Repository: google-deepmind/alphafold3
Branch: main
Commit: 608edb684db9
Files: 186
Total size: 7.4 MB

Directory structure:
gitextract_op0f7t9l/

├── .github/
│   └── workflows/
│       └── ci.yaml
├── CMakeLists.txt
├── CONTRIBUTING.md
├── LICENSE
├── OUTPUT_TERMS_OF_USE.md
├── README.md
├── WEIGHTS_PROHIBITED_USE_POLICY.md
├── WEIGHTS_TERMS_OF_USE.md
├── docker/
│   ├── Dockerfile
│   ├── dockerignore
│   └── jackhmmer_seq_limit.patch
├── docs/
│   ├── community_tools.md
│   ├── contributing.md
│   ├── input.md
│   ├── installation.md
│   ├── known_issues.md
│   ├── metadata_antibody_antigen.csv
│   ├── metadata_antibody_antigen.md
│   ├── model_parameters.md
│   ├── output.md
│   └── performance.md
├── fetch_databases.sh
├── legal/
│   ├── WEIGHTS_PROHIBITED_USE_POLICY-Bahasa-Indonesia.md
│   ├── WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md
│   ├── WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md
│   ├── WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md
│   ├── WEIGHTS_TERMS_OF_USE-Bahasa-Indonesia.md
│   ├── WEIGHTS_TERMS_OF_USE-Espanol-Latinoamerica.md
│   ├── WEIGHTS_TERMS_OF_USE-Francais-Canada.md
│   └── WEIGHTS_TERMS_OF_USE-Portugues-Brazil.md
├── pyproject.toml
├── run_alphafold.py
├── run_alphafold_data_test.py
├── run_alphafold_test.py
└── src/
    └── alphafold3/
        ├── __init__.py
        ├── build_data.py
        ├── common/
        │   ├── base_config.py
        │   ├── folding_input.py
        │   ├── resources.py
        │   ├── safe_pickle.py
        │   └── testing/
        │       └── data.py
        ├── constants/
        │   ├── atom_types.py
        │   ├── chemical_component_sets.py
        │   ├── chemical_components.py
        │   ├── converters/
        │   │   ├── ccd_pickle_gen.py
        │   │   └── chemical_component_sets_gen.py
        │   ├── mmcif_names.py
        │   ├── periodic_table.py
        │   ├── residue_names.py
        │   └── side_chains.py
        ├── cpp.cc
        ├── data/
        │   ├── cpp/
        │   │   ├── msa_profile_pybind.cc
        │   │   └── msa_profile_pybind.h
        │   ├── featurisation.py
        │   ├── msa.py
        │   ├── msa_config.py
        │   ├── msa_features.py
        │   ├── msa_identifiers.py
        │   ├── parsers.py
        │   ├── pipeline.py
        │   ├── structure_stores.py
        │   ├── template_realign.py
        │   ├── templates.py
        │   └── tools/
        │       ├── hmmalign.py
        │       ├── hmmbuild.py
        │       ├── hmmsearch.py
        │       ├── jackhmmer.py
        │       ├── msa_tool.py
        │       ├── nhmmer.py
        │       ├── rdkit_utils.py
        │       ├── shards.py
        │       └── subprocess_utils.py
        ├── jax/
        │   └── geometry/
        │       ├── __init__.py
        │       ├── rigid_matrix_vector.py
        │       ├── rotation_matrix.py
        │       ├── struct_of_array.py
        │       ├── utils.py
        │       └── vector.py
        ├── model/
        │   ├── atom_layout/
        │   │   └── atom_layout.py
        │   ├── components/
        │   │   ├── haiku_modules.py
        │   │   ├── mapping.py
        │   │   └── utils.py
        │   ├── confidence_types.py
        │   ├── confidences.py
        │   ├── data3.py
        │   ├── data_constants.py
        │   ├── feat_batch.py
        │   ├── features.py
        │   ├── merging_features.py
        │   ├── mkdssp_pybind.cc
        │   ├── mkdssp_pybind.h
        │   ├── mmcif_metadata.py
        │   ├── model.py
        │   ├── model_config.py
        │   ├── msa_pairing.py
        │   ├── network/
        │   │   ├── atom_cross_attention.py
        │   │   ├── confidence_head.py
        │   │   ├── diffusion_head.py
        │   │   ├── diffusion_transformer.py
        │   │   ├── distogram_head.py
        │   │   ├── evoformer.py
        │   │   ├── featurization.py
        │   │   ├── modules.py
        │   │   ├── noise_level_embeddings.py
        │   │   └── template_modules.py
        │   ├── params.py
        │   ├── pipeline/
        │   │   ├── inter_chain_bonds.py
        │   │   ├── pipeline.py
        │   │   └── structure_cleaning.py
        │   ├── post_processing.py
        │   ├── protein_data_processing.py
        │   └── scoring/
        │       ├── alignment.py
        │       ├── chirality.py
        │       ├── covalent_bond_cleaning.py
        │       └── scoring.py
        ├── parsers/
        │   └── cpp/
        │       ├── cif_dict.pyi
        │       ├── cif_dict_lib.cc
        │       ├── cif_dict_lib.h
        │       ├── cif_dict_pybind.cc
        │       ├── cif_dict_pybind.h
        │       ├── fasta_iterator.pyi
        │       ├── fasta_iterator_lib.cc
        │       ├── fasta_iterator_lib.h
        │       ├── fasta_iterator_pybind.cc
        │       ├── fasta_iterator_pybind.h
        │       ├── msa_conversion.pyi
        │       ├── msa_conversion_pybind.cc
        │       └── msa_conversion_pybind.h
        ├── scripts/
        │   ├── copy_to_ssd.sh
        │   └── gcp_mount_ssd.sh
        ├── structure/
        │   ├── __init__.py
        │   ├── bioassemblies.py
        │   ├── bonds.py
        │   ├── chemical_components.py
        │   ├── cpp/
        │   │   ├── aggregation.pyi
        │   │   ├── aggregation_pybind.cc
        │   │   ├── aggregation_pybind.h
        │   │   ├── membership.pyi
        │   │   ├── membership_pybind.cc
        │   │   ├── membership_pybind.h
        │   │   ├── mmcif_altlocs.cc
        │   │   ├── mmcif_altlocs.h
        │   │   ├── mmcif_atom_site.pyi
        │   │   ├── mmcif_atom_site_pybind.cc
        │   │   ├── mmcif_atom_site_pybind.h
        │   │   ├── mmcif_layout.h
        │   │   ├── mmcif_layout.pyi
        │   │   ├── mmcif_layout_lib.cc
        │   │   ├── mmcif_layout_pybind.cc
        │   │   ├── mmcif_layout_pybind.h
        │   │   ├── mmcif_struct_conn.h
        │   │   ├── mmcif_struct_conn.pyi
        │   │   ├── mmcif_struct_conn_lib.cc
        │   │   ├── mmcif_struct_conn_pybind.cc
        │   │   ├── mmcif_struct_conn_pybind.h
        │   │   ├── mmcif_utils.pyi
        │   │   ├── mmcif_utils_pybind.cc
        │   │   ├── mmcif_utils_pybind.h
        │   │   ├── string_array.pyi
        │   │   ├── string_array_pybind.cc
        │   │   └── string_array_pybind.h
        │   ├── mmcif.py
        │   ├── parsing.py
        │   ├── sterics.py
        │   ├── structure.py
        │   ├── structure_tables.py
        │   ├── table.py
        │   └── test_utils.py
        ├── test_data/
        │   ├── alphafold_run_outputs/
        │   │   ├── run_alphafold_test_output_bucket_1024.pkl
        │   │   └── run_alphafold_test_output_bucket_default.pkl
        │   ├── featurised_example.json
        │   ├── featurised_example.pkl
        │   ├── miniature_databases/
        │   │   ├── bfd-first_non_consensus_sequences__subsampled_1000.fasta
        │   │   ├── mgy_clusters__subsampled_1000.fa
        │   │   ├── nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq__subsampled_1000.fasta
        │   │   ├── pdb_mmcif/
        │   │   │   ├── 5y2e.cif
        │   │   │   ├── 6s61.cif
        │   │   │   ├── 6ydw.cif
        │   │   │   └── 7rye.cif
        │   │   ├── pdb_seqres_2022_09_28__subsampled_1000.fasta
        │   │   ├── rfam_14_4_clustered_rep_seq__subsampled_1000.fasta
        │   │   ├── rnacentral_active_seq_id_90_cov_80_linclust__subsampled_1000.fasta
        │   │   ├── uniprot_all__subsampled_1000.fasta
        │   │   └── uniref90__subsampled_1000.fasta
        │   └── model_config.json
        └── version.py

================================================
FILE CONTENTS
================================================

================================================
FILE: .github/workflows/ci.yaml
================================================
name: Continuous Integration

on:
  push:
    branches:
      - main
  pull_request:
    branches:
      - main
  workflow_dispatch:

jobs:
  build:
    name: "build ${{ matrix.name-prefix }} (py ${{ matrix.python-version }} on ${{ matrix.os }})"
    runs-on: ${{ matrix.os }}
    strategy:
      matrix:
        include:
          - name-prefix: "all tests"
            python-version: '3.12'
            os: ubuntu-latest

    steps:
    - uses: actions/checkout@v6
    - name: Set up uv
      uses: astral-sh/setup-uv@v7
      with:
        enable-cache: true
        cache-dependency-glob: "uv.lock"

    - name: Set up Python ${{ matrix.python-version }}
      run: uv python install ${{ matrix.python-version }}

    - name: Install dependencies
      run: sudo apt-get install -y hmmer

    - name: Install Python dependencies
      run: uv sync --frozen --all-groups

    - name: Build data
      run: uv run build_data

    - name: Run CPU-only tests
      run: uv run python run_alphafold_data_test.py


================================================
FILE: CMakeLists.txt
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

cmake_minimum_required(VERSION 3.28)

# This forces Git to use the 'files' backend for all FetchContent operations.
# This fixes libcifpp and dssp incompatibility with newer git versions.
set(ENV{GIT_CONFIG_PARAMETERS} "'init.defaultRefFormat=files'")

project(
  "${SKBUILD_PROJECT_NAME}"
  LANGUAGES CXX
  VERSION "${SKBUILD_PROJECT_VERSION}")

include(FetchContent)
set(CMAKE_CXX_STANDARD 20)
set(CMAKE_CXX_STANDARD_REQUIRED ON)
set(CMAKE_POSITION_INDEPENDENT_CODE TRUE)
set(ABSL_PROPAGATE_CXX_STD ON)

# Remove support for scan deps, which is only useful when using C++ modules.
unset(CMAKE_CXX_SCANDEP_SOURCE)

FetchContent_Declare(
  abseil-cpp
  GIT_REPOSITORY https://github.com/abseil/abseil-cpp
  GIT_TAG d7aaad83b488fd62bd51c81ecf16cd938532cc0a # 20240116.2
  EXCLUDE_FROM_ALL)

FetchContent_Declare(
  pybind11
  GIT_REPOSITORY https://github.com/pybind/pybind11
  GIT_TAG 2e0815278cb899b20870a67ca8205996ef47e70f # v2.12.0
  EXCLUDE_FROM_ALL)

FetchContent_Declare(
  pybind11_abseil
  GIT_REPOSITORY https://github.com/pybind/pybind11_abseil
  GIT_TAG bddf30141f9fec8e577f515313caec45f559d319 # HEAD @ 2024-08-07
  EXCLUDE_FROM_ALL)

FetchContent_Declare(
  cifpp
  GIT_REPOSITORY https://github.com/pdb-redo/libcifpp
  GIT_TAG ac98531a2fc8daf21131faa0c3d73766efa46180 # v7.0.3
  # Don't `EXCLUDE_FROM_ALL` as necessary for build_data.
)

FetchContent_Declare(
  dssp
  GIT_REPOSITORY https://github.com/PDB-REDO/dssp
  GIT_TAG 57560472b4260dc41f457706bc45fc6ef0bc0f10 # v4.4.7
  EXCLUDE_FROM_ALL)

FetchContent_MakeAvailable(pybind11 abseil-cpp pybind11_abseil cifpp dssp)

find_package(
  Python3
  COMPONENTS Interpreter Development NumPy
  REQUIRED)

include_directories(${PYTHON_INCLUDE_DIRS})
include_directories(src/)

file(GLOB_RECURSE cpp_srcs src/alphafold3/*.cc)
list(FILTER cpp_srcs EXCLUDE REGEX ".*\(_test\|_main\|_benchmark\).cc$")

add_compile_definitions(NPY_NO_DEPRECATED_API=NPY_1_7_API_VERSION)

pybind11_add_module(cpp ${cpp_srcs})

target_link_libraries(
  cpp
  PRIVATE absl::check
          absl::flat_hash_map
          absl::node_hash_map
          absl::strings
          absl::status
          absl::statusor
          absl::log
          pybind11_abseil::absl_casters
          Python3::NumPy
          dssp::dssp
          cifpp::cifpp)

target_compile_definitions(cpp PRIVATE VERSION_INFO=${PROJECT_VERSION})
install(TARGETS cpp LIBRARY DESTINATION alphafold3)
install(
  FILES LICENSE
        OUTPUT_TERMS_OF_USE.md
        WEIGHTS_PROHIBITED_USE_POLICY.md
        WEIGHTS_TERMS_OF_USE.md
  DESTINATION alphafold3)


================================================
FILE: CONTRIBUTING.md
================================================
# How to Contribute

We welcome small patches related to bug fixes and documentation, but we do not
plan to make any major changes to this repository.

## AI Generated Code

We welcome the use of AI tools for the generation of code, documentation and/or
Pull Request (PR) description as long as:

1.  It has been transparently labelled as such. Make sure to declare it in the
    PR message.
2.  You have manually reviewed the code before sending the PR.
3.  The change has been manually tested. We might ask you to fold a certain
    input to check correctness of the PR.

Please do not submit AI generated PRs where test results have been hallucinated.

## Contributor License Agreement

Contributions to this project must be accompanied by a Contributor License
Agreement. You (or your employer) retain the copyright to your contribution,
this simply gives us permission to use and redistribute your contributions as
part of the project. Head over to <https://cla.developers.google.com/> to see
your current agreements on file or to sign a new one.

You generally only need to submit a CLA once, so if you've already submitted one
(even if it was for a different project), you probably don't need to do it
again.

## Code reviews

All submissions, including submissions by project members, require review. We
use GitHub pull requests for this purpose. Consult
[GitHub Help](https://help.github.com/articles/about-pull-requests/) for more
information on using pull requests.


================================================
FILE: LICENSE
================================================
Attribution-NonCommercial-ShareAlike 4.0 International

=======================================================================

Creative Commons Corporation ("Creative Commons") is not a law firm and
does not provide legal services or legal advice. Distribution of
Creative Commons public licenses does not create a lawyer-client or
other relationship. Creative Commons makes its licenses and related
information available on an "as-is" basis. Creative Commons gives no
warranties regarding its licenses, any material licensed under their
terms and conditions, or any related information. Creative Commons
disclaims all liability for damages resulting from their use to the
fullest extent possible.

Using Creative Commons Public Licenses

Creative Commons public licenses provide a standard set of terms and
conditions that creators and other rights holders may use to share
original works of authorship and other material subject to copyright
and certain other rights specified in the public license below. The
following considerations are for informational purposes only, are not
exhaustive, and do not form part of our licenses.

     Considerations for licensors: Our public licenses are
     intended for use by those authorized to give the public
     permission to use material in ways otherwise restricted by
     copyright and certain other rights. Our licenses are
     irrevocable. Licensors should read and understand the terms
     and conditions of the license they choose before applying it.
     Licensors should also secure all rights necessary before
     applying our licenses so that the public can reuse the
     material as expected. Licensors should clearly mark any
     material not subject to the license. This includes other CC-
     licensed material, or material used under an exception or
     limitation to copyright. More considerations for licensors:
    wiki.creativecommons.org/Considerations_for_licensors

     Considerations for the public: By using one of our public
     licenses, a licensor grants the public permission to use the
     licensed material under specified terms and conditions. If
     the licensor's permission is not necessary for any reason--for
     example, because of any applicable exception or limitation to
     copyright--then that use is not regulated by the license. Our
     licenses grant only permissions under copyright and certain
     other rights that a licensor has authority to grant. Use of
     the licensed material may still be restricted for other
     reasons, including because others have copyright or other
     rights in the material. A licensor may make special requests,
     such as asking that all changes be marked or described.
     Although not required by our licenses, you are encouraged to
     respect those requests where reasonable. More considerations
     for the public:
    wiki.creativecommons.org/Considerations_for_licensees

=======================================================================

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International
Public License

By exercising the Licensed Rights (defined below), You accept and agree
to be bound by the terms and conditions of this Creative Commons
Attribution-NonCommercial-ShareAlike 4.0 International Public License
("Public License"). To the extent this Public License may be
interpreted as a contract, You are granted the Licensed Rights in
consideration of Your acceptance of these terms and conditions, and the
Licensor grants You such rights in consideration of benefits the
Licensor receives from making the Licensed Material available under
these terms and conditions.


Section 1 -- Definitions.

  a. Adapted Material means material subject to Copyright and Similar
     Rights that is derived from or based upon the Licensed Material
     and in which the Licensed Material is translated, altered,
     arranged, transformed, or otherwise modified in a manner requiring
     permission under the Copyright and Similar Rights held by the
     Licensor. For purposes of this Public License, where the Licensed
     Material is a musical work, performance, or sound recording,
     Adapted Material is always produced where the Licensed Material is
     synched in timed relation with a moving image.

  b. Adapter's License means the license You apply to Your Copyright
     and Similar Rights in Your contributions to Adapted Material in
     accordance with the terms and conditions of this Public License.

  c. BY-NC-SA Compatible License means a license listed at
     creativecommons.org/compatiblelicenses, approved by Creative
     Commons as essentially the equivalent of this Public License.

  d. Copyright and Similar Rights means copyright and/or similar rights
     closely related to copyright including, without limitation,
     performance, broadcast, sound recording, and Sui Generis Database
     Rights, without regard to how the rights are labeled or
     categorized. For purposes of this Public License, the rights
     specified in Section 2(b)(1)-(2) are not Copyright and Similar
     Rights.

  e. Effective Technological Measures means those measures that, in the
     absence of proper authority, may not be circumvented under laws
     fulfilling obligations under Article 11 of the WIPO Copyright
     Treaty adopted on December 20, 1996, and/or similar international
     agreements.

  f. Exceptions and Limitations means fair use, fair dealing, and/or
     any other exception or limitation to Copyright and Similar Rights
     that applies to Your use of the Licensed Material.

  g. License Elements means the license attributes listed in the name
     of a Creative Commons Public License. The License Elements of this
     Public License are Attribution, NonCommercial, and ShareAlike.

  h. Licensed Material means the artistic or literary work, database,
     or other material to which the Licensor applied this Public
     License.

  i. Licensed Rights means the rights granted to You subject to the
     terms and conditions of this Public License, which are limited to
     all Copyright and Similar Rights that apply to Your use of the
     Licensed Material and that the Licensor has authority to license.

  j. Licensor means the individual(s) or entity(ies) granting rights
     under this Public License.

  k. NonCommercial means not primarily intended for or directed towards
     commercial advantage or monetary compensation. For purposes of
     this Public License, the exchange of the Licensed Material for
     other material subject to Copyright and Similar Rights by digital
     file-sharing or similar means is NonCommercial provided there is
     no payment of monetary compensation in connection with the
     exchange.

  l. Share means to provide material to the public by any means or
     process that requires permission under the Licensed Rights, such
     as reproduction, public display, public performance, distribution,
     dissemination, communication, or importation, and to make material
     available to the public including in ways that members of the
     public may access the material from a place and at a time
     individually chosen by them.

  m. Sui Generis Database Rights means rights other than copyright
     resulting from Directive 96/9/EC of the European Parliament and of
     the Council of 11 March 1996 on the legal protection of databases,
     as amended and/or succeeded, as well as other essentially
     equivalent rights anywhere in the world.

  n. You means the individual or entity exercising the Licensed Rights
     under this Public License. Your has a corresponding meaning.


Section 2 -- Scope.

  a. License grant.

       1. Subject to the terms and conditions of this Public License,
          the Licensor hereby grants You a worldwide, royalty-free,
          non-sublicensable, non-exclusive, irrevocable license to
          exercise the Licensed Rights in the Licensed Material to:

            a. reproduce and Share the Licensed Material, in whole or
               in part, for NonCommercial purposes only; and

            b. produce, reproduce, and Share Adapted Material for
               NonCommercial purposes only.

       2. Exceptions and Limitations. For the avoidance of doubt, where
          Exceptions and Limitations apply to Your use, this Public
          License does not apply, and You do not need to comply with
          its terms and conditions.

       3. Term. The term of this Public License is specified in Section
          6(a).

       4. Media and formats; technical modifications allowed. The
          Licensor authorizes You to exercise the Licensed Rights in
          all media and formats whether now known or hereafter created,
          and to make technical modifications necessary to do so. The
          Licensor waives and/or agrees not to assert any right or
          authority to forbid You from making technical modifications
          necessary to exercise the Licensed Rights, including
          technical modifications necessary to circumvent Effective
          Technological Measures. For purposes of this Public License,
          simply making modifications authorized by this Section 2(a)
          (4) never produces Adapted Material.

       5. Downstream recipients.

            a. Offer from the Licensor -- Licensed Material. Every
               recipient of the Licensed Material automatically
               receives an offer from the Licensor to exercise the
               Licensed Rights under the terms and conditions of this
               Public License.

            b. Additional offer from the Licensor -- Adapted Material.
               Every recipient of Adapted Material from You
               automatically receives an offer from the Licensor to
               exercise the Licensed Rights in the Adapted Material
               under the conditions of the Adapter's License You apply.

            c. No downstream restrictions. You may not offer or impose
               any additional or different terms or conditions on, or
               apply any Effective Technological Measures to, the
               Licensed Material if doing so restricts exercise of the
               Licensed Rights by any recipient of the Licensed
               Material.

       6. No endorsement. Nothing in this Public License constitutes or
          may be construed as permission to assert or imply that You
          are, or that Your use of the Licensed Material is, connected
          with, or sponsored, endorsed, or granted official status by,
          the Licensor or others designated to receive attribution as
          provided in Section 3(a)(1)(A)(i).

  b. Other rights.

       1. Moral rights, such as the right of integrity, are not
          licensed under this Public License, nor are publicity,
          privacy, and/or other similar personality rights; however, to
          the extent possible, the Licensor waives and/or agrees not to
          assert any such rights held by the Licensor to the limited
          extent necessary to allow You to exercise the Licensed
          Rights, but not otherwise.

       2. Patent and trademark rights are not licensed under this
          Public License.

       3. To the extent possible, the Licensor waives any right to
          collect royalties from You for the exercise of the Licensed
          Rights, whether directly or through a collecting society
          under any voluntary or waivable statutory or compulsory
          licensing scheme. In all other cases the Licensor expressly
          reserves any right to collect such royalties, including when
          the Licensed Material is used other than for NonCommercial
          purposes.


Section 3 -- License Conditions.

Your exercise of the Licensed Rights is expressly made subject to the
following conditions.

  a. Attribution.

       1. If You Share the Licensed Material (including in modified
          form), You must:

            a. retain the following if it is supplied by the Licensor
               with the Licensed Material:

                 i. identification of the creator(s) of the Licensed
                    Material and any others designated to receive
                    attribution, in any reasonable manner requested by
                    the Licensor (including by pseudonym if
                    designated);

                ii. a copyright notice;

               iii. a notice that refers to this Public License;

                iv. a notice that refers to the disclaimer of
                    warranties;

                 v. a URI or hyperlink to the Licensed Material to the
                    extent reasonably practicable;

            b. indicate if You modified the Licensed Material and
               retain an indication of any previous modifications; and

            c. indicate the Licensed Material is licensed under this
               Public License, and include the text of, or the URI or
               hyperlink to, this Public License.

       2. You may satisfy the conditions in Section 3(a)(1) in any
          reasonable manner based on the medium, means, and context in
          which You Share the Licensed Material. For example, it may be
          reasonable to satisfy the conditions by providing a URI or
          hyperlink to a resource that includes the required
          information.
       3. If requested by the Licensor, You must remove any of the
          information required by Section 3(a)(1)(A) to the extent
          reasonably practicable.

  b. ShareAlike.

     In addition to the conditions in Section 3(a), if You Share
     Adapted Material You produce, the following conditions also apply.

       1. The Adapter's License You apply must be a Creative Commons
          license with the same License Elements, this version or
          later, or a BY-NC-SA Compatible License.

       2. You must include the text of, or the URI or hyperlink to, the
          Adapter's License You apply. You may satisfy this condition
          in any reasonable manner based on the medium, means, and
          context in which You Share Adapted Material.

       3. You may not offer or impose any additional or different terms
          or conditions on, or apply any Effective Technological
          Measures to, Adapted Material that restrict exercise of the
          rights granted under the Adapter's License You apply.


Section 4 -- Sui Generis Database Rights.

Where the Licensed Rights include Sui Generis Database Rights that
apply to Your use of the Licensed Material:

  a. for the avoidance of doubt, Section 2(a)(1) grants You the right
     to extract, reuse, reproduce, and Share all or a substantial
     portion of the contents of the database for NonCommercial purposes
     only;

  b. if You include all or a substantial portion of the database
     contents in a database in which You have Sui Generis Database
     Rights, then the database in which You have Sui Generis Database
     Rights (but not its individual contents) is Adapted Material,
     including for purposes of Section 3(b); and

  c. You must comply with the conditions in Section 3(a) if You Share
     all or a substantial portion of the contents of the database.

For the avoidance of doubt, this Section 4 supplements and does not
replace Your obligations under this Public License where the Licensed
Rights include other Copyright and Similar Rights.


Section 5 -- Disclaimer of Warranties and Limitation of Liability.

  a. UNLESS OTHERWISE SEPARATELY UNDERTAKEN BY THE LICENSOR, TO THE
     EXTENT POSSIBLE, THE LICENSOR OFFERS THE LICENSED MATERIAL AS-IS
     AND AS-AVAILABLE, AND MAKES NO REPRESENTATIONS OR WARRANTIES OF
     ANY KIND CONCERNING THE LICENSED MATERIAL, WHETHER EXPRESS,
     IMPLIED, STATUTORY, OR OTHER. THIS INCLUDES, WITHOUT LIMITATION,
     WARRANTIES OF TITLE, MERCHANTABILITY, FITNESS FOR A PARTICULAR
     PURPOSE, NON-INFRINGEMENT, ABSENCE OF LATENT OR OTHER DEFECTS,
     ACCURACY, OR THE PRESENCE OR ABSENCE OF ERRORS, WHETHER OR NOT
     KNOWN OR DISCOVERABLE. WHERE DISCLAIMERS OF WARRANTIES ARE NOT
     ALLOWED IN FULL OR IN PART, THIS DISCLAIMER MAY NOT APPLY TO YOU.

  b. TO THE EXTENT POSSIBLE, IN NO EVENT WILL THE LICENSOR BE LIABLE
     TO YOU ON ANY LEGAL THEORY (INCLUDING, WITHOUT LIMITATION,
     NEGLIGENCE) OR OTHERWISE FOR ANY DIRECT, SPECIAL, INDIRECT,
     INCIDENTAL, CONSEQUENTIAL, PUNITIVE, EXEMPLARY, OR OTHER LOSSES,
     COSTS, EXPENSES, OR DAMAGES ARISING OUT OF THIS PUBLIC LICENSE OR
     USE OF THE LICENSED MATERIAL, EVEN IF THE LICENSOR HAS BEEN
     ADVISED OF THE POSSIBILITY OF SUCH LOSSES, COSTS, EXPENSES, OR
     DAMAGES. WHERE A LIMITATION OF LIABILITY IS NOT ALLOWED IN FULL OR
     IN PART, THIS LIMITATION MAY NOT APPLY TO YOU.

  c. The disclaimer of warranties and limitation of liability provided
     above shall be interpreted in a manner that, to the extent
     possible, most closely approximates an absolute disclaimer and
     waiver of all liability.


Section 6 -- Term and Termination.

  a. This Public License applies for the term of the Copyright and
     Similar Rights licensed here. However, if You fail to comply with
     this Public License, then Your rights under this Public License
     terminate automatically.

  b. Where Your right to use the Licensed Material has terminated under
     Section 6(a), it reinstates:

       1. automatically as of the date the violation is cured, provided
          it is cured within 30 days of Your discovery of the
          violation; or

       2. upon express reinstatement by the Licensor.

     For the avoidance of doubt, this Section 6(b) does not affect any
     right the Licensor may have to seek remedies for Your violations
     of this Public License.

  c. For the avoidance of doubt, the Licensor may also offer the
     Licensed Material under separate terms or conditions or stop
     distributing the Licensed Material at any time; however, doing so
     will not terminate this Public License.

  d. Sections 1, 5, 6, 7, and 8 survive termination of this Public
     License.


Section 7 -- Other Terms and Conditions.

  a. The Licensor shall not be bound by any additional or different
     terms or conditions communicated by You unless expressly agreed.

  b. Any arrangements, understandings, or agreements regarding the
     Licensed Material not stated herein are separate from and
     independent of the terms and conditions of this Public License.


Section 8 -- Interpretation.

  a. For the avoidance of doubt, this Public License does not, and
     shall not be interpreted to, reduce, limit, restrict, or impose
     conditions on any use of the Licensed Material that could lawfully
     be made without permission under this Public License.

  b. To the extent possible, if any provision of this Public License is
     deemed unenforceable, it shall be automatically reformed to the
     minimum extent necessary to make it enforceable. If the provision
     cannot be reformed, it shall be severed from this Public License
     without affecting the enforceability of the remaining terms and
     conditions.

  c. No term or condition of this Public License will be waived and no
     failure to comply consented to unless expressly agreed to by the
     Licensor.

  d. Nothing in this Public License constitutes or may be interpreted
     as a limitation upon, or waiver of, any privileges and immunities
     that apply to the Licensor or You, including from the legal
     processes of any jurisdiction or authority.

=======================================================================

Creative Commons is not a party to its public
licenses. Notwithstanding, Creative Commons may elect to apply one of
its public licenses to material it publishes and in those instances
will be considered the “Licensor.” The text of the Creative Commons
public licenses is dedicated to the public domain under the CC0 Public
Domain Dedication. Except for the limited purpose of indicating that
material is shared under a Creative Commons public license or as
otherwise permitted by the Creative Commons policies published at
creativecommons.org/policies, Creative Commons does not authorize the
use of the trademark "Creative Commons" or any other trademark or logo
of Creative Commons without its prior written consent including,
without limitation, in connection with any unauthorized modifications
to any of its public licenses or any other arrangements,
understandings, or agreements concerning use of licensed material. For
the avoidance of doubt, this paragraph does not form part of the
public licenses.

Creative Commons may be contacted at creativecommons.org.


================================================
FILE: OUTPUT_TERMS_OF_USE.md
================================================
# ALPHAFOLD 3 OUTPUT TERMS OF USE

Last Modified: 2024-11-09

By using AlphaFold 3 Output (as defined below), without having agreed to
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md),
you agree to be bound by these AlphaFold 3 Output Terms of Use between you (or
your organization, as applicable) and Google LLC (these "**Terms**").

If you are using Output on behalf of an organization, you confirm you are
authorized either explicitly or implicitly to agree to, and are agreeing to,
these Terms as an employee on behalf of, or otherwise on behalf of, your
organization.

If you have agreed to
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md),
your use of Output are governed by those terms. **If you have not agreed to
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md)
and do not agree to these Terms, do not use Output or permit any third party to
do so on your behalf.**

When we say "**you**", we mean the individual or organization using Output. When
we say "**we**", "**us**" or "**Google**", we mean the entities that belong to
the Google group of companies, which means Google LLC and its affiliates.

## Key Definitions

As used in these Terms:

"**AlphaFold 3**" means the AlphaFold 3 Code and Model Parameters.

"**AlphaFold 3 Code**" means the AlphaFold 3 source code: (a) identified at
[public GitHub repo](https://github.com/google-deepmind/alphafold3/), or such
other location in which we may make it available from time to time, regardless
of the source that it was obtained from; and (b) made available by Google to
organizations for their use in accordance with the
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md)
(not these Terms) together with (i) modifications to that code, (ii) works based
on that code, or (iii) other code or machine learning model which incorporates,
in full or in part, that code.

"**Model Parameters**" means the trained model weights and parameters made
available by Google to organizations (at its sole discretion) for their use in
accordance with the
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md)
(not these Terms), together with (a) modifications to those weights and
parameters, (b) works based on those weights and parameters, or (c) other code
or machine learning model which incorporates, in full or in part, those weights
and parameters.

"**Output**" means the structure predictions and all related information
provided by AlphaFold 3, together with any visual representations, computational
predictions, descriptions, modifications, copies, or adaptations that are
substantially derived from Output.

## Use restrictions

[AlphaFold 3](https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/)
belongs to us. Output are made available free of charge, for non-commercial use
only, in accordance with the following use restrictions. You must not use nor
allow others to use Output:

1.  **On behalf of a commercial organization or in connection with any
    commercial activities, including research on behalf of commercial
    organizations.**

    1.  This means that only non-commercial organizations (*i.e.*, universities,
        non-profit organizations and research institutes, educational,
        journalism and government bodies) may use Output for their
        non-commercial activities. Output are not available for use by any other
        types of organization, even if conducting non-commercial work.

    2.  If you are a researcher affiliated with a non-commercial organization,
        provided **you are not a commercial organisation or acting on behalf of
        a commercial organisation**, you can use Output for your non-commercial
        affiliated research.

    3.  You must not share Output with any commercial organization. The only
        exception is making Output publicly available (including, indirectly, to
        commercial organizations) via a scientific publication or open source
        release or using these to support journalism, each of which are
        permitted.

2.  **To misinform, misrepresent or mislead**, including:

    1.  providing false or inaccurate information in relation to your access to
        or use of Output;

    2.  misrepresenting your relationship with Google - including by using
        Google’s trademarks, trade names, logos or suggesting endorsement by
        Google without Google’s permission to do so - nothing in these Terms
        grants such permission;

    3.  misrepresenting the origin of Output;

    4.  distributing misleading claims of expertise or capability, or engaging
        in the unauthorized or unlicensed practice of any profession,
        particularly in sensitive areas (*e.g.*, health); or

    5.  making decisions in domains that affect material or individual rights or
        well-being (*e.g.*, healthcare).

3.  **To perform, promote or facilitate dangerous, illegal or malicious
    activities**, including:

    1.  promoting or facilitating the sale of, or providing instructions for
        synthesizing or accessing, illegal substances, goods or services;

    2.  abusing, harming, interfering, or disrupting any services, including
        generating or distributing content for deceptive or fraudulent
        activities or malware;

    3.  generating or distributing any content that infringes, misappropriates,
        or otherwise violates any individual’s or entity’s rights (including,
        but not limited to rights in copyrighted content); or

    4.  attempting to circumvent these Terms.

4.  **To train or create machine learning models or related technology for
    biomolecular structure prediction similar to AlphaFold 3 as made available
    by Google ("Derived Models"),** including via distillation or other
    methods**.** For the avoidance of doubt, the use restrictions set out in
    these Terms would apply in full to any Derived Models created in breach of
    these Terms.

5.  **Without providing conspicuous notice that published or distributed Output
    is provided under and subject to these Terms and of any modifications you
    make to Output.**

    1.  This means if you remove, or cause to be removed (for example by using
        third-party software), these Terms, or any notice of these Terms, from
        Output, you must ensure further distribution or publication is
        accompanied by a copy of the
        [AlphaFold 3 Output Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
        and a "*Legally Binding Terms of Use*" text file that contains the
        following notice:

        "*By using this information, you agree to AlphaFold 3 Output Terms of
        Use found at
        https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md.*

        *To request access to the AlphaFold 3 model parameters, follow the
        process set out at https://github.com/google-deepmind/alphafold3. You
        may only use these if received directly from Google. Use is subject to
        terms of use available at
        https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.*"

    2.  You must not include any additional or different terms that conflict
        with the
        [AlphaFold 3 Output Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

6.  **Distribute Output, or disclose findings arising from using AlphaFold 3
    without citing our paper:** [Abramson, J et al. Accurate structure
    prediction of biomolecular interactions with AlphaFold 3. *Nature*
    (2024)](https://www.nature.com/articles/s41586-024-07487-w). For the
    avoidance of doubt, this is an additional requirement to the notice
    requirements set out above.

We grant you a non-exclusive, royalty-free, revocable, non-transferable and
non-sublicensable (except as expressly permitted in these Terms) license to any
intellectual property rights we have in Output to the extent necessary for these
purposes. You agree that your right to use and share Output is subject to your
compliance with these Terms. If you breach these Terms, Google reserves the
right to request that you delete and cease use or sharing of Output in your
possession or control and prohibit you from using the AlphaFold 3 Assets
(including as made available via
[AlphaFold Server](https://alphafoldserver.com/about)). You agree to immediately
comply with any such request.

## Disclaimers

Nothing in these Terms restricts any rights that cannot be restricted under
applicable law or limits Google’s responsibilities except as allowed by
applicable law.

**Output are provided on an "as is" basis, without warranties or conditions of
any kind, either express or implied, including any warranties or conditions of
title, non-infringement, merchantability, or fitness for a particular purpose.
You are solely responsible for determining the appropriateness of using or
distributing any of the Output and assume any and all risks associated with your
use or distribution of any Output and your exercise of rights and obligations
under these Terms. You and anyone you share Output with are solely responsible
for these and their subsequent uses.**

**Output are predictions with varying levels of confidence and should be
interpreted carefully. Use discretion before relying on, publishing, downloading
or otherwise using Output.**

**Output are for theoretical modeling only. These are not intended, validated,
or approved for clinical use. You should not use these for clinical purposes or
rely on them for medical or other professional advice. Any content regarding
those topics is provided for informational purposes only and is not a substitute
for advice from a qualified professional.**

## Liabilities

To the extent allowed by applicable law, you will indemnify Google and its
directors, officers, employees, and contractors for any third-party legal
proceedings (including actions by government authorities) arising out of or
relating to your unlawful use of Output or violation of these Terms. This
indemnity covers any liability or expense arising from claims, losses, damages,
judgments, fines, litigation costs, and legal fees, except to the extent a
liability or expense is caused by Google's breach, negligence, or willful
misconduct. If you are legally exempt from certain responsibilities, including
indemnification, then those responsibilities don’t apply to you under these
terms.

In no circumstances will Google be responsible for any indirect, special,
incidental, exemplary, consequential, or punitive damages, or lost profits of
any kind, even if Google has been advised of the possibility of such damages.
Google’s total, aggregate liability for all claims arising out of or in
connection with these Terms or Output, including for its own negligence, is
limited to $500.

## Governing law and disputes

These Terms will be governed by the laws of the State of California. The state
or federal courts of Santa Clara County, California shall have exclusive
jurisdiction of any dispute arising out of these Terms.

Given the nature of scientific research, it may take some time for any breach of
these Terms to become apparent. To the extent allowed by applicable law, any
legal claims relating to these Terms or Output can be initiated until the later
of (a) the cut-off date under applicable law for bringing the legal claim; or
(b) two years from the date you or Google (as applicable) became aware, or
should reasonably have become aware, of the facts giving rise to that claim. You
will not argue limitation, time bar, delay, waiver or the like in an attempt to
bar an action filed within that time period, and neither will we.

All rights not specifically and expressly granted to you by these Terms are
reserved to Google. No delay, act or omission by Google in exercising any right
or remedy will be deemed a waiver of any breach of these Terms and Google
expressly reserves any and all rights and remedies available under these Terms
or at law or in equity or otherwise, including the remedy of injunctive relief
against any threatened or actual breach of these Terms without the necessity of
proving actual damages.

## Miscellaneous

Google may update these Terms (1) to reflect changes in how it does business,
(2) for legal, regulatory or security reasons, or (3) to prevent abuse or harm.
The version of these Terms that were effective on the date the relevant Output
was generated will apply to your use of that Output.

If it turns out that a particular provision of these Terms is not valid or
enforceable, this will not affect any other provisions.


================================================
FILE: README.md
================================================
![header](docs/header.jpg)

# AlphaFold 3

This package provides an implementation of the inference pipeline of AlphaFold
3. See below for how to access the model parameters. You may only use AlphaFold
3 model parameters if received directly from Google. Use is subject to these
[terms of use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md).

Any publication that discloses findings arising from using this source code, the
model parameters or outputs produced by those should [cite](#citing-this-work)
the
[Accurate structure prediction of biomolecular interactions with AlphaFold 3](https://doi.org/10.1038/s41586-024-07487-w)
paper.

Please also refer to the Supplementary Information for a detailed description of
the method.

AlphaFold 3 is also available at
[alphafoldserver.com](https://alphafoldserver.com) for non-commercial use,
though with a more limited set of ligands and covalent modifications.

If you have any questions, please contact the AlphaFold team at
[alphafold@google.com](mailto:alphafold@google.com).

## Obtaining Model Parameters

This repository contains all necessary code for AlphaFold 3 inference. To
request access to the AlphaFold 3 model parameters, please complete
[this form](https://forms.gle/svvpY4u2jsHEwWYS6). Access will be granted at
Google DeepMind’s sole discretion. We will aim to respond to requests within 2–3
business days. You may only use AlphaFold 3 model parameters if received
directly from Google. Use is subject to these
[terms of use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md).

## Installation and Running Your First Prediction

See the [installation documentation](docs/installation.md).

Once you have installed AlphaFold 3, you can test your setup using e.g. the
following input JSON file named `fold_input.json`:

```json
{
  "name": "2PV7",
  "sequences": [
    {
      "protein": {
        "id": ["A", "B"],
        "sequence": "GMRESYANENQFGFKTINSDIHKIVIVGGYGKLGGLFARYLRASGYPISILDREDWAVAESILANADVVIVSVPINLTLETIERLKPYLTENMLLADLTSVKREPLAKMLEVHTGAVLGLHPMFGADIASMAKQVVVRCDGRFPERYEWLLEQIQIWGAKIYQTNATEHDHNMTYIQALRHFSTFANGLHLSKQPINLANLLALSSPIYRLELAMIGRLFAQDAELYADIIMDKSENLAVIETLKQTYDEALTFFENNDRQGFIDAFHKVRDWFGDYSEQFLKESRQLLQQANDLKQG"
      }
    }
  ],
  "modelSeeds": [1],
  "dialect": "alphafold3",
  "version": 1
}
```

You can then run AlphaFold 3 using the following command:

```
docker run -it \
    --volume $HOME/af_input:/root/af_input \
    --volume $HOME/af_output:/root/af_output \
    --volume <MODEL_PARAMETERS_DIR>:/root/models \
    --volume <DATABASES_DIR>:/root/public_databases \
    --gpus all \
    alphafold3 \
    python run_alphafold.py \
    --json_path=/root/af_input/fold_input.json \
    --model_dir=/root/models \
    --output_dir=/root/af_output
```

There are various flags that you can pass to the `run_alphafold.py` command, to
list them all run `python run_alphafold.py --help`. Two fundamental flags that
control which parts AlphaFold 3 will run are:

*   `--run_data_pipeline` (defaults to `true`): whether to run the data
    pipeline, i.e. genetic and template search. This part is CPU-only, time
    consuming and could be run on a machine without a GPU.
*   `--run_inference` (defaults to `true`): whether to run the inference. This
    part requires a GPU.

## AlphaFold 3 Input

See the [input documentation](docs/input.md).

## AlphaFold 3 Output

See the [output documentation](docs/output.md).

## Performance

See the [performance documentation](docs/performance.md).

## Known Issues

Known issues are documented in the
[known issues documentation](docs/known_issues.md).

Please
[create an issue](https://github.com/google-deepmind/alphafold3/issues/new/choose)
if it is not already listed in [Known Issues](docs/known_issues.md) or in the
[issues tracker](https://github.com/google-deepmind/alphafold3/issues).

## Citing This Work

Any publication that discloses findings arising from using this source code, the
model parameters or outputs produced by those should cite:

```bibtex
@article{Abramson2024,
  author  = {Abramson, Josh and Adler, Jonas and Dunger, Jack and Evans, Richard and Green, Tim and Pritzel, Alexander and Ronneberger, Olaf and Willmore, Lindsay and Ballard, Andrew J. and Bambrick, Joshua and Bodenstein, Sebastian W. and Evans, David A. and Hung, Chia-Chun and O’Neill, Michael and Reiman, David and Tunyasuvunakool, Kathryn and Wu, Zachary and Žemgulytė, Akvilė and Arvaniti, Eirini and Beattie, Charles and Bertolli, Ottavia and Bridgland, Alex and Cherepanov, Alexey and Congreve, Miles and Cowen-Rivers, Alexander I. and Cowie, Andrew and Figurnov, Michael and Fuchs, Fabian B. and Gladman, Hannah and Jain, Rishub and Khan, Yousuf A. and Low, Caroline M. R. and Perlin, Kuba and Potapenko, Anna and Savy, Pascal and Singh, Sukhdeep and Stecula, Adrian and Thillaisundaram, Ashok and Tong, Catherine and Yakneen, Sergei and Zhong, Ellen D. and Zielinski, Michal and Žídek, Augustin and Bapst, Victor and Kohli, Pushmeet and Jaderberg, Max and Hassabis, Demis and Jumper, John M.},
  journal = {Nature},
  title   = {Accurate structure prediction of biomolecular interactions with AlphaFold 3},
  year    = {2024},
  volume  = {630},
  number  = {8016},
  pages   = {493–-500},
  doi     = {10.1038/s41586-024-07487-w}
}
```

## Acknowledgements

AlphaFold 3's release was made possible by the invaluable contributions of the
following people:

Andrew Cowie, Bella Hansen, Charlie Beattie, Chris Jones, Grace Margand,
Jacob Kelly, James Spencer, Josh Abramson, Kathryn Tunyasuvunakool, Kuba Perlin,
Lindsay Willmore, Max Bileschi, Molly Beck, Oleg Kovalevskiy,
Sebastian Bodenstein, Sukhdeep Singh, Tim Green, Toby Sargeant, Uchechi Okereke,
Yotam Doron, and Augustin Žídek (engineering lead).

We also extend our gratitude to our collaborators at Google and Isomorphic Labs.

AlphaFold 3 uses the following separate libraries and packages:

*   [abseil-cpp](https://github.com/abseil/abseil-cpp) and
    [abseil-py](https://github.com/abseil/abseil-py)
*   [Docker](https://www.docker.com)
*   [DSSP](https://github.com/PDB-REDO/dssp)
*   [HMMER Suite](https://github.com/EddyRivasLab/hmmer)
*   [Haiku](https://github.com/deepmind/dm-haiku)
*   [JAX](https://github.com/jax-ml/jax/)
*   [libcifpp](https://github.com/pdb-redo/libcifpp)
*   [NumPy](https://github.com/numpy/numpy)
*   [pybind11](https://github.com/pybind/pybind11) and
    [pybind11_abseil](https://github.com/pybind/pybind11_abseil)
*   [RDKit](https://github.com/rdkit/rdkit)
*   [Tokamax](https://github.com/openxla/tokamax)
*   [tqdm](https://github.com/tqdm/tqdm)

We thank all their contributors and maintainers!

## Get in Touch

If you have any questions not covered in this overview, please contact the
AlphaFold team at alphafold@google.com.

We would love to hear your feedback and understand how AlphaFold 3 has been
useful in your research. Share your stories with us at
[alphafold@google.com](mailto:alphafold@google.com).

## Licence and Disclaimer

This is not an officially supported Google product.

Copyright 2024 DeepMind Technologies Limited.

### AlphaFold 3 Source Code and Model Parameters

The AlphaFold 3 source code is licensed under the Creative Commons
Attribution-Non-Commercial ShareAlike International License, Version 4.0
(CC-BY-NC-SA 4.0) (the "License"); you may not use this file except in
compliance with the License. You may obtain a copy of the License at
[https://github.com/google-deepmind/alphafold3/blob/main/LICENSE](https://github.com/google-deepmind/alphafold3/blob/main/LICENSE).

The AlphaFold 3 model parameters are made available under the
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md)
(the "Terms"); you may not use these except in compliance with the Terms. You
may obtain a copy of the Terms at
[https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md).

Unless required by applicable law, AlphaFold 3 and its output are distributed on
an "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express
or implied. You are solely responsible for determining the appropriateness of
using AlphaFold 3, or using or distributing its source code or output, and
assume any and all risks associated with such use or distribution and your
exercise of rights and obligations under the relevant terms. Output are
predictions with varying levels of confidence and should be interpreted
carefully. Use discretion before relying on, publishing, downloading or
otherwise using the AlphaFold 3 Assets.

AlphaFold 3 and its output are for theoretical modeling only. They are not
intended, validated, or approved for clinical use. You should not use the
AlphaFold 3 or its output for clinical purposes or rely on them for medical or
other professional advice. Any content regarding those topics is provided for
informational purposes only and is not a substitute for advice from a qualified
professional. See the relevant terms for the specific language governing
permissions and limitations under the terms.

### Third-party Software

Use of the third-party software, libraries or code referred to in the
[Acknowledgements](#acknowledgements) section above may be governed by separate
terms and conditions or license provisions. Your use of the third-party
software, libraries or code is subject to any such terms and you should check
that you can comply with any applicable restrictions or terms and conditions
before use.

### Mirrored and Reference Databases

The following databases have been: (1) mirrored by Google DeepMind; and (2) in
part, included with the inference code package for testing purposes, and are
available with reference to the following:

*   [BFD](https://bfd.mmseqs.com/) (modified), by Steinegger M. and Söding J.,
    modified by Google DeepMind, available under a
    [Creative Commons Attribution 4.0 International License](https://creativecommons.org/licenses/by/4.0/deed.en).
    See the Methods section of the
    [AlphaFold proteome paper](https://www.nature.com/articles/s41586-021-03828-1)
    for details.
*   [PDB](https://wwpdb.org) (unmodified), by H.M. Berman et al., available free
    of all copyright restrictions and made fully and freely available for both
    non-commercial and commercial use under
    [CC0 1.0 Universal (CC0 1.0) Public Domain Dedication](https://creativecommons.org/publicdomain/zero/1.0/).
*   [MGnify: v2022\_05](https://ftp.ebi.ac.uk/pub/databases/metagenomics/peptide_database/2022_05/README.txt)
    (unmodified), by Mitchell AL et al., available free of all copyright
    restrictions and made fully and freely available for both non-commercial and
    commercial use under
    [CC0 1.0 Universal (CC0 1.0) Public Domain Dedication](https://creativecommons.org/publicdomain/zero/1.0/).
*   [UniProt: 2021\_04](https://www.uniprot.org/) (unmodified), by The UniProt
    Consortium, available under a
    [Creative Commons Attribution 4.0 International License](https://creativecommons.org/licenses/by/4.0/deed.en).
*   [UniRef90: 2022\_05](https://www.uniprot.org/) (unmodified) by The UniProt
    Consortium, available under a
    [Creative Commons Attribution 4.0 International License](https://creativecommons.org/licenses/by/4.0/deed.en).
*   [NT: 2023\_02\_23](https://www.ncbi.nlm.nih.gov/nucleotide/) (modified) See
    the Supplementary Information of the
    [AlphaFold 3 paper](https://nature.com/articles/s41586-024-07487-w) for
    details.
*   [RFam: 14\_4](https://rfam.org/) (modified), by I. Kalvari et al., available
    free of all copyright restrictions and made fully and freely available for
    both non-commercial and commercial use under
    [CC0 1.0 Universal (CC0 1.0) Public Domain Dedication](https://creativecommons.org/publicdomain/zero/1.0/).
    See the Supplementary Information of the
    [AlphaFold 3 paper](https://nature.com/articles/s41586-024-07487-w) for
    details.
*   [RNACentral: 21\_0](https://rnacentral.org/) (modified), by The RNAcentral
    Consortium available free of all copyright restrictions and made fully and
    freely available for both non-commercial and commercial use under
    [CC0 1.0 Universal (CC0 1.0) Public Domain Dedication](https://creativecommons.org/publicdomain/zero/1.0/).
    See the Supplementary Information of the
    [AlphaFold 3 paper](https://nature.com/articles/s41586-024-07487-w) for
    details.


================================================
FILE: WEIGHTS_PROHIBITED_USE_POLICY.md
================================================
# ALPHAFOLD 3 MODEL PARAMETERS PROHIBITED USE POLICY

Last Modified: 2024-11-09

AlphaFold 3 can help you accelerate scientific research by predicting the 3D
structure of biological molecules. Google makes the AlphaFold Assets available
free of charge for certain non-commercial uses in accordance with the
restrictions set out below. This policy uses the same defined terms as the
[AlphaFold 3 Model Parameters Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md).

**You must not access or use nor allow others to access or use the AlphaFold 3
Assets:**

1.  **On behalf of a commercial organization or in connection with any
    commercial activities, including research on behalf of commercial
    organizations.**

    1.  This means that only non-commercial organizations (*i.e.*, universities,
        non-profit organizations and research institutes, educational,
        journalism and government bodies) may use the AlphaFold 3 Assets for
        their non-commercial activities. The AlphaFold 3 Assets are not
        available for any other types of organization, even if conducting
        non-commercial work.

    2.  If you are a researcher affiliated with a non-commercial organization,
        provided **you are not a commercial organisation or acting on behalf of
        a commercial organisation,** you can use the AlphaFold 3 Assets for your
        non-commercial affiliated research.

    3.  You must not share the AlphaFold 3 Assets with any commercial
        organization or use the AlphaFold 3 Assets in a manner that will grant a
        commercial organization any rights in these. The only exception is
        making Output publicly available (including indirectly to commercial
        organizations) via a scientific publication or open source release or
        using it to support journalism, each of which is permitted.

2.  **To misinform, misrepresent or mislead**, including:

    1.  providing false or inaccurate information in relation to your access to
        or use of AlphaFold 3 or Output, including accessing or using the Model
        Parameters on behalf of an organization without telling us or submitting
        a request to access the Model Parameters where Google has prohibited
        your use of AlphaFold 3 in full or in part (including as made available
        via [AlphaFold Server](https://alphafoldserver.com/about));

    2.  misrepresenting your relationship with us, including by using Google’s
        trademarks, trade names, logos or suggesting endorsement by Google
        without Google’s permission to do so - nothing in the Terms grants such
        permission;

    3.  misrepresenting the origin of AlphaFold 3 in full or in part;

    4.  distributing misleading claims of expertise or capability, or engaging
        in the unauthorized or unlicensed practice of any profession,
        particularly in sensitive areas (*e.g.*, health); or

    5.  to make decisions in domains that affect material or individual rights
        or well-being (*e.g.*, healthcare).

3.  **To perform, promote or facilitate dangerous, illegal or malicious
    activities**, including:

    1.  promoting or facilitating the sale of, or providing instructions for
        synthesizing or accessing, illegal substances, goods or services;

    2.  abusing, harming, interfering, or disrupting any services, including
        generating or distributing content for deceptive or fraudulent
        activities or malware;

    3.  generating or distributing any content, including Output, that
        infringes, misappropriates, or otherwise violates any individual's or
        entity's rights (including, but not limited to rights in copyrighted
        content); or

    4.  attempting to circumvent, or intentionally causing (directly or
        indirectly) AlphaFold 3 to act in a manner that contravenes the Terms.

**You must not nor allow others to:**

1.  **Use Output to train or create machine learning models or related
    technology for biomolecular structure prediction similar to AlphaFold 3
    ("Derived Models"),** including via distillation or other methods. For the
    avoidance of doubt, the use restrictions set out in the Terms would apply in
    full to any Derived Models created in breach of the Terms.

2.  **Distribute Output without providing conspicuous notice that what you
    Distribute is provided under and subject to the
    [AlphaFold 3 Output Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
    and of any modifications you make.**

    1.  This means if you remove, or cause to be removed (for example by using
        third-party software), the notices and terms we provide when you
        generate Output using AlphaFold 3, you must ensure any further
        Distribution of Output is accompanied by a copy of the
        [AlphaFold 3 Output Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
        and a "Legally Binding Terms of Use" text file that contains the
        following notice:

        "*By using this information, you agree to AlphaFold 3 Output Terms of
        Use found at
        https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md.*

        *To request access to the AlphaFold 3 model parameters, follow the
        process set out at https://github.com/google-deepmind/alphafold3. You
        may only use these if received directly from Google. Use is subject to
        terms of use available at
        https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.*"

    2.  You must not include any additional or different terms that conflict
        with the
        [AlphaFold 3 Output Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

3.  **Distribute Output, or disclose findings arising from using AlphaFold 3
    without citing our paper:** [Abramson, J et al. Accurate structure
    prediction of biomolecular interactions with AlphaFold 3. *Nature*
    (2024)](https://www.nature.com/articles/s41586-024-07487-w). For the
    avoidance of doubt, this is an additional requirement to the notice
    requirements set out above.

4.  **Circumvent access restrictions relating to the Model Parameters, including
    utilising, sharing or making available the Model Parameters when you have
    not been expressly authorized to do so by Google.** Google will grant access
    to the Model Parameters to either:

    1.  you for your individual use on behalf of your organization, in which
        case you cannot share your copy of Model Parameters with anyone else; or

    2.  an authorized representative of your organization, with full legal
        authority to bind that organization to these Terms in which case you may
        share that organization’s copy of the Model Parameters with employees,
        consultants, contractors and agents of the organization as authorized by
        that representative.


================================================
FILE: WEIGHTS_TERMS_OF_USE.md
================================================
# ALPHAFOLD 3 MODEL PARAMETERS TERMS OF USE

Last Modified: 2024-11-09

[AlphaFold 3](https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/)
is an AI model developed by [Google DeepMind](https://deepmind.google/) and
[Isomorphic Labs](https://www.isomorphiclabs.com/). It generates 3D structure
predictions of biological molecules, providing model confidence for the
structure predictions. We make the trained model parameters and output generated
using those available free of charge for certain non-commercial uses, in
accordance with these terms of use and the
[AlphaFold 3 Model Parameters Prohibited Use Policy](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_PROHIBITED_USE_POLICY.md).

**Key things to know when using the AlphaFold 3 model parameters and output**

1.  The AlphaFold 3 model parameters and output are **only** available for
    non-commercial use by, or on behalf of, non-commercial organizations
    (*i.e.*, universities, non-profit organizations and research institutes,
    educational, journalism and government bodies). If you are a researcher
    affiliated with a non-commercial organization, provided **you are not a
    commercial organisation or acting on behalf of a commercial organisation,**
    this means you can use these for your non-commercial affiliated research.
2.  You **must not** use nor allow others to use:
    1.  AlphaFold 3 model parameters or output in connection with **any
        commercial activities, including research** **on behalf of commercial
        organizations;** or
    2.  AlphaFold 3 output to **train machine learning models** or related
        technology for **biomolecular structure prediction** similar to
        AlphaFold 3.
3.  You ***must not* publish or share AlphaFold 3 model parameters**, except
    sharing these within your organization in accordance with these Terms.
4.  You ***can* publish, share and adapt AlphaFold 3 *output*** in accordance
    with these Terms, including the requirements to provide clear notice of any
    modifications you make and that ongoing use of AlphaFold 3 output and
    derivatives are subject to the
    [AlphaFold 3 Output Terms of Use](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

By using, reproducing, modifying, performing, distributing or displaying any
portion or element of the Model Parameters (as defined below) or otherwise
accepting the terms of this agreement, you agree to be bound by (1) these terms
of use, and (2) the
[AlphaFold 3 Model Parameters Prohibited Use Policy](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_PROHIBITED_USE_POLICY.md)
which is incorporated herein by reference (together, the "**Terms**"), in each
case (a) as modified from time to time in accordance with the Terms, and (b)
between you and (i) if you are from a country in the European Economic Area or
Switzerland, Google Ireland Limited, or (ii) otherwise, Google LLC.

You confirm you are authorized either explicitly or implicitly to enter, and are
entering, into the Terms as an employee on behalf of, or otherwise on behalf of,
your organization.

Please read these Terms carefully. They establish what you can expect from us as
you access and use the AlphaFold 3 Assets (as defined below), and what Google
expects from you. When we say "**you**", we mean the individual or organization
using the AlphaFold 3 Assets. When we say "**we**", "**us**" or "**Google**", we
mean the entities that belong to the Google group of companies, which means
Google LLC and its affiliates.

## 1. Key Definitions

As used in these Terms:

"**AlphaFold 3**" means: (a) the AlphaFold 3 source code made available
[here](https://github.com/google-deepmind/alphafold3/) and licensed under the
terms of the Creative Commons Attribution-NonCommercial-Sharealike 4.0
International (CC-BY-NC-SA 4.0) license and any derivative source code, and (b)
Model Parameters.

"**AlphaFold 3 Assets**" means the Model Parameters and Output.

"**Distribution**" or "**Distribute**" means any transmission, publication, or
other sharing of Output publicly or to any other person.

"**Model Parameters**" means the trained model weights and parameters made
available by Google to organizations (at its sole discretion) for their use in
accordance with these Terms, together with (a) modifications to those weights
and parameters, (b) works based on those weights and parameters, or (c) other
code or machine learning models which incorporate, in full or in part, those
weights and parameters.

"**Output**" means the structure predictions and all ancillary and related
information provided by AlphaFold 3 or using the Model Parameters, together with
any visual representations, computational predictions, descriptions,
modifications, copies, or adaptations that are substantially derived from
Output.

"**Including"** means "**including without limitation**".

## 2. Accessing and using the AlphaFold 3 Assets

Subject to your compliance with the Terms, including the
[AlphaFold 3 Model Parameters Prohibited Use Policy](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_PROHIBITED_USE_POLICY.md),
you may access, use and modify the AlphaFold 3 Assets and Distribute the Output
as set out in these Terms. We grant you a non-exclusive, royalty-free,
revocable, non-transferable and non-sublicensable (except as expressly permitted
in these Terms) license to any intellectual property rights we have in the
AlphaFold Assets to the extent necessary for these purposes. In order to verify
your access and use of AlphaFold 3, we may from time-to-time ask for additional
information from you, including verification of your name, organization, and
other identifying information.

By accessing, using, or modifying the AlphaFold 3 Assets, Distributing Output,
or requesting to access the Model Parameters, you represent and warrant that (a)
you have full power and authority to enter into these Terms (including being of
sufficient age of consent), (b) Google has never previously terminated your
access and right to use AlphaFold 3 (including as made available via
[AlphaFold Server](https://alphafoldserver.com/about)) due to your breach of
applicable terms of use, (c) entering into or performing your rights and
obligations under these Terms will not violate any agreement you have with a
third party or any third-party rights, (d) any information provided by you to
Google in relation to AlphaFold 3, including (where applicable) in order to
request access to the Model Parameters, is correct and current, and (e) you are
not (i) resident of a embargoed country, (ii) ordinarily resident in a US
embargoed country, or (iii) otherwise prohibited by applicable export controls
and sanctions programs from accessing, using, or modifying the AlphaFold 3
Assets.

If you choose to give Google feedback, such as suggestions to improve AlphaFold
3, you undertake any such information is non-confidential and non-proprietary,
and Google may act on your feedback without obligation to you.

## 3. Use Restrictions

You must not use any of the AlphaFold 3 Assets:

1.  for the restricted uses set forth in the
    [AlphaFold 3 Model Parameters Prohibited Use Policy](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_PROHIBITED_USE_POLICY.md);
    or
2.  in violation of applicable laws and regulations.

To the maximum extent permitted by law and without limiting any of our other
rights, Google reserves the right to revoke your right to use, and (to the
extent feasible) restrict usage of any of the AlphaFold 3 Assets that Google
reasonably believes is in violation of these Terms.

## 4. Generated Output

Although you must comply with these Terms when using the AlphaFold 3 Assets, we
will not claim ownership in original Output you generate using AlphaFold 3.
However, you acknowledge that AlphaFold 3 may generate the same or similar
Output for multiple users, including Google, and we reserve all our rights in
this respect.

## 5. Changes to the AlphaFold 3 Assets or these Terms

Google may add or remove functionalities or features of the AlphaFold 3 Assets
at any time and may stop offering access to the AlphaFold 3 Assets altogether.

Google may update these Terms and the access mechanism for the Model Parameters
at any time. We'll post any modifications to the Terms
[in the AlphaFold 3 GitHub repository](https://github.com/google-deepmind/alphafold3).
Changes will generally become effective 14 days after they are posted. However,
changes addressing functionality or made for legal reasons will be effective
immediately.

You should review the Terms whenever we update them or you use the AlphaFold 3
Assets. If you do not agree to any modifications to the Terms, you must stop
using the AlphaFold 3 Assets immediately.

## 6. Suspending or terminating your right to use the AlphaFold 3 Assets

Google may at any time suspend or terminate your right to use and, as applicable
access to, the AlphaFold 3 Assets because of, among other reasons, your failure
to fully comply with the Terms. If Google suspends or terminates your right to
access or use the AlphaFold 3 Assets, you must immediately delete and cease use
and Distribution of all copies of the AlphaFold 3 Assets in your possession or
control and are prohibited from using the AlphaFold 3 Assets, including by
submitting an application to use the Model Parameters. Google will endeavour to
give you reasonable notice prior to any such suspension or termination, but no
notice or prior warning will be given if the suspension or termination is for
your failure to fully comply with the Terms or other serious grounds.

Of course, you are always free to stop using the AlphaFold 3 Assets. If you do
stop using these, we would appreciate knowing why (via
[alphafold@google.com](mailto:alphafold@google.com)) so that we can continue to
improve our technologies.

## 7. Confidentiality

You agree not to disclose or make available Google Confidential Information to
anyone without our prior written consent. "**Google Confidential Information**"
means (a) the AlphaFold 3 Model Parameters and all software, technology and
documentation relating to AlphaFold 3, except for the AlphaFold 3 source code,
and (b) any other information made available by Google that is marked
confidential or would normally be considered confidential under the
circumstances in which it is presented. Google Confidential Information does not
include (a) information that you already knew prior to your access to, or use
of, the AlphaFold 3 Assets (including via
[AlphaFold Server](https://alphafoldserver.com/about)), (b) that becomes public
through no fault of yours (for example, your breach of the Terms), (c) that was
independently developed by you without reference to Google Confidential
Information, or (d) that was lawfully given to you by a third party (without
your or their breach of the Terms).

## 8. Disclaimers

Nothing in the Terms restricts any rights that cannot be restricted under
applicable law or limits Google's responsibilities except as allowed by
applicable law.

**AlphaFold 3 and Output are provided on an "as is" basis, without warranties or
conditions of any kind, either express or implied, including any warranties or
conditions of title, non-infringement, merchantability, or fitness for a
particular purpose. You are solely responsible for determining the
appropriateness of using AlphaFold 3, or using or distributing Output, and
assume any and all risks associated with such use or distribution and your
exercise of rights and obligations under these Terms. You and anyone you share
Output with are solely responsible for these and their subsequent uses.**

**Output are predictions with varying levels of confidence and should be
interpreted carefully. Use discretion before relying on, publishing, downloading
or otherwise using AlphaFold 3.**

**AlphaFold 3 and Outputs are for theoretical modeling only. They are not
intended, validated, or approved for clinical use. You should not use AlphaFold
3 or Output for clinical purposes or rely on them for medical or other
professional advice. Any content regarding those topics is provided for
informational purposes only and is not a substitute for advice from a qualified
professional.**

## 9. Liabilities

To the extent allowed by applicable law, you will indemnify Google and its
directors, officers, employees, and contractors for any third-party legal
proceedings (including actions by government authorities) arising out of or
relating to your unlawful use of the AlphaFold 3 Assets or violation of the
Terms. This indemnity covers any liability or expense arising from claims,
losses, damages, judgments, fines, litigation costs, and legal fees, except to
the extent a liability or expense is caused by Google's breach, negligence, or
willful misconduct. If you are legally exempt from certain responsibilities,
including indemnification, then those responsibilities do not apply to you under
the Terms.

In no circumstances will Google be responsible for any indirect, special,
incidental, exemplary, consequential, or punitive damages, or lost profits of
any kind in connection with the Terms or the AlphaFold 3 Assets, even if Google
has been advised of the possibility of such damages. Google's total aggregate
liability for all claims arising out of or in connection with the Terms or the
AlphaFold 3 Assets, including for its own negligence, is limited to $500.

## 10. Miscellaneous

By law, you have certain rights that cannot be limited by a contract like the
Terms. The Terms are in no way intended to restrict those rights.

The Terms are our entire agreement relating to your use of the AlphaFold 3
Assets and supersede any prior or contemporaneous agreements on that subject.

If it turns out that a particular provision of the Terms is not enforceable, the
balance of the Terms will remain in full force and effect.

## 11. Disputes

California law will govern all disputes arising out of or relating to the Terms
or in connection to the AlphaFold 3 Assets. These disputes will be resolved
exclusively in the federal or state courts of Santa Clara County, California,
USA and you and Google consent to personal jurisdiction in those courts. To the
extent that applicable local law prevents certain disputes from being resolved
in a California court, you and Google can file those disputes in your local
courts. If applicable local law prevents your local court from applying
California law to resolve these disputes, then these disputes will be governed
by the applicable local laws of your country, state, or other place of
residence. If you are using the AlphaFold 3 Assets on behalf of a government
organization other than US federal government organizations (where the foregoing
provisions shall apply to the extent permitted by federal law), these Terms will
be silent regarding governing law and courts.

Given the nature of scientific research, it may take some time for any breach of
the Terms to become apparent. To protect you, Google and the AlphaFold 3 Assets,
to the extent allowed by applicable law you agree that:

1.  any legal claims relating to the Terms or the AlphaFold 3 Assets can be
    initiated until the later of:
    1.  the cut-off date under applicable law for bringing the legal claim; or
    2.  two years from the date you or Google (as applicable) became aware, or
        should reasonably have become aware, of the facts giving rise to that
        claim; and
2.  you will not argue limitation, time bar, delay, waiver, or the like in an
    attempt to bar an action filed within that time period, and neither will
    Google.

All rights not specifically and expressly granted to you by the Terms are
reserved to Google. No delay, act or omission by Google in exercising any right
or remedy will be deemed a waiver of any breach of the Terms and Google
expressly reserves any and all rights and remedies available under the Terms or
at law or in equity or otherwise, including the remedy of injunctive relief
against any threatened or actual breach of the Terms without the necessity of
proving actual damages.


================================================
FILE: docker/Dockerfile
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

FROM nvidia/cuda:12.6.3-base-ubuntu24.04

# Some RUN statements are combined together to make Docker build run faster.
# Get latest package listing, install python, git, wget, compilers and libs.
# * git is required for pyproject.toml toolchain's use of CMakeLists.txt.
# * gcc, g++, make are required for compiling HMMER and AlphaFold 3 libaries.
# * zlib is a required dependency of AlphaFold 3.
RUN DEBIAN_FRONTEND=noninteractive \
apt-get update --quiet \
&& apt-get install --yes --quiet python3.12 python3.12-dev \
&& apt-get install --yes --quiet git wget gcc g++ make zlib1g-dev zstd

# Install uv from the official repository. The version is pinned for
# reproducibility.
COPY --from=ghcr.io/astral-sh/uv:0.9.24 /uv /uvx /bin/

# UV_COMPILE_BYTECODE=1 speeds up future container starts.
# UV_PROJECT_ENVIRONMENT explicitly sets the virtual environment location.
ENV UV_COMPILE_BYTECODE=1
ENV UV_PROJECT_ENVIRONMENT=/alphafold3_venv
RUN uv venv $UV_PROJECT_ENVIRONMENT

ENV PATH="/hmmer/bin:/alphafold3_venv/bin:$PATH"

# Install HMMER. Do so before copying the source code, so that docker can cache
# the image layer containing HMMER. Alternatively, you could also install it
# using `apt-get install hmmer` instead of bulding it from source, but we want
# to have control over the exact version of HMMER and also apply the sequence
# limit patch. Also note that eddylab.org unfortunately doesn't support HTTPS
# and the tar file published on GitHub is explicitly not recommended to be used
# for building from source.

# Download, check hash, and extract the HMMER source code.
RUN mkdir /hmmer_build /hmmer ; \
    wget http://eddylab.org/software/hmmer/hmmer-3.4.tar.gz --directory-prefix /hmmer_build ; \
    (cd /hmmer_build && echo "ca70d94fd0cf271bd7063423aabb116d42de533117343a9b27a65c17ff06fbf3 hmmer-3.4.tar.gz" | sha256sum --check) && \
    (cd /hmmer_build && tar zxf hmmer-3.4.tar.gz && rm hmmer-3.4.tar.gz)

# Apply the --seq_limit patch to HMMER.
COPY docker/jackhmmer_seq_limit.patch /hmmer_build/
RUN (cd /hmmer_build && patch -p0 < jackhmmer_seq_limit.patch)

# Build HMMER.
RUN (cd /hmmer_build/hmmer-3.4 && ./configure --prefix /hmmer) ; \
    (cd /hmmer_build/hmmer-3.4 && make -j) ; \
    (cd /hmmer_build/hmmer-3.4 && make install) ; \
    (cd /hmmer_build/hmmer-3.4/easel && make install) ; \
    rm -R /hmmer_build

# Copy the AlphaFold 3 source code from the local machine to the container and
# set the working directory to there.
COPY . /app/alphafold
WORKDIR /app/alphafold

# Install the exact dependency tree using uv and cache the build artifacts.
# --frozen: do not update the lockfile during build.
# --all-groups: install development/test dependencies defined in pyproject.toml.
# --no-editable: install as a static package.
# If using this as a recipe for local installation, we recommend removing the
# --frozen and --no-editable flags.
RUN --mount=type=cache,target=/root/.cache/uv \ 
    UV_LINK_MODE=copy uv sync --frozen --all-groups --no-editable

# Build chemical components database (this binary was installed by uv sync).
RUN uv run build_data

# To work around a known XLA issue causing the compilation time to greatly
# increase, the following environment variable setting XLA flags must be enabled
# when running AlphaFold 3. Note that if using CUDA capability 7 GPUs, it is
# necessary to set the following XLA_FLAGS value instead:
# ENV XLA_FLAGS="--xla_disable_hlo_passes=custom-kernel-fusion-rewriter"
# (no need to disable gemm in that case as it is not supported for such GPU).
ENV XLA_FLAGS="--xla_gpu_enable_triton_gemm=false"
# Memory settings used for folding up to 5,120 tokens on A100 80 GB.
ENV XLA_PYTHON_CLIENT_PREALLOCATE=true
ENV XLA_CLIENT_MEM_FRACTION=0.95

CMD ["uv", "run", "python3", "run_alphafold.py"]


================================================
FILE: docker/dockerignore
================================================
dockerignore
Dockerfile

================================================
FILE: docker/jackhmmer_seq_limit.patch
================================================
--- hmmer-3.4/src/jackhmmer.c
+++ hmmer-3.4/src/jackhmmer.c
@@ -73,6 +73,7 @@ static ESL_OPTIONS options[] = {
   { "--noali",      eslARG_NONE,        FALSE, NULL, NULL,      NULL,    NULL,  NULL,            "don't output alignments, so output is smaller",                2 },
   { "--notextw",    eslARG_NONE,         NULL, NULL, NULL,      NULL,    NULL, "--textw",        "unlimit ASCII text output line width",                         2 },
   { "--textw",      eslARG_INT,         "120", NULL, "n>=120",  NULL,    NULL, "--notextw",      "set max width of ASCII text output lines",                     2 },
+  { "--seq_limit",  eslARG_INT,          NULL, NULL, NULL,      NULL,    NULL, "--seq_limit",    "if set, truncate all hits after this value is reached",        2 },
 /* Control of scoring system */
   { "--popen",      eslARG_REAL,       "0.02", NULL, "0<=x<0.5",NULL,    NULL,  NULL,            "gap open probability",                                         3 },
   { "--pextend",    eslARG_REAL,        "0.4", NULL, "0<=x<1",  NULL,    NULL,  NULL,            "gap extend probability",                                       3 },
@@ -298,6 +299,7 @@ output_header(FILE *ofp, ESL_GETOPTS *go
   if (esl_opt_IsUsed(go, "--noali")      && fprintf(ofp, "# show alignments in output:       no\n")                                                   < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
   if (esl_opt_IsUsed(go, "--notextw")    && fprintf(ofp, "# max ASCII text line length:      unlimited\n")                                            < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
   if (esl_opt_IsUsed(go, "--textw")      && fprintf(ofp, "# max ASCII text line length:      %d\n",             esl_opt_GetInteger(go, "--textw"))    < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
+  if (esl_opt_IsUsed(go, "--seq_limit")  && fprintf(ofp, "# set max sequence hits to return: %d\n",             esl_opt_GetInteger(go, "--seq_limit")) < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
   if (esl_opt_IsUsed(go, "--popen")      && fprintf(ofp, "# gap open probability:            %f\n",             esl_opt_GetReal   (go, "--popen"))    < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
   if (esl_opt_IsUsed(go, "--pextend")    && fprintf(ofp, "# gap extend probability:          %f\n",             esl_opt_GetReal   (go, "--pextend"))  < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
   if (esl_opt_IsUsed(go, "--mx")         && fprintf(ofp, "# subst score matrix (built-in):   %s\n",             esl_opt_GetString (go, "--mx"))       < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
@@ -674,6 +676,13 @@ serial_master(ESL_GETOPTS *go, struct cf
 	  /* Print the results. */
 	  p7_tophits_SortBySortkey(info->th);
 	  p7_tophits_Threshold(info->th, info->pli);
+	  /* Limit the number of hits if specified. */
+	  if (esl_opt_IsOn(go, "--seq_limit"))
+	  {
+	    int seq_limit = esl_opt_GetInteger(go, "--seq_limit");
+	    info->th->N = ESL_MIN(info->th->N, seq_limit);
+	  }
+
 	  p7_tophits_CompareRanking(info->th, kh, &nnew_targets);
 	  p7_tophits_Targets(ofp, info->th, info->pli, textw); if (fprintf(ofp, "\n\n") < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");
 	  p7_tophits_Domains(ofp, info->th, info->pli, textw); if (fprintf(ofp, "\n\n") < 0) ESL_EXCEPTION_SYS(eslEWRITE, "write failed");


================================================
FILE: docs/community_tools.md
================================================
# Community Tools

## JAAG: a JSON input file Assembler for AlphaFold 3 (with Glycan Integration)

JAAG is a lightweight, web-based GUI tool that helps generate AlphaFold 3 input
JSON files with integrated glycan support. It automates the creation of correct
glycan syntax (including `bondedAtomPairs` + CCD), reducing manual errors when
preparing glycoprotein or glycan–protein complexes.

*   Web app: https://biofgreat.org/JAAG
*   Source code: https://github.com/chinchc/JAAG
*   Paper: https://doi.org/10.1093/glycob/cwaf083

Note: JAAG is compatible with standalone AlphaFold 3, but not with the AlphaFold
3 server.

## Modeling glycans with AlphaFold 3: capabilities, caveats, and limitations

Paper on modeling glycans (and other ligands) with AF3 that modeled and assessed
major glycan classes and provides:

*   Step-by-step tutorial for building ligand inputs (applicable beyond glycans)
*   Ready-to-run scripts for each glycan class
*   Comprehensive CCD table for all SNFG monosaccharides
*   Discussion of caveats and limitations of AF3
*   Full AF3 inputs/outputs archived on ModelArchive for reproducibility

Useful resource if your AF3 ligand models appear stereochemically off.

*   Paper: https://doi.org/10.1093/glycob/cwaf048
*   ModelArchive: https://doi.org/10.5452/ma-af3glycan


================================================
FILE: docs/contributing.md
================================================
# How to Contribute

We welcome small patches related to bug fixes and documentation, but we do not
plan to make any major changes to this repository.

## Before You Begin

### Sign Our Contributor License Agreement

Contributions to this project must be accompanied by a
[Contributor License Agreement](https://cla.developers.google.com/about) (CLA).
You (or your employer) retain the copyright to your contribution; this simply
gives us permission to use and redistribute your contributions as part of the
project.

If you or your current employer have already signed the Google CLA (even if it
was for a different project), you probably don't need to do it again.

Visit <https://cla.developers.google.com/> to see your current agreements or to
sign a new one.

### Review Our Community Guidelines

This project follows
[Google's Open Source Community Guidelines](https://opensource.google/conduct/).

## Contribution Process

We won't accept pull requests directly, but if you send one, we will review it.
If we send a fix based on your pull request, we will make sure to credit you in
the release notes.


================================================
FILE: docs/input.md
================================================
# AlphaFold 3 Input

## Specifying Input Files

You can provide inputs to `run_alphafold.py` in one of two ways:

-   Single input file: Use the `--json_path` flag followed by the path to a
    single JSON file.
-   Multiple input files: Use the `--input_dir` flag followed by the path to a
    directory of JSON files.

## Input Format

AlphaFold 3 uses a custom JSON input format differing from the
[AlphaFold Server JSON input format](https://github.com/google-deepmind/alphafold/tree/main/server).
See [below](#alphafold-server-json-compatibility) for more information.

The custom AlphaFold 3 format allows:

*   Specifying protein, RNA, and DNA chains, including modified residues.
*   Specifying custom multiple sequence alignment (MSA) for protein and RNA
    chains.
*   Specifying custom structural templates for protein chains.
*   Specifying ligands using
    [Chemical Component Dictionary (CCD)](https://www.wwpdb.org/data/ccd) codes.
*   Specifying ligands using SMILES.
*   Specifying ligands by defining them using the CCD mmCIF format and supplying
    them via the [user-provided CCD](#user-provided-ccd).
*   Specifying covalent bonds between entities.
*   Specifying multiple random seeds.

## AlphaFold Server JSON Compatibility

The [AlphaFold Server](https://alphafoldserver.com/) uses a separate
[JSON format](https://github.com/google-deepmind/alphafold/tree/main/server)
from the one used here in the AlphaFold 3 codebase. In particular, the JSON
format used in the AlphaFold 3 codebase offers more flexibility and control in
defining custom ligands, branched glycans, and covalent bonds between entities.

We provide a converter in `run_alphafold.py` which automatically detects the
input JSON format, denoted `dialect` in the converter code. The converter
denotes the AlphaFoldServer JSON as `alphafoldserver`, and the JSON format
defined here in the AlphaFold 3 codebase as `alphafold3`. If the detected input
JSON format is `alphafoldserver`, then the converter will translate that into
the JSON format `alphafold3`.

### Multiple Inputs

The top-level of the `alphafoldserver` JSON format is a list, allowing
specification of multiple inputs in a single JSON. In contrast, the `alphafold3`
JSON format requires exactly one input per JSON file. Specifying multiple inputs
in a single `alphafoldserver` JSON is fully supported.

Note that the converter distinguishes between `alphafoldserver` and `alphafold3`
JSON formats by checking if the top-level of the JSON is a list or not. In
particular, if you pass in a `alphafoldserver`-style JSON without a top-level
list, then this is considered incorrect and `run_alphafold.py` will raise an
error.

### Glycans

If the JSON in `alphafoldserver` format specifies glycans, the converter will
raise an error. This is because translating glycans specified in the
`alphafoldserver` format to the `alphafold3` format is not currently supported.

### Random Seeds

The `alphafoldserver` JSON format allows users to specify `"modelSeeds": []`, in
which case a seed is chosen randomly for the user. On the other hand, the
`alphafold3` format requires users to specify a seed.

The converter will choose a seed randomly if `"modelSeeds": []` is set when
translating from `alphafoldserver` JSON format to `alphafold3` JSON format. If
seeds are specified in the `alphafoldserver` JSON format, then those will be
preserved in the translation to the `alphafold3` JSON format.

### Ions

While AlphaFold Server treats ions and ligands as different entity types in the
JSON format, AlphaFold 3 treats ions as ligands. Therefore, to specify e.g. a
magnesium ion, one would specify it as an entity of type `ligand` with
`ccdCodes: ["MG"]`.

### Sequence IDs

The `alphafold3` JSON format requires the user to specify a unique identifier
(`id`) for each entity. On the other hand, the `alphafoldserver` does not allow
specification of an `id` for each entity. Thus, the converter automatically
assigns one.

The converter iterates through the list provided in the `sequences` field of the
`alphafoldserver` JSON format, assigning an `id` to each entity using the
following order ("reverse spreadsheet style"):

```
A, B, ..., Z, AA, BA, CA, ..., ZA, AB, BB, CB, ..., ZB, ...
```

For any entity with `count > 1`, an `id` is assigned arbitrarily to each "copy"
of the entity.

## Top-level Structure

The top-level structure of the input JSON is:

```json
{
  "name": "Job name goes here",
  "modelSeeds": [1, 2],  # At least one seed required.
  "sequences": [
    {"protein": {...}},
    {"rna": {...}},
    {"dna": {...}},
    {"ligand": {...}}
  ],
  "bondedAtomPairs": [...],  # Optional.
  "userCCD": "...",  # Optional, mutually exclusive with userCCDPath.
  "userCCDPath": "...",  # Optional, mutually exclusive with userCCD.
  "dialect": "alphafold3",  # Required.
  "version": 4  # Required.
}
```

The fields specify the following:

*   `name: str`: The name of the job. A sanitised version of this name is used
    for naming the output files.
*   `modelSeeds: list[int]`: A list of integer random seeds. The pipeline and
    the model will be invoked with each of the seeds in the list. I.e. if you
    provide *n* random seeds, you will get *n* predicted structures, each with
    the respective random seed. You must provide at least one random seed.
*   `sequences: list[Protein | RNA | DNA | Ligand]`: A list of sequence
    dictionaries, each defining a molecular entity, see below.
*   `bondedAtomPairs: list[Bond]`: An optional list of covalently bonded atoms.
    These can link atoms within an entity, or across two entities. See more
    below.
*   `userCCD: str`: An optional string with user-provided chemical components
    dictionary. This is an expert mode for providing custom molecules when
    SMILES is not sufficient. This should also be used when you have a custom
    molecule that needs to be bonded with other entities - SMILES can't be used
    in such cases since it doesn't give the possibility of uniquely naming all
    atoms. It can also be used to provide a reference conformer for cases where
    RDKit fails to generate a conformer. See more below.
*   `userCCDPath: str`: An optional path to a file that contains the
    user-provided chemical components dictionary instead of providing it inline
    using the `userCCD` field. The path can be either absolute, or relative to
    the input JSON path. The file must be in the
    [CCD mmCIF format](https://www.wwpdb.org/data/ccd#mmcifFormat), and could be
    either plain text, or compressed using gzip, xz, or zstd.
*   `dialect: str`: The dialect of the input JSON. This must be set to
    `alphafold3`. See
    [AlphaFold Server JSON Compatibility](#alphafold-server-json-compatibility)
    for more information.
*   `version: int`: The version of the input JSON. This must be set to 1 or 2.
    See
    [AlphaFold Server JSON Compatibility](#alphafold-server-json-compatibility)
    and [versions](#versions) below for more information.

## Versions

The top-level `version` field (for the `alphafold3` dialect) can be either `1`,
`2`, or `3`. The following features have been added in respective versions:

*   `1`: the initial AlphaFold 3 input format.
*   `2`: added the option of specifying external MSA and templates using newly
    added fields `unpairedMsaPath`, `pairedMsaPath`, and `mmcifPath`.
*   `3`: added the option of specifying external user-provided CCD using newly
    added field `userCCDPath`.
*   `4`: added the option of specifying textual `description` of protein chains,
    RNA chains, DNA chains, or ligands.

## Sequences

The `sequences` section specifies the protein chains, RNA chains, DNA chains,
and ligands. Every entity in `sequences` must have a unique ID. IDs don't have
to be sorted alphabetically.

### Protein

Specifies a single protein chain.

```json
{
  "protein": {
    "id": "A",
    "sequence": "PVLSCGEWQL",
    "modifications": [
      {"ptmType": "HY3", "ptmPosition": 1},
      {"ptmType": "P1L", "ptmPosition": 5}
    ],
    "description": ...,  # Optional.
    "unpairedMsa": ...,  # Mutually exclusive with unpairedMsaPath.
    "unpairedMsaPath": ...,  # Mutually exclusive with unpairedMsa.
    "pairedMsa": ...,  # Mutually exclusive with pairedMsaPath.
    "pairedMsaPath": ...,  # Mutually exclusive with pairedMsa.
    "templates": [...]
  }
}
```

The fields specify the following:

*   `id: str | list[str]`: An uppercase letter or multiple letters specifying
    the unique IDs for each copy of this protein chain. The IDs are then also
    used in the output mmCIF file. Specifying a list of IDs (e.g. `["A", "B",
    "C"]`) implies a homomeric chain with multiple copies.
*   `sequence: str`: The amino-acid sequence, specified as a string that uses
    the 1-letter standard amino acid codes.
*   `modifications: list[ProteinModification]`: An optional list of
    post-translational modifications. Each modification is specified using its
    CCD code and 1-based residue position. In the example above, we see that the
    first residue won't be a proline (`P`) but instead `HY3`.
*   `description: str`: An optional textual description of this chain. This
    field will is only used in the JSON format and serves as a comment
    describing this chain.
*   `unpairedMsa: str`: An optional multiple sequence alignment for this chain.
    This is specified using the A3M format (equivalent to the FASTA format, but
    also allows gaps denoted by the hyphen `-` character). See more details
    below.
*   `unpairedMsaPath: str`: An optional path to a file that contains the
    multiple sequence alignment for this chain instead of providing it inline
    using the `unpairedMsa` field. The path can be either absolute, or relative
    to the input JSON path. The file must be in the A3M format, and could be
    either plain text, or compressed using gzip, xz, or zstd.
*   `pairedMsa: str`: We recommend *not* using this optional field and using the
    `unpairedMsa` for the purposes of pairing. See more details below.
*   `pairedMsaPath: str`: An optional path to a file that contains the multiple
    sequence alignment for this chain instead of providing it inline using the
    `pairedMsa` field. The path can be either absolute, or relative to the input
    JSON path. The file must be in the A3M format, and could be either plain
    text, or compressed using gzip, xz, or zstd.
*   `templates: list[Template]`: An optional list of structural templates. See
    more details below.

### RNA

Specifies a single RNA chain.

```json
{
  "rna": {
    "id": "A",
    "sequence": "AGCU",
    "modifications": [
      {"modificationType": "2MG", "basePosition": 1},
      {"modificationType": "5MC", "basePosition": 4}
    ],
    "description": ...,  # Optional.
    "unpairedMsa": ...,  # Mutually exclusive with unpairedMsaPath.
    "unpairedMsaPath": ...  # Mutually exclusive with unpairedMsa.
  }
}
```

The fields specify the following:

*   `id: str | list[str]`: An uppercase letter or multiple letters specifying
    the unique IDs for each copy of this RNA chain. The IDs are then also used
    in the output mmCIF file. Specifying a list of IDs (e.g. `["A", "B", "C"]`)
    implies a homomeric chain with multiple copies.
*   `sequence: str`: The RNA sequence, specified as a string using only the
    letters `A`, `C`, `G`, `U`.
*   `modifications: list[RnaModification]`: An optional list of modifications.
    Each modification is specified using its CCD code and 1-based base position.
*   `description: str`: An optional textual description of this chain. This
    field will is only used in the JSON format and serves as a comment
    describing this chain.
*   `unpairedMsa: str`: An optional multiple sequence alignment for this chain.
    This is specified using the A3M format. See more details below.
*   `unpairedMsaPath: str`: An optional path to a file that contains the
    multiple sequence alignment for this chain instead of providing it inline
    using the `unpairedMsa` field. The path can be either absolute, or relative
    to the input JSON path. The file must be in the A3M format, and could be
    either plain text, or compressed using gzip, xz, or zstd.

### DNA

Specifies a single DNA chain.

```json
{
  "dna": {
    "id": "A",
    "sequence": "GACCTCT",
    "modifications": [
      {"modificationType": "6OG", "basePosition": 1},
      {"modificationType": "6MA", "basePosition": 2}
    ],
    "description": ...  # Optional.
  }
}
```

The fields specify the following:

*   `id: str | list[str]`: An uppercase letter or multiple letters specifying
    the unique IDs for each copy of this DNA chain. The IDs are then also used
    in the output mmCIF file. Specifying a list of IDs (e.g. `["A", "B", "C"]`)
    implies a homomeric chain with multiple copies.
*   `sequence: str`: The DNA sequence, specified as a string using only the
    letters `A`, `C`, `G`, `T`.
*   `modifications: list[DnaModification]`: An optional list of modifications.
    Each modification is specified using its CCD code and 1-based base position.
*   `description: str`: An optional textual description of this chain. This
    field will is only used in the JSON format and serves as a comment
    describing this chain.

### Ligands

Specifies a single ligand. Ligands can be specified using 3 different formats:

1.  [CCD code(s)](https://www.wwpdb.org/data/ccd). This is the easiest way to
    specify ligands. Supports specifying covalent bonds to other entities. CCD
    from 2022-09-28 is used. If multiple CCD codes are specified, you may want
    to specify a bond between these and/or a bond to some other entity. See the
    [bonds](#bonds) section below.
2.  [SMILES string](https://en.wikipedia.org/wiki/Simplified_Molecular_Input_Line_Entry_System).
    This enables specifying ligands that are not in CCD. If using SMILES, you
    cannot specify covalent bonds to other entities as these rely on specific
    atom names - see the next option for what to use for this case.
3.  User-provided CCD + custom ligand codes. This enables specifying ligands not
    in CCD, while also supporting specification of covalent bonds to other
    entities and backup reference coordinates for when RDKit fails to generate a
    conformer. This offers the most flexibility, but also requires careful
    attention to get all of the details right.

```json
{
  "ligand": {
    "id": ["G", "H", "I"],
    "ccdCodes": ["ATP"],
    "description": ...  # Optional.
  }
},
{
  "ligand": {
    "id": "J",
    "ccdCodes": ["LIG-1337"],
    "description": ...  # Optional.
  }
},
{
  "ligand": {
    "id": "K",
    "smiles": "CC(=O)OC1C[NH+]2CCC1CC2",
    "description": ...  # Optional.
  }
}
```

The fields specify the following:

*   `id: str | list[str]`: An uppercase letter (or multiple letters) specifying
    the unique ID of this ligand. This ID is then also used in the output mmCIF
    file. Specifying a list of IDs (e.g. `["A", "B", "C"]`) implies a ligand
    that has multiple copies.
*   `ccdCodes: list[str]`: An optional list of CCD codes. These could be either
    standard CCD codes, or custom codes pointing to the
    [user-provided CCD](#user-provided-ccd).
*   `smiles: str`: An optional string defining the ligand using a SMILES string.
    The SMILES string must be correctly JSON-escaped.
*   `description: str`: An optional textual description of this chain. This
    field will is only used in the JSON format and serves as a comment
    describing this ligand.

Each ligand may be specified using CCD codes or SMILES but not both, i.e. for a
given ligand, the `ccdCodes` and `smiles` fields are mutually exclusive.

#### SMILES string JSON escaping

The SMILES string must be correctly JSON-escaped, in particular the backslash
character must be escaped as two backslashes, otherwise the JSON parser will
fail with a `JSONDecodeError`. For instance, the following SMILES string
`CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO` has to be specified as:

```json
{
  "ligand": {
    "id": "A",
    "smiles": "CCC[C@@H](O)CC\\C=C\\C=C\\C#CC#C\\C=C\\CO"
  }
}
```

You can JSON-escape the SMILES string using the
[`jq`](https://github.com/jqlang/jq) command-line tool which should be easily
installable on most Linux systems:

```bash
jq -R . <<< 'CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO'  # Replace with your SMILES.
```

Alternatively, you can use this Python code:

```python
import json

smiles = r'CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO'  # Replace with your SMILES.
print(json.dumps(smiles))
```

#### Reference structure construction with SMILES

For some ligands and some random seeds, RDKit might fail to generate a
conformer, indicated by the `Failed to construct RDKit reference structure`
error message. In this case, you can either provide a reference structure for
the ligand using the [user-provided CCD Format](#user-provided-ccd-format), or
try increasing the number of RDKit conformer iterations using the
`--conformer_max_iterations=...` flag.

### Ions

Ions are treated as ligands, e.g. a magnesium ion would simply be a ligand with
`ccdCodes: ["MG"]`.

## Multiple Sequence Alignment

Protein and RNA chains allow setting a custom Multiple Sequence Alignment (MSA).
If not set, the data pipeline will automatically build MSAs for protein and RNA
entities using Jackhmmer/Nhmmer search over genetic databases as described in
the paper.

### RNA Multiple Sequence Alignment

RNA `unpairedMsa` can be either:

1.  Unset (or set explicitly to `null`). AlphaFold 3 will build MSA for this RNA
    chain automatically. This is the recommended option.
2.  Set to an empty string (`""`). AlphaFold 3 won't build the MSA for this RNA
    chain and the MSA input to the model will be just the RNA chain (equivalent
    to running MSA-free for this RNA chain).
3.  Set to a non-empty A3M string. AlphaFold 3 will use the provided MSA for
    this RNA chain.

### Protein Multiple Sequence Alignment

For protein chains, the situation is slightly more complicated due to paired and
unpaired MSA (see [MSA Pairing](#msa-pairing) below for more details).

The following combinations are valid for a given protein chain:

1.  Both `unpairedMsa` and `pairedMsa` fields are unset (or set explicitly to
    `null`), AlphaFold 3 will build both MSAs automatically. This is the
    recommended option.
2.  The `unpairedMsa` is set to to a non-empty A3M string, `pairedMsa` set to an
    empty string (`""`). AlphaFold 3 won't build MSA, will use the `unpairedMsa`
    as is and run `pairedMSA`-free.
3.  The `pairedMsa` is set to to a non-empty A3M string, `unpairedMsa` set to an
    empty string (`""`). AlphaFold 3 won't build MSA, will use the `pairedMsa`
    and run `unpairedMSA`-free. **This option is not recommended**, see
    [MSA Pairing](#msa-pairing) below.
4.  Both `unpairedMsa` and `pairedMsa` fields are set to an empty string (`""`).
    AlphaFold 3 will not build the MSA and the MSA input to the model will be
    just the query sequence (equivalent to running completely MSA-free).
5.  Both `unpairedMsa` and `pairedMsa` fields are set to a custom non-empty A3M
    string, AlphaFold 3 will use the provided MSA instead of building one as
    part of the data pipeline. This is considered an expert option.

Note that both `unpairedMsa` and `pairedMsa` have to either be *both* set (i.e.
non-`null`), or both unset (i.e. both `null`, explicitly or implicitly).
Typically, when setting `unpairedMsa`, you will set the `pairedMsa` to an empty
string (`""`). For example this will run the protein chain A with the given MSA,
but without any templates (template-free):

```json
{
  "protein": {
    "id": "A",
    "sequence": ...,
    "unpairedMsa": "The A3M you want to run with",
    "pairedMsa": "",
    "templates": []
  }
}
```

When setting your own MSA, you have to make sure that:

1.  The MSA is in the A3M format. This means adhering to the FASTA format while
    also allowing lowercase characters denoting inserted residues and hyphens
    (`-`) denoting gaps in sequences.
2.  The first sequence is exactly equal to the query sequence.
3.  If all insertions are removed from MSA hits (i.e. all lowercase letters are
    removed), all sequences have exactly the same length as the query (they form
    an exact rectangular matrix).

### MSA Pairing

MSA pairing matters only when folding multiple chains (multimers), since we need
to find a way to concatenate MSAs for the individual chains along the sequence
dimension. If done naively, by simply concatenating the individual MSA matrices
along the sequence dimension and padding so that all MSAs have the same depth,
one can end up with rows in the concatenated MSA that are formed by sequences
from different organisms.

It may be desirable to ensure that across multiple chains, sequences in the MSA
that are from the same organism end up in the same MSA row. AlphaFold 3
internally achieves this by looking for the UniProt organism ID in the
`pairedMsa` and pairing sequences based on this information.

We recommend users do the pairing manually or use the output of an appropriate
software and then provide the MSA using only the `unpairedMsa` field. This
method gives exact control over the placement of each sequence in the MSA, as
opposed to relying on name-matching post-processing heuristics used for
`pairedMsa`.

When setting `unpairedMsa` manually, the `pairedMsa` must be explicitly set to
an empty string (`""`).

Make sure to run with `--resolve_msa_overlaps=false`. This prevents
deduplication of the unpaired MSA within each chain against the paired MSA
sequences. Even if you set `pairedMsa` to an empty string, the query sequence(s)
will still be added in there and the deduplication procedure could destroy the
carefully crafted sequence positioning in the unpaired MSA.

For instance, if there are two chains `DEEP` and `MIND` which we want to be
paired on organism A and C, we can achieve it as follows:

```txt
> query
DEEP
> match 1 (organism A)
D--P
> match 2 (organism B)
DD-P
> match 3 (organism C)
DD-P
```

```txt
> query
MIND
> match 1 (organism A)
M--D
> Empty hit to make sure pairing is achieved
----
> match 2 (organism C)
MIN-
```

The resulting MSA when chains are concatenated will then be:

```txt
> query
DEEPMIND
> match 1 + match 1
D--PM--D
> match 2 + padding
DD-P----
> match 3 + match 2
DD-PMIN-
```

## Structural Templates

Structural templates can be specified only for protein chains:

```json
"templates": [
  {
    "mmcif": ...,  # Mutually exclusive with mmcifPath.
    "mmcifPath": ...,  # Mutually exclusive with mmcif.
    "queryIndices": [0, 1, 2, 4, 5, 6],
    "templateIndices": [0, 1, 2, 3, 4, 8]
  }
]
```

The fields specify the following:

*   `mmcif: str`: A string containing the single chain protein structural
    template in the mmCIF format.
*   `mmcifPath: str`: An optional path to a file that contains the mmCIF with
    the structural template instead of providing it inline using the `mmcifPath`
    field. The path can be either absolute, or relative to the input JSON path.
    The file must be in the mmCIF format, and could be either plain text, or
    compressed using gzip, xz, or zstd.
*   `queryIndices: list[int]`: O-based indices in the query sequence, defining
    the mapping from query residues to template residues.
*   `templateIndices: list[int]`: O-based indices in the template sequence,
    specifying the mapping from query residues to template residues defined in
    the mmCIF file. Note that unresolved mmCIF residues must be taken into
    account when specifying template indices.

A template is specified as an mmCIF string containing a single chain with the
structural template together with a 0-based mapping that maps query residue
indices to the template residue indices. The mapping is specified using two
lists of the same length. E.g. to express a mapping `{0: 0, 1: 2, 2: 5, 3: 6}`,
you would specify the two indices lists as:

```json
"queryIndices":    [0, 1, 2, 3],
"templateIndices": [0, 2, 5, 6]
```

Note that mmCIFs can have residues with missing atom coordinates (present in
residue tables but missing in the `_atom_site` table) – these must be taken into
account when specifying template indices. E.g. to align residues 4–7 in a
template with unresolved residues 1, 2, 3 and resolved residues 4, 5, 6, 7, you
need to set the template indices to 3, 4, 5, 6 (since 0-based indexing is used).
An example of a protein with unresolved residues 1–20 can be found here:
https://www.rcsb.org/structure/8UXY.

You can provide multiple structural templates. Note that if an mmCIF containing
more than one chain is provided, you will get an error since it is not possible
to determine which of the chains should be used as the template.

You can run template-free (but still run genetic search and build MSA) by
setting templates to `[]` and either explicitly setting both `unpairedMsa` and
`pairedMsa` to `null`:

```json
"protein": {
  "id": "A",
  "sequence": ...,
  "pairedMsa": null,
  "unpairedMsa": null,
  "templates": []
}
```

Or you can simply fully omit them:

```json
"protein": {
  "id": "A",
  "sequence": ...,
  "templates": []
}
```

You can also run with pre-computed MSA, but let AlphaFold 3 search for
templates. This can be achieved by setting `unpairedMsa` and `pairedMsa`, but
keeping templates unset (or set to `null`). The profile given as an input to
Hmmsearch when searching for templates will be built from the provided
`unpairedMsa`:

```json
"protein": {
  "id": "A",
  "sequence": ...,
  "unpairedMsa": ...,
  "pairedMsa": ...,
  "templates": null
}
```

Or you can simply fully omit the `templates` field thus setting it implicitly to
`null`:

```json
"protein": {
  "id": "A",
  "sequence": ...,
  "unpairedMsa": ...,
  "pairedMsa": ...,
}
```

## Bonds

To manually specify covalent bonds, use the `bondedAtomPairs` field. This is
intended for modelling covalent ligands, and for defining multi-CCD ligands
(e.g. glycans). Defining covalent bonds between or within polymer entities is
not currently supported.

Bonds are specified as pairs of (source atom, destination atom), with each atom
being uniquely addressed using 3 fields:

*   **Entity ID** (`str`): this corresponds to the `id` field for that entity.
*   **Residue ID** (`int`): this is 1-based residue index *within* the chain.
    For single-residue ligands, this is simply set to 1.
*   **Atom name** (`str`): this is the unique atom name *within* the given
    residue. The atom name for protein/RNA/DNA residues or CCD ligands can be
    looked up in the CCD for the given chemical component. This also explains
    why SMILES ligands don't support bonds: there is no atom name that could be
    used to define the bond. This shortcoming can be addressed by using the
    user-provided CCD format (see below).

The example below shows two bonds:

```json
"bondedAtomPairs": [
  [["A", 145, "SG"], ["L", 1, "C04"]],
  [["J", 1, "O6"], ["J", 2, "C1"]]
]
```

The first bond is between chain A, residue 145, atom SG and chain L, residue 1,
atom C04. This is a typical example for a covalent ligand. The second bond is
between chain J, residue 1, atom O6 and chain J, residue 2, atom C1. This bond
is within the same entity and is a typical example when defining a glycan.

All bonds are implicitly assumed to be covalent bonds. Other bond types are not
supported.

### Defining Glycans

Glycans are bound to a protein residue, and they are typically formed of
multiple chemical components. To define a glycan, define a new ligand with all
of the chemical components of the glycan. Then define a bond that links the
glycan to the protein residue, and all bonds that are within the glycan between
its individual chemical components.

For example, to define the following glycan composed of 4 components (CMP1,
CMP2, CMP3, CMP4) bound to an asparagine in a protein chain A:

```
 ⋮
ALA            CMP4
 |              |
ASN ―― CMP1 ―― CMP2
 |              |
ALA            CMP3
 ⋮
```

You will need to specify:

1.  Protein chain A.
2.  Ligand chain B with the 4 components.
3.  Bonds ASN-CMP1, CMP1-CMP2, CMP2-CMP3, CMP2-CMP4.

## User-provided CCD

There are two approaches to model a custom ligand not defined in the CCD:

1.  If the ligand is not bonded to other entities, it can be defined using a
    [SMILES string](https://en.wikipedia.org/wiki/Simplified_Molecular_Input_Line_Entry_System).
2.  If it is bonded to other entities, or to be able to customise relevant
    features (such as bond orders, atom names and ideal coordinates used when
    conformer generation fails), it is necessary to define that particular
    ligand using the
    [CCD mmCIF format](https://www.wwpdb.org/data/ccd#mmcifFormat).

Note that if a full CCD mmCIF is provided, any SMILES string input as part of
that mmCIF is ignored.

Once defined, this ligand needs to be assigned a name that doesn't clash with
existing CCD ligand names (e.g. `LIG-1`). Avoid underscores (`_`) in the name,
as it could cause issues in the mmCIF format.

The newly defined ligand can then be used as a standard CCD ligand using its
custom name, and bonds can be linked to it using its named atom scheme.

### Conformer Generation

The data pipeline attempts to generate a conformer for ligands using RDKit. The
`Mol` used to generate the conformer is constructed either from the information
provided in the CCD mmCIF, or from the SMILES string if that is the only
information provided.

If conformer generation fails, the model will fall back to using the ideal
coordinates in the CCD mmCIF if these are provided. If they are not provided,
the model will use the reference coordinates if the last modification date given
in the CCD mmCIF is prior to the training cutoff date. If no coordinates can be
found in this way, all conformer coordinates are set to zero and the model will
output `NaN` (`null` in the output JSON) confidences for the ligand.

Note that sometimes conformer generation failures can be resolved by
increasinging the number of RDKit conformer iterations using the
`--conformer_max_iterations=...` flag.

### User-provided CCD Format

The user-provided CCD must be passed either:

*   In the `userCCD` field (in the root of the input JSON) as a string. Note
    that JSON doesn't allow newlines within strings, so newline characters
    (`\n`) must be used to delimit lines. Single rather than double quotes
    should also be used around strings like the chemical formula.
*   In the `userCCDPath` field, as a path to a file that contains the
    user-provided chemical components dictionary. The path can be either
    absolute, or relative to the input JSON path. The file must be in the
    [CCD mmCIF format](https://www.wwpdb.org/data/ccd#mmcifFormat), and could be
    either plain text, or compressed using gzip, xz, or zstd.

The main pieces of information used are the atom names and elements, bonds, and
also the ideal coordinates (`pdbx_model_Cartn_{x,y,z}_ideal`) which essentially
serve as a structural template for the ligand if RDKit fails to generate
conformers for that ligand.

The user-provided CCD can also be used to redefine standard chemical components
in the CCD. This can be useful if you need to redefine the ideal coordinates.

Below is an example user-provided CCD redefining component X7F, which serves to
illustrate the required sections. For readability purposes, newlines have not
been replaced by `\n`.

```
data_MY-X7F
#
_chem_comp.id MY-X7F
_chem_comp.name '5,8-bis(oxidanyl)naphthalene-1,4-dione'
_chem_comp.type non-polymer
_chem_comp.formula 'C10 H6 O4'
_chem_comp.mon_nstd_parent_comp_id ?
_chem_comp.pdbx_synonyms ?
_chem_comp.formula_weight 190.152
#
loop_
_chem_comp_atom.comp_id
_chem_comp_atom.atom_id
_chem_comp_atom.type_symbol
_chem_comp_atom.charge
_chem_comp_atom.pdbx_leaving_atom_flag
_chem_comp_atom.pdbx_model_Cartn_x_ideal
_chem_comp_atom.pdbx_model_Cartn_y_ideal
_chem_comp_atom.pdbx_model_Cartn_z_ideal
MY-X7F C02 C 0 N -1.418 -1.260 0.018
MY-X7F C03 C 0 N -0.665 -2.503 -0.247
MY-X7F C04 C 0 N 0.677 -2.501 -0.235
MY-X7F C05 C 0 N 1.421 -1.257 0.043
MY-X7F C06 C 0 N 0.706 0.032 0.008
MY-X7F C07 C 0 N -0.706 0.030 -0.004
MY-X7F C08 C 0 N -1.397 1.240 -0.037
MY-X7F C10 C 0 N -0.685 2.443 -0.057
MY-X7F C11 C 0 N 0.679 2.445 -0.045
MY-X7F C12 C 0 N 1.394 1.243 -0.013
MY-X7F O01 O 0 N -2.611 -1.301 0.247
MY-X7F O09 O 0 N -2.752 1.249 -0.049
MY-X7F O13 O 0 N 2.750 1.257 -0.001
MY-X7F O14 O 0 N 2.609 -1.294 0.298
MY-X7F H1 H 0 N -1.199 -3.419 -0.452
MY-X7F H2 H 0 N 1.216 -3.416 -0.429
MY-X7F H3 H 0 N -1.221 3.381 -0.082
MY-X7F H4 H 0 N 1.212 3.384 -0.062
MY-X7F H5 H 0 N -3.154 1.271 0.830
MY-X7F H6 H 0 N 3.151 1.241 -0.880
#
loop_
_chem_comp_bond.atom_id_1
_chem_comp_bond.atom_id_2
_chem_comp_bond.value_order
_chem_comp_bond.pdbx_aromatic_flag
O01 C02 DOUB N
O09 C08 SING N
C02 C03 SING N
C02 C07 SING N
C03 C04 DOUB N
C08 C07 DOUB Y
C08 C10 SING Y
C07 C06 SING Y
C10 C11 DOUB Y
C04 C05 SING N
C06 C05 SING N
C06 C12 DOUB Y
C11 C12 SING Y
C05 O14 DOUB N
C12 O13 SING N
C03 H1 SING N
C04 H2 SING N
C10 H3 SING N
C11 H4 SING N
O09 H5 SING N
O13 H6 SING N
#
```

### Mandatory fields

Parsing the user-provided CCD needs only a subset of the fields that CCD uses.
The mandatory fields are described below. Refer to
[CCD documentation](https://www.wwpdb.org/data/ccd#mmcifFormat) for more
detailed explanation of each field. Note that not all of these fields are input
to the model, but they are necessary for the data pipeline to run – see the
[Model input fields](#model-input-fields) section below.

**Singular fields (containing just a single value)**

*   `_chem_comp.id`: The ID of the component. Must match the `_data` record and
    must not contain special CIF characters (like `_` or `#`).
*   `_chem_comp.name`: Optional full name of the component. If unknown, set to
    `?`.
*   `_chem_comp.type`: Type of the component, typically `non-polymer`.
*   `_chem_comp.formula`: Optional component formula. If unknown, set to `?`.
*   `_chem_comp.mon_nstd_parent_comp_id`: Optional parent component ID. If
    unknown, set to `?`.
*   `_chem_comp.pdbx_synonyms`: Optional synonym IDs. If unknown, set to `?`.
*   `_chem_comp.formula_weight`: Optional weight of the component. If unknown,
    set to `?`.

**Per-atom fields (containing one record per atom)**

*   `_chem_comp_atom.comp_id`: Component ID.
*   `_chem_comp_atom.atom_id`: Atom ID.
*   `_chem_comp_atom.type_symbol`: Atom element type.
*   `_chem_comp_atom.charge`: Atom charge.
*   `_chem_comp_atom.pdbx_leaving_atom_flag`: Optional flag determining whether
    this is a leaving atom. If unset, assumed to be no (`N`) for all atoms.
*   `_chem_comp_atom.pdbx_model_Cartn_x_ideal`: Ideal x coordinate.
*   `_chem_comp_atom.pdbx_model_Cartn_y_ideal`: Ideal y coordinate.
*   `_chem_comp_atom.pdbx_model_Cartn_z_ideal`: Ideal z coordinate.

**Per-bond fields (containing one record per bond)**

*   `_chem_comp_bond.atom_id_1`: The ID of the first of the two atoms that
    define the bond.
*   `_chem_comp_bond.atom_id_2`: The ID of the second of the two atoms that
    define the bond.
*   `_chem_comp_bond.value_order`: The bond order of the chemical bond
    associated with the specified atoms.
*   `_chem_comp_bond.pdbx_aromatic_flag`: Whether the bond is aromatic.

### Model input fields

The following fields are used to generate input for the model:

*   `_chem_comp_atom.atom_id`: Atom ID.
*   `_chem_comp_atom.type_symbol`: Atom element type.
*   `_chem_comp_atom.charge`: Atom charge.
*   `_chem_comp_atom.pdbx_model_Cartn_x_ideal`: Ideal x coordinate. Only used if
    conformer generation fails.
*   `_chem_comp_atom.pdbx_model_Cartn_y_ideal`: Ideal y coordinate. Only used if
    conformer generation fails.
*   `_chem_comp_atom.pdbx_model_Cartn_z_ideal`: Ideal z coordinate. Only used if
    conformer generation fails.
*   `_chem_comp_bond.atom_id_1`: The ID of the first of the two atoms that
    define the bond.
*   `_chem_comp_bond.atom_id_2`: The ID of the second of the two atoms that
    define the bond.

## Full Example

An example illustrating all the aspects of the input format is provided below.
Note that AlphaFold 3 won't run this input out of the box as it abbreviates
certain fields and the sequences are not biologically meaningful.

```json
{
  "name": "Hello fold",
  "modelSeeds": [10, 42],
  "sequences": [
    {
      "protein": {
        "id": "A",
        "sequence": "PVLSCGEWQL",
        "modifications": [
          {"ptmType": "HY3", "ptmPosition": 1},
          {"ptmType": "P1L", "ptmPosition": 5}
        ],
        "description": "10-residue protein with 2 modifications",
        "unpairedMsa": ...,
        "pairedMsa": ""
      }
    },
    {
      "protein": {
        "id": "B",
        "sequence": "RPACQLW",
        "templates": [
          {
            "mmcif": ...,
            "queryIndices": [0, 1, 2, 4, 5, 6],
            "templateIndices": [0, 1, 2, 3, 4, 8]
          }
        ]
      }
    },
    {
      "dna": {
        "id": "C",
        "sequence": "GACCTCT",
        "modifications": [
          {"modificationType": "6OG", "basePosition": 1},
          {"modificationType": "6MA", "basePosition": 2}
        ]
      }
    },
    {
      "rna": {
        "id": "E",
        "sequence": "AGCU",
        "modifications": [
          {"modificationType": "2MG", "basePosition": 1},
          {"modificationType": "5MC", "basePosition": 4}
        ],
        "unpairedMsa": ...
      }
    },
    {
      "ligand": {
        "id": ["F", "G", "H"],
        "ccdCodes": ["ATP"]
      }
    },
    {
      "ligand": {
        "id": "I",
        "ccdCodes": ["NAG", "FUC"]
      }
    },
    {
      "ligand": {
        "id": "Z",
        "smiles": "CC(=O)OC1C[NH+]2CCC1CC2"
      }
    }
  ],
  "bondedAtomPairs": [
    [["A", 1, "CA"], ["G", 1, "CHA"]],
    [["I", 1, "O6"], ["I", 2, "C1"]]
  ],
  "userCCD": ...,
  "dialect": "alphafold3",
  "version": 4
}
```


================================================
FILE: docs/installation.md
================================================
# Installation and Running Your First Prediction

You will need a machine running Linux; AlphaFold 3 does not support other
operating systems. Full installation requires up to 1 TB of disk space to keep
genetic databases (SSD storage is recommended) and an NVIDIA GPU with Compute
Capability 8.0 or greater (GPUs with more memory can predict larger protein
structures). We have verified that inputs with up to 5,120 tokens can fit on a
single NVIDIA A100 80 GB, or a single NVIDIA H100 80 GB. We have verified
numerical accuracy on both NVIDIA A100 and H100 GPUs.

Especially for long targets, the genetic search stage can consume a lot of RAM –
we recommend running with at least 64 GB of RAM.

We provide installation instructions for a machine with an NVIDIA A100 80 GB GPU
and a clean Ubuntu 22.04 LTS installation, and expect that these instructions
should aid others with different setups. If you are installing locally outside
of a Docker container, please ensure CUDA, cuDNN, and JAX are correctly
installed; the
[JAX installation documentation](https://jax.readthedocs.io/en/latest/installation.html#nvidia-gpu)
is a useful reference for this case. Please note that the Docker container
requires that the host machine has CUDA 12.6 installed.

The instructions provided below describe how to:

1.  Provision a machine on GCP.
1.  Install Docker.
1.  Install NVIDIA drivers for an A100.
1.  Obtain genetic databases.
1.  Obtain model parameters.
1.  Build the AlphaFold 3 Docker container or Singularity image.

## Provisioning a Machine

Clean Ubuntu images are available on Google Cloud, AWS, Azure, and other major
platforms.

Using an existing Google Cloud project, we provisioned a new machine:

*   We recommend using `--machine-type a2-ultragpu-1g` but feel free to use
    `--machine-type a2-highgpu-1g` for smaller predictions.
*   If desired, replace `--zone us-central1-a` with a zone that has quota for
    the machine you have selected. See
    [gpu-regions-zones](https://cloud.google.com/compute/docs/gpus/gpu-regions-zones).

```sh
gcloud compute instances create alphafold3 \
    --machine-type a2-ultragpu-1g \
    --zone us-central1-a \
    --image-family ubuntu-2204-lts \
    --image-project ubuntu-os-cloud \
    --maintenance-policy TERMINATE \
    --boot-disk-size 1000 \
    --boot-disk-type pd-balanced
```

This provisions a bare Ubuntu 22.04 LTS image on an
[A2 Ultra](https://cloud.google.com/compute/docs/accelerator-optimized-machines#a2-vms)
machine with 12 CPUs, 170 GB RAM, 1 TB disk and NVIDIA A100 80 GB GPU attached.
We verified the following installation steps from this point.

## Installing Docker

These instructions are for rootless Docker.

### Installing Docker on Host

Note these instructions only apply to Ubuntu 22.04 LTS images, see above.

Add Docker's official GPG key. Official Docker instructions are
[here](https://docs.docker.com/engine/install/ubuntu/#install-using-the-repository).
The commands we ran are:

```sh
sudo apt-get update
sudo apt-get install ca-certificates curl
sudo install -m 0755 -d /etc/apt/keyrings
sudo curl -fsSL https://download.docker.com/linux/ubuntu/gpg -o /etc/apt/keyrings/docker.asc
sudo chmod a+r /etc/apt/keyrings/docker.asc
```

Add the repository to apt sources:

```sh
echo \
  "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/ubuntu \
  $(. /etc/os-release && echo "$VERSION_CODENAME") stable" | \
  sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update
sudo apt-get install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin
sudo docker run hello-world
```

### Enabling Rootless Docker

Official Docker instructions are
[here](https://docs.docker.com/engine/security/rootless/#distribution-specific-hint).
The commands we ran are:

```sh
sudo apt-get install -y uidmap systemd-container

sudo machinectl shell $(whoami)@ /bin/bash -c 'dockerd-rootless-setuptool.sh install && sudo loginctl enable-linger $(whoami) && DOCKER_HOST=unix:///run/user/1001/docker.sock docker context use rootless'
```

## Installing GPU Support

### Installing NVIDIA Drivers

Official Ubuntu instructions are
[here](https://documentation.ubuntu.com/server/how-to/graphics/install-nvidia-drivers/).
The commands we ran are:

```sh
sudo apt-get -y install alsa-utils ubuntu-drivers-common
sudo ubuntu-drivers install

sudo nvidia-smi --gpu-reset

nvidia-smi  # Check that the drivers are installed.
```

Accept the "Pending kernel upgrade" dialog if it appears.

You will need to reboot the instance with `sudo reboot now` to reset the GPU if
you see the following warning:

```text
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.
Make sure that the latest NVIDIA driver is installed and running.
```

Proceed only if `nvidia-smi` has a sensible output.

### Installing NVIDIA Support for Docker

Official NVIDIA instructions are
[here](https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html).
The commands we ran are:

```sh
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
nvidia-ctk runtime configure --runtime=docker --config=$HOME/.config/docker/daemon.json
systemctl --user restart docker
sudo nvidia-ctk config --set nvidia-container-cli.no-cgroups --in-place
```

Check that your container can see the GPU:

```sh
docker run --rm --gpus all nvidia/cuda:12.6.0-base-ubuntu22.04 nvidia-smi
```

Example output:

```text
Mon Nov  11 12:00:00 2024
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.120                Driver Version: 550.120        CUDA Version: 12.6     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA A100-SXM4-80GB          Off |   00000000:00:05.0 Off |                    0 |
| N/A   34C    P0             51W /  400W |       1MiB /  81920MiB |      0%      Default |
|                                         |                        |             Disabled |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+
```

## Obtaining AlphaFold 3 Source Code

Install `git` and download the AlphaFold 3 repository:

```sh
git clone https://github.com/google-deepmind/alphafold3.git
```

## Obtaining Genetic Databases

This step requires `wget` and `zstd` to be installed on your machine. On
Debian-based systems install them by running `sudo apt install wget zstd`.

AlphaFold 3 needs multiple genetic (sequence) protein and RNA databases to run:

*   [BFD small](https://bfd.mmseqs.com/)
*   [MGnify](https://www.ebi.ac.uk/metagenomics/)
*   [PDB](https://www.rcsb.org/) (structures in the mmCIF format)
*   [PDB seqres](https://www.rcsb.org/)
*   [UniProt](https://www.uniprot.org/uniprot/)
*   [UniRef90](https://www.uniprot.org/help/uniref)
*   [NT](https://www.ncbi.nlm.nih.gov/nucleotide/)
*   [RFam](https://rfam.org/)
*   [RNACentral](https://rnacentral.org/)

We provide a bash script `fetch_databases.sh` that can be used to download and
set up all of these databases. This process takes around 45 minutes when not
installing on local SSD. We recommend running the following in a `screen` or
`tmux` session as downloading and decompressing the databases takes some time.

```sh
cd alphafold3  # Navigate to the directory with cloned AlphaFold 3 repository.
./fetch_databases.sh [<DB_DIR>]
```

This script downloads the databases from a mirror hosted on GCS, with all
versions being the same as used in the AlphaFold 3 paper, to the directory
`<DB_DIR>`. If not specified, the default `<DB_DIR>` is
`$HOME/public_databases`.

:ledger: **Note: The download directory `<DB_DIR>` should *not* be a
subdirectory in the AlphaFold 3 repository directory.** If it is, the Docker
build will be slow as the large databases will be copied during the image
creation.

:ledger: **Note: The total download size for the full databases is around 252 GB
and the total size when unzipped is 630 GB. Please make sure you have sufficient
hard drive space, bandwidth, and time to download. We recommend using an SSD for
better genetic search performance.**

:ledger: **Note: If the download directory and datasets don't have full read and
write permissions, it can cause errors with the MSA tools, with opaque
(external) error messages. Please ensure the required permissions are applied,
e.g. with the `sudo chmod 755 --recursive <DB_DIR>` command.**

Once the script has finished, you should have the following directory structure:

```sh
mmcif_files/  # Directory containing ~200k PDB mmCIF files.
bfd-first_non_consensus_sequences.fasta
mgy_clusters_2022_05.fa
nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta
pdb_seqres_2022_09_28.fasta
rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta
rnacentral_active_seq_id_90_cov_80_linclust.fasta
uniprot_all_2021_04.fa
uniref90_2022_05.fa
```

Optionally, after the script finishes, you may want copy databases to an SSD.
You can use theses two scripts:

*   `src/scripts/gcp_mount_ssd.sh [<SSD_MOUNT_PATH>]` Mounts and formats an
    unmounted GCP SSD drive to the specified path. It will skip the either step
    if the disk is either already formatted or already mounted. The default
    `<SSD_MOUNT_PATH>` is `/mnt/disks/ssd`.
*   `src/scripts/copy_to_ssd.sh [<DB_DIR>] [<SSD_DB_DIR>]` this will copy as
    many files that it can fit on to the SSD. The default `<DB_DIR>` is
    `$HOME/public_databases`, and must match the path used in the
    `fetch_databases.sh` command above, and the default `<SSD_DB_DIR>` is
    `/mnt/disks/ssd/public_databases`.

## Obtaining Model Parameters

To request access to the AlphaFold 3 model parameters, please complete
[this form](https://forms.gle/svvpY4u2jsHEwWYS6). Access will be granted at
Google DeepMind’s sole discretion. We will aim to respond to requests within 2–3
business days. You may only use AlphaFold 3 model parameters if received
directly from Google. Use is subject to these
[terms of use](https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md).

Once access has been granted, download the model parameters to a directory of
your choosing, referred to as `<MODEL_PARAMETERS_DIR>` in the following
instructions. As with the databases, this should *not* be a subdirectory in the
AlphaFold 3 repository directory.

## Building the Docker Container That Will Run AlphaFold 3

Then, build the Docker container. This builds a container with all the right
python dependencies:

```sh
docker build -t alphafold3 -f docker/Dockerfile .
```

If you hit `No file descriptors available (os error 24)` on systems like
AlmaLinux/Rocky/RHEL, you need to manually expand the file descriptor limits
during the build by appending `--ulimit nofile=65535:65535`:

```sh
docker build --ulimit nofile=65535:65535 -t alphafold3 -f docker/Dockerfile .
```

Create an input JSON file, using either the example in the
[README](https://github.com/google-deepmind/alphafold3?tab=readme-ov-file#installation-and-running-your-first-prediction)
or a
[custom input](https://github.com/google-deepmind/alphafold3/blob/main/docs/input.md),
and place it in a directory, e.g. `$HOME/af_input`. You can now run AlphaFold 3!

```sh
docker run -it \
    --volume $HOME/af_input:/root/af_input \
    --volume $HOME/af_output:/root/af_output \
    --volume <MODEL_PARAMETERS_DIR>:/root/models \
    --volume <DB_DIR>:/root/public_databases \
    --gpus all \
    alphafold3 \
    python run_alphafold.py \
    --json_path=/root/af_input/fold_input.json \
    --model_dir=/root/models \
    --output_dir=/root/af_output
```

where `$HOME/af_input` is the directory containing the input JSON file;
`$HOME/af_output` is the directory where the output will be written to; and
`<DB_DIR>` and `<MODEL_PARAMETERS_DIR>` are the directories containing the
databases and model parameters. The values of these directories must match the
directories used in previous steps for downloading databases and model weights,
and for the input file.

:ledger: Note: You may also need to create the output directory,
`$HOME/af_output` directory before running the `docker` command and make it and
the input directory writable from the docker container, e.g. by running `chmod
755 $HOME/af_input $HOME/af_output`. In most cases `docker` and
`run_alphafold.py` will create the output directory if it does not exist.

:ledger: **Note: In the example above the databases have been placed on the
persistent disk, which is slow.** If you want better genetic and template search
performance, make sure all databases are placed on a local SSD.

If you have some databases on an SSD in the `<SSD_DB_DIR>` directory and some
databases on a slower disk in the `<DB_DIR>` directory, you can mount both
directories and specify `db_dir` multiple times. This will enable the fast
access to databases with a fallback to the larger, slower disk:

```sh
docker run -it \
    --volume $HOME/af_input:/root/af_input \
    --volume $HOME/af_output:/root/af_output \
    --volume <MODEL_PARAMETERS_DIR>:/root/models \
    --volume <SSD_DB_DIR>:/root/public_databases \
    --volume <DB_DIR>:/root/public_databases_fallback \
    --gpus all \
    alphafold3 \
    python run_alphafold.py \
    --json_path=/root/af_input/fold_input.json \
    --model_dir=/root/models \
    --db_dir=/root/public_databases \
    --db_dir=/root/public_databases_fallback \
    --output_dir=/root/af_output
```

If you get an error like the following, make sure the models and data are in the
paths (flags named `--volume` above) in the correct locations.

```
docker: Error response from daemon: error while creating mount source path '/srv/alphafold3_data/models': mkdir /srv/alphafold3_data/models: permission denied.
```

`run_alphafold.py` supports many flags for controlling performance, running on
multiple input files, specifying external binary paths, and more. See

```sh
docker run alphafold3 python run_alphafold.py --help
```

for more information.

## Running Using Singularity Instead of Docker

You may prefer to run AlphaFold 3 within Singularity. You'll still need to
*build* the Singularity image from the Docker container. Afterwards, you will
not have to depend on Docker (at structure prediction time).

### Install Singularity

Official Singularity instructions are
[here](https://docs.sylabs.io/guides/3.3/user-guide/installation.html). The
commands we ran are:

```sh
wget https://github.com/sylabs/singularity/releases/download/v4.2.1/singularity-ce_4.2.1-jammy_amd64.deb
sudo dpkg --install singularity-ce_4.2.1-jammy_amd64.deb
sudo apt-get install -f
```

### Build the Singularity Container From the Docker Image

After building the *Docker* container above with `docker build -t`, start a
local Docker registry and upload your image `alphafold3` to it. Singularity's
instructions are [here](https://github.com/apptainer/singularity/issues/1537).
The commands we ran are:

```sh
docker run -d -p 5000:5000 --restart=always --name registry registry:2
docker tag alphafold3 localhost:5000/alphafold3
docker push localhost:5000/alphafold3
```

Then build the Singularity container:

```sh
SINGULARITY_NOHTTPS=1 singularity build alphafold3.sif docker://localhost:5000/alphafold3:latest
```

You can confirm your build by starting a shell and inspecting the environment.
For example, you may want to ensure the Singularity image can access your GPU.
You may want to restart your computer if you have issues with this.

```sh
singularity exec --nv alphafold3.sif sh -c 'nvidia-smi'
```

You can now run AlphaFold 3!

```sh
singularity exec --nv alphafold3.sif <<args>>
```

For example:

```sh
singularity exec \
     --nv \
     --bind $HOME/af_input:/root/af_input \
     --bind $HOME/af_output:/root/af_output \
     --bind <MODEL_PARAMETERS_DIR>:/root/models \
     --bind <DB_DIR>:/root/public_databases \
     alphafold3.sif \
     python run_alphafold.py \
     --json_path=/root/af_input/fold_input.json \
     --model_dir=/root/models \
     --db_dir=/root/public_databases \
     --output_dir=/root/af_output
```

Or with some databases on SSD in location `<SSD_DB_DIR>`:

```sh
singularity exec \
     --nv \
     --bind $HOME/af_input:/root/af_input \
     --bind $HOME/af_output:/root/af_output \
     --bind <MODEL_PARAMETERS_DIR>:/root/models \
     --bind <SSD_DB_DIR>:/root/public_databases \
     --bind <DB_DIR>:/root/public_databases_fallback \
     alphafold3.sif \
     python run_alphafold.py \
     --json_path=/root/af_input/fold_input.json \
     --model_dir=/root/models \
     --db_dir=/root/public_databases \
     --db_dir=/root/public_databases_fallback \
     --output_dir=/root/af_output
```


================================================
FILE: docs/known_issues.md
================================================
# Known Issues

## Numerical performance for CUDA Capability 7.x GPUs

All CUDA Capability 7.x GPUs (e.g. V100) produce obviously bad output, with lots
of clashing residues (the clashes cause a ranking score of -99 or lower), unless
the environment variable `XLA_FLAGS` is set to include
`--xla_disable_hlo_passes=custom-kernel-fusion-rewriter`.

## Incorrect handling of two-letter atoms in SMILES ligands

Between commits https://github.com/google-deepmind/alphafold3/commit/f8df1c7 and
https://github.com/google-deepmind/alphafold3/commit/4e4023c, AlphaFold 3
handled incorrectly any two-letter atoms (e.g. Cl, Br) in ligands defined using
SMILES strings.

## MSA discrepancy between AlphaFold 3 and AlphaFold Server

### The root cause of the problem

The released AlphaFold 3 and AlphaFold Server use the same model weights and
equivalent featurisation and model code. However, the way they run genetic
search is slightly different. The released AlphaFold 3 searches each database in
one go, while AlphaFold Server has a sharded version of each database (split
into multiple smaller FASTA files) and searches all of the shards in parallel.
The results of these parallel searches are then merged together at the end.

The discrepancy is caused by a different (deeper) MSA on AlphaFold Server in
some cases. We discovered that the issue is caused by running sharded Jackhmmer
in AlphaFold Server without the `--domZ` flag (has to be set together with the
`--Z` flag and set to the same value) which means that effectively the AlphaFold
Server is running with roughly 100× more permissive `--domE` filter. This means
more sequences are sometimes included in the MSA.

We are keeping behaviour unchanged in both the released AlphaFold 3 and in the
AlphaFold Server, however, we are giving users with local installs an option to
replicate AlphaFold Server behaviour locally. In our large scale tests the
difference did not matter, it is only very specific inputs that get better
accuracy with the deeper MSA.

See https://github.com/google-deepmind/alphafold3/issues/492 for an example
input where a protein-DNA complex gets significantly higher ipTM and pTM with
AlphaFold Server compared to a local run.

### Replicating AlphaFold Server behaviour locally

If you want to replicate AlphaFold Server behaviour (i.e. better folding
accuracy in some cases), you can increase the value of the Jackhmmer/Nhmmer
`--domE` flag by 100× compared to its default value.

Alternatively, you can run the sharded MSA search while not setting the `--domZ`
value – you would have to modify the code to do it. We added support for
searching against sharded databases in AlphaFold 3 in
https://github.com/google-deepmind/alphafold3/commit/805adc3863841d83d631ccd18136ad58ce3ecb34
and the way to run AlphaFold 3 with sharded databases is documented in
https://github.com/google-deepmind/alphafold3/blob/main/docs/performance.md#sharded-genetic-databases.
It can provide 10–30× speedup (potentially even more, depending on hardware) of
the genetic search.

In general, we recommend experimenting with MSA if you are seeing a prediction
with low predicted confidence. Typically adding more *relevant* sequences in the
MSA will increase AlphaFold prediction accuracy and model confidence scores.


================================================
FILE: docs/metadata_antibody_antigen.csv
================================================
pdb_id,chain_id_1,chain_id_2,cluster_key_chain_1,cluster_key_chain_2,interface_cluster_key
7fci,A,B,5581,5964,5581|5964
7fci,A,C,5581,17640,17640|5581
7mnl,A,C,8677,17640,17640|8677
7n0a,A,B,33602,5964,33602|5964
7n0a,A,C,33602,17640,17640|33602
7ox1,A,G,17640,41184,17640|41184
7ox1,B,G,5964,41184,41184|5964
7ox2,A,C,17640,41184,17640|41184
7ox2,B,C,5964,41184,41184|5964
7ox3,A,C,5964,41184,41184|5964
7ox3,B,C,17640,41184,17640|41184
7ox4,A,C,17640,41184,17640|41184
7ox4,B,C,5964,41184,41184|5964
7q6c,A,B,15496,17640,15496|17640
7q6c,A,D,15496,5964,15496|5964
7r58,A,B,30790,17640,17640|30790
7r58,A,C,30790,5964,30790|5964
7ru6,A,B,7068,17640,17640|7068
7sbd,A,C,17640,20692,17640|20692
7sbd,B,C,5964,20692,20692|5964
7sbg,A,C,17640,20692,17640|20692
7sbg,B,C,5964,20692,20692|5964
7sjo,A,F,7390,17640,17640|7390
7sjo,A,I,7390,5964,5964|7390
7sjo,B,G,7390,17640,17640|7390
7sjo,B,H,7390,5964,5964|7390
7sjo,C,D,7390,17640,17640|7390
7sjo,C,E,7390,5964,5964|7390
7sk3,A,C,45640,5964,45640|5964
7sk3,A,D,45640,17640,17640|45640
7sk3,A,E,45640,5964,45640|5964
7sk3,A,F,45640,17640,17640|45640
7sk4,A,C,45640,5964,45640|5964
7sk4,A,D,45640,17640,17640|45640
7sk4,A,E,45640,5964,45640|5964
7sk4,A,F,45640,17640,17640|45640
7sk5,A,B,45640,17640,17640|45640
7sk5,A,D,45640,5964,45640|5964
7sk6,A,C,45640,5964,45640|5964
7sk6,A,D,45640,17640,17640|45640
7sk7,A,C,45640,5964,45640|5964
7sk7,A,D,45640,17640,17640|45640
7sk8,A,C,45640,5964,45640|5964
7sk8,A,D,45640,17640,17640|45640
7sk8,A,E,45640,5964,45640|5964
7sk8,A,F,45640,17640,17640|45640
7sk9,A,B,45640,17640,17640|45640
7sk9,A,C,45640,5964,45640|5964
7st8,A,C,17640,41188,17640|41188
7st8,B,C,5964,41188,41188|5964
7t6x,E,H,5964,24273,24273|5964
7t82,A,C,9703,5964,5964|9703
7t82,A,D,9703,17640,17640|9703
7t9m,A,C,17640,13210,13210|17640
7t9m,B,C,5964,13210,13210|5964
7t9n,A,D,5964,13210,13210|5964
7t9n,B,D,17640,13210,13210|17640
7tuf,A,B,22549,17640,17640|22549
7tuf,A,C,22549,5964,22549|5964
7tuf,A,E,22549,17640,17640|22549
7tuf,B,D,17640,22549,17640|22549
7tuf,D,E,22549,17640,17640|22549
7tuf,D,F,22549,5964,22549|5964
7tug,A,B,22549,17640,17640|22549
7tug,A,C,22549,5964,22549|5964
7u8c,A,B,20081,17640,17640|20081
7u8c,A,C,20081,5964,20081|5964
7u8g,A,C,29632,17640,17640|29632
7u8g,A,D,29632,5964,29632|5964
7uih,A,B,11223,5964,11223|5964
7uih,A,C,11223,17640,11223|17640
7uih,A,D,11223,5964,11223|5964
7uih,A,E,11223,17640,11223|17640
7um3,A,E,17640,33649,17640|33649
7um3,B,E,5964,33649,33649|5964
7ura,A,B,44530,5964,44530|5964
7ura,A,C,44530,17640,17640|44530
7urc,A,B,44530,5964,44530|5964
7urc,A,C,44530,17640,17640|44530
7urd,A,C,44530,5964,44530|5964
7urd,A,D,44530,17640,17640|44530
7ure,A,B,44530,5964,44530|5964
7ure,A,C,44530,17640,17640|44530
7uvf,A,C,23558,17640,17640|23558
7uvf,A,D,23558,5964,23558|5964
7uvf,B,E,23558,5964,23558|5964
7uvf,B,F,23558,17640,17640|23558
7vad,A,B,5581,17640,17640|5581
7vad,A,C,5581,5964,5581|5964
7vae,A,B,5581,17640,17640|5581
7vae,A,C,5581,5964,5581|5964
7vaf,A,C,17640,5581,17640|5581
7vaf,B,C,5964,5581,5581|5964
7vag,A,B,5581,17640,17640|5581
7vag,A,C,5581,5964,5581|5964
7vgr,A,E,5964,33673,33673|5964
7vgr,A,F,5964,33673,33673|5964
7vgr,B,E,17640,33673,17640|33673
7vgr,B,F,17640,33673,17640|33673
7vgr,C,E,5964,33673,33673|5964
7vgr,C,F,5964,33673,33673|5964
7vgr,D,E,17640,33673,17640|33673
7vgr,D,F,17640,33673,17640|33673
7vgs,A,B,33673,5964,33673|5964
7vgs,A,C,33673,17640,17640|33673
7vgs,A,E,33673,5964,33673|5964
7vgs,B,D,5964,33673,33673|5964
7vgs,D,E,33673,5964,33673|5964
7vgs,D,F,33673,17640,17640|33673
7vn9,A,C,17640,20046,17640|20046
7vn9,B,C,5964,20046,20046|5964
7vng,A,B,20046,17640,17640|20046
7vng,A,C,20046,5964,20046|5964
7w71,A,E,24335,17640,17640|24335
7w71,A,F,24335,5964,24335|5964
7wsi,A,B,5581,17640,17640|5581
7wsi,A,C,5581,5964,5581|5964
7xq8,A,B,26372,5964,26372|5964
7xq8,C,D,26372,5964,26372|5964
7zlg,A,D,17640,29547,17640|29547
7zlg,C,D,5964,29547,29547|5964
7zlh,A,D,17640,29547,17640|29547
7zlh,C,D,5964,29547,29547|5964
7zli,A,D,17640,29547,17640|29547
7zli,C,D,5964,29547,29547|5964
7zlj,A,D,17640,29547,17640|29547
7zlj,C,D,5964,29547,29547|5964
7zwi,A,C,7003,5964,5964|7003
7zxf,A,C,7003,5964,5964|7003
7zxf,A,E,7003,5964,5964|7003
7zxg,A,C,7003,5964,5964|7003
7zxk,A,F,26707,5964,26707|5964
7zxk,A,G,26707,17640,17640|26707
7zyi,A,B,5581,17640,17640|5581
7zyi,A,C,5581,5964,5581|5964
8cz5,A,B,24059,17640,17640|24059
8cz5,A,C,24059,5964,24059|5964
8dcy,A,C,17640,23342,17640|23342
8dcy,B,C,5964,23342,23342|5964
8ddk,A,C,17640,23342,17640|23342
8ddk,B,C,5964,23342,23342|5964
8djk,A,E,15456,17640,15456|17640
8djk,B,D,15455,5964,15455|5964
8djk,B,E,15455,17640,15455|17640
8djm,A,E,15456,17640,15456|17640
8djm,B,D,15455,5964,15455|5964
8djm,B,E,15455,17640,15455|17640
8dke,A,B,13979,17640,13979|17640
8dke,A,C,13979,5964,13979|5964
8dki,A,B,13979,17640,13979|17640
8dki,A,C,13979,5964,13979|5964
8dkm,A,C,17640,13979,13979|17640
8dkm,B,C,5964,13979,13979|5964
8dkw,A,C,17640,13979,13979|17640
8dkw,B,C,5964,13979,13979|5964
8dkx,A,C,17640,13979,13979|17640
8dkx,B,C,5964,13979,13979|5964
8hii,A,B,21158,17640,17640|21158
8hii,A,D,21158,5964,21158|5964
8hij,A,B,21158,17640,17640|21158
8hij,A,D,21158,5964,21158|5964
8hik,A,B,21158,17640,17640|21158
8hik,A,D,21158,5964,21158|5964
7so7,A,F,3006,5964,3006|5964
7xy8,A,C,2517,17640,17640|2517
7xy8,A,E,2517,5964,2517|5964

================================================
FILE: docs/metadata_antibody_antigen.md
================================================
# Metadata for Antibody-Antigen pairs used to create figure 5a

Figure 5a in the AlphaFold 3 paper was created using 71 antibody–antigen
complexes, containing 166 antibody–antigen interfaces spanning 65 interface
clusters. Scores were averaged within each interface cluster then across
clusters. Note that the first bioassembly is used in all cases.

We provide metadata for these complexes and the associated clusters in this CSV
file:

https://github.com/google-deepmind/alphafold3/blob/main/docs/metadata_antibody_antigen.csv


================================================
FILE: docs/model_parameters.md
================================================
# Model Parameters

AlphaFold 3 layer names, shapes, and dtypes are documented in the table below.
This can be used for example to generate random parameters for AlphaFold 3
performance optimisation on new accelerators without having to obtain the
official parameters. It is important to not generate zero-only parameters for
performance optimisations as accelerators often have shortcuts for zero-only
arguments (e.g. `0 * tensor` can be optimised to a no-op).

Producing random parameters could be done similarly to the following snippet:

```py
from alphafold3.model import params
import numpy as np
import zstandard

parameters = ...  # Data from the parameters schema.

with zstandard.open('random_weights.bin.zst', 'wb') as compressed:
  for scope_name, shape, dtype in parameters:
    if scope_name == '__meta__:__identifier__':
      # The identifier can be all zeros.
      arr = np.zeros(shape=shape, dtype=dtype)
    else:
      # Do not use all-zero params, instead sample uniformly between -1 and 1.
      arr = np.random.uniform(low=-1, high=1, size=shape).astype(dtype)
    scope_name = scope_name.split(':')
    compressed.write(params.encode_record(*scope_name, arr))
```

## Parameters Schema

```
name=__meta__:__identifier__                                                                                                                                                             dtype=uint8     shape=(64,)
name=diffuser/~/diffusion_head/diffusion_atom_features_layer_norm:scale                                                                                                                  dtype=float32   shape=(128,)
name=diffuser/~/diffusion_head/diffusion_atom_features_to_position_update:weights                                                                                                        dtype=float32   shape=(128, 3)
name=diffuser/~/diffusion_head/diffusion_atom_positions_to_features:weights                                                                                                              dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderadaptive_zero_cond:bias                                 dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderadaptive_zero_cond:weights                              dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_adaptive_zero_cond:bias                             dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_adaptive_zero_cond:weights                          dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_single_cond_bias:weights                            dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_single_cond_layer_norm:scale                        dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_single_cond_scale:bias                              dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_single_cond_scale:weights                           dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_transition1:weights                                 dtype=float32   shape=(3, 128, 512)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderffw_transition2:weights                                 dtype=float32   shape=(3, 256, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decodergating_query:weights                                    dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderk_projection:weights                                    dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderksingle_cond_bias:weights                               dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderksingle_cond_layer_norm:scale                           dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderksingle_cond_scale:bias                                 dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderksingle_cond_scale:weights                              dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderq_projection:bias                                       dtype=float32   shape=(3, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderq_projection:weights                                    dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderqsingle_cond_bias:weights                               dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderqsingle_cond_layer_norm:scale                           dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderqsingle_cond_scale:bias                                 dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderqsingle_cond_scale:weights                              dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decodertransition2:weights                                     dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/__layer_stack_with_per_layer/diffusion_atom_transformer_decoderv_projection:weights                                    dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/pair_input_layer_norm:scale                                                                                            dtype=float32   shape=(16,)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_decoder/pair_logits_projection:weights                                                                                         dtype=float32   shape=(16, 3, 4)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderadaptive_zero_cond:bias                                 dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderadaptive_zero_cond:weights                              dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_adaptive_zero_cond:bias                             dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_adaptive_zero_cond:weights                          dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_single_cond_bias:weights                            dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_single_cond_layer_norm:scale                        dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_single_cond_scale:bias                              dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_single_cond_scale:weights                           dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_transition1:weights                                 dtype=float32   shape=(3, 128, 512)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderffw_transition2:weights                                 dtype=float32   shape=(3, 256, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encodergating_query:weights                                    dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderk_projection:weights                                    dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderksingle_cond_bias:weights                               dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderksingle_cond_layer_norm:scale                           dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderksingle_cond_scale:bias                                 dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderksingle_cond_scale:weights                              dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderq_projection:bias                                       dtype=float32   shape=(3, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderq_projection:weights                                    dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderqsingle_cond_bias:weights                               dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderqsingle_cond_layer_norm:scale                           dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderqsingle_cond_scale:bias                                 dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderqsingle_cond_scale:weights                              dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encodertransition2:weights                                     dtype=float32   shape=(3, 128, 128)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/__layer_stack_with_per_layer/diffusion_atom_transformer_encoderv_projection:weights                                    dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/pair_input_layer_norm:scale                                                                                            dtype=float32   shape=(16,)
name=diffuser/~/diffusion_head/diffusion_atom_transformer_encoder/pair_logits_projection:weights                                                                                         dtype=float32   shape=(16, 3, 4)
name=diffuser/~/diffusion_head/diffusion_embed_pair_distances_1:weights                                                                                                                  dtype=float32   shape=(1, 16)
name=diffuser/~/diffusion_head/diffusion_embed_pair_distances:weights                                                                                                                    dtype=float32   shape=(1, 16)
name=diffuser/~/diffusion_head/diffusion_embed_pair_offsets_1:weights                                                                                                                    dtype=float32   shape=(3, 16)
name=diffuser/~/diffusion_head/diffusion_embed_pair_offsets_valid:weights                                                                                                                dtype=float32   shape=(1, 16)
name=diffuser/~/diffusion_head/diffusion_embed_pair_offsets:weights                                                                                                                      dtype=float32   shape=(3, 16)
name=diffuser/~/diffusion_head/diffusion_embed_ref_atom_name:weights                                                                                                                     dtype=float32   shape=(256, 128)
name=diffuser/~/diffusion_head/diffusion_embed_ref_charge:weights                                                                                                                        dtype=float32   shape=(1, 128)
name=diffuser/~/diffusion_head/diffusion_embed_ref_element:weights                                                                                                                       dtype=float32   shape=(128, 128)
name=diffuser/~/diffusion_head/diffusion_embed_ref_mask:weights                                                                                                                          dtype=float32   shape=(1, 128)
name=diffuser/~/diffusion_head/diffusion_embed_ref_pos:weights                                                                                                                           dtype=float32   shape=(3, 128)
name=diffuser/~/diffusion_head/diffusion_embed_trunk_pair_cond:weights                                                                                                                   dtype=float32   shape=(128, 16)
name=diffuser/~/diffusion_head/diffusion_embed_trunk_single_cond:weights                                                                                                                 dtype=float32   shape=(384, 128)
name=diffuser/~/diffusion_head/diffusion_lnorm_trunk_pair_cond:scale                                                                                                                     dtype=float32   shape=(128,)
name=diffuser/~/diffusion_head/diffusion_lnorm_trunk_single_cond:scale                                                                                                                   dtype=float32   shape=(384,)
name=diffuser/~/diffusion_head/diffusion_pair_mlp_1:weights                                                                                                                              dtype=float32   shape=(16, 16)
name=diffuser/~/diffusion_head/diffusion_pair_mlp_2:weights                                                                                                                              dtype=float32   shape=(16, 16)
name=diffuser/~/diffusion_head/diffusion_pair_mlp_3:weights                                                                                                                              dtype=float32   shape=(16, 16)
name=diffuser/~/diffusion_head/diffusion_project_atom_features_for_aggr:weights                                                                                                          dtype=float32   shape=(128, 768)
name=diffuser/~/diffusion_head/diffusion_project_token_features_for_broadcast:weights                                                                                                    dtype=float32   shape=(768, 128)
name=diffuser/~/diffusion_head/diffusion_single_to_pair_cond_col_1:weights                                                                                                               dtype=float32   shape=(128, 16)
name=diffuser/~/diffusion_head/diffusion_single_to_pair_cond_col:weights                                                                                                                 dtype=float32   shape=(128, 16)
name=diffuser/~/diffusion_head/diffusion_single_to_pair_cond_row_1:weights                                                                                                               dtype=float32   shape=(128, 16)
name=diffuser/~/diffusion_head/diffusion_single_to_pair_cond_row:weights                                                                                                                 dtype=float32   shape=(128, 16)
name=diffuser/~/diffusion_head/noise_embedding_initial_norm:scale                                                                                                                        dtype=float32   shape=(256,)
name=diffuser/~/diffusion_head/noise_embedding_initial_projection:weights                                                                                                                dtype=float32   shape=(256, 384)
name=diffuser/~/diffusion_head/output_norm:scale                                                                                                                                         dtype=float32   shape=(768,)
name=diffuser/~/diffusion_head/pair_cond_initial_norm:scale                                                                                                                              dtype=float32   shape=(267,)
name=diffuser/~/diffusion_head/pair_cond_initial_projection:weights                                                                                                                      dtype=float32   shape=(267, 128)
name=diffuser/~/diffusion_head/pair_transition_0ffw_layer_norm:offset                                                                                                                    dtype=float32   shape=(128,)
name=diffuser/~/diffusion_head/pair_transition_0ffw_layer_norm:scale                                                                                                                     dtype=float32   shape=(128,)
name=diffuser/~/diffusion_head/pair_transition_0ffw_transition1:weights                                                                                                                  dtype=float32   shape=(128, 512)
name=diffuser/~/diffusion_head/pair_transition_0ffw_transition2:weights                                                                                                                  dtype=float32   shape=(256, 128)
name=diffuser/~/diffusion_head/pair_transition_1ffw_layer_norm:offset                                                                                                                    dtype=float32   shape=(128,)
name=diffuser/~/diffusion_head/pair_transition_1ffw_layer_norm:scale                                                                                                                     dtype=float32   shape=(128,)
name=diffuser/~/diffusion_head/pair_transition_1ffw_transition1:weights                                                                                                                  dtype=float32   shape=(128, 512)
name=diffuser/~/diffusion_head/pair_transition_1ffw_transition2:weights                                                                                                                  dtype=float32   shape=(256, 128)
name=diffuser/~/diffusion_head/single_cond_embedding_norm:scale                                                                                                                          dtype=float32   shape=(384,)
name=diffuser/~/diffusion_head/single_cond_embedding_projection:weights                                                                                                                  dtype=float32   shape=(384, 768)
name=diffuser/~/diffusion_head/single_cond_initial_norm:scale                                                                                                                            dtype=float32   shape=(831,)
name=diffuser/~/diffusion_head/single_cond_initial_projection:weights                                                                                                                    dtype=float32   shape=(831, 384)
name=diffuser/~/diffusion_head/single_transition_0ffw_layer_norm:offset                                                                                                                  dtype=float32   shape=(384,)
name=diffuser/~/diffusion_head/single_transition_0ffw_layer_norm:scale                                                                                                                   dtype=float32   shape=(384,)
name=diffuser/~/diffusion_head/single_transition_0ffw_transition1:weights                                                                                                                dtype=float32   shape=(384, 1536)
name=diffuser/~/diffusion_head/single_transition_0ffw_transition2:weights                                                                                                                dtype=float32   shape=(768, 384)
name=diffuser/~/diffusion_head/single_transition_1ffw_layer_norm:offset                                                                                                                  dtype=float32   shape=(384,)
name=diffuser/~/diffusion_head/single_transition_1ffw_layer_norm:scale                                                                                                                   dtype=float32   shape=(384,)
name=diffuser/~/diffusion_head/single_transition_1ffw_transition1:weights                                                                                                                dtype=float32   shape=(384, 1536)
name=diffuser/~/diffusion_head/single_transition_1ffw_transition2:weights                                                                                                                dtype=float32   shape=(768, 384)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformeradaptive_zero_cond:bias                                                  dtype=float32   shape=(6, 4, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformeradaptive_zero_cond:weights                                               dtype=float32   shape=(6, 4, 384, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_adaptive_zero_cond:bias                                              dtype=float32   shape=(6, 4, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_adaptive_zero_cond:weights                                           dtype=float32   shape=(6, 4, 384, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_single_cond_bias:weights                                             dtype=float32   shape=(6, 4, 384, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_single_cond_layer_norm:scale                                         dtype=float32   shape=(6, 4, 384)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_single_cond_scale:bias                                               dtype=float32   shape=(6, 4, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_single_cond_scale:weights                                            dtype=float32   shape=(6, 4, 384, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_transition1:weights                                                  dtype=float32   shape=(6, 4, 768, 3072)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerffw_transition2:weights                                                  dtype=float32   shape=(6, 4, 1536, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformergating_query:weights                                                     dtype=float32   shape=(6, 4, 768, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerk_projection:weights                                                     dtype=float32   shape=(6, 4, 768, 16, 48)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerq_projection:bias                                                        dtype=float32   shape=(6, 4, 16, 48)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerq_projection:weights                                                     dtype=float32   shape=(6, 4, 768, 16, 48)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformersingle_cond_bias:weights                                                 dtype=float32   shape=(6, 4, 384, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformersingle_cond_layer_norm:scale                                             dtype=float32   shape=(6, 4, 384)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformersingle_cond_scale:bias                                                   dtype=float32   shape=(6, 4, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformersingle_cond_scale:weights                                                dtype=float32   shape=(6, 4, 384, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformertransition2:weights                                                      dtype=float32   shape=(6, 4, 768, 768)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/__layer_stack_with_per_layer/transformerv_projection:weights                                                     dtype=float32   shape=(6, 4, 768, 16, 48)
name=diffuser/~/diffusion_head/transformer/__layer_stack_with_per_layer/pair_logits_projection:weights                                                                                   dtype=float32   shape=(6, 128, 4, 16)
name=diffuser/~/diffusion_head/transformer/pair_input_layer_norm:scale                                                                                                                   dtype=float32   shape=(128,)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/act_norm:offset                                                                           dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/act_norm:scale                                                                            dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/gating_query:weights                                                                      dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/k_projection:weights                                                                      dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/output_projection:weights                                                                 dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/pair_bias_projection:weights                                                              dtype=bfloat16  shape=(4, 128, 4)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/q_projection:weights                                                                      dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention1/v_projection:weights                                                                      dtype=bfloat16  shape=(4, 128, 4, 32)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/act_norm:offset                                                                           dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/act_norm:scale                                                                            dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/gating_query:weights                                                                      dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/k_projection:weights                                                                      dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/output_projection:weights                                                                 dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/pair_bias_projection:weights                                                              dtype=bfloat16  shape=(4, 128, 4)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/q_projection:weights                                                                      dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_attention2/v_projection:weights                                                                      dtype=bfloat16  shape=(4, 128, 4, 32)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_transition/input_layer_norm:offset                                                                   dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_transition/input_layer_norm:scale                                                                    dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_transition/transition1:weights                                                                       dtype=bfloat16  shape=(4, 128, 1024)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/pair_transition/transition2:weights                                                                       dtype=bfloat16  shape=(4, 512, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_gating_query:weights                                                                     dtype=bfloat16  shape=(4, 384, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_k_projection:weights                                                                     dtype=bfloat16  shape=(4, 384, 16, 24)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_layer_norm:offset                                                                        dtype=float32   shape=(4, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_layer_norm:scale                                                                         dtype=float32   shape=(4, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_q_projection:bias                                                                        dtype=bfloat16  shape=(4, 16, 24)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_q_projection:weights                                                                     dtype=bfloat16  shape=(4, 384, 16, 24)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_transition2:weights                                                                      dtype=bfloat16  shape=(4, 384, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_attention_v_projection:weights                                                                     dtype=bfloat16  shape=(4, 384, 16, 24)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_pair_logits_norm:offset                                                                            dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_pair_logits_norm:scale                                                                             dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_pair_logits_projection:weights                                                                     dtype=bfloat16  shape=(4, 128, 16)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_transition/input_layer_norm:offset                                                                 dtype=float32   shape=(4, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_transition/input_layer_norm:scale                                                                  dtype=float32   shape=(4, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_transition/transition1:weights                                                                     dtype=bfloat16  shape=(4, 384, 3072)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/single_transition/transition2:weights                                                                     dtype=bfloat16  shape=(4, 1536, 384)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/center_norm:offset                                                       dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/center_norm:scale                                                        dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/gate:weights                                                             dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/gating_linear:weights                                                    dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/left_norm_input:offset                                                   dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/left_norm_input:scale                                                    dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/output_projection:weights                                                dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_incoming/projection:weights                                                       dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/center_norm:offset                                                       dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/center_norm:scale                                                        dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/gate:weights                                                             dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/gating_linear:weights                                                    dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/left_norm_input:offset                                                   dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/left_norm_input:scale                                                    dtype=float32   shape=(4, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/output_projection:weights                                                dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/confidence_head/__layer_stack_no_per_layer/confidence_pairformer/triangle_multiplication_outgoing/projection:weights                                                       dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/confidence_head/~_embed_features/distogram_feat_project:weights                                                                                                            dtype=bfloat16  shape=(39, 128)
name=diffuser/confidence_head/~_embed_features/left_target_feat_project:weights                                                                                                          dtype=bfloat16  shape=(447, 128)
name=diffuser/confidence_head/~_embed_features/right_target_feat_project:weights                                                                                                         dtype=bfloat16  shape=(447, 128)
name=diffuser/confidence_head/experimentally_resolved_ln:offset                                                                                                                          dtype=float32   shape=(384,)
name=diffuser/confidence_head/experimentally_resolved_ln:scale                                                                                                                           dtype=float32   shape=(384,)
name=diffuser/confidence_head/experimentally_resolved_logits:weights                                                                                                                     dtype=float32   shape=(384, 24, 2)
name=diffuser/confidence_head/left_half_distance_logits:weights                                                                                                                          dtype=float32   shape=(128, 64)
name=diffuser/confidence_head/logits_ln:offset                                                                                                                                           dtype=float32   shape=(128,)
name=diffuser/confidence_head/logits_ln:scale                                                                                                                                            dtype=float32   shape=(128,)
name=diffuser/confidence_head/pae_logits_ln:offset                                                                                                                                       dtype=float32   shape=(128,)
name=diffuser/confidence_head/pae_logits_ln:scale                                                                                                                                        dtype=float32   shape=(128,)
name=diffuser/confidence_head/pae_logits:weights                                                                                                                                         dtype=float32   shape=(128, 64)
name=diffuser/confidence_head/plddt_logits_ln:offset                                                                                                                                     dtype=float32   shape=(384,)
name=diffuser/confidence_head/plddt_logits_ln:scale                                                                                                                                      dtype=float32   shape=(384,)
name=diffuser/confidence_head/plddt_logits:weights                                                                                                                                       dtype=float32   shape=(384, 24, 50)
name=diffuser/distogram_head/half_logits:weights                                                                                                                                         dtype=float32   shape=(128, 64)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderadaptive_zero_cond:bias                        dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderadaptive_zero_cond:weights                     dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_adaptive_zero_cond:bias                    dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_adaptive_zero_cond:weights                 dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_single_cond_bias:weights                   dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_single_cond_layer_norm:scale               dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_single_cond_scale:bias                     dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_single_cond_scale:weights                  dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_transition1:weights                        dtype=float32   shape=(3, 128, 512)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderffw_transition2:weights                        dtype=float32   shape=(3, 256, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encodergating_query:weights                           dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderk_projection:weights                           dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderksingle_cond_bias:weights                      dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderksingle_cond_layer_norm:scale                  dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderksingle_cond_scale:bias                        dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderksingle_cond_scale:weights                     dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderq_projection:bias                              dtype=float32   shape=(3, 4, 32)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderq_projection:weights                           dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderqsingle_cond_bias:weights                      dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderqsingle_cond_layer_norm:scale                  dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderqsingle_cond_scale:bias                        dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderqsingle_cond_scale:weights                     dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encodertransition2:weights                            dtype=float32   shape=(3, 128, 128)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/__layer_stack_with_per_layer/evoformer_conditioning_atom_transformer_encoderv_projection:weights                           dtype=float32   shape=(3, 128, 4, 32)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/pair_input_layer_norm:scale                                                                                                dtype=float32   shape=(16,)
name=diffuser/evoformer_conditioning_atom_transformer_encoder/pair_logits_projection:weights                                                                                             dtype=float32   shape=(16, 3, 4)
name=diffuser/evoformer_conditioning_embed_pair_distances_1:weights                                                                                                                      dtype=float32   shape=(1, 16)
name=diffuser/evoformer_conditioning_embed_pair_distances:weights                                                                                                                        dtype=float32   shape=(1, 16)
name=diffuser/evoformer_conditioning_embed_pair_offsets_1:weights                                                                                                                        dtype=float32   shape=(3, 16)
name=diffuser/evoformer_conditioning_embed_pair_offsets_valid:weights                                                                                                                    dtype=float32   shape=(1, 16)
name=diffuser/evoformer_conditioning_embed_pair_offsets:weights                                                                                                                          dtype=float32   shape=(3, 16)
name=diffuser/evoformer_conditioning_embed_ref_atom_name:weights                                                                                                                         dtype=float32   shape=(256, 128)
name=diffuser/evoformer_conditioning_embed_ref_charge:weights                                                                                                                            dtype=float32   shape=(1, 128)
name=diffuser/evoformer_conditioning_embed_ref_element:weights                                                                                                                           dtype=float32   shape=(128, 128)
name=diffuser/evoformer_conditioning_embed_ref_mask:weights                                                                                                                              dtype=float32   shape=(1, 128)
name=diffuser/evoformer_conditioning_embed_ref_pos:weights                                                                                                                               dtype=float32   shape=(3, 128)
name=diffuser/evoformer_conditioning_pair_mlp_1:weights                                                                                                                                  dtype=float32   shape=(16, 16)
name=diffuser/evoformer_conditioning_pair_mlp_2:weights                                                                                                                                  dtype=float32   shape=(16, 16)
name=diffuser/evoformer_conditioning_pair_mlp_3:weights                                                                                                                                  dtype=float32   shape=(16, 16)
name=diffuser/evoformer_conditioning_project_atom_features_for_aggr:weights                                                                                                              dtype=float32   shape=(128, 384)
name=diffuser/evoformer_conditioning_single_to_pair_cond_col_1:weights                                                                                                                   dtype=float32   shape=(128, 16)
name=diffuser/evoformer_conditioning_single_to_pair_cond_col:weights                                                                                                                     dtype=float32   shape=(128, 16)
name=diffuser/evoformer_conditioning_single_to_pair_cond_row_1:weights                                                                                                                   dtype=float32   shape=(128, 16)
name=diffuser/evoformer_conditioning_single_to_pair_cond_row:weights                                                                                                                     dtype=float32   shape=(128, 16)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/act_norm:offset                                                                                    dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/act_norm:scale                                                                                     dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/gating_query:weights                                                                               dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/k_projection:weights                                                                               dtype=bfloat16  shape=(48, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/output_projection:weights                                                                          dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/pair_bias_projection:weights                                                                       dtype=bfloat16  shape=(48, 128, 4)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/q_projection:weights                                                                               dtype=bfloat16  shape=(48, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention1/v_projection:weights                                                                               dtype=bfloat16  shape=(48, 128, 4, 32)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/act_norm:offset                                                                                    dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/act_norm:scale                                                                                     dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/gating_query:weights                                                                               dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/k_projection:weights                                                                               dtype=bfloat16  shape=(48, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/output_projection:weights                                                                          dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/pair_bias_projection:weights                                                                       dtype=bfloat16  shape=(48, 128, 4)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/q_projection:weights                                                                               dtype=bfloat16  shape=(48, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_attention2/v_projection:weights                                                                               dtype=bfloat16  shape=(48, 128, 4, 32)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_transition/input_layer_norm:offset                                                                            dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_transition/input_layer_norm:scale                                                                             dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_transition/transition1:weights                                                                                dtype=bfloat16  shape=(48, 128, 1024)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/pair_transition/transition2:weights                                                                                dtype=bfloat16  shape=(48, 512, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_gating_query:weights                                                                              dtype=bfloat16  shape=(48, 384, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_k_projection:weights                                                                              dtype=bfloat16  shape=(48, 384, 16, 24)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_layer_norm:offset                                                                                 dtype=float32   shape=(48, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_layer_norm:scale                                                                                  dtype=float32   shape=(48, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_q_projection:bias                                                                                 dtype=bfloat16  shape=(48, 16, 24)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_q_projection:weights                                                                              dtype=bfloat16  shape=(48, 384, 16, 24)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_transition2:weights                                                                               dtype=bfloat16  shape=(48, 384, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_attention_v_projection:weights                                                                              dtype=bfloat16  shape=(48, 384, 16, 24)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_pair_logits_norm:offset                                                                                     dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_pair_logits_norm:scale                                                                                      dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_pair_logits_projection:weights                                                                              dtype=bfloat16  shape=(48, 128, 16)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_transition/input_layer_norm:offset                                                                          dtype=float32   shape=(48, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_transition/input_layer_norm:scale                                                                           dtype=float32   shape=(48, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_transition/transition1:weights                                                                              dtype=bfloat16  shape=(48, 384, 3072)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/single_transition/transition2:weights                                                                              dtype=bfloat16  shape=(48, 1536, 384)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/center_norm:offset                                                                dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/center_norm:scale                                                                 dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/gate:weights                                                                      dtype=bfloat16  shape=(48, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/gating_linear:weights                                                             dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/left_norm_input:offset                                                            dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/left_norm_input:scale                                                             dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/output_projection:weights                                                         dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_incoming/projection:weights                                                                dtype=bfloat16  shape=(48, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/center_norm:offset                                                                dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/center_norm:scale                                                                 dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/gate:weights                                                                      dtype=bfloat16  shape=(48, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/gating_linear:weights                                                             dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/left_norm_input:offset                                                            dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/left_norm_input:scale                                                             dtype=float32   shape=(48, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/output_projection:weights                                                         dtype=bfloat16  shape=(48, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer_1/trunk_pairformer/triangle_multiplication_outgoing/projection:weights                                                                dtype=bfloat16  shape=(48, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/act_norm:offset                                                                                              dtype=float32   shape=(4, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/act_norm:scale                                                                                               dtype=float32   shape=(4, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/gating_query:weights                                                                                         dtype=bfloat16  shape=(4, 64, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/output_projection:weights                                                                                    dtype=bfloat16  shape=(4, 64, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/pair_logits:weights                                                                                          dtype=bfloat16  shape=(4, 128, 8)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/pair_norm:offset                                                                                             dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/pair_norm:scale                                                                                              dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_attention1/v_projection:weights                                                                                         dtype=bfloat16  shape=(4, 64, 8, 8)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_transition/input_layer_norm:offset                                                                                      dtype=float32   shape=(4, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_transition/input_layer_norm:scale                                                                                       dtype=float32   shape=(4, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_transition/transition1:weights                                                                                          dtype=bfloat16  shape=(4, 64, 512)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/msa_transition/transition2:weights                                                                                          dtype=bfloat16  shape=(4, 256, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/outer_product_mean:output_b                                                                                                 dtype=bfloat16  shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/outer_product_mean:output_w                                                                                                 dtype=bfloat16  shape=(4, 32, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/outer_product_mean/layer_norm_input:offset                                                                                  dtype=float32   shape=(4, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/outer_product_mean/layer_norm_input:scale                                                                                   dtype=float32   shape=(4, 64)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/outer_product_mean/left_projection:weights                                                                                  dtype=bfloat16  shape=(4, 64, 32)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/outer_product_mean/right_projection:weights                                                                                 dtype=bfloat16  shape=(4, 64, 32)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/act_norm:offset                                                                                             dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/act_norm:scale                                                                                              dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/gating_query:weights                                                                                        dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/k_projection:weights                                                                                        dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/output_projection:weights                                                                                   dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/pair_bias_projection:weights                                                                                dtype=bfloat16  shape=(4, 128, 4)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/q_projection:weights                                                                                        dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention1/v_projection:weights                                                                                        dtype=bfloat16  shape=(4, 128, 4, 32)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/act_norm:offset                                                                                             dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/act_norm:scale                                                                                              dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/gating_query:weights                                                                                        dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/k_projection:weights                                                                                        dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/output_projection:weights                                                                                   dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/pair_bias_projection:weights                                                                                dtype=bfloat16  shape=(4, 128, 4)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/q_projection:weights                                                                                        dtype=bfloat16  shape=(4, 4, 32, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_attention2/v_projection:weights                                                                                        dtype=bfloat16  shape=(4, 128, 4, 32)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_transition/input_layer_norm:offset                                                                                     dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_transition/input_layer_norm:scale                                                                                      dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_transition/transition1:weights                                                                                         dtype=bfloat16  shape=(4, 128, 1024)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/pair_transition/transition2:weights                                                                                         dtype=bfloat16  shape=(4, 512, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/center_norm:offset                                                                         dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/center_norm:scale                                                                          dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/gate:weights                                                                               dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/gating_linear:weights                                                                      dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/left_norm_input:offset                                                                     dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/left_norm_input:scale                                                                      dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/output_projection:weights                                                                  dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_incoming/projection:weights                                                                         dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/center_norm:offset                                                                         dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/center_norm:scale                                                                          dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/gate:weights                                                                               dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/gating_linear:weights                                                                      dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/left_norm_input:offset                                                                     dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/left_norm_input:scale                                                                      dtype=float32   shape=(4, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/output_projection:weights                                                                  dtype=bfloat16  shape=(4, 128, 128)
name=diffuser/evoformer/__layer_stack_no_per_layer/msa_stack/triangle_multiplication_outgoing/projection:weights                                                                         dtype=bfloat16  shape=(4, 128, 256)
name=diffuser/evoformer/~_relative_encoding/position_activations:weights                                                                                                                 dtype=bfloat16  shape=(139, 128)
name=diffuser/evoformer/bond_embedding:weights                                                                                                                                           dtype=bfloat16  shape=(1, 128)
name=diffuser/evoformer/extra_msa_target_feat:weights                                                                                                                                    dtype=bfloat16  shape=(447, 64)
name=diffuser/evoformer/left_single:weights                                                                                                                                              dtype=bfloat16  shape=(447, 128)
name=diffuser/evoformer/msa_activations:weights                                                                                                                                          dtype=bfloat16  shape=(34, 64)
name=diffuser/evoformer/prev_embedding_layer_norm:offset                                                                                                                                 dtype=float32   shape=(128,)
name=diffuser/evoformer/prev_embedding_layer_norm:scale                                                                                                                                  dtype=float32   shape=(128,)
name=diffuser/evoformer/prev_embedding:weights                                                                                                                                           dtype=bfloat16  shape=(128, 128)
name=diffuser/evoformer/prev_single_embedding_layer_norm:offset                                                                                                                          dtype=float32   shape=(384,)
name=diffuser/evoformer/prev_single_embedding_layer_norm:scale                                                                                                                           dtype=float32   shape=(384,)
name=diffuser/evoformer/prev_single_embedding:weights                                                                                                                                    dtype=bfloat16  shape=(384, 384)
name=diffuser/evoformer/right_single:weights                                                                                                                                             dtype=bfloat16  shape=(447, 128)
name=diffuser/evoformer/single_activations:weights                                                                                                                                       dtype=bfloat16  shape=(447, 384)
name=diffuser/evoformer/template_embedding/output_linear:weights                                                                                                                         dtype=bfloat16  shape=(64, 128)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/act_norm:offset                             dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/act_norm:scale                              dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/gating_query:weights                        dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/k_projection:weights                        dtype=bfloat16  shape=(2, 4, 16, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/output_projection:weights                   dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/pair_bias_projection:weights                dtype=bfloat16  shape=(2, 64, 4)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/q_projection:weights                        dtype=bfloat16  shape=(2, 4, 16, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention1/v_projection:weights                        dtype=bfloat16  shape=(2, 64, 4, 16)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/act_norm:offset                             dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/act_norm:scale                              dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/gating_query:weights                        dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/k_projection:weights                        dtype=bfloat16  shape=(2, 4, 16, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/output_projection:weights                   dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/pair_bias_projection:weights                dtype=bfloat16  shape=(2, 64, 4)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/q_projection:weights                        dtype=bfloat16  shape=(2, 4, 16, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_attention2/v_projection:weights                        dtype=bfloat16  shape=(2, 64, 4, 16)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_transition/input_layer_norm:offset                     dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_transition/input_layer_norm:scale                      dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_transition/transition1:weights                         dtype=bfloat16  shape=(2, 64, 256)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/pair_transition/transition2:weights                         dtype=bfloat16  shape=(2, 128, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/center_norm:offset         dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/center_norm:scale          dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/gate:weights               dtype=bfloat16  shape=(2, 64, 128)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/gating_linear:weights      dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/left_norm_input:offset     dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/left_norm_input:scale      dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/output_projection:weights  dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_incoming/projection:weights         dtype=bfloat16  shape=(2, 64, 128)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/center_norm:offset         dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/center_norm:scale          dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/gate:weights               dtype=bfloat16  shape=(2, 64, 128)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/gating_linear:weights      dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/left_norm_input:offset     dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/left_norm_input:scale      dtype=float32   shape=(2, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/output_projection:weights  dtype=bfloat16  shape=(2, 64, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/__layer_stack_no_per_layer/template_embedding_iteration/triangle_multiplication_outgoing/projection:weights         dtype=bfloat16  shape=(2, 64, 128)
name=diffuser/evoformer/template_embedding/single_template_embedding/output_layer_norm:offset                                                                                            dtype=float32   shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/output_layer_norm:scale                                                                                             dtype=float32   shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/query_embedding_norm:offset                                                                                         dtype=float32   shape=(128,)
name=diffuser/evoformer/template_embedding/single_template_embedding/query_embedding_norm:scale                                                                                          dtype=float32   shape=(128,)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_0:weights                                                                                   dtype=bfloat16  shape=(39, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_1:weights                                                                                   dtype=bfloat16  shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_2:weights                                                                                   dtype=bfloat16  shape=(31, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_3:weights                                                                                   dtype=bfloat16  shape=(31, 64)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_4:weights                                                                                   dtype=bfloat16  shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_5:weights                                                                                   dtype=bfloat16  shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_6:weights                                                                                   dtype=bfloat16  shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_7:weights                                                                                   dtype=bfloat16  shape=(64,)
name=diffuser/evoformer/template_embedding/single_template_embedding/template_pair_embedding_8:weights                                                                                   dtype=bfloat16  shape=(128, 64)
```


================================================
FILE: docs/output.md
================================================
# AlphaFold 3 Output

## Output Directory Structure

For every input job, AlphaFold 3 writes all its outputs in a directory called by
the sanitized version of the job name. E.g. for job name "My first fold (TEST)",
AlphaFold 3 will write its outputs in a directory called `My_first_fold_TEST`
(the case is respected). If such directory already exists, AlphaFold 3 will
append a timestamp to the directory name to avoid overwriting existing data
unless `--force_output_dir` is passed.

The following structure is used within the output directory:

*   Sub-directories with results for each sample and seed. There will be
    *num\_seeds* \* *num\_samples* such sub-directories. The naming pattern is
    `seed-<seed value>_sample-<sample number>`. Each of these directories
    contains a confidence JSON, summary confidence JSON, and the mmCIF with the
    predicted structure.
*   Distogram for each seed: `seed-<seed value>_distogram/distogram.npz`. The
    Numpy zip file contains a single key: `distogram`. The distogram can be
    large, its shape is `(num_tokens, num_tokens, 64)` and dtype `np.float16`
    (almost 3 GiB for a 5,000-token input). Only saved if AlphaFold 3 is run
    with `--save_distogram=true`.
*   Embeddings for each seed: `seed-<seed value>_embeddings/embeddings.npz`. The
    Numpy zip file contains 2 keys: `single_embeddings` and `pair_embeddings`.
    The embeddings can be large, their shapes are `(num_tokens, 384)` for
    `single_embeddings`, and `(num_tokens, num_tokens, 128)` for
    `pair_embeddings`. Their dtype is `np.float16` (almost 6 GiB for a
    5,000-token input). Only saved if AlphaFold 3 is run with
    `--save_embeddings=true`.
*   Top-ranking prediction mmCIF: `<job_name>_model.cif`. This file contains the
    predicted coordinates and should be compatible with most structural biology
    tools. We do not provide the output in the PDB format, the CIF file can be
    easily converted into one if needed.
*   Top-ranking prediction confidence JSON: `<job_name>_confidences.json`.
*   Top-ranking prediction summary confidence JSON:
    `<job_name>_summary_confidences.json`.
*   Job input JSON file with the MSA and template data added by the data
    pipeline: `<job_name>_data.json`.
*   Ranking scores for all predictions: `ranking_scores.csv`. The prediction
    with highest ranking is the one included in the root directory.
*   Output terms of use: `TERMS_OF_USE.md`.

Below is an example AlphaFold 3 output directory listing for a job called "Hello
Fold", that has been ran with 1 seed and 5 samples:

```txt
hello_fold/
├── seed-1234_distogram                        # Only if --save_distogram=true.
│   └── hello_fold_seed-1234_distogram.npz     # Only if --save_distogram=true.
├── seed-1234_embeddings                       # Only if --save_embeddings=true.
│   └── hello_fold_seed-1234_embeddings.npz    # Only if --save_embeddings=true.
├── seed-1234_sample-0/
│   ├── hello_fold_seed-1234_sample-0_confidences.json
│   ├── hello_fold_seed-1234_sample-0_model.cif
│   └── hello_fold_seed-1234_sample-0_summary_confidences.json
├── seed-1234_sample-1/
│   ├── hello_fold_seed-1234_sample-1_confidences.json
│   ├── hello_fold_seed-1234_sample-1_model.cif
│   └── hello_fold_seed-1234_sample-1_summary_confidences.json
├── seed-1234_sample-2/
│   ├── hello_fold_seed-1234_sample-2_confidences.json
│   ├── hello_fold_seed-1234_sample-2_model.cif
│   └── hello_fold_seed-1234_sample-2_summary_confidences.json
├── seed-1234_sample-3/
│   ├── hello_fold_seed-1234_sample-3_confidences.json
│   ├── hello_fold_seed-1234_sample-3_model.cif
│   └── hello_fold_seed-1234_sample-3_summary_confidences.json
├── seed-1234_sample-4/
│   ├── hello_fold_seed-1234_sample-4_confidences.json
│   ├── hello_fold_seed-1234_sample-4_model.cif
│   └── hello_fold_seed-1234_sample-4_summary_confidences.json
├── TERMS_OF_USE.md
├── hello_fold_confidences.json
├── hello_fold_data.json
├── hello_fold_model.cif
├── hello_fold_ranking_scores.csv
└── hello_fold_summary_confidences.json
```

## Confidence Metrics

Similar to AlphaFold 2 and AlphaFold-Multimer, AlphaFold 3 outputs include
confidence metrics. The main metrics are:

*   **pLDDT:** a per-atom confidence estimate on a 0-100 scale where a higher
    value indicates higher confidence. pLDDT aims to predict a modified LDDT
    score that only considers distances to polymers. For proteins this is
    similar to the
    [lDDT-Cα metric](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3799472/) but
    with more granularity as it can vary per atom not just per residue. For
    ligand atoms, the modified LDDT considers the errors only between the ligand
    atom and polymers, not other ligand atoms. For DNA/RNA a wider radius of 30
    Å is used for the modified LDDT instead of 15 Å.
*   **PAE (predicted aligned error)**: an estimate of the error in the relative
    position and orientation between two tokens in the predicted structure.
    Higher values indicate higher predicted error and therefore lower
    confidence. For proteins and nucleic acids, PAE score is essentially the
    same as AlphaFold 2, where the error is measured relative to frames
    constructed from the protein backbone. For small molecules and
    post-translational modifications, a frame is constructed for each atom from
    its closest neighbors from a reference conformer.
*   **pTM and ipTM scores**: the predicted template modeling (pTM) score and the
    interface predicted template modeling (ipTM) score are both derived from a
    measure called the template modeling (TM) score. This measures the accuracy
    of the entire structure
    ([Zhang and Skolnick, 2004](https://doi.org/10.1002/prot.20264);
    [Xu and Zhang, 2010](https://doi.org/10.1093/bioinformatics/btq066)). A pTM
    score above 0.5 means the overall predicted fold for the complex might be
    similar to the true structure. ipTM measures the accuracy of the predicted
    relative positions of the subunits within the complex. Values higher than
    0.8 represent confident high-quality predictions, while values below 0.6
    suggest a failed prediction. ipTM values between 0.6 and 0.8 are a gray zone
    where predictions could be correct or incorrect. The TM score is very strict
    for small structures or short chains, so pTM assigns values less than 0.05
    when fewer than 20 tokens are involved; for these cases PAE or pLDDT may be
    more indicative of prediction quality.

For detailed description of these confidence metrics see the
[AlphaFold 3 paper](https://www.nature.com/articles/s41586-024-07487-w). For
protein components, the
[AlphaFold: A Practical guide](https://www.ebi.ac.uk/training/online/courses/alphafold/inputs-and-outputs/evaluating-alphafolds-predicted-structures-using-confidence-scores/)
course for structures provides additional tutorials on the confidence metrics.

If you are interested in a specific entity or interaction, then there are
confidences available in the outputs which are specific to each chain or
chain-pair, as opposed to the full complex. See below for more details on all
the confidence metrics that are returned.

## Multi-Seed and Multi-Sample Results

By default, the model samples five predictions per seed. The top-ranked
prediction across all samples and seeds is available at the top-level of the
output directory. All samples along with their associated confidences are
available in subdirectories of the output directory.

For ranking of the full complex use the `ranking_score` (higher is better). This
score uses overall structure confidences (pTM and ipTM), but also includes terms
that penalize clashes and encourage disordered regions not to have spurious
helices – these extra terms mean the score should only be used to rank
structures.

If you are interested in a specific entity or interaction, you may want to rank
by a metric specific to that chain or chain-pair, as opposed to the full
complex. In that case, use the per chain or per chain-pair confidence metrics
described below for ranking.

## Metrics in Confidences JSON

For each predicted sample we provide two JSON files. One contains summary
metrics – summaries for either the whole structure, per chain or per chain-pair
– and the other contains full 1D or 2D arrays.

Summary outputs:

*   `ptm`: A scalar in the range 0-1 indicating the predicted TM-score for the
    full structure.
*   `iptm`: A scalar in the range 0-1 indicating predicted interface TM-score
    (confidence in the predicted interfaces) for all interfaces in the
    structure.
*   `fraction_disordered`: A scalar in the range 0-1 that indicates what
    fraction of the prediction structure is disordered, as measured by
    accessible surface area, see our
    [paper](https://www.nature.com/articles/s41586-024-07487-w) for details.
*   `has_clash`: A boolean indicating if the structure has a significant number
    of clashing atoms (more than 50% of a chain, or a chain with more than 100
    clashing atoms).
*   `ranking_score`: A scalar in the range \[-100, 1.5\] that can be used for
    ranking predictions, it incorporates `ptm`, `iptm`, `fraction_disordered`
    and `has_clash` into a single number with the following equation: 0.8 × ipTM
    \+ 0.2 × pTM \+ 0.5 × disorder − 100 × has_clash.
*   `chain_pair_pae_min`: A \[num_chains, num_chains\] array. Element (i, j) of
    the array contains the lowest PAE value across rows restricted to chain i
    and columns restricted to chain j. This has been found to correlate with
    whether two chains interact or not, and in some cases can be used to
    distinguish binders from non-binders.
*   `chain_pair_iptm`: A \[num_chains, num_chains\] array. Off-diagonal element
    (i, j) of the array contains the ipTM restricted to tokens from chains i and
    j. Diagonal element (i, i) contains the pTM restricted to chain i. Can be
    used for ranking a specific interface between two chains, when you know that
    they interact, e.g. for antibody-antigen interactions
*   `chain_ptm`: A \[num_chains\] array. Element i contains the pTM restricted
    to chain i. Can be used for ranking individual chains when the structure of
    that chain is most of interest, rather than the cross-chain interactions it
    is involved with.
*   `chain_iptm:` A \[num_chains\] array that gives the average confidence
    (interface pTM) in the interface between each chain and all other chains.
    Can be used for ranking a specific chain, when you care about where the
    chain binds to the rest of the complex and you do not know which other
    chains you expect it to interact with. This is often the case with ligands.

Full array outputs:

*   `pae`: A \[num\_tokens, num\_tokens\] array. Element (i, j) indicates the
    predicted error in the position of token j, when the prediction is aligned
    to the ground truth using the frame of token i.
*   `atom_plddts`: A \[num_atoms\] array, element i indicates the predicted
    local distance difference test (pLDDT) for atom i in the prediction.
*   `contact_probs`: A \[num_tokens, num_tokens\] array. Element (i, j)
    indicates the predicted probability that token i and token j are in contact
    (8 Å between the representative atom for each token), see
    [paper](https://www.nature.com/articles/s41586-024-07487-w) for details.
*   `token_chain_ids`: A \[num_tokens\] array indicating the chain ids
    corresponding to each token in the prediction.
*   `atom_chain_ids`: A \[num_atoms\] array indicating the chain ids
    corresponding to each atom in the prediction.

## Embeddings

AlphaFold 3 can be run with `--save_embeddings=true` to save the embeddings for
each seed. The file is in the
[compressed Numpy `.npz` format](https://numpy.org/doc/stable/reference/generated/numpy.savez_compressed.html)
and can be loaded using `numpy.load` as a dictionary-like object with two
arrays:

*   `single_embeddings`: A \`[num\_tokens, 384\] array containing the embeddings
    for each token.
*   `pair_embeddings`: A \[num\_tokens, num\_tokens, 128\] array containing the
    pairwise embeddings between all tokens.

You can use for instance the following Python code to load the embeddings:

```py
import numpy as np

with open('embeddings.npz', 'rb') as f:
  embeddings = np.load(f)
  single_embeddings = embeddings['single_embeddings']
  pair_embeddings = embeddings['pair_embeddings']
```

## Chirality checks

In the AlphaFold 3 paper Posebusters results, a penalty was applied to the
ranking score if the ligand of interest contained chiral errors. By running
multiple seeds and using this chiral aware ranking, chiral error rates were
greatly reduced.

We provide the method `compare_chirality` in
[`model/scoring/chirality.py`](https://github.com/google-deepmind/alphafold3/blob/main/src/alphafold3/model/scoring/chirality.py)
to replicate these chiral checks. Chirality is checked against CCD structures if
available, otherwise users can supply custom RDKit Mol objects for comparison.


================================================
FILE: docs/performance.md
================================================
# Performance

## Running the Pipeline in Stages

The `run_alphafold.py` script can be executed in stages to optimise resource
utilisation. This can be useful for:

1.  Splitting the CPU-only data pipeline from model inference (which requires a
    GPU), to optimise cost and resource usage.
1.  Generating the JSON output file from the data pipeline only run and then
    using it for multiple different inference only runs across seeds or across
    variations of other features (e.g. a ligand or a partner chain).
1.  Generating the JSON output for multiple individual monomer chains (e.g. for
    chains A, B, C, D), then running the inference on all possible chain pairs
    (AB, AC, AD, BC, BD, CD) by creating dimer JSONs by merging the monomer
    JSONs. By doing this, the MSA and template search need to be run just 4
    times (once for each chain), instead of 12 times.

### Data Pipeline Only

Launch `run_alphafold.py` with `--norun_inference` to generate Multiple Sequence
Alignments (MSAs) and templates, without running featurisation and model
inference. This stage can be quite costly in terms of runtime, CPU, and RAM use.
The output will be JSON files augmented with MSAs and templates that can then be
directly used as input for running inference.

### Pre-computing and reusing MSA and templates

When folding multiple candidate chains with a set of fixed chains (i.e. chains
that are the same for all the runs), you can optimize the process by computing
the MSA and templates for the fixed chains only once. The computations for the
changing candidate chains will still be performed for each run:

1.  Run the AlphaFold 3 data pipeline for the fixed chains using the
    `--run_inference=false` flag. This step generates a JSON file containing the
    MSA and template data for these chains.
2.  When constructing your multimer input JSONs, populate the entries for the
    fixed chains using the data generated in the previous step.
    *   For the fixed chains: Specifically, copy the `unpairedMsa`, `pairedMsa`,
        and `templates` fields from the pre-computed JSON into the multimer
        input JSON. This prevents these fields from being recomputed.
    *   For the candidate chains: Leave these fields unset (or `null`) in the
        multimer input JSON. This will signal the pipeline to compute them
        dynamically for each run.

This technique can also be extended to efficiently process all combinations of
*n* first chains and *m* second chains. Instead of performing *n* × *m* full
computations, you can reduce this to *n* + *m* data pipeline runs.

In this scenario:

1.  Run the data pipeline (step 1 above, with `--run_inference=false`) for all
    *n* individual first chains and all *m* individual second chains.
2.  Assemble the dimer input JSONs for each desired pair by combining their
    respective pre-computed monomer JSONs.
3.  Run only the inference step on these assembled JSONs using the
    `--run_data_pipeline=false` flag.

This approach has been discussed in multiple GitHub issues, such as:
https://github.com/google-deepmind/alphafold3/issues/171 (which links to other
similar issues).

### Featurisation and Model Inference Only

Launch `run_alphafold.py` with `--norun_data_pipeline` to skip the data pipeline
and run only featurisation and model inference. This stage requires the input
JSON file to contain pre-computed MSAs and templates (or they must be explicitly
set to empty if you want to run MSA and template free).

## Data Pipeline

The runtime of the data pipeline (i.e. genetic sequence search and template
search) can vary significantly depending on the size of the input and the number
of homologous sequences found, as well as the available hardware – the disk
speed can influence genetic search speed in particular.

If you would like to improve performance, it's recommended to increase the disk
speed (e.g. by leveraging a RAM-backed filesystem), or increase the available
CPU cores and add more parallelisation. This can help because AlphaFold 3 runs
genetic search against 4 databases in parallel, so the optimal number of cores
is the number of cores used for each Jackhmmer process times 4. Also note that
for sequences with deep MSAs, Jackhmmer or Nhmmer may need a substantial amount
of RAM beyond the recommended 64 GB of RAM.

### Sharded genetic databases

The run time of the genetic database search can be *significantly* sped up by
splitting the genetic databases if a machine with many CPU cores is used and the
databases are on very fast SSD or in a RAM-backed filesystem. With this
technique you can make Jackhmmer/Nhmmer genetic search fully utilize your
hardware and take advantage of multi-core systems.

Each genetic database with *n* sequences is split into *s* shards, each
containing roughly *n* / *s* sequences. We recommend splitting the sequences
between shards randomly to make sure each shard has similar sequence length
distribution. This could be achieved using standard tools:

1.  Shuffle the sequences in the fasta. This can be done for example by running:
    `seqkit shuffle --two-pass <db.fasta>`
2.  Split the shuffled fasta in *s* shards. This can be done for example by
    running: `seqkit split2 --by-part <s> <db.fasta>`

Make sure the shards names follow this pattern:
`prefix-<shard_index>-of-<total_shards>`, both `shard_index` and `total_shards`
having always 5 digits, with leading zeros as needed. The `shard_index` goes
from 0 to `total_shards - 1`. A file "path" (spec) for a sharded file is
`prefix@<total_shards>`.

E.g. for a file named `uniprot.fasta` split into 3 shards, the names of the
shards should be:

*   `uniprot.fasta-00000-of-00003`
*   `uniprot.fasta-00001-of-00003`
*   `uniprot.fasta-00002-of-00003`

The file spec for these files is `uniprot.fasta@3`.

Save the total number of sequences in the protein databases, and the total
number of nucleic bases in the RNA databases – these will be needed later as a
flag to Jackhmmer/Nhmmer to correctly scale e-values across all shards.

Save the sharded databases on a fast SSD or in a RAM-backed filesystem, then
launch AlphaFold with the sharded paths instead of normal paths and set the
Z-values.

For instance with each database sharded into 16 shards:

```bash
python run_alphafold.py \
    --small_bfd_database_path="bfd-first_non_consensus_sequences.fasta@64" \
    --small_bfd_z_value=65984053 \
    --mgnify_database_path="mgy_clusters_2022_05.fa@512" \
    --mgnify_z_value=623796864 \
    --uniprot_cluster_annot_database_path="uniprot_cluster_annot_2021_04.fasta@256" \
    --uniprot_cluster_annot_z_value=225619586 \
    --uniref90_database_path="uniref90_2022_05.fasta@128" \
    --uniref90_z_value=153742194 \
    --ntrna_database_path="nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta@256" \
    --ntrna_z_value=76752.808514 \
    --rfam_database_path="rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta@16" \
    --rfam_z_value=138.115553 \
    --rna_central_database_path="rnacentral_active_seq_id_90_cov_80_linclust.fasta@64" \
    --rna_central_z_value=13271.415730
    --jackhmmer_n_cpu=2 \
    --jackhmmer_max_parallel_shards=16 \
    --nhmmer_n_cpu=2 \
    --nhmmer_max_parallel_shards=16
```

This run will utilize (2 CPUs) × (16 max parallel shards) × (4 protein dbs
searched in parallel) = 128 cores for each protein chain, and (2 CPUs) × (16 max
parallel shards) × (3 RNA dbs searched in parallel) = 96 cores for each RNA
chain. Make sure to tune:

*   the Jackhmmer/Nhmmer number of CPUs,
*   the maximum number of shards searched in parallel,
*   and the number of shards for each database

so that the memory bandwidth and CPUs on your machine are optimally utilized.
You should aim for consistent shard sizes across all databases (so e.g. if
database A is split into 16 shards and is 3× smaller than database B, database B
should be split into 3 × 16 = 48 shards).

## Model Inference

Table 8 in the Supplementary Information of the
[AlphaFold 3 paper](https://nature.com/articles/s41586-024-07487-w) provides
compile-free inference timings for AlphaFold 3 when configured to run on 16
NVIDIA A100s, with 40 GB of memory per device. In contrast, this repository
supports running AlphaFold 3 on a single NVIDIA A100 with 80 GB of memory in a
configuration optimised to maximise throughput.

We compare compile-free inference timings of these two setups in the table below
using GPU seconds (i.e. multiplying by 16 when using 16 A100s). The setup in
this repository is more efficient (by at least 2×) across all token sizes,
indicating its suitability for high-throughput applications.

Num Tokens | 1 A100 80 GB (GPU secs) | 16 A100 40 GB (GPU secs) | Improvement
:--------- | ----------------------: | -----------------------: | ----------:
1024       | 62                      | 352                      | 5.7×
2048       | 275                     | 1136                     | 4.1×
3072       | 703                     | 2016                     | 2.9×
4096       | 1434                    | 3648                     | 2.5×
5120       | 2547                    | 5552                     | 2.2×

## Accelerator Hardware Requirements

We officially support the following configurations, and have extensively tested
them for numerical accuracy and throughput efficiency:

-   1 NVIDIA A100 (80 GB)
-   1 NVIDIA H100 (80 GB)

We compare compile-free inference timings of both configurations in the
following table:

Num Tokens | 1 A100 80 GB (seconds) | 1 H100 80 GB (seconds)
:--------- | ---------------------: | ---------------------:
1024       | 62                     | 34
2048       | 275                    | 144
3072       | 703                    | 367
4096       | 1434                   | 774
5120       | 2547                   | 1416

### Other Hardware Configurations

#### NVIDIA A100 (40 GB)

AlphaFold 3 can run on inputs of size up to 4,352 tokens on a single NVIDIA A100
(40 GB) with the following configuration changes:

1.  Enabling [unified memory](#unified-memory).
1.  Adjusting `pair_transition_shard_spec` in `model_config.py`:

    ```py
      pair_transition_shard_spec: Sequence[_Shape2DType] = (
          (2048, None),
          (3072, 1024),
          (None, 512),
      )
    ```

The format of entries in `pair_transition_shard_spec` is
`(num_tokens_upper_bound, shard_size)`. Setting `shard_size=None` means there is
no upper bound.

For the example above:

*   `(2048, None)`: for sequences up to 2,048 tokens, do not shard
*   `(3072, 1024)`: for sequences up to 3,072 tokens, shard in chunks of 1,024
*   `(None, 512)`: for all other sequences, shard in chunks of 512

While numerically accurate, this configuration will have lower throughput
compared to the set up on the NVIDIA A100 (80 GB), due to less available memory.

#### NVIDIA V100

There are known numerical issues with CUDA Capability 7.x devices. To work
around the issue, set the ENV XLA_FLAGS to include
`--xla_disable_hlo_passes=custom-kernel-fusion-rewriter`.

With the above flag set, AlphaFold 3 can run on inputs of size up to 1,280
tokens on a single NVIDIA V100 using [unified memory](#unified-memory).

#### NVIDIA P100

AlphaFold 3 can run on inputs of size up to 1,024 tokens on a single NVIDIA P100
with no configuration changes needed.

#### Other devices

Large-scale numerical tests have not been performed on any other devices but
they are believed to be numerically accurate.

There are known numerical issues with CUDA Capability 7.x devices. To work
around the issue, set the environment variable `XLA_FLAGS` to include
`--xla_disable_hlo_passes=custom-kernel-fusion-rewriter`.

## Compilation Buckets

To avoid excessive re-compilation of the model, AlphaFold 3 implements
compilation buckets: ranges of input sizes using a single compilation of the
model.

When featurising an input, AlphaFold 3 determines the smallest bucket the input
fits into, then adds any necessary padding. This may avoid re-compiling the
model when running inference on the input if it belongs to the same bucket as a
previously processed input.

The configuration of bucket sizes involves a trade-off: more buckets leads to
more re-compilations of the model, but less padding.

By default, the largest bucket size is 5,120 tokens. Processing inputs larger
than this maximum bucket size triggers the creation of a new bucket for exactly
that input size, and a re-compilation of the model. In this case, you may wish
to redefine the compilation bucket sizes via the `--buckets` flag in
`run_alphafold.py` to add additional larger bucket sizes. For example, suppose
you are running inference on inputs with token sizes: `5132, 5280, 5342`. Using
the default bucket sizes configured in `run_alphafold.py` will trigger three
separate model compilations, one for each unique token size. If instead you pass
in the following flag to `run_alphafold.py`

```
--buckets 256,512,768,1024,1280,1536,2048,2560,3072,3584,4096,4608,5120,5376
```

when running inference on the above three input sizes, the model will be
compiled only once for the bucket size `5376`. **Note:** for this specific
example with input sizes `5132, 5280, 5342`, passing in `--buckets 5376` is
sufficient to achieve the desired compilation behaviour. The provided example
with multiple buckets illustrates a more general solution suitable for diverse
input sizes.

## Additional Flags

### Compilation Time Workaround with XLA Flags

To work around a known XLA issue causing the compilation time to greatly
increase, the following environment variable must be set (it is set by default
in the provided `Dockerfile`).

```sh
ENV XLA_FLAGS="--xla_gpu_enable_triton_gemm=false"
```

### CUDA Capability 7.x GPUs

For all CUDA Capability 7.x GPUs (e.g. V100) the environment variable
`XLA_FLAGS` must be changed to include
`--xla_disable_hlo_passes=custom-kernel-fusion-rewriter`. Disabling the Tritron
GEMM kernels is not necessary as they are not supported for such GPUs.

```sh
ENV XLA_FLAGS="--xla_disable_hlo_passes=custom-kernel-fusion-rewriter"
```

### GPU Memory

The following environment variables (set by default in the `Dockerfile`) enable
folding a single input of size up to 5,120 tokens on a single A100 (80 GB) or a
single H100 (80 GB):

```sh
ENV XLA_PYTHON_CLIENT_PREALLOCATE=true
ENV XLA_CLIENT_MEM_FRACTION=0.95
```

#### Unified Memory

If you would like to run AlphaFold 3 on inputs larger than 5,120 tokens, or on a
GPU with less memory (an A100 with 40 GB of memory, for instance), we recommend
enabling unified memory. Enabling unified memory allows the program to spill GPU
memory to host memory if there isn't enough space. This prevents an OOM, at the
cost of making the program slower by accessing host memory instead of device
memory. To learn more, check out the
[NVIDIA blog post](https://developer.nvidia.com/blog/unified-memory-cuda-beginners/).

You can enable unified memory by setting the following environment variables in
your `Dockerfile`:

```sh
ENV XLA_PYTHON_CLIENT_PREALLOCATE=false
ENV TF_FORCE_UNIFIED_MEMORY=true
ENV XLA_CLIENT_MEM_FRACTION=3.2
```

### JAX Persistent Compilation Cache

You may also want to make use of the JAX persistent compilation cache, to avoid
unnecessary recompilation of the model between runs. You can enable the
compilation cache with the `--jax_compilation_cache_dir <YOUR_DIRECTORY>` flag
in `run_alphafold.py`.

More detailed instructions are available in the
[JAX documentation](https://jax.readthedocs.io/en/latest/persistent_compilation_cache.html#persistent-compilation-cache),
and more specifically the instructions for use on
[Google Cloud](https://jax.readthedocs.io/en/latest/persistent_compilation_cache.html#persistent-compilation-cache).
In particular, note that if you would like to make use of a non-local
filesystem, such as Google Cloud Storage, you will need to install
[`etils`](https://github.com/google/etils) (this is not included by default in
the AlphaFold 3 Docker container).


================================================
FILE: fetch_databases.sh
================================================
#!/bin/bash
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

set -euo pipefail

readonly db_dir=${1:-$HOME/public_databases}

for cmd in wget tar zstd ; do
  if ! command -v "${cmd}" > /dev/null 2>&1; then
    echo "${cmd} is not installed. Please install it."
    exit 1
  fi
done

echo "Fetching databases to ${db_dir}"
mkdir -p "${db_dir}"

readonly SOURCE=https://storage.googleapis.com/alphafold-databases/v3.0

echo "Start Fetching and Untarring 'pdb_2022_09_28_mmcif_files.tar'"
wget --quiet --output-document=- \
    "${SOURCE}/pdb_2022_09_28_mmcif_files.tar.zst" | \
    tar --no-same-owner --no-same-permissions \
    --use-compress-program=zstd -xf - --directory="${db_dir}" &

for NAME in mgy_clusters_2022_05.fa \
            bfd-first_non_consensus_sequences.fasta \
            uniref90_2022_05.fa uniprot_all_2021_04.fa \
            pdb_seqres_2022_09_28.fasta \
            rnacentral_active_seq_id_90_cov_80_linclust.fasta \
            nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta \
            rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta ; do
  echo "Start Fetching '${NAME}'"
  wget --quiet --output-document=- "${SOURCE}/${NAME}.zst" | \
      zstd --decompress > "${db_dir}/${NAME}" &
done

wait
echo "Complete"


================================================
FILE: legal/WEIGHTS_PROHIBITED_USE_POLICY-Bahasa-Indonesia.md
================================================
# KEBIJAKAN PENGGUNAAN TERLARANG UNTUK PARAMETER MODEL ALPHAFOLD 3

Terakhir diubah: 2024-11-09

AlphaFold 3 dapat membantu Anda mempercepat riset ilmiah dengan memprediksi
struktur 3D molekul biologis. Google menyediakan Aset AlphaFold tanpa biaya
untuk penggunaan non-komersial tertentu, sesuai dengan pembatasan yang
ditetapkan di bawah. Kebijakan ini menggunakan persyaratan yang sama dengan
[Persyaratan Penggunaan Parameter Model AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_TERMS_OF_USE-Bahasa-Indonesia.md).

**Anda tidak boleh mengakses atau menggunakan, atau mengizinkan orang lain
mengakses atau menggunakan Aset AlphaFold 3:**

1.  **Atas nama organisasi komersial atau sehubungan dengan aktivitas komersial
    apa pun, termasuk riset atas nama organisasi komersial.**

    1.  Artinya, hanya organisasi non-komersial (*yaitu*, universitas,
        organisasi non-profit dan institusi riset, serta lembaga pendidikan,
        jurnalistik, dan pemerintah) yang dapat menggunakan Aset AlphaFold 3
        untuk aktivitas non-komersial mereka. Aset AlphaFold 3 tidak tersedia
        untuk jenis organisasi lainnya, meskipun organisasi tersebut melakukan
        pekerjaan non-komersial.

    2.  Jika Anda adalah peneliti yang berafiliasi dengan organisasi
        non-komersial, Anda dapat menggunakan Aset AlphaFold 3 untuk riset
        terafiliasi non-komersial Anda, dengan syarat Anda bukan organisasi
        komersial atau bertindak atas nama organisasi komersial.

    3.  Anda tidak boleh membagikan Aset AlphaFold 3 kepada organisasi komersial
        mana pun atau menggunakan Aset AlphaFold 3 dengan cara yang akan memberi
        organisasi komersial hak apa pun atas Aset ini. Satu-satunya
        pengecualian adalah menyediakan Output secara publik (termasuk secara
        tidak langsung kepada organisasi komersial) melalui publikasi ilmiah
        atau rilis open source atau menggunakannya untuk mendukung jurnalisme,
        yang masing-masing diizinkan.

2.  **Untuk menyebarkan misinformasi, memberikan pernyataan tidak benar, atau
    menyesatkan pengguna**, termasuk:

    1.  menyediakan informasi palsu atau tidak akurat sehubungan dengan akses ke
        atau penggunaan AlphaFold 3 atau Output oleh Anda, termasuk mengakses
        atau menggunakan Parameter Model atas nama organisasi tanpa memberi tahu
        kami atau mengirimkan permintaan untuk mengakses Parameter Model di mana
        Google telah melarang penggunaan AlphaFold 3 oleh Anda secara
        keseluruhan atau sebagian (termasuk yang disediakan melalui
        [Server AlphaFold](https://alphafoldserver.com/about));

    2.  memberikan pernyataan tidak benar tentang hubungan Anda dengan kami;
        termasuk dengan menggunakan merek dagang, nama dagang, atau logo Google,
        atau menyiratkan dukungan oleh Google tanpa seizin Google - Tidak ada di
        dalam Persyaratan memberikan izin semacam itu;

    3.  memberikan pernyataan tidak benar tentang asal AlphaFold 3 secara
        keseluruhan atau sebagian;

    4.  menyebarkan klaim menyesatkan tentang keahlian atau kemampuan, atau
        terlibat dalam praktik profesional yang tidak sah atau tanpa lisensi,
        khususnya di bidang yang sensitif (misalnya, kesehatan); atau

    5.  membuat keputusan dalam ranah yang memengaruhi hak atau kesejahteraan
        individu atau material (misalnya, layanan kesehatan).

3.  **Untuk melakukan, mempromosikan, atau memfasilitasi aktivitas berbahaya,
    ilegal, atau jahat, termasuk:**

    1.  mempromosikan atau memfasilitasi penjualan, ataupun memberikan petunjuk
        untuk membuat atau mengakses, zat, barang, atau layanan ilegal;

    2.  menyalahgunakan, merugikan, mengganggu, atau mengacaukan layanan apa
        pun, termasuk membuat atau mendistribusikan konten untuk aktivitas
        penipuan atau penyebaran malware;

    3.  membuat atau mendistribusikan konten, termasuk Output, yang menyalahi,
        menyalahgunakan, atau melanggar hak individu atau entitas apa pun
        (termasuk, tetapi tidak terbatas pada hak atas konten yang dilindungi
        hak cipta); atau

    4.  mencoba mengakali, atau dengan sengaja menyebabkan (secara langsung atau
        tidak langsung) AlphaFold 3 untuk bertindak dengan cara yang melanggar
        Persyaratan.

**Anda tidak boleh atau mengizinkan orang lain:**

1.  **Menggunakan Output guna melatih atau membuat model machine learning atau
    teknologi terkait untuk prediksi struktur biomolekuler yang mirip dengan
    AlphaFold 3 ("Model Turunan"),** termasuk melalui distilasi atau metode
    lainnya. Untuk menegaskan, pembatasan penggunaan yang ditetapkan dalam
    Persyaratan akan berlaku sepenuhnya untuk semua Model Turunan yang dibuat
    dengan melanggar Persyaratan.

2.  **Mendistribusikan Output tanpa memberikan pemberitahuan yang jelas bahwa
    apa yang Anda Distribusikan disediakan berdasarkan dan tunduk pada
    [Persyaratan Penggunaan Output AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
    serta tentang modifikasi apa pun yang Anda buat.**

    1.  Artinya, jika Anda menghapus, atau menyebabkan penghapusan (misalnya
        dengan menggunakan perangkat lunak pihak ketiga), pemberitahuan dan
        syarat yang kami berikan saat Anda menghasilkan Output menggunakan
        AlphaFold 3, Anda harus memastikan Distribusi Output berikutnya
        menyertakan salinan
        [Persyaratan Penggunaan Output AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
        dan file teks "Persyaratan Penggunaan yang Mengikat secara Hukum" yang
        berisi pemberitahuan berikut:

        "*Dengan menggunakan informasi ini, Anda menyetujui Persayatan
        Penggunaan Output AlphaFold 3 yang terdapat di
        https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md.*

        *Untuk meminta akses ke parameter model AlphaFold 3, ikuti proses yang
        ditetapkan di https://github.com/google-deepmind/alphafold3. Anda hanya
        dapat menggunakan parameter model ini jika menerimanya langsung dari
        Google. Penggunaannya tunduk pada persyaratan penggunaan yang tersedia
        di
        https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.*"

    1.  Anda tidak boleh menyertakan persyaratan tambahan atau berbeda yang
        bertentangan dengan
        [Persyaratan Penggunaan Output AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

3.  **Mendistribusikan Output, atau mengungkapkan temuan yang didapatkan dari
    penggunaan AlphaFold 3 tanpa mengutip makalah kami**: [Abramson, J et al.
    Accurate structure prediction of biomolecular interactions with AlphaFold
    3.](https://www.nature.com/articles/s41586-024-07487-w). Untuk menegaskan,
    hal ini merupakan persyaratan tambahan selain persyaratan pemberitahuan yang
    ditetapkan di atas.

4.  **Mengakali pembatasan akses terkait Parameter Model, termasuk menggunakan,
    membagikan, atau menyediakan Parameter Model ketika Google belum mengizinkan
    Anda secara tegas untuk melakukan hal tersebut.** Google akan memberikan
    akses ke Parameter Model kepada:

    1.  Anda untuk penggunaan pribadi Anda atas nama organisasi Anda, dimana
        Anda tidak dapat membagikan salinan Parameter Model Anda kepada siapa
        pun; atau

    2.  perwakilan resmi organisasi Anda, dengan kewenangan hukum penuh untuk
        mengikat organisasi tersebut pada Persyaratan ini. Dalam hal ini, Anda
        dapat membagikan salinan Parameter Model milik organisasi tersebut
        kepada karyawan, konsultan, kontraktor, serta agen organisasi
        sebagaimana diizinkan oleh perwakilan tersebut.


================================================
FILE: legal/WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md
================================================
# POLÍTICA DE USO PROHIBIDO DE PARÁMETROS DEL MODELO ALPHAFOLD 3

Última modificación: 9 de noviembre de 2024

AlphaFold 3 puede ayudar a acelerar la investigación científica, ya que predice
la estructura 3D de moléculas biológicas. Google pone a disposición los Recursos
de AlphaFold sin costo para determinados usos no comerciales de conformidad con
las restricciones que se establecen a continuación. Esta política usa los mismos
términos definidos que en las
[Condiciones de Uso de los Parámetros del Modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md).

**No debe acceder o utilizar ni permitir que otros accedan o utilicen los
Recursos de AlphaFold 3 en los siguientes casos:**

1.  **En nombre de una organización comercial o en conexión con cualquier
    actividad comercial, incluida la investigación en nombre de organizaciones
    comerciales.**

    1.  Esto significa que solo las organizaciones no comerciales (*por
        ejemplo*, universidades, institutos de investigación y organizaciones
        sin fines de lucro, y organismos educativos, gubernamentales y
        periodísticos) pueden usar los Recursos de AlphaFold 3 para sus
        actividades no comerciales. Los Recursos de AlphaFold 3 no están
        disponibles para ningún otro tipo de organización, aunque realicen
        trabajos no comerciales.

    2.  Si usted es un investigador afiliado de una organización no comercial,
        dado que no pertenece a una organización comercial, puede usar los
        Recursos de AlphaFold 3 para su investigación de afiliación no
        comercial.

    3.  No debe compartir los Recursos de AlphaFold 3 con ninguna organización
        comercial ni usarlos de manera que otorgue a una organización comercial
        algún derecho sobre estos. La única excepción es poner los Resultados a
        disposición del público (lo que incluye indirectamente a las
        organizaciones comerciales) a través de una publicación científica o una
        publicación de código abierto, o utilizarlos para apoyar la actividad
        periodística, opciones que están todas permitidas.

2.  **Para desinformar, tergiversar o engañar, entre lo que se incluye lo
    siguiente:**

    1.  proporcionar información falsa o errónea en relación con su acceso o uso
        de AlphaFold 3 o los Resultados, incluido el uso o acceso a los
        Parámetros del Modelo en nombre de una organización sin informarnos o
        enviarnos una solicitud para acceder a los Parámetros del Modelo cuando
        Google le ha prohibido el uso de AlphaFold 3 de forma parcial o total
        (incluido como se pone a disposición a través de
        [AlphaFold Server](https://alphafoldserver.com/about)),

    2.  tergiversar su relación con nosotros, incluido el uso de marcas,
        comerciales, nombres comerciales o logotipos de Google, o sugerir
        recomendación por parte de Google sin el permiso de Google para hacerlo
        (ningún punto de las Condiciones otorga ese permiso)

    3.  tergiversar el origen de AlphaFold 3 de forma parcial o total,

    4.  distribuir declaraciones engañosas sobre experiencia o capacidad, o
        participar en la práctica de cualquier profesión sin autorización o
        licencia, en particular si se trata de áreas sensibles (*p. ej.*, la de
        la salud), o

    5.  tomar decisiones en ámbitos que afectan el bienestar o los derechos
        materiales o individuales (*p. ej.*, atención médica).

3.  **Para realizar, promover o facilitar actividades peligrosas, ilegales o
    maliciosas, entre lo que se incluye lo siguiente:**

    1.  promover o facilitar la venta de sustancias, bienes o servicios
        ilegales, o bien proporcionar instrucciones para sintetizarlos o acceder
        a ellos,

    2.  abusar, interferir, dañar o interrumpir servicios, lo que incluye
        generar o distribuir contenido para actividades engañosas o fraudulentas
        o software malicioso,

    3.  generar o distribuir contenido, incluidos los Resultados, que incumpla,
        se apropie indebidamente o infrinja los derechos de un individuo o una
        entidad (incluidos, sin limitaciones, los derechos de contenido
        protegido por derechos de autor), o

    4.  intentar eludir o causar de forma intencional (directa o indirectamente)
        que AlphaFold 3 actúe de manera que incumpla las Condiciones.

**No debe utilizar ni permitir que otros:**

1.  **Utilicen los Resultados para entrenar o crear modelos de aprendizaje
    automático o tecnología relacionada para la predicción de estructura
    biomolecular similar a la de AlphaFold 3 ("Modelos Derivados"),** lo que
    incluye métodos a través de destilación o de otro tipo. En aras de evitar
    dudas, las restricciones de uso establecidas en las Condiciones se aplicarán
    en su totalidad a cualquier Modelo Derivado que se cree incumpliendo las
    Condiciones.

2.  **Distribuir los Resultados sin brindar un aviso claro de que lo que usted
    Distribuye se proporciona de acuerdo con las
    [Condiciones de Uso de los Resultados de AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
    y cualquier modificación que usted haga.**

    1.  Esto quiere decir que si usted quita o hace que se quiten (por ejemplo,
        con software de terceros) los avisos y las condiciones que
        proporcionamos cuando genera Resultados usando AlphaFold 3, debe
        asegurarse de que cualquier Distribución adicional de los Resultados
        esté acompañada por una copia de las
        [Condiciones de Uso de Resultados de AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
        y un archivo de texto llamado "Condiciones de Uso Legalmente
        Vinculantes" que contenga el siguiente aviso:

        "*Si utiliza esta información, usted acepta las Condiciones de Uso de
        Resultados de AlphaFold 3, que se encuentran en
        https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md.*

        *Para solicitar acceso a los parámetros del modelo AlphaFold 3, siga el
        proceso que se establece en
        https://github.com/google-deepmind/alphafold3. Solo puede usarlos si los
        recibe directamente de Google. El uso está sujeto a las Condiciones de
        Uso disponibles en
        https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.*"

    2.  No debe incluir ninguna condición adicional o diferente que entre en
        conflicto con las
        [Condiciones de Uso de Resultados de AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

3.  **Distribuir Resultados, o divulgar descubrimientos que surjan del uso de
    AlphaFold 3 sin citar nuestro artículo** [Abramson, J et al. Accurate
    structure prediction of biomolecular interactions with AlphaFold 3
    (Predicción precisa de la estructura de las interacciones biomoleculares con
    AlphaFold 3). *Nature*
    (2024)](https://www.nature.com/articles/s41586-024-07487-w). En aras de
    evitar dudas, este es un requisito adicional a los requisitos de aviso que
    se establecen más arriba.

4.  **Eludir las restricciones de acceso relacionadas con los Parámetros del
    Modelo, lo que incluye utilizar, compartir o poner a disponibilidad los
    Parámetros del Modelo cuando no recibió autorización expresa por parte de
    Google para hacerlo.** Google otorgará acceso a los Parámetros del Modelo a:

    1.  Usted para su uso individual o para usarlos en nombre de su
        organización, en cuyo caso no puede compartir su copia de los Parámetros
        del Modelo con nadie más, o

    2.  Un representante autorizado de su organización con autoridad legal total
        para obligar a esa organización con estas Condiciones (en cuyo caso
        usted podrá compartir la copia de los Parámetros del Modelo de esa
        organización con empleados, consultores, contratistas y agentes de la
        organización, según lo autorizado por ese representante)


================================================
FILE: legal/WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md
================================================
# POLITIQUE D'UTILISATION INTERDITE DES PARAMÈTRES DU MODÈLE ALPHAFOLD 3

Dernière modification: 2024-11-09

AlphaFold 3 peut vous aider à accélérer la recherche scientifique en prévoyant
la structure 3D des molécules biologiques. Pour certaines utilisations non
commerciales, Google met gratuitement à disposition les Éléments d'AlphaFold
dans le respect des restrictions énoncées ci-dessous. Cette politique utilise
les mêmes conditions d'utilisation telles que définies dans les
[Conditions d'utilisation des paramètres du modèle AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md).

**Vous ne devez pas accéder aux Éléments d'AlphaFold 3 ni les utiliser ou
permettre à d'autres personnes de le faire:**

1.  **Au nom d'une organisation commerciale ou en connexion avec des activités
    commerciales, y compris la recherche au nom d'organisations commerciales.**

    1.  Cela signifie que seules les organisations non commerciales (*c.-à-d*.
        universités, organismes sans but lucratif, instituts de recherche et
        organismes éducatifs, journalistiques et gouvernementaux) peuvent
        utiliser les Éléments d'AlphaFold 3 dans le cadre de leurs activités non
        commerciales. Les Éléments AlphaFold 3 ne sont pas offerts à d'autres
        types d'organisations, même si elles effectuent des travaux non
        commerciaux.

    2.  Si vous êtes un chercheur affilié à une organisation non commerciale, à
        la condition que **vous ne soyez pas une organisation commerciale ou que
        vous n'agissez pas au nom d'une organisation commerciale**, vous pouvez
        utiliser les Éléments AlphaFold 3 pour vos recherches affiliées non
        commerciales.

    3.  Vous ne devez pas partager les Éléments d'AlphaFold 3 avec une
        organisation commerciale ni les utiliser d'une manière qui confère à une
        organisation commerciale des droits sur ces éléments. La seule exception
        est la mise à disposition publique des Résultats (y compris
        indirectement à des organisations commerciales) par le biais d'une
        publication scientifique ou d'une version open source, ou l'utilisation
        de ces résultats pour soutenir le journalisme, qui sont toutes deux
        autorisées.

2.  **Pour désinformer ou déformer ou induire en erreur**, y compris:

    1.  fournir des informations fausses ou inexactes concernant votre accès à
        AlphaFold 3 ou à ses Résultats, ou à l'utilisation de ceux-ci, y compris
        l'accès aux Paramètres du modèle ou l'utilisation de ceux-ci au nom
        d'une organisation sans nous en informer ou sans soumettre une demande
        d'accès aux Paramètres du modèle lorsque Google a interdit l'utilisation
        d'AlphaFold 3 en totalité ou en partie (y compris tel que mis à
        disposition par le biais du
        [Serveur d'AlphaFold](https://alphafoldserver.com/about));

    2.  présenter de manière inexacte votre relation avec nous, y compris en
        utilisant les marques de commerce, les noms commerciaux et les logos de
        Google ou en suggérant l'approbation de Google sans son autorisation.
        Rien dans les présentes Conditions ne permet d'accorder une telle
        autorisation;

    3.  présenter de manière inexacte l'origine d'AlphaFold 3, en tout ou en
        partie;

    4.  distribuer des déclarations trompeuses quant au savoir-faire ou aux
        capacités, ou exercer une activité professionnelle sans autorisation ou
        sans licence, en particulier dans des domaines sensibles (*p. ex.* les
        soins de santé); ou

    5.  prendre des décisions dans des domaines qui touchent les droits
        matériels ou individuels ou le bien-être (*p. ex.* les soins de santé).

3.  **Pour effectuer ou faciliter des activités dangereuses, illégales ou
    malveillantes**, y compris:

    1.  la promotion ou l'aide à la vente, ou la fourniture d'instructions pour
        synthétiser ou accéder à des substances, des biens ou des services
        illégaux, ou l'accès à ces derniers;

    2.  abuser, nuire, interférer ou perturber tout service, y compris en
        générant ou en distribuant du contenu pour des activités trompeuses ou
        frauduleuses ou pour des logiciels malveillants;

    3.  générer ou distribuer tout contenu, y compris des Résultats, qui
        enfreigne, détourne ou viole de toute autre manière les droits d'un
        individu ou d'une entité (y compris, mais sans s'y limiter, les droits
        sur les contenus protégés par des droits d'auteur); ou

    4.  tenter de contourner, ou causer intentionnellement (directement ou
        indirectement) AlphaFold 3 à agir d'une manière qui contrevient aux
        Conditions.

**Vous ne devez pas, et vous ne devez pas permettre aux autres:**

1.  **D'utiliser les Résultats pour entraîner ou créer des modèles
    d'apprentissage automatique ou une technologie connexe pour la prédiction de
    la structure biomoléculaire semblable à AlphaFold 3 (« Modèles dérivés »)**,
    y compris par distillation ou d'autres méthodes. Pour éviter le doute, les
    restrictions d'utilisation énoncées dans les présentes Conditions
    s'appliquent intégralement à tout Modèle dérivé créé en violation des
    présentes Conditions.

2.  **De Distribuer les Résultats sans indiquer clairement que ce que vous
    Distribuez est fourni dans le cadre et sous réserve des
    [Conditions d'utilisation des résultats d'AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
    et de toutes les modifications que vous y apportez.**

    1.  Cela signifie que si vous retirez, ou faites retirer (par exemple en
        utilisant un logiciel tiers), les avis et les conditions d'utilisation
        que nous fournissons lorsque vous générez des Résultats à l'aide
        d'AlphaFold 3, vous devez vous assurer que toute Distribution ultérieure
        de Résultats est accompagnée d'une copie des
        [Conditions d'utilisation des résultats d'AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
        et d'un fichier texte des « Conditions d'utilisation légalement
        contraignantes » qui contient l'avis suivant:

        « *En utilisant cette information,vous acceptez les Conditions
        d'utilisation des résultats d'AlphaFold 3 qui se trouve à l'adresse
        https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md.*

        *Pour demander l'accès aux paramètres du modèle AlphaFold 3, suivez le
        processus décrit à l'adresse
        https://github.com/google-deepmind/alphafold3. Vous ne pouvez les
        utiliser que si vous les recevez directement de Google. L'utilisation
        est soumise aux conditions d'utilisation disponibles à l'adresse
        https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.*
        »

    2.  Vous ne devez pas inclure de conditions d'utilisation supplémentaires ou
        différentes qui seraient en contradiction avec les
        [Conditions d'utilisation des résultats d'AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

3.  **De Distribuer les Résultats ou de divulguer les résultats découlant de
    l'utilisation d'AlphaFold 3 sans citer notre article:** « [Abramson, J et
    al. Accurate structure prediction of biomolecular interactions with
    AlphaFold 3. *Nature*
    (2024)](https://www.nature.com/articles/s41586-024-07487-w) ». Pour éviter
    toute ambiguïté, il s'agit d'une exigence supplémentaire par rapport aux
    exigences de notification énoncées ci-dessus.

4.  **De contourner les restrictions d'accès relatives aux Paramètres du modèle,
    y compris l'utilisation, le partage ou la mise à disposition des Paramètres
    du modèle alors que vous n'y avez pas été expressément autorisé par
    Google.** Google accordera l'accès aux Paramètres du modèle à soit:

    1.  vous, pour votre utilisation individuelle au nom de votre organisation,
        auquel cas vous ne pouvez pas partager votre copie des Paramètres du
        modèle avec quelqu'un d'autre; ou

    2.  un représentant autorisé de votre organisation, disposant de la pleine
        autorité légale pour lier cette organisation aux présentes Conditions,
        auquel cas vous pouvez partager la copie des Paramètres du modèle de
        cette organisation avec les employés, les consultants, les entrepreneurs
        et les agents de l'organisation, tel qu'autorisé par ce représentant.


================================================
FILE: legal/WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md
================================================
# POLÍTICA DE USO PROIBIDO DOS PARÂMETROS DO MODELO ALPHAFOLD 3

Última modificação: 2024-11-09

O AlphaFold 3 ajuda você a acelerar pesquisas científicas ao prever a estrutura
3D de moléculas biológicas. O Google disponibiliza os Recursos do AlphaFold sem
custo financeiro para certos usos não comerciais, de acordo com as restrições
abaixo. Esta política usa os mesmos termos definidos nos
[Termos de Uso dos Parâmetros do Modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md).

**Você não deve acessar, usar nem permitir que outras pessoas acessem ou usem os
Recursos do AlphaFold 3 nos seguintes casos:**

1.  **Em nome de uma organização comercial ou em associação a atividades
    comerciais, incluindo pesquisas em nome de organizações comerciais.**

    1.  Isso significa que apenas organizações não comerciais (*ou seja*,
        universidades, organizações sem fins lucrativos, institutos de pesquisa
        e órgãos governamentais, educacionais e de notícias) podem usar os
        Recursos do AlphaFold 3 para suas atividades não comerciais. Os Recursos
        do AlphaFold 3 não estão disponíveis para qualquer outro tipo de
        organização, mesmo as que conduzem trabalhos não comerciais.

    2.  Se você for um pesquisador afiliado a uma organização não comercial,
        você tem permissão para usar esses recursos em sua pesquisa afiliada a
        organizações sem fins lucrativos, desde que você não seja uma
        organização comercial nem esteja agindo em nome de uma.

    3.  É proibido compartilhar os Recursos do AlphaFold 3 com qualquer
        organização comercial ou usar os Recursos do AlphaFold 3 de modo a
        conceder a uma organização comercial qualquer direito em relação a eles.
        A única exceção é a disponibilização da Saída para o público (incluindo
        indiretamente para organizações comerciais) mediante uma publicação
        científica, versão de código aberto ou em apoio ao jornalismo, o que é
        permitido.

2.  **Para gerar desinformação, deturpar ou enganar**, incluindo:

    1.  fornecer informações falsas ou imprecisas em relação ao seu acesso ou
        uso do AlphaFold 3 ou da Saída gerada, incluindo acessar ou usar os
        Parâmetros do Modelo em nome de uma organização sem nos informar ou
        solicitar o acesso aos Parâmetros do Modelo caso o Google tenha proibido
        totalmente ou parcialmente seu uso do AlphaFold 3 (incluindo conforme
        disponibilizado pelo
        [Servidor do AlphaFold](https://alphafoldserver.com/about));

    2.  deturpar sua relação conosco, incluindo ao usar marcas registradas,
        nomes comerciais e logotipos do Google, ou sugerir o endosso do Google
        sem a nossa permissão – nada nestes Termos concede tal permissão;

    3.  deturpar a origem do AlphaFold 3 total ou parcialmente;

    4.  distribuir declarações enganosas sobre conhecimento ou capacidade, ou
        participar do exercício não autorizado ou não licenciado de qualquer
        profissão, especialmente em áreas sensíveis (*por exemplo*, saúde); ou

    5.  tomar decisões em áreas que afetam o bem-estar ou direitos materiais ou
        individuais (*por exemplo*, saúde).

3.  **Para realizar, promover ou facilitar atividades perigosas, ilegais ou
    maliciosas**, incluindo:

    1.  promover ou facilitar a venda ou fornecer instruções para sintetizar ou
        ter acesso a substâncias, produtos ou serviços ilegais;

    2.  abusar, prejudicar, interferir ou interromper quaisquer serviços,
        incluindo gerar ou distribuir conteúdo para atividades enganosas ou
        fraudulentas ou malware;

    3.  gerar ou distribuir qualquer conteúdo, incluindo a Saída, que infrinja,
        se aproprie indevidamente ou viole de outra forma os direitos de
        qualquer indivíduo ou entidade (incluindo, mas não se limitando a
        direitos autorais do conteúdo); ou

    4.  tentar burlar ou levar intencionalmente (direta ou indiretamente) o
        AlphaFold 3 a agir de maneira que viole os Termos.

**Não é permitido que você nem outras pessoas:**

1.  **Usem os Resultados para treinar ou criar modelos de aprendizado de máquina
    ou tecnologias relacionadas para previsão de estrutura biomolecular
    semelhante ao AlphaFold 3 ("Modelos Derivados"),** incluindo pela destilação
    ou outros métodos. Para evitar dúvidas, as restrições de uso definidas nos
    Termos são totalmente válidas para quaisquer Modelos Derivados criados em
    violação dos Termos.

2.  **Distribuam a Saída sem apresentar aviso evidente de que o que você
    Distribui é oferecido de acordo com e sujeito aos
    [Termos de Uso dos Resultados do AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
    e quaisquer modificações realizadas.**

    1.  Isso significa que, se você remover ou causar a remoção (por exemplo,
        usando um software de terceiros) dos avisos e termos que fornecemos
        quando você gera Resultados usando o AlphaFold 3, você precisa garantir
        que a Distribuição da Saída posterior esteja acompanhada de uma cópia
        dos
        [Termos de Uso dos Resultados do AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md)
        e de um arquivo de texto "Termos de Uso Juridicamente Vinculativos" com
        o seguinte aviso:

        "*Ao usar estas informações, você concorda com os Termos de Uso da Saída
        do AlphaFold 3 disponíveis em
        https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md.*

        *Para solicitar acesso aos parâmetros do modelo AlphaFold 3, siga o
        processo descrito em https://github.com/google-deepmind/alphafold3. Você
        só pode usar os parâmetros se os receber diretamente do Google. O uso
        está sujeito aos Termos de Uso disponíveis em
        https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.*"

    2.  É proibido incluir quaisquer termos adicionais ou diferentes que entrem
        em conflito com os
        [Termos de Uso da Saída do AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

3.  **Distribuam a Saída ou divulguem descobertas provenientes do uso do
    AlphaFold 3 sem citar nosso artigo:** [Abramson, J et al. Accurate structure
    prediction of biomolecular interactions with AlphaFold 3. *Nature*
    (2024)](https://www.nature.com/articles/s41586-024-07487-w). Para evitar
    dúvidas, esse é um requisito adicional às exigências de aviso definidas
    acima.

4.  **Burlem as restrições de acesso relacionadas aos Parâmetros do Modelo,
    incluindo usar, compartilhar ou disponibilizar os Parâmetros do Modelo sem
    autorização explícita do Google.** O Google concederá acesso aos Parâmetros
    do Modelo a:

    1.  você, para uso individual em nome da sua organização, sendo proibido
        compartilhar sua cópia dos Parâmetros do Modelo com qualquer indivíduo;
        ou

    2.  um representante autorizado da sua organização, com autoridade legal
        total para vincular tal organização a estes Termos, sendo permitido
        compartilhar a cópia dos Parâmetros do Modelo pertencente a essa
        organização com funcionários, consultores, prestadores de serviço e
        agentes da organização, conforme autorizado por esse representante.


================================================
FILE: legal/WEIGHTS_TERMS_OF_USE-Bahasa-Indonesia.md
================================================
# PERSYARATAN PENGGUNAAN PARAMETER MODEL ALPHAFOLD 3

Terakhir diubah: 09-11-2024

[AlphaFold 3](https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/)
adalah model AI yang dikembangkan oleh
[Google DeepMind](https://deepmind.google/) dan
[Isomorphic Labs](https://www.isomorphiclabs.com/). Program ini membuat prediksi
struktur 3D molekul biologis, serta memberikan keyakinan model untuk prediksi
struktur tersebut. Kami membuat parameter model terlatih dan output yang
dihasilkan menggunakan aset yang tersedia tanpa biaya untuk penggunaan
non-komersial tertentu, sehubungan dengan persyaratan penggunaan ini dan
[Kebijakan Penggunaan Terlarang untuk Parameter Model AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Bahasa-Indonesia.md).

**Hal penting yang perlu diketahui saat menggunakan parameter dan output model
AlphaFold 3**

1.  Parameter dan output model AlphaFold 3 hanya tersedia untuk penggunaan
    non-komersial oleh, atau atas nama, organisasi non-komersial (*yaitu*
    universitas, organisasi nonprofit dan institusi riset, serta lembaga
    pendidikan, jurnalistik, dan pemerintah). Jika Anda adalah peneliti yang
    berafiliasi dengan organisasi non-komersial, dengan syarat Anda bukan
    organisasi komersial atau bertindak atas nama organisasi komersial, artinya
    Anda dapat menggunakannya untuk riset terafiliasi non-komersial Anda.
2.  Anda tidak boleh menggunakan atau mengizinkan orang lain menggunakan:
    1.  Parameter atau Output model AlphaFold 3 sehubungan dengan aktivitas
        komersial apa pun, termasuk riset atas nama organisasi komersial; atau
    1.  Output AlphaFold 3 untuk melatih model machine learning atau teknologi
        terkait untuk prediksi struktur biomolekuler yang mirip dengan AlphaFold
        3
3.  Anda *tidak boleh* mempublikasikan atau membagikan parameter model AlphaFold
    3, kecuali membagikannya dalam organisasi Anda sesuai dengan Persyaratan
    ini.
4.  Anda *dapat* mempublikasikan, membagikan, dan mengadaptasi *output*
    AlphaFold 3 sesuai dengan Persyaratan ini, termasuk persyaratan untuk
    memberikan pemberitahuan yang jelas atas setiap modifikasi yang Anda buat
    dan bahwa penggunaan yang sedang berlangsung atas output AlphaFold 3 dan
    turunannya tunduk pada
    [Persyaratan Penggunaan Output AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

Dengan menggunakan, mereproduksi, memodifikasi, menjalankan, mendistribusikan,
atau menampilkan bagian atau elemen apa pun dari Parameter Model (sebagaimana
didefinisikan di bawah) atau menyetujui persyaratan perjanjian ini, Anda setuju
untuk terikat oleh (1) persyaratan penggunaan ini, dan (2)
[Kebijakan Penggunaan Terlarang untuk Parameter Model AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Bahasa-Indonesia.md)
yang disertakan di sini sebagai referensi (secara kolektif disebut
"**Persyaratan**"), dalam setiap kasus (a) sebagaimana diubah dari waktu ke
waktu sesuai dengan Persyaratan, serta (b) antara Anda dan (i) Google Ireland
Limited, jika Anda berasal dari negara di Wilayah Ekonomi Eropa atau Swiss, atau
(ii) Google LLC, jika Anda berasal dari wilayah lain.

Anda mengonfirmasi bahwa Anda berwenang baik secara eksplisit maupun implisit
untuk masuk, dan sedang memasuki, ke dalam Persyaratan ini sebagai karyawan yang
mewakili, atau atas nama, organisasi Anda.

Harap baca Persyaratan ini dengan cermat. Persyaratan ini menetapkan apa yang
dapat Anda harapkan dari kami saat Anda mengakses dan menggunakan Aset AlphaFold
3 (sebagaimana di definisikan di bawah), dan apa yang Google harapkan dari Anda.
Penyebutan "**Anda**" di sini mengacu pada individu atau organisasi yang
menggunakan Aset AlphaFold 3. Penyebutan "**kami**", "**kita**", atau
"**Google**" di sini mengacu pada entitas milik grup perusahaan Google, yaitu
Google LLC beserta afiliasinya.

## 1. Definisi Penting

Sebagaimana digunakan dalam Persyaratan ini:

"**AlphaFold 3**" adalah: (a) kode sumber AlphaFold 3 yang disediakan
[di sini](https://github.com/google-deepmind/alphafold3/) dan yang dilisensikan
berdasarkan persyaratan lisensi Creative Commons
Attribution-NonCommercial-Sharealike 4.0 International (CC-BY-NC-SA 4.0) dan
kode sumber turunan apa pun, serta (b) Parameter Model.

"**Aset AlphaFold 3**" adalah Parameter dan output Model.

"**Distribusi**" atau "**Mendistribusikan**" adalah mengirimkan,
mempublikasikan, atau membagikan Output secara publik atau kepada orang lain.

"**Parameter Model**" adalah bobot dan parameter model terlatih yang disediakan
oleh Google bagi organisasi (atas pertimbangannya sendiri) untuk digunakan
sesuai dengan Persyaratan ini, bersama dengan (a) modifikasi pada bobot dan
parameter tersebut, (b) pekerjaan yang didasarkan pada bobot dan parameter
tersebut, atau (c) kode atau model machine learning lainnya yang menggabungkan,
seluruh atau sebagian, bobot dan parameter tersebut.

"**Output**" adalah prediksi struktur serta semua informasi tambahan dan
informasi terkait yang disediakan oleh AlphaFold 3 atau penggunaan Parameter
Model, bersama dengan representasi visual, prediksi komputasional, deskripsi,
modifikasi, salinan, atau adaptasi apa pun yang secara substansial berasal dari
Output.

"**Termasuk**" adalah "**termasuk, tetapi tidak terbatas pada**".

## 2. Mengakses dan menggunakan Aset AlphaFold 3

Dengan tunduk pada kepatuhan Anda terhadap Persyaratan, termasuk
[Kebijakan Penggunaan Terlarang untuk Parameter Model AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Bahasa-Indonesia.md),
Anda dapat mengakses, menggunakan, dan memodifikasi Aset AlphaFold 3 serta
Mendistribusikan Output sebagaimana ditetapkan dalam Persyaratan ini. Kami
memberi Anda lisensi non-eksklusif, bebas royalti, dapat dibatalkan, tidak dapat
dipindahtangankan, dan tidak dapat disublisensikan (kecuali secara tegas
diizinkan dalam Persyaratan ini) untuk hak atas kekayaan intelektual apa pun
yang kami miliki dalam Aset AlphaFold sejauh diperlukan untuk tujuan ini. Untuk
memverifikasi akses dan penggunaan AlphaFold 3 oleh Anda, kami dapat meminta
Anda memberikan informasi tambahan dari waktu ke waktu, termasuk verifikasi
nama, organisasi, serta informasi identitas Anda lainnya.

Dengan mengakses, menggunakan, atau memodifikasi Aset AlphaFold 3,
Mendistribusikan Output, atau meminta akses ke Parameter Model, Anda menyatakan
dan menjamin bahwa (a) Anda memiliki kuasa dan wewenang penuh untuk menyetujui
Persyaratan ini (termasuk telah berusia dewasa), (b) Google sebelumnya tidak
pernah menghentikan akses dan hak Anda untuk menggunakan AlphaFold 3 (termasuk
yang disediakan melalui [Server AlphaFold](https://alphafoldserver.com/about))
karena pelanggaran Anda terhadap persyaratan penggunaan yang berlaku, (c)
menyetujui atau menjalankan hak dan kewajiban Anda berdasarkan Persyaratan ini
tidak akan melanggar hak pihak ketiga mana pun atau perjanjian yang Anda
sepakati dengan pihak ketiga, (d) informasi apa pun yang Anda berikan ke Google
sehubungan dengan AlphaFold 3, termasuk (jika berlaku) untuk meminta akses ke
Parameter Model, sudah benar dan aktual, serta (e) Anda bukan (i) berstatus
warga dari negara yang diembargo, (ii) berstatus menetap di negara yang
diembargo Amerika Serikat, atau (iii) dinyatakan dilarang oleh program sanksi
dan kontrol ekspor yang berlaku untuk mengakses, menggunakan, atau memodifikasi
Aset AlphaFold 3.

Jika Anda memilih untuk memberikan masukan ke Google, seperti saran untuk
meningkatkan kualitas AlphaFold 3, Anda setuju bahwa informasi tersebut tidak
bersifat rahasia dan eksklusif, serta Google dapat menindaklanjuti masukan Anda
tanpa kewajiban kepada Anda.

## 3. Pembatasan Penggunaan

Anda tidak boleh menggunakan Aset AlphaFold 3 apa pun:

1.  untuk penggunaan terbatas yang ditetapkan dalam
    [Kebijakan Penggunaan Terlarang untuk Parameter Model AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Bahasa-Indonesia.md);
    atau
2.  dengan cara yang melanggar hukum dan peraturan yang berlaku.

Selama diizinkan oleh hukum dan tanpa membatasi hak kami lainnya, Google berhak
mencabut hak penggunaan Anda, dan (selama memungkinkan) membatasi penggunaan
Aset AlphaFold 3 apa pun yang menurut Google secara wajar melanggar Persyaratan
ini.

## 4. Output yang Dihasilkan

Meskipun Anda harus mematuhi Persyaratan ini saat menggunakan Aset AlphaFold 3,
kami tidak akan mengklaim kepemilikan atas Output orisinal yang Anda hasilkan
menggunakan AlphaFold 3. Namun, Anda memahami bahwa AlphaFold 3 dapat
menghasilkan Output yang sama atau mirip untuk beberapa pengguna, termasuk
Google, dan kami berhak mengklaim Output tersebut.

## 5. Perubahan pada Aset AlphaFold 3 atau Persyaratan ini

Google dapat menambahkan atau menghapus fungsi atau fitur Aset AlphaFold 3 kapan
saja dan dapat berhenti menawarkan akses ke Aset AlphaFold 3 sepenuhnya.

Google dapat memperbarui Persyaratan ini dan mekanisme akses untuk Parameter
Model kapan saja. Kami akan memposting setiap perubahan pada Persyaratan
[di repositori GitHub AlphaFold 3](https://github.com/google-deepmind/alphafold3).
Perubahan umumnya akan berlaku 14 hari setelah diposting. Namun, perubahan yang
berkaitan dengan fungsi atau yang dibuat karena alasan hukum akan langsung
berlaku.

Anda harus meninjau Persyaratan ini setiap kali kami memperbaruinya atau saat
Anda menggunakan Aset AlphaFold 3. Jika Anda tidak menyetujui perubahan pada
Persyaratan, Anda harus segera menghentikan penggunaan Aset AlphaFold 3.

## 6. Menangguhkan atau menghentikan hak Anda untuk menggunakan Aset AlphaFold 3

Google dapat sewaktu-waktu menangguhkan atau menghentikan hak Anda untuk
menggunakan dan mengakses Aset AlphaFold 3 sebagaimana berlaku karena, antara
lain, kegagalan Anda untuk sepenuhnya mematuhi Persyaratan. Jika Google
menangguhkan atau menghentikan hak Anda untuk mengakses atau menggunakan Aset
AlphaFold 3, Anda harus segera menghapus dan menghentikan penggunaan serta
Distribusi semua salinan Aset AlphaFold 3 yang Anda miliki atau kontrol, dan
Anda dilarang menggunakan Aset AlphaFold 3, termasuk mengajukan permohonan untuk
menggunakan Parameter Model. Google akan berupaya memberikan pemberitahuan
sewajarnya kepada Anda sebelum penangguhan atau penghentian tersebut. Namun,
Anda tidak akan menerima pemberitahuan atau peringatan sebelumnya jika
penangguhan atau penghentian tersebut terjadi karena Anda tidak sepenuhnya
mematuhi Persyaratan atau karena alasan serius lainnya.

Anda tentunya dapat menghentikan penggunaan Aset AlphaFold 3 kapan saja. Jika
Anda berhenti menggunakannya, harap beri tahu kami alasannya (melalui
alphafold@google.com) sehingga kami dapat terus meningkatkan kualitas teknologi
kami.

## 7. Kerahasiaan

Anda setuju untuk tidak mengungkapkan atau menyediakan Informasi Rahasia Google
kepada siapa pun tanpa izin tertulis dari kami sebelumnya. "**Informasi Rahasia
Google**" berarti (a) Parameter Model AlphaFold 3 dan semua software, teknologi,
serta dokumentasi yang terkait dengan AlphaFold 3, kecuali kode sumber AlphaFold
3, dan (b) informasi lain apa pun yang disediakan oleh Google yang ditandai
sebagai rahasia atau umumnya dianggap rahasia berdasarkan penyajian informasi
tersebut. Informasi Rahasia Google tidak mencakup (a) informasi yang sudah Anda
ketahui sebelum Anda mengakses atau menggunakan Aset AlphaFold 3 (termasuk
melalui [Server AlphaFold](https://alphafoldserver.com/about)), (b) yang
terungkap ke publik bukan karena kesalahan Anda (misalnya, pelanggaran Anda
terhadap Persyaratan ini), (c) yang Anda kembangkan sendiri tanpa mengacu pada
Informasi Rahasia Google, atau (d) yang diberikan kepada Anda oleh pihak ketiga
sesuai hukum yang berlaku (Tanpa anda atau pihak ketiga tersebut melanggar
Persyaratan).

## 8. Pernyataan penyangkalan

Tidak ada di dalam Persyaratan membatasi hak apa pun yang tidak dapat dibatasi
berdasarkan hukum yang berlaku atau membatasi tanggung jawab Google kecuali
sebagaimana diizinkan oleh hukum yang berlaku.

**AlphaFold 3 dan Output disediakan "apa adanya", tanpa jaminan atau ketentuan
apa pun, baik tersurat maupun tersirat, termasuk jaminan atau ketentuan tentang
kepemilikan, ketiadaan pelanggaran, kelayakan untuk diperdagangkan, atau
kesesuaian untuk tujuan tertentu. Anda bertanggung jawab sepenuhnya untuk
menentukan kesesuaian penggunaan AlphaFold 3, atau penggunaan atau
pendistribusian Output, dan menanggung semua risiko yang terkait dengan
penggunaan atau pendistribusian tersebut serta pelaksanaan hak dan kewajiban
oleh Anda berdasarkan Persyaratan ini. Anda dan siapa pun yang Anda beri Output
bertanggung jawab sepenuhnya atas Output tersebut serta penggunaannya
selanjutnya.**

**Output merupakan prediksi dengan tingkat keyakinan yang berbeda-beda dan harus
ditafsirkan dengan cermat. Gunakan pertimbangan sebelum mengandalkan,
memublikasikan, mendownload, atau menggunakan AlphaFold 3.**

**AlphaFold 3 dan Output hanya ditujukan untuk pemodelan teoretis. Aset tersebut
tidak dimaksudkan, divalidasi, atau disetujui untuk penggunaan klinis. Anda
tidak boleh menggunakan AlphaFold 3 atau Output untuk tujuan klinis atau
mengandalkannya untuk saran medis atau profesional lainnya. Konten apa pun
terkait topik tersebut hanya diberikan untuk tujuan informasi dan bukan
merupakan pengganti saran dari profesional yang berkualifikasi.**

## 9. Kewajiban

Selama diizinkan hukum yang berlaku, Anda akan melindungi Google serta direktur,
petugas, karyawan, dan kontraktornya terhadap kerugian dari proses hukum pihak
ketiga (termasuk tindakan oleh otoritas pemerintah) yang timbul dari atau
berkaitan dengan penggunaan Aset AlphaFold 3 oleh Anda yang melanggar hukum atau
pelanggaran Anda terhadap Persyaratan. Perlindungan terhadap kerugian ini
mencakup kewajiban atau pengeluaran yang timbul dari klaim, kerugian, kerusakan,
putusan pengadilan, denda, biaya proses pengadilan, dan biaya hukum, kecuali
jika kewajiban atau pengeluaran disebabkan oleh pelanggaran, kelalaian, atau
perbuatan tidak pantas yang disengaja oleh Google. Jika Anda dikecualikan secara
hukum dari tanggung jawab tertentu, termasuk perlindungan terhadap kerugian,
tanggung jawab tersebut tidak berlaku bagi Anda berdasarkan Persyaratan.

Dalam keadaan apa pun, Google tidak akan bertanggung jawab atas ganti rugi tidak
langsung, ganti rugi khusus, ganti rugi insidental, ganti rugi sebagai
peringatan, ganti rugi sebagai akibat, atau ganti rugi penghukuman, atau
hilangnya keuntungan dalam bentuk apa pun sehubungan dengan Persyaratan atau
Aset AlphaFold 3, meskipun Google telah diberi tahu tentang kemungkinan adanya
ganti rugi tersebut. Total kewajiban kumulatif Google untuk semua klaim yang
timbul dari atau sehubungan dengan Persyaratan atau Aset AlphaFold 3, termasuk
karena kelalaiannya sendiri, dibatasi hingga $500.

## 10. Ketentuan lainnya

Secara hukum, Anda memiliki hak tertentu yang tidak dapat dibatasi oleh kontrak
seperti Persyaratan. Persyaratan sama sekali tidak dimaksudkan untuk membatasi
hak tersebut.

Persyaratan merupakan keseluruhan perjanjian kami terkait penggunaan Aset
AlphaFold 3 oleh Anda dan menggantikan perjanjian sebelumnya atau pada saat yang
sama yang menyangkut penggunaan tersebut.

Jika ternyata ada ketentuan dalam Persyaratan yang tidak memiliki kekuatan
hukum, ketentuan lainnya dalam Persyaratan akan tetap berlaku dan memiliki
kekuatan hukum penuh.

## 11. Sengketa

Hukum California akan mengatur semua sengketa yang timbul dari atau berkaitan
dengan Persyaratan atau sehubungan dengan Aset AlphaFold 3. Sengketa ini akan
diselesaikan secara eksklusif di pengadilan federal atau negara bagian Santa
Clara County, California, Amerika Serikat dan Anda serta Google menyetujui
wilayah hukum pribadi di pengadilan tersebut. Jika hukum setempat yang berlaku
mencegah sengketa tertentu diselesaikan di pengadilan California, Anda dan
Google dapat mengajukan sengketa tersebut di pengadilan setempat Anda. Jika
hukum setempat yang berlaku mencegah pengadilan setempat Anda menerapkan hukum
California untuk menyelesaikan sengketa ini, sengketa ini akan diatur oleh hukum
setempat yang berlaku dari negara, negara bagian, atau tempat tinggal Anda yang
lain. Jika Anda menggunakan Aset AlphaFold 3 atas nama organisasi pemerintah
selain organisasi pemerintah federal Amerika Serikat (dengan ketentuan yang
disebutkan sebelumnya akan berlaku selama diizinkan oleh hukum federal),
Persyaratan ini tidak akan berlaku untuk pengadilan dan hukum yang mengatur.

Mengingat sifat riset ilmiah, mungkin perlu waktu beberapa saat hingga
pelanggaran terhadap Persyaratan terlihat jelas. Untuk melindungi Anda, Google,
dan Aset AlphaFold 3, selama diizinkan hukum yang berlaku, Anda setuju bahwa:

1.  klaim hukum apa pun terkait Persyaratan atau Aset AlphaFold 3 dapat diajukan
    hingga:
    1.  tanggal batas waktu berdasarkan hukum yang berlaku untuk mengajukan
        klaim hukum; atau
    2.  dua tahun sejak tanggal Anda atau Google (sebagaimana berlaku)
        mengetahui, atau seharusnya secara wajar mengetahui, fakta yang
        menimbulkan klaim tersebut; dan
2.  Anda dan Google tidak akan memperdebatkan pembatasan, batas waktu,
    penundaan, pelepasan hak, atau sejenisnya dalam upaya untuk menghalangi
    gugatan yang diajukan dalam jangka waktu tersebut.

Semua hak yang tidak secara khusus dan tegas diberikan kepada Anda oleh
Persyaratan menjadi hak milik Google. Penundaan, tindakan, atau kelalaian oleh
Google dalam melaksanakan hak atau upaya hukum apa pun tidak akan dianggap
sebagai pelepasan hak atas pelanggaran terhadap Persyaratan, dan Google secara
tegas memiliki semua hak dan upaya hukum yang tersedia berdasarkan Persyaratan,
hukum, ekuitas, atau lainnya, termasuk upaya hukum yang menyangkut penyelesaian
dengan perintah pengadilan atas setiap ancaman atau pelanggaran nyata terhadap
Persyaratan tanpa perlu membuktikan kerugian yang sebenarnya.


================================================
FILE: legal/WEIGHTS_TERMS_OF_USE-Espanol-Latinoamerica.md
================================================
# CONDICIONES DE USO DE LOS PARÁMETROS DEL MODELO ALPHAFOLD 3

Última modificación: 9 de noviembre de 2024

[AlphaFold 3](https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/)
es un modelo de IA desarrollado por [Google DeepMind](https://deepmind.google/)
y por [Isomorphic Labs](https://www.isomorphiclabs.com/). Genera predicciones de
estructuras 3D de moléculas biológicas, lo que proporciona confianza del modelo
para las predicciones de estructuras. Creamos los parámetros del modelo
entrenado y los resultados generados y los ponemos a disposición sin costo para
determinados usos no comerciales de conformidad con las condiciones de uso y la
[Política de Uso Prohibido de los Parámetros del Modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md).

**Puntos clave para tener en cuenta al usar los parámetros y los resultados del
modelo AlphaFold 3**

1.  Los parámetros y los resultados del modelo AlphaFold 3 solo están
    disponibles para usos no comerciales de organizaciones no comerciales (*es
    decir*, universidades, organizaciones sin fines de lucro, instituciones de
    investigación y organismos educativos, periodísticos y gubernamentales), o
    bien en su nombre. Si usted es un investigador afiliado de una organización
    no comercial, en la medida en que no pertenezca a una organización comercial
    ni actúe en nombre de una, puede usar estos recursos para su investigación
    de afiliación no comercial.
    1.  No debe utilizar ni permitir que otros utilicen AlphaFold 3 ni sus
        parámetros o resultados en los siguientes casos:
    2.  En conexión con cualquier actividad comercial, incluidas investigaciones
        en nombre de organizaciones comerciales
2.  Para entrenar modelos de aprendizaje automático, o bien tecnologías
    relacionadas para la predicción de estructuras biomoleculares, similares a
    AlphaFold 3
3.  No *debe* publicar ni compartir los parámetros del modelo AlphaFold 3,
    excepto dentro de su organización, de acuerdo con estas Condiciones.
4.  Puede publicar, compartir y adaptar los *resultados* de AlphaFold 3 de
    conformidad con estas Condiciones, que incluyen el requisito de brindar un
    aviso claro de que cualquier modificación que haga y el uso continuo de los
    resultados de AlphaFold 3 y sus derivaciones están sujetas a las
    [Condiciones de Uso de los Resultados de AlphaFold](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

Al usar, reproducir, modificar, realizar, distribuir o mostrar cualquier porción
o elemento de los Parámetros del Modelo (como se definen a continuación), o bien
al aceptar las condiciones de este acuerdo, usted se compromete a cumplir con lo
siguiente: (1) estas Condiciones de Uso y (2) la
[Política de Uso Prohibido de los Parámetros del Modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md),
que se incorpora por referencia en este documento (en conjunto, las
"**Condiciones**"), en cada caso, (a) según las modificaciones ocasionales que
se hagan de acuerdo con las Condiciones y (b) entre usted y (i) si es de un país
del Espacio Económico Europeo o Suiza, Google Ireland Limited o (ii) en
cualquier otro caso, Google LLC.

Confirma que tiene la autorización explícita o implícita para celebrar, y está
celebrando, las Condiciones como empleado o de otra manera en nombre de su
organización.

Lea cuidadosamente estas Condiciones. En ellas, se establece lo que usted puede
esperar de nosotros cuando usa los Recursos de AlphaFold 3, como se describen a
continuación, y lo que Google espera de usted. Cuando decimos "**usted**",
hacemos referencia al individuo o la organización que usa los Recursos de
AlphaFold 3. Cuando decimos "**nosotros**" o "**Google**", hacemos referencia a
las entidades que pertenecen al grupo de empresas de Google, que comprende a
Google LLC y sus afiliadas.

## 1. Definiciones clave

Según su uso en estas Condiciones:

"**AlphaFold 3**" significa: (a) el código fuente de AlphaFold 3 disponible
[aquí](https://github.com/google-deepmind/alphafold3/) y con licencia en virtud
de las condiciones de la Atribución/Reconocimiento-NoComercial-CompartirIgual
4.0 Internacional (CC-BY-NC-SA 4.0) de Creative Commons, y cualquier código
fuente derivado, y (b) los Parámetros del Modelo.

"**Recursos de AlphaFold 3**" hace referencia a los Resultados y los Parámetros
del Modelo.

"**Distribución" o "Distribuir**" incluye cualquier transmisión, publicación y
otras instancias en las que se comparten los Resultados de manera pública o a
otra persona.

"**Parámetros del Modelo**" hace referencia a las ponderaciones y los parámetros
del modelo entrenado, que Google pone a disposición para las organizaciones (a
su entera discreción) para su uso de acuerdo con estas Condiciones, junto con
(a) las modificaciones a esas ponderaciones y parámetros, (b) los trabajos
basados en esas ponderaciones y parámetros, o bien (c) otros modelos de
aprendizaje automático y código que incorporan, en su totalidad o en parte,
estos parámetros y ponderaciones.

"**Resultados**" hace referencia a las predicciones de estructura y toda la
información adicional y relacionada que brinda AlphaFold 3 o el uso de los
Parámetros del Modelo, además de toda representación visual, predicción
computacional, descripción, modificación, copia o adaptación que esté
sustancialmente derivada de los Resultados.

"**Lo que incluye**" significa "**incluido, sin limitarse a ello**".

## 2. Acceso y uso de los Recursos de AlphaFold 3

Sujeto al cumplimiento de estas Condiciones, lo que incluye la
[Política de Uso Prohibido de los Parámetros del Modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md),
puede acceder a los Recursos de AlphaFold 3, usarlos y modificarlos, y
Distribuir los Resultados como se define en estas Condiciones. Le otorgamos una
licencia no exclusiva, libre de regalías, revocable, no transferible y no
susceptible de someterse a otras licencias (excepto como se indica expresamente
en estas Condiciones) respecto de cualquier derecho de propiedad intelectual que
tengamos sobre los Recursos de AlphaFold en la medida necesaria para estos
propósitos. Para verificar su acceso a AlphaFold 3 y el uso correspondiente,
podríamos solicitarle ocasionalmente información adicional sobre usted, ya sea
que verifique su nombre, su organización o cualquier otra información
identificatoria.

Al acceder a los Recursos de AlphaFold 3 y usarlos o modificarlos, así como al
Distribuir Resultados o solicitar acceso a los Parámetros del Modelo, manifiesta
y garantiza que (a) tiene plenas facultades y atribuciones para celebrar estas
Condiciones (lo que incluye tener la edad de consentimiento), (b) Google nunca
rescindió en el pasado su acceso a AlphaFold 3 ni su derecho de uso (lo que
incluye su disponibilidad a través de
[AlphaFold Server](https://alphafoldserver.com/about)) debido a su
incumplimiento de las Condiciones de Uso correspondientes, (c) el cumplimiento
de estas Condiciones o el ejercicio de sus derechos y obligaciones no infringirá
ningún acuerdo que tenga con un tercero ni ningún derecho de terceros, (d)
cualquier información que usted proporcione a Google en relación con AlphaFold
3, incluida la necesaria (cuando corresponda) para solicitar acceso a los
Parámetros del Modelo, es correcta y actual, y (e) usted no (i) es residente de
un país bajo embargo, (ii) es residente de un país bajo el embargo de EE.UU. ni
(iii) tiene prohibiciones a través de controles de exportación aplicables y
programas de sanción el acceso a los Recursos de AlphaFold 3, así como su uso y
modificación.

Si decide enviarle comentarios a Google, como sugerencias para mejorar AlphaFold
3, asegura que esa información no es confidencial ni de su propiedad, y que
Google puede actuar respecto de sus comentarios sin tener ninguna obligación con
usted.

## 3. Restricciones de uso

No debe usar ninguno de los Recursos de AlphaFold 3 en los siguientes casos:

1.  Los usos restringidos establecidos en la
    [Política de Uso Prohibido de los Parámetros del Modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Espanol-Latinoamerica.md)

2.  En incumplimiento de las leyes y reglamentaciones aplicables

En el sentido más amplio permitido por la ley y sin limitar ninguno de nuestros
otros derechos, Google se reserva el derecho de revocar su derecho de usar y (en
la medida que sea viable) restringir el uso de cualquiera de los Recursos de
AlphaFold 3 que Google razonablemente cree que infringe estas Condiciones.

## 4. Resultados generados

Aunque debe cumplir con estas Condiciones cuando usa los Recursos de AlphaFold
3, no reclamaremos la propiedad de los Resultados originales que genere usando
AlphaFold 3. Sin embargo, usted reconoce que AlphaFold 3 puede generar los
mismos Resultados, o bien otros similares, para varios usuarios, incluido
Google, y nos reservamos todos nuestros derechos al respecto.

## 5. Cambios en los Recursos de AlphaFold 3 o estas Condiciones

Google podría agregar o quitar funciones de los Recursos de AlphaFold 3 en
cualquier momento, y también podría quitar por completo el acceso a los Recursos
de AlphaFold 3.

Google podría actualizar estas Condiciones y el mecanismo de acceso a los
Parámetros del Modelo en cualquier momento. Publicaremos cualquier modificación
a las Condiciones
[en el repositorio de GitHub de AlphaFold 3](https://github.com/google-deepmind/alphafold3).
En general, los cambios entrarán en vigencia 14 días después de su publicación.
Sin embargo, los cambios relacionados con funciones o realizados por motivos
legales entrarán en vigencia de inmediato.

Debería revisar las Condiciones siempre que realicemos actualizaciones o que use
los Recursos de AlphaFold 3. Si no está de acuerdo con las modificaciones de las
Condiciones, debe dejar de usar los Recursos de AlphaFold 3 de inmediato.

## 6. Suspensión o rescisión de su derecho de uso de los Recursos de AlphaFold 3

Google puede, en cualquier momento, suspender o rescindir su derecho de uso y,
según corresponda, acceso a los Recursos de AlphaFold 3 debido a, entre otros
motivos, su incumplimiento de estas Condiciones. Si Google suspende o rescinde
su derecho de acceso o uso de los Recursos de AlphaFold 3, debe borrarlos y
dejar de usar y Distribuir todas las copias correspondientes que tenga en su
posesión o control, y se le prohibirá usar los Recursos de AlphaFold 3, lo que
incluye el envío de solicitudes para usar los Parámetros del Modelo. Google
tratará de darle un aviso con una antelación razonable antes de cualquier
suspensión o rescisión, pero no se le dará ningún aviso ni advertencia previos
si la suspensión o rescisión se deben a su incumplimiento de las Condiciones o
alguna otra razón grave.

Tenga en cuenta que puede dejar de usar los Recursos de AlphaFold 3 cuando lo
desee. Si los deja de usar, le agradeceríamos saber el motivo (a través de
alphafold@google.com) para que podamos continuar mejorando nuestras tecnologías.

## 7. Confidencialidad

Usted acepta no divulgar ni poner a disposición Información Confidencial de
Google sin obtener nuestro previo consentimiento por escrito. "Información
Confidencial de Google" hace referencia a (a) los Parámetros del Modelo
AlphaFold 3 y todo el software, la tecnología y la documentación relacionada con
AlphaFold 3, excepto el código fuente de AlphaFold 3, y (b) cualquier otra
información que Google ponga a disposición y se marque como confidencial o que
normalmente se consideraría confidencial en las circunstancias en las que se
presenta. La Información Confidencial de Google no incluye (a) información que
usted ya conocía antes de acceder a los Recursos de AlphaFold 3 o de usarlos
(que se incluye a través de
[AlphaFold Server](https://alphafoldserver.com/about)), (b) información que se
comparte de manera pública por una razón que no lo responsabiliza (por ejemplo,
su incumplimiento de las Condiciones), (c) información que usted desarrolló de
manera independiente sin hacer referencia a la Información Confidencial de
Google, o (d) información que recibió de manera legal de parte de un tercero
(sin que usted o ese tercero hayan incumplido las Condiciones).

## 8. Renuncias de responsabilidad

Ninguna disposición de las Condiciones restringe ningún derecho que no pueda
restringirse en función de la ley aplicable ni limita las responsabilidades de
Google, excepto según lo que permite la ley aplicable.

**AlphaFold 3 y los Resultados se brindan "tal cual son", sin garantías de
ningún tipo, ya sean explícitas o implícitas, lo que incluye garantías o
condiciones de titularidad, no incumplimiento, comerciabilidad o adecuación para
un propósito particular. Usted es el único responsable de determinar la
idoneidad del uso de AlphaFold 3, o bien del uso o la distribución de los
Resultados, y asume todos los riesgos asociados con ese uso o distribución y su
ejercicio de los derechos y las obligaciones según estas Condiciones. Usted y
todas las personas con quienes comparta los Resultados serán los únicos
responsables de estos usos y sus usos posteriores.**

**Los Resultados son predicciones con diversos niveles de confianza y deberían
interpretarse con cuidado. Sea prudente antes de basarse en el contenido de
AlphaFold 3, o bien publicarlo, descargarlo o usarlo de cualquier otro modo.**

**AlphaFold 3 y los Resultados deben usarse únicamente para el modelado teórico.
No están pensados, validados ni aprobados para uso clínico. No debe usar
AlphaFold 3 ni los Resultados con fines clínicos, ni basarse en ellos para dar
consejos médicos ni de índole profesional. Cualquier contenido relacionado con
esos temas se proporciona solo con fines informativos y no sustituye el
asesoramiento de un profesional calificado.**

## 9. Responsabilidades

En la medida en que lo permita la legislación aplicable, usted indemnizará a
Google y sus directores, funcionarios, empleados y contratistas por cualquier
procedimiento legal de terceros (incluidas las acciones de las autoridades
gubernamentales) que surja de su uso ilegal de los Recursos de AlphaFold 3 o del
incumplimiento de estas Condiciones. Esta indemnización cubrirá cualquier
responsabilidad o gasto que surja a partir de reclamos, pérdidas, daños,
juicios, multas, costos de litigios y honorarios legales, excepto en la medida
en que una responsabilidad o un gasto sean causados por un incumplimiento,
negligencia o conducta inapropiada voluntaria por parte de Google. Si en su caso
se aplica una exención legal de ciertas responsabilidades, lo que incluye la
indemnización, no deberá hacerse cargo de estas responsabilidades según estas
Condiciones.

En ningún caso Google será responsable de daños indirectos, especiales,
incidentales, ejemplares, resultantes ni punitivos, ni de la pérdida de
ganancias de ningún tipo en conexión con estas Condiciones o los Recursos de
AlphaFold 3, incluso si se le advirtió sobre la posibilidad de dichos daños. La
responsabilidad conjunta de Google por todos los reclamos que surjan en conexión
con estas Condiciones o los Recursos de AlphaFold 3, lo que incluye los que
surjan de su propia negligencia, se limita a USD 500.

## 10. Varios

Por ley, tiene ciertos derechos que no pueden estar limitados por un contrato,
como estas Condiciones. Las Condiciones no tienen la intención de restringir
esos derechos.

Las Condiciones son nuestro acuerdo completo relacionado con su uso de los
AlphaFold 3 y sustituyen cualquier acuerdo anterior o contemporáneo sobre la
materia.

Si cualquier disposición de estas Condiciones resultase inejecutable, el resto
seguirá plenamente en vigencia.

## 11. Disputas

La ley de California regirá todas las disputas que surjan de las Condiciones o
en conexión con los Recursos de AlphaFold 3. Estas disputas se resolverán
exclusivamente en los tribunales federales o estatales del Condado de Santa
Clara, California, EE.UU., y usted y Google aceptan someterse a la jurisdicción
personal de dichos tribunales. En la medida en que la ley local aplicable impida
que ciertas disputas se resuelvan en un tribunal de California, usted y Google
pueden presentarlas en los tribunales locales de su jurisdicción. Si la ley
local aplicable impide que su tribunal local aplique la ley de California para
resolver las disputas, estas se regirán por las leyes locales aplicables de su
país, estado o lugar de residencia. Si usará los Recursos de AlphaFold 3 en
nombre de una organización gubernamental que no sea del gobierno federal de
Estados Unidos (donde se aplican las disposiciones mencionadas anteriormente en
la medida en que la ley federal lo permita), estas Condiciones no se aplicarán
en relación con la ley aplicable y los tribunales.

Dada la naturaleza de la investigación científica, el incumplimiento de las
Condiciones puede tardar algún tiempo en hacerse evidente. Para protegerlo a
usted, y proteger a Google y a los Recursos de AlphaFold 3, en la medida en que
lo permita la ley aplicable, usted acepta lo siguiente:

1.  Cualquier demanda legal relacionada con las Condiciones o los Recursos de
    AlphaFold 3 podrá iniciarse hasta la fecha posterior de lo siguiente:
    1.  la fecha límite que establece la ley aplicable para interponer una
        demanda legal; o
    2.  dos años a partir de la fecha en que usted o Google (según corresponda)
        tomaron conocimiento, o debieron haber tomado conocimiento
        razonablemente, de los hechos que dieron lugar a dicha demanda, y
2.  Ni usted ni Google alegarán prescripción, caducidad, demora, renuncia o
    similares para intentar impedir una acción presentada dentro de ese período.

Todos los derechos que no se le otorguen específica y expresamente en las
Condiciones quedan reservados a Google. Ninguna demora, omisión o acto de Google
en el ejercicio de cualquier derecho o recurso se considerará una renuncia de
cualquier incumplimiento de las Condiciones y Google se reserva expresamente
todos los derechos y recursos disponibles según las Condiciones, la ley, por
acuerdo implícito o de cualquier otro modo, lo que incluye el recurso de medida
cautelar contra cualquier amenaza o hecho de infracción de las Condiciones sin
la necesidad de mostrar daños reales.


================================================
FILE: legal/WEIGHTS_TERMS_OF_USE-Francais-Canada.md
================================================
# CONDITIONS D'UTILISATION DES PARAMÈTRES DU MODÈLE ALPHAFOLD 3

Dernière modification: 2024-11-09

[AlphaFold 3](https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/)
est un modèle d'IA développé par [Google DeepMind](https://deepmind.google/) et
[Isomorphic Labs](https://www.isomorphiclabs.com/). Il génère des prédictions de
structures 3D de molécules biologiques en fournissant la confiance du modèle
pour les prédictions de structures. Pour certaines utilisations non
commerciales, nous mettons gratuitement à disposition les paramètres du modèle
entraîné et les résultats générés à l'aide de ces paramètres, conformément aux
présentes conditions d'utilisation et à la
[Politique d'utilisation interdite des paramètres du modèle AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md).

**Éléments clés à connaître lors de l'utilisation des paramètres du modèle
AlphaFold 3 et les résultats**

1.  Les paramètres du modèle AlphaFold 3 et les résultats sont **uniquement**
    disponibles pour un usage non commercial par des organisations non
    commerciales ou au nom de celles-ci (*c.-à-d.* universités, organismes sans
    but lucratif, instituts de recherche et organismes éducatifs,
    journalistiques et gouvernementaux). Si vous êtes un chercheur affilié à une
    organisation non commerciale, **à la condition que vous ne soyez pas une
    organisation commerciale ou que vous n'agissiez pas au nom d'une
    organisation commerciale**, cela signifie que vous pouvez les utiliser pour
    votre recherche affiliée non commerciale.
2.  Vous **ne devez pas** utiliser ni permettre à d'autres personnes d'utiliser:
    1.  les paramètres du modèle AlphaFold 3 ou les résultats dans le cadre de
        **toute activité commerciale, y compris la recherche au nom
        d'organisations commerciales**; ou
    2.  les résultats d'AlphaFold 3 pour **entraîner des modèles d'apprentissage
        automatique** ou une technologie connexe de **prédiction de structures
        biomoléculaires** semblable à AlphaFold 3.
3.  Vous ***ne devez pas* publier ni partager les paramètres du modèle AlphaFold
    3**, sauf si vous les partagez au sein de votre organisation conformément
    aux présentes Conditions.
4.  Vous ***pouvez* publier, partager ou adapter les *résultats* d'AlphaFold 3**
    conformément aux présentes Conditions, y compris à l'exigence de fournir un
    préavis clair de toute modification que vous apportez et à celle stipulant
    que l'utilisation continue des résultats et des œuvres dérivées d'AlphaFold
    3 est soumise aux
    C[onditions d'utilisation des résultats d'AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

En utilisant, reproduisant, modifiant, exécutant, distribuant ou affichant toute
portion ou tout élément des Paramètres du modèle (comme défini ci-dessous) ou en
acceptant autrement les conditions de ce contrat, vous acceptez d'être lié par
(1) ces conditions d'utilisation et (2) la
[Politique d'utilisation interdite des paramètres du modèle AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md)
qui est incorporée aux présentes par référence (collectivement, les « Conditions
»), dans chaque cas (a) tel que modifié de temps à autre conformément aux
Conditions et (b) entre vous et (i) si vous êtes d'un pays de l'Espace
économique européen ou de la Suisse, Google Ireland Limited, ou (ii) autrement,
Google LLC.

Vous confirmez que vous êtes autorisé, soit explicitement ou implicitement, à
accepter les Conditions et que vous les acceptez, en tant qu'employé ou
autrement, au nom de votre organisation.

Veuillez lire ces Conditions attentivement. Elles établissent ce à quoi vous
pouvez vous attendre de nous lorsque vous accédez aux Éléments d'AlphaFold 3 et
que vous les utilisez (comme défini ci-dessous), et ce à quoi Google s'attend de
vous. Par « **vous** », nous entendons l’individu ou l'organisation qui utilise
les Éléments d'AlphaFold 3. Par « **nous** », « **notre** » ou « **Google** »,
nous entendons les entités qui appartiennent au groupe d'entreprises Google,
c'est-à-dire Google LLC et ses filiales.

## 1. Définitions clés

Telle qu’utilisées dans ces Conditions: \
« **AlphaFold 3** » désigne: (a) le code source d'AlphaFold 3 rendu accessible
[ici](https://github.com/google-deepmind/alphafold3/) et sous les conditions de
la licence « Creative Commons Attribution-NonCommercial-Sharealike 4.0
International (CC-BY-NC-SA 4.0) » ainsi que tout code source d'œuvres dérivées
et (b) les Paramètres du modèle.

« **Éléments d'AlphaFold 3** » signifie les Paramètres du modèle et les
Résultats.

« **Distribution** » ou « **Distribuer** » signifient toute transmission,
publication ou tout autre partage de Résultats effectués publiquement ou avec
une autre personne.

« **Paramètres du modèle** » désigne les poids du modèle entrainé et paramètres
mis à disposition par Google pour les organisations (à sa seule discrétion) pour
leur utilisation conformément à ces Conditions, ainsi que (a) les modifications
apportées à ces poids et paramètres (b) les travaux basés sur ces poids et
paramètres ou (c) tout autre code ou tout autre modèle d'apprentissage
automatique qui intègre, en totalité ou en partie, ces poids et paramètres.

« **Résultats** » désigne les prédictions de structures et toutes les
informations auxiliaires et connexes fournies par AlphaFold 3 ou utilisant les
Paramètres du modèle ainsi que toutes les représentations visuelles, les
prédictions informatiques, les descriptions, les modifications, les copies ou
les adaptations qui sont substantiellement dérivées des Résultats.

« **Y compris** » signifie « **y compris, sans s'y limiter** ».

## 2. Accéder aux Éléments d'AlphaFold 3 et les utiliser

Sous réserve de votre conformité aux Conditions, y compris la
P[olitique d'utilisation interdite des paramètres du modèle AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md),
vous pouvez accéder aux Éléments d'AlphaFold 3, les utiliser et les modifier, et
Distribuer les Résultats comme indiqué dans ces Conditions. Nous vous accordons
une licence non exclusive, libre de redevances, révocable, non transférable et
non susceptible de faire l'objet d'une sous-licence (sauf si expressément permis
dans ces Conditions) sur tout droit de propriété intellectuelle que nous
détenons sur les Éléments d'AlphaFold, dans la mesure nécessaire à ces fins.
Afin de vérifier votre accès à AlphaFold 3 et votre utilisation de celui-ci,
nous pouvons de temps à autre vous demander des informations supplémentaires, y
compris la validation de votre nom, de votre organisation et d'autres
informations d'identification.

En accédant aux Éléments d'AlphaFold 3, en les utilisant ou en les modifiant, en
Distribuant des Résultats ou en demandant l'accès aux Paramètres du modèle, vous
déclarez et garantissez que (a) vous avez les pleins pouvoirs et l'autorité
nécessaire pour accepter ces Conditions (y compris avoir l'âge de consentement
requis) (b) Google n'a jamais précédemment résilié votre accès à AlphaFold 3 ni
votre droit de l'utiliser (y compris au moyen du
[Serveur AlphaFold](https://alphafoldserver.com/about)) en raison de votre
violation des conditions d'utilisation applicables (c) l'acceptation de ces
Conditions ou l'exécution de vos droits et obligations en vertu de ces
Conditions ne violera aucun contrat que vous avez avec un tiers ni aucun droit
d'un tiers (d) toute information que vous fournissez à Google en relation avec
AlphaFold 3, y compris (le cas échéant) pour demander l'accès aux Paramètres du
modèle, est correcte et à jour, et (e) vous n'êtes pas (i) résident d'un pays
soumis à un embargo (ii) habituellement résident d'un pays sous embargo
américain ni (iii) autrement soumis à une interdiction, par les contrôles
d'exportation et les programmes de sanctions applicables, d'accéder aux Éléments
d'AlphaFold 3, de les utiliser ou de les modifier.

Si vous choisissez de donner des commentaires à Google, comme des suggestions
pour améliorer AlphaFold 3, vous vous engagez à ce que ces informations soient
non confidentielles et non propriétaire, et Google pourra agir en fonction de
vos commentaires sans aucune obligation envers vous.

## 3. Restrictions d'utilisation

Vous ne devez pas utiliser les Éléments d'AlphaFold 3:

1.  pour les utilisations restreintes énoncées dans la
    P[olitique d'utilisation interdite des paramètres du modèle AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Francais-Canada.md);
2.  en violation des lois et règlements applicables.

Dans toute la mesure permise par la loi et sans limiter aucun de nos autres
droits, Google se réserve le droit de révoquer votre droit d'utilisation et
(dans la mesure du possible) de restreindre l'utilisation de tout Élément
d'AlphaFold 3 que Google estime raisonnablement être en violation de ces
Conditions.

## 4. Résultats générés

Bien que vous deviez respecter ces Conditions lors de l'utilisation des Éléments
d'AlphaFold 3, nous ne revendiquerons pas la propriété des Résultats d'origine
que vous générez en utilisant AlphaFold 3. Cependant, vous reconnaissez
qu'AlphaFold 3 peut générer les mêmes Résultats ou des Résultats semblables pour
plusieurs utilisateurs, y compris Google, et nous nous réservons tous nos droits
à cet égard.

## 5. Modifications aux Éléments d'AlphaFold 3 ou aux présentes Conditions

Google peut ajouter ou retirer des fonctions ou fonctionnalités des Éléments
d'AlphaFold 3 à tout moment et peut cesser d'offrir l'accès aux Éléments
d'AlphaFold 3.

Google peut mettre à jour ces Conditions et le mécanisme d'accès aux Paramètres
du modèle à tout moment. Nous allons publier toute modification apportée aux
Conditions
[dans le référentiel GitHub d'AlphaFold 3](https://github.com/google-deepmind/alphafold3).
Les modifications entreront généralement en vigueur 14 jours après leur
publication. Cependant, les modifications concernant la fonctionnalité ou celles
apportées pour des raisons juridiques entreront en vigueur immédiatement.

Vous devriez revoir les Conditions chaque fois que nous les mettons à jour ou
que vous utilisez les Éléments d'AlphaFold 3. Si vous n'acceptez pas les
modifications apportées aux Conditions, vous devez cesser d'utiliser les
Éléments d'AlphaFold 3 immédiatement.

## 6. Suspendre ou résilier votre droit d'utiliser les Éléments d'AlphaFold 3

Google peut à tout moment suspendre ou résilier votre droit d'utiliser les
Éléments d'AlphaFold 3 et, le cas échéant, d'y accéder pour différentes raisons,
notamment votre manquement à respecter entièrement les présentes Conditions. Si
Google suspend ou résilie votre droit d'accéder aux Éléments d'AlphaFold 3 ou de
les utiliser, vous devez immédiatement supprimer toutes les copies des Éléments
d'AlphaFold 3 en votre possession ou sous votre contrôle et cesser de les
utiliser et de les Distribuer, et il vous est interdit d'utiliser les Éléments
d'AlphaFold 3, y compris en soumettant une demande pour utiliser les Paramètres
du modèle. Google s'efforcera de vous donner un préavis raisonnable avant toute
suspension ou résiliation, mais aucun avis ni avertissement préalable ne sera
donné si la suspension ou la résiliation est due à votre manquement à respecter
entièrement les présentes Conditions ou à d'autres motifs sérieux.

Bien entendu, vous êtes toujours libre de cesser d'utiliser les Éléments
d'AlphaFold 3. Si vous cessez de les utiliser, nous aimerions savoir pourquoi (à
l'adresse alphafold@google.com) afin de pouvoir continuer à améliorer nos
technologies.

## 7. Confidentialité

Vous acceptez de ne pas divulguer ni rendre disponibles les renseignements
confidentiels de Google à quiconque sans notre consentement écrit préalable. «
**Renseignements confidentiels de Google** » désigne (a) les Paramètres du
modèle AlphaFold 3 et tous les logiciels, la technologie et la documentation en
lien avec AlphaFold 3, excepté le code source d'AlphaFold 3, et (b) toute autre
information mise à disposition par Google qui est marquée comme confidentielle
ou qui serait normalement considérée comme confidentielle dans les circonstances
dans lesquelles elle est présentée. Les Renseignements confidentiels de Google
n'incluent pas (a) les informations que vous connaissiez déjà avant d'accéder
aux Éléments d'AlphaFold 3 ou de les utiliser (y compris au moyen du
[Serveur AlphaFold](https://alphafoldserver.com/about)) (b) qui deviennent
publiques sans que vous en soyez responsable (par exemple, par votre violation
des Conditions) (c) qui ont été développées indépendamment par vous sans
référence aux Renseignements confidentiels de Google ou (d) qui vous ont été
légalement fournies par un tiers (sans violation des Conditions par vous-même ou
par le tiers).

## 8. Clauses de non-responsabilité

Rien dans les Conditions ne restreint les droits qui ne peuvent pas être
restreints en vertu de la loi applicable ni ne limite les responsabilités de
Google, sauf si cela est permis par la loi applicable.

AlphaFold 3 et les Résultats sont fournis « tels quels », sans garantie ni
condition de quelque nature que ce soit, explicite ou implicite, y compris toute
garantie ou condition de titre, d'absence de violation, de qualité marchande ou
d'adéquation avec un usage particulier. Vous êtes seul responsable de déterminer
la légitimité de l'utilisation d'AlphaFold 3 ou celle de l'utilisation et de la
distribution des Résultats, et vous assumez tous les risques liés à une telle
utilisation ou distribution ainsi qu'à l'exercice de vos droits et obligations
en vertu de ces Conditions. Vous et toute personne avec qui vous partagez des
Résultats êtes les seuls responsables de ces utilisations et de celles qui
s’ensuivent.

Les Résultats sont des prédictions avec des niveaux de confiance variables et
doivent être interprétés avec prudence. Faites preuve de discernement avant de
vous fier à AlphaFold 3, de le publier, de le télécharger ou de l’utiliser d'une
autre manière.

AlphaFold 3 et les Résultats sont uniquement destinés à la modélisation
théorique. Ils ne sont pas prévus, validés, ni approuvés pour une utilisation
clinique. Vous ne devez pas utiliser AlphaFold 3 ni les Résultats à des fins
cliniques ni les considérer comme des conseils médicaux ou professionnels. Tout
contenu concernant ces sujets est fourni à titre informatif uniquement et ne
remplace pas les conseils d'un professionnel qualifié.

## 9. Responsabilités

Dans la mesure permise par la loi applicable, vous indemniserez Google et ses
administrateurs, dirigeants, employés et sous-traitants pour toutes poursuites
judiciaires intentées par des tiers (y compris des actions menées par des
autorités gouvernementales) découlant de ou en rapport avec votre utilisation
illégale des Éléments d'AlphaFold 3 ou à votre violation des présentes
Conditions. Cette indemnité couvre toute responsabilité ou charge financière
résultant de réclamations, de pertes, de dommages, de jugements, d'amendes, de
débours et de frais juridiques, sauf dans la mesure où une responsabilité ou une
charge financière est causée par une violation, une négligence ou une inconduite
intentionnelle de Google. Si vous êtes légalement exempté de certaines
responsabilités, y compris l'indemnisation, alors ces responsabilités ne
s'appliquent pas à vous en vertu des présentes Conditions.

Google n'est pas responsable, en aucun cas, des dommages-intérêts indirects,
spéciaux, accessoires, exemplaires, consécutifs ou punitifs ni des pertes de
profits de quelque nature que ce soit en rapport avec les Conditions ou les
Éléments d'AlphaFold 3, même si Google a été informée de la possibilité de tels
dommages. L'obligation globale et totale de Google pour toutes les réclamations
découlant des Conditions ou des Éléments d'AlphaFold 3 ou en lien avec ceux-ci,
y compris pour sa propre négligence, est limitée à 500,00USD.

## 10. Divers

Selon la loi, vous avez certains droits qui ne peuvent pas être limités par un
contrat tel que les Conditions. Les présentes Conditions ne visent aucunement à
restreindre ces droits.

Les Conditions constituent l'intégralité de notre contrat concernant votre
utilisation des Éléments d'AlphaFold 3 et remplacent tous les contrats
antérieurs ou contemporains sur ce sujet.

Si une disposition particulière des présentes Conditions s'avère inapplicable,
le reste des conditions restera en vigueur.

## 11. Contestations

Les lois de la Californie régiront toutes les contestations découlant de ou en
rapport avec ces Conditions ou en lien avec les Éléments d'AlphaFold 3. Ces
contestations seront résolues exclusivement par les tribunaux fédéraux ou
étatiques du comté de Santa Clara, en Californie, aux États-Unis, et vous et
Google consentez à la compétence territoriale de ces tribunaux. Dans la mesure
où la loi locale applicable s'oppose à ce que certaines contestations soient
résolues devant un tribunal de la Californie, vous et Google pouvez les
soumettre à vos tribunaux locaux. Si la loi locale applicable s'oppose à ce que
votre tribunal local applique la loi californienne pour résoudre ces
contestations, elles seront régies par les lois locales applicables de votre
pays, de votre État ou de votre autre lieu de résidence. Si vous utilisez les
Éléments d'AlphaFold 3 au nom d'une organisation gouvernementale autre que les
organisations gouvernementales fédérales américaines (où les dispositions
précédentes s'appliquent dans la mesure permise par la loi fédérale), ces
Conditions seront silencieuses en ce qui concerne la loi applicable et les
tribunaux.

Considérant la nature de la recherche scientifique, il peut s'écouler un certain
temps avant que toute violation des présentes Conditions devienne évidente. \
Dans la mesure permise par la loi applicable, pour vous protéger, Google et les
Éléments d'AlphaFold 3, vous acceptez que:

1.  toute réclamation légale liée aux présentes Conditions ou aux Éléments
    d'AlphaFold 3 peut être intentée jusqu'à la date la plus tardive entre:
    1.  la date limite prévue par la loi applicable pour intenter la réclamation
        légale; ou
    2.  deux années à partir de la date à laquelle vous ou Google (selon le cas)
        avez pris connaissance ou auriez dû raisonnablement prendre connaissance
        des faits à l'origine de cette réclamation; et
2.  vous n'invoquerez pas la limitation, la prescription, le retard, la
    renonciation ou des arguments semblables pour tenter de faire obstacle à une
    action intentée dans ce délai et Google non plus.

Tous les droits qui ne vous sont pas précisément et expressément accordés par
les présentes Conditions sont réservés à Google. Aucun retard, acte ni aucune
omission de la part de Google dans l'exercice d'un droit ou d'un recours ne sera
considéré comme une renonciation à une violation des Conditions, et Google se
réserve expressément tous les droits et recours disponibles en vertu des
Conditions ou de la loi, en équité ou autrement, y compris le recours à une
injonction contre toute menace de violation ou violation réelle des Conditions
sans qu'il soit nécessaire de prouver des dommages réels.


================================================
FILE: legal/WEIGHTS_TERMS_OF_USE-Portugues-Brazil.md
================================================
# TERMOS DE USO DOS PARÂMETROS DO MODELO ALPHAFOLD 3

Última modificação: 2024-11-09

O
[AlphaFold 3](https://blog.google/technology/ai/google-deepmind-isomorphic-alphafold-3-ai-model/)
é um modelo de IA desenvolvido pelo [Google DeepMind](https://deepmind.google/)
e pela [Isomorphic Labs](https://www.isomorphiclabs.com/). Ele gera previsões
sobre a estrutura 3D de moléculas biológicas, apresentando a confiança do
modelo. Disponibilizamos os parâmetros do modelo treinado e as saídas geradas
por ele sem custo financeiro para determinados usos não comerciais, de acordo
com estes Termos de Uso e com a
[Política de uso proibido dos parâmetros do modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md).

**Observações importantes sobre o uso dos parâmetros e das saídas do modelo
AlphaFold 3**

1.  Os parâmetros e as saídas do modelo AlphaFold 3 só estão disponíveis para
    uso não comercial por organizações não comerciais ou em nome delas (*por
    exemplo*, universidades, organizações sem fins lucrativos, institutos de
    pesquisa e órgãos governamentais, educacionais e de notícias). Se você for
    um pesquisador afiliado a uma organização não comercial, você tem permissão
    para usar esses recursos em sua pesquisa afiliada a organizações sem fins
    lucrativos, desde que você não seja uma organização comercial nem esteja
    agindo em nome de uma.
2.  Não use nem permita que outras pessoas usem:
    1.  os parâmetros ou as saídas do modelo AlphaFold 3 em relação a qualquer
        atividade comercial, incluindo a pesquisa em nome de organizações
        comerciais; ou
    2.  a saída do AlphaFold 3 para treinar modelos de aprendizado de máquina ou
        tecnologia relacionada na previsão de estrutura biomolecular semelhante
        ao AlphaFold 3.
3.  Você *não tem permissão* para publicar ou compartilhar os parâmetros do
    modelo AlphaFold 3, exceto compartilhar dentro da sua organização de acordo
    com estes Termos.
4.  Você *tem permissão* para publicar, compartilhar e adaptar as *saídas* do
    AlphaFold 3 de acordo com estes Termos, incluindo os requisitos de oferecer
    aviso claro de quaisquer modificações e de que o uso contínuo das saídas e
    derivados do modelo estão sujeitos aos
    [Termos de Uso das saídas do AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md).

Ao usar, reproduzir, modificar, realizar, distribuir ou exibir qualquer parte ou
elemento dos Parâmetros do modelo (conforme definido abaixo) ou aceitar de outra
forma os termos deste contrato, você concorda em se vincular (1) a estes Termos
de Uso e (2) à
[Política de uso proibido dos parâmetros do modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md),
incorporada aqui como referência (em conjunto, os "**Termos**"), em cada caso
(a) conforme modificado periodicamente de acordo com os Termos e (b) entre você
e (i), se você for de um país no Espaço Econômico Europeu ou da Suíça, a Google
Ireland Limited ou (ii), caso contrário, a Google LLC.

Você confirma que tem autorização explícita ou implícita para celebrar, e está
celebrando, estes Termos como funcionário ou de outro modo em nome da sua
organização.

Leia estes Termos com atenção. Eles definem o que você pode esperar de nós ao
acessar e usar os Recursos do AlphaFold 3 (conforme definido abaixo) e o que o
Google espera de você. "**Você**" significa o indivíduo ou a organização que
está usando os Recursos do AlphaFold 3. "**Nós**", "**nos**" ou "**Google**"
significam as entidades que pertencem ao grupo de empresas do Google, ou seja, a
Google LLC e suas afiliadas.

## 1. Principais definições

Conforme usado nestes Termos:

"**AlphaFold 3**" significa: (a) o código-fonte do AlphaFold 3 disponível
[neste link](https://github.com/google-deepmind/alphafold3/) e licenciado nos
termos da licença Creative Commons Attribution-NonCommercial-Sharealike 4.0
International (CC-BY-NC-SA 4.0), bem como qualquer código-fonte derivado, e (b)
Parâmetros do modelo.

"**Recursos do AlphaFold 3**" significam as Saídas e os Parâmetros do modelo.

"**Distribuição**" ou "**Distribuir**" significam qualquer transmissão,
publicação ou outra forma de compartilhamento das Saídas publicamente ou com
qualquer outra pessoa.

"**Parâmetros do modelo**" significam os pesos e os parâmetros do modelo
treinado disponibilizados pelo Google às organizações (a critério próprio) para
uso de acordo com estes Termos, com (a) modificações nesses pesos e parâmetros,
com (b) trabalhos baseados nesses pesos e parâmetros ou (c) com outros códigos
ou modelos de aprendizado de máquina que incorporam esses pesos e parâmetros na
íntegra ou em partes.

"**Saída**" significa as previsões de estrutura e todas as informações
adicionais e relacionadas que são fornecidas pelo AlphaFold 3 ou usam os
Parâmetros do modelo, com quaisquer representações visuais, previsões
computacionais, descrições, modificações, cópias ou adaptações derivadas
consideravelmente da Saída.

"**Incluindo**" significa "**incluindo, sem limitação**".

## 2. Acesso e uso dos Recursos do AlphaFold 3

Sujeito à sua compliance com os Termos, incluindo a
[Política de uso proibido do AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md),
você pode acessar, usar e modificar os Recursos do AlphaFold 3 e Distribuir as
Saídas conforme definido nestes Termos. Concedemos a você uma licença não
exclusiva, livre de royalties, revogável, intransferível e não sublicenciável
(exceto conforme expressamente permitido nestes Termos) para todos os nossos
direitos de propriedade intelectual dos Recursos do AlphaFold na medida
necessária para esses fins. Para verificar seu acesso e uso do AlphaFold 3,
podemos solicitar informações adicionais periodicamente, incluindo a verificação
do seu nome, organização e outras informações de identificação.

Ao acessar, usar ou modificar os Recursos do AlphaFold 3, Distribuir a Saída ou
solicitar acesso aos Parâmetros do modelo, você declara e garante que (a) tem
total capacidade legal para celebrar estes Termos (incluindo a idade mínima de
consentimento), (b) o Google nunca rescindiu seu acesso e direito de usar o
AlphaFold 3 (incluindo conforme disponibilizado pelo
[Servidor da AlphaFold](https://alphafoldserver.com/about)) devido à sua
violação dos Termos de Uso relevantes, (c) celebrar ou exercer seus direitos e
obrigações de acordo com estes Termos não violará nenhum contrato firmado entre
você e um terceiro ou quaisquer direitos de terceiros, (d) quaisquer informações
que você fornecer ao Google em relação ao AlphaFold 3, incluindo solicitar
acesso aos Parâmetros do modelo (quando aplicável), são verdadeiras e atuais, e
(e) você (i) não é residente de um país embargado, (ii) não é residente
ordinário de um país embargado pelos EUA ou (iii) não tem nenhuma outra
proibição de acessar, usar ou modificar os Recursos do AlphaFold 3 pelos
programas de sanções e controles de exportação aplicáveis.

Ao optar por dar feedback ao Google, como sugestões para melhorar o AlphaFold 3,
você assume que essas informações não são confidenciais nem reservadas, e
poderemos agir de acordo com seu feedback sem qualquer compromisso com você.

## 3. Restrições de uso

Você não tem permissão para usar qualquer Recurso do AlphaFold 3:

1.  para os usos restritos estabelecidos na
    [Política de uso proibido dos Parâmetros do modelo AlphaFold 3](https://github.com/google-deepmind/alphafold3/blob/main/legal/WEIGHTS_PROHIBITED_USE_POLICY-Portugues-Brazil.md);
    ou
2.  em violação das leis e regulamentações aplicáveis.

Até o limite permitido pela legislação e sem limitação de quaisquer outros
direitos, o Google reserva o direito de revogar e (até onde possível) restringir
seu uso de qualquer Recurso do AlphaFold 3 que acreditamos razoavelmente violar
estes Termos.

## 4. Saída gerada

Embora você precise cumprir com estes Termos ao usar os Recursos do AlphaFold 3,
não reivindicaremos propriedade da Saída original que você gerar usando o
AlphaFold 3. No entanto, você reconhece que o AlphaFold 3 pode gerar uma Saída
igual ou semelhante para vários usuários, incluindo o Google, e reservamos todos
os direitos nesse sentido.

## 5. Mudanças nos Recursos do AlphaFold 3 ou nestes Termos

O Google pode adicionar ou remover funcionalidades ou funções dos Recursos do
AlphaFold 3 a qualquer momento e parar de oferecer acesso a elas completamente.

O Google pode atualizar estes Termos e o mecanismo de acesso aos Parâmetros do
modelo a qualquer momento. Quaisquer modificações nestes Termos serão postadas
[no repositório GitHub do AlphaFold 3](https://github.com/google-deepmind/alphafold3).
Geralmente, as alterações entrarão em vigor 14 dias após a postagem. No entanto,
as alterações relacionadas à funcionalidade ou feitas por motivos jurídicos
serão aplicadas imediatamente.

Consulte os Termos sempre que forem atualizados ou você usar os Recursos do
AlphaFold 3. Se você não concordar com quaisquer modificações nos Termos, pare
de usar os Recursos do AlphaFold 3 imediatamente.

## 6. Suspensão ou encerramento do seu direito de usar os Recursos do AlphaFold 3

O Google pode suspender ou encerrar a qualquer momento seu direito de usar e,
conforme aplicável, acessar os Recursos do AlphaFold 3 devido ao não cumprimento
dos Termos, entre outros motivos. Se o Google suspender ou encerrar seu direito
de acessar ou usar os Recursos do AlphaFold 3, você precisará excluir e parar de
usar e Distribuir imediatamente todas as cópias dos Recursos do AlphaFold 3 em
sua posse ou controle. Você não poderá usar os Recursos do AlphaFold 3,
incluindo o envio de um aplicativo para usar os Parâmetros do modelo. O Google
fará o possível para fornecer aviso prévio razoável antes de qualquer suspensão
ou encerramento, mas não daremos nenhum aviso ou alerta com antecedência se a
suspensão ou o encerramento for por não obedecer totalmente aos Termos ou outras
justificativas graves.

Você pode parar de usar os Recursos do AlphaFold 3 a qualquer momento. Nesse
caso, queremos saber o motivo (via alphafold@google.com) para continuarmos
melhorando nossas tecnologias.

## 7. Confidencialidade

Você concorda em não divulgar nem disponibilizar Informações confidenciais do
Google a qualquer pessoa sem nosso consentimento prévio por escrito.
"**Informações confidenciais do Google**" significam (a) os Parâmetros do modelo
e todo software, tecnologia e documentação associados ao AlphaFold 3, exceto
para o código-fonte do AlphaFold 3, e (b) quaisquer outras informações
disponibilizadas pelo Google que foram marcadas como confidenciais ou que seriam
normalmente consideradas assim nas circunstâncias em que são apresentadas. As
Informações confidenciais do Google não incluem (a) informações que você já
sabia antes do seu acesso ou uso dos Recursos do AlphaFold 3 (incluindo pelo
[Servidor do AlphaFold](https://alphafoldserver.com/about)), (b) que se tornaram
públicas sem sua culpa (por exemplo, sua violação dos Termos), (c) que foram
desenvolvidas de maneira independente por você sem referência às Informações
confidenciais do Google ou (d) foram fornecidas legalmente a você por um
terceiro (sem que você nem o terceiro violassem os Termos).

## 8. Exoneração de responsabilidade

Os Termos não restringem quaisquer direitos que não possam ser restritos de
acordo com a legislação aplicável nem limitam as responsabilidades do Google,
exceto conforme permitido pela legislação aplicável.

**O AlphaFold 3 e as Saídas são fornecidos no estado em que se encontram, sem
garantias ou condições de qualquer tipo, sejam explícitas ou implícitas,
incluindo quaisquer garantias ou condições de título, comercialidade, adequação
para uma finalidade específica e não violação. Você é a única pessoa responsável
por determinar se o uso do AlphaFold 3, ou uso/distribuição das Saídas, é
adequado e assume qualquer e todo risco associado a esse uso ou distribuição e
ao exercício dos seus direitos e obrigações de acordo com estes Termos. Você e
qualquer pessoa com quem compartilhar as Saídas são exclusivamente responsáveis
por elas e pelos usos subsequentes delas.**

**As Saídas são previsões com níveis variados de confiança e devem ser
interpretadas com cuidado. Tenha cautela antes de confiar, publicar, baixar ou
usar de outra forma o AlphaFold 3.**

**O AlphaFold 3 e as Saídas servem apenas para modelagem teórica. Eles não são
destinados, validados nem aprovados para uso clínico. Não os use para
finalidades clínicas nem conte com eles para aconselhamento médico ou de outra
natureza. Todo conteúdo sobre esses assuntos é fornecido somente para fins
informativos e não substitui a orientação de um profissional qualificado.**

## 9. Responsabilidades

Na medida permitida pela lei, você indenizará o Google e os diretores,
executivos, funcionários e prestadores de serviço dele por qualquer processo
judicial de terceiros (incluindo ações de órgãos do governo) decorrente ou
relacionado ao uso ilegal dos Recursos do AlphaFold ou a violações dos Termos.
Essa indenização cobre qualquer responsabilidade ou despesa decorrente de ações
judiciais, perdas, danos, julgamentos, multas, custos de litígios e honorários
jurídicos, exceto se a responsabilidade ou despesa for causada por violação,
negligência ou má conduta intencional do Google. Se você for passível de isenção
legal de certas responsabilidades, incluindo indenização, essas
responsabilidades não se aplicarão a você de acordo com os Termos.

Em hipótese alguma o Google será responsável por quaisquer danos indiretos,
especiais, incidentais, exemplares, emergentes ou punitivos ou por perdas de
lucros de qualquer tipo em relação aos Termos ou aos Recursos do AlphaFold 3,
mesmo se o Google tiver sido advertido da possibilidade de tais danos. A
responsabilidade agregada total do Google para todas as ações judiciais
decorrentes de ou relacionadas aos Termos ou aos Recursos do AlphaFold 3,
incluindo pela nossa negligência, é limitada a US$ 500.

## 10. Disposições gerais

Por lei, você tem certos direitos que não podem ser limitados por um contrato
como os Termos. Os Termos não têm, de forma alguma, o objetivo de restringir
esses direitos.

Os Termos constituem a integralidade do nosso contrato relacionado ao seu uso
dos Recursos do AlphaFold 3 e substituem quaisquer contratos anteriores ou
contemporâneos sobre esse assunto.

Se uma disposição específica dos Termos não for aplicável, o saldo dos Termos
permanecerá vigente.

## 11. Disputas

As leis da Califórnia vão reger todas as disputas que surgirem com relação aos
Termos ou em relação aos Recursos do AlphaFold 3. Essas disputas serão
resolvidas exclusivamente nos tribunais federais ou estaduais do condado de
Santa Clara, Califórnia, EUA, e você e o Google concordam com a jurisdição
pessoal nesses tribunais. Se a legislação local aplicável impedir que alguma
disputa seja tratada em um tribunal na Califórnia, você e o Google podem entrar
com a petição no seu foro local. Da mesma forma, se a legislação local aplicável
impedir que o tribunal local aplique a lei da Califórnia para resolver essas
disputas, elas serão regidas pelas leis do seu país, estado ou outro local de
residência. Se você usar os Recursos do AlphaFold 3 em nome de uma organização
governamental que não seja do governo federal dos EUA (onde as disposições acima
se aplicam até onde permitido pela legislação federal), estes Termos não se
aplicarão quanto à legislação aplicável e aos tribunais.

Considerando a natureza das pesquisas científicas, pode levar algum tempo para
qualquer violação dos Termos se tornar aparente. Para proteger você, o Google e
os Recursos do AlphaFold 3, até onde permitido pela legislação aplicável, você
concorda que:

1.  qualquer ação judicial relacionada aos Termos ou Recursos do AlphaFold 3
    pode ser iniciada até o que ocorrer por último:
    1.  a data-limite de acordo com a legislação aplicável para iniciar a ação
        judicial; ou
    2.  dois anos após a data em que você ou o Google (conforme aplicável) tomou
        conhecimento, ou deve ter tomado conhecimento de forma razoável, dos
        fatos que deram origem a essa ação; e
2.  você não alegará limitação, prazo de prescrição, atraso, renúncia ou
    semelhantes para tentar impedir uma ação registrada nesse período, e o
    Google também não.

Todos os direitos que não forem concedidos a você de maneira específica e
explícita pelos Termos são reservados ao Google. Nenhum atraso, ação ou omissão
do Google em exercer qualquer direito ou correção será considerado uma renúncia
a qualquer violação dos Termos, e o Google reserva expressamente todos e
quaisquer direitos e correções disponíveis de acordo com os Termos ou com base
na lei, na equidade ou de outra forma, incluindo a correção da tutela de
urgência contra qualquer violação real dos Termos ou ameaça disso sem precisar
comprovar danos reais.


================================================
FILE: pyproject.toml
================================================
[build-system]
requires = [
    "scikit_build_core",
    "pybind11",
    "cmake>=3.28",
    "ninja",
    "numpy",
]
build-backend = "scikit_build_core.build"

[project]
name = "alphafold3"
version = "3.0.1"
requires-python = ">=3.12"
readme = "README.md"
license = {file = "LICENSE"}
dependencies = [
    "absl-py>=2.3.1",
    "dm-haiku==0.0.16",
    "jax==0.9.1",
    "jax[cuda12]==0.9.1",
    "numpy",
    "rdkit==2025.9.4",
    "tokamax==0.0.11",
    "tqdm",
    "zstandard",
]

[dependency-groups]
dev = [
    "pytest>=6.0",
]

[tool.uv]
package = true
environments = [
    "sys_platform == 'linux' and platform_machine == 'x86_64'",
    "sys_platform == 'linux' and platform_machine == 'aarch64'",
]

[tool.scikit-build]
wheel.exclude = [
    "**.pyx",
    "**/CMakeLists.txt",
    "**.cc",
    "**.h"
]
sdist.include = [
    "LICENSE",
    "OUTPUT_TERMS_OF_USE.md",
    "WEIGHTS_PROHIBITED_USE_POLICY.md",
    "WEIGHTS_TERMS_OF_USE.md",
]

[tool.cibuildwheel]
build = "cp3*-manylinux_x86_64"
manylinux-x86_64-image = "manylinux_2_28"

[project.scripts]
build_data = "alphafold3.build_data:build_data"


================================================
FILE: run_alphafold.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""AlphaFold 3 structure prediction script.

AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/

To request access to the AlphaFold 3 model parameters, follow the process set
out at https://github.com/google-deepmind/alphafold3. You may only use these
if received directly from Google. Use is subject to terms of use available at
https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md
"""

from collections.abc import Callable, Sequence
import csv
import dataclasses
import datetime
import functools
import os
import pathlib
import shutil
import string
import textwrap
import time
import typing
from typing import overload

from absl import app
from absl import flags
from alphafold3.common import folding_input
from alphafold3.common import resources
from alphafold3.constants import chemical_components
import alphafold3.cpp
from alphafold3.data import featurisation
from alphafold3.data import pipeline
from alphafold3.data.tools import shards
from alphafold3.model import features
from alphafold3.model import model
from alphafold3.model import params
from alphafold3.model import post_processing
from alphafold3.model.components import utils
import haiku as hk
import jax
from jax import numpy as jnp
import numpy as np
import tokamax


_HOME_DIR = pathlib.Path(os.environ.get('HOME'))
_DEFAULT_MODEL_DIR = _HOME_DIR / 'models'
_DEFAULT_DB_DIR = _HOME_DIR / 'public_databases'


# Input and output paths.
_JSON_PATH = flags.DEFINE_string(
    'json_path',
    None,
    'Path to the input JSON file.',
)
_INPUT_DIR = flags.DEFINE_string(
    'input_dir',
    None,
    'Path to the directory containing input JSON files.',
)
_OUTPUT_DIR = flags.DEFINE_string(
    'output_dir',
    None,
    'Path to a directory where the results will be saved.',
)
MODEL_DIR = flags.DEFINE_string(
    'model_dir',
    _DEFAULT_MODEL_DIR.as_posix(),
    'Path to the model to use for inference.',
)

# Control which stages to run.
_RUN_DATA_PIPELINE = flags.DEFINE_bool(
    'run_data_pipeline',
    True,
    'Whether to run the data pipeline on the fold inputs.',
)
_RUN_INFERENCE = flags.DEFINE_bool(
    'run_inference',
    True,
    'Whether to run inference on the fold inputs.',
)

# Binary paths.
_JACKHMMER_BINARY_PATH = flags.DEFINE_string(
    'jackhmmer_binary_path',
    shutil.which('jackhmmer'),
    'Path to the Jackhmmer binary.',
)
_NHMMER_BINARY_PATH = flags.DEFINE_string(
    'nhmmer_binary_path',
    shutil.which('nhmmer'),
    'Path to the Nhmmer binary.',
)
_HMMALIGN_BINARY_PATH = flags.DEFINE_string(
    'hmmalign_binary_path',
    shutil.which('hmmalign'),
    'Path to the Hmmalign binary.',
)
_HMMSEARCH_BINARY_PATH = flags.DEFINE_string(
    'hmmsearch_binary_path',
    shutil.which('hmmsearch'),
    'Path to the Hmmsearch binary.',
)
_HMMBUILD_BINARY_PATH = flags.DEFINE_string(
    'hmmbuild_binary_path',
    shutil.which('hmmbuild'),
    'Path to the Hmmbuild binary.',
)

# Database paths.
DB_DIR = flags.DEFINE_multi_string(
    'db_dir',
    (_DEFAULT_DB_DIR.as_posix(),),
    'Path to the directory containing the databases. Can be specified multiple'
    ' times to search multiple directories in order.',
)

_SMALL_BFD_DATABASE_PATH = flags.DEFINE_string(
    'small_bfd_database_path',
    '${DB_DIR}/bfd-first_non_consensus_sequences.fasta',
    'Small BFD database path, used for protein MSA search.',
)
_SMALL_BFD_Z_VALUE = flags.DEFINE_integer(
    'small_bfd_z_value',
    None,
    'The Z-value representing the database size in number of sequences for'
    ' E-value calculation. Must be set for sharded databases.',
    lower_bound=0,
)
_MGNIFY_DATABASE_PATH = flags.DEFINE_string(
    'mgnify_database_path',
    '${DB_DIR}/mgy_clusters_2022_05.fa',
    'Mgnify database path, used for protein MSA search.',
)
_MGNIFY_Z_VALUE = flags.DEFINE_integer(
    'mgnify_z_value',
    None,
    'The Z-value representing the database size in number of sequences for'
    ' E-value calculation. Must be set for sharded databases.',
    lower_bound=0,
)
_UNIPROT_CLUSTER_ANNOT_DATABASE_PATH = flags.DEFINE_string(
    'uniprot_cluster_annot_database_path',
    '${DB_DIR}/uniprot_all_2021_04.fa',
    'UniProt database path, used for protein paired MSA search.',
)
_UNIPROT_CLUSTER_ANNOT_Z_VALUE = flags.DEFINE_integer(
    'uniprot_cluster_annot_z_value',
    None,
    'The Z-value representing the database size in number of sequences for'
    ' E-value calculation. Must be set for sharded databases.',
    lower_bound=0,
)
_UNIREF90_DATABASE_PATH = flags.DEFINE_string(
    'uniref90_database_path',
    '${DB_DIR}/uniref90_2022_05.fa',
    'UniRef90 database path, used for MSA search. The MSA obtained by '
    'searching it is used to construct the profile for template search.',
)
_UNIREF90_Z_VALUE = flags.DEFINE_integer(
    'uniref90_z_value',
    None,
    'The Z-value representing the database size in number of sequences for'
    ' E-value calculation. Must be set for sharded databases.',
    lower_bound=0,
)
_NTRNA_DATABASE_PATH = flags.DEFINE_string(
    'ntrna_database_path',
    '${DB_DIR}/nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta',
    'NT-RNA database path, used for RNA MSA search.',
)
_NTRNA_Z_VALUE = flags.DEFINE_float(
    'ntrna_z_value',
    None,
    'The Z-value representing the database size in megabases for E-value'
    ' calculation. Must be set for sharded databases.',
    lower_bound=0.0,
)
_RFAM_DATABASE_PATH = flags.DEFINE_string(
    'rfam_database_path',
    '${DB_DIR}/rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta',
    'Rfam database path, used for RNA MSA search.',
)
_RFAM_Z_VALUE = flags.DEFINE_float(
    'rfam_z_value',
    None,
    'The Z-value representing the database size in megabases for E-value'
    ' calculation. Must be set for sharded databases.',
    lower_bound=0.0,
)
_RNA_CENTRAL_DATABASE_PATH = flags.DEFINE_string(
    'rna_central_database_path',
    '${DB_DIR}/rnacentral_active_seq_id_90_cov_80_linclust.fasta',
    'RNAcentral database path, used for RNA MSA search.',
)
_RNA_CENTRAL_Z_VALUE = flags.DEFINE_float(
    'rna_central_z_value',
    None,
    'The Z-value representing the database size in megabases for E-value'
    ' calculation. Must be set for sharded databases.',
    lower_bound=0.0,
)
_PDB_DATABASE_PATH = flags.DEFINE_string(
    'pdb_database_path',
    '${DB_DIR}/mmcif_files',
    'PDB database directory with mmCIF files path, used for template search.',
)
_SEQRES_DATABASE_PATH = flags.DEFINE_string(
    'seqres_database_path',
    '${DB_DIR}/pdb_seqres_2022_09_28.fasta',
    'PDB sequence database path, used for template search.',
)

# Number of CPUs to use for MSA tools.
_JACKHMMER_N_CPU = flags.DEFINE_integer(
    'jackhmmer_n_cpu',
    # Unfortunately, os.process_cpu_count() is only available in Python 3.13+.
    min(len(os.sched_getaffinity(0)), 8),
    'Number of CPUs to use for Jackhmmer. Defaults to min(cpu_count, 8). Going'
    ' above 8 CPUs provides very little additional speedup.',
    lower_bound=0,
)
_JACKHMMER_MAX_PARALLEL_SHARDS = flags.DEFINE_integer(
    'jackhmmer_max_parallel_shards',
    None,
    'Maximum number of shards to search against in parallel. If unset, one'
    ' Jackhmmer instance will be run per shard. Only applicable if the'
    ' database is sharded.',
    lower_bound=1,
)
_NHMMER_N_CPU = flags.DEFINE_integer(
    'nhmmer_n_cpu',
    # Unfortunately, os.process_cpu_count() is only available in Python 3.13+.
    min(len(os.sched_getaffinity(0)), 8),
    'Number of CPUs to use for Nhmmer. Defaults to min(cpu_count, 8). Going'
    ' above 8 CPUs provides very little additional speedup.',
    lower_bound=0,
)
_NHMMER_MAX_PARALLEL_SHARDS = flags.DEFINE_integer(
    'nhmmer_max_parallel_shards',
    None,
    'Maximum number of shards to search against in parallel. If unset, one'
    ' Nhmmer instance will be run per shard. Only applicable if the'
    ' database is sharded.',
    lower_bound=1,
)

# Data pipeline configuration.
_RESOLVE_MSA_OVERLAPS = flags.DEFINE_bool(
    'resolve_msa_overlaps',
    True,
    'Whether to deduplicate unpaired MSA against paired MSA. The default'
    ' behaviour matches the method described in the AlphaFold 3 paper. Set this'
    ' to false if providing custom paired MSA using the unpaired MSA field to'
    ' keep it exactly as is as deduplication against the paired MSA could break'
    ' the manually crafted pairing between MSA sequences.',
)
_MAX_TEMPLATE_DATE = flags.DEFINE_string(
    'max_template_date',
    '2021-09-30',  # By default, use the date from the AlphaFold 3 paper.
    'Maximum template release date to consider. Format: YYYY-MM-DD. All'
    ' templates released after this date will be ignored. Controls also whether'
    ' to allow use of model coordinates for a chemical component from the CCD'
    ' if RDKit conformer generation fails and the component does not have ideal'
    ' coordinates set. Only for components that have been released before this'
    ' date the model coordinates can be used as a fallback.',
)
_CONFORMER_MAX_ITERATIONS = flags.DEFINE_integer(
    'conformer_max_iterations',
    None,  # Default to RDKit default parameters value.
    'Optional override for maximum number of iterations to run for RDKit '
    'conformer search.',
    lower_bound=0,
)

# JAX inference performance tuning.
_JAX_COMPILATION_CACHE_DIR = flags.DEFINE_string(
    'jax_compilation_cache_dir',
    None,
    'Path to a directory for the JAX compilation cache.',
)
_GPU_DEVICE = flags.DEFINE_integer(
    'gpu_device',
    0,
    'Optional override for the GPU device to use for inference, uses zero-based'
    ' indexing. Defaults to the 0th GPU on the system. Useful on multi-GPU'
    ' systems to pin each run to a specific GPU. Note that if GPUs are already'
    ' pre-filtered by the environment (e.g. by using CUDA_VISIBLE_DEVICES),'
    ' this flag refers to the GPU index after the filtering has been done.',
)
_BUCKETS = flags.DEFINE_list(
    'buckets',
    # pyformat: disable
    ['256', '512', '768', '1024', '1280', '1536', '2048', '2560', '3072',
     '3584', '4096', '4608', '5120'],
    # pyformat: enable
    'Strictly increasing order of token sizes for which to cache compilations.'
    ' For any input with more tokens than the largest bucket size, a new bucket'
    ' is created for exactly that number of tokens.',
)
_FLASH_ATTENTION_IMPLEMENTATION = flags.DEFINE_enum(
    'flash_attention_implementation',
    default='triton',
    enum_values=['triton', 'cudnn', 'xla'],
    help=(
        "Flash attention implementation to use. 'triton' and 'cudnn' uses a"
        ' Triton and cuDNN flash attention implementation, respectively. The'
        ' Triton kernel is fastest and has been tested more thoroughly. The'
        " Triton and cuDNN kernels require Ampere GPUs or later. 'xla' uses an"
        ' XLA attention implementation (no flash attention) and is portable'
        ' across GPU devices.'
    ),
)
_NUM_RECYCLES = flags.DEFINE_integer(
    'num_recycles',
    10,
    'Number of recycles to use during inference.',
    lower_bound=1,
)
_NUM_DIFFUSION_SAMPLES = flags.DEFINE_integer(
    'num_diffusion_samples',
    5,
    'Number of diffusion samples to generate.',
    lower_bound=1,
)
_NUM_SEEDS = flags.DEFINE_integer(
    'num_seeds',
    None,
    'Number of seeds to use for inference. If set, only a single seed must be'
    ' provided in the input JSON. AlphaFold 3 will then generate random seeds'
    ' in sequence, starting from the single seed specified in the input JSON.'
    ' The full input JSON produced by AlphaFold 3 will include the generated'
    ' random seeds. If not set, AlphaFold 3 will use the seeds as provided in'
    ' the input JSON.',
    lower_bound=1,
)

# Output controls.
_SAVE_EMBEDDINGS = flags.DEFINE_bool(
    'save_embeddings',
    False,
    'Whether to save the final trunk single and pair embeddings in the output.'
    ' Note that the embeddings are large float16 arrays: num_tokens * 384'
    ' + num_tokens * num_tokens * 128.',
)
_SAVE_DISTOGRAM = flags.DEFINE_bool(
    'save_distogram',
    False,
    'Whether to save the final distogram in the output. Note that the distogram'
    ' is a large float16 array: num_tokens * num_tokens * 64.',
)
_FORCE_OUTPUT_DIR = flags.DEFINE_bool(
    'force_output_dir',
    False,
    'Whether to force the output directory to be used even if it already exists'
    ' and is non-empty. Useful to set this to True to run the data pipeline and'
    ' the inference separately, but use the same output directory.',
)
_COMPRESS_LARGE_OUTPUT_FILES = flags.DEFINE_bool(
    'compress_large_output_files',
    False,
    'If True, compresses the output mmCIF and confidences JSON files (the two'
    ' largest files) using zstandard. Note that embeddings and distogram, if'
    ' saved, are already stored in a compressed format.',
)


def make_model_config(
    *,
    flash_attention_implementation: tokamax.DotProductAttentionImplementation = 'triton',
    num_diffusion_samples: int = 5,
    num_recycles: int = 10,
    return_embeddings: bool = False,
    return_distogram: bool = False,
) -> model.Model.Config:
  """Returns a model config with some defaults overridden."""
  config = model.Model.Config()
  config.global_config.flash_attention_implementation = (
      flash_attention_implementation
  )
  config.heads.diffusion.eval.num_samples = num_diffusion_samples
  config.num_recycles = num_recycles
  config.return_embeddings = return_embeddings
  config.return_distogram = return_distogram
  return config


class ModelRunner:
  """Helper class to run structure prediction stages."""

  def __init__(
      self,
      config: model.Model.Config,
      device: jax.Device,
      model_dir: pathlib.Path,
  ):
    self._model_config = config
    self._device = device
    self._model_dir = model_dir

  @functools.cached_property
  def model_params(self) -> hk.Params:
    """Loads model parameters from the model directory."""
    return params.get_model_haiku_params(model_dir=self._model_dir)

  @functools.cached_property
  def _model(
      self,
  ) -> Callable[[jnp.ndarray, features.BatchDict], model.ModelResult]:
    """Loads model parameters and returns a jitted model forward pass."""

    @hk.transform
    def forward_fn(batch):
      return model.Model(self._model_config)(batch)

    return functools.partial(
        jax.jit(forward_fn.apply, device=self._device), self.model_params
    )

  def run_inference(
      self, featurised_example: features.BatchDict, rng_key: jnp.ndarray
  ) -> model.ModelResult:
    """Computes a forward pass of the model on a featurised example."""
    featurised_example = jax.device_put(
        jax.tree_util.tree_map(
            jnp.asarray, utils.remove_invalidly_typed_feats(featurised_example)
        ),
        self._device,
    )

    result = self._model(rng_key, featurised_example)
    result = jax.tree.map(np.asarray, result)
    result = jax.tree.map(
        lambda x: x.astype(jnp.float32) if x.dtype == jnp.bfloat16 else x,
        result,
    )
    result = dict(result)
    identifier = self.model_params['__meta__']['__identifier__'].tobytes()
    result['__identifier__'] = identifier
    return result

  def extract_inference_results(
      self,
      batch: features.BatchDict,
      result: model.ModelResult,
      target_name: str,
  ) -> list[model.InferenceResult]:
    """Extracts inference results from model outputs."""
    return list(
        model.Model.get_inference_result(
            batch=batch, result=result, target_name=target_name
        )
    )

  def extract_embeddings(
      self, result: model.ModelResult, num_tokens: int
  ) -> dict[str, np.ndarray] | None:
    """Extracts embeddings from model outputs."""
    embeddings = {}
    if 'single_embeddings' in result:
      embeddings['single_embeddings'] = result['single_embeddings'][
          :num_tokens
      ].astype(np.float16)
    if 'pair_embeddings' in result:
      embeddings['pair_embeddings'] = result['pair_embeddings'][
          :num_tokens, :num_tokens
      ].astype(np.float16)
    return embeddings or None

  def extract_distogram(
      self, result: model.ModelResult, num_tokens: int
  ) -> np.ndarray | None:
    """Extracts distogram from model outputs."""
    if 'distogram' not in result['distogram']:
      return None
    distogram = result['distogram']['distogram'][:num_tokens, :num_tokens, :]
    return distogram


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class ResultsForSeed:
  """Stores the inference results (diffusion samples) for a single seed.

  Attributes:
    seed: The seed used to generate the samples.
    inference_results: The inference results, one per sample.
    full_fold_input: The fold input that must also include the results of
      running the data pipeline - MSA and templates.
    embeddings: The final trunk single and pair embeddings, if requested.
    distogram: The token distance histogram, if requested.
  """

  seed: int
  inference_results: Sequence[model.InferenceResult]
  full_fold_input: folding_input.Input
  embeddings: dict[str, np.ndarray] | None = None
  distogram: np.ndarray | None = None


def predict_structure(
    fold_input: folding_input.Input,
    model_runner: ModelRunner,
    buckets: Sequence[int] | None = None,
    ref_max_modified_date: datetime.date | None = None,
    conformer_max_iterations: int | None = None,
    resolve_msa_overlaps: bool = True,
) -> Sequence[ResultsForSeed]:
  """Runs the full inference pipeline to predict structures for each seed."""

  print(f'Featurising data with {len(fold_input.rng_seeds)} seed(s)...')
  featurisation_start_time = time.time()
  ccd = chemical_components.Ccd(user_ccd=fold_input.user_ccd)
  featurised_examples = featurisation.featurise_input(
      fold_input=fold_input,
      buckets=buckets,
      ccd=ccd,
      verbose=True,
      ref_max_modified_date=ref_max_modified_date,
      conformer_max_iterations=conformer_max_iterations,
      resolve_msa_overlaps=resolve_msa_overlaps,
  )
  print(
      f'Featurising data with {len(fold_input.rng_seeds)} seed(s) took'
      f' {time.time() - featurisation_start_time:.2f} seconds.'
  )
  print(
      'Running model inference and extracting output structure samples with'
      f' {len(fold_input.rng_seeds)} seed(s)...'
  )
  all_inference_start_time = time.time()
  all_inference_results = []
  for seed, example in zip(fold_input.rng_seeds, featurised_examples):
    print(f'Running model inference with seed {seed}...')
    inference_start_time = time.time()
    rng_key = jax.random.PRNGKey(seed)
    result = model_runner.run_inference(example, rng_key)
    print(
        f'Running model inference with seed {seed} took'
        f' {time.time() - inference_start_time:.2f} seconds.'
    )
    print(f'Extracting inference results with seed {seed}...')
    extract_structures = time.time()
    inference_results = model_runner.extract_inference_results(
        batch=example, result=result, target_name=fold_input.name
    )
    num_tokens = len(inference_results[0].metadata['token_chain_ids'])
    embeddings = model_runner.extract_embeddings(
        result=result, num_tokens=num_tokens
    )
    distogram = model_runner.extract_distogram(
        result=result, num_tokens=num_tokens
    )
    print(
        f'Extracting {len(inference_results)} inference samples with'
        f' seed {seed} took {time.time() - extract_structures:.2f} seconds.'
    )

    all_inference_results.append(
        ResultsForSeed(
            seed=seed,
            inference_results=inference_results,
            full_fold_input=fold_input,
            embeddings=embeddings,
            distogram=distogram,
        )
    )
  print(
      'Running model inference and extracting output structures with'
      f' {len(fold_input.rng_seeds)} seed(s) took'
      f' {time.time() - all_inference_start_time:.2f} seconds.'
  )
  return all_inference_results


def write_fold_input_json(
    fold_input: folding_input.Input,
    output_dir: os.PathLike[str] | str,
) -> None:
  """Writes the input JSON to the output directory."""
  os.makedirs(output_dir, exist_ok=True)
  path = os.path.join(output_dir, f'{fold_input.sanitised_name()}_data.json')
  print(f'Writing model input JSON to {path}')
  with open(path, 'wt') as f:
    f.write(fold_input.to_json())


def write_outputs(
    all_inference_results: Sequence[ResultsForSeed],
    output_dir: os.PathLike[str] | str,
    job_name: str,
    compress_large_output_files: bool = False,
) -> None:
  """Writes outputs to the specified output directory."""
  ranking_scores = []
  max_ranking_score = None
  max_ranking_result = None

  output_terms = (
      pathlib.Path(alphafold3.cpp.__file__).parent / 'OUTPUT_TERMS_OF_USE.md'
  ).read_text()

  os.makedirs(output_dir, exist_ok=True)
  for results_for_seed in all_inference_results:
    seed = results_for_seed.seed
    for sample_idx, result in enumerate(results_for_seed.inference_results):
      sample_dir = os.path.join(output_dir, f'seed-{seed}_sample-{sample_idx}')
      os.makedirs(sample_dir, exist_ok=True)
      post_processing.write_output(
          inference_result=result,
          output_dir=sample_dir,
          name=f'{job_name}_seed-{seed}_sample-{sample_idx}',
          compress=compress_large_output_files,
      )
      ranking_score = float(result.metadata['ranking_score'])
      ranking_scores.append((seed, sample_idx, ranking_score))
      if max_ranking_score is None or ranking_score > max_ranking_score:
        max_ranking_score = ranking_score
        max_ranking_result = result

    if embeddings := results_for_seed.embeddings:
      embeddings_dir = os.path.join(output_dir, f'seed-{seed}_embeddings')
      os.makedirs(embeddings_dir, exist_ok=True)
      post_processing.write_embeddings(
          embeddings=embeddings,
          output_dir=embeddings_dir,
          name=f'{job_name}_seed-{seed}',
      )

    if (distogram := results_for_seed.distogram) is not None:
      distogram_dir = os.path.join(output_dir, f'seed-{seed}_distogram')
      os.makedirs(distogram_dir, exist_ok=True)
      distogram_path = os.path.join(
          distogram_dir, f'{job_name}_seed-{seed}_distogram.npz'
      )
      with open(distogram_path, 'wb') as f:
        np.savez_compressed(f, distogram=distogram.astype(np.float16))

  if max_ranking_result is not None:  # True iff ranking_scores non-empty.
    post_processing.write_output(
        inference_result=max_ranking_result,
        output_dir=output_dir,
        # The output terms of use are the same for all seeds/samples.
        terms_of_use=output_terms,
        name=job_name,
        compress=compress_large_output_files,
    )
    # Save csv of ranking scores with seeds and sample indices, to allow easier
    # comparison of ranking scores across different runs.
    with open(
        os.path.join(output_dir, f'{job_name}_ranking_scores.csv'), 'wt'
    ) as f:
      writer = csv.writer(f)
      writer.writerow(['seed', 'sample', 'ranking_score'])
      writer.writerows(ranking_scores)


def replace_db_dir(path_with_db_dir: str, db_dirs: Sequence[str]) -> str:
  """Replaces the DB_DIR placeholder in a path with the given DB_DIR."""
  template = string.Template(path_with_db_dir)
  if 'DB_DIR' in template.get_identifiers():
    for db_dir in db_dirs:
      path = template.substitute(DB_DIR=db_dir)
      if os.path.exists(path):
        return path
    raise FileNotFoundError(
        f'{path_with_db_dir} with ${{DB_DIR}} not found in any of {db_dirs}.'
    )
  if (sharded_paths := shards.get_sharded_paths(path_with_db_dir)) is not None:
    db_exists = all(os.path.exists(p) for p in sharded_paths)
  else:
    db_exists = os.path.exists(path_with_db_dir)
  if not db_exists:
    raise FileNotFoundError(f'{path_with_db_dir} does not exist.')
  return path_with_db_dir


@overload
def process_fold_input(
    fold_input: folding_input.Input,
    data_pipeline_config: pipeline.DataPipelineConfig | None,
    *,
    model_runner: None,
    output_dir: os.PathLike[str] | str,
    buckets: Sequence[int] | None = None,
    ref_max_modified_date: datetime.date | None = None,
    conformer_max_iterations: int | None = None,
    resolve_msa_overlaps: bool = True,
    force_output_dir: bool = False,
    compress_large_output_files: bool = False,
) -> folding_input.Input:
  ...


@overload
def process_fold_input(
    fold_input: folding_input.Input,
    data_pipeline_config: pipeline.DataPipelineConfig | None,
    *,
    model_runner: ModelRunner,
    output_dir: os.PathLike[str] | str,
    buckets: Sequence[int] | None = None,
    ref_max_modified_date: datetime.date | None = None,
    conformer_max_iterations: int | None = None,
    resolve_msa_overlaps: bool = True,
    force_output_dir: bool = False,
    compress_large_output_files: bool = False,
) -> Sequence[ResultsForSeed]:
  ...


def process_fold_input(
    fold_input: folding_input.Input,
    data_pipeline_config: pipeline.DataPipelineConfig | None,
    *,
    model_runner: ModelRunner | None,
    output_dir: os.PathLike[str] | str,
    buckets: Sequence[int] | None = None,
    ref_max_modified_date: datetime.date | None = None,
    conformer_max_iterations: int | None = None,
    resolve_msa_overlaps: bool = True,
    force_output_dir: bool = False,
    compress_large_output_files: bool = False,
) -> folding_input.Input | Sequence[ResultsForSeed]:
  """Runs data pipeline and/or inference on a single fold input.

  Args:
    fold_input: Fold input to process.
    data_pipeline_config: Data pipeline config to use. If None, skip the data
      pipeline.
    model_runner: Model runner to use. If None, skip inference.
    output_dir: Output directory to write to.
    buckets: Bucket sizes to pad the data to, to avoid excessive re-compilation
      of the model. If None, calculate the appropriate bucket size from the
      number of tokens. If not None, must be a sequence of at least one integer,
      in strictly increasing order. Will raise an error if the number of tokens
      is more than the largest bucket size.
    ref_max_modified_date: Optional maximum date that controls whether to allow
      use of model coordinates for a chemical component from the CCD if RDKit
      conformer generation fails and the component does not have ideal
      coordinates set. Only for components that have been released before this
      date the model coordinates can be used as a fallback.
    conformer_max_iterations: Optional override for maximum number of iterations
      to run for RDKit conformer search.
    resolve_msa_overlaps: Whether to deduplicate unpaired MSA against paired
      MSA. The default behaviour matches the method described in the AlphaFold 3
      paper. Set this to false if providing custom paired MSA using the unpaired
      MSA field to keep it exactly as is as deduplication against the paired MSA
      could break the manually crafted pairing between MSA sequences.
    force_output_dir: If True, do not create a new output directory even if the
      existing one is non-empty. Instead use the existing output directory and
      potentially overwrite existing files. If False, create a new timestamped
      output directory instead if the existing one is non-empty.
    compress_large_output_files: If True, compress large output files (mmCIF and
      confidences JSON) using zstandard.

  Returns:
    The processed fold input, or the inference results for each seed.

  Raises:
    ValueError: If the fold input has no chains.
  """
  print(f'\nRunning fold job {fold_input.name}...')

  if not fold_input.chains:
    raise ValueError('Fold input has no chains.')

  if (
      not force_output_dir
      and os.path.exists(output_dir)
      and os.listdir(output_dir)
  ):
    new_output_dir = (
        f'{output_dir}_{datetime.datetime.now().strftime("%Y%m%d_%H%M%S")}'
    )
    print(
        f'Output will be written in {new_output_dir} since {output_dir} is'
        ' non-empty.'
    )
    output_dir = new_output_dir
  else:
    print(f'Output will be written in {output_dir}')

  if data_pipeline_config is None:
    print('Skipping data pipeline...')
  else:
    print('Running data pipeline...')
    fold_input = pipeline.DataPipeline(data_pipeline_config).process(fold_input)

  write_fold_input_json(fold_input, output_dir)
  if model_runner is None:
    print('Skipping model inference...')
    output = fold_input
  else:
    print(
        f'Predicting 3D structure for {fold_input.name} with'
        f' {len(fold_input.rng_seeds)} seed(s)...'
    )
    all_inference_results = predict_structure(
        fold_input=fold_input,
        model_runner=model_runner,
        buckets=buckets,
        ref_max_modified_date=ref_max_modified_date,
        conformer_max_iterations=conformer_max_iterations,
        resolve_msa_overlaps=resolve_msa_overlaps,
    )
    print(f'Writing outputs with {len(fold_input.rng_seeds)} seed(s)...')
    write_outputs(
        all_inference_results=all_inference_results,
        output_dir=output_dir,
        job_name=fold_input.sanitised_name(),
        compress_large_output_files=compress_large_output_files,
    )
    output = all_inference_results

  print(f'Fold job {fold_input.name} done, output written to {output_dir}\n')
  return output


def main(_):
  if _JAX_COMPILATION_CACHE_DIR.value is not None:
    jax.config.update(
        'jax_compilation_cache_dir', _JAX_COMPILATION_CACHE_DIR.value
    )

  if _JSON_PATH.value is None == _INPUT_DIR.value is None:
    raise ValueError(
        'Exactly one of --json_path or --input_dir must be specified.'
    )

  if not _RUN_INFERENCE.value and not _RUN_DATA_PIPELINE.value:
    raise ValueError(
        'At least one of --run_inference or --run_data_pipeline must be'
        ' set to true.'
    )

  if _INPUT_DIR.value is not None:
    fold_inputs = folding_input.load_fold_inputs_from_dir(
        pathlib.Path(_INPUT_DIR.value)
    )
  elif _JSON_PATH.value is not None:
    fold_inputs = folding_input.load_fold_inputs_from_path(
        pathlib.Path(_JSON_PATH.value)
    )
  else:
    raise AssertionError(
        'Exactly one of --json_path or --input_dir must be specified.'
    )

  # Make sure we can create the output directory before running anything.
  try:
    os.makedirs(_OUTPUT_DIR.value, exist_ok=True)
  except OSError as e:
    print(f'Failed to create output directory {_OUTPUT_DIR.value}: {e}')
    raise

  if _RUN_INFERENCE.value:
    # Fail early on incompatible devices, but only if we're running inference.
    gpu_devices = jax.local_devices(backend='gpu')
    if gpu_devices:
      compute_capability = float(
          gpu_devices[_GPU_DEVICE.value].compute_capability
      )
      if compute_capability < 6.0:
        raise ValueError(
            'AlphaFold 3 requires at least GPU compute capability 6.0 (see'
            ' https://developer.nvidia.com/cuda-gpus).'
        )
      elif 7.0 <= compute_capability < 8.0:
        xla_flags = os.environ.get('XLA_FLAGS')
        required_flag = '--xla_disable_hlo_passes=custom-kernel-fusion-rewriter'
        if not xla_flags or required_flag not in xla_flags:
          raise ValueError(
              'For devices with GPU compute capability 7.x (see'
              ' https://developer.nvidia.com/cuda-gpus) the ENV XLA_FLAGS must'
              f' include "{required_flag}".'
          )
        if _FLASH_ATTENTION_IMPLEMENTATION.value != 'xla':
          raise ValueError(
              'For devices with GPU compute capability 7.x (see'
              ' https://developer.nvidia.com/cuda-gpus) the'
              ' --flash_attention_implementation must be set to "xla".'
          )

  notice = textwrap.wrap(
      'Running AlphaFold 3. Please note that standard AlphaFold 3 model'
      ' parameters are only available under terms of use provided at'
      ' https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.'
      ' If you do not agree to these terms and are using AlphaFold 3 derived'
      ' model parameters, cancel execution of AlphaFold 3 inference with'
      ' CTRL-C, and do not use the model parameters.',
      break_long_words=False,
      break_on_hyphens=False,
      width=80,
  )
  print('\n' + '\n'.join(notice) + '\n')

  max_template_date = datetime.date.fromisoformat(_MAX_TEMPLATE_DATE.value)
  if _RUN_DATA_PIPELINE.value:
    expand_path = lambda x: replace_db_dir(x, DB_DIR.value)
    data_pipeline_config = pipeline.DataPipelineConfig(
        jackhmmer_binary_path=_JACKHMMER_BINARY_PATH.value,
        nhmmer_binary_path=_NHMMER_BINARY_PATH.value,
        hmmalign_binary_path=_HMMALIGN_BINARY_PATH.value,
        hmmsearch_binary_path=_HMMSEARCH_BINARY_PATH.value,
        hmmbuild_binary_path=_HMMBUILD_BINARY_PATH.value,
        small_bfd_database_path=expand_path(_SMALL_BFD_DATABASE_PATH.value),
        small_bfd_z_value=_SMALL_BFD_Z_VALUE.value,
        mgnify_database_path=expand_path(_MGNIFY_DATABASE_PATH.value),
        mgnify_z_value=_MGNIFY_Z_VALUE.value,
        uniprot_cluster_annot_database_path=expand_path(
            _UNIPROT_CLUSTER_ANNOT_DATABASE_PATH.value
        ),
        uniprot_cluster_annot_z_value=_UNIPROT_CLUSTER_ANNOT_Z_VALUE.value,
        uniref90_database_path=expand_path(_UNIREF90_DATABASE_PATH.value),
        uniref90_z_value=_UNIREF90_Z_VALUE.value,
        ntrna_database_path=expand_path(_NTRNA_DATABASE_PATH.value),
        ntrna_z_value=_NTRNA_Z_VALUE.value,
        rfam_database_path=expand_path(_RFAM_DATABASE_PATH.value),
        rfam_z_value=_RFAM_Z_VALUE.value,
        rna_central_database_path=expand_path(_RNA_CENTRAL_DATABASE_PATH.value),
        rna_central_z_value=_RNA_CENTRAL_Z_VALUE.value,
        pdb_database_path=expand_path(_PDB_DATABASE_PATH.value),
        seqres_database_path=expand_path(_SEQRES_DATABASE_PATH.value),
        jackhmmer_n_cpu=_JACKHMMER_N_CPU.value,
        jackhmmer_max_parallel_shards=_JACKHMMER_MAX_PARALLEL_SHARDS.value,
        nhmmer_n_cpu=_NHMMER_N_CPU.value,
        nhmmer_max_parallel_shards=_NHMMER_MAX_PARALLEL_SHARDS.value,
        max_template_date=max_template_date,
    )
  else:
    data_pipeline_config = None

  if _RUN_INFERENCE.value:
    devices = jax.local_devices(backend='gpu')
    print(
        f'Found local devices: {devices}, using device {_GPU_DEVICE.value}:'
        f' {devices[_GPU_DEVICE.value]}'
    )

    print('Building model from scratch...')
    model_runner = ModelRunner(
        config=make_model_config(
            flash_attention_implementation=typing.cast(
                tokamax.DotProductAttentionImplementation,
                _FLASH_ATTENTION_IMPLEMENTATION.value,
            ),
            num_diffusion_samples=_NUM_DIFFUSION_SAMPLES.value,
            num_recycles=_NUM_RECYCLES.value,
            return_embeddings=_SAVE_EMBEDDINGS.value,
            return_distogram=_SAVE_DISTOGRAM.value,
        ),
        device=devices[_GPU_DEVICE.value],
        model_dir=pathlib.Path(MODEL_DIR.value),
    )
    # Check we can load the model parameters before launching anything.
    print('Checking that model parameters can be loaded...')
    _ = model_runner.model_params
  else:
    model_runner = None

  num_fold_inputs = 0
  for fold_input in fold_inputs:
    if _NUM_SEEDS.value is not None:
      print(f'Expanding fold job {fold_input.name} to {_NUM_SEEDS.value} seeds')
      fold_input = fold_input.with_multiple_seeds(_NUM_SEEDS.value)
    process_fold_input(
        fold_input=fold_input,
        data_pipeline_config=data_pipeline_config,
        model_runner=model_runner,
        output_dir=os.path.join(_OUTPUT_DIR.value, fold_input.sanitised_name()),
        buckets=tuple(int(bucket) for bucket in _BUCKETS.value),
        ref_max_modified_date=max_template_date,
        conformer_max_iterations=_CONFORMER_MAX_ITERATIONS.value,
        resolve_msa_overlaps=_RESOLVE_MSA_OVERLAPS.value,
        force_output_dir=_FORCE_OUTPUT_DIR.value,
        compress_large_output_files=_COMPRESS_LARGE_OUTPUT_FILES.value,
    )
    num_fold_inputs += 1

  print(f'Done running {num_fold_inputs} fold jobs.')


if __name__ == '__main__':
  flags.mark_flags_as_required(['output_dir'])
  app.run(main)


================================================
FILE: run_alphafold_data_test.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Tests the AlphaFold 3 data pipeline."""

import contextlib
import datetime
import difflib
import functools
import hashlib
import json
import os
import pathlib
import pickle
from typing import Any

from absl.testing import absltest
from absl.testing import parameterized
from alphafold3 import structure
from alphafold3.common import folding_input
from alphafold3.common import resources
from alphafold3.common.testing import data as testing_data
from alphafold3.constants import chemical_components
from alphafold3.data import featurisation
from alphafold3.data import pipeline
from alphafold3.model.atom_layout import atom_layout
import jax
import numpy as np

import run_alphafold
import shutil


_JACKHMMER_BINARY_PATH = shutil.which('jackhmmer')
_NHMMER_BINARY_PATH = shutil.which('nhmmer')
_HMMALIGN_BINARY_PATH = shutil.which('hmmalign')
_HMMSEARCH_BINARY_PATH = shutil.which('hmmsearch')
_HMMBUILD_BINARY_PATH = shutil.which('hmmbuild')


@contextlib.contextmanager
def _output(name: str):
  with open(result_path := f'{absltest.TEST_TMPDIR.value}/{name}', "wb") as f:
    yield result_path, f


@functools.singledispatch
def _hash_data(x: Any, /) -> str:
  if x is None:
    return '<<None>>'
  return _hash_data(json.dumps(x).encode('utf-8'))


@_hash_data.register
def _(x: bytes, /) -> str:
  return hashlib.sha256(x).hexdigest()


@_hash_data.register
def _(x: jax.Array) -> str:
  return _hash_data(jax.device_get(x))


@_hash_data.register
def _(x: np.ndarray) -> str:
  if x.dtype == object:
    return ';'.join(map(_hash_data, x.ravel().tolist()))
  return _hash_data(x.tobytes())


@_hash_data.register
def _(_: structure.Structure) -> str:
  return '<<structure>>'


@_hash_data.register
def _(_: atom_layout.AtomLayout) -> str:
  return '<<atom-layout>>'


def _generate_diff(actual: str, expected: str) -> str:
  return '\n'.join(
      difflib.unified_diff(
          expected.split('\n'),
          actual.split('\n'),
          fromfile='expected',
          tofile='actual',
          lineterm='',
      )
  )


class DataPipelineTest(parameterized.TestCase):
  """Test AlphaFold 3 inference."""

  def setUp(self):
    super().setUp()
    small_bfd_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/bfd-first_non_consensus_sequences__subsampled_1000.fasta'
    ).path()
    mgnify_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/mgy_clusters__subsampled_1000.fa'
    ).path()
    uniprot_cluster_annot_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/uniprot_all__subsampled_1000.fasta'
    ).path()
    uniref90_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/uniref90__subsampled_1000.fasta'
    ).path()
    ntrna_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq__subsampled_1000.fasta'
    ).path()
    rfam_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/rfam_14_4_clustered_rep_seq__subsampled_1000.fasta'
    ).path()
    rna_central_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/rnacentral_active_seq_id_90_cov_80_linclust__subsampled_1000.fasta'
    ).path()
    pdb_database_path = testing_data.Data(
        resources.ROOT / 'test_data/miniature_databases/pdb_mmcif'
    ).path()
    seqres_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/pdb_seqres_2022_09_28__subsampled_1000.fasta'
    ).path()

    self._data_pipeline_config = pipeline.DataPipelineConfig(
        jackhmmer_binary_path=_JACKHMMER_BINARY_PATH,
        nhmmer_binary_path=_NHMMER_BINARY_PATH,
        hmmalign_binary_path=_HMMALIGN_BINARY_PATH,
        hmmsearch_binary_path=_HMMSEARCH_BINARY_PATH,
        hmmbuild_binary_path=_HMMBUILD_BINARY_PATH,
        small_bfd_database_path=small_bfd_database_path,
        mgnify_database_path=mgnify_database_path,
        uniprot_cluster_annot_database_path=uniprot_cluster_annot_database_path,
        uniref90_database_path=uniref90_database_path,
        ntrna_database_path=ntrna_database_path,
        rfam_database_path=rfam_database_path,
        rna_central_database_path=rna_central_database_path,
        pdb_database_path=pdb_database_path,
        seqres_database_path=seqres_database_path,
        max_template_date=datetime.date(2021, 9, 30),
    )
    test_input = {
        'name': '5tgy',
        'modelSeeds': [1234],
        'sequences': [
            {
                'protein': {
                    'id': 'P',
                    'sequence': (
                        'SEFEKLRQTGDELVQAFQRLREIFDKGDDDSLEQVLEEIEELIQKHRQLFDNRQEAADTEAAKQGDQWVQLFQRFREAIDKGDKDSLEQLLEELEQALQKIRELAEKKN'
                    ),
                    'modifications': [],
                    'unpairedMsa': None,
                    'pairedMsa': None,
                }
            },
            {'ligand': {'id': 'LL', 'ccdCodes': ['7BU']}},
        ],
        'dialect': folding_input.JSON_DIALECT,
        'version': folding_input.JSON_VERSION,
    }
    self._test_input_json = json.dumps(test_input)

  def compare_golden(self, result_path: str) -> None:
    filename = os.path.split(result_path)[1]
    golden_path = testing_data.Data(
        resources.ROOT / f'test_data/{filename}'
    ).path()
    with open(golden_path, 'r') as golden_file:
      golden_text = golden_file.read()
    with open(result_path, 'r') as result_file:
      result_text = result_file.read()

    diff = _generate_diff(result_text, golden_text)

    self.assertEqual(diff, "", f"Result differs from golden:\n{diff}")

  def test_config(self):
    model_config = run_alphafold.make_model_config()
    model_config_as_str = json.dumps(
        model_config.as_dict(), sort_keys=True, indent=2
    )
    with _output('model_config.json') as (result_path, output):
      output.write(model_config_as_str.encode('utf-8'))
    self.compare_golden(result_path)

  def test_featurisation(self):
    """Run featurisation and assert that the output is as expected."""
    fold_input = folding_input.Input.from_json(self._test_input_json)
    data_pipeline = pipeline.DataPipeline(self._data_pipeline_config)
    full_fold_input = data_pipeline.process(fold_input)
    featurised_example = featurisation.featurise_input(
        full_fold_input,
        ccd=chemical_components.Ccd(),
        buckets=None,
    )
    del featurised_example[0]['ref_pos']  # Depends on specific RDKit version.

    with _output('featurised_example.pkl') as (_, output):
      output.write(pickle.dumps(featurised_example))
    featurised_example = jax.tree_util.tree_map(_hash_data, featurised_example)
    with _output('featurised_example.json') as (result_path, output):
      output.write(
          json.dumps(featurised_example, sort_keys=True, indent=2).encode(
              'utf-8'
          )
      )
    self.compare_golden(result_path)

  def test_write_input_json(self):
    fold_input = folding_input.Input.from_json(self._test_input_json)
    output_dir = self.create_tempdir().full_path
    run_alphafold.write_fold_input_json(fold_input, output_dir)
    with open(
        os.path.join(output_dir, f'{fold_input.sanitised_name()}_data.json'),
        'rt',
    ) as f:
      actual_fold_input = folding_input.Input.from_json(f.read())

    self.assertEqual(actual_fold_input, fold_input)

  def test_process_fold_input_runs_only_data_pipeline(self):
    fold_input = folding_input.Input.from_json(self._test_input_json)
    output_dir = self.create_tempdir().full_path
    run_alphafold.process_fold_input(
        fold_input=fold_input,
        data_pipeline_config=self._data_pipeline_config,
        model_runner=None,
        output_dir=output_dir,
    )
    with open(
        os.path.join(output_dir, f'{fold_input.sanitised_name()}_data.json'),
        'rt',
    ) as f:
      actual_fold_input = folding_input.Input.from_json(f.read())

    featurisation.validate_fold_input(actual_fold_input)

  @parameterized.product(num_db_dirs=tuple(range(1, 3)))
  def test_replace_db_dir(self, num_db_dirs: int) -> None:
    """Test that the db_dir is replaced correctly."""
    db_dirs = [pathlib.Path(self.create_tempdir()) for _ in range(num_db_dirs)]
    db_dirs_posix = [db_dir.as_posix() for db_dir in db_dirs]

    for i, db_dir in enumerate(db_dirs):
      for j in range(i + 1):
        (db_dir / f'filename{j}.txt').write_text(f'hello world {i}')

    for i in range(num_db_dirs):
      self.assertEqual(
          pathlib.Path(
              run_alphafold.replace_db_dir(
                  f'${{DB_DIR}}/filename{i}.txt', db_dirs_posix
              )
          ).read_text(),
          f'hello world {i}',
      )
    with self.assertRaises(FileNotFoundError):
      run_alphafold.replace_db_dir(
          f'${{DB_DIR}}/filename{num_db_dirs}.txt', db_dirs_posix
      )


if __name__ == '__main__':
  absltest.main()


================================================
FILE: run_alphafold_test.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Tests end-to-end running of AlphaFold 3."""

import contextlib
import csv
import dataclasses
import datetime
import difflib
import json
import os
import pathlib
import pickle

from absl import logging
from absl.testing import absltest
from absl.testing import parameterized
from alphafold3.common import folding_input
from alphafold3.common import resources
from alphafold3.common.testing import data as testing_data
from alphafold3.data import pipeline
from alphafold3.model.scoring import alignment
import jax
import numpy as np

import run_alphafold
import shutil


_JACKHMMER_BINARY_PATH = shutil.which('jackhmmer')
_NHMMER_BINARY_PATH = shutil.which('nhmmer')
_HMMALIGN_BINARY_PATH = shutil.which('hmmalign')
_HMMSEARCH_BINARY_PATH = shutil.which('hmmsearch')
_HMMBUILD_BINARY_PATH = shutil.which('hmmbuild')


@contextlib.contextmanager
def _output(name: str):
  with open(result_path := f'{absltest.TEST_TMPDIR.value}/{name}', "wb") as f:
    yield result_path, f


jax.config.update('jax_enable_compilation_cache', False)


def _generate_diff(actual: str, expected: str) -> str:
  return '\n'.join(
      difflib.unified_diff(
          expected.split('\n'),
          actual.split('\n'),
          fromfile='expected',
          tofile='actual',
          lineterm='',
      )
  )


class InferenceTest(parameterized.TestCase):
  """Test AlphaFold 3 inference."""

  def setUp(self):
    super().setUp()
    small_bfd_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/bfd-first_non_consensus_sequences__subsampled_1000.fasta'
    ).path()
    mgnify_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/mgy_clusters__subsampled_1000.fa'
    ).path()
    uniprot_cluster_annot_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/uniprot_all__subsampled_1000.fasta'
    ).path()
    uniref90_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/uniref90__subsampled_1000.fasta'
    ).path()
    ntrna_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq__subsampled_1000.fasta'
    ).path()
    rfam_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/rfam_14_4_clustered_rep_seq__subsampled_1000.fasta'
    ).path()
    rna_central_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/rnacentral_active_seq_id_90_cov_80_linclust__subsampled_1000.fasta'
    ).path()
    pdb_database_path = testing_data.Data(
        resources.ROOT / 'test_data/miniature_databases/pdb_mmcif'
    ).path()
    seqres_database_path = testing_data.Data(
        resources.ROOT
        / 'test_data/miniature_databases/pdb_seqres_2022_09_28__subsampled_1000.fasta'
    ).path()

    self._data_pipeline_config = pipeline.DataPipelineConfig(
        jackhmmer_binary_path=_JACKHMMER_BINARY_PATH,
        nhmmer_binary_path=_NHMMER_BINARY_PATH,
        hmmalign_binary_path=_HMMALIGN_BINARY_PATH,
        hmmsearch_binary_path=_HMMSEARCH_BINARY_PATH,
        hmmbuild_binary_path=_HMMBUILD_BINARY_PATH,
        small_bfd_database_path=small_bfd_database_path,
        mgnify_database_path=mgnify_database_path,
        uniprot_cluster_annot_database_path=uniprot_cluster_annot_database_path,
        uniref90_database_path=uniref90_database_path,
        ntrna_database_path=ntrna_database_path,
        rfam_database_path=rfam_database_path,
        rna_central_database_path=rna_central_database_path,
        pdb_database_path=pdb_database_path,
        seqres_database_path=seqres_database_path,
        max_template_date=datetime.date(2021, 9, 30),
    )
    test_input = {
        'name': '5tgy',
        'modelSeeds': [1234],
        'sequences': [
            {
                'protein': {
                    'id': 'P',
                    'sequence': (
                        'SEFEKLRQTGDELVQAFQRLREIFDKGDDDSLEQVLEEIEELIQKHRQLFDNRQEAADTEAAKQGDQWVQLFQRFREAIDKGDKDSLEQLLEELEQALQKIRELAEKKN'
                    ),
                    'modifications': [],
                    'unpairedMsa': None,
                    'pairedMsa': None,
                }
            },
            {'ligand': {'id': 'LL', 'ccdCodes': ['7BU']}},
        ],
        'dialect': folding_input.JSON_DIALECT,
        'version': folding_input.JSON_VERSION,
    }
    self._test_input_json = json.dumps(test_input)
    self._model_config = run_alphafold.make_model_config(
        flash_attention_implementation='triton',
        return_embeddings=True,
        return_distogram=True,
    )
    self._runner = run_alphafold.ModelRunner(
        config=self._model_config,
        device=jax.local_devices()[0],
        model_dir=pathlib.Path(run_alphafold.MODEL_DIR.value),
    )

  def test_model_inference(self):
    """Run model inference and assert that output exists."""
    featurised_examples = pickle.loads(
        (resources.ROOT / 'test_data' / 'featurised_example.pkl').read_bytes()
    )

    self.assertLen(featurised_examples, 1)
    featurised_example = featurised_examples[0]
    result = self._runner.run_inference(
        featurised_example, jax.random.PRNGKey(0)
    )
    self.assertIsNotNone(result)
    inference_results = self._runner.extract_inference_results(
        batch=featurised_example, result=result, target_name='target'
    )
    embeddings = self._runner.extract_embeddings(
        result=result,
        num_tokens=len(inference_results[0].metadata['token_chain_ids']),
    )
    self.assertLen(embeddings, 2)

  def test_process_fold_input_runs_only_inference(self):
    with self.assertRaisesRegex(ValueError, 'missing unpaired MSA.'):
      run_alphafold.process_fold_input(
          fold_input=folding_input.Input.from_json(self._test_input_json),
          # No data pipeline config, so featurisation will run first, and fail
          # since the input is missing MSAs.
          data_pipeline_config=None,
          model_runner=self._runner,
          output_dir=self.create_tempdir().full_path,
      )

  @parameterized.named_parameters(
      {
          'testcase_name': 'default_bucket',
          'bucket': None,
          'seed': 1,
      },
      {
          'testcase_name': 'bucket_1024',
          'bucket': 1024,
          'seed': 42,
      },
  )
  def test_inference(self, bucket, seed):
    """Run AlphaFold 3 inference."""

    ### Prepare inputs with modified seed.
    fold_input = folding_input.Input.from_json(self._test_input_json)
    fold_input = dataclasses.replace(fold_input, rng_seeds=[seed])

    output_dir = self.create_tempdir().full_path
    actual = run_alphafold.process_fold_input(
        fold_input,
        self._data_pipeline_config,
        model_runner=run_alphafold.ModelRunner(
            config=self._model_config,
            device=jax.local_devices(backend='gpu')[0],
            model_dir=pathlib.Path(run_alphafold.MODEL_DIR.value),
        ),
        output_dir=output_dir,
        buckets=None if bucket is None else [bucket],
    )
    logging.info('finished get_inference_result')
    expected_model_cif_filename = f'{fold_input.sanitised_name()}_model.cif'
    expected_summary_confidences_filename = (
        f'{fold_input.sanitised_name()}_summary_confidences.json'
    )
    expected_confidences_filename = (
        f'{fold_input.sanitised_name()}_confidences.json'
    )
    expected_data_json_filename = f'{fold_input.sanitised_name()}_data.json'

    prefix = f'seed-{seed}'
    self.assertSameElements(
        os.listdir(output_dir),
        [
            # Subdirectories, one for each sample and one for embeddings.
            f'{prefix}_sample-0',
            f'{prefix}_sample-1',
            f'{prefix}_sample-2',
            f'{prefix}_sample-3',
            f'{prefix}_sample-4',
            f'{prefix}_embeddings',
            f'{prefix}_distogram',
            # Top ranking result.
            expected_confidences_filename,
            expected_model_cif_filename,
            expected_summary_confidences_filename,
            # Ranking scores for all samples.
            f'{fold_input.sanitised_name()}_ranking_scores.csv',
            # The input JSON defining the job.
            expected_data_json_filename,
            # The output terms of use.
            'TERMS_OF_USE.md',
        ],
    )

    for sample_index in range(5):
      sample_dir = os.path.join(output_dir, f'{prefix}_sample-{sample_index}')
      sample_prefix = (
          f'{fold_input.sanitised_name()}_seed-{seed}_sample-{sample_index}'
      )
      self.assertSameElements(
          os.listdir(sample_dir),
          [
              f'{sample_prefix}_confidences.json',
              f'{sample_prefix}_model.cif',
              f'{sample_prefix}_summary_confidences.json',
          ],
      )

    embeddings_dir = os.path.join(output_dir, f'{prefix}_embeddings')
    embeddings_filename = (
        f'{fold_input.sanitised_name()}_{prefix}_embeddings.npz'
    )
    self.assertSameElements(os.listdir(embeddings_dir), [embeddings_filename])

    with open(os.path.join(embeddings_dir, embeddings_filename), 'rb') as f:
      embeddings = np.load(f)
      self.assertSameElements(
          embeddings.keys(), ['single_embeddings', 'pair_embeddings']
      )
      # Ligand 7BU has 41 tokens.
      num_tokens = len(fold_input.protein_chains[0].sequence) + 41
      self.assertEqual(embeddings['single_embeddings'].shape, (num_tokens, 384))
      self.assertEqual(embeddings['single_embeddings'].dtype, np.float16)
      self.assertEqual(
          embeddings['pair_embeddings'].shape, (num_tokens, num_tokens, 128)
      )
      self.assertEqual(embeddings['pair_embeddings'].dtype, np.float16)

    distogram_dir = os.path.join(output_dir, f'{prefix}_distogram')
    distogram_filename = f'{fold_input.sanitised_name()}_{prefix}_distogram.npz'
    self.assertSameElements(os.listdir(distogram_dir), [distogram_filename])

    with open(os.path.join(distogram_dir, distogram_filename), 'rb') as f:
      distogram = np.load(f)['distogram']
      self.assertEqual(distogram.shape, (num_tokens, num_tokens, 64))
      self.assertEqual(distogram.dtype, np.float16)

    with open(os.path.join(output_dir, expected_data_json_filename), 'rt') as f:
      actual_input_json = json.load(f)

    self.assertEqual(
        actual_input_json['sequences'][0]['protein']['sequence'],
        fold_input.protein_chains[0].sequence,
    )
    self.assertSequenceEqual(
        actual_input_json['sequences'][1]['ligand']['ccdCodes'],
        fold_input.ligands[0].ccd_ids,
    )
    self.assertNotEmpty(
        actual_input_json['sequences'][0]['protein']['unpairedMsa']
    )
    self.assertNotEmpty(
        actual_input_json['sequences'][0]['protein']['pairedMsa']
    )
    self.assertIsNotNone(
        actual_input_json['sequences'][0]['protein']['templates']
    )

    ranking_scores_filename = (
        f'{fold_input.sanitised_name()}_ranking_scores.csv'
    )
    with open(os.path.join(output_dir, ranking_scores_filename), 'rt') as f:
      ranking_scores = list(csv.DictReader(f))

    self.assertLen(ranking_scores, 5)
    self.assertEqual([int(s['seed']) for s in ranking_scores], [seed] * 5)
    self.assertEqual(
        [int(s['sample']) for s in ranking_scores], [0, 1, 2, 3, 4]
    )

    # Ranking score should be in the expected range for all samples.
    ranking_scores = [float(s['ranking_score']) for s in ranking_scores]
    lower = 0.66
    upper = 0.78
    scores_ok = [lower <= score <= upper for score in ranking_scores]
    if not all(scores_ok):
      printable_scores = [f'{score:.2f}' for score in ranking_scores]
      self.fail(
          f'Ranking scores {printable_scores} not in expected range '
          f'[{lower:.2f}, {upper:.2f}]'
      )

    with open(os.path.join(output_dir, 'TERMS_OF_USE.md'), 'rt') as f:
      actual_terms_of_use = f.read()
    self.assertStartsWith(
        actual_terms_of_use, '# ALPHAFOLD 3 OUTPUT TERMS OF USE'
    )

    bucket_label = 'default' if bucket is None else bucket
    output_filename = f'run_alphafold_test_output_bucket_{bucket_label}.pkl'

    # Convert to dict to enable simple serialization.
    actual_dict = [
        dict(
            seed=actual_inf.seed,
            inference_results=actual_inf.inference_results,
            full_fold_input=actual_inf.full_fold_input,
        )
        for actual_inf in actual
    ]
    with _output(output_filename) as (_, output):
      output.write(pickle.dumps(actual_dict))

    logging.info('Comparing inference results with expected values.')

    ### Assert that output is as expected.
    expected_dict = pickle.loads(
        (
            resources.ROOT
            / 'test_data'
            / 'alphafold_run_outputs'
            / output_filename
        ).read_bytes()
    )
    expected = [
        run_alphafold.ResultsForSeed(**expected_inf)
        for expected_inf in expected_dict
    ]

    actual_rmsds = []
    mask_proportions = []
    actual_masked_rmsds = []
    for actual_inf, expected_inf in zip(actual, expected, strict=True):
      for actual_inf, expected_inf in zip(
          actual_inf.inference_results,
          expected_inf.inference_results,
          strict=True,
      ):
        # Make sure the token chain IDs are the same as the input chain IDs.
        self.assertEqual(
            actual_inf.metadata['token_chain_ids'],
            ['P'] * len(fold_input.protein_chains[0].sequence) + ['LL'] * 41,
        )
        # All atom occupancies should be 1.0.
        np.testing.assert_array_equal(
            actual_inf.predicted_structure.atom_occupancy,
            [1.0] * actual_inf.predicted_structure.num_atoms,
        )
        actual_rmsds.append(
            alignment.rmsd_from_coords(
                decoy_coords=actual_inf.predicted_structure.coords,
                gt_coords=expected_inf.predicted_structure.coords,
            )
        )
        # Mask out atoms with b_factor < 80.0 (i.e. lower confidence regions).
        mask = actual_inf.predicted_structure.atom_b_factor > 80.0
        mask_proportions.append(
            np.sum(mask) / actual_inf.predicted_structure.num_atoms
        )
        actual_masked_rmsds.append(
            alignment.rmsd_from_coords(
                decoy_coords=actual_inf.predicted_structure.coords,
                gt_coords=expected_inf.predicted_structure.coords,
                include_idxs=mask,
            )
        )
    # 5tgy is stably predicted, samples should be all within 3.0 RMSD
    # regardless of seed, bucket, device type, etc.
    if any(rmsd > 3.0 for rmsd in actual_rmsds):
      self.fail(f'Full RMSD too high: {actual_rmsds=}')
    # Check proportion of atoms with b_factor > 80 is at least 70%.
    if any(prop < 0.7 for prop in mask_proportions):
      self.fail(f'Too many residues with low pLDDT: {mask_proportions=}')
    # Check masked RMSD is within tolerance (lower than full RMSD due to masking
    # of lower confidence regions).
    if any(rmsd > 1.4 for rmsd in actual_masked_rmsds):
      self.fail(f'Masked RMSD too high: {actual_masked_rmsds=}')


if __name__ == '__main__':
  absltest.main()


================================================
FILE: src/alphafold3/__init__.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""An implementation of the inference pipeline of AlphaFold 3."""


================================================
FILE: src/alphafold3/build_data.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Script for building intermediate data."""

from importlib import resources
import os
import pathlib
import site

import alphafold3.constants.converters
from alphafold3.constants.converters import ccd_pickle_gen
from alphafold3.constants.converters import chemical_component_sets_gen


def build_data():
  """Builds intermediate data."""
  libcifpp_data_dir = os.environ.get('LIBCIFPP_DATA_DIR')
  if libcifpp_data_dir:
    cif_path = pathlib.Path(libcifpp_data_dir) / 'components.cif'
  else:
    for site_path in site.getsitepackages():
      path = pathlib.Path(site_path) / 'share/libcifpp/components.cif'
      if path.exists():
        cif_path = path
        break
    else:
      raise ValueError(
          'Could not find components.cif. If libcifpp is installed in a'
          ' non-standard location, please set the LIBCIFPP_DATA_DIR environment'
          ' variable to the directory where libcifpp is installed.'
      )

  out_root = resources.files(alphafold3.constants.converters)
  ccd_pickle_path = out_root.joinpath('ccd.pickle')
  chemical_component_sets_pickle_path = out_root.joinpath(
      'chemical_component_sets.pickle'
  )
  ccd_pickle_gen.main(['', str(cif_path), str(ccd_pickle_path)])
  chemical_component_sets_gen.main(
      ['', str(chemical_component_sets_pickle_path)]
  )


================================================
FILE: src/alphafold3/common/base_config.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Config for the protein folding model and experiment."""

from collections.abc import Mapping
import copy
import dataclasses
import types
import typing
from typing import Any, ClassVar, TypeVar


_T = TypeVar('_T')
_ConfigT = TypeVar('_ConfigT', bound='BaseConfig')


def _strip_optional(t: type[Any]) -> type[Any]:
  """Transforms type annotations of the form `T | None` to `T`."""
  if typing.get_origin(t) in (typing.Union, types.UnionType):
    args = set(typing.get_args(t)) - {types.NoneType}
    if len(args) == 1:
      return args.pop()
  return t


_NO_UPDATE = object()


class _Autocreate:

  def __init__(self, **defaults: Any):
    self.defaults = defaults


def autocreate(**defaults: Any) -> Any:
  """Marks a field as having a default factory derived from its type."""
  return _Autocreate(**defaults)


def _clone_field(
    field: dataclasses.Field[_T], new_default: _T
) -> dataclasses.Field[_T]:
  if new_default is _NO_UPDATE:
    return copy.copy(field)
  return dataclasses.field(
      default=new_default,
      init=True,
      kw_only=True,
      repr=field.repr,
      hash=field.hash,
      compare=field.compare,
      metadata=field.metadata,
  )


@typing.dataclass_transform()
class ConfigMeta(type):
  """Metaclass that synthesizes a __post_init__ that coerces dicts to Config subclass instances."""

  def __new__(mcs, name, bases, classdict):
    cls = super().__new__(mcs, name, bases, classdict)

    def _coercable_fields(self) -> Mapping[str, tuple[ConfigMeta, Any]]:
      type_hints = typing.get_type_hints(self.__class__)
      fields = dataclasses.fields(self.__class__)
      field_to_type_and_default = {
          field.name: (_strip_optional(type_hints[field.name]), field.default)
          for field in fields
      }
      coercable_fields = {
          f: t
          for f, t in field_to_type_and_default.items()
          if issubclass(type(t[0]), ConfigMeta)
      }
      return coercable_fields

    cls._coercable_fields = property(_coercable_fields)

    old_post_init = getattr(cls, '__post_init__', None)

    def _post_init(self) -> None:
      # Use get_type_hints instead of Field.type to ensure that forward
      # references are resolved.
      for field_name, (
          field_type,
          field_default,
      ) in self._coercable_fields.items():  # pylint: disable=protected-access
        field_value = getattr(self, field_name)
        if field_value is None:
          continue
        try:
          match field_value:
            case _Autocreate():
              # Construct from field defaults.
              setattr(self, field_name, field_type(**field_value.defaults))
            case Mapping():
              # Field value is not yet a `Config` instance; Assume we can create
              # one by splatting keys and values.
              args = {}
              # Apply default args first, if present.
              if isinstance(field_default, _Autocreate):
                args.update(field_default.defaults)
              args.update(field_value)
              setattr(self, field_name, field_type(**args))
            case _:
              pass
        except TypeError as e:
          raise TypeError(
              f'Failure while coercing field {field_name!r} of'
              f' {self.__class__.__qualname__}'
          ) from e
      if old_post_init:
        old_post_init(self)

    cls.__post_init__ = _post_init

    return dataclasses.dataclass(kw_only=True)(cls)


class BaseConfig(metaclass=ConfigMeta):
  """Config base class.

  Subclassing Config automatically makes the subclass a kw_only dataclass with
  a `__post_init__` that coerces Config-subclass field values from mappings to
  instances of the right type.
  """
  # Provided by dataclasses.make_dataclass
  __dataclass_fields__: ClassVar[dict[str, dataclasses.Field[Any]]]

  # Overridden by metaclass
  @property
  def _coercable_fields(self) -> Mapping[str, tuple[type['BaseConfig'], Any]]:
    return {}

  def as_dict(self) -> Mapping[str, Any]:
    result = dataclasses.asdict(self)
    for field_name in self._coercable_fields:
      field_value = getattr(self, field_name, None)
      if isinstance(field_value, BaseConfig):
        result[field_name] = field_value.as_dict()
    return result


================================================
FILE: src/alphafold3/common/folding_input.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Model input dataclass."""

from collections.abc import Collection, Iterator, Mapping, Sequence
import dataclasses
import gzip
import json
import logging
import lzma
import os
import pathlib
import random
import re
import string
from typing import Any, Final, Self, TypeAlias, cast

from alphafold3 import structure
from alphafold3.constants import chemical_components
from alphafold3.constants import mmcif_names
from alphafold3.constants import residue_names
from alphafold3.cpp import cif_dict
from alphafold3.structure import mmcif as mmcif_lib
import rdkit.Chem as rd_chem
import zstandard as zstd


BondAtomId: TypeAlias = tuple[str, int, str]

JSON_DIALECT: Final[str] = 'alphafold3'
JSON_VERSIONS: Final[tuple[int, ...]] = (1, 2, 3, 4)
JSON_VERSION: Final[int] = JSON_VERSIONS[-1]

ALPHAFOLDSERVER_JSON_DIALECT: Final[str] = 'alphafoldserver'
ALPHAFOLDSERVER_JSON_VERSION: Final[int] = 1


def _validate_keys(actual: Collection[str], expected: Collection[str]):
  """Validates that the JSON doesn't contain any extra unwanted keys."""
  if bad_keys := set(actual) - set(expected):
    raise ValueError(f'Unexpected JSON keys in: {", ".join(sorted(bad_keys))}')


def _read_file(path: pathlib.Path, json_path: pathlib.Path | None) -> str:
  """Reads a maybe compressed (gzip, xz, zstd) file from the given path.

  Args:
    path: The path to the file to read. This can be either absolute path, or a
      path relative to the JSON file path.
    json_path: The path to the JSON file. If None, the path must be absolute.

  Returns:
    The contents of the file.
  """
  if not path.is_absolute():
    if json_path is None:
      raise ValueError('json_path must be specified if path is not absolute.')
    path = (json_path.parent / path).resolve()

  with open(path, 'rb') as f:
    first_six_bytes = f.read(6)
    f.seek(0)

    # Detect the compression type using the magic number in the header.
    if first_six_bytes[:2] == b'\x1f\x8b':
      with gzip.open(f, 'rt') as gzip_f:
        return cast(str, gzip_f.read())
    elif first_six_bytes == b'\xfd\x37\x7a\x58\x5a\x00':
      with lzma.open(f, 'rt') as xz_f:
        return cast(str, xz_f.read())
    elif first_six_bytes[:4] == b'\x28\xb5\x2f\xfd':
      with zstd.open(f, 'rt') as zstd_f:
        return cast(str, zstd_f.read())
    else:
      return f.read().decode('utf-8')


class Template:
  """Structural template input."""

  __slots__ = ('_mmcif', '_query_to_template')

  def __init__(self, *, mmcif: str, query_to_template_map: Mapping[int, int]):
    """Initializes the template.

    Args:
      mmcif: The structural template in mmCIF format. The mmCIF should have only
        one protein chain.
      query_to_template_map: A mapping from query residue index to template
        residue index.
    """
    self._mmcif = mmcif
    # Needed to make the Template class hashable.
    self._query_to_template = tuple(query_to_template_map.items())

  @property
  def query_to_template_map(self) -> Mapping[int, int]:
    return dict(self._query_to_template)

  @property
  def mmcif(self) -> str:
    return self._mmcif

  def __hash__(self) -> int:
    return hash((self._mmcif, tuple(sorted(self._query_to_template))))

  def __eq__(self, other: Self) -> bool:
    mmcifs_equal = self._mmcif == other._mmcif
    maps_equal = sorted(self._query_to_template) == sorted(
        other._query_to_template
    )
    return mmcifs_equal and maps_equal


class ProteinChain:
  """Protein chain input."""

  __slots__ = (
      '_id',
      '_sequence',
      '_ptms',
      '_description',
      '_paired_msa',
      '_unpaired_msa',
      '_templates',
  )

  def __init__(
      self,
      *,
      id: str,  # pylint: disable=redefined-builtin
      sequence: str,
      ptms: Sequence[tuple[str, int]],
      description: str | None = None,
      paired_msa: str | None = None,
      unpaired_msa: str | None = None,
      templates: Sequence[Template] | None = None,
  ):
    """Initializes a single protein chain input.

    Args:
      id: Unique protein chain identifier.
      sequence: The amino acid sequence of the chain.
      ptms: A list of tuples containing the post-translational modification type
        and the (1-based) residue index where the modification is applied.
      description: An optional textual description of the protein chain.
      paired_msa: Paired A3M-formatted MSA for this chain. This MSA is not
        deduplicated and will be used to compute paired features. If None, this
        field is unset and must be filled in by the data pipeline before
        featurisation. If set to an empty string, it will be treated as a custom
        MSA with no sequences.
      unpaired_msa: Unpaired A3M-formatted MSA for this chain. This will be
        deduplicated and used to compute unpaired features. If None, this field
        is unset and must be filled in by the data pipeline before
        featurisation. If set to an empty string, it will be treated as a custom
        MSA with no sequences.
      templates: A list of structural templates for this chain. If None, this
        field is unset and must be filled in by the data pipeline before
        featurisation. The list can be empty or contain up to 20 templates.
    """
    if not all(res.isalpha() for res in sequence):
      raise ValueError(f'Protein must contain only letters, got "{sequence}"')
    if any(not 0 < mod[1] <= len(sequence) for mod in ptms):
      raise ValueError(f'Invalid protein modification index: {ptms}')
    if any(mod[0].startswith('CCD_') for mod in ptms):
      raise ValueError(
          f'Protein ptms must not contain the "CCD_" prefix, got {ptms}'
      )
    # Use hashable containers for ptms and templates.
    self._id = id
    self._sequence = sequence
    self._ptms = tuple(ptms)
    self._description = description
    self._paired_msa = paired_msa
    self._unpaired_msa = unpaired_msa
    self._templates = tuple(templates) if templates is not None else None

  @property
  def id(self) -> str:
    return self._id

  @property
  def sequence(self) -> str:
    """Returns a single-letter sequence, taking modifications into account.

    Uses 'X' for all unknown residues.
    """
    return ''.join([
        residue_names.letters_three_to_one(r, default='X')
        for r in self.to_ccd_sequence()
    ])

  @property
  def ptms(self) -> Sequence[tuple[str, int]]:
    return self._ptms

  @property
  def description(self) -> str | None:
    return self._description

  @property
  def paired_msa(self) -> str | None:
    return self._paired_msa

  @property
  def unpaired_msa(self) -> str | None:
    return self._unpaired_msa

  @property
  def templates(self) -> Sequence[Template] | None:
    return self._templates

  def __len__(self) -> int:
    return len(self._sequence)

  def __eq__(self, other: Self) -> bool:
    return (
        self._id == other._id
        and self._sequence == other._sequence
        and self._ptms == other._ptms
        and self._description == other._description
        and self._paired_msa == other._paired_msa
        and self._unpaired_msa == other._unpaired_msa
        and self._templates == other._templates
    )

  def __hash__(self) -> int:
    return hash((
        self._id,
        self._sequence,
        self._ptms,
        self._description,
        self._paired_msa,
        self._unpaired_msa,
        self._templates,
    ))

  def hash_without_id(self) -> int:
    """Returns a hash ignoring the ID - useful for deduplication."""
    return hash((
        self._sequence,
        self._ptms,
        self._description,
        self._paired_msa,
        self._unpaired_msa,
        self._templates,
    ))

  @classmethod
  def from_alphafoldserver_dict(
      cls, json_dict: Mapping[str, Any], seq_id: str
  ) -> Self:
    """Constructs ProteinChain from the AlphaFoldServer JSON dict."""
    _validate_keys(
        json_dict.keys(),
        {
            'sequence',
            'glycans',
            'modifications',
            'count',
            'maxTemplateDate',
            'useStructureTemplate',
        },
    )
    sequence = json_dict['sequence']

    if 'glycans' in json_dict:
      raise ValueError(
          f'Specifying glycans in the `{ALPHAFOLDSERVER_JSON_DIALECT}` format'
          ' is not supported.'
      )

    if 'maxTemplateDate' in json_dict:
      raise ValueError(
          f'Specifying maxTemplateDate in the `{ALPHAFOLDSERVER_JSON_DIALECT}`'
          ' format is not supported, use the --max_template_date flag instead.'
      )

    templates = None  # Search for templates unless explicitly disabled.
    if not json_dict.get('useStructureTemplate', True):
      templates = []  # Do not use any templates.

    ptms = [
        (mod['ptmType'].removeprefix('CCD_'), mod['ptmPosition'])
        for mod in json_dict.get('modifications', [])
    ]
    return cls(id=seq_id, sequence=sequence, ptms=ptms, templates=templates)

  @classmethod
  def from_dict(
      cls,
      json_dict: Mapping[str, Any],
      json_path: pathlib.Path | None = None,
      seq_id: str | None = None,
  ) -> Self:
    """Constructs ProteinChain from the AlphaFold JSON dict."""
    json_dict = json_dict['protein']
    _validate_keys(
        json_dict.keys(),
        {
            'id',
            'sequence',
            'modifications',
            'description',
            'unpairedMsa',
            'unpairedMsaPath',
            'pairedMsa',
            'pairedMsaPath',
            'templates',
        },
    )

    sequence = json_dict['sequence']
    ptms = [
        (mod['ptmType'], mod['ptmPosition'])
        for mod in json_dict.get('modifications', [])
    ]

    unpaired_msa = json_dict.get('unpairedMsa', None)
    unpaired_msa_path = json_dict.get('unpairedMsaPath', None)
    if unpaired_msa and unpaired_msa_path:
      raise ValueError('Only one of unpairedMsa/unpairedMsaPath can be set.')
    if (
        unpaired_msa
        and len(unpaired_msa) < 256
        and os.path.exists(unpaired_msa)
    ):
      raise ValueError(
          'Set the unpaired MSA path using the "unpairedMsaPath" field.'
      )
    elif unpaired_msa_path:
      unpaired_msa = _read_file(pathlib.Path(unpaired_msa_path), json_path)

    paired_msa = json_dict.get('pairedMsa', None)
    paired_msa_path = json_dict.get('pairedMsaPath', None)
    if paired_msa and paired_msa_path:
      raise ValueError('Only one of pairedMsa/pairedMsaPath can be set.')
    if paired_msa and len(paired_msa) < 256 and os.path.exists(paired_msa):
      raise ValueError(
          'Set the paired MSA path using the "pairedMsaPath" field.'
      )
    elif paired_msa_path:
      paired_msa = _read_file(pathlib.Path(paired_msa_path), json_path)

    raw_templates = json_dict.get('templates', None)

    if raw_templates is None:
      templates = None
    else:
      templates = []
      for raw_template in raw_templates:
        _validate_keys(
            raw_template.keys(),
            {'mmcif', 'mmcifPath', 'queryIndices', 'templateIndices'},
        )
        mmcif = raw_template.get('mmcif', None)
        mmcif_path = raw_template.get('mmcifPath', None)
        if mmcif and mmcif_path:
          raise ValueError('Only one of mmcif/mmcifPath can be set.')
        if mmcif and len(mmcif) < 256 and os.path.exists(mmcif):
          raise ValueError('Set the template path using the "mmcifPath" field.')
        if mmcif_path:
          mmcif = _read_file(pathlib.Path(mmcif_path), json_path)
        query_to_template_map = dict(
            zip(raw_template['queryIndices'], raw_template['templateIndices'])
        )
        templates.append(
            Template(mmcif=mmcif, query_to_template_map=query_to_template_map)
        )

    return cls(
        id=seq_id or json_dict['id'],
        sequence=sequence,
        ptms=ptms,
        description=json_dict.get('description', None),
        paired_msa=paired_msa,
        unpaired_msa=unpaired_msa,
        templates=templates,
    )

  def to_dict(
      self, seq_id: str | Sequence[str] | None = None
  ) -> Mapping[str, Mapping[str, Any]]:
    """Converts ProteinChain to an AlphaFold JSON dict."""
    if self._templates is None:
      templates = None
    else:
      templates = [
          {
              'mmcif': template.mmcif,
              'queryIndices': list(template.query_to_template_map.keys()),
              'templateIndices': (
                  list(template.query_to_template_map.values()) or None
              ),
          }
          for template in self._templates
      ]
    contents = {
        'id': seq_id or self._id,
        'sequence': self._sequence,
        'modifications': [
            {'ptmType': ptm[0], 'ptmPosition': ptm[1]} for ptm in self._ptms
        ],
        'unpairedMsa': self._unpaired_msa,
        'pairedMsa': self._paired_msa,
        'templates': templates,
    }
    if self._description is not None:
      contents['description'] = self._description
    return {'protein': contents}

  def to_ccd_sequence(self) -> Sequence[str]:
    """Converts to a sequence of CCD codes."""
    ccd_coded_seq = [
        residue_names.PROTEIN_COMMON_ONE_TO_THREE.get(res, residue_names.UNK)
        for res in self._sequence
    ]
    for ptm_code, ptm_index in self._ptms:
      ccd_coded_seq[ptm_index - 1] = ptm_code
    return ccd_coded_seq

  def fill_missing_fields(self) -> Self:
    """Fill missing MSA and template fields with default values."""
    return ProteinChain(
        id=self.id,
        sequence=self._sequence,
        ptms=self._ptms,
        description=self._description,
        unpaired_msa=self._unpaired_msa or '',
        paired_msa=self._paired_msa or '',
        templates=self._templates or [],
    )


class RnaChain:
  """RNA chain input."""

  __slots__ = (
      '_id',
      '_sequence',
      '_modifications',
      '_description',
      '_unpaired_msa',
  )

  def __init__(
      self,
      *,
      id: str,  # pylint: disable=redefined-builtin
      sequence: str,
      modifications: Sequence[tuple[str, int]],
      description: str | None = None,
      unpaired_msa: str | None = None,
  ):
    """Initializes a single strand RNA chain input.

    Args:
      id: Unique RNA chain identifier.
      sequence: The RNA sequence of the chain.
      modifications: A list of tuples containing the modification type and the
        (1-based) residue index where the modification is applied.
      description: An optional textual description of the RNA chain.
      unpaired_msa: Unpaired A3M-formatted MSA for this chain. This will be
        deduplicated and used to compute unpaired features. If None, this field
        is unset and must be filled in by the data pipeline before
        featurisation. If set to an empty string, it will be treated as a custom
        MSA with no sequences.
    """
    if not all(res.isalpha() for res in sequence):
      raise ValueError(f'RNA must contain only letters, got "{sequence}"')
    if any(not 0 < mod[1] <= len(sequence) for mod in modifications):
      raise ValueError(f'Invalid RNA modification index: {modifications}')
    if any(mod[0].startswith('CCD_') for mod in modifications):
      raise ValueError(
          'RNA modifications must not contain the "CCD_" prefix, got'
          f' {modifications}'
      )
    self._id = id
    self._sequence = sequence
    # Use hashable container for modifications.
    self._modifications = tuple(modifications)
    self._description = description
    self._unpaired_msa = unpaired_msa

  @property
  def id(self) -> str:
    return self._id

  @property
  def sequence(self) -> str:
    """Returns a single-letter sequence, taking modifications into account.

    Uses 'N' for all unknown residues.
    """
    return ''.join([
        residue_names.letters_three_to_one(r, default='N')
        for r in self.to_ccd_sequence()
    ])

  @property
  def modifications(self) -> Sequence[tuple[str, int]]:
    return self._modifications

  @property
  def description(self) -> str | None:
    return self._description

  @property
  def unpaired_msa(self) -> str | None:
    return self._unpaired_msa

  def __len__(self) -> int:
    return len(self._sequence)

  def __eq__(self, other: Self) -> bool:
    return (
        self._id == other._id
        and self._sequence == other._sequence
        and self._modifications == other._modifications
        and self._description == other._description
        and self._unpaired_msa == other._unpaired_msa
    )

  def __hash__(self) -> int:
    return hash((
        self._id,
        self._sequence,
        self._modifications,
        self._description,
        self._unpaired_msa,
    ))

  def hash_without_id(self) -> int:
    """Returns a hash ignoring the ID - useful for deduplication."""
    return hash((
        self._sequence,
        self._modifications,
        self._description,
        self._unpaired_msa,
    ))

  @classmethod
  def from_alphafoldserver_dict(
      cls, json_dict: Mapping[str, Any], seq_id: str
  ) -> Self:
    """Constructs RnaChain from the AlphaFoldServer JSON dict."""
    _validate_keys(json_dict.keys(), {'sequence', 'modifications', 'count'})
    sequence = json_dict['sequence']
    modifications = [
        (mod['modificationType'].removeprefix('CCD_'), mod['basePosition'])
        for mod in json_dict.get('modifications', [])
    ]
    return cls(id=seq_id, sequence=sequence, modifications=modifications)

  @classmethod
  def from_dict(
      cls,
      json_dict: Mapping[str, Any],
      json_path: pathlib.Path | None = None,
      seq_id: str | None = None,
  ) -> Self:
    """Constructs RnaChain from the AlphaFold JSON dict."""
    json_dict = json_dict['rna']
    _validate_keys(
        json_dict.keys(),
        {
            'id',
            'sequence',
            'modifications',
            'description',
            'unpairedMsa',
            'unpairedMsaPath',
        },
    )
    sequence = json_dict['sequence']
    modifications = [
        (mod['modificationType'], mod['basePosition'])
        for mod in json_dict.get('modifications', [])
    ]

    unpaired_msa = json_dict.get('unpairedMsa', None)
    unpaired_msa_path = json_dict.get('unpairedMsaPath', None)
    if unpaired_msa and unpaired_msa_path:
      raise ValueError('Only one of unpairedMsa/unpairedMsaPath can be set.')
    if (
        unpaired_msa
        and len(unpaired_msa) < 256
        and os.path.exists(unpaired_msa)
    ):
      raise ValueError(
          'Set the unpaired MSA path using the "unpairedMsaPath" field.'
      )
    elif unpaired_msa_path:
      unpaired_msa = _read_file(pathlib.Path(unpaired_msa_path), json_path)

    return cls(
        id=seq_id or json_dict['id'],
        sequence=sequence,
        modifications=modifications,
        description=json_dict.get('description', None),
        unpaired_msa=unpaired_msa,
    )

  def to_dict(
      self, seq_id: str | Sequence[str] | None = None
  ) -> Mapping[str, Mapping[str, Any]]:
    """Converts RnaChain to an AlphaFold JSON dict."""
    contents = {
        'id': seq_id or self._id,
        'sequence': self._sequence,
        'modifications': [
            {'modificationType': mod[0], 'basePosition': mod[1]}
            for mod in self._modifications
        ],
        'unpairedMsa': self._unpaired_msa,
    }
    if self._description is not None:
      contents['description'] = self._description
    return {'rna': contents}

  def to_ccd_sequence(self) -> Sequence[str]:
    """Converts to a sequence of CCD codes."""
    mapping = {r: r for r in residue_names.RNA_TYPES}  # Same 1-letter and CCD.
    ccd_coded_seq = [
        mapping.get(res, residue_names.UNK_RNA) for res in self._sequence
    ]
    for ccd_code, modification_index in self._modifications:
      ccd_coded_seq[modification_index - 1] = ccd_code
    return ccd_coded_seq

  def fill_missing_fields(self) -> Self:
    """Fill missing MSA fields with default values."""
    return RnaChain(
        id=self.id,
        sequence=self.sequence,
        modifications=self.modifications,
        unpaired_msa=self._unpaired_msa or '',
    )


class DnaChain:
  """Single strand DNA chain input."""

  __slots__ = ('_id', '_sequence', '_modifications', '_description')

  def __init__(
      self,
      *,
      id: str,  # pylint: disable=redefined-builtin
      sequence: str,
      modifications: Sequence[tuple[str, int]],
      description: str | None = None,
  ):
    """Initializes a single strand DNA chain input.

    Args:
      id: Unique DNA chain identifier.
      sequence: The DNA sequence of the chain.
      modifications: A list of tuples containing the modification type and the
        (1-based) residue index where the modification is applied.
      description: An optional textual description of the DNA chain.
    """
    if not all(res.isalpha() for res in sequence):
      raise ValueError(f'DNA must contain only letters, got "{sequence}"')
    if any(not 0 < mod[1] <= len(sequence) for mod in modifications):
      raise ValueError(f'Invalid DNA modification index: {modifications}')
    if any(mod[0].startswith('CCD_') for mod in modifications):
      raise ValueError(
          'DNA modifications must not contain the "CCD_" prefix, got'
          f' {modifications}'
      )
    self._id = id
    self._sequence = sequence
    # Use hashable container for modifications.
    self._modifications = tuple(modifications)
    self._description = description

  @property
  def id(self) -> str:
    return self._id

  @property
  def sequence(self) -> str:
    """Returns a single-letter sequence, taking modifications into account.

    Uses 'N' for all unknown residues.
    """
    return ''.join([
        residue_names.letters_three_to_one(r, default='N')
        for r in self.to_ccd_sequence()
    ])

  @property
  def description(self) -> str | None:
    return self._description

  def __len__(self) -> int:
    return len(self._sequence)

  def __eq__(self, other: Self) -> bool:
    return (
        self._id == other._id
        and self._sequence == other._sequence
        and self._modifications == other._modifications
        and self._description == other._description
    )

  def __hash__(self) -> int:
    return hash(
        (self._id, self._sequence, self._modifications, self._description)
    )

  def modifications(self) -> Sequence[tuple[str, int]]:
    return self._modifications

  def hash_without_id(self) -> int:
    """Returns a hash ignoring the ID - useful for deduplication."""
    return hash((self._sequence, self._modifications, self._description))

  @classmethod
  def from_alphafoldserver_dict(
      cls, json_dict: Mapping[str, Any], seq_id: str
  ) -> Self:
    """Constructs DnaChain from the AlphaFoldServer JSON dict."""
    _validate_keys(json_dict.keys(), {'sequence', 'modifications', 'count'})
    sequence = json_dict['sequence']
    modifications = [
        (mod['modificationType'].removeprefix('CCD_'), mod['basePosition'])
        for mod in json_dict.get('modifications', [])
    ]
    return cls(id=seq_id, sequence=sequence, modifications=modifications)

  @classmethod
  def from_dict(
      cls, json_dict: Mapping[str, Any], seq_id: str | None = None
  ) -> Self:
    """Constructs DnaChain from the AlphaFold JSON dict."""
    json_dict = json_dict['dna']
    _validate_keys(
        json_dict.keys(), {'id', 'sequence', 'modifications', 'description'}
    )
    sequence = json_dict['sequence']
    modifications = [
        (mod['modificationType'], mod['basePosition'])
        for mod in json_dict.get('modifications', [])
    ]
    return cls(
        id=seq_id or json_dict['id'],
        sequence=sequence,
        modifications=modifications,
        description=json_dict.get('description', None),
    )

  def to_dict(
      self, seq_id: str | Sequence[str] | None = None
  ) -> Mapping[str, Mapping[str, Any]]:
    """Converts DnaChain to an AlphaFold JSON dict."""
    contents = {
        'id': seq_id or self._id,
        'sequence': self._sequence,
        'modifications': [
            {'modificationType': mod[0], 'basePosition': mod[1]}
            for mod in self._modifications
        ],
    }
    if self._description is not None:
      contents['description'] = self._description
    return {'dna': contents}

  def to_ccd_sequence(self) -> Sequence[str]:
    """Converts to a sequence of CCD codes."""
    ccd_coded_seq = [
        residue_names.DNA_COMMON_ONE_TO_TWO.get(res, residue_names.UNK_DNA)
        for res in self._sequence
    ]
    for ccd_code, modification_index in self._modifications:
      ccd_coded_seq[modification_index - 1] = ccd_code
    return ccd_coded_seq


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class Ligand:
  """Ligand input.

  Attributes:
    id: Unique ligand "chain" identifier.
    ccd_ids: The Chemical Component Dictionary or user-defined CCD IDs of the
      chemical components of the ligand. Typically, this is just a single ID,
      but some ligands are composed of multiple components. If that is the case,
      a bond linking these components should be added to the bonded_atom_pairs
      Input field.
    smiles: The SMILES representation of the ligand.
    description: An optional textual description of the ligand.
  """

  id: str
  ccd_ids: Sequence[str] | None = None
  smiles: str | None = None
  description: str | None = None

  def __post_init__(self):
    if (self.ccd_ids is None) == (self.smiles is None):
      raise ValueError('Ligand must have one of CCD ID or SMILES set.')

    if self.smiles is not None:
      mol = rd_chem.MolFromSmiles(self.smiles)
      if not mol:
        raise ValueError(f'Unable to make RDKit Mol from SMILES: {self.smiles}')

    # Use hashable types for ccd_ids.
    if self.ccd_ids is not None:
      object.__setattr__(self, 'ccd_ids', tuple(self.ccd_ids))

  def __len__(self) -> int:
    if self.ccd_ids is not None:
      return len(self.ccd_ids)
    else:
      return 1

  def hash_without_id(self) -> int:
    """Returns a hash ignoring the ID - useful for deduplication."""
    return hash((self.ccd_ids, self.smiles, self.description))

  @classmethod
  def from_alphafoldserver_dict(
      cls, json_dict: Mapping[str, Any], seq_id: str
  ) -> Self:
    """Constructs Ligand from the AlphaFoldServer JSON dict."""
    # Ligand can be specified either as a ligand, or ion (special-case).
    _validate_keys(json_dict.keys(), {'ligand', 'ion', 'count'})
    if 'ligand' in json_dict:
      return cls(id=seq_id, ccd_ids=[json_dict['ligand'].removeprefix('CCD_')])
    elif 'ion' in json_dict:
      return cls(id=seq_id, ccd_ids=[json_dict['ion']])
    else:
      raise ValueError(f'Unknown ligand type: {json_dict}')

  @classmethod
  def from_dict(
      cls, json_dict: Mapping[str, Any], seq_id: str | None = None
  ) -> Self:
    """Constructs Ligand from the AlphaFold JSON dict."""
    json_dict = json_dict['ligand']
    _validate_keys(
        json_dict.keys(), {'id', 'ccdCodes', 'smiles', 'description'}
    )
    if json_dict.get('ccdCodes') and json_dict.get('smiles'):
      raise ValueError(
          'Ligand cannot have both CCD code and SMILES set at the same time, '
          f'got CCD: {json_dict["ccdCodes"]} and SMILES: {json_dict["smiles"]}'
      )

    if 'ccdCodes' in json_dict:
      ccd_codes = json_dict['ccdCodes']
      if not isinstance(ccd_codes, (list, tuple)):
        raise ValueError(
            'CCD codes must be a list of strings, got '
            f'{type(ccd_codes).__name__} instead: {ccd_codes}'
        )
      return cls(
          id=seq_id or json_dict['id'],
          ccd_ids=ccd_codes,
          description=json_dict.get('description', None),
      )
    elif 'smiles' in json_dict:
      return cls(
          id=seq_id or json_dict['id'],
          smiles=json_dict['smiles'],
          description=json_dict.get('description', None),
      )
    else:
      raise ValueError(f'Unknown ligand type: {json_dict}')

  def to_dict(
      self, seq_id: str | Sequence[str] | None = None
  ) -> Mapping[str, Mapping[str, Any]]:
    """Converts Ligand to an AlphaFold JSON dict."""
    contents = {'id': seq_id or self.id}
    if self.ccd_ids is not None:
      contents['ccdCodes'] = self.ccd_ids
    if self.smiles is not None:
      contents['smiles'] = self.smiles
    if self.description is not None:
      contents['description'] = self.description
    return {'ligand': contents}


def _sample_rng_seed() -> int:
  """Sample a random seed for AlphaFoldServer job."""
  # See https://alphafoldserver.com/faq#what-are-seeds-and-how-are-they-set.
  return random.randint(0, 2**32 - 1)


def _validate_user_ccd_keys(keys: Sequence[str], component_name: str) -> None:
  """Validates the keys of the user-defined CCD dictionary."""
  mandatory_keys = (
      '_chem_comp.id',
      '_chem_comp.name',
      '_chem_comp.type',
      '_chem_comp.formula',
      '_chem_comp.mon_nstd_parent_comp_id',
      '_chem_comp.pdbx_synonyms',
      '_chem_comp.formula_weight',
      '_chem_comp_atom.comp_id',
      '_chem_comp_atom.atom_id',
      '_chem_comp_atom.type_symbol',
      '_chem_comp_atom.charge',
      '_chem_comp_atom.pdbx_model_Cartn_x_ideal',
      '_chem_comp_atom.pdbx_model_Cartn_y_ideal',
      '_chem_comp_atom.pdbx_model_Cartn_z_ideal',
      '_chem_comp_bond.atom_id_1',
      '_chem_comp_bond.atom_id_2',
      '_chem_comp_bond.value_order',
      '_chem_comp_bond.pdbx_aromatic_flag',
  )
  if missing_keys := set(mandatory_keys) - set(keys):
    raise ValueError(
        f'Component {component_name} in the user-defined CCD is missing these'
        f' keys: {missing_keys}'
    )


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class Input:
  """AlphaFold input.

  Attributes:
    name: The name of the target.
    chains: Protein chains, RNA chains, DNA chains, or ligands.
    protein_chains: Protein chains.
    rna_chains: RNA chains.
    dna_chains: Single strand DNA chains.
    ligands: Ligand (including ion) inputs.
    rng_seeds: Random number generator seeds, one for each model execution.
    bonded_atom_pairs: A list of tuples of atoms that are bonded to each other.
      Each atom is defined by a tuple of (chain_id, res_id, atom_name). Chain
      IDs must be set if there are any bonded atoms. Residue IDs are 1-indexed.
      Atoms in ligands defined by SMILES can't be bonded since SMILES doesn't
      define unique atom names.
    user_ccd: Optional user-defined chemical component dictionary in the CIF
      format. This can be used to provide additional CCD entries that are not
      present in the default CCD and thus define arbitrary new ligands. This is
      more expressive than SMILES since it allows to name all atoms within the
      ligand which in turn makes it possible to define bonds using those atoms.
  """

  name: str
  chains: Sequence[ProteinChain | RnaChain | DnaChain | Ligand]
  rng_seeds: Sequence[int]
  bonded_atom_pairs: Sequence[tuple[BondAtomId, BondAtomId]] | None = None
  user_ccd: str | None = None

  def __post_init__(self):
    if not self.rng_seeds:
      raise ValueError('Input must have at least one RNG seed.')

    if not self.name.strip() or not self.sanitised_name():
      raise ValueError(
          'Input name must be non-empty and contain at least one valid'
          ' character (letters, numbers, dots, dashes, underscores).'
      )

    chain_ids = [c.id for c in self.chains]
    if any(not c.id.isalpha() or c.id.islower() for c in self.chains):
      raise ValueError(f'IDs must be upper case letters, got: {chain_ids}')
    if len(set(chain_ids)) != len(chain_ids):
      raise ValueError('Input JSON contains sequences with duplicate IDs.')

    # Use hashable types for chains, rng_seeds, and bonded_atom_pairs.
    object.__setattr__(self, 'chains', tuple(self.chains))
    object.__setattr__(self, 'rng_seeds', tuple(self.rng_seeds))
    if self.bonded_atom_pairs is not None:
      object.__setattr__(
          self, 'bonded_atom_pairs', tuple(self.bonded_atom_pairs)
      )

    if self.user_ccd is not None:
      for component_name, component_cif in cif_dict.parse_multi_data_cif(
          self.user_ccd
      ).items():
        _validate_user_ccd_keys(component_cif.keys(), component_name)

  @property
  def protein_chains(self) -> Sequence[ProteinChain]:
    return [chain for chain in self.chains if isinstance(chain, ProteinChain)]

  @property
  def rna_chains(self) -> Sequence[RnaChain]:
    return [chain for chain in self.chains if isinstance(chain, RnaChain)]

  @property
  def dna_chains(self) -> Sequence[DnaChain]:
    return [chain for chain in self.chains if isinstance(chain, DnaChain)]

  @property
  def ligands(self) -> Sequence[Ligand]:
    return [chain for chain in self.chains if isinstance(chain, Ligand)]

  def sanitised_name(self) -> str:
    """Returns sanitised version of the name that can be used as a filename."""
    spaceless_name = self.name.replace(' ', '_')
    allowed_chars = set(string.ascii_letters + string.digits + '_-.')
    return ''.join(l for l in spaceless_name if l in allowed_chars)

  @classmethod
  def from_alphafoldserver_fold_job(cls, fold_job: Mapping[str, Any]) -> Self:
    """Constructs Input from an AlphaFoldServer fold job."""

    # Validate the fold job has the correct format.
    _validate_keys(
        fold_job.keys(),
        {'name', 'modelSeeds', 'sequences', 'dialect', 'version'},
    )
    if 'dialect' not in fold_job and 'version' not in fold_job:
      dialect = ALPHAFOLDSERVER_JSON_DIALECT
      version = ALPHAFOLDSERVER_JSON_VERSION
    elif 'dialect' in fold_job and 'version' in fold_job:
      dialect = fold_job['dialect']
      version = fold_job['version']
    else:
      raise ValueError(
          'AlphaFold Server input JSON must either contain both `dialect` and'
          ' `version` fields, or neither. If neither is specified, it is'
          f' assumed that `dialect="{ALPHAFOLDSERVER_JSON_DIALECT}"` and'
          f' `version="{ALPHAFOLDSERVER_JSON_VERSION}"`.'
      )

    if dialect != ALPHAFOLDSERVER_JSON_DIALECT:
      raise ValueError(
          f'AlphaFold Server input JSON has unsupported dialect: {dialect}, '
          f'expected {ALPHAFOLDSERVER_JSON_DIALECT}.'
      )

    # For now, there is only one AlphaFold Server JSON version.
    if version != ALPHAFOLDSERVER_JSON_VERSION:
      raise ValueError(
          f'AlphaFold Server input JSON has unsupported version: {version}, '
          f'expected {ALPHAFOLDSERVER_JSON_VERSION}.'
      )

    # Parse the chains.
    chains = []
    for sequence in fold_job['sequences']:
      if 'proteinChain' in sequence:
        for _ in range(sequence['proteinChain'].get('count', 1)):
          chains.append(
              ProteinChain.from_alphafoldserver_dict(
                  sequence['proteinChain'],
                  seq_id=mmcif_lib.int_id_to_str_id(len(chains) + 1),
              )
          )
      elif 'rnaSequence' in sequence:
        for _ in range(sequence['rnaSequence'].get('count', 1)):
          chains.append(
              RnaChain.from_alphafoldserver_dict(
                  sequence['rnaSequence'],
                  seq_id=mmcif_lib.int_id_to_str_id(len(chains) + 1),
              )
          )
      elif 'dnaSequence' in sequence:
        for _ in range(sequence['dnaSequence'].get('count', 1)):
          chains.append(
              DnaChain.from_alphafoldserver_dict(
                  sequence['dnaSequence'],
                  seq_id=mmcif_lib.int_id_to_str_id(len(chains) + 1),
              )
          )
      elif 'ion' in sequence:
        for _ in range(sequence['ion'].get('count', 1)):
          chains.append(
              Ligand.from_alphafoldserver_dict(
                  sequence['ion'],
                  seq_id=mmcif_lib.int_id_to_str_id(len(chains) + 1),
              )
          )
      elif 'ligand' in sequence:
        for _ in range(sequence['ligand'].get('count', 1)):
          chains.append(
              Ligand.from_alphafoldserver_dict(
                  sequence['ligand'],
                  seq_id=mmcif_lib.int_id_to_str_id(len(chains) + 1),
              )
          )
      else:
        raise ValueError(f'Unknown sequence type: {sequence}')

    if 'modelSeeds' in fold_job and fold_job['modelSeeds']:
      rng_seeds = [int(seed) for seed in fold_job['modelSeeds']]
    else:
      rng_seeds = [_sample_rng_seed()]

    return cls(name=fold_job['name'], chains=chains, rng_seeds=rng_seeds)

  @classmethod
  def from_json(
      cls, json_str: str, json_path: pathlib.Path | None = None
  ) -> Self:
    """Loads the input from the AlphaFold JSON string."""
    raw_json = json.loads(json_str)

    _validate_keys(
        raw_json.keys(),
        {
            'dialect',
            'version',
            'name',
            'modelSeeds',
            'sequences',
            'bondedAtomPairs',
            'userCCD',
            'userCCDPath',
        },
    )

    if 'dialect' not in raw_json or 'version' not in raw_json:
      raise ValueError(
          'AlphaFold 3 input JSON must contain `dialect` and `version` fields.'
      )

    if raw_json['dialect'] != JSON_DIALECT:
      raise ValueError(
          'AlphaFold 3 input JSON has unsupported dialect:'
          f' {raw_json["dialect"]}, expected {JSON_DIALECT}.'
      )

    if raw_json['version'] not in JSON_VERSIONS:
      raise ValueError(
          'AlphaFold 3 input JSON has unsupported version:'
          f' {raw_json["version"]}, expected one of {JSON_VERSIONS}.'
      )

    if 'sequences' not in raw_json:
      raise ValueError('AlphaFold 3 input JSON does not contain any sequences.')

    if 'modelSeeds' not in raw_json or not raw_json['modelSeeds']:
      raise ValueError(
          'AlphaFold 3 input JSON must specify at least one rng seed in'
          ' `modelSeeds`.'
      )

    sequences = raw_json['sequences']

    # Make sure sequence IDs are all set.
    raw_sequence_ids = [next(iter(s.values())).get('id') for s in sequences]
    if all(raw_sequence_ids):
      sequence_ids = []
      for sequence_id in raw_sequence_ids:
        if isinstance(sequence_id, list):
          sequence_ids.append(sequence_id)
        else:
          sequence_ids.append([sequence_id])
    else:
      raise ValueError(
          'AlphaFold 3 input JSON contains sequences with unset IDs.'
      )

    flat_seq_ids = []
    for seq_ids in sequence_ids:
      flat_seq_ids.extend(seq_ids)

    chains = []
    for seq_ids, sequence in zip(sequence_ids, sequences, strict=True):
      if len(sequence) != 1:
        raise ValueError(f'Chain {seq_ids} has more than 1 sequence.')
      for seq_id in seq_ids:
        if 'protein' in sequence:
          chains.append(ProteinChain.from_dict(sequence, json_path, seq_id))
        elif 'rna' in sequence:
          chains.append(RnaChain.from_dict(sequence, json_path, seq_id))
        elif 'dna' in sequence:
          chains.append(DnaChain.from_dict(sequence, seq_id=seq_id))
        elif 'ligand' in sequence:
          chains.append(Ligand.from_dict(sequence, seq_id=seq_id))
        else:
          raise ValueError(f'Unknown sequence type: {sequence}')

    smiles_ligand_ids = set(
        c.id for c in chains if isinstance(c, Ligand) and c.smiles is not None
    )
    chain_lengths = {chain.id: len(chain) for chain in chains}
    bonded_atom_pairs = None
    if bonds := raw_json.get('bondedAtomPairs'):
      bonded_atom_pairs = []
      for bond in bonds:
        if len(bond) != 2:
          raise ValueError(f'Bond {bond} must have 2 atoms, got {len(bond)}.')
        bond_beg, bond_end = bond
        if (
            len(bond_beg) != 3
            or not isinstance(bond_beg[0], str)
            or not isinstance(bond_beg[1], int)
            or not isinstance(bond_beg[2], str)
        ):
          raise ValueError(
              f'Atom {bond_beg} in bond {bond} must have 3 components: '
              '(chain_id: str, res_id: int, atom_name: str).'
          )
        if (
            len(bond_end) != 3
            or not isinstance(bond_end[0], str)
            or not isinstance(bond_end[1], int)
            or not isinstance(bond_end[2], str)
        ):
          raise ValueError(
              f'Atom {bond_end} in bond {bond} must have 3 components: '
              '(chain_id: str, res_id: int, atom_name: str).'
          )
        if bond_beg[0] not in flat_seq_ids or bond_end[0] not in flat_seq_ids:
          raise ValueError(f'Invalid chain ID(s) in bond {bond}')
        if (
            not 0 < bond_beg[1] <= chain_lengths[bond_beg[0]]
            or not 0 < bond_end[1] <= chain_lengths[bond_end[0]]
        ):
          raise ValueError(f'Invalid residue ID(s) in bond {bond}')
        if bond_beg[0] in smiles_ligand_ids:
          raise ValueError(
              f'Bond {bond} involves an unsupported SMILES ligand {bond_beg[0]}'
          )
        if bond_end[0] in smiles_ligand_ids:
          raise ValueError(
              f'Bond {bond} involves an unsupported SMILES ligand {bond_end[0]}'
          )
        bonded_atom_pairs.append((tuple(bond_beg), tuple(bond_end)))

      if len(bonded_atom_pairs) != len(set(bonded_atom_pairs)):
        raise ValueError(f'Bonds are not unique: {bonded_atom_pairs}')

    user_ccd = raw_json.get('userCCD')
    user_ccd_path = raw_json.get('userCCDPath')
    if user_ccd and user_ccd_path:
      raise ValueError('Only one of userCCD/userCCDPath can be set.')
    if user_ccd and len(user_ccd) < 256 and os.path.exists(user_ccd):
      raise ValueError('Set the user CCD path using the "userCCDPath" field.')
    elif user_ccd_path:
      user_ccd = _read_file(pathlib.Path(user_ccd_path), json_path)

    return cls(
        name=raw_json['name'],
        chains=chains,
        rng_seeds=[int(seed) for seed in raw_json['modelSeeds']],
        bonded_atom_pairs=bonded_atom_pairs,
        user_ccd=user_ccd,
    )

  @classmethod
  def from_mmcif(cls, mmcif_str: str, ccd: chemical_components.Ccd) -> Self:
    """Loads the input from an mmCIF string.

    WARNING: Since rng seeds are not stored in mmCIFs, an rng seed is sampled
    in the returned `Input`.

    Args:
      mmcif_str: The mmCIF string.
      ccd: The chemical components dictionary.

    Returns:
      The input in an Input format.
    """

    struc = structure.from_mmcif(
        mmcif_str,
        # Change MSE residues to MET residues.
        fix_mse_residues=True,
        # Fix arginine atom names. This is not needed since the input discards
        # any atom-level data, but kept for consistency with the paper.
        fix_arginines=True,
        # Fix unknown DNA residues to the correct unknown DNA residue type.
        fix_unknown_dna=True,
        # Do not include water molecules.
        include_water=False,
        # Do not include things like DNA/RNA hybrids. This will be changed once
        # we have a way of handling these in the AlphaFold 3 input format.
        include_other=False,
        # Include the specific bonds defined in the mmCIF bond table, e.g.
        # covalent bonds for PTMs.
        include_bonds=True,
    )

    # Create default bioassembly, expanding structures implied by stoichiometry.
    struc = struc.generate_bioassembly(None)

    sequences = struc.chain_single_letter_sequence(
        include_missing_residues=True
    )

    chains = []
    for chain_id, chain_type in zip(
        struc.group_by_chain.chain_id, struc.group_by_chain.chain_type
    ):
      sequence = sequences[chain_id]

      if chain_type in mmcif_names.NON_POLYMER_CHAIN_TYPES:
        residues = list(struc.chain_res_name_sequence()[chain_id])
        if all(ccd.get(res) is not None for res in residues):
          chains.append(Ligand(id=chain_id, ccd_ids=residues))
        elif len(residues) == 1:
          comp_name = residues[0]
          comps = struc.chemical_components_data
          if comps is None:
            raise ValueError(
                'Missing mmCIF chemical components data - this is required for '
                f'a non-CCD ligand {comp_name} defined using SMILES string.'
            )
          chains.append(
              Ligand(id=chain_id, smiles=comps.chem_comp[comp_name].pdbx_smiles)
          )
        else:
          raise ValueError(
              'Multi-component ligand must be defined using CCD IDs, defining'
              ' using SMILES is supported only for single-component ligands. '
              f'Got {residues}'
          )
      else:
        residues = struc.chain_res_name_sequence()[chain_id]
        fixed = struc.chain_res_name_sequence(
            fix_non_standard_polymer_res=True
        )[chain_id]
        modifications = [
            (orig, i + 1)
            for i, (orig, fixed) in enumerate(zip(residues, fixed, strict=True))
            if orig != fixed
        ]

        if chain_type == mmcif_names.PROTEIN_CHAIN:
          chains.append(
              ProteinChain(id=chain_id, sequence=sequence, ptms=modifications)
          )
        elif chain_type == mmcif_names.RNA_CHAIN:
          chains.append(
              RnaChain(
                  id=chain_id, sequence=sequence, modifications=modifications
              )
          )
        elif chain_type == mmcif_names.DNA_CHAIN:
          chains.append(
              DnaChain(
                  id=chain_id, sequence=sequence, modifications=modifications
              )
          )

    bonded_atom_pairs = []
    chain_ids = set(c.id for c in chains)
    for atom_a, atom_b, _ in struc.iter_bonds():
      if atom_a['chain_id'] in chain_ids and atom_b['chain_id'] in chain_ids:
        beg = (atom_a['chain_id'], int(atom_a['res_id']), atom_a['atom_name'])
        end = (atom_b['chain_id'], int(atom_b['res_id']), atom_b['atom_name'])
        bonded_atom_pairs.append((beg, end))

    return cls(
        name=struc.name,
        chains=chains,
        # mmCIFs don't store rng seeds, so we need to sample one here.
        rng_seeds=[_sample_rng_seed()],
        bonded_atom_pairs=bonded_atom_pairs or None,
    )

  def to_structure(self, ccd: chemical_components.Ccd) -> structure.Structure:
    """Converts Input to a Structure.

    WARNING: This method does not preserve the rng seeds.

    Args:
      ccd: The chemical components dictionary.

    Returns:
      The input in a structure.Structure format.
    """
    ids: list[str] = []
    sequences: list[str] = []
    poly_types: list[str] = []
    formats: list[structure.SequenceFormat] = []

    for chain in self.chains:
      ids.append(chain.id)
      match chain:
        case ProteinChain():
          sequences.append('(' + ')('.join(chain.to_ccd_sequence()) + ')')
          poly_types.append(mmcif_names.PROTEIN_CHAIN)
          formats.append(structure.SequenceFormat.CCD_CODES)
        case RnaChain():
          sequences.append('(' + ')('.join(chain.to_ccd_sequence()) + ')')
          poly_types.append(mmcif_names.RNA_CHAIN)
          formats.append(structure.SequenceFormat.CCD_CODES)
        case DnaChain():
          sequences.append('(' + ')('.join(chain.to_ccd_sequence()) + ')')
          poly_types.append(mmcif_names.DNA_CHAIN)
          formats.append(structure.SequenceFormat.CCD_CODES)
        case Ligand():
          if chain.ccd_ids is not None:
            sequences.append('(' + ')('.join(chain.ccd_ids) + ')')
            if len(chain.ccd_ids) == 1:
              poly_types.append(mmcif_names.NON_POLYMER_CHAIN)
            else:
              poly_types.append(mmcif_names.BRANCHED_CHAIN)
            formats.append(structure.SequenceFormat.CCD_CODES)
          elif chain.smiles is not None:
            # Convert to `<unique ligand ID>:<smiles>` format that is expected
            # by structure.from_sequences_and_bonds.
            sequences.append(f'LIG_{chain.id}:{chain.smiles}')
            poly_types.append(mmcif_names.NON_POLYMER_CHAIN)
            formats.append(structure.SequenceFormat.LIGAND_SMILES)
          else:
            raise ValueError('Ligand must have one of CCD ID or SMILES set.')

    # Remap bond chain IDs from chain IDs to chain indices and convert to
    # 0-based residue indexing.
    bonded_atom_pairs = []
    chain_indices = {cid: i for i, cid in enumerate(ids)}
    if self.bonded_atom_pairs is not None:
      for bond_beg, bond_end in self.bonded_atom_pairs:
        bonded_atom_pairs.append((
            (chain_indices[bond_beg[0]], bond_beg[1] - 1, bond_beg[2]),
            (chain_indices[bond_end[0]], bond_end[1] - 1, bond_end[2]),
        ))

    return structure.from_sequences_and_bonds(
        sequences=sequences,
        chain_types=poly_types,
        sequence_formats=formats,
        chain_ids=ids,
        bonded_atom_pairs=bonded_atom_pairs,
        ccd=ccd,
        name=self.sanitised_name(),
        bond_type=mmcif_names.COVALENT_BOND,
        release_date=None,
    )

  def to_json(self) -> str:
    """Converts Input to an AlphaFold JSON."""
    deduped_chains = {}
    deduped_chain_ids = {}
    for chain in self.chains:
      deduped_chains[chain.hash_without_id()] = chain
      deduped_chain_ids.setdefault(chain.hash_without_id(), []).append(chain.id)

    sequences = []
    for chain_content_hash, ids in deduped_chain_ids.items():
      chain = deduped_chains[chain_content_hash]
      sequences.append(chain.to_dict(seq_id=ids if len(ids) > 1 else ids[0]))

    alphafold_json = json.dumps(
        {
            'dialect': JSON_DIALECT,
            'version': JSON_VERSION,
            'name': self.name,
            'sequences': sequences,
            'modelSeeds': self.rng_seeds,
            'bondedAtomPairs': self.bonded_atom_pairs,
            'userCCD': self.user_ccd,
        },
        indent=2,
    )
    # Remove newlines from the query/template indices arrays. We match the
    # queryIndices/templatesIndices with a non-capturing group. We then match
    # the entire region between the square brackets by looking for lines
    # containing only whitespace, number, or a comma.
    return re.sub(
        r'("(?:queryIndices|templateIndices)": \[)([\s\n\d,]+)(\],?)',
        lambda mtch: mtch[1] + re.sub(r'\n\s+', ' ', mtch[2].strip()) + mtch[3],
        alphafold_json,
    )

  def fill_missing_fields(self) -> Self:
    """Fill missing MSA and template fields with default values."""
    with_missing_fields = [
        c.fill_missing_fields()
        if isinstance(c, (ProteinChain, RnaChain))
        else c
        for c in self.chains
    ]
    return dataclasses.replace(self, chains=with_missing_fields)

  def with_multiple_seeds(self, num_seeds: int) -> Self:
    """Returns a copy of the input with num_seeds rng seeds."""
    if num_seeds <= 1:
      raise ValueError('Number of seeds must be greater than 1.')
    if len(self.rng_seeds) != 1:
      raise ValueError('Input must have one rng seed to set multiple seeds.')

    return dataclasses.replace(
        self,
        rng_seeds=list(range(self.rng_seeds[0], self.rng_seeds[0] + num_seeds)),
    )


def load_fold_inputs_from_path(json_path: pathlib.Path) -> Iterator[Input]:
  """Loads multiple fold inputs from a JSON string."""
  with open(json_path, 'r') as f:
    json_str = f.read()

  # Parse the JSON string, so we can detect its format.
  raw_json = json.loads(json_str)

  if isinstance(raw_json, list):
    # AlphaFold Server JSON.
    logging.info('Loading %d fold jobs from %s', len(raw_json), json_path)
    for fold_job_idx, fold_job in enumerate(raw_json):
      try:
        yield Input.from_alphafoldserver_fold_job(fold_job)
      except ValueError as e:
        raise ValueError(
            f'Failed to load fold job {fold_job_idx} from {json_path}'
            f' (AlphaFold Server dialect): {e}'
        ) from e
  else:
    # AlphaFold 3 JSON.
    try:
      yield Input.from_json(json_str, json_path)
    except ValueError as e:
      raise ValueError(
          f'Failed to load input from {json_path} (AlphaFold 3 dialect): {e}'
      ) from e


def load_fold_inputs_from_dir(input_dir: pathlib.Path) -> Iterator[Input]:
  """Loads multiple fold inputs from all JSON files in a given input_dir.

  Args:
    input_dir: The directory containing the JSON files.

  Yields:
    The fold inputs from all JSON files in the input directory.
  """
  for file_path in sorted(input_dir.glob('*.json')):
    if not file_path.is_file():
      continue

    yield from load_fold_inputs_from_path(file_path)


================================================
FILE: src/alphafold3/common/resources.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Load external resources, such as external tools or data resources."""

from collections.abc import Iterator
import os
import pathlib
import typing
from typing import BinaryIO, Final, Literal, TextIO

from importlib import resources
import alphafold3.common


_DATA_ROOT:  Final[pathlib.Path] = (
    resources.files(alphafold3.common).joinpath('..').resolve()
)
ROOT = _DATA_ROOT


def filename(name: str | os.PathLike[str]) -> str:
  """Returns the absolute path to an external resource.

  Note that this calls resources.GetResourceFilename under the hood and hence
  causes par file unpacking, which might be unfriendly on diskless machines.


  Args:
    name: the name of the resource corresponding to its path relative to the
      root of the repository.
  """
  return (_DATA_ROOT / name).as_posix()


@typing.overload
def open_resource(
    name: str | os.PathLike[str], mode: Literal['r', 'rt'] = 'rt'
) -> TextIO:
  ...


@typing.overload
def open_resource(
    name: str | os.PathLike[str], mode: Literal['rb']
) -> BinaryIO:
  ...


def open_resource(
    name: str | os.PathLike[str], mode: str = 'rb'
) -> TextIO | BinaryIO:
  """Returns an open file object for the named resource.

  Args:
    name: the name of the resource corresponding to its path relative to the
      root of the repository.
    mode: the mode to use when opening the file.
  """
  return (_DATA_ROOT / name).open(mode)


def get_resource_dir(path: str | os.PathLike[str]) -> os.PathLike[str]:
  return _DATA_ROOT / path


def walk(path: str) -> Iterator[tuple[str, list[str], list[str]]]:
  """Walks the directory tree of resources similar to os.walk."""
  return os.walk((_DATA_ROOT / path).as_posix())


================================================
FILE: src/alphafold3/common/safe_pickle.py
================================================
# Copyright 2025 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Restricted-safe wrapper around pickle for loading trusted data.

This prevents arbitrary object instantiation during unpickling by only
allowing a small allowlist of built-in, innocuous types.

Intended for loading pickled constant data that ships with the repository.
If the pickle is tampered with, an UnpicklingError will be raised instead
of silently executing attacker-controlled bytecode.
"""

from collections.abc import Collection
import pickle
from typing import Any, BinaryIO, Final


# Builtin types expected from AlphaFold 3 generated data.
_ALLOWED_BUILTINS: Final[Collection[str]] = frozenset({
    "NoneType",
    "bool",
    "bytes",
    "dict",
    "float",
    "frozenset",
    "int",
    "list",
    "set",
    "str",
    "tuple",
})


class _RestrictedUnpickler(pickle.Unpickler):
  """A pickle `Unpickler` that forbids loading arbitrary global classes."""

  def find_class(self, module: str, name: str) -> Any:
    """Returns the class for `module` and `name` if allowed."""
    if module == "builtins" and name in _ALLOWED_BUILTINS:
      return super().find_class(module, name)
    raise pickle.UnpicklingError(f"Can't unpickle disallowed '{module}.{name}'")


def load(file_obj: BinaryIO) -> Any:
  """Safely loads pickle data from an already-opened binary file handle.

  Only built-in container/primitive types listed in `_ALLOWED_BUILTINS` are
  permitted. Any attempt to load other types raises `pickle.UnpicklingError`.

  Args:
    file_obj: A binary file-like object open for reading.

  Returns:
    The unpickled data.
  """

  return _RestrictedUnpickler(file_obj).load()


================================================
FILE: src/alphafold3/common/testing/data.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Module that provides an abstraction for accessing test data."""

import os
import pathlib
from typing import Literal, overload

from absl.testing import absltest


class Data:
  """Provides an abstraction for accessing test data."""

  def __init__(self, data_dir: os.PathLike[str] | str):
    """Initiailizes data wrapper, providing users with high level data access.

    Args:
      data_dir: Directory containing test data.
    """
    self._data_dir = pathlib.Path(data_dir)

  def path(self, data_name: str | os.PathLike[str] | None = None) -> str:
    """Returns the path to a given test data.

    Args:
      data_name: the name of the test data file relative to data_dir. If not
        set, this will return the absolute path to the data directory.
    """
    data_dir_path = (
        pathlib.Path(absltest.get_default_test_srcdir()) / self._data_dir
    )

    if data_name:
      return str(data_dir_path / data_name)

    return str(data_dir_path)

  @overload
  def load(
      self, data_name: str | os.PathLike[str], mode: Literal['rt'] = 'rt'
  ) -> str:
    ...

  @overload
  def load(
      self, data_name: str | os.PathLike[str], mode: Literal['rb'] = 'rb'
  ) -> bytes:
    ...

  def load(
      self, data_name: str | os.PathLike[str], mode: str = 'rt'
  ) -> str | bytes:
    """Returns the contents of a given test data.

    Args:
      data_name: the name of the test data file relative to data_dir.
      mode: the mode in which to read the data file. Defaults to text ('rt').
    """
    with open(self.path(data_name), mode=mode) as f:
      return f.read()


================================================
FILE: src/alphafold3/constants/atom_types.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""List of atom types with reverse look-up."""

from collections.abc import Mapping, Sequence, Set
import itertools
import sys
from typing import Final
from alphafold3.constants import residue_names

# Note:
# `sys.intern` places the values in the Python internal db for fast lookup.

# 37 common residue atoms.
N = sys.intern('N')
CA = sys.intern('CA')
C = sys.intern('C')
CB = sys.intern('CB')
O = sys.intern('O')
CG = sys.intern('CG')
CG1 = sys.intern('CG1')
CG2 = sys.intern('CG2')
OG = sys.intern('OG')
OG1 = sys.intern('OG1')
SG = sys.intern('SG')
CD = sys.intern('CD')
CD1 = sys.intern('CD1')
CD2 = sys.intern('CD2')
ND1 = sys.intern('ND1')
ND2 = sys.intern('ND2')
OD1 = sys.intern('OD1')
OD2 = sys.intern('OD2')
SD = sys.intern('SD')
CE = sys.intern('CE')
CE1 = sys.intern('CE1')
CE2 = sys.intern('CE2')
CE3 = sys.intern('CE3')
NE = sys.intern('NE')
NE1 = sys.intern('NE1')
NE2 = sys.intern('NE2')
OE1 = sys.intern('OE1')
OE2 = sys.intern('OE2')
CH2 = sys.intern('CH2')
NH1 = sys.intern('NH1')
NH2 = sys.intern('NH2')
OH = sys.intern('OH')
CZ = sys.intern('CZ')
CZ2 = sys.intern('CZ2')
CZ3 = sys.intern('CZ3')
NZ = sys.intern('NZ')
OXT = sys.intern('OXT')

# 29 common nucleic acid atoms.
C1PRIME = sys.intern("C1'")
C2 = sys.intern('C2')
C2PRIME = sys.intern("C2'")
C3PRIME = sys.intern("C3'")
C4 = sys.intern('C4')
C4PRIME = sys.intern("C4'")
C5 = sys.intern('C5')
C5PRIME = sys.intern("C5'")
C6 = sys.intern('C6')
C7 = sys.intern('C7')
C8 = sys.intern('C8')
N1 = sys.intern('N1')
N2 = sys.intern('N2')
N3 = sys.intern('N3')
N4 = sys.intern('N4')
N6 = sys.intern('N6')
N7 = sys.intern('N7')
N9 = sys.intern('N9')
O2 = sys.intern('O2')
O2PRIME = sys.intern("O2'")
O3PRIME = sys.intern("O3'")
O4 = sys.intern('O4')
O4PRIME = sys.intern("O4'")
O5PRIME = sys.intern("O5'")
O6 = sys.intern('O6')
OP1 = sys.intern('OP1')
OP2 = sys.intern('OP2')
OP3 = sys.intern('OP3')
P = sys.intern('P')

# A list of atoms (excluding hydrogen) for each AA type. PDB naming convention.
RESIDUE_ATOMS: Mapping[str, tuple[str, ...]] = {
    residue_names.ALA: (C, CA, CB, N, O),
    residue_names.ARG: (C, CA, CB, CG, CD, CZ, N, NE, O, NH1, NH2),
    residue_names.ASN: (C, CA, CB, CG, N, ND2, O, OD1),
    residue_names.ASP: (C, CA, CB, CG, N, O, OD1, OD2),
    residue_names.CYS: (C, CA, CB, N, O, SG),
    residue_names.GLN: (C, CA, CB, CG, CD, N, NE2, O, OE1),
    residue_names.GLU: (C, CA, CB, CG, CD, N, O, OE1, OE2),
    residue_names.GLY: (C, CA, N, O),
    residue_names.HIS: (C, CA, CB, CG, CD2, CE1, N, ND1, NE2, O),
    residue_names.ILE: (C, CA, CB, CG1, CG2, CD1, N, O),
    residue_names.LEU: (C, CA, CB, CG, CD1, CD2, N, O),
    residue_names.LYS: (C, CA, CB, CG, CD, CE, N, NZ, O),
    residue_names.MET: (C, CA, CB, CG, CE, N, O, SD),
    residue_names.PHE: (C, CA, CB, CG, CD1, CD2, CE1, CE2, CZ, N, O),
    residue_names.PRO: (C, CA, CB, CG, CD, N, O),
    residue_names.SER: (C, CA, CB, N, O, OG),
    residue_names.THR: (C, CA, CB, CG2, N, O, OG1),
    residue_names.TRP:
        (C, CA, CB, CG, CD1, CD2, CE2, CE3, CZ2, CZ3, CH2, N, NE1, O),
    residue_names.TYR: (C, CA, CB, CG, CD1, CD2, CE1, CE2, CZ, N, O, OH),
    residue_names.VAL: (C, CA, CB, CG1, CG2, N, O),
}  # pyformat: disable

# Used to identify backbone for alignment and distance calculation for sterics.
PROTEIN_BACKBONE_ATOMS: tuple[str, ...] = (N, CA, C)

# Naming swaps for ambiguous atom names. Due to symmetries in the amino acids
# the naming of atoms is ambiguous in 4 of the 20 amino acids. (The LDDT paper
# lists 7 amino acids as ambiguous, but the naming ambiguities in LEU, VAL and
# ARG can be resolved by using the 3D constellations of the 'ambiguous' atoms
# and their neighbours)
AMBIGUOUS_ATOM_NAMES: Mapping[str, Mapping[str, str]] = {
    residue_names.ASP: {OD1: OD2},
    residue_names.GLU: {OE1: OE2},
    residue_names.PHE: {CD1: CD2, CE1: CE2},
    residue_names.TYR: {CD1: CD2, CE1: CE2},
}

# Used when we need to store atom data in a format that requires fixed atom data
# size for every protein residue (e.g. a numpy array).
ATOM37: tuple[str, ...] = (
    N, CA, C, CB, O, CG, CG1, CG2, OG, OG1, SG, CD, CD1, CD2, ND1, ND2, OD1,
    OD2, SD, CE, CE1, CE2, CE3, NE, NE1, NE2, OE1, OE2, CH2, NH1, NH2, OH, CZ,
    CZ2, CZ3, NZ, OXT)  # pyformat: disable
ATOM37_ORDER: Mapping[str, int] = {name: i for i, name in enumerate(ATOM37)}
ATOM37_NUM: Final[int] = len(ATOM37)  # := 37.

# Used when we need to store protein atom data in a format that requires fixed
# atom data size for any residue but takes less space than ATOM37 by having 14
# fields, which is sufficient for storing atoms of all protein residues (e.g. a
# numpy array).
ATOM14: Mapping[str, tuple[str, ...]] = {
    residue_names.ALA: (N, CA, C, O, CB),
    residue_names.ARG: (N, CA, C, O, CB, CG, CD, NE, CZ, NH1, NH2),
    residue_names.ASN: (N, CA, C, O, CB, CG, OD1, ND2),
    residue_names.ASP: (N, CA, C, O, CB, CG, OD1, OD2),
    residue_names.CYS: (N, CA, C, O, CB, SG),
    residue_names.GLN: (N, CA, C, O, CB, CG, CD, OE1, NE2),
    residue_names.GLU: (N, CA, C, O, CB, CG, CD, OE1, OE2),
    residue_names.GLY: (N, CA, C, O),
    residue_names.HIS: (N, CA, C, O, CB, CG, ND1, CD2, CE1, NE2),
    residue_names.ILE: (N, CA, C, O, CB, CG1, CG2, CD1),
    residue_names.LEU: (N, CA, C, O, CB, CG, CD1, CD2),
    residue_names.LYS: (N, CA, C, O, CB, CG, CD, CE, NZ),
    residue_names.MET: (N, CA, C, O, CB, CG, SD, CE),
    residue_names.PHE: (N, CA, C, O, CB, CG, CD1, CD2, CE1, CE2, CZ),
    residue_names.PRO: (N, CA, C, O, CB, CG, CD),
    residue_names.SER: (N, CA, C, O, CB, OG),
    residue_names.THR: (N, CA, C, O, CB, OG1, CG2),
    residue_names.TRP:
        (N, CA, C, O, CB, CG, CD1, CD2, NE1, CE2, CE3, CZ2, CZ3, CH2),
    residue_names.TYR: (N, CA, C, O, CB, CG, CD1, CD2, CE1, CE2, CZ, OH),
    residue_names.VAL: (N, CA, C, O, CB, CG1, CG2),
    residue_names.UNK: (),
}  # pyformat: disable

# A compact atom encoding with 14 columns, padded with '' in empty slots.
ATOM14_PADDED: Mapping[str, Sequence[str]] = {
    k: [v for _, v in itertools.zip_longest(range(14), values, fillvalue='')]
    for k, values in ATOM14.items()
}

ATOM14_ORDER: Mapping[str, Mapping[str, int]] = {
    k: {name: i for i, name in enumerate(v)} for k, v in ATOM14.items()
}
ATOM14_NUM: Final[int] = max(len(v) for v in ATOM14.values())

# Used when we need to store protein and nucleic atom library.
DENSE_ATOM: Mapping[str, tuple[str, ...]] = {
    # Protein.
    residue_names.ALA: (N, CA, C, O, CB),
    residue_names.ARG: (N, CA, C, O, CB, CG, CD, NE, CZ, NH1, NH2),
    residue_names.ASN: (N, CA, C, O, CB, CG, OD1, ND2),
    residue_names.ASP: (N, CA, C, O, CB, CG, OD1, OD2),
    residue_names.CYS: (N, CA, C, O, CB, SG),
    residue_names.GLN: (N, CA, C, O, CB, CG, CD, OE1, NE2),
    residue_names.GLU: (N, CA, C, O, CB, CG, CD, OE1, OE2),
    residue_names.GLY: (N, CA, C, O),
    residue_names.HIS: (N, CA, C, O, CB, CG, ND1, CD2, CE1, NE2),
    residue_names.ILE: (N, CA, C, O, CB, CG1, CG2, CD1),
    residue_names.LEU: (N, CA, C, O, CB, CG, CD1, CD2),
    residue_names.LYS: (N, CA, C, O, CB, CG, CD, CE, NZ),
    residue_names.MET: (N, CA, C, O, CB, CG, SD, CE),
    residue_names.PHE: (N, CA, C, O, CB, CG, CD1, CD2, CE1, CE2, CZ),
    residue_names.PRO: (N, CA, C, O, CB, CG, CD),
    residue_names.SER: (N, CA, C, O, CB, OG),
    residue_names.THR: (N, CA, C, O, CB, OG1, CG2),
    residue_names.TRP:
        (N, CA, C, O, CB, CG, CD1, CD2, NE1, CE2, CE3, CZ2, CZ3, CH2),
    residue_names.TYR: (N, CA, C, O, CB, CG, CD1, CD2, CE1, CE2, CZ, OH),
    residue_names.VAL: (N, CA, C, O, CB, CG1, CG2),
    residue_names.UNK: (),
    # RNA.
    residue_names.A:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, O2PRIME, C1PRIME, N9, C8, N7, C5, C6, N6, N1, C2, N3, C4),
    residue_names.C:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, O2PRIME, C1PRIME, N1, C2, O2, N3, C4, N4, C5, C6),
    residue_names.G:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, O2PRIME, C1PRIME, N9, C8, N7, C5, C6, O6, N1, C2, N2, N3, C4),
    residue_names.U:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, O2PRIME, C1PRIME, N1, C2, O2, N3, C4, O4, C5, C6),
    residue_names.UNK_RNA: (),
    # DNA.
    residue_names.DA:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, C1PRIME, N9, C8, N7, C5, C6, N6, N1, C2, N3, C4),
    residue_names.DC:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, C1PRIME, N1, C2, O2, N3, C4, N4, C5, C6),
    residue_names.DG:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, C1PRIME, N9, C8, N7, C5, C6, O6, N1, C2, N2, N3, C4),
    residue_names.DT:
        (OP3, P, OP1, OP2, O5PRIME, C5PRIME, C4PRIME, O4PRIME, C3PRIME, O3PRIME,
         C2PRIME, C1PRIME, N1, C2, O2, N3, C4, O4, C5, C7, C6),
    # Unknown nucleic.
    residue_names.UNK_DNA: (),
}  # pyformat: disable

DENSE_ATOM_ORDER: Mapping[str, Mapping[str, int]] = {
    k: {name: i for i, name in enumerate(v)} for k, v in DENSE_ATOM.items()
}
DENSE_ATOM_NUM: Final[int] = max(len(v) for v in DENSE_ATOM.values())

# Used when we need to store atom data in a format that requires fixed atom data
# size for every nucleic molecule (e.g. a numpy array).
ATOM29: tuple[str, ...] = (
    "C1'", 'C2', "C2'", "C3'", 'C4', "C4'", 'C5', "C5'", 'C6', 'C7', 'C8', 'N1',
    'N2', 'N3', 'N4', 'N6', 'N7', 'N9', 'OP3', 'O2', "O2'", "O3'", 'O4', "O4'",
    "O5'", 'O6', 'OP1', 'OP2', 'P')  # pyformat: disable
ATOM29_ORDER: Mapping[str, int] = {
    atom_type: i for i, atom_type in enumerate(ATOM29)
}
ATOM29_NUM: Final[int] = len(ATOM29)  # := 29

# Hydrogens that exist depending on the protonation state of the residue.
# Extracted from third_party/py/openmm/app/data/hydrogens.xml
PROTONATION_HYDROGENS: Mapping[str, Set[str]] = {
    'ASP': {'HD2'},
    'CYS': {'HG'},
    'GLU': {'HE2'},
    'HIS': {'HD1', 'HE2'},
    'LYS': {'HZ3'},
}


================================================
FILE: src/alphafold3/constants/chemical_component_sets.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Sets of chemical components."""

from typing import Final

from alphafold3.common import resources
from alphafold3.common import safe_pickle

_CCD_SETS_CCD_PICKLE_FILE = resources.filename(
    resources.ROOT / 'constants/converters/chemical_component_sets.pickle'
)

with open(_CCD_SETS_CCD_PICKLE_FILE, 'rb') as f:
  _CCD_SET = safe_pickle.load(f)

# Glycan (or 'Saccharide') ligands.
# _chem_comp.type containing 'saccharide' and 'linking' (when lower-case).
GLYCAN_LINKING_LIGANDS: Final[frozenset[str]] = _CCD_SET['glycans_linking']

# _chem_comp.type containing 'saccharide' and not 'linking' (when lower-case).
GLYCAN_OTHER_LIGANDS: Final[frozenset[str]] = _CCD_SET['glycans_other']

# Each of these molecules appears in over 1k PDB structures, are used to
# facilitate crystallization conditions, but do not have biological relevance.
COMMON_CRYSTALLIZATION_AIDS: Final[frozenset[str]] = frozenset({
    'SO4', 'GOL', 'EDO', 'PO4', 'ACT', 'PEG', 'DMS', 'TRS', 'PGE', 'PG4', 'FMT',
    'EPE', 'MPD', 'MES', 'CD', 'IOD',
})  # pyformat: disable


================================================
FILE: src/alphafold3/constants/chemical_components.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Chemical Components found in PDB (CCD) constants."""

from collections.abc import ItemsView, Iterator, KeysView, Mapping, Sequence, ValuesView
import dataclasses
import functools
import os

from alphafold3.common import resources
from alphafold3.common import safe_pickle
from alphafold3.cpp import cif_dict


_CCD_PICKLE_FILE = resources.filename(
    resources.ROOT / 'constants/converters/ccd.pickle'
)


@functools.cache
def _load_ccd_pickle_cached(
    path: os.PathLike[str],
) -> dict[str, Mapping[str, Sequence[str]]]:
  """Loads the CCD pickle file and caches it so that it is only loaded once."""
  with open(path, 'rb') as f:
    return safe_pickle.load(f)


class Ccd(Mapping[str, Mapping[str, Sequence[str]]]):
  """Chemical Components found in PDB (CCD) constants.

  See https://academic.oup.com/bioinformatics/article/31/8/1274/212200 for CCD
  CIF format documentation.

  Wraps the dict to prevent accidental mutation.
  """

  __slots__ = ('_dict', '_ccd_pickle_path')

  def __init__(
      self,
      ccd_pickle_path: os.PathLike[str] | None = None,
      user_ccd: str | None = None,
  ):
    """Initialises the chemical components dictionary.

    Args:
      ccd_pickle_path: Path to the CCD pickle file. If None, uses the default
        CCD pickle file included in the source code.
      user_ccd: A string containing the user-provided CCD. This has to conform
        to the same format as the CCD, see https://www.wwpdb.org/data/ccd. If
        provided, takes precedence over the CCD for the the same key. This can
        be used to override specific entries in the CCD if desired.
    """
    self._ccd_pickle_path = ccd_pickle_path or _CCD_PICKLE_FILE
    self._dict = _load_ccd_pickle_cached(self._ccd_pickle_path)

    if user_ccd is not None:
      if not user_ccd:
        raise ValueError('User CCD cannot be an empty string.')
      user_ccd_cifs = {
          key: value.to_dict()
          for key, value in cif_dict.parse_multi_data_cif(user_ccd).items()
      }
      self._dict.update(user_ccd_cifs)

  def __getitem__(self, key: str) -> Mapping[str, Sequence[str]]:
    return self._dict[key]

  def __contains__(self, key: str) -> bool:
    return key in self._dict

  def __iter__(self) -> Iterator[str]:
    return self._dict.__iter__()

  def __len__(self) -> int:
    return len(self._dict)

  def __hash__(self) -> int:
    return id(self)  # Ok since this is immutable.

  def get(
      self, key: str, default: None | Mapping[str, Sequence[str]] = None
  ) -> Mapping[str, Sequence[str]] | None:
    return self._dict.get(key, default)

  def items(self) -> ItemsView[str, Mapping[str, Sequence[str]]]:
    return self._dict.items()

  def values(self) -> ValuesView[Mapping[str, Sequence[str]]]:
    return self._dict.values()

  def keys(self) -> KeysView[str]:
    return self._dict.keys()


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class ComponentInfo:
  name: str
  type: str
  pdbx_synonyms: str
  formula: str
  formula_weight: str
  mon_nstd_parent_comp_id: str
  mon_nstd_flag: str
  pdbx_smiles: str


def mmcif_to_info(mmcif: Mapping[str, Sequence[str]]) -> ComponentInfo:
  """Converts CCD mmCIFs to component info. Missing fields are left empty."""
  names = mmcif['_chem_comp.name']
  types = mmcif['_chem_comp.type']
  mon_nstd_parent_comp_ids = mmcif['_chem_comp.mon_nstd_parent_comp_id']
  pdbx_synonyms = mmcif['_chem_comp.pdbx_synonyms']
  formulas = mmcif['_chem_comp.formula']
  formula_weights = mmcif['_chem_comp.formula_weight']

  def front_or_empty(values: Sequence[str]) -> str:
    return values[0] if values else ''

  type_ = front_or_empty(types)
  mon_nstd_parent_comp_id = front_or_empty(mon_nstd_parent_comp_ids)
  if type_.lower() == 'non-polymer':
    # Unset for non-polymers, e.g. water or ions.
    mon_nstd_flag = '.'
  elif mon_nstd_parent_comp_id == '?':
    # A standard component - it doesn't have a standard parent, e.g. MET.
    mon_nstd_flag = 'y'
  else:
    # A non-standard component, e.g. MSE.
    mon_nstd_flag = 'n'

  # Default SMILES is the canonical SMILES, but we fall back to the SMILES if a
  # canonical SMILES is not available. Of canonical SMILES, we prefer ones from
  # the OpenEye OEToolkits program.
  canonical_pdbx_smiles = ''
  fallback_pdbx_smiles = ''
  descriptor_types = mmcif.get('_pdbx_chem_comp_descriptor.type', [])
  descriptors = mmcif.get('_pdbx_chem_comp_descriptor.descriptor', [])
  programs = mmcif.get('_pdbx_chem_comp_descriptor.program', [])
  for descriptor_type, descriptor, program in zip(
      descriptor_types, descriptors, programs
  ):
    if descriptor_type == 'SMILES_CANONICAL':
      if (not canonical_pdbx_smiles) or program == 'OpenEye OEToolkits':
        canonical_pdbx_smiles = descriptor
    if not fallback_pdbx_smiles and descriptor_type == 'SMILES':
      fallback_pdbx_smiles = descriptor
  pdbx_smiles = canonical_pdbx_smiles or fallback_pdbx_smiles

  return ComponentInfo(
      name=front_or_empty(names),
      type=type_,
      pdbx_synonyms=front_or_empty(pdbx_synonyms),
      formula=front_or_empty(formulas),
      formula_weight=front_or_empty(formula_weights),
      mon_nstd_parent_comp_id=mon_nstd_parent_comp_id,
      mon_nstd_flag=mon_nstd_flag,
      pdbx_smiles=pdbx_smiles,
  )


@functools.lru_cache(maxsize=128)
def component_name_to_info(ccd: Ccd, res_name: str) -> ComponentInfo | None:
  component = ccd.get(res_name)
  if component is None:
    return None
  return mmcif_to_info(component)


def type_symbol(ccd: Ccd, res_name: str, atom_name: str) -> str:
  """Returns the element type for the given component name and atom name.

  Args:
    ccd: The chemical components dictionary.
    res_name: The component name, e.g. ARG.
    atom_name: The atom name, e.g. CB, OXT, or NH1.

  Returns:
    Element type, e.g. C for (ARG, CB), O for (ARG, OXT), N for (ARG, NH1).
  """
  res = ccd.get(res_name)
  if res is None:
    return '?'
  try:
    return res['_chem_comp_atom.type_symbol'][
        res['_chem_comp_atom.atom_id'].index(atom_name)
    ]
  except (ValueError, IndexError, KeyError):
    return '?'


================================================
FILE: src/alphafold3/constants/converters/ccd_pickle_gen.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Reads Chemical Components gz file and generates a CCD pickle file."""

from collections.abc import Sequence
import gzip
import pickle
import sys

from alphafold3.cpp import cif_dict
import tqdm


def main(argv: Sequence[str]) -> None:
  if len(argv) != 3:
    raise ValueError('Must specify input_file components.cif and output_file')

  _, input_file, output_file = argv

  print(f'Parsing {input_file}', flush=True)
  if input_file.endswith('.gz'):
    opener = gzip.open
  else:
    opener = open

  with opener(input_file, 'rb') as f:
    whole_file = f.read()
  result = {
      key: value.to_dict()
      for key, value in tqdm.tqdm(
          cif_dict.parse_multi_data_cif(whole_file).items(), disable=None
      )
  }
  assert len(result) == whole_file.count(b'data_')

  print(f'Writing {output_file}', flush=True)
  with open(output_file, 'wb') as f:
    pickle.dump(result, f, protocol=pickle.HIGHEST_PROTOCOL)
  print('Done', flush=True)

if __name__ == '__main__':
  main(sys.argv)


================================================
FILE: src/alphafold3/constants/converters/chemical_component_sets_gen.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Script for updating chemical_component_sets.py."""

from collections.abc import Mapping, Sequence
import pathlib
import pickle
import re
import sys

from alphafold3.common import resources
from alphafold3.common import safe_pickle
import tqdm


_CCD_PICKLE_FILE = resources.filename(
    'constants/converters/ccd.pickle'
)


def find_ions_and_glycans_in_ccd(
    ccd: Mapping[str, Mapping[str, Sequence[str]]],
) -> dict[str, frozenset[str]]:
  """Finds glycans and ions in all version of CCD."""
  glycans_linking = []
  glycans_other = []
  ions = []
  for name, comp in tqdm.tqdm(ccd.items(), disable=None):
    if name == 'UNX':
      continue  # Skip "unknown atom or ion".
    comp_type = comp['_chem_comp.type'][0].lower()
    # Glycans have the type 'saccharide'.
    if re.findall(r'\bsaccharide\b', comp_type):
      # Separate out linking glycans from others.
      if 'linking' in comp_type:
        glycans_linking.append(name)
      else:
        glycans_other.append(name)

    # Ions have the word 'ion' in their name.
    comp_name = comp['_chem_comp.name'][0].lower()
    if re.findall(r'\bion\b', comp_name):
      ions.append(name)
  result = dict(
      glycans_linking=frozenset(glycans_linking),
      glycans_other=frozenset(glycans_other),
      ions=frozenset(ions),
  )

  return result


def main(argv: Sequence[str]) -> None:
  if len(argv) != 2:
    raise ValueError(
        'Directory to write to must be specified as a command-line arguments.'
    )

  print(f'Loading {_CCD_PICKLE_FILE}', flush=True)
  with open(_CCD_PICKLE_FILE, 'rb') as f:
    ccd: Mapping[str, Mapping[str, Sequence[str]]] = safe_pickle.load(f)
  output_path = pathlib.Path(argv[1])
  output_path.parent.mkdir(exist_ok=True)
  print('Finding ions and glycans', flush=True)
  result = find_ions_and_glycans_in_ccd(ccd)
  print(f'writing to {output_path}', flush=True)
  with output_path.open('wb') as f:
    pickle.dump(result, f)
  print('Done', flush=True)


if __name__ == '__main__':
  main(sys.argv)


================================================
FILE: src/alphafold3/constants/mmcif_names.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Names of things in mmCIF format.

See https://www.iucr.org/__data/iucr/cifdic_html/2/cif_mm.dic/index.html
"""

from collections.abc import Mapping, Sequence, Set
from typing import Final

from alphafold3.constants import atom_types
from alphafold3.constants import residue_names


# The following are all possible values for the "_entity.type".
# https://mmcif.wwpdb.org/dictionaries/mmcif_pdbx_v50.dic/Items/_entity.type.html
BRANCHED_CHAIN: Final[str] = 'branched'
MACROLIDE_CHAIN: Final[str] = 'macrolide'
NON_POLYMER_CHAIN: Final[str] = 'non-polymer'
POLYMER_CHAIN: Final[str] = 'polymer'
WATER: Final[str] = 'water'

CYCLIC_PSEUDO_PEPTIDE_CHAIN: Final[str] = 'cyclic-pseudo-peptide'
DNA_CHAIN: Final[str] = 'polydeoxyribonucleotide'
DNA_RNA_HYBRID_CHAIN: Final[str] = (
    'polydeoxyribonucleotide/polyribonucleotide hybrid'
)
OTHER_CHAIN: Final[str] = 'other'
PEPTIDE_NUCLEIC_ACID_CHAIN: Final[str] = 'peptide nucleic acid'
POLYPEPTIDE_D_CHAIN: Final[str] = 'polypeptide(D)'
PROTEIN_CHAIN: Final[str] = 'polypeptide(L)'
RNA_CHAIN: Final[str] = 'polyribonucleotide'

# Most common _entity_poly.types.
STANDARD_POLYMER_CHAIN_TYPES: Final[Set[str]] = {
    PROTEIN_CHAIN,
    DNA_CHAIN,
    RNA_CHAIN,
}

# Possible values for _entity.type other than polymer and water.
LIGAND_CHAIN_TYPES: Final[Set[str]] = {
    BRANCHED_CHAIN,
    MACROLIDE_CHAIN,
    NON_POLYMER_CHAIN,
}

# Possible values for _entity.type other than polymer.
NON_POLYMER_CHAIN_TYPES: Final[Set[str]] = {
    *LIGAND_CHAIN_TYPES,
    WATER,
}

# Peptide possible values for _entity_poly.type.
PEPTIDE_CHAIN_TYPES: Final[Set[str]] = {
    CYCLIC_PSEUDO_PEPTIDE_CHAIN,
    POLYPEPTIDE_D_CHAIN,
    PROTEIN_CHAIN,
    PEPTIDE_NUCLEIC_ACID_CHAIN,
}


# Nucleic-acid possible values for _entity_poly.type.
NUCLEIC_ACID_CHAIN_TYPES: Final[Set[str]] = {
    RNA_CHAIN,
    DNA_CHAIN,
    DNA_RNA_HYBRID_CHAIN,
}

# All possible values for _entity_poly.type.
POLYMER_CHAIN_TYPES: Final[Set[str]] = {
    *NUCLEIC_ACID_CHAIN_TYPES,
    *PEPTIDE_CHAIN_TYPES,
    OTHER_CHAIN,
}


TERMINAL_OXYGENS: Final[Mapping[str, str]] = {
    PROTEIN_CHAIN: 'OXT',
    DNA_CHAIN: 'OP3',
    RNA_CHAIN: 'OP3',
}


# For each chain type, which atom should be used to represent each residue.
RESIDUE_REPRESENTATIVE_ATOMS: Final[Mapping[str, str]] = {
    PROTEIN_CHAIN: atom_types.CA,
    DNA_CHAIN: atom_types.C1PRIME,
    RNA_CHAIN: atom_types.C1PRIME,
}

# Methods involving crystallization. See the documentation at
# mmcif.wwpdb.org/dictionaries/mmcif_pdbx_v50.dic/Items/_exptl.method.html
# for the full list of experimental methods.
CRYSTALLIZATION_METHODS: Final[Set[str]] = {
    'X-RAY DIFFRACTION',
    'NEUTRON DIFFRACTION',
    'ELECTRON CRYSTALLOGRAPHY',
    'POWDER CRYSTALLOGRAPHY',
    'FIBER DIFFRACTION',
}

# Possible bond types.
COVALENT_BOND: Final[str] = 'covale'
HYDROGEN_BOND: Final[str] = 'hydrog'
METAL_COORDINATION: Final[str] = 'metalc'
DISULFIDE_BRIDGE: Final[str] = 'disulf'


def is_standard_polymer_type(chain_type: str) -> bool:
  """Returns if chain type is a protein, DNA or RNA chain type.

  Args:
     chain_type: The type of the chain.

  Returns:
    A bool for if the chain_type matches protein, DNA, or RNA.
  """
  return chain_type in STANDARD_POLYMER_CHAIN_TYPES


def guess_polymer_type(chain_residues: Sequence[str]) -> str:
  """Guess the polymer type (protein/rna/dna/other) based on the residues.

  The polymer type is guessed by first checking for any of the standard
  protein residues. If one is present then the chain is considered to be a
  polypeptide. Otherwise we decide by counting residue types and deciding by
  majority voting (e.g. mostly DNA residues -> DNA). If there is a tie between
  the counts, the ordering is rna > dna > other.

  Note that we count MSE and UNK as protein residues.

  Args:
    chain_residues: A sequence of full residue name (1-letter for DNA, 2-letters
      for RNA, 3 for protein). The _atom_site.label_comp_id column in mmCIF.

  Returns:
    The most probable chain type as set in the _entity_poly mmCIF table:
    protein - polypeptide(L), rna - polyribonucleotide,
    dna - polydeoxyribonucleotide or other.
  """
  residue_types = {
      **{r: RNA_CHAIN for r in residue_names.RNA_TYPES},
      **{r: DNA_CHAIN for r in residue_names.DNA_TYPES},
      **{r: PROTEIN_CHAIN for r in residue_names.PROTEIN_TYPES_WITH_UNKNOWN},
      residue_names.MSE: PROTEIN_CHAIN,
  }

  counts = {PROTEIN_CHAIN: 0, RNA_CHAIN: 0, DNA_CHAIN: 0, OTHER_CHAIN: 0}
  for residue in chain_residues:
    residue_type = residue_types.get(residue, OTHER_CHAIN)
    # If we ever see a protein residue we'll consider this a polypeptide(L).
    if residue_type == PROTEIN_CHAIN:
      return residue_type
    counts[residue_type] += 1

  # Make sure protein > rna > dna > other if there is a tie.
  tie_braker = {PROTEIN_CHAIN: 3, RNA_CHAIN: 2, DNA_CHAIN: 1, OTHER_CHAIN: 0}

  def order_fn(item):
    name, count = item
    return count, tie_braker[name]

  most_probable_type = max(counts.items(), key=order_fn)[0]
  return most_probable_type


def fix_non_standard_polymer_res(*, res_name: str, chain_type: str) -> str:
  """Returns the res_name of the closest standard protein/RNA/DNA residue.

  Optimized for the case where a single residue needs to be converted.

  If res_name is already a standard type, it is returned unaltered.
  If a match cannot be found, returns 'UNK' for protein chains and 'N' for
    RNA/DNA chains.

  Args:
     res_name: A residue_name (monomer code from the CCD).
     chain_type: The type of the chain, must be PROTEIN_CHAIN, RNA_CHAIN or
       DNA_CHAIN.

  Returns:
    An element from PROTEIN_TYPES_WITH_UNKNOWN | RNA_TYPES | DNA_TYPES | {'N'}.

  Raises:
    ValueError: If chain_type not in PEPTIDE_CHAIN_TYPES or
      {OTHER_CHAIN, RNA_CHAIN, DNA_CHAIN, DNA_RNA_HYBRID_CHAIN}.
  """
  # Map to one letter code, then back to common res_names.
  one_letter_code = residue_names.letters_three_to_one(res_name, default='X')

  if chain_type in PEPTIDE_CHAIN_TYPES or chain_type == OTHER_CHAIN:
    return residue_names.PROTEIN_COMMON_ONE_TO_THREE.get(one_letter_code, 'UNK')
  elif chain_type == RNA_CHAIN:
    # RNA's CCD monomer code is single-letter.
    return (
        one_letter_code if one_letter_code in residue_names.RNA_TYPES else 'N'
    )
  elif chain_type == DNA_CHAIN:
    return residue_names.DNA_COMMON_ONE_TO_TWO.get(one_letter_code, 'N')
  elif chain_type == DNA_RNA_HYBRID_CHAIN:
    return (
        res_name
        if res_name in residue_names.NUCLEIC_TYPES_WITH_UNKNOWN
        else 'N'
    )
  else:
    raise ValueError(f'Expected a protein/DNA/RNA chain but got {chain_type}')


================================================
FILE: src/alphafold3/constants/periodic_table.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Periodic table of elements."""

from collections.abc import Mapping, Sequence
import dataclasses
from typing import Final

import numpy as np


@dataclasses.dataclass(frozen=True, kw_only=True)
class Element:
  name: str
  number: int
  symbol: str
  weight: float


# Weights taken from rdkit/Code/GraphMol/atomic_data.cpp for compatibility.
# pylint: disable=invalid-name

# X is an unknown element that can be present in the CCD,
# https://www.rcsb.org/ligand/UNX.
X: Final[Element] = Element(name='Unknown', number=0, symbol='X', weight=0.0)
H: Final[Element] = Element(name='Hydrogen', number=1, symbol='H', weight=1.008)
He: Final[Element] = Element(name='Helium', number=2, symbol='He', weight=4.003)
Li: Final[Element] = Element(
    name='Lithium', number=3, symbol='Li', weight=6.941
)
Be: Final[Element] = Element(
    name='Beryllium', number=4, symbol='Be', weight=9.012
)
B: Final[Element] = Element(name='Boron', number=5, symbol='B', weight=10.812)
C: Final[Element] = Element(name='Carbon', number=6, symbol='C', weight=12.011)
N: Final[Element] = Element(
    name='Nitrogen', number=7, symbol='N', weight=14.007
)
O: Final[Element] = Element(name='Oxygen', number=8, symbol='O', weight=15.999)
F: Final[Element] = Element(
    name='Fluorine', number=9, symbol='F', weight=18.998
)
Ne: Final[Element] = Element(name='Neon', number=10, symbol='Ne', weight=20.18)
Na: Final[Element] = Element(
    name='Sodium', number=11, symbol='Na', weight=22.99
)
Mg: Final[Element] = Element(
    name='Magnesium', number=12, symbol='Mg', weight=24.305
)
Al: Final[Element] = Element(
    name='Aluminium', number=13, symbol='Al', weight=26.982
)
Si: Final[Element] = Element(
    name='Silicon', number=14, symbol='Si', weight=28.086
)
P: Final[Element] = Element(
    name='Phosphorus', number=15, symbol='P', weight=30.974
)
S: Final[Element] = Element(name='Sulfur', number=16, symbol='S', weight=32.067)
Cl: Final[Element] = Element(
    name='Chlorine', number=17, symbol='Cl', weight=35.453
)
Ar: Final[Element] = Element(
    name='Argon', number=18, symbol='Ar', weight=39.948
)
K: Final[Element] = Element(
    name='Potassium', number=19, symbol='K', weight=39.098
)
Ca: Final[Element] = Element(
    name='Calcium', number=20, symbol='Ca', weight=40.078
)
Sc: Final[Element] = Element(
    name='Scandium', number=21, symbol='Sc', weight=44.956
)
Ti: Final[Element] = Element(
    name='Titanium', number=22, symbol='Ti', weight=47.867
)
V: Final[Element] = Element(
    name='Vanadium', number=23, symbol='V', weight=50.942
)
Cr: Final[Element] = Element(
    name='Chromium', number=24, symbol='Cr', weight=51.996
)
Mn: Final[Element] = Element(
    name='Manganese', number=25, symbol='Mn', weight=54.938
)
Fe: Final[Element] = Element(name='Iron', number=26, symbol='Fe', weight=55.845)
Co: Final[Element] = Element(
    name='Cobalt', number=27, symbol='Co', weight=58.933
)
Ni: Final[Element] = Element(
    name='Nickel', number=28, symbol='Ni', weight=58.693
)
Cu: Final[Element] = Element(
    name='Copper', number=29, symbol='Cu', weight=63.546
)
Zn: Final[Element] = Element(name='Zinc', number=30, symbol='Zn', weight=65.39)
Ga: Final[Element] = Element(
    name='Gallium', number=31, symbol='Ga', weight=69.723
)
Ge: Final[Element] = Element(
    name='Germanium', number=32, symbol='Ge', weight=72.61
)
As: Final[Element] = Element(
    name='Arsenic', number=33, symbol='As', weight=74.922
)
Se: Final[Element] = Element(
    name='Selenium', number=34, symbol='Se', weight=78.96
)
Br: Final[Element] = Element(
    name='Bromine', number=35, symbol='Br', weight=79.904
)
Kr: Final[Element] = Element(
    name='Krypton', number=36, symbol='Kr', weight=83.8
)
Rb: Final[Element] = Element(
    name='Rubidium', number=37, symbol='Rb', weight=85.468
)
Sr: Final[Element] = Element(
    name='Strontium', number=38, symbol='Sr', weight=87.62
)
Y: Final[Element] = Element(
    name='Yttrium', number=39, symbol='Y', weight=88.906
)
Zr: Final[Element] = Element(
    name='Zirconium', number=40, symbol='Zr', weight=91.224
)
Nb: Final[Element] = Element(
    name='Niobiu', number=41, symbol='Nb', weight=92.906
)
Mo: Final[Element] = Element(
    name='Molybdenum', number=42, symbol='Mo', weight=95.94
)
Tc: Final[Element] = Element(
    name='Technetium', number=43, symbol='Tc', weight=98
)
Ru: Final[Element] = Element(
    name='Ruthenium', number=44, symbol='Ru', weight=101.07
)
Rh: Final[Element] = Element(
    name='Rhodium', number=45, symbol='Rh', weight=102.906
)
Pd: Final[Element] = Element(
    name='Palladium', number=46, symbol='Pd', weight=106.42
)
Ag: Final[Element] = Element(
    name='Silver', number=47, symbol='Ag', weight=107.868
)
Cd: Final[Element] = Element(
    name='Cadmium', number=48, symbol='Cd', weight=112.412
)
In: Final[Element] = Element(
    name='Indium', number=49, symbol='In', weight=114.818
)
Sn: Final[Element] = Element(name='Tin', number=50, symbol='Sn', weight=118.711)
Sb: Final[Element] = Element(
    name='Antimony', number=51, symbol='Sb', weight=121.76
)
Te: Final[Element] = Element(
    name='Tellurium', number=52, symbol='Te', weight=127.6
)
I: Final[Element] = Element(
    name='Iodine', number=53, symbol='I', weight=126.904
)
Xe: Final[Element] = Element(
    name='Xenon', number=54, symbol='Xe', weight=131.29
)
Cs: Final[Element] = Element(
    name='Caesium', number=55, symbol='Cs', weight=132.905
)
Ba: Final[Element] = Element(
    name='Barium', number=56, symbol='Ba', weight=137.328
)
La: Final[Element] = Element(
    name='Lanthanum', number=57, symbol='La', weight=138.906
)
Ce: Final[Element] = Element(
    name='Cerium', number=58, symbol='Ce', weight=140.116
)
Pr: Final[Element] = Element(
    name='Praseodymium', number=59, symbol='Pr', weight=140.908
)
Nd: Final[Element] = Element(
    name='Neodymium', number=60, symbol='Nd', weight=144.24
)
Pm: Final[Element] = Element(
    name='Promethium', number=61, symbol='Pm', weight=145
)
Sm: Final[Element] = Element(
    name='Samarium', number=62, symbol='Sm', weight=150.36
)
Eu: Final[Element] = Element(
    name='Europium', number=63, symbol='Eu', weight=151.964
)
Gd: Final[Element] = Element(
    name='Gadolinium', number=64, symbol='Gd', weight=157.25
)
Tb: Final[Element] = Element(
    name='Terbium', number=65, symbol='Tb', weight=158.925
)
Dy: Final[Element] = Element(
    name='Dysprosium', number=66, symbol='Dy', weight=162.5
)
Ho: Final[Element] = Element(
    name='Holmium', number=67, symbol='Ho', weight=164.93
)
Er: Final[Element] = Element(
    name='Erbium', number=68, symbol='Er', weight=167.26
)
Tm: Final[Element] = Element(
    name='Thulium', number=69, symbol='Tm', weight=168.934
)
Yb: Final[Element] = Element(
    name='Ytterbium', number=70, symbol='Yb', weight=173.04
)
Lu: Final[Element] = Element(
    name='Lutetium', number=71, symbol='Lu', weight=174.967
)
Hf: Final[Element] = Element(
    name='Hafnium', number=72, symbol='Hf', weight=178.49
)
Ta: Final[Element] = Element(
    name='Tantalum', number=73, symbol='Ta', weight=180.948
)
W: Final[Element] = Element(
    name='Tungsten', number=74, symbol='W', weight=183.84
)
Re: Final[Element] = Element(
    name='Rhenium', number=75, symbol='Re', weight=186.207
)
Os: Final[Element] = Element(
    name='Osmium', number=76, symbol='Os', weight=190.23
)
Ir: Final[Element] = Element(
    name='Iridium', number=77, symbol='Ir', weight=192.217
)
Pt: Final[Element] = Element(
    name='Platinum', number=78, symbol='Pt', weight=195.078
)
Au: Final[Element] = Element(
    name='Gold', number=79, symbol='Au', weight=196.967
)
Hg: Final[Element] = Element(
    name='Mercury', number=80, symbol='Hg', weight=200.59
)
Tl: Final[Element] = Element(
    name='Thallium', number=81, symbol='Tl', weight=204.383
)
Pb: Final[Element] = Element(name='Lead', number=82, symbol='Pb', weight=207.2)
Bi: Final[Element] = Element(
    name='Bismuth', number=83, symbol='Bi', weight=208.98
)
Po: Final[Element] = Element(
    name='Polonium', number=84, symbol='Po', weight=209
)
At: Final[Element] = Element(
    name='Astatine', number=85, symbol='At', weight=210
)
Rn: Final[Element] = Element(name='Radon', number=86, symbol='Rn', weight=222)
Fr: Final[Element] = Element(
    name='Francium', number=87, symbol='Fr', weight=223
)
Ra: Final[Element] = Element(name='Radium', number=88, symbol='Ra', weight=226)
Ac: Final[Element] = Element(
    name='Actinium', number=89, symbol='Ac', weight=227
)
Th: Final[Element] = Element(
    name='Thorium', number=90, symbol='Th', weight=232.038
)
Pa: Final[Element] = Element(
    name='Protactinium', number=91, symbol='Pa', weight=231.036
)
U: Final[Element] = Element(
    name='Uranium', number=92, symbol='U', weight=238.029
)
Np: Final[Element] = Element(
    name='Neptunium', number=93, symbol='Np', weight=237
)
Pu: Final[Element] = Element(
    name='Plutonium', number=94, symbol='Pu', weight=244
)
Am: Final[Element] = Element(
    name='Americium', number=95, symbol='Am', weight=243
)
Cm: Final[Element] = Element(name='Curium', number=96, symbol='Cm', weight=247)
Bk: Final[Element] = Element(
    name='Berkelium', number=97, symbol='Bk', weight=247
)
Cf: Final[Element] = Element(
    name='Californium', number=98, symbol='Cf', weight=251
)
Es: Final[Element] = Element(
    name='Einsteinium', number=99, symbol='Es', weight=252
)
Fm: Final[Element] = Element(
    name='Fermium', number=100, symbol='Fm', weight=257
)
Md: Final[Element] = Element(
    name='Mendelevium', number=101, symbol='Md', weight=258
)
No: Final[Element] = Element(
    name='Nobelium', number=102, symbol='No', weight=259
)
Lr: Final[Element] = Element(
    name='Lawrencium', number=103, symbol='Lr', weight=262
)
Rf: Final[Element] = Element(
    name='Rutherfordium', number=104, symbol='Rf', weight=267
)
Db: Final[Element] = Element(
    name='Dubnium', number=105, symbol='Db', weight=268
)
Sg: Final[Element] = Element(
    name='Seaborgium', number=106, symbol='Sg', weight=269
)
Bh: Final[Element] = Element(
    name='Bohrium', number=107, symbol='Bh', weight=270
)
Hs: Final[Element] = Element(
    name='Hassium', number=108, symbol='Hs', weight=269
)
Mt: Final[Element] = Element(
    name='Meitnerium', number=109, symbol='Mt', weight=278
)
Ds: Final[Element] = Element(
    name='Darmstadtium', number=110, symbol='Ds', weight=281
)
Rg: Final[Element] = Element(
    name='Roentgenium', number=111, symbol='Rg', weight=281
)
Cn: Final[Element] = Element(
    name='Copernicium', number=112, symbol='Cn', weight=285
)
Nh: Final[Element] = Element(
    name='Nihonium', number=113, symbol='Nh', weight=284
)
Fl: Final[Element] = Element(
    name='Flerovium', number=114, symbol='Fl', weight=289
)
Mc: Final[Element] = Element(
    name='Moscovium', number=115, symbol='Mc', weight=288
)
Lv: Final[Element] = Element(
    name='Livermorium', number=116, symbol='Lv', weight=293
)
Ts: Final[Element] = Element(
    name='Tennessine', number=117, symbol='Ts', weight=292
)
Og: Final[Element] = Element(
    name='Oganesson', number=118, symbol='Og', weight=294
)
# pylint: enable=invalid-name

# fmt: off
# Lanthanides
_L: Final[Sequence[Element]] = (
    La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb, Lu)
# Actinides
_A: Final[Sequence[Element]] = (
    Ac, Th, Pa, U, Np, Pu, Am, Cm, Bk, Cf, Es, Fm, Md, No, Lr)

# pylint: disable=bad-whitespace
PERIODIC_TABLE: Final[Sequence[Element]] = (
    X,  # Unknown
    H,                                                                   He,
    Li, Be,                                          B,  C,  N,  O,  F,  Ne,
    Na, Mg,                                          Al, Si, P,  S,  Cl, Ar,
    K,  Ca,  Sc, Ti, V,  Cr, Mn, Fe, Co, Ni, Cu, Zn, Ga, Ge, As, Se, Br, Kr,
    Rb, Sr,  Y,  Zr, Nb, Mo, Tc, Ru, Rh, Pd, Ag, Cd, In, Sn, Sb, Te, I,  Xe,
    Cs, Ba, *_L, Hf, Ta, W,  Re, Os, Ir, Pt, Au, Hg, Tl, Pb, Bi, Po, At, Rn,
    Fr, Ra, *_A, Rf, Db, Sg, Bh, Hs, Mt, Ds, Rg, Cn, Nh, Fl, Mc, Lv, Ts, Og
)
# pylint: enable=bad-whitespace
# fmt: on
ATOMIC_SYMBOL: Mapping[int, str] = {e.number: e.symbol for e in PERIODIC_TABLE}
ATOMIC_NUMBER = {e.symbol: e.number for e in PERIODIC_TABLE}
# Add Deuterium as previous table contained it.
ATOMIC_NUMBER['D'] = 1

ATOMIC_NUMBER: Mapping[str, int] = ATOMIC_NUMBER
ATOMIC_WEIGHT: np.ndarray = np.zeros(len(PERIODIC_TABLE), dtype=np.float64)

for e in PERIODIC_TABLE:
  ATOMIC_WEIGHT[e.number] = e.weight
ATOMIC_WEIGHT.setflags(write=False)


================================================
FILE: src/alphafold3/constants/residue_names.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Constants associated with residue names."""

from collections.abc import Mapping
import functools
import sys

# pyformat: disable
# common_typos_disable
CCD_NAME_TO_ONE_LETTER: Mapping[str, str] = {
    '00C': 'C', '01W': 'X', '02K': 'A', '03Y': 'C', '07O': 'C', '08P': 'C',
    '0A0': 'D', '0A1': 'Y', '0A2': 'K', '0A8': 'C', '0AA': 'V', '0AB': 'V',
    '0AC': 'G', '0AD': 'G', '0AF': 'W', '0AG': 'L', '0AH': 'S', '0AK': 'D',
    '0AM': 'A', '0AP': 'C', '0AU': 'U', '0AV': 'A', '0AZ': 'P', '0BN': 'F',
    '0C': 'C', '0CS': 'A', '0DC': 'C', '0DG': 'G', '0DT': 'T', '0FL': 'A',
    '0G': 'G', '0NC': 'A', '0SP': 'A', '0U': 'U', '10C': 'C', '125': 'U',
    '126': 'U', '127': 'U', '128': 'N', '12A': 'A', '143': 'C', '193': 'X',
    '1AP': 'A', '1MA': 'A', '1MG': 'G', '1PA': 'F', '1PI': 'A', '1PR': 'N',
    '1SC': 'C', '1TQ': 'W', '1TY': 'Y', '1X6': 'S', '200': 'F', '23F': 'F',
    '23S': 'X', '26B': 'T', '2AD': 'X', '2AG': 'A', '2AO': 'X', '2AR': 'A',
    '2AS': 'X', '2AT': 'T', '2AU': 'U', '2BD': 'I', '2BT': 'T', '2BU': 'A',
    '2CO': 'C', '2DA': 'A', '2DF': 'N', '2DM': 'N', '2DO': 'X', '2DT': 'T',
    '2EG': 'G', '2FE': 'N', '2FI': 'N', '2FM': 'M', '2GT': 'T', '2HF': 'H',
    '2LU': 'L', '2MA': 'A', '2MG': 'G', '2ML': 'L', '2MR': 'R', '2MT': 'P',
    '2MU': 'U', '2NT': 'T', '2OM': 'U', '2OT': 'T', '2PI': 'X', '2PR': 'G',
    '2SA': 'N', '2SI': 'X', '2ST': 'T', '2TL': 'T', '2TY': 'Y', '2VA': 'V',
    '2XA': 'C', '32S': 'X', '32T': 'X', '3AH': 'H', '3AR': 'X', '3CF': 'F',
    '3DA': 'A', '3DR': 'N', '3GA': 'A', '3MD': 'D', '3ME': 'U', '3NF': 'Y',
    '3QN': 'K', '3TY': 'X', '3XH': 'G', '4AC': 'N', '4BF': 'Y', '4CF': 'F',
    '4CY': 'M', '4DP': 'W', '4FB': 'P', '4FW': 'W', '4HT': 'W', '4IN': 'W',
    '4MF': 'N', '4MM': 'X', '4OC': 'C', '4PC': 'C', '4PD': 'C', '4PE': 'C',
    '4PH': 'F', '4SC': 'C', '4SU': 'U', '4TA': 'N', '4U7': 'A', '56A': 'H',
    '5AA': 'A', '5AB': 'A', '5AT': 'T', '5BU': 'U', '5CG': 'G', '5CM': 'C',
    '5CS': 'C', '5FA': 'A', '5FC': 'C', '5FU': 'U', '5HP': 'E', '5HT': 'T',
    '5HU': 'U', '5IC': 'C', '5IT': 'T', '5IU': 'U', '5MC': 'C', '5MD': 'N',
    '5MU': 'U', '5NC': 'C', '5PC': 'C', '5PY': 'T', '5SE': 'U', '64T': 'T',
    '6CL': 'K', '6CT': 'T', '6CW': 'W', '6HA': 'A', '6HC': 'C', '6HG': 'G',
    '6HN': 'K', '6HT': 'T', '6IA': 'A', '6MA': 'A', '6MC': 'A', '6MI': 'N',
    '6MT': 'A', '6MZ': 'N', '6OG': 'G', '70U': 'U', '7DA': 'A', '7GU': 'G',
    '7JA': 'I', '7MG': 'G', '8AN': 'A', '8FG': 'G', '8MG': 'G', '8OG': 'G',
    '9NE': 'E', '9NF': 'F', '9NR': 'R', '9NV': 'V', 'A': 'A', 'A1P': 'N',
    'A23': 'A', 'A2L': 'A', 'A2M': 'A', 'A34': 'A', 'A35': 'A', 'A38': 'A',
    'A39': 'A', 'A3A': 'A', 'A3P': 'A', 'A40': 'A', 'A43': 'A', 'A44': 'A',
    'A47': 'A', 'A5L': 'A', 'A5M': 'C', 'A5N': 'N', 'A5O': 'A', 'A66': 'X',
    'AA3': 'A', 'AA4': 'A', 'AAR': 'R', 'AB7': 'X', 'ABA': 'A', 'ABR': 'A',
    'ABS': 'A', 'ABT': 'N', 'ACB': 'D', 'ACL': 'R', 'AD2': 'A', 'ADD': 'X',
    'ADX': 'N', 'AEA': 'X', 'AEI': 'D', 'AET': 'A', 'AFA': 'N', 'AFF': 'N',
    'AFG': 'G', 'AGM': 'R', 'AGT': 'C', 'AHB': 'N', 'AHH': 'X', 'AHO': 'A',
    'AHP': 'A', 'AHS': 'X', 'AHT': 'X', 'AIB': 'A', 'AKL': 'D', 'AKZ': 'D',
    'ALA': 'A', 'ALC': 'A', 'ALM': 'A', 'ALN': 'A', 'ALO': 'T', 'ALQ': 'X',
    'ALS': 'A', 'ALT': 'A', 'ALV': 'A', 'ALY': 'K', 'AN8': 'A', 'AP7': 'A',
    'APE': 'X', 'APH': 'A', 'API': 'K', 'APK': 'K', 'APM': 'X', 'APP': 'X',
    'AR2': 'R', 'AR4': 'E', 'AR7': 'R', 'ARG': 'R', 'ARM': 'R', 'ARO': 'R',
    'ARV': 'X', 'AS': 'A', 'AS2': 'D', 'AS9': 'X', 'ASA': 'D', 'ASB': 'D',
    'ASI': 'D', 'ASK': 'D', 'ASL': 'D', 'ASM': 'X', 'ASN': 'N', 'ASP': 'D',
    'ASQ': 'D', 'ASU': 'N', 'ASX': 'B', 'ATD': 'T', 'ATL': 'T', 'ATM': 'T',
    'AVC': 'A', 'AVN': 'X', 'AYA': 'A', 'AZK': 'K', 'AZS': 'S', 'AZY': 'Y',
    'B1F': 'F', 'B1P': 'N', 'B2A': 'A', 'B2F': 'F', 'B2I': 'I', 'B2V': 'V',
    'B3A': 'A', 'B3D': 'D', 'B3E': 'E', 'B3K': 'K', 'B3L': 'X', 'B3M': 'X',
    'B3Q': 'X', 'B3S': 'S', 'B3T': 'X', 'B3U': 'H', 'B3X': 'N', 'B3Y': 'Y',
    'BB6': 'C', 'BB7': 'C', 'BB8': 'F', 'BB9': 'C', 'BBC': 'C', 'BCS': 'C',
    'BE2': 'X', 'BFD': 'D', 'BG1': 'S', 'BGM': 'G', 'BH2': 'D', 'BHD': 'D',
    'BIF': 'F', 'BIL': 'X', 'BIU': 'I', 'BJH': 'X', 'BLE': 'L', 'BLY': 'K',
    'BMP': 'N', 'BMT': 'T', 'BNN': 'F', 'BNO': 'X', 'BOE': 'T', 'BOR': 'R',
    'BPE': 'C', 'BRU': 'U', 'BSE': 'S', 'BT5': 'N', 'BTA': 'L', 'BTC': 'C',
    'BTR': 'W', 'BUC': 'C', 'BUG': 'V', 'BVP': 'U', 'BZG': 'N', 'C': 'C',
    'C1X': 'K', 'C25': 'C', 'C2L': 'C', 'C2S': 'C', 'C31': 'C', 'C32': 'C',
    'C34': 'C', 'C36': 'C', 'C37': 'C', 'C38': 'C', 'C3Y': 'C', 'C42': 'C',
    'C43': 'C', 'C45': 'C', 'C46': 'C', 'C49': 'C', 'C4R': 'C', 'C4S': 'C',
    'C5C': 'C', 'C66': 'X', 'C6C': 'C', 'CAF': 'C', 'CAL': 'X', 'CAR': 'C',
    'CAS': 'C', 'CAV': 'X', 'CAY': 'C', 'CB2': 'C', 'CBR': 'C', 'CBV': 'C',
    'CCC': 'C', 'CCL': 'K', 'CCS': 'C', 'CDE': 'X', 'CDV': 'X', 'CDW': 'C',
    'CEA': 'C', 'CFL': 'C', 'CG1': 'G', 'CGA': 'E', 'CGU': 'E', 'CH': 'C',
    'CHF': 'X', 'CHG': 'X', 'CHP': 'G', 'CHS': 'X', 'CIR': 'R', 'CLE': 'L',
    'CLG': 'K', 'CLH': 'K', 'CM0': 'N', 'CME': 'C', 'CMH': 'C', 'CML': 'C',
    'CMR': 'C', 'CMT': 'C', 'CNU': 'U', 'CP1': 'C', 'CPC': 'X', 'CPI': 'X',
    'CR5': 'G', 'CS0': 'C', 'CS1': 'C', 'CS3': 'C', 'CS4': 'C', 'CS8': 'N',
    'CSA': 'C', 'CSB': 'C', 'CSD': 'C', 'CSE': 'C', 'CSF': 'C', 'CSI': 'G',
    'CSJ': 'C', 'CSL': 'C', 'CSO': 'C', 'CSP': 'C', 'CSR': 'C', 'CSS': 'C',
    'CSU': 'C', 'CSW': 'C', 'CSX': 'C', 'CSZ': 'C', 'CTE': 'W', 'CTG': 'T',
    'CTH': 'T', 'CUC': 'X', 'CWR': 'S', 'CXM': 'M', 'CY0': 'C', 'CY1': 'C',
    'CY3': 'C', 'CY4': 'C', 'CYA': 'C', 'CYD': 'C', 'CYF': 'C', 'CYG': 'C',
    'CYJ': 'X', 'CYM': 'C', 'CYQ': 'C', 'CYR': 'C', 'CYS': 'C', 'CZ2': 'C',
    'CZZ': 'C', 'D11': 'T', 'D1P': 'N', 'D3': 'N', 'D33': 'N', 'D3P': 'G',
    'D3T': 'T', 'D4M': 'T', 'D4P': 'X', 'DA': 'A', 'DA2': 'X', 'DAB': 'A',
    'DAH': 'F', 'DAL': 'A', 'DAR': 'R', 'DAS': 'D', 'DBB': 'T', 'DBM': 'N',
    'DBS': 'S', 'DBU': 'T', 'DBY': 'Y', 'DBZ': 'A', 'DC': 'C', 'DC2': 'C',
    'DCG': 'G', 'DCI': 'X', 'DCL': 'X', 'DCT': 'C', 'DCY': 'C', 'DDE': 'H',
    'DDG': 'G', 'DDN': 'U', 'DDX': 'N', 'DFC': 'C', 'DFG': 'G', 'DFI': 'X',
    'DFO': 'X', 'DFT': 'N', 'DG': 'G', 'DGH': 'G', 'DGI': 'G', 'DGL': 'E',
    'DGN': 'Q', 'DHA': 'S', 'DHI': 'H', 'DHL': 'X', 'DHN': 'V', 'DHP': 'X',
    'DHU': 'U', 'DHV': 'V', 'DI': 'I', 'DIL': 'I', 'DIR': 'R', 'DIV': 'V',
    'DLE': 'L', 'DLS': 'K', 'DLY': 'K', 'DM0': 'K', 'DMH': 'N', 'DMK': 'D',
    'DMT': 'X', 'DN': 'N', 'DNE': 'L', 'DNG': 'L', 'DNL': 'K', 'DNM': 'L',
    'DNP': 'A', 'DNR': 'C', 'DNS': 'K', 'DOA': 'X', 'DOC': 'C', 'DOH': 'D',
    'DON': 'L', 'DPB': 'T', 'DPH': 'F', 'DPL': 'P', 'DPP': 'A', 'DPQ': 'Y',
    'DPR': 'P', 'DPY': 'N', 'DRM': 'U', 'DRP': 'N', 'DRT': 'T', 'DRZ': 'N',
    'DSE': 'S', 'DSG': 'N', 'DSN': 'S', 'DSP': 'D', 'DT': 'T', 'DTH': 'T',
    'DTR': 'W', 'DTY': 'Y', 'DU': 'U', 'DVA': 'V', 'DXD': 'N', 'DXN': 'N',
    'DYS': 'C', 'DZM': 'A', 'E': 'A', 'E1X': 'A', 'ECC': 'Q', 'EDA': 'A',
    'EFC': 'C', 'EHP': 'F', 'EIT': 'T', 'ENP': 'N', 'ESB': 'Y', 'ESC': 'M',
    'EXB': 'X', 'EXY': 'L', 'EY5': 'N', 'EYS': 'X', 'F2F': 'F', 'FA2': 'A',
    'FA5': 'N', 'FAG': 'N', 'FAI': 'N', 'FB5': 'A', 'FB6': 'A', 'FCL': 'F',
    'FFD': 'N', 'FGA': 'E', 'FGL': 'G', 'FGP': 'S', 'FHL': 'X', 'FHO': 'K',
    'FHU': 'U', 'FLA': 'A', 'FLE': 'L', 'FLT': 'Y', 'FME': 'M', 'FMG': 'G',
    'FMU': 'N', 'FOE': 'C', 'FOX': 'G', 'FP9': 'P', 'FPA': 'F', 'FRD': 'X',
    'FT6': 'W', 'FTR': 'W', 'FTY': 'Y', 'FVA': 'V', 'FZN': 'K', 'G': 'G',
    'G25': 'G', 'G2L': 'G', 'G2S': 'G', 'G31': 'G', 'G32': 'G', 'G33': 'G',
    'G36': 'G', 'G38': 'G', 'G42': 'G', 'G46': 'G', 'G47': 'G', 'G48': 'G',
    'G49': 'G', 'G4P': 'N', 'G7M': 'G', 'GAO': 'G', 'GAU': 'E', 'GCK': 'C',
    'GCM': 'X', 'GDP': 'G', 'GDR': 'G', 'GFL': 'G', 'GGL': 'E', 'GH3': 'G',
    'GHG': 'Q', 'GHP': 'G', 'GL3': 'G', 'GLH': 'Q', 'GLJ': 'E', 'GLK': 'E',
    'GLM': 'X', 'GLN': 'Q', 'GLQ': 'E', 'GLU': 'E', 'GLX': 'Z', 'GLY': 'G',
    'GLZ': 'G', 'GMA': 'E', 'GMS': 'G', 'GMU': 'U', 'GN7': 'G', 'GND': 'X',
    'GNE': 'N', 'GOM': 'G', 'GPL': 'K', 'GS': 'G', 'GSC': 'G', 'GSR': 'G',
    'GSS': 'G', 'GSU': 'E', 'GT9': 'C', 'GTP': 'G', 'GVL': 'X', 'H2U': 'U',
    'H5M': 'P', 'HAC': 'A', 'HAR': 'R', 'HBN': 'H', 'HCS': 'X', 'HDP': 'U',
    'HEU': 'U', 'HFA': 'X', 'HGL': 'X', 'HHI': 'H', 'HIA': 'H', 'HIC': 'H',
    'HIP': 'H', 'HIQ': 'H', 'HIS': 'H', 'HL2': 'L', 'HLU': 'L', 'HMR': 'R',
    'HOL': 'N', 'HPC': 'F', 'HPE': 'F', 'HPH': 'F', 'HPQ': 'F', 'HQA': 'A',
    'HRG': 'R', 'HRP': 'W', 'HS8': 'H', 'HS9': 'H', 'HSE': 'S', 'HSL': 'S',
    'HSO': 'H', 'HTI': 'C', 'HTN': 'N', 'HTR': 'W', 'HV5': 'A', 'HVA': 'V',
    'HY3': 'P', 'HYP': 'P', 'HZP': 'P', 'I': 'I', 'I2M': 'I', 'I58': 'K',
    'I5C': 'C', 'IAM': 'A', 'IAR': 'R', 'IAS': 'D', 'IC': 'C', 'IEL': 'K',
    'IG': 'G', 'IGL': 'G', 'IGU': 'G', 'IIL': 'I', 'ILE': 'I', 'ILG': 'E',
    'ILX': 'I', 'IMC': 'C', 'IML': 'I', 'IOY': 'F', 'IPG': 'G', 'IPN': 'N',
    'IRN': 'N', 'IT1': 'K', 'IU': 'U', 'IYR': 'Y', 'IYT': 'T', 'IZO': 'M',
    'JJJ': 'C', 'JJK': 'C', 'JJL': 'C', 'JW5': 'N', 'K1R': 'C', 'KAG': 'G',
    'KCX': 'K', 'KGC': 'K', 'KNB': 'A', 'KOR': 'M', 'KPI': 'K', 'KST': 'K',
    'KYQ': 'K', 'L2A': 'X', 'LA2': 'K', 'LAA': 'D', 'LAL': 'A', 'LBY': 'K',
    'LC': 'C', 'LCA': 'A', 'LCC': 'N', 'LCG': 'G', 'LCH': 'N', 'LCK': 'K',
    'LCX': 'K', 'LDH': 'K', 'LED': 'L', 'LEF': 'L', 'LEH': 'L', 'LEI': 'V',
    'LEM': 'L', 'LEN': 'L', 'LET': 'X', 'LEU': 'L', 'LEX': 'L', 'LG': 'G',
    'LGP': 'G', 'LHC': 'X', 'LHU': 'U', 'LKC': 'N', 'LLP': 'K', 'LLY': 'K',
    'LME': 'E', 'LMF': 'K', 'LMQ': 'Q', 'LMS': 'N', 'LP6': 'K', 'LPD': 'P',
    'LPG': 'G', 'LPL': 'X', 'LPS': 'S', 'LSO': 'X', 'LTA': 'X', 'LTR': 'W',
    'LVG': 'G', 'LVN': 'V', 'LYF': 'K', 'LYK': 'K', 'LYM': 'K', 'LYN': 'K',
    'LYR': 'K', 'LYS': 'K', 'LYX': 'K', 'LYZ': 'K', 'M0H': 'C', 'M1G': 'G',
    'M2G': 'G', 'M2L': 'K', 'M2S': 'M', 'M30': 'G', 'M3L': 'K', 'M5M': 'C',
    'MA': 'A', 'MA6': 'A', 'MA7': 'A', 'MAA': 'A', 'MAD': 'A', 'MAI': 'R',
    'MBQ': 'Y', 'MBZ': 'N', 'MC1': 'S', 'MCG': 'X', 'MCL': 'K', 'MCS': 'C',
    'MCY': 'C', 'MD3': 'C', 'MD6': 'G', 'MDH': 'X', 'MDR': 'N', 'MEA': 'F',
    'MED': 'M', 'MEG': 'E', 'MEN': 'N', 'MEP': 'U', 'MEQ': 'Q', 'MET': 'M',
    'MEU': 'G', 'MF3': 'X', 'MG1': 'G', 'MGG': 'R', 'MGN': 'Q', 'MGQ': 'A',
    'MGV': 'G', 'MGY': 'G', 'MHL': 'L', 'MHO': 'M', 'MHS': 'H', 'MIA': 'A',
    'MIS': 'S', 'MK8': 'L', 'ML3': 'K', 'MLE': 'L', 'MLL': 'L', 'MLY': 'K',
    'MLZ': 'K', 'MME': 'M', 'MMO': 'R', 'MMT': 'T', 'MND': 'N', 'MNL': 'L',
    'MNU': 'U', 'MNV': 'V', 'MOD': 'X', 'MP8': 'P', 'MPH': 'X', 'MPJ': 'X',
    'MPQ': 'G', 'MRG': 'G', 'MSA': 'G', 'MSE': 'M', 'MSL': 'M', 'MSO': 'M',
    'MSP': 'X', 'MT2': 'M', 'MTR': 'T', 'MTU': 'A', 'MTY': 'Y', 'MVA': 'V',
    'N': 'N', 'N10': 'S', 'N2C': 'X', 'N5I': 'N', 'N5M': 'C', 'N6G': 'G',
    'N7P': 'P', 'NA8': 'A', 'NAL': 'A', 'NAM': 'A', 'NB8': 'N', 'NBQ': 'Y',
    'NC1': 'S', 'NCB': 'A', 'NCX': 'N', 'NCY': 'X', 'NDF': 'F', 'NDN': 'U',
    'NEM': 'H', 'NEP': 'H', 'NF2': 'N', 'NFA': 'F', 'NHL': 'E', 'NIT': 'X',
    'NIY': 'Y', 'NLE': 'L', 'NLN': 'L', 'NLO': 'L', 'NLP': 'L', 'NLQ': 'Q',
    'NMC': 'G', 'NMM': 'R', 'NMS': 'T', 'NMT': 'T', 'NNH': 'R', 'NP3': 'N',
    'NPH': 'C', 'NPI': 'A', 'NSK': 'X', 'NTY': 'Y', 'NVA': 'V', 'NYM': 'N',
    'NYS': 'C', 'NZH': 'H', 'O12': 'X', 'O2C': 'N', 'O2G': 'G', 'OAD': 'N',
    'OAS': 'S', 'OBF': 'X', 'OBS': 'X', 'OCS': 'C', 'OCY': 'C', 'ODP': 'N',
    'OHI': 'H', 'OHS': 'D', 'OIC': 'X', 'OIP': 'I', 'OLE': 'X', 'OLT': 'T',
    'OLZ': 'S', 'OMC': 'C', 'OMG': 'G', 'OMT': 'M', 'OMU': 'U', 'ONE': 'U',
    'ONH': 'A', 'ONL': 'X', 'OPR': 'R', 'ORN': 'A', 'ORQ': 'R', 'OSE': 'S',
    'OTB': 'X', 'OTH': 'T', 'OTY': 'Y', 'OXX': 'D', 'P': 'G', 'P1L': 'C',
    'P1P': 'N', 'P2T': 'T', 'P2U': 'U', 'P2Y': 'P', 'P5P': 'A', 'PAQ': 'Y',
    'PAS': 'D', 'PAT': 'W', 'PAU': 'A', 'PBB': 'C', 'PBF': 'F', 'PBT': 'N',
    'PCA': 'E', 'PCC': 'P', 'PCE': 'X', 'PCS': 'F', 'PDL': 'X', 'PDU': 'U',
    'PEC': 'C', 'PF5': 'F', 'PFF': 'F', 'PFX': 'X', 'PG1': 'S', 'PG7': 'G',
    'PG9': 'G', 'PGL': 'X', 'PGN': 'G', 'PGP': 'G', 'PGY': 'G', 'PHA': 'F',
    'PHD': 'D', 'PHE': 'F', 'PHI': 'F', 'PHL': 'F', 'PHM': 'F', 'PIV': 'X',
    'PLE': 'L', 'PM3': 'F', 'PMT': 'C', 'POM': 'P', 'PPN': 'F', 'PPU': 'A',
    'PPW': 'G', 'PQ1': 'N', 'PR3': 'C', 'PR5': 'A', 'PR9': 'P', 'PRN': 'A',
    'PRO': 'P', 'PRS': 'P', 'PSA': 'F', 'PSH': 'H', 'PST': 'T', 'PSU': 'U',
    'PSW': 'C', 'PTA': 'X', 'PTH': 'Y', 'PTM': 'Y', 'PTR': 'Y', 'PU': 'A',
    'PUY': 'N', 'PVH': 'H', 'PVL': 'X', 'PYA': 'A', 'PYO': 'U', 'PYX': 'C',
    'PYY': 'N', 'QMM': 'Q', 'QPA': 'C', 'QPH': 'F', 'QUO': 'G', 'R': 'A',
    'R1A': 'C', 'R4K': 'W', 'RE0': 'W', 'RE3': 'W', 'RIA': 'A', 'RMP': 'A',
    'RON': 'X', 'RT': 'T', 'RTP': 'N', 'S1H': 'S', 'S2C': 'C', 'S2D': 'A',
    'S2M': 'T', 'S2P': 'A', 'S4A': 'A', 'S4C': 'C', 'S4G': 'G', 'S4U': 'U',
    'S6G': 'G', 'SAC': 'S', 'SAH': 'C', 'SAR': 'G', 'SBL': 'S', 'SC': 'C',
    'SCH': 'C', 'SCS': 'C', 'SCY': 'C', 'SD2': 'X', 'SDG': 'G', 'SDP': 'S',
    'SEB': 'S', 'SEC': 'A', 'SEG': 'A', 'SEL': 'S', 'SEM': 'S', 'SEN': 'S',
    'SEP': 'S', 'SER': 'S', 'SET': 'S', 'SGB': 'S', 'SHC': 'C', 'SHP': 'G',
    'SHR': 'K', 'SIB': 'C', 'SLA': 'P', 'SLR': 'P', 'SLZ': 'K', 'SMC': 'C',
    'SME': 'M', 'SMF': 'F', 'SMP': 'A', 'SMT': 'T', 'SNC': 'C', 'SNN': 'N',
    'SOC': 'C', 'SOS': 'N', 'SOY': 'S', 'SPT': 'T', 'SRA': 'A', 'SSU': 'U',
    'STY': 'Y', 'SUB': 'X', 'SUN': 'S', 'SUR': 'U', 'SVA': 'S', 'SVV': 'S',
    'SVW': 'S', 'SVX': 'S', 'SVY': 'S', 'SVZ': 'X', 'SYS': 'C', 'T': 'T',
    'T11': 'F', 'T23': 'T', 'T2S': 'T', 'T2T': 'N', 'T31': 'U', 'T32': 'T',
    'T36': 'T', 'T37': 'T', 'T38': 'T', 'T39': 'T', 'T3P': 'T', 'T41': 'T',
    'T48': 'T', 'T49': 'T', 'T4S': 'T', 'T5O': 'U', 'T5S': 'T', 'T66': 'X',
    'T6A': 'A', 'TA3': 'T', 'TA4': 'X', 'TAF': 'T', 'TAL': 'N', 'TAV': 'D',
    'TBG': 'V', 'TBM': 'T', 'TC1': 'C', 'TCP': 'T', 'TCQ': 'Y', 'TCR': 'W',
    'TCY': 'A', 'TDD': 'L', 'TDY': 'T', 'TFE': 'T', 'TFO': 'A', 'TFQ': 'F',
    'TFT': 'T', 'TGP': 'G', 'TH6': 'T', 'THC': 'T', 'THO': 'X', 'THR': 'T',
    'THX': 'N', 'THZ': 'R', 'TIH': 'A', 'TLB': 'N', 'TLC': 'T', 'TLN': 'U',
    'TMB': 'T', 'TMD': 'T', 'TNB': 'C', 'TNR': 'S', 'TOX': 'W', 'TP1': 'T',
    'TPC': 'C', 'TPG': 'G', 'TPH': 'X', 'TPL': 'W', 'TPO': 'T', 'TPQ': 'Y',
    'TQI': 'W', 'TQQ': 'W', 'TRF': 'W', 'TRG': 'K', 'TRN': 'W', 'TRO': 'W',
    'TRP': 'W', 'TRQ': 'W', 'TRW': 'W', 'TRX': 'W', 'TS': 'N', 'TST': 'X',
    'TT': 'N', 'TTD': 'T', 'TTI': 'U', 'TTM': 'T', 'TTQ': 'W', 'TTS': 'Y',
    'TY1': 'Y', 'TY2': 'Y', 'TY3': 'Y', 'TY5': 'Y', 'TYB': 'Y', 'TYI': 'Y',
    'TYJ': 'Y', 'TYN': 'Y', 'TYO': 'Y', 'TYQ': 'Y', 'TYR': 'Y', 'TYS': 'Y',
    'TYT': 'Y', 'TYU': 'N', 'TYW': 'Y', 'TYX': 'X', 'TYY': 'Y', 'TZB': 'X',
    'TZO': 'X', 'U': 'U', 'U25': 'U', 'U2L': 'U', 'U2N': 'U', 'U2P': 'U',
    'U31': 'U', 'U33': 'U', 'U34': 'U', 'U36': 'U', 'U37': 'U', 'U8U': 'U',
    'UAR': 'U', 'UCL': 'U', 'UD5': 'U', 'UDP': 'N', 'UFP': 'N', 'UFR': 'U',
    'UFT': 'U', 'UMA': 'A', 'UMP': 'U', 'UMS': 'U', 'UN1': 'X', 'UN2': 'X',
    'UNK': 'X', 'UR3': 'U', 'URD': 'U', 'US1': 'U', 'US2': 'U', 'US3': 'T',
    'US5': 'U', 'USM': 'U', 'VAD': 'V', 'VAF': 'V', 'VAL': 'V', 'VB1': 'K',
    'VDL': 'X', 'VLL': 'X', 'VLM': 'X', 'VMS': 'X', 'VOL': 'X', 'X': 'G',
    'X2W': 'E', 'X4A': 'N', 'XAD': 'A', 'XAE': 'N', 'XAL': 'A', 'XAR': 'N',
    'XCL': 'C', 'XCN': 'C', 'XCP': 'X', 'XCR': 'C', 'XCS': 'N', 'XCT': 'C',
    'XCY': 'C', 'XGA': 'N', 'XGL': 'G', 'XGR': 'G', 'XGU': 'G', 'XPR': 'P',
    'XSN': 'N', 'XTH': 'T', 'XTL': 'T', 'XTR': 'T', 'XTS': 'G', 'XTY': 'N',
    'XUA': 'A', 'XUG': 'G', 'XX1': 'K', 'Y': 'A', 'YCM': 'C', 'YG': 'G',
    'YOF': 'Y', 'YRR': 'N', 'YYG': 'G', 'Z': 'C', 'Z01': 'A', 'ZAD': 'A',
    'ZAL': 'A', 'ZBC': 'C', 'ZBU': 'U', 'ZCL': 'F', 'ZCY': 'C', 'ZDU': 'U',
    'ZFB': 'X', 'ZGU': 'G', 'ZHP': 'N', 'ZTH': 'T', 'ZU0': 'T', 'ZZJ': 'A',
}
# common_typos_enable
# pyformat: enable


@functools.lru_cache(maxsize=64)
def letters_three_to_one(restype: str, *, default: str) -> str:
  """Returns single letter name if one exists otherwise returns default."""
  return CCD_NAME_TO_ONE_LETTER.get(restype, default)


ALA = sys.intern('ALA')
ARG = sys.intern('ARG')
ASN = sys.intern('ASN')
ASP = sys.intern('ASP')
CYS = sys.intern('CYS')
GLN = sys.intern('GLN')
GLU = sys.intern('GLU')
GLY = sys.intern('GLY')
HIS = sys.intern('HIS')
ILE = sys.intern('ILE')
LEU = sys.intern('LEU')
LYS = sys.intern('LYS')
MET = sys.intern('MET')
PHE = sys.intern('PHE')
PRO = sys.intern('PRO')
SER = sys.intern('SER')
THR = sys.intern('THR')
TRP = sys.intern('TRP')
TYR = sys.intern('TYR')
VAL = sys.intern('VAL')
UNK = sys.intern('UNK')
GAP = sys.intern('-')

# Unknown ligand.
UNL = sys.intern('UNL')

# Non-standard version of MET (with Se instead of S), but often appears in PDB.
MSE = sys.intern('MSE')

# 20 standard protein amino acids (no unknown).
PROTEIN_TYPES: tuple[str, ...] = (
    ALA, ARG, ASN, ASP, CYS, GLN, GLU, GLY, HIS, ILE, LEU, LYS, MET, PHE, PRO,
    SER, THR, TRP, TYR, VAL,
)  # pyformat: disable

# 20 standard protein amino acids plus the unknown (UNK) amino acid.
PROTEIN_TYPES_WITH_UNKNOWN: tuple[str, ...] = PROTEIN_TYPES + (UNK,)

# This is the standard residue order when coding AA type as a number.
# Reproduce it by taking 3-letter AA codes and sorting them alphabetically.
# For legacy reasons this only refers to protein residues.

PROTEIN_TYPES_ONE_LETTER: tuple[str, ...] = (
    'A', 'R', 'N', 'D', 'C', 'Q', 'E', 'G', 'H', 'I', 'L', 'K', 'M', 'F', 'P',
    'S', 'T', 'W', 'Y', 'V',
)  # pyformat: disable

PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN: tuple[str, ...] = (
    PROTEIN_TYPES_ONE_LETTER + ('X',)
)
PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_AND_GAP: tuple[str, ...] = (
    PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN + (GAP,)
)

PROTEIN_TYPES_ONE_LETTER_TO_INT: Mapping[str, int] = {
    r: i for i, r in enumerate(PROTEIN_TYPES_ONE_LETTER)
}
PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_TO_INT: Mapping[str, int] = {
    r: i for i, r in enumerate(PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN)
}

PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_AND_GAP_TO_INT: Mapping[str, int] = {
    r: i for i, r in enumerate(PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_AND_GAP)
}


PROTEIN_COMMON_ONE_TO_THREE: Mapping[str, str] = {
    'A': ALA,
    'R': ARG,
    'N': ASN,
    'D': ASP,
    'C': CYS,
    'Q': GLN,
    'E': GLU,
    'G': GLY,
    'H': HIS,
    'I': ILE,
    'L': LEU,
    'K': LYS,
    'M': MET,
    'F': PHE,
    'P': PRO,
    'S': SER,
    'T': THR,
    'W': TRP,
    'Y': TYR,
    'V': VAL,
}

PROTEIN_COMMON_THREE_TO_ONE: Mapping[str, str] = {
    v: k for k, v in PROTEIN_COMMON_ONE_TO_THREE.items()
}

A = sys.intern('A')
G = sys.intern('G')
C = sys.intern('C')
U = sys.intern('U')
T = sys.intern('T')

DA = sys.intern('DA')
DG = sys.intern('DG')
DC = sys.intern('DC')
DT = sys.intern('DT')

UNK_NUCLEIC_ONE_LETTER = sys.intern('N')  # Unknown nucleic acid single letter.
UNK_RNA = sys.intern('N')  # Unknown RNA.
UNK_DNA = sys.intern('DN')  # Unknown DNA residue (differs from N).

RNA_TYPES: tuple[str, ...] = (A, G, C, U)
DNA_TYPES: tuple[str, ...] = (DA, DG, DC, DT)

NUCLEIC_TYPES: tuple[str, ...] = RNA_TYPES + DNA_TYPES
# Without UNK DNA.
NUCLEIC_TYPES_WITH_UNKNOWN: tuple[str, ...] = NUCLEIC_TYPES + (
    UNK_NUCLEIC_ONE_LETTER,
)
NUCLEIC_TYPES_WITH_2_UNKS: tuple[str, ...] = NUCLEIC_TYPES + (
    UNK_RNA,
    UNK_DNA,
)

RNA_TYPES_ONE_LETTER_WITH_UNKNOWN: tuple[str, ...] = RNA_TYPES + (UNK_RNA,)
RNA_TYPES_ONE_LETTER_WITH_UNKNOWN_TO_INT: Mapping[str, int] = {
    r: i for i, r in enumerate(RNA_TYPES_ONE_LETTER_WITH_UNKNOWN)
}

DNA_TYPES_WITH_UNKNOWN: tuple[str, ...] = DNA_TYPES + (UNK_DNA,)
DNA_TYPES_ONE_LETTER: tuple[str, ...] = (A, G, C, T)
DNA_TYPES_ONE_LETTER_WITH_UNKNOWN: tuple[str, ...] = DNA_TYPES_ONE_LETTER + (
    UNK_NUCLEIC_ONE_LETTER,
)
DNA_TYPES_ONE_LETTER_WITH_UNKNOWN_TO_INT: Mapping[str, int] = {
    r: i for i, r in enumerate(DNA_TYPES_ONE_LETTER_WITH_UNKNOWN)
}
DNA_COMMON_ONE_TO_TWO: Mapping[str, str] = {
    'A': 'DA',
    'G': 'DG',
    'C': 'DC',
    'T': 'DT',
}

STANDARD_POLYMER_TYPES: tuple[str, ...] = PROTEIN_TYPES + NUCLEIC_TYPES
POLYMER_TYPES: tuple[str, ...] = PROTEIN_TYPES_WITH_UNKNOWN + NUCLEIC_TYPES
POLYMER_TYPES_WITH_UNKNOWN: tuple[str, ...] = (
    PROTEIN_TYPES_WITH_UNKNOWN + NUCLEIC_TYPES_WITH_UNKNOWN
)
POLYMER_TYPES_WITH_GAP: tuple[str, ...] = PROTEIN_TYPES + (GAP,) + NUCLEIC_TYPES
POLYMER_TYPES_WITH_UNKNOWN_AND_GAP: tuple[str, ...] = (
    PROTEIN_TYPES_WITH_UNKNOWN + (GAP,) + NUCLEIC_TYPES_WITH_UNKNOWN
)
POLYMER_TYPES_WITH_ALL_UNKS_AND_GAP: tuple[str, ...] = (
    PROTEIN_TYPES_WITH_UNKNOWN + (GAP,) + NUCLEIC_TYPES_WITH_2_UNKS
)

POLYMER_TYPES_ORDER = {restype: i for i, restype in enumerate(POLYMER_TYPES)}

POLYMER_TYPES_ORDER_WITH_UNKNOWN = {
    restype: i for i, restype in enumerate(POLYMER_TYPES_WITH_UNKNOWN)
}

POLYMER_TYPES_ORDER_WITH_UNKNOWN_AND_GAP = {
    restype: i for i, restype in enumerate(POLYMER_TYPES_WITH_UNKNOWN_AND_GAP)
}

POLYMER_TYPES_ORDER_WITH_ALL_UNKS_AND_GAP = {
    restype: i for i, restype in enumerate(POLYMER_TYPES_WITH_ALL_UNKS_AND_GAP)
}

POLYMER_TYPES_NUM = len(POLYMER_TYPES)  # := 29.
POLYMER_TYPES_NUM_WITH_UNKNOWN = len(POLYMER_TYPES_WITH_UNKNOWN)  # := 30.
POLYMER_TYPES_NUM_WITH_GAP = len(POLYMER_TYPES_WITH_GAP)  # := 29.
POLYMER_TYPES_NUM_WITH_UNKNOWN_AND_GAP = len(
    POLYMER_TYPES_WITH_UNKNOWN_AND_GAP
)  # := 31.
POLYMER_TYPES_NUM_ORDER_WITH_ALL_UNKS_AND_GAP = len(
    POLYMER_TYPES_WITH_ALL_UNKS_AND_GAP
)  # := 32.

WATER_TYPES: tuple[str, ...] = ('HOH', 'DOD')

UNKNOWN_TYPES: tuple[str, ...] = (UNK, UNK_RNA, UNK_DNA, UNL)


================================================
FILE: src/alphafold3/constants/side_chains.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Constants associated with side chains."""

from collections.abc import Mapping, Sequence
import itertools

# Format: The list for each AA type contains chi1, chi2, chi3, chi4 in
# this order (or a relevant subset from chi1 onwards). ALA and GLY don't have
# chi angles so their chi angle lists are empty.
CHI_ANGLES_ATOMS: Mapping[str, Sequence[tuple[str, ...]]] = {
    'ALA': [],
    # Chi5 in arginine is always 0 +- 5 degrees, so ignore it.
    'ARG': [
        ('N', 'CA', 'CB', 'CG'),
        ('CA', 'CB', 'CG', 'CD'),
        ('CB', 'CG', 'CD', 'NE'),
        ('CG', 'CD', 'NE', 'CZ'),
    ],
    'ASN': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'OD1')],
    'ASP': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'OD1')],
    'CYS': [('N', 'CA', 'CB', 'SG')],
    'GLN': [
        ('N', 'CA', 'CB', 'CG'),
        ('CA', 'CB', 'CG', 'CD'),
        ('CB', 'CG', 'CD', 'OE1'),
    ],
    'GLU': [
        ('N', 'CA', 'CB', 'CG'),
        ('CA', 'CB', 'CG', 'CD'),
        ('CB', 'CG', 'CD', 'OE1'),
    ],
    'GLY': [],
    'HIS': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'ND1')],
    'ILE': [('N', 'CA', 'CB', 'CG1'), ('CA', 'CB', 'CG1', 'CD1')],
    'LEU': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'CD1')],
    'LYS': [
        ('N', 'CA', 'CB', 'CG'),
        ('CA', 'CB', 'CG', 'CD'),
        ('CB', 'CG', 'CD', 'CE'),
        ('CG', 'CD', 'CE', 'NZ'),
    ],
    'MET': [
        ('N', 'CA', 'CB', 'CG'),
        ('CA', 'CB', 'CG', 'SD'),
        ('CB', 'CG', 'SD', 'CE'),
    ],
    'PHE': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'CD1')],
    'PRO': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'CD')],
    'SER': [('N', 'CA', 'CB', 'OG')],
    'THR': [('N', 'CA', 'CB', 'OG1')],
    'TRP': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'CD1')],
    'TYR': [('N', 'CA', 'CB', 'CG'), ('CA', 'CB', 'CG', 'CD1')],
    'VAL': [('N', 'CA', 'CB', 'CG1')],
}

CHI_GROUPS_FOR_ATOM = {}
for res_name, chi_angle_atoms_for_res in CHI_ANGLES_ATOMS.items():
  for chi_group_i, chi_group in enumerate(chi_angle_atoms_for_res):
    for atom_i, atom in enumerate(chi_group):
      CHI_GROUPS_FOR_ATOM.setdefault((res_name, atom), []).append(
          (chi_group_i, atom_i)
      )

# Mapping from (residue_name, atom_name) pairs to the atom's chi group index
# and atom index within that group.
CHI_GROUPS_FOR_ATOM: Mapping[tuple[str, str], Sequence[tuple[int, int]]] = (
    CHI_GROUPS_FOR_ATOM
)

MAX_NUM_CHI_ANGLES: int = 4
ATOMS_PER_CHI_ANGLE: int = 4

# A list of atoms for each AA type that are involved in chi angle calculations.
CHI_ATOM_SETS: Mapping[str, set[str]] = {
    residue_name: set(itertools.chain(*atoms))
    for residue_name, atoms in CHI_ANGLES_ATOMS.items()
}

# If chi angles given in fixed-length array, this matrix determines how to mask
# them for each AA type. The order is as per restype_order (see below).
CHI_ANGLES_MASK: Sequence[Sequence[float]] = (
    (0.0, 0.0, 0.0, 0.0),  # ALA
    (1.0, 1.0, 1.0, 1.0),  # ARG
    (1.0, 1.0, 0.0, 0.0),  # ASN
    (1.0, 1.0, 0.0, 0.0),  # ASP
    (1.0, 0.0, 0.0, 0.0),  # CYS
    (1.0, 1.0, 1.0, 0.0),  # GLN
    (1.0, 1.0, 1.0, 0.0),  # GLU
    (0.0, 0.0, 0.0, 0.0),  # GLY
    (1.0, 1.0, 0.0, 0.0),  # HIS
    (1.0, 1.0, 0.0, 0.0),  # ILE
    (1.0, 1.0, 0.0, 0.0),  # LEU
    (1.0, 1.0, 1.0, 1.0),  # LYS
    (1.0, 1.0, 1.0, 0.0),  # MET
    (1.0, 1.0, 0.0, 0.0),  # PHE
    (1.0, 1.0, 0.0, 0.0),  # PRO
    (1.0, 0.0, 0.0, 0.0),  # SER
    (1.0, 0.0, 0.0, 0.0),  # THR
    (1.0, 1.0, 0.0, 0.0),  # TRP
    (1.0, 1.0, 0.0, 0.0),  # TYR
    (1.0, 0.0, 0.0, 0.0),  # VAL
)


================================================
FILE: src/alphafold3/cpp.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include "alphafold3/data/cpp/msa_profile_pybind.h"
#include "alphafold3/model/mkdssp_pybind.h"
#include "alphafold3/parsers/cpp/cif_dict_pybind.h"
#include "alphafold3/parsers/cpp/fasta_iterator_pybind.h"
#include "alphafold3/parsers/cpp/msa_conversion_pybind.h"
#include "alphafold3/structure/cpp/aggregation_pybind.h"
#include "alphafold3/structure/cpp/membership_pybind.h"
#include "alphafold3/structure/cpp/mmcif_atom_site_pybind.h"
#include "alphafold3/structure/cpp/mmcif_layout_pybind.h"
#include "alphafold3/structure/cpp/mmcif_struct_conn_pybind.h"
#include "alphafold3/structure/cpp/mmcif_utils_pybind.h"
#include "alphafold3/structure/cpp/string_array_pybind.h"
#include "pybind11/pybind11.h"

namespace alphafold3 {
namespace {

// Include all modules as submodules to simplify building.
PYBIND11_MODULE(cpp, m) {
  RegisterModuleCifDict(m.def_submodule("cif_dict"));
  RegisterModuleFastaIterator(m.def_submodule("fasta_iterator"));
  RegisterModuleMsaConversion(m.def_submodule("msa_conversion"));
  RegisterModuleMmcifLayout(m.def_submodule("mmcif_layout"));
  RegisterModuleMmcifStructConn(m.def_submodule("mmcif_struct_conn"));
  RegisterModuleMembership(m.def_submodule("membership"));
  RegisterModuleMmcifUtils(m.def_submodule("mmcif_utils"));
  RegisterModuleAggregation(m.def_submodule("aggregation"));
  RegisterModuleStringArray(m.def_submodule("string_array"));
  RegisterModuleMmcifAtomSite(m.def_submodule("mmcif_atom_site"));
  RegisterModuleMkdssp(m.def_submodule("mkdssp"));
  RegisterModuleMsaProfile(m.def_submodule("msa_profile"));
}

}  // namespace
}  // namespace alphafold3


================================================
FILE: src/alphafold3/data/cpp/msa_profile_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <algorithm>

#include "absl/strings/str_cat.h"
#include "pybind11/cast.h"
#include "pybind11/numpy.h"
#include "pybind11/pybind11.h"

namespace {

namespace py = pybind11;

py::array_t<double> ComputeMsaProfile(
    const py::array_t<int, py::array::c_style>& msa, int num_residue_types) {
  if (msa.size() == 0) {
    throw py::value_error("The MSA must be non-empty.");
  }
  if (msa.ndim() != 2) {
    throw py::value_error(absl::StrCat("The MSA must be rectangular, got ",
                                       msa.ndim(), "-dimensional MSA array."));
  }
  const int msa_depth = msa.shape()[0];
  const int sequence_length = msa.shape()[1];

  py::array_t<double> profile({sequence_length, num_residue_types});
  std::fill(profile.mutable_data(), profile.mutable_data() + profile.size(),
            0.0f);
  auto profile_unchecked = profile.mutable_unchecked<2>();

  const double normalized_count = 1.0 / msa_depth;
  const int* msa_it = msa.data();
  for (int row_index = 0; row_index < msa_depth; ++row_index) {
    for (int column_index = 0; column_index < sequence_length; ++column_index) {
      const int residue_code = *(msa_it++);
      if (residue_code < 0 || residue_code >= num_residue_types) {
        throw py::value_error(
            absl::StrCat("All residue codes must be positive and smaller than "
                         "num_residue_types ",
                         num_residue_types, ", got ", residue_code));
      }
      profile_unchecked(column_index, residue_code) += normalized_count;
    }
  }
  return profile;
}

constexpr char kComputeMsaProfileDoc[] = R"(
Computes MSA profile for the given encoded MSA.

Args:
  msa: A Numpy array of shape (num_msa, num_res) with the integer coded MSA.
  num_residue_types: Integer that determines the number of unique residue types.
    This will determine the shape of the output profile.

Returns:
  A float Numpy array of shape (num_res, num_residue_types) with residue
  frequency (residue type count normalized by MSA depth) for every column of the
  MSA.
)";

}  // namespace

namespace alphafold3 {

void RegisterModuleMsaProfile(pybind11::module m) {
  m.def("compute_msa_profile", &ComputeMsaProfile, py::arg("msa"),
        py::arg("num_residue_types"), py::doc(kComputeMsaProfileDoc + 1));
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/data/cpp/msa_profile_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_DATA_PYTHON_MSA_PROFILE_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_DATA_PYTHON_MSA_PROFILE_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMsaProfile(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_DATA_PYTHON_MSA_PROFILE_PYBIND_H_


================================================
FILE: src/alphafold3/data/featurisation.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""AlphaFold 3 featurisation pipeline."""

from collections.abc import Sequence
import datetime
import time

from alphafold3.common import folding_input
from alphafold3.constants import chemical_components
from alphafold3.model import features
from alphafold3.model.pipeline import pipeline
import numpy as np


def validate_fold_input(fold_input: folding_input.Input):
  """Validates the fold input contains MSA and templates for featurisation."""
  for i, chain in enumerate(fold_input.protein_chains):
    if chain.unpaired_msa is None:
      raise ValueError(f'Protein chain {i + 1} is missing unpaired MSA.')
    if chain.paired_msa is None:
      raise ValueError(f'Protein chain {i + 1} is missing paired MSA.')
    if chain.templates is None:
      raise ValueError(f'Protein chain {i + 1} is missing Templates.')
  for i, chain in enumerate(fold_input.rna_chains):
    if chain.unpaired_msa is None:
      raise ValueError(f'RNA chain {i + 1} is missing unpaired MSA.')


def featurise_input(
    fold_input: folding_input.Input,
    ccd: chemical_components.Ccd,
    buckets: Sequence[int] | None,
    ref_max_modified_date: datetime.date | None = None,
    conformer_max_iterations: int | None = None,
    resolve_msa_overlaps: bool = True,
    verbose: bool = False,
) -> Sequence[features.BatchDict]:
  """Featurise the folding input.

  Args:
    fold_input: The input to featurise.
    ccd: The chemical components dictionary.
    buckets: Bucket sizes to pad the data to, to avoid excessive re-compilation
      of the model. If None, calculate the appropriate bucket size from the
      number of tokens. If not None, must be a sequence of at least one integer,
      in strictly increasing order. Will raise an error if the number of tokens
      is more than the largest bucket size.
    ref_max_modified_date: Optional maximum date that controls whether to allow
      use of model coordinates for a chemical component from the CCD if RDKit
      conformer generation fails and the component does not have ideal
      coordinates set. Only for components that have been released before this
      date the model coordinates can be used as a fallback.
    conformer_max_iterations: Optional override for maximum number of iterations
      to run for RDKit conformer search.
    resolve_msa_overlaps: Whether to deduplicate unpaired MSA against paired
      MSA. The default behaviour matches the method described in the AlphaFold 3
      paper. Set this to false if providing custom paired MSA using the unpaired
      MSA field to keep it exactly as is as deduplication against the paired MSA
      could break the manually crafted pairing between MSA sequences.
    verbose: Whether to print progress messages.

  Returns:
    A featurised batch for each rng_seed in the input.
  """
  validate_fold_input(fold_input)

  # Set up data pipeline for single use.
  data_pipeline = pipeline.WholePdbPipeline(
      config=pipeline.WholePdbPipeline.Config(
          buckets=buckets,
          ref_max_modified_date=ref_max_modified_date,
          conformer_max_iterations=conformer_max_iterations,
          resolve_msa_overlaps=resolve_msa_overlaps,
      ),
  )

  batches = []
  for rng_seed in fold_input.rng_seeds:
    featurisation_start_time = time.time()
    if verbose:
      print(f'Featurising data with seed {rng_seed}.')
    batch = data_pipeline.process_item(
        fold_input=fold_input,
        ccd=ccd,
        random_state=np.random.RandomState(rng_seed),
        random_seed=rng_seed,
    )
    if verbose:
      print(
          f'Featurising data with seed {rng_seed} took'
          f' {time.time() - featurisation_start_time:.2f} seconds.'
      )
    batches.append(batch)

  return batches


================================================
FILE: src/alphafold3/data/msa.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions for getting MSA and calculating alignment features."""

from collections.abc import MutableMapping, Sequence
import string
from typing import Self

from absl import logging
from alphafold3.constants import mmcif_names
from alphafold3.data import msa_config
from alphafold3.data import msa_features
from alphafold3.data import parsers
from alphafold3.data.tools import jackhmmer
from alphafold3.data.tools import msa_tool
from alphafold3.data.tools import nhmmer
import numpy as np


class Error(Exception):
  """Error indicatating a problem with MSA Search."""


def _featurize(seq: str, chain_poly_type: str) -> str | list[int]:
  if mmcif_names.is_standard_polymer_type(chain_poly_type):
    featurized_seqs, _ = msa_features.extract_msa_features(
        msa_sequences=[seq], chain_poly_type=chain_poly_type
    )
    return featurized_seqs[0].tolist()
  # For anything else simply require an identical match.
  return seq


def sequences_are_feature_equivalent(
    sequence1: str,
    sequence2: str,
    chain_poly_type: str,
) -> bool:
  feat1 = _featurize(sequence1, chain_poly_type)
  feat2 = _featurize(sequence2, chain_poly_type)
  return feat1 == feat2


class Msa:
  """Multiple Sequence Alignment container with methods for manipulating it."""

  def __init__(
      self,
      query_sequence: str,
      chain_poly_type: str,
      sequences: Sequence[str],
      descriptions: Sequence[str],
      deduplicate: bool = True,
  ):
    """Raw constructor, prefer using the from_{a3m,multiple_msas} class methods.

    The first sequence must be equal (in featurised form) to the query sequence.
    If sequences/descriptions are empty, they will be initialised to the query.

    Args:
      query_sequence: The sequence that was used to search for MSA.
      chain_poly_type: Polymer type of the query sequence, see mmcif_names.
      sequences: The sequences returned by the MSA search tool.
      descriptions: Metadata for the sequences returned by the MSA search tool.
      deduplicate: If True, the MSA sequences will be deduplicated in the input
        order. Lowercase letters (insertions) are ignored when deduplicating.
    """
    if len(sequences) != len(descriptions):
      raise ValueError('The number of sequences and descriptions must match.')

    self.query_sequence = query_sequence
    self.chain_poly_type = chain_poly_type

    if not deduplicate:
      self.sequences = sequences
      self.descriptions = descriptions
    else:
      self.sequences = []
      self.descriptions = []
      # A replacement table that removes all lowercase characters.
      deletion_table = str.maketrans('', '', string.ascii_lowercase)
      unique_sequences = set()
      for seq, desc in zip(sequences, descriptions, strict=True):
        # Using string.translate is faster than re.sub('[a-z]+', '').
        sequence_no_deletions = seq.translate(deletion_table)
        if sequence_no_deletions not in unique_sequences:
          unique_sequences.add(sequence_no_deletions)
          self.sequences.append(seq)
          self.descriptions.append(desc)

    # Make sure the MSA always has at least the query.
    self.sequences = self.sequences or [query_sequence]
    self.descriptions = self.descriptions or ['Original query']

    # Check if the 1st MSA sequence matches the query sequence. Since it may be
    # mutated by the search tool (jackhmmer) check using the featurized version.
    if not sequences_are_feature_equivalent(
        self.sequences[0], query_sequence, chain_poly_type
    ):
      raise ValueError(
          f'First MSA sequence {self.sequences[0]} is not the {query_sequence=}'
      )

  @classmethod
  def from_multiple_msas(
      cls, msas: Sequence[Self], deduplicate: bool = True
  ) -> Self:
    """Initializes the MSA from multiple MSAs.

    Args:
      msas: A sequence of Msa objects representing individual MSAs produced by
        different tools/dbs.
      deduplicate: If True, the MSA sequences will be deduplicated in the input
        order. Lowercase letters (insertions) are ignored when deduplicating.

    Returns:
      An Msa object created by merging multiple MSAs.
    """
    if not msas:
      raise ValueError('At least one MSA must be provided.')

    query_sequence = msas[0].query_sequence
    chain_poly_type = msas[0].chain_poly_type
    sequences = []
    descriptions = []

    for msa in msas:
      if msa.query_sequence != query_sequence:
        raise ValueError(
            f'Query sequences must match: {[m.query_sequence for m in msas]}'
        )
      if msa.chain_poly_type != chain_poly_type:
        raise ValueError(
            f'Chain poly types must match: {[m.chain_poly_type for m in msas]}'
        )
      sequences.extend(msa.sequences)
      descriptions.extend(msa.descriptions)

    return cls(
        query_sequence=query_sequence,
        chain_poly_type=chain_poly_type,
        sequences=sequences,
        descriptions=descriptions,
        deduplicate=deduplicate,
    )

  @classmethod
  def from_multiple_a3ms(
      cls, a3ms: Sequence[str], chain_poly_type: str, deduplicate: bool = True
  ) -> Self:
    """Initializes the MSA from multiple A3M strings.

    Args:
      a3ms: A sequence of A3M strings representing individual MSAs produced by
        different tools/dbs.
      chain_poly_type: Polymer type of the query sequence, see mmcif_names.
      deduplicate: If True, the MSA sequences will be deduplicated in the input
        order. Lowercase letters (insertions) are ignored when deduplicating.

    Returns:
      An Msa object created by merging multiple A3Ms.
    """
    if not a3ms:
      raise ValueError('At least one A3M must be provided.')

    query_sequence = None
    all_sequences = []
    all_descriptions = []

    for a3m in a3ms:
      sequences, descriptions = parsers.parse_fasta(a3m)
      if query_sequence is None:
        query_sequence = sequences[0]

      if sequences[0] != query_sequence:
        raise ValueError(
            f'Query sequences must match: {sequences[0]=} != {query_sequence=}'
        )
      all_sequences.extend(sequences)
      all_descriptions.extend(descriptions)

    return cls(
        query_sequence=query_sequence,
        chain_poly_type=chain_poly_type,
        sequences=all_sequences,
        descriptions=all_descriptions,
        deduplicate=deduplicate,
    )

  @classmethod
  def from_a3m(
      cls,
      query_sequence: str,
      chain_poly_type: str,
      a3m: str,
      max_depth: int | None = None,
      deduplicate: bool = True,
  ) -> Self:
    """Parses the single A3M and builds the Msa object."""
    sequences, descriptions = parsers.parse_fasta(a3m)

    if max_depth is not None and 0 < max_depth < len(sequences):
      logging.info(
          'MSA cropped from depth of %d to %d for %s.',
          len(sequences),
          max_depth,
          query_sequence,
      )
      sequences = sequences[:max_depth]
      descriptions = descriptions[:max_depth]

    return cls(
        query_sequence=query_sequence,
        chain_poly_type=chain_poly_type,
        sequences=sequences,
        descriptions=descriptions,
        deduplicate=deduplicate,
    )

  @classmethod
  def from_empty(cls, query_sequence: str, chain_poly_type: str) -> Self:
    """Creates an empty Msa containing just the query sequence."""
    return cls(
        query_sequence=query_sequence,
        chain_poly_type=chain_poly_type,
        sequences=[],
        descriptions=[],
        deduplicate=False,
    )

  @property
  def depth(self) -> int:
    return len(self.sequences)

  def __repr__(self) -> str:
    return f'Msa({self.depth} sequences, {self.chain_poly_type})'

  def to_a3m(self) -> str:
    """Returns the MSA in the A3M format."""
    a3m_lines = []
    for desc, seq in zip(self.descriptions, self.sequences, strict=True):
      a3m_lines.append(f'>{desc}')
      a3m_lines.append(seq)
    return '\n'.join(a3m_lines) + '\n'

  def featurize(self) -> MutableMapping[str, np.ndarray]:
    """Featurises the MSA and returns a map of feature names to features.

    Returns:
      A dictionary mapping feature names to values.

    Raises:
      msa.Error:
        * If the sequences in the MSA don't have the same length after deletions
          (lower case letters) are removed.
        * If the MSA contains an unknown amino acid code.
        * If there are no sequences after aligning.
    """
    try:
      msa, deletion_matrix = msa_features.extract_msa_features(
          msa_sequences=self.sequences, chain_poly_type=self.chain_poly_type
      )
    except ValueError as e:
      raise Error(f'Error extracting MSA or deletion features: {e}') from e

    if msa.shape == (0, 0):
      raise Error(f'Empty MSA feature for {self}')

    species_ids = msa_features.extract_species_ids(self.descriptions)

    return {
        'msa_species_identifiers': np.array(species_ids, dtype=object),
        'num_alignments': np.array(self.depth, dtype=np.int32),
        'msa': msa,
        'deletion_matrix': deletion_matrix,
    }


def get_msa_tool(
    msa_tool_config: msa_config.JackhmmerConfig | msa_config.NhmmerConfig,
) -> msa_tool.MsaTool:
  """Returns the requested MSA tool."""

  match msa_tool_config:
    case msa_config.JackhmmerConfig():
      return jackhmmer.Jackhmmer(
          binary_path=msa_tool_config.binary_path,
          database_path=msa_tool_config.database_config.path,
          n_cpu=msa_tool_config.n_cpu,
          n_iter=msa_tool_config.n_iter,
          e_value=msa_tool_config.e_value,
          z_value=msa_tool_config.z_value,
          max_sequences=msa_tool_config.max_sequences,
      )
    case msa_config.NhmmerConfig():
      return nhmmer.Nhmmer(
          binary_path=msa_tool_config.binary_path,
          hmmalign_binary_path=msa_tool_config.hmmalign_binary_path,
          hmmbuild_binary_path=msa_tool_config.hmmbuild_binary_path,
          database_path=msa_tool_config.database_config.path,
          n_cpu=msa_tool_config.n_cpu,
          e_value=msa_tool_config.e_value,
          max_sequences=msa_tool_config.max_sequences,
          alphabet=msa_tool_config.alphabet,
      )
    case _:
      raise ValueError(f'Unknown MSA tool: {msa_tool_config}.')


def get_msa(
    target_sequence: str,
    run_config: msa_config.RunConfig,
    chain_poly_type: str,
    deduplicate: bool = False,
) -> Msa:
  """Computes the MSA for a given query sequence.

  Args:
    target_sequence: The target amino-acid sequence.
    run_config: MSA run configuration.
    chain_poly_type: The type of chain for which to get an MSA.
    deduplicate: If True, the MSA sequences will be deduplicated in the input
      order. Lowercase letters (insertions) are ignored when deduplicating.

  Returns:
    Aligned MSA sequences.
  """

  return Msa.from_a3m(
      query_sequence=target_sequence,
      chain_poly_type=chain_poly_type,
      a3m=get_msa_tool(run_config.config).query(target_sequence).a3m,
      max_depth=run_config.crop_size,
      deduplicate=deduplicate,
  )


================================================
FILE: src/alphafold3/data/msa_config.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Genetic search config settings for data pipelines."""

import dataclasses
import datetime
from typing import Self
from alphafold3.constants import mmcif_names


def _validate_chain_poly_type(chain_poly_type: str) -> None:
  if chain_poly_type not in mmcif_names.STANDARD_POLYMER_CHAIN_TYPES:
    raise ValueError(
        'chain_poly_type must be one of'
        f' {mmcif_names.STANDARD_POLYMER_CHAIN_TYPES}: {chain_poly_type}'
    )


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class DatabaseConfig:
  """Configuration for a database."""

  name: str
  path: str


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class JackhmmerConfig:
  """Configuration for a jackhmmer run.

  Attributes:
      binary_path: Path to the binary of the msa tool.
      database_config: Database configuration.
      n_cpu: An integer with the number of CPUs to use.
      n_iter: An integer with the number of database search iterations.
      e_value: e-value for the database lookup.
      z_value: The Z-value representing the database size in number of sequences
        for E-value and domain E-value calculation. Must be set for sharded
        databases.
      dom_z_value: The Z-value representing the database size in number of
        sequences for domain E-value calculation. Must be set for sharded
        databases.
      max_sequences: Max sequences to return in MSA.
      max_parallel_shards: If given, the maximum number of shards to search
        against in parallel. If None, one Jackhmmer instance will be run per
        shard. Only applicable if the database is sharded.
  """

  binary_path: str
  database_config: DatabaseConfig
  n_cpu: int
  n_iter: int
  e_value: float
  z_value: int | None
  dom_z_value: int | None
  max_sequences: int
  max_parallel_shards: int | None = None


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class NhmmerConfig:
  """Configuration for a nhmmer run.

  Attributes:
      binary_path: Path to the binary of the msa tool.
      hmmalign_binary_path: Path to the hmmalign binary.
      hmmbuild_binary_path: Path to the hmmbuild binary.
      database_config: Database configuration.
      n_cpu: An integer with the number of CPUs to use.
      e_value: e-value for the database lookup.
      z_value: The Z-value representing the database size in megabases for
        E-value calculation. Allows fractional values. Must be set for sharded
        databases.
      max_sequences: Max sequences to return in MSA.
      alphabet: The alphabet when building a profile with hmmbuild.
      max_parallel_shards: If given, the maximum number of shards to search
        against in parallel. If None, one Nhmmer instance will be run per shard.
        Only applicable if the database is sharded.
  """

  binary_path: str
  hmmalign_binary_path: str
  hmmbuild_binary_path: str
  database_config: DatabaseConfig
  n_cpu: int
  e_value: float
  z_value: float | None
  max_sequences: int
  alphabet: str | None
  max_parallel_shards: int | None = None


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class RunConfig:
  """Configuration for an MSA run.

  Attributes:
    config: MSA tool config.
    chain_poly_type: The chain type for which the tools will be run.
    crop_size: The maximum number of sequences to keep in the MSA. If None, all
      sequences are kept. Note that the query is included in the MSA, so it
      doesn't make sense to set this to less than 2.
  """

  config: JackhmmerConfig | NhmmerConfig
  chain_poly_type: str
  crop_size: int | None

  def __post_init__(self):
    if self.crop_size is not None and self.crop_size < 2:
      raise ValueError(f'crop_size must be None or >= 2: {self.crop_size}')

    _validate_chain_poly_type(self.chain_poly_type)


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class HmmsearchConfig:
  """Configuration for a hmmsearch."""

  hmmsearch_binary_path: str
  hmmbuild_binary_path: str

  e_value: float
  inc_e: float
  dom_e: float
  incdom_e: float
  alphabet: str = 'amino'
  filter_f1: float | None = None
  filter_f2: float | None = None
  filter_f3: float | None = None
  filter_max: bool = False


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class TemplateToolConfig:
  """Configuration for a template tool."""

  database_path: str
  chain_poly_type: str
  hmmsearch_config: HmmsearchConfig
  max_a3m_query_sequences: int | None = 300

  def __post_init__(self):
    _validate_chain_poly_type(self.chain_poly_type)


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class TemplateFilterConfig:
  """Configuration for a template filter."""

  max_subsequence_ratio: float | None
  min_align_ratio: float | None
  min_hit_length: int | None
  deduplicate_sequences: bool
  max_hits: int | None
  max_template_date: datetime.date

  @classmethod
  def no_op_filter(cls) -> Self:
    """Returns a config for filter that keeps everything."""
    return cls(
        max_subsequence_ratio=None,
        min_align_ratio=None,
        min_hit_length=None,
        deduplicate_sequences=False,
        max_hits=None,
        max_template_date=datetime.date(3000, 1, 1),  # Very far in the future.
    )


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class TemplatesConfig:
  """Configuration for the template search pipeline."""

  template_tool_config: TemplateToolConfig
  filter_config: TemplateFilterConfig


================================================
FILE: src/alphafold3/data/msa_features.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utilities for computing MSA features."""

from collections.abc import Sequence
import re
from alphafold3.constants import mmcif_names
import numpy as np

_PROTEIN_TO_ID = {
    'A': 0,
    'B': 3,  # Same as D.
    'C': 4,
    'D': 3,
    'E': 6,
    'F': 13,
    'G': 7,
    'H': 8,
    'I': 9,
    'J': 20,  # Same as unknown (X).
    'K': 11,
    'L': 10,
    'M': 12,
    'N': 2,
    'O': 20,  # Same as unknown (X).
    'P': 14,
    'Q': 5,
    'R': 1,
    'S': 15,
    'T': 16,
    'U': 4,  # Same as C.
    'V': 19,
    'W': 17,
    'X': 20,
    'Y': 18,
    'Z': 6,  # Same as E.
    '-': 21,
}

_RNA_TO_ID = {
    # Map non-standard residues to UNK_NUCLEIC (N) -> 30
    **{chr(i): 30 for i in range(ord('A'), ord('Z') + 1)},
    # Continue the RNA indices from where Protein indices left off.
    '-': 21,
    'A': 22,
    'G': 23,
    'C': 24,
    'U': 25,
}

_DNA_TO_ID = {
    # Map non-standard residues to UNK_NUCLEIC (N) -> 30
    **{chr(i): 30 for i in range(ord('A'), ord('Z') + 1)},
    # Continue the DNA indices from where DNA indices left off.
    '-': 21,
    'A': 26,
    'G': 27,
    'C': 28,
    'T': 29,
}


def extract_msa_features(
    msa_sequences: Sequence[str], chain_poly_type: str
) -> tuple[np.ndarray, np.ndarray]:
  """Extracts MSA features.

  Example:
  The input raw MSA is: `[["AAAAAA"], ["Ai-CiDiiiEFa"]]`
  The output MSA will be: `[["AAAAAA"], ["A-CDEF"]]`
  The deletions will be: `[[0, 0, 0, 0, 0, 0], [0, 1, 0, 1, 3, 0]]`

  Args:
    msa_sequences: A list of strings, each string with one MSA sequence. Each
      string must have the same, constant number of non-lowercase (matching)
      residues.
    chain_poly_type: Either 'polypeptide(L)' (protein), 'polyribonucleotide'
      (RNA), or 'polydeoxyribonucleotide' (DNA). Use the appropriate string
      constant from mmcif_names.py.

  Returns:
    A tuple with:
    * MSA array of shape (num_seq, num_res) that contains only the uppercase
      characters or gaps (-) from the original MSA.
    * Deletions array of shape (num_seq, num_res) that contains the number
      of deletions (lowercase letters in the MSA) to the left from each
      non-deleted residue (uppercase letters in the MSA).

  Raises:
    ValueError if any of the preconditions are not met.
  """

  # Select the appropriate character map based on the chain type.
  if chain_poly_type == mmcif_names.RNA_CHAIN:
    char_map = _RNA_TO_ID
  elif chain_poly_type == mmcif_names.DNA_CHAIN:
    char_map = _DNA_TO_ID
  elif chain_poly_type == mmcif_names.PROTEIN_CHAIN:
    char_map = _PROTEIN_TO_ID
  else:
    raise ValueError(f'{chain_poly_type=} invalid.')

  # Handle empty MSA.
  if not msa_sequences:
    empty_msa = np.array([], dtype=np.int32).reshape((0, 0))
    empty_deletions = np.array([], dtype=np.int32).reshape((0, 0))
    return empty_msa, empty_deletions

  # Get the number of rows and columns in the MSA.
  num_rows = len(msa_sequences)
  num_cols = sum(1 for c in msa_sequences[0] if c in char_map)

  # Initialize the output arrays.
  msa_arr = np.zeros((num_rows, num_cols), dtype=np.int32)
  deletions_arr = np.zeros((num_rows, num_cols), dtype=np.int32)

  # Populate the output arrays.
  for problem_row, msa_sequence in enumerate(msa_sequences):
    deletion_count = 0
    upper_count = 0
    problem_col = 0
    problems = []
    for current in msa_sequence:
      msa_id = char_map.get(current, -1)
      if msa_id == -1:
        if not current.islower():
          problems.append(f'({problem_row}, {problem_col}):{current}')
        deletion_count += 1
      else:
        # Check the access is safe before writing to the array.
        # We don't need to check problem_row since it's guaranteed to be within
        # the array bounds, while upper_count is incremented in the loop.
        if upper_count < deletions_arr.shape[1]:
          deletions_arr[problem_row, upper_count] = deletion_count
          msa_arr[problem_row, upper_count] = msa_id
        deletion_count = 0
        upper_count += 1
      problem_col += 1
    if problems:
      raise ValueError(
          f"Unknown residues in MSA: {', '.join(problems)}. "
          f'target_sequence: {msa_sequences[0]}'
      )
    if upper_count != num_cols:
      raise ValueError(
          'Invalid shape all strings must have the same number '
          'of non-lowercase characters; First string has '
          f"{num_cols} non-lowercase characters but '{msa_sequence}' has "
          f'{upper_count}. target_sequence: {msa_sequences[0]}'
      )

  return msa_arr, deletions_arr


# UniProtKB SwissProt/TrEMBL dbs have the following description format:
# `db|UniqueIdentifier|EntryName`, e.g. `sp|P0C2L1|A3X1_LOXLA` or
# `tr|A0A146SKV9|A0A146SKV9_FUNHE`.
_UNIPROT_ENTRY_NAME_REGEX = re.compile(
    # UniProtKB TrEMBL or SwissProt database.
    r'(?:tr|sp)\|'
    # A primary accession number of the UniProtKB entry.
    r'(?:[A-Z0-9]{6,10})'
    # Occasionally there is an isoform suffix (e.g. _1 or _10) which we ignore.
    r'(?:_\d+)?\|'
    # TrEMBL: Same as AccessionId (6-10 characters).
    # SwissProt: A mnemonic protein identification code (1-5 characters).
    r'(?:[A-Z0-9]{1,10}_)'
    # A mnemonic species identification code.
    r'(?P<SpeciesId>[A-Z0-9]{1,5})'
)


def extract_species_ids(msa_descriptions: Sequence[str]) -> Sequence[str]:
  """Extracts species ID from MSA UniProtKB sequence identifiers.

  Args:
    msa_descriptions: The descriptions (the FASTA/A3M comment line) for each of
      the sequences.

  Returns:
    Extracted UniProtKB species IDs if there is a regex match for each
    description line, blank if the regex doesn't match.
  """
  species_ids = []
  for msa_description in msa_descriptions:
    msa_description = msa_description.strip()
    match = _UNIPROT_ENTRY_NAME_REGEX.match(msa_description)
    if match:
      species_ids.append(match.group('SpeciesId'))
    else:
      # Handle cases where the regex doesn't match
      # (e.g., append None or raise an error depending on your needs)
      species_ids.append('')
  return species_ids


================================================
FILE: src/alphafold3/data/msa_identifiers.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utilities for extracting identifiers from MSA sequence descriptions."""

import dataclasses
import re


# Sequences coming from UniProtKB database come in the
# `db|UniqueIdentifier|EntryName` format, e.g. `tr|A0A146SKV9|A0A146SKV9_FUNHE`
# or `sp|P0C2L1|A3X1_LOXLA` (for TREMBL/Swiss-Prot respectively).
_UNIPROT_PATTERN = re.compile(
    r"""
    ^
    # UniProtKB/TrEMBL or UniProtKB/Swiss-Prot
    (?:tr|sp)
    \|
    # A primary accession number of the UniProtKB entry.
    (?P<AccessionIdentifier>[A-Za-z0-9]{6,10})
    # Occasionally there is a _0 or _1 isoform suffix, which we ignore.
    (?:_\d)?
    \|
    # TREMBL repeats the accession ID here. Swiss-Prot has a mnemonic
    # protein ID code.
    (?:[A-Za-z0-9]+)
    _
    # A mnemonic species identification code.
    (?P<SpeciesIdentifier>([A-Za-z0-9]){1,5})
    # Small BFD uses a final value after an underscore, which we ignore.
    (?:_\d+)?
    $
    """,
    re.VERBOSE,
)


@dataclasses.dataclass(frozen=True)
class Identifiers:
  species_id: str = ''


def _parse_sequence_identifier(msa_sequence_identifier: str) -> Identifiers:
  """Gets species from an msa sequence identifier.

  The sequence identifier has the format specified by
  _UNIPROT_TREMBL_ENTRY_NAME_PATTERN or _UNIPROT_SWISSPROT_ENTRY_NAME_PATTERN.
  An example of a sequence identifier: `tr|A0A146SKV9|A0A146SKV9_FUNHE`

  Args:
    msa_sequence_identifier: a sequence identifier.

  Returns:
    An `Identifiers` instance with species_id. These
    can be empty in the case where no identifier was found.
  """
  matches = re.search(_UNIPROT_PATTERN, msa_sequence_identifier.strip())
  if matches:
    return Identifiers(species_id=matches.group('SpeciesIdentifier'))
  return Identifiers()


def _extract_sequence_identifier(description: str) -> str | None:
  """Extracts sequence identifier from description. Returns None if no match."""
  split_description = description.split()
  if split_description:
    return split_description[0].partition('/')[0]
  else:
    return None


def get_identifiers(description: str) -> Identifiers:
  """Computes extra MSA features from the description."""
  sequence_identifier = _extract_sequence_identifier(description)
  if sequence_identifier is None:
    return Identifiers()
  else:
    return _parse_sequence_identifier(sequence_identifier)


================================================
FILE: src/alphafold3/data/parsers.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions for parsing various file formats."""

from collections.abc import Iterable, Sequence
from typing import IO, TypeAlias

from alphafold3.cpp import fasta_iterator
from alphafold3.cpp import msa_conversion


DeletionMatrix: TypeAlias = Sequence[Sequence[int]]


def lazy_parse_fasta_string(fasta_string: str) -> Iterable[tuple[str, str]]:
  """Lazily parses a FASTA/A3M string and yields (sequence, description) tuples.

  This implementation is more memory friendly than `fasta_sequence` while
  offering comparable performance. The underlying implementation is in C++ and
  is therefore faster than a pure Python implementation.

  Use this method when parsing FASTA files where you already have the FASTA
  string, but need to control how far you iterate through its sequences.

  Arguments:
    fasta_string: A string with the contents of FASTA/A3M file.

  Returns:
    Iterator of (sequence, description). In the description, the leading ">" is
    stripped.

  Raises:
    ValueError if the FASTA/A3M file is invalid, e.g. empty.
  """

  # The lifetime of the FastaStringIterator is tied to the lifetime of
  # fasta_string - fasta_string must be kept while the iterator is in use.
  return fasta_iterator.FastaStringIterator(fasta_string)


def parse_fasta(fasta_string: str) -> tuple[Sequence[str], Sequence[str]]:
  """Parses FASTA string and returns list of strings with amino-acid sequences.

  Arguments:
    fasta_string: The string contents of a FASTA file.

  Returns:
    A tuple of two lists:
    * A list of sequences.
    * A list of sequence descriptions taken from the comment lines. In the
      same order as the sequences.
  """
  return fasta_iterator.parse_fasta_include_descriptions(fasta_string)


def convert_a3m_to_stockholm(a3m: str, max_seqs: int | None = None) -> str:
  """Converts MSA in the A3M format to the Stockholm format."""
  sequences, descriptions = parse_fasta(a3m)
  if max_seqs is not None:
    sequences = sequences[:max_seqs]
    descriptions = descriptions[:max_seqs]

  stockholm = ['# STOCKHOLM 1.0', '']

  # Add the Stockholm header with the sequence metadata.
  names = []
  for i, description in enumerate(descriptions):
    name, _, rest = description.replace('\t', ' ').partition(' ')
    # Ensure that the names are unique - stockholm format requires that
    # the sequence names are unique.
    name = f'{name}_{i}'
    names.append(name)
    # Avoid zero-length description due to historic hmmbuild parsing bug.
    desc = rest.strip() or '<EMPTY>'
    stockholm.append(f'#=GS {name.strip()} DE {desc}')
  stockholm.append('')

  # Convert insertions in a sequence into gaps in all other sequences that don't
  # have an insertion in that column as well.
  sequences = msa_conversion.convert_a3m_to_stockholm(sequences)

  # Add the MSA data.
  max_name_width = max(len(name) for name in names)
  for name, sequence in zip(names, sequences, strict=True):
    # Align the names to the left and pad with spaces to the maximum length.
    stockholm.append(f'{name:<{max_name_width}s} {sequence}')

  # Add the reference annotation for the query (the first sequence).
  ref_annotation = ''.join('.' if c == '-' else 'x' for c in sequences[0])
  stockholm.append(f'{"#=GC RF":<{max_name_width}s} {ref_annotation}')
  stockholm.append('//')

  return '\n'.join(stockholm)


def convert_stockholm_to_a3m(
    stockholm: IO[str],
    max_sequences: int | None = None,
    remove_first_row_gaps: bool = True,
    linewidth: int | None = None,
) -> str:
  """Converts MSA in Stockholm format to the A3M format."""
  descriptions = {}
  sequences = {}
  reached_max_sequences = False

  if linewidth is not None and linewidth <= 0:
    raise ValueError('linewidth must be > 0 or None')

  for line in stockholm:
    reached_max_sequences = max_sequences and len(sequences) >= max_sequences
    line = line.strip()
    # Ignore blank lines, markup and end symbols - remainder are alignment
    # sequence parts.
    if not line or line.startswith(('#', '//')):
      continue
    seqname, aligned_seq = line.split(maxsplit=1)
    if seqname not in sequences:
      if reached_max_sequences:
        continue
      sequences[seqname] = ''
    sequences[seqname] += aligned_seq

  if not sequences:
    return ''

  stockholm.seek(0)
  for line in stockholm:
    line = line.strip()
    if line[:4] == '#=GS':
      # Description row - example format is:
      # #=GS UniRef90_Q9H5Z4/4-78            DE [subseq from] cDNA: FLJ22755 ...
      columns = line.split(maxsplit=3)
      seqname, feature = columns[1:3]
      value = columns[3] if len(columns) == 4 else ''
      if feature != 'DE':
        continue
      if reached_max_sequences and seqname not in sequences:
        continue
      descriptions[seqname] = value
      if len(descriptions) == len(sequences):
        break

  assert len(descriptions) <= len(sequences)

  # Convert sto format to a3m line by line
  a3m_sequences = {}
  # query_sequence is assumed to be the first sequence
  query_sequence = next(iter(sequences.values()))
  for seqname, sto_sequence in sequences.items():
    if remove_first_row_gaps:
      a3m_sequences[seqname] = msa_conversion.align_sequence_to_gapless_query(
          sequence=sto_sequence, query_sequence=query_sequence
      ).replace('.', '')
    else:
      a3m_sequences[seqname] = sto_sequence.replace('.', '')

  fasta_chunks = []

  for seqname, seq in a3m_sequences.items():
    fasta_chunks.append(f'>{seqname} {descriptions.get(seqname, "")}')

    if linewidth:
      fasta_chunks.extend(
          seq[i : linewidth + i] for i in range(0, len(seq), linewidth)
      )
    else:
      fasta_chunks.append(seq)

  return '\n'.join(fasta_chunks) + '\n'  # Include terminating newline.


================================================
FILE: src/alphafold3/data/pipeline.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions for running the MSA and template tools for the AlphaFold model."""

from concurrent import futures
import dataclasses
import datetime
import functools
import logging
import time

from alphafold3.common import folding_input
from alphafold3.constants import mmcif_names
from alphafold3.data import msa
from alphafold3.data import msa_config
from alphafold3.data import structure_stores
from alphafold3.data import templates as templates_lib


# Cache to avoid re-running template search for the same sequence in homomers.
@functools.cache
def _get_protein_templates(
    sequence: str,
    input_msa_a3m: str,
    run_template_search: bool,
    templates_config: msa_config.TemplatesConfig,
    pdb_database_path: str,
) -> templates_lib.Templates:
  """Searches for templates for a single protein chain."""
  if run_template_search:
    templates_start_time = time.time()
    logging.info('Getting protein templates for sequence %s', sequence)
    protein_templates = templates_lib.Templates.from_seq_and_a3m(
        query_sequence=sequence,
        msa_a3m=input_msa_a3m,
        max_template_date=templates_config.filter_config.max_template_date,
        database_path=templates_config.template_tool_config.database_path,
        hmmsearch_config=templates_config.template_tool_config.hmmsearch_config,
        max_a3m_query_sequences=None,
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        structure_store=structure_stores.StructureStore(pdb_database_path),
        filter_config=templates_config.filter_config,
    )
    logging.info(
        'Getting %d protein templates took %.2f seconds for sequence %s',
        protein_templates.num_hits,
        time.time() - templates_start_time,
        sequence,
    )
  else:
    logging.info('Skipping template search for sequence %s', sequence)
    protein_templates = templates_lib.Templates(
        query_sequence=sequence,
        hits=[],
        max_template_date=templates_config.filter_config.max_template_date,
        structure_store=structure_stores.StructureStore(pdb_database_path),
    )
  return protein_templates


# Cache to avoid re-running the MSA tools for the same sequence in homomers.
@functools.cache
def _get_protein_msa_and_templates(
    sequence: str,
    run_template_search: bool,
    uniref90_msa_config: msa_config.RunConfig,
    mgnify_msa_config: msa_config.RunConfig,
    small_bfd_msa_config: msa_config.RunConfig,
    uniprot_msa_config: msa_config.RunConfig,
    templates_config: msa_config.TemplatesConfig,
    pdb_database_path: str,
) -> tuple[msa.Msa, msa.Msa, templates_lib.Templates]:
  """Processes a single protein chain."""
  logging.info('Getting protein MSAs for sequence %s', sequence)
  msa_start_time = time.time()
  # Run various MSA tools in parallel. Use a ThreadPoolExecutor because
  # they're not blocked by the GIL, as they're sub-shelled out.
  with futures.ThreadPoolExecutor(max_workers=4) as executor:
    uniref90_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=uniref90_msa_config,
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
    )
    mgnify_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=mgnify_msa_config,
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
    )
    small_bfd_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=small_bfd_msa_config,
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
    )
    uniprot_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=uniprot_msa_config,
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
    )
  uniref90_msa = uniref90_msa_future.result()
  mgnify_msa = mgnify_msa_future.result()
  small_bfd_msa = small_bfd_msa_future.result()
  uniprot_msa = uniprot_msa_future.result()
  logging.info(
      'Getting protein MSAs took %.2f seconds for sequence %s',
      time.time() - msa_start_time,
      sequence,
  )

  logging.info('Deduplicating MSAs for sequence %s', sequence)
  msa_dedupe_start_time = time.time()
  with futures.ThreadPoolExecutor() as executor:
    unpaired_protein_msa_future = executor.submit(
        msa.Msa.from_multiple_msas,
        msas=[uniref90_msa, small_bfd_msa, mgnify_msa],
        deduplicate=True,
    )
    paired_protein_msa_future = executor.submit(
        msa.Msa.from_multiple_msas, msas=[uniprot_msa], deduplicate=False
    )
  unpaired_protein_msa = unpaired_protein_msa_future.result()
  paired_protein_msa = paired_protein_msa_future.result()
  logging.info(
      'Deduplicating MSAs took %.2f seconds for sequence %s, found %d unpaired'
      ' sequences, %d paired sequences',
      time.time() - msa_dedupe_start_time,
      sequence,
      unpaired_protein_msa.depth,
      paired_protein_msa.depth,
  )

  protein_templates = _get_protein_templates(
      sequence=sequence,
      input_msa_a3m=unpaired_protein_msa.to_a3m(),
      run_template_search=run_template_search,
      templates_config=templates_config,
      pdb_database_path=pdb_database_path,
  )

  return unpaired_protein_msa, paired_protein_msa, protein_templates


# Cache to avoid re-running the Nhmmer for the same sequence in homomers.
@functools.cache
def _get_rna_msa(
    sequence: str,
    nt_rna_msa_config: msa_config.NhmmerConfig,
    rfam_msa_config: msa_config.NhmmerConfig,
    rnacentral_msa_config: msa_config.NhmmerConfig,
) -> msa.Msa:
  """Processes a single RNA chain."""
  logging.info('Getting RNA MSAs for sequence %s', sequence)
  rna_msa_start_time = time.time()
  # Run various MSA tools in parallel. Use a ThreadPoolExecutor because
  # they're not blocked by the GIL, as they're sub-shelled out.
  with futures.ThreadPoolExecutor() as executor:
    nt_rna_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=nt_rna_msa_config,
        chain_poly_type=mmcif_names.RNA_CHAIN,
    )
    rfam_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=rfam_msa_config,
        chain_poly_type=mmcif_names.RNA_CHAIN,
    )
    rnacentral_msa_future = executor.submit(
        msa.get_msa,
        target_sequence=sequence,
        run_config=rnacentral_msa_config,
        chain_poly_type=mmcif_names.RNA_CHAIN,
    )
  nt_rna_msa = nt_rna_msa_future.result()
  rfam_msa = rfam_msa_future.result()
  rnacentral_msa = rnacentral_msa_future.result()
  rna_msa = msa.Msa.from_multiple_msas(
      msas=[rfam_msa, rnacentral_msa, nt_rna_msa],
      deduplicate=True,
  )
  logging.info(
      'Getting RNA MSAs took %.2f seconds for sequence %s, found %d unpaired'
      ' sequences',
      time.time() - rna_msa_start_time,
      sequence,
      rna_msa.depth,
  )
  return rna_msa


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class DataPipelineConfig:
  """The configuration for the data pipeline.

  Attributes:
    jackhmmer_binary_path: Jackhmmer binary path, used for protein MSA search.
    nhmmer_binary_path: Nhmmer binary path, used for RNA MSA search.
    hmmalign_binary_path: Hmmalign binary path, used to align hits to the query
      profile.
    hmmsearch_binary_path: Hmmsearch binary path, used for template search.
    hmmbuild_binary_path: Hmmbuild binary path, used to build HMM profile from
      raw MSA in template search.
    small_bfd_database_path: Small BFD database path, used for protein MSA
      search.
    small_bfd_z_value: The Z-value representing the database size in number of
      sequences for E-value calculation. Must be set for sharded databases.
    mgnify_database_path: Mgnify database path, used for protein MSA search.
    mgnify_z_value: The Z-value representing the database size in number of
      sequences for E-value calculation. Must be set for sharded databases.
    uniprot_cluster_annot_database_path: Uniprot database path, used for protein
      paired MSA search.
    uniprot_cluster_annot_z_value: The Z-value representing the database size in
      number of sequences for E-value calculation. Must be set for sharded
      databases.
    uniref90_database_path: UniRef90 database path, used for MSA search, and the
      MSA obtained by searching it is used to construct the profile for template
      search.
    uniref90_z_value: The Z-value representing the database size in number of
      sequences for E-value calculation. Must be set for sharded databases.
    ntrna_database_path: NT-RNA database path, used for RNA MSA search.
    ntrna_z_value: The Z-value representing the database size in megabases for
      E-value calculation. Must be set for sharded databases.
    rfam_database_path: Rfam database path, used for RNA MSA search.
    rfam_z_value: The Z-value representing the database size in megabases for
      E-value calculation. Must be set for sharded databases.
    rna_central_database_path: RNAcentral database path, used for RNA MSA
      search.
    rna_central_z_value: The Z-value representing the database size in megabases
      for E-value calculation. Must be set for sharded databases.
    seqres_database_path: PDB sequence database path, used for template search.
    pdb_database_path: PDB database directory with mmCIF files path, used for
      template search.
    jackhmmer_n_cpu: Number of CPUs to use for Jackhmmer.
    jackhmmer_max_parallel_shards: Maximum number of shards to search against in
      parallel. If None, one Jackhmmer instance will be run per shard. Only
      applicable if the database is sharded.
    nhmmer_n_cpu: Number of CPUs to use for Nhmmer.
    nhmmer_max_parallel_shards: Maximum number of shards to search against in
      parallel. If None, one Nhmmer instance will be run per shard. Only
      applicable if the database is sharded.
    max_template_date: The latest date of templates to use.
  """

  # Binary paths.
  jackhmmer_binary_path: str
  nhmmer_binary_path: str
  hmmalign_binary_path: str
  hmmsearch_binary_path: str
  hmmbuild_binary_path: str

  # Jackhmmer databases.
  small_bfd_database_path: str
  small_bfd_z_value: int | None = None
  mgnify_database_path: str
  mgnify_z_value: int | None = None
  uniprot_cluster_annot_database_path: str
  uniprot_cluster_annot_z_value: int | None = None
  uniref90_database_path: str
  uniref90_z_value: int | None = None
  # Nhmmer databases.
  ntrna_database_path: str
  ntrna_z_value: int | None = None
  rfam_database_path: str
  rfam_z_value: int | None = None
  rna_central_database_path: str
  rna_central_z_value: int | None = None
  # Template search databases.
  seqres_database_path: str
  pdb_database_path: str

  # Optional configuration for MSA tools.
  jackhmmer_n_cpu: int = 8
  jackhmmer_max_parallel_shards: int | None = None
  nhmmer_n_cpu: int = 8
  nhmmer_max_parallel_shards: int | None = None

  max_template_date: datetime.date


class DataPipeline:
  """Runs the alignment tools and assembles the input features."""

  def __init__(self, data_pipeline_config: DataPipelineConfig):
    """Initializes the data pipeline with default configurations."""
    self._uniref90_msa_config = msa_config.RunConfig(
        config=msa_config.JackhmmerConfig(
            binary_path=data_pipeline_config.jackhmmer_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='uniref90',
                path=data_pipeline_config.uniref90_database_path,
            ),
            n_cpu=data_pipeline_config.jackhmmer_n_cpu,
            n_iter=1,
            e_value=1e-4,
            z_value=data_pipeline_config.uniref90_z_value,
            dom_z_value=data_pipeline_config.uniref90_z_value,
            max_sequences=10_000,
            max_parallel_shards=data_pipeline_config.jackhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        crop_size=None,
    )
    self._mgnify_msa_config = msa_config.RunConfig(
        config=msa_config.JackhmmerConfig(
            binary_path=data_pipeline_config.jackhmmer_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='mgnify',
                path=data_pipeline_config.mgnify_database_path,
            ),
            n_cpu=data_pipeline_config.jackhmmer_n_cpu,
            n_iter=1,
            e_value=1e-4,
            z_value=data_pipeline_config.mgnify_z_value,
            dom_z_value=data_pipeline_config.mgnify_z_value,
            max_sequences=5_000,
            max_parallel_shards=data_pipeline_config.jackhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        crop_size=None,
    )
    self._small_bfd_msa_config = msa_config.RunConfig(
        config=msa_config.JackhmmerConfig(
            binary_path=data_pipeline_config.jackhmmer_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='small_bfd',
                path=data_pipeline_config.small_bfd_database_path,
            ),
            n_cpu=data_pipeline_config.jackhmmer_n_cpu,
            n_iter=1,
            e_value=1e-4,
            # Set z_value=138_515_945 to match the z_value used in the paper.
            # In practice, this has minimal impact on predicted structures.
            z_value=data_pipeline_config.small_bfd_z_value,
            dom_z_value=data_pipeline_config.small_bfd_z_value,
            max_sequences=5_000,
            max_parallel_shards=data_pipeline_config.jackhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        crop_size=None,
    )
    self._uniprot_msa_config = msa_config.RunConfig(
        config=msa_config.JackhmmerConfig(
            binary_path=data_pipeline_config.jackhmmer_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='uniprot_cluster_annot',
                path=data_pipeline_config.uniprot_cluster_annot_database_path,
            ),
            n_cpu=data_pipeline_config.jackhmmer_n_cpu,
            n_iter=1,
            e_value=1e-4,
            z_value=data_pipeline_config.uniprot_cluster_annot_z_value,
            dom_z_value=data_pipeline_config.uniprot_cluster_annot_z_value,
            max_sequences=50_000,
            max_parallel_shards=data_pipeline_config.jackhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        crop_size=None,
    )
    self._nt_rna_msa_config = msa_config.RunConfig(
        config=msa_config.NhmmerConfig(
            binary_path=data_pipeline_config.nhmmer_binary_path,
            hmmalign_binary_path=data_pipeline_config.hmmalign_binary_path,
            hmmbuild_binary_path=data_pipeline_config.hmmbuild_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='nt_rna',
                path=data_pipeline_config.ntrna_database_path,
            ),
            n_cpu=data_pipeline_config.nhmmer_n_cpu,
            e_value=1e-3,
            alphabet='rna',
            z_value=data_pipeline_config.ntrna_z_value,
            max_sequences=10_000,
            max_parallel_shards=data_pipeline_config.nhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.RNA_CHAIN,
        crop_size=None,
    )
    self._rfam_msa_config = msa_config.RunConfig(
        config=msa_config.NhmmerConfig(
            binary_path=data_pipeline_config.nhmmer_binary_path,
            hmmalign_binary_path=data_pipeline_config.hmmalign_binary_path,
            hmmbuild_binary_path=data_pipeline_config.hmmbuild_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='rfam_rna',
                path=data_pipeline_config.rfam_database_path,
            ),
            n_cpu=data_pipeline_config.nhmmer_n_cpu,
            e_value=1e-3,
            alphabet='rna',
            z_value=data_pipeline_config.rfam_z_value,
            max_sequences=10_000,
            max_parallel_shards=data_pipeline_config.nhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.RNA_CHAIN,
        crop_size=None,
    )
    self._rnacentral_msa_config = msa_config.RunConfig(
        config=msa_config.NhmmerConfig(
            binary_path=data_pipeline_config.nhmmer_binary_path,
            hmmalign_binary_path=data_pipeline_config.hmmalign_binary_path,
            hmmbuild_binary_path=data_pipeline_config.hmmbuild_binary_path,
            database_config=msa_config.DatabaseConfig(
                name='rna_central_rna',
                path=data_pipeline_config.rna_central_database_path,
            ),
            n_cpu=data_pipeline_config.nhmmer_n_cpu,
            e_value=1e-3,
            alphabet='rna',
            z_value=data_pipeline_config.rna_central_z_value,
            max_sequences=10_000,
            max_parallel_shards=data_pipeline_config.nhmmer_max_parallel_shards,
        ),
        chain_poly_type=mmcif_names.RNA_CHAIN,
        crop_size=None,
    )

    self._templates_config = msa_config.TemplatesConfig(
        template_tool_config=msa_config.TemplateToolConfig(
            database_path=data_pipeline_config.seqres_database_path,
            chain_poly_type=mmcif_names.PROTEIN_CHAIN,
            hmmsearch_config=msa_config.HmmsearchConfig(
                hmmsearch_binary_path=data_pipeline_config.hmmsearch_binary_path,
                hmmbuild_binary_path=data_pipeline_config.hmmbuild_binary_path,
                filter_f1=0.1,
                filter_f2=0.1,
                filter_f3=0.1,
                e_value=100,
                inc_e=100,
                dom_e=100,
                incdom_e=100,
                alphabet='amino',
            ),
        ),
        filter_config=msa_config.TemplateFilterConfig(
            max_subsequence_ratio=0.95,
            min_align_ratio=0.1,
            min_hit_length=10,
            deduplicate_sequences=True,
            max_hits=4,
            max_template_date=data_pipeline_config.max_template_date,
        ),
    )
    self._pdb_database_path = data_pipeline_config.pdb_database_path

  def process_protein_chain(
      self, chain: folding_input.ProteinChain
  ) -> folding_input.ProteinChain:
    """Processes a single protein chain."""
    has_unpaired_msa = chain.unpaired_msa is not None
    has_paired_msa = chain.paired_msa is not None
    has_templates = chain.templates is not None

    if not has_unpaired_msa and not has_paired_msa and not chain.templates:
      # MSA None - search. Templates either [] - don't search, or None - search.
      unpaired_msa, paired_msa, template_hits = _get_protein_msa_and_templates(
          sequence=chain.sequence,
          run_template_search=not has_templates,  # Skip template search if [].
          uniref90_msa_config=self._uniref90_msa_config,
          mgnify_msa_config=self._mgnify_msa_config,
          small_bfd_msa_config=self._small_bfd_msa_config,
          uniprot_msa_config=self._uniprot_msa_config,
          templates_config=self._templates_config,
          pdb_database_path=self._pdb_database_path,
      )
      unpaired_msa = unpaired_msa.to_a3m()
      paired_msa = paired_msa.to_a3m()
      templates = [
          folding_input.Template(
              mmcif=struc.to_mmcif(),
              query_to_template_map=hit.query_to_hit_mapping,
          )
          for hit, struc in template_hits.get_hits_with_structures()
      ]
    elif has_unpaired_msa and has_paired_msa and not has_templates:
      # Has MSA, but doesn't have templates. Search for templates only.
      empty_msa = msa.Msa.from_empty(
          query_sequence=chain.sequence,
          chain_poly_type=mmcif_names.PROTEIN_CHAIN,
      ).to_a3m()
      unpaired_msa = chain.unpaired_msa or empty_msa
      paired_msa = chain.paired_msa or empty_msa
      template_hits = _get_protein_templates(
          sequence=chain.sequence,
          input_msa_a3m=unpaired_msa,
          run_template_search=True,
          templates_config=self._templates_config,
          pdb_database_path=self._pdb_database_path,
      )
      templates = [
          folding_input.Template(
              mmcif=struc.to_mmcif(),
              query_to_template_map=hit.query_to_hit_mapping,
          )
          for hit, struc in template_hits.get_hits_with_structures()
      ]
    else:
      # Has MSA and templates, don't search for anything.
      if not has_unpaired_msa or not has_paired_msa or not has_templates:
        raise ValueError(
            f'Protein chain {chain.id} has unpaired MSA, paired MSA, or'
            ' templates set only partially. If you want to run the pipeline'
            ' with custom MSA/templates, you need to set all of them. You can'
            ' set MSA to empty string and templates to empty list to signify'
            ' that they should not be used and searched for.'
        )
      logging.info(
          'Skipping MSA and template search for protein chain %s because it '
          'already has MSAs and templates.',
          chain.id,
      )
      if not chain.unpaired_msa:
        logging.info('Using empty unpaired MSA for protein chain %s', chain.id)
      if not chain.paired_msa:
        logging.info('Using empty paired MSA for protein chain %s', chain.id)
      if not chain.templates:
        logging.info('Using no templates for protein chain %s', chain.id)
      empty_msa = msa.Msa.from_empty(
          query_sequence=chain.sequence,
          chain_poly_type=mmcif_names.PROTEIN_CHAIN,
      ).to_a3m()
      unpaired_msa = chain.unpaired_msa or empty_msa
      paired_msa = chain.paired_msa or empty_msa
      templates = chain.templates

    return folding_input.ProteinChain(
        id=chain.id,
        sequence=chain.sequence,
        ptms=chain.ptms,
        unpaired_msa=unpaired_msa,
        paired_msa=paired_msa,
        templates=templates,
    )

  def process_rna_chain(
      self, chain: folding_input.RnaChain
  ) -> folding_input.RnaChain:
    """Processes a single RNA chain."""
    if chain.unpaired_msa is not None:
      # Don't run MSA tools if the chain already has an MSA.
      logging.info(
          'Skipping MSA search for RNA chain %s because it already has MSA.',
          chain.id,
      )
      if not chain.unpaired_msa:
        logging.info('Using empty unpaired MSA for RNA chain %s', chain.id)
      empty_msa = msa.Msa.from_empty(
          query_sequence=chain.sequence, chain_poly_type=mmcif_names.RNA_CHAIN
      ).to_a3m()
      unpaired_msa = chain.unpaired_msa or empty_msa
    else:
      unpaired_msa = _get_rna_msa(
          sequence=chain.sequence,
          nt_rna_msa_config=self._nt_rna_msa_config,
          rfam_msa_config=self._rfam_msa_config,
          rnacentral_msa_config=self._rnacentral_msa_config,
      ).to_a3m()
    return folding_input.RnaChain(
        id=chain.id,
        sequence=chain.sequence,
        modifications=chain.modifications,
        unpaired_msa=unpaired_msa,
    )

  def process(self, fold_input: folding_input.Input) -> folding_input.Input:
    """Runs MSA and template tools and returns a new Input with the results."""
    processed_chains = []
    for chain in fold_input.chains:
      print(f'Running data pipeline for chain {chain.id}...')
      process_chain_start_time = time.time()
      match chain:
        case folding_input.ProteinChain():
          processed_chains.append(self.process_protein_chain(chain))
        case folding_input.RnaChain():
          processed_chains.append(self.process_rna_chain(chain))
        case _:
          processed_chains.append(chain)
      print(
          f'Running data pipeline for chain {chain.id} took'
          f' {time.time() - process_chain_start_time:.2f} seconds',
      )

    return dataclasses.replace(fold_input, chains=processed_chains)


================================================
FILE: src/alphafold3/data/structure_stores.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Library for loading structure data from various sources."""

from collections.abc import Mapping, Sequence
import functools
import os
import pathlib
import tarfile


class NotFoundError(KeyError):
  """Raised when the structure store doesn't contain the requested target."""


class StructureStore:
  """Handles the retrieval of mmCIF files from a filesystem."""

  def __init__(
      self,
      structures: str | os.PathLike[str] | Mapping[str, str],
  ):
    """Initialises the instance.

    Args:
      structures: Path of the directory where the mmCIF files are or a Mapping
        from target name to mmCIF string.
    """
    if isinstance(structures, Mapping):
      self._structure_mapping = structures
      self._structure_path = None
      self._structure_tar = None
    else:
      self._structure_mapping = None
      path_str = os.fspath(structures)
      if path_str.endswith('.tar'):
        self._structure_tar = tarfile.open(path_str, 'r')
        self._structure_path = None
      else:
        self._structure_path = pathlib.Path(structures)
        self._structure_tar = None

  @functools.cached_property
  def _tar_members(self) -> Mapping[str, tarfile.TarInfo]:
    assert self._structure_tar is not None
    return {
        path.stem: tarinfo
        for tarinfo in self._structure_tar.getmembers()
        if tarinfo.isfile()
        and (path := pathlib.Path(tarinfo.path.lower())).suffix == '.cif'
    }

  def get_mmcif_str(self, target_name: str) -> str:
    """Returns an mmCIF for a given `target_name`.

    Args:
      target_name: Name specifying the target mmCIF.

    Raises:
      NotFoundError: If the target is not found.
    """
    if self._structure_mapping is not None:
      try:
        return self._structure_mapping[target_name]
      except KeyError as e:
        raise NotFoundError(f'{target_name=} not found') from e

    if self._structure_tar is not None:
      try:
        member = self._tar_members[target_name]
        if struct_file := self._structure_tar.extractfile(member):
          return struct_file.read().decode()
        else:
          raise NotFoundError(f'{target_name=} not found')
      except KeyError:
        raise NotFoundError(f'{target_name=} not found') from None

    filepath = self._structure_path / f'{target_name}.cif'
    try:
      return filepath.read_text()
    except FileNotFoundError as e:
      raise NotFoundError(f'{target_name=} not found at {filepath=}') from e

  def target_names(self) -> Sequence[str]:
    """Returns all targets in the store."""
    if self._structure_mapping is not None:
      return [*self._structure_mapping.keys()]
    elif self._structure_tar is not None:
      return sorted(self._tar_members.keys())
    elif self._structure_path is not None:
      return sorted([path.stem for path in self._structure_path.glob('*.cif')])
    return ()


================================================
FILE: src/alphafold3/data/template_realign.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Realign sequences found in PDB seqres to the actual CIF sequences."""

from collections.abc import Mapping


class AlignmentError(Exception):
  """Failed alignment between the hit sequence and the actual mmCIF sequence."""


def realign_hit_to_structure(
    *,
    hit_sequence: str,
    hit_start_index: int,
    hit_end_index: int,
    full_length: int,
    structure_sequence: str,
    query_to_hit_mapping: Mapping[int, int],
) -> Mapping[int, int]:
  """Realigns the hit sequence to the Structure sequence.

  For example, for the given input:
    query_sequence : ABCDEFGHIJKL
    hit_sequence   : ---DEFGHIJK-
    struc_sequence : XDEFGHKL
  the mapping is {3: 0, 4: 1, 5: 2, 6: 3, 7: 4, 8: 5, 9: 6, 10: 7}. However, the
  actual Structure sequence has an extra X at the start as well as no IJ. So the
  alignment from the query to the Structure sequence will be:
    hit_sequence   : ---DEFGHIJK-
    struc_aligned  : --XDEFGH--KL
  and the new mapping will therefore be: {3: 1, 4: 2, 5: 3, 6: 4, 7: 5, 10: 6}.

  Args:
    hit_sequence: The PDB seqres hit sequence obtained from Hmmsearch, but
      without any gaps. This is not the full PDB seqres template sequence but
      rather just its subsequence from hit_start_index to hit_end_index.
    hit_start_index: The start index of the hit sequence in the full PDB seqres
      template sequence (inclusive).
    hit_end_index: The end index of the hit sequence in the full PDB seqres
      template sequence (exclusive).
    full_length: The length of the full PDB seqres template sequence.
    structure_sequence: The actual sequence extracted from the Structure
      corresponding to this template. In vast majority of cases this is the same
      as the PDB seqres sequence, but this function handles the cases when not.
    query_to_hit_mapping: The mapping from the query sequence to the
      hit_sequence.

  Raises:
    AlignmentError: if the alignment between the sequence returned by Hmmsearch
      differs from the actual sequence found in the mmCIF and can't be aligned
      using the simple alignment algorithm.

  Returns:
    A mapping from the query sequence to the actual Structure sequence.
  """
  max_num_gaps = full_length - len(structure_sequence)
  if max_num_gaps < 0:
    raise AlignmentError(
        f'The Structure sequence ({len(structure_sequence)}) '
        f'must be shorter than the PDB seqres sequence ({full_length}):\n'
        f'Structure sequence : {structure_sequence}\n'
        f'PDB seqres sequence: {hit_sequence}'
    )

  if len(hit_sequence) != hit_end_index - hit_start_index:
    raise AlignmentError(
        f'The difference of {hit_end_index=} and {hit_start_index=} does not '
        f'equal to the length of the {hit_sequence}: {len(hit_sequence)}'
    )

  best_score = -1
  best_start = 0
  best_query_to_hit_mapping = query_to_hit_mapping
  max_num_gaps_before_subseq = min(hit_start_index, max_num_gaps)
  # It is possible the gaps needed to align the PDB seqres subsequence and
  # the Structure subsequence need to be inserted before the match region.
  # Try and pick the alignment with the best number of aligned residues.
  for num_gaps_before_subseq in range(0, max_num_gaps_before_subseq + 1):
    start = hit_start_index - num_gaps_before_subseq
    end = hit_end_index - num_gaps_before_subseq
    structure_subseq = structure_sequence[start:end]

    new_query_to_hit_mapping, score = _remap_to_struc_seq(
        hit_seq=hit_sequence,
        struc_seq=structure_subseq,
        max_num_gaps=max_num_gaps - num_gaps_before_subseq,
        mapping=query_to_hit_mapping,
    )
    if score >= best_score:
      # Use >= to prefer matches with larger number of gaps before.
      best_score = score
      best_start = start
      best_query_to_hit_mapping = new_query_to_hit_mapping

  return {q: h + best_start for q, h in best_query_to_hit_mapping.items()}


def _remap_to_struc_seq(
    *,
    hit_seq: str,
    struc_seq: str,
    max_num_gaps: int,
    mapping: Mapping[int, int],
) -> tuple[Mapping[int, int], int]:
  """Remaps the query -> hit mapping to match the actual Structure sequence.

  Args:
    hit_seq: The hit sequence - a subsequence of the PDB seqres sequence without
      any Hmmsearch modifications like inserted gaps or lowercased residues.
    struc_seq: The actual sequence obtained from the corresponding Structure.
    max_num_gaps: The maximum number of gaps that can be inserted in the
      Structure sequence. In practice, this is the length difference between the
      PDB seqres sequence and the actual Structure sequence.
    mapping: The mapping from the query residues to the hit residues. This will
      be remapped to point to the actual Structure sequence using a simple
      realignment algorithm.

  Returns:
    A tuple of (mapping, score):
      * Mapping from the query to the actual Structure sequence.
      * Score which is the number of matching aligned residues.

  Raises:
    ValueError if the structure sequence isn't shorter than the seqres sequence.
    ValueError if the alignment fails.
  """
  hit_seq_idx = 0
  struc_seq_idx = 0
  hit_to_struc_seq_mapping = {}
  score = 0

  # This while loop is guaranteed to terminate since we increase both
  # struc_seq_idx and hit_seq_idx by at least 1 in each iteration.
  remaining_num_gaps = max_num_gaps
  while hit_seq_idx < len(hit_seq) and struc_seq_idx < len(struc_seq):
    if hit_seq[hit_seq_idx] != struc_seq[struc_seq_idx]:
      # Explore which alignment aligns the next residue (if present).
      best_shift = 0
      for shift in range(0, remaining_num_gaps + 1):
        next_hit_res = hit_seq[hit_seq_idx + shift : hit_seq_idx + shift + 1]
        next_struc_res = struc_seq[struc_seq_idx : struc_seq_idx + 1]
        if next_hit_res == next_struc_res:
          best_shift = shift
          break
      hit_seq_idx += best_shift
      remaining_num_gaps -= best_shift

    hit_to_struc_seq_mapping[hit_seq_idx] = struc_seq_idx
    score += hit_seq[hit_seq_idx] == struc_seq[struc_seq_idx]
    hit_seq_idx += 1
    struc_seq_idx += 1

  fixed_mapping = {}
  for query_idx, original_hit_idx in mapping.items():
    fixed_hit_idx = hit_to_struc_seq_mapping.get(original_hit_idx)
    if fixed_hit_idx is not None:
      fixed_mapping[query_idx] = fixed_hit_idx

  return fixed_mapping, score


================================================
FILE: src/alphafold3/data/templates.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""API for retrieving and manipulating template search results."""

from collections.abc import Iterable, Iterator, Mapping, Sequence
import dataclasses
import datetime
import functools
import os
import re
from typing import Any, Final, Self, TypeAlias

from absl import logging
from alphafold3 import structure
from alphafold3.common import resources
from alphafold3.constants import atom_types
from alphafold3.constants import mmcif_names
from alphafold3.constants import residue_names
from alphafold3.data import msa_config
from alphafold3.data import parsers
from alphafold3.data import structure_stores
from alphafold3.data import template_realign
from alphafold3.data.tools import hmmsearch
from alphafold3.structure import mmcif
import numpy as np


_POLYMER_FEATURES: Final[Mapping[str, np.float64 | np.int32 | object]] = {
    'template_aatype': np.int32,
    'template_all_atom_masks': np.float64,
    'template_all_atom_positions': np.float64,
    'template_domain_names': object,
    'template_release_date': object,
    'template_sequence': object,
}

_LIGAND_FEATURES: Final[Mapping[str, Any]] = {
    'ligand_features': Mapping[str, Any]
}


TemplateFeatures: TypeAlias = Mapping[
    str, np.ndarray | bytes | Mapping[str, np.ndarray | bytes]
]
_REQUIRED_METADATA_COLUMNS: Final[Sequence[str]] = (
    'seq_release_date',
    'seq_unresolved_res_num',
    'seq_author_chain_id',
    'seq_sequence',
)


@dataclasses.dataclass(frozen=True, kw_only=True, slots=True)
class _Polymer:
  """Container for alphabet specific (dna, rna, protein) atom information."""

  min_atoms: int
  num_atom_types: int
  atom_order: Mapping[str, int]


_POLYMERS = {
    mmcif_names.PROTEIN_CHAIN: _Polymer(
        min_atoms=5,
        num_atom_types=atom_types.ATOM37_NUM,
        atom_order=atom_types.ATOM37_ORDER,
    ),
    mmcif_names.DNA_CHAIN: _Polymer(
        min_atoms=21,
        num_atom_types=atom_types.ATOM29_NUM,
        atom_order=atom_types.ATOM29_ORDER,
    ),
    mmcif_names.RNA_CHAIN: _Polymer(
        min_atoms=20,
        num_atom_types=atom_types.ATOM29_NUM,
        atom_order=atom_types.ATOM29_ORDER,
    ),
}


def _encode_restype(
    chain_poly_type: str,
    sequence: str,
) -> Sequence[int]:
  """Encodes a sequence of residue names as a sequence of ints.

  Args:
    chain_poly_type: Polymer chain type to determine sequence encoding.
    sequence: Polymer residues. Protein encoded by single letters. RNA and DNA
      encoded by  multi-letter CCD codes.

  Returns:
    A sequence of integers encoding amino acid types for the given chain type.
  """
  if chain_poly_type == mmcif_names.PROTEIN_CHAIN:
    return [
        residue_names.PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_AND_GAP_TO_INT[
            _STANDARDIZED_AA.get(res, res)
        ]
        for res in sequence
    ]

  unk_nucleic = residue_names.UNK_NUCLEIC_ONE_LETTER
  unk_nucleic_idx = residue_names.POLYMER_TYPES_ORDER_WITH_UNKNOWN_AND_GAP[
      unk_nucleic
  ]
  if chain_poly_type == mmcif_names.RNA_CHAIN:
    return [
        residue_names.POLYMER_TYPES_ORDER_WITH_UNKNOWN_AND_GAP.get(
            res, unk_nucleic_idx
        )
        for res in sequence
    ]
  elif chain_poly_type == mmcif_names.DNA_CHAIN:
    # Map UNK DNA to the generic nucleic UNK (N), which happens to also be the
    # same as the RNA UNK.
    return [
        residue_names.POLYMER_TYPES_ORDER_WITH_UNKNOWN_AND_GAP.get(
            residue_names.DNA_COMMON_ONE_TO_TWO.get(res, unk_nucleic),
            unk_nucleic_idx,
        )
        for res in sequence
    ]

  raise NotImplementedError(f'"{chain_poly_type}" unsupported.')


_DAYS_BEFORE_QUERY_DATE: Final[int] = 60
_HIT_DESCRIPTION_REGEX = re.compile(
    r'(?P<pdb_id>[a-z0-9]{4,})_(?P<chain_id>\w+)/(?P<start>\d+)-(?P<end>\d+) '
    r'.* length:(?P<length>\d+)\b.*'
)

_STANDARDIZED_AA = {'B': 'D', 'J': 'X', 'O': 'X', 'U': 'C', 'Z': 'E'}


class Error(Exception):
  """Base class for exceptions."""


class HitDateError(Error):
  """An error indicating that invalid release date was detected."""


class InvalidTemplateError(Error):
  """An error indicating that template is invalid."""


@dataclasses.dataclass(frozen=True, kw_only=True)
class Hit:
  """Template hit metrics derived from the MSA for filtering and featurising.

  Attributes:
    pdb_id: The PDB ID of the hit.
    auth_chain_id: The author chain ID of the hit.
    hmmsearch_sequence: Hit sequence as given in hmmsearch a3m output.
    structure_sequence: Hit sequence as given in PDB structure.
    unresolved_res_indices: Indices of unresolved residues in the structure
      sequence. 0-based.
    query_sequence: The query nucleotide/amino acid sequence.
    start_index: The start index of the sequence relative to the full PDB seqres
      sequence. Inclusive and uses 0-based indexing.
    end_index: The end index of the sequence relative to the full PDB seqres
      sequence. Exclusive and uses 0-based indexing.
    full_length: Length of the full PDB seqres sequence. This can be different
      from the length from the actual sequence we get from the mmCIF and we use
      this to detect whether we need to realign or not.
    release_date: The release date of the PDB corresponding to this hit.
    chain_poly_type: The polymer type of the selected hit structure.
  """

  pdb_id: str
  auth_chain_id: str
  hmmsearch_sequence: str
  structure_sequence: str
  unresolved_res_indices: Sequence[int] | None
  query_sequence: str
  start_index: int
  end_index: int
  full_length: int
  release_date: datetime.date
  chain_poly_type: str

  @functools.cached_property
  def query_to_hit_mapping(self) -> Mapping[int, int]:
    """0-based query index to hit index mapping."""
    query_to_hit_mapping = {}
    hit_index = 0
    query_index = 0
    for residue in self.hmmsearch_sequence:
      # Gap inserted in the template
      if residue == '-':
        query_index += 1
      # Deleted residue in the template (would be a gap in the query).
      elif residue.islower():
        hit_index += 1
      # Normal aligned residue, in both query and template. Add to mapping.
      elif residue.isupper():
        query_to_hit_mapping[query_index] = hit_index
        query_index += 1
        hit_index += 1

    structure_subseq = self.structure_sequence[
        self.start_index : self.end_index
    ]
    if self.matching_sequence != structure_subseq:
      # The seqres sequence doesn't match the structure sequence. Two cases:
      # 1. The sequences have the same length. The sequences are different
      #    because our 3->1 residue code mapping is different from the one PDB
      #    uses. We don't do anything in this case as both sequences have the
      #    same length, so the original query to hit mapping stays valid.
      # 2. The sequences don't have the same length, the one in structure is
      #    shorter. In this case we change the mapping to match the actual
      #    structure sequence using a simple realignment algorithm.
      # This procedure was validated on all PDB seqres (2023_01_12) sequences
      # and handles all cases that can happen.
      if self.full_length != len(self.structure_sequence):
        return template_realign.realign_hit_to_structure(
            hit_sequence=self.matching_sequence,
            hit_start_index=self.start_index,
            hit_end_index=self.end_index,
            full_length=self.full_length,
            structure_sequence=self.structure_sequence,
            query_to_hit_mapping=query_to_hit_mapping,
        )

    # Hmmsearch returns a subsequence and so far indices have been relative to
    # the subsequence. Add an offset to index relative to the full structure
    # sequence.
    return {q: h + self.start_index for q, h in query_to_hit_mapping.items()}

  @property
  def matching_sequence(self) -> str:
    """Returns the matching hit sequence including insertions.

    Make deleted residues uppercase and remove gaps ("-").
    """
    return self.hmmsearch_sequence.upper().replace('-', '')

  @functools.cached_property
  def output_templates_sequence(self) -> str:
    """Returns the final template sequence."""
    result_seq = ['-'] * len(self.query_sequence)
    for query_index, template_index in self.query_to_hit_mapping.items():
      result_seq[query_index] = self.structure_sequence[template_index]
    return ''.join(result_seq)

  @property
  def length_ratio(self) -> float:
    """Ratio of the length of the hit sequence to the query."""
    return len(self.matching_sequence) / len(self.query_sequence)

  @property
  def align_ratio(self) -> float:
    """Ratio of the number of aligned residues to the query length."""
    return len(self.query_to_hit_mapping) / len(self.query_sequence)

  @functools.cached_property
  def is_valid(self) -> bool:
    """Whether hit can be used as a template."""
    if self.unresolved_res_indices is None:
      return False

    return bool(
        set(self.query_to_hit_mapping.values())
        - set(self.unresolved_res_indices)
    )

  @property
  def full_name(self) -> str:
    """A full name of the hit."""
    return f'{self.pdb_id}_{self.auth_chain_id}'

  def __post_init__(self):
    if not self.pdb_id.islower() and not self.pdb_id.isdigit():
      raise ValueError(f'pdb_id must be lowercase {self.pdb_id}')

    if not (0 <= self.start_index <= self.end_index):
      raise ValueError(
          'Start must be non-negative and less than or equal to end index. '
          f'Range: {self.start_index}-{self.end_index}'
      )

    if len(self.matching_sequence) != (self.end_index - self.start_index):
      raise ValueError(
          'Sequence length must be equal to end_index - start_index. '
          f'{len(self.matching_sequence)} != {self.end_index} - '
          f'{self.start_index}'
      )

    if self.full_length < 0:
      raise ValueError(f'Full length must be non-negative: {self.full_length}')

  def keep(
      self,
      *,
      release_date_cutoff: datetime.date | None,
      max_subsequence_ratio: float | None,
      min_hit_length: int | None,
      min_align_ratio: float | None,
  ) -> bool:
    """Returns whether the hit should be kept.

    In addition to filtering on all of the provided parameters, this method also
    excludes hits with unresolved residues.

    Args:
      release_date_cutoff: Maximum release date of the template.
      max_subsequence_ratio: If set, excludes hits which are an exact
        subsequence of the query sequence, and longer than this ratio. Useful to
        avoid ground truth leakage.
      min_hit_length: If set, excludes hits which have fewer residues than this.
      min_align_ratio: If set, excludes hits where the number of residues
        aligned to the query is less than this proportion of the template
        length.
    """
    # Exclude hits which are too recent.
    if (
        release_date_cutoff is not None
        and self.release_date > release_date_cutoff
    ):
      return False

    # Exclude hits which are large duplicates of the query_sequence.
    if (
        max_subsequence_ratio is not None
        and self.length_ratio > max_subsequence_ratio
    ):
      if self.matching_sequence in self.query_sequence:
        return False

    # Exclude hits which are too short.
    if (
        min_hit_length is not None
        and len(self.matching_sequence) < min_hit_length
    ):
      return False

    # Exclude hits with unresolved residues.
    if not self.is_valid:
      return False

    # Exclude hits with too few alignments.
    try:
      if min_align_ratio is not None and self.align_ratio <= min_align_ratio:
        return False
    except template_realign.AlignmentError as e:
      logging.warning('Failed to align %s: %s', self, str(e))
      return False

    return True


def _filter_hits(
    hits: Iterable[Hit],
    release_date_cutoff: datetime.date,
    max_subsequence_ratio: float | None,
    min_align_ratio: float | None,
    min_hit_length: int | None,
    deduplicate_sequences: bool,
    max_hits: int | None,
) -> Sequence[Hit]:
  """Filters hits based on the filter config."""
  filtered_hits = []
  seen_before = set()
  for hit in hits:
    if not hit.keep(
        max_subsequence_ratio=max_subsequence_ratio,
        min_align_ratio=min_align_ratio,
        min_hit_length=min_hit_length,
        release_date_cutoff=release_date_cutoff,
    ):
      continue

    # Remove duplicate templates, keeping the first.
    if deduplicate_sequences:
      if hit.output_templates_sequence in seen_before:
        continue
      seen_before.add(hit.output_templates_sequence)

    filtered_hits.append(hit)
    if max_hits and len(filtered_hits) == max_hits:
      break

  return filtered_hits


@dataclasses.dataclass(init=False)
class Templates:
  """A container for templates that were found for the given query sequence.

  The structure_store is constructed from the config by default. Callers can
  optionally supply a structure_store to the constructor to avoid the cost of
  construction and metadata loading.
  """

  def __init__(
      self,
      *,
      query_sequence: str,
      hits: Sequence[Hit],
      max_template_date: datetime.date,
      structure_store: structure_stores.StructureStore,
      query_release_date: datetime.date | None = None,
  ):
    self._query_sequence = query_sequence
    self._hits = tuple(hits)
    self._max_template_date = max_template_date
    self._query_release_date = query_release_date
    self._hit_structures = {}
    self._structure_store = structure_store

    if any(h.query_sequence != self._query_sequence for h in self.hits):
      raise ValueError('All hits must match the query sequence.')

    if self._hits:
      chain_poly_type = self._hits[0].chain_poly_type
      if any(h.chain_poly_type != chain_poly_type for h in self.hits):
        raise ValueError('All hits must have the same chain_poly_type.')

  @classmethod
  def from_seq_and_a3m(
      cls,
      *,
      query_sequence: str,
      msa_a3m: str,
      max_template_date: datetime.date,
      database_path: os.PathLike[str] | str,
      hmmsearch_config: msa_config.HmmsearchConfig,
      max_a3m_query_sequences: int | None,
      structure_store: structure_stores.StructureStore,
      filter_config: msa_config.TemplateFilterConfig | None = None,
      query_release_date: datetime.date | None = None,
      chain_poly_type: str = mmcif_names.PROTEIN_CHAIN,
  ) -> Self:
    """Creates templates from a run of hmmsearch tool against a custom a3m.

    Args:
      query_sequence: The polymer sequence of the target query.
      msa_a3m: An a3m of related polymers aligned to the query sequence, this is
        used to create an HMM for the hmmsearch run.
      max_template_date: This is used to filter templates for training, ensuring
        that they do not leak ground truth information used in testing sets.
      database_path: A path to the sequence database to search for templates.
      hmmsearch_config: Config with Hmmsearch settings.
      max_a3m_query_sequences: The maximum number of input MSA sequences to use
        to construct the profile which is then used to search for templates.
      structure_store: Structure store to fetch template structures from.
      filter_config: Optional config that controls which and how many hits to
        keep. More performant than constructing and then filtering. If not
        provided, no filtering is done.
      query_release_date: The release_date of the template query, this is used
        to filter templates for training, ensuring that they do not leak
        structure information from the future.
      chain_poly_type: The polymer type of the templates.

    Returns:
      Templates object containing a list of Hits initialised from the
      structure_store metadata and a3m alignments.
    """
    hmmsearch_a3m = run_hmmsearch_with_a3m(
        database_path=database_path,
        hmmsearch_config=hmmsearch_config,
        max_a3m_query_sequences=max_a3m_query_sequences,
        a3m=msa_a3m,
    )
    return cls.from_hmmsearch_a3m(
        query_sequence=query_sequence,
        a3m=hmmsearch_a3m,
        max_template_date=max_template_date,
        query_release_date=query_release_date,
        chain_poly_type=chain_poly_type,
        structure_store=structure_store,
        filter_config=filter_config,
    )

  @classmethod
  def from_hmmsearch_a3m(
      cls,
      *,
      query_sequence: str,
      a3m: str,
      max_template_date: datetime.date,
      structure_store: structure_stores.StructureStore,
      filter_config: msa_config.TemplateFilterConfig | None = None,
      query_release_date: datetime.date | None = None,
      chain_poly_type: str = mmcif_names.PROTEIN_CHAIN,
  ) -> Self:
    """Creates Templates from a Hmmsearch A3M.

    Args:
      query_sequence: The polymer sequence of the target query.
      a3m: Results of Hmmsearch in A3M format. This provides a list of potential
        template alignments and pdb codes.
      max_template_date: This is used to filter templates for training, ensuring
        that they do not leak ground truth information used in testing sets.
      structure_store: Structure store to fetch template structures from.
      filter_config: Optional config that controls which and how many hits to
        keep. More performant than constructing and then filtering. If not
        provided, no filtering is done.
      query_release_date: The release_date of the template query, this is used
        to filter templates for training, ensuring that they do not leak
        structure information from the future.
      chain_poly_type: The polymer type of the templates.

    Returns:
      Templates object containing a list of Hits initialised from the
      structure_store metadata and a3m alignments.
    """

    def hit_generator(a3m: str):
      if not a3m:
        return  # Hmmsearch could return an empty string if there are no hits.

      for hit_seq, hit_desc in parsers.lazy_parse_fasta_string(a3m):
        pdb_id, auth_chain_id, start, end, full_length = _parse_hit_description(
            hit_desc
        )

        release_date, sequence, unresolved_res_ids = _parse_hit_metadata(
            structure_store, pdb_id, auth_chain_id
        )
        if unresolved_res_ids is None:
          continue

        # seq_unresolved_res_num are 1-based, setting to 0-based indices.
        unresolved_indices = [i - 1 for i in unresolved_res_ids]

        yield Hit(
            pdb_id=pdb_id,
            auth_chain_id=auth_chain_id,
            hmmsearch_sequence=hit_seq,
            structure_sequence=sequence,
            query_sequence=query_sequence,
            unresolved_res_indices=unresolved_indices,
            start_index=start - 1,  # Raw value is residue number, not index.
            end_index=end,
            full_length=full_length,
            release_date=datetime.date.fromisoformat(release_date),
            chain_poly_type=chain_poly_type,
        )

    if filter_config is None:
      hits = tuple(hit_generator(a3m))
    else:
      hits = _filter_hits(
          hit_generator(a3m),
          release_date_cutoff=filter_config.max_template_date,
          max_subsequence_ratio=filter_config.max_subsequence_ratio,
          min_align_ratio=filter_config.min_align_ratio,
          min_hit_length=filter_config.min_hit_length,
          deduplicate_sequences=filter_config.deduplicate_sequences,
          max_hits=filter_config.max_hits,
      )

    return Templates(
        query_sequence=query_sequence,
        query_release_date=query_release_date,
        hits=hits,
        max_template_date=max_template_date,
        structure_store=structure_store,
    )

  @property
  def query_sequence(self) -> str:
    return self._query_sequence

  @property
  def hits(self) -> tuple[Hit, ...]:
    return self._hits

  @property
  def query_release_date(self) -> datetime.date | None:
    return self._query_release_date

  @property
  def num_hits(self) -> int:
    return len(self._hits)

  @functools.cached_property
  def release_date_cutoff(self) -> datetime.date:
    if self.query_release_date is None:
      return self._max_template_date
    return min(
        self._max_template_date,
        self.query_release_date
        - datetime.timedelta(days=_DAYS_BEFORE_QUERY_DATE),
    )

  def __repr__(self) -> str:
    return f'Templates({self.num_hits} hits)'

  def filter(
      self,
      *,
      max_subsequence_ratio: float | None,
      min_align_ratio: float | None,
      min_hit_length: int | None,
      deduplicate_sequences: bool,
      max_hits: int | None,
  ) -> Self:
    """Returns a new Templates object with only the hits that pass all filters.

    This also filters on query_release_date and max_template_date.

    Args:
      max_subsequence_ratio: If set, excludes hits which are an exact
        subsequence of the query sequence, and longer than this ratio. Useful to
        avoid ground truth leakage.
      min_align_ratio: If set, excludes hits where the number of residues
        aligned to the query is less than this proportion of the template
        length.
      min_hit_length: If set, excludes hits which have fewer residues than this.
      deduplicate_sequences: Whether to exclude duplicate template sequences,
        keeping only the first. This can be useful in increasing the diversity
        of hits especially in the case of homomer hits.
      max_hits: If set, excludes any hits which exceed this count.
    """
    filtered_hits = _filter_hits(
        hits=self._hits,
        release_date_cutoff=self.release_date_cutoff,
        max_subsequence_ratio=max_subsequence_ratio,
        min_align_ratio=min_align_ratio,
        min_hit_length=min_hit_length,
        deduplicate_sequences=deduplicate_sequences,
        max_hits=max_hits,
    )
    return Templates(
        query_sequence=self.query_sequence,
        query_release_date=self.query_release_date,
        hits=filtered_hits,
        max_template_date=self._max_template_date,
        structure_store=self._structure_store,
    )

  def get_hits_with_structures(
      self,
  ) -> Sequence[tuple[Hit, structure.Structure]]:
    """Returns hits + Structures, Structures filtered to the hit's chain."""
    results = []
    structures = {struc.name.lower(): struc for struc in self.structures}
    for hit in self.hits:
      if not hit.is_valid:
        raise InvalidTemplateError(
            'Hits must be filtered before calling get_hits_with_structures.'
        )
      struc = structures[hit.pdb_id]
      label_chain_id = struc.polymer_auth_asym_id_to_label_asym_id().get(
          hit.auth_chain_id
      )
      results.append((hit, struc.filter(chain_id=label_chain_id)))
    return results

  def featurize(
      self,
      include_ligand_features: bool = True,
  ) -> TemplateFeatures:
    """Featurises the templates and returns a map of feature names to features.

    NB: If you don't do any prefiltering, this method might be slow to run
    as it has to fetch many CIFs and featurize them all.

    Args:
      include_ligand_features: Whether to compute ligand features.

    Returns:
      Template features: A mapping of template feature labels to features, which
        may be numpy arrays, bytes objects, or for the special case of label
        `ligand_features` (if `include_ligand_features` is True), a nested
        feature map of labels to numpy arrays.

    Raises:
      InvalidTemplateError: If hits haven't been filtered before featurization.
    """
    hits_by_pdb_id = {}
    for idx, hit in enumerate(self.hits):
      if not hit.is_valid:
        raise InvalidTemplateError(
            f'Hits must be filtered before featurizing, got unprocessed {hit=}'
        )
      hits_by_pdb_id.setdefault(hit.pdb_id, []).append((idx, hit))

    unsorted_features = []
    for struc in self.structures:
      pdb_id = str(struc.name).lower()
      for idx, hit in hits_by_pdb_id[pdb_id]:
        try:
          label_chain_id = struc.polymer_auth_asym_id_to_label_asym_id()[
              hit.auth_chain_id
          ]
          hit_features = {
              **get_polymer_features(
                  chain=struc.filter(chain_id=label_chain_id),
                  chain_poly_type=hit.chain_poly_type,
                  query_sequence_length=len(hit.query_sequence),
                  query_to_hit_mapping=hit.query_to_hit_mapping,
              ),
          }
          if include_ligand_features:
            hit_features['ligand_features'] = _get_ligand_features(struc)
          unsorted_features.append((idx, hit_features))
        except Error as e:
          raise type(e)(f'Failed to featurise {hit=}') from e

    sorted_features = sorted(unsorted_features, key=lambda x: x[0])
    sorted_features = [feat for _, feat in sorted_features]
    return package_template_features(
        hit_features=sorted_features,
        include_ligand_features=include_ligand_features,
    )

  @property
  def structures(self) -> Iterator[structure.Structure]:
    """Yields template structures for each unique PDB ID among hits.

    If there are multiple hits in the same Structure, the Structure will be
    included only once by this method.

    Yields:
      A Structure object for each unique PDB ID among hits.

    Raises:
      HitDateError: If template's release date exceeds max cutoff date.
    """

    for hit in self.hits:
      if hit.release_date > self.release_date_cutoff:  # pylint: disable=comparison-with-callable
        raise HitDateError(
            f'Invalid release date for hit {hit.pdb_id=}, when release date '
            f'cutoff is {self.release_date_cutoff}.'
        )

    # Get the set of pdbs to load. In particular, remove duplicate PDB IDs.
    targets_to_load = tuple({hit.pdb_id for hit in self.hits})

    for target_name in targets_to_load:
      yield structure.from_mmcif(
          mmcif_string=self._structure_store.get_mmcif_str(target_name),
          fix_mse_residues=True,
          fix_arginines=True,
          include_water=False,
          include_bonds=False,
          include_other=True,  # For non-standard polymer chains.
      )


def _parse_hit_description(description: str) -> tuple[str, str, int, int, int]:
  """Parses the hmmsearch A3M sequence description line."""
  # Example lines (protein, nucleic, no description):
  # >4pqx_A/2-217 [subseq from] mol:protein length:217  Free text
  # >4pqx_A/2-217 [subseq from] mol:na length:217  Free text
  # >5g3r_A/1-55 [subseq from] mol:protein length:352
  if match := re.fullmatch(_HIT_DESCRIPTION_REGEX, description):
    return (
        match['pdb_id'],
        match['chain_id'],
        int(match['start']),
        int(match['end']),
        int(match['length']),
    )
  else:
    raise ValueError(f'Could not parse description "{description}"')


def _parse_hit_metadata(
    structure_store: structure_stores.StructureStore,
    pdb_id: str,
    auth_chain_id: str,
) -> tuple[Any, str | None, Sequence[int] | None]:
  """Parse hit metadata by parsing mmCIF from structure store."""
  try:
    cif = mmcif.from_string(structure_store.get_mmcif_str(pdb_id))
  except structure_stores.NotFoundError:
    logging.warning(
        'Failed to get mmCIF for %s (author chain %s).', pdb_id, auth_chain_id
    )
    return None, None, None
  release_date = mmcif.get_release_date(cif)

  try:
    struc = structure.from_parsed_mmcif(
        cif,
        model_id=structure.ModelID.ALL,
        include_water=True,
        include_other=True,
        include_bonds=False,
    )
  except ValueError:
    struc = structure.from_parsed_mmcif(
        cif,
        model_id=structure.ModelID.FIRST,
        include_water=True,
        include_other=True,
        include_bonds=False,
    )

  sequence = struc.polymer_author_chain_single_letter_sequence(
      include_missing_residues=True,
      protein=True,
      dna=True,
      rna=True,
      other=True,
  )[auth_chain_id]

  unresolved_res_ids = struc.filter(
      chain_auth_asym_id=auth_chain_id
  ).unresolved_residues.id

  return release_date, sequence, unresolved_res_ids


def get_polymer_features(
    *,
    chain: structure.Structure,
    chain_poly_type: str,
    query_sequence_length: int,
    query_to_hit_mapping: Mapping[int, int],
) -> Mapping[str, Any]:
  """Returns features for this polymer chain.

  Args:
    chain: Structure object representing the template. Must be already filtered
      to a single chain.
    chain_poly_type: The chain polymer type (protein, DNA, RNA).
    query_sequence_length: The length of the query sequence.
    query_to_hit_mapping: 0-based query index to hit index mapping.

  Returns:
    A dictionary with polymer features for template_chain_id in the struc.

  Raises:
    ValueError: If the input structure contains more than just a single chain.
  """
  if chain.name is None:
    raise ValueError('Template structure must have a name.')

  if chain.release_date is None:
    raise ValueError(
        f'Template structure {chain.name} must have a release date. You can do'
        ' this by setting "_pdbx_audit_revision_history.revision_date" in the'
        ' template mmCIF to a date in the ISO-8601 format (e.g. 1989-11-17).'
    )

  num_polymer_chains = len(chain.polymer_auth_asym_id_to_label_asym_id())
  if num_polymer_chains != 1:
    raise ValueError(
        f'Template structure {chain.name} must be filtered to a single polymer'
        f' chain but got a structure with {num_polymer_chains} polymer chains.'
    )

  auth_chain_id, label_chain_id = next(
      iter(chain.polymer_auth_asym_id_to_label_asym_id().items())
  )
  chain_sequence = chain.chain_single_letter_sequence()[label_chain_id]

  polymer = _POLYMERS[chain_poly_type]
  res_arrays = chain.to_res_arrays(
      include_missing_residues=True, atom_order=polymer.atom_order
  )
  positions = res_arrays.atom_positions
  positions_mask = res_arrays.atom_mask
  template_all_atom_positions = np.zeros(
      (query_sequence_length, polymer.num_atom_types, 3), dtype=np.float64
  )
  template_all_atom_masks = np.zeros(
      (query_sequence_length, polymer.num_atom_types), dtype=np.int64
  )

  template_sequence = ['-'] * query_sequence_length
  for query_index, template_index in query_to_hit_mapping.items():
    template_all_atom_positions[query_index] = positions[template_index]
    template_all_atom_masks[query_index] = positions_mask[template_index]
    template_sequence[query_index] = chain_sequence[template_index]

  template_sequence = ''.join(template_sequence)
  template_aatype = _encode_restype(chain_poly_type, template_sequence)
  template_name = f'{chain.name.lower()}_{auth_chain_id}'
  release_date = chain.release_date.strftime('%Y-%m-%d')
  return {
      'template_all_atom_positions': template_all_atom_positions,
      'template_all_atom_masks': template_all_atom_masks,
      'template_sequence': template_sequence.encode(),
      'template_aatype': np.array(template_aatype, dtype=np.int32),
      'template_domain_names': np.array(template_name.encode(), dtype=object),
      'template_release_date': np.array(release_date.encode(), dtype=object),
  }


def _get_ligand_features(
    struc: structure.Structure,
) -> Mapping[str, Mapping[str, np.ndarray | bytes]]:
  """Returns features for the ligands in this structure."""
  ligand_struc = struc.filter_to_entity_type(ligand=True)
  assert ligand_struc.coords is not None
  assert ligand_struc.atom_name is not None
  assert ligand_struc.atom_occupancy is not None

  ligand_features = {}
  for ligand_chain_id in ligand_struc.chains:
    idxs = np.where(ligand_struc.chain_id == ligand_chain_id)[0]
    if idxs.shape[0]:
      ligand_features[ligand_chain_id] = {
          'ligand_atom_positions': (
              ligand_struc.coords[idxs, :].astype(np.float32)
          ),
          'ligand_atom_names': ligand_struc.atom_name[idxs].astype(object),
          'ligand_atom_occupancies': (
              ligand_struc.atom_occupancy[idxs].astype(np.float32)
          ),
          'ccd_id': ligand_struc.res_name[idxs][0].encode(),
      }
  return ligand_features


def package_template_features(
    *,
    hit_features: Sequence[Mapping[str, Any]],
    include_ligand_features: bool,
) -> Mapping[str, Any]:
  """Stacks polymer features, adds empty and keeps ligand features unstacked."""

  features_to_include = set(_POLYMER_FEATURES)
  if include_ligand_features:
    features_to_include.update(_LIGAND_FEATURES)

  features = {
      feat: [single_hit_features[feat] for single_hit_features in hit_features]
      for feat in features_to_include
  }

  stacked_features = {}
  for k, v in features.items():
    if k in _POLYMER_FEATURES:
      v = np.stack(v, axis=0) if v else np.array([], dtype=_POLYMER_FEATURES[k])
    stacked_features[k] = v

  return stacked_features


def _resolve_path(path: os.PathLike[str] | str) -> str:
  """Resolves path for data dep paths, stringifies otherwise."""
  # Data dependency paths: db baked into the binary.
  resolved_path = resources.filename(path)
  if os.path.exists(resolved_path):
    return resolved_path
  else:
    # Other paths, e.g. local.
    return str(path)


def run_hmmsearch_with_a3m(
    *,
    database_path: os.PathLike[str] | str,
    hmmsearch_config: msa_config.HmmsearchConfig,
    max_a3m_query_sequences: int | None,
    a3m: str | None,
) -> str:
  """Runs Hmmsearch to get a3m string of hits."""
  searcher = hmmsearch.Hmmsearch(
      binary_path=hmmsearch_config.hmmsearch_binary_path,
      hmmbuild_binary_path=hmmsearch_config.hmmbuild_binary_path,
      database_path=_resolve_path(database_path),
      e_value=hmmsearch_config.e_value,
      inc_e=hmmsearch_config.inc_e,
      dom_e=hmmsearch_config.dom_e,
      incdom_e=hmmsearch_config.incdom_e,
      alphabet=hmmsearch_config.alphabet,
      filter_f1=hmmsearch_config.filter_f1,
      filter_f2=hmmsearch_config.filter_f2,
      filter_f3=hmmsearch_config.filter_f3,
      filter_max=hmmsearch_config.filter_max,
  )
  # STO enables us to annotate query non-gap columns as reference columns.
  sto = parsers.convert_a3m_to_stockholm(a3m, max_a3m_query_sequences)
  return searcher.query_with_sto(sto, model_construction='hand')


================================================
FILE: src/alphafold3/data/tools/hmmalign.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""A Python wrapper for hmmalign from the HMMER Suite."""

from collections.abc import Mapping, Sequence
import os
import tempfile

from alphafold3.data import parsers
from alphafold3.data.tools import subprocess_utils


def _to_a3m(sequences: Sequence[str], name_prefix: str = 'sequence') -> str:
  a3m = ''
  for i, sequence in enumerate(sequences, 1):
    a3m += f'> {name_prefix} {i}\n{sequence}\n'
  return a3m


class Hmmalign:
  """Python wrapper of the hmmalign binary."""

  def __init__(self, binary_path: str):
    """Initializes the Python hmmalign wrapper.

    Args:
      binary_path: Path to the hmmalign binary.

    Raises:
      RuntimeError: If hmmalign binary not found within the path.
    """
    self._binary_path = binary_path

    subprocess_utils.check_binary_exists(
        path=self._binary_path, name='hmmalign'
    )

  def align_sequences(
      self,
      sequences: Sequence[str],
      profile: str,
      extra_flags: Mapping[str, str] | None = None,
  ) -> str:
    """Aligns sequence list to the profile and returns the alignment in A3M."""
    return self.align(
        a3m_str=_to_a3m(sequences, name_prefix='query'),
        profile=profile,
        extra_flags=extra_flags,
    )

  def align(
      self,
      a3m_str: str,
      profile: str,
      extra_flags: Mapping[str, str] | None = None,
  ) -> str:
    """Aligns sequences in A3M to the profile and returns the alignment in A3M.

    Args:
      a3m_str: A list of sequence strings.
      profile: A hmm file with the hmm profile to align the sequences to.
      extra_flags: Dictionary with extra flags, flag_name: flag_value, that are
        added to hmmalign.

    Returns:
      An A3M string with the aligned sequences.

    Raises:
      RuntimeError: If hmmalign fails.
    """
    with tempfile.TemporaryDirectory() as query_tmp_dir:
      input_profile = os.path.join(query_tmp_dir, 'profile.hmm')
      input_sequences = os.path.join(query_tmp_dir, 'sequences.a3m')
      output_a3m_path = os.path.join(query_tmp_dir, 'output.a3m')

      with open(input_profile, 'w') as f:
        f.write(profile)

      with open(input_sequences, 'w') as f:
        f.write(a3m_str)

      cmd = [
          self._binary_path,
          *('-o', output_a3m_path),
          *('--outformat', 'A2M'),  # A2M is A3M in the HMMER suite.
      ]
      if extra_flags:
        for flag_name, flag_value in extra_flags.items():
          cmd.extend([flag_name, flag_value])
      cmd.extend([input_profile, input_sequences])

      subprocess_utils.run(
          cmd=cmd,
          cmd_name='hmmalign',
          log_stdout=False,
          log_stderr=True,
          log_on_process_error=True,
      )

      with open(output_a3m_path, encoding='utf-8') as f:
        a3m = f.read()

    return a3m

  def align_sequences_to_profile(self, profile: str, sequences_a3m: str) -> str:
    """Aligns the sequences to profile and returns the alignment in A3M string.

    Uses hmmalign to align the sequences to the profile, then ouputs the
    sequence contatenated at the beginning of the sequences in the A3M format.
    As the sequences are represented by an alignment with possible gaps ('-')
    and insertions (lowercase characters), the method first removes the gaps,
    then uppercases the insertions to prepare the sequences for realignment.
    Sequences with gaps cannot be aligned, as '-'s are not a valid symbol to
    align; lowercase characters must be uppercased to preserve the original
    sequences before realignment.

    Args:
      profile: The Hmmbuild profile to align the sequences to.
      sequences_a3m: Sequences in A3M format to align to the profile.

    Returns:
      An A3M string with the aligned sequences.

    Raises:
      RuntimeError: If hmmalign fails.
    """
    deletion_table = str.maketrans('', '', '-')
    sequences_no_gaps_a3m = []
    for seq, desc in parsers.lazy_parse_fasta_string(sequences_a3m):
      sequences_no_gaps_a3m.append(f'>{desc}')
      sequences_no_gaps_a3m.append(seq.translate(deletion_table))
    sequences_no_gaps_a3m = '\n'.join(sequences_no_gaps_a3m)

    aligned_sequences = self.align(sequences_no_gaps_a3m, profile)

    return aligned_sequences


================================================
FILE: src/alphafold3/data/tools/hmmbuild.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""A Python wrapper for hmmbuild - construct HMM profiles from MSA."""

import os
import re
import tempfile
from typing import Literal

from alphafold3.data import parsers
from alphafold3.data.tools import subprocess_utils


class Hmmbuild(object):
  """Python wrapper of the hmmbuild binary."""

  def __init__(
      self,
      *,
      binary_path: str,
      singlemx: bool = False,
      alphabet: str | None = None,
  ):
    """Initializes the Python hmmbuild wrapper.

    Args:
      binary_path: The path to the hmmbuild executable.
      singlemx: Whether to use --singlemx flag. If True, it forces HMMBuild to
        just use a common substitution score matrix.
      alphabet: The alphabet to assert when building a profile. Useful when
        hmmbuild cannot guess the alphabet. If None, no alphabet is asserted.

    Raises:
      RuntimeError: If hmmbuild binary not found within the path.
    """
    self._binary_path = binary_path
    self._singlemx = singlemx
    self._alphabet = alphabet

    subprocess_utils.check_binary_exists(
        path=self._binary_path, name='hmmbuild'
    )

  def build_profile_from_sto(self, sto: str, model_construction='fast') -> str:
    """Builds a HHM for the aligned sequences given as an A3M string.

    Args:
      sto: A string with the aligned sequences in the Stockholm format.
      model_construction: Whether to use reference annotation in the msa to
        determine consensus columns ('hand') or default ('fast').

    Returns:
      A string with the profile in the HMM format.

    Raises:
      RuntimeError: If hmmbuild fails.
    """
    return self._build_profile(
        sto, informat='stockholm', model_construction=model_construction
    )

  def build_profile_from_a3m(self, a3m: str) -> str:
    """Builds a HHM for the aligned sequences given as an A3M string.

    Args:
      a3m: A string with the aligned sequences in the A3M format.

    Returns:
      A string with the profile in the HMM format.

    Raises:
      RuntimeError: If hmmbuild fails.
    """
    lines = []
    for sequence, description in parsers.lazy_parse_fasta_string(a3m):
      sequence = re.sub('[a-z]+', '', sequence)  # Remove inserted residues.
      lines.append(f'>{description}\n{sequence}\n')
    msa = ''.join(lines)
    return self._build_profile(msa, informat='afa')

  def _build_profile(
      self,
      msa: str,
      informat: Literal['afa', 'stockholm'],
      model_construction: str = 'fast',
  ) -> str:
    """Builds a HMM for the aligned sequences given as an MSA string.

    Args:
      msa: A string with the aligned sequences, in A3M or STO format.
      informat: One of 'afa' (aligned FASTA) or 'sto' (Stockholm).
      model_construction: Whether to use reference annotation in the msa to
        determine consensus columns ('hand') or default ('fast').

    Returns:
      A string with the profile in the HMM format.

    Raises:
      RuntimeError: If hmmbuild fails.
      ValueError: If unspecified arguments are provided.
    """
    if model_construction not in {'hand', 'fast'}:
      raise ValueError(f'Bad {model_construction=}. Only hand or fast allowed.')

    with tempfile.TemporaryDirectory() as query_tmp_dir:
      input_msa_path = os.path.join(query_tmp_dir, 'query.msa')
      output_hmm_path = os.path.join(query_tmp_dir, 'output.hmm')

      with open(input_msa_path, 'w') as f:
        f.write(msa)

      # Specify the format as we don't specify the input file extension. See
      # https://github.com/EddyRivasLab/hmmer/issues/321 for more details.
      cmd_flags = ['--informat', informat]
      # If adding flags, we have to do so before the output and input:
      if model_construction == 'hand':
        cmd_flags.append(f'--{model_construction}')
      if self._singlemx:
        cmd_flags.append('--singlemx')
      if self._alphabet:
        cmd_flags.append(f'--{self._alphabet}')

      cmd_flags.extend([output_hmm_path, input_msa_path])

      cmd = [self._binary_path, *cmd_flags]

      subprocess_utils.run(
          cmd=cmd,
          cmd_name='Hmmbuild',
          log_stdout=False,
          log_stderr=True,
          log_on_process_error=True,
      )

      with open(output_hmm_path) as f:
        hmm = f.read()

    return hmm


================================================
FILE: src/alphafold3/data/tools/hmmsearch.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""A Python wrapper for hmmsearch - search profile against a sequence db."""

import os
import tempfile

from absl import logging
from alphafold3.data import parsers
from alphafold3.data.tools import hmmbuild
from alphafold3.data.tools import subprocess_utils


class Hmmsearch(object):
  """Python wrapper of the hmmsearch binary."""

  def __init__(
      self,
      *,
      binary_path: str,
      hmmbuild_binary_path: str,
      database_path: str,
      alphabet: str = 'amino',
      filter_f1: float | None = None,
      filter_f2: float | None = None,
      filter_f3: float | None = None,
      e_value: float | None = None,
      inc_e: float | None = None,
      dom_e: float | None = None,
      incdom_e: float | None = None,
      filter_max: bool = False,
  ):
    """Initializes the Python hmmsearch wrapper.

    Args:
      binary_path: The path to the hmmsearch executable.
      hmmbuild_binary_path: The path to the hmmbuild executable. Used to build
        an hmm from an input a3m.
      database_path: The path to the hmmsearch database (FASTA format).
      alphabet: Chain type e.g. amino, rna, dna.
      filter_f1: MSV and biased composition pre-filter, set to >1.0 to turn off.
      filter_f2: Viterbi pre-filter, set to >1.0 to turn off.
      filter_f3: Forward pre-filter, set to >1.0 to turn off.
      e_value: E-value criteria for inclusion in tblout.
      inc_e: E-value criteria for inclusion in MSA/next round.
      dom_e: Domain e-value criteria for inclusion in tblout.
      incdom_e: Domain e-value criteria for inclusion of domains in MSA/next
        round.
      filter_max: Remove all filters, will ignore all filter_f* settings.

    Raises:
      RuntimeError: If hmmsearch binary not found within the path.
    """
    self._binary_path = binary_path
    self._hmmbuild_runner = hmmbuild.Hmmbuild(
        alphabet=alphabet, binary_path=hmmbuild_binary_path
    )
    self._database_path = database_path
    flags = []
    if filter_max:
      flags.append('--max')
    else:
      if filter_f1 is not None:
        flags.extend(('--F1', filter_f1))
      if filter_f2 is not None:
        flags.extend(('--F2', filter_f2))
      if filter_f3 is not None:
        flags.extend(('--F3', filter_f3))

    if e_value is not None:
      flags.extend(('-E', e_value))
    if inc_e is not None:
      flags.extend(('--incE', inc_e))
    if dom_e is not None:
      flags.extend(('--domE', dom_e))
    if incdom_e is not None:
      flags.extend(('--incdomE', incdom_e))

    self._flags = tuple(map(str, flags))

    subprocess_utils.check_binary_exists(
        path=self._binary_path, name='hmmsearch'
    )

    if not os.path.exists(self._database_path):
      logging.error('Could not find hmmsearch database %s', database_path)
      raise ValueError(f'Could not find hmmsearch database {database_path}')

  def query_with_hmm(self, hmm: str) -> str:
    """Queries the database using hmmsearch using a given hmm."""
    with tempfile.TemporaryDirectory() as query_tmp_dir:
      hmm_input_path = os.path.join(query_tmp_dir, 'query.hmm')
      sto_out_path = os.path.join(query_tmp_dir, 'output.sto')
      with open(hmm_input_path, 'w') as f:
        f.write(hmm)

      cmd = [
          self._binary_path,
          '--noali',  # Don't include the alignment in stdout.
          *('--cpu', '8'),
      ]
      # If adding flags, we have to do so before the output and input:
      if self._flags:
        cmd.extend(self._flags)
      cmd.extend([
          *('-A', sto_out_path),
          hmm_input_path,
          self._database_path,
      ])

      subprocess_utils.run(
          cmd=cmd,
          cmd_name=f'Hmmsearch ({os.path.basename(self._database_path)})',
          log_stdout=False,
          log_stderr=True,
          log_on_process_error=True,
      )

      with open(sto_out_path) as f:
        a3m_out = parsers.convert_stockholm_to_a3m(
            f, remove_first_row_gaps=False, linewidth=60
        )

    return a3m_out

  def query_with_a3m(self, a3m_in: str) -> str:
    """Query the database using hmmsearch using a given a3m."""

    # Only the "fast" model construction makes sense with A3M, as it doesn't
    # have any way to annotate reference columns.
    hmm = self._hmmbuild_runner.build_profile_from_a3m(a3m_in)
    return self.query_with_hmm(hmm)

  def query_with_sto(
      self, msa_sto: str, model_construction: str = 'fast'
  ) -> str:
    """Queries the database using hmmsearch using a given stockholm msa."""
    hmm = self._hmmbuild_runner.build_profile_from_sto(
        msa_sto, model_construction=model_construction
    )
    return self.query_with_hmm(hmm)


================================================
FILE: src/alphafold3/data/tools/jackhmmer.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Library to run Jackhmmer from Python."""

from collections.abc import Iterable, Sequence
from concurrent import futures
import heapq
import os
import pathlib
import shutil
import tempfile
import time

from absl import logging
from alphafold3.data import parsers
from alphafold3.data.tools import msa_tool
from alphafold3.data.tools import shards
from alphafold3.data.tools import subprocess_utils


class Jackhmmer(msa_tool.MsaTool):
  """Python wrapper of the Jackhmmer binary."""

  def __init__(
      self,
      *,
      binary_path: str,
      database_path: str,
      n_cpu: int = 8,
      n_iter: int = 3,
      e_value: float | None = 1e-3,
      z_value: float | int | None = None,
      dom_e: float | None = None,
      dom_z_value: float | int | None = None,
      max_sequences: int = 5000,
      filter_f1: float = 5e-4,
      filter_f2: float = 5e-5,
      filter_f3: float = 5e-7,
      max_threads: int | None = None,
      **unused_kwargs,
  ):
    """Initializes the Python Jackhmmer wrapper.

    NOTE: The MSA obtained by running against sharded dbs won't be always
    exactly the same as the MSA obtained by running against an unsharded db.
    This is because of Jackhmmer deduplication logic, which won't spot duplicate
    hits across multiple shards. Usually this means that the sharded search
    finds more hits (likely bounded by the number of shards), but this should
    not pose an issue given how the results are used downstream. The problem is
    more pronounced with deep MSAs and lower in the hit list (higher e-values).

    Make sure to set the Z and domZ values when searching against a sharded
    database, otherwise the results won't match the normal unsharded search.

    Args:
      binary_path: The path to the jackhmmer executable.
      database_path: The path to the jackhmmer database (FASTA format). Sharded
        file specs, e.g. `<db_path>@<num_shards>`, are supported.
      n_cpu: The number of CPUs to give Jackhmmer.
      n_iter: The number of Jackhmmer iterations.
      e_value: The E-value, see Jackhmmer docs for more details.
      z_value: The Z-value representing the number of comparisons done (i.e
        correct database size) for E-value calculation. Make sure to set this
        when searching against a sharded database, otherwise the e-values will
        be incorrectly scaled.
      dom_e: Domain e-value criteria for inclusion in tblout.
      dom_z_value: Domain z-value representing the number of comparisons done
        (i.e correct database size) for domain E-value calculation. Make sure to
        set this when searching against a sharded database, otherwise the domain
        e-values will be incorrectly scaled.
      max_sequences: Maximum number of sequences to return in the MSA.
      filter_f1: MSV and biased composition pre-filter, set to >1.0 to turn off.
      filter_f2: Viterbi pre-filter, set to >1.0 to turn off.
      filter_f3: Forward pre-filter, set to >1.0 to turn off.
      max_threads: If given, the maximum number of threads used when running
        sharded databases.

    Raises:
      RuntimeError: If Jackhmmer binary not found within the path.
      ValueError: If an invalid configuration is provided in the args.
    """
    self._database_path = database_path

    if shard_paths := shards.get_sharded_paths(self._database_path):
      if n_iter != 1:
        raise ValueError('For a sharded db, only n_iter=1 is supported.')
      if z_value is None:
        raise ValueError(
            'The Z-value must be set when searching against a sharded database '
            'to correctly scale e-values.'
        )
      if max_sequences <= 1:
        raise ValueError(
            'max_sequences must be greater than 1 when running in sharded '
            'mode, because each shard would return only the query sequence.'
        )

      self._shard_paths = shard_paths
      self._max_threads = len(self._shard_paths)
      if max_threads is not None:
        self._max_threads = min(max_threads, self._max_threads)
      logging.info('Jackhmmer running with max_threads = %d', self._max_threads)
    else:
      self._shard_paths = None
      self._max_threads = None

    self._binary_path = binary_path
    subprocess_utils.check_binary_exists(
        path=self._binary_path, name='Jackhmmer'
    )

    self._n_cpu = n_cpu
    self._n_iter = n_iter
    self._e_value = e_value
    self._z_value = z_value
    self._dom_e = dom_e
    self._dom_z_value = dom_z_value
    self._max_sequences = max_sequences
    self._filter_f1 = filter_f1
    self._filter_f2 = filter_f2
    self._filter_f3 = filter_f3

    # If Jackhmmer supports the --seq_limit flag (via our patch), use it to
    # prevent writing out redundant sequences and increasing peak memory usage.
    # If not, the Jackhmmer will be run without the --seq_limit flag.
    self._supports_seq_limit = subprocess_utils.jackhmmer_seq_limit_supported(
        self._binary_path
    )

  def query(self, target_sequence: str) -> msa_tool.MsaToolResult:
    """Query the database (sharded or unsharded) using Jackhmmer."""
    if self._shard_paths:
      # Sharded case, run the query against each database shard in parallel.
      logging.info(
          'Query sequence (sharded db): %s',
          target_sequence
          if len(target_sequence) <= 16
          else f'{target_sequence[:16]}... (len {len(target_sequence)})',
      )

      global_temp_dir = tempfile.mkdtemp()

      def _query_shard_fn(
          shard_path: str,
      ) -> tuple[msa_tool.MsaToolResult, float]:
        t_start = time.time()
        result = self._query_db_shard(
            target_sequence=target_sequence,
            db_shard_path=shard_path,
            get_tblout=True,  # Tblout contains e-values needed for merging.
            global_temp_dir=global_temp_dir,
        )
        return result, time.time() - t_start

      with futures.ThreadPoolExecutor(max_workers=self._max_threads) as ex:
        tool_outputs, timings = zip(*ex.map(_query_shard_fn, self._shard_paths))

      logging.info(
          'Finished query for %d shards, shard timings (seconds): %s',
          len(tool_outputs),
          ', '.join(f'{t:.1f}' for t in timings),
      )

      shutil.rmtree(global_temp_dir, ignore_errors=True)
      return _merge_jackhmmer_results(tool_outputs, self._max_sequences)

    else:
      # Non-sharded case, run the query against the whole database.
      logging.info(
          'Query sequence (non-sharded db): %s',
          target_sequence
          if len(target_sequence) <= 16
          else f'{target_sequence[:16]}... (len {len(target_sequence)})',
      )
      return self._query_db_shard(
          target_sequence=target_sequence,
          db_shard_path=self._database_path,
          get_tblout=False,
      )

  def _query_db_shard(
      self,
      *,
      target_sequence: str,
      db_shard_path: str,
      get_tblout: bool,
      global_temp_dir: str | None = None,
  ) -> msa_tool.MsaToolResult:
    """Query the database shard using Jackhmmer."""

    with tempfile.TemporaryDirectory(dir=global_temp_dir) as query_tmp_dir:
      input_fasta_path = os.path.join(query_tmp_dir, 'query.fasta')
      subprocess_utils.create_query_fasta_file(
          sequence=target_sequence, path=input_fasta_path
      )
      output_sto_path = os.path.join(query_tmp_dir, 'output.sto')
      pathlib.Path(output_sto_path).touch()

      # The F1/F2/F3 are the expected proportion to pass each of the filtering
      # stages (which get progressively more expensive), reducing these
      # speeds up the pipeline at the expensive of sensitivity.  They are
      # currently set very low to make querying Mgnify run in a reasonable
      # amount of time.
      cmd_flags = [
          *('-o', '/dev/null'),  # Don't pollute stdout with Jackhmmer output.
          *('-A', output_sto_path),
          '--noali',
          *('--F1', str(self._filter_f1)),
          *('--F2', str(self._filter_f2)),
          *('--F3', str(self._filter_f3)),
          *('--cpu', str(self._n_cpu)),
          *('-N', str(self._n_iter)),
      ]

      if get_tblout:
        output_tblout_path = pathlib.Path(query_tmp_dir, 'tblout.txt')
        output_tblout_path.touch()
        cmd_flags.extend(['--tblout', str(output_tblout_path)])
      else:
        output_tblout_path = None

      # Report only sequences with E-values <= x in per-sequence output.
      if self._e_value is not None:
        cmd_flags.extend(['-E', str(self._e_value)])

        # Use the same value as the reporting e-value (`-E` flag).
        cmd_flags.extend(['--incE', str(self._e_value)])

      if self._z_value is not None:
        cmd_flags.extend(['-Z', str(self._z_value)])

      if self._dom_z_value is not None:
        cmd_flags.extend(['--domZ', str(self._dom_z_value)])

      if self._dom_e is not None:
        cmd_flags.extend(['--domE', str(self._dom_e)])

      if self._max_sequences is not None and self._supports_seq_limit:
        cmd_flags.extend(['--seq_limit', str(self._max_sequences)])

      # The input FASTA and the input db are the last two arguments.
      cmd = [self._binary_path] + cmd_flags + [input_fasta_path, db_shard_path]

      subprocess_utils.run(
          cmd=cmd,
          cmd_name=f'Jackhmmer ({os.path.basename(db_shard_path)})',
          log_stdout=False,
          log_stderr=True,
          log_on_process_error=True,
      )

      with open(output_sto_path) as f:
        a3m = parsers.convert_stockholm_to_a3m(
            f, max_sequences=self._max_sequences
        )

      # Get the tabular output which has e.g. e-value for each target.
      tbl = '' if output_tblout_path is None else output_tblout_path.read_text()

      return msa_tool.MsaToolResult(
          target_sequence=target_sequence,
          a3m=a3m,
          e_value=self._e_value,
          tblout=tbl,
      )


def _merge_jackhmmer_results(
    jh_results: Sequence[msa_tool.MsaToolResult], max_sequences: int
) -> msa_tool.MsaToolResult:
  """Merges Jackhmmer result protos into a single one."""
  assert len(set(jh_res.target_sequence for jh_res in jh_results)) == 1
  assert len(set(jh_res.e_value for jh_res in jh_results)) == 1

  # Parse the TBL output, create a mapping from hit name to TBL line.
  parsed_tbl = {}
  for jh_result in jh_results:
    assert jh_result.tblout is not None
    for line in jh_result.tblout.splitlines():
      if not line.startswith('#'):
        parsed_tbl[line.partition(' ')[0]] = line

  # Create an iterator and merge a3m info with tbl info.
  def _merged_a3m_tbl_iter(a3m: str) -> Iterable[tuple[str, str, str, str]]:
    # Don't parse the entire a3m, lazily parse only as many sequences as needed.
    iterator = iter(parsers.lazy_parse_fasta_string(a3m))
    next(iterator)  # Skip the query which isn't present in tblout.
    for sequence, description in iterator:
      name = description.partition(' ')[0].partition('/')[0]
      if tbl_info := parsed_tbl.get(name):
        # Skip sequences for which we don't have tbl information.
        yield sequence, description, tbl_info, name

  def sort_key(seq_data: tuple[str, str, str, str]) -> tuple[float, float, str]:
    unused_seq, unused_description, tbl_info, name = seq_data
    # Tblout lines have 19 whitespace delimited columns. "-" used if no value
    # present. We want e-value (column 5) and bit score (column 6), so do only 6
    # splits. E-value and bit score are equivalent, but bit score might have
    # higher resolution. Use the name in case of a tie.
    e_value, bit_score = tbl_info.split(maxsplit=6)[4:6]
    return float(e_value), -float(bit_score), name

  # A3M/TBL is sorted by e-value and name, hence we can merge them efficiently.
  merged_a3m_and_tblout = heapq.merge(
      *[_merged_a3m_tbl_iter(res.a3m) for res in jh_results],
      key=sort_key,
  )

  # Truncate the a3m to max_sequences. Do not truncate the tblout.
  merged_tblout = []
  merged_a3m = [f'>query\n{jh_results[0].target_sequence}']
  for seq, description, tbl_info, _ in merged_a3m_and_tblout:
    merged_tblout.append(tbl_info)
    if len(merged_a3m) < max_sequences:
      merged_a3m.append(f'>{description}\n{seq}')

  logging.info(
      'Limiting merged MSA depth from %d to %d',
      len(merged_tblout),
      max_sequences,
  )

  return msa_tool.MsaToolResult(
      target_sequence=jh_results[0].target_sequence,
      a3m='\n'.join(merged_a3m),
      e_value=jh_results[0].e_value,
      tblout=None,  # We no longer need the tblout.
  )


================================================
FILE: src/alphafold3/data/tools/msa_tool.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Defines protocol for MSA tools."""

import dataclasses
from typing import Protocol


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class MsaToolResult:
  """The result of a MSA tool query.

  Attributes:
    target_sequence: The sequence that was used to query the MSA tool.
    e_value: The e-value that was used to filter the MSA tool results.
    a3m: The MSA output of the tool in the A3M format.
    tblout: The optional tblout output of the MSA tool (needed for merging
      results of queries against a sharded database).
  """

  target_sequence: str
  e_value: float
  a3m: str
  tblout: str | None = None


class MsaTool(Protocol):
  """Interface for MSA tools."""

  def query(self, target_sequence: str) -> MsaToolResult:
    """Runs the MSA tool on the target sequence."""


================================================
FILE: src/alphafold3/data/tools/nhmmer.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Library to run Nhmmer from Python."""

from collections.abc import Iterable, Sequence
from concurrent import futures
import heapq
import os
import pathlib
import shutil
import tempfile
import time
from typing import Final

from absl import logging
from alphafold3.data import parsers
from alphafold3.data.tools import hmmalign
from alphafold3.data.tools import hmmbuild
from alphafold3.data.tools import msa_tool
from alphafold3.data.tools import shards
from alphafold3.data.tools import subprocess_utils


_SHORT_SEQUENCE_CUTOFF: Final[int] = 50


class Nhmmer(msa_tool.MsaTool):
  """Python wrapper of the Nhmmer binary."""

  def __init__(
      self,
      binary_path: str,
      hmmalign_binary_path: str,
      hmmbuild_binary_path: str,
      database_path: str,
      n_cpu: int = 8,
      e_value: float = 1e-3,
      z_value: float | int | None = None,
      max_sequences: int = 5000,
      filter_f3: float = 1e-5,
      alphabet: str | None = None,
      strand: str | None = None,
      max_threads: int | None = None,
  ):
    """Initializes the Python Nhmmer wrapper.

    NOTE: The MSA obtained by running against sharded dbs won't be always
    exactly the same as the MSA obtained by running against an unsharded db.
    This is because of Jackhmmer deduplication logic, which won't spot duplicate
    hits across multiple shards. Usually this means that the sharded search
    finds more hits (likely bounded by the number of shards), but this should
    not pose an issue given how the results are used downstream. The problem is
    more pronounced with deep MSAs and lower in the hit list (higher e-values).

    Make sure to set the Z value when searching against a sharded database,
    otherwise the results won't match the normal unsharded search.

    Args:
      binary_path: Path to the Nhmmer binary.
      hmmalign_binary_path: Path to the Hmmalign binary.
      hmmbuild_binary_path: Path to the Hmmbuild binary.
      database_path: MSA database path to search against. This can be either a
        FASTA (slow) or HMMERDB produced from the FASTA using the makehmmerdb
        binary. The HMMERDB is ~10x faster but experimental.  Sharded file
        specs, e.g. <db_path>@<num_shards>, are supported.
      n_cpu: The number of CPUs to give Nhmmer.
      e_value: The E-value, see Nhmmer docs for more details. Will be
        overwritten if bit_score is set.
      z_value: The Z-value representing the number of comparisons done (i.e
        correct database size) for E-value calculation. Make sure to set this
        when searching against a sharded database, otherwise the e-values will
        be incorrectly scaled.
      max_sequences: Maximum number of sequences to return in the MSA.
      filter_f3: Forward pre-filter, set to >1.0 to turn off.
      alphabet: The alphabet to assert when building a profile with hmmbuild.
        This must be 'rna', 'dna', or None.
      strand: "watson" searches query sequence, "crick" searches
        reverse-compliment and default is None which means searching for both.
      max_threads: If given, the maximum number of threads used when running
        sharded databases.

    Raises:
      RuntimeError: If Nhmmer binary not found within the path.
      ValueError: If an invalid configuration is provided in the args.
    """
    self._database_path = database_path

    if shard_paths := shards.get_sharded_paths(self._database_path):
      if z_value is None:
        raise ValueError(
            'The Z-value must be set when searching against a sharded database '
            'to correctly scale e-values.'
        )
      if 'hmmerdb' in self._database_path:
        raise ValueError('HMMERDB is not supported in sharded mode.')

      if max_sequences <= 1:
        raise ValueError(
            'max_sequences must be greater than 1 when running in sharded '
            'mode, because each shard would return only the query sequence.'
        )

      self._shard_paths = shard_paths
      self._max_threads = len(self._shard_paths)
      if max_threads is not None:
        self._max_threads = min(max_threads, self._max_threads)
      logging.info('Nhmmer running with max_threads = %d', self._max_threads)
    else:
      self._shard_paths = None
      self._max_threads = None

    self._binary_path = binary_path
    self._hmmalign_binary_path = hmmalign_binary_path
    self._hmmbuild_binary_path = hmmbuild_binary_path
    subprocess_utils.check_binary_exists(path=self._binary_path, name='Nhmmer')

    if strand and strand not in {'watson', 'crick'}:
      raise ValueError(f'Invalid {strand=}. only "watson" or "crick" supported')

    if alphabet and alphabet not in {'rna', 'dna'}:
      raise ValueError(f'Invalid {alphabet=}, only "rna" or "dna" supported')

    self._e_value = e_value
    self._n_cpu = n_cpu
    self._z_value = z_value
    self._max_sequences = max_sequences
    self._filter_f3 = filter_f3
    self._alphabet = alphabet
    self._strand = strand

  def query(self, target_sequence: str) -> msa_tool.MsaToolResult:
    """Query the database (sharded or unsharded) using Nhmmer."""
    if self._shard_paths:
      # Sharded case, run the query against each database shard in parallel.
      logging.info(
          'Query sequence (sharded db): %s',
          target_sequence
          if len(target_sequence) <= 16
          else f'{target_sequence[:16]}... (len {len(target_sequence)})',
      )

      global_temp_dir = tempfile.mkdtemp()

      def _query_shard_fn(
          shard_path: str,
      ) -> tuple[msa_tool.MsaToolResult, float]:
        t_start = time.time()
        # Get tblout as it contains e-values we need for merging sequences.
        result = self._query_db_shard(
            target_sequence=target_sequence,
            db_shard_path=shard_path,
            get_tblout=True,  # Tblout contains e-values needed for merging.
            global_temp_dir=global_temp_dir,
        )
        return result, time.time() - t_start

      with futures.ThreadPoolExecutor(max_workers=self._max_threads) as ex:
        tool_outputs, timings = zip(*ex.map(_query_shard_fn, self._shard_paths))

      logging.info(
          'Finished query for %d shards, shard timings (seconds): %s',
          len(tool_outputs),
          ', '.join(f'{t:.1f}' for t in timings),
      )

      shutil.rmtree(global_temp_dir, ignore_errors=True)
      return _merge_nhmmer_results(tool_outputs, self._max_sequences)

    else:
      # Non-sharded case, run the query against the whole database.
      logging.info(
          'Query sequence (non-sharded db): %s',
          target_sequence
          if len(target_sequence) <= 16
          else f'{target_sequence[:16]}... (len {len(target_sequence)})',
      )
      return self._query_db_shard(
          target_sequence=target_sequence,
          db_shard_path=self._database_path,
          get_tblout=False,
      )

  def _query_db_shard(
      self,
      *,
      target_sequence: str,
      db_shard_path: str,
      get_tblout: bool,
      global_temp_dir: str | None = None,
  ) -> msa_tool.MsaToolResult:
    """Query the database shard using Nhmmer."""

    with tempfile.TemporaryDirectory(dir=global_temp_dir) as query_tmp_dir:
      input_a3m_path = os.path.join(query_tmp_dir, 'query.a3m')
      output_sto_path = os.path.join(query_tmp_dir, 'output.sto')
      pathlib.Path(output_sto_path).touch()
      subprocess_utils.create_query_fasta_file(
          sequence=target_sequence, path=input_a3m_path
      )

      cmd_flags = [
          *('-o', '/dev/null'),  # Don't pollute stdout with nhmmer output.
          '--noali',  # Don't include the alignment in stdout.
          *('--cpu', str(self._n_cpu)),
      ]

      if get_tblout:
        output_tblout_path = pathlib.Path(query_tmp_dir, 'tblout.txt')
        output_tblout_path.touch()
        cmd_flags.extend(['--tblout', str(output_tblout_path)])
      else:
        output_tblout_path = None

      cmd_flags.extend(['-E', str(self._e_value)])

      if self._z_value is not None:
        cmd_flags.extend(['-Z', str(self._z_value)])

      if self._alphabet:
        cmd_flags.extend([f'--{self._alphabet}'])

      if self._strand is not None:
        cmd_flags.extend([f'--{self._strand}'])

      cmd_flags.extend(['-A', output_sto_path])
      # As recommend by RNAcentral for short sequences.
      if (
          self._alphabet == 'rna'
          and len(target_sequence) < _SHORT_SEQUENCE_CUTOFF
      ):
        cmd_flags.extend(['--F3', str(0.02)])
      else:
        cmd_flags.extend(['--F3', str(self._filter_f3)])

      # The input A3M and the db are the last two arguments.
      cmd_flags.extend((input_a3m_path, db_shard_path))

      cmd = [self._binary_path, *cmd_flags]
      subprocess_utils.run(
          cmd=cmd,
          cmd_name=f'Nhmmer ({os.path.basename(db_shard_path)})',
          log_stdout=False,
          log_stderr=True,
          log_on_process_error=True,
      )

      if os.path.getsize(output_sto_path) > 0:
        with open(output_sto_path) as f:
          a3m_out = parsers.convert_stockholm_to_a3m(
              f, max_sequences=self._max_sequences - 1  # Query not included.
          )
        # Nhmmer hits are generally shorter than the query sequence. To get MSA
        # of width equal to the query sequence, align hits to the query profile.
        logging.info('Aligning output a3m of size %d bytes', len(a3m_out))

        aligner = hmmalign.Hmmalign(self._hmmalign_binary_path)
        target_sequence_fasta = f'>query\n{target_sequence}\n'
        profile_builder = hmmbuild.Hmmbuild(
            binary_path=self._hmmbuild_binary_path, alphabet=self._alphabet
        )
        profile = profile_builder.build_profile_from_a3m(target_sequence_fasta)
        a3m_out = aligner.align_sequences_to_profile(
            profile=profile, sequences_a3m=a3m_out
        )
        a3m_out = ''.join([target_sequence_fasta, a3m_out])

        # Parse the output a3m to remove line breaks.
        a3m = '\n'.join(
            [f'>{n}\n{s}' for s, n in parsers.lazy_parse_fasta_string(a3m_out)]
        )
      else:
        # Nhmmer returns an empty file if there are no hits.
        # In this case return only the query sequence.
        a3m = f'>query\n{target_sequence}'

      # Get the tabular output which has e.g. e-value for each target.
      tbl = '' if output_tblout_path is None else output_tblout_path.read_text()

    return msa_tool.MsaToolResult(
        target_sequence=target_sequence,
        e_value=self._e_value,
        a3m=a3m,
        tblout=tbl,
    )


def _merge_nhmmer_results(
    nhmmer_results: Sequence[msa_tool.MsaToolResult],
    max_sequences: int,
) -> msa_tool.MsaToolResult:
  """Merges nhmmer result protos into a single one."""
  assert len(set(nh_res.target_sequence for nh_res in nhmmer_results)) == 1
  assert len(set(nh_res.e_value for nh_res in nhmmer_results)) == 1

  # Parse the TBL output, create a mapping from unique hit ID to TBL line.
  parsed_tbl = {}
  for nhmmer_result in nhmmer_results:
    assert nhmmer_result.tblout is not None
    for line in nhmmer_result.tblout.splitlines():
      if not line.startswith('#'):
        line_fields = line.split(maxsplit=15)
        accession = line_fields[0]
        alignment_from = line_fields[6]
        alignment_to = line_fields[7]
        # This is the unique ID that is used in the output A3M.
        unique_id = f'{accession}/{alignment_from}-{alignment_to}'
        parsed_tbl[unique_id] = line

  # Create an iterator and merge a3m info with tbl info.
  def _merged_a3m_tbl_iter(a3m: str) -> Iterable[tuple[str, str, str, str]]:
    # Don't parse the entire a3m, lazily parse only as many sequences as needed.
    iterator = iter(parsers.lazy_parse_fasta_string(a3m))
    next(iterator)  # Skip the query which isn't present in tblout.
    for sequence, description in iterator:
      name = description.partition(' ')[0]
      if tbl_info := parsed_tbl.get(name):
        # Skip sequences for which we don't have tbl information.
        yield sequence, description, tbl_info, name

  def sort_key(seq_data: tuple[str, str, str, str]) -> tuple[float, str]:
    unused_seq, unused_description, tbl_info, name = seq_data
    # Nucleic tblout has 16 space delimited columns. "-" used if no value
    # present. We want e-value in column 12, so do only 13 splits. Use the name
    # in case of an e-value tie.
    return float(tbl_info.split(maxsplit=13)[12]), name

  # A3M/TBL is sorted by e-value and name, hence we can merge them efficiently.
  merged_a3m_and_tblout = heapq.merge(
      *[_merged_a3m_tbl_iter(res.a3m) for res in nhmmer_results],
      key=sort_key,
  )

  # Truncate the a3m to max_sequences. Do not truncate the tblout.
  merged_tblout = []
  merged_a3m = [f'>query\n{nhmmer_results[0].target_sequence}']
  for seq, description, tbl_info, _ in merged_a3m_and_tblout:
    merged_tblout.append(tbl_info)
    if len(merged_a3m) < max_sequences:
      merged_a3m.append(f'>{description}\n{seq}')

  logging.info(
      'Limiting merged MSA depth from %d to %d',
      len(merged_tblout),
      max_sequences,
  )

  return msa_tool.MsaToolResult(
      target_sequence=nhmmer_results[0].target_sequence,
      a3m='\n'.join(merged_a3m),
      e_value=nhmmer_results[0].e_value,
      tblout=None,  # We no longer need the tblout.
  )


================================================
FILE: src/alphafold3/data/tools/rdkit_utils.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Tools for calculating features for ligands."""

import collections
from collections.abc import Mapping, Sequence

from absl import logging
from alphafold3.cpp import cif_dict
import numpy as np
import rdkit.Chem as rd_chem
from rdkit.Chem import AllChem as rd_all_chem


_RDKIT_MMCIF_TO_BOND_TYPE: Mapping[str, rd_chem.BondType] = {
    'SING': rd_chem.BondType.SINGLE,
    'DOUB': rd_chem.BondType.DOUBLE,
    'TRIP': rd_chem.BondType.TRIPLE,
}

_RDKIT_BOND_TYPE_TO_MMCIF: Mapping[rd_chem.BondType, str] = {
    v: k for k, v in _RDKIT_MMCIF_TO_BOND_TYPE.items()
}

_RDKIT_BOND_STEREO_TO_MMCIF: Mapping[rd_chem.BondStereo, str] = {
    rd_chem.BondStereo.STEREONONE: 'N',
    rd_chem.BondStereo.STEREOE: 'E',
    rd_chem.BondStereo.STEREOZ: 'Z',
    rd_chem.BondStereo.STEREOCIS: 'Z',
    rd_chem.BondStereo.STEREOTRANS: 'E',
}


class MolFromMmcifError(Exception):
  """Raised when conversion from mmCIF to RDKit Mol fails."""


class UnsupportedMolBondError(Exception):
  """Raised when we try to handle unsupported RDKit bonds."""


def _populate_atoms_in_mol(
    mol: rd_chem.Mol,
    atom_names: Sequence[str],
    atom_types: Sequence[str],
    atom_charges: Sequence[int],
    implicit_hydrogens: bool,
    ligand_name: str,
    atom_leaving_flags: Sequence[str],
):
  """Populate the atoms of a Mol given atom features.

  Args:
    mol: Mol object.
    atom_names: Names of the atoms.
    atom_types: Types of the atoms.
    atom_charges: Charges of the atoms.
    implicit_hydrogens: Whether to mark the atoms to allow implicit Hs.
    ligand_name: Name of the ligand which the atoms are in.
    atom_leaving_flags: Whether the atom is possibly a leaving atom. Values from
      the CCD column `_chem_comp_atom.pdbx_leaving_atom_flag`. The expected
      values are 'Y' (yes), 'N' (no), '?' (unknown/unset, interpreted as no).

  Raises:
    ValueError: If atom type is invalid.
  """
  # Map atom names to the position they will take in the rdkit molecule.
  atom_name_to_idx = {name: i for i, name in enumerate(atom_names)}

  for atom_name, atom_type, atom_charge, atom_leaving_flag in zip(
      atom_names, atom_types, atom_charges, atom_leaving_flags, strict=True
  ):
    try:
      if atom_type == 'X':
        atom_type = '*'
      atom = rd_chem.Atom(atom_type)
    except RuntimeError as e:
      raise ValueError(f'Failed to use atom type: {str(e)}') from e

    if not implicit_hydrogens:
      atom.SetNoImplicit(True)

    atom.SetProp('atom_name', atom_name)
    atom.SetProp('atom_leaving_flag', atom_leaving_flag)
    atom.SetFormalCharge(atom_charge)
    residue_info = rd_chem.AtomPDBResidueInfo()
    residue_info.SetName(_format_atom_name(atom_name, atom_type))
    residue_info.SetIsHeteroAtom(True)
    residue_info.SetResidueName(ligand_name)
    residue_info.SetResidueNumber(1)
    atom.SetPDBResidueInfo(residue_info)
    atom_index = mol.AddAtom(atom)
    assert atom_index == atom_name_to_idx[atom_name]


def _populate_bonds_in_mol(
    mol: rd_chem.Mol,
    atom_names: Sequence[str],
    bond_begins: Sequence[str],
    bond_ends: Sequence[str],
    bond_orders: Sequence[str],
    bond_is_aromatics: Sequence[bool],
):
  """Populate the bonds of a Mol given bond features.

  Args:
    mol: Mol object.
    atom_names: Names of atoms in the molecule.
    bond_begins: Names of atoms at the beginning of the bond.
    bond_ends: Names of atoms at the end of the bond.
    bond_orders: What order the bonds are.
    bond_is_aromatics: Whether the bonds are aromatic.
  """
  atom_name_to_idx = {name: i for i, name in enumerate(atom_names)}
  for begin, end, bond_type, is_aromatic in zip(
      bond_begins, bond_ends, bond_orders, bond_is_aromatics, strict=True
  ):
    begin_name, end_name = atom_name_to_idx[begin], atom_name_to_idx[end]
    bond_idx = mol.AddBond(begin_name, end_name, bond_type)
    mol.GetBondWithIdx(bond_idx - 1).SetIsAromatic(is_aromatic)


def sanitize_mol(mol, sort_alphabetically, remove_hydrogens) -> rd_chem.Mol:
  # https://www.rdkit.org/docs/source/rdkit.Chem.rdmolops.html#rdkit.Chem.rdmolops.SanitizeMol
  # Kekulize, check valencies, set aromaticity, conjugation and hybridization.
  # This can repair e.g. incorrect aromatic flags.
  rd_chem.SanitizeMol(mol)
  if sort_alphabetically:
    mol = sort_atoms_by_name(mol)
  if remove_hydrogens:
    mol = rd_chem.RemoveHs(mol)
  return mol


def _add_conformer_to_mol(mol, conformer, force_parse) -> rd_chem.Mol:
  # Create conformer and use it to assign stereochemistry.
  if conformer is not None:
    try:
      mol.AddConformer(conformer)
      rd_chem.AssignStereochemistryFrom3D(mol)
    except ValueError as e:
      logging.warning('Failed to parse conformer: %s', e)
      if not force_parse:
        raise


def mol_from_ccd_cif(
    mol_cif: cif_dict.CifDict,
    *,
    force_parse: bool = False,
    sort_alphabetically: bool = True,
    remove_hydrogens: bool = True,
    implicit_hydrogens: bool = False,
) -> rd_chem.Mol:
  """Creates an rdkit Mol object from a CCD mmcif data block.

  The atoms are renumbered so that their names are in alphabetical order and
  these names are placed on the atoms under property 'atom_name'.
  Only hydrogens which are not required to define the molecule are removed.
  For example, hydrogens that define stereochemistry around a double bond are
  retained.
  See this link for more details.
  https://www.rdkit.org/docs/source/rdkit.Chem.rdmolops.html#rdkit.Chem.rdmolops.RemoveHs

  Args:
     mol_cif: An mmcif object representing a molecule.
     force_parse: If True, assumes missing aromatic flags are false, substitutes
       deuterium for hydrogen, assumes missing charges are 0 and ignores missing
       conformer / stereochemistry information.
     sort_alphabetically: True: sort atom alphabetically; False: keep CCD order
     remove_hydrogens: if True, remove non-important hydrogens
     implicit_hydrogens: Sets a marker on the atom that allows implicit Hs.

  Returns:
     An rdkit molecule, with the atoms sorted by name.

  Raises:
    MolToMmcifError: If conversion from mmcif to rdkit Mol fails. More detailed
      error is available as this error's cause.
  """
  # Read data fields.
  try:
    atom_names, atom_types, atom_charges, atom_leaving_flags = parse_atom_data(
        mol_cif, force_parse
    )
    bond_begins, bond_ends, bond_orders, bond_is_aromatics = parse_bond_data(
        mol_cif, force_parse
    )
    lig_name = mol_cif['_chem_comp.id'][0].rjust(3)
  except (KeyError, ValueError) as e:
    raise MolFromMmcifError from e

  # Build Rdkit molecule.
  mol = rd_chem.RWMol()

  # Per atom features.
  try:
    _populate_atoms_in_mol(
        mol=mol,
        atom_names=atom_names,
        atom_types=atom_types,
        atom_charges=atom_charges,
        implicit_hydrogens=implicit_hydrogens,
        ligand_name=lig_name,
        atom_leaving_flags=atom_leaving_flags,
    )
  except (ValueError, RuntimeError) as e:
    raise MolFromMmcifError from e

  _populate_bonds_in_mol(
      mol, atom_names, bond_begins, bond_ends, bond_orders, bond_is_aromatics
  )

  try:
    conformer = _parse_ideal_conformer(mol_cif)
  except (KeyError, ValueError) as e:
    logging.warning('Failed to parse ideal conformer: %s', e)
    if not force_parse:
      raise MolFromMmcifError from e
    conformer = None

  mol.UpdatePropertyCache(strict=False)

  try:
    _add_conformer_to_mol(mol, conformer, force_parse)
    mol = sanitize_mol(mol, sort_alphabetically, remove_hydrogens)
  except (
      ValueError,
      rd_chem.KekulizeException,
      rd_chem.AtomValenceException,
  ) as e:
    raise MolFromMmcifError from e

  return mol


def mol_to_ccd_cif(
    mol: rd_chem.Mol,
    component_id: str,
    pdbx_smiles: str | None = None,
    include_hydrogens: bool = True,
) -> cif_dict.CifDict:
  """Creates a CCD-like mmcif data block from an rdkit Mol object.

  Only a subset of associated mmcif fields is populated, but that is
  sufficient for further usage, e.g. in featurization code.

  Atom names can be specified via `atom_name` property. For atoms with
  unspecified value of that property, the name is assigned based on element type
  and the order in the Mol object.

  If the Mol object has associated conformers, atom positions from the first of
  them will be populated in the resulting mmcif file.

  Args:
     mol: An rdkit molecule.
     component_id: Name of the molecule to use in the resulting mmcif. That is
       equivalent to CCD code.
     pdbx_smiles: If specified, the value will be used to populate
       `_chem_comp.pdbx_smiles`.
     include_hydrogens: Whether to include atom and bond data involving
       hydrogens.

  Returns:
     An mmcif data block corresponding for the given rdkit molecule.

  Raises:
    UnsupportedMolBond: When a molecule contains a bond that can't be
      represented with mmcif.
  """
  mol = rd_chem.Mol(mol)
  if include_hydrogens:
    mol = rd_chem.AddHs(mol)
  rd_chem.Kekulize(mol)

  if mol.GetNumConformers() > 0:
    ideal_conformer = mol.GetConformer(0).GetPositions()
    ideal_conformer = np.vectorize(lambda x: f'{x:.3f}')(ideal_conformer)
  else:
    # No data will be populated in the resulting mmcif if the molecule doesn't
    # have any conformers attached to it.
    ideal_conformer = None

  mol_cif = collections.defaultdict(list)
  mol_cif['data_'] = [component_id]
  mol_cif['_chem_comp.id'] = [component_id]
  if pdbx_smiles:
    mol_cif['_chem_comp.pdbx_smiles'] = [pdbx_smiles]

  mol = assign_atom_names_from_graph(mol, keep_existing_names=True)

  for atom_idx, atom in enumerate(mol.GetAtoms()):
    element = atom.GetSymbol()
    if not include_hydrogens and element in ('H', 'D'):
      continue

    mol_cif['_chem_comp_atom.comp_id'].append(component_id)
    mol_cif['_chem_comp_atom.atom_id'].append(atom.GetProp('atom_name'))
    mol_cif['_chem_comp_atom.type_symbol'].append(atom.GetSymbol().upper())
    mol_cif['_chem_comp_atom.charge'].append(str(atom.GetFormalCharge()))
    if ideal_conformer is not None:
      coords = ideal_conformer[atom_idx]
      mol_cif['_chem_comp_atom.pdbx_model_Cartn_x_ideal'].append(coords[0])
      mol_cif['_chem_comp_atom.pdbx_model_Cartn_y_ideal'].append(coords[1])
      mol_cif['_chem_comp_atom.pdbx_model_Cartn_z_ideal'].append(coords[2])

  for bond in mol.GetBonds():
    atom1 = bond.GetBeginAtom()
    atom2 = bond.GetEndAtom()
    if not include_hydrogens and (
        atom1.GetSymbol() in ('H', 'D') or atom2.GetSymbol() in ('H', 'D')
    ):
      continue
    mol_cif['_chem_comp_bond.comp_id'].append(component_id)
    mol_cif['_chem_comp_bond.atom_id_1'].append(
        bond.GetBeginAtom().GetProp('atom_name')
    )
    mol_cif['_chem_comp_bond.atom_id_2'].append(
        bond.GetEndAtom().GetProp('atom_name')
    )
    try:
      bond_type = bond.GetBondType()
      # Older versions of RDKit did not have a DATIVE bond type. Convert it to
      # SINGLE to match the AF3 training setup.
      if bond_type == rd_chem.BondType.DATIVE:
        bond_type = rd_chem.BondType.SINGLE
      mol_cif['_chem_comp_bond.value_order'].append(
          _RDKIT_BOND_TYPE_TO_MMCIF[bond_type]
      )
      mol_cif['_chem_comp_bond.pdbx_stereo_config'].append(
          _RDKIT_BOND_STEREO_TO_MMCIF[bond.GetStereo()]
      )
    except KeyError as e:
      raise UnsupportedMolBondError from e
    mol_cif['_chem_comp_bond.pdbx_aromatic_flag'].append(
        'Y' if bond.GetIsAromatic() else 'N'
    )

  return cif_dict.CifDict(mol_cif)


def _format_atom_name(atom_name: str, atom_type: str) -> str:
  """Formats an atom name to fit in the four characters specified in PDB.

  See for example the following note on atom name formatting in PDB files:
  https://www.cgl.ucsf.edu/chimera/docs/UsersGuide/tutorials/pdbintro.html#note1

  Args:
    atom_name: The unformatted atom name.
    atom_type: The atom element symbol.

  Returns:
    formatted_atom_name: The formatted 4-character atom name.
  """
  atom_name = atom_name.strip()
  atom_type = atom_type.strip().upper()
  if len(atom_name) == 1:
    return atom_name.rjust(2).ljust(4)
  elif len(atom_name) == 2:
    if atom_name == atom_type:
      return atom_name.ljust(4)
    return atom_name.center(4)
  elif len(atom_name) == 3:
    if atom_name[:2] == atom_type:
      return atom_name.ljust(4)
    return atom_name.rjust(4)
  elif len(atom_name) == 4:
    return atom_name
  else:
    raise ValueError(
        f'Atom name `{atom_name}` has more than four characters '
        'or is an empty string.'
    )


def parse_atom_data(
    mol_cif: cif_dict.CifDict | Mapping[str, Sequence[str]], force_parse: bool
) -> tuple[Sequence[str], Sequence[str], Sequence[int], Sequence[str]]:
  """Parses atoms. If force_parse is True, fix deuterium and missing charge."""
  atom_types = [t.capitalize() for t in mol_cif['_chem_comp_atom.type_symbol']]
  atom_names = mol_cif['_chem_comp_atom.atom_id']
  atom_charges = mol_cif['_chem_comp_atom.charge']
  atom_leaving_flags = ['?'] * len(atom_names)
  if '_chem_comp_atom.pdbx_leaving_atom_flag' in mol_cif:
    atom_leaving_flags = mol_cif['_chem_comp_atom.pdbx_leaving_atom_flag']

  if force_parse:
    # Replace missing charges with 0.
    atom_charges = [charge if charge != '?' else '0' for charge in atom_charges]
    # Deuterium for hydrogen.
    atom_types = [type_ if type_ != 'D' else 'H' for type_ in atom_types]

  atom_charges = [int(atom_charge) for atom_charge in atom_charges]
  return atom_names, atom_types, atom_charges, atom_leaving_flags


def parse_bond_data(
    mol_cif: cif_dict.CifDict | Mapping[str, Sequence[str]], force_parse: bool
) -> tuple[
    Sequence[str], Sequence[str], Sequence[rd_chem.BondType], Sequence[bool]
]:
  """Parses bond data. If force_parse is True, ignore missing aromatic flags."""
  # The bond table isn't present if there are no bonds. Use [] in that case.
  begin_atoms = mol_cif.get('_chem_comp_bond.atom_id_1', [])
  end_atoms = mol_cif.get('_chem_comp_bond.atom_id_2', [])
  orders = mol_cif.get('_chem_comp_bond.value_order', [])
  bond_types = [_RDKIT_MMCIF_TO_BOND_TYPE[order] for order in orders]

  try:
    aromatic_flags = mol_cif.get('_chem_comp_bond.pdbx_aromatic_flag', [])
    is_aromatic = [{'Y': True, 'N': False}[flag] for flag in aromatic_flags]
  except KeyError:
    if force_parse:
      # Set them all to not aromatic.
      is_aromatic = [False for _ in begin_atoms]
    else:
      raise

  return begin_atoms, end_atoms, bond_types, is_aromatic


def _parse_ideal_conformer(mol_cif: cif_dict.CifDict) -> rd_chem.Conformer:
  """Builds a conformer containing the ideal coordinates from the CCD.

  Args:
     mol_cif: An mmcif object representing a molecule.

  Returns:
     An rdkit conformer filled with the ideal positions from the mmcif.

  Raises:
     ValueError: if the positions can't be interpreted.
  """
  atom_x = [
      float(x) for x in mol_cif['_chem_comp_atom.pdbx_model_Cartn_x_ideal']
  ]
  atom_y = [
      float(y) for y in mol_cif['_chem_comp_atom.pdbx_model_Cartn_y_ideal']
  ]
  atom_z = [
      float(z) for z in mol_cif['_chem_comp_atom.pdbx_model_Cartn_z_ideal']
  ]
  atom_positions = zip(atom_x, atom_y, atom_z, strict=True)

  conformer = rd_chem.Conformer(len(atom_x))
  for atom_index, atom_position in enumerate(atom_positions):
    conformer.SetAtomPosition(atom_index, atom_position)

  return conformer


def sort_atoms_by_name(mol: rd_chem.Mol) -> rd_chem.Mol:
  """Sorts the atoms in the molecule by their names."""
  atom_names = {
      atom.GetProp('atom_name'): atom.GetIdx() for atom in mol.GetAtoms()
  }

  # Sort the name, int tuples by the names.
  sorted_atom_names = sorted(atom_names.items())

  # Zip these tuples back together to the sorted indices.
  _, new_order = zip(*sorted_atom_names, strict=True)

  # Reorder the molecule.
  # new_order is effectively an argsort of the names.
  return rd_chem.RenumberAtoms(mol, new_order)


def assign_atom_names_from_graph(
    mol: rd_chem.Mol,
    keep_existing_names: bool = False,
) -> rd_chem.Mol:
  """Assigns atom names from the molecular graph.

  The atom name is stored as an atom property 'atom_name', accessible
  with atom.GetProp('atom_name'). If the property is already specified, and
  keep_existing_names is True we keep the original name.

  We traverse the graph in the order of the rdkit atom index and give each atom
  a name equal to '{ELEMENT_TYPE}{INDEX}'. E.g. C5 is the name for the fifth
  unnamed carbon encountered.

  NOTE: A new mol is returned, the original is not changed in place.

  Args:
    mol: Mol object.
    keep_existing_names: If True, atoms that already have the atom_name property
      will keep their assigned names.

  Returns:
    A new mol, with potentially new 'atom_name' properties.
  """
  mol = rd_chem.Mol(mol)

  specified_atom_names = {
      atom.GetProp('atom_name')
      for atom in mol.GetAtoms()
      if atom.HasProp('atom_name') and keep_existing_names
  }

  element_counts = collections.Counter()
  for atom in mol.GetAtoms():
    if not atom.HasProp('atom_name') or not keep_existing_names:
      element = atom.GetSymbol()
      while True:
        element_counts[element] += 1
        # Standardize names by using uppercase element type, as in CCD. Only
        # effects elements with more than one letter, e.g. 'Cl' becomes 'CL'.
        new_name = f'{element.upper()}{element_counts[element]}'
        if new_name not in specified_atom_names:
          break
      atom.SetProp('atom_name', new_name)

  return mol


def get_random_conformer(
    mol: rd_chem.Mol,
    random_seed: int,
    max_iterations: int | None,
    logging_name: str,
) -> rd_chem.Conformer | None:
  """Stochastic conformer search method using V3 ETK."""
  params = rd_all_chem.ETKDGv3()
  params.randomSeed = random_seed
  if max_iterations is not None:  # Override default value.
    params.maxIterations = max_iterations
  mol_copy = rd_chem.Mol(mol)
  try:
    conformer_id = rd_all_chem.EmbedMolecule(mol_copy, params)
    conformer = mol_copy.GetConformer(conformer_id)
  except ValueError:
    logging.warning('Failed to generate conformer for: %s', logging_name)
    conformer = None
  return conformer


================================================
FILE: src/alphafold3/data/tools/shards.py
================================================
# Copyright 2025 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""A library to handle shards of the format file_path@NUM_SHARDS.

For instance, /path/to/file@20 will generate the following shards:

- /path/to/file-00000-of-00020
- /path/to/file-00001-of-00020
- ...
- /path/to/file-00019-of-00020

This also supports @* pattern, which will determine the number of shards based
on the filesystem content.
"""

from collections.abc import Sequence
import dataclasses
import pathlib
import re


_MAX_NUM_SHARDS = 99_999
_SHARD_RE = re.compile(
    r"""
    ^(?P<prefix>[^\?\],\*]+)@
     (?P<shards>(\d{1,5})|\*)
     (?P<suffix>[\._][^\?\]@\*\/]*)?
    $""",
    re.X,
)


@dataclasses.dataclass(frozen=True)
class ShardSpec:
  prefix: str
  num_shards: int
  suffix: str


def parse_shard_spec(path: str) -> ShardSpec | None:
  """Returns the shard spec or None if the path is not a shard spec.

  For instance, if the shard spec is '/path/to/file@20', the output will be
  ('/path/to/file', 20).

  Args:
    path: the path to parse, e.g. /path/to/file@20 or /path/to/file@*.
  """
  parsed = re.fullmatch(_SHARD_RE, path)
  if not parsed:
    return None
  prefix = parsed.group('prefix')
  shards = parsed.group('shards')
  suffix = parsed.group('suffix') or ''

  if shards != '*':
    return ShardSpec(prefix=prefix, num_shards=int(shards), suffix=suffix)
  shard_slice = slice(len(prefix) + 10, len(prefix) + 15)
  shard_path = pathlib.Path(f'{prefix}-00000-of-?????{suffix}')
  for shard in sorted(shard_path.parent.glob(shard_path.name), reverse=True):
    try:
      num_shards = int(str(shard)[shard_slice])
      return ShardSpec(prefix=prefix, num_shards=num_shards, suffix=suffix)
    except ValueError:
      continue
  return None


def get_sharded_paths(shard_spec: str) -> Sequence[str] | None:
  """Returns a list of file path or None if the input is not a shard spec.

  Args:
    shard_spec: the specifications of the shard, e.g. /path/to/file@20.
  """
  parsed_spec = parse_shard_spec(shard_spec)
  if not parsed_spec:
    return None

  prefix = parsed_spec.prefix
  num_shards = parsed_spec.num_shards
  suffix = parsed_spec.suffix
  if num_shards > _MAX_NUM_SHARDS:
    raise ValueError(f'Shard count for {shard_spec} exceeds {_MAX_NUM_SHARDS}')
  return [
      f'{prefix}-{i:05d}-of-{num_shards:05d}{suffix}' for i in range(num_shards)
  ]


================================================
FILE: src/alphafold3/data/tools/subprocess_utils.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Helper functions for launching external tools."""

from collections.abc import Sequence
import os
import subprocess
import time
from typing import Any

from absl import logging


def create_query_fasta_file(sequence: str, path: str, linewidth: int = 80):
  """Creates a fasta file with the sequence with line width limit."""
  with open(path, 'w') as f:
    f.write('>query\n')

    i = 0
    while i < len(sequence):
      f.write(f'{sequence[i:(i + linewidth)]}\n')
      i += linewidth


def check_binary_exists(path: str, name: str) -> None:
  """Checks if a binary exists on the given path and raises otherwise."""
  if not os.path.exists(path):
    raise RuntimeError(f'{name} binary not found at {path}')


def jackhmmer_seq_limit_supported(jackhmmer_path: str) -> bool:
  """Checks if Jackhmmer supports the --seq-limit flag."""
  try:
    subprocess.run(
        [jackhmmer_path, '-h', '--seq_limit', '1'],
        stdout=subprocess.DEVNULL,
        stderr=subprocess.DEVNULL,
        check=True,
    )
  except subprocess.CalledProcessError:
    return False
  return True


def run(
    cmd: Sequence[str],
    cmd_name: str,
    log_on_process_error: bool = False,
    log_stderr: bool = False,
    log_stdout: bool = False,
    max_out_streams_len: int | None = 500_000,
    **run_kwargs,
) -> subprocess.CompletedProcess[Any]:
  """Launches a subprocess, times it, and checks for errors.

  Args:
    cmd: Command to launch.
    cmd_name: Human-readable command name to be used in logs.
    log_on_process_error: Whether to use `logging.error` to log the process'
      stderr on failure.
    log_stderr: Whether to log the stderr of the command.
    log_stdout: Whether to log the stdout of the command.
    max_out_streams_len: Max length of prefix of stdout and stderr included in
      the exception message. Set to `None` to disable truncation.
    **run_kwargs: Any other kwargs for `subprocess.run`.

  Returns:
    The completed process object.

  Raises:
    RuntimeError: if the process completes with a non-zero return code.
  """

  logging.info('Launching subprocess "%s"', ' '.join(cmd))

  start_time = time.time()
  try:
    completed_process = subprocess.run(
        cmd,
        check=True,
        stderr=subprocess.PIPE,
        stdout=subprocess.PIPE,
        text=True,
        **run_kwargs,
    )
  except subprocess.CalledProcessError as e:
    if log_on_process_error:
      # Logs have a 15k character limit, so log the error line by line.
      logging.error('%s failed. %s stderr begin:', cmd_name, cmd_name)
      for error_line in e.stderr.splitlines():
        if stripped_error_line := error_line.strip():
          logging.error(stripped_error_line)
      logging.error('%s stderr end.', cmd_name)

    error_msg = (
        f'{cmd_name} failed'
        f'\nstdout:\n{e.stdout[:max_out_streams_len]}\n'
        f'\nstderr:\n{e.stderr[:max_out_streams_len]}'
    )
    raise RuntimeError(error_msg) from e
  end_time = time.time()

  logging.info('Finished %s in %.3f seconds', cmd_name, end_time - start_time)
  stdout, stderr = completed_process.stdout, completed_process.stderr

  if log_stdout and stdout:
    logging.info('%s stdout:\n%s', cmd_name, stdout)

  if log_stderr and stderr:
    logging.info('%s stderr:\n%s', cmd_name, stderr)

  return completed_process


================================================
FILE: src/alphafold3/jax/geometry/__init__.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Geometry Module."""

from alphafold3.jax.geometry import rigid_matrix_vector
from alphafold3.jax.geometry import rotation_matrix
from alphafold3.jax.geometry import struct_of_array
from alphafold3.jax.geometry import vector

Rot3Array = rotation_matrix.Rot3Array
Rigid3Array = rigid_matrix_vector.Rigid3Array

StructOfArray = struct_of_array.StructOfArray

Vec3Array = vector.Vec3Array
square_euclidean_distance = vector.square_euclidean_distance
euclidean_distance = vector.euclidean_distance
dihedral_angle = vector.dihedral_angle
dot = vector.dot
cross = vector.cross


================================================
FILE: src/alphafold3/jax/geometry/rigid_matrix_vector.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Rigid3Array Transformations represented by a Matrix and a Vector."""

from typing import Any, Final, Self, TypeAlias

from alphafold3.jax.geometry import rotation_matrix
from alphafold3.jax.geometry import struct_of_array
from alphafold3.jax.geometry import utils
from alphafold3.jax.geometry import vector
import jax
import jax.numpy as jnp


Float: TypeAlias = float | jnp.ndarray

VERSION: Final[str] = '0.1'


# Disabling name in pylint, since the relevant variable in math are typically
# referred to as X, Y in mathematical literature.
def _compute_covariance_matrix(
    row_values: vector.Vec3Array,
    col_values: vector.Vec3Array,
    weights: jnp.ndarray,
    epsilon=1e-6,
) -> jnp.ndarray:
  """Compute covariance matrix.

  The quantity computes is
  cov_xy = weighted_avg_i(row_values[i, x] col_values[j, y]).
  Here x and y run over the xyz coordinates.
  This is used to construct frames when aligning points.

  Args:
    row_values: Values used for rows of covariance matrix, shape [..., n_point]
    col_values: Values used for columns of covariance matrix, shape [...,
      n_point]
    weights: weights to weight points by, shape broacastable to [...]
    epsilon: small value to add to denominator to avoid Nan's when all weights
      are 0.

  Returns:
    Covariance Matrix as [..., 3, 3] array.
  """
  weights = jnp.asarray(weights)
  weights = jnp.broadcast_to(weights, row_values.shape)

  out = []

  normalized_weights = weights / (weights.sum(axis=-1, keepdims=True) + epsilon)

  weighted_average = lambda x: jnp.sum(normalized_weights * x, axis=-1)

  out.append(
      jnp.stack(
          (
              weighted_average(row_values.x * col_values.x),
              weighted_average(row_values.x * col_values.y),
              weighted_average(row_values.x * col_values.z),
          ),
          axis=-1,
      )
  )

  out.append(
      jnp.stack(
          (
              weighted_average(row_values.y * col_values.x),
              weighted_average(row_values.y * col_values.y),
              weighted_average(row_values.y * col_values.z),
          ),
          axis=-1,
      )
  )

  out.append(
      jnp.stack(
          (
              weighted_average(row_values.z * col_values.x),
              weighted_average(row_values.z * col_values.y),
              weighted_average(row_values.z * col_values.z),
          ),
          axis=-1,
      )
  )

  return jnp.stack(out, axis=-2)


@struct_of_array.StructOfArray(same_dtype=True)
class Rigid3Array:
  """Rigid Transformation, i.e. element of special euclidean group."""

  rotation: rotation_matrix.Rot3Array
  translation: vector.Vec3Array

  def __matmul__(self, other: Self) -> Self:
    new_rotation = self.rotation @ other.rotation
    new_translation = self.apply_to_point(other.translation)
    return Rigid3Array(new_rotation, new_translation)

  def inverse(self) -> Self:
    """Return Rigid3Array corresponding to inverse transform."""
    inv_rotation = self.rotation.inverse()
    inv_translation = inv_rotation.apply_to_point(-self.translation)
    return Rigid3Array(inv_rotation, inv_translation)

  def apply_to_point(self, point: vector.Vec3Array) -> vector.Vec3Array:
    """Apply Rigid3Array transform to point."""
    return self.rotation.apply_to_point(point) + self.translation

  def apply_inverse_to_point(self, point: vector.Vec3Array) -> vector.Vec3Array:
    """Apply inverse Rigid3Array transform to point."""
    new_point = point - self.translation
    return self.rotation.apply_inverse_to_point(new_point)

  def compose_rotation(self, other_rotation: rotation_matrix.Rot3Array) -> Self:
    rot = self.rotation @ other_rotation
    trans = jax.tree.map(
        lambda x: jnp.broadcast_to(x, rot.shape), self.translation
    )
    return Rigid3Array(rot, trans)

  @classmethod
  def identity(cls, shape: Any, dtype: jnp.dtype = jnp.float32) -> Self:
    """Return identity Rigid3Array of given shape."""
    return cls(
        rotation_matrix.Rot3Array.identity(shape, dtype=dtype),
        vector.Vec3Array.zeros(shape, dtype=dtype),
    )  # pytype: disable=wrong-arg-count  # trace-all-classes

  def scale_translation(self, factor: Float) -> Self:
    """Scale translation in Rigid3Array by 'factor'."""
    return Rigid3Array(self.rotation, self.translation * factor)

  def to_array(self):
    rot_array = self.rotation.to_array()
    vec_array = self.translation.to_array()
    return jnp.concatenate([rot_array, vec_array[..., None]], axis=-1)

  @classmethod
  def from_array(cls, array):
    rot = rotation_matrix.Rot3Array.from_array(array[..., :3])
    vec = vector.Vec3Array.from_array(array[..., -1])
    return cls(rot, vec)  # pytype: disable=wrong-arg-count  # trace-all-classes

  @classmethod
  def from_array4x4(cls, array: jnp.ndarray) -> Self:
    """Construct Rigid3Array from homogeneous 4x4 array."""
    if array.shape[-2:] != (4, 4):
      raise ValueError(f'array.shape({array.shape}) must be [..., 4, 4]')
    rotation = rotation_matrix.Rot3Array(
        *(array[..., 0, 0], array[..., 0, 1], array[..., 0, 2]),
        *(array[..., 1, 0], array[..., 1, 1], array[..., 1, 2]),
        *(array[..., 2, 0], array[..., 2, 1], array[..., 2, 2]),
    )
    translation = vector.Vec3Array(
        array[..., 0, 3], array[..., 1, 3], array[..., 2, 3]
    )
    return cls(rotation, translation)  # pytype: disable=wrong-arg-count  # trace-all-classes

  @classmethod
  def from_point_alignment(
      cls,
      points_to: vector.Vec3Array,
      points_from: vector.Vec3Array,
      weights: Float | None = None,
      epsilon: float = 1e-6,
  ) -> Self:
    """Constructs Rigid3Array by finding transform aligning points.

    This constructs the optimal Rigid Transform taking points_from to the
    arrangement closest to points_to.

    Args:
      points_to: Points to align to.
      points_from: Points to align from.
      weights: weights for points.
      epsilon: epsilon used to regularize covariance matrix.

    Returns:
      Rigid Transform.
    """
    if weights is None:
      weights = 1.0

    def compute_center(value):
      return utils.weighted_mean(value=value, weights=weights, axis=-1)

    points_to_center = jax.tree.map(compute_center, points_to)
    points_from_center = jax.tree.map(compute_center, points_from)
    centered_points_to = points_to - points_to_center[..., None]
    centered_points_from = points_from - points_from_center[..., None]
    cov_mat = _compute_covariance_matrix(
        centered_points_to,
        centered_points_from,
        weights=weights,
        epsilon=epsilon,
    )
    rots = rotation_matrix.Rot3Array.from_svd(
        jnp.reshape(cov_mat, cov_mat.shape[:-2] + (9,))
    )

    translations = points_to_center - rots.apply_to_point(points_from_center)

    return cls(rots, translations)  # pytype: disable=wrong-arg-count  # trace-all-classes

  def __getstate__(self):
    return (VERSION, (self.rotation, self.translation))

  def __setstate__(self, state):
    version, (rot, trans) = state
    del version
    object.__setattr__(self, 'rotation', rot)
    object.__setattr__(self, 'translation', trans)


================================================
FILE: src/alphafold3/jax/geometry/rotation_matrix.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Rot3Array Matrix Class."""

import dataclasses
from typing import Any, Final, Self

from alphafold3.jax.geometry import struct_of_array
from alphafold3.jax.geometry import utils
from alphafold3.jax.geometry import vector
import jax
import jax.numpy as jnp
import numpy as np


COMPONENTS: Final[tuple[str, ...]] = (
    *('xx', 'xy', 'xz'),
    *('yx', 'yy', 'yz'),
    *('zx', 'zy', 'zz'),
)
VERSION: Final[str] = '0.1'


def make_matrix_svd_factors() -> np.ndarray:
  """Generates factors for converting 3x3 matrix to symmetric 4x4 matrix."""
  factors = np.zeros((16, 9), dtype=np.float32)

  factors[0, [0, 4, 8]] = 1.0

  factors[[1, 4], 5] = 1.0
  factors[[1, 4], 7] = -1.0

  factors[[2, 8], 6] = 1.0
  factors[[2, 8], 2] = -1.0

  factors[[3, 12], 1] = 1.0
  factors[[3, 12], 3] = -1.0

  factors[5, 0] = 1.0
  factors[5, [4, 8]] = -1.0

  factors[[6, 9], 1] = 1.0
  factors[[6, 9], 3] = 1.0

  factors[[7, 13], 2] = 1.0
  factors[[7, 13], 6] = 1.0

  factors[10, 4] = 1.0
  factors[10, [0, 8]] = -1.0

  factors[[11, 14], 5] = 1.0
  factors[[11, 14], 7] = 1.0

  factors[15, 8] = 1.0
  factors[15, [0, 4]] = -1.0

  return factors


@jax.custom_jvp
def largest_evec(m):
  _, eigvecs = jnp.linalg.eigh(m)
  return eigvecs[..., -1]


def largest_evec_jvp(primals, tangents):
  """jvp for largest eigenvector."""
  (m,) = primals
  (t,) = tangents
  eigvals, eigvecs = jnp.linalg.eigh(m)
  large_eigvec = eigvecs[..., -1]
  large_eigval = eigvals[..., -1]
  other_eigvals = eigvals[..., :-1]
  other_eigvecs = eigvecs[..., :-1]
  other_ev_times_tangent = jnp.einsum(
      '...aj,...ab -> ...bj',
      other_eigvecs,
      t,
      precision=jax.lax.Precision.HIGHEST,
  )
  nominator = jnp.einsum(
      '...bj,...b -> ...j',
      other_ev_times_tangent,
      large_eigvec,
      precision=jax.lax.Precision.HIGHEST,
  )
  prefactor = nominator / jnp.maximum(
      large_eigval[..., None] - other_eigvals, 1e-6
  )
  grad = jnp.sum(prefactor[..., None, :] * other_eigvecs, axis=-1)
  return large_eigvec, grad


largest_evec.defjvp(largest_evec_jvp)


MATRIX_SVD_QUAT_FACTORS = make_matrix_svd_factors()


@struct_of_array.StructOfArray(same_dtype=True)
class Rot3Array:
  """Rot3Array Matrix in 3 dimensional Space implemented as struct of arrays."""

  xx: jnp.ndarray = dataclasses.field(metadata={'dtype': jnp.float32})
  xy: jnp.ndarray
  xz: jnp.ndarray
  yx: jnp.ndarray
  yy: jnp.ndarray
  yz: jnp.ndarray
  zx: jnp.ndarray
  zy: jnp.ndarray
  zz: jnp.ndarray

  __array_ufunc__ = None

  def inverse(self) -> Self:
    """Returns inverse of Rot3Array."""
    return Rot3Array(
        *(self.xx, self.yx, self.zx),
        *(self.xy, self.yy, self.zy),
        *(self.xz, self.yz, self.zz),
    )

  def apply_to_point(self, point: vector.Vec3Array) -> vector.Vec3Array:
    """Applies Rot3Array to point."""
    return vector.Vec3Array(
        self.xx * point.x + self.xy * point.y + self.xz * point.z,
        self.yx * point.x + self.yy * point.y + self.yz * point.z,
        self.zx * point.x + self.zy * point.y + self.zz * point.z,
    )

  def apply_inverse_to_point(self, point: vector.Vec3Array) -> vector.Vec3Array:
    """Applies inverse Rot3Array to point."""
    return self.inverse().apply_to_point(point)

  def __matmul__(self, other: Self) -> Self:
    """Composes two Rot3Arrays."""
    c0 = self.apply_to_point(vector.Vec3Array(other.xx, other.yx, other.zx))
    c1 = self.apply_to_point(vector.Vec3Array(other.xy, other.yy, other.zy))
    c2 = self.apply_to_point(vector.Vec3Array(other.xz, other.yz, other.zz))
    return Rot3Array(c0.x, c1.x, c2.x, c0.y, c1.y, c2.y, c0.z, c1.z, c2.z)

  @classmethod
  def identity(cls, shape: Any, dtype: jnp.dtype = jnp.float32) -> Self:
    """Returns identity of given shape."""
    ones = jnp.ones(shape, dtype=dtype)
    zeros = jnp.zeros(shape, dtype=dtype)
    return cls(ones, zeros, zeros, zeros, ones, zeros, zeros, zeros, ones)  # pytype: disable=wrong-arg-count  # trace-all-classes

  @classmethod
  def from_two_vectors(cls, e0: vector.Vec3Array, e1: vector.Vec3Array) -> Self:
    """Construct Rot3Array from two Vectors.

    Rot3Array is constructed such that in the corresponding frame 'e0' lies on
    the positive x-Axis and 'e1' lies in the xy plane with positive sign of y.

    Args:
      e0: Vector
      e1: Vector

    Returns:
      Rot3Array
    """
    # Normalize the unit vector for the x-axis, e0.
    e0 = e0.normalized()
    # make e1 perpendicular to e0.
    c = e1.dot(e0)
    e1 = (e1 - c * e0).normalized()
    # Compute e2 as cross product of e0 and e1.
    e2 = e0.cross(e1)
    return cls(e0.x, e1.x, e2.x, e0.y, e1.y, e2.y, e0.z, e1.z, e2.z)  # pytype: disable=wrong-arg-count  # trace-all-classes

  @classmethod
  def from_array(cls, array: jnp.ndarray) -> Self:
    """Construct Rot3Array Matrix from array of shape. [..., 3, 3]."""
    unstacked = utils.unstack(array, axis=-2)
    unstacked = sum([utils.unstack(x, axis=-1) for x in unstacked], [])
    return cls(*unstacked)

  def to_array(self) -> jnp.ndarray:
    """Convert Rot3Array to array of shape [..., 3, 3]."""
    return jnp.stack(
        [
            jnp.stack([self.xx, self.xy, self.xz], axis=-1),
            jnp.stack([self.yx, self.yy, self.yz], axis=-1),
            jnp.stack([self.zx, self.zy, self.zz], axis=-1),
        ],
        axis=-2,
    )

  @classmethod
  def from_quaternion(
      cls,
      w: jnp.ndarray,
      x: jnp.ndarray,
      y: jnp.ndarray,
      z: jnp.ndarray,
      normalize: bool = True,
      epsilon: float = 1e-6,
  ) -> Self:
    """Construct Rot3Array from components of quaternion."""
    if normalize:
      inv_norm = jax.lax.rsqrt(jnp.maximum(epsilon, w**2 + x**2 + y**2 + z**2))
      w *= inv_norm
      x *= inv_norm
      y *= inv_norm
      z *= inv_norm
    xx = 1 - 2 * (jnp.square(y) + jnp.square(z))
    xy = 2 * (x * y - w * z)
    xz = 2 * (x * z + w * y)
    yx = 2 * (x * y + w * z)
    yy = 1 - 2 * (jnp.square(x) + jnp.square(z))
    yz = 2 * (y * z - w * x)
    zx = 2 * (x * z - w * y)
    zy = 2 * (y * z + w * x)
    zz = 1 - 2 * (jnp.square(x) + jnp.square(y))
    return cls(xx, xy, xz, yx, yy, yz, zx, zy, zz)  # pytype: disable=wrong-arg-count  # trace-all-classes

  @classmethod
  def from_svd(cls, mat: jnp.ndarray, use_quat_formula: bool = True) -> Self:
    """Constructs Rot3Array from arbitrary array of shape [3 * 3] using SVD.

    The case when 'use_quat_formula' is False rephrases the problem of
    projecting the matrix to a rotation matrix as a problem of finding the
    largest eigenvector of a certain 4x4 matrix. This has the advantage of
    having fewer numerical issues.
    This approach follows:
    https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.65.971&rep=rep1&type=pdf
    In the other case we construct it via svd following
    https://arxiv.org/pdf/2006.14616.pdf
    In that case [∂L/∂M] is large if the two smallest singular values are close
    to each other, or if they are close to 0.

    Args:
      mat: Array of shape [..., 3 * 3]
      use_quat_formula: Whether to construct matrix via 4x4 eigenvalue problem.

    Returns:
      Rot3Array of shape [...]
    """
    assert mat.shape[-1] == 9
    if use_quat_formula:
      symmetric_4by4 = jnp.einsum(
          'ji, ...i -> ...j',
          MATRIX_SVD_QUAT_FACTORS,
          mat,
          precision=jax.lax.Precision.HIGHEST,
      )
      symmetric_4by4 = jnp.reshape(symmetric_4by4, mat.shape[:-1] + (4, 4))
      largest_eigvec = largest_evec(symmetric_4by4)
      return cls.from_quaternion(
          *utils.unstack(largest_eigvec, axis=-1)
      ).inverse()

    else:
      mat = jnp.reshape(mat, mat.shape[:-1] + (3, 3))
      u, _, v_t = jnp.linalg.svd(mat, full_matrices=False)
      det_uv_t = jnp.linalg.det(
          jnp.matmul(u, v_t, precision=jax.lax.Precision.HIGHEST)
      )
      ones = jnp.ones_like(det_uv_t)
      diag_array = jnp.stack([ones, ones, det_uv_t], axis=-1)
      # This is equivalent to making diag_array into a diagonal array and matrix
      # multiplying
      diag_times_v_t = diag_array[..., None] * v_t
      out = jnp.matmul(u, diag_times_v_t, precision=jax.lax.Precision.HIGHEST)
      return cls.from_array(out)

  @classmethod
  def random_uniform(cls, key, shape, dtype=jnp.float32) -> Self:
    """Samples uniform random Rot3Array according to Haar Measure."""
    quat_array = jax.random.normal(key, tuple(shape) + (4,), dtype=dtype)
    quats = utils.unstack(quat_array)
    return cls.from_quaternion(*quats)

  def __getstate__(self):
    return (VERSION, [np.asarray(getattr(self, field)) for field in COMPONENTS])

  def __setstate__(self, state):
    version, state = state
    del version
    for i, field in enumerate(COMPONENTS):
      object.__setattr__(self, field, state[i])


================================================
FILE: src/alphafold3/jax/geometry/struct_of_array.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Class decorator to represent (nested) struct of arrays."""

import dataclasses

import jax


def get_item(instance, key):
  sliced = {}
  for field in get_array_fields(instance):
    num_trailing_dims = field.metadata.get('num_trailing_dims', 0)
    this_key = key
    if isinstance(key, tuple) and Ellipsis in this_key:
      this_key += (slice(None),) * num_trailing_dims
    sliced[field.name] = jax.tree.map(
        lambda x: x[this_key],  # pylint: disable=cell-var-from-loop
        getattr(instance, field.name),
    )
  return dataclasses.replace(instance, **sliced)


@property
def get_shape(instance):
  """Returns Shape for given instance of dataclass."""
  first_field = dataclasses.fields(instance)[0]
  num_trailing_dims = first_field.metadata.get('num_trailing_dims', None)
  value = getattr(instance, first_field.name)
  if num_trailing_dims:
    return value.shape[:-num_trailing_dims]
  else:
    return value.shape


def get_len(instance):
  """Returns length for given instance of dataclass."""
  shape = instance.shape
  if shape:
    return shape[0]
  else:
    raise TypeError('len() of unsized object')  # Match jax.numpy behavior.


@property
def get_dtype(instance):
  """Returns Dtype for given instance of dataclass."""
  fields = dataclasses.fields(instance)
  sets_dtype = [
      field.name for field in fields if field.metadata.get('sets_dtype', False)
  ]
  if sets_dtype:
    assert len(sets_dtype) == 1, 'at most field can set dtype'
    field_value = getattr(instance, sets_dtype[0])
  elif instance.same_dtype:
    field_value = getattr(instance, fields[0].name)
  else:
    # Should this be Value Error?
    raise AttributeError(
        'Trying to access Dtype on Struct of Array without'
        'either "same_dtype" or field setting dtype'
    )

  if hasattr(field_value, 'dtype'):
    return field_value.dtype
  else:
    # Should this be Value Error?
    raise AttributeError(f'field_value {field_value} does not have dtype')


def replace(instance, **kwargs):
  return dataclasses.replace(instance, **kwargs)


def post_init(instance):
  """Validate instance has same shapes & dtypes."""
  array_fields = get_array_fields(instance)
  arrays = list(get_array_fields(instance, return_values=True).values())
  first_field = array_fields[0]
  # These slightly weird constructions about checking whether the leaves are
  # actual arrays is since e.g. vmap internally relies on being able to
  # construct pytree's with object() as leaves, this would break the checking
  # as such we are only validating the object when the entries in the dataclass
  # Are arrays or other dataclasses of arrays.
  try:
    dtype = instance.dtype
  except AttributeError:
    dtype = None
  if dtype is not None:
    first_shape = instance.shape
    for array, field in zip(arrays, array_fields, strict=True):
      num_trailing_dims = field.metadata.get('num_trailing_dims', None)
      if num_trailing_dims:
        array_shape = array.shape
        field_shape = array_shape[:-num_trailing_dims]
        msg = (
            f'field {field} should have number of trailing dims'
            ' {num_trailing_dims}'
        )
        assert len(array_shape) == len(first_shape) + num_trailing_dims, msg
      else:
        field_shape = array.shape

      shape_msg = (
          f"Stripped Shape {field_shape} of field {field} doesn't "
          f'match shape {first_shape} of field {first_field}'
      )
      assert field_shape == first_shape, shape_msg

      field_dtype = array.dtype

      allowed_metadata_dtypes = field.metadata.get('allowed_dtypes', [])
      if allowed_metadata_dtypes:
        msg = f'Dtype is {field_dtype} but must be in {allowed_metadata_dtypes}'
        assert field_dtype in allowed_metadata_dtypes, msg

      if 'dtype' in field.metadata:
        target_dtype = field.metadata['dtype']
      else:
        target_dtype = dtype

      msg = f'Dtype is {field_dtype} but must be {target_dtype}'
      assert field_dtype == target_dtype, msg


def flatten(instance):
  """Flatten Struct of Array instance."""
  array_likes = get_array_fields(instance, return_values=True).values()
  flat_array_likes = []
  inner_treedefs = []
  num_arrays = []
  for array_like in array_likes:
    flat_array_like, inner_treedef = jax.tree_util.tree_flatten(array_like)
    inner_treedefs.append(inner_treedef)
    flat_array_likes += flat_array_like
    num_arrays.append(len(flat_array_like))
  metadata = get_metadata_fields(instance, return_values=True)
  metadata = type(instance).metadata_cls(**metadata)
  return flat_array_likes, (inner_treedefs, metadata, num_arrays)


def make_metadata_class(cls):
  metadata_fields = get_fields(
      cls, lambda x: x.metadata.get('is_metadata', False)
  )
  metadata_cls = dataclasses.make_dataclass(
      cls_name='Meta' + cls.__name__,
      fields=[(field.name, field.type, field) for field in metadata_fields],
      frozen=True,
      eq=True,
  )
  return metadata_cls


def get_fields(cls_or_instance, filterfn, return_values=False):
  fields = dataclasses.fields(cls_or_instance)
  fields = [field for field in fields if filterfn(field)]
  if return_values:
    return {
        field.name: getattr(cls_or_instance, field.name) for field in fields
    }
  else:
    return fields


def get_array_fields(cls, return_values=False):
  return get_fields(
      cls,
      lambda x: not x.metadata.get('is_metadata', False),
      return_values=return_values,
  )


def get_metadata_fields(cls, return_values=False):
  return get_fields(
      cls,
      lambda x: x.metadata.get('is_metadata', False),
      return_values=return_values,
  )


class StructOfArray:
  """Class Decorator for Struct Of Arrays."""

  def __init__(self, same_dtype=True):
    self.same_dtype = same_dtype

  def __call__(self, cls):
    cls.__array_ufunc__ = None
    cls.replace = replace
    cls.same_dtype = self.same_dtype
    cls.dtype = get_dtype
    cls.shape = get_shape
    cls.__len__ = get_len
    cls.__getitem__ = get_item
    cls.__post_init__ = post_init
    new_cls = dataclasses.dataclass(cls, frozen=True, eq=False)  # pytype: disable=wrong-keyword-args
    # pytree claims to require metadata to be hashable, not sure why,
    # But making derived dataclass that can just hold metadata
    new_cls.metadata_cls = make_metadata_class(new_cls)

    def unflatten(aux, data):
      inner_treedefs, metadata, num_arrays = aux
      array_fields = [field.name for field in get_array_fields(new_cls)]
      value_dict = {}
      array_start = 0
      for num_array, inner_treedef, array_field in zip(
          num_arrays, inner_treedefs, array_fields, strict=True
      ):
        value_dict[array_field] = jax.tree_util.tree_unflatten(
            inner_treedef, data[array_start : array_start + num_array]
        )
        array_start += num_array
      metadata_fields = get_metadata_fields(new_cls)
      for field in metadata_fields:
        value_dict[field.name] = getattr(metadata, field.name)

      return new_cls(**value_dict)

    jax.tree_util.register_pytree_node(
        nodetype=new_cls, flatten_func=flatten, unflatten_func=unflatten
    )
    return new_cls


================================================
FILE: src/alphafold3/jax/geometry/utils.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utils for geometry library."""

from collections.abc import Iterable
import numbers

import jax.numpy as jnp


def unstack(value: jnp.ndarray, axis: int = -1) -> list[jnp.ndarray]:
  return [
      jnp.squeeze(v, axis=axis)
      for v in jnp.split(value, value.shape[axis], axis=axis)
  ]


def angdiff(alpha: jnp.ndarray, beta: jnp.ndarray) -> jnp.ndarray:
  """Compute absolute difference between two angles."""
  d = alpha - beta
  d = (d + jnp.pi) % (2 * jnp.pi) - jnp.pi
  return d


def weighted_mean(
    *,
    weights: jnp.ndarray,
    value: jnp.ndarray,
    axis: int | Iterable[int] | None = None,
    eps: float = 1e-10,
) -> jnp.ndarray:
  """Computes weighted mean in a safe way that avoids NaNs.

  This is equivalent to jnp.average for the case eps=0.0, but adds a small
  constant to the denominator of the weighted average to avoid NaNs.
  'weights' should be broadcastable to the shape of value.

  Args:
    weights: Weights to weight value by.
    value: Values to average
    axis: Axes to average over.
    eps: Epsilon to add to the denominator.

  Returns:
    Weighted average.
  """

  weights = jnp.asarray(weights, dtype=value.dtype)
  weights = jnp.broadcast_to(weights, value.shape)

  weights_shape = weights.shape

  if isinstance(axis, numbers.Integral):
    axis = [axis]
  elif axis is None:
    axis = list(range(len(weights_shape)))

  return jnp.sum(weights * value, axis=axis) / (
      jnp.sum(weights, axis=axis) + eps
  )


================================================
FILE: src/alphafold3/jax/geometry/vector.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Vec3Array Class."""

import dataclasses
from typing import Final, Self, TypeAlias

from alphafold3.jax.geometry import struct_of_array
from alphafold3.jax.geometry import utils
import jax
import jax.numpy as jnp
import numpy as np


Float: TypeAlias = float | jnp.ndarray

VERSION: Final[str] = '0.1'


@struct_of_array.StructOfArray(same_dtype=True)
class Vec3Array:
  """Vec3Array in 3 dimensional Space implemented as struct of arrays.

  This is done in order to improve performance and precision.
  On TPU small matrix multiplications are very suboptimal and will waste large
  compute ressources, furthermore any matrix multiplication on TPU happens in
  mixed bfloat16/float32 precision, which is often undesirable when handling
  physical coordinates.

  In most cases this will also be faster on CPUs/GPUs since it allows for easier
  use of vector instructions.
  """

  x: jnp.ndarray = dataclasses.field(metadata={'dtype': jnp.float32})
  y: jnp.ndarray
  z: jnp.ndarray

  def __post_init__(self):
    if hasattr(self.x, 'dtype'):
      if not self.x.dtype == self.y.dtype == self.z.dtype:
        raise ValueError(
            f'Type mismatch: {self.x.dtype}, {self.y.dtype}, {self.z.dtype}'
        )
      if not self.x.shape == self.y.shape == self.z.shape:
        raise ValueError(
            f'Shape mismatch: {self.x.shape}, {self.y.shape}, {self.z.shape}'
        )

  def __add__(self, other: Self) -> Self:
    return jax.tree.map(lambda x, y: x + y, self, other)

  def __sub__(self, other: Self) -> Self:
    return jax.tree.map(lambda x, y: x - y, self, other)

  def __mul__(self, other: Float) -> Self:
    return jax.tree.map(lambda x: x * other, self)

  def __rmul__(self, other: Float) -> Self:
    return self * other

  def __truediv__(self, other: Float) -> Self:
    return jax.tree.map(lambda x: x / other, self)

  def __neg__(self) -> Self:
    return jax.tree.map(lambda x: -x, self)

  def __pos__(self) -> Self:
    return jax.tree.map(lambda x: x, self)

  def cross(self, other: Self) -> Self:
    """Compute cross product between 'self' and 'other'."""
    new_x = self.y * other.z - self.z * other.y
    new_y = self.z * other.x - self.x * other.z
    new_z = self.x * other.y - self.y * other.x
    return Vec3Array(new_x, new_y, new_z)

  def dot(self, other: Self) -> Float:
    """Compute dot product between 'self' and 'other'."""
    return self.x * other.x + self.y * other.y + self.z * other.z

  def norm(self, epsilon: float = 1e-6) -> Float:
    """Compute Norm of Vec3Array, clipped to epsilon."""
    # To avoid NaN on the backward pass, we must use maximum before the sqrt
    norm2 = self.dot(self)
    if epsilon:
      norm2 = jnp.maximum(norm2, epsilon**2)
    return jnp.sqrt(norm2)

  def norm2(self):
    return self.dot(self)

  def normalized(self, epsilon: float = 1e-6) -> Self:
    """Return unit vector with optional clipping."""
    return self / self.norm(epsilon)

  @classmethod
  def zeros(cls, shape, dtype=jnp.float32):
    """Return Vec3Array corresponding to zeros of given shape."""
    return cls(
        jnp.zeros(shape, dtype),
        jnp.zeros(shape, dtype),
        jnp.zeros(shape, dtype),
    )  # pytype: disable=wrong-arg-count  # trace-all-classes

  def to_array(self) -> jnp.ndarray:
    return jnp.stack([self.x, self.y, self.z], axis=-1)

  @classmethod
  def from_array(cls, array):
    return cls(*utils.unstack(array))

  def __getstate__(self):
    return (
        VERSION,
        [np.asarray(self.x), np.asarray(self.y), np.asarray(self.z)],
    )

  def __setstate__(self, state):
    version, state = state
    del version
    for i, letter in enumerate('xyz'):
      object.__setattr__(self, letter, state[i])


def square_euclidean_distance(
    vec1: Vec3Array, vec2: Vec3Array, epsilon: float = 1e-6
) -> Float:
  """Computes square of euclidean distance between 'vec1' and 'vec2'.

  Args:
    vec1: Vec3Array to compute  distance to
    vec2: Vec3Array to compute  distance from, should be broadcast compatible
      with 'vec1'
    epsilon: distance is clipped from below to be at least epsilon

  Returns:
    Array of square euclidean distances;
    shape will be result of broadcasting 'vec1' and 'vec2'
  """
  difference = vec1 - vec2
  distance = difference.dot(difference)
  if epsilon:
    distance = jnp.maximum(distance, epsilon)
  return distance


def dot(vector1: Vec3Array, vector2: Vec3Array) -> Float:
  return vector1.dot(vector2)


def cross(vector1: Vec3Array, vector2: Vec3Array) -> Float:
  return vector1.cross(vector2)


def norm(vector: Vec3Array, epsilon: float = 1e-6) -> Float:
  return vector.norm(epsilon)


def normalized(vector: Vec3Array, epsilon: float = 1e-6) -> Vec3Array:
  return vector.normalized(epsilon)


def euclidean_distance(
    vec1: Vec3Array, vec2: Vec3Array, epsilon: float = 1e-6
) -> Float:
  """Computes euclidean distance between 'vec1' and 'vec2'.

  Args:
    vec1: Vec3Array to compute euclidean distance to
    vec2: Vec3Array to compute euclidean distance from, should be broadcast
      compatible with 'vec1'
    epsilon: distance is clipped from below to be at least epsilon

  Returns:
    Array of euclidean distances;
    shape will be result of broadcasting 'vec1' and 'vec2'
  """
  distance_sq = square_euclidean_distance(vec1, vec2, epsilon**2)
  distance = jnp.sqrt(distance_sq)
  return distance


def dihedral_angle(
    a: Vec3Array, b: Vec3Array, c: Vec3Array, d: Vec3Array
) -> Float:
  """Computes torsion angle for a quadruple of points.

  For points (a, b, c, d), this is the angle between the planes defined by
  points (a, b, c) and (b, c, d). It is also known as the dihedral angle.

  Arguments:
    a: A Vec3Array of coordinates.
    b: A Vec3Array of coordinates.
    c: A Vec3Array of coordinates.
    d: A Vec3Array of coordinates.

  Returns:
    A tensor of angles in radians: [-pi, pi].
  """
  v1 = a - b
  v2 = b - c
  v3 = d - c

  c1 = v1.cross(v2)
  c2 = v3.cross(v2)
  c3 = c2.cross(c1)

  v2_mag = v2.norm()
  return jnp.arctan2(c3.dot(v2), v2_mag * c1.dot(c2))


def random_gaussian_vector(shape, key, dtype=jnp.float32) -> Vec3Array:
  vec_array = jax.random.normal(key, shape + (3,), dtype)
  return Vec3Array.from_array(vec_array)


================================================
FILE: src/alphafold3/model/atom_layout/atom_layout.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Helper functions for different atom layouts and conversion between them."""

import collections
from collections.abc import Mapping, Sequence
import dataclasses
import types
from typing import Any, TypeAlias

from alphafold3 import structure
from alphafold3.constants import atom_types
from alphafold3.constants import chemical_component_sets
from alphafold3.constants import chemical_components
from alphafold3.constants import mmcif_names
from alphafold3.constants import residue_names
from alphafold3.data.tools import rdkit_utils
from alphafold3.structure import chemical_components as struc_chem_comps
import jax.numpy as jnp
import numpy as np
from rdkit import Chem


xnp_ndarray: TypeAlias = np.ndarray | jnp.ndarray  # pylint: disable=invalid-name
NumpyIndex: TypeAlias = Any


@dataclasses.dataclass(frozen=True)
class AtomLayout:
  """Atom layout in a fixed shape (usually 1-dim or 2-dim).

  Examples for atom layouts are atom37, atom14, and similar.
  All members are np.ndarrays with the same shape, e.g.
  - [num_atoms]
  - [num_residues, max_atoms_per_residue]
  - [num_fragments, max_fragments_per_residue]
  All string arrays should have dtype=object to avoid pitfalls with Numpy's
  fixed-size strings

  Attributes:
    atom_name: np.ndarray of str: atom names (e.g. 'CA', 'NE2'), padding
      elements have an empty string (''), None or any other value, that maps to
      False for .astype(bool). mmCIF field: _atom_site.label_atom_id.
    res_id: np.ndarray of int: residue index (usually starting from 1) padding
      elements can have an arbitrary value. mmCIF field:
      _atom_site.label_seq_id.
    chain_id: np.ndarray of str: chain names (e.g. 'A', 'B') padding elements
      can have an arbitrary value. mmCIF field: _atom_site.label_seq_id.
    atom_element: np.ndarray of str: atom elements (e.g. 'C', 'N', 'O'), padding
      elements have an empty string (''), None or any other value, that maps to
      False for .astype(bool). mmCIF field: _atom_site.type_symbol.
    res_name: np.ndarray of str: residue names (e.g. 'ARG', 'TRP') padding
      elements can have an arbitrary value. mmCIF field:
      _atom_site.label_comp_id.
    chain_type: np.ndarray of str: chain types (e.g. 'polypeptide(L)'). padding
      elements can have an arbitrary value. mmCIF field: _entity_poly.type OR
      _entity.type (for non-polymers).
    shape: shape of the layout (just returns atom_name.shape)
  """

  atom_name: np.ndarray
  res_id: np.ndarray
  chain_id: np.ndarray
  atom_element: np.ndarray | None = None
  res_name: np.ndarray | None = None
  chain_type: np.ndarray | None = None

  def __post_init__(self):
    """Assert all arrays have the same shape."""
    attribute_names = (
        'atom_name',
        'atom_element',
        'res_name',
        'res_id',
        'chain_id',
        'chain_type',
    )
    _assert_all_arrays_have_same_shape(
        obj=self,
        expected_shape=self.atom_name.shape,
        attribute_names=attribute_names,
    )
    # atom_name must have dtype object, such that we can convert it to bool to
    # obtain the mask
    if self.atom_name.dtype != object:
      raise ValueError(
          'atom_name must have dtype object, such that it can '
          'be converted converted to bool to obtain the mask'
      )

  def __getitem__(self, key: NumpyIndex) -> 'AtomLayout':
    return AtomLayout(
        atom_name=self.atom_name[key],
        res_id=self.res_id[key],
        chain_id=self.chain_id[key],
        atom_element=(
            self.atom_element[key] if self.atom_element is not None else None
        ),
        res_name=(self.res_name[key] if self.res_name is not None else None),
        chain_type=(
            self.chain_type[key] if self.chain_type is not None else None
        ),
    )

  def __eq__(self, other: 'AtomLayout') -> bool:
    if not np.array_equal(self.atom_name, other.atom_name):
      return False

    mask = self.atom_name.astype(bool)
    # Check essential fields.
    for field in ('res_id', 'chain_id'):
      my_arr = getattr(self, field)
      other_arr = getattr(other, field)
      if not np.array_equal(my_arr[mask], other_arr[mask]):
        return False

    # Check optional fields.
    for field in ('atom_element', 'res_name', 'chain_type'):
      my_arr = getattr(self, field)
      other_arr = getattr(other, field)
      if (
          my_arr is not None
          and other_arr is not None
          and not np.array_equal(my_arr[mask], other_arr[mask])
      ):
        return False

    return True

  def copy_and_pad_to(self, shape: tuple[int, ...]) -> 'AtomLayout':
    """Copies and pads the layout to the requested shape.

    Args:
      shape: new shape for the atom layout

    Returns:
      a copy of the atom layout padded to the requested shape

    Raises:
      ValueError: incompatible shapes.
    """
    if len(shape) != len(self.atom_name.shape):
      raise ValueError(
          f'Incompatible shape {shape}. Current layout has shape {self.shape}.'
      )
    if any(new < old for old, new in zip(self.atom_name.shape, shape)):
      raise ValueError(
          "Can't pad to a smaller shape. Current layout has shape "
          f'{self.shape} and you requested shape {shape}.'
      )
    pad_width = [
        (0, new - old) for old, new in zip(self.atom_name.shape, shape)
    ]
    pad_val = np.array('', dtype=object)
    return AtomLayout(
        atom_name=np.pad(self.atom_name, pad_width, constant_values=pad_val),
        res_id=np.pad(self.res_id, pad_width, constant_values=0),
        chain_id=np.pad(self.chain_id, pad_width, constant_values=pad_val),
        atom_element=(
            np.pad(self.atom_element, pad_width, constant_values=pad_val)
            if self.atom_element is not None
            else None
        ),
        res_name=(
            np.pad(self.res_name, pad_width, constant_values=pad_val)
            if self.res_name is not None
            else None
        ),
        chain_type=(
            np.pad(self.chain_type, pad_width, constant_values=pad_val)
            if self.chain_type is not None
            else None
        ),
    )

  def to_array(self) -> np.ndarray:
    """Stacks the fields to a numpy array with shape (6, <layout_shape>).

    Creates a pure numpy array of type `object` by stacking the 6 fields of the
    AtomLayout, i.e. (atom_name, atom_element, res_name, res_id, chain_id,
    chain_type). This method together with from_array() provides an easy way to
    apply pure numpy methods like np.concatenate() to `AtomLayout`s.

    Returns:
      np.ndarray of object with shape (6, <layout_shape>), e.g.
      array([['N', 'CA', 'C', ..., 'CB', 'CG', 'CD'],
       ['N', 'C', 'C', ..., 'C', 'C', 'C'],
       ['LEU', 'LEU', 'LEU', ..., 'PRO', 'PRO', 'PRO'],
       [1, 1, 1, ..., 403, 403, 403],
       ['A', 'A', 'A', ..., 'D', 'D', 'D'],
       ['polypeptide(L)', 'polypeptide(L)', ..., 'polypeptide(L)']],
      dtype=object)
    """
    if (
        self.atom_element is None
        or self.res_name is None
        or self.chain_type is None
    ):
      raise ValueError('All optional fields need to be present.')

    return np.stack(dataclasses.astuple(self), axis=0)

  @classmethod
  def from_array(cls, arr: np.ndarray) -> 'AtomLayout':
    """Creates an AtomLayout object from a numpy array with shape (6, ...).

    see also to_array()
    Args:
      arr: np.ndarray of object with shape (6, <layout_shape>)

    Returns:
      AtomLayout object with shape (<layout_shape>)
    """
    if arr.shape[0] != 6:
      raise ValueError(
          'Given array must have shape (6, ...) to match the 6 fields of '
          'AtomLayout (atom_name, atom_element, res_name, res_id, chain_id, '
          f'chain_type). Your array has {arr.shape=}'
      )
    return cls(*arr)

  @property
  def shape(self) -> tuple[int, ...]:
    return self.atom_name.shape


@dataclasses.dataclass(frozen=True)
class Residues:
  """List of residues with meta data.

  Attributes:
    res_name: np.ndarray of str [num_res], e.g. 'ARG', 'TRP'
    res_id: np.ndarray of int [num_res]
    chain_id: np.ndarray of str [num_res], e.g. 'A', 'B'
    chain_type: np.ndarray of str [num_res], e.g. 'polypeptide(L)'
    is_start_terminus: np.ndarray of bool [num_res]
    is_end_terminus: np.ndarray of bool [num_res]
    deprotonation: (optional) np.ndarray of set() [num_res], e.g. {'HD1', 'HE2'}
    smiles_string: (optional) np.ndarray of str [num_res], e.g. 'Cc1ccccc1'
    shape: shape of the layout (just returns res_name.shape)
  """

  res_name: np.ndarray
  res_id: np.ndarray
  chain_id: np.ndarray
  chain_type: np.ndarray
  is_start_terminus: np.ndarray
  is_end_terminus: np.ndarray
  deprotonation: np.ndarray | None = None
  smiles_string: np.ndarray | None = None

  def __post_init__(self):
    """Assert all arrays are 1D have the same shape."""
    attribute_names = (
        'res_name',
        'res_id',
        'chain_id',
        'chain_type',
        'is_start_terminus',
        'is_end_terminus',
        'deprotonation',
        'smiles_string',
    )
    _assert_all_arrays_have_same_shape(
        obj=self,
        expected_shape=(self.res_name.shape[0],),
        attribute_names=attribute_names,
    )

  def __getitem__(self, key: NumpyIndex) -> 'Residues':
    return Residues(
        res_name=self.res_name[key],
        res_id=self.res_id[key],
        chain_id=self.chain_id[key],
        chain_type=self.chain_type[key],
        is_start_terminus=self.is_start_terminus[key],
        is_end_terminus=self.is_end_terminus[key],
        deprotonation=(
            self.deprotonation[key] if self.deprotonation is not None else None
        ),
        smiles_string=(
            self.smiles_string[key] if self.smiles_string is not None else None
        ),
    )

  def __eq__(self, other: 'Residues') -> bool:
    return all(
        np.array_equal(getattr(self, field.name), getattr(other, field.name))
        for field in dataclasses.fields(self)
    )

  @property
  def shape(self) -> tuple[int, ...]:
    return self.res_name.shape


@dataclasses.dataclass(frozen=True)
class GatherInfo:
  """Gather indices to translate from one atom layout to another.

  All members are np or jnp ndarray (usually 1-dim or 2-dim) with the same
  shape, e.g.
  - [num_atoms]
  - [num_residues, max_atoms_per_residue]
  - [num_fragments, max_fragments_per_residue]

  Attributes:
    gather_idxs: np or jnp ndarray of int: gather indices into a flattened array
    gather_mask: np or jnp ndarray of bool: mask for resulting array
    input_shape: np or jnp ndarray of int: the shape of the unflattened input
      array
    shape: output shape. Just returns gather_idxs.shape
  """

  gather_idxs: xnp_ndarray
  gather_mask: xnp_ndarray
  input_shape: xnp_ndarray

  def __post_init__(self):
    if self.gather_mask.shape != self.gather_idxs.shape:
      raise ValueError(
          'All arrays must have the same shape. Got\n'
          f'gather_idxs.shape = {self.gather_idxs.shape}\n'
          f'gather_mask.shape = {self.gather_mask.shape}\n'
      )

  def __getitem__(self, key: NumpyIndex) -> 'GatherInfo':
    return GatherInfo(
        gather_idxs=self.gather_idxs[key],
        gather_mask=self.gather_mask[key],
        input_shape=self.input_shape,
    )

  @property
  def shape(self) -> tuple[int, ...]:
    return self.gather_idxs.shape

  def as_np_or_jnp(self, xnp: types.ModuleType) -> 'GatherInfo':
    return GatherInfo(
        gather_idxs=xnp.array(self.gather_idxs),
        gather_mask=xnp.array(self.gather_mask),
        input_shape=xnp.array(self.input_shape),
    )

  def as_dict(
      self,
      key_prefix: str | None = None,
  ) -> dict[str, xnp_ndarray]:
    prefix = f'{key_prefix}:' if key_prefix else ''
    return {
        prefix + 'gather_idxs': self.gather_idxs,
        prefix + 'gather_mask': self.gather_mask,
        prefix + 'input_shape': self.input_shape,
    }

  @classmethod
  def from_dict(
      cls,
      d: Mapping[str, xnp_ndarray],
      key_prefix: str | None = None,
  ) -> 'GatherInfo':
    """Creates GatherInfo from a given dictionary."""
    prefix = f'{key_prefix}:' if key_prefix else ''
    return cls(
        gather_idxs=d[prefix + 'gather_idxs'],
        gather_mask=d[prefix + 'gather_mask'],
        input_shape=d[prefix + 'input_shape'],
    )


def fill_in_optional_fields(
    minimal_atom_layout: AtomLayout,
    reference_atoms: AtomLayout,
) -> AtomLayout:
  """Fill in the optional fields (atom_element, res_name, chain_type).

  Extracts the optional fields (atom_element, res_name, chain_type) from a
  flat reference layout and fills them into the fields from this layout.

  Args:
    minimal_atom_layout: An AtomLayout that only contains the essential fields
      (atom_name, res_id, chain_id).
    reference_atoms: A flat layout that contains all fields for all atoms.

  Returns:
    An AtomLayout that contains all fields.

  Raises:
    ValueError: Reference atoms layout is not flat.
    ValueError: Missing atoms in reference.
  """
  if len(reference_atoms.shape) > 1:
    raise ValueError('Only flat layouts are supported as reference.')
  ref_to_self = compute_gather_idxs(
      source_layout=reference_atoms, target_layout=minimal_atom_layout
  )
  atom_mask = minimal_atom_layout.atom_name.astype(bool)
  missing_atoms_mask = atom_mask & ~ref_to_self.gather_mask
  if np.any(missing_atoms_mask):
    raise ValueError(
        f'{np.sum(missing_atoms_mask)} missing atoms in reference: '
        f'{minimal_atom_layout[missing_atoms_mask]}'
    )

  def _convert_str_array(gather: GatherInfo, arr: np.ndarray):
    output = arr[gather.gather_idxs]
    output[~gather.gather_mask] = ''
    return output

  return dataclasses.replace(
      minimal_atom_layout,
      atom_element=_convert_str_array(
          ref_to_self, reference_atoms.atom_element
      ),
      res_name=_convert_str_array(ref_to_self, reference_atoms.res_name),
      chain_type=_convert_str_array(ref_to_self, reference_atoms.chain_type),
  )


def guess_deprotonation(residues: Residues) -> Residues:
  """Convenience function to create a plausible deprotonation field.

  Assumes a pH of 7 and always prefers HE2 over HD1 for HIS.
  Args:
    residues: a Residues object without a depronotation field

  Returns:
    a Residues object with a depronotation field
  """
  num_residues = residues.res_name.shape[0]
  deprotonation = np.empty(num_residues, dtype=object)
  deprotonation_at_ph7 = {
      'ASP': 'HD2',
      'GLU': 'HE2',
      'HIS': 'HD1',
  }
  for idx, res_name in enumerate(residues.res_name):
    deprotonation[idx] = set()
    if res_name in deprotonation_at_ph7:
      deprotonation[idx].add(deprotonation_at_ph7[res_name])
    if residues.is_end_terminus[idx]:
      deprotonation[idx].add('HXT')

  return dataclasses.replace(residues, deprotonation=deprotonation)


def atom_layout_from_structure(
    struct: structure.Structure,
    *,
    fix_non_standard_polymer_res: bool = False,
) -> AtomLayout:
  """Extract AtomLayout from a Structure."""

  if not fix_non_standard_polymer_res:
    return AtomLayout(
        atom_name=np.array(struct.atom_name, dtype=object),
        atom_element=np.array(struct.atom_element, dtype=object),
        res_name=np.array(struct.res_name, dtype=object),
        res_id=np.array(struct.res_id, dtype=int),
        chain_id=np.array(struct.chain_id, dtype=object),
        chain_type=np.array(struct.chain_type, dtype=object),
    )

  # Target lists.
  target_atom_names = []
  target_atom_elements = []
  target_res_ids = []
  target_res_names = []
  target_chain_ids = []
  target_chain_types = []

  for atom in struct.iter_atoms():
    target_atom_names.append(atom['atom_name'])
    target_atom_elements.append(atom['atom_element'])
    target_res_ids.append(atom['res_id'])
    target_chain_ids.append(atom['chain_id'])
    target_chain_types.append(atom['chain_type'])
    if mmcif_names.is_standard_polymer_type(atom['chain_type']):
      fixed_res_name = mmcif_names.fix_non_standard_polymer_res(
          res_name=atom['res_name'], chain_type=atom['chain_type']
      )
      target_res_names.append(fixed_res_name)
    else:
      target_res_names.append(atom['res_name'])

  return AtomLayout(
      atom_name=np.array(target_atom_names, dtype=object),
      atom_element=np.array(target_atom_elements, dtype=object),
      res_name=np.array(target_res_names, dtype=object),
      res_id=np.array(target_res_ids, dtype=int),
      chain_id=np.array(target_chain_ids, dtype=object),
      chain_type=np.array(target_chain_types, dtype=object),
  )


def residues_from_structure(
    struct: structure.Structure,
    *,
    include_missing_residues: bool = True,
    fix_non_standard_polymer_res: bool = False,
) -> Residues:
  """Create a Residues object from a Structure object."""

  def _get_smiles(res_name):
    """Get SMILES string from chemical components."""
    smiles = None
    if (
        struct.chemical_components_data is not None
        and struct.chemical_components_data.chem_comp is not None
        and struct.chemical_components_data.chem_comp.get(res_name)
    ):
      smiles = struct.chemical_components_data.chem_comp[res_name].pdbx_smiles
    return smiles

  res_names_per_chain = struct.chain_res_name_sequence(
      include_missing_residues=include_missing_residues,
      fix_non_standard_polymer_res=fix_non_standard_polymer_res,
  )
  res_name = []
  res_id = []
  chain_id = []
  chain_type = []
  smiles = []
  is_start_terminus = []
  for c in struct.iter_chains():
    if include_missing_residues:
      this_res_ids = [id for (_, id) in struct.all_residues[c['chain_id']]]
    else:
      this_res_ids = [
          r['res_id']
          for r in struct.iter_residues()
          if r['chain_id'] == c['chain_id']
      ]
    fixed_res_names = res_names_per_chain[c['chain_id']]
    assert len(this_res_ids) == len(
        fixed_res_names
    ), f'{len(this_res_ids)} != {len(fixed_res_names)}'
    this_start_res_id = min(min(this_res_ids), 1)
    this_is_start_terminus = [r == this_start_res_id for r in this_res_ids]
    smiles.extend([_get_smiles(res_name) for res_name in fixed_res_names])
    num_res = len(fixed_res_names)
    res_name.extend(fixed_res_names)
    res_id.extend(this_res_ids)
    chain_id.extend([c['chain_id']] * num_res)
    chain_type.extend([c['chain_type']] * num_res)
    is_start_terminus.extend(this_is_start_terminus)
  res_name = np.array(res_name, dtype=object)
  res_id = np.array(res_id, dtype=int)
  chain_id = np.array(chain_id, dtype=object)
  chain_type = np.array(chain_type, dtype=object)
  smiles = np.array(smiles, dtype=object)
  is_start_terminus = np.array(is_start_terminus, dtype=bool)

  res_uid_to_idx = {
      uid: idx for idx, uid in enumerate(zip(chain_id, res_id, strict=True))
  }

  # Start terminus indicates whether residue index is 1 and chain is polymer.
  is_polymer = np.isin(chain_type, tuple(mmcif_names.POLYMER_CHAIN_TYPES))
  is_start_terminus = is_start_terminus & is_polymer

  # Start also indicates whether amino acid is attached to H2 or proline to H.
  start_terminus_atom_index = np.nonzero(
      (struct.chain_type == mmcif_names.PROTEIN_CHAIN)
      & (
          (struct.atom_name == 'H2')
          | ((struct.atom_name == 'H') & (struct.res_name == 'PRO'))
      )
  )[0]

  # Translate atom idx to residue idx to assign start terminus.
  for atom_idx in start_terminus_atom_index:
    res_uid = (struct.chain_id[atom_idx], struct.res_id[atom_idx])
    res_idx = res_uid_to_idx[res_uid]
    is_start_terminus[res_idx] = True

  # Infer end terminus: Check for OXT, or in case of
  # include_missing_residues==True for the last residue of the chain.
  num_all_residues = res_name.shape[0]
  is_end_terminus = np.zeros(num_all_residues, dtype=bool)
  end_term_atom_idxs = np.nonzero(struct.atom_name == 'OXT')[0]
  for atom_idx in end_term_atom_idxs:
    res_uid = (struct.chain_id[atom_idx], struct.res_id[atom_idx])
    res_idx = res_uid_to_idx[res_uid]
    is_end_terminus[res_idx] = True

  if include_missing_residues:
    for idx in range(num_all_residues - 1):
      if is_polymer[idx] and chain_id[idx] != chain_id[idx + 1]:
        is_end_terminus[idx] = True
    if (num_all_residues > 0) and is_polymer[-1]:
      is_end_terminus[-1] = True

  # Infer (de-)protonation: Only if hydrogens are given.
  num_hydrogens = np.sum(
      (struct.atom_element == 'H') & (struct.chain_type == 'polypeptide(L)')
  )
  if num_hydrogens > 0:
    deprotonation = np.empty(num_all_residues, dtype=object)
    all_atom_uids = set(
        zip(struct.chain_id, struct.res_id, struct.atom_name, strict=True)
    )
    for idx in range(num_all_residues):
      deprotonation[idx] = set()
      check_hydrogens = set()
      if is_end_terminus[idx]:
        check_hydrogens.add('HXT')
      if res_name[idx] in atom_types.PROTONATION_HYDROGENS:
        check_hydrogens.update(atom_types.PROTONATION_HYDROGENS[res_name[idx]])
      for hydrogen in check_hydrogens:
        if (chain_id[idx], res_id[idx], hydrogen) not in all_atom_uids:
          deprotonation[idx].add(hydrogen)
  else:
    deprotonation = None

  return Residues(
      res_name=res_name,
      res_id=res_id,
      chain_id=chain_id,
      chain_type=chain_type,
      is_start_terminus=is_start_terminus.astype(bool),
      is_end_terminus=is_end_terminus,
      deprotonation=deprotonation,
      smiles_string=smiles,
  )


def get_link_drop_atoms(
    res_name: str,
    chain_type: str,
    *,
    is_start_terminus: bool,
    is_end_terminus: bool,
    bonded_atoms: set[str],
    drop_ligand_leaving_atoms: bool = False,
) -> set[str]:
  """Returns set of atoms that are dropped when this res_name gets linked.

  Args:
    res_name: residue name, e.g. 'ARG'
    chain_type: chain_type, e.g. 'polypeptide(L)'
    is_start_terminus: whether the residue is the n-terminus
    is_end_terminus: whether the residue is the c-terminus
    bonded_atoms: Names of atoms coming off this residue.
    drop_ligand_leaving_atoms: Flag to switch on/off leaving atoms for ligands.

  Returns:
    Set of atoms that are dropped when this amino acid gets linked.
  """
  drop_atoms = set()
  if chain_type == mmcif_names.PROTEIN_CHAIN:
    if res_name == 'PRO':
      if not is_start_terminus:
        drop_atoms.update({'H', 'H2', 'H3'})
      if not is_end_terminus:
        drop_atoms.update({'OXT', 'HXT'})
    else:
      if not is_start_terminus:
        drop_atoms.update({'H2', 'H3'})
      if not is_end_terminus:
        drop_atoms.update({'OXT', 'HXT'})
  elif chain_type in mmcif_names.NUCLEIC_ACID_CHAIN_TYPES:
    if not is_start_terminus:
      drop_atoms.update({'OP3'})
  elif (
      drop_ligand_leaving_atoms and chain_type in mmcif_names.LIGAND_CHAIN_TYPES
  ):
    if res_name in {
        *chemical_component_sets.GLYCAN_OTHER_LIGANDS,
        *chemical_component_sets.GLYCAN_LINKING_LIGANDS,
    }:
      if 'O1' not in bonded_atoms:
        drop_atoms.update({'O1'})
  return drop_atoms


def get_bonded_atoms(
    polymer_ligand_bonds: AtomLayout,
    ligand_ligand_bonds: AtomLayout,
    res_id: int,
    chain_id: str,
) -> set[str]:
  """Finds the res_name on the opposite end of the bond, if a bond exists.

  Args:
    polymer_ligand_bonds: Bond information for polymer-ligand pairs.
    ligand_ligand_bonds: Bond information for ligand-ligand pairs.
    res_id: residue id in question.
    chain_id: chain id of residue in question.

  Returns:
    res_name of bonded atom.
  """
  bonded_atoms = set()
  if polymer_ligand_bonds:
    # Filter before searching to speed this up.
    bond_idx = np.logical_and(
        polymer_ligand_bonds.res_id == res_id,
        polymer_ligand_bonds.chain_id == chain_id,
    ).any(axis=1)
    relevant_polymer_bonds = polymer_ligand_bonds[bond_idx]
    for atom_names, res_ids, chain_ids in zip(
        relevant_polymer_bonds.atom_name,
        relevant_polymer_bonds.res_id,
        relevant_polymer_bonds.chain_id,
    ):
      if (res_ids[0], chain_ids[0]) == (res_id, chain_id):
        bonded_atoms.add(atom_names[0])
      elif (res_ids[1], chain_ids[1]) == (res_id, chain_id):
        bonded_atoms.add(atom_names[1])
  if ligand_ligand_bonds:
    bond_idx = np.logical_and(
        ligand_ligand_bonds.res_id == res_id,
        ligand_ligand_bonds.chain_id == chain_id,
    ).any(axis=1)
    relevant_ligand_bonds = ligand_ligand_bonds[bond_idx]
    for atom_names, res_ids, chain_ids in zip(
        relevant_ligand_bonds.atom_name,
        relevant_ligand_bonds.res_id,
        relevant_ligand_bonds.chain_id,
    ):
      if (res_ids[0], chain_ids[0]) == (res_id, chain_id):
        bonded_atoms.add(atom_names[0])
      elif (res_ids[1], chain_ids[1]) == (res_id, chain_id):
        bonded_atoms.add(atom_names[1])
  return bonded_atoms


def make_flat_atom_layout(
    residues: Residues,
    ccd: chemical_components.Ccd,
    polymer_ligand_bonds: AtomLayout | None = None,
    ligand_ligand_bonds: AtomLayout | None = None,
    *,
    with_hydrogens: bool = False,
    skip_unk_residues: bool = True,
    drop_ligand_leaving_atoms: bool = False,
) -> AtomLayout:
  """Make a flat atom layout for given residues.

  Create a flat layout from a `Residues` object. The required atoms for each
  amino acid type are taken from the CCD, hydrogens and oxygens are dropped to
  make the linked residues. Terminal OXT's and protonation state for the
  hydrogens come from the `Residues` object.

  Args:
    residues: a `Residues` object.
    ccd: The chemical components dictionary.
    polymer_ligand_bonds: Bond information for polymer-ligand pairs.
    ligand_ligand_bonds: Bond information for ligand-ligand pairs.
    with_hydrogens: whether to create hydrogens
    skip_unk_residues: whether to skip 'UNK' resides -- default is True to be
      compatible with the rest of AlphaFold that does not predict atoms for
      unknown residues
    drop_ligand_leaving_atoms: Flag to switch on/ off leaving atoms for ligands.

  Returns:
    an `AtomLayout` object
  """
  num_res = residues.res_name.shape[0]

  # Target lists.
  target_atom_names = []
  target_atom_elements = []
  target_res_ids = []
  target_res_names = []
  target_chain_ids = []
  target_chain_types = []

  for idx in range(num_res):
    # skip 'UNK' residues if requested
    if (
        skip_unk_residues
        and residues.res_name[idx] in residue_names.UNKNOWN_TYPES
    ):
      continue

    # Get the atoms for this residue type from CCD.
    if ccd.get(residues.res_name[idx]):
      res_atoms = struc_chem_comps.get_all_atoms_in_entry(
          ccd=ccd, res_name=residues.res_name[idx]
      )
      atom_names_elements = list(
          zip(
              res_atoms['_chem_comp_atom.atom_id'],
              res_atoms['_chem_comp_atom.type_symbol'],
              strict=True,
          )
      )
    elif residues.smiles_string[idx]:
      # Get atoms from RDKit via SMILES.
      mol = Chem.MolFromSmiles(residues.smiles_string[idx])
      if mol is None:
        raise ValueError(
            f'Failed to construct RDKit Mol for {residues.res_name[idx]} from'
            f' SMILES string: {residues.smiles_string[idx]} . This is likely'
            ' due to an issue with the SMILES string. Note that the userCCD'
            ' input format provides an alternative way to define custom'
            ' molecules directly without RDKit or SMILES.'
        )
      mol = rdkit_utils.assign_atom_names_from_graph(mol)
      atom_names_elements = [
          (a.GetProp('atom_name'), a.GetSymbol()) for a in mol.GetAtoms()
      ]
    else:
      raise ValueError(
          f'{residues.res_name[idx]} not found in CCD and no SMILES string'
      )

    # Remove hydrogens if requested.
    if not with_hydrogens:
      atom_names_elements = [
          (n, e) for n, e in atom_names_elements if (e != 'H' and e != 'D')
      ]
    bonded_atoms = get_bonded_atoms(
        polymer_ligand_bonds,
        ligand_ligand_bonds,
        residues.res_id[idx],
        residues.chain_id[idx],
    )
    # Connect the amino-acids, i.e. remove OXT, HXT and H2.
    drop_atoms = get_link_drop_atoms(
        res_name=residues.res_name[idx],
        chain_type=residues.chain_type[idx],
        is_start_terminus=residues.is_start_terminus[idx],
        is_end_terminus=residues.is_end_terminus[idx],
        bonded_atoms=bonded_atoms,
        drop_ligand_leaving_atoms=drop_ligand_leaving_atoms,
    )

    # If deprotonation info is available, remove the specific atoms.
    if residues.deprotonation is not None:
      drop_atoms.update(residues.deprotonation[idx])

    atom_names_elements = [
        (n, e) for n, e in atom_names_elements if n not in drop_atoms
    ]

    # Append the found atoms to the target lists.
    target_atom_names.extend([n for n, _ in atom_names_elements])
    target_atom_elements.extend([e for _, e in atom_names_elements])
    num_atoms = len(atom_names_elements)
    target_res_names.extend([residues.res_name[idx]] * num_atoms)
    target_res_ids.extend([residues.res_id[idx]] * num_atoms)
    target_chain_ids.extend([residues.chain_id[idx]] * num_atoms)
    target_chain_types.extend([residues.chain_type[idx]] * num_atoms)

  return AtomLayout(
      atom_name=np.array(target_atom_names, dtype=object),
      atom_element=np.array(target_atom_elements, dtype=object),
      res_name=np.array(target_res_names, dtype=object),
      res_id=np.array(target_res_ids, dtype=int),
      chain_id=np.array(target_chain_ids, dtype=object),
      chain_type=np.array(target_chain_types, dtype=object),
  )


def compute_gather_idxs(
    *,
    source_layout: AtomLayout,
    target_layout: AtomLayout,
    fill_value: int = 0,
) -> GatherInfo:
  """Produce gather indices and mask to convert from source layout to target."""
  source_uid_to_idx = {
      uid: idx
      for idx, uid in enumerate(
          zip(
              source_layout.chain_id.ravel(),
              source_layout.res_id.ravel(),
              source_layout.atom_name.ravel(),
              strict=True,
          )
      )
  }
  gather_idxs = []
  gather_mask = []
  for uid in zip(
      target_layout.chain_id.ravel(),
      target_layout.res_id.ravel(),
      target_layout.atom_name.ravel(),
      strict=True,
  ):
    if uid in source_uid_to_idx:
      gather_idxs.append(source_uid_to_idx[uid])
      gather_mask.append(True)
    else:
      gather_idxs.append(fill_value)
      gather_mask.append(False)
  target_shape = target_layout.atom_name.shape
  return GatherInfo(
      gather_idxs=np.array(gather_idxs, dtype=int).reshape(target_shape),
      gather_mask=np.array(gather_mask, dtype=bool).reshape(target_shape),
      input_shape=np.array(source_layout.atom_name.shape),
  )


def convert(
    gather_info: GatherInfo,
    arr: xnp_ndarray,
    *,
    layout_axes: tuple[int, ...] = (0,),
) -> xnp_ndarray:
  """Convert an array from one atom layout to another."""
  # Translate negative indices to the corresponding positives.
  layout_axes = tuple(i if i >= 0 else i + arr.ndim for i in layout_axes)

  # Ensure that layout_axes are continuous.
  layout_axes_begin = layout_axes[0]
  layout_axes_end = layout_axes[-1] + 1

  if layout_axes != tuple(range(layout_axes_begin, layout_axes_end)):
    raise ValueError(f'layout_axes must be continuous. Got {layout_axes}.')
  layout_shape = arr.shape[layout_axes_begin:layout_axes_end]

  # Ensure that the layout shape is compatible
  # with the gather_info. I.e. the first axis size must be equal or greater
  # than the gather_info.input_shape, and all subsequent axes sizes must match.
  if (len(layout_shape) != gather_info.input_shape.size) or (
      isinstance(gather_info.input_shape, np.ndarray)
      and (
          (layout_shape[0] < gather_info.input_shape[0])
          or (np.any(layout_shape[1:] != gather_info.input_shape[1:]))
      )
  ):
    raise ValueError(
        'Input array layout axes are incompatible. You specified layout '
        f'axes {layout_axes} with an input array of shape {arr.shape}, but '
        f'the gather info expects shape {gather_info.input_shape}. '
        'Your first axis size must be equal or greater than the '
        'gather_info.input_shape, and all subsequent axes sizes must '
        'match.'
    )

  # Compute the shape of the input array with flattened layout.
  batch_shape = arr.shape[:layout_axes_begin]
  features_shape = arr.shape[layout_axes_end:]
  arr_flattened_shape = batch_shape + (np.prod(layout_shape),) + features_shape

  # Flatten input array and perform the gather.
  arr_flattened = arr.reshape(arr_flattened_shape)
  if layout_axes_begin == 0:
    out_arr = arr_flattened[gather_info.gather_idxs, ...]
  elif layout_axes_begin == 1:
    out_arr = arr_flattened[:, gather_info.gather_idxs, ...]
  elif layout_axes_begin == 2:
    out_arr = arr_flattened[:, :, gather_info.gather_idxs, ...]
  elif layout_axes_begin == 3:
    out_arr = arr_flattened[:, :, :, gather_info.gather_idxs, ...]
  elif layout_axes_begin == 4:
    out_arr = arr_flattened[:, :, :, :, gather_info.gather_idxs, ...]
  else:
    raise ValueError(
        'Only 4 batch axes supported. If you need more, the code '
        'is easy to extend.'
    )

  # Broadcast the mask and apply it.
  broadcasted_mask_shape = (
      (1,) * len(batch_shape)
      + gather_info.gather_mask.shape
      + (1,) * len(features_shape)
  )
  out_arr *= gather_info.gather_mask.reshape(broadcasted_mask_shape)
  return out_arr


def make_structure(
    flat_layout: AtomLayout,
    atom_coords: np.ndarray,
    name: str,
    *,
    atom_b_factors: np.ndarray | None = None,
    all_physical_residues: Residues | None = None,
) -> structure.Structure:
  """Returns a Structure from a flat layout and atom coordinates.

  The provided flat_layout must be 1-dim and must not contain any padding
  elements. The flat_layout.atom_name must conform to the OpenMM/CCD standard
  and must not contain deuterium.

  Args:
    flat_layout: flat 1-dim AtomLayout without pading elements
    atom_coords: np.ndarray of float, shape (num_atoms, 3)
    name: str: the name (usually PDB id), e.g. '1uao'
    atom_b_factors: np.ndarray of float, shape (num_atoms,) or None. If None,
      they will be set to all zeros.
    all_physical_residues: a Residues object that contains all physically
      existing residues, i.e. also those residues that have no resolved atoms.
      This is common in experimental structures, but also appears in predicted
      structures for 'UNK' or other non-standard residue types, where the model
      does not predict coordinates. This will be used to create the
      `all_residues` field of the structure object.
  """

  if flat_layout.atom_name.ndim != 1 or not np.all(
      flat_layout.atom_name.astype(bool)
  ):
    raise ValueError(
        'flat_layout must be 1-dim and must not contain anypadding element'
    )
  if (
      flat_layout.atom_element is None
      or flat_layout.res_name is None
      or flat_layout.chain_type is None
  ):
    raise ValueError('All optional fields must be present.')

  if atom_b_factors is None:
    atom_b_factors = np.zeros(atom_coords.shape[:-1])

  if all_physical_residues is not None:
    # Create the all_residues field from a Residues object
    # (unfortunately there is no central place to keep the chain_types in
    # the structure class, so we drop it here)
    all_residues = collections.defaultdict(list)
    for chain_id, res_id, res_name in zip(
        all_physical_residues.chain_id,
        all_physical_residues.res_id,
        all_physical_residues.res_name,
        strict=True,
    ):
      all_residues[chain_id].append((res_name, res_id))
  else:
    # Create the all_residues field from the flat_layout
    all_residues = collections.defaultdict(list)
    if flat_layout.chain_id.shape[0] > 0:
      all_residues[flat_layout.chain_id[0]].append(
          (flat_layout.res_name[0], flat_layout.res_id[0])
      )
      for i in range(1, flat_layout.shape[0]):
        if (
            flat_layout.chain_id[i] != flat_layout.chain_id[i - 1]
            or flat_layout.res_name[i] != flat_layout.res_name[i - 1]
            or flat_layout.res_id[i] != flat_layout.res_id[i - 1]
        ):
          all_residues[flat_layout.chain_id[i]].append(
              (flat_layout.res_name[i], flat_layout.res_id[i])
          )

  return structure.from_atom_arrays(
      name=name,
      all_residues=dict(all_residues),
      chain_id=flat_layout.chain_id,
      chain_type=flat_layout.chain_type,
      res_id=flat_layout.res_id.astype(np.int32),
      res_name=flat_layout.res_name,
      atom_name=flat_layout.atom_name,
      atom_element=flat_layout.atom_element,
      atom_x=atom_coords[..., 0],
      atom_y=atom_coords[..., 1],
      atom_z=atom_coords[..., 2],
      atom_b_factor=atom_b_factors,
  )


def _assert_all_arrays_have_same_shape(
    *,
    obj: AtomLayout | Residues | GatherInfo,
    expected_shape: tuple[int, ...],
    attribute_names: Sequence[str],
) -> None:
  """Checks that given attributes of the object have the expected shape."""
  attribute_shapes_description = []
  all_shapes_are_valid = True

  for attribute_name in attribute_names:
    attribute = getattr(obj, attribute_name)

    if attribute is None:
      attribute_shape = None
    else:
      attribute_shape = attribute.shape

    if attribute_shape is not None and expected_shape != attribute_shape:
      all_shapes_are_valid = False

    attribute_shape_name = attribute_name + '.shape'
    attribute_shapes_description.append(
        f'{attribute_shape_name:25} = {attribute_shape}'
    )

  if not all_shapes_are_valid:
    raise ValueError(
        f'All arrays must have the same shape ({expected_shape=}). Got\n'
        + '\n'.join(attribute_shapes_description)
    )


================================================
FILE: src/alphafold3/model/components/haiku_modules.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Common Haiku modules."""

from collections.abc import Sequence
import contextlib
import numbers
from typing import TypeAlias

import haiku as hk
import jax
import jax.numpy as jnp
import numpy as np


PRECISION: TypeAlias = (
    None
    | str
    | jax.lax.Precision
    | tuple[str, str]
    | tuple[jax.lax.Precision, jax.lax.Precision]
)

# Useful for mocking in tests.
DEFAULT_PRECISION = None

# Constant from scipy.stats.truncnorm.std(a=-2, b=2, loc=0., scale=1.)
TRUNCATED_NORMAL_STDDEV_FACTOR = np.asarray(
    0.87962566103423978, dtype=np.float32
)


class LayerNorm(hk.LayerNorm):
  """LayerNorm module.

  Equivalent to hk.LayerNorm but with an extra 'upcast' option that casts
  (b)float16 inputs to float32 before computing the layer norm, and then casts
  the output back to the input type.

  The learnable parameter shapes are also different from Haiku: they are always
  vectors rather than possibly higher-rank tensors. This makes it easier
  to change the layout whilst keep the model weight-compatible.
  """

  def __init__(
      self,
      *,
      axis: int = -1,
      create_scale: bool = True,
      create_offset: bool = True,
      eps: float = 1e-5,
      scale_init: hk.initializers.Initializer | None = None,
      offset_init: hk.initializers.Initializer | None = None,
      use_fast_variance: bool = True,
      name: str,
      param_axis: int | None = None,
      upcast: bool = True,
  ):
    super().__init__(
        axis=axis,
        create_scale=False,
        create_offset=False,
        eps=eps,
        scale_init=None,
        offset_init=None,
        use_fast_variance=use_fast_variance,
        name=name,
        param_axis=param_axis,
    )
    self.upcast = upcast
    self._temp_create_scale = create_scale
    self._temp_create_offset = create_offset

  def __call__(self, x: jnp.ndarray) -> jnp.ndarray:
    dtype = x.dtype
    is_16bit = x.dtype in [jnp.bfloat16, jnp.float16]
    if self.upcast and is_16bit:
      x = x.astype(jnp.float32)

    param_axis = self.param_axis[0] if self.param_axis else -1
    param_shape = (x.shape[param_axis],)

    param_broadcast_shape = [1] * x.ndim
    param_broadcast_shape[param_axis] = x.shape[param_axis]
    scale = None
    offset = None
    if self._temp_create_scale:
      scale = hk.get_parameter(
          'scale', param_shape, x.dtype, init=self.scale_init
      )
      scale = scale.reshape(param_broadcast_shape)

    if self._temp_create_offset:
      offset = hk.get_parameter(
          'offset', param_shape, x.dtype, init=self.offset_init
      )
      offset = offset.reshape(param_broadcast_shape)

    out = super().__call__(x, scale=scale, offset=offset)

    if self.upcast and is_16bit:
      out = out.astype(dtype)

    return out


def haiku_linear_get_params(
    inputs: jax.Array | jax.ShapeDtypeStruct,
    *,
    num_output: int | Sequence[int],
    use_bias: bool = False,
    num_input_dims: int = 1,
    initializer: str = 'linear',
    bias_init: float = 0.0,
    transpose_weights: bool = False,
    name: str | None = None,
) -> tuple[jax.Array, jax.Array | None]:
  """Get parameters for linear layer.

  Parameters will be at least float32 or higher precision.

  Arguments:
    inputs: The input to the Linear layer. Can be either a JAX array or a
      jax.ShapeDtypeStruct.
    num_output: The number of output channels. Can be an integer or a sequence
      of integers.
    use_bias: Whether to create a bias array.
    num_input_dims: The number of dimensions to consider as channel dims in the
      input.
    initializer: The name of the weight initializer to use.
    bias_init: A float used to initialize the bias.
    transpose_weights: If True, will create a transposed version of the weights.
    name: The Haiku namespace to use for the weight and bias.

  Returns:
    A tuple[weight, bias] if use_bias otherwise tuple[weight, None].
  """

  if isinstance(num_output, numbers.Integral):
    output_shape = (num_output,)
  else:
    output_shape = tuple(num_output)

  if num_input_dims > 0:
    in_shape = inputs.shape[-num_input_dims:]
  elif num_input_dims == 0:
    in_shape = ()
  else:
    raise ValueError('num_input_dims must be >= 0.')

  weight_init = _get_initializer_scale(initializer, in_shape)
  with hk.name_scope(name) if name else contextlib.nullcontext():

    if transpose_weights:
      weight_shape = output_shape + in_shape

      weights = hk.get_parameter(
          'weights', shape=weight_shape, dtype=inputs.dtype, init=weight_init
      )
    else:
      weight_shape = in_shape + output_shape
      weights = hk.get_parameter(
          name='weights',
          shape=weight_shape,
          dtype=inputs.dtype,
          init=weight_init,
      )

    bias = None
    if use_bias:
      bias = hk.get_parameter(
          name='bias',
          shape=output_shape,
          dtype=inputs.dtype,
          init=hk.initializers.Constant(bias_init),
      )
  return weights, bias


class Linear(hk.Module):
  """Custom Linear Module.

  This differs from the standard Linear in a few ways:
    * It supports inputs of arbitrary rank
    * It allows to use ntk parametrization
    * Initializers are specified by strings
    * It allows to explicitly specify which dimension of the input will map to
      the tpu sublane/lane dimensions.
  """

  def __init__(
      self,
      num_output: int | Sequence[int],
      *,
      initializer: str = 'linear',
      num_input_dims: int = 1,
      use_bias: bool = False,
      bias_init: float = 0.0,
      precision: PRECISION = None,
      fast_scalar_mode: bool = True,
      transpose_weights: bool = False,
      name: str,
  ):
    """Constructs Linear Module.

    Args:
      num_output: number of output channels. Can be tuple when outputting
        multiple dimensions.
      initializer: What initializer to use, should be one of {'linear', 'relu',
        'zeros'}.
      num_input_dims: Number of dimensions from the end to project.
      use_bias: Whether to include trainable bias (False by default).
      bias_init: Value used to initialize bias.
      precision: What precision to use for matrix multiplication, defaults to
        None.
      fast_scalar_mode: Whether to use optimized path for num_input_dims = 0.
      transpose_weights: decides whether weights have shape [input, output] or
        [output, input], True means [output, input], this is helpful to avoid
        padding on the tensors holding the weights.
      name: name of module, used for name scopes.
    """
    super().__init__(name=name)
    if isinstance(num_output, numbers.Integral):
      self.output_shape = (num_output,)
    else:
      self.output_shape = tuple(num_output)
    self.initializer = initializer
    self.use_bias = use_bias
    self.bias_init = bias_init
    self.num_input_dims = num_input_dims
    self.num_output_dims = len(self.output_shape)
    self.precision = precision if precision is not None else DEFAULT_PRECISION
    self.fast_scalar_mode = fast_scalar_mode
    self.transpose_weights = transpose_weights

  def __call__(self, inputs: jnp.ndarray) -> jnp.ndarray:
    """Connects Module.

    Args:
      inputs: Tensor of shape [..., num_channel]

    Returns:
      output of shape [..., num_output]
    """

    num_input_dims = self.num_input_dims

    # Adds specialized path for scalar inputs in Linear layer,
    # this means the linear Layer does not use the matmul units on the tpu,
    # which is more efficient and gives compiler more flexibility over layout.
    if num_input_dims == 0 and self.fast_scalar_mode:
      weight_shape = self.output_shape
      if self.initializer == 'zeros':
        w_init = hk.initializers.Constant(0.0)
      else:
        distribution_stddev = jnp.array(1 / TRUNCATED_NORMAL_STDDEV_FACTOR)
        w_init = hk.initializers.TruncatedNormal(
            mean=0.0, stddev=distribution_stddev
        )

      weights = hk.get_parameter('weights', weight_shape, inputs.dtype, w_init)

      inputs = jnp.expand_dims(
          inputs, tuple(range(-1, -self.num_output_dims - 1, -1))
      )
      output = inputs * weights
    else:
      if self.num_input_dims > 0:
        in_shape = inputs.shape[-self.num_input_dims :]
      else:
        in_shape = ()

      weight_init = _get_initializer_scale(self.initializer, in_shape)

      in_letters = 'abcde'[: self.num_input_dims]
      out_letters = 'hijkl'[: self.num_output_dims]

      if self.transpose_weights:
        weight_shape = self.output_shape + in_shape
        weights = hk.get_parameter(
            'weights', weight_shape, inputs.dtype, weight_init
        )
        equation = (
            f'...{in_letters}, {out_letters}{in_letters}->...{out_letters}'
        )
      else:
        weight_shape = in_shape + self.output_shape
        weights = hk.get_parameter(
            'weights', weight_shape, inputs.dtype, weight_init
        )

        equation = (
            f'...{in_letters}, {in_letters}{out_letters}->...{out_letters}'
        )

      output = jnp.einsum(equation, inputs, weights, precision=self.precision)

    if self.use_bias:
      bias = hk.get_parameter(
          'bias',
          self.output_shape,
          inputs.dtype,
          hk.initializers.Constant(self.bias_init),
      )
      output += bias

    return output


def _get_initializer_scale(initializer_name, input_shape):
  """Get initializer for weights."""

  if initializer_name == 'zeros':
    w_init = hk.initializers.Constant(0.0)
  else:
    # fan-in scaling
    noise_scale = 1.0
    for channel_dim in input_shape:
      noise_scale /= channel_dim
    if initializer_name == 'relu':
      noise_scale *= 2

    stddev = np.sqrt(noise_scale)
    # Adjust stddev for truncation.
    stddev = stddev / TRUNCATED_NORMAL_STDDEV_FACTOR
    w_init = hk.initializers.TruncatedNormal(mean=0.0, stddev=stddev)

  return w_init


================================================
FILE: src/alphafold3/model/components/mapping.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Specialized mapping functions."""

from collections.abc import Callable, Sequence
import functools
from typing import Any, TypeVar

import haiku as hk
import jax
import jax.numpy as jnp


Pytree = Any
PytreeJaxArray = Any

partial = functools.partial
PROXY = object()

T = TypeVar("T")


def _maybe_slice(array, i, slice_size, axis):
  if axis is PROXY:
    return array
  else:
    return jax.lax.dynamic_slice_in_dim(
        array, i, slice_size=slice_size, axis=axis
    )


def _maybe_get_size(array, axis):
  if axis == PROXY:
    return -1
  else:
    return array.shape[axis]


def _expand_axes(axes, values, name="sharded_apply"):
  values_tree_def = jax.tree_util.tree_structure(values)
  flat_axes = jax.api_util.flatten_axes(name, values_tree_def, axes)
  # Replace None's with PROXY.
  flat_axes = [PROXY if x is None else x for x in flat_axes]
  return jax.tree_util.tree_unflatten(values_tree_def, flat_axes)


def sharded_map(
    fun: Callable[..., PytreeJaxArray],
    shard_size: int | None = 1,
    in_axes: int | Pytree = 0,
    out_axes: int | Pytree = 0,
) -> Callable[..., PytreeJaxArray]:
  """Sharded vmap.

  Maps `fun` over axes, in a way similar to hk.vmap, but does so in shards of
  `shard_size`. This allows a smooth trade-off between memory usage
  (as in a plain map) vs higher throughput (as in a vmap).

  Args:
    fun: Function to apply smap transform to.
    shard_size: Integer denoting shard size.
    in_axes: Either integer or pytree describing which axis to map over for each
      input to `fun`, None denotes broadcasting.
    out_axes: Integer or pytree denoting to what axis in the output the mapped
      over axis maps.

  Returns:
    Function with smap applied.
  """
  if hk.running_init():
    # Guarantees initialisation independent of shard_size. Doesn't incur a high
    # memory cost, as long as large concrete tensors are not encountered.
    return hk.vmap(fun, in_axes=in_axes, out_axes=out_axes, split_rng=False)
  else:
    vmapped_fun = hk.vmap(fun, in_axes, out_axes, split_rng=True)
    return sharded_apply(vmapped_fun, shard_size, in_axes, out_axes)


def _set_docstring(docstr: str) -> Callable[[T], T]:
  """Decorator for setting the docstring of a function."""

  def wrapped(fun: T) -> T:
    fun.__doc__ = docstr.format(fun=getattr(fun, "__name__", repr(fun)))
    return fun

  return wrapped


def sharded_apply(
    fun: Callable[..., PytreeJaxArray],
    shard_size: int | None = 1,
    in_axes: int | Pytree = 0,
    out_axes: int | Pytree = 0,
    new_out_axes: bool = False,
) -> Callable[..., PytreeJaxArray]:
  """Sharded apply.

  Applies `fun` over shards to axes, in a way similar to vmap,
  but does so in shards of `shard_size`. Shards are stacked after.
  This allows a smooth trade-off between
  memory usage (as in a plain map) vs higher throughput (as in a vmap).

  Args:
    fun: Function to apply smap transform to.
    shard_size: Integer denoting shard size. None will return `fun` unchanged.
    in_axes: Either integer or pytree describing which axis to map over for each
      input to `fun`, None denotes broadcasting.
    out_axes: Integer or pytree denoting to what axis in the output the mapped
      over axis maps.
    new_out_axes: Whether to stack outputs on new axes. This assumes that the
      output sizes for each shard (including the possible remainder shard) are
      the same.

  Returns:
    Function with smap applied.
  """
  docstr = (
      "Mapped version of {fun}. Takes similar arguments to {fun} "
      "but with additional array axes over which {fun} is mapped."
  )
  if new_out_axes:
    raise NotImplementedError("New output axes not yet implemented.")

  if shard_size is None:
    return fun

  @_set_docstring(docstr)
  @functools.wraps(fun)
  def mapped_fn(*args, **kwargs):
    # Expand in axes and determine loop range.
    in_axes_ = _expand_axes(in_axes, args)

    in_sizes = jax.tree.map(_maybe_get_size, args, in_axes_)
    in_size = max(jax.tree_util.tree_leaves(in_sizes))

    num_extra_shards = (in_size - 1) // shard_size

    # Fix if necessary.
    last_shard_size = in_size % shard_size
    last_shard_size = shard_size if last_shard_size == 0 else last_shard_size

    def apply_fun_to_slice(slice_start, slice_size):
      input_slice = jax.tree.map(
          lambda array, axis: _maybe_slice(
              array, slice_start, slice_size, axis
          ),
          args,
          in_axes_,
      )
      return fun(*input_slice, **kwargs)

    remainder_shape_dtype = hk.eval_shape(
        partial(apply_fun_to_slice, 0, last_shard_size)
    )
    out_dtypes = jax.tree.map(lambda x: x.dtype, remainder_shape_dtype)
    out_shapes = jax.tree.map(lambda x: x.shape, remainder_shape_dtype)
    out_axes_ = _expand_axes(out_axes, remainder_shape_dtype)

    if num_extra_shards > 0:
      regular_shard_shape_dtype = hk.eval_shape(
          partial(apply_fun_to_slice, 0, shard_size)
      )
      shard_shapes = jax.tree.map(lambda x: x.shape, regular_shard_shape_dtype)

      def make_output_shape(axis, shard_shape, remainder_shape):
        return (
            shard_shape[:axis]
            + (shard_shape[axis] * num_extra_shards + remainder_shape[axis],)
            + shard_shape[axis + 1 :]
        )

      out_shapes = jax.tree.map(
          make_output_shape, out_axes_, shard_shapes, out_shapes
      )

    # Calls dynamic Update slice with different argument order.
    # This is here since tree_map only works with positional arguments.
    def dynamic_update_slice_in_dim(full_array, update, axis, i):
      return jax.lax.dynamic_update_slice_in_dim(full_array, update, i, axis)

    def compute_shard(outputs, slice_start, slice_size):
      slice_out = apply_fun_to_slice(slice_start, slice_size)
      update_slice = partial(dynamic_update_slice_in_dim, i=slice_start)
      return jax.tree.map(update_slice, outputs, slice_out, out_axes_)

    def scan_iteration(outputs, i):
      new_outputs = compute_shard(outputs, i, shard_size)
      return new_outputs, ()

    slice_starts = jnp.arange(0, in_size - shard_size + 1, shard_size)

    def allocate_buffer(dtype, shape):
      return jnp.zeros(shape, dtype=dtype)

    outputs = jax.tree.map(allocate_buffer, out_dtypes, out_shapes)

    if slice_starts.shape[0] > 0:
      outputs, _ = hk.scan(scan_iteration, outputs, slice_starts)

    if last_shard_size != shard_size:
      remainder_start = in_size - last_shard_size
      outputs = compute_shard(outputs, remainder_start, last_shard_size)

    return outputs

  return mapped_fn


def inference_subbatch(
    module: Callable[..., PytreeJaxArray],
    subbatch_size: int,
    batched_args: Sequence[PytreeJaxArray],
    nonbatched_args: Sequence[PytreeJaxArray],
    input_subbatch_dim: int = 0,
    output_subbatch_dim: int | None = None,
) -> PytreeJaxArray:
  """Run through subbatches (like batch apply but with split and concat)."""
  assert len(batched_args) > 0  # pylint: disable=g-explicit-length-test

  if hk.running_init():
    args = list(batched_args) + list(nonbatched_args)
    return module(*args)

  if output_subbatch_dim is None:
    output_subbatch_dim = input_subbatch_dim

  def run_module(*batched_args):
    args = list(batched_args) + list(nonbatched_args)
    res = module(*args)
    return res

  sharded_module = sharded_apply(
      run_module,
      shard_size=subbatch_size,
      in_axes=input_subbatch_dim,
      out_axes=output_subbatch_dim,
  )
  output = sharded_module(*batched_args)

  return output


================================================
FILE: src/alphafold3/model/components/utils.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utility functions for training AlphaFold and similar models."""

from collections import abc
import contextlib
import numbers

from alphafold3.model import features
import haiku as hk
import jax.numpy as jnp
import numpy as np


VALID_DTYPES = [np.float32, np.float64, np.int8, np.int32, np.int64, bool]


def remove_invalidly_typed_feats(
    batch: features.BatchDict,
) -> features.BatchDict:
  """Remove features of types we don't want to send to the TPU e.g. strings."""
  return {
      k: v
      for k, v in batch.items()
      if hasattr(v, 'dtype') and v.dtype in VALID_DTYPES
  }


def bfloat16_getter(next_getter, value, context):
  """Ensures that a bfloat16 parameter is provided by casting if necessary."""
  if context.original_dtype == jnp.bfloat16:
    if value.dtype != jnp.bfloat16:
      value = value.astype(jnp.bfloat16)
  return next_getter(value)


@contextlib.contextmanager
def bfloat16_context():
  with hk.custom_getter(bfloat16_getter):
    yield


def mask_mean(mask, value, axis=None, keepdims=False, eps=1e-10):
  """Masked mean."""

  mask_shape = mask.shape
  value_shape = value.shape

  assert len(mask_shape) == len(
      value_shape
  ), 'Shapes are not compatible, shapes: {}, {}'.format(mask_shape, value_shape)

  if isinstance(axis, numbers.Integral):
    axis = [axis]
  elif axis is None:
    axis = list(range(len(mask_shape)))
  assert isinstance(
      axis, abc.Iterable
  ), 'axis needs to be either an iterable, integer or "None"'

  broadcast_factor = 1.0
  for axis_ in axis:
    value_size = value_shape[axis_]
    mask_size = mask_shape[axis_]
    if mask_size == 1:
      broadcast_factor *= value_size
    else:
      error = f'Shapes are not compatible, shapes: {mask_shape}, {value_shape}'
      assert mask_size == value_size, error

  return jnp.sum(mask * value, keepdims=keepdims, axis=axis) / (
      jnp.maximum(
          jnp.sum(mask, keepdims=keepdims, axis=axis) * broadcast_factor, eps
      )
  )


================================================
FILE: src/alphafold3/model/confidence_types.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Confidence categories for predictions."""

import dataclasses
import enum
import json
from typing import Any, Self

from absl import logging
from alphafold3.model import model
import jax
import numpy as np


class StructureConfidenceFullEncoder(json.JSONEncoder):
  """JSON encoder for serializing confidence types."""

  def __init__(self, **kwargs):
    super().__init__(**(kwargs | dict(separators=(',', ':'))))

  def encode(self, o: 'StructureConfidenceFull'):
    # Cast to np.float64 before rounding, since casting to Python float will
    # cast to a 64 bit float, potentially undoing np.float32 rounding.
    atom_plddts = np.round(
        np.clip(np.asarray(o.atom_plddts, dtype=np.float64), 0.0, 99.99), 2
    ).astype(float)
    contact_probs = np.round(
        np.clip(np.asarray(o.contact_probs, dtype=np.float64), 0.0, 1.0), 2
    ).astype(float)
    pae = np.round(
        np.clip(np.asarray(o.pae, dtype=np.float64), 0.0, 99.9), 1
    ).astype(float)
    return """\
{
  "atom_chain_ids": %s,
  "atom_plddts": %s,
  "contact_probs": %s,
  "pae": %s,
  "token_chain_ids": %s,
  "token_res_ids": %s
}""" % (
        super().encode(o.atom_chain_ids),
        super().encode(list(atom_plddts)).replace('NaN', 'null'),
        super().encode([list(x) for x in contact_probs]).replace('NaN', 'null'),
        super().encode([list(x) for x in pae]).replace('NaN', 'null'),
        super().encode(o.token_chain_ids),
        super().encode(o.token_res_ids),
    )


def _dump_json(data: Any, indent: int | None = None) -> str:
  """Dumps a json string with JSON compatible NaN representation."""
  json_str = json.dumps(
      data,
      sort_keys=True,
      indent=indent,
      separators=(',', ': '),
  )
  return json_str.replace('NaN', 'null')


@enum.unique
class ConfidenceCategory(enum.Enum):
  """Confidence categories for AlphaFold predictions."""

  HIGH = 0
  MEDIUM = 1
  LOW = 2
  DISORDERED = 3

  @classmethod
  def from_char(cls, char: str) -> Self:
    match char:
      case 'H':
        return cls.HIGH
      case 'M':
        return cls.MEDIUM
      case 'L':
        return cls.LOW
      case 'D':
        return cls.DISORDERED
      case _:
        raise ValueError(
            f'Unknown character. Expected one of H, M, L or D; got: {char}'
        )

  def to_char(self) -> str:
    match self:
      case self.HIGH:
        return 'H'
      case self.MEDIUM:
        return 'M'
      case self.LOW:
        return 'L'
      case self.DISORDERED:
        return 'D'

  @classmethod
  def from_confidence_score(cls, confidence: float) -> Self:
    if 90 <= confidence <= 100:
      return cls.HIGH
    if 70 <= confidence < 90:
      return cls.MEDIUM
    if 50 <= confidence < 70:
      return cls.LOW
    if 0 <= confidence < 50:
      return cls.DISORDERED
    raise ValueError(f'Confidence score out of range [0, 100]: {confidence}')


@dataclasses.dataclass()
class AtomConfidence:
  """Dataclass for 1D per-atom confidences from AlphaFold."""

  chain_id: list[str]
  atom_number: list[int]
  confidence: list[float]
  confidence_category: list[ConfidenceCategory]

  def __post_init__(self):
    num_res = len(self.atom_number)
    if not all(
        len(v) == num_res
        for v in [self.chain_id, self.confidence, self.confidence_category]
    ):
      raise ValueError('All confidence fields must have the same length.')

  @classmethod
  def from_inference_result(
      cls, inference_result: model.InferenceResult
  ) -> Self:
    """Instantiates an AtomConfidence from a structure.

    Args:
      inference_result: Inference result from AlphaFold.

    Returns:
      Scores in AtomConfidence dataclass.
    """
    struc = inference_result.predicted_structure
    as_dict = {
        'chain_id': [],
        'atom_number': [],
        'confidence': [],
        'confidence_category': [],
    }
    for atom_number, atom in enumerate(struc.iter_atoms()):
      this_confidence = float(struc.atom_b_factor[atom_number])
      as_dict['chain_id'].append(atom['chain_id'])
      as_dict['atom_number'].append(atom_number)
      as_dict['confidence'].append(round(this_confidence, 2))
      as_dict['confidence_category'].append(
          ConfidenceCategory.from_confidence_score(this_confidence)
      )
    return cls(**as_dict)

  @classmethod
  def from_json(cls, json_string: str) -> Self:
    """Instantiates a AtomConfidence from a json string."""
    input_dict = json.loads(json_string)
    input_dict['confidence_category'] = [
        ConfidenceCategory.from_char(k)
        for k in input_dict['confidence_category']
    ]
    return cls(**input_dict)

  def to_json(self) -> str:
    output = dataclasses.asdict(self)
    output['confidence_category'] = [
        k.to_char() for k in output['confidence_category']
    ]
    output['atom_number'] = [int(k) for k in output['atom_number']]
    return _dump_json(output)


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class StructureConfidenceSummary:
  """Dataclass for the summary of structure scores from AlphaFold.

  Attributes:
   ptm: Predicted TM global score.
   iptm: Interface predicted TM global score.
   ranking_score: Ranking score extracted from CIF metadata.
   fraction_disordered: Fraction disordered, measured with RASA.
   has_clash: Has significant clashing.
   chain_pair_pae_min: [num_chains, num_chains] Minimum cross chain PAE.
   chain_pair_iptm: [num_chains, num_chains] Chain pair ipTM.
   chain_ptm: [num_chains] Chain pTM.
   chain_iptm: [num_chains] Mean cross chain ipTM for a chain.
  """

  ptm: float
  iptm: float
  ranking_score: float
  fraction_disordered: float
  has_clash: float
  chain_pair_pae_min: np.ndarray
  chain_pair_iptm: np.ndarray
  chain_ptm: np.ndarray
  chain_iptm: np.ndarray

  @classmethod
  def from_inference_result(
      cls, inference_result: model.InferenceResult
  ) -> Self:
    """Returns a new instance based on a given inference result."""
    return cls(
        ptm=float(inference_result.metadata['ptm']),
        iptm=float(inference_result.metadata['iptm']),
        ranking_score=float(inference_result.metadata['ranking_score']),
        fraction_disordered=float(
            inference_result.metadata['fraction_disordered']
        ),
        has_clash=float(inference_result.metadata['has_clash']),
        chain_pair_pae_min=inference_result.metadata['chain_pair_pae_min'],
        chain_pair_iptm=inference_result.metadata['chain_pair_iptm'],
        chain_ptm=inference_result.metadata['iptm_ichain'],
        chain_iptm=inference_result.metadata['iptm_xchain'],
    )

  @classmethod
  def from_json(cls, json_string: str) -> Self:
    """Returns a new instance from a given json string."""
    return cls(**json.loads(json_string))

  def to_json(self) -> str:
    def convert(data):
      if isinstance(data, np.ndarray):
        # Cast to np.float64 before rounding, since casting to Python float will
        # cast to a 64 bit float, potentially undoing np.float32 rounding.
        rounded_data = np.round(data.astype(np.float64), decimals=2).tolist()
      else:
        rounded_data = np.round(data, decimals=2)
      return rounded_data

    return _dump_json(jax.tree.map(convert, dataclasses.asdict(self)), indent=1)


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class StructureConfidenceFull:
  """Dataclass for full structure data from AlphaFold."""

  pae: np.ndarray
  token_chain_ids: list[str]
  token_res_ids: list[int]
  atom_plddts: list[float]
  atom_chain_ids: list[str]
  contact_probs: np.ndarray  # [num_tokens, num_tokens]

  @classmethod
  def from_inference_result(
      cls, inference_result: model.InferenceResult
  ) -> Self:
    """Returns a new instance based on a given inference result."""

    pae = inference_result.numerical_data['full_pae']
    if not isinstance(pae, np.ndarray):
      logging.info('%s', type(pae))
      raise TypeError('pae should be a numpy array.')

    contact_probs = inference_result.numerical_data['contact_probs']
    if not isinstance(contact_probs, np.ndarray):
      logging.info('%s', type(contact_probs))
      raise TypeError('contact_probs should be a numpy array.')

    struc = inference_result.predicted_structure
    chain_ids = struc.chain_id.tolist()
    atom_plddts = struc.atom_b_factor.tolist()
    token_chain_ids = [
        str(token_id)
        for token_id in inference_result.metadata['token_chain_ids']
    ]
    token_res_ids = [
        int(token_id) for token_id in inference_result.metadata['token_res_ids']
    ]
    return cls(
        pae=pae,
        token_chain_ids=token_chain_ids,
        token_res_ids=token_res_ids,
        atom_plddts=atom_plddts,
        atom_chain_ids=chain_ids,
        contact_probs=contact_probs,
    )

  @classmethod
  def from_json(cls, json_string: str) -> Self:
    """Returns a new instance from a given json string."""
    return cls(**json.loads(json_string))

  def to_json(self) -> str:
    """Converts StructureConfidenceFull to json string."""
    return json.dumps(self, cls=StructureConfidenceFullEncoder)


================================================
FILE: src/alphafold3/model/confidences.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions for extracting and processing confidences from model outputs."""
import warnings

from absl import logging
from alphafold3 import structure
from alphafold3.constants import residue_names
from alphafold3.cpp import mkdssp
import jax.numpy as jnp
import numpy as np
from scipy import spatial


# From Sander & Rost 1994 https://doi.org/10.1002/prot.340200303
MAX_ACCESSIBLE_SURFACE_AREA = {
    'ALA': 106.0,
    'ARG': 248.0,
    'ASN': 157.0,
    'ASP': 163.0,
    'CYS': 135.0,
    'GLN': 198.0,
    'GLU': 194.0,
    'GLY': 84.0,
    'HIS': 184.0,
    'ILE': 169.0,
    'LEU': 164.0,
    'LYS': 205.0,
    'MET': 188.0,
    'PHE': 197.0,
    'PRO': 136.0,
    'SER': 130.0,
    'THR': 142.0,
    'TRP': 227.0,
    'TYR': 222.0,
    'VAL': 142.0,
}

# Weights for ranking confidence.
_IPTM_WEIGHT = 0.8
_FRACTION_DISORDERED_WEIGHT = 0.5
_CLASH_PENALIZATION_WEIGHT = 100.0


def windowed_solvent_accessible_area(cif: str, window: int = 25) -> np.ndarray:
  """Implementation of AlphaFold-RSA.

  AlphaFold-RSA defined in https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9601767.

  Args:
    cif: Raw cif string.
    window: The window over which to average accessible surface area

  Returns:
    An array of size num_res that predicts disorder by using windowed solvent
    accessible surface area.
  """
  result = mkdssp.get_dssp(cif, calculate_surface_accessibility=True)
  parse_row = False
  rasa = []
  for row in result.splitlines():
    if parse_row:
      aa = row[13:14]
      if aa == '!':
        continue
      aa3 = residue_names.PROTEIN_COMMON_ONE_TO_THREE.get(aa, 'ALA')
      max_acc = MAX_ACCESSIBLE_SURFACE_AREA[aa3]
      acc = int(row[34:38])
      norm_acc = acc / max_acc
      if norm_acc > 1.0:
        norm_acc = 1.0
      rasa.append(norm_acc)
    if row.startswith('  #  RESIDUE'):
      parse_row = True

  half_w = (window - 1) // 2
  pad_rasa = np.pad(rasa, (half_w, half_w), 'reflect')
  rasa = np.convolve(pad_rasa, np.ones(window), 'valid') / window
  return rasa


def fraction_disordered(
    struc: structure.Structure, rasa_disorder_cutoff: float = 0.581
) -> float:
  """Compute fraction of protein residues that are disordered.

  Args:
    struc: A structure to compute rASA metrics on.
    rasa_disorder_cutoff: The threshold at which residues are considered
      disordered. Default value taken from
      https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9601767.

  Returns:
    The fraction of protein residues that are disordered
    (rasa > rasa_disorder_cutoff).
  """
  struc = struc.filter_to_entity_type(protein=True)
  rasa = []
  seq_rasa = {}
  for chain_id, chain_seq in struc.chain_single_letter_sequence().items():
    if chain_seq in seq_rasa:
      # We assume that identical sequences have approximately similar rasa
      # values to speed up the computation.
      rasa.extend(seq_rasa[chain_seq])
      continue
    chain_struc = struc.filter(chain_id=chain_id)
    # Rename the chain to 'A' as MKDSSP supports only single letter chain IDs.
    chain_struc = chain_struc.rename_chain_ids(new_id_by_old_id={chain_id: 'A'})
    try:
      rasa_per_residue = windowed_solvent_accessible_area(
          chain_struc.to_mmcif()
      )
      seq_rasa[chain_seq] = rasa_per_residue
      rasa.extend(rasa_per_residue)
    except (ValueError, RuntimeError) as e:
      logging.warning('%s: rasa calculation failed: %s', struc.name, e)

  if not rasa:
    return 0.0
  return np.mean(np.array(rasa) > rasa_disorder_cutoff)


def has_clash(
    struc: structure.Structure,
    cutoff_radius: float = 1.1,
    min_clashes_for_overlap: int = 100,
    min_fraction_for_overlap: float = 0.5,
) -> bool:
  """Determine whether the structure has at least one clashing chain.

  A clashing chain is defined as having greater than 100 polymer atoms within
  1.1A of another polymer atom, or having more than 50% of the chain with
  clashing atoms.

  Args:
    struc: A structure to get clash metrics for.
    cutoff_radius: atom distances under this threshold are considered a clash.
    min_clashes_for_overlap: The minimum number of atom-atom clashes for a chain
      to be considered overlapping.
    min_fraction_for_overlap: The minimum fraction of atoms within a chain that
      are clashing for the chain to be considered overlapping.

  Returns:
    True if the structure has at least one clashing chain.
  """
  struc = struc.filter_to_entity_type(protein=True, rna=True, dna=True)
  if not struc.chains:
    return False
  coords = struc.coords
  coord_kdtree = spatial.cKDTree(coords)
  clashes_per_atom = coord_kdtree.query_ball_point(
      coords, p=2.0, r=cutoff_radius
  )
  per_atom_has_clash = np.zeros(len(coords), dtype=np.int32)
  for atom_idx, clashing_indices in enumerate(clashes_per_atom):
    for clashing_idx in clashing_indices:
      if np.abs(struc.res_id[atom_idx] - struc.res_id[clashing_idx]) > 1 or (
          struc.chain_id[atom_idx] != struc.chain_id[clashing_idx]
      ):
        per_atom_has_clash[atom_idx] = True
        break
  for chain_id in struc.chains:
    mask = struc.chain_id == chain_id
    num_atoms = np.sum(mask)
    if num_atoms == 0:
      continue
    num_clashes = np.sum(per_atom_has_clash * mask)
    frac_clashes = num_clashes / num_atoms
    if (
        num_clashes > min_clashes_for_overlap
        or frac_clashes > min_fraction_for_overlap
    ):
      return True
  return False


def get_ranking_score(
    ptm: float, iptm: float, fraction_disordered_: float, has_clash_: bool
) -> float:
  # ipTM is NaN for single chain structures. Use pTM for such cases.
  if np.isnan(iptm):
    ptm_iptm_average = ptm
  else:
    ptm_iptm_average = _IPTM_WEIGHT * iptm + (1.0 - _IPTM_WEIGHT) * ptm
  return (
      ptm_iptm_average
      + _FRACTION_DISORDERED_WEIGHT * fraction_disordered_
      - _CLASH_PENALIZATION_WEIGHT * has_clash_
  )


def rank_metric(
    full_pde: jnp.ndarray | np.ndarray, contact_probs: jnp.ndarray | np.ndarray
) -> jnp.ndarray | np.ndarray:
  """Compute the metric that will be used to rank predictions, higher is better.

  Args:
    full_pde: A [num_samples, num_tokens,num_tokens] matrix of predicted
      distance errors between pairs of tokens.
    contact_probs: A [num_tokens, num_tokens] matrix consisting of the
      probability of contact (<8A) that is returned from the distogram head.

  Returns:
    A scalar that can be used to rank (higher is better).
  """
  if not isinstance(full_pde, type(contact_probs)):
    raise ValueError('full_pde and contact_probs must be of the same type.')

  if isinstance(full_pde, np.ndarray):
    sum_fn = np.sum
  elif isinstance(full_pde, jnp.ndarray):
    sum_fn = jnp.sum
  else:
    raise ValueError('full_pde must be a numpy array or a jax array.')
  # It was found that taking the contact_map weighted average was better than
  # just the predicted distance error on its own.
  return -sum_fn(full_pde * contact_probs[None, :, :], axis=(-2, -1)) / (
      sum_fn(contact_probs) + 1e-6
  )


def weighted_mean(mask, value, axis):
  return np.mean(mask * value, axis=axis) / (1e-8 + np.mean(mask, axis=axis))


def pde_single(
    num_tokens: int,
    asym_ids: np.ndarray,
    full_pde: np.ndarray,
    contact_probs: np.ndarray,
) -> tuple[np.ndarray, np.ndarray, np.ndarray]:
  """Compute 1D PDE summaries.

  Args:
    num_tokens: The number of tokens (not including padding).
    asym_ids: The asym_ids (array of shape num_tokens).
    full_pde: A [num_samples, num_tokens, num_tokens] matrix of predicted
      distance errors.
    contact_probs: A [num_tokens, num_tokens] matrix consisting of the
      probability of contact (<8A) that is returned from the distogram head.

  Returns:
    A tuple (ichain, xchain, full_chain) where:
      `ichain` is a [num_samples, num_chains] matrix where the
      value assigned to each chain is an average of the full PDE matrix over all
      its within-chain interactions, weighted by `contact_probs`.
      `xchain` is a [num_samples, num_chains] matrix where the
      value assigned to each chain is an average of the full PDE matrix over all
      its cross-chain interactions, weighted by `contact_probs`.
      `full_chain` is a [num_samples, num_tokens] matrix where the
      value assigned to each token is an average of it PDE against all tokens,
      weighted by `contact_probs`.
  """

  full_pde = full_pde[:, :num_tokens, :num_tokens]
  contact_probs = contact_probs[:num_tokens, :num_tokens]
  asym_ids = asym_ids[:num_tokens]
  unique_asym_ids = np.unique(asym_ids)
  num_chains = len(unique_asym_ids)
  num_samples = full_pde.shape[0]

  asym_ids = asym_ids[None]
  contact_probs = contact_probs[None]

  ichain = np.zeros((num_samples, num_chains))
  xchain = np.zeros((num_samples, num_chains))

  for idx, asym_id in enumerate(unique_asym_ids):
    my_asym_id = asym_ids == asym_id
    imask = my_asym_id[:, :, None] * my_asym_id[:, None, :]
    xmask = my_asym_id[:, :, None] * ~my_asym_id[:, None, :]
    imask = imask * contact_probs
    xmask = xmask * contact_probs
    ichain[:, idx] = weighted_mean(mask=imask, value=full_pde, axis=(-2, -1))
    xchain[:, idx] = weighted_mean(mask=xmask, value=full_pde, axis=(-2, -1))

  full_chain = weighted_mean(mask=contact_probs, value=full_pde, axis=(-1,))

  return ichain, xchain, full_chain


def chain_pair_pde(
    num_tokens: int, asym_ids: np.ndarray, full_pde: np.ndarray
) -> tuple[np.ndarray, np.ndarray]:
  """Compute predicted distance errors for all pairs of chains.

  Args:
    num_tokens: The number of tokens (not including padding).
    asym_ids: The asym_ids (array of shape num_tokens).
    full_pde: A [num_samples, num_tokens, num_tokens] matrix of predicted
      distance errors.

  Returns:
    chain_pair_pred_err_mean - a [num_chains, num_chains] matrix with average
      per chain-pair predicted distance error.
    chain_pair_pred_err_min - a [num_chains, num_chains] matrix with min
      per chain-pair predicted distance error.
  """
  full_pde = full_pde[:, :num_tokens, :num_tokens]
  asym_ids = asym_ids[:num_tokens]
  unique_asym_ids = np.unique(asym_ids)
  num_chains = len(unique_asym_ids)
  num_samples = full_pde.shape[0]
  chain_pair_pred_err_mean = np.zeros((num_samples, num_chains, num_chains))
  chain_pair_pred_err_min = np.zeros((num_samples, num_chains, num_chains))

  for idx1, asym_id_1 in enumerate(unique_asym_ids):
    subset = full_pde[:, asym_ids == asym_id_1, :]
    for idx2, asym_id_2 in enumerate(unique_asym_ids):
      subsubset = subset[:, :, asym_ids == asym_id_2]
      chain_pair_pred_err_mean[:, idx1, idx2] = np.mean(subsubset, axis=(1, 2))
      chain_pair_pred_err_min[:, idx1, idx2] = np.min(subsubset, axis=(1, 2))
  return chain_pair_pred_err_mean, chain_pair_pred_err_min


def weighted_nanmean(
    value: np.ndarray, mask: np.ndarray, axis: int
) -> np.ndarray:
  """Nan-mean with weighting -- empty slices return NaN."""
  assert mask.shape == value.shape
  assert not np.isnan(mask).all()

  nan_idxs = np.where(np.isnan(value))
  # Need to NaN the mask to get the correct denominator weighting.
  mask_with_nan = mask.copy()
  mask_with_nan[nan_idxs] = np.nan
  with warnings.catch_warnings():
    # Mean of empty slice is ok and should return a NaN.
    warnings.filterwarnings(action='ignore', message='Mean of empty slice')
    warnings.filterwarnings(
        action='ignore', message='invalid value encountered in (scalar )?divide'
    )
    return np.nanmean(value * mask_with_nan, axis=axis) / np.nanmean(
        mask_with_nan, axis=axis
    )


def chain_pair_pae(
    *,
    num_tokens: int,
    asym_ids: np.ndarray,
    full_pae: np.ndarray,
    mask: np.ndarray | None = None,
    contact_probs: np.ndarray | None = None,
) -> tuple[np.ndarray, np.ndarray, np.ndarray]:
  """Compute predicted errors for all pairs of chains.

  Args:
    num_tokens: The number of tokens (not including padding).
    asym_ids: The asym_ids (array of shape num_tokens).
    full_pae: A [num_samples, num_tokens, num_tokens] matrix of predicted
      errors.
    mask: A [num_tokens, num_tokens] mask matrix.
    contact_probs: A [num_tokens, num_tokens] matrix consisting of the
      probability of contact (<8A) that is returned from the distogram head.

  Returns:
    chain_pair_pred_err_mean - a [num_chains, num_chains] matrix with average
      per chain-pair predicted error.
  """
  if mask is None:
    mask = np.ones(shape=full_pae.shape[1:], dtype=bool)
  if contact_probs is None:
    contact_probs = np.ones(shape=full_pae.shape[1:], dtype=float)
  assert mask.shape == full_pae.shape[1:]

  full_pae = full_pae[:, :num_tokens, :num_tokens]
  mask = mask[:num_tokens, :num_tokens]
  asym_ids = asym_ids[:num_tokens]
  contact_probs = contact_probs[:num_tokens, :num_tokens]
  unique_asym_ids = np.unique(asym_ids)
  num_chains = len(unique_asym_ids)
  num_samples = full_pae.shape[0]
  chain_pair_pred_err_mean = np.zeros((num_samples, num_chains, num_chains))
  chain_pair_pred_err_min = np.zeros((num_samples, num_chains, num_chains))

  for idx1, asym_id_1 in enumerate(unique_asym_ids):
    subset = full_pae[:, asym_ids == asym_id_1, :]
    subset_mask = mask[asym_ids == asym_id_1, :]
    subset_contact_probs = contact_probs[asym_ids == asym_id_1, :]
    for idx2, asym_id_2 in enumerate(unique_asym_ids):
      subsubset = subset[:, :, asym_ids == asym_id_2]
      subsubset_mask = subset_mask[:, asym_ids == asym_id_2]
      subsubset_contact_probs = subset_contact_probs[:, asym_ids == asym_id_2]
      (flat_mask_idxs,) = np.where(subsubset_mask.flatten() > 0)
      flat_subsubset = subsubset.reshape([num_samples, -1])
      flat_contact_probs = subsubset_contact_probs.flatten()
      # A ligand chain will have no valid frames if it contains fewer than
      # three non-colinear atoms (e.g. a sodium ion).
      if not flat_mask_idxs.size:
        chain_pair_pred_err_mean[:, idx1, idx2] = np.nan
        chain_pair_pred_err_min[:, idx1, idx2] = np.nan
      else:
        chain_pair_pred_err_min[:, idx1, idx2] = np.min(
            flat_subsubset[:, flat_mask_idxs], axis=1
        )
        chain_pair_pred_err_mean[:, idx1, idx2] = weighted_mean(
            mask=flat_contact_probs[flat_mask_idxs],
            value=flat_subsubset[:, flat_mask_idxs],
            axis=-1,
        )
  return chain_pair_pred_err_mean, chain_pair_pred_err_min, unique_asym_ids


def reduce_chain_pair(
    *,
    chain_pair_met: np.ndarray,
    num_chain_tokens: np.ndarray,
    agg_over_col: bool,
    agg_type: str,
    weight_method: str,
) -> tuple[np.ndarray, np.ndarray]:
  """Compute 1D summaries from a chain-pair summary.

  Args:
    chain_pair_met: A [num_samples, num_chains, num_chains] aggregate matrix.
    num_chain_tokens: A [num_chains] array of number of tokens for each chain.
      Used for 'per_token' weighting.
    agg_over_col: Whether to aggregate the PAE over rows (i.e. average error
      when aligned to me) or columns (i.e. my average error when aligned to all
      others.)
    agg_type: The type of aggregation to use, 'mean' or 'min'.
    weight_method: The method to use for weighting the PAE, 'per_token' or
      'per_chain'.

  Returns:
    A tuple (ichain, xchain) where:
      `ichain` is a [num_samples, num_chains] matrix where the
      value assigned to each chain is an average of the full PAE matrix over all
      its within-chain interactions, weighted by `contact_probs`.
      `xchain` is a [num_samples, num_chains] matrix where the
      value assigned to each chain is an average of the full PAE matrix over all
      its cross-chain interactions, weighted by `contact_probs`.
  """
  num_samples, num_chains, _ = chain_pair_met.shape

  ichain = chain_pair_met.diagonal(axis1=-2, axis2=-1)

  if weight_method == 'per_chain':
    chain_weight = np.ones((num_chains,), dtype=float)
  elif weight_method == 'per_token':
    chain_weight = num_chain_tokens
  else:
    raise ValueError(f'Unknown weight method: {weight_method}')

  if agg_over_col:
    agg_axis = -1
  else:
    agg_axis = -2

  if agg_type == 'mean':
    weight = np.ones((num_samples, num_chains, num_chains), dtype=float)
    weight -= np.eye(num_chains, dtype=float)
    weight *= chain_weight[None] * chain_weight[:, None]
    xchain = weighted_nanmean(chain_pair_met, mask=weight, axis=agg_axis)
  elif agg_type == 'min':
    is_self = np.eye(num_chains)
    with warnings.catch_warnings():
      # Min over empty slice is ok and should return a NaN.
      warnings.filterwarnings('ignore', message='All-NaN slice encountered')
      xchain = np.nanmin(chain_pair_met + 1e8 * is_self, axis=agg_axis)
  else:
    raise ValueError(f'Unknown aggregation method: {agg_type}')

  return ichain, xchain


def pae_metrics(
    num_tokens: int,
    asym_ids: np.ndarray,
    full_pae: np.ndarray,
    mask: np.ndarray,
    contact_probs: np.ndarray,
    tm_adjusted_pae: np.ndarray,
):
  """PAE aggregate metrics."""
  assert mask.shape == full_pae.shape[1:]
  assert contact_probs.shape == full_pae.shape[1:]

  chain_pair_contact_weighted, _, unique_asym_ids = chain_pair_pae(
      num_tokens=num_tokens,
      asym_ids=asym_ids,
      full_pae=full_pae,
      mask=mask,
      contact_probs=contact_probs,
  )

  ret = {}
  ret['chain_pair_pae_mean'], ret['chain_pair_pae_min'], _ = chain_pair_pae(
      num_tokens=num_tokens,
      asym_ids=asym_ids,
      full_pae=full_pae,
      mask=mask,
  )
  chain_pair_iptm = np.stack(
      [
          chain_pairwise_predicted_tm_scores(
              tm_adjusted_pae=sample_tm_adjusted_pae[:num_tokens],
              asym_id=asym_ids[:num_tokens],
              pair_mask=mask[:num_tokens, :num_tokens],
          )
          for sample_tm_adjusted_pae in tm_adjusted_pae
      ],
      axis=0,
  )

  num_chain_tokens = np.array(
      [sum(asym_ids == asym_id) for asym_id in unique_asym_ids]
  )

  def reduce_chain_pair_fn(chain_pair: np.ndarray):
    def inner(agg_over_col):
      ichain_pae, xchain_pae = reduce_chain_pair(
          num_chain_tokens=num_chain_tokens,
          chain_pair_met=chain_pair,
          agg_over_col=agg_over_col,
          agg_type='mean',
          weight_method='per_chain',
      )
      return ichain_pae, xchain_pae

    ichain, xchain_row_agg = inner(False)
    _, xchain_col_agg = inner(True)
    with warnings.catch_warnings():
      # Mean of empty slice is ok and should return a NaN.
      warnings.filterwarnings(action='ignore', message='Mean of empty slice')
      xchain = np.nanmean(
          np.stack([xchain_row_agg, xchain_col_agg], axis=0), axis=0
      )
    return ichain, xchain

  pae_ichain, pae_xchain = reduce_chain_pair_fn(chain_pair_contact_weighted)
  iptm_ichain, iptm_xchain = reduce_chain_pair_fn(chain_pair_iptm)

  ret.update({
      'chain_pair_iptm': chain_pair_iptm,
      'iptm_ichain': iptm_ichain,
      'iptm_xchain': iptm_xchain,
      'pae_ichain': pae_ichain,
      'pae_xchain': pae_xchain,
  })

  return ret


def get_iptm_xchain(chain_pair_iptm: np.ndarray) -> np.ndarray:
  """Cross chain aggregate ipTM."""
  num_samples, num_chains, _ = chain_pair_iptm.shape
  weight = np.ones((num_samples, num_chains, num_chains), dtype=float)
  weight -= np.eye(num_chains, dtype=float)
  xchain_row_agg = weighted_nanmean(chain_pair_iptm, mask=weight, axis=-2)
  xchain_col_agg = weighted_nanmean(chain_pair_iptm, mask=weight, axis=-1)
  with warnings.catch_warnings():
    # Mean of empty slice is ok and should return a NaN.
    warnings.filterwarnings(action='ignore', message='Mean of empty slice')
    iptm_xchain = np.nanmean(
        np.stack([xchain_row_agg, xchain_col_agg], axis=0), axis=0
    )
  return iptm_xchain


def predicted_tm_score(
    tm_adjusted_pae: np.ndarray,
    pair_mask: np.ndarray,
    asym_id: np.ndarray,
    interface: bool = False,
) -> float:
  """Computes predicted TM alignment or predicted interface TM alignment score.

  Args:
    tm_adjusted_pae: [num_res, num_res] Relevant tensor for computing TMScore
      values.
    pair_mask: A [num_res, num_res] mask. The TM score will only aggregate over
      masked-on entries.
    asym_id: [num_res] asymmetric unit ID (the chain ID). Only needed for ipTM
      calculation, i.e. when interface=True.
    interface: If True, the interface predicted TM score is computed. If False,
      the predicted TM score without any residue pair restrictions is computed.

  Returns:
   score: pTM or ipTM score.
  """
  num_tokens, _ = tm_adjusted_pae.shape
  if tm_adjusted_pae.shape != (num_tokens, num_tokens):
    raise ValueError(
        f'Bad tm_adjusted_pae shape, expected ({num_tokens, num_tokens}), got '
        f'{tm_adjusted_pae.shape}.'
    )

  if pair_mask.shape != (num_tokens, num_tokens):
    raise ValueError(
        f'Bad pair_mask shape, expected ({num_tokens, num_tokens}), got '
        f'{pair_mask.shape}.'
    )
  if pair_mask.dtype != bool:
    raise TypeError(f'Bad pair mask type, expected bool, got {pair_mask.dtype}')
  if asym_id.shape[0] != num_tokens:
    raise ValueError(
        f'Bad asym_id shape, expected ({num_tokens},), got {asym_id.shape}.'
    )

  # Create pair mask.
  if interface:
    pair_mask = pair_mask * (asym_id[:, None] != asym_id[None, :])

  # Ions and other ligands with colinear atoms have ill-defined frames.
  if pair_mask.sum() == 0:
    return np.nan

  normed_residue_mask = pair_mask / (
      1e-8 + np.sum(pair_mask, axis=-1, keepdims=True)
  )
  per_alignment = np.sum(tm_adjusted_pae * normed_residue_mask, axis=-1)
  return per_alignment.max()


def chain_pairwise_predicted_tm_scores(
    tm_adjusted_pae: np.ndarray,
    pair_mask: np.ndarray,
    asym_id: np.ndarray,
) -> np.ndarray:
  """Compute predicted TM (pTM) between each pair of chains independently.

  Args:
    tm_adjusted_pae: [num_res, num_res] Relevant tensor for computing TMScore
      values.
    pair_mask: A [num_res, num_res] mask specifying which frames are valid.
      Invalid frames can be the result of chains with not enough atoms (e.g.
      ions).
    asym_id: [num_res] asymmetric unit ID (the chain ID).

  Returns:
    A [num_chains, num_chains] matrix, where row i, column j indicates the
    predicted TM-score for the interface between chain i and chain j.
  """
  unique_chains = list(np.unique(asym_id))
  num_chains = len(unique_chains)
  all_pairs_iptms = np.zeros((num_chains, num_chains))
  for i, chain_i in enumerate(unique_chains):
    chain_i_mask = asym_id == chain_i
    for j, chain_j in enumerate(unique_chains[i:]):
      chain_j_mask = asym_id == chain_j
      mask = chain_i_mask | chain_j_mask
      (indices,) = np.where(mask)
      is_interface = chain_i != chain_j
      indices = np.ix_(indices, indices)
      iptm = predicted_tm_score(
          tm_adjusted_pae=tm_adjusted_pae[indices],
          pair_mask=pair_mask[indices],
          asym_id=asym_id[mask],
          interface=is_interface,
      )
      all_pairs_iptms[i, i + j] = iptm
      all_pairs_iptms[i + j, i] = iptm
  return all_pairs_iptms


================================================
FILE: src/alphafold3/model/data3.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Protein features that are computed from parsed mmCIF objects."""

from collections.abc import Mapping
import datetime
from typing import TypeAlias

from alphafold3.constants import residue_names
from alphafold3.cpp import msa_profile
from alphafold3.model import protein_data_processing
import numpy as np


FeatureDict: TypeAlias = Mapping[str, np.ndarray]


def get_profile_features(
    msa: np.ndarray, deletion_matrix: np.ndarray
) -> FeatureDict:
  """Returns the MSA profile and deletion_mean features."""
  num_restypes = residue_names.POLYMER_TYPES_NUM_WITH_UNKNOWN_AND_GAP
  profile = msa_profile.compute_msa_profile(
      msa=msa, num_residue_types=num_restypes
  )

  return {
      'profile': profile.astype(np.float32),
      'deletion_mean': np.mean(deletion_matrix, axis=0),
  }


def fix_template_features(
    template_features: FeatureDict, num_res: int
) -> FeatureDict:
  """Convert template features to AlphaFold 3 format.

  Args:
    template_features: Template features for the protein.
    num_res: The length of the amino acid sequence of the protein.

  Returns:
    Updated template_features for the chain.
  """
  if not template_features['template_aatype'].shape[0]:
    template_features = empty_template_features(num_res)
  else:
    template_release_timestamp = [
        _get_timestamp(x.decode('utf-8'))
        for x in template_features['template_release_date']
    ]

    # Convert from atom37 to dense atom
    dense_atom_indices = np.take(
        protein_data_processing.PROTEIN_AATYPE_DENSE_ATOM_TO_ATOM37,
        template_features['template_aatype'],
        axis=0,
    )

    atom_mask = np.take_along_axis(
        template_features['template_all_atom_masks'], dense_atom_indices, axis=2
    )
    atom_positions = np.take_along_axis(
        template_features['template_all_atom_positions'],
        dense_atom_indices[..., None],
        axis=2,
    )
    atom_positions *= atom_mask[..., None]

    template_features = {
        'template_aatype': template_features['template_aatype'],
        'template_atom_mask': atom_mask.astype(np.int32),
        'template_atom_positions': atom_positions.astype(np.float32),
        'template_domain_names': np.array(
            template_features['template_domain_names'], dtype=object
        ),
        'template_release_timestamp': np.array(
            template_release_timestamp, dtype=np.float32
        ),
    }
  return template_features


def empty_template_features(num_res: int) -> FeatureDict:
  """Creates a fully masked out template features to allow padding to work.

  Args:
    num_res: The length of the target chain.

  Returns:
    Empty template features for the chain.
  """
  template_features = {
      'template_aatype': np.zeros(num_res, dtype=np.int32)[None, ...],
      'template_atom_mask': np.zeros(
          (num_res, protein_data_processing.NUM_DENSE), dtype=np.int32
      )[None, ...],
      'template_atom_positions': np.zeros(
          (num_res, protein_data_processing.NUM_DENSE, 3), dtype=np.float32
      )[None, ...],
      'template_domain_names': np.array([b''], dtype=object),
      'template_release_timestamp': np.array([0.0], dtype=np.float32),
  }
  return template_features


def _get_timestamp(date_str: str):
  dt = datetime.datetime.fromisoformat(date_str)
  dt = dt.replace(tzinfo=datetime.timezone.utc)
  return dt.timestamp()


================================================
FILE: src/alphafold3/model/data_constants.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Constants shared across modules in the AlphaFold data pipeline."""

from alphafold3.constants import residue_names

MSA_GAP_IDX = residue_names.PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_AND_GAP.index(
    '-'
)

# Feature groups.
NUM_SEQ_NUM_RES_MSA_FEATURES = ('msa', 'msa_mask', 'deletion_matrix')
NUM_SEQ_MSA_FEATURES = ('msa_species_identifiers',)
TEMPLATE_FEATURES = (
    'template_aatype',
    'template_atom_positions',
    'template_atom_mask',
)
MSA_PAD_VALUES = {'msa': MSA_GAP_IDX, 'msa_mask': 1, 'deletion_matrix': 0}


================================================
FILE: src/alphafold3/model/feat_batch.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Batch dataclass."""
import dataclasses
from typing import Self

from alphafold3.model import features
import jax


@dataclasses.dataclass(frozen=True)
class Batch:
  """Dataclass containing batch."""

  msa: features.MSA
  templates: features.Templates
  token_features: features.TokenFeatures
  ref_structure: features.RefStructure
  predicted_structure_info: features.PredictedStructureInfo
  polymer_ligand_bond_info: features.PolymerLigandBondInfo
  ligand_ligand_bond_info: features.LigandLigandBondInfo
  pseudo_beta_info: features.PseudoBetaInfo
  atom_cross_att: features.AtomCrossAtt
  convert_model_output: features.ConvertModelOutput
  frames: features.Frames

  @property
  def num_res(self) -> int:
    return self.token_features.aatype.shape[-1]

  @classmethod
  def from_data_dict(cls, batch: features.BatchDict) -> Self:
    """Construct batch object from dictionary."""
    return cls(
        msa=features.MSA.from_data_dict(batch),
        templates=features.Templates.from_data_dict(batch),
        token_features=features.TokenFeatures.from_data_dict(batch),
        ref_structure=features.RefStructure.from_data_dict(batch),
        predicted_structure_info=features.PredictedStructureInfo.from_data_dict(
            batch
        ),
        polymer_ligand_bond_info=features.PolymerLigandBondInfo.from_data_dict(
            batch
        ),
        ligand_ligand_bond_info=features.LigandLigandBondInfo.from_data_dict(
            batch
        ),
        pseudo_beta_info=features.PseudoBetaInfo.from_data_dict(batch),
        atom_cross_att=features.AtomCrossAtt.from_data_dict(batch),
        convert_model_output=features.ConvertModelOutput.from_data_dict(batch),
        frames=features.Frames.from_data_dict(batch),
    )

  def as_data_dict(self) -> features.BatchDict:
    """Converts batch object to dictionary."""
    output = {
        **self.msa.as_data_dict(),
        **self.templates.as_data_dict(),
        **self.token_features.as_data_dict(),
        **self.ref_structure.as_data_dict(),
        **self.predicted_structure_info.as_data_dict(),
        **self.polymer_ligand_bond_info.as_data_dict(),
        **self.ligand_ligand_bond_info.as_data_dict(),
        **self.pseudo_beta_info.as_data_dict(),
        **self.atom_cross_att.as_data_dict(),
        **self.convert_model_output.as_data_dict(),
        **self.frames.as_data_dict(),
    }
    return output


jax.tree_util.register_dataclass(
    Batch,
    data_fields=[f.name for f in dataclasses.fields(Batch)],
    meta_fields=[],
)


================================================
FILE: src/alphafold3/model/features.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Data-side of the input features processing."""

import dataclasses
import datetime
import itertools
from typing import Any, Self, TypeAlias

from absl import logging
from alphafold3 import structure
from alphafold3.common import folding_input
from alphafold3.constants import chemical_components
from alphafold3.constants import mmcif_names
from alphafold3.constants import periodic_table
from alphafold3.constants import residue_names
from alphafold3.cpp import cif_dict
from alphafold3.data import msa as msa_module
from alphafold3.data import templates
from alphafold3.data.tools import rdkit_utils
from alphafold3.model import data3
from alphafold3.model import data_constants
from alphafold3.model import merging_features
from alphafold3.model import msa_pairing
from alphafold3.model.atom_layout import atom_layout
from alphafold3.structure import chemical_components as struc_chem_comps
import jax
import jax.numpy as jnp
import numpy as np
from rdkit import Chem


xnp_ndarray: TypeAlias = np.ndarray | jnp.ndarray  # pylint: disable=invalid-name
BatchDict: TypeAlias = dict[str, xnp_ndarray]

_STANDARD_RESIDUES = frozenset({
    *residue_names.PROTEIN_TYPES_WITH_UNKNOWN,
    *residue_names.NUCLEIC_TYPES_WITH_2_UNKS,
})


@dataclasses.dataclass(frozen=True)
class PaddingShapes:
  num_tokens: int
  msa_size: int
  num_chains: int
  num_templates: int
  num_atoms: int


def _pad_to(
    arr: np.ndarray, shape: tuple[int | None, ...], **kwargs
) -> np.ndarray:
  """Pads an array to a given shape. Wrapper around np.pad().

  Args:
    arr: numpy array to pad
    shape: target shape, use None for axes that should stay the same
    **kwargs: additional args for np.pad, e.g. constant_values=-1

  Returns:
    the padded array

  Raises:
    ValueError if arr and shape have a different number of axes.
  """
  if arr.ndim != len(shape):
    raise ValueError(
        f'arr and shape have different number of axes. {arr.shape=}, {shape=}'
    )

  num_pad = []
  for axis, width in enumerate(shape):
    if width is None:
      num_pad.append((0, 0))
    else:
      if width >= arr.shape[axis]:
        num_pad.append((0, width - arr.shape[axis]))
      else:
        raise ValueError(
            f'Can not pad to a smaller shape. {arr.shape=}, {shape=}'
        )
  padded_arr = np.pad(arr, pad_width=num_pad, **kwargs)
  return padded_arr


def _unwrap(obj):
  """Unwrap an object from a zero-dim np.ndarray."""
  if isinstance(obj, np.ndarray) and obj.ndim == 0:
    return obj.item()
  else:
    return obj


@dataclasses.dataclass(frozen=True)
class Chains:
  chain_id: np.ndarray
  asym_id: np.ndarray
  entity_id: np.ndarray
  sym_id: np.ndarray


jax.tree_util.register_dataclass(
    Chains,
    data_fields=[f.name for f in dataclasses.fields(Chains)],
    meta_fields=[],
)


def _compute_asym_entity_and_sym_id(
    all_tokens: atom_layout.AtomLayout,
) -> Chains:
  """Compute asym_id, entity_id and sym_id.

  Args:
    all_tokens: atom layout containing a representative atom for each token.

  Returns:
    A Chains object
  """

  # Find identical sequences and assign entity_id and sym_id to every chain.
  seq_to_entity_id_sym_id = {}
  seen_chain_ids = set()
  chain_ids = []
  asym_ids = []
  entity_ids = []
  sym_ids = []
  for chain_id in all_tokens.chain_id:
    if chain_id not in seen_chain_ids:
      asym_id = len(seen_chain_ids) + 1
      seen_chain_ids.add(chain_id)
      seq = ','.join(all_tokens.res_name[all_tokens.chain_id == chain_id])
      if seq not in seq_to_entity_id_sym_id:
        entity_id = len(seq_to_entity_id_sym_id) + 1
        sym_id = 1
      else:
        entity_id, sym_id = seq_to_entity_id_sym_id[seq]
        sym_id += 1
      seq_to_entity_id_sym_id[seq] = (entity_id, sym_id)

      chain_ids.append(chain_id)
      asym_ids.append(asym_id)
      entity_ids.append(entity_id)
      sym_ids.append(sym_id)

  return Chains(
      chain_id=np.array(chain_ids),
      asym_id=np.array(asym_ids),
      entity_id=np.array(entity_ids),
      sym_id=np.array(sym_ids),
  )


def tokenizer(
    flat_output_layout: atom_layout.AtomLayout,
    ccd: chemical_components.Ccd,
    max_atoms_per_token: int,
    flatten_non_standard_residues: bool,
    logging_name: str,
) -> tuple[atom_layout.AtomLayout, atom_layout.AtomLayout, np.ndarray]:
  """Maps a flat atom layout to tokens for evoformer.

  Creates the evoformer tokens as one token per polymer residue and one token
  per ligand atom. The tokens are represented as AtomLayouts all_tokens
  (1 representative atom per token) atoms per residue, and
  all_token_atoms_layout (num_tokens, max_atoms_per_token). The atoms in a
  residue token use the layout of the corresponding CCD entry

  Args:
    flat_output_layout: flat AtomLayout containing all atoms that the model
      wants to predict.
    ccd: The chemical components dictionary.
    max_atoms_per_token: number of slots per token.
    flatten_non_standard_residues: whether to flatten non-standard residues,
      i.e. whether to use one token per atom for non-standard residues.
    logging_name: logging name for debugging (usually the mmcif_id).

  Returns:
    A tuple (all_tokens, all_tokens_atoms_layout) with
      all_tokens: AtomLayout shape (num_tokens,) containing one representative
        atom per token.
      all_token_atoms_layout: AtomLayout with shape
        (num_tokens, max_atoms_per_token) containing all atoms per token.
      standard_token_idxs: The token index that each token would have if not
        flattening non standard resiudes.
  """
  # Select  the representative atom for each token.
  token_idxs = []
  single_atom_token = []
  standard_token_idxs = []
  current_standard_token_id = 0
  # Iterate over residues, and provide a group_iter over the atoms of each
  # residue.
  for key, group_iter in itertools.groupby(
      zip(
          flat_output_layout.chain_type,
          flat_output_layout.chain_id,
          flat_output_layout.res_id,
          flat_output_layout.res_name,
          flat_output_layout.atom_name,
          np.arange(flat_output_layout.shape[0]),
      ),
      key=lambda x: x[:3],
  ):

    # Get chain type and chain id of this residue
    chain_type, chain_id, _ = key

    # Get names and global idxs for all atoms of this residue
    _, _, _, res_names, atom_names, idxs = zip(*group_iter)

    # As of March 2023, all OTHER CHAINs in pdb are artificial nucleics.
    is_nucleic_backbone = (
        chain_type in mmcif_names.NUCLEIC_ACID_CHAIN_TYPES
        or chain_type == mmcif_names.OTHER_CHAIN
    )
    if chain_type in mmcif_names.PEPTIDE_CHAIN_TYPES:
      res_name = res_names[0]
      if (
          flatten_non_standard_residues
          and res_name not in residue_names.PROTEIN_TYPES_WITH_UNKNOWN
          and res_name != residue_names.MSE
      ):
        # For non-standard protein residues take all atoms.
        # NOTE: This may get very large if we include hydrogens.
        token_idxs.extend(idxs)
        single_atom_token += [True] * len(idxs)
        standard_token_idxs.extend([current_standard_token_id] * len(idxs))
      else:
        # For standard protein residues take 'CA' if it exists, else first atom.
        if 'CA' in atom_names:
          token_idxs.append(idxs[atom_names.index('CA')])
        else:
          token_idxs.append(idxs[0])
        single_atom_token += [False]
        standard_token_idxs.append(current_standard_token_id)
      current_standard_token_id += 1
    elif is_nucleic_backbone:
      res_name = res_names[0]
      if (
          flatten_non_standard_residues
          and res_name not in residue_names.NUCLEIC_TYPES_WITH_2_UNKS
      ):
        # For non-standard nucleic residues take all atoms.
        token_idxs.extend(idxs)
        single_atom_token += [True] * len(idxs)
        standard_token_idxs.extend([current_standard_token_id] * len(idxs))
      else:
        # For standard nucleic residues take C1' if it exists, else first atom.
        if "C1'" in atom_names:
          token_idxs.append(idxs[atom_names.index("C1'")])
        else:
          token_idxs.append(idxs[0])
        single_atom_token += [False]
        standard_token_idxs.append(current_standard_token_id)
      current_standard_token_id += 1
    elif chain_type in mmcif_names.NON_POLYMER_CHAIN_TYPES:
      # For non-polymers take all atoms
      token_idxs.extend(idxs)
      single_atom_token += [True] * len(idxs)
      standard_token_idxs.extend([current_standard_token_id] * len(idxs))
      current_standard_token_id += len(idxs)
    else:
      # Chain type that we don't handle yet.
      logging.warning(
          '%s: ignoring chain %s with chain type %s.',
          logging_name,
          chain_id,
          chain_type,
      )

  assert len(token_idxs) == len(single_atom_token)
  assert len(token_idxs) == len(standard_token_idxs)
  standard_token_idxs = np.array(standard_token_idxs, dtype=np.int32)

  # Create the list of all tokens, represented as a flat AtomLayout with 1
  # representative atom per token.
  all_tokens = flat_output_layout[token_idxs]

  # Create the 2D atoms_per_token layout
  num_tokens = all_tokens.shape[0]

  # Target lists.
  target_atom_names = []
  target_atom_elements = []
  target_res_ids = []
  target_res_names = []
  target_chain_ids = []
  target_chain_types = []

  # uids of all atoms in the flat layout, to check whether the dense atoms
  # exist -- This is necessary for terminal atoms (e.g. 'OP3' or 'OXT')
  all_atoms_uids = set(
      zip(
          flat_output_layout.chain_id,
          flat_output_layout.res_id,
          flat_output_layout.atom_name,
      )
  )

  for idx, single_atom in enumerate(single_atom_token):
    if not single_atom:
      # Standard protein and nucleic residues have many atoms per token
      chain_id = all_tokens.chain_id[idx]
      res_id = all_tokens.res_id[idx]
      res_name = all_tokens.res_name[idx]
      atom_names = []
      atom_elements = []

      res_atoms = struc_chem_comps.get_all_atoms_in_entry(
          ccd=ccd, res_name=res_name
      )
      atom_names_elements = list(
          zip(
              res_atoms['_chem_comp_atom.atom_id'],
              res_atoms['_chem_comp_atom.type_symbol'],
              strict=True,
          )
      )

      for atom_name, atom_element in atom_names_elements:
        # Remove hydrogens if they are not in flat layout.
        if atom_element in ['H', 'D'] and (
            (chain_id, res_id, atom_name) not in all_atoms_uids
        ):
          continue
        elif (chain_id, res_id, atom_name) in all_atoms_uids:
          atom_names.append(atom_name)
          atom_elements.append(atom_element)
        # Leave spaces for OXT etc.
        else:
          atom_names.append('')
          atom_elements.append('')

      if len(atom_names) > max_atoms_per_token:
        logging.warning(
            'Atom list for chain %s '
            'residue %s %s is too long and will be truncated: '
            '%s to the max atoms limit %s. Dropped atoms: %s',
            chain_id,
            res_id,
            res_name,
            len(atom_names),
            max_atoms_per_token,
            list(
                zip(
                    atom_names[max_atoms_per_token:],
                    atom_elements[max_atoms_per_token:],
                    strict=True,
                )
            ),
        )
        atom_names = atom_names[:max_atoms_per_token]
        atom_elements = atom_elements[:max_atoms_per_token]

      num_pad = max_atoms_per_token - len(atom_names)
      atom_names.extend([''] * num_pad)
      atom_elements.extend([''] * num_pad)

    else:
      # ligands have only 1 atom per token
      padding = [''] * (max_atoms_per_token - 1)
      atom_names = [all_tokens.atom_name[idx]] + padding
      atom_elements = [all_tokens.atom_element[idx]] + padding

    # Append the atoms to the target lists.
    target_atom_names.append(atom_names)
    target_atom_elements.append(atom_elements)
    target_res_names.append([all_tokens.res_name[idx]] * max_atoms_per_token)
    target_res_ids.append([all_tokens.res_id[idx]] * max_atoms_per_token)
    target_chain_ids.append([all_tokens.chain_id[idx]] * max_atoms_per_token)
    target_chain_types.append(
        [all_tokens.chain_type[idx]] * max_atoms_per_token
    )

  # Make sure to get the right shape also for 0 tokens
  trg_shape = (num_tokens, max_atoms_per_token)
  all_token_atoms_layout = atom_layout.AtomLayout(
      atom_name=np.array(target_atom_names, dtype=object).reshape(trg_shape),
      atom_element=np.array(target_atom_elements, dtype=object).reshape(
          trg_shape
      ),
      res_name=np.array(target_res_names, dtype=object).reshape(trg_shape),
      res_id=np.array(target_res_ids, dtype=int).reshape(trg_shape),
      chain_id=np.array(target_chain_ids, dtype=object).reshape(trg_shape),
      chain_type=np.array(target_chain_types, dtype=object).reshape(trg_shape),
  )

  return all_tokens, all_token_atoms_layout, standard_token_idxs


@dataclasses.dataclass(frozen=True)
class MSA:
  """Dataclass containing MSA."""

  rows: xnp_ndarray
  mask: xnp_ndarray
  deletion_matrix: xnp_ndarray
  # Occurrence of each residue type along the sequence, averaged over MSA rows.
  profile: xnp_ndarray
  # Occurrence of deletions along the sequence, averaged over MSA rows.
  deletion_mean: xnp_ndarray
  # Number of MSA alignments.
  num_alignments: xnp_ndarray

  @classmethod
  def compute_features(
      cls,
      *,
      all_tokens: atom_layout.AtomLayout,
      standard_token_idxs: np.ndarray,
      padding_shapes: PaddingShapes,
      fold_input: folding_input.Input,
      logging_name: str,
      max_paired_sequence_per_species: int,
      resolve_msa_overlaps: bool = True,
  ) -> Self:
    """Compute the msa features."""
    seen_entities = {}

    substruct = atom_layout.make_structure(
        flat_layout=all_tokens,
        atom_coords=np.zeros(all_tokens.shape + (3,)),
        name=logging_name,
    )
    prot = substruct.filter_to_entity_type(protein=True)
    num_unique_chains = len(set(prot.chain_single_letter_sequence().values()))
    need_msa_pairing = num_unique_chains > 1

    np_chains_list = []
    input_chains_by_id = {chain.id: chain for chain in fold_input.chains}
    nonempty_chain_ids = set(all_tokens.chain_id)
    for asym_id, chain_info in enumerate(substruct.iter_chains(), start=1):
      b_chain_id = chain_info['chain_id']
      chain_type = chain_info['chain_type']
      chain = input_chains_by_id[b_chain_id]

      # Generalised "sequence" for ligands (can't trust residue name)
      chain_tokens = all_tokens[all_tokens.chain_id == b_chain_id]
      assert chain_tokens.res_name is not None
      three_letter_sequence = ','.join(chain_tokens.res_name.tolist())
      chain_num_tokens = len(chain_tokens.atom_name)
      if chain_type in mmcif_names.POLYMER_CHAIN_TYPES:
        sequence = substruct.chain_single_letter_sequence()[b_chain_id]
        if chain_type in mmcif_names.NUCLEIC_ACID_CHAIN_TYPES:
          # Only allow nucleic residue types for nucleic chains (can have some
          # protein residues in e.g. tRNA, but that causes MSA search failures).
          # Replace non nucleic residue types by UNK_NUCLEIC.
          nucleic_types_one_letter = (
              residue_names.DNA_TYPES_ONE_LETTER
              + residue_names.RNA_TYPES_ONE_LETTER_WITH_UNKNOWN
          )
          sequence = ''.join([
              base
              if base in nucleic_types_one_letter
              else residue_names.UNK_NUCLEIC_ONE_LETTER
              for base in sequence
          ])
      else:
        sequence = 'X' * chain_num_tokens

      skip_chain = (
          chain_type not in mmcif_names.STANDARD_POLYMER_CHAIN_TYPES
          or len(sequence) <= 4
          or b_chain_id not in nonempty_chain_ids
      )
      if three_letter_sequence in seen_entities:
        entity_id = seen_entities[three_letter_sequence]
      else:
        entity_id = len(seen_entities) + 1

      if chain_type in mmcif_names.STANDARD_POLYMER_CHAIN_TYPES:
        unpaired_a3m = ''
        paired_a3m = ''
        if not skip_chain:
          if need_msa_pairing and isinstance(chain, folding_input.ProteinChain):
            paired_a3m = chain.paired_msa
          if isinstance(
              chain, folding_input.RnaChain | folding_input.ProteinChain
          ):
            unpaired_a3m = chain.unpaired_msa
        # If we generated the MSA ourselves, it is already deduplicated. If it
        # is user-provided, keep it as is to prevent destroying desired pairing.
        unpaired_msa = msa_module.Msa.from_a3m(
            query_sequence=sequence,
            chain_poly_type=chain_type,
            a3m=unpaired_a3m,
            deduplicate=False,
        )

        paired_msa = msa_module.Msa.from_a3m(
            query_sequence=sequence,
            chain_poly_type=chain_type,
            a3m=paired_a3m,
            deduplicate=False,
        )
      else:
        unpaired_msa = msa_module.Msa.from_empty(
            query_sequence='-' * len(sequence),
            chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        )
        paired_msa = msa_module.Msa.from_empty(
            query_sequence='-' * len(sequence),
            chain_poly_type=mmcif_names.PROTEIN_CHAIN,
        )

      msa_features = unpaired_msa.featurize()
      all_seqs_msa_features = paired_msa.featurize()

      msa_features = msa_features | {
          f'{k}_all_seq': v for k, v in all_seqs_msa_features.items()
      }
      feats = msa_features
      feats['chain_id'] = b_chain_id
      feats['asym_id'] = np.full(chain_num_tokens, asym_id)
      feats['entity_id'] = entity_id
      np_chains_list.append(feats)

    # Add profile features to each chain.
    for chain in np_chains_list:
      chain.update(
          data3.get_profile_features(chain['msa'], chain['deletion_matrix'])
      )

    # Allow 50% of the MSA to come from MSA pairing.
    max_paired_sequences = padding_shapes.msa_size // 2
    if need_msa_pairing:
      np_chains_list = list(map(dict, np_chains_list))
      np_chains_list = msa_pairing.create_paired_features(
          np_chains_list,
          max_paired_sequences=max_paired_sequences,
          nonempty_chain_ids=nonempty_chain_ids,
          max_hits_per_species=max_paired_sequence_per_species,
      )
      if resolve_msa_overlaps:
        np_chains_list = msa_pairing.deduplicate_unpaired_sequences(
            np_chains_list
        )

    # Remove all gapped rows from all seqs.
    nonempty_asym_ids = []
    for chain in np_chains_list:
      if chain['chain_id'] in nonempty_chain_ids:
        nonempty_asym_ids.append(chain['asym_id'][0])
    if 'msa_all_seq' in np_chains_list[0]:
      np_chains_list = msa_pairing.remove_all_gapped_rows_from_all_seqs(
          np_chains_list, asym_ids=nonempty_asym_ids
      )

    # Crop MSA rows.
    cropped_chains_list = []
    for chain in np_chains_list:
      unpaired_msa_size, paired_msa_size = (
          msa_pairing.choose_paired_unpaired_msa_crop_sizes(
              unpaired_msa=chain['msa'],
              paired_msa=chain.get('msa_all_seq'),
              total_msa_crop_size=padding_shapes.msa_size,
              max_paired_sequences=max_paired_sequences,
          )
      )
      cropped_chain = {
          'asym_id': chain['asym_id'],
          'chain_id': chain['chain_id'],
          'profile': chain['profile'],
          'deletion_mean': chain['deletion_mean'],
      }
      for feat in data_constants.NUM_SEQ_NUM_RES_MSA_FEATURES:
        if feat in chain:
          cropped_chain[feat] = chain[feat][:unpaired_msa_size]
        if feat + '_all_seq' in chain:
          cropped_chain[feat + '_all_seq'] = chain[feat + '_all_seq'][
              :paired_msa_size
          ]
      cropped_chains_list.append(cropped_chain)

    # Merge Chains.
    # Make sure the chain order is unaltered before slicing with tokens.
    curr_chain_order = [chain['chain_id'] for chain in cropped_chains_list]
    orig_chain_order = [chain['chain_id'] for chain in substruct.iter_chains()]
    assert curr_chain_order == orig_chain_order
    np_example = {
        'asym_id': np.concatenate(
            [c['asym_id'] for c in cropped_chains_list], axis=0
        ),
    }
    for feature in data_constants.NUM_SEQ_NUM_RES_MSA_FEATURES:
      for feat in [feature, feature + '_all_seq']:
        if feat in cropped_chains_list[0]:
          np_example[feat] = merging_features.merge_msa_features(
              feat, cropped_chains_list
          )
    for feature in ['profile', 'deletion_mean']:
      feature_list = [c[feature] for c in cropped_chains_list]
      np_example[feature] = np.concatenate(feature_list, axis=0)

    # Crop MSA rows to maximum size given by chains participating in the crop.
    max_allowed_unpaired = max([
        len(chain['msa'])
        for chain in cropped_chains_list
        if chain['asym_id'][0] in nonempty_asym_ids
    ])
    np_example['msa'] = np_example['msa'][:max_allowed_unpaired]
    if 'msa_all_seq' in np_example:
      max_allowed_paired = max([
          len(chain['msa_all_seq'])
          for chain in cropped_chains_list
          if chain['asym_id'][0] in nonempty_asym_ids
      ])
      np_example['msa_all_seq'] = np_example['msa_all_seq'][:max_allowed_paired]

    np_example = merging_features.merge_paired_and_unpaired_msa(np_example)

    # Crop MSA residues. Need to use the standard token indices, since msa does
    # not expand non-standard residues. This means that for expanded residues,
    # we get repeated msa columns.
    new_cropping_idxs = standard_token_idxs
    for feature in data_constants.NUM_SEQ_NUM_RES_MSA_FEATURES:
      if feature in np_example:
        np_example[feature] = np_example[feature][:, new_cropping_idxs].copy()
    for feature in ['profile', 'deletion_mean']:
      np_example[feature] = np_example[feature][new_cropping_idxs]

    # Make MSA mask.
    np_example['msa_mask'] = np.ones_like(np_example['msa'], dtype=np.float32)

    # Count MSA size before padding.
    num_alignments = np_example['msa'].shape[0]

    # Pad:
    msa_size, num_tokens = padding_shapes.msa_size, padding_shapes.num_tokens

    def safe_cast_int8(x):
      return np.clip(x, np.iinfo(np.int8).min, np.iinfo(np.int8).max).astype(
          np.int8
      )

    return MSA(
        rows=_pad_to(safe_cast_int8(np_example['msa']), (msa_size, num_tokens)),
        mask=_pad_to(
            np_example['msa_mask'].astype(bool), (msa_size, num_tokens)
        ),
        # deletion_matrix may be out of int8 range, but we mostly care about
        # small values since we arctan it in the model.
        deletion_matrix=_pad_to(
            safe_cast_int8(np_example['deletion_matrix']),
            (msa_size, num_tokens),
        ),
        profile=_pad_to(np_example['profile'], (num_tokens, None)),
        deletion_mean=_pad_to(np_example['deletion_mean'], (num_tokens,)),
        num_alignments=np.array(num_alignments, dtype=np.int32),
    )

  def index_msa_rows(self, indices: xnp_ndarray) -> Self:
    assert indices.ndim == 1

    return MSA(
        rows=self.rows[indices, :],
        mask=self.mask[indices, :],
        deletion_matrix=self.deletion_matrix[indices, :],
        profile=self.profile,
        deletion_mean=self.deletion_mean,
        num_alignments=self.num_alignments,
    )

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    output = cls(
        rows=batch['msa'],
        mask=batch['msa_mask'],
        deletion_matrix=batch['deletion_matrix'],
        profile=batch['profile'],
        deletion_mean=batch['deletion_mean'],
        num_alignments=batch['num_alignments'],
    )
    return output

  def as_data_dict(self) -> BatchDict:
    return {
        'msa': self.rows,
        'msa_mask': self.mask,
        'deletion_matrix': self.deletion_matrix,
        'profile': self.profile,
        'deletion_mean': self.deletion_mean,
        'num_alignments': self.num_alignments,
    }


jax.tree_util.register_dataclass(
    MSA,
    data_fields=[f.name for f in dataclasses.fields(MSA)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class Templates:
  """Dataclass containing templates."""

  # aatype of templates, int32 w shape [num_templates, num_res]
  aatype: xnp_ndarray
  # atom positions of templates, float32 w shape [num_templates, num_res, 24, 3]
  atom_positions: xnp_ndarray
  # atom mask of templates, bool w shape [num_templates, num_res, 24]
  atom_mask: xnp_ndarray

  @classmethod
  def compute_features(
      cls,
      all_tokens: atom_layout.AtomLayout,
      standard_token_idxs: np.ndarray,
      padding_shapes: PaddingShapes,
      fold_input: folding_input.Input,
      max_templates: int,
      logging_name: str,
  ) -> Self:
    """Compute the template features."""

    seen_entities = {}
    polymer_entity_features = {True: {}, False: {}}

    substruct = atom_layout.make_structure(
        flat_layout=all_tokens,
        atom_coords=np.zeros(all_tokens.shape + (3,)),
        name=logging_name,
    )
    np_chains_list = []

    input_chains_by_id = {chain.id: chain for chain in fold_input.chains}

    nonempty_chain_ids = set(all_tokens.chain_id)
    for chain_info in substruct.iter_chains():
      chain_id = chain_info['chain_id']
      chain_type = chain_info['chain_type']
      chain = input_chains_by_id[chain_id]

      # Generalised "sequence" for ligands (can't trust residue name)
      chain_tokens = all_tokens[all_tokens.chain_id == chain_id]
      assert chain_tokens.res_name is not None
      three_letter_sequence = ','.join(chain_tokens.res_name.tolist())
      chain_num_tokens = len(chain_tokens.atom_name)

      # Don't compute features for chains not included in the crop, or ligands.
      skip_chain = (
          chain_type != mmcif_names.PROTEIN_CHAIN
          or chain_num_tokens <= 4  # not cache filled
          or chain_id not in nonempty_chain_ids
      )

      if three_letter_sequence in seen_entities:
        entity_id = seen_entities[three_letter_sequence]
      else:
        entity_id = len(seen_entities) + 1

      if entity_id not in polymer_entity_features[skip_chain]:
        if skip_chain:
          template_features = data3.empty_template_features(chain_num_tokens)
        else:
          assert isinstance(chain, folding_input.ProteinChain)

          sorted_features = []
          for template in chain.templates:
            struc = structure.from_mmcif(
                template.mmcif,
                fix_mse_residues=True,
                fix_arginines=True,
                include_bonds=False,
                include_water=False,
                include_other=True,  # For non-standard polymer chains.
            )
            hit_features = templates.get_polymer_features(
                chain=struc,
                chain_poly_type=mmcif_names.PROTEIN_CHAIN,
                query_sequence_length=len(chain.sequence),
                query_to_hit_mapping=dict(template.query_to_template_map),
            )
            sorted_features.append(hit_features)

          template_features = templates.package_template_features(
              hit_features=sorted_features,
              include_ligand_features=False,
          )

          template_features = data3.fix_template_features(
              template_features=template_features, num_res=len(chain.sequence)
          )

        template_features = _reduce_template_features(
            template_features, max_templates
        )
        polymer_entity_features[skip_chain][entity_id] = template_features

      seen_entities[three_letter_sequence] = entity_id
      feats = polymer_entity_features[skip_chain][entity_id].copy()
      feats['chain_id'] = chain_id
      np_chains_list.append(feats)

    # We pad the num_templates dimension before merging, so that different
    # chains can be concatenated on the num_res dimension.  Masking will be
    # applied so that each chains templates can't see each other.
    for chain in np_chains_list:
      chain['template_aatype'] = _pad_to(
          chain['template_aatype'], (max_templates, None)
      )
      chain['template_atom_positions'] = _pad_to(
          chain['template_atom_positions'], (max_templates, None, None, None)
      )
      chain['template_atom_mask'] = _pad_to(
          chain['template_atom_mask'], (max_templates, None, None)
      )

    # Merge on token dimension.
    np_example = {
        ft: np.concatenate([c[ft] for c in np_chains_list], axis=1)
        for ft in np_chains_list[0]
        if ft in data_constants.TEMPLATE_FEATURES
    }

    # Crop template data. Need to use the standard token indices, since msa does
    # not expand non-standard residues. This means that for expanded residues,
    # we get repeated template information.
    for feature_name, v in np_example.items():
      np_example[feature_name] = v[:max_templates, standard_token_idxs, ...]

    # Pad along the token dimension.
    templates_features = Templates(
        aatype=_pad_to(
            np_example['template_aatype'], (None, padding_shapes.num_tokens)
        ),
        atom_positions=_pad_to(
            np_example['template_atom_positions'],
            (None, padding_shapes.num_tokens, None, None),
        ),
        atom_mask=_pad_to(
            np_example['template_atom_mask'].astype(bool),
            (None, padding_shapes.num_tokens, None),
        ),
    )
    return templates_features

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    """Make Template from batch dictionary."""
    return cls(
        aatype=batch['template_aatype'],
        atom_positions=batch['template_atom_positions'],
        atom_mask=batch['template_atom_mask'],
    )

  def as_data_dict(self) -> BatchDict:
    return {
        'template_aatype': self.aatype,
        'template_atom_positions': self.atom_positions,
        'template_atom_mask': self.atom_mask,
    }


jax.tree_util.register_dataclass(
    Templates,
    data_fields=[f.name for f in dataclasses.fields(Templates)],
    meta_fields=[],
)


def _reduce_template_features(
    template_features: data3.FeatureDict,
    max_templates: int,
) -> data3.FeatureDict:
  """Reduces template features to max num templates and defined feature set."""
  num_templates = template_features['template_aatype'].shape[0]
  template_keep_mask = np.arange(num_templates) < max_templates
  template_fields = data_constants.TEMPLATE_FEATURES + (
      'template_release_timestamp',
  )
  template_features = {
      k: v[template_keep_mask]
      for k, v in template_features.items()
      if k in template_fields
  }
  return template_features


@dataclasses.dataclass(frozen=True)
class TokenFeatures:
  """Dataclass containing features for tokens."""

  residue_index: xnp_ndarray
  token_index: xnp_ndarray
  aatype: xnp_ndarray
  mask: xnp_ndarray
  seq_length: xnp_ndarray

  # Chain symmetry identifiers
  # for an A3B2 stoichiometry the meaning of these features is as follows:
  # asym_id:    1 2 3 4 5
  # entity_id:  1 1 1 2 2
  # sym_id:     1 2 3 1 2
  asym_id: xnp_ndarray
  entity_id: xnp_ndarray
  sym_id: xnp_ndarray

  # token type features
  is_protein: xnp_ndarray
  is_rna: xnp_ndarray
  is_dna: xnp_ndarray
  is_ligand: xnp_ndarray
  is_nonstandard_polymer_chain: xnp_ndarray
  is_water: xnp_ndarray

  @classmethod
  def compute_features(
      cls,
      all_tokens: atom_layout.AtomLayout,
      padding_shapes: PaddingShapes,
  ) -> Self:
    """Compute the per-token features."""

    residue_index = all_tokens.res_id.astype(np.int32)

    token_index = np.arange(1, len(all_tokens.atom_name) + 1).astype(np.int32)

    aatype = []
    for res_name, chain_type in zip(all_tokens.res_name, all_tokens.chain_type):
      if chain_type in mmcif_names.POLYMER_CHAIN_TYPES:
        res_name = mmcif_names.fix_non_standard_polymer_res(
            res_name=res_name, chain_type=chain_type
        )
        if (
            chain_type == mmcif_names.DNA_CHAIN
            and res_name == residue_names.UNK_DNA
        ):
          res_name = residue_names.UNK_NUCLEIC_ONE_LETTER
      elif chain_type in mmcif_names.NON_POLYMER_CHAIN_TYPES:
        res_name = residue_names.UNK
      else:
        raise ValueError(f'Chain type {chain_type} not polymer or ligand.')
      aa = residue_names.POLYMER_TYPES_ORDER_WITH_UNKNOWN_AND_GAP[res_name]
      aatype.append(aa)
    aatype = np.array(aatype, dtype=np.int32)

    mask = np.ones(all_tokens.shape[0], dtype=bool)
    chains = _compute_asym_entity_and_sym_id(all_tokens)
    m = dict(zip(chains.chain_id, chains.asym_id))
    asym_id = np.array([m[c] for c in all_tokens.chain_id], dtype=np.int32)

    m = dict(zip(chains.chain_id, chains.entity_id))
    entity_id = np.array([m[c] for c in all_tokens.chain_id], dtype=np.int32)

    m = dict(zip(chains.chain_id, chains.sym_id))
    sym_id = np.array([m[c] for c in all_tokens.chain_id], dtype=np.int32)

    seq_length = np.array(all_tokens.shape[0], dtype=np.int32)

    is_protein = all_tokens.chain_type == mmcif_names.PROTEIN_CHAIN
    is_rna = all_tokens.chain_type == mmcif_names.RNA_CHAIN
    is_dna = all_tokens.chain_type == mmcif_names.DNA_CHAIN
    is_ligand = np.isin(
        all_tokens.chain_type, list(mmcif_names.LIGAND_CHAIN_TYPES)
    )
    standard_polymer_chain = list(mmcif_names.NON_POLYMER_CHAIN_TYPES) + list(
        mmcif_names.STANDARD_POLYMER_CHAIN_TYPES
    )
    is_nonstandard_polymer_chain = np.isin(
        all_tokens.chain_type, standard_polymer_chain, invert=True
    )
    is_water = all_tokens.chain_type == mmcif_names.WATER

    return TokenFeatures(
        residue_index=_pad_to(residue_index, (padding_shapes.num_tokens,)),
        token_index=_pad_to(token_index, (padding_shapes.num_tokens,)),
        aatype=_pad_to(aatype, (padding_shapes.num_tokens,)),
        mask=_pad_to(mask, (padding_shapes.num_tokens,)),
        asym_id=_pad_to(asym_id, (padding_shapes.num_tokens,)),
        entity_id=_pad_to(entity_id, (padding_shapes.num_tokens,)),
        sym_id=_pad_to(sym_id, (padding_shapes.num_tokens,)),
        seq_length=seq_length,
        is_protein=_pad_to(is_protein, (padding_shapes.num_tokens,)),
        is_rna=_pad_to(is_rna, (padding_shapes.num_tokens,)),
        is_dna=_pad_to(is_dna, (padding_shapes.num_tokens,)),
        is_ligand=_pad_to(is_ligand, (padding_shapes.num_tokens,)),
        is_nonstandard_polymer_chain=_pad_to(
            is_nonstandard_polymer_chain, (padding_shapes.num_tokens,)
        ),
        is_water=_pad_to(is_water, (padding_shapes.num_tokens,)),
    )

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        residue_index=batch['residue_index'],
        token_index=batch['token_index'],
        aatype=batch['aatype'],
        mask=batch['seq_mask'],
        entity_id=batch['entity_id'],
        asym_id=batch['asym_id'],
        sym_id=batch['sym_id'],
        seq_length=batch['seq_length'],
        is_protein=batch['is_protein'],
        is_rna=batch['is_rna'],
        is_dna=batch['is_dna'],
        is_ligand=batch['is_ligand'],
        is_nonstandard_polymer_chain=batch['is_nonstandard_polymer_chain'],
        is_water=batch['is_water'],
    )

  def as_data_dict(self) -> BatchDict:
    return {
        'residue_index': self.residue_index,
        'token_index': self.token_index,
        'aatype': self.aatype,
        'seq_mask': self.mask,
        'entity_id': self.entity_id,
        'asym_id': self.asym_id,
        'sym_id': self.sym_id,
        'seq_length': self.seq_length,
        'is_protein': self.is_protein,
        'is_rna': self.is_rna,
        'is_dna': self.is_dna,
        'is_ligand': self.is_ligand,
        'is_nonstandard_polymer_chain': self.is_nonstandard_polymer_chain,
        'is_water': self.is_water,
    }


jax.tree_util.register_dataclass(
    TokenFeatures,
    data_fields=[f.name for f in dataclasses.fields(TokenFeatures)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class PredictedStructureInfo:
  """Contains information necessary to work with predicted structure."""

  atom_mask: xnp_ndarray
  residue_center_index: xnp_ndarray

  @classmethod
  def compute_features(
      cls,
      all_tokens: atom_layout.AtomLayout,
      all_token_atoms_layout: atom_layout.AtomLayout,
      padding_shapes: PaddingShapes,
  ) -> Self:
    """Compute the PredictedStructureInfo features.

    Args:
      all_tokens: flat AtomLayout with 1 representative atom per token, shape
        (num_tokens,)
      all_token_atoms_layout: AtomLayout for all atoms per token, shape
        (num_tokens, max_atoms_per_token)
      padding_shapes: padding shapes.

    Returns:
      A PredictedStructureInfo object.
    """
    atom_mask = _pad_to(
        all_token_atoms_layout.atom_name.astype(bool),
        (padding_shapes.num_tokens, None),
    )
    residue_center_index = np.zeros(padding_shapes.num_tokens, dtype=np.int32)
    for idx in range(all_tokens.shape[0]):
      repr_atom = all_tokens.atom_name[idx]
      atoms = list(all_token_atoms_layout.atom_name[idx, :])
      if repr_atom in atoms:
        residue_center_index[idx] = atoms.index(repr_atom)
      else:
        # Representative atoms can be missing if cropping the number of atoms
        # per residue.
        logging.warning(
            'The representative atom in all_tokens (%s) is not in '
            'all_token_atoms_layout (%s)',
            all_tokens[idx : idx + 1],
            all_token_atoms_layout[idx, :],
        )
        residue_center_index[idx] = 0
    return cls(atom_mask=atom_mask, residue_center_index=residue_center_index)

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        atom_mask=batch['pred_dense_atom_mask'],
        residue_center_index=batch['residue_center_index'],
    )

  def as_data_dict(self) -> BatchDict:
    return {
        'pred_dense_atom_mask': self.atom_mask,
        'residue_center_index': self.residue_center_index,
    }


jax.tree_util.register_dataclass(
    PredictedStructureInfo,
    data_fields=[f.name for f in dataclasses.fields(PredictedStructureInfo)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class PolymerLigandBondInfo:
  """Contains information about polymer-ligand bonds."""

  tokens_to_polymer_ligand_bonds: atom_layout.GatherInfo
  # Gather indices to convert from cropped dense atom layout to bonds layout
  # (num_tokens, 2)
  token_atoms_to_bonds: atom_layout.GatherInfo

  @classmethod
  def compute_features(
      cls,
      all_tokens: atom_layout.AtomLayout,
      all_token_atoms_layout: atom_layout.AtomLayout,
      bond_layout: atom_layout.AtomLayout | None,
      padding_shapes: PaddingShapes,
  ) -> Self:
    """Computes the InterChainBondInfo features.

    Args:
      all_tokens: AtomLayout for tokens; shape (num_tokens,).
      all_token_atoms_layout: Atom Layout for all atoms (num_tokens,
        max_atoms_per_token)
      bond_layout: Bond layout for polymer-ligand bonds.
      padding_shapes: Padding shapes.

    Returns:
      A PolymerLigandBondInfo object.
    """

    if bond_layout is not None:
      # Must convert to list before calling np.isin, will not work raw.
      peptide_types = list(mmcif_names.PEPTIDE_CHAIN_TYPES)
      nucleic_types = list(mmcif_names.NUCLEIC_ACID_CHAIN_TYPES) + [
          mmcif_names.OTHER_CHAIN
      ]
      # These atom renames are so that we can use the atom layout code with
      # all_tokens, which only has a single atom per token.
      atom_names = bond_layout.atom_name.copy()
      atom_names[np.isin(bond_layout.chain_type, peptide_types)] = 'CA'
      atom_names[np.isin(bond_layout.chain_type, nucleic_types)] = "C1'"
      adjusted_bond_layout = atom_layout.AtomLayout(
          atom_name=atom_names,
          res_id=bond_layout.res_id,
          chain_id=bond_layout.chain_id,
          chain_type=bond_layout.chain_type,
      )
      # Remove bonds that are not in the crop.
      cropped_tokens_to_bonds = atom_layout.compute_gather_idxs(
          source_layout=all_tokens, target_layout=adjusted_bond_layout
      )
      bond_is_in_crop = np.all(
          cropped_tokens_to_bonds.gather_mask, axis=1
      ).astype(bool)
      adjusted_bond_layout = adjusted_bond_layout[bond_is_in_crop, :]
    else:
      # Create layout with correct shape when bond_layout is None.
      s = (0, 2)
      adjusted_bond_layout = atom_layout.AtomLayout(
          atom_name=np.array([], dtype=object).reshape(s),
          res_id=np.array([], dtype=int).reshape(s),
          chain_id=np.array([], dtype=object).reshape(s),
      )
    adjusted_bond_layout = adjusted_bond_layout.copy_and_pad_to(
        (padding_shapes.num_tokens, 2)
    )
    tokens_to_polymer_ligand_bonds = atom_layout.compute_gather_idxs(
        source_layout=all_tokens, target_layout=adjusted_bond_layout
    )

    # Stuff for computing the bond loss.
    if bond_layout is not None:
      # Pad to num_tokens (hoping that there are never more bonds than tokens).
      padded_bond_layout = bond_layout.copy_and_pad_to(
          (padding_shapes.num_tokens, 2)
      )
      token_atoms_to_bonds = atom_layout.compute_gather_idxs(
          source_layout=all_token_atoms_layout, target_layout=padded_bond_layout
      )
    else:
      token_atoms_to_bonds = atom_layout.GatherInfo(
          gather_idxs=np.zeros((padding_shapes.num_tokens, 2), dtype=int),
          gather_mask=np.zeros((padding_shapes.num_tokens, 2), dtype=bool),
          input_shape=np.array((
              padding_shapes.num_tokens,
              all_token_atoms_layout.shape[1],
          )),
      )

    return cls(
        tokens_to_polymer_ligand_bonds=tokens_to_polymer_ligand_bonds,
        token_atoms_to_bonds=token_atoms_to_bonds,
    )

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        tokens_to_polymer_ligand_bonds=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='tokens_to_polymer_ligand_bonds'
        ),
        token_atoms_to_bonds=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='token_atoms_to_polymer_ligand_bonds'
        ),
    )

  def as_data_dict(self) -> BatchDict:
    return {
        **self.tokens_to_polymer_ligand_bonds.as_dict(
            key_prefix='tokens_to_polymer_ligand_bonds'
        ),
        **self.token_atoms_to_bonds.as_dict(
            key_prefix='token_atoms_to_polymer_ligand_bonds'
        ),
    }


jax.tree_util.register_dataclass(
    PolymerLigandBondInfo,
    data_fields=[f.name for f in dataclasses.fields(PolymerLigandBondInfo)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class LigandLigandBondInfo:
  """Contains information about the location of ligand-ligand bonds."""

  tokens_to_ligand_ligand_bonds: atom_layout.GatherInfo

  @classmethod
  def compute_features(
      cls,
      all_tokens: atom_layout.AtomLayout,
      bond_layout: atom_layout.AtomLayout | None,
      padding_shapes: PaddingShapes,
  ) -> Self:
    """Computes the InterChainBondInfo features.

    Args:
      all_tokens: AtomLayout for tokens; shape (num_tokens,).
      bond_layout: Bond layout for ligand-ligand bonds.
      padding_shapes: Padding shapes.

    Returns:
      A LigandLigandBondInfo object.
    """

    if bond_layout is not None:
      # Discard any bonds that do not join to an existing atom.
      keep_mask = []
      all_atom_ids = {
          uid
          for uid in zip(
              all_tokens.chain_id,
              all_tokens.res_id,
              all_tokens.atom_name,
              strict=True,
          )
      }
      for chain_id, res_id, atom_name in zip(
          bond_layout.chain_id,
          bond_layout.res_id,
          bond_layout.atom_name,
          strict=True,
      ):
        atom_a = (chain_id[0], res_id[0], atom_name[0])
        atom_b = (chain_id[1], res_id[1], atom_name[1])
        if atom_a in all_atom_ids and atom_b in all_atom_ids:
          keep_mask.append(True)
        else:
          keep_mask.append(False)
      keep_mask = np.array(keep_mask).astype(bool)
      bond_layout = bond_layout[keep_mask]
      # Remove any bonds to Hydrogen atoms.
      bond_layout = bond_layout[
          ~np.char.startswith(bond_layout.atom_name.astype(str), 'H').any(
              axis=1
          )
      ]
      atom_names = bond_layout.atom_name
      adjusted_bond_layout = atom_layout.AtomLayout(
          atom_name=atom_names,
          res_id=bond_layout.res_id,
          chain_id=bond_layout.chain_id,
          chain_type=bond_layout.chain_type,
      )
    else:
      # Create layout with correct shape when bond_layout is None.
      s = (0, 2)
      adjusted_bond_layout = atom_layout.AtomLayout(
          atom_name=np.array([], dtype=object).reshape(s),
          res_id=np.array([], dtype=int).reshape(s),
          chain_id=np.array([], dtype=object).reshape(s),
      )
    # 10 x num_tokens as max_inter_bonds_ratio + max_intra_bonds_ration = 2.061.
    adjusted_bond_layout = adjusted_bond_layout.copy_and_pad_to(
        (padding_shapes.num_tokens * 10, 2)
    )
    gather_idx = atom_layout.compute_gather_idxs(
        source_layout=all_tokens, target_layout=adjusted_bond_layout
    )
    return cls(tokens_to_ligand_ligand_bonds=gather_idx)

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        tokens_to_ligand_ligand_bonds=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='tokens_to_ligand_ligand_bonds'
        )
    )

  def as_data_dict(self) -> BatchDict:
    return {
        **self.tokens_to_ligand_ligand_bonds.as_dict(
            key_prefix='tokens_to_ligand_ligand_bonds'
        )
    }


jax.tree_util.register_dataclass(
    LigandLigandBondInfo,
    data_fields=[f.name for f in dataclasses.fields(LigandLigandBondInfo)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class PseudoBetaInfo:
  """Contains information for extracting pseudo-beta and equivalent atoms."""

  token_atoms_to_pseudo_beta: atom_layout.GatherInfo

  @classmethod
  def compute_features(
      cls,
      all_token_atoms_layout: atom_layout.AtomLayout,
      ccd: chemical_components.Ccd,
      padding_shapes: PaddingShapes,
      logging_name: str,
  ) -> Self:
    """Compute the PseudoBetaInfo features.

    Args:
      all_token_atoms_layout:  AtomLayout for all atoms per token, shape
        (num_tokens, max_atoms_per_token)
      ccd: The chemical components dictionary.
      padding_shapes: padding shapes.
      logging_name: logging name for debugging (usually the mmcif_id)

    Returns:
      A PseudoBetaInfo object.
    """
    token_idxs = []
    atom_idxs = []
    for token_idx in range(all_token_atoms_layout.shape[0]):
      chain_type = all_token_atoms_layout.chain_type[token_idx, 0]
      atom_names = list(all_token_atoms_layout.atom_name[token_idx, :])
      atom_idx = None
      is_nucleic_backbone = (
          chain_type in mmcif_names.NUCLEIC_ACID_CHAIN_TYPES
          or chain_type == mmcif_names.OTHER_CHAIN
      )
      if chain_type == mmcif_names.PROTEIN_CHAIN:
        # Protein chains
        if 'CB' in atom_names:
          atom_idx = atom_names.index('CB')
        elif 'CA' in atom_names:
          atom_idx = atom_names.index('CA')
      elif is_nucleic_backbone:
        # RNA / DNA chains
        res_name = all_token_atoms_layout.res_name[token_idx, 0]
        cifdict = ccd.get(res_name)
        if cifdict:
          parent = cifdict['_chem_comp.mon_nstd_parent_comp_id'][0]
          if parent != '?':
            res_name = parent
        if res_name in {'A', 'G', 'DA', 'DG'}:
          if 'C4' in atom_names:
            atom_idx = atom_names.index('C4')
        else:
          if 'C2' in atom_names:
            atom_idx = atom_names.index('C2')
      elif chain_type in mmcif_names.NON_POLYMER_CHAIN_TYPES:
        # Ligands: there is only one atom per token
        atom_idx = 0
      else:
        logging.warning(
            '%s: Unknown chain type for token %i. (%s)',
            logging_name,
            token_idx,
            all_token_atoms_layout[token_idx : token_idx + 1],
        )
        atom_idx = 0
      if atom_idx is None:
        (valid_atom_idxs,) = np.nonzero(
            all_token_atoms_layout.atom_name[token_idx, :]
        )
        if valid_atom_idxs.shape[0] > 0:
          atom_idx = valid_atom_idxs[0]
        else:
          atom_idx = 0
        logging.warning(
            '%s token %i (%s), does not contain a pseudo-beta atom.'
            'Using first valid atom (%s) instead.',
            logging_name,
            token_idx,
            all_token_atoms_layout[token_idx : token_idx + 1],
            all_token_atoms_layout.atom_name[token_idx, atom_idx],
        )

      token_idxs.append(token_idx)
      atom_idxs.append(atom_idx)

    pseudo_beta_layout = all_token_atoms_layout[token_idxs, atom_idxs]
    pseudo_beta_layout = pseudo_beta_layout.copy_and_pad_to((
        padding_shapes.num_tokens,
    ))
    token_atoms_to_pseudo_beta = atom_layout.compute_gather_idxs(
        source_layout=all_token_atoms_layout, target_layout=pseudo_beta_layout
    )

    return cls(
        token_atoms_to_pseudo_beta=token_atoms_to_pseudo_beta,
    )

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        token_atoms_to_pseudo_beta=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='token_atoms_to_pseudo_beta'
        ),
    )

  def as_data_dict(self) -> BatchDict:
    return {
        **self.token_atoms_to_pseudo_beta.as_dict(
            key_prefix='token_atoms_to_pseudo_beta'
        ),
    }


jax.tree_util.register_dataclass(
    PseudoBetaInfo,
    data_fields=[f.name for f in dataclasses.fields(PseudoBetaInfo)],
    meta_fields=[],
)


_DEFAULT_BLANK_REF = {
    'positions': np.zeros(3),
    'mask': 0,
    'element': 0,
    'charge': 0,
    'atom_name_chars': np.zeros(4),
}


def random_rotation(random_state: np.random.RandomState) -> np.ndarray:
  # Create a random rotation (Gram-Schmidt orthogonalization of two
  # random normal vectors)
  v0, v1 = random_state.normal(size=(2, 3))
  e0 = v0 / np.maximum(1e-10, np.linalg.norm(v0))
  v1 = v1 - e0 * np.dot(v1, e0)
  e1 = v1 / np.maximum(1e-10, np.linalg.norm(v1))
  e2 = np.cross(e0, e1)
  return np.stack([e0, e1, e2])


def random_augmentation(
    positions: np.ndarray,
    random_state: np.random.RandomState,
) -> np.ndarray:
  """Center then apply random translation and rotation."""

  center = np.mean(positions, axis=0)
  rot = random_rotation(random_state)
  positions_target = np.einsum('ij,kj->ki', rot, positions - center)

  translation = random_state.normal(size=(3,))
  positions_target = positions_target + translation
  return positions_target


def _get_reference_positions_from_ccd_cif(
    ccd_cif: cif_dict.CifDict,
    ref_max_modified_date: datetime.date,
    logging_name: str,
) -> np.ndarray:
  """Creates reference positions from a CCD mmcif data block."""
  num_atoms = len(ccd_cif['_chem_comp_atom.atom_id'])
  if '_chem_comp_atom.pdbx_model_Cartn_x_ideal' in ccd_cif:
    atom_x = ccd_cif['_chem_comp_atom.pdbx_model_Cartn_x_ideal']
    atom_y = ccd_cif['_chem_comp_atom.pdbx_model_Cartn_y_ideal']
    atom_z = ccd_cif['_chem_comp_atom.pdbx_model_Cartn_z_ideal']
  else:
    atom_x = np.array(['?'] * num_atoms)
    atom_y = np.array(['?'] * num_atoms)
    atom_z = np.array(['?'] * num_atoms)
  pos = np.array([[x, y, z] for x, y, z in zip(atom_x, atom_y, atom_z)])
  # Unknown reference coordinates are specified by '?' in chem comp dict.
  # Replace unknown reference coords with 0.
  if '?' in pos and '_chem_comp.pdbx_modified_date' in ccd_cif:
    # Use reference coordinates if modifed date is before cutoff.
    modified_dates = [
        datetime.date.fromisoformat(date)
        for date in ccd_cif['_chem_comp.pdbx_modified_date']
    ]
    max_modified_date = max(modified_dates)
    if max_modified_date < ref_max_modified_date:
      atom_x = ccd_cif['_chem_comp_atom.model_Cartn_x']
      atom_y = ccd_cif['_chem_comp_atom.model_Cartn_y']
      atom_z = ccd_cif['_chem_comp_atom.model_Cartn_z']
      pos = np.array([[x, y, z] for x, y, z in zip(atom_x, atom_y, atom_z)])
  if '?' in pos:
    if np.all(pos == '?'):
      logging.warning('All ref positions unknown for: %s', logging_name)
    else:
      logging.warning('Some ref positions unknown for: %s', logging_name)
    pos[pos == '?'] = 0
  return np.array(pos, dtype=np.float32)


def get_reference(
    res_name: str,
    chemical_components_data: struc_chem_comps.ChemicalComponentsData,
    ccd: chemical_components.Ccd,
    random_state: np.random.RandomState,
    ref_max_modified_date: datetime.date,
    conformer_max_iterations: int | None,
) -> tuple[dict[str, Any], Any, Any]:
  """Reference structure for residue from CCD or SMILES.

  Uses CCD entry if available, otherwise uses SMILES from chemical components
  data. Conformer generation is done using RDKit, with a fallback to CCD ideal
  or reference coordinates if RDKit fails and those coordinates are supplied.

  Args:
    res_name: ccd code of the residue.
    chemical_components_data: ChemicalComponentsData for making ref structure.
    ccd: The chemical components dictionary.
    random_state: Numpy RandomState
    ref_max_modified_date: date beyond which reference structures must not be
      modified to be allowed to use reference coordinates.
    conformer_max_iterations: Optional override for maximum number of iterations
      to run for RDKit conformer search.

  Returns:
    Mapping from atom names to features, from_atoms, dest_atoms.
  """

  ccd_cif = ccd.get(res_name)

  mol = None
  if ccd_cif:
    try:
      mol = rdkit_utils.mol_from_ccd_cif(ccd_cif, remove_hydrogens=False)
    except rdkit_utils.MolFromMmcifError:
      logging.warning('Failed to construct mol from ccd_cif for: %s', res_name)
  else:  # No CCD entry, use SMILES from chemical components data.
    if not (
        chemical_components_data.chem_comp
        and res_name in chemical_components_data.chem_comp
        and chemical_components_data.chem_comp[res_name].pdbx_smiles
    ):
      raise ValueError(f'No CCD entry or SMILES for {res_name}.')
    smiles_string = chemical_components_data.chem_comp[res_name].pdbx_smiles
    logging.info('Using SMILES for: %s - %s', res_name, smiles_string)

    mol = Chem.MolFromSmiles(smiles_string)
    if mol is None:
      # In this case the model will not have any information about this molecule
      # and will not be able to predict anything about it.
      raise ValueError(
          f'Failed to construct RDKit Mol for {res_name} from SMILES string: '
          f'{smiles_string} . This is likely due to an issue with the SMILES '
          'string. Note that the userCCD input format provides an alternative '
          'way to define custom molecules directly without RDKit or SMILES.'
      )
    mol = Chem.AddHs(mol)
    # No existing names, we assign them from the graph.
    mol = rdkit_utils.assign_atom_names_from_graph(mol)
    # Temporary CCD cif with just atom and bond information, no coordinates.
    ccd_cif = rdkit_utils.mol_to_ccd_cif(mol, component_id='fake_cif')

  conformer = None
  atom_names = []
  elements = []
  charges = []
  pos = []

  # If mol is not None (must be True for SMILES case), then we try and generate
  # an RDKit conformer.
  if mol is not None:
    conformer_random_seed = int(random_state.randint(1, 1 << 31))
    conformer = rdkit_utils.get_random_conformer(
        mol=mol,
        random_seed=conformer_random_seed,
        max_iterations=conformer_max_iterations,
        logging_name=res_name,
    )
    if conformer:
      for idx, atom in enumerate(mol.GetAtoms()):
        atom_names.append(atom.GetProp('atom_name'))
        elements.append(atom.GetAtomicNum())
        charges.append(atom.GetFormalCharge())
        coords = conformer.GetAtomPosition(idx)
        pos.append([coords.x, coords.y, coords.z])
      pos = np.array(pos, dtype=np.float32)

  # If no mol could be generated (can only happen when using CCD), or no
  # conformer could be generated from the mol (can happen in either case), then
  # use CCD cif instead (which will have zero coordinates for SMILES case).
  if conformer is None:
    atom_names = ccd_cif['_chem_comp_atom.atom_id']
    charges = ccd_cif['_chem_comp_atom.charge']
    type_symbols = ccd_cif['_chem_comp_atom.type_symbol']
    elements = [
        periodic_table.ATOMIC_NUMBER.get(elem_type.capitalize(), 0)
        for elem_type in type_symbols
    ]
    pos = _get_reference_positions_from_ccd_cif(
        ccd_cif=ccd_cif,
        ref_max_modified_date=ref_max_modified_date,
        logging_name=res_name,
    )

  # Augment reference positions.
  pos = random_augmentation(pos, random_state)

  # Extract atom and bond information from CCD cif.
  from_atom = ccd_cif.get('_chem_comp_bond.atom_id_1', None)
  dest_atom = ccd_cif.get('_chem_comp_bond.atom_id_2', None)

  features = {}
  for atom_name in atom_names:
    features[atom_name] = {}
    idx = atom_names.index(atom_name)
    charge = 0 if charges[idx] == '?' else int(charges[idx])
    atom_name_chars = np.array([ord(c) - 32 for c in atom_name], dtype=int)
    atom_name_chars = _pad_to(atom_name_chars, (4,))
    features[atom_name]['positions'] = pos[idx]
    features[atom_name]['mask'] = 1
    features[atom_name]['element'] = elements[idx]
    features[atom_name]['charge'] = charge
    features[atom_name]['atom_name_chars'] = atom_name_chars
  return features, from_atom, dest_atom


@dataclasses.dataclass(frozen=True)
class RefStructure:
  """Contains ref structure information."""

  # Array with positions, float32, shape [num_res, max_atoms_per_token, 3]
  positions: xnp_ndarray
  # Array with masks, bool, shape [num_res, max_atoms_per_token]
  mask: xnp_ndarray
  # Array with elements, int32, shape [num_res, max_atoms_per_token]
  element: xnp_ndarray
  # Array with charges, float32, shape [num_res, max_atoms_per_token]
  charge: xnp_ndarray
  # Array with atom name characters, int32, [num_res, max_atoms_per_token, 4]
  atom_name_chars: xnp_ndarray
  # Array with reference space uids, int32, [num_res, max_atoms_per_token]
  ref_space_uid: xnp_ndarray

  @classmethod
  def compute_features(
      cls,
      all_token_atoms_layout: atom_layout.AtomLayout,
      ccd: chemical_components.Ccd,
      padding_shapes: PaddingShapes,
      chemical_components_data: struc_chem_comps.ChemicalComponentsData,
      random_state: np.random.RandomState,
      ref_max_modified_date: datetime.date,
      conformer_max_iterations: int | None,
      ligand_ligand_bonds: atom_layout.AtomLayout | None = None,
  ) -> tuple[Self, Any]:
    """Reference structure information for each residue."""

    # Get features per atom
    padded_shape = (padding_shapes.num_tokens, all_token_atoms_layout.shape[1])
    result = {
        'positions': np.zeros((*padded_shape, 3), 'float32'),
        'mask': np.zeros(padded_shape, 'bool'),
        'element': np.zeros(padded_shape, 'int32'),
        'charge': np.zeros(padded_shape, 'float32'),
        'atom_name_chars': np.zeros((*padded_shape, 4), 'int32'),
        'ref_space_uid': np.zeros((*padded_shape,), 'int32'),
    }

    atom_names_all = []
    chain_ids_all = []
    res_ids_all = []

    # Cache reference conformations for each residue.
    conformations = {}
    ref_space_uids = {}
    for idx in np.ndindex(all_token_atoms_layout.shape):
      chain_id = all_token_atoms_layout.chain_id[idx]
      res_id = all_token_atoms_layout.res_id[idx]
      res_name = all_token_atoms_layout.res_name[idx]
      is_non_standard = res_name not in _STANDARD_RESIDUES
      atom_name = all_token_atoms_layout.atom_name[idx]
      if not atom_name:
        ref = _DEFAULT_BLANK_REF
      else:
        if (chain_id, res_id) not in conformations:
          conf, from_atom, dest_atom = get_reference(
              res_name=res_name,
              chemical_components_data=chemical_components_data,
              ccd=ccd,
              random_state=random_state,
              ref_max_modified_date=ref_max_modified_date,
              conformer_max_iterations=conformer_max_iterations,
          )
          conformations[(chain_id, res_id)] = conf

          if (
              is_non_standard
              and (from_atom is not None)
              and (dest_atom is not None)
          ):
            # Add intra-ligand bond graph
            atom_names_ligand = np.stack(
                [from_atom, dest_atom], axis=1, dtype=object
            )
            atom_names_all.append(atom_names_ligand)
            res_ids_all.append(
                np.full_like(atom_names_ligand, res_id, dtype=int)
            )
            chain_ids_all.append(
                np.full_like(atom_names_ligand, chain_id, dtype=object)
            )

        conformation = conformations.get(
            (chain_id, res_id), {atom_name: _DEFAULT_BLANK_REF}
        )
        if atom_name not in conformation:
          logging.warning(
              'Missing atom "%s" for CCD "%s"',
              atom_name,
              all_token_atoms_layout.res_name[idx],
          )
        ref = conformation.get(atom_name, _DEFAULT_BLANK_REF)
      for k in ref:
        result[k][idx] = ref[k]

      # Assign a unique reference space id to each component, to determine which
      # reference positions live in the same reference space.
      space_str_id = (
          all_token_atoms_layout.chain_id[idx],
          all_token_atoms_layout.res_id[idx],
      )
      if space_str_id not in ref_space_uids:
        ref_space_uids[space_str_id] = len(ref_space_uids)
      result['ref_space_uid'][idx] = ref_space_uids[space_str_id]

    if atom_names_all:
      atom_names_all = np.concatenate(atom_names_all, axis=0)
      res_ids_all = np.concatenate(res_ids_all, axis=0)
      chain_ids_all = np.concatenate(chain_ids_all, axis=0)
      if ligand_ligand_bonds is not None:
        adjusted_ligand_ligand_bonds = atom_layout.AtomLayout(
            atom_name=np.concatenate(
                [ligand_ligand_bonds.atom_name, atom_names_all], axis=0
            ),
            chain_id=np.concatenate(
                [ligand_ligand_bonds.chain_id, chain_ids_all], axis=0
            ),
            res_id=np.concatenate(
                [ligand_ligand_bonds.res_id, res_ids_all], axis=0
            ),
        )
      else:
        adjusted_ligand_ligand_bonds = atom_layout.AtomLayout(
            atom_name=atom_names_all,
            chain_id=chain_ids_all,
            res_id=res_ids_all,
        )
    else:
      adjusted_ligand_ligand_bonds = ligand_ligand_bonds

    return cls(**result), adjusted_ligand_ligand_bonds

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        positions=batch['ref_pos'],
        mask=batch['ref_mask'],
        element=batch['ref_element'],
        charge=batch['ref_charge'],
        atom_name_chars=batch['ref_atom_name_chars'],
        ref_space_uid=batch['ref_space_uid'],
    )

  def as_data_dict(self) -> BatchDict:
    return {
        'ref_pos': self.positions,
        'ref_mask': self.mask,
        'ref_element': self.element,
        'ref_charge': self.charge,
        'ref_atom_name_chars': self.atom_name_chars,
        'ref_space_uid': self.ref_space_uid,
    }


jax.tree_util.register_dataclass(
    RefStructure,
    data_fields=[f.name for f in dataclasses.fields(RefStructure)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class ConvertModelOutput:
  """Contains atom layout info."""

  cleaned_struc: structure.Structure
  token_atoms_layout: atom_layout.AtomLayout
  flat_output_layout: atom_layout.AtomLayout
  empty_output_struc: structure.Structure
  polymer_ligand_bonds: atom_layout.AtomLayout
  ligand_ligand_bonds: atom_layout.AtomLayout

  @classmethod
  def compute_features(
      cls,
      all_token_atoms_layout: atom_layout.AtomLayout,
      padding_shapes: PaddingShapes,
      cleaned_struc: structure.Structure,
      flat_output_layout: atom_layout.AtomLayout,
      empty_output_struc: structure.Structure,
      polymer_ligand_bonds: atom_layout.AtomLayout,
      ligand_ligand_bonds: atom_layout.AtomLayout,
  ) -> Self:
    """Pads the all_token_atoms_layout and stores other data."""
    # Crop and pad the all_token_atoms_layout.
    token_atoms_layout = all_token_atoms_layout.copy_and_pad_to(
        (padding_shapes.num_tokens, all_token_atoms_layout.shape[1])
    )

    return cls(
        cleaned_struc=cleaned_struc,
        token_atoms_layout=token_atoms_layout,
        flat_output_layout=flat_output_layout,
        empty_output_struc=empty_output_struc,
        polymer_ligand_bonds=polymer_ligand_bonds,
        ligand_ligand_bonds=ligand_ligand_bonds,
    )

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    """Construct atom layout object from dictionary."""

    return cls(
        cleaned_struc=_unwrap(batch.get('cleaned_struc', None)),
        token_atoms_layout=_unwrap(batch.get('token_atoms_layout', None)),
        flat_output_layout=_unwrap(batch.get('flat_output_layout', None)),
        empty_output_struc=_unwrap(batch.get('empty_output_struc', None)),
        polymer_ligand_bonds=_unwrap(batch.get('polymer_ligand_bonds', None)),
        ligand_ligand_bonds=_unwrap(batch.get('ligand_ligand_bonds', None)),
    )

  def as_data_dict(self) -> BatchDict:
    return {
        'cleaned_struc': np.array(self.cleaned_struc, object),
        'token_atoms_layout': np.array(self.token_atoms_layout, object),
        'flat_output_layout': np.array(self.flat_output_layout, object),
        'empty_output_struc': np.array(self.empty_output_struc, object),
        'polymer_ligand_bonds': np.array(self.polymer_ligand_bonds, object),
        'ligand_ligand_bonds': np.array(self.ligand_ligand_bonds, object),
    }


jax.tree_util.register_dataclass(
    ConvertModelOutput,
    data_fields=[f.name for f in dataclasses.fields(ConvertModelOutput)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class AtomCrossAtt:
  """Operate on flat atoms."""

  token_atoms_to_queries: atom_layout.GatherInfo
  tokens_to_queries: atom_layout.GatherInfo
  tokens_to_keys: atom_layout.GatherInfo
  queries_to_keys: atom_layout.GatherInfo
  queries_to_token_atoms: atom_layout.GatherInfo

  @classmethod
  def compute_features(
      cls,
      all_token_atoms_layout: atom_layout.AtomLayout,  # (num_tokens, num_dense)
      queries_subset_size: int,
      keys_subset_size: int,
      padding_shapes: PaddingShapes,
  ) -> Self:
    """Computes gather indices and meta data to work with a flat atom list."""

    token_atoms_layout = all_token_atoms_layout.copy_and_pad_to(
        (padding_shapes.num_tokens, all_token_atoms_layout.shape[1])
    )
    token_atoms_mask = token_atoms_layout.atom_name.astype(bool)
    flat_layout = token_atoms_layout[token_atoms_mask]
    num_atoms = flat_layout.shape[0]

    padded_flat_layout = flat_layout.copy_and_pad_to((
        padding_shapes.num_atoms,
    ))

    # Create the layout for queries
    num_subsets = padding_shapes.num_atoms // queries_subset_size
    lay_arr = padded_flat_layout.to_array()
    queries_layout = atom_layout.AtomLayout.from_array(
        lay_arr.reshape((6, num_subsets, queries_subset_size))
    )

    # Create the layout for the keys (the key subsets are centered around the
    # query subsets)
    # Create initial gather indices (contain out-of-bound indices)
    subset_centers = np.arange(
        queries_subset_size / 2, padding_shapes.num_atoms, queries_subset_size
    )
    flat_to_key_gathers = (
        subset_centers[:, None]
        + np.arange(-keys_subset_size / 2, keys_subset_size / 2)[None, :]
    )
    flat_to_key_gathers = flat_to_key_gathers.astype(int)
    # Shift subsets with out-of-bound indices, such that they are fully within
    # the bounds.
    for row in range(flat_to_key_gathers.shape[0]):
      if flat_to_key_gathers[row, 0] < 0:
        flat_to_key_gathers[row, :] -= flat_to_key_gathers[row, 0]
      elif flat_to_key_gathers[row, -1] > num_atoms - 1:
        overflow = flat_to_key_gathers[row, -1] - (num_atoms - 1)
        flat_to_key_gathers[row, :] -= overflow
    # Create the keys layout.
    keys_layout = padded_flat_layout[flat_to_key_gathers]

    # Create gather indices for conversion between token atoms layout,
    # queries layout and keys layout.
    token_atoms_to_queries = atom_layout.compute_gather_idxs(
        source_layout=token_atoms_layout, target_layout=queries_layout
    )

    token_atoms_to_keys = atom_layout.compute_gather_idxs(
        source_layout=token_atoms_layout, target_layout=keys_layout
    )

    queries_to_keys = atom_layout.compute_gather_idxs(
        source_layout=queries_layout, target_layout=keys_layout
    )

    queries_to_token_atoms = atom_layout.compute_gather_idxs(
        source_layout=queries_layout, target_layout=token_atoms_layout
    )

    # Create gather indices for conversion of tokens layout to
    # queries and keys layout
    token_idxs = np.arange(padding_shapes.num_tokens).astype(np.int64)
    token_idxs = np.broadcast_to(token_idxs[:, None], token_atoms_layout.shape)
    tokens_to_queries = atom_layout.GatherInfo(
        gather_idxs=atom_layout.convert(
            token_atoms_to_queries, token_idxs, layout_axes=(0, 1)
        ),
        gather_mask=atom_layout.convert(
            token_atoms_to_queries, token_atoms_mask, layout_axes=(0, 1)
        ),
        input_shape=np.array((padding_shapes.num_tokens,)),
    )

    tokens_to_keys = atom_layout.GatherInfo(
        gather_idxs=atom_layout.convert(
            token_atoms_to_keys, token_idxs, layout_axes=(0, 1)
        ),
        gather_mask=atom_layout.convert(
            token_atoms_to_keys, token_atoms_mask, layout_axes=(0, 1)
        ),
        input_shape=np.array((padding_shapes.num_tokens,)),
    )

    return cls(
        token_atoms_to_queries=token_atoms_to_queries,
        tokens_to_queries=tokens_to_queries,
        tokens_to_keys=tokens_to_keys,
        queries_to_keys=queries_to_keys,
        queries_to_token_atoms=queries_to_token_atoms,
    )

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(
        token_atoms_to_queries=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='token_atoms_to_queries'
        ),
        tokens_to_queries=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='tokens_to_queries'
        ),
        tokens_to_keys=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='tokens_to_keys'
        ),
        queries_to_keys=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='queries_to_keys'
        ),
        queries_to_token_atoms=atom_layout.GatherInfo.from_dict(
            batch, key_prefix='queries_to_token_atoms'
        ),
    )

  def as_data_dict(self) -> BatchDict:
    return {
        **self.token_atoms_to_queries.as_dict(
            key_prefix='token_atoms_to_queries'
        ),
        **self.tokens_to_queries.as_dict(key_prefix='tokens_to_queries'),
        **self.tokens_to_keys.as_dict(key_prefix='tokens_to_keys'),
        **self.queries_to_keys.as_dict(key_prefix='queries_to_keys'),
        **self.queries_to_token_atoms.as_dict(
            key_prefix='queries_to_token_atoms'
        ),
    }


jax.tree_util.register_dataclass(
    AtomCrossAtt,
    data_fields=[f.name for f in dataclasses.fields(AtomCrossAtt)],
    meta_fields=[],
)


@dataclasses.dataclass(frozen=True)
class Frames:
  """Features for backbone frames."""

  mask: xnp_ndarray

  @classmethod
  def compute_features(
      cls,
      all_tokens: atom_layout.AtomLayout,
      all_token_atoms_layout: atom_layout.AtomLayout,
      ref_structure: RefStructure,
      padding_shapes: PaddingShapes,
  ) -> Self:
    """Computes features for backbone frames."""
    num_tokens = padding_shapes.num_tokens
    all_token_atoms_layout = all_token_atoms_layout.copy_and_pad_to(
        (num_tokens, all_token_atoms_layout.shape[1])
    )

    all_token_atoms_to_all_tokens = atom_layout.compute_gather_idxs(
        source_layout=all_token_atoms_layout, target_layout=all_tokens
    )
    ref_coordinates = atom_layout.convert(
        all_token_atoms_to_all_tokens,
        ref_structure.positions.astype(np.float32),
        layout_axes=(0, 1),
    )
    ref_mask = atom_layout.convert(
        all_token_atoms_to_all_tokens,
        ref_structure.mask.astype(bool),
        layout_axes=(0, 1),
    )
    ref_mask = ref_mask & all_token_atoms_to_all_tokens.gather_mask.astype(bool)

    all_frame_mask = []

    # Iterate over tokens
    for idx, args in enumerate(
        zip(all_tokens.chain_type, all_tokens.chain_id, all_tokens.res_id)
    ):

      chain_type, chain_id, res_id = args

      if chain_type in list(mmcif_names.PEPTIDE_CHAIN_TYPES):
        frame_mask = True
      elif chain_type in list(mmcif_names.NUCLEIC_ACID_CHAIN_TYPES):
        frame_mask = True
      elif chain_type in list(mmcif_names.NON_POLYMER_CHAIN_TYPES):
        # For ligands, build frames from closest atoms from the same molecule.
        (local_token_idxs,) = np.where(
            (all_tokens.chain_type == chain_type)
            & (all_tokens.chain_id == chain_id)
            & (all_tokens.res_id == res_id)
        )

        if len(local_token_idxs) < 3:
          frame_mask = False

        else:
          # [local_tokens]
          local_dist = np.linalg.norm(
              ref_coordinates[idx] - ref_coordinates[local_token_idxs], axis=-1
          )
          local_mask = ref_mask[local_token_idxs]
          cost = local_dist + 1e8 * ~local_mask
          cost = cost + 1e8 * (idx == local_token_idxs)
          # [local_tokens]
          closest_idxs = np.argsort(cost, axis=0)

          # The closest indices index an array of local tokens. Convert this
          # to indices of the full (num_tokens,) array.
          global_closest_idxs = local_token_idxs[closest_idxs]

          # Construct frame by placing the current token at the origin and two
          # nearest atoms on either side.
          global_frame_idxs = np.array(
              (global_closest_idxs[0], idx, global_closest_idxs[1])
          )

          # Check that the frame atoms are not colinear.
          a, b, c = ref_coordinates[global_frame_idxs]
          vec1 = a - b
          vec2 = c - b
          # Reference coordinates can be all zeros, in which case we have
          # to explicitly set colinearity.
          if np.isclose(np.linalg.norm(vec1, axis=-1), 0) or np.isclose(
              np.linalg.norm(vec2, axis=-1), 0
          ):
            is_colinear = True
            logging.info('Found identical coordinates: Assigning as colinear.')
          else:
            vec1 = vec1 / np.linalg.norm(vec1, axis=-1)
            vec2 = vec2 / np.linalg.norm(vec2, axis=-1)
            cos_angle = np.einsum('...k,...k->...', vec1, vec2)
            # <25 degree deviation is considered colinear.
            is_colinear = 1 - np.abs(cos_angle) < 0.0937

          frame_mask = not is_colinear
      else:
        # No frame for other chain types.
        frame_mask = False

      all_frame_mask.append(frame_mask)

    all_frame_mask = np.array(all_frame_mask, dtype=bool)

    mask = _pad_to(all_frame_mask, (padding_shapes.num_tokens,))

    return cls(mask=mask)

  @classmethod
  def from_data_dict(cls, batch: BatchDict) -> Self:
    return cls(mask=batch['frames_mask'])

  def as_data_dict(self) -> BatchDict:
    return {'frames_mask': self.mask}


jax.tree_util.register_dataclass(
    Frames,
    data_fields=[f.name for f in dataclasses.fields(Frames)],
    meta_fields=[],
)


================================================
FILE: src/alphafold3/model/merging_features.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Methods for merging existing features to create a new example.

Covers:
- Merging features across chains.
- Merging the paired and unpaired parts of the MSA.
"""

from typing import TypeAlias

from alphafold3.model import data_constants
import jax.numpy as jnp
import numpy as np

NUM_SEQ_NUM_RES_MSA_FEATURES = data_constants.NUM_SEQ_NUM_RES_MSA_FEATURES
NUM_SEQ_MSA_FEATURES = data_constants.NUM_SEQ_MSA_FEATURES
MSA_PAD_VALUES = data_constants.MSA_PAD_VALUES


xnp_ndarray: TypeAlias = np.ndarray | jnp.ndarray  # pylint: disable=invalid-name
BatchDict: TypeAlias = dict[str, xnp_ndarray]


def _pad_features_to_max(feat_name: str, chains: list[BatchDict], axis: int):
  """Pad a set of features to the maximum size amongst all chains.

  Args:
    feat_name: The feature name to pad.
    chains: A list of chains with associated features.
    axis: Which axis to pad to the max.

  Returns:
    A list of features, all with the same size on the given axis.
  """
  max_num_seq = np.max([chain[feat_name].shape[axis] for chain in chains])

  padded_feats = []
  for chain in chains:
    feat = chain[feat_name]

    padding = np.zeros_like(feat.shape)  # pytype: disable=attribute-error
    padding[axis] = max_num_seq - feat.shape[axis]  # pytype: disable=attribute-error
    padding = [(0, p) for p in padding]
    padded_feats.append(
        np.pad(
            feat,
            padding,
            mode='constant',
            constant_values=MSA_PAD_VALUES[feat_name],
        )
    )
  return padded_feats


def merge_msa_features(feat_name: str, chains: list[BatchDict]) -> np.ndarray:
  """Merges MSA features with shape (NUM_SEQ, NUM_RES) across chains."""
  expected_dtype = chains[0][feat_name].dtype
  if '_all_seq' in feat_name:
    return np.concatenate(
        [c.get(feat_name, np.array([], expected_dtype)) for c in chains], axis=1
    )
  else:
    # Since each MSA can be of different lengths, we first need to pad them
    # all to the size of the largest MSA before concatenating.
    padded_feats = _pad_features_to_max(feat_name, chains, axis=0)
    return np.concatenate(padded_feats, axis=1)


def merge_paired_and_unpaired_msa(example: BatchDict) -> BatchDict:
  """Concatenates the paired (all_seq) MSA features with the unpaired ones."""
  new_example = dict(example)

  for feature_name in NUM_SEQ_NUM_RES_MSA_FEATURES + NUM_SEQ_MSA_FEATURES:
    if feature_name in example and feature_name + '_all_seq' in example:
      feat = example[feature_name]
      feat_all_seq = example[feature_name + '_all_seq']
      merged_feat = np.concatenate([feat_all_seq, feat], axis=0)
      new_example[feature_name] = merged_feat

  new_example['num_alignments'] = np.array(
      new_example['msa'].shape[0], dtype=np.int32
  )
  return new_example


================================================
FILE: src/alphafold3/model/mkdssp_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include "alphafold3/model/mkdssp_pybind.h"

#include <filesystem>

#include <cif++/file.hpp>
#include <cif++/pdb.hpp>
#include <dssp.hpp>
#include <sstream>

#include "absl/strings/string_view.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"

namespace alphafold3 {
namespace py = pybind11;

void RegisterModuleMkdssp(pybind11::module m) {
  if (!getenv("LIBCIFPP_DATA_DIR")) {
    py::module site = py::module::import("site");
    py::list paths = py::cast<py::list>(site.attr("getsitepackages")());
    // Find the first path that contains the libcifpp components.cif file.
    bool found = false;
    for (const auto& py_path : paths) {
      auto path_str =
          std::filesystem::path(py::cast<absl::string_view>(py_path)) /
          "share/libcifpp/components.cif";
      if (std::filesystem::exists(path_str)) {
        setenv("LIBCIFPP_DATA_DIR", path_str.parent_path().c_str(), 0);
        found = true;
        break;
      }
    }
    if (!found) {
      throw py::type_error(
        "Could not find the libcifpp components.cif file.");
    }
  }
  m.def(
      "get_dssp",
      [](absl::string_view mmcif, int model_no,
         int min_poly_proline_stretch_length,
         bool calculate_surface_accessibility) {
        cif::file cif_file(mmcif.data(), mmcif.size());
        dssp result(cif_file.front(), model_no, min_poly_proline_stretch_length,
                    calculate_surface_accessibility);
        std::stringstream sstream;
        result.write_legacy_output(sstream);
        return sstream.str();
      },
      py::arg("mmcif"), py::arg("model_no") = 1,
      py::arg("min_poly_proline_stretch_length") = 3,
      py::arg("calculate_surface_accessibility") = false,
      py::doc("Gets secondary structure from an mmCIF file."));
}
}  // namespace alphafold3


================================================
FILE: src/alphafold3/model/mkdssp_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_MODEL_MKDSSP_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_MODEL_MKDSSP_PYBIND_H_


#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMkdssp(pybind11::module m);

}


#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_MODEL_MKDSSP_PYBIND_H_


================================================
FILE: src/alphafold3/model/mmcif_metadata.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Adds mmCIF metadata (to be ModelCIF-conformant) and author and legal info."""

from typing import Final

from alphafold3.structure import mmcif
import numpy as np

_LICENSE_URL: Final[str] = (
    'https://github.com/google-deepmind/alphafold3/blob/main/OUTPUT_TERMS_OF_USE.md'
)

_LICENSE: Final[str] = f"""
Non-commercial use only, by using this file you agree to the terms of use found
at {_LICENSE_URL}.
To request access to the AlphaFold 3 model parameters, follow the process set
out at https://github.com/google-deepmind/alphafold3. You may only use these if
received directly from Google. Use is subject to terms of use available at
https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.
""".strip()

_DISCLAIMER: Final[str] = """\
AlphaFold 3 and its output are not intended for, have not been validated for,
and are not approved for clinical use. They are provided "as-is" without any
warranty of any kind, whether expressed or implied. No warranty is given that
use shall not infringe the rights of any third party.
""".strip()

_MMCIF_PAPER_AUTHORS: Final[tuple[str, ...]] = (
    'Google DeepMind',
    'Isomorphic Labs',
)

# Authors of the mmCIF - we set them to be equal to the authors of the paper.
_MMCIF_AUTHORS: Final[tuple[str, ...]] = _MMCIF_PAPER_AUTHORS


def add_metadata_to_mmcif(
    old_cif: mmcif.Mmcif, version: str, model_id: bytes
) -> mmcif.Mmcif:
  """Adds metadata to a mmCIF to make it ModelCIF-conformant."""
  cif = {}

  # ModelCIF conformation dictionary.
  cif['_audit_conform.dict_name'] = ['mmcif_ma.dic']
  cif['_audit_conform.dict_version'] = ['1.4.5']
  cif['_audit_conform.dict_location'] = [
      'https://raw.githubusercontent.com/ihmwg/ModelCIF/master/dist/mmcif_ma.dic'
  ]

  cif['_pdbx_data_usage.id'] = ['1', '2']
  cif['_pdbx_data_usage.type'] = ['license', 'disclaimer']
  cif['_pdbx_data_usage.details'] = [_LICENSE, _DISCLAIMER]
  cif['_pdbx_data_usage.url'] = [_LICENSE_URL, '?']

  # Structure author details.
  cif['_audit_author.name'] = []
  cif['_audit_author.pdbx_ordinal'] = []
  for author_index, author_name in enumerate(_MMCIF_AUTHORS, start=1):
    cif['_audit_author.name'].append(author_name)
    cif['_audit_author.pdbx_ordinal'].append(str(author_index))

  # Paper author details.
  cif['_citation_author.citation_id'] = []
  cif['_citation_author.name'] = []
  cif['_citation_author.ordinal'] = []
  for author_index, author_name in enumerate(_MMCIF_PAPER_AUTHORS, start=1):
    cif['_citation_author.citation_id'].append('primary')
    cif['_citation_author.name'].append(author_name)
    cif['_citation_author.ordinal'].append(str(author_index))

  # Paper citation details.
  cif['_citation.id'] = ['primary']
  cif['_citation.title'] = [
      'Accurate structure prediction of biomolecular interactions with'
      ' AlphaFold 3'
  ]
  cif['_citation.journal_full'] = ['Nature']
  cif['_citation.journal_volume'] = ['630']
  cif['_citation.page_first'] = ['493']
  cif['_citation.page_last'] = ['500']
  cif['_citation.year'] = ['2024']
  cif['_citation.journal_id_ASTM'] = ['NATUAS']
  cif['_citation.country'] = ['UK']
  cif['_citation.journal_id_ISSN'] = ['0028-0836']
  cif['_citation.journal_id_CSD'] = ['0006']
  cif['_citation.book_publisher'] = ['?']
  cif['_citation.pdbx_database_id_PubMed'] = ['38718835']
  cif['_citation.pdbx_database_id_DOI'] = ['10.1038/s41586-024-07487-w']

  # Type of data in the dataset including data used in the model generation.
  cif['_ma_data.id'] = ['1']
  cif['_ma_data.name'] = ['Model']
  cif['_ma_data.content_type'] = ['model coordinates']

  # Description of number of instances for each entity.
  cif['_ma_target_entity_instance.asym_id'] = old_cif['_struct_asym.id']
  cif['_ma_target_entity_instance.entity_id'] = old_cif[
      '_struct_asym.entity_id'
  ]
  cif['_ma_target_entity_instance.details'] = ['.'] * len(
      cif['_ma_target_entity_instance.entity_id']
  )

  # Details about the target entities.
  cif['_ma_target_entity.entity_id'] = cif[
      '_ma_target_entity_instance.entity_id'
  ]
  cif['_ma_target_entity.data_id'] = ['1'] * len(
      cif['_ma_target_entity.entity_id']
  )
  cif['_ma_target_entity.origin'] = ['.'] * len(
      cif['_ma_target_entity.entity_id']
  )

  # Details of the models being deposited.
  cif['_ma_model_list.ordinal_id'] = ['1']
  cif['_ma_model_list.model_id'] = ['1']
  cif['_ma_model_list.model_group_id'] = ['1']
  cif['_ma_model_list.model_name'] = ['Top ranked model']

  cif['_ma_model_list.model_group_name'] = [
      f'AlphaFold-beta-20231127 ({version})'
  ]
  cif['_ma_model_list.data_id'] = ['1']
  cif['_ma_model_list.model_type'] = ['Ab initio model']

  # Software used.
  cif['_software.pdbx_ordinal'] = ['1']
  cif['_software.name'] = ['AlphaFold']
  cif['_software.version'] = [
      f'AlphaFold-beta-20231127 ({model_id.decode("ascii")})'
  ]
  cif['_software.type'] = ['package']
  cif['_software.description'] = ['Structure prediction']
  cif['_software.classification'] = ['other']
  cif['_software.date'] = ['?']

  # Collection of software into groups.
  cif['_ma_software_group.ordinal_id'] = ['1']
  cif['_ma_software_group.group_id'] = ['1']
  cif['_ma_software_group.software_id'] = ['1']

  # Method description to conform with ModelCIF.
  cif['_ma_protocol_step.ordinal_id'] = ['1', '2', '3']
  cif['_ma_protocol_step.protocol_id'] = ['1', '1', '1']
  cif['_ma_protocol_step.step_id'] = ['1', '2', '3']
  cif['_ma_protocol_step.method_type'] = [
      'coevolution MSA',
      'template search',
      'modeling',
  ]

  # Details of the metrics use to assess model confidence.
  cif['_ma_qa_metric.id'] = ['1', '2']
  cif['_ma_qa_metric.name'] = ['pLDDT', 'pLDDT']
  # Accepted values are distance, energy, normalised score, other, zscore.
  cif['_ma_qa_metric.type'] = ['pLDDT', 'pLDDT']
  cif['_ma_qa_metric.mode'] = ['global', 'local']
  cif['_ma_qa_metric.software_group_id'] = ['1', '1']

  # Global model confidence pLDDT value.
  cif['_ma_qa_metric_global.ordinal_id'] = ['1']
  cif['_ma_qa_metric_global.model_id'] = ['1']
  cif['_ma_qa_metric_global.metric_id'] = ['1']
  # Mean over all atoms, since AlphaFold 3 outputs pLDDT per-atom.
  global_plddt = np.mean(
      [float(v) for v in old_cif['_atom_site.B_iso_or_equiv']]
  )
  cif['_ma_qa_metric_global.metric_value'] = [f'{global_plddt:.2f}']

  # Local (per residue) model confidence pLDDT value.
  cif['_ma_qa_metric_local.ordinal_id'] = []
  cif['_ma_qa_metric_local.model_id'] = []
  cif['_ma_qa_metric_local.label_asym_id'] = []
  cif['_ma_qa_metric_local.label_seq_id'] = []
  cif['_ma_qa_metric_local.label_comp_id'] = []
  cif['_ma_qa_metric_local.metric_id'] = []
  cif['_ma_qa_metric_local.metric_value'] = []

  plddt_grouped_by_res = {}
  for *res, atom_plddt in zip(
      old_cif['_atom_site.label_asym_id'],
      old_cif['_atom_site.label_seq_id'],
      old_cif['_atom_site.label_comp_id'],
      old_cif['_atom_site.B_iso_or_equiv'],
  ):
    plddt_grouped_by_res.setdefault(tuple(res), []).append(float(atom_plddt))

  for ordinal_id, ((chain_id, res_id, res_name), res_plddts) in enumerate(
      plddt_grouped_by_res.items(), start=1
  ):
    res_plddt = np.mean(res_plddts)
    cif['_ma_qa_metric_local.ordinal_id'].append(str(ordinal_id))
    cif['_ma_qa_metric_local.model_id'].append('1')
    cif['_ma_qa_metric_local.label_asym_id'].append(chain_id)
    cif['_ma_qa_metric_local.label_seq_id'].append(res_id)
    cif['_ma_qa_metric_local.label_comp_id'].append(res_name)
    cif['_ma_qa_metric_local.metric_id'].append('2')  # See _ma_qa_metric.id.
    cif['_ma_qa_metric_local.metric_value'].append(f'{res_plddt:.2f}')

  cif['_atom_type.symbol'] = sorted(set(old_cif['_atom_site.type_symbol']))

  return old_cif.copy_and_update(cif)


def add_legal_comment(cif: str) -> str:
  """Adds legal comment at the top of the mmCIF."""
  # fmt: off
  # pylint: disable=line-too-long
  comment = (
      '# By using this file you agree to the legally binding terms of use found at\n'
      f'# {_LICENSE_URL}.\n'
      '# To request access to the AlphaFold 3 model parameters, follow the process set\n'
      '# out at https://github.com/google-deepmind/alphafold3. You may only use these if\n'
      '# received directly from Google. Use is subject to terms of use available at\n'
      '# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md.'
  )
  # pylint: enable=line-too-long
  # fmt: on
  return f'{comment}\n{cif}'


================================================
FILE: src/alphafold3/model/model.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""AlphaFold3 model."""

from collections.abc import Iterable, Mapping
import concurrent
import dataclasses
import functools
from typing import Any, TypeAlias

from absl import logging
from alphafold3 import structure
from alphafold3.common import base_config
from alphafold3.model import confidences
from alphafold3.model import feat_batch
from alphafold3.model import features
from alphafold3.model import model_config
from alphafold3.model.atom_layout import atom_layout
from alphafold3.model.components import mapping
from alphafold3.model.components import utils
from alphafold3.model.network import atom_cross_attention
from alphafold3.model.network import confidence_head
from alphafold3.model.network import diffusion_head
from alphafold3.model.network import distogram_head
from alphafold3.model.network import evoformer as evoformer_network
from alphafold3.model.network import featurization
import haiku as hk
import jax
import jax.numpy as jnp
import numpy as np


ModelResult: TypeAlias = Mapping[str, Any]


@dataclasses.dataclass(frozen=True, kw_only=True)
class InferenceResult:
  """Postprocessed model result.

  Attributes:
    predicted_structure: Predicted protein structure.
    numerical_data: Useful numerical data (scalars or arrays) to be saved at
      inference time.
    metadata: Smaller numerical data (usually scalar) to be saved as inference
      metadata.
    debug_outputs: Additional dict for debugging, e.g. raw outputs of a model
      forward pass.
    model_id: Model identifier.
  """

  predicted_structure: structure.Structure = dataclasses.field()
  numerical_data: Mapping[str, float | int | np.ndarray] = dataclasses.field(
      default_factory=dict
  )
  metadata: Mapping[str, float | int | np.ndarray] = dataclasses.field(
      default_factory=dict
  )
  debug_outputs: Mapping[str, Any] = dataclasses.field(default_factory=dict)
  model_id: bytes = b''


def get_predicted_structure(
    result: ModelResult, batch: feat_batch.Batch
) -> structure.Structure:
  """Creates the predicted structure and ion preditions.

  Args:
    result: model output in a model specific layout
    batch: model input batch

  Returns:
    Predicted structure.
  """
  model_output_coords = result['diffusion_samples']['atom_positions']

  # Rearrange model output coordinates to the flat output layout.
  model_output_to_flat = atom_layout.compute_gather_idxs(
      source_layout=batch.convert_model_output.token_atoms_layout,
      target_layout=batch.convert_model_output.flat_output_layout,
  )
  pred_flat_atom_coords = atom_layout.convert(
      gather_info=model_output_to_flat,
      arr=model_output_coords,
      layout_axes=(-3, -2),
  )

  predicted_lddt = result.get('predicted_lddt')

  if predicted_lddt is not None:
    pred_flat_b_factors = atom_layout.convert(
        gather_info=model_output_to_flat,
        arr=predicted_lddt,
        layout_axes=(-2, -1),
    )
  else:
    # Handle models which don't have predicted_lddt outputs.
    pred_flat_b_factors = np.zeros(pred_flat_atom_coords.shape[:-1])

  (missing_atoms_indices,) = np.nonzero(model_output_to_flat.gather_mask == 0)
  if missing_atoms_indices.shape[0] > 0:
    missing_atoms_flat_layout = batch.convert_model_output.flat_output_layout[
        missing_atoms_indices
    ]
    missing_atoms_uids = list(
        zip(
            missing_atoms_flat_layout.chain_id,
            missing_atoms_flat_layout.res_id,
            missing_atoms_flat_layout.res_name,
            missing_atoms_flat_layout.atom_name,
        )
    )
    logging.warning(
        'Target %s: warning: %s atoms were not predicted by the '
        'model, setting their coordinates to (0, 0, 0). '
        'Missing atoms: %s',
        batch.convert_model_output.empty_output_struc.name,
        missing_atoms_indices.shape[0],
        missing_atoms_uids,
    )

  # Put them into a structure
  pred_struc = batch.convert_model_output.empty_output_struc
  pred_struc = pred_struc.copy_and_update_atoms(
      atom_x=pred_flat_atom_coords[..., 0],
      atom_y=pred_flat_atom_coords[..., 1],
      atom_z=pred_flat_atom_coords[..., 2],
      atom_b_factor=pred_flat_b_factors,
      atom_occupancy=np.ones(pred_flat_atom_coords.shape[:-1]),  # Always 1.0.
  )
  # Set manually/differently when adding metadata.
  pred_struc = pred_struc.copy_and_update_globals(release_date=None)
  return pred_struc


def create_target_feat_embedding(
    batch: feat_batch.Batch,
    config: evoformer_network.Evoformer.Config,
    global_config: model_config.GlobalConfig,
) -> jnp.ndarray:
  """Create target feature embedding."""

  dtype = jnp.bfloat16 if global_config.bfloat16 == 'all' else jnp.float32

  with utils.bfloat16_context():
    target_feat = featurization.create_target_feat(
        batch,
        append_per_atom_features=False,
    ).astype(dtype)

    enc = atom_cross_attention.atom_cross_att_encoder(
        token_atoms_act=None,
        trunk_single_cond=None,
        trunk_pair_cond=None,
        config=config.per_atom_conditioning,
        global_config=global_config,
        batch=batch,
        name='evoformer_conditioning',
    )
    target_feat = jnp.concatenate([target_feat, enc.token_act], axis=-1).astype(
        dtype
    )

  return target_feat


def _compute_ptm(
    result: ModelResult,
    num_tokens: int,
    asym_id: np.ndarray,
    pae_single_mask: np.ndarray,
    interface: bool,
) -> np.ndarray:
  """Computes the pTM metrics from PAE."""
  return np.stack(
      [
          confidences.predicted_tm_score(
              tm_adjusted_pae=tm_adjusted_pae[:num_tokens, :num_tokens],
              asym_id=asym_id,
              pair_mask=pae_single_mask[:num_tokens, :num_tokens],
              interface=interface,
          )
          for tm_adjusted_pae in result['tmscore_adjusted_pae_global']
      ],
      axis=0,
  )


def _compute_chain_pair_iptm(
    num_tokens: int,
    asym_ids: np.ndarray,
    mask: np.ndarray,
    tm_adjusted_pae: np.ndarray,
) -> np.ndarray:
  """Computes the chain pair ipTM metrics from PAE."""
  return np.stack(
      [
          confidences.chain_pairwise_predicted_tm_scores(
              tm_adjusted_pae=sample_tm_adjusted_pae[:num_tokens],
              asym_id=asym_ids[:num_tokens],
              pair_mask=mask[:num_tokens, :num_tokens],
          )
          for sample_tm_adjusted_pae in tm_adjusted_pae
      ],
      axis=0,
  )


class Model(hk.Module):
  """Full model. Takes in data batch and returns model outputs."""

  class HeadsConfig(base_config.BaseConfig):
    diffusion: diffusion_head.DiffusionHead.Config = base_config.autocreate()
    confidence: confidence_head.ConfidenceHead.Config = base_config.autocreate()
    distogram: distogram_head.DistogramHead.Config = base_config.autocreate()

  class Config(base_config.BaseConfig):
    evoformer: evoformer_network.Evoformer.Config = base_config.autocreate()
    global_config: model_config.GlobalConfig = base_config.autocreate()
    heads: 'Model.HeadsConfig' = base_config.autocreate()
    num_recycles: int = 10
    return_embeddings: bool = False
    return_distogram: bool = False

  def __init__(self, config: Config, name: str = 'diffuser'):
    super().__init__(name=name)
    self.config = config
    self.global_config = config.global_config
    self.diffusion_module = diffusion_head.DiffusionHead(
        self.config.heads.diffusion, self.global_config
    )

  @hk.transparent
  def _sample_diffusion(
      self,
      batch: feat_batch.Batch,
      embeddings: dict[str, jnp.ndarray],
      *,
      sample_config: diffusion_head.SampleConfig,
  ) -> dict[str, jnp.ndarray]:
    denoising_step = functools.partial(
        self.diffusion_module,
        batch=batch,
        embeddings=embeddings,
        use_conditioning=True,
    )

    sample = diffusion_head.sample(
        denoising_step=denoising_step,
        batch=batch,
        key=hk.next_rng_key(),
        config=sample_config,
    )
    return sample

  def __call__(
      self, batch: features.BatchDict, key: jax.Array | None = None
  ) -> ModelResult:
    if key is None:
      key = hk.next_rng_key()

    batch = feat_batch.Batch.from_data_dict(batch)

    embedding_module = evoformer_network.Evoformer(
        self.config.evoformer, self.global_config
    )
    target_feat = create_target_feat_embedding(
        batch=batch,
        config=embedding_module.config,
        global_config=self.global_config,
    )

    def recycle_body(_, args):
      prev, key = args
      key, subkey = jax.random.split(key)
      embeddings = embedding_module(
          batch=batch,
          prev=prev,
          target_feat=target_feat,
          key=subkey,
      )
      embeddings['pair'] = embeddings['pair'].astype(jnp.float32)
      embeddings['single'] = embeddings['single'].astype(jnp.float32)
      return embeddings, key

    num_res = batch.num_res

    embeddings = {
        'pair': jnp.zeros(
            [num_res, num_res, self.config.evoformer.pair_channel],
            dtype=jnp.float32,
        ),
        'single': jnp.zeros(
            [num_res, self.config.evoformer.seq_channel], dtype=jnp.float32
        ),
        'target_feat': target_feat,
    }
    if hk.running_init():
      embeddings, _ = recycle_body(None, (embeddings, key))
    else:
      # Number of recycles is number of additional forward trunk passes.
      num_iter = self.config.num_recycles + 1
      embeddings, _ = hk.fori_loop(0, num_iter, recycle_body, (embeddings, key))

    samples = self._sample_diffusion(
        batch,
        embeddings,
        sample_config=self.config.heads.diffusion.eval,
    )

    # Compute dist_error_fn over all samples for distance error logging.
    confidence_output = mapping.sharded_map(
        lambda dense_atom_positions: confidence_head.ConfidenceHead(
            self.config.heads.confidence, self.global_config
        )(
            dense_atom_positions=dense_atom_positions,
            embeddings=embeddings,
            seq_mask=batch.token_features.mask,
            token_atoms_to_pseudo_beta=batch.pseudo_beta_info.token_atoms_to_pseudo_beta,
            asym_id=batch.token_features.asym_id,
        ),
        in_axes=0,
    )(samples['atom_positions'])

    distogram = distogram_head.DistogramHead(
        self.config.heads.distogram, self.global_config
    )(batch, embeddings, return_distogram=self.config.return_distogram)

    output = {
        'diffusion_samples': samples,
        'distogram': distogram,
        **confidence_output,
    }
    if self.config.return_embeddings:
      output['single_embeddings'] = embeddings['single']
      output['pair_embeddings'] = embeddings['pair']
    return output

  @classmethod
  def get_inference_result(
      cls,
      batch: features.BatchDict,
      result: ModelResult,
      target_name: str = '',
  ) -> Iterable[InferenceResult]:
    """Get the predicted structure, scalars, and arrays for inference.

    This function also computes any inference-time quantities, which are not a
    part of the forward-pass, e.g. additional confidence scores. Note that this
    function is not serialized, so it should be slim if possible.

    Args:
      batch: data batch used for model inference, incl. TPU invalid types.
      result: output dict from the model's forward pass.
      target_name: target name to be saved within structure.

    Yields:
      inference_result: dataclass object that contains a predicted structure,
      important inference-time scalars and arrays, as well as a slightly trimmed
      dictionary of raw model result from the forward pass (for debugging).
    """
    del target_name
    batch = feat_batch.Batch.from_data_dict(batch)

    # Retrieve structure and construct a predicted structure.
    pred_structure = get_predicted_structure(result=result, batch=batch)

    num_tokens = batch.token_features.seq_length.item()

    pae_single_mask = np.tile(
        batch.frames.mask[:, None],
        [1, batch.frames.mask.shape[0]],
    )
    ptm = _compute_ptm(
        result=result,
        num_tokens=num_tokens,
        asym_id=batch.token_features.asym_id[:num_tokens],
        pae_single_mask=pae_single_mask,
        interface=False,
    )
    iptm = _compute_ptm(
        result=result,
        num_tokens=num_tokens,
        asym_id=batch.token_features.asym_id[:num_tokens],
        pae_single_mask=pae_single_mask,
        interface=True,
    )
    ptm_iptm_average = 0.8 * iptm + 0.2 * ptm

    asym_ids = batch.token_features.asym_id[:num_tokens]
    # Map asym IDs back to chain IDs. Asym IDs are constructed from chain IDs by
    # iterating over the chain IDs, and for each unique chain ID incrementing
    # the asym ID by 1 and mapping it to the particular chain ID. Asym IDs are
    # 1-indexed, so subtract 1 to get back to the chain ID.
    chain_ids = [pred_structure.chains[asym_id - 1] for asym_id in asym_ids]
    res_ids = batch.token_features.residue_index[:num_tokens]

    if len(np.unique(asym_ids[:num_tokens])) > 1:
      # There is more than one chain, hence interface pTM (i.e. ipTM) defined,
      # so use it.
      ranking_confidence = ptm_iptm_average
    else:
      # There is only one chain, hence ipTM=NaN, so use just pTM.
      ranking_confidence = ptm

    contact_probs = result['distogram']['contact_probs']
    # Compute PAE related summaries.
    _, chain_pair_pae_min, _ = confidences.chain_pair_pae(
        num_tokens=num_tokens,
        asym_ids=batch.token_features.asym_id,
        full_pae=result['full_pae'],
        mask=pae_single_mask,
    )
    chain_pair_pde_mean, chain_pair_pde_min = confidences.chain_pair_pde(
        num_tokens=num_tokens,
        asym_ids=batch.token_features.asym_id,
        full_pde=result['full_pde'],
    )
    intra_chain_single_pde, cross_chain_single_pde, _ = confidences.pde_single(
        num_tokens,
        batch.token_features.asym_id,
        result['full_pde'],
        contact_probs,
    )
    pae_metrics = confidences.pae_metrics(
        num_tokens=num_tokens,
        asym_ids=batch.token_features.asym_id,
        full_pae=result['full_pae'],
        mask=pae_single_mask,
        contact_probs=contact_probs,
        tm_adjusted_pae=result['tmscore_adjusted_pae_interface'],
    )
    ranking_confidence_pae = confidences.rank_metric(
        result['full_pae'],
        contact_probs * batch.frames.mask[:, None].astype(float),
    )
    chain_pair_iptm = _compute_chain_pair_iptm(
        num_tokens=num_tokens,
        asym_ids=batch.token_features.asym_id,
        mask=pae_single_mask,
        tm_adjusted_pae=result['tmscore_adjusted_pae_interface'],
    )
    # iptm_ichain is a vector of per-chain ptm values. iptm_ichain[0],
    # for example, is just the zeroth diagonal entry of the chain pair iptm
    # matrix:
    # [[x, , ],
    #  [ , , ],
    #  [ , , ]]]
    iptm_ichain = chain_pair_iptm.diagonal(axis1=-2, axis2=-1)
    # iptm_xchain is a vector of cross-chain interactions for each chain.
    # iptm_xchain[0], for example, is an average of chain 0's interactions with
    # other chains:
    # [[ ,x,x],
    #  [x, , ],
    #  [x, , ]]]
    iptm_xchain = confidences.get_iptm_xchain(chain_pair_iptm)

    predicted_distance_errors = result['average_pde']

    # Computing solvent accessible area with dssp can be slow for large
    # structures with lots of chains, so we parallelize the call.
    pred_structures = pred_structure.unstack()
    with concurrent.futures.ThreadPoolExecutor(
        max_workers=min(len(pred_structures), 32)
    ) as executor:
      has_clash = list(executor.map(confidences.has_clash, pred_structures))
      fraction_disordered = list(
          executor.map(confidences.fraction_disordered, pred_structures)
      )

    for idx, pred_structure in enumerate(pred_structures):
      ranking_score = confidences.get_ranking_score(
          ptm=ptm[idx],
          iptm=iptm[idx],
          fraction_disordered_=fraction_disordered[idx],
          has_clash_=has_clash[idx],
      )
      yield InferenceResult(
          predicted_structure=pred_structure,
          numerical_data={
              'full_pde': result['full_pde'][idx, :num_tokens, :num_tokens],
              'full_pae': result['full_pae'][idx, :num_tokens, :num_tokens],
              'contact_probs': contact_probs[:num_tokens, :num_tokens],
          },
          metadata={
              'predicted_distance_error': predicted_distance_errors[idx],
              'ranking_score': ranking_score,
              'fraction_disordered': fraction_disordered[idx],
              'has_clash': has_clash[idx],
              'predicted_tm_score': ptm[idx],
              'interface_predicted_tm_score': iptm[idx],
              'chain_pair_pde_mean': chain_pair_pde_mean[idx],
              'chain_pair_pde_min': chain_pair_pde_min[idx],
              'chain_pair_pae_min': chain_pair_pae_min[idx],
              'ptm': ptm[idx],
              'iptm': iptm[idx],
              'ptm_iptm_average': ptm_iptm_average[idx],
              'intra_chain_single_pde': intra_chain_single_pde[idx],
              'cross_chain_single_pde': cross_chain_single_pde[idx],
              'pae_ichain': pae_metrics['pae_ichain'][idx],
              'pae_xchain': pae_metrics['pae_xchain'][idx],
              'ranking_confidence': ranking_confidence[idx],
              'ranking_confidence_pae': ranking_confidence_pae[idx],
              'chain_pair_iptm': chain_pair_iptm[idx],
              'iptm_ichain': iptm_ichain[idx],
              'iptm_xchain': iptm_xchain[idx],
              'token_chain_ids': chain_ids,
              'token_res_ids': res_ids,
          },
          model_id=result['__identifier__'],
          debug_outputs={},
      )


================================================
FILE: src/alphafold3/model/model_config.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Global config for the model."""

from collections.abc import Sequence
from typing import Literal, TypeAlias

from alphafold3.common import base_config
import tokamax

_Shape2DType: TypeAlias = tuple[int | None, int | None]


class GlobalConfig(base_config.BaseConfig):
  """Global configuration for the AlphaFold3 model."""

  bfloat16: Literal['all', 'none', 'intermediate'] = 'all'
  final_init: Literal['zeros', 'linear'] = 'zeros'
  pair_attention_chunk_size: Sequence[_Shape2DType] = ((1536, 128), (None, 32))
  pair_transition_shard_spec: Sequence[_Shape2DType] = (
      (2048, None),
      (None, 1024),
  )
  # Note: flash_attention_implementation = 'xla' means no flash attention.
  flash_attention_implementation: tokamax.DotProductAttentionImplementation = (
      'triton'
  )


================================================
FILE: src/alphafold3/model/msa_pairing.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions for producing "paired" and "unpaired" MSA features for each chain.

The paired MSA:
- Is made from the result of the all_seqs MSA query.
- Is ordered such that you can concatenate features across chains and related
  sequences will end up on the same row. Related here means "from the same
  species". Gaps are added to facilitate this whenever a sequence has no
  suitable pair.

The unpaired MSA:
- Is made from the results of the remaining MSA queries.
- Has no special ordering properties.
- Is deduplicated such that it doesn't contain any sequences in the paired MSA.
"""

from typing import Mapping, MutableMapping, Sequence
from alphafold3.model import data_constants
import numpy as np


def _align_species(
    all_species: Sequence[bytes],
    chains_species_to_rows: Sequence[Mapping[bytes, np.ndarray]],
    min_hits_per_species: Mapping[bytes, int],
) -> np.ndarray:
  """Aligns MSA row indices based on species.

  Within a species, MSAs are aligned based on their original order (the first
  sequence for a species in the first chain's MSA is aligned to the first
  sequence for the same species in the second chain's MSA).

  Args:
    all_species: A list of all unique species identifiers.
    chains_species_to_rows: A dictionary for each chain, that maps species to
      the set of MSA row indices from that species in that chain.
    min_hits_per_species: A mapping from species id, to the minimum MSA size
      across chains for that species (ignoring chains with zero hits).

  Returns:
    A matrix of size [num_msa_rows, num_chains], where the i,j element is an
    index into the jth chains MSA.  Each row consists of sequences from each
    chain for the same species (or -1 if that chain has no sequences for that
    species).
  """
  # Each species block is of size [num_seqs x num_chains] and consists of
  # indices into the respective MSAs that have been aligned and are all for the
  # same species.
  species_blocks = []
  for species in all_species:
    chain_row_indices = []
    for species_to_rows in chains_species_to_rows:
      min_msa_size = min_hits_per_species[species]
      if species not in species_to_rows:
        # If a given chain has no hits for a species then we pad it with -1's,
        # later on these values are used to make sure each feature is padded
        # with its appropriate pad value.
        row_indices = np.full(min_msa_size, fill_value=-1, dtype=np.int32)
      else:
        # We crop down to the smallest MSA for a given species across chains.
        row_indices = species_to_rows[species][:min_msa_size]
      chain_row_indices.append(row_indices)
    species_block = np.stack(chain_row_indices, axis=1)
    species_blocks.append(species_block)
  aligned_matrix = np.concatenate(species_blocks, axis=0)
  return aligned_matrix


def create_paired_features(
    chains: Sequence[MutableMapping[str, np.ndarray]],
    max_paired_sequences: int,
    nonempty_chain_ids: set[str],
    max_hits_per_species: int,
) -> Sequence[MutableMapping[str, np.ndarray]]:
  """Creates per-chain MSA features where the MSAs have been aligned.

  Args:
    chains: A list of feature dicts, one for each chain.
    max_paired_sequences: No more than this many paired sequences will be
      returned from this function.
    nonempty_chain_ids: A set of chain ids (str) that are included in the crop
      there is no reason to process chains not in this list.
    max_hits_per_species: No more than this number of sequences will be returned
      for a given species.

  Returns:
    An updated feature dictionary for each chain, where the {}_all_seq features
    have been aligned so that the nth row in chain 1 is aligned to the nth row
    in chain 2's features.
  """
  # The number of chains that the given species appears in - we rank hits
  # across more chains higher.
  species_num_chains = {}

  # For each chain we keep a mapping from species to the row indices in the
  # original MSA for that chain.
  chains_species_to_rows = []

  # Keep track of the minimum number of hits across chains for a given species.
  min_hits_per_species = {}

  for chain in chains:
    species_ids = chain['msa_species_identifiers_all_seq']

    # The query gets an empty species_id, so no pairing happens for this row.
    if (
        species_ids.size == 0
        or (species_ids.size == 1 and not species_ids[0])
        or chain['chain_id'] not in nonempty_chain_ids
    ):
      chains_species_to_rows.append({})
      continue

    # For each species keep track of which row indices in the original MSA are
    # from this species.
    row_indices = np.arange(len(species_ids))
    # The grouping np.split code requires that the input is already clustered
    # by species id.
    sort_idxs = species_ids.argsort()
    species_ids = species_ids[sort_idxs]
    row_indices = row_indices[sort_idxs]

    species, unique_row_indices = np.unique(species_ids, return_index=True)
    grouped_row_indices = np.split(row_indices, unique_row_indices[1:])
    species_to_rows = dict(zip(species, grouped_row_indices, strict=True))
    chains_species_to_rows.append(species_to_rows)

    for s in species:
      species_num_chains[s] = species_num_chains.get(s, 0) + 1

    for species, row_indices in species_to_rows.items():
      min_hits_per_species[species] = min(
          min_hits_per_species.get(species, max_hits_per_species),
          len(row_indices),
      )

  # Construct a mapping from the number of chains a species appears in to
  # the list of species with that count.
  num_chains_to_species = {}
  for species, num_chains in species_num_chains.items():
    if not species or num_chains <= 1:
      continue
    if num_chains not in num_chains_to_species:
      num_chains_to_species[num_chains] = []
    num_chains_to_species[num_chains].append(species)

  num_rows_seen = 0
  # We always keep the first row as it is the query sequence.
  all_rows = [np.array([[0] * len(chains)], dtype=np.int32)]

  # We prioritize species that have hits across more chains.
  for num_chains in sorted(num_chains_to_species, reverse=True):
    all_species = num_chains_to_species[num_chains]

    # Align all the per-chain row indices by species, so every paired row is
    # for a single species.
    rows = _align_species(
        all_species, chains_species_to_rows, min_hits_per_species
    )
    # Sort rows by the product of the original indices in the respective chain
    # MSAS, so as to rank hits that appear higher in the original MSAs higher.
    rank_metric = np.abs(np.prod(rows.astype(np.float32), axis=1))
    sorted_rows = rows[np.argsort(rank_metric), :]
    all_rows.append(sorted_rows)
    num_rows_seen += rows.shape[0]
    if num_rows_seen >= max_paired_sequences:
      break

  all_rows = np.concatenate(all_rows, axis=0)
  all_rows = all_rows[:max_paired_sequences, :]

  # Now we just have to select the relevant rows from the original msa and
  # deletion matrix features
  paired_chains = []
  for chain_idx, chain in enumerate(chains):
    out_chain = {k: v for k, v in chain.items() if 'all_seq' not in k}
    selected_row_indices = all_rows[:, chain_idx]
    for feat_name in {'msa', 'deletion_matrix'}:
      all_seq_name = f'{feat_name}_all_seq'
      feat_value = chain[all_seq_name]

      # The selected row indices are padded to be the same shape for each chain,
      # they are padded with -1's, so we add a single row onto the feature with
      # the appropriate pad value.  This has the effect that we correctly pad
      # each feature since all padded indices will select this padding row.
      pad_value = data_constants.MSA_PAD_VALUES[feat_name]
      feat_value = np.concatenate([
          feat_value,
          np.full((1, feat_value.shape[1]), pad_value, feat_value.dtype),
      ])

      feat_value = feat_value[selected_row_indices, :]
      out_chain[all_seq_name] = feat_value
    out_chain['num_alignments_all_seq'] = np.array(
        out_chain['msa_all_seq'].shape[0]
    )
    paired_chains.append(out_chain)
  return paired_chains


def deduplicate_unpaired_sequences(
    np_chains: Sequence[MutableMapping[str, np.ndarray]],
) -> Sequence[MutableMapping[str, np.ndarray]]:
  """Deduplicates unpaired sequences based on paired sequences."""

  feature_names = np_chains[0].keys()
  msa_features = (
      data_constants.NUM_SEQ_MSA_FEATURES
      + data_constants.NUM_SEQ_NUM_RES_MSA_FEATURES
  )

  for chain in np_chains:
    sequence_set = set(
        hash(s.data.tobytes()) for s in chain['msa_all_seq'].astype(np.int8)
    )
    keep_rows = []
    # Go through unpaired MSA seqs and remove any rows that correspond to the
    # sequences that are already present in the paired MSA.
    for row_num, seq in enumerate(chain['msa'].astype(np.int8)):
      if hash(seq.data.tobytes()) not in sequence_set:
        keep_rows.append(row_num)
    for feature_name in feature_names:
      if feature_name in msa_features:
        chain[feature_name] = chain[feature_name][keep_rows]
    chain['num_alignments'] = np.array(chain['msa'].shape[0], dtype=np.int32)
  return np_chains


def choose_paired_unpaired_msa_crop_sizes(
    unpaired_msa: np.ndarray,
    paired_msa: np.ndarray | None,
    total_msa_crop_size: int,
    max_paired_sequences: int,
) -> tuple[int, int | None]:
  """Returns the sizes of the MSA crop and MSA_all_seq crop.

  NOTE: Unpaired + paired MSA sizes can exceed total_msa_size when
    there are lots of gapped rows. Through the pairing logic another chain(s)
    will have fewer than total_msa_size.

  Args:
     unpaired_msa: The unpaired MSA array (not all_seq).
     paired_msa: The paired MSA array (all_seq).
     total_msa_crop_size: The maximum total number of sequences to crop to.
     max_paired_sequences: The maximum number of sequences that can come from
       MSA pairing.

  Returns:
    A tuple of:
      The size of the reduced MSA crop (not all_seq features).
      The size of the unreduced MSA crop (for all_seq features) or None, if
        paired_msa is None.
  """
  if paired_msa is not None:
    paired_crop_size = np.minimum(paired_msa.shape[0], max_paired_sequences)

    # We reduce the number of un-paired sequences, by the number of times a
    # sequence from this chains MSA is included in the paired MSA.  This keeps
    # the MSA size for each chain roughly constant.
    cropped_all_seq_msa = paired_msa[:max_paired_sequences]
    num_non_gapped_pairs = cropped_all_seq_msa.shape[0]

    assert num_non_gapped_pairs <= max_paired_sequences
    unpaired_crop_size = np.minimum(
        unpaired_msa.shape[0], total_msa_crop_size - num_non_gapped_pairs
    )
    assert unpaired_crop_size >= 0
  else:
    unpaired_crop_size = np.minimum(unpaired_msa.shape[0], total_msa_crop_size)
    paired_crop_size = None
  return unpaired_crop_size, paired_crop_size


def remove_all_gapped_rows_from_all_seqs(
    chains_list: Sequence[dict[str, np.ndarray]], asym_ids: Sequence[float]
) -> Sequence[dict[str, np.ndarray]]:
  """Removes all gapped rows from all_seq feat based on selected asym_ids."""

  merged_msa_all_seq = np.concatenate(
      [
          chain['msa_all_seq']
          for chain in chains_list
          if chain['asym_id'][0] in asym_ids
      ],
      axis=1,
  )

  non_gapped_keep_rows = np.any(
      merged_msa_all_seq != data_constants.MSA_GAP_IDX, axis=1
  )
  for chain in chains_list:
    for feat_name in list(chains_list)[0]:
      if '_all_seq' in feat_name:
        feat_name_split = feat_name.split('_all_seq')[0]
        if feat_name_split in (
            data_constants.NUM_SEQ_NUM_RES_MSA_FEATURES
            + data_constants.NUM_SEQ_MSA_FEATURES
        ):
          # For consistency we do this for all chains even though the
          # gapped rows are based on a selected set asym_ids.
          chain[feat_name] = chain[feat_name][non_gapped_keep_rows]
    chain['num_alignments_all_seq'] = np.sum(non_gapped_keep_rows)
  return chains_list


================================================
FILE: src/alphafold3/model/network/atom_cross_attention.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Per-atom cross attention."""
import dataclasses

from alphafold3.common import base_config
from alphafold3.model import feat_batch
from alphafold3.model import model_config
from alphafold3.model.atom_layout import atom_layout
from alphafold3.model.components import haiku_modules as hm
from alphafold3.model.components import utils
from alphafold3.model.network import diffusion_transformer
import jax
import jax.numpy as jnp


class AtomCrossAttEncoderConfig(base_config.BaseConfig):
  per_token_channels: int = 768
  per_atom_channels: int = 128
  atom_transformer: diffusion_transformer.CrossAttTransformer.Config = (
      base_config.autocreate(num_intermediate_factor=2, num_blocks=3)
  )
  per_atom_pair_channels: int = 16


def _per_atom_conditioning(
    config: AtomCrossAttEncoderConfig, batch: feat_batch.Batch, name: str
) -> tuple[jnp.ndarray, jnp.ndarray]:
  """computes single and pair conditioning for all atoms in each token."""

  c = config
  # Compute per-atom single conditioning
  # Shape (num_tokens, num_dense, channels)
  act = hm.Linear(
      c.per_atom_channels, precision='highest', name=f'{name}_embed_ref_pos'
  )(batch.ref_structure.positions)
  act += hm.Linear(c.per_atom_channels, name=f'{name}_embed_ref_mask')(
      batch.ref_structure.mask.astype(jnp.float32)[:, :, None]
  )
  # Element is encoded as atomic number if the periodic table, so
  # 128 should be fine.
  act += hm.Linear(c.per_atom_channels, name=f'{name}_embed_ref_element')(
      jax.nn.one_hot(batch.ref_structure.element, 128)
  )
  act += hm.Linear(c.per_atom_channels, name=f'{name}_embed_ref_charge')(
      jnp.arcsinh(batch.ref_structure.charge)[:, :, None]
  )
  # Characters are encoded as ASCII code minus 32, so we need 64 classes,
  # to encode all standard ASCII characters between 32 and 96.
  atom_name_chars_1hot = jax.nn.one_hot(batch.ref_structure.atom_name_chars, 64)
  num_token, num_dense, _ = act.shape
  act += hm.Linear(c.per_atom_channels, name=f'{name}_embed_ref_atom_name')(
      atom_name_chars_1hot.reshape(num_token, num_dense, -1)
  )
  act *= batch.ref_structure.mask.astype(jnp.float32)[:, :, None]

  # Compute pair conditioning
  # shape (num_tokens, num_dense, num_dense, channels)
  # Embed single features
  row_act = hm.Linear(
      c.per_atom_pair_channels, name=f'{name}_single_to_pair_cond_row'
  )(jax.nn.relu(act))
  col_act = hm.Linear(
      c.per_atom_pair_channels, name=f'{name}_single_to_pair_cond_col'
  )(jax.nn.relu(act))
  pair_act = row_act[:, :, None, :] + col_act[:, None, :, :]
  # Embed pairwise offsets
  pair_act += hm.Linear(
      c.per_atom_pair_channels,
      precision='highest',
      name=f'{name}_embed_pair_offsets',
  )(
      batch.ref_structure.positions[:, :, None, :]
      - batch.ref_structure.positions[:, None, :, :]
  )
  # Embed pairwise inverse squared distances
  sq_dists = jnp.sum(
      jnp.square(
          batch.ref_structure.positions[:, :, None, :]
          - batch.ref_structure.positions[:, None, :, :]
      ),
      axis=-1,
  )
  pair_act += hm.Linear(
      c.per_atom_pair_channels, name=f'{name}_embed_pair_distances'
  )(1.0 / (1 + sq_dists[:, :, :, None]))

  return act, pair_act


@dataclasses.dataclass(frozen=True)
class AtomCrossAttEncoderOutput:
  token_act: jnp.ndarray  # (num_tokens, ch)
  skip_connection: jnp.ndarray  # (num_subsets, num_queries, ch)
  queries_mask: jnp.ndarray  # (num_subsets, num_queries)
  queries_single_cond: jnp.ndarray  # (num_subsets, num_queries, ch)
  keys_mask: jnp.ndarray  # (num_subsets, num_keys)
  keys_single_cond: jnp.ndarray  # (num_subsets, num_keys, ch)
  pair_cond: jnp.ndarray  # (num_subsets, num_queries, num_keys, ch)


jax.tree_util.register_dataclass(
    AtomCrossAttEncoderOutput,
    data_fields=[f.name for f in dataclasses.fields(AtomCrossAttEncoderOutput)],
    meta_fields=[],
)


def atom_cross_att_encoder(
    token_atoms_act: jnp.ndarray | None,  # (num_tokens, max_atoms_per_token, 3)
    trunk_single_cond: jnp.ndarray | None,  # (num_tokens, ch)
    trunk_pair_cond: jnp.ndarray | None,  # (num_tokens, num_tokens, ch)
    config: AtomCrossAttEncoderConfig,
    global_config: model_config.GlobalConfig,
    batch: feat_batch.Batch,
    name: str,
) -> AtomCrossAttEncoderOutput:
  """Cross-attention on flat atom subsets and mapping to per-token features."""
  c = config

  # Compute single conditioning from atom meta data and convert to queries
  # layout.
  # (num_subsets, num_queries, channels)
  token_atoms_single_cond, _ = _per_atom_conditioning(config, batch, name)
  token_atoms_mask = batch.predicted_structure_info.atom_mask
  queries_single_cond = atom_layout.convert(
      batch.atom_cross_att.token_atoms_to_queries,
      token_atoms_single_cond,
      layout_axes=(-3, -2),
  )
  queries_mask = atom_layout.convert(
      batch.atom_cross_att.token_atoms_to_queries,
      token_atoms_mask,
      layout_axes=(-2, -1),
  )

  # If provided, broadcast single conditioning from trunk to all queries
  if trunk_single_cond is not None:
    trunk_single_cond = hm.Linear(
        c.per_atom_channels,
        precision='highest',
        initializer=global_config.final_init,
        name=f'{name}_embed_trunk_single_cond',
    )(
        hm.LayerNorm(
            use_fast_variance=False,
            create_offset=False,
            name=f'{name}_lnorm_trunk_single_cond',
        )(trunk_single_cond)
    )
    queries_single_cond += atom_layout.convert(
        batch.atom_cross_att.tokens_to_queries,
        trunk_single_cond,
        layout_axes=(-2,),
    )

  if token_atoms_act is None:
    # if no token_atoms_act is given (e.g. begin of evoformer), we use the
    # static conditioning only
    queries_act = queries_single_cond
  else:
    # Convert token_atoms_act to queries layout and map to per_atom_channels
    # (num_subsets, num_queries, channels)
    queries_act = atom_layout.convert(
        batch.atom_cross_att.token_atoms_to_queries,
        token_atoms_act,
        layout_axes=(-3, -2),
    )
    queries_act = hm.Linear(
        c.per_atom_channels,
        precision='highest',
        name=f'{name}_atom_positions_to_features',
    )(queries_act)
    queries_act *= queries_mask[..., None]
    queries_act += queries_single_cond

  # Gather the keys from the queries.
  keys_single_cond = atom_layout.convert(
      batch.atom_cross_att.queries_to_keys,
      queries_single_cond,
      layout_axes=(-3, -2),
  )
  keys_mask = atom_layout.convert(
      batch.atom_cross_att.queries_to_keys, queries_mask, layout_axes=(-2, -1)
  )

  # Embed single features into the pair conditioning.
  # shape (num_subsets, num_queries, num_keys, ch)
  row_act = hm.Linear(
      c.per_atom_pair_channels, name=f'{name}_single_to_pair_cond_row'
  )(jax.nn.relu(queries_single_cond))
  pair_cond_keys_input = atom_layout.convert(
      batch.atom_cross_att.queries_to_keys,
      queries_single_cond,
      layout_axes=(-3, -2),
  )
  col_act = hm.Linear(
      c.per_atom_pair_channels, name=f'{name}_single_to_pair_cond_col'
  )(jax.nn.relu(pair_cond_keys_input))
  pair_act = row_act[:, :, None, :] + col_act[:, None, :, :]

  if trunk_pair_cond is not None:
    # If provided, broadcast the pair conditioning for the trunk (evoformer
    # pairs) to the atom pair activations. This should boost ligands, but also
    # help for cross attention within proteins, because we always have atoms
    # from multiple residues in a subset.
    # Map trunk pair conditioning to per_atom_pair_channels
    # (num_tokens, num_tokens, per_atom_pair_channels)
    trunk_pair_cond = hm.Linear(
        c.per_atom_pair_channels,
        precision='highest',
        initializer=global_config.final_init,
        name=f'{name}_embed_trunk_pair_cond',
    )(
        hm.LayerNorm(
            use_fast_variance=False,
            create_offset=False,
            name=f'{name}_lnorm_trunk_pair_cond',
        )(trunk_pair_cond)
    )

    # Create the GatherInfo into a flattened trunk_pair_cond from the
    # queries and keys gather infos.
    num_tokens = trunk_pair_cond.shape[0]
    # (num_subsets, num_queries)
    tokens_to_queries = batch.atom_cross_att.tokens_to_queries
    # (num_subsets, num_keys)
    tokens_to_keys = batch.atom_cross_att.tokens_to_keys
    # (num_subsets, num_queries, num_keys)
    trunk_pair_to_atom_pair = atom_layout.GatherInfo(
        gather_idxs=(
            num_tokens * tokens_to_queries.gather_idxs[:, :, None]
            + tokens_to_keys.gather_idxs[:, None, :]
        ),
        gather_mask=(
            tokens_to_queries.gather_mask[:, :, None]
            & tokens_to_keys.gather_mask[:, None, :]
        ),
        input_shape=jnp.array((num_tokens, num_tokens)),
    )
    # Gather the conditioning and add it to the atom-pair activations.
    pair_act += atom_layout.convert(
        trunk_pair_to_atom_pair, trunk_pair_cond, layout_axes=(-3, -2)
    )

  # Embed pairwise offsets
  queries_ref_pos = atom_layout.convert(
      batch.atom_cross_att.token_atoms_to_queries,
      batch.ref_structure.positions,
      layout_axes=(-3, -2),
  )
  queries_ref_space_uid = atom_layout.convert(
      batch.atom_cross_att.token_atoms_to_queries,
      batch.ref_structure.ref_space_uid,
      layout_axes=(-2, -1),
  )
  keys_ref_pos = atom_layout.convert(
      batch.atom_cross_att.queries_to_keys,
      queries_ref_pos,
      layout_axes=(-3, -2),
  )
  keys_ref_space_uid = atom_layout.convert(
      batch.atom_cross_att.queries_to_keys,
      batch.ref_structure.ref_space_uid,
      layout_axes=(-2, -1),
  )

  offsets_valid = (
      queries_ref_space_uid[:, :, None] == keys_ref_space_uid[:, None, :]
  )
  offsets = queries_ref_pos[:, :, None, :] - keys_ref_pos[:, None, :, :]
  pair_act += (
      hm.Linear(
          c.per_atom_pair_channels,
          precision='highest',
          name=f'{name}_embed_pair_offsets',
      )(offsets)
      * offsets_valid[:, :, :, None]
  )

  # Embed pairwise inverse squared distances
  sq_dists = jnp.sum(jnp.square(offsets), axis=-1)
  pair_act += (
      hm.Linear(c.per_atom_pair_channels, name=f'{name}_embed_pair_distances')(
          1.0 / (1 + sq_dists[:, :, :, None])
      )
      * offsets_valid[:, :, :, None]
  )
  # Embed offsets valid mask
  pair_act += hm.Linear(
      c.per_atom_pair_channels, name=f'{name}_embed_pair_offsets_valid'
  )(offsets_valid[:, :, :, None].astype(jnp.float32))

  # Run a small MLP on the pair acitvations
  pair_act2 = hm.Linear(
      c.per_atom_pair_channels, initializer='relu', name=f'{name}_pair_mlp_1'
  )(jax.nn.relu(pair_act))
  pair_act2 = hm.Linear(
      c.per_atom_pair_channels, initializer='relu', name=f'{name}_pair_mlp_2'
  )(jax.nn.relu(pair_act2))
  pair_act += hm.Linear(
      c.per_atom_pair_channels,
      initializer=global_config.final_init,
      name=f'{name}_pair_mlp_3',
  )(jax.nn.relu(pair_act2))

  # Run the atom cross attention transformer.
  queries_act = diffusion_transformer.CrossAttTransformer(
      c.atom_transformer, global_config, name=f'{name}_atom_transformer_encoder'
  )(
      queries_act=queries_act,
      queries_mask=queries_mask,
      queries_to_keys=batch.atom_cross_att.queries_to_keys,
      keys_mask=keys_mask,
      queries_single_cond=queries_single_cond,
      keys_single_cond=keys_single_cond,
      pair_cond=pair_act,
  )
  queries_act *= queries_mask[..., None]
  skip_connection = queries_act

  # Convert back to token-atom layout and aggregate to tokens
  queries_act = hm.Linear(
      c.per_token_channels, name=f'{name}_project_atom_features_for_aggr'
  )(queries_act)
  token_atoms_act = atom_layout.convert(
      batch.atom_cross_att.queries_to_token_atoms,
      queries_act,
      layout_axes=(-3, -2),
  )
  token_act = utils.mask_mean(
      token_atoms_mask[..., None], jax.nn.relu(token_atoms_act), axis=-2
  )

  return AtomCrossAttEncoderOutput(
      token_act=token_act,
      skip_connection=skip_connection,
      queries_mask=queries_mask,
      queries_single_cond=queries_single_cond,
      keys_mask=keys_mask,
      keys_single_cond=keys_single_cond,
      pair_cond=pair_act,
  )


class AtomCrossAttDecoderConfig(base_config.BaseConfig):
  per_atom_channels: int = 128
  atom_transformer: diffusion_transformer.CrossAttTransformer.Config = (
      base_config.autocreate(num_intermediate_factor=2, num_blocks=3)
  )


def atom_cross_att_decoder(
    token_act: jnp.ndarray,  # (num_tokens, ch)
    enc: AtomCrossAttEncoderOutput,
    config: AtomCrossAttDecoderConfig,
    global_config: model_config.GlobalConfig,
    batch: feat_batch.Batch,
    name: str,
):  # (num_tokens, max_atoms_per_token, 3)
  """Mapping to per-atom features and self-attention on subsets."""
  c = config
  # map per-token act down to per_atom channels
  token_act = hm.Linear(
      c.per_atom_channels, name=f'{name}_project_token_features_for_broadcast'
  )(token_act)
  # Broadcast to token-atoms layout and convert to queries layout.
  num_token, max_atoms_per_token = (
      batch.atom_cross_att.queries_to_token_atoms.shape
  )
  token_atom_act = jnp.broadcast_to(
      token_act[:, None, :],
      (num_token, max_atoms_per_token, c.per_atom_channels),
  )
  queries_act = atom_layout.convert(
      batch.atom_cross_att.token_atoms_to_queries,
      token_atom_act,
      layout_axes=(-3, -2),
  )
  queries_act += enc.skip_connection
  queries_act *= enc.queries_mask[..., None]

  # Run the atom cross attention transformer.
  queries_act = diffusion_transformer.CrossAttTransformer(
      c.atom_transformer, global_config, name=f'{name}_atom_transformer_decoder'
  )(
      queries_act=queries_act,
      queries_mask=enc.queries_mask,
      queries_to_keys=batch.atom_cross_att.queries_to_keys,
      keys_mask=enc.keys_mask,
      queries_single_cond=enc.queries_single_cond,
      keys_single_cond=enc.keys_single_cond,
      pair_cond=enc.pair_cond,
  )
  queries_act *= enc.queries_mask[..., None]
  queries_act = hm.LayerNorm(
      use_fast_variance=False,
      create_offset=False,
      name=f'{name}_atom_features_layer_norm',
  )(queries_act)
  queries_position_update = hm.Linear(
      3,
      initializer=global_config.final_init,
      precision='highest',
      name=f'{name}_atom_features_to_position_update',
  )(queries_act)
  position_update = atom_layout.convert(
      batch.atom_cross_att.queries_to_token_atoms,
      queries_position_update,
      layout_axes=(-3, -2),
  )
  return position_update


================================================
FILE: src/alphafold3/model/network/confidence_head.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Confidence Head."""

from alphafold3.common import base_config
from alphafold3.model import model_config
from alphafold3.model.atom_layout import atom_layout
from alphafold3.model.components import haiku_modules as hm
from alphafold3.model.components import utils
from alphafold3.model.network import modules
from alphafold3.model.network import template_modules
import haiku as hk
import jax
import jax.numpy as jnp


def _safe_norm(x, keepdims, axis, eps=1e-8):
  return jnp.sqrt(eps + jnp.sum(jnp.square(x), axis=axis, keepdims=keepdims))


class ConfidenceHead(hk.Module):
  """Head to predict the distance errors in a prediction."""

  class PAEConfig(base_config.BaseConfig):
    max_error_bin: float = 31.0
    num_bins: int = 64

  class Config(base_config.BaseConfig):
    """Configuration for ConfidenceHead."""

    pairformer: modules.PairFormerIteration.Config = base_config.autocreate(
        single_attention=base_config.autocreate(),
        single_transition=base_config.autocreate(),
        num_layer=4,
    )
    max_error_bin: float = 31.0
    num_plddt_bins: int = 50
    num_bins: int = 64
    no_embedding_prob: float = 0.2
    pae: 'ConfidenceHead.PAEConfig' = base_config.autocreate()
    dgram_features: template_modules.DistogramFeaturesConfig = (
        base_config.autocreate()
    )

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name='confidence_head',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def _embed_features(
      self,
      dense_atom_positions,
      token_atoms_to_pseudo_beta,
      pair_mask,
      pair_act,
      target_feat,
  ):
    out = hm.Linear(pair_act.shape[-1], name='left_target_feat_project')(
        target_feat
    ).astype(pair_act.dtype)
    out += hm.Linear(pair_act.shape[-1], name='right_target_feat_project')(
        target_feat
    ).astype(pair_act.dtype)[:, None]
    positions = atom_layout.convert(
        token_atoms_to_pseudo_beta,
        dense_atom_positions,
        layout_axes=(-3, -2),
    )
    dgram = template_modules.dgram_from_positions(
        positions, self.config.dgram_features
    )
    dgram *= pair_mask[..., None]

    out += hm.Linear(pair_act.shape[-1], name='distogram_feat_project')(
        dgram.astype(pair_act.dtype)
    )
    return out

  def __call__(
      self,
      dense_atom_positions: jnp.ndarray,
      embeddings: dict[str, jnp.ndarray],
      seq_mask: jnp.ndarray,
      token_atoms_to_pseudo_beta: atom_layout.GatherInfo,
      asym_id: jnp.ndarray,
  ) -> dict[str, jnp.ndarray]:
    """Builds ConfidenceHead module.

    Arguments:
      dense_atom_positions: [N_res, N_atom, 3] array of positions.
      embeddings: Dictionary of representations.
      seq_mask: Sequence mask.
      token_atoms_to_pseudo_beta: Pseudo beta info for atom tokens.
      asym_id: Asym ID token features.

    Returns:
      Dictionary of results.
    """
    dtype = (
        jnp.bfloat16 if self.global_config.bfloat16 == 'all' else jnp.float32
    )
    with utils.bfloat16_context():
      seq_mask_cast = seq_mask.astype(dtype)
      pair_mask = seq_mask_cast[:, None] * seq_mask_cast[None, :]
      pair_mask = pair_mask.astype(dtype)

      pair_act = embeddings['pair'].astype(dtype)
      single_act = embeddings['single'].astype(dtype)
      target_feat = embeddings['target_feat'].astype(dtype)

      num_residues = seq_mask.shape[0]
      num_pair_channels = pair_act.shape[2]

      pair_act += self._embed_features(
          dense_atom_positions,
          token_atoms_to_pseudo_beta,
          pair_mask,
          pair_act,
          target_feat,
      )

      def pairformer_fn(act):
        pair_act, single_act = act
        return modules.PairFormerIteration(
            self.config.pairformer,
            self.global_config,
            with_single=True,
            name='confidence_pairformer',
        )(
            act=pair_act,
            single_act=single_act,
            pair_mask=pair_mask,
            seq_mask=seq_mask,
        )

      pairformer_stack = hk.experimental.layer_stack(
          self.config.pairformer.num_layer
      )(pairformer_fn)

      pair_act, single_act = pairformer_stack((pair_act, single_act))
      pair_act = pair_act.astype(jnp.float32)
      assert pair_act.shape == (num_residues, num_residues, num_pair_channels)

      # Produce logits to predict a distogram of pairwise distance errors
      # between the input prediction and the ground truth.

      # Shape (num_res, num_res, num_bins)
      left_distance_logits = hm.Linear(
          self.config.num_bins,
          initializer=self.global_config.final_init,
          name='left_half_distance_logits',
      )(hm.LayerNorm(name='logits_ln')(pair_act))
      right_distance_logits = left_distance_logits
      distance_logits = left_distance_logits + jnp.swapaxes(  # Symmetrize.
          right_distance_logits, -2, -3
      )
      # Shape (num_bins,)
      distance_breaks = jnp.linspace(
          0.0, self.config.max_error_bin, self.config.num_bins - 1
      )

      step = distance_breaks[1] - distance_breaks[0]

      # Add half-step to get the center
      bin_centers = distance_breaks + step / 2
      # Add a catch-all bin at the end.
      bin_centers = jnp.concatenate(
          [bin_centers, bin_centers[-1:] + step], axis=0
      )

      distance_probs = jax.nn.softmax(distance_logits, axis=-1)

      pred_distance_error = (
          jnp.sum(distance_probs * bin_centers, axis=-1) * pair_mask
      )
      average_pred_distance_error = jnp.sum(
          pred_distance_error, axis=[-2, -1]
      ) / jnp.sum(pair_mask, axis=[-2, -1])

      # Predicted aligned error
      pae_outputs = {}
      # Shape (num_res, num_res, num_bins)
      pae_logits = hm.Linear(
          self.config.pae.num_bins,
          initializer=self.global_config.final_init,
          name='pae_logits',
      )(hm.LayerNorm(name='pae_logits_ln')(pair_act))
      # Shape (num_bins,)
      pae_breaks = jnp.linspace(
          0.0, self.config.pae.max_error_bin, self.config.pae.num_bins - 1
      )
      step = pae_breaks[1] - pae_breaks[0]
      # Add half-step to get the center
      bin_centers = pae_breaks + step / 2
      # Add a catch-all bin at the end.
      bin_centers = jnp.concatenate(
          [bin_centers, bin_centers[-1:] + step], axis=0
      )
      pae_probs = jax.nn.softmax(pae_logits, axis=-1)

      seq_mask_bool = seq_mask.astype(bool)
      pair_mask_bool = seq_mask_bool[:, None] * seq_mask_bool[None, :]
      pae = jnp.sum(pae_probs * bin_centers, axis=-1) * pair_mask_bool
      pae_outputs.update({
          'full_pae': pae,
      })

    # The pTM is computed outside of bfloat16 context.
    tmscore_adjusted_pae_global, tmscore_adjusted_pae_interface = (
        self._get_tmscore_adjusted_pae(
            asym_id=asym_id,
            seq_mask=seq_mask,
            pair_mask=pair_mask_bool,
            bin_centers=bin_centers,
            pae_probs=pae_probs,
        )
    )
    pae_outputs.update({
        'tmscore_adjusted_pae_global': tmscore_adjusted_pae_global,
        'tmscore_adjusted_pae_interface': tmscore_adjusted_pae_interface,
    })
    single_act = single_act.astype('float32')

    # pLDDT
    # Shape (num_res, num_atom, num_bins)
    plddt_logits = hm.Linear(
        (dense_atom_positions.shape[-2], self.config.num_plddt_bins),
        initializer=self.global_config.final_init,
        name='plddt_logits',
    )(hm.LayerNorm(name='plddt_logits_ln')(single_act))

    bin_width = 1.0 / self.config.num_plddt_bins
    bin_centers = jnp.arange(0.5 * bin_width, 1.0, bin_width)
    predicted_lddt = jnp.sum(
        jax.nn.softmax(plddt_logits, axis=-1) * bin_centers, axis=-1
    )
    predicted_lddt = predicted_lddt * 100.0

    # Experimentally resolved
    # Shape (num_res, num_atom, 2)
    experimentally_resolved_logits = hm.Linear(
        (dense_atom_positions.shape[-2], 2),
        initializer=self.global_config.final_init,
        name='experimentally_resolved_logits',
    )(hm.LayerNorm(name='experimentally_resolved_ln')(single_act))

    predicted_experimentally_resolved = jax.nn.softmax(
        experimentally_resolved_logits, axis=-1
    )[..., 1]

    return {
        'predicted_lddt': predicted_lddt,
        'predicted_experimentally_resolved': predicted_experimentally_resolved,
        'full_pde': pred_distance_error,
        'average_pde': average_pred_distance_error,
        **pae_outputs,
    }

  def _get_tmscore_adjusted_pae(
      self,
      asym_id: jnp.ndarray,
      seq_mask: jnp.ndarray,
      pair_mask: jnp.ndarray,
      bin_centers: jnp.ndarray,
      pae_probs: jnp.ndarray,
  ):
    def get_tmscore_adjusted_pae(num_interface_tokens, bin_centers, pae_probs):
      # Clip to avoid negative/undefined d0.
      clipped_num_res = jnp.maximum(num_interface_tokens, 19)

      # Compute d_0(num_res) as defined by TM-score, eqn. (5) in
      # http://zhanglab.ccmb.med.umich.edu/papers/2004_3.pdf
      # Yang & Skolnick "Scoring function for automated
      # assessment of protein structure template quality" 2004.
      d0 = 1.24 * (clipped_num_res - 15) ** (1.0 / 3) - 1.8

      # Make compatible with [num_tokens, num_tokens, num_bins]
      d0 = d0[:, :, None]
      bin_centers = bin_centers[None, None, :]

      # TM-Score term for every bin.
      tm_per_bin = 1.0 / (1 + jnp.square(bin_centers) / jnp.square(d0))
      # E_distances tm(distance).
      predicted_tm_term = jnp.sum(pae_probs * tm_per_bin, axis=-1)
      return predicted_tm_term

    # Interface version
    x = asym_id[None, :] == asym_id[:, None]
    num_chain_tokens = jnp.sum(x * pair_mask, axis=-1)
    num_interface_tokens = num_chain_tokens[None, :] + num_chain_tokens[:, None]
    # Don't double-count within a single chain
    num_interface_tokens -= x * (num_interface_tokens // 2)
    num_interface_tokens = num_interface_tokens * pair_mask

    num_global_tokens = jnp.full(
        shape=pair_mask.shape, fill_value=seq_mask.sum()
    )

    assert num_global_tokens.dtype == 'int32'
    assert num_interface_tokens.dtype == 'int32'
    global_apae = get_tmscore_adjusted_pae(
        num_global_tokens, bin_centers, pae_probs
    )
    interface_apae = get_tmscore_adjusted_pae(
        num_interface_tokens, bin_centers, pae_probs
    )
    return global_apae, interface_apae


================================================
FILE: src/alphafold3/model/network/diffusion_head.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Diffusion Head."""

from collections.abc import Callable

from alphafold3.common import base_config
from alphafold3.model import feat_batch
from alphafold3.model import model_config
from alphafold3.model.components import haiku_modules as hm
from alphafold3.model.components import utils
from alphafold3.model.network import atom_cross_attention
from alphafold3.model.network import diffusion_transformer
from alphafold3.model.network import featurization
from alphafold3.model.network import noise_level_embeddings
import haiku as hk
import jax
import jax.numpy as jnp


# Carefully measured by averaging multimer training set.
SIGMA_DATA = 16.0


def random_rotation(key):
  # Create a random rotation (Gram-Schmidt orthogonalization of two
  # random normal vectors)
  v0, v1 = jax.random.normal(key, shape=(2, 3))
  e0 = v0 / jnp.maximum(1e-10, jnp.linalg.norm(v0))
  v1 = v1 - e0 * jnp.dot(v1, e0, precision=jax.lax.Precision.HIGHEST)
  e1 = v1 / jnp.maximum(1e-10, jnp.linalg.norm(v1))
  e2 = jnp.cross(e0, e1)
  return jnp.stack([e0, e1, e2])


def random_augmentation(
    rng_key: jnp.ndarray,
    positions: jnp.ndarray,
    mask: jnp.ndarray,
) -> jnp.ndarray:
  """Apply random rigid augmentation.

  Args:
    rng_key: random key
    positions: atom positions of shape (<common_axes>, 3)
    mask: per-atom mask of shape (<common_axes>,)

  Returns:
    Transformed positions with the same shape as input positions.
  """
  rotation_key, translation_key = jax.random.split(rng_key)

  center = utils.mask_mean(
      mask[..., None], positions, axis=(-2, -3), keepdims=True, eps=1e-6
  )
  rot = random_rotation(rotation_key)
  translation = jax.random.normal(translation_key, shape=(3,))

  augmented_positions = (
      jnp.einsum(
          '...i,ij->...j',
          positions - center,
          rot,
          precision=jax.lax.Precision.HIGHEST,
      )
      + translation
  )
  return augmented_positions * mask[..., None]


def noise_schedule(t, smin=0.0004, smax=160.0, p=7):
  return (
      SIGMA_DATA
      * (smax ** (1 / p) + t * (smin ** (1 / p) - smax ** (1 / p))) ** p
  )


class ConditioningConfig(base_config.BaseConfig):
  pair_channel: int
  seq_channel: int
  prob: float


class SampleConfig(base_config.BaseConfig):
  steps: int
  gamma_0: float = 0.8
  gamma_min: float = 1.0
  noise_scale: float = 1.003
  step_scale: float = 1.5
  num_samples: int = 1


class DiffusionHead(hk.Module):
  """Denoising Diffusion Head."""

  class Config(
      atom_cross_attention.AtomCrossAttEncoderConfig,
      atom_cross_attention.AtomCrossAttDecoderConfig,
  ):
    """Configuration for DiffusionHead."""

    eval_batch_size: int = 5
    eval_batch_dim_shard_size: int = 5
    conditioning: ConditioningConfig = base_config.autocreate(
        prob=0.8, pair_channel=128, seq_channel=384
    )
    eval: SampleConfig = base_config.autocreate(
        num_samples=5,
        steps=200,
    )
    transformer: diffusion_transformer.Transformer.Config = (
        base_config.autocreate()
    )

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name='diffusion_head',
  ):
    self.config = config
    self.global_config = global_config
    super().__init__(name=name)

  @hk.transparent
  def _conditioning(
      self,
      batch: feat_batch.Batch,
      embeddings: dict[str, jnp.ndarray],
      noise_level: jnp.ndarray,
      use_conditioning: bool,
  ) -> tuple[jnp.ndarray, jnp.ndarray]:
    single_embedding = use_conditioning * embeddings['single']
    pair_embedding = use_conditioning * embeddings['pair']

    rel_features = featurization.create_relative_encoding(
        seq_features=batch.token_features,
        max_relative_idx=32,
        max_relative_chain=2,
    ).astype(pair_embedding.dtype)
    features_2d = jnp.concatenate([pair_embedding, rel_features], axis=-1)
    pair_cond = hm.Linear(
        self.config.conditioning.pair_channel,
        precision='highest',
        name='pair_cond_initial_projection',
    )(
        hm.LayerNorm(
            use_fast_variance=False,
            create_offset=False,
            name='pair_cond_initial_norm',
        )(features_2d)
    )

    for idx in range(2):
      pair_cond += diffusion_transformer.transition_block(
          pair_cond, 2, self.global_config, name=f'pair_transition_{idx}'
      )

    target_feat = embeddings['target_feat']
    features_1d = jnp.concatenate([single_embedding, target_feat], axis=-1)
    single_cond = hm.LayerNorm(
        use_fast_variance=False,
        create_offset=False,
        name='single_cond_initial_norm',
    )(features_1d)
    single_cond = hm.Linear(
        self.config.conditioning.seq_channel,
        precision='highest',
        name='single_cond_initial_projection',
    )(single_cond)

    noise_embedding = noise_level_embeddings.noise_embeddings(
        sigma_scaled_noise_level=noise_level / SIGMA_DATA
    )
    single_cond += hm.Linear(
        self.config.conditioning.seq_channel,
        precision='highest',
        name='noise_embedding_initial_projection',
    )(
        hm.LayerNorm(
            use_fast_variance=False,
            create_offset=False,
            name='noise_embedding_initial_norm',
        )(noise_embedding)
    )

    for idx in range(2):
      single_cond += diffusion_transformer.transition_block(
          single_cond, 2, self.global_config, name=f'single_transition_{idx}'
      )

    return single_cond, pair_cond

  def __call__(
      self,
      # positions_noisy.shape: (num_token, max_atoms_per_token, 3)
      positions_noisy: jnp.ndarray,
      noise_level: jnp.ndarray,
      batch: feat_batch.Batch,
      embeddings: dict[str, jnp.ndarray],
      use_conditioning: bool,
  ) -> jnp.ndarray:

    with utils.bfloat16_context():
      # Get conditioning
      trunk_single_cond, trunk_pair_cond = self._conditioning(
          batch=batch,
          embeddings=embeddings,
          noise_level=noise_level,
          use_conditioning=use_conditioning,
      )

      # Extract features
      sequence_mask = batch.token_features.mask
      atom_mask = batch.predicted_structure_info.atom_mask

      # Position features
      act = positions_noisy * atom_mask[..., None]
      act = act / jnp.sqrt(noise_level**2 + SIGMA_DATA**2)

      enc = atom_cross_attention.atom_cross_att_encoder(
          token_atoms_act=act,
          trunk_single_cond=embeddings['single'],
          trunk_pair_cond=trunk_pair_cond,
          config=self.config,
          global_config=self.global_config,
          batch=batch,
          name='diffusion',
      )
      act = enc.token_act

      # Token-token attention
      act = jnp.asarray(act, dtype=jnp.float32)

      act += hm.Linear(
          act.shape[-1],
          precision='highest',
          initializer=self.global_config.final_init,
          name='single_cond_embedding_projection',
      )(
          hm.LayerNorm(
              use_fast_variance=False,
              create_offset=False,
              name='single_cond_embedding_norm',
          )(trunk_single_cond)
      )

      act = jnp.asarray(act, dtype=jnp.float32)
      trunk_single_cond = jnp.asarray(trunk_single_cond, dtype=jnp.float32)
      trunk_pair_cond = jnp.asarray(trunk_pair_cond, dtype=jnp.float32)
      sequence_mask = jnp.asarray(sequence_mask, dtype=jnp.float32)

      transformer = diffusion_transformer.Transformer(
          self.config.transformer, self.global_config
      )
      act = transformer(
          act=act,
          single_cond=trunk_single_cond,
          mask=sequence_mask,
          pair_cond=trunk_pair_cond,
      )
      act = hm.LayerNorm(
          use_fast_variance=False, create_offset=False, name='output_norm'
      )(act)
      # (n_tokens, per_token_channels)

      # (Possibly) atom-granularity decoder
      assert isinstance(enc, atom_cross_attention.AtomCrossAttEncoderOutput)
      position_update = atom_cross_attention.atom_cross_att_decoder(
          token_act=act,
          enc=enc,
          config=self.config,
          global_config=self.global_config,
          batch=batch,
          name='diffusion',
      )

      skip_scaling = SIGMA_DATA**2 / (noise_level**2 + SIGMA_DATA**2)
      out_scaling = (
          noise_level * SIGMA_DATA / jnp.sqrt(noise_level**2 + SIGMA_DATA**2)
      )
    # End `with utils.bfloat16_context()`.

    return (
        skip_scaling * positions_noisy + out_scaling * position_update
    ) * atom_mask[..., None]


def sample(
    denoising_step: Callable[[jnp.ndarray, jnp.ndarray], jnp.ndarray],
    batch: feat_batch.Batch,
    key: jnp.ndarray,
    config: SampleConfig,
) -> dict[str, jnp.ndarray]:
  """Sample using denoiser on batch.

  Args:
    denoising_step: the denoising function.
    batch: the batch
    key: random key
    config: config for the sampling process (e.g. number of denoising steps,
      etc.)

  Returns:
    a dict
      {
         'atom_positions': jnp.array(...)       # shape (<common_axes>, 3)
         'mask': jnp.array(...)                 # shape (<common_axes>,)
      }
    where the <common_axes> are
    (num_samples, num_tokens, max_atoms_per_token)
  """

  mask = batch.predicted_structure_info.atom_mask

  def apply_denoising_step(carry, noise_level):
    key, positions, noise_level_prev = carry
    key, key_noise, key_aug = jax.random.split(key, 3)

    positions = random_augmentation(
        rng_key=key_aug, positions=positions, mask=mask
    )

    gamma = config.gamma_0 * (noise_level > config.gamma_min)
    t_hat = noise_level_prev * (1 + gamma)

    noise_scale = config.noise_scale * jnp.sqrt(t_hat**2 - noise_level_prev**2)
    noise = noise_scale * jax.random.normal(key_noise, positions.shape)
    positions_noisy = positions + noise

    positions_denoised = denoising_step(positions_noisy, t_hat)
    grad = (positions_noisy - positions_denoised) / t_hat

    d_t = noise_level - t_hat
    positions_out = positions_noisy + config.step_scale * d_t * grad

    return (key, positions_out, noise_level), positions_out

  num_samples = config.num_samples

  noise_levels = noise_schedule(jnp.linspace(0, 1, config.steps + 1))

  key, noise_key = jax.random.split(key)
  positions = jax.random.normal(noise_key, (num_samples,) + mask.shape + (3,))
  positions *= noise_levels[0]

  init = (
      jax.random.split(key, num_samples),
      positions,
      jnp.tile(noise_levels[None, 0], (num_samples,)),
  )

  apply_denoising_step = hk.vmap(
      apply_denoising_step, in_axes=(0, None), split_rng=(not hk.running_init())
  )
  result, _ = hk.scan(apply_denoising_step, init, noise_levels[1:], unroll=4)
  _, positions_out, _ = result

  final_dense_atom_mask = jnp.tile(mask[None], (num_samples, 1, 1))

  return {'atom_positions': positions_out, 'mask': final_dense_atom_mask}


================================================
FILE: src/alphafold3/model/network/diffusion_transformer.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Diffusion transformer model."""

from alphafold3.common import base_config
from alphafold3.model import model_config
from alphafold3.model.atom_layout import atom_layout
from alphafold3.model.components import haiku_modules as hm
import haiku as hk
import jax
from jax import numpy as jnp
import tokamax


def adaptive_layernorm(x, single_cond, name):
  """Adaptive LayerNorm."""
  # Adopted from Scalable Diffusion Models with Transformers
  # https://arxiv.org/abs/2212.09748
  if single_cond is None:
    x = hm.LayerNorm(name=f'{name}layer_norm', use_fast_variance=False)(x)
  else:
    x = hm.LayerNorm(
        name=f'{name}layer_norm',
        use_fast_variance=False,
        create_scale=False,
        create_offset=False,
    )(x)
    single_cond = hm.LayerNorm(
        name=f'{name}single_cond_layer_norm',
        use_fast_variance=False,
        create_offset=False,
    )(single_cond)
    single_scale = hm.Linear(
        x.shape[-1],
        initializer='zeros',
        use_bias=True,
        name=f'{name}single_cond_scale',
    )(single_cond)
    single_bias = hm.Linear(
        x.shape[-1], initializer='zeros', name=f'{name}single_cond_bias'
    )(single_cond)
    x = jax.nn.sigmoid(single_scale) * x + single_bias
  return x


def adaptive_zero_init(
    x, num_channels, single_cond, global_config: model_config.GlobalConfig, name
):
  """Adaptive zero init, from AdaLN-zero."""
  if single_cond is None:
    output = hm.Linear(
        num_channels,
        initializer=global_config.final_init,
        name=f'{name}transition2',
    )(x)
  else:
    output = hm.Linear(num_channels, name=f'{name}transition2')(x)
    # Init to a small gain, sigmoid(-2) ~ 0.1
    cond = hm.Linear(
        output.shape[-1],
        initializer='zeros',
        use_bias=True,
        bias_init=-2.0,
        name=f'{name}adaptive_zero_cond',
    )(single_cond)
    output = jax.nn.sigmoid(cond) * output
  return output


def transition_block(
    x: jnp.ndarray,
    num_intermediate_factor: int,
    global_config: model_config.GlobalConfig,
    single_cond: jnp.ndarray | None = None,
    use_glu_kernel: bool = True,
    name: str = '',
) -> jnp.ndarray:
  """Transition Block."""
  num_channels = x.shape[-1]
  num_intermediates = num_intermediate_factor * num_channels

  x = adaptive_layernorm(x, single_cond, name=f'{name}ffw_')

  if use_glu_kernel:
    weights, _ = hm.haiku_linear_get_params(
        x,
        num_output=num_intermediates * 2,
        initializer='relu',
        name=f'{name}ffw_transition1',
    )
    weights = jnp.reshape(weights, (len(weights), 2, num_intermediates))
    c = tokamax.gated_linear_unit(x=x, weights=weights, activation=jax.nn.swish)
  else:
    x = hm.Linear(
        num_intermediates * 2, initializer='relu', name=f'{name}ffw_transition1'
    )(x)
    a, b = jnp.split(x, 2, axis=-1)
    c = jax.nn.swish(a) * b

  output = adaptive_zero_init(
      c, num_channels, single_cond, global_config, f'{name}ffw_'
  )
  return output


class SelfAttentionConfig(base_config.BaseConfig):
  num_head: int = 16
  key_dim: int | None = None
  value_dim: int | None = None


def self_attention(
    x: jnp.ndarray,  # (num_tokens, ch)
    mask: jnp.ndarray,  # (num_tokens,)
    pair_logits: jnp.ndarray | None,  # (num_heads, num_tokens, num_tokens)
    config: SelfAttentionConfig,
    global_config: model_config.GlobalConfig,
    single_cond: jnp.ndarray | None = None,  # (num_tokens, ch)
    name: str = '',
) -> jnp.ndarray:
  """Multihead self-attention."""
  assert len(mask.shape) == len(x.shape) - 1, f'{mask.shape}, {x.shape}'
  # bias: ... x heads (1) x query (1) x key
  bias = (1e9 * (mask - 1.0))[..., None, None, :]

  x = adaptive_layernorm(x, single_cond, name=name)

  num_channels = x.shape[-1]
  # Sensible default for when the config keys are missing
  key_dim = config.key_dim if config.key_dim is not None else num_channels
  value_dim = config.value_dim if config.value_dim is not None else num_channels
  num_head = config.num_head
  assert key_dim % num_head == 0, f'{key_dim=} % {num_head=} != 0'
  assert value_dim % num_head == 0, f'{value_dim=} % {num_head=} != 0'
  key_dim = key_dim // num_head
  value_dim = value_dim // num_head

  qk_shape = (num_head, key_dim)
  q = hm.Linear(qk_shape, use_bias=True, name=f'{name}q_projection')(x)
  k = hm.Linear(qk_shape, use_bias=False, name=f'{name}k_projection')(x)

  # In some situations the gradient norms can blow up without running this
  # einsum in float32.
  q = q.astype(jnp.float32)
  k = k.astype(jnp.float32)
  bias = bias.astype(jnp.float32)
  logits = jnp.einsum('...qhc,...khc->...hqk', q * key_dim ** (-0.5), k) + bias
  if pair_logits is not None:
    logits += pair_logits  # (num_heads, seq_len, seq_len)
  weights = jax.nn.softmax(logits, axis=-1)
  weights = jnp.asarray(weights, dtype=x.dtype)

  v_shape = (num_head, value_dim)
  v = hm.Linear(v_shape, use_bias=False, name=f'{name}v_projection')(x)
  weighted_avg = jnp.einsum('...hqk,...khc->...qhc', weights, v)
  weighted_avg = jnp.reshape(weighted_avg, weighted_avg.shape[:-2] + (-1,))

  gate_logits = hm.Linear(
      num_head * value_dim,
      bias_init=1.0,
      initializer='zeros',
      name=f'{name}gating_query',
  )(x)
  weighted_avg *= jax.nn.sigmoid(gate_logits)

  output = adaptive_zero_init(
      weighted_avg, num_channels, single_cond, global_config, name
  )
  return output


class Transformer(hk.Module):
  """Simple transformer stack."""

  class Config(base_config.BaseConfig):
    attention: SelfAttentionConfig = base_config.autocreate()
    num_blocks: int = 24
    block_remat: bool = False
    super_block_size: int = 4
    num_intermediate_factor: int = 2

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name: str = 'transformer',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(
      self,
      act: jnp.ndarray,
      mask: jnp.ndarray,
      single_cond: jnp.ndarray,
      pair_cond: jnp.ndarray | None,
  ) -> jnp.ndarray:
    def block(act, pair_logits):
      act += self_attention(
          act,
          mask,
          pair_logits,
          self.config.attention,
          self.global_config,
          single_cond,
          name=self.name,
      )
      act += transition_block(
          act,
          self.config.num_intermediate_factor,
          self.global_config,
          single_cond,
          name=self.name,
      )
      return act, None

    # Precompute pair logits for performance
    if pair_cond is None:
      pair_act = None
    else:
      pair_act = hm.LayerNorm(
          name='pair_input_layer_norm',
          use_fast_variance=False,
          create_offset=False,
      )(pair_cond)

    assert self.config.num_blocks % self.config.super_block_size == 0
    num_super_blocks = self.config.num_blocks // self.config.super_block_size

    def super_block(act):
      if pair_act is None:
        pair_logits = None
      else:
        pair_logits = hm.Linear(
            (self.config.super_block_size, self.config.attention.num_head),
            name='pair_logits_projection',
        )(pair_act)
        pair_logits = jnp.transpose(pair_logits, [2, 3, 0, 1])
      return hk.experimental.layer_stack(
          self.config.super_block_size, with_per_layer_inputs=True
      )(block)(act, pair_logits)

    return hk.experimental.layer_stack(
        num_super_blocks, with_per_layer_inputs=True
    )(super_block)(act)[0]


class CrossAttentionConfig(base_config.BaseConfig):
  num_head: int = 4
  key_dim: int = 128
  value_dim: int = 128


def cross_attention(
    x_q: jnp.ndarray,  # (..., Q, C)
    x_k: jnp.ndarray,  # (..., K, C)
    mask_q: jnp.ndarray,  # (..., Q)
    mask_k: jnp.ndarray,  # (..., K)
    config: CrossAttentionConfig,
    global_config: model_config.GlobalConfig,
    pair_logits: jnp.ndarray | None = None,  # (..., Q, K)
    single_cond_q: jnp.ndarray | None = None,  # (..., Q, C)
    single_cond_k: jnp.ndarray | None = None,  # (..., K, C)
    name: str = '',
) -> jnp.ndarray:
  """Multihead self-attention."""
  assert len(mask_q.shape) == len(x_q.shape) - 1, f'{mask_q.shape}, {x_q.shape}'
  assert len(mask_k.shape) == len(x_k.shape) - 1, f'{mask_k.shape}, {x_k.shape}'
  # bias: ... x heads (1) x query x key
  bias = (
      1e9
      * (mask_q - 1.0)[..., None, :, None]
      * (mask_k - 1.0)[..., None, None, :]
  )

  x_q = adaptive_layernorm(x_q, single_cond_q, name=f'{name}q')
  x_k = adaptive_layernorm(x_k, single_cond_k, name=f'{name}k')

  assert config.key_dim % config.num_head == 0
  assert config.value_dim % config.num_head == 0
  key_dim = config.key_dim // config.num_head
  value_dim = config.value_dim // config.num_head

  q = hm.Linear(
      (config.num_head, key_dim), use_bias=True, name=f'{name}q_projection'
  )(x_q)
  k = hm.Linear(
      (config.num_head, key_dim), use_bias=False, name=f'{name}k_projection'
  )(x_k)

  # In some situations the gradient norms can blow up without running this
  # einsum in float32.
  q = q.astype(jnp.float32)
  k = k.astype(jnp.float32)
  bias = bias.astype(jnp.float32)
  logits = jnp.einsum('...qhc,...khc->...hqk', q * key_dim ** (-0.5), k) + bias
  if pair_logits is not None:
    logits += pair_logits
  weights = jax.nn.softmax(logits, axis=-1)
  weights = jnp.asarray(weights, dtype=x_q.dtype)

  v = hm.Linear(
      (config.num_head, value_dim), use_bias=False, name=f'{name}v_projection'
  )(x_k)
  weighted_avg = jnp.einsum('...hqk,...khc->...qhc', weights, v)
  weighted_avg = jnp.reshape(weighted_avg, weighted_avg.shape[:-2] + (-1,))

  gate_logits = hm.Linear(
      config.num_head * value_dim,
      bias_init=1.0,
      initializer='zeros',
      name=f'{name}gating_query',
  )(x_q)
  weighted_avg *= jax.nn.sigmoid(gate_logits)

  output = adaptive_zero_init(
      weighted_avg, x_q.shape[-1], single_cond_q, global_config, name
  )
  return output


class CrossAttTransformer(hk.Module):
  """Transformer that applies cross attention between two sets of subsets."""

  class Config(base_config.BaseConfig):
    num_intermediate_factor: int
    num_blocks: int
    attention: CrossAttentionConfig = base_config.autocreate()

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name: str = 'transformer',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(
      self,
      queries_act: jnp.ndarray,  # (num_subsets, num_queries, ch)
      queries_mask: jnp.ndarray,  # (num_subsets, num_queries)
      queries_to_keys: atom_layout.GatherInfo,  # (num_subsets, num_keys)
      keys_mask: jnp.ndarray,  # (num_subsets, num_keys)
      queries_single_cond: jnp.ndarray,  # (num_subsets, num_queries, ch)
      keys_single_cond: jnp.ndarray,  # (num_subsets, num_keys, ch)
      pair_cond: jnp.ndarray,  # (num_subsets, num_queries, num_keys, ch)
  ) -> jnp.ndarray:
    def block(queries_act, pair_logits):
      # copy the queries activations to the keys layout
      keys_act = atom_layout.convert(
          queries_to_keys, queries_act, layout_axes=(-3, -2)
      )
      # cross attention
      queries_act += cross_attention(
          x_q=queries_act,
          x_k=keys_act,
          mask_q=queries_mask,
          mask_k=keys_mask,
          config=self.config.attention,
          global_config=self.global_config,
          pair_logits=pair_logits,
          single_cond_q=queries_single_cond,
          single_cond_k=keys_single_cond,
          name=self.name,
      )
      queries_act += transition_block(
          queries_act,
          self.config.num_intermediate_factor,
          self.global_config,
          queries_single_cond,
          name=self.name,
      )
      return queries_act, None

    # Precompute pair logits for performance
    pair_act = hm.LayerNorm(
        name='pair_input_layer_norm',
        use_fast_variance=False,
        create_offset=False,
    )(pair_cond)
    # (num_subsets, num_queries, num_keys, num_blocks, num_heads)
    pair_logits = hm.Linear(
        (self.config.num_blocks, self.config.attention.num_head),
        name='pair_logits_projection',
    )(pair_act)
    # (num_block, num_subsets, num_heads, num_queries, num_keys)
    pair_logits = jnp.transpose(pair_logits, [3, 0, 4, 1, 2])

    return hk.experimental.layer_stack(
        self.config.num_blocks, with_per_layer_inputs=True
    )(block)(queries_act, pair_logits)[0]


================================================
FILE: src/alphafold3/model/network/distogram_head.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Distogram head."""

from typing import Final

from alphafold3.common import base_config
from alphafold3.model import feat_batch
from alphafold3.model import model_config
from alphafold3.model.components import haiku_modules as hm
import haiku as hk
import jax
import jax.numpy as jnp


_CONTACT_THRESHOLD: Final[float] = 8.0
_CONTACT_EPSILON: Final[float] = 1e-3


class DistogramHead(hk.Module):
  """Distogram head."""

  class Config(base_config.BaseConfig):
    first_break: float = 2.3125
    last_break: float = 21.6875
    num_bins: int = 64

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name='distogram_head',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(
      self,
      batch: feat_batch.Batch,
      embeddings: dict[str, jnp.ndarray],
      return_distogram: bool = False,
  ) -> dict[str, jnp.ndarray]:
    pair_act = embeddings['pair']
    seq_mask = batch.token_features.mask.astype(bool)
    pair_mask = seq_mask[:, None] * seq_mask[None, :]

    left_half_logits = hm.Linear(
        self.config.num_bins,
        initializer=self.global_config.final_init,
        name='half_logits',
    )(pair_act)

    right_half_logits = left_half_logits
    logits = left_half_logits + jnp.swapaxes(right_half_logits, -2, -3)
    probs = jax.nn.softmax(logits, axis=-1)
    breaks = jnp.linspace(
        self.config.first_break,
        self.config.last_break,
        self.config.num_bins - 1,
    )

    bin_tops = jnp.append(breaks, breaks[-1] + (breaks[-1] - breaks[-2]))
    threshold = _CONTACT_THRESHOLD + _CONTACT_EPSILON
    is_contact_bin = 1.0 * (bin_tops <= threshold)
    contact_probs = jnp.einsum(
        'ijk,k->ij', probs, is_contact_bin, precision=jax.lax.Precision.HIGHEST
    )
    contact_probs = pair_mask * contact_probs

    return_dict = {'bin_edges': breaks, 'contact_probs': contact_probs}
    if return_distogram:
      return_dict['distogram'] = logits

    return return_dict


================================================
FILE: src/alphafold3/model/network/evoformer.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Evoformer network."""

import functools

from alphafold3.common import base_config
from alphafold3.model import feat_batch
from alphafold3.model import features
from alphafold3.model import model_config
from alphafold3.model.components import haiku_modules as hm
from alphafold3.model.components import utils
from alphafold3.model.network import atom_cross_attention
from alphafold3.model.network import featurization
from alphafold3.model.network import modules
from alphafold3.model.network import template_modules
import haiku as hk
import jax
import jax.numpy as jnp


class Evoformer(hk.Module):
  """Creates 'single' and 'pair' embeddings."""

  class PairformerConfig(modules.PairFormerIteration.Config):  # pytype: disable=invalid-function-definition
    block_remat: bool = False
    remat_block_size: int = 8

  class Config(base_config.BaseConfig):
    """Configuration for Evoformer."""

    max_relative_chain: int = 2
    msa_channel: int = 64
    seq_channel: int = 384
    max_relative_idx: int = 32
    num_msa: int = 1024
    pair_channel: int = 128
    pairformer: 'Evoformer.PairformerConfig' = base_config.autocreate(
        single_transition=base_config.autocreate(),
        single_attention=base_config.autocreate(),
        num_layer=48,
    )
    per_atom_conditioning: atom_cross_attention.AtomCrossAttEncoderConfig = (
        base_config.autocreate(
            per_token_channels=384,
            per_atom_channels=128,
            atom_transformer=base_config.autocreate(
                num_intermediate_factor=2,
                num_blocks=3,
            ),
            per_atom_pair_channels=16,
        )
    )
    template: template_modules.TemplateEmbedding.Config = (
        base_config.autocreate()
    )
    msa_stack: modules.EvoformerIteration.Config = base_config.autocreate()

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name='evoformer',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def _relative_encoding(
      self, batch: feat_batch.Batch, pair_activations: jnp.ndarray
  ) -> jnp.ndarray:
    """Add relative position encodings."""
    rel_feat = featurization.create_relative_encoding(
        seq_features=batch.token_features,
        max_relative_idx=self.config.max_relative_idx,
        max_relative_chain=self.config.max_relative_chain,
    )
    rel_feat = rel_feat.astype(pair_activations.dtype)

    pair_activations += hm.Linear(
        self.config.pair_channel, name='position_activations'
    )(rel_feat)
    return pair_activations

  @hk.transparent
  def _seq_pair_embedding(
      self,
      token_features: features.TokenFeatures,
      target_feat: jnp.ndarray,
  ) -> tuple[jnp.ndarray, jnp.ndarray]:
    """Generated Pair embedding from sequence."""
    left_single = hm.Linear(self.config.pair_channel, name='left_single')(
        target_feat
    )[:, None]
    right_single = hm.Linear(self.config.pair_channel, name='right_single')(
        target_feat
    )[None]
    dtype = left_single.dtype
    pair_activations = left_single + right_single
    num_residues = pair_activations.shape[0]
    assert pair_activations.shape == (
        num_residues,
        num_residues,
        self.config.pair_channel,
    )
    mask = token_features.mask
    pair_mask = (mask[:, None] * mask[None, :]).astype(dtype)
    assert pair_mask.shape == (num_residues, num_residues)
    return pair_activations, pair_mask  # pytype: disable=bad-return-type  # jax-ndarray

  @hk.transparent
  def _embed_bonds(
      self,
      batch: feat_batch.Batch,
      pair_activations: jnp.ndarray,
  ) -> jnp.ndarray:
    """Embeds bond features and merges into pair activations."""
    # Construct contact matrix.
    num_tokens = batch.token_features.token_index.shape[0]
    contact_matrix = jnp.zeros((num_tokens, num_tokens))

    tokens_to_polymer_ligand_bonds = (
        batch.polymer_ligand_bond_info.tokens_to_polymer_ligand_bonds
    )
    gather_idxs_polymer_ligand = tokens_to_polymer_ligand_bonds.gather_idxs
    gather_mask_polymer_ligand = (
        tokens_to_polymer_ligand_bonds.gather_mask.prod(axis=1).astype(
            gather_idxs_polymer_ligand.dtype
        )[:, None]
    )
    # If valid mask then it will be all 1's, so idxs should be unchanged.
    gather_idxs_polymer_ligand = (
        gather_idxs_polymer_ligand * gather_mask_polymer_ligand
    )

    tokens_to_ligand_ligand_bonds = (
        batch.ligand_ligand_bond_info.tokens_to_ligand_ligand_bonds
    )
    gather_idxs_ligand_ligand = tokens_to_ligand_ligand_bonds.gather_idxs
    gather_mask_ligand_ligand = tokens_to_ligand_ligand_bonds.gather_mask.prod(
        axis=1
    ).astype(gather_idxs_ligand_ligand.dtype)[:, None]
    gather_idxs_ligand_ligand = (
        gather_idxs_ligand_ligand * gather_mask_ligand_ligand
    )

    gather_idxs = jnp.concatenate(
        [gather_idxs_polymer_ligand, gather_idxs_ligand_ligand]
    )
    contact_matrix = contact_matrix.at[
        gather_idxs[:, 0], gather_idxs[:, 1]
    ].set(1.0)

    # Because all the padded index's are 0's.
    contact_matrix = contact_matrix.at[0, 0].set(0.0)

    bonds_act = hm.Linear(self.config.pair_channel, name='bond_embedding')(
        contact_matrix[:, :, None].astype(pair_activations.dtype)
    )
    return pair_activations + bonds_act

  @hk.transparent
  def _embed_template_pair(
      self,
      batch: feat_batch.Batch,
      pair_activations: jnp.ndarray,
      pair_mask: jnp.ndarray,
      key: jnp.ndarray,
  ) -> tuple[jnp.ndarray, jnp.ndarray]:
    """Embeds Templates and merges into pair activations."""
    dtype = pair_activations.dtype
    key, subkey = jax.random.split(key)
    template_module = template_modules.TemplateEmbedding(
        self.config.template, self.global_config
    )
    templates = batch.templates
    asym_id = batch.token_features.asym_id
    # Construct a mask such that only intra-chain template features are
    # computed, since all templates are for each chain individually.
    multichain_mask = (asym_id[:, None] == asym_id[None, :]).astype(dtype)

    template_fn = functools.partial(template_module, key=subkey)
    template_act = template_fn(
        query_embedding=pair_activations,
        templates=templates,
        multichain_mask_2d=multichain_mask,
        padding_mask_2d=pair_mask,
    )
    return pair_activations + template_act, key

  @hk.transparent
  def _embed_process_msa(
      self,
      msa_batch: features.MSA,
      pair_activations: jnp.ndarray,
      pair_mask: jnp.ndarray,
      key: jnp.ndarray,
      target_feat: jnp.ndarray,
  ) -> tuple[jnp.ndarray, jnp.ndarray]:
    """Processes MSA and returns updated pair activations."""
    dtype = pair_activations.dtype
    msa_batch, key = featurization.shuffle_msa(key, msa_batch)
    msa_batch = featurization.truncate_msa_batch(msa_batch, self.config.num_msa)
    msa_feat = featurization.create_msa_feat(msa_batch).astype(dtype)

    msa_activations = hm.Linear(
        self.config.msa_channel, name='msa_activations'
    )(msa_feat)

    msa_activations += hm.Linear(
        self.config.msa_channel, name='extra_msa_target_feat'
    )(target_feat)[None]
    msa_mask = msa_batch.mask.astype(dtype)

    # Evoformer MSA stack.
    evoformer_input = {'msa': msa_activations, 'pair': pair_activations}
    masks = {'msa': msa_mask, 'pair': pair_mask}

    def evoformer_fn(x):
      return modules.EvoformerIteration(
          self.config.msa_stack, self.global_config, name='msa_stack'
      )(
          activations=x,
          masks=masks,
      )

    evoformer_stack = hk.experimental.layer_stack(
        self.config.msa_stack.num_layer
    )(evoformer_fn)

    evoformer_output = evoformer_stack(evoformer_input)

    return evoformer_output['pair'], key

  def __call__(
      self,
      batch: feat_batch.Batch,
      prev: dict[str, jnp.ndarray],
      target_feat: jnp.ndarray,
      key: jnp.ndarray,
  ) -> dict[str, jnp.ndarray]:

    assert self.global_config.bfloat16 in {'all', 'none'}

    num_residues = target_feat.shape[0]
    assert batch.token_features.aatype.shape == (num_residues,)

    dtype = (
        jnp.bfloat16 if self.global_config.bfloat16 == 'all' else jnp.float32
    )

    with utils.bfloat16_context():
      pair_activations, pair_mask = self._seq_pair_embedding(
          batch.token_features, target_feat
      )

      pair_activations += hm.Linear(
          pair_activations.shape[-1],
          name='prev_embedding',
          initializer=self.global_config.final_init,
      )(
          hm.LayerNorm(name='prev_embedding_layer_norm')(
              prev['pair'].astype(pair_activations.dtype)
          )
      )

      pair_activations = self._relative_encoding(batch, pair_activations)

      pair_activations = self._embed_bonds(
          batch=batch, pair_activations=pair_activations
      )

      pair_activations, key = self._embed_template_pair(
          batch=batch,
          pair_activations=pair_activations,
          pair_mask=pair_mask,
          key=key,
      )
      pair_activations, key = self._embed_process_msa(
          msa_batch=batch.msa,
          pair_activations=pair_activations,
          pair_mask=pair_mask,
          key=key,
          target_feat=target_feat,
      )
      del key  # Unused after this point.

      single_activations = hm.Linear(
          self.config.seq_channel, name='single_activations'
      )(target_feat)

      single_activations += hm.Linear(
          single_activations.shape[-1],
          name='prev_single_embedding',
          initializer=self.global_config.final_init,
      )(
          hm.LayerNorm(name='prev_single_embedding_layer_norm')(
              prev['single'].astype(single_activations.dtype)
          )
      )

      def pairformer_fn(x):
        pairformer_iteration = modules.PairFormerIteration(
            self.config.pairformer,
            self.global_config,
            with_single=True,
            name='trunk_pairformer',
        )
        pair_act, single_act = x
        return pairformer_iteration(
            act=pair_act,
            single_act=single_act,
            pair_mask=pair_mask,
            seq_mask=batch.token_features.mask.astype(dtype),
        )

      pairformer_stack = hk.experimental.layer_stack(
          self.config.pairformer.num_layer
      )(pairformer_fn)

      pair_activations, single_activations = pairformer_stack(
          (pair_activations, single_activations)
      )

      assert pair_activations.shape == (
          num_residues,
          num_residues,
          self.config.pair_channel,
      )
      assert single_activations.shape == (num_residues, self.config.seq_channel)
      assert len(target_feat.shape) == 2
      assert target_feat.shape[0] == num_residues
      output = {
          'single': single_activations,
          'pair': pair_activations,
          'target_feat': target_feat,
      }

    return output


================================================
FILE: src/alphafold3/model/network/featurization.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Model-side of the input features processing."""

import functools

from alphafold3.constants import residue_names
from alphafold3.model import feat_batch
from alphafold3.model import features
from alphafold3.model.components import utils
import jax
import jax.numpy as jnp


def _grid_keys(key, shape):
  """Generate a grid of rng keys that is consistent with different padding.

  Generate random keys such that the keys will be identical, regardless of
  how much padding is added to any dimension.

  Args:
    key: A PRNG key.
    shape: The shape of the output array of keys that will be generated.

  Returns:
    An array of shape `shape` consisting of random keys.
  """
  if not shape:
    return key
  new_keys = jax.vmap(functools.partial(jax.random.fold_in, key))(
      jnp.arange(shape[0])
  )
  return jax.vmap(functools.partial(_grid_keys, shape=shape[1:]))(new_keys)


def _padding_consistent_rng(f):
  """Modify any element-wise random function to be consistent with padding.

  Normally if you take a function like jax.random.normal and generate an array,
  say of size (10,10), you will get a different set of random numbers to if you
  add padding and take the first (10,10) sub-array.

  This function makes a random function that is consistent regardless of the
  amount of padding added.

  Note: The padding-consistent function is likely to be slower to compile and
  run than the function it is wrapping, but these slowdowns are likely to be
  negligible in a large network.

  Args:
    f: Any element-wise function that takes (PRNG key, shape) as the first 2
      arguments.

  Returns:
    An equivalent function to f, that is now consistent for different amounts of
    padding.
  """

  def inner(key, shape, **kwargs):
    keys = _grid_keys(key, shape)
    signature = (
        '()->()'
        if jax.dtypes.issubdtype(keys.dtype, jax.dtypes.prng_key)
        else '(2)->()'
    )
    return jnp.vectorize(
        functools.partial(f, shape=(), **kwargs), signature=signature
    )(keys)

  return inner


def gumbel_argsort_sample_idx(
    key: jnp.ndarray, logits: jnp.ndarray
) -> jnp.ndarray:
  """Samples with replacement from a distribution given by 'logits'.

  This uses Gumbel trick to implement the sampling an efficient manner. For a
  distribution over k items this samples k times without replacement, so this
  is effectively sampling a random permutation with probabilities over the
  permutations derived from the logprobs.

  Args:
    key: prng key
    logits: logarithm of probabilities to sample from, probabilities can be
      unnormalized.

  Returns:
    Sample from logprobs in one-hot form.
  """
  gumbel = _padding_consistent_rng(jax.random.gumbel)
  z = gumbel(key, logits.shape)
  # This construction is equivalent to jnp.argsort, but using a non stable sort,
  # since stable sort's aren't supported by jax2tf
  axis = len(logits.shape) - 1
  iota = jax.lax.broadcasted_iota(jnp.int64, logits.shape, axis)
  _, perm = jax.lax.sort_key_val(
      logits + z, iota, dimension=-1, is_stable=False
  )
  return perm[::-1]


def create_msa_feat(msa: features.MSA) -> jax.Array:
  """Create and concatenate MSA features."""
  msa_1hot = jax.nn.one_hot(
      msa.rows, residue_names.POLYMER_TYPES_NUM_WITH_UNKNOWN_AND_GAP + 1
  )
  deletion_matrix = msa.deletion_matrix
  has_deletion = jnp.clip(deletion_matrix, 0.0, 1.0)[..., None]
  deletion_value = (jnp.arctan(deletion_matrix / 3.0) * (2.0 / jnp.pi))[
      ..., None
  ]

  msa_feat = [
      msa_1hot,
      has_deletion,
      deletion_value,
  ]

  return jnp.concatenate(msa_feat, axis=-1)


def truncate_msa_batch(msa: features.MSA, num_msa: int) -> features.MSA:
  indices = jnp.arange(num_msa)
  return msa.index_msa_rows(indices)


def create_target_feat(
    batch: feat_batch.Batch,
    append_per_atom_features: bool,
) -> jax.Array:
  """Make target feat."""
  token_features = batch.token_features
  target_features = []
  target_features.append(
      jax.nn.one_hot(
          token_features.aatype,
          residue_names.POLYMER_TYPES_NUM_WITH_UNKNOWN_AND_GAP,
      )
  )
  target_features.append(batch.msa.profile)
  target_features.append(batch.msa.deletion_mean[..., None])

  # Reference structure features
  if append_per_atom_features:
    ref_mask = batch.ref_structure.mask
    element_feat = jax.nn.one_hot(batch.ref_structure.element, 128)
    element_feat = utils.mask_mean(
        mask=ref_mask[..., None], value=element_feat, axis=-2, eps=1e-6
    )
    target_features.append(element_feat)
    pos_feat = batch.ref_structure.positions
    pos_feat = pos_feat.reshape([pos_feat.shape[0], -1])
    target_features.append(pos_feat)
    target_features.append(ref_mask)

  return jnp.concatenate(target_features, axis=-1)


def create_relative_encoding(
    seq_features: features.TokenFeatures,
    max_relative_idx: int,
    max_relative_chain: int,
) -> jax.Array:
  """Add relative position encodings."""
  rel_feats = []
  token_index = seq_features.token_index
  residue_index = seq_features.residue_index
  asym_id = seq_features.asym_id
  entity_id = seq_features.entity_id
  sym_id = seq_features.sym_id

  left_asym_id = asym_id[:, None]
  right_asym_id = asym_id[None, :]

  left_residue_index = residue_index[:, None]
  right_residue_index = residue_index[None, :]

  left_token_index = token_index[:, None]
  right_token_index = token_index[None, :]

  left_entity_id = entity_id[:, None]
  right_entity_id = entity_id[None, :]

  left_sym_id = sym_id[:, None]
  right_sym_id = sym_id[None, :]

  # Embed relative positions using a one-hot embedding of distance along chain
  offset = left_residue_index - right_residue_index
  clipped_offset = jnp.clip(
      offset + max_relative_idx, min=0, max=2 * max_relative_idx
  )
  asym_id_same = left_asym_id == right_asym_id
  final_offset = jnp.where(
      asym_id_same,
      clipped_offset,
      (2 * max_relative_idx + 1) * jnp.ones_like(clipped_offset),
  )
  rel_pos = jax.nn.one_hot(final_offset, 2 * max_relative_idx + 2)
  rel_feats.append(rel_pos)

  # Embed relative token index as a one-hot embedding of distance along residue
  token_offset = left_token_index - right_token_index
  clipped_token_offset = jnp.clip(
      token_offset + max_relative_idx, min=0, max=2 * max_relative_idx
  )
  residue_same = (left_asym_id == right_asym_id) & (
      left_residue_index == right_residue_index
  )
  final_token_offset = jnp.where(
      residue_same,
      clipped_token_offset,
      (2 * max_relative_idx + 1) * jnp.ones_like(clipped_token_offset),
  )
  rel_token = jax.nn.one_hot(final_token_offset, 2 * max_relative_idx + 2)
  rel_feats.append(rel_token)

  # Embed same entity ID
  entity_id_same = left_entity_id == right_entity_id
  rel_feats.append(entity_id_same.astype(rel_pos.dtype)[..., None])

  # Embed relative chain ID inside each symmetry class
  rel_sym_id = left_sym_id - right_sym_id

  max_rel_chain = max_relative_chain

  clipped_rel_chain = jnp.clip(
      rel_sym_id + max_rel_chain, min=0, max=2 * max_rel_chain
  )

  final_rel_chain = jnp.where(
      entity_id_same,
      clipped_rel_chain,
      (2 * max_rel_chain + 1) * jnp.ones_like(clipped_rel_chain),
  )
  rel_chain = jax.nn.one_hot(final_rel_chain, 2 * max_relative_chain + 2)

  rel_feats.append(rel_chain)

  return jnp.concatenate(rel_feats, axis=-1)


def shuffle_msa(
    key: jax.Array, msa: features.MSA
) -> tuple[features.MSA, jax.Array]:
  """Shuffle MSA randomly, return batch with shuffled MSA.

  Args:
    key: rng key for random number generation.
    msa: MSA object to sample msa from.

  Returns:
    Protein with sampled msa.
  """
  key, sample_key = jax.random.split(key)
  # Sample uniformly among sequences with at least one non-masked position.
  logits = (jnp.clip(jnp.sum(msa.mask, axis=-1), 0.0, 1.0) - 1.0) * 1e6
  index_order = gumbel_argsort_sample_idx(sample_key, logits)

  return msa.index_msa_rows(index_order), key


================================================
FILE: src/alphafold3/model/network/modules.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Haiku modules for the Diffuser model."""

from collections.abc import Sequence
from typing import Literal

from alphafold3.common import base_config
from alphafold3.model import model_config
from alphafold3.model.components import haiku_modules as hm
from alphafold3.model.components import mapping
from alphafold3.model.network import diffusion_transformer
import haiku as hk
import jax
import jax.numpy as jnp
import tokamax


def get_shard_size(
    num_residues: int, shard_spec: Sequence[tuple[int | None, int | None]]
) -> int | None:
  shard_size = shard_spec[0][-1]
  for num_residues_upper_bound, num_residues_shard_size in shard_spec:
    shard_size = num_residues_shard_size
    if (
        num_residues_upper_bound is None
        or num_residues <= num_residues_upper_bound
    ):
      break
  return shard_size


class TransitionBlock(hk.Module):
  """Transition block for transformer."""

  class Config(base_config.BaseConfig):
    num_intermediate_factor: int = 4
    use_glu_kernel: bool = True

  def __init__(
      self, config: Config, global_config: model_config.GlobalConfig, *, name
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(self, act, broadcast_dim=0):
    num_channels = act.shape[-1]

    num_intermediate = int(num_channels * self.config.num_intermediate_factor)

    act = hm.LayerNorm(name='input_layer_norm')(act)

    if self.config.use_glu_kernel:
      weights, _ = hm.haiku_linear_get_params(
          act,
          num_output=num_intermediate * 2,
          initializer='relu',
          name='transition1',
      )
      weights = jnp.reshape(weights, (len(weights), 2, num_intermediate))
      c = tokamax.gated_linear_unit(
          x=act, weights=weights, activation=jax.nn.swish
      )
    else:
      act = hm.Linear(
          num_intermediate * 2, initializer='relu', name='transition1'
      )(act)
      a, b = jnp.split(act, 2, axis=-1)
      c = jax.nn.swish(a) * b

    return hm.Linear(
        num_channels,
        initializer=self.global_config.final_init,
        name='transition2',
    )(c)


class MSAAttention(hk.Module):
  """MSA Attention."""

  class Config(base_config.BaseConfig):
    num_head: int = 8

  def __init__(
      self, config: Config, global_config: model_config.GlobalConfig, *, name
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(self, act, mask, pair_act):
    act = hm.LayerNorm(name='act_norm')(act)
    pair_act = hm.LayerNorm(name='pair_norm')(pair_act)
    logits = hm.Linear(
        self.config.num_head, use_bias=False, name='pair_logits'
    )(pair_act)
    logits = jnp.transpose(logits, [2, 0, 1])
    logits += 1e9 * (jnp.max(mask, axis=0) - 1.0)
    weights = jax.nn.softmax(logits, axis=-1)
    num_channels = act.shape[-1]
    value_dim = num_channels // self.config.num_head
    v = hm.Linear(
        [self.config.num_head, value_dim], use_bias=False, name='v_projection'
    )(act)
    v_avg = jnp.einsum('hqk, bkhc -> bqhc', weights, v)
    v_avg = jnp.reshape(v_avg, v_avg.shape[:-2] + (-1,))
    gate_values = hm.Linear(
        self.config.num_head * value_dim,
        bias_init=1.0,
        initializer='zeros',
        name='gating_query',
    )(act)
    v_avg *= jax.nn.sigmoid(gate_values)

    return hm.Linear(
        num_channels,
        initializer=self.global_config.final_init,
        name='output_projection',
    )(v_avg)


class GridSelfAttention(hk.Module):
  """Self attention that is either per-sequence or per-residue."""

  class Config(base_config.BaseConfig):
    num_head: int = 4

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      transpose: bool,
      *,
      name: str,
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config
    self.transpose = transpose

  @hk.transparent
  def _attention(
      self,
      act,
      mask,
      bias,
  ):
    num_channels = act.shape[-1]
    assert num_channels % self.config.num_head == 0
    # Triton requires a minimum dimension of 16 for doing matmul.
    qkv_dim = max(num_channels // self.config.num_head, 16)

    qkv_shape = (self.config.num_head, qkv_dim)
    q = hm.Linear(
        qkv_shape, use_bias=False, name='q_projection', transpose_weights=True
    )(act)
    k = hm.Linear(
        qkv_shape, use_bias=False, name='k_projection', transpose_weights=True
    )(act)
    v = hm.Linear(qkv_shape, use_bias=False, name='v_projection')(act)

    # Dot product attention requires the bias term to have a batch dimension.
    bias = jnp.expand_dims(bias, 0)

    weighted_avg = tokamax.dot_product_attention(
        q,
        k,
        v,
        mask=mask,
        bias=bias,
        implementation=self.global_config.flash_attention_implementation,
    )
    weighted_avg = jnp.reshape(weighted_avg, weighted_avg.shape[:-2] + (-1,))

    gate_values = hm.Linear(
        self.config.num_head * qkv_dim,
        bias_init=1.0,
        initializer='zeros',
        transpose_weights=True,
        name='gating_query',
    )(act)
    weighted_avg *= jax.nn.sigmoid(gate_values)

    return hm.Linear(
        num_channels,
        initializer=self.global_config.final_init,
        name='output_projection',
    )(weighted_avg)

  def __call__(self, act, pair_mask):
    """Builds a module.

    Arguments:
      act: [num_seq, num_res, channels] activations tensor
      pair_mask: [num_seq, num_res] mask of non-padded regions in the tensor.
        Only used in inducing points attention currently.

    Returns:
      Result of the self-attention operation.
    """
    assert len(act.shape) == 3
    assert len(pair_mask.shape) == 2

    pair_mask = jnp.swapaxes(pair_mask, -1, -2)
    act = hm.LayerNorm(name='act_norm')(act)

    nonbatched_bias = hm.Linear(
        self.config.num_head, use_bias=False, name='pair_bias_projection'
    )(act)
    nonbatched_bias = jnp.transpose(nonbatched_bias, [2, 0, 1])

    num_residues = act.shape[0]

    chunk_size = get_shard_size(
        num_residues, self.global_config.pair_attention_chunk_size
    )

    if self.transpose:
      act = jnp.swapaxes(act, -2, -3)

    pair_mask = pair_mask[:, None, None, :].astype(jnp.bool_)

    act = mapping.inference_subbatch(
        self._attention,
        chunk_size,
        batched_args=[act, pair_mask],
        nonbatched_args=[nonbatched_bias],
    )

    if self.transpose:
      act = jnp.swapaxes(act, -2, -3)

    return act


class TriangleMultiplication(hk.Module):
  """Triangle Multiplication."""

  class Config(base_config.BaseConfig):
    equation: Literal['ikc,jkc->ijc', 'kjc,kic->ijc']
    use_glu_kernel: bool = True

  def __init__(
      self, config: Config, global_config: model_config.GlobalConfig, *, name
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(self, act, mask):
    """Applies Module.

    Args:
      act: The activation.
      mask: The mask.

    Returns:
      Outputs, should have same shape/type as output_act
    """
    mask = mask[None, ...]
    num_channels = act.shape[-1]
    equation = {
        'ikc,jkc->ijc': 'cik,cjk->cij',
        'kjc,kic->ijc': 'ckj,cki->cij',
    }[self.config.equation]

    act = hm.LayerNorm(name='left_norm_input')(act)
    input_act = act

    if self.config.use_glu_kernel:
      weights_projection, _ = hm.haiku_linear_get_params(
          act, num_output=num_channels * 2, name='projection'
      )
      weights_gate, _ = hm.haiku_linear_get_params(
          act,
          num_output=num_channels * 2,
          initializer=self.global_config.final_init,
          name='gate',
      )
      weights_glu = jnp.stack([weights_gate, weights_projection], axis=1)

      projection = tokamax.gated_linear_unit(
          act, weights_glu, activation=jax.nn.sigmoid
      )
      projection = jnp.transpose(projection, (2, 0, 1))
      projection *= mask
    else:
      projection = hm.Linear(num_channels * 2, name='projection')(act)
      projection = jnp.transpose(projection, (2, 0, 1))
      projection *= mask

      gate = hm.Linear(
          num_channels * 2,
          name='gate',
          bias_init=1.0,
          initializer=self.global_config.final_init,
      )(act)
      gate = jnp.transpose(gate, (2, 0, 1))
      projection *= jax.nn.sigmoid(gate)

    projection = projection.reshape(num_channels, 2, *projection.shape[1:])
    a, b = jnp.split(projection, 2, axis=1)
    a, b = jnp.squeeze(a, axis=1), jnp.squeeze(b, axis=1)
    act = jnp.einsum(equation, a, b)
    act = hm.LayerNorm(name='center_norm', axis=0, param_axis=0)(act)

    act = jnp.transpose(act, (1, 2, 0))
    act = hm.Linear(
        num_channels,
        initializer=self.global_config.final_init,
        name='output_projection',
    )(act)

    gate_out = hm.Linear(
        num_channels,
        name='gating_linear',
        bias_init=1.0,
        initializer=self.global_config.final_init,
    )(input_act)
    act *= jax.nn.sigmoid(gate_out)

    return act


class OuterProductMean(hk.Module):
  """Computed mean outer product."""

  class Config(base_config.BaseConfig):
    chunk_size: int = 128
    num_outer_channel: int = 32

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      num_output_channel,
      *,
      name,
  ):
    super().__init__(name=name)
    self.global_config = global_config
    self.config = config
    self.num_output_channel = num_output_channel

  def __call__(self, act, mask):
    mask = mask[..., None]
    act = hm.LayerNorm(name='layer_norm_input')(act)

    left_act = mask * hm.Linear(
        self.config.num_outer_channel,
        initializer='linear',
        name='left_projection',
    )(act)

    right_act = mask * hm.Linear(
        self.config.num_outer_channel,
        initializer='linear',
        name='right_projection',
    )(act)

    if self.global_config.final_init == 'zeros':
      w_init = hk.initializers.Constant(0.0)
    else:
      w_init = hk.initializers.VarianceScaling(scale=2.0, mode='fan_in')

    output_w = hk.get_parameter(
        'output_w',
        shape=(
            self.config.num_outer_channel,
            self.config.num_outer_channel,
            self.num_output_channel,
        ),
        dtype=act.dtype,
        init=w_init,
    )
    output_b = hk.get_parameter(
        'output_b',
        shape=(self.num_output_channel,),
        dtype=act.dtype,
        init=hk.initializers.Constant(0.0),
    )

    def compute_chunk(left_act):
      # Make sure that the 'b' dimension is the most minor batch like dimension
      # so it will be treated as the real batch by XLA (both during the forward
      # and the backward pass)
      left_act = jnp.transpose(left_act, [0, 2, 1])
      act = jnp.einsum('acb,ade->dceb', left_act, right_act)
      act = jnp.einsum('dceb,cef->dbf', act, output_w) + output_b
      return jnp.transpose(act, [1, 0, 2])

    act = mapping.inference_subbatch(
        compute_chunk,
        self.config.chunk_size,
        batched_args=[left_act],
        nonbatched_args=[],
        input_subbatch_dim=1,
        output_subbatch_dim=0,
    )

    epsilon = 1e-3
    norm = jnp.einsum('abc,adc->bdc', mask, mask)
    return act / (epsilon + norm)


class PairFormerIteration(hk.Module):
  """Single Iteration of Pair Former."""

  class Config(base_config.BaseConfig):
    """Config for PairFormerIteration."""

    num_layer: int
    pair_attention: GridSelfAttention.Config = base_config.autocreate()
    pair_transition: TransitionBlock.Config = base_config.autocreate()
    single_attention: diffusion_transformer.SelfAttentionConfig | None = None
    single_transition: TransitionBlock.Config | None = None
    triangle_multiplication_incoming: TriangleMultiplication.Config = (
        base_config.autocreate(equation='kjc,kic->ijc')
    )
    triangle_multiplication_outgoing: TriangleMultiplication.Config = (
        base_config.autocreate(equation='ikc,jkc->ijc')
    )
    shard_transition_blocks: bool = True

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      with_single=False,
      *,
      name,
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config
    self.with_single = with_single

  def __call__(
      self,
      act,
      pair_mask,
      single_act=None,
      seq_mask=None,
  ):
    """Build a single iteration of the pair former.

    Args:
      act: [num_res, num_res, num_channel] Input pairwise activations.
      pair_mask: [num_res, num_res] padding mask.
      single_act: [num_res, single_channel] Single Input activations, optional
      seq_mask: [num_res] Sequence Mask, optional.

    Returns:
      [num_res, num_res, num_channel] tensor of activations.
    """

    num_residues = act.shape[0]

    act += TriangleMultiplication(
        self.config.triangle_multiplication_outgoing,
        self.global_config,
        name='triangle_multiplication_outgoing',
    )(act, pair_mask)

    act += TriangleMultiplication(
        self.config.triangle_multiplication_incoming,
        self.global_config,
        name='triangle_multiplication_incoming',
    )(act, pair_mask)

    act += GridSelfAttention(
        self.config.pair_attention,
        self.global_config,
        name='pair_attention1',
        transpose=False,
    )(act, pair_mask)

    act += GridSelfAttention(
        self.config.pair_attention,
        self.global_config,
        name='pair_attention2',
        transpose=True,
    )(act, pair_mask)

    transition_block = TransitionBlock(
        self.config.pair_transition, self.global_config, name='pair_transition'
    )
    if self.config.shard_transition_blocks:
      transition_block = mapping.sharded_apply(
          transition_block,
          get_shard_size(
              num_residues, self.global_config.pair_transition_shard_spec
          ),
      )
    act += transition_block(act)

    if self.with_single:
      assert self.config.single_attention is not None
      pair_logits = hm.Linear(
          self.config.single_attention.num_head,
          name='single_pair_logits_projection',
      )(hm.LayerNorm(name='single_pair_logits_norm')(act))

      pair_logits = jnp.transpose(pair_logits, [2, 0, 1])

      single_act += diffusion_transformer.self_attention(
          single_act,
          seq_mask,
          pair_logits=pair_logits,
          config=self.config.single_attention,
          global_config=self.global_config,
          name='single_attention_',
      )

      single_act += TransitionBlock(
          self.config.single_transition,
          self.global_config,
          name='single_transition',
      )(single_act, broadcast_dim=None)

      return act, single_act
    else:
      return act


class EvoformerIteration(hk.Module):
  """Single Iteration of Evoformer Main Stack."""

  class Config(base_config.BaseConfig):
    """Configuration for EvoformerIteration."""

    num_layer: int = 4
    msa_attention: MSAAttention.Config = base_config.autocreate()
    outer_product_mean: OuterProductMean.Config = base_config.autocreate()
    msa_transition: TransitionBlock.Config = base_config.autocreate()
    pair_attention: GridSelfAttention.Config = base_config.autocreate()
    pair_transition: TransitionBlock.Config = base_config.autocreate()
    triangle_multiplication_incoming: TriangleMultiplication.Config = (
        base_config.autocreate(equation='kjc,kic->ijc')
    )
    triangle_multiplication_outgoing: TriangleMultiplication.Config = (
        base_config.autocreate(equation='ikc,jkc->ijc')
    )
    shard_transition_blocks: bool = True

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name='evoformer_iteration',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(self, activations, masks):

    msa_act, pair_act = activations['msa'], activations['pair']

    num_residues = pair_act.shape[0]

    msa_mask, pair_mask = masks['msa'], masks['pair']

    pair_act += OuterProductMean(
        config=self.config.outer_product_mean,
        global_config=self.global_config,
        num_output_channel=int(pair_act.shape[-1]),
        name='outer_product_mean',
    )(msa_act, msa_mask)

    msa_act += MSAAttention(
        self.config.msa_attention, self.global_config, name='msa_attention1'
    )(msa_act, msa_mask, pair_act=pair_act)

    msa_act += TransitionBlock(
        self.config.msa_transition, self.global_config, name='msa_transition'
    )(msa_act)

    pair_act += TriangleMultiplication(
        self.config.triangle_multiplication_outgoing,
        self.global_config,
        name='triangle_multiplication_outgoing',
    )(pair_act, pair_mask)

    pair_act += TriangleMultiplication(
        self.config.triangle_multiplication_incoming,
        self.global_config,
        name='triangle_multiplication_incoming',
    )(pair_act, pair_mask)

    pair_act += GridSelfAttention(
        self.config.pair_attention,
        self.global_config,
        name='pair_attention1',
        transpose=False,
    )(pair_act, pair_mask)

    pair_act += GridSelfAttention(
        self.config.pair_attention,
        self.global_config,
        name='pair_attention2',
        transpose=True,
    )(pair_act, pair_mask)

    transition_block = TransitionBlock(
        self.config.pair_transition, self.global_config, name='pair_transition'
    )
    if self.config.shard_transition_blocks:
      transition_block = mapping.sharded_apply(
          transition_block,
          get_shard_size(
              num_residues, self.global_config.pair_transition_shard_spec
          ),
      )
    pair_act += transition_block(pair_act)

    return {'msa': msa_act, 'pair': pair_act}


================================================
FILE: src/alphafold3/model/network/noise_level_embeddings.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Fourier embeddings for given noise levels.

We supply fixed weights and biases for the Fourier embeddings. These were
initially generated by the following code, but we make them into constants
to future proof against changes in jax rng generation:

```
dim = 256
w_key, b_key = jax.random.split(jax.random.PRNGKey(42))
weight = jax.random.normal(w_key, shape=[dim])
bias = jax.random.uniform(b_key, shape=[dim])
```
"""

import jax.numpy as jnp

# pyformat: disable
# pylint: disable=bad-whitespace
# pylint: disable=bad-continuation
_WEIGHT = [
     0.45873642,  0.06516238, -0.07278306, -0.26992258,  0.64292115,
    -0.40763968,  3.60116863,  0.54461384, -0.32644904,  2.10888267,
     1.30805349,  1.19838560, -1.37745857,  1.99475312, -1.64120293,
     1.07823789, -0.02288206,  0.88305283,  0.48099944,  0.17655374,
     0.30281949,  0.80646873,  0.62605333, -0.23965347, -1.02609432,
     0.75006109, -0.19913037,  0.07466396,  0.66431236, -0.60990530,
    -0.69709194, -0.44453633, -1.77656078,  0.02299878,  0.04095552,
     0.35485864, -0.47602659, -0.98820388, -0.24106771, -1.07254291,
    -0.99741757,  0.22697604,  1.41390419,  1.54984057, -0.12237291,
     0.20156337,  0.61767143,  0.23959029,  0.92454034,  1.84082258,
     0.89030224,  0.39598912, -1.52224910,  0.29669049,  1.52356744,
    -0.33968377,  0.24155144, -0.52308381, -0.23622665,  0.92825454,
    -0.63864607, -0.62169307,  0.78623551, -0.80352145, -0.45496067,
     1.30877995, -0.06686528,  1.00248849, -0.63593471,  0.16372502,
    -1.46133232,  1.10562658, -0.01693927,  0.28684548, -0.72843230,
     0.66133535, -1.92225552,  0.70241231, -0.96868867, -0.47309339,
    -1.66894221,  0.46018723, -0.56806105,  0.32694784, -0.46529883,
     1.02299964,  0.84688205,  1.19581807, -1.82454145,  0.05999713,
    -0.59530073,  1.44862521, -0.34933713, -0.46564487, -0.55005538,
    -1.61170268,  0.17502306,  0.38670063, -1.12133658, -0.29343036,
    -0.52527446, -1.26285112,  1.07982683,  0.51215219,  1.48963666,
     1.09847653, -0.01563358,  0.32574457,  1.94779706, -1.29198587,
     1.06249654, -0.86965990,  0.22975266, -0.27182648, -0.21130897,
    -0.41773933, -0.02329035,  1.31049252,  0.05579265, -1.23127055,
    -0.99691105,  0.27058721, -0.72509319, -0.14421797, -1.48605061,
     1.35041201,  1.29619241, -1.01022530, -0.79787987, -0.16166858,
     0.87210685,  1.69248152,  1.42469788, -0.72325104, -1.24823737,
     0.07051118,  0.71332991, -0.07360429, -0.91955227, -2.68856549,
    -0.44033936,  0.35482934, -0.57933813,  0.97468042, -0.31050494,
    -0.88454425, -2.08785224,  0.47322822, -0.02400172,  0.26644820,
    -0.19147627, -2.10538960, -1.27962470, -1.35999286,  2.09867334,
     0.65099514,  0.21604492, -0.45951018,  0.15994427, -0.31420693,
    -0.65202618, -0.61077976, -1.06100249, -1.47254968,  1.18165290,
    -0.78656220,  1.28182006,  1.80323684,  1.09196901,  0.26118696,
    -0.30168581,  0.39749333,  0.26812574, -1.51995814, -0.46909946,
     0.03874255, -1.36774313,  2.30143976,  2.06959820, -0.41647521,
     1.85624206,  0.49019700, -0.06726539,  0.00457313,  0.23915423,
    -1.84971249, -0.20482327, -0.34097880, -0.57933033, -1.10541213,
    -0.30269983, -0.16430426, -0.82371718,  0.10345812,  1.78753936,
     0.04786763,  1.86778629, -0.65214992,  0.81544143, -0.28214937,
     0.31187257,  0.57661986,  1.21938801, -1.56046617,  0.38046429,
    -0.18235965,  0.81794524, -0.40474343,  0.46538028, -1.15558851,
     0.59625793, -1.07801270,  0.07310858,  0.61526084,  0.55518496,
    -0.49787554,  0.92703879, -1.27780271, -0.83373469, -0.43015575,
     0.41877759, -1.03987372, -1.46055734,  0.61282396,  0.15590595,
    -0.34269521,  0.56509072, -1.17904210,  0.11374855, -1.83310866,
     0.38734794, -0.58623004,  0.77931106,  1.53930688, -0.70299625,
    -0.11389336, -1.14818096, -0.44400632,  1.21887410,  0.64066756,
    -0.70249403, -0.27244881,  0.38586098, -1.07925785,  0.12448707,
    -1.28286278,  0.37827531,  0.68812364,  1.65695465,  0.12440517,
    -0.03689830,  1.10224664, -0.28323629, -0.47939169,  0.70120829,
    -0.67204583
]

_BIAS = [
    0.00465965, 0.21738243, 0.22277749, 0.68463874, 0.84596848, 0.17337036,
    0.39573753, 0.78153563, 0.86311185, 0.21782327, 0.24377882, 0.42310703,
    0.19887352, 0.10486019, 0.48707581, 0.22205460, 0.97263455, 0.29714966,
    0.11244559, 0.53020525, 0.36796236, 0.37294638, 0.80261672, 0.04669094,
    0.86319661, 0.75907171, 0.77297020, 0.01114798, 0.55850804, 0.91799915,
    0.23032320, 0.12154722, 0.26701927, 0.42934716, 0.47951782, 0.96782577,
    0.86785042, 0.61985648, 0.05743814, 0.41800117, 0.68881893, 0.60575199,
    0.21058667, 0.64412105, 0.63958526, 0.89390790, 0.69755554, 0.89345169,
    0.53330755, 0.56985939, 0.30724049, 0.00984561, 0.91407037, 0.92118979,
    0.94153070, 0.81097460, 0.70537627, 0.32810748, 0.47227263, 0.11821401,
    0.44983089, 0.30767226, 0.31756389, 0.62969446, 0.69892538, 0.16949117,
    0.06207097, 0.46717727, 0.95348179, 0.62363589, 0.49018729, 0.06920040,
    0.39333904, 0.41299903, 0.52514863, 0.61197245, 0.56871891, 0.65053988,
    0.22203422, 0.46748531, 0.86931503, 0.87050021, 0.40208721, 0.32084906,
    0.55084610, 0.94584596, 0.76279902, 0.36250532, 0.74272907, 0.66682065,
    0.96452832, 0.64768302, 0.88070846, 0.56995463, 0.06395614, 0.69499350,
    0.44494808, 0.39775658, 0.20280898, 0.33363521, 0.05999005, 0.44414878,
    0.65227020, 0.01199079, 0.71995056, 0.19045687, 0.48342144, 0.25127733,
    0.66515994, 0.22465158, 0.22313106, 0.06302810, 0.55783665, 0.93625581,
    0.58800840, 0.72525370, 0.52879298, 0.77195418, 0.15548682, 0.01028740,
    0.39325142, 0.45401239, 0.71494079, 0.33011997, 0.05050695, 0.26381660,
    0.63064706, 0.47604024, 0.08593416, 0.00383425, 0.06352687, 0.05510247,
    0.03552997, 0.35810637, 0.56094289, 0.60922170, 0.88599777, 0.45419788,
    0.40486634, 0.71297824, 0.34976673, 0.97825217, 0.12915993, 0.09566259,
    0.64318919, 0.16717327, 0.82308614, 0.32672071, 0.81688786, 0.84857118,
    0.99922776, 0.07551706, 0.18766022, 0.13051236, 0.39136350, 0.08768725,
    0.92048228, 0.87185788, 0.39158428, 0.79224777, 0.17492688, 0.68902445,
    0.81980729, 0.70458186, 0.59489477, 0.93324888, 0.49986637, 0.40705478,
    0.89202917, 0.20673239, 0.39339757, 0.20996964, 0.02923799, 0.53992438,
    0.40119815, 0.10366607, 0.08044600, 0.95551598, 0.20518017, 0.68826210,
    0.90159297, 0.69008791, 0.86880815, 0.16246438, 0.89628279, 0.11481643,
    0.61353648, 0.41545081, 0.92478311, 0.78212476, 0.48292696, 0.79621077,
    0.11947489, 0.01747024, 0.22928023, 0.87387264, 0.86349785, 0.89526737,
    0.58904779, 0.13896775, 0.68194926, 0.55824125, 0.44428205, 0.55422378,
    0.28189969, 0.27923775, 0.09979951, 0.66994715, 0.45943546, 0.71207762,
    0.17300689, 0.83434916, 0.02573085, 0.45858085, 0.55934799, 0.30676675,
    0.52219367, 0.34544575, 0.19280875, 0.26937950, 0.07147646, 0.06295013,
    0.76382887, 0.38737607, 0.58825982, 0.17423475, 0.05509448, 0.97228825,
    0.94380617, 0.91664016, 0.18800116, 0.41771865, 0.59420645, 0.77371931,
    0.64687788, 0.27284670, 0.22310913, 0.15663862, 0.45573199, 0.50386798,
    0.66712272, 0.71649647, 0.28475654, 0.83415413, 0.75261366, 0.61517799,
    0.93544555, 0.76141870, 0.85474241, 0.74766934, 0.33459592, 0.78477907,
    0.07250881, 0.10174239, 0.95332730, 0.80793905
]
# pyformat: enable
# pylint: enable=bad-whitespace
# pylint: enable=bad-continuation


def noise_embeddings(sigma_scaled_noise_level: jnp.ndarray) -> jnp.ndarray:
  """Returns Fourier noise level embeddings for diffusion model."""
  transformed_noise_level = (1 / 4) * jnp.log(sigma_scaled_noise_level)
  weight = jnp.array(_WEIGHT, dtype=jnp.float32)
  bias = jnp.array(_BIAS, dtype=jnp.float32)
  embeddings = transformed_noise_level[..., None] * weight + bias
  return jnp.cos(2 * jnp.pi * embeddings)


================================================
FILE: src/alphafold3/model/network/template_modules.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Modules for embedding templates."""

from alphafold3.common import base_config
from alphafold3.constants import residue_names
from alphafold3.jax import geometry
from alphafold3.model import features
from alphafold3.model import model_config
from alphafold3.model import protein_data_processing
from alphafold3.model.components import haiku_modules as hm
from alphafold3.model.network import modules
from alphafold3.model.scoring import scoring
import haiku as hk
import jax
import jax.numpy as jnp


class DistogramFeaturesConfig(base_config.BaseConfig):
  # The left edge of the first bin.
  min_bin: float = 3.25
  # The left edge of the final bin. The final bin catches everything larger than
  # `max_bin`.
  max_bin: float = 50.75
  # The number of bins in the distogram.
  num_bins: int = 39


def dgram_from_positions(positions, config: DistogramFeaturesConfig):
  """Compute distogram from amino acid positions.

  Args:
    positions: (num_res, 3) Position coordinates.
    config: Distogram bin configuration.

  Returns:
    Distogram with the specified number of bins.
  """
  lower_breaks = jnp.linspace(config.min_bin, config.max_bin, config.num_bins)
  lower_breaks = jnp.square(lower_breaks)
  upper_breaks = jnp.concatenate(
      [lower_breaks[1:], jnp.array([1e8], dtype=jnp.float32)], axis=-1
  )
  dist2 = jnp.sum(
      jnp.square(
          jnp.expand_dims(positions, axis=-2)
          - jnp.expand_dims(positions, axis=-3)
      ),
      axis=-1,
      keepdims=True,
  )

  dgram = (dist2 > lower_breaks).astype(jnp.float32) * (
      dist2 < upper_breaks
  ).astype(jnp.float32)
  return dgram


def make_backbone_rigid(
    positions: geometry.Vec3Array,
    mask: jnp.ndarray,
    group_indices: jnp.ndarray,
) -> tuple[geometry.Rigid3Array, jnp.ndarray]:
  """Make backbone Rigid3Array and mask.

  Args:
    positions: (num_res, num_atoms) of atom positions as Vec3Array.
    mask: (num_res, num_atoms) for atom mask.
    group_indices: (num_res, num_group, 3) for atom indices forming groups.

  Returns:
    tuple of backbone Rigid3Array and mask (num_res,).
  """
  backbone_indices = group_indices[:, 0]

  # main backbone frames differ in sidechain frame convention.
  # for sidechain it's (C, CA, N), for backbone it's (N, CA, C)
  # Hence using c, b, a, each of shape (num_res,).
  c, b, a = [backbone_indices[..., i] for i in range(3)]

  slice_index = jax.vmap(lambda x, i: x[i])
  rigid_mask = (
      slice_index(mask, a) * slice_index(mask, b) * slice_index(mask, c)
  ).astype(jnp.float32)

  frame_positions = []
  for indices in [a, b, c]:
    frame_positions.append(
        jax.tree.map(lambda x, idx=indices: slice_index(x, idx), positions)
    )

  rotation = geometry.Rot3Array.from_two_vectors(
      frame_positions[2] - frame_positions[1],
      frame_positions[0] - frame_positions[1],
  )
  rigid = geometry.Rigid3Array(rotation, frame_positions[1])

  return rigid, rigid_mask


class TemplateEmbedding(hk.Module):
  """Embed a set of templates."""

  class Config(base_config.BaseConfig):
    num_channels: int = 64
    template_stack: modules.PairFormerIteration.Config = base_config.autocreate(
        num_layer=2,
        pair_transition=base_config.autocreate(num_intermediate_factor=2),
    )
    dgram_features: DistogramFeaturesConfig = base_config.autocreate()

  def __init__(
      self,
      config: Config,
      global_config: model_config.GlobalConfig,
      name='template_embedding',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(
      self,
      query_embedding: jnp.ndarray,
      templates: features.Templates,
      padding_mask_2d: jnp.ndarray,
      multichain_mask_2d: jnp.ndarray,
      key: jnp.ndarray,
  ) -> jnp.ndarray:
    """Generate an embedding for a set of templates.

    Args:
      query_embedding: [num_res, num_res, num_channel] a query tensor that will
        be used to attend over the templates to remove the num_templates
        dimension.
      templates: A 'Templates' object.
      padding_mask_2d: [num_res, num_res] Pair mask for attention operations.
      multichain_mask_2d: [num_res, num_res] Pair mask for multichain.
      key: random key generator.

    Returns:
      An embedding of size [num_res, num_res, num_channels]
    """
    c = self.config
    num_residues = query_embedding.shape[0]
    num_templates = templates.aatype.shape[0]
    query_num_channels = query_embedding.shape[2]
    num_atoms = 24
    assert query_embedding.shape == (
        num_residues,
        num_residues,
        query_num_channels,
    )
    assert templates.aatype.shape == (num_templates, num_residues)
    assert templates.atom_positions.shape == (
        num_templates,
        num_residues,
        num_atoms,
        3,
    )
    assert templates.atom_mask.shape == (num_templates, num_residues, num_atoms)
    assert padding_mask_2d.shape == (num_residues, num_residues)

    num_templates = templates.aatype.shape[0]
    num_res, _, query_num_channels = query_embedding.shape

    # Embed each template separately.
    template_embedder = SingleTemplateEmbedding(self.config, self.global_config)

    subkeys = jnp.array(jax.random.split(key, num_templates))

    def scan_fn(carry, x):
      templates, key = x
      embedding = template_embedder(
          query_embedding,
          templates,
          padding_mask_2d,
          multichain_mask_2d,
          key,
      )
      return carry + embedding, None

    scan_init = jnp.zeros(
        (num_res, num_res, c.num_channels), dtype=query_embedding.dtype
    )
    summed_template_embeddings, _ = hk.scan(
        scan_fn, scan_init, (templates, subkeys)
    )

    embedding = summed_template_embeddings / (1e-7 + num_templates)
    embedding = jax.nn.relu(embedding)
    embedding = hm.Linear(
        query_num_channels, initializer='relu', name='output_linear'
    )(embedding)

    assert embedding.shape == (num_residues, num_residues, query_num_channels)
    return embedding


class SingleTemplateEmbedding(hk.Module):
  """Embed a single template."""

  def __init__(
      self,
      config: TemplateEmbedding.Config,
      global_config: model_config.GlobalConfig,
      name='single_template_embedding',
  ):
    super().__init__(name=name)
    self.config = config
    self.global_config = global_config

  def __call__(
      self,
      query_embedding: jnp.ndarray,
      templates: features.Templates,
      padding_mask_2d: jnp.ndarray,
      multichain_mask_2d: jnp.ndarray,
      key: jnp.ndarray,
  ) -> jnp.ndarray:
    """Build the single template embedding graph.

    Args:
      query_embedding: (num_res, num_res, num_channels) - embedding of the query
        sequence/msa.
      templates: 'Templates' object containing single Template.
      padding_mask_2d: Padding mask (Note: this doesn't care if a template
        exists, unlike the template_pseudo_beta_mask).
      multichain_mask_2d: A mask indicating intra-chain residue pairs, used to
        mask out between chain distances/features when templates are for single
        chains.
      key: Random key generator.

    Returns:
      A template embedding (num_res, num_res, num_channels).
    """
    gc = self.global_config
    c = self.config
    assert padding_mask_2d.dtype == query_embedding.dtype
    dtype = query_embedding.dtype
    num_channels = self.config.num_channels

    def construct_input(
        query_embedding, templates: features.Templates, multichain_mask_2d
    ):

      # Compute distogram feature for the template.
      aatype = templates.aatype
      dense_atom_mask = templates.atom_mask

      dense_atom_positions = templates.atom_positions
      dense_atom_positions *= dense_atom_mask[..., None]

      pseudo_beta_positions, pseudo_beta_mask = scoring.pseudo_beta_fn(
          templates.aatype, dense_atom_positions, dense_atom_mask
      )
      pseudo_beta_mask_2d = (
          pseudo_beta_mask[:, None] * pseudo_beta_mask[None, :]
      )
      pseudo_beta_mask_2d *= multichain_mask_2d
      dgram = dgram_from_positions(
          pseudo_beta_positions, self.config.dgram_features
      )
      dgram *= pseudo_beta_mask_2d[..., None]
      dgram = dgram.astype(dtype)
      pseudo_beta_mask_2d = pseudo_beta_mask_2d.astype(dtype)
      to_concat = [(dgram, 1), (pseudo_beta_mask_2d, 0)]

      aatype = jax.nn.one_hot(
          aatype,
          residue_names.POLYMER_TYPES_NUM_WITH_UNKNOWN_AND_GAP,
          axis=-1,
          dtype=dtype,
      )
      to_concat.append((aatype[None, :, :], 1))
      to_concat.append((aatype[:, None, :], 1))

      # Compute a feature representing the normalized vector between each
      # backbone affine - i.e. in each residues local frame, what direction are
      # each of the other residues.

      template_group_indices = jnp.take(
          protein_data_processing.RESTYPE_RIGIDGROUP_DENSE_ATOM_IDX,
          templates.aatype,
          axis=0,
      )
      rigid, backbone_mask = make_backbone_rigid(
          geometry.Vec3Array.from_array(dense_atom_positions),
          dense_atom_mask,
          template_group_indices.astype(jnp.int32),
      )
      points = rigid.translation
      rigid_vec = rigid[:, None].inverse().apply_to_point(points)
      unit_vector = rigid_vec.normalized()
      unit_vector = [unit_vector.x, unit_vector.y, unit_vector.z]

      unit_vector = [x.astype(dtype) for x in unit_vector]
      backbone_mask = backbone_mask.astype(dtype)

      backbone_mask_2d = backbone_mask[:, None] * backbone_mask[None, :]
      backbone_mask_2d *= multichain_mask_2d
      unit_vector = [x * backbone_mask_2d for x in unit_vector]

      # Note that the backbone_mask takes into account C, CA and N (unlike
      # pseudo beta mask which just needs CB) so we add both masks as features.
      to_concat.extend([(x, 0) for x in unit_vector])
      to_concat.append((backbone_mask_2d, 0))

      query_embedding = hm.LayerNorm(name='query_embedding_norm')(
          query_embedding
      )
      # Allow the template embedder to see the query embedding.  Note this
      # contains the position relative feature, so this is how the network knows
      # which residues are next to each other.
      to_concat.append((query_embedding, 1))

      act = 0

      for i, (x, n_input_dims) in enumerate(to_concat):
        act += hm.Linear(
            num_channels,
            num_input_dims=n_input_dims,
            initializer='relu',
            name=f'template_pair_embedding_{i}',
        )(x)
      return act

    act = construct_input(query_embedding, templates, multichain_mask_2d)

    if c.template_stack.num_layer:

      def template_iteration_fn(x):
        return modules.PairFormerIteration(
            c.template_stack, gc, name='template_embedding_iteration'
        )(act=x, pair_mask=padding_mask_2d)

      template_stack = hk.experimental.layer_stack(c.template_stack.num_layer)(
          template_iteration_fn
      )
      act = template_stack(act)

    act = hm.LayerNorm(name='output_layer_norm')(act)
    return act


================================================
FILE: src/alphafold3/model/params.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Model param loading."""

import bisect
import collections
from collections.abc import Iterator
import contextlib
import io
import os
import pathlib
import re
import struct
import sys
from typing import IO

import haiku as hk
import jax.numpy as jnp
import numpy as np
import zstandard


class RecordError(Exception):
  """Error reading a record."""


def encode_record(scope: str, name: str, arr: np.ndarray) -> bytes:
  """Encodes a single haiku param as bytes, preserving non-numpy dtypes."""
  scope = scope.encode('utf-8')
  name = name.encode('utf-8')
  shape = arr.shape
  dtype = str(arr.dtype).encode('utf-8')
  arr = np.ascontiguousarray(arr)
  if sys.byteorder == 'big':
    arr = arr.byteswap()
  arr_buffer = arr.tobytes('C')
  header = struct.pack(
      '<5i', len(scope), len(name), len(dtype), len(shape), len(arr_buffer)
  )
  return header + b''.join(
      (scope, name, dtype, struct.pack(f'{len(shape)}i', *shape), arr_buffer)
  )


def _read_record(stream: IO[bytes]) -> tuple[str, str, np.ndarray] | None:
  """Reads a record encoded by `_encode_record` from a byte stream."""
  header_size = struct.calcsize('<5i')
  header = stream.read(header_size)
  if not header:
    return None
  if len(header) < header_size:
    raise RecordError(f'Incomplete header: {len(header)=} < {header_size=}')
  (scope_len, name_len, dtype_len, shape_len, arr_buffer_len) = struct.unpack(
      '<5i', header
  )
  fmt = f'<{scope_len}s{name_len}s{dtype_len}s{shape_len}i'
  payload_size = struct.calcsize(fmt) + arr_buffer_len
  payload = stream.read(payload_size)
  if len(payload) < payload_size:
    raise RecordError(f'Incomplete payload: {len(payload)=} < {payload_size=}')
  scope, name, dtype, *shape = struct.unpack_from(fmt, payload)
  scope = scope.decode('utf-8')
  name = name.decode('utf-8')
  dtype = dtype.decode('utf-8')
  arr = np.frombuffer(payload[-arr_buffer_len:], dtype=dtype)
  arr = np.reshape(arr, shape)
  if sys.byteorder == 'big':
    arr = arr.byteswap()
  return scope, name, arr


def read_records(stream: IO[bytes]) -> Iterator[tuple[str, str, np.ndarray]]:
  """Fully reads the contents of a byte stream."""
  while record := _read_record(stream):
    yield record


class _MultiFileIO(io.RawIOBase):
  """A file-like object that presents a concatenated view of multiple files."""

  def __init__(self, files: list[pathlib.Path]):
    self._files = files
    self._stack = contextlib.ExitStack()
    self._handles = [
        self._stack.enter_context(file.open('rb')) for file in files
    ]
    self._sizes = []
    for handle in self._handles:
      handle.seek(0, os.SEEK_END)
      self._sizes.append(handle.tell())
    self._length = sum(self._sizes)
    self._offsets = [0]
    for s in self._sizes[:-1]:
      self._offsets.append(self._offsets[-1] + s)
    self._abspos = 0
    self._relpos = (0, 0)

  def _abs_to_rel(self, pos: int) -> tuple[int, int]:
    idx = bisect.bisect_right(self._offsets, pos) - 1
    return idx, pos - self._offsets[idx]

  def close(self):
    self._stack.close()

  def closed(self) -> bool:
    return all(handle.closed for handle in self._handles)

  def fileno(self) -> int:
    return -1

  def readable(self) -> bool:
    return True

  def tell(self) -> int:
    return self._abspos

  def seek(self, pos: int, whence: int = os.SEEK_SET, /):
    match whence:
      case os.SEEK_SET:
        pass
      case os.SEEK_CUR:
        pos += self._abspos
      case os.SEEK_END:
        pos = self._length - pos
      case _:
        raise ValueError(f'Invalid whence: {whence}')
    self._abspos = pos
    self._relpos = self._abs_to_rel(pos)

  def readinto(self, b: bytearray | memoryview) -> int:
    result = 0
    mem = memoryview(b)
    while mem:
      self._handles[self._relpos[0]].seek(self._relpos[1])
      count = self._handles[self._relpos[0]].readinto(mem)
      result += count
      self._abspos += count
      self._relpos = self._abs_to_rel(self._abspos)
      mem = mem[count:]
      if self._abspos == self._length:
        break
    return result


@contextlib.contextmanager
def open_for_reading(model_files: list[pathlib.Path], is_compressed: bool):
  with contextlib.closing(_MultiFileIO(model_files)) as f:
    if is_compressed:
      yield zstandard.ZstdDecompressor().stream_reader(f)
    else:
      yield f


def _match_model(
    paths: list[pathlib.Path], pattern: re.Pattern[str]
) -> dict[str, list[pathlib.Path]]:
  """Match files in a directory with a pattern, and group by model name."""
  models = collections.defaultdict(list)
  for path in paths:
    match = pattern.fullmatch(path.name)
    if match:
      models[match.group('model_name')].append(path)
  return {k: sorted(v) for k, v in models.items()}


def select_model_files(
    model_dir: pathlib.Path, model_name: str | None = None
) -> tuple[list[pathlib.Path], bool]:
  """Select the model files from a model directory."""
  files = [file for file in model_dir.iterdir() if file.is_file()]

  for pattern, is_compressed in (
      (r'(?P<model_name>.*)\.[0-9]+\.bin\.zst$', True),
      (r'(?P<model_name>.*)\.bin\.zst\.[0-9]+$', True),
      (r'(?P<model_name>.*)\.[0-9]+\.bin$', False),
      (r'(?P<model_name>.*)\.bin]\.[0-9]+$', False),
      (r'(?P<model_name>.*)\.bin\.zst$', True),
      (r'(?P<model_name>.*)\.bin$', False),
  ):
    models = _match_model(files, re.compile(pattern))
    if model_name is not None:
      if model_name in models:
        return models[model_name], is_compressed
    else:
      if models:
        if len(models) > 1:
          raise RuntimeError(f'Multiple models matched in {model_dir}')
        _, model_files = models.popitem()
        return model_files, is_compressed
  raise FileNotFoundError(f'No models matched in {model_dir}')


def get_model_haiku_params(model_dir: pathlib.Path) -> hk.Params:
  """Get the Haiku parameters from a model name."""
  params: dict[str, dict[str, jnp.Array]] = {}
  model_files, is_compressed = select_model_files(model_dir)
  with open_for_reading(model_files, is_compressed) as stream:
    for scope, name, arr in read_records(stream):
      params.setdefault(scope, {})[name] = jnp.array(arr)
  if not params:
    raise FileNotFoundError(f'Model missing from "{model_dir}"')
  return params


================================================
FILE: src/alphafold3/model/pipeline/inter_chain_bonds.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions for handling inter-chain bonds."""

from collections.abc import Collection
import functools
from typing import Final, NamedTuple
from alphafold3 import structure
from alphafold3.constants import chemical_component_sets
from alphafold3.constants import mmcif_names
from alphafold3.model.atom_layout import atom_layout
import numpy as np


BOND_THRESHOLD_GLYCANS_ANGSTROM: Final[float] = 1.7
# See https://pubs.acs.org/doi/10.1021/ja010331r for P-P atom bond distances.
BOND_THRESHOLD_ALL_ANGSTROM: Final[float] = 2.4


class BondAtomArrays(NamedTuple):
  chain_id: np.ndarray
  chain_type: np.ndarray
  res_id: np.ndarray
  res_name: np.ndarray
  atom_name: np.ndarray
  coords: np.ndarray


def _get_bond_atom_arrays(
    struc: structure.Structure, bond_atom_indices: np.ndarray
) -> BondAtomArrays:
  return BondAtomArrays(
      chain_id=struc.chain_id[bond_atom_indices],
      chain_type=struc.chain_type[bond_atom_indices],
      res_id=struc.res_id[bond_atom_indices],
      res_name=struc.res_name[bond_atom_indices],
      atom_name=struc.atom_name[bond_atom_indices],
      coords=struc.coords[..., bond_atom_indices, :],
  )


@functools.lru_cache(maxsize=1)
def get_polymer_ligand_and_ligand_ligand_bonds(
    struct: structure.Structure,
    only_glycan_ligands: bool,
    allow_multiple_bonds_per_atom: bool,
) -> tuple[atom_layout.AtomLayout, atom_layout.AtomLayout]:
  """Return polymer-ligand & ligand-ligand inter-residue bonds.

  Args:
    struct: Structure object to extract bonds from.
    only_glycan_ligands: Whether to only include glycans in ligand category.
    allow_multiple_bonds_per_atom: If not allowed, we greedily choose the first
      bond seen per atom and discard the remaining on each atom..

  Returns:
    polymer_ligand, ligand_ligand_bonds: Each object is an AtomLayout object
    [num_bonds, 2] for the bond-defining atoms.
  """
  if only_glycan_ligands:
    allowed_res_names = list({
        *chemical_component_sets.GLYCAN_OTHER_LIGANDS,
        *chemical_component_sets.GLYCAN_LINKING_LIGANDS,
    })
  else:
    allowed_res_names = None
  all_bonds = get_bond_layout(
      bond_threshold=BOND_THRESHOLD_GLYCANS_ANGSTROM
      if only_glycan_ligands
      else BOND_THRESHOLD_ALL_ANGSTROM,
      struct=struct,
      allowed_chain_types1=list({
          *mmcif_names.LIGAND_CHAIN_TYPES,
          *mmcif_names.POLYMER_CHAIN_TYPES,
      }),
      allowed_chain_types2=list(mmcif_names.LIGAND_CHAIN_TYPES),
      allowed_res_names=allowed_res_names,
      allow_multiple_bonds_per_atom=allow_multiple_bonds_per_atom,
  )
  ligand_ligand_bonds_mask = np.isin(
      all_bonds.chain_type, list(mmcif_names.LIGAND_CHAIN_TYPES)
  )
  polymer_ligand_bonds_mask = np.isin(
      all_bonds.chain_type, list(mmcif_names.POLYMER_CHAIN_TYPES)
  )
  polymer_ligand_bonds_mask = np.logical_and(
      ligand_ligand_bonds_mask.any(axis=1),
      polymer_ligand_bonds_mask.any(axis=1),
  )
  ligand_ligand_bonds = all_bonds[ligand_ligand_bonds_mask.all(axis=1)]
  polymer_ligand_bonds = all_bonds[polymer_ligand_bonds_mask]
  return polymer_ligand_bonds, ligand_ligand_bonds


def _remove_multi_bonds(
    bond_layout: atom_layout.AtomLayout,
) -> atom_layout.AtomLayout:
  """Remove instances greedily."""
  uids = {}
  keep_indx = []
  for chain_id, res_id, atom_name in zip(
      bond_layout.chain_id,
      bond_layout.res_id,
      bond_layout.atom_name,
      strict=True,
  ):
    key1 = (chain_id[0], res_id[0], atom_name[0])
    key2 = (chain_id[1], res_id[1], atom_name[1])
    keep_indx.append(bool(key1 not in uids) and bool(key2 not in uids))
    if key1 not in uids:
      uids[key1] = None
    if key2 not in uids:
      uids[key2] = None
  return bond_layout[np.array(keep_indx, dtype=bool)]


@functools.lru_cache(maxsize=1)
def get_ligand_ligand_bonds(
    struct: structure.Structure,
    only_glycan_ligands: bool,
    allow_multiple_bonds_per_atom: bool = False,
) -> atom_layout.AtomLayout:
  """Return ligand-ligand inter-residue bonds.

  Args:
    struct: Structure object to extract bonds from.
    only_glycan_ligands: Whether to only include glycans in ligand category.
    allow_multiple_bonds_per_atom: If not allowed, we greedily choose the first
      bond seen per atom and discard the remaining on each atom.

  Returns:
    bond_layout: AtomLayout object [num_bonds, 2] for the bond-defining atoms.
  """
  if only_glycan_ligands:
    allowed_res_names = list({
        *chemical_component_sets.GLYCAN_OTHER_LIGANDS,
        *chemical_component_sets.GLYCAN_LINKING_LIGANDS,
    })
  else:
    allowed_res_names = None
  return get_bond_layout(
      bond_threshold=BOND_THRESHOLD_GLYCANS_ANGSTROM
      if only_glycan_ligands
      else BOND_THRESHOLD_ALL_ANGSTROM,
      struct=struct,
      allowed_chain_types1=list(mmcif_names.LIGAND_CHAIN_TYPES),
      allowed_chain_types2=list(mmcif_names.LIGAND_CHAIN_TYPES),
      allowed_res_names=allowed_res_names,
      allow_multiple_bonds_per_atom=allow_multiple_bonds_per_atom,
  )


@functools.lru_cache(maxsize=1)
def get_polymer_ligand_bonds(
    struct: structure.Structure,
    only_glycan_ligands: bool,
    allow_multiple_bonds_per_atom: bool = False,
    bond_threshold: float | None = None,
) -> atom_layout.AtomLayout:
  """Return polymer-ligand interchain bonds.

  Args:
    struct: Structure object to extract bonds from.
    only_glycan_ligands: Whether to only include glycans in ligand category.
    allow_multiple_bonds_per_atom: If not allowed, we greedily choose the first
      bond seen per atom and discard the remaining on each atom.
    bond_threshold: Euclidean distance of max allowed bond.

  Returns:
    bond_layout: AtomLayout object [num_bonds, 2] for the bond-defining atoms.
  """
  if only_glycan_ligands:
    allowed_res_names = list({
        *chemical_component_sets.GLYCAN_OTHER_LIGANDS,
        *chemical_component_sets.GLYCAN_LINKING_LIGANDS,
    })
  else:
    allowed_res_names = None
  if bond_threshold is None:
    if only_glycan_ligands:
      bond_threshold = BOND_THRESHOLD_GLYCANS_ANGSTROM
    else:
      bond_threshold = BOND_THRESHOLD_ALL_ANGSTROM
  return get_bond_layout(
      bond_threshold=bond_threshold,
      struct=struct,
      allowed_chain_types1=list(mmcif_names.POLYMER_CHAIN_TYPES),
      allowed_chain_types2=list(mmcif_names.LIGAND_CHAIN_TYPES),
      allowed_res_names=allowed_res_names,
      allow_multiple_bonds_per_atom=allow_multiple_bonds_per_atom,
  )


def get_bond_layout(
    bond_threshold: float = BOND_THRESHOLD_ALL_ANGSTROM,
    *,
    struct: structure.Structure,
    allowed_chain_types1: Collection[str],
    allowed_chain_types2: Collection[str],
    include_bond_types: Collection[str] = ('covale',),
    allowed_res_names: Collection[str] | None = None,
    allow_multiple_bonds_per_atom: bool,
) -> atom_layout.AtomLayout:
  """Get bond_layout for all bonds between two sets of chain types.

  There is a mask (all_mask) that runs through this script, and each bond pair
  needs to maintain a True across all conditions in order to be preserved at the
  end, otherwise the bond pair has invalidated a condition with a False and is
  removed entirely. Note, we remove oxygen atom bonds as they are an edge case
  that causes issues with scoring, due to multiple waters bonding with single
  residues.

  Args:
    bond_threshold: Maximum bond distance in Angstrom.
    struct: Structure object to extract bonds from.
    allowed_chain_types1: One end of the bonds must be an atom with one of these
      chain types.
    allowed_chain_types2: The other end of the bond must be an atom with one of
      these chain types.
    include_bond_types: Only include bonds with specified type e.g. hydrog,
      metalc, covale, disulf.
    allowed_res_names: Further restricts from chain_types. Either end of the
      bonds must be an atom part of these res_names. If none all will be
      accepted after chain and bond type filtering.
    allow_multiple_bonds_per_atom: If not allowed, we greedily choose the first
      bond seen per atom and discard the remaining on each atom.

  Returns:
    bond_layout: AtomLayout object [num_bonds, 2] for the bond-defining atoms.
  """
  if not struct.bonds:
    return atom_layout.AtomLayout(
        atom_name=np.empty((0, 2), dtype=object),
        res_id=np.empty((0, 2), dtype=int),
        res_name=np.empty((0, 2), dtype=object),
        chain_id=np.empty((0, 2), dtype=object),
        chain_type=np.empty((0, 2), dtype=object),
        atom_element=np.empty((0, 2), dtype=object),
    )
  from_atom_idxs, dest_atom_idxs = struct.bonds.get_atom_indices(
      struct.atom_key
  )
  from_atoms = _get_bond_atom_arrays(struct, from_atom_idxs)
  dest_atoms = _get_bond_atom_arrays(struct, dest_atom_idxs)
  # Chain type
  chain_mask = np.logical_or(
      np.logical_and(
          np.isin(
              from_atoms.chain_type,
              allowed_chain_types1,
          ),
          np.isin(
              dest_atoms.chain_type,
              allowed_chain_types2,
          ),
      ),
      np.logical_and(
          np.isin(
              from_atoms.chain_type,
              allowed_chain_types2,
          ),
          np.isin(
              dest_atoms.chain_type,
              allowed_chain_types1,
          ),
      ),
  )
  if allowed_res_names:
    # Res type
    res_mask = np.logical_or(
        np.isin(from_atoms.res_name, allowed_res_names),
        np.isin(dest_atoms.res_name, allowed_res_names),
    )
    # All mask
    all_mask = np.logical_and(chain_mask, res_mask)
  else:
    all_mask = chain_mask
  # Bond type mask
  type_mask = np.isin(struct.bonds.type, list(include_bond_types))
  np.logical_and(all_mask, type_mask, out=all_mask)
  # Bond length check. Work in square length to avoid taking many square roots.
  bond_length_squared = np.square(from_atoms.coords - dest_atoms.coords).sum(
      axis=1
  )
  bond_threshold_squared = bond_threshold * bond_threshold
  np.logical_and(
      all_mask, bond_length_squared < bond_threshold_squared, out=all_mask
  )
  # Inter-chain and inter-residue bonds for ligands
  ligand_types = list(mmcif_names.LIGAND_CHAIN_TYPES)
  is_ligand = np.logical_or(
      np.isin(
          from_atoms.chain_type,
          ligand_types,
      ),
      np.isin(
          dest_atoms.chain_type,
          ligand_types,
      ),
  )
  res_id_differs = from_atoms.res_id != dest_atoms.res_id
  chain_id_differs = from_atoms.chain_id != dest_atoms.chain_id
  is_inter_res = np.logical_or(res_id_differs, chain_id_differs)
  is_inter_ligand_res = np.logical_and(is_inter_res, is_ligand)
  is_inter_chain_not_ligand = np.logical_and(chain_id_differs, ~is_ligand)
  # If ligand then inter-res & inter-chain bonds, otherwise inter-chain only.
  combined_allowed_bonds = np.logical_or(
      is_inter_chain_not_ligand, is_inter_ligand_res
  )
  np.logical_and(all_mask, combined_allowed_bonds, out=all_mask)
  bond_layout = atom_layout.AtomLayout(
      atom_name=np.stack(
          [
              from_atoms.atom_name[all_mask],
              dest_atoms.atom_name[all_mask],
          ],
          axis=1,
          dtype=object,
      ),
      res_id=np.stack(
          [from_atoms.res_id[all_mask], dest_atoms.res_id[all_mask]],
          axis=1,
          dtype=int,
      ),
      chain_id=np.stack(
          [
              from_atoms.chain_id[all_mask],
              dest_atoms.chain_id[all_mask],
          ],
          axis=1,
          dtype=object,
      ),
  )
  if not allow_multiple_bonds_per_atom:
    bond_layout = _remove_multi_bonds(bond_layout)
  return atom_layout.fill_in_optional_fields(
      bond_layout,
      reference_atoms=atom_layout.atom_layout_from_structure(struct),
  )


================================================
FILE: src/alphafold3/model/pipeline/pipeline.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""The main featurizer."""

import bisect
from collections.abc import Sequence
import datetime
import itertools

from absl import logging
from alphafold3.common import base_config
from alphafold3.common import folding_input
from alphafold3.constants import chemical_components
from alphafold3.model import feat_batch
from alphafold3.model import features
from alphafold3.model.pipeline import inter_chain_bonds
from alphafold3.model.pipeline import structure_cleaning
from alphafold3.structure import chemical_components as struc_chem_comps
import numpy as np


_DETERMINISTIC_FRAMES_RANDOM_SEED = 12312837


def calculate_bucket_size(
    num_tokens: int, buckets: Sequence[int] | None
) -> int:
  """Calculates the bucket size to pad the data to."""
  if buckets is None:
    return num_tokens

  if not buckets:
    raise ValueError('Buckets must be non-empty.')

  if not all(prev < curr for prev, curr in itertools.pairwise(buckets)):
    raise ValueError(
        f'Buckets must be in strictly increasing order. Got {buckets=}.'
    )

  bucket_idx = bisect.bisect_left(buckets, num_tokens)

  if bucket_idx == len(buckets):
    logging.warning(
        'Creating a new bucket of size %d since the input has more tokens than'
        ' the largest bucket size %d. This may trigger a re-compilation of the'
        ' model. Consider additional large bucket sizes to avoid excessive'
        ' re-compilation.',
        num_tokens,
        buckets[-1],
    )
    return num_tokens

  return buckets[bucket_idx]


class NanDataError(Exception):
  """Raised if the data pipeline produces data containing nans."""


class TotalNumResOutOfRangeError(Exception):
  """Raised if total number of residues for all chains outside allowed range."""


class MmcifNumChainsError(Exception):
  """Raised if the mmcif file contains too many / too few chains."""


class WholePdbPipeline:
  """Processes an entire mmcif entity and merges the content."""

  class Config(base_config.BaseConfig):
    """Configuration object for `WholePdbPipeline`.

    Properties:
      max_atoms_per_token: number of atom slots in one token (was called
        num_dense, and semi-hardcoded to 24 before)
      pad_num_chains: Size to pad NUM_CHAINS feature dimensions to, only for
        protein chains.
      buckets: Bucket sizes to pad the data to, to avoid excessive
        re-compilation of the model. If None, calculate the appropriate bucket
        size from the number of tokens. If not None, must be a sequence of at
        least one integer, in strictly increasing order. Will raise an error if
        the number of tokens is more than the largest bucket size.
      max_total_residues: Any mmCIF with more total residues will be rejected.
        If none, then no limit is applied.
      min_total_residues: Any mmCIF with less total residues will be rejected.
      msa_crop_size: Maximum size of MSA to take across all chains.
      max_template_date: Optional max template date to prevent data leakage in
        validation.
      ref_max_modified_date: Optional maximum date that controls whether to
        allow use of model coordinates for a chemical component from the CCD if
        RDKit conformer generation fails and the component does not have ideal
        coordinates set. Only for components that have been released before this
        date the model coordinates can be used as a fallback.
      max_templates: The maximum number of templates to send through the network
        set to 0 to switch off templates.
      filter_clashes: If true then will remove clashing chains.
      filter_crystal_aids: If true ligands in the cryal aid list are removed.
      max_paired_sequence_per_species: The maximum number of sequences per
        species that will be used for MSA pairing.
      drop_ligand_leaving_atoms: Flag for handling leaving atoms for ligands.
      average_num_atoms_per_token: Target average number of atoms per token to
        compute the padding size for flat atoms.
      atom_cross_att_queries_subset_size: queries subset size in atom cross
        attention
      atom_cross_att_keys_subset_size: keys subset size in atom cross attention
      flatten_non_standard_residues: Whether to expand non-standard polymer
        residues into flat-atom format.
      remove_nonsymmetric_bonds: Whether to remove nonsymmetric bonds from
        symmetric polymer chains.
      deterministic_frames: Whether to use fixed-seed reference positions to
        construct deterministic frames.
      resolve_msa_overlaps: Whether to deduplicate unpaired MSA against paired
        MSA. The default behaviour matches the method described in the AlphaFold
        3 paper. Set this to false if providing custom paired MSA using the
        unpaired MSA field to keep it exactly as is as deduplication against
        the paired MSA could break the manually crafted pairing between MSA
        sequences.
    """

    max_atoms_per_token: int = 24
    pad_num_chains: int = 1000
    buckets: list[int] | None = None
    max_total_residues: int | None = None
    min_total_residues: int | None = None
    msa_crop_size: int = 16384
    max_template_date: datetime.date | None = None
    ref_max_modified_date: datetime.date | None = None
    max_templates: int = 4
    filter_clashes: bool = False
    filter_crystal_aids: bool = False
    max_paired_sequence_per_species: int = 600
    drop_ligand_leaving_atoms: bool = True
    average_num_atoms_per_token: int = 24
    atom_cross_att_queries_subset_size: int = 32
    atom_cross_att_keys_subset_size: int = 128
    flatten_non_standard_residues: bool = True
    remove_nonsymmetric_bonds: bool = False
    deterministic_frames: bool = True
    conformer_max_iterations: int | None = None
    resolve_msa_overlaps: bool = True

  def __init__(self, *, config: Config):
    """Initializes WholePdb data pipeline.

    Args:
      config: Pipeline configuration.
    """
    self._config = config

  def process_item(
      self,
      fold_input: folding_input.Input,
      random_state: np.random.RandomState,
      ccd: chemical_components.Ccd,
      random_seed: int | None = None,
  ) -> features.BatchDict:
    """Takes requests from in_queue, adds (key, serialized ex) to out_queue."""
    if random_seed is None:
      random_seed = random_state.randint(2**31)

    random_state = np.random.RandomState(seed=random_seed)

    logging_name = f'{fold_input.name}, random_seed={random_seed}'
    logging.info('processing %s', logging_name)
    struct = fold_input.to_structure(ccd=ccd)

    # Clean structure.
    cleaned_struc, cleaning_metadata = structure_cleaning.clean_structure(
        struct,
        ccd=ccd,
        drop_non_standard_atoms=True,
        drop_missing_sequence=True,
        filter_clashes=self._config.filter_clashes,
        filter_crystal_aids=self._config.filter_crystal_aids,
        filter_waters=True,
        filter_hydrogens=True,
        filter_leaving_atoms=self._config.drop_ligand_leaving_atoms,
        only_glycan_ligands_for_leaving_atoms=True,
        covalent_bonds_only=True,
        remove_polymer_polymer_bonds=True,
        remove_bad_bonds=True,
        remove_nonsymmetric_bonds=self._config.remove_nonsymmetric_bonds,
    )

    num_clashing_chains_removed = cleaning_metadata[
        'num_clashing_chains_removed'
    ]

    if num_clashing_chains_removed:
      logging.info(
          'Removed %d clashing chains from %s',
          num_clashing_chains_removed,
          logging_name,
      )

    # No chains after fixes
    if cleaned_struc.num_chains == 0:
      raise MmcifNumChainsError(f'{logging_name}: No chains in structure!')

    polymer_ligand_bonds, ligand_ligand_bonds = (
        inter_chain_bonds.get_polymer_ligand_and_ligand_ligand_bonds(
            cleaned_struc,
            only_glycan_ligands=False,
            allow_multiple_bonds_per_atom=True,
        )
    )

    # If empty replace with None as this causes errors downstream.
    if ligand_ligand_bonds and not ligand_ligand_bonds.atom_name.size:
      ligand_ligand_bonds = None
    if polymer_ligand_bonds and not polymer_ligand_bonds.atom_name.size:
      polymer_ligand_bonds = None

    # Create the flat output AtomLayout
    empty_output_struc, flat_output_layout = (
        structure_cleaning.create_empty_output_struc_and_layout(
            struc=cleaned_struc,
            ccd=ccd,
            polymer_ligand_bonds=polymer_ligand_bonds,
            ligand_ligand_bonds=ligand_ligand_bonds,
            drop_ligand_leaving_atoms=self._config.drop_ligand_leaving_atoms,
        )
    )

    # Select the tokens for Evoformer.
    # Each token (e.g. a residue) is encoded as one representative atom. This
    # is flexible enough to allow the 1-token-per-atom ligand representation
    # in the future.
    all_tokens, all_token_atoms_layout, standard_token_idxs = (
        features.tokenizer(
            flat_output_layout,
            ccd=ccd,
            max_atoms_per_token=self._config.max_atoms_per_token,
            flatten_non_standard_residues=self._config.flatten_non_standard_residues,
            logging_name=logging_name,
        )
    )
    total_tokens = len(all_tokens.atom_name)
    if (
        self._config.max_total_residues
        and total_tokens > self._config.max_total_residues
    ):
      raise TotalNumResOutOfRangeError(
          'Total Number of Residues > max_total_residues: '
          f'({total_tokens} > {self._config.max_total_residues})'
      )

    if (
        self._config.min_total_residues
        and total_tokens < self._config.min_total_residues
    ):
      raise TotalNumResOutOfRangeError(
          'Total Number of Residues < min_total_residues: '
          f'({total_tokens} < {self._config.min_total_residues})'
      )

    logging.info(
        'Calculating bucket size for input with %d tokens.', total_tokens
    )
    padded_token_length = calculate_bucket_size(
        total_tokens, self._config.buckets
    )
    logging.info(
        'Got bucket size %d for input with %d tokens, resulting in %d padded'
        ' tokens.',
        padded_token_length,
        total_tokens,
        padded_token_length - total_tokens,
    )

    # Padding shapes for all features.
    num_atoms = padded_token_length * self._config.average_num_atoms_per_token
    # Round up to next multiple of subset size.
    num_atoms = int(
        np.ceil(num_atoms / self._config.atom_cross_att_queries_subset_size)
        * self._config.atom_cross_att_queries_subset_size
    )
    padding_shapes = features.PaddingShapes(
        num_tokens=padded_token_length,
        msa_size=self._config.msa_crop_size,
        num_chains=self._config.pad_num_chains,
        num_templates=self._config.max_templates,
        num_atoms=num_atoms,
    )

    # Create the atom layouts for flat atom cross attention
    batch_atom_cross_att = features.AtomCrossAtt.compute_features(
        all_token_atoms_layout=all_token_atoms_layout,
        queries_subset_size=self._config.atom_cross_att_queries_subset_size,
        keys_subset_size=self._config.atom_cross_att_keys_subset_size,
        padding_shapes=padding_shapes,
    )

    # Extract per-token features
    batch_token_features = features.TokenFeatures.compute_features(
        all_tokens=all_tokens,
        padding_shapes=padding_shapes,
    )

    # Create reference structure features
    chemical_components_data = struc_chem_comps.populate_missing_ccd_data(
        ccd=ccd,
        chemical_components_data=cleaned_struc.chemical_components_data,
        populate_pdbx_smiles=True,
    )

    # Add smiles info to empty_output_struc.
    empty_output_struc = empty_output_struc.copy_and_update_globals(
        chemical_components_data=chemical_components_data
    )
    # Create layouts and store structures for model output conversion.
    batch_convert_model_output = features.ConvertModelOutput.compute_features(
        all_token_atoms_layout=all_token_atoms_layout,
        padding_shapes=padding_shapes,
        cleaned_struc=cleaned_struc,
        flat_output_layout=flat_output_layout,
        empty_output_struc=empty_output_struc,
        polymer_ligand_bonds=polymer_ligand_bonds,
        ligand_ligand_bonds=ligand_ligand_bonds,
    )

    # Create the PredictedStructureInfo
    batch_predicted_structure_info = (
        features.PredictedStructureInfo.compute_features(
            all_tokens=all_tokens,
            all_token_atoms_layout=all_token_atoms_layout,
            padding_shapes=padding_shapes,
        )
    )

    # Create MSA features
    batch_msa = features.MSA.compute_features(
        all_tokens=all_tokens,
        standard_token_idxs=standard_token_idxs,
        padding_shapes=padding_shapes,
        fold_input=fold_input,
        logging_name=logging_name,
        max_paired_sequence_per_species=self._config.max_paired_sequence_per_species,
        resolve_msa_overlaps=self._config.resolve_msa_overlaps,
    )

    # Create template features
    batch_templates = features.Templates.compute_features(
        all_tokens=all_tokens,
        standard_token_idxs=standard_token_idxs,
        padding_shapes=padding_shapes,
        fold_input=fold_input,
        max_templates=self._config.max_templates,
        logging_name=logging_name,
    )

    ref_max_modified_date = self._config.ref_max_modified_date
    conformer_max_iterations = self._config.conformer_max_iterations
    batch_ref_structure, ligand_ligand_bonds = (
        features.RefStructure.compute_features(
            all_token_atoms_layout=all_token_atoms_layout,
            ccd=ccd,
            padding_shapes=padding_shapes,
            chemical_components_data=chemical_components_data,
            random_state=random_state,
            ref_max_modified_date=ref_max_modified_date,
            conformer_max_iterations=conformer_max_iterations,
            ligand_ligand_bonds=ligand_ligand_bonds,
        )
    )
    deterministic_ref_structure = None
    if self._config.deterministic_frames:
      deterministic_ref_structure, _ = features.RefStructure.compute_features(
          all_token_atoms_layout=all_token_atoms_layout,
          ccd=ccd,
          padding_shapes=padding_shapes,
          chemical_components_data=chemical_components_data,
          random_state=(
              np.random.RandomState(_DETERMINISTIC_FRAMES_RANDOM_SEED)
          ),
          ref_max_modified_date=ref_max_modified_date,
          conformer_max_iterations=None,
          ligand_ligand_bonds=ligand_ligand_bonds,
      )

    # Create ligand-polymer bond features.
    polymer_ligand_bond_info = features.PolymerLigandBondInfo.compute_features(
        all_tokens=all_tokens,
        all_token_atoms_layout=all_token_atoms_layout,
        bond_layout=polymer_ligand_bonds,
        padding_shapes=padding_shapes,
    )
    # Create ligand-ligand bond features.
    ligand_ligand_bond_info = features.LigandLigandBondInfo.compute_features(
        all_tokens,
        ligand_ligand_bonds,
        padding_shapes,
    )

    # Create the Pseudo-beta layout for distogram head and distance error head.
    batch_pseudo_beta_info = features.PseudoBetaInfo.compute_features(
        all_token_atoms_layout=all_token_atoms_layout,
        ccd=ccd,
        padding_shapes=padding_shapes,
        logging_name=logging_name,
    )

    # Frame construction.
    batch_frames = features.Frames.compute_features(
        all_tokens=all_tokens,
        all_token_atoms_layout=all_token_atoms_layout,
        ref_structure=(
            deterministic_ref_structure
            if self._config.deterministic_frames
            else batch_ref_structure
        ),
        padding_shapes=padding_shapes,
    )

    # Assemble the Batch object.
    batch = feat_batch.Batch(
        msa=batch_msa,
        templates=batch_templates,
        token_features=batch_token_features,
        ref_structure=batch_ref_structure,
        predicted_structure_info=batch_predicted_structure_info,
        polymer_ligand_bond_info=polymer_ligand_bond_info,
        ligand_ligand_bond_info=ligand_ligand_bond_info,
        pseudo_beta_info=batch_pseudo_beta_info,
        atom_cross_att=batch_atom_cross_att,
        convert_model_output=batch_convert_model_output,
        frames=batch_frames,
    )

    np_example = batch.as_data_dict()
    if 'num_iter_recycling' in np_example:
      del np_example['num_iter_recycling']  # that does not belong here

    for name, value in np_example.items():
      if (
          value.dtype.kind not in {'U', 'S'}
          and value.dtype.name != 'object'
          and np.isnan(np.sum(value))
      ):
        raise NanDataError(
            f'Data pipeline output for {logging_name=} contains NaNs. NaN'
            f' feature: {name}'
        )

    return np_example


================================================
FILE: src/alphafold3/model/pipeline/structure_cleaning.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Prepare PDB structure for training or inference."""

from typing import Any

from absl import logging
from alphafold3 import structure
from alphafold3.constants import chemical_component_sets
from alphafold3.constants import chemical_components
from alphafold3.constants import mmcif_names
from alphafold3.model.atom_layout import atom_layout
from alphafold3.model.pipeline import inter_chain_bonds
from alphafold3.model.scoring import covalent_bond_cleaning
from alphafold3.structure import sterics
import numpy as np


def _get_leaving_atom_mask(
    struc: structure.Structure,
    polymer_ligand_bonds: atom_layout.AtomLayout | None,
    ligand_ligand_bonds: atom_layout.AtomLayout | None,
    chain_id: str,
    chain_type: str,
    res_id: int,
    res_name: str,
) -> np.ndarray:
  """Updates a drop_leaving_atoms mask with new leaving atom locations."""
  bonded_atoms = atom_layout.get_bonded_atoms(
      polymer_ligand_bonds,
      ligand_ligand_bonds,
      res_id,
      chain_id,
  )
  # Connect the amino-acids, i.e. remove OXT, HXT and H2.
  drop_atoms = atom_layout.get_link_drop_atoms(
      res_name=res_name,
      chain_type=chain_type,
      is_start_terminus=False,
      is_end_terminus=False,
      bonded_atoms=bonded_atoms,
      drop_ligand_leaving_atoms=True,
  )
  # Default mask where everything is false, which equates to being kept.
  drop_atom_filter_atoms = struc.chain_id != struc.chain_id
  for drop_atom in drop_atoms:
    drop_atom_filter_atom = np.logical_and(
        np.logical_and(
            struc.atom_name == drop_atom,
            struc.chain_id == chain_id,
        ),
        struc.res_id == res_id,
    )
    drop_atom_filter_atoms = np.logical_or(
        drop_atom_filter_atoms, drop_atom_filter_atom
    )
  return drop_atom_filter_atoms


def clean_structure(
    struc: structure.Structure,
    ccd: chemical_components.Ccd,
    *,
    drop_missing_sequence: bool,
    filter_clashes: bool,
    drop_non_standard_atoms: bool,
    filter_crystal_aids: bool,
    filter_waters: bool,
    filter_hydrogens: bool,
    filter_leaving_atoms: bool,
    only_glycan_ligands_for_leaving_atoms: bool,
    covalent_bonds_only: bool,
    remove_polymer_polymer_bonds: bool,
    remove_bad_bonds: bool,
    remove_nonsymmetric_bonds: bool,
) -> tuple[structure.Structure, dict[str, Any]]:
  """Cleans structure.

  Args:
    struc: Structure to clean.
    ccd: The chemical components dictionary.
    drop_missing_sequence: Whether to drop chains without specified sequences.
    filter_clashes: Whether to drop clashing chains.
    drop_non_standard_atoms: Whether to drop non CCD standard atoms.
    filter_crystal_aids: Whether to drop ligands in the crystal aid set.
    filter_waters: Whether to drop water chains.
    filter_hydrogens: Whether to drop hyrdogen atoms.
    filter_leaving_atoms: Whether to drop leaving atoms based on heuristics.
    only_glycan_ligands_for_leaving_atoms: Whether to only include glycan
      ligands when filtering leaving atoms.
    covalent_bonds_only: Only include covalent bonds.
    remove_polymer_polymer_bonds: Remove polymer-polymer bonds.
    remove_bad_bonds: Whether to remove badly bonded ligands.
    remove_nonsymmetric_bonds: Whether to remove nonsymmetric polymer-ligand
      bonds from symmetric polymer chains.

  Returns:
    Tuple of structure and metadata dict. The metadata dict has
    information about what was cleaned from the original.
  """

  metadata = {}
  # Crop crystallization aids.
  if (
      filter_crystal_aids
      and struc.structure_method in mmcif_names.CRYSTALLIZATION_METHODS
  ):
    struc = struc.filter_out(
        res_name=chemical_component_sets.COMMON_CRYSTALLIZATION_AIDS
    )

  # Drop chains without specified sequences.
  if drop_missing_sequence:
    chains_with_unk_sequence = struc.find_chains_with_unknown_sequence()
    num_with_unk_sequence = len(chains_with_unk_sequence)
    if chains_with_unk_sequence:
      struc = struc.filter_out(chain_id=chains_with_unk_sequence)
  else:
    num_with_unk_sequence = 0
  metadata['num_with_unk_sequence'] = num_with_unk_sequence

  # Remove intersecting chains.
  if filter_clashes and struc.num_chains > 1:
    clashing_chains = sterics.find_clashing_chains(struc)
    if clashing_chains:
      struc = struc.filter_out(chain_id=clashing_chains)
  else:
    clashing_chains = []
  metadata['num_clashing_chains_removed'] = len(clashing_chains)
  metadata['chains_removed'] = clashing_chains

  # Drop non-standard atoms
  if drop_non_standard_atoms:
    struc = struc.drop_non_standard_atoms(
        ccd=ccd, drop_unk=False, drop_non_ccd=False
    )

  # Sort chains in "reverse-spreadsheet" order.
  struc = struc.with_sorted_chains

  if filter_hydrogens:
    struc = struc.without_hydrogen()

  if filter_waters:
    struc = struc.filter_out(chain_type=mmcif_names.WATER)

  if filter_leaving_atoms:
    drop_leaving_atoms_all = struc.chain_id != struc.chain_id
    polymer_ligand_bonds = inter_chain_bonds.get_polymer_ligand_bonds(
        struc,
        only_glycan_ligands=only_glycan_ligands_for_leaving_atoms,
    )
    ligand_ligand_bonds = inter_chain_bonds.get_ligand_ligand_bonds(
        struc,
        only_glycan_ligands=only_glycan_ligands_for_leaving_atoms,
    )
    all_glycans = {
        *chemical_component_sets.GLYCAN_OTHER_LIGANDS,
        *chemical_component_sets.GLYCAN_LINKING_LIGANDS,
    }
    # If only glycan ligands and no O1 atoms, we can do parallel drop.
    if (
        only_glycan_ligands_for_leaving_atoms
        and (not (ligand_ligand_bonds.atom_name == 'O1').any())
        and (not (polymer_ligand_bonds.atom_name == 'O1').any())
    ):
      drop_leaving_atoms_all = np.logical_and(
          np.isin(struc.atom_name, 'O1'),
          np.isin(struc.res_name, list(all_glycans)),
      )
    else:
      substruct = struc.group_by_residue
      glycan_mask = np.isin(substruct.res_name, list(all_glycans))
      substruct = substruct.filter(glycan_mask)
      # We need to iterate over all glycan residues for this.
      for res in substruct.iter_residues():
        # Only need to do drop leaving atoms for glycans depending on bonds.
        if (res_name := res['res_name']) in all_glycans:
          drop_atom_filter = _get_leaving_atom_mask(
              struc=struc,
              polymer_ligand_bonds=polymer_ligand_bonds,
              ligand_ligand_bonds=ligand_ligand_bonds,
              chain_id=res['chain_id'],
              chain_type=res['chain_type'],
              res_id=res['res_id'],
              res_name=res_name,
          )
          drop_leaving_atoms_all = np.logical_or(
              drop_leaving_atoms_all, drop_atom_filter
          )

    num_atoms_before = struc.num_atoms
    struc = struc.filter_out(drop_leaving_atoms_all)
    num_atoms_after = struc.num_atoms

    if num_atoms_before > num_atoms_after:
      logging.error(
          'Dropped %s atoms from GT struc: chain_id %s res_id %s res_name %s',
          num_atoms_before - num_atoms_after,
          struc.chain_id,
          struc.res_id,
          struc.res_name,
      )

  # Can filter by bond type without having to iterate over bonds.
  if struc.bonds and covalent_bonds_only:
    is_covalent = np.isin(struc.bonds.type, ['covale'])
    if sum(is_covalent) > 0:
      new_bonds = struc.bonds[is_covalent]
    else:
      new_bonds = structure.Bonds.make_empty()
    struc = struc.copy_and_update(bonds=new_bonds)

  # Other bond filters require iterating over individual bonds.
  if struc.bonds and (remove_bad_bonds or remove_polymer_polymer_bonds):
    include_bond = []
    num_pp_bonds = 0
    num_bad_bonds = 0
    for bond in struc.iter_bonds():
      dest_atom = bond.dest_atom
      from_atom = bond.from_atom
      if remove_polymer_polymer_bonds:
        if (
            from_atom['chain_type'] in mmcif_names.POLYMER_CHAIN_TYPES
            and dest_atom['chain_type'] in mmcif_names.POLYMER_CHAIN_TYPES
        ):
          num_pp_bonds += 1
          include_bond.append(False)
          continue
      if remove_bad_bonds:
        dest_coords = np.array(
            [dest_atom['atom_x'], dest_atom['atom_y'], dest_atom['atom_z']]
        )
        from_coords = np.array(
            [from_atom['atom_x'], from_atom['atom_y'], from_atom['atom_z']]
        )
        squared_dist = np.sum(np.square(dest_coords - from_coords))
        squared_threshold = 2.4 * 2.4
        if squared_dist > squared_threshold:
          num_bad_bonds += 1
          include_bond.append(False)
          continue
      include_bond.append(True)
    if sum(include_bond) < len(struc.bonds):
      logging.info(
          'Reducing number of bonds for %s from %s to %s, of which %s are'
          ' polymer-polymer bonds and %s are bad bonds.',
          struc.name,
          len(struc.bonds),
          sum(include_bond),
          num_pp_bonds,
          num_bad_bonds,
      )
      if sum(include_bond) > 0:
        # Need to index bonds with bond keys or arrays of bools with same length
        # as num bonds. In this case, we use array of bools (as elsewhere in the
        # cleaning code).
        new_bonds = struc.bonds[np.array(include_bond, dtype=bool)]
      else:
        new_bonds = structure.Bonds.make_empty()
      struc = struc.copy_and_update(bonds=new_bonds)

  if struc.bonds and remove_nonsymmetric_bonds:
    # Check for asymmetric polymer-ligand bonds and remove if these exist.
    polymer_ligand_bonds = inter_chain_bonds.get_polymer_ligand_bonds(
        struc,
        only_glycan_ligands=False,
    )
    if polymer_ligand_bonds:
      if covalent_bond_cleaning.has_nonsymmetric_bonds_on_symmetric_polymer_chains(
          struc, polymer_ligand_bonds
      ):
        from_atom_idxs, dest_atom_idxs = struc.bonds.get_atom_indices(
            struc.atom_key
        )
        poly_chain_types = list(mmcif_names.POLYMER_CHAIN_TYPES)
        is_polymer_bond = np.logical_or(
            np.isin(struc.chain_type[from_atom_idxs], poly_chain_types),
            np.isin(struc.chain_type[dest_atom_idxs], poly_chain_types),
        )
        struc = struc.copy_and_update(bonds=struc.bonds[~is_polymer_bond])

  return struc, metadata


def create_empty_output_struc_and_layout(
    struc: structure.Structure,
    ccd: chemical_components.Ccd,
    *,
    with_hydrogens: bool = False,
    skip_unk: bool = False,
    polymer_ligand_bonds: atom_layout.AtomLayout | None = None,
    ligand_ligand_bonds: atom_layout.AtomLayout | None = None,
    drop_ligand_leaving_atoms: bool = False,
) -> tuple[structure.Structure, atom_layout.AtomLayout]:
  """Make zero-coordinate structure from all physical residues.

  Args:
    struc: Structure object.
    ccd: The chemical components dictionary.
    with_hydrogens: Whether to keep hydrogen atoms in structure.
    skip_unk: Whether to remove unknown residues from structure.
    polymer_ligand_bonds: Bond information for polymer-ligand pairs.
    ligand_ligand_bonds: Bond information for ligand-ligand pairs.
    drop_ligand_leaving_atoms: Flag for handling leaving atoms for ligands.

  Returns:
    Tuple of structure with all bonds, physical residues and coordinates set to
    0 and a flat atom layout of empty structure.
  """
  bonded_atom_pairs = []
  if polymer_ligand_bonds:
    for chain_ids, res_ids, atom_names in zip(
        polymer_ligand_bonds.chain_id,
        polymer_ligand_bonds.res_id,
        polymer_ligand_bonds.atom_name,
        strict=True,
    ):
      bonded_atom_pairs.append((
          (chain_ids[0], res_ids[0], atom_names[0]),
          (chain_ids[1], res_ids[1], atom_names[1]),
      ))
  if ligand_ligand_bonds:
    for chain_ids, res_ids, atom_names in zip(
        ligand_ligand_bonds.chain_id,
        ligand_ligand_bonds.res_id,
        ligand_ligand_bonds.atom_name,
        strict=True,
    ):
      bonded_atom_pairs.append((
          (chain_ids[0], res_ids[0], atom_names[0]),
          (chain_ids[1], res_ids[1], atom_names[1]),
      ))
  residues = atom_layout.residues_from_structure(
      struc, include_missing_residues=True
  )

  flat_output_layout = atom_layout.make_flat_atom_layout(
      residues,
      ccd=ccd,
      with_hydrogens=with_hydrogens,
      skip_unk_residues=skip_unk,
      polymer_ligand_bonds=polymer_ligand_bonds,
      ligand_ligand_bonds=ligand_ligand_bonds,
      drop_ligand_leaving_atoms=drop_ligand_leaving_atoms,
  )

  empty_output_struc = atom_layout.make_structure(
      flat_layout=flat_output_layout,
      atom_coords=np.zeros((flat_output_layout.shape[0], 3)),
      name=struc.name,
      atom_b_factors=None,
      all_physical_residues=residues,
  )
  if bonded_atom_pairs:
    empty_output_struc = empty_output_struc.add_bonds(
        bonded_atom_pairs, bond_type=mmcif_names.COVALENT_BOND
    )

  return empty_output_struc, flat_output_layout


================================================
FILE: src/alphafold3/model/post_processing.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Post-processing utilities for AlphaFold inference results."""

import dataclasses
import datetime
import os

from alphafold3 import version
from alphafold3.model import confidence_types
from alphafold3.model import mmcif_metadata
from alphafold3.model import model
import numpy as np
import zstandard


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class ProcessedInferenceResult:
  """Stores attributes of a processed inference result.

  Attributes:
    cif: CIF file containing an inference result.
    mean_confidence_1d: Mean 1D confidence calculated from confidence_1d.
    ranking_score: Ranking score extracted from CIF metadata.
    structure_confidence_summary_json: Content of JSON file with structure
      confidences summary calculated from CIF file.
    structure_full_data_json: Content of JSON file with structure full
      confidences calculated from CIF file.
    model_id: Identifier of the model that produced the inference result.
  """

  cif: bytes
  mean_confidence_1d: float
  ranking_score: float
  structure_confidence_summary_json: bytes
  structure_full_data_json: bytes
  model_id: bytes


def post_process_inference_result(
    inference_result: model.InferenceResult,
) -> ProcessedInferenceResult:
  """Returns cif, confidence_1d_json, confidence_2d_json, mean_confidence_1d, and ranking confidence."""

  # Add mmCIF metadata fields.
  timestamp = datetime.datetime.now().isoformat(sep=' ', timespec='seconds')
  cif_with_metadata = mmcif_metadata.add_metadata_to_mmcif(
      old_cif=inference_result.predicted_structure.to_mmcif_dict(),
      version=f'{version.__version__} @ {timestamp}',
      model_id=inference_result.model_id,
  )
  cif = mmcif_metadata.add_legal_comment(cif_with_metadata.to_string())
  cif = cif.encode('utf-8')
  confidence_1d = confidence_types.AtomConfidence.from_inference_result(
      inference_result
  )
  mean_confidence_1d = np.mean(confidence_1d.confidence)
  structure_confidence_summary_json = (
      confidence_types.StructureConfidenceSummary.from_inference_result(
          inference_result
      )
      .to_json()
      .encode('utf-8')
  )
  structure_full_data_json = (
      confidence_types.StructureConfidenceFull.from_inference_result(
          inference_result
      )
      .to_json()
      .encode('utf-8')
  )
  return ProcessedInferenceResult(
      cif=cif,
      mean_confidence_1d=mean_confidence_1d,
      ranking_score=float(inference_result.metadata['ranking_score']),
      structure_confidence_summary_json=structure_confidence_summary_json,
      structure_full_data_json=structure_full_data_json,
      model_id=inference_result.model_id,
  )


def write_output(
    inference_result: model.InferenceResult,
    output_dir: os.PathLike[str] | str,
    terms_of_use: str | None = None,
    name: str | None = None,
    compress: bool = False,
) -> None:
  """Writes processed inference result to a directory."""
  processed_result = post_process_inference_result(inference_result)

  prefix = f'{name}_' if name is not None else ''

  if compress:
    opener = zstandard.open
    path_transform = lambda path: f'{path}.zst'
  else:
    opener = open
    path_transform = lambda path: path

  mmcif_path = os.path.join(output_dir, f'{prefix}model.cif')
  with opener(path_transform(mmcif_path), 'wb') as f:
    f.write(processed_result.cif)

  full_confidences_path = os.path.join(output_dir, f'{prefix}confidences.json')
  with opener(path_transform(full_confidences_path), 'wb') as f:
    f.write(processed_result.structure_full_data_json)

  summary_confidences_path = os.path.join(
      output_dir, f'{prefix}summary_confidences.json'
  )
  with open(summary_confidences_path, 'wb') as f:
    f.write(processed_result.structure_confidence_summary_json)

  if terms_of_use is not None:
    with open(os.path.join(output_dir, 'TERMS_OF_USE.md'), 'wt') as f:
      f.write(terms_of_use)


def write_embeddings(
    embeddings: dict[str, np.ndarray],
    output_dir: os.PathLike[str] | str,
    name: str | None = None,
) -> None:
  """Writes embeddings to a directory."""
  prefix = f'{name}_' if name is not None else ''

  with open(os.path.join(output_dir, f'{prefix}embeddings.npz'), 'wb') as f:
    np.savez_compressed(f, **embeddings)


================================================
FILE: src/alphafold3/model/protein_data_processing.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Process Structure Data."""

from alphafold3.constants import atom_types
from alphafold3.constants import residue_names
from alphafold3.constants import side_chains
import numpy as np


NUM_DENSE = atom_types.DENSE_ATOM_NUM
NUM_AA = len(residue_names.PROTEIN_TYPES)
NUM_AA_WITH_UNK_AND_GAP = len(
    residue_names.PROTEIN_TYPES_ONE_LETTER_WITH_UNKNOWN_AND_GAP
)
NUM_RESTYPES_WITH_UNK_AND_GAP = (
    residue_names.POLYMER_TYPES_NUM_WITH_UNKNOWN_AND_GAP
)


def _make_restype_rigidgroup_dense_atom_idx():
  """Create Mapping from rigid_groups to dense_atom indices."""
  # Create an array with the atom names.
  # shape (num_restypes, num_rigidgroups, 3_atoms):
  # (31, 8, 3)
  base_atom_indices = np.zeros(
      (NUM_RESTYPES_WITH_UNK_AND_GAP, 8, 3), dtype=np.int32
  )

  # 4,5,6,7: 'chi1,2,3,4-group'
  for restype, restype_letter in enumerate(
      residue_names.PROTEIN_TYPES_ONE_LETTER
  ):
    resname = residue_names.PROTEIN_COMMON_ONE_TO_THREE[restype_letter]

    dense_atom_names = atom_types.ATOM14[resname]
    # 0: backbone frame
    base_atom_indices[restype, 0, :] = [
        dense_atom_names.index(atom) for atom in ['C', 'CA', 'N']
    ]

    # 3: 'psi-group'
    base_atom_indices[restype, 3, :] = [
        dense_atom_names.index(atom) for atom in ['CA', 'C', 'O']
    ]
    for chi_idx in range(4):
      if side_chains.CHI_ANGLES_MASK[restype][chi_idx]:
        atom_names = side_chains.CHI_ANGLES_ATOMS[resname][chi_idx]
        base_atom_indices[restype, chi_idx + 4, :] = [
            dense_atom_names.index(atom) for atom in atom_names[1:]
        ]
  dense_atom_names = atom_types.DENSE_ATOM['A']
  nucleic_rigid_atoms = [
      dense_atom_names.index(atom) for atom in ["C1'", "C3'", "C4'"]
  ]
  for nanum, _ in enumerate(residue_names.NUCLEIC_TYPES):
    # 0: backbone frame only.
    # we have aa + unk + gap, so we want to start after those
    resnum = nanum + NUM_AA_WITH_UNK_AND_GAP
    base_atom_indices[resnum, 0, :] = nucleic_rigid_atoms

  return base_atom_indices


RESTYPE_RIGIDGROUP_DENSE_ATOM_IDX = _make_restype_rigidgroup_dense_atom_idx()


def _make_restype_pseudobeta_idx():
  """Returns indices of residue's pseudo-beta."""
  restype_pseudobeta_index = np.zeros(
      (NUM_RESTYPES_WITH_UNK_AND_GAP,), dtype=np.int32
  )
  for restype, restype_letter in enumerate(
      residue_names.PROTEIN_TYPES_ONE_LETTER
  ):
    restype_name = residue_names.PROTEIN_COMMON_ONE_TO_THREE[restype_letter]
    atom_names = list(atom_types.ATOM14[restype_name])
    if restype_name in {'GLY'}:
      restype_pseudobeta_index[restype] = atom_names.index('CA')
    else:
      restype_pseudobeta_index[restype] = atom_names.index('CB')
  for nanum, resname in enumerate(residue_names.NUCLEIC_TYPES):
    atom_names = list(atom_types.DENSE_ATOM[resname])
    # 0: backbone frame only.
    # we have aa + unk , so we want to start after those
    restype = nanum + NUM_AA_WITH_UNK_AND_GAP
    if resname in {'A', 'G', 'DA', 'DG'}:
      restype_pseudobeta_index[restype] = atom_names.index('C4')
    else:
      restype_pseudobeta_index[restype] = atom_names.index('C2')
  return restype_pseudobeta_index


RESTYPE_PSEUDOBETA_INDEX = _make_restype_pseudobeta_idx()


def _make_aatype_dense_atom_to_atom37():
  """Map from dense_atom to atom37 per residue type."""
  restype_dense_atom_to_atom37 = []  # mapping (restype, dense_atom) --> atom37
  for rt in residue_names.PROTEIN_TYPES_ONE_LETTER:
    atom_names = list(
        atom_types.ATOM14_PADDED[residue_names.PROTEIN_COMMON_ONE_TO_THREE[rt]]
    )
    atom_names.extend([''] * (NUM_DENSE - len(atom_names)))
    restype_dense_atom_to_atom37.append(
        [(atom_types.ATOM37_ORDER[name] if name else 0) for name in atom_names]
    )
  # Add dummy mapping for restype 'UNK', '-' (gap), and nucleics [but not DN].
  for _ in range(2 + len(residue_names.NUCLEIC_TYPES_WITH_UNKNOWN)):
    restype_dense_atom_to_atom37.append([0] * NUM_DENSE)

  restype_dense_atom_to_atom37 = np.array(
      restype_dense_atom_to_atom37, dtype=np.int32
  )
  return restype_dense_atom_to_atom37


PROTEIN_AATYPE_DENSE_ATOM_TO_ATOM37 = _make_aatype_dense_atom_to_atom37()


================================================
FILE: src/alphafold3/model/scoring/alignment.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Alignment based metrics."""

import numpy as np


def transform_ls(
    x: np.ndarray,
    b: np.ndarray,
    *,
    allow_reflection: bool = False,
) -> np.ndarray:
  """Find the least squares best fit rotation between two sets of N points.

  Solve Ax = b for A. Where A is the transform rotating x^T into b^T.

  Args:
    x: NxD numpy array of coordinates. Usually dimension D is 3.
    b: NxD numpy array of coordinates. Usually dimension D is 3.
    allow_reflection: Whether the returned transformation can reflect as well as
      rotate.

  Returns:
    Matrix A transforming x into b, i.e. s.t. Ax^T = b^T.
  """
  assert x.shape[1] >= b.shape[1]
  assert b.shape[0] == x.shape[0], '%d, %d' % (b.shape[0], x.shape[0])
  # First postmultiply by x.;
  # Axx^t = b x^t
  bxt = np.dot(b.transpose(), x) / b.shape[0]

  u, _, v = np.linalg.svd(bxt)

  r = np.dot(u, v)
  if not allow_reflection:
    flip = np.ones((v.shape[1], 1))
    flip[v.shape[1] - 1, 0] = np.sign(np.linalg.det(r))
    r = np.dot(u, v * flip)

  return r


def align(
    *,
    x: np.ndarray,
    y: np.ndarray,
    x_indices: np.ndarray,
    y_indices: np.ndarray,
) -> np.ndarray:
  """Align x to y considering only included_idxs.

  Args:
    x: NxD np array of coordinates.
    y: NxD np array of coordinates.
    x_indices: An np array of indices for `x` that will be used in the
      alignment. Must be of the same length as `y_included_idxs`.
    y_indices: An np array of indices for `y` that will be used in the
      alignment. Must be of the same length as `x_included_idxs`.

  Returns:
    NxD np array of points obtained by applying a rigid transformation to x.
    These points are aligned to y and the alignment is the optimal alignment
    over the points in included_idxs.

  Raises:
    ValueError: If the number of included indices is not the same for both
    input arrays.
  """
  if len(x_indices) != len(y_indices):
    raise ValueError(
        'Number of included indices must be the same for both input arrays,'
        f' but got for x: {len(x_indices)}, and for y: {len(y_indices)}.'
    )

  x_mean = np.mean(x[x_indices, :], axis=0)
  y_mean = np.mean(y[y_indices, :], axis=0)

  centered_x = x - x_mean
  centered_y = y - y_mean

  t = transform_ls(centered_x[x_indices, :], centered_y[y_indices, :])
  transformed_x = np.dot(centered_x, t.transpose()) + y_mean

  return transformed_x


def deviations_from_coords(
    decoy_coords: np.ndarray,
    gt_coords: np.ndarray,
    align_idxs: np.ndarray | None = None,
    include_idxs: np.ndarray | None = None,
) -> np.ndarray:
  """Returns the raw per-atom deviations used in RMSD computation."""
  if decoy_coords.shape != gt_coords.shape:
    raise ValueError(
        'decoy_coords.shape and gt_coords.shape must match.Found: %s and %s.'
        % (decoy_coords.shape, gt_coords.shape)
    )
  # Include and align all residues unless specified otherwise.
  if include_idxs is None:
    include_idxs = np.arange(decoy_coords.shape[0])
  if align_idxs is None:
    align_idxs = include_idxs
  aligned_decoy_coords = align(
      x=decoy_coords,
      y=gt_coords,
      x_indices=align_idxs,
      y_indices=align_idxs,
  )
  deviations = np.linalg.norm(
      aligned_decoy_coords[include_idxs] - gt_coords[include_idxs], axis=1
  )
  return deviations


def rmsd_from_coords(
    decoy_coords: np.ndarray,
    gt_coords: np.ndarray,
    align_idxs: np.ndarray | None = None,
    include_idxs: np.ndarray | None = None,
) -> float:
  """Computes the *aligned* RMSD of two Mx3 np arrays of coordinates.

  Args:
    decoy_coords: [M, 3] np array of decoy atom coordinates.
    gt_coords: [M, 3] np array of gt atom coordinates.
    align_idxs: [M] np array of indices specifying coordinates to align on.
      Defaults to None, in which case all the include_idx (see after) are used.
    include_idxs: [M] np array of indices specifying coordinates to score.
      Defaults to None, in which case all indices are used for scoring.

  Returns:
    rmsd value of the aligned decoy and gt coordinates.
  """
  deviations = deviations_from_coords(
      decoy_coords, gt_coords, align_idxs, include_idxs
  )
  return np.sqrt(np.mean(np.square(deviations)))


================================================
FILE: src/alphafold3/model/scoring/chirality.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Chirality detection and comparison."""

from collections.abc import Mapping

from absl import logging
from alphafold3 import structure
from alphafold3.constants import chemical_components
from alphafold3.data.tools import rdkit_utils
import rdkit.Chem as rd_chem

_CHIRAL_ELEMENTS = frozenset({'C', 'S'})


def _find_chiral_centres(mol: rd_chem.Mol) -> dict[str, str]:
  """Find chiral centres and detect their chirality.

  Only elements listed in _CHIRAL_ELEMENTS are considered as centres.

  Args:
    mol: The molecule for which to detect chirality.

  Returns:
    Map from chiral centre atom names to identified chirality.
  """
  chiral_centres = rd_chem.FindMolChiralCenters(
      mol, force=True, includeUnassigned=False, useLegacyImplementation=True
  )
  atom_name_by_idx = {
      atom.GetIdx(): atom.GetProp('atom_name') for atom in mol.GetAtoms()
  }
  atom_chirality_by_name = {atom_name_by_idx[k]: v for k, v in chiral_centres}
  return {
      k: v
      for k, v in atom_chirality_by_name.items()
      if any(k[: len(el)].upper() == el for el in _CHIRAL_ELEMENTS)
  }


def _chiral_match(mol1: rd_chem.Mol, mol2: rd_chem.Mol) -> bool:
  """Compares chirality of two Mols. Mol1 can match a subset of mol2."""

  mol1_atom_names = {a.GetProp('atom_name') for a in mol1.GetAtoms()}
  mol2_atom_names = {a.GetProp('atom_name') for a in mol2.GetAtoms()}
  if mol1_atom_names != mol2_atom_names:
    if not mol1_atom_names.issubset(mol2_atom_names):
      raise ValueError('Mol1 atoms are not a subset of mol2 atoms.')

  mol1_chiral_centres = _find_chiral_centres(mol1)
  mol2_chiral_centres = _find_chiral_centres(mol2)
  if set(mol1_chiral_centres) != set(mol2_chiral_centres):
    if not set(mol1_chiral_centres).issubset(mol2_chiral_centres):
      return False
  chirality_matches = {
      centre_atom: chirality1 == mol2_chiral_centres[centre_atom]
      for centre_atom, chirality1 in mol1_chiral_centres.items()
      if '?' != mol2_chiral_centres[centre_atom]
  }
  return all(chirality_matches.values())


def _mol_from_ligand_struc(
    ligand_struc: structure.Structure,
    ref_mol: rd_chem.Mol,
) -> rd_chem.Mol | None:
  """Creates a Mol object from a ligand structure and reference mol."""

  if ligand_struc.num_residues(count_unresolved=True) > 1:
    raise ValueError('ligand_struc %s has more than one residue.')
  coords_by_atom_name = dict(zip(ligand_struc.atom_name, ligand_struc.coords))

  ref_mol = rdkit_utils.sanitize_mol(
      ref_mol,
      sort_alphabetically=False,
      remove_hydrogens=True,
  )

  mol = rd_chem.Mol(ref_mol)
  mol.RemoveAllConformers()

  atom_indices_to_remove = [
      a.GetIdx()
      for a in mol.GetAtoms()
      if a.GetProp('atom_name') not in coords_by_atom_name
  ]
  editable_mol = rd_chem.EditableMol(mol)
  # Remove indices from the largest to smallest, to avoid invalidating.
  for atom_idx in atom_indices_to_remove[::-1]:
    editable_mol.RemoveAtom(atom_idx)
  mol = editable_mol.GetMol()

  conformer = rd_chem.Conformer(mol.GetNumAtoms())
  for atom_idx, atom in enumerate(mol.GetAtoms()):
    atom_name = atom.GetProp('atom_name')
    coords = coords_by_atom_name[atom_name]
    conformer.SetAtomPosition(atom_idx, coords.tolist())
  mol.AddConformer(conformer)
  try:
    rd_chem.AssignStereochemistryFrom3D(mol)
  except RuntimeError as e:
    # Catch only this specific rdkit error.
    if 'Cannot normalize a zero length vector' in str(e):
      return None
    else:
      raise
  return mol


def _maybe_mol_from_ccd(res_name: str) -> rd_chem.Mol | None:
  """Creates a Mol object from CCD information if res_name is in the CCD."""
  ccd = chemical_components.Ccd()
  ccd_cif = ccd.get(res_name)
  if not ccd_cif:
    logging.warning('No ccd information for residue %s.', res_name)
    return None
  try:
    mol = rdkit_utils.mol_from_ccd_cif(ccd_cif, force_parse=False)
  except rdkit_utils.MolFromMmcifError as e:
    logging.warning('Failed to create mol from ccd for %s: %s', res_name, e)
    return None
  if mol is None:
    raise ValueError('Failed to create mol from ccd for %s.' % res_name)
  mol = rdkit_utils.sanitize_mol(
      mol,
      sort_alphabetically=False,
      remove_hydrogens=True,
  )
  return mol


def compare_chirality(
    test_struc: structure.Structure,
    ref_mol_by_chain: Mapping[str, rd_chem.Mol] | None = None,
) -> dict[str, bool]:
  """Compares chirality of ligands in a structure with reference molecules.

  We do not enforce that ligand atoms exactly match, only that the ligand atoms
  and chiral centres are a subset of those in ref mol.

  Args:
    test_struc: The structure for whose ligands to match chirality.
    ref_mol_by_chain: Optional dictionary mapping chain IDs to mol objects with
      conformers to compare against. If this is not provided, the comparison is
      to the corresponding ligands in the CCD if the ligand residue name is in
      the CCD.

  Returns:
    Dictionary mapping chain id to whether chirality mismatches the ref mol.
    Only single residue ligands where reference molecules are available are
    compared.
  """
  ref_mol_by_chain = ref_mol_by_chain or {}
  test_struc = test_struc.filter_to_entity_type(ligand=True)
  name = test_struc.name
  chiral_match_by_chain_id = {}
  for chain_id in test_struc.chains:
    chain_struc = test_struc.filter(chain_id=chain_id)
    # Only compare single-residue ligands.
    if chain_struc.num_residues(count_unresolved=True) > 1:
      logging.warning('%s: Chain %s has >1 residues. Skipping.', name, chain_id)
      continue
    if chain_id not in ref_mol_by_chain:
      ref_mol = _maybe_mol_from_ccd(chain_struc.res_name[0])
    else:
      ref_mol = ref_mol_by_chain[chain_id]
    if ref_mol is None:
      logging.warning(
          '%s: Ref mol is None for chain %s. Skipping.', name, chain_id
      )
      continue
    mol = _mol_from_ligand_struc(
        ligand_struc=chain_struc,
        ref_mol=ref_mol,
    )
    if mol is None:
      logging.warning(
          '%s: Failed to create mol for chain %s. Skipping.', name, chain_id
      )
      continue
    chiral_match_by_chain_id[chain_id] = _chiral_match(mol, ref_mol)
  return chiral_match_by_chain_id


================================================
FILE: src/alphafold3/model/scoring/covalent_bond_cleaning.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Some methods to compute metrics for PTMs."""

import collections
from collections.abc import Mapping
import dataclasses

from alphafold3 import structure
from alphafold3.constants import mmcif_names
from alphafold3.model.atom_layout import atom_layout
import numpy as np


@dataclasses.dataclass(frozen=True)
class ResIdMapping:
  old_res_ids: np.ndarray
  new_res_ids: np.ndarray


def _count_symmetric_chains(struc: structure.Structure) -> Mapping[str, int]:
  """Returns a dict with each chain ID and count."""
  chain_res_name_sequence_from_chain_id = struc.chain_res_name_sequence(
      include_missing_residues=True, fix_non_standard_polymer_res=False
  )
  counts_for_chain_res_name_sequence = collections.Counter(
      chain_res_name_sequence_from_chain_id.values()
  )
  chain_symmetric_count = {}
  for chain_id, chain_res_name in chain_res_name_sequence_from_chain_id.items():
    chain_symmetric_count[chain_id] = counts_for_chain_res_name_sequence[
        chain_res_name
    ]
  return chain_symmetric_count


def has_nonsymmetric_bonds_on_symmetric_polymer_chains(
    struc: structure.Structure, polymer_ligand_bonds: atom_layout.AtomLayout
) -> bool:
  """Returns true if nonsymmetric bonds found on polymer chains."""
  try:
    _get_polymer_dim(polymer_ligand_bonds)
  except ValueError:
    return True
  if _has_non_polymer_ligand_ptm_bonds(polymer_ligand_bonds):
    return True
  if _has_multiple_polymers_bonded_to_one_ligand(polymer_ligand_bonds):
    return True
  combined_struc, _ = _combine_polymer_ligand_ptm_chains(
      struc, polymer_ligand_bonds
  )
  struc = struc.filter(chain_type=mmcif_names.POLYMER_CHAIN_TYPES)
  combined_struc = combined_struc.filter(
      chain_type=mmcif_names.POLYMER_CHAIN_TYPES
  )
  return _count_symmetric_chains(struc) != _count_symmetric_chains(
      combined_struc
  )


def _has_non_polymer_ligand_ptm_bonds(
    polymer_ligand_bonds: atom_layout.AtomLayout,
):
  """Checks if all bonds are between a polymer chain and a ligand chain type."""
  for start_chain_type, end_chain_type in polymer_ligand_bonds.chain_type:
    if (
        start_chain_type in mmcif_names.POLYMER_CHAIN_TYPES
        and end_chain_type in mmcif_names.LIGAND_CHAIN_TYPES
    ):
      continue
    elif (
        start_chain_type in mmcif_names.LIGAND_CHAIN_TYPES
        and end_chain_type in mmcif_names.POLYMER_CHAIN_TYPES
    ):
      continue
    else:
      return True
  return False


def _combine_polymer_ligand_ptm_chains(
    struc: structure.Structure,
    polymer_ligand_bonds: atom_layout.AtomLayout,
) -> tuple[structure.Structure, dict[tuple[str, str], ResIdMapping]]:
  """Combines the ptm polymer-ligand chains together.

  This will prevent them from being permuted away from each other when chains
  are matched to the ground truth. This function also returns the res_id mapping
  from the separate ligand res_ids to their res_ids in the combined
  polymer-ligand chain; this information is needed to later separate the
  combined polymer-ligand chain.

  Args:
    struc: Structure to be modified.
    polymer_ligand_bonds: AtomLayout with polymer-ligand bond info.

  Returns:
    A tuple of a Structure with each ptm polymer-ligand chain relabelled as one
    chain and a dict from bond chain pair to the res_id mapping.
  """
  if not _has_only_single_bond_from_each_chain(polymer_ligand_bonds):
    if _has_multiple_ligands_bonded_to_one_polymer(polymer_ligand_bonds):
      # For structures where a polymer chain is connected to multiple ligands,
      # we need to sort the multiple bonds from the same chain by res_id to
      # ensure that the combined polymer-ligand chain will always be the same
      # when you have repeated symmetric polymer-ligand chains.
      polymer_ligand_bonds = (
          _sort_polymer_ligand_bonds_by_polymer_chain_and_res_id(
              polymer_ligand_bonds
          )
      )
    else:
      raise ValueError(
          'Code cannot handle multiple bonds from one chain unless'
          ' its several ligands bonded to a polymer.'
      )
  res_id_mappings_for_bond_chain_pair = dict()
  for (start_chain_id, end_chain_id), (start_chain_type, end_chain_type) in zip(
      polymer_ligand_bonds.chain_id, polymer_ligand_bonds.chain_type
  ):
    poly_info, ligand_info = _get_polymer_and_ligand_chain_ids_and_types(
        start_chain_id, end_chain_id, start_chain_type, end_chain_type
    )
    polymer_chain_id, polymer_chain_type = poly_info
    ligand_chain_id, _ = ligand_info

    # Join the ligand chain to the polymer chain.
    ligand_res_ids = struc.filter(chain_id=ligand_chain_id).res_id
    new_res_ids = ligand_res_ids + len(struc.all_residues[polymer_chain_id])
    res_id_mappings_for_bond_chain_pair[(polymer_chain_id, ligand_chain_id)] = (
        ResIdMapping(old_res_ids=ligand_res_ids, new_res_ids=new_res_ids)
    )
    chain_groups = []
    chain_group_ids = []
    chain_group_types = []
    for chain_id, chain_type in zip(
        struc.chains_table.id, struc.chains_table.type
    ):
      if chain_id == ligand_chain_id:
        continue
      elif chain_id == polymer_chain_id:
        chain_groups.append([polymer_chain_id, ligand_chain_id])
        chain_group_ids.append(polymer_chain_id)
        chain_group_types.append(polymer_chain_type)
      else:
        chain_groups.append([chain_id])
        chain_group_ids.append(chain_id)
        chain_group_types.append(chain_type)

    struc = struc.merge_chains(
        chain_groups=chain_groups,
        chain_group_ids=chain_group_ids,
        chain_group_types=chain_group_types,
    )

  return struc, res_id_mappings_for_bond_chain_pair


def _has_only_single_bond_from_each_chain(
    polymer_ligand_bonds: atom_layout.AtomLayout,
) -> bool:
  """Checks that there is at most one bond from each chain."""
  chain_ids = []
  for chains in polymer_ligand_bonds.chain_id:
    chain_ids.extend(chains)
  if len(chain_ids) != len(set(chain_ids)):
    return False
  return True


def _get_polymer_and_ligand_chain_ids_and_types(
    start_chain_id: str,
    end_chain_id: str,
    start_chain_type: str,
    end_chain_type: str,
) -> tuple[tuple[str, str], tuple[str, str]]:
  """Finds polymer and ligand chain ids from chain types."""
  if (
      start_chain_type in mmcif_names.POLYMER_CHAIN_TYPES
      and end_chain_type in mmcif_names.LIGAND_CHAIN_TYPES
  ):
    return (start_chain_id, start_chain_type), (end_chain_id, end_chain_type)
  elif (
      start_chain_type in mmcif_names.LIGAND_CHAIN_TYPES
      and end_chain_type in mmcif_names.POLYMER_CHAIN_TYPES
  ):
    return (end_chain_id, end_chain_type), (start_chain_id, start_chain_type)
  else:
    raise ValueError(
        'This code only handles PTM-bonds from polymer chain to ligands.'
    )


def _get_polymer_dim(polymer_ligand_bonds: atom_layout.AtomLayout) -> int:
  """Gets polymer dimension from the polymer-ligand bond layout."""
  start_chain_types = []
  end_chain_types = []
  for start_chain_type, end_chain_type in polymer_ligand_bonds.chain_type:
    start_chain_types.append(start_chain_type)
    end_chain_types.append(end_chain_type)
  if set(start_chain_types).issubset(
      set(mmcif_names.POLYMER_CHAIN_TYPES)
  ) and set(end_chain_types).issubset(set(mmcif_names.LIGAND_CHAIN_TYPES)):
    return 0
  elif set(start_chain_types).issubset(mmcif_names.LIGAND_CHAIN_TYPES) and set(
      end_chain_types
  ).issubset(set(mmcif_names.POLYMER_CHAIN_TYPES)):
    return 1
  else:
    raise ValueError(
        'Polymer and ligand dimensions are not consistent within the structure.'
    )


def _has_multiple_ligands_bonded_to_one_polymer(polymer_ligand_bonds):
  """Checks if there are multiple ligands bonded to one polymer."""
  polymer_dim = _get_polymer_dim(polymer_ligand_bonds)
  polymer_chain_ids = [
      chains[polymer_dim] for chains in polymer_ligand_bonds.chain_id
  ]
  if len(polymer_chain_ids) != len(set(polymer_chain_ids)):
    return True
  return False


def _has_multiple_polymers_bonded_to_one_ligand(polymer_ligand_bonds):
  """Checks if there are multiple polymer chains bonded to one ligand."""
  polymer_dim = _get_polymer_dim(polymer_ligand_bonds)
  ligand_dim = 1 - polymer_dim
  ligand_chain_ids = [
      chains[ligand_dim] for chains in polymer_ligand_bonds.chain_id
  ]
  if len(ligand_chain_ids) != len(set(ligand_chain_ids)):
    return True
  return False


def _sort_polymer_ligand_bonds_by_polymer_chain_and_res_id(
    polymer_ligand_bonds,
):
  """Sorts bonds by res_id (for when a polymer chain has multiple bonded ligands)."""

  polymer_dim = _get_polymer_dim(polymer_ligand_bonds)

  polymer_chain_ids = [
      chains[polymer_dim] for chains in polymer_ligand_bonds.chain_id
  ]
  polymer_res_ids = [res[polymer_dim] for res in polymer_ligand_bonds.res_id]

  polymer_chain_and_res_id = zip(polymer_chain_ids, polymer_res_ids)
  sorted_indices = [
      idx
      for idx, _ in sorted(
          enumerate(polymer_chain_and_res_id), key=lambda x: x[1]
      )
  ]
  return polymer_ligand_bonds[sorted_indices]


================================================
FILE: src/alphafold3/model/scoring/scoring.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Library of scoring methods of the model outputs."""

from alphafold3.model import protein_data_processing
import jax.numpy as jnp
import numpy as np


Array = jnp.ndarray | np.ndarray


def pseudo_beta_fn(
    aatype: Array,
    dense_atom_positions: Array,
    dense_atom_masks: Array,
    is_ligand: Array | None = None,
    use_jax: bool | None = True,
) -> tuple[Array, Array] | Array:
  """Create pseudo beta atom positions and optionally mask.

  Args:
    aatype: [num_res] amino acid types.
    dense_atom_positions: [num_res, NUM_DENSE, 3] vector of all atom positions.
    dense_atom_masks: [num_res, NUM_DENSE] mask.
    is_ligand: [num_res] flag if something is a ligand.
    use_jax: whether to use jax for the computations.

  Returns:
    Pseudo beta dense atom positions and the corresponding mask.
  """
  if use_jax:
    xnp = jnp
  else:
    xnp = np

  if is_ligand is None:
    is_ligand = xnp.zeros_like(aatype)

  pseudobeta_index_polymer = xnp.take(
      protein_data_processing.RESTYPE_PSEUDOBETA_INDEX, aatype, axis=0
  ).astype(xnp.int32)

  pseudobeta_index = xnp.where(
      is_ligand,
      xnp.zeros_like(pseudobeta_index_polymer),
      pseudobeta_index_polymer,
  )

  pseudo_beta = xnp.take_along_axis(
      dense_atom_positions, pseudobeta_index[..., None, None], axis=-2
  )
  pseudo_beta = xnp.squeeze(pseudo_beta, axis=-2)

  pseudo_beta_mask = xnp.take_along_axis(
      dense_atom_masks, pseudobeta_index[..., None], axis=-1
  ).astype(xnp.float32)
  pseudo_beta_mask = xnp.squeeze(pseudo_beta_mask, axis=-1)

  return pseudo_beta, pseudo_beta_mask


================================================
FILE: src/alphafold3/parsers/cpp/cif_dict.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from typing import Any, ClassVar, Iterable, Iterator, TypeVar, overload

import numpy as np

_T = TypeVar('_T')

class CifDict:
  class ItemView:
    def __iter__(self) -> Iterator[tuple[str, list[str]]]: ...
    def __len__(self) -> int: ...

  class KeyView:
    @overload
    def __contains__(self, key: str) -> bool: ...
    @overload
    def __contains__(self, key: object) -> bool: ...
    def __iter__(self) -> Iterator[str]: ...
    def __len__(self) -> int: ...

  class ValueView:
    def __iter__(self) -> Iterator[list[str]]: ...
    def __len__(self) -> int: ...

  def __init__(self, d: dict[str, Iterable[str]]) -> None: ...
  def copy_and_update(self, d: dict[str, Iterable[str]]) -> CifDict: ...
  def extract_loop_as_dict(self, prefix: str, index: str) -> dict:
    """Extracts loop associated with a prefix from mmCIF data as a dict.

    For instance for an mmCIF with these fields:
    '_a.ix': ['1', '2', '3']
    '_a.1': ['a.1.1', 'a.1.2', 'a.1.3']
    '_a.2': ['a.2.1', 'a.2.2', 'a.2.3']

    this function called with prefix='_a.', index='_a.ix' extracts:
    {'1': {'a.ix': '1', 'a.1': 'a.1.1', 'a.2': 'a.2.1'}
     '2': {'a.ix': '2', 'a.1': 'a.1.2', 'a.2': 'a.2.2'}
     '3': {'a.ix': '3', 'a.1': 'a.1.3', 'a.2': 'a.2.3'}}

    Args:
      prefix: Prefix shared by each of the data items in the loop. The prefix
        should include the trailing period.
      index: Which item of loop data should serve as the key.

    Returns:
      Dict of dicts; each dict represents 1 entry from an mmCIF loop,
      indexed by the index column.
    """

  def extract_loop_as_list(self, prefix: str) -> list:
    """Extracts loop associated with a prefix from mmCIF data as a list.

    Reference for loop_ in mmCIF:
    http://mmcif.wwpdb.org/docs/tutorials/mechanics/pdbx-mmcif-syntax.html

    For instance for an mmCIF with these fields:
    '_a.1': ['a.1.1', 'a.1.2', 'a.1.3']
    '_a.2': ['a.2.1', 'a.2.2', 'a.2.3']

    this function called with prefix='_a.' extracts:
    [{'_a.1': 'a.1.1', '_a.2': 'a.2.1'}
     {'_a.1': 'a.1.2', '_a.2': 'a.2.2'}
     {'_a.1': 'a.1.3', '_a.2': 'a.2.3'}]

    Args:
      prefix: Prefix shared by each of the data items in the loop. The prefix
        should include the trailing period.

    Returns:
      A list of dicts; each dict represents 1 entry from an mmCIF loop.
    """

  def get(self, key: str, default_value: _T = ...) -> list[str] | _T: ...
  def get_array(
      self, key: str, dtype: object = ..., gather: object = ...
  ) -> np.ndarray:
    """Returns values looked up in dict converted to a NumPy array.

    Args:
      key: Key in dictionary.
      dtype: Optional (default `object`) Specifies output dtype of array. One of
        [object, np.{int,uint}{8,16,32,64} np.float{32,64}]. As with NumPy use
        `object` to return a NumPy array of strings.
      gather: Optional one of [slice, np.{int,uint}{32,64}] non-intermediate
        version of get_array(key, dtype)[gather].

    Returns:
      A NumPy array of given dtype. An optimised equivalent to
      np.array(cif[key]).astype(dtype).  With support of '.' being treated
      as np.nan if dtype is one of np.float{32,64}.
      Identical strings will all reference the same object to save space.

    Raises:
      KeyError - if key is not found.
      TypeError - if dtype is not valid or supported.
      ValueError - if string cannot convert to dtype.
    """

  def get_data_name(self) -> str: ...
  def items(self) -> CifDict.ItemView: ...
  def keys(self) -> CifDict.KeyView: ...
  def to_string(self) -> str: ...
  def to_dict(self) -> dict[str, list[str]]: ...
  def value_length(self, key: str) -> int: ...
  def values(self) -> CifDict.ValueView: ...
  def __bool__(self) -> bool: ...
  def __contains__(self, key: str) -> bool: ...
  def __getitem__(self, key: str) -> list[str]: ...
  def __getstate__(self) -> tuple: ...
  def __iter__(self) -> Iterator[str]: ...
  def __len__(self) -> int: ...
  def __setstate__(self, state: tuple) -> None: ...

def tokenize(cif_string: str) -> list[str]: ...
def split_line(line: str) -> list[str]: ...
def from_string(mmcif_string: str | bytes) -> CifDict: ...
def parse_multi_data_cif(cif_string: str | bytes) -> dict[str, CifDict]: ...


================================================
FILE: src/alphafold3/parsers/cpp/cif_dict_lib.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include "alphafold3/parsers/cpp/cif_dict_lib.h"

#include <algorithm>
#include <array>
#include <cstddef>
#include <iterator>
#include <memory>
#include <string>
#include <tuple>
#include <utility>
#include <vector>

#include "absl/algorithm/container.h"
#include "absl/container/btree_map.h"
#include "absl/container/flat_hash_map.h"
#include "absl/container/flat_hash_set.h"
#include "absl/container/node_hash_map.h"
#include "absl/log/check.h"
#include "absl/status/status.h"
#include "absl/status/statusor.h"
#include "absl/strings/ascii.h"
#include "absl/strings/match.h"
#include "absl/strings/str_cat.h"
#include "absl/strings/str_format.h"
#include "absl/strings/str_join.h"
#include "absl/strings/str_split.h"
#include "absl/strings/string_view.h"
#include "absl/strings/strip.h"

namespace alphafold3 {
namespace {

bool IsQuote(const char symbol) { return symbol == '\'' || symbol == '"'; }
bool IsWhitespace(const char symbol) { return symbol == ' ' || symbol == '\t'; }

// Splits line into tokens, returns whether successful.
bool SplitLineInline(absl::string_view line,
                     std::vector<absl::string_view>* tokens) {
  // See https://www.iucr.org/resources/cif/spec/version1.1/cifsyntax
  for (int i = 0, line_length = line.length(); i < line_length;) {
    // Skip whitespace (spaces or tabs).
    while (IsWhitespace(line[i])) {
      if (++i == line_length) {
        break;
      }
    }
    if (i == line_length) {
      break;
    }

    // Skip comments (from # until the end of the line). If # is a non-comment
    // character, it must be inside a quoted token.
    if (line[i] == '#') {
      break;
    }

    int start_index;
    int end_index;
    if (IsQuote(line[i])) {
      // Token in single or double quotes. CIF v1.1 specification considers a
      // quote to be an opening quote only if it is at the beginning of a token.
      // So e.g. A' B has tokens A' and B. Also, ""A" is a token "A.
      const char quote_char = line[i++];
      start_index = i;

      // Find matching quote. The double loop is not strictly necessary, but
      // optimises a bit better.
      while (true) {
        while (i < line_length && line[i] != quote_char) {
          ++i;
        }
        if (i == line_length) {
          // Reached the end of the line while still being inside a token.
          return false;
        }
        if (i + 1 == line_length || IsWhitespace(line[i + 1])) {
          break;
        }
        ++i;
      }
      end_index = i++;
    } else {
      // Non-quoted token. Read until reaching whitespace.
      start_index = i++;
      while (i < line_length && !IsWhitespace(line[i])) {
        ++i;
      }
      end_index = i;
    }

    tokens->push_back(line.substr(start_index, end_index - start_index));
  }

  return true;
}

using HeapStrings = std::vector<std::unique_ptr<std::string>>;

// The majority of strings can be viewed on original cif_string.
// heap_strings store multi-line tokens that have internal white-space stripped.
absl::StatusOr<std::vector<absl::string_view>> TokenizeInternal(
    absl::string_view cif_string, HeapStrings* heap_strings) {
  const std::vector<absl::string_view> lines = absl::StrSplit(cif_string, '\n');
  std::vector<absl::string_view> tokens;
  // Heuristic: Most lines in an mmCIF are _atom_site lines with 21 tokens.
  tokens.reserve(lines.size() * 21);
  int line_num = 0;
  while (line_num < lines.size()) {
    auto line = absl::StripSuffix(lines[line_num], "\r");
    line_num++;

    if (line.empty() || line[0] == '#') {
      // Skip empty lines or lines that contain only comments.
      continue;
    } else if (line[0] == ';') {
      // Leading whitespace on each line must be preserved while trailing
      // whitespace may be stripped.
      std::vector<absl::string_view> multiline_tokens;
      // Strip the leading ";".
      multiline_tokens.push_back(
          absl::StripTrailingAsciiWhitespace(line.substr(1)));
      while (line_num < lines.size()) {
        auto multiline = absl::StripTrailingAsciiWhitespace(lines[line_num]);
        line_num++;
        if (!multiline.empty() && multiline[0] == ';') {
          break;
        } else if (line_num == lines.size()) {
          return absl::InvalidArgumentError(
              "Last multiline token is not terminated by a semicolon.");
        }
        multiline_tokens.push_back(multiline);
      }
      heap_strings->push_back(
          std::make_unique<std::string>(absl::StrJoin(multiline_tokens, "\n")));
      tokens.emplace_back(*heap_strings->back());
    } else {
      if (!SplitLineInline(line, &tokens)) {
        return absl::InvalidArgumentError(
            absl::StrCat("Line ended with quote open: ", line));
      }
    }
  }
  return tokens;
}

// Returns whether the token doesn't need any quoting. This is true if the token
// isn't empty and contains only safe characters [A-Za-z0-9.?-].
bool IsTrivialToken(const absl::string_view value) {
  if (value.empty()) {
    return false;
  }

  return std::all_of(value.begin(), value.end(), [](char c) {
    return absl::ascii_isalnum(c) || c == '.' || c == '?' || c == '-';
  });
}

// Returns whether the token needs to be a multiline token. This happens if it
// has a newline or both single and double quotes.
bool IsMultiLineToken(const absl::string_view value) {
  bool has_single_quotes = false;
  bool has_double_quotes = false;
  for (const char c : value) {
    if (c == '\n') {
      return true;
    } else if (c == '\'') {
      has_single_quotes = true;
    } else if (c == '"') {
      has_double_quotes = true;
    }
  }
  return has_single_quotes && has_double_quotes;
}

absl::string_view GetEscapeQuote(const absl::string_view value) {
  // Empty values should not happen, but if so, they should be quoted.
  if (value.empty()) {
    return "\"";
  }

  // The value must not start with one of these CIF keywords.
  if (absl::StartsWithIgnoreCase(value, "data_") ||
      absl::StartsWithIgnoreCase(value, "loop_") ||
      absl::StartsWithIgnoreCase(value, "save_") ||
      absl::StartsWithIgnoreCase(value, "stop_") ||
      absl::StartsWithIgnoreCase(value, "global_")) {
    return "\"";
  }

  // The first character must not be a special character.
  const char first = value.front();
  if (first == '_' || first == '#' || first == '$' || first == '[' ||
      first == ']' || first == ';') {
    return "\"";
  }

  // No quotes or whitespace allowed inside. Rare case when both double and
  // single quotes are present is handled by IsMultiLineToken.
  bool use_double_quote = true;
  bool use_single_quote = true;
  bool needs_quote = false;
  for (const char c : value) {
    if (c == ' ' || c == '\t') {
      needs_quote = true;
    } else if (c == '"') {
      needs_quote = true;
      use_double_quote = false;
    } else if (c == '\'') {
      needs_quote = true;
      use_single_quote = false;
    }
  }
  if (needs_quote && use_double_quote) {
    return "\"";
  } else if (needs_quote && use_single_quote) {
    return "'";
  }
  return "";
}

int RecordIndex(absl::string_view record) {
  if (record == "_entry") {
    return 0;  // _entry is always first.
  }
  if (record == "_atom_site") {
    return 2;  // _atom_site is always last.
  }
  return 1;  // other records are between _entry and _atom_site.
}

struct RecordOrder {
  using is_transparent = void;  // Enable heterogeneous lookup.
  bool operator()(absl::string_view lhs, absl::string_view rhs) const {
    std::size_t lhs_index = RecordIndex(lhs);
    std::size_t rhs_index = RecordIndex(rhs);
    return std::tie(lhs_index, lhs) < std::tie(rhs_index, rhs);
  }
};

// Make sure the _atom_site loop columns are sorted in the PDB-standard way.
constexpr absl::string_view kAtomSiteSortOrder[] = {
    "_atom_site.group_PDB",
    "_atom_site.id",
    "_atom_site.type_symbol",
    "_atom_site.label_atom_id",
    "_atom_site.label_alt_id",
    "_atom_site.label_comp_id",
    "_atom_site.label_asym_id",
    "_atom_site.label_entity_id",
    "_atom_site.label_seq_id",
    "_atom_site.pdbx_PDB_ins_code",
    "_atom_site.Cartn_x",
    "_atom_site.Cartn_y",
    "_atom_site.Cartn_z",
    "_atom_site.occupancy",
    "_atom_site.B_iso_or_equiv",
    "_atom_site.pdbx_formal_charge",
    "_atom_site.auth_seq_id",
    "_atom_site.auth_comp_id",
    "_atom_site.auth_asym_id",
    "_atom_site.auth_atom_id",
    "_atom_site.pdbx_PDB_model_num",
};

size_t AtomSiteIndex(absl::string_view atom_site) {
  return std::distance(std::begin(kAtomSiteSortOrder),
                       absl::c_find(kAtomSiteSortOrder, atom_site));
}

struct AtomSiteOrder {
  bool operator()(absl::string_view lhs, absl::string_view rhs) const {
    auto lhs_index = AtomSiteIndex(lhs);
    auto rhs_index = AtomSiteIndex(rhs);
    return std::tie(lhs_index, lhs) < std::tie(rhs_index, rhs);
  }
};

class Column {
 public:
  Column(absl::string_view key, const std::vector<std::string>* values)
      : key_(key), values_(values) {
    int max_value_length = 0;
    for (size_t i = 0; i < values->size(); ++i) {
      absl::string_view value = (*values)[i];
      if (IsTrivialToken(value)) {
        // Shortcut for the most common cases where no quoting/multiline needed.
        max_value_length = std::max<int>(max_value_length, value.size());
        continue;
      } else if (IsMultiLineToken(value)) {
        values_with_newlines_.insert(i);
      } else {
        absl::string_view quote = GetEscapeQuote(value);
        if (!quote.empty()) {
          values_with_quotes_[i] = quote;
        }
        max_value_length =
            std::max<int>(max_value_length, value.size() + quote.size() * 2);
      }
    }
    max_value_length_ = max_value_length;
  }

  absl::string_view key() const { return key_; }

  const std::vector<std::string>* values() const { return values_; }

  int max_value_length() const { return max_value_length_; }

  bool has_newlines(size_t index) const {
    return values_with_newlines_.contains(index);
  }

  absl::string_view quote(size_t index) const {
    if (auto it = values_with_quotes_.find(index);
        it != values_with_quotes_.end()) {
      return it->second;
    }
    return "";
  }

 private:
  absl::string_view key_;
  const std::vector<std::string>* values_;
  int max_value_length_;
  // Values with newlines or quotes are very rare in a typical CIF file.
  absl::flat_hash_set<size_t> values_with_newlines_;
  absl::flat_hash_map<size_t, absl::string_view> values_with_quotes_;
};

struct GroupedKeys {
  std::vector<Column> grouped_columns;
  int max_key_length;
  int value_size;
};

absl::Status CheckLoopColumnSizes(int num_loop_keys, int num_loop_values) {
  if ((num_loop_keys > 0) && (num_loop_values % num_loop_keys != 0)) {
    return absl::InvalidArgumentError(absl::StrFormat(
        "The number of values (%d) in a loop is not a multiple of the "
        "number of the loop's columns (%d)",
        num_loop_values, num_loop_keys));
  }
  return absl::OkStatus();
}

}  // namespace

absl::StatusOr<CifDict> CifDict::FromString(absl::string_view cif_string) {
  CifDict::Dict cif;

  bool loop_flag = false;
  absl::string_view key;

  HeapStrings heap_strings;
  auto tokens = TokenizeInternal(cif_string, &heap_strings);
  if (!tokens.ok()) {
    return tokens.status();
  }

  if (tokens->empty()) {
    return absl::InvalidArgumentError("The CIF file must not be empty.");
  }

  // The first token should be data_XXX. Split into key = data, value = XXX.
  absl::string_view first_token = tokens->front();
  if (!absl::ConsumePrefix(&first_token, "data_")) {
    return absl::InvalidArgumentError(
        "The CIF file does not start with the data_ field.");
  }
  if (first_token.empty()) {
    return absl::InvalidArgumentError(
        "The CIF file does not contain a data block name.");
  }
  cif["data_"].emplace_back(first_token);

  // Counters for CIF loop_ regions.
  int loop_token_index = 0;
  int num_loop_keys = 0;
  // Loops have usually O(10) columns but could have up to O(10^6) rows. It is
  // therefore wasteful to look up the cif vector where to add a loop value
  // since that means doing `columns * rows` map lookups. If we save pointers to
  // these loop column fields instead, we need only 1 cif lookup per column.
  std::vector<std::vector<std::string>*> loop_column_values;

  // Skip the first element since we already processed it above.
  for (auto token_itr = tokens->begin() + 1; token_itr != tokens->end();
       ++token_itr) {
    auto token = *token_itr;
    if (absl::EqualsIgnoreCase(token, "loop_")) {
      // A new loop started, check the previous loop and get rid of its data.
      absl::Status loop_status =
          CheckLoopColumnSizes(num_loop_keys, loop_token_index);
      if (!loop_status.ok()) {
        return loop_status;
      }
      loop_flag = true;
      loop_column_values.clear();
      loop_token_index = 0;
      num_loop_keys = 0;
      continue;
    } else if (loop_flag) {
      // The second condition checks we are in the first column. Some mmCIF
      // files (e.g. 4q9r) have values in later columns starting with an
      // underscore and we don't want to read these as keys.
      int token_column_index =
          num_loop_keys == 0 ? 0 : loop_token_index % num_loop_keys;
      if (token_column_index == 0 && !token.empty() && token[0] == '_') {
        if (loop_token_index > 0) {
          // We are out of the loop.
          loop_flag = false;
        } else {
          // We are in the keys (column names) section of the loop.
          auto [it, inserted] = cif.try_emplace(token);
          if (!inserted) {
            return absl::InvalidArgumentError(
                absl::StrCat("Duplicate loop key: '", token, "'"));
          }
          auto& columns = it->second;
          columns.clear();

          // Heuristic: _atom_site is typically the largest table in an mmCIF
          // with ~16 columns. Make sure we reserve enough space for its values.
          if (absl::StartsWith(token, "_atom_site.")) {
            columns.reserve(tokens->size() / 20);
          }

          // Save the pointer to the loop column values.
          loop_column_values.push_back(&columns);
          num_loop_keys += 1;
          continue;
        }
      } else {
        // We are in the values section of the loop. We have a pointer to the
        // loops' values, add the new token in there.
        if (token_column_index >= loop_column_values.size()) {
          return absl::InvalidArgumentError(
              absl::StrCat("Too many columns at: '", token,
                           "' at column index: ", token_column_index,
                           " expected at most: ", loop_column_values.size()));
        }
        loop_column_values[token_column_index]->emplace_back(token);
        loop_token_index++;
        continue;
      }
    }
    if (key.empty()) {
      key = token;
      if (!absl::StartsWith(key, "_")) {
        return absl::InvalidArgumentError(
            absl::StrCat("Key '", key, "' does not start with an underscore."));
      }
    } else {
      auto [it, inserted] = cif.try_emplace(key);
      if (!inserted) {
        return absl::InvalidArgumentError(
            absl::StrCat("Duplicate key: '", key, "'"));
      }
      (it->second).emplace_back(token);
      key = "";
    }
  }
  absl::Status loop_status =
      CheckLoopColumnSizes(num_loop_keys, loop_token_index);
  if (!loop_status.ok()) {
    return loop_status;
  }
  return CifDict(std::move(cif));
}

absl::StatusOr<std::string> CifDict::ToString() const {
  std::string output;

  absl::string_view data_name;
  // Check that the data_ field exists.
  if (auto name_it = (*dict_).find("data_");
      name_it == (*dict_).end() || name_it->second.empty()) {
    return absl::InvalidArgumentError(
        "The CIF must contain a valid name for this data block in the special "
        "data_ field.");
  } else {
    data_name = name_it->second.front();
  }

  if (absl::c_any_of(data_name,
                     [](char i) { return absl::ascii_isspace(i); })) {
    return absl::InvalidArgumentError(absl::StrFormat(
        "The CIF data block name must not contain any whitespace characters, "
        "got '%s'.",
        data_name));
  }
  absl::StrAppend(&output, "data_", data_name, "\n#\n");

  // Group keys by their prefix. Use btree_map to iterate in alphabetical order,
  // but with some keys being placed at the end (e.g. _atom_site).
  absl::btree_map<std::string, GroupedKeys, RecordOrder> grouped_keys;
  for (const auto& [key, values] : *dict_) {
    if (key == "data_") {
      continue;  // Skip the special data_ key, we are already done with it.
    }
    const std::pair<absl::string_view, absl::string_view> key_parts =
        absl::StrSplit(key, absl::MaxSplits('.', 1));
    const absl::string_view key_prefix = key_parts.first;
    auto [it, inserted] = grouped_keys.emplace(key_prefix, GroupedKeys{});
    GroupedKeys& grouped_key = it->second;
    grouped_key.grouped_columns.push_back(Column(key, &values));
    if (inserted) {
      grouped_key.max_key_length = key.length();
      grouped_key.value_size = values.size();
    } else {
      grouped_key.max_key_length =
          std::max<int>(key.length(), grouped_key.max_key_length);
      if (grouped_key.value_size != values.size()) {
        return absl::InvalidArgumentError(
            absl::StrFormat("Values for key %s have different length (%d) than "
                            "the other values with the same key prefix (%d).",
                            key, values.size(), grouped_key.value_size));
      }
    }
  }

  for (auto& [key_prefix, group_info] : grouped_keys) {
    if (key_prefix == "_atom_site") {
      // Make sure we sort the _atom_site loop in the standard way.
      absl::c_sort(group_info.grouped_columns,
                   [](const Column& lhs, const Column& rhs) {
                     return AtomSiteOrder{}(lhs.key(), rhs.key());
                   });
    } else {
      // Make the key ordering within a key group deterministic.
      absl::c_sort(group_info.grouped_columns,
                   [](const Column& lhs, const Column& rhs) {
                     return lhs.key() < rhs.key();
                   });
    }

    // Force `_atom_site` field to always be a loop. This resolves issues with
    // third party mmCIF parsers such as OpenBabel which always expect a loop
    // even when there is only a single atom present.
    if (group_info.value_size == 1 && key_prefix != "_atom_site") {
      // Plain key-value pairs, output them as they are.
      for (const Column& grouped_column : group_info.grouped_columns) {
        int width = group_info.max_key_length + 1;
        size_t start_pos = output.size();
        output.append(width, ' ');
        auto out_it = output.begin() + start_pos;
        absl::c_copy(grouped_column.key(), out_it);
        // Append the value, handle multi-line/quoting.
        absl::string_view value = grouped_column.values()->front();
        if (grouped_column.has_newlines(0)) {
          absl::StrAppend(&output, "\n;", value, "\n;\n");  // Multi-line value.
        } else {
          const absl::string_view quote_char = grouped_column.quote(0);
          absl::StrAppend(&output, quote_char, value, quote_char, "\n");
        }
      }
    } else {
      // CIF loop. Output the column names, then the rows with data.
      absl::StrAppend(&output, "loop_\n");
      for (Column& grouped_column : group_info.grouped_columns) {
        absl::StrAppend(&output, grouped_column.key(), "\n");
      }
      // Write the loop values, line by line. This is the most expensive part
      // since this path is taken to write the entire atom site table which has
      // about 20 columns, but thousands of rows.
      for (int i = 0; i < group_info.value_size; i++) {
        for (int column_index = 0;
             column_index < group_info.grouped_columns.size(); ++column_index) {
          const Column& grouped_column =
              group_info.grouped_columns[column_index];
          const absl::string_view value = (*grouped_column.values())[i];
          if (grouped_column.has_newlines(i)) {
            // Multi-line. This is very rarely taken path.
            if (column_index == 0) {
              // No extra newline before leading ;, already inserted.
              absl::StrAppend(&output, ";", value, "\n;\n");
            } else if (column_index == group_info.grouped_columns.size() - 1) {
              // No extra newline after trailing ;, will be inserted.
              absl::StrAppend(&output, "\n;", value, "\n;");
            } else {
              absl::StrAppend(&output, "\n;", value, "\n;\n");
            }
          } else {
            size_t start_pos = output.size();
            output.append(grouped_column.max_value_length() + 1, ' ');
            auto out_it = output.begin() + start_pos;
            absl::string_view quote = grouped_column.quote(i);
            if (!quote.empty()) {
              out_it = absl::c_copy(quote, out_it);
              out_it = absl::c_copy(value, out_it);
              absl::c_copy(quote, out_it);
            } else {
              absl::c_copy(value, out_it);
            }
          }
        }
        absl::StrAppend(&output, "\n");
      }
    }
    absl::StrAppend(&output, "#\n");  // Comment token after every key group.
  }
  return output;
}

absl::StatusOr<
    std::vector<absl::flat_hash_map<absl::string_view, absl::string_view>>>
CifDict::ExtractLoopAsList(absl::string_view prefix) const {
  std::vector<absl::string_view> column_names;
  std::vector<std::vector<absl::string_view>> column_data;

  for (const auto& element : *dict_) {
    if (absl::StartsWith(element.first, prefix)) {
      column_names.emplace_back(element.first);
      auto& cells = column_data.emplace_back();
      cells.insert(cells.begin(), element.second.begin(), element.second.end());
    }
  }
  // Make sure all columns have the same number of rows.
  const std::size_t num_rows = column_data.empty() ? 0 : column_data[0].size();
  for (const auto& column : column_data) {
    if (column.size() != num_rows) {
      return absl::InvalidArgumentError(absl::StrCat(
          GetDataName(),
          ": Columns do not have the same number of rows for prefix: '", prefix,
          "'. One possible reason could be not including the trailing dot, "
          "e.g. '_atom_site.'."));
    }
  }

  std::vector<absl::flat_hash_map<absl::string_view, absl::string_view>> result;
  result.reserve(num_rows);
  CHECK_EQ(column_names.size(), column_data.size());
  for (std::size_t row_index = 0; row_index < num_rows; ++row_index) {
    auto& row_dict = result.emplace_back();
    row_dict.reserve(column_names.size());
    for (int col_index = 0; col_index < column_names.size(); ++col_index) {
      row_dict[column_names[col_index]] = column_data[col_index][row_index];
    }
  }
  return result;
}

absl::StatusOr<absl::flat_hash_map<
    absl::string_view,
    absl::flat_hash_map<absl::string_view, absl::string_view>>>
CifDict::ExtractLoopAsDict(absl::string_view prefix,
                           absl::string_view index) const {
  if (!absl::StartsWith(index, prefix)) {
    return absl::InvalidArgumentError(
        absl::StrCat(GetDataName(), ": The loop index '", index,
                     "' must start with the loop prefix '", prefix, "'."));
  }
  absl::flat_hash_map<absl::string_view,
                      absl::flat_hash_map<absl::string_view, absl::string_view>>
      result;
  auto loop_as_list = ExtractLoopAsList(prefix);
  if (!loop_as_list.ok()) {
    return loop_as_list.status();
  }
  result.reserve(loop_as_list->size());
  for (auto& entry : *loop_as_list) {
    if (const auto it = entry.find(index); it != entry.end()) {
      result[it->second] = entry;
    } else {
      return absl::InvalidArgumentError(absl::StrCat(
          GetDataName(), ": The index column '", index,
          "' could not be found in the loop with prefix '", prefix, "'."));
    }
  }
  return result;
}

absl::StatusOr<std::vector<std::string>> Tokenize(
    absl::string_view cif_string) {
  HeapStrings heap_strings;
  auto tokens = TokenizeInternal(cif_string, &heap_strings);
  if (!tokens.ok()) {
    return tokens.status();
  }
  return std::vector<std::string>(tokens->begin(), tokens->end());
}

absl::StatusOr<std::vector<absl::string_view>> SplitLine(
    absl::string_view line) {
  std::vector<absl::string_view> tokens;
  if (!SplitLineInline(line, &tokens)) {
    return absl::InvalidArgumentError(
        absl::StrCat("Line ended with quote open: ", line));
  }
  return tokens;
}

absl::StatusOr<absl::flat_hash_map<std::string, CifDict>> ParseMultiDataCifDict(
    absl::string_view cif_string) {
  absl::flat_hash_map<std::string, CifDict> mapping;
  constexpr absl::string_view delimitor = "data_";
  // Check cif_string starts with correct offset.
  if (!cif_string.empty() && !absl::StartsWith(cif_string, delimitor)) {
    return absl::InvalidArgumentError(
        "Invalid format. MultiDataCifDict must start with 'data_'");
  }
  for (absl::string_view data_block :
       absl::StrSplit(cif_string, delimitor, absl::SkipEmpty())) {
    absl::string_view block_with_delimitor(
        data_block.data() - delimitor.size(),
        data_block.size() + delimitor.size());
    absl::StatusOr<CifDict> parsed_block =
        CifDict::FromString(block_with_delimitor);
    if (!parsed_block.ok()) {
      return parsed_block.status();
    }
    absl::string_view data_name = parsed_block->GetDataName();
    mapping[data_name] = *std::move(parsed_block);
  }

  return mapping;
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/parsers/cpp/cif_dict_lib.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

// A C++ implementation of a CIF parser. For the format specification see
// https://www.iucr.org/resources/cif/spec/version1.1/cifsyntax
#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_CIF_DICT_LIB_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_CIF_DICT_LIB_H_

#include <cstddef>
#include <memory>
#include <string>
#include <utility>
#include <vector>

#include "absl/container/flat_hash_map.h"
#include "absl/container/node_hash_map.h"
#include "absl/status/statusor.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"

namespace alphafold3 {

class CifDict {
 public:
  // Use absl::node_hash_map since it guarantees pointer stability.
  using Dict = absl::node_hash_map<std::string, std::vector<std::string>>;

  CifDict() = default;

  explicit CifDict(Dict dict)
      : dict_(std::make_shared<const Dict>(std::move(dict))) {}

  // Converts a CIF string into a dictionary mapping each CIF field to a list of
  // values that field contains.
  static absl::StatusOr<CifDict> FromString(absl::string_view cif_string);

  // Converts the CIF into into a string that is a valid CIF file.
  absl::StatusOr<std::string> ToString() const;

  // Extracts loop associated with a prefix from mmCIF data as a list.
  // Reference for loop_ in mmCIF:
  // http://mmcif.wwpdb.org/docs/tutorials/mechanics/pdbx-mmcif-syntax.html
  // Args:
  // prefix: Prefix shared by each of the data items in the loop.
  //   e.g. '_entity_poly_seq.', where the data items are _entity_poly_seq.num,
  //   _entity_poly_seq.mon_id. Should include the trailing period.
  //
  // Returns a list of dicts; each dict represents 1 entry from an mmCIF loop.
  // Lifetime of string_views tied to this.
  absl::StatusOr<
      std::vector<absl::flat_hash_map<absl::string_view, absl::string_view>>>
  ExtractLoopAsList(absl::string_view prefix) const;

  // Extracts loop associated with a prefix from mmCIF data as a dictionary.
  // Args:
  // prefix: Prefix shared by each of the data items in the loop.
  //   e.g. '_entity_poly_seq.', where the data items are _entity_poly_seq.num,
  //   _entity_poly_seq.mon_id. Should include the trailing period.
  // index: Which item of loop data should serve as the key.
  //
  // Returns a dict of dicts; each dict represents 1 entry from an mmCIF loop,
  // indexed by the index column.
  // Lifetime of string_views tied to this.
  absl::StatusOr<absl::flat_hash_map<
      absl::string_view,
      absl::flat_hash_map<absl::string_view, absl::string_view>>>
  ExtractLoopAsDict(absl::string_view prefix, absl::string_view index) const;

  // Returns value at key if present or an empty list.
  absl::Span<const std::string> operator[](absl::string_view key) const {
    auto it = dict_->find(key);
    if (it != dict_->end()) {
      return it->second;
    }
    return {};
  }

  // Returns boolean of whether dict contains key.
  bool Contains(absl::string_view key) const { return dict_->contains(key); }

  // Returns number of values for the given key if present, 0 otherwise.
  size_t ValueLength(absl::string_view key) const {
    return (*this)[key].size();
  }

  // Returns the size of the underlying dictionary.
  std::size_t Length() { return dict_->size(); }

  // Creates a copy of this CifDict object that will contain the original values
  // but only if not updated by the given dictionary.
  // E.g. if the CifDict = {a: [a1, a2], b: [b1]} and other = {a: [x], c: [z]},
  // you will get {a: [x], b: [b1], c: [z]}.
  CifDict CopyAndUpdate(Dict other) const {
    other.insert(dict_->begin(), dict_->end());
    return CifDict(std::move(other));
  }

  // Returns the value of the special CIF data_ field.
  absl::string_view GetDataName() const {
    // The data_ element has to be present by construction.
    if (auto it = dict_->find("data_");
        it != dict_->end() && !it->second.empty()) {
      return it->second.front();
    } else {
      return "";
    }
  }

  const std::shared_ptr<const Dict>& dict() const { return dict_; }

 private:
  std::shared_ptr<const Dict> dict_;
};

// Tokenizes a CIF string into a list of string tokens. This is more involved
// than just a simple split on whitespace as CIF allows comments and quoting.
absl::StatusOr<std::vector<std::string>> Tokenize(absl::string_view cif_string);

// Tokenizes a single line of a CIF string.
absl::StatusOr<std::vector<absl::string_view>> SplitLine(
    absl::string_view line);

// Parses a CIF string with multiple data records and returns a mapping from
// record names to CifDict objects. For instance, the following CIF string:
//
// data_001
// _foo bar
//
// data_002
// _foo baz
//
// will be parsed as:
// {'001': CifDict({'_foo': ['bar']}),
//  '002': CifDict({'_foo': ['baz']})}
absl::StatusOr<absl::flat_hash_map<std::string, CifDict>> ParseMultiDataCifDict(
    absl::string_view cif_string);

}  // namespace alphafold3

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_CIF_DICT_LIB_H_


================================================
FILE: src/alphafold3/parsers/cpp/cif_dict_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <Python.h>

#include <cstddef>
#include <cstdint>
#include <cstring>
#include <limits>
#include <memory>
#include <string>
#include <type_traits>
#include <utility>
#include <vector>

#include "numpy/ndarrayobject.h"
#include "numpy/ndarraytypes.h"
#include "numpy/npy_common.h"
#include "absl/base/no_destructor.h"
#include "absl/container/flat_hash_map.h"
#include "absl/status/status.h"
#include "absl/status/statusor.h"
#include "absl/strings/numbers.h"
#include "absl/strings/str_cat.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"
#include "pybind11/attr.h"
#include "pybind11/cast.h"
#include "pybind11/gil.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11/stl.h"

namespace alphafold3 {
namespace {
namespace py = pybind11;

template <typename Item, typename ForEach>
bool GatherArray(size_t num_dims, npy_intp* shape_array, npy_intp* stride_array,
                 const char* data, absl::Span<const std::string> values,
                 ForEach&& for_each_cb) {
  if (num_dims == 1) {
    const npy_intp shape = shape_array[0];
    const npy_intp stride = stride_array[0];
    for (size_t i = 0; i < shape; ++i) {
      Item index;
      std::memcpy(&index, data + stride * i, sizeof(Item));
      if (index < 0 || index >= values.size()) {
        PyErr_SetString(PyExc_IndexError,
                        absl::StrCat("index ", index,
                                     " is out of bounds for column with size ",
                                     values.size())
                            .c_str());
        return false;
      }
      if (!for_each_cb(values[index])) {
        return false;
      }
    }
  } else if (num_dims == 0) {
    Item index;
    std::memcpy(&index, data, sizeof(Item));
    if (index < 0 || index >= values.size()) {
      PyErr_SetString(
          PyExc_IndexError,
          absl::StrCat("index ", index,
                       " is out of bounds for column with size ", values.size())
              .c_str());
      return false;
    }
    if (!for_each_cb(values[index])) {
      return false;
    }
  } else {
    const npy_intp shape = shape_array[0];
    const npy_intp stride = stride_array[0];
    for (size_t i = 0; i < shape; ++i) {
      if (!GatherArray<Item>(num_dims - 1, shape_array + 1, stride_array + 1,
                             data + stride * i, values, for_each_cb)) {
        return false;
      }
    }
  }
  return true;
}

template <typename Size, typename ForEach>
bool Gather(PyObject* gather, absl::Span<const std::string> values,
            Size&& size_cb, ForEach&& for_each_cb) {
  if (gather == Py_None) {
    npy_intp dim = static_cast<npy_intp>(values.size());
    if (!size_cb(absl::MakeSpan(&dim, 1))) {
      return false;
    }
    for (const std::string& v : values) {
      if (!for_each_cb(v)) {
        return false;
      }
    }
    return true;
  }
  if (PySlice_Check(gather)) {
    Py_ssize_t start, stop, step, slice_length;
    if (PySlice_GetIndicesEx(gather, values.size(), &start, &stop, &step,
                             &slice_length) != 0) {
      return false;
    }
    npy_intp dim = static_cast<npy_intp>(slice_length);
    if (!size_cb(absl::MakeSpan(&dim, 1))) {
      return false;
    }
    for (size_t i = 0; i < slice_length; ++i) {
      if (!for_each_cb(values[start + i * step])) {
        return false;
      }
    }
    return true;
  }
  if (PyArray_Check(gather)) {
    PyArrayObject* gather_array = reinterpret_cast<PyArrayObject*>(gather);
    auto shape =
        absl::MakeSpan(PyArray_DIMS(gather_array), PyArray_NDIM(gather_array));
    switch (PyArray_TYPE(gather_array)) {
      case NPY_INT16:
        if (!size_cb(shape)) {
          return false;
        }
        return GatherArray<std::int16_t>(shape.size(), shape.data(),
                                         PyArray_STRIDES(gather_array),
                                         PyArray_BYTES(gather_array), values,
                                         std::forward<ForEach>(for_each_cb));
      case NPY_UINT16:
        if (!size_cb(shape)) {
          return false;
        }
        return GatherArray<std::uint16_t>(shape.size(), shape.data(),
                                          PyArray_STRIDES(gather_array),
                                          PyArray_BYTES(gather_array), values,
                                          std::forward<ForEach>(for_each_cb));
      case NPY_INT32:
        if (!size_cb(shape)) {
          return false;
        }
        return GatherArray<std::int32_t>(shape.size(), shape.data(),
                                         PyArray_STRIDES(gather_array),
                                         PyArray_BYTES(gather_array), values,
                                         std::forward<ForEach>(for_each_cb));
      case NPY_UINT32:
        if (!size_cb(shape)) {
          return false;
        }
        return GatherArray<std::uint32_t>(shape.size(), shape.data(),
                                          PyArray_STRIDES(gather_array),
                                          PyArray_BYTES(gather_array), values,
                                          std::forward<ForEach>(for_each_cb));
      case NPY_INT64:
        if (!size_cb(shape)) {
          return false;
        }
        return GatherArray<std::int64_t>(shape.size(), shape.data(),
                                         PyArray_STRIDES(gather_array),
                                         PyArray_BYTES(gather_array), values,
                                         std::forward<ForEach>(for_each_cb));
      case NPY_UINT64:
        if (!size_cb(shape)) {
          return false;
        }
        return GatherArray<std::uint64_t>(shape.size(), shape.data(),
                                          PyArray_STRIDES(gather_array),
                                          PyArray_BYTES(gather_array), values,
                                          std::forward<ForEach>(for_each_cb));
      default:
        PyErr_SetString(PyExc_TypeError, "Unsupported NumPy array type.");
        return false;
    }
  }

  PyErr_Format(PyExc_TypeError, "Invalid gather %R", gather);
  return false;
}

// Creates a NumPy array of objects of given strings. Reusing duplicates where
// possible.
PyObject* ConvertStrings(PyObject* gather, PyArray_Descr* type,
                         absl::Span<const std::string> values) {
  absl::flat_hash_map<absl::string_view, PyObject*> existing;

  PyObject* ret = nullptr;
  PyObject** dst;
  if (Gather(
          gather, values,
          [&dst, &ret, type](absl::Span<const npy_intp> size) {
            ret = PyArray_NewFromDescr(
                /*subtype=*/&PyArray_Type,
                /*type=*/type,
                /*nd=*/size.size(),
                /*dims=*/size.data(),
                /*strides=*/nullptr,
                /*data=*/nullptr,
                /*flags=*/0,
                /*obj=*/nullptr);
            dst = static_cast<PyObject**>(
                PyArray_DATA(reinterpret_cast<PyArrayObject*>(ret)));
            return true;
          },
          [&dst, &existing](absl::string_view value) {
            auto [it, inserted] = existing.emplace(value, nullptr);
            if (inserted) {
              it->second =
                  PyUnicode_FromStringAndSize(value.data(), value.size());
              PyUnicode_InternInPlace(&it->second);
            } else {
              Py_INCREF(it->second);
            }
            *dst++ = it->second;
            return true;
          })) {
    return ret;
  } else {
    Py_XDECREF(ret);
    return nullptr;
  }
}

// Creates NumPy array with given dtype given specified converter.
// `converter` shall have the following signature:
// bool converter(const std::string& value, T* result);
// It must return whether conversion is successful and store conversion in
// result.
template <typename T, typename C>
inline PyObject* Convert(PyObject* gather, PyArray_Descr* type,
                         absl::Span<const std::string> values, C&& converter) {
  py::object ret;
  T* dst;
  if (Gather(
          gather, values,
          [&dst, &ret, type](absl::Span<const npy_intp> size) {
            // Construct uninitialised NumPy array of type T.
            ret = py::reinterpret_steal<py::object>(PyArray_NewFromDescr(
                /*subtype=*/&PyArray_Type,
                /*type=*/type,
                /*nd=*/size.size(),
                /*dims=*/size.data(),
                /*strides=*/nullptr,
                /*data=*/nullptr,
                /*flags=*/0,
                /*obj=*/nullptr));

            dst = static_cast<T*>(
                PyArray_DATA(reinterpret_cast<PyArrayObject*>(ret.ptr())));
            return true;
          },
          [&dst, &converter](const std::string& value) {
            if (!converter(value, dst++)) {
              PyErr_SetString(PyExc_ValueError, value.c_str());
              return false;
            }
            return true;
          })) {
    return ret.release().ptr();
  }
  return nullptr;
}

PyObject* CifDictGetArray(const CifDict& self, absl::string_view key,
                          PyObject* dtype, PyObject* gather) {
  import_array();
  PyArray_Descr* type = nullptr;
  if (dtype == Py_None) {
    type = PyArray_DescrFromType(NPY_OBJECT);
  } else if (PyArray_DescrConverter(dtype, &type) == NPY_FAIL || !type) {
    PyErr_Format(PyExc_TypeError, "Invalid dtype %R", dtype);
    Py_XDECREF(type);
    return nullptr;
  }
  auto entry = self.dict()->find(key);
  if (entry == self.dict()->end()) {
    Py_DECREF(type);
    PyErr_SetObject(PyExc_KeyError,
                    PyUnicode_FromStringAndSize(key.data(), key.size()));
    return nullptr;
  }

  auto int_convert = [](absl::string_view str, auto* value) {
    return absl::SimpleAtoi(str, value);
  };

  auto int_convert_bounded = [](absl::string_view str, auto* value) {
    int64_t v;
    if (absl::SimpleAtoi(str, &v)) {
      using limits =
          std::numeric_limits<std::remove_reference_t<decltype(*value)>>;
      if (limits::min() <= v && v <= limits::max()) {
        *value = v;
        return true;
      }
    }
    return false;
  };

  absl::Span<const std::string> values = entry->second;

  switch (type->type_num) {
    case NPY_DOUBLE:
      return Convert<double>(
          gather, type, values, [](absl::string_view str, double* value) {
            if (str == ".") {
              *value = std::numeric_limits<double>::quiet_NaN();
              return true;
            }
            return absl::SimpleAtod(str, value);
          });
    case NPY_FLOAT:
      return Convert<float>(
          gather, type, values, [](absl::string_view str, float* value) {
            if (str == ".") {
              *value = std::numeric_limits<float>::quiet_NaN();
              return true;
            }
            return absl::SimpleAtof(str, value);
          });
    case NPY_INT8:
      return Convert<int8_t>(gather, type, values, int_convert_bounded);
    case NPY_INT16:
      return Convert<int16_t>(gather, type, values, int_convert_bounded);
    case NPY_INT32:
      return Convert<int32_t>(gather, type, values, int_convert);
    case NPY_INT64:
      return Convert<int64_t>(gather, type, values, int_convert);
    case NPY_UINT8:
      return Convert<uint8_t>(gather, type, values, int_convert_bounded);
    case NPY_UINT16:
      return Convert<uint16_t>(gather, type, values, int_convert_bounded);
    case NPY_UINT32:
      return Convert<uint32_t>(gather, type, values, int_convert);
    case NPY_UINT64:
      return Convert<uint64_t>(gather, type, values, int_convert);
    case NPY_BOOL:
      return Convert<bool>(gather, type, values,
                           [](absl::string_view str, bool* value) {
                             if (str == "n" || str == "no") {
                               *value = false;
                               return true;
                             }
                             if (str == "y" || str == "yes") {
                               *value = true;
                               return true;
                             }
                             return false;
                           });
    case NPY_OBJECT:
      return ConvertStrings(gather, type, values);
    default: {
      PyErr_Format(PyExc_TypeError, "Unsupported dtype %R", dtype);
      Py_XDECREF(type);
      return nullptr;
    }
  }
}

}  // namespace

void RegisterModuleCifDict(pybind11::module m) {
  using Value = std::vector<std::string>;
  static absl::NoDestructor<std::vector<std::string>> empty_values;

  m.def(
      "from_string",
      [](absl::string_view s) {
        absl::StatusOr<CifDict> dict = CifDict::FromString(s);
        if (!dict.ok()) {
          throw py::value_error(dict.status().ToString());
        }
        return *dict;
      },
      py::call_guard<py::gil_scoped_release>());

  m.def(
      "tokenize",
      [](absl::string_view cif_string) {
        absl::StatusOr<std::vector<std::string>> tokens = Tokenize(cif_string);
        if (!tokens.ok()) {
          throw py::value_error(tokens.status().ToString());
        }
        return *std::move(tokens);
      },
      py::arg("cif_string"));

  m.def("split_line", [](absl::string_view line) {
    absl::StatusOr<std::vector<absl::string_view>> tokens = SplitLine(line);
    if (!tokens.ok()) {
      throw py::value_error(tokens.status().ToString());
    }
    return *std::move(tokens);
  });

  m.def(
      "parse_multi_data_cif",
      [](absl::string_view cif_string) {
        auto result = ParseMultiDataCifDict(cif_string);
        if (!result.ok()) {
          throw py::value_error(result.status().ToString());
        }
        py::dict dict;
        for (auto& [key, value] : *result) {
          dict[py::cast(key)] = py::cast(value);
        }
        return dict;
      },
      py::arg("cif_string"));

  auto cif_dict =
      py::class_<CifDict>(m, "CifDict")
          .def(py::init<>([](py::dict dict) {
                 CifDict::Dict result;
                 for (const auto& [key, value] : dict) {
                   result.emplace(py::cast<absl::string_view>(key),
                                  py::cast<std::vector<std::string>>(value));
                 }
                 return CifDict(std::move(result));
               }),
               "Initialise with a map")
          .def("copy_and_update",
               [](const CifDict& self, py::dict dict) {
                 CifDict::Dict result;
                 for (const auto& [key, value] : dict) {
                   result.emplace(py::cast<absl::string_view>(key),
                                  py::cast<std::vector<std::string>>(value));
                 }
                 {
                   py::gil_scoped_release gil_release;
                   return self.CopyAndUpdate(std::move(result));
                 }
               })
          .def(
              "__str__",
              [](const CifDict& self) {
                absl::StatusOr<std::string> result = self.ToString();
                if (!result.ok()) {
                  throw py::value_error(result.status().ToString());
                }
                return *result;
              },
              "Serialize to a string", py::call_guard<py::gil_scoped_release>())
          .def(
              "to_string",
              [](const CifDict& self) {
                absl::StatusOr<std::string> result = self.ToString();
                if (!result.ok()) {
                  throw py::value_error(result.status().ToString());
                }
                return *result;
              },
              "Serialize to a string", py::call_guard<py::gil_scoped_release>())
          .def(
              "to_dict",
              [](const CifDict& self) {
                py::dict result;
                for (const auto& [key, value] : *self.dict()) {
                  result[py::cast(key)] = py::cast(value);
                }
                return result;
              },
              "Returns the CIF data as a Python dict[str, list[str]].")
          .def("value_length", &CifDict::ValueLength, py::arg("key"),
               "Num elements in value")
          .def("__len__",
               [](const CifDict& self) { return self.dict()->size(); })
          .def(
              "__bool__",
              [](const CifDict& self) { return !self.dict()->empty(); },
              "Check whether the map is nonempty")
          .def(
              "__contains__",
              [](const CifDict& self, absl::string_view k) {
                return self.dict()->find(k) != self.dict()->end();
              },
              py::arg("key"), py::call_guard<py::gil_scoped_release>())
          .def("get_data_name", &CifDict::GetDataName)
          .def(
              "get",
              [](const CifDict& self, absl::string_view k,
                 py::object default_value) -> py::object {
                auto it = self.dict()->find(k);
                if (it == self.dict()->end()) return default_value;
                py::list result(it->second.size());
                size_t index = 0;
                for (const std::string& v : it->second) {
                  result[index++] = py::cast(v);
                }
                return result;
              },
              py::arg("key"), py::arg("default_value") = py::none())
          .def(
              "get_array",
              [](const CifDict& self, absl::string_view key, py::handle dtype,
                 py::handle gather) -> py::object {
                PyObject* obj =
                    CifDictGetArray(self, key, dtype.ptr(), gather.ptr());
                if (obj == nullptr) {
                  throw py::error_already_set();
                }
                return py::reinterpret_steal<py::object>(obj);
              },
              py::arg("key"), py::arg("dtype") = py::none(),
              py::arg("gather") = py::none())
          .def(
              "__getitem__",
              [](const CifDict& self, absl::string_view k) -> const Value& {
                auto it = self.dict()->find(k);
                if (it == self.dict()->end()) {
                  throw py::key_error(std::string(k).c_str());
                }
                return it->second;
              },
              py::arg("key"), py::call_guard<py::gil_scoped_release>())
          .def(
              "extract_loop_as_dict",
              [](const CifDict& self, absl::string_view prefix,
                 absl::string_view index) {
                absl::StatusOr<absl::flat_hash_map<
                    absl::string_view,
                    absl::flat_hash_map<absl::string_view, absl::string_view>>>
                    dict;
                {
                  py::gil_scoped_release gil_release;
                  dict = self.ExtractLoopAsDict(prefix, index);
                  if (!dict.ok()) {
                    throw py::value_error(dict.status().ToString());
                  }
                }
                py::dict key_value_dict;
                for (const auto& [key, value] : *dict) {
                  py::dict value_dict;
                  for (const auto& [key2, value2] : value) {
                    value_dict[py::cast(key2)] = py::cast(value2);
                  }
                  key_value_dict[py::cast(key)] = std::move(value_dict);
                }
                return key_value_dict;
              },
              py::arg("prefix"), py::arg("index"))
          .def(
              "extract_loop_as_list",
              [](const CifDict& self, absl::string_view prefix) {
                absl::StatusOr<std::vector<
                    absl::flat_hash_map<absl::string_view, absl::string_view>>>
                    list_dict;
                {
                  py::gil_scoped_release gil_release;
                  list_dict = self.ExtractLoopAsList(prefix);
                  if (!list_dict.ok()) {
                    throw py::value_error(list_dict.status().ToString());
                  }
                }
                py::list list_obj(list_dict->size());
                size_t index = 0;
                for (const auto& value : *list_dict) {
                  py::dict value_dict;
                  for (const auto& [key, value] : value) {
                    value_dict[py::cast(key)] = py::cast(value);
                  }
                  list_obj[index++] = std::move(value_dict);
                }
                return list_obj;
              },
              py::arg("prefix"))
          .def(py::pickle(
              [](const CifDict& self) {  // __getstate__.
                py::tuple result_tuple(1);
                py::dict result;
                for (const auto& [key, value] : *self.dict()) {
                  result[py::cast(key)] = py::cast(value);
                }
                result_tuple[0] = std::move(result);
                return result_tuple;
              },
              [](py::tuple t) {  // __setstate__.
                py::dict dict = t[0].cast<py::dict>();
                CifDict::Dict result;
                for (const auto& [key, value] : dict) {
                  result.emplace(py::cast<absl::string_view>(key),
                                 py::cast<std::vector<std::string>>(value));
                }
                return CifDict(std::move(result));
              }));

  // Item, value, and key views
  struct KeyView {
    CifDict map;
  };

  struct ValueView {
    CifDict map;
  };
  struct ItemView {
    CifDict map;
  };

  py::class_<ItemView>(cif_dict, "ItemView")
      .def("__len__", [](const ItemView& v) { return v.map.dict()->size(); })
      .def(
          "__iter__",
          [](const ItemView& v) {
            return py::make_iterator(v.map.dict()->begin(),
                                     v.map.dict()->end());
          },
          py::keep_alive<0, 1>());

  py::class_<KeyView>(cif_dict, "KeyView")
      .def(
          "__contains__",
          [](const KeyView& v, absl::string_view k) {
            return v.map.dict()->find(k) != v.map.dict()->end();
          },
          py::call_guard<py::gil_scoped_release>())
      .def("__contains__", [](const KeyView&, py::handle) { return false; })
      .def("__len__", [](const KeyView& v) { return v.map.dict()->size(); })
      .def(
          "__iter__",
          [](const KeyView& v) {
            return py::make_key_iterator(v.map.dict()->begin(),
                                         v.map.dict()->end());
          },
          py::keep_alive<0, 1>());

  py::class_<ValueView>(cif_dict, "ValueView")
      .def("__len__", [](const ValueView& v) { return v.map.dict()->size(); })
      .def(
          "__iter__",
          [](const ValueView& v) {
            return py::make_value_iterator(v.map.dict()->begin(),
                                           v.map.dict()->end());
          },
          py::keep_alive<0, 1>());

  cif_dict
      .def(
          "__iter__",
          [](const CifDict& self) {
            return py::make_key_iterator(self.dict()->begin(),
                                         self.dict()->end());
          },
          py::keep_alive<0, 1>())
      .def(
          "keys", [](const CifDict& self) { return KeyView{self}; },
          "Returns an iterable view of the map's keys.")
      .def(
          "values", [](const CifDict& self) { return ValueView{self}; },
          "Returns an iterable view of the map's values.")
      .def(
          "items", [](const CifDict& self) { return ItemView{self}; },
          "Returns an iterable view of the map's items.");
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/parsers/cpp/cif_dict_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_CIF_DICT_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_CIF_DICT_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleCifDict(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_CIF_DICT_PYBIND_H_


================================================
FILE: src/alphafold3/parsers/cpp/fasta_iterator.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

class FastaFileIterator:
    def __init__(self, fasta_path: str) -> None: ...
    def __iter__(self) -> FastaFileIterator: ...
    def __next__(self) -> tuple[str,str]: ...

class FastaStringIterator:
    def __init__(self, fasta_string: str | bytes) -> None: ...
    def __iter__(self) -> FastaStringIterator: ...
    def __next__(self) -> tuple[str,str]: ...

def parse_fasta(fasta_string: str | bytes) -> list[str]: ...
def parse_fasta_include_descriptions(fasta_string: str | bytes) -> tuple[list[str],list[str]]: ...


================================================
FILE: src/alphafold3/parsers/cpp/fasta_iterator_lib.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include "alphafold3/parsers/cpp/fasta_iterator_lib.h"

#include <cstddef>
#include <optional>
#include <string>
#include <utility>
#include <vector>

#include "absl/status/status.h"
#include "absl/status/statusor.h"
#include "absl/strings/ascii.h"
#include "absl/strings/str_cat.h"
#include "absl/strings/str_split.h"
#include "absl/strings/string_view.h"
#include "absl/strings/strip.h"

namespace alphafold3 {

// Parse FASTA string and return list of strings with amino acid sequences.
// Returns a list of amino acid sequences only.
std::vector<std::string> ParseFasta(absl::string_view fasta_string) {
  std::vector<std::string> sequences;
  std::string* sequence = nullptr;
  for (absl::string_view line_raw : absl::StrSplit(fasta_string, '\n')) {
    absl::string_view line = absl::StripAsciiWhitespace(line_raw);
    if (absl::ConsumePrefix(&line, ">")) {
      sequence = &sequences.emplace_back();
    } else if (!line.empty() && sequence != nullptr) {
      absl::StrAppend(sequence, line);
    }
  }
  return sequences;
}

// Parse FASTA string and return list of strings with amino acid sequences.
// Returns two lists: The first one with amino acid sequences, the second with
// the descriptions associated with each sequence.
std::pair<std::vector<std::string>, std::vector<std::string>>
ParseFastaIncludeDescriptions(absl::string_view fasta_string) {
  std::pair<std::vector<std::string>, std::vector<std::string>> result;
  auto& [sequences, descriptions] = result;
  std::string* sequence = nullptr;
  for (absl::string_view line_raw : absl::StrSplit(fasta_string, '\n')) {
    absl::string_view line = absl::StripAsciiWhitespace(line_raw);
    if (absl::ConsumePrefix(&line, ">")) {
      descriptions.emplace_back(line);
      sequence = &sequences.emplace_back();
    } else if (!line.empty() && sequence != nullptr) {
      absl::StrAppend(sequence, line);
    }
  }
  return result;
}

absl::StatusOr<std::pair<std::string, std::string>> FastaFileIterator::Next() {
  std::string line_str;
  while (std::getline(reader_, line_str)) {
    absl::string_view line = line_str;
    line = absl::StripAsciiWhitespace(line);
    if (absl::ConsumePrefix(&line, ">")) {
      if (!description_.has_value()) {
        description_ = line;
      } else {
        std::pair<std::string, std::string> output(sequence_, *description_);
        description_ = line;
        sequence_ = "";
        return output;
      }
    } else if (description_.has_value()) {
      absl::StrAppend(&sequence_, line);
    }
  }
  has_next_ = false;
  reader_.close();
  if (description_.has_value()) {
    return std::pair(sequence_, *description_);
  } else {
    return absl::InvalidArgumentError(
        absl::StrCat("Invalid FASTA file: ", filename_));
  }
}

absl::StatusOr<std::pair<std::string, std::string>>
FastaStringIterator::Next() {
  size_t consumed = 0;
  for (absl::string_view line_raw : absl::StrSplit(fasta_string_, '\n')) {
    consumed += line_raw.size() + 1;  // +1 for the newline character.
    absl::string_view line = absl::StripAsciiWhitespace(line_raw);
    if (absl::ConsumePrefix(&line, ">")) {
      if (!description_.has_value()) {
        description_ = line;
      } else {
        std::pair<std::string, std::string> output(sequence_, *description_);
        description_ = line;
        sequence_ = "";
        fasta_string_.remove_prefix(consumed);
        return output;
      }
    } else if (description_.has_value()) {
      absl::StrAppend(&sequence_, line);
    }
  }
  has_next_ = false;
  if (description_.has_value()) {
    return std::pair(sequence_, *description_);
  } else {
    return absl::InvalidArgumentError("Invalid FASTA string");
  }
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/parsers/cpp/fasta_iterator_lib.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

// A C++ implementation of a FASTA parser.
#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_FASTA_ITERATOR_LIB_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_FASTA_ITERATOR_LIB_H_

#include <fstream>
#include <ios>
#include <optional>
#include <string>
#include <utility>
#include <vector>

#include "absl/status/statusor.h"
#include "absl/strings/string_view.h"

namespace alphafold3 {

// Parse FASTA string and return list of strings with amino acid sequences.
// Returns a list of amino acid sequences only.
std::vector<std::string> ParseFasta(absl::string_view fasta_string);

// Parse FASTA string and return list of strings with amino acid sequences.
// Returns two lists: The first one with amino acid sequences, the second with
// the descriptions associated with each sequence.
std::pair<std::vector<std::string>, std::vector<std::string>>
ParseFastaIncludeDescriptions(absl::string_view fasta_string);

// Lazy FASTA parser for memory efficient FASTA parsing from a path.
class FastaFileIterator {
 public:
  // Initialise FastaFileIterator with filename of fasta. If you initialize
  // reader_ with an invalid path or empty file, it won't fail, only
  // riegeli::ReadLine within the Next method will then return false. That will
  // then trigger the "Invalid FASTA file" error.
  explicit FastaFileIterator(absl::string_view fasta_path)
      : filename_(fasta_path),
        reader_(filename_, std::ios::in),
        has_next_(true) {}

  // Returns whether there are more sequences. Returns true before first call to
  // next even if the file is empty.
  bool HasNext() const { return has_next_; }

  // Fetches the next (sequence, description) from the file.
  absl::StatusOr<std::pair<std::string, std::string>> Next();

 private:
  // Use riegeli::FileReader instead of FileLineIterator for about 2x speedup.
  std::string filename_;
  std::fstream reader_;
  std::optional<std::string> description_;
  std::string sequence_;
  bool has_next_;
};

// Lazy FASTA parser for memory efficient FASTA parsing from a string.
class FastaStringIterator {
 public:
  // Initialise FastaStringIterator with a string_view of a FASTA. If you
  // initialize it with an invalid FASTA string, it won't fail, the Next method
  // will then return false. That will then trigger the "Invalid FASTA" error.
  // WARNING: The object backing the fasta_string string_view must not be
  // deleted while this Iterator is alive.
  explicit FastaStringIterator(absl::string_view fasta_string)
      : fasta_string_(fasta_string), has_next_(true) {}

  // Returns whether there are more sequences. Returns true before first call to
  // next even if the string is empty.
  bool HasNext() const { return has_next_; }

  // Fetches the next (sequence, description) from the string.
  absl::StatusOr<std::pair<std::string, std::string>> Next();

 private:
  absl::string_view fasta_string_;
  bool has_next_;
  std::optional<std::string> description_;
  std::string sequence_;
};

}  // namespace alphafold3

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_FASTA_ITERATOR_LIB_H_


================================================
FILE: src/alphafold3/parsers/cpp/fasta_iterator_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <utility>

#include "absl/status/statusor.h"
#include "absl/strings/string_view.h"
#include "alphafold3/parsers/cpp/fasta_iterator_lib.h"
#include "pybind11/attr.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11/stl.h"

namespace alphafold3 {
namespace {

namespace py = pybind11;

template <typename T>
T ValueOrThrowValueError(absl::StatusOr<T> value) {
  if (!value.ok()) throw py::value_error(value.status().ToString());
  return *std::move(value);
}

constexpr char kFastaFileIteratorDoc[] = R"(
Lazy FASTA parser for memory efficient FASTA parsing from a path.)";

constexpr char kFastaStringIteratorDoc[] = R"(
Lazy FASTA parser for memory efficient FASTA parsing from a string.

WARNING: The object backing the fasta_string string_view must not be
deleted while the FastaStringIterator is alive. E.g. this will break:

```
# Make sure the fasta_string is not interned.
fasta_string = '\n'.join(['>d\nS' for _ in range(10)])
iterator = fasta_iterator.FastaStringIterator(fasta_string)
del fasta_string
iterator.next()  # Heap use-after-free.
```
)";

constexpr char kParseFastaDoc[] = R"(
Parses a FASTA string and returns a list of amino-acid sequences.

Args:
  fasta_string: The contents of a FASTA file.

Returns:
  List of sequences in the FASTA file. Descriptions are ignored.
)";

constexpr char kParseFastaIncludeDescriptionsDoc[] = R"(
Parses a FASTA string, returns amino-acid sequences with descriptions.

Args:
  fasta_string: The contents of a FASTA file.

Returns:
  A tuple with two lists (sequences, descriptions):
  * A list of sequences.
  * A list of sequence descriptions taken from the comment lines. In the
    same order as the sequences.
)";

class PythonFastaStringIterator : public FastaStringIterator {
 public:
  explicit PythonFastaStringIterator(py::object fasta_string)
      : FastaStringIterator(py::cast<absl::string_view>(fasta_string)),
        fasta_string_(std::move(fasta_string)) {}

 private:
  py::object fasta_string_;
};

}  // namespace

void RegisterModuleFastaIterator(pybind11::module m) {
  py::class_<FastaFileIterator>(m, "FastaFileIterator", kFastaFileIteratorDoc)
      .def(py::init<absl::string_view>(), py::arg("fasta_path"))
      .def("__iter__",
           [](FastaFileIterator& iterator) -> FastaFileIterator& {
             return iterator;
           })
      .def(
          "__next__",
          [](FastaFileIterator& iterator) {
            if (iterator.HasNext()) {
              return ValueOrThrowValueError(iterator.Next());
            } else {
              throw py::stop_iteration();
            }
          },
          py::call_guard<py::gil_scoped_release>());

  py::class_<PythonFastaStringIterator>(m, "FastaStringIterator",
                                        kFastaStringIteratorDoc)
      .def(py::init<py::object>(), py::arg("fasta_string"))
      .def("__iter__",
           [](PythonFastaStringIterator& iterator)
               -> PythonFastaStringIterator& { return iterator; })
      .def(
          "__next__",
          [](PythonFastaStringIterator& iterator) {
            if (iterator.HasNext()) {
              return ValueOrThrowValueError(iterator.Next());
            } else {
              throw py::stop_iteration();
            }
          },
          py::call_guard<py::gil_scoped_release>());

  m.def("parse_fasta", &ParseFasta, py::arg("fasta_string"),
        py::call_guard<py::gil_scoped_release>(), py::doc(kParseFastaDoc + 1));
  m.def("parse_fasta_include_descriptions", &ParseFastaIncludeDescriptions,
        py::arg("fasta_string"), py::call_guard<py::gil_scoped_release>(),
        py::doc(kParseFastaIncludeDescriptionsDoc + 1));
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/parsers/cpp/fasta_iterator_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_FASTA_ITERATOR_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_FASTA_ITERATOR_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleFastaIterator(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_FASTA_ITERATOR_PYBIND_H_


================================================
FILE: src/alphafold3/parsers/cpp/msa_conversion.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Type annotations for Python bindings for `msa_conversion`.

The type annotations in this file were modified from the automatically generated
stubgen output.
"""

from collections.abc import Iterable


def align_sequence_to_gapless_query(
    sequence: str | bytes,
    query_sequence: str | bytes,
) -> str: ...


def convert_a3m_to_stockholm(a3m_sequences: Iterable[str]) -> list[str]: ...


================================================
FILE: src/alphafold3/parsers/cpp/msa_conversion_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <algorithm>
#include <cstddef>
#include <stdexcept>
#include <string>
#include <vector>

#include "absl/strings/ascii.h"
#include "absl/strings/str_format.h"
#include "absl/strings/string_view.h"
#include "pybind11/pybind11.h"
#include "pybind11/stl.h"

namespace {

namespace py = pybind11;

std::vector<std::string> ConvertA3MToStockholm(
    std::vector<absl::string_view> a3m_sequences) {
  std::vector<std::string> stockholm_sequences(a3m_sequences.size());
  auto max_length_element =
      std::max_element(a3m_sequences.begin(), a3m_sequences.end(),
                       [](absl::string_view lhs, absl::string_view rhs) {
                         return lhs.size() < rhs.size();
                       });

  for (auto& out : stockholm_sequences) {
    out.reserve(max_length_element->size());
  }

  // While any sequence has remaining columns.
  while (std::any_of(a3m_sequences.begin(), a3m_sequences.end(),
                     [](absl::string_view in) { return !in.empty(); })) {
    if (std::any_of(a3m_sequences.begin(), a3m_sequences.end(),
                    [](absl::string_view in) {
                      return !in.empty() && absl::ascii_islower(in.front());
                    })) {
      // Insertion(s) found at column.
      for (std::size_t i = 0; i < a3m_sequences.size(); ++i) {
        absl::string_view& in = a3m_sequences[i];
        std::string& out = stockholm_sequences[i];
        if (!in.empty() && absl::ascii_islower(in.front())) {
          // Consume insertion.
          out.push_back(absl::ascii_toupper(in.front()));
          in.remove_prefix(1);
        } else {
          // Row requires padding.
          out.push_back('-');
        }
      }
    } else {
      // No insertions found.
      for (std::size_t i = 0; i < a3m_sequences.size(); ++i) {
        absl::string_view& in = a3m_sequences[i];
        std::string& out = stockholm_sequences[i];
        if (!in.empty()) {
          // Consume entire column.
          out.push_back(in.front());
          in.remove_prefix(1);
        } else {
          // One alignment is shorter than the others. Should not happen with
          // valid A3M input.
          throw std::invalid_argument(absl::StrFormat(
              "a3m rows have inconsistent lengths; row %d has no columns left "
              "but not all rows are exhausted",
              i));
        }
      }
    }
  }
  return stockholm_sequences;
}

std::string AlignSequenceToGaplessQuery(absl::string_view sequence,
                                        absl::string_view query_sequence) {
  if (sequence.size() != query_sequence.size()) {
    throw py::value_error(
        absl::StrFormat("The sequence (%d) and the query sequence (%d) don't "
                        "have the same length.",
                        sequence.size(), query_sequence.size()));
  }
  std::string output;
  for (std::size_t residue_index = 0, sequence_length = sequence.size();
       residue_index < sequence_length; ++residue_index) {
    const char query_residue = query_sequence[residue_index];
    const char residue = sequence[residue_index];
    if (query_residue != '-') {
      // No gap in the query, so the residue is aligned.
      output += residue;
    } else if (residue == '-') {
      // Gap in both sequence and query, simply skip.
      continue;
    } else {
      // Gap only in the query, so this must be an inserted residue.
      output += absl::ascii_tolower(residue);
    }
  }
  return output;
}

constexpr char kConvertA3mToStockholm[] = R"(
Converts a list of sequences in a3m format to stockholm format sequences.

As an example if the input is:
abCD
CgD
fCDa

Then the output will be:
ABC-D-
--CGD-
F-C-DA

Args:
  a3m_sequences: A list of strings in a3m format.

Returns
  A list of strings converted to stockholm format.
)";

constexpr char kAlignSequenceToGaplessQuery[] = R"(
Aligns a sequence to a gapless query sequence.

This is useful when converting Stockholm MSA to A3M MSA. Example:
Seq  : AB--E
Query: A--DE
Output: Ab-E.

Args:
  sequence: A string containing to be aligned.
  query_sequence: A string containing the reference sequence to align to.

Returns
  The input sequence with gaps dropped where both the `sequence` and
  `query_sequence` have gaps, and sequence elements non-capitalized where the
  `query_sequence` has a gap, but the `sequence` does not.
)";

}  // namespace

namespace alphafold3 {

void RegisterModuleMsaConversion(pybind11::module m) {
  m.def("convert_a3m_to_stockholm", &ConvertA3MToStockholm,
        py::arg("a3m_sequences"), py::call_guard<py::gil_scoped_release>(),
        py::doc(kConvertA3mToStockholm + 1));
  m.def("align_sequence_to_gapless_query", &AlignSequenceToGaplessQuery,
        py::arg("sequence"), py::arg("query_sequence"),
        py::call_guard<py::gil_scoped_release>(),
        py::doc(kAlignSequenceToGaplessQuery + 1));
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/parsers/cpp/msa_conversion_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_MSA_CONVERSION_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_MSA_CONVERSION_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMsaConversion(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_PARSERS_PYTHON_MSA_CONVERSION_PYBIND_H_


================================================
FILE: src/alphafold3/scripts/copy_to_ssd.sh
================================================
#!/bin/bash
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

set -euo pipefail

readonly SOURCE_DIR=${1:-$HOME/public_databases}
readonly TARGET_DIR=${2:-/mnt/disks/ssd/public_databases}

mkdir -p "${TARGET_DIR}"

FILES=(pdb_seqres_2022_09_28.fasta \
      uniprot_all_2021_04.fa \
      mgy_clusters_2022_05.fa \
      uniref90_2022_05.fa \
      bfd-first_non_consensus_sequences.fasta \
      rfam_14_9_clust_seq_id_90_cov_80_rep_seq.fasta \
      nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq.fasta \
      rnacentral_active_seq_id_90_cov_80_linclust.fasta)

NOT_COPIED_FILES=()

while (( ${#FILES[@]} )); do
  # Get total size of files to copy in bytes
  SOURCE_FILES=( "${FILES[@]/#/${SOURCE_DIR}/}" )
  TOTAL_SIZE=$(du -sbc "${SOURCE_FILES[@]}" | awk 'END{print $1}')

  # Get available space on target drive in bytes
  AVAILABLE_SPACE=$(df --portability --block-size=1 "$TARGET_DIR" | awk 'END{print $4}')

  # Compare sizes and copy if enough space
  if (( TOTAL_SIZE <= AVAILABLE_SPACE )); then
    printf 'Copying files... %s\n' "${FILES[@]}"
    echo "From ${SOURCE_DIR} -> ${TARGET_DIR}"

    for file in "${FILES[@]}"; do
      cp -r "${SOURCE_DIR}/${file}" "${TARGET_DIR}/" &
    done
    break
  else
    NOT_COPIED_FILES+=("${FILES[-1]}")
    unset 'FILES[-1]'
  fi
done

printf 'No room left on ssd for: %s\n' "${NOT_COPIED_FILES[@]}"
wait


================================================
FILE: src/alphafold3/scripts/gcp_mount_ssd.sh
================================================
#!/bin/bash
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

set -euo pipefail

readonly MOUNT_DIR="${1:-/mnt/disks/ssd}"

if [[ -d "${MOUNT_DIR}" ]]; then
  echo "Mount directory ${MOUNT_DIR} already exists, skipping"
  exit 0
fi

for SSD_DISK in $(realpath "$(find /dev/disk/by-id/ | grep google-local)")
do
  # Check if the disk is already formatted
  if ! blkid -o value -s TYPE "${SSD_DISK}" > /dev/null 2>&1; then
    echo "Disk ${SSD_DISK} is not formatted, format it."
    mkfs.ext4 -m 0 -E lazy_itable_init=0,lazy_journal_init=0,discard "${SSD_DISK}" || continue
  fi

  # Check if the disk is already mounted
  if grep -qs "^/dev/nvme0n1 " /proc/mounts; then
    grep -s "^/dev/nvme0n1 " /proc/mounts
    echo "Disk ${SSD_DISK} is already mounted, skip it."
    continue
  fi

  # Disk is not mounted, mount it
  echo "Mounting ${SSD_DISK} to ${MOUNT_DIR}"
  mkdir -p "${MOUNT_DIR}"
  chmod -R 777 "${MOUNT_DIR}"
  mount "${SSD_DISK}" "${MOUNT_DIR}"
  break
done

if [[ ! -d "${MOUNT_DIR}" ]]; then
  echo "No unmounted SSD disks found"
  exit 1
fi


================================================
FILE: src/alphafold3/structure/__init__.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Structure module initialization."""

# pylint: disable=g-importing-member
from alphafold3.structure.bioassemblies import BioassemblyData
from alphafold3.structure.bonds import Bonds
from alphafold3.structure.chemical_components import ChemCompEntry
from alphafold3.structure.chemical_components import ChemicalComponentsData
from alphafold3.structure.chemical_components import get_data_for_ccd_components
from alphafold3.structure.chemical_components import populate_missing_ccd_data
from alphafold3.structure.mmcif import BondParsingError
from alphafold3.structure.parsing import BondAtomId
from alphafold3.structure.parsing import from_atom_arrays
from alphafold3.structure.parsing import from_mmcif
from alphafold3.structure.parsing import from_parsed_mmcif
from alphafold3.structure.parsing import from_res_arrays
from alphafold3.structure.parsing import from_sequences_and_bonds
from alphafold3.structure.parsing import ModelID
from alphafold3.structure.parsing import NoAtomsError
from alphafold3.structure.parsing import SequenceFormat
from alphafold3.structure.structure import ARRAY_FIELDS
from alphafold3.structure.structure import AuthorNamingScheme
from alphafold3.structure.structure import Bond
from alphafold3.structure.structure import CascadeDelete
from alphafold3.structure.structure import concat
from alphafold3.structure.structure import enumerate_residues
from alphafold3.structure.structure import fix_non_standard_polymer_residues
from alphafold3.structure.structure import GLOBAL_FIELDS
from alphafold3.structure.structure import make_empty_structure
from alphafold3.structure.structure import MissingAtomError
from alphafold3.structure.structure import MissingAuthorResidueIdError
from alphafold3.structure.structure import multichain_residue_index
from alphafold3.structure.structure import stack
from alphafold3.structure.structure import Structure
from alphafold3.structure.structure_tables import Atoms
from alphafold3.structure.structure_tables import Chains
from alphafold3.structure.structure_tables import Residues


================================================
FILE: src/alphafold3/structure/bioassemblies.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utilities for parsing and manipulating bioassembly data."""

from collections.abc import Mapping, Sequence
import copy
import dataclasses
from typing import Self

from alphafold3.structure import mmcif
import numpy as np


@dataclasses.dataclass(frozen=True)
class Operation:
  """A rigid transformation operation."""

  trans: np.ndarray  # shape: (3,)
  rot: np.ndarray  # shape: (3, 3)

  def apply_to_coords(self, coords: np.ndarray) -> np.ndarray:
    """Applies the rotation followed by the translation to `coords`."""
    return np.dot(coords, self.rot.T) + self.trans[np.newaxis, :]


@dataclasses.dataclass(frozen=True)
class Transform:
  """A rigid transformation composed of a sequence of `Operation`s."""

  # The sequence of operations that form the transform. These will be applied
  # right-to-left (last-to-first).
  operations: Sequence[Operation]

  # The chain IDs that this transform should be applied to. These are
  # label_asym_ids in the mmCIF spec.
  chain_ids: Sequence[str]

  # A mapping from chain IDs (of chains that participate in this transform)
  # to their new values in the bioassembly.
  chain_id_rename_map: Mapping[str, str]

  def apply_to_coords(self, coords: np.ndarray) -> np.ndarray:
    """Applies the `operations` in right-to-left order."""
    for operation in reversed(self.operations):
      coords = operation.apply_to_coords(coords)
    return coords


def _get_operation(oper_data: Mapping[str, str]) -> Operation:
  """Parses an `Operation` from a mmCIF _pdbx_struct_oper_list row."""
  trans = np.zeros((3,), dtype=np.float32)
  rot = np.zeros((3, 3), dtype=np.float32)
  for i in range(3):
    trans[i] = float(oper_data[f'_pdbx_struct_oper_list.vector[{i + 1}]'])
  for i in range(3):
    for j in range(3):
      rot[i][j] = float(
          oper_data[f'_pdbx_struct_oper_list.matrix[{i + 1}][{j + 1}]']
      )
  return Operation(trans=trans, rot=rot)


class MissingBioassemblyDataError(Exception):
  """Raised when bioassembly data is missing from an mmCIF."""


class BioassemblyData:
  """Stores and processes bioassembly data from mmCIF tables."""

  # Not all of these columns are required for internal operations, but all
  # should be present whenever bioassemblies are defined in an mmCIF to stay
  # consistent with external mmCIFs.
  _REQUIRED_COLUMNS = (
      '_pdbx_struct_assembly.id',
      '_pdbx_struct_assembly.details',
      '_pdbx_struct_assembly.method_details',
      '_pdbx_struct_assembly.oligomeric_details',
      '_pdbx_struct_assembly.oligomeric_count',
      '_pdbx_struct_assembly_gen.assembly_id',
      '_pdbx_struct_assembly_gen.oper_expression',
      '_pdbx_struct_assembly_gen.asym_id_list',
      '_pdbx_struct_oper_list.id',
      '_pdbx_struct_oper_list.type',
      '_pdbx_struct_oper_list.name',
      '_pdbx_struct_oper_list.symmetry_operation',
      '_pdbx_struct_oper_list.matrix[1][1]',
      '_pdbx_struct_oper_list.matrix[1][2]',
      '_pdbx_struct_oper_list.matrix[1][3]',
      '_pdbx_struct_oper_list.vector[1]',
      '_pdbx_struct_oper_list.matrix[2][1]',
      '_pdbx_struct_oper_list.matrix[2][2]',
      '_pdbx_struct_oper_list.matrix[2][3]',
      '_pdbx_struct_oper_list.vector[2]',
      '_pdbx_struct_oper_list.matrix[3][1]',
      '_pdbx_struct_oper_list.matrix[3][2]',
      '_pdbx_struct_oper_list.matrix[3][3]',
      '_pdbx_struct_oper_list.vector[3]',
  )

  def __init__(
      self,
      *,
      pdbx_struct_assembly: Mapping[str, Mapping[str, str]],
      pdbx_struct_assembly_gen: Mapping[str, Sequence[Mapping[str, str]]],
      pdbx_struct_oper_list: Mapping[str, Mapping[str, str]],
      assembly_ids: Sequence[str],
      oper_ids: Sequence[str],
  ):
    for assembly_id in assembly_ids:
      for table, table_name in (
          (pdbx_struct_assembly, '_pdbx_struct_assembly'),
          (pdbx_struct_assembly_gen, '_pdbx_struct_assembly_gen'),
      ):
        if assembly_id not in table:
          raise ValueError(
              f'Assembly ID "{assembly_id}" missing from {table_name} '
              f'with keys: {table.keys()}'
          )
    for oper_id in oper_ids:
      if oper_id not in pdbx_struct_oper_list:
        raise ValueError(
            f'Oper ID "{oper_id}" missing from _pdbx_struct_oper_list '
            f'with keys: {pdbx_struct_oper_list.keys()}'
        )

    self._pdbx_struct_assembly = pdbx_struct_assembly
    self._pdbx_struct_assembly_gen = pdbx_struct_assembly_gen
    self._pdbx_struct_oper_list = pdbx_struct_oper_list
    self._operations = {
        oper_id: _get_operation(oper_data)
        for oper_id, oper_data in self._pdbx_struct_oper_list.items()
    }
    self._assembly_ids = assembly_ids
    self._oper_ids = oper_ids

  @classmethod
  def from_mmcif(cls, cif: mmcif.Mmcif) -> Self:
    """Constructs an instance of `BioassemblyData` from an `Mmcif` object."""
    for col in cls._REQUIRED_COLUMNS:
      if col not in cif:
        raise MissingBioassemblyDataError(col)

    pdbx_struct_assembly = cif.extract_loop_as_dict(
        prefix='_pdbx_struct_assembly.', index='_pdbx_struct_assembly.id'
    )
    pdbx_struct_oper_list = cif.extract_loop_as_dict(
        prefix='_pdbx_struct_oper_list.', index='_pdbx_struct_oper_list.id'
    )

    # _pdbx_struct_assembly_gen is unlike the other two tables because it can
    # have multiple rows share the same assembly ID. This can happen when an
    # assembly is constructed by applying different sets of transforms to
    # different sets of chain IDs. Each of these would have its own row.
    # Here we group rows by their assembly_id.
    pdbx_struct_assembly_gen = {}
    for assembly_id, oper_expression, asym_id_list in zip(
        cif['_pdbx_struct_assembly_gen.assembly_id'],
        cif['_pdbx_struct_assembly_gen.oper_expression'],
        cif['_pdbx_struct_assembly_gen.asym_id_list'],
    ):
      pdbx_struct_assembly_gen.setdefault(assembly_id, []).append({
          '_pdbx_struct_assembly_gen.assembly_id': assembly_id,
          '_pdbx_struct_assembly_gen.oper_expression': oper_expression,
          '_pdbx_struct_assembly_gen.asym_id_list': asym_id_list,
      })

    # We provide these separately to keep track of the original order that they
    # appear in the mmCIF.
    assembly_ids = cif['_pdbx_struct_assembly.id']
    oper_ids = cif['_pdbx_struct_oper_list.id']
    return cls(
        pdbx_struct_assembly=pdbx_struct_assembly,
        pdbx_struct_assembly_gen=pdbx_struct_assembly_gen,
        pdbx_struct_oper_list=pdbx_struct_oper_list,
        assembly_ids=assembly_ids,
        oper_ids=oper_ids,
    )

  @property
  def assembly_ids(self) -> Sequence[str]:
    return self._assembly_ids

  def asym_id_by_assembly_chain_id(self, assembly_id: str) -> Mapping[str, str]:
    asym_id_by_assembly_chain_id = {}
    for transform in self.get_transforms(assembly_id):
      for asym_id, assembly_chain_id in transform.chain_id_rename_map.items():
        asym_id_by_assembly_chain_id[assembly_chain_id] = asym_id
    return asym_id_by_assembly_chain_id

  def assembly_chain_ids_by_asym_id(
      self, assembly_id: str
  ) -> Mapping[str, set[str]]:
    assembly_chain_ids_by_asym_id = {}
    for transform in self.get_transforms(assembly_id):
      for asym_id, assembly_chain_id in transform.chain_id_rename_map.items():
        assembly_chain_ids_by_asym_id.setdefault(asym_id, set()).add(
            assembly_chain_id
        )
    return assembly_chain_ids_by_asym_id

  def get_default_assembly_id(self) -> str:
    """Gets a default assembly ID."""
    # The first assembly is usually (though not always) the best choice.
    # If we find a better heuristic for picking bioassemblies then this
    # method should be updated.
    return min(self._assembly_ids)

  def get_assembly_info(self, assembly_id: str) -> Mapping[str, str]:
    return {
        k.replace('_pdbx_struct_assembly.', ''): v
        for k, v in self._pdbx_struct_assembly[assembly_id].items()
    }

  def get_transforms(self, assembly_id: str) -> Sequence[Transform]:
    """Returns the transforms required to generate the given assembly."""
    partial_transforms = []
    all_chain_ids = set()
    for row in self._pdbx_struct_assembly_gen[assembly_id]:
      oper_expression = row['_pdbx_struct_assembly_gen.oper_expression']
      parsed_oper_id_seqs = mmcif.parse_oper_expr(oper_expression)
      label_asym_ids = row['_pdbx_struct_assembly_gen.asym_id_list'].split(',')
      all_chain_ids |= set(label_asym_ids)
      for parsed_oper_id_seq in parsed_oper_id_seqs:
        partial_transforms.append((parsed_oper_id_seq, label_asym_ids))

    # We start assigning new chain IDs by finding the largest chain ID in
    # the original structure that is involved in this bioassembly, and then
    # starting from the next one.
    max_int_chain_id = max(mmcif.str_id_to_int_id(c) for c in all_chain_ids)
    next_int_chain_id = max_int_chain_id + 1

    transforms = []
    has_been_renamed = set()
    for parsed_oper_id_seq, label_asym_ids in partial_transforms:
      chain_id_rename_map = {}
      for label_asym_id in label_asym_ids:
        if label_asym_id not in has_been_renamed:
          # The first time we see a label_asym_id we don't need to rename it.
          # This isn't strictly necessary since we don't provide any
          # guarantees about chain naming after bioassembly extraction but
          # can make it a bit easier to inspect and compare structures
          # pre and post bioassembly extraction.
          chain_id_rename_map[label_asym_id] = label_asym_id
          has_been_renamed.add(label_asym_id)
        else:
          chain_id_rename_map[label_asym_id] = mmcif.int_id_to_str_id(
              next_int_chain_id
          )
          next_int_chain_id += 1
      transforms.append(
          Transform(
              operations=[
                  self._operations[oper_id] for oper_id in parsed_oper_id_seq
              ],
              chain_ids=label_asym_ids,
              chain_id_rename_map=chain_id_rename_map,
          )
      )
    return transforms

  def to_mmcif_dict(self) -> Mapping[str, Sequence[str]]:
    """Returns the bioassembly data as a dict suitable for `mmcif.Mmcif`."""
    mmcif_dict = {}
    for assembly_id in self._assembly_ids:
      for column, val in self._pdbx_struct_assembly[assembly_id].items():
        mmcif_dict.setdefault(column, []).append(val)
      for row in self._pdbx_struct_assembly_gen[assembly_id]:
        for column, val in row.items():
          mmcif_dict.setdefault(column, []).append(val)
    for oper_id in self._oper_ids:
      for column, val in self._pdbx_struct_oper_list[oper_id].items():
        mmcif_dict.setdefault(column, []).append(val)
    return mmcif_dict

  def rename_label_asym_ids(
      self,
      mapping: Mapping[str, str],
      present_chains: set[str],
  ) -> Self:
    """Returns a new BioassemblyData with renamed label_asym_ids.

    Args:
      mapping: A mapping from original label_asym_ids to their new values. Any
        label_asym_ids in this BioassemblyData that are not in this mapping will
        remain unchanged.
      present_chains: A set of label_asym_ids that are actually present in the
        atom site list. All label_asym_ids that are in the BioassemblyData but
        not in present_chains won't be included in the output BioassemblyData.

    Returns:
      A new BioassemblyData with renamed label_asym_ids.

    Raises:
      ValueError: If any two previously distinct chains do not have unique names
          anymore after the rename.
    """
    new_pdbx_struct_assembly_gen = copy.deepcopy(self._pdbx_struct_assembly_gen)
    for rows in new_pdbx_struct_assembly_gen.values():
      for row in rows:
        old_asym_ids = row['_pdbx_struct_assembly_gen.asym_id_list'].split(',')
        new_asym_ids = [
            mapping.get(label_asym_id, label_asym_id)
            for label_asym_id in old_asym_ids
            if label_asym_id in present_chains
        ]
        if len(set(old_asym_ids) & present_chains) != len(set(new_asym_ids)):
          raise ValueError(
              'Can not rename chains, the new names are not unique: '
              f'{sorted(new_asym_ids)}.'
          )
        row['_pdbx_struct_assembly_gen.asym_id_list'] = ','.join(new_asym_ids)  # pytype: disable=unsupported-operands

    return BioassemblyData(
        pdbx_struct_assembly=copy.deepcopy(self._pdbx_struct_assembly),
        pdbx_struct_assembly_gen=new_pdbx_struct_assembly_gen,
        pdbx_struct_oper_list=copy.deepcopy(self._pdbx_struct_oper_list),
        assembly_ids=copy.deepcopy(self._assembly_ids),
        oper_ids=copy.deepcopy(self._oper_ids),
    )


================================================
FILE: src/alphafold3/structure/bonds.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Bond representation for structure module."""

import collections
from collections.abc import Mapping, Sequence
import dataclasses
import typing
from typing import Self

from alphafold3.structure import table
import numpy as np


@dataclasses.dataclass(frozen=True, kw_only=True)
class Bonds(table.Table):
  """Table of atomic bonds."""

  # mmCIF column: _struct_conn.conn_type_id
  # mmCIF desc: This data item is a pointer to _struct_conn_type.id in the
  #             STRUCT_CONN_TYPE category.
  # E.g.: "covale", "disulf", "hydrog", "metalc".
  type: np.ndarray

  # mmCIF column: _struct_conn.pdbx_role
  # mmCIF desc: The chemical or structural role of the interaction.
  # E.g.: "N-Glycosylation", "O-Glycosylation".
  role: np.ndarray

  # mmCIF columns: _struct_conn.ptnr1_*
  from_atom_key: np.ndarray

  # mmCIF columns: _struct_conn.ptnr2_*
  dest_atom_key: np.ndarray

  @classmethod
  def make_empty(cls) -> Self:
    return cls(
        key=np.empty((0,), dtype=np.int64),
        from_atom_key=np.empty((0,), dtype=np.int64),
        dest_atom_key=np.empty((0,), dtype=np.int64),
        type=np.empty((0,), dtype=object),
        role=np.empty((0,), dtype=object),
    )

  def get_atom_indices(
      self,
      atom_key: np.ndarray,
  ) -> tuple[np.ndarray, np.ndarray]:
    """Returns the indices of the from/dest atoms in the atom_key array."""
    from_atom_missing = ~np.isin(self.from_atom_key, atom_key)
    dest_atom_missing = ~np.isin(self.dest_atom_key, atom_key)
    if np.any(from_atom_missing):
      raise ValueError(
          f'No atoms for from_atom_key {self.from_atom_key[from_atom_missing]}'
      )
    if np.any(dest_atom_missing):
      raise ValueError(
          f'No atoms for dest_atom_key {self.dest_atom_key[dest_atom_missing]}'
      )
    sort_indices = np.argsort(atom_key)
    from_indices_sorted = np.searchsorted(
        atom_key, self.from_atom_key, sorter=sort_indices
    )
    dest_indices_sorted = np.searchsorted(
        atom_key, self.dest_atom_key, sorter=sort_indices
    )
    from_indices = sort_indices[from_indices_sorted]
    dest_indices = sort_indices[dest_indices_sorted]
    return from_indices, dest_indices

  def restrict_to_atoms(self, atom_key: np.ndarray) -> Self:
    if not self.size:  # Early-out for empty table.
      return self
    from_atom_mask = np.isin(self.from_atom_key, atom_key)
    dest_atom_mask = np.isin(self.dest_atom_key, atom_key)
    mask = np.logical_and(from_atom_mask, dest_atom_mask)
    return typing.cast(Bonds, self.filter(mask=mask))

  def to_mmcif_dict_from_atom_arrays(
      self,
      atom_key: np.ndarray,
      chain_id: np.ndarray,
      res_id: np.ndarray,
      res_name: np.ndarray,
      atom_name: np.ndarray,
      auth_asym_id: np.ndarray,
      auth_seq_id: np.ndarray,
      insertion_code: np.ndarray,
  ) -> Mapping[str, Sequence[str] | np.ndarray]:
    """Returns a dict suitable for building a CifDict, representing bonds.

    Args:
      atom_key: A (num_atom,) integer array of atom_keys.
      chain_id: A (num_atom,) array of label_asym_id strings.
      res_id: A (num_atom,) array of label_seq_id strings.
      res_name: A (num_atom,) array of label_comp_id strings.
      atom_name: A (num_atom,) array of label_atom_id strings.
      auth_asym_id: A (num_atom,) array of auth_asym_id strings.
      auth_seq_id: A (num_atom,) array of auth_seq_id strings.
      insertion_code: A (num_atom,) array of insertion code strings.
    """
    mmcif_dict = collections.defaultdict(list)
    ptnr1_indices, ptnr2_indices = self.get_atom_indices(atom_key)

    mmcif_dict['_struct_conn.ptnr1_label_asym_id'] = chain_id[ptnr1_indices]
    mmcif_dict['_struct_conn.ptnr2_label_asym_id'] = chain_id[ptnr2_indices]
    mmcif_dict['_struct_conn.ptnr1_label_comp_id'] = res_name[ptnr1_indices]
    mmcif_dict['_struct_conn.ptnr2_label_comp_id'] = res_name[ptnr2_indices]
    mmcif_dict['_struct_conn.ptnr1_label_seq_id'] = res_id[ptnr1_indices]
    mmcif_dict['_struct_conn.ptnr2_label_seq_id'] = res_id[ptnr2_indices]
    mmcif_dict['_struct_conn.ptnr1_label_atom_id'] = atom_name[ptnr1_indices]
    mmcif_dict['_struct_conn.ptnr2_label_atom_id'] = atom_name[ptnr2_indices]

    mmcif_dict['_struct_conn.ptnr1_auth_asym_id'] = auth_asym_id[ptnr1_indices]
    mmcif_dict['_struct_conn.ptnr2_auth_asym_id'] = auth_asym_id[ptnr2_indices]
    mmcif_dict['_struct_conn.ptnr1_auth_seq_id'] = auth_seq_id[ptnr1_indices]
    mmcif_dict['_struct_conn.ptnr2_auth_seq_id'] = auth_seq_id[ptnr2_indices]
    mmcif_dict['_struct_conn.pdbx_ptnr1_PDB_ins_code'] = insertion_code[
        ptnr1_indices
    ]
    mmcif_dict['_struct_conn.pdbx_ptnr2_PDB_ins_code'] = insertion_code[
        ptnr2_indices
    ]

    label_alt_id = ['?'] * self.size
    mmcif_dict['_struct_conn.pdbx_ptnr1_label_alt_id'] = label_alt_id
    mmcif_dict['_struct_conn.pdbx_ptnr2_label_alt_id'] = label_alt_id

    # We need to set this to make visualisation work in NGL/PyMOL.
    mmcif_dict['_struct_conn.pdbx_value_order'] = ['?'] * self.size

    # We use a symmetry of 1_555 which is the no-op transformation. Other
    # values are used when bonds involve atoms that only exist after expanding
    # the bioassembly, but we don't support this kind of bond at the moment.
    symmetry = ['1_555'] * self.size
    mmcif_dict['_struct_conn.ptnr1_symmetry'] = symmetry
    mmcif_dict['_struct_conn.ptnr2_symmetry'] = symmetry
    bond_type_counter = collections.Counter()
    for bond_row in self.iterrows():
      bond_type = bond_row['type']
      bond_type_counter[bond_type] += 1
      mmcif_dict['_struct_conn.id'].append(
          f'{bond_type}{bond_type_counter[bond_type]}'
      )
      mmcif_dict['_struct_conn.pdbx_role'].append(bond_row['role'])
      mmcif_dict['_struct_conn.conn_type_id'].append(bond_type)

    bond_types = np.unique(self.type)
    mmcif_dict['_struct_conn_type.id'] = bond_types
    unknown = ['?'] * len(bond_types)
    mmcif_dict['_struct_conn_type.criteria'] = unknown
    mmcif_dict['_struct_conn_type.reference'] = unknown

    return dict(mmcif_dict)


def concat_with_atom_keys(
    bonds_tables: Sequence[Bonds | None],
    atom_key_arrays: Sequence[np.ndarray],
) -> tuple[Bonds | None, np.ndarray]:
  """Concatenates bonds tables and atom keys simultaneously.

  Args:
    bonds_tables: A sequence of `Bonds` instances to concatenate. If any are
      None then these are skipped.
    atom_key_arrays: A sequence of integer `atom_key` arrays, where the n-th
      bonds_table referrs to the atoms in the n-th atom_key array. These must
      all be non-None.

  Returns:
    A pair of (bonds, atom_key) where atom_key is a unique atom_key array with
    length equal to the sum of the input atom array sizes, and the bonds table
    contains all the bonds from the individual bonds table inputs.
  """
  if not bonds_tables or not atom_key_arrays:
    if bonds_tables or atom_key_arrays:
      raise ValueError(
          'bonds_tables and atom_keys must have same length but got'
          f' {len(bonds_tables)=} and {len(atom_key_arrays)=}'
      )
    return None, np.array([], dtype=np.int64)
  max_key = -1
  atom_keys_to_concat = []
  types_to_concat = []
  roles_to_concat = []
  from_atom_keys_to_concat = []
  dest_atom_keys_to_concat = []
  for bonds, atom_key in zip(bonds_tables, atom_key_arrays, strict=True):
    if not atom_key.size:
      assert bonds is None or bonds.size == 0
      continue
    assert np.min(atom_key, initial=0) >= 0  # Should always be non-negative!
    offset = max_key + 1
    offset_atom_key = atom_key + offset
    atom_keys_to_concat.append(offset_atom_key)
    max_key = np.max(offset_atom_key)
    if bonds is not None:
      types_to_concat.append(bonds.type)
      roles_to_concat.append(bonds.role)
      from_atom_keys_to_concat.append(bonds.from_atom_key + offset)
      dest_atom_keys_to_concat.append(bonds.dest_atom_key + offset)

  if atom_keys_to_concat:
    concatted_atom_keys = np.concatenate(atom_keys_to_concat, axis=0)
  else:
    concatted_atom_keys = np.array([], dtype=np.int64)

  if types_to_concat:
    assert (
        len(types_to_concat)
        == len(roles_to_concat)
        == len(from_atom_keys_to_concat)
        == len(dest_atom_keys_to_concat)
    )
    num_bonds = sum(b.size for b in bonds_tables if b is not None)
    concatted_bonds = Bonds(
        key=np.arange(num_bonds, dtype=np.int64),
        type=np.concatenate(types_to_concat, axis=0),
        role=np.concatenate(roles_to_concat, axis=0),
        from_atom_key=np.concatenate(from_atom_keys_to_concat, axis=0),
        dest_atom_key=np.concatenate(dest_atom_keys_to_concat, axis=0),
    )
  else:
    concatted_bonds = None

  return concatted_bonds, concatted_atom_keys


================================================
FILE: src/alphafold3/structure/chemical_components.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utilities for manipulating chemical components data."""

from collections.abc import Iterable, Mapping, Sequence
import dataclasses
import functools
from typing import Self

from alphafold3.constants import chemical_components
from alphafold3.constants import residue_names
from alphafold3.structure import mmcif
import rdkit.Chem as rd_chem


@dataclasses.dataclass(frozen=True)
class ChemCompEntry:
  """Items of _chem_comp category.

  For the full list of items and their semantics see
  http://mmcif.rcsb.org/dictionaries/mmcif_pdbx_v50.dic/Categories/chem_comp.html
  """

  type: str
  name: str = '?'
  pdbx_synonyms: str = '?'
  formula: str = '?'
  formula_weight: str = '?'
  mon_nstd_flag: str = '?'
  pdbx_smiles: str | None = None

  def __post_init__(self):
    for field, value in vars(self).items():
      if not value and value is not None:
        raise ValueError(f"{field} value can't be an empty string.")

  def extends(self, other: Self) -> bool:
    """Checks whether this ChemCompEntry extends another one."""
    for field, value in vars(self).items():
      other_value = getattr(other, field)
      if _value_is_missing(other_value):
        continue
      if value != other_value:
        return False
    return True

  @property
  def rdkit_mol(self) -> rd_chem.Mol:
    """Returns an RDKit Mol, created via RDKit from entry SMILES string."""
    if not self.pdbx_smiles:
      raise ValueError('Cannot construct RDKit Mol with empty pdbx_smiles')
    return rd_chem.MolFromSmiles(self.pdbx_smiles)


_REQUIRED_MMCIF_COLUMNS = ('_chem_comp.id', '_chem_comp.type')


class MissingChemicalComponentsDataError(Exception):
  """Raised when chemical components data is missing from an mmCIF."""


@dataclasses.dataclass(frozen=True)
class ChemicalComponentsData:
  """Extra information for chemical components occurring in mmCIF.

  Fields:
    chem_comp: A mapping from _chem_comp.id to associated items in the
      chem_comp category.
  """

  chem_comp: Mapping[str, ChemCompEntry]

  @classmethod
  def from_mmcif(
      cls, cif: mmcif.Mmcif, fix_mse: bool, fix_unknown_dna: bool
  ) -> Self:
    """Constructs an instance of ChemicalComponentsData from an Mmcif object."""
    for col in _REQUIRED_MMCIF_COLUMNS:
      if col not in cif:
        raise MissingChemicalComponentsDataError(col)

    id_ = cif['_chem_comp.id']  # Guaranteed to be present.
    type_ = cif['_chem_comp.type']  # Guaranteed to be present.
    name = cif.get('_chem_comp.name', ['?'] * len(id_))
    synonyms = cif.get('_chem_comp.pdbx_synonyms', ['?'] * len(id_))
    formula = cif.get('_chem_comp.formula', ['?'] * len(id_))
    weight = cif.get('_chem_comp.formula_weight', ['?'] * len(id_))
    mon_nstd_flag = cif.get('_chem_comp.mon_nstd_flag', ['?'] * len(id_))
    smiles = cif.get('_chem_comp.pdbx_smiles', ['?'] * len(id_))
    smiles = [None if s == '?' else s for s in smiles]

    chem_comp = {
        component_name: ChemCompEntry(*entry)
        for component_name, *entry in zip(
            id_, type_, name, synonyms, formula, weight, mon_nstd_flag, smiles
        )
    }

    if fix_mse and 'MSE' in chem_comp:
      if 'MET' not in chem_comp:
        chem_comp['MET'] = ChemCompEntry(
            type='L-PEPTIDE LINKING',
            name='METHIONINE',
            pdbx_synonyms='?',
            formula='C5 H11 N O2 S',
            formula_weight='149.211',
            mon_nstd_flag='y',
            pdbx_smiles=None,
        )

    if fix_unknown_dna and 'N' in chem_comp:
      # Do not delete 'N' as it may be needed for RNA in the system.
      if 'DN' not in chem_comp:
        chem_comp['DN'] = ChemCompEntry(
            type='DNA LINKING',
            name="UNKNOWN 2'-DEOXYNUCLEOTIDE",
            pdbx_synonyms='?',
            formula='C5 H11 O6 P',
            formula_weight='198.111',
            mon_nstd_flag='y',
            pdbx_smiles=None,
        )

    return ChemicalComponentsData(chem_comp)

  def to_mmcif_dict(self) -> Mapping[str, Sequence[str]]:
    """Returns chemical components data as a dict suitable for `mmcif.Mmcif`."""
    mmcif_dict = {}

    mmcif_fields = set()
    for entry in self.chem_comp.values():
      for field, value in vars(entry).items():
        if value:
          mmcif_fields.add(field)
    chem_comp_ids = []
    for component_id in sorted(self.chem_comp):
      entry = self.chem_comp[component_id]
      chem_comp_ids.append(component_id)
      for field in mmcif_fields:
        mmcif_dict.setdefault(f'_chem_comp.{field}', []).append(
            getattr(entry, field) or '?'
        )
    if chem_comp_ids:
      mmcif_dict['_chem_comp.id'] = chem_comp_ids
    return mmcif_dict


def _value_is_missing(value: str) -> bool:
  return not value or value in ('.', '?')


def get_data_for_ccd_components(
    ccd: chemical_components.Ccd,
    chemical_component_ids: Iterable[str],
    populate_pdbx_smiles: bool = False,
) -> ChemicalComponentsData:
  """Returns `ChemicalComponentsData` for chemical components known by PDB."""
  chem_comp = {}
  for chemical_component_id in chemical_component_ids:
    chem_data = chemical_components.component_name_to_info(
        ccd=ccd, res_name=chemical_component_id
    )
    if not chem_data:
      continue
    chem_comp[chemical_component_id] = ChemCompEntry(
        type=chem_data.type,
        name=chem_data.name,
        pdbx_synonyms=chem_data.pdbx_synonyms,
        formula=chem_data.formula,
        formula_weight=chem_data.formula_weight,
        mon_nstd_flag=chem_data.mon_nstd_flag,
        pdbx_smiles=(
            chem_data.pdbx_smiles or None if populate_pdbx_smiles else None
        ),
    )
  return ChemicalComponentsData(chem_comp=chem_comp)


def populate_missing_ccd_data(
    ccd: chemical_components.Ccd,
    chemical_components_data: ChemicalComponentsData,
    chemical_component_ids: Iterable[str] | None = None,
    populate_pdbx_smiles: bool = False,
) -> ChemicalComponentsData:
  """Populates missing data for the chemical components from CCD.

  Args:
    ccd: The chemical components database.
    chemical_components_data: ChemicalComponentsData to populate missing values
      for. This function doesn't modify the object, extended version is provided
      as a return value.
    chemical_component_ids: chemical components to populate missing values for.
      If not specified, the function will consider all chemical components which
      are already present in `chemical_components_data`.
    populate_pdbx_smiles: whether to populate `pdbx_smiles` field using SMILES
      descriptors from _pdbx_chem_comp_descriptor CCD table. If CCD provides
      multiple SMILES strings, any of them could be used.

  Returns:
    New instance of ChemicalComponentsData without missing values for CCD
    entries.
  """
  if chemical_component_ids is None:
    chemical_component_ids = chemical_components_data.chem_comp.keys()

  ccd_data = get_data_for_ccd_components(
      ccd, chemical_component_ids, populate_pdbx_smiles
  )
  chem_comp = dict(chemical_components_data.chem_comp)
  for component_id, ccd_entry in ccd_data.chem_comp.items():
    if component_id not in chem_comp:
      chem_comp[component_id] = ccd_entry
    else:
      already_specified_fields = {
          field: value
          for field, value in vars(chem_comp[component_id]).items()
          if not _value_is_missing(value)
      }
      chem_comp[component_id] = ChemCompEntry(
          **{**vars(ccd_entry), **already_specified_fields}
      )
  return ChemicalComponentsData(chem_comp=chem_comp)


def get_all_atoms_in_entry(
    ccd: chemical_components.Ccd, res_name: str
) -> Mapping[str, Sequence[str]]:
  """Get all possible atoms and bonds for this residue in a standard order.

  Args:
    ccd: The chemical components dictionary.
    res_name: Full CCD name.

  Returns:
    A dictionary table of the atoms and bonds for this residue in this residue
    type.
  """
  # The CCD version of 'UNK' is weird. It has a CB and a CG atom. We just want
  # the minimal amino-acid here which is GLY.
  if res_name == 'UNK':
    res_name = 'GLY'
  ccd_data = ccd.get(res_name)
  if not ccd_data:
    raise ValueError(f'Unknown residue type {res_name}')

  keys = (
      '_chem_comp_atom.atom_id',
      '_chem_comp_atom.type_symbol',
      '_chem_comp_bond.atom_id_1',
      '_chem_comp_bond.atom_id_2',
  )

  # Add terminal hydrogens for protonation of the N-terminal
  if res_name == 'PRO':
    res_atoms = {key: [*ccd_data.get(key, [])] for key in keys}
    res_atoms['_chem_comp_atom.atom_id'].extend(['H2', 'H3'])
    res_atoms['_chem_comp_atom.type_symbol'].extend(['H', 'H'])
    res_atoms['_chem_comp_bond.atom_id_1'].extend(['N', 'N'])
    res_atoms['_chem_comp_bond.atom_id_2'].extend(['H2', 'H3'])
  elif res_name in residue_names.PROTEIN_TYPES_WITH_UNKNOWN:
    res_atoms = {key: [*ccd_data.get(key, [])] for key in keys}
    res_atoms['_chem_comp_atom.atom_id'].append('H3')
    res_atoms['_chem_comp_atom.type_symbol'].append('H')
    res_atoms['_chem_comp_bond.atom_id_1'].append('N')
    res_atoms['_chem_comp_bond.atom_id_2'].append('H3')
  else:
    res_atoms = {key: ccd_data.get(key, []) for key in keys}

  return res_atoms


@functools.lru_cache(maxsize=128)
def get_res_atom_names(ccd: chemical_components.Ccd, res_name: str) -> set[str]:
  """Gets the names of the atoms in a given CCD residue."""
  atoms = get_all_atoms_in_entry(ccd, res_name)['_chem_comp_atom.atom_id']
  return set(atoms)


================================================
FILE: src/alphafold3/structure/cpp/aggregation.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from collections.abc import Sequence

def indices_grouped_by_value(values: Sequence[int]) -> dict[int, list[int]]: ...


================================================
FILE: src/alphafold3/structure/cpp/aggregation_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <cstdint>
#include <vector>

#include "absl/container/flat_hash_map.h"
#include "absl/types/span.h"
#include "pybind11/cast.h"
#include "pybind11/numpy.h"
#include "pybind11/pybind11.h"
#include "pybind11_abseil/absl_casters.h"

namespace {

namespace py = pybind11;

absl::flat_hash_map<int64_t, std::vector<int64_t>> IndicesGroupedByValue(
    absl::Span<const int64_t> values) {
  absl::flat_hash_map<int64_t, std::vector<int64_t>> group_indices;
  for (int64_t i = 0, e = values.size(); i < e; ++i) {
    group_indices[values[i]].push_back(i);
  }
  return group_indices;
}

constexpr char kIndicesGroupedByValue[] = R"(
Returns a map from value to a list of indices this value occupies.

E.g. indices_grouped_by_value([1, 1, 2, 3, 3, 1, 1]) returns:
{1: [0, 1, 5, 6], 2: [2], 3: [3, 4]}

Args:
  values: a list of values to group.
)";

}  // namespace

namespace alphafold3 {

void RegisterModuleAggregation(py::module m) {
  m.def("indices_grouped_by_value", &IndicesGroupedByValue, py::arg("values"),
        py::doc(kIndicesGroupedByValue + 1),
        py::call_guard<py::gil_scoped_release>());
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/aggregation_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_AGGREGATION_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_AGGREGATION_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleAggregation(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_AGGREGATION_PYBIND_H_


================================================
FILE: src/alphafold3/structure/cpp/membership.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

import numpy


def isin(
    array: numpy.ndarray[numpy.int64],
    test_elements: set[int],
    invert: bool = ...,
) -> numpy.ndarray[bool]: ...


================================================
FILE: src/alphafold3/structure/cpp/membership_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <algorithm>
#include <cstddef>
#include <cstdint>
#include <vector>

#include "absl/container/flat_hash_set.h"
#include "pybind11/cast.h"
#include "pybind11/numpy.h"
#include "pybind11/pybind11.h"
#include "pybind11_abseil/absl_casters.h"

namespace {

namespace py = pybind11;

py::array_t<bool> IsIn(const py::array_t<int64_t, py::array::c_style>& array,
                       const absl::flat_hash_set<int64_t>& test_elements,
                       bool invert) {
  const size_t num_elements = array.size();

  py::array_t<bool> output(num_elements);
  std::fill(output.mutable_data(), output.mutable_data() + output.size(),
            invert);

  // Shortcut: The output will be trivially always false if test_elements empty.
  if (test_elements.empty()) {
    return output;
  }

  for (size_t i = 0; i < num_elements; ++i) {
    if (test_elements.contains(array.data()[i])) {
      output.mutable_data()[i] = !invert;
    }
  }
  if (array.ndim() > 1) {
    auto shape =
        std::vector<ptrdiff_t>(array.shape(), array.shape() + array.ndim());
    return output.reshape(shape);
  }
  return output;
}

constexpr char kIsInDoc[] = R"(
Computes whether each element is in test_elements.

Same use as np.isin, but much faster. If len(array) = n, len(test_elements) = m:
* This function has complexity O(n).
* np.isin with kind='sort' has complexity O(m*log(m) + n * log(m)).

Args:
  array: Input NumPy array with dtype=np.int64.
  test_elements: The values against which to test each value of array.
  invert: If True, the values in the returned array are inverted, as if
    calculating `element not in test_elements`. Default is False.
    `isin(a, b, invert=True)` is equivalent to but faster than `~isin(a, b)`.

Returns
  A boolean array of the same shape as the input array. Each value `val` is:
  * `val in test_elements` if `invert=False`,
  * `val not in test_elements` if `invert=True`.
)";

}  // namespace

namespace alphafold3 {

void RegisterModuleMembership(pybind11::module m) {
  m.def("isin", &IsIn, py::arg("array"), py::arg("test_elements"),
        py::kw_only(), py::arg("invert") = false, py::doc(kIsInDoc + 1));
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/membership_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MEMBERSHIP_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MEMBERSHIP_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMembership(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MEMBERSHIP_PYBIND_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_altlocs.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include "alphafold3/structure/cpp/mmcif_altlocs.h"

#include <cstddef>
#include <cstdint>
#include <functional>
#include <iterator>
#include <limits>
#include <string>
#include <utility>
#include <vector>

#include "absl/algorithm/container.h"
#include "absl/log/log.h"
#include "absl/strings/numbers.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/structure/cpp/mmcif_layout.h"

namespace alphafold3 {
namespace {

float OccupancyToFloat(absl::string_view occupancy) {
  float result = 0.0f;
  LOG_IF(ERROR, !absl::SimpleAtof(occupancy, &result))
      << "Invalid Occupancy: " << occupancy;
  return result;
}

// Deuterium is the same atom as Hydrogen so keep equivalent for grouping.
bool AtomEquiv(absl::string_view lhs, absl::string_view rhs) {
  if (lhs == rhs) return true;
  if (lhs.empty() != rhs.empty()) return false;
  // Both lhs and rhs are guaranteed to be non-empty after this.
  char first_lhs = lhs.front();
  char second_rhs = rhs.front();
  if ((first_lhs == 'H' && second_rhs == 'D') ||
      (first_lhs == 'D' && second_rhs == 'H')) {
    lhs.remove_prefix(1);
    rhs.remove_prefix(1);
    return lhs == rhs;
  }
  return false;
}

// Calls group_callback with that start index and count for each group of
// equivalent values in `values`, starting at `start` and ending at `count`.
// Example:
// GroupBy({"B", "B", "B", "C", "C"}, 0, 5, [](size_t start, size_t count) {
//   absl::Printf("start=%d, count=%d\n", start, count);
// });
// Would print:
// start=0, count=3
// start=3, count=2
template <typename GroupCallback,
          typename IsEqual = std::equal_to<absl::string_view>>
void GroupBy(absl::Span<const std::string> values, std::size_t start,
             std::size_t count, GroupCallback&& group_callback,
             IsEqual&& is_equal = std::equal_to<absl::string_view>{}) {
  std::size_t span_start = start;
  if (count > 0) {
    for (std::size_t i = start + 1; i < start + count; ++i) {
      if (!is_equal(values[i], values[span_start])) {
        group_callback(span_start, i - span_start);
        span_start = i;
      }
    }
    group_callback(span_start, start + count - span_start);
  }
}

void ProcessAltLocGroupsWhole(std::size_t alt_loc_start,
                              std::size_t alt_loc_count,
                              absl::Span<const std::string> comp_ids,
                              absl::Span<const std::string> atom_ids,
                              absl::Span<const std::string> alt_ids,
                              absl::Span<const std::string> occupancies,
                              std::vector<std::uint64_t>& in_out_keep_indices) {
  std::pair<std::size_t, std::size_t> best_split = {alt_loc_start,
                                                    alt_loc_count};
  std::vector<char> alt_loc_groups;
  float best_occupancy = -std::numeric_limits<float>::infinity();
  char best_group = alt_ids[alt_loc_start].front();
  std::vector<std::pair<std::size_t, float>> occupancy_stats;

  // Group by residue type.
  GroupBy(comp_ids, alt_loc_start, alt_loc_count,
          [&](std::size_t start, std::size_t count) {
            // This callback selects the best residue group and the best
            // Alt-loc char within that group.
            alt_loc_groups.clear();
            occupancy_stats.clear();
            // Calculate total occupancy for residue type.
            for (std::size_t i = 0; i < count; ++i) {
              char alt_loc_id = alt_ids[start + i].front();
              float occupancy = OccupancyToFloat(occupancies[start + i]);
              if (auto loc = absl::c_find(alt_loc_groups, alt_loc_id);
                  loc == alt_loc_groups.end()) {
                occupancy_stats.emplace_back(1, occupancy);
                alt_loc_groups.push_back(alt_loc_id);
              } else {
                auto& stat =
                    occupancy_stats[std::distance(alt_loc_groups.begin(), loc)];
                ++stat.first;
                stat.second += occupancy;
              }
            }
            float total_occupancy = 0.0;
            for (auto& stat : occupancy_stats) {
              total_occupancy += stat.second / stat.first;
            }
            char group = *absl::c_min_element(alt_loc_groups);
            // Compares occupancy of residue to best seen so far.
            // Tie breaks alphabetic.
            if (total_occupancy > best_occupancy ||
                (total_occupancy == best_occupancy && group < best_group)) {
              // Selects the best sub group.
              best_group = alt_loc_groups.front();
              float best_amount = occupancy_stats.front().second /
                                  occupancy_stats.front().first;
              for (std::size_t i = 1; i < occupancy_stats.size(); ++i) {
                float amount =
                    occupancy_stats[i].second / occupancy_stats[i].first;
                char group = alt_loc_groups[i];
                if (amount > best_amount ||
                    (amount == best_amount && group < best_group)) {
                  best_amount = amount;
                  best_group = group;
                }
              }
              best_occupancy = total_occupancy;
              best_split = {start, count};
            }
          });

  // Now that the best residue type has been selected and the best alt-loc
  // within that has been selected add indices of indices to keep to the keep
  // list.
  auto [split_start, split_count] = best_split;
  GroupBy(
      atom_ids, split_start, split_count,
      [&in_out_keep_indices, &alt_ids, best_group](std::size_t start,
                                                   std::size_t count) {
        // This makes sure we select an atom for each atom id even if it does
        // not have our selected alt-loc char.
        std::size_t best_index = start;
        for (std::size_t i = 1; i < count; ++i) {
          if (alt_ids[start + i].front() == best_group) {
            best_index = start + i;
            break;
          }
        }
        in_out_keep_indices.push_back(best_index);
      },
      AtomEquiv);
}

// Finds the alt-loc group with the highest score and pushes the indices on to
// the back of in_out_keep_indices.
void ProcessAltLocGroupPartial(
    std::size_t alt_loc_start, std::size_t alt_loc_count,
    absl::Span<const std::string> atom_ids,
    absl::Span<const std::string> alt_ids,
    absl::Span<const std::string> occupancies,
    std::vector<std::uint64_t>& in_out_keep_indices) {
  GroupBy(
      atom_ids, alt_loc_start, alt_loc_count,
      [&](std::size_t start, std::size_t count) {
        if (count == 1) {
          in_out_keep_indices.push_back(start);
        } else {
          float best_occ = OccupancyToFloat(occupancies[start]);
          std::size_t best_index = start;
          char best_group = alt_ids[start].front();
          for (std::size_t i = 0; i < count; ++i) {
            float occ = OccupancyToFloat(occupancies[start + i]);
            char group = alt_ids[start + i].front();
            if (occ > best_occ || (occ == best_occ && group < best_group)) {
              best_group = group;
              best_index = start + i;
              best_occ = occ;
            }
          }
          in_out_keep_indices.push_back(best_index);
        }
      },
      AtomEquiv);
}

}  // namespace

// Resolves alt-locs returning the atom indices that will be left.
std::vector<std::uint64_t> ResolveMmcifAltLocs(
    const MmcifLayout& layout, absl::Span<const std::string> comp_ids,
    absl::Span<const std::string> atom_ids,
    absl::Span<const std::string> alt_ids,
    absl::Span<const std::string> occupancies,
    absl::Span<const std::size_t> chain_indices) {
  std::vector<std::uint64_t> keep_indices;
  keep_indices.reserve(layout.num_atoms());
  std::size_t alt_loc_start = 0;
  for (std::size_t chain_index : chain_indices) {
    auto [residues_start, residues_end] = layout.residue_range(chain_index);
    for (std::size_t residue = residues_start; residue < residues_end;
         ++residue) {
      std::size_t alt_loc_count = 0;
      auto [atom_start, atom_end] = layout.atom_range(residue);
      for (std::size_t i = atom_start; i < atom_end; ++i) {
        char alt_loc_id = alt_ids[i].front();
        if (alt_loc_id == '.' || alt_loc_id == '?') {
          if (alt_loc_count > 0) {
            ProcessAltLocGroupPartial(alt_loc_start, alt_loc_count, atom_ids,
                                      alt_ids, occupancies, keep_indices);
            alt_loc_count = 0;
          }
          keep_indices.push_back(i);
        } else {
          if (alt_loc_count == 0) {
            alt_loc_start = i;
          }
          ++alt_loc_count;
        }
      }
      if (alt_loc_count > 0) {
        if (atom_end - atom_start == alt_loc_count) {
          ProcessAltLocGroupsWhole(alt_loc_start, alt_loc_count, comp_ids,
                                   atom_ids, alt_ids, occupancies,
                                   keep_indices);
        } else {
          ProcessAltLocGroupPartial(alt_loc_start, alt_loc_count, atom_ids,
                                    alt_ids, occupancies, keep_indices);
        }
      }
    }
  }

  return keep_indices;
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_altlocs.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_ALTLOCS_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_ALTLOCS_H_

#include <cstddef>
#include <cstdint>
#include <string>
#include <vector>

#include "absl/types/span.h"
#include "alphafold3/structure/cpp/mmcif_layout.h"

namespace alphafold3 {

// Returns the list of indices that should be kept after resolving alt-locs.
// 1) Partial Residue. Each cycle of alt-locs are resolved separately with the
//    highest occupancy alt-loc. Tie-breaks are resolved alphabetically. See
//    tests for examples.
// 2) Whole Residue. These are resolved in two passes.
//    a) The residue with the highest occupancy is chosen.
//    b) The locations for a given residue are resolved.
//    All tie-breaks are resolved alphabetically. See tests for examples.
//
// Preconditions: layout and comp_ids, alt_ids, occupancies are all from same
// mmCIF file and chain_indices are monotonically increasing and less than
// layout.num_chains().
//
// comp_ids from '_atom_site.label_comp_id'.
// alt_ids from '_atom_site.label_alt_id'.
// occupancies from '_atom_site.occupancy'.
std::vector<std::uint64_t> ResolveMmcifAltLocs(
    const MmcifLayout& layout, absl::Span<const std::string> comp_ids,
    absl::Span<const std::string> atom_ids,
    absl::Span<const std::string> alt_ids,
    absl::Span<const std::string> occupancies,
    absl::Span<const std::size_t> chain_indices);

}  // namespace alphafold3

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_ALTLOCS_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_atom_site.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from collections.abc import Callable
from alphafold3.cpp import cif_dict


def get_internal_to_author_chain_id_map(
    mmcif: cif_dict.CifDict
) -> dict[str,str]: ...


def get_or_infer_type_symbol(
    mmcif: cif_dict.CifDict,
    atom_id_to_type_symbol: Callable[[str, str], str],
) -> list[str]: ...


================================================
FILE: src/alphafold3/structure/cpp/mmcif_atom_site_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <cstddef>

#include "absl/container/flat_hash_map.h"
#include "absl/log/check.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"
#include "pybind11/gil.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11/stl.h"
#include "pybind11_abseil/absl_casters.h"

namespace alphafold3 {
namespace {
namespace py = pybind11;

// If present, returns the _atom_site.type_symbol. If not, infers it using
// _atom_site.label_comp_id (residue name), _atom_site.label_atom_id (atom name)
// and the CCD.
py::list GetOrInferTypeSymbol(const CifDict& mmcif,
                              const py::object& atom_id_to_type_symbol) {
  const auto& type_symbol = mmcif["_atom_site.type_symbol"];
  const int num_atom = mmcif["_atom_site.id"].size();
  py::list patched_type_symbol(num_atom);
  if (type_symbol.empty()) {
    const auto& label_comp_id = mmcif["_atom_site.label_comp_id"];
    const auto& label_atom_id = mmcif["_atom_site.label_atom_id"];
    CHECK_EQ(label_comp_id.size(), num_atom);
    CHECK_EQ(label_atom_id.size(), num_atom);
    for (int i = 0; i < num_atom; i++) {
      patched_type_symbol[i] =
          atom_id_to_type_symbol(label_comp_id[i], label_atom_id[i]);
    }
  } else {
    for (int i = 0; i < num_atom; i++) {
      patched_type_symbol[i] = type_symbol[i];
    }
  }
  return patched_type_symbol;
}

absl::flat_hash_map<absl::string_view, absl::string_view>
GetInternalToAuthorChainIdMap(const CifDict& mmcif) {
  const auto& label_asym_ids = mmcif["_atom_site.label_asym_id"];
  const auto& auth_asym_ids = mmcif["_atom_site.auth_asym_id"];
  CHECK_EQ(label_asym_ids.size(), auth_asym_ids.size());

  absl::flat_hash_map<absl::string_view, absl::string_view> mapping;
  for (size_t i = 0, num_rows = label_asym_ids.size(); i < num_rows; ++i) {
    // Use only the first internal_chain_id occurrence to generate the mapping.
    // It should not matter as there should not be a case where a single
    // internal chain ID would map to more than one author chain IDs (i.e. the
    // mapping should be injective). Since we need this method to be fast, we
    // choose not to check it.
    mapping.emplace(label_asym_ids[i], auth_asym_ids[i]);
  }
  return mapping;
}

}  // namespace

namespace py = pybind11;

void RegisterModuleMmcifAtomSite(pybind11::module m) {
  m.def("get_or_infer_type_symbol", &GetOrInferTypeSymbol, py::arg("mmcif"),
        py::arg("atom_id_to_type_symbol"));

  m.def("get_internal_to_author_chain_id_map", &GetInternalToAuthorChainIdMap,
        py::arg("mmcif"), py::call_guard<py::gil_scoped_release>());
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_atom_site_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_ATOM_SITE_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_ATOM_SITE_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMmcifAtomSite(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_ATOM_SITE_PYBIND_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_layout.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_LAYOUT_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_LAYOUT_H_

#include <cstddef>
#include <cstdint>
#include <string>
#include <utility>
#include <vector>

#include "absl/status/statusor.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"

namespace alphafold3 {

// Holds the layout of a parsed mmCIF file.
class MmcifLayout {
 public:
  MmcifLayout(std::vector<std::size_t> chain_ends,
              std::vector<std::size_t> residues, std::size_t model_offset,
              std::size_t num_models)
      : chain_ends_(std::move(chain_ends)),
        residue_ends_(std::move(residues)),
        model_offset_(model_offset),
        num_models_(num_models) {}

  // Reads a layout from a valid parsed mmCIF. If a valid model_id is provided
  // the offsets will select that model from the mmCIF.
  // If no model_id is specified, we calculate the layout of the first model
  // only. Therefore it is a requirement that each model has identical atom
  // layouts. An error is returned if the atom counts do not between models.
  static absl::StatusOr<MmcifLayout> Create(const CifDict& mmcif,
                                            absl::string_view model_id = "");

  std::string ToDebugString() const;

  // Returns the start index and one past the last residue index of a given
  // chain. A chain_index of n refers to the n-th chain in the mmCIF. The
  // returned residue indices are 0-based enumerations of residues in the
  // _atom_site records, and therefore do not include missing residues.
  std::pair<std::size_t, std::size_t> residue_range(
      std::size_t chain_index) const {
    if (chain_index > 0) {
      return {chain_ends_[chain_index - 1], chain_ends_[chain_index]};
    } else {
      return {0, chain_ends_[0]};
    }
  }

  // Returns the start index and one past the last index of a given residue.
  // A residue_index of n refers to the n-th residue in the mmCIF, not
  // including residues that are unresolved (i.e. only using _atom_site).
  std::pair<std::size_t, std::size_t> atom_range(
      std::size_t residue_index) const {
    if (residue_index > 0) {
      return {residue_ends_[residue_index - 1], residue_ends_[residue_index]};
    } else {
      return {model_offset_, residue_ends_[residue_index]};
    }
  }

  // If model_id was provided during construction then this is 1, otherwise
  // it is the number of models present in the mmCIF.
  std::size_t num_models() const { return num_models_; }
  // The number of atoms in the chosen model.
  std::size_t num_atoms() const {
    return residue_ends_.empty() ? 0 : residue_ends_.back() - model_offset_;
  }
  // The number of chains in the chosen model.
  std::size_t num_chains() const { return chain_ends_.size(); }
  // The number of residues in the chosen model, not counting unresolved
  // residues.
  std::size_t num_residues() const { return residue_ends_.size(); }

  // Returns the first atom index that is part of the specified chain.
  // The chain is specified using chain_index, which is a 0-based
  // enumeration of the chains in the _atom_site table.
  std::size_t atom_site_from_chain_index(std::size_t chain_index) const {
    if (chain_index == 0) {
      return model_offset_;
    }
    return atom_site_from_residue_index(chain_ends_[chain_index - 1]);
  }

  // Returns the first atom index that is part of the specified residue.
  // The residue is specified using residue_index, which is a 0-based
  // enumeration of the residues in the _atom_site table.
  std::size_t atom_site_from_residue_index(std::size_t residues_index) const {
    if (residues_index == 0) {
      return model_offset_;
    }
    return residue_ends_[residues_index - 1];
  }

  // One past last residue index of each chain. The residue index does not
  // include unresolved residues and is a simple 0-based enumeration of the
  // residues in _atom_site table.
  const std::vector<std::size_t>& chains() const { return chain_ends_; }

  // Indices of the first atom of each chain. Note that this returns atom
  // indices (like residue_starts()), not residue indices (like chains()).
  std::vector<std::size_t> chain_starts() const;

  // One past last atom index of each residue.
  const std::vector<std::size_t>& residues() const { return residue_ends_; }

  // Indices of the first atom of each residue.
  std::vector<std::size_t> residue_starts() const {
    std::vector<std::size_t> residue_starts;
    if (!residue_ends_.empty()) {
      residue_starts.reserve(residue_ends_.size());
      residue_starts.push_back(model_offset_);
      residue_starts.insert(residue_starts.end(), residue_ends_.begin(),
                            residue_ends_.end() - 1);
    }
    return residue_starts;
  }

  // The first atom index that is part of the specified model.
  std::size_t model_offset() const { return model_offset_; }

  void Filter(absl::Span<const std::uint64_t> keep_indices);

 private:
  std::vector<std::size_t> chain_ends_;
  std::vector<std::size_t> residue_ends_;
  std::size_t model_offset_;
  std::size_t num_models_;
};

}  // namespace alphafold3

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_LAYOUT_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_layout.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from alphafold3.cpp import cif_dict

class MmcifLayout:
  def atom_range(self, residue_index: int) -> tuple[int, int]: ...
  def chain_starts(self) -> list[int]: ...
  def chains(self) -> list[int]: ...
  def model_offset(self) -> int: ...
  def num_atoms(self) -> int: ...
  def num_chains(self) -> int: ...
  def num_models(self) -> int: ...
  def num_residues(self) -> int: ...
  def residue_range(self, chain_index: int) -> tuple[int, int]: ...
  def residue_starts(self) -> list[int]: ...
  def residues(self) -> list[int]: ...

def from_mmcif(mmcif: cif_dict.CifDict, model_id: str = ...) -> MmcifLayout: ...


================================================
FILE: src/alphafold3/structure/cpp/mmcif_layout_lib.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <algorithm>
#include <cstddef>
#include <cstdint>
#include <functional>
#include <iterator>
#include <string>
#include <utility>
#include <vector>

#include "absl/algorithm/container.h"
#include "absl/status/status.h"
#include "absl/status/statusor.h"
#include "absl/strings/str_cat.h"
#include "absl/strings/str_format.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"
#include "alphafold3/structure/cpp/mmcif_layout.h"

namespace alphafold3 {

std::string MmcifLayout::ToDebugString() const {
  return absl::StrFormat(
      "MmcifLayout(models=%d, chains=%d, num_residues=%d, atoms=%d)",
      num_models(), num_chains(), num_residues(), num_atoms());
}

// Changes layout to match keep_indices removing empty chains/residues.
void MmcifLayout::Filter(absl::Span<const std::uint64_t> keep_indices) {
  if (num_chains() == 0) {
    return;
  }
  // Update residue indices.
  auto keep_it = absl::c_lower_bound(keep_indices, residue_ends_.front());
  for (auto& residue : residue_ends_) {
    while (keep_it != keep_indices.end() && *keep_it < residue) {
      ++keep_it;
    }
    residue = std::distance(keep_indices.begin(), keep_it);
  }
  // Unique residue_ends_ with updating chains.
  auto first = residue_ends_.begin();
  auto tail = first;
  std::size_t num_skipped = 0;
  std::size_t current = 0;
  for (std::size_t& chain_end : chain_ends_) {
    for (auto e = residue_ends_.begin() + chain_end; first != e; ++first) {
      std::size_t next = *first;
      *tail = next;
      if (current != next) {
        current = next;
        ++tail;
      } else {
        ++num_skipped;
      }
    }
    chain_end -= num_skipped;
  }
  residue_ends_.erase(tail, residue_ends_.end());

  current = 0;
  chain_ends_.erase(std::remove_if(chain_ends_.begin(), chain_ends_.end(),
                                   [&current](std::size_t next) {
                                     bool result = current == next;
                                     current = next;
                                     return result;
                                   }),
                    chain_ends_.end());
  model_offset_ = 0;
}

absl::StatusOr<MmcifLayout> MmcifLayout::Create(const CifDict& mmcif,
                                                absl::string_view model_id) {
  auto model_ids = mmcif["_atom_site.pdbx_PDB_model_num"];
  auto chain_ids = mmcif["_atom_site.label_asym_id"];     // chain ID.
  auto label_seq_ids = mmcif["_atom_site.label_seq_id"];  // residue ID.
  auto auth_seq_ids = mmcif["_atom_site.auth_seq_id"];    // author residue ID.
  auto insertion_codes = mmcif["_atom_site.pdbx_PDB_ins_code"];

  if (model_ids.size() != chain_ids.size() ||
      model_ids.size() != label_seq_ids.size() ||
      (model_ids.size() != auth_seq_ids.size() && !auth_seq_ids.empty()) ||
      (model_ids.size() != insertion_codes.size() &&
       !insertion_codes.empty())) {
    return absl::InvalidArgumentError(absl::StrCat(
        "Invalid _atom_site table.",  //
        " len(_atom_site.pdbx_PDB_model_num): ", model_ids.size(),
        " len(_atom_site.label_asym_id): ", chain_ids.size(),
        " len(_atom_site.label_seq_id): ", label_seq_ids.size(),
        " len(_atom_site.auth_seq_id): ", auth_seq_ids.size(),
        " len(_atom_site.pdbx_PDB_ins_code): ", insertion_codes.size()));
  }
  std::size_t num_atoms = model_ids.size();
  if (num_atoms == 0) {
    return MmcifLayout({}, {}, 0, 0);
  }
  std::size_t model_offset = 0;
  std::size_t num_models;
  std::size_t num_atoms_per_model;
  if (model_id.empty()) {
    absl::string_view first_model_id = model_ids.front();

    // Binary search for where the first model ends.
    num_atoms_per_model = std::distance(
        model_ids.begin(),
        absl::c_upper_bound(model_ids, first_model_id, std::not_equal_to<>{}));
    if (num_atoms % num_atoms_per_model != 0) {
      return absl::InvalidArgumentError(absl::StrCat(
          "Each model must have the same number of atoms: (", num_atoms, " % ",
          num_atoms_per_model, " == ", num_atoms % num_atoms_per_model, ")."));
    }
    num_models = num_atoms / num_atoms_per_model;
    // Test boundary conditions for each model hold.
    for (std::size_t i = 1; i < num_models; ++i) {
      if ((model_ids[i * num_atoms_per_model] !=
           model_ids[(i + 1) * num_atoms_per_model - 1]) ||
          (model_ids[i * num_atoms_per_model - 1] ==
           model_ids[i * num_atoms_per_model])) {
        return absl::InvalidArgumentError(
            absl::StrCat("Each model must have the same number of atoms: (",
                         num_atoms, " % ", num_atoms_per_model,
                         " == ", num_atoms % num_atoms_per_model, ")."));
      }
    }
  } else {
    num_models = 1;
    model_offset =
        std::distance(model_ids.begin(), absl::c_find(model_ids, model_id));
    if (model_offset == model_ids.size()) {
      return absl::InvalidArgumentError(
          absl::StrCat("Unknown model_id: ", model_id));
    }
    model_ids.remove_prefix(model_offset);
    chain_ids.remove_prefix(model_offset);
    label_seq_ids.remove_prefix(model_offset);
    if (!auth_seq_ids.empty()) auth_seq_ids.remove_prefix(model_offset);
    if (!insertion_codes.empty()) insertion_codes.remove_prefix(model_offset);

    num_atoms_per_model = std::distance(
        model_ids.begin(), std::upper_bound(model_ids.begin(), model_ids.end(),
                                            model_id, std::not_equal_to<>{}));
    num_atoms = num_atoms_per_model;
  }
  std::vector<std::size_t> residues;
  std::vector<std::size_t> chains;
  absl::string_view chain_id = chain_ids.front();
  if (!auth_seq_ids.empty() && !insertion_codes.empty()) {
    // If author residue IDs are present then these are preferred to
    // label residue IDs because they work for multi-residue ligands (which
    // are given constant "." label residue IDs).
    // NB: Author residue IDs require both the auth_seq_id and the insertion
    // code to be unique.
    absl::string_view auth_seq_id = auth_seq_ids.front();
    absl::string_view insertion_code = insertion_codes.front();
    for (std::size_t i = 1; i < num_atoms_per_model; ++i) {
      if (absl::string_view current_chain_id = chain_ids[i];
          current_chain_id != chain_id) {
        residues.push_back(i + model_offset);
        chains.push_back(residues.size());
        chain_id = current_chain_id;
        auth_seq_id = auth_seq_ids[i];
        insertion_code = insertion_codes[i];
      } else if (absl::string_view current_seq_id = auth_seq_ids[i],
                 current_insertion_code = insertion_codes[i];
                 insertion_code != current_insertion_code ||
                 auth_seq_id != current_seq_id) {
        residues.push_back(i + model_offset);
        auth_seq_id = current_seq_id;
        insertion_code = current_insertion_code;
      }
    }
  } else {
    absl::string_view label_seq_id = label_seq_ids.front();
    for (std::size_t i = 1; i < num_atoms_per_model; ++i) {
      if (absl::string_view current_chain_id = chain_ids[i];
          current_chain_id != chain_id) {
        residues.push_back(i + model_offset);
        chains.push_back(residues.size());
        chain_id = current_chain_id;
        label_seq_id = label_seq_ids[i];
      } else if (absl::string_view current_seq_id = label_seq_ids[i];
                 label_seq_id != current_seq_id) {
        residues.push_back(i + model_offset);
        label_seq_id = current_seq_id;
      }
    }
  }
  residues.push_back(num_atoms_per_model + model_offset);
  chains.push_back(residues.size());
  return MmcifLayout(std::move(chains), std::move(residues), model_offset,
                     num_models);
}

std::vector<std::size_t> MmcifLayout::chain_starts() const {
  std::vector<std::size_t> chain_starts;
  chain_starts.reserve(chain_ends_.size());
  for (std::size_t index = 0; index < chain_ends_.size(); ++index) {
    chain_starts.push_back(atom_site_from_chain_index(index));
  }
  return chain_starts;
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_layout_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include "alphafold3/structure/cpp/mmcif_layout.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11/stl.h"

namespace alphafold3 {

namespace py = pybind11;

void RegisterModuleMmcifLayout(pybind11::module m) {
  py::class_<MmcifLayout>(m, "MmcifLayout")
      .def("__str__", &MmcifLayout::ToDebugString)
      .def("num_models", &MmcifLayout::num_models)
      .def("num_chains", &MmcifLayout::num_chains)
      .def("num_residues", &MmcifLayout::num_residues)
      .def("num_atoms", &MmcifLayout::num_atoms)
      .def("residue_range", &MmcifLayout::residue_range, py::arg("chain_index"))
      .def("atom_range", &MmcifLayout::atom_range, py::arg("residue_index"))
      .def("chains", &MmcifLayout::chains,
           py::doc("Returns a list of indices one past the last residue of "
                   "each chain."))
      .def(
          "chain_starts", &MmcifLayout::chain_starts,
          py::doc("Returns a list of indices of the first atom of each chain."))
      .def("residues", &MmcifLayout::residues,
           py::doc("Returns a list of indices one past the last atom of each "
                   "residue."))
      .def("residue_starts", &MmcifLayout::residue_starts,
           py::doc(
               "Returns a list of indices of the first atom of each residue."))
      .def("model_offset", &MmcifLayout::model_offset,
           py::doc("Returns the first atom index that is part of the specified "
                   "model."));

  m.def("from_mmcif", &MmcifLayout::Create, py::arg("mmcif"),
        py::arg("model_id") = "");
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_layout_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_LAYOUT_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_LAYOUT_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMmcifLayout(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_LAYOUT_PYBIND_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_struct_conn.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_STRUCT_CONN_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_STRUCT_CONN_H_

#include <utility>
#include <vector>

#include "absl/status/statusor.h"
#include "absl/strings/string_view.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"

namespace alphafold3 {

// Returns a pair of atom indices for each row in the bonds table (aka
// _struct_conn). The indices are simple 0-based indexes into the columns of
// the _atom_site table in the input mmCIF, and do not necessarily correspond
// to the values in _atom_site.id, or any other column.
absl::StatusOr<std::pair<std::vector<std::size_t>, std::vector<std::size_t>>>
GetBondAtomIndices(const CifDict& mmcif, absl::string_view model_id);

}  // namespace alphafold3

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_STRUCT_CONN_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_struct_conn.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from alphafold3.cpp import cif_dict

def get_bond_atom_indices(mmcif_dict: cif_dict.CifDict, model_id: str) -> tuple[list[int],list[int]]: ...


================================================
FILE: src/alphafold3/structure/cpp/mmcif_struct_conn_lib.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <cstddef>
#include <iterator>
#include <optional>
#include <string>
#include <utility>
#include <vector>

#include "absl/algorithm/container.h"
#include "absl/container/flat_hash_map.h"
#include "absl/container/flat_hash_set.h"
#include "absl/status/status.h"
#include "absl/status/statusor.h"
#include "absl/strings/str_cat.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"
#include "alphafold3/structure/cpp/mmcif_struct_conn.h"

namespace alphafold3 {

namespace {

struct AtomId {
  absl::string_view chain_id;
  absl::string_view res_id_1;
  absl::string_view res_id_2;
  absl::string_view atom_name;
  absl::string_view alt_id;

  friend bool operator==(const AtomId&, const AtomId&) = default;
  template <typename H>
  friend H AbslHashValue(H h, const AtomId& m) {
    return H::combine(std::move(h), m.chain_id, m.res_id_1, m.res_id_2,
                      m.atom_name, m.alt_id);
  }
};

using StringArrayRef = absl::Span<const std::string>;
using BondIndexByAtom = absl::flat_hash_map<AtomId, std::vector<std::size_t>>;
using BondAtomIndices = std::vector<std::size_t>;

// Returns whether each container is the same size.
template <typename C, typename... Cs>
bool AreSameSize(const C& c, const Cs&... cs) {
  return ((c.size() == cs.size()) && ...);
}

struct ColumnSpec {
  absl::string_view chain_id_col;
  absl::string_view res_id_1_col;
  absl::string_view res_id_2_col;
  absl::string_view atom_name_col;
  std::optional<absl::string_view> alt_id_col;  // Not used by OpenMM.
};

class AtomColumns {
 public:
  static absl::StatusOr<AtomColumns> Create(const CifDict& mmcif,
                                            const ColumnSpec& column_spec) {
    StringArrayRef chain_id = mmcif[column_spec.chain_id_col];
    StringArrayRef res_id_1 = mmcif[column_spec.res_id_1_col];
    StringArrayRef res_id_2 = mmcif[column_spec.res_id_2_col];
    StringArrayRef atom_name = mmcif[column_spec.atom_name_col];
    if (!AreSameSize(chain_id, res_id_1, res_id_2, atom_name)) {
      return absl::InvalidArgumentError(absl::StrCat(
          "Atom columns are not the same size. ",                       //
          "len(", column_spec.chain_id_col, ")=", chain_id.size(),      //
          ", len(", column_spec.res_id_1_col, ")=", res_id_1.size(),    //
          ", len(", column_spec.res_id_2_col, ")=", res_id_2.size(),    //
          ", len(", column_spec.atom_name_col, ")=", atom_name.size(),  //
          "."));
    }
    if (column_spec.alt_id_col.has_value()) {
      StringArrayRef alt_id = mmcif[*column_spec.alt_id_col];
      if (!AreSameSize(alt_id, chain_id)) {
        return absl::InvalidArgumentError(absl::StrCat(
            "Atom columns are not the same size. ",                   //
            "len(", column_spec.chain_id_col, ")=", chain_id.size(),  //
            ", len(", *column_spec.alt_id_col, ")=", alt_id.size(),   //
            "."));
      }
      return AtomColumns(chain_id, res_id_1, res_id_2, atom_name, alt_id,
                         column_spec);
    } else {
      return AtomColumns(chain_id, res_id_1, res_id_2, atom_name, std::nullopt,
                         column_spec);
    }
  }

  inline std::size_t size() const { return size_; }

  absl::string_view GetNormalizedAltId(const std::size_t index) const {
    constexpr absl::string_view kFullStop = ".";
    if (alt_id_.has_value()) {
      absl::string_view alt_id = (*alt_id_)[index];
      return alt_id == "?" ? kFullStop : alt_id;
    } else {
      return kFullStop;
    }
  }

  AtomId GetAtom(const std::size_t index) const {
    return {.chain_id = chain_id_[index],
            .res_id_1 = res_id_1_[index],
            .res_id_2 = res_id_2_[index],
            .atom_name = atom_name_[index],
            .alt_id = GetNormalizedAltId(index)};
  }

  std::string GetAtomString(const std::size_t index) const {
    std::string alt_id_col;
    if (column_spec_.alt_id_col.has_value()) {
      alt_id_col = *column_spec_.alt_id_col;
    } else {
      alt_id_col = "default label_alt_id";
    }
    return absl::StrCat(
        column_spec_.chain_id_col, "=", chain_id_[index], ", ",    //
        column_spec_.res_id_1_col, "=", res_id_1_[index], ", ",    //
        column_spec_.res_id_2_col, "=", res_id_2_[index], ", ",    //
        column_spec_.atom_name_col, "=", atom_name_[index], ", ",  //
        alt_id_col, "=", GetNormalizedAltId(index));               //
  }

 private:
  AtomColumns(StringArrayRef chain_id, StringArrayRef res_id_1,
              StringArrayRef res_id_2, StringArrayRef atom_name,
              std::optional<StringArrayRef> alt_id,
              const ColumnSpec& column_spec)
      : chain_id_(chain_id),
        res_id_1_(res_id_1),
        res_id_2_(res_id_2),
        atom_name_(atom_name),
        alt_id_(alt_id),
        column_spec_(column_spec),
        size_(chain_id.size()) {}
  StringArrayRef chain_id_;
  StringArrayRef res_id_1_;
  StringArrayRef res_id_2_;
  StringArrayRef atom_name_;
  std::optional<StringArrayRef> alt_id_;
  ColumnSpec column_spec_;
  std::size_t size_;
};

// Adds the atom index to any rows in the bond table involving that atom.
absl::Status FillInBondsForAtom(const BondIndexByAtom& bond_index_by_atom,
                                const AtomId& atom,
                                const std::size_t atom_index,
                                BondAtomIndices& bond_atom_indices) {
  if (auto bond_index_it = bond_index_by_atom.find(atom);
      bond_index_it != bond_index_by_atom.end()) {
    for (std::size_t bond_index : bond_index_it->second) {
      if (bond_index < 0 || bond_index >= bond_atom_indices.size()) {
        return absl::OutOfRangeError(
            absl::StrCat("Bond index out of range: ", bond_index));
      }
      bond_atom_indices[bond_index] = atom_index;
    }
  }
  return absl::OkStatus();
}

// Checks that the CifDict has all of the columns in the column spec.
bool HasAllColumns(const CifDict& mmcif, const ColumnSpec& columns) {
  return mmcif.Contains(columns.chain_id_col) &&
         mmcif.Contains(columns.res_id_1_col) &&
         mmcif.Contains(columns.res_id_2_col) &&
         mmcif.Contains(columns.atom_name_col) &&
         (!columns.alt_id_col.has_value() ||
          mmcif.Contains(*columns.alt_id_col));
}

// Fully specified ptnr1 atom.
constexpr ColumnSpec kStructConnPtnr1ColumnsFull{
    .chain_id_col = "_struct_conn.ptnr1_label_asym_id",
    .res_id_1_col = "_struct_conn.ptnr1_auth_seq_id",
    .res_id_2_col = "_struct_conn.pdbx_ptnr1_PDB_ins_code",
    .atom_name_col = "_struct_conn.ptnr1_label_atom_id",
    .alt_id_col = "_struct_conn.pdbx_ptnr1_label_alt_id",
};

// Fully specified ptnr2 atom.
constexpr ColumnSpec kStructConnPtnr2ColumnsFull{
    .chain_id_col = "_struct_conn.ptnr2_label_asym_id",
    .res_id_1_col = "_struct_conn.ptnr2_auth_seq_id",
    .res_id_2_col = "_struct_conn.pdbx_ptnr2_PDB_ins_code",
    .atom_name_col = "_struct_conn.ptnr2_label_atom_id",
    .alt_id_col = "_struct_conn.pdbx_ptnr2_label_alt_id",
};

// Columns used by OpenMM for ptnr1 atoms.
constexpr ColumnSpec kStructConnPtnr1OpenMM{
    .chain_id_col = "_struct_conn.ptnr1_label_asym_id",
    .res_id_1_col = "_struct_conn.ptnr1_label_seq_id",
    .res_id_2_col = "_struct_conn.ptnr1_label_comp_id",
    .atom_name_col = "_struct_conn.ptnr1_label_atom_id",
    .alt_id_col = std::nullopt,
};

// Columns used by OpenMM for ptnr2 atoms.
constexpr ColumnSpec kStructConnPtnr2OpenMM{
    .chain_id_col = "_struct_conn.ptnr2_label_asym_id",
    .res_id_1_col = "_struct_conn.ptnr2_label_seq_id",
    .res_id_2_col = "_struct_conn.ptnr2_label_comp_id",
    .atom_name_col = "_struct_conn.ptnr2_label_atom_id",
    .alt_id_col = std::nullopt,
};

// Fully specified atom sites.
constexpr ColumnSpec kAtomSiteColumnsFull{
    .chain_id_col = "_atom_site.label_asym_id",
    .res_id_1_col = "_atom_site.auth_seq_id",
    .res_id_2_col = "_atom_site.pdbx_PDB_ins_code",
    .atom_name_col = "_atom_site.label_atom_id",
    .alt_id_col = "_atom_site.label_alt_id",
};

// Atom site columns used to match OpenMM _struct_conn tables.
constexpr ColumnSpec kAtomSiteColumnsOpenMM{
    .chain_id_col = "_atom_site.label_asym_id",
    .res_id_1_col = "_atom_site.label_seq_id",
    .res_id_2_col = "_atom_site.label_comp_id",
    .atom_name_col = "_atom_site.label_atom_id",
    .alt_id_col = "_atom_site.label_alt_id",
};

}  // namespace

absl::StatusOr<std::pair<BondAtomIndices, BondAtomIndices>> GetBondAtomIndices(
    const CifDict& mmcif, absl::string_view model_id) {
  ColumnSpec ptnr1_columns, ptnr2_columns, atom_site_columns;

  if (HasAllColumns(mmcif, kStructConnPtnr1ColumnsFull) &&
      HasAllColumns(mmcif, kStructConnPtnr2ColumnsFull)) {
    ptnr1_columns = kStructConnPtnr1ColumnsFull;
    ptnr2_columns = kStructConnPtnr2ColumnsFull;
    atom_site_columns = kAtomSiteColumnsFull;
  } else {
    ptnr1_columns = kStructConnPtnr1OpenMM;
    ptnr2_columns = kStructConnPtnr2OpenMM;
    atom_site_columns = kAtomSiteColumnsOpenMM;
  }

  absl::StatusOr<AtomColumns> ptnr1_atoms =
      AtomColumns::Create(mmcif, ptnr1_columns);
  if (!ptnr1_atoms.ok()) {
    return ptnr1_atoms.status();
  }
  absl::StatusOr<AtomColumns> ptnr2_atoms =
      AtomColumns::Create(mmcif, ptnr2_columns);
  if (!ptnr2_atoms.ok()) {
    return ptnr2_atoms.status();
  }
  StringArrayRef struct_conn_id = mmcif["_struct_conn.id"];
  if (!AreSameSize(struct_conn_id, *ptnr1_atoms, *ptnr2_atoms)) {
    return absl::InvalidArgumentError(absl::StrCat(
        "Invalid '_struct_conn.' loop. ",                  //
        "len(id) = ", struct_conn_id.size(), ", ",         //
        "len(ptnr1_atoms) = ", ptnr1_atoms->size(), ", ",  //
        "len(ptnr2_atoms) = ", ptnr2_atoms->size(), "."    //
        ));
  }

  absl::StatusOr<AtomColumns> atoms =
      AtomColumns::Create(mmcif, atom_site_columns);
  if (!atoms.ok()) {
    return atoms.status();
  }
  StringArrayRef atom_site_id = mmcif["_atom_site.id"];
  StringArrayRef atom_site_model_id = mmcif["_atom_site.pdbx_PDB_model_num"];
  if (!AreSameSize(atom_site_id, atom_site_model_id, *atoms)) {
    return absl::InvalidArgumentError(absl::StrCat(
        "Invalid '_atom_site.' loop. ",                                //
        "len(id)= ", atom_site_id.size(), ", ",                        //
        "len(pdbx_PDB_model_num)= ", atom_site_model_id.size(), ", ",  //
        "len(atoms)= ", atoms->size(), "."));                          //
  }

  // Build maps from atom ID tuples to the rows in _struct_conn where that
  // atom appears (NB could be multiple).
  const std::size_t struct_conn_size = struct_conn_id.size();
  BondIndexByAtom ptnr1_rows_by_atom(struct_conn_size);
  BondIndexByAtom ptnr2_rows_by_atom(struct_conn_size);
  for (std::size_t i = 0; i < struct_conn_size; ++i) {
    ptnr1_rows_by_atom[ptnr1_atoms->GetAtom(i)].push_back(i);
    ptnr2_rows_by_atom[ptnr2_atoms->GetAtom(i)].push_back(i);
  }

  // Allocate two output arrays with one element per row in struct_conn, where
  // each element will be the index of that atom in the atom_site table.
  // Fill the arrays with atom_site_size, which is an invalid value, so that
  // we can check at the end that each atom has been found.
  const std::size_t atom_site_size = atom_site_id.size();
  BondAtomIndices ptnr1_atom_indices(struct_conn_size, atom_site_size);
  BondAtomIndices ptnr2_atom_indices(struct_conn_size, atom_site_size);

  bool model_id_ecountered = false;
  absl::flat_hash_set<absl::string_view> seen_alt_ids;
  for (std::size_t atom_i = 0; atom_i < atom_site_size; ++atom_i) {
    if (atom_site_model_id[atom_i] != model_id) {
      if (!model_id_ecountered) {
        continue;
      } else {
        // Models are contiguous so once we see a different model ID after
        // encountering our model ID then we can exit early.
        break;
      }
    } else {
      model_id_ecountered = true;
    }
    AtomId atom = atoms->GetAtom(atom_i);
    seen_alt_ids.insert(atom.alt_id);

    if (auto fill_in_bonds_status1 = FillInBondsForAtom(
            ptnr1_rows_by_atom, atom, atom_i, ptnr1_atom_indices);
        !fill_in_bonds_status1.ok()) {
      return fill_in_bonds_status1;
    }
    if (auto fill_in_bonds_status2 = FillInBondsForAtom(
            ptnr2_rows_by_atom, atom, atom_i, ptnr2_atom_indices);
        !fill_in_bonds_status2.ok()) {
      return fill_in_bonds_status2;
    }
  }
  // The seen_alt_ids check is a workaround for a known PDB issue: some mmCIFs
  // (2evw, 2g0v, 2g0x, 2g0z, 2g10, 2g11, 2g12, 2g14, 2grz, 2ntw as of 2024)
  // have multiple models and they set different whole-chain altloc in each
  // model. The bond table however doesn't distinguish between models, so there
  // are bonds that are valid only for some models. E.g. 2grz has model 1 with
  // chain A with altloc A, and model 2 with chain A with altloc B. The bonds
  // table lists a bond for each of these.

  // Check that a ptnr1 atom was found for every bond.
  if (auto row_it = absl::c_find(ptnr1_atom_indices, atom_site_size);
      row_it != ptnr1_atom_indices.end()) {
    if (seen_alt_ids.size() > 1 || seen_alt_ids.contains(".") ||
        seen_alt_ids.contains("?")) {
      std::size_t i = std::distance(ptnr1_atom_indices.begin(), row_it);
      return absl::InvalidArgumentError(
          absl::StrCat("Error parsing \"", mmcif.GetDataName(), "\". ",
                       "Cannot find atom for bond ID ", struct_conn_id[i], ": ",
                       ptnr1_atoms->GetAtomString(i)));
    }
  }

  // Check that a ptnr2 atom was found for every bond.
  if (auto row_it = absl::c_find(ptnr2_atom_indices, atom_site_size);
      row_it != ptnr2_atom_indices.end()) {
    if (seen_alt_ids.size() > 1 || seen_alt_ids.contains(".") ||
        seen_alt_ids.contains("?")) {
      std::size_t i = std::distance(ptnr2_atom_indices.begin(), row_it);
      return absl::InvalidArgumentError(
          absl::StrCat("Error parsing \"", mmcif.GetDataName(), "\". ",
                       "Cannot find atom for bond ID ", struct_conn_id[i], ": ",
                       ptnr2_atoms->GetAtomString(i)));
    }
  }

  if (!model_id_ecountered) {
    return absl::InvalidArgumentError(absl::StrCat(
        "Error parsing \"", mmcif.GetDataName(), "\". model_id \"", model_id,
        "\" not found in _atom_site.pdbx_PDB_model_num."));
  }

  return std::make_pair(std::move(ptnr1_atom_indices),
                        std::move(ptnr2_atom_indices));
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_struct_conn_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <string>

#include "absl/strings/string_view.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"
#include "alphafold3/structure/cpp/mmcif_struct_conn.h"
#include "pybind11/gil.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11/stl.h"

namespace alphafold3 {

namespace py = pybind11;

constexpr char kGetBondAtomIndices[] = R"(
Extracts the indices of the atoms that participate in bonds.

This function has a workaround for a known PDB issue: some mmCIFs have
(2evw, 2g0v, 2g0x, 2g0z, 2g10, 2g11, 2g12, 2g14, 2grz, 2ntw as of 2024)
multiple models and they set different whole-chain altloc in each model.
The bond table however doesn't distinguish between models, so there are
bonds that are valid only for some models. E.g. 2grz has model 1 with
chain A with altloc A, and model 2 with chain A with altloc B. The bonds
table lists a bond for each of these. This case is rather rare (10 cases
in PDB as of 2024). For the offending bonds, the returned atom index is
set to the size of the atom_site table, i.e. it is an invalid index.

Args:
  mmcif: The mmCIF object to process.
  model_id: The ID of the model that the returned atoms will belong to. This
    should be a value in the mmCIF's _atom_site.pdbx_PDB_model_num column.

Returns:
  Two lists of atom indices, `from_atoms` and `to_atoms`, each one having
  length num_bonds (as defined by _struct_conn, the bonds table). The bond
  i, defined by the i'th row in _struct_conn, is a bond from atom at index
  from_atoms[i], to the atom at index to_atoms[i]. The indices are simple
  0-based indexes into the columns of the _atom_site table in the input
  mmCIF, and do not necessarily correspond to the values in _atom_site.id,
  or any other column.
)";

void RegisterModuleMmcifStructConn(pybind11::module m) {
  m.def(
      "get_bond_atom_indices",
      [](const CifDict& mmcif, absl::string_view model_id) {
        auto result = GetBondAtomIndices(mmcif, model_id);
        if (result.ok()) {
          return *result;
        }
        throw py::value_error(std::string(result.status().message()));
      },
      py::arg("mmcif_dict"), py::arg("model_id"),
      py::doc(kGetBondAtomIndices + 1),
      py::call_guard<py::gil_scoped_release>());
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_struct_conn_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_STRUCT_CONN_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_STRUCT_CONN_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMmcifStructConn(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_STRUCT_CONN_PYBIND_H_


================================================
FILE: src/alphafold3/structure/cpp/mmcif_utils.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from collections.abc import Sequence

import numpy as np

from alphafold3.cpp import cif_dict
from alphafold3.structure.python import mmcif_layout


def filter(
    mmcif: cif_dict.CifDict,
    include_nucleotides: bool,
    include_ligands: bool = ...,
    include_water: bool = ...,
    include_other: bool = ...,
    model_id: str = ...,
) -> tuple[np.ndarray[int], set[str], mmcif_layout.MmcifLayout]: ...


def fix_residues(
    layout: mmcif_layout.MmcifLayout,
    comp_id: Sequence[str],
    atom_id: Sequence[str],
    atom_x: Sequence[float],
    atom_y: Sequence[float],
    atom_z: Sequence[float],
    fix_arg: bool = ...,
) -> None: ...


def read_layout(
    mmcif: cif_dict.CifDict, model_id: str = ...
) -> mmcif_layout.MmcifLayout: ...


def selected_ligand_residue_mask(
    layout: mmcif_layout.MmcifLayout,
    atom_site_label_asym_ids: list[str],
    atom_site_label_seq_ids: list[str],
    atom_site_auth_seq_ids: list[str],
    atom_site_label_comp_ids: list[str],
    atom_site_pdbx_pdb_ins_codes: list[str],
    nonpoly_asym_ids: list[str],
    nonpoly_auth_seq_ids: list[str],
    nonpoly_pdb_ins_codes: list[str],
    nonpoly_mon_ids: list[str],
    branch_asym_ids: list[str],
    branch_auth_seq_ids: list[str],
    branch_pdb_ins_codes: list[str],
    branch_mon_ids: list[str],
) -> tuple[list[bool], list[bool]]: ...


def selected_polymer_residue_mask(
    layout: mmcif_layout.MmcifLayout,
    atom_site_label_asym_ids: list[str],
    atom_site_label_seq_ids: list[str],
    atom_site_label_comp_ids: list[str],
    poly_seq_asym_ids: list[str],
    poly_seq_seq_ids: list[str],
    poly_seq_mon_ids: list[str],
) -> list[bool]: ...


================================================
FILE: src/alphafold3/structure/cpp/mmcif_utils_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <Python.h>

#include <algorithm>
#include <cstddef>
#include <cstdint>
#include <iterator>
#include <memory>
#include <new>
#include <optional>
#include <string>
#include <tuple>
#include <utility>
#include <vector>

#include "numpy/ndarrayobject.h"
#include "numpy/ndarraytypes.h"
#include "numpy/npy_common.h"
#include "absl/container/flat_hash_map.h"
#include "absl/container/flat_hash_set.h"
#include "absl/memory/memory.h"
#include "absl/strings/str_cat.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "alphafold3/parsers/cpp/cif_dict_lib.h"
#include "alphafold3/structure/cpp/mmcif_altlocs.h"
#include "alphafold3/structure/cpp/mmcif_layout.h"
#include "pybind11/cast.h"
#include "pybind11/gil.h"
#include "pybind11/numpy.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11/stl.h"
#include "pybind11_abseil/absl_casters.h"

namespace alphafold3 {
namespace {
namespace py = pybind11;

struct PyObjectDeleter {
  inline void operator()(PyObject* obj) const { Py_CLEAR(obj); }
};

using ScopedPyObject = std::unique_ptr<PyObject, PyObjectDeleter>;

using StringArrayRef = absl::Span<const std::string>;
using Indexer = absl::flat_hash_map<absl::string_view, std::size_t>;

// Returns the reverse look-up map of name to index.
Indexer MakeIndex(StringArrayRef col) {
  Indexer index;
  index.reserve(col.size());
  for (std::size_t i = 0; i < col.size(); ++i) {
    index[col[i]] = i;
  }
  return index;
}

// Returns whether each container is the same size.
template <typename C, typename... Cs>
bool AreSameSize(C c, const Cs&... cs) {
  return ((c.size() == cs.size()) && ...);
}

// Stores references to columns in `_atom_site` ensuring they all exist and
// are the same size.
struct AtomSiteLoop {
  explicit AtomSiteLoop(const CifDict& cif_dict)
      : id(cif_dict["_atom_site.id"]),
        model_id(cif_dict["_atom_site.pdbx_PDB_model_num"]),
        chain_id(cif_dict["_atom_site.label_asym_id"]),
        seq_id(cif_dict["_atom_site.label_seq_id"]),

        comp_id(cif_dict["_atom_site.label_comp_id"]),
        atom_id(cif_dict["_atom_site.label_atom_id"]),

        alt_id(cif_dict["_atom_site.label_alt_id"]),
        occupancy(cif_dict["_atom_site.occupancy"])

  {
    if (!AreSameSize(id, model_id, chain_id, seq_id, comp_id, atom_id, alt_id,
                     occupancy)) {
      throw py::value_error(
          absl::StrCat("Invalid '_atom_site.' loop. ",                     //
                       "len(id)=", id.size(), ", ",                        //
                       "len(pdbx_PDB_model_num)=", model_id.size(), ", ",  //
                       "len(label_asym_id)=", chain_id.size(), ", ",       //
                       "len(label_seq_id)=", seq_id.size(), ", ",          //
                       "len(label_comp_id)=", comp_id.size(), ", ",        //
                       "len(atom_id)=", atom_id.size(), ", ",              //
                       "len(label_alt_id)=", alt_id.size(), ", ",          //
                       "len(occupancy)=", occupancy.size()));
    }
  }
  StringArrayRef id;
  StringArrayRef model_id;
  StringArrayRef chain_id;
  StringArrayRef seq_id;
  StringArrayRef comp_id;
  StringArrayRef atom_id;
  StringArrayRef alt_id;
  StringArrayRef occupancy;
};

// Stores references to columns in `_entity` ensuring they all exist and are the
// same size.
struct EntityLoop {
  explicit EntityLoop(const CifDict& cif_dict)
      : id(cif_dict["_entity.id"]), type(cif_dict["_entity.type"]) {
    if (!AreSameSize(id, type)) {
      throw py::value_error(absl::StrCat("Invalid '_entity.' loop. ",  //
                                         "len(id)=", id.size(), ", ",  //
                                         "len(type)=", type.size()));
    }
  }
  StringArrayRef id;
  StringArrayRef type;
};

// Stores references to columns in `_entity_poly` ensuring they all exist and
// are the same size.
struct EntityPolyLoop {
  explicit EntityPolyLoop(const CifDict& cif_dict)
      : entity_id(cif_dict["_entity_poly.entity_id"]),
        type(cif_dict["_entity_poly.type"]) {
    if (!AreSameSize(entity_id, type)) {
      throw py::value_error(absl::StrCat("Invalid '_entity_poly.' loop. ",  //
                                         "len(entity_id)=", entity_id.size(),
                                         ", ",  //
                                         "len(type)=", type.size()));
    }
  }
  StringArrayRef entity_id;
  StringArrayRef type;
};

// Returns a set of entity names removing ones not included by the flags
// specified.
absl::flat_hash_set<absl::string_view> SelectChains(const CifDict& mmcif,
                                                    bool include_nucleotides,
                                                    bool include_ligands,
                                                    bool include_water,
                                                    bool include_other) {
  EntityLoop entity_loop(mmcif);
  EntityPolyLoop entity_poly(mmcif);
  absl::flat_hash_set<absl::string_view> permitted_polymers{"polypeptide(L)"};
  absl::flat_hash_set<absl::string_view> forbidden_polymers;
  for (absl::string_view type :
       {"polydeoxyribonucleotide", "polyribonucleotide",
        "polydeoxyribonucleotide/polyribonucleotide hybrid"}) {
    if (include_nucleotides) {
      permitted_polymers.emplace(type);
    } else {
      forbidden_polymers.emplace(type);
    }
  }

  absl::flat_hash_set<absl::string_view> permitted_nonpoly_entity_types;
  absl::flat_hash_set<absl::string_view> forbidden_nonpoly_entity_types;
  for (absl::string_view type : {"non-polymer", "branched"}) {
    if (include_ligands) {
      permitted_nonpoly_entity_types.emplace(type);
    } else {
      forbidden_nonpoly_entity_types.emplace(type);
    }
  }
  absl::string_view water_type = "water";
  if (include_water) {
    permitted_nonpoly_entity_types.emplace(water_type);
  } else {
    forbidden_nonpoly_entity_types.emplace(water_type);
  }

  StringArrayRef chain_ids = mmcif["_struct_asym.id"];
  StringArrayRef entity_ids = mmcif["_struct_asym.entity_id"];
  Indexer chain_index = MakeIndex(chain_ids);
  Indexer entity_poly_index = MakeIndex(entity_poly.entity_id);
  Indexer entity_id_to_index = MakeIndex(entity_loop.id);

  absl::flat_hash_set<absl::string_view> keep_chain_id;
  for (std::size_t i = 0; i < chain_ids.size(); ++i) {
    absl::string_view chain_id = chain_ids[i];
    absl::string_view entity_id = entity_ids[i];
    if (entity_id_to_index.empty() ||
        entity_loop.type[entity_id_to_index[entity_id]] == "polymer") {
      if (auto it = entity_poly_index.find(entity_id);
          it != entity_poly_index.end()) {
        absl::string_view poly_type = entity_poly.type[it->second];
        if (include_other) {
          if (!forbidden_polymers.contains(poly_type)) {
            keep_chain_id.insert(chain_id);
          }
        } else {
          if (permitted_polymers.contains(poly_type)) {
            keep_chain_id.insert(chain_id);
          }
        }
      }
    } else {
      absl::string_view entity_type =
          entity_loop.type[entity_id_to_index[entity_id]];
      if (include_other) {
        if (!forbidden_nonpoly_entity_types.contains(entity_type)) {
          keep_chain_id.insert(chain_id);
          continue;
        }
      } else {
        if (permitted_nonpoly_entity_types.contains(entity_type)) {
          keep_chain_id.insert(chain_id);
          continue;
        }
      }
    }
  }
  return keep_chain_id;
}

class ProcessResidue {
 public:
  explicit ProcessResidue(const char* residue)
      : residue_(PyUnicode_InternFromString(residue)) {}
  bool IsResidue(PyObject* residue) {
    return ArePyObjectsEqual(residue_.get(), residue);
  }

  static bool ArePyObjectsEqual(PyObject* lhs, PyObject* rhs) {
    switch (PyObject_RichCompareBool(lhs, rhs, Py_EQ)) {
      case -1:
        PyErr_Clear();
        return false;
      case 0:
        return false;
      default:
        return true;
    }
  }

 private:
  ScopedPyObject residue_;
};

struct Position3 {
  float x;
  float y;
  float z;
};

float DistanceSquared(Position3 v1, Position3 v2) {
  float dx = v1.x - v2.x;
  float dy = v1.y - v2.y;
  float dz = v1.z - v2.z;
  return dx * dx + dy * dy + dz * dz;
}

class FixArginine : public ProcessResidue {
 public:
  FixArginine()
      : ProcessResidue("ARG"),
        cd_(PyUnicode_InternFromString("CD")),
        nh1_(PyUnicode_InternFromString("NH1")),
        nh2_(PyUnicode_InternFromString("NH2")),
        hh11_(PyUnicode_InternFromString("HH11")),
        hh21_(PyUnicode_InternFromString("HH21")),
        hh12_(PyUnicode_InternFromString("HH12")),
        hh22_(PyUnicode_InternFromString("HH22")) {}
  void Fix(absl::Span<PyObject*> atom_ids, absl::Span<const float> atom_x,
           absl::Span<const float> atom_y, absl::Span<const float> atom_z) {
    std::ptrdiff_t cd_index = -1;
    std::ptrdiff_t nh1_index = -1;
    std::ptrdiff_t nh2_index = -1;
    std::ptrdiff_t hh11_index = -1;
    std::ptrdiff_t hh21_index = -1;
    std::ptrdiff_t hh12_index = -1;
    std::ptrdiff_t hh22_index = -1;
    for (std::ptrdiff_t index = 0; index < atom_ids.size(); ++index) {
      PyObject* atom_id = atom_ids[index];
      if (cd_index == -1 && ArePyObjectsEqual(atom_id, cd_.get())) {
        cd_index = index;
      } else if (nh1_index == -1 && ArePyObjectsEqual(atom_id, nh1_.get())) {
        nh1_index = index;
      } else if (nh2_index == -1 && ArePyObjectsEqual(atom_id, nh2_.get())) {
        nh2_index = index;
      } else if (hh11_index == -1 && ArePyObjectsEqual(atom_id, hh11_.get())) {
        hh11_index = index;
      } else if (hh21_index == -1 && ArePyObjectsEqual(atom_id, hh21_.get())) {
        hh21_index = index;
      } else if (hh12_index == -1 && ArePyObjectsEqual(atom_id, hh12_.get())) {
        hh12_index = index;
      } else if (hh22_index == -1 && ArePyObjectsEqual(atom_id, hh22_.get())) {
        hh22_index = index;
      }
    }
    if (cd_index < 0 || nh1_index < 0 || nh2_index < 0) {
      return;
    }
    Position3 cd_pos(atom_x[cd_index], atom_y[cd_index], atom_z[cd_index]);
    Position3 nh1_pos(atom_x[nh1_index], atom_y[nh1_index], atom_z[nh1_index]);
    Position3 nh2_pos(atom_x[nh2_index], atom_y[nh2_index], atom_z[nh2_index]);
    if (DistanceSquared(nh1_pos, cd_pos) <= DistanceSquared(nh2_pos, cd_pos)) {
      return;
    }
    std::swap(atom_ids[nh1_index], atom_ids[nh2_index]);
    if (hh11_index >= 0 && hh21_index >= 0) {
      std::swap(atom_ids[hh11_index], atom_ids[hh21_index]);
    } else if (hh11_index >= 0) {
      Py_DECREF(atom_ids[hh11_index]);
      Py_INCREF(hh21_.get());
      atom_ids[hh11_index] = hh21_.get();
    } else if (hh21_index >= 0) {
      Py_DECREF(atom_ids[hh21_index]);
      Py_INCREF(hh11_.get());
      atom_ids[hh21_index] = hh11_.get();
    }
    if (hh12_index >= 0 && hh22_index >= 0) {
      std::swap(atom_ids[hh12_index], atom_ids[hh22_index]);
    } else if (hh12_index >= 0) {
      Py_DECREF(atom_ids[hh12_index]);
      Py_INCREF(hh22_.get());
      atom_ids[hh12_index] = hh22_.get();
    } else if (hh22_index >= 0) {
      Py_DECREF(atom_ids[hh22_index]);
      Py_INCREF(hh21_.get());
      atom_ids[hh22_index] = hh21_.get();
    }
  }

 private:
  ScopedPyObject cd_;
  ScopedPyObject nh1_;
  ScopedPyObject nh2_;
  ScopedPyObject hh11_;
  ScopedPyObject hh21_;
  ScopedPyObject hh12_;
  ScopedPyObject hh22_;
};

// Returns the layout of the mmCIF `_atom_site` table.
inline MmcifLayout ReadMmcifLayout(const CifDict& mmcif,
                                   absl::string_view model_id = "") {
  py::gil_scoped_release release;
  auto mmcif_layout = MmcifLayout::Create(mmcif, model_id);
  if (mmcif_layout.ok()) {
    return *mmcif_layout;
  }

  throw py::value_error(std::string(mmcif_layout.status().message()));
}

py::tuple MmcifFilter(         //
    const CifDict& mmcif,      //
    bool include_nucleotides,  //
    bool include_ligands,      //
    bool include_water,        //
    bool include_other,        //
    absl::string_view model_id) {
  if (_import_array() < 0) {
    throw py::import_error("Failed to import NumPy.");
  }
  auto layout = ReadMmcifLayout(mmcif, model_id);
  std::unique_ptr<std::vector<std::uint64_t>> keep_indices;
  size_t new_num_atoms;
  absl::flat_hash_set<absl::string_view> keep_chain_ids;

  {
    py::gil_scoped_release release;

    AtomSiteLoop atom_site(mmcif);

    keep_chain_ids = SelectChains(mmcif, include_nucleotides, include_ligands,
                                  include_water, include_other);

    std::vector<std::size_t> chain_indices;
    chain_indices.reserve(keep_chain_ids.size());
    for (std::size_t i = 0; i < layout.num_chains(); ++i) {
      if (keep_chain_ids.contains(
              atom_site.chain_id[layout.atom_site_from_chain_index(i)])) {
        chain_indices.push_back(i);
      }
    }

    keep_indices =
        absl::WrapUnique(new std::vector<std::uint64_t>(ResolveMmcifAltLocs(
            layout, atom_site.comp_id, atom_site.atom_id, atom_site.alt_id,
            atom_site.occupancy, chain_indices)));
    new_num_atoms = keep_indices->size();

    if (layout.num_models() > 1) {
      keep_indices->reserve(layout.num_models() * new_num_atoms);
      std::uint64_t* start = &(*keep_indices->begin());
      std::size_t num_atom = keep_indices->size();
      // Copy first model indices into all model indices offsetting each copy.
      for (std::size_t i = 1; i < layout.num_models(); ++i) {
        std::size_t offset = i * layout.num_atoms();
        std::transform(start, start + num_atom,
                       std::back_inserter(*keep_indices),
                       [offset](std::size_t v) { return v + offset; });
      }
    }
  }

  layout.Filter(*keep_indices);

  npy_intp shape[] = {static_cast<npy_intp>(layout.num_models()),
                      static_cast<npy_intp>(new_num_atoms)};
  PyObject* arr =
      PyArray_SimpleNewFromData(2, shape, NPY_INT64, keep_indices->data());
  // Create a capsule to hold the memory of the buffer so NumPy knows how to
  // delete it when done with it.
  PyObject* capsule = PyCapsule_New(
      keep_indices.release(), nullptr, +[](PyObject* capsule_cleanup) {
        void* memory = PyCapsule_GetPointer(capsule_cleanup, nullptr);
        delete static_cast<std::vector<std::size_t>*>(memory);
      });
  PyArray_SetBaseObject(reinterpret_cast<PyArrayObject*>(arr), capsule);

  return py::make_tuple(py::reinterpret_steal<py::object>(arr), keep_chain_ids,
                        std::move(layout));
}

void MmcifFixResidues(               //
    const MmcifLayout& layout,       //
    absl::Span<PyObject*> comp_id,   //
    absl::Span<PyObject*> atom_id,   //
    absl::Span<const float> atom_x,  //
    absl::Span<const float> atom_y,  //
    absl::Span<const float> atom_z,  //
    bool fix_arginine                //
) {
  std::optional<FixArginine> arginine;
  std::size_t num_atoms = layout.num_atoms();
  if (comp_id.size() != num_atoms || atom_id.size() != num_atoms ||
      atom_x.size() != num_atoms || atom_y.size() != num_atoms ||
      atom_z.size() != num_atoms) {
    throw py::value_error(
        absl::StrCat("Sizes must match. ",                   //
                     "num_atoms=", num_atoms, ", ",          //
                     "len(comp_id)=", comp_id.size(), ", ",  //
                     "len(atom_id)=", atom_id.size(), ", ",  //
                     "len(atom_x)=", atom_x.size(), ", ",    //
                     "len(atom_y)=", atom_y.size(), ", ",    //
                     "len(atom_z)=", atom_z.size()));
  }

  if (fix_arginine) {
    arginine.emplace();
  }
  if (!arginine.has_value()) {
    return;
  }

  for (std::size_t res_index = 0; res_index < layout.num_residues();
       ++res_index) {
    auto [atom_start, atom_end] = layout.atom_range(res_index);
    std::size_t atom_count = atom_end - atom_start;
    PyObject* resname = comp_id[atom_start];
    if (arginine.has_value() && arginine->IsResidue(resname)) {
      arginine->Fix(atom_id.subspan(atom_start, atom_count),
                    atom_x.subspan(atom_start, atom_count),
                    atom_y.subspan(atom_start, atom_count),
                    atom_z.subspan(atom_start, atom_count));
    }
  }
}

std::vector<bool> SelectedPolymerResidueMask(
    const MmcifLayout& layout,
    const std::vector<absl::string_view>& atom_site_label_asym_ids,  //
    const std::vector<absl::string_view>& atom_site_label_seq_ids,   //
    const std::vector<absl::string_view>& atom_site_label_comp_ids,  //
    const std::vector<absl::string_view>& poly_seq_asym_ids,         //
    const std::vector<absl::string_view>& poly_seq_seq_ids,          //
    const std::vector<absl::string_view>& poly_seq_mon_ids           //
) {
  absl::flat_hash_map<std::pair<absl::string_view, absl::string_view>,
                      absl::string_view>
      selected;
  selected.reserve(layout.num_residues());
  // layout.residues() is O(1) while layout.residue_starts() is O(num_res).
  const std::vector<std::size_t>& residue_starts = layout.residue_starts();
  for (int i = 0; i < layout.residues().size(); ++i) {
    std::size_t res_start = residue_starts[i];
    std::size_t res_end = layout.residues()[i];
    if (res_start == res_end) {
      continue;  // Skip empty residues (containing no atoms).
    }

    absl::string_view label_seq_id = atom_site_label_seq_ids[i];
    if (label_seq_id == ".") {
      continue;  // Skip non-polymers.
    }

    absl::string_view label_asym_id = atom_site_label_asym_ids[i];
    absl::string_view label_comp_id = atom_site_label_comp_ids[i];
    selected[std::make_pair(label_asym_id, label_seq_id)] = label_comp_id;
  }

  std::vector<bool> mask;
  mask.reserve(poly_seq_mon_ids.size());
  for (int i = 0; i < poly_seq_mon_ids.size(); ++i) {
    absl::string_view poly_seq_asym_id = poly_seq_asym_ids[i];
    absl::string_view poly_seq_seq_id = poly_seq_seq_ids[i];
    absl::string_view poly_seq_mon_id = poly_seq_mon_ids[i];

    auto it = selected.find(std::make_pair(poly_seq_asym_id, poly_seq_seq_id));
    if (it != selected.end()) {
      mask.push_back(it->second == poly_seq_mon_id);
    } else {
      mask.push_back(true);  // Missing residues are not heterogeneous.
    }
  }
  return mask;
}

std::pair<std::vector<bool>, std::vector<bool>> SelectedLigandResidueMask(
    const MmcifLayout& layout,                                           //
    const std::vector<absl::string_view>& atom_site_label_asym_ids,      //
    const std::vector<absl::string_view>& atom_site_label_seq_ids,       //
    const std::vector<absl::string_view>& atom_site_auth_seq_ids,        //
    const std::vector<absl::string_view>& atom_site_label_comp_ids,      //
    const std::vector<absl::string_view>& atom_site_pdbx_pdb_ins_codes,  //
    const std::vector<absl::string_view>& nonpoly_asym_ids,              //
    const std::vector<absl::string_view>& nonpoly_auth_seq_ids,          //
    const std::vector<absl::string_view>& nonpoly_pdb_ins_codes,         //
    const std::vector<absl::string_view>& nonpoly_mon_ids,               //
    const std::vector<absl::string_view>& branch_asym_ids,               //
    const std::vector<absl::string_view>& branch_auth_seq_ids,           //
    const std::vector<absl::string_view>& branch_pdb_ins_codes,          //
    const std::vector<absl::string_view>& branch_mon_ids) {
  absl::flat_hash_map<
      std::tuple<absl::string_view, absl::string_view, absl::string_view>,
      absl::string_view>
      selected;
  selected.reserve(layout.num_residues());
  // layout.residues() is O(1) while layout.residue_starts() is O(num_res).
  const std::vector<std::size_t>& residue_starts = layout.residue_starts();
  for (int i = 0; i < layout.residues().size(); ++i) {
    std::size_t res_start = residue_starts[i];
    std::size_t res_end = layout.residues()[i];
    if (res_start == res_end) {
      continue;  // Skip empty residues (containing no atoms).
    }

    absl::string_view label_seq_id = atom_site_label_seq_ids[i];
    if (label_seq_id != ".") {
      continue;  // Skip polymers.
    }

    absl::string_view label_asym_id = atom_site_label_asym_ids[i];
    absl::string_view auth_seq_id = atom_site_auth_seq_ids[i];
    absl::string_view ins_code = atom_site_pdbx_pdb_ins_codes[i];
    ins_code = ins_code == "?" ? "." : ins_code;  // Remap unknown to unset.
    absl::string_view label_comp_id = atom_site_label_comp_ids[i];
    selected[std::make_tuple(label_asym_id, auth_seq_id, ins_code)] =
        label_comp_id;
  }

  std::vector<bool> nonpoly_mask;
  nonpoly_mask.reserve(nonpoly_asym_ids.size());
  for (int i = 0; i < nonpoly_asym_ids.size(); ++i) {
    absl::string_view nonpoly_asym_id = nonpoly_asym_ids[i];
    absl::string_view nonpoly_auth_seq_id = nonpoly_auth_seq_ids[i];
    absl::string_view nonpoly_ins_code = nonpoly_pdb_ins_codes[i];
    // Remap unknown to unset.
    nonpoly_ins_code = nonpoly_ins_code == "?" ? "." : nonpoly_ins_code;
    absl::string_view nonpoly_mon_id = nonpoly_mon_ids[i];

    auto it = selected.find(std::make_tuple(
        nonpoly_asym_id, nonpoly_auth_seq_id, nonpoly_ins_code));
    if (it != selected.end()) {
      nonpoly_mask.push_back(it->second == nonpoly_mon_id);
    } else {
      nonpoly_mask.push_back(true);  // Missing residues are not heterogeneous.
    }
  }

  std::vector<bool> branch_mask;
  branch_mask.reserve(branch_asym_ids.size());
  for (int i = 0; i < branch_asym_ids.size(); ++i) {
    absl::string_view branch_asym_id = branch_asym_ids[i];
    absl::string_view branch_auth_seq_id = branch_auth_seq_ids[i];

    // Insertion codes in _pdbx_branch_scheme are not required and can be
    // missing. Default to unset ('.') in such case.
    absl::string_view branch_ins_code;
    if (i < branch_pdb_ins_codes.size()) {
      branch_ins_code = branch_pdb_ins_codes[i];
      // Remap unknown to unset.
      branch_ins_code = branch_ins_code == "?" ? "." : branch_ins_code;
    } else {
      branch_ins_code = ".";
    }

    absl::string_view branch_mon_id = branch_mon_ids[i];

    auto it = selected.find(
        std::make_tuple(branch_asym_id, branch_auth_seq_id, branch_ins_code));
    if (it != selected.end()) {
      branch_mask.push_back(it->second == branch_mon_id);
    } else {
      branch_mask.push_back(true);  // Missing residues are not heterogeneous.
    }
  }

  return std::make_pair(nonpoly_mask, branch_mask);
}

constexpr char kReadMmcifLayout[] = R"(
Returns the layout of the cif_dict.

Args:
  mmcif: mmCIF to calculate the layout for.
  model_id: If non-empty the layout of the given model is returned
    otherwise the layout of all models are returned.
Raises:
  ValueError: if the mmCIF is malformed or the number of atoms in each
    model are inconsistent.
)";

constexpr char kMmcifFilter[] = R"(
Returns NumpyArray of selected rows in `_atom_site` and new layout.

Args:
  mmcif: mmCIF to filter.
  include_nucleotides: Whether to include polymer entities of type:
    "polypeptide(L)\", "polydeoxyribonucleotide", "polyribonucleotide".
    Otherwise only "polypeptide(L)\". ("polypeptide(D)\" is never included.)
  include_ligands: Whether to include non-polymer entities of type:
    "non-polymer", "branched".
  include_water: Whether to include entities of type water.
  include_other: Whether to include other (non-standard) entity types
    that are not covered by any of the above parameters.
  model_id: If non-empty the model with given name is selected otherwise
    all models are selected.

Returns:
  A tuple containing a numpy array with a shape (num_models, num_atoms)
  with the atom_site indices selected and the new layout.

Raises:
  ValueError error if mmCIF dict does not have all required fields.
)";

constexpr char kMmcifFixResidues[] = R"(
Fixes residue columns in-place.

Args:
  layout: layout from filter command.
  comp_id: '_atom_site.label_comp_id' of first model.
  group: '_atom_site.group_PDB' of first model.
  atom_id: '_atom_site.label_atom_id' of first model.
  type_symbol: '_atom_site.type_symbol' of first model.
  atom_x: '_atom_site.Cartn_x' of first model.
  atom_y: '_atom_site.Cartn_y' of first model.
  atom_z: '_atom_site.Cartn_z' of first model.
  fix_mse: Whether to convert MSE residues into MET residues.
  fix_arg: Whether to ensure the atoms in ARG are in the correct order.
  fix_unknown_dna: Whether to convert DNA residues from N to DN.
  dna_mask: Which atoms are from DNA chains.

Raises:
  ValueError: If shapes are invalid.
)";

constexpr char kSelectedPolymerResidueMask[] = R"(
Returns a _pdbx_poly_seq_scheme mask for selected hetero residues.

Should be called after filtering the layout using mmcif_utils.filter.

Args:
  layout: Layout defining the _atom_site residue selection.
  atom_site_label_asym_ids: Internal (label) chain ID, per selected residue.
  atom_site_label_seq_ids: Internal (label) residue ID, per selected residue.
  atom_site_label_comp_ids: Residue name, per selected residue.
  poly_seq_asym_ids: Internal (label) chain ID, per residue.
  poly_seq_seq_ids: Internal (label) residue ID, per residue.
  poly_seq_mon_ids: Residue name, per residue.

Returns:
  A mask for the _pdbx_poly_seq_scheme table. If residues are selected
  using this mask, they will have consistent heterogeneous residue
  selection with the _atom_site table.
)";

constexpr char kSelectedLigandResidueMask[] = R"(
Returns masks for selected ligand hetero residues.

Should be called after filtering the layout using mmcif_utils.filter.

Args:
  layout: Layout defining the _atom_site residue selection.
  atom_site_label_asym_ids: Internal (label) chain ID, per selected residue.
  atom_site_label_seq_ids: Internal (author) residue ID, per selected residue.
  atom_site_auth_seq_ids: External (author) residue ID, per selected residue.
  atom_site_label_comp_ids: Residue name, per selected residue.
  atom_site_pdbx_pdb_ins_codes: Insertion code, per selected residue.
  nonpoly_asym_ids: Internal (label) chain ID, per residue from
   _pdbx_nonpoly_scheme.
  nonpoly_auth_seq_ids: External (author) residue ID, per residue from
   _pdbx_nonpoly_scheme.
  nonpoly_pdb_ins_codes: Residue name, per residue from
   _pdbx_nonpoly_scheme.
  nonpoly_mon_ids: Insertion code, per residue from _pdbx_nonpoly_scheme.
  branch_asym_ids: Internal (label) chain ID, per residue from
   _pdbx_branch_scheme.
  branch_auth_seq_ids: External (author) residue ID, per residue from
   _pdbx_branch_scheme.
  branch_pdb_ins_codes: Residue name, per residue from _pdbx_branch_scheme.
  branch_mon_ids: Insertion code, per residue from _pdbx_branch_scheme.

Returns:
  A tuple with masks for _pdbx_nonpoly_scheme and _pdbx_branch_scheme. If
  residues are selected using these masks, they will have consistent
  heterogeneous residue selection with the _atom_site table.
)";

}  // namespace

void RegisterModuleMmcifUtils(pybind11::module m) {
  m.def("read_layout", ReadMmcifLayout,
        py::arg("mmcif"),              //
        py::arg("model_id") = "",      //
        py::doc(kReadMmcifLayout + 1)  //
  );

  m.def("filter", MmcifFilter,               //
        py::arg("mmcif"),                    //
        py::arg("include_nucleotides"),      //
        py::arg("include_ligands") = false,  //
        py::arg("include_water") = false,    //
        py::arg("include_other") = false,    //
        py::arg("model_id") = "",            //
        py::doc(kMmcifFilter + 1)            //
  );

  m.def("fix_residues", MmcifFixResidues,
        py::arg("layout"),              //
        py::arg("comp_id"),             //
        py::arg("atom_id"),             //
        py::arg("atom_x"),              //
        py::arg("atom_y"),              //
        py::arg("atom_z"),              //
        py::arg("fix_arg") = false,     //
        py::doc(kMmcifFixResidues + 1)  //
  );

  m.def("selected_polymer_residue_mask", SelectedPolymerResidueMask,
        py::arg("layout"),                         //
        py::arg("atom_site_label_asym_ids"),       //
        py::arg("atom_site_label_seq_ids"),        //
        py::arg("atom_site_label_comp_ids"),       //
        py::arg("poly_seq_asym_ids"),              //
        py::arg("poly_seq_seq_ids"),               //
        py::arg("poly_seq_mon_ids"),               //
        py::call_guard<py::gil_scoped_release>(),  //
        py::doc(kSelectedPolymerResidueMask + 1)   //
  );

  m.def("selected_ligand_residue_mask", SelectedLigandResidueMask,
        py::arg("layout"),                         //
        py::arg("atom_site_label_asym_ids"),       //
        py::arg("atom_site_label_seq_ids"),        //
        py::arg("atom_site_auth_seq_ids"),         //
        py::arg("atom_site_label_comp_ids"),       //
        py::arg("atom_site_pdbx_pdb_ins_codes"),   //
        py::arg("nonpoly_asym_ids"),               //
        py::arg("nonpoly_auth_seq_ids"),           //
        py::arg("nonpoly_pdb_ins_codes"),          //
        py::arg("nonpoly_mon_ids"),                //
        py::arg("branch_asym_ids"),                //
        py::arg("branch_auth_seq_ids"),            //
        py::arg("branch_pdb_ins_codes"),           //
        py::arg("branch_mon_ids"),                 //
        py::call_guard<py::gil_scoped_release>(),  //
        py::doc(kSelectedLigandResidueMask + 1)    //
  );
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/mmcif_utils_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_UTILS_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_UTILS_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleMmcifUtils(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_MMCIF_UTILS_PYBIND_H_


================================================
FILE: src/alphafold3/structure/cpp/string_array.pyi
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

from collections.abc import Sequence
from typing import Any, overload

import numpy as np


def format_float_array(
    values: Sequence[float], num_decimal_places: int
) -> list[str]: ...


def isin(
    array: np.ndarray[object],
    test_elements: set[str | bytes],
    *,
    invert: bool = ...,
) -> np.ndarray[bool]: ...


@overload
def remap(
    array: np.ndarray[object],
    mapping: dict[str, str],
    default_value: str,
    inplace: bool = ...,
) -> np.ndarray[object]: ...


@overload
def remap(
    array: np.ndarray[object],
    mapping: dict[str, str],
    inplace: bool = ...,
) -> np.ndarray[object]: ...


def remap_multiple(
    arrays: Sequence[np.ndarray[object]],
    mapping: dict[tuple[Any], int],
) -> np.ndarray[int]: ...


================================================
FILE: src/alphafold3/structure/cpp/string_array_pybind.cc
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#include <Python.h>

#include <algorithm>
#include <cstddef>
#include <cstdint>
#include <cstring>
#include <iterator>
#include <limits>
#include <string>
#include <vector>

#include "numpy/arrayobject.h"
#include "numpy/ndarrayobject.h"
#include "numpy/ndarraytypes.h"
#include "numpy/npy_common.h"
#include "absl/algorithm/container.h"
#include "absl/container/flat_hash_set.h"
#include "absl/strings/str_format.h"
#include "absl/strings/string_view.h"
#include "absl/types/span.h"
#include "pybind11/cast.h"
#include "pybind11/numpy.h"
#include "pybind11/pybind11.h"
#include "pybind11/pytypes.h"
#include "pybind11_abseil/absl_casters.h"

namespace {

namespace py = pybind11;

PyObject* RemapNumpyArrayObjects(PyObject* array, PyObject* mapping,
                                 bool inplace, PyObject* default_value) {
  import_array();
  if (!PyArray_Check(array)) {
    PyErr_SetString(PyExc_TypeError, "'array' must be a np.ndarray.");
    return nullptr;
  }
  if (!PyDict_Check(mapping)) {
    PyErr_SetString(PyExc_TypeError, "'mapping' must be a Python dict.");
    return nullptr;
  }

  PyArrayObject* array_obj = reinterpret_cast<PyArrayObject*>(array);
  if (PyArray_TYPE(array_obj) != NPY_OBJECT) {
    PyErr_SetString(PyExc_TypeError, "`array` must be an array of objects.");
    return nullptr;
  }

  if (inplace) {
    // We are returning original array so we need to increase the ref count.
    Py_INCREF(array);
  } else {
    // We are returning a fresh copy.
    array = PyArray_NewCopy(array_obj, NPY_CORDER);
    if (array == nullptr) {
      PyErr_SetString(PyExc_MemoryError, "Out of memory!");
      return nullptr;
    }
    array_obj = reinterpret_cast<PyArrayObject*>(array);
  }

  if (PyArray_SIZE(array_obj) == 0) {
    return array;
  }

  if (default_value == nullptr && PyDict_Size(mapping) == 0) {
    return array;
  }

  NpyIter* iter = NpyIter_New(
      array_obj, NPY_ITER_READWRITE | NPY_ITER_EXTERNAL_LOOP | NPY_ITER_REFS_OK,
      NPY_KEEPORDER, NPY_NO_CASTING, nullptr);
  if (iter == nullptr) {
    PyErr_SetString(PyExc_MemoryError, "Out of memory!");
    Py_XDECREF(array);
    return nullptr;
  }

  NpyIter_IterNextFunc* iter_next = NpyIter_GetIterNext(iter, nullptr);
  if (iter_next == nullptr) {
    NpyIter_Deallocate(iter);
    Py_XDECREF(array);
    PyErr_SetString(PyExc_MemoryError, "Out of memory!");
    return nullptr;
  }

  // Iterating arrays taken from:
  // https://numpy.org/doc/stable/reference/c-api/iterator.html
  char** data_pointer = NpyIter_GetDataPtrArray(iter);
  npy_intp* stride_pointer = NpyIter_GetInnerStrideArray(iter);
  npy_intp* inner_size_pointer = NpyIter_GetInnerLoopSizePtr(iter);
  do {
    char* data = *data_pointer;
    npy_intp stride = *stride_pointer;
    npy_intp count = *inner_size_pointer;
    for (size_t i = 0; i < count; ++i) {
      PyObject* entry;
      std::memcpy(&entry, data, sizeof(PyObject*));
      PyObject* result = PyDict_GetItem(mapping, entry);
      if (result != nullptr) {
        // Replace entry.
        Py_INCREF(result);
        Py_XDECREF(entry);
        std::memcpy(data, &result, sizeof(PyObject*));
      } else if (default_value != nullptr) {
        // Replace entry with a default value.
        Py_INCREF(default_value);
        Py_XDECREF(entry);
        std::memcpy(data, &default_value, sizeof(PyObject*));
      }
      data += stride;
    }
  } while (iter_next(iter));

  NpyIter_Deallocate(iter);
  return array;
}

// Convert 1D Numpy float array to a list of strings where each string has fixed
// number of decimal points. This is faster than Python list comprehension.
std::vector<std::string> FormatFloatArray(absl::Span<const float> values,
                                          int num_decimal_places) {
  std::vector<std::string> output;
  output.reserve(values.size());

  absl::c_transform(values, std::back_inserter(output),
                    [num_decimal_places](float value) {
                      return absl::StrFormat("%.*f", num_decimal_places, value);
                    });
  return output;
}

py::array_t<bool> IsIn(
    const py::array_t<PyObject*, py::array::c_style>& array,
    const absl::flat_hash_set<absl::string_view>& test_elements, bool invert) {
  const size_t num_elements = array.size();
  py::array_t<bool> output(num_elements);
  std::fill(output.mutable_data(), output.mutable_data() + output.size(),
            invert);

  // Shortcut: The output will be trivially always false if test_elements empty.
  if (test_elements.empty()) {
    return output;
  }

  for (size_t i = 0; i < num_elements; ++i) {
    // Compare the string values instead of comparing just object pointers.
    py::handle handle = array.data()[i];
    if (!PyUnicode_Check(handle.ptr()) && !PyBytes_Check(handle.ptr())) {
      continue;
    }
    if (test_elements.contains(py::cast<absl::string_view>(handle))) {
      output.mutable_data()[i] = !invert;
    }
  }
  if (array.ndim() > 1) {
    auto shape =
        std::vector<ptrdiff_t>(array.shape(), array.shape() + array.ndim());
    return output.reshape(shape);
  }
  return output;
}

py::array RemapMultipleArrays(
    const std::vector<py::array_t<PyObject*, py::array::c_style>>& arrays,
    const py::dict& mapping) {
  size_t array_size = arrays[0].size();
  for (const auto& array : arrays) {
    if (array.size() != array_size) {
      throw py::value_error("All arrays must have the same length.");
    }
  }

  // Create a result buffer.
  auto result = py::array_t<int64_t>(array_size);
  absl::Span<int64_t> result_buffer(result.mutable_data(), array_size);
  PyObject* entry = PyTuple_New(arrays.size());
  if (entry == nullptr) {
    throw py::error_already_set();
  }
  std::vector<absl::Span<PyObject* const>> array_spans;
  array_spans.reserve(arrays.size());
  for (const auto& array : arrays) {
    array_spans.emplace_back(array.data(), array.size());
  }

  // Iterate over arrays and look up elements in the `py_dict`.
  bool fail = false;
  for (size_t i = 0; i < array_size; ++i) {
    for (size_t j = 0; j < array_spans.size(); ++j) {
      PyTuple_SET_ITEM(entry, j, array_spans[j][i]);
    }
    PyObject* result = PyDict_GetItem(mapping.ptr(), entry);
    if (result != nullptr) {
      int64_t result_value = PyLong_AsLongLong(result);
      if (result_value == -1 && PyErr_Occurred()) {
        fail = true;
        break;
      }
      if (result_value > std::numeric_limits<int64_t>::max() ||
          result_value < std::numeric_limits<int64_t>::lowest()) {
        PyErr_SetString(PyExc_OverflowError, "Result value too large.");
        fail = true;
        break;
      }
      result_buffer[i] = result_value;
    } else {
      PyErr_Format(PyExc_KeyError, "%R", entry);
      fail = true;
      break;
    }
  }

  for (size_t j = 0; j < array_spans.size(); ++j) {
    PyTuple_SET_ITEM(entry, j, nullptr);
  }
  Py_XDECREF(entry);
  if (fail) {
    throw py::error_already_set();
  }
  return result;
}

constexpr char kRemapNumpyArrayObjects[] = R"(
Replace objects in NumPy array of objects using mapping.

Args:
  array: NumPy array with dtype=object.
  mapping: Dict mapping old values to new values.
  inplace: Bool (default False) whether to replace values inplace or to
    create a new array.
  default_value: If given, what value to map to if the mapping is missing
    for that particular item. If not given, such items are left unchanged.

Returns
  NumPy array of dtype object with values replaced according to mapping.
  If inplace is True the original array is modified inplace otherwise a
  new array is returned.
)";

constexpr char kFormatFloatArrayDoc[] = R"(
Converts float -> string array with given number of decimal places.
)";

constexpr char kIsInDoc[] = R"(
Computes whether each element is in test_elements.

Same use as np.isin, but much faster. If len(array) = n, len(test_elements) = m:
* This function has complexity O(n).
* np.isin with arrays of objects has complexity O(m*log(m) + n * log(m)).

Args:
  array: Input NumPy array with dtype=object.
  test_elements: The values against which to test each value of array.
  invert: If True, the values in the returned array are inverted, as if
    calculating `element not in test_elements`. Default is False.
    `isin(a, b, invert=True)` is equivalent to but faster than `~isin(a, b)`.

Returns
  A boolean array of the same shape as the input array. Each value `val` is:
  * `val in test_elements` if `invert=False`,
  * `val not in test_elements` if `invert=True`.
)";

constexpr char kRemapMultipleDoc[] = R"(
Maps keys from multiple aligned arrays to a single array.

Args:
  arrays: Numpy arrays of the same length. The tuple of aligned entries is used
    as key for the mapping.
  mapping: Dict mapping from tuples to integer values.

Returns
  NumPy array of dtype `int` with values looked up in mapping according to the
  tuple of aligned array entries as keys.
)";

}  // namespace

namespace alphafold3 {

void RegisterModuleStringArray(pybind11::module m) {
  m.def(
      "remap",
      [](py::object array, py::object mapping, bool inplace,
         py::object default_value) -> py::object {
        PyObject* result = RemapNumpyArrayObjects(array.ptr(), mapping.ptr(),
                                                  inplace, default_value.ptr());
        if (result == nullptr) {
          throw py::error_already_set();
        }
        return py::reinterpret_steal<py::object>(result);
      },
      py::return_value_policy::take_ownership, py::arg("array"),
      py::arg("mapping"), py::arg("inplace") = false, py::arg("default_value"),
      py::doc(kRemapNumpyArrayObjects + 1));
  m.def(
      "remap",
      [](py::object array, py::object mapping, bool inplace) -> py::object {
        PyObject* result = RemapNumpyArrayObjects(array.ptr(), mapping.ptr(),
                                                  inplace, nullptr);
        if (result == nullptr) {
          throw py::error_already_set();
        }
        return py::reinterpret_steal<py::object>(result);
      },
      py::return_value_policy::take_ownership, py::arg("array"),
      py::arg("mapping"), py::arg("inplace") = false,
      py::doc(kRemapNumpyArrayObjects + 1));
  m.def("format_float_array", &FormatFloatArray, py::arg("values"),
        py::arg("num_decimal_places"), py::doc(kFormatFloatArrayDoc + 1),
        py::call_guard<py::gil_scoped_release>());
  m.def("isin", &IsIn, py::arg("array"), py::arg("test_elements"),
        py::kw_only(), py::arg("invert") = false, py::doc(kIsInDoc + 1));
  m.def("remap_multiple", &RemapMultipleArrays, py::arg("arrays"),
        py::arg("mapping"), py::doc(kRemapMultipleDoc + 1));
}

}  // namespace alphafold3


================================================
FILE: src/alphafold3/structure/cpp/string_array_pybind.h
================================================
// Copyright 2024 DeepMind Technologies Limited
//
// AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
// this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
//
// To request access to the AlphaFold 3 model parameters, follow the process set
// out at https://github.com/google-deepmind/alphafold3. You may only use these
// if received directly from Google. Use is subject to terms of use available at
// https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

#ifndef ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_STRING_ARRAY_PYBIND_H_
#define ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_STRING_ARRAY_PYBIND_H_

#include "pybind11/pybind11.h"

namespace alphafold3 {

void RegisterModuleStringArray(pybind11::module m);

}

#endif  // ALPHAFOLD3_SRC_ALPHAFOLD3_STRUCTURE_PYTHON_STRING_ARRAY_PYBIND_H_


================================================
FILE: src/alphafold3/structure/mmcif.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Low level mmCIF parsing operations and wrappers for nicer C++/Py errors.

Note that the cif_dict.CifDict class has many useful methods to help with data
extraction which are not shown in this file. You can find them in cif_dict.clif
together with docstrings. The cif_dict.CifDict class behaves like an immutable
Python dictionary (some methods are not implemented though).
"""
from collections.abc import Callable, Mapping, Sequence
import functools
import itertools
import re
from typing import ParamSpec, TypeAlias, TypeVar

from alphafold3.constants import chemical_components
from alphafold3.cpp import cif_dict
from alphafold3.cpp import mmcif_atom_site
from alphafold3.cpp import mmcif_struct_conn
from alphafold3.cpp import string_array
import numpy as np

Mmcif = cif_dict.CifDict


_P = ParamSpec('_P')
_T = TypeVar('_T')
_WappedFn: TypeAlias = Callable[_P, _T]


@functools.lru_cache(maxsize=256)
def int_id_to_str_id(num: int) -> str:
  """Encodes a number as a string, using reverse spreadsheet style naming.

  Args:
    num: A positive integer.

  Returns:
    A string that encodes the positive integer using reverse spreadsheet style,
    naming e.g. 1 = A, 2 = B, ..., 27 = AA, 28 = BA, 29 = CA, ... This is the
    usual way to encode chain IDs in mmCIF files.
  """
  if num <= 0:
    raise ValueError(f'Only positive integers allowed, got {num}.')

  num = num - 1  # 1-based indexing.
  output = []
  while num >= 0:
    output.append(chr(num % 26 + ord('A')))
    num = num // 26 - 1
  return ''.join(output)


@functools.lru_cache(maxsize=256)
def str_id_to_int_id(str_id: str) -> int:
  """Encodes an mmCIF-style string chain ID as an integer.

  The integer IDs are one based so this function is the inverse of
  int_id_to_str_id.

  Args:
    str_id: A string chain ID consisting only of upper case letters A-Z.

  Returns:
    An integer that can be used to order mmCIF chain IDs in the standard
    (reverse spreadsheet style) ordering.
  """
  if not re.match('^[A-Z]+$', str_id):
    raise ValueError(f'String ID must be upper case letters, got {str_id}.')

  offset = ord('A') - 1
  output = 0
  for i, c in enumerate(str_id):
    output += (ord(c) - offset) * int(26**i)
  return output


def from_string(mmcif_string: str | bytes) -> Mmcif:
  return cif_dict.from_string(mmcif_string)


def parse_multi_data_cif(cif_string: str) -> dict[str, Mmcif]:
  """Parses a CIF string with multiple data records.

  For instance, the CIF string:

  ```
  data_001
  _foo bar
  #
  data_002
  _foo baz
  ```

  is parsed as:

  ```
  {'001': Mmcif({'_foo': ['bar']}), '002': Mmcif({'_foo': ['baz']})}
  ```

  Args:
    cif_string: The multi-data CIF string to be parsed.

  Returns:
    A dictionary mapping record names to Mmcif objects with data.
  """
  return cif_dict.parse_multi_data_cif(cif_string)


class BondParsingError(Exception):
  """Exception raised by errors when getting bond atom indices."""


def get_bond_atom_indices(
    mmcif: Mmcif,
    model_id: str = '1',
) -> tuple[Sequence[int], Sequence[int]]:
  """Extracts the indices of the atoms that participate in bonds.

  Args:
    mmcif: The mmCIF object to process.
    model_id: The ID of the model that the returned atoms will belong to. This
      should be a value in the mmCIF's _atom_site.pdbx_PDB_model_num column.

  Returns:
    Two lists of atom indices, `from_atoms` and `to_atoms`, each one having
    length num_bonds (as defined by _struct_conn, the bonds table). The bond
    i, defined by the i'th row in _struct_conn, is a bond from atom at index
    from_atoms[i], to the atom at index to_atoms[i]. The indices are simple
    0-based indexes into the columns of the _atom_site table in the input
    mmCIF, and do not necessarily correspond to the values in _atom_site.id,
    or any other column.

  Raises:
    BondParsingError: If any of the required tables or columns are not present
    in
      the mmCIF, or if the _struct_conn table refers to atoms that cannot
      be found in the _atom_site table.
  """
  try:
    return mmcif_struct_conn.get_bond_atom_indices(mmcif, model_id)
  except ValueError as e:
    raise BondParsingError(str(e)) from e


def get_or_infer_type_symbol(
    mmcif: Mmcif, ccd: chemical_components.Ccd | None = None
) -> Sequence[str]:
  """Returns the type symbol (element) for all of the atoms.

  Args:
    mmcif: A parsed mmCIF file in the Mmcif format.
    ccd: The chemical component dictionary. If not provided, defaults to the
      cached CCD.

  If present, returns the _atom_site.type_symbol. If not, infers it using
  _atom_site.label_comp_id (residue name), _atom_site.label_atom_id (atom name)
  and the CCD.
  """
  ccd = ccd or chemical_components.Ccd()
  type_symbol_fn = lambda res_name, atom_name: chemical_components.type_symbol(
      ccd, res_name, atom_name
  )
  return mmcif_atom_site.get_or_infer_type_symbol(mmcif, type_symbol_fn)


def get_chain_type_by_entity_id(mmcif: Mmcif) -> Mapping[str, str]:
  """Returns mapping from entity ID to its type or polymer type if available.

  If the entity is in the _entity_poly table, returns its polymer chain type.
  If not, returns the type as specified in the _entity table.

  Args:
    mmcif: CifDict holding the mmCIF.
  """
  poly_entity_id = mmcif.get('_entity_poly.entity_id', [])
  poly_type = mmcif.get('_entity_poly.type', [])
  poly_type_by_entity_id = dict(zip(poly_entity_id, poly_type, strict=True))

  chain_type_by_entity_id = {}
  for entity_id, entity_type in zip(
      mmcif.get('_entity.id', []), mmcif.get('_entity.type', []), strict=True
  ):
    chain_type = poly_type_by_entity_id.get(entity_id) or entity_type
    chain_type_by_entity_id[entity_id] = chain_type

  return chain_type_by_entity_id


def get_internal_to_author_chain_id_map(mmcif: Mmcif) -> Mapping[str, str]:
  """Returns a mapping from internal chain ID to the author chain ID.

  Note that this is not a bijection. One author chain ID can map to multiple
  internal chain IDs. For example, a protein chain and a ligand bound to it will
  share the same author chain ID, but they will each have a unique internal
  chain ID).

  Args:
    mmcif: CifDict holding the mmCIF.
  """
  return mmcif_atom_site.get_internal_to_author_chain_id_map(mmcif)


def get_experimental_method(mmcif: Mmcif) -> str | None:
  field = '_exptl.method'
  return ','.join(mmcif[field]).lower() if field in mmcif else None


def get_release_date(mmcif: Mmcif) -> str | None:
  """Returns the oldest revision date."""
  if '_pdbx_audit_revision_history.revision_date' not in mmcif:
    return None

  # Release dates are ISO-8601, hence sort well.
  return min(mmcif['_pdbx_audit_revision_history.revision_date'])


def get_resolution(mmcif: Mmcif) -> float | None:
  """Returns the resolution of the structure.

  More than one resolution can be reported in an mmCIF. This function returns
  the first one (in the order _refine.ls_d_res_high,
  _em_3d_reconstruction.resolution, _reflns.d_resolution_high) that appears
  in the mmCIF as is parseable as a float.

  Args:
    mmcif: An `Mmcif` object.

  Returns:
    The resolution as reported in the mmCIF.
  """
  for res_key in ('_refine.ls_d_res_high',
                  '_em_3d_reconstruction.resolution',
                  '_reflns.d_resolution_high'):
    if res_key in mmcif:
      try:
        raw_resolution = mmcif[res_key][0]
        return float(raw_resolution)
      except ValueError:
        continue
  return None


def parse_oper_expr(oper_expression: str) -> list[tuple[str, ...]]:
  """Determines which transforms to apply based on an MMCIF oper_expression str.

  Args:
    oper_expression: the field oper_expression from MMCIF format data.
      Transform ids may be either numbers or single letters. Hyphens are used to
      denote a numeric range of transforms to apply, and commas are used to
      delimit a sequence of transforms. Where two sets of parentheses are
      adjacent without a comma, the two sets of transforms should be combined as
      a cartesian product, i.e. all possible pairs.
      example 1,2,3 -> generate 3 copies of each chain by applying 1, 2 or 3.
      example (1-3) -> generate 3 copies of each chain by applying 1, 2 or 3.
      example (1-3)(4-6) -> generate 9 copies of each chain by applying one of
        [(1,4), (1,5), (1,6),
         (2,4), (2,5), (2,6),
         (3,4), (3,5), (3,6)]
      example (P) -> apply transform with id P.

  Raises:
    ValueError: Failure to parse oper_expression.

  Returns:
    A list with one element for each chain copy that should be generated.
    Each element is a list of transform ids to apply.
  """
  # Expand ranges, e.g. 1-4 -> 1,2,3,4.
  def range_expander(match):
    return ','.join(
        [str(i) for i in range(int(match.group(1)),
                               int(match.group(2)) + 1)])

  ranges_expanded = re.sub(r'\b(\d+)-(\d+)', range_expander, oper_expression)

  if re.fullmatch(r'(\w+,)*\w+', ranges_expanded):
    # No brackets, just a single range, e.g. "1,2,3".
    return [(t,) for t in ranges_expanded.split(',')]
  elif re.fullmatch(r'\((\w+,)*\w+\)', ranges_expanded):
    # Single range in brackets, e.g. "(1,2,3)".
    return [(t,) for t in ranges_expanded[1:-1].split(',')]
  elif re.fullmatch(r'\((\w+,)*\w+\)\((\w+,)*\w+\)', ranges_expanded):
    # Cartesian product of two ranges, e.g. "(1,2,3)(4,5)".
    part1, part2 = ranges_expanded[1:-1].split(')(')
    return list(itertools.product(part1.split(','), part2.split(',')))
  else:
    raise ValueError(f'Unsupported oper_expression format: {oper_expression}')


def format_float_array(
    values: np.ndarray, num_decimal_places: int) -> Sequence[str]:
  """Converts 1D array to a list of strings with the given number of decimals.

  This function is faster than converting via Python list comprehension, e.g.:
  atoms_x = ['%.3f' % x for x in atoms_x]

  Args:
    values: A numpy array with values to convert. This array is casted to
      float32 before doing the conversion.
    num_decimal_places: The number of decimal points to keep, including trailing
      zeros. E.g. for 1.07 and num_decimal_places=1: 1.1,
      num_decimal_places=2: 1.07, num_decimal_places=3: 1.070.

  Returns:
    A list of formatted strings.
  """
  if values.ndim != 1:
    raise ValueError(f'The given array must be 1D, got {values.ndim}D')

  return string_array.format_float_array(
      values=values.astype(np.float32), num_decimal_places=num_decimal_places
  )


================================================
FILE: src/alphafold3/structure/parsing.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Module for parsing various data sources and producing Structures."""

from collections.abc import Collection, Mapping, MutableMapping, Sequence
import dataclasses
import datetime
import enum
import functools
import itertools
from typing import TypeAlias

from alphafold3.constants import chemical_components
from alphafold3.constants import mmcif_names
from alphafold3.constants import residue_names
from alphafold3.cpp import mmcif_utils
from alphafold3.cpp import string_array
from alphafold3.structure import bioassemblies
from alphafold3.structure import bonds
from alphafold3.structure import chemical_components as struc_chem_comps
from alphafold3.structure import mmcif
from alphafold3.structure import structure
from alphafold3.structure import structure_tables
import numpy as np


ChainIndex: TypeAlias = int
ResIndex: TypeAlias = int
AtomName: TypeAlias = str
BondAtomId: TypeAlias = tuple[ChainIndex, ResIndex, AtomName]

_INSERTION_CODE_REMAP: Mapping[str, str] = {'.': '?'}


class NoAtomsError(Exception):
  """Raise when the mmCIF does not have any atoms."""


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class BondIndices:
  from_indices: list[int]
  dest_indices: list[int]


@enum.unique
class ModelID(enum.Enum):
  """Values for specifying model IDs when parsing."""

  FIRST = 1  # The first model in the file.
  ALL = 2  # All models in the file.


@enum.unique
class SequenceFormat(enum.Enum):
  """The possible formats for an input sequence."""

  FASTA = 'fasta'  # One-letter code used in FASTA.
  CCD_CODES = 'ccd_codes'  # Multiple-letter chemical components dictionary ids.
  LIGAND_SMILES = 'ligand_smiles'  # SMILES string defining a molecule.


def _create_bond_lookup(
    bonded_atom_pairs: Sequence[tuple[BondAtomId, BondAtomId]],
) -> Mapping[tuple[ChainIndex, ResIndex], Mapping[AtomName, BondIndices]]:
  """Creates maps to help find bonds during a loop over residues."""
  bond_lookup = {}
  for bond_i, (from_atom_id, dest_atom_id) in enumerate(bonded_atom_pairs):
    from_chain_i, from_res_i, from_atom_name = from_atom_id
    dest_chain_i, dest_res_i, dest_atom_name = dest_atom_id
    bonds_by_from_atom_name = bond_lookup.setdefault(
        (from_chain_i, from_res_i), {}
    )
    bonds_by_dest_atom_name = bond_lookup.setdefault(
        (dest_chain_i, dest_res_i), {}
    )
    bonds_by_from_atom_name.setdefault(
        from_atom_name, BondIndices(from_indices=[], dest_indices=[])
    ).from_indices.append(bond_i)
    bonds_by_dest_atom_name.setdefault(
        dest_atom_name, BondIndices(from_indices=[], dest_indices=[])
    ).dest_indices.append(bond_i)
  return bond_lookup


def _get_atom_element(
    ccd: chemical_components.Ccd, res_name: str, atom_name: str
) -> str:
  type_symbol = chemical_components.type_symbol(
      ccd, res_name=res_name, atom_name=atom_name
  )
  return type_symbol or '?'


def _get_representative_atom(
    ccd: chemical_components.Ccd,
    res_name: str,
    chain_type: str,
    sequence_format: SequenceFormat,
) -> tuple[str, str]:
  match sequence_format:
    case SequenceFormat.CCD_CODES:
      atom_name = _get_first_non_leaving_atom(ccd=ccd, res_name=res_name)
      atom_element = _get_atom_element(
          ccd=ccd, res_name=res_name, atom_name=atom_name
      )
      return atom_name, atom_element
    case SequenceFormat.LIGAND_SMILES:
      return '', '?'
    case SequenceFormat.FASTA:
      if chain_type in mmcif_names.PEPTIDE_CHAIN_TYPES:
        return 'CA', 'C'
      if chain_type in mmcif_names.NUCLEIC_ACID_CHAIN_TYPES:
        return "C1'", 'C'
      else:
        raise ValueError(chain_type)
    case _:
      raise ValueError(sequence_format)


@functools.lru_cache(maxsize=128)
def _get_first_non_leaving_atom(
    ccd: chemical_components.Ccd, res_name: str
) -> str:
  """Returns first definitely non-leaving atom if exists, as a stand-in."""
  all_atoms = struc_chem_comps.get_all_atoms_in_entry(ccd, res_name=res_name)[
      '_chem_comp_atom.atom_id'
  ]
  representative_atom = all_atoms[0]
  if representative_atom == 'O1' and len(all_atoms) > 1:
    representative_atom = all_atoms[1]
  return representative_atom


def _add_ligand_to_chem_comp(
    chem_comp: MutableMapping[str, struc_chem_comps.ChemCompEntry],
    ligand_id: str,
    ligand_smiles: str,
):
  """Adds a ligand to chemical components. Raises ValueError on mismatch."""
  new_entry = struc_chem_comps.ChemCompEntry(
      type='non-polymer', pdbx_smiles=ligand_smiles
  )

  existing_entry = chem_comp.get(ligand_id)
  if existing_entry is None:
    chem_comp[ligand_id] = new_entry
  elif existing_entry != new_entry:
    raise ValueError(
        f'Mismatching data for ligand {ligand_id}: '
        f'{new_entry} != {existing_entry}'
    )


def _get_first_model_id(cif: mmcif.Mmcif) -> str:
  """Returns cheaply the first model ID from the mmCIF."""
  return cif.get_array(
      '_atom_site.pdbx_PDB_model_num', dtype=object, gather=slice(1)
  )[0]


def _get_str_model_id(
    cif: mmcif.Mmcif,
    model_id: ModelID | int,
) -> str:
  """Converts a user-specified model_id argument into a string."""
  match model_id:
    case int():
      str_model_id = str(model_id)
    case enum.Enum():
      # We compare the enum's value attribute since regular enum comparison
      # breaks when adhoc importing.
      match model_id.value:
        case ModelID.FIRST.value:
          try:
            str_model_id = _get_first_model_id(cif)
          except IndexError as e:
            raise NoAtomsError(
                'The mmCIF does not have any atoms or'
                ' _atom_site.pdbx_PDB_model_num is missing.'
            ) from e
        case ModelID.ALL.value:
          str_model_id = ''
        case _:
          raise ValueError(
              f'Model ID {model_id} with value {model_id.value} not recognized.'
          )
    case _:
      raise ValueError(
          f'Model ID {model_id} with type {type(model_id)} not recognized.'
      )
  return str_model_id


def _parse_bonds(
    cif: mmcif.Mmcif,
    atom_key: np.ndarray,
    model_id: str,
) -> bonds.Bonds:
  """Returns the bonds table extracted from the mmCIF.

  Args:
    cif: The raw mmCIF to extract the bond information from.
    atom_key: A numpy array defining atom key for each atom in _atom_site. Note
      that the atom key must be computed before resolving alt-locs since this
      function operates on the raw mmCIF!
    model_id: The ID of the model to get bonds for.
  """
  if '_struct_conn.id' not in cif:
    # This is the category key item for the _struct_conn table, therefore
    # we use it to determine whether to parse bond info.
    return bonds.Bonds.make_empty()
  from_atom, dest_atom = mmcif.get_bond_atom_indices(cif, model_id)
  from_atom = np.array(from_atom, dtype=np.int64)
  dest_atom = np.array(dest_atom, dtype=np.int64)
  num_bonds = from_atom.shape[0]
  bond_key = np.arange(num_bonds, dtype=np.int64)
  bond_type = cif.get_array('_struct_conn.conn_type_id', dtype=object)
  if '_struct_conn.pdbx_role' in cif:  # This column isn't always present.
    bond_role = cif.get_array('_struct_conn.pdbx_role', dtype=object)
  else:
    bond_role = np.full((num_bonds,), '?', dtype=object)

  bonds_mask = np.ones((num_bonds,), dtype=bool)
  # Symmetries other than 1_555 imply the atom is not part of the asymmetric
  # unit, and therefore this is a bond that only exists in the expanded
  # bioassembly.
  # We do not currently support parsing these types of bonds.
  if '_struct_conn.ptnr1_symmetry' in cif:
    ptnr1_symmetry = cif.get_array('_struct_conn.ptnr1_symmetry', dtype=object)
    np.logical_and(bonds_mask, ptnr1_symmetry == '1_555', out=bonds_mask)
  if '_struct_conn.ptnr2_symmetry' in cif:
    ptnr2_symmetry = cif.get_array('_struct_conn.ptnr2_symmetry', dtype=object)
    np.logical_and(bonds_mask, ptnr2_symmetry == '1_555', out=bonds_mask)
  # Remove bonds that involve atoms that are not part of the structure,
  # e.g. waters if include_water=False. In a rare case this also removes invalid
  # bonds that are indicated by a key that is set to _atom_site size.
  np.logical_and(bonds_mask, np.isin(from_atom, atom_key), out=bonds_mask)
  np.logical_and(bonds_mask, np.isin(dest_atom, atom_key), out=bonds_mask)
  return bonds.Bonds(
      key=bond_key[bonds_mask],
      type=bond_type[bonds_mask],
      role=bond_role[bonds_mask],
      from_atom_key=from_atom[bonds_mask],
      dest_atom_key=dest_atom[bonds_mask],
  )


@dataclasses.dataclass(frozen=True, slots=True)
class _MmcifHeader:
  name: str
  resolution: float | None
  release_date: datetime.date | None
  structure_method: str | None
  bioassembly_data: bioassemblies.BioassemblyData | None
  chemical_components_data: struc_chem_comps.ChemicalComponentsData | None


def _get_mmcif_header(
    cif: mmcif.Mmcif,
    fix_mse: bool,
    fix_unknown_dna: bool,
) -> _MmcifHeader:
  """Extract header fields from an mmCIF object."""
  entry_id = cif.get('_entry.id')
  name = entry_id[0] if entry_id else cif.get_data_name()
  resolution = mmcif.get_resolution(cif)

  release_date = mmcif.get_release_date(cif)
  if release_date is not None:
    release_date = datetime.date.fromisoformat(release_date)

  experiments = cif.get('_exptl.method')
  structure_method = ','.join(experiments) if experiments else None

  try:
    bioassembly_data = bioassemblies.BioassemblyData.from_mmcif(cif)
  except bioassemblies.MissingBioassemblyDataError:
    bioassembly_data = None

  try:
    chemical_components_data = (
        struc_chem_comps.ChemicalComponentsData.from_mmcif(
            cif, fix_mse=fix_mse, fix_unknown_dna=fix_unknown_dna
        )
    )
  except struc_chem_comps.MissingChemicalComponentsDataError:
    chemical_components_data = None

  return _MmcifHeader(
      name=name,
      resolution=resolution,
      release_date=release_date,
      structure_method=structure_method,
      bioassembly_data=bioassembly_data,
      chemical_components_data=chemical_components_data,
  )


def from_parsed_mmcif(
    mmcif_object: mmcif.Mmcif,
    *,
    name: str | None = None,
    fix_mse_residues: bool = False,
    fix_arginines: bool = False,
    fix_unknown_dna: bool = False,
    include_water: bool = False,
    include_other: bool = False,
    include_bonds: bool = False,
    model_id: int | ModelID = ModelID.FIRST,
) -> structure.Structure:
  """Construct a Structure from a parsed mmCIF object.

  This function is called by `from_mmcif` but can be useful when an mmCIF has
  already been parsed e.g. to extract extra information from the header before
  then converting to Structure for further manipulation.

  Args:
    mmcif_object: A parsed mmcif.Mmcif object.
    name: Optional name for the structure. If not provided, the name will be
      taken from the mmCIF data_ field.
    fix_mse_residues: If True, selenium atom sites (SE) in selenomethionine
      (MSE) residues will be changed to sulphur atom sites (SD). This is because
      methionine (MET) residues are often replaced with MSE to aid X-Ray
      crystallography. If False, the SE MSE atom sites won't be modified.
    fix_arginines: If True, NH1 and NH2 in arginine will be swapped if needed so
      that NH1 is always closer to CD than NH2. If False, no atom sites in
      arginine will be touched. Note that HH11, HH12, HH21, HH22 are fixed too.
    fix_unknown_dna: If True, residues with name N in DNA chains will have their
      res_name replaced with DN. Atoms are not changed.
    include_water: If True, water (HOH) molecules will be parsed. Water
      molecules may be grouped into chains, where number of residues > 1. Water
      molecules are usually grouped into chains but do not necessarily all share
      the same chain ID.
    include_other: If True, all other atoms that are not included by any of the
      above parameters will be included. This covers e.g. "polypeptide(D)" and
      "macrolide" entities, as well as all other non-standard types.
    include_bonds: If True, bond information will be parsed from the mmCIF and
      stored in the Structure.
    model_id: Either the integer model ID to parse, or one of ModelID.FIRST to
      parse the first model, or ModelID.ALL to parse all models.

  Returns:
    A Structure representation of the mmCIF object.
  """
  str_model_id = _get_str_model_id(cif=mmcif_object, model_id=model_id)
  header = _get_mmcif_header(
      mmcif_object, fix_mse=fix_mse_residues, fix_unknown_dna=fix_unknown_dna
  )

  chains, residues, atoms = get_tables(
      cif=mmcif_object,
      fix_mse_residues=fix_mse_residues,
      fix_arginines=fix_arginines,
      fix_unknown_dna=fix_unknown_dna,
      include_water=include_water,
      include_other=include_other,
      model_id=str_model_id,
  )

  if include_bonds and atoms.size > 0:
    # NB: parsing the atom table before the bonds table allows for a more
    # informative error message when dealing with bad multi-model mmCIFs.
    # Also always use a specific model ID, even when parsing all models.
    if str_model_id == '':  # pylint: disable=g-explicit-bool-comparison
      bonds_model_id = _get_first_model_id(mmcif_object)
    else:
      bonds_model_id = str_model_id

    bonds_table = _parse_bonds(
        mmcif_object,
        atom_key=atoms.key,
        model_id=bonds_model_id,
    )
  else:
    bonds_table = bonds.Bonds.make_empty()

  return structure.Structure(
      name=name if name is not None else header.name,
      resolution=header.resolution,
      release_date=header.release_date,
      structure_method=header.structure_method,
      bioassembly_data=header.bioassembly_data,
      chemical_components_data=header.chemical_components_data,
      bonds=bonds_table,
      chains=chains,
      residues=residues,
      atoms=atoms,
  )


def from_mmcif(
    mmcif_string: str | bytes,
    *,
    name: str | None = None,
    fix_mse_residues: bool = False,
    fix_arginines: bool = False,
    fix_unknown_dna: bool = False,
    include_water: bool = False,
    include_other: bool = False,
    include_bonds: bool = False,
    model_id: int | ModelID = ModelID.FIRST,
) -> structure.Structure:
  """Construct a Structure from a mmCIF string.

  Args:
    mmcif_string: The string contents of an mmCIF file.
    name: Optional name for the structure. If not provided, the name will be
      taken from the mmCIF data_ field.
    fix_mse_residues: If True, selenium atom sites (SE) in selenomethionine
      (MSE) residues will be changed to sulphur atom sites (SD). This is because
      methionine (MET) residues are often replaced with MSE to aid X-Ray
      crystallography. If False, the SE MSE atom sites won't be modified.
    fix_arginines: If True, NH1 and NH2 in arginine will be swapped if needed so
      that NH1 is always closer to CD than NH2. If False, no atom sites in
      arginine will be touched. Note that HH11, HH12, HH21, HH22 are fixed too.
    fix_unknown_dna: If True, residues with name N in DNA chains will have their
      res_name replaced with DN. Atoms are not changed.
    include_water: If True, water (HOH) molecules will be parsed. Water
      molecules may be grouped into chains, where number of residues > 1. Water
      molecules are usually grouped into chains but do not necessarily all share
      the same chain ID.
    include_other: If True, all other atoms that are not included by any of the
      above parameters will be included. This covers e.g. "polypeptide(D)" and
      "macrolide" entities, as well as all other non-standard types.
    include_bonds: If True, bond information will be parsed from the mmCIF and
      stored in the Structure.
    model_id: Either the integer model ID to parse, or one of ModelID.FIRST to
      parse the first model, or ModelID.ALL to parse all models.

  Returns:
    A Structure representation of the mmCIF string.
  """
  mmcif_object = mmcif.from_string(mmcif_string)

  return from_parsed_mmcif(
      mmcif_object,
      name=name,
      fix_mse_residues=fix_mse_residues,
      fix_arginines=fix_arginines,
      fix_unknown_dna=fix_unknown_dna,
      include_water=include_water,
      include_other=include_other,
      include_bonds=include_bonds,
      model_id=model_id,
  )


def from_res_arrays(atom_mask: np.ndarray, **kwargs) -> structure.Structure:
  """Returns Structure created from from arrays with a residue dimension.

  All unset fields are filled with defaults (e.g. 1.0 for occupancy) or
  unset/unknown values (e.g. UNK for residue type, or '.' for atom element).

  Args:
    atom_mask: A array with shape (num_res, num_atom). This is used to decide
      which atoms in the atom dimension are present in a given residue. Present
      atoms should have a nonzero value, e.g. 1.0 or True.
    **kwargs: A mapping from field name to values. For all array-valued fields
      these arrays must have a dimension of length num_res. Chain and residue
      fields should have this as their only dimension and atom fields should be
      shaped (num_res, num_atom). Coordinate fields may also have arbitrary
      leading dimensions (they must be the same across all coordinate fields).
      See structure.{CHAIN,RESIDUE,ATOM}_FIELDS for a list of allowed fields.
  """
  num_res, num_atom = atom_mask.shape
  included_indices = np.flatnonzero(atom_mask)

  array_fields = (
      structure.CHAIN_FIELDS.keys()
      | structure.RESIDUE_FIELDS.keys()
      | structure.ATOM_FIELDS.keys()
  )
  initializer_kwargs = {}
  fields = {}
  for k, val in kwargs.items():
    if k not in array_fields:
      # The kwarg key isn't an array field name. Such kwargs are forwarded as-is
      # to the constructor. They are expected to be global fields (e.g. name).
      # Other values will raise an error when the constructor is called.
      if k in structure.TABLE_FIELDS:
        raise ValueError(f'Table fields must not be set. Got {k}.')
      initializer_kwargs[k] = val
      continue
    elif val is None:
      raise ValueError(f'{k} must be non-None.')

    if not isinstance(val, np.ndarray):
      raise TypeError(f'Value for {k} must be a NumPy array. Got {type(val)}.')
    if k in structure.CHAIN_FIELDS or k in structure.RESIDUE_FIELDS:
      if val.shape != (num_res,):
        raise ValueError(
            f'{k} must have shape ({num_res=},). Got {val.shape=}.'
        )
      # Do not reshape the chain/residue arrays, they have the shape we need.
      fields[k] = val
    else:
      assert k in structure.ATOM_FIELDS
      if val.shape[-2:] != (num_res, num_atom):
        raise ValueError(
            f'{k} must have final two dimensions of length '
            f'{(num_res, num_atom)=}. Got {val.shape=}.'
        )
      leading_dims = val.shape[:-2]
      flat_val = val.reshape(leading_dims + (-1,), order='C')
      masked_val = flat_val[..., included_indices]
      fields[k] = masked_val

  # Get chain IDs or assume this is a single-chain structure.
  chain_id = kwargs.get('chain_id', np.array(['A'] * num_res, dtype=object))
  # Find chain starts in res-sized arrays, use these to make chain-sized arrays.
  chain_start = np.concatenate(
      ([0], np.where(chain_id[1:] != chain_id[:-1])[0] + 1)
  )
  if len(set(chain_id)) != len(chain_start):
    raise ValueError(f'Chain IDs must be contiguous, but got {chain_id}')

  chain_lengths = np.diff(chain_start, append=len(chain_id))
  chain_key = np.repeat(np.arange(len(chain_start)), chain_lengths)

  chain_entity_id = fields.get('chain_entity_id')
  if chain_entity_id is not None:
    entity_id = chain_entity_id[chain_start]
  else:
    entity_id = np.array(
        [str(mmcif.str_id_to_int_id(cid)) for cid in chain_id[chain_start]],
        dtype=object,
    )
  chain_str_empty = np.full((num_res,), '.', dtype=object)
  chains_table = structure_tables.Chains(
      key=chain_key[chain_start],
      id=chain_id[chain_start],
      type=fields.get('chain_type', chain_str_empty)[chain_start],
      auth_asym_id=fields.get('chain_auth_asym_id', chain_id)[chain_start],
      entity_id=entity_id,
      entity_desc=fields.get('chain_entity_desc', chain_str_empty)[chain_start],
  )

  # Since all arrays are residue-shaped, we can use them directly.
  res_key = np.arange(num_res, dtype=np.int64)
  res_id = fields.get('res_id', res_key + 1).astype(np.int32)
  residues_table = structure_tables.Residues(
      key=res_key,
      chain_key=chain_key,
      id=res_id,
      name=fields.get('res_name', np.full(num_res, 'UNK', dtype=object)),
      auth_seq_id=fields.get(
          'res_auth_seq_id', np.char.mod('%d', res_id).astype(object)
      ),
      insertion_code=fields.get(
          'res_insertion_code', np.full(num_res, '?', dtype=object)
      ),
  )

  # The atom-sized arrays have already been masked and reshaped.
  num_atoms_per_res = np.sum(atom_mask, axis=1, dtype=np.int32)
  num_atoms_total = np.sum(num_atoms_per_res, dtype=np.int32)
  # Structure is immutable, so use the same array multiple times to save RAM.
  atom_str_empty = np.full(num_atoms_total, '.', dtype=object)
  atom_float32_zeros = np.zeros(num_atoms_total, dtype=np.float32)
  atom_float32_ones = np.ones(num_atoms_total, dtype=np.float32)
  atoms_table = structure_tables.Atoms(
      key=np.arange(num_atoms_total, dtype=np.int64),
      chain_key=np.repeat(chain_key, num_atoms_per_res),
      res_key=np.repeat(res_key, num_atoms_per_res),
      name=fields.get('atom_name', atom_str_empty),
      element=fields.get('atom_element', atom_str_empty),
      x=fields.get('atom_x', atom_float32_zeros),
      y=fields.get('atom_y', atom_float32_zeros),
      z=fields.get('atom_z', atom_float32_zeros),
      b_factor=fields.get('atom_b_factor', atom_float32_zeros),
      occupancy=fields.get('atom_occupancy', atom_float32_ones),
  )

  return structure.Structure(
      chains=chains_table,
      residues=residues_table,
      atoms=atoms_table,
      bonds=structure_tables.Bonds.make_empty(),  # Currently not set.
      **initializer_kwargs,
  )


def expand_sequence(
    sequence: str, chain_type: str, sequence_format: SequenceFormat
) -> Sequence[str]:
  """Returns full residue names based on a sequence string.

  Args:
    sequence: A string representing the sequence.
    chain_type: The chain type of the sequence.
    sequence_format: The format of the sequence argument.
  """
  match sequence_format:
    case SequenceFormat.FASTA:
      if not all(c.isalpha() for c in sequence):
        raise ValueError(f'Sequence "{sequence}" has non-alphabetic characters')
      match chain_type:
        case mmcif_names.PROTEIN_CHAIN:
          res_name_map = residue_names.PROTEIN_COMMON_ONE_TO_THREE
          default_res_name = residue_names.UNK
        case mmcif_names.RNA_CHAIN:
          res_name_map = {r: r for r in residue_names.RNA_TYPES}
          default_res_name = residue_names.UNK_RNA
        case mmcif_names.DNA_CHAIN:
          res_name_map = residue_names.DNA_COMMON_ONE_TO_TWO
          default_res_name = residue_names.UNK_DNA
        case _:
          raise ValueError(f'{chain_type=} not supported for FASTA format.')
      return [
          res_name_map.get(one_letter_res, default_res_name)
          for one_letter_res in sequence
      ]
    case SequenceFormat.CCD_CODES:
      return sequence.strip('()').split(')(')
    case SequenceFormat.LIGAND_SMILES:
      ligand_id, _ = sequence.split(':', maxsplit=1)
      return [ligand_id]


def from_sequences_and_bonds(
    *,
    sequences: Sequence[str],
    chain_types: Sequence[str],
    sequence_formats: Sequence[SequenceFormat],
    bonded_atom_pairs: Sequence[tuple[BondAtomId, BondAtomId]] | None,
    ccd: chemical_components.Ccd,
    chain_ids: Sequence[str] | None = None,
    name: str = 'from_sequences_and_bonds',
    bond_type: str | None = None,
    **constructor_args,
) -> structure.Structure:
  """Returns a minimal structure for the input sequences and bonds.

  The returned structure will have at least one atom per residue. If the
  residue has any bonded atoms, according to `bonded_atom_pairs`, then
  all (and only) those atoms will be present for that residue. If the residue
  is not involved in any bond then an arbitrary atom will be created.

  Args:
    sequences: A sequence of strings, each one representing a single chain.
    chain_types: The types of each chain, e.g. polypeptide(L). The n-th element
      describes the n-th sequence in `sequences`.
    sequence_formats: The format of each sequence. The n-th element describes
      the n-th sequence in `sequences`.
    bonded_atom_pairs: A sequence of bonded atom pairs. Each atom is described
      as a tuple of (chain_index, res_index, atom_name), where the first two
      values are 0-based indices. The chain_index is the index of the chain in
      the `sequences` argument, and the res_index is the index of the residue in
      that sequence. The atom_name is the name of the atom in the residue, e.g.
      CA. If the atom is not found in the standard atoms for that residue
      (according to the CCD) then an error is raised.
    ccd: The chemical components dictionary.
    chain_ids: A sequence of chain IDs, one for each chain in `sequences`. If
      not provided, then the chain IDs will be generated automatically based on
      sequence indices.
    name: A name for the returned structure.
    bond_type: This type will be used for all bonds in the structure, where type
      follows PDB scheme, e.g. unknown (?), hydrog, metalc, covale, disulf.
    **constructor_args: These arguments are passed directly to the
      structure.Structure constructor.
  """
  chain_id = []
  chain_type = []
  chain_res_count = []
  res_id = []
  res_name = []
  res_atom_count = []
  atom_name = []
  atom_element = []
  chem_comp = {}

  num_bonds = len(bonded_atom_pairs or ())
  from_atom_key = np.full((num_bonds,), -1, dtype=np.int64)
  dest_atom_key = np.full((num_bonds,), -1, dtype=np.int64)

  # Create map (chain_i, res_i) -> {atom_name -> (from_idxs dest_idxs)}.
  # This allows quick lookup of whether a residue has any bonded atoms, and
  # which bonds those atoms participate in.
  bond_lookup = _create_bond_lookup(bonded_atom_pairs or ())

  current_atom_key = 0
  for chain_i, (sequence, curr_chain_type, sequence_format) in enumerate(
      zip(sequences, chain_types, sequence_formats, strict=True)
  ):
    if chain_ids is not None:
      current_chain_id = chain_ids[chain_i]
    else:
      current_chain_id = mmcif.int_id_to_str_id(chain_i + 1)
    num_chain_residues = 0
    for res_i, full_res_name in enumerate(
        expand_sequence(sequence, curr_chain_type, sequence_format)
    ):
      current_res_id = res_i + 1
      num_res_atoms = 0

      # Look for bonded atoms in the bond lookup and if any are found, add
      # their atom keys to the bond atom_key columns.
      if bond_indices_by_atom_name := bond_lookup.get((chain_i, res_i)):
        comp_atoms = None
        if sequence_format != SequenceFormat.LIGAND_SMILES:
          comp_atoms = set(ccd.get(full_res_name)['_chem_comp_atom.atom_id'])
        for bond_atom_name, bond_indices in bond_indices_by_atom_name.items():
          if comp_atoms is not None and bond_atom_name not in comp_atoms:
            raise ValueError(
                f'Bonded atom "{bond_atom_name}" was not found in the list of'
                f' atoms of the chemical component {full_res_name}. Valid atom'
                f' names for {full_res_name} are: {sorted(comp_atoms)}.'
                ' This is likely caused by an invalid atom name in the bonded'
                f' atom (chain_id={current_chain_id}, res_id={current_res_id},'
                f' atom_name={bond_atom_name}) specified in `bondedAtomPairs`'
                ' in the input JSON.'
            )
          atom_name.append(bond_atom_name)
          atom_element.append(
              _get_atom_element(
                  ccd=ccd, res_name=full_res_name, atom_name=bond_atom_name
              )
          )
          for from_bond_i in bond_indices.from_indices:
            from_atom_key[from_bond_i] = current_atom_key
          for dest_bond_i in bond_indices.dest_indices:
            dest_atom_key[dest_bond_i] = current_atom_key
          current_atom_key += 1
          num_res_atoms += 1
      else:
        # If this residue has no bonded atoms then we need to add one atom
        # like in from_sequences.
        assert num_res_atoms == 0
        rep_atom_name, rep_atom_element = _get_representative_atom(
            ccd=ccd,
            res_name=full_res_name,
            chain_type=curr_chain_type,
            sequence_format=sequence_format,
        )
        atom_name.append(rep_atom_name)
        atom_element.append(rep_atom_element)
        num_res_atoms += 1
        current_atom_key += 1

      if sequence_format == SequenceFormat.LIGAND_SMILES:
        # Sequence expect to be in the format <ligand_id>:<ligand_smiles>,
        # which always corresponds to a single-residue chain.
        ligand_id, ligand_smiles = sequence.split(':', maxsplit=1)
        if ccd.get(ligand_id) is not None:
          raise ValueError(
              f'Ligand name {ligand_id} is in CCD - it is not supported to give'
              ' ligands created from SMILES the same name as CCD components.'
          )
        # We need to provide additional chemical components metadata for
        # ligands specified via SMILES strings since they might not be in CCD.
        _add_ligand_to_chem_comp(chem_comp, ligand_id, ligand_smiles)

      assert num_res_atoms >= 1
      res_atom_count.append(num_res_atoms)
      num_chain_residues += 1
      res_id.append(current_res_id)
      res_name.append(full_res_name)

    chain_id.append(current_chain_id)
    chain_type.append(curr_chain_type)
    chain_res_count.append(num_chain_residues)

  chem_comp_data = struc_chem_comps.ChemicalComponentsData(chem_comp)
  chem_comp_data = struc_chem_comps.populate_missing_ccd_data(
      ccd=ccd,
      chemical_components_data=chem_comp_data,
      chemical_component_ids=set(res_name),
  )

  if bonded_atom_pairs is not None:
    unknown_bond_col = np.full((num_bonds,), '?', dtype=object)
    if bond_type is None:
      bond_type_col = unknown_bond_col
    else:
      bond_type_col = np.full((num_bonds,), bond_type, dtype=object)
    bonds_table = bonds.Bonds(
        key=np.arange(num_bonds, dtype=np.int64),
        type=bond_type_col,
        role=unknown_bond_col,
        from_atom_key=from_atom_key,
        dest_atom_key=dest_atom_key,
    )
  else:
    bonds_table = structure_tables.Bonds.make_empty()

  chain_key = np.arange(len(sequences), dtype=np.int64)  # 1 chain per sequence.
  chain_id = np.array(chain_id, dtype=object)
  chains_table = structure_tables.Chains(
      key=chain_key,
      id=chain_id,
      type=np.array(chain_type, dtype=object),
      auth_asym_id=chain_id,
      entity_id=np.char.mod('%d', chain_key + 1).astype(object),
      entity_desc=np.array(['.'] * len(chain_key), dtype=object),
  )

  res_key = np.arange(len(res_name), dtype=np.int64)
  res_chain_key = np.repeat(chain_key, chain_res_count)
  residues_table = structure_tables.Residues(
      key=res_key,
      chain_key=res_chain_key,
      id=np.array(res_id, dtype=np.int32),
      name=np.array(res_name, dtype=object),
      auth_seq_id=np.char.mod('%d', res_id).astype(object),
      insertion_code=np.full(len(res_name), '?', dtype=object),
  )

  num_atoms = current_atom_key
  atom_float32_zeros = np.zeros(num_atoms, dtype=np.float32)
  atoms_table = structure_tables.Atoms(
      key=np.arange(num_atoms, dtype=np.int64),
      chain_key=np.repeat(res_chain_key, res_atom_count),
      res_key=np.repeat(res_key, res_atom_count),
      name=np.array(atom_name, dtype=object),
      element=np.array(atom_element, dtype=object),
      x=atom_float32_zeros,
      y=atom_float32_zeros,
      z=atom_float32_zeros,
      b_factor=atom_float32_zeros,
      occupancy=np.ones(num_atoms, np.float32),
  )

  return structure.Structure(
      name=name,
      atoms=atoms_table,
      residues=residues_table,
      chains=chains_table,
      bonds=bonds_table,
      chemical_components_data=chem_comp_data,
      **constructor_args,
  )


class _ChainResBuilder:
  """Class for incrementally building chain and residue tables."""

  def __init__(
      self,
      *,
      chain_key_by_chain_id: Mapping[str, int],
      entity_id_by_chain_id: Mapping[str, str],
      chain_type_by_entity_id: Mapping[str, str],
      entity_desc_by_entity_id: Mapping[str, str],
      fix_mse_residues: bool,
      fix_unknown_dna: bool,
  ):
    # Len: num_chains.
    self.chain_key = []
    self.chain_id = []
    self.chain_type = []
    self.chain_auth_asym_id = []
    self.chain_entity_id = []
    self.chain_entity_desc = []

    # Len: num_residues.
    self.res_key = []
    self.res_chain_key = []
    self.res_id = []
    self.res_name = []
    self.res_auth_seq_id = []
    self.res_insertion_code = []

    self.chain_key_by_chain_id = chain_key_by_chain_id
    self.entity_id_by_chain_id = entity_id_by_chain_id
    self.chain_type_by_entity_id = chain_type_by_entity_id
    self.entity_desc_by_entity_id = entity_desc_by_entity_id
    self.key_for_res: dict[tuple[str, str, str, str], int] = {}

    self._fix_mse_residues = fix_mse_residues
    self._fix_unknown_dna = fix_unknown_dna

  def add_residues(
      self,
      *,
      chain_ids: np.ndarray,
      chain_auth_asym_ids: np.ndarray,
      res_ids: np.ndarray,
      res_names: np.ndarray,
      res_auth_seq_ids: np.ndarray,
      res_ins_codes: np.ndarray,
  ):
    """Adds a residue (and its chain) to the tables."""
    # Create chain table data.
    if chain_ids.size == 0:
      return

    chain_ids_with_prev = np.concatenate(
        (([self.chain_id[-1] if self.chain_id else None], chain_ids))
    )
    chain_change_mask = chain_ids_with_prev[:-1] != chain_ids_with_prev[1:]
    chain_change_ids = chain_ids[chain_change_mask]
    chain_keys = string_array.remap(
        chain_change_ids, self.chain_key_by_chain_id, inplace=False
    )
    self.chain_key.extend(chain_keys)
    self.chain_id.extend(chain_change_ids)
    self.chain_auth_asym_id.extend(chain_auth_asym_ids[chain_change_mask])
    chain_entity_id = string_array.remap(
        chain_change_ids, self.entity_id_by_chain_id, inplace=False
    )
    self.chain_entity_id.extend(chain_entity_id)
    chain_type = string_array.remap(
        chain_entity_id, self.chain_type_by_entity_id, inplace=False
    )
    self.chain_type.extend(chain_type)
    chain_entity_desc = string_array.remap(
        chain_entity_id, self.entity_desc_by_entity_id, inplace=False
    )
    self.chain_entity_desc.extend(chain_entity_desc)

    # Create residue table data.
    num_prev_res = len(self.res_id)
    res_keys = np.arange(num_prev_res, num_prev_res + len(res_ids))
    res_iter = zip(
        chain_ids,
        res_auth_seq_ids,
        res_names,
        res_ins_codes,
        strict=True,
    )
    key_for_res_update = {
        res_unique_id: res_key
        for res_key, res_unique_id in enumerate(res_iter, num_prev_res)
    }
    self.key_for_res.update(key_for_res_update)
    self.res_key.extend(res_keys)
    self.res_chain_key.extend(
        string_array.remap(chain_ids, self.chain_key_by_chain_id, inplace=False)
    )
    self.res_id.extend(res_ids)
    self.res_name.extend(res_names)
    self.res_auth_seq_id.extend(res_auth_seq_ids)
    self.res_insertion_code.extend(res_ins_codes)

  def make_chains_table(self) -> structure_tables.Chains:
    """Returns the Structure chains table."""
    chain_key = np.array(self.chain_key, dtype=np.int64)
    if not np.all(chain_key[:-1] <= chain_key[1:]):
      # If the order is inconsistent with the atoms table, sort so that it is.
      order = np.argsort(self.chain_key, kind='stable')
      return structure_tables.Chains(
          key=chain_key[order],
          id=np.array(self.chain_id, dtype=object)[order],
          type=np.array(self.chain_type, dtype=object)[order],
          auth_asym_id=np.array(self.chain_auth_asym_id, dtype=object)[order],
          entity_id=np.array(self.chain_entity_id, dtype=object)[order],
          entity_desc=np.array(self.chain_entity_desc, dtype=object)[order],
      )
    return structure_tables.Chains(
        key=chain_key,
        id=np.array(self.chain_id, dtype=object),
        type=np.array(self.chain_type, dtype=object),
        auth_asym_id=np.array(self.chain_auth_asym_id, dtype=object),
        entity_id=np.array(self.chain_entity_id, dtype=object),
        entity_desc=np.array(self.chain_entity_desc, dtype=object),
    )

  def make_residues_table(self) -> structure_tables.Residues:
    """Returns the Structure residues table."""
    res_name = np.array(self.res_name, dtype=object)
    res_chain_key = np.array(self.res_chain_key, dtype=np.int64)

    if self._fix_mse_residues:
      string_array.remap(res_name, mapping={'MSE': 'MET'}, inplace=True)

    if self._fix_unknown_dna:
      # Remap residues from N -> DN in DNA chains only.
      dna_chain_mask = (
          np.array(self.chain_type, dtype=object) == mmcif_names.DNA_CHAIN
      )
      dna_chain_key = np.array(self.chain_key, dtype=object)[dna_chain_mask]
      res_name[(res_name == 'N') & np.isin(res_chain_key, dna_chain_key)] = 'DN'

    if not np.all(res_chain_key[:-1] <= res_chain_key[1:]):
      # If the order is inconsistent with the atoms table, sort so that it is.
      order = np.argsort(res_chain_key, kind='stable')
      return structure_tables.Residues(
          key=np.array(self.res_key, dtype=np.int64)[order],
          chain_key=res_chain_key[order],
          id=np.array(self.res_id, dtype=np.int32)[order],
          name=res_name[order],
          auth_seq_id=np.array(self.res_auth_seq_id, dtype=object)[order],
          insertion_code=np.array(self.res_insertion_code, dtype=object)[order],
      )
    return structure_tables.Residues(
        key=np.array(self.res_key, dtype=np.int64),
        chain_key=res_chain_key,
        id=np.array(self.res_id, dtype=np.int32),
        name=res_name,
        auth_seq_id=np.array(self.res_auth_seq_id, dtype=object),
        insertion_code=np.array(self.res_insertion_code, dtype=object),
    )


def _get_string_array_default(cif: mmcif.Mmcif, key: str, default: list[str]):
  try:
    return cif.get_array(key, dtype=object)
  except KeyError:
    return default


def _generate_required_tables_if_missing(
    cif: mmcif.Mmcif,
) -> Mapping[str, Sequence[str]]:
  """Generates all required tables and columns if missing."""
  update = {}

  atom_site_entities = _get_string_array_default(
      cif, '_atom_site.label_entity_id', []
  )

  # OpenMM produces files that don't have any of the tables and also have
  # _atom_site.label_entity_id set to '?' for all atoms. We infer the entities
  # based on the _atom_site.label_asym_id column. We start with cheaper O(1)
  # checks to prevent running the expensive O(n) check on most files.
  if (
      len(atom_site_entities) > 0  # pylint: disable=g-explicit-length-test
      and '_entity.id' not in cif  # Ignore if the _entity table exists.
      and atom_site_entities[0] == '?'  # Cheap check.
      and set(atom_site_entities) == {'?'}  # Expensive check.
  ):
    label_asym_ids = cif.get_array('_atom_site.label_asym_id', dtype=object)
    atom_site_entities = [
        str(mmcif.str_id_to_int_id(cid)) for cid in label_asym_ids
    ]
    # Update _atom_site.label_entity_id to be consistent with the new tables.
    update['_atom_site.label_entity_id'] = atom_site_entities

  # Check table existence by checking the presence of its primary key.
  if '_struct_asym.id' not in cif:
    # Infer the _struct_asym table using the _atom_site table.
    asym_ids = _get_string_array_default(cif, '_atom_site.label_asym_id', [])

    if len(atom_site_entities) == 0 or len(asym_ids) == 0:  # pylint: disable=g-explicit-length-test
      raise ValueError(
          'Could not parse an mmCIF with no _struct_asym table and also no '
          '_atom_site.label_entity_id or _atom_site.label_asym_id columns.'
      )

    # Deduplicate, but keep the order intact - dict.fromkeys maintains order.
    entity_id_chain_id_pairs = list(
        dict.fromkeys(zip(atom_site_entities, asym_ids, strict=True))
    )
    update['_struct_asym.entity_id'] = [e for e, _ in entity_id_chain_id_pairs]
    update['_struct_asym.id'] = [c for _, c in entity_id_chain_id_pairs]

  if '_entity.id' not in cif:
    # Infer the _entity_poly and _entity tables using the _atom_site table.
    residues = _get_string_array_default(cif, '_atom_site.label_comp_id', [])
    group_pdb = _get_string_array_default(cif, '_atom_site.group_PDB', [])
    if '_atom_site.label_entity_id' in cif:
      entities = atom_site_entities
    else:
      # If _atom_site.label_entity_id not set, use the asym_id -> entity_id map.
      asym_to_entity = dict(
          zip(
              cif['_struct_asym.id'], cif['_struct_asym.entity_id'], strict=True
          )
      )
      entities = string_array.remap(
          cif.get_array('_atom_site.label_asym_id', dtype=object),
          mapping=asym_to_entity,
      )

    entity_ids = []
    entity_types = []
    entity_poly_entity_ids = []
    entity_poly_types = []
    entity_poly_table_missing = '_entity_poly.entity_id' not in cif
    for entity_id, group in itertools.groupby(
        zip(entities, residues, group_pdb, strict=True), key=lambda e: e[0]
    ):
      _, entity_residues, entity_group_pdb = zip(*group, strict=True)
      entity_type = _guess_entity_type(
          chain_residues=entity_residues, atom_types=entity_group_pdb
      )
      entity_ids.append(entity_id)
      entity_types.append(entity_type)

      if entity_poly_table_missing and entity_type == mmcif_names.POLYMER_CHAIN:
        polymer_type = mmcif_names.guess_polymer_type(entity_residues)
        entity_poly_entity_ids.append(entity_id)
        entity_poly_types.append(polymer_type)

    update['_entity.id'] = entity_ids
    update['_entity.type'] = entity_types
    if entity_poly_table_missing:
      update['_entity_poly.entity_id'] = entity_poly_entity_ids
      update['_entity_poly.type'] = entity_poly_types

  if '_atom_site.type_symbol' not in cif:
    update['_atom_site.type_symbol'] = mmcif.get_or_infer_type_symbol(cif)

  return update


def _maybe_add_missing_scheme_tables(
    cif: mmcif.Mmcif,
    res_starts: Sequence[int],
    label_asym_ids: np.ndarray,
    label_seq_ids: np.ndarray,
    label_comp_ids: np.ndarray,
    auth_seq_ids: np.ndarray,
    pdb_ins_codes: np.ndarray,
) -> Mapping[str, Sequence[str]]:
  """If missing, infers the scheme tables from the _atom_site table."""
  update = {}

  required_poly_seq_scheme_cols = (
      '_pdbx_poly_seq_scheme.asym_id',
      '_pdbx_poly_seq_scheme.pdb_seq_num',
      '_pdbx_poly_seq_scheme.pdb_ins_code',
      '_pdbx_poly_seq_scheme.seq_id',
      '_pdbx_poly_seq_scheme.mon_id',
      '_pdbx_poly_seq_scheme.pdb_strand_id',
  )
  if not all(col in cif for col in required_poly_seq_scheme_cols):
    # Create a mask for atoms where each polymer residue start.
    entity_id_by_chain_id = dict(
        zip(cif['_struct_asym.id'], cif['_struct_asym.entity_id'], strict=True)
    )
    chain_type_by_entity_id = dict(
        zip(cif['_entity.id'], cif['_entity.type'], strict=True)
    )
    # Remap asym ID -> entity ID.
    label_entity_id = string_array.remap(
        label_asym_ids, mapping=entity_id_by_chain_id, inplace=False
    )
    # Remap entity ID -> chain type.
    chain_type = string_array.remap(
        label_entity_id, mapping=chain_type_by_entity_id, inplace=False
    )
    res_mask = np.zeros_like(label_seq_ids, dtype=bool)
    res_mask[res_starts] = True
    res_mask &= chain_type == mmcif_names.POLYMER_CHAIN

    entity_poly_seq_cols = (
        '_entity_poly_seq.entity_id',
        '_entity_poly_seq.num',
        '_entity_poly_seq.mon_id',
    )
    if all(col in cif for col in entity_poly_seq_cols):
      # Use _entity_poly_seq if available.
      poly_seq_num = cif.get_array('_entity_poly_seq.num', dtype=object)
      poly_seq_mon_id = cif.get_array('_entity_poly_seq.mon_id', dtype=object)
      poly_seq_entity_id = cif.get_array(
          '_entity_poly_seq.entity_id', dtype=object
      )
      # We have to add the entity ID to the residue ID because multiple residues
      # can share the same ID. This also allows using string_array.remap.
      label_seq_id_to_auth_seq_id = dict(
          zip(
              np.char.add(label_entity_id[res_mask], label_seq_ids[res_mask]),
              auth_seq_ids[res_mask],
              strict=True,
          )
      )
      scheme_pdb_seq_num = string_array.remap(
          np.char.add(poly_seq_entity_id, poly_seq_num),
          mapping=label_seq_id_to_auth_seq_id,
          default_value='.',
      )
      label_seq_id_to_ins_code = dict(
          zip(label_seq_ids[res_mask], pdb_ins_codes[res_mask], strict=True)
      )
      scheme_pdb_ins_code = string_array.remap(
          poly_seq_num, mapping=label_seq_id_to_ins_code, default_value='.'
      )

      # The _entity_poly_seq table is entity-based, while _pdbx_poly_seq_scheme
      # is chain-based. A single entity could mean multiple chains (asym_ids),
      # we therefore need to replicate each entity for all of the chains.
      scheme_asym_id = []
      select = []
      indices = np.arange(len(poly_seq_entity_id), dtype=np.int32)
      for asym_id, entity_id in zip(
          cif['_struct_asym.id'], cif['_struct_asym.entity_id'], strict=True
      ):
        entity_mask = poly_seq_entity_id == entity_id
        select.extend(indices[entity_mask])
        scheme_asym_id.extend([asym_id] * sum(entity_mask))

      scheme_pdb_strand_id = string_array.remap(
          np.array(scheme_asym_id, dtype=object),
          mapping=mmcif.get_internal_to_author_chain_id_map(cif),
          inplace=False,
      )

      update['_pdbx_poly_seq_scheme.asym_id'] = scheme_asym_id
      update['_pdbx_poly_seq_scheme.pdb_strand_id'] = scheme_pdb_strand_id
      update['_pdbx_poly_seq_scheme.pdb_seq_num'] = scheme_pdb_seq_num[select]
      update['_pdbx_poly_seq_scheme.pdb_ins_code'] = scheme_pdb_ins_code[select]
      update['_pdbx_poly_seq_scheme.seq_id'] = poly_seq_num[select]
      update['_pdbx_poly_seq_scheme.mon_id'] = poly_seq_mon_id[select]
    else:
      # _entity_poly_seq not available, fallback to _atom_site.
      res_asym_ids = label_asym_ids[res_mask]
      res_strand_ids = string_array.remap(
          array=res_asym_ids,
          mapping=mmcif.get_internal_to_author_chain_id_map(cif),
          inplace=False,
      )
      update['_pdbx_poly_seq_scheme.asym_id'] = res_asym_ids
      update['_pdbx_poly_seq_scheme.pdb_strand_id'] = res_strand_ids
      update['_pdbx_poly_seq_scheme.pdb_seq_num'] = auth_seq_ids[res_mask]
      update['_pdbx_poly_seq_scheme.pdb_ins_code'] = pdb_ins_codes[res_mask]
      update['_pdbx_poly_seq_scheme.seq_id'] = label_seq_ids[res_mask]
      update['_pdbx_poly_seq_scheme.mon_id'] = label_comp_ids[res_mask]

  required_nonpoly_scheme_cols = (
      '_pdbx_nonpoly_scheme.mon_id',
      '_pdbx_nonpoly_scheme.asym_id',
      '_pdbx_nonpoly_scheme.pdb_seq_num',
      '_pdbx_nonpoly_scheme.pdb_ins_code',
  )
  required_branch_scheme_cols = (
      '_pdbx_branch_scheme.mon_id',
      '_pdbx_branch_scheme.asym_id',
      '_pdbx_branch_scheme.pdb_seq_num',
  )

  # Generate _pdbx_nonpoly_scheme only if both tables are missing.
  if not (
      all(col in cif for col in required_nonpoly_scheme_cols)
      or all(col in cif for col in required_branch_scheme_cols)
  ):
    # To be strictly semantically correct, multi-residue ligands should be
    # written in _pdbx_branch_scheme. However, Structure parsing handles
    # correctly multi-residue ligands in _pdbx_nonpoly_scheme and the tables
    # constructed here live only while parsing, hence this is unnecessary.
    entity_id_by_chain_id = dict(
        zip(cif['_struct_asym.id'], cif['_struct_asym.entity_id'], strict=True)
    )
    chain_type_by_entity_id = dict(
        zip(cif['_entity.id'], cif['_entity.type'], strict=True)
    )
    # Remap asym ID -> entity ID.
    chain_type = string_array.remap(
        label_asym_ids, mapping=entity_id_by_chain_id, inplace=False
    )
    # Remap entity ID -> chain type.
    string_array.remap(
        chain_type, mapping=chain_type_by_entity_id, inplace=True
    )
    res_mask = np.zeros_like(label_seq_ids, dtype=bool)
    res_mask[res_starts] = True
    res_mask &= chain_type != mmcif_names.POLYMER_CHAIN

    if not np.any(res_mask):
      return update  # Shortcut: no non-polymer residues.

    ins_codes = string_array.remap(
        pdb_ins_codes[res_mask], mapping={'?': '.'}, inplace=False
    )

    update['_pdbx_nonpoly_scheme.asym_id'] = label_asym_ids[res_mask]
    update['_pdbx_nonpoly_scheme.pdb_seq_num'] = auth_seq_ids[res_mask]
    update['_pdbx_nonpoly_scheme.pdb_ins_code'] = ins_codes
    update['_pdbx_nonpoly_scheme.mon_id'] = label_comp_ids[res_mask]

  return update


def _get_chain_key_by_chain_id(
    resolved_chain_ids: np.ndarray, struct_asym_chain_ids: np.ndarray
) -> Mapping[str, int]:
  """Returns chain key for each chain ID respecting resolved chain ordering."""
  # Check that all chain IDs found in the (potentially filtered) _atom_site
  # table are present in the _struct_asym table.
  unique_resolved_chain_ids = set(resolved_chain_ids)
  if not unique_resolved_chain_ids.issubset(set(struct_asym_chain_ids)):
    unique_resolved_chain_ids = sorted(unique_resolved_chain_ids)
    unique_struct_asym_chain_ids = sorted(set(struct_asym_chain_ids))
    raise ValueError(
        'Bad mmCIF: chain IDs in _atom_site.label_asym_id '
        f'{unique_resolved_chain_ids} is not a subset of chain IDs in '
        f'_struct_asym.id {unique_struct_asym_chain_ids}.'
    )

  resolved_mask = string_array.isin(
      struct_asym_chain_ids, unique_resolved_chain_ids
  )
  # For all resolved chains, use the _atom_site order they appear in. E.g.
  # resolved_chain_ids     = [B A   E D F]
  # struct_asym_chain_ids  = [A B C D E F]
  # consistent_chain_order = [B A C E D F]
  # chain_keys             = [0 1 2 3 4 5]
  consistent_chain_order = struct_asym_chain_ids.copy()
  consistent_chain_order[resolved_mask] = resolved_chain_ids
  return dict(zip(consistent_chain_order, range(len(struct_asym_chain_ids))))


def get_tables(
    cif: mmcif.Mmcif,
    fix_mse_residues: bool,
    fix_arginines: bool,
    fix_unknown_dna: bool,
    include_water: bool,
    include_other: bool,
    model_id: str,
) -> tuple[
    structure_tables.Chains, structure_tables.Residues, structure_tables.Atoms
]:
  """Returns chain, residue, and atom tables from a parsed mmcif.

  Args:
    cif: A parsed mmcif.Mmcif.
    fix_mse_residues: See from_mmcif.
    fix_arginines: See from_mmcif.
    fix_unknown_dna: See from_mmcif.
    include_water: See from_mmcif.
    include_other: See from_mmcif.
    model_id: A string defining which model ID to use. If set, only coordinates,
      b-factors and occupancies for the given model are returned. If empty,
      coordinates, b-factors and occupanciesall for models are returned with a
      leading dimension of num_models. Note that the model_id argument in
      from_mmcif is an integer and has slightly different use (see from_mmcif).
  """
  # Add any missing tables and columns we require for parsing.
  if cif_update := _generate_required_tables_if_missing(cif):
    cif = cif.copy_and_update(cif_update)

  # The wanted_chain_ids include chain IDs that are not necessarily present in
  # the _atom_site table, because we want to be able to read Structures with
  # chains consist of only unresolved residues.
  atom_site_all_models, wanted_chain_ids, layout = mmcif_utils.filter(
      cif,
      include_nucleotides=True,
      include_ligands=True,
      include_water=include_water,
      include_other=include_other,
      model_id=model_id,
  )
  atom_site_first_model = atom_site_all_models[0]

  # Get atom information from the _atom_site table.
  def _first_model_string_array(col: str) -> np.ndarray:
    return cif.get_array(col, dtype=object, gather=atom_site_first_model)

  def _requested_models_float_array(col: str) -> np.ndarray:
    if not model_id:
      # Return data for all models with a leading dimension of num_models.
      return cif.get_array(col, dtype=np.float32, gather=atom_site_all_models)
    else:
      # Return data only for the single requested model.
      return cif.get_array(col, dtype=np.float32, gather=atom_site_first_model)

  # These columns are the same for all models, fetch them just for the 1st one.
  label_comp_ids = _first_model_string_array('_atom_site.label_comp_id')
  label_asym_ids = _first_model_string_array('_atom_site.label_asym_id')
  label_seq_ids = _first_model_string_array('_atom_site.label_seq_id')
  label_atom_ids = _first_model_string_array('_atom_site.label_atom_id')
  if '_atom_site.auth_seq_id' in cif:
    auth_seq_ids = _first_model_string_array('_atom_site.auth_seq_id')
  else:
    auth_seq_ids = label_seq_ids  # auth_seq_id unset, fallback to label_seq_id.
  type_symbols = _first_model_string_array('_atom_site.type_symbol')
  pdbx_pdb_ins_codes = _first_model_string_array('_atom_site.pdbx_PDB_ins_code')

  # These columns are different for all models, fetch them as requested.
  atom_x = _requested_models_float_array('_atom_site.Cartn_x')
  atom_y = _requested_models_float_array('_atom_site.Cartn_y')
  atom_z = _requested_models_float_array('_atom_site.Cartn_z')
  atom_b_factor = _requested_models_float_array('_atom_site.B_iso_or_equiv')
  atom_occupancy = _requested_models_float_array('_atom_site.occupancy')

  # Make sure the scheme (residue) tables exist in case they are not present.
  if cif_update := _maybe_add_missing_scheme_tables(
      cif,
      res_starts=layout.residue_starts(),
      label_asym_ids=label_asym_ids,
      label_seq_ids=label_seq_ids,
      label_comp_ids=label_comp_ids,
      auth_seq_ids=auth_seq_ids,
      pdb_ins_codes=pdbx_pdb_ins_codes,
  ):
    cif = cif.copy_and_update(cif_update)

  # Fix common issues found in mmCIF files, like swapped arginine NH atoms.
  mmcif_utils.fix_residues(
      layout,
      comp_id=label_comp_ids,
      atom_id=label_atom_ids,
      atom_x=atom_x[0] if not model_id else atom_x,
      atom_y=atom_y[0] if not model_id else atom_y,
      atom_z=atom_z[0] if not model_id else atom_z,
      fix_arg=fix_arginines,
  )

  # Get keys for chains in the order they appear in _atom_site while also
  # dealing with empty chains.
  resolved_chain_ids = label_asym_ids[layout.chain_starts()]
  struct_asym_chain_ids = cif.get_array('_struct_asym.id', dtype=object)

  chain_key_by_chain_id = _get_chain_key_by_chain_id(
      resolved_chain_ids=resolved_chain_ids,
      struct_asym_chain_ids=struct_asym_chain_ids,
  )
  entity_id_by_chain_id = dict(
      zip(struct_asym_chain_ids, cif['_struct_asym.entity_id'], strict=True)
  )
  entity_description = cif.get(
      '_entity.pdbx_description', ['?'] * len(cif['_entity.id'])
  )
  entity_desc_by_entity_id = dict(
      zip(cif['_entity.id'], entity_description, strict=True)
  )
  chain_type_by_entity_id = mmcif.get_chain_type_by_entity_id(cif)
  auth_asym_id_by_chain_id = mmcif.get_internal_to_author_chain_id_map(cif)

  chain_res_builder = _ChainResBuilder(
      chain_key_by_chain_id=chain_key_by_chain_id,
      entity_id_by_chain_id=entity_id_by_chain_id,
      chain_type_by_entity_id=chain_type_by_entity_id,
      entity_desc_by_entity_id=entity_desc_by_entity_id,
      fix_mse_residues=fix_mse_residues,
      fix_unknown_dna=fix_unknown_dna,
  )

  # Collect data for polymer chain and residue tables. _pdbx_poly_seq_scheme is
  # guaranteed to be present thanks to _maybe_add_missing_scheme_tables.
  def _get_poly_seq_scheme_col(col: str) -> np.ndarray:
    return cif.get_array(key=f'_pdbx_poly_seq_scheme.{col}', dtype=object)

  poly_seq_asym_ids = _get_poly_seq_scheme_col('asym_id')
  poly_seq_pdb_seq_nums = _get_poly_seq_scheme_col('pdb_seq_num')
  poly_seq_seq_ids = _get_poly_seq_scheme_col('seq_id')
  poly_seq_mon_ids = _get_poly_seq_scheme_col('mon_id')
  poly_seq_pdb_strand_ids = _get_poly_seq_scheme_col('pdb_strand_id')
  poly_seq_pdb_ins_codes = _get_poly_seq_scheme_col('pdb_ins_code')
  string_array.remap(
      poly_seq_pdb_ins_codes, mapping=_INSERTION_CODE_REMAP, inplace=True
  )

  # We resolved alt-locs earlier for the atoms table. In cases of heterogeneous
  # residues (a residue with an alt-loc that is of different residue type), we
  # need to also do the same resolution in the residues table. Compute a mask
  # for the residues that were selected in the atoms table.
  poly_seq_mask = mmcif_utils.selected_polymer_residue_mask(
      layout=layout,
      atom_site_label_asym_ids=label_asym_ids[layout.residue_starts()],
      atom_site_label_seq_ids=label_seq_ids[layout.residue_starts()],
      atom_site_label_comp_ids=label_comp_ids[layout.residue_starts()],
      poly_seq_asym_ids=poly_seq_asym_ids,
      poly_seq_seq_ids=poly_seq_seq_ids,
      poly_seq_mon_ids=poly_seq_mon_ids,
  )

  if not include_other and poly_seq_mask:
    # Mask filtered-out residues so that they are not treated as missing.
    # Instead, we don't want them included in the chains/residues tables at all.
    keep_mask = string_array.isin(poly_seq_asym_ids, wanted_chain_ids)
    poly_seq_mask &= keep_mask

  chain_res_builder.add_residues(
      chain_ids=poly_seq_asym_ids[poly_seq_mask],
      chain_auth_asym_ids=poly_seq_pdb_strand_ids[poly_seq_mask],
      res_ids=poly_seq_seq_ids[poly_seq_mask].astype(np.int32),
      res_names=poly_seq_mon_ids[poly_seq_mask],
      res_auth_seq_ids=poly_seq_pdb_seq_nums[poly_seq_mask],
      res_ins_codes=poly_seq_pdb_ins_codes[poly_seq_mask],
  )

  # Collect data for ligand chain and residue tables. _pdbx_nonpoly_scheme
  # could be empty/unset if there are only branched ligands.
  def _get_nonpoly_scheme_col(col: str) -> np.ndarray:
    key = f'_pdbx_nonpoly_scheme.{col}'
    if f'_pdbx_nonpoly_scheme.{col}' in cif:
      return cif.get_array(key=key, dtype=object)
    else:
      return np.array([], dtype=object)

  nonpoly_asym_ids = _get_nonpoly_scheme_col('asym_id')
  nonpoly_auth_seq_ids = _get_nonpoly_scheme_col('pdb_seq_num')
  nonpoly_pdb_ins_codes = _get_nonpoly_scheme_col('pdb_ins_code')
  nonpoly_mon_ids = _get_nonpoly_scheme_col('mon_id')
  nonpoly_auth_asym_id = string_array.remap(
      nonpoly_asym_ids, mapping=auth_asym_id_by_chain_id, inplace=False
  )

  def _get_branch_scheme_col(col: str) -> np.ndarray:
    key = f'_pdbx_branch_scheme.{col}'
    if f'_pdbx_branch_scheme.{col}' in cif:
      return cif.get_array(key=key, dtype=object)
    else:
      return np.array([], dtype=object)

  branch_asym_ids = _get_branch_scheme_col('asym_id')
  branch_auth_seq_ids = _get_branch_scheme_col('pdb_seq_num')
  branch_pdb_ins_codes = _get_branch_scheme_col('pdb_ins_code')
  branch_mon_ids = _get_branch_scheme_col('mon_id')
  branch_auth_asym_id = string_array.remap(
      branch_asym_ids, mapping=auth_asym_id_by_chain_id, inplace=False
  )

  if branch_asym_ids.size > 0 and branch_pdb_ins_codes.size == 0:
    branch_pdb_ins_codes = np.array(['.'] * branch_asym_ids.size, dtype=object)

  # Compute the heterogeneous residue masks as above, this time for ligands.
  nonpoly_mask, branch_mask = mmcif_utils.selected_ligand_residue_mask(
      layout=layout,
      atom_site_label_asym_ids=label_asym_ids[layout.residue_starts()],
      atom_site_label_seq_ids=label_seq_ids[layout.residue_starts()],
      atom_site_auth_seq_ids=auth_seq_ids[layout.residue_starts()],
      atom_site_label_comp_ids=label_comp_ids[layout.residue_starts()],
      atom_site_pdbx_pdb_ins_codes=pdbx_pdb_ins_codes[layout.residue_starts()],
      nonpoly_asym_ids=nonpoly_asym_ids,
      nonpoly_auth_seq_ids=nonpoly_auth_seq_ids,
      nonpoly_pdb_ins_codes=nonpoly_pdb_ins_codes,
      nonpoly_mon_ids=nonpoly_mon_ids,
      branch_asym_ids=branch_asym_ids,
      branch_auth_seq_ids=branch_auth_seq_ids,
      branch_pdb_ins_codes=branch_pdb_ins_codes,
      branch_mon_ids=branch_mon_ids,
  )

  if not include_water:
    if nonpoly_mask:
      nonpoly_mask &= (nonpoly_mon_ids != 'HOH') & (nonpoly_mon_ids != 'DOD')
    if branch_mask:
      # Fix for bad mmCIFs that have water in the branch scheme table.
      branch_mask &= (branch_mon_ids != 'HOH') & (branch_mon_ids != 'DOD')

  string_array.remap(
      pdbx_pdb_ins_codes, mapping=_INSERTION_CODE_REMAP, inplace=True
  )
  string_array.remap(
      nonpoly_pdb_ins_codes, mapping=_INSERTION_CODE_REMAP, inplace=True
  )
  string_array.remap(
      branch_pdb_ins_codes, mapping=_INSERTION_CODE_REMAP, inplace=True
  )

  def _ligand_residue_ids(chain_ids: np.ndarray) -> np.ndarray:
    """Computes internal residue ID for ligand residues that don't have it."""

    # E.g. chain_ids=[A, A, A, B, C, C, D, D, D] -> [1, 2, 3, 1, 1, 2, 1, 2, 3].
    indices = np.arange(chain_ids.size, dtype=np.int32)
    return (indices + 1) - np.maximum.accumulate(
        indices * (chain_ids != np.roll(chain_ids, 1))
    )

  branch_residue_ids = _ligand_residue_ids(branch_asym_ids[branch_mask])
  nonpoly_residue_ids = _ligand_residue_ids(nonpoly_asym_ids[nonpoly_mask])

  chain_res_builder.add_residues(
      chain_ids=branch_asym_ids[branch_mask],
      chain_auth_asym_ids=branch_auth_asym_id[branch_mask],
      res_ids=branch_residue_ids,
      res_names=branch_mon_ids[branch_mask],
      res_auth_seq_ids=branch_auth_seq_ids[branch_mask],
      res_ins_codes=branch_pdb_ins_codes[branch_mask],
  )

  chain_res_builder.add_residues(
      chain_ids=nonpoly_asym_ids[nonpoly_mask],
      chain_auth_asym_ids=nonpoly_auth_asym_id[nonpoly_mask],
      res_ids=nonpoly_residue_ids,
      res_names=nonpoly_mon_ids[nonpoly_mask],
      res_auth_seq_ids=nonpoly_auth_seq_ids[nonpoly_mask],
      res_ins_codes=nonpoly_pdb_ins_codes[nonpoly_mask],
  )

  chains = chain_res_builder.make_chains_table()
  residues = chain_res_builder.make_residues_table()

  # Construct foreign residue keys for the atoms table.
  res_ends = np.array(layout.residues(), dtype=np.int32)
  res_starts = np.array(layout.residue_starts(), dtype=np.int32)
  res_lengths = res_ends - res_starts

  # Check just for HOH, DOD can be part e.g. of hydroxycysteine.
  if include_water:
    res_chain_types = chains.apply_array_to_column(
        column_name='type', arr=residues.chain_key
    )
    water_mask = res_chain_types != mmcif_names.WATER
    if 'HOH' in set(residues.name[water_mask]):
      raise ValueError('Bad mmCIF file: non-water entity has water molecules.')
  else:
    # Include resolved and unresolved residues.
    if 'HOH' in set(residues.name) | set(label_comp_ids[res_starts]):
      raise ValueError('Bad mmCIF file: non-water entity has water molecules.')

  atom_chain_key = string_array.remap(
      label_asym_ids, mapping=chain_res_builder.chain_key_by_chain_id
  ).astype(int)

  # If any of the residue lookups failed, the mmCIF is corrupted.
  try:
    atom_res_key_per_res = string_array.remap_multiple(
        (
            label_asym_ids[res_starts],
            auth_seq_ids[res_starts],
            label_comp_ids[res_starts],
            pdbx_pdb_ins_codes[res_starts],
        ),
        mapping=chain_res_builder.key_for_res,
    )
  except KeyError as e:
    raise ValueError(
        'Lookup for the following atom from the _atom_site table failed: '
        f'(label_asym_id, auth_seq_id, res_name, ins_code)={e}. This typically '
        'indicates that the _pdbx_poly_seq_scheme, _pdbx_nonpoly_scheme, or '
        '_pdbx_branch_scheme tables do not have data for all residues present '
        'in the _atom_site table. It could also be due to a known issue with '
        'a small number of multi-model mmCIFs.'
    ) from e

  # The residue ID will be shared for all atoms within that residue.
  atom_res_key = np.repeat(atom_res_key_per_res, repeats=res_lengths)

  if fix_mse_residues:
    met_residues_mask = (residues.name == 'MET')[atom_res_key]
    unfixed_mse_selenium_mask = met_residues_mask & (label_atom_ids == 'SE')
    label_atom_ids[unfixed_mse_selenium_mask] = 'SD'
    type_symbols[unfixed_mse_selenium_mask] = 'S'

  atoms = structure_tables.Atoms(
      key=atom_site_first_model,
      chain_key=atom_chain_key,
      res_key=atom_res_key,
      name=label_atom_ids,
      element=type_symbols,
      x=atom_x,
      y=atom_y,
      z=atom_z,
      b_factor=atom_b_factor,
      occupancy=atom_occupancy,
  )

  return chains, residues, atoms


def from_atom_arrays(
    *,
    res_id: np.ndarray,
    name: str = 'unset',
    release_date: datetime.date | None = None,
    resolution: float | None = None,
    structure_method: str | None = None,
    all_residues: Mapping[str, Sequence[tuple[str, int]]] | None = None,
    bioassembly_data: bioassemblies.BioassemblyData | None = None,
    chemical_components_data: (
        struc_chem_comps.ChemicalComponentsData | None
    ) = None,
    bond_table: structure_tables.Bonds | None = None,
    chain_id: np.ndarray | None = None,
    chain_type: np.ndarray | None = None,
    res_name: np.ndarray | None = None,
    atom_key: np.ndarray | None = None,
    atom_name: np.ndarray | None = None,
    atom_element: np.ndarray | None = None,
    atom_x: np.ndarray | None = None,
    atom_y: np.ndarray | None = None,
    atom_z: np.ndarray | None = None,
    atom_b_factor: np.ndarray | None = None,
    atom_occupancy: np.ndarray | None = None,
) -> structure.Structure:
  """Returns a Structure constructed from atom array level data.

  All fields except name and, res_id are optional, all array fields consist of a
  value for each atom in the structure - so residue and chain values should hold
  the same value for each atom in the chain or residue. Fields which are not
  defined are filled with default values.

  Validation is performed by the Structure constructor where possible - but
  author_naming scheme and all_residues must be checked in this function.

  It is not possible to construct structures with chains that do not contain
  any resolved residues using this function. If this is necessary, use the
  structure.Structure constructor directly.

  Args:
    res_id: Integer array of shape [num_atom]. The unique residue identifier for
      each residue. mmCIF field - _atom_site.label_seq_id.
    name: The name of the structure. E.g. a PDB ID.
    release_date: The release date of the structure as a `datetime.date`.
    resolution: The resolution of the structure in Angstroms.
    structure_method: The method used to solve this structure's coordinates.
    all_residues: An optional mapping from each chain ID (i.e. label_asym_id) to
      a sequence of (label_comp_id, label_seq_id) tuples, one per residue. This
      can contain residues that aren't present in the atom arrays. This is
      common in experimental data where some residues are not resolved but are
      known to be present.
    bioassembly_data: An optional instance of bioassembly.BioassemblyData. If
      present then a new Structure representing a specific bioassembly can be
      extracted using `Structure.generate_bioassembly(assembly_id)`.
    chemical_components_data: An optional instance of ChemicalComponentsData.
      Its content will be used for providing metadata about chemical components
      in this Structure instance. If not specified information will be retrieved
      from the standard chemical component dictionary (CCD, for more details see
      https://www.wwpdb.org/data/ccd).
    bond_table: A table representing manually-specified bonds. This corresponds
      to the _struct_conn table in an mmCIF. Atoms are identified by their key,
      as specified by the atom_key column. If this table is provided then the
      atom_key column must also be defined.
    chain_id: String array of shape [num_atom] of unique chain identifiers.
      mmCIF field - _atom_site.label_asym_id.
    chain_type: String array of shape [num_atom]. The molecular type of the
      current chain (e.g. polyribonucleotide). mmCIF field - _entity_poly.type
      OR _entity.type (for non-polymers).
    res_name: String array of shape [num_atom].. The name of each residue,
      typically a 3 letter string for polypeptides or 1-2 letter strings for
      polynucleotides. mmCIF field - _atom_site.label_comp_id.
    atom_key: A unique sorted integer array, used only by the bonds table to
      identify the atoms participating in each bond. If the bonds table is
      specified then this column must be non-None.
    atom_name: String array of shape [num_atom]. The name of each atom (e.g CA,
      O2', etc.). mmCIF field - _atom_site.label_atom_id.
    atom_element: String array of shape [num_atom]. The element type of each
      atom (e.g. C, O, N, etc.). mmCIF field - _atom_site.type_symbol.
    atom_x: Float array of shape [..., num_atom] of atom x coordinates. May have
      arbitrary leading dimensions, provided that these are consistent across
      all coordinate fields.
    atom_y: Float array of shape [..., num_atom] of atom y coordinates. May have
      arbitrary leading dimensions, provided that these are consistent across
      all coordinate fields.
    atom_z: Float array of shape [..., num_atom] of atom z coordinates. May have
      arbitrary leading dimensions, provided that these are consistent across
      all coordinate fields.
    atom_b_factor: Float array of shape [..., num_atom] or [num_atom] of atom
      b-factors or equivalent. If there are no extra leading dimensions then
      these values are assumed to apply to all coordinates for a given atom. If
      there are leading dimensions then these must match those used by the
      coordinate fields.
    atom_occupancy: Float array of shape [..., num_atom] or [num_atom] of atom
      occupancies or equivalent. If there are no extra leading dimensions then
      these values are assumed to apply to all coordinates for a given atom. If
      there are leading dimensions then these must match those used by the
      coordinate fields.
  """

  atoms, residues, chains = structure_tables.tables_from_atom_arrays(
      res_id=res_id,
      all_residues=all_residues,
      chain_id=chain_id,
      chain_type=chain_type,
      res_name=res_name,
      atom_key=atom_key,
      atom_name=atom_name,
      atom_element=atom_element,
      atom_x=atom_x,
      atom_y=atom_y,
      atom_z=atom_z,
      atom_b_factor=atom_b_factor,
      atom_occupancy=atom_occupancy,
  )

  return structure.Structure(
      name=name,
      release_date=release_date,
      resolution=resolution,
      structure_method=structure_method,
      bioassembly_data=bioassembly_data,
      chemical_components_data=chemical_components_data,
      atoms=atoms,
      chains=chains,
      residues=residues,
      bonds=bond_table or structure_tables.Bonds.make_empty(),
  )


def _guess_entity_type(
    chain_residues: Collection[str], atom_types: Collection[str]
) -> str:
  """Guess the entity type (polymer/non-polymer/water) based on residues/atoms.

  We treat both arguments as unordered collections since we care only whether
  all elements satisfy come conditions. The chain_residues can be either
  grouped by residue (length num_res), or it can be raw (length num_atoms).
  Atom type is unique for each atom in a residue, so don't group atom_types.

  Args:
    chain_residues: A sequence of full residue name (1-letter for DNA, 2-letters
      for RNA, 3 for protein). The _atom_site.label_comp_id column in mmCIF.
    atom_types: Atom type: ATOM or HETATM. The _atom_site.group_PDB column in
      mmCIF.

  Returns:
    One of polymer/non-polymer/water based on the following criteria:
    * If all atoms are HETATMs and all residues are water -> water.
    * If all atoms are HETATMs and not all residues are water -> non-polymer.
    * Otherwise -> polymer.
  """
  if not chain_residues or not atom_types:
    raise ValueError(
        f'chain_residues (len {len(chain_residues)}) and atom_types (len '
        f'{len(atom_types)}) must be both non-empty. Got: {chain_residues=} '
        f'and {atom_types=}'
    )

  if all(a == 'HETATM' for a in atom_types):
    if all(c in residue_names.WATER_TYPES for c in chain_residues):
      return mmcif_names.WATER
    return mmcif_names.NON_POLYMER_CHAIN
  return mmcif_names.POLYMER_CHAIN


================================================
FILE: src/alphafold3/structure/sterics.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Functions relating to spatial locations of atoms within a structure."""

from collections.abc import Collection, Sequence

from alphafold3 import structure
from alphafold3.structure import mmcif
import numpy as np
import scipy


def _make_atom_has_clash_mask(
    kd_query_result: np.ndarray,
    struc: structure.Structure,
    ignore_chains: Collection[str],
) -> np.ndarray:
  """Returns a boolean NumPy array representing whether each atom has a clash.

  Args:
    kd_query_result: NumPy array containing N-atoms arrays, each array
      containing indices to atoms that clash with the N'th atom.
    struc: Structure over which clashes were detected.
    ignore_chains: Collection of chains that should not be considered clashing.
      A boolean NumPy array of length N atoms.
  """
  atom_is_clashing = np.zeros((struc.num_atoms,), dtype=bool)
  for atom_index, clashes in enumerate(kd_query_result):
    chain_i = struc.chain_id[atom_index]
    if chain_i in ignore_chains:
      continue
    islig_i = struc.is_ligand_mask[atom_index]
    for clashing_atom_index in clashes:
      chain_c = struc.chain_id[clashing_atom_index]
      if chain_c in ignore_chains:
        continue
      islig_c = struc.is_ligand_mask[clashing_atom_index]
      if (
          clashing_atom_index == atom_index
          or chain_i == chain_c
          or islig_i != islig_c
      ):
        # Ignore clashes within chain or between ligand and polymer.
        continue
      atom_is_clashing[atom_index] = True
  return atom_is_clashing


def find_clashing_chains(
    struc: structure.Structure,
    clash_thresh_angstrom: float = 1.7,
    clash_thresh_fraction: float = 0.3,
) -> Sequence[str]:
  """Finds chains that clash with others.

  Clashes are defined by polymer backbone atoms and all ligand atoms.
  Ligand-polymer clashes are not dropped.

  Will not find clashes if all coordinates are 0. Coordinates are all 0s if
  the structure is generated from sequences only, as done for inference in
  dendro for example.

  Args:
    struc: The structure defining the chains and atom positions.
    clash_thresh_angstrom: Below this distance, atoms are considered clashing.
    clash_thresh_fraction: Chains with more than this fraction of their atoms
      considered clashing will be dropped. This value should be in the range (0,
      1].

  Returns:
    A sequence of chain ids for chains that clash.

  Raises:
    ValueError: If `clash_thresh_fraction` is not in range (0,1].
  """
  if not 0 < clash_thresh_fraction <= 1:
    raise ValueError('clash_thresh_fraction must be in range (0,1]')

  struc_backbone = struc.filter_polymers_to_single_atom_per_res()
  if struc_backbone.num_chains == 0:
    return []

  # If the coordinates are all 0, do not search for clashes.
  if not np.any(struc_backbone.coords):
    return []

  coord_kdtree = scipy.spatial.cKDTree(struc_backbone.coords)

  # For each atom coordinate, find all atoms within the clash thresh radius.
  clashing_per_atom = coord_kdtree.query_ball_point(
      struc_backbone.coords, r=clash_thresh_angstrom
  )
  chain_ids = struc_backbone.chains
  if struc_backbone.atom_occupancy is not None:
    chain_occupancy = np.array([
        np.mean(struc_backbone.atom_occupancy[start:end])
        for start, end in struc_backbone.iter_chain_ranges()
    ])
  else:
    chain_occupancy = None

  # Remove chains until no more significant clashing.
  chains_to_remove = set()
  for _ in range(len(chain_ids)):
    # Calculate maximally clashing.
    atom_has_clash = _make_atom_has_clash_mask(
        clashing_per_atom, struc_backbone, chains_to_remove
    )
    clashes_per_chain = np.array([
        atom_has_clash[start:end].mean()
        for start, end in struc_backbone.iter_chain_ranges()
    ])
    max_clash = np.max(clashes_per_chain)
    if max_clash <= clash_thresh_fraction:
      # None of the remaining chains exceed the clash fraction threshold, so
      # we can exit.
      break

    # Greedily remove worst with the lowest occupancy.
    most_clashes = np.nonzero(clashes_per_chain == max_clash)[0]
    if chain_occupancy is not None:
      occupancy_clashing = chain_occupancy[most_clashes]
      last_lowest_occupancy = (
          len(occupancy_clashing) - np.argmin(occupancy_clashing[::-1]) - 1
      )
      worst_and_last = most_clashes[last_lowest_occupancy]
    else:
      worst_and_last = most_clashes[-1]

    chains_to_remove.add(chain_ids[worst_and_last])

  return sorted(chains_to_remove, key=mmcif.str_id_to_int_id)


================================================
FILE: src/alphafold3/structure/structure.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Structure class for representing and processing molecular structures."""

import collections
from collections.abc import Callable, Collection, Iterable, Iterator, Mapping, Sequence, Set
import dataclasses
import datetime
import enum
import functools
import itertools
import typing
from typing import Any, ClassVar, Final, Literal, NamedTuple, Self, TypeAlias, TypeVar

from alphafold3.constants import atom_types
from alphafold3.constants import chemical_components
from alphafold3.constants import mmcif_names
from alphafold3.constants import residue_names
from alphafold3.cpp import membership
from alphafold3.cpp import string_array
from alphafold3.structure import bioassemblies
from alphafold3.structure import chemical_components as struc_chem_comps
from alphafold3.structure import mmcif
from alphafold3.structure import structure_tables
from alphafold3.structure import table
import numpy as np

# Controls the default number of decimal places for coordinates when writing to
# mmCIF.
_COORDS_DECIMAL_PLACES: Final[int] = 3


@enum.unique
class CascadeDelete(enum.Enum):
  NONE = 0
  FULL = 1
  CHAINS = 2


# See www.python.org/dev/peps/pep-0484/#support-for-singleton-types-in-unions
class _UnsetSentinel(enum.Enum):
  UNSET = object()


_UNSET = _UnsetSentinel.UNSET


class Bond(NamedTuple):
  """Describes a bond between two atoms."""

  from_atom: Mapping[str, str | int | float | np.ndarray]
  dest_atom: Mapping[str, str | int | float | np.ndarray]
  bond_info: Mapping[str, str | int]


class MissingAtomError(Exception):
  """Error raised when an atom is missing during alignment."""


class MissingAuthorResidueIdError(Exception):
  """Raised when author naming data is missing for a residue.

  This can occur in certain edge cases where missing residue data is provided
  without also providing author IDs for those missing residues.
  """


# AllResidues is a mapping from label_asym_id to a sequence of (label_comp_id,
# label_seq_id) pairs. These represent the full sequence including residues
# that might be missing (e.g. unresolved residues in X-ray data).
AllResidues: TypeAlias = Mapping[str, Sequence[tuple[str, int]]]
AuthorNamingScheme: TypeAlias = structure_tables.AuthorNamingScheme


# External residue ID given to missing residues that don't have an ID
# already provided. In mmCIFs this data is found in _pdbx_poly_seq_scheme.
MISSING_AUTH_SEQ_ID: Final[str] = '.'


# Maps from structure fields to column names in the relevant table.
CHAIN_FIELDS: Final[Mapping[str, str]] = {
    'chain_id': 'id',
    'chain_type': 'type',
    'chain_auth_asym_id': 'auth_asym_id',
    'chain_entity_id': 'entity_id',
    'chain_entity_desc': 'entity_desc',
}


RESIDUE_FIELDS: Final[Mapping[str, str]] = {
    'res_id': 'id',
    'res_name': 'name',
    'res_auth_seq_id': 'auth_seq_id',
    'res_insertion_code': 'insertion_code',
}

ATOM_FIELDS: Final[Mapping[str, str]] = {
    'atom_name': 'name',
    'atom_element': 'element',
    'atom_x': 'x',
    'atom_y': 'y',
    'atom_z': 'z',
    'atom_b_factor': 'b_factor',
    'atom_occupancy': 'occupancy',
    'atom_key': 'key',
}

# Fields in structure.
ARRAY_FIELDS = frozenset({
    'atom_b_factor',
    'atom_element',
    'atom_key',
    'atom_name',
    'atom_occupancy',
    'atom_x',
    'atom_y',
    'atom_z',
    'chain_id',
    'chain_type',
    'res_id',
    'res_name',
})

GLOBAL_FIELDS = frozenset({
    'name',
    'release_date',
    'resolution',
    'structure_method',
    'bioassembly_data',
    'chemical_components_data',
})

# Fields which can be updated in copy_and_update.
_UPDATEABLE_FIELDS: Final[Set[str]] = frozenset({
    'all_residues',
    'atom_b_factor',
    'atom_element',
    'atom_key',
    'atom_name',
    'atom_occupancy',
    'atom_x',
    'atom_y',
    'atom_z',
    'bioassembly_data',
    'bonds',
    'chain_id',
    'chain_type',
    'chemical_components_data',
    'name',
    'release_date',
    'res_id',
    'res_name',
    'resolution',
    'structure_method',
})


def fix_non_standard_polymer_residues(
    res_names: np.ndarray, chain_type: str
) -> np.ndarray:
  """Remaps residue names to the closest standard protein/RNA/DNA residue.

  If residue name is already a standard type, it is not altered.
  If a match cannot be found, returns 'UNK' for protein chainresidues and 'N'
    for RNA/DNA chain residue.

  Args:
     res_names: A numpy array of string residue names (CCD monomer codes). E.g.
       'ARG' (protein), 'DT' (DNA), 'N' (RNA).
     chain_type: The type of the chain, must be PROTEIN_CHAIN, RNA_CHAIN or
       DNA_CHAIN.

  Returns:
    An array remapped so that its elements are all from
    PROTEIN_TYPES_WITH_UNKNOWN | RNA_TYPES | DNA_TYPES | {'N'}.

  Raises:
    ValueError: If chain_type not in PEPTIDE_CHAIN_TYPES or
      {OTHER_CHAIN, RNA_CHAIN, DNA_CHAIN, DNA_RNA_HYBRID_CHAIN}.
  """
  # Map to one letter code, then back to common res_names.
  one_letter_codes = string_array.remap(
      res_names, mapping=residue_names.CCD_NAME_TO_ONE_LETTER, default_value='X'
  )

  if (
      chain_type in mmcif_names.PEPTIDE_CHAIN_TYPES
      or chain_type == mmcif_names.OTHER_CHAIN
  ):
    mapping = residue_names.PROTEIN_COMMON_ONE_TO_THREE
    default_value = 'UNK'
  elif chain_type == mmcif_names.RNA_CHAIN:
    # RNA has single-letter CCD monomer codes.
    mapping = {r: r for r in residue_names.RNA_TYPES}
    default_value = 'N'
  elif chain_type == mmcif_names.DNA_CHAIN:
    mapping = residue_names.DNA_COMMON_ONE_TO_TWO
    default_value = 'N'
  elif chain_type == mmcif_names.DNA_RNA_HYBRID_CHAIN:
    mapping = {r: r for r in residue_names.NUCLEIC_TYPES_WITH_UNKNOWN}
    default_value = 'N'
  else:
    raise ValueError(f'Expected a protein/DNA/RNA chain but got {chain_type}')

  return string_array.remap(
      one_letter_codes, mapping=mapping, default_value=default_value
  )


def _get_change_indices(arr: np.ndarray) -> np.ndarray:
  if arr.size == 0:
    return np.array([], dtype=np.int32)
  else:
    changing_idxs = np.where(arr[1:] != arr[:-1])[0] + 1
    return np.concatenate(([0], changing_idxs), axis=0)


def _unpack_filter_predicates(
    predicate_by_field_name: Mapping[str, table.FilterPredicate],
) -> tuple[
    Mapping[str, table.FilterPredicate],
    Mapping[str, table.FilterPredicate],
    Mapping[str, table.FilterPredicate],
]:
  """Unpacks filter kwargs into predicates for each table."""
  chain_predicates = {}
  res_predicates = {}
  atom_predicates = {}
  for k, pred in predicate_by_field_name.items():
    if col := CHAIN_FIELDS.get(k):
      chain_predicates[col] = pred
    elif col := RESIDUE_FIELDS.get(k):
      res_predicates[col] = pred
    elif col := ATOM_FIELDS.get(k):
      atom_predicates[col] = pred
    else:
      raise ValueError(k)
  return chain_predicates, res_predicates, atom_predicates


_T = TypeVar('_T')


SCALAR_FIELDS: Final[Collection[str]] = frozenset({
    'name',
    'release_date',
    'resolution',
    'structure_method',
    'bioassembly_data',
    'chemical_components_data',
})


TABLE_FIELDS: Final[Collection[str]] = frozenset(
    {'chains', 'residues', 'atoms', 'bonds'}
)


V2_FIELDS: Final[Collection[str]] = frozenset({*SCALAR_FIELDS, *TABLE_FIELDS})


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class StructureTables:
  chains: structure_tables.Chains
  residues: structure_tables.Residues
  atoms: structure_tables.Atoms
  bonds: structure_tables.Bonds


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class ResArrays:
  """Atom-level data arrays with a residue dimension.

  Attributes:
    atom_positions: float32 of shape [num_res, num_atom_type, 3] coordinates.
    atom_mask: float32 of shape [num_res, num_atom_type] indicating if an atom
      is present.
    atom_b_factor: float32 of shape [num_res, num_atom_type] b_factors.
    atom_occupancy: float32 of shape [num_res, num_atom_type] occupancies.
  """

  atom_positions: np.ndarray
  atom_mask: np.ndarray
  atom_b_factor: np.ndarray
  atom_occupancy: np.ndarray


class Structure(table.Database):
  """Structure class for representing and processing molecular structures."""

  tables: ClassVar[Collection[str]] = TABLE_FIELDS

  foreign_keys: ClassVar[Mapping[str, Collection[tuple[str, str]]]] = {
      'residues': (('chain_key', 'chains'),),
      'atoms': (('chain_key', 'chains'), ('res_key', 'residues')),
      'bonds': (('from_atom_key', 'atoms'), ('dest_atom_key', 'atoms')),
  }

  def __init__(
      self,
      *,
      name: str = 'unset',
      release_date: datetime.date | None = None,
      resolution: float | None = None,
      structure_method: str | None = None,
      bioassembly_data: bioassemblies.BioassemblyData | None = None,
      chemical_components_data: (
          struc_chem_comps.ChemicalComponentsData | None
      ) = None,
      chains: structure_tables.Chains,
      residues: structure_tables.Residues,
      atoms: structure_tables.Atoms,
      bonds: structure_tables.Bonds,
      skip_validation: bool = False,
  ):
    # Version number is written to mmCIF and should be incremented when changes
    # are made to mmCIF writing or internals that affect this.
    # b/345221494 Rename this variable when structure_v1 compatibility code
    # is removed.
    self._VERSION = '2.0.0'  # pylint: disable=invalid-name
    self._name = name or 'unset'
    self._release_date = release_date
    self._resolution = resolution
    self._structure_method = structure_method
    self._bioassembly_data = bioassembly_data
    self._chemical_components_data = chemical_components_data

    self._chains = chains
    self._residues = residues
    self._atoms = atoms
    self._bonds = bonds

    if not skip_validation:
      self._validate_table_foreign_keys()
      self._validate_consistent_table_ordering()

  def _validate_table_foreign_keys(self):
    """Validates that all foreign keys are present in the referred tables."""
    residue_keys = set(self._residues.key)
    chain_keys = set(self._chains.key)
    if np.any(membership.isin(self._atoms.res_key, residue_keys, invert=True)):
      raise ValueError(
          'Atom residue keys not in the residues table: '
          f'{set(self._atoms.res_key).difference(self._residues.key)}'
      )
    if np.any(membership.isin(self._atoms.chain_key, chain_keys, invert=True)):
      raise ValueError(
          'Atom chain keys not in the chains table: '
          f'{set(self._atoms.chain_key).difference(self._chains.key)}'
      )
    if np.any(
        membership.isin(self._residues.chain_key, chain_keys, invert=True)
    ):
      raise ValueError(
          'Residue chain keys not in the chains table: '
          f'{set(self._residues.chain_key).difference(self._chains.key)}'
      )

  def _validate_consistent_table_ordering(self):
    """Validates that all tables have the same ordering."""
    atom_chain_keys = self._atoms.chain_key[self.chain_boundaries]
    atom_res_keys = self._atoms.res_key[self.res_boundaries]

    if not np.array_equal(self.present_chains.key, atom_chain_keys):
      raise ValueError(
          f'Atom table chain order\n{atom_chain_keys}\ndoes not match the '
          f'chain table order\n{self._chains.key}'
      )
    if not np.array_equal(self.present_residues.key, atom_res_keys):
      raise ValueError(
          f'Atom table residue order\n{atom_res_keys}\ndoes not match the '
          f'present residue table order\n{self.present_residues.key}'
      )

  def get_table(self, table_name: str) -> table.Table:
    match table_name:
      case 'chains':
        return self.chains_table
      case 'residues':
        return self.residues_table
      case 'atoms':
        return self.atoms_table
      case 'bonds':
        return self.bonds_table
      case _:
        raise ValueError(table_name)

  @property
  def chains_table(self) -> structure_tables.Chains:
    """Chains table."""
    return self._chains

  @property
  def residues_table(self) -> structure_tables.Residues:
    """Residues table."""
    return self._residues

  @property
  def atoms_table(self) -> structure_tables.Atoms:
    """Atoms table."""
    return self._atoms

  @property
  def bonds_table(self) -> structure_tables.Bonds:
    """Bonds table."""
    return self._bonds

  @property
  def name(self) -> str:
    return self._name

  @property
  def release_date(self) -> datetime.date | None:
    return self._release_date

  @property
  def resolution(self) -> float | None:
    return self._resolution

  @property
  def structure_method(self) -> str | None:
    return self._structure_method

  @property
  def bioassembly_data(self) -> bioassemblies.BioassemblyData | None:
    return self._bioassembly_data

  @property
  def chemical_components_data(
      self,
  ) -> struc_chem_comps.ChemicalComponentsData | None:
    return self._chemical_components_data

  @property
  def bonds(self) -> structure_tables.Bonds:
    return self._bonds

  @functools.cached_property
  def author_naming_scheme(self) -> AuthorNamingScheme:
    auth_asym_id = {}
    entity_id = {}
    entity_desc = {}
    auth_seq_id = collections.defaultdict(dict)
    insertion_code = collections.defaultdict(dict)

    for chain_i in range(self._chains.size):
      chain_id = self._chains.id[chain_i]
      auth_asym_id[chain_id] = self._chains.auth_asym_id[chain_i]
      chain_entity_id = self._chains.entity_id[chain_i]
      entity_id[chain_id] = chain_entity_id
      entity_desc[chain_entity_id] = self._chains.entity_desc[chain_i]

    chain_index_by_key = self._chains.index_by_key
    for res_i in range(self._residues.size):
      chain_key = self._residues.chain_key[res_i]
      chain_id = self._chains.id[chain_index_by_key[chain_key]]
      res_id = self._residues.id[res_i]
      res_auth_seq_id = self._residues.auth_seq_id[res_i]
      if res_auth_seq_id == MISSING_AUTH_SEQ_ID:
        continue
      auth_seq_id[chain_id][res_id] = res_auth_seq_id
      ins_code = self._residues.insertion_code[res_i]
      # Compatibility with Structure v1 which used None to represent . or ?.
      insertion_code[chain_id][res_id] = (
          ins_code if ins_code not in {'.', '?'} else None
      )

    return AuthorNamingScheme(
        auth_asym_id=auth_asym_id,
        entity_id=entity_id,
        entity_desc=entity_desc,
        auth_seq_id=dict(auth_seq_id),
        insertion_code=dict(insertion_code),
    )

  @functools.cached_property
  def all_residues(self) -> AllResidues:
    chain_id_by_key = dict(zip(self._chains.key, self._chains.id))
    residue_chain_boundaries = _get_change_indices(self._residues.chain_key)
    boundaries = self._iter_residue_ranges(
        residue_chain_boundaries, count_unresolved=True
    )
    return {
        chain_id_by_key[self._residues.chain_key[start]]: list(
            zip(self._residues.name[start:end], self._residues.id[start:end])
        )
        for start, end in boundaries
    }

  @functools.cached_property
  def label_asym_id_to_entity_id(self) -> Mapping[str, str]:
    return dict(zip(self._chains.id, self._chains.entity_id))

  @functools.cached_property
  def chain_entity_id(self) -> np.ndarray:
    """Returns the entity ID for each atom in the structure."""
    return self.chains_table.apply_array_to_column(
        'entity_id', self._atoms.chain_key
    )

  @functools.cached_property
  def chain_entity_desc(self) -> np.ndarray:
    """Returns the entity description for each atom in the structure."""
    return self.chains_table.apply_array_to_column(
        'entity_desc', self._atoms.chain_key
    )

  @functools.cached_property
  def chain_auth_asym_id(self) -> np.ndarray:
    """Returns the chain auth asym ID for each atom in the structure."""
    return self.chains_table.apply_array_to_column(
        'auth_asym_id', self._atoms.chain_key
    )

  @functools.cached_property
  def chain_id(self) -> np.ndarray:
    chain_index_by_key = self._chains.index_by_key
    return self._chains.id[chain_index_by_key[self._atoms.chain_key]]

  @functools.cached_property
  def chain_type(self) -> np.ndarray:
    chain_index_by_key = self._chains.index_by_key
    return self._chains.type[chain_index_by_key[self._atoms.chain_key]]

  @functools.cached_property
  def res_id(self) -> np.ndarray:
    return self._residues['id', self._atoms.res_key]

  @functools.cached_property
  def res_name(self) -> np.ndarray:
    return self._residues['name', self._atoms.res_key]

  @functools.cached_property
  def res_auth_seq_id(self) -> np.ndarray:
    """Returns the residue auth seq ID for each atom in the structure."""
    return self.residues_table.apply_array_to_column(
        'auth_seq_id', self._atoms.res_key
    )

  @functools.cached_property
  def res_insertion_code(self) -> np.ndarray:
    """Returns the residue insertion code for each atom in the structure."""
    return self.residues_table.apply_array_to_column(
        'insertion_code', self._atoms.res_key
    )

  @property
  def atom_key(self) -> np.ndarray:
    return self._atoms.key

  @property
  def atom_name(self) -> np.ndarray:
    return self._atoms.name

  @property
  def atom_element(self) -> np.ndarray:
    return self._atoms.element

  @property
  def atom_x(self) -> np.ndarray:
    return self._atoms.x

  @property
  def atom_y(self) -> np.ndarray:
    return self._atoms.y

  @property
  def atom_z(self) -> np.ndarray:
    return self._atoms.z

  @property
  def atom_b_factor(self) -> np.ndarray:
    return self._atoms.b_factor

  @property
  def atom_occupancy(self) -> np.ndarray:
    return self._atoms.occupancy

  @functools.cached_property
  def chain_boundaries(self) -> np.ndarray:
    """The indices in the atom fields where each present chain begins."""
    return _get_change_indices(self._atoms.chain_key)

  @functools.cached_property
  def res_boundaries(self) -> np.ndarray:
    """The indices in the atom fields where each present residue begins."""
    return _get_change_indices(self._atoms.res_key)

  @functools.cached_property
  def present_chains(self) -> structure_tables.Chains:
    """Returns table of chains which have at least 1 resolved atom."""
    is_present_mask = np.isin(self._chains.key, self._atoms.chain_key)
    return typing.cast(structure_tables.Chains, self._chains[is_present_mask])

  @functools.cached_property
  def present_residues(self) -> structure_tables.Residues:
    """Returns table of residues which have at least 1 resolved atom."""
    is_present_mask = np.isin(self._residues.key, self._atoms.res_key)
    return typing.cast(
        structure_tables.Residues, self._residues[is_present_mask]
    )

  @functools.cached_property
  def unresolved_residues(self) -> structure_tables.Residues:
    """Returns table of residues which have at least 1 resolved atom."""
    is_unresolved_mask = np.isin(
        self._residues.key, self._atoms.res_key, invert=True
    )
    return typing.cast(
        structure_tables.Residues, self._residues[is_unresolved_mask]
    )

  def __getitem__(self, field: str) -> Any:
    """Gets raw field data using field name as a string."""
    if field in TABLE_FIELDS:
      return self.get_table(field)
    else:
      return getattr(self, field)

  def __getstate__(self) -> dict[str, Any]:
    """Pickle calls this on dump.

    Returns:
      Members with cached properties removed.
    """
    cached_props = {
        k
        for k, v in self.__class__.__dict__.items()
        if isinstance(v, functools.cached_property)
    }
    return {k: v for k, v in self.__dict__.items() if k not in cached_props}

  def __repr__(self):
    return (
        f'Structure({self._name}: {self.num_chains} chains, '
        f'{self.num_residues(count_unresolved=False)} residues, '
        f'{self.num_atoms} atoms)'
    )

  @property
  def num_atoms(self) -> int:
    return self._atoms.size

  def num_residues(self, *, count_unresolved: bool) -> int:
    """Returns the number of residues in this Structure.

    Args:
      count_unresolved: Whether to include unresolved (empty) residues.

    Returns:
      Number of residues in the Structure.
    """
    if count_unresolved:
      return self._residues.size
    else:
      return self.present_residues.size

  @property
  def num_chains(self) -> int:
    return self._chains.size

  @property
  def num_models(self) -> int:
    """The number of models of this Structure."""
    return self._atoms.num_models

  def _atom_mask(self, entities: Set[str]) -> np.ndarray:
    """Boolean label indicating if each atom is from entities or not."""
    mask = np.zeros(self.num_atoms, dtype=bool)
    chain_index_by_key = self._chains.index_by_key
    for start, end in self.iter_chain_ranges():
      chain_index = chain_index_by_key[self._atoms.chain_key[start]]
      chain_type = self._chains.type[chain_index]
      mask[start:end] = chain_type in entities
    return mask

  @functools.cached_property
  def is_protein_mask(self) -> np.ndarray:
    """Boolean label indicating if each atom is from protein or not."""
    return self._atom_mask(entities={mmcif_names.PROTEIN_CHAIN})

  @functools.cached_property
  def is_dna_mask(self) -> np.ndarray:
    """Boolean label indicating if each atom is from DNA or not."""
    return self._atom_mask(entities={mmcif_names.DNA_CHAIN})

  @functools.cached_property
  def is_rna_mask(self) -> np.ndarray:
    """Boolean label indicating if each atom is from RNA or not."""
    return self._atom_mask(entities={mmcif_names.RNA_CHAIN})

  @functools.cached_property
  def is_nucleic_mask(self) -> np.ndarray:
    """Boolean label indicating if each atom is a nucleic acid or not."""
    return self._atom_mask(entities=mmcif_names.NUCLEIC_ACID_CHAIN_TYPES)

  @functools.cached_property
  def is_ligand_mask(self) -> np.ndarray:
    """Boolean label indicating if each atom is a ligand or not."""
    return self._atom_mask(entities=mmcif_names.LIGAND_CHAIN_TYPES)

  @functools.cached_property
  def is_water_mask(self) -> np.ndarray:
    """Boolean label indicating if each atom is from water or not."""
    return self._atom_mask(entities={mmcif_names.WATER})

  def iter_atoms(self) -> Iterator[Mapping[str, Any]]:
    """Iterates over the atoms in the structure."""
    if self._atoms.size == 0:
      return

    current_chain = self._chains.get_row_by_key(
        column_name_map=CHAIN_FIELDS, key=self._atoms.chain_key[0]
    )
    current_chain_key = self._atoms.chain_key[0]
    current_res = self._residues.get_row_by_key(
        column_name_map=RESIDUE_FIELDS, key=self._atoms.res_key[0]
    )
    current_res_key = self._atoms.res_key[0]
    for atom_i in range(self._atoms.size):
      atom_chain_key = self._atoms.chain_key[atom_i]
      atom_res_key = self._atoms.res_key[atom_i]

      if atom_chain_key != current_chain_key:
        chain_index = self._chains.index_by_key[atom_chain_key]
        current_chain = {
            'chain_id': self._chains.id[chain_index],
            'chain_type': self._chains.type[chain_index],
            'chain_auth_asym_id': self._chains.auth_asym_id[chain_index],
            'chain_entity_id': self._chains.entity_id[chain_index],
            'chain_entity_desc': self._chains.entity_desc[chain_index],
        }
        current_chain_key = atom_chain_key
      if atom_res_key != current_res_key:
        res_index = self._residues.index_by_key[atom_res_key]
        current_res = {
            'res_id': self._residues.id[res_index],
            'res_name': self._residues.name[res_index],
            'res_auth_seq_id': self._residues.auth_seq_id[res_index],
            'res_insertion_code': self._residues.insertion_code[res_index],
        }
        current_res_key = atom_res_key

      yield {
          'atom_name': self._atoms.name[atom_i],
          'atom_element': self._atoms.element[atom_i],
          'atom_x': self._atoms.x[..., atom_i],
          'atom_y': self._atoms.y[..., atom_i],
          'atom_z': self._atoms.z[..., atom_i],
          'atom_b_factor': self._atoms.b_factor[..., atom_i],
          'atom_occupancy': self._atoms.occupancy[..., atom_i],
          'atom_key': self._atoms.key[atom_i],
          **current_res,
          **current_chain,
      }

  def iter_residues(
      self,
      include_unresolved: bool = False,
  ) -> Iterator[Mapping[str, Any]]:
    """Iterates over the residues in the structure."""
    res_table = self._residues if include_unresolved else self.present_residues
    if res_table.size == 0:
      return

    current_chain = self._chains.get_row_by_key(
        column_name_map=CHAIN_FIELDS, key=res_table.chain_key[0]
    )
    current_chain_key = res_table.chain_key[0]
    for res_i in range(res_table.size):
      res_chain_key = res_table.chain_key[res_i]

      if res_chain_key != current_chain_key:
        current_chain = self._chains.get_row_by_key(
            column_name_map=CHAIN_FIELDS, key=res_table.chain_key[res_i]
        )
        current_chain_key = res_chain_key

      row = {
          'res_id': res_table.id[res_i],
          'res_name': res_table.name[res_i],
          'res_auth_seq_id': res_table.auth_seq_id[res_i],
          'res_insertion_code': res_table.insertion_code[res_i],
      }
      yield row | current_chain

  def _iter_atom_ranges(
      self, boundaries: Sequence[int]
  ) -> Iterator[tuple[int, int]]:
    """Iterator for (start, end) pairs from an array of start indices."""
    yield from itertools.pairwise(boundaries)
    # Use explicit length test as boundaries can be a NumPy array.
    if len(boundaries) > 0:  # pylint: disable=g-explicit-length-test
      yield boundaries[-1], self.num_atoms

  def _iter_residue_ranges(
      self,
      boundaries: Sequence[int],
      *,
      count_unresolved: bool,
  ) -> Iterator[tuple[int, int]]:
    """Iterator for (start, end) pairs from an array of start indices."""
    yield from itertools.pairwise(boundaries)
    # Use explicit length test as boundaries can be a NumPy array.
    if len(boundaries) > 0:  # pylint: disable=g-explicit-length-test
      yield boundaries[-1], self.num_residues(count_unresolved=count_unresolved)

  def iter_chain_ranges(self) -> Iterator[tuple[int, int]]:
    """Iterates pairs of (chain_start, chain_end) indices.

    Yields:
      Pairs of (start, end) indices for each chain, where end is not inclusive.
      i.e. struc.chain_id[start:end] would be a constant array with length
      equal to the number of atoms in the chain.
    """
    yield from self._iter_atom_ranges(self.chain_boundaries)

  def iter_residue_ranges(self) -> Iterator[tuple[int, int]]:
    """Iterates pairs of (residue_start, residue_end) indices.

    Yields:
      Pairs of (start, end) indices for each residue, where end is not
      inclusive. i.e. struc.res_id[start:end] would be a constant array with
      length equal to the number of atoms in the residue.
    """
    yield from self._iter_atom_ranges(self.res_boundaries)

  def iter_chains(self) -> Iterator[Mapping[str, Any]]:
    """Iterates over the chains in the structure."""
    for chain_i in range(self.present_chains.size):
      yield {
          'chain_id': self.present_chains.id[chain_i],
          'chain_type': self.present_chains.type[chain_i],
          'chain_auth_asym_id': self.present_chains.auth_asym_id[chain_i],
          'chain_entity_id': self.present_chains.entity_id[chain_i],
          'chain_entity_desc': self.present_chains.entity_desc[chain_i],
      }

  def iter_bonds(self) -> Iterator[Bond]:
    """Iterates over the atoms and bond information.

    Example usage:

    ```
    for from_atom, dest_atom, bond_info in struc.iter_bonds():
      print(
          f'From atom: name={from_atom["atom_name"]}, '
          f'chain={from_atom["chain_id"]}, ...'
      )
      # Same for dest_atom
      print(f'Bond info: type={bond_info["type"]}, role={bond_info["role"]}')
    ```

    Yields:
      A `Bond` NamedTuple for each bond in the bonds table.
      These have fields `from_atom`, `dest_atom`, `bond_info` where each
      is a dictionary. The first two have the same keys as the atom dicts
      returned by self.iter_atoms() -- i.e. one key per non-None field.
      The final dict has the same keys as self.bonds.iterrows() -- i.e. one
      key per column in the bonds table.
    """
    from_atom_iter = self._atoms.iterrows(
        row_keys=self._bonds.from_atom_key,
        column_name_map=ATOM_FIELDS,
        chain_key=self._chains.with_column_names(CHAIN_FIELDS),
        res_key=self._residues.with_column_names(RESIDUE_FIELDS),
    )
    dest_atom_iter = self._atoms.iterrows(
        row_keys=self._bonds.dest_atom_key,
        column_name_map=ATOM_FIELDS,
        chain_key=self._chains.with_column_names(CHAIN_FIELDS),
        res_key=self._residues.with_column_names(RESIDUE_FIELDS),
    )

    for from_atom, dest_atom, bond_info in zip(
        from_atom_iter, dest_atom_iter, self._bonds.iterrows(), strict=True
    ):
      yield Bond(from_atom=from_atom, dest_atom=dest_atom, bond_info=bond_info)

  def _apply_atom_index_array(
      self,
      index_arr: np.ndarray,
      chain_boundaries: np.ndarray | None = None,
      res_boundaries: np.ndarray | None = None,
      skip_validation: bool = False,
  ) -> Self:
    """Applies index_arr to the atom table using NumPy-style array indexing.

    Args:
      index_arr: A 1D NumPy array that will be used to index into the atoms
        table. This can either be a boolean array to act as a mask, or an
        integer array to perform a gather operation.
      chain_boundaries: Unused in structure v2.
      res_boundaries: Unused in structure v2.
      skip_validation: Whether to skip the validation step that checks internal
        consistency after applying atom index array. Do not set to True unless
        you are certain the transform is safe, e.g. when the order of atoms is
        guaranteed to not change.

    Returns:
      A new Structure with an updated atoms table.
    """
    del chain_boundaries, res_boundaries

    if index_arr.ndim != 1:
      raise ValueError(
          f'index_arr must be a 1D NumPy array, but has shape {index_arr.shape}'
      )

    if index_arr.dtype == bool and np.all(index_arr):
      return self  # Shortcut: The operation is a no-op, so just return itself.

    atoms = structure_tables.Atoms(
        **{col: self._atoms[col][..., index_arr] for col in self._atoms.columns}
    )
    updated_tables = self._cascade_delete(atoms=atoms)
    return self.copy_and_update(
        atoms=updated_tables.atoms,
        bonds=updated_tables.bonds,
        skip_validation=skip_validation,
    )

  @property
  def group_by_residue(self) -> Self:
    """Returns a Structure with one atom per residue.

    e.g. restypes = struc.group_by_residue['res_id']

    Returns:
      A new Structure with one atom per residue such that per-atom arrays
      such as res_name (i.e. Structure v1 fields) have one element per residue.
    """
    # This use of _apply_atom_index_array is safe because the chain/residue/atom
    # ordering won't change (essentially applying a residue start mask).
    return self._apply_atom_index_array(
        self.res_boundaries, skip_validation=True
    )

  @property
  def group_by_chain(self) -> Self:
    """Returns a Structure where all fields are per-chain.

    e.g. chains = struc.group_by_chain['chain_id']

    Returns:
      A new Structure with one atom per chain such that per-atom arrays
      such as res_name (i.e. Structure v1 fields) have one element per chain.
    """
    # This use of _apply_atom_index_array is safe because the chain/residue/atom
    # ordering won't change (essentially applying a chain start mask).
    return self._apply_atom_index_array(
        self.chain_boundaries, skip_validation=True
    )

  @property
  def with_sorted_chains(self) -> Self:
    """Returns a new structure with the chains are in reverse spreadsheet style.

    This is the usual order to write chains in an mmCIF:
    (A < B < ... < AA < BA < CA < ... < AB < BB < CB ...)

    NB: this method will fail if chains do not conform to this mmCIF naming
    convention.

    Only to be used for third party metrics that rely on the chain order.
    Elsewhere chains should be identified by name and code should be agnostic to
    the order.
    """
    sorted_chains = sorted(self.chains, key=mmcif.str_id_to_int_id)
    return self.reorder_chains(new_order=sorted_chains)

  @functools.cached_property
  def atom_ids(self) -> Sequence[tuple[str, str, None, str]]:
    """Gets a list of atom ID tuples from Structure class arrays.

    Returns:
      A list of tuples of (chain_id, res_id, insertion_code, atom_name) where
      insertion code is always None. There is one element per atom, and the
      list is ordered according to the order of atoms in the input arrays.
    """
    # Convert to Numpy strings, then to Python strings (dtype=object).
    res_ids = self.residues_table.id.astype(str).astype(object)
    res_ids = res_ids[
        self.residues_table.index_by_key[self.atoms_table.res_key]
    ]
    ins_codes = [None] * self.num_atoms
    return list(
        zip(self.chain_id, res_ids, ins_codes, self.atom_name, strict=True)
    )

  def order_and_drop_atoms_to_match(
      self,
      other: 'Structure',
      *,
      allow_missing_atoms: bool = False,
  ) -> Self:
    """Returns a new structure with atoms ordered & dropped to match another's.

    This performs two operations simultaneously:
      * Ordering the atoms in this structure to match the order in the other.
      * Dropping atoms in this structure that do not appear in the other.

    Example:
    Consider a prediction and ground truth with the following atoms, described
    using tuples of `(chain_id, res_id, atom_name)`:
      * `prediction:   [(A, 1, CA), (A, 1, N), (A, 2, CA), (B, 1, CA)]`
      * `ground_truth: [(B, 1, CA), (A, 1, N), (A, 1, CA)]`
    Note how the ground truth is missing the `(A, 2, CA)` atom and also
    has the atoms in a different order. This method returns a modified
    prediction that has reordered atoms and without any atoms not in the ground
    truth so that its atom list looks the same as the ground truth atom list.
    This means `prediction.coords` and `ground_truth.coords` now have the
    same shape and can be compared across the atom dimension.

    Note that matching residues with no atoms and matching chains with no
    residues will also be kept. E.g. in the example above, if prediction and
    ground truth both had an unresolved residue (A, 3), the output structure
    will also have an unresolved residue (A, 3).

    Args:
      other: Another `Structure`. This provides the reference ordering that is
        used to sort this structure's atom arrays.
      allow_missing_atoms: Whether to skip atoms present in `other` but not this
        structure and return a structure containing a subset of the atoms in the
        other structure.

    Returns:
      A new `Structure`, based on this structure, which, if
      `allow_missing_atoms` is False, contains exactly the same atoms as in
      the `other` structure and which matches the `other` structure in terms
      of the order of the atoms in the field arrays. Otherwise, if missing
      atoms are allowed then the resulting structure contains a subset of
      those atoms in the other structure.

    Raises:
      MissingAtomError: If there are atoms present in the other structure that
        cannot be found in this structure.
    """
    atom_index_map = {atom_id: i for i, atom_id in enumerate(self.atom_ids)}
    try:
      if allow_missing_atoms:
        # Only include atoms that were found in the other structure.
        atom_indices = [
            atom_index
            for atom_id in other.atom_ids
            if (atom_index := atom_index_map.get(atom_id)) is not None
        ]
      else:
        atom_indices = [
            atom_index_map[atom_id]  # Hard fail on missing.
            for atom_id in other.atom_ids
        ]
    except KeyError as e:
      if len(e.args[0]) == 4:
        chain_id, res_id, ins_code, atom_name = e.args[0]
        raise MissingAtomError(
            f'No atom in this structure (name: {self._name}) matches atom in '
            f'other structure (name: {other.name}) with internal (label) chain '
            f'ID {chain_id}, residue ID {res_id}, insertion code {ins_code} '
            f'and atom name {atom_name}.'
        ) from e
      else:
        raise

    def _iter_residues(struc: Self) -> Iterable[tuple[str, str]]:
      yield from zip(
          struc.chains_table['id', struc.residues_table.chain_key],
          struc.residues_table.id,
          strict=True,
      )

    chain_index_map = {
        chain_id: i for i, chain_id in enumerate(self._chains.id)
    }
    chain_indices = [
        chain_index
        for chain_id in other.chains_table.id
        if (chain_index := chain_index_map.get(chain_id)) is not None
    ]
    residue_index_map = {
        res_id: i for i, res_id in enumerate(_iter_residues(self))
    }
    res_indices = [
        residue_index
        for res_id in _iter_residues(other)
        if (residue_index := residue_index_map.get(res_id)) is not None
    ]

    # Reorder all tables.
    chains = self._chains.apply_index(np.array(chain_indices, dtype=np.int64))
    residues = self._residues.apply_index(np.array(res_indices, dtype=np.int64))
    atoms = self._atoms.apply_index(np.array(atom_indices, dtype=np.int64))

    # Get chain keys in the order they appear in the atoms table.
    new_chain_boundaries = _get_change_indices(atoms.chain_key)
    new_chain_key_order = atoms.chain_key[new_chain_boundaries]
    if len(new_chain_key_order) != len(set(new_chain_key_order)):
      raise ValueError(
          f'Chain keys not contiguous after reordering: {new_chain_key_order}'
      )

    # Get residue keys in the order they appear in the atoms table.
    new_res_boundaries = _get_change_indices(atoms.res_key)
    new_res_key_order = atoms.res_key[new_res_boundaries]
    if len(new_res_key_order) != len(set(new_res_key_order)):
      raise ValueError(
          f'Residue keys not contiguous after reordering: {new_res_key_order}'
      )

    # If any atoms were deleted, propagate that into the bonds table.
    updated_tables = self._cascade_delete(
        chains=chains,
        residues=residues,
        atoms=atoms,
    )
    return self.copy_and_update(
        chains=chains,
        residues=residues,
        atoms=updated_tables.atoms,
        bonds=updated_tables.bonds,
    )

  def copy_and_update(
      self,
      *,
      name: str | Literal[_UNSET] = _UNSET,
      release_date: datetime.date | None | Literal[_UNSET] = _UNSET,
      resolution: float | None | Literal[_UNSET] = _UNSET,
      structure_method: str | None | Literal[_UNSET] = _UNSET,
      bioassembly_data: (
          bioassemblies.BioassemblyData | None | Literal[_UNSET]
      ) = _UNSET,
      chemical_components_data: (
          struc_chem_comps.ChemicalComponentsData | None | Literal[_UNSET]
      ) = _UNSET,
      chains: structure_tables.Chains | None | Literal[_UNSET] = _UNSET,
      residues: structure_tables.Residues | None | Literal[_UNSET] = _UNSET,
      atoms: structure_tables.Atoms | None | Literal[_UNSET] = _UNSET,
      bonds: structure_tables.Bonds | None | Literal[_UNSET] = _UNSET,
      skip_validation: bool = False,
  ) -> Self:
    """Performs a shallow copy but with specified fields updated."""

    def all_unset(fields):
      return all(field == _UNSET for field in fields)

    if all_unset((chains, residues, atoms, bonds)):
      if all_unset((
          name,
          release_date,
          resolution,
          structure_method,
          bioassembly_data,
          chemical_components_data,
      )):
        raise ValueError(
            'Unnecessary call to copy_and_update with no changes. As Structure'
            ' and its component tables are immutable, there is no need to copy'
            ' it. Any subsequent operation that modifies structure will return'
            ' a new object.'
        )
      else:
        raise ValueError(
            'When only changing global fields, prefer to use the specialised '
            'copy_and_update_globals.'
        )

    def select(field, default):
      return field if field != _UNSET else default

    return Structure(
        name=select(name, self.name),
        release_date=select(release_date, self.release_date),
        resolution=select(resolution, self.resolution),
        structure_method=select(structure_method, self.structure_method),
        bioassembly_data=select(bioassembly_data, self.bioassembly_data),
        chemical_components_data=select(
            chemical_components_data, self.chemical_components_data
        ),
        chains=select(chains, self._chains),
        residues=select(residues, self._residues),
        atoms=select(atoms, self._atoms),
        bonds=select(bonds, self._bonds),
        skip_validation=skip_validation,
    )

  def _copy_and_update(
      self, skip_validation: bool = False, **changes: Any
  ) -> Self:
    """Performs a shallow copy but with specified fields updated."""
    if not changes:
      raise ValueError(
          'Unnecessary call to copy_and_update with no changes. As Structure '
          'and its component tables are immutable, there is no need to copy '
          'it. Any subsequent operation that modifies structure will return a '
          'new object.'
      )

    if 'author_naming_scheme' in changes:
      raise ValueError(
          'Updating using author_naming_scheme is not supported. Update '
          'auth_asym_id, entity_id, entity_desc fields directly in the chains '
          'table and auth_seq_id, insertion_code in the residues table.'
      )

    if all(k in GLOBAL_FIELDS for k in changes):
      raise ValueError(
          'When only changing global fields, prefer to use the specialised '
          'copy_and_update_globals.'
      )

    if all(k in V2_FIELDS for k in changes):
      constructor_kwargs = {field: self[field] for field in V2_FIELDS}
      constructor_kwargs.update(changes)
    elif any(k in ('atoms', 'residues', 'chains') for k in changes):
      raise ValueError(
          'Cannot specify atoms/chains/residues table changes with non-v2'
          f' constructor params: {changes.keys()}'
      )
    elif all(k in ATOM_FIELDS for k in changes):
      if 'atom_key' not in changes:
        raise ValueError(
            'When only changing atom fields, prefer to use the specialised '
            'copy_and_update_atoms.'
        )
      # Only atom fields are being updated, do that directly on the atoms table.
      updated_atoms = self._atoms.copy_and_update(
          **{ATOM_FIELDS[k]: v for k, v in changes.items()}
      )
      constructor_kwargs = {
          field: self[field] for field in V2_FIELDS if field != 'atoms'
      }
      constructor_kwargs['atoms'] = updated_atoms
    else:
      constructor_kwargs = {field: self[field] for field in _UPDATEABLE_FIELDS}
      constructor_kwargs.update(changes)
    return Structure(skip_validation=skip_validation, **constructor_kwargs)

  def copy_and_update_coords(self, coords: np.ndarray) -> Self:
    """Performs a shallow copy but with coordinates updated."""
    if coords.shape[-2:] != (self.num_atoms, 3):
      raise ValueError(
          f'{coords.shape=} does not have last dimensions ({self.num_atoms}, 3)'
      )
    updated_atoms = self._atoms.copy_and_update_coords(coords)
    return self.copy_and_update(atoms=updated_atoms, skip_validation=True)

  def copy_and_update_from_res_arrays(
      self,
      *,
      include_unresolved: bool = False,
      **changes: np.ndarray,
  ) -> Self:
    """Like copy_and_update but changes are arrays of length num_residues.

    These changes are first scattered into arrays of length num_atoms such
    that each value is repeated across the residue at that index, then they
    are used as the new values of these fields.

    E.g.
    * This structure's res_id: 1, 1, 1, 2, 3, 3 (3 res, 6 atoms)
    * new atom_b_factor: 7, 8, 9
    * Returned structure's atom_b_factor: 7, 7, 7, 8, 9, 9

    Args:
      include_unresolved: Whether the provided list of new values per residue
        include values for all residues, or only those that are resolved.
      **changes: kwargs corresponding to atom array fields, e.g. atom_x or
        atom_b_factor, but with length num_residues rather than num_atoms. Note
        that changing atom_key this way is is not supported.

    Returns:
      A new `Structure` with all fields other than those specified as kwargs
      shallow copied from this structure. The values of the kwargs are
      scattered across the atom arrays and then used to overwrite these
      fields for the returned structure.
    """
    if not all(c in set(ATOM_FIELDS) - {'atom_key'} for c in changes):
      raise ValueError(
          'Changes must only be to atom fields, got changes to'
          f' {changes.keys()}'
      )

    num_residues = self.num_residues(count_unresolved=include_unresolved)

    for field_name, new_values in changes.items():
      if len(new_values) != num_residues:
        raise ValueError(
            f'{field_name} array of length {len(new_values)} does not match '
            f'{num_residues=} - is include_unresolved set correctly?'
        )

    # We cannot assume that atom_table.res_keys are the relevant indices of the
    # residue table.

    # Therefore we need to construct a map from res_key to the new values and
    # update the atoms_table with that.
    if include_unresolved:
      target_keys = self.residues_table.key
    else:
      target_keys = self.present_residues.key

    new_atom_columns = {}
    for field_name, new_values in changes.items():
      value_by_key = dict(zip(target_keys, new_values, strict=True))
      # pylint: disable=cell-var-from-loop
      new_atom_columns[field_name] = np.vectorize(lambda x: value_by_key[x])(
          self.atoms_table.res_key
      )
      # pylint: enable=cell-var-from-loop

    return self.copy_and_update_atoms(**new_atom_columns)

  def copy_and_update_globals(
      self,
      *,
      name: str | Literal[_UNSET] = _UNSET,
      release_date: datetime.date | Literal[_UNSET] | None = _UNSET,
      resolution: float | Literal[_UNSET] | None = _UNSET,
      structure_method: str | Literal[_UNSET] | None = _UNSET,
      bioassembly_data: (
          bioassemblies.BioassemblyData | Literal[_UNSET] | None
      ) = _UNSET,
      chemical_components_data: (
          struc_chem_comps.ChemicalComponentsData | Literal[_UNSET] | None
      ) = _UNSET,
  ) -> Self:
    """Returns a shallow copy with the global columns updated."""

    def select(field, default):
      return field if field != _UNSET else default

    name = select(name, self.name)
    release_date = select(release_date, self.release_date)
    resolution = select(resolution, self.resolution)
    structure_method = select(structure_method, self.structure_method)
    bioassembly_data = select(bioassembly_data, self.bioassembly_data)
    chem_data = select(chemical_components_data, self.chemical_components_data)

    return Structure(
        name=name,
        release_date=release_date,
        resolution=resolution,
        structure_method=structure_method,
        bioassembly_data=bioassembly_data,
        chemical_components_data=chem_data,
        atoms=self._atoms,
        residues=self._residues,
        chains=self._chains,
        bonds=self._bonds,
    )

  def copy_and_update_atoms(
      self,
      *,
      atom_name: np.ndarray | None = None,
      atom_element: np.ndarray | None = None,
      atom_x: np.ndarray | None = None,
      atom_y: np.ndarray | None = None,
      atom_z: np.ndarray | None = None,
      atom_b_factor: np.ndarray | None = None,
      atom_occupancy: np.ndarray | None = None,
  ) -> Self:
    """Returns a shallow copy with the atoms table updated."""
    new_atoms = structure_tables.Atoms(
        key=self._atoms.key,
        res_key=self._atoms.res_key,
        chain_key=self._atoms.chain_key,
        name=atom_name if atom_name is not None else self.atom_name,
        element=atom_element if atom_element is not None else self.atom_element,
        x=atom_x if atom_x is not None else self.atom_x,
        y=atom_y if atom_y is not None else self.atom_y,
        z=atom_z if atom_z is not None else self.atom_z,
        b_factor=(
            atom_b_factor if atom_b_factor is not None else self.atom_b_factor
        ),
        occupancy=(
            atom_occupancy
            if atom_occupancy is not None
            else self.atom_occupancy
        ),
    )
    return self.copy_and_update(atoms=new_atoms)

  def copy_and_update_residues(
      self,
      *,
      res_id: np.ndarray | None = None,
      res_name: np.ndarray | None = None,
      res_auth_seq_id: np.ndarray | None = None,
      res_insertion_code: np.ndarray | None = None,
  ) -> Self:
    """Returns a shallow copy with the residues table updated."""
    new_residues = structure_tables.Residues(
        key=self._residues.key,
        chain_key=self._residues.chain_key,
        id=res_id if res_id is not None else self._residues.id,
        name=res_name if res_name is not None else self._residues.name,
        auth_seq_id=res_auth_seq_id
        if res_auth_seq_id is not None
        else self._residues.auth_seq_id,
        insertion_code=res_insertion_code
        if res_insertion_code is not None
        else self._residues.insertion_code,
    )
    return self.copy_and_update(residues=new_residues)

  def _cascade_delete(
      self,
      *,
      chains: structure_tables.Chains | None = None,
      residues: structure_tables.Residues | None = None,
      atoms: structure_tables.Atoms | None = None,
      bonds: structure_tables.Bonds | None = None,
  ) -> StructureTables:
    """Performs a cascade delete operation on the structure's tables.

    Cascade delete ensures all the tables are consistent after any table fields
    are being updated by cascading any deletions down the hierarchy of tables:
    chains > residues > atoms > bonds.

    E.g.: if a row from residues table is removed then all the atoms in that
    residue will also be removed from the atoms table. In turn this cascades
    also to the bond table, by removing any bond row which involves any of those
    removed atoms. However the chains table will not be modified, even if
    that was the only residue in its chain, because the chains table is above
    the residues table in the hierarchy.

    Args:
      chains: An optional new chains table.
      residues: An optional new residues table.
      atoms: An optional new atoms table.
      bonds: An optional new bonds table.

    Returns:
      A StructureTables object with the updated tables.
    """
    if chains_unchanged := chains is None:
      chains = self._chains
    if residues_unchanged := residues is None:
      residues = self._residues
    if atoms_unchanged := atoms is None:
      atoms = self._atoms
    if bonds is None:
      bonds = self._bonds

    if not chains_unchanged:
      residues_mask = membership.isin(residues.chain_key, set(chains.key))  # pylint:disable=attribute-error
      if not np.all(residues_mask):  # Only apply if this is not a no-op.
        residues = residues[residues_mask]
        residues_unchanged = False
    if not residues_unchanged:
      atoms_mask = membership.isin(atoms.res_key, set(residues.key))  # pylint:disable=attribute-error
      if not np.all(atoms_mask):  # Only apply if this is not a no-op.
        atoms = atoms[atoms_mask]
        atoms_unchanged = False
    if not atoms_unchanged:
      bonds = bonds.restrict_to_atoms(atoms.key)
    return StructureTables(
        chains=chains, residues=residues, atoms=atoms, bonds=bonds
    )

  def filter(
      self,
      mask: np.ndarray | None = None,
      *,
      apply_per_element: bool = False,
      invert: bool = False,
      cascade_delete: CascadeDelete = CascadeDelete.CHAINS,
      **predicate_by_field_name: table.FilterPredicate,
  ) -> Self:
    """Filters the structure by field values and returns a new structure.

    Predicates are specified as keyword arguments, with names following the
    pattern: <table_name>_<col_name>, where table_name := (chain|res|atom).
    For instance the auth_seq_id column in the residues table can be filtered
    by passing `res_auth_seq_id=pred_value`. The full list of valid options
    are defined in the `col_by_field_name` fields on the different Table
    dataclasses.

    Predicate values can be either:
      1. A constant value, e.g. 'CA'. In this case then only rows that match
        this value for the given field are retained.
      2. A (non-string) iterable e.g. ('A', 'B'). In this
        case then rows are retained if they match any of the provided values for
        the given field.
      3. A boolean function e.g. lambda b_fac: b_fac < 100.0.
        In this case then only rows that evaluate to True are retained. By
        default this function's parameter is expected to be an array, unless
        apply_per_element=True.

    Example usage:
      # Filter to backbone atoms in residues up to 100 in chain B.
      filtered_struc = struc.filter(
          chain_id='B',
          atom_name=('N', 'CA', 'C'),
          res_id=lambda res_id: res_id < 100)

    Example usage where predicate must be applied per-element:
      # Filter to residues with IDs in either [1, 100) or [300, 400).
      ranges = ((1, 100), (300, 400))
      filtered_struc = struc.filter(
          res_id=lambda i: np.any([start <= i < end for start, end in ranges]),
          apply_per_element=True)

    Example usage of providing a raw mask:
      filtered_struc = struc.filter(struc.atom_b_factor < 10.0)

    Args:
      mask: An optional boolean NumPy array with length equal to num_atoms. If
        provided then this will be combined with the other predicates so that an
        atom is included if it is masked-in *and* matches all the predicates.
      apply_per_element: Whether apply predicates to each element individually,
        or to pass the whole column array to the predicate.
      invert: Whether to remove, rather than retain, the entities which match
        the specified predicates.
      cascade_delete: Whether to remove residues and chains which are left
        unresolved in a cascade. filter operates on the atoms table, removing
        atoms which match the predicate. If all atoms in a residue are removed,
        the residue is "unresolved". The value of this argument then determines
        whether such residues and their parent chains should be deleted. FULL
        implies that all unresolved residues should be deleted, and any chains
        which are left with no resolved residues should be deleted. CHAINS is
        the default behaviour - only chains with no resolved residues, and their
        child residues are deleted. Unresolved residues in partially resolved
        chains remain. NONE implies that no unresolved residues or chains should
        be deleted.
      **predicate_by_field_name: A mapping from field name to a predicate.
        Filtered columns must be 1D arrays. If multiple fields are provided as
        keyword arguments then each predicate is applied and the results are
        combined using a boolean AND operation, so an atom is only retained if
        it passes all predicates.

    Returns:
      A new structure representing a filtered version of the current structure.

    Raises:
      ValueError: If mask is provided and is not a bool array with shape
        (num_atoms,).
    """
    chain_predicates, res_predicates, atom_predicates = (
        _unpack_filter_predicates(predicate_by_field_name)
    )
    # Get boolean masks for each table. These are None if none of the filter
    # parameters affect the table in question.
    chain_mask = self._chains.make_filter_mask(
        **chain_predicates, apply_per_element=apply_per_element
    )
    res_mask = self._residues.make_filter_mask(
        **res_predicates, apply_per_element=apply_per_element
    )
    atom_mask = self._atoms.make_filter_mask(
        mask, **atom_predicates, apply_per_element=apply_per_element
    )
    if atom_mask is None:
      atom_mask = np.ones((self._atoms.size,), dtype=bool)

    # Remove atoms that belong to filtered out chains.
    if chain_mask is not None:
      atom_chain_mask = membership.isin(
          self._atoms.chain_key, set(self._chains.key[chain_mask])
      )
      np.logical_and(atom_mask, atom_chain_mask, out=atom_mask)

    # Remove atoms that belong to filtered out residues.
    if res_mask is not None:
      atom_res_mask = membership.isin(
          self._atoms.res_key, set(self._residues.key[res_mask])
      )
      np.logical_and(atom_mask, atom_res_mask, out=atom_mask)

    final_atom_mask = ~atom_mask if invert else atom_mask

    if cascade_delete == CascadeDelete.NONE and np.all(final_atom_mask):
      return self  # Shortcut: The filter is a no-op, so just return itself.

    filtered_atoms = typing.cast(
        structure_tables.Atoms, self._atoms[final_atom_mask]
    )

    match cascade_delete:
      case CascadeDelete.FULL:
        nonempty_residues_mask = np.isin(
            self._residues.key, filtered_atoms.res_key
        )
        filtered_residues = self._residues[nonempty_residues_mask]
        nonempty_chain_mask = np.isin(
            self._chains.key, filtered_atoms.chain_key
        )
        filtered_chains = self._chains[nonempty_chain_mask]
        updated_tables = self._cascade_delete(
            chains=filtered_chains,
            residues=filtered_residues,
            atoms=filtered_atoms,
        )
      case CascadeDelete.CHAINS:
        # To match v1 behavior we remove chains that have no atoms remaining,
        # and we remove residues in those chains.
        # NB we do not remove empty residues.
        nonempty_chain_mask = membership.isin(
            self._chains.key, set(filtered_atoms.chain_key)
        )
        filtered_chains = self._chains[nonempty_chain_mask]
        updated_tables = self._cascade_delete(
            chains=filtered_chains, atoms=filtered_atoms
        )
      case CascadeDelete.NONE:
        updated_tables = self._cascade_delete(atoms=filtered_atoms)
      case _:
        raise ValueError(f'Unknown cascade_delete behaviour: {cascade_delete}')
    return self.copy_and_update(
        chains=updated_tables.chains,
        residues=updated_tables.residues,
        atoms=updated_tables.atoms,
        bonds=updated_tables.bonds,
        skip_validation=True,
    )

  def filter_out(self, *args, **kwargs) -> Self:
    """Returns a new structure with the specified elements removed."""
    return self.filter(*args, invert=True, **kwargs)

  def filter_to_entity_type(
      self,
      *,
      protein: bool = False,
      rna: bool = False,
      dna: bool = False,
      dna_rna_hybrid: bool = False,
      ligand: bool = False,
      water: bool = False,
  ) -> Self:
    """Filters the structure to only include the selected entity types.

    This convenience method abstracts away the specifics of mmCIF entity
    type names which, especially for ligands, are non-trivial.

    Args:
      protein: Whether to include protein (polypeptide(L)) chains.
      rna: Whether to include RNA chains.
      dna: Whether to include DNA chains.
      dna_rna_hybrid: Whether to include DNA RNA hybrid chains.
      ligand: Whether to include ligand (i.e. not polymer) chains.
      water: Whether to include water chains.

    Returns:
      The filtered structure.
    """
    include_types = []
    if protein:
      include_types.append(mmcif_names.PROTEIN_CHAIN)
    if rna:
      include_types.append(mmcif_names.RNA_CHAIN)
    if dna:
      include_types.append(mmcif_names.DNA_CHAIN)
    if dna_rna_hybrid:
      include_types.append(mmcif_names.DNA_RNA_HYBRID_CHAIN)
    if ligand:
      include_types.extend(mmcif_names.LIGAND_CHAIN_TYPES)
    if water:
      include_types.append(mmcif_names.WATER)
    return self.filter(chain_type=include_types)

  def get_stoichiometry(
      self, *, fix_non_standard_polymer_res: bool = False
  ) -> Sequence[int]:
    """Returns the structure's stoichiometry using chain_res_name_sequence.

    Note that everything is considered (protein, RNA, DNA, ligands) except for
    water molecules. If you are interested only in a certain type of entities,
    filter them out before calling this method.

    Args:
      fix_non_standard_polymer_res: If True, maps non standard residues in
        protein / RNA / DNA chains to standard residues (e.g. MSE -> MET) or UNK
        / N if a match is not found.

    Returns:
      A list of integers, one for each unique chain in the structure,
      determining the number of that chain appearing in the structure. The
      numbers are sorted highest to lowest. E.g. for an A3B2 protein this method
      will return [3, 2].
    """
    filtered = self.filter_to_entity_type(
        protein=True,
        rna=True,
        dna=True,
        dna_rna_hybrid=True,
        ligand=True,
        water=False,
    )
    seqs = filtered.chain_res_name_sequence(
        include_missing_residues=True,
        fix_non_standard_polymer_res=fix_non_standard_polymer_res,
    )

    unique_seq_counts = collections.Counter(seqs.values())
    return sorted(unique_seq_counts.values(), reverse=True)

  def without_hydrogen(self) -> Self:
    """Returns the structure without hydrogen atoms."""
    return self.filter(
        np.logical_and(self._atoms.element != 'H', self._atoms.element != 'D')
    )

  def without_terminal_oxygens(self) -> Self:
    """Returns the structure without terminal oxygen atoms."""
    terminal_oxygen_filter = np.zeros(self.num_atoms, dtype=bool)
    for chain_type, atom_name in mmcif_names.TERMINAL_OXYGENS.items():
      chain_keys = self._chains.key[self._chains.type == chain_type]
      chain_atom_filter = np.logical_and(
          self._atoms.name == atom_name,
          np.isin(self._atoms.chain_key, chain_keys),
      )
      np.logical_or(
          terminal_oxygen_filter, chain_atom_filter, out=terminal_oxygen_filter
      )
    return self.filter_out(terminal_oxygen_filter)

  def reset_author_naming_scheme(self) -> Self:
    """Remove author chain/residue ids, entity info and use internal ids."""
    new_chains = structure_tables.Chains(
        key=self._chains.key,
        id=self._chains.id,
        type=self._chains.type,
        auth_asym_id=self._chains.id,
        entity_id=np.arange(1, self.num_chains + 1).astype(str).astype(object),
        entity_desc=np.full(self.num_chains, '.', dtype=object),
    )
    new_residues = structure_tables.Residues(
        key=self._residues.key,
        chain_key=self._residues.chain_key,
        id=self._residues.id,
        name=self._residues.name,
        auth_seq_id=self._residues.id.astype(str).astype(object),
        insertion_code=np.full(
            self.num_residues(count_unresolved=True), '?', dtype=object
        ),
    )
    return self.copy_and_update(
        chains=new_chains, residues=new_residues, skip_validation=True
    )

  def filter_residues(self, res_mask: np.ndarray) -> Self:
    """Filter resolved residues using a boolean mask."""
    required_shape = (self.num_residues(count_unresolved=False),)
    if res_mask.shape != required_shape:
      raise ValueError(
          f'res_mask must have shape {required_shape}. Got: {res_mask.shape}.'
      )
    if res_mask.dtype != bool:
      raise ValueError(f'res_mask must have dtype bool. Got: {res_mask.dtype}.')

    filtered_residues = self.present_residues.filter(res_mask)
    atom_mask = np.isin(self._atoms.res_key, filtered_residues.key)
    return self.filter(atom_mask)

  def filter_coords(
      self, coord_predicate: Callable[[np.ndarray], bool]
  ) -> Self:
    """Filter a structure's atoms by a function of their coordinates.

    Args:
      coord_predicate: A boolean function of coordinate vectors (shape (3,)).

    Returns:
      A Structure filtered so that only atoms with coords passing the predicate
      function are present.

    Raises:
      ValueError: If the coords are not shaped (num_atom, 3).
    """
    coords = self.coords
    if coords.ndim != 2 or coords.shape[-1] != 3:
      raise ValueError(
          f'coords should have shape (num_atom, 3). Got {coords.shape}.'
      )
    mask = np.vectorize(coord_predicate, signature='(n)->()')(coords)
    # This use of _apply_atom_index_array is safe because a boolean mask is
    # used, which means the chain/residue/atom ordering will stay unchanged.
    return self._apply_atom_index_array(mask, skip_validation=True)

  def filter_polymers_to_single_atom_per_res(
      self,
      representative_atom_by_chain_type: Mapping[
          str, str
      ] = mmcif_names.RESIDUE_REPRESENTATIVE_ATOMS,
  ) -> Self:
    """Filter to one representative atom per polymer residue, ligands unchanged.

    Args:
      representative_atom_by_chain_type: Chain type str to atom name, only atoms
        with this name will be kept for this chain type. Chains types from the
        structure not found in this mapping will keep all their atoms.

    Returns:
      A Structure filtered so that per chain types, only specified atoms are
      present.
    """
    polymer_chain_keys = self._chains.key[
        string_array.isin(
            self._chains.type, set(representative_atom_by_chain_type)
        )
    ]
    polymer_atoms_mask = np.isin(self._atoms.chain_key, polymer_chain_keys)

    wanted_atom_by_chain_key = {
        chain_key: representative_atom_by_chain_type.get(chain_type, None)
        for chain_key, chain_type in zip(self._chains.key, self._chains.type)
    }
    wanted_atoms = string_array.remap(
        self._atoms.chain_key.astype(object), mapping=wanted_atom_by_chain_key
    )

    representative_polymer_atoms_mask = polymer_atoms_mask & (
        wanted_atoms == self._atoms.name
    )

    return self.filter(representative_polymer_atoms_mask | ~polymer_atoms_mask)

  def drop_non_standard_protein_atoms(self, *, drop_oxt: bool = True) -> Self:
    """Drops non-standard atom names from protein chains.

    Args:
      drop_oxt: If True, also drop terminal oxygens (OXT).

    Returns:
      A new Structure object where the protein chains have been filtered to
        only contain atoms with names listed in `atom_types`
        (including OXT unless `drop_oxt` is `True`). Non-protein chains are
        unaltered.
    """
    allowed_names = set(atom_types.ATOM37)
    if drop_oxt:
      allowed_names = {n for n in allowed_names if n != atom_types.OXT}

    return self.filter_out(
        chain_type=mmcif_names.PROTEIN_CHAIN,
        atom_name=lambda n: string_array.isin(n, allowed_names, invert=True),
    )

  def drop_non_standard_atoms(
      self,
      *,
      ccd: chemical_components.Ccd,
      drop_unk: bool,
      drop_non_ccd: bool,
      drop_terminal_oxygens: bool = False,
  ) -> Self:
    """Drops atoms that are not in the CCD for the given residue type."""

    # We don't remove any atoms in UNL, as it has no standard atoms.
    def _keep(atom_index: int) -> bool:
      atom_name = self._atoms.name[atom_index]
      res_name = self._residues.name[
          self._residues.index_by_key[self._atoms.res_key[atom_index]]
      ]
      if drop_unk and res_name in residue_names.UNKNOWN_TYPES:
        return False
      else:
        return (
            (not drop_non_ccd and not ccd.get(res_name))
            or atom_name in struc_chem_comps.get_res_atom_names(ccd, res_name)
            or res_name == residue_names.UNL
        )

    standard_atom_mask = np.array(
        [_keep(atom_i) for atom_i in range(self.num_atoms)], dtype=bool
    )
    standard_atoms = self.filter(mask=standard_atom_mask)
    if drop_terminal_oxygens:
      standard_atoms = standard_atoms.without_terminal_oxygens()
    return standard_atoms

  def find_chains_with_unknown_sequence(self) -> Sequence[str]:
    """Returns a sequence of chain IDs that contain only unknown residues."""
    unknown_sequences = []
    for start, end in self.iter_chain_ranges():
      try:
        unknown_id = residue_names.UNKNOWN_TYPES.index(self.res_name[start])
        if start + 1 == end or np.all(
            self.res_name[start + 1 : end]
            == residue_names.UNKNOWN_TYPES[unknown_id]
        ):
          unknown_sequences.append(self.chain_id[start])
      except ValueError:
        pass
    return unknown_sequences

  def add_bonds(
      self,
      bonded_atom_pairs: Sequence[
          tuple[tuple[str, int, str], tuple[str, int, str]],
      ],
      bond_type: str | None = None,
  ) -> Self:
    """Returns a structure with new bonds added.

    Args:
      bonded_atom_pairs: A sequence of pairs of atoms, with one pair per bond.
        Each element of the pair is a tuple of (chain_id, res_id, atom_name),
        matching values from the respective fields of this structure. The first
        element is the start atom, and the second atom is the end atom of the
        bond.
      bond_type: This type will be used for all bonds in the structure, where
        type follows PDB scheme, e.g. unknown (?), hydrog, metalc, covale,
        disulf.

    Returns:
      A copy of this structure with the new bonds added. If this structure has
      bonds already then the new bonds are concatenated onto the end of the
      old bonds. NB: bonds are not deduplicated.
    """
    atom_key_lookup: dict[tuple[str, str, None, str], int] = dict(
        zip(self.atom_ids, self._atoms.key, strict=True)
    )

    # iter_atoms returns a 4-tuple (chain_id, res_id, ins_code, atom_name) but
    # the insertion code is always None. It also uses string residue IDs.
    def _to_internal_res_id(
        bonded_atom_id: tuple[str, int, str],
    ) -> tuple[str, str, None, str]:
      return bonded_atom_id[0], str(bonded_atom_id[1]), None, bonded_atom_id[2]

    from_atom_key = []
    dest_atom_key = []
    for from_atom, dest_atom in bonded_atom_pairs:
      from_atom_key.append(atom_key_lookup[_to_internal_res_id(from_atom)])
      dest_atom_key.append(atom_key_lookup[_to_internal_res_id(dest_atom)])
    num_bonds = len(bonded_atom_pairs)
    bonds_key = np.arange(num_bonds, dtype=np.int64)
    from_atom_key = np.array(from_atom_key, dtype=np.int64)
    dest_atom_key = np.array(dest_atom_key, dtype=np.int64)
    all_unk_col = np.array(['?'] * num_bonds, dtype=object)
    if bond_type is None:
      bond_type_col = all_unk_col
    else:
      bond_type_col = np.full((num_bonds,), bond_type, dtype=object)

    max_key = -1 if not self._bonds.size else np.max(self._bonds.key)
    new_bonds = structure_tables.Bonds(
        key=np.concatenate([self._bonds.key, bonds_key + max_key + 1]),
        from_atom_key=np.concatenate(
            [self._bonds.from_atom_key, from_atom_key]
        ),
        dest_atom_key=np.concatenate(
            [self._bonds.dest_atom_key, dest_atom_key]
        ),
        type=np.concatenate([self._bonds.type, bond_type_col]),
        role=np.concatenate([self._bonds.role, all_unk_col]),
    )
    return self.copy_and_update(bonds=new_bonds)

  @property
  def coords(self) -> np.ndarray:
    """A [..., num_atom, 3] shaped array of atom coordinates."""
    return np.stack([self._atoms.x, self._atoms.y, self._atoms.z], axis=-1)

  def chain_single_letter_sequence(
      self, include_missing_residues: bool = True
  ) -> Mapping[str, str]:
    """Returns a mapping from chain ID to a single letter residue sequence.

    Args:
      include_missing_residues: Whether to include residues that have no atoms.
    """
    res_table = (
        self._residues if include_missing_residues else self.present_residues
    )
    residue_chain_boundaries = _get_change_indices(res_table.chain_key)
    boundaries = self._iter_residue_ranges(
        residue_chain_boundaries,
        count_unresolved=include_missing_residues,
    )
    chain_keys = res_table.chain_key[residue_chain_boundaries]
    chain_ids = self._chains.apply_array_to_column('id', chain_keys)
    chain_types = self._chains.apply_array_to_column('type', chain_keys)
    chain_seqs = {}
    for idx, (start, end) in enumerate(boundaries):
      chain_id = chain_ids[idx]
      chain_type = chain_types[idx]
      chain_res = res_table.name[start:end]
      if chain_type in mmcif_names.PEPTIDE_CHAIN_TYPES:
        unknown_default = 'X'
      elif chain_type in mmcif_names.NUCLEIC_ACID_CHAIN_TYPES:
        unknown_default = 'N'
      else:
        chain_seqs[chain_id] = 'X' * chain_res.size
        continue

      chain_res = string_array.remap(
          chain_res,
          mapping=residue_names.CCD_NAME_TO_ONE_LETTER,
          inplace=False,
          default_value=unknown_default,
      )
      chain_seqs[chain_id] = ''.join(chain_res.tolist())

    return chain_seqs

  def polymer_auth_asym_id_to_label_asym_id(
      self,
      *,
      protein: bool = True,
      rna: bool = True,
      dna: bool = True,
      other: bool = True,
  ) -> Mapping[str, str]:
    """Mapping from author chain ID to internal chain ID, polymers only.

    This mapping is well defined only for polymers (protein, DNA, RNA), but not
    for ligands or water.

    E.g. if a structure had the following internal chain IDs (label_asym_id):
      A (protein), B (DNA), C (ligand bound to A), D (ligand bound to A),
      E (ligand bound to B).

    Such structure would have this internal chain ID (label_asym_id) -> author
    chain ID (auth_asym_id) mapping:
      A -> A, B -> B, C -> A, D -> A, E -> B

    This is a bijection only for polymers (A, B), but not for ligands.

    Args:
      protein: Whether to include protein (polypeptide(L)) chains.
      rna: Whether to include RNA chains.
      dna: Whether to include DNA chains.
      other: Whether to include other polymer chains, e.g. RNA/DNA hybrid or
        polypeptide(D). Note that include_other=True must be set in from_mmcif.

    Returns:
      A mapping from author chain ID to the internal (label) chain ID for the
      given polymer types in the Structure, ligands/water are ignored.

    Raises:
      ValueError: If the mapping from internal chain IDs to author chain IDs is
        not a bijection for polymer chains.
    """
    allowed_types = set()
    if protein:
      allowed_types.add(mmcif_names.PROTEIN_CHAIN)
    if rna:
      allowed_types.add(mmcif_names.RNA_CHAIN)
    if dna:
      allowed_types.add(mmcif_names.DNA_CHAIN)
    if other:
      non_standard_chain_types = (
          mmcif_names.POLYMER_CHAIN_TYPES
          - mmcif_names.STANDARD_POLYMER_CHAIN_TYPES
      )
      allowed_types |= non_standard_chain_types

    auth_asym_id_to_label_asym_id = {}
    for chain in self.iter_chains():
      if chain['chain_type'] not in allowed_types:
        continue
      label_asym_id = chain['chain_id']
      auth_asym_id = chain['chain_auth_asym_id']
      # The mapping from author chain id to label chain id is only one-to-one if
      # we restrict our attention to polymers. But check nevertheless.
      if auth_asym_id in auth_asym_id_to_label_asym_id:
        raise ValueError(
            f'Author chain ID "{auth_asym_id}" does not have a unique mapping '
            f'to internal chain ID "{label_asym_id}", it is already mapped to '
            f'"{auth_asym_id_to_label_asym_id[auth_asym_id]}".'
        )
      auth_asym_id_to_label_asym_id[auth_asym_id] = label_asym_id

    return auth_asym_id_to_label_asym_id

  def polymer_author_chain_single_letter_sequence(
      self,
      *,
      include_missing_residues: bool = True,
      protein: bool = True,
      rna: bool = True,
      dna: bool = True,
      other: bool = True,
  ) -> Mapping[str, str]:
    """Mapping from author chain ID to single letter aa sequence, polymers only.

    This mapping is well defined only for polymers (protein, DNA, RNA), but not
    for ligands or water.

    Args:
      include_missing_residues: If True then all residues will be returned for
        each polymer chain present in the structure. This uses the all_residues
        field and will include residues missing due to filtering operations as
        well as e.g. unresolved residues specified in an mmCIF header.
      protein: Whether to include protein (polypeptide(L)) chains.
      rna: Whether to include RNA chains.
      dna: Whether to include DNA chains.
      other: Whether to include other polymer chains, e.g. RNA/DNA hybrid or
        polypeptide(D). Note that include_other=True must be set in from_mmcif.

    Returns:
      A mapping from (author) chain IDs to their single-letter sequences for all
      polymers in the Structure, ligands/water are ignored.

    Raises:
      ValueError: If the mapping from internal chain IDs to author chain IDs is
        not a bijection for polymer chains.
    """
    label_chain_id_to_seq = self.chain_single_letter_sequence(
        include_missing_residues=include_missing_residues
    )
    auth_to_label = self.polymer_auth_asym_id_to_label_asym_id(
        protein=protein, rna=rna, dna=dna, other=other
    )
    return {
        auth: label_chain_id_to_seq[label]
        for auth, label in auth_to_label.items()
    }

  def chain_res_name_sequence(
      self,
      *,
      include_missing_residues: bool = True,
      fix_non_standard_polymer_res: bool = False,
  ) -> Mapping[str, Sequence[str]]:
    """A mapping from internal chain ID to a sequence of residue names.

    The residue names are the full residue names rather than single letter
    codes. For instance, for proteins these are the 3 letter CCD codes.

    Args:
      include_missing_residues: Whether to include residues with no atoms in the
        returned sequences.
      fix_non_standard_polymer_res: Whether to map non standard residues in
        protein / RNA / DNA chains to standard residues (e.g. MSE -> MET) or UNK
        / N if a match is not found.

    Returns:
      A mapping from (internal) chain IDs to a sequence of residue names.
    """
    res_table = (
        self._residues if include_missing_residues else self.present_residues
    )
    residue_chain_boundaries = _get_change_indices(res_table.chain_key)
    boundaries = self._iter_residue_ranges(
        residue_chain_boundaries, count_unresolved=include_missing_residues
    )
    chain_keys = res_table.chain_key[residue_chain_boundaries]
    chain_ids = self._chains.apply_array_to_column('id', chain_keys)
    chain_types = self._chains.apply_array_to_column('type', chain_keys)
    chain_seqs = {}
    for idx, (start, end) in enumerate(boundaries):
      chain_id = chain_ids[idx]
      chain_type = chain_types[idx]
      chain_res = res_table.name[start:end]
      if (
          fix_non_standard_polymer_res
          and chain_type in mmcif_names.POLYMER_CHAIN_TYPES
      ):
        chain_seqs[chain_id] = tuple(
            fix_non_standard_polymer_residues(
                res_names=chain_res, chain_type=chain_type
            )
        )
      else:
        chain_seqs[chain_id] = tuple(chain_res)

    return chain_seqs

  def fix_non_standard_polymer_res(
      self,
      res_mapper: Callable[
          [np.ndarray, str], np.ndarray
      ] = fix_non_standard_polymer_residues,
  ) -> Self:
    """Replaces non-standard polymer residues with standard alternatives or UNK.

    e.g. maps 'ACE' -> 'UNK', 'MSE' -> 'MET'.

    NB: Only fixes the residue names, but does not fix the atom names.
    E.g., 'MSE' will be renamed to 'MET' but its 'SE' atom will not be renamed
    to 'S'. Fixing MSE should be done during conversion from mmcif with the
    `fix_mse_residues` flag.

    Args:
      res_mapper: An optional function that accepts a numpy array of residue
        names and chain_type, and returns an array with fixed res_names. This
        defaults to fix_non_standard_polymer_residues.

    Returns:
      A Structure containing only standard residue types (or 'UNK') in its
      polymer chains.
    """
    fixed_res_name = self._residues.name.copy()
    chain_change_indices = _get_change_indices(self._residues.chain_key)
    for start, end in self._iter_atom_ranges(chain_change_indices):
      chain_key = self._residues.chain_key[start]
      chain_type = self._chains.type[self._chains.index_by_key[chain_key]]
      if chain_type not in mmcif_names.POLYMER_CHAIN_TYPES:
        continue  # We don't need to change anything for non-polymers.
      fixed_res_name[start:end] = res_mapper(
          fixed_res_name[start:end], chain_type
      )
    fixed_residues = self._residues.copy_and_update(name=fixed_res_name)
    return self.copy_and_update(residues=fixed_residues, skip_validation=True)

  @property
  def slice_leading_dims(self) -> '_LeadingDimSlice':
    """Used to create a new Structure by slicing into the leading dimensions.

    Example usage 1:

    ```
    final_state = multi_state_struc.slice_leading_dims[-1]
    ```

    Example usage 2:

    ```
    # Structure has leading batch and time dimensions.
    # Get final 3 time frames from first two batch elements.
    sliced_strucs = batched_trajectories.slice_leading_dims[:2, -3:]
    ```
    """
    return _LeadingDimSlice(self)

  def unstack(self, axis: int = 0) -> Sequence[Self]:
    """Unstacks a multi-model structure into a list of Structures.

    This method is the inverse of `stack`.

    Example usage:
    ```
    strucs = multi_dim_struc.unstack(axis=0)
    ```

    Args:
      axis: The axis to unstack over. The structures in the returned list won't
        have this axis in their coordinate of b-factor fields.

    Returns:
      A list of `Structure`s with length equal to the size of the specified
      axis in the coorinate field arrays.

    Raises:
      IndexError: If axis does not refer to one of the leading dimensions of
        `self.atoms_table.size`.
    """
    ndim = self._atoms.ndim
    if not (-ndim <= axis < ndim):
      raise IndexError(
          f'{axis=} is out of range for atom coordinate fields with {ndim=}.'
      )
    elif axis < 0:
      axis += ndim
    if axis == ndim - 1:
      raise IndexError(
          'axis must refer to one of the leading dimensions, not the final '
          f'dimension. The atom fields have {ndim=} and {axis=} was specified.'
      )
    unstacked = []
    leading_dim_slice = self.slice_leading_dims  # Compute once here.
    for i in range(self._atoms.shape[axis]):
      slice_i = (slice(None),) * axis + (i,)
      unstacked.append(leading_dim_slice[slice_i])
    return unstacked

  def split_by_chain(self) -> Sequence[Self]:
    """Splits a Structure into single-chain Structures, one for each chain.

    The obtained structures can be merged back together into the original
    structure using the `concat` function.

    Returns:
      A list of `Structure`s, one for each chain. The order is the same as the
      chain order in the original Structure.
    """
    return [self.filter(chain_id=chain_id) for chain_id in self.chains]

  def transform_states_to_chains(self) -> Self:
    """Transforms states to chains.

    A multi-state protein structure will be transformed to a multi-chain
    single-state protein structure. Useful for visualising multiples states to
    examine diversity. This structure's coordinate fields must have shape
    `(num_states, num_atoms)`.

    Returns:
      A new `Structure`, based on this structure, but with the multiple states
      now represented as `num_states * num_chains` chains in a
      single-state protein.

    Raises:
      ValueError: If this structure's array fields don't have shape
        `(num_states, num_atoms)`.
    """
    if self._atoms.ndim != 2:
      raise ValueError(
          'Coordinate field tensor must have 2 dimensions: '
          f'(num_states, num_atoms), got {self._atoms.ndim}.'
      )
    return concat(self.unstack(axis=0))

  def merge_chains(
      self,
      *,
      chain_groups: Sequence[Sequence[str]],
      chain_group_ids: Sequence[str] | None = None,
      chain_group_types: Sequence[str] | None = None,
      chain_group_entity_ids: Sequence[str] | None = None,
  ) -> Self:
    """Merges chains in each group into a single chain.

    If a Structure has chains A, B, C, D, E, and
    `merge_chains([[A, C], [B, D], [E]])` is called, the new Structure will have
    3 chains A, B, C, the first being concatenation of A+C, the second B+D, the
    third just the original chain E.

    Args:
      chain_groups: Each group defines what chains should be merged into a
        single chain. The output structure will therefore have len(chain_groups)
        chains. Residue IDs (label and author) are renumbered to preserve
        uniqueness within new chains. Order of chain groups and within each
        group matters.
      chain_group_ids: Optional sequence of new chain IDs for each group. If not
        given, the new internal chain IDs (label_asym_id) are assigned in the
        standard mmCIF order (i.e. A, B, ..., Z, AA, BA, CA, ...). Author chain
        names (auth_asym_id) are set to be equal to the new internal chain IDs.
      chain_group_types: Optional sequence of new chain types for each group. If
        not given, only chains with the same type can be merged.
      chain_group_entity_ids: Optional sequence of new entity IDs for each
        group. If not given, the new internal entity IDs (entity_id) are
        assigned in the standard mmCIF order (i.e. 1, 2, 3, ...). Entity
        descriptions (entity_desc) are set to '.' for each chain.

    Returns:
      A new `Structure` with chains merged together into a single chain within
      each chain group.

    Raises:
      ValueError: If chain_group_ids or chain_group_types are given but don't
        match the length of chain_groups.
      ValueError: If the chain IDs in the flattened chain_groups don't match the
        chain IDs in the Structure.
      ValueError: If chains in any of the groups don't have the same chain type.
    """
    if chain_group_ids and len(chain_group_ids) != len(chain_groups):
      raise ValueError(
          'chain_group_ids must the same length as chain_groups: '
          f'{len(chain_group_ids)=} != {len(chain_groups)=}'
      )
    if chain_group_types and len(chain_group_types) != len(chain_groups):
      raise ValueError(
          'chain_group_types must the same length as chain_groups: '
          f'{len(chain_group_types)=} != {len(chain_groups)=}'
      )
    if chain_group_entity_ids and len(chain_group_entity_ids) != len(
        chain_groups
    ):
      raise ValueError(
          'chain_group_entity_ids must the same length as chain_groups: '
          f'{len(chain_group_entity_ids)=} != {len(chain_groups)=}'
      )

    flattened = sorted(itertools.chain.from_iterable(chain_groups))
    if flattened != sorted(self.chains):
      raise ValueError(
          'IDs in chain groups do not match Structure chain IDs: '
          f'{chain_groups=}, chains={self.chains}'
      )

    new_chain_key_by_chain_id = {}
    for new_chain_key, group_chain_ids in enumerate(chain_groups):
      for chain_id in group_chain_ids:
        new_chain_key_by_chain_id[chain_id] = new_chain_key

    chain_key_remap = {}
    new_chain_type_by_chain_key = {}
    for old_chain_key, old_chain_id, old_chain_type in zip(
        self._chains.key, self._chains.id, self._chains.type
    ):
      new_chain_key = new_chain_key_by_chain_id[old_chain_id]
      chain_key_remap[old_chain_key] = new_chain_key

      if new_chain_key not in new_chain_type_by_chain_key:
        new_chain_type_by_chain_key[new_chain_key] = old_chain_type
      elif not chain_group_types:
        if new_chain_type_by_chain_key[new_chain_key] != old_chain_type:
          bad_types = [
              f'{cid}: {self._chains.type[np.where(self._chains.id == cid)][0]}'
              for cid in chain_groups[new_chain_key]
          ]
          raise ValueError(
              'Inconsistent chain types within group:\n' + '\n'.join(bad_types)
          )

    new_chain_key = np.arange(len(chain_groups), dtype=np.int64)
    if chain_group_ids:
      new_chain_id = np.array(chain_group_ids, dtype=object)
    else:
      new_chain_id = np.array(
          [mmcif.int_id_to_str_id(k) for k in new_chain_key + 1], dtype=object
      )
    if chain_group_types:
      new_chain_type = np.array(chain_group_types, dtype=object)
    else:
      new_chain_type = np.array(
          [new_chain_type_by_chain_key[k] for k in new_chain_key], dtype=object
      )
    if chain_group_entity_ids:
      new_chain_entity_id = np.array(chain_group_entity_ids, dtype=object)
    else:
      new_chain_entity_id = np.char.mod('%d', new_chain_key + 1).astype(object)
    new_chains = structure_tables.Chains(
        key=new_chain_key,
        id=new_chain_id,
        type=new_chain_type,
        auth_asym_id=new_chain_id,
        entity_id=new_chain_entity_id,
        entity_desc=np.full(len(chain_groups), fill_value='.', dtype=object),
    )

    # Remap chain keys and sort residues to match the chain table order.
    new_residues = self._residues.copy_and_remap(chain_key=chain_key_remap)
    new_residues = new_residues.apply_index(
        np.argsort(new_residues.chain_key, kind='stable')
    )
    # Renumber uniquely residues in each chain.
    indices = np.arange(new_residues.chain_key.size, dtype=np.int32)
    new_res_ids = (indices + 1) - np.maximum.accumulate(
        indices * (new_residues.chain_key != np.roll(new_residues.chain_key, 1))
    )
    new_residues = new_residues.copy_and_update(
        id=new_res_ids,
        auth_seq_id=np.char.mod('%d', new_res_ids).astype(object),
    )

    # Remap chain keys and sort atoms to match the chain table order.
    new_atoms = self._atoms.copy_and_remap(chain_key=chain_key_remap)
    new_atoms = new_atoms.apply_index(
        np.argsort(new_atoms.chain_key, kind='stable')
    )

    return self.copy_and_update(
        chains=new_chains,
        residues=new_residues,
        atoms=new_atoms,
        bonds=self._bonds,
    )

  def to_res_arrays(
      self,
      *,
      include_missing_residues: bool,
      atom_order: Mapping[str, int] = atom_types.ATOM37_ORDER,
  ) -> ResArrays:
    """Returns atom-level information in arrays containing a num_res dimension.

    NB: All residues in the structure will appear in the residue dimension but
    atoms will only have a True (1.0) mask value if the residue + atom
    combination is defined in `atom_order`. E.g. for the standard ATOM37_ORDER,
    atoms are guaranteed to be present only for standard protein residues.

    Args:
      include_missing_residues: If True then the res arrays will include rows
        for missing residues where all atoms will be masked out. Otherwise these
        will simply be skipped.
      atom_order: Atom order mapping atom names to their index in the atom
        dimension of the returned arrays. Default is atom_order for proteins,
        choose atom_types.ATOM29_ORDER for nucleics.

    Returns:
      A ResArrays object.
    """
    num_res = self.num_residues(count_unresolved=include_missing_residues)
    atom_type_num = len(atom_order)
    atom_positions = np.zeros((num_res, atom_type_num, 3), dtype=np.float32)
    atom_mask = np.zeros((num_res, atom_type_num), dtype=np.float32)
    atom_b_factor = np.zeros((num_res, atom_type_num), dtype=np.float32)
    atom_occupancy = np.zeros((num_res, atom_type_num), dtype=np.float32)

    all_residues = None if not include_missing_residues else self.all_residues
    for i, atom in enumerate_residues(self.iter_atoms(), all_residues):
      atom_idx = atom_order.get(atom['atom_name'])
      if atom_idx is not None:
        atom_positions[i, atom_idx, 0] = atom['atom_x']
        atom_positions[i, atom_idx, 1] = atom['atom_y']
        atom_positions[i, atom_idx, 2] = atom['atom_z']
        atom_mask[i, atom_idx] = 1.0
        atom_b_factor[i, atom_idx] = atom['atom_b_factor']
        atom_occupancy[i, atom_idx] = atom['atom_occupancy']

    return ResArrays(
        atom_positions=atom_positions,
        atom_mask=atom_mask,
        atom_b_factor=atom_b_factor,
        atom_occupancy=atom_occupancy,
    )

  def to_res_atom_lists(
      self, *, include_missing_residues: bool
  ) -> Sequence[Sequence[Mapping[str, Any]]]:
    """Returns list of atom dictionaries grouped by residue.

    If this is a multi-model structure, each atom will store its fields
    atom_x, atom_y, atom_z, and atom_b_factor as Numpy arrays of shape of the
    leading dimension(s). If this is a single-mode structure, these fields will
    just be scalars.

    Args:
      include_missing_residues: If True, then the output list will contain an
        empty list of atoms for missing residues. Otherwise missing residues
        will simply be skipped.

    Returns:
      A list of size `num_res`. Each element in the list represents atoms of one
      residue. If a residue is present is present, the list will contain an atom
      dictionary for every atom present in that residue. If a residue is missing
      and `include_missing_residues=True`, the list for that missing residue
      will be empty.
    """
    num_res = self.num_residues(count_unresolved=include_missing_residues)
    residue_atoms = [[] for _ in range(num_res)]
    all_residues = None if not include_missing_residues else self.all_residues

    # We could yield directly in this loop but the code would be more complex.
    # Let's optimise if memory usage is an issue.
    for res_index, atom in enumerate_residues(self.iter_atoms(), all_residues):
      residue_atoms[res_index].append(atom)

    return residue_atoms

  def reorder_chains(self, new_order: Sequence[str]) -> Self:
    """Reorders tables so that the label_asym_ids are in the given order.

    This method changes the order of the chains, residues, and atoms tables so
    that they are all consistent with each other. Moreover, it remaps chain keys
    so that they stay monotonically increasing in chains/residues/atoms tables.

    Args:
      new_order: The order in which the chain IDs (label_asym_id) should be.
        This must be a permutation of the current chain IDs.

    Returns:
      A structure with chains reorded.
    """
    if len(new_order) != len(self.chains):
      raise ValueError(
          f'The new number of chains ({len(new_order)}) does not match the '
          f'current number of chains ({len(self.chains)}).'
      )
    new_chain_set = set(new_order)
    if len(new_chain_set) != len(new_order):
      raise ValueError(f'The new order {new_order} contains non-unique IDs.')
    if new_chain_set.symmetric_difference(set(self.chains)):
      raise ValueError(
          f'New chain IDs {new_order} do not match the old {set(self.chains)}'
      )

    if self.chains == tuple(new_order):
      return self  # Shortcut: the new order is the same as the current one.

    desired_chain_id_pos = {chain_id: i for i, chain_id in enumerate(new_order)}

    current_chain_index_order = np.empty(self.num_chains, dtype=np.int64)
    for index, old_chain_id in enumerate(self._chains.id):
      current_chain_index_order[index] = desired_chain_id_pos[old_chain_id]
    chain_reorder = np.argsort(current_chain_index_order, kind='stable')
    chain_key_map = dict(
        zip(self._chains.key[chain_reorder], range(self.num_chains))
    )
    chains = self._chains.apply_index(chain_reorder)
    chains = chains.copy_and_remap(key=chain_key_map)

    # The stable sort keeps the original residue ordering within each chain.
    residues = self._residues.copy_and_remap(chain_key=chain_key_map)
    residue_reorder = np.argsort(residues.chain_key, kind='stable')
    residues = residues.apply_index(residue_reorder)

    # The stable sort keeps the original atom ordering within each chain.
    atoms = self._atoms.copy_and_remap(chain_key=chain_key_map)
    atoms_reorder = np.argsort(atoms.chain_key, kind='stable')
    atoms = atoms.apply_index(atoms_reorder)

    # Bonds unchanged - each references 2 atom keys, hence ordering not defined.
    return self.copy_and_update(chains=chains, residues=residues, atoms=atoms)

  def rename_auth_asym_ids(self, new_id_by_old_id: Mapping[str, str]) -> Self:
    """Returns a new structure with renamed author chain IDs (auth_asym_ids).

    Args:
      new_id_by_old_id: A mapping from original auth_asym_ids to their new
        values. Any auth_asym_ids in this structure that are not in the mapping
        will remain unchanged.

    Raises:
      ValueError: If any two previously distinct polymer chains do not have
        unique names anymore after the rename.
    """
    mapped_chains = self._chains.copy_and_remap(auth_asym_id=new_id_by_old_id)
    mapped_polymer_ids = mapped_chains.filter(
        type=mmcif_names.POLYMER_CHAIN_TYPES
    ).auth_asym_id
    if len(mapped_polymer_ids) != len(set(mapped_polymer_ids)):
      raise ValueError(
          'The new polymer auth_asym_ids are not unique:'
          f' {sorted(mapped_polymer_ids)}.'
      )
    return self.copy_and_update(chains=mapped_chains, skip_validation=True)

  def rename_chain_ids(self, new_id_by_old_id: Mapping[str, str]) -> Self:
    """Returns a new structure with renamed chain IDs (label_asym_ids).

    The chains' auth_asym_ids will be updated to be identical to the chain ID
    since there isn't one unambiguous way to maintain the auth_asym_ids after
    renaming the chain IDs (depending on whether you view the auth_asym_id as
    more strongly associated with a given physical chain, or with a given
    chain ID).

    The residues' auth_seq_id will be updated to be identical to the residue ID
    since they are strongly tied to the original author chain naming and keeping
    them would be misleading.

    Args:
      new_id_by_old_id: A mapping from original chain ID to their new values.
        Any chain IDs in this structure that are not in this mapping will remain
        unchanged.

    Returns:
      A new structure with renamed chains (and bioassembly data if it is
      present).

    Raises:
      ValueError: If any two previously distinct chains do not have unique names
        anymore after the rename.
    """
    new_chain_id = string_array.remap(self._chains.id, new_id_by_old_id)
    if len(new_chain_id) != len(set(new_chain_id)):
      raise ValueError(f"New chain names aren't unique: {sorted(new_chain_id)}")

    # Map label_asym_ids in the bioassembly data.
    if self._bioassembly_data is None:
      new_bioassembly_data = None
    else:
      new_bioassembly_data = self._bioassembly_data.rename_label_asym_ids(
          new_id_by_old_id, present_chains=set(self.present_chains.id)
      )

    # Set author residue IDs to be the string version of internal residue IDs.
    new_residues = self._residues.copy_and_update(
        auth_seq_id=self._residues.id.astype(str).astype(object)
    )

    new_chains = self._chains.copy_and_update(
        id=new_chain_id, auth_asym_id=new_chain_id
    )

    return self.copy_and_update(
        bioassembly_data=new_bioassembly_data,
        chains=new_chains,
        residues=new_residues,
        skip_validation=True,
    )

  @functools.cached_property
  def chains(self) -> tuple[str, ...]:
    """Ordered internal chain IDs (label_asym_id) present in the Structure."""
    return tuple(self._chains.id)

  def rename_res_name(
      self,
      res_name_map: Mapping[str, str],
      fail_if_not_found: bool = True,
  ) -> Self:
    """Returns a copy of this structure with residues renamed.

    Residue names in chemical components data will also be renamed.

    Args:
      res_name_map: A mapping from old residue names to new residue names. Any
        residues that are not in this mapping will be left unchanged.
      fail_if_not_found: Whether to fail if keys in the res_name_map mapping are
        not found in this structure's residues' `name` column.

    Raises:
      ValueError: If `fail_if_not_found=True` and a residue name isn't found in
        the residues table's `name` field.
    """
    res_name_set = set(self._residues.name)
    if fail_if_not_found:
      for res_name in res_name_map:
        if res_name not in res_name_set:
          raise ValueError(f'"{res_name}" not found in this structure.')
    new_residues = self._residues.copy_and_remap(name=res_name_map)

    if self._chemical_components_data is not None:
      chem_comp = {
          res_name_map.get(res_name, res_name): data
          for res_name, data in self._chemical_components_data.chem_comp.items()
      }
      new_chem_comp = struc_chem_comps.ChemicalComponentsData(chem_comp)
    else:
      new_chem_comp = None

    return self.copy_and_update(
        residues=new_residues,
        chemical_components_data=new_chem_comp,
        skip_validation=True,
    )

  def remap_res_id(self, res_id_map: Mapping[str, Mapping[int, int]]) -> Self:
    """Returns a copy of this structure with residue IDs remapped.

    Example structure with 2 chains:
    Chain A: residues 1, 2, 3; chain B: residues 6, 7, 8
    res_id_map: {'A': {1: 1, 2: 5, 3: 6}, 'B': {6: 1, 7: 2, 8: 8}}
    Will result in:
    Chain A: residues 1, 5, 6; chain B: residues 1, 2, 8

    Args:
      res_id_map: A mapping from internal chain ID to a mapping from old residue
        ID to new residue ID. A mapping must be provided for each residue in
        each chain.

    Raises:
      KeyError: If residue ID in a given chain is not found in the mapping for
        that chain.
      ValueError: If residue IDs are not unique in each chain after remapping.
    """
    chain_ids = self._chains.apply_array_to_column(
        column_name='id', arr=self._residues.chain_key
    )
    flat_res_id_map = {}
    for chain_id, chain_res_id_map in res_id_map.items():
      flat_res_id_map.update({
          (chain_id, old_res_id): new_res_id
          for old_res_id, new_res_id in chain_res_id_map.items()
      })

    try:
      new_res_id = string_array.remap_multiple(
          (chain_ids, self._residues.id), flat_res_id_map
      )
    except KeyError as e:
      raise KeyError(
          f'Could not find new residue ID for residue {e} in {res_id_map=}'
      ) from e

    residue_chain_boundaries = _get_change_indices(self._residues.chain_key)
    res_boundaries = self._iter_residue_ranges(
        residue_chain_boundaries, count_unresolved=True
    )
    for idx, (start, end) in enumerate(res_boundaries):
      chain_id = chain_ids[idx]
      chain_res_ids = new_res_id[start:end]
      if len(chain_res_ids) != len(set(chain_res_ids)):
        raise ValueError(
            f'New residue IDs not unique in chain {chain_id}: {chain_res_ids}'
        )

    return self.copy_and_update(
        residues=self._residues.copy_and_update(id=new_res_id.astype(np.int32)),
        skip_validation=True,
    )

  def rename_chains_to_match(
      self,
      other: 'Structure',
      *,
      fuzzy_match_non_standard_res: bool = True,
  ) -> Self:
    """Returns a new structure with renamed chains to match another's.

    Example:
    This structure has chains: {'A': 'DEEP', 'B': 'MIND', 'C': 'MIND'}
    Other structure has chains: {'X': 'DEEP', 'Z': 'MIND', 'Y': 'MIND'}

    After calling this method, you will get a structure that has chains named:
    {'X': 'DEEP', 'Z': 'MIND', Y: 'MIND'}

    Args:
      other: Another `Structure`. This provides the reference chain names that
        is used to rename this structure's chains.
      fuzzy_match_non_standard_res: If True, protein/RNA/DNA chains with the
        same one letter sequence will be matched. e.g. "MET-MET-UNK1" will match
        "MET-MSE-UNK2", since both will be mapped to "MMX". If False, we require
        the full res_names to match.

    Returns:
      A new `Structure`, based on this structure, which has chains renamed to
      match the other structure.
    """
    sequences = self.chain_res_name_sequence(
        include_missing_residues=True,
        fix_non_standard_polymer_res=fuzzy_match_non_standard_res,
    )

    other_sequences = other.chain_res_name_sequence(
        include_missing_residues=True,
        fix_non_standard_polymer_res=fuzzy_match_non_standard_res,
    )

    # Check that the sequences are the same.
    sequence_counts = collections.Counter(sequences.values())
    other_sequence_counts = collections.Counter(other_sequences.values())
    if other_sequence_counts != sequence_counts:
      raise ValueError(
          'The other structure does not have the same sequences\n'
          f' other: {other_sequence_counts}\n self: {sequence_counts}'
      )

    new_decoy_id_by_old_id = {}
    used_chain_ids = set()
    # Sort self keys and take min over other to make matching deterministic.
    # The matching is arbitrary but this helps debugging.
    for self_chain_id, self_seq in sorted(sequences.items()):
      # Find corresponding chains in the other structure.
      other_chain_id = min(
          k
          for k, v in other_sequences.items()
          if v == self_seq and k not in used_chain_ids
      )

      new_decoy_id_by_old_id[self_chain_id] = other_chain_id
      used_chain_ids.add(other_chain_id)

    return self.rename_chain_ids(new_decoy_id_by_old_id)

  def _apply_bioassembly_transform(
      self, transform: bioassemblies.Transform
  ) -> Self:
    """Applies a bioassembly transform to this structure."""
    base_struc = self.filter(chain_id=transform.chain_ids)
    transformed_atoms = base_struc.atoms_table.copy_and_update_coords(
        transform.apply_to_coords(base_struc.coords)
    )
    transformed_chains = base_struc.chains_table.copy_and_remap(
        id=transform.chain_id_rename_map
    )
    # Set the transformed author chain ID to match the label chain ID.
    transformed_chains = transformed_chains.copy_and_update(
        auth_asym_id=transformed_chains.id
    )
    return base_struc.copy_and_update(
        chains=transformed_chains,
        atoms=transformed_atoms,
        skip_validation=True,
    )

  def generate_bioassembly(self, assembly_id: str | None = None) -> Self:
    """Generates a biological assembly as a new `Structure`.

    When no assembly ID is provided this method produces a default assembly.
    If this structure has no `bioassembly_data` then this returns itself
    unchanged. Otherwise a default assembly ID is picked with
    `BioassemblyData.get_default_assembly_id()`.

    Args:
      assembly_id: The assembly ID to generate, or None to generate a default
        bioassembly.

    Returns:
      A new `Structure`, based on this one, representing the specified
      bioassembly. Note that if the bioassembly contains copies of chains
      in the original structure then they will be given new unique chain IDs.

    Raises:
      ValueError: If this structure's `bioassembly_data` is `None` and
      `assembly_id` is not `None`.
    """
    if self._bioassembly_data is None:
      if assembly_id is None:
        return self
      else:
        raise ValueError(
            f'Unset bioassembly_data, cannot generate assembly {assembly_id}'
        )

    if assembly_id is None:
      assembly_id = self._bioassembly_data.get_default_assembly_id()

    transformed_strucs = [
        self._apply_bioassembly_transform(transform)
        for transform in self._bioassembly_data.get_transforms(assembly_id)
    ]

    # We don't need to assign unique chain IDs because the bioassembly
    # transform takes care of remapping chain IDs to be unique.
    concatenated = concat(
        transformed_strucs,
        assign_unique_chain_ids=False,
        assign_unique_entity_ids=False,
    )

    # Copy over all scalar fields (e.g. name, release date, etc.) other than
    # bioassembly_data because it relates only to the pre-transformed structure.
    return concatenated.copy_and_update_globals(
        name=self.name,
        release_date=self.release_date,
        resolution=self.resolution,
        structure_method=self.structure_method,
        bioassembly_data=None,
        chemical_components_data=self.chemical_components_data,
    )

  def _to_mmcif_header(self) -> Mapping[str, Sequence[str]]:
    raw_mmcif = collections.defaultdict(list)
    raw_mmcif['data_'] = [self._name.replace(' ', '-')]
    raw_mmcif['_entry.id'] = [self._name]

    if self._release_date is not None:
      date = [datetime.datetime.strftime(self._release_date, '%Y-%m-%d')]
      raw_mmcif['_pdbx_audit_revision_history.revision_date'] = date
      raw_mmcif['_pdbx_database_status.recvd_initial_deposition_date'] = date

    if self._resolution is not None:
      raw_mmcif['_refine.ls_d_res_high'] = ['%.2f' % self._resolution]

    if self._structure_method is not None:
      for method in self._structure_method.split(','):
        raw_mmcif['_exptl.method'].append(method)

    if self._bioassembly_data is not None:
      raw_mmcif.update(self._bioassembly_data.to_mmcif_dict())

    # Populate chemical components data for all residues of this Structure.
    if self._chemical_components_data:
      raw_mmcif.update(self._chemical_components_data.to_mmcif_dict())

    # Add _software table to store version number used to generate mmCIF.
    # Only required data items are used (+ _software.version).
    raw_mmcif['_software.pdbx_ordinal'] = ['1']
    raw_mmcif['_software.name'] = ['DeepMind Structure Class']
    raw_mmcif['_software.version'] = [self._VERSION]
    raw_mmcif['_software.classification'] = ['other']  # Required.

    return raw_mmcif

  def to_mmcif_dict(
      self,
      *,
      coords_decimal_places: int = _COORDS_DECIMAL_PLACES,
  ) -> mmcif.Mmcif:
    """Returns an Mmcif representing the structure."""
    header = self._to_mmcif_header()
    sequence_tables = structure_tables.to_mmcif_sequence_and_entity_tables(
        self._chains, self._residues, self._atoms.res_key
    )
    atom_and_bond_tables = structure_tables.to_mmcif_atom_site_and_bonds_table(
        chains=self._chains,
        residues=self._residues,
        atoms=self._atoms,
        bonds=self._bonds,
        coords_decimal_places=coords_decimal_places,
    )
    return mmcif.Mmcif({**header, **sequence_tables, **atom_and_bond_tables})

  def to_mmcif(
      self, *, coords_decimal_places: int = _COORDS_DECIMAL_PLACES
  ) -> str:
    """Returns an mmCIF string representing the structure.

    Args:
      coords_decimal_places: The number of decimal places to keep for atom
        coordinates, including trailing zeros.
    """
    return self.to_mmcif_dict(
        coords_decimal_places=coords_decimal_places
    ).to_string()


class _LeadingDimSlice:
  """Helper class for slicing the leading dimensions of a `Structure`.

  Wraps a `Structure` instance and applies a slice operation to the coordinate
  fields and other fields that may have leading dimensions (e.g. b_factor).

  Example usage:
    t0_struc = multi_state_struc.slice_leading_dims[0]
  """

  def __init__(self, struc: Structure):
    self._struc = struc

  def __getitem__(self, *args, **kwargs) -> Structure:
    sliced_atom_cols = {}
    for col_name in structure_tables.Atoms.multimodel_cols:
      if (col := self._struc.atoms_table.get_column(col_name)).ndim > 1:
        sliced_col = col.__getitem__(*args, **kwargs)
        if (
            not sliced_col.shape
            or sliced_col.shape[-1] != self._struc.num_atoms
        ):
          raise ValueError(
              'Coordinate slice cannot change final (atom) dimension.'
          )
        sliced_atom_cols[col_name] = sliced_col
    sliced_atoms = self._struc.atoms_table.copy_and_update(**sliced_atom_cols)
    return self._struc.copy_and_update(atoms=sliced_atoms, skip_validation=True)


def stack(strucs: Sequence[Structure], axis: int = 0) -> Structure:
  """Stacks multiple structures into a single multi-model Structure.

  This function is the inverse of `Structure.unstack()`.

  NB: this function assumes that every structure in `strucs` is identical
  other than the coordinates and b-factors. Under this assumption we can safely
  copy all these identical fields from the first element of strucs w.l.o.g.
  However this is not checked in full detail as full comparison is expensive.
  Instead this only checks that the `atom_name` field is identical, and that
  the coordinates have the same shape.

  Usage example:
  ```
  multi_model_struc = structure.stack(strucs, axis=0)
  ```

  Args:
    strucs: A sequence of structures, each with the same atoms, but they may
      have different coordinates and b-factors. If any b-factors are not None
      then they must have the same shape as each of the coordinate fields.
    axis: The axis in the returned structure that represents the different
      structures in `strucs` and will have size `len(strucs)`. This cannot be
      the final dimension as this is reserved for `num_atoms`.

  Returns:
    A `Structure` with the same atoms as the structures in `strucs` but with
    all of their coordinates stacked into a new leading axis.

  Raises:
    ValueError: If `strucs` is empty.
    ValueError: If `strucs` do not all have the same `atom_name` field.
  """
  if not strucs:
    raise ValueError('Need at least one Structure to stack.')
  struc_0, *other_strucs = strucs
  for i, struc in enumerate(other_strucs, start=1):
    # Check that every structure has the same atom name column.
    # This check is intended to catch cases where the input structures might
    # contain the same atoms, but in different orders. This won't catch every
    # such case, e.g. if these are carbon-alpha-only structures, but should
    # catch most cases.
    if np.any(struc.atoms_table.name != struc_0.atoms_table.name):
      raise ValueError(
          f'strucs[0] and strucs[{i}] have mismatching atom name columns.'
      )

  stacked_atoms = struc_0.atoms_table.copy_and_update(
      x=np.stack([s.atoms_table.x for s in strucs], axis=axis),
      y=np.stack([s.atoms_table.y for s in strucs], axis=axis),
      z=np.stack([s.atoms_table.z for s in strucs], axis=axis),
      b_factor=np.stack([s.atoms_table.b_factor for s in strucs], axis=axis),
      occupancy=np.stack([s.atoms_table.occupancy for s in strucs], axis=axis),
  )
  return struc_0.copy_and_update(atoms=stacked_atoms, skip_validation=True)


def _assign_unique_chain_ids(
    strucs: Iterable[Structure],
) -> Sequence[Structure]:
  """Creates a sequence of `Structure` objects with unique chain IDs.

  Let e.g. [A, B] denote a structure of two chains A and B, then this function
  performs the following kind of renaming operation:

  e.g.: [Z], [C], [B, C] -> [A], [B], [C, D]

  NB: This function uses Structure.rename_chain_ids which will define each
  structure's chains.auth_asym_id to be identical to its chains.id columns.

  Args:
    strucs: Structures whose chains ids are to be uniquified.

  Returns:
    A sequence with the same number of elements as `strucs` but where each
    element has had its chains renamed so that they aren't shared with any
    other `Structure` in the sequence.
  """
  # Start counting at 1 because mmcif.int_id_to_str_id expects integers >= 1.
  chain_counter = 1
  strucs_with_new_chain_ids = []
  for struc in strucs:
    rename_map = {}
    for chain_id in struc.chains:
      rename_map[chain_id] = mmcif.int_id_to_str_id(chain_counter)
      chain_counter += 1
    renamed = struc.rename_chain_ids(rename_map)
    strucs_with_new_chain_ids.append(renamed)
  return strucs_with_new_chain_ids


def concat(
    strucs: Sequence[Structure],
    *,
    name: str | None = None,
    assign_unique_chain_ids: bool = True,
    assign_unique_entity_ids: bool = True,
) -> Structure:
  """Concatenates structures along the atom dimension.

  NB: By default this function will first assign unique chain IDs to all chains
  in `strucs` so that the resulting structure does not contain duplicate chain
  IDs. This will also fix entity IDs and author chain IDs. If this is disabled
  via `assign_unique_chain_ids=False` the user must ensure that there are no
  duplicate chains (label_asym_id). However, duplicate entity IDs and author
  chain IDs are allowed as that might be the desired behavior.

  If `assign_unique_chain_ids=True`, note also that the chain_ids may be
  overwritten even if they are already unique.

  Let e.g. [A, B] denote a structure of two chains A and B, then this function
  performs the following kind of concatenation operation:

  assign_unique_chain_ids=True:
    label chain IDS : [Z], [C], [B, C] -> [A, B, C, D]
    author chain IDS: [U], [V], [V, C] -> [A, B, C, D]
    entity IDs      : [1], [1], [3, 3] -> [1, 2, 3, 4]
  assign_unique_chain_ids=False:
    label chain IDS : [D], [B], [C, A] -> [D, B, C, A]  (inputs must be unique)
    author chain IDS: [U], [V], [V, A] -> [U, V, V, A]
    entity IDs      : [1], [1], [3, 3] -> [1, 1, 3, 3]

  NB: This operation loses some information from the elements of `strucs`,
  namely the `name`, `resolution`, `release_date` and `bioassembly_data` fields.

  Args:
    strucs: The `Structure` instances to concatenate. These should all have the
      same number and shape of leading dimensions (i.e. if any are multi-model
      structures then they should all have the same number of models).
    name: Optional name to give to the concatenated structure. If None, the name
      will be concatenation of names of all concatenated structures.
    assign_unique_chain_ids: If True, this function first assigns new unique
      chain IDs, entity IDs and author chain IDs to every chain in `strucs`. If
      False, you must ensure chain IDs are already unique, otherwise an
      exception is raised. See `_assign_unique_chain_ids` for more information
      on how this is performed.
    assign_unique_entity_ids: If True, this function first assigns new unique
      entity IDs to every chain in `strucs`. If False, you must ensure entity
      IDs are already set in a way so that same entity ID implies for two chains
      in `strucs` that they have the same residues. This option applies only if
      `assign_unique_chain_ids == False`, otherwise it must be set to True.

  Returns:
    A new concatenated `Structure` with all of the chains in `strucs` combined
    into one new structure. The new structure will be named by joining the
    names of `strucs` with underscores.

  Raises:
    ValueError: If `strucs` is empty.
    ValueError: If `assign_unique_chain_ids=False` and not all chains in
      `strucs` have unique chain IDs.
  """
  if not strucs:
    raise ValueError('Need at least one Structure to concatenate.')

  if assign_unique_chain_ids and not assign_unique_entity_ids:
    raise ValueError(
        'If assign_unique_chain_ids is True, assign_unique_entity_ids must be '
        'True as well.'
    )

  if assign_unique_chain_ids:
    strucs = _assign_unique_chain_ids(strucs)

  chemical_components_data = {}
  seen_label_chain_ids = set()
  for i, struc in enumerate(strucs):
    if not assign_unique_chain_ids:
      if seen_cid := seen_label_chain_ids.intersection(struc.chains):
        raise ValueError(
            f'Chain IDs {seen_cid} from strucs[{i}] also exist in other'
            ' members of strucs. All given structures must have unique chain'
            ' IDs. Consider setting assign_unique_chain_ids=True.'
        )
      seen_label_chain_ids.update(struc.chains)

    if struc.chemical_components_data is not None:
      chemical_components_data.update(struc.chemical_components_data.chem_comp)  # pytype: disable=attribute-error  # always-use-property-annotation

  concatted_struc = table.concat_databases(strucs)
  name = name if name is not None else '_'.join(s.name for s in strucs)
  # Chain IDs (label and author) are fixed at this point, fix also entity IDs.
  if assign_unique_chain_ids or assign_unique_entity_ids:
    numeric_ids = np.arange(1, concatted_struc.num_chains + 1)
    entity_id = np.char.mod('%d', numeric_ids).astype(object)
    chains = concatted_struc.chains_table.copy_and_update(entity_id=entity_id)
  else:
    chains = concatted_struc.chains_table

  return concatted_struc.copy_and_update(
      name=name,
      release_date=None,
      resolution=None,
      structure_method=None,
      bioassembly_data=None,
      chemical_components_data=(
          struc_chem_comps.ChemicalComponentsData(chemical_components_data)
          if chemical_components_data
          else None
      ),
      chains=chains,
      skip_validation=True,  # Already validated by table.concat_databases.
  )


def multichain_residue_index(
    struc: Structure, chain_offset: int = 9000, between_chain_buffer: int = 1000
) -> np.ndarray:
  """Compute a residue index array that is monotonic across all chains.

  Lots of metrics (lddt, l1_long, etc) require computing a
  distance-along-chain between two residues.  For multimers we want to ensure
  that any residues on different chains have a high along-chain distance
  (i.e. they should always count as long-range contacts for example).  To
  do this we add 10000 to the residue indices of each chain, and enforce that
  the residue index is monotonically increasing across the whole complex.

  Note: This returns the same as struc.res_id for monomers.

  Args:
    struc: The structure to make a multichain residue index for.
    chain_offset: The start of each chain is offset by at least this amount.
      This must be larger than the absolute range of standard residue IDs.
    between_chain_buffer: The final residue in one chain will have at least this
      much of a buffer before the first residue in the next chain.

  Returns:
    A monotonically increasing residue index, with at least
    `between_chain_buffer` residues in between each chain.
  """
  if struc.num_atoms:
    res_id_range = np.max(struc.res_id) - np.min(struc.res_id)
    assert res_id_range < chain_offset
  chain_id_int = struc.chain_id
  monotonic_chain_id_int = np.concatenate(
      ([0], np.cumsum(chain_id_int[1:] != chain_id_int[:-1]))
  )
  return struc.res_id + monotonic_chain_id_int * (
      chain_offset + between_chain_buffer
  )


def make_empty_structure() -> Structure:
  """Returns a new structure consisting of empty array fields."""
  return Structure(
      chains=structure_tables.Chains.make_empty(),
      residues=structure_tables.Residues.make_empty(),
      atoms=structure_tables.Atoms.make_empty(),
      bonds=structure_tables.Bonds.make_empty(),
  )


def enumerate_residues(
    atom_iter: Iterable[Mapping[str, Any]],
    all_residues: AllResidues | None = None,
) -> Iterator[tuple[int, Mapping[str, Any]]]:
  """Provides a zero-indexed enumeration of residues in an atom iterable.

  Args:
    atom_iter: An iterable of atom dicts as returned by Structure.iter_atoms().
    all_residues: (Optional) A structure's all_residues field. If present then
      this will be used to count missing residues by adding appropriate gaps in
      the residue enumeration.

  Yields:
    (res_i, atom) pairs where atom is the unmodified atom dict and res_i is a
    zero-based index for the residue that the atom belongs to.
  """
  if all_residues is None:
    prev_res = None
    res_i = -1
    for atom in atom_iter:
      res = (atom['chain_id'], atom['res_id'])
      if res != prev_res:
        prev_res = res
        res_i += 1
      yield res_i, atom
  else:
    all_res_seq = []  # Sequence of (chain_id, res_id) for all chains.
    prev_chain = None
    res_i = 0
    for atom in atom_iter:
      chain_id = atom['chain_id']
      if chain_id not in all_residues:
        raise ValueError(
            f'Atom {atom} does not belong to any residue in all_residues.'
        )
      if chain_id != prev_chain:
        prev_chain = chain_id
        all_res_seq.extend(
            (chain_id, res_id) for (_, res_id) in all_residues[chain_id]
        )
      res = (chain_id, atom['res_id'])
      while res_i < len(all_res_seq) and res != all_res_seq[res_i]:
        res_i += 1
      if res_i == len(all_res_seq):
        raise ValueError(
            f'Atom {atom} does not belong to a residue in all_residues.'
        )
      yield res_i, atom


================================================
FILE: src/alphafold3/structure/structure_tables.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Table implementations for the Structure class."""

import collections
from collections.abc import Mapping, Sequence
import dataclasses
import functools
import itertools
import typing
from typing import Any, ClassVar, Self

from alphafold3.constants import mmcif_names
from alphafold3.constants import residue_names
from alphafold3.cpp import aggregation
from alphafold3.cpp import string_array
from alphafold3.structure import bonds as bonds_module
from alphafold3.structure import mmcif
from alphafold3.structure import table
import numpy as np


Bonds = bonds_module.Bonds


def _residue_name_to_record_name(
    residue_name: np.ndarray,
    polymer_mask: np.ndarray,
) -> np.ndarray:
  """Returns record names (ATOM/HETATM) given residue names and polymer mask."""
  record_name = np.array(['HETATM'] * len(residue_name), dtype=object)
  record_name[polymer_mask] = string_array.remap(
      residue_name[polymer_mask],
      mapping={r: 'ATOM' for r in residue_names.STANDARD_POLYMER_TYPES},
      default_value='HETATM',
  )
  return record_name


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class AuthorNamingScheme:
  """A mapping from internal values to author values in a mmCIF.

  Fields:
    auth_asym_id: A mapping from label_asym_id to auth_asym_id.
    auth_seq_id: A mapping from label_asym_id to a mapping from
      label_seq_id to auth_seq_id.
    insertion_code: A mapping from label_asym_id to a mapping from
      label_seq_id to insertion codes.
    entity_id: A mapping from label_asym_id to _entity.id.
    entity_desc: A mapping from _entity.id to _entity.pdbx_description.
  """

  auth_asym_id: Mapping[str, str]
  auth_seq_id: Mapping[str, Mapping[int, str]]
  insertion_code: Mapping[str, Mapping[int, str | None]]
  entity_id: Mapping[str, str]
  entity_desc: Mapping[str, str]


def _default(
    candidate_value: np.ndarray | None, default_value: Sequence[Any], dtype: Any
) -> np.ndarray:
  if candidate_value is None:
    return np.array(default_value, dtype=dtype)
  return np.array(candidate_value, dtype=dtype)


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class Atoms(table.Table):
  """Table of atoms in a Structure."""

  chain_key: np.ndarray
  res_key: np.ndarray
  name: np.ndarray
  element: np.ndarray
  x: np.ndarray
  y: np.ndarray
  z: np.ndarray
  b_factor: np.ndarray
  occupancy: np.ndarray
  multimodel_cols: ClassVar[tuple[str, ...]] = (
      'x',
      'y',
      'z',
      'b_factor',
      'occupancy',
  )

  def __post_init__(self):
    # Validates that the atom coordinates, b-factors and occupancies are finite.
    for column_name in ('x', 'y', 'z', 'b_factor', 'occupancy'):
      column = self.get_column(column_name)
      if not np.isfinite(column).all():
        raise ValueError(
            f'Column {column_name} must not contain NaN/inf values.'
        )
    # super().__post_init__() can't be used as that causes the following error:
    # TypeError: super(type, obj): obj must be an instance or subtype of type
    super(Atoms, self).__post_init__()

  @classmethod
  def make_empty(cls) -> Self:
    return cls(
        key=np.array([], dtype=np.int64),
        chain_key=np.array([], dtype=np.int64),
        res_key=np.array([], dtype=np.int64),
        name=np.array([], dtype=object),
        element=np.array([], dtype=object),
        x=np.array([], dtype=np.float32),
        y=np.array([], dtype=np.float32),
        z=np.array([], dtype=np.float32),
        b_factor=np.array([], dtype=np.float32),
        occupancy=np.array([], dtype=np.float32),
    )

  @classmethod
  def from_defaults(
      cls,
      *,
      chain_key: np.ndarray,
      res_key: np.ndarray,
      key: np.ndarray | None = None,
      name: np.ndarray | None = None,
      element: np.ndarray | None = None,
      x: np.ndarray | None = None,
      y: np.ndarray | None = None,
      z: np.ndarray | None = None,
      b_factor: np.ndarray | None = None,
      occupancy: np.ndarray | None = None,
  ) -> Self:
    """Create an Atoms table with minimal user inputs."""
    num_atoms = len(chain_key)
    if not num_atoms:
      return cls.make_empty()
    return Atoms(
        chain_key=chain_key,
        res_key=res_key,
        key=_default(key, np.arange(num_atoms), np.int64),
        name=_default(name, ['?'] * num_atoms, object),
        element=_default(element, ['?'] * num_atoms, object),
        x=_default(x, [0.0] * num_atoms, np.float32),
        y=_default(y, [0.0] * num_atoms, np.float32),
        z=_default(z, [0.0] * num_atoms, np.float32),
        b_factor=_default(b_factor, [0.0] * num_atoms, np.float32),
        occupancy=_default(occupancy, [1.0] * num_atoms, np.float32),
    )

  def get_value_by_index(
      self, column_name: str, index: int
  ) -> table.TableEntry | np.ndarray:
    if column_name in self.multimodel_cols:
      return self.get_column(column_name)[..., index]
    else:
      return self.get_column(column_name)[index]

  def copy_and_update_coords(self, coords: np.ndarray) -> Self:
    """Returns a copy with the x, y and z columns updated."""
    if coords.shape[-1] != 3:
      raise ValueError(
          f'Expecting 3-dimensional coordinates, got {coords.shape}'
      )
    return typing.cast(
        Atoms,
        self.copy_and_update(
            x=coords[..., 0], y=coords[..., 1], z=coords[..., 2]
        ),
    )

  @property
  def shape(self) -> tuple[int, ...]:
    return self.x.shape

  @property
  def ndim(self) -> int:
    return len(self.shape)

  @functools.cached_property
  def num_models(self) -> int:
    """The number of models of this Structure."""
    leading_dims = self.shape[:-1]
    match leading_dims:
      case ():
        return 1
      case (single_leading_dim_size,):
        return single_leading_dim_size
      case _:
        raise ValueError(
            'num_models not defined for atom tables with more than one '
            'leading dimension.'
        )


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class Residues(table.Table):
  """Table of residues in a Structure."""

  chain_key: np.ndarray
  id: np.ndarray
  name: np.ndarray
  auth_seq_id: np.ndarray
  insertion_code: np.ndarray

  @classmethod
  def make_empty(cls) -> Self:
    return cls(
        key=np.array([], dtype=np.int64),
        chain_key=np.array([], dtype=np.int64),
        id=np.array([], dtype=np.int32),
        name=np.array([], dtype=object),
        auth_seq_id=np.array([], dtype=object),
        insertion_code=np.array([], dtype=object),
    )

  @classmethod
  def from_defaults(
      cls,
      *,
      id: np.ndarray,  # pylint:disable=redefined-builtin
      chain_key: np.ndarray,
      key: np.ndarray | None = None,
      name: np.ndarray | None = None,
      auth_seq_id: np.ndarray | None = None,
      insertion_code: np.ndarray | None = None,
  ) -> Self:
    """Create a Residues table with minimal user inputs."""
    num_res = len(id)
    if not num_res:
      return cls.make_empty()
    return Residues(
        key=_default(key, np.arange(num_res), np.int64),
        id=id,
        chain_key=chain_key,
        name=_default(name, ['UNK'] * num_res, object),
        auth_seq_id=_default(auth_seq_id, id.astype(str), object),
        insertion_code=_default(insertion_code, ['?'] * num_res, object),
    )


@dataclasses.dataclass(frozen=True, slots=True, kw_only=True)
class Chains(table.Table):
  """Table of chains in a Structure."""

  id: np.ndarray
  type: np.ndarray
  auth_asym_id: np.ndarray
  entity_id: np.ndarray
  entity_desc: np.ndarray

  @classmethod
  def make_empty(cls) -> Self:
    return cls(
        key=np.array([], dtype=np.int64),
        id=np.array([], dtype=object),
        type=np.array([], dtype=object),
        auth_asym_id=np.array([], dtype=object),
        entity_id=np.array([], dtype=object),
        entity_desc=np.array([], dtype=object),
    )

  @classmethod
  def from_defaults(
      cls,
      *,
      id: np.ndarray,  # pylint:disable=redefined-builtin
      key: np.ndarray | None = None,
      type: np.ndarray | None = None,  # pylint:disable=redefined-builtin
      auth_asym_id: np.ndarray | None = None,
      entity_id: np.ndarray | None = None,
      entity_desc: np.ndarray | None = None,
  ) -> Self:
    """Create a Chains table with minimal user inputs."""
    num_chains = len(id)
    if not num_chains:
      return cls.make_empty()

    return Chains(
        key=_default(key, np.arange(num_chains), np.int64),
        id=id,
        type=_default(type, [mmcif_names.PROTEIN_CHAIN] * num_chains, object),
        auth_asym_id=_default(auth_asym_id, id, object),
        entity_id=_default(
            entity_id, np.arange(1, num_chains + 1).astype(str), object
        ),
        entity_desc=_default(entity_desc, ['.'] * num_chains, object),
    )


def to_mmcif_sequence_and_entity_tables(
    chains: Chains,
    residues: Residues,
    atom_res_key: np.ndarray,
) -> Mapping[str, Sequence[str]]:
  """Returns raw sequence and entity mmCIF tables."""
  raw_mmcif = collections.defaultdict(list)
  chains_by_entity_id = {}
  written_entity_poly_seq_ids = set()
  present_res_keys = set(atom_res_key)

  # Performance optimisation: Find residue indices for each chain in advance, so
  # that we don't have to do redunant masking work for each chain.
  res_indices_for_chain = aggregation.indices_grouped_by_value(
      residues.chain_key
  )

  for chain in chains.iterrows():
    # Add all chain information to the _struct_asym table.
    chain_id = chain['id']  # Saves multiple dict lookups.
    auth_asym_id = chain['auth_asym_id']
    entity_id = chain['entity_id']
    chains_by_entity_id.setdefault(entity_id, []).append(chain)
    raw_mmcif['_struct_asym.id'].append(chain_id)
    raw_mmcif['_struct_asym.entity_id'].append(entity_id)

    res_chain_indices = res_indices_for_chain[chain['key']]
    chain_type = chain['type']
    is_polymer = chain_type in mmcif_names.POLYMER_CHAIN_TYPES
    is_water = chain_type == mmcif_names.WATER
    is_branched = len(res_chain_indices) > 1 and not is_polymer and not is_water
    write_entity_poly_seq = entity_id not in written_entity_poly_seq_ids

    # Iterate over the individual masked residue table columns, as that doesn't
    # create a copy (only a view), while residues[res_chain_indices] does.
    for res_key, res_name, res_id, pdb_seq_num, res_ins_code in zip(
        residues.key[res_chain_indices],
        residues.name[res_chain_indices],
        residues.id[res_chain_indices],
        residues.auth_seq_id[res_chain_indices],
        residues.insertion_code[res_chain_indices],
        strict=True,
    ):
      is_missing = res_key not in present_res_keys
      str_res_id = str(res_id)
      # While atom_site uses "?" for insertion codes, scheme tables use ".".
      ins_code = (res_ins_code or '.').replace('?', '.')
      auth_seq_num = '?' if is_missing else pdb_seq_num

      if is_polymer:
        raw_mmcif['_pdbx_poly_seq_scheme.asym_id'].append(chain_id)
        raw_mmcif['_pdbx_poly_seq_scheme.entity_id'].append(entity_id)
        raw_mmcif['_pdbx_poly_seq_scheme.seq_id'].append(str_res_id)
        raw_mmcif['_pdbx_poly_seq_scheme.mon_id'].append(res_name)
        raw_mmcif['_pdbx_poly_seq_scheme.pdb_seq_num'].append(pdb_seq_num)
        raw_mmcif['_pdbx_poly_seq_scheme.auth_seq_num'].append(auth_seq_num)
        raw_mmcif['_pdbx_poly_seq_scheme.pdb_strand_id'].append(auth_asym_id)
        raw_mmcif['_pdbx_poly_seq_scheme.pdb_ins_code'].append(ins_code)
        # Structure doesn't support heterogeneous sequences.
        raw_mmcif['_pdbx_poly_seq_scheme.hetero'].append('n')
        if write_entity_poly_seq:
          raw_mmcif['_entity_poly_seq.entity_id'].append(entity_id)
          raw_mmcif['_entity_poly_seq.num'].append(str_res_id)
          raw_mmcif['_entity_poly_seq.mon_id'].append(res_name)
          # Structure doesn't support heterogeneous sequences.
          raw_mmcif['_entity_poly_seq.hetero'].append('n')
          written_entity_poly_seq_ids.add(entity_id)
      elif is_branched:
        raw_mmcif['_pdbx_branch_scheme.asym_id'].append(chain_id)
        raw_mmcif['_pdbx_branch_scheme.entity_id'].append(entity_id)
        raw_mmcif['_pdbx_branch_scheme.mon_id'].append(res_name)
        raw_mmcif['_pdbx_branch_scheme.num'].append(str_res_id)
        raw_mmcif['_pdbx_branch_scheme.pdb_asym_id'].append(auth_asym_id)
        raw_mmcif['_pdbx_branch_scheme.pdb_seq_num'].append(pdb_seq_num)
        raw_mmcif['_pdbx_branch_scheme.auth_asym_id'].append(auth_asym_id)
        raw_mmcif['_pdbx_branch_scheme.auth_seq_num'].append(auth_seq_num)
        raw_mmcif['_pdbx_branch_scheme.pdb_ins_code'].append(ins_code)
        # Structure doesn't support heterogeneous sequences.
        raw_mmcif['_pdbx_branch_scheme.hetero'].append('n')
      else:
        raw_mmcif['_pdbx_nonpoly_scheme.asym_id'].append(chain_id)
        raw_mmcif['_pdbx_nonpoly_scheme.entity_id'].append(entity_id)
        raw_mmcif['_pdbx_nonpoly_scheme.mon_id'].append(res_name)
        raw_mmcif['_pdbx_nonpoly_scheme.pdb_seq_num'].append(pdb_seq_num)
        raw_mmcif['_pdbx_nonpoly_scheme.auth_seq_num'].append(auth_seq_num)
        raw_mmcif['_pdbx_nonpoly_scheme.pdb_strand_id'].append(auth_asym_id)
        raw_mmcif['_pdbx_nonpoly_scheme.pdb_ins_code'].append(ins_code)

  # Add _entity and _entity_poly tables.
  for entity_id, chains in chains_by_entity_id.items():
    # chains should always be a non-empty list because of how we constructed
    # chains_by_entity_id.
    assert chains
    # All chains for a given entity should have the same type and sequence
    # so we can pick the first one without losing information.
    key_chain = chains[0]
    raw_mmcif['_entity.id'].append(entity_id)
    raw_mmcif['_entity.pdbx_description'].append(key_chain['entity_desc'])
    entity_type = key_chain['type']
    if entity_type not in mmcif_names.POLYMER_CHAIN_TYPES:
      raw_mmcif['_entity.type'].append(entity_type)
    else:
      raw_mmcif['_entity.type'].append('polymer')
      raw_mmcif['_entity_poly.entity_id'].append(entity_id)
      raw_mmcif['_entity_poly.type'].append(entity_type)

      # _entity_poly.pdbx_strand_id is a comma-separated list of
      # auth_asym_ids that are part of the entity.
      raw_mmcif['_entity_poly.pdbx_strand_id'].append(
          ','.join(chain['auth_asym_id'] for chain in chains)
      )
  return raw_mmcif


def to_mmcif_atom_site_and_bonds_table(
    *,
    chains: Chains,
    residues: Residues,
    atoms: Atoms,
    bonds: Bonds,
    coords_decimal_places: int,
) -> Mapping[str, Sequence[str]]:
  """Returns raw _atom_site and _struct_conn mmCIF tables."""
  raw_mmcif = collections.defaultdict(list)
  # Use [value] * num wherever possible since it is about 10x faster than list
  # comprehension in such cases. Also use f-strings instead of str() - faster.
  total_atoms = atoms.size * atoms.num_models
  raw_mmcif['_atom_site.id'] = [f'{i}' for i in range(1, total_atoms + 1)]
  raw_mmcif['_atom_site.label_alt_id'] = ['.'] * total_atoms
  # Use format_float_array instead of list comprehension for performance.
  raw_mmcif['_atom_site.Cartn_x'] = mmcif.format_float_array(
      values=atoms.x.ravel(), num_decimal_places=coords_decimal_places
  )
  raw_mmcif['_atom_site.Cartn_y'] = mmcif.format_float_array(
      values=atoms.y.ravel(), num_decimal_places=coords_decimal_places
  )
  raw_mmcif['_atom_site.Cartn_z'] = mmcif.format_float_array(
      values=atoms.z.ravel(), num_decimal_places=coords_decimal_places
  )

  # atoms.b_factor or atoms.occupancy can be flat even when the coordinates have
  # leading dimensions. In this case we tile it to match.
  if atoms.b_factor.ndim == 1:
    atom_b_factor = np.tile(atoms.b_factor, atoms.num_models)
  else:
    atom_b_factor = atoms.b_factor.ravel()
  raw_mmcif['_atom_site.B_iso_or_equiv'] = mmcif.format_float_array(
      values=atom_b_factor, num_decimal_places=2
  )

  if atoms.occupancy.ndim == 1:
    atom_occupancy = np.tile(atoms.occupancy, atoms.num_models)
  else:
    atom_occupancy = atoms.occupancy.ravel()
  raw_mmcif['_atom_site.occupancy'] = mmcif.format_float_array(
      values=atom_occupancy.ravel(), num_decimal_places=2
  )

  label_atom_id = atoms.name
  type_symbol = atoms.element
  label_comp_id = residues.apply_array_to_column('name', atoms.res_key)
  label_asym_id = chains.apply_array_to_column('id', atoms.chain_key)
  label_entity_id = chains.apply_array_to_column('entity_id', atoms.chain_key)
  # Performance optimisation: Do the int->str conversion on num_residue-sized,
  # array, then select instead of selecting and then converting.
  label_seq_id = residues.id.astype('str').astype(object)[
      ..., residues.index_by_key[atoms.res_key]
  ]

  # _atom_site.label_seq_id is '.' for non-polymers.
  non_polymer_chain_mask = string_array.isin(
      chains.type, mmcif_names.POLYMER_CHAIN_TYPES, invert=True
  )
  non_polymer_chain_keys = chains.key[non_polymer_chain_mask]
  non_polymer_atom_mask = np.isin(atoms.chain_key, non_polymer_chain_keys)
  label_seq_id[non_polymer_atom_mask] = '.'

  auth_asym_id = chains.apply_array_to_column('auth_asym_id', atoms.chain_key)
  auth_seq_id = residues.apply_array_to_column('auth_seq_id', atoms.res_key)
  pdbx_pdb_ins_code = residues.apply_array_to_column(
      'insertion_code', atoms.res_key
  )
  string_array.remap(pdbx_pdb_ins_code, mapping={None: '?'}, inplace=True)

  group_pdb = _residue_name_to_record_name(
      residue_name=label_comp_id, polymer_mask=~non_polymer_atom_mask
  )

  def tile_for_models(arr: np.ndarray) -> list[str]:
    if atoms.num_models == 1:
      return arr.tolist()  # Memory optimisation: np.tile(arr, 1) does a copy.
    return np.tile(arr, atoms.num_models).tolist()

  raw_mmcif['_atom_site.group_PDB'] = tile_for_models(group_pdb)
  raw_mmcif['_atom_site.label_atom_id'] = tile_for_models(label_atom_id)
  raw_mmcif['_atom_site.type_symbol'] = tile_for_models(type_symbol)
  raw_mmcif['_atom_site.label_comp_id'] = tile_for_models(label_comp_id)
  raw_mmcif['_atom_site.label_asym_id'] = tile_for_models(label_asym_id)
  raw_mmcif['_atom_site.label_entity_id'] = tile_for_models(label_entity_id)
  raw_mmcif['_atom_site.label_seq_id'] = tile_for_models(label_seq_id)
  raw_mmcif['_atom_site.auth_asym_id'] = tile_for_models(auth_asym_id)
  raw_mmcif['_atom_site.auth_seq_id'] = tile_for_models(auth_seq_id)
  raw_mmcif['_atom_site.pdbx_PDB_ins_code'] = tile_for_models(pdbx_pdb_ins_code)
  model_id = np.array(
      [str(i + 1) for i in range(atoms.num_models)], dtype=object
  )
  raw_mmcif['_atom_site.pdbx_PDB_model_num'] = np.repeat(
      model_id, [atoms.size] * atoms.num_models
  ).tolist()

  if bonds.key.size > 0:
    raw_mmcif.update(
        bonds.to_mmcif_dict_from_atom_arrays(
            atom_key=atoms.key,
            chain_id=label_asym_id,
            res_id=label_seq_id,
            res_name=label_comp_id,
            atom_name=label_atom_id,
            auth_asym_id=auth_asym_id,
            auth_seq_id=auth_seq_id,
            insertion_code=np.array(pdbx_pdb_ins_code),
        )
    )
  return raw_mmcif


def _flatten_author_naming_scheme_table(
    res_table: Mapping[str, Mapping[int, str]],
    chain_ids: np.ndarray,
    res_chain_ids: np.ndarray,
    res_ids: np.ndarray,
    default_if_missing: str,
    table_name: str,
) -> np.ndarray:
  """Flattens an author naming scheme table consistently with res_ids."""
  if not set(chain_ids).issubset(res_table):
    raise ValueError(
        f'Chain IDs in the chain_id array must be a subset of {table_name} in '
        'author naming scheme:\n'
        f'chain_ids: {sorted(chain_ids)}\n'
        f'{table_name} keys: {sorted(res_table.keys())}'
    )

  chain_change_mask = res_chain_ids[1:] != res_chain_ids[:-1]
  res_chain_boundaries = np.concatenate(
      ([0], np.where(chain_change_mask)[0] + 1, [len(res_chain_ids)])
  )

  flat_vals = np.empty(len(res_ids), dtype=object)
  for chain_start, chain_end in itertools.pairwise(res_chain_boundaries):
    chain_id = res_chain_ids[chain_start]
    chain_res_ids = res_ids[chain_start:chain_end]
    chain_mapping = res_table[chain_id]
    flat_vals[chain_start:chain_end] = [
        chain_mapping.get(r, default_if_missing) for r in chain_res_ids
    ]

  return flat_vals


def tables_from_atom_arrays(
    *,
    res_id: np.ndarray,
    author_naming_scheme: AuthorNamingScheme | None = None,
    all_residues: Mapping[str, Sequence[tuple[str, int]]] | None = None,
    chain_id: np.ndarray | None = None,
    chain_type: np.ndarray | None = None,
    res_name: np.ndarray | None = None,
    atom_key: np.ndarray | None = None,
    atom_name: np.ndarray | None = None,
    atom_element: np.ndarray | None = None,
    atom_x: np.ndarray | None = None,
    atom_y: np.ndarray | None = None,
    atom_z: np.ndarray | None = None,
    atom_b_factor: np.ndarray | None = None,
    atom_occupancy: np.ndarray | None = None,
) -> tuple[Atoms, Residues, Chains]:
  """Returns Structure tables constructed from atom array level data.

  All fields except name and, res_id are optional, all array fields consist of a
  value for each atom in the structure - so residue and chain values should hold
  the same value for each atom in the chain or residue. Fields which are not
  defined are filled with default values.

  Validation is performed by the Structure constructor where possible - but
  author_naming scheme and all_residues must be checked in this function.

  It is not possible to construct structures with chains that do not contain
  any resolved residues using this function. If this is necessary, use the
  structure.Structure constructor directly.

  Args:
    res_id: Integer array of shape [num_atom]. The unique residue identifier for
      each residue. mmCIF field - _atom_site.label_seq_id.
    author_naming_scheme: An optional instance of AuthorNamingScheme to use when
      converting this structure to mmCIF.
    all_residues: An optional mapping from each chain ID (i.e. label_asym_id) to
      a sequence of (label_comp_id, label_seq_id) tuples, one per residue. This
      can contain residues that aren't present in the atom arrays. This is
      common in experimental data where some residues are not resolved but are
      known to be present.
    chain_id: String array of shape [num_atom] of unique chain identifiers.
      mmCIF field - _atom_site.label_asym_id.
    chain_type: String array of shape [num_atom]. The molecular type of the
      current chain (e.g. polyribonucleotide). mmCIF field - _entity_poly.type
      OR _entity.type (for non-polymers).
    res_name: String array of shape [num_atom].. The name of each residue,
      typically a 3 letter string for polypeptides or 1-2 letter strings for
      polynucleotides. mmCIF field - _atom_site.label_comp_id.
    atom_key: A unique sorted integer array, used only by the bonds table to
      identify the atoms participating in each bond. If the bonds table is
      specified then this column must be non-None.
    atom_name: String array of shape [num_atom]. The name of each atom (e.g CA,
      O2', etc.). mmCIF field - _atom_site.label_atom_id.
    atom_element: String array of shape [num_atom]. The element type of each
      atom (e.g. C, O, N, etc.). mmCIF field - _atom_site.type_symbol.
    atom_x: Float array of shape [..., num_atom] of atom x coordinates. May have
      arbitrary leading dimensions, provided that these are consistent across
      all coordinate fields.
    atom_y: Float array of shape [..., num_atom] of atom y coordinates. May have
      arbitrary leading dimensions, provided that these are consistent across
      all coordinate fields.
    atom_z: Float array of shape [..., num_atom] of atom z coordinates. May have
      arbitrary leading dimensions, provided that these are consistent across
      all coordinate fields.
    atom_b_factor: Float array of shape [..., num_atom] or [num_atom] of atom
      b-factors or equivalent. If there are no extra leading dimensions then
      these values are assumed to apply to all coordinates for a given atom. If
      there are leading dimensions then these must match those used by the
      coordinate fields.
    atom_occupancy: Float array of shape [..., num_atom] or [num_atom] of atom
      occupancies or equivalent. If there are no extra leading dimensions then
      these values are assumed to apply to all coordinates for a given atom. If
      there are leading dimensions then these must match those used by the
      coordinate fields.
  """
  num_atoms = len(res_id)

  for arr_name, array, dtype in (
      ('chain_id', chain_id, object),
      ('chain_type', chain_type, object),
      ('res_id', res_id, np.int32),
      ('res_name', res_name, object),
      ('atom_key', atom_key, np.int64),
      ('atom_name', atom_name, object),
      ('atom_element', atom_element, object),
  ):
    if array is not None and array.shape != (num_atoms,):
      raise ValueError(f'{arr_name} shape {array.shape} != ({num_atoms},)')
    if array is not None and array.dtype != dtype:
      raise ValueError(f'{arr_name} dtype {array.dtype} != {dtype}')

  for arr_name, array in (
      ('atom_x', atom_x),
      ('atom_y', atom_y),
      ('atom_z', atom_z),
      ('atom_b_factor', atom_b_factor),
      ('atom_occupancy', atom_occupancy),
  ):
    if array is not None and array.shape[-1] != num_atoms:
      raise ValueError(f'{arr_name} last dim {array.shape[-1]} != {num_atoms=}')
    if (
        array is not None
        and array.dtype != np.float32
        and array.dtype != np.float64
    ):
      raise ValueError(
          f'{arr_name} must be np.float32 or np.float64, got {array.dtype=}'
      )

  if all_residues is not None and (res_name is None or res_id is None):
    raise ValueError(
        'If all_residues != None, res_name and res_id must not be None either.'
    )

  if num_atoms == 0:
    return Atoms.make_empty(), Residues.make_empty(), Chains.make_empty()

  if chain_id is None:
    chain_id = np.full(shape=num_atoms, fill_value='A', dtype=object)
  if res_name is None:
    res_name = np.full(shape=num_atoms, fill_value='UNK', dtype=object)

  chain_change_mask = chain_id[1:] != chain_id[:-1]
  chain_start = np.concatenate(([0], np.where(chain_change_mask)[0] + 1))
  res_start = np.concatenate(
      ([0], np.where((res_id[1:] != res_id[:-1]) | chain_change_mask)[0] + 1)
  )

  if len(set(chain_id)) != len(chain_start):
    raise ValueError(f'Chain IDs must be contiguous, but got {chain_id}')

  # We do not support chains with unresolved residues-only in this function.
  chain_ids = chain_id[chain_start]
  if all_residues and set(all_residues.keys()) != set(chain_ids):
    raise ValueError(
        'all_residues must contain the same set of chain IDs as the chain_id '
        f'array:\nall_residues keys: {sorted(all_residues.keys())}\n'
        f'chain_ids: {sorted(chain_ids)}.'
    )
  # Make sure all_residue ordering is consistent with chain_id.
  if all_residues and np.any(list(all_residues.keys()) != chain_ids):
    all_residues = {cid: all_residues[cid] for cid in chain_ids}

  # Create the chains table.
  num_chains = len(chain_ids)
  chain_keys = np.arange(num_chains, dtype=np.int64)
  chain_key_by_chain_id = dict(zip(chain_ids, chain_keys, strict=True))

  if chain_type is not None:
    chain_types = chain_type[chain_start]
  else:
    chain_types = np.full(num_chains, mmcif_names.PROTEIN_CHAIN, dtype=object)

  if author_naming_scheme is not None:
    auth_asym_id = string_array.remap(
        chain_ids, author_naming_scheme.auth_asym_id
    )
    entity_id = string_array.remap(
        chain_ids, author_naming_scheme.entity_id, default_value='.'
    )
    entity_desc = string_array.remap(
        entity_id, author_naming_scheme.entity_desc, default_value='.'
    )
  else:
    auth_asym_id = chain_ids
    entity_id = (chain_keys + 1).astype(str).astype(object)
    entity_desc = np.full(num_chains, '.', dtype=object)

  chains = Chains(
      key=chain_keys,
      id=chain_ids,
      type=chain_types,
      auth_asym_id=auth_asym_id,
      entity_id=entity_id,
      entity_desc=entity_desc,
  )

  # Create the residues table.
  if all_residues is not None:
    residue_order = []
    for cid, residues in all_residues.items():
      residue_order.extend((cid, rname, int(rid)) for (rname, rid) in residues)
    res_chain_ids, res_names, res_ids = zip(*residue_order)
    res_chain_ids = np.array(res_chain_ids, dtype=object)
    res_ids = np.array(res_ids, dtype=np.int32)
    res_names = np.array(res_names, dtype=object)
  else:
    res_chain_ids = chain_id[res_start]
    res_ids = res_id[res_start]
    res_names = res_name[res_start]
    residue_order = list(zip(res_chain_ids, res_names, res_ids))

  if author_naming_scheme is not None and author_naming_scheme.auth_seq_id:
    auth_seq_id = _flatten_author_naming_scheme_table(
        author_naming_scheme.auth_seq_id,
        chain_ids=chain_ids,
        res_chain_ids=res_chain_ids,
        res_ids=res_ids,
        default_if_missing='.',
        table_name='auth_seq_id',
    )
  else:
    auth_seq_id = res_ids.astype(str).astype(object)

  if author_naming_scheme is not None and author_naming_scheme.insertion_code:
    insertion_code = _flatten_author_naming_scheme_table(
        author_naming_scheme.insertion_code,
        chain_ids=chain_ids,
        res_chain_ids=res_chain_ids,
        res_ids=res_ids,
        default_if_missing='?',
        table_name='insertion_code',
    )
    # Make sure insertion code of None is mapped to '.'.
    insertion_code = string_array.remap(insertion_code, {None: '?'})
  else:
    insertion_code = np.full(shape=len(res_ids), fill_value='?', dtype=object)

  res_key_by_res = {res: i for i, res in enumerate(residue_order)}
  res_keys = np.arange(len(residue_order), dtype=np.int64)
  res_chain_keys = string_array.remap(
      res_chain_ids, chain_key_by_chain_id
  ).astype(np.int64)
  residues = Residues(
      chain_key=res_chain_keys,
      key=res_keys,
      id=res_ids,
      name=res_names,
      auth_seq_id=auth_seq_id,
      insertion_code=insertion_code,
  )

  if atom_key is None:
    atom_key = np.arange(num_atoms, dtype=np.int64)

  atom_chain_keys = string_array.remap(chain_id, chain_key_by_chain_id).astype(
      np.int64
  )

  try:
    atom_res_keys = [res_key_by_res[r] for r in zip(chain_id, res_name, res_id)]
  except KeyError as e:
    missing_chain_id, missing_res_name, missing_res_id = e.args[0]
    raise ValueError(
        'Inconsistent res_name, res_id and all_residues. Could not find '
        f'residue with chain_id={missing_chain_id}, '
        f'res_name={missing_res_name}, res_id={missing_res_id} in all_residues.'
    ) from e

  atoms = Atoms(
      key=atom_key,
      chain_key=atom_chain_keys,
      res_key=np.array(atom_res_keys, dtype=np.int64),
      name=_default(atom_name, ['?'] * num_atoms, object),
      element=_default(atom_element, ['?'] * num_atoms, object),
      x=_default(atom_x, [0.0] * num_atoms, np.float32),
      y=_default(atom_y, [0.0] * num_atoms, np.float32),
      z=_default(atom_z, [0.0] * num_atoms, np.float32),
      b_factor=_default(atom_b_factor, [0.0] * num_atoms, np.float32),
      occupancy=_default(atom_occupancy, [1.0] * num_atoms, np.float32),
  )
  return atoms, residues, chains


================================================
FILE: src/alphafold3/structure/table.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Table module for atom/residue/chain tables in Structure.

Tables are intended to be lightweight collections of columns, loosely based
on a pandas dataframe, for use in the Structure class.
"""

import abc
from collections.abc import Callable, Collection, Iterable, Iterator, Mapping, Sequence
import dataclasses
import functools
import graphlib
import typing
from typing import Any, Protocol, Self, TypeAlias, TypeVar, overload

from alphafold3.cpp import string_array
import numpy as np


TableEntry: TypeAlias = str | int | float | None
FilterPredicate: TypeAlias = (
    TableEntry
    | Iterable[Any]  # Workaround for b/326384670. Tighten once fixed.
    | Callable[[Any], bool]  # Workaround for b/326384670. Tighten once fixed.
    | Callable[[np.ndarray], bool]
)


class RowLookup(Protocol):

  def get_row_by_key(
      self,
      key: int,
      column_name_map: Mapping[str, str] | None = None,
  ) -> Mapping[str, Any]:
    ...


@dataclasses.dataclass(frozen=True, kw_only=True)
class Table:
  """Parent class for structure tables.

  A table is a collection of columns of equal length, where one column is the
  key. The key uniquely identifies each row in the table.

  A table can refer to other tables by including a foreign key column, whose
  values are key values from the other table's key column. These column can have
  arbitrary names and are treated like any other integer-valued column.

  See the `Database` class in this module for utilities for handing sets of
  tables that are related via foreign keys.

  NB: This does not correspond to an mmCIF table.
  """

  key: np.ndarray

  def __post_init__(self):
    for col_name in self.columns:
      if (col_len := self.get_column(col_name).shape[-1]) != self.size:
        raise ValueError(
            f'All columns should have length {self.size} but got "{col_name}"'
            f' with length {col_len}.'
        )
      self.get_column(col_name).flags.writeable = False  # Make col immutable.
    if self.key.size and self.key.min() < 0:
      raise ValueError(
          'Key values must be non-negative. Got negative values:'
          f' {set(self.key[self.key < 0])}'
      )
    self.key.flags.writeable = False  # Make key immutable.

  def __getstate__(self) -> dict[str, Any]:
    """Returns members with cached properties removed for pickling."""
    cached_props = {
        k
        for k, v in self.__class__.__dict__.items()
        if isinstance(v, functools.cached_property)
    }
    return {k: v for k, v in self.__dict__.items() if k not in cached_props}

  @functools.cached_property
  def index_by_key(self) -> np.ndarray:
    """Mapping from key values to their index in the column arrays.

    i.e.: self.key[index_by_key[k]] == k
    """
    if not self.key.size:
      return np.array([], dtype=np.int64)
    else:
      index_by_key = np.zeros(np.max(self.key) + 1, dtype=np.int64)
      index_by_key[self.key] = np.arange(self.size)
      return index_by_key

  @functools.cached_property
  def columns(self) -> tuple[str, ...]:
    """The names of the columns in the table, including the key column."""
    return tuple(field.name for field in dataclasses.fields(self))

  @functools.cached_property
  def items(self) -> Mapping[str, np.ndarray]:
    """Returns the mapping from column names to column values."""
    return {col: getattr(self, col) for col in self.columns}

  @functools.cached_property
  def size(self) -> int:
    """The number of rows in the table."""
    return self.key.shape[-1]

  def __len__(self) -> int:
    return self.size

  def get_column(self, column_name: str) -> np.ndarray:
    """Gets a column by name."""
    # Performance optimisation: use the cached columns, instead of getattr.
    return self.items[column_name]

  def apply_array(self, arr: np.ndarray) -> Self:
    """Returns a sliced table using a key (!= index) array or a boolean mask."""
    if arr.dtype == bool and np.all(arr):
      return self  # Shortcut: No-op, so just return.

    return self.copy_and_update(**{
        column_name: self.apply_array_to_column(column_name, arr)
        for column_name in self.columns
    })

  def apply_index(self, index_arr: np.ndarray) -> Self:
    """Returns a sliced table using an index (!= key) array."""
    if index_arr.dtype == bool:
      raise ValueError('The index array must not be a boolean mask.')

    return self.copy_and_update(
        **{col: self.get_column(col)[..., index_arr] for col in self.columns}
    )

  def apply_array_to_column(
      self,
      column_name: str,
      arr: np.ndarray,
  ) -> np.ndarray:
    """Returns a sliced column array using a key array or a boolean mask."""
    if arr.dtype == bool:
      return self.get_column(column_name)[..., arr]
    else:
      return self.get_column(column_name)[..., self.index_by_key[arr]]

  def get_value_by_index(self, column_name: str, index: int) -> Any:
    return self.get_column(column_name)[index]

  def get_value_by_key(
      self,
      column_name: str,
      key: int | np.integer,
  ) -> TableEntry:
    """Gets the value of a column at the row with specified key value."""
    return self.get_value_by_index(column_name, self.index_by_key[key])

  @overload
  def __getitem__(self, key: str) -> np.ndarray:
    ...

  @overload
  def __getitem__(self, key: np.ndarray) -> 'Table':
    ...

  @overload
  def __getitem__(self, key: tuple[str, int | np.integer]) -> TableEntry:
    ...

  @overload
  def __getitem__(self, key: tuple[str, np.ndarray]) -> np.ndarray:
    ...

  def __getitem__(self, key):
    match key:
      case str():
        return self.get_column(key)
      case np.ndarray() as key_arr_or_mask:
        return self.apply_array(key_arr_or_mask)
      case str() as col, int() | np.integer() as key_val:
        return self.get_value_by_key(col, key_val)
      case str() as col, np.ndarray() as key_arr_or_mask:
        return self.apply_array_to_column(col, key_arr_or_mask)
      case _:
        if isinstance(key, tuple):
          err_msg = f'{key}, type: tuple({[type(v) for v in key]})'
        else:
          err_msg = f'{key}, type: {type(key)}'
        raise KeyError(err_msg)

  def get_row_by_key(
      self,
      key: int,
      column_name_map: Mapping[str, str] | None = None,
  ) -> dict[str, Any]:
    """Gets the row with specified key value."""
    return self.get_row_by_index(
        self.index_by_key[key], column_name_map=column_name_map
    )

  def get_row_by_index(
      self,
      index: int,
      column_name_map: Mapping[str, str] | None = None,
  ) -> dict[str, Any]:
    """Gets the row at the specified index."""
    if column_name_map is not None:
      return {
          renamed_col: self.get_value_by_index(col, index)
          for renamed_col, col in column_name_map.items()
      }
    else:
      return {col: self.get_value_by_index(col, index) for col in self.columns}

  def iterrows(
      self,
      *,
      row_keys: np.ndarray | None = None,
      column_name_map: Mapping[str, str] | None = None,
      **table_by_foreign_key_col: RowLookup,
  ) -> Iterator[Mapping[str, Any]]:
    """Yields rows from the table.

    This can be used to easily convert a table to a Pandas dataframe:

    ```py
    df = pd.DataFrame(table.iterrows())
    ```

    Args:
      row_keys: An optional array of keys of rows to yield. If None, all rows
        will be yielded.
      column_name_map: An optional mapping from desired keys in the row dicts to
        the names of the columns they correspond to.
      **table_by_foreign_key_col: An optional mapping from column names in this
        table, which are expected to be columns of foreign keys, to the table
        that the foreign keys point into. If provided, then the yielded rows
        will include data from the foreign tables at the appropriate key.
    """
    if row_keys is not None:
      row_indices = self.index_by_key[row_keys]
    else:
      row_indices = range(self.size)
    for i in row_indices:
      row = self.get_row_by_index(i, column_name_map=column_name_map)
      for key_col, table in table_by_foreign_key_col.items():
        foreign_key = self[key_col][i]
        foreign_row = table.get_row_by_key(foreign_key)
        row.update(foreign_row)
      yield row

  def with_column_names(
      self, column_name_map: Mapping[str, str]
  ) -> 'RenamedTableView':
    """Returns a view of this table with mapped column names."""
    return RenamedTableView(self, column_name_map=column_name_map)

  def make_filter_mask(
      self,
      mask: np.ndarray | None = None,
      *,
      apply_per_element: bool = False,
      **predicate_by_col: FilterPredicate,
  ) -> np.ndarray | None:
    """Returns a boolean array of rows to keep, or None if all can be kept.

    Args:
      mask: See `Table.filter`.
      apply_per_element: See `Table.filter`.
      **predicate_by_col: See `Table.filter`.

    Returns:
      Either a boolean NumPy array of length `(self.size,)` denoting which rows
      should be kept according to the input mask and predicates, or None. None
      implies there is no filtering required, and is used where possible
      instead of an all-True array to save time and space.
    """
    if mask is None:
      if not predicate_by_col:
        return None
      else:
        mask = np.ones((self.size,), dtype=bool)
    else:
      if mask.shape != (self.size,):
        raise ValueError(
            f'mask must have shape ({self.size},). Got: {mask.shape}.'
        )
      if mask.dtype != bool:
        raise ValueError(f'mask must have dtype bool. Got: {mask.dtype}.')

    for col, predicate in predicate_by_col.items():
      if self[col].ndim > 1:
        raise ValueError(
            f'Cannot filter by column {col} with more than 1 dimension.'
        )

      callable_predicates = []
      if not callable(predicate):
        if isinstance(predicate, Iterable) and not isinstance(predicate, str):
          target_vals = predicate
        else:
          target_vals = [predicate]
        for target_val in target_vals:
          callable_predicates.append(lambda x, target=target_val: x == target)
      else:
        callable_predicates.append(predicate)

      field_mask = np.zeros_like(mask)
      for callable_predicate in callable_predicates:
        if not apply_per_element:
          callable_predicate = typing.cast(
              Callable[[np.ndarray], bool], callable_predicate
          )
          predicate_result = callable_predicate(self.get_column(col))
        else:
          predicate_result = np.array(
              [callable_predicate(elem) for elem in self.get_column(col)]
          )
        np.logical_or(field_mask, predicate_result, out=field_mask)
      np.logical_and(mask, field_mask, out=mask)  # Update in-place.
    return mask

  def filter(
      self,
      mask: np.ndarray | None = None,
      *,
      apply_per_element: bool = False,
      invert: bool = False,
      **predicate_by_col: FilterPredicate,
  ) -> Self:
    """Filters the table using mask and/or predicates and returns a new table.

    Predicates can be either:
      1. A constant value, e.g. `'CA'`. In this case then only rows that match
        this value for the given column are retained.
      2. A (non-string) iterable e.g. `('A', 'B')`. In this
        case then rows are retained if they match any of the provided values for
        the given column.
      3. A boolean function e.g. `lambda b_fac: b_fac < 100.0`.
        In this case then only rows that evaluate to `True` are retained. By
        default this function's parameter is expected to be an array, unless
        `apply_per_element=True`.

    Args:
      mask: An optional boolean NumPy array with length equal to the table size.
        If provided then this will be combined with the other predicates so that
        a row is included if it is masked-in *and* matches all the predicates.
      apply_per_element: Whether apply predicates to each element in the column
        individually, or to pass the whole column array to the predicate.
      invert: If True then the returned table will contain exactly those rows
        that would be removed if this was `False`.
      **predicate_by_col: A mapping from column name to a predicate. Filtered
        columns must be 1D arrays. If multiple columns are provided as keyword
        arguments then each predicate is applied and the results are combined
        using a boolean AND operation, so an atom is only retained if it passes
        all predicates.

    Returns:
      A new table with the desired rows retained (or filtered out if
      `invert=True`).

    Raises:
      ValueError: If mask is provided and is not a bool array with shape
        `(num_atoms,)`.
    """
    filter_mask = self.make_filter_mask(
        mask, apply_per_element=apply_per_element, **predicate_by_col
    )
    if filter_mask is None:
      # No mask or predicate was specified, so we can return early.
      if not invert:
        return self
      else:
        return self[np.array((), dtype=np.int64)]
    else:
      return self[~filter_mask if invert else filter_mask]

  def _validate_keys_are_column_names(self, keys: Collection[str]) -> None:
    """Raises an error if any of the keys are not column names."""
    if mismatches := set(keys) - set(self.columns):
      raise ValueError(f'Invalid column names: {sorted(mismatches)}.')

  def copy_and_update(self, **new_column_by_column_name: np.ndarray) -> Self:
    """Returns a copy of this table with the specified changes applied.

    Args:
      **new_column_by_column_name: New values for the specified columns.

    Raises:
      ValueError: If a specified column name is not a column in this table.
    """
    self._validate_keys_are_column_names(new_column_by_column_name)
    return dataclasses.replace(self, **new_column_by_column_name)

  def copy_and_remap(
      self, **mapping_by_col: Mapping[TableEntry, TableEntry]
  ) -> Self:
    """Returns a copy of the table with the specified columns remapped.

    Args:
      **mapping_by_col: Each kwarg key should be the name of one of this table's
        columns, and each value should be a mapping. The values in the column
        will be looked up in the mapping and replaced with the result if one is
        found.

    Raises:
      ValueError: If a specified column name is not a column in this table.
    """
    self._validate_keys_are_column_names(mapping_by_col)
    if not self.size:
      return self
    remapped_cols = {}
    for column_name, mapping in mapping_by_col.items():
      col_arr = self.get_column(column_name)
      if col_arr.dtype == object:
        remapped = string_array.remap(col_arr, mapping)
      else:
        remapped = np.vectorize(lambda x: mapping.get(x, x))(col_arr)  # pylint: disable=cell-var-from-loop
      remapped_cols[column_name] = remapped
    return self.copy_and_update(**remapped_cols)


class RenamedTableView:
  """View of a table with renamed column names."""

  def __init__(self, table: Table, column_name_map: Mapping[str, str]):
    self._table = table
    self._column_name_map = column_name_map

  def get_row_by_key(
      self,
      key: int,
      column_name_map: Mapping[str, str] | None = None,
  ) -> Mapping[str, Any]:
    del column_name_map
    return self._table.get_row_by_key(
        key, column_name_map=self._column_name_map
    )


_DatabaseT = TypeVar('_DatabaseT', bound='Database')


class Database(abc.ABC):
  """Relational database base class."""

  @property
  @abc.abstractmethod
  def tables(self) -> Collection[str]:
    """The names of the tables in this database."""

  @abc.abstractmethod
  def get_table(self, table_name: str) -> Table:
    """Gets the table with the given name."""

  @property
  @abc.abstractmethod
  def foreign_keys(self) -> Mapping[str, Collection[tuple[str, str]]]:
    """Describes the relationship between keys in the database.

    Returns:
      A map from table names to pairs of `(column_name, foreign_table_name)`
      where `column_name` is a column containing foreign keys in the table named
      by the key, and the `foreign_table_name` is the name of the table that
      those foreign keys refer to.
    """

  @abc.abstractmethod
  def copy_and_update(
      self: _DatabaseT,
      **new_field_by_field_name: ...,
  ) -> _DatabaseT:
    """Returns a copy of this database with the specified changes applied."""


def table_dependency_order(db: Database) -> Iterable[str]:
  """Yields the names of the tables in the database in dependency order.

  This order guarantees that a table appears after all other tables that
  it refers to using foreign keys. Specifically A < B implies that A contains
  no column that refers to B.key as a foreign key.

  Args:
    db: The database that defines the table names and foreign keys.
  """
  connections: dict[str, set[str]] = {}
  for table_name in db.tables:
    connection_set = set()
    for _, foreign_table in db.foreign_keys.get(table_name, ()):
      connection_set.add(foreign_table)
    connections[table_name] = connection_set
  yield from graphlib.TopologicalSorter(connections).static_order()


def concat_databases(dbs: Sequence[_DatabaseT]) -> _DatabaseT:
  """Concatenates the tables across a sequence of databases.

  Args:
    dbs: A non-empty sequence of database instances of the same type.

  Returns:
    A new database containing the concatenated tables from the input databases.

  Raises:
    ValueError: If `dbs` is empty or `dbs` contains different Database
      types.
  """
  if not dbs:
    raise ValueError('Need at least one value to concatenate.')
  distinct_db_types = {type(db) for db in dbs}
  if len(distinct_db_types) > 1:
    raise ValueError(
        f'All `dbs` must be of the same type, got: {distinct_db_types}'
    )

  first_db, *other_dbs = dbs
  concatted_tables: dict[str, Table] = {}
  key_offsets: dict[str, list[int]] = {}
  for table_name in table_dependency_order(first_db):
    first_table = first_db.get_table(table_name)
    columns: dict[str, list[np.ndarray]] = {
        column_name: [first_table.get_column(column_name)]
        for column_name in first_table.columns
    }
    key_offsets[table_name] = [
        first_table.key.max() + 1 if first_table.size else 0
    ]

    for prev_index, db in enumerate(other_dbs):
      table = db.get_table(table_name)
      for col_name in table.columns:
        columns[col_name].append(table.get_column(col_name))
      key_offset = key_offsets[table_name][prev_index]
      offset_key = table.key + key_offset
      columns['key'][-1] = offset_key
      if table.size:
        key_offsets[table_name].append(offset_key.max() + 1)
      else:
        key_offsets[table_name].append(key_offsets[table_name][prev_index])
      for fkey_col_name, foreign_table_name in first_db.foreign_keys.get(
          table_name, []
      ):
        fkey_columns = columns[fkey_col_name]
        fkey_columns[-1] = (
            fkey_columns[-1] + key_offsets[foreign_table_name][prev_index]
        )

    concatted_columns = {
        column_name: np.concatenate(values, axis=-1)
        for column_name, values in columns.items()
    }
    concatted_tables[table_name] = (type(first_table))(**concatted_columns)
  return first_db.copy_and_update(**concatted_tables)


================================================
FILE: src/alphafold3/structure/test_utils.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Utilities for structure module testing."""

import dataclasses

from absl.testing import parameterized
from alphafold3 import structure
from alphafold3.common.testing import data
import numpy as np
import tree


class StructureTestCase(parameterized.TestCase):
  """Testing utilities for working with structure.Structure."""

  def assertAuthorNamingSchemeEqual(self, ans1, ans2):  # pylint: disable=invalid-name
    """Walks naming scheme, making sure all elements are equal."""
    if ans1 is None or ans2 is None:
      self.assertIsNone(ans1)
      self.assertIsNone(ans2)
      return
    flat_ans1 = dict(tree.flatten_with_path(dataclasses.asdict(ans1)))
    flat_ans2 = dict(tree.flatten_with_path(dataclasses.asdict(ans2)))
    for k, v in flat_ans1.items():
      self.assertEqual(v, flat_ans2[k], msg=str(k))
    for k, v in flat_ans2.items():
      self.assertEqual(v, flat_ans1[k], msg=str(k))

  def assertAllResiduesEqual(self, all_res1, all_res2):  # pylint: disable=invalid-name
    """Walks all residues, making sure alll elements are equal."""
    if all_res1 is None or all_res2 is None:
      self.assertIsNone(all_res1)
      self.assertIsNone(all_res2)
      return
    self.assertSameElements(all_res1.keys(), all_res2.keys())
    for chain_id, chain_res in all_res1.items():
      self.assertSequenceEqual(chain_res, all_res2[chain_id], msg=chain_id)

  def assertBioassemblyDataEqual(self, data1, data2):  # pylint: disable=invalid-name
    if data1 is None or data2 is None:
      self.assertIsNone(data1)
      self.assertIsNone(data2)
      return
    self.assertDictEqual(data1.to_mmcif_dict(), data2.to_mmcif_dict())

  def assertChemicalComponentsDataEqual(  # pylint: disable=invalid-name
      self,
      data1,
      data2,
      allow_chem_comp_data_extension,
  ):
    """Checks whether two ChemicalComponentData objects are considered equal."""
    if data1 is None or data2 is None:
      self.assertIsNone(data1)
      self.assertIsNone(data2)
      return
    if (not allow_chem_comp_data_extension) or (
        data1.chem_comp.keys() ^ data2.chem_comp.keys()
    ):
      self.assertDictEqual(data1.chem_comp, data2.chem_comp)
    else:
      mismatching_values = []
      for component_id in data1.chem_comp:
        found = data1.chem_comp[component_id]
        expected = data2.chem_comp[component_id]
        if not found.extends(expected):
          mismatching_values.append((component_id, expected, found))

      if mismatching_values:
        mismatch_err_msgs = '\n'.join(
            f'{component_id}: {expected} or its extension expected,'
            f' but {found} found.'
            for component_id, expected, found in mismatching_values
        )
        self.fail(
            f'Mismatching values for `_chem_comp` table: {mismatch_err_msgs}',
        )

  def assertBondsEqual(self, bonds1, bonds2, atom_key1, atom_key2):  # pylint: disable=invalid-name
    """Checks whether two Bonds objects are considered equal."""
    # An empty bonds table is functionally equivalent to an empty bonds table.
    # NB: this can only ever be None in structure v1.
    if bonds1 is None or not bonds1.size or bonds2 is None or not bonds2.size:
      self.assertTrue(bonds1 is None or not bonds1.size, msg=f'{bonds1=}')
      self.assertTrue(bonds2 is None or not bonds2.size, msg=f'{bonds2=}')
      return

    ptnr1_indices1, ptnr2_indices1 = bonds1.get_atom_indices(atom_key1)
    ptnr1_indices2, ptnr2_indices2 = bonds2.get_atom_indices(atom_key2)
    np.testing.assert_array_equal(ptnr1_indices1, ptnr1_indices2)
    np.testing.assert_array_equal(ptnr2_indices1, ptnr2_indices2)
    np.testing.assert_array_equal(bonds1.type, bonds2.type)
    np.testing.assert_array_equal(bonds1.role, bonds2.role)

  def assertStructuresEqual(  # pylint: disable=invalid-name
      self,
      struc1,
      struc2,
      *,
      ignore_fields=None,
      allow_chem_comp_data_extension=False,
      atol=0,
  ):
    """Checks whether two Structure objects could be considered equal.

    Args:
      struc1: First Structure object.
      struc2: Second Structure object.
      ignore_fields: Fields not taken into account during comparison.
      allow_chem_comp_data_extension: Whether to allow data of `_chem_comp`
        table to differ if `struc2` is missing some fields, but `struc1` has
        specific values for them.
      atol: Absolute tolerance for floating point comparisons (in
        np.testing.assert_allclose).
    """
    for field in sorted(structure.GLOBAL_FIELDS):
      if ignore_fields and field in ignore_fields:
        continue
      if field == 'author_naming_scheme':
        self.assertAuthorNamingSchemeEqual(struc1[field], struc2[field])
      elif field == 'all_residues':
        self.assertAllResiduesEqual(struc1[field], struc2[field])
      elif field == 'bioassembly_data':
        self.assertBioassemblyDataEqual(struc1[field], struc2[field])
      elif field == 'chemical_components_data':
        self.assertChemicalComponentsDataEqual(
            struc1[field], struc2[field], allow_chem_comp_data_extension
        )
      elif field == 'bonds':
        self.assertBondsEqual(
            struc1.bonds, struc2.bonds, struc1.atom_key, struc2.atom_key
        )
      else:
        self.assertEqual(struc1[field], struc2[field], msg=field)

    # The chain order within a structure is arbitrary so in order to
    # directly compare arrays we first align struc1 to struc2 and check that
    # the number of atoms doesn't change.
    num_atoms = struc1.num_atoms
    self.assertEqual(struc2.num_atoms, num_atoms)
    struc1 = struc1.order_and_drop_atoms_to_match(struc2)
    self.assertEqual(struc1.num_atoms, num_atoms)

    for field in sorted(structure.ARRAY_FIELDS):
      if field == 'atom_key':
        # atom_key has no external meaning, so it doesn't matter whether it
        # differs between two structures.
        continue
      if ignore_fields and field in ignore_fields:
        continue
      self.assertEqual(struc1[field] is None, struc2[field] is None, msg=field)

      if np.issubdtype(struc1[field].dtype, np.inexact):
        np.testing.assert_allclose(
            struc1[field], struc2[field], err_msg=field, atol=atol
        )
      else:
        np.testing.assert_array_equal(
            struc1[field], struc2[field], err_msg=field
        )


================================================
FILE: src/alphafold3/test_data/featurised_example.json
================================================
[
  {
    "aatype": "46551530df4e79371352989100ae6af82ccd939009517b788173bdbb323ae40a",
    "asym_id": "42c714885d17f6c0fcfebebd171b5ed7d7e77a56cf9c4983d9ff9ff90995bd1c",
    "cleaned_struc": "<<structure>>",
    "deletion_matrix": "54f980b5b3be8ce80cb6490c527e38d681deade50f239f2cb7d23cf9d0108c37",
    "deletion_mean": "655a3ef0465a9f30fddf25f4dde0c19a05c6f9069b83961800c1944165955273",
    "empty_output_struc": "<<structure>>",
    "entity_id": "42c714885d17f6c0fcfebebd171b5ed7d7e77a56cf9c4983d9ff9ff90995bd1c",
    "flat_output_layout": "<<atom-layout>>",
    "frames_mask": "e8a48532fba32c318f7d809fae3ea0999baa01376b29d94ef3c27d82f12f6a90",
    "is_dna": "1d83518b897b14e2943990eff655838246cc0207a7c95a5f3dfccc2e395f8bbf",
    "is_ligand": "cfa4e080dc2885de94224db5075c2feb0805567d31e8898abdebaebc6646ce12",
    "is_nonstandard_polymer_chain": "1d83518b897b14e2943990eff655838246cc0207a7c95a5f3dfccc2e395f8bbf",
    "is_protein": "569b0e93b5f77c1a9d430b643f29e600c7db6f44ded72b96ab1dd25351d26075",
    "is_rna": "1d83518b897b14e2943990eff655838246cc0207a7c95a5f3dfccc2e395f8bbf",
    "is_water": "1d83518b897b14e2943990eff655838246cc0207a7c95a5f3dfccc2e395f8bbf",
    "ligand_ligand_bonds": "<<None>>",
    "msa": "871c93669d8a7dd046f8ba6a1ea7b9fc52e1a2e040c8d9bdc4ae73a77f95d3f7",
    "msa_mask": "13a46a8a2c5305d2a07bb9587ad092d97749d2b2a2d10ad5d64474a4f0f4c803",
    "num_alignments": "26b25d457597a7b0463f9620f666dd10aa2c4373a505967c7c8d70922a2d6ece",
    "polymer_ligand_bonds": "<<None>>",
    "pred_dense_atom_mask": "1e388e40167a4d31291903d74c98544868d0dc574706cdfd259ddd65f56d2993",
    "profile": "6ec7da33d5f9801357ca6c82725416ef59025c7a8810bfd67fed2262845b480b",
    "queries_to_keys:gather_idxs": "e0a2fd867fbae573b5613a98ee037eeb575cc5aa3285db2fe5158cda0e8c49cd",
    "queries_to_keys:gather_mask": "7ddcbfda2904f013d9ab73c55517ac933ecb3dbfbfab9bb351ee43b5fd66e54e",
    "queries_to_keys:input_shape": "cf801b14d3da833c486e3d73e355c3c2068523012b42c2b17decc45dbd8b9972",
    "queries_to_token_atoms:gather_idxs": "3c2d0028564167c93b2f33e877974d45756c1e2e8934270c024fc5f1e85fcf14",
    "queries_to_token_atoms:gather_mask": "1e388e40167a4d31291903d74c98544868d0dc574706cdfd259ddd65f56d2993",
    "queries_to_token_atoms:input_shape": "cf801b14d3da833c486e3d73e355c3c2068523012b42c2b17decc45dbd8b9972",
    "ref_atom_name_chars": "043f3242ff4dff04fd36699ccefdff718c57c325f72c71f33f4c4774e75a64dc",
    "ref_charge": "27898ee238963105942db19f27a980c1fe4f7aeb396c1e5ea4e82da3876deef4",
    "ref_element": "cc437747adeea094daf8a0e551be02f406c7e7d9b0a9328a84a59d907c5492b5",
    "ref_mask": "1e388e40167a4d31291903d74c98544868d0dc574706cdfd259ddd65f56d2993",
    "ref_space_uid": "97afd7d9d3ba835731457ef090ba4939d707bb2a270d48fde56369bde8e58e9f",
    "residue_center_index": "dfef3704f73a7ee9a3be86b74e25ecd43e056c76574bc9bb65b6b446eeed87a7",
    "residue_index": "6bf4ea803d0fcd31446e07f6ba9e012f794ced1fe5ad60b7181f66bb92601638",
    "seq_length": "5a667734987b65ef5c4d07bf176148504bcf8378a5a1a0e23a7fa2c1121cc143",
    "seq_mask": "a795c048f28bc4307f8599dc5140fe6e971bce6a34a0349b6c18d6cbb197f75f",
    "sym_id": "5f170600b904a3464c72817993120957c1ce2eec8c2421af02d4912b5e8d8372",
    "template_aatype": "6c5c3e7a5e23f064f1e8791f61bde8fb59ccf837095144b29e6c8e1607081398",
    "template_atom_mask": "8a282b7476e13f6de5afbb52c14ea7baa3434281ed77b542bb790287e8c92e82",
    "template_atom_positions": "b032ac0c813748a81b8d50ce94487c66510a177ad25e84581c7ea5f4b524987f",
    "token_atoms_layout": "<<atom-layout>>",
    "token_atoms_to_polymer_ligand_bonds:gather_idxs": "a0ee989ed2a0a2e3626520afa4032e06144865c8c8f6357293c9f4cd2069eaf2",
    "token_atoms_to_polymer_ligand_bonds:gather_mask": "d13d4a8b3b8add19b5970157f09d00c12cbda4fed4d74d8493156523f7069b66",
    "token_atoms_to_polymer_ligand_bonds:input_shape": "6ed5c8b9711af5b9c7c3d98ba048bed4dfe5974be758f1a632abd746b8278ed2",
    "token_atoms_to_pseudo_beta:gather_idxs": "3fd8de4dd02450c6e249f33de9c6573694f7991e6a36528d6f32b6c6334a4d4f",
    "token_atoms_to_pseudo_beta:gather_mask": "a795c048f28bc4307f8599dc5140fe6e971bce6a34a0349b6c18d6cbb197f75f",
    "token_atoms_to_pseudo_beta:input_shape": "6ed5c8b9711af5b9c7c3d98ba048bed4dfe5974be758f1a632abd746b8278ed2",
    "token_atoms_to_queries:gather_idxs": "50a1708678bb3d848be6fb49816196b13fcac36891817dac585f4a7556a8310e",
    "token_atoms_to_queries:gather_mask": "3f4ac4f311cea0c7f6b8464e225815b791a767c9a8d15f9c7fb488c49f674fa9",
    "token_atoms_to_queries:input_shape": "6ed5c8b9711af5b9c7c3d98ba048bed4dfe5974be758f1a632abd746b8278ed2",
    "token_index": "77627a5d3856b90a27ae1f5bf5aa14754743c03c00a97bab68f4e7961a405454",
    "tokens_to_keys:gather_idxs": "bc16a2a2b81bdbb3fb3ff180d984704b201866a7cdc373fb345a9be417aa246e",
    "tokens_to_keys:gather_mask": "7ddcbfda2904f013d9ab73c55517ac933ecb3dbfbfab9bb351ee43b5fd66e54e",
    "tokens_to_keys:input_shape": "5545412ee9a21a04712910d53fc1447c73ff94a29ddd1268131b4ed30d1dbe07",
    "tokens_to_ligand_ligand_bonds:gather_idxs": "bac3003591bd8ef44d85b82cd4d23191d48496c1992e61d3fca2a37e6ddd34ea",
    "tokens_to_ligand_ligand_bonds:gather_mask": "4d33ec9784aaf54079b4445118c1be26b4a5555e1d6034ccc4182defd86f2068",
    "tokens_to_ligand_ligand_bonds:input_shape": "5545412ee9a21a04712910d53fc1447c73ff94a29ddd1268131b4ed30d1dbe07",
    "tokens_to_polymer_ligand_bonds:gather_idxs": "a0ee989ed2a0a2e3626520afa4032e06144865c8c8f6357293c9f4cd2069eaf2",
    "tokens_to_polymer_ligand_bonds:gather_mask": "d13d4a8b3b8add19b5970157f09d00c12cbda4fed4d74d8493156523f7069b66",
    "tokens_to_polymer_ligand_bonds:input_shape": "5545412ee9a21a04712910d53fc1447c73ff94a29ddd1268131b4ed30d1dbe07",
    "tokens_to_queries:gather_idxs": "f82b61cc7f007a744fc9186107647ff333b598642a681b046d61aef4994931e1",
    "tokens_to_queries:gather_mask": "3f4ac4f311cea0c7f6b8464e225815b791a767c9a8d15f9c7fb488c49f674fa9",
    "tokens_to_queries:input_shape": "5545412ee9a21a04712910d53fc1447c73ff94a29ddd1268131b4ed30d1dbe07"
  }
]

================================================
FILE: src/alphafold3/test_data/miniature_databases/bfd-first_non_consensus_sequences__subsampled_1000.fasta
================================================
>SRR5689334_7619591
TFRYLCRQMERRLDGRPTLVVIDEAWTKIRKQPEWLEESLRTLRKKNCAVVLATQSLSEVVESPIASVVFESCQTRLLLPNPEARTPAIRALYTQRLGLTEPQVDALASVAPKRWYMYVGGGRTRLFTLDLGPVALAFVGASGRVDVAQIDALHRR
>SRR5262249_54877602
WRLEHPAVREAEVVKRLVNGREAVTAVVVSDSGVSPAELCAHLGRTLPAWMIPRQFEFVGELPRTTSGKVDYPRLRSSPSHLVGEGGSRSESGEGYFMAGTPEAILAEIWSAVLGRPADPDAGFFDQGGDSLGVLQVVAGAHARGVTVPPELVAEGRSLRDIAAVLPTVDHSVAPGALTGSELEYDTAAVLDGWPSPSARRRPAGPAX
>SRR3546814_5789022
IVCLFYVSSCCFLFVYVFFFKQKTAYEMRISDWSSDVCSSDLTPAQIDRSFHRNTAHQVTRPAATHRRNTLAANPELLAGLRALGDFQLHATVEGRDLKLTAQGLINETDRHFAEQMLEIGRAHVX
>B9TJ46_RICCO
RGDRGDGDRLLLGDRARAAGRGDRAHLHCPADRARPCRDLPEGEDRRALDPRLAARAGRSRHHPGRPAGRAAPARFGARHGGGARLGGVLRSQPRHRAPPGAAGRADRDRLLPELVHPRPVRAAGALAAGDSGGGAMAAGRARRRAGDHVAAAAFLGLCAGGSAGAAHGRIYRLCLGSDHGLAVLPRAAYAGYHRRHLADRRGMLDGGAQSARHRRARSGARTVMIAIRTATPDDVPLILDLVRELAVYEREPDAVVATEAMLHDALFARRVAESLIAELDGRPVGFALFFHNFSTWTGKPGIYLEDLYVTPGARGAGAGKALLRHLAGIALDRDCGRFEWAVLDWNTPAIDFYRAMGAQAMAEWTVQRVTGDALVALAGR
>SRR3954452_1678131
PEAARARAAARAPAPRPPRWSLRRPGSTRRRILAGSRRVPELRELEAESLRRRLVACGVGESELDPVGAARQRPLLDAQKRQDVLALLHLQRRLAGAAEGAPAWRTAEDCRLQRAGLRRSELEDQRPTAGVTLDLAGEARCGGVGGSRRRRGDRFRRWRGCRRGGARPCAGAGAGAG
>SRR5450756_2573138
LHRVDRRQRQMCIRDRAYTAGLLLVCVSLIRLSSVRSEYSPGLEDAPVWNSDSPVGSKPGPAKFQPPRSRICQVVVASSPMIAENDRGTRLMSMPACAASAWYAATSCWKNVTPVTX
>SRR6266446_6012191
VSDLPLDSYRALKLPRCRGVGVGRGVGVGLGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGLGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGLGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGVGLGVGVGRGVGVGRGVGVGRGVGVGRGVGVGRGVGRGVGRGVGVGRGVGRGVGRGRGVGSGGLIEARIAPLFFASLSNQTSPLASCRMIACFNLX
>ERR1712048_306589
VARMTISRVALAFGCVLTCAHAADPTSPAGNVEAVCEYVSNGLENYGERLLRFPLPPSCQKYQGIGEEVLFKFGLQSQSCYQALSGPLCALQFSEYEASSTCKSTLDLFTTLIETCSNKNVMAATYSDCVSYDPNTRTISNPEAFCKSSFLRVDKGESPEGTSAGFEKKTFGQSEIMDCKRIAENFNACQIVGVGLLGYSNRFCMGKGFPAYCQKYPTVVRDGTFTRICKNLVIPYLLESNRRLGTKREINHCDGIYENYLMFLKSRKDAYSQKAEAAKESLESMKNSSEMFSSFKRVAQALSQDNDSLERDSTEVLNQFHQMSSQNMAFDAQILTEFQNLGASLAAAEQAATVIEYPEMTENAEENIKIFAKESPSIESLDQAITKSSVSVKNLEALIAQGGHVSYSQAYGFYPIELASIEELRTRIKKMSESLKPFTTTYSEEVLALEEPPQPGVDASFLNAAQTFGKLNDIYGEQMALLTKLQRYGSQTGNVFTAASRSFKX
>SRR5580765_3802522
GLGLDDAGRIADRRRSGRHRLQHHRVRADPGVVADGEAAQHLRVGADDDAAAERRMALGAAGERGAAERHPLVDGAVVTDLRGFAHDHAHAVIDEDAAADLRPRMDLDAGDETGQVRDPARHPVEAVTAPPGRLAVQDDRMQAGVTRQHLPRRPGGRIAFTDADDVFAQALEHTIFARVTRSASLSGSLFHCSGDAAQDLDLLHGERGPIGQPVQPRHQFPGRGRVEKADRCQRLLPVCDQAAHRDRIGQDAGVGPRLDRIAAQRLAPVIGEELHRLSEVERAVARIGRDREAGVAGVEVVVRQAEALRAEHERDRAAAGRQFAEDRARGEGRRAEVTRRHRRRPDPGHAVERVAESRDDAGALQHVGPSRRHQHELGKAHHLDRPRCRADVAGVAGADEDEAGRIGGHLSRPLKLRLSILQPRPGGPPPARARLQTILPMSQALHPMLNIAVKAARAAGAIINRASLDLDRLQVSAKSTNDFVTEVDHAAEAAVIDVLLGAYPGHGILAEESGSTRGAKDSDYLWIIDPLDGTTNFIHGLPTYAVSIGLSFRGQMQQAVVYDPARNDLFYATKGRGAFLNDKRLRVSKRTRMAEALIGTGFPFRQGDDLTHYLKVLEMVMKSCAGVRRPGAAALDLCYVAAGWYDGFFETGLSPWDVAAGSLIVTEAGGLVGNFTGEADFLYRREVVAGCPKVYGQLVQVLSPYSTLSGSAX
>SRR3989441_2692536
AASRDALLATQRTRKRVAVEHARRSSFLAPRVAGVDIDRLDDPDKWGKIPPLTKDELRALGTDEFYSGFCIQPPSAAVEFWRSGGATGRPLFYPRSAEDLPYCLLGFRRIWECIGVGAGDVVHDSFPLGIHPIGQMVARSAQEIGAGVVWAGAGTPPPSALQLELIATLRPTVWAGMSSYALHPANVAEAQGVDRAASGGGPVVCPAEQLPGARRAKLERAWGARVYDTFGMTEGSMMAAERDGVDGMRLWADLFLVEVVDEVTGKPVAEGQPGALVMTPLWSHTATPFLRWLSGDIVTLRWPEPDADPFSVFPVLKHAHRTSGFFKIRGVNVNHTELEDFMFRQPGVLDFRAELVTHHDREVLRLLIEVVRGADPAGLYFALLTKKADPAHEVTVLERTRADATFGFGVVFSDATLDNFIEADRPTGEAITRAFAHWDDIDIHYQGQVLTSTGHGFSGMSRQVLLDILHTRCAALGVTLRFQTDVTDLEPYRSADLVLAADGVNSLVRSQYAAHFQPHVDARGNRFVWLGTTFPFRAFTFIFKDSPHGLWRVPAYRYDARYSTFIVETTEATWRRAGLDQASEDDTVAFTERFFARELEGHRLLKNRSLWRSFPTIRNAHWHWDNVVLVGDAAHTAHFSIGSGTKLAMEDAIALAAALQRHRDVPSALDAYEEERRPQVESIQRAAQVSLEWFEQTERYHGRLEPLQFAFSLLTRSLRVTHDNLKVRDAKFVETVDRWFAAKAADQSKVPVAAQPMPPPMFTPLRLRELVLANRVVVSPMCQYSADDGTPNDWHVVNLGSRAVGGAGLVIAEMTDVSREARISPGCTGMYKPEHVTAWKRVVDFVHAHSPARIALQLAHAGRKGSTRRLWEGIDEPLAEGNWPLISASAIPYFPHSQIPKAMDRADMERVQADFVKAASMAEAAGFDMLELHMAHGYLLASFVSPLTNTRTDAYGGTLDNRLCYPLAVFDAVRAVWPAAPPISGKISATHSADGGVTPEESVEFARRLKAHGCDLVTVSTGQTVAHQHPAYGRLYQTPFSDRIRHEAGIATMTVGAVASYADVNSILAAGRADLCALARGHLYDPYWTRHAAWEQGFEVAWPDQYVSVKGFTPRLRX
>ERR1700679_3575755
ARRESGSRGRWRPEHQSATCQHRIRPRCAGAHVRRSAREAPHKVSMVSWDFLNWLEIYGSELLVKYDIGLESSGVLHRRFHPECRFELQLSWMSGSERSRQPKIMPRQIGEHWPTFQDLLSKX
>ERR1700756_3832034
KLVQLLKASSYLSSILSSSSVVSFSGSNRARRPESMDWNPIPLTSGYKASFPSPPRVHWATLFAAIAGSEGLVLWLVPQPYRDFFVNLAIAAWAIYLCLWIRKIDIRSLSLYWALASFATGFLFSWLLWIVVIFEIREELLEHYNRREPIGLRLNLVMTLLFSFVYFQYHLNKIAKEKNQQRSIELVGAGRAFLQX
>SRR6267378_1761704
LARPGAGRLGARDVRARGGTAARRASARRHRGVARRAARARPAPGGRRRRRGAPARKPAARAPARPADACALPFGPPGRRAQDLPRGSPAAGRRARHRAGPRAAAALRPDPPAGADPRDDGRRRAAGHRRRLGGGLGRHPRRAPRAGARHRRHVERRQRRAPAGARPAGGVPRADVRRPARTCGRPREGRAVHRRHPRGRPALRRAAHDLQPRLRAAAGAPLPRGPAPAPAHGGRAATADRDDALRPRARARLRRGGRAVRRRLLHLARSRARKVPTSLRGGRRARDPAPERVRRRAARAAACDPEDPRRGRPRARAGVRELRRQRGRPHRVPRGDGPRRRPSRHARRAPAAKPLPLPRLRAPRLEPACVPAPAVVGRAGRLSLVGGAAGGGPRGAGVLEEARRGAELARPRRVRVAAADTARGRVARGSRAVTTVTEAVRTPYKGLSPFDDTELDALLFFGRERETKIVVANALASRLTVLYGPSGVGKSSLLRAGVVHSMRKLTELDPIAVGYYSSWAGDPLVGIEEAARGALTETFGGDPGEAAGDLADRLDAWTAALGCE
>GraSoiStandDraft_16_1057320.scaffolds.fasta_scaffold7416948_1
MSNKYGDGGMKRDNTSLTMIDPTMIDPIGTQQMGVDTGSFQLNLAGDTPAYTPGKGVSWMKRAGMNIGEAFGGVGSKLSNMSAGSKMGIMSGVGGILQGIIGGGARRARQRDAKTEYTKQRKAYAALDARNLSENIKNPYENMENVYEDMTVNQQQAQFEAQQGAQSRANIMQNLQGAAGSSGIGALAQAMANQSQLATQRAGASIGMQESRNQALAARGADTVQQLERRGAFEAELHKVRGAEKARDLEWQKQEMALGMAMQEKAEADRARQQATNALVGGIGTIAGSVLTGGASSVLGGLVKGDNX
>SRR5450631_843885
PRQRARDRPAGPPSDRRQPRGAPHANRVRAVASPGDEPGPRADPRLSAANRPRLGLRGRAGQSADLYRSAPPQARARTKPSTLDRHRARRGLPLSSRRLARKDDIVLLQARALMKRPVVPVVLSPPRRSLIDW
>SRR5690349_11316732
DHRRADAWRRGLCRELWRYRLRAGRRHGARLARKRFDARRVDGEQGLRGAGRGAASTREQMNELLARLAALRRNKTAVNAATATVIALAMALLAMLAVDRISFFTSADRFVRDWEVAYQSTPEDQDPNILILAVNEQTMQNFPYRSPLDRGFLANLLT
>SRR4029077_5045757
XKTKDITGGLPRVAELFESRKPKEHAVIAEIDGTVSFGKDTKGKRKVLVTPDRGDAKEYLISKGKHLAVREGDKIRAGEPLMDGAANPHDILKVLGEKALAKYLVDEVQEVYRLQGVKINDKHIETIVRQMLRRIRVIDVGDTGFLVDEHVEKYLFEEENERVMGKGAKPAQGEPLLLGITKASLSTESFISASSFQETTKVLTEAAVQGKVDYLRGLKENVIMGRLIPAGTGLGAYKRLSVHVEDGGAQDLPAPPMAPAAAAAAPRTCLQLRWPLRPPRRRRFPWRSSAHGTPSACNGANVGSLRARRX
>SRR6266404_2839436
XMDRRSRAPWAHRQELRAAHTDSRAARPGPHPPPATARTHRARFAGERHEAFGVAVVATEAREAPGPDATAQELAELIGNSSGLSGRAGCHNVQSRTLVCKPQMKMSGFSKVEMSALPPGGRDRGDGDVDHGGTGALGGADAACRAAPDTTAGRRTAGAECTPGPAARSALCRRRRRGTRVAP
>SRR5262245_52145018
ESYGIFHALSGASSGGIADFMYESALLNPALDDCGAVSCDEVTVRRRVALLLKGFRGYFDFLKNDSEEAAIFEVVRRFYEEIKNRKIEALLDVGKDLKALKAVRKILKNEDIRSLINTEILELFELENVPSLPKNLRRLVNAVKEGAALGKTNI
>SRR5688500_19911985
PTPHLLTLALIARSPTALSTLPLHDALPISARVVEPDQRHTNPERQVHQLDDLFGVRRAERAAKYRKILRKDADGAAVDARMARDRKSTRLNSSHLVISYAVFCLKKKNKTSE
>SRR6266576_2342774
XMQRKNARVDPDGKLPKEFPLTSHPNGQYSKKHAQKPFYFGRIADGWRAALERFNHDWPYILADQVPPPMGTDPTTVEYVARMFLARSLKRLERGQLSGGSFVDMRVAVGIAATSLRQAKKVRHLKPSDFAELREDLSFRWEKQGEGETARWAKREQRIGVAALKRR
>SRR5438552_10607511
FLSLMCLRLLLFFSFILLPPPRSTLFPYTTLFRSVDLPDAGLPHDPRGVPLVDPPDGHHGDSTGRLRHHRRDDRHARLRRRGDRSEEHTSELQSPDHLVCRLLLEKKNRNIQKGKHE
>SRR3954454_14771217
RRGAARGHRPRARHHASDHAPHLRALLHLRRRRAGRRAGPGDRVGARGPHERPPDRPLPDRHDDLHLGAAGMTGPARRTLVAAAACAALAAGCGGGKDTHVVHTTTTRVEVLKGIGSAKGAFDPRAIYAKEAPGVVTIISLFAGGSITDLLGGGGGSGGQTGLGSSIVLDGKGDILTNAHVVTT
>SRR6185503_6756615
XMVFIDPIQAKHERLTLSQGNIKTNPNPFLIRGKARRHKHVRQCCRNRVANLSVDRAVVVIDRMTASHSSTPRKESTILLRKAACLQFPAAGNLAAYFFGLQPGFLQNLPIIERFCPGRREWNRELRE
>SRR5581483_2541413
AGPAHRRALQADAALRGLRARRSEQGRLAGSRRAGDDADEDRLRLVGGDREALDARDDRCGRRRRPAALARGRILRAARRRQARRRLRRLGHDEAPAVDPSRRDALRHQREPRPRPHRHPLPRGPLNLNAVAAARRTSNVELLWDLVFVFAVTQISSLMTGDLTWPGLGRALLVMALVWWAWSAFVWTANADDPNSGIVRAVLLLATVLIFITALALPHAFAAGAVLFAISYAIVRLLHLALYMDLWRRHLATFSAIAGFAVTVLAGMGLLVAGAFAGGLWLIGLWAVAAAIDYAGPGLLTRRRLVALQAVAVEHFAERYSLFVIICLGESVVAVGVGAAARGLDATVIAGATLMLLITIALWWAYFDRLAAAAEDGLRASTAPVLAASDAYSYIHLVLVAGIIVFAAGARIAVGRIDAPLPLAASLAFGGGIALYLLGVVAFRLRITQRLGVATVAGAAVAAVVAIAGVNAPAWVEAVVLLVVLAAVQLLERRSAWRX
>SRR5688572_11341527
AAEASVGEVTCAVREARDAAARFVGIPLTLSTRTAAIEMLQRLMARDAGRARWVCFLNSHSFNIATLDGQCREALNGAYAVFPDGCAMQVAARLCGIRIPENLPGTDLVPALLESCSGRCFLIGDRPEWIERAVCELERRFPTWSVVGFAPGYFDSEEGARRVVDRVNGAKPDLLLIGMGSPLQE
>SRR6476661_7197889
SDIRTCSKAAANSPGGASLATRLAVAGGGGGGGGLGTDAKSPGTILGGAGGSGGGPGGPGGPDAHADLGGQPGQQGNQASGGAAGANSAESPATAGQLGDGGYGGTAPSGGGGGGGGGLFGGGGGGAGTTTIVDPQKLIIATAGGGGGGGGSSGVPPGASG
>SRR5690606_8821431
XIGEDTAEMATTTKEAVVATHIFSHYTARPDERSEAEPLQRLMHYPAMRLIPILILCALSGCSLFGADFDDLDPGTFRMKADGKEMSGQATYYPERDLASQEPLVFLESDEGDFMFIRSEAFLNAISGQSVTPRASYRPLTGGVFTRRSGRVEX
>ERR1035437_2281458
IDEEYGTGPGGLSGNEDAGQMSAWLVLSMMGFYPVCPGKPEYVIGTPAFDEVQIKTGIKAKPFIIKAIHNSSKIQEFKSVTLNGLPLEGSIIQQIGRASCRERVXX
>SRR6266478_5987559
GGETAPGWSQFKFCRSSRTVIGWDHTGPRGAAARWGWTDPGAKGPPSTPKPPVYYVGCSSLNSAPQIGGAVSYRGGPIDRRRVLFRYFAMIAGLNVPTKLSNGGSRHGRRCLAEQGGRILGEGTCDQRSTTCSASSRAGAQLSQVCX
>JI10StandDraft_1071094.scaffolds.fasta_scaffold2749928_1
MILVSGLPATGKTTFSEWLSSEICIPLLSRDRVLEKYVEIAKVHCEYEEQRGNVADNIPAVFLGHSIPALLFWFFCEEIMKSSSALIIETVFTNQMKETIGNLIEKYKYQTVNVHLDASVEIKRHRINERSPNKKISLENLKKAHESEKIKDAKNFRYGNCIIYVDTTDFSMVSYKDISEQIRQFILRNVX
>SRR3989344_2742104
RSTFGPRFNIATKQDEREQGGRRFPERMIDVEKEKADRTIEISRRSAENHQNIHVGHANTKGGESVTIEWPSNNKLNRGGQHPVNIVQIQTPNFMHMFQIKHVNEHIINNDRGRNDEGKENAATSLFDLLHLFLLFFLKCPAFLLRPDQIVTQLIDELINFLKRDHRFVKLESHLLGAITSARLNHPRLLPHQLINQDRAGGAMHALNFKYEFGHCVX
>ERR1700722_7849674
STRAALTHWAQCLAFLSPPSVYQVSSNSAGRSSSNPCSMARPWSSLSRWQALRSEGAVSCDRFARSTIRVRKRIAGGHNGVFARSPRSAAIGPSPKCRTPRLRSRTARQQLIGRIRMSRFYMIGGGLLASAAIAGLHAGVAQAADDEFMKMAKDYIAQASAPVTTWDGPTTGPKAQGKKVVIYVSADQKNGGASGVGDGVPEAAKAIGWDFRILDGQGSVPARSSALTQAIALKPDGIILGTIDAAEQAPIVEQAIAAGIKVVGWHAGPGPGKIEAVPGVFTNITTDPNEVAKASGLYAVVDSGGTAGVILFTDSIYAIATAKTNAEKAAVEGCTGCKVLSIEDTPIGDLSNRMGQLTTSLLAKYGKAWTYSIGVNDLYFDFAAPSLQSAGVDPATGYPRNIAAGDGSVPAFQRIREKQYQIATVAEPLHLHGWQCIDEMNRALAGQPPSGYVAHVHLFIKANIDKDGGAQNIFDPDNDYKGHYKKIWGGMX
>GraSoiStandDraft_35_1057300.scaffolds.fasta_scaffold1321871_1
ITAQTGSFAGIVHVATEAGGLETGQKISIGREVSASHDGIWINRFNYWFTTADFRVGDATNYIQVTGSGGNFGNDTRIKMDTFTLEAGNLDINSTDETIRLGSVTDFAKDGSAKGILMGKESSGNYDFFVGKEDGNYIHWDDSDNSLKVVGTIEIGSAGSFTPDTATQNQLAALNATTGSLSSETGSLQNATASLYTSASAQYLTGSILRQDSGSMATQVTLANDGMTLNQADGTNLASYGSTIRIGKSGEGRVEITDTALDMYDGAGSPVSRVNLNSSGQLTLGKSSDNRVQITDTSFKLYEGSNERINITSTGVQILEDGNNFTEVSASGLSIHAGGQPKAYFTDKWTTLSNDARSQKENSVQIWNGGGIGIYRDANNYASMSADGMKLYQGGSHVATFGQDVYLGEVGSSKRNIFIDADAGIKIRNNTTTIAEFGEDAIIGEVGSNKRNILIDADDGISIRDNTTVKAKFDTDVILGEVGSSKRNILIDADDGISIRDNTTVKAKFDTDIVLGEVGSSKRNILIDA
>SRR5271165_1503329
APRSPGTTSSWTGCLATPPGRCSSASFARYPGRVGIEPATSPEGEEQATLAEPAASSRKLERSSGRLSDLPSGESTGSRITSVITPRETLHLQEINRTRIFTVMVVALSAFVLATLTVIGGDPMAKRVFAFALLAIASSCGWLRWELRRDEGYTVERATSVAYISIFCAFTGIWFFGVFSPAPMILPFGIAFFSVGQSQRAVFGTYITCAILQAGLMLAVLGGVLPDQGLIRSSGLAPLEQ
>SRR5258708_2540147
LQVPGHALPHAGVGAQPVEQKQRRPPVGLGRPPLQPLQTHARAFDPTLSHERIVWEAGRRNAPQWPATTGSPAPWAGAGARCRRLMARQLAAPIASATTGTSSVGRIASMNALANTSCAIRAICSATWGGRPARWPAAELLDAPTSRPLLPALLKPSMKRWRAAAGTVLGSWAAYWMAWLWRVTPSWFCSPPPVIAPPIPPP
>A0A0R1K2P3_9LACO
MLRERFDKGEKKMSLRVLLVCGTGASSSFMAVSMRKAVQQLGLDYKIQARSESELENYLDEVDVIMVGPHLSFMEEEIKKSIGGRKIKVILMNPAYYAVLDGKKALDHLQSELDYKEEDSNK
>A0A2A4RMB9_9BACT
MNPDLKVYDTQIMIDGKTENIRTGMSCKATILIEDHEDTLFVPLQAVVGKAGETVVYVVNGKTSEARVVETGLDNNAMVHIISGINAGDKVLLTPPLGDDLFSASSKPKDAQAKGKPKGERQGKPQRGSSSQGMPKGKRP
>ERR1719320_184571
QSCLTSLHTNHSYTPGITNSWIMEEALLRKKAKKLRLFTFWVENHAESSSPWLRRALARADSGGKRLLADLERFLEEVEKTGGRRDGTVLCNSEMTGGNDISLIYPWLHISSSLVTINTWVRREESRDIEAAGGSLSSYPCYGSLERHEYLRSSSLRKRKVVQGTYSIVESVVPSQEVLPAGEELCILLGFRTTDDNCVDTVEAETERSGEARTWREWTGIGTLYQNMTQEDSVEVIKVEFMESHIPDHAAVFHYLVLMFLQVTSHRGKLGVLDAVARFRVRNMSGYVTVYSNLSDVTVDDRADDCLGDNLKTLQHSKQEAKKMFFKQEIIQVEQSGRKMEEX
>SRR5215204_6862387
GIFFFFFIFFVVEKKWNFFFFFFSSRRRHTRSLCDWSSDVCSSDLRHPNSRRRRGKGGPDQSRTRSRAGCRFRALPRCHGLPHRAGSVGRRRAHGLRRCWRPTPSRLRFLLLHQASGEAAKRGMLALLEICTEVPRSSVLRSWAREERVGASFGVSPPPTKGARWTIRKGKX
>ERR1719195_1908659
RRRTRMLIGEVQIQEWRLAVPSLPTCRLVVVPQSPLADQPVPLPLAARPKRSPRRRPPNQSLTPTLTWAWDFSTKQLKKPLKLFHPNFSTPLLVCLLGSGLQNCILDDSWVEIDLFLHSLKKK
>ERR1719313_113703
RRAGVRFQRRRALPQQALLLCTLAVVAVVAPYMWESAQRGAASLEYSNAQVSSGGRSLLSAITPHEDSAPCCSTACCKASDGRTDRDSFCAKRLESNGALNLTGTCMKRSTVLKDDQWGPSVALGLRATNASSGMLYCYSHLDCPVGHECKTAVTIQTNVNCSTNSDCSADRVACLTNTLNCTEPKCEGGTLSESGVRTTCRVQSPDSWGVCRVFDVDTEPTCDVSKGGINPRDLFSCTQKRQGALILHLIGIYWMFNALAIVCDDYFVAALEELVERWGISEDVAGATFMAAGGSAPELFTSIVGVFLAQNDVGFGTIVGSAVFNVLLVIGACSVAAGKVLELTWFPLFR
>ERR1719245_442272
FSLTLRAHLPSTIAAEHTAVSPSSLRVPDSPGSPPGSNKESPSKARKASLQGAGITSKLPLKQLADFAVTLSSPDEKSGGKSFGNIAKPPTPKASSPSESTPFLPAPAPADPSMPLSPTDQLKLRRKRLVHYKSNAARNNNRSDPDSPHNQLLDLESGGGAGVGGFHQRRGSGHSLPGRLLKRTNQMKRRESQALLEQIRKRGSR
>ERR1712194_41197
HGDAPEHMAIREAVMRTNMDTVHGEMKGSDGDHVLFSPKALLESLGEMGQGISAYVVDAHKKLLVPYVVLEFVSGIPLEIAPLSLGGSLPDEIWPKLGHVCALDILLNNMDRLPLPIFPTLGNLNNIMVQDSGRRAVAIDQQVNTITDDIGLMVYLEKVRTFVRDVARLAGEDSAETDDILGHMRDSLKTRAQTELTESNARLVLQGMWETLKHIAKAWESGDLKAAIDASVLAAGESLVSGVIEKEWSFLEDGVLAPPASCDHGPYQGVVEASAAQLRVVACEISTSVRSAGAFQLGASANGSTLQGTSSARQLADLTSSFVKX
>SRR4051812_43875519
AHKKGSFDEARQLYKQSEQSARAALDLARSYPPAHFELCRVLHRQALLPGPDVDALFEGAIGACRQATTVDPDDESIVAKAGTALMSAAERDLARGREPSTIDEAQLDVEHAIALNPKRSNSYRNLCDVLLVRAESLSARGRDAGPAFAA
>A0A1V2Q3A6_9PSEU
MQTISRGSVHIEQCENCKGVFLDGGELEQIIAAERAHYAQPYRPEGFPVPPPAPTMAVPVNVGVPVDAAVPVDVGVPVDTGVPVDVGVPVDAPVPADGAVPVEGAVPVDGEQPPPATPAPAPAPTTGPPPPYQPPPGTPMPGTPAAAPPPYQPPPGTVTGPPPPVYPPGYYQPYPHRKRSFLEELLD
>ERR1043166_9773265
VFFFNGTATTEIYTLSPTRRSSDLKAVSASATSAFRLRNRQRFRAGPDSRRSEEHTSELQSRFGISYADFWLKKKQHENIFDSWWRSGDRVLNHRGSTKFSQPRSEERRVGKECRSRWSPYHX
>SRR4029434_590066
PLSHSHTHTHTHTLTLTHTHTTHTHSNTHTHTHTHIHTHTHTHSTHTHTHTHTHTHTHTYTHTHTLPTHTHSYTHTHNYPRDGLEPVSQAWFSLLRDICFADSSGWQTGKSSDSHKTHSDEREGLDMRV
>SRR5690554_368104
XMELKKKVPEVRFKGFSGEWEEKELGKLFDITSASRVHKNEWTESGIPFFRSSDVVADYKGQENIKAFISYELYKELSSKTGCVQKNDILVTGGGSIGIPYLVKNDEPLYFKDADLLWLKNGNIINGNFLYTFFSTLGFRRYVNSITHIGTISHYTVEQAKLTPFKVPVRAEQDKIGDYLLKLDQLISLHQKKYNKLTNIKKAMLEKMFPKNGADVPEIRFEGFEGKWEEKKLNQVSEIIGGGTPSTIIPEFWDGDIDWYSPTEIGDKVYAEGSVKKITALGLENSSAKILPANNTVLFTSRAGIGDMAILRKDGATNQGFQSFVIKEDNDPYFVYSKGHLIKDYALKHASGSTFLEVSGKQLGNMNFSIPIALEQSRIGTWFQHLDQLITLHQKKYNKLTNIKKAMLEKMFPKNGSDVPEIRFEGFEGKWEEKKLGDFTNFRRGSFPQPYGNKEWYDGKGAMPFVQVVDVSDNLLLVNDTKQKISKLAQIRSVFVEKGKVIVTLQGSIGRVAITQYNAYVDRTILIFEGYENKTDSRFWAYTIQKIFEIEKMKAPGGTIKTITKEALSVFIVKLPVFEEQRSIGTYFQKLDHLISLQQTQIDKLKNIKKACLEKMFVX
>ERR1700679_1367360
KLLSYILLTHLFSIWMNEAQTAINVKPGRGTQAGKNPAVRILFYRLCRLLTLPIIPVFVFDGPDCPKMKRGVNVKTGKSHWLSSPFKKFIEVFGFSWYMVSFTSCDLGFPFKYL
>SRR3954454_14908726
YRLRRTPEYPAPARRAARLQLSERPARGGGRARSRCVPDLIVAGLARGERRKGTAVRLEVDQGRAVETIEATHEHTLAFDPHQPDKLRPDRIGPHGCAQRKGPTRDAVIAGALPDEVAARQVQPVEHLQALVFRDPIERCDPGLEHLDPAGRTIRTALAWARQTIDPGRVDPADEHEPGVGRRWRLYRHLAGADLVLPDHAARLYWSTATITSEVFTTAX
>SRR5436190_15766111
XMPPATRTELNARKLFRTRCAKNTSTPPATRPINVRPVSLIRPLPMAYCMSNPMPITSTAIPILLIRFSPMNFSRSGWRSKNEGRGGGGGVRSGGGCATNGGGVLAAVTGARTTVGAGCGGTSRTGSWIASFSAVGGLKTGGVTAGGEGTGGGAALDAPSAMDDGPDRNRSASFSMLWRVLVSSRDTLPSRANRTIINTMIAIGTSASRTKYSSIQPGFWKQSTHEAAHRSGRMQDRRLAPSIFQGYLPSICTGCRIRVRQDSRGGGGPFLPPX
>SRR6266540_2703125
GRDAPERRAAARLAHARAGPQADRRAQGRAREGEDRGEAPVPARRAAVEALQARGGAEGRREDPRGARDGGGGAGGRRGGGEDRREARRRRGEARRVRRGDRKARGGAGQGRRGARGARGGGRGGRAEALLGGPALLGRGRRWARRRGGGPPRRVAPVGPPLPRAARHARLRLGRVGRAALGRRARGLGADRAAPARRGRMGEEGRGALRARLSRDPRGREGARRLEAGGAEGGGRPRRRRGCGRGRVAEPARRMGARARCAGRARREGEGGGRAAGRRDAPRLRGRRVRARRPLDRFGAPAARGGRGGPRGAGRPRRRAPGAGASTARGRSAPDAARARRGRTRREPHGRGPRRGAEGVPGALRPLVPAAAGGAGGRPRQRAGPDRRPTRPGDDPRARGPRSRLHRAQALVRRAGPRRREGDRDRGGRVRRPLGGGAALRGAAPQADREAGATPPRDDRSVVPGGGGPRRLIVAEGPRDGGRRARGREAEALAAAFLEERGYRILARNHALRRGEVDLVCETGGLLCFVEVRSRTGDAHGGPEETVDRRKARRVVLAATDWAERNGGSGRNIRFDVVAVTFGESAPRVVHFPA
>SRR3984957_4909703
TNAAIRRRRVKPRFLKVGNAVFAWGLDRRRMGRLINSYFRAAGQLDGCFDSPSFLLRRRTLYAFSLQRFYERGQVVAHEVEVRSRQLVSAVKLTSLAVGRVDRGLGRWQRKEQPTSAGVDSAKIENITKESTVGLRVVAVEEDVSASDSGNHDDSENTILKTPRIVRPGRRRAFEEFPSGGRLSNAGVFVIRRSVLELLPFTSIYRFRGIDRLIVDLFIDDFSGFVDQESCTPRRFHRNSLNVELLGQSITACYWAPPVPENRGGHSILLGKCEVREGAVHAHTQHLGVGAFQLGQILLESLHFAGSTTGESKDKKCQGDIFLSPIVLQX
>SRR5579862_538352
XMVVSYPKLTPKARNAGDLGVPYARVKGLSRQARAGIAGPVLARWRAPPWPLRLRFRLRSVVYRIWYTRWVTRMAMNAKKNRGRVDHGGSSFDSFLEQEGIREEVEVEAVAVKRVLARQLQRAMQKQQKTKQAMAKQLRTSRSQLDRLLDPGNASVTLDTIARAARALGKRLIIRVADAKAEKRAX
>SRR5262249_1788368
ALGQWPGETAQHQALTLAQLRRRRAPPPPWRRFERGDPLFQDAGIRAAVDDRPRLGDGCGGPITIAQRLQHLGLLEQAERANRRLAESAERLETAVDVVSSRGHVPAHQLGDRSGKMDLAVDALDTALASELHRLLREQGLVLPPPLLAGDE
>SRR5438270_12444290
RNEGLSPHDSQLLCTRKLRTQPLSILFFRFISRVIIAEFAFDPYICLCYKYRSATREYSRSRTLLSSSMAEHSAVNRRVVGSSPTSGAKFINDFQHLPPITSPNCLQILRFRREPPDIAPLQTQPLNHRSPAIEYRVGVRVDRAHDARLDHLHVDIACRRDAGVAX
>SRR6476620_8373323
GPLPVSSSVAADSTLPTTRFTRWWLSSSIGPFGGTPTCQNPTRPGASWTVVNGPAVSTSKADVSGEPSSTGGTGRRRPGSGATSVIGSGHLGRVVAEDDHAHRRRIEAVARVVDLRAVRDEDDHVALGPDVEVQAGRRDAVDDAERAIGADG
>G7IQB2_MEDTR
MEGEEGGGVRLSKRFNDDKGGGEVDYKTKSGTAWSHNFLNQKPWHPLSYPNQRRKWIAEQTHAQRERRTEEVAREYAQEQEFYRTTSLISKKDKEKVELMQAVSFMYVRPPGYNPESAKAAELNDEKKKEDTVNNEPTQTNPDGPSSLPPHGEKKKPRPKDVFGRALPTEEEFEVLKNAPRHETGVAARAKPFGVEIRNVKCLRCGNYGHQSGDRECPLKDAIMPNEENRLKRDDPLNAILAHTDLTEPLKWELKQKPGISPPRGGFKPDDPNQQIVAEEEDIFDEYGGFLNMGDIPDLLTNLSKKPKKSKNKKHKKQKLLHSEREASLDDGESRSKKKRVKESKKKRDYKESSSSGSFASEKVHGKSRNKHSDDFDSDRNDPSRKTKPERSLSLKDYDHPRHGRSKHGKRRHSFSSEESGPDCYNGNYKNRDRRSYSSEDPDSDRDDRGRKNIQKHKRKHGRKRHYNSDEKDSGPADYHLKQKGRDEHSYKSDDCNHQRQPEDKISSHKYSSIIHCDSQRHHVSFSHDRYRGSQKSRSEHSCSSNDSDVEKNDQSRRIKEERGSQKRREEHLYSSDDSDVVKNDRSRRICSSNDSDVEKNDQSRRIKEERGSQKRRAEHLYSSDDVVKNNRSRRIKEKHGNQKRRTEHSYSSDDSDEKNDRSRRIKEKYGSVKRRAEHSYSSDDSDVEKDNRSRRIKEKDGSVKRRAEHSYSSDDSDVEKDCRSRRIKEKHRSQKSRAERSYSSVDSDVEKDGRSRRIKEKHCGTPDGSEHAEIDVRQQNREKPSYHRSEKSYIHREKHKLRKRSKNLPHHESVVYLLYDSSAFSQAQSLQSVLEKVDVKATIFNQQDSGCRDLHGSRLALDCQDRFCLRHRPWQSGHFLLAYIRGLLEVGMLTNLPIADLHVGGLAWSVKWIE
>SRR2546423_6060734
SPVWATSCPMAACAGDPLTATDVAARAEMSMVLRRRGFISISLLAARGRAKAICPCARGAQRPGERNTSGARRLRAPVRTLLAVPSVRKPVMVRTFGELVRRWALGGAVVGAAALLGGPAAPAPAAVDRSLAR
>SRR6187399_628079
TYSVLQHQFADTLRAQKLAALTAEQPDVIATANVGCQLHLRDGAAVPVRHWLELLGYRAPQRSASMQDFPHHYRVGTRLTAAEDGVVLAADGLPDLDTAPPMEFGGKGDRWSPETLLVAAVCDCFVLGFKAIAAASRLTWTDLDVRVDGTLDRIDRKMRFTHFVVSARLTVPAGQETRAPRILEKAEEACLITNSLSAEVQLSSEVIVGX
>ERR1719375_252775
ALSMGLLGTGLRVGEDRRLRGRPSWDPENRGASAAGSTPGRPACTRRPWRGQRPRRRVRGPEPRRRPCPWTSSEASPAFALDRKRLASRASRASQASLATAAAVAPRGLLGAYQAPCPTWPLEYTGPGRPVQRPASHQFMPHPSAAAALSNYELAQRTPRGWMSTRQAAPSAPKLPGLNNGALGAACRVDIHPR
>SRR5579859_4059679
AIRTATATLLPLGQTGTIINRIHHSCPDSPWVARGTDLAHCCFDGNRISGRRMTDVITLIRVKRDNKRPLTDQEITWLFAAYAGGEVADEQMAALLMAIYLNGLDAAELRAWTGAMIDSGERLKLGGDTRAGGRPTVDKHSTGGVGDKVSLVLAPLVASCGAI
>SRR2546428_4694028
GTLGFIYGMSEPMPDLLAEHSRWAATRAQELGAQSLNATNFGETFSAGAFRDPVTGRVYNAVGSRLPGGGLQGGATARPGEFVIRGYFGHAEYQLLQWAAEKGLVPVSIGASRPHCWVCADLTLHMGGTNASPLKGVS
>ERR1719343_138255
PGGAFIFGTFCASSVRDRFSSGPKLLLYRSEGAVLSRGVFLLLGAAPRPHAASTRGVVRPRMPREFRTYSIMAMVRMPHQRGVSSGRECQGNSGHIRSWPWSACRINEGCRQAENAKGIQDIFDHGHGPHAASTRGVVRPRMPREFRTYSIMA
>ERR1039458_2685568
FFLMIRRPPRSTLFPYTTLFQSISDTNILPAVSISLFLLTACRSDIALVLRKNGAPMTYKYLFASACEELKLSVWAKGESALGYNPIFYRRDIFGAWMQYNAHGDTLTHFGWEIGYITPVEQGGTNELSNLQPVQWRNNRNRTAPQPX
>SRR5712672_4201355
HSEKSGAGGRRLFSPDARGTVRQASGRGRRRPRQGSRGLSQIARSDAADAEQPKLSRRRRAELCRLHRVRRVSVGARRQPVQAARRRRSGLCGARALARCVRGHGAKVAELSRVRISAALNLTAAVSTARFWTSRPPSFANNPDTGSRRRPTASAGGTIHRNTSTAPTGCRRTPRHNRSRRAAARVGFLTDLSSKGPLFRPAFNSGFIRDGVMIRRKSYLDDGPREARWPAIRKPPWSRSIDSDLVHAAGPRAISSTRRPIRAVLSRPS
>SRR4051812_7757704
TRPRTSPRTATRCGSACGWPIPAGCARSCWAPPDRSRSCRRTGSPRASATKLCGRLRPTPRSRVPDVTWVPIAAWGAAAFIALAVLGFCAYEIMWKARRLERDLGRLQTMTGELADLQSRLALAQQRVVAARQRX
>ERR1711998_154733
GELSIIIAISGARPRMDMSLTNCEPWLTQESRNRRELTYPFGSSVSRTGSAYFARDAVNTTTSNISATFSRKTSTPGRFATKTSWWIPSISTLIWKSKNAVGWKEECTNVSSRSSTRHFLFLNFGSGGGRRGCLLEVLX
>ERR1719424_536034
RSHHTASLHESMNGMHGPMVQTEEDEALPPIISLDDLVAQQELKEEPPSTVQYIHCGSTPEERRTCIRLMQRCLQCPVLPAPRPTLSARRALLQLVCDESGQPAADDPATLRLPEPKAAAAAALADLTAQLEQCHGDDLEDQSDRDAARRAEAVRSSSSAMATTWRIR
>SRR5947207_3404454
IPPTFKDFVGRIEGAFLHPGSRIGGIVADLSDLTTFLPLDAQYDQITVGSWVVVENLDSTGTAIRTFHQVTDVKTITLTPLDFLSRGVFVGIEGIELQQISAILTIATTITLLTLDPAWLPRERGKDRNDLFTVLRTTTIYAQSECLPLAEVPSSESTDNQSASGEPTSQSASSGATSQCIIENDTIELDRLYPDLKSGQRLIISGERADVPGVRVSELVMLAGVKQDVGQVIVEVNGVKQSIPLSNDKLHTFLQLAVPLAFRYKCGTVTIYGNVVRATHGETRSETLGSGDGTK
>SRR4051812_28246904
DYVRLHQWVARRFHVHRTVLVSVSMGAIAGLQLAAHHDVPRLAGWVGVSPVLDLTSAAASGPLSDDIHLSAAQVHGLDPTRLAPGRLRGLPMAVAISREDRVVSVPAAESFARRTGARLIACAGGHATGDCYRPGVVEKMLRX
>SRR2546428_178850
PRDSRAGPRAVRSGHRRRAREACARRIRARLLRPAARSRGLAPTPRRGAPSPARPCSPQHLWAPSMRLWAFSAGLLSLGSPPNFAQSGQFFVYYGTATGTPPDPWHSVIAGYRVSARDPNRADPSSGRILLQVKRQKGPQHFGGGFCFGSDGMLYIGNGDSA
>SRR5215472_1953996
RLCSPACRPINASFIKGPSLLVLFGIESGRGGIRTHEGLAPLAVFKTAALNHSATLPRSQRQLLTHWPSQTKVDIAAESRRRPPFAGPLFGPDLSQTSRVHHGESGRRSGVDRLSGAGPALALPDQIEARRTRPQKRKPRGSAGLVPGSAYVRTARGLGESER
>A0A2H1WYH1_SPOFR
MKLTKHLFATIINKNLQLLPRITMGCGFALIKTSIIFGAGLYTGVYVAQNYKIDKVEDPKVLFERAQTFVKDKLAEVGDKKDK
>SRR5580765_5835986
LGRGPVPHLAPAALGRGQAGLDQRLQVLDDGLAGDGEVHRQVAGRLRPVVDEPLQETPPGRVGQRVEEGVDGVDQTLASAQTESQSDSTRKSHDVAAAMAVSTEAAAVSVMTRRLPRSAGSMANTTVEAACSSSSGHQRKLTYSPSTTPS
>SRR3990170_974992
GGRHARAGPRAGASGGCAGIGDGQPDLGREFDRAGRYRSRLELVFLHGCRQREIPLVQALDFLFEMFAIAIVVDHVIRLLQTLRATHLGGHDFTDLRFGQSAARGRALNLRAFRGVHHQNTIHEIDEPGLDQQRHHEDAVGRVKYIQFFADYFADARMQDRLKPLTFAGILEYAFAQSVPVNPAMGVENILPEGADDFVEYRLPGFGQAMRDFVGIDDRYATRGKERRHRGFSAANATGKANPQHGAGAQTAIRANCRX
>SRR4030095_11228013
GTRDQRGTRQGACPSDRRLSRLPGGGVPGGRNRPQPWQVQTGRGFPPAQEGGQSRRAKLQAQSAIGSEARRRFIVPGEGIVRAAAILISVGALELTGCATARMHTEADLNSAATAFGLALGQLAQDDEEKRLLFVMEANPSAPKQVCVKNWARRNHLKAVFIDALDWVGPWGGGFAALLPLPRG
>SRR6266567_941993
ISAASGIIVRPAAAASRTADAVRSASRPAMATAAPAWASAVANAFPSPRFPPVTSAFRPCSANWSRTFMNRSLRPRTSRCASMVRMTETDLGALYGMVRVRLSGLAAEVSEPAGVPVPACPAWSVHDVVAHVVAVAEDVLSGRLTSPPTDDWTAAQVTARKDRSVADLVAEWGELAPRIEALISKGGMWAGFLDVLSHEHDIRGAIAAPAGRDAPELLLAAEFLVSRWRPDVAVTVRMGEREFSVGPADESAIGLVTSPF
>ERR1712020_113728
EPVGAGVHGSQWWKVKLGAVSSHELGSCPGSLSLLATLATILATTLIITASLKIAMNGLKEEGWPTPGAATRPTADGSGGRTLQYLSGGQADGQDLALPVSDGRGLGRGLRARHRVDDLLERNEWTRVWSSPEPQRISFFVPSPHTTLLHYCVSMFVVCYRVVVFVKTFVICVX
>SRR5262245_7284194
ESGLSLLLDVLDGARQRGISGDGFCCSRRSSTEPAVVAIPPSQAKFEIEAVAQFEMRVQALLEDDPVLGMHQFEENIAPRREAAAVVSQQLAKARREPGVSRRDVEFPDSVLCAADRTIEPQPCFVLLGDIL
>SRR5216683_8145363
REEPRLLRALVAVDVKRKVQAGPDHATSTQLTRHDHAVRSRSQHRLGPAPHPRRGRHLPRAATVPSWSEAREVAAVCDRRALRAESPVAIHPEAGRSRDWKRLACTGAAGQGRSARLEDHAPARLDVTVQQFERPGIVVRAAAIDHHLVELSQVLGSVVVNVPTSLDRYGSGSVEVAERKVAKDQLVVLGPAN
>ERR1719282_30391
KMHLGTAVEDVRCDVVRWRSVRQHHVYRCRCCPKSQEGCQAQGPSCPSSIRCHDQGCCQGSCLCCCRWKEGSRILQACCQGTQGKEACCQETKGQEASCQETKEGCQEASSX
>SRR3984957_655891
KPPARSAAHFDRAAVTLINQAIRDSDVFRLAAAEAEDRPSRAERAVSHGRKLTASEERAGVVLRHDVAVRHIHVNATDEMKPVVVVIDAVVNVDAVEMDVPALDGPDAVIGAGVEKNIPDDQILATIKQQQMRPMIAADSRRRRDAASRAAKRVALAVDGARPFDADIPGKDGVDQPNISVAERGIPAQWDGVSRPILLSVRAPQEFSAGGDVEGDIALEFDCSDDKTAGRHHDGSALIGSAGIDSSLNGRRIECLSIARGAKIADVVDARP
>SRR4029077_904125
KAARQGRRQRLRHNKMHSEAQQLYEHTVWNEEFGGNLIARFARKIPAAFRSTAIPDYQMIASALAMGDLETKGGAHNWPQRRVWERFAHHFQNSKKRPDVFAAIDAHTKRFQQDMVFCQAHAALHCRKADPPDLLWDDKLLPREIAPHL
>SRR2546429_6251402
GCGAARWRGVLAECVWRMRNSGSRSTSYCFFFFLMIRRPPRSTLFPYTTLFRSSAHRRKHEPGRNVGRHVLHAVHRKIDGRADRSEEHTSELQSRLHLVCRLLLEKKNELRLTRSCHRGTDHPHADALRPLPPRHS
>SRR5438046_2863571
STFLTSFLAQQESPAALAFSAQQADFALSQVLASPACKAGMKAKAASVKQTTSFFIMVLFRTAVNIVNTPFIPNQTVLSMDHSKRIPAVLDFVGLPRGGMLSIFVCLQQRSRFTIDIAPLRGWGAAVSLPLFRARVAAGHTDADPSDGSVKA
>ERR1719491_2917382
KWLLVTWHLLLSISISWWHLTRRHLTWRHLTWRVHAWLHLHLRILTRWELAWRSVLAWWELAWWELAWWILWICSSIMMHGFLLVVYLDDLVNATRGVTARIMRTNVLAMTRANQNANNDANTAEKDADADEAAAMTATTEVTAVS
>ERR1700736_6027844
ITESGREGRIDPVKKLLLLPVVLTTLLLAFAFIMPATAANVLRSLAPATHLNLPSVISAGSGNEVAARPAASAANPGSAAFPGGSSAPGGSSPTHQDSTSRPLITVQDRGHAVTTSGGVISGCFGVGCYGVKHHELCPNWLYPLPAVHYAPPALLAGNDAAA
>SRR6476661_8427451
EAPNGTFVSLGSNAHGPWGPLVGSQVGCHRIRSETGQTRRETGTQSQGSSRRQSTRPPGYQAPHRQALLKGTSMVQPERTALDEPRQERQVRQAGPMAPTRGWSLDFTGSRRASVVLSLVLLLTALGTSGASAAGYDPA
>SRR6266540_5744156
XMSAEPLAKAELPYTLTRGGHKPRSVRVPRSRCSLSSEGLCPSARLHNATAMSAEPLAKAELPYTLSRGPQAPLRSRASLAVLAIIRGALPLGTPPQCYGDVRRTLGEGGTPLHAHSRAPSTAPFACLARGARYHPRGFAPRHACTMLRRCRPKPWRRRNSPTRSLAGPKHRSVRVPRSRCSLSSEGLRPTARLHNATAMSAEALAKTELPCTLTRGGP
>ERR1719259_1225225
GFHLIRIDARWFKTAKNWDVNTRLLANLFACLLTQLAHLLALHCLLHLRATLRSFIRSPTNFTHSQACENVGILMSHNQAVLNHGAATLNSVHADIPSSERVHNCVTDAVGVVLVAFALSVILPRKCETRRQHEQFLX
>SRR5579871_1117583
XMPGITTLRQPARKGKSQPAKKSSSGKNTRRSPASNVRKKIKHAGQSRQPATLKQTDQPSTGGVSMKFRLNDNNPKEKAIIDALAACGEREMSRFIKRAAYQLATGRDYDTGLPLYATIPSAHERNESEIPVSSGGDIQRRMSILADLDSGLDDWDSLSAX
>JI8StandDraft_2_1071088.scaffolds.fasta_scaffold684990_1
MALTLRLVKGTELTFDELDENFTYLNANKYEANDDAQFGTLTFGTLTDGVLDVIAFTNDVTLSSQTPEQVVPTEFAITSYIAAYHAANPYSTSDLTDVSASGTYTGVLVYDGLGEYIPTVPTMSFLQDVDVSSVSDGQILAYDADSEMWTTVTTGALSNIYLAGLTDVDLTTTPPITNDLLSFNGSEWVPATPILNLDGLQDVDLTTNPPVDGESLIYDAGTWVAGTPSTVGKMEVYAAAGETISAGRAVTIGLQDTSKTVAFPIQYADPEFGQSISLGAAVGSQSHSIWCTAQEKYIIAYINDTTGDGEFRVGELDDQGIEITLDPTIHYFGENIGGEFSVSYDIATTRTVFAWRDSITNIGYARVITLAGFSVTMSEFPIDFSLSSPIGTHSVSCDTASGNVVFHYADQESLGTGVGRLAELDGLDLLFQPPIPFTTKEVYQIHTVYNSIGNRHVSVFIDELGTGWSFVTIVSGLFLTFRTPRGIWDNMTTPFVTLMKGGSECWVAYRRTNTVPAQGWITRFTNSNNGTTNTNYTGAQYTHYPFENGQDSVETPYKMSNIDPAIIGSQDTRGATIVWGREDQLGNVSLHSTLLTFSEFGGYPIVDTDDAIKASDDSNVEFLITDQLWPVLLTNKEESRMLIPLTQPGGIKAITFGTNPITNIRDWFGIADESFSSPINPQSGFPEWNTGQITILGGTSEATSFAGGIGGVLVPGTKIYIDNSRIYRGALRTSDVGSGAIGIAVAGNKVLVTGDIEPNPDVSGVPKSLNELEDVDTKSVAPQSQQFLQWNTNKQNWVPAYAEVQGEINNLSDVDTFTNYNTGIPNSHLFAWDDFNTEWVPKLINDIIAEIGVSINELNDVNILIPQDRHVLTYSSEAGQWLSQSLELTSKLEDLLDVDMDDQSYPRSTGHFLQWQGQKWVPNAPSIPPISALPDTVIGASPITGQALVWNGTTQKWVNSFISIAGNLNSLSDVDTTATAPINGQALVWNSEAAKWVPGTVSGGGSGGGNNEGSPVGPLPGGGSSEGTVETEDGDTIVIPPLEEGDSIDDAILTGQGIVDQTYSNSTIIGFTDVISGNVHPGDIVDNVALLPKPFPIILSIAEDRLSVTVSRSVSIPQGAVCAFGTPPVIQNVAGTEGIVVSPTMSPGEYDTILTQPALPEGVVPGVAVYVSSITEYPVITGISADRLSLTVSYPIQVIPGEVITFNIVIPVKTTGGEGTLVLDDQDAGPIGPMTIASFSAGGVTINFTEDRLPLVDSGMNIIAYDELGEVEYVYIYGVDGGSTDSVNITNPTRAAELLSVGQEVYFENQASKGQTNGTLIRVQSEIDDEVKIGDYVISPRLIDAPKVTSIDINLLYVTVNKNIDVLEHGDFVTFGESVDKAIEVNIRLDELKDTAIEPGLLRDGELLVWDAELEKWTTKDLQLATSLDSLTDVRIDNRDTGQILRYVDNVEFGIRMENITPSWTADDLQDFDYSTVAENSVLAGNNGQWIQKDIVETIKSVNTLELTDLSNVSVLSATSGQGLVYNGSAWTAQNFPDEIGDLLNVNAASPSTLDALIWSGSSWNSAEIPRALEDLNALNVFELDQFPVGGFTDVPIGTANTSRFVKWTGSGFITTRFNNDDGYGIGLKLENLDDVNLENPYTADFISWDPETQMWITRSVEGAVIDIGLTVLSDVDLQTVLPQSRNTLEYDEPTGQWRPTERQGLAHYVPHEDLVLGDLVALRSDGKVEKVGEVSSSESVLFTTTATPSSASDYYGKSVYVSDNYYIVGAPGFENSTTGGKIEIYDTSTNSLLQVITNPTPGLATKFGESVSISDNFFVVGAPGYNSNAGRIYIYDLPGFTLSETIENPNLSTSTLDDQFGNRVQITNDYIVVSAITEEPINLSDNNTGVVYIFNPATGNLLHSIQSPTPSITGWGQSVAVGASGYIAIGHPLNNEVRVYQAATAGLLYTLTSPNNFEGNFGNSMGISTSGRLVVGAPNSEGGKIFVYNLVTGDFNYTITNPDRNISGGADKFGNTVAISNDYIIASATDERTIGTSWGTVYIFDVNTGRFLNEFKNPTDTNINWGYSLAVTNDYTIIGAPRLTIAGVGEIHTFSSSSFLTSNADNWVGIVEEDRLVADNKDVLVTTVGSVNKFVSGLETNKNYYLDGRGFLTLTETDYGVLGKATAETELLITGNVVSAETGVSYLNDIRDVDTVSKPPANNQGLVWDSANNRWSPKTIGYSNITTFGGLSDTSVASPTPGQSIQWTGTHWALANYIPQGSFVLNELSDVNTAGLEHGDSLVYSFILDKWIPQQTGTSNVFILDDLTDVDLQEITPVSNDVLVYNLEEDKWIPGAVSRVASLDDLTDVDLQTQAPTEADVIAYNSITSKWEPQLIANITVTSLSGLDEVDITSLGNNPLEGETLVWNAIDSVFRPGSPSLDTISLGSLGDVDTTTGGNVPEAGESLFWDGSNWVPGPTGDAVAAFIGDLVDVNVISYPPKELQVLTWDSSINRWYPRNGHSGGIEDFIAEGDILQGEVVSINLNGSVSRTGQSPFQPAWYKENPTPFGTASNDFFAYSLAASTDKLLVSADREDETGEIDSGKVYVYDALGFLEATINNNNINASPANDRFGFSLAIHGNLFAISAPFEDSGLNYQTGAVYLYNRTTNAITSQIVHPGLATFGSVQSYSPNNSQFGHSISLGGERLAVGAPFDSGNIAINSGVVYIVNPSPAVGEAQFPHIITNPNETGGSYNDQFGTKVALNSTGQYLAVASKNEGPSSTKGGVYIFDISNEEIDPVQVAYIANPGLGGGFSYNFASALKWDQVYPNLLAIGSYDSDTDYPEGYDQGRVFIWDLNTLDFRTVITNPNSYNNPTTGDRFGWSVDMKEGKLLAGATYEEQGYVGGKYTNAGKAYLLDATSGQLEAIFSNPNIYGDSTNEQFGYSVAIGGQGFNDLYHVGTPYVRNTISSDFNSGAVVTFDSQITTNADAWIGIAFEDIADGEVGNVTLFGGVAKNLFGLEAGSNYYLQVDGGYTLTLSPYGIIGKALSPNTLLITGDVESNTADQVNVLNDLNDVTSVTPQVGDGLVWNGSGWVTGAVSGGVSNIGELDDVFLPVPNLLQSGQVLTWNGVAQSWVNAATGSSNVAIINDLTDVDLDTIPPLEDQVLQFDGATWRPTDLPEGQRITGVASENITEGSIVLYGNTGQFKNVEISIGAFLASIPASVPSNYALFGSVITHQGDYYAVSAPGASAQGVGSYFGVVTVYDAVTDAPVRTFYPPREGYQVIANVSNQYFGESISIYGDYLAVGAPKGTINGAVQTGIVYVFRISTGSLVYIIPCPFNQNANDNFGASVSIDDTAILIGSPGYDSPTSFNTGRAYLYDFNDLDGYSYDVEEEEWPIIPPSKIFENSNDEGTPAGDAFGSVVSITPSSVIISAPSEDTGGTLSTGRIYIRNRVTTASIATLVNPNIDSEGFGTVLAYWPEKIIVGAPGYNANQGIVYIFSATTGALLHTIQSPEAIGDRFGVSVAIGEYQIVIGSETGKEGYPDSGKIHVYSNAAPPVYYGGFDNPGYNVSPSGERMGTAVAITPAGKAIAGAPYSDLSAGSQQNPAIDRGAVHLFDVSESAISSDAGEWIGIAAGTMTQGETGEVVILGGLTPFVYSGLVPATYYYANFDGTLTTNTTDYGLVGIATNSQQLLILGSISGVATMPDLSDVDFSSGLTPSHALTWNGQFWEGKFVSTITSITELDDVSLIDTPPEDTQALVFESLSGKWKATDIGYSNVFAFNDLNDVSISNVAVGQSLSWNGSQWVPETFSQVSTLDELTDVNTNVFKTDRDILEWDGEALEWTVARNVFGNFINIEAEGSIAAGEPVYITNNSKVAQIRGTEEITGTAVFENDFFQDISLSGYGRSIDIYEDLIVAGNPEFDLPGITNTGKAFVYSASSGELLQVLYPPTSYTYQQFGNTVATNGDLVAIIAAENPYANGKGKVHIYKGTTGEYLRSIEHPDPSRTTSNGFGYHQKSIDFQGNFLLVGDKNYRDPISNASLGRAFLFNAYTGNLVHTFEHPNSSAVNSRSFGTQVAMLDDGSKILIYDVLQDGLNSATAYIYDYAYDLVSTIEVPHYNADTIAINSNYLIVASTYSGYLYIHSLLDGTLLYTSGSAYLDYGQKSLSANEKTLVVTYGSNKGFRVFDIASRILLASETTSSVGSCASLFKTRLVYSTGYQAITYNLNDISISSKAADWVGISEGAYLAGDTTTIITGSGFVSALSGLIPGANYYVAVDGTLFPGATGFGKIGRAVSETELLVSSNTSNIDLDSDSTASLIAGIGDLTDVDTFTLFPTDGQYLQYNSVTSTWSPGDVSLPSLTDISLADIENNDLLLYSEGIWSNGTLATTNLSDIDTTVAPTASQTLIWNENTSKWEAGIPERALDSLSNMGSSVSTPTTGQILVYNTIGDQWSAVDNEFSLDGLTDVNLEGVTDNQFLQYNSTSSEWEPGTVATAVSELTDVDLTGVTEGQYLVYNDQDKWVPTTIEFAAALTDLTDVNAVGATQGQGLIYDTGTNKFELAIVGTSNVDTLEDLSNVSIPTTPNNGDVLKYNGNTDTWEATPTPSPAVVYATRNSFPAIGNLGDLSFAQDTGVLYVWEGTIWYNLKRTNAFYLVRAGQFTGPLTGTQLFQPQQTITLHEIRAQVDQPSGASLIFSVMRSGAEVQQFVIPPAAPFIEAAFTAGVVVGPADEITVDIISGPGTNLSIKFIYSX
>EndMetStandDraft_2_1072991.scaffolds.fasta_scaffold3645261_1
TIQMSVTFNQPVRIYKYNNSSNNGVIAPDNTGVASATQQSYILNPISAANSGTVTFQTADVGQTTATPFVLPAGAQISNIRLYQTTAAANLAGGVITVSIIQTNPTTSANTTTAIGTITPTAAGGVITWVPTATAATATILNNIGTLDATLTFAAAXVTALTXGSLXGTFDVSYTPRNYDGSIINVGQGYTNSX
>ERR1712185_45118
LGKGCCRAGGSVLLRDCTLEGRAVAKIRLTVVEGLNQRVVLGMDVLGREGIVLDCERGAVAFRPDVSGPGLIDSPNGLTVLDDDEDAAEYEFFYVTAKDILQAGGLDDNEEDLPNQQAVSAGDSATGQPVITDARMQQIIDDHSRVFQKRESLPGRRGLYDFAIDLYDDARPERRTLYRLSTAETKALRAEVMGLLDRGWIARSHSAWSSPVLFAKNQKKDGSLRPVYDYRSINSRTVPFNGPLPRWTEILPKLRGAAVFSVFDLAKGFQQIRVRAGDEPKTAFATPWGLYHHLVMTMGSANAAAHMQSVGNAMIEGDAEALPEFPVGHPLHDLAEENLARYSLERGAARRQQRRRDGRDEIARIALDSLGSFIILYVDDIIVYSADREAHYGHVEALLERLELFDLRLNEFSRFGESSGEFLGFTISRNEVRVKESRVQSILDWPVPTSAAAVRTFLGLVNFYRDHHLSYATWAAQITPLTGKGVPWRWTAQHDRAFAQIKEGIAARIALRLPDPDRPFVLATDASLHAVGGVLLQADPDAAIPDRLEIVACFSKQCSPAEGRYSQHSLEMLALVRCITHWRWLLDGATDLVIYTDSQALVTGKLFSESQPSWASHRMARWIARIASTRADLRHHPASARLAVAVDALTRRPDYVNGTAKDMDGWIRELSELHAARKQRAQQTQSMQVMSGIAATPQGAKCMYTLVVAESPLARIKAGTLGSDDRRMQRLGCEWRDGIWTRFGRIVVPLDAALRADLIREVHDVGHPGRLATCQVLRRRYWWPRMIDDVAEFIKQCATCSHVKSGRRHGRGSHPLPLATEVWSEVQLDFIVSLPPSGPRGFTRICTVSCRRSKEVILIPCWDAMTAADFADLFLDYVWKTKGMPRVVRTDHDPLFISQLWRRFAARLGFAATQSAPYRHQQMGGVERVNQHVEQLLRTWVASQEARWSEYLPMVQFALNYTPASTLGISPFEVVQGWLPRRGFDASDDVPLATTSLDPGQRAAEVIQWVNERLMDSEIHNTRSGSTWRPGVGDRVYLSSEHLSAKTVGVASDSRLRDRWVGPYVVVGLDDNTEAVHVELPLRWQVQQPISLDRLKPCFLAGLPPVQVEVDPDTGTKYVVAEVERIVGHTCSGRGRNRVVATLTVRFAGYEADFDRVYSIDGDDAIAGLLDTSAGVVQDYLEQHGLRLPPDLQKCLTAECAFLELDPMDVPWMFSVEAV
>SRR3954468_8813130
LSQGGSGPAYGDFPPGRPLTGSVTTRAGRRLAGRLVYDLDESETTETLDAPSQGVDYTIPFGLIASIVPPGRGARRARVTLHNGEELQLERIGDLGEGNAGMLIVVDGRQRAEYVPWTDVEQVDFDRPPAMSPPAVGGVYPATGAASTLCSTASSSWRLTGLVRWARKPASRLCRMSSSMPKPVRQMPLTSSPQRARIWRMRSSPLPSGRPRSLMIRSKQGSKGGVSRWARAAATEAAVSTEXX
>A0A1Q6RLF7_9FIRM
MEGLEKAIEQIKENIPKLDLRENEPMRNHCSFKVGGAVRAFAVPGDLFEMSKVMFYLHMNGVSPLTLGKCTNVIFPEEGLDIMVISTENLRKLRLGETENTIYAEAGVSLAKLAQFARDNGLSGLEFASGIPGSVGGGVLMNAGAYGGEMKDVIESVVVYYVPTQALTEVRGSDCGFEYRRSGFEKINCAIMGAVFKLTPDDPEAIGARMKEMNEKRTASQPLDMPSAGSAFKRPVGGYAVALIDQCGLKGYTVGGAQISRKHAGFAVNTGSATYDDVVELLDHVRREVYAQTQVTLEPEIRIYPKGMLLVDDWRERKQTIIDGMLEQAKQNAADSAAESSDVRPS
>SRR5689334_5448804
SGTSAALSGTRRTIFVVDRTGNARARAALEAFKDRWNSESFGRTSLPLVGIVAGRPADGCALPAAGSETDTGDVILCLDDTLTSAGVGGPLRVDAHKHTELALVKLKSATLRWTECSLRTAVAHEMGHVMGLAHNDKGGALQPSIMMSAAGPYKYGCAVWFNA
>U2SVQ8_9FUSO
MVVISGIIEFRNVSYSKNNNMILENISFSLKKNKYNVIIGKNGSGKSTILKLIVGLEKISGGQIFIDNEELVYKRDELYKIRKKTGIVFQESNEHIIGETVAESLIFGMENNRIPLEKMKENMTKYVKLFQLENIIDKKTVNLSGGEKQKVALAGAVITEPEIILLDEVTEMWDKVTKDKMNGIIEEFLKDGKTVVSVTHNLEEIKRSDNIVFITEEGKIVTGKSEEVNKIIEKKENTEINHEVISEYSADLTKMSLKEEEIKVKIKDISYYYEKERKIIDSFSVNIPKDSITAITGKSGTGKTTLIEIISGLAFLGENFSGEIGYNFRNENKEKEDEKLLLYKNISERELYEIRKRMGIVFQNTGEQFFSGTVLEELEYNITKKYKIKNRKSKELNDKIKEIAELFGYDEKFLMKSPFVLSGGEKKMLGLALAVCLEPEILILDEPTGALDYNMTIKFMQIVEKTKKNGTTVILVTHDENIVKQYSDYILKM
>SRR5439155_21550961
GVPGTQASRLHTLHNALEDECFSAGFPREARPFHPHLTSARLRSAKGSRGLAQRHKELSFEPERFNVSEVGVFRSDLLSEGPKHTAISRHNVRRANRKSQVDAYXX
>SRR4051794_8769673
CDGARRRRLRAGRRHGRTRHGGARARGGRRAARRAARRRRRELGRPAVGQRAQPLRRRLALLVRASDRRAAATAARARAGDGGGRRGSVRDLVVGPAADRRARHLERPATGRERADEGALARARPPRHPRERGGAGPDRHRSRAVQRRRPRRAHRPPGRGREGRVGARGAARSLRGARGDGPRGRVPALRRRVVRERRGRTGGRRAGDRAAMSDFLRVAAAQLENVVGDLDGNADRILDAMRWAEEQDADVIVFPELALTGYPLADLVLRDEFVDASLDCLRRIAARSGRTAAVIGTVDRVPPRRAWDTRPRDVAISAALACDGELRGSYHKTLLPNYEVFNEARNFAPGNDPAVLWRIGTAIAGVAICEDSWSGDGPPEDQAAAGARILLIPNASPFNLEKPAGRLELVSSVARRNAAPVVYVNFVGGQDELVFDGGSLVVDADGELLYRARQFEPERFCLDVPLGRDRPLARDPRTVHARPPAPRRRMPQPEPAVQLSDDEQVWRAIVLGTRDFV
>SRR6478735_3307528
SSPVGRRSEGCVASATPNSGRYRKSGDCRTASITAARPDVKVSPLVTLFSSASSASASPAASGRRYALGTQLSTNVRAQLSWLVEVVALAAQGASLASGVACTARLAISPATSLYPETRSAETVCWAASLLKPFPSTSGGRLMAGEVVSPSNSATVLLNSLRVRRRIGAELGSNVWLVQAETCVSPALALAPPRPCVAPPFAPAKPELFGPAPEPFPAVDPRLGAPGASRFALQATPSNRHKRTVTSAGAPIAGGDLLVIGGX
>ERR1039458_4032371
PPRSTLFPYTTALPIYALFVERCTGKIAAECANEPARPAKLFVITTEFYLRPHERSLSFDHFDGHAGQVIGQPVRPGKSKGSFADGFDQRFRLEIAIDPAARRQGVTTKRPACRIACFRDPIRVKDHNVSRLERQGYLVVDFSFTDSERQIISVYQVAQARLAVKVNYPRMQAINENEIALIQVQSDITESHETFEIDQMRRQFRMGQRDDLFRLRQLAMLGQEIGRAP
>SRR2546423_9850065
IQHKRNCLIASEPRFPPCGIGNTTGKDPAIRNIAKSNPDRFRISATSVINSGECLFQRNTFAESRLAGQDEAFFGQELIKMFRYLMVSIPFTIWIVEKSIAMHAARDVRAKRDPESFPGNYHCLIX
>SRR6185437_1912756
GDRAGARKRRRSLAAHRRKAGRNAAGSLGNAPFLEEDAVLKPASCQIPSAASLRGLGAFAPAPILEQTLAARGIARLERVRRGDPVGAEMAKALPQLTPGHDDALLVEKANPERPDGALGPCALRVVINEREFAFGADRGADLREVGRGRAFGFX
>SRR5678815_2292360
STTTARVRAASSRPADVTVWTRAGASDFLPGRRRLNPSMPETIDLFVPLAELDEPLAPRVEQALGWRRGQVGELRVLRRSLDARKGRPLGQRLRVLVGREGEALGPAAARGSQRAGHDRRTGQARAAAPPRSRAADARRADAELELLFRRGRGR
>ERR550532_1119739
AAGVASQVLGVRCNLAGHCNCLEGNLLSSFGAAVMDVEDVEEDNVPEVFVLLTQEVPYQLEVDPQEEEDLHPNFLHKALVAVGPDSRMECYSDARIHHNCCYLGVHSHQDHPFACRNAHLGAVVLLGDLHNKDVGLGQEDLEGHLYYYTSYVAGVPX
>SRR5690349_19480509
KAPFPICSSSTAARASCTRRSPQRTTSACRRSRCRATRARRSSRWSASRRAASSTTGRRGWCRGGAPGALRSSPRPFAASEAESKGAALADAAEATSRGFVGELERTPERVFLPGRKDPVVLRQNSAELFLLTRLRDEAHRFAITFHRKLRRSRNFQSVLEEIPGIGAGRRKALLRTLGSLKRIKEARVEEIAAVEGFGPKAAQAVWDFFHGSAAAGDADAARAPGGLADQVDAGSGAGTGTAEALGDVTEADIDAALAEDDDAGDATAVRX
>ERR1740129_664351
VLLSSFSFGAAGRMCLLKRLVFIWHYSTLIEGVFLRGGLVEDPRQTLVTTPIESYIVASRSFSEDYNAVVVDYYMKSFGIYSSLHPSVVLRRDKLGVESGGGTEVINFDKTYGFGTKITFESDHFGRPRLACVDGYLPCLARNCLRTRVVRVLSHLSTVLKTCCGNLTNGWTTPGMLTVPAAFMTLHAEAERVYNPWAFQGVTNCSEAIEALNMASHKFRRSSELAGAAVHAALLHYHSDAAGHTPGATAPIPRKVVFHRYIGSHRSTILLSLLEGMSKLMESPQESLNAVEIGVYTAYTSAFILENLWQLRVWSVDPYRVERPKNRGIGSWQNVYDVDIFGQVRQLLSRYGHRSTLWRLTSKEAAQRFNDTLDLVFIDGDHSYEAVREDINLWEPFVRLGGIVAGHDYHTDSVIQAVHGHLDGTNTVLHIAPDFMWWYIVGSSGSCEVGSERPARDHTQPLRFPSX
>SRR6202011_3201054
XVRVVGGFGNDGCLLALAQYLDRELRPESCELRLDVADREALADAMSIITRCCASNYTAVSIEKRLVAERIGVRDAMYFERDEPVRHAGSQLLLELCLADEVALVHAHEAVETGLERRVVRRHVATPHX
>ERR1700756_1693894
HQTSGPREFTRLIDRRYLVSECKHRKPLRLAVEKWIGAYDEDAGFQLGKTSERSLDLGFRTCPQNMKLKSARERRRLHIFHDDVGTGVGRVDKQRNEGCGRHHFMSQLQ
>SRR3712207_7425182
LKERHTGGKEKREVTIVFFSSRRRHTRYWRDWSSDVCSSDLQELLGRGRLVGREAHARGELEVERRGHRDQDGAGAVGRLHLAGSEERRVGKEGRSRWSPYHLKKYIDTLAHAVTHSTISTTIS
>ERR1719174_1663456
PDLLFRSAGRVSSVEPIDLAGNAAAVEAVARARSYRGELIVLAATASHWPYAINAVSELALLGMEHYVFIAPSRTDCDVLRARRPGLACVFSTLVSNTTMAQEKSFTVWTTRKRYVGRWAALGLGVLQADLDVIWYANPYPALKGALRNVSLVHLQEGKCNEGRANGGMLYAQSACDGSMAHWVLREVYERVRRNEDDPRILETHYPGLFSD
>SRR6185312_1149132
XMNWNSPRADEVLAAAFGLKLDSIFAVASRYSKLAPVVDAACLIEPAILARTGSTPAAIVAFDVSTAMSLVPCPSRTSRGRSGAGNQRPYAAETAAIIVNDRLRAPPLRLGFVIAGDLVDLFRGHLAGDVAHLLADVVAAGAGRERLQLRLDVDSRLTAKPGTTGLVVDVAMAGAARCDVAHRRPRRDDRRCRHRRIELVRWHARQIG
>A0A1V9EVA1_9BACT
MATIEFLDQLLSDNKAREAKKLALIMDPAKKPFHILSFIGINEVYFIYKAFVEGDFKAARQHLYNMGMTNAWYYEKINGEIFDVLATFTYPLLSDSSFLIERYLTYTRMDSPGSFAACFGKAIQNVLKNDIDGLSLNIEGLKKRSGQGWEKNYNGVIPVFEGFIDNDKAKIEEGLMSLLAKHNKQNQPPVLKDFMNLEATALAKLAWRKGISVDVKSHLIPIVLLPVQEPDQYSGYEFFNEVS
>SRR6478735_9024146
TARPPRTCRRASGRRPAPARPTGRRASPRGSASSGAPPTRTRPPGPSRPGARSRRHGPSPPSPHGTRRVPRPRPVRCWACSPSSVGRGGALGVGDRGAAIGDRPLLPASGPPLGLEDAHVDLIPPSAVAPDRLPRAALVDEADPLVGPDGALVEGEHGQGDAMEAERAQGVVHHQRGRLAAVAPAPGVALADG
>ERR1017187_5434680
XMLVFKTTSTANQPVGATSAYHILFRILIISGSRAKSQPFPVPNGSCSGQSRKWVQGRGLLRKKRFSRGLTHGLRSSYVRLLLSKFWPRCSFDDTPFQRKRSEVQERIDAREILFEGDRGCGRGIVLVAIGCAKLQPLRHEILGANPALPNIVYAAYSGVLIMLVGATSIDQELLPVNLLVDLKICAGRGDGGX
>SRR2546423_1398384
DGITEVARRSLQCWLYRTIALERACPQFWNSVVSWFFSVTYNADRSITYTPGFLTALRQLLRQPRPEVVTASSLPNARLSDFAEVMSWLGTAFPFPAGAAAVAHAGFEDAGFEAALAMTRSALAGMRQAPYVPPTTYTAAPPPGATGTLLPPAPL
>SRR5699024_12166037
SLLPSDTVTLYLHSFPTRRSSDLRIIKRHSTFHLLFQILPGIVLRLQLLPATAWFSCFLHFTHAAPAAVHPGRGRKSSSCRCNQDRKSTRLNSSHVSISYAVFCLKX
>SRR6266536_896491
GTMSHDERACEHEWRRWVDKDGIAHRECWRCATYYAWPVNGEPRAGVAKGTVYYNFASKAALFEEVHTQSDYIQRYRLTKLAIVGSRHLTTQQADLVHVIIDAVLDDYPDDAVICSGGAPGVDTMAITRAHQAGRTTRLFLPHHQRWEPDGYKARNMLIASWCDDLVAIMATDSKTFGSGWTANYAESLGKNVRRLYVX
>SRR4051794_24080993
LARLARRTRWSSTASCAASGCALRPPARRSSSPSTRSPARNAACPIGAFGVLTQDEARREARAILGAAAKGGDPYIDRKQKAAAGCQAKAEAEFTFSRMVEAWAAAREGDRRASYLREAVSCLRRNLPGWW
>ERR1719310_114900
SARYVGRSQAAWQAASQRMGGLDAPPRKTAWSSSPDGLKSPRLDSRNASMQPPSGDIRGRRPSHLGLAHEVKERRPLFDALDTEKIKQQARESLQGRPAYNVFEFYHETGVFQFVAKHPLFENITLGVISLNAVYMAIDTDYNKSDTLLQAHPFFIACENMFCLYFFGEWFIRFMAFKNKCNG
>ERR1719193_2294297
LYCCLLRRGLLLFGPFLYFLVPGVLLRIHVLLVVLLRTGLGALLPIRVGRRGRGDVRRGGAAGPAARGDAADDPPHPRLEVPLDQGTEIDLVCEVIARDEPDVQRRVPLKLAPIFLHVYACAPFVAVPAQLLAVHLVVQVILPLARRLLRARRLPGRRLLLFGEQAVLPAVLDEGGAELPPSVAR
>ERR1719433_1424020
ASAICILATGRASFLNFLRQNPRKSLTSLIHRNFYEFEMAEKTIQFKAKKEIFDKAAARLACSDCKVVPRDVPIFQTGQGDVLCSICKPNSKLTGIFRSSVLEDLLMSLPISCKFQKNECPVVLQDRENLSYHEEDCEHRDVLCPYGFCKERIPAIQFKNHFLEKHEIDLEEYMKAVTKMTENGMYKVK
>ERR1700730_4647339
XMISACRQWVRLSPRIPLFQQNPLWFESEDFARFSFAPLPRASPDHFAGAPRGLDRLAKIGQKALLPLFVVSHPPASRALHPCRLPCASALPVSAPLEPRLLRCSAGRPRRCDAGPAGNSRLPEFRPAKGRSSGGSI
>SRR5947209_14544591
VGNKVRPRSSDAQVVRLAQADVIDRNDGDGMCRQLPAARPGRDDVLRETNPLREVARECKLRLSRAVDAPVTSVANRDEIPNVSRLGLIEPDGNDVVGVKAAAGFAAPDAREPVLLVNDGCMFRRPAADVLPVGAEATTPEV
>SRR6267378_108524
XMPPSLTSALRRASSGPMPDRRLSSMCNWRWLSISCASSRSRRSLPNIPANRNNQPRSVLIGTPAETSSSRLLVAQRHHRIHTHCATRRDVASRERNECEQDCDTRECRGVRRFHLEKQTGHKASQRKRSCNPGGDAEERDSRSISHNEPQHVALLRTQCCPYADLMRSLVHGISHRAERSEEPEKQHVEAFLRKRHSDELVH
>A0A1E5NXB1_9ACTN
MAERVILVDDLDGKSTEGVERVEFSWQGKDYEVDLSSAHIERYSDLLDPLLKAARLRQVTGRKTGRTAAGKSKADAAETKRIRDWGKTSGLDVPDRGPVPKEVRDAYAAAQASGEAAVPSQAQPGAPVSASQG
>ERR1719507_515787
FFLRFVCNVFIPLSLASHIRNFWQRKKGKKAIKKGPNLWGRFQVLVVEVEAESLGVVILDDLGEEVDVACELAYVVRVRLNEVLLEEVRDRRIVARLEAGLGRNNVLVHRVLVEADRLLGRLLHHVQRRAQGVQLSKLLGDLSIFNLEAVSYRSAPLDNVLHERQPIIPHLVRVPAEVSVDAHAVDLVGVEDASHEEEAEAISEVMAHQLVQVVRVSLEVAVDGVAGTAVVLPLGPDFVITTVLDVVGAGVLPVAVGRGSRSRQYEGGGX
>ERR1740120_427324
RTTISLKRPRAWCRCRRRRRRLIRLCIVDRCHDPGVRLLGSGEDIAHWRSEGSAPGGRRAHFEADAQSADFVGVIHGGARCRVEHLGCSPLGVCDTIDLPHGGLHERADLTVLSSARIVCCGVGISRNDQLSEGMDVNVHSARCLIQSAMREVDGITYTEGAAAQVLYTASGTTMDYADKIGALGICFEMRPASSGGGAFAPPVSDILPGSLESYAGVMAAIDYAKNPPPPTPAPPPSANCPWFCSIICMSPDCDGCP
>SRR5512145_1624320
PGGGARGGSIGSVLVSPRSAGRQPRSPAPPGPRGRGAAELRAARRARVGGRSGSGSRAAKAGGERRLRQRPNKALQLASASGACSDTPPVRLTPPGGLGRLAAHFGGVSYRSAALAAERLV
>A0A0H4L3H5_9RHOB
MTAIIATPAALTTDLTEELAALIDAALEIRDLTAPLSFVDFFDGDEGDEENEGNEGDEDDEDNEGDEFDEGDENDEGDEDNEGNEGDEQNEPDGGDEADEGNEGNEGDEGNEDNEGNEADEGNEGDEGEEGNEDDEGNEGDEGNEADEGDEGNEGDEGNEDDEGNEGNEPDGNNEGNEGDEGNEGDEGNEDDEGNETSASGDEGDEADEDNEGNEADEGNEGNEGNEGNEGNEGDEDDEGNEGDEANEGNEGDEGNEGNEGDEGNEDNEGNEGDEGNESEGDEGDEGNEQDERDEGDEADEGDEGDEADEDDEGNEDNEGNEGDEDFNEGDESNEGDEGDEADEDNEGNEGNEGNEGDEGDEGDEPGVDPQDEGDEENEGDEGDEDDEGDEGDGTDTFDDEGDEGNEDDEDDEADEANEGNEHGTNPDDDDNEGNEGDEGNENVPGQEDNEGDEGDESNEDNEDDEGNEDDEADENDEGDEGDENDEGDEANEDDENDEGDEGDENDEFNEGNEDNENDENDENDEGDEGNEGDEDDENNEGNEALPDTGNENDENDEGDEGNEGDELDEHDEDDEGDENDEDDENDEGDEGQEGDEGDEGDEDNEFDENDENDEGDEANEGDEYDEGDEGDEANEGDEGDEGDEPVAGTGDEGDEGNEGDEIDPDIDNSGDEADEGDEGDEADEGDEADEHDENDEGDEEDEGDEGNEDDESDEDDEGDEDNEGDEADEDDEGDEHDEENEGDEADENNEGDEGNEGDESDENDEADEGDENNEGDENDESDEGDEGGINNEGDEGDEDNENDENDENDEDDEANEDDEGDEFDEGDEENEGDENDEEDENNEGDEGNEDFEGDEGDEGQEGNEGDEDDEDNEGDEDDENNEGDEGNEGDEGDEGDEADEADEENEGDEGDENDELNEEDSDDEGDEANEGNENDEGDEGDEGNEADSQADNNEGDEGDENNEGNEGDENDEDDEGNEHDEDDEGDEGDEGNEPV
>SRR3954447_5641343
VHVERLQVGLLPVGVARRRRAHAVALEQVLVALRVAEALVDLLELDGVLAPVGRPGNRAVRVHVRAGPVVVADVPDLRALVGRAEVLDVEREDAVLPALHQVGLDEAVLALAGARVAGALEADARRVAAGHPQPVQEPALVGLRIGDGRIRLRVDQLGDVVVVVLRARVLDPLALLRVEVTVVAGAGATEGEGRALEDARAVRRDAEDAGAAVRLVRLPPAVHRVRARLPGGDRARVRDRRARARQVDRAARVAAAGTELVAVPRVHLRERAAEVRGARRS
>ERR1700712_4604191
DVSIIAHGNQGEIELGSTIVTEATLNANAAALRTIGHALAPGADILLYGCDTGEGSAGQQFVDTLAAATGATVAAASHLVGDVAAGDGWNLDVTSPGAAVAAPQVLSAAALNSYDHPLVINSPPTGLPISVTTFTGNTSFVETGTAVTTTSSGYLQLTNTSTNQAGIAVYSQAFPSTAAVSVQFTYYSGGGTGADGLSFFLLNADTIT
>ERR1719161_2539103
LVQTDPRVACSVFGPTLVQRGLGAKRPALPRLEARMRFGFLCIAWVLEFRLQGSSALDHQGVLRSWSPSTANRNMALSAERVQLRAEESCPPGVPCSCNCHCNPGRYPPPPPPPMPYPPPPPTPPGGWPGVPYPPPPPQENPEPPPPLPLPWDAPPPPKMPPLFGIGSYKGAPKIVALRNNAGPIKAPPGFGVPPKPPWETPAPPPPPLIMPRAMTDAPPYSKPPPFTTTLPPTTTTVDAWWLRTTFPWWHYTTKEYEWTTTTEAPTTTTTAAPTTTTTPAPTTPPPTTTTTPAPTTTTAAPTTTTMPTTTTPAPTTTTPAPTTTTPVPTTTTPAPTTTTPAPTATTPAPTTTPAPTTTTSAPTTTGPAVVLAQAGMKWNAQKGKLQLHAGPDDLNPNKGGWGGGQSGDEYKLGDAYHARAAEYLGYGSRKAPNPAEEYAIPQFQEEQSAECKSICPPCEAX
>SRR4029453_7064880
XGGALSTQTSPPAARRRVRGWRRSNRRNGVSFGPPTLRTDQPGNLAPALTMGRFGRSLLPMKRHLFGIAAGVPLACAMAGLVSVSSSAQAPAAAPDVTFTKHIAPILQRSCQRCHRPDGGAPMPLITYEQVRPWARSIKTRTGLGPHAGVMPPWFVEKNIGIQGFKQDPSLSEAEIAMVAKWVDSGAPRGNAADMPKPLDFENADKWQLGEPDLIVRSPDVVVPASGPDRWGSLGMVPTGLKEDRYVSSVEVREVNDIPVGGAKGTVGGRYV
>ERR1719342_652718
TRQRYAHTLRNIILHSTPTLYPILHLDASSAWYDLKELNAISGEPIFQVMMIQVKKIQILKRRPLPLLLTMLVMMLSTTPRTRLWRKVQVTMKIMRRRIQSIRRRKSSRSIFDRLCPASQRYPFQRLNDVLLHLNSKHSGRGGGLSNVVFPGNKNDLTGLGLATCKHCGFIVYGLGQTLYKHHEKKHSGVGCMKFNVFCRLCQISSKSMVTPFEDVRALQVHISEAHTNIFDLLPEKX
>SRR5450756_449411
TNYSVPWTVTQAVGTYTLWVRYCSSAGKVIRSDASDAALGITPFPTPSPPNLPAGPFNVMDYGAKADGVTDDSPFIQAAVNACYSAGGGTVYMPAGTYRLNYADSSWAPPGIHGSRNNDCSCLLYTSDAADDLLCVDLGGRRIIKNKK
>SRR5258708_35312273
GEEGPGRIELKADPESGAEGDDEEAQRGRGREEVEGSVSDGPDHSRSGQRHDDAEADDPEPLTGDFGDDLLPLMSSDARVEEGQDAADDSGERDEGSGDQEAPATKVFSFDPLIDGQADHGREGRLDRHEGVVTFVRRELNEKAPEERPATQEAPGRAVGGIAEPARQPHNPRHEWQHGTPLPEPITITHL
>SRR3984957_2613687
PRVVSRIESLAFPAKLEQPLGDSPLISRIQVDGPPPLRGPAYDLDWEGLGIVHETTIAFETGLGGNFDRRFVRPPHPGRGYIGEFPLTHVHVVRSCDEISELCRAEGRLVSRFPARAQDRVSRSGRPRRRQACGRSSRQX
>SRR6266536_1781336
DAGDVLVTQRRESRRSSSGAEVPSHGTKDPCRVRMAAEEAGGTARVTTRHPWEAAMSPTVSDHPSIRGALDRAEALAARRRAYAPEVVALLANAEFAGRVADLAGSLGRPAAEVRGEVAGYLREMGETRTRRATSDWARFS
>SoimicMinimDraft_7_1059735.scaffolds.fasta_scaffold44147_1
LPKHAHMQLFGFFLSQKATKVRCRFIQLMHSAAEEAERIYRFEMGLLSKEFFPVTISKLGRYKARLFVCTFICIAYTKYTTKHKIKKDDNDSYEMLQISSEIAYTPFSMPATEDFIDKKQKEEAAGLMYKIISSINIELSNRPSPIVGESTKGLENLFTIYEGIFVESIGQKNYNSEIKERLKVRIFSHIWSGFNTMIKISQSRSISQVLFKNELGLPRLSSPX
>SRR3954453_3871201
LGVPLWLDRRGKYRGEEAVGQVLAGVLAGDAHRVEQAAVAAIGGELDRLDPALNSRQALEAVVPLGVDVDDRARALQEGLPGEELQGDRLAGPEAAGEQAGWWTGALAGLGEVEEDRRTAAAEGVPYIWTDLRSGVTDRVRDHRPDLVGQQVLGVLGQREPGGGKGGEEEAVLLAAGTMQLGAPVGL
>J3L6R9_ORYBR
MQRLLVKKNAARIAETPRVVWVNRFSCLRSSMASRAPIAIQDENLPIFRGIGGKKAGAAAAARAVGRQERKALGDLSKARKAPPASAGGGPPAAAAAAASGSKNLVKPSYLSDEEWMKCCEWAKDGIEAASFTGNDMQKLLSDKREERIRKKVEKAMRTMKLSMDNLYDIDVHSEACMVDPEDKTKLDLDTEFLPPKPYLSSRLGEHEANYVLSDMEFEHETFANCNLDLKLKDEYGT
>SRR3990172_7523137
XMQFVAIDMETANADMASICQIGLVKCENGILSHEWKTYVDPENYFDVINVSIHGIDEKVVEGAPTFPELADTLHSYLDGTVVVCHTHFDRVAMHQAARRYGVSTPECTWLDSARVARRTWKEFAWRGYGLSSVCQRLGYEFKHHDALEDAKAAAQILLAASNETGLDLDGWLRRVRQPIDPTAGSSDSAIRRKGNPEGPFYGEVLVFTGALEIPRRKAADLAAAIGCQVASGVTKNTTMLVVGDQDIKRLAGHEKSSKHRKAEELIEKGTPIRIVKESDFEELARVSNELQANARWTTLRSRSVLAAAGTSLHTGVWMEKKGLLQYYGLDTWWQSVLTPAERERVESLFHPLCSPHAQPLTDGVVGQIIGATSTPVSFLSELVGWLHSTPEDLAIRRKIRDKMTELVSTEPNVISRHFSLQVLLSEYYRDRDVDPSALAAAINACRQQIAIAPAVAIVMRTDFPGGLPGHVGYQQLAIILEKEKSYTDAIGVCEEAKGAGWGGEWDKRIARCTACRDKATAS
>SRR5260370_27521811
ALVDFEVDDLRGLMPDVQPRDEARLLVEEELLDLVLRLAQERCHLYREVTAECVLEREVVVVRHLRTDGMSRRRRETERPETNQTGDVVRLEEIVLLEGGVWRLGVPAVARPHNRARIQAVRQSDARLPFGIGEDLTRHIEDRGRRVYCVERIIEKRPSSRVCRIGADELVIVESHAEVDVEAIGRLPDVRDRAGPELRPPRLX
>ERR1719507_1551978
ATKGELHMCRKGCIACFIPQGDTDSCQNSRVLMQPEFSGALRIGEPQMSMQFFQDESCPNWFDKLDSKIAQQDVFVGDCFKARELVKNQKYAFIKEASEGKPMTLWACAAADCRTNSCEETTVAVESCATSHYVGIPDNAWYKKLRFMRYQPTEAMHVWDDPYCRERVGLIRQTMGLVQQAVDRVAAFKHLEPSCSFGTAVQDEIVEKKFAEFRGHVTDLRPQYPKRGVLWX
>SRR5690349_24626955
RPTLFPYTTLFRSLAGKKTVDLARRDVQRAKQNGHRRGEVFAVPRASDEKKIRQRIRTRLATEVQRVAVAAAQKTFHGGRFVVRSASACGDLRGQVRNARVERIGKLEILSAHLVGIIGRGSAQLGD
>SRR5687768_17364510
DKAVSTYDYFASYYTNVAMTFDQRYTLSLSGRLDQSNLFGAKTNRKIIPLYSAGIKWDISEEPFYNKAWPFITARVTYGLSGNLNKSTTAYTTSIATLVNDNTILSVITPANPYLQWERSAMWNYSIGLTDQGGHFQLNFEYYHRRSTLLTGPGDQDATLGMTSLWGNNAALKSR
>SRR5262245_62041426
IANLARVGILAVTQIDVLHLIAMRVDHPLQLPAEDALMIVYTGVVRLAKEIADAIGRLPLPAAALAPFEAHEAALILKAVAAIVERHELFPTAIDKGILRIHIRRQTILGPPLDKWYAQLPAHSPGAVAIAAVIVKRNLRLKLX
>SRR5690554_5011345
LKVSTMDCVAPRLPSGETVTVGGVLPPPPPPPPPPPPPPPPPPPPPPPPPPPPELPPQAASEMANITATRMRMAPPENGFEIFNIVRLHGESYETKPVEMTVNTPSTAGNPRKHLPWFARCSVIRKPYNGPCKKTLKGCESEVVKTRGITRCCNRETKRLSDVDVEHDEFLEVQTAFAQGAHEILFICHTAEIYRGDLDEQRLGDLEQSRAAFAERLREEDAPLGLQQCADVSKRFLGFGKQHEARGKVHCIIRSADMIVDGFQRERDVVMQACLGDAFAGALHVFIIDVYAADVKLLVTDQRRVVRERTGGADTDIEQVRAVGEARQHLRIPARRQWAEQRVVNQASDHGRRFPVGGKVFVWTMRDRIKAERKGTQCVPGQFIVSTGSADRSAPFSRR
>SRR6185295_1157811
XSRVGRVEPRREHLLAAAAVWLWAIAAPAAAGASGAAGNDVQRYIQAAAKLYESLDYDQALEQLAHAKALAVRADDGVEISLYEGIIYADMSGHRDQSQAAFRAALLLRPDARLPVKVSPKVEKEFEQLRKQVTQEQAKEQKEQAKRKVASKPPSPAASDRPVAGAPPTPPSLVPLEPSGRGPAPSSGFSAFGVRVPLX
>SRR6266480_734243
DPGFELEAARLDKLGPETDRLFFGASRPITDGGDLQVRRRGKAAAGDVRRTIARRQAGGRVQLVDRRRILEVDLVYARDPEVAAAVIAAGGGRRLVGAEESRPRDRDGRSDRFFARAQRQHPALGAEEIALRSEQLRAARRTKGHVLQAVVGRVEQIRLGNRGYRADVRRIDIGELAVLEHVIAVGDGRIERVLPVAX
>SRR4051794_34720228
SIERKSEGCTLPVAGWNNLQPSTCNPQRTVQFYFFLAGAAALAAGAAEVLAPAAGAAALAPAAPFAPAAGAAAAPAAGAAPGAPGTAPSAVSSFSAFASAILRCATFGRPSGLLLSSHFSSSLSLSKRSPRVSTLRX
>SRR5258706_1188100
FALFAGNSFAVKNVVLFQFNIVSPRLIEIRKFVRRKLALDLRRRTYDKRIRRYLRSRRQQAPGCDERIASDANAVHQDRPNADQASALDMTSVQRDAVADGDVFLKDGGMRLGADMDDSRVLDISPCADPYKIHIAANDRAKPDARVLADLNIAYDDRVVRYKRCVVNFRFDX
>ERR1043166_2789281
PGRKICSERKSGRNYLGADNALGQPEELTADLHRFNPVNPAFLSELSVFICGRSSFDHIQYRIGFWLRLGFWMFGMTKFAESKEHVALIRRVGQSVLLGHDTTANHLFDLTVESLHAFGLTLLHRVEQRLTFGLAAFDVFARSGRCFQNLNRCEATVAVGARX
>A0A1X2JM77_PARBF
MSLLKLILQNELCSINFNKNVACATNIYYNNFKISTLVYGGVEMKKYEPLGDLIYFISKELKSRMDESLKDRNLGQGQLLTLMTLFKLKNYDEITQEDLAKVMGINKANTSRNLAKLKESGFIVINQSKDDQRKKNIELTNKAFEEFLYLEKIMREIHNEMIFGLDSPSLDCTLSTLIKMKENLLNK
>SRR5260370_10911006
GTAGFSMDTDVMPISSCDGPSLERPASTKLRVPDLSAWLQARAEQLDLDRDLATDTLPQLGRAGPLRVGVPTDMGGSGGTILHAIEAVAAVAEDSLAAAFVFWGQRAFIECLLQSDNAVLRASLLPSLLSGDLAGAVGLSNAMKFLANMERLQVSAASLPSPGDAQRWTLTGNHPLVSNLRPEGFVAAIAADHGDGRPPSIFVVSDEVPGVIRSDDLDLVGLRASNTAAVRLNDAIADEHFQLASSAPDFLARVRPNFLGLQCGLSIGLARRSLRALDSMGPTARATIGEDGRKLEAELPLCFLSLLDGISTGEFVTRPTQLFRLRLLLATLVEDAIILEVHATGGRGYIRGQADVARRRREAAFIPIVTPSVVQLRSLLQEX
>SRR5512139_1340698
XMAVAQRTPEWIAARQMGIGSSDIPVLAGESPYRSPYSLWAEKTGQIMPEPDEAQAELFEIGHLMEPVLLTIYERRTGRHPRRARMMRTHPDLPWAHASLDAVAPVRRVVEAKWTTSQRWGDEGVPDDVLLQVQWQLFVVGWQVADVVALAGRRARVVEVPRDDGLIDRLVALATDFWQGVEHRVPPPVDGSEATRQTLVALHPAATAPALSPTPELVSLVDRYVEAKAVTRAAADDESTIGNALRAVIGEADGIAGLVTYRQSADVTRVNWPAVAAAYRQLLEGSGADLDALEAIHSVTSQGPRSLRLSKGVTSX
>SRR5882757_368707
VIPECPLRDVGWDRDVRARLLDPVRDLVRRHAGWRLRVPACAGPARGRLHGGGPHDQARLVADHRRRLGRALSVPAARQHLHPVDGGPGRGARLHRGRAAETERGPARQPVVTGSLASGLRWQGFGGGPPITLVAPGLGATPGEARIPASGLSGTRVVVTFPSHGEAADAPAGYWTYPTISTDLERVADEVGATRAVGVSMGAGGLTALLTRRPDYFERIALLLPAALDKPRATPAMWAFEQLADAVEAGDVDGLRELVAAEVPAGVGVGEHISSRADALLRLGGALRTLPEQTPTNDAALLQRVSAAALVIGAVGDPMHPEQVARDVAAALPNSRLELVDSPAPLLTHRREVRSLLVDFFVGXX
>ERR1712082_453316
YLKEHLDTIGPHLFVNKNSWNILGRKLGKNCKVRFLLIKRSILVRFSKFLKCYLQNYQTKLTICVIFLCDLYGPHNGPSKMNDPEKKGKKLESSFFANKTLNFGPIFKIFKMLFAELSDKTHYMCNFFVRLIRPAQWSVKDERPRKKGKFRRVX
>SRR5271166_3589085
QGRIAGVTTGDRSVHFEYDASGGWVIHDKDAAGERILRYDASGSLTARTDEKGRTTQYAYDGQHRLASVSDPDGSVLRYQYDDAGRVASVTGNADGSPASIAFSYDASGRPLSVTHEDGTREQYAYDAAGRVAQTTNRFGQTLSYTRDDAGRVLSIAGPSGTLANKYDGQGRLIEHDDPVEGTTRFEYAPGHIALVDAADDRTQFAFDAK
>SRR5262249_39470886
GSKMTVLVRFNDDILLGTRLESQPDWEGYVAPVEILLLLERQLDFSAFLEQLGRKHRFERQGERLRSLWGDTTRRKLVDERLAGDQLDGLVDRFGRRRLGNGRDVLGIDRSNLKLAFQNDRLTVAIGQLVSGDAGIIPVLIEPALGDDEVDX
>ERR1719421_1404448
HYVAGRGRREYEELPDVLDAVLEVSEGREALALQDAEARTALVVAVAGDSELELKDLYEELDDEETVVERSAGSPWFVRAVLACAEGRALLPQTWPAEVMTLLHLAAHADTVAAILEHAEGRKLLEARLPGQLRPVVGQHVRLRDSAQKTDGVLAEGATGIVADDDWTDQPFCVRPLENPDEDYDWYY
>SRR5437773_2629605
GGGCVCRCASSWSPVRWRADPLRVRLWLTAVVPPPEHSTRAATPRVVFPSRSHVLAGARDRRPVSRHCIHRLRPRLGKGVGVPGRSCRTHYPRLPPTDALSVVRRRHRGLATRSDRFWLLACRLEVRLRVSSDCCSLGAGQLAKARPX
>SRR2546425_291204
DSAVSAYPFCLSFRLPGAASLSPQRSRLTQVLLCRSVVRRPPRRPLIILRPSFRTVRVAFMCPVPPRTEYTAWLQMVRSVWSRVPQQKGFSGDSGLATSAELKYPVGVAVDGSGNLFIADPGNSRIRKVTPAGVISTVAGDGTSGFSGDGGPAASAQLNASSGVVADRSGNLFIADAGNSRIRKVTP
>GraSoiStandDraft_43_1057313.scaffolds.fasta_scaffold3636311_1
RFFYDEDDNLNLDFYSEYIKAIKKITNEEFLSTFFEKRKKNINKINSAIYSDYFLVDNNSYLKYGPGLYYFNQEDLLFRAEILKKKIKQKLNKISAIETNDQITIENKDIPGNISLTVDGLICEKLQNNWRKNFTYKIISAEYLKNKVEIKKDSPYLSNSRCIYVKFKDKFDNEVFLKKINYSLPVLFNEKEIKEKYLNYFYKKNNILFLKNKETEINEDIIIPENFTVRIKSGENIKILNNAFIISNSQWEVGDKNGRVLITGAKDNFGGGLVIKRVKQISKFYNTDFKYLSGVENRFLNNKKSEKTSFILTKYFENKKNSYIYSQVTSNDYNYGFSDKFSYTGAVNLYETKAQFQNCRFIRIDSEDALNIISSQFLIEDSIFEENSSDSIDIDFGEGIIKNSKFTSVDNDAIDLSGSKVYLENLYFLDVDDKLISSGENTKVNIKKIEGKNSYVGIASKDGSETIAEDINFINVKIPFASYQKKKSFKHGILKINDPINLENYVVKNIKDRNSYIYINKKQIRNSNKQALNIVYKKKLSLINEHX
>SRR5690606_2703104
NREPLVTNRFADGRERIERPACGRTNLEIVELAGREAAIAGIRDHGGVVRAELRARIHHAHVHAAAELAELGAQLAVRADAACDDERRKRRLLERALALGDERLDDGILKLASNVGARRVIELESSRRDDDRRFQAAETEVEPGPIEHRPRKTKAARFPGIRQLRERGAAGVRQPEQLCGLVERFAGRVIDRRAYDVVLPEPANFREQGMPARDEQREKRKFGRLALEHRREQMAFEMMYAX
>ERR1043165_1439568
XMIVQTKIEDSMTLKLVSERAEAELRLINSRELEQELANRDNHFNVRDIVAAALWKTDLMEAVIIRKIYEAIIKIDMKDLTKVENWAEEINRASQNPLAIESMKSKKKQAMPREEIITPEMYIEKVRQETDSVDVVMNEKESRQDTSPEEKERQKRRKGKEVTDIEVINTKMEMTTLDEIEEVKTKATEAGFQQQNYKDIITAIRNENDTREIEEMQDTVHQKKENSFAEAPLEQSIWSPSNRSCNSKATYAAKIPAYNVPGSSQEERTKFVRRLLAFNDHVKEVKEVFERGNAWVRAVFDYKYSREEAINKIQKKHNDWFRMIPDTDEREEDKIREHERPKQKENLVKEEEERREEGLLALTIWDLPQEISEQEVRYLVKRIGKVISCKVKRSAYRTIDRKR
>SRR4051812_11463556
RHAYRDRPAEPKPNIGNYLEKTSRFGTPRVLEGDRIAHNGIRQRERTNMGATATWAGTGAGRRRMEAVIETLASVHEHGESVSELAHDARTMVTALSLYCDLLDEPGVLASSHRHYASELRLVAEASRRLVEKLAQLEGGDEETSCPGRTSALQACLFPEIAQPHGGAFQGALNGMPGMEPVSGGLIHDLREELLSSRGLLAAIAGPSVTVNTATEGGAQPVRMSGENLIRALVNLVKNSAESIDGAGTIDLRLIEQWEPGKVHTLVLTLEDTGCGIPPEFLEKIFDPGFSTHPARQPGGSWTSGHRGLGLAITRSIFTAAGGRIHAENRTARGARFVIEMPVRN
>SRR5688572_23826730
GVLALEALGLIALSLLLGNALTLFTLGRIIGMVLRVFSFAAATVDIAIGRLGSDGRLLVGDTVVWLIVLEWLAQSILAFAVGAFVLWVSSDTIGLAGAVLSGFVRTIRRIGIHAHNGRVGLTVVLAAFAAALAGAINS
>SRR3972149_4567815
PPRSTLFPYTTLFRSDGLAYPFGRWSAFIVLTLAALNAFWLLKRFLGQLRLGGKVPAFFRGHLIENTMLLVSLAVFRGALGRADFPHISYNVFFTYLLALYLVVKHGLAGFVERVGGERAASRVAM
>ERR1700722_15463975
GITVAQELRDREREPLAAEYVVLAGPDHEPDAPLTQGVEDRQQPRASLGQAVQGRGDRRRSFFPADQPGSFQLADAVGEKVRRDSRQSVFEVGVPQSVADQQFTDDQQAPTVAHDIQSFGDRAVLSVAPHDLSLSVLQLNFKSKRLTSSSLRVTLASMRTGCRRX
>ERR1719253_2112
CSHETALPMILRGPHSLTSDLMSALISSVASSSIPTVLCITAQGPRYIGTLLSCLSFASLALIHRLHDWCVVLRLMDDDVVWQRHLGTHLALRVMRKHDLDLNAKHPLTHGHVADSLANVVLLRLTSGNE
>A0A1Y4JJG6_9BACE
MHATKEFSSISELKHIREQKSRLSEREAELVSPILTNLECIPYIYELFKNIVRTMNIPLREEIIQRKEFLFIVLFLFVPSVLAGGRIPNGVRKALEHVFPKVKPCTISNNIADVFFLYQQYKYFRSDIEIIYKEMLKRLENDDVSNGLKRFIIK
>SRR5471032_1837456
MLLVDVDGLSSLVVAVIPLHEIGLDLRDTQAGQLAGASGPKERTAEHSRKRDSLQCAAQVGGLAFAGFGQRQVGAARMLAGQSPGGFPMANEVNLRCHRARIAIRSSLPMDETRSSPGELPGAIVGSSTRTIGPKFEHMRPTLRVL
>ERR1019366_9306790
AMPITPSSANLRFSDRAVTNVPRSSANTRFFAHQQASPAARVPFAQQQRAVGQAATGAPNRATAAAPGASQAGPAQNAVRPQTPQAGAASGWRRFGEPGGSQQAPRSQTAPQNNRGWTGFGTPGSSSSAPRQQYSQPQPGYRGNSGSSAPQSLRIAPPVVQQRSGGGSYSAPRSYSGGSNGSRPSGGGGASHSSGGGSSRRGSRREKLGSREISVSSPRPRPASAGSRP
>A0A098LH02_9BACT
MAVLSWAQTPLSMNGRLSVTDGKLVNECGTAVQLRGLSTHGVMFHQECYTESSVKAIAQDWKADLLRLALYTENSDGATKGFAQSTNKEFYYQWIDKMVSLTEKYGIYVIIDWHILKDGNPSKYQNEAKAFFTLMSSKYKDKKHVIYEICNEPNGGTQWNQIKTYAEDIIPAIRNNDPNAVILVGTPEWSSRIDQARSNPLSGNNAKNVMYTLHFYAGSGAHNQYKNYLRDAVSAKFPVFVSEWGTTEASGAGNIDSGNSRDWLSLLEQNKISWANWQFSDKNESSSLLKEGSCIRESWIDFRTDNSGNSGKLIYDELRKTKNYTACGSVTIPVTPKPPVCPNATGSNLNIYGCPVTNTFNTNYCQGYNTKQAYVRTDFSKDTVPYFTYWKKPSEGSTVYSAVIQNEKLVITSVNADPNYSTFGFDFGKLNATTHVPIDLRANAVLKFDVSFQKTNYSANDIALYIELVDANEKSINATALGSYNRFILPVNGTTKTIVADFTNGVKRTPPATPGTNGDPKEDTYDRTTFDFSKVTKITIWVNPNVSGVYSRPPFTGTWTIDNFSLGYDETKAVSCEEYVDVDLCPEDPNKTKPGKCGCGVPEDGCDCNGVAGGTAFIDLCGVCVGGNTGKIECDGNAYSGTPYPIPGTIEAENFDKGGQGVGYYDITEGQPASSYRPGDKVFTELAGGSTNNWNVGYTSTGEWLNYTVDVKYPGTYHVSFRAASERATGKWHLEVNGQKIPNSDFSLASTGGWQTYTTLKTTQPIALSQGKQVIRLVFDGPDANIDNMTFEAFEVITSIPAKAERKVTVYPMPANGLINIRQEEMSYNKAVMMDMTGNVIKTKTLSGLTEELPLQNVARGIYMLELTGAKGTEHVRVVVE
>DeetaT_19_FD_contig_21_9884499_length_257_multi_3_in_0_out_0_1
MKDYIGLVDTLNMKGMVVLERGGGALLSRTYPSNKIDVKDCAFKFPLYTTEYKMGKETPELVRTQSWNGAIQVHTSKAFTAEYGYDLFMNIPPWIYYNHTNLKSQTKKQIKTASETKIMLQIKIPSIKSLFLSNAFKDWLSSGTTKENNNQPDKLLWDYILHHHDFRVYGIKPWGKSNYLHYRDLPITQMDLHIDIRGIETKDVLGLTSVAGYYARKNMAIWHNTDATENEKVVIYQSPNGIEFRKGKKSSEIYKFYDKKLQQQQQYYDAIYTPQSFASDRYKKAMKPFFEKLTDAERTTLRYEVSLRKVPSQRNAVNKVYAKYSDGIEKDIHLDDIIGNTTIYSRVASKVLQVGLYNIFGSEITKEISNLESGDNAMNDTDILQKYKSKGLKYLGIKYLMKNEGLNNEQVWKYLTNAIAGNSSYEVVRRLRNEFRDEGLALDLLDTHQQTLDRLKDVYKNALSX
>SRR5580698_6036952
PHHKIFDSVNFLLRTWLHWTLRVRKISESHPVPAIVSQIAGFRCCTTETSAPPQSSSPALSRSMQVREYKESDLAQLKAIHASQGFDYAFPDLSNPLFVTKLVLIDANANAATSENRQSIDSTATANGKILAAAFLRLTAETYLLLDPNAG
>SRR5690348_4651858
LTPGEVMQLDPEEEIILAAGQPPIRAHKLRYYADAALRARVLAPPEVTCPDRPSQMSSPWEDEGPKALAPGSRRAPRGMADTEDTEEEGHVIERGVDEDDAGPGEEEAIEEEGYVLX
>A0A085GHN3_9GAMM
MINNICISLYGSIEDICKQQLVNAGFRVPKETTNGYLPLLLNMNKRLIEPRKRNVHFHSTLIVPEKNRNGFALLINKMQCGSNINGYQSHHLERTNFNDDFLNDFGLHHFHLGETTQKTGKHKRYIERTGNTIFAKVDQNDIYLLGVFGHNSEEKQFIYSDEQLLKSLYDEWPHLLEQCRVRGVTGQTLSPEERNALRSNGTNVITALSDDIAIMSPGGGFMANKMSAYVSIEMIHLYRTISLLKKSLFKIQEQHYPFDADFKVITFGHDELSLFCDKNCFFTKIQILDGNHKTMSLAPGYGPVYTHGFVRGQTTKLYVALIEALNTTASRNYLHPFPSLYIRHL
>SRR5205085_12251670
XMNDCGALCAPFVCQGGTWEKSRKCRCFPGMRQERRKLWLEASQGAILVAALLGAVLSSRASDWHPASLVLLLLALVVATDQFAIATKRMRISGGHVSFVLAMALX
>ERR1700748_1727377
DSAGDPRAIYNRLAEETDESNLFLDVEAIGAGENWRTRIDNMLQKVNAVVVVIGPRWLDLLNARAAAGAFDSVRGEIAASLKRSDVQVIPVLVNGARLPAQSTLPDEIKGLTDLNAIEVRGSAWTSDVERLVKALRKSGALPTSRTRWMIRAAALAAVPVVVLAVVIAFFELRREVPNLPKNISYRFARELVSNAGLKVVGHKIEPRNGTIDVVSAQRRAPGSHLFTWQSVEVDLVAVEPYRLVCREGQNFAYGSDDDGFRFEQYKGQASIDMTEGSCAWIDRPMRQEEANVLKPLGFERNLAKHFHSAPGGLLAFCAISDYDKHNKSPRLLALSLEWYARKEGSGQLVPIIGDYMCVDRLEX
>SRR6478672_9921535
KLYVSHKVTVARSAVDNSETCRAYGDSVAQRRRRGLGRAPLYVARLQGDVLRTRRRELLGAGVQRLLGFVSPSHEREQRIDGELRGRRASLRGALNESHASGGGMAGGQTDLHVPELGFFTGVDLDGLCALERECRDLDLGLGLAGILCGCRRGALPLDDRVRLARLVVPETSQRHSFEFDCTGEAPGVLVEEARGNREISGEAETGSRIGAEEVX
>G7DWE7_MIXOS
MVNQDAKGKLKKLEPVEAAKRLAAYAAVDAHIKPHHRVIGIGSGSTVPYVVERILEQGSEINEDRWFIPTGFQSKQLIVQAGLNLGDVDQFPSIDVTIDGADEVDDDLNAIKGGGACHLREKVLAEAAADFILVADSRKDSRVLGTTWTQGIPVEVAPFAWAKVYQNLALLGCEEPILRMGKAKAGPIVTDNGNFVIDAPFSAVYMRDPADLLHRIKMLTGVLEVGLFAGMAKAAYFGQNDGSVIVRYVDASPPNSARGPPSPSLAVLQSFSFTFQNGPPEHRARIMPSTSLFSQRSVMSMFTESHIRSIKSLDDLDNAPGGRSAKPKYPYVITLRAALLGSPNGQLTLQEIYAEIANRFPYYKHAGKGWKNSVRHNLSINRCFKRIKSADPSKGSLWSVDEDEEVTTTRIRNKKRYATSSRSNYRYRARAAKSRRSFADDDEDEEEEDDRSSVSESASAAFIARSPIRTRRAVLAVDTQTKSSASSHPSATMPSSPTTSELSDANSVNSTFSPLSPAHKPIQHIQREPAPIDSFGRAGTRPTPITALNAGQSVAPRASESPRSAAFPHTESHMRSFAGHVQSPSYRFSAVQGHQMDDHYPTVWPSLGTYTPRQTTFAGAASSTVAGTGPSYPDARHSLGNYALKSDNNHEHVPSTSGAENAQPYYDYPPETEETPTSSYYRDYATVTQSDPHWWQQVYQHSSAAQQHSPTQATHPAPPPYYHHQVHQPPVTMSPLHAGHPLSSGYGTWYPAPNLPPIGHAPNGDVTSPHYPTLLPISQQKRMLQAAQ
>SRR5437870_1888551
ARCCFLIRELQFWVLGPSRSASWSGFSRIMPLRSSPKLRRRYSVRRVVTVRRSPQNRLARRLEPTEAVLRWMSGVSEPPFVWVTPTRVRRLQSSRAPAGIGEKARGLLWLPAAWVPPFFVLSPEFHQTLSECPAARRNALIDSWATVFERAIVAAGLGRAEKLYLRSNAVDETIEARGRYKSEVCERKHWKPVLRNL
>SRR3972149_5390364
RLLRGGLLLGLFACLRLLCGGLLLDRLLLGGPLPRPLACPPPLPPTPLPPPGPLPPQSPPRQPPPQPYRPAAPRSRSPACERFASASPPPRGRRGPGSDDGGRPACAPARCRCPPGASPRCRGRSRSRTTCPVRQRAPRX
>ERR1719354_373981
NLVKLSNTTDLLIVPRKSRRTKDSLLSSRELEQMSSVLAQVLVCWLVSTKCKQHTSTTSSAQKTKTYIRKHNQFLLKPPSLKSKFAIPTTNSPSRKHTTNYEHLFIEVKPTRKHKRKKELSLFQRDGASGFDHEFLNMTNNLLERSSTHTPKEGVIFWKCLSKVDSFLPRPLQRFFLLYILTSASRGVNSLSX
>SRR3954463_10117746
LSFFFFLMIRRPPRSTLFPYTTLFRSVGEVAALGQGQALGQGVGAATELQDRKSTRLNSSHTIISYAVFCLKNKRIKRHEAREVACLVVVFAENPSPRLRYVIGRDAHLQIFFFLITRRPRNYTLFPNAALFD
>ERR1700722_4865254
VQQQFVPSLATRVDCGKMGEAQNAKGTTCDHQHFLERVFLLFLELYHSMRYTFIPRTLLLLISLSRGSLSSPGSFVSTRFPPVLQDGISCPIEQGDSHMQPLLHNHDLGTKTKLWAKVARLQGDNASVSANALX
>ERR1035441_2809112
GLSGREITWSPVNFRADGNGIPAPSTEDPQVTVERCNAHLNVTPTGKSDQPLRIVIPHLVVTTILIEELHHSIPLEVKQATGDRLPHGISPRQLCFSHVETVAEAISGALSGLHQHDYSIDRSVRTLPVGRLRRNRRPACLLRSEWWSTTVVAASPDR
>SRR5215472_7227805
GTPIVIGEASEGATLGVVAADATNILFQRYDSAGTAQGTPITVAPSPPAPRPTFIGSGGGSSLVVWGQGGGLHGSVVSSSGAGAPFDFAPGSWARTLYLSIADAGNGTFAIAWTGDTATGVTVSGFALAGAGGITGGPSIITAGSVEFRVIKLVHTPAGFGLLIAGLPGNDTVYVVPLDSAGNVTGSAHRFLGADVAWDMGAQGGGLGI
>SRR5580700_8890822
VLAGYSRRPVPGRSHRPLAWSRVRPGKARTRLWARRCHGANAPSMPGRRRPANRHEQPSLAIVFLSPVFVPSASCEGFPHFEIRTMKGEPHETSSSQLPCELFAAVARSRNRPRTCPRSSGLRTARQFPLGERGQRAHDRVYQHHRARTVARCNRRVRTHFRFWGRGIQKGPRRRAVRRGNGDRCGELSGLALSGGVRAEYEHMAETRRINKVHRSLSRPLTILGAERKLFFFAMCMGAATFNLLGSLLGGLLMFLLLYAMARSATQTDPQILRFLLSAARLRRQYDPMKFSPIVIRREGDAX
>SRR6266545_3341769
RNGSDRVLLLKREPGRKRPKPCSDTLKRLAALRLRCVTPGTCDEFSRAPADRAFPVLQESCPGIDTALANERIGVLRRGKMFGIDNEKRGAPTGTGGLFHRSRGGRVAGPVAVETKRHGVDPERCEPFKQTRAHTRSTKGGDVVDAASAELVEVEDSLDEDELLPV
>SRR5438128_2375330
XMRSMASGGSFHCAYRHATQQAFLEAHELAFAYFGGVFRLLRYDNLTSAVKKILRGYQREETTRFVAFRSHWGYEAQFCNAAKGNEKGGVEGDVGYSRRNYLVPIPQARDLVELNAHLLARSQEDEGRKIGDRAQSVGAGMVIETEHLLPVASEGFELGEVSFLVVDGKGCVKARTNWYSTPLRAGAKARVNVLPAWLEVWHEGRCVARHERNYGRGRQVFNLEHYLDVLERKPGALAGSTPLQQWREQGRWPDSYDRLWKNLIQRNGKLSGTREMVELLLLGRHPDFIRGYAIMVRGGSQMFPSHANLIDGFGADYKRRIKRNHPAWVIVYARGEPLQTFGNHVDIDKNVVDAWGIPVLWIHYERTENEQKMAKDAFQNLQELMHTAGAEVLSADDTLSTPGAISHEMGTTRMGNDPKSSVLNGFCQSHDLRNLFVIDGGCWPSATCQNPTETMLAVAWRASDYLAEQLRRGELX
>SRR5262249_4210377
FPDEGNEDREIDEPPYRLHGWIRTVSHDGALDDQDPLRNSISRSESLPGRALWSAFDLQAGQPPAKEWFRAGSLTFRTGVWSDLPESYDDSRPYRRRAGSHGSRVQIRSDLLTDLLRSVQMDLIVSVHIERSIESEYGRSYDTSTKKRKEFERIFIFRSDGX
>SRR5258706_5404908
DAPPLLTPPETPANVLNPQWRRIGAQAAPDAEQLRRRGFRQGVIVAAGVVLAAVALTLFLLPVRRPAASPGAASALAPGVNAAPGANATPGANAASAAADAVDLQQLAQQKSSAESWYTRVAPRVRMLADSGAAEWDAAGMSSASAALATVDALLAGRDYIAAQRQLQALDVTLRQLEAGRAAALKAALQHGADALHQHDAAAAATAYAAALRIDVSNRDAMHGARRAASLDSVLAAVARAREAEQAGRLADASAGYRKALSLDPLTSEAQAGLARTSAQVASDQFGRAMARGYAALQARPPP
>H1UR20_ACEPA
MRILNQCVTKCFALDLAGTAKGINLNRKGWENVTFQAARQQNSYPMPYPKDKDMETARNLMVDDQLRPSEITNLSLLSVMRELPRECCVMPDQHSVAYADITLPLGQGRVLPQPLLTARLVQAVMPAEKARVLVVGAATGYTAALFAALGANVTALESNTRLAEQGQLFCQQEALSVSWVIAPLNEGAAGNAPYDVIYFDGAILRFPAFCAAQLAASGTMAGVMASPNKLAKAFIAMREPKSASSFIVTNLFETQLPLLPDLAAPITFEF
>SRR5687768_16770258
ISAAPARRPPSRIGAFPPERTGFRVARMGRGMHRLPLRCQMARASVGRDASSVHRIDLPCEQTGFLCPPPFDVHLKFLPNLPPLQGWTLLAHAAAGRPDALARWLAGHRGVTDVRVEPGLAPKILRAKVAVLPELWAAASPYVRVHHLDLSTEGHASWFIEGSKKDVLAF
>ERR550537_1009424
GKPWPPRTTSDPTSQRAGHVYLIHAAVSNVNGFLDLGVGDKFGEAASAVDPGSAAVKQRVAAVTLDHALDHESVIHVLKSDTQGFEVNVMSGGKQIHRKARLVIYELWPKGLAFAEASVKDFFTELADAGFVICYDLYQQRPANALE
>ERR1719378_273336
QVHFKTRLEFLKLDLQQIMKEEEIPLFPTKGLFHRTEDIAIMVQHFVSELLILPNLCSAREIYRDDFLKLLQQKSNTLFSYIEAKSLRGVDPFTHADIRQMKIDLSLNSEADFRIVLAEAEKLHPGLVSFLFQDPGSGTPYQAIRTAFVX
>SRR5260370_18266583
DRTGPVRPDRFAQPRNSGANVGRQTSRFLIGSKYWDVDYTRTQTASNADTDAIMRRNRKVLVGVFAPIRVVFATPGRALLGATEGNGRVGSIWHGTRFQVPKREFGSLVCSSSKYLILHDRNNLSVRS
>A7T0A9_NEMVE
MKSSPTFRFWNAILHYQMLVLLVVRAQRQRNFVLYVEALEELVPLFFVLDHVNYAKWTSIHIRDMKSLPQSITEKFQDEGQFVLSRTDNDFSAMPFDQAHEQENKIVKSAGGAVGLTENPTAFRRWMLPGPETTRLLQQFEGQYLDDTDSETGDRANHETGLSSQKTFKIQVNNLIDVIRKMGNPFLDNFPELVTLDSRDCMDNEEAETIVNLDALGKSQYSSFLKDVTKDRTVAIGKPLMQNKLPLFRKQASRNKPKQSKTTPLLQNNAALFAQLYIAMQSRDAEFFSHEVQPSPPSLSEFGSLRLPTAKSDLLKCLSQPPQPEPPTEVDCKVCDGAVIVHCLPVTGVMTFDDYAENVFLPYIRNLRSRRVDIVWDSYIPNCLKEATREKRGTGLRRKVEGRTKIPPKWMEFLRDPRNKQELFQFLSVKVAEFPWFTVRKEVYITRRWMLSGPETTRLLQQFEGQYLDDTDSETGDRTNHETGLSSQKTFKIQVNNLIDVIRKMGNPFLDNFPELVTLDSRDCMDNEVAETIVNLDALESNVASSGEADSFLRVTYLKDQKLKSEAFSHSGDQLTTAEWEQTMKSSPTFRFWNAILHYQMLVLLVVRAQRQRNFVLYVEALEKLVPLFFVLDHVNYARWTPIHIRDMKSLPQSITEKFQDEGQFVLSRTGYDFSAMPFDQAHEQENKIVKSAGGAVGLTENPTAFRRWMLSGPETTRLLQQFEGQYLDDTDSETGDRTNHETGLSSQKTFKIQVNNLIDVIRKMGNPFLDNFPELVTLDSRDCMDNEVAETIVNLDALGKSQYSSFLKDVIKDRTVTIGKSLKHNKLPLFRKQASRNKSKQSKTISLLQNNVALFAQLYRSSMVTVEIKKLLNIQFLVSLCGFALFIKEL
>SRR5262249_55098951
TLLAGDVGLYSDFRYDQTGTDILWMGSYPPASTAGIYEWHRSDGSIVQLSPTGDVVGSFAHNADWSIIAYTAKRDSGFVYDQRVLNRAVPGKALQLSNPAGTAGVLLYTGSYFFTKX
>SRR5215218_3154104
SPDVAAATSVPATSGAAPRTRSRGSMDAAVRVADEAVMPGTSGCWGPPLGGTMAAESPMLRPVTFRLPVPALPEGCTRDRLHPERREPPRPRRRPSLRRGGDPPVHPRVGREGRGPPRGLREDGGARVPGSSDPGTVRRIRDGLRLVRAPVRGAGARGHRVPRRAERPRRPELAHAPPVGDGGAEAALAGAPGEGREARDVRADGARRGDRRGVAGVHGTTRRRLVRAQRAQDLDLARGPRRPLP
>SRR5699024_12259917
SCALIILLSFPTRRSSDLKVVCAADDAAAGHLGAGLRVLRIVESLVVLGPDIDAAPADALAVRVLFLDQIEHAADDEGAGDLGTEEVLFLESDAGEFGGEGMGIRIGREIDIVGQPVQWDAHIKPSFRIGSRSAHRLRPCRAYRX
>SRR6185437_13271781
SVKNRVSARRCAAHAADYVGGFIAAHAALDVRLQVNGQFDGVKAGLAGLCNFVVNTAEAGGGEELLRHIVLDPGGGAQSGIGVALQIALLNGLRVFHHIPAVAGKVRSVNDKHADGAQTRGFLVLVCPAAVVGERFALEEAVVIRWRFVDDDEGYFSFHIDAGVVVPVVLGRIDAVAGEDDRRINVGALLPCLVLGNDVGAVVEIDGCAARGCEGEARLVFHGVDGNERDFLEIGAVIACRLEAGHRELRADVFGGELVAACAGAAAFEQIERKKADVRANLLRINGVCGSARGGRHAGNVGNGGLLRAEQRKRGEREYESKMHVPKLHSGGSFGLHRYAAMVIAGTAQFKAQTLRALCGALQASRADGRGX
>ERR1700731_1967141
WPAQLKISEISTGPVQPAFRWQRTTIPLLHDCDRAKSYRSIAPRHWRELMDSPTRSPSRPEFRTRPATPAGRQVESFFRCADNEPDAQNCSRVLLPTPRVSDRLPLKMPFRRETEPLHALKSRAGIRLCHLTGSLILEFVCCEIRFDLRASLREPTASPRTAXX
>ERR1711974_545716
CLRYELVPLFKSACCPPFFAKQTVSSKRTISIGSDRATSELSLELGWPIASAWGVCTEMATTGGHPPKGCLLRQATTCMGGHFVACLVRMLLNDVALKSIVLPARX
>ERR1719506_2640246
SAQLAGGMGGYSQHRVAETGSSKAMLGSLGVFRYVNLKFPSLAHAKRRALMLFLATWSSSHRRAVPLLTKPALQDLAVCEETLCLWDVYGLNWPHGDRTATFQLNKRYGSTVSEMISMCGHGPWSSIPSREDKGDANRLQPVGVRVASPVDEQEISRASAGNHQGKITGRGRLPQIASAASGGSTLAKASILSARTFTSSGGIVSPLKTNRKHVSSEELSSPRHRKMTLRCITGSSFSIG
>SRR5574344_946438
PRSLRADTLKRRSRRMVEKMTKYSFVLLSGETEGFLKWLQGLGIVDVTRSTKPVDEKSSQMLDKVSRVTKTLSILEKLDYSADPDFELIRQAADKTCIEGCKAVNTLGATARLEELKAELAAARKTMNDVA
>ERR1712128_216805
TAAAVFLLQLVMARSSSLVVRMVGSVWSSPSRPTAKPKEVICTKTRGHARIDIASAASQVLQPLSHQHLHQLNLQSWHHAQSHSNVEAPSASLFMKIKMIFLIGMKLEFDVWPWERELTWQNLMTWLTLX
>SRR6266568_2358632
PSTASSAYALVTVPRAMPRSAASTRVDGIRVPAASRPSRIAFRIASASPWPRPAAQSRCRSRPALDHSIAMPLDHTDGPVSAYRGRYERQAQSEPQGGGRIGVSRGLRTATGSAQAGRGRGDSGRSGSETGRVDQDPGVAAQRLRVLPRHAQPRRAQDRRGRAAAVRAVGLARDRLLHRTGTGRAGTDRGHDGSPPAPGRAERDLRPGRRGFQLPPVDRRGLARQRNQHVQPLRCHRPGTATVPGMNNIELAATLKSLHVPGRPLVLANVWDAASAKLVAAAGFPAVATSSVAVAETLGYPDGHGAPVAEMLGAAARIARVVDVPVTVDAEGGYGLPADEFVDRLLATGAVGCNLEDTDHAASGGLIDIDRQAKYLADVRAAADRAGVPLVLNARIDVVLATGRPADQAPLVAPIVERAQAYLAAGADCVYPIALRDPEAIRQVVAAVAPAPVNTNCPPDKAGIAAAAKLGSGRLSMGGGLWAVVRTGLAARLA
>SRR5882762_5772273
SRPLFAVYHQTFPRTCFGRVYRRGSRMKLSVGRYFTQASLGCGECCIFIEIGELIDWVVFSLNKENIPSRAYIAFKNEEQLATFSQGYDGHLFRDKAGAFVFVVRHSCPSSNWHCFGGLIMSLVPGNESIAVVEFAPYQKIPTEKKKADARGGTIEKDEDYLSFLESLSNKNKPTGENGEPPNLESLSVYLLSSRIPSFPHTLPLHPLLQHLYDYSLTHAFICSCRNATRPPTKNHPTSX
>SRR5262245_8502620
XMSWLRIEKFFLVAVATVLAHQALGAELIHPGARRVAFTRAVVNLEYLSGRLGHDEPPSIRRSAPLGESVWFGEIPRQLVGEELDSRRHYVPFAVMLDGNTVVRAWCDANMNGDLADDPSPALSAYPGSMTTRSFRVMLRWRARVGDRTLPIERLVRVVVEGPDTVGAVPTYRLQDVYGMLGTIEVEGVQRAALLYDANHDGIYTRGRSDGVFIDLDGDRHFTIDPMAPDFGPFAIPFTILHASYAVDSVALDGSSIVWRRLSPAYAAPAELGRPAPDFAFQDMQGRSVRLSGLRGKTAVLYFWATWCGICRRQAEDLRSLYAQSSRTDWELVGVCYDTDRDAAQRFQSEHSFTWPASFSGGLPAEDPVGRLYREAGAGVFYVIDHDGTLARKVFDVTELEAVLDSLRTAPTESSLTGHHYPKX
>SRR5262249_12765844
RAIWAAWRRFCCHERVGIIRPPKMSYPAYFFNSGCVDHTAAHGSLQDSRVRRTQQAHFQDLGAAAAIGRCAGARTRTPDAAAGRSRAARFSSPTAARAVAPATPTVAAADAGAPRTIYQGPYSAAPCSRELVNGRSMLPX
>SRR5438132_851461
XMADLDTTQDHRTRTLVDTAAYQPGAIAPDDATGYRDHAAVIGQTSAGPTRPVPADRRIREGEGAAGIFNAAAVAAGGVAADGAVGQRGRAAKAGQAAAETEGCAAGGVAADGGVGQRRTAAAADHSAACQAGGVAAAGAVGKRGGPDQVVHATAEDCRVAAHGGVGHHKIAVVEDAAAAGKAAKAVVFASRGVAAHGAVVQRKRAGIEHTATGVGGVAADAA
>SRR5262249_12382799
RPDRPTASSTNRSSALGRRADDRAVISAFLQMAAAVLAIAPLGICMNTQRGLCPPSHLMQECAMSVRDDTPAVRDLNGRAALVTGGASGIGAACARELAARGATVTVADVDEAGAKDLAQGIGGRAWAVDLLDVSSLENLRIEADILVNNAGVQSINSIVDFAPX
>ERR1740117_695841
LRIKYLNETQQKNPKHFQDPETGAQLEIKDQQTLSDWLLMYYGKFGIKIELVTDQSSESFQFVKGFGGIGGFLRYKLELDDIIGDAAGQYDDQPVPITVIPISNSRESTFTTTKPPVEDTFQEPSSWISNQEPWTPSELDHSDNSSDQTTSSSDKLVPVTTGLKDITPRVPSSSTPSSTSLEKKLKVAIAFKVSKSPTLSVEELDPVWEPSLSPRSERNTQTEX
>SRR5258706_2253991
TVEDVAILRCVAAAPHDHAQPDLALVSVAVGELVFPAPIGPIVREVPLVTIAVVPCVGAFAVLETFAEFAFVLECLRDVLALAVKALAAHGAAVDRSVGERELAYARRDFASGSRVRLRRGRRGGRRWREWRLGGNRRPWCHLRRSRGNGDRCGGYDRLFRDLVPRALGRRAVRGCDLLGRFRGGFGRSRGGLHASLRR
>SRR6476619_4763585
PKAQPRLHREHELRLLHVAVLRTRLSHHLCRVARPGPTRPLARRARDPHHVRTASANLSRSRRMYPRLLAAALLSPAQPPKADPNDVGVLPLGADGKPLNLDFETGDLKDWTATGDAFKGQPIKGDTVAPRRGDNRSRHQGQ
>SRR4029079_7780467
PEPDSGTGAVGGGVPDVSAERQADYRELVEEGPVALTALDPRGTDAVAAYCLLPTAYCLLPTAYCLLLVFPVHVVIHELLEARRQLVVGSAQRRDVLAVDEDGAVGRLARAGQADADVCGLRFAGAVDDAAHDGEGEGLDAVVLLLPRWHLLSDVALDALGQLLERRARRAAAAGTRRHARRERAEAERLEDX
>SRR5215204_4095657
VHGLAGLRGGQGAVARDRAVGRVARRSSALRAGSVALAEAVAVAAGVRVAAAVAVAAAVAVAARVAAAVDRVAGHGIAGVGAALAGVSAALAGVVPTALTGVPTAALAGVAAALLVVGRLGRGRADRHLRVAHAGAALGPRSRGRRGDDERDQAQQTQKSGDPAHIGPVAMRSRRLEX
>SRR5512147_2844591
RAYFNAERPPWFLDPAMSGGGMFGNVGLHRLALSRSCLPGLRPAAVTASVSTLPEHPVEACTAAIVTYAGGGAVLYEEVGYFPKPSWLNTGTHYIFENGIVSWDEKLW
>SRR5579859_1021161
DAGTVAGAGRQPRADCRDTDAESAAAAAKTRLDLGRGRRRRRGGGDQHRPRRRSGSRQGSFAVDRRRHVGQVMRAVWLCLLLAGCRTGPCKSGTLLVSVHFTGAAATADSVDVTVTVDGMNGHTTLLPLRSSSGTIEIDFAPNYPVGHTANLTVVARREGNLVGTGQLDVK
>SRR4029079_5257423
VRLDVSAGSDVPKEVDLVHDRPVVTACDRGCIVDDQPAGGELSEMDTAEVCRLDLANRHLCLAEPDVELLGQTAICDRPEARYGRRHLQVETRGIDDVELESSGYIPAHQPIVPTTRPARSAVAPAREACDQLPGRVRRDVTGLTTRPSRGASILENGRRSSRSSSSAGDPLDEPDVVAAPTHRARQTCGQRRVVX
>SRR5215218_4007277
XMKQSVLVLASVALAVLLAATGVVWAEPLAAEDQEGSGQSAASVTEASQPAGRVWSWGFNRDGQLGDGTTANRSTPVRVEGLSGVVDVSSGRQHSLALKTDGTVWAWGGNDAGQLGDGTTANRITPIRVIGLINVVEVEAGWNHSLALKDNGTVWAWGNNFQGQLGDGTTTNRRSPVKVDGLGDVVDVSAGGGGGGIGLYNHSLAVKDDGTVWAWGRTLGEFGDVVNSSKTPTKVSGLNNVADVEAGWHHSLALKDNGVVRAWGYNGGGQLRVDGLRAVKDVSGGGGHSLAAMRDRTVQASGARSFGQLGVRSLRFVVDV
>SRR5688572_11278665
ICRAPSCTSGTARCSISTTSLRRCCSARGWCCRRTNTRSSARTCSTCSTPAAASASRSGPRTSCASVSLRSRWRRRGWARTTGTRAAARPRERRIMDRELLIEIGVEELPAAWMPDLTVQLAKRLEARLKEYRIAPGAPVESFTTPRRLTARVAGIAERQDDLDETITGPPVSAAYGADGQPTPAALGFAKKQGVPFEQLTRVKTPKGEYLACQKRHRGRSAV
>SRR5947208_11212059
AFALSNPPFRESVVDVGNRILMIHETRIQREGQKPAELMSFRHLANRVSIAICFLWPTITAIPALAVEPYIPLSLAIRRNSYQRKASAALATTRCCIKKNAFICVAIILYFVKRRNPLRRFAPQLCARFARTTDALPPYPAVSRLYLLX
>SRR5439155_26842666
XLQDDATDQGALRHARHRVRRCRQPPAPGRASSGVNGALTPMPSALIVSVGGTPDPVAFTLREHRPDFVCFLASQRSVDLVGQIKSAASLPIQDEKVLVDDADDLLACYRAALDCVGX
>SRR6266480_5487073
VLAEANVLPETDMDYFGDDGDRMHMMFNFQVNQNLFYALAAADTRPLIKALKATNRGRRRHSGGSFCEITTNLTSVVCKRSSGKPCLRHLDRTNRCSFTIVGSDAGLPQCSGAISAGLSWPTVX
>ERR1719433_450597
TGCATPKEVLTAAAAAAATAAAAEVAIAGIAAACSVQQFLSPKQEKQLGSPWNLPRGLLSRGNATVPGVRSCREGLAPAGTTPARRYAAAAREPTWSSRVWASAGPGQAGPVPPHSGGSWSVGARFRMQLGTSPGATRVHFRLIR
>SRR6218665_3920812
XMARAVTRIREENGVSATRRFVVPIAIVMLLVGAAMVAVILYSARKMDENIVSSQTELIDNSLNARLTRSLSEVRSVAWWDEAVTKSRGTIDTGWLDLEVGAFMTESFHHDRIMILDEQNRPVYGYNGEGRNVSPPITDSSYTEGATEGTTERRYGRSAAAVVRIGDHGELASAMAITPSVDMSLQSARPRILVSFIKLDQAYWAAAGRDMLLPDLGFGRPSGERRGDYQLKTDTGQALGTLTWTPRRPGQLLMKNVLPLVLAGLAISLLVIGAFARRLFSASRAIEAREAKAQHLANHDSLTGLPNRRKLEAEFARFTDAAKAEGHTLAIACVDVDRFKDINDTLGHHTRDQLIPSLADRLRRAMREGDFIARLGGDEFAVMRNCRDAEDGEGLLADLRDCFRTPFRVVGHLVEANSSVGVAFAEPGRSFDDLMREADIALYEAKASGRGCDVRFEAEMGQKIEKRRMLEAALKPAIAKGELSVLYQPIVEASTGQIASVEALCRWNSPRHGFVPPDVFIPIAEEAGLMADLGRVVMESAGQDSLRWAQARTPINVSAAQLRAVSILEYLISPTEKYGVNPERITI
>SRR3989338_8474758
XMKHGEMARRSRKPASSCKSRDCLIGSTEDFYHVEQLRDLLDNKLPLPLTVFGHLCEGKRVGRQTIERAVRDLQAIAVQFKTGPTKAERRGNMTTVGSQYRGTQEFLRVYRQLITAAEHRGLVTYTQVAHILGIHSLGHHMARQVGQILGEISEDEHRANRPMLSVVAVGSGGMPGEGFFGLARRLKKFSGSDPSSKRRFWATEQERVYKVWQPEXX
>SRR5215472_2857866
AERGADSKVRCRDEYDYASQKVAVCASVLVVGGLLVERGAIRADDLAVALQEQESGDRRRLGEILVALGWCRQEEVSAAQQILDSRSRATVVFETVRVAVDVLDTLTVLQCSITSVITHVNDISGTIASAAEDQSATTRETTRNVSEAAKASDEITSNIAGVADAAHGTANNAHESQKSAEDLAQMFSQLRSLVEQFKIDRNMSSARTRTAHSRERQPGWX
>SRR5215216_7579447
EGYLQHGNTHSDRWASVRWQACTPSLPPSWLPFRWRRARFASLFLSLGVATPSALDWQPLAPSSILYNILQLYHQKGAGVATLGLGLRVLSGPQQETNVFGLQSLAHPTHQVLVQPVQVGLLAQPRRRTRSRSLLRQHFLHYFSEDVSRGQRGIRTSMRRHICQRRRGGPLRSRALRLRVLRAMLPSALLMSQLSSDPVHRMRSFFSDYX
>ERR1719150_3364345
SSSSSSSDKILWFPFQPPINTGCGGVEVEVTKSTGTMLHSAAPQPFNMFPFGHPAQHPQTSHPGDMFSHPPAHHHNPQPAAQQPEAAPKPRFLFKMPRVVPNQKEKFESDEFLKRHSREGEVRYTGYRDRPIHERQNKFLNAARDGSTEIAFVATGFNLIMNFDTSSHFNPAHRQCDFDREVGKLHLKAPMILNGVCIRWRGWLDLERLDGVGCLEFDEENAMVEDAKLREQVESYNRRLREFEEQSKARSRHLAGLVSSQHSQFPSHHHLQSDILRRLDLDILQGLFPPSTANSLHTIICSQTFSLRLGRSRSNLQQRPSSPSDAGSGARLHQVHQAPEKQLPPVEASSLTATTTPSPTFDLLPLLGLPHPPDFAQHPPPALWVEVTEQQASLAAPLPAGQARLKQTNTSQSFGRRGTFRPGTCLEKINASKLGGDLLRPKKKLDPWTFVRASQLSAQMLQYHNRX
>SRR6185312_8718178
QPVGHAALSRFVSPPRSKGIGWAIAGYFRLTTACLLRIVSPQSRLACVGGQLPTHISISRQSRLQFAQRDVLQRFLDEPSSYSVAEVKLGLSKLQPEIARRIKGPPSPETHSFVATAVRSLGRIKGSSNCELRIQCLFDCAIYSYNNGDTAGFVTSIQLLDELGKYSNSPSWTRRIQMFGGVCHADIGNVAEAVMRYAQALEISRRANDIPGQVATLCNLGGALNYGGLHREAIPALRLAIRLAQX
>SRR5438132_413551
QGQANALGNLAIAYHETGKLDDALNAYQDALGIYRQIQNRLGEAATLNNIGIFERERGKLDVALSNVRESLAINRQIDDKDGIAEALNNLGNIYRDQGKFDLAISSTREALDMYREIQKPMGEAICQTTMGEIYTAQGKLSDALIALQRALELDEQAKYVPGIANVSGDMGIVFAKQKDEGKALEQLKKAIDLYVKNGIRGPELKLYQEWVTRLEGGTRTMSRX
>ERR1719318_1879121
KVIMVRADMLVHHATIEKAITEYDDDDKVIICSGSEKTIVSKRILILFSPIIRTLIASLPCCTPATIMIPEFSSSAVQHLTRILETGFTLGVPIESFKQVYEIIDLAKSLNIEMSDLRREVKAKVLEDEKDVKTEETHLVNNEVVNATNEETEELQSDKILILKDKQKTISKDILSFISQFRNGVEKLTCSECSETVTRANVVDHFKEHIMDLNQKIDELSKGNQSSTDKEEKITKKPEIATPAEAFKTESELDNVDIVTDMKVEENYVNEIKER
>SRR5689334_23174827
GRGHRGREKQISHLQARVSRQLAQQRRSLVMGLGIDLAVKDLRPVTCLRRDRDAVVDNLRISRNLLRYGQDPREVDAEVHAASLGAVSAGVSGRPGYRSSPTSASKASVYAARNDEAPAMKAARDWFTSASIRS
>SRR5271157_4508164
RLKHGFVARSTSIGHHVGKWRAASGGTIERCAPRLTRRVERRTRRRVGTRKLARQGGSMPEELAYARKASGLVRGLSFWDVLGIGLAFLTPIYAIWYVIGFSLSVFPRAQLLIAIGISVLTVVWASPIVWGILGGTMPRSGGEYVYNSRIITPAVALGASFAAIVAQFYWNLFNASLLGVPSLCTLGQSLGWK
>ERR1719433_1034072
PSYRVFVGLFTLKKRLCWFVYIEKMAVNDHPFILTSIYVAYLFLMNLGTMVGNACFGCKWWLDVILLKGDQAKNHSCTDAALFNHTQHSYTYTLGFVVFVCGLAHSWVDGDMETDAIYGPPAQDVATALGVWFLLLAVVNFYTMLGCSAGCGDIKCSEDFEFFNILVNLCFDLLLAIWLLLYSNASWSDEGEPPLYDWRVTKVVVWVGYVILVLCIIGDWIVQSVRKNIMGCGACGMKCCDDESQEVVGVGVNQEEVMPMSPNAQGMQGGMQGGGQGQVMVSGNNFDTQMVDMQQPQYGHVNYNQQYGGQPVTYGHQQYGPSGQSLMX
>SRR6516225_9276130
SAPRGTRRFGFESQAMIVNFPRKNIRHDIKTTALGLLPAIKTTRDIVEEIREVLKQVLAAIHNEQRRRRLRFQVFPRLMTKAQAANYCGVCVESFAVNCPVEPIRIRSGEKSVRWDTHDLNEWIESKKQDLIGSNGVDWLKRVGX
>SRR5215831_4168361
TDRRRGDRGFDRRAGGQVDPVPRRRAWQGPVPAAGYRRRVRAVQAAGRGRRTGAAAPAPRLVCGAGGAAGGLRARPGSMAHRPGRRSREPSRRLGVLPVGPAGGGRGGEDGVRPVAVLGNPRASHRGPPHPDRAAGQAGPGRRGAAPGPVGRRLPGAVSRRHPAARALLEAGLSAARTAGDIGAEAWASSFLGWDLYYFGDTKAGDALAQTALKLHRESGDQVGVVYALAQIGFTRLCAGEALAAADAWGECARVCESSGNVWFHAYAQWGLGVAALLRADYDSAAGLECAALRTMRHMDDPMGVV
>SRR2546428_4767028
GRTVRAIGAGGEQKVEPLGDRGWMGDPRPQPARAEEVPQRDFAAHPVAVGVDVRREGDAPARLQDARDRLRGPGALGGNADAICGHDNNISAAGAASRLASSAQACQLPLQHAVLAAVAEVNPEPDYQPYEQPDPRVHGEKTNITKTGGLPQQRPHGDD
>ERR1740121_3388036
PEPPQMAPPRDSKPTGTAWPQGNSLQSLAGVLAQIDRAVWDFDISQDELQAKFYEALEARKRCTEIVVEGELPEEEWDWRPGEDDGAVLALPPPPLAPPAKRARPSLPDLNLPVQEYGNVQEVPKHEKGPRLELILEEVVRMLKEAGGRMKLQDLGTRRLMELRKGACGNLAKFLYTQPETVFVDDSTNV
>SRR5579859_1509829
SCQPEVEVREHSTRNSLPLRARLSLQARVFLFALRARAGITCCVFYPGETIRLLHALPDSGLPQFAEGRVLSLRRDEHNQIIDVEVDFHRDSHTLKAELPLGDVELVISDSSLAQTAVFWGLDEPPRKVIEAAMHSLLDSGFLMRDGLNLVQLHYDRENRWWKWGEKLMDPTGALVATAAAAWDGFVVAFSGQQRFHLEFRQQRLREAVRMLHERHEVYLEQARTTHPAMSLMRVLLNLSNAAGARYCAFPVATPWIYDQDFASVLRPPLYPDFLLVPEKELPRSISTPFRLIRLTGQRSILTVLPVKSSPTETGFERSERELQVDRLRKCKALGEKYYDQMYEARFGTSGLYADAKDAFRDAIAAANELGLKEEAAELEKRLDHIKAVYRSQFSX
>SRR5256885_8719643
RKKEKGPAPWGARASPSPELLRGCGSGAAFFVRVFRGIAGGLAVGLTLRLVGFQLVFVRLDGVFVAGLAIGFDLVLVLLDLLLVGLHGVLRGGLRERGPAERQESGKDESRQQFHTSSCGVGLPASFNARTLNPDDTQTGPAFPRTIDDAMTRQSAIAAAQKYFDAGGFHADLARRVAIPTESQNPERQAELERYLETEMAESLAKLGLQSRIFPNPRGKGGPFLVAELLEDPKRPTVLLYGHGDVIRGQENEWRPGLGPWTLRQEGDRIYGRGTADNKGQHTINLAAIETVLRTRGRLGFNLKVLIETGEGMGSPGLKEFCEQNKALLRADVLISSDGPRLQPQRPTIYLGTRGALNFHLTVELRKGAHHSGNWGGLLANPGIVLAHAIASITDARGAIRAPEWRRGRRX
>SRR5258706_15926144
GFGAGGRAGLGAGGPPARRFGAGGGGAGGAGGRGGAGAERNDRRERGAQVLEPPRQVVENREDRTSHSASSMPSGRHHCHTAQRDNGSPFIVGLIVVHCGEHGGELEQLPFKTPPRX
>SRR3972149_2856803
TVYNAVRQGAMPRMTDERVKQLQDEILKMPQAEGSVRHIFMPGIYMRELTIPAGVVSVGHNHRYNHISMLTKGRITVLNNDGSLTELVAPFTMISSPGKKCAYSHDEVVWVNIHAAPCTDVETMEQLLYDWSDAPDRIKELPDNTSSDDYQQMLIEWGLTEDDVQAETQVDNVAPMPYGIHKCKVSDSKLHGKGVFATANISDGELIAPVFMDGLRTPIGRYMNHSGNPNAVVIKAPNGDNYLMATRNIQGCMGGNDGEEITTNYRETLRLLGGAGWSGRRDPSRAARASREACRSCPRPISPVP
>ERR1719162_375500
LMAGALSQPSHVDPLPGWDFICNGYVPGNLPGREGLGTTSPQWLGEVGCMRACENQGRCDFVTYDTFNGNCWMEIIPDRPTECDSNTGGWAYWRNSQPAPAPSPAPVPSHVDPLPGWDFICNGYLAGNIPGRQGLGAASTQWLGEVGCMRACENQGRCDFVTYDNLNGNCWMEIIPDRPNECDSNTGGWAYWRNSQDEVRRRSTTQQNDVRRRSTTQQNDVRRRSTTQ
>SRR6266849_10918975
VQMLGPQAASQALAVLEAGREEPLGLVDHLFSPIRTKAASIVPSALSRCSSMGLSGWHPGAPSPARCGARRAAPGASARGSYAERTTPSAHPDRLPVVQSPPLEEVAGIRGRPALRDQTGGPGFQGEDAPHPLVLRGLDMDVRDRDEDLVQDARPLKRREDHCPALTVQVAHVELVEESLVRADEPARLDPLLAGEEERDALSLTPFRAKTARAGVRRDDDR
>ERR1711972_1082418
RSKGRAMPCCYMEDGAHQHHRKRCLGRQDLAPNRAKLTTLAPLASWPSWPLPFLFRISGRPLSKLGSFWAAPEQALGGSAFDLAWEPSESAPRSPLRQRPAQLIMLGTLKPNLSRHVPPGADAPNTLMPTKASAHSPQPIVTAASTLILGTLFGKSASLQLSGCARKSSQHGMDTTRTFWRISLAASTQRCTSEPVATRMSSGSSHSTTAX
>SRR5512136_1229453
DTPEAEKAKNRVTRPHYTAHGYARSFFCQSTHMYLQTLSLENFRNYKKGIIEFSPYGAFFEGENGSGKTNLIESIHLLCTGRSQRNAQKKEMVNFNASYASVRGVFVSRD
>SRR5712692_9023375
TLGIERIECNAQDARRRDACGKCKVWLCEAAQLAMLTKLGKYEIQGELGRGAMGIVYRAEDPRLGRPVALKTTTAEVAGNPNLLKRFHREAQAAAKLTHPNIVTIYEIDEANGVPFIAMEFLEGESLQKIIADRANIPILRKVHILIDTCKGLDYAHQHGIVHRDVKPGNIVVLNNGQVKIVDFGIARVGVSSMTRTGVVLGTVMYMSPEQVQGQTVDARSDVFSLGVVLYELLTYQAPFRGDDVPSIFFKIINEPPEAITKYIPQCPALLEQIVQRALATDREERYQSAEDMGFDLQRIGDSLKRDTIDVFLQQGQRSLRQGDFTIAKESLQKVLEIDSSHQLAKSLLAQVREQIQSRQRAQKVDHNLGQAKEALQAEQYEDALSLFEEVLRLDPGNEEAKQCKQLAVERRDRSEKVRRHLERAEKLAAEADFQRAKAELEAVLTIEPGNAAALEMIDWVVKELTEQERLRQVRQYLEGARAHLAGKNFVKALETLERAREIDPINIEVEALTRLVRSSQEKEERRKVLVTRVAEIEEALSKGKLDLALACVEQALREFTDDAQVLRLHEQVLRRTEVDKKRRYVEEQLQAARDFVQKNQYSSALAVLERAIQAVPDDPRLGPFLKTVQESQEQSVLEASRRDAVREANEQIRAQNFLAAIETLEKSLVRAGQSPELIDLLQFARERYAEQQQQERVRQALARAHSHLRDEQHEEAIRVLARAQDELKSSEIDALLAAAREQQEAFERRREEVIASALKLLQSGEAARAVALFETAPKVYFTQEEFQRVYSQCRQSLDRANFVHSAVEQAEKSLAEEDIGSAHSVLEQALKPYPGEPALLALQKRLREEEFRLRREERVKLLEEAQVAVGRMEYGRAAELLTSVTWESRDLPELAVQAELLLEEAQRRERERQVLSRAQGYLRNEQYVEAEQFLLGIRNELKTGEIDALLATVRKEREAFERRREEIIAIALQFLQSGEAAKAVAIFEGAPKVFFKNENFQRVYSQCRQNLDRANFVHAAAEQIKKCLAEEDISAAESLLEQALKPYPSEPALLALQKQLREEEFRLRREERTKLLEEAQVAVGRMEYGRAAELLTSVTWESRDLPELAVQAKLLLEEAQRRERERQVLSRAQGYLRNEQYVEAEQFLLGIRNELKTGEIDALLATVRKGREAFERRREEIMAIALQFLQSGEAAKAVAIFEGAPKVFFKNENFQRVYSQCRQNLDRANFVHAAAEQIKKCLAEEDISAAESLLEQALKPYPSEPALLALQKQLREEEFRLRREERTKLLEEAQVAVGRMEYGRAAELLTSVTWESRDLPELAVQAKLLLEEAQRRERERQVLSRAQGYLRNEQYVEAEQFLLGIRNELKTGEIDALLATVRKGREAFERRREEIMAIALQFLQSGEAAKAVAI
>ERR1719240_1252999
IRDTTRGVSDFDYCLCGEAGAKFLVWLHDCTNKLINFEDRDHFDYEHEVWFRPPNATCASPKVKLCAESARCTLCVDPVADDHTFLVQLFGISQLIKCVGPREYAPRLPVVYEAEQNERRSLX
>SRR6266511_3081427
SAPMTVTPTRIFLRYGLIVSVCCGRCLYSLSPRVASETSGADHQVVRITSLAVAVAFMLIGPLLSSAAQEDVLATLRKGHPRLLVLDDDIARIKKQIETDPTARKYFEHLKIAAEKVIQQPVTERVLVGPRMLGASRAVLARVTLCAGLYRLT
>SRR6185312_7578494
SSDLCVHGHEAGSGDRAGGGRGSRQALLRTARLAPGRGDLPPDARDIPGPRPGSGATKLRLVRHLQGPGRQRLVGPRGPAALAGTVKGPTTMGATSTEPTSAELIRDLLEQAAAAHGMHEREIGRPDPDWPRWYAEHMARALRAGGYEVHPSHGDGGTTLPVGSRRPELAGQTVVVIGGSSGIGLETARRARAEGAELIIAGRNPERLRTAAQEIGAQGSRAFDATHPASLDRFFQELPAHIDHLMLTGGGPSYGRLVDMDLADLRRGLDEHILLILQVARRAATKLRPGGTLLFMAGTGARRPHLGLGIVPTVTAALPALAASLAIELAPVRVNSIAAGFVDTPLSASLLGEDLERRRDQLRATLPIHH
>ERR671919_521420
XMRGRGPGEASRRAAPRPFFPLPPRAAGRRGEGSCLSLCFEHSGGERILGRFARPQHELEGLIIALASLERSPKQRLALAGMGVGAGEQEPVAIEQKPVLAPQIEMAKPELLVDQRHQLIDFREPPLRDLEIESASEMQRLQIVAPVQRDVIVAPGARDGQREFVRGGALEAPGMNGGDVLDHIHWVGEMVVDRQCRSHTSPLWPRQSFAFPSCPSANHFVNQLYIGESRSTNAGRDPKTGFAKDSCGLRARPKPLEARATPQANDARTVKTFGASRSPGPAQESLRLLGEALDDGGLERRDPLLQGLVFLARFLRHRLDGLELLAL
>SRR3990172_7588517
RRCGNARSPARRVVVRGSVKPERPAMSIVRSSFLAALTLVSLTACSGTTAPTGEAARQGVVVEVTPESVSVSSGVAAAFDASVTGAADTSVRWSVLEGSPSGGSVSAAGLYTAPGTPGTYHVVATSSADATKSATATVRVAAGYGGGAGAGGEGGGEGACRDEKLRAAG
>SRR5439155_1739346
QASVPVESARTGLVSSSLKCSDNVAGSKRARRTARAHRCGTVAGRVPTAWLSQSARSTSREPAHLHPQTARASASGDRRDRPGQCRGRQVVRRGGGLRALLPRRTRRPRHRAPCLGAPALGLCARCPGGDGPRSGTDGLCRLPKPRSARPDADDQLGEGDHSVGEIAPARTDRELAKLRGSARTERELSLLRGAIDADVTELRTRISRDVDPRRLARRQPVAFFGTLGSVIAVLGFAVASRVKSFRRSRTETELDQVIQRLGGRLDRLKGRTRKRFRESLRKEIGEVESGPRAKQMFWETATAALVSAATLLARSIASRTVGIAPATAAPTTNAKRLMSTSGRAPGAATSNSGNEITTVAVMSAPADSSRAPRRRAMRGPTSAEGENARIVTAGSSTX
>SRR6185312_8989730
QIDAVAGFHRGIDNQNPYSADENVPYVYYNYERSLYDFADLEGTSQIAKCQDGGPNDPYPMIRNCPVTAYGEQGLGYLERDTKDRTSLVASITQRVKAAGYHVIKAGVDAEFETFDINKNYTGGVVWRHDAPSVATGANGRWNQREFLKVVRNLTPAEIADPTSVQLDMGQLLCAGDRAICAVASSITANTTDSNYGAYLQDSWQLRPNFTINAGLRYEDQIGYAASQLAGQETPVGEKVPSQVFNLNDLWAPRLGFIYD
>SRR5258707_393308
GLNSGQPSLDAQNVGATAARAVHAIADRAEVVAEHEPRIARRKGVNVAEHPRFPLAEDPQVTGITGGHPQPGRHVHAMLSAGAHYGVELNHVEAVPDPAAPVELKDADQQLDQFLTWHGLTGRALPAARGNDQSAVRTEIDAAVLLLHPRGELQDKHRRPDQDRLDALLPIEEPLDQLIGEEPSVPYVEFRRVDEVDDAEHIGEPEVGGLNGVGPEDIEAGRPLRVKVEDLQGGGDAAEKPLERPAVAVDHAPAALGPAARAAPELAVERPGHQVASLEDRG
>SRR5213594_1844093
NPGSVCSRIHRHVMMACFNSRLLLHESQKRSPTPRVSRSPRYSTTQQLATDHFRATGHSIPYQRPFLAQNRSCRPASQPGLGLRQDQSTIQYTFAIQQPRPQHLPRGLAQRIFSQPPRLSTSRLPLPHGSPRRSAKNALLSVTSPQSAKPRKWPPDTCGIAFEKLILKAKHADPIPYCQLGKMDVVKASNKNKALTDFRSEPQWPVRTPTPPLRLGVCRGRRRYKRPDSHPIRGRVDRRPASDRYRPVAIDWRACVAX
>SRR5947209_20053041
NACENYSIICCYSDGYSVAGQLISTRSLPVCCFFFFNDTATTEIYTLSLHDALPICQRTIRLVSWPQVNHFALPPLFRGSEKGRSEEHTSELQSRQYLVCRLLLEKKKKDDAKRKKIHHVVILDSKERSTEWX
>SRR5436190_7157327
PSLNPAPESLPSSRIVDLMLSVHKDLVPVSETGKQRFRSQFYSGRDLDDVLERVQRAGVFKREARIAGGLIRPTLADAARLNEERRAAIATALERTSEGLGAILDEAASVFRLPGRIDLRIVIVPGDGPCRFFVGAESLALSAPPGPGDAILLRAAIAIAVGCQNDMIGPMPRGIVATPCDSFLLAAIALQLAARGWVTSYGADVLESAAQRETFATEDDDAALQLCRLAVAVRPMFDDVYVRKTSFADALVAARHVWRGLYAIQYVHGAPGEIPEGW
>ERR1700739_2321498
XMRAVMDRTAPKRFAHSNRPARTVAGPPRHRKAVAGGRGSRIRTCDLQYPKLPRYQAAPYPAGSRHWIAFSPAPSKRRGQSMRFAENRAADTVACLDTEAAGDAGIDFEDRADREYGRDEVIGHRLGIFGDAYDPPVA
>SRR5579862_6422017
TRLYREAAAGCRPARREFLSSPCQRSEYGPAPSVALPPAKPGGRSEAQPSVQSQCISCLFLLNPLHHYVFTLFTWAMQRIGWGNCLAARWTRSFFASQGVPSLPGSSAAQFPLRPDRRLGKSITGQL
>SRR5258706_10244772
EDAVARVVGALEEDFADDALPALLEAVGDLDLVFLAVEAQFGFEELPRGRPQRRVRDVPALSVVLPQRPFVGVLRRALVALAGREPADLQELRLREEEIDGLLDRFLVRAGRIGLRLEGSDGEFGNPVRLALVDDDVDHHVAAIRRELQRVELDDGVEEALVAVDLAHREDVGLERVLDEPLALPVEEPWAVELDAGELPQSPLPEPGPGLGKRVIPADLH
>ERR1719491_1280783
VRDVLGRPSSLLLDCGHGPLLTAACAVRPFAPVQTVEGAGACTGARCEDPSHCRSKWGWCNAGGSYCNKDSTWTSACDGSATTTEAATTTQEHDATTSTFLPRGACTGARCEDRSHCRLKWGWCNAGGNHCNKDSIWTSACDGSATTTQAATTTKQSDATTTMRAATTATTTRVATTTATKPMLADLAPCTYSKTFTHAGWPVQQDSTDVAQMVDRCQGQHFVNNVDAATCVINSNADGYDYDKWTPQTACPYPLGQSPDVSQAQCQAEFTRWKSMGVRMVSLAGGVEAMTGIGHGVFNGVRGECALMEFQGRYAVIMQVDIRSWSMEFTEQTLNHLTNNVNPGGHCFVPNVKVIDCATVRAX
>SRR4029453_3979317
AVGLDPETTVQEFLDEMKQSENEAARVASTPSEVTPEDRAFLERQKRAIRLLQIAGVLVVVAAGTGAALAYMKWKKSAPADAPAAAVAPPSSPSPPTNSPAPPPGPPRPPGAGVSAPAPKSSTTTPASPPPAAGTSQSPPVTVVPPEAPAPVPVPPAPAEPLTIEFEGTSACFV
>SRR5437868_9650668
PNSHYSTHIIDILSLLPLYLYMQLLYFLSFFFNAPPTPDISTLSLHDALPISHLRSPETRRHRWRGRCLSPRLAGQLGKGSDHADRKSTRLNSSHVSISYAVFCLKKKKTLNHRKYLAYDYPSLINLSRIIRTLL
>SRR3989339_1542112
WHFLFFMDLFLIHCKSIFLKNKIERYLRVPYDFMHTGLFLCYTITMTNELGTLYVVATPIGNMEDITLRALRVLKEVDVILCEDTRTTKNLLNKYDIHTKTLSYNAHSSDNKHSNIIEMLREGKNLAMVSDAGTPCISDPGVLLVAYVREEFGKEAKVVPIPGASALVSALSASGISSAEFIFIGFLPHKKGRETLFKEMATTNRTIVFYESTHRILKTLASLDTFCKNHRVMIAREITKQFEEFVKGTPAEVLEYFTVNTDKQRGEFVVIVDPKX
>SRR5438552_9638688
LFRLVPVAFAVGAVPLGPPPPAGMAGRDFRLDGLQMELAWIPPGTFVMGNAEGDEDERVTTRVTISRGFWLGKDEVTQGQWDQVTGDDPSGYRDAGPTVPVENVTWYEAMAFCHRLTESEGVAGGRLPPGYEFRLPTEAEWEYACRAGGPGARSTATALDEIAWYGGNSHGRTHPVGQKK
>SRR5580693_6454278
RTLTKLCYILFVWNVDSALFSQKLLLSGQCLNRADQSPGNRNGQKATKVFGQTENMKTLKARVLSVLSFQPFRRGNKSDGQSKDTIIKFWRMRCSYPGPETPYECELREPLENFASKKYTVGLNGFVEFELLSKPNVAAGDSIQIDAYEPEEKILEGGNGEHNPRAGAIDDC
>A0A1H1AGA9_9GAMM
MATSKPHRLSSCIALALHCARAGIIGGLGCAAAFSAYAGCDSTAPVSGQTVTCDANVPNPQTTGVQAVAGSTGVTVNIVDGATLQIAAGPGVQVRDQSQVNNDGSINLSAADTFDAIFAEGSGNTVVNTGAIATAGGASDGIQSNGSNNTLTNGVGGSIVTTGANANGMLSLNGSGNALANNGTITVSGAGSSGIRIDGAAGGTNTVVNDGSIASQAGIGVLFNGSAGSTLINRGTISGATGGVTSGTGNDRLEMLGGSISGAVAQGAGDDTLIISAGQLSAVNQGDGADRFEISGTGSVTGTVQQGSGIDTFLMSGGQLGALLQGDNLDTFTMSGGRIVGAFEDGDRATMTGGRIGRVDMKLDDNVFDMSGGTIDGNLVTGFGNDTIRLSNGYIGGNISVSGGNDSITVTGGTVRGEVRVSAGDDTFEWAGGGVIYGAIDLGEGTDTATLRNLNQSHLGATPSLSGGNGVDSLSFANVTSGGVARFGNWETINAGNDTELTFDGNLVLGDAASGTGVLNVDASSTLFAGNGASASLMAFGAGQLATVNNAGRIDLTNGAASATDTFTIVGNYVGNNAALFLQTQLGDDSSPSDRLVISGGVASGTTGLEIINLNGSGGSTLLDGIMVIQAINGASSSNSAFALMGPVAAGAFEYFLFKGGVSGGTSENWYLRSTLVAPPASPPPTPAPAPDPLEPTPPPVPPTPPEPPAPPPPTLPPPPPPEVPDNPDPEVPPAPPPAPPTAPPPAEPPAPPPPLPPVPEDPAPLPTPSPEPPPVLPTPPTPGATPATGTVIPLYRVETPTYAVVPPIVHQLGLATLGTFHERQGEQALLDSEGALRSAWGRVIGQNTEQSWTGTVAPTFDGSLWGVQAGVELFAREGDDGRRDHFGLFVGRTRADGDVRGFALGWNNLTVGQTRLDDTHLGLSWTRIGTSGAYLDAVIVASRYDGEATSSRGIGIDLEGDGVTVSLEVGYPTRWGEDSRWSLEPQAQLVWQHVSLDRQQDDFASVDFDSDDALTGRIGLRLSADYSTSAGLLQPYLKLNYLRGFSGEDRLHFNTDIVETDQQFDAVELGAGLVVQFNANISAYVVLDYTTDADDADRERKTVEGNVGLRITW
>SRR6266849_3749832
XMGRGKSYLEESHELQEGTVWTSVQGNGRSGCEDGHDGGRGAGVADCGRRRSGDCYAKLARIREAGETNGDNTRQILLQHQGADAGGAGASQAIERKTDGGAEADRGVGERVRIPVWPGGRIAGGIGGLGGGGEQVLPVFX
>NGEPerStandDraft_8_1074529.scaffolds.fasta_scaffold152358_1
MAGSTAMARRLSPCPALPATARTAAGPGPGGGSGRCAGPGRHLGVPAPELGELVLRAQIHELRGEVDHAQGGDVRHAERLSGDEAGGRELVVQTAVESPGRTLPLLLRRGNLLAVRQQPGHHRAVDPRLAHGAEQLELELPVGHVHQADRHRVGAEQGRFRVERLEITADGHGFGDAGAVVELQHRHLAAGIAAQKLRRAVLAAPHVHLDGGHLDPLLGEEHPHPPRVGRRGHVVELQIRLPGCRX
>ERR1711990_8348
FQLVSPGTNDVNRVCIDIDPQVVIVPHHYHVHPEGHPRDTGGPPSLPSRQESPCPVRVAAEAVVQEVQVSLSSHHQEVSSAPLHGDGDVCTVALPPAPHIHHPGLHVQFPLESQQYKYGGRVLQLFIFLCNQFDL
>SRR6185503_5987732
GQPRAVRAHAQRAEREELAPAGERVAVEQHLLAVEGSAVRGYRRRGLVRADGTPALDAVLLALLGAGVVPVALLAHRQREVGLLGARLDLGEERLAQGGQVPRGGVGVRVLGLEVLGRRRVFLVPEPGVLVDHGVDVDRPFGRDGLGYLRLLSRHVDDVTIRSSWNTRSRDCENPEGLRKYLSGHCQ
>ERR1700694_3206782
KRQRAMENLFTGADQPRKLRRQPLSGLRKWTRNYIPYLEVLEDRNLLSAGTKGFGAQIRDPGFEMPAAGTGNILYDPPTSPWTFNGSAGLAGINSGFTAGNPAAPQGPQVAFLQGVGSLGQTTTFAAGTYNVSLSAAQRGNGLASSQTFQMLVDGTVV
>Q19Z88_9CAUD
MTLDALASLPGVAVIQLPEPTEAVTMQDCAGSGKPFKPGTLSRDGEVAKCSACRTNRYVRDDGSMWAPSGARCCGCGYRGESMILSHVRTELERSRNHRFYDRPVNKNVQAMYVWWEYMDEIDLVNGENDTMRITLTEEEVHPPPGDLFHEKPKVIRAIQTWTKISLEYQINGAYVDLRTLSAAESIRDDRWIPLEQYQIQRYCIQGRIRPGGNGYEPYRIVILAGEVSPPGVWYPWPGQPEGVPNEVLDGTYHGMFMADK
>SRR5690554_76201
XMRAYLSRFVLFGGFIMEIIQNIAVAIDNLRISKGLTVSELCLDICDESSYRRYKSGNRDIPIAKIKQFCDKLGIGLDEFLYNVSVKNSYEYKKIHKMFLDLQSKKYDEIRKSLPLIKVDDIGIDRNKVLFKFILYTYQYETKKITSSNYYELLLKLLPEQSGFYTFNDLIIFEKLALLEVNQNESPSLKILLDILLNTEKLYVTNTNQYVLATTYANVANYLTKRKEYEEALKICNKGLEYSKSFYVTKNIHYLYYLKAYCLFHTEDKEGATFNLSIVISWVFAIQDEYMSNYFINLIMKEFNMTKSMIYQMHQKVLANYLX
>SRR6185369_2141686
SSDLRAGVEVRQRRQRRLRDAREVRRQALAVRRDAALLLLRRFPLLDGGVERRLGAGRDLRLLDLRRLLDLVLLLLGFLDLLRRRRLGRVLVLRRGRLVLIALGDGLARRRAAAHRRRSEQQRQPISVELLHYFISSCWTGVLSMTMS
>SRR5262249_26280313
MGRLQTPFQSKEDCMDDAEAKVIELIFGSWRSQLLYGGVQLGVFDALRRGPVSADQVARELQVDARLLYRLMRALGSLELVHEDPHQHFTLTPLGEVLCRDHPQTLRGLTLLEAGPEHSAAWMQLPELITTGQQDAFGREVGQPVYAYADQDPSYAAVLDEGLNTYALLDNPLVLEALAAYDFAGIAHLCDVGGGHGLTLCSLLVQHPHLRGTVLERPHVLAQPDAFWADKLGVSDRCTYVVGDMFHAVPPADAYLLKRMLRHWNDVEGGQLLATLARAAPAQGRVFIIEQIVPGPDTPHFAKLFDLHMLILLTGRERTLEEYTRLLAGAGWTYRQTWYPASKQLGVVEAVKASDFNVLGSEQSEINGFEHHRLFHRLRNPCLIIHRASYFRSCFAEREEILVDLILVRRAHAVRRALVDRALGQFIRLHGKAVAQRGMPHANRSSIFTGSSRTRMPVACX
>SRR5882757_3079952
DAVEDGVAGHFQGAFQADVAEALVLEVLEDLVADGHRRGAGVLAVDVVPGVDRRGGGHHLEGGARGGDAAHPLVGVVGGGAGHRDDLAGVVVHHHGRAGVGLVVLVGDRVVGLAGVLHGRVELLFGDRLDLGVDAGDQVVAGGGRGVALLADHPAQVVDLVVGDAGLAAQLGVVRALQAGAADLVRAQQRVVAALRGGQLGVGDRGEVAEHLRGVGVVRRRVAAYGGGLGGDAREVLAALHDLQRLLGGGLVGDRDRLVGRAVPAGLRGLRVAQPHLVQHVLRLHAEHVGQLRQYGLAVVALLEQVGPVGGDHQPGLVVGERHPAVVQYRAAHRGRDDLLDLVARGFLVVLLAVADLQVPQPAAEGEQQGQGEDLQDDQPDGDPRGPAGLRDVTHLATRSPGRRIDLSHLACAPEQAALGGQAGSGGTHAGAVQASGPGTRAGAAAGAAQTAEAATEAAEAPAETAGRVLGQRVVV
>SRR3972149_160959
LVNCWPVFPSFFFWWWSLRLYGSSGDKIRMRCEALLAAILLLAAIPIPTATALQNTALYAPTGDVQAADSFAVNGCTYAARHTCVDEIPPGPNDGDTTRLQSNVTQDESQIDLTAYWQLDPEDSVVGMRIHFFVKTLTGSWPIGTTLMIFIQENIGGGRICYFETFSPPTSTGSYRRFSYPAGYDETCINSDVNTWEILVVLDCDTPPNCSNWLRITSIYLEILYFDRFGFPSSPENFAWIIYAILIGSGCLIAAWRIKKWRETIX
>SRR5262249_38322783
GLRGRGDGRMSAAVRRVLCTVLLSGLFVTVTAAQDAKMPVPAERKKALLEGTHVFRRILYDNDCTSLKNFKELVDEPSKSILIVFGDLDRIADVPGGLANFVKDGGAVLLASDRPLVDRDARAQLLAVAGVSINVETVFMNPAGGQLYRGWPYCPFPDPAAGASPALFSGDSREGGGTLSVATNVPTHLVVHGRPRGINVLARLPANCQYDVTEAERQRGFWVGRFPHDRTFLVGGDVGDGRILVAADHSVFINEMMLPDDTNNVEFSINCIRYLRGGEQRSRV
>ERR1700745_413936
KTENVRIPKTLLLFVYYRTRPLPHLSGVRFAMAKLCTPCRRVDVALLDALDGSLHLDLITFSCNHYRPCPPHFPGPSHRVKSAGCLRLLLWRGLSPCIPVRRSRARSGSFFLARYDRLSRYALFGSPLSSERDNEYAFCPGDVVLRPRRGMAIATLPTWNRCRVGLTGLSRAGLSSSPAV
>SRR3954463_761953
GPALLDEQELAARMAVPGRARTGFETPAARDGARCVERRSLPGKPRRFRVGGGLLGAHPRGRSAKQHEERAGNLYSLHGSDTTPAKLVRLKPEATNRDRSRTLRQMNRRTFLKSSGMAMVSGLAQRGAAPMERTIQTPVLSIGFEESGSPSGFPIVLLHGFPDDVR
>SRR6266566_9387372
APAVSCGQEKFLAAPAQPEGLVVQPLNNCIVFRAVIKPSGVEVNDMVSRDPCHLLENGIDKEYVITIVSNHNAFVQRLQNALHLFQPVRLYNIHDVFHFVHSATCVSCQNGHLAASLSDPARHKCVRRDRGSVPTCTSSSSLSRETRRX
>SRR6516225_4656599
RAVRADLSQRACHENATHVCPTCSNRRAARVPKAPCGMGYGNGRTPSCPLQRRSRKPRCPSRRARRARSSGRGLLSGRLDGGLPPCNLPAGDEAIGDGKNVVKYIDAFNHFFPRRFFAGVLETPAARKDMGKRIRGIPALWDLEVRLGIVDSFPDYSQILSLAMPAIDRLWDAEHAPEWARIGNDELARARCQVSAAFSGLCGIASDERAAGRDSGSGTGPAQRRQCDPA
>SRR3954451_7163765
RQCFDQLLFLAGVADGAPSGIDARRQSGVRDDATIPDASDEVVLTDDTFPVPDQIVQKVEYLRGDSNRVGSLPQLPPFRIQHEIRKGVKQMHPPVVRSQCKQTVRRMEGACKALLMTLAHPRARLSSMNCLRIPRHEGEYHEADGCTDVGCHCSEALDLGRMRSRLCEPRSRSMLAAX
>SRR5262249_15769881
VVDANFNPVAGGDDGDKVTITTSLSSKVLLSPIAPGLSLTTVLSNQSGMRLLGFPDVIFGYAQAPFADVLLNAYDQVFRDWPIDVKDKRTVGTSSMCTEASFTVTATVRATPAPGLSSHDSVLSAAGTLGAQAPPCP
>ERR1719265_1088395
SVLPTSHVRFGDRRNIRPLQGAKIVYRAFDPVAGWSPLLVNNHHSVLVHGGANAVPQSWPRVLPHPYHDGPEDLGIARGSGAHNDHHVAGGNAVPPTHASLDADLPDDIQLPHPRGVGTGNLEILRRRRREVHECDESRNGAHHQRKPFARTIASASLLHLATPRARQLPDLEATQPWLVDDGLSAGX
>SRR5680860_510741
GSGAAGGARPRYGAGRPRCRGGRRGGPARAGRPGRCAAAGGDPVVTPVKVWPYVVGAAACALLQVAVTLGFAATVTMSGDISSASPSEPAPPLPLPGLPTPGPPPSEPSEPPSGAYAEPRDDRPVVRLRFDVADDLTTVAGSETVVFTPDLRVCELVFRLWPNKPETALAGNELSVTSASVDGASVTPVVEAAGAPSGTTGTLVELPVEGCAEPGEQVTAELEFALVLGEDTPERVGWSAEESMAWFATAFPLLAWEHGVGWMRNPAVGLAGETVASETFRLESLEVVALEGLEVMGTGASRGETDVGSSGRVAHVFSADAVRDVAVVVGELEVSTTEVDGTAVHVAVPVAGSVAGVDLWESASVESLGLVSGYLGPYPYTDLWVTVVPDFPTGVEFPGAIFYGDVDPAVFVQLVPHETAHMWLYGLVGNHQGRDPWLDEGITSFVEAHVLGVSEFLVDQPVPPPADGYLGASMPFWAELDPSGDLYGAGVYGAGASVLASARAVADPAAFDASLRAYVSAQAYQIATPEDVREAFGSVPEALAVLEDAGAFAGDAGDPX
>SRR6266849_1400336
VRTCSTNSGVSDGSNRSLQAPNDLDSEMRIVNDRDLRVVIEHHLQQSCARPGTADDKQIGVSNRTVFAPAFVPDHDFSEPYSLRVYARFTCASNRTCPANLFRLSRATDPAEEKPPTSRPLAEGDSAGAIPQRNQVAGTPHRPQSRAARHLFGRGIVSFGIVDASPARFADHGHGAPNEDX
>SRR6185503_8510077
LVEAMRGSIAVDSTPGRGTTFSVDLDLSIDASAERPLQSARTVIGYAGTRVSIVIADDDAVSRGLVADFLAGLGFEVRRAPDGAAALEQLRNAATDLLITDLVMPRVDGIELIRAVRSGLSARAPRILAVSASASDYTSHEALDAGCDAFLPKPLHLGDLLDRMTELLHIDWQYQDTPAAVGQRSAASSTFALQRELADELYHLAMQGDIAGLVERANARLSDDPSACGFCDELRALASEYDTGGIRRMLSAHSPA
>SRR4029434_6363074
SRCAAVGSNTARFGGRESPGNGAIVNGTAFGVSGWALDAEDATLTVQLLVDGAVVSSSPTRSARPDVCAAFPSVSHCGSSQPGVTFAWNTTAVADGPRTIAPRATGPAGLPATSATRTEMRRAHA
>SRR4051812_49403107
HVVRHGGIAKAAAAGCGDLSSLSKLMKGLEEELCTELFKRNPFRLLSHGRIYFAALERAREVRDAAMDQIWTETRPTLQLISAEVVTLCYFPGITRELERKHPNLQCSTESGGEEQIQRMLRDGDVNLAIAPEHEGWRGFQRAPLLELRPVLICPEKMPFRSAKEIWALPEP
>B4ND15_DROWI
MAKKGAVQQLQADLQNDEDFARFLERPGLLVLDVYSDWCGPCLGMVGSLRRVKLEYGGDNLQLAICKSDTITDLKRFNKRSEPTWLFVTGGKAVNIMYGTDAPKLLAVVIKELEKTLQKLPRSHVYDIAELQPIEVEQLRVKTEALEKLERIERDAKNKKQNDYLNQVTDAIMENMPDIGVTVFGPQVNRDMFKKLTEPAEPLKMQCKDRKVVQVTAEQFDIVNYACRNPMPPDVLEQLDGKELLMCFWKIDETVGTVPNVLAAYAHELTKERSAPPNEQFFEEHAIPPIISPMKIKFEVELKEGEVWVEDVSSEEEQKPVKGKKQPKLKSPTHQEDATPVPVDEEVGEQDGEEEGSEEDGPEYGADGLPSLPSMPFDIDLDLDLGDDMGEEEEEVKEEEPPKPLTRTKTVKMPAVWVPNNRRTHAALIYMFFRGQTTGFLAPDPKPEPPHIIMAFDATKRREIMHVVERHREEVPLYGYFTNDDPDGTELIANSTDKYDYYPEQLLSDKIVLKVNKVQSNMMLSLVSYGPSYVSPNVTAGHDEALKFFPDDYRQQEEPPADVKQKKVKKGKKGEEIPEKAREKAASLEPQRTTLPADAGAAVSADVQQPGEDIEKETSQTAVQGAEGEAAVPPTTEGEGAPAPEGESVVAEVTHESAPTEAAAEEAPQPGEAVAETSAPPESAPPEVAPEPPKEETPPVEAPPTEAPPPEPTPPEPTPPEAAPTEAPPAEEPPTEAPPPEAPPPDAE
>SRR5690606_34130643
XGLQHTPTGHRRSNRRRDRTDPLRLGVVERLIDRLARRCAPPDRLPARPERRPFDRHNPRPSQRHHEPLAQRHVITRRLQPSRPQPAIAVATVAAIALTRCALAYSNVLLTASTGVAPPSIASKIARSVAPLIASARDRADALTNPSVSASSX
>ERR1719410_660988
GSNLVKGVMPIWCGGSSRSRSRGNRQPHRRRSSSRRFSPPRGRGYSPPQRKDPPWRRSISRCRRRSSSRQSSLPRRSDGSRERSCSRKHSPRRPNRARSVSGGRNYSPRRVGGTKPDVPVPVDGEPAEFGKARVLKNPSTGRDETWKAEIDIETGEVNHVGRRRVMSIRGPSRTTKERAEEDARRLEAAVPQGPQAVRAVGNQLQKTKRGALGVLAELPGVHVLATYTDLPPLPALRSSGTCRRPIPCMLPDVKTIMDLRLRMGEVYMKDEAVLLRVATLRVTLGLAPEAAPC
>SRR6266487_7083492
WREDFARGTEVGVEVGIDRAVSQDRGGRLGAGRVDQRRSGMAIIRYHMVAVIGRDCEAQELIRRWLVADQGPGNLDLNEAAWQLAVGRADQLRSAAVATRRSGGAAVESRWVKITARRRGESCLNHIFPAGSAGYVGADAVRQRVDSAGGVIGIDRDHHLRRWIVRDSTDAIYLDQKIEVVAVAGDAERIQIGLAGDVYGTGDDSLVVEGVIEDELALIGGVEI
>SRR5574344_1391919
KLKPQHGALIFYVLFAAGAGLELLEEVIALVIHEDECREVFYGNLPDSFHTEFGILNALDALDGALRENSSNTADGAEIESSVLLASLSDTVATVTLGNHHERSAVCLELIHVGIHTVGSGRTHRTARIAFGSLGRSCIENRVILEVVGHTLTGIQASLELGMCDVASHDDSALEVDAGADGILRQFGTHGVDTLVEIDFDPLGTFARIAHFGRDKLCGVVVHLLKPYTVLVDLCLDVAVGRAAYTHTDGTACSVARQTDDTDVVGEILTAKLCSKSNLVSLFEQLLLKVDVAEGTTCLVACGGQX
>ERR1700722_5898992
VDLGAREHQVGGIERKTGQDAQRLEIGRRGNASQDGEEHQRNGAAKEPHIAAVTPRGAEGARTVVTAPERGPAWIAHGRCKAQCAYPLRGPAECGRESSARGYLNAAPPPNKSPCNYGCDTAVPSLRTCSGMGKNVLTGPAREVEAGPIGQEAETGGGKLGAPLARQHEVKLVLEGVQKQHIGGRIGDLSIGQLGRTPIGXX
>ETNmetMinimDraft_35_1059890.scaffolds.fasta_scaffold1061826_1
MRSLRIDAGMRGFCGVLALSVLLAGCGGVSDLAGSINPFSREKKLSGERQPVFDGADPATVATARPASVGPASGGQEWPSAGGGLANDPGNQAISVTGARVWRSNIGATGGGLTTDALRASARPVSAGGRIFIYKPNGDVVALSTNGGRQWVKNLRPEGERDVAPGGGVAVSGGRVYAATAYRQVAALDAGSGQVLWTADLSTPARGAPAVGQGHLVVVTQSNEVIALKLEDGSQAWSYQGIEEIGGILSAADPAIAGNQVVVPFSSGEIMSLDIKSGEPQWADGVTRGFRTQALSGLADVSASPVISGDTVYATGVAGRTVAASLKTGTRIWGTDLGSVHTPVVSGNALFMVDLEDRMVALDRKTGETLWSTVLPRPEKKKRRRNWAGPILASGALVAFSSDGRFAAVDAASGQIILTKDVNTKVYVTPIVAGGRVIVLDGDRAVAAFNX
>SRR2546427_1622280
PAFSRCHEIMVPPIFVTDSPETSAGARKEPASLGAQSRASPTPSPSASVEHASPMPSPFASACVGLGQVGQLSSTSAKPSPSVSRRTREQGDPLGREAPLDWLPRPDSPQRFLDETRX
>SRR4051812_6966754
SLRPRRPTKEGCSMSLRRRAVTTAFAALAVAGLTAGCASTGSQAADSGGGDVHATPDAAYPKDLGWEPMDNSLTNLACTDNSYANAVKKGIKLGIYSAAPYEYMDNGKPAGLDWDVNMAVLKYLGIKKYTTVTLQWDAMIPALKSNRID
>SRR5262249_18224374
TLAPLAVLIVASRSPALRLWQRRQVMELTGKQIAVTGATGFLGRYIVDALLKRGARVIGVVRNPDRVPALAQRGVEFRKADLTQRDQLVKGFAGADAVVSNAALFSVRKMFALGSSVWDEHERTNIAGTRNVFEAVTAAGVKRVVHVSSVAVYG
>ERR1719430_1578260
GWSSPPGGTRGGWSCPPRSSPWSPWWPAGLKWFPGHFVISECLPEILSSSPSVLSYYRSPWDFHRKRRVAIQHLIQDHTQGPPVAPGVVPTLGEHLGGDVVRGTHSGVSQLASSSLPTLSLPLGLRWVGCQVERLSLRIVFVEFCSMSFLESSAKTKVGQLDVSAGIKKDIVRLNIPVYEAKLVYX
>ERR1712156_240685
LNLMKQAAGKFTFQIFLFKPQSRILKRSLVSLERSNRSPFQKFTVLEGQRGLLLFVLLLKNKEKLPLKDSMVLLLKEESLEFELTKDVLSVLNKTLLIVVVAVADHKNKDLNSQNQLKDVPRFTSGIFRGSLMKRSWNNYFRSLVQSRTHEL
>SRR5581483_5340204
VRVFVVKQRVAARRVARGLPGVGEARLDVGEFLAMLGRVAAVAVTATQVERLLVVRVVLVLVTREAAGALHGRRLRVLAQQVEDRLADDDRFLAPAWRDPRPAAAQHQANDDRRGHPEQDGKAREKLRLDRHEGRQGTLRAGFGAAHPWRSRCFVAGRVFSVNGKPRPPRRRADRAELACFPRLPNLPSGHYPSCRIPWASCPCTQGETPMFPHLARARSRRRPFSWKPRLEVLEDRRTPSGIAKVQDLGTKADTTMAQSVSINVPAQGVAKGDTILVTVATTEADPTQGVSVTDGAGNLYHRDADVLKSNERLLVFSAPVYHALSGGGSITFTQSGMAGSPTALSATEFSGLLLHDKSAKATGIGTTASSGPTPITSEANELLFGAIAANAFNVNNPPPSTMITAGQAYTGLPQKTVVDSVERTDLKPEFAVVAATGAYTADGTIAANREFLAALTTYRQVPPLSAVAVTATVGPHTKDNRILVLAGNTDPSGGTLSVQSVSHPAHGTASX
>ERR1719323_1321519
GKCGNLEGVRVLLVLVHGFGVNGLGLLWPRGNRRGRRLRLVILGRRQRRHGGRGGGRAGSPDRGDGRQRGSVVRLLLQLLLLERVVVMVVGRGCLLLRVDVLLLLGVRGRRRRRRRPRPAAHGRGERRGQRRGRDRVGWSRRRVCRGGLRHK
>SRR5690606_29123364
LEGVPARATIRAEYTKMKQERYTFLTAELAQQVRDLIAFKHRERNLACRNSKDGTYYIAKLKPKVRPNDLLFAIYRRDETAKMAPKVQSLYNMYNVKLNALLDTMGLDAKEDDARRRRITEYSLRRYVKSAISNAX
>SRR6516165_751239
XMRFSTIIVLLLFASMGWGQAQVNEKLETAFIYVDVNTGSDSNPGTASQPLKTIGAATSKALSNNHQGVGSRVIINPGTYRESISMGKNVRSTSLPMTFEAATSGTVFVSGADVWTGWTPYSGNPSIYTQSWPFQWGLCQTVTGSPNNLEDIVLRREMIIVNGTSLTEVLALTAMRPGTFFPDEANATVYLWPPSGTDMSTATVEVATRPVLFSDQGQSGVVLRGLTFQYANSCREKVAVGFNSASNVLIDKDNFFWNNADGLGMFYSQNFTVQSSVGNHNGEHGLDTAFVKYGVWQSDRASYNNWRGAQGAFYLWDTGKFLYNHNNTFNDHRALFNQGPGVWFDTDAADTTLTGLIAVGNMMNGIFVEKSEGPVTLSNSYVCGNNPQGWAPYGGVGLRNSSSVSLIGNTVFGNGFSQISIVGEAGGILVTNWETGQVYNLQTENLALSQDIVVGGPTAQVFSDGTLGGEDWNVFASTLSSDYNSWWAGPNTQAFTVPSPSFENLDLSGWQNMTAQDTNSSWTSSTSPAACNVQSQGRDYWLVADLIVPVTVSPAGVAAYNLTTMPLGGMTGTVNLSLDGLSGIPGVTASFAPSSVSTSGASVLTLTTSPSTPAGTYPFTVIGTSGSITRTVTIPLVVPTTSVRLSTTSLSFATQTLGTTSSAQAVTLTNTGTLPLAMSGISVNGSFAETDTCGASVAAGASCAISVTFSPQWLGTATGTLTLNDADPTSPQLVSLTGTGQGALVTWAPTSLTFAGQAVNTTSPAQALTLSNTGNAAMTITSIATNGDFAESNNCGSRLAAGASCSVRITFTPQRVGTRNGSVTIVTNATLNPGVGLTGTGLGPLVTWSPTSLTFAGQTVKTTSPARPVTLSNTGNTAMTIASITANGDFAQSNNCGSRLAAGASCSVQITFTPQWAGTRNGNVTIVTNATSNPGVGLTGTGLGPLVTWTPTSLTFAGQAVKTTSPAKPLTLSNTGNATMTITSITANGDFAQSNNCGSSLAAGASCSVQITFTPQWVGTRNGNVTIVTNATLNPGVG
>SRR4028118_1117479
FNDPATTEIYTLSLHDALPISHVASTKGSIQSRPVAIACPSLVLKLSASEDRKSGSAGMPRPISYAAFCLHKTTHLRAHRLHHAPSNLAQALTCARPRLSADASSRALRPGHDRWLCVVFFLMMRRPPRSTLFPYTTLFRSDRGRASRRRSGRWGRRSAGRRGAX
>SRR5690348_14199435
AIVSRLVERGNTDRFAIDLCRRPDLVRPADIAWLGSKAQRASEPARALWLDLLDWVFYPLMASSARALLDAAAVNPIVHERFADWLDPVEFGSAREVTHRDRYENATRSEAPERPLGPSPRTIVRRFLRRFESGDVDAYWHLQRALQAEAATGRSHLSEMDLC
>SRR5215217_5590548
QADTFPPRITLTESPPANATLTSNPTIRGVVVDNPPPGVQLTVKVDGAAPVNVPLDATGQFQFTSNFTTDGGHTLEFQARDPAANLSAPKIVTFTLQTGALTVDLAAASDTGVQGNRTTTLNSVTLTGKGPANQTITLVPTGTTTTADANGNYS
>SRR5262249_54389218
PALGARQRDHGAVPDTERKWDDDRSGDAFGGERVLWVADYPAARWLGGRRLARQTIVICRTSKRRQFPESPVAVAHWPADTTEESPQEPALAPRVLIADDQPDVLEALRLLLKGEGYQIDSAGSPAAILDAVDAEEFDVALVDLNYTRDTTSGQEGLDLL
>SRR5262245_362740
AVGLPAIGMLKQALESGDPEIARQSELILKKVEKVPSEALAAAVARMLGRTKPDGALDTILAQLPVADDEQVADALRGALAQLAAKDGKPEPKLIAALSDREPARRGAAAEALIKSKLTAVEADVRKLLKDSDPGVRLRVALGLVRVWRAKDAVPTLIELLATGPANRVWLADEVLRHLAGEDAPAVSPFGTAAERARAREAWTTWWKTNGERVDLARLDKEPPHLGYTLVLKMNRNTGLGEAVELAPDGKTVRWRISGLQYPTDAQVLPNLNHVLVAEHESGAVNERDLNGKVVRTWPVSMPIACQRLPDGNTLVAHRGGLIEFNAKDEKIFAYDRNSHDIVAARKDRDGTYVFLTRNGLCERIDAKGKSVKAFNGGRTYSYASLELLPNNRVLVSQLTGVAEYDLATGKLEWSATAKRNVTSATRLPNGNTLMSSITSNSILELDRDGKVVKETRMDDGS
>ERR1719242_22332
SHSHFSTEHTAFNQYNQAPSSPTQNYSTHSSLPCPLSATIHVIVQYKKTKCHTLSTVTPILKEGFAEQNGGTKFIVVPLGDPHWSKRLQRRQQRSSNPGDIVPLQWRIHFDLGLGLTHFVLQFRHQSASKVLGVGGPSREHNLFIQIPSQIQIALIDAVKDTVLNAAIFRTDNGGIEQDLRCSIPGTSNTQFRTVRQLIFRCISQSTTNATRCTIPQIEVVHNIRVIRIVFGIVISTRCCTTSTTAGCSQGTDTRGSTTSHDLX
>ERR1719359_2831734
AQHKNLGKGVGVRNDPVFKVSNQDMLKQMDSHDFSGEGSRTQAATGIVDLMKIIKEDLQSDMKKADKIEGDAQAEYDQYKKESDKMLDDLKDKIDDYQSQKADRNTDIDDTEDAKQDEESDLADYNQAMNVLMGKGADDIPFPCEFMLREFHNRRHRREAEVEGLHE
>SRR5437773_2584272
PESDAKPFQHAGLSGCRGGSFLFDSRRTEGFEVDVLFRNAPLRQAVSDPAHHRPRATQEIVIVTRRQHLLENINGEPAGVLIISPQDIGFLGPAIADVHVNVVMLSRHLLNVGLLNMVGSTSRSEEHTSELQSHHDIVCRLTPRLTLFPYTTLFRSQEIVIVTRRQHLLENINGEPAGVLIISPQDIGFLGPAIADVHVNVVMLSRHLLNVGLLNMVGSTSRAVEEPYFPPX
>SRR4029453_10054290
TFDKDTGHPQHGTSPITRTTGELSLATNVVIQGPGASALTITRDGSGATFRIFHNQANVTSTISGVTVTGGNVPASGAFYGGEGGGILNDEGTLTLQSVVVTGNFAAHDGSGVLNGTVNGGAHATMTILDSTISGNGSVFTNAGGAIFNHPARGNIGVTATDTTISGNTAFGHGGGIQNRNDDEGTGHTAQVTLTNCTITANQANAGGGGINNLDTVSLRNTIVAGNTTGG
>SRR5579859_1338868
EVILAGLNDSGVLAGWYMNDVTAAAIFELVNGRFQTVSLPVPDVISASVSGLNNEGQLVGSYETSTSGHGFILSGRHLRTLDLPPNWGGTGLTPGRINDEGVVIGTYEIESDFVTVHSVVWTDGVFRKIDFPGAAATIASYLNNRGEIVGTYSTSPAGGIANTHPFLLKDGVYSDLSSLFPGTFAIVGINNRGQ
>SRR3990172_9676722
LLFIDEGTEMFQFPWFASRPYGFRPGWPDTTPAGFPHSGIPGSTPVCGFPGLIAAYHALHRLLVPRHPPYALSSLTPLPSGRCGQRPEPPLAPSRRGQCPGSPPTLFTCQRTRGISPPEPSCPHSPGSPGGDERSRTADPLLAKQVLSRLSYIPTESPAGTAVPFWDRPPPAGGGPFW
>SRR5580692_1321847
DLGLAWSYYDLAQKMTQKSLSANVSLLYFSESQKINAALERIPKSYAQGHIEERNGHKSFVDSSGTVVGQERWPGTLMSEKVRRKQAEYNTWLETRAKETSLSNIRLVPQYPRQFLVVGANGALSADHAEIAEIRVPRHIELTGVLDLDTLAIGYYKSAIEWAELCKAAGANNQGLTRPTKEEDFKE
>SRR5262249_47273405
XVQIHVLLAVDGNHPGAGVFVLGDDANPPPDVVRPGRAGSVGGDQAVPAHTVRVALEQRERHGATGAGAPGPVGAGLAARGSAAVGAGTAERIRAACGSVVDEPVAVLVLPVANLDPLGRVVGHAPEVRPGGSAVLVSGRSHRIGAGCCIGGSRQRNTHPIAVLDASTSIGQLAGLSSLGPVAVRRAATVTGDRAAASVGEGAPGSGTRATGRRVAAPETAVQVAGLRTRGAAGSEAPAVAGRIQLALAPDGGGVAHAGAGALVQQRATCTAX
>SRR5438093_5564102
SHIPDAVKILCDTRIVDHARTGEVNITNVRLAYHKRIGARAWVKDYTIECELAGDGNVSDVRNIKGRDICVFVRHRFGCPVSGCVPIIVGRIQLPSRAPSVSGGERQQTGYEETEGSFHTTVISTANAA
>SRR5919201_5360144
FRWFAASAETVVQPSSPTYWRSSAQIGQTRGGGPGGPAWFPQVRQTGASAVASSATAAEPFAKRRQVVVEIGRGLVAVVGLLGERLQDGVLELRIELPPHSRRRSRLSPDMLGEERKGTLLLGRLERRLAAEDLVAQDPCAVDVGAAVDGPVHNLLRRHVLRGSDHRATTVARRGRALVRGARDPEVGHFDVPGVGDHDVLRLDVAVDNALAVRTVERREHTVHPSER
>SRR4029077_8001983
RDSSQVQEVSRRNPGTSACTALRAARKLRATRPWMPRTLLERSGGGSGTQRDKTRRHAESWCRSFPLHDGFFLESTLGAGVSLQHAAELPVWPAAGHAPTKLEASRTTLALGIGVGLQLALQRGVLIHEFVELQLHFCQLEHQVRDQLLELRVPAPLTDDSQAGCEGYGTRNPRKQIAHTDSIGRVAGSPRLFAVSLRRASHRVRKFGGPTHIRARGGSRPPPPHR
>SRR6266508_4076808
WLAFAVIAVTLLVQGLTLSKVVRALKVPRDDPTQDLLAEASVQSQASQAALTRLAAEGDGAPPDVVQRLREHAEKRTNHAWERLGSQVRETPAHAYRRLRRSMLEAERDVFRQARDAGRIPEEIMAQAQRALDLEESILTRECPSMSLPVGCEDLAAAPADIEPTSKRCVDCEAIGRVGWVHLRQCLAGGRV
>SRR6266404_7425182
GIVRRHEVILGSPCPVPRGLEQKRQLRSYRPALFPVTTEQRLRYRRAQLSPSRWPERSVQRVLIKHVDEPITQRQHMSGKLPFTDEPNQRIDSLQRLEALFNIRRIQLESFRHDSRIELISLHARSNQQAPIFVAQLRDLALNHPAQ
>A0A1G9LFL1_9RHOB
MRSECVECHDGPVHCTAIKKTIEYRGNDALMRNILNAAILASFGGILLATTALADWTYSGPPYPNATIQTNDMSLEVQCDRIRFAPAGYEDSQDIVRKNGLSFRFLVNGSQEVASFQMGRENSFVQIVDNYPVEIQLSDEADYAFVLDQIAANATLNLSMVDQDVSYGIFDLKGSGAAIQSLRAECRALDQTSAPLEAPEGVVYCGGGGIKRQIEFEILDDASDEWDARVTVNGETQRAMTAYSYFGNSEPVKDFVVALLAEDRSEFLIFRNRMENWLEFGDYRYDQCN
>SRR6218665_3367076
XMKLSMCSKCPPLTCTHAFRRLVKSFTALLIGSCGMSSHINCKEAFSPVIVFGFGCSYDTFPAWPPHVIVKGVEIWGIWWPTVLHNDLRTVCVQLLLRDTCRVCWSAILLENEPGWHQLFAVLDKLNFHSLYGYARTIAFAPHPCSRSVCIRILSACDTFPILTALTKYWLLTAILPKHRVLYLHIRLSDEFAWLQLGCKVIKRGILSVQIAX
>SRR5258705_1672816
XMFGWEVDGQRSLMRRFFHIWSFVFHKFISVVTMYRCAKGVRRRTSCLADPGDAGRRVVGEAAGEALAGARAAAGAAAARRNKQVMPEVLGKWVENRMGVAEGVHGAGQVMVKALDGFSDRVSGFLGGVTSPPRIVFLVLVNRLQFALDLGLDRPELGFVVEDGFQLLLLAPERPGGP
>SRR6266850_6431312
CAWTCRAWGAARSRSCSIATTARRAPMRATRLWRPRWWCAARAGPGPTTRAATAPPGTGTLHRRSRAARLRLGTLRAVALAFALALALIPTAPARWCAADGRPEALSRGEIAFLDTLEQRTFRWFWELSDPRTGLTPDRAPTRSFSSVSAIGFALTAYPIGVDRTWVTRGEARERVGRTLEFLWAARQDTSRAGATGLRGFYYHFLDPASGTRFENVELSTMDTALLLAGVLFCQSYFDRRNPGETHIRALAESLYARVDWTWAQVRPPTISHGWTPEQGFLPYDWRGYNEAMVLYVMALGSTTHPVGADAWNAWTGGYRWGAFHGEPHVGFAPMFGHQYTQVWLDLRGIRDAWMRARGIDYFENSRRATLAQRAYAIANPDGWRGYGPALWGLSACDGPLDGTVSIAGRARSRRIRPTPTRTTRSATPIRRGATIATRWRCSSARCRWNATRTSSG
>SRR6266545_636481
EWAEGAGGVGLVGPGSGDGLGQVEFGGGGGDAAVVGLGGGQADGGDFGLGEHDPGDAGVVGAVGFAEDGVGDDPGLVLGDMGEQGVAGDEVTDPRLFPVQQPGAALDDGDLGAHAGQKLAQLDADRAAADHHHPAWDVAQGGGFPVGPHRHLVQAVDRRTYRVGAGCNDDVGCGELLPGDLYPPRATAGQPGGAFDHGGALFLVAGDLVGVVEVADHVVAVVAQPRPVQVRGGQAGGVAGLGARLDRAQQGLGRDARPVGAFPADQLPLDQRHPQPAGKQPGGGDLAAGTGANHDRVEVGAHRFYLRLLVGWGWGRRWRSAHAASVTAATASPX
>SRR4051794_24386335
MLSSSACEVRCWSTRATGLARGAAGGPEPYATLPASMPETRVSGAPRLDLSPYPLASHLGRIFAGRGFPLHLVGGSVRSLLLGLPAGDLDFTTPARPADITQLIRQAGGHPVPIGERFGTMAGVFAGHVTVEITTYR
>ERR1719330_1029551
LLQALIVTTWPDADGPRIPAAGSEPKRNRLHSILPSPSSGIQPRLHEPPCEHRSIAGANHTRRAGTRCRPWLPSALCLVQSCLTRALATQPRYLPYWNSSLPEHWNPMFASLLNLSSAVRSLLEHPSLLWLLLSSPFPGPCSTSRASQSHLSSPRIWSRMRPMLQGVPPEQLCAHETRSLPALQFLFLQYLRGQQWRRVRPGCPNSYRLDLPQKVLPSAEPCTTSDYRICSACFWQMQALLWPLCQMPSRPCTRRSDPCAEPSLQSSDLLPKRCNGLFGLRDGSFLACYTALKRLLVLIVVLFGFQNSHHVVNHLNDLVEASPGDILLTGQCQHQQFQPRFVLHGCSLHG
>SRR6188472_3631345
RRLLREKQFLGRRFRDSRGLARRLRGKLGGRRLPSRSDRDRAGRLVERSRRARVSPAPAIEAAVLGKKLVDALATRNPDKAVAPRLLPSAELSLSQERPNRLRRCSKRPRGFGHSEVVGHFGKMLAQPAWPSETFX
>SRR5262249_43660061
XEIIDAVVGSDVRDWRVVEGDHALGSEADDGEGGRSYHSLAVYRAEPAVSLVWGLTENPNFREIEWANNFADPSAKSAWFDIRYNGVPVLRELLVVVDGGRCYLPMPSRHGETRSVPSAYSRVVRLMQKLKGRHEYDDYFARAGLIETGDEWPTT
>R8G6Q3_BACCE
MLPEDILIVDNFYSNPDAVRKLALEINYQEFGEMQNFPGFESEKSFSSTSIKERFQKLIKNEIIISPREYIFGKFRYSTENDYAHTEVHLDHDVDWTGIVYLTKDEDCQGGLSIYHHKKLGLDSAPVQSELQDFNCKNIAEFDSKYIYPYTKLAENWNLLYYIPIKFNRLILFRGSKYFHGITEQFGNSIYNSRLTQNFFFKEKVKKGVGL
>SRR4029079_2700613
CQARAAAPTMYRPGQVRTTRSECGQAASSLSLDVITAQALAQERAHARVRRLAGGRIGADMDALPRMHAVGDIEPLHDGSRRRIERLITARIRRHEELAPAARHRRAERDAGGSRRPVVELADMNAPR
>SRR5579875_498642
XMGGGPGSGSVLQAHGGDDRRDRGDAAADGPSAGRDWQAHAAPSCSRARRAGSCRAAWRAARVIAAGLNVKTRKNPVNTRCERVREVCPPGYCRVMGRGEPVRGSGRPSGRRGGAGDRGGAGSARKGDRMRGMALAAALAGAALLGVAGCGAAPAPQGSRPAVSPSPAGHRAGPPSCVTPGTAGRARTFTITEKDNGRSYCVTSGTRLLVFLHGTLARKWGPIQASSPALRRRPSPVMMLAIGVTGGYFVAASLGTATLTSVRGSCPPGASHCRDRQVFRVSVLVRGTMX
>SRR5215472_4865484
SANGRSVAPLIPLPEAAQARIKAREAQAAAELEILYRACESDLSNARRNPAGYGTRHGRLDLVTEQVRQTMREAQSVGAQYIFNVHAVEYRAVTPDPVELKAVLEQLRETIIIHYGEHCRTVVQVMETREFEEAWKQKPAVDSAAPIERRGEAVGSSDYPHPLRRGDGSNHQAIPAVRRSPASRGRQVKSESGHRRLDPVVQRIKAKVREYKKANLTFKEMCERLGNSERPPRATWTHLPWPKAYEKHTSAVSKWLSEA
>ERR1700722_18781964
XMSWSSDIRCLYCDGKLPLYRKLTSGQFCSAGHRKLYWQEQERLGVERLHETHDSLRAFRPKEAVEALLGYPPSYPMPEPARAHGVPIQAELPPVAANPIEATPVADSYPGSYLNDADLSPQTPLWAPQEISEPDHGVEPPAPMGGFIVVHAMMPQPRWPLDRLVIPEPNPLATTGPVWIPLRTMAALIRDVLGAGAAAMPMAPRPYEGTRRLEPVHPAMLPCLDVSHSATPAGNALAAEEDAPRAEKLLALAAFAAHEPAPDGTRRDPWPAAPFSKVHKAHLPPATMERNVRLTIAAPPQAGLRSLAIDQVPLVHGTWIDSLRALKSEGELPRYELSTPAMRPRLRLATGSRYPVATRDQNPGVATVEPQNLQPSATAVAIPERAMAAAASCSAQNVPDAAGLIPLLAAVKPNEPAAQLAPSTQSLNLPQPLLTEPMRPASHLEPLDAKPVMDFMAPTPQIPSQIIKMAADEPKKDSPAMENAAALPPSESGDVTPWTVVAGFWQHAPRDLKLLVFGIPILLALALHPSLKKIPYAAPLKAGGIERNLEHNFQSKLKDQWVTVKQTMVDRGAIALA
>SRR5947209_11779987
PPRRPAPASPPRSRPRSGRRSGGRPRPPARPSPGPARTPRRPAAAPPARPRPPRWPARPWTRPGAGPPTWAAPSRPPPRTRSTGPPGWPPAAPPASGRRRPAAAGRRAGSARTGSAGSGSRPARPPAPRPGSRPASAASAGTSPTGRSPGRPGWSRRTPFFPPRQGGLDRLGRDRQHPVAGLELGSPEQFGVALGGQHIGQAAQVGLTGRRQRGEDAVGLGALLGGQFRSAHGSAPANEFRRPTHTPRPAAKNPPTSETHTPPGIATWELIAPPLRRGYNG
>SRR4051812_12632978
GRRSTARAGRSPAGTARRGTGWGPAGGSGRGSARSCRSPAAARRRPRPAGRHCGRPWRTLPRPSPRDGSRTAGESPCRLLPPASSTRGSGRPACTPATTPPLAGTVDRGREPGQTHVAGGCSGVPASYRARSGPSAVVRVTLDRPPRPATAGLGRLVAVGYPERASGASGGIGRRARFRSVCPKGRGGSTPPSRTRRRAPDPGTPRAGASSSARTAGQEAVSTVRPPRRPRAPSADDPGARDGVAGHASIYYSAGPDGCHAARHRDSRLAGPLCHKRTQIRTWRPSTGGGPPRPVTSAGSTESATPKPGVRPSRQESAPFERESAPTQRVLYRGTMDVGPCSPLRSDPRGPGRQTYQRASRTRCVTTATSHATETSPARATGPAISLRGLVKRFDDVRAVDGVDLDIARGEFFSMLGPSGSGKTTVLRLIGGFERPTSGTVELDGSDVTALAPFERNLTTVFQDYALFPHMNVLDNVAYGLRVRGVGRTERHDRAAEALATVALHGMEKRRPAQLSGGQRQRVALAPPGRPAAGGAPPRGLGRRPGRAAARRAARSARPEAARAHAGRAQADPARRRDHLRLRHPRPGGGADHERPGRGLRPRPDPAGGDPREIYERPASRFVAGFVGTSNLLSAQAAQELLGRAGTFTVRPEKVRMAAADALGDDRHVVAEGTVAEVVYAGPVTRYLVDLDVGERLTAVLQN
>SRR5207247_1084271
DDSKCSLAQQKGEHCVSMPPAWSEWIVQVLPISDGRSTAFSNPTQGVGGSFILSLQRDSRARPKSHQRSWWIVHTQPTKRLARPSRIPPTALVGLSGLPDGRPLGLFQQPARAQAKVRSW
>ERR1719350_1727719
GKPPSRRQRLFDMVVSPAFQGFFAVLIATDSVVLGVETEYVSRHRDDDRNPGFFAIRQIFAFLFFVELALKAVALRVRFFADPALRNWNVFDTLLVTNSIVELFIDGALGGDQVSELRLLRIIRTVRIFRVFRFVRMFPALKLLVNSILATLQSLLWTIFLLLVFLYLFGIVFTQVATNHFEKVGEVDE
>SRR3954447_23639997
YRDVVGLWVAVGTCQYDGGGNAEVEHGDDRDGRADRARNVPAGVGELPDEVRDGLPPGEREEQDDDTSADRGDAMRGERGQALQRHEWCGGGDREDQRRGHPAGESELNATADTQAEKVRADGRGEDRGGYRVGAPGPDLQRLGDVVAASERDD
>SRR5688500_19711690
RPLSPPSPLSLHDALPISLGGAEQRDLPAPDQRQRGQCRAHGREDATQPGHGAVTAPRCRTVAAWHAERVVGRRTVLTGAALLRSEEHTSELQSPCNLVCS
>SRR5512143_883754
LERIFFHDVLGAANAVQGLARLVAGDDAERAKSAAQSLVRATDQLLEEIQAQRDLMLAERGALTIREDETAVSDILEAVRQQYQWSPLAEGRELVVETAVANKRLRVDRTQLIRSLGNLVRNALEATADGQRVTVSTQPLAEGVLFQVTNPGAIAAPLQR
>SRR5579863_223257
ALDWEGVVLVVIGESESELVHQRGSDRVVIRGHHAASLFVRAVAGQKVARRRYRPRVVELGIERILEAVAHVNLLLGIEVVVDSNIEAVRVRWDGRERLVVIGRVCYTQVRVRHWIVLQQCGRYGIDAGRARSGWNGVVRERRTGKWVEQGSGSNRLHQVIQVAGSFGCRGHQKFFGIGLCFAVALVVGEDEGLVAPVIEPWDCDRASYASTEGVKGAGRLYVEVEHGGVESAVLEVFERTALPSIGPALCDEGYVADLRELRIVIECGDLHFIDALKRWIRICEX
>SRR6266404_1434125
XMRVLVSHEAVSVSPLISSSLFVSLIVFATSDLVLACPASCWFPLTRLRARGVFLQDRKSTGIEVVDNPAYHLWWECTRLIDSLSRCQKFPASRHRVVLRYCHRAITFIHKSAHLQX
>SRR4051794_20682467
VGRGGLPRAAVVGKRTLTLDMPAATRWHVRHERAHLPVAPRRPVLGRPDRAGRRRRPAVLRGRPRLDVRRRRAGVRRLRDRAGGRGSGGRHRPAAAGDCDRLDALLRQRRRRGDREAVTDSGGTLLLPRGDVGPLGRLCVAADPTGAVFGVWQAGQHIGAGHVNAPGGLTWEDLRSPDPATAQAFYTAVFGHVVDPMPEAAPDYGLFHLPHEQAPLGGMGPIFGRDDASAHWLVYFGVADTAGAVEAAQNAGGSVTNPLFESPYGRMAGLADPAGGRFWVVETDGSCQPDRSDX
>SRR4051794_34313143
PVADFAHVAPSSEPVAQPEERVAVLLGDRLAELDAVLLLDLLEPVLVTELQEKTVGEVDAHARAEEPARARLPGDRAVGERAVQHREVSALGVKDAVVKLELRAQARVRLRVALLVVLEKGPDAPPRTEVIEVRLGEQRR
>SRR5450759_4329672
CVEETGRDVQLRALLPCYEVAVAIFDHAFHGDRFTTDREIELRAEGGRAERHTEGDVRLEVVARGVLARRPVWRGDVGVRGNLRRHLARDGLRQRPRTVGELTIETGQHDGAKLRWLDGAGHRVYGHVHGLSGGHDTVVGQGIETRAARDDERLLELALLLGETKIDFGPDRRRHRRDVAAGFARAATNPDGKMHIRARRHTQQA
>SRR6185295_8040175
RFSPGSGRSRPSSLSLPVLDDSVKSTPTPSGQPEHESSSIKAAVVSTAPSKRGFLVGGLGLVALALAVVIAVRPGGAPASPGPAVRAAEAVGMVSITSEPPEAMLSWNGRVLGKTPLKADLPPGTQSMVVSRPGFFDETLVITVPPAGTVERSVTLRRREDPAPLTAX
>ERR1719401_1546905
KLLPLLAARQTATGTGDELRFALLQAKSRTHPRTRRAQITALKRPGTRPPAKLTSSPSTHVLVSLASLHSRPDLHVVASVLPSQVAPLSAVPVLFVAAPVTKNRQDRTSAIIFSIFSMANELERQCAGLVVRX
>SRR5207248_7680326
GPIPRAQPRCPAYPAGRHCREPSTVCLLECSAGPRDLHSFPTRRSSDLPGTYFGTAGSALIRAAALWDDLEAAGVPGIKGVWKIDRKSTRLNSSHRTSSYAVLCFIKKRVPDNACLVEARLPGRQNVAGHT
>ERR1039458_7977961
VLISGPTGVSQADLSSPLLPWILPCGPVFFFNDPATTEIYTLSLHDALSISNKLFVESPATRRFLSPSNCSRTDRKSTRLNSSHLGISYAVFCLKKKPTVLLVALGYGLASLYYLDHFDKLSVLIKRQFSCIRVSIVVSVLTLSNFFFNDTATTEIYTLSLHDALPIWKRRACRCLRHLSCFWCSPCGPRDRKSTRLNSSHLGISYAVFCLKKKX
>ERR1700760_2163761
SPHPTAPIGDVVPSTPPANALGKPRTSAVWKTATTAGGAGARTARSRRWWYVSRRGLLSPAKFERRPSVGRFVLGDDVRGNPAALIHLVAVRPRPLADSGTLLAAGAVALTAAANLSATRFACVIHVLSKLGAELARVAGTQIDLIGQAIETKADGLSCLTAVDVIDQX
>SRR6185437_11610463
QDRRVWQRLQLLLHGQDHWAGSRAPVLRSAPRHRGPSAMRPTPRPISATRRRSQRVRRIARLLAAGLALAALVAGAATAEATSTGQLQQKISSGRAHISSLSGAVSAANRKVRQLDASVTATSNRLDAVQRDLDAKRAQLLSLRAQLNAAQARLKRLQATEAADEQVLATQLVGSYEGQRPDIVTVVLEARGFNDLLERLDFAQRIGHHNAQIVGAVKSARRAVAAEAIRLGVLSARQQRLTEEVLTERDNVASLRISLLSQRLGAARARDTTAGRLSSAKAQVASLTTQLNRLQAAQRAAAQRAANAGSSPAASTGSRRSSSSSGPPPSAPPSRGFPFPMPTGAVSPPD
>SRR5260221_13052907
SLQPTRARATRTCWACSTSCSATASGRSACSPVRREARDWRAPCHPFAHADIARTGPSVVQKSERPRAPRQVTGKWLALILALLVQAAFVAVLVVSVRWQNRTPEPVTAELYAPAPRNPVAEAPPAPAPEPAPPPAPPPAPPKPVVATPSPKVDQPDTRAADIALRA
>SRR5437868_12203378
LVRRGVLGPGPTDAGIHYVVSLRFGLDPMLRVAPGFVVHFFFLMSRRPPSSTLFPYTTLFRSPHQSVYCFTGSLFYRVPCSRSRSEEHTSELQSRFDLVCRLLLEKKKQWRTMCPVGVRVRSGACVLILSVCASAPACGVVRTAL
>ERR1740130_985408
VVTKNHAAVLKMSTRHMQGTSDSRSDRKRKNAEVAREELQRQKQRLDFHRHKTRDLKARLKDIEKGTCKEYLAQCKTLDSTTQKEIRTIALLREAHMTSTSQLYSFDTMAARHGNRDSKDALKLQLRNTVIEELKEIDDLVKSESSFRRVSKRNLRSKSKTDDVPNGTNHAGTSCLDSFRLHFPLTMREVDEDLRIIADDWHKAALEFKKSQDMIPVTVTHGKLKYDDLVIERGANILVQSELTQTQTEGHVLSIRRNEIRIKCKNGKKWQVQVEHLRTGRVHLFPAGSAEX
>_1
FPEDIAHTAVRNLGVPFYMIEIADDPRYRAVVGIENTTASQWLAPPDLVSVPSNGEIPIDFCLDSTFPYTTNMTYTHLMWRFVEPTRQQDDFGPTEWITVPWEMSGFVDAGNSCELLDGSNGTVLQAQIPLPDSSVGKIHYKAMLGTTNGAFPFSYPTVEEGPNYYELSIPYRASFGSSVLALLMFSLIATMVWGGLGYTLKEMFNDERDVLGLPLKCVIWRKLKWKLRMKQAQMSLVEDX
>SRR5262245_59441811
SGIRVLERERLRQSTAAAWRHRISGGRSAHTHSDETPCGCHRGVLSAAGPVEGCRSVQGRASSADERRIRCHVEPERPEPYAGRVVGADADHRSAKMVCPTVREEVERLVRDPRVDVYAAVVRRSGVPLAVVIRIVICGEPEVRRLMWIVHVTECVAGDAWC
>SRR5689334_15183997
RLGDVVLDALLQRRERFVDDAEGVIAVGHRIDEHADREEVIDLLVRPLAGLHLFVDRPQMLRSTRDFEVLDAGARQRSFERLTHLANELFSLATLGRDLLGERFVPVALEVLEREILKLPPQLRHTKAMRERRVEIARLLGNATPLFGRQPLERPHVMEAVRELDDDDAGVFGDREQQLAVALDLPLFLRATGRQLGDLRETVDDRGNVFSELPLDVGDGNLGVFDDVVDQPAGDGNRVQLEVGQNLGDIHAMRDVRVARVAHLPAMGSLAEAIGAHEQVPVELVVERSLLLPPTRYDLANRRCRRHPFSNVFSGIPSAIPTGRWGFGTLPSACSARLPSWDKQGPTTTDGPRSSTANIRGS
>SRR5437773_4994510
TIKIGNGTGCAVTFLRKEDGMPLRRTLELTDSQRQDLVHYRDHDPRPYVRERCAALLKIADGQSPHAVARHGLLKRRDPDTLYDWLNWYERLVSAVSGCFSTAGNIGSVFDRSDELVERLQHAPGEQARQELAPTADGPPPSRWTLRGVREIGRAHVX
>SRR5512137_1013993
LWHTLSAATVRMTALATRVLYQRGGGSWRERLLDQLAWPREAARSRFSGSVSSRRIVEGVGFDMEEVRRIRKWVSGATTNDVFMATVGGALRSYLQLCGDPLPPGLAAAVPVGHHDTLPGGEPGNKLNQHRVSLHIDCESGLARLRALRQASEDA
>SRR6267143_4187927
LGEALRADARRLAAVDLAYGRDHPVGCPVDVLGEDAARVIELRGNLSAVVWSSGRATSRSKDGRRVLRADDRVRVTKIDERDRTRIRLDVVKRVHQSDLVGARGLQRLVLPVPLLNRDEGDVIARVVRVPEGERRRVREAFGQGGRLHILQPSEVSK
>SRR5215211_5171990
PPWRRALPSRSPSRLLGWRNSPSLGRAPSPADGHSSSRPKLLLVLLAPMLPHRGYGPFIAEQTLGPGAGRLAAEQPHGEVSARNEQLVEGLAHVPVGNDELSPLLRGEERCPAQQLLDKGSAHASGAGYYGVEVFEFEVEALAVERDQAPPAARVGERYLRGLVYAAGSRGERRLEQVWTVGSEHEDDVCVLGEAIHLVQX
>ERR1043166_75354
YRLLLGSDPAEPLLNEAHGFRFEADTEIKGQPVYVLRWQQDARSFLNAMGLTNTPTSGRSFPVKAWVNTTNHLVLQLQSDLSNWAKEIMGKRPEFPVTGLLITESHSAIETAAIAASVRVFSTQLQEGVRTVERIELPPPNFAILAAPRRHFSKLIPARLSMASSNQIDLTDYYNGALIQAWHPGPPGNNLSALPNGLLQLGGVVFDVRGVVQLAGVDLLRAGGRFPQQISGIRIAQVCHELHFLQAAGWRSRDGTRIGTYLIHYADGRTQAIPVIYGEDVRDWNAAADPGPQLKRAVIAWGGINSEGRPVRLFKTTWDNPWPDTEIVSMDYVSAMAASAPFLVAITVE
>SRR5689334_14209035
IANNGIIATVSLIISTFIGAILYNISPGLPHTAMGVVHLVGFLLAFRLVEPKIKDAAKEKFTFKAYRQQLSNGFRHLMTPALWGFLPMMFGLLGITELMRASLVQPALAFNMGFGPEAQSGIFALQLFVAMFAANAMPFLRRRIGDWIGLVAMTLLLMVG
>ERR1719265_2530241
PTNTDPRCAGRVHAVRQPTLVVRVGSLDKEVVRLVQLFPQHVLVQVASVVIQETTVKIPVHVNGLATWSVIANVLAEILVSANRVACDVVVAAVVPTAETVVSRARRVQTTLSVALVFLDVHHHAGKRNLYLVQIHVA
>SRR6266545_7407710
ASRRRHAAAVRAGDRDPAAGGEGAHVQADRRAVGDLDSYGAEPRPEHAGEAAAAQPYRAGPVRHRNRPRPGRLTSGVPMTVLAAPGATWGITGPQFLALYGGLILVSFARRGHQRPARCRQPRRPAGRAGRRPVAGAPLPDGFDPRTVRAAAAALLRKRASGSPPT
>SRR6202166_3668028
KDGPAAVAPAPAPPKPDMAGLDLPLPDPVRERPASNPGANASGLNLNKPGEKIPAGKAVPGPAAPRETFRRLVPDFAPLEEQRRPARAFMSENMMPDVRATFPVRKKVLGTAFLQALLRQWWPLLVAILLVVGALWLLLPHPARREAPSARVLPETPSTDAGTPARPLGLYVDSSGPVWRVSWNPGATAFRGARGVALFVRDGDDQNRIDLSPQDLQSGTYQYAAKNQEVTFRLEVTDDRGRLSAESFRLVKSVPVPPEKPTGESVRRTAEPPRPASTAKNLVHPRATHKVPPVVPAGIRPRIKSPIPVDILVHVDSHGRVTDAAPAVKQHAGLESYLAERAVTAAKQWRFDPARENGRAVPGTETIHFVFERXX
>SRR5215217_2643638
DDASPAVRGKVGPDVPAMQLDDLPADIEPQAESLGGIIRSSLEEALEDPVTCVGRDPDATITDRELDRAGRRQGESHDDRCSTGTVLEGVIEENGEYLLESQRIDPRFERCRHLQHDRVPVAPGSRAGDYLFQQRRQISWPPAAMSSGRPPAVRHPG
>ERR1035438_2618940
SSDLTDLSRQPHGTNAEVDLAFLEAKSWFVKTNQAKAERMLLSLLDAHPDDLILLNRAKGLFAAFASYTNALRITDRQLQHEPDNLQLLQEKGFLCLKAGQFSNAIPTFTRILSVTNSYPVLMSRALAYLQPRRWGEATKDYDRARQASPDSSEPYYGLSDVARHRGDPNTASQYYQQGVSNGLRVIEER
>SRR5437762_5397717
RAATGEKAPDARQLVAVDVQGDAHASGEQAFAQHTLPYHPRSAEQKHLHNASTIARQTASIKEARYGVRLQATRWLGGGAGDRVARGVCRVFRVQRGRRARRRRRSADLGRRSGRRGPAGGPAGVLVRIWIWMASAVGIRVLPVLLYSVLAVRPAGAVLGRRVAPAPMLWLWRLLRSSADLRRLAPARPRAHDEGAGSIANRGATNRX
>SRR5882762_3560359
RAPGQIFFRLHDDCIYLGGDVAQIGSLHRTEDIERRRGVVVGHDRGRDTAVNVRHAREDLRRSARSVQRRVAEIIEILQAKLRRLRRDLVLSSALGIDPERGRRLETARQRYQHVGGNRLLGQTQQLRLAAIDIHVELRIVARLVDVQIDGARNGAEFLQQLVGKFTVAVHVEAGYLHVDGGGQPEVQYLADHIGGQERERGRRIGGGEFR
>SRR4030081_1498409
RRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLPATLSDLGVLERDEGNIDAARRHLEDAGAHERALVQADPAPHHRRSLAITLSDLGVLERDEGNIDAARRHLEAARAHERALVQADPTPNHRRRLAITLSDLGVRERDEGNIDAARRHLEAALEHNQALVQAD
>I1BUC6_RHIO9
MLYSRLSPAKDRIFLQKILPACNTTSKLFLNQNKLFVIRLASTRSTLYNNQSKPDNVSLNGDAKKPKRRFVKVDSEFSKANKFTYVMPQDPYVASDRVTSILKNGSVDDAIEYIKALPLDLQSVVVWNHLIGYCAQQGKAKFAEQSYVQMRRRGIAPNDRTFTHMISVYSKSTTPNAVENAEEWLKKMKNFDIKPSIIHINNLLKVYNHAQQPSKTIKLLHEMPSRRIHPDAFTYSIALKACSELSEPGQAAKEIKQIWQNIVYRLEGEDHGDSLKIENLNLKIDDGLVISLLTAISRTLSKESDMIPGLEAIHRLYSLYPPRAAAVIEKHQLFNVNQQYGFGMQPSIKALDTILRFCGKTKQYALAIKSILDGCMTLSHKYIHDQKDQHKSKYNVWNQSGRGSTYATATKSRNDTTRGPIIAAAATNLTIAVSIIASANFRC
>SRR3984893_10676208
QLRRAYPKWRKAGRPAGAGSDPVRAGDKPQDCEGDRPRSAADAARACRRGDRITAAVRESVPGTKRRKPRRRVYVSFWGSSGSAWTDGLGCLRRKCRVGPGELHPEPLTDPDLTLSRHPARATARRLPPSVENWRLLLLPVGSLPTAMTCLLRSTSITPASSLLQGSPPLSGASVLSASRLEPLAPFPLPSPARFSRSVPEPDX
>SRR6185369_3836006
IGELLSSLRLQIVRIDIELAVAVRAKVDRVSHPHRVYVVGAALGLGKLLGGVVAKTIKPYRRVEAAAIMLPLGKRLRQRVVSQSRSVGRIGRLECVWQLERLFDAAFDRNGEQLGVASGEDSARRSEQHRRSIGCESLNYVRTRMPRQPRRHSAGNRHYIDVGVSFILGGKRDERSVRREPRAGLLAFVAG
>ERR1719376_375132
FYPGMVNTDKMKKTSLTYTITPEQMKAEDRIFEQQIEKERRHTLMLRQARKRKKRANKNRGSVPGTLVPIRAYNSYKTRERGTRIDELRNVDQQVAQRIPEQQPKAPVIINWNDDDDGSVTDPGHHLHQTFIEAITTNIKGLDPPKENEGPSKHNIRAGAGTPWQHGMKEIPSSFVDQISIVGVKKSSFFQLMVTGNLFWLRMFLKGKEQMLLPDKLGGKSLDLDTLKVSTPALSGLSDNNYFNNCSQIIELGKTLMSKDFPHLKVYRCHNKESKKNCNLVSKFRHWTVSEDLKYLDLNGNEAFESAAHNTPDILIADTVKKYLEDVNQHDSMIEVMTMIVKILCNHLHVPLRVLKRERSFKEIIKCLVEYCMNKSITFDGTKQLQYSINKLMSKASKWIGGKRMYRKLLQSYLNELFIRRWIEYDSDKSITDLINDFSGRTMVDISDMSSITKSSFCSDVSENVRGGGGGGERYNSSSPISSKRSGLYSFRCNEMSDLLLLIVRMRSTKNLGGKIESSSEKMILDEYLLDWFFNKIKEMNLIESQVSNTNLNEGSAKITALENFMLTLALPNTDNEVTDTTTTSDASVATAIHYKWNYIEEDKYGSLESFNGTNHSDMMKHLILDNVDIDKEERKEEKLSDYIKTVDESIQNSLTNLLNNEKCWGPIRVIWGTTSYIRLLLHKYSNVLDLYSESCHVIEEIPSFKVILLRGRRX
>ERR1719191_268510
RNLLVLGARNAAGIIRVFHRLARLPVGAYIRIALATWRARRFVFLLRAATHGNVEKSRSARLLEQDGFCRSCCRVLFCDRRKRDLLLMLLLVFPKNSSSTTVLCFRSTGKRSETSQDTEYPKMNMNTTRTRNSIVSKPRSNSADSTALITILRKCCKEMGGCKSQRQTARSLRRTNTSYVASVRG
>ERR1740124_282413
RDDRRPCCEEMYVLVRESPRAAGTELRFASKPCAGEKAAMDQWRDAYNTSRSSAQLKREGKVVSVALTEQLAHEYRRFRSDHPSWLSLEPPAAVRAVAMVEADEPEAAAAAGGGDSGGGGGGGGGGGGG
>SRR5271168_1700852
LALLPHISHGRGIVTLFVAHCRWISGPDNYYGPTIDLESIGVRDGLVEDLVVGVVNVGPVCRVADVKGGGGIIVGIGPLGLPGRRVVIEGTYLYLVGKAGVVQGRQYGGHACGTPAGDRTCSAKVGAKKVQPGLTRLANPG
>SRR5712692_205962
KLFERSSKMNTMIRCLGAAFVLSLLTLCICPDASGQGWTSTATKAYLVQNLSNATLIGPLDSSTTLHVVVGLQGQNANQIQPTLRRMLTPGDPLYGTSLTVPQFITQFGPADRKSTRLNSSHSSISYAVFCLKKKKQNKKTSCYEKKKIKKTKQETTIQKQ
>SRR5271156_1441549
CVGAATQVLLVLIPPVLIDALGLFWTRWASLLINSIGPFDQQHLLILVDLLQLHFDDFALGGRNVAPDKRRLNRKLAMPAVDQHQQLDSLGTPMIKQGVERSTDGSPGVQHVVDQDDIASVHIKADSAGADHGANIVGREVVAVKADVQHAVVDWGLFNRADDLRQPLGQRYAAAFDADQPYIFAPVVLLNDLVGQPDQRA
>ERR1719300_424020
SGDQLFRSFTKFICSFFRFLTLSFATRFTLALHGFGRFLGCFSSWLLLLSSYSRTRSGCWCSTLFRSGKDLIVIRDIIIIRVFLWFRCWTFFTLGRFFLFSLFFLFLFFFFIIRSPQLLRRRIVWIHKPVGARKSLSTDLLKPTFGX
>SRR6267378_6278353
RLSVPKRIIHGEGIWGSDKLARVEPVWARPEYANLIPLALANGVFEINPKKIWSSVYSYNRPEITVEKVEEILAAFVKAALLFIWDDPATGKQWGFWIGIDKAGRLPAASRLKKGHDSVGPTPPLDSLQQYMKQPMASHGSANGLVGSGSGSGSGSGKDVRADSSSPHESVTPQTPKPPDEKLLVVERVWAYYVQKLGKNPKQLSFTAGRKQKGLARLRECLEKEGGDLGHAEGLMRLAVDALAESPFHRGENNRKKRYDSWEKNLFKDQDQAENWLDSTGGSKRGPVPVPLLDRRGELNDAGRTVYDKAGVSMSX
>SRR6185503_10073111
SSSLASRLDQQRQFARENYNWEKRAEEWERWLSGFGNATSRLPAAVADTALSAKTAGNFLRFVGEPEAAIAMYRRSLEIEPDYLPALYNLGMMLHQTDRFEEAEESFRRVIAIDP
>SRR5438552_10382664
SYCYSSLLYSCRHLFISLLLWFMVYFFFFLLIRRPPRSTLFPYTTLFRSTRQFLTESLVDGERSQSKSFSSCARIGRILRPFADRKSGSAGMPRPISYAVFCLKKKKNILKEALALEHTTGERWYAPELYRLKCK
>SRR5947209_3319617
CRAMRVLMRFYQKIGFRIIVGAVLLVSAVAGLLAWRIQGLSKEVLRTHEYADVFDETNLRFREVSSDIQTLRDELLGLFNDPVVRQLQWSEHYKEGWLPIAPPGLEDKAAFSKHARKQATEVFVQLLRRHVRYFRIEYYLDRTRT
>W8CC99_CERCA
MKFLLTLCFAACFIATLQAAAVDSTTAQPKAAEAADASTTVAPTEASDVVEECHQPKETGRCFGLFYRYAYNVENRQCEEFVYGGCNGNKNNFESKEDCEAKCLAAKKDEAPKEAEEGEESSTLAKEGDEDAPVVPVVEAKPVAED
>SRR4030042_5098232
KGDAFLLIESQRGVRRSNYCQIGKASLENLVDCDTLQAAEVLSHALPWLAGTAVECFGDDCRFSLPGREVGRERWAEKSHDRSRRCGRDVHRAAVRADKQGGATDDLPELDHVELSGQX
>SRR5688572_19060020
KIFRIYIQANSYFTILPACFTFTQLKILIMKTIISALFIMAAMFTACNSKSGSADAQSTPEGAANMIFDAAKSGDYSKLKGLCDASLDTDVDSKKICEVSDGNEELKKMFKDYFSKGKVVGTPTIEGDDAKVAIMFGPEGTNDETMNFKKKDGKWY
>SRR5438552_950382
AYRYVPATPAPDLFLADESIRLGVTAPGTSVTRDLRLANQGTAPLEICDIATDDARFAVRPASLRLAPGAHATVQVTWSASDGNPALGTLTLGSDDPGSPRRTVQLVAGAGRVAVGQPAPEVVATLLDGTTFRLSAERGHVVVVAFFATFCPACSF
>SRR5208337_2690271
XMAFALLVRLAEQPPMEVNIFEDAECWIKIAAKALGHVGNPANLGVPVYLAGHIAAKHMDLALLNDSDACGEPEQRRLAGAVRPDQSDHPAGGNIDGNVIQRDRLAVTMGNALDLGHDVIRHWEASRQVFPARQRRDWCGRTPFREFRSSREYDI
>SRR5262245_35595640
GRRHVRAVGGAQAPDRRAGRRDGRARGQPADRRRARAARRPGDRPAREDALGHRAGRLAVLPRQLRHQPLRGAGHTDGALDTADGAAHRARPHQGRARARAEPRVPDPGRGRVRLREVPRADAEARLPGPHQPRDLAHGPAPTGLRRGRGDGADLPRGRGRLRAERRATRAADDLIRAALLLGVLLAALVPGGARAQSLPDVSDDGGVLFRSELRRLGGVQTVGYPLTGRFVWEGFTVQAFQRAIFQWRPESRAVAFVNVFDRLYELGHDDWLLVHRQTPRHDPSLGDASARLALLEARPAIRAAYFGVVGDPVQANGLPTSRVQDMGNHYALRAQRVVFQEWKEDVPWARRGQVTVALGGSIARELGVLPSVA
>ERR1719499_2701023
LKQFCKKTCCKKAEMAVADPCYWTDDCDEKAVGSSSDESSEDSAEKAVANNRFDWSDQKGWCQGERARFNGAKKYPGKRYTSREQCLADCEKENYSGWAPKGCEYSARYGTCNVFFGKSVSGTNRGSSYRCNINRSKAADYERAYGDFILQSNANAAKDEKAVGSSSDESSEDNAEKAVANERFDWSDQKGWCQGERARFNGAKKYP
>A0A2E9IMM2_9BACT
MTRRLYTMALMVLGLSMLLSSTGCHEPTSRDPRVLRVGVIVSLKGPARYWGVVTMRSAQVVADYYNERGGFEVAGERVKIELVVLDDEFDATEANRVAHQLVSEGIHYTIGPLGDATVDAARRVLEGANVFYLHYGFDPALQGSGGLAVLGMPRPEQTLSIMFRHLRQEHHVSRAVVMAYGTEAGIRQKRVAEQLALDAGMELVRIARYDVSKETFDVSLDPQGIQRRVAGVVAAAPDLVVLAGCPPEAFVVIVDRLRSAGYRGFVGTQTTQDPRALAKLGEASDGIYYVGGEPADALRSEYFRTLKERYLDLAGEWDAEANKKFYALELIVSCIRAAGLEALDETSLIYPVLSELNIEDPFYQEPRALRLIGGQEEGLPRQLEIPIYITKMSGGRAVLVEESPRVLP
>SRR5262249_35545196
GDFGSAQGGDWHSSRKEEHLAANADAEQQTREERVDPVEHSGQAMDDPQELFDLINEDDVVVGRVRRGEAHRNPALLHRSVQVLVLDSSGQLLLQRRSQQKDLFPGYYCASASGHVMAGERYAETAARELAEELGIAPPLTYLGTTLVRSAFETEMTQVFLARSDGPFRFHPTETEGGLFLTRRALQRAQSAGSLPLTPAVLAALDILDRQLPDADARTGE
>SRR6266550_8732594
AAIGQRRVTRPGERDRDRVLPPVVGGSRLVVLGRAVGGRSRSIRSRLVDVDASDGGQRSIARLVEHRARERLTLTLVRESVVRLTCVYTGEIVVAGELSRNSRVVPTVRVRPRRSGAGDGWRRGIEAEALRSASTVAGVVHATARDSRRISVRDAVARRWIAALDSAQIVKLVCDRIAERVVVPVIVVGSPRERHVERWRRLVELEAL
>SRR5438874_2142771
LRRRKGTDMKRRDRRNGGRWGRSVLASLLVVGGLGGLGLPVVAATCVLEPQLRAITANQGIGSYATVARGKETLVRLYLSLPSCAASGSSIKVTGASLTADNGSGVKKTVSPFSPTPTSTPEIVAAGMAPAFDSDGDPKFVLPGTYLAPSYTTARFDVTFTATVNYQATANSTSSPVVSSKTFDKLSDSTPLKVTVERKTNALRLLVVPMGDGHQTYSSQFGNLDKITTQNGLTTLARLLPVPDGTGDLTSTARGGVRYRIAPTLLDLSSLMTAGKFCGKSTTWGALQSLLLGFLSSWNAANTANPAATADRVLGVVSENISVGGSGDCVDGYATFGEKQAWVRAIADTAFAPSKTGALMAMEIGHTLGAVPPDRDDDFNVRHSPNVAAVPSTALAPNRGYNVDKRAFVPNDRSAMKVSPSGAWNNTNVLFEAADWAWIQCQLSNTASTACPSPGKVGSAVGVGANPTLTITGRTDGTRSGTDVVESGFAPGGFAPGGLLTEPDPTSVYRLVQRDGATILRDDGVEVSFEESQHDGGAVFLDNPFGVFSVAFPFDTGANSIELWNGTPDGPTSVLLYARDRTAPPTLTSVNAQPPSTGTAATERASVSSAEAQTTSGSTGAQPSISADGRFVAFPSTATSLSVEADTNAQSDIFVRDRQSGTTERVSVSDSEAQATGGPSTDPVISGDGRYVAFVSSATHLVPGDTNGQPDIFLRDRQAGATVRVSVATAGTQANNRSIHPSISDDGNLVAFTSLASNLVTADTNSTDDVFVHNLTTAVTERASVSTSGTATITSTTGAVVGVAAPVSVRPNAAVSDDDIIAFDEQPGDAPSARAPAGGLNVDVTNGTADRTHALSPSTIPAGTTVKTHLLHADRPNNPVDFKSFTGTATFGADILGVIVRQSRLEATDGLSSVGTTYPVANDPQLQGLRGLDF
>SRR3954447_7250895
XMEAGWEMPAMSSIALAVLVSVVAFVCVWCQRAQDRADKRAELLLQQHLTTEQLAHLNRTGSLQVPSKSFESRVYTVPIRGFVSVHDEGRLVMRLCVRPGTFLPGREAILAHKMYIEAAEDEYVESATVVWRAMSLKTSATAVX
>SRR6185437_774131
RLHGRGDETSRYSAKSVRDLGNGAVVSLKVPSRCNLMTRKKITGLDQALGASAKLEATASAAYSRKRSITEVIPPDVTRAKAGAWLDLISPLSEWAGLKGDALRAKREQLRLQREDVLGEIARRARARITAQGLSVTPVPNKFLVPFLEQASLEDPDSSLVEIWRNLLVSAASDFSSHHTHFVSVIARLSPKQGDIFRAIIKAESLDELEYARDEIGMWFEAHSVRQGIAREYGKIPKRTRADLSDDDFAEFIHGYMKTAGISIVHGSFENEQTKS
>ERR1719456_362451
AMTATTLSAPILTTMTATIALVRLTTRPATDLTTTGMLLAMTLIRMTTTTLPLTLRTAMTAATLSAPILTAMTATIALVRLTTRPVTDLTTTGMLLAMTLIRMTTTTLPLTLPTATTPTTPFAPTMKAMTVTIALIISTTKLTTDWTMTLMDSVIRVTLTTTMILIPTP
>SRR5690348_12433932
LENVTSFDPKTGKALWSKKVFPNAPATVLSVSPDGKRVAVGGWAEICVLDARTGKEEARVPGKDLSIKLIKWLPDGKTALVVRKNPDRQGIPEDRTITLYDTATWKKV
>SRR5438093_595488
YNIGTYPTKSMIWVFLPSLEGLFYAVITASYLGLNKTLPRFLDKSLAWLGSLSYSFYLNHLFVIDVSYKICTALGWKVARFADALIFALLIVFPPLIVTSAATYYLIELPFLSLRRRYFRDEHDGVYSSRQPSNHESPHLPFERDDAKNVQLSSX
>SRR6267378_3168319
GLRRELSTMNSQTYRLQLCSSDLKVFQRTNRFCTGQRCTKLHLFQSGWTVSMTNVKMQISGKDRTHAPATTVFASIGFASLLTIIIAAPAAWDSRRTEDERVAPLSAKSAAGRPRGLWYIRSGQWQAHARTLVAAIRYILQNDSETNSGKSDGSCPALHLAMP
>SRR5919106_1596169
LSRSFLRCGHASAAVRSRCTDELFALRSALDLNRQDRADALRVVLALDDVGLERVDLLGHEHFVVRTDRHGDRLGKAEHLGLVLGLAGVVLLPVRVADLWLGRHDDARLGTIHPGLPRTLGADDLAVLVLGALFTEIPDGAVGVLGEPVVRVLDDLAVEGDGVAYDDARHAHHLARLVCDLHNGALKAVLGATLVHPLSTRLQWEIGVVHRGGERCRIDGRCVRDLGFVRAARSFVILVAHSRGEDDGSDRRNDGCGPDRDEGGARDRHRQSSPSSASPASSSAPTTLNDSSSWTSTWRPLSRVTSTSYMLSSSPTSVPVTSPPPVCSRAASAARSYASPEMGRSFSASSPPAATAVPTPAPTTVTPAAAAAASLDLRFIADSSRRGWTLTSCGQPAESRLKARAYPAPASYPGSRTVNRAPPSVLSAIETSPPCAVTNSATMASPSPAPPASRARASSSLTNRSKTRTLSSAPMPGPSSSTSRTTQPSRSASRSRTRERACRAALSARFRTTRRAATASASTRPADTAVVSMWRRVFARSRRASSKTRSSRSSGLACRWRACSSAAARSIRSSTRPWSLRHSALTVAPRSAGGVAFGX
>ERR1700674_3395430
XMALRPARPRLAGRWLEPRGDPRPRGMAAGPTGFARMGPQNPAYRPSPTAFYVPVGFVIVPPAYSWHNLGMAVLAKIGKPNTAPALFRLLEDSALSRAALGCCGIPLAMLDANAKSSPVTYVNSAFEAFFGYREGEALGRSLAAVLLRNDEPLLQRLLAESPKRWEISAWGKDGEARHVEAALAALRDASGKLTHWVVAFSDRAELERLRSEVESLKSLAAASLGIGIEAGGKPARGSQKARIEVPAADELHPDRQS
>SRR6478672_5938487
SVRRLSKETILAAPEKIFTALLREINASPDPKIKRACGNSWIAPHNWEGFFLNFGDMIVKNGEFEAAKEIYSTAKLSPSYNEWVYEPALEKRLLEMKENNIAFNKKQDVFALNGNDQIMINSSMSCTGCHQMSNSEFIKAGYKEP
>SRR5262245_38459693
KSVAAGQQECAERLTPHKRGKAFPRDERRKSGTVWRLGLTFAPAGVCEVYKFTTLIGCILAQTLGAARTGIAAGPDRPTERTGSPGPVRPFYGRGAIGGVCGFGAMPVVEPPPGAVVVRAGGLWYWKSGAFLSCSFVHVTCSFTLVGSSLPMAAPAPVVLPVLAGTTLNEFMSMATLFSPMPRKPPTPTISARILPCLSNRMSLTSPTWALSGPSTSVPLNFENTHX
>SRR5215831_1038994
TPDGTSESNWTNFFNIEKNLLSSNVIFPAIGNHEADGVLFAKYFALPQNGASGLSPAERTYWFKYGNSMFIALDANNPSGGSQVQWLQQELAAARADSSVQNIFVFYHQCAYSNGTGHGDTSTVDSAWVPSLEGNGGVTLVFQGHDHIYSRITHGPNTYIVAGGGGAPLYGTGASTAGTVVKTEASHHYIRVQVNGTYIQATVFRPDGTQIEAFTVGQPGGSGGSGGGGAGGGAGGSGGNPGSGGSGGTTGSGGSGNGTTDSGGCQM
>SRR5215212_9325299
NKCDHLSTLRLAVIVVAFGRIAGVDPILFSTCVVRHVCISHIRQFTGGHFGCRSGRFRAIDNYLGVLIGQNGGCEFRDLIGRQIERTRKVFVMVSSITECLYEHEVFSSIDLPFQIFSGNCIHSIFLLFRGHNSHDAVVVLCCGAPAVAIRGGKINESVRTFLHFTYAAVCAFEKILLTHDVSTVEYHADDPGASKAAKKVISLKLRKCQAGVKHPACGCASRRVFKKGRFHSLLCLPVMDDRPAVILAPLDEIKLIASISKPFKATWAVLSFENKIRAWLPVDPLRISDSIGPDLGTRSLLIDEWIVRGN
>SRR3990167_6373537
CALPICREEARDLKNEDRKATRITRAKLRGQNIIERATIRIDKLEKLNIKATDLARKMQEKEIDITLATASLQAATEKIALARASISEAKTMLDQLENAEDPLAVAKNFKSKMTEVYKTLVDARQSIKEVFAKNADTSYMRTFIEPMKNKNAVIGIVIIIIIIALLVAVRKQKYAIAPIDEQPATTAPTTPPPSITPDTTTSINDESALRELDIELNAEDDTVLPDELNIETELXX
>A0A0J8TGQ0_COCIT
MASMRLAFCGTEVPGIRGTVICPLLLVDESFWLGEKVRPWVLAGLNLLEFDHCTYSRLAKSV
>SRR5262245_63831105
LSRLLVKSFMGTFLCAVVFLVVSNSIIVYEVISYERSQLDAYRSQWGRASAWVSGLGRLFFFSSRRRHKICLSDWSSDVCSSDLCSAFGRTGRNYPRRREVGYAPLASSARFSAQQGLASLSHKCLLAPSLPGFPRTVQPVRQTRSEERRVGKECRSRCALKTIDKK
>SRR5262249_16412955
EVVLQARKGLRRVFRFQLRIGHRDDSRVVVHGDRATEVAVIGAEDGLTERELAAELLREVVLDAAAQEPVVVFAMPLGKRAVVVLIEQALDGAGRKTRCNHVARGTDIGDPRRRLRLLVTQTQIEPSVADARLTFDVRGIDLFLYALVVVELALX
>SRR5579875_1120949
TIGVDDLPIAKGTLIDQQVATNEDANGGDHAGDIVADVELVHGDLAGIASSRFVRLNDHTGADPQQADGRSDQAEGAENQWKENPADIACNLEKGHTEDHGADVLSGGGLEEVGPTSGAVAHVVAHEVGDDGGVTRVIFWNAGLDLAHEVGSHISRFSIDTTAELGEERDETGTKAETHDQRWSGSRQRGTGQAAVGRENDGDAQERKRDDQEARDRAAAQRNHQCFTKTAPCRAGGTNVRTYRDQHADVAGDTGAESPDQKCQCRVPGQANLDGLAALTEYGQYNGDHDSRDDCQCGNGSILSVEESYRSX
>ERR1719436_269911
IIHKFSCMPEGPFSPPSKGQYQRMMGSSSLSFLCQQALPFTSLFLINKNIPSTRLRAESGAPPKSKAIGLSFGFVEAASVEELALAKLLGWKVRVIGIFACFIVFRISPCFFCFTFSSFFQIILFLDRTDIRISSGGVHNNTKTKRFFLPCNRVLFVRVRTWFYSHFLQNQSSGDKLSX
>A0A137STU4_9FIRM
MKILIVGAGRLAQRVVRMLSLENHKLTVVDANAEKLGKLRRFKNHTYIEADPLGLDFYKSVNLGDFDVVVCLTRSDKTNIIIGSAAKRLGAKKTIALFKEVSPIEDLDDLKSSIGIDEVVSLNRESAQAIADLVFDDFSGKSDFFAKGKMQVLSFRANNSPDLINKTIEKVGALMPFLIVALARDNKVFIPNGNTIIEKDDLIYIAGLTKDIQKFRHIYFPAKTQVESKNIMIVGGGEVCEYAAELMSKKSCNIKLIAKDEKNVKRLRRNLSDALVVRGDFEDFRVLEGEDIEKQDVFIAATDSDELNIVTGLMSKKYKVGMAISKVEGLSYSLLLDELSIDQFVNPIGICANRIVEIIRGNKGLNTFVSFSGRAEMWEVKLRQKLPIVDKKIKDLNLADGIIIAGIEREDGLILVPRGETVIRQNDKLIVFCKNESLKNLCKVVNPESTPTFFGEIFR
>SRR3990167_1971404
VASAEQADAVFLLDQRNVQAIEAGTGHHAEVEGHGLALIVEGEHGGLFFVHLCHQRFAQLHKAGFLAAGDRVSHGQLLTQWVNVYAVNLELIVQVRPGGQAGGADITDDLTLLDVAAAADALGKAIHVGIQGAVALAVLNDYRIAIATVAAGQGNAAITGGLDRRAAWGSVIHTFVRTNLVQHRMAAPGAETRTDAGEIDRGADKGFAHAFASGAVVAAIALLVGVTHGGVGLAAVGEARREDIASADLLAVDHFLFVDQLELVAFTNIHGEVDVVAKYVGQIHGQTVRQAGAFGREKQRAVDHAVAIGGLDFRFDQFALETEALLALRQGNAFQVAELAVQAFQLAVGIQVELKRLAYFQACQLLGFLTAIKHVMQSGCAQAHLGKYRGQRVAVFHANRVLQWVDFFLRFFSLCGLQLIASWLLCSCCIGERXX
>ERR1719397_1477701
QRSRGSQRWMGTRRTLMERFSTTHSSCLLLEMEEVVSRTEEWRWKAMEEQKLDRSKKRSNLCNISKLSNGGNGGTNALWDFFFAKIQTQCLISKQKLCNISQHSYGGTGEQMLDRSKKLANVQTQCLISKQSFISKQNLCNISQYSNGEEWGEQMLDRKELAKMVISQHSNSX
>SRR5690606_35020854
ALVRAPARRVATPPAAATAGDGDRRLRAGLVFIARHRLLRTLTLVTALMNVWWAAWTAVLVVHAVSPGPVGVSEGGYGLLLTAMAAGGVAGAALAEPARRRFGARTVLALDVVGTAAMVGVPALTTDPWLIGAAIVAGGAGSAVWRVIGASVRQLVVPDRLLGRVYSASRVVSWGVLPLGAALRGALGEALGVRSVFAVGGIAGLALLQVFAIAVRPGDLAAVGLGAQRTSRGRSVRWATSRPASTRASVPPHTGSSCSTDSTPSKPPSYRASTSRTQSTX
>SRR6266498_1588512
ICRSWERSTLEVNSTSSRGPGMDPALGWSQGLAVEVGGAGTVASAEIVLPRLLADRVGLTTGLSGALARAGFIPLRDRGRALTDAACALAAGASCLSDIEAMTAQVEIFGPGGGASDTTMLRVLNELAARLGSDGLPGRKLAKTMAGARAKAWAQIVARHGQLPAVKVAGTGHTRPGVDQDQDAGAPRPVLFVRLDATLIEADSTKTGAAGNYKGGFGFHPLTAWCSNVGDNLAVMLRPGNAGSFTASDHIVVLDAAIAQIPAAWRTDVLVTIDGAGASHDVINHLTALNSAAAHGRRGRRIEYSIGWPVDERTLTGIGELRESDWTDALSADGKPDPNASVADLTGILRHGPGGDTMSGWPPDQRIIARRVPRPVGEQAKLGRPPRLALRRVRDQHRHRTDPMAGRPPPHPGPRRGQDEGTKDLWRRQPALSRLGPQQRLATAGGAGLLAERLAAPPRPRRRTRQSRTQNAALPAPGRPSPPRHPRPPQDPEDPTRLAMGRRSGHRLRTTPRPPRLNKRPVPTNSTTPADQWTRRPPEHIGPTNLDPDHHPAHDNRKSHYHEPRTPPRIIQVHAVRRADDSAAR
>SRR6266481_5783698
ERDQYLRARPHVGRSRERQCPDLGSVGAPDVRQPQRERPEPRGLRRHSADVLLVRPRERCASRDPGRQAPRWVRPERLGDGLMALLSILTSVLSVLTPPAKPLVPKPDPVVSTPTPGGADVQTGRALPVSSGPSRGLASWYPMRPATCDGISVPTWVKAWTASLTLPCGSLVRLSGPTGSITVPVWDRGPEGWTGRLFDLNPAAFIAVAGNLWSGVVPVSWQPAX
>SRR5918996_3897299
ASRWFARVRFDHVAMVTPRQAPALALLGVAAVLTSCGADEDDPEPPPPPTAVASCGEAFLGSGDPNWRRDATTSGPFGLFGAGRHFQRPVMRELDNGQLLTKLPVIVDGTRPVVLSVPEDELGRVGLDYGDLRTERAIED
>SRR4051794_24721663
SGDGSVRRQQGSPRRRPVPGSAAQVCDLQRGGPAGVRQPRLDLLPGCEATRCDGCQPAGPRRRRPPQGAGRACRGGRRPMTGGHANARRDMSTRSLISTDDLSDAELRALVERGATLAAGARPNDALAGQVVGIYFPLTSRRTRTAFSSGALRLGGQIIAYGPNDLQTNTGGSTEDTGAVLSRMLDLLVARTGGTDAELRGWAANGRMSVVNAMSAQEHPTQALADLSRITRHFG
>SRR6185437_8036068
RGAGRFRFAGAESTLRLWAAGRPPTGLAMRCRSPRLPVRFSRTTDSWRSSAKRADKDENLRNDEPTGVCCLRRLFQLADLAQLVVQGLEAHAELLGRLGLVAAMAVEGLLDGLQLDLAQTERAEGLEVRAAQPAVGELAGQMGRGDRPAVAQNCGVLDDVGQLAHIAGPYVLFERGDRIGGEQLVAGLRVRAKARQQVPSERGHVVDPVAQRRQMNX
>SRR5215471_7291055
APGLPQPTSEQPTKPKTPLSPPPWFVRGFFARRLNVCRAPDMEGRSLGHHLEFDMQAARQVRWTKTLHLGVLALLERVLHAARALLPRSIKRHLARFARVAEFALTPSVQLRFDARSTALVDWQALLPADTFADGPIVHANNGLAPGGVERQIVNTLVGLQRRQRAAGLLCLRLHDDA
>ERR1719233_1599910
FAYAGSFLKDPAQSTLGSSFFLSWACNHHQSHLSLVLYHLQNLNYHSERLWLPWKFLQSFLLLLEIVFWILFWVRLPLFPQLLGQLSYPSLKGLCYQQFQTLPX
>ERR1700722_19934493
QLPWRNSQFSDAPGIEVSLTIETVLSNLNSLSRKSQCHDVAGVRNRPESLRSNAAVKNPPVPSLRWRADPSPPGPRVRAPRGGKSGKMTRRRRRKVTTTRSLDARLTSAGPKRILALDCGGVRGVISLAYLERLEAILRGRFGPATVLADYFDLIGGTSTGAIIATGLALGLTVERLIEIYLDLAHKGFRRSAFSAFLGPKFRAASLLEQIQIQVGDETLGSARLRTGLAIVAKRIDTGSVWVFHNNPRGPWFDPAGLDPAAVANKDLKLTRLLRASTAAPTYFAPEHLEIAAGVTGTFVDGGVSPHNNPGLLLFLLATLEGYGFRWPAGAEQLMLVSVGTGHHPMTQARLPGKGSPSALLAVLALRSVLDDCSWLGQTMLQFLGT
>GraSoiStandDraft_51_1057287.scaffolds.fasta_scaffold520000_1
VSRNPHGSGSGFATPQVKRGRPASTPPGVDTRALANPTTMHTMSPDTSCKEERPKLRKIDLGEPITVDFTGASRVATSTSMAGSLGQDADATAKVNELRQQCIAAHTEGQVNFERLDGRALHLEAEVTKMALVVAEVQRVVVDIHAQQERLKVETTRVGDELHGQQAAIVEMGDRLVGTTTSFTQHLEDMKAKLEETAGETLKKHEDNFTDVQGFAKLVDNKVVQVEATFAVMQKTMEDIHVRLQATESMAKRAEHQPPPGPPAGVRAGRWMGSAMGNAFSIGKATASCSPGCTDDHTASQSSAGKSSAMAEMTNIINEAMTMVSSQFEMV
>ERR550519_1962169
ELSASKSQGQMALEMILDEATGVFCHDERQNLSGLFESENCKINNHENVDIITGNDENESLGEHELEVMKGLEVEQLSTSKLTTKKRKAKESDEVMKENRGLDGNILSTVLKSQSGNKKLKVTGLDGSFLSSVKKTYPRDRKLGTKITCSKCDYTTTRKDNLNRHCDRVHLKILYNCNQCDYKTSCGQSLKRHIEAVHEKIPQTKLACSKCDFTTKRKDNLNRHFDSVHKKILYNCNQCDFKITWKRALTRHIEAVHEKKLETKLACSKCDYTTQRKDTLNSHFNRMHKKILYNCNQCDYTTMWRENLIKHNEAVHENNSYSCDKCDFMSTSKLIVKKHVERVHQEINFHYNCSKCEFTTTHKQNLKNHIDVVHLKISQNCDQCDFTTKYKRALKKHIQVAHQKLGFNCTQCEFKTMWKNSLKYHIKGMHAGVSHTNYQHNAINVHKPSLSSRKSVDGEVTTNCRTRAQNVSRDVTGAVNPIRKVSENPSSISDNTEQKRVQKKSETKGGTRFTMKKRKQDEKTSRLEX
>SRR5687768_17643082
LLYTGLYHSLLLLFFLFQHPSTTQTYPLSLHDALPICRRVLDQAAARRCRRHHAVQLPGDGPDVDVRQRTRLREHVRAQAERERSEEHTSELQSRLHIVCRLLLEKKKENINNTRLTEYR
>SRR4029434_9585403
VIFFSLSVSLFLSLSLPFSLSLSLSLCLSLSLPLSLSLCLPLPFGCQATQLGCAPWWLCCVGIREPIPSHSHGNRVPECLCVFVCVCACVRVCMCVCVCLSVCVCVCVCVCVCVCVRADRERTRLHYTHSCISYSVLFHKNRTSAAVDHIAS
>SRR5271168_4498088
RAGGVGRRVEVVLRCRRRWRRRLRADRTGARQQERGDGAHEQAGRSGGLNHRTASPTGAPLRCPRRAAPGAPRCFCIPRRRPRSKATKGCPTMPRLAFALALLATGSTSPAGATWLYCTATGTDGTGAIEFQTTAADVGAVPPARVAYFKQRLVQHATQADADARGMQANCFSFDDQTAAMSDYS
>SRR5713101_1804337
HARIQARLNAARDRAEPGEGRPLAYSHRHRRAQDRNRMRLRAHRCTPARVDEYLSAVRLQSDTSIVWCCSNRRIAVLLVLYSSSMSPATPESGKAAGSTHERILRVSKSLFANRGYEHTSTSAIARQAGTSESQLMKHFGNKAGLLEAIFVEGWTQITDAARVAIQDVTSPLLKLQTISGCVLRSLERDPELKLLLLLEGRRIRKEGQMVSLTQGFLGFVQLVDGVLYEMRDLKILRPNISAQAVRSALMGMLEGMLRDRFLAERLGFPADFNHEQIREMLATAMAAFVRAX
>SRR3954470_16959927
VSTGLVLVGAAIPLAWLTGVVGLGWPPNASARPASAIGLDRFGAALHLTNDPLGVLRAEIALQLTGFAALVVVHRAHGLDACGESGGSSDTVIARRLRHVVADVPTTSRRPAATTSASRGLGIVLGAPTARPDRPSARDTAAAARRLRARTSWRSIVLKEHGARRRPRGP
>SRR3954468_5071070
NGALIGSNTGGAALGGEQVVTVTGGGIDLKGGGIGVNNRASITAVNANQTINATGTITVIGGDSGGVANSSNSSNGAFIVDNTTVGPVRTQTINAGSIELKGGAGGTENFAAIGAAKQVITSVGDVKLTGGNSDGVFTGTRIGGQGGAAPTATDLTLTTLTGDVILTGGSQANAGARLGSSGLTATTPATPVAVANKVTVNAGGNVILNEGTAVGALIGYSSAALPSAGDISVTAGKSIQMNGTTFGTAIRTTGNVELHADQPAATITQSSASRVLASGLTTTSDGSTSLNGQNQVSTYNGKSTSAGITLNNSGPLTVTGLQAATSSSITNNGAMVINGALNTGAGSLNLTTLGATSGLSLSSGAALRAVGSTVQLTAGGAITEASDAVIQSGSLITSSGGATTLVGANQVSSFNGTTTGGDLTLINSGTLDVTGLGVAGNVSVTNNGDLTISGVASSTGSQSYGAATISEASNAFILANGLTTTSAGNTTLTGPNEVSSFNGTSASGDVSLRNIGGLNLTGLNAAGSATLAAESLNGAGNVSTGTGFTVTVASDSLLSGVISGAGGLNKKGGGTLTVSGNNSYAGDTNVLVGTLALGGSDRTNSGVVNISSGATYRGSAGSFTNAGIIGGNGTLDVAATSFTNTGTLRPGGAGAIGTLTVAGNATLAATSIVDIEAQSATSHDVLAVTGAAALGGNLNVTPINGYAPANGDTLTPLTYASRSGTVFVPGTWLPTYNPSNLQLGFDSTINRWVGTTGNWNVAANWRPGHTPLASETVLIDVMGTQLVTLSDGSRFGGKLVSFENFLLSGGSLSLGGPSAFNGALSLTGGTLQGAGNVTASGAFNWTGGTLAGAGQFITGPGSLV
>SRR6185312_6080286
RAEEVEELLARHPAAPPHHRLFHERDVRRRSAERGEAEPQEEQRDLDERALHAGVKRARSAIPSVSSSRATASTIFSKPPCGSAFSLSSKRSCSLASSFSPTSSRNAGKSTVSSRAACGSYMRMNLASASASGLRPASLFMPAAVASLSTSAVTRR
>SRR5215213_10844578
XMPKTCTRCNSEPVLSARSAAVRAARSASLEPSVAKRTLVGKMLIWCPPRWTLALRLHDASRTYPVRTSENYPSTHFTWVNRGRKGILRTSASVLALVASGTSETASFGKEDTKMYWYNPTTHSSENVAAPSNDSQAIQMLAGTQDSAEFVKEYCQLRRSGTPIEQVLVLVGHEFRLRQPEYQLVLRX
>SRR6266496_2280139
ELTMQYVLRLFENDVEVSTSSVAITPDAQSYSSVGQTIDDTWRVTDVISQARTEQLRKEQSPPRFYNYDGSVDPINVSGKEHSAQGPFMNLHCLITVVNTTQAPIKVNPVRLVVDGQERTLENAFFRLKDGSRERLKKISLRGNDKEDYELHFMFPDDQCPTSKDGELWVSSDNRPEPITLKVKFRX
>SRR5439155_630595
RTAAAIVVPPSVASASASGPSDSEPTRSTLSERAGGSAKTGPKSGCVPGLANPLMRTSNASRSGRSKIPTSVATTAVPPAETNFFTFWASAGVIASVAPRMNSTDAVDASGANRSHARGADEQLAIGERRVPADRLARDERGEREKVERVDRLARPTGGERVVRGAEVAGRIGTLRADRLTQRHLGAHALAEAAAERRDDEEDDRRAEDPEKRPHQTEIDARTLEPREEPLDRARDGVEERRRGSRVVNGAQRVAQRRVRTRSLDRRX
>ERR1719277_1000244
PDRASKAAGLRCAAEVELWEEMVVAGVRQVLQHHFGEVLARAPTTFVAWVALRTVRGDNPVQWVPQEDRLRPVLALHGIHAELASLLEPRVHHVAHAGRKEIGRGASTICPFLDAVQGVDHPGELRAGVLRDEAEEQPEPGHRENVLGDWLGQAVYPSSSPLLGVALIPAQVEVGSERPAQ
>SRR5947207_102588
DRREGQIPAVLAPRRHVLTCLSNNASQGVLAMSRIPGLRALFVCSALSFMAVAATAQTKVAVLNLQRAVLESDEIQKASAAMEAKFKPRQQEIEKLQRDLQGIQQQLQAGAGKLTQQAEADLTAQGQRKQRDLQRMTDDLQADVTADRNDVLGKSSQKMSEVVKKLAEKRTEEFLALLRKGDYKGAYRLWGCTDEKPCRDYAFKNFMDDWGPQSVRADNPPTITKSRACGSGVIVTVNSSKGDATLWVQQGD
>SRR5207247_709107
DVLAAHPRLQLSGEHNASLLRDREVHVPGRPPEPERGRPYAVTECAVRAVRAAVRVGAGDERAGENELLLGEVEVEDPVARRRAVAASGQVTSGGRRTDSGNSRRPTLIIPPERRISSSCGDSAAGSYVLPRVSLLSFLVFGSNENASPSCASSTASRLWTTVSPRFSALRRKMSPIAAPHTMNISRPASSATPLRPAGLISRELPMAQRSPATTNVSPRCTRSRKLGLRX
>ERR1700688_3359193
RRRRRTLERRRLSAARARDARRDGTIGVHRTGRRLRPRSALRRDHSRRVACDDRGRAGLARCARRFRPAQRTPRRALRRARSRHDHLERHPHPRPDPSPRFRGVRKIQGDRQRSQRPARRRLRRDADRATARNRRSDRRRDLERPWRPARRGASLEEPRRRRLRRPGGAPRDPRALQPRRALHSVRPPCERRLHRSREPGERRTCPRDGDRCRARCALVRRRRLPLTARALRRARWRRRGGVFRRAPFRRVRRRRHRVPWRFWGTCSGRRRLSRGRALSREPGARKSRRRRGHSAPHRRRSAARRVAAASAANACPLHRRGSGRGSRIPPTSRASARRLRDCARCPARRRRARGRGRCGAHRSLGNVAGAGSYGRTRRGRADSALRARYLPRRMSELEAIRTEIPGPRSRELTAVLARTETRGVTYVAHNFPMVWDSAQRATVTDVDGTRYLDLTSAFGVAVTGHANPAVARAIAEQAARLPHAMGDVHPSDVKIALLAKLASLTPLDEPRTFLCSSGAESIEFALKTAFLATDKPDLLSFEGAYHGLSYGALEVGGIEKFRAPWRRQLLDRTVFARFPDRRIPSTAARALAEIEAAPPRRSSIGAVVVEPIQGRAGVVIPPDGFFHALQTLCRDRDVFLIVDEIYTGFGRTGTLFACERESVRPDMLCVGKALGGGFPLSATILARRVADAWTPSRGEALHTSTYLGNPMGCAAALANVGEIERLDLPARGRAGEAKIAARLEPLRERPDVVDVRGRGMLWAIEFRDGAAAAATVVRALQNGVITLQSGVRGESLAVTPPLVIDDAQLERALALLCDAVAEKVMTX
>SRR5262249_19266331
XTLAARQLASRFGGDRGSCDWRHFGRLAVFTNQKKERRLQSGFQPFVRLRSSEGYVYSAANEFLREVEALKREHLSCRQRRESPRLPRETDTPVRAITSFHADLRYGGDLHRADLAWAVHAAARGLSLKKQDSRAPHRLRDRQVLNRVVWRACAVTX
>SRR5512143_347789
GFTGCRRVRGVECCESILQLRGETVLGSVRQVKATDQRNEIVDLSRHRTRELEREGVDVEGPRARNGIDNSPDAVAHADVAERLVNAWRVGDLVEIPCADVVDKNVVTCSRLRLEGDQVSGDSDVALLAGNGDLRLCAASDGLVIDVGLAAAGRRINRDLAVGVRETVLARCAGECSNGEYAWRGLGRRVDVTARDIRLALLPNDGVAIRTDGGVHVVQAIVGQPGHGSSAQVIDTDFALL
>ERR1739838_676663
EIVSHFESDTNSSLGQISDNIGFSLGEGGVSCNGGGDQSVVHFLVFSAASSVFRSVFSVTGQTKTSVLGGEIPAILVESSVASVGLVDTVQVLLLRKALPLSRDYCVVGLDGTDSSESPARSTASLVLDSGSFTLRSPVLGCGDISYKGAGEGPVSVGGGVVSEISCLLFDRQVSELVEALPPX
>SRR5918995_363747
HQPSSFGSSSPAAASPSSASKSTPKRSKVSPCSASTPSPTTRPSSNKPASPSTSTKRRRDGPTASIRRSANSSAPATRATARWASAPPPALSEAMLTVAVRPYPAECTSLPDDPTDLPWSVPHVVELLHPAPARRARRQLSGQLLDNSTSHRASVLDTLLMLPIGMDALDARLIRAMWETARAGVMELTRQLGVRRATVRTRLDKLQQRGIICGFEPDLDLRAMGYEVLAFVSLEIAPGRLQAVAKHLREIPEVLEIHSVTGPADLHCRVVARTNDHLQHIIGCILEAQGINRTTTQIALTEQLRHRVLPLVDLVIDHGEQATTEDPWRGGPPNPPAPTAVRSPGRSA
>SRR3954452_4728668
DRDDRPHRRVAASDLLDDQAVARVVERADAVLLRDRSAEIAQVPKSPGEVDVEPLRPIAVAGARDDLAVGEVASGLGDQPLLIAELEVHLNPPRRQTLQLSSSSRARTPANASAASRVRGPGASSSTSSIAATGWTSRTVEARNASLAASRSPRANVPSSTWSSRISAARVIDSRMPTSIAGVLRTPSPTQKIEEVGGSRTTPSGRTRTASSAPAARAIRLACMLAPX
>SRR5215813_7369292
CIDTTSMGVSSAVARVGASVRVLHPQDTPSQGSRFVAQSSSHRIRRHRLFFLWNVTQIELPRCILGERSMGGRPVDTPEDEILIDRMRQGRTDALGVLFDRYARLVFTVARRILRNDAEAEDLTQEVFIEIYKKAGLYDSGKGSVK
>SRR5260221_1576336
QITLLAVDRTAARNPRHGDELSSSLKLGCARPIRLPHASQHWHAAQGGPGVEHPGLGRRHGDAQDLRGFFHGKFPKLVHLHYFSTAWPKAPDGRTDNLPALTVAVIFFRIRRPVRELPLRPCLFRGARLVHRNFPDSAFLSELSQRGVDGNASQPGGKTRAPIETCEVYKCAQEGVLHCVLRVLAIACDSKRHAENHFRMPFAKYPERGAMPASCGGYQFAFAPSLDAARRVCFVKFGLTCTHQASVHRLLLTPVSTQQLCPAVLRVSFSNPLPDVGGTIFQMHSCCFTACQELLNLPVHQPYILQIQDNQSRAALKAEKGLQFPDMLSLQTTDX
>ERR550514_625570
ETFKIISVTCTNEWTLPNPFLGAAWVTSPLVGAPNGVRPSDYVFNWDYQQKEYPLISIDTTVNNAIVPNAQYQFEVFINGNLNNPKQVISEKKGSGTFQYQPDVAGTYTFRVYVSDQCKTQIYDMPTAFTVGCGFTPEPQITGSENVAFGVTFDNFEYRVRYDNRKAGFYRVRLSCKESKMTGLPVSFKWRDVCKWNFENSNNLPTNTTKDGEITLQPIQKSGTDG
>SRR5262249_32914110
XAGVLTMSIAGSVAWQVREGSEISELRGADLELEVNSAYRSGGDRKHESNIVAVRITEMVIHNNLKLLGGADIRVDTLVVHGKRPGGKSDLYQPGTLRFPDVRDEQHLPFGEKGVLIYLGEPRYFLDIFINVSRDNKDAPDLHKLLTGESARNFASX
>SRR5581483_4550651
TVPSFIAAVAVPEITIPTCSTSQNATPACGPTCSDHLHPGSYVAQPMVIPPTLTISNFPFANKRTSSGFSNRFKITSSMLFPRFAFLLLSFYFCLPHSGHHLQPSSVHLQGRTDAVTRPRRTEEHKEVGQFLRRSEPPDRSFLPGDPVKILSPVGPGPGHSLSCRFLPGSRQDQAGVDAVDTDVVPDQFIGQALX
>SRR6478609_4614806
SHAMEGERPAYARIAGSDFAALSIEEQELVMKIRHVFGALTVTAITCGMTAGVSIVRAQDHHDPFLSGTSPEAVQQSSPEAVHQSSPEAVEPVVVEQTSPQVETVQKDTPRDPYILKTSPKAPKVKKVKHEKEAYSGLPKGHITIVGCFYRDVDGDGDHAHYMLADAKMGPATAVADQNCTPSGAGQLIRLKDADDVGLTQVASNRWVELYGEMGSPKDADDARKFEVKSFREVPLAQRPRIAILIPPAPAPQAAVETPPAQEVGVTESPKPMATTGETPYERKLPKTASELPLIALLGLFALAGGLVLGLVDRQKVLGRGX
>A0A1W9U6M8_9DELT
MEIKINRDVLLKGVSRVQGILEKRSHMPILSTILLTTKQDNIEISATDLEIGFQNSYPAEIIKPGSITISGKKLLDITRETNSKNIYILEKENNWIYISDNKAHYNLSCLPADEFPILTEPEGIIMIEINSKILTEMINKTIYSITMEDTAFKLSGVFMEIVNKNKEDFLRMVATDGHRLSLIDKKIPKLQEIDIQQGVMIPKKGLIELNKLCLENGNILFGIKQNNLVGKKEEALIVIRLLDTEFPDYKDVILPKKEDKRNIITVNRKLLLESMRRMIIIGGDQYQGVKITIGTDYLEMVSVNPDLGDVEEKIEIKYDGEPIDKKKYTASNIKVLKDLLAVRKRPAMYIGNTSTEGLHHLLYEVVDNSVDEALAGYCDQIDIKILGDNSVIVKDNGRGIPVDIHKTEKLPALEVVMTKLHAGGKFDNKTYKVSGGLHGVGVSVVNALSEYLEVEVYLNGSVYYQTTDFSFDIIRQRMRELAFLNTGLKINIYDDRTHKEKKLFYKGGIVS
>SRR4030081_3248946
WPPAAKRAPPTSVLSTLSWRFSLASHRRADRRPLWVRGCVKTLEPPRAQCIFGHVGSISHDFVGLNRALANLHGMLFAFSHSLGRERSFERQVGIRSAFGAARPEQAVWRGSALGPCR
>SRR5262245_55954626
PRAPIRPTRTASTTCRATSGNGCPIGTARITMGGERCAIRRARRSGRCGSCAAGRGSTRTSRCCGAPIVTRSRPTPTRTASDSGSYAADSGSLARADLRRRGAGAGAAAAERRRDGRRGDDPARTGSRVRHRRRRDAREEPARGAAPQRRSDERRAAASRAGAPRVRHPAHDRLRSAAGVRLRAGQTRAARVRCPQRHRSPPRRHRPNRGNPRRGGAVGRDVGERHPLRSEGSRRRRARSAAPGGRRCARPSRCRGLWRRPGRRARAARRRRPRTVDQPAAADGPDDDRRGVGGADAGRTGDDRNPRARDPDCFAAMTDADYQKARRWLIRRDPILADAIKRIGPCRMAERQRKDHLTALIGAIVSQQLSTKAAATIFGRFAALFPDNQITTAAAIDAFDDATLRGVGLSGQKVSYLRDLAARIADGRLNLDELDALPDEQVIERLTAVKGFGRWTAEMFLMFRLHRPDVLPAGDLGIVNAIQRLYRLRKRPDPKRILKMGELWRPYRSVASWYLWQTLRNEPLSTAPRSRPRSPAKSHARX
>S3BF76_9BURK
MNALGVWGQFFSMAILGLVLWAAVSDLLFRRIPNAAVVSIVLVEAAALAAAALGGNGGAALGLLQSGSVWAVGVLIAGFLLYLTGRMGAGDVKLAAVLSFWAGSEALLFLILLSLVGGLMVLGLPILRMIETKTGFWAERLAEAFGRPLECTPIGLLGGEAQKGLPYGLAIAAGFAAVQFGVFSHIF
>SRR6266545_3847418
SWRLPGRQGRPPPPSTWARSASTSVTRMGPTARCGSAAASPAACPCPRTRVPPATTTAPTPCGSARRTPTATCTSKAPTAWNAGHARPTRSTAPERRQGRLVADPLWMEHQIKFLCPTRLLGRSIPRSAAAVAQALVIPLVIQTIRRVPSGSVWIDEAPNLSGADPSGPTTSTWSTRLRIWRLGLRIPRGVDADRHGPGWRLPRGRGPLPVAAMHHLLERAPVGPLNRREGAVGGDAERDQQRTEPVLGKAQQAPRQLLVMHARMGAADAEIGGGQHDAHRRLAQVELDQVAQAGVVGLRGHQRDRRRRAGDVPGGAPHPGQLSELLPVSADHEIPRLLVAGRRCAPRGLQDPVQVLGRDRSLVVGPHVAPGPDRIPRLHLDLPQTRPERRARRPRPQX
>Q4DQ35_TRYCC
MVIFLAYWRNETTQTGKHANRRKCVQMIIKRWFSRVHERICVFRLCSFLFPFFFLYYFYTCKCNSIATYVMHIYIYIYIYIYIYIYLPFPLFFYLFCISIELVKKRSQMVKANYIRAGRLVRIIRGPRQDRVGVVVDIIDGNRVLVENPADKKMWRHVQNLKNVEPLKFSVELSRNCSTRTLKNVLAEKKILEKYAATKSARRIAAKRAFARSTDFERYQLRVAKRSRAFWTRKVFDENDKKKPVSWHKVALKKLQKNAKKVDSKPAAKKRIEKARAARKAKAAAGKK
>U2C1V5_CLOSY
MGADSMFEILLNSLGDTAVYVVRKDDYRILYFNDIVGEMVPGIRKGDFCRELWTGYKEACIFSGIGSKKPYSAVGFDETFGATVMLTASEIEWGEKKTPAFAITVKPYAMSGTEENGKEEKELLLCAMRLFGEVFLLDINTGRYLVYKSDGLPDTMFEEADFCDFNRLYGENLIHPHDRQVFYDSFTLENIRNRARERQQMISAEVRRKDRSGEYRYCELIGIFYKDREGISEKMMLTYRDTDELAKARIRERQANRRFVRAVNESYDEIYEGELYTDYLRQWKGEKSTPYFRSSPSFSEQIKWAADTIVHPEEKEVFLSRLSPDRLKEDFENGKSEVTISYRRLTPSGSYRWHSLYVRLSEMTTDCIRVMLYLKDIDDVKKEEERKQRELQNALAMAEKANEAKTDFLSRMSHDIRTPMNVIVGMASVARFVLQSEAKETANLQCDEKTGNYAKLLNCLEKIEMSSAFLLSLINDILDMSKIESGKMKIANREMNLKDTIRNIKVMIEAQAEERRQTFLVSVAPEVGEFYYCDSLRLNQILLNLLGNALKYTPEQGEIRLCVTAGKVEAGEQLIWFIISDTGIGMSEEFMARMFDPFEQQDFGGSRIFEGTGLGLSISRKLVELLNGTISAESEPGKGTVFTVKIPMKISDKKQKVRKLGETQHRETDREDSLRNKRVLLVEDNEINREIAVMLLEQTGIRCETAVNGAEGVSSFEKTVPGWYDAILMDIRMPVLNGIESAKKIREMERRDAKTIPIIAMTANAFSEEREEALEAGINDYLTKPIDAEVMYACLRNYMRR
>SRR4029078_11775012
IAEGAVNLPIGDTAAMRVSGRWNQSGEGWQESLLTGKDHGKKDLWSDRALLLADIGESTELLVNVHGSADNSETPLGRGIGLYDASTGGFCAAVLAGHQDDANCAMEATFYDPQFRYPSVQGDSGRKTLSDPINQFDNDGHGASIRLTSEFDAATLTSITAYERFNYGLVFDYDGSDGEFAHQHAKSQIEAWSQELRLASTTNGPLSPLPGVALATGALRA
>SRR5260370_25801032
THRLCLARRQIRVHRSNPSQKSGPMRCSEAPAMHPAPPAAFPGSLEAGTERHKLNQVTGFEIKVFFVLQLAVINSDYRREITGTLRPGVIVIVTGGYYVDAFQVGEIDPRFVAMDVFSYAATKAAIQNFVAVIQRQINSLTDYIDAIGVVLVQNPETSDLGF
>SRR3990172_1850163
VGRRGAAGHIPAVVDGDAVEPGREARVLPEGGERQVGLEEDLLHHILGLLPALAQQPPGQPPDPARVPEDQGLEGVRVPPLAAGDPGRVVLRLGRRTHQPHPPGCGSVRLRGPPLYQEGSKGARLAESSRCLVRRPRVPPPGGGGYIMAGNQGFGADSGVKPREAGGEGGRGWPFGRRWRGRRGRWAAGSFTWWPPRATWPS
>SRR5580700_5373870
XMPRSQSRLLDGLTPTERWQPQPGLVLSAQLGSLAATGCIVWLLAVRSRPHVHSLPGAVTQSVVVGLVAFVCSGMFMTAFQLATARSLGFDALRTSLPTARTAVWLAPTAILLTRSSPFAVGAALALVIGTTKMLYFQWAEFESVGGPLPGRSNRWLRTSAYGVALAGQTTIVCLWMGSPLLAAALLCVSAAGLTLMCLVADAYRAREPSTLPDSLLRILFTLILGVGLTVGGRIGGFGSSSETSGEPDDRARPELIT
>SRR3954452_18840074
IARDALRRGYSRNPAHFLLWSEILPFWPKTLDGWFRDAVRRSAVLLASLIAHGRGPHAGGEPAGASRLPLRVELPWGRRGAPRPPRGGCRQAGRLLPRRADLVVPLAQGDPARARRRLPLHRPRLRRLRPLRQAHRPRLVHLRPPRRADGGAAGGIGPARRNRRRPRLGRADRAPLG
>SRR6185437_12615591
XVHPRAGLSQAPGQVVLSFPLHVLLQAGNPRWPRRPAVLPLHLIVRAVHLPETGRTPSTGEGSEAGEGRAMTTPAEQPVAQPAAPADRLVPSARSISPWTTRQKIARVLWMFVRATLFRWSFHNWYAWRVMLLRLFGAKLGHAVRIRPTVSIEIPWNLEIGADTGIGDHAILYSLX
>SRR5689334_22958838
LSDPERRADYDEQRFAGIRGAADLPPAAQRAAPPMRAPAIATAVLAFVLSFGVWMSQQPAVPAAKSAVVRPAAHVSPVPMVELEPESERLARLHAQSGVVATAPAPPDPQLEAVADVPAPSPVLPTSRVPDRRLAPAVRVSAHVPPPAPSTA
>SRR5215469_4716775
PCLSITHDDVYRMPKHLADLERRARPYQACYVRWLASNIATIGGCVAFAAENFPQFAEMRNSARTPVGKRIIAGSSTMGNPMADDEITLETLLTFQLGDMEGGIALVLGYATSAEKLSKREMDTFAIGMTREKAAELGRALVEITDKAPVTRGPRRREHX
>ERR1711865_1142824
IHPFFACLSHRAIRHFPGLLSSFITPDTRISVAFLGEVQTYIHLLPPGVHLVPDTPCRGFTQPRLVPQVTRAEQYRPVRLPFTLSFLSYLRLVRCTYPIAVHHNSFIPFHPSSPAPATACTPRLYLRPYRPCPAICYPHLLSCLQPLLLFNRYDYPLFVDPKHHFFYLLWLPCALLPLFSTIFILYSGTACQPLHQCRX
>SRR5688572_31128903
FLVVTFIILFFFFFQAEDGIRDLTVTGVQTCAFRSGCSRQAPPSRSGPVFATRCSTLGLVSPLQWLRRQFRAACMARQRCCLTRSEERRVGKECRSRWSPDHLKKKKKKDMKIKEX
>SRR5436305_2025442
IRARVEWFVQKCRCDRQGAEERAAERTGPLGQFGNIVEIARAPALLRMESVKRSEQAPAALIGVVVVSMFRGGNQKRASDGVTNLNFEPVIAARQCSDRDLMTASRSRIDDCQMARSSVFEMKNAFDVSGGKRAIEPDFGRPLPPDHAHRLKHSSIASFFDPCDCILYVSIFX
>ERR1700722_19574956
LQLADQRTGKVVSTSYQDHDIAGYKRPAPALQRHAAASLPRDPTRQRLGKDWRGGGKPLVLFGHHPWFWFGGLGRLGQRPQLHAASLSGPVSVVGQHVTFPHHPGSRQRVGEYAVDQIEHGARGPEGYIEPRFAPWFAGRLDPLAQQLVRMIERFDIRALKRI
>SRR5512141_2661244
XMGGPTWELFSCAIGNPNDFSALYPSERLAPSLNDSLPGIQITPFERGSEMKRILAAVMAVAFVISVAGFAVAAEKAAAPAAEKAAASAEKAATSAEKAATSAEKSAASAKKSAKAAKSYLLTGTIETLDPAAGTFSVKGRKGNVELKAGEKVKLGDFKVGDKVIVKHADGTASSVKAVKAAKVAKKAAAKAEKSAVAAEKSATAAEKSADAAKKAAPAAAPAMPAEKKX
>B3ZYH5_BACCE
MNIKSVYKCIATTVLLSQIMSPSILHAQEVSDKAESGVVTQPENKRTGLMGYYYNDSNFSELVMMTPEKNGELKIIKEDHGELLPEGKRNIQSIRWIGYIKPSEDGEYIFSTSSDQNIVMQIDGKTVINQSPMENKIELDKDKLYEIRLEYRQDENGKHQNLSDLKLFWSRTNSDKIVIPEENLVLPNFAPGENKTKLIPETHSFDDNSIPDTADLCLDTDDDSIPDYWETNGFTIKGNKFVEWTDDLAKKGYIKYVSNPMTAYTTGDPYTDFEKSAGQMPAAVAKEAHNPLVAAFPAVGVKMEKMIISENKDYTNAEEHAMSSNQSSGTTVGTEVHVGVSENYGITGGVSASFSHSNTTENTISKSNGNTIHLNEADAAFTNLNVRYYNSGTAPIYRVAPTTSFVLGGETIGSFTAQANQIGNDLNPGDTYPNKELHALSLNTMDQFNAQPIKMNRQQLERLRAGAPVKLETPQVAGKYAKVLSNGDISVAGDWAPKLGQIENKTADIILNTGDTVKEEKVAAREYNNPEDKTPELTLADALKLAFGAKEENGKLTFNGHNISEHSVELFYDENTKKEMKKQLEKMSNKNMYDIKLTPKMKIVIKTPTILESGTDSNIDWETTNTNQPGLDDVGYSTANIGYGILKSKLEPNTSYVLSAYFKGTKHEKEIEFGIGSGKGDYAVNQKFELSQGGNWKKVELKFTTGDDVSKFNTVRVKNDRNDETRQVYFDNIAITKLGKAEKKFDGVSEDYIKEAHTFKSVHSDKKNGTNYINSINLNVNKPIKWKYKVKMNGKEVGDLKNISEPDANGVIKINFLDLNNGSGFLSTDHIEVYAVKEGLRPVKIAENHKYNMEAILKFKNAGESGMIEPYGDIRFINNGEVFEIWKDAIENSSREYTQDQPYKKDITFRTFTPITEESNIRFIANVKEEDYLANQDDILAYGENDPKDSKGLNGNIYFTGDVADDSVNIEYKITK
>ERR1719506_2373094
ANGQAAHAAANYDSYTEAEPPIMASGAGSATYGTGAAYGTGAATYQRANEYTGGAGSLPIEAGAGAGQSWQYTYSSGGASTKYHDSAVSGSPGSTHVVTGSSWTNDRTHRINIDEGSRVIVTVNGRDVEGGAQPVRQAVPNNFPKPPPAQFAAFGGDSIATMRARAERHAKEEAEQILRAEQGRERTEEVRKAEQILRAEAKQNPALIIEEAQRIEAKRHRGRPAAAAQPVEEEEDCPAPPELLTLPGKGCPGNVVTHCLNENKAYATLDEAWQACHTTSGCAYIEKNDLDKMYVLRRESDPDNAGPHVTMMRFM
>SRR5919107_2884606
SRPTTSLRRFLTVGCKSPETVVSTRSRWEMPLPSPNIKSDGCRYYVCSQHRKRGPCESVRCILGDHLCILSAGQLSQHSPLLRCPYPSCRKLRVLPLPLRSHEKAPQLLGRNPRRTRSAKRVEDQVPFPAGGHDGSPYQAQGLLGGMVAVQLLFLGHRRDRPDGGDLCRGVSAVNEVVVEGVVGPSLASPEQRLVGVGPRKSGQRRDRASTRWSDQTTSPMYSKWSSRDAEERTNALHSLRRNGX
>SRR3990172_5150764
LRLVNSVSYQGDALRRFSSRCGGLGGGFLVANACDLRPLAAIPLDAISALRRDTPLSLDDNIRSVPPLIGTPRCAWASGVTHEYVAVFMKRSTYASGNAPLRLAGFGRILPRPADRWNNRVSGYRMDDHAVTMDIVAQRAEVFGPADLRGPGPVPPGGEREDGRFHHHPHLRLDQRHSGDGGRELRVPPDPQSGAPEQPVPHVSRRRRVPRRRPEVRPLRVDRDRPLVPAGDRHGATERGGPPRAGPRRVRAVLRGGVRSALMDLWLVRHGEAVPEREDPARPLSPEGARAIRALVESHAGEAGPFDLVAASGKKRAIQTAAIWAEAAGYPAVKIAETAALAPNATPEAFLAFLEDRGEEGRILCVGPLPSIAAIASFFLSDGDPVRLAFSPGTVCRIRVEATRRGAGELLLFVX
>SRR2546426_2734100
GRASTAPDRARGRRRWKRRRPRRSAGSIAWSARRRYEIRKEANLTDANAIIERLGAVFVESFHVEVPSSDTDLLETGILDSFQFVELLFELEQRFGFRIKIESIDLDDLRTLSRIARLVAANGEAAQPVAARSSSDTAAYIVRLAGRSSIAKNQSCHGHAAYLCRGRYARR
>ERR1700722_10537092
LQPAAGKRRAQITRSPVLDKRHLALGHAARSVAVDIEYSHALAAQRKCDRQRQPDVTASPNHAQVKAHRKLLDLKSIRTLLPSLRRPLSNHEHLFAQKPLRRPHAKVQAYHPTGGRKSRLEAVGKELRNQQLDFEPVLHQSFTQAQMGEGCYVIVKVPVACAEIPDVRLEHQQSSAGTKPLPGLRE
>SRR6266511_848920
FGAEPAALVRDALGARRQAPLPTPAAPSPRLALAVMAELTAERATFTRREVVQAVARCLDAADAATIRERAKELADAVLADLEVVCLHAPERVEVPAALRRRDGWSVWDAPQAIRYTTREMLALEGRILHTAEMGRAPIAPAGVVELQTLERAVADEARPLGTDQHDALRAVTSRGRRIEVVVGPAGAGKTAMVRVAARAWHATGCEVIGLAHTAVAADVLRTEADVGAETVAKFLDWHARGEVPAGWRLTPRTVLVVDEAGMLSTRDLDRLRELVARRVGTKLVLVGDDRQLGAVRGPGGMFAALAHELGAVELRDTHRYQHSWEAHALGELRRGEGSWLEDFAAHGRVHGGTDTSARNECFARWWRAHQARRDAVMLAQDHATAGELAAKAHATRVLAGDAQPGGLRVRTETGTQTVGVEDLVETRRNDRRLTYGPAPDQWVRNHDRWHVRAIDQHRGTLEVEHARHHARLRLP
>SRR5207249_3827138
KMVVLNSIVSVLSAILALAKSGRPSPLRSTATTDPGWWPTAGEKARAKPPLPLLVSTERVFASGFALTKSILPSPLTSAAATHQGKLVPLGKEENIKPPLPLLVRTTSPNDAQTKSCFPSPLTSATAIETVVLLSNCEAKTKPPLPPLVNTETVGLSS
>SRR3546814_18573071
ILSLHDTLPFLGSSKVAVVWPAWGAKAGTQGWLENARVRRYDEEQHALQAASAGHGLGLASNVLVAEAVGRGELVEYRPEVRLAGARYTVVCVPGRERQAAVRVFSEWLLGRSIAEAEDRKSTRLNSSHX
>SRR5436190_12017692
PTGVQDILQRVLDDGADCQAETQVAKTLEAVAAKPFGLDSTRHGKREWQIEDDEQQERRQGKIAGRIREDGKAADQKNSGEQEYGRKIEARLPLDKQPGGQTIDRHQAEAHGKIRQHLYPEH
>SRR5438309_4153540
CWTRRMQSFPHVRKSFSKTFIPPRGNDAQLRRQRGRRQFKTNLIIPLSSCPVRDGIRRLRARDLDYSLRNQGTGDAGPEKILSFVSRARLKYGKNKITSEFFAQISMMHFIVPAGRAFSSRPSSSSSCPIIGAEGDNLCVVVVPKPAKNYRSAEPAGIRENNLHLRTRRRQSPKLISTSRAVCTISPVGGTSRKRLTASAIGTWR
>SRR5678815_2528847
TRHLCACRPSSRMDDMTTCPRTRCGTASSMRSLTPRSTSSNEAVTRRSSSSRSDLSRWSVDGWRVPAHLGDNEPPASSESPLSASSPERLAEWISASPEARSRALAKCLETITLKDPRIHAWVQINPQSATETGPLSGIPFGAKDIIDTRGLVTEYGSAIYRGRVGVDDADIIAELKDRGAILIGKTQTTAFAYMTPGPTRNPRNVEHTPGGSSSGSAAAVAAGMVPLALGTQTKGSVLRLSLIH
>SRR4051794_18478678
RRDERRADPDFGRVHRRRPLVRLEGRRICVGAGRLRPADRSEPGRAVPDRAGARGDRGRRPDALQGGLAVRAGPAVRRGGEHGEAPRLRGVVGGGERVPRHARRLRLRRGVRRRAQVPRDTALLGRARLEQPDPRVPRPARARHAALVLMRYTRVFTETDGETRFEELETPGETIQAVESDLVGTVSVTLAVKGIYFREVVEESSPVPHTAPYPLFIIGLRGTFSIEISSGETREFPPGSVVLVEDTTGKGHTTRRVGDEPRATLMAPLAX
>SRR5512138_1963781
GAPTRDAVTRTTSYCVRCPPSRGACSHSAISLCGICTRRRDAMAKRRDNKEDLPEQVAGNGLLHRRVFLQSGAAMAGAAAALGAGAAQAQSIGAGSPPSMLKPGAPFSAYGVPSHWRNNITRIVTQNPPPGREGAGSSRTPLQMLEGTITPAGLHYERHHNGVPDIDPDKHELMIHGMVRQPLVFNLNSLLRYPMETRVHFVECAGNSGGIAGAAEPQQANAGVLHGLLSCSEWTGVKLSV
>SRR4051812_18625933
GTPEAVVLALQGGTEVLAFRTGQEPLLATARIHPGEPLAFAYRNGGRWPWLMVFARDPRGAVSWFHPQWTDAAQDPKAVPLEVEPGLHELTTAVAHPFAPGPLALCAMVLPAPLSVRQVEAALATGSEAPAGGAAALRDPGGVPLGPPRFRRRFCWWARPGPP
>SRR5215216_1715194
ILYEAATSRKPFAGDSVIDSLHKIVYMQAPPIRESNPNAPAELQRIVRKCLAKDPADRYQSIRDVAIDLRDLLREYDSQQSISASFPPAPPSGSYTRDPSTGSHSQPHMTDSHSQIAPTMMHPQSTITGPEEALSSGPVSGATSAPQRESNRR
>ERR1711871_72301
NSVQSLRSPCASIDDNKSIALDPLRVSSFKPRRSIIDMVTFEESDEDDEIAGGPADEAPIWGDDRPPSVQPRRLSVRERFRNSVSTPLIGYWRRNAVTFAVKLVRHPRFDHFVLLLIVTSSVCLALESPRTANDAGLMNALRVLDVIFTMLFTLEVILKSIAMGFVTGLKPYLSNNWNRLDFFVVLTSWINLIFTWSGMGGEFGYVRALRMLRCLRPLRMISRYPGMKKVVGALLLSFWPMINVIMVLMLVWLIFAIVGVQLFGGTMYHCLPSVESCILNGTHCVTSRTQCLSRGGAWTRHDSNFDDVLNSIMVLFTVSSLEGWPEIMWNAIDGTGSDYASLYFIFFILLGVFFFLNLFVLTIFRNFMYLKQTMDGVGFLTPEQQNWVDSQKRIMASNAVRRLKPPRSVWRLTAWRVVRYRWFEPFILSMIAINVMLMATVGVKVDDWEEILDDLNTFFVVVYTLEMLLKIVALHFSQYISDRWNQLDFALVVLSLADLAIGSIDGGAVLTVRILRLTRLIRVLRMVKRAEGLRRIFLTIYLALPSLVNVGSLLLLLFFIFAVLGVNLFGEVQFDVFVNDHANFRDVLVSALTLFRCTTGEGWQDIMYELRRTGPSPYTATAFFVVFLTLASYMLINLFVMVLIDTFDGVTTRASGMRDEHMSDFKECWGVLDPNASEMVHAYQVEALLRMLLPPLGVGPHEPLHTVLEVVDQLQLIAYDGKIEYHKTFLAILNVSFGDVMEAKTKNHAMVKADNDGLKRRATHNFIHGDKSGGIGSKLRVMTRRLSSEFGLLKGGMMNELALLKARPTSVKDEVAAFRLQTWARAITGNRKWLSLVQQAKANSPKRMPSTNLAAVFLAPVPDTVLLPPVQQSSPISDKLHSPHKLPPMRTKRIESEPSVQPVTGSTRQQPLRKPARAGSLPTSPSATDVVIDLDAVLHDFQKQGINLSTGGSTQSEESPVDIEHAMAMARLTGGSVX
>SRR6266567_3171955
TQPLLIGALSLSSTFRLGLRDLADLQKVAVRIAEEAADLTTPVDRRRQEDGPTGFERLIRCLAVWHTQRQLMADGIRIGRRGKRDGRLVPGGPTTSHQQQPVPLKREDAGRAPIVTVDRGSQHVSIELPRAVKFTDHQQVGEGNPFRGEASVRHASAPSVVRAALATKRHAASLWMISQVCYPSNVYGKDRRLKRSSFLHRTVYPTTNHILESSAFYPADDSKEKERHDKMSMKERTITEDQPGEKMADHEDVLAQAQPFGRMGRPEAIALLLHALSPRMKLASX
>SRR5580704_9526292
XMASHTGISSANRRIESDFPSVFGWECCKRAKPATDRMQAATLSAWVRMRFAFPLRLAMNLALLLGAALHCFGQRELFHEYGSSDGLANLNVKCLFQDRVGFLWVGTDNGLFRYDGSTFRGYGHADGLTNTEILSLAESPNGTLWVGTNSGVAQASGERFVSVDGSEEGATR
>SRR5215469_13096766
TGFSALLSNGTFDFLYGRNPSVPIAQIDTGDSATSQLVIDPSSNVRGIVEVSSSAANPFLLDNYTDYDAYGNPISGSGGSVNAGGLTVDGKSGDADSASSYGFGGGYEDATSLVYLINRYLEPAIGAFASLDPALRTTGAPFAYATDSPPNRVDPHGLNTGGVCVGASAVDSITLGLLQFSTVFGQACLAETVNTPKTNNDVGFLLVSGVGKKGWGF
>ERR1719424_287230
WLKKAALSGAAIYIVAMAILGRWQGAVVAVAAFVLPLSAHSNAAAATAAEARLHLRGGEGVMAAGEAQGPMDVTLKSSTKPPPPPVPNPLGYGDLRAGGLGVLPTPTPMPPPPPPDPPIPPLGLPNMEEIGMDKLWEMDMPKGPVMVTGPSTTRAIGSTGVRPRRKRKRMTQPSTSLLVHMQKCLRRMKLLRRTGENDCVRPSCRSELISLHRLGRPGHERLLC
>SRR3954454_10920512
VSMIAMRPTWACAAVAGLVLPLLLAACSSDAAAAAAKEGCELVMSGNGIDESQLDALSTRAQNVTQAAGMLADAAAENPDYAELSGTAAAAAADLAAQLQFAEVNGFDPQGWSAEVLADYQREFPATRDDPYARLTSACAAQVTGX
>SRR5947199_9062679
RKKPVTWAFAASGCSRSAPNVVTMAPTSLCERDWSHRAENDKPAAHAVGVHPAAVLPGPSRRPGGDRRAARRRAVLRAVPAVLRPRHRPAVDPHRDLPADDVPEVPLPARLRTAVPGGGRLHRLAALLPCA
>SRR3989338_3014829
RRFGQAEGSSMILPPGQCIKSAIDFATLDFFVLLQELTKKSFTGYLTMMIRGVGGLEEGTLVYDGGKIVACTYEYLKYDNLLLGSDAFLRIVNASTAKKGIVDLYQLSSDQIKLVIAFNEKMVFVPNEKDLRNIKVTEFSPFLEDQIKEKVKTDRTEILKKLKMGEVANSGDGGKPDANADQPAETDSDM
>RhiMetStandDraft_4_1073278.scaffolds.fasta_scaffold4497251_1
MKIPLTFAFLIIPCFSCSAEITGYWNFNGSLKATIGENLEWAWEQGDATFGTTETFEIPGIQGNSANVLKIPDSDEFSDFSGIEVWIGDGLDEDSWLHNEYSIIVDILYPETSSAEIRAIVSNAPVEQASIIINGEGKIGGTSFHGEILANTWYRVGIVVSHASKKIMYYLDGQKVGHESIGGLVDGEGEHSLWDFFYLFTTSGLSKGGYISSLQFHNEALSDTVINDLGGTTKLDEPEDITLPGDEVMPTSDNSPGGERAPNAIDDNPSTKYLNFDKVDTGLTITTGGGVVTGLGLTSANDAPDRDPANFILSGSNDDGATFTEIASGEIPEFLERFERQTVSFDNDVAYTTYKLIFPEVVNPDGANSMQIAEIELLAGAPEAGGDEPDDNQEHHIDDMVLAPFGFRFGFSINTEEGESYTVEATGDLLQWNKIETINGTGSSVQFTDTRNEVFQYQYYRVRMAEX
>SRR4051812_32645189
TFNGSSTPQTFTITPTATGTITLTPTNSGGLTNPSPRTYLVTLQTATAYTVTGPTTGIVNTASTAFTVTPNGLFTGSITITPTPGFGLTPIVLNWNNTNAAESFTITPTAVGTVTLTPTNSDSLANPTAPTYVVTLPAATSYSLTGP
>SRR5690625_3194486
XMTMPQIVPTTSKNAMALIAGGGISMTSQEIAELVEKRHDNVKRTIETLAYQGVISRPQIEDGIKSANGVVPRHYRFTGEQGKRDSIIVVAQLSPEFTARLVDRWQELERIHSGPALPNFSNPAEAARAWAEQYEARIAAERTKAEIGSRREATAMATASAATRKAKRLEAELDQSMQYASVKRMEMLYHGQKFNWRHLKSTGTEMGIPSIDIFDANYGTVKAYHADVWREAYALDINQTEVAX
>SRR6267142_3947303
TQGKLEKPASEERSLHVITADRDYTEQEIAGNQSHESGYDQERDRTNLLKHPEQHREYEVQLDEQAEIPPCSIQIVENGFGRVKTIAGQAEQEAVVDRFTGPRKWRDEIYDVRSPVHRIQPQQPIPVPSGPSRWRINEVRERVGQAESAEQQKYADGMIPTLDCEYVDALEPALQHRENAVRX
>ERR1700761_8280655
RYVRTAACQSRSCASARRSKSEASLRRRDEQFLCIVRRSQTIRAAGEIAPGQIGRRDVPCVGDPSVASERHDLGWCEVTEERRAAGTRSLLRHLKPGADLGVRQLQREQERHGERRSGGKRGDFAERACVRLLAEVHAHAGGVYDGWLAVIKAGSHELVAP
>SRR4029078_20332
SAPRGWCCACSCWLWSWSWSSVMSAPGEGLAERVGFEPTDLSVSGFQDRRNRPLCHLSAGDSTAGGSESRCRCRRRARLPEQALEVEDRGVARRDEHDLDLVAQLLDVLVLEDLVRQRRRARLVGRGLGGRERDVRVGLALSLGDDLLGLDLPLGQDLLL
>SRR2546423_8221276
LRFNGVLKALYAPAAADCKAAAGGDSVRVFVHLSVIDLDIEKLSTDRSWWARLLPGDRFAKWVVNHVLSFAGAYIERHDARALSVWEKGGEKGLPLVPIGFPLCWGKTTDCGYVAKKSAPPGFKTATVALGKLGSITFASAGTAAPYLSASSRRFLC
>GraSoiStandDraft_11_1057310.scaffolds.fasta_scaffold1002834_1
MSSLDDELAEIESQTAYGVSAADYAQVTSNKRASPISTYRLASSSPTATNSPTSLNGGGGAGTATTSSGVAKVKASQLKSKSRGRRGSGFKPDDPAGEGGGAGSGAAGTNGAGGGDSAPVTKLPMSAYINPNMTPQQQAALQAMLERNPGLAKYAPPGAFSPLPGATPATQTTGGRGPPTSHRMGDMAPPPSIRMGGAAMPPSMKMGEPISRGADLTAGGQGQRGADLLVGWGQDLGEEEESDEDVYKPPVSKKMGQSAPPPTTRPGGAVSPRDAIGGQPLNPPELHESTQESLKNPTKPGADKEDDEEGGITYRPTVDAMARGGEAERIMRKQNEMYDLQMPAHRTYVGGFAAAAYETAREYHYIQKAEKAAEDNMVNKARIRDKRPPPSIX
>ERR1039458_81816
FAQVLVGGGNDAQVELDIFEAAETAEALIFEHAQELGLEHERDLADFVQEKGAFVGQFEDAALLLAGIREGAFFVAEQFAFEQGFRDGGAVDGDERFGLADALVVEGFGDEVLAGAVFAFEQDGGGFAGGHAAHEVERFAHCGRDGFDFEFLRGGLFGDVLGGGHRAFQAAFVIEHLGGAHDDQALHAVIGVQADGRMRRGGRLIETDEDAATGFADTAAKDVLAVAADHVLGGHTEEVFSSAVNSGYGEIRRIQDQRPDAADHHHDGEGRSEAGLGDDGHAGPSPEHCRLHLDRQFGHRRSRVHGPKEWAAAAPGGREPVGGGPPGGLTLGSFEAHPSLVNVRVTNRQLPSTFTRVSAYLPEWVT
>ERR1719162_2616429
GRELEQARQRCCDPHCGEGGHCPCAKDSPNPSAQPSAGDTDGSARADPGSCQERSTRSANSGASADSGACSSANLRQARWSMQFEVIDLTGAYCGPARGFEVVCVLPFCPKTKCKA
>SRR6266571_5669770
PTSSTAPRPTSATPTSRAPASTPSTTSTGRGSGSSSTRPPRFPDYDWGARSRNGPPIRLERSEWLDDAGYPPLHRPAAAADHGDRAHRLLDRLHRHPPAARERLPQRAQPQPLGGAGPGPPLRPRPALARPVPELADGRAARGPRRVAGQPRRQDHATVAARS
>ERR1700722_2864867
VLERVARALEPLDAPLEQRDRRARIADRAVGASEALRELGLLDGVEPAGLDRLAEQRDRLRVVAFPEREAAEACERLGACGPGLLVRRERPFVEAPCGLGIVEAQRDVGVDERGVVLRAEEPGGEEVGADREPRSQLTQQLDRRDALAELEPGDVGGRACLAGELALAQPGALAGLPQALSDRGRVVDMLCLLFRHALY
>SRR5437879_7003822
SKREWPGGSVERLISAGEDLSHEMAPAAQKDVCHLLLGLDNRAQDSRQCWVQRDDLLELVEHDDHATLALHRELLRDREQLLDCQVLILWQRQRTELDSWSAVLANGELGLEWKGPKQVKGLRPCTGHRTAQPTVERGAELVDKALLAGRAEQVCVGDEHLPVLELLACVQRDRCLAVAPRX
>SRR5918993_323855
APASSRPCGYWDANAACSAPGRRQEDAAPSCLERLTKAHGSTVLTKRRLSGKLFQLQAARPHRLEAKDIALSRRKPGFESRWGHSRKPASPGESLLTRGDRIGLVWWSGGAAKTISVQRSTSDVAKSDPQRWSIPTKKPIAQNSHPIRCSGRREAIRGPTVEKATVIAVACAQYWX
>ETNmetMinimDraft_11_1059920.scaffolds.fasta_scaffold246889_1
MSIKTINGTKPNINPDYIAPATDNFWDKLNAAAAFTVGGSVINNIAPNDYQIQNVDYVLSNLPDREQDENFFDDRWNRKKRGLIADIIPSINEYRKQNDLEELNYKAYRYLTDSDTVSEFEKRYNELDKLAFANRTMARNPASVLGLTVGLSMVEPWNLFAGPYALVGQATAGKAALRAGAATAAIAATEEAILYRNDPHRTPGMSLLNIGAAGVIGSTIGGIVGARKSNQKALIKDISARMKSIDDEQHVVLDVDNFYTGSSPDTINLNLASFEDILEATKSIPGVGKKTAQLIVKLRNSKPNKVFDSYADLLDDPDLTKAQKKQLEIALGHCTSPCRFHVNGMPYGGDEATIIGSYGLDKVAAITSPLARLLQSEFPEIRREAVSLLNTPFMLSDNLQGVATKKSLEEIIDGNRIHYTRLIDSLENNYFNYLNIKTAPNGSVRKHIAKTRAGRILRTPSNVVRNGLRGNFSKMGTPAGKMSFEEFKLAAVKHRTGAVVSLDKNVIAASKSIDNLFDSNADAVKKLMKSIYRGKEFTWIDSEPYTHRLWNKAVISSNKEGFISFLHEQLIKKYGSKEAVEEAIGDGMQHIDASIRRSVDKIVMSPEERIDLSNIFEPLKRGATHNRFWNFVDDSDLYNTDWAVHDIEAIANSYIMGPLADVSFYNTYKTLNPETVTLRIRKAAIDNARMRYRQEGIQLDDDVVLFEKHMESLDNSLSLLESMLKRVRGSYVDVWSPVPGGTIQGVLDNIKRYNNIRLGGAFGLRSAADVGRTVMFLGLKKAYGPLFESYIKRNRKAMMMYDQASAELAAINVGNEINSMSLVSAITNTNFNTPYSDKFTQLMSKANSSMFVFNGLVLWNQSMKRNAGIGVMNEIITSAKAATLGKLDSKKASNLAKLGLEREDLYEIAKEFKAHGASYRGVHLMNFENWNADSTIADKLARAVKKEVDTIIVTPGIGDTPLLMENSFVSMMMQYRSFPMAAMLRQTIPLAQNMNRNALSGLLISVVTGMAARQYINFANDKDGPDDLDELLYQGLEDTGTLSTIGEFANYGQMIYNRNPFFLGPTVTGAGDMYKVGSSLISGEEMNQYEINAASRLVPYDGLKKLVTAIVPEIGEX
>ERR1711988_1839548
KSAEKQKIAARVKRRVDEKVAEAKESFQKKADKEIAKDRADEAEEVSELKEKAKAGNVGKKVKDVNDHLEAKASDKDKIDAALKSKTAANVTQVYVKANSTLHQQEEQQKTDVSQIDSQIKDLEAKKGKSQDPVEQHKIDSQIKELHAKGGNMPADYFHKTGPASK
>SRR6266542_965261
NNRIFLPYKPKNGLFHSDFSVHSITSTKEISIALAKKAQDDIVSYKNMEEDLKWIVHTKCKTHGSSCGGSLSQKITSGIFTINEKKVEKFAENYFSYLDEEPREILKSSLISLFDTEGYSWTHKYIDISCEESDVNKSITGDFFFMYAEEGSGEKHKVFIGLAQLTKRPATNYYFLKDYYKGNEDRVEQALKHMLYKDVKSKGLITNX
>SRR4051812_43011536
LNEFKSARDSVYHQMVTPERPLPERAAAMGASLDEYFSYRGLALSCGFSLAGLEKLDRMESWRTGARLTGGHQPQILRDIFGNPFRPVSFDTAWRTPSVLAVAQVIYEERRFGELPILADALEEAGAVDEQLLAHFRQQGQVHVRGCWALDLVLERRX
>ERR1719272_2699062
RRHAGGCWVVWIYAARMLHEVVKERVHLLLDGGRLVNGHVALGIFGERDAPRPRHTIFFAEVPKNGALYRHSPPRLNHARRGAGERLEHIHEVIAAERVRLDGGERHRLRVVDQVHVLHNHVLAPNLAGAKEAPHLDHEAAAQDVQLAHGQPLLGNEAAHHELLCELCDEVRAALDLLDVPEEPDVVKPLLVGHHRDGALEX
>SRR4051812_6490251
EGGIDLSDTGWGTPNQLAGAAPNTLSGGGGDASTDAAPGDPLGVPPPTEADSNAEPQPPTAPARAAKKRLNWRSGFVQLAVIGAIAGGALVFRDRLTGNATDLRVGDCFDEPAGVVTEVKDVQHHPCIEPHDGEVFFVGKHPDSGSFPGRPALEAWAGEQCVPAFATYVGQAYDVNRELDFAGFVPVQDGWNSGDHEVVCYIVRVDHAKLTKSVKAAGX
>SRR5690242_7610662
LNHWNYPDTEFTAQYTQQTRHRIGPYTEQPFHYCFLLGPTNSCGVLLDEPRQNKKIADFVFLATATDALDKLHGELVDQEIPLTGLDGVGCPTHYLSFGLNTIEFPLLAVQHVLSMHMARRILESWTAEQDYQRLGLPREAEEMFRVAEVGAR
>SRR5207248_4090244
FSCLCILYLFHNPPPPDIYTLSLHDALPISFRTIYRPSENISHTVGVIADIVTLCDASDDFVSDAMVSEFTPIRNSRHSVGQRRDVAVGNEKSADVLLNCLRESTNRCCNDRHTSDDGLESDESKRLCPERWRNECPGX
>SRR5260370_35461453
GGAGWEERRGQLGGGGAEVGGPVTRVREQQRRRGPTPYLDAGLAAFRQDSTAHARAGQRTMAQPLLNPLSERERDVLQLLARGDSNPEIAEVLVLSVDTVKRHVYNIFSKLGVKNRVQAVTRARALGLLSEETCFLFGLVVSTASFLTNGSVMRNNGTLAAAWARAQALPIEGSFTITFFYAIASTKYCDWIKMALX
>SRR5438128_2108134
RRYPVPAAQRAIPAIRRPLSAIRRSQYATLSFQSCGAGPQVRKEFHRTFATVPFVQPTVFRTRIEQVWGAWEKLADNDLRQRVAALREERRRLKDKQTDLETRGQTLNAADQRRLDESNFELDVSDFEAELRDYERQPWLNVQDPVLRNRQQLAHYYRVVGQFV
>SRR5450755_1345668
GTRCLGGRLEQHDSFGHLTAQITLAACQLALEFVAPAGEGVGPRLDRVLPAPGPVELDLGLPAHPVEVGVDWPQLGLAPLPLPGSAVADNRADDLVPVPEHVGGNRDGVPDAPLGRKSPTVDGRGGVLDHDPLRRPARAAVLRGSPSGELRADGACGHHCESIQNRRSGKHPGVKTFPRSSGIQLHITSLPGARLGPEAYRFLDWLASAGQSWWQVLPLGPPDRHRSPYKSSSAFAAWRGLLAQPRARVSASEIAEFRERQRFWIGDWERFSGAGAVADQVRFEREWTALRRYGAERGVRLMGDVAIYVSPGSADHVAHPELFQRGFVAGAPPDAYAVEGQLWGNPLYYWPALRRSRYRWWVERLRRTLECFDLARIDHFRGFTAYWAIPDGAANAIGGSWRRGPGRAPFDAAVRELGRSLPLVAEDLGVITPAVHRLRDSLHLPGMAVLQFGLDPEERRSPHRLENQVERQVVYMGTHDQDTARGWYESLAPARRAAVDSQLQRHGVAERQPWWALTRLALSSPARLAIAQAQDVLGLGSAARMNDPSRAGGNWRWQMEPGALTPALARRLRELTGAADRRDGRSPGQAWSERTSTELPAPVGIGRVVAQTSPPRRLELDQRRWSRRRGQAVALERRQRSLRDRDLAQRRRMHAISHHQVARAQLAQIHDQPTELVRDALDRITQLVHLGPGAGTAELQRRREGQQPVAALAQKSRGGAEARLESGYVPLGRPNVVDSDVQASKLVTCARVGGAPLERGDLGPHDIAYVCAVDRVSGKRQSERARHPQCPRLKRHAPLQLAPAVGDRIAEREQAEAASVVGIFVGGHGRRAX
>SRR4030095_10399445
SALSAPVTTQHRGSNSAARVSCLVTRHHDVCGRRSCVHNPRAALISVIRHSQSLRSRARHRNGGVRTSLSLTRSGQVVEDGSELRFGPLAGFLCGFKGGTTFHRIGNRFDLQALSDAFEVGNAGAFHGKRLPARRHWTVVTHKPVRALFQGVVCKITLPFDDRCAFLHLRRWSSEQGFFNLGRILRLSEGTERKCHHNNQGHESHGMTSTRSSIRFNPPIPRLISCFEISAVVNSPEMRNVLLILLLLLLASIAALPQTAGDPTTEERLRPPRAGDWLSYRRTDDVFGFSPLTQINRANVKNLRAVWSYPVQDDSRWVPTPIVANGIMYVAEGKGRVLAFDVPTGEIKWIHTRSYPEDIRASQAYLRARGVAVYDDKLYWGTAESYLVALDARTGKQVWQVKTADYKKGVGHAHPPMIVDGKVI
>SRR5256885_12855722
RSSSSNSLILYIYSTASLFFFFFLMIRRPPRSTLFPYTTLFRSLGLRRGGDQDRGDLAGGRALVGYERRGIAAHRDDPQEHRWRSEEHTSELQSPCNLVCRLLLEKKKKNNTMLDGHTSRTTVCCH
>SRR5262245_11139375
ECIRLLNYPAVECSRQAVSTGKHIERTQRFQLASKVRELSICFLDRYANCPAKASVEFVEARLPVTHLVERRTECAPFDNCFKPLLGHFDSPRHPLAHSTLAIAKERQQLGTIGGQISHRMAWRQGPVVGDHVGDRKVGLVADSADYRNARGKNGVGDDLLVERPEVFEAPAAAANDHGVEPKSRSQLQPIQAMNGVGNFRSRAFALHSYWDDQDAGDGPASAQX
>ERR1711871_676384
VHGGFSEIAKVPHHPEHTATTSAVPLVTETQLPLPQTIFVVDPVVVRRAEEDKSTEEEKDVFLSDADQKEAADAIRKWMKMLRKNRRAGRHKRLRELERMRRMRLQRLKAARLQMKRKMQADFGGYDPGLEKRSSQEKDEAMTP
>SRR6266852_8977469
KRSQVKFKDHKEKLHIIFFFSSRRRHTRCYRDWSSDVCSSDLGAWLRRRRRHHRRAGVAKRLLQKDQGVRVRSEERRVGKECRSRWSPHQSKKKEAVSGTLRVQSVHESCYRYGSASRCLL
>SRR5262249_17805584
TGPGTPRATGAALPGAGPPHPDAARGPGRGGPGLERLPAPCACVPGAADNAGHGGGAHGPWLDEARPAVVAGAAISFGTTEAAWASFTGAAASDCTVVRTVTTVHCGATHCFFNTAFPDLTSQRPRCDIYGPAHDVKGVSRRGTRVRTDAVIYPTSQ
>SRR5262249_30216735
LRNGSTRNIALLTLLIAEAGAFAASGATGCSSGETTSSAEPDASPSVPPPPPLENGQTAAPHTPTAHSPRTPTHDPATDAGVTPGKANVVFVLADDFSMNLLDYMPHVQDMMKNGLTFSHYYVTDSLCCPSRTSIFTGKFPHESHVYTNGGDAGGFATF
>SRR6266540_3007965
ASDGIHRNIRRMRGAGANTSLKTHCMRHPGSRPPAYLLLYSLKYRLFKRTGFRELFTNTKQMLIGADEDSSVGNRGRGQATFIQQVFLQQSELSPGFQHKGFPGFVQKEDFPITPNGGCGKNTSNPFLPDHFARIGIRANYNAVFSSHVNELSVTKKRRDIRSTGGDAPCYVGLGDVSLPSRSNRHVGTTAISSACVEHSVDINRHGNRHWAE
>ERR1712159_79709
PVTKRPTANYSQTCFTPQMSSATWEINYEPIQGANCMWMIMCTCLTGFVIGHWVMTYVKGGLNDFRNQLLCGFPISFVNTALLDDPESVPKWPVVTWKKALEKFYLFVVVIIVIFGEAALPTHQVFPEWLYVDIWCTGGAQIFWVILPRSAFLGFMEHMHHACEITLPYTHGAVWFTVFLTVLGAGIASTINTSFSGEYNRDLEYW
>SRR5215468_965392
NDPLILAALRQHYQRYARFLTGLIQGAQRAGQVRKDVMAAGMAWQLIHSAIGFAFIKPLQIPGHATPAAVEQAIGLLLEQLSSLKPALPTNGRVAVRRARPPRRTIHHKPARRSKX
>GraSoiStandDraft_49_1057285.scaffolds.fasta_scaffold1147020_1
MTKKWKLSLLRILLLASPVYAASVAGGATLDIDTGDPLSCPPSNSFWWSNERGSAFYSYCTDPRDEGACDGKGQNGETTGNASTGCCGASAEKGKEECDTCRDPEAGGGSGTNGEDPADSSTEAGRKIDKDQSCQDCPEAGMPLWSVEEPLLSVRLVDVPMWYKPAFGPKMALKLHYKSLEGSFGHADTRQANVFGFGPGWSTPWRSYIRAKAGSSPAEVWVFDGVGNVRSYFVGSPGGNAPYYHKKTGAFVETDTVGYVLTHNNGAKDFYAEEVENNSNGAGNGEKIYFLSRREDAVGRGLTFNYSTTTSGGFDQMRLANIVDAAGLSTTFTYTNVGPMNSLIHKVTNPHGFAAMMLYDANGRLETIVDTISLTSKFVYDGTDRITSVKTPYGTNRFEYVSLSDTNCLAVRVIEKEVRKHLFVFGDLPVDPWPNVADVITSLNNYMDMATNVLATTDFFYKLLDDLKGRNPAAFTNHPSARCSAYWGPLQYQNLTNTIDSSLNNSTFAINSVTTNSYNLAHVTRWRAAWGGFISNIKSFERLPGAAINGSEVGPFVFYAYDMGATHEAGTKEGFDNLPAQIFRETMLTDPTDSNLRVWDATQIEYYGLGTVRPGYVKKKMVLERNDFPEPALGIPQFCFRIHRPIRPLTGCSGSGCNRYASGVIQDENEFTCMGVSSYSTNWLASLSGTDGRYIEIIAFPWDPSTGAGIGGPGGAPIHYEYHGTNKELTKVTYEGIVEKIRAFNAAGQLQSEMFQQTTGGVTVTLWTNSWTYLNGFVRTNINPRGLAISYDTDPMGRVTKIGFPDSTYVSNRYDRLDLVETIDRNGFSTRYVYDAFRKLLYTTNAMTNVVSSSYCNCGSLSSVTDGNGQVTSYTYDNRGRKTQVTFPGGSWVATKFDAWSHPTNLTTSGGIEQGILYNLKGQVREKWLKSG
>ERR1044072_1391978
RNWCCSALAVPKHSQHPKEAAELAAWLTAPEQQIKAFQKTGNFPSQVEALSSPELLGTTNDYFGDVKTGELFAAQAQKVGQAQYKGPGDGQIQENATSPALQAVEQGKSPEDGWQQAVEARWCGARAPPRAAEAGERTPAGPGAGAGGAGRRAARRAPPPPRKPRL
>SRR4051794_8328619
XMSHPPIPPILASVIACIAAAVPARGRATFLDLLLGAAATKSGHVTDAILASGLSRGWSTYYWFLEQGRWSWLRVWAALLEVLTMLFRPAVWYAVIDDSVVERVSTEAPGALTHHNHNAKPNRPKFLRGQGWLCLAAVIERNDFAVGAVPLLLRLVRRGTNRGKLRSAGLLLHLLGQRLGHVRLLLDAWFMRAWLIHRALAAGHIVIGCVRRDLALFDVPKPPRKRRQGRPLKYGPRLTPGCGIAGAPQRPDPLRQAGSRALSHLPGCCAVPARAGGAGGVGGTGASRPARQTVPAAIADLHRPGAVRTAGDQRICQEMGGGVAVQEPQARLWPEGCLAAVASGADALGHRTGGRICDPADAGLHRPGAPGRPGPARPLACARHPHRRANPGRHRPHFTRGRAGGLHRGDLGKNRRRGIKHKRIVSAARRQSRVSHPTPPSSFRSCGANPAPRRRNVAWKLQICKTTSGSENRRDRPQGRNAPRIRPELQFNEPADLGQAETPEFPRFRPSCCRAAITGWRADTAADDTRRRDVDRGRPDLDDALYAGIDPARPSLRDDRGRDPHDDHRLFVRVRAGAAPLRPAVGPLRPAPGRARLPRALCR
>SRR6184192_2552679
LQAAVPEYWYRRRQSDLRSRDLLWEWTAIETTPDCTSQNYWAVDFAFRVTGNTRPTAILSIPCRKHLGDFYQTTLTKEDYVAGGRASVARVKRYRHRVVAIRGEWAHIETRSRIAKSQLENKANESIPLGFGYCPTRAVX
>SRR5512141_912622
XMIGSRPGCGATPILMVGQPPRAVAAGSQRPNVYRRIELINHYGRGFHEADNEQRDYKQGLMGSSPEPVVAAWIYKLRGCGRSLPRNSRFYFTEKGWREIGRMVVSACRKSGQEYRVIAIKETDAQVVWRDKHTGYEVAVQPARRRAX
>APWor3302396189_1045246.scaffolds.fasta_scaffold344749_1
ADPTTISLPTLTWDINVNMPANETLTIRFRGITTAAPGGSSVNDSTATGTLGTLTYSASDKATVDISGLQITKTSNATGPLNPGDDIHYTIDVTNIGSIGQNNIIIRDPQPAGTHYLDDTTLVTGYTLVSGDYLDEFGAASYSNDDGSETWSTPWTEGGLESGNDPNNGRIVIIGGRLRFHDTTATGADYWLQRNVDLTGVTTATLTLSYEEAGTLEASDRVRVQVSGDNGASWTNALDINNDFGGPTNLSWDVPIPSVGNTNTVIRILVNNYQEAGVEYLYIDDVRIALTKPGAAIKDNAAGGNPDLLNGDPEQLVLAGDGFMLAPGATMRVEYDVSVNNPLLTPGLTDITNVAYASSVEEPVEISATREDPLNFIDVSLDKQINDDTPLVNDTVTFTLRVSNAMGSQTATNLTVTDIVPVGYTYVVGSILGGDTNNGDDPTGTGLTWTINSLSAGNFVDLTYQATVNLTGPYENYAEITAYAQYDLDSIPGNGQQTPDEDDDDTVTVVPEATPDLTLDKVYVDYTDNDTSGDITAGDDLNYTVTMTNTGNTTLTNVVVSDPELIPTSQTCASVAPLGTCVLTGSYTVIQSDVDAGEFENTATVTDDNICTTTPGPECEDTETVPIPQA
>SRR5262249_48298838
MDVKSERSSARDRQQSEPCESGTEVTRSRTGRPEASSDRAASSSHRRSERGIDPAKPRTDDRDVARDRSVRRIPDQRTGPAIASRVPAMLTPEEVALLLRTSKKAVYAMVERGQLPGIVRLGRRVLVREEALVDWLRQKSLTPSSERX
>ERR1700737_2044360
HRGPGVSQKCGHFAGKHVIPAGEMVQKINAAVDARHDGDLQIVARTDARAIEGLEAAIARAHAYVEAGADVTFVEAPLNFAEMQRIAREIAVPQIANMVFGGLTPPLRQTELATLGFGGVLYANAALQAALKAVSDVMQALRRDGSLDAVAEQLAGFEERQRMVGKAHYDELELRYQSAGPRRSRSAPRLSPFGRSCPLGSQPRAGAVSRQAWVCKRAVT
>SRR5580704_900937
PRDRHLFGAYVRKNITSTGTAVNQGARLDKQFPLVSMTRPPSDPLERDKIGKQVWTGIGLLFVMSLSDRDRSLWANPPTRPEESPEHLRLLHAFDDFLLCQFAEWGWRLLMSAEVLHRISEWEKHDPVLLERLGKELGLRSKVLRGEKCAPLGKNIHKFADPTIKELKILLRRQQLDFGSKRKAVSCEKIALRIRSEVAAHPTKFPLLSANLEQLCGFIHNLPKNHQRAAQKFERGDLRENSFFYLWYASCSNRSVKDVRNQISRSRGAHRSSX
>SRR5947207_3184146
NDKKEPRSGGAEVKAFRLTLSCSSAPLPLCPLLLSLVTCHFRIGASSHREWSSVIGAICFPNLNRPGEDLMSHLPFRSLAATHCLRKLWRCARTAATLATVCALLLAAAPRTAAQTFRGTILGTVTDPQGAVVAGATVTAKNLDTGVERSTVTDDAGNYSLPELPIGRYEVKVQATGFQVYLITNVRVEVAGERRVDPELSLGGSDTVTITANAVQVETTANTLGGTISGSAVVDLPINGRQFTKFQ
>SRR3954471_2680322
LAHHRRGVVQPDVHPTGPGHHRVEVVEGTAARANFEVVGVEDAASRTARPGDAQGGGLARLRQGRVHRVGAALGDRLDVRWREHAELLEVPAVVVVDPGGAHDVEGVAVLDRLAAVADGHGGAAGGTGQAVGVVEAEVVPHLVRRDLHGEGAVDPGVRAGHVAHPTPVAV
>SRR5580698_10972885
SGRPSPSTRTTWSITPTGTRATSSGPAGSCRAARTRWSRNTEVTAQQSLGRSAPARCRCRCRCRPATTGAGGQRRGSPSRRAGRAAPARPPCTRRTLLAACSPQYPGRAGLGEADCLVVGHAAAALVGVVEGILAELFPGGRADTGRVEAAVVDRAADRVG
>ERR1700674_1031357
VWRGWWVSVAGAPRRRVAGGRLDDERQGGSACREVDAEPLHGAGAQVVGGEVRDAVLLGPCRAPLGQVVLRRGLGGIACHLDGRTLPPVLGQPRAALERQARVGEGVALDRRGPDDGVAGPGAELALETPHGLPERRLDLPDLLAEDVGQRREVAPPRPGQRGVDPFPAVPHALPLLVVLAGKQQGEAGGTFGGGPEAGARHLPTPPPAAR
>ERR1712151_647775
PLPSRCRGSLQQIARERAGLTSLHLRVFFARSRERLRSLALSFLARVGLPPRAFTFAVSAPWLLLRRLFWTSFSLSRLSSLSFTLRFRFTFSFDRSSLVRSSSRFFLSLSFSFARSFPFSFSFSLR
>SRR5258706_534337
WGSRAPAHRHGKRARLVPTRTFGSVRAEVAVTPARGSQHSPFSLEGVSMSMDASETLERSVLESKDREQLLAIASALGAKAGSRTKKADIIDKILEQTGSGAPASNGKTPEARASDGPRTSDGPRTSGGPRTSDGPPGDAAPAAGGARAGGGTPGGAPPGGGGENVRASPAGAPGGPGSRRPRRPRPRGDDAFVGGKKPRQYGLRRGDHVTGACRPAGRN
>SRR5215471_3001876
XMVPENASPTRVRSNVVPGGAFMLNIGPAATSTQLAGTSAALAIPKLNTAASRLPVTRRIASSSENSRAKKLVLWAASGNGRRRVAIFRRGRDAADQQDAGNDSRGDDREGGRGREGQPLVGGVSVGQDREGIEIERPQHQRRRKLLHHIDEDKKRRGKHARTDQRQIDSHQRIPGTARQQFRSAANRRRHPLET
>SRR6266702_5134999
XMSCCSNPFTLFPLNTMVIRKTIGEVSSLLFQFTCKCDILNTDDAYYQPHPAETALARVFLHAILIDTGNSASSEAPPYPYNRGLIETIMHEKSLITLEYPKILEKVAKEAAFSASKELILNLEPTPNLEEARRRLAYTTEAYQLIEQYADTGIRGARDIRPILTRAAREGILSPGELLEVLATAQSAMYVAKLLERPDPENFPLLHKWVTDIPRRPQIIRRIEETISAEGEVLETASPTLHRLRANIRAANQRLQERLRRLVNEFGPSLQEPIVTIRNDRYVIPVRRSEERRVGKECRSR
>SRR6266480_5337023
YGFEELGALVVRRHGIGGLPQDAILVRVGKSRVREQRVEVLPLRVIGVHQVRLVQHGVRSALLEQQRHTGLGKPCGAPFDGEQRVREPAIPIDVEGRVAIETPAIVQCAVDVSDANLAAVIAGALFYFHKVVDAFEAAEVGPGREVTTRVDSELTVTITQANGGGSRLCITVDV
>SRR5580658_3392266
DRVALPSRRTVQAPHWARPQPNFGPLKPTTSRRTYSSGVSGAAVTSCLRPLRCRVVLVLTGRMIRPECAEGNRVKRTLLLATLGALALGAAALAAPAITTLPTGWKILGSDGPVATVGTLPEGLALARDGSRVFELEGGHRKPTLRVLDAATLHELRTVALNGAYGVPLRDPDGDGVWVNVAGTFQEQLAHVDTESGTVDRDVSLPLPFFPVALARSPDGNLLAVAGDLGGRLAFVDPRAERVVAIERVGLHPAAVAFSADGTAVFVAERGERYVDVVPVPGSGPATPADPDAPRPFSVAMRIPVGLHPDALVL
>SRR5437879_9218440
PRGSKAYSLKNVMRATSSPGAQTPKSPQASFGPSLSPGLNPSPPTFTDRISGHGRGRTATPAFWRIPRMGPAHPPVGGPARSVSPGIFWLRQGDFGSGLLLVVTRICDPVRAMARGSFEPPVRIPPAVDPRSLGRHGLARLRAERALVVRYADEYRRLEPRLGHIGAISTLVRRHTKEYGRMVTASAAGAPEQPGFVRRRLSA
>SRR5438105_2884871
AATRRTTTCGPRPWAGSSRPRGEMPSRNTRSPRRKDHSMSDKQQYAVPQHYHALDTSELAALRTALAKAERTAAGTGPWVDRTRAEQDVKIIQRQLHSAETAARSELELQRLNAPRPSETPAGNQAAGQQYVVPEPYFAEQQDYDQPSSS
>SRR4029453_17137562
PPPRRPVLARRRPGVRPRVGCRGRQRLARRPPGHLGLRQWLVRGALGRRAGDDRRDLAAPAPGLGGGGAVDRGPRRLPGRPRPRSPPATGPAARPAARGHADAAVRPRAPPGLGSARGADHRRNGHRVVGVRPPGRRPGRHRGHGAEPRVALGRAGHPAGGRRDRRLCRRLHLRQADPQRPAGGLRLAPELRVGPLVDDDRGSVARRRRRRRPGPAAGAEGGPVRRAAVILGVLVVMLVLAEVGARALAPYLPEPSLWTDDTTEGKVEQLDALAPGPGCVDVVFAGNSMTRDGLVPDTFTEADPEGRTTYNAALDAATPALLERWVLQEVDDRVDPDGVVLGLSSFDLNDEAKIGQSALDAYDDAPLX
>ERR1700733_14753379
NGLLELTPYNTPSISMSNIIEEKDNRIHTEEESQADYTPELRPTIRTDNQTIDLEISKHSTVLRPLHNLSHRLIHNRLKGPTGVELPAIIVEDSDIWKRTVGGNWDCVX
>SRR3972149_5498235
EPRGREHVGQHDVVFVEDGGRVIVEILDAADLRRQVEADVHPLQRPLGLAPLAQVSLEELHRRVRLQIGVALGEVVNDPDLMSPLQQPAHHGAADEPGASGYQYHAPPPLPKTRSSTLAARARSSSQTPQQSTRIGRGPEVFSRSRNDRSRKARWLVASTTTSASRTAVFRSGVSWKGSLTATRAPSAFSSSARRTAGDCRVSSISALNPIPSTATLAPTRLWERSSRRRS
>ERR1700722_8398492
HAPIGRGSHNRSALNGSRAVSGGAVVMERACPRVSPDECGSGNLCDRLHDLRADARSKSHLAHFVVSPIERHPQQRITPFVGVRRIQVHEVLPVGKMLRSHIHTWTDSVPMLNCSFFPGRAPVARSFPHGHSSEGSNWTFAGSGATQKSSSAYYFFRNLMVEISLKIGDAIAHRARSHKEIQPFLEDQHTGPSAGDLVGQVLAQRSLGRDWIVGFADTREK
>ERR1719253_1353614
RSLLRKSALSHKLHNHMLGTRIFQDQSLHWDHAPLGLSLVSFLPCGWCRALAESVLETARHSLQVLHAARAWSTTTLWLGSPLVGSDLSCRVAATCASLLLVVEGPLAATEAKPVSLGVPLSHAWSTVTHGCRCAENCQMLPANEMEP
>SRR5206468_5774351
GCSGYDGEILTEPFPAAVVLTDVPNTPRMHLSRVIVTFAVGFVPVASPSQYRKTQPLAEVAVIVTTELLRYGPDGGAIVKVPPPAASRESEYVGTKRAVTCSFRSIVTLTVRFVPVASPAHPSNTQPAAGLALSVTTVLLE
>SRR5690625_4794838
XMESVHAPIRSCTHQANGTSAQVGHIGSRTDQYTAVSHLLGHYLRGPLTIISATYSRRSVRYFRRSVTRSPPSVDCLPAFGGAAEAQHARSVAGRPHIDLFADTPLEFADMADDADESPSGAQRAELVHNRIQALGIQGAKSLIDEERAQAYSAARAGDHIGQSQCQAQRGVKSFAAGQCARLTLTPGDVIEYPKSQTGAPAAAGLDFFAADQAQPAGRHFREPRVSRLDNVFEASQQHIX
>ERR1719284_851324
RTVAYPVLSERCTASIHSWDSKKGLTSKDLLENSLLSTTQVRLMGKSPNKVKQQEKAAHAKNKVISVLSNKLRGACKMGGKLETNPKKNYNLAKVIAEVEKAGMN
>SRR5579875_2658053
WDAVLRKPRPHPGRASADDPRTRPQRQADRSRSRRARPLEDPHPARLQECQVGESNRGGEHVLAPLFRKGRILGRQRLQLVRRDLIRRLLFPAFFIGAVIGIASAAEPAHFSYIPPPPGKMVESRLVALSGAGTQGRWRAVLSRKVVGREGDQRFYQWYLTIYAPNAAGDYVQKYRAPGNGTSSLLTVVEKARGANLWFPVQTVKIVGSAELMQPGVQQLVVAVHESGADCGAATVTILRYDQASGKIAPAVSVRNGCRLDAGIVRTSSGDALRLKARITALRPLCAVRPSPRPARSSGTVPAGGSRARRIMKCRSGRTRSAGNAGYIRNTPKLVREGGAHEATSRPMPRTX
>SRR5215469_13482869
LGGHRVLAGPGAWRADGSIGVWDSSGCGCAYSAILHLRLSYVDSKFGTDVYGPRLDEFDALGARLLGWRDNGDAVVDRDQPGGHFAPAAATYPLDGQAELVALSPGGGAQRLVSLPGGTNRVEVAARLLDRFGGASPSIGYRLADWLRTHLDDLVGLVALTAVVVAIVLLRRRFRRRPVTX
>SRR3954453_2381136
RRHDHHEPDRPDPDHPAAPRGLRRRDLRGRPGRRAGGHRQLPGGLHGLPAVPAVLHHPVVGDQPGRLLLGAQGALRGGRPVRPERQLRPVQQGRLRRLRRRHPHPDPLHEQHPVRRPDRQLAGWRGAGLAARPDRGRRPLLPLLRRGAPQRPGGCLGARRTRRPRHGPGAAPDRQGAGVKYDPAVEKSPLPYSPFKSCTVPRPIGWLSSVSPDGVENLAPYSQWQTLTFDPPMVMFSANQYPDGRRKDTVLNAEQTGWFVWNMATWDLREAVNISAMALPFAESEFDRAGISKRYADLSATPMVRESPVHFECRYLSTHRLAGHSAVGTIDVVYAAVERI
>SRR5436853_886914
GSSPRISLWEHGSDPEEMEELPLQSPHLGPSPRISLWKRGSGLREMKALRLSQAAGASVVDVDAFLRCVYALQEETDPPRPVGSHGRELQWPLGLVQGHRPRPNDWGRKGRADPPWLHTCGLX
>SRR2546423_1658942
AAWDADVVVKVAPTSEEEVGRLTGDSVLIGFLSHLTNAAGVRALAAGGATAFALEAVPRISRAQSMDALSSQSNVAGYRAALMGATLLGRYYPLLVTPAGTIRPAQALVLGAGVPGRRGGRQLRALRAGRDRGQARRDDRGAAEPGQRHGRGRLPDVRAQHPVAARAHDRRGRRAEARLRRRDHRRRLRHARRRDRARGRQAGRGSGRLMLVTNLAILVLAGFVGFVVISKVPNTLHTPLMSGTNAIHGIVILGGLLVLGLSGSGTLNKVLLVIAITFGTINVVGGFLVTDRMLEMFKGRKPARQEEIEEAQDEEEKKAAX
>SRR6185295_6827403
XSGTYVVQDYDLAMKFIVSARGLTSGWTAHTTFTDGNATAQGTVVSAAAGNPPISGATVQCIAGCNNISITTTNGTGSYSLTFQFGGNGPTSITLQASAPGFTSQSITLTNVTKGQTRTNVNFVLTPTFRNTSTTVSCTPNPTVVGGGVSCTSTVS
>ERR1719499_497600
MWSSLPTELTDTVDGLASDLTAFGFNDLESLTDYDSMLETTWQNVQDNSGIDVSDIEGQMNSLIGDFEDYLTGGTDMTLDTIIADIDDAMTAVSAELEENVDNEQLVELYQNLEIVDWGVTTWNQFASETELLTDFTGNLDIVLQSIQFTSEFGDVLTYDWLDNFMTSLNDILRVDGNQYSVCDEEYIKDQVWNLYDAEYDWYTARSEYMTNCYTTNFADTWTNSLASLMSGDLSGAFTPDCSCWEDLWNDQDLVSTMNCVMDAGDSITVEGQIAECNGVIMDTVDEVSLITGALETFEELANDLTSLETD
>SRR5574343_384457
YLKTSKSSIYYYIKSILFYFILFYLHIKNLFIILYLYLEINLIGDNMESLTIKDLKHGKAFASDMLRENFNNYNDTDIIINFAYTDYGGTFFDNVCIEYFVQNYPNNIVQENTSWNGKNAILFGNNLVQNFIEQFENYPLGFEVLEDFYYEKESELLESDFIEFIKNNFSTDEYSYNEIDLLNFIIDNCSYNLTSNSVDYNENGLIEYIIQHYKRLNKIX
>SRR6185503_2167616
RVESATGCGTAWLMASRLDSYERDEVAEPAIGEQPAEARIRREPVAQRRGKRIGVYRPQRIGGQSPDLPSEGAELPAERCDTHAIDAVMTPVVIALPLLAEHLMAEASRIRRVDEQHGARPGDGAQRVDHLEGLVKMFEHGPHDDGAK
>SRR6266567_1659920
LYRCGASACSEHTFHPAIYKNYAHSIERELTILCYERVDRKLQSDLSTVHPPLQCCSRLFTHCNEKSPTKLEIPSSSCTPAPGSSPIATPVLLPPHGKPLRLALCERRFNPMKKERPFSWIHTIRAALFQSPGEIYQWPLATIINQRLNDT
>SRR6187431_3469506
CFILYLLSDFELRAVCVRPLLFFFFFLMIRRPPRSTQQSTPFPYTTLFRSPPPSAPVARHARPLVFCAARARSSSARGDRKSTRLNSSHGLLSRMPSSAXX
>SRR5574338_764212
DTGEPPADIRRETSRDTTGVVWYASTSPVKVQTASKKEDSDLDDNHKITISGLSSGTKYYFIIVGKDNDGDTATSTERSFTTDQVNDTTAPTISNISITVGTTTANISWKTNESSTGF
>SRR5690606_34928301
VDLTRFYGADANTLQTVYPVEVSEQIGQTVIIQIVPITARMNTCQHNFLIACSDELPRLLQHAFRITASGQPSRPRNNTKCTKIVTSFLNFQKGTCPFGKIGHVKLLEFPRLHNVAHSIDRLTLALQISDVIEQFVPX
>ERR1719424_1028065
RFAALSSPTNTALPRRRRRRRVEAIMWRTRARAAVRMPGVLRSSRRPLSNEISATSYAAALATRKDATMGRELISTEDTSIKNFTLNFGPQHPAAHGVLRLVLELQGELVARADPHIGLLHRGTEKLIEYKNYQQALPYFDRLDYVSMMAQEHTYSMAVEKLVNCDVPRRAQVIRTLFLEITRILNHLLAVSCHALDVGATTPFFTGFEEREKLMEFYERVSGARMHAAYIRPGGVHVDMPVGMAEDIYTFCEQFPSRLDEMEELLTGSRIWKGRLVDIGTVTAQEALDWGFTGVMLRGSGVPWDLRRAQPYEIYPEVEFDVPVGTSGDCYDRYLIRVEEMRQSIRIMVQCLNLLEPGCIKADDRKLCPPSRAEMKDDMESLIHHFKLYSEVRPPASTAPRPHLGRTSAAPRLHLGCTSAAPRLHLGRTSAAPRPHLNCISPRLHLGCTSATPPRSGCGRRMARRSTGGRLVACSTRWCAACLPFGATRSRTSTRRSSTRSQSTPAX
>ERR1712137_1537553
PPARPAPVKRTFRPAAYSLADKPVEASFDTSEGIYQLQRTHRMPPYPIPLKEAFDTIHNHPTRCSLTPCPAPAFLSSRIHEARSEKRILLSEDTGMPTDDDGFLLVYNKKDSLFLDRYFHQPLQPYQVLELPPAPKEGAPFKALTVTQWPHQIRCKRFPSCHLVAHRVTASPPREALLIVFGFSTGELIVYEPWREANCPRVSEPLHLFRTAITCMIWVPLQEGRLLLVGLLDGTVALINLEHKQISTSTAPSAETMQEYLPQDRTGRFVMWKNPHSRTHNPVMKWKFSSHPIYDIKYAPDAVQVALACGDGYIRVLPLLESKSNDLHPLETDQPGAAGFHMEVGQVAVAFQSYFGSVCCLDWSFDGEYLLAGGEDDLVALWSMRKLAVVVRGKGHRSWVSSVAFDSWRCKDGTYRFGSVGQDGRLPLWEYSKETVHRPRSLSAMAIRRRNGRHHASDQGAREGTKPMEPKELARLGHGMIVPAAGSTEVPMLEPIVEHQAHLVPSHSICFTPQAIVTAGNEPCVRVWARPGHYVAPPPKKEPVVPEVEKIPLSVLDAATPLSKSEPADPSIKDTSGNSEITDSKEEQTTVEETETTSTASLSESEEDTHLVTMKDGTSTTSPRVNGKEYDSVHDEAGAPESREIQIPHSMANEKEEKAALPVAEESFLPEQPSDPLIVQX
>SRR5437868_9687141
RRADRPSVEKLIGHAPAAHAGNGGAALFDGPEIAVGGAAIQPAAVLRAPRIRIGLGRYGGDAAEDQYRSCRESNAHHDLLWMAAFNAARISRLNPHRCCLVVSPVSPRYGLYRVPPGIAAVSIRGAPPSLTANVLAERRFLSHQH
>ERR687886_608271
ESVISDVDAIALFSLSEVTAVLFVTGEVSTTETDGFSIAGARSSELAEVTSVSVLAGSDVAAAVVTTAVSDFDTSEAIASELLFVTTAESGFFGGLVDAGWPELVDVGSVSVLAGSDVAAAVVTTAVSDFDTSEAIAAELLFVTTAESGFLGVSDTIATASPVTLAEDSVVTNGCSDDTGAVDPESSGAIGTFSVEVMETSGVLDX
>SRR5262245_18501370
CALHSRSASASSKAFNVSSTVPRTTRSRWLLIRSSSIVMTLFSRLGVSSDMAAPSCWPGCVWPPPVQPDSGPPALPNCAKDSVRHPIESNSGRRNAVLAAAEIYFGAYWENKFVKQSLQDIINAVGWASRRRDDIAHGIIWGNIVVDHVSYGAFLFPPEYNTGRTLAFMADTPDPLRFMRTKYRYTAANIAKWGSKFTKLRDAIIDYFKAIKREDGRFPVLEARLEPLMDRAEKKRX
>SRR4051812_41527219
VTGAIEPTLERAEVDRVRSRPARNQDAYDFYLRALPLRLQTTRVSSEEALALLRRALELDPGFAPAQAHMLTCIIERVAQGWSAPEEQEEGTQLARKAYTDHGDDPLVLTSVADALGFLAYDPEGSLEAASRAVTLNPNSSWAQSAAGWAN
>SRR6478672_26151
ARRAAGGHPGPGRAPARGAAAPAGRPRGPRRSVGAQRRPGPDPGPAGPRPGRPHQPAHPVQAAAGRRPGSGTPPHRTRPARRRPADPGRRHPRPAGRRHPGSAAGRPRGGARPTARSARRGPHRARRHRHRTRPGGAPGGRPGRGARAGGRRGTSNRDVGRPHRRRAARPARGRRDRGVLLLQRGPAERRQVRPSRSDRGCGPGEHRGGGVRRDRRRRRIRSGRRAGPGRRPARPGRPGIAGRRRHRGRHGSGPRDPAARRDPPRRPGRGPLRRPGSGPTRRPGRHRAHRPGRRRARTVGRRWVVTGRGVAARPLLLGAARFVIALAVYAGAAALWWSASGDPDRMPGWVAVLATGVVAVAFGMLRRPLDALADRLLLGGRNTGYATVRALLARMATTLPVDEVIPALAETAGRTVHADRAEVRVLLSDGADLSRVWAAPAVPPARTADTVTVGVRHHGTAVGEIEVEVTDQAQADHDRRLLRDLAGPAGVAVSTVRLTVELRRRAADLELLAGELAESNRRIGDARRSQLAAVHAEMTERVLPLVDRARAGLDSASGAGARGAPDITGTADAVAGALDALRTLARGVYPPRLTEAGLAVSIEGWQHRTGRVLRLRIVGDQAVLRRDEDLESLVYFGVVGMVDGLRAGGAEPPAVTLDVERAQVRLTVTGESDGPALDRAVDALRDRVEAFGGTLERTSTAAGDDARVRIVTRLPYGEGSDDMAARHRGAEA
>ERR1719505_362534
STSSIILSQASFAASIGYIAHIVLTAFSMNSILALTVFTSNVMNRTTALQTVHPMGPPKFLRPSHGSRRPNPPNPGLSKSPKSSPRPPNRPRPRPPHNPRFGDNPFRPHWPRHRHGGRHGGRHGGRGLW
>SRR6266536_3216943
RPVGWCAATVLGPRGATRPARRGRSSPSTGGLPEHRVAGLVALPAGGGYAVRAGAAERVAHLRPARASVLTPTVRRVGLNNAVVYPPEGGCGGGDEQGDVVVQRGDAPPAAFQAGFDELVGVAPVHLRAGWAARGAAVAAGRVDDPVGHVRGGVGGDALAVAVVDVDRAFQADRVSAAGRGSHVVQPLVVVAGGGAGDDGRGFGHTTGPCRDGGGCGGLRPRPVPVIGGGRVEERRLAVGARTRGEGVLLPGYEGPRRDAHRSAPTGVPLWTLVFEVVEMVPRAARICSAVLVLMPSRTASX
>SRR5713226_9196200
KLYGWKLYGLEVIWMEAVWVGSYMDGSCMGWKLYGWKLYGLEVICMAVVWFGSHMDGSCMGWKLYEWKLYGLEVIWMEVVWVGSYMDGSCMGWKLYGWKLYGLEVIWMEVVWVGSYMYGSCMVWKSYGWKLYGLEVIX
>SRR5829696_2428463
SRPVRIADAIPSIGSPACSQASARRTFCTSLARNGAGPGRATRMPSSTSRPTSASVVPARSASPDAESPVMPPSSYERGNLRGECRSVPDRHLASVAPARPTTASRQALDCASWLFSPGLGRNAGLTCAYDPARTYEPDHLACRPYKHGSIGCLQDQPGVDLNAGGWVLTGRPVADEGQRPGWRQAPQPVSRAPATLASTGPVVVEERRVGLVGLEGPGPAPRVGADRLAVGEAELQPEVAEEMAVGPVWIVAGLLELVWVRSGGEGERQAGGVGAQVGDQDGMGVGAGRHELNRDDAGNHGLGWSRPGRDPVARGRLPGRHREEAHGGLGSGHRVWARAAAASTSPASSAACEGGICSAGQWQAKVSGPGGGRPHSHTWPPSGPLTLWYSRGGSGGWSPVGRGQRRGSLSARRPSAKRTSSRRSSPQRCSGWRGWLGRRRTARSKSNPVGYTSRPSTRTAW
>ERR1719375_709491
AFIALKEVLDGAASRLDRDGGAFAHEPRLGFLTSCPSNLGTALQASMLLRLPLLVQQEEAWPWRDWCREQRVQVQAAFSEEYKPVPDTFLLSNMDRIGTSDVHLVNLLVEAASLLVQMELCLETAGAGGTVDLRDLMVDIKVPGDGEAEEFPGFPAEECPDALPDLSGHCSFLADVLQKDPACYANLRNVRTPLGVSFGRCIKAALDNRGHPLVKFPGLVAGDEQCFEVFREVFDPVIKLCNVGFGEGAGGQGTGLLSTPIDPS
>SRR3546814_8950902
XMRISGWSSDVCSSDLVDIEQHALRALEQDALAPRPRIIQRQPDGPRELKHELGDLAQVRLQPCAIDGTLAEAGAEGIVMSAEPVDMRAELAQMGKIADPDRAAADLVFIGRTDAAPGGADLALFARLLPTRIEVAMEGEDERAIIGYLQGFRGDRKSTRLNSSHX
>SRR5205814_2128888
NLGVTTAGQPIANEKVTIALAASTPADYSGVAVKSASVNSSFARTTVNGATINLKSAGVFDMIQKASLQVAIPDINKTMNVAQAFSPPSTQPAATQPSAPLQIGGGAVVNVDLQREGQTTHITIPELAASKVSLVRGKRRFAFDKAIAVKLAADLAAGEKIDKIDV
>SRR5262245_33090118
HWALGQNHVALFLQPVAKVGPEWRGLLLTQANAQRVSAVAVQVFRLDAFLGFLLQGVELTIPGQGSMAADRIAVLRLIERAPRMRVAGHLDNGAARGQVDAVVTTERVRLQIALEAGQKALRPIAGPSRRVVEHVVRMTAIAGIDPEPALAGRVTRFVLHRQ
>ERR1700744_713940
QPIVEKQGIKAACHFFILSMRKLLRPAFDFLLFSNVFMSLCAVAQGLLTFYLISSKPIYPVLGLLFTSTLGIYNFSILISKPKHPEKSPYRRISWFFSHYRLMVTFTIVSLLSFIPLFFFISTPSKILMIFLAVLSFGYGLPLFTIGEQKFGLRNIPGLKLIMITLVWTMSCVLLPILESQAAHLATISMRDTTILIAKRFLFICALAIPFDIRDLFEDKQLGLKTIPVAWGEKNAYLFCQVLLAGYVALLFLFRNNGFSTDFWALTLSVVLTGWLIFRSKWEKNEYYYFFYLDGVLILQYVFVLTFNYVSRYLX
>D4D873_TRIVH
MLRKGAINPDIDSLAPKNTSFFLFFLCTYSFFSPTSISSCINHPFSKVHLVQVLNYTAHQTFPSASRNTNRFTHLGAMAEMRYISPDGPPLGGMPPQDFAFLQAFHMPHFMAYPSIIQNPPPGPPPASTPAPAPAAGAPAATPAPQVSTFPLTIYVVQHGLTDQVILHQTFTTNVPPPAPAPMAPASSPPRAPNPNPTAAQAPSPASPPSAAPAQGRRLPSGAYPPDSERAMVLPTGQGYIFPKKHTTLHIIEAFTAPWDNPGSTFQWRSYRVPSSMSISELIDQLCPTKAPDGRDATSRGVIECLEIGDGTWLKGSEFWIGGRRGGDDNMKRRVSQSLTAVGWTEQRGTIAQPVWITLSIAV
>SRR5690554_8049497
YPLLILSFFFFLMIRRPPRSTLFPYTTLFRSGKNQGVGPQFDFNGVGPASTHTLGIPNFGAHGLAFVVTRTRKIGVPAVCSQCEGPVFIIAVTFLIQEQDRILPVAPGILNHAVDARKALAGNAVLMALLFAGSAHGGKEX
>ERR1719239_204793
GKVAVKVSLPTRNNSCKRSSVDQESTPASTFQGHSLKYKLCSLHGCHDVDVHTSPPTSHIAVDSSIIAEDVHLGVEMFLATIIKGNQIIFFGHIAPDKSNFVLPKLLPQLDQGFFAHLTVDVRQANLGSSGQESDCKSFAEPLSRTRDDX
>SRR5271157_3087616
XMKLLLKILFAGILIYMVGMTTWVSLHKSILLSPDEFSWAQHPWAVATLFDAYFGFVTFYAWVFYKETSWLARMGWFAAIMGLGNIAMSGYVLIQLFRLRPEQAGIGHPVAESRVTRGFFHRRVVRPIVDLLTQGITPEKIALSIAFGLVLGVFPALGWTTLLCLLVAVWLKLNVPAMQLVNYLAYPLQLALLVPFIRAGEVLFRAPKLVISLAQILAMVRADLWHAIAALWVATLHAIVAWTLIAPVAVYLIYKILLPILTRLAQVTGLAKQEGSAASVAEVCX
>SRR3546814_2889336
XMLRHGKYVLVPASAHIDDDDTVFRHRRRDLGKGSDGVTGLKRRDDTFGSAKKLERLERFGVGHGGIVDPPDFLEPCVLGADARIIETCADRIAFDDLPVRSEEHTSELQSLMRISYAVFCLQKKTNRQKSA
>SRR5262245_5483048
DTMKQLVNAFGDYARPPKLELRPLDLNRVLGEVLDLYEDEQRLDVTRALAPDLPPLRADPVRIRQLLHNLIRNTLEAMPEGTRPRLEVATRCGSGNGVAMELEVGDNGPGLPPDFDASWFEPYTTTKPKGGGLGLAIVKKIAEEHGATVSARNRDQGGAEFLVRFPAX
>SRR6266699_1496226
AGIGPVPRAAEPSDPGSTPWGRLRGRLRDSLRPTVSLYVIRSCQGRSTMAGQFAGRAVTGGRGRGPRGRLTTLSSGVRHCPISGCGDQIDPSRLMCRRHWYMVPKETRDEVWATWRSGHGAYSRGHRNAVRRAVAAVLEAAGHADGHRTGHADGHADGRTTGNADGHASGHASGHASGMATVGDSAGX
>SRR6218665_631217
XMMLQTTYTVELHPETWYVLKVTATSSAGSTECILKFGTKSYFGATIEPLRLVHRFETPFYENIYIMVPLAVVTISCLIVIVAVALFCYRRRLRKRHKASSALRMHQEAKTALSLLRDIEKPVAAVGTEKSRDTQTYVAVPGLSTNVLKLVPQVSMDAKDNEDDEAIFRERTLSTGGLDIGLPNRVRVTAETGSQDESGTVCKDVLYGYPQKSSLF
>SRR3972149_6447067
RERAARALVHKGIALGHLGRPDHAIAVFDEVVGRFGEAAEPALREPVATAVFSKGVALGGRGWRPTTRSSGASARRPSRRYWNRWRWHWSTGPSRSASWSGRRMNSRP
>SRR5678815_2305109
XMCIRDRQPGGTWVDADRGIQVEFPTFVGSAPDAACRVNIQYAAAGAKPDPMFLTVGAGTVDLWMDNMQNGTGVYPSTQPLDGDGVPTGPGDPFAPGKVNLLNFRVRNLGAAPTPSLAVRLIAEQPPHVTCGVNPPRILDKIRLVDPIAPGGVALDGVNLEIPDNRLVRVRAEILSVPGETTTSNNKGERTFTTGANSAVLDQQYAGPVTINATFINGCPGDQLATAVPMTMPVKTGPPIPDPIFDRWRVTDPGLTLVGPGEQAQLAFTFLPPSPVTPGSGVTIPISFRAGGGLAAAGGMFGESRPQIDSMEVTIPVVEQAT
>ERR1039458_8973043
PPSLNRKKWGRAEPPREQKIIWQHGPPAVSPHQFSRSDTACSRKTCSADAGFPARRRPPATLPRCRNGFSPPGFSTAADNPAPSAKAAAASAHPPPPLDRIAEIVEVLDLVFGRHRLGLRLAETGTARVRQIAEREHVHRMAVRADLAVDLETALQLRLVVFSERAGERPFQPRWGHLLGQLRGPRGPDGGQRTGEDKGEDGALYVHDHPHALAPRTDSEIEFGSGFVFSKMPSSGRTIRKKAKX
>SRR2546421_543181
GCFRREAGAAGRDTHGMFRVHQFEKVEMFVWAPPEESWEEHERLLAIEEELVQELGLPYRVLNIAAGDLSASAAKRYDIEAWFPSQERYREITSCSNTTDYQARRLGTRFRRDGKAEAPHTLNGTGCERVPAQEVELSGVAGVFHVGVRSSFHQLVVESCDDVLPWLVEDDDAVVAVRAVFGENTHGVVDDLVSSSGVHPAVVAAEAVRRVGFLLELARQRVGFFLAGRALGVRSLLRTDRRLGAEDDPRGEQEVEDARREVEVGX
>SRR5262249_31764099
DDPHTLVIQGDTKTFNCNFSQDAIDRLIKDDPESAKAEIEGEFRTDLSAFLEDAVIDAAIVNDRPKEIEPRKGVYYTAFVDAAAGGCDAYCIAIGHSEGSGDSGVVEIDVLRGRRATDPYQITAEYVELCRKYGIKKVMGDKFGKSWVEMA
>SRR5574337_5095
NLKSGSVIPPAPFFFLKTVLAIWGRLCFHMNCEIFCSSSVKNATGNLIGIALNLQIAFGSIFAILSLPTQEHGISLHLSISSSIFFTSVLEFLSIVLSSPKVSLFLDIYFFVAMVNGIYSLIALFDFSLLVYRNVGDFCVLILYPATLLNSLISSSNFLILSLGFSMYSIISSANSESFTSFRIWIPFISFSSLIAVASTSRTMLNNSGX
>SRR3989338_7824970
RWNCDWSSDVCSSDLSLFCLFCISEIHAVFLFNFLGSSRIFRVVFFACFTCDPCTFLFLVLRSLGGGGCIFFFFSFFLFLTLAPDALEGFLIDGEESFEGETDTSLVDIDINDLCVNTLADREDLCRVVDVVMCEFGEMNETVDIFLESYECAVVRETHNRPCYFLANWVAFRHFLPWVICQLFHTEGKLVTIDANHFHGHSVACFCMLGRILHVAPCDLX
>SRR5688572_19622849
TDDEMQNPGSWTQDGRLLFSQGIRGVDGDIRILTLDSPPRVDTLLGGPAIEVLPAMSPDGRLLAYMLVEPVGQIFVRPYPNINDARIPVSNGPGMGPEWSQDGRDLYFMVRQTELFAARLESTNPIAFGKPRLVRSLREPTGDPIRVTLPPVNGRLLRQVRPQVSLSNPTEYRVVLNWTEELKARVGTKX
>SRR5687767_14888222
VIDAHTGKQLQVVDRLELEHGEGAGARYRAGRLDLVDGTPEQRPGAVTVVEVYRRVAPGNVVRQPLRVDAGDGSDLLTQAKTEVAATLDHEHVGIGVDRALGEGHDILADGKAGGPTQIVRDSCLGACLNAEETGVQLGITAGGRIAAVRX
>SRR5216684_2934442
YASRKTLPSDAKPQQHHSQGLETWLREKSKRVYARASVLLRAPVSSPHKESLGRLPINRAGFLFTLFIASFNCLRTDLLIDLLISNALVVKPDGLLRDVQSWVKPFAVSIQVSDPLVSIFAKDANFLVERVVVQSQVLQKVPLESIRICDDSFPRVVPISFAEELAPVEHAHIKEITVYGIPEVSTVRVRFEQVSELHRPSSAVVGHVAPKRPAQSLNVSEDLASRX
>SRR5215469_11197210
SLQVQPVRSKRLWPAIASVLLVALVGVSAIHFREHPPDSPKPIRFQLAPANVIIGSSARPSFSPDGTKLAYYATGSDGVARLWIRSMDTLESRSLSATELNANVPIFWSYDSRFVLFPSAGRLKKIDISGGPAQPLCDVAAQVVGGSWNREGVIVFGTNNTAIQRVPSEGGNATPVTALDSTLGESAHLGPVFLPDGRHFLYLRRGRPESTGIYIGSLDLKPDQQSLKRLFASDYIPEFVPFQDGRSGEILFLREGTLLAQPFDLRRLELTGDAIPLAERVGSYLGDPLFSSSRTGALVYRSGGAGEFSTLTWFDRQGKMLSNLADAFYGPFTLAVSPDGSRAVAERLETTGVNLWLVDLARGGRTRFTYTRSGIDRYAAWSPDGAKIAFSSNRGGHEDLYLHAANGAGEDELLLKSDSDKSVTDWSRDGRFLLFNQLSGKAIRELWVLPMDAAGGQKPIPFLRSDFDSRSGRFSPNGRWVAYGSNESGGNYEIYVRPFPPSAGGGKWMVSQGNGAYPRWRRDGKELFYLRPDGELMVADVGADGAVFQAGVPRPLFKATYVQGWDMSADGTKFLFPMAGGETTQFPFTVVL
>SRR5215471_2447632
SWRRSSGSPSRRRASTWGSSPAWPCWRASGAGRGRCTGSGRNSSAAYSSRRRTGSCGPSRSDLPNGDQRMQLVPAVLIVEDPVARRLDAGADSWDHEVVVVALTGRHGVSLGDVPLADRLEHEVTVLLLDVLRVGARLSIAALSDVELEADVVVAIGLRPLVLDQPLQRGRLAAVQQPEPARMIDMSGRRRAVGGAERNGTGRRIELGRRT
>SRR4029077_541644
SPASLRPAKANSAHTGPAFSSPSVPIPSAASPNFHSSICTAQIARTPTPHVFPLAPAPDPKSSVSSFPNTARSHNRHTSTHQTPFPNNQSPAQCESARIAPSEIHPARLLQQAPEKPASRPAPDSLSPPFRSSGTSLSASQIAGRAASRPPN
>SRR3989344_1047100
AYFEIIEKRQAPSETSAKVRVPAVFLANSRSIPIKAPNRTANANWPNISKFSPPKNPILVHQKYLVAFSDALADFNPDFFAFWRHGNLLVIILHGFNHLIKIRRRPAETKFRARFNRFFKFYDRDFNVSVEMSNYSDGLALSLPNGLFHLHRRLCFRHRFLGGFLRCFFNYFSHGHIFRNXX
>SRR5215510_3565519
WPRALLHRTCRRGRWRLQTGELGHGLQVQTMTVGCMRVVTFSQLPSSMPTALIQINDGVKPCSPLIKARPRPATGRPRPRSGAAVEGQADPASDISSMPRPVGLVASRHLGIAKSLRWFAELPIGDVLSRTGTRARHRHNRDRYSRRPX
>SRR3974390_2059552
ARVIHTCLNKDAEERFQSAHDLKLQLEVLVSFAEQPAKAAPPVATKPWTARAQWVAIAVLVFVVGVTAFAWWQLRNELKPVVRSYLTAPDKSNFNTESVALSPDGRFLAFSAVSATGGKMLWVRPLSSLI
>SRR6266566_5267620
PLPRPPLPRRTGRSDGRAGGAACRGLPRDDGNRRRPVLRIRGGGEPARGARGELAGGGVGSGRRAGGAGAGSRGVRGGRAALAARRARSPARLRRRFRDRGDDGELPRARRRPPGRPAARARGAWVHVDGAFGLWAAAAPAREHLVAGIAAADSWALDAHKWLNVPYDSGVALCRDGAALRAAMATQAAYLLQ
>SRR6476620_1160279
LSNNKGTIITLAVAKKKEPTSPSSSSSHHKRTMTSNTNTANTIHPSPKPNHLHRGKNQDLHSAIPKTTTTTTSPSLSPSTLSLSPSSERPSDVPAPSPEEQQATVQKLYAASAVAASDPTNFNSPMDQQTQQQQQSCSYSDSIDKFILPFKEARFTHIRPCVTMTGTVISGLKVNADGDISFNIAVDPAYEGMLGPGNLDPSHATSSGEHGIHIEVICQEPVNSSAPMDVGACNGYNGPDFHSLLPTDHEHVMVTGRFQIEWNEAPGGLTEIHPVYDIKTIPKTX
>SRR5580700_450720
DMPIGDDVIVLVEHHPPCLRMMLEDDGPLLGRSLVARILAAQSQPLETTIHALAQPVQRIARHGIDGRHLVDVQLDEVFEEIHPIPTPAHDVVMAADPIRRQQPAYAVDDFADVAVVGDFKIFQLADGDEVVGQSVGRNYGAVDQDRQDLESVLLAQIQSGFELATDEIMAAVETVLGVPLRTDERDHHLARLQLAHDLGDDLVARLRDVDVEENLFLRKGRFQRLVEPTRNRPGIVAPIADEDTLRHGSPSAFLGLPGNDLALELRQQCRSDEAKEADHHDADEHGIDLEQLPGIPDHVADADLGGNEFGGDQHDEGHRDRDAQPSEDHRQRAEEHDTREHHPKARAIIARDIPVDFLDISRTRIGVDDHREEHADGDQRDLRGIAEAEGEQHERHQRHFRDREQHGNQRIEEDAHRTEHRHEEADRNRRHDADDEAGDDT
>SRR5580658_247251
RAKLLRALPAALFFRRRLTRRTQRAHNVLAGAVDRKKNPPGESLGLPCCRRLERTALPAEPRLHHAVAAHALIHAAGDRLHLGQLRHSKILTDYLRSAFICGRPIISGQRWCDQAPQQSCSPRSSQSSTRPEGLPHTRAYSGSFLKYRRPAWCPVCRRSTSPAPLSHKSAPCG
>SRR4051812_49755575
XMAIFVTRWIRRLSWSSWRVFRLSRQNSGVLWFGNSLLCLGEGRTSRVSFFERSSPHPRSDALLLLADGIRVDRCRGELGMAEPLLHHIEGDAPADSLHPEAMAQALGVGVGAVRDARRRDNLLHPPVGRHAAPRPQPHFCWAAPGCSAAGPCPPACARLPDAPGPCARSAX
>ERR1719445_2651091
NIYVVLLFFYVGVAFVAGEQYWWKFVHADCGYDDVSPQPACGRSHKGDVEALKACCLNTTGCGGFNTNGIIKKTDCLSNKKFESACDLYVLEDRPQPPPGTKFPPIWPLPKKYSNGTSYASVSTAFKFTSGKTTTTLTDAFTRYTNLIFLHDIKSSTVNAAVNATALSGLDVSCDSYDESHPQLETDESY
>SRR5215211_4540433
AAGGLQRGGAGVGGEVMLGREPANVADLAQEPGRQHRPHPEQPQQAGVGPGDRGLDSRLDRGDLLLHLAGVGDEFCGQLPTGDRRRTGRGHFTEQGGGPLGGEVTPGAAGDQVHQQPMQPVDGLGPRGHRSWRRLVNKCRTTAWSSTPTWRGAGILNAATTTETASSGSLLRPCPTDSTRTRAASLAGTSRTCSPSPTSRWASARPMPWAPSTAQQALWPALGPSPQGLVALKGGSDALLAEQLAVFVKRGAGVGGLVRGRRRSSPACGRLLEGRREQPGGQADIGALAILCXX
>SRR5215471_16031673
ANGSNVQNEQPGSRRHDNETGKHNSRRAPAFAVRTAFRLHGSGRKDRGLEREKIARPPTCTAPLAPYRSERGVRWINWQAYSLEQRAGWSRDRFASETSVRAARMAALFRKGSESRQPLEHHFVAADWRSPQDSMGVDTLHPX
>SRR3984893_4885850
CCRRAATGSSRCPRRRSCVPRLSTSTAPDRPRTALPVPGQVVDHLDDLAAAVPLLPGELQQVSDLGQDGTAFGGARHRDAASAAELQQPFLAQDVQRAQDRVLFHAEDGRQVLGQRQAFARAGLAVGDGAADLRGDLVVQRSRAGSVDVDINHGPSHSSPMLDEWHGPVSAVLAPPGPSAPSEAEALFAEARRRRRPRRLAVRVACLLLAGSAAAGLMTAWPSHGAGTQYGHPGRAAVPHTPDFTLPRVRVAWVDYGGQLHIGDLATGTSRSWRRSMPRQPTP
>SRR6266568_5935642
YSAIRLNSLKALAALAAQKADTNVSTAKATSNPPTTTTARPSGARGRRPKPTPTRIAHHSTIPTIARAVRPEPPFSYAMQKTRIATTPAIHHVSKATRGLRRGVGSTDRTAWVRGATDMGGARLAL
>A0A061IJV5_CRIGR
MLCFEGLVSLVSGASCFPFFRADYWKSQPKKFCDYCKCWIADNRPSVEFHERGKNHKENVARRISEIKQKSLDKAKEEEKASKEFAAMEAAALKAYQEDLKRLGLESDIPEPSISPVTSTVQPTSTSDQPKEKKKKKEKKKKDPSKGRWVEGVTADGHCYYYDLITGASQWEKPEGFQGNLKKTAAKAVWVEGLSEDGYTYYYNTETGESKWEKPDDFIPHTGDVPSSKDKEKSPESLEESKSSDSHSDSDGEQKKPGEASAETKKLVIKFKEKNKSTEKRTDPEIQKEKSTPKQNPSTTNEEKSKPLKKLTNPYGEWQEIKQEAESQEEVDLELPSTESEYLSAPEAAAGEIKVVFKEKTVSSLGVAADGVAPXFKKRKIENGRSRNLRQRAAEMSHHLCIHLFRNPSYTRRHVFLYCQRFRQISLDTRLWDFKQNKSHVLHQVLNKSWSRSYCHQDPKMLWKHKALQKYMEGLNEEYQTLDGCLQDISGNEDSRRALCRRHAKLAPLAAIYQEIQEAEQAIEELESMCKTLHKQDEKQLQELVSEERQIIDQKINTLYSELLEQLVPKEKYDKSDVILEVTSGRTTGGDICQQFTREIFDMYQNYSYYKHWKFELLNYTPADYGGLHHAAARISGDSVYKHLKYEGGIHRVQRIPDVGLSSRMQRIHTGTMSVIVLLQPDEVDVKVDPRDLRIDTFRSRGPGGQHVNTTDSAVRLVHIPTGLVVECQQERSQLKNKEIALRVLRARLYQQILEKDKCQQQSARKLQVGTRAQSERIRTYNFTQDRVTDHRIAFEVRDIKEFLRGEKCLDQLIQRLLQSADEEAIAEFLDESLKSVK
>SRR4051794_32399155
ADVGRASAGSCMVRRSFRTLPGDGGGATTVLSLETQTLATSSWRAELPFALSRPRISPRVALALEAGAVLAILLLAAIVRADSYMVVPRLTDETLEVMLGLRLARQGGLPLVGYAPHIGSLFTYLTAGAFLLLGPKIEAGRLLVLTTGVLTVLPTYLLGRDLGQLLVARGEGRGARDNTRRAEAERLTRGRIVGLIAALLLALSAPHVATSSRIAYSNSLTPLFIMTGLWLVSRAIGRRSDRALIGSGVAFGLALQSHVSAVTVLPGVAAAILLPLLASWKRGELARVTPGGQ
>SRR3954453_11447405
AENDRKNQDYDPENFRLLAGRRVERCWSDAGINECDDLDDEQRQADDQEDAVQRPEDEHRSSTVARWRRDVIECRKIFRRRFPGTGGDIRADLFWLRRSSDDRRNRRLSGEATDSDVEQAATTLGGVLLEFLTDVEDTFGERLGSGGKSSPLRRWLSAPVLAGQQSACEREIGQDAEPEALARRSHLRLDVAFEQAVVVLHADEPVETPDAHRPVRVRDLPALEVGAAEVANLATFHQLVX
>ERR1719182_1343932
LLKAKYVEVNALRVNGKSLADYIVMTAKKSNLCKCGGGGPTKKPTKKPKCPVAMIKCKCGHTYTMVKGCKMAKCKPCGDKTLSGGNNGGAKNLKACTGECDSEAQCAKGLKCFQRSKGEKIPGCKGNGGGKDWDYCYNPVHGGIKELGGPNDSKAKNLQRCVGECDADSQCAYGLKCFQRSKGEKIPGCKDGKKKMPGHYDYCYDPKTEVKKPDPCKKNNGGCDKARKCMNSNGKAKCGNCPKGYTNSGATKCQKNRPRGKEPERRQQRWCQEPEGVHWRMRCGFAMREGPEVLPALQGREDSRMQGQWRRQRLGLLLQSVARRRQDAERRKQRQCQEFATLHWRVRRRLAMRVRSEVLPAFQGRADSRLQGSWRRQRLGLLLRPQDRSEEARACNEVRSRQCIQLQSYQDQHPQVLRRELHPQVDWWX
>SRR5574341_165588
XMGGYLSSKLFRIIESGDRTMNPEQPQIFGLIGNPVTHSLSPLIFEYLFKKHRIKGSYHLFPLQPEQLKSALEGMKILGMSGLNVTAPYKEQVLPHLYNLDESATKIGAANVICNHKGKLKGYNTDVIGVRRTLKEIMYIQAKIGAVALIGAGGAARACLQVLKELKPEKIVLFNRTAEKAKQLAQQFNSSIPLQHRNLGELENCRSERDFNLVINATSGRNPAIKKAMLKGLSLGSHLFDLNYNRDYGINHRFHKRFCDGLYMLSCQAAESFRIWFGKRTEAEEIHRYLKKRLKX
>ERR687887_1747641
AGEAAQAQGDGAQRRVAGLDAAAGVEGAEAVDVDERQRRGPAVALGTAQLVGGGAAEGVVDEEARPGVAVAPFVELGLQRAQARLRVSQLAAQRLLLAGSEHGGSSAERRRSHSRWTRFGARSPELGTAHRRYPARPASAAARX
>SRR5215218_6855622
PSVRRAVMPYWSVLLGGFARIPSGENRHDDMPVRLSAFVSLLAGVWAVLAVLSVWGAGSAAAAAGTRLVISGAFHATSARTVARDEACAYRPNHTLIYQSDALRLGRSPKAVVRVQFFIRRYRGLARYPAAGSAPYRRTAVQVVTARNAATGVATAFYIATSGSVAISQAKGVARAGHRASLSGSVHAKLREQDGSRRLRLDGTWHCRIEPDANGGRPRTSRRVQERSPSMTDVGSSRHCSGEAAAGLEPTNRRPGRASAGRARGRARX
>SRR6476619_648836
LFFTTYIGWQPVLVTRDRHGELHCLLNTCRHSGTIVCPFQDGNAKLHVCRYHGWSYDAAGINRAITGEQDGQYPVAFKNANHNLINVARFGNYRGLLFASLCVDVPSLEEYLGDARIFLDIVLDQSENGFEFVPGPVIYTYDGNWKLQFENGLDFYHFNLLSPKSGAAADKIAALGPRLAHWNVIGASNVRNVASSRCYLRHHRNSMPFSVLARLSTYWCIAANDAMCRX
>SRR3954447_23271464
NWRRLWRRYRFVATLEGRLERLGLLCPPDMMQGWNKGPAIWFPPPGRARCTAETAAQCAGPNAHRQYGQRPVAPSNEIIMSARMPARGGLGVECQEAKRHGRSRKSGALEKVRGFRPRCAQGAFRRPWARTAFGLX
>SRR5437588_9293553
ASAAEMAAAAGLSLAGASALAAGADPATAKLATEPVGPSALMDGRTAVLGGDEVAQPPVSPPGPPAGGDQGAGRLRPVALLAVVLVALAAIGIALALRGNSGSTPTTTTTSVPATTAVTRPPTTRPPVTTTSAPTTTTTSPTTTSSSSTTTSSTTSTTSGVLGRVGGRDHKNADAANIGGGX
>ERR1719421_986179
GSSSEDFGDQSSIQRCATLDDAYAKLQRESAVAGQFEAFAAATLDNALAERAALYRLDGAESYVDACEREASGAIMGLLDSLPGDDAPGALRALVGRALPQALRERLWSRRLTDIKVQREFRESRGDWSVRSPHEADVTAFCVRVLSDTDGDKLCCARSAFSFLDQKARESGGPLPSDVYWLAKPLLEVLALDDAVLASAVRCVLERGLEPATKPEGTLAFGDESTDNQSVLEGGAGAAALALRLGVQRKNTQRWWVPRDWLRRCRTLLVELCPSLAKALKCEEDTDDSENVIARAIGRSMRRGLSDILSTEVLLFVWDQCVLTSFDLVIPYAAACVLALLDEPLQFFLRDNEDPQVHEALMRLGKDLPLIDVEACFRRVVPKIAPDARELTDAISARPPPGLLVEASLPGAAALGGLADVVVDSLADGAGFTMHGTLHCFLRNLDCRLEWCEVFPAKDSLPNVVDRLLALPANRKCILKARQQWGDQGGFDASLREACAVAACRALPGLAALYAGSYPATIQDALKDIMKECVRFSLPVRADDDDRDGDGVKDEVEYEPTTGALLGEHVPQVDVLLRKNSKPQDPGLGPGSALLQAAGIFAIRAAPGSLWPHYSPGLMHLVYLAYNMLREQHHLAGIEESKQKEIAAAEKAIDNCRRAEAKKKELAQKERDSMNAQEQAKLDEQYRKEAREQQRKRIEAADAADEKVKDAFLACVNAAKECGDTYKKCREAFEAKERWRKQLIFRWSRGSKRP
>SRR6266571_3544720
ERFPERGPVPTVPDSLVKSSPSNPSGNSPHSHSSPKQHLLRILEALSLSTDKALLRNMSILENNLRGNRASVTQLVDMLTRLRRPCVNEECRGPFRRLGEEEVEVAVAAICGEHLRTIHHPLSTLETGGGLKIACVGARARLGQRKAGELLAAYHLRKILLLLTRITELANALATGTVNGERKSGAGASLPAHLHSCDVNRPGKLQSTKVFWKAHAGESLLEEFPNVLARKLCLQVGLASCRLDLLLEEIAQRLKEEQIIFRSXX
>SRR5918994_7596206
TQERPRRNRPGGDPAAGDARRGRGGDPGKGADDVPRVRAAQGPREPGGPQPGVGNDDGGPGPPAGVRGRGQVRAGRDEQCDPVAGGDPVVGEPDGQLVHAPDEQVPGDRADIRFDDGGGGVAGAGVERGPQRGVRALRVTARWTSGPFVRTYPTNGP
>ERR1039457_7143814
XMLSIIGSVLVLGSVLGSFLMEGGSLLLLWHPSEFIIILGAALGAFITSNPLKVVKGSFVAIFGLLKGPRYGRADYLDLLKLLYDILVKIRKFGMLAIEADIESPGKSKMFTEYPRILADHHMIEFITDCLRLIVGGNLDPQELESLLEYELETHHKEAAEPGHAVQKVADALPGFGIVAAVLGIVNTMAAIEGADTATIGKKVGAALVVTFLGILVAYGFVGPIASAIENRAHEEGKAFEVVKMALVASVRGYAPAVAVEFARKLLWSDVRPIIVKKVKKSAAGHHGGAWKVAYADFVTAMMAFFMVMWLIAAVTKEQRAAIFEYFKNPSMEQGKSVRASLGQMGPGGASTSVINMGGGLDARRSASALSTGIGTPHNAEPTADKEKAQDKERAASSEEQARKLTEAADHKKLESLMQELRKAIDMSQALRPFKDQLLLDITPEGLRIQIVDAQNRPMFDLGSAKLKDYTATILHELAPYLNTVPNHISLSGHTDTTPYLAQNGATNWDLSADRANAARRALESGGLATEKIARVVGLSSSVLFDQDNPRNPINRRISIIVMTKQAEESALAPDAAPQAKVSELPATLAPQAPAVPSVAHX
>SRR6185436_12656879
PHKNFLAPLARCFRHLDRGDKKMNSAKQRGISLTVLLALSVAVVALNAAPAAAQTSTYMKVDGITGSATDPRHIGWINIASLGQSASMPVQASSLGGTSAGHVVGACDVEVLKGLDAAGPLLWAALFAGKHI
>A0A2D6A177_9PROT
MGQIFLATANLLALLISISASAQSNQDQFYRYFTKRIELTANGQEMALEVHAPASELPAEAGLFAEVDGLLQPFGQSQRISMNRSKGAWVMTMAFRKVPNEGRVYLVTRSSTGTKTYRFTERPWESPREGELESTRPRAIAAKPLPEMKDSDVFRPVDSYYFPAMTARFGGVTLETETNVQRTVQAITTVCPQEPLNYDPLRHKRFVVEYFPAQDDADKVEAALQAPPLSTQSLRTTPQGCLALSIEVSHLWYQCQRYFLLPIRFTDPTTGISETLTLGVNPWDEGWVFARDARDLQPHQLEQVQCRPPQIHLNSYSLDGAGMNYSIDHNLSLVVEKNYYLKLSPRVQRADSITRGRFGGAALRDGFYLLNIGLFYRAEEGEITPKDYVSSWEQIVEVKSSEIVAPLKFDLKDMTLMGARNQILMQLQPIDESKVVLKPATASGNREIDQDATLRAENLVLENTGLHSPVYQGPIIPLSAGQGPILRPSHINLEQSIKLGQLQLAELAGDFQRRYRMTHFDRMFRLKSMLHSEPEARLWLQQTFGKYILAGPLFDFSVSPDINRSYLDKQRLQASLCDGWAGRFLRQQIQLDDQTTAAQRTMQIHYFEQFLRDFRQACIRETLDDRQTFSLSPSMMIRDIDPERTKYIGGTSFNYNINESFSLGRSENWGTSQSTSSSLSFSASLKAEIGVTSLGASRTETLSSSENYGRNLNESNSISYGRGTYLVVQHSQVEFVPTEYQACQVIRPKSEFIMDLLDKEVIERRTERPRSRMVHLWDRIVDFFKVDTDDVSVDTMTYRDVFGRDLSLDLMETGLRLCEDGTRTNDDSVIEDYYYVTQHFTAGDMQDTFDNRNRPWLMMIRSTRDFNVFLSNLQGQSRLEHRGVENIAPVEILADAYDDFAGTLPAWPGIYNPTERTRSDQTRCDNQVSAPDLLVSAIRQVIAGPFVQPDGNHIFSDRDFRRIWHCGEE
>ERR1712176_1124453
KMKANNNMAAATANSAHADVVNASNKTERDRLAEKMKANKNMAAATANSAHAEVAKDTRRHTKALRKRTFATSNYKRFYGGAKAPVFYHQLLNNVYTVLELYTARINPTLEKDMLTEGLNDFMSLLQNDAFKNNKTLQTVDAVAEYLWTSCKRHAIVQDMEL
>ERR1719473_1570082
RGGDLHKKCSSGKARGTKSAQSPEEGRPTKMITRTCRTERHLVFPNNAITMKKKHFSVIVPQEPSAQQDPRDIHLLSVTQTSRALDSDFGIRRLTAWQVPHSSRLAAFEQKKERRQLCNRAIMCCVTLYEFIPLTGLKRPEILFYLSRATDSQVPHASRLPLFWPTLSQADKX
>ERR1719473_2414288
AGYDFNSCVPVPQATTATAGTMSMAEGEPTTLPECTCEGENGEMFCPGDSYTAPDGCNSCTCTETGVGACTLMACPEEPTTLPECTCEGENGEMFCPGDSYTAPDGCN
>ERR1719473_87410
ISKMMRAVVLMCGFLALASSTNLRGASEDQKKKKDGPWPKLPLEHLGLKDFLDWEEPEDPIPPERPARPEGGLAAVDWDYNDAERARMEIEHSRNNEWVNGHAPTGQIDPVEPPMTEPERTLLYQLFGKATNLLEFGTGGSTIAALNFENIKKVTSIDSAERWKKLIEHRDDAKAAIEAGKLNLIYSDIGKVGTWGHPKKPNTKPIYKKTASSPGFHEDGSENGPHRSSPFGGLKMIDRIAMKRRAHEAVAQFAQYSGETPAAAGVADLILVDGRFRVASLLKALQRTPADKRSETVFAMHDYGYVSTKYNAVEQFVDKVQQADSLAVFKAKPNIDESALAQVIKTFEKNPKX
>SRR5437660_4872881
PLARCRRASRVTARAHPRADSASSTRLSKRGLHPGIGGNIAQAGLPELYADLRHAGIKQAVRVPIAHGVAARLTASQVSFFASDPRVDRIIYDAPVQLSDTPFDPGALASLYPQVVDAAASWSNRPSPLTGNGIGIAVIDSGIAAHPDLAGRVVVRKGFSPDVKEASDTYGHGPAVAGIIAGDGTASGGAYVGVAPRASLIHIRVNDGTGAAPTSAILNALLWATVNRKTYNIRVINLSLQASVQESYQTSPLDAAVEYAWLKGILVVVAAGNKGPNSELYAPANDPYIGVIRGRVQLAVRTLVAGGNDHQDALEPGILHRRVQRAGLIRLLDGCLQRQVDDADVVGLAVDGCPEQGVQDGGRGRRPGAVVNPDVDQAGPRRDADIRASTGRSVARDDAGHGGAMPIGVTRVVDIRVEVLAGDDPTGQVGVGRNSAIDHSDPDSIAGQRRRAIAPAGRRVHDLRIQARQRTWIEWSVGELHRGVINDPVDPGVAREEADLRRRKPGCNPVGDRNPDRLLDAGVSQVGIELGQACLGNQDHIDGGANARRAAGFTVEPFVSPRRGERWSRRQGSERQADPEAGRESCPEQGGHPVTGRX
>SRR5674476_1677054
GRPVAMDVSAQAVVVGATEVIDSSLPAAPVRVGASSRRAVSCSHPNPSTINRTIWFASRAGEGSQVGGCPASPLPPANPDNRAGTRVARQPPSSTGRSGTADPSEREDAAITSDGTP
>SRR5258708_27400449
SRRVCSALLTDGSAMFLLRHLACSVFFFFNDPAPAEISPLPLHDALPISRGRPRAALDDAPERRAVAHRRGGRRGPGDHPDGARDLKSTRLNSSHQIISYAVFSLKKKNGGLADQPPDFPPRAHLHRGAGQD
>SRR5260221_9098150
LVPDATPASPHRDAKVSAPRHPQPNNACRCPAPARARKDAPEAVATAPARSTRLGNTSFLPSRETSHQVAACARTLRSRAAQKACAETLRHLGTATRKGLRAAEVAWPQARIALCSCPTSRCRTPRQSPRSKKTKPHMAGQLRIVPMSRLPPRVRGDFGPAPLEQLPPIAPPCIV
>A0A151A617_STASA
MFDMLKTLKLYLAKDATINQYCKNRIRAYTIPETADRTDTNILIIPLIAPTPSTYASDKNLTTDYLFQIDVRSKSYEETKLVSEAIRLVMKGIGFGQQDGTDEYDSELKAYFETRRYRGNPYTIDELRHIDKDIEPTLNT
>SRR5882724_11345676
RQRLSRPARASMRPVACAITASGSRRWRSSIARTAKSPRTPRSTTCWPTSTSSTTGRSKGWPPRRVRSARTRRCAGTATWSTRRSSRWPTTRATIARRRSCVGSGRRRPPSSRKPRATTPAPRCASERRRCSKVQVGRGRHLGRRPARRQAFSTDRKVTSHTIGHAGNIWSVRLRSRSMRMLRGLPRGEPSRPATIETAVHPDGGLVSLLEEQVLELRGALEDAAEAICRTDASGRLISVNRAFTEMLGYAAPEILGRSWQTVIAAHDRALVSADLEAGIRAKIERQAVGLRRDGTSFAMHLVLVPLFSRRDHHDAVQGHYFYIRDLTERRRT
>SRR5882762_10441494
XMCSTEAIDGNVDDAAKEQRAALAFELKIQIGAPVLPLITDGKFVRQWSKLSEQDRKFSLLQEPAFVISWYRQHEALFEPIVCLGYDFSGELLGVMALARCREDGAITHAGDFHAEYSGWVALSTIDERFVEESLIAIKRTLGLKRWAWKWLAPGTPVGFLSSSRLAQNGIFATFRTERSPVWNLEDPERLNQLLKTKSIKNQINRFTKKGGFFLERVRDKERTRQLLKHLRLQCDFRQEAIQGVRPFADNPCKEPFFVERQEYPESNHFTVLWSNDRPVSFHFGACNRDTLLLGLTAYDPTESRNSPGKVHLIELARMLREEGIRRIDLTPGGDQYKEFVANESQELVVPTFYFSRAAKLWADLVEAARRTTKAALTLARISPNALRALPTRLRRATLGRLLKRIRRIFYENVVYLQYTTECKPSEAARDPEIFVQRYEDLLLYDDDNPWLGRRQLLSAALKRFGSGETLYSASRGGKLLHYGWMTPGGQTHLLQGVNATFHSPSDSVVLYDFFTHPEYRGQSWYQRTLRQMLQDLSAAGVRRAFIGVLQGNESSQRAIENVGFSPYRSFGRRRILWFEKKDERAMKPQNMTX
>ERR1711974_149456
NAEYMGGTSLKCYSLVSGTSDDMGTETTCPSIANKFCQKTYDSNSGIVIKNCQLTGTNGCTSVGTLPLASRHRSVQWVGNYRDQTNDCHHYCPVDNLLRKNVLGWVEENPSNFSKSLSCHX
>SRR5919202_1515199
GQLDHLEDPDPDPRRRRAARTTGRAQLGRPADGLADGHQRPQPEAAGRGGVCRARAAGPRRLKRIATNTPSRGDTPMNTFQKYLLVTLAVGLPATALSLPLWPPQPGADPSPLQIALFFGIFAAEGLLFGFGVAFVLFGGPLVRAATGAAGVRSWPVFVSLAWTLLSWWPHDGFHRASPLGDLDATLRIDYAFHLTLIIAAVVMARFFLATLRAT
>SRR5947207_7774739
SGGPRAAGCEANRPTESGTTACPVASRPANGGSPLLLRSPVPARLQTRSRRPSVRFPATHATPGRDRQDRAPARTPPPPRPAGRETAWARTTESNGAPTPPALLHRVTPTVSRRRGTRAGARAWACGRHLQIDERLWIPX
>SRR6516225_11363389
NVCARRVSTGANSAEGTVDPLTTRNAATLQEAKEELLDLEIPEHRGRSLHHFGDVLARQRTRIPLAERNVRDNLGLAHLHGLGYGLLLGRVGLARKVIAQFLDLRVTGPAKHSLVAGRIHEASEDWIADVSRHPSGYEGMPAARIRRVLLRTTRNQGLPVHRLHVDLEAGFLQQRLGHWRKVGKRGQIRRLHENDRGAVVP
>ERR550534_489957
PHPPASSGAAPRAAGRAPRQMSAADLWAQLQGALELLSNVPLTHLTQQACVPYWVFGAVFLTHLTLLTITWIFWRRIRNVYSQLEQSSEDAATLSELFSSELGRLRVQLSQSQEDSESLDEMLGSILKGGLPGHLELTSKDYWCVKTMQVVYTDQDGKRQEWRQSGYRVNCFVPGGARDIEVTFGVVGGAECKQVDRSKPKFPYVYDESGRTKLERFSYERCPANVRYEIRGPSIAAFISHVTEVHGAAQPSGGDAAKETSPDAKRERSLSDHFSVAESRVCSX
>SRR5262245_51303680
SRDAVRALLPRNENVVRRQHSKVVEDVVDGKPCPGYELQVCIHSCAFDGVPTCVPTSHAALAVDEHKILALRCDEMGDPPDETVSHPKCVLELPGEQSLPPRVDFPPTHGELFGDVLFVGVPYYFSLLKARHECSVTRPPGRITWCGSNPASPIRS
>SRR5690625_3526233
RECFFFSSRRRHTRWPRDWSSDVCSSDLYDYDYQNVGGRWVHGFGVTSPADEPFSQPGDSGGGVYQGDTAVGVISGGGNLGGESFTWVADLDHSLEQSGTDFNLEKPGDEAPENPDAPKAKDQTIEPGEEVTGKAEAGAEVEVTWKPAEEGEEEGTDNHAGEEGSETVKADEDGNFSVEGPEAEGAYTYTATATVDGEESETTEFEVTVEKDESETPAPDEREISVDPKEIAASDFVKEDEGVTITVKGFDEGEKVTLEVASGPENVKGITLEETANENGAAAFAIYGTSASDPSAYLGKYDVEVTGANDTEDEDALTGSFEVVANEDGNGGGTGGEDLKSTRLNSSHVAISYAVFCLI
>ERR1051325_2865591
WLEAAAGRHGGLGTKEFSRSGLLFGRDRGGSQPLHFVNATAGNRPLDLPSLPAFRFGGYSGASKVDGPSNAHDRRWLRLLLSIDSVFERQVFFRMGVGFGGGYTGRFTAELCAVAGGWQAGIGGRRHLSGALPGISHYRRVCGLAPRNGPALPGSRDLGCADQFAKSRPK
>SRR4051794_2477398
VSDRRWFGISVCARRSNAPRQECWRPPDQIAEAIYLMCNAMFGIMCIVTVSAATPTITILLFCAAGVSWWASEICLVFFLPATLQDLLGVLRHQRVGVPGQFRHSLHPHLLSDVETVPLEAPQNHLRVARIQQPRHCFLA
>SRR2546422_7969508
SATSRLLMFCFPSIHASPFYFFFFFLMIRRPPRSTLFPYTTLFRSKKQTRSVRPDSPLRPGGETHAYDEQPPVRCSSFSSRTQRDRKSTRLNSSHGYISYAVFCLKKKKKRNIKRVEAKVCARPPNAQ
>ERR1719506_1077933
EKADENIEEYFAHLENKSGTCRQVGTVRIGKIYNDVWSYNLACDRQYDTPCNSEGWRLLDRGSLYGGCIIVNQIEVCQFPQERYGHMATVHLNKLWVYGGFAMFCEDYCIDMWTFELPDYRGYEQNVYVPGIGVVPGQTPLPWGYDVDLYGIDPIDGHMKKLRDHQTIGHEQTKTGDFPRWNE
>ERR1719159_229085
PMQASMETLPCLISVCRRLAKSSALPSAVKPRGSQKPTGGCTPSSFSKALSGDASYNAQSPYAEPVSPSWKNIPMIAIIASLPFAISAASFFSFSAGSLDVSTLNPKSPFAAGVPGDWSCESSQKAPYAKICPQPATGTLEIAPKPFGMSANFKVPVAGWGQILAYGAFCELSQDQSPGTPAAKGDFGFKVLTSSDPAEKEKKLAAEIANGRLAMMAIIGMFFQDGLTGSAWGDWALYEASPLRAFEDELGVQAPVGFWDPLGYTAEGNAEDFARRRQTEIKHGRVSMLACMGYITPELTGKLPVYLSPSMGLKFADIPNGLGAISKVPLAGWGQILAYGAFCELSQDQSPGTPGAKGDFGFKVLTSSDPEEKTKKLAAEIANGRLAMMAIIGMFFQDGLTGSAWGDWSLYTASPLRAFENEL
>ERR1700751_3884456
LASSIYGGEQGLGDPSTVLVASQWAKWTKDYLPTDFGLLSGFPYPFPINGGLNSRTVLPPPAVQRLVEKKVYVRGYMIPLEMDAKGVSQFILVGDLNTCCYGLTGDPNTWVVVYMKKTTAFTRYDPLTVFGTLHATEIAHGNGYETIE
>SRR3569833_572735
LPIIPRRDAPAQIGRDTQSPALSVRLRHMGLDRVARGEIPKFDQGVLAGGEQESLGRNVKDHRLSRLFVFQALRPRLDEMEPGNLVFVSAKFELASLRHQVPYDDIRVLGTAREPHARAVKSQDGHGRAVAIEVDYSGCDLAIPEPDAAIFVSNSKHILVRLALRDSRNLGLALIVSTSTQYKTSSLAATSACPTPVPERSLDVHTMVEVLEVTRPNDLVYSYFLYD
>ERR1719329_115142
SGIPKGTEADTFERTVESIHTALNHGDTIHHTFSVDAVGNQHDLQTSSPGGQGGCCKLHLINSNGISKPGGGSRPGGTSNPGGKRNNASASTSESLSARVELSSCRDLLAEGQSSSSSSLSSAKYTAVSTACEQTX
>SRR5690606_4275788
YIGVIFNKEVAFELVEPAKPSSIHGRVLVLNQSYEPLTVCSVQRAFVLVYLQKAEIVSSLNGKRLHSVNASYAFPSIVRLSKYRRVPFKEIILSRKNIIRRDGNRCQYCGTTRPPITVDHIIPKSR
>SRR3990172_6323865
VVDMVDGAGVAEPCREGKETGVERPAACRDATMLPAMYFLATLFNGEIPPRAVPNRFQIFCAPAQDLSQKDGWQHDTHSVAKALGRGVWVREVPVASDEDVYIARQQGQGNGHVLLAAHQVALLANEVGGRHRELFVVRAGQEGIEHVRLSGRLEMPPRLYDDLFRQDQVEIVRQRRPHDLVRPARQPDTGDEHVGVQSDTEPTLRHS
>ERR1719186_79813
LILLDSLLQEIFAKSLNRKLNVKRMGDDMEYLTLKVVGTDSNEFHFKLKWVTQLGKLKQSYSERMGVPVSSVRFLFDGQRIGDDDTPKSLKMENNDEIEVFYGKGGPIDRAKTALQDAVQKDNTNVIKFLLKFGANVNAKFDGETPLDLALAAGKIANCKILIEHGAEFGLGCWFGEDYEYLLRYQQSYKKAVKQVTNNEELISENRYTELTCEEIQWLKELKAKKVKEVDSQMISMDHKLDEVTTVNKNKIKVIQNQVDEVKENCDEKITALENEITIARKKLNDLEFEKNAETLNMKTRIKTLEQQEKEIRDSTDKIEFERLVTVATKSKLNKEFKMIDFELKRKGFSESTKRTVTGKTPSKTDGLEFVEHLKQQISSMEQELECPVCLEVSEVPIYTCPSQHHICAKCWSDVKSQDYESGRYPCRRPCPVCREYIQDPPSKHRSLEKMAQQLKQARAKLDKIL
>ERR1719186_361628
TEETLLARRHQSRGKMSKLTDPAALKSSPQVWTLYLVPQDLLTRSLACQVLGRSLPHKTAPAHCPLTLHLVTVQSSPSTSGGGEGDPRGREGRHAGGQTRTGTAGRTRTTTRPTTLPRSWRWTEPASSPRTVWQLX
>SRR5215208_4256899
LCHTVSLHPKTKSLLWQICVRCAIWFCVLSRSDMLVCRRQVSPSTAVSCNRSHELVTDASGLTFGTDVVKRHGSLAHDASCSPMIHRANSGHTASSLDLKAHRGCFAINNRLDPCLLALLLGEPKGADERHRRTAGGVGAADSTCPDPGDHGLPVGSLRVEMADPLLGLVAHPVTVVTHVFGQSPCPAPALGVAYALARLRVYRRLSGELRWDLDQGLGDEDGDGVEVGAVGFEAKALGFEGDRTSPAEGVX
>UPI0003AA342E
MFNSGAETVSGAYIELRVDGELVNSWNVTLAEGGLRELEYDYIWAEHNPTVMGYADPGKVIDELDESNNYKSIWVAIAAPRHDVQLGAISHSGGQWVELTVELQNLLGEVPHYRLSLFVDNATAPEYQDPNQVQELYYVEGFNLAYNESRVVSIWWYNTVGFGWHNLSVEVEVVDHSYPDLNLSDNRNSTSFYLKQIFYQLSLEIEPLPEKIRLNETVRVIVHAFNFGPEILSEGAEVVITGNGTQCEPGLQRTRELDRATGEDTLEFFCTPNSTGPYVIEARIDPDNIHDEPNEDDNFATGVVNVTNEEFTPVTPPVISDDSFITQPIVWVPLATLAIIGAGMFAYYRLRGDDDFLPGTRGRQSGGSAPEQASGSATFRYDAESGITYDANTGEVIGEKKKDX
>ERR1712099_209071
ILLCAGEEHISSGNRSISMERKRKGGSGEHTHTTEEGNYYANTSAVFNFFLFLSFFTVGARKERESISLHYHVSFRLSLNLYLLRSSEIRYGHLLIFIYTYPPGQPEFERHSIKYHQKYKKNKKKKKKKKKKKKKKKKKKKSKTKKKKKKKKKKKKKKKKETH
>SRR5437762_3435613
GQRTGVRDVDEPGRWRSGEVWELGQRAGRRVELVDQRVQAGQRRGQLSTQISALRKLIVDRLDREQKLGLLSEAEVLAREGEAVPVAVRDAGVGVGRAAARLRRGKAAADGEVAARVAKTSIQGRLGDRRGAHGERGVGEGLEVLR
>SRR5579883_1301911
PDLPRYGEFHAAVGRAVMLAAAYAGGWIMSAAIAESYMEEGVVGLEPRIVRIESNVANLNEKVGRVETRVDTLDAKVDRLDESVRSIDRGVAVLEANTENIKENVATLQIDMREMDAKLDRRFDSIDRKFESLDRKFDSMDRKFDSIDGRFDSIHQELRGVTRTLMGIVITFFTTLIGFGAAILGVLAKG
>SRR5438034_829519
RPDWQSGQPGRITNPSYTIGTSAPVLENTAVPKQGEIDYVSRLTPDELRFALDKPFSDAECGRYLMELGALMYLLPAPPARLLDLGCGTGWTSCFFARRGYDVVGQDIAPAMVSQAQLNKERYGVPNANFVDCDYEGLPFRDEFDCALFYDSLHHAVSEEQALRGVYRALKPGAVCVTSEPGVGHARRQSSLDAMRKFNVTERDMPPTRIIRVARRIGFRRFRLYPHMKPFGMLLYGKSESGILAKLRWLPYWVRSLALMFYASFYKRFNGLVVLEKX
>ERR1719411_249020
KSTVYIKPTISNSFEHEPNHHPHSPSASYSFSETNNSSTNPDFPLIEPQYGHFAHLKQRHNRPQSTPQKLVQFKAFKFDENAYDVTANSQSIHSPQFIQANTPNTITPIQTPSNQQQQQQTQNERFQQLIPNDSTTVMTPTPSPAPSINIPPVINLDLIDLGSVNKSTARDNGGHKF
>SRR5262245_60002328
TRLFQGFLSTLLERSDGWQAHGSAWEEALLSFGNRSQPSGRRRCHWRKEPSRYRPARSTQRLVFEDKKSCWEKPICSIQPALRLPPRGRLPRITSEPACIAQSPAAFAQRKPNCKRPASTQSPAPKPNVSSSALRMPLRGLRRLRH
>SRR5438132_1115162
SRNLYRAEASRGTGFPPYASDFAEAPSLARVYAQERGRVMGGELAELAARVRVGDRHGAVFRHRVEATAIRAARNAGDGPAGGDDRQIEDAERAPRVEVKHVDEGPAVGVVVEAEVPLPIAARDRRLVDAVHDAVDARLGVVAICLRGELHVDDQRLRELRGWDVVDPDAIGVGGVHADQRLRGLRSDPLDQIQGGSVVADRVIGEGTRDVDVGGDLEETRVHDGESASLAGRSDEHKPPAVRRESGGSRTVLVGERESAWKLNARDRPPGLRLDQLQCGRGCAVERVVPGSVWSRDGAAKGAQEITLRVADLDVTGGSDDELVAGRRRGRGLARPSARGEEQAGRGX
>SRR3990172_10122028
APRPSRARGDPRSLAPGPRGGVARAGGCAPRAGDRGGARAGHPARPPDALGECHPPADAVVLLAADPRSAGGARDRRHPRAGAPAGLRPRAALLGPRRRPSPRPRRLAALAANPLARAPRRDGRGGCRDGADVADGRGLTPAPVTGCWWGVAE
>SRR5262245_24698148
ADLVVPLLQPGIEHVARQPGHIRGLEHLDGHLDAAARSEEQQTQEELEESPEDYTAKPRGRVGLSVSERAAPQTAGSHQDDTGFGDSLEDVGSSAGWSESLDAVALDVPRRPQNECASLLEAILDRVNRCLDLRA
>SRR5579863_8325721
ALPADSPRIARQRLEQLVHRGKPLFRTRAETAEQDLAQPPRYLRVLRHRLDPSADHGVADLEKAIALEGTFPVERLVQRHAKTELIRALVGLKTAVLLGRHVVRGAEDGASL
>SRR5216684_4526886
LSRGDIGDATGAAAAALRAAIGGARLRERRPEILGRRDGLIDVFLLRGVEAHQSFDRLDQSLGIANEIAIDLLRRHVLGNAGEEASEMQDLAVRPAHGGEAVALSQDFGELWIDIALVVALVRNYLLLNHPVCLGDQRGRALGGGVVERIDERSPPGPAAASRRSPPTWPGSKAPCRRRCFRSRSAVPVARSX
>SRR5262245_20684417
IALPEPLPGLIRRVRAPAPVLGALGLDEEGDDLGVTGLDSPLEPRGDLLDVARGQLVGKIHVEGGDDLTRPQVHAEHRGRGLDAGLLARDAGHGRHGLRRRALADEEGLALAGEEQRHPTQQEADRDGGEAVQNRQVQPGGGDGAGERDEQTEHRRGVLEEHDESRRILALSNGLVVPLCALGRAELSKGDPPGAALEEHRETDHRVVHHGTGHRARAEHVHEALVERDAGSQGEDQQRDDEAREIELTAVAEWVSRIRRPGGAAKTVEEQRLVGRVDERVHPFADHDRAAREAARGELRGGHEQIAEQGRVDHLPRCAARHGARPARHRPRAYQRGASDRAAFRYTAGVTKLGVLALLALLAVSPLVALLPYDTGSIRLLGVSLGWWYAVAVAPVVAVLVAALSAPRRSPSPPAX
>SRR6218665_887351
RHNRHNRHNRHNRHNRHNRHNRHNRHNRHNRHNRHNRHNRHNRHNTNSSYRQNAHDPETSAWISRCNSVGPHIRLLDGSALNPDRTTWGPSLGGGPQSGLVNLHRCSAPASPGQSSTLAGQPTPIQDKVRNTYPAGRGCRWISGCQRHGQQHLPRRTIYPNTTHNPPSTPPLTPPNNLRRHETESTLQRAEDPRPLGVLGQSVGERGVGRRLSFWVVSHVIYREAFFWSTVTX
>SRR6266516_6846987
LAGWPPGRPGLAATATWASAAFEFGGQSRNSAGVAAAEQPGSWRDWLVVRPFQVDVRLSEPLGDLDGMRSLPVRRDQVQAWHQSLARVVHFEQRDSPALAGLDAVQTMSEQALTDAARVYAEASRQLGDGDARGKDGRVLGGGSRQRVVGSQIACGKVGEVHASLFEECDLGLRQLRSRVGGGALRQDVLNGLHDQLLKVGQGQVETRTPK
>SRR5450432_930278
VVRKSLVACLGALLVLQACGSSSNSGSAGSMAGSPATGGASGAAGASAAAAGGSSGSPAASGSGGLAASGSGGLAASGSGGSAGSGGSAGSGGSEPAPPWDSSLRARATAGMVPLATWYSADTGLWNKTDWWTSANQLETVIDYTREVGDPKYNDEIDNTFVKNSGNDFDQFGFYDDDGWWALAWIKAYDLSHQQKYLDMAKVIFQRMTGGWDDKCGGGIYWASAKAGSNGLMNKNAIPNSLFMQVAAKLHQRTPGDTGPGSFLDWAQREWTWFKGTGMLTAKHQVVDGLDGLTTCKAGGPIFTYNNGVLVGALVDLGVGTGDATLIDEASAIASATMTLMNDGKGTLKEAPCGGDICTQFKGVFMRNLAALYRARPAADLQAYAGHQSDQLWTANRNAQDQFGYEWYVPFDKADASRQSSALDALVAAVMTANLNLALVGSTATGSAPCSAAGAASNAIDGSSRWDSKWCAGGMGGQTLVVDLGATRKIVGFRVRHAGAGGESSGWNTRDFELETSADGQTWTRVVSVTGNTADVTTHGIPPVMARDVRFHVTAAQTATDNLAARIYELEIFGTGLX
>SRR5512147_282644
GGEISHMLRETVVSAVVSSGLRQATFAFCPYLLPDCGAVIVFGRHLRQQAIAKPKRRVGEAAQSESIDQFLIDRRPCDNNLRTARSQTFHQTTLSKVAFREFCIHLGQGLSRDKALASGAIHIFRKRRQRCRCSRCRDHPLRSALSHALFKLAYLFPDELPHPLEFLRFGRIALDEVLGETNRSKGK
>SRR3972149_3229708
PQNLDALYPPRRFAEPFTGTPCTPLKHGDGARRRMDRRGTNAAGDGNRRVHTPSVQIRVYGVGHVARRRKEASNVVAYTARSYYGHAPSHIDAPRQHVEIGDGGRMIDAGDVRGSREGPGGYHYGIVPVTQHLLGTHSRVETDIDTMQFELCSVITQHFAKLRLSRDAQRKIDLSADLAACFVKRDAMPPQSGIDCHRQSGRSRAHDSNATRDPPRSKRKSRFPAGAGIHEATGRFISENVVETGLIAGNAGIDLRCATRRAF
>SRR3954451_16501819
WCGAGRSADRRSPPATNPPGPGRRGTPVRRPRALARLESAGRSARLRRVGGVAVGGRVDRGCVGRLVRLSWRRRPGATFRREAGGRAPGRLGPAGQLGQPGLQHLGHGQPVAVRGLVVQQGLDAARVQGPYPLAQRGDRKVVVVRQGELVVAGHAGSLPRPATAEPFPRDSSGRCRGVTDRNRLVLAATASEAPRRCRMTSPTGSPRWYWVTPSTAWSSSTASSSTAARLRSSPTATRVAPTVPX
>SRR3989442_4700027
SVCRRQGRGLTSHASKDTAANENPLVVEYCHLGGALDAGLVRGTPLLNLRNEKAAPDGQVQRRSQIFCNRISGNAEPGAQYPAVADKVIHNAPDRARGNGETYADVSPADGEYRSVDPDHFTGAVEQRSPRISGIDGRVRLNDVIDQFPALSLNRSPX
>SRR5215472_13468930
CEKGMQWTFFGQEKTLSLSGLFRNLIPENECRFLSDKRPAHAFYEFKTPATIAAVEESMNKLRRLPFLILLAPVRSSICLGAKALCRNELQNKRSLRPALIHGHNTTKNCVNPRSMVKARSDCAPVAAARSFDSEKNRGSK
>ERR1719158_407498
DDLSNHPLSSSRVSKYFIKFFSIKYKFYTSVCVCANYSTIRSNAPAVTCPNKTLNARTIATTSGDAVFIWIRTADIRTAEIRTSDIRTLEIRTAEITTAEIRTAEIRTAITPVSSEEYRPAVTRRGWIYGSTVATMPGRFTVX
>SRR5262245_10967354
DATTSSIGSLAGSNGAATVSGTGSKWTVAGGFTAGDSGNASLTIQNGGLLTATSSIVGNLLGSSGTATVSGTGALWSTSGALTVGNLGTGSLSIQNGGIVSAVSSTIGNAAVSNSTATVTGAGSQWSITGALVAGNQGVANLTIQNGGLVSTASSTMGSVAGSSGTATVTGVGSKWSTTGDFTVGDSGSATLSILNQWTFSVGNTLLIGNQGTVNLDGGTLRLGFAFGLIHLNYTSGTIQLAGNSTTGNTDVVGQIFGLSPVIPANKTLAVEGNLTVQNFSPLTIMNQGSVNVGGSLTLLGNSTVNLYGGTLRFSSYAKDPTATFNYLAGTIQLASDRSIGTDAAIQSLFGSSPTIPAGKGLTVEGTATLLTPVALNGGTLTVGDIINPGLLNFQSGMFRLTTANLQVSGGQFGSTLNVASGQNYLIDHTTNLSIDALLSISSGASFASAQTNNSGEIA
>SRR6266481_4594428
DFQHALGTAAIGGTVSRAAVDPARLRLWSVGAASRPAGSADDFQHALGTAAIGGTVSRAAVDPARLRLWSVGAASRPAGSADDFQHALGTAAIGGTVSRAAVDPARLRLWSVGAASRPAGSADDFQHALGTAAIGGTVSRAAVDPARLRLWSVGAASRTAGSADDFQHALGTASRAAAGTTGAVWQHSWRHRSAARRRHWWCLGAASAGATAGRPRRAVQPPAAVCSRATVDPARLRLRSVGAA
>SRR6185312_13763440
HFYEKKGLITSRRTSGNQRRYRRDTLRRVALVRIGQRVGIPLAEIAEVLATLPEGRTPNRRDWQELSARWQERLDDRIRDLQHLRDDFDDCIGAGCSPRPADRHPTARRSAQSAPVTAPPSGSADSARRTTPVTAGSVGSAEWVTRAPGHSACSWTWTVPANRAATSGGVTVSSSAVHTANQGSASPTRSRASSVISALPGASCRQAAGQASGATTDAVAARDVPARGAPRVTTRRALAAPSSRATH
>SRR4029453_7084716
XRESAPCPTGSRPRTTLEMLAPLVGVLEQRRVDRHGKWPCAHPSSFSLSLLASRSWGVVGAMAERRPASPAREPGRVAARPGTTATRTPADGGQPVSKATAARVRHPSWRDGRDQPPHPATSVQPPVSVPPASAGGTFLRVLNGWPRVDGVQGRGPAIAGTAGP
>SRR6266850_5569252
RRGQAAEKSGALQYCLCGQSHDGIPPAKHCEQCTSCVVLLTEPHSECAHDALDGEVAVNTQSVKESIMSITKVFRTNAIGVAWVILASGPMTWLANAAQAGESLPHKVVSFKDLNLSSTEGAGVAYRRIKSAADEVCGKRDRFELSQSHAIQTCINQAVSRAVAQVNSPMLTSLYNAKTGKADKQTTTLAQTHX
>ERR1700690_1151612
HHLVIHKTEGELPAFLKDLVQKLIALLDGPLHALMLDREHDRGLDGHVQGASEPQPLRLELFAIQHGKNALSARGNGALDKYGSACALRQRDHSYPASGSNLGNSAVRAKNSGSPGNPAEWNGGRRSATAWPSPTAFPQASFAAKAPASRPKYGSSAGPHAGRGRTSGMPWAGPSPRSVRLRTWFPELFPPWSCPSSPPCASX
>SRR2546430_15524557
IYTLSPHDALPISVERLHGARHAVTVWKIEPPASKLPNRSGVPAEATGGSSIAPPAERSPGRYVKSPIPTPLATVEPFASFRGSARPVGRPPWLFAAARCPWVTFPVVFTRCLNGSGPDRSSAMX
>SRR5687767_7487181
EPGPDLALEQRLRTASPYIEWSLEQTWDYWQLDIQSSRPGSDPAQRTNYIAQLNTQLRSAQVIRAVHAQNQLQEVMTWFWMNHFNVNLPDDIVRFTIHDYERQLRRHALGKFKDLLSASAHHPAMMVYLDNNLSTVSRYDNRGRLLSGLNENYGRELMELHTL
>SRR3546814_18830037
FLFVYIMVLHYLCFFFLVVGRIPGSPRTDTLFPDTTLFRSWGLRRGYPRRPFQRLGRRSAPVRRRRANGDGSAVPTAMRPPDRNCLRCLAGGSGRSSHRASGRIAGLATPDRSRRRPEPSQATPKAAPRRTPPPCGGYRHRTRRDRKSTRLNSSHX
>SRR6185312_7772205
RRTSMPLSLPDYDTLWQQIVAFFRNRFTGKDDHAESFIGKLARSVGMAIYGLLQAVAAVDADSPPSESTSSQGLRDWAFVFGVPADTDGDYGPKGPSLATGGQGDCTGTLGTVFADGLLLTAPDGQTSIKLSGAVSIPGTPPGAGSVLGSFVAVTPGSSGNLAAGTVLAWESPPSGADSTVTLKAPLRGALDAESDPSLLGRTRQRMQTPPKGGTAADFRFWAESVPGVFRAYVYPLRGGMDSVHTVVTTAGSGLARVPSDAVRSAVDVEVAADRSVTVEGYKTLVPRMVAPGMALRLRVAPYPKFGFHWSSAGASYTVTAYAPPGSAVATLX
>ERR550525_1171417
EKSSLFVHQCSQCSQNGFCRKCWIQFVRLQKDDDDEKSHPVSQQKTGNSKQNAVDLTSVSDEEIDDGNDESSPTFPRRKRKRPMNGQDTQERNAKKAKRTVNVDCNTQSNGDGNNSGATPIMPLVHTERGIDKSNGLNETEHSNDRK
>SRR5690242_17665658
RLLRHARGNLAAGSPGAQARRPRPVALSGAMARMSFANVVVWIGALAACGDNLGPVEETVDAGVTLERAFRGEDLPGCTLASPVLVDVAGDLRIVAATSEGRIAAYGRDGSARWSFDLPRAEGERAEVASTPVVVGTRVVVVWQAFAADGARIS
>ERR1700687_127959
RIAPPDEEQAFRLQPCGAMQQRGFERLAGHFAAGDYVLGGFAHGGIGALDGRCRLIFFASVFFATVEHHYDEAIGFQLRRDGGREVCIHDGVSSVSTVEGGTRNSAADVCRAKSLSPGRRLDAGTTGSCRAALGLGGEGARPHTSRVQQRWIHSTLVFFPGRWPPALPCRRCDGARSRACPIAVCPSPARVRLX
>SRR5256885_2151122
NSILKKEQIGIHICDRTPMDPIAFNEDSEVSAKAKFITERLSPGKSRRKAQQGQVILLTGAPEELETRVVGRHKQSPAALIGDLQKRLQRIFAGAIRPSVVDTFGLSIPQVIKRVARIVLLEEYCPSDLATRLKELEKVGFFPPETPTX
>SRR5205085_4486535
CRTRTRSLAEGGRGWRCGYAVGLYLDRSCGRRSCRDVRCILASAEPGQAKTPSWTKRAASHAGKRHRGARSWLSLKNVGMCLTCPRVPVASGAVRSRSYDPANPRAGEEAPNRDGEARGRGAIADRRGRRVVRVPRGDPRAARRSVSGGRALGVGPPPAAHARDQGATREASPGGRLVAAWRADGLEPANGSFAERTRSRIRNSPFHRPPRYWNEIEQLARERPHAEAGAEGGRDLRQPLARVDLEAVRLLEPQDEPKLVQREHRQVDARQEHRGTDDPVLARERRDEPLADRAA
>SRR6266545_2846328
WRSRARAPACAGRRARRTRAAGRQRGAEADRKGGPGDSIDRPGSRAAHRRRSVLAARRRPPAPGRTDRRAPRPAGTGGRSRGHDPSRGPGPPHGWQGAGDRASRHRVARRGEGSPGRLRGGLRPAQRDPGAQVLVARRPDRARPRAPGPGRRRRQRRVRFDRPDRHAGGEPRRSPRGSARLRRAAGSRHRRAPPEEDPRPMRPWRRAGPVLALAAALLALARAAGWAGPPPGAAAADLLVEAGAALGAGEHERAAALAGRVAHDPRPIARQDRAEAWRILGLAEYALGRRDRAESSFYAYLKLDPDAHLDPALVAPEVLSVFEDVRARHAAELAALRPRPQRRRSFWLNFVPLAGQWQNGEHRKMWVMGSAGALLLGANITSYALLRSWCGNSGASATCDDPDGTNSRAESARTMQVVNIASGVGFIAL
>SRR3990172_1023493
DLDDLGRTSGRCEMSARGAAACAFLLASTVALAQSPRVLRLEGGAAQIRQKERTARAAGVFGGLWRVEGPRLASLASAAFTWAGDSATAAQGIVAAAWRPTVESAWHTEGGVTASAFGVYALGRGGNRSAYARERVVLDDGGFWAGGAAGHTTRDGRSWHSTVVDVGAFLRSGGLETSVAFARLRTNDWPLMQASGIFLETDAAAHDLDDVTLAMRYARGALALDASHTWRGGARKTLARQTAFLWSAAYELSPRYAVIVGGGRQLADAVRGVPDAMVASAVLRVVLFPWRADAAERATARSSARVEQTAEGAVLVVRVAVNDSARVEVAGSFSGWEPVPLQRTSEGWEARVPLGPGTHRVAVRLGGGPWRAPRNLGKVRDEYGGEAGIVVVPX
>SRR5438132_1110025
VRGHDVTRVSAGAVLGANIRALRAQQGLSLSELARQSGIAKGTLSQLENGQGNPTIETVFSLSNALNVPVSSLLAEVPEPSVMVVRSAGLDVLSGTAVDLRLLRRMDVTDTVLELYDQRVRPGQVQQSAGQPGVERGRAAGHRAGPRRARLRHHRGRRGQCAALGQGARAGARPGHGVAAALAGADRRARAGSGVGAQGRAGRVHCGPRAAARVRR
>SRR5581483_1731585
VRAPADGTVAVAIDHLDDNAVGESDFYNLAGNQVVIDTGSNRFVLLAHLQKGSVLVTTGEVVHAGQPVARCGNSGKTTGPHLFLQVQDQPRFGASGVKTFPIRFRDVTCLRSGHPRTDAPFFVRRNDRIVMDPPAPVKSDTIGQTWFPNGDTIELLSVERNDDQIVARGRYHLASHDHATLGLYITSTNISRVHEGREQTMVIGRGDGSFQLIHPHPVPGMPHVTMYADGKGIATVYFGTEDEAARSKKMHLQPLASTETWTPAFATGETPDMSKILEQAQKL
>SRR6266496_2749558
ELGGLLGLRPSCPPPYRRGTDASPHRSRWRCPEAVDLWQVSGLPMPGPDGCPTDRERSGIGVANAGPLVDAKRDALDQAHRAPRPPGHPPLVVVSERLRMLLHSDEIPVIAQPLDDLPGGRDVAAVRRYVASQAERRDESMSASVGRVLTDLLAKDEARDLNVKVX
>ERR1017187_5553991
RRRNSGPARACPAMCCGARLGTGWRSVGRVEAVDVIQVLDALDEAGVRHWAGGGWGVAALAGRQTRPHRDLDLAVDARDLGSCLTALGRLGYAAETDWLPARIELRSPGDRWVDVHPVAFGEGGHGRQADLDGGSFDYPPDAFSHGLIAGRSVPCLSAGQQRRFRAGYEHRPQDVHDLAQLDALRESATHGPDSWPLTNLRSYPLRISECPVCTGSSGSGPGPATVQFVPARVPAAGVTRRRWSIKGLRCGSRSEEHTS
>A0A2G9SB67_LITCT
SNKVPVVQPSHAVHPLTPLITYSDEHFAPGAHPSHIPSDVCSKQGMNCNSKYEKTLSCILLGEDALHYVDALQNTKHSVTKQEERKSEQKTRSALTDLLYFFILLRYSHHMVPGPPGPHTTGIPHPAIVNPQVKQEHHHNDNDLMHVKPHHEQRKEQEPKRPHIKKPLNAFMLYMKEMRANVVAECTLKESAAINQILGRRIFASQSGTIILHRNLAFYIAGSAPVHCDARREQSLAQRGFGQRTEPSDRGTLQDPGDKWHALSREEQAKYYELARKERQLHMQLYPGWSARDNYRHAASIPGKFEAHVDVESLFSQGKKKKRKREKLQESTSVASRSVQWNRSNRSDASRSDLEERFLYYFGGDLHRLLYRSRLASRHGSRVQVTSVRRPASRAASNVNRR
>ERR1739844_819532
MGEEYMEDHRGNIDLELLQEEITAQICLRILERSCNTNEAIDRMCLEDEDGDGELLPESGGKMMTKRRRKQRNAERDLTRIKVKLDRDIEELLGTNKHLINNVGLGVWDILSQMTIPTLSSQANVRALDLRGGAYDSS
>SRR4029434_248713
SRSCEERMMGWEGREEKVRGGEVWGGQGERGGERRRGVGVCSEGNLSGQRRCEKTGSQWCSVMFTPHIHTHTRTHAHRHTCTRTRIRNTHTHTCTLRSPLQSRQTVTRATNKSAANTEVELSVTYQHTPTHSTGQTICCHT
>SRR5207248_268926
ISLDAGAHVEVAIVKQRPAAVRALQAAKINADLALKLGIDGLGEIVPHQHIFTRYRGIGFQLEYPMAVGLLPLEKGTGGALNVLFEGGNAAIVHRSRDHFVYEGRLSPRAVVPAERRSLRKQAWAREPGPIP
>SRR2546428_1292487
GRVHAGRFQLAANSLDSQRMTPKPRAFPLLLSLVLAMFAPQQTRAGEPHRLQVKPEQQILTAQEYFAAVLKLPDSHGTPLRNRVKPAGARDEFGELSDYEEVIVFKQLAAGYRAGIPVERVQRWISAYDAGRSHDNIFRRLASLATRPGLIDCLHNIEGRKDSLGRNVSPHMAFRYCAAGAQPDEITAQSLEGRALVILSYSDFNGALEVQQFARLLDNVRLSYRLSFALARTPADVHAAVAKHRNGPRIIAGHPVRGGIELMRESPDGILSSVAAQTLVEHLGGEALVVYSCRGGERFAPALAAGGARGRGRPRGRSAPHAGGHAERAPYTERRTPLPRRKG
>SRR3954454_11295577
LAMLTPVVFGFLSKQQESMDLNADGLANLLVGQKDNIKAAMPAGLEAALSSALPGGGQVLGGNGPTEPELAQVEGKSAASANRTADWHSRAVYSKPHRDAGKRLSVPVLLVLGALAVGILWARHQHNRQNDPPSVGAPAASPSETVTGSSSSVVPNMTRLINQASGTLAGIKDPASAEAATLRLRQINQQISGLRSSWSRLPESARSAASTALEPQIVKLKE
>SRR5207245_10474605
FFPAGCGPAPYADERMPGDSLHNAEQGRWAVYAAVLLEPRAKVRDPERVAVGQRDDRHENVGVWQVLLGRREMFRSRGSGNREAPAVGVQDAAEHRRAIGPWQTHPVNGPRVADQR
>SRR6266480_972767
DVVARQDHEELRPGGAQDVEILVNRIGRAAVPGRLVEPLLRRQQIEKFVHLGAQKRPAHLQMPQQAVRFVLGEDSDATDVRIEAIRQRKIYDAELAAEKHGGLGAAVRQLFEPTAAAARQHQRERTPRQPFLDPRRGQHGGVPPTTRLTQSGPRGEPIRKGKANEAKNWAYKMNRDRSAFLASSPTRSRTX
>SRR4051812_21032643
XMKKVMVTSCSHSHGWRSVRVTTSQMTVTVNPEMAMPHSTISASSSGSSARHFRWRWVCWTSEGMAPALLDVAHHVQDLDGVGTEVLGELVLDGFAHGLEAGLVDRGDDLDADLLQARARVTLHLEGLGRLHLVHVVGGL
>SRR5579875_2506212
PNPLVPRGSRVSEPASTPVVVHSRRPSPLFPGRTRAATQTNWAPRAATSASWPSTKSRLAWSSPCLPDQRAENTPGMPCSASTHRPESSATAGSPVYDAIARALSSALSANVRPVSGTSGAPGNESRPATPSANPAADRIRESSAILLRFRVASTRRGPAGSAIEGFGLPPGQLRTPGCRQVEQRRQHRPAERLAFGRALDLHKVPGPGADHVHVGLRHRVLLIAQVAPGLAVHDPDAHRRHRSDQRGPLAPPAGLQPCDGIRQRHIPAGHRGGAGAAVGLQHVAVDDDRILAERLVVHAGTQRAADEAGYLLSPPAEPPLDRLPLAPRVRRAGQHRVLGGHPAEPAPPPPPRHLLGDTRRAQHPRGAELDEHRSLGVVKPPPGKAHRTQRVRRPSIWSCHIAFLIGLIGAGSFPRAGSVYPTGIAPGCGPGTGYGPGTGCGSGAQEPGREPGQAPGAETGARAPGAGPGPARRCCSFMPTAGGCLGCSRARFERIAX
>ERR1719468_912648
AFDEFLIVSVNFIEKFTVKLFFNRENVTEFRSMAAHIFAIFVFFRSSFSIFSLPDFSQQGGFEGWNSRDRLFWVGNALETANLGNICNHWRAEVPPVCRLGTSFLQNLICRAGEDPLGSGSFESIALIRSFIANAGEIAVDLLTNLFNGIFRGSASDSSESFAKRTKTVFTRNRLFGRDRFASSWIFLQKQIGCFAVLDNRANGEFIRESVNWSFWPNX
>ERR1017187_631561
LRPRPDRRQEAADQHGSGIEGASKPRRQHQTRRGQEVLPPRYALAWQKRLQGRSDELQLRALVRTQCGRDQPKARRGPGGAGQARWTGDKVAMTAASQGPDDVGPSVSSSSPGNGFTSTKIGARLGRYEIVGTLGHGAMATVFRARDTQLGRDVAIKVMSMVHAARGGAGERFRREAHAVAALKHPAIVEIYDFVSATENEPSYIVVELIPGPTLRTMLEERGGRFLPEIAALIALPLAEALAAAHDHGVIHRDVKTDNVMIQTSGQSSRVVLTDFGVAHITGMETMTATGALVGSPAYMSPEQSRGHEVTAAADLWTFGAMLYELVTGVVPFSGKDPFTMIAAIVRGTFRRPSQVVATVGPDFEAMIMRCLKASPAERYPSASALATDLREFTRTAGLVPEAKGLRGFLDEPDAMLADLRPRVADMAVERARQFARRGQLARALAEIGHATASVPSHTGADKLLRRLSASRIAIKIAVVAAGLLAALGIVLAAKPLLTPHVPAPVAPIASPVASPIASPAGTTPAPVRKVQAVAPPT
>SRR5699024_12213394
XHYSAASALSPLSLHDALPILPHFAGAFVLRAPNVYGDSLRFGRGGERTADFELYTAAGDRRVRSDERKLVYIQHGIRRGGNGGEDRKSTRLNSSHVSISYAVFX
>SRR6266508_47967
RGSDPGAFDIELGPVAEREVEHVPRTADVISAVEQRAQSVQGDPAADLQRRGTAGDPGTADEPASPFEARRPSYRTGLVAGHRRTPDDVLGTVAERLAQDVRARGVAAGQLGAEGAGVRRLGDRVLRTDVPAGDAQLGTLVGQVRPDRERQQVAAVGELDGTAVPVRPPRYVQRRTVQPHLTVVAAGQRTQEGQIALVQLGADPARGAIEVDRRGQPVLAGQLVGDIRGRRVVESTGTPGQPQVLQPVLGEDQHLRLLGGRVVGLDRADPSLEDPPAAVLRAERDGERGTEVEDVAAEVEIAGGVVAEPVVVQPRLAPAHPDRRLLHGQGKEVARRLGVGCAGDGEDGSGYERGHSHGVLNQRSGAVGVRRSRVAAGAVARGWVRYGRGPQEYRTPAVARAVPAPRSRX
>SRR5215831_1420303
RMRVSVRRVKARPGIRCCAGEESVRIGGPVAHGGRTGARPRLEQSLANSGGPIEIHTFREVGQFQVVIAVFYGDGIGIRPIGVAAVSHSIKSVAPNVDGFGRLMRPDNFPRRAVHDIWPALARDQVSLTSPHLVDARIARGIRVTVPRGRGPAKRGTAIAPAVWGGRLRISDVVGSHRIFMNELHKSRNGVAPPQTCARFQLHNESEIIVAGPGAVRKRVVVNLHGSAAAMDVRSQPVGLQPGVSSDVIVAEHKARSGNAIERPAVSRKSVVFGKHEVVSPKIRAVCPRRIAVAIGVALAVPTRRGKLYKEQISSLVEKIVVNYAVEPALSLESVRTVSSD
>SRR5690606_9332282
RQMADSSSSLVPATKQKSFNRWEERRVGKECKAMFTVYALYSEKYNKIYIVVTSNIQQRMLSHNHLGKKGWTVRFRPWVIVYTEEFQDKQLALKREKQLKTAKGREFIREIIAAGSYPPDGGQQFESGPRYX
>SRR5688572_13872492
PAGGRANGQVRLRDGVPPMVAAVLRTATARRPADRYPDGAAFGAALDRAVGRRPVSPAGARRVARFRRVAALVAVPSAVVWASAASTSAGGRARGVPGSVTDRSGQFTVALPDGWQAWRARLTDTPRLAERSPAAMLITPSLGGWQSDPAVPGAFVLFTRG
>SRR5581483_4009571
RVREEVARAYVRRELVVPELDGGDRRAPDRLASRELAASLREVDAEAGPLGDDHVDLAVAVHVAEELLPADLVVGGAPEERLAGYDLLRRDLEVGLAGRALGRVERVGPDAVVADEDDLLRLPGREDVAHVHDHGARVDLEAEVGLLPERARGALEEDPHLAAEEEDQVLQSVAVQVLEQDLX
>SRR4051794_2395804
RHGSDRELQERECRRVVPCSPHRDRPYLRLCRSSGRASRRSPEAEALLHRPSDRRLEDGRHIQSTCRTWRFARSQSCHRICLCLNNQSRGISLSFSSLSRVWRDAQFFSGAGMKKISRTSMGKRHALTPLRAHAITSSTSAHSSIHKPPTCSLVSRYGPSVTSNSPLGCGRSVFVGPRPPANFLTPAAIISRLSAWISSIIASSWVDGSKLSGRX
>GraSoiStandDraft_16_1057320.scaffolds.fasta_scaffold8539811_1
RQRHPRLRARQHLEPQRRGEVGLDGVQPEPIAQPHRRPVHKPLTGLRDLALERALGLAAGAQGQRRQEAAHLQAARAEHAQLGQAQVHRADVAQGDLHGERPLRHQPLAARRARQPPHELQVAPPQERRARRELQVAAKEQRRRAQARGGQRPAAAAHPDDQKDQAQREQVAAAHGQGRLFAAPGRQALASFIRLDRLARPRPLARADGDLGERLGDDAGGAHAFHLGLGDEQQAVGDDVRGERLDIVGQHEVAPLQQRPRPPRVQERQRGARRGPERDPPVPPGEVDELHHIVEDLLVDVHARRHAAQLEDRLRRQHRLQLRPRLRVGAQHLLLGPELGIRHVQLHEEAVKLRLGQRVGALVLDGVLGRQDHERLWQRPRLALERDLALLHRLEQRRLRLGRGAVDLVAEDDLGEDRPLAQDKVPRRLIEDVGAGDVRRQQVGRELDAAELAADHQRERLGQGGLGDPRHPFQEHVAAAEQADEQPLHQTRVTDKYLADLLDHRLAEVLGLHQALRVX
>A0A0C3LW61_9HOMO
MKYSIAYFDGYKRHVLPKGKSETMWLGRPGIPKGLQAGLFHLKEGQSGTWTCNAEDGFERDIDLVDHGKQFKIPAKTQLDFEVDLESVIVGAASN
>A0A1I2KW36_9BACI
MKRHLTGKRLKYKSMTFIDRFSAVQLDVLKEVGNIGAGHAATALSYLLERKIGMFVPSVQLADFDEVVELSGSAEEVVVSVFLKIEGDAPGGMFFILSPPQAESFVRIMTGDASFTIHNPKSMGIGVSALKELGNILAGSYLTALSDLTQLTLYPSVPSLNIDMAGAILSFGLLELSLVSDQGIVIETCLTDPSNETKESVEGHFFLFPDPDSYDTLFKALGVSAYD
>GraSoiStandDraft_57_1057295.scaffolds.fasta_scaffold1415339_1
MKTYRRTELDRTGLTRIAGCGVGRAAAAMAVITACLAAVGCSTDVNARRTIGAERELPTLAGADATHGINAERATRLDRGDWEPVDFRLPVDGTVHNALLKSEPSFGDEQPRAHGLYPTAESALDLGSDRGAEAWRGVVEPVRSFVDLAIMPVRAFTDPAWGKRQSASNFKRWRSGAWYAGPVPEADSGADEDGG
>SRR5690625_3860754
EVFSHARGNAAFEAASFDGQYKGSLDLFTGSDTERADDALRRIISKVRVGEVDVPEMRIGHSILFRPEMVLPACVIASILDTHSFGGLRNFAIAGSAGGAIRRVVRQVKLHHAAPDGLDPLAAGGNLQALCYGSGTGGWRPASPRDLHQAKPAGAECLHHVVCTKLGNFNSSQACRAHDRGAFRHADLFSIDRELDELVRFCSGGAVVGFFHERHLFSPAPGX
>SRR5689334_12383051
ELQRERHPRHRDVCRRGSRFPASRRQRCHNCVLDRFRQSPEDLESRPVLRGLHIYQLPDGSGLCRYRDLHQRVRRRRIELCIVQRLDPPLHVPHPGSLGNPGIRKPQLLGHPDVHLDRPVEIHSKNESPMHTLDHVQRRRKLTFLGALLAALLAAGTASAQVGLGLIPMREELALGPGAAHSGVLTLNNDSPARVRVVAELLDFFIDSTGTPQFGRQWTQEADYSCRSWLSVNPMEMELEGNSQISVRYTVRTPPAAPARGYHCAVGFSTQPTAGQARGTGLRTAVQIVAAIYVVVGKPAAQGSLKDLTLEYVADARQPGWRAVVVLANPGVMHYRPSGDLDVFDQSGKVVESVKFVPMPVLPGRDQRFLFPLKLASGPGKYTLRARVDLGDSEIQEATALVVAAKDSRX
>ERR1719375_951704
ENAPDGGAHATWSGFSYWWDLLRPDVELHAELRVRVGVRDLPLRTRREGGLPLRPCQLRQDPPRRPPDRLRRLLHRPSCLLLLQSLFFGVTLRVLRGLQLARLFGCGPQVPLEGRRVHLPKQRRVPLVRGRWGRHNPRPFFPLREGDVERPTGPGRGGRPPEAALWSRPGGQPKEGARGHQPASQRQGLVEGEERRAFPDGAPEFGGWRAGCPLGPKVPEEVRERQNGCDLLLIPLPLGIPAELEE
>SRR5690606_30224247
KPLALQWCVDSWGALKERRDLITDAWHKCCVSLFNVMDPAKRIEAVAAVARQELEHTHVPAEIEEQHDSSESDSDDAGGTDGDTEDDDELDVSQPKEFGSRKSQRQRTQATAFGFQLDSSAIALTEDSEHXX
>SRR3954447_19024062
LGAVARQQALEPPRGVEPAEAAAGDDDAPSHASASPIEGRSKLFRKPAPHAPGAAREGVIRNCGEADLVAAEREQQVGDAIGRRQLLVGGRDAEAVDTTLPVEEQDPAGFADQPGPEPAPFQDDAGLALELTRVMTEQVAEKALRDGLRVLAARPFSAQDAGAAECVQLRNDPGMRDARDRHRCGEWLD
>SRR5205085_4690665
RRVGWRERHEEERGDCRPISQGHGHVHGRQGRADVRSERRRPEVQLQGSLTLRARRRSSRLPRASSMFLYGRFAWSSGDDVAADSTRWSAGAGWAALAVALCWCNCADAETEVYLVRGWFGVFSTGMDSIAQKLRAKGIRAEAIMHLSSKSTAAKIIGEREAGRTSRLVLVGHSQGX
>SRR5712692_4144902
RNRKEETGGVQLMDPYRLRPHLDIQRGHKERRTRKVQAWLQSLPSLQKPTDTEHIIRLDPIALFLIFFAVTSFVLVIVLTNTPINIAGPATDLGGIAVNYLLITAPIAGFAPLLVGSYFYDPRQLGPILRPVTFGKKVRRESFPDVAILGIVAALAVVTVIDYAGTYGGFTPTLSFWNTTTNRIVYADGGIFEEF
>SRR5262249_38079830
FADGMFEGVVRAFVPEAQTWADVRENRSYADALAAGVASDEGLMLCAGLFADELAELVGVEATPDQRESAIAVLKGTFQLPLRIYNALMYRILKDGVNVRRPEIANTIWDMQLALTIPISSQMVRTPLWLISGDSAFADAGRAAGVPHVVHRLDDYIALX
>SRR5581483_8213852
ITITYTAMNGHQYSVRKSAPLLITYGFHQQRPWPIIVVLVTRRVLQGMPHHSRQRSVTAFKHQRVAVPPGHGRPRRHLRGSRAHRAGAAAVLLMAAGCALIGCAGSVQGLGSSSHRVDLTGGGNPPRAGNSLPLPEATARRLPAGVFYLLAGPNPLSCNVWEVSRSGKETELTHNRPNFGISSFGASRAGIVMADASTGADELVRLTAHGIVPLPGQHLGSPAINRRGEIAAVRPPGGTGTKAYFYLVVKKSFSAQPHRTYRQHPALGGLAWGPHSS
>SRR5579863_3949436
SDLRDRRPGRGRLAGVDGIHCARADSRLDHLAFLLRRGAQSSTICVSGDAGGVLLLVALAAGRGPSRRGTCGRRRKRDDFHDAPAIGCAMSAHPFRLNSEKLSVALRVSLFVLIAWSGLILFPWLISGVTGDFTGSALSTFAAAAVANAILVRIYEHGQLSAVGLVWQETSTRELFTGMAAAAAGAVAIVAAALILQMAMFESAPRVENAWANLAFLGLVLLFGAAGEEMLFHGYAFQLLVRALGQFATILPVAVLFGLMHLNNRNVTALAVANTMAWGVLLGYAYVRTGALWLSIGLHFGWNAASPLLGVNLSGFTIGVAGYELHWRAGILWSGGGYGLEGSLFTTVIAIALFFVVYRVIPDRDRQVIPERGTX
>SRR5438876_2751381
YRREHHVEDPRRRGGRHLPRAEQHGRRSRVRPAAGTGCAAVRRCGAEGGGGEEAQPSEGVTRMLDIKLIREDPEPFRTALARRGLAERVDELLAADERRRQLTGRVEELRAEQNRASKAIGRASGDEKRTLIGEVAKVSAELKEFEPELAEAETALTL
>SRR5215831_6834791
RFQHGCLAVSIHLFASALNSSTFAGPSFHDGSNPPGCPTLGAAHDLARFGRKAQFPKSSNPTRRSPAVGAFQHPTLTGALLPRSGRPAMRLRALIGRQRRVKKLLLRLSNREIHGAITDLTIPQVLSHRLKKGTASIWLERRTTAHDGIELTVAQFDRRHVAEFRGGQRGYVVGRX
>SRR4051794_29872810
EQVLLQLKLMMETELGITGGISEREVEVLELRRQGKGPAASGYQRTAVQLSPGAPVYLRHVDAAYLADLLNTPGNLPFVMDATGLLVSFDLELGKLPATLAEWNAALKGSGLCLVRGRRELPVFVLRENGGRQLTGSHQSPANS
>ERR1719217_1201603
GRACRWRSWAAWRGVAWRGVAWPSLPLAFLGSVAYIGARVRSMTSSALWSAFTSSRWRSSIVMGESSPEALWLRNPFGSPDAHGTIRHEITLAIMKVVRLDEPVRAAQPMAIARGDVMQGLEQLAPGRTYLLREITLAKGR
>SRR5579884_3263431
XMSKGLILGHTDGKASKLRSFKALFDRSLDDKVACQRFLQAFQRKSAKHLLRLTPAIHTAVFAPSGAGKNVSVVEPFLFTSEESAFVTDIKGENAELTGRFREEVFGHKIMRLDPWHLTTDKPARWNVLDLIKTDDPEALDKARALAEAIVEKNPNDQQPHWPKKAQDFIAGAIAAVTHFCPPELRSLQQVAEILADKTLLAQVIEKMKQSTAHGGLLARKGYEMSASADKELDGILSTANQSLAFLSTPAVMESTKCTSDFDLSALYEGKGATIYTIIPLQYLKSHAALMRLWVTAFTKYVVSRGIKNARPVHVILDECAAVMAGHGDTLDEMLTVGRGFNMKVTAIFQSMAQLKKLFPPGQEGVLLANASLLFFAVNEVEDAKYVASRLGEETIIVQDWGTSDSESEQPSGQGGRSKSYSRSRSLNFRQVGRQLLKPEEVIGLHPRVALTFTPGRPPIWTWLTRYYEKDFGAPTGLSPAKMIFDTACLFLSSAMLAALWTAGLFHHWFQX
>A0A1Q9BUH2_SYMMI
MCAEWEPRWTAQLQAPGQAWQSVLQRAGVQPTPPGDFANVSVEEMRTAISEGAGGAGFDGWTAKELRGXCTSCAWLVDDLVSLFNETLQHQSPEVLQACRDSVFAWRVVGIPKRTEAATRPIAVASSLVRAFNRAILKRCPEPPEGQQCGVSGQSAVTATLQWLAVRAQRGAELDLRRAFDTIDHRLAGCAASTYGVHPVVIRYLQQLVWCAPRSCVVGGEPPPRSIQATCGLPQGDPVSPLFLSFVLGPWFKIVCALPAISAFLYMDDRSLLDSGDRNSLEPALRLTEWHDHTLGLQEHLGKRQQWAIDGSYAARAVEHLGLTATPGVDVLPSTRAGPDDLKALASQLQYLPGAMEMKERLLAAFILPKISWAAPLIPAVEFSIVRSCFRAIRGHVTWWCQGRVWADCINLHPLFAACGCKCGQGLKSPQGYHLQAYGRRXTPKESTTSTSKLKVQLALAPVVIFKDIAYSSAAIPDFDLALPVPLLGSVGSCPGCCPRGSIGER
>ERR1700730_765710
HRLWCDSLHSAVAARGFNRDTTTPDKKTCSALSRSMSQRNGACGRAQLRRNCAYAGRLCRTRSGAWTDHGITDTGGPAIRAPSGMPGPVALSTQARARRSGSGCLEPGAGSALRERNLLFRHLLCNFPAQPARFRVPTQRRHVEPLVGRHEIDGNIASHRIHHAELIEGLGRRRRTPEGCAVDAVHLETSHVSVSQFPAARRCGLRGCTPSPPAETWRISGENLKGGLSKSMNRIX
>SRR6476620_3825097
TERCRSGSARSRGARREHRRRRGGPGCGRHFRRTRRYRAGLHEVDARALPRARGRDAAAPSARRRLDSPFRRRGGGAVSAYPHLFSPLRIGNITVRNRIMQTAHVKLFAYNAVDSQRNVAYQAARAKGGAGLLITGNRVVHPTSTTGFPRVAWAYLSEALDADQKLTDAVHEHGAA
>SRR5438132_6851853
APPSRFFSIRSTMRIWSLLRRGCLETLDDALQQLNLLLLDVQQLDPFLYPQVVDAAVQLFDQHLGLQVGVQVELGLQTVFGRLAILAHHDDGRGVRGLEAQGQVEQDERVWVPRASKNFVDVQHDPGCKQKRLDDDEPPAAHGGRDTV
>SRR4051794_37294934
XMRSCRASSCCVIPRSSRNRRTSNASHSSSEALGSSSSARDIATPRGRVYPCLSDRGFASHGSDAGPCWVAIHPKKEDRRMDATRNVDYSVYLHAHHGATPCARDVLAGKLTEWHMPELIEDGSIIVAELVTNAARLGEVFRMTLRNPGDGMLRIEVEDRSRAIPVRKDPLADLGNDDYDANGGRGLVLVDALADDWGYELLPDGKVVWAVLSKX
>RhiMetStandDraft_4_1073278.scaffolds.fasta_scaffold432969_1
MYRSRFEVFFEDEFEHPFMIMIIMIMIIMIIIIMIIIIIIYRYNNIIHTMWIEDELQKDQTGIQESIQRLTRDYQSQLSRNIRSHLSENREKTTDFLKHFYHKLRNAEYILYHQHAGTGTGTGTGADCENDAYCRLTFNITEIKNSAHDLPHPRILSELQRKYEHNRGIAQPNDNGDNGDTYIPYKVYTYIREKSEFCIQFQATIYGRVITLYFITFPESHISVCNRSSSGSGGSRCAAETAVYQTYAYKAFIWLSIVTSMADKECSEKSLNVYFYMTPFKKQRPKQSASGETDTVLSAIHVNTGLTRNCETHGEIVVYRTEEWFKVFIHESMHNFNMDFIDLDLRAANEQLRRTFCIPHDDILLFETYTEAWARIINTIFNVYFVSAATSATSATSQAHFIRNVREKLTTNALFYAHQAVKVLNIMGLTYGNITIQSPENTEVSRKRYAENTNVYAYYILGGILSVYSLPFISWCCENNRSRVSAIRFSQHPSNLTKFVDFISSAARDPVMLSMVAFIEKAATTTATAATAATAVVTKTMRMTMDX
>SRR5215217_9088951
RRGSDRPVFPPPRRRRRNRRGRWRGCRAPCAAKGEGTRKPSTAPPEGWLKASGNHGRKERRSWAAGLFELGRREGPMGLHDVFRLGVQLLGKRDQQRLVGYDIVEDPGEETRGRGGRADGVGAQAGDRQEPTQALLVARKERKSAECDIFGLLAGNSFX
>SRR5260221_1043445
LHDSTTNRATRLAQTPDDLRGLIKSRLDQWDTLTPGLRREFLDNERTLRYFTHVDATNNPAERHHGPSDDEQARWNSLSENERQKITAQFNQFFELTPDEKQKTLKTLSDAERAQMEKTLQSFDKLPLPQRRECIHAFAKFADMSTQDRAEFLKNAERWSQMLPAERKIWRDLVTNIPQWPPLPTSLIMPPMPPMPIIPNNIRPLVATN
>SRR5215204_1812972
PFALRELVGDTVKSLALRAHAKGLELACRVAPDVPDWVVGDDDRLRQVLVNLLGNAIKFTDRGEVVLSVSRELGNSGDRELGNSGDRELGRSEDRARHQAAGKQPSSVCPEFPNSRT
>A0A0B2WMB5_9HYPO
MDQQLDFSTLNKSLVIKAATLFLMIVGLLACITRISMKWFTVRSLGLDDQLAVGATCLAVAQSIVVVEATSNGLGKHVGGLQAGQIDHVLKSEYAAHVIFIASLTLAKLSAITTLWALAPLYHRRTVVITSSLVVAWTLSSILPALLQCQMPRPWDYISGQCFQRAAFWMYVSVGNIVTDVAIVVIMTTIFVNLQLPLSKKLLVGGIFGSRILVTPAIIGHISTWHEAITNPGDATFRMVMPTILAELVQCLSILTACLPYLKPFLDSFQSGAMVVVDATSQNARSKGSKAGTATSAAYGGNSKNDTSTSNNNNNHINHNNMNNMNNINQHHHSQSHSQSRSHGHSYSNSSGHGRAASGVTTPRGHPDEFELADMPSSKTATTVTANQGMMDAAMEAWDGQSHTSQTVLVQQSWQVDIEHNLPARGNGRRV
>SRR4029453_5233173
DPRPSRTRDRSSLSRSSSHPTGLAGALRSDPWTGRPAMLAKLQLPVVAGRLPGRAGRAAIASTVSAMEPAAVVGQIGVTTIVATRDRTPPGGGSATGWPGPAARLERAAGDLAGGPRSVVAGDQAGLVPGSSVRTVLHGRATERSVIDRLLEGVRAGRGGALVIRGEVGIGKTTLLDYAAVAAGTAGTRNATVGGTAPPGRVAVRVLRGAGIQSEAEPPFAGLHP
>SRR5690606_9372909
YLTKSSFTMPHVAEGCIIEFSYKIISPFFFSIDDFSFQSGIPIKKLEAKFEAPSYFQFKPTYKGYLPVNPKHETKNSPQLGDVIKRTSYSLIDVPALKSEVYVDNINNYRSGISYELSAIDIPGGMYKSYTQSWDDITKNIYAYSSFGAELEKTGYFEEDLDILIKGVTDPSEKINLIFNHVKSTMNWNKYMGYGCNEGVRKAYKEKTGN
>SRR6266436_1748777
IEFLRRLTDVEVAAQHAQKLLDPKLLRRARTSENRALRTLVAMAKPIWQSLTGRKPSVNKVAGKRKSDFVTFVQELAKIAGGPEPTFKQVQNAFRARTLPILLTAKEVGARLKVSLSWLAKARMRSDGPPYIRIGRSIRYTEATTMTRPVAHRAAFEAQTPTEVRAKTRAGAPCIMRVVPGKRRCRFHGGLSTGPKTKAGRVVSPHAMLKLTSSPANTPHHCSPSFGKV
>ERR1700722_19782650
XMAHCEASAIAERFVRLRGSVVGENENCGSIKAHDCAPPFDVMAGLLPALHAGALAVNFLIHGLPAGMAGPPPAMTREGWATGLTELDTPAPRSRGEPLAEHRQAADRLRRGRLVLKNVPMLGEPAVFEAHDVGGDPRRGTTVAGKTAVGDHIIPSGEDDVIFIAQRIRQGANEIEQAIAARRNMGAVLDVSVRPEALCGGVVAFVEQRVEGFENKRLVLRSE
>SRR6185295_4310521
TAEEVREYVVRSSEVGKAVGARVVISSAAGMVAIKAAGRPLGARSIDLAAIEASALLGVTHQIVGRRHLLELLLGLLVAGVEVGVELLGQRAIGLLDVLLGGILGDTQNLIGIGAQGFLPSATRHLTTSAVAGHDGAWRRQRGRGAAADRGSCSRLPTPAGLCRTSPPDRRAPSPPRAAPGRKPHPRPRSFARRSARRRPPACARWLRPLRETPHHRFRARRRPRPSX
>SRR2546428_4765453
FNCTPVTLPDAARVCPAGREKLVSVLAIVARFDIHDRGRRFGAATLTRQQQGECTMTPRNFVVRSLLMAGLFASALPGWADCQSNFVNRITQLRPIKLGTSGSNLRDRVIFRNLECCGGTLGALLTDTNGNYYVLGNNHAMGRLNKGKKGESITQPGLIDADC
>ERR1700722_5782801
PTNFSCPQIEPDHDGTMLDFECEDTRYCRYREDCRRAELHDTVVTNYAHWVTMLRSPTGSRIGGFSTLILDEAHLVPDLVTDYLRVRLSRAYVQARLGLDMPEPDQSLRIWRSWATGARREAEQRAERAPERSKEGRRVSGLADTLARIADIQDGEEWLVDQTPRGAELTPVWCARYLERYLYAGIEQVVLSSATLLPAITRYMGVGAGQSVTHEIDSTFPIERRPFIYVWPQTRLQETRVQYNMSNTVRRAWAAKMDRFIGDRLDRKGLIHTRSYDRGGEIPGLSQWSSAMIVADRRNGRAATDLFKRAEAPSILLSPVVEEGVDFPDGAARWGFIAKLPSVDRRG
>SRR3712207_4962885
IVLIIKHVVLFFFFFQAEDGIRDIGVTGVQTCALPILRVSFNSIGADYLRTAGLPLLRGRGFTTAEATQAGGPAVALIDDALAKKLWPNGDAIGQQLQLAGERITNTSGDVTPGEAIEVVGIVPVVRSSILEKAPAGAIYLPFARGFQNNAFFYVRFKAGAQANSAATGELLRSTVRSVDPALPVLSLKTAAQHLDD
>SRR3954447_3399888
AQLTAWNLATVRRLNSWIIRATTSLPDPVGPRISTEISDFAAVRIHSKTISIFSSRPIISRNRCTDGDWSSVLTAARRSRNVSRSSTVASLAGRSARYRGGLLPATTAATPKSTSSLIQFSTSRRSRPNVCINDSTSKLSSGRALMYRSNPARSGDCTRLRNRVSRSAGSAVLVALAALARRALKIRSSMDRLSLSAGYRRADRGGPLAAIILGLVALDQRFHRHRVAFTVSVADDRRAATAGFDENVRQQHACINFDGGDMRHVDCFFLPPDPPWLVLHDAGRRNQDLRREKVIAGTEAAGAEHI
>SRR5688572_24783379
ATVICGMNRPIVWRTPIASMRMSAAQTSTVRVDFISSCCRVARGLPNDHRASRACARLMAIQGMTNRNTRQVPGNALGPRVAQNAPIPKSRSTRSMNPRHLALATFLACAMPAAADCKWEWLCNGDGACKQMPVCGSVYDRPPPRPTESTPPATPPLAMRHNTFAGRGANRGPPLTCEHIMRKDHTGRWYWSEACFCTDAARAKDPTPPFANIVRCENGTKX
>A0A1E5AL09_ALIFS
MIVNSNNILSLTSTSRVMSINWALMNNCNYKCKYCHSDLNSGSIKSPEYNIVVVFVKKIIKQCQQLNLTPYFEFGGGEVTLLRYFSELIELIHKNDGLISIISNGSKSLDWWKANTPYLGGVSLSYHVNDIKDNNHFIDVAKILEQSKNTRLHINVMMDPERFSDCLFFAKQLKKEIRCSIALQPLYEGFGHGGITKKYTYTQEQEKEMQTFRGRADNKNLPEPRAYLDVIYLDGSKKTLSTFDLLITDNVNFIGWDCYAGIESMVITFSGEIYRAWCMQDGPIGSIYDEIITLPTTPIRCRTKICQCGADISAKKVNTTLLKHYQNSIETKYIE
>SRR5262245_57968688
XMICLQILVPFRFSIVSARTHWASDAKQYNKSHARPPPAPGNCPRAAVDHWAMARQFRWCLRGASRMAVLILGNDRDEHAECMRAYLSTKGAVVEFLDSQRFPAELQIAHDPAAGSGTIRLPSGSTWEFAEIESVYWRSYGGATAAELPDAEQAFIAANDARSLLESLLLCLPARWVNGLAGYRWHQTKPAALARVAALGVAVPATVVTNDPQAVLAFADRHGRCIFKPVQGGAHTQRVTREHLTEQNLASLAVAPVTIQEEVPGVDVRVFVAGPRVLACEIRTEVLDFRKDPRADIVAIDLPGGVAETCR
>SRR2546425_387409
PKSGWTLAAAGLLLYASASHVQAAGAFVRAGASYTVDKWDAADFVGFDSAALPPNEIIAMTQNRDGYLWLGTLNGLVRFDGVHFKVFDEENISGLSGSPVIRLFEDSQGNLWVGTEIGAIALMKDGQITTPLETGLGGRERRLMSVCEDSSGAVWLYTANGDLWRCRNGECRAFPENPRAQSVYRGVIAEPSGTVWVGSDHRQFAIGPVPGSASFELPVARQLPVAKLDFLLASQHGGHWRLADGRIQKRRGDQIEDLGAYPWGLASVSAACEDRDGNLVVGTRGAGVFWFEQDGKVASLSTTNRLSHNYIL
>ERR1700751_958828
LDGETGLQPGVATHVQALGAELGHAPGDHILHLPGLDPGPLDHRAIGRAQQLVGMSVLVVALLQVPAPNRGARGLDDHYLTASCRHQLSLSGTGPAPEPALRVYKHQLTVTVPRRAGPAGPRSHPSRPAPRRGRDAEPPG
>SRR6185437_9543277
LWSMRGSLRFGLGCRSVRALTVDVPSPCFVRGFHASARSALPRCALPSPRVTRRRRMECGCFHCIQTFEATAVIDWIDDGETPLCPYCGMDSVMLEVTDLTTLWRMRARRFGMEGLAALGEGPFSVAGPLDD
>SRR3954464_8629952
PLEHAIARVHGRVISFDPATSTLTARVPASALRRLSGRRDVASVAAVPVRRRLALSDFVATTGAPNFWAAGYTGGQGTNDSVPATLWIDEDLDTAHPDFHGVNWENIPGAAPGPLCGSPSNDAGGSCEHGTQVASLAIGQGVDAAHCPSGITCTASDAQQKGVAYGIAHAISTQGGGAAAPPGGYWDIFGFALGIYQTGGSSCSSPLPGATWPAQVTNESYGSGAGTVTAANLRDDSIFSAYGVLPVPGAGNDGPTASSVASPCIGYDTLCVGSYETNASVSDPADDSISDWSSRGPGPA
>SRR5450759_3105029
SGWSEEGEMFVQSADSATRPQFSASYSHLITCSRSSPSPSHPLSSPSHLQSPSRLKSPTLLALPLNHMVKATIFIHMKTTLNIDDALLADARRLSRIEEKTALVHAGLEALIARESALRLAALGVTERRRRPVRRRRPARTATRX
>SRR5580765_3100358
LPAPGDAPRALSTKNTEHQEHWAPRARRAATARIATKLTSHPIVTRIPMLAEFSAVLETVANSGPGIGAGLAAGLGAVGAGLGIGQIGSAAGEGIARQPEAADVIKGNALVLSALVEGVALFAAVIGLLLVGKGX
>SRR5690242_3907823
RAHPDRPPRRPRLPPFAVARERRRALDRGDAPRAGAARRGRARDVPVAEARRARAPARLLARGARAARRGRRLGAPSGGIRRGRSPSPRPPSGDSPMSKPEVLRQHAEELFSEELAELSRADDKQKPPNWKLSPWAVRTYLCGGKLPNGFEVSVKYI
>SRR4051812_6319949
PRPAEVMRDDRRHAADGAIGAERAATIEVSRREMIRVGAAARNHPGFESRARRRVMLPVGEYVDGRLGFGLPAHRAAQGDGLLAIERRAIGDVVDHAVVLVPREGEPAEQDVGGEGQVDVSGRAALVVIAEAGGERAGGLVLRLVLDEGNRADFRAAAKKRALGSFQHFHALEIEELDNTAPRTADRYA
>SRR5580658_5004565
YLKARQRTRTKRGHERNVGGIAPARHQNTADARLVMAGIECVPAFSQIGLKPGAKIHWGRIRWYADVTEIARAVAHRDVHAAAQGDGEMSKVPTYPALFGMDIPCCFGRTRVFITKFNAIVDVVADRLNKAPSSGNICELRPCDLDEAIRLAISAAEEEDERVDGEVLQCMLLRPQVHRVRFALVLHKEVRRHCELACGSMNDMAEIAENVVIGIGKNRRIELQAIPGQQVGCPGWMNTQLQDHVRGLRAIIRDLVARMNLHRYPLRTSQPRACRSLAKIIAPQKFHCDAARNKQHKSSALGSIRSLCRX
>SRR5919197_97304
QSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSTERSAGGATQAAPAQSPKRSRERSAGGGTPAAPAQSPKRSRERSAGGATQGAPAQSPKRSTERSAGGATQAAPAQSPKRS
>SRR5215470_420408
EIQPGKFETLSNASKRALVAAMNKSRSSRGNARNGAELGSINLRSTAVKVDLAEPCSPARHKTGYGPLAQRRKDKGHAENEIPVLIFGSIFILWHAHVQELAKLIDRSTTGRLRQWQHSAGAAKRDGCLINDAPAVGIDFNRAPTRISEVEIQAAIECADPNVHRALPTVEMCTRLDDVERRLDRVGVRSARR
>ERR1719223_2153901
QAQTVSAPANFASKTVWGQNVINIRPFSIESHKTFEFVGSYKNNGQIPIFPSPEIAFLGRSNVGKSSLLNQLTALNKNIAVVGKTPGRTQSINLFKCSERQ
>SRR2546430_7123832
TRRRTQTRWAAPPRSTGAAPLSAPAHPPTRNLRCSPRTGEMGVAAQPCVRSPIGLQPQRCINVGKRLPAPRTNDGRRLGPRGPATSRHHLARETPSAPPDRERVRRRARARAKQRGSASGRARAPGREPRVRPGHRCRSNPPSPHPRSEEHTSELQSQSNLVCRLLLEKKTGAHAHDMRLTGTGSATIFRDGLRQEATWSRANNTDPFIFKNASGERILLDQGQTSVHVIPNDWETPSQX
>SRR5207245_1019995
XMYPARGPAAERKRSNWLSASSGSGLFHSVSSSAGYSRSIASRRAPAYGTSGRPSRISLRFWRARSGSAKPVARSASRLGSRSRRRGGAARSLKKSVNARWTAVVTARCRARKTPAAGAQLDVAARRPAAPAQRAVDLALHRADRGQDALVHAGPVDDGARPVHEARADARIAGGHPGLEQRLALPQLGALVVIRAEGVERQRHRAHAALRAQAQVHAEDVALLGDRLDDRDDVAADAREVLAVGQPPLGPAGGVAVGAVGEHQVECGRVIQLLAAQLAHADHRQARLVAVDVPRRADAGAEVGGGHAPGLAEADVGQPRQLLRRDAEVX
>A0A1H8BLI9_9MICO
MTDHISRSYRRPLTLTPTHHNGASQRGPAAHRLEPPRPDLNRPDLPGAVRLERKRARFTATTRTPALVAAATLAVLIPLAGLAAPAQAAIAGIARAATAGAGTTGVPAGTTLKVHNGDLNITRAGTVISGLDIRGLVKINAINVTIKNSIIRGRSVSAPAALINNLGGRSDLKVIDSELYPSKPSPDINGINGYNFTLTRVDIHGVIDAAHITGSNVTIANSWLHGNLHYVSDPNQGGKPSHDDSIQIQKGSNIKVYGSTLSGSHNAGVQITQDTGDVSNFSFTNNFADGGACTINVAQKSYGPIHGTVIQDNKFGRNTRLLNCAVISPTTTKISTARNYYTPDSKTVAVRTG
>SRR5262245_45043355
TGSMLLIGVFGGPGFAQQPATNDTLKQNKNEAVPPAPSATAPGKTVFEKVEPAKPPEKSQEAKPPVVKPDGTPAKVDEVPKPVVVKETQPAGAPVPPPDGKPELSAPVPPATVIPPVRYFVMIFGSESVPKRARFSHTWYTIVKATPKQNLPPGYDPDGNLVKYYDLTAHTISWLPSSLHIRVLKLRPDCGHNFSLH
>SRR5512132_3388807
TDLEILAAARAHFPTEERLAIIQASAQRALLRHAEAEAGLRAHLAANPGAHGCLMTLGQALLDQKRSAAARELAESTLRAEPRGEVAVGAHFLLATAYQQEGEREKARPHLEAMLALEPGNTRIELLLASLDREAGRLEESLARLDRLVEREPRPGNHDWDRMVTATLLGRWDAVRASAARIGMNLKGAGPIEEAWGLCRIELREPDGEIGIHHALRTGPVTARILDVARPRAPQHYGDEIVFEAAPRNAGPRPGEADHSYLYPALATRKPGGYEAFLLDGVHPGAEALDTLRRELAALGCVLAVQSDTTYVVTEAATGEARPGLFAYLAAPAGCSRRELHDLLVQHGGSPARPLVWPGLAQALEQASELEDELARQAAIIERLGLX
>SRR5215472_956881
RSWSPPGGCTRCRPLGVVIRPVDLAEDLIRRATAWHAGSRGAGRSGGAGRARIALWSSRARGTSWTCRPSRAGCALLGQILPRRARWRRGHVARQGDPARAVVEDRVVLQVRGRRGLPVAAPVDARQARRSSRARGALWTLRARGASRARRPGRAGGTRRASLRQHAPVGRVLGWWHVVGGVVERDVARALITDAVVFGVGRGRRPRAAPLHRDAPAAGHRWTVGALAIVVVAADRVEQAVGHPPRLRQPPLQVRLDIVAPRVLQKADHVRLERHTADX
>SRR5258707_121040
GRDEMCEASASNRKRTREGCSPIRFSSIVITAVRPGGELSLMPLSVALAILMCPAMRLRDLRMHRYHWAMLEARRRIHERRIRMNPPRVRLRVPVAVATIVAVVRRAVAIGRVILIMLIALILLIAALDFAAAIIRFAIAVVPIPATIINIAIAIISIVIAISGRPVLMRPVALFAEHQPIWMGLELX
>ERR1039457_2916573
FFFNDTATTEIYTLSLHDALPIWDAEARRDLQAGRLAGQAQAQVVGGLEGLLIEPHGAVHHAFGGSAVDLERHQVRGNQGEGAGGTEVFDDRHTQRAALLRVGGGAQFVQKHQRCGRHIERHLADIRNVGREGTEILLDGLIVADIGQDLLEEGEFGFGGGHRQRGLRHQAEEADGLESHGLAARIGAADEQRAALLREFERDRDGGFAAAAQDVFEQRMARVAQHQALPKTRDHAIELGAEAGLGEDQLQLGHGDEGLADGIAVAAQTVGDFEQDAADLALLLFGEADQLIIQVDGFERLDEQGVAAGAGAMDDAIELAALAGDHRHHETLVADGDELLLEDAILAVGAQEALERFLDRLFLTFHIAAPAGARAI
>SRR5918993_1097003
GCAPDITPGGRAMRNRTMALVGPFAAATVLLLAPTAAADPPPPEFGRSNMGLCSSFLGPREAARQRSSRARVPPTALDAVAAAHPVPSYRPGGPLMNRLLGMLATCAVLLGLSAFLAPAAGGQEPVPTFTYTTPEGGATPAQACANSDDAVIGQFRLDGEVVEEFPLSGPGDLTRGGCVTTITMQELSTPAYVANCKILEPEFAAANESGRPYPYAFYGNPDYTANNRADCVSFLRGFHTGTLIPGPX
>ERR1700722_7859116
XMKYRVYKPFLLAVVLLCVVAPHARAQAFQNLNFEAANIPPGTQPASMISASAAIPGWTTSQNTWYDAFSGGGALVSVNDSLTPIMNFSPLQGRYSAILFGGAFVPSTSISQMGLVPANAHSIQMDISLLIPSAPFTVSLGGQLITMVPLQVFPNYTVYGGDVSPFAGMIENLTITQFAPAPPNVPPAALELDDIIFSPQIVPE
>SRR5437773_11503562
SRWRVKARRFTRATAQRVTNPALNLQTRWLLSPRLGLIRSGCIRGRKMPRPRQTGASRNWASIVHQWRRPRIHTDTSRLHWMESGSARLTLHNGSVPTLHDLLNPPNERPQTFHRGYDVFDPVKIGFKEPPPQPTGPNGTLTQPYFFAIPEKKETAIKVTPTAPSYPARTKRNCWNIX
>ERR1712178_671869
SVKTIRVEIRVNENKCLLNLRSIMLQRKVLIIKLSTPDRFTTGSVTSCEITTLNHKIFNNSMKLTAFITKTFSTGGEFAKVFYGFWDSFSKETNFDCTSGFPSDSDVKEHFVSNNW
>SRR5258708_11690673
GVPRRPQRDVDVLGSRIGVGEESLDGLIGCAEQRPARDSRVPFRAPLFLQRRLDARGVGGVTREVEADVDGAPDGRRLPTLDLAPVVQHAAEAPELIWSDVRNVPAIGVTGDEEEGASFAHPTKPDRKAVLHGTWQARRVLRGEVLAAEGGALLGEQAADDLRGLVEHVEPYADLRKRVPERAGLGF
>ERR1017187_4658610
LFRSDVPAVHKGATQPGKWIARPTKKRPLRLGGPLLPGRQAENFQLPAIAVAIPVPVTVVITITVAISVAIEISAPVVPIEIAAHKAVPIAVADKVPAARNPIAAVHVSGAPGVTRSRGRWNVGKRCVHVNSKLGSLSRDACQPRCASQYRCSQHPVLHTSHNASVPAGPWFKISVTIDRPGSVPVX
>SRR5690554_4605005
ALSLTMKNGFNFGSHQAEVQGGSWGRRVVTVESGGNDGTWGYYLNATGFEEDGWRDLSDSDALNVYGSLSWRAGDTSALNLNLQHGDSELRGNGASPVGLLATRRAAIFTAPDITENDMRMVSLDGSHFITPSIQLAGSAF
>SRR6201996_3122915
PFDWERSVASGCKFSRGPICSKIAPIEPYSLSQSVSRRVLLLDPPLLRFSHCVLCLLPDLLELLQPAGYLGHRAVRCFPISAGVSSHQKIKRGLPCCGVLPIVMREFCQWEVLRPIVLLIVYEKPEIGFEPLIGPFRLSVRSRVVGRRNVLPYLQEATQLRCKFX
>SRR5438477_5602888
RCGPDCRRGDPHPRQRGRTPGLPPAGHGRDPDRDPRPAAPGPARDRARRGGRVPVRHHAPEGHDQKEERQGEEREERHDAQERRARARSRKRARGHRRGGDRAGHARPGRHAVHGGRQGPRGLGGAARTGRMAAATARSAAANVRGRGPAARRGRPAQADHRRRRPAPDQPAAARRQRCRSDALGRSGRRGDGLGRAPDGSAGPARGHVHRPERPPARAGVLSVGSPHLRGPAHGAWPGRDRSLRSGRDRRRRAAPSGRNDPARPPGTLAVGQADGGRLGVGGGSAREAPGGVGVVHVAHRSARDRAGRVAARAARRRHRLLPARFPDRDGARQGRGVGLLDAHGVAAPRQLPGRVRGCGRRRGARGPGGRRRHRRPRGPDVRAGLDLAERGLVDGDGAAALAGRAGRPRAPAQKPRRRLPRRARALSDARAGRGDRAQAGPALLDLPADAVSGRPLPRSRLDALVPSLLTGQALVSLVPATGDHVWAAGAAWDVARAAATTDRRVALVDLWLERPTLHEVVGLSPAEGIVDAFEYDVSLTKAAHEIDRVFFIAAGTVTAHAGDLFANPRWRKLHGGFRSEDALLLLYLSAGALARLSTVPDGLIVLSADGYEPESSIGQGITAAMERGIPLLGVVRERWTPLATPAPDPRAMAPPPGRISAAVRPGLRGGGVSHRRTRPVVIAATLVAGTAGGWALLARGAEHRAPNAAVRAAPTPTATSAPAPAAPAPSQPRVDSLAWTVQLAAYARLDRALALADRLTADGITPFVTPVTLGPRRGGTVWYRVLAGGYRTRDSAVSVRATLWNRRLAQRGQGDVLRAPYSYAVSGTTTPDELRARGIPALARDGAGRLLVGALETPEQGGVLEARLKRAGVRAKLVTRMGATPX
>ERR1719231_1158533
HLVPYAARLNPTMVICFFPNIFMNSKNEPGGELNQDSSFFSSPSSEAVASCTSSAPLDMPKRAQMFSSTHGASASAMPIRNGTANRASVRKPRDHADTLPASSTFDMSGTCPLVARNANAASGTDTTQKSSSNSPYEMPPAMPYFLICAVISLTLSIASSPFSASSAIISSGAERGAGAGSPGSTTLRATKRCGATVDGTKAAAGMMSSSARASIV
>SRR3954468_1616850
AGSAVLHVGRDARASAGHETRRARARAVLAGGAGAAGLTAGSAILTVGLNVDAGAVALVLIATALRVHRPATAFGAAGEQDQRREKSRGQRRQGRLAFVHDRLLRGKLPRLKKERAAASAPAGGLEGRRHAYHNSRLGALLETYGVIARNGVPRX
>SRR6516225_4192873
TSASVTSTSWPLGVTPPSGIDAVLAGALSATVADNTGSGSGLIVFTFGAGDALDFLAAGEKLTITYDVTVTDNNGASSTQLVTITVIGTNDAPVITSSAQTGAVTEHTNVDNSGNLNAAGAITFSDLDLTDTHTVSFTPDGNNYLGTFKPTLTQDATGGSTGVVGWTFSVSEKTVEFLAAGQTLTQTYTVQVADNNGGFTTQDVTITITGTNEAPVITSGVQSGLVTEIADGAPGENTAPHSLNGAVTFTDVNLSDIEASSISNTQVVATLANGYTLSAAQRSALVNAFTIDAATHSTTDGTGSIGWHYNINDSALDFLGKNDQVVLTFTVQVADGNGGFASQDVKITVLGAEDAPVITSGVQSGLVTEIADGAPGENTAPHSLSGAVTFTDVDLSDIEASSISNTQVVATLANGYTLTAAQRSALVNAFTIDAATHSTTDGTGSIGWHYNINDSALDFLGKNDQVVLTFTVQVADGNGGFASQDVTITVHGAEDAPVITSGVQSGSVAHGTTTTHSLSGAVTFTDVDLSDIETSAISNTQVVATLANGATLSAAQQSALVNAFTIDAATHSTTDGTGSIGWHYNINDSALAFLGQNDQVVLTFTVQVADGNGGLTTQDVTITIGGSNEAPVITSGPQSGSVTEIADGAPGENTAPHSLNGAVTFTDVNLSDIETSSITNTQVVATLANGYTLSAAQRSALVNAFTIDAATHSTTDGTGSIGWHYNINDSALDFLGKNDQVVLTFTVQVADGNGGFASQDVKITVHGAEDAPTITAGSTTATGSFSESTGVTGSTALDSASGNIVFADVDLSDAHTVSQAAPTFSWSGGTLSASQIAALTSASTLTLTRTADSTGTGSGSVAWSYSAQDQTFDFLAAGQLLTITYQVTINDGNGGAAVQNVAVTVTGTDDAPVLSVAGTALYTQNGPPVTLLSAATVSDVDNQTMQSAIVSISSGFLTGDMLAFTNTSSTTYGNIVANYNAATGVLTLASAGATATLAQWQAALDAVQYSSTSSDPTNFGNDPGRTISWVVNDGTLASAPLQTTTLNIKASTLTIPAGSTTTLNGGTLQASVIDVEGTVIGFGTIIANVLTNNGTITSKSAHTLTIEITSGIQGTGLLEITNNTTLALDGPVGSGQTVQFDIGNGPAPILILNDPSDFQGKITGFQGSDQIDFVNIDPARIHYLNGILTITGTTNAITFVGSPNLKFASDNHGGTLIIDPPLSTTTAAVTTTAAATTTADAAVTPVAKTSTLTATKTTSSQTKATSATETASSRTNATLAAVDEASVVALSTAVAVAVALDTAVADPGKMSSLTISGDGTAVDITGTGSGLDSSTVNSSAALGFSSISHEMAGAPADKAVEVSNGKPQTADTVSETGAFKIDAAATPQLDGSDAVDALVITAGTNADAINVPGDHATKTAWHVSDDGRGGKTVHESPVSATSEEASAQSTSADHHVIVGGPLTETLSGNGDHSASPFKPNADHDATVDPGINLDSIPKNHLLQHPADNLIHIPAQPDHGADPAHPHVDGNQSANVKFADDGSAPSGALPSDPSALTALPSDPSEAHGPAARALAPGDDTPVQPTPADNGHHWGTDPEMKFASIPQNNPPEHPADNSLHAPAQQDAPAATDGTHPLRGQVDASESASPNFAANGSPQSAHATGEDTSVPVALLDNGHHGDADPKNNDIAKDPPPQHPADNSSHMQHDDGTIAATDGAHPGLGQVDGSESASPNFADNGSPQSAHATGEDTSVPAALADNGHHGDADPKNNDIAKDLPPQHPADNSSHMQHDDDGSSAASDGTHPGRGQVDGSESASPNFADNGSPQSAHATGESLSVPSTPADNGHRPITDPDINLASIAPNQPPEHPADHLPPTPAQPDDGPHPADPSVDVNEVSSFKFADNGSDHGTGPDGAHPADPQVDRNQLKLADDGSDHGTGPDGAHPAHPQVDGNQSDSFKFADSADHPGTVTNDPTAVTAPSSDSTGTHGPAAPTLAKTDVPDAGLSAAPDQFVFVDNTGHGPVTDHKTDVVEIDHTVPADIQHLLDTAHETNAVSALDPNHATASQDMTKVPPHHQGDFHFAX
>SRR5271156_26155
RCLPVGNFRSNRGVEHTMSSPYTFVPIWSIWRELPSPLKLFCLVLVIVCIRTLISALTTLVGLRAFPTSRKAADESRVHPCLATLCLRVENMRQLLSATVYLFVFIFCWILPWVMVTLDNSKTPGGILVMRHFFIDIAFAANVFLAFLVLHSVQWFVSSRVNTINLSAKTSPAG
>SRR5580698_4360037
DHLHHLTACRLSLNLTFGLGHGARLVGPATSLAQLLQPCERGCLGRRRRRGWRARLRFGDSPIGLLLIPGGVALSLRDQAGLIGPAARARELGRSLSSGVCPLLSRRDTRRRRGRGARLCVRARGPAERYARDNHTYFGNSVHRKHGVLSSSSSPFVAGFVLTVRCWS
>SRR5947208_1864857
SSWSQFGPRLASLGATRANAAPGMARATPPAAPMRNCRRLGSDGVFWGGVGGMCGVPDMSLATPSRPAIELTVVDSGRRERGASPGSQPTPTSGGAGATVAERRPLRNHRGRGGAVFYINSEYLSNRGPGSDGRX
>SRR3989344_4462318
XMDFRTRRTENIYNRIHCMKNTLTISIATLVGVLLSDTRHIVAQSVTPVPNMIWINSGTFVMGSPLNEEGHTIYEEQQTRVTLTYGFYMNKFEATQQEYLDLTCLNPSTTTNLDAPVTKTSWNGAVNYCFLLTERERSAGRIPSNWEYRLPTDAEWEYCCRAGTTTRYSFGDDPTYTLINQYEWYIGNTGTNGLFPRSVGIKLPNRWGLYDMQGNVSEYALDWFIDNPFRGSLPGGSLVDSHGPTTGDWRVFRGGSFFEGVSSCRAAVRGGISPTSTSGLIGFRVVLAPATPEWRQVIETQLERPKYSSGPVKEVGKSKLVLVTHGWIPSWDIPQLSTAWVDEMTNSIDRYLTDKGLDGWQVVGYKWIEGAHPLDLLSIAFPTRAAQTALENAKREGRKLGEYLAGQGWSEIHFIAHSAGSGLIQAATEAIKDISPSTIVHVTFLDPFVGLDYSGVSSYGNRADWAENYYSRDLDTGGENWPFTQGLFDYCYNIEVTWVDDNKILGPVYISTPLGTQRCTQTVSSHGWPIQFYQNTIPPNTQLGSAGFGFPLSRAGGNWDYAISNYMVSSNALWVLGTPDDPQCNQLYTSTPPMIGERVDFSNSPIEKSSTGEVKIHGIDSFSLITGSPVWLAAVINPTNSVNLVSFDAKFVNANGSEGLLSLYWDTNSIGSVDEPAIQLGFKRYAFMFPRAASNTLHILGFRLDAFTNVPSSVLVTNVSLVSMGVSEPFTLSFAGVYTNMLPIFALTGPTGVVYTIETSSNLVDWTTSVVLVNNSGKVRFSDLASTNALQRFYRAVAPX
>SRR5262245_14032018
XMSEDIDTAPPAALPPRNCTTCGKPATVAYTWEWGESGMACPEHAATLQQNAGNLNRTVTVVPLPAQGPTPLTRDERIKYNATILALEAEIEDLKSRGLELVRSNEDLAKQAQLFSMREREKTAYLEDAQAEVKQLSARLEEVETELADAVTEVERLRSIVKFTPGAQPPQQPPAGPTVVDGPRX
>SRR5260370_42043382
RSGGFPELTIHQTGHGLGLGVHAAPRVLIGNEQRCANPSVIILDEPSRGVDIGARRRIHDFVVEAAAGGAAVLLISSELEEVMGLSHRSYLMSEGRILGEIDPRKTSVADVLFPLFNVVGARAVAASLSRAAAPASX
>SRR5690242_10536872
SVAPSPMSPLPVDPQTGGLRSMDTALVTSTQPLATGPSLAGSTVFHDASGRIGYISDSAFPTLKSAWTYDIRGRLATTKLLQPQSSLASLTPITDHHMPTAFRDLRDTGSLSVTDVGHLGVPAALATEPAKWIVNDGPAHEITSKTLFLDGHVVTPTMQLGVVPPPNQIPATFNFTFEGGRRTSDGVWNTSFDEFGRLMRLENADRVIDYVYDPRGRLIGRTASQKTSSGNVLETRSEVLNRDGLPAETTFVWDPVVDRLVAMYEAGKSTQPNATA
>ERR1719203_2165260
DRTIDKFDQSIRVSNIALSASNAQIRIVSLVPITLQKATAMMASTAIRCPSRSPSQSSSASECKGSLLSLCRLLGRLGLLLGALPSVANVPAAPLEVLLHQLPLVFLGAPHVVVGHLRHAHQLALLGFVQVRHRRLGEVAVARHLALGLLLRHQVGDHLLPVVAVFAPAPCP
>SRR5690349_23072571
YFFFFFFSSRRRHTRSLRDWSSDVCSSDLLGIPTLPTGGISVALLIAFVWIVAFALPVCLWMLAFWCRPAHTFVLVIAVAALLRSEERRVGKECRSRWAPDDVRTKGVALLD
>SRR5262252_5786708
IRTAARDQQEHMPTGVQIIATRRKSPAHDLSSIVNIVGFYKLQTRIRRNHSVQVDDGPIVPEDYSKGIGVAIERITDDLMLRINRSREAGAISGRIQIRDTPVLPQCGVKLPIAGIGATDRLPIVVKPERHG
>A0A0N1ILD7_LEPSE
MSKYFEPDTTFGKDAECAVCCCLWTNPVEVNNCQHIFCRECVANLDLCPVCCGPVDHLNTPGKFILRLLDLTRGKCSACAWRGTYKDFISKHAKCLKEGEVMRSREDTNATAPEAEPMHEYYLEEGWPAAHSLARLAAASPTLTSTNSATQNAPQPAPAIAADNPEKRDLSHVSNAAREVSAEPTHAQRARWQQTLTSTARDFGMPEGEFKELVRRFPDFASLVTDRSSRLELRWRDACRLLRFMNYPSHPDDVKNLFEMAERSPKTDSISFNTLCLWLMMNRRSPAQWYQMSDAPYRQILQVAQLLDVEATGLFTVEQCRILAEQYFERDVEDSEWSQITPLLRSKDAGIRQSFIPSNRCHPDPLEDFTQSAVKLPLHDALCSFARHVNELKSLKLQSPVQQRQADFVHRIKKIVGYYEPDALPQLETTLQKFNGEEESLLMTLTAMYGPEPM
>ERR1700733_3340046
VVGANTSTGGSNPPLSASKPFRIPANASNPRHDRYLRLQNEGPRAFSYYVCARVSAPAIASTARFSYSCEWAMLRSDMEFRVIWEIDIHADSPKQAVEAAREVQLSTDMPATVFEVWDHARQKMHRIDLATVTGRLENGEVASLRAAFRQLQCAPDLGAGVRDFLSVMLIFLDADGGYWRRRX
>SRR5262245_2448521
XMNSRSRANSARRVAFLIIRLILLTTVLVRFPVQAQTDAAARFAQRLQEARQVDAAAQDDVGVMYAEADGVKRNYSKAVFWLKRSAAQGNVLGACNLALHYARGEGVRKNPILAMKWTFVSHSLDGLKCFPDDLLQFFKPRRSAVRKAWSLANAFLRSHPDLKNEFGERPWLKSGTQPNKSLDRSPDVSGFARLECLVRX
>ERR1711873_241630
PELTDSEGEEDSEDETEDDMLVEYRPSGNIASGISRSPKPDGYHLSERLLTSKTTIKNKSTSNTDADSSDEDTEKPQMNKEINKNRLHRKRLTYPCHPPGRYSPMIEDQQHTETSKEIGSITVKEEEVSNTDLSSSLTWGKDQEVSWLSGTSIRLELT
>ERR1039458_8309614
RKTSRPDRPLQQTLDYVEPQTWVPQVSPLRPGTAANQSKVRAAIAKPESMYPEATMLNSTRPAGSGESSVLSTGHSNSGFALAAISNGHLYNLRNSRRYRERRLNYTKTRPTTVSISERRKPDPRGQPGYLRIDTDQGDSPTAKGVYHINAVDEVTQWQLPPHGRRPVRGDPGAX
>SRR4030042_4963036
YTPSDCSTPGVIPFPSPLYVVLPVLLLAGFQLLKPKLRSSLSFVLLLCLFFFFNMSSSLRLVEASRDRHLRIVGLTSAMEETGRRYWLGEYWRCWLLTAVSKEKLIVDSYTTESSLPYSLAYWNQAESDNYVFVSPSDRERPAYYARFGRWLETIGVRSEKKEGGTFRLVYDLEPRVFQRVLFMDPPGQIPRLDLEMIEPRQGYLPLLFPNPAPGKSDLGFWLTVEIPGFSGRKELFSLNQPEVRVKIPHPSEASFSIRYFIDYIGVRIPASERKVHGSLPPDAVLVRSDPVVLLRGIPPEAPLRKAGRMICEKESWLELNRMSPGASRLRLILNSPFKFRSWLWYGKYVQQVDIAVNGTSLGKRTLDDGRNVLDVQVAKDILKPGPNLVCLRFRYHGWFPTRSPWPFSAFLERVKL
>SRR3954469_24847718
VACSAQAPEWTSVLGSRPQEALKRFGRALLGAVAGLRAALGLGVMVGQEGARSVAPRAADRGRRAAQVGDQRPRPPAHGAGHGVVDVGCLLVGAPGDGERSGTGPAATSPTGPVRRPGASLASRPCSMSPPPPLPPPPRPARRRX
>SRR6478609_5279812
RVGGRRGPRARRHRDQHHRRGAQREPVHQRGAHGRVAGRVRRDHRRARDREGRLRRGLPADVAESVTTARVRLNAALEALRKVDDSLGADVATRKARVTNAVTALVTDIDAFVSPRVDDVMWVDELAGEHRLQVAPLDVGLTLDRLLWDPPDRGGLEIAAAGPADPEDDPRYGLPTSVVLTSATIP
>ERR1700736_2808299
HTIRGAVTRARGLLAPNKLFRSRDKGKGRGFCPRPGFPRMADGTAGATRRDTRCQQTQCFMQILVQPGISGQSFATPEVGCQASEYRRIHFQETLDSARGTKHCGKETSGIVLLAGRRQPALKEPAGNLPKQLMLGWDPRFREXX
>SRR5580700_6228722
SRGSVNADARLAEDNVHRRVPAIAEGERTELNEMFARPSLPSRAGALHPDVHEALAGRLDAAAADGKVQSSRRGVVHSFVVVRQVRDGVVNGRVLSHADVLAAGGLELGQDGDAGAARVLQEHPPACKERLGVGLTGDHVYE
>ERR1051326_2460312
VLEFVFRRLFACAAFRGLWFLTRCASRGNSLGLGGFEAGEPPLCGAWRAKADDGQVGVFRLSKEQRIFSAAPFIELERPHEQGIAAEEGAAPGFAVAIPEFRVPGGAPDRSPDRTPQNERQGVIQPDEGISALPDHLADHIAIDDPAIPADCPSDTLAQDIRWRGCPVWPPMEGVHLYMGEH
>SRR6185437_12123836
PHSPTDRARRGKSNAAATARRPSGYAAPASRACTAPPSPLPRQIAQKVVVAPSRCLGSESRAKFLRSPPPVPSCAPSRVVSPPARRRCFRHRELHDALTQRTEIESHRRRGLRQQAQWCHPRQCVRLETEKFTAVRHTEVDARVAVKLERAECSQRQPLNFRRLACRELGRELLARHARRVFALVIVDLVTRENFAHRQRLVAEHAHRQFSSRNKSLDHYLIIVLQRLGHRRREISSSTNQRKTNSRPLLRRLHDHRPAQLLLDLLGLWTRTGRLANEQPVRRGHAGRPKQHLXX
>A0A1F8KNI6_9CHLR
MLTNVLGDYLDSISERNFDFPFMALLRAQGFYDIHFTHGQVEFGKDFIAKQSLNGNIFQYSFQLKAGNINQATWRNDIQGQMLEAVISRLSHPCFDHTVPHQNVLVITGRLIGNASLGMEDLNRTIVDKYRSRRIQLWDREKLIDMLVSAGLEEFYSTTSSGHMGYGDFHILYGKSLKGYISEKDIENHSKNWLDDLVISKNRVLGAILESEIITQNCRRNGFFYESIHSQLSALRVILFEINNVQDPSDDIFLNKILSSAVINLARDCFEYTTHVQKSWEESGHDLVKIIPGTGKIFTYLVNCARILEIAGLAFFLVQSPDEKQVLCKFISNFILSEQGCSHIPSDRYAVSIVFPVLALKKCERNEVALEFLHRLTIWLCDRYEQGNGIAGIGKSPLEEISILLGAPFSFIATMKRNDNYLATVLSDLAAFFEDDIFYSKVINDIRAVKIFPTYWQISDNNDLFIIEGRSIISYPNIEYLDHLKRFNDYDFAQHIIHEERTYGLSQKVSPVSIMTLMLLLRDRYFPTLWNLLIE
>SRR4051794_33743283
ARSGWPGLADLRERRSRRRRASCRDAARAVKRRCRLVDREGSAGGGGKPLARGVACVVDAAVQVRADRDVRQRTCRGDRRRRGARRERERRDRGQESNYDHGERPSVAFERATELFHLPRQSPPNRERLRVSGIAAPACREPQGHQLVRRKPRQKSSPKRASRPSKGGLPRRRSRSNGPKCEGAARDTRPPSSFQGPAGPLQLSPCLAPTYAVCCEVTQPYVMCVGPCRVRPWSVQTSAALPPLSIAIEIESARSRLPSFTVQKIPFVQIPPTCMTELDADVWLNFGTASYPSVVCANVVYHGDCSGSLGVX
>A0A1T5DHB0_9SPHN
MARPYRNGINRSAGANGASAALRVRGTMAAAVIIIIIALTFSAAMLTGVMLIAWRSFGRPRHALLWAAAFAVATVEWIANLAFRIAHAQDNAAIYAAIAGLSCLSNALIAAGFVQRSRPQTGPGPFLIAAAGAALLIAGAAIVVPHDGVRDATGLLFGGAMMAISAAHVGRGFRSASLPERSVTLMLMLFAMLDGAMAVIALRQGIAGQGEAFALFRTILVLLYPPAFIGVGLFSVFLVAADLAETMRTLATSDVLTGVYNRRGFEDAAERAIRNAHRQRQPLSVVVADIDGFKAINDRYGHGVGDRALRHFASRVERLVRRGDLIGRIGGEEFALLLVNTRPQDAVEVVERIRRDIAAMPVSGPDRIVMTASFGVTGLRPGDISLASLLTRADRALYRSKLDGRDRVTSAEELEEA
>ERR1017187_5107048
MMRRPPRSTLFPYTTLFRSVGVGGKHHRRGGARVRQGIGGARRVEIRQGRRPARCRYGGGGGAEIEIRGQAVVIADGSLVKRDAIAGGIGAAIEQAEQSPGGTVVGEVGSGGRAEHGGREGSSAAIEVVGRRRAYSNELVRGKGEVDAAANAGAGQIDDIGAGILYLDELEVLVLIRAVRGRRRGVIVDLRDAQRGKGGDIKGFGRSAPCIGVEGAGDDSGIIGQRDCAAI
>SRR5450756_1904656
IVTPNGPGRLSSGGDGGLGGGGGKAYRAWLDAEQPAGQRLRGTLGLGEPDACRGDVEVGEAGAAEGAACRLGHGDRKHRVLLAARGEPAKHAAAPHRDPDVAVRVHGQPIGDALDPGQVDEDPSLEGVAGRRIIVEPVSYTHL
>SRR6267143_246127
PPSTSTRCRRAACPSRCYSAGPSSKRASKEPCRFRRSPGASRPASRCRWRPGKRSSTCISRTRATSRCSARCWTGSTATRSGAGCPPGSGRWNRCSRARRRKHEPRRDRPDRPGRALRGLPPVPVPGLGGEEPAAVQFRDAPPGILGGRASGAQLPPGRGPRPWRGAARGRSGALPPPRRAAVPLRTLAAGTRTGGRDPLPSRPGAVLLRPRGRWTGAAGRVHRALLGRARARFAPRLRAAAQPRRARSLCLPRGGAPPRAGLGAPAPGSARRRVRLAPGASGRGGRGRCGLPQPRVLAGPGGRAGNPRHHARLAHHPLRLPGGRPREPRRPLRRGRDRRDPVAPDPHPDRRREGGGPRDRSPRAGLARSDGSALPGRSDEAPRSAARAARGAPPGSARAHPTPAGRGRLRPGARGEGGHRGGRRARRPGPAAPGGHRRRRSGPRPRRLRPPLLLPRRRGGAAAMKRILVAGVGNIFLGDDGFGVEVSRRLAGRPLPDGVRVVDFGIRGLDLTYTLLDGWDAAILVDAAPRGGRPGTLYVLEPRLDPDAPAALEPHAMDPAKVLALVREMGGTPPLMRVVGCEPEAAGDFEVGLSPAVQAAVDSAVALVERIVAQLGAADAX
>SRR3954471_23318179
XMSTPPCRRAAPDALNAIRPAVGGCICGGARPAAISAAATTPWRVTLLRTGGSPAIPSFARSNRARTGSGTSRPTSITTVQNSLRPNAVPRTRPFPVRGAGCPATGPTSCVAASERSLRGYSVAVNKEKPDTADSDSGPSGADDDVVSDPAKSDGASGDWSDEGGAPPSGPADTGDHTQX
>SRR2546422_8761933
RCSLFVMRRHSLRGLARLCLLCFLCTHTALSYFFFFFFFNDTATTEIYPLSLHDALPIYLARHDGHASGDERLARHPGGGVLGEDRKSTRLNSSHGYISYAVFCLKKKKKTKKLTERIEHNTTDSPPAHADSCHTQHSPDX
>SRR5258705_435907
YTSYGKVRDLNELLPETAKAIAKVENPTLRDALAMELFGRGGVKMIQALTTIGNDMEGTGKKAKDLGVLLSTDVINAGKQTSIAFQRLSLAVQGLLLAIGTPLLSRITKMTEALVTWLAAHQHIIALRVHEVFEHINNSLNAFLAIAKYIVNNSGLV
>ERR1719362_736321
LKPYLANIAFFFSSGSCIWSHSLFGFTGVDLGSVFSIDLVVVFSLKYEGMLCCLLTVLLLCRFCISGTIWACFMGSMITLGFFTFGFNESSDIVLDMPEPFVVSKNFLIIDVLSSEPGTSVVFFSVMEGLLSKNEDASTLPMFFFVSAIVPGLLNSSRNFDFFESSLKGDVISGSVFVLTSVDFSSIKSRNALIPSLNATSLVFSQGLLEKSCKSSMKPFIALSLSLMLLASCSDF
>SRR5262245_8711603
CPPTEKRVGSSAAVRNDRPFGTSIGFVRRLLPALHNPPGRAGGPARLTRNRMTSRALITLLSWLTLLALSGLGSTHVGAQSGKPATAPAAAPAVPNRSGYLRFPDLNGSQVVFCAGGDLWITSDRGGASRRLTTHVGNEVYPKFSPDGRQV
>SRR6478752_7265712
FVSLVLLCFRPCSSLLWLDCCFLHCLFFFFLMIRRPPRSTLFPYTTLFRSHPVGELLADRPEVHARHSSIWVLATPASTCFITLPDAVRGRASSVSSTTVGTLYAANCAAQNSRSSSASTSAPGRTTTTALTSWPYTALSTP
>ERR1740124_914837
AAAKTRATEDARGRAREMSSMNVIMLEDGWAKLKTGGVKKIEDILEDMKDGVYKDKITTDEYSALYTTVYTMCTQKPPNNWSEHLYNNYCEAVKDYLSSRILPRIKEKHDEYMLRELVRRWENHKLMIRFLSHVFKYLDRFYVKRLSLPELAEVGSQAFHEIVFNAVKREVRTAILALIQREREGEMIDTKLVKDVVAIFVEMGGNRTSLEVYVVDFGEMLLSSTADFYSRCSSKWAEEDSFPDYMCKAEDRIKQEADRVRSYLHSSTEDKLLRVCDEQLLQTPETQLLEKENSGCEALLRDNKPDDPQEPQPNSDPPKRRRSPPPLPTVAGGSGQIDVISRLLKDRILLLGTDVNDEVANVLVAQLLYLAQDDPDADITLYINSPGGSVSAGLAIYDTMKFIPCDVQTVCFGMAASMGAFLLGAGTPGKRKSLPNARIMIHQPLGGAQGQAADIEIQAKEILFIREVRCVD
>SRR6478735_628956
QRRSERPWNAATWLTASWCRSDRRVLSDVGSEPLVAVSAANPLRCRSPQPSLHTEPDMDLGLTDDQRAIEQMFSSFFANEAPPAVARAAEPLGFDRSLWQRLLETGAPGMGAPESAGGGGARLSDLVVVAEAFGRSIAPAPLLEHIVASRVVYDADVLSGDAIATVALRPADADVVWRIVPA
>SRR5256885_2358642
FGGKTCYETENSSLLVMRFKLKASGYDVDGTDQTSLGQFSGRVQQTYKHSVPRFFVPEHGTMFTLALVRFPPTATTEIQYLNAKGTLTYTDIAVFFSSRRQHTRLQGDWSSDVCSSDLDPEATAVFPRLLASERLAGDSEPAGPDLASVTRPAERSSDDELPTAIQAPPAAGAPEPTQIGRASCRERVX
>SRR5258705_12133918
YVIIIKSASMNCMTDRPPGITALDERIPFLLSQLGAHIAGEFQRRMSATGVAPRTYAVLMALATEDGQSQRQLSARLGIHRNTMVSVVDALEADGLVKRTAHPDDRRAFVITLTDQARSLLPDLDNAGHALENAVTAPLSAVERNTLREMLQRIATGAGLIPGVHPDLAHSVAAIAKQRLSSDETSRRKRVDQPWPNRDPMS
>ERR1043165_342850
GTTAGTNFLGTTDNQALDIRANNLVRLRLNTNNSIQRDNAGNARGQNAIDLQASRANTTMVASGNYSVLSGGMDNKVLGTYAVIAGGEDNIANGDDNAIGGGASNWTNGGAATVAGGGGNDASGNYSTVGGGGNNTAQNTYSTVSGGHYNNAAGIYSSISGGLENHVLGLSSTILGGQNNYIDGNFSTIAGGAHLAITSGY
>SRR6516162_8751238
RFVFNGGPMRRLLLGSAIAMLGMFFAAPAMANPTPATGYLELCKYSDQTAPVTGPFTFTVTDGSYSSTQTVTTGTCTSPFQVPVGTATVKEQSVPYASVTAISALPSGNLVPGSVHLGQGGSAQFTITGGDESTTTTAEFTNKEVTGYIEICKQAVPGSGLTGSFQFAISGAMGYKQNVTVPVGACSDSIQVPAGSVIAQENPGSSTYVVSITSTAGFTTLPMGWTSNPDLLNARASVPVAAGDTSAETILTFTNSPSVLKLCKAVTNSSMLGVNYPFTVNGSPISVPAALAPNATCEIVPGIFTAGTTVNIAEGVVPGTQVQSIAVTPSGREVSGSNNPAARTDSVILGSGETVVTYTNEPAPPGTLKICKIAGFGVAPGSMWSFTVAGVPGTI
>SRR5262245_26240924
KANPKPEGVKTPPEKEAITVPSKAKAEPAKPKPTYVTVVGQLLDDATGQPIEKAGWEWGQADPKKPEQIAWGHSRQGDGNYPGGKFAGRVNIGADGHHHTWRVYSAGYETAIVVDDLAKPYPERIERVVRLKRGRNITGVLRDHAGKPVANGWVFFIPKGHRANIVEGVPGTDAHELPGRARDDAVAEVRTNADGTFAFSTGADGALAASTDLVDLWPFPLPEDGHAVLKMPTPSYLVIDLTYWYLDELAKKGKRELSPNSEDPNQCWLAVD
>SRR3990172_2002343
YTLSLHDALPICRRGIQDIFYAKSFDGGLTWTDPNLRVDDDTGSAWQAFPSVAVGPPGNVFIAWGDQRNGDADIYVARLAPAPPFVEAPTVDGFAPGSAEIDHLIGNVPAFGFTYRDLDLDRLTAYNVTVLDGALAPLWTCNRTLSAPLPDGFPIFVNYNVWPCPTSGPALADGSDYAVDLTVQDATGRWSVPERVGFHLNEVLGPTAPVQPAPGAVVPCSRSHTLSWTAPPADVEGELPVSFSYQVASDPAFTAIVASGNSTFNVTDPFTTCPGGPYHWRVRATDGWEASTWVSWNFSTFTPPNAPPSALNPAVEGYGEGSPGILRIGPDRPTFLWNYTDAEGDPQVEARVTVGTANGSNDIWDSGNLTLSGSALVYGGGTALVDGAEYWYGVRVHDGKDWSPWASVRFRVNTPPRAPLAGGGGRGGRPPHLSGLDQHHARVRVPLGLRAGLGPLRHGHGGGLHDVLLAGPGPRPARRRPEQLDVPVHHVPGPRQRDGPCHLRRAGPLRRSGDRRGVHPHVSWRRLVQPRCERHDGERRAGGLPPRPQDVPRARRDRHAPRGGPLGEPYRFLTEYLPPHP
>SRR5262245_7034097
YVLVTEGTTSFDTADVQVSTNNFATFTTVASRSTNLPNSSTWRSVAPVSLASFAGQTVQIRWVFDTRDGIANNFEGWYVDDVQITAPGTWNDYYSFTLGAGETATVALKNLTGSGTSLTLEDGTGATVATGLAGPTNFDRVISNFTGAPGAYFLHVSGAVAATYSAVVTRNAAFDTEANDTFLTAQPIAGGQAALGAVATSASTASTVIPNANTNVEGDFSNGFPFHISAFSLPSMRYQQIYASSQFTGGGVIDQIRFRKDVSAGTNFSTSNIDVKINLSYSATSPTAPSNIFANNVGAGVVTVFDGLLSLSSTGTGTPNPFDIVIDVANSFNYDPTQGNLLVDVFMRNSPVTTFFDAVGNSPGVTSRIFSNNTVNDTSGSSFQSGLVTRFDFVTTGAAQEDWYTVNVTNAASALRLETATPADGPNQFVNTLTPRIALFDPTGVQVASGTPLADGRNEFVQYQPLATGAYRVRLSAEAGTSGEYFLTKNFKPAVTSLSVTSPINENDVATLTGTFTDADPLDTHTVLIDWGPGEGTTTLTLAAGVTSFNSTHTYLDDNPTGTSSDNYPVSVTVTDSPGVSGSASTSVTVNNVAPSHVVLNSGNINENGTFTLTGSFADPGIQDAHTVVIAWGPGEGSSTLTLPAGVLNFTASHLYLDDNPTATDADTYPVSVTVADDDGGSGTGNTSVTVSNVAPSNVVLNSGSINENGTFTLNGSFTDPGTQDTHTVVITWGPGEGSTTLNLAAGVLSFSAAHQYLDDNPTGTASDTYPVSVTVTDDDTGVGTGTTSVTVNNAAPSNVVLNSGTINENDTFNLNGSFTDPGTQDTHTVVITWGPGEGTTTLSLAAGVLTFSAAHQYLDDNPTGTASDVYPVNVTVTDDDTGVGTGTASVTVNKLAPSAVTLSTGTINQHVTFTLTGSFADAGTLDTHHVVITWGPGEGSTTLDLPAGVLTFTASHQYLDDNPTGTPSDVIDIGVTVTDDDGGSATASTSVTVNNLAPVVTPIVAPTDPVAAGSPSPVAVSSSFTDVGTVDTHTAVWDWGDGTNTPATVTEAGGSGTVAGTHTYLAAGVYTVTLTVTDDDAGAVSVSSGYIVVYDPSAGFVTGGGWIDSPAGAYAADPGLTGRASFGFVSQYHVGTSVPDGNTQFKLHAAGFDFRSTSYDWMVIAGPKAQYKGTGTVNGIGTYKFLLTATDGQRPGGGGVDKFRIKVWDPVTGMVVYDNQMGASDTSNPVTALAGGSIQIHDNSHX
>SRR5690349_22883871
LYPLMSSLYSFLFVFFRLFSFTIFFFSMIRRPPMSTLFPYTTLFRSDARSAGSRSRHRPSRRRSRRSARASTPPARRRTRRRPRSEEHTSELQSRREIVCRLLLEKKKRPHLVCLLLLEKKKNTAQNTQ
>ERR1700731_2171409
LQDPTGAVASRGCGKVDLGVVDTVEDVGEDGGRESQADLDQLRVAIARSLDRGEILVADGATGLCELADEADQRVALGAAGGLTLADLPEHFRLRPGELGEMVVGGDAIVAAAGGADDELDHFLIALGQRARSENRTGGEDRLEGGRAVGCNGSECFRDAADGLLIPDDQQLLRTFNSPWRKNRATLVRAIKVSGAAICRGRTCARCAPNITRRIAARVLVQRAFTTQFEYSDRCFRPTRAFQSLKPCLSANSTMRRARWEPQVSASKLACRSCRRRSRTRSTMRLANAYGRSADRTGKAPTKAVLAQRYRPFICPRRFLFPF
>SRR5688572_8862321
ERKLRWDNQQRRLPAGETGQPLAHADGHGKVLSVERVELGLVVEQFQMRRPAGLEEVDDALGLGREVGRLERSGRGRRAAGSRENGWVDQRGHRQRAQAQARARQQLTAGNEASLFQEFVHMLSRYFVITSSRFSSMLATVVYAASSVASSFSSRGDSPIERSFAAVSGFALYAANRRSKVSRSTFSSSADGACAVARRNANVIRSSAAVPPSCIIRSAS
>SRR3546814_633682
IDHDILYFLFFKQKTAYEMRISDWSSDVCSSDLIGKFGGEPIVDRENDGARGGSERAHRAVLAARRPHDITAAMNVEDGTPRPVRNIKQPAYRAAFAEGYGARLDAIRMAQGNFAAGHQTAEMRQIVEGKIVEIGNRRQGADQLRIDRRQCAGSRFIHLLSLPIAGLSAKQARRSVGPCGNKIGRAX
>SRR6185369_2348986
LVGITPPALPTLPQTSAHTTASVEPPDGTSQSARATLVGIADSATPSGPAPIGQRPTPTLNPVIEQARGTLLYFALQNNSYDLYTLNLNTRAEQQLTFNVGGDSYGIYSPDGKQIAFESDRDGDFDIYVMDADGQNLRRLTQNVVTDRLPSWSPDGQWIVFSSDVRGDTNYDLYEIHPDGTGIQLVFSDGERSSHASWSPDGRSLIFTHGNNLDGSTW
>SRR5262245_26026989
EPDLWPGKNDGSDFAGSAQYTIAIAIRTTPRMIAAAARRRLLLTRKKSRGPLGGGRVRGVRELAEFARDQVGRLLADVDRAVADPLDRACDDHHPQPPLAKAGLGHDVDEALDEPAVRPVDELVEIDEALGTMPLAPAERVERNADHLLRAVTHLRQDVDERRVRLGAGDELRELRNRDAPVCRPLEQQIDVEDREEEPQVACDRSLQRQXX
>SRR5687767_9486488
DEVSRMRVSTCLGFAVTLFVTGCDKAVGNASVTRTLDSLTTIVDSLNTRLGALEWDKLISGVEGVAVLRPSDAGYDRLATDFGSITVSLEDVVPYANGSRITLKFGNVTSATINDAAANIQWGSVDSA
>SRR3954452_6150108
PGHVPRQQEMRAEDLENPCKQVDFCRTAELPERAEEQREVRAVLVVAAVRDRPGVEVCGGLVVVTARRVVRQTQHPEQERADQCDRQPDGEPVAPPAGEQRGIERKRAPGTQPGAHPQPTARAAAAAASATCSTSASVSSGYMGSETTVRASSSAPASDRP
>SRR3954453_16503950
DRRRHVPAARRQTAVGVCVNWSRRWASRWRSTTWTVVTAVTLAQAAAWRGLAGQLVGGCASGLDARFDRTTVFTVDRVGRSAVDAGRDLTIDAPAVNQRGRRIERIHRFDRGRWRQRRQWLDHRRGQRLDGRRW
>SRR3546814_3464296
MSFLQYVVLLVISFFFFLRNRRPPRSTRTDTLVPYTTLFLSDRRRPGGCACRGRPHAPAGARPARPGQGAAAGVHARRHLLRRLPVAPEGPRRHRDSQWRGQPRRQQRRSEEHTSELQSLMRISYAVFCLKKKQHKKIDKSTSKTPNTQQK
>ERR1017187_7010674
PYTTLFRSSELRNSGRSFWDVRRATGGIHLFPCHFRLAGLDKSYQNSAATMLGGPVLPLMISVESTMAILFPSQPLGATASSFLIWLGSVRNSPAIRVPKQVIPAAVTTICSVFGSLSRRTIAX
>SRR6266545_5506238
RLSAALPPAACAGPRCRGGRAAGRGRSTRPGAACRSSRSAEDRDPVHGVRRAAHARVVAERRRPRDHRPRRSRHHPPVPAALPARDRRGAAAFVRHALSLHRHAAVERRGLNVRSLSRVVAATLAGVVIGLVVGYIPSLLAYGLVAGATQNTISRTGGWAEAGAVGGVVWLASAGLIVGFLQQRVLPPTARSIWWVVALAAVWAAAHVINMALRGLAGDVDLAAILPALVVISLVAGVAALRLATRVTRXX
>ERR1041385_9034566
RSDLGFLTDRRDDVRRDVPAEISRRDAQERDGALGAFLANPFLRRSTDRLQGREVGCIHEQDASVAPTVNYHLVQQGKIRRQYILLEAVAVDALLLIHVTIPARQEDRDSRFFGRGQSWSNRLCVSPLRDDEVVLLTDRANDPIS
>ERR1719323_877409
FTSTREWLVIMQNPNEDTEWNDVLRKKGIIPEKPKEAEVNEEDLVRMLEETIREKSGVKRTEDMDLDELDELEDEEEEKILLQMRNRRMAEIKARMEKSKYGGHGPGRAGRARGRGGGEDLAPDEEPEDGRDQGQNGKIKIWRRKRDYCSRLCSGSEQGRRRCVCDPALVQAGRAPLRPGQRVHEQAGAQVPHHQVHQGHLDHMHPQLPRQELAHDLRLPRGRLEVPDHRTRADARNELDRERVX
>ERR550517_2316039
SEASLEGTAMEEETTTVTDAVVAGGEGGDGRMEEVDEAMEEEAVDEAMVEETATVVEAVEAKTANPSQNSLAPRSTNSGAQAKLQVSAQKGSPSTMLQRPKTAVQICPQTELSVGAKAAMPKCASTAVX
>SRR5689334_23514466
HLRPCTVLIMRVPCFYLFFFKDAATTEIYTLSLHDALPICADHVDADVRGTPVGRVGRILFRTDERGRVPGVAGPPFLDDPSDADRKSTRLNSSHSSISYAVFCLKKKRTRPEDRTEPSLRAF
>SRR6266436_2860317
SPRCSKRGVMLIESSFMILFKALWLDNPKSKRSPGTLLSVKRIANNWRRNCNRVFHPQNLPVQLSSELLAVGVAFAQVIEMHRRLNGALAAQVDEMRHERHVLPVTNLLAHIAVAEFVSEKTRRQRMSLPRGGFXX
>SRR5271166_360653
CDARDVEFQIAERRDRDVADGEGKIERPEVVGVADIDVGDSIGKSDVNVPFDGDLYRDRDVHVLQQGMRRVEGEADVAERETAHRDRPDAQLTDRNRLQACLLYRELRDLELHDPCPPLGNELIAMSTELQNARAARPRASFLPVRRKYSLETDQRQLRREPIALSRRANGASAARSMVEEPLPPRLTRSAFAIAPLPARGX
>SRR5438128_8400954
IAGARSDWSRSGVAVRRGRRAARRVDGVGFPAPAQRRKRGPTGSPSDRGARSPGSVAVQSLAGTFQVFNSENRHPVRFGRGVARRGALAHPTLLRRRPMLPAVISVRAGKPASASRPSRASARVGLGIVLVALLTLSTASIVSAHAFLASTTPRAGERLLGSPSEVVLQFSEPVSVESGGVVVHTAQGAAIPLGPSESNGRSQLRIPLPPLAPAVYSVSWSVVASDGHQSAGEFAFGVGTEAIEASTAVTSDAPIAWPAAAAGAMLLVGFALGAGGLLSELAV
>SRR5262249_6274811
LFALAAQPDWPMAQVWREPLKSTLRRRSWGGDLDGPQESVQHVNGRVPFAGTSDDLRGRIAFRFDRRGDRLCALRGACNQKPARGLRVGQEMALPVRASRWKLDAILVAFPIAMRSAGDEALLRQLRSLVEQRDVPQIDCQPQSGAARHLQCMAEQAKARHVGX
>ERR1700710_2726627
CVTTRSRRTRRSGRDFPATSAGVPATRASSTRCTAPLRPQKRGKSGVLGCVPQCALGLQVFVEPVLAPLATVSAALVAAERGVEVERVVDRHLAGADPARQSTRSVQIGGX
>SRR5438105_150411
AADRSHGERRGRHEAHVVPALLVRRHAHPRRPATQVERGAHAAAPDLGLALLAGKAQARRAAARFVEAVHVHVLVGDPHRGPDAQAPEAEIVAPHELGRCVRAAGLRGGGARYLPQAERAADIVEVEVRVRHYAGAIEPAPLHGAEERPGVLAGAEASRFPTEAGVELAAPIGDAQGRALRYAHREAHGGGGDVAADAGIAGA
>SRR5919112_1724051
RGARRAALRDQGPHRARARHTALLQQDHHLPGSTELGRPRGSLPLARAREVLPYAFERAFQGADPRAQAATPDHGHPHHEQPGQPQRPFLRVQAGRGDGGSGVRDRPCLHGGARDLLYALPVGCYRGPGQYVRGEGADQDDARRPQTRRACDPLAAPLPPRAAPRRGDDLALLRGCCRTLRAHPWDPARRRPRSGGERGPPPYRGERTTGRGGAGREPRPAVLRTGRFRRGQLHGRVPRDDSGLILHPRRQAQAPLAATPYPGSPPRQSLAHARALGPARRHLQPAGRPRRRDTKRYSGRQTRQRTHRGMGRSQQGARRPHPAGSRRHKLERYLRPLHPLGRAAGDPKPHHDAGGPARGGGCAKWLKPRCELSDISYLFLLMADSAIWGGSMTLPKSLERLSVGGGALYVLAGAAGYFPGLLVAHVADAFGGDADYEAPGWELAGLGDDGAGGDDGTRADLRAVEDGCAHADETVVLDLAPVHDGVVADDASFADDRRVAWVRVQDAAVLDVGSGPDADRLCVTAQHGPVPNARFFVQVDVPDDVGSRRDPGGLCDPGEGVAVGKHVALFVQIQRGALTLYSRYTSPNFRSRX
>SRR5258708_1650640
PMKSRAPVMHDRCCDGARRARRSAMKRGASSGGSGGGVATLLAVVVGAAIVAGAGAARADVVLEGLPTVSVGYTDNAALAPTPVVAPGLPPRSDEFGIVAGIARARLRKAHAEHSLGYRLAETFYFHGRGPSSLAQELAWLSDLSLSAPTQLRLGASVAYGRTSNPTGVDASGAGPGAQLAISSNIISLGATEELVHIVGRRSRILQNLRFAGVHYLNAPGAFDGTFVVGAFVRGEHEVGQSLFSLELDVADNIVPGAVGVSDQVLLLQSLAGWRRDLGLAWWVELKAGALGVLDFHGTEILEPAALASLNYRQIYWFATLSGSQTATANLFIGAATISDQAMLRLALPLARSERYLLAGYGGHTYARLIDDTGPHRGYTLPPAAPPF
>SRR5205823_11678186
FGTMALSRFVIIRKGAIKRILSRREFYRNVIAPISRIWIVQAAVVLGQSLSHELTRFGTGLLGAGFSPIQKTVVTIWLFHGKRCPGSIGFRANCPGVNAIELTSTTRSSADFWDFLLNLVLAGSVFEAVPCAX
>SRR5690348_5794318
GGRGGASGSGGGAVRGDANKNRRGGGRGGASAPAPSDPTSLQPFDFEKANSLFDKDKLREEDGPLVPSAEAEAAVDDEPPAYSKDSFFDSISCEALEKQDRANYNAGRVTMDEQRRRDMETFGAVSVNDRNRYRGRGGRRYHNHNNRGGGYQRNYRVCL
>SRR5208337_1056505
SSSPLSSANGPTAPADDPSSSSPSSAHSSASSSSSSPTSSSPSTPASPSSSSISPASSTASPAATSPSPPPTSQISPPPRTAPKAWGSSAPPSASASSSVPSSVASSENTSAFTGFPSPPPSSPPPHSPSPSSPSPNPTTPATPTPKVSAATTPPPSSTSSHAPSSACX
>ERR1700722_2816766
LNRITNCGLVSKSCRIWFPFQCSGVESGEEDEDDKNAKEETAAVGDGVDNRVFVELAARALEPETHDPEEKNGDEKPETPRVLVELCRVQVRDVEGQDNDRGKAACGAEGAELLDVGDVVAAASSGDAAAFAQAFELGEALNQGEGEEEEDAEASEPGGDLDSSGGGAGDDTDGVETRQDDNVDQDGALQTQGVSEGGEEIDAKPQKEIIRFDQGQRVRX
>SRR5262245_51317312
CRVFSALITTKQSMMAMMAPTSISAIASPFLADAAAAAARARRRVSGCELVKRPGTPTSSLASVEAALPNDSLDPGRDESVDGTSGRESFPDRRGRHVESRDRKVFDLPSRSGWFGMLAGALDDDKRRERTGVLEPLPRRHVGDRVGPGDQEELVAVAAERLERVGGDGRLVALDLDRATIQAVDAVDRGLDERESITRRGNHEPALLPRVAGYDEEHAVERKGRARVHRGDDVPDVHRIERATEHADALRVPAHHGSVRAPVF
>SRR5439155_7586424
XWDAESVVDLVGHLVPVGELTARRVSRCEDGLQVGECGLSSDSSKDRVGEVIRRQLAVLVRRPARSPAVAVARPADLVRGELILTAAAFGCKARRDDDRILELARQECGGDGGAEVVVGVAARAVNHDHRAGDLLVLLVHSIRAIDQRAAGPAADRDPFRAFLLRDRARRGVSRHRRREADENTGGKDQRAFHVADDTTLTSTAWRLAPTCPCALYSIQPQDMVESX
>SRR5262249_42789402
GVLAVAQLDHARDAHEIDARAEIERADDRRARQDQHRELLEAVDERVRDRAAAAQVPQPERVVAVDHDATVVAALPHGDALPPAGAVFYNVPKMVTLLMFSGGLDSTAALYKLLTQDSGALRVHHVHLINREARARAERDACAAIIDWC
>SRR5437667_1021999
LETICLKCLEKEPGRRYATARELAEDIARFLNHEPIRARRANPVRRVWSWFIRHPWIVTGAASLVVLLTVGFAYRMWERVDALEWQHAHPKESPPFNSEYFLPVWFNFLLLFEFLFLQGVPVLSFLTLRARQQRANWFHWVFAMMGAVQLLFGLEILRRAVATQAWQPQFILGPILASIAALTNVWFGSALAWKALREARLDLPGVDLSEEPIEHPLEFTNQK
>ERR1740121_1965673
ASWLAQERPAAAAGLAFRRARHGRTPACAEDCELRSREAVERIRQYAWQLVLQSRENISMAGKSAEWRLNNTLYERSREEQRNLQHASKQHREQALVQEREWLAAQTAHNESLRSAAEYELLSSAFSAMMKEFSKDRGLWQQLSQNATRLRQEFGDAVQDWSSAVGESSLASQTGEVLLRNSTATLYEDMRWLKEAHREVGVRLVRVGLQARPRGRVPGAAGGEPGAARAAGHADQCREAGQAGGDDYRGRGPGAGGGPLRSAQARVPSSGRARKRLFPAVSX
>ERR1740122_63733
TSAEPTAEADNDEPDEERQDPIFEALAILSLDGDVRGLLVAACCGARYVRRQLCRHPDADGAGFVLDAAQVHTTLELEEASVAPRVAPRVLRYPILHLTSGSLRLDTEPHEHDHVPTDDLTVVTTMLLEVHCFGVVLPEREQIDAHAEVHSQRSVGRQLCSHHVGGATSQCGLLQRQLVEGHDFDVAVGHAALLLSVCAPGPLRTRACSARIELVLNVAPSALVGHLVLPDCCCDQRVVSVGGCAAVAAPPAARDGAPHDVLNAEMSLAEHVGAIAAVIALAVLHASALPGHRGDGKRPAAAAGTLGAWLQLEAVGPLRAGVERRRHVVRNVR
>SRR4029453_18409069
MTMRRSDPRRLHAGRMPPLRAGLAVGETVGPRARPSGGPGSRQAPRREAHGPGVGEPAMAPRSSEVAGRLPRARRGAMAVGYTPGAGLDVQPKTGTAWRVTPAPRGPQAAGILERTAWGTITADRRALADWRAATGVTPVAMASPAASGRPVDPLREGPVAVWLVHAAHVQQGPGHQTDQAEARWWAPH
>SRR6185503_13583503
RLDFVARAEGWETCAVTVPRPDDVWLVSRRATAVRGRVTDAAGRPLADAQVWRVEPPNEATMTPTDSSGAFESFFTAPGAGQFRVSHPAFLEKTVAVAAPSTDVVVALEHGREVSGRVAFPDGRPLPGVPMYGENERVATTDADGRYVVTGLTEGRVDIRCGLGNDIERRFVESGTTGVDFVVDRPVARIRFVDADGRPFRFVTPRMRVCKDGKDLW
>SRR5579875_218622
PSSGRFCRLPRGRLIPAEVSAEALARERRMHSIVQAQDSFHNQLILLHRFGGAGADAIGERQQHQIGQRQPVDGRYERGSDAGGHRSQIGKPAQDLEETDHGSENAEGWRKSAGDFERARAAFQLALAQADAAEQRVLQFGSLRHIQREGERFSEERTAHAFEHRLNRQQAAGARVFHQRHDLVDQFGVIQLRRNKELARPPEGLNQRGAGGGHEKGPQGSAGDDQRSGGLKEIDEPYAAGRDAGQQCGGRDGDAGQHPNIQARRRRRARHFFQGGGGGQRATPARCEAIRLPRAGGRKQRRARRRRFVTGTSLKPSCLEMTRREAIVIAFGQPLAASDTRPFWEGKKPEDWTEEERRELLSRSPWTREAEVKFNGGPGPLGGPDGWLMAQPGVILNEPNGSTTRTPKKFAATVRWESALPIRLAGGNKSGKEPANYVLSVTGDLPMLGGAGEETDEEHQSRLENLKQYTRIEKRGGPLYLADFADQRGKGTEAGTRFFFDRSDPITLHDGSVTFVTRLGPIDLKCKFALKEMVYHGRLELX
>SRR5277367_2534031
QITSFCEEHHIDLLSTPRSRRIRTLPSRFKDAFITISVGQRVNMNNEDQYRANLYYPLINSVLIELNDRFSFENMQMLNGISALCPDSDNFLQSEVLKPFEVQMKADLSSLFNEIQVLKSMLKDTKLKSIV
>SRR6266568_6098953
GVTITVSAPSSAPAGLKGVHPAWSPMQPANVKSPAALMVKWLTVLPRVEVAYSCLPSAVTATPCAQSSAPAGEVGVHPARSPMQPANVGLPVASIVKWLTAPAWSPNLVVVX
>SRR5207244_11792182
GARGEPLGLWWARRVAGPAGARLGGALRQGAGASLPPRHALPPLAARQGSGCLHLGERPPPAGAERPDGRRAARRRSLTCSPARHRTIVGVGVRTRSALAAPAVAALVLAASAAAGPPGQWTPISKGSPLSSDEVGVARTPDGVLHVX
>SRR6266852_3314374
RTTSACRRCRSRVPRQRHSYDVSDQRECGPGRDNGDIRVASRSLLVGTDRPERGALRMNHNHWDDLARENAEYYICPSETDYSTPEGRRHFFAEGQLQVNRLLEDIGQDIHSHRRALEIGCGVGRLAIPMSQHFDRLSAVDVAPRMLKALAKN
>SRR5688572_20022461
MIRGSLGRLSSVPEAALRQRYWWSCRSSRRNQKVATAGIRMRRWKPARSPRRGTDPATRADRTPPPCSRRGACRWSGAPGGPALCTCRAALDAFPGAAGVGGELGRFILGVSDDFIDGRHAVADQPPAILAQALHALLDGRLADVMRWSALQDQRADLIAEEHHLEDAATTMVAAPLALSAAGAPVENRRH
>SRR5579859_288497
LSCRKSAGDNEREERKNGAAQTTHLDGTARRTLRAGGPFGAGRRHFLRDGGGNDRAEVSLDYVFAGGLRTVERRAGATGRRGSRKRGIDPPGPTNSGEGQGEEPEYRGGDAREQAIRKRYFDGFRGEPGDGRIAWEPLRQYQPGDHRCAIERRSGSSRDRRKSHEGSGRTERGSARQSPGVVGKRPGSDHRCEAGQRLAGKDSDRX
>SRR5688572_26030911
SRRGDRLRAHPSPARPRHGRHHRRNRVRDALRRRGPTQASCARGRSVLGAGLRSYLRRRLPMGAPYVVREPVGGSAGHRVSDYAVVHRSWLRWTVRGWPGSEPPEMALAAQRPHRLHLLDHRRGARAGRRPRRVGALRAGRVLGDPHRPAGARRVWSTAGRRDHRLDRPPGRDQPRCGHRASSHHRRPAALRVVRGVVAGGVLGSRRRARLRGARPGKLTAAKSEAFRVDRLGRSIVIAAGGTGGHIFPGLALADALRLRAPETPVSFIGTPHGLEQAIIPKRGYPLHLIDMKPFVRRIGPGPLIAIGSLILATGQATRLLRTHGAAAVVGMGGYASLPVLAAARRLHLPSLLHESGAIPGLSNRVAARMTRHVALAFDEAARSFPRSVRPRTVGMPLDASITDLERGSLRSDARSALDLPPDARVLLVLGGSLGAMRLNRVGVDLASRWRHRGDLRILLKTGAEHIEAVQAELHRREVSHLVRCFAFFERMDLAYAAADVALCRAGAGTVAELAASALPAILVPYPHAPRDHQTRNAAPLARAGGAVIVPDAEANGARIGAIAEELFGDEER
>SRR5437867_1173916
SAWADVALLHAALFGATIVSSRPIDDVEAEGVVLIKQHLKVGCARSPKVSRAPLTNEDAVGGGTGNRGENAAAAGESRAVGLCIGAQVVLICDNGLDDRLIRQGTVCAQIICIARKLQVAIGTDVCTGKTRTVKAYRKRKRNGGCAIIAMVAYVRVPGHDCVRRSRRGIVAASAGGSARERLLNGNHIWLDHWFGDALLGDPATAGLRQRKWDRADCDEQKX
>A0A0T9YTR4_MYCTX
MRSFCPGRSPQITVVRARSGRASVVISTRPGTSTSCSIPAAIISALARVRCMRSAPRSVRSCSTACSGLSRMADTRGSAEVSGTSSLVTSSDCTVTRTNSSIASTTYSIAATLRWASDTSRVDVTLTCLPAGERQCARRVSVPARRSRIRSWEINSPYRTSNGSSPTNRRKILPLVTSTTVWPASGYP
>SRR5882724_3941186
SLPSEGHAEGDEDTARGSGRERAVRDQRRLRLAVEVRRVAVFAEAILRVEEIGRDDAKLKRYPGRGGGCVDREDVVARLAVREWTWSDVRDAGAERPAQGPSEDEPWEVVKEGSVGAQDRAWHVRDGGARVVVCRADERQVRGFVEERSRTPQRAEPPRSSRADADDVAPLRLIEDEILVDNRLEDDRAGDERGVTQVAREGGAGLVSRDAGERGADVGDDVAGIDRADALAPAQRERKAAQWPRDQRSARQERSSRGRSDLVGLARAAEVLLCEAALVDGRVAGRRMRDGLRGAVVMHVIREQLGAAAPAEREPATEAQVGVAVEAD
>SRR5258708_38243777
HDVDRVVVGGQAADQLQPLAVRRGRELLVGDRVLAVALVAAAGDRLAGRARGIRTDVVVERNRTETTAAGTARSQSGCGEGGAGENRHALPDTVGPSPHLASNAELRLEWLPDRREDRRLWPAGRPALPRCTTSIARASSPATPTATSRTLALPNGVHR
>SRR5262245_54597287
GAVIASVGCAFTTVDAIDAPHVLAAKLSIESPLKETYHQYVPAAADEMPALGLQRPSPVGDAVPSVVPPEVPVEGAVAPVKYLNVSVPLVWPELLASVARIDVGRIAVPVPAVSGDVSERVGDHLPLRTCVTGMLAPQALLAAAFVPSVGIDA
>ERR1700689_1111789
AGCMRRHGENIDEALRRYEETRRPATAAIVQANRGFGPELPMQLVEERAPDGFANVADVITPEEIAEVTERYRTTAGVSLAALQRRTSLFEDPYPLSEHRGQGARKGIRDGGESPGTRATVWGKMRQWFHPIGMPQTEV
>SRR5439155_12922379
FFRRLMRLTGMGAETGSQKSVSRDALPVREQTPSLPVLPQRLDRSFTPARPLALETGAATKAMLALALANGDDFAGSLADAGSALDWRWMAAALALGVDRWAEPPARRSKQTNFSPKRK
>ERR1711871_374509
VQQHRDSNTESHTRAHSNITTQEQAIIDHANEQLRNNGLPNFQLSSDELNPYSQSTVSIVNGSGRQDVDVCSNNEGFQPIYDGPNLACPDGLLQFSHEIPGQNDWYCCMLPDDPMNISTDENGHKSSKFASMVASNLERLQSAPRAFKIGLGVTIIGITLSSKFRSLVSKIAT
>ERR1711871_1877964
KDYSVASEVTAVLSLILERAKYDDLGVSSSLLSEVYATLALLAQACQDNLAIGETPMSFVDDNLRMTVAMTDSIDMRNKSFAVPVSTYESYAGETSASLGMSDMADSENAAGSVGLMVLQYLSNPNAVPTNSTSLLLEATKYDSSSRRRTKRRLTSITDRRFNSGLRGRSSRQKRLARNQD
>SRR5579859_5275108
RPVLPAELAYAAADRVQPGRGKAREKVVLDMPIQSAQDRPPTPPDDEVLARLDLKAAPGIGTFLAEIRIVVRRDLVADAAPHLKARENEISDHGRDQPCREHLFPAVAGHRREKHILISDEDRKSVVX
>A0A257SWG7_9GAMM
MSAGTDSRRAPRGGALFVWCGLALVLLLIPSLAPRAAGRCGADRVDAQVRVTYVYDGDTVRLADGRHLRLIGIDTPELHPDHGGPQPLAEAARDQLRALLQRHRYQLRLRFDQDRQDRYHRLLAHAFLNDGSSVERRLLDAGLGTALVVPPNLWHLTCYHDAQAVAQHARRGLWALPAYQPVAAARLPRDADGFHLLTGRVTAVRGGRRGIWLQLDGPVVLRIPRGDLIYFVGHDLPALKGQRVLAQGWLHRSFGDRSGWFMAVRHPEALEVLR
>SRR6266542_84348
RDRHCRNLLRFQVLRAGPHEVYGYGPRGQEISRQTRRAVSGGAHTKGVHVKIRFARGRGGSLVAGGALLALTLAVLVQSASPSGEEGATTRFAPVDISMSGDRPSSFTPAALAGSSRTLMLQLGPAPLAAHDAAAARQGRKLSQNERAAIRAEIKSKQEPLLGRIRQGGADVVGQLQSAYDGIMVRGGDLARLAALPGVVAVRPLEKFQASNERGVPFVGTPPVWASSLTGAGVKVAIIDSGIDYTHANFGGPGTRAAYLDAFAHGTEAPPPTLVGAGAPK
>SRR6266511_5884634
WTSAALGTLPPHATTAAVAEGVGVGVGVGVAAGFFLGLFRMRAYAAKPRPPTATAMATDAARMRWRRRRTRSRRRRSANFANCRSRVFLLLWGMVRTDEPTGWWLLRPCDRRCRRACRSQRSGP
>SRR4051794_24959122
XMFSSAGSAIIGSSDEAGGGPPIPRVHHVQGQPIMEAKLRLATLVAISLMPSARSLAHAARPDVVLADFEGDDYDGWTTTGDAFGRGPAHATLPGQMPVSGFHGKGWVSSFAGGDRTTGTLTSPAFAVERNFVVFLIGGGGWEGTTCVNLLVDGRVARTARGPNTQ
>SRR5437762_3811764
FRPRDRVKASRVNAFQLPQDGRRPRLRWRRALILGKIPAHRDFSGVAGRQHGTIEGRLALGDDIVKRDLLDRLCQQLADAIRQRAVVDEIRRLAGDPLVVQRRPLLQVGGNVIGDRKVLSEHVSPAGGKSSRRVARYGKWFPNIAPRSGTYFRCRLPKAAAMPSGLPMRSISMSMRSPPQNNSPLNTMVGTPNTPSVSASSMMRSCSARAG
>A0A2E6AYA7_9BACT
MNFTAIECSTNVCSIASYKSNKLLNVIDISDSYNHSTNLPIIFKSIDDDLKKIDTKVNYYAISIGPGSFTSLRISLSFLKGIVFSKNIPILPVQTHAALNVGTEKIGKHYIIIDSSKDRCFIQKFNNHTQIGTPYIEKILNLKNLDYPIYGYSKNIEKNNYIKPSSLLIGAYVTKNYKRLIKKPAKDISPIYLSENVYKKIDDT
>SRR5258707_10299995
FAQDDRNGVVWWEADDGIVVIGVIVVQWFVFFFQAEDGIRDIGVTGVQTCALPISYNRTAMSRTPPPSQPDSPELLSEADYEERSEERRVGKECRSRWSPYHX
>SRR5882757_10583142
RINDAERRVERPAAREGQAVRPRMAGDAIPRDGEVAAPFHERGIRNPSPCAVGDSGIRCVREVGYDETGYDEAGYDETGAQAGGAIELHRGDGHGMTACQNMAPTPVPIFGGMPRARFSSTGSAVAESPRPRLPPARAVS
>SRR3954468_7113634
LDGHPEAPTGERSACELNVDGCTWDAIAGELNRQEIRRPTASSWSLVNTSKIARRAALVLDIYSRRIVGFALGQHHDTALAYAAFAMAECVRGGAVDGVVLHTDGGSNTPHGPSRLTAPDLGQPVDGPARAGARQTPRSSPGTPPX
>SRR4029077_1358176
SRSRKVPRQRCLRRSPSTGKTRGWTCAVPSPTLQGMGMDTYERPAGAGMEATQGPPQVGAVDSLLAGVLRLSHLADSTGEPREIFHALASELFAELGVEEVHVHHHAEQEDMVVVYMFGGDGRLSYLAPLGERPHGVAWVAESGKHIVPHGTRELAAAVPRLAVGGRVGAALLLPLAVRGEVEAVVILARADGRGAIGVGGSTRAAGGAAQA
>SRR5271154_6067984
TMRVLKPGDRILVSTSLKRANCRSLGRQDILALMYFNNYLSRDIASAEQSARKGKSIKFGNSMPTQAISSSWLSWRICKLMGHLIPSSMVSLFINVSDRRRRWDLSCCESLSFQASRQRKRFTSPGDKRDDKYPEFRTEGTVCQAHRYYFNDGNYITYRKRSMAWKSVX
>SRR5437763_77052
AAFHAGWHVPQLVHDQRPVSRRYRAVFDSVVVIIAGHADHFPPHAGKILAYALADRLLRIMPQIARKFLRKDDVIPLGVSIRPRVIAPGDDPVSHRLEVARRDEFIPPQGRQLAFGGRLVLGEDRIVALPPVHRDGTGRGHLGDARNRGDLVQDFVVHLYDAIVALDCRVRNRYPQRLYVLRILEPGIDAP
>A0A1J6JVT2_NICAT
MGSLMDESKMERMGDESKEAILYVNGRALLVYDVSKRHTFERLSSWLEDILQQRDTTVIVVGNKYDAGEIIRTVSAEGGEEFAKSNGCLFMEASVKTAVNVVAAFDKTTERICEKMGYGDVEEVDEALEINMWNWKGFRIGKNTGVK
>ERR1700728_2000873
GTAPLFSASQAIGRLLPCEQAHGASAHPAEPFAPDEERTPGIRCSCGQFEVANHPRALAHQRCVGSGTGAAPAMTAQRESTVTDLLLLQLIRLKGLVDAAGLASSTDAPVEAIRSTCAAWAREGLVLETPRGVRLTATGRERLADLLEQERAGLDLRALQAVYDRFGEHNGKLKAAITAWQVRDATTPNDHS
>SRR5262245_41074620
GRDLVREDGRRGRGHAQLGRGARRGPVDSIRALAGARAHGVREPPVAVADRRALPPAELRPDGRLLGADRPGGRQPQESIHPLRRAAQSVPAARRGGWECFAMNDVNVAVPVLIEQSGLEHQGNGRAGAERLGKVAAPPNKESTSEFFHFWVEKGKLCERTQIVTTSSQLGGRTVEFVGLVEEVYRQSRQRDMGEEVDRFDADSAVTPPFASAGFTYAKVTILRTDPVTHAPPTEESTVYLGGEREAEKGYGVDRMGKPMRVGLLRNGGTPFAGPATIDLDYLLGENGGHLNVNGIAGLGAKTSFLLHVNALLLHEAERQITALGISHSGRLQVVPVIFNVKNYDLFFIDHWGKQWQKEKLTALPEWRDYLGINTPTPFRDVQFFAPEDEGGNPAKVGRTDEKVRGYSWSLSDIIEHRLFKFLFSEEDIYDANFGGLVGELEEELTDESSGAPRLNTQGGDTATFAKLLQWFRANRDTFTDSAPGTRGKLLRRLKYIVQEG
>SRR5262249_55421997
XDQCANIEIIENFLRSGYDILRHDCTVTGSNLCHKMTAVRCANNGASERHDPSRVLPIQNHVIARREQSLEPIAESNALPTELVGSEHDTAQHRIQSRAIATAGQNTNPWPHVIKTRSERLGRIDESTPSRPLIVQLPPFIHQSRALSESVSA
>ERR1719460_1257335
AMGLGYTKKNWDNQSGKEKYPASAMKYWSELTSCGCKNQQAAATKFGYTQLTWDNKSGKEQQPHSAYKETWSLLTDDEKAAAMVLGYSQTIWDDSSKQTYPASAGKYWSQLITCAPPATAAGDAAGDANIVEDQQDQIGEDFIIGGVIALAIVLVVALVVTIAIVAAQSNKADEYSEESHNANVLDKKTDDDL
>SRR5258705_15912
PPFWRTWWFLISVIGAGIGIVLGVVWFLLSRQKNLFKQHALQAEQEILRLQNENLEKDICSKQAQLNASVLQSAHKNQFLEDLKANIQKIDSAETKSKSKELHRLTRSIDTELTQKNYWEQFQLTFNQVHQDFVHKLHQRHPHISATDSRLCCFIRMGF
>SRR5665213_2795117
QSRSSAASDVYKRQCPKPPAMFVSVLLVVAGLSSHAQQPVYPVTCILSNGDRLSGDLISISKFRLRLQHVTLGRLVLKRSSVAVCETTDSTTRVKLGDLALDTLPENSRTTVGVLPDVMPLPPGSVAPVVSLEHLMHPPKPTPLASRALPTYVSHVGWKRAIGMNYMLTRGNANVSNLGFTGSVARRADRSQVALSAKREFGSQDGNATENYFSATLRYDLALGPNDSAAKSRPSFFSEAVVEHDPFAQIGSRAVENTGVSVPLTRNKQNDIALEIGTGITHEAPTGVPSYTRFGGLLRLAARQIFGKAKSDQQLAIFPDLSGPHGHYRSNGDFNLSAPLISGVALKLGVADRYDTRPQARVRKNDVTVQSGIGIEFX
>ERR1719443_2623778
VHDFKRKRTMDKYVSDDSDRKPTPPLEAPRAEKGEVAAPQANAPASDTVAGVSVRGGFAGQRQLRDLKASQEKEGGGGTSKPRGEPLEEWTYSDYQNGEVLNPVNFDQQRDCGAWTAIALHAFQADISKKPIRVRENNQPQAVQKAKFSINGGPNDVINRDQDECMARNPFVSMYSDVRPNRVLRTRPPRTTLAVKKMGSVPAYTHRDAVTAKAIERSNARRTASKATYNEAAKTIQQIWRHYSDYLSSTKEWFLQCKMAAMQIQWTWRQYHVWRRQVDKLMTRVQAVARGFLVRRHIRKHFHIVRAQKICVGAHQRSKLKNMARCVRVIQRWGRGHLVRVKLRVFKGFLVQTVRVIQSYWRMRKANQEVALLQEEKQAQALLVKSAIHMQRLFRGWKGRQRVLVRQQEHAQAQLKAMMAVKCQGQMRGASCRSKVAKLRQAKLTRMNNAATYLRKMWLGYVQRKRHAEWKNFRVDQIPYIVTMQRIARGFLVRNRMWRAVEKEEREFYAVHKISRLWRGNRGREKWQRLKHSQLEREIAAACIQPVVRGWLARLSIRRGTDRTRYAHFELLKRRHLAALKILKQWKVMLPRIKISITLRKKQKAACTIIALCKGVRTRAMNALRLRQMCAILIQAHFRGALARARAEARFPRVREIRLAAVASQEICFPNRLKRKAFLIMCSGLSAPAWSTDLEVSKSKPAKTPEAKEAQLMLLEAVQRARAAGMGLIM
>SRR3569832_936138
AMTIRSSAARCGRTLAVMIALHVVPVLAAPADQAFRQGLSAYRSGDYGKAMKIWLPLAQKEDAAAQAGIGFMYHRGQGVALDDSKAAYWLRKAAEHGQPEGQLMLGSLYFYGTGVEKSYVKAYAWCDLAQDGGNADAQMCRDAALQSFKSEDDVKAAFRLSLELHQRFRRSRRAARYSCLFFLFFSVGFSVLPVI
>SRR6185312_8416935
TMWLLVRASHDERLRDSSLGWAVLTAGLAIGTKFSNGLVMLIFVPLVPWLYRRSIFSKGRLAIPWTLYGFPLTVFLPTILSWPWIWQDSGAHLGETFGHWNNYVVNELFLGRTAPAPIYYFLVAFCFTMPIGIAPLFVSGISQMFRPRAEALLRPLPPGSAFSARGWWVFLTIWLAVPFVWTFAGMRQDGIRYVYSAYGPFAILCGAGIVALGRGVAALWKNPRARYATAALTAVTACYLAVADVRTYPFX
>SRR5919199_676836
RKWRFNAEEVGKMRRIALEQAQLATTLFALFSIIRFSTGVGHPRQHLGIKSRLQLKTEDEGRELQEMSVIAICGEGRIAVSALRYTHHLLLASIPNIRLVACPNYSDRGYDTWYPSLSKAARAMGVDVVELDSLAAEQDLLLLSLEYRRIVKVDRFASKRLFNLHFSRLPKYRGVYMATWPILNGETEAGVTLHLMDEGIDSGPIVDQRSFALPSHITARGLYETYMDEAFELFKENFLRLIYGDYRLIEQDHSKATYYAKDSIDFAQHTKLDLSQPASRVERTVRGFYFPEYQLPTLENRPVRACHIIHGRSSEQPPGTEVCNTSIGAIYVAGDNSLVELVWAXX
>SRR6185312_187726
PRDVFPEHRSRRVAGYPEGVVVDTMRREEQPILMHAVMFEIFAVPLADIEEAVEAPQDAREDDRLGQADEHAAPCHELRVAAYEDGHPGAPARVRRLEIGPQTPARHDEGIEAAVGDLARDPGRIAAAKVLGRRPGCDVLEELAV
>SRR6266851_1047964
NCGLQVISSGGIASSTTVLSGGQEQVKTLGHALGTVLSSGGVQVVSAGGVANGTIVSNGGSVIASSGGTAGGTIVSNGGSVVASASGTASGALISSGGQEIILAGGIAKSAVLLSAGQELVSGGVASAATVSSGATLNVAAGGLVSGTQLSGGVTNISTGAVASRTTLFSGGVENVSSGGKTVSATISSGGVVNVLSGSHVGSSVIFNGGIENVLLGGVTGKARISSGGVQNMFGSTNNAIVFSGGLQNVFSGATVTATTVSLGGSTVVSSGGTVINTTIASGGTLELQGGALVSGTTTRVAGSIERIVSGYGLNNFTVQSGVTLQVGAAGAASGTIVSSGGAENVL
>SRR6185312_1756791
XMRAKPLCFSPASINGTSCCLSPEKLRATKVAPSVIASSTGSIGGWKLVSPFFALVPMSAEAENCPFVNPYTPLFSMMYSMFRLRRMAWQNCPSPIDRVSPSPETPMKLRLRFAALAPMAIDGMRPWTELNPWPPLTKYAVVFEEQPMPESFTTFCGSSDSSQAASTIAAVIESWPHPAHRVDSAPSYCRRVNPSAFLGREGWATLGFARNVMWTPAQRYAPAPWAVLGSALSSLRGRISWSTPSTMNEEEM
>SRR3954471_24146024
TGARRRRKPGPGGHRAVGVPAARAAAGLANRSDASTQGSPGMIQAQELLRRLADPGHDMVITPILDARQQIGAASVDLRLGPDIIVSRRATGTTAFDASDPQGFSRALQERQAYVRRRLGDTFHIQPGEFVIARTLEFVRLPPDLSAQALGRSSWGRLGLII
>SRR5690606_23903138
LEPSVITVESPEHKFLNKLMGVIEARMAESDFGVEELVMEMNMSRTVLYKKVQSITGFSVGDLVKNMRLKKAAMLFSQTSMNVSEVAYQVGFNDRKHFSREFRKFHELSPSEYIKKVKDESLNGSDL
>SRR3569623_980461
LVDLEVRRHKKKNTGQHHRMAAVVQGLRMPVEALHPLQFGLEFGALDRIAVRRIEAGHDHAFHRGFQVAALLVLWIAGQAAAAFDRFRSFRQDRHAVPRSLAVPETVVALRLDGRDGELLVRRLQFLQAGDVRRLALQPFEQVGEAGAYAVAVERGDAQGPGAFPGGFLYRGHRQCFFVAGLDSAGFSAGFAAGFAAGAAASLRRDSSSGRQAISRSWLGAISAPSAASGARVARAAAATPRISSGPLFTPTSGFDSVPRTCSGERSESRRRRLACGCTVRSSFSVPRSMLPSTVISASSVSMLNSRGVSTPSFATRSAAAQWMR
>SRR5262249_45364707
TVEVEQPALSDHLRAELAVGERGVGEFHVHPEVACRTVGEANNGNGAEIRDPMVAVARDARVDAVGLAADEPAEKIEVVDALTHEQAGLRVAVPRAGPDDRLRPRRGKEGPDPHLAGAADAPLVEEALGLLVDAAEALALDDHQLHPSGGTVS
>SRR3990172_9952057
RRGKEKRRRNARLIHAGILGICTSTASTIPRYSQSRAGKKRRCLPSGRGGWGTMSSEGVQTVMPVDASPIHLNPQAGKFESIKQTTPVCFHDPQTELGQLLLGLVRVRYRLPLKPELPCTAAAEALDQETLARGIFLPVHHPDRVEAMVSAVAGKILAAGLGSRLFLGLIAGLFRQLHGSGRSWIDNTVAVEVDIGPGDEETQWKGTGYPETTRVEHPPWHGGCGDIRGLQTLFSEIEEXX
>SRR6185369_2406511
FWASTNGGVDWTRYPAPDGSGQQFYPPYMDPYDPKHMLIAGHGSDLLAETTNGGMTWTKVTQAAGMAGGATAEVAFIDNGDPAATRKTWLWLATGTGGKIGTWRTTDGGVTWKHVESNEHVAGSTQVYQPDTKGVVFMAGVYSTQGAGVLRSTDYGQTWTHVGRNSPETIVFGTARSLYALYGVGLPADVGLEVSPVPGTGTWTTPGTPAAMKLGPAQAAILNDGQTSIILLAN
>SRR5258706_8531874
AMGFDLRSRNSQDRAGATNGNECDQGEPHAHATIETVQCRPPSNGRNVVSAQTQGAGPSLLRRGTRVLWRFISLHPLPFSAAVTGSVVYAITSVIGAGVLGRVTDRVITPSFSSHGHVRASTVWFYAFLIVLVALLRGCGVVSRR
>SRR6266481_2504579
TLRRGNDQNSRARQGRHPRRRYRQGLRAGPDLSRQPDAHHRLSLQRSDLSVLRGHDLRCSQDFSRAASESEIVLESLANQIQESMMQSSPLNLRRAIIWIGRLVLGGIFVYAGLSKLLMPNTHLWPMFVLRFSISMNISSFAQQVESYKLISPDASQVVAHTLPFVEIVLGLLLLIGWRLRIWATAITAIMVGFLAVVTRAYLLHMDINCGCFGTPEKLNGMTVVRDGAFTALALAMTIFAFIEAREPHPWSAPEKACAGLAAMKTLAEYLDLAAVAHGHLCAGQVLGVRLAMLGLRELGIDDPVSERKRIVTYVEIDRCVTDAVALVANCRLGKRALKFRDWGKVAATFVDLQTGRAVRVAAKESSKQAAREMFPELGKDAGQQKAYAQLSDEILFDKQRVKVEVQPEDLPGFKGPRVVCAQCGEGINFKREVVVKGRALCRSCAGEKYYETLSX
>SRR6185312_10010982
LLTGGSLNQDHIDILQNSMKPFGSNKDEDPPPDSTSLISSSNASHTELKSVSTIISAFKTLPKCVSLYAQHYISIDPANTDRLEPKFTNYGEYYKGTLDYIFYLGKSNNNNRDNIERETNEEIEMQVVKLLKMPREMDI
>SRR5437899_3944324
SDVCSSDLNISCGRDLRCCRPSGLSRIRFLYDGLALFWSCRRRGNIRRTGEIMRQQAHNRPERIAGHGSLQTLNPSKRNQRCPLGDPSQANLEFRFLRGPREDGRATKARGRKSVGGTPTWPAVGSRLPPRSVTRHVSLLAAQTTQWRRSDGX
>ERR1712112_183966
LMFDGIKDHPLNFGTLNYWVLREWASHCLGQDTREVGICPLGEKFAFVQALDPEGEHSLPSVHVCHRHTEQYPGYVGEVYMDGEVMDWETYQKRTGTLYPVQWSGYSFYLDDVGGSLQRVMVDHTVQYPTPSAYGMFASRALISGSGGDFSLGGVFPTVHVPTRPLDTSRDMGKVVYKKSPFSGDAAVLQELTENGYGFLVDKEEGFIYYSNSVAVAKGYPPVASALGWHKVPLRPLPSDWMVQLDQGQMAIGIAX
>SRR5437660_607594
RLGPPLPDSRRRRRSLLAPTGEGLDARLQPVRARLAPQAELDPRLLAPAEGLRPGRGAARGQVARALQPRGPPVVGRADVRARADPPAVPQAAGLSRQLGPGSLPDALPAVARNACLAPADAGVVPADRGARRALGARTPVVAAPGGGATARRGGRGRARSGGKERGARGVPGAATIAPGTGRSAHAHRLPVPDAVLRPPLGPARARPVALAHARASGPQAPPPTHAHALGGVLALARRSPPGDRDDPGRGGNGHPPGRGLRPLGPGGPRRRFGVRAHPPRSRGAWRRQTALAPSLLAAPFGRRVADTALAHGALGCGRARGRGSGRRRARCPRRDRCRAFAARVLRSDR
>SRR5581483_1442169
RARAQPHPHAGRLCGDLCRAGHAARLPRPSRHLHGAHRAHRCHPARPQPGAHGHHAGLPQRGLQRHQRRRRALVAAVGPDRLVLRAGGGVGAPAETDGVDARQGAGLAARRAPPRARAATARCDRPLGLCRLRAGPGLRRGLAHHQAAPHRLRRVPRHRGHGARPPRPLSPGPAAPLRAASPRVASGILGIADLGHPRALPRFRHARAMARARQLLAVNKPATVAHPPGRRVAVPRTRKTLGWRVGSTPPAADVAADGERPPERGLDLMQQDATKAELAPMTGAARVRHLRQILLWPVQLLPIEGDLQYWEHLAKGTDPSPWREVDDEFGDPTEFQERHYNEFVTFLPPVQRFLYGQGVGKAVRRIYGESPIKTMRRTDVATARVTLSRGDKPVELRIVHTDLYFFFDIDIAILAMEIAADDLPLPVAQEAVFRFGRAYPAYX
>ERR1712159_470442
NGAPEQDRLLPDETDLLSKPLHIELAKVGAVEGDGPLVRIIKSFHQLNRSRFTTPTRTHERHGSTCLHLEAVSVADFGVGAAWVTEMHILKHDPALDAGQSFALVTMGIDHRLSVDHFENSLGSFTCLSHRCEPWGNATKTLCSNLQAKHRDQDVAAREVTCRCGETATVLTRAVSGVLKLLRVFDGTVEEAECAHDVPGGKHET
>SRR3546814_65869
YCVFFHSFLLLFSLRSLLMCSLVCWIYTFSLLLFFFFFKQKTAYEMRISDWSSDVCSSDLFAGFVVSTQSVSAPGVQFTGVVCDHCADDSDGTCDACQSLCLELPRAVRVRHAGVLIAAGVRDFFAAKPAARTVTVVHPAAGRIHGPRAGIRDRRRARAALAQRAQGVWRGGCAGRGRRCRDCDPPSVVAVIAPRPRSRLRPGAGVHAX
>SRR4051794_20208749
PGQYGVVGLARNVDSMHPKSGGAKGLNAKIRNTLLCASAILVLTTVARAQPADPIGDLLAQAQTTPAMPPSLRQTVAHPISSADQALFAQAMSAAKRGDVSGARNAIANLSDPIAKKTATWWLVDQNAESLSFWEVDAA
>SRR6266852_3879948
XMGRLNANQPRELALTVSKNLASYADGGPELGVRFHLFLSFLQRSRHVNENRYRSVFMSIRDRSIRRSGLLVRTAVRRPSSCTKARRVLPNSLAQNEFPIALDQGRTWX
>SRR5215204_675534
GEIAGFEEAAAAAPAALAAAPGAGDDMRLGVREGAEALHDDGRWGVLGEVGHGARSFWCGAGARNPPGAPGRVRLRCQRARVLFRPPGEGRWDAGGPAGLGLNAGHDRRPTRFLPGFPVPGPGFHDRLDPTSRALRPRRIGENSAPSGQRGRPVVAGEWCSWG
>F2U329_SALR5
MMMGVAPVIACCLVLSLLALGAVAQDVDVTVYPGRLFRADLSLQFGAAASVEAIATLTGNPAPPAWLRVNLLPIIYGQVPDDIAGDRFSAAILLRINDQPVTRTLNLMVDRTQGLPRVAFEVHATNANETQLVGDRYDDLETAVGITRARLSADTGQVGSGVLFVRSVAPFETDRRNINPMTSNPPLPVNNAYINGTAWLTLGSKLSDSQLTCAELEATAGSLFAAQGLQLDFDLCTPFPISTNATIDRSRVLATVEMRTWARTKDDFNETIIPASVIAAFIFFPFALIFIIHYFARSSDEAIEQQMHRLVKNMLRRNRAHTLRVISDDNTIAAAWLANSEEEEVVPPRLSTVSKPSNTSLPTSEHSRNLRYRTHTRPPTYRPPPQHDF
>SRR5919199_6745454
RVPKTTDGESHKEEETHSSLDFPSRLCYPGNIITCRMGQNLLNYTTEIPVEKTITEIQQVLVKAHATSILTEYDNGAIKAIMFKIRGKNGQELPFRLPAKVDEAYQVMYGNRQQWEVRRYGEKWQQHARRTAWRILLTWVKAQLALIELELAKPEEVFLPYLLVKGNKTLFEDVQDKQFLLGSGTEEX
>ERR1700761_7736419
GQRFDSAQLHQPSLAMRAKAAAAQPAQQAKTGCRQVRKPARSALQHPRFSALGALPMLFPVIDSLLYVFNTVLGIYEFVVILAILVTWLIPAGVISMRNDVVRSIVNALDALTDPVLRRIRRVIPPIGGVDLSAIALLIALEVIKRLVNGYAPLLYTVX
>ERR1719296_360158
THRTGPLADCVAWPSREGQPQALLRRAAARQPTALRAGTRSRACSLAEAESFSTGATCEAAARVAATEGAGAIVLLCRRRRRRRRRRCGPRGGEHAADVDGNLGCLLLVAPKLGNVLVAEDVQRTFLELAPIVLFKCD
>SRR5262245_40312332
AGRRDRTFCSGERPAAARLRLPAAGRGAQFLYGQAGGGKMPFNVWGRVKNMTRETKLGLVVSCSFLCLLGVVLGLKMTEPPEEDQGAEVAATEPAEGPPAPPTGAQPDTQPRPAKAADKSAPPAKADTAPPPLPPNVNNAIELTAGTAGQKKAAPG
>SRR5579871_2118101
ESTQDPGMSDLELPPEVTLRAAPLLGDRRKVEQDRPLEEVRPARELVDAVQEHGALRVEDRLGVVRVELPRREASSGGQPAERIGDPRLEPAQVVEGKTPRVLRGDREIPLLPRQATERGGRGVHTRPEETRRRALGAALLADQDYDLVRTTRSKGRNEPANEEDEVVVAGDVDEPTKLLNGTTASRAGERTHSSGPTEPYERHSHDPPPLLRHLHAGPRVVSEVEVDRSFVLGEADVDLALRTAERGFALEHSRRVHDGLTPGRLLRPVEVKLREEPPELLRAEGPRLAMTAASDRGVTDAVGVVEEFDTSLASELDELRRNGPAVLLLVVVGGTRAAPRRLDPLGSLLPRAELRGEELEERLLEAARPLGRAP
>SRR5256886_992629
MFAQLSYAQAPNGTIPATFFGMTFSGGNAPSEYAAQPAAITSSMGTMGKESAAEWSYIEQNAPTGSGCPGTTNCTHTYNWTVLDGYVNTAFNHGLPFMFFFTEAPPWATNSVGCRSIAPGQACRGPIVSGHTADQQAFVTALVTRYGSKIGSYELGNEEDYQGTWAQYAAQSDLYVKAIKAVSPSALIVGMGWDHPDGHYAQGGDFDQFWSAWGAIPNNSRHLDVVSFHGYPHTFCAPSCVVPEIVISNNGLGTQGSGDCATTGFAKCAQNAIARNGVTTFTGGTPLLRDTEGSWGTTNYTIPAPAFISRMLLLNWAAGVSEHQWSYPDGGSVYGQLDGITANISAYQQTYNWMAGSTMTSPCAIQSGTVWTCGLTESSGKSALAVWNTAGASSYTITAGAYPDYKGLSGNTTTIASGVTSINIGAQPILLERNGSHAPRAP
>SRR5688500_8464034
AVELDPGSRVLLMAVDRWVQLGAKDKARRTLLNAPSSTWENVPRTQGAEALLNMGESKAAAALLRGAPDSEQEPAAKLALARVLTANGEFKSARELYLIALTKSPYVALETRIEYFEFERLHGSARDALAAYDKLRGEGFAADSLARHRLSLFVSRPGLAWAWRDALGVLTLLGVTLAFCIMPLLIIVPVHYRGLALRASGRAPAREGTSWTLLDAWYASGVFLLVGFVCSYVFALPYLE
>SRR5215218_300340
SPATSPRDSGAARWQQRSSSAAAFPLAPRNSTTGSPKNVRPTGAWVRSFDQLAAYQPFFGNCTRLLRGFGQRYLCFRSQGTNRFCTIRNLGLAAAFSKWGRAAGSREAFMPAYRLRDVAVLVGAVVVGAAAGFNGGWFAAVPPKVVTVDAPNKLATGTADTRTPATAPAPAPQAPPPIQGTAAPVTPAPPAAPAEATPQSDARNVRVIRPVEQANEISATARQ
>SRR4051794_31039054
PGCAGSPRPVHRRDDPSAVAAGPEEAEGVSRVRPVGRGARAPRGGWRKERRRLTLGATGVHAMVHQVRYSVWVALGWIGVYMMLWVALAMVPVLGLFLEKKSPWGWAALGVFLVCWVAHSRQYWRRLFDRTPQIEL
>SRR5688572_28435885
GALLPIYFFYDSAPSFLTLLLDTNGAMLGSILIFIGLRKLAKLLDIQTHFASPAVLASTLLVFLLLGLLFPENGSVSKNAVVQFIAQVGPIVDALRYGFSASLVWVIRKNANRTYSWALGWFFVALLSNALNTALIALDPLLMMTGLPVELLSMPFILNTFIFAIAGAAFYKMAHAAPKPTQDAGVLEVVMFTASLTSKPSDVDPILDPVRKITARHQAGDFTPQEIATLSGVYTKLEDYLVTQEPLRRVTREHLQAMIKERFDWSPSAAX
>SRR5450759_1044538
SCATATTTEWPVASRNVTRPAMKSAETTLPNPSGVRATPWMWLITVSWLGSSTSVVGIPSRLRELGATDPATPAPKYDRTSSSPRHASRPYHGEKWRPRFAVQMRVEGRMDESFRANQRKPLVVNVAAVQAGVGAGSLKTIKPSVYPRPVGYDEX
>ERR1043165_7129941
RRPAGGIVPWLARAGDQTAFAGGALGTETHIFRPGKVLHRLEGVSTSSFDASPEQLRAAAQKAHAALDPSRPRFLYVHVMWMHRPLWNHPAYHEALPELDVALGALHAEIGPEALWIVTADHGEEYGEHGGSFHANTLFDE
>SRR5258708_5362479
GRAKLRRAQGHALCPLAAQRRQPAHAALVALPAGGDSFARPQRLALAQLVEPRRGGALRNQNSLRPFVEAGIALVVLAQRAAVEPQGAARQPRQERAVVADQQQPGAVRCQPLFQPFDGGDVEVVGRLVEQQDVGIAGQRTGEADPPSLAAGQRRQRLAGTDPDLVQRRFDQMPVDKPPAHIFGGREIRIERRQLRRVGDPRAWLPEHRPGLQLDLAGQRLEQGRLAGAVAPDQAYPVAEPERYRDAGEDRPPVELNAGIAQSNKRRRGHDDAAAGSTRVGESPAGSTTYNSIASCPRRCPSVLGKFRTQLTAHAALPLTLWRDWSWXX
>SRR5665811_2613661
RSTRVRSSAASDVYKRQPICRSAARVRRSSDFCHLLTRAIRTKSVGSSMKVQAMAPPVTWSVSGEACQLYIGCLLYTSDAADDLTRVDLGGRRIIKKKKKKKKINKYL
>SRR5256885_2171212
VRGRRRNGAGVTGGTRTGAKARALEPLGAKVAASPGEAAAGAERVHMTLPDDVVVDRIVDDVRRHLGKDAIVVDHSTTSPRGAAARIPRLNAAGVRFLHAPVFMSPQMARDGVGIILVSGPRAVFDDVKPALETMTGDVWYIGEEPDRAAAYKIFGNSMLFVIAAGVADVFAMAKGLGIAPADALAVFSKFQPGGVIAGRPPNPSAPANFVSRRARVIALAHARVIDGTGAPPREDQTLVIRDGRIADLGDAAAVAPPPGAAIVDLAGKSVVPGLVMMHEHLYYTTGPGVYGQLGVSFSRLYLAGGVTTMRTAGNLNGIMDINIARRIAAGEMRSEEHTSELQSPCNLVCR
>SRR5437016_5746367
CLSPAYHPVRSTAFRMAIRGKAQLDTRVSVEDNPPRLSSRTICLTQVSNLLGKSSSSAARKKEVGMRRALVCILPFCVIAFSAFAQDAVKVDPQHYKVEFENDQVRVLRIHYGPHEKSIMHAHPNAVAVFLTANRSKFTLPDGKSEERSWKVGDARWTPAETPARKPDGSAARSSFGRAKKVAGFKNTHARSREX
>SRR6266481_1587377
RRKPRRPIGRSASGQAAEVRDIRPSVDMPVSGAKAASGNLLFSPSVTSLARLAIESGCELHRNRSIGGNLSHQVYLTRAVVAGDAAGVDLRRQATGLRRWQAAWTQGPQYCHRSRRWKTSQGSX
>SRR6185369_7209777
IVLGDTACPSSSCGRVNAQRGRTTMDLPSKTVFEVLLNNGVDTLHHANSVITSCQFLRQKSLLSRGSAERSGLKQTSQSSDATDLRYSLWYDVFMDSVDIHRRARKQNHYGPVLFLLDVEKLAATRTGRIWVTKLNPTKWAGVPVEDRWFRSKKELVTGFRRGTFDQMIVFRHSGGALPLADCLDEIILDDPDLKVDGYDLCSTAHGALTLAMSDFGLQVPITKRRCAPTCTCGHYYGSTNADIKDGVVKMFFPYQ
>ERR1719183_2396889
LVVGTGPRRPASRRKAGRMSALARHDDGAGRETAHSLAKDGGCPPAAPYSATTHEGGTAVDVVQYGADAPPGLTRPIGDPRPVSVSSGSAQQRSGPSLQSRAGTGASSLDSRSSRSSSSSSSTASGWSSVSSSSSGSWPDDEYPPPPPPPPR
>SRR5438045_3528744
PGAVAHEVAVAAANVGQAEREDPVQHPEGPLAVQSIEVDDDLGIARGVKLQSRGAALFAQPAIVVDLAVEDDAGAAVDVPKRLRAGGAEIDDAQPAVAEDGVASSCDAVAVRAAMREGRVHRIDPRANVAARLEHAMDAAHSVESDPLGDLVXX
>ERR1700691_2800241
HAIVVGIGDIVERAVGIESFDLAVGFLEDECTAGLLGEDAVVAGLGEVVAASAIGLEDTLFTVGHVNRDGPVGRDREEILPVVGPAVSQRSERVAGADRVKKRPREVQRYAARYS
>SRR3989338_1552555
GWDERGDDYKTFFFVRIAKQSEQRKIFIKEQKVFLTMEEYMLSNSTAQGKQELLAPLLHQNSDDTLFIRAFEERVARTIKTFGLLDGKKNIVVAASGGKDSTAVLYILSKLGYPVTALSIDTHIGCYTEQNKRNVITFCKTHNIPLLLKDFNTEFG
>SRR5215470_13194424
THVRCGEPLHLATEQSRGAAGEQAAGLTPCPARGWMGEACGGTPSFRRPGPRADEHACKVMGLSLVHQGEVPTRITLGTAPGKITCWYSGGTLAGRTDPGRRERGCPALATNFGQLMTPRPFRSVCKSGLA
>SRR6267378_3904149
VLRLLNRLHELKLSDEELAKVGAAVGSDVPFFVYGGTALVEGRGERVRPLSVVAETWLVVIAPSIDVPGKTARAYGSLTVEDFADGDHTKQMVACVDKRKNVPAAFLYNSFDSTKLGISLATRVYAGL
>Dee2metaT_26_FD_contig_111_7158_length_345_multi_4_in_0_out_0_2
MDTSKLKSNLNINMRLINLDNIGEISRKNIRKFISTIYGFKATTKDLKKIAIDMGLDIGKRKDTQKTRTYKFFGEMYNDDIEKKKNISQQLDKQIKILEKKRGKTYTALDLNKDLLTKRPFKNMFKSSKSKRKPFSVNLISRVVSNVKLSTNFNNYWQFRNWLENEEKWNGMEMNSGETIIKIGNEEAEVWDLFNMTINFIEGGKTWGENKKTITRNIKFLNYECKVLDPATSHVGDNNCGIRVLSKLLDIKLNPKSIRKEINSPAGTLINTEQLNYIYKKNNGRKNLIIIDENYEGEFNLKDTDYVLYKDNHYTAIIEAKRQNHKETGKKKQKGKLAFDIETRHTEEIIMVGETKSKVLKSTILSMVYKCVRGKKMKKTFTTDNNKNCCVKFLDWLGHEANNGRYYNCVAHNGSRFDFYLLMSYFTEEDLLDSKTQLRGTSIIGLQYKSHTFKDSCCFLTDNLNNLCNGYLITPEEKAFSKLTNIKIGDKTITNHQLCFYKPELNFNEFMELETKEPEFWTEYVKYCEYDCESLFLVWEKFKFQIDTIIGKMGEWLKKSVSLNTCNTIGSLSKKLIDANNGVKSKKQPTKEMQIIRNKYKNGNKWKYGVCKADYNEEVKKLKESGNELYEVGGITGKPNFRKYCEFMSNDEEKYEFIKNFKRGGISHSNQKGYHKEGVCGFDIKSQYPTALMNMKIPVGKSRWVENYEPTAYGFYLINNIKWCSNVKLFKPVANKKDDGILDWATNKFNELYCDSYMIKYLKENCGLVNFNVIKGLVSNEEMISNKLFGTYVDTLYKEKAHQDYLKDSNQEYNKPYREAIKLLMNSLTGKLVEDPSRYFKLEFKSNDEKTQSINNVKINKTDANKGINYWVVAGVMVYSYSKRLLWEYINCLPNKADDVIHIETDGIYFGLPNKDAFIKNLKEKNDPIIRIGRELGNVEQEICTKEESFFIGKKDYMIGEPILNNDKSINYNKSKIRNKGIPKTTINDEGNKIDLLNKQFYIDRYNGKTCYKTFKTIGKALYDTKHHSGITLTGYDMVRKSTPHDFKNFKMYEEKDGKVIIKDWKKY
>GraSoiStandDraft_4_1057263.scaffolds.fasta_scaffold10840448_1
DNNEAFTLTATPAGGQAATGTGTIKDDGTGDIYKADGTTDTSAVKNDDRVVAVTSPTVNEASPYAVFTVTGTAGQTVSLGLTAGTATGGGTDFGSATATTNLQYSIDGGANWLDYSTTGAFALPAGGSVLVRTPINNDATPDNNEAFTLTATPAGGQAATGTGTIKDDGTGDIYKADGTKDTSAVKDDDRGLTVTSPTVNEASPYAVFTVTGVSGQKLTLALGNTSTVSDKDAQLGTDTGNAGTGVPLQVYDPSAAAGAGAWVDYTPASLATIPSGGVLLVRTRIANDSILEGAETFTLVATNTGGTSAEGICTIRDDGQGSIYPDNKTGADDPAAVKDDDREPIAVDDTYTVAEGGTITGNINANDTDPDGKTLVGSSVAVVNGSTFTSLTDSAHPIYTAADGYKQLTLATGTLYVKSSGQFAYVHNGGETPADSFTYKVSDGSELSVAAAKVSLAVTAVNDPPVPGKLPGGANDPAYNASAGRYEISTPEDTPISGRASASDVDGGPLTYALTNQPAKGTVVVNPDGSYTYTPAPDFNGTDSFAITVSDGKGGTAVITVFVTVTPVNDPPVPGKLPDGAADPNFNPAAGRYQTTTPENTPVSGRVRAYDVDGDPLTFAKASDPQNGTVTVNPDGTYTYTPKPGFNGNDSFTVTVSDGKGGTATITVAVTVTPVNDAPQGGKLPSGAADPNFNPTAGRYEISTGQDKPVSGRVSAFDPDGDRLTYTAKTAPANGSVVVNPDGSYTYTPAPGFNGEDRFVVLASDGNGGVVEILVVVRVSAAPVNTVPNGPMKFRGEPARVVGPDGSVFRVADADSSELTVELSCGHGLLSLPVRTGLQIVKGTGSNDTVVAFRGTKESINAALAQLVYQPITGYFGLDTITITSVDERGNSDRDQIDPPFTVELVTLGGNDANASVASLAAQGKTVVGSAVTSFDSTLIKGAQVVGDGPVGRLAIGTPLRQDGSVQETTVKVELAYADGSKETFDVRVTIYNPKLELITQLRLNPQTSLYEQRVQVTNTTPFVIDSFRVIVPTLPAGVSLYSRSTTTSDGRAAIEDQRPLQANEARVFIVEYFAPNVQRFTEPVLALEINTSGGVSTPIGTNSPVDRVVVGANNRTYVEFATQSGRTYFVQYRDGANGAWQTSPVAVNGTGTTIHWLDEGMPKTLTPPTAAREYRLLVTSGIATPLLITTQPQSTQVASGGATTLRVAMGAGGPYTYQWFRDGVAVSAATGASLAISDATLASEGDYHVVVSDGRSSIQSQTATVSLASNNPGRIVNLSVRAQLEASGTPLITGFVMEGAGSRPILVRAVGDTLANFGVQTAVRDTALKLYRGQSVLSENDDWTRDSEAAQTRSASANVGAFALAETAKDAALVRRLLAEPYTIHVDNRTTQEGIVLVEMYDALGAYDSGNRIANVSARARVSSGDGVLIAGLVVGGNTTCRLLARVVGPTLSSLGVTGTLADPTLELYAAGGSTPIATNDDWGTVQGAVLGERLFRRVGAFDLPLGSRDSVIVTRIQPGAYTLVAQGKGGAQGQALIEIYLIDX
>SRR5450759_2854005
HSVTNDLPEKRYILDERGAVIDQSAQSLSLPPPILTRSAPLLDSGSVVGRFVTSRSLVPLLQDTALVALFGLVLALAVYFSLSVLPLRALKRTLGALVQERERLRAIVDNAVEGIITFDPQGKLQSSNPAAGRMFDYSAAELVGRSAGDLLPEIDMANTDPAGRQAHLGTQETVGRRKDGTRFPIELAISQAIL
>SRR5919197_598751
AANPGLHGILFDTAEGVGDARDVLPERAEIVTGDFFEHVPGGDAHMIKSVIHDWDDEHSITILRRVREAMQPHGKLFLVEPVLPDDHEGLARSKVTLMSDLNMLIMLGGRERTEGEFRALLTAAGLRLGDVTPAPPGSFSVLTAGAGITKGRAGGLRRGPPRPVLPAALRRRARLARGLAGRPGRLX
>SRR3712207_1410375
XMNCKKILISSLLISFISCNLSTDFEPITQEEKSNYLGTRSQQSLVIFEDDFEQTGRIPDTTKWSLCPRIEPAWGKHLSESYDQAFVENGNLVLLAEKKEGEYKAGGIQTLGKFDFQYGKVEVCARFTKTAQGGWPAIWMMPSIHRYAGSSWPACGEIDIMEQLNHQSIVHQTIHSHYKNTLHFYLPVPAMISSYKRDEYNVYGLEWTPDYLIFSINGQSKLKYPNMHFASEPSKKQWPFNAPFYLILNYALGGPDTWPGEIKDADLPAKMEIDWVRIYSHTLSEHHITSGDTYNILTALNAKSAVDVAGAGTTDGTSVILWHGNSAVNQKWIVTELDNGYYRLSPVYVPDQALSAPLDSSATNQQLEIRTYKGELSQQWKIKSVGNGFFTLSPASSPEMSMDVIGEETEDGTSIALWKTTEKINQRFMFKKTRXX
>SRR6056297_976187
DDVGKIGIPDAILLKPGRLDDDEFDTMREHVDVGVRLLAQGQSELMVLAEKVALTHHERWDGSGYPRGLSGDEIPLVGQIVAIADVFDTLINARPYKPAWKLETAIAEIRRKSGRWFSPRIVEAFMTVLADQPELLARLERESWEDAQNGRLLGTVVAERRKRRHLAVLEAELPQARPRGGRDLGRRQDAADRRPRRLAHPPHVAVELMDGVVAGSAPLELDDHQTPLAVASVQIDPAHADGKLDLEQDEAVLDQLGTPGQRPLHLGLAAVQEQAALVAWSQRQSERGVEERHANQLGGRGSLRDQHGPSRLLDQLHRVDPRLPVQRLDAARRVHLQAAVRLEQQQVVAGVGGAGRPPVVDDLHLAADLEPAARLRELLAQEREQLAGAWLEQLRCDHGPDGTTGPGRHPRPVPCRHGTAWSARIGIRRRREGGGASRRPPLRRLPDLRQEPQPLVRAAEVRGGRRDVPRAAWYRRSTGGGARGLPDQPREPQAGGGPEVARGRSEEHTSELQSLRRISYAVFCLKKKKKKKKKQKKKIKIKQKKTHQQKKRK
>C1N8J1_MICPC
MHAVASTPCAAAAAARGRGRRRRPEDAARGGGGGGGCENASSWSSSCRRWEVAPSPRRLLATPRRATPRLRALRGDEWKAIAPPGFTPSALNLSYDEHEADALFERVTEVMDEVDVDAQSAPGGGVKLTASQKRALDAFWLSCGVASASHRASLVREGGKRGLFRDPRRVVERVTELEDSLWRAVGISEIDVGLCVGRFPKVLFFEPDFLIERLRLLRDLLPNVNLRKVIERNPQVLGMDMTCTLPAKMRELSVLLPHVDVIHLIETHPKILSTNVSGNVAGNLRQLKRLMSEVGVEDIGVEMMVTRAPRLLTSDVDGTVRERMRAIERASPGTFRRYADKPASAARMLCASEKVIDRIAFLHETVEEGERGSEIAAVNAPAGTFSKKHPGFEAWQRERSKARERERSADTGAL
>SRR6202050_3633006
FFYGYGDHQELHSFPTRRSSDLGRRQHSHHGYRPAIKGQRSSHNVRVRPEKRKSTRLNSSHGSISYAGFCLKKKNHHSHSGVLVQSDLLARDTCHAPNACSFSMPKENGPSVVCARSMSQSSGGPRHRHGSPRPRSSFFPDG
>SRR5882724_974133
ICIGFGLNIDDSGPATPNTNTLTVQLDGVTIISNGTNVSSGTATVTRIGASTAISYSQSALLASLSSHTVHVTFSGTGFSGTIDETRNFTVAFYPTLPVSVRTPVGSGSQPGFRVKVWQINNAFSFVNGWLNRIVFDEQQLAGLISTNTADLTSFTNNGSFYESSTINYSLTLASGFIQPDAALPGVPGSLTVNDDVVYEMLSFVEFPTNGLYTMGVASDDGFKITVGDRTGPDVGLKVLAPASVAGRYFGVPTASDYGDAFGAALPKTPLVARAVLCDLPWPPSLPNNAAALSNNIALLHRDPSGGVAVHGIWAKQAGAVAVVLVDQDDQGATVDQRGAGRLPGNWGGSIAGFTIPVVMMDYALGTNIFALATSNTSSPVIMSIGDDSSYELAEFNGGRGDGTPTVFNVNVPQAGVYPLRLVYENGGGGAAVELWTVSGGTTISSMIRVVWLRRIERAPSRLDQP
>SRR5882757_10675725
XMTISDMSSRQAACAFSVPVSERDQLLGKRTPLKATIDFHPTIVREEQQLTSRLCSDQRVPIRLKGKLYNFGQLVSLVRLELMSRRVIQSAILAICGSPPSVEAPSLIRRGAFIPAVAADAEQEMQVCLGKNDAGADGEVVWSCLDADVESVEARPARPGAGE


================================================
FILE: src/alphafold3/test_data/miniature_databases/mgy_clusters__subsampled_1000.fa
================================================
>MGYP001379502932 FL=0
KNNVKKNNANKNNVKKNNVENIIKQEDDSESNEKLMFKISDDISNDISEIYSYNVDKSKKVYKTYNFYILILVLFILFFIYINEDSSILPFSYTPTPSPEFLNSSTEF
>MGYP001093304395 FL=0
MGVPVGVGVSVEVGVPVGVGVPVEVGVSVEVGVPVEVGVPVEVGVEVGMEVEVGMEVEVGMGVEVEVEVEVGVEVEVGVEVEVGVEVEVGVGVEVEVGVGVEVEV
>MGYP000080920170 FL=0
MPVLSGLKPESVFSYFEKLCAVPHGSGNTQIISDLCVSFARELGLKCRQEDCGNVVIWKDGSTGYENAAPIILQGHIDMVCAKTDDCTKDMTREGSGRLAGRKWSGQSNPRRTPPFVRRAARSPYAYRRRRTR
>MGYP003331872083 FL=0
LDYEYVATVFDLNASKWNAVLMEEYLQWIIDIFSDTHPDVPNFLFFFAIFLRDIHIDPIKSEHELILNQIEALQQQFPNKVTTIKRLKPIPIPILEDWIRDLGEQNQAVIEDTIKEIVASLPKEKREQYQNENQNLMLYIGSFEFVRNFS
>MGYP001589871100 FL=0
REVKRAVYEALKVLSGSGSPEELLNSVIKGTKSVVGLKVNVYFGEPNNATHPAVAYALAELINKIGVNRNNIIIWDRAEDELNKANYQTNKSAKDVRCLATLTHRNPRFAKPFIGYEDSPITIGKAQVRLSKLVNMSNVIINMPVLRTYKFKDNTGISNAITNMYHVVDIAEADMPFFYDNECNPGAAEIYNIPAIKTRTGLTVCDAIYPLYNGGPGDDQRYHWRANAVIASLDPVALDTVAQNIIQKYRDKVMPGEQPLKSAYLETCAKAPYLLGASDIKQIDVIEREI
>MGYP000312263992 FL=0
FSPFFNKNKKLQSLCDLLLKYAPDFDHKQLSRPVLHQKIFKTKTYKVTQINNLISDLLKMLYAYLAFVNYEAKPALGKDLLLEELLHKDIHQDVERVSRAFEKIQQHTPFENYDFHLNEYQRYDKLDRFFFTKGIRTYDENLQLKNDHLDLYYFINKFRIACDMASRNIVTNAQYQCNFLKDLLKHFESKHELLDQIPALQIYYKILRMIQEHEVEAHYQEI
>MGYP001087948731 FL=0
MSRAADPLLFGTAGVPDTTPQTSTLAAVKRVRELGLDCLEIEFVRGVRIMPDSAAKIRERAAALGVALSAHAPYYVNLNSPEPGKRMQSQDHLLRSARMAAACGARTVVFHAGYYGADSPEKAMSAIRAELSQVISILRSERNPVRMRIETMGKPSQFGTLDEVFEAITLIQTRKMPPIPIVLFGRDYWEKAINFQ
>MGYP000560073095 FL=0
RRSKGGSDFFQCLAQGPTQGQAKPRSDLGFRSRQSSVVMVTVAAVGVADNLATWLQGSDAAVPQGVDGATQTTRLGRADGRIGAQTSYELALRMWRAYQPWPGVWVEIPGVADRLILSGVSAVEGGALVAPGVLELRDDTLLLGLAGGTVRLDRVTPAGGKSMTGGEFARGRQGELAARGRIAE
>MGYP000244154749 FL=0
SIVFNVGSKSTFMQRDYKLDVSWLWNVYVLVICPILGHPLFPLISNRISKSILFLQNAISSALIALHSCVFAIANIFTCATPYKVTPLHIKKSSLKC
>MGYP001210306911 FL=0
DFRPTYNEEDEEPVVLPVRFPNFLVNGSEGIAVGMATSTPPHSLSEVIDALLALLDDADISNEALMRILPGPDFPTGGIIVNRDDLPAIYETGQGRIRIRGKVETEKGRNGHINLVITEIPYTMVGAGIGKFLSDVAALAENKVTNDIIDITNQSSKEGIRIVIELRKDTDVENFKNLLYKKTRLEDTFGVNMLALVEGEPRLLPLKRALQIFIDHRVVVITRRTRFELEKAKHRAHILEGLLIALNNLDEVIKTIRSSADADIAKTNLIHRFKLTEIQAQAILDMQLRRLAQLEREKIENEYKELMDRIAYLEDLLAHPKKILGLIQE
>MGYP001762835755 FL=0
QRRAGRGEEGGGAARGREPIGETQAEVAMRNQLRTAVDRAEHDAGVVDLYGQRPAANQKARKDMNLLDVGRYTLAGNRLW
>MGYP001516588361 FL=0
QMCIRDRINSTQEFAIFAESRNLNRNQNENGIDE
>MGYP001111298869 FL=1
MITELRIADLGVINDANFVPGVFPQAR
>MGYP000402828031 FL=0
EHILEYQNQFYYVGGKVPEKECVDKTENENYYLLTLAALAQEMRFRGLTDASVKMGAALPPRRFQQQKESFKKYLLKTKELHFRYEGGTLSCVVGKCVCFYAGACGDPYAFRSGSPVIAF
>MGYP001006094493 FL=0
AVIPATDLTKSPEEAAKPEAGNDINTPADKAVVKDPAKLTDAEKKAIEDKVKAVNPGATVAVDDKGNATVTTPEGKTAVIPATDLVKSPEEATKPNAGNDIVKPADKTVAANPEKLTDAEKKAIEDKVKEVNPGATVVVDDKGNATVTTPEGKTAVIPASDLTKSEKDVNDGKAKDNAVTPAAKTKVANPEKLTDAEKKAIADKVKAANPGAEVVVDDKGNATVVKDGNVSVIPSTDLVKVQDDATKPNGGNDANTPAAKTVVKDPANLTDEEKAKVKKAVEAV
>MGYP003389908322 FL=0
VSTDISSRYDAFLFIDETHALHPLHMQTIKDEDLPETFPTGL
>MGYP000520683910 FL=1
MVGRNGGMRSGDSLAIVERKKMSASQRNKGQRGERELFGILSDLLGTCVRRNVDQARNGGADGLDVPGWAIECKRVESGFREAWWVQAVNQSVDTDRKPALVYRASRQPWRVRMFLHDCNPGMYCSHAWVEMNLETFAFVVRESLETETT
>MGYP000427244613 FL=0
VDIFKISNVLNIGDIIHGDLDTKTITLPSLIVNDGINVIVPSNGVNKNIIGSDASGLTNLSFDKVEKKKLSFEDYGFVIDPANRLGIIEETVNTGNDNRQVTYLGNSAVDTGSIWGVAKTSNDGALWESVIAATQAGNIGIDKNNPESKLDVNGDIRFQTVNPITRLANGSSPTHVTLLRNLLTNEIEHYENTEWFTYRNVDIINGASANSVQSRIVNGRVQLRIFNLSNFTANQRFLILGPTFRPSNPMHAGALFPNNPADTSSFVNIQVRNNGSLFIDKDSAGLVYGGIITYDLW
>MGYP003153183859 FL=1
MKHPIKVSPVSRKPVLRKKVKVGDIVTCKWGSPFGVVVKVLAADQWRIVEACRVRWIDDPHGLGEEFSADLKVISRG
>MGYP001561007815 FL=0
IEKNTITVSKKINKDELPNGKIEITLKNINWINRKPNIGESLEARSRYRQTLEKIKIKDEKTIIFEKPQYTLSSGQSLVIYDGDICLGGGIIS
>MGYP001231096471 FL=0
LKILLLGGDTGESEGGAVAKEDFGKVSGDDCPVSCPDDSLWGVFAGTAAPEIHSGNENGRPFVLGLVDRVIPGFSIGGITDIPEEMLAETVKGDAPHVAGGDDAVRVDIVPHHGDGSARHLLDGNQRHFRQRPGGRR
>MGYP001181966303 FL=1
NTLTNYNSFYADEMNTTNRVENAFVQNAGSSSETSNNGLSSFHGGATDLPDMKFNKERNYDGGGTFLPTYDNGGMTTEHGMAMLQKGETVIPKTQNMLSGGGGITLNIGGDIVTNDAEDFAQRIADVLPEALRRQDDMGGI
>MGYP001558603255 FL=0
MLCDNCKERDAVINLTQVEHDSKVTLHLCEQCAQQKGVETGETVLKSPLGGFLTALGKGGGGAALLPTPTDGLRCAACGATLRDFRDSGRLGCDQCYVTFDFHLRDLLRRLHGSSQHVGERYELPGVDDADPKGRLLELRAQL
>MGYP000721412648 FL=0
VSMGSDGAVLLDENGYSYKINALNTKDAINTVGAGDSMIAGFIAGYKLSSKYEEALDMGIAAATATTASMFLGKKEKIYNIYNDIKDARLSKKGECIDW
>MGYP001793408712 FL=0
MQEKDIQEKDIQNYIKKIILDEKTLDKKPEILVSYPEKTDEKGHITVICGKNHSGKSYVLKKISEALTKTEERKKYNKDEGILQCAETNLKVEFSSLGDDLPEVGKILSIGDSTSTKRIYEQINSITFKELRDNKIFTCALYFNDDKNSFLKILTSTNLKENFRFSSIHPPVLYSNKFFDTLLKNRCQQYLEQYFQQYFQQYLKHYLKRYLQQNFRQDFKQYLKQYLKQYLKQNFQQDFKQYFQQYLKQDLKQYFQQYFQQYLKQNFQQDFKQYFQQYLKQDLKQY
>MGYP001036737385 FL=0
MAGKLAIQGGEPAITIKDPE
>MGYP000214490624 FL=0
RSLALYDTLLDEMHDDAISHTEVAAELAQKTIGNGESDDDDTGAGIASDSPAEASKVKAEESEDDLRLGPDDAESWSDDPVRMYLTQMGEIPLLTRKEEIALAERIETTRAAFRRKLLECDFVIRASAKVLNRVFQGELPFDRTVQVSVTDQLEKEQILGRMPHNLRTLDILLQRNREDYEIATNKRQRVAHRRAAWRRLGRRRHRAVQLVEELGLRTQRIEPMIKVVEDFSRRIDELKATLTSMKKTRRSLTERKPLMLEYRSILRCTQETPTSLRNRINYLKAVYCEYQTAKRGLSEGNLRLVVSIAKKYRNRGLSFLDLIQEGNAGLMRAVDKFEYRRGFKFCTYATWWI
>MGYP001362031269 FL=0
GGPGGGPAAGPRRPFEGVGVGGKDTRIEQKKQRCLLGGEEGGDDDGE
>MGYP001241401404 FL=0
KDIFLKIILLFPLLLNSQIQRVDPPNWWIDFKNNSFQLLFKGESISNLSPTIKYQGLKINNITRSNSSDNYLFVDFAMDSTIKPGKFTIYFNGNPQIKYKYELKERSFDKLRFNGFDSSDVIYLITPDRFANGDYANDVIHKLRENKINRSDDYARHGGDIKGIIDNIDYLSRMGFTALWTNPFLINDMEKHSYHGYAITDHYKIDPRLGSLNDVINLSEKLNSKGIKLIMDQIVNHCGLEHWWMKDLPFDDWLNFQQEFQSKPISIDKMRISNEYNQDSINKYLIKTNHRRTINQDKYSSQFDEIKMLNGWFVSSMPDLNHNNQFMSRYLIQNSIWWIETLGLGGIRQDTYPYSDKKFMSKWASEIMYEYPNITIVGEEWSYNPLSINYWHKDSNNSDGYVSNINSVMDFPLQKSIIEGINEKESWNTGFIKIYESLSNDFYYSNPFELMIFIDNHDINRAYTQFNKNIENFKMAFGYILSIPRIPQILYGSEILLHNSDRIGSHGKIRSDFPGGWKDDKKNGFNDIGITNNQKDAKLFFKKILNFRKSSRAIQKGETIHFAPFENIYVLFRIFQEELLMIVLNKNLESYKLNLNRFREIDILDKTYLDIIRNDSIKVKNSIIIPEKGFYIFSIR
>MGYP001468330683 FL=0
KKLTPIMTFGKMPIANGFIDKKDLKKEFFFDMSIGFSEDLSLLQLLDHPKPEAMFNNNYPFFTSSSRFMVDHFKSFSNWLKKNYSNHIKNIIEIGSNDGTFLLNFKGEDMNLIGFEPSSNVSDLAKKKGINSVNDFFNTSSIKNYSNYINQTDIICAANVICHIPNLPDLFETINMCLNKNGLFIFEEPYLGSMFSKVSYDQIYDEHIYIFSATSISKICSLYELELIDAIPQTTHGGSLRYVCGRKNHHKQSINVKKILDQEKKMNLDNIESCLQFKKNCKNSKKKLREKLIKFKMQNKKISGYAATSKSTTILNYCDIGPDVIDYICDTTKEKIGKLSPGKHIPIKPMEYFYNNQPDVAFLFAWNHKKEIFEKEKEFSKKGEWMAHVEL
>MGYP003628530332 FL=1
MILLDSAQSMIRNEPITLSAVILVLTGTISYLYRERDKDRKAERERFLDQIDRLEEEINDLRNRKEKRKTL
>MGYP002780399917 FL=0
TGQIERRRETGNVVSSISADDVEPAAVSDIADMLTARAPGVIVQNNSGTTGTSQRIRIRGSNSISLSNQPLLIIDGVRVNNNALGLNTVEARAVWVGGQETS
>MGYP001284371659 FL=0
HGVGETQVRGSSSSASSSSSLKRNAKEHRNPLARTKGENDAASLGGKYERSKSKLGDVLVPPKAPARGVAEEGKLGSTTIESLSRDGDEERARDDRETDETMKKLDGYFNFDDNASNNKASEEKKSSASSLSSNDDAETAEEAKTKVEFSARKNEEDGSKTITSGTKIDESISDKDALDAYFSAKSSSSQAASVASSSSGSSSGGGDLSSAVKTALDARADEDPSLEDLKSSLKSGKTVNGEELEGKVETKPIASTPKASSLTSSVNMEVEAEKLLKEASEETEKSLSSTTKTAATGSIDSTSSTAAASEKSKYVPITTSHSMRSLSPIAQKYLRPRATSAYASTSSTSSASAAAAAAPSLHSDLASSARSLYSRDASTSGKSASSNKNAIAAKYANMFSLRSSDASSSSGKPSTGYA
>MGYP003656136555 FL=1
MLINLNVKNKYTNCVMKKGRRYIEPELGKGDKKGKNIKPKKTKGFAWDGKSRPVDDAYRENWKVIFGKQEKTTAEKENEEYLEEIKNKL
>MGYP001595159463 FL=1
MKQLNDMMRVGLGVRKMLSVCPHNPQPTTHSGNCLFQSCRAQSILEFTFSTIVFLAMVSGMVLIFRWAMMDLAERRFDHDRNLTVNSLTPEQQLAPDFHRVRAMDTFLFKKP
>MGYP001794431668 FL=1
MYVQVAGLQCNNAVNCSTVTLIWTDVNSVTVIAGSQENFPVVSDSTMTVLLTDLIVVQHSC
>MGYP000352505163 FL=0
VVISAPVFSKQLINTEIVTGGNSSTQVVAGEILTYSIVITLPEGTIPNLLLSDTLGSTSGALAYVNCVSITASANVTRTGGSGGTTGNWPSFALMAPPTELPTDTVSLTDWAMFETRLEPMQSRAHSFSVLLPISGPGSDIATLQRDMDLVRRVVSLEKPAHTRFDIQPYWTLFRLGQVRLGLDTLLGDGSRDPQLAPAMVLGQGHIGSSRTASRRDVPPDRILLEC
>MGYP003280527331 FL=0
MSDGTAVQFKTEKRRFLCFFY
>MGYP003443885239 FL=0
GVTSIGNDAFRGCSSLSSLVIPDYVVNIKGNPFSGWNGELKCLSPYFIYDNKVLFNKDKSKIIAFRDKNTTSYVIPDSVTSIGSGAFRGCWSLSSLVIPDGVTSIGDYAFVGCGSLRSLVIPNSVTSIGGGAFSDCESLGNLVFPNSITSIGDCAFDECFSLRSVVIPDSVTSIGDYAFDSCRSLTDIVIPDGVTSIGDCAFRGCRSLSSLVIPDSVTSI
>MGYP001559223103 FL=0
MLAFRRDVQTTQRLGGRSLRFDGRRPVRGLGSAVVVGSGGGMTVHGVELQNCNSLPFGAQYSCSLA
>MGYP001074122584 FL=1
GIAVGMATNIPPHNLREVAEAVLWALDHPEATDEELLNALLARIQGPDFPTGGLIVGRQGLEEAYRTGRGSIRMRAVVEVDEDARGRTQLVVTELPYQVNPDNLALSIAELVKEGRIGGIADVRDEGSLRTGQRLVIVLKRDAVAKVVLNNLYKHTQLQFTFGANMLAIVDGVPRTLRLDEFVRYYVAHQVEVIVRRTRYRLRKAEERAHILRALGKALDALDAVIALIRGAESADAAREGLMQLLDIDEIQAVAILDMQLRRLAALERQRILDELAEREAEIADLTAILADGARQRRIVGEEMTEIVDKYGDERRT
>MGYP001605154428 FL=0
RLIKSLRAGFLADSFGRSKRQWRGGSHWIICNHXHRYNTHHRGHHDSRTIISSNSWRGRRIEHSWTGLLYMYVRFKVX
>MGYP000199882868 FL=0
MGKAKKFFMYLILTVASILSVFPLYYMFCASTNRSIDVIAGKLIPGTYLIDNFKALIAQQNLRLALCNSFRNATVLTILCLLVCSIAGYGFEIYHDKGKDILMSILLLAMMLPFVAIMIPLFKMFTSWKLVNTWIALALPSISTPFMIMLFRQAARSFPHDIIEAARPERNTDFLPDVHSGDEIYLWSGDDGYIYECVEQLSVADDHFTGQQGDHHADVSSQSEEWIQCGLWYADAGSIDLYTSYSDHLPVFTEELCKWNYGSSEIMQQKMPKQETMTQAHIRKAQGAFLLAHRMGLIEDPSMEGLKARRKKHNEELRRMEQEGQRFYGPHYFSAPAYLQYELTRFKMDFAEPCEK
>MGYP000548054597 FL=0
MLRKILVPVRGDGKGDNVLAHAAALARGFNAHIEITHCRAKPENLLPFGVPIPAALRAQLVESTSQVFDIEDYNLPYFIMFSDYRVATNKKYPEIENDIAESLCFFLLPFVYDNETYDEYLSFYNSYEEDEEFNLYSYKTKSGKYI
>MGYP001129376977 FL=0
MNDFSETNPYTPLVFNSLEVNEQNFCSNLLNRLIVFTQASFHYSSIESLHLFREIVNSSRSSQGSLFSPFFFFKTKKTNLKFQISNQKDKDKEKEKEKEKDKEKEKDKEKEKEKEKDRPKMFKTDAQLLFYCYLIAPSFRLAKANVKLSQDVIFFFLSK
>MGYP003295116401 FL=0
LREAYDYLLLDLPPVAEVTDAMAVAPKVDGMLLVVRQNYCDRIVLSETVQQFAFINAKILGVVFNCTSEHGGKYYGKGYYKGYYRRYYKRYKGYGYNQENQNA
>MGYP000887695439 FL=0
KGEYYLEAMVFDLNSKGQYLPEWYDNAKDMTEATPVILDCADAATADFYLEKMPEPVYHKVSGTVKDAETGDPIQWAIVEFYGNDPNGYGYSSYASTDEDGYYEAQILEGVSYIAYANSGYRGKKDYDTIPYQDIYLPQYWDGKSDPSEADPIVAYEDVENINFNLEKYVFHENLITGIVVGEDEKELSDIMVFAYLIDGENVDESNYKYHGFMGYTDHNGKFYLNNLVPGTYVLFAVPARPMKYAPGFYMEDDLAILTWEDATQIEITEDGEFGPYTITLPLFENIFGEGIVKGKVSSEIGKVKVDEEVQGNEDGLQGAFVHVTDYLGARIKTSETNSKGNFELKGLANGTYTVTVDKVGFKSTSFQITITDDNKVIEHGVTLVKDDNTTDVNDDVLSPLSITVYPNPSVESFNVQFNSISGKSDLQIFDNMGRVVYQQTVNSTNGANYININSDNFTNGTYYIRLSNGNSTVLTPVVIAK
>MGYP001202805109 FL=0
GVDGEGGAVRTWLGLGSGLRVGVGSGIGLGIGLGIGIGLGLGLGLPGI
>MGYP000917578306 FL=1
MNKKFTSLLLLSSVILITTADKTRTKADTTDSSIEQQENIINEAQSAKDKSLSDISLLQSKIDGIRVEKNKTEQKISEIKKQAQNLNNKIEELSKNIEKRTDVLESQARSAQVNSNATNYVDTIVNSKSLSDIIQRLSAMATISSANKSMLSLQIKEQKDLNNKSDEVKKNYIEYDNLVKNQALQEKDLTSQEKQLKVASLNYQSTIETAQDKKENLLKQKSTAEKEAKIAQAEKEKVASAQKSAKEAYTSSSVTNTPSSSVEKSSSPKKENTKTSSNTGTTVEQGTGTSSNNDTNNSTSGTGNPNYNPYAGGGCTDFVWQYFAAKGIYIANIVNGNGGYWGTNGVSQGVLRRTNLAPGVIASGFTFHFTGYGTSTTARTSPYGHVAVVTGVNPDGTFNVQEAGYGGTFPWGNVRTNISPENVVFLLPN
>MGYP000491110560 FL=1
GTAIYGETRAIPLNLVDFTLRDFATRQSDDSQTISYLETDYSNSYQFNLDSNNILRLVYDLAPTARGFSRSFDGSTSATNFTVAVIPISARAPVIVSDGGGPTASLSIAENGAAVTTVVTRSNFRHLAEIVRLATRMMTGAGLAVVLIAMTAAVLVIFAVRSGLAIHRETIEVLHLIG
>MGYP001489963689 FL=0
SERNKYSRSIQVSLKNIIILMFFGISLFGLAVIGTLRIINKEPLTRELNDLRADRLLLKQIVSDLHASGIIDSTKAYEHFVYEFYNSHKMSFPDLAPVMGYVTRGVHMGNNHLGIDIAAKYKDDIYAPADGRIIFSGVGDDLGNTIIMSHDGGFITVYGHNATNLVNTGDSIHKGQVISQVGDTGKSKGPHLHFEIWKNNQVLDPREIIKKYKEKDVSIRETRK
>MGYP003582534822 FL=1
MLFFAQKGTVTDGHQYIPAVIEAGAAAIVCKDLPEVLQPEVCYIQVDEVAPVIGLMASAFYDHPTRKLQVVGVTGTNGKTSVATLLYKLFNQLGEDSGLVSTVENRIMDNVIPSTHTTPDPVSLQALFRQMVDASCTYAFMEVSSHAVHQHRIAGITFRGGIFTNITHDHLDYHQTFDEYIRVKKQFFDHLPKGTFALTNIDDKRGMVMLQNTKAAKKAYGLRVPCDFKGKVFENNLTGLLMNIDGQDVHFRMSGLFNAYNLLAVYGAAVLCGKDKIDILTALSNMQGAAGRFETYHSENEKILGIIDYAHTPDALQNVLSTIKQFGQQANIITVIGCGGDRDKLKRPEMAQVACELSTKVILTSDNPRSEDPEAILDDMEAGLTPGMMRKALRISDRKAAIKTAVSMAHADDVILVAGKGHETYQEIKGVRHHFDDREVLLEMFKLLEK
>MGYP001208310892 FL=1
MKKKKAYVVGTNVSKSLSPLIFNYWFKKYKINGSYNYKEIKEKKFDLEIKKILQEEGVRGINVTIPFKEKIIKHLNQQNKHAKLIGAVNCVSIVKEKTKGINTDWTGFKDCTKHIKKRNVAIVLGYGGSAKAVIYALKQMGFKKIRVFNRTFNKIKRLKNIKPHKLEEIPDYFYTADIIVNTIPKNFISKLLKAKQKPTNKTNKTGYGFDLVYNHPTLFLDSISKTKRIYGVEMLAHQAAPCFYKWFGKKPKVDKKLIKKLINS
>MGYP000076073552 FL=0
DLVLGVFGWVVRSDKLGKGTLDHTLKIQVESELQYWRSVLNRVVAVIKFLSSRGLAFRGEN
>MGYP001544161807 FL=0
MGLQQRLDSLALNDFFTLYHFIWTHSKESICNTTHCGTFYIPPRQIVPKVYNIITRTFPSVARIQGRDKDCTEICFAVAFCNSGEHVTGSSGDGFQLRRCCFALISPRTCLRPDCNDASVHRSVXERASLAVRTTHGEGNAGXTKLLRRRCXLX
>MGYP000196507220 FL=0
RFMAEKRELQMKEITEQLEQGVKELFTSEMYTEYLRTMSQFHNYSFNNTLLIAMQKPDATLVAGYQAWQKKFKRQVRRGEKAIQIIAPAPIREKQEVEKIDPETQEPVLRFDGQPETEEVEIVIPRFRVASVFDISQTDGEPLPELETPELMGSVENFKVFMKAVQEVSPVPVRFDEISSGAKGYYSNTEKEIVIQNGMSESQTMKTGIHEVTHAMLHDRDFMEEQGEKKNQMTKEVEAESVAYTVCQYFGLDTSDYSFPYIAGWSSSMDMKELRTSMDTIRKTAGSFIDSMTEVIQRLMWEQPELSLSAMKQAEILIDRVEQERTLFSGEERNLLVNYAYKFDNAEETEKLIRKLAEAKAIPDLRSATEICRDIQKEIEFLPDGMVGMTELHRYGYQNEGCFRLKGRGHMNCFRKVLRYSPCIRMIRRQCWMMKENLIRMTVFSG
>MGYP000592636036 FL=1
MTDRPLWQMTATETANAIRDGQITAQQATEAALSRMQEVNPHLNAVVEDLSREALEQALGMESGYVLDFSDRTFNDFFYETIAIDPEDQSQLFNGRGTSKAKRLRSFIERAQPALVAKILREMWEYRDAMVFAPSAHNEEKLKESYFTTVARIEGRADVIDTSAIETFEPNETLEELVASIRRDLDANKPQAALDRLHTYCMKRFASLVRKHGGGECGKDDALHARVAKYVKILGAQKNLNPISERIVKSSISVFEAMNPVRNDQSFAHDNPDLVQMEEARFVFDSVTAFLRFSKAIDGRFFED
>MGYP000923000473 FL=0
GISVENTSMFEITNFDIVIEVIISGTISIHFIYNTDVFENETIKRLSGHFRNVINVIVNNLEIEVSRVELLTEYEKKQIKYGFNNSKTLFPDNLAVHEVFEEKVKNTPENKALSFNGFELTYKELDEKANQLAWFIRSKGIIQNSIVAIIFKRSIEMIVSILAILKAGGAYLPIDPMYPIERIDSIIEDSGAKLVLTQKNIFDQANISENGMFHRNNIELVFLNDVEYLLSQYEKNYIQNINVPGDVAYVLYTSGSTGKPKGTLITHYNICSKIVNANF
>MGYP000510006770 FL=0
RVGKRTWWYENGQIRQESNFKDGKIDGKLTEWNENGQIRLESNFKDGKRVGKRTWWYENGQIEREENYKDGKKNGKWTWWYENGQMEREENWKDKIPDGNWVSWFENGLQSSEGNFKDGTGVFLQLHENNQKSYEVIYKDGLGKMTEWYENGQIAGERNYKDGELHGKHTYWHENGQIFEEANLKDGKWDGKYTRWYENGQID
>MGYP000191306956 FL=0
LRTQTSGVQIRTMEAEKPPLRIISPGRVYRNDYDQTHTPMFHQVEGLMVDKNVSFTDLKGILHDFLHHFFEESLEIRFRPSYFPFTEPSAEVDVMGKNGQWLEVLGCGMVHPNVLKAVGIDPEEYTGFAFGMGVERLTMLRYGVNDLRAFFENDLRFLKQFN
>MGYP002707266309 FL=1
MNKFGLDNVVTEKANVELTDLDNGVKVSFSGDIDVQNPEPIFVPFFEQIHNKIIENGIKYVELDFSKLTFLNSSGIKTLIKWITKVTPLPADKKYNFKVIANSQITWQETSLKMLSMLAPGLIEIQIQ
>MGYP000629646757 FL=0
MPFVTTPDGTEIFYKDWGPRGGQPIVFHHGWPLSADDWDNQLLFFRDKGFRVLVAQRGAGHHAVALEKLDVPVVVDGNPRQRRLWFPLRSGRDAQDLVGRVVVDVAVLDLAQVDAGLH
>MGYP003443031209 FL=0
PSVMVSVTTVSTVYVPIMVSVVVSVAVKIPVVVIMSAIDVTPVMIPVVHCCTGRAVACTIMMVAIVSAVPSVTHTEMTGGVMVDIVVTTTMVPTSSSYDMPGMSTTIRGVEDRATIVEIVTMRIACIDGEVPETVTPVEWTIEVGGCTESA
>MGYP004007491671 FL=0
TTQSVHDTLFELDAAGKLAPGLVEAWEWKDSLTIVLTTRSGVKFHDDTEFNAEAVRYNLERIRNPDTGSIRGGEISALDTVEVLDAKTVRLRLKQPFAAFLYPLVDVAGCVVSPTAAERWGKEYGLHPAGTGPFKLVEYLKDAHSILERNGDYWIPGKPHLDRLVLRPIPVDSTRLAELRSGGVQFAESLPWQDIQRLRAGNEVVVSEKVGFRWEWFGFNVREEYPGHSK
>MGYP002477604874 FL=1
MESMHFLHLLTAVAALLLGALLGGRIASLLHIPRVTGYLLTGLLAGPSFTQLVGLPSLLTTDALQELAVLSKVALALILLNIGGQFRTEQLRRFRHRILLFSASESLGTALLVSGGTVAVNQFYLQQVVPGLSLLGTSLAFGLLLGLVAIATAPAATLMVIREYEAEGPVTGTLLTLVGLNNILAILSFSVAAHLMFHGDSGMGQLAIKMFGPLLVGGSLGFFLSIWGQRLELDTEFKLLLLGGAVATAALCSALGLDVLLASMALGIVLANSSPRWHRMQEALRQVDYPLYVAFFVLAGAQLHLETLSHIGLLGVVYVVARTLGKLGGAWFGAKLGHFGERERKWIGITLLAQAGVAIGLAEQIAQLWPVGGHLIETVVLGSVVIFELIGPLAVRHGLVSAGEVPILSLLQKRAPQNAIEGFHSVLSHFRSSIGLPAGHRMRDPGDILIRHVMRQNVETIRNDTPFNELLRHISHSRYDRFPVVDESGHFLGMINYTEIRELLFEPALAKLVVASDLVSTSHLAVNPDQPLREALQLLQKHRDISYFPVVDPEDQNLLLGILRQNDVLAAFRRLDLQ
>MGYP001551819414 FL=0
TLDASLGDVAVLYRTRDQGEVIANALGKLGLPVKMTGKATLEQSENIDRVLGALEFIAGRKTPPVDFEGVLETSSALADLSAREVIHKVSETLFEEDGSASADIAPLVRIAKKVDEHWAKKVTKKVSFVKPGRPIDDFLDRIALQGKADLHESKVDSITLTTLHASKGLE
>MGYP000703270391 FL=0
MPKSEKLRDVLIGFDSAWTDSLRNPGAISACILDGGQHVTFYRPRLATFEEALHFTRQVGGDADYVLIAIDQPTVDPNRDG
>MGYP001030102971 FL=0
GRYRSEPPPRAGGDRSSRADGTLVIPVEGAGLSVRVAFASPIQERGYAPLVEACGMLVGLARAPSAEASASLRPVPPPPEPATVAPAVRHLYADALRVAQGDVSVLIRGESGTGKEILARYIHAASRRAAAPFVPLNCAALPRDLLEAELFGVEKGTATGVDARPGKFELADGGTLFLDEIADMAPDT
>MGYP000938480968 FL=0
FEAKLKELSDDAQVNGFRHGKAPRRLIENRYKKEISEQLKNELLYQSLEQMSEDKKLNPISPPNIDPNRIEIPMEGDFVYEFEVEVRPEFNMPEYKGLKLNKPVHHYTPEEIVREERRILATYGTPLPKEEAVALEDMVILSGPVKYGEQQIGMIKSHPFRVDGQLAFKDGVAPKFAEQ
>MGYP001617072387 FL=0
MNRDEFADKTVESYKAACLEHLRQFLRSMRLRDKVSSNPTRLGNLSVECIWHEGQNHYIENYHKQQWAWGFTLFCPQGHEIARRLVISQEQVGAFLAHQERPCYACKEAKP
>MGYP003654168572 FL=1
MEELVDNFERLDGPQKRKKLEELLRIDRRLGEIDDLPFGVPPNRLEACYYDVLRWLRSGEDVRAPEVGDLVDVLAGTYHTGFGRMRDTPAYHGAIVLKLDSHGRIVARLPDSAGPFAAEDRAMHLGWNVKPTRKLYLSFDEYKLKRKE
>MGYP002623322284 FL=0
PPEETHRLLPCLQTGIIDDRGAAAWQWRNRGRASPGGPLTMDMAANRTIRHKGGFPPATPGRAQEWRKPMFKKTAAAMALSLGLVLGAGAIAPEAAAQTRVTLKSAKAGTSYYVMMVQLGEMMKAQSGGKIQATVEESQGSVQNVKESARRPGNFLFTTPPSLLVSAREGKKPFEGETGYDRVRALFVVPFVTIHFAVQQDSGITDVMQLEGKKFIAGGKG
>MGYP001568520366 FL=0
HQLRVWLTVGDVLAVRQQPQALIVMLIVSLFRHLFVSYMVNRFSSPIS
>MGYP000925408016 FL=0
MVEHIGYHTLKEGKTLLAIFNALEGFANNLTGLAGKNIEISTDIPSSAKAPVKQT
>MGYP003579269052 FL=0
MNSDVPGPDDGAAPDALDFASLDVVYIDDALAVVDKPAGLMVHDSALARGETDFAADRLREQFGRPIFLVHRLDRATSGCLLLAFDREVASALGKTLMARDVEKDYVAVCRGWPAEERFTIEHPLDGGPGKPVQKPATTPVG
>MGYP003309607925 FL=0
MSVKRIFLIVLDSVGVGELPDAAKYGDEGSNTLKACV
>MGYP000957236481 FL=0
MVEGALDARHLPGLAPFLSRETLDRLALKIGEGQIDAGCLTSLAPFLSQEALSRLVDQAAEGTFDAVHLTGLAPFLSRETLDRLALKIGEGQIDAAHLPALAPFLSQEALTRLLGLAGAGKLGAETIVALAPFLDSAVLGELIKNSARQK
>MGYP000599625106 FL=1
MIENNQKLGSLSSGKNFDRTQSWVERSDQISNSNTGIFIQISLPAKISGFYGLKEFNFMNCEMSGMFGPNLAKCISFYNTDWVKNEKYFSMPTNGIQKVTIPTSAVYKITAFGAGWQNYGAMAKSNVKLENGTQIYVGIGQRGKHISDGCGGTFVTFRKNGKFVPLIIAGGAGGGDYENEYGNGSTDEFGKKSDSIEESNRNIGKGGKSGYSNCYNGGNGFEGEINENWEKT
>MGYP001217081736 FL=0
SFADKFLEVLIFRTALFLFLLTIILQIIMPFCIYFLAPGFLDNSLVLDQITTLTRITIIFMPLISIVALLGVATNVSGKFWILSFTPIILNFCLIISCFFISDNWTVKSLPLALATVLGGVLQLIFTLIMIKKFGILKLSFKSKTIKEYDQIKLYLKQTWKKFLPAAFGGGILQVNLLVDTVLASLLGFGSVSYLYFADRIAQLPLGIIGIALGTALLTSLSKSSAIKDTKQFSKELIISLKIGLFFSIPASFVFINFSELFIKVLFERGEFSSLETNQTAQALIAYAFGIPAFIIIKSCQPAFLADGNTKTPMYIGFILLLLNVFLSYTLMHYLKHSGIALATSLVSWTGSIMYIVLLIKKGKISKFKFTFKYDQFNLFAVLIYALKIIFTSCLMVLVMKSIFYFLNIYKINEISILLFIVLFGMLTYFSTTYFLKYIPQELLKINVFKFRKVN
>MGYP002526846326 FL=1
MIRRSSDKISVTKPSPFNGIGEITVRSLLNGPEEMENKGRVFGHTTVYPGSKIGLHMHKGDSETYYILSGHGKYNDNGTIIDVQPGDVYYCADGESHSIEAIDEPIEMIALILYTT
>MGYP003577118151 FL=0
MIPSQINDTSLKIFRDGMAAYVVFEDTEWEILKNYIELKVLQKKDHFAVSGKICDHIGFIVNGSVRYYHIKDGTEITGYFSFENDFVSSYKSYVTRTPGTGYIQALEQTEFAIISYNNLEQMLNHPL
>MGYP000225436725 FL=1
MRNTFHLKTLAVAIAAFSVASVTNAAGLDRSGQDVTAFLQDGIYAEAVYTYIDADVSGYDNGRVATDDAGYVQGNKTGDIAEYYDFFRYGVKADVNDTFSVGILYDEPFGAAAAYTGDSNFT
>MGYP003337284868 FL=0
MKEGYGEENSDIRRYSGDYLNDVPHGYGTIIYGKNIYTGNMKNGKKDGIGTIRNFTGKFEYHYYYQGKKYRGPLYRFPIYEEKKAFWKEDKFIVDFYIKKGELMIQNYLNSMNEKDIKYCKSNNIRNYIYKNFH
>MGYP003906308351 FL=0
AYGFVRDCDGAERHQGPLVEAALAAKRPGDAGELANELARVCLESGNADKAENWYRKGHDAGIAQPDFTPATKDLWEFRTAHALAALVGDQGRQRRDRVDARAHERVGVAEAEPIVPVASAPATAAFSRGCVAAKITGLPRDVLYAHALTMKPEEPARS
>MGYP001106728357 FL=0
MINAIIFSKDRAPQLRLLIYSIQKNAPHAFNLNVIYKYSNDKFKEGYEKVKGEFSSICNFVEQ
>MGYP000556042202 FL=0
MRLKLLVALVAALLLSACNDPHTGTFIFTAIPDQDESQLEKRFGTIALYLEDQLGVPVKYVPVKSYAAAVTAFRNCLLYTSPSPR
>MGYP003339182432 FL=0
MISRRNFLGLSLSTVALQRLSIFDAFAANADISHGLRTKKEVALTFHGAGDLKIARDLLAIASDAKTPISVMAVGSWLSANPEIGKEILAGGHDLGNHTYNHKAMLHLNLNEAKSEIAKGKAAIIKSVGSAQKYFRPSGTPKSNATIRKAAIASGYSNCITYDVDTLDYRSEEHTSELQSLRHPRMPS
>MGYP000070210673 FL=0
MRSKYISKLILLCAIIIISNINVFSQDEDSIKTIEMKEVMVSANKTEKPFVELTVPAKIISKKEIENSGHSRLDEIISEQVGIITVPGFGGSEGIQLQGIDPEYTLILIDGLPVIGRVAGILDLSRISLASVERIEIVKKALFYDLKLNKKKVVVISFSSLTTELCKKYKSNIILRGLRAVSDFEYEFQLAGMNRKLNKNIETLFLMSDVENQIISSRFVKEIVNLKGDIKKFTTKSTIKLLKRKYE
>MGYP000373531853 FL=0
TYWFLIHFIFERNKWRYAKINESPGILTIREPNGTDRVELERLEVEEARETLGVFIAMDGNQDAQTQALKDKAATWADKIRTGSFSHAEAWFSLQYCLMKSLEYPLMATCLTKKQCEDIMTPVRKAVLPALGINRKLSLVVSQAPKKYQGLGVLDLWTVQGSLKTWLAINHGDASTITGHQLRASMELHTLEIGLPGQLTQHDFEIYGAITTTSWIKNLWKFCQHSKIQLNTTTPQLQLACTNDSLLMGTFAEYGYREPQLSLLKLCRLHCHAVRVSDISTGDGRRI
>MGYP000570708825 FL=0
LERYDVDPANVLGAGDGGNDVGWLSGIGFPVAMGNARPEVHEIARAVAPSNADDGAAHLLERLAAAHGGA
>MGYP000034617079 FL=0
RVRNGAGRAVVVQRLGQDRNVGTGRVWPYQDREVFDTADGARFDLDSAPGGLPNEGYFGTRSTSRA
>MGYP003372218023 FL=0
MTNYSVYIDESGDLGINKGTHWFVISAVVV
>MGYP000394300602 FL=1
AKERMKLVDLDPAFGARSVNEGFSGGEKKRNEVFQMAVLEPRLAILDEIDSGLDIDALRIVAGGVNALRRADRAILLVTHYKRLLEYVEPDHVHVMAGGRIVRSGGPELADELERTGYAWVAGAAPETAAAGA
>MGYP003610839716 FL=0
MIEMKLLVTGGLGFIGSNFIRLMLHEREDCRIVNVDAMHYGSNPDN
>MGYP000586146873 FL=1
MQDELKVYEEKMEKSIEAMMSEFASIRAGRANPHVLDKIKVDYYGTPTPIQQVGNISVPEARMILIQPWEKSLIKPIEKAIQTSDLGINPNNDGSCIRLVFPELTEDRRKELAKDIKKKGEAAKVAVRNIRRDANDAFKKMEKNNEISEDDLKDAETGIQKITDKAIEKIDKAVDNKTKEVMTV
>MGYP003291547436 FL=1
MLSFFVGALSSCAAQLLKLMIHGIHHLVEHYLIEQHHWWYLITPMIGITLAGLFVKYVVKDDISHGITKILYAISQRKSIIKLHNTWSSLVGSAITIGFGGSVGAEAPIVMTGAAIGSNLAKLFRLDQKTMMLMIGCGAAGAVGGIFQAPIAGLVFTLEVLMMDLTMTRMAPLLISSVTATAISFLANGQEAMFPLTNSEPFFVERLPWYILLGVMCGLVSLYFTRGMNHLEQFFKHHVQNIWLKFVVGGSVLGLLLFLFPPLYGEGYDVIKQLINGDSVSAIVNSPFEQLGKSNWVLVGYFVAILLFKIFASVATNGGGGVGGIFAPSLFMGAITGFICARLMNMIGISVPEANFALAGMSGLMAGVMHAPLTGIFLIAELTGGYHLFMPLMAVAVISFLTIKIFEPHSLYAMRLAQKGELLTHNKDRSVLTLMKMENVLETDLRTLHPEMTLGELVKVIAESSRNIFPVIDEEGRLLGILLLDEVRNIMFQPRLYDRFIVKQLMNSPQAILTNTMPMGKVMEVFEDTGAWNLPVVDEQKKYLGFVSKSKIFNSYRHVLVHFSEE
>MGYP000629932273 FL=0
KSDVSIARTIWQENEIRRLERAVTGYFDYIEDLIERENTFNMEQFAASVNEFLTFRKYQILPDKGRISAAQARQRQKANTIFLIKTNGLILTLTKKLGGCWVKSNKMK
>MGYP002789926533 FL=0
REALDALDASERAAQEALLKAREAADAASAAAGEKARDKRGVVLEPGDAVEVATLGGKTGKLIERRGSDAVVMVGALKLTVPFAALRRVSQRHLKDQAPAIAIIDVPEVMAKTEVDLRGLRVHEVDDAIVQAIDAAHRADLRALRIIHGKGTGALRERVNQLLKGDKRVKSFRLGAWNEGGAGVTVAELS
>MGYP000243790712 FL=1
MKTGFRKSQKGAVAIEFALVFIIFFAVFYGLVSYSLPLVMMQSFNQATSEAVRRSVAVDPNTPNYSTVVLNTANATLTQQLSWIPPVFNLVVGVDTSSQYSASGLLTVRVDYPVSKLNQVMPFLVLPVVGTVPNLPTYLTAKSSLQF
>MGYP003301794412 FL=1
MNKTKLLILLFFIALATNVNAQFGIGLKGGLDFNSVTRSNSGRIDETYHAKNGADYGIILSYQINEWFALRANVEMLSRSHTMKRNLNAVKGLYTDYKNQYLTVPVMADFTFGGARVRGQFMMGGYVSYWMMANVSGNTFDLYNKIRPFNEKMEFNEYHNRFVAGLVAGPGLSVALTEKISLELDALLYYDLVSYMKVSKVSPDPRYNNTASLTLGVIYKL
>MGYP003383111361 FL=0
MYKTSKLRKLVFQRLTTPEGTRAQQSLSSGTGQSLHDLVVQAMINVKLVKW
>MGYP003686761737 FL=0
TPHAPIHARDTRQEAPVFFQAEDGIRDRSPSRGLGDVYKRQVQLNEKFSDGKYIVKSQYGNSKSTVNTSSFLIATSNISSMESTSSEIPTWIKNNAGWWADGSIDDDSFVQGIQFLVQEGFMKITN
>MGYP001302444474 FL=1
RSNSDSNWANEGNLENEVVLEAEFDLGS
>MGYP002051420820 FL=0
GRQDRQGGQRAWTPNQTTSTITSKKIILLAYTYTYVISNYFSPTGSLLYYVSCNPEIQDKIFDEILDTIGSDEITHDNISKLDYLEACIMETLRTCPPVIEHDRVCTNDCVVQGIPVKKGVKICMPNYPAHYDADFFPEPEMFKPERFLKENADQIIPYTWRPFGSGNRVCIGQRFALMEIKIFISKLLYKFKVERTPRTELKYSPGGFFIISYPEIRVALHPRNWTNKILQKKVFMRSGILRKINFRACKEKPSYKKLCQKMVDK
>MGYP000789720163 FL=0
SSSSPMVLVDGMEYSLNELNPGDIETISVLKDASASIYGSKAANGVILINTKNGRNSEKMNVSVRLENTFSMPTMVQQVADGVTYMQLYNEAVFNTAKETGTLHAYQPFYSADKINGTKAGLNKYLYPNNDWYDLMFKDFSVNQNLNLNIRGGGRKVSYFLNAAVSNEN
>MGYP003304858611 FL=0
MVTERTRELDESNHLLEQKQLLIEQRNKDLEQALQEKDRLLSVIAHDLKNPMFAIVGALDSVLKNHSSLESTWKTLKDIYLSALNLQSAMVKLLEWARGKQTDVVCHVEDASVRKMVQEVVSLLNGLFKEKKIKVSTSFNVSHCALMDSRMIGTALRNVLSNAVKFTPEEGSVEIEVLEESGYITMKVTDTGVGMTEEQLVSIRNNENVISTMGTKMEKGTGLGFKMAKDFVEKSGGVLLVDSKKNEGTVITIKLPVALTDD
>MGYP000358995731 FL=0
PSGYHEERVMSKCENIYDTLLQVFEISSEKDIPTFEAANHMVEERLETIAHIKSIKS
>MGYP001565574238 FL=0
MKALTLPFPPSANRYWRHTAGRVYVSEEAKDYKYYAVMEALRQGILAPLVGKLSLVARFYFPFPVKGDLENRLKVLDDAMNKILWDDDSQLWRIVLERHYDRANPRVELEV
>MGYP000188450185 FL=0
QITASLGGVSTGFPREAGFDITVASEVMAILCLAKDLSDLQKRLGDMIVAYTRERKPIYARDIKADGAMTVLLKDAMQPNLVQTLENNPAFVHGGPFANIAHGCNSVIATTTALKLADYVVTEAGFGADLGAEKFLNIKCRKAGLAPSCVVVVATVRAMKMNGGVAKADLGAENVEAVQKGCPNLGRHIANVKSFGVPVVVAINRFPTDSDAEVELARKAAEAAGAEAAVMSNHWEEGGKGAVELAEAVVAACEQPADFKLLYPDDMTIKQKIETIAKEIYNADGGTFE
>MGYP000733041054 FL=0
SPCSFYTIGTQQIFANTSDWSSEFFARGEEVGLIPSSLSQSKKSYITRKNFSEIAINFYSLYTGNPAVSINISPFMDEKSPKIVKAYELGIVNGYIEEMMEGQKVVKVFTHEEESIADFNRLNDQLFHSADNANKFGNILMPVNAQIGNISYVLCAIVGGILALGGYGGFTLGKLASFLTYNKSFGQPINQLSMQLNNIVMALAGSERIFALLDEQPEVDDGYVTLVRAKWENGQIVESKERTGMWAWKHTHQADGSVDYIELKGDVVFDDVDFGYVPEKTVLHNVDLYATPGQKIAFVGSTGAGKTTITNLINRFYDIQDGKIRYDGININKIKKDDLRHSLGIVLQDTHLFTATVMENIRYGKLDATDEEVMAAARLANADTFIQQLPNGYDTLLTGDGANLSQGQRQLLAIARAAIADPPVLILDEATSSIDTRTEKIVQDGMDKLMAGRTTFVIAHRLSTVRNSDCIIVLEQGRVIERGSHDQLIEKHGKYYQLYTGNLAEG
>MGYP003499035801 FL=0
MTNSSFSVLIVDDEPNIRSGLAKGLISEADSIETAKDADEALLAFGKHDYQLVLADVRLNCSMNGIDLMRKMLLARPQTAVIVITAHGTMETAVEAMRAGAFDFIAKPLDLNLVRQQVRKAREHYQLQLENRNLRNQLANAGEISNIIGNCTAMQEVFHQIRQVANTDATVMIHGESGTGKELIARALHELSDRSGGPFLAVN
>MGYP002865127206 FL=0
MERNELKKKAKEALRSTDLDEKVGAAANEMKEKVQDVLDKTDLDEKIKAGADRLREKADANVDALKAQVHANAEQLKDKVQDALDKTDVDERVK
>MGYP000383000818 FL=0
MTLLVAGPEVEEQCRQLGLPLAAPLAEGWALPTKPRCLHLEKGPQGFGFLLREEKGLDGRPGEWEPWGRWGKVGLGVGTQAYIHLSVHRRGVPV
>MGYP000367940092 FL=1
LMSGESVLLEPILSFVIEVDSGDLGRVLFDIQRMQGEAEPPQAAGERMEVRGRAPAACMADYPQTLISATRGTGRISLRFEGYAPCHNAQEVIEAKGYDPERDVENTPDSVFCSHGAGYPVKWDQVPNHIHCK
>MGYP001277400934 FL=0
CARSVLKPRPPPVPPAPPKPLVCAAEPARQLTPRELPRVPPAVVQAEIHEHLADVSTGPDENMMRMLFEAEPDPALVFLKAVRPSPLPRTGPRAVLASSCPAER
>MGYP000821197694 FL=1
MIMQNLSLIHISEPTRLLSIS
>MGYP000868773532 FL=0
MLSINERDGVRLDALALPHRPQFFSGLGLHVDLPGLDAQGPGNGVAHGLAVRRHAGCLGHNGAIDIADLPPLLAHPPDGLGKQAQRVGAPENRVGIGEMRADVAQRGRPQQRVGDGVQQHVGIGVAEQAHGMRDGDPADDQRAARHQGVDVPALADTEIDGCVHAARLFRMASARAKSSG
>MGYP003609178968 FL=1
MLRKPVYRSWAYTADADAKSKSNAEYFEELSHLRSKEHMSFTTSPQYAHTTFSGELLSEEALALTADEILLLMDHGNLCFGGRCSKSGNKFSGSYNTD
>MGYP003113185133 FL=0
KKKKKIRIGIIDAKADQILTGIGTVADNPELGNIIDIVVGMGITQTLVGKTSIGAGSTSSLSGYLKGMVTEVGEGQVSVKKKKKVEGSTETPRDYQEGGAFPFDDLGSLGIHTAGISTAAATVPYAGRQDWFSQQTVAISTSTVGGSTITTTQPWNTVADKPGTSQYAADRGTRFDEVHVVVIDGAGKVSGNAGTILEKHLGLSKAKDAEFSAGAPSYWRSYLKTNSAFVFGGDEPSGTIDVGFDVGGFSPAGGSWDKTAEGTIFKSIGKFNGVMGGGKNYDGNTDITGDNALAVDLSKLVTGYSLFENADNFKVDFLLMGSADYSKEIAQALANKLIAVADTRKDALAFISPYRKAFLTDTVAGSVTVNNDETITENVLEFFSPVTSSSYAIFDSGYKYMYDRFANTFRYVPLNGDIAGLCARNDIDNFPWFSPAGTTRGAILNAVKLTYNPSQTQRDRLYSARINPVIVSPGGGIILFGDKTGLAKASAFDRINV
>MGYP000828330599 FL=0
MRKLNYSLKELVLADLYRYEGKTDTKSFLHAYATYEGFKFSVWLRMCSVARKKKLTKIFILPICRMIYRHYKYKYGYDIPYACLLYTSPSPRDKRQSR
>MGYP001429112534 FL=0
ESGGITQHIGAYEVIVEGDKKITFLDTPGHAAFTAMRARGAQVTDIAIIIIAADDDVKPQTIEAIDHAKAASVPMIFAINKSDLPEADIDRVKKSLSGINILVEDWGGKYQSQTISAKTGDGIKELLEKVLLEADVMDLKASREVSAQGVVVESRLDKGLGPVATVLVNKGTLK
>MGYP001154957988 FL=1
DVCFCKANKGCAVGESSTDGSFTNDSIIWRTIDGGKTWKQTYAGEGEGGLGAVTFTSKKKGWAVGRGGTILKTKTGGRKWKKVTVPAGAEHYDLTDVSFPDKMHGWAIGGLSQGATDYNIFLRTRDGGHSWDLTTFNMTEPLSILWKISFPTDTEGWAVGDEGRIYHTSDGGTTWSEQESPHTDTFIQATDVHFTDADTGYVVTSDGYLLTTINGGADWEIAHHENSGFYGIAFGDLLNGWAFGADGMAVTTLDGGETWQRTTEGATEVLLGCSFADLSAGWAVGAFGTALGTSDGGHTWRDLQTGTVEHLRAVKFIDRDHGWAVGDSGAILHTYDGGESWAPQESGTGQALAGVDFVDSLHGWAVGGDTTLLRTVDGGETWTASSADAAIDLYTVDFVDTMHGWAAGKGPGHVLRTEDGGETWDAVEVVFIQGQTVAGYFSVRFRDAYEGWLCGAVQVGLDDATVIGHTTDGGWTWDSQHLSRSTDHILQAMAVTEDGRGWA
>MGYP004345682747 FL=0
ALMISIKNFPNPSLKVYNVSALICFQSTQNPNKTAPDSPATQHRTGFKDGLATSPIDRHFP
>MGYP003480708303 FL=0
MYHSGYKKSFKITGFALVELLVSISILVMVTGAVMANHGAFNSAVLLRGQAYEVAFQARDTQLFAVSIMSDAGQYRNIYGLHFDKNNNTGYKIFRDSNRNSYFGTSEEFGRQGSLDSRFVIGDVRWVHSNGSETSINNVSVLFERPNFDAKFFEAAAPGGELSNAMAVEIDIRTKGTSGNTNGEVRTVEITRTGQI
>MGYP001578248368 FL=1
MKEEIKRLPQTLSELRKQEDEDDYSPRPRGGKPYKRKFLISFKKNEGK
>MGYP001074384480 FL=0
RHHRGPGDHGQRGQLSGRGVHHEGRLAWGPASQDPALHPAPQREGGEVQPADGR
>MGYP003184699802 FL=1
MYKKKQITCSPCFSDNPSESLDFNPFVDKVAVARPMSYYLNGGVDLDGISTRKPLPDAFDDAESIASGDVNVFTDLTVGKLDLMDMASTMASESQARALKDGARETNFD
>MGYP003330398148 FL=0
LLPSFAIIVLGTIGSIPGAIVGSIIVGFVRALSSPVLIGVGLPLGRSNYSALDGVMPYIFLVAILMIMPEGIGDAYEKWKIDRLRKKREASVRDDKLQSTTYKCFMERSYYVYLLASRRMGTLYCGVTNELMRRVYEHKLGQADGFTRKYGVSRLVWFERHELVNNAITREKRIKRWRRDWKIELIEKDNP
>MGYP001273406180 FL=1
MAIIYMLFKHISQLFSYKITLLFVFIVLFSIVYMFLDDKHFSGVNFIKDAIKEEVIKKKIEKKVDKTLENFTGDVFSFKPITANDEEDVDTKIDRVAEVTEQEVKEQDLSAEKIETSYPQKLFDRFYFSINTTTLLGYGDIYPVTNVCKSLAMTQSLLTIFLIVV
>MGYP003308729374 FL=0
MIAKIEKCTLSGTAYAPTSKSIAHRLLICAALSEGVSIIKKVTFSEDIYATLECLKTLGANYTVDGDTVIINGIENIQQSEEKIFNCRESGSTLRFIIPLLLLSDVKQILTGKGRLIERPQDVYEDICNEQNLLFEKNDKITVRGRITAGNYYVKGNISSQFITGLLFALST
>MGYP000219845609 FL=0
TTTTTANITEPTAVVISGAPVTDANCTGANNGSITINANGGTGTLQYSIDNGITYQIGNTFSSLSPGSYIIVVQDANGCTATTTAIALPAGQLILSGFGSGSLKSKIIKAKSIFRANECDEHSGEQLYILYTSAMMEKILGDTTLTSADFMAGKMIQEGGVGGKWMGFNWIPYEKLSQGAAVGELRTVAYCGSAIHFGEADITGFDITTRSDK
>MGYP000496951928 FL=0
MSIEAMKQALETFKMLNLTQVIEVQWTINALRQAIEEAEKQFNPDWDQQAVLVKRIRELEAQQALDKKADNARELGLDYEPTHTDHPMRHWDRTCPACVEQAEKQEPSRAQTKQIVEGLKHCHHPDSQHEFLRVWIKDWTAHKSAQPRKEWQAVNGKLEVEPIKGTLLPQAQGQEPVANEKEGSPCPEFWDWLPKAYNFAGNGVFTKYNMEVAFLAGKQFSSTAPSRTSIEHAVIAGVLFDFMGWLTS
>MGYP001105606284 FL=0
YGMIPCYKWPRNSSRLESFLQKQGTLHPKGYTYSEVKKMTKSFAHKLGQGGYGAVYRGNMPDGREIAVKMLKGIEGDGEEFMNEVASISRTSHVNIVTLVGYCLQGSKRALLYEYMANGSLERYTFGNNSTQGEDTLSWDKLFNIVIGIARGLEYLHTGCNTPIVHFDIKPQNILLDQDFCPKISDFGLA
>MGYP001562148884 FL=1
MILIGLVTGLGAMIALSYWLTGSVGSNPAAADVCAEVATPVLDGPVADVTLGTVCGDIDLRLDEPISGTDGFEGDFRYSGPPSDPDRPRPGYLVWESDGCSAPVLGRGPFDFTLACNRHDFGWRNLKHIDGDDVPTWQVENKDRVDAGFLHDMRKRCAAVPAIVRIGCDTTARVYYTAVRLNPSGVKGIPGSG
>MGYP000254919864 FL=0
RYHKIIIMTDADVDGSHIRTLLLTFFFRQMPELVERGHIYIAQPPLYKLKKGKQEQYIKDNDALETYLISNAIDELELHVSADAPAIRGEALAKVIADYQTSQKSLSRLTLRYPASLLDGLLELDAFKIDQAVSSYQTAKVKPKVIGSP
>MGYP003314355870 FL=0
KESSAASDVYKRQVQESVLRKEETPLVSHVRTIVGHIILMENYWQQRA
>MGYP003594184147 FL=0
NDKFRGQSMMSIDQMELFFQLLISQNSDRKVVEVFPSYYNKETTFGQCEILKETYGVNSKHDYAETISLSSERLIVRFRNIFVVGILFKRDFITWKEGKPIENEFVPFYKHLLNFVSFEDKV
>MGYP000202344024 FL=1
METATKASDQQATNAALAALAATGNSYALGQLWELNKGLLRSMFWKWYPAHKAQADAHGLTADDFEQEGIFCCPARRPDLRPGTGSLYHLADCRHAAPDPAHPYQRPRPQRDRR
>MGYP000205932652 FL=0
HQARMAPLRHQVDAGRVVQIDLHIPETSHMQHAPFLDEQPPLALRPVRPHAADGHAQPDHPGDGERRAKQHAQPVEREIGQSDDPQRRDRRGQRHRRLEPPFQQGRRLGADHRETLA
>MGYP000157303393 FL=0
MKAKLLSTLKYLFFLGIGIAILIVVFKDKDLDKMVEDLRNAEYKWLIFSMIFGYAAYLFRGLRWLLLLETMNYKSSANHATQAI
>MGYP001265825478 FL=0
MLRFILLTLLALIVWVVAFVGGTIAGLWREPIAPRGDTAAFVKAATARIDREHKGNVAFTLVEHGRKVA
>MGYP000910426799 FL=0
MNMNAVTRAERGCVEAPTVSFTLNGRQISALASETLIEIATRESIDIPQLCYRPGLEAVGNCRACMVEVKGERVLATSCCRFPLPGMDVTTDSERARKAQQMVLELLQSDLPKTALTRNNEVDEWAARLEVCSPRFAPRPAVAADLSHPAIAVNMDACIQCTRCL
>MGYP001021135751 FL=0
FKARFFALWAQNDKKHTQNDKKHTQNDKIFSEWQYILRMTKHT
>MGYP001288254412 FL=0
MAGHNASKRLPLATQGRDRGVPHEKPRELLPNQRAARTLRKVPAHDQAQASPAAAQVPRLWKRDRVEHYRSQRGEAVRTWDIQQGDCLDLLRALPDNCIDAIVTDPPYGLSPDGRCRTWDDIESGRKGGGFMGKQWDAAVPGVTWARECLRVCKPGAHIVAFGGQRTIHRLICGLEDAGWEIRDLGAWQQWQGFPKSLAVGKAIDAHHGAEREVVGHADRKTGPGRHLAALAGNPGESATPSITAPATEDARRWEGYGTALKPCLEPWTLARKPLDGTVAANVLRWGTGAINVDGCRYGYGDPAWPGPQGDPGGRHNSADRSGSPTVHLPPVSLDSHDLGRWPANVYACPKASRAEREAGCGHLKGRAGFEAVERTEGSAGLDNPRAGAGRTAGEVRNHHPTVKPTALMAWLCRLVGGQPGSLILDPFCGSGTTGIAALREGFRFLGFELDPEYIQIAEARIAGDAPLLNRRESVLG
>MGYP001416122492 FL=0
SEKEHHPDYERNTNHIKWRFVMDNANFCSDHKQVEFCAHELDFTCDYDAAITKKTGKHHKHTKNKTKRQYSGRDSEDNGSDMDLFEYTLNSDSESDTSQRGSGRKTSKKPKKRSNTGDGVKDSFLRDSMQFHPYNKSEHDTLNSTEMRWSGRKSYRDNRRNIGLNNNKSRARVVTVVS
>MGYP000266266674 FL=0
MGMEDFWEQLPTGKEDKPLLFEMGPLEYDFHDIDGLYFMLDRRLSGCLLMMLSLIHISEPTRRV
>MGYP001810632152 FL=0
ALENMPLEELQGQVQARQQDLEGLFRFVNSQEEELTLQRQDIEELQVKLSRSSEGERPGLEAELADQQEQYNMLNETLVGQRRNLREREEILSKHQEVLWRRLGNPPGLGRSKRLDVGSALQKAEAWRQNFGAAVQNLTGSVESLQQSLGELRETVTQKAAAMEGKQQELKEKESALATRQQEVLELAGRVSLYQEMLQPERDRLHSLHEKLEELGAAIAHLDETKDYQQQAITQIRDALMPIISPSA
>MGYP000787850220 FL=1
MCKAKAWVLALTAGLLLLLIPAQARADVTRLLILNDEQTSETSAAATDVLRRFALYSSWTCTFVSSEDVPDTCLLYTSPSPRD
>MGYP003299208211 FL=0
ENRCQNGPVQGQFSGRNRDVADEGAEGTKYEHGCHKHPGGASGVLHGNHFLSKMVLIVPEDGAVCKMYLIRQEPKNFFKMRIIPIDK
>MGYP003980343243 FL=0
MMKSKIDPTVLYPSRRSMYKQDALAIERNEELPLFDATLLDTDVIIVVGKRQKVKDVAAYPFYLVKENNTVNSLVTTVEIQLGIYEVSVNKEEEYLDDTGTIDISLIGKPLLHTFVTKTLLESILSPTPTVNNHNNNNHNNNNHNNNNYNNGFNANNENPEENNNNNNNNTLQPSETERKRKSNSKTALEAEAENYIDIMTPTKT
>MGYP001799802231 FL=0
YVIYINTFSKVLVPGLRIGYLVVSGPVRQLLLQQKLNHDRTTSDLMQRALEAYMTVGKYQVHVRRVCRAYRQRQVAMHQALKRHMPQGVTWQRPNGGLFFWVKLPDGVTAVSLFQQALRQGVVVSPGTSYTTPIDNESPYLRLNFTVHDTAVLEEGIARLGQIVRERLD
>MGYP003466254295 FL=1
MSLSKIIGYASAALAVYFYKQSSDLENEIKSEKKAHEAYVRELLAANSALENKIDPNLGSYQSPIIFSATMRSGGQMLEQNEITLNCTNPTDSIIEISDFQARIWVAGYMADLCVPANILSIKIPAKKTVSFRLYARYGKMFRNYVEVKRALNLLYDGKNTSTMRAGTFIPLDKEPVLMNMQYLWVGKGFEDKCYVYDVPGSFRWKYAGWTVGAYVGYNAGNENQQKANPSYWTDTQEIDSIDE
>MGYP001158205152 FL=0
MHANQYNFISSVSSNIIQVNIDITPKYNDYEMAQIIQNHAINQNGYIKNHGLMIYQKKDVYLVYAMDYVGFEFAWKYMIDAHSGKIVDQIPLIYDSGPTIGSGINLLNESITDLKVYEGSSFETMGGDLITPNLICEQFCWDYGDCDGQNYSDCIVVAEQYNCDDGYIVDCDGICFNEWYMQFPGVGNGFCNDPWIEYEEANI
>MGYP003680783999 FL=0
QATIFGILAGALVIIFSKNLQAIFHTQSHWMFVLFGIGIPLYFFMSVNRGTFQGHQDFKNLSITYQTEMWSRLFLIPWEPSFLVALGIGLSFLFGLIPSNLKDISFKSKAKLLPENSKRVTQFMLLTACYEFTQIIINNSDILLVKHYFNALDAGLYASLALIGRVVYFVAWMFVMLLLPTVVQKQKD
>MGYP001343183673 FL=1
MSNTYERLQKVIAQSGVTSRRKAEKLIEEGKVKVNNKVVTELGTKVSPDDKIEVNGIQLEKEVPVHYLFYKPRGVISSVKDEKGRKVVTDFFPEIEERIYPVGRLDYDTSGILLLTNDGEFANLVMHPKHGVEKVYVAKIKGIPSKLELGRLRKGVKDNGELLKAIKYRVISSDKKKNTMILELTLQEGKNRHVRRMMEQLGYPVIKLKRERYGMLTLDGMRVGEYRKLTPKEVKQMINLATQIVED
>MGYP001231558494 FL=0
KNSDLILINGDKDIDFEKKLFSYNAKVKIYYSVYKPINADKFKNKKILALAGIGNPENFFNLLKNSNLSVSEKNFFPDHYEFSKSELSKIILKAKRNNFCIVTTEKDYFRVKDYNLAEIEYLKTELVIENKKQFLKDIMKIYD
>MGYP000160763201 FL=0
MINKSIKYIGVILLAYTLNACNEQRMSSSSETTTPVWLAEVGKRDVLELTTTTGTAKAAKTVEVKSETNGKYELMINPKTKRPYKLGDIVEEGAVIIKLNNKEHENTVSLPTKKMQVDIAKKEWDGQKAVFEKGGATEKDVLNAESSYIQAQTALETAYTELAKLTIKAPFKGAIVSLPYFTPNVEIASGETMVGLMDYSHMRSEERRVGKECRSRWS
>MGYP003702127599 FL=1
MSAMKRASSVVKMKPLSSRSKPLPVNDVIAATDLPTPSPASPRGGRASGSAMIRCEFFARDVCENFFLAIFPFMHKFQDDPMITNLKVSEVKNLRKFSSNIWTAIKYMGRNLYSHL
>MGYP001407002453 FL=0
GFAVLGGLKPALNLLGNVPLSVLTDYNLAVIPMFILMGAFASHSGMSRELFGAGRAWLGHRRGGLAYASIAACAGFAAINGSSVATAATMTQVALPEMRKSGYDAGFSAGLIAAGGTLGIMIPPSVIFVLYGIMTETDISKLFAAGVMPGLLAVLLYFAVVQFLGWRYPASMPLGEPHSWPERWTSLRALWAVLLLFLFVLGGIYGGWFTVQEAAGIGAAGTLGIGMMRGRLRWQQIRAALIDALRVSSAIMLIVVGAYLFGYFLTITQFTQKAVAFLTTLPIGAYGVLALVMLGYLILGAVMDELAMILLTVPIVFPAMMQLGFDPVWFGVIIVMAVTFGMICPPVGMNVFVINSIARDITLARIYRGTLPFATELWDPVLR
>MGYP000300748531 FL=0
MTVEFTFQAIFGFLSNFVEYLCTIQKRIYGIKRLHHSDRCLLLDDIGPPIETLRSIPLLVSRYELLAHCLYAVTSYQFSFNLVCLDKVTIHITISTIHKMQNILVSKNNKITSTS
>MGYP003495590882 FL=0
MPTGHWPAEAAHTDEYLQVAPGICYMNIPARDKYVPGGEMWVTESGDAGGGGDTWASTYLDVLRTLNELGSFCTLTNGVIFHNTLASSDYGFLQHGSFDPRPNYFAALLWNRLMGSECYKVEDAPQTEGAHVYCHSSKDGRGNYCYLIINNSLAEETLVSVPKHSY
>MGYP001249907410 FL=1
MWARIEQTMAKQIRHVRPIARDHADPTTQRIAAQIERDFGAFVPPFALHAPAPAVLAACWMMLRESLVPAHVDRRTKEAVASAVSRLNACTYCVDAHTAALHALGETATAAAIADAAPALDASGALGPFIAWAAATRSPDNRLLRQPPLSAAQGPEVIGIALCFHYINRLVSIFLAPSPLPFKSARLKAIARRLLSPILTGLLQRPLEPGESLAWLPEAPSPPDFAWAAGNPTIAAAFARAAASFESAGAAVLPATVRALVRDRLHAWHGEEMGLGRRWLEDAVDLVDAELRPAARLTLLTAFAPFQVDDVLLREVRRTLPDDAALIAATAWASFAATRRIGTWLTVDQFTSGSRK
>MGYP003567298226 FL=1
MFSAEVFRLSGFRHDIQAGDPPLPLWWKIEQNKNMNLSRKPRPQLSLGPAAPDLALGRMHEATGPSAVIFAALAAGRLTGPILWARPAWEGGVLNPEGLAPLFDPTRLVVASCPRPLDILWTAEEALRSGAVQMVVAETAEPPALTPLRRLQLAAEAGGANTKRPPLGLILPPRAGTAGAVESRWRCRPSPAWASGQPARWRFERSYGKSGPPLVWETGVSDTIQRRAA
>MGYP003550943715 FL=0
MLLCPPRLIAERQAAQYEIIFSHGDSLARSIMIRGVVDAVLTLPLVLPPTVTRYFLLRLLGSRRVIGAWLMTY
>MGYP003599591953 FL=1
MKLIEDWKQAWKLKSVQVGAMSAFFYALILFSEQFVNIWNVIPQDLKNYIPAQWQEYMGMFVGVAIVLARLKKQPELHAPELSGINSLLSMPTQTNDLAWMIEAKKHIGLKEVSGKAHNPTILNWLKSLGAWWSEDETAWCGTFIAHCLKVAGAKYPKHWYRALDYVNYGSKLTKPAYGCVAIKTRQGGGHVCFVFGRDEKTRKLVCIGGNQSNMVCYALYAESEFQEFRWYGMTDRPADKRYNLPIMTGVTATKVSEA
>MGYP001120090256 FL=0
VRLLLRLLLLLLLRRTRFDLDSRSSLLLPPLLLALLLSS
>MGYP000141974819 FL=0
MSVIERVLKTGDTMQVSDYELTPLTEVVKIQLPGKHAGLIWNHPKAVIVRTTDGRESHLPVRDVTRIVMWATLAGGLLGAIMVARIYRKN
>MGYP002637710184 FL=0
TQRKKEDGTLDPIKDLFRSPDIKTIGIHLDVPKGLVLKKSDGAVAEVGIQSGDEVTAINGIPVFTFGDLQYYYDQVGRKSTSITL
>MGYP001617737781 FL=1
MGEILLIWMVGGWKMYKKRSYDGKNTPRLIHVLMAIIPILVLGGLLVYFAYIKVPEYQQSDTTYSSRQPAYDEYSQQWQSVQSREKQQRENVTAAYKQMSQYTQDQLQQLRTERELQKTQQKVIYPFK
>MGYP000263732607 FL=1
MPLFIFIRLFHHRKMSAAELDAKLVELKKNLFMLRMQHATNQLDNPLQIAVVKKDIARIKTIIRENETK
>MGYP001213662979 FL=1
MAFNNFLEGVATQLINTGLRKVAGNLPGLNISVNSSNSSPVADVTRNSRSTKFFRFPLDVEADPGIGNQGHYMMFEINEQDHARLKFGGKGSPMRRVKAVSPVLSNLDQPPPARLDPIQQMNRYGSIQNYEKAVSDYKTKSVGTKRASTTEISAHIAMYMPESVTTGYSAQYTDTEIGYITSAAIDAYEKFAQGNMRGGLEEIGRRDKDLAAALNAMMLNTAGALPGLSGLKAAAEMRSGVVLSDRMELAFKGIDKRTFQYEFKMVPKSEDEAKEIKEIVNMFKLNMLPEFAGNDVHGRSLIVPNTFNIRYMYAGAENEFLHKISECVLESMNVTYGGERYKTHSATDGGAPPIQTTMSLTFKELDLITREQVMMGM
>MGYP003703380869 FL=0
MVPLLNSPGASWKVLAPYILSTANSPGANWRVMVPLILSACTLP
>MGYP000959007105 FL=0
MSGTQTETVACDVLCIGGGGAAVMAAISAKKAGADVVIASKGKIGNSGDTIMIGGSYSMDGESAKKKYGFKKANASVTKDVLFEQIVKQGFLPFRTEPCGAVRGGRPGGGLSVLAVGGARK
>MGYP003576775111 FL=0
MASAPSISDAFRTTLDLFQTGCDLMRQNLRRRYPDAHEHEIDRLLQTWLLERPGAERATAPAGRSTSSPDLRDGTRSGAQNDCGTRISPRTRARDRVRRTVAPAASLX
>MGYP003283773441 FL=1
MEQGGTLAARQRTRQVDVGGVTLGGGAPVRVQSMLTAPTADAGGALAQTRALAQAGCEIVRAAIPNEAALAGFEALCAASPIPVVADVHFDHRLAVEAARRGAAGLRINPGNIGSWEKVDLVIDAAARAGIPIRIGVNAGSIGRDLAERDDLSVADKMVRSAVSFVEHFEGRGFTDVVLSAKAHDVPTTVETYRRLSRDLPLVPLHLGVTEAGTALQGTVKSAVGLGILLEEGIGDTLRVSLTADPVDELPVAWGILGALGLRRRGAELVSCPTCARCQVDLIPIAREVECRLAALELPITVAVMGCEVNGPGEARGADIGVACGRGSGAVFYGGKIVARAPEDRIVDVLFGEIASRFGC
>MGYP000469828058 FL=0
SYRRDLVKLQSGRLVCGYIYASAGEGESSTDLVFAAHNLIAENGTILAQSKRFENEIVTADLDIHRIRAERRRMTTYPTTQEEYEWTEFELKTEETKLERTFARTPFVPQNKNDRERRCEEILSIQALGLKKRLVHTNCKSLVVGISGGLDSTLALLVAARACDMAGIGRDHILSVTMPCFGTTDRTYQNACELTRRLGATLKEVDIRKSVTCHFEDIGQDINCHDVTYENGQARERTQVLMDLANKSGGMVIGTGDMSELALGWATYNGDHMSMYGVNVGVPKTLVRHLVAYCANTCSESEKVLQEVLLDVLDTPVSPELLPPEDGKISQKTEDLVGPYELHDFFLYQLLRCGFGPAKIYRLACRAFEGIYSKETIGKWLKTFCRRFFAQQFKRSCLPDGPKVGSVAVSPRGDLRMPSDASSA
>MGYP001221173772 FL=0
MTIPSALASLLLSQAAAEQQTLIMESLDLISQNSSEDLIASSGSSTQSSSLPSSFGEI
>MGYP001563734490 FL=0
MSGRAMGWVTVALLFAGCAGVNYRDKYERYLEEGHKLPPSTAEEVKLQRQAYVDAVGRDSPFKEVLWDVAINGHRIARVTLRGDHVYVETRDYWLYAIEAKTGITKWALDVTRPIQYPPTVVHGLDDAMAAQRALLANIQE
>MGYP000046061924 FL=0
KLDAFFNDNVNYIKRFTNPEHLGIAADVEVPDLVMSSIITGAEIYLPLADLLNVEEELARLEKELAKWQKELDMSVRSSLTNAS
>MGYP003435272778 FL=0
FIFCLVAFNYTMRELKRGRILNKVTFLEKVIKQIKL
>MGYP000462850367 FL=0
YIYKRYGTSWRIDKKVVANDPAEDDQYGISVAIDGDYVAVGAPYKNANAADQGTIYVIEHNASANAGSAQVYNYDGTSWIQIGQTLYGKTELSHFGVSVSLDYDGDIVAIGAPDVNNGVVGVYKFGTDGSWAQLGSDIVGEADGDYFGISVSIDSDGSHVAIGGAGNNAAGDDAGHARVYEYNGTRWREVGYDIDGDGDGDYFGNAVSIDS
>MGYP000891392761 FL=0
YNFFPFCYISRFFVQFICQIPFFFVFMRPSVFLREKRWDASTRKFWIYFNNVELPYLNNLNFS
>MGYP000314751283 FL=0
YQEAVKWYRLAAEQGIAKAQYNLGVMYRDGKGVLQDYQEAVRLFRLSAEQGHAKAQYNLGVMYANGQGVPQDYKEAAKWYRLAAEQGVAEAQSNLGVMYEKGHGVPQDYKEAVKWYRFAAEQGTAEAQYNLGGKYYFGKGIPQDYQEAFKWYRLAAEQGIAEAQYNLGTMYN
>MGYP001575587140 FL=0
FLEHMCFKGTFKRPRAIDITSELDSLGAQYNAFTGHEYTGYYAKVEARHLDKALDVVADLYQNPIFNEREIEKEKGVVIEEINMYEDLPQKKVQDLITKLLYGDQPAGWSIAGNKETIKILTKADFLKDRNQHHVASATTVVVAGKFDDKNIFKKIETKFAVFSDLRKKGYIVKTALKFGAEFRVYEKGVKPGEDHAKWILYTV
>MGYP000040707706 FL=1
MGMLNTSCFYSFGKEMFRKIFYKSCKRHSFCINDTKGLACGSFISLIEYEIASRKTRLPTLPFLSILFMSLFR
>MGYP001557050405 FL=1
MLEQYKKTAFHESGHIAMTYFAEYACQEVEVLISGDGKTTMEYGNDLLLISAITNCKEYPEMFNDLPHATKLNSPGVAFKASLILLAGSIEESIYMNNGIVDGDMEVELSGPDLLRVQNIDYLLSSIAKNHPSNFIQSNIENIMMTFSIPEIWTSITALAESIYSKDGMKLTKDEIEQNLTSTGYFDHIKKYL
>MGYP002626139264 FL=0
NNDTAALLAPIAISVAASMGVAARPLVMTVAVAASASFLTPVGYQTNTMIYGAGHYRFGDFVRLGGPLSLLTGIVATLLIPWLWPL
>MGYP001591609445 FL=0
LTESGSCPTFPIFYGTYSGVAKEFKADITEEYSLMKNQDWFDFFNNKLFTIEKNKLDSINKSKNSFELNLEFDNNLGEDINLETHDLEENNEDITKEENSEDIKLETHDLEENSDSDGKWSDITSEEEYKDVIRVAEKIDIPYFSVNFVEEYRENVFKNFVQEYRDGFTPNPDILCNREIKFKVFFQKAMELGADYFATGHYCQHEYIDGKSILTKGIDAGKDQTYFLYTMQEEILNKVLFPIGHLEKKIVRKVALDFELATATKKDSTGICFIGERNFKNFLSQYIKEQKGEFVRLDDGKTVGPHDGYCYYTIGQRKGLGLGGPGGPWFVAGKEVDTNIVYVVEGEN
>MGYP000075518654 FL=0
AQIGKGVHLSAGVQIGGVLEPLQASPVIVEDHAFIGAGSIVVEGVLVRRSAVLAPGVVLSGSTPIVELNEKHEKVAEYKGEVPENAIVIPGIRMKGNSGYGYQTPLIIGYKSEGTSAKVALNTLLRDF
>MGYP001377906329 FL=1
METDQIMSAIFLIAVLALILPGFLSTNNRAKQFMKNLSIWTIIVLIIIVIIYLIKQ
>MGYP003341019630 FL=0
MLFRSIGAFWALTLAAKPADRTHHYGHFKAEYFSSGLESVLIVVAALAIIHTAIARLQQPQPLEQLGLGLAISLVATALNGLVAWALLRAARRFDSITLRADAQHLLSDVWTSCGVVLGIGLVKLTGLTILDPLIAIAVALNIVVTGWMLLRETASGLLDRSLPDHEQQLVERSEEHTSELQSHSDLVCRL
>MGYP001601917572 FL=0
LKALATSRAINLIEVEENKLKLRQKNNYLQVGGRFPRLGGRQAGDRFDEIREWIAKLAVARAAE
>MGYP000576050399 FL=0
MADSKKNDKTEAPKNNIEDSKEQIKEKFRNKDNMVDLDSDPTKLIEIVEI
>MGYP000088332676 FL=0
MSSWGRPERVVVLLVGEGAVGDTSAVRERIVHQQSTYAWEFVLVDVKRGRRRAAFNHGKLARALQQATGKEFDDDRLPLEQLRFSPDRTACWFRVAGKGWTCVLKTCVLE
>MGYP000901407724 FL=0
MDSAGERFEAIRAALADRNNILTVKDLCELAGVSRSGYYNWVRSEKNRELREAKDRAAFEQILEAYRFRGYAKGVRGIHMRLLHMGIRMNVKKIRRLMRKYKLTCPIRKPNPYRRLQRSIRMGSAAENLVNREFESHGPRAILLTDITYIPLCGRFCYLSTILDACTKQVLAYAMSESLEVDFVLETVQLLVKHHGISLSKETVIHSDQGTHYTSLKFIQLVENSALRRSMSRRGNCWDNAPQESFFGHMKDELASEIPGWTSFEAAKASIDRWMDYYNNDRCQWDLAKLSPNEYYHYITTGEYPAGTMRRCREELSKLFKRLYEDNVLGRVTDEQYRMLAGDYTGEQKALEEQIPEKEARLEKLKAASANVNTFVEKAKQYTAIDELTPELLRLFIQRIEVGERTEKYSRSSHQSIRIVYRDIGTVDSAMEQGEAQPHIAPPLSEVFELPA
>MGYP001844006787 FL=0
FGNFVKITXPNLAKRHIYRPRAFIXSQHEISRPLRSRDIARTNKKSIFVGFFLAILSRSRDQIGQNGQKAHLQAESFHLSPTXNLXASPFSRXWPHKQKSIFGVFCQFRQDHVIKFGQNGQKAHLQAENFYLRPTSNL
>MGYP000461460321 FL=0
MERKSFASLDCSIAQCLEVVGEWWSLLIVRDAFLGVHRFDDYQRRLGISRNVLRQRLTHLVEAGILEKVPYSTRPPRSEYHLTDKGTDLWPVLTAMRQWGDRHAAPNGPPALFVHRSCGATTDTLLVCESCREPVRAGDMKLVPGPGRTLASLVSTSRTDK
>MGYP001244209094 FL=0
MARNWCSAHAPVGNSESPAHSLESPRLHSSAKRRGDRFTGQIVVGRVGLEPTTTRESVRTSTCQRAIDPLKVTRKKYRLREDGHDPSSSYSASATSGLMPSDGCSARLVTGRDGFLWFPLLFLFVFLFVCLALWVFLKCSGICLVCHSGEEQPMCCVVVDHRVQALLVSELVPS
>MGYP002522304077 FL=1
MLNNTSTDMDTHPPTQAGIGIATPVCYSEIGAKANQEDALFPLAGEATARQRVFLVCDGMGGHEHGEVASQCVAHTVGTLTAAQPPCDTATMRTTFEQALATAYDRLDEIDTPPSEGRTMGTTLTFLALCTDGILIAHIGDSRVYQLRPGEDVVMRTRDHSLVSDLIAAGELTEDEARTFPQRNVITRAIQPHQERRDRATYNVVRDVREGDVFLLCCDGVVEQLDDASLCALLLAPGSLTDRLAALRDECLRRHTRDNNSAYLIGITAVDSPARPQAAMPTSPVTQPRGRHNWVYVAIALLIALACFLLAQVFMGSKDGARAGKTDPPATETTADSAPLRTIQHR
>MGYP002571109560 FL=1
MKNILFVIGSGIYPHVVGGMEIFNYYLIKKLSSFFKIHYLSYKRYDYDEGKQLKCFKIKPTKFFAPLQLAYYLLIKPQIQTVVFSYSAAHWILWHLYQKVTRLFNRNYIVVIHYGHTPPVEKKQAYQKFFQQAKAVIAVSNDIKKNYDAYFNINCEVIYPLVPFEHSNLNKKELRENYNLPIKSNIISMIGSLKPMKNPETIIHALCLFTQEEIAKYNPHIVYAGKGESMVKLQELAKQYNLTERISFLGFIPKEKVNDIMKLSNIYLIASDFEGTSVSLLEAMYNELPILASRAPGITNTLNENKDCLMFETKNAQQLKMQLLRLLSNESLSKQLAINAYRNYCNKFSYESIVNSYQKIL
>MGYP000323132695 FL=0
MIERLLRIDNPPAHRRRAGAVLFDKPRGKTVGVVVQHVCDIALLPKLDLLGLVPCDFFVTHARKKIAQFLRVGRRKFNKFKAVGASGVLWRDLRFRRAVGERTHGNASLVVRG
>MGYP001035366785 FL=1
MSPRRSFHTISCPLQKAAGLQDDDRPAFIAKPCAQYYKLRAPSSVLGPSRGQQVPEPELVRQDLDAAGLGARAPAAALHGPHRLLAQPRRQLQAHPIHERVHVLGEVQQVPVQELGHRQPPRRRHAHGRLQVLPLRRLQLLLHARRRVHPHLKSEETTASPPGQAHIVTRTIASADCCYCRRPAAAGRNLINYRGGGPAPAGEREGDEGLRPLQPERAALRRHVVAGAGAALAPFRIHLPGHESSIRSAHSATATRGVAPLYRARR
>MGYP000942704436 FL=0
MAAISKGTVAFSFGVDETYTGGTVTSLSVNESWGNIGEVRNETGTMISKRYDDIRKEGTITVLLEDATVPSSALGSTFTYDAVVYYIDGISEARSNEGYAEYTFNIKEYENMSSVTIV
>MGYP000205166280 FL=0
EINIERAFPDADHVVLEKAGTAMARILEAINTI
>MGYP003568659006 FL=0
FYAAYTRSPYFLLQNYRNENDVDRVTGNFTITYKPMEWLDIVERVGADVYADRRRLKYPKFTYYPVDETTGNYTRANVQSATGEYRETQFNVSEIVHDLMITARKKMGSITGSLMLGHNVRQRTSTILEASTNESAGLIVPGWYNLDNSNGPVSNYNNFSRRRLTGLYAQLTLGFNEMLFLDLTARNDWSSTLPKSNNSFFYPSASASFAFSELMKNGNLSDVLS
>MGYP000466899968 FL=0
ARYGTRKLKKGYRSHKLKPYREVAKAEKAAFKANVNFQYHKALQENPQLTSNPFSRFMQKQKIKRQYAKTVKKGGAATAKAAAGASQTAAKEAAAFAGRHPAGVIIAIAALLLFIMVSVGLSSCGAMFSGTLNGVLGTSYTSEDSDLVEVENSYAGLENELQSRIDNIERDNPGYDEYRYDLANIGHNPHELASYLTAKYQSYTCAEVQSELQRIFNQQYKLTLTEEVEIRYREEERTDTWTDEDGNEHTDTYTVQVPYEYYILNVKLTNKPISELAEKLLTPEQLEMYRVYLETSGNKPLIFGGGSPDGSPSEDLSGVEFVNGTRPGNQ
>MGYP003111832576 FL=1
MSIATSLGKRLRDWQLVYVADNAFFPYGDQAESLVIDRCATLISSVMAETPIDMVVVGCNTASTVVLPALRAILSCPVVGVVPAIKPAAALSRNRRIGLLATPATIQRPYLDQLIAEFASDCTVTRIGSSELVRLAERWMGTGEIALGDCQRILRPFAEAEVDTVVLGCTHFPLIRYLLEPVLGPGVGWVDSGEAIARRLEALWQQSAAGGLGRAEQEDPVEFSFYFTGLEPPRIRSYLAATGWPTARIHPEYVPSAPGSAPGLARGVKGAG
>MGYP004300484681 FL=0
PPPHSTQAARWPDARTSSSGSWHACKYAADTVRRLLRTELADALQHGAEAPAEGAPELTRLGEAIVALLLQKEGAIDVRDLFNAAFAAHWHGIDHLAAHFRVGAHHRRPHRRHEAGVDRVDPDIVTCELHGSGFCRKAPLAALAPRAVPLHSLPGAGVPYSQSARSMIMPRSTSGPGSVPNSCVTWSARSHAP
>MGYP001071452416 FL=0
PFIKSLKLWVNAVSKSPALKPLVQPLVIVLLSAIRAKESHLIFLPYVSIILGMVNDLSLSCETFVPIISSCLSALNMCSNKLASKSLTAEGREPNISDVVRVSDRQLKDKRVVRTLTLMILKELTRHLCFLARTGAFPEVAWPVAQTLRKLAKSNSTLKPEVASLIDSIDKTIVDIKEKRAAEIGTSLFQFSFEETPMGKEYEKVLTKMEKSWEYKDEEGDEEEEDDEDDDEEDEENTKKSMSKEERSKRSIKRQRQNEKKRALKQTVPEDALVA
>MGYP003153901614 FL=0
DTARAVVDGLAAKGIACPAVTGAGTGTFELEAASGVFTELQAGSYAFMDADYGRILDADGNRIDAGEWENAFFILTSVMSHAKADKAIVDAGLKAQSVDSGLPVIYGRDDVEYVKCSDEHGVVADPKGVLKVNDKLKLIPGHCDPTANVHDWYVGVRNGKVETLWPVSARGKAY
>MGYP003386720413 FL=0
MGQKVNPVGIRLGITRDWTSKWFASTKNFPSYVHSDWLVRDYLKRRLAEASVSRIQIERAAKKANIMIHTARPGVVIGKKGEDIEKLRVDVARLMKMAVSDVRVNIAEIRKPELDAQLVAEGVAQ
>MGYP001336422905 FL=1
MKILKKSQERTEEDRRELSRLVQDIIDNVRANKDEALKEYGRKFDACEREQIRVSKDEIEEAYAQLSEEEKELAEQYADLE
>MGYP000344590912 FL=0
KGDVDFAQKLARLGNVWVNDAFGTAHRAHASTAVIGQFFTDKVSGYVMQAELDNAQKILEYSERPFTAIMGGSKISDKILIIERLLDKVDNLIIGGGMTYTFSLAEGGKIGKSICEPDKVELAKQLIEKAKAKGVNLIMPLDNVCADDFNNNANRQIVERGCIPDGWEGMDAGPKSLELFDAVVNQCKTILWNGPMGVFEKEKFSLGTEAICKSLREAKSNGVNVIVGGGDSIAALKKLGNKDWVTYISTGGGALLESLEGKALPGVKALSNDY
>MGYP001550816469 FL=0
MVLNYTRFFGVFTGAIERVAVTGREGNIGPSPTDSNLMPTPLVFAHNAQDDIALLPAMSNRHGLITGATGTGKTVSLQVMAERFSSIGVPVFMADVKGDLAGMSQPGAGSPKLTER
>MGYP003138151264 FL=1
MAKAAATARPRRRERKNIAAGIAHVNSTFNNTIITITDAQGNSIAWSSAGAQGFKGSRKSTPYAAQVAGEVVGRAAMEHGMKTLEVEVKGPGSGRESALRALQSVGFTITAIRDVTPIPHNGCRPRKRRRV
>MGYP003443083341 FL=0
MGDTLLVRIDPRLIDPLMEQAEACGAAFADELCLVLLGLSTGARDSALERILGRLAHNMTLTLHGPAEFI
>MGYP001435087364 FL=0
IIESDIVKTFNGDMQASEPKYFDIEEILMKTYLPVWA
>MGYP001431098935 FL=0
MSHYNLILKNYKIDKTQNNNIKYSFNNIDQDSNSVSETFILSEGSNFLKNEIKGYKGSVEKINSQGDPVKKHAR
>MGYP003304349197 FL=0
GIRDPLWSRGLGDVYKRQVKYKAPNSWKWVKLN
>MGYP001141817981 FL=1
ITTIHGFAQRCLRRPALEAGMAPDLSLDTDPATLIAQVVHDYWQQQVLALPPDWLAALQRAALNPALLETLLGTLDGDPALALDPPPPELPPELPLPVGLPVLWQRLWDSFADAWRRDGRALQDELCEQAAEWRGLGVEDTGEYRPTFRKTNDRAAAIDGFVAAAGEQPPGYEAVLAIKPLTTYFHPGPFTKEARKAEGEDRPIRLPRPDLMEAVAALVDGPLEAVLAHACSWGRAELRRRRQRAGTLSYADLLAGLDPGAAATGPTPLLQAVGERYRVALIDEFQDTDPVQWRVLRLAFGGPDHLLVMVGDPKQAIYRFRGGD
>MGYP000931218709 FL=0
MRTVLAVAALGVALGTVSLGLRSALDGGVLPRLLGVLEGLGGAQLLAGAPGGASVTGDLRRGGEDGRGRRCGAVRLSRRRLQGLLGGGLGLFDGALMPAGHTAHRCDGLGLRRLCGDRRR
>MGYP002812137160 FL=0
VRNLPFSAVRPFVRGLPLLRSSERFGQFGYFNVRLQSRIDGSEIKSADLKIHQCNESLFPEFALHARQNPLWGLNVTLAAN
>MGYP000364897687 FL=1
MNSPFRIFLLARAVPALVAAAVITFSANHAVIVGQIVFIAYGFVLAPLFVWAAFSNSFTTIVRRSFLAIGLTSLAAAAAAALTIGQGLIAFTLTIGIWAAISGLLELFAGWSSTNKDQTREMLLLGALTAVLGLVEAVVPLNDVYAVGLFGAYAAIVAVFSAIAGFSGSSATPAPSSSAPSPRLPSGRPT
>MGYP003364664002 FL=1
MSIFNFFKKSSKNEPTTAPTAQTCESSVEMQSVAVPKASSDEQPVQPKIDTTGAKRVHNLIIVDESGSMSSIYQPALTGLNETLQTIREAQKEHENQEHIVWLVTFDTSHFKQIYANTPAEKAEDITREQYRPCGGTPLYDAMGKSINQLRQMATADDVVLVTVITDGYENASREYNGKAIKALVEEMKGKGWVFTYIGANQDVEAVAASMSIDNHLAFEEDAEGAKEMFARECRSRKKFFGKLNDNMPMCDISKDYFEEE
>MGYP000037013818 FL=1
MAHRIDERVVLVLRRDVGEARALQEALDGGVRRADARPLLLLAQVRLARGQSRDVQGEAKKMGRP
>MGYP001133519274 FL=0
MKTRYVVQRKPLIVGLAGLTMLAALAAPNAAWSPLATAAAQDSHGSSHSSGTHGSQNKGGQGQGKGKSSSGDASGSSSHGNSGSKSVESKVLHGSGDASAAADESSDRRGPKYGGGKASTGKPTGAGTKKGDLLGDLNVILRDANGIPILDQYGHVQPLDASGNLIPLTPEGDIVAGSEDLVVPVEFSRLSVSRSPSKVTDKAYDEAIAALNAATAITTDSSGRLVTTVDGVAKTIDSPLENLALYEALMNNGYLPGFVPKDGVSLGSLSFLVDKSATNSDMLQAASFLAAASDKAGSINEDMVVYTDSILGVTGATPLVGADGKDYVDFSNVTYDRSATYTGTVTYLKSNGDGTYSTVTAPIIDAVFGGTTYTGTQLDAFTQAADDARAVIEYVHDNPLPAQ
>MGYP001272594557 FL=1
MKFGRKKDTNYFELLNSMAECTSRAAEQLDEMLHNYTDVAAKAEAVHGTEHECDNYLHRLVRELNRAFITPIDREDLLQIGSMIDTITDAIEDVANSFEMLSIRKVEKPALDMSELIKAVCTALSKAVKEFEHFRSSKKLSEYVIEVNHLEEQADVLYRSTIKALYNNTHMTVLDVIKWKEIYDYMERIFDACEDVANLLEGTAIKNR
>MGYP003517379434 FL=0
TLPLYLVRNYESGVNLSGSNATTTTTTTTTPAVCSGRCKWIWDLTNEIWELDSSNCSTATTTTTSTTTTAGSTTTTIALDCECVSGTTTTTNTSTSTTTTTTTASPCSCSYPAYCGTEDGECTYTNCVAGYVTTTLECTTTTSCDCNTTTTTPDCSSCANYICTPTGWVLVDDNCTGNCTAEEPSSDCNFGTSGSCSGLGGISVAGYGCSGECIYIYYDALDDWYFAYGNC
>MGYP003652714744 FL=1
MSVATSAGYDNLSGGKWNPSIYSQKVLKFFRRSSVAEAITNTDYSGEIENFGDTVKIIKEPTITVSSYTRGAVVNTQDLTDSEITLTVDQGNYFAFKVDDIEERQSHVNWESLSTSSGAFSLKKAFDYNVLKEINDSAVQGTAGTDTGAAGAAISCNTGNKAANVLARYSQQLDANDVPQENRWFVANSGFYELLKQADAKLMDASVTGESMSALMNGAVTSRQVHGFTLYQTNVIQTASVGSAAAFTFGPSATSGETTCLAGHISAVATASHIAKTEVIRDPDSFADIVRGLHVFGRKVLRGSGDGYKGVLQGVVDLNS
>MGYP002630153343 FL=0
HLTPVSSPLHSLPLQAWTMASLTDLLNEMLELVFLQLEDWQDLISLGSSSTALRQVFIQPRMWRELLEKTRIVQRGVGFEEVTESQVKKIMTFLKTVVGHEPLLEVLNDSICDQHQSIMWRRTIMKLGALRKMGAMRKMGAMRKLRAMRKIGATKKIGAMQWGEFGPQLWEELGQAAAR
>MGYP002515195457 FL=1
MGSLFLSVFCVFSTLHLISSWKNDRTRRAKTKPFLISSLALAYLVSAEVPSALLLAALVTSWLGDVLLIPRGNRWVILGGISFLGSHFLLMVLFLHHIHFAAIPWFRLLPVAAVYALLSVISIRSIWDNTPTLMLLSFGLYLLTNSCMNLLALMQLLTSRHPGAAVAYAGAVLFFLSDCILLLVRYHRNPDLVPKKHFPVMLCYLSGEFLITLGIFMMA
>MGYP000652960749 FL=1
MLNSFKNLSTVLKLRKQPASLKAARQFHDCGNFQMLYIASGITVTILLEHPQA
>MGYP001560261255 FL=1
MTPAPPTLLAGQGAQPGDIINAIAVQRNQLMDALAMAEANFAAFRRAHQGGGCGLDEVVPGERKVPDDAPA
>MGYP001590704470 FL=0
REAAAGFIPEGGTITLKALEVDSSLSGLRETWPASMPPVTLGLKLDDLSFRLKGFDEPFSGVGGTVSLKGDNITVENVSARYGKSVLKSADATLRGITGNTAYGISAEGTLDAGAGLSLARDITGGNTLPGQRGFPGPRPPAL
>MGYP001590172643 FL=0
AKSQREIASDSVKLNVLSCFDYSLQTEKTLLSVCDHTTTIVPITLVNSGSLSNIYDLSLKGPSWVGLDNNNILVNSGNQGKVNLIVSPDYGINGNFDLIVESKSKNGEIVKSSDIKVNVKGCNSVNVNIADDKIKMCGSLTNQYNVLVKNTGEVTNRFNLRTSGVDWVSLDKSLVELRGGEETNVILTIKPDKDVISGVYDVRIEAVNIEGNVKSDDTIKIEVVNMEKCYEPNLNISKKSVEIVIGDSVTIPILIENKGSNTADYNVGISGDAVNFVQVNPASITLEAGKSEIVYLYLAPSIQNRQGPYSLTVSVRYDSTTIIDSDTIEINVVEKQGVKITSEEKKEEKKEKGVFSLIWSYKWYILIALILLFVIVKVISTKGEEEYLDEIEELNKEKKIEKKEVKEKKLIEKPKEKKKEEKREEIIKEDVEERNYGFVKYIVGLVVLAALAYVIYRYNSYLGVYKWYILSAIALLIIVILIIRGFGGLIKFFEEDEEFEEVKEEKKIEKKEVKEKKLIEK
>MGYP003651019918 FL=0
MEFMEFYFYISDITLPQQEYLRDRIERMNVHFNEEEGYVAYGRGMMEGIDRSLSHPLTRTPLSRDTTYLPGAPALPFTVRTIFNGSYTYDPESEWARNSSTILHAFNRDRFSLSLSLSLSLSLSLSLIC
>MGYP003348846132 FL=0
ASTVTVEANATVDASATQNGNGGYISIWSAVKTAVAGILNATGGQFGGNGGVIETSSKGSLQLPNSLAVNTTAPNGKTGTWTLDPTAIIVDSADVAVVPVVCVTID
>MGYP000962646007 FL=0
GGCGGPAPGAAKDLRRVVRRDGNRRCHGGRGALEEPKGAVAIASLQEISDTSFERGLVCHRPGSGGVGGGRNQLVPQDPERAEVLDLLDGGDQVVQERRGHHGLQ
>MGYP003955760495 FL=0
MWAQERVLVTGGRGFLGRHIVDFLRQAGA
>MGYP001189459322 FL=0
MNKILLIIKREYLSRVRKKSFIIMTILGPVLMAGLILAPILLMDSSDEEKKEIWVCDENNLFEPQFEDINGTDYQFFKNDIIEVKERFNTSDGYALVHIPKFKNESIDVLESSVKVYVRKPMSFSNQNQISNNIESVIESIKLKEEGLTRDIIDRTRSNVNLNTIILGESGSEKTGSTEVSMGISMFGGFLIYIFIFLYGAMVMRGVMEEKTSRIVEIIISSV
>MGYP000827854766 FL=0
MDNNNLVNDLSGILDGLDSSQEQLEKDAFDVINSSDTSLNLVKESISSVEEILKMIDELNEVAEESATRIKELEKLSKDIEQFAGVISSISNRTNILSLNASIEAARAGEHGRGFAVVASEVRNLAAQSAKSSKEITDTITMVQQSVGKTVDSMKNIYENSNQQKEKADEIGNVLNKVVEAAYTCLLYTSDAADDMQC
>MGYP003969404433 FL=1
MPLPSKSTNMDNNNNQALRIHQSDNVYVALADLVPGKDILANGNKIHVSEPIPAKQKFSISGLKKGEVVRMYGVTVGEVIRNIPAGGLLSRSNIKHKSDGFVSTDSRYHWDEPDVSPWQGRTFKGFYRSNGSVGTANTWIFVPMVFCENKNIHVLRDSLNKSLGYEKTTIYQDYAKKLAEMVRNGASEEELADFEISKLKSSTPHVNRAFPNVDGIKFLTHNIGCGGTRQDSNSLCGLLAGYITHPNVAGATVLSLGCENAEVSILKDEVIKRDPEFDKPLLIYEQQKFGSEMDMITSAIRETIINLSVANECERKPAPLNKLLIGLECGASDGFSGISANPAIGACTDRLIALGGGAILSEFPELCGAEQSLVNRCITKEIGDRFIKLMRDYAARAEAVGSGFDMNPSPGNIRDGLITDAIKSTGAARKGGTSPIVDVLDYPEKVINTKGLNLLCTPGNDLESTTAMAGSGANLILFSTGLGTPTGNPVTPVIKVSTNDKLSNTLSEIIDFNTGSIITGNKTVDELGSELLNLCIDTASGDYITCTNKMSQDDFLPWKRGVSL
>MGYP001828137919 FL=1
MLPDKADIVVIGGGVIGASIAYHLSKQKVKVVLLEKSDPAGGSSGACGGTIFLQTKSPGIHLEMALASARRFVHLEEELGDGFEYQRNGGMIVIEHEEELQAVKRHVENQKKFGLDVSLLDRKQAREFEPSLSETILGATFSPMDAQVNPMLLTFAFIKAAKKNGAKFFSHTRVTGFRKTFNRINIVKTDQGEIETQMVVNAAGVHAAEIGALVDLEIPITPRRGQLVVTEAAESVIGRCMLSAQYIAAKFNPDQAQKSGGVSIEPTANRNFVIGSTREFVGFNKGITLEGIHHIAKHVFRIVPCLKKLQFIRVFSGLRPYTPDGLPILGKVTGLPGFIMAAGHEGDGIALAPITGRIIADLIVDNQTTFPLKEYNLERFSS
>MGYP003643276008 FL=0
RGFKKIAKSPLGKMALMYFGGNLLQGNALFGNPLSGNLTNKLGSMFTGGGGGGGGGGFKGITEGFKNIAKSAFKPENAFATISGISGLSGLYTSYMNNKREDESMADYQRRLEEERGNFAPIPTDFVQFAANGGRMGFADGGDDDDDDESFRSKALGALYSMKRPQFSMGGGAGMPPVTMMSEGQDTQSFGDDESTGMVNATPTMPNQTPMRSPM
>MGYP000011570578 FL=0
NRFDAEIIIIVDKIFQSEVVDYALQLGITNAFIQEGDVAKESFIPDFDTTGV
>MGYP002350897487 FL=0
MQIDAIDRRILYRLQENGHLSNQ
>MGYP001584058516 FL=0
VLYSNKLTALPESLGQLAQLQSLNFSNNQLTALPSFIKQLVNLTVLNIGDNPFDKSIEIIGSLHQLKELYCFKINVPLPKTIGELKNLERLSIMQNKLELLPEFVCELSNLNWLWLFDNQLTELTSSISQLKNLKEISLHKNKLTDIPSSLVYLEHLEKLSLDDNPLNPALQSAYKQGLVALKAY
>MGYP003693669217 FL=1
MASPTVAANAYAALSRIMESGGAEKGGQSAGGPSFGALLKDAVGSVLDAGKKSDAQTMAMSSGKANVMDVVTAVAETDVAVSTLVSVRDRVIQSYEDIMKMPI
>MGYP000343390212 FL=0
MNIAIIAHDAKKELMVQFCIAYCRVLSQHSLVATGTTGKLVAEATGLP
>MGYP001158220473 FL=0
EMSELVQIKDHDQTSNHENEWAEKAKGKEVLMIMSELNYEVLEQLELMQKCLSEYDLYNNTDGKFCTIFMLNKDIGNESQLVSVGMAVGAEVEKVWETYSENNNPPEWVKSFAESYNRNMELLEKWNNLNAKLKKAYGY
>MGYP000395984138 FL=0
MKKEIAVTERPEIFTEQYLAAFGNMSWYDFVTAMPSLVFVVTGWKSNGKENACLHSWSSFAGSGADNFICILGKVNKDGHMYQSLKETKACVLNFPSNDIYDRCIKTIGNNQFETDEITASGLTAEAALKVNAPRIKECFL
>MGYP001462322588 FL=0
QATISSDARFGILSKSGADAKKMFTDKVVPISVNYPFFFKPIQDGMDRPKTELAYRVPASKLTRRKLESNEQLRELDGLDTTIDWKNTGDNSYDGEKLKLLAHDESGKWERPDNILNNWRVTKTTLRLGSRVVGKCMMGSTSNALNKGGDEFKKLYQDSDVTKRNGNGQTKSGLYSLFIPMEWNMEGFIDIYGMPVFTNPEKPVLGIDGEMIHQGAVDYWVAVIKPGAVLFEINGLEEERAYKVLKLASYKLPIKTKIISR
>MGYP001101270620 FL=1
MDRIIFHIDVNSAYLSWSALEKLHNGSCVDLRTIPAIIGGDMAKRHGVVLAKSIPAKAYGIVTGEPIVNARRKCPNLTLEPPDHKLYSRRSRELMTLLSDFSPDLEQVSVDECYMDFTPIRRQYPSPETAAHLIKERIETELGFTVNVGISDRKVLAKMASDFRKPNLVHTLYSYEIQEKMWPLPLSSLFMCGHSSVETLRNLEILTIGDLARTDRAIVESHLKSHGTLLWEYANGIDASEVATVQADAKGIGNSTTLTKDAEDKETAHLVLLSLAESVSRRLRSSGQSAGMVSTEIKYNNFRKVSHQTTLLSPTGQTDAIHQTACALFDEIWDGTPVRLLGIRSSKLVSNEDPVQLSLFDLQTADAGTAADDSFAPAYTRSPRRQPSTKKKEQLDAALDSIRKRYGADAVVRGSLLSDSKKPKYD
>MGYP001545760421 FL=0
MKRRVAALYGLAIRNAALSQNPMLSTAARPLPHSALQRVQRSGSWQIGLDFDKTALSKAAAESRVLHIELDVVTRVA
>MGYP000446957473 FL=0
EIQCVTGVQTCALPISGGDGIYLVGVGVGDTGYNDELMDTVTDAGKGASVFIHEPAEAWKVFNQNFVNTMAIAARDVQVQLDMPPGFDIVKFSGEEYSGDPTEVEPQHIAPNDAMVFHQVIETCAPESVDGSAEITVTARYRDAWTFLPKEVSHTYTFDELSAQTTPLMYKGAAILAFAEMIDAWDQLST
>MGYP000532152884 FL=0
LDVMDGHFVDNISFGPAFVEATAAVATRPIDVHLMIERPDHYVPRFLKSATNITVHVEAKHNVNKTLRAIREAGKSCGLALNPATPVEAAVPYLDLIDLLLVMTVVPGFGGQPFMPETMEKVRHAHAARQIKACAISCQRFMIAAAHMIGAQARPKRQCAQSQPTAKPRFGANEISERRYFSICASRL
>MGYP001076569615 FL=1
MDDRLTGKLIQMIGELTGKEMKRFEDFVDSPFYNKKEKLQKLSRFIAKYHPNFQHRNFTKQA
>MGYP001614764691 FL=1
MRGLRAGVYTNGPWGRLRGMSSAMGQMTDVKDRDELFLEG
>MGYP000090456593 FL=0
MCDDFSSPFQQISSYTLTIEPYLNTYSKQYENIIVIDKMPLGPLSQLVSHFNAPRLSPFAKQTNSCCKYAIRRHYNNTLRRENCFLTADDVPSLLSYLSANGYTINSEITKIVQKTNYNKKNFVCVFYYTV
>MGYP002742331534 FL=0
YFVCDMYPLLELVCTDTYFIGLTVFVNGGTICIVVFTLLLISYGVILNSLKTYSQEGRHKALSTCSSHVTVVILFFASCIFIYVRPVSNFPTEHFMFNP
>MGYP002712581081 FL=1
MATLASAARPDDAARVLSEAIARIARFWSLSNAQAGAILGLSAPTVSRLRAGNWRLEPGSKPFELAQHLLRLFRSLDSWLGQDDAAARSWLATPNLDLGAAPIALIASVRGLLRTADYVDALRART
>MGYP000897634123 FL=0
MDDVGPEAQLGSGRPVAVSGEEEIGIDGDRRGDHQGVGKFHRPVGGTDERSGPRDVVVDGVHPNGEPLEPSVDRSDAPWPAL
>MGYP003681647399 FL=0
MYPLDTIHFKKPETVLALAKSLELTGNAFTFARLRLETNIETNRVMRSSITWDSMSEAPSQGKASAP
>MGYP003287676207 FL=0
MLAGLAKFAYDVVLDNLSESAVLAAHHFGRANSIFEMLSDRYRAARAKFLLGRAYSAAQPERAAEHEPAADGPADGSEAIRWTSPDWPTSPTKPKPSCGCGVCDPAETLMNIGSFICS
>MGYP001816890121 FL=1
MSDGRPPFHLAFPVNDLEQARHFYAEVLGCPVGRESDRWIDFDFFGHQITAHLSEPGDAGSANLVDGDAVPVRHFGAVLPWARWRDLADRLAGQDLEFLIEPKIRFKGQAGEQGTFFVRDPAGNALEFKSFRDPARLFARA
>MGYP003627722903 FL=0
MDIFKTLILDTPDTLSNISGILPVSNGGTGADNAPDARVNLLPSYTGNANKVLSLNGGATDVEWTSNGAGDVVGPASATDNAVVRYDGTTGKLVQNSGVAIDDSGNVNLADNSSLNWSTAPGRPYIVGNKASDLIKLGTPTGGDLLNLVGSNVGIGSTAPAKNLAISSNANSQTTA
>MGYP001002779910 FL=1
MTAPSAPPHPGNTVPDAPYDARPASASTNRLKLGIDFGTTNSVVVLAHPDGKTETLRFRFPEHAESDTCRTLLCFWQDEVGSRIIQQEAIGAAAIDAYLEDPAESRMIMSMKSYLAQKSFRETQVFSRRLTLEMLIARFLSNLMQAVAIDPASVDVTVGRPVEFAGDFPDDALGAQRLRDSFTAAGFPSVELAWEPEAAGWRFAQRLENPTTILVGDFGGGTSDFSVLRFDPARPGHAEPLGHSGVGIAGDQFDYRILNTVIAPLLGRDCTYRVMGGEPLPVPIEWYASLGRWHRLALMRTPQTLRAMEDVARTVSEPQKLRALIDLVQDQQGQALYRAVGAAKNALSSADSTVLRFQHRSFKVEQTITRAEFESWIAPDLAQFDSAVDQALTHAGLTAADVDRVFLTGGTSFVPAVRNLFIRRFGTERVDTGGEFVSVAEGLALMSGKAAHAA
>MGYP000271019841 FL=1
GTAADARSPVHRATLGDPRGGDRIRRPDSRGHRRASSLAPHGRLGRIPLRPDDVRGVAGRGRLRGADARGTRRGRRLADRAGAVRLSGRDAEDLGVPARWNPRRVRRASTEHESGDLLGSTSGRDRRTRPRRGSTRHREACASDVLRDRLPKTPRRAPAKARLRLVRSPPALGRSTPAGPIHGLRRRPAAARRRGRRRERQLLIGTREAAAQTRSRGSSRGINALRAARRVAPSARPEVHRLAQERRQAVRGGHAVEPAEPPCAVRLVTERGEDAHG
>MGYP000735556993 FL=0
MKKNILYVLLIFIFIACDLTKEDKKNTVRGDIVSIPITEMETDYGKLSDFAEDIKMIPLEFKDECILGEIRKVVMSDSYIFIMERNNPKGVYVFDHMGKYLYKIGNRGQEPEEFVDLSDFSLNEEERVVYLYDLMRTKVLTFSYEGDFIKDIPMNYYADN
>MGYP003340149605 FL=1
MGPNIANAIIIYLSGRVIDELINESNTKVEQGDFKLLDILHHFTSGMKSISTDMMYRGTDELRSSCGGAGFHVASGLVTGFTDHAPLATFEGVNTLMTQQSSRYLIKQVKKAKSGKTCKDYFEYINHLSKLVSSKSEAKTLEDC
>MGYP003571959109 FL=0
GADSRVAFTENNSQTIGDYGTESHGSIDQKDGQPGCLLQAKSEETLGRKATGPFSMKKG
>MGYP003329312794 FL=0
RRGAETSGDIDIIINDQPTFDQFIKDLVDKNIIVEMLTDGKTKKLTVAQLPGKTPRRIDFLYSPPDEYAFAILYFTGSKEFNTSVRERSLKLGFSINEHGFSKMEGKKKGDKLNQEFKSEKDTIDFLKIKYREPSQRNSDNLEEIIEISQPKSDNSPKKTTRKKRDSNKKNKILEKIEELLL
>MGYP003570303464 FL=0
FLICQTFHFXLXKKHTTAXSTLCQIFTTQEKPRALLELFLKMLSKFLIFKVKKKLDAAALTLFKNIQIRLFQQEPVQYILEQAD
>MGYP003863973903 FL=0
MRLCLSPRRPYRHRRQARVDGLHSVIVKAEPIDIYRMLRLHNPSPYMYLFQFSDGISVVGSSPEALVKVNQKEVMVHPIAGTRKRSASPEIDKKLAEELLADPKERAEHLMLVDLGRNDLGRICTAGTVEVVDFMHIERYSHVMHIVSTVIGELNDGVSVVQALSAVFPAGTLSGAPKPRAMEIIEELEPTRRGLYGGIVGYI
>MGYP000597221545 FL=1
DQVADARLDHHRRVHAGKLRERQLAAHHLGILLVAARCAGRGDIVLAVDRRQTVGVLRNADHEARIGTEGFANDTGGGRQGLAQRLGPAILDFVPGDDRHRALGFKDRRAGLGARGCALGNIAFHRRGRIALPRDDDLVQFRRCGLLGDSSGMKGKETGSGEKGYPGVHGPSNKTKEIHD
>MGYP001178354147 FL=0
MEIMQDDLHKVEYRVWFSDSHRTLYLDTYMVWERKSKRHGWVVKASYHRLYDRYSTLTLAEVPFGDDIREMVKKEFMDSVTVKVWEDRK
>MGYP003521894557 FL=0
DYHPVTEVLMALRQRPFDKAPAFDLDDIWKKYRWQLATVGVLITLVLLLAASLDRYNRRLRQLKVRAEEGDNRRTIRMSATPCSSCTKQRPKP
>MGYP000829874590 FL=1
MFEMKIHTVRKYGLTINDEDVYFSSKGKAIEAGKISIKLNPNTKLFEEYKLCLLYTSDA
>MGYP002763718406 FL=0
MFTADAHYKRCGYPFFCKYLCPQGVLEGAIPLSAVDSGIRAALGTLFSWKLGILIAVIVLSVLFYRPFCKWLCPLGAFYALLNKVS
>MGYP003059114969 FL=0
MPDRIPVAEKDFMFSAITEEFGLIFSIALLLVCLNNLILMMNIASRCKTLFYRLVAVVAFAQITPHFGNGPVLANLND
>MGYP000926614758 FL=0
PNWVPSIWGVLETDPATLAQPRAAALRTKARTMVVASEASGKLVELDTMLSDLRHKADAMSLSLSDGSLRQQRSRLNSLRDQAAVQEAAVFDTSGHVIAFTSDEKDALAPVLPSSEVLRDIRMQRSSSRIRVAVIEPRFSPRSPARCSKCALAGAACARRSQARWALPARLASTRR
>MGYP000302371285 FL=1
MAKMAPGNAVHGDAYKYDLMGEYQMLADVAFKLSVNNLTDKHYADMLYRGHYIAGKPRTLQLTATAKF
>MGYP001304573571 FL=0
LLNEIPFPKNLKNVPTIASNHHEKLDGSGYPFGKQEKDLSIQSRILGFSDIFEALTAPDRPYKRANTLRESLDIMYDMCNKGKIDKEIFKVFLNKKLYKKYAKKHIHKNQIDGIDINQYSFS
>MGYP001161862952 FL=0
MKERGISSSLWKQSSMLIETFTENHTIECAVDNIAYCSCHNCTDSQNQSSGCFFTDKGRKEPSYTENCYNSEDTKNEFPGFAPHFHPEGHPVIFYEMQNTPVTKQVNFLPDLHMGFDPYLQNLIRQ
>MGYP001557844164 FL=0
KTNLFVFFNRIGLKDEGSYYLAELEDLGKDLKIRHN
>MGYP000311311414 FL=0
LVMFFIFSLSLSFSFYCVFSLIH
>MGYP003155641669 FL=0
MIWSNRFQEILADLDRPYAPMFRLQIGTTAITYHMSETERISGHKVLEILSHPGTASYPDLSAPNPQLEGQGNFSNGYTSGPYKYVVGLTSRISMGAQSVSPRSFKYTGASLQVDVSRKAFSLATKIYVGAMAVLQVCLDDPDDPT
>MGYP000405580788 FL=0
AAQANLQAAKQDANRLQAERSAAVQQRQNTRLIAPADAVVISRDAESGSTVVAGQAVLRLANPLSLWVKLRVDQARSAGLATGLPAQIVLRSRPQQLLSGKVERVELQADAVTEERIAQVAFEQIPAALSIGEMAEVTLKLQPADQDLDADFGGGDRIGDALGRAVARKGRRQRLARRQKHLPEPT
>MGYP000037092074 FL=1
MINLKLIATNILSNENKLVYEIIYDAAGTRYSYLDGELDGGDGPAVEKTNGDKEWYINGELNREDGPAIEHANGDKYWYVNDKLHREDGPAVEYANGRDVWYLDGHKIKHDSKTWSQLVKDSEMEREIGRVMDA
>MGYP001501362630 FL=0
QAFIQHGNTAGESGFSSVDTTSVAAGVGGEIAFHGKYNTGAQDYAYYGHIRGIKENATNGNTACALTFHTRPNATAPIERLRIDSSGRLIVGGGTHAGGSALVVKGGNQNNYSTIGMFSNHTNPANNTLLTQIRFGANASAVGADIRVYADADWGTNDYPTRMEFHTTPDGSNSKQVRLKIEKDGRVNVLGPKLKLPTGTSNPGSSVAGDSYYNTSDGTFKIYDGSIWGSVVVAAKGTQQNPAANSTELAATGALAQYYFKPNTGDTAFQQYACGGLSNLGTIPSGGPSWVNSHSSLIIIEKGQVGATSTMKMSQANYGKFIKESITRNSGTTPYVYWAVFDGGTLWGIWRIRWTGATYSTWFSNHNYSEGVNTAPSGTPSSDVWKTGSGTTGNALATGTYTISNNTSLNRAVLPEQDYNSAGSWGIHYKRLGSGEHYPWRNSAGNYTSNGYFEPSTSYSMGTDTRYIHYVYLADN
>MGYP001058876537 FL=0
KSISTSRISSAKEKEKLEEESLKSTSQLLPVIDDIIIKEDPRKFLKNIVQFDKGSTCTIYTAEYNGEEIIVKEMIIDKDNEQPLLEETRLMASMDSQYIVKFIAAYRVDDHLWILMEYMDGGSLTNIATLCDCQEEHIAYFAREILHALDYMHKQHKIHRDIKTDNVLLKKNGEVKLADFGFTAQLDKKRPVRKSIVGTPYWMA
>MGYP000564650396 FL=0
LTVSSTKLDALKKDFDNWAHVSESADFPQQ
>MGYP000266732317 FL=1
MAQILFYTLTVLIWGSTWLAITFQLGRVDPETVGISPERLEFLTRTFQDYVDNGQLPGAVVLVARGSQVAYLALLLPLPDGQPHGSRLRQRLDYQHPGHYRFLREVPLEERLVVGDVLDALEGVPLLGDEGVDHEERVTVRKYGACLLYTSDAADE
>MGYP000394770065 FL=0
PWLKELAGIRHEFEARMAQLLPDSADALAAFLAEYDLGPATAFEGILQGIENTNYRLETPAGRFVLTLFERRAAAHDLPYFVALMAHLAGAGFPAPKPIPRRDGATIGEIAGKPAAIVEKLSNYALVALEFSSFAPDSASAMMARLALGVAGQKVVDLEAVLVTMLKQAAGEHIGHPEVLGDILRKATRKR
>MGYP003657985056 FL=0
GVVIASYRPTLAAEEATGGNTIATLGNYTVHTFTSSGTFTIPADKRVPIQYLVIAGGGAGADGGGGGGAGGYRNSTIGELTGGGGSAEATLASAAGSYTVTVGAGGAGTSSDGNNGANSAFGSITATGGGGGGGGGRVGLAGGSGGGGGYFTKSGGSASSPTQGFNGGTGGGAGGGCAASPHNGGGGGGASAVGTNTAGSTDGSGGDGLSSSITGTSVQRAGGG
>MGYP000700515465 FL=0
SSDVCSSDLGFADQGADRASLVAKGQHGPAYHEADHRHTQGGHTQKTQKRTECFADGNGQRMNDGAEAPDHDRPGISFFGTEFIDDTSGEQHADGITELEYRCDIGIIAVRPPEFFSKVGLQQAQYLPVEVIDRGGKKQQGADRPAVFADCFPIHMKHFIFCRPG
>MGYP001095249562 FL=0
KSLLDITKCEEGASLQFKQTDLRDFIRNIIEESAICVLGKQLNLIENVQDIPNFIPIDETALKRAIMNIMMNAIEYSPTKGDLMFSVEMISEKLQFIVEDSGRGFTEEEMHSATEQFYRGDKSRNSKDHHGMGLYIAKSFAKQHGGNLYLSNSEKLHGAKVVLEISA
>MGYP000020363101 FL=0
LLKQLKPTSVQQLAATLAIIRPAKRHLANQSWEKILKEVWVKPTNNEYFFKKAHAFAYAMSVIVHINLLCEKIKS
>MGYP000387930855 FL=0
MTIDEKLQHFYEVSVEEAKEDAAKAIQEHRESLSQMLEDHKAARRQSAEAEVKAEAEHVRREINKALAAEQITLKRGWSRKQEELKETLFVEVQEKLADYMATQEYQQLLISQIREILKFAGNEEVTIYIDPADQSCLSGLTAAVNHPLTVSEYSFSGGTRAVIPGRHILIDNSFA
>MGYP003117850129 FL=1
MADTNGFWTTAGARDPKRGFRFRVSFAGGTNSVLNGIAWYAKKATKPSVSFSEASHQYLNHTYYWPARTEWNEVDITFVDPVEPDLCDGLTSLIESVGYVVPAGGAFAPADFSTVSKSRSVAALGNVQVEQIDEDGAPLETWTLNNGWVKELTFGDLDYGSDDLTEVTMKIRYDWASVQIRNAVTKKFSLRT
>MGYP001108639497 FL=1
MKRFALIGAAGYIAPRHLKAIKEVGGELVAAYDPSDSVGHMDAYFPKAAFFTEFERFDRHLNKLQEAGTPVEYISICSPNYLHDSHIRYALRNGAHCICEKPLTLRPWNIQGLTNTAQATGNKVFTILQLRLHEQVIALKERVEQKWLKEPDHVFEVDLTYITSRGNWYYASWKGDEEKSGGIATNIGVHFFDMLQWIFGPLTSQKVYLRTHDRASGMLSFERANIKWFLSINESTLPETATNEGKRTFRTLSFDDWSFDFTEGFTELHTQSYQHILDQGGFDEKAAENAISIVHQMRETALTPLDDQAHPFAHLPLEEHPFYPKR
>MGYP001328585271 FL=1
MRHVIDARESGSQDYKCWFFISVVNRLTVRMSYPYVTHNNNVTKEQSGFAQNRIQVVRHKVDLMFDRRRQRPSTVPLL
>MGYP001616298175 FL=0
MAKQFKTNVVVLGAGPGGYTAAFRAADLGLNV
>MGYP000014566423 FL=0
DKSFPKVSIIIPVKNEEETITELLDSIFELDYPKDKMEVIIVDGKSTDKTVEKASKYPVKILFEEGKSPNNARRIGIQHASGDIYIFTDGDCVVPKDWIRRIIDDINEEEIGCVGGSVFVEKSLQDNLLAAYSDHSIMRVMPLVEEKEEISEVRVFKHLAFCNMAIKKRALERTGGLDPTLKTFEDVDVVTSICKIGYKVLRDPKVYVWHKHRHTIREIIRQTYNYGRGGPKFRRKHPDTPIARFYTFGLTIFTAYFFILILSSLSGIILSNIRPI
>MGYP003409085276 FL=0
MAIESTLYGDRKVFTVAAFNSGVATWLRRLPELWVEGEVTELRRNEAWANVFFTLKDPASGSCLAATMPRRRFDALE
>MGYP001804777217 FL=0
MLVLHPSCEINLLISLIQVLSSTVNAVFHPIVTTSRELLVNIMLCWFLLESYISGAVKRH
>MGYP000216902384 FL=0
VPADQAGMVVDGDAAAADGDAIPSDFIQGTFKPSETTVQAQDSYEYPFLGLTMKLPEELLKQIKEQTIAMITNEGWNDNADAIKYAYISWSEMTEEQKEAEVDKLGTAYDDWYNSSVEEILYEDPDGIGDMIQAVCKLIHSCVDAGEYKEAFRTGRRLFMQEILTDDEYMTGPLEVEDFICCNELDIDLKKIALDTLYACYQVKKEAERADIMYEIWSNSGIHDLKLEDVMQHGD
>MGYP003292492700 FL=1
MNKKISLVTLGLSLSSILILTGAMIISQPKYTLKNIVGKQSSLGDVVVYSQSKRGIYSNDSVILSKDKYQFNKNVNQNPDLYKYSKNFNKNRDIFPGYIHDTGSIYSDENSIGYIEYIDEQYGETDITLSTTIKDKNLDTGEFTQFKIEIPNSLKSENNNNHKGLVTKYNGEVYIALLGEQENNPDIKMGEKDELENFVEISKVNFNSKEAKSVNNINLKIDDKSKYRIVYHNPFVIDNKIYFYLENQDKLENSYYLAYYDMENNKFDYIDNKINLEFPLESYQQDIEGEKLNLLADIDNKNKVDLRISTIDLTTGKVITNNEEYSIKKLNKEMGIDGFRIIDNKIYILASALKSYYDVRDYTENIIVLDKTSKSTLYIGEYKQGNEFKANSYILKKDEL
>MGYP001325456118 FL=1
MNVAVFSDKFSGTLTAKEALSIIKDVFQASSINAEFFSVTDGGEDSSKIFKEYGFKQFEAFRSYNCDGTEVEVESLNINGLKYFETAQLIGINSIKDSLEINSASLFKVLQKVNILGTGGSKTVDFGVGLLSKLGIDFLSNGERINNPTPKDFPLINSVSTKEFDPDINLKVLADTTIPLLGQNSAYDVFGPQKGLKQEFIKQHQIETERLIELLAKELSLELNPYEQLSGAAGGLSFCLHQILGCEISSGSKYFMETTNLAEKVKEYEIGVFCEGKFDESSFEGKIIGELLKNFNGNSYFLGGQYKAESKKLFTNIFECGEAGLNDPKGTLKIATNNLIKELT
>MGYP000616556949 FL=1
KPTEEAIFYAACKKAKLLMYMKKMKIINTQNLLRLCYVLQELKHQKQEFIR
>MGYP000530409509 FL=1
SPPVNSEAQEDAAGISKDATIEALQKTADSNVLIQEYSNTTQEKTTETVDVLKEILELMKKMSADNQSGTAGGDGGDGGGMDIDLPDRRRGPRRSRGRLRARARMASRGIRGRVGGLARGLVSGARTVGSAILSGGARTLGMLGLGTAGATGAAGLGTAGATGLAATGATGAAAGGGCGHAAGPQQHRP
>MGYP000350425517 FL=0
HRPEDFLAVDPHGGRHVVEQARADEVALLVTGHLEAATVDDELRAFRDAQSWRRLEVGAAWIEAQEEWRGARFYPDANSTLRVTYGTVRGYRPTPDAPNGGRRLATDRARPGRSRPG
>MGYP003641307857 FL=0
GGTWQXSGHAHSAYPLQDXSLSPVDKALSFAGLLWKKLIMSSAKRTRSRSIWMLRWLPCMSRVSHGESFGQTCTRETGAAIWYPAKPALSPFDRLTAASYLRAHPFAFKRDALLLRQHNSVQSANGHGSSLTDRNDRETDISLFSQLLGRRCATVFSLHSAIFFVNY
>MGYP002623368859 FL=0
IKFPKVTIPVKPGRNIAMIVEVAAKNMRQKRLGYNAAEELNKRVLKSIEERKASKTLG
>MGYP001326310147 FL=0
SQADLGKTQYGSAPSPNKLMDAYHSMYQDQKEQTLDEEGRNIFGSTPQLDKVEKIKKYKENADRVLRNKKPESGNDNTKNLNNSVDLLAAYRAVYEHHKKDEDGNTIPHEDDVKEGKIPAGLQAYLDKKKGKKKDDDDNGNDEKESKKKAKKDVKEGYDLVYNHFISEGFSEEETYERMSNLTEEQLDEFLKALAQAGMRGAESIGKKTQGLAARAAQQGAMTDPKFRKLEKVQGPRPNRADQVLDDLRTRRKQQSDNLRGRLDTAVTQLRSKEGLKFGGSQSSTLKSTPTPTSSTSKSTATQTSSGNTTIKPQQKKNNNLLSTDNLVKAQVVGSMLSGGGNQQKKKTGQVSSVQGPSQAGALSSIRRSRGQVMQDSFDLISNELIKEGYSEKETYKIMSNLTEDQIEELNEAIVSGTLATLGVLGKLLGGGVAKAAAVGKGLATAAKGGAMAVKGAAKGAMSAAKTTMTGTKDLANKALTKVQSIAKPPSKGPKITSSGGDIVQGSDQAKNKILSTDNMMKAQMASSMLSGGGGQKKEKTATVSASADLFDIVKGQLLDEGLSEEEIKDIMLTLTPEEILNEMGAKFPAGKGAKYRETPKPNPQKRLGDRTDGTAGSYVEKPQKPQK
>MGYP001574869672 FL=0
MNTPTESAAQESELLKGIVTEAMRRARHFRAVVGSDYDFAYKELETFLYGILRGAPQPPITKDAKPTNGHAADNENAIPPGAYRDGYAAG
>MGYP001569408988 FL=1
MTRKKEEFKSIVKGKVGMYTCGPTVYWYQHIGNLRTYLFSDFLKRVLLYNTYKVNQIINITDVGHLTSDADEGEDKMEKAALKEGKRAQDIAKHYFDVFHVDLHKLNILEPLNWTKATDHIPEQVTLIEQLEKKGFTYKTDDGIYFDTSKLEDYGILAGIQKDQIKAGKRVDIGGKKHTTDFALWKFSGEVGKRQQEWDSPWGVGFPGWHIECSAMSMKYLGKTFDIHVGGEDHRQIHHPNEIAQSEAATGKKFVHYWLHGAFLLDKEGKKVSKSTGGLYTLSELEEQGYAPMHYRYFCLQTHYRKPLQFSFENLDSAKNAFERLKRKVFELKATEHTGRDKTKEYEKEFHSAINNDLNIPEALQVFLKMLDDSAFDTCKRIALLEKFDTVLGLGVVEFKEEKFTVPQDIQELIDAREVLRKEKKWAESDILRQRILEKGFRVIDMPQGSKAEKI
>MGYP000341628933 FL=0
QRGPKIASAKINDTGKKKSYRKSTIHQAEKKEKEPSKFKRNIRESNTSIKTKNTNLHIAGRTGALAAGAVTEQVEGGQEVSQAAYLAYEVSRPVTGTASRGASLFRRKAAAEAKRRIKKVETGKKLAKKMGKKAASDTAKKVAGDTTKTAAKETAKNTAKETAKNTAKETAKNTAKETAKTTAKAATTAAGTAVAPGAGIAVGMAAGYAT
>MGYP001115643208 FL=1
MCSRKKWPNSSGSFVLSLFFPMDGKWWLTFHIVGLGTASFEIHDQHGLQKIIYEEVCWKWCFSLLLEANRLVYIGYRLAS
>MGYP001336892370 FL=0
SKLGIKALFKILFAENDVVVSYPGDRMIIPSKSTWAETQILRVLPIPEVFCPVGSRILPPDKFINSKLTYFKENFDKEDEILSESICEYAFSFPFEGETQFELVLQKDSLLGEILPTAKSILTLALEDDDRTITMETTLGFPSSGVVYIENEAIFYTSKSLNQLFDCKRGYNGVAVNHPNGSRVF
>MGYP003760760195 FL=0
ARIPAELVVLEVGLGGRLDATNIIDRPAACAIASISLDHREMLGDTLAAIAFEKAGIIKPGIPVATGAQPAEALEVIAARAAALGAPLLARGADWHVAPTATGFTWRDASAKLDLPRPSLPGIHQLDNAGIAIAAIRASGLAVADAAIAQGIARAQWPARMQRLTGHLAALL
>MGYP001290313395 FL=1
FRSALARFKDAEAFILLNRWSIKYFHSDGPIMPYVLFQVWSFIAPGLYEKEKKLAMPLFISSVLLFYLGIAFCYYIVFPLVFGFFTSVAPVGISVTPDINSYLNFILKLFFAFGLAFEIPVATVILVRTGITSHSALAKKRPYIIVCCFIFGMLLTPPDVISQSLLAIPTWLLFEFGLILSRFISVKS
>MGYP001572697057 FL=0
ADEVNFPSLPGGIGQKLILRTAFSPPVTINLAATSPEGQRGGDSQGGAATAVMNALKPSIEEPATGLRIEPWGSPGDWRIPLGILLALAAFGVYALARG
>MGYP000217052795 FL=0
TLFRSFFNDPCDLLLSLSLAPIMSFDEDYLVVSLNELSYEDESLPNNTLKISDVAELIPLTEIAFSGYDRKFSTGMIWTHPSKYQFDDTFLDFSKLQIRKDAEKNFNFLNEVYNFNEVERHINEDIKKEIIEASICKRLLKKSDLNIKGNEFPHVYCSLMIYEQGSHLSRESAMGFLMHAVGVYILHKGYGSQLTSKIELNNST
>MGYP000907485586 FL=0
MLRWQFVLVGVVALTLSACKKNEQPTAMPAE
>MGYP000122865995 FL=0
MEGVGRGMGFITSLESYSILTRLNQHHKSELFLTSLNHMSESFPISLIQHKFASSTPIWNDALANLKRLRIAYLRLIYPVLSLAGQFV
>MGYP001557166919 FL=0
TPLEHTIPADSLLPVELCWRVLAEVEKDYSIMVQVIGPENSLISNRRTFPGLGRYPTSTWQPGAAWCDLIHLLVADKGIPKTLVYKIEVGMLYPELDDRISIYGTAGDQIETFAADVLITQDADESVSLLDTDEIMTLLDYQVEPVWRPGQANQFVLTWAVSSPISEDYQLYVHLRDT
>MGYP000281517610 FL=0
MREHRRLGAASLAVGATLLLSGCIGAGPSVVVGSEVNIGSTVSFTSMNPQSQSGRTDTNIAVAAATGARFFNFDETAAVVFDPSFGSVTKLSGDPLVVRYTVADGVRWSDGVAVDGADLLLNWAALSGVLNDPRLSRADVFEENTDGDGEEFRADLPTDAVYFDTGVNPARPRGIQLARAIPQLSDDRKSITMTYSAPFADWAIAMPSAGLPAHVVAGEGLDVEGSNQAKDAVIAAVLEGDTAALGPLSRFWNTGFNVADTAIDGTSSLLVSNGPYLISDIVAEQFVTLSPNPNYVGAHRPEFETVTFRYFSDPLAAIQGLSIGAIQVATPPLTASVVSALGALQLDTQAGYSARWEHLDLRVTESKSGVFDNPLVREAFLKIVPRQLIAGMLTEDADAPAGPRDSFLFQPGQDGYTSASRANGDYLLASPGGATAAVALLAEAGVTAPEVCILYPSDDPLRAREFLAIQGAAAPAGFVVTDCSSADWQDRLGAAGEYDAALFSWELATPGISDLEQIFATEGFENLTGYSNPELDALFSEITASTSVPERRALRLKADALIFSDHYGLPLFNYPRVTLFDEDEVSGILPSPTASGPYWNIWAWKPVLPG
>MGYP000572280030 FL=1
MKDKDLLKLLLKNGWKDVPVGLLNAILKRTGLK
>MGYP000287529352 FL=1
TMEKALKIEKYREIREKKERTSQDLEGSPKVP
>MGYP000977872181 FL=0
MMTKNPGQDEIHMIATNRRARHDYTIENSLEAGLVLQGTEVKSLRE
>MGYP003566039669 FL=0
ERQLAEAVMKLKPTTSIQEKLWSRITADVDLMSDYRLIRLDNALAEPPVYVFVIIIGFILTMSCFGVYQPQAPLVGLVVLYTVFIGLVRFLLLTLSDPFHGIGVQPTSFELKYALP
>MGYP003578873141 FL=0
EGHLRAQLRRAAEFEEDVEVTSEMTHAKENVFALRVKGTSMIDALVNEYRTCRPDLVLTHSTDDPYNPDHPTAHQISLQARVYAQAEGYPASGRPIGAPPVFMFEPHQPERCGFMPDVLLDITAVWEQKRKAMESMEAQRHLVDYYSDLGRRRGTQAVRNSGRKGITVLTGEVGTGKTTLLRAALEPMKSTAVRYAHLSNPTLTRSEFYEFL
>MGYP003526032744 FL=0
MRLSLRWQEALLLVSGYTLLALQPSWMPNVGLFALHGLLVLLLGWMAGQRLFGSGYTAFERFGGGVLTWASSLSLVHTAAYYASIPLTTLNTTLLEAVIAAVVFAIPPLPETSPTNAPVAPVALHQRFLGLLAGAVGIGSAAFLFRAALLHPATVSIRTPWPLLPNGVFLFFALCFASGLVAAHVTRSVQTTWLAAVSWFTISALPALLYPLGYGFDGFIHRASQELLLRTGTLTPKPLYYIGQYVWTVWLSRWTELPLTIIDTWLVPASIGVVIFAFVGLLRRSSPSLRWAPWPLLLLLPLGAFVTTTPQTWSYLLGFSALLIALWPGLQGRAWIFPLLISLWAGLVHPLGGLPFASIVWALGIGALPIFKRYAVPVRIIGFIGALLLIPLAFWAQSRLGNTPIRWSWDWLRWEVLRTSFADLLLAPRQTLTLWLDGAEWARTAVSLGGILVGAWLCLRPK
>MGYP001228241971 FL=0
INLSLKETGSMKIELIIDAIAVLFLAIGGSLYFSYSKSRIKGLQIWTPISKRLILNFLVPLATGGLFIIILYVQNQWQLIVPSMLIFYGLAIINAGKFTYSEVFYLGLAEILTGLISAISPEHAIFFWSFGFGLLHIAYGLFMYRKYEV
>MGYP003467506258 FL=0
EHVFDDEHALRPAEPAERGLRRLVRLRDPSLRHEIRDPVGVVDVAERTPHDRLREVEAPTAVGGERRREREDVADSAVRIGRKIIELLGARDENGYVFRVDMRLRPSPEVTPIAIPVEAAISYYESSALAWEQAAFIRARAAAGDKALGDYFLKSIQPFVWRRSLDFGQLANIRKMSGQIRDHYHKGQVLGPGYDLKRGRGGIRECEFFAQAHQLIHGGRDPGLRMADTRTALAALA
>MGYP000492251796 FL=0
DMTGSASVALPQITAGAITSTGLNSTTGTVQYTDGGSAFDSSDADGYPRFTVTNGSAQLGLFRAGSSVGGSYIGADDSKLLRVYNTSFASKFDIDTSGNVTALGTISSGALATTGNSTHGGYSSWTAGNGTSGIFQHYNSSNSYRGYFDWRTLQLGNNGANNILAGNSSTGGYFKFWVNATGISQTGGTSGINALTISAAGNSTFSGSIDSGAISSTDRVTVTTAGADGLVLAPDTGSTNNSARLFLNGSVGNWAIFNNSNILKFNSSATAGSTSGNLAASLTTAGLLTVVSLTESSSIRYKENLKPITNGLEVIKKLEPVTYDRTDNDSKDEPGFIAEEVLKFLPN
>MGYP000299415252 FL=0
LQKEGKDRSAYRVSEADKRELLAAYQRRGYCEGYYHQHNGRDMISLKRPKNAKDGNTEEKPWQDIKVQEKINGILTFSVGKRAKLTVSYGNITVECTGQEVQEAQKQPLDPKRIEKQMRKTGNTEFVFERLKIHTEGNVFLPMQALNELRREGIEELTEQIQMQYRREKAGCGMKTATAGFDSDADGVTETAGKKE
>MGYP000035781564 FL=0
FDRLLSIYNRFPLKELIIHPRVLKDFYKYTPRMEAFRNAFANSAAPVCYNGDIVDRESYERLTAAYPALDAVMIGRGLLADPFLIETLSGQAGTERRRTQIERLSAFHQQILEGYCQTMSGDKNVLFKMKELWFYMGHLFEENKKQMKKIKKSQKLSDYMEAVDSLFEEGEFHAWGTFE
>MGYP000547744649 FL=1
LLFGFETQEEYKELLELLIQLRTPKLSSLFNSI
>MGYP001288746208 FL=0
FFDCKRCFFFDLKFGIKRPHGTPLVLNNKIIQQVKKEFDFFREKKKPHPEIIKLKRGFIPSNHENLLKWKNSFNGVFFVDKKTNLKFHGTIDDLWFDNQTNSHISVIFKSTSRKDQLNQSEIWDGYWKQLSFYSFLLSKNSIEMSQSGLILYINVLNEDNFEKEIKLDFNLFEQILDFSWIENTIENIHELLNKDAIPDQNRKCKFCNYFNNIKKIHE
>MGYP000877297596 FL=1
MLFRSADAVEAVIRGLKRAGVSVATYLPDSLLKELYPALDADPDIRTIPVTNEGEGAAIAGGVFLSGKRAVLVMENSGLRAATEHLARMGLGAGIPVVMIMSYRGEMGENNWWAIPHGITMEPLLQALRTPYTIVRDVDQLETAIVRAYDTAYASYYHAAIVLGGDLVR
>MGYP000780934939 FL=1
MTLKEAYETGRDLDVYVDSEMADQDSHSFDDLWQSIYDICLLYTSPSPRDS
>MGYP003414964913 FL=0
FMKKNEEINMFTVYILYSPSMSKYYVGSTSMDISERLARHLHDHQGFTSRAKDWEVIYTEKYDDKTEALSKEKAIKKRGAKRYLEQLGHL
>MGYP000195956432 FL=0
MIGYLEGKLLKKDSDRILLLANQVGYEVLLPAVVMETFGAQKIGDQISLYIYYQQTERQPKPVLIGFNLEAEREFFQLFISVEDIGPLKAVRALNIPIRDIARAIEARDVQKLNQLKGVGKRTAQKIIATLAGKMDKFA
>MGYP000654245701 FL=0
MSETRYSKDHEYIRVEGDVGIVGISDYAQSQLGDVVFVELPATGKALSKGAEAAVVESVKAASEVYAPVSG
>MGYP001494102332 FL=1
MADYKPIEAGFTKIRMLRKYDVFDLLSISLFNAVVFGCGLGVGWLVWCY
>MGYP003981121435 FL=0
GTLCHFDSXYYXQSDSDCISSGFXNDSPFLKCLAFYYQSIGEEGKTRKELQNHVLQVEETFISNFS
>MGYP000559679233 FL=0
DILEDIRAFFERNVHMKMPENNVQQAELPEGCTVFDNPVGTAPGCAFEADGVHVLMLPGPPFEMLTMLKGHVVPYLRGFSSEVIVSHDIMTFGMGESSVDQLLHEKMSHMENPTLATYAKPAEVRLRATAKAETAEAAEAMLAPVVKDVTDFLGDYVYGVDVSSLEETCFRLLKEKGMTLATAESCTGGRVAERMTALPGVSAVYRGGVVSYWTSVKAAVLGRQTFLRPAQHNRLDGSPVAAPAPTVEGDHNPRRSHPPRHSPHCAAHWRGVQAAIAPQ
>MGYP003443514059 FL=0
MASLIDYIHLYGGVSFSKKRFNDVDNVILSLVAYIDMSNTAAATSDGIRLADALENFIRSHTQKEISRYGLAIKDAYLVAKELIGAPRFADVRVSDYVYLADGDTQFGAMVFHLTKYLDYICFEGTDHTIGGWREDCLLACYHPVSSHILGADYLKKHIKLSGPTVILGGHSKGGNTALVSALMTTPMRRKKIRMIYSNDGPGLRRRELLSKEYKSIRSKYKHIVPQNSIVGML
>MGYP000585668832 FL=0
TRSSHALALNLGNITDARMKSMPESLKTAASLHIPVMLDLVGTACSNLRYEFANRLMNIHMPELLKGNMSELLAMSGQTAHAIGIDAGDEDTVTDINRLHLQELFQEKAAQWNTTLLITGKEDMIVSANKCSFIKRGTPAMSQITGTGCQLSGLMTLIWQRIRTTCWSRGRSCLRHGTGG
>MGYP000681108114 FL=0
MKDQDLIQAIEQLVTDHNPPVSDLPGHVDFIKETNRSLVTKIKELFFKSVPVGSTKATIQVHAVMSFWYAQRNIERWSLIDKVFGEEDEGVVNHLKDLFMKAKYCINDFMIDLDEEKRMKLIQYVMDQYNGFTLESAKRYVDQLEK
>MGYP000336411506 FL=1
MDIINIVAVISFFLIEIHTLPLVESLIVLLVEFFLHVNQRFAIDVGFDEKAEVF
>MGYP001129885005 FL=0
QLLRDLVSRLRLPDSPTATAVAEIRPFDFVAADDYELPAAYDQRRPPSPSAATVAKALSGEKPPPYWAGQAAPEADATHLTRLELASVEPELCVALRAEGKRRGVSLHAILFTACAAALRAAFDVPPALGIKAATPISARRFCEPPVDADEVGNFIGGVETWLPLVSAADPSDDAGEFWASCAAYSRHLSANLREGAALPGLLAHVGEWPAAWER
>MGYP000989466621 FL=1
MNQSIKNQNIFSSVLLAALGYFVDIYDLILFS
>MGYP003369514027 FL=1
MNNSEIITCVNGALSHDQKSVERLYQYTYPNASALARHLCSNPNDVDDILQESYITAFTQLNPLREKASFPFWLRKIVINTWRAFAKNKSNYYEILVQDIPGEELVDESLQLSVQDEVELSENQREINDLVEALPESHRLCVRLFYYEEISVEEIAEILDIPVGTVMSRLYYGRKRLKEQIEQRGLHTFHASPTAASAADPLLLSQILSALQAASGGVSAGGIALKLCLGLASLLTIGGLIGIPVLMKDDSKPAQPSITAHSTTATTAAATSSTSSMTSATASSTTVTTTATTIAATTPRSYISFEFEDYDGGIMLTSYTGTEPDVTIPDSIDGKPVTAVGSGAFKKNRILRSVKIPPSVRRIDSNAFRDCRALQSVAFGSGVSYIGDMAFLGCSSLRKINIPSNVDEIPESVKVEKRRS
>MGYP003580237746 FL=0
MEMTITEKPARTLPVQDARIYPRGGLDVLSRAEVARLRDASGGGMHELLRRCALAVLTSGSASDDPRAARDLYPDFDIQVAQQDRGVRID
>MGYP002553410909 FL=0
MGDFGGVEQDANRCLYPSLATGENAGLSARLFWEQGKARSNKKINCRGLNNLYQSGIDKAIVSALPFGPQYSNQQLCCFNNYIKQQVALFPHRLKGFCTINPLEQDALSYLEQLIGSEGFKGLKLHNNMQQFYPDDTKLYPIYQKMQEYQLPILFHCGGIGLPPTRDSYGQPIRFDAIACDFPDLPIILGHAGRTWYDETAMMLRKHKNIYADISTNIGRLKSHAGKPMADLLEKVKVWAGHTNTLFLGSDYPFYGQAETVEIL
>MGYP001481087062 FL=0
FIEDKALDFFKNQTLKSAIVQSVEIMESKGDFEQIKRLVDDALNAGSERNIGHDKKPARMKAGFQVVIYPVSKGLKDSN
>MGYP001410066015 FL=1
MNITGIKKLAKEGKSPYFFSPDTMRFFSSKVYKDVRAVKEGHLFITSEVFGDDSRHYSLRLIDSKGSIETLITKDNLKIIKQLMRAY
>MGYP000418322004 FL=1
ATANKKAQQRESNSRPQHSNPKRGREAGFTPTHEKRPNPHANYGVHFDMYSASDEERQNSLGRYGKQAPWAQPKQSHTPRTPEQEASLKRKIRALEGKLEDAKRDQASGRNDFPQVMLVDGTSSSLSVHVRKSMETELRAWNFDVPPRVSKDLVTIRFLLDYGEFIQELNCPVDMAYLNLRLMSQKWKEARLTPLRTAVS
>MGYP001323574780 FL=1
MYSLELFVIAIYCLIEDALYPHFCHQHGQPRRAGFPPALSDSECLTLEVVGHYLGYGTQKQLYEQLCDRFGTWFPGLRIGWPLPGSRPTCGRSKPGSTSTL
>MGYP003297312165 FL=1
MDNASNTLLGKVKKLIGVEPGTKLQPMVAYNSAVFFTGGGPYILGCYLLPFLTKVEGLDAVPESVSAEVDVLQIAENWSLFMSNDLPFSTVAKDLIPSSYQYEVATKYANGIDITFTSIHTLLDPAFVDEKVTNFVWITDNLFSVDISFVKRMLLSSGTTIEDSMNDRFYFVKYDDTNDYSDNPTWKLLSMKEIVGNAE
>MGYP001502702574 FL=0
MINPINLAILGLICGGLMKFFWQMGLENKVDIASFLAVDALFIFLFTVITFLYLKQPFVLSGRMSIAAALAGIFGGIAMTAVAYAIKLGGAGSVIFPIISLETLLVVILAFV
>MGYP000531888355 FL=0
RKRNIHRSIHVESDDYPFVAIFKERINIMREKYESLSLGALKEIAKARGMRGISTLKKSELVERMVQEDDKERQMKESSAPQESEQESRNGSRAGKAEERQESRASGRQEERQETRASGRQEERQETRTSGRQEDRQESRTYVRKEEKQESRTERPPMEQSDLDSGMSVSGILEVLPDGYGFIRSENYLPGENDVYVSPSQIRRFNLKTGDILRGNTRVKSQNEKFSALLYVTSINGIKPNEMRRLNFEDMTPIFPNERLHLERPGGSLAMRIVDLVSPIGKGQRGMIVSPPKAGKTTLLKDAAKSILKNNPEMHLIILLIDERPEEVTDIREAIQGPNVEIIYSTFDELPEHHKRVSEMTIERAKRLVEHKKDVTIFIDSITRLARAYNLTVPPSGRTLSGGLDPAALHMPKRFFGAARNMREGGSLTILATALVDTGSKMDDVVYEEFKGTGNMELVLDRRLQEKRVFPAIDISKSGTRREDLLLTKEEHEAVDIMRKALNGMKADDALENILNMFAHTRNNNEFVQTVKKQRFL
>MGYP001261365442 FL=1
MTFDITKPFAPSTRSPNSTPIASWSSWAEERRCRETLASAQQLKQVALSKRHRITFYMERTTVADFVVDDLVSPADVVRIGPCLVVDDHAQHPVVGAQIHHPLRSDDVGIGQDGNAVFGRTSRHDRVVGEASRLRKVPSARLSVPTGVDRALGSRIISTGGGREWIG
>MGYP001159235774 FL=0
DGDVYYVAGGGDWHTSGNNGYYSDPNYIRLATTQENATGYYWDDDSDSDTPDVWHAPVVLNLVHHDTSPYTDVTHTLRAVNDQPMSGLVNGQAYFVVNRTATSFQLSNTPNGSPIAFSNGGLTGGHHTFAVEGIDLTSAGSGSQDLVLDIDNGATGSFSGMGGARGASGAPSGDLQFTVSTTGSTGGAVTVGYAKADGTASIDTDLTINSAKIFGADVNIETKSFMNVSAVSDSGAFGGVAIGESNTSALGTNDSDITINSGAVIESTTDLKVSATIDS
>MGYP001146147798 FL=1
MRSKSQKLQLKLTIEFALFFIVVSVFIFIHFTKKFEDQINDKYVYKADVFVNFFKQSPNAFTGEKLADKEAVSNLLDLNGAVYLVIEKPTGEILDAINLDIAENNLYVLSKTNREGISKDEKVYRIALPVEGDNISGKIYVGFESRDDAQKILKNRMLTALFSLSILLAGIVFTYFLSSISFRPLAKIFKALDSANIYADIKGKKNVNKSELRVLEDRVNILLGELDRSSGEVESLNRKLHDVFKDKIAELNFEINQRKKAEILLQKSEEQFRLVFQNAPIGIVIISTEGKIISVNRSFCNTVGFERDEIIGIPIKYLFEKNDLEGFENDSLVYDGKPIADISTERTLLKKEGKEINVIVKLVSVLDEKNKVKHYVMQLLDITEIKRVQQELVAALKKAEESDRLKSAFLAQMSHEIRTPLNVILTSIPLLADEISSKDEELKIILDSVKSAGRRLQRTIDMILNMSSVQSGNYKPVFEKFDLLTDLKKLMNEFKSLSDDKGLELKFKQSADESFIVADRYTVNQIFQNLINNAIKYTLKGYVEVFVRNENDNKVRVEIRDSGIGMSDEYLKKIFTPFSQEDVGYKREFEGNGLGLALVKKYVELNKAEIEVESEKSIGSVFSVTFDLSVNFEDESQVKKYSNYQ
>MGYP000699489815 FL=0
MQINITIEPEYSGTVWCKETMDGINEKVSSLRYSVNFCSDVSEAKDAMDWAGR
>MGYP003287736390 FL=0
GLLHGLWFIGQGEEGGVLFIGDDWAEAHHDIEIEDEAGRLLVRKRLPEGLAGVTLLHELVAEHLDPSGEPDQVLVGIETDRGPWVQALLATGYLVYAINPLQVARYRERHSTSGAKSDQGDAHLLAEIVRLDRAHHRPVAGDSEIAEHIKVAARAHQTMIWSRVRQVNTLRSMLREYYPAALAAFGADLAGREALAVLAAAPSPDPGRRLAQARLESLLRKAGRQRNVAATAAKIRATLATEQLTARPGVVPAYAPARRR
>MGYP003686838251 FL=1
MQDIPYAHEVLSAETQTLALEAIKKAGPYEPQTAAAKLERTETAIIELIEQQAAGIANKVHDEMTELAPNESCLIEVYPSRFGNLYLLQKVPCLQTIVENINRISGLDISAMLATEEQDIGDRNPLYVTVAGILIQKGKSLHRGQHLLRTRS
>MGYP000072504175 FL=0
RIGPHLVGVARDQPEAPARLGTKMDLGVRFAQLHVAPQRGHMAVGAPLDGIVGAELDLIAQKRLERAAELGREFVVKVEGVVRERSSKNMKIPTGEIEIQVINMTILNESKVPPFTIEDESDGGDELRMKYRYLDIRRRPVKENLIFRSRVTMEVRKYLSDKGFIEVETPYLIKSTPEGARDFVVPSRMNEGEFYALPQSPQTFKQLLMVGGMDKYFQIVKCFRDEDLRADRQPEFTQIDCEMAFVEQEDILQAFGGLTLHLLETICGVRLDSIPRMTYDEAMRRYGSDKPDIRFGMEFGDLNEVARHRDFKVFNEAELVVGFAVPGGNAYSRKEIDALTEWVKRPQVGAKGLVYVRCNEDGSFKSSVDKFFGQEDLAAWAERTGAQQGDLILVLSGEADSTRTQLSALRMELAERLGLRNPGEFAPLWVVDFPLLEFDEETGRYHAMHHPFTAPKPGQLELLDSDPAAVRANAYDLVLNGNEIGGGSIRIHDRETQEVMFGHLGFSPEEARQQFGFLMDAFQYGAPPHGGIAFGLDRLVAILGGQESIRDFIAFPKNNAGRDMMIDTPSTISGEQLDELKLRVIKD
>MGYP001564172474 FL=0
IVVASLNFFDTYLAVIRFVDYKLITRLIRGYLVAAVVLYGIARYLDSAAWSERMLLMFVILGPAIALQVRLLAQWFLRPYLRKDQREPVLIYGAGHAGTQLAAALVTSARYKVKGFVDDRPSLQGREMLALPVHAPARLRALKEEDVFRQIIVAIPSITKSRRRAILESLEDLSVKVQVVPGLDEVASGQRKFEDVREVQVEDLLGRDPVEPIAGLVEAQVRGQCVLVTGAGGSIGSELCRQIAMLGASK
>MGYP000465940127 FL=0
YAAKRTRRQAQPKVCVLVENMEYANIGQFGYEIVAGFRLAAAARGWAVDVLPTTPEAQARTKYGSLLLEGGYGGAFILGLTPQDAYMRALAGTGTPTVLLDNCVPNASVGYVGTDSWEGVELGDILSSGFEAASFDAALSECAFFLTGDPEGALREAARLLRPGGALLYSDICPGGEARLRRAAEAAGFAVEALTDVTEDWKRYYIAALWRGEAECPPDGARNCRYLCAVFRKEAR
>MGYP000176012788 FL=0
NIAKITLKNLSEKVLTIHPLGKAVVRCFKNDHSATIPEASDFKMIPGRGVSANVEGYHVLAGNMAMLNENNITVSQPIMAKTEEYINRGCTITYVALDNEFAGYVILSDTIRALIADEKSPA
>MGYP001150477923 FL=0
MMMEVQDEANEVDSDLMENKTHLDANEGELLILRRVLHTQDSPYD
>MGYP000662722262 FL=0
MTYVVTDNCIKCKYTDCVSVCPVDCFYEGENTLVIDPDECIDCGVCVPECPAEAIFPESPDLANWVEINRKYAKQWPVITKKKDALPEAKDFDGMKNKYEKFFDPRGFQGQTRK
>MGYP003721390011 FL=0
XXSLKSSXVSPPAXFLHTXLLPXEVYSKSASLLXQVDRLIESLLLPISQQQIRKLESERTMLVDRNVGIQAELDQLKQQSRDRIAAVAATQQN
>MGYP001010919623 FL=1
MYPVLFHIGDNPVHSYYLLWTLALTLAVVFSRRRMTFFYGIDDDDARSVIIWAFIGMLLGARAGSVYDSWSIYSADPLKILRIWEGGLSAVPAFLGAGAVSFVYSKRRKIPYWMIVDAGALPAALTVAIGRWGCFLNGCCTGIETTVPWGVRFPSDALGLLRHPTQLYYSFGALFIAALLQWTESSWLGYHNDRRIRGAVLCPLFAILYSLLRLAADPFRSDFSRIGMQTNRSVLFVVLGISMLWLGYSVFYEKKCIRS
>MGYP000546373282 FL=1
MSHQRVKRLTQFIAATAIASLITLPAAADGLSLGSRPDQAPRTSQSGNSISVEAWAGGTTATTNTADTTATEFDSTAWTRWAPVSYTHLTLP
>MGYP001816006016 FL=0
MSRKCIVVIGAAGRVGSQIVAELLRRHHRVVMVDALPGDALTRRAGRLLNDARLAVSPCSGSLRAYGGIDALNCAAMTDILIRENPDLVINYAIPITWDAAKRLPNYKAISAAGLGAFTPIQVLTPLKVAQAIHDSGVESRYMVGNLPDITIPIINGIAQGGTLQPALCGAGNVGLNQIAMRHQAALELAASFDDVDVALVSHHLHWVAPREPGYSNEGPFLATVSLAGEDVSASFKDLRALMNEGVRRHYEADASFSSTTGILASQVAMALLDDTDTTHHLHTPAPNGLPGGYPVEIQHGAINVNLPKQWSLDDAVAAMAICHTLDGVASIIADGTVTFTDLARDILRDELSFDLPSQMLPHDIETVAREQIDCMRCLLYTADAAD
>MGYP001138444575 FL=0
MPTIEVEGSKVELDDEGYLVHPEDWNEKIACILAEREGIIKKCPMTKEKVGILKFMREYYKNFEAFPIPRGICVNIHQPRNCTYEEFPDPSIAWKIAGLPQPSRHVVAQLKGLGGVS
>MGYP000402310384 FL=0
MTRDPLDEVTVTFQPRRPNSIFRQKVLVQYSEQFNTFGFGMVVKKHGIYREYRMNVKRKTLWISDLIFNVEESRHSMNNPVSFCFDRKIICGKRPRSMYQTSVNRPMPFPQCKFDAVWMRPGAIF
>MGYP000123267625 FL=1
MFKDKLAVEQEQGCKVPITLLESLTTFLGKNSTKRLDQVKGALTLWMSGILIKTLPATSDPACGKGIFFFFTTHLFA
>MGYP000748431043 FL=0
LRALGTSSTAESHVPAISFQSDQGDGVTARASISADRDGGATKGSLIFSTRISDNITEAMKIDSSGRVGIANDTPGDFDADGDDLVIGNSTGNRGLTVRSSASGFGSMYFAMGTSTTAQKVDGFLVYDHGTSFSGTSGLHIGTGASTRIGIDESGKIGINETAPTATLDVRGSSSQPICNFGDDNIRDSDALDIFGSDSFRYQFQNGQQARPAIIEGGGDVAANESAVYFTGFSSSQTDGHRNLGGMIVYRKNTGGADSGQYGSQIQFRSKADGTATPAQNMVLSENGSLGIGVGAPSATRLQLVRADGVTDSTEFTQTIQNLDTTEGQGSGLFIQAGNGSTDKILQCQTRGGTFVLDLNGAGRFNTTANVAND
>MGYP001244487380 FL=1
MQYHVKAMQSLDMVVELNVDCVEADDARRQVERLGYEGVTLRSKRAGLAAYLKRRTTFPLTLFSQELIALLGAGLSLVEALETLREKERHPDLKQVLEQILTKLREGLTFSSSVEQLPSSFPALYVATIRASERTGDLREALSRYIAYQVQLELVRKKLVSASIYPVVLLVVGGLVMLFLMMYVVPKFSRIYEDAGKDLPVLSQLLLEWGKVMEAHGLLVMGCLACVGIASAYGLTVPAVKARILSQLRSIPAIGSRLQVFDLARFYRTLGMLVKGGIPIVSAIEMVSGILPLSLRGPLHAAVRDLREGKPVSQAMESHGLTTPVAHRMLRVGERTGQMGEMMERIAVFYDEDIARALDWVTKLIEPALMAAIGLVIGTIVLLMYFPMFELAGSIQ
>MGYP001368835617 FL=0
FTWKSLQISSFILNNLSVRKRSLFAKKKLRGSFFRKLLFYYLSEKSKTTQTSIYLKNNLIITIFLL
>MGYP003476759632 FL=0
AGQAFEQTGLKLTPWQQYEKDLAEYNEYIKQNPNAATQSTAASAANVAKGNGTGNVPMNTDTISLKDQFPETTTTGGGASWQGIGDTDRFGDVEPPLKDQFPDTPQGTGASFLGTPEAPPDDPIPPDIITTPPPDVAPPPGGPCPQPTTYSQCTSYHPESTIPGKMSQAATVRSITAYINSKGFRHDPDGIPWLAPSAWKTWDGVTTINPCTSTTAQIMAFVFPPPGSVNTMRGLRERFYQVNPFADNQNPTVAEIENWNVEVIRHFRRLLGFNQTTHPVYNDKCTYLKAAWAEERARTNYWSASYPGVQDSASGPCTQPSSSNAHCGASFLPSPADQAPYLCPATMPACTTTAGAEGISNQNKDIPWGIKMSRIIGNYLSADGITGHTG
>MGYP001453318140 FL=1
MREFGAELGELRLHRRTHGEGILLAAVGHNATVDLEELCVRRQGDVGPVGALANGRPLLLAQVADHEHRAVH
>MGYP000100214384 FL=1
MNIEKFYDDDLSGQIKAKNFQGKIFEILCLLAILLGISILLILLIDVTLDGIPWLRPQLFNSFPSRFPDQSGLRSALQGTLWMAILTAIIAFPIGVSAAIYLEEYASDNRFSRFIEINIANLAGVPSIIYGLLGLGLFVRGLGLNRSVLAGSLTMTLLILPTIIVTSREAIRAVPRSLRMASLALGATQWETIRYHVLPYAMPGILTGLILGMSRAIGETAPLITIGALTYIAFDLRGPMDIFTVLPIQIFNWISLPQKDFHDLAAAGILILLAILLSLNSIAIYLRNRLQHRW
>MGYP000373900305 FL=1
MKDYAKKFYLSQAWRKTRDAYAKSQNGLCERCKQAGDIVHHKQYITPKNISNPLITLDWANLELLCQDCHNKEHTKKQNSRYAIDEFGNILPPGCVKNKRPREPVKGS
>MGYP000933484466 FL=1
MKIGNLNLDNRVFLSPMAGVTDLPFRLICKEQDCGMLYTEMVNAKALCYDDQNTKKMLKIEEEEHPVAIQIFGSDPEYMGGAAKIFNSYPNEILDINMGCPAPKVVKNGDGSALLKNPELAAKVLKAVVGNSEKPVTLKIRKGWDDTCINAVEIAKIAEDCGISAIAIHGRTREQYYSGKADWDIIRQVKENVSIPVIGNGDVFEVEDAINMLNQTNCDAIMIGRGAQGNPWIFKRINHYMQTGEILPEPTLEEKINTAKKHLKLAVEEHGEYVAVREMRKHIAWYLKGLRNSARVRDEINKIESYEEVVNKLESYMQDCLTLE
>MGYP003298397327 FL=1
MKKIYENIEIAIILMPTMDIVTLSINQKDDVADDIFAPNN
>MGYP001558061087 FL=1
MNILQRLKLRLGLQVCLGERTREGWSGALPFYAFKCPVHGLVENYPSGWAEILRCPLCIEAEKLRHGESRPP
>MGYP000481936423 FL=0
RTQIGKASLNVGWPRDYAKLPVIRRYSFAPHVSPRDGTMPVELIGPVNSPGGNGPSNGMYALQKALRKRIDEGLDWLSIKPLPASKGSLPWFWHWDDRRYAAWWDSEGQPFVQGPNMLFTYSGKPRSDTEECALLDAVNCRAMFCHSEWYRDLIAKHRGPANQSPIVLWPYPIDPWPGEPLPDEYDLLLSLIHISE
>MGYP003150238574 FL=0
IGPYFKSETGTGNTGKTPIQAYVPAGPAPATSTIQSSYWTNLGHRVYGYGTVYGCGVFRDPLSVEHLLVATSDGVYATKEANPSVLLSGITSITNDVTFVQCFNVVVMFRGEGEEPYVMERIDEGFKAISQVASDTDLDENDSDGTESIPNASTGLFFANRLLIPHSDDQVAVSDFLNYTRYQPIMSNFRINQGSEDELVGLRRINNSTLACFKTNSVYIVSNIYGNLTDIVLDEVTREYSAVSDKSIVQVGSDVLFLSSKRGVCSLTVATNGKVSAVDQPVSEAIQPLVDRINWNHSSKAVAAYHNNRYYLAVPLDGSTYNNAILIYDTFNKAWAGYDDGDAVKVKDFVETKHQGKRRLFFLSTDGFVNLYDDDITECGFVDEIPSSTTITDSDFGQVTVKDIKDELVTRGYTAGDVSPKKWRSAEVHLSTNDPWFQVKTQYDGPEEDDQELTAAATIDANGYITAGGKTFSRSAYDRPFDKTAFVESMTNNDFFTQHRQDYSVDPDTEIVLGSNGFDPDIHQKSVNRYR
>MGYP001768574441 FL=0
FPDPSTQDLAGYISTDPETKDELKYY
>MGYP001452703586 FL=0
SVLIFLIAAGIVLFAVTSSMMSWDFVMSIDSHWFSTMFGWYTFAGIWVSGLTMIGLMTVYLKRKNLMAAVTSHHVHDIGKFMFAFSVFWTYLWVAQYMLIWYSNLPEEIVYFRTRLDHYRWTFWIAFFLNFIIPFLVLMTRDAKRQFNILFFGGIVILCGHWLDSFNMIIPGTLTAHGNHWQLSWMEVGTTIGFLGGFLYVTFRSLAKAPLLRTKHPLMMESVQHAI
>MGYP000024922526 FL=0
MEDIYKLIDDINLQKIDNIDSRVNDALTSPNDDALFILGETLYNFGLMPQGLEVFRTLYHKYPDESELLIYFIEGLMAENQTDEALEYLSHVETSTEKLMLEADLYQQINMLEVAIDKLIEARDLEPNDPIIHFALAEILYYDGQYLRATHEYQTVLDTGEYEINGINLFARMADCSLQSGNYSDAIRLFDEISDEEMTSDDYFKKAIAYEKNDLSLEAIKIMTTLLTKNPDFLQGYYYLQQLYEHEKNYADAIEIGKEGLRLSQFYKELMVSTGSIEIEHGDANEGVALLKQALEVDNAYHEPLLLLADLFRSEEDYEALINLLQYVDEEDLDPVFTWHLAFAFGQEERDKEAQHFFELAYPTLKTQSAFLSDYYYYLLEIGDKNHAQQILNQLLELDPSNEIWHEETARLEN
>MGYP000184957940 FL=1
MLSDSLADGKAIHPRHIDIQQNQVWLFTRLLDGLPAAVGGEDLVLGGEVGFHGIDNAGLIVHYQQGRFQGDAPFHGVFFILP
>MGYP000054682017 FL=0
MHIHILGICGTFMGGLAALAREAGHRVTGCDAGVYPPMSDQLRALGIEALSRGAGHVTFVDTSPRALAAVRDPGVIDDKIELVGAHRRVAAGAVDDQIDATETDHQTAQRFAQARCVEHIDRQRQTARMRLLEGEQFSLHRGALRDARWIGLLEDPHRGDRVALADGRVLRDARRLEPDLAGLDAIAPV
>MGYP001618312234 FL=0
MMLHRIHPVVNPWHAQNCSRSTPSKRVSSPSQPWALCMAWAWPQAHSGPGAGQGRDLRRVSLYVTMSLLSLSLFGLGWTSDL
>MGYP003315070702 FL=1
MGDDIMGSSTFIPRWVKIDDNASIYNRKVSYLSGNNKIIERSFECKTQKNNQKLVVEIWDIEFVVTKFDENSIQIGDSAESIPCKARSPVLYLFVKFSNFNINYSFLKSQAHIKSLA
>MGYP001373614446 FL=0
RQVRVETTLPEIKTQDFSAASVAAIADPKLRRALDRVASGFEVARLARVADATPEVWDAWRQEARDIKAHTIEHLDYYLDLLHTNVTAAGGHLHFAKDAGQANEIVAQIARTRNVKVATKSKSMVSEELGLNPILEAVGVEVWETDLGEYIIQLAEETPSHLVAPALHKSKEDVAELFSEKLGIPYDEDIFHMAATAREVLRDKFMEADLGISGANFVIAETGTLVIITNEGNGRLCTSAPRIHIGITGMEKVIPSLQDLSIFLRLLPQSATGQRITSYVSMTTGPRRSDDEDGPEEFHLVLVDNGRSRMLADPALREALYCIRCGACLNICPVYARVGGHAYGWVYPGPIGAVVSPMLVGLKKAKELPQASSLCGACREVCPIKIDIPKMFLHLRNQTAESPDPNLRSAPIVERTMAKMYARLMSSPRLLGLFRKFGRALQLAEGMIPFSPLTKDGEWIRMAPLPPLSKWTRSRDLPTLPKQSFHEIWKKGLSRDDS
>MGYP000395248815 FL=0
NKSYTMYFTEINFTEIDFTEIYFTKIFLNYLVCILPPTIVQKGKSQK
>MGYP001502370584 FL=0
AAGSTEYTTGVETNGTPGNSGAYTRITVAADAPTLYYYCTNHSGMGSFVTIGANVQFNNDADPPNITITPKTDFTVGQRYALSYPSGVFTQTGAGGSFVGTGYTFTARNYSYQLWTWGDNEFGNLGLNAPETSRKSSPTQIPGLTWENSLSSSSQSKHSAVAKNDGTLWTWGRNDWGQLGQNSEVNYSSPVQIPGTTWAGPTATDSEGTTYATKSDGTMWAWGRNTMGNLGQNSTNTGYSSPVQVGSDTTWPTDLGSDDGVIKLATGSDNVFAIKTDNTLWSWGTNLTGQLGLNNTVKYSSPVQVPGSWKSIGDDGYTKFGVKTDGTAYYWGQSNDGYSGINLFEPKRSSPTQLHGGGTTWNHIAFGGTIALAVKTDGTMWGWGENTYGQAAIGNPDTFPQGTPGKSAPIQIGNQTNWKFVQSSASGGASPQFAGLKTDGTLWIWGLAPFGTAGNNTVTPGSAGYSSPVQIPGTDWKTVALSYGKVAATKQI
>MGYP001024040911 FL=0
LDIRLTPARNDAGRVVAIRDMGKAQFLQIQDQSGRVQVYAGNKTLGEDDYFVLRNLDLGDIIGIKGRPFRTKTGEASIHADELKILSKNLAPLPVVKEKDGETYDGISDIELRYRQRYIDLAVNAEARATFTLRSAILREIRDFLHRKGFMEVETPMMQAIASGAAARPFTTHHNALDIDLYMRIAPELYLKRLIVGGYEKVFEMNRNFR
>MGYP003311824185 FL=0
RLRIGEQEHLLELRRFTPWILLEFRAGFTMKIRGICRFYLLEKAPHMRLYMSPVNIDPENPALPISYPATYSMYLAKTQGRFSTLGLAEDTWALNERVLDEDAFLEQAYLVHEEREKMFLDAIEKTEQGLAVCVFDITDRVQHMFWRYLEKDHPSNVDKDVTRHKNAIFDLYERMDGLVGKVMKNISDDTVMLVMSDHGFKSFQRGVNLNSWLHQEGYLAVHSGPSGAEWFAEVDWERTRAYAVGLGGIYLNVRGREAQGIVD
>MGYP000397936239 FL=0
GVFAENHSLALGVFGNFGQRVANNTIGQADTILNVMRTWWKAVCLVTSTCLAASMNLT
>MGYP003982510387 FL=0
IKDAPNIQKWTNPISWPGLHLKNDDDIYAIPGNTIVRADGMMIRKDWLDAVGLDLPADNEVTLDEYTEILKRFTENDPDGNGEDDTYGMGVAASGGNMYLVFGWPFGVGRRATEDWWQKVDGEEFDYMPMKYAKNHENMIDALEYHQMLWDKSYVDKNWPSNNGTMRNDRVWSGVSGGRESFGGHVYGNWLPNIQKNFPEAE
>MGYP001965651419 FL=0
THARTHARTHARAHTHTHTQEGALLQVLCADMVERFQMFIFLLLVTVQNWAKDGRVSSHSFAWLQEWVQAILLVFASELGVLRASC
>MGYP001756801604 FL=0
YIFTGLRIGIGLSWLVIVAAEMLTGGVGIGFFIWDAWNSSRISDIILALVYVGVIGFLLDRLVAWAGRLITRGTTAAQRMRRVDRWLTDVHGPLLRRTPRPLAVDLGFGAEPVTAVEMAQRLRVQNPALELVGLEIDPARVARARERAGGLPGVTWAVGGFELPVPRPPTVVRAFNVLRQYREEDVPAIWSLLCAGLADDGVLVEGTCSEDGRRAAWVDLRRDGPASLTVALRLGSFARPSDVAARLPKVLIHRHVPGEPVHRLLAEADAAWAAHAPLAAYGTRQGGRARRVGRE
>MGYP001019934495 FL=1
MFLPVKRRGLLFILSSPSGAGKTTITRSLLERDDQLSISVSATTRAPRVGETDGKDYHFVSKEAFDQMVERHELLEHAKVFNNYYGTPLVPVEQALANSQDIIFDIDWQGTQQLKQKLVNDLVTIFILPPSKDELERRLRSRQQDDEDVIRERMKKASDEISHYSEYDYIIINHDLEKSILQARAILEAERCKRRRLTELPDFVRTLMQESI
>MGYP000405630647 FL=1
GYPSQVSPVVKTPSQRCKVNLSRTQQIPSRKLAQATKKEVTSFVFVTVLGSSVVTLI
>MGYP003603128023 FL=0
MSLNIAFIGLGAMGWHMASHLPKLGHPVWVWNRRAERASSRAKTVVAWAYEM
>MGYP001304718576 FL=1
MHCSRCGSREYFKNGKMNGKQRYRCKGCGYNFTNLHGRGYPPALRLYALKLYTENVGIRSIARLLGIDPSTIVHWVRDEGKKVMEQLKASIPDSLPEMDIIEIDEMWHYTQKNSANYGYGLLCLDSPDKSLPSKWDLVVQSHSKNSGNV
>MGYP001796365966 FL=0
MSQGRLKRRGTGFTAVPNSFLRDDSLSGDARMLFMLLSSHSENWVFRVPQIQKNLRYGKDRLRNAKNGLIKRGFLTLWQPKDENGSVIPGPWSWEICIDPALPISAGRKTAQADARPAETRIALKEQDQEDQVQEDYVDSAREPNLLDRLDAGLKTAT
>MGYP000859918013 FL=0
KGWTLDGNAVNGTNNSYSFTVTKAAEVKVSFESDSTPLPQYAVNFSVEGGNGTLKAKADGVAETATSPISVQKGKTVIFTAFPAAGYEVKEWQIFGTGAVFEAGTGTPANNTAQVNLKEGLTDLVVKVSFQVQTLTPKHKVTMSAGANGSISAEPALPAGGMVNENTTIVFTASPNSASYTVDAWTITGGQVLSGGSPGSSTAMVKITEPVTVAVSFKLKPPTTYTVSFGVAGTPPNGTISATYKTDGAAFTSGTAVAENTALVFTASPAAGYKVEKWTVNGTAVPGNTSNTYEHTVTQPADIRVTFVSSVTIPDTFTLPNGAEYKVTDKAQKLVIMTKRENNASGTVYTVNVKPEYSGITYTLTGFSESV
>MGYP003019047097 FL=0
EKYQSPVYKVLSVPIEKIVANSYNPNIVAPPEMKLLEVSIWEDGYTMPVYVIISPVSYTHLRAHETRSN
>MGYP001083449663 FL=1
MDDSAPIRDFEKLLRETIGLSMETVGASVIRHALKRRMTACAISDLHAYWAFVTSSPAERQELVDAVIVPETWFFRDREAFGAMVRHLRENRASCRPLKLLSLPCSTGEEPYSIAMALLDAGFPDGSFQIDAIDVSSRNLVHAERAIYGKNSFRGADIAFRDRYFEACNGGFRPHDIVRRHVRFRIGNVLSAAAQTGNEAYAVAFCRNLLIYFDRETQGAALNQLRQMLADDGLLLVGPAESGLPPLHGFNSTRVPRAFAFIKAEAAPVKPPEPPAARRPRPAPAKAAPLPRAQTAKASSAPRPFAQKTASAQPSAPSPDRVAASLAEIERAADAGHLAEVSAAAERHIAEFGPSPDAFYWLGLAHDAADAVEDAMRNYRKALYLAPDHQRALAQLRLLQQRQGDHGAAKALADRLDRLAKRSGT
>MGYP000234632724 FL=1
RDVERSRGLGDVYKRQIAGIATPTEASAIGAMGALIITFVNGKFSIDFIKEASEKTAIVSTMIFTILIGASIFSLIFRGVGGDELIDLIFGSLPGGPYMALIFVLLLVFLLGFILDFIEICYVIVPLVAPPLLMMGFDPVWLAILLAINLQTSFLTPPFGFSLFYLRGVADESIKTSDIYKGVIPFIFIQLLILALVLIFPFIVL
>MGYP001050647894 FL=0
MATTKNKKEGLARKRQSPMVLISPSFPWNFRVLPGDVAHLAVQKHREPAADGVSGAF
>MGYP001636256112 FL=0
MIFRPQGLEAKGLSAGTGRV
>MGYP001782636417 FL=1
MFVQGNAFRYGSDVDTDVIIPARYLNTSSAEELASHCMEDIDPDFVKRVKKGDVIVAEDNFGCGSSREHAPLAIKTSGVSLVIANSFARIFYRNAINIGLPILECPDAVKAIKAGDVVSCDLSTGVITDVTTGETFRAEPFPPFIQNIIDAGGLIASLASKED
>MGYP003367769974 FL=1
MDQSLNMVKIAYDALDDKLAEDIKIIDIRSISVLADYFIIADGNNKNQVQAMYRKNFLKLDMR
>MGYP003688882127 FL=0
EREREREREIEKNREREKEKEEKESEKEKEIERQRDIDSCDFDVFSDF
>MGYP003700002783 FL=1
MLPAFVLRAIEEGVSLQEILKEHNIYLAFAKLSGRVHGLTYADSSGYYLIIINENLSITAQYKTLLHELKHIIYDLPKMKYIVGKDMNSNIEKEADKIAEEWFKEIVKKLRKG
>MGYP000043255058 FL=0
MEFNYTVTDKVAIISWNMTTSPMNVLNDVSIPEFEQNVDKALADESLKGIIITSDKNEFIAGADVKMILKNADKDPKEIHKLSMDLNRLATRLERCGKPVVAAINGTALGGGYEICLGCHH
>MGYP001157010399 FL=0
MKSLRKQGIILFTILALVLVACGGDAAEEEVVEAKEDEPAAEEAPAEEESPAEEEVVEAK
>MGYP000411183089 FL=0
MSLTLREASKDTLQAENKTWHYYSLPLAARTLGDISRLPKSLKVLLENLLRWQDDDSVTAEDIQALAGWLKNALALIQISWPHESMGKRVIRLLVSKKDRRV
>MGYP000600471748 FL=1
MTTTRRLSLAYLALTAGVAVLFALNLFWGSVSLTPGAVAAALLGRGEDALAVGIVLQLRLPRAVMVVLLGAALSAAGYLLQTFFANPIAGPFVMGVSSGAKLAVALTMVVFLQQGLLTGSATLIIAAFAGSMAAMAFVLVVARRVPRMSILVICGIMIGYICSAVTDIVVTFAQDSNIVNLHNWSMGSFSGMTWENVLTAALIVLPCLALSFMLSKPMAAYQMGEAYAQSVGVSVRPFSVTLVLLSSLLAACVTAFAGPISFVGIAVPHLVKRTLRSAKPLHVLPGCVLGGAAFCLLCDLIARSIFAPTELSVSSVTAIFGAPVVILLLVRKQRREAAA
>MGYP000149143676 FL=1
MQFVEDYIVLTAVLSLWQRVNVYVTNSTQETFVIQVKKLCLLLNTLTFNTTMLTISSHTLSIIYYNDNTLDAVFD
>MGYP001584307752 FL=0
IREGRHDPVLYSVGPVPPGKDRNSHGVVVSWEGRSLRTVFSRMVSDSPVTILEERLLSEDGREMTVRNVSDRDGSETVQLYXXXXRQLSVEHGYQGRGINTSETVTDVYLRQAR
>MGYP001913057525 FL=0
YRCRDHGFEWPGQAYRIHSMGEPGSAEGMNAENPKHLILKAPHPSPLSAFRGFFGSRPFSKTNAFLEEHGIEPIDWQID
>MGYP003393519970 FL=0
ENALKALAKNIKGDRYDDAILSAPLPDNANAWKELVDVKALKKSLADQKAEQARLKELLGAIENREQLATERAQVQEECDRRLSSLSLWERLQKEKIEEPRLKKRLSELTKEKAQAEHTRVDARAKLDELSVKLFEQRTALNKEDERFNRLLRLMEQCVPPPSMEAQPSGPMAVPADAEDAIALYTKLTLSYKDMSREMDQLRSKIENVLKSDIIGATENETVRLMKEQIEGLPTFEEALRKDWDNYLHLLRANFANVLSGLSDIRNAAEKLNKRFGSVRVSNLESLRMDVLDQSDLVEPLKELAETDHTGLFDSSTKLDAAYQSFRNKLSERITLNYGDLFTLRFSVVIKGKTHSYDNLQVESHGTAITIKVLFNLLVLRSMLKEDPKTRAPLSNVPFFLDEIHSLDAANRGAVLRMARDLGFMAITAAPEPVSEVDALYFLRPINGRLVVRNELRVGVKYDAVEA
>MGYP000523383570 FL=0
MQIENNYGNDVYNGDIGFVAGIDLDEQELSVSFDGRTVRYAFGELNELVLCYATTIHKSQGSEYPAVVIPLSTQHYIMLKRNLVYTGITRGKRLVVLVDQKRALAIALKGEQLERRWSKLEERLREPGSIRYRPESLRHLDCPRSGRVHQALESGQVVAHPAEHPEIVSARLPLLVLRLPSYLRRSGVGFISLAHCYNITA
>MGYP002653935032 FL=0
NDALLREVGSDVKRGDPLASVGNSGGQGRPALYFELRRNGQPVNPASWLSAAR
>MGYP003551677296 FL=0
QDGMGIRFTGQYAEVLPGFRLDFSGRAGISDAGNFAANIDFQSSEPDASIKIDLGKFSPQLTDLSFEGNIGMSGSCQVTGSTVTSNAVLSTHNAKIEIPGRKMTLEGIDLNLNLQDLYQFHSAPDQVLKFKRFAWGDIEMNEGEVLFQIESLSSFFLQKSSFSWCGGHVYTHGLQITSGKREIDIICYCDRLKLATLLQQ
>MGYP000229859498 FL=0
MEKEVSFVYCNNNNNVVLFYVAELRPHGLLY
>MGYP001544784897 FL=0
MPVVEAARYQVHRLQRISPVSQAQLKAERATPLHTLDTLTVATKKGRLFREEAPVLRRLSAAQARPVLAALSPAQAEEFLAGYRTRIRAAYPAAPYGTVLPFRRVFVVARVKA
>MGYP001256815242 FL=0
MVPETQLRAFRPPLRTPASLYQRDAGWDLSHAQVRGLARHPDTHDLDKIKPIALSHSDKTYLIDNCCNDKV
>MGYP000824429490 FL=0
RMKGQKNVKDVGRQKGKHSKDQKKQKIKDVRNVIRHQL
>MGYP001586178734 FL=0
EQLAKGQARTKAYLASEQSCAAEELRADLVDASDVRVVLREAEGESFLLVADGEDELVEDLDAVLRGLDPLFQGHDRVELGVDDREQLAAEVIDQRYVEGAEELVAGEPSFDRGERGELESECARERAVRVRGVAGESVEDAGLVAGQGELVVRRENNRRLRFLAFENNLRG
>MGYP000104835098 FL=0
SLLIYIIHENIILMSLVERILPYERNLFLWLNDQHTSYWDVFMWIYSGKLVWLPLAIVAIGVFVYKIKWKEALLLLLCAVLVGVLCDYVSSSLIKPFFERLRPTHHPDFQNYVDTVRNYRGGKYGFISNHAANGFGIVAFISLLFRYKYYTITVLLWACITGYSRIYLGVHFVSDVVGGAIWGALVGISMYYVYLTSRRYILKVPKDELKIPVYTKVRAQILMCTIWVLVISIAIYS
>MGYP001657250507 FL=0
MQTKQTLLKTKRINNKQTKKLEDQLXRLFIHLSLSQSYXVSLLAQLQRMKQSKKILFLNQXKVLMEXKMLHIMX
>MGYP003575916264 FL=0
VLLVIAGMFLTWRFMIGGLWLGLAGNSRVLAFSAAPYVILPLFVLPAILIMEQPIMDWIAENSRRLLPPLVWIAAAGVVIKFWLAAFSWRKIEPRYVRRYLPVWLGGAVCLTVLAFMLGVLLSLFLPEDTYRL
>MGYP002282927298 FL=0
MEWTSGVSAVAFKSSLRSVPGSSAANGTSFSVFGHDDSSRGSMDRGAGSGPGSRADSPVEFRFHDHFDFQRQIGRSPTSEAWLVRSKQSNKPYCVKKVTAKFRTPAERSRYIHEVEAVCFLPPHANVVKYYRAWQEHRHFYAQM
>MGYP001843998727 FL=0
MLLTMSLDSTWRDGKKVRWFAVQATNKTQRNKFTQDCYYSHAQGSQEKWARDXMXSRKSRMCVWQTSNKIIAGDRSCHLRHQRPQPADGEISHSAQLKATDQPIIVKRTVLX
>MGYP000291769357 FL=1
SAGGADRCAESGVNMSNDRTIGFIGAGNMAEAMIRGLLRGGDFAIAQIAASGPREERMRELRDTYGIYATTDNKVPAASEIVVLSVKPQILSRVLDDVLEYGGDYSIDRFEVGKTPLDPSYARLTVTADTEEDLARLVMRLQTHGVNLTDPGELTVREVEQDGVFPDDFYSTTNLETVVRTGGHWVPVENPEMDCGILVEGDDEHPRARTIAVSDVKRGDRIVCGASGVKVVPLPAIDRSVGGFEFMNSEVSSEKPQALLVRQIAQQMREIKAEGRKVLWVGGPAVVHTGAAPAMVALVEAGYVDVLFAGNALATHDIEAALFGT
>MGYP001585133350 FL=0
MFSCSFIDKLPIRILSDVKESFLNLGMMCKXKXFKRSYXLHKTTSIWNXIFQSSNRILX
>MGYP003587374593 FL=0
LNDLSFSELAHKRISLIHQSAIRLLNLINKILDFRKAETRNMLLKISQGYLSKLIREIGLKYKELNRNENITLQIVLESDEQPIRVDEEKVYIIVDNLLSNAFKYTQKGEIVLTLRTIYKQKTAWAEIEVRDTGNGIPVSRQAAVFEAFSQADDSTTRRYGGTGLGLTICTHLVQMMGGRVWLESVEGEGSCFYFTARFGVDSSSSAISSVLQFGDLRVLLIESNPAVAAQLSAFLAQLGVQVTHMAASEAAVDAIEKSRSLGFPFDCVLADIKMAPPGGMDLAESWHGYDHSEKLIMVMDSEEQRRHMSKLRGLGVD
>MGYP003618342538 FL=0
MEHLFDHAASSTPLDDLLKQLHLTDPSSAIPQDDAFSSLLSDANMVAPPHDADWNAPTFDAAQHESPFDPTNWQDPAHLSSEDMLTSAFET
>MGYP003539180734 FL=0
LLACVFSLSLVFAVACEEEETEEVVFAPTYTYTDYTQDTDALITNGDFTKGLAEKTEKDFPVSSIGSWNVGADTNSDASVVTNGVISVSDNGWKELMGTFHGVSNFKSWAEKTFNGNNKIDTKEAFQDFMVGQNGLKNPGKASGTTLNDDKVLMLANFTNSTTVDGRGTAMKASSTSTISIAKGKMA
>MGYP000164259871 FL=0
QIPKGYESRLRYEKFPKKSVDTHATNRKADEAP
>MGYP001127871448 FL=1
MQAPTKYALVINLKTAKALGLAVPPSLLGRADKLIE
>MGYP001811598644 FL=0
MTWMCAGLEPLLEDIQQPPLLSGRPVQHTNLWMCSRCVLQAVAGAAGVGLCXAAPCKSXKVX
>MGYP003351460088 FL=0
MTDLGTGAGRLAWPPPASLLPWRQPVKFPGVAAPEFRRGRRGDPANPRLHQPRDFRVFGRELAYRPVGSEQHLVLRDRLRVLHDQRVDVVRGVAAQVHPHVGLVDDHCESVLVPREGRVREDDLQVGEVRGDVVEIFPAYEEERAIRVEFFGDEIESISEIDPLRGVRIQKIPRITIYPGSHYVTTVENRKRAVDSIRIELQQRLQERALALISIAHPKYRADLLKRSEEHTSELQSRVDIS
>MGYP002526488509 FL=0
MAGNVDNRVVQLTFENRQFERNIAKSKKSLDELKASMNFDETSKGLNKFAEGMDKLSFSHLEDNIQKLTDKFTGLGTATELVVSQIRRKIEEAARSMSGFVESMTTQQIGVGKDKYDMLNKSVRTIMNATGKEEKEVLAVMERLNNRRSE
>MGYP001359237027 FL=0
NSVNNQFTPLFQDEIKPGCRIISNTTFENLNNFRINLDIHDSKKWNKNIIYGELRNGYRIAERYKTQQYATFEIINKNDGSICTLQAKVRISGDAADHINLEKFQASIDVELIDENIFGYTDFKLFLPETRNNENEIFVTTLLRHLNYLAPNTFFIDIFVNDQKVKYLFQEKINK
>MGYP000346659406 FL=0
MGTRIGSIHANVTAKDLSWSDTMRRVREETKRTADLLQGISDRGGGLGSLGSIMPTIDIGNVINRSIGLVTDAYRQLSEAREKAEIKADKADVLGLSMADLQGLSVGAALANTDIETVTGATDKRGTEVHFWADEAIFSHVEFHYDILAKRIRELSFLNNGVHIKL
>MGYP002611241135 FL=0
SPATPLGSKRRFIRVPSNNFVWHILGGSNAVMGFISSTSAWMEVPFMLLCGFLLTKYSCASLLRISSFFYILKPSILLLASSIPMVALGQYMQGPSYAIFTIASVYYMNHMVDIKDNAKAQALLGICTKGLSGIVANLVSGIMLDRFGINGMLGFCMACTICGFCVIQVMTLQKEKGR
>MGYP001764798971 FL=1
MSATPVLPRHAANAAGLIARPAWKGRLDWRGLLGWLRDDRLISAEDEQRVTQRFGAGASSQHALVRLGGAGLKRAGTQQPLDTEALTEWLAARCRLPYLRIDPLKADVGRVADVMSVHYAESRCALPLQLNNTEVVIATSEPFDAGWVGEIEAHTRRSVKLVLANPQDVRKYTTEFYALAKSVRAAQKTGEVSPAASFEQLVELGKTAKQLDANDQGVVQVVDWLWQYAFDQRASDIHLEPRREMGAIRFRIDGVLHTVYQVPLGVMNAMVSRIKLLGRMDVVEKRRPLDGRIKTKRPDTADKIGAEVEMRLSTLPTAFGEKLVMRIFDPETAVKSIEALGFGAHDTARWQELIARPHGIILVTGPTGSGKTTTLYSTLKTLATDEVNVCTIEDPIEMIEPAFNQTQVHAAIDMGFAEGLRALMRQDPDIIMVGEIRDLATAEMAIQAALTGHLVFSTLHTNDAASAITRLADLGVPSYLISATVIGVLAQRLTRMLCPACKQRDEDTTRETLDELAKPWRLSGGVRPYKPVGCLECRHTGYRGRVGLYELLVMTDGARAAVHPALDATALRRQAVKDGMRALRLAGAMKVAEGLTTVEEVLRSTPSLDVRA
>MGYP000601219188 FL=0
GGGLFYMYYVETRSHYVAWAGLELLASSDPPTSASQNAGIIGLSHQAGPGYSKYIIILRSIHHLDHSLTIYFYFPVIVLISWVRHSSLDI
>MGYP000591043049 FL=1
LARGVARALWLPGLSLSPLRIPFCEFSQIYIYSNALYKQVIYGQRPDHNTGNYVPYSLR
>MGYP003318478948 FL=1
MIYLFLANGFEECEALCPLDLMRRAKIEVTTVGVGGKYIEGAHGITVCADITDAELCDDAPDGVILPGGMPGTLNLDACAAVHKALDAPEKRGALICAICAAPSVLGKRGYLRGKQAVCFPSFEEYLDGAILQPKGIKVVTDGKIITAVGMGAAVEFGLALVRVLKGDEAANALCSAILAD
>MGYP004071202169 FL=1
MIVLSAINEPKRYAPLSPKKIFALGKLNNKIDNKIIIWAINIKEISVFALIRLIYTKTKLIIIRLITSKPLKPSIKFAPLTMNKKHRRTKITENISLFVKEIKKGISIFVILIGKKNIMELKKKIINNSLLKGLILNLRSSRNPIKNIE
>MGYP003151139587 FL=0
MDVEQTEEAVAEAPPAEIVDQAQINEWLDDKLGPAEPEVTEEPEATEEPEPEPAAAEPETPEPETPRVSKAFSKVAKKEREVQQQKQELNKEKEKLKPLQEAQAAADRGDMLGALEKVGWTYEAATNSVLQDGKLQTPKAEPAALTPEVEGRLAKLETMERQKQIDNYVNRMKTKVEGDERFELVKDNWDNAWPTILEMQKIVAQETGTIKQDEEILQEVENFYEQQAQKLAKSGKFKNLLQPDAGPPEKP
>MGYP004197989809 FL=0
FHVKSEKIEISQKNHLKHDLN
>MGYP001807843292 FL=0
MCVKEHKEHNTRRTVYARCVCVCVCVCVCVCVCVC
>MGYP000196272724 FL=1
MALRICSQLTVGGFVPTIMVLGSATEVDRIKPIQPLGTFIFIVFIYLFIYFLRRSLTLSPRLECNGTISAHHNLHLPSSSN
>MGYP000647749030 FL=0
MEVGAEGDPITFAERRTMSVAGRKIIAGS
>MGYP000363977344 FL=1
VQHDRNCSRNVSPNRMCLCVFPKGTQMVRMGPDSIGICRGSVKIDVSTMRNPGDALPNIAPKSNVSDNRNENRSKQHIYSTYLNSTRGQNIKSGTGGTLFFSGNFAPGVDFGRPDAHNHQGMISRDTSLQNRPWEPTQGRKPTLFIQIISTSFLF
>MGYP001764752421 FL=0
MFENLSERLEKSFKLLKGQGRITEINIAETLKEVRRALLDADVNFKIAKQFTDNVKQKAIGQEVLKSVNPSQMMVKIVHDELVELMGGD
>MGYP003108819162 FL=1
MACFHPLEDFDFINRILPKISFFGGLDDEQLAYIFSRLESAEFSQGEIIGRPGTVPSHIHVIQEGAVDLLISHDQRLVRKRQFTVGDCFGEAALLSLINDTATFTAAGPTSVASLSRLQLLRLHSEKPDIFLQLVLNMARDLARKLQYSDELLLRR
>MGYP001799047598 FL=1
MYSLYIPVVDSFYVYCIQEAEAAQASTEDDSYEQEIEEATSQEIETDDQVFH
>MGYP000061367530 FL=1
MGSTYTRQSSTEIVDGEVIAASDFNNEFAQLVSAFASSTGHTHDGTTAEGGPITKLLGTAITIGDGSSGTDIAVTFDGETSDGVLTWMEDEDYFKFSDDVLIVDDEKDLREIIRYNLEQEGINSIQASNGDKAIESLSQNPSLI
>MGYP003345690776 FL=1
MRNFLKSHFWVLAGCFLFYSVHADQHGTTERILFDGQSLDNWEKTDYAGGGEVRLDGKGGVVLEFGIALTGIHWIGEKVPRCNYEISWSAKKVSGTDFFGSLTFPYLNEHATLVLGGWGGALVGISCLDGFDASENQTATAHLFNTNQWYRCVLRVTEAHFKFWVDQEKLIDCDIQGRTISMRTGEIELSKPLGFSTFDTTGLIKDVRLSSLVP
>MGYP000806452421 FL=1
MEEKVDIVALGELLIDFTEAGHSQGGRKLFEQNPGGAPANLLTVASHFGYRTSFIGKVGNDMHGKFLKRTLQTEGINTDAIVEDPDYFTTLAFVEIGENGERNFSFARKPGADTRMEKEEIDVDILDKTHIFHVGSLSVSYTHLTLPTILRV
>MGYP001393538896 FL=1
MKCKDCRKQFSVTGNKRIIYELRGDMACVHVICDVRRDLRALLLRRLVEAPRSPGP
>MGYP003366091699 FL=0
LRMSRGLGDVYKRQPLASGAKAADQAEIDIIIAELSALAAQYTE
>MGYP001054490991 FL=0
RRLGHGELKLGGGNGGRGDGAPALMCSPRFKRLR
>MGYP004024396583 FL=0
MITLILHYXSNRFKIFLFLKYLFHQIXFVMXTRLVXTRLGLIXQCHCFCLVLSGIYMRKMGTSILYGTNRHLRCRLWPKKKKIVTCMTVGLVSCGYFGTIALQADMFI
>MGYP001796939300 FL=0
FDTVTIKDIAKALNFSTSTVSRALRGSYEISAETKKLVLEYAEKINYRPNPVALSLKERRSRAIGVVVSEIANNFFSQAIDGIESIAYNRGYHVIITQSHESEAREKVNVQHQASISVDGLLISLSSETVDLSYLKELHDKGFPIVFFDRITDEIETHKVTANNYLGALQATEH
>MGYP000574954487 FL=0
MKKFSLITLLLITVGFSSCTQEDSTFLEEPTAQVLLKSFTLNKSTSGDYSLDYQLNNGAASDNVLDAKTNTSNIYLYSSENVSKSIKNEGIALKDGELRISFNDTEKHKKHSITVLDEEIKASRSEDDTDLGYLNSYSVTTNNDGTFTLDFKVNEWVVVDYIFDLCDGYQYSDSRTSGKANTHATPRKTKGR
>MGYP001104094517 FL=0
TVFGEEYKNVISSLTDWKMYGFFKINGTIGLKYFDNKVVTLDYKNKKIAVSNNALDYSRLQNEKYTVLPLIKSNLSNEQDLLFFEGDVNGEKSTIYLDTGSSRSFYNLDGTREEIEVKLGEKAYTFNSNKFRHDEIGFKDTFKYPLKLAINSDLLKANHFIIVVDKQKKVVFFRFI
>MGYP004251094059 FL=0
MNQLIIRTKIICTFTCNPIKRFRYAQVIITKIFKNINAKSKK
>MGYP001561011533 FL=0
LTLLRFANDDIKMRELGNSIIDEIVNDANVPHEQHLIIEQDREDIMNLTKKAHS
>MGYP003626153934 FL=1
MPAVHAPRLLMIGAGGHARVCLDVMVDNDDVAIVGAVSAEGVVSEPLGVPLLGTDAQLRELTQSYAVTTFCVSIGSNPIRQAFGELLTQSGRHVTRIISRSAVISRSAKLGDGVQIMPAAVITAATVLGDGTIVNTNASVDHNCRVGRFVHIGPGAVIGGDVTIGSRAFIGLGSRILPGVTIGADAIVGAGAVVLSDVPAGATVVGVPARIIKSKSAQQ
>MGYP003586072608 FL=0
PLFTIAQIVAAHIGSTPGVLRVLASSFILISLSSIFFGLFCVXXRSPGLCQKNLXNTWCTASVCGSSGEVRARKRLQICPKTIAKVCNRFWADFLCXLFPFAVSHRVKEVRKRLFSCAWALFSEKPFFESDRIRSGXKNMX
>MGYP003337571193 FL=1
MSKITDLIVPNIGDFKNVEIIEILTKPEQNINKNDGLITLESDKSSVEVPSQFSGKIKNIKVKIGDRVSQGDIIGQIELTADEKIEERIIKNRSNHDLTTEVFSKKKELQTIAISPNKDENNFVKSASPKIKKYARELGVDLQLVNGSARKGRIVEEDVKQFIKNTLNTKIIKEEVIKNIETKEEKLPFEHEEFGEIDIQKIPRIKRLSGPHLVKAWNEIPHVTQFDEVDVTDMEYFRKNLIDLNTKEKITITPLAFIMKALVNAMKKYPNFNCSLETINENIIYKKYFHIGIAVDTPHGLMVPKIRNVDQKNLLTLSNELRRISKLSKELKIDKKEFFGGSMTISSLGGIGGSFFTPIINSPEVAIIGIGKTETKQIFIDGKFISRAMMPISLSYDHRIIDGAEAARFCQDLKTSLGKNFAFKIGRAHV
>MGYP002417791626 FL=1
MLKMEESKININRIHFLYEALAKRHASPEETYHAILNEGLKAFNLSLGIISQIEGERYSLLAVSPTRGDISAGMVFELKDTYCQRVVSENRIISVEHAGEHPGFNNHPVYIGMRLESYISAPIWVRENLWGTLNFSSTQVRAISFSEDDYEFISLMAEGIGSLIEMNLLISENENVISALRKNNDILESIFENSTIGMALVAPSGQWMKVNSSLTRMLGYTEDHLLSINFQNITHPDDLTTDLKQLEALSQGNIPFYQLEKRYLTASGHYIWILLSVSLVREDNGDVKYYIAQIQSIDERKKMEMELKNQKEALHKVNIILERMATEDSLTEIANRRKFMLWFESEITRMARHPVPVSLAIADIDFFKSYNDDYGHQEGDFALQNIARALSHPLRSQDKIARFGGEEFIMLFPETDEKGCLLACERLRKRVENLTSLRRTVTISIGAVTCHPKEGELVHFDDLLKVADSKLYEAKRSGRNQVKVTSLEDHQE
>MGYP003123586391 FL=0
VWGRWLRRRLRKDRGEQLLSIVRSLDYAMNNTSLILLFEVGDTKLLFPGDAQYENWMYALGQDWVKKLLEGVDVYKVGHHGSLNASPRSMLDLFEKKRSRTDDPEKVMHSLLSTMHGVHGSVSSRTEVPRKTLVKTLEDETQLTATSDFGGEISHTVTLPL
>MGYP003322783177 FL=0
MLSNVNDIDEEKLKTISNNQYAIVKTEDLNNIKDENRIIFAIGDLHNKINNPDLKIIILGNVFVETEDFTSTEGIQSISGSLYIQSKGGLETPNLESVYGNIYIDDSLFTQIYVKEIYGEINIKNSIKTYILADNAYGKIKCNKSVDTQLD
>MGYP000483552797 FL=0
GRPVAVPDLPGLPEAVSEAMTITLNPIGVIRSPHLAAPGTPIQPAFAQQYEGHVLVNNEFEAALADIEGFERLWLIYLFDRAGRYKPRVVPYRDTREHGLFATRSPCRPNPIGLSVVRLLGREHNMLRIAGVDILDGSPLLDIKPYVPSFDAHPSSMAGWLDERREDRTEADSRFHGENGPETAHDGAARHGKTTVKP
>MGYP002514261527 FL=0
SRVTRDLPANEVAVGTTCRVLRKIGEKDREYYFRDKKIKL
>MGYP003501294569 FL=0
NEEAYELTVKTGKMTYFSRSRNEIWVKGLTSGHFQYLMSMEIDCDNDTLLAKVRQVGAACHTGERSCFYRNLMSREYANTNPLKVFSDVMATILDRKENPKEGSYTNYLFEKGIDKILKKVGEEATEIIIAAKNPDKEEIKYEVADFLYHVMVLMAVKDVTWDEIITELARR
>MGYP001567805989 FL=1
MNATITTIIISFAVLPILVLSYQLGTPSIGESAVGEYLKQPALTTFALAKKQESKEVLPRRRPEIADLVVDSSEALAWDSKQNVTLFSKNSEVTRPIASLTKLITAAVVLDYTQPRETVAVSLKAIRTEGNSGNLKEGEVLTVYDLIAAALLESSNDAAYALAEYTGNKIISNQETPPDPVKTFVRSMNQKFNDLGLVHTNFTDPSGLADKTSFSTAEDFSRFIKYLRDNQRYLPIWEILKMNTYTTESQNGVSAHEFRNTNPFLAELSGVIGGKTGYTPAALGNMALVMSGPNGTEIIYLVLGSADRFGDIRKMVGWVSEAWVWPAPM
>MGYP003352111790 FL=1
MREWNLEEIKMNKAQSKENIFLLKGWKGVVVLYTVMIATAAITIGIAQFGGGVLSP
>MGYP002236981273 FL=0
DNNRKEINEARRDFENSFFNMLNLLQVKIKDMRVVNKITKEVHAEDVGYSFISLSHSEVKYCKEITLEYLKRIINESWTEWPKQSANNICNIFIAAHRIYLIIIDFCLIHLSLLMSLKLVMLIKKRYANILGRKISNYELLMLFYNCLSEDGRKFQYYFEKYEILDNLPIIKMAYKNHVLLVNKKCWGDNKQALELINGE
>MGYP001471266083 FL=0
MNVFCALRSLPHIMSIGILSQKTLFLIMLTSSTNLNFMIKDHPIFLESIRYIRSNLEANDFNYLEKKVLERLVHSSGDFSIQNLVNFSEGACEKGLQALKNGAPILTDTDMAAAAIKSMAENTTRNKVFTASMWFGE
>MGYP000742235348 FL=0
MAQATESRSSSSSQPNIQDVFLNYARRERLPVTLHLL
>MGYP001188259027 FL=0
EQYGLDHDNFIGSTVQKNNLELDASIVWHATDYLDITLEAANLLNEALVLRQPKAGNIVHSVDEFGTRYFVGASIRF
>MGYP004019405559 FL=0
MKLQNYFPYFSLFKFSIYFLISSIYLLDMSVYISVSIIEKIIIDSPKATPYVMELFAISLANSFGLKPIKRIKEK
>MGYP000810644476 FL=0
MTVAEDGSVTVADETLTTLRVPQGVAWMAQPVLRSVNGGDAAENRYPMEPNGTVALVPDTVGPTGGLYLYGVPGADLESKTYQWNGSKVTLCAVYTDVNGKKVDASVFTYKKGNTLFFYFPVTIGGEAKEIEITDLDVPTHGQPLDRTATASVGTVTKVRYEMLRKEINEVSKGDNISVGVQVKIPKGFTFADGSYAVWNGQTSEYRIRTSSMGSDEYLYVF
>MGYP000110014348 FL=0
LLRKNELSSCIPLAKSIISLGTSGFIMQLTNSLVSICCNHVLSVTGGDVYVSVMTIVSSVRQMVETPIYAINEGTSPILSYNYGAQRPKKVKKAICVLTCMILIYTAITWSVIIFEPEFLIGIFSTDRELLADCVGALKLYFAAFIFMDLQYIGQTVFKSLNKKKQ
>MGYP000289551974 FL=0
KRNCAKAGIQQEIRKREHYEKPSVRRKKKAEAARRKNAKK
>MGYP000993698250 FL=0
LTVHVDKRPDLESHTMTNLLVEDEKLENLVQETGVPNLFVVPSDTSLAGVEQVLANRIGRETILREALEVFPAGKEFDFVLFDCPPSLGVLSANALVAADFVVIPMQAEYLSLQGMAKLLEVIQLVQKRLNPQLQIACVLPCMLDARTNLSTEVLREIDAHFGSLLAKTRIRNNVKLAEAPSFGRTIFEHAPDSNGARDYEAFGAEFLAMILVLVYVGAVAVLFLFVVMMLDVDFVELRQGMLNYLPVG
>MGYP002735085997 FL=0
EDAFGFVNAECRYPENGANWTEEVFQNYGGTLKWISYNSGVGIPEPEPDITGKCGDNVTWGFVERSGKLTLSGTGATWDYGSYGPEEFKSFRDRVRVIEVKPGVTDLGTSLFVFCENAEKVILHEGLKTIDMFTFQRCDSLTELIVPESVTYIESAAFRDCPSLVSVRLPSHFTRIPDVLL
>MGYP001200674681 FL=0
NGWIITIVLINLLGCLWLLWWTRKRPEDTIKEGESLGHSFDGIEELNNPLPHWWLNLFYFTIAFAFIYLTLYPGWGDAKGILGWTSVGQWETEVEKAENRYDRLFEEYAQVPVEQLAGNEEVVKTGQRLFGNNCAICHGSDARGNVGYPNLADDDWLYGGQPENIKTSIVQGRNGIMNPWGDVIGEEGVVASANYVLKLSGRDHDAGQAAE
>MGYP003380670323 FL=0
MKKRYXQSAXYGCASRXAHKNYXLIREMVIQYRPSGXWRKGKMVQPHFEXLHQPARFHARETERXXGYRKDPMDRQSLXQFLLLXSIHGKIPXRRXYXISILSDSPTNIMXELLGIRKRXIYLPTGKVNVFCCSWNVPIXKQPYGXTDKRQECRIVFVFPINMIXPIMSVPENVLSLSGWIIVSKKSMSDRIRTAXPTRPKETGTALXDASVCKRLRKHISMIFKYIRNRNKTGTCQSRHQRYRHCKSKIISRELQYGXKHIVPAIQQEIKLNKGVTETEMVLPMGNDMLLWDEFHPALYKLKAEVTNGKKLRXKKYNSVCADLKSKVNGFMXTGAKPSFAEQLKTVTSRXPVTPRWMXKVGNGYSVSVAVMDXITCVSIHSVLPKPLLWLPTGXDSICNPKVRAGPIMVPNXVWDNLLTNIXWTKPSHXPKNMATMLLIACWHAETNLADAGXNGXPSSXNIGKRRIPDMYIPEHRXATDGNGNLATNIMXRLGHVAXPGPRNNRPPKTTIVSKIILTPXDSPTYPMKQVNGALSPISMKYVNIQASIKPRTSRFSKTFWLTTTXATKPIYLXWPAESCKPFVTNMKXKRHSARPIMPVSNYWHXTIIRVRELHWXVFSMFSLKKKDISTLQNGDVSAHLQFHXCVQINLYIITRKFXRRILKSLILVPRHXNKQKLYIRXKTNMAKYMRKAHWQHKTFLSEIXIAQVALSFRLLISKRLKAESGNTHYGNRSCKXLEFLGLSRPSDNSRRKSIHYRHLGFESPGNSSEWWKCAYYSCGQSELWXRSGPAIHSCILEHLLVQNASSSYHRYLSEPQTPVIPSVSDRISQQSAMVGTAESCSSDAIHPLSTRFPTYGSKHRHLVYKPQDRYVIRSQCIKWESAHDKHGHYLPARETHCSPSDAXSHFGLYEFGPVPSAIYCNASTNQXVVHKTAGDIX
>MGYP001753171793 FL=0
EMTSSLVGSEMCIRDSDRLLSLLGLARRAGRLSLGNDPVLSSMEEGKAKLVLVCPDLSQRTLKGIESRAEAFGVPLVTIEQTMDQVSMSLGKRCGVLALNDEGFARKALTLTKTNGEDLII
>MGYP001606986961 FL=0
MKSQEKNCIIIHGCPSDAEKAMNPETRTYDKHWIPWLKRNLVAARIKTDFPFYMQIVNRWVKIEPAVWNLFYRNNGAKVNFSGQIFQAVQYGLNPETEQIDYDQVATLAQEHRPKVIVAGA
>MGYP001452258850 FL=0
MHDKKIVNERLISSTVEITKEAGEAITEIYNSDFDYQLKKDLSPITAADNLSHNIIVERLESLTPEIPILSEENCDIPYKIRTQWTKYWLVDPLDGTKEFIKKNGEFTVNIALIEKDTPVFGVVYAPAIDLLFWGSMQLGAWRKNAQESEKRISISTQTSKKIKIAGSRSHPSEKMKSFLSQFVDYELQPMGSSLKICLVADGTVHLYPRLGPTMEWDTAAAHAILQSAGG
>MGYP000432580839 FL=0
GYAFFGSHRIGESYRTGLDGVYYLTAAGVLAKYRSSTEMLRRLVLSAMKELAARSPLGRIETIMSEKDPKLRRIFESLGFETTARYRSFIKRP
>MGYP001553361461 FL=0
GPRHRRRRISEGPQGPHPVIDGRRMTAFCSNDYLGLASHPQLVTALKRGAERYGVGSGAAHLVTGHSGAHHALEQELADFLGRPRALLFSTGYMANLGVISALAGRGDLVLEDRLNHASLLDGATLSRARLIRYAHGDAAALAAALEGDAGGECLVATDGVFSMDGDLAPLPDLARAARERGAWLMVDDAHGLG
>MGYP000983384177 FL=0
MKGKILGVNGDGSGGVILGDDNKRYNFTQEEMKNSSNPEVNQSVDFNADGRDAKDVYTVASGLFDVSQLKIPSFSIGDNFQVVILSLLVLFFAFTYYKNSKIEEAFVEFIATQEEYKITFEDYDCSGLFSTDCTLENIEFTTGGVLDFEAESLEISNIYELGTFDQSYRKSKIPFSVEIEGIKFAERIQETYFKSFVNNGGFISAREKELSEEVYNYLIDSLDSDTITLDGKLEVANKKLNRLEIIELSYDNDILPISIDMKVDNLGEEKRIVRNVTLRLSSENLL
>MGYP003554407810 FL=0
ILCFVTRLLMGLCVGLVYGAMAKACKNATANCFVASLSAPLLNTLFFMGYIVLAFYNCDYVQNLVSVKGAANPLMFVVLLVGVQGVAEFLVSGILGGIVARAVHKFLK
>MGYP003431497335 FL=1
MHQQVSLELLEILEIGCSKSNPASAGHLKLKHED
>MGYP002928876319 FL=0
ALHVMDEANRCLQCKVPQCQKGCPINTNIPMAIRLLKENKLNEAGKMLFENNPLTTGAVSSAIMRTSVKVTVYLDCLLYTSDAADDKA
>MGYP003442291329 FL=0
RDNTMNTINAYYEYSIDMQPNMSIGQNYITDIRTSKQTFPNGSTTGARWIQFKIPVAQPENTIGNISDFRSIRFMRMFMTGFSDAVTVRFGALDLVRGDWRRYTNTLDPNDTNPTDDKTHCDESTPPDYGVPEYTAATRPAPVRLEAAH
>MGYP000852449644 FL=0
AINFKFSLSPLLDSTKSQVTVFINGIYAGTTKLKTVPGRKMNFKVKIPPQARDRQLLEVAVRYYLDTEQQVNLDCGRRDYDKAWFIIHGDSWLDYKHRDKNVFYLSDLPGPYLLRKKVNLPLFVMPDQPTAADLTALERLSMSMGQLMPKNENWFSVKKASQITKEDLKTNHLIVIGLAERQ
>MGYP000542208118 FL=0
HTTAAALPMMRKAGWGRVVNIASAHGLTASPFKGAYVAAKHGIVGMTKVVALETAREPITCNAICPGYVLTPLVEAQIPDTAKEYNMTEEEVVEQVILQRQPSKEFATVEQIGGTAVFLCSDAAAQITGTTISVDGGWTAL
>MGYP001017409220 FL=0
ACRTTRAITRRSNPRTSRASNKMTSSSMAVFGQVNLMVLVARRSFRQHLLDDELGNIGAVGLLMVHRADRPVAHIANRPAMRFRRAVAAVLGGAGFAAIQPAVQLGQGAGGDHGMHHVLQVGGLLDGERLRVRDRLFAVDQIGRQGLGGADRGGLGRQRHRGYQHLALTDGVGCHGDRVVGRRHGTVEGVEAGVEIHAHAQACGRCGQLTGCEIPGLVHEGGVAGLLEGGAQRDLADELGRIAVVVAEYPAVDLGGL
>MGYP001607760096 FL=0
MSDTGTEAPGGATHFTVSKGNLDLFDYTRACEEDRKSPNCK
>MGYP003410680479 FL=0
MKNNLLKYGLFTFSLAFAISCGTPKANLTAIQKDPIAQRVDSVLKLMTLEEKVGQMNQYNGFYDVTGPAPSEGEASKKYENIKKGLVGSMLNIRGAKEVRAMQKIAVEETRLGIPMLFGFDVVHGYKTVSPIPLAEAASWDLEAMKKSAEIAAAEAAAAGLNWTFAPMVDITRD
>MGYP000424193527 FL=0
CDSVVISSFVRTGYTTRRTRLIKHVIPPGLLGLVGCQIENVEPVISTFL
>MGYP001346217960 FL=1
MGDAFKALADPTRRRILELLAQGDLTAGEIAAHFDMTKPSVSHHLNILRSAALITDERGGQNIVYSVNLTVFQELMKWFYDCGLVKGDDSNEKE
>MGYP003339884708 FL=0
MSVSKFRFVSPGVQVAEIDNSQLPRLPSAMGPVIIGRSL
>MGYP003507622094 FL=0
VELSADDGDPTEPDHALVWMSASEALSKMRHEAHAWAILHWLRGRRGV
>MGYP003457963375 FL=0
RSSETRAALASSGVPRGVYAGKKPEKLLLDPGFVITQANLAEKQEEMWGFTVWKKQNG
>MGYP002508125824 FL=1
MRAGCNPGGGIGVPRDNSVSTGSVRVLSRSESSWIWAEKSLSAFTAGSFWSSVSTDTGAGIPEEEREQIFKPFTRVRNLAEGDGLGLPICAFINALGESSVA
>MGYP003488338009 FL=1
MDHVWLRNPPRPSGPDRGPPRTLNELHYDQLMLRLKFVEKIEKELGHKGLAAKGSIEEIMSADFNQEFEVEREHVPGKIASCWEVCYWVRTNYGNRHMEVLLTGELLRFSDDVVKLKEKFAKQDSAFAYSGR
>MGYP003140940673 FL=0
MSASGPAGQDGGGSKESNKKARKDLEVSAYEREIEKQNKLKSQKQLTT
>MGYP003132782948 FL=1
MASAPPTGFVLKAYLTEANARADSNALQVTTNTAYLINKEQDANYNFFTHIEYYFRIEANDPVIEFYIDWDDGENNDPKGKANFSLIKLDTPNNIAITSHIFTRDKLHFPKIRVKSVDGFLSKFYQAAGDDTFEGIDVLAVGDALIDEGRNDRYRLENDKTNAERIPILAPTPRPPVGILKADKKRVFAGITNKYLAGVGGTYDGVTCRLIGSHALMDTTRDNVKVKVTYYAGGADQNDLGNTGSGELIETEMSITTTPTISNVLSVVKMELVDLRENTSENQADIADGTASSFNTSRLFAGEKMILVVDGSSAYQNDTPSVIGEVSMGNPILVLDDPKFSVSLDATESFCRSPEQTIDEYKIWDGDYVTNHGFDENTALFSASSTDTSDIFGAGAGRDTLRAASGIKTTSYAFHPSMTFTDEYHRWLPKQLLAIAQVKSSESAAKAATGTVNDTRATYDHSFVEHWVDESQSNNYGEDRAGIEEYNWPSDMTSSAFFAFKGPSDSDNWHDLNPFNRLTGLDMEHTLFHQTDRASVTGGTRRYANTSTNDLDQVNAQGAYMICARDSKWTKQHFVTKAYSRDTNRTASVGENGPYRAAPITVNGVANKTTANEWSGVSHAAVRVEIFYTARQDGSTNIIWKPLKRIDKTKHPYLSDSTFYSSGAMEWMEPEDWVECDPGDIPDRFWPGGDFESSLEPDTERDSFAYDSDATGNYFDVSNRWNATNKKYGLMWVLTSDGGVDSQHDTFGWGPDVHYSFPASNKNSVLIDIVDPMHVSLNTHAIAQSVSYNHKGKYQIIEDRMGKSEIRKIGATGGTLTFGGVDLKDKDGTFTRDKFYEYQKRAIPVFFDIEHKSRNISRFFGVITDMSEDHPVGKQHGKFGITMQCSHMIYFAGSGSSLGDGSILSDGYVSLGGDMIDEFDYI
>MGYP000711591066 FL=1
MKTNTIITIGRQYGSAGREIGSKVAEAFGIKLYDKEMLARAAKESGICEEIFETHDEKPTNSFLYSLVMDTYSFGYSSAAFADMPINHKIFLAQFDTIRKIASEGPCILVGRCADYALEDNPYAVSVFIKASLDERVQRIKRIYELNDSKAA
>MGYP003326832321 FL=0
TIEQVLYRRVYDASDDEVQLRACAPKGYVKSFTVPGFHGPKPLQIRHQILLDYHNSRAGGHPGRAATVDAISKDWWWPGLYEDVKQWIQRCPFCSKEKGISGVSAWTRTELHSRPFRMLQFDTVSAIGGGDSGYKHILTARCPFSRYYWLIPLVGETAEEIAEALVTHVLLGLANFPTILQSDNGLLNQVMTCLMKTFEIEHITSSSYHPQSQGKVERMHGHLNELIKGLVRSEPSNWVKMLPYAQC
>MGYP001544677532 FL=0
LLDRDLSLHFRLLLALTGTLGRAVAARPTQRYDYFTTDDTDETGCWRPDAGWNGGRPGS
>MGYP001464162734 FL=0
IMFLLRKPSVKILAIDNFSNSKPNFVNNIKKKYKNKFFFKKIDIRDEEKLTNFFFKNSIDVVIHLAGKIDAIDSFKNKDEYRSVNLDSTKKLINISASNNVKRFIFASSAAVYGEVTQGNCSEKKKTNPINPYGKYKLQAEKYIINKKKELNFVILRLFNIAGIDKIFYS
>MGYP003602224053 FL=0
YSFLLTKNILMILRRQYGKSQLIFPEAFLFPYALIINRTKHKINLFVRFLVYFFVFVE
>MGYP000042883827 FL=0
WKVQIQVLQIVLARAFENQARRALSHHALEPETHLLAPTQIGAGQGIGLAQILGRAVEHDAPALRAGKNEAEPHPFPATMHPVIEAHRAQLLALARRHGMRSIKVFGSMARGAAGPDSDVDLLVEPEPGQSEPVRMFALGALLMDAEELLGRHVDVVTVALLHPLLRGRVLSEARALGVIAAA
>MGYP001545084500 FL=0
RMAPAIQDLWMLLSGDRADQIAQLSEVVEGYNEFYDFHPRELNLIEALRALRILYHTAWIARRWDDPAFPRAFSWFNTERFWGEHILELREQCVVLREPPLSLT
>MGYP000472409418 FL=0
SGDAMDLIKNFKLHVLALVIVIIAEMIGVLRFGLIMFLPLFYALVIGGIISYPSFKIMKLPEMERASRILTVGMLVLVTKILGIGPNLEMLSHSSLALLVQEFGHFFGTLVFGLPVAFLVGMKREAIGACYSIDREPNIAIIAERYGLDSAEGRGVMGMYICGTVFGALWVSILAGVIAQLGIFHPHSLAMGAGIGSASMMAAEWEMQGGTSVPVSGPYGSRLMETPISSTASIVATHPEWAETVQAYAAAANLLTSVLGIYFALFVSLPVTIKVYDWLDRFRSKKKAA
>MGYP000294864057 FL=1
MKHRMKRAAAPLAGIGAVVLVWYMVSRLGLLSAYVLPPPPKVWSSFIKMLVTGELWKDIYISYVRVMKGFSIAFVLAFLLGMVRSLLPASGRYYEFIVQFFRNVPPLSMIPLLILWCGIGEMTKTVIIVLASFFPMYLNIVKGFTGCDRKLMEVGEMFGYSKGRRFLRIVLPYALADILVGMRIGLGYSWRAIIGAEMVAASTGLGHMILFAQQMSRTDKVIVGILVIGIVGYVTDRVFALAISKLLKGSGDNGWD
>MGYP003498844063 FL=1
MSNDTTSTRPALTTLSDDEAAFRDAVAAFAEGEVRPRVQAMEREEGAARDLVRSLLERGRGEVLFQVETLTDHVTQNLPRVEIVEQVGQIDIEHVSQNSGRVCRDMVAGFIRWVTFDRKIENFTE
>MGYP003578506829 FL=0
MLMVTPKTLVATTAELIAYAKARPGKLNFPTGLGGAPHLAGLSFAQRAGIDWVYVPTKGGANSVAAMMAGEGDAMFLGMLQSLPHVNAGGLKLIGISAG
>MGYP002788440824 FL=1
MSRISLAKNYDYNCELIIIGDSTVGKSSILSIYNNNTNPLKQISTIGIDYIIKDEKINDKLVKVKIWDTSGQERFKSLADNVLKTSHGVILVFDLNNKETYDNLKTWIQFITIKISENIPLLLIGNKSDLEANILYGESIKFADKFNMKYFETSVKNNTNILESINWLVTQTIEKGIIKLIDKNINK
>MGYP001490688083 FL=0
VVIRRRVIPAAVAVVRQRAGTTADGEITDRQRVAFNVRRVRQQRRARDRVRPAVLGNGGQRHPTRYRGVVDRGDVHRRGTGDGTIVRNTVRRAVVGDRVAEAHIAVVVIRRRVIPAAVAVVRQRTQTIGNDQVTDRQRVAFNIQRVDQQRRARDRVRPAVFGNGGQRHRRTRRGVVDRGDVHRRGTRDRTVVWSAVRRPIVGDRVAEADIAVVVIRR
>MGYP001613389359 FL=0
LEFLLSQVDKMCVGGKIANVFLAAQGILKSELYPADEIAVAKHLLESYSNKIIVPSDIVIGNDDGSYVQTIDAGNIPESVGGVWDIGPKSVAQIQAACEGAKTIIWNGPVGRVEVPAYEQGTKSLVDFLASHSAYRVVGGGDTVNVLEKMKKIDAFNHVSVGGGAMLEFLEGKRMPGLEPLKI
>MGYP001822186784 FL=0
AKSEVPGPPKAIPVEKLAPAQTELGLRLVGTVVAYDSRLSRAFIGNRQTRRQKIYSEGDTIDDVLIKKILRNKVIIATKAGDRLLTVRSAASGNSNETYSAAPQVSRASMPQSQSPGRPSNSARVRHISLDRQEVEDSLANVDQVLQELTLTPYMRFQKPAGFRISNLSRNSIFNKMGLSSRDVIMGINDQKITSPDQAAEFLQTLAEGDEVTIKARRRLRTRRIILSIQ
>MGYP001418701337 FL=0
VKPLMSSSGKGQSLIKNDSDIQKSWDYAMEGSRGDLMEIIIEEFIDFDYEITLLTLTQKNHNTLFCPPIGHRQERGDYQESWQPIDMREEHLKMAQEMALQVTESLGGNGIWGVEFFIKENKVYFSELSPRPHDTGMVTLAGTQNFSEFELHARAVLGLPIPEIKLMKNGASAVVLANNISVEQPKFSGLEEAMNVTDSDLRIFGKPTTRPFRRMAVTLTYGKEDVDSLVERAKELAA
>MGYP001258882498 FL=1
MADAFFVCVVFCSAGAGAPHDWPGHQARRAGPRALLQNGGDARRHRGRQREAPRRGHQLRGEVLRGQAQAGGHGKLILFKSSRMCALRWRPASRCLERESNNSEQQ
>MGYP002553949049 FL=0
TESTKCVIALIDEIPDRITLDESVIAKVEAARKAYDAITDLTQKSLTRNFGKLTGAETNIERLRAGQQSSSSDSSSSAQSKSAPVALFIVLGVLLVSCAAAAVVFVLRKKKNK
>MGYP000347212883 FL=0
NRIVLRNYGSSPPTLQIWLLLSHLASHCPIHTHTHTHTHNTYMHVTMYMYVSMSMSMSMSMSMSMSMYMNVYMHMYMYVSVSVSVYVCVYVYVYVYECVYAYVYVCVCVCACACGCACLCLCLCLCLCLSRVCVYVYHICICVCVCVCVCGSIFLCLSLSTAFPACV
>MGYP003507787529 FL=1
MSEQSTHDAYEAKAKSTFSAERKEDYFVLAVAAITVALVLSGVIGPNFFKSLFF
>MGYP000959777104 FL=0
KEAKDARRLERAVFRSRPVERDEAEWVEADDPEDALAPLFTWVGPDLPEHIGPDCDPEEDMLCAVGSNLLVIANYKVGKTTQVFGMCYRLAGAPTPWLGVFATPQPLTVAYFDFELLASQHKRWRRRASDALGVRHDEDVQSRFRSLPLRSASAPNPATKAGRKALVRVWLAYQPDVAVLEPATAWVEGDGNSAEVVIAWTRGLDLAKGKYDRARMRAWEEAGAVGVPPPPLTCVISLHTPKSVKPGEETAIGSGRWMGWADE
>MGYP000823295119 FL=0
KIADFLAGMYPETIDRSLLLTGTLLHDMAKAQEFVFSQLGLATDYSIKGQLLGHLVMGAQDAAETAARLGVPEEKSVLLQHLILSHHGEPEFGAAVRPLCAEAELLSYIDLIDSRMEIYAETLPAVPAGSFSARIFALEKKIYHHN
>MGYP000922530624 FL=0
MSPTTVRRPIRPAALLRSVLR
>MGYP000535681885 FL=0
VWLKDYELPGVGDFLGRPPGYLMGSDLDRAYAHCRRIAKKHAKNFYYAFRTLPREKRRAIYAAYAFCRHCDDIADEELSHEEKMRLFADTRRRLSQAQNGSAQDPVFMALGHAAKAFGIPSEYFEQIIEGVEMDLTKARFQDFDELRTYCYHVASVVGLVCIEVFEYE
>MGYP003610816290 FL=0
CCSMSPSVHSIWSPPCILAPRFLAPARLGALVGXDFPLGMPLDDVFFDLVTVWAP
>MGYP001477694372 FL=0
MPRGGTAGKAQESNRRLGSVRGATRAKTPPPCAYAQTSQITIKVEGKFVSRGSREQA
>MGYP000729372693 FL=0
LLGTLCGDPRATSGRIVFDDKDITDWQTAKIMREAVAIVPEGRRVFSRMTVEENLAMGGFFAERDQFQERIKWVYELFPRLHERRVQRAGTMSGGEQQMLAIGRALMSNPRLLLLDEPSLGLAPIIIQQIFDTIEQLREQGMTIFLVEQNANQALKLADRGYVLENGHVVLSDTALDKLESIPGFDIFPDDNRFREIIKDVGVAIIGQTSSLAPADKRFYATRDITATVDSIPLITASILAKKLAEGLDALVMDVKVGSGAFMPTYELSEALAEAIVGVANGAGVRTTALLTDMNQVLASSAGNAVEVREA
>MGYP003294174267 FL=0
PQIDQRFVNFGVVAAEDAGVGRGLVKTDKNNIAPRLGIAWRLTDSSVLRGGYGIYYPTSAAQGMRDAFAANAFNQRITKSSTTATPLGGLPGGVNPRGVTPFSGGSVVVQGVAINAIRFDLQSPRIEQFNVTFEQEVKWNTGVRVSFVGSRQHNLIAGIDLNMLAPNDTPFGVHNADGDLCTPGDDCEESAADSARRPFPAL
>MGYP002514170153 FL=0
LKSARIYREEQMKNLEIKNPERHTERLMNAMQRELRLDRQPRHIECFDNSNLQGTNPVASCVVFRDGKPSRKEYRHFNVKTVVGPDDFASMREIVYRRYSRLLEEKAELPDLIIVDGGKGQLSSAYEVLCALGIENQVPIVGLAKRLEEVYYPNDPMPYYLSRTGEPLKVICHLRDEAHRFGITFHRQKRSKNFIVSELESIEGVGPKSIEALLRRFRSVSKIRAASVEELAEVVGPKRAELIEQWRSKS
>MGYP000515275479 FL=0
MASRVKINNIKELEKRKNSTHPSLVNIRKILSLLKNPQKNLGITIGITGTNGKGSVAKTLSTILNDSNLKTGLYTSPHLYSINERISIGKKNIPTKELNQILTEIFETEIKANIKLSFFELITVVAIIFLSKKKNIFNIFEVGLGGRFDATNVIDSDISIITNIGKDHKEYLGNTLLKIAKEKIGIIKKDSFFITGMKPYPFYRVKDYILKKTKKIYIFKKDFQIENNKEFYKYENLTFKPSLKGSHQIENMALVLKTCSIIKNNLGFNLKNQNIVDSLESVKWEGRFSILSSSPYKIVDVAHNYEAIKVLVQNVKKITSKKFIVILGMLNDKDPIKCINELLNIANKIILFKVNNQRTFIPEKIAKKINNKKVVLGKSEELGALIEKDINTLYCGSIYFIGDLLKKYKNLRSC
>MGYP000931687007 FL=0
MKNYLNEKYNDLDSVAKLHCKSYITADPYPHIVFDNFFNDVMLNEILNEFPSELDKVGSKYNTNQERKSFSNNPDQLSPKINNFLNFTNSHKFINFINILSGIERSLIPDPYLFGGGLHELKDGGFLNIHCDFNKHPQMNLDRRINALIYLNHDWQEKYGGALELWDKNMKNCVQKIQPIFNRMVIFNTTNFSFHGNPEKVTLADKSKSRKSIALYYYSNGRPANEVSSKDHSTLWQNRPNTSDT
>MGYP001385379217 FL=0
INLILIYQIFIYLLKNKYWTFIENDATNYHYLHLLYRNSVLEVAKHIIEGCKAEDQKCCKQLYSMFKDKMYGVCLRYAESEHDANDIFQEGFIKVFRDISSFRGEGSFEGWMRRLFVNTSLHFLKQKRKSGFVFEDDFSQYDNADELDDSIEISENRQNLLIDLMQKLPSGYRTVLNLYIMEDYSHVDIANQLGISVSTSKTQLMRAKKMMKLMVESALIKN
>MGYP001196022355 FL=0
MLHAPVLHREAVIPNLATQRGFRRRVAVVDFPWSDRERVRGDAHALLVRISGKALRVVRAGPDRHALALRALLVLVVDRLVVEEVADLHLAAVPRAPAIFVVAVVVPTRSLGDGSPLFCIRFALQVAVRLLPRVVPGPGKTERPAYHVRVGVRVLVDPVAPGVDRVRRQARAQLKRGLGVGGLGAFYLVLCALRFEPEALFKA
>MGYP003389695985 FL=0
DEIQYRVWEMTPHLELPGSDHRSPGPRTPNPNRRQVRVPPATQSSHGQHAPGGQMGXIPPAHPRLLPARFQWCQKYSTGTALNRRLVGVX
>MGYP000014734933 FL=1
LGRYGVRTIGELSKCSEEMLETLMGKMGSQLYRYANGLDDSPVRGAADREPIKSVGNSTTFRRDLTRWDEVQSGISLLSDSVAMRLRRYGLYCGGVQAGIKNSRFQVFSRQTTLDHSTHLMREINDTALRLTKDLWKQSQARALCVFQHSGCYRHRSLQVPGCASQVGGHNFGGRGHGPFFISILFIQHRVSGSVHHHGTLSAGGRQRPHRHQQKQT
>MGYP000109000080 FL=0
NVFYQDMGFSKTDIANAVKLVGVIMVIAGGFLGGILAQKLRMMQAMMVGAILACVTNLLFVLLTYHPGSLPHMYVAVIFDNLAAGLASAVFIAFLSALTSIRFSAVQYAIFSSLMTLLPKVMGGYSGAIVDNMGYPFFFIFTFAIGMPILILIYLVDKHIVIGDNDDIYGDNDKLTKANPNLTDTSEPPRASE
>MGYP003723858749 FL=0
ARGESQRTGQRSREEIQQEAGQGLRCEDHSACAGTRQGQGSCAANLRQRQGPLQSVFRCHVVKEAA
>MGYP001454151373 FL=1
VSEDDGVDKIDRVVSNGEANTVVITVVVSST
>MGYP003345151193 FL=0
DLRVRCLVACCSWRGDECESAVWRVAVIATPFQSLGDHVVE
>MGYP004046731215 FL=0
MSADPFXIXSGTLLLAAXSIGSQAFRLRLRFIMPKRTSKTSGRATRKTSPIPASPGPLFPSTPERRSSPKRSRSKSSPRSPPRREVRRRVTFADGTEGEGDASHSTSDESVVNNSD
>MGYP003232878591 FL=0
MSTLFCVARAPHCSASVPHEARIAPPRLLEESIEGAHGALINIAGPSDLKLQEAAAATQLVGKAIHPEAQIIWGLSLDDAYGDEVRVTVIAAGFDANSKKAAQAEAQKQAEPAESTVPLSALSAAPRA
>MGYP002780757469 FL=1
MRESSFIRQNFDKWKYIETRLELKKGENPDELASLYIQLTDDLSYAKTFYPKSKVTDYLNDLTGLAYANLYKNKREKSNRFITFWKSELPLLYFKYQKTLALAFFVLIISFVFGYLSAAFNEDFVRGILGDRYVNMTIENIESGDPMGVYGKSEPFEMFITITGNNIYVSFLTFIWGGVNFGFPVFIFLSGGSIFSLLYNGIVLGAFMRFFYDYSLTTTASSALWIHGVFELTAITIAAAAGIIMGNGILLPGTRTRIESFAIAAKDGLKILLGLIPFFIVAGFLEGFVTRHYKNELVAWFIIILSLVFVIWYFVIYPINVKKNYGSTE
>MGYP003421169975 FL=0
ASNLALLVRSLYKHWSSIKSSIWFDLFSRLVNDIYDQKIGIKKAWEYIQNIKNAIPSKYPLDETSNNSDSNKAGYAKVLDDYNWSIRSNINIDNFGWTIEKIVNDMSYWTLPYQYIIPQLFKNDIYVSYKINKINNEYTNDFKIYDGKTKTFNIINIFNGTVVDWLDLAVKEIKDVWAKNQVPIVVGGTGMYIDNLING
>MGYP002515247338 FL=0
LSRIVVELSPATPADRMPQMWDELRRKVQNVQNELPEGASAISVGDDFGDLYGIYYGLKGDDGIDNEELREWAQEIKRRVVTVDGVQKVVLYGEQQPVVNVYVSMARLSNFSIRPESIIAAMSGQNRVVDSGEKLAGEMQIRILESGTYRTLDDIANQLLTSSDGKQFRLGDVARIEREVIEPPTSIMRIDGDRAIGIGIATDPSRDVVRSGRAVAEQLRQLSSQMPLGMEIVTLYPEDEIAREANNQFIINLLESVAIVVAVIMLVMGLRQGVVIGSSLLLAIGGTMLIMLVVGEGLNRTSLAGFIIAMGMLVDNAIVVTDNAQRGVAQGVDLQTSFISGANRPMWGLLGATLIAMISFLPLYLAPSSVAESIKPLFVVISLSLLLSWVLSLTQVP
>MGYP000642399635 FL=0
DAPLAEEIAEELGAELVPVEPSAGAQRVPVPLFYPVLFDRLSIRRRDK
>MGYP001211563207 FL=0
MSSSSIVNKKIPVTVLTGFLGSGKTTLLNHI
>MGYP001099929414 FL=1
PVDPNKSANKTVLLLIKGLLTINSTNRFFFRRKYIFQPTDLRLFFYMLIGTIIYIST
>MGYP003481454472 FL=0
VVLNSQTKRAELTVEGADMVGFVFFAPSPRHLSLETARELGRQAKGRAAKVALSVDADDATLENIVETLQPDLLQLHGKETIARVRDIKAKFGLPVMKVIAVETSADLAVLPGYASVADRILFDARAPKGATRPGGLGAVFDWNALAKLELDLPYLVSGGLTADNLAEAVRVTRAGGIDVSSGVESAPGIKDPEMIRNFIRAARASE
>MGYP003404440343 FL=0
PGLTAHEEEPTASIDRIVEPGRQLPQLALPPDKHITGTAGSDVILALVHGPIVPTCAPARIPR
>MGYP003306851604 FL=0
IKIPANRGAGCCLGGNSYLTVTGCRNLLISGISTTVNGAVLISVPTNLGTGCCLSFNRYLVMACCRDLHIGSISTLGAVLIGIPADFGTACGLCLYNSQAMAGCGDCFIRGVITAGTSNILLPAIFGTGCCLTLMGLVIMTQLCLFDIGGVITVCTVLIGFPADFGTGGSLCLY
>MGYP001507408964 FL=0
PELCIAGVKEGDSGLYWCEAAPEGGQGQKTSPPRELCGRGWGAEGWKQSLQSPPRKEATGLTALPTLTPKQ
>MGYP000892867995 FL=0
GSAPRMRRLHELGFAVLGIDYRGFGRSEGSALPSEAMAYEDARAAWDWLKRDAEKTGAPEAGAVRRFVFGHSLGGAIAVDLAAQVEDDASGLIVEGSFTSLRELLATFKWGWLPVGPLLTQRFEAAARIAQVRAPVLVVHGSDDHLVPPTLGRALYERAPGRKRFLLVEGGSHHDSSARGLDEYRVAVRELFGVAAVE
>MGYP001570592810 FL=0
KLEMITTENAPTIAPHINPNVTITDGNVLTIKQNAVPLPHTEGWSAASGAISPYLIDMCFDKNGNMYFVCRFSWASMGNLDGTQDGDMAGIHKMAPDGTITYKWWYYSDPSIEPTKGEAGIWSGTSWDNAFNLSTAIWCEGNDIYLGCGDHGTANCLKISISDTSDILSTKVLRLNRAAAAGSVDGPYSAPVKGVSVEGDSATTCPPIAKIRSFSNGDICMVIGARN
>MGYP000867335061 FL=0
MDPVRRDVLAMGAAATAVAATSPAAFAQDGAAASFFEKDGVRIRYGIVRQLGSFNLLWAVFHEWIGIARDVWRAPWRAKLPYMFAPPGWSHDGSRDTSDSIRARWQERQEAVPAE
>MGYP000426411893 FL=1
MQSSVFYFPHCRNETEVESKLIVDFLLPRLGYTPHTWHQEVAFGHIRLDFLVFAVNRAPLRLADNQPVSLVIEAKSPQHGLDRFEGKLREYLTKLRIGHGVLTNGKDFRVYGRDKDSVRLLFRCPGEAIEQSLPQIRELIGREALITLSSSEPVLLDPVQEVDDLPSLRVVPIPASTEGIPETQGLSNVSSLEYSVIREDSSMIIIAIYHNKGGVGKTTTTVNLSATLSKMGYRVLLVDLDSQANSTFAVGLMKFPDEIDDDIKKSYVYHVILEKNQFSIPEVARKSSFCNPEFDVIPSHIDLMTHEFELKEGGSGITKYRLLKKLEEVQNSYDVVLIDTPPSLNLFAEIALITADYLLIPSDLKPFANEGLNNVRRFIDDINEDREDRGKTTLEVLGILPSKIATHARFVEHTLPKMEKTVEERYGYKLLNSRIYERRDASAAIEKTIVVGDLDIPDPQSVLDFKPDSASALEFKRLAEEIISLTGL
>MGYP000549342313 FL=1
MLKNIIWRDIEVVITLSLIHIS
>MGYP001554259151 FL=0
PFWSKVRQVSIDSDQESQRELFLFEDMSSQNEMFEKVQRLSQAVEQSSNSVVITDIDGIIEYVNRTFIKTTGYSSNEVIGRNLSFLSPDQAASSVYEEMWTAVRAGKEWAGELINKKKNSELYEENVVVSPIRNEQNEITHIITTKENITDLKKARQQADSANKAKSQFLANMSHEIRTPMNAII
>MGYP001144722731 FL=1
MCYWNCPLASRLFRKSKASWRVAPAWSRWQLQLPWPIFIASQPTRAVPWLVV
>MGYP001076062122 FL=0
MSKRLILFVAVAVMLLSSAGIVTFLSAQEGEIPAGAPQDSPGNAPAGGEPLETQYAPDRIYRTGSPDVWRVSTGDGILLSRDSGRTWENRGTGLPARAVWPFDKPRPPIVTGLSVDPAHTDRVGLTTLDPLYLSEDAGGTWEKVELKDPLKANDQLTCIALSPLQPASLLIGTSFHGFFETR
>MGYP001119048589 FL=1
MKQNIITKKDFDINKDRDVKNFLLNFGPQHPAAHGVLRLVLELNGEVVLKADPHIGLLHRGTEKLLEYKTYSQGLPYVDRLDYVSMMAQEHAFAYVVESFFNKKVPKRASYIRVIFLEITRILNHLLALTTHALDVGAMTPFLWAFEEREKLMEFYERVSGARMHANYIRPGGVAQDIPVGLLDDIFKFIKQFGSRIDELEELLTGNRIWKQRLVDVGIVSAEEALAWGFTGVMLRGSGIPWDLRKKESYEIYDELSFEIPIGSKGDCYDRYLIRIEEMRQSLKILEQCLDKIPETGNYKIFDFKLVSPPRALIKFDMHALIHHFKFFSEGYSLPKGESYVGVEAPKGEFGLFLVSVGSNKPYRFRIRAPGFFHLQSLNQMSYKHMIADVVTIVGTQDIVFGEIDR
>MGYP000170037481 FL=1
SGPLFVFHGIEKTFAEDEVLRKVDLSLYPTKCILLTGKNGSGKTTLLKIVAGLEKPEKAEIEISGKLHCWKKVMPIIRKEIIYLHQQAFLFSGTVESNVAYGLRFTSLTREKRRESLKKALEWSGLTDMAKQEANTLSGGVQQRVAFTRAQIMKPKVLLLDEPMANMDHESREQTYQLLVRMKLAGMSLVITSHFMQYFEGIVDQHFQLKNGALELKSKS
>MGYP001203790631 FL=0
MIKNFKQLILFHRLKPFMNFEESIAEVHAISMSIKWCRPGALLGLFASPIRSYLLAAKPYIE
>MGYP001549860555 FL=0
LSLEGKSGPAAQSARAFARNFAKRSDIPIALVDERFSTAAVTRTLLEADSSRKRRAEVVDKMAAAYILQGALDLVRGLKLELANLKEADIVACPPFTALSEVSKATLDSNIRLGAQNMSEHNVGAYTGEIAAVMLKEFSVRYVILGHSERRQYQKESNELIAKKAPEVHVDALRPIVCVGESMAEREQ
>MGYP002065815634 FL=0
VAYRQPLYLLRTAVEWDVVQDRVMAYSLPMVEATMHMPFRVAEYTDFYASRHHATNVGTMFRGPENALPPNWLHIPIGYNGRASSVVVSGTDIRRPWGQLKGAEYDAPIFAPSRHRRTVQNASIPSRSSRSSVLRVPLSRNHAVR
>MGYP001354736308 FL=0
QKKKKMGIRNVSPIYTPAAARTKPPHRLAPLNDSSSSTGAFNGLKPLGKISIDSPWDAFGKPKSITAVEKKK
>MGYP003506483410 FL=0
XSPLLPKXATSNGHNHDNKQWFYQFATELDGSVGTKVRAEHQAKSHGNAQLVVNVT
>MGYP001354348586 FL=0
DTGTGIHAAAGAAAGWGGEARINWALLQLQNNLWRYAFGNVLAARVRAMAMNWVQFQEGLSMAEFMARYGSEAKCRRALCRARWPKGFRCPACGDRRHSTFQRGGQTYYQCRACGHQTTLLSGTLLQATKLPLTTWFLAMHLLTSTKTNMAALELKRHLGVCYRTAWRLKHKIMQAMATREETRRLDGFVQIDGAYLGGERNGGKAGRGSEDKQAFVVAVETDETLEHPRYAVIEPVSTFSNATITAWAQRRLA
>MGYP003378432903 FL=0
MGSRKKKNGKFLSENNNNCDYEGFTKVLSKRRIIVTIYFYLEVQ
>MGYP001118074481 FL=1
VNCPLCSPSRASLLTGQYAVTHGYTVNAAVNAVPDERLPIYQHTLRGAGYRTGHVGKWHKDSYVEPRPGFDYWVTYHGQGVHTDPQLRVKQYDAPVRTVNETGFTTNVLTEYALDFLDDYGTGGDRTEPFALTLSFKAVHGPHGDQYTQSGGAYAGQTIDRPPNAR
>MGYP001597331187 FL=0
MWLSLAGLVETLRGGCGACSLGCGILLLPYGPHILRQCLELLNFISIHVSDVVRLWARELALSSLRHPMQMEVGEIGIERGGFCSQ
>MGYP001567613541 FL=1
MDNNNKWYISSTGSGLSLTIKGVLVGIVPLIAGLARTYGYDLTEGELFNFIEAGFQAVSLSMVVFGLARKLFFKFKPL
>MGYP000114959871 FL=0
MRPVLASARALSQNPHESSFPSTNGNCGFVGQYFDRKDLTDLRLSRLDSRIAFDWGNGSPDRRIEPDTFSVRWTGRIVPRYTEVYTLSTVSDDGVRLWVDGALVIDNWTDHAQTENSASVELAAGRHPIRLDFYEKTGGASIRLEWEGPGIGRQIVPRTVLAPSNADEKAEGLLGTYYQGGPGESIFAWTDENDDGRVQPPEVRTGTITFEGAPWRQVAATWQTRMNDRFEIAFSDGEYGRAGIAFFNVRGFNRRGYPLYELPKSFVPIPGLAHASDAVMRDRAGNAISLDEYVVSVSPDGRILWRYKNRWPGLHAGHYTTAAGDEPGVLIATTRFLGSAVVNETLGEVIAILSNLGATYLFTADGLYIDRVFQDCRQGLSWSFNAPPSDELLKRVSLGDEHFGGTFQKVKTADGSFRCRYVVSPGSPHNSVVELHGLENVIRLEGGSFEVTAEHLSRAEHLRQRRTLAATEPRRLIVR
>MGYP002866891791 FL=0
TSIDTMITRHHQKGDAASVAVYTACESYRYLLTRTWDASGPRALFVMLNPSTATEVQNDPTVERCERRSRALGFGAFRVTNIFAFRATDPKVMRAQTDPTGPANDDTIVGSAIDWIRGGDDRVICAWGTHGAHLDRGPAVEALLRQTDRPLWHLGLSKAGHPKHPLYIAYDQQPQLWRTT
>MGYP000706738672 FL=0
MSSKFYTKATTLALLTGGGTSAAALAWFPLRQNSKDTDDNVDSPFSDEGLEAGMLLLEHAQDVPGLLPIAFLVSAIVKSSEHSGHSDATRFARLIETLEILLLQASSLPLPFLAQLTTVLEQAEV
>MGYP000526671817 FL=0
MTKQKSIMTNGIIMKFKNNNTMRNIFYSLIFIFVIWVLMQPRPTNDIVTYHNDYRIDSNYLTPIEPLTESVNTMSVIPKQKENAVDLYIKRYSKTAIEEMRLYGIPASIT
>MGYP001798615877 FL=0
MNQDRTVSFKNGHSGYTNCDFTILDIYDCDFTILDMYDCDFTFLDMYDCDFTI
>MGYP003125760673 FL=0
MKQRKLKVRKGHWAYTLKSQPYSGNRITPFLLLKGTWLEQAGFNIDTPVSVSVEDGRLSIIRDHTRXEPRPGHRPGHSVLXQIRGMX
>MGYP001490802382 FL=0
MPLHLNVQQSNSSAAVKKLWFVPEVLMFIMQIVYISDTFSLLISNFYYFWAVLCT
>MGYP003141655914 FL=0
VDGVKNEGLLQPDNVTEPKKINIPRSVAGTHTDGNIHTYLINSALDIGPPDGLGFPVFYNNQIPIREEHITVIKKGPKNILNLDLDTGRDSDISTYINQQKTIKVAIRSDLNGNQDFNLLGWESYKGKTVVLKEFENDTAPSIPIADYRIKGIITDWHNFQNPELISDTGLQDISYPDGDSTGIIEIEILPTAVQGLPPLAPSGETLNYAIDLFDEEEKLFEFKFPRFSYRYKYEDGE
>MGYP000069741418 FL=0
REAPPAEAPPAPETPAPRREKAATAREVAVQTAAVAAEIEEKMATGEDAYRFPPVTLLHENREENHVEAGAELRNNSRRLAETLTSFGVDASPGDVVHGPAVTRYEFVLDQGVKLSKITNLADDIALALGATGVRIAPIPDKISVVGIEVPNKQVTPVLIRDVIESRDFTEHKSHVAFALGRDIGGRNVIGNIEKLPHVLIAGTTGSGKSVCTNSLIISLLYKSTPDEVRFIMVDPKMVELAPYNGIPHLLIPVVTDPKKAAGALQWAVFEMMKRYKTFSEHGVKKLEEFNRLARATEGMETLPAVVVVIDELADLMLVAAKEVEESICRVAQMGRAAGVHLVIATQRPSADVITGLMKANIPSRIAFAVASSLESRIILDTTGAEKLVGKGDMLYAPLGAGKPTRVQGCFISPEEIEDVVACVKQSGEAQYSDEVIAKIEESIQEKEKGGKGASAASADPGEDEGDELLPAAVDVVLETGQASVSMLQRRLKLGYSRAARLVDQMEERGIVGPFEGSKPRQLLITRAQWQEQQMGGAPDAGEPPFPVEGDEGL
>MGYP000844791533 FL=0
PRRTFIDFSENDKVASRRDSPLDRALSESESEVTTIRARSIIAAPKGDSAEPMSNFSREAPRKVVTKPAPSPAATPAPPVLVATPAAPYEAVRPVRPFEDFKEFSSPPLVVPKTVVRPIPVETVVVPEPTPAPAPEIATSVANIETTTVKSEPREGFIKSIAPATLTFVRTGYYSAKYRKFDDRMKNEASMLGLGAARGIETSWGSFEARAAVDIYHAMDQSMTIDNIRMMSVRTEVAYWLSHSRVKPGLSLGLGWADYSIRSYRSISGANEDIVTLRTHAKGKAFSIIPATSLRIEVADSDTSQLVVDVQTEFVALLGGESPDAAQGLG
>MGYP000545153660 FL=1
MSADPHVVYVTVPEMLDAARIAREVVSARLAACANIMPNIQSVYHWDGEVCLSDEVVIVFKTTGDRVVELTHMVVDEHPDEVPCVTSWPITDGNPEYLKWVRDEATGQPQG
>MGYP000168519987 FL=0
MASITIPYAVADFIEMRERGFYYVDKTQYIAKLEDYKAPVFLRPRRFGKSLLVSTLACYYDRTKAHRFEELFGDTWIGNHPTKEHNRYMIIRYDFSAMVMSDHIQGLAQNFNDLNCGPVEVMVAHNRDLFGDFEFSNRGDASKMLEEVLTYARSHELPKVYILIDEYDNFTNTILSTYGTEFYRKATHGEGFIRGFFNVIKSATTGTGAALERLFITGVSPVTMDDVTSGFNIGTNITNDSWFNDLVGFSEKELREMLTYYKEQGVLQESIDEIVAMMKPNYDNYCFSRSRLVDCMFNSDMVLYFMKSFVLHGEKPEEIVDPNIRTDFNKLAYLIKLDHGLGENFSVIKEIAEQGEITTDIVTHFSALE
>MGYP000057883855 FL=0
KNLLKPGDHGTTYGGNPFCSVLQLIRCFEMIGARPHHRPCERNHTISWKKNYDELVASYDFLTARRGLWTDAGLWYPKSRSDRSLQMALEEGLIVITAGSERTPFCTTAHHRETTCG
>MGYP003384944733 FL=0
MPVYRYYVPHAIVFLTQTVANRAPIFREPRWVDLLRATLHRVQERHPFRMRGYVFSPDHFHLLIQPTPPETHSSVMHSLKRAFTLAYKQATGIPGSLQFWQRSFYDHLIRDERDFEQHLHYIHFNPVKHGLVARPEDWPDSSLAAWKARGAYPEMWRWSLEERAAA
>MGYP002790362313 FL=0
GKWQSVWRLDLNTEGLLLFTNSGELANQLMHPRFGVEREYAVRVLGTLEPDARKKLLEGVKIDGQPASFKSIEDGG
>MGYP001259587854 FL=1
MLTNRIAKLLSVLLLLTLASACGGGGGGGNDDSSSPPETINLGQFYDGDLSSKNSETWSFSAAANTFISVELYGARLDQTSWNTPLNAPIVKLLNSNGSTILAHNITDSAGDLTSYWYFGYRDTEIPLYYLTDAGDYSIEVSKKTTNSGAPYKIRVNNENKSILAQFGSAQEETEPRGLGTNNILASAETILRDGPGTDEIIFGLFEDDDPDTYAIDIAADTTTPAVISCFEIISQRLGILTPQTGQSYPDLELTLYDTTDTKVNFVDDFYFTDPKVCRKITNTDTANDTYKIQVTETTGASNPTTDAYYFLKYTEEKILN
>MGYP000577366278 FL=0
MPWEIGDIVRQVKKQVKIPLGIHAHNDSGCAV
>MGYP002519074643 FL=1
MQTAVFTRETSVAMPSDMFAARNSGILSAAAVIAAETGVPVFELDMIMHGSSYFDSMYRNIDTLKGALG
>MGYP002064227981 FL=0
LLRRAAISRPEIGDADRRAGCRLRQRRHRIHQHVRCLVDDVLGAQLDAVGKSHLADGHDPPIADRHVANQRFRARTVVDRAALKQQILKAVPSIPDLVRPAWASASTFRGSDKRGGANGARIRLEPQASWDVNVRSGVGEVVAKLDAADLVARRRMRPVRRLRRWSPTSITGDDAGLMALPVAAAAVSSDCSPLPPAIAPDRRSVTIGRAPWIAGVSGLASQATTRPAAHTANSATSSGSRCRSGSMSTSAAKELADLGYTNVVELDGGMRAWSA
>MGYP000874961551 FL=1
MISKISNDFPVFDFKKDARYLGFFDFSCPEGPIFSWSGCSIQTNFNGTGIYAKIIDKNMTGNSWISVIIDYKESDPINIKPDKDMYVIAKGLKNEAHNLEIHKRTEALLGQLQFCGFELSSGGRFLTPPSEKARKIEIIGDSITCGAGNEGVYSGDDAEFLGKEENNYMSYGPIAARILDADIAMVSISGSGCYQNYGGAKENTIGDLYLKTNLSTSYDEWNLKKWTPDVVVVNLGTNDFSAEIDTDKFKEKYKRLIKHIRNKYSKAAIFCSIGPMNLQPGKYIDSVVNELKIEGDSSIFYCEFDPIDLKDEGLGWGTHPTIKTHEKMAKKLANEIKLRLCW
>MGYP000873909662 FL=0
IYYLETGANQRGSTVVYDRAASSVALAAAEEYDFRSALGGVARVHVTGITPAISENGFLATRALLRLASQQGAKVSCDLNFRKKLWRWRKGVPPGELARQCMTELLPMVDLVIGNEADAEDVLGIKAEGTEVERGRVSAEAYVEVARGIAERFPNVSRVAITLRESVSASHNNWGAMLFDARSASAHFAPLDGQGRYRPYEIRNIVDRVGAGDSFAAGLLYALDSEKYAAPADAVRLINKGALVIDVRDPAAFATGHIVNAKNVPLAEIESGTEVAKKKNKVLVTVCDRG
>MGYP001229117954 FL=0
NREAKLPPRQELFECNLAVAADIELGHDQVLLLRLQLVPHVPAQQLQLVGVERDHVHAVGAVRLVGVALAEGADVDPPQAPRPLDRARAFPGREFGPPLEDLEAAWVVAVADFLRPARDSLGIGEALNGRDRERDRRQRAPAALRKEVVTPSADLLDSEVLVAWSAELPDLTLLRA
>MGYP003486854474 FL=0
ALGLSGERAGRIDANLAEHRLRDRTLAEEAVQDAFLRVVRHRQRFDPARRFAPWFYTMLFNLCADHWRKAARYAARLKAFVPEIDTVQFAHNFRCHGTHPWLAHKMAETDRISAVX
>MGYP000004611563 FL=0
SDSPASASQVAGTTVAHHHAWLSFVFLVEMRFHHVGQAGLELLTSCDPPTSTSHSAGITGVSHCA
>MGYP000261681696 FL=1
MDFEQFYQDKYPAGVPRNVDLDKYTSMVDVFDQAVKKFAERPAFSAVGATLTYKDLDTQSRNFAAWIQNRTDLKPGDRIAVQMPNVSQYPVIVFGAMRAGLIVVNTNPLYTTREMEHQFNDSGAKAIVVLANMANNVEKVLPHTGIEHVIVTEIADMHSPLKRTVMNAAVKHLKKMVPAYNLPQAHKLPAVLSAGSKEKFSPVECKKDDIAVLQYTGGTTGTETECTRFRPYDRGYHFNALLLIDNIFHSAKDFLHLLG
>MGYP000082023964 FL=0
PFVPRRMPDGSGYELMMLEPELAPPLEDAETTARWIERCLAGSEPVPASLKIQMACCLVATGESASLAEGLARVEQSF
>MGYP000378578682 FL=0
MEKMRFSISSSPHIRQSQTVQSIMRDVVIALIPTAIYGVIQFGYQAALVMLSGVAGAVLTEFVGNKLTGRPVTVTDFSAIITGLLLAMCCPAYVPLWVPFIGSVFAIAIGKLPFGGLGQNFLNPALVGRAFLLASWPALMTHWAPADAVSAATPLAAYKATGAMASYGDLFFGNIPGCIGEVSKLCILIGAAYLLLRHVITLATPIGYLGGLALMIFAFGGQDGLFTGDALFAILSGGAMFGAFFMCTDYVTSPVTQKGQFIMGLGAGILTALIRTFGGYAEGVTYAILFMNVVTPLIDRFVHPKLYGEADRKSVV
>MGYP002628574471 FL=1
MKINFHHPAPEKTPRIWRSLRELENDPEFEKHLHTEFPRGADVYQDSGLSKRDFIKLMGASIALAGVGLTGCRRPESYLVPFTKGVEFTIPGKFLYYATSMPARFGAIPLVATTSDGRPTKLEGNPLHPFSNGGTDTFAQAETLNLYDPHRSKQITENGKPSSREAFDAYVASVAQSDGSNLAILTEPSSSPTRARLRAALQTKFPKLVWAEYDPLAPTAANAANEASFGSSVRLVPQFSRADVILAIDSDFLNPIETGIGYAQGFSARRNPEQKGASMNRLYAVENHYTVTGGMADHRLRCKISETGEFARQLGLALAAATNNAALAEVANAFPASQTSIDPAWIKECAADLAKNAGSSIVLAGPMTPAPVQVLVNAINNALGNIGSTLLPVKADLVPAASIEDLAAAIDKGNVKTLFLMGVNPVYNAPANLGFKELLSKVPDTVHLGFFEDETGTASRWHVPAAHFLESWGDCRTFDGTYTSVQPMILPLWNGVSEIEVLNILSGATAPEGPSLVRETFNAIAPQATAESWNAFLRDGFLPESAFQQIQPTFNAATASGLAKKGAPAKADALELVFLQSSSVDDGRYANNSWLLETPDFVTKVTWDNVLMVSPATAVRLGIKTNNFGLLGDVAEKMGNDVNYDLIGDIVELSDGKSTIEAAAIVAPGHADDSLSIALGYGRKGVSALMDGVGFDAYPLRSSNSMRFLDGVTIKVTDRNYPIAQTQEHRSMEGRDLVREGSLERYAKDNAFAQTMGMDSHIPPNISLYTHPELNAKDQWGMTVDLNTCTGCNACVVACQAENNVPVVGKDQVRKNRDMAWIRLDRYFAGDSSDPEMLSHAIMCQHCENAPCETVCPVNATVHSEDGLNLMAYNRCIGTRYCANNCPWKVRRFNYFDYNQRPIDELYWGPLAKKGMADSLKMSKNPNVTVRMRGVMEKCTFCIQRIEEAKISRLVEAGPTPASDTPIAPFKVACQQACPNDSIVFGNIADPKSQVSRMRKDPRGYVMFKYLNVSPRVTYLARIRNPNPKMPGADLVGMANGSGHHGDAHGEHADQGHVDSHSDHHTEPAAH
>MGYP000967004213 FL=0
SSEGALPGNGRFFAVTRPALVDALDAQGGEHPT
>MGYP003580660516 FL=0
MPIINRNIESPINILIIFLFITVSFYSNHKKSRHSGGNDGLRSNSIDSEFXDQSPSSIPGSFTALX
>MGYP003382547724 FL=0
MRWVRFRENEDRVIRKSMLCEAVIRRKKRRMMPPFSTIFDQNAVTGITSRPRQRSGMVNLPCGRKSVTIAILLLVSWLNSLAGDAFADDVQSRRQGSFAAGGTDGKILQQHEASFQASDDGQENGSWQKAEFKAETKVTSLPQQPASFRSLLSGTPDFLNYDAP
>MGYP000595587323 FL=0
NVTATDPATGAVVSSATQVVDAERVLGNVAVVSHPGTKGPRLEPALYAFDDWTITGEGVAHHPGQTFGPIACAQHTLSRGVLKMTAQFLPMDDNAPSGVDLQVNQGGQWVTVDTAELDTLSWTAGFRVPDWDDTVDQDCSGADLTDVDGDQYDAEAAGGGDCDDDDPEVHPGAIDIEGDGVDSDCDGVDGRGGGDDTGGGDDTGGGDD
>MGYP000311212580 FL=1
MLTGVDQAKAVRALLPELPAENFIIEPLRRDTAAAMALAAGSIARRNPHATAVVLPADHHIPSTIDFQKTLHCAVQAAETSGSIVTVAIKPDWPCPGFGYLELGDPVERESGAVYPVVRFHEKPSAETASEYLAQGNFRWNAGMFVWSVPVLCEALQKTAPALFDFYTGLKQASDAVEFLNANFESVPKVSFDYAVMEKLSGVLAVEAGFAWDDLGGWAAAGKYFPSDQHGNSGNTAIQSIDARNNIVFSKEPNQHVALLGVENLIVVNTGDALLVCPRGQAERLKELVAGLPSDLQ
>MGYP000202157561 FL=0
AQVRTLGCVGDCVAQASELIDQSALQRLIAAPYASLTDLIDLFRGLVAIGGDLGDEILVAGVDHRLQDFTDARIEELHAKHIFCVLNRRRQALAYLGGELGHQALAVGLGALPGSLRGQLGGQQRRADENADEAEGDDAAEDAEHDQQQRQAAAAADQVGLDEVVDAADHQQAPGGHEDGPAHRTLGQQPQRGPTPHQRRPHRHHGQQEGGRGQGWRAGYAGHQEADQGHQGLGQRRAEDAVHHAGDGAGDGGQQLVGQAAGQLVQDGARGQDQLVTVAVEEEGDEGRESELQQAAAQGLAA
>MGYP000361399541 FL=0
MGAPPALCGRAADRPALRPSTFGLPLRRVPGLAPAAQRSPSRLSPALHTQRAARCLRVAVPVTGLAAARRRSAALHAPVHDPDAVRDAQRLLGEVHAQKLRELSVERADLLRCQHGADALAGPDAPAPAAVRVRHRVIVREGLDVADAAFRQIADEGGVEARGHGEADVRLELRRVVALDQRLGPLDDVAAERDPVEGRDHDVPTGAQLRADLTQRRRPIEPVPALTRADHVEALGAKRDLLGAPEHIIDPQPRLRIEAARRREQRLRDVQADDPAAVAGEAARHDPGPGPQVQDRLAAGADSLVGEAAEQGVWEPDPVLPVVLCGAIKVDLHVCLPVQCPALFNALPCSAPCLRGTAYQRGAVSVRGQRLLQGDVRLDAAQRLRLARHAARQLRRHAREDAAAAQKLDGADDAQELGHRGLVQHLGAGEVEDDPQRPQLDDLLEQPRRHVAGALGVEPTDDREGERALPDLDHRRRQEQQLLLFRGQRLQLPIEPLFIRDAVVGRAGHAGGVAEHHDVGRAEGVRLRAGEPVGADAADIAQDRDEEARADAQAAAGAALRAPFGVGLDVRDVQELRVAHHPAGVS
>MGYP003362107572 FL=0
MSLFSKKTTQQPIPEEQRVEQAYLAGMTTLRDLIAPSSLEIFSNYFRLGTKFGRTLYVYGYPRQVHTGWLSPLINIDEILDISMFIYPVDTQIVLNNLRKKVTQLEATMNINTEKGRVRDPGLETALQDAEELRDQLQIGAEKFFRYGLYITIYADSMDELNFVQHKIETIFGQQLVFSKVASSQQEQGLNSTIPQLTDELQIRRNMNTGAISTSFPFTSADLTDGKGVLYGINMHNNGLVIFDRFSLENANMVVFAKSGAGKSFTVKLEALRSMMTGSDIVIIDPENEYQKLCEAVGGSYIRLSLNSDTRINPFDLPRVIDTEEADDALRANLVTLHGLLR
>MGYP001412591253 FL=1
MTRISLPFAPQVRSGIPKSPCHSNVVYECVCEKKITVSLICAGGKEGFASPAAEPQSPVPLSHTPRPVASTLTCFPPLPLGPAHGRKDRL
>MGYP001520358773 FL=0
IFANEYPNEFIGEAGTINGPNNIRKRKNKVPGALYIAITSLYLK
>MGYP002525796693 FL=0
MNKKLITLLVALLSGSAAFPQVHKMERKDSSAVDRTYNLNPVVVTGSGHHQRLKSTATPVHVLSNQEISEQGISTFDGALTRMMPQISMSPNSMGTFLRLNGLGNKYILILINGQKLSGDISNNVDLNRINMSRVKRIEVLDGAASSLYGSDAIAGVINIITDQPTQNLISVTSDTRVSGHGQLTENVTLDIYKNGFGSYTSFSHDRADSYRHNDLEYVKGSDTETQQTIAPFFTGYRSNVIGQKFTYAPIEQLALNAGLDYSYKITDRPETRQDITGGTDYEMRYKGFRWNVGGIYKFTAKNSLQANFTVDRFRYGKQYDVKTKDYAVGDYVQSKKQMMMDGELKAILGLTKNSTTIFGADWRKDYLTATSGNIEENVYSLAAYAQHEHKLFKDFTATLGLRLTHHE
>MGYP001301746093 FL=0
MTQEVQITRDQVLEQLREVYDPEIPVNVVDLGLIYDVQVSGKNEGFVQMTLTAAGCGMGPYIAQQAEWSISELEGVEE
>MGYP004005692463 FL=0
GVAAHGPSRVVRDPEQASGVERALVVRLGGVHDILVAELFEHRLAAQYHQDLTLARRRPEHRFAVLFLDLDHFKVVNDSLGHHVGDRLLVEVARRLRTCVRPGDTIARLGGDEFIILLTDLAESADVDRVTARVQEVFEAPFNVASHEVQTSASVGVAAGELSYTRAEELLRDADTAMYRAKALGRSRTEQFEASMRVKALARLGTEIGIRQGLDDDQFVVHYQPIVSLGTRKILSFEALVRWEHPEAGLVGPDQFIQVAEETG
>MGYP001224191517 FL=0
LNYVGHLRGYHDITESTNIDLGASYSYGHNPAGVINDIDIGRFTTKLFGVDATLRWRPLTRAIYHQFVGRSAVIWSHRQQFGGPQDRLGYYVPGDYQFARRWFAGGRFDHSDRVDDSAIVETGGSAVLTYWPSEFSQVRGQYRRTSYAEGVVANEFLFQFLFSIGAHGAHTF
>MGYP001086061371 FL=0
AAYGAVFTIRALQQNTEDEPQPGHAFSFVTALKFALVLAAILLASAALREWFGETGVILAAAVAGFVDAHSAAISIAALVASGKMDAADAVMPILAGFTTNTISKMVFAGTSGGYGFALRVIPGLILVAVAAWAGAGTTRIGR
>MGYP000610080798 FL=0
MSIGGLTKDKLSNFDKLSQPRD
>MGYP001730562506 FL=0
LNVLHHSSVKYFISFPSIQDFEIIILKSVKKSTIILTISGKNRFSFCAFHPDILIEK
>MGYP000961376923 FL=1
MKHHVENQCDEPRVSVVILNWNGRKLLEQFLPLVLEHTLGDEFRVVVADNGSTDDSVEFLQTLFPEVPLILLDENHGFAEGYNRALEQVRSEYVVLLNSDVETTPNWLQPLVDFMDNHPEVAAVQPKLLSYHQRDHFEYAGAAGGFIDRYGYPFCRGRILEEVEEDRGQYDTVIPLFWATGACLMIRKSDFVENGGLDGRFFAHMEEIDLCWRLNARGRKVMCVPSSTVYHVGGASLDKENPKKMYLNFRNNLLMLYKNVPRTRYFTTFAVRYFMDLLAFVHLVMKGNFKNARAVVKAYVDYWKMRPSYKQVRRENLAKTLIEIPTQYPKSILMRFYTGKKTYQSLYSK
>MGYP003987264985 FL=1
MEDIKKAIIKAKGEGNKHLVQRLQQELDALQEISNNLDWPRYEKVIRKLEDKPDMEDFPDGPKKNNS
>MGYP001575371671 FL=0
EESALDTLPGLAALCNALSPKLVSGAVELGAEGTA
>MGYP002783228703 FL=1
MSDEIGRLDIMVEAEANRANRALGGMEKRLNRIADSLEKVTALTAGINGFDKFDLKGLESFRKELDSVFKSSSKKSVKVDDSDLKYAKKSMDELQRQYKNAKLEVNISTIGEEELKKFINQTERRYRKLKQTLADTIELNGSDMVGGKAWYKANMQLMQYENALDDATEALGRMKSMRDRIPEITIDRGETYNNDTDIPEYPKIVEIGNCEQYDASEIEEYINNFAGARKEANTFEAQIKSLKSELSDLASQGFSQYDPEYDSVARELAEVTIAQKQYNKELRESARESLGISNSERSAEAMKKASKQAGVFKRTIDGIKSSAKNINALKRNFDNVSKSIRSAIKLSKSALHPIRSLKQVISGDGGNRKGMSWGRMIGSSVLFSFVFQGINAIQKAIKEGSDNLVKYSAEYNYSISSMLSSLLYLKNAFAAAFSPIVNVVSPYISQFIDMMASAANAVGQFMAALTGKGFAVQAKKAWKDYAAGLDTTKDSAGDAAKAIKDLQNYTLRIDELNVLQPNDNSSSGSGSGGSGSGGADISPSDMFETVEVSNSMSKLAEMFKEAIANSDFTEIGRMISNKLSDELESIDWQSIYKKADNFGKDLATFLNGLITPRLFYNLGKTIANSINTAFHSANAFAINFDWSNLGDSLASSVKGFFENWDAKLTGETFSNFVKGVLESITSFVNSLNSNDTFEDIGQKFVDLLCGVDWAGLTWDMGKFFKALSDAMTDFPKDFSKGVAESILEHMFDSEFSDGMKQKFNDSIQPLNDIWDYLFSSLNPAINAFKIMDFVRETVSSKGQNILDFLSDCWESIKIIFSPVVKWFKDTFSGAYEAIKSPFEFIASWFGEKWTAIKGVFDKDKVRNFFKSAFKAALDAVKNIWDGIGDYFKKIANHIISPIGKAVNGIIKGINWVLDKVGSKKPPLDLWEIPKFARGAAGLPEDTIGIVNDQKGSVYKELIVPPDGKPFIPEGRNVMLPLQKGTKIMPADETKALMSAFPHFAGGIGDFFGNAWAKFKDFTGNVLDYITHPNKIVQIALDKFVDISNMAEPISSIAKGTVDTVFDGIVDYIKGIFDSETTVKYNPTAGVEQWRSLATKALQMTGQFTESNLSRMLMQMQTESGGNPNAINNWDINAKNGTPSKGLMQVIDPTFRAYAYPGYNANIYDPLSNMLAAIRYTVSRYGSLAKGWKGHGYASGIGKINFADFLPQLAGGGAVKSGQMFIAREKGPELVANYGNKSFVMNNDQIVQSVSNGVEAAFERQNARTNALLQQIAECQKMLIHKDTSVNIDGKKADKQLSKARKNSGYSFSPA
>MGYP000278592768 FL=0
RPPRSTLFPYTTLFRSRKVMAYNDQVMMCEITFEKGAKGNFHTHPHIQTTYIVKGSFAFTIDGETQVVNAGDSILMPSNSLHGCECLEAGVLCDVFTPMREDFIKK
>MGYP000014633898 FL=1
MSDGKKILITGGAGYLGSVMTPLFLHAGHSVTVLDNFMWRQSSLAAVCHHPRFELINGDARTESTMKPLVNEADIAIPLAALVGAPLCDKDPIAATSTNLDAVRMMLDMLSKDQWVLLPNTNSGYGVGEGCCVGKLGVPSREPAPSVGTCGGRGRRARKMKPVPTSRATMKLMKAIW
>MGYP001266816030 FL=0
MEHYGKKLKFRPLNYVFILL
>MGYP000960759586 FL=1
MRVDPVTQTTMARMMDHAVLNPAMTENDIRRAAAMCRARGVGNLCVRPTDAALAASLLKGSATTVAVVVGFPHGASRSEVKALEARLAIGDGASELDMVMNIGKFLSGDYEYVKRDIEAVVAVAKPQGVLVKVIQESCLLTLDQVAKACELTIAAGADFVKTSTGFNGDGATVEQVEVMLKTCAGRTKVKPSGGIRDWERAAMFVRMGVDRLGVSSTDKILDGAPTEDGC
>MGYP001420375246 FL=0
PEQLAGVLSIVARQSAAAKGQPYDEEADTAIRAAVEQQIEAESLPVFLSGRLYDDGVIDPRDTRTVLGLCLSAVHSAPVEGVHGGFGVFRM
>MGYP003296810821 FL=0
CQGYFTEERGDCYGGNFNIVKVIIESPIAPTSCEGLFQGLTACKVIEGIEKLDTSRATSMEDMFASCFKLYNPDVSGFDTSNVTDMSGMFTSCHAITKLDLSNFDTSKVTDMSKMFVACHGLATELNLSSFIFCYF
>MGYP002731676114 FL=0
NTKALRQKILDLAIHGKLVPQDPNDEPASVLLERIRAEIVEGVTTEATNALGEKVQMDFAANRTSLPMDLRAAEVQENAIQENQNPKKFVVHSGANENRKTLDSKKNL
>MGYP000800539561 FL=0
MKNICIGLFEGETLPESLAAFKDVKLDLEFGKVTTIYTLHQLDCEKVVVVGLGDGKKNIKEAFSKVEADDYLAYVTENTAYAAGFGLVYAVSYTHLRAHETDS
>MGYP000365574991 FL=1
MNEATYISELGEAIYPHLNKPDVKFNENGEYKVILKVSQGRATKMVAQFEKAMQDSISKAESELKGKTVKVAPSPYSEEGGFVNFKFKMKATGVNRKTKEPFSQRPALFDAKKNPLNPTSCNIWGGSKIKVAYQLRPYHTPLIGAGVTAILKAVQVIDLVEGKQMNLFSKEDGYENTTSPEEMNNVPETEVQTSTDF
>MGYP001556904936 FL=0
SLTEILITVFLGFIGFVAFIGFVAFIGFDRLLGVFRPLLSATLQPSYHPCITLGL
>MGYP004044994415 FL=0
FSGSGFLGENKKFKIIKPILRLKATKKKIIIDKYSFKKSASILYVYLYSTFFYTYRREIDAK
>MGYP000469735265 FL=1
MFHVNLICKRCAKTVSYTHLRAHETG
>MGYP000883239672 FL=1
NPEAIKKHKGIIANPNCATIIGLVAVNPLHKAAGIRRITGQAIADI
>MGYP003386468952 FL=0
KLLSTNALDGIELPPKGEQIPKALYSVEEIEKF
>MGYP001795370918 FL=0
MIGIVLYLELKLISEANKSSNIVFELLMSASQISIWAYMLQGTYPTATNIIHLSQLVMVDRGKGSQ
>MGYP000051665382 FL=0
MTDPAALAREYYRTIDADEYDALADLLAPEFVHARPDRTLSGRDRFVAFTRDERPMTETTHVVETVYDVGPGDSGSVAVRGRLLDADGAELFAFVDVFTVRDCHLTRVETYVSAGTETG
>MGYP001510798038 FL=0
MVKFKYSKAWWGKTSYKIIGLHEQLDQELLNFITTIQNQESSTVTALENSVDLLISSLNSCIAKVGLNQGTIANYESNSFYTDKDVYALANISELFYQQHEDNKDVYDAICEAEQNLKAVSYTHLRAHETV
>MGYP003638701188 FL=1
MAKRLPEFLPHKYQEDVIQEMEDAGVLALLLDPGLGKTSIVLEYFRRQMDCMAATRMLVVAPLRTCWGVWPQEVQKWKGFKHLKVHVAHGKTGKDAALCNDADIVVINPEGLTWLEGEMKAKRIERFDVLAVDESTLFKSGSSLRTKTLFRIAHKHQGGIPNRFILTGTPAPNGVEDLFGQFAILDPDVLGKTLTAFRTNFRFSASKRPWGMVWAPSVHTAQLVQDAIRTHSVRLEATDHLDLPDLIQVQREVVLPKGVMDLYKELQAEMLVNLDGNTSVVAVNPAVLSAKCRQVANGAVYVDDNGEAGDSSARRIEYLHQAKVKELAQLFDELGQKPLLVAYEFRHDLKQIRNHMKASYKLDVPFIGGGSSGEETAQAIDDWNAGNLPMLLVNPASAAHGLNLQSGGSHLCWYAMTWNLEHYQQLNARLWRQGQREAVIVHHLLAKDTVDLVVWEAVQRKDATQRDLLLGLKRSKS
>MGYP001045944336 FL=0
LVWRSYRPYAVGQSRRDATPPCPSSKNHDELLPSSTRNPKRDELLHPSSRNPMVCA
>MGYP003142759631 FL=1
MKKARNIKNKKHNQIVNDYDKIKSRHLEKLANKILKDEERRDNLRSKDIKGDFLKNF
>MGYP001277206801 FL=0
VAAGLAGGLLDEHIAYVTSDESFRTPFARGYVVVEQLPYREKALKAALRERGVGRLAIKKRGVDVIPDQLRKRLDLRGDAEATIVLTRARGHGIALLVQPF
>MGYP000667709688 FL=0
ACTDITGFGLIGHGLEMAVASQVGLVIQSGAVPVFPEALDYAKIGLVPGGAHSNRQFFSCKVEVHPGVPDLLLDIFYDPQTSGGLFISLPRDGAETLVQRLKDRGHVNTAIIGEVVPEPKGKIRIF
>MGYP001758919174 FL=0
RDSVASRGLGDVYKRQEVVKDE
>MGYP003402598952 FL=1
MRHGNKNNALGRKKAHRDALLSNLAISLIDHKRIETTLAKAKALRLYVEPLITKSKDDTTHSRRVIFSELQNKEATAALFRDVAPKVASRPGGYTRIIKLGNRLGDAAEMAMIELVDFNTTYTKEKSAGAAKKTRRTRRATAKPTTAKTDGGDEAKSE
>MGYP002859056165 FL=1
MANKIMKFFHEEFGNVRGRYIGGECRFAGKDVAQALGYKDTKSALADHVFDDYKQVFNAKTIRQMASQSKGGETPPLETTSPRGMIYIKEPGLYQLIFSSKMPKAIKFQRWVFEEILPKMRREALREEARAEGKRVRRELTDVIKSFIEYLTARGELDRAEVAWYSAFSNLVNKMTATNDKRDNLLMLPLLRLSDCEDILTDAIEEGMAEGKGHHDIWLACQGKLDAWRQLTK
>MGYP003351460330 FL=0
MAGQMDTMPGERAGRREQNKAENRAALLKAARSVFAEIGYNAAGVRDIVRRTDLASGTFYNYLDRKSTRLNSSHVSESRM
>MGYP001464310971 FL=0
QALDVLLLRAGEDGAGGDGHFQERAGLVRVDVLEGLHGDLAGFGALGHDVHNLAAHQALGSHALAHVHDDPQGAFGGHGLGSLAADVLERVAEQRVAREDGHLLTIYLVVGGLASAEVVVVHGRKVVVDEGHGVNHLERARGGHGDIHSPAHEFAGGDAEAGADALA
>MGYP001323269287 FL=0
VGDRGGGTSSPSPSAPPPMAISPRSTARGDPGEEPGTVSHRLTPGTAAPLISPRTDPAPRRGRGRSAAGAGGVGEPEEYGYPCGGAGGVGEPAKCMGIPLEGNAGAERMINPPAKVLARRRTGLCRTPPVGIYLNPVQKVHYYWLQIISCNG
>MGYP003154234093 FL=0
DDPIEGSYEALEQISKKYTIIIFTTKAKSDRGLVNGKTGTELVWDWLKKHDMAQFVSKVTAEKPRAVAYIDDKAVRFENWKDALENVL
>MGYP001373085551 FL=1
FCIHTTGSAFDDLRKLIESGGGYTPAWKGRIRGKETAIVPVTMYTYFIIGLAEKPLFMGQVELAKRLGMENDFILANLIKAQDQWIIDIKGNSSLYGSFINNSSRNEKDILIQWLEKT
>MGYP001489405527 FL=0
VTASSAVPVVFDPVVVENYAACSAGLPSWLEAARSRQSMDANLRMVVADDAAYADKTGHRYAHFVDGGITDNLGLRALLETVEVIGGAQEYVAQLGMQPPRRIAVISVNAAADPRQGIDASRQQPTIGQTLDAVTNIQLQRYNTDTLQEMQQSLQRWSKALSTPQWQVQNYFIRLSFEGVPDLPLRRFL
>MGYP002718885158 FL=1
MSLILPNSKGKSTLVNMIDTPGHVNFVDEVASVARLVDGVVVVVDVVEGVMHGTEAVIRHAMQEKLKIVLVVNKMDRLILELRLPPSEAFFKIKHTIEEVNSFIA
>MGYP003566853254 FL=1
MKYIGVKRKKNRGNRYKFVVDIHVNGVRYFFGNYDDPKEAAKAYDLLVIRKGLDRPTNFFKKKLV
>MGYP001092313238 FL=0
TYYKVMNNLASRTDEELVVLYSKGNNEAFDILLNRYKNRIYSYIYYIVKDRELTEDIFQETFVKVITTIKQGRYVETGKFPSWISRIAHNLIIDYYRQEKSENHLSNDEMNPDVFNRKELSEGTIEDSLVQTQIQADIRKLVAALPDNQKEVLIMRYYKNMSFKEIADATNVSINTALGRMRYAILNMRKMAEDHHIELSL
>MGYP001474034502 FL=0
AKAALELVQAKDFKGLVALARKHADSIAEKALDASQSFEAQVLAQKERLQTLARAAEAPAIPPRAMIPTDAKEPADESIRLAGKFDELGAVVPRGVLRVVSAERVAIPSDHSGRLELADWIIDPQAGAGRLTARVLVNRLWHHSFGRGIVRTVDNFGRTGEAPSHPEL
>MGYP000079457881 FL=0
MSSTSRDASAVVAGPALEAVAAELEAQGPLAVLSWAFETFGPGVAIATGFGVEGAALIDMAARVNPRPFVFFVDTGFHFEETLALRTRIERRYRIEIRAVEPDLTPDEQADAYGVRLWHYDPDFCCSLRKVEPLERFLAGRDAWVTAIRRDQTAARATARTVEWDA
>MGYP001330772963 FL=1
MQVPEDIGVNEINIFLLLPSPIMLIGLTGRNASGKSTLVEWFSEKGMNSYSCSDSIRAWLREQDKEITRDTLIEGGRELRRQGGGGILAEMLIEILDGEDAVIDSIRTPAEVSVLRSRGDFFLIEVKASEEVRWSRLQERARPGDPTEKNIFLEQENKEIKAKDSAGQDLDATAKMSDFQIFNDGSVENLYTKLDDLWEKLHNSKN
>MGYP002627366002 FL=0
MTNQVRPESMKRITTTELAQAFIDEQIIELKKQVGNGKVLLALSGGVDSSVAAVLLNKAIGKNLTCVFVDH
>MGYP003117035852 FL=1
MSLLRNSVIVGGATFLVGSAFMEIGKADSKSDIGKWPYVATFLSGALGFYLLKQNVIPVPKALELNADYTDSDLSHFGKPLEDDEKFTTMQVRIGSPSGSTTSWTTAFNLQCVGDDDNLTYFTGLLEDSVRDRVRKWNGDELGDFIPMQIVIGSPSGSTTSWYRAFTVQPVDVDEENLYYLSGEIQDLLVDKAKWWNGHEVIYDAEIEYDGAKSYARSLDSKFDGANDEGYFPVDEDDFSEMVVDEIGEHTTLDAESFDADSLKGRWEEGTTRIVHGVSVTKSRYGEYEKPQYRASYNGYSCRIFYEGVAFYLPCWMYHGYGGVGRGGCFKNPMEAILDFKRRAEGGFQQISHRKDFDADTSLLQSFAAEVFMADRKIRRRTRWTWTRGNEKGFEIENDDLSELPYNIDYTAYTGRGYYRNSQPMYSIDEAYYISDLPEGYHLHLYKPSVRSGEWRAFSKSPTSEDWNEYRNYKKSNLTGDLLNWYNQDIAQPEEKTLSPIEKLMISKGMKSGTVQIERVVIPKTNYTPEKVQYFALGGPTNMSPTKFCEIEGGVIALENLRYEDEPNLFAFGQGLKFMTEKAGTLRSVNRFNKNPEAWVKSYPAWFQNAVKNKLTDIDVQFKFYQEHDGGIRINNIRVLKFLNGVDRLSWRPINESERKMMDTPYGEMPQFEIYELDMSDPAPITPRPSTMRKIYGKSFKQNLNGEWKFDKDMFMMAVVDKYKFENGGSERVHKSMVDEPLYSIDIIPYMTPMAELMARRYKKKE
>MGYP002788159078 FL=0
TQTLIRDTARGFAERVLAPQATKLDREGGFPVESLAQAAELGLLGIAVPEELGGVEAGQQLAFLDLHAF
>MGYP001798696378 FL=0
MLTGGEMAVSVITIQTKDIKAETKETHPNHYQKTNLXCHWSXKWRHAVKKTSCCMX
>MGYP001406754757 FL=0
MRPLGSMCAIEYPAIPLPVFFLLEMMIPSSFDWSFTNRIILKFFWLRFGPIGARPPALVLRSLLAAPGDDVDRVGSPNVSSSPCP
>MGYP000997370353 FL=0
FECGICKYLEHVDYRDLFLFRFGLVYRLWWFSQVESLVTDLHDVFGLDPGSLALAQSLRRAERLLSGTVLWAIGEGLQFASVVALIVSFGLGLSATIHFLNRLRLENTPDTTAEAAVEKATVLVGPALILTTVVLACGLVVTVFSDLPSLRLFGWLSAFSMVAALVADLFILRPTSMWLIGMAQKIRGRGADGKAI
>MGYP002214501719 FL=0
IIIHVIFDKNSRANDVYKKQISSTTITTTATKKKKILVTTGIDSTSLFYNQGKGGNSGTSGYIAILAAIDAL
>MGYP000390568609 FL=0
PISCFLPCVCFLCVFFFGGGVGGGSSILLAKKLISLKFAII
>MGYP000957035233 FL=0
MSPLAAASPARPAIEPRGVVIAVRGSVVDARFPRHLPALRQQLHAGRDRSVVIEVSDHLAADTVRGIALTPTQGLARGDPVQDCGGSLTVPVGPELLGRMINVFGQTIDEGPALADGERRSIHQPPIPLAQRRVGLEMFETGIKVIDLLCPLERGGKAGLFGGAGVGKTVVITELIHNMVGRYQGVSLFCGIGERCREAEELYREMREAGVLLSTDGPFDNVLKIKPPLAFGKPEADMLLAALADAAPVEAELLRG
>MGYP003548451047 FL=0
VARAMGGAVFLLMIAAGSAFDLVTQNAALSIGLGVTRETLFRVALGCGLAGLVLLTYAFVRSRLRNQSNDAQLAELEDEYADLLDRKNSSSEND
>MGYP001276729923 FL=0
AFAALSLQSPPQRQTLESIPESMNECVHESMDDSVNE
>MGYP002536854477 FL=0
MADKIRVLLSEDEVNKRISEVAAQISRDYQGKEIHLICILKGASFFTCELAKRITVPVEVEFMSVSSYGSGTESSGIVKIVQDLSTSIEGKNVIVVEDIIDTGRTLSYLLENLKTRSPKSVRLCTLLDKPERRVVDVKVDYVGFEIPDEFVV
>MGYP000601791154 FL=0
MPALRHMSQTYALCANTSLHRRSWLVRSNTAGLLKRTAPERKKSNGAVPPKRSTSSKNTLLTRVLLGRFPMRPVPQSASSCGLASWTGQYFPSCSPRVCLGASCPRFSVTFIIEHFYLSMACQIDRVKNRRPFPARETRKTLLDRTSASVLWSS
>MGYP000636477196 FL=0
MNTLNVKLSHSISQLYETLCQVGKSTFAELQRATNLKTRSPVWLYARSCTTTKYIRHVSAIPFITLLNNVLHRKFDLTKPDHRIKQANQRVRDKSCGRITAGTILPFPNRDARIVPSNKGTSGVSHWLPFHKAILAIDVSVKTPSRMIKISSASPF
>MGYP000562867999 FL=0
NSFFYGWAFGFGYFFSNLYWISISLTFDSNFKFLIPFSLFLIPAFLALFYGFISFLFFKINLRSTLTSFFLLTLLFSIFEFLRGHILTGFPWNLIAFSFSNYPKFLSIISLIGTYGFNTICISLFLIPGLLYLRNSYINRFVCGIFFLILIFFNVYGNYYSNIFLNLKKIKLDYQIRAIASNFEIKKFYNNFSTEEIIKELIDISNPSTTTKKTLFLWPESIIPGVTKEQFQNQNVGSSINYFLLMLNIYALSV
>MGYP003365983449 FL=0
MLVAVAPLARMLFIALLEPASIAWLTSTALGGQLGVLCWG
>MGYP001155155630 FL=0
MLMVNHALSLVAECRAEARAVFMVFSFCFLELYVVCVRACASRGWLLSSPLGIGNE
>MGYP001568236931 FL=0
MISSQAGQQSSPVEWVSAPELGESMFYMVQRTPDAELLLTPNEAFFPKLGLNAGGEGEFPLEKPELNQNKNFKWISGWDPGDAAEWGLWVEKPGSLKVSVAMDGAEGSYLLSLSGEEKKLSGKVVSFNVRKPGMHVLRITCRADADAEKLHALKLSGSAVENAGLLRKRWRPSAAHARFSSSANPKDVRLVIIEMDAKPGTLGFYAPITTPFGYYGPTWKADGLVNTGFNFSLWSYGRGKEEPPVERLSHLIAIGDPTAEFSGFGHEGTGVKIRGW
>MGYP001201323188 FL=1
MYTTFTQITPAINLRRRRTLSAAGTVMVRLGQKVSADDVIAEAVIPTRHELVDVVRLLGLSKRKTADTLIQRKIGDTLAEQDIIAETGGLFSRVIRTPAPGKIISIRDGQVLIETETRKVQVLAIYSGVIDEIIANRGAVINTTGSIIQGAWGNGKIAVGPLLCKAETSSSNLTQADLEITARGSIIASASCSEEKLFDLAAQLPIAGLILGSMPAALIEKALAQPYAVMLIEGFGKSGMNSAAFKYLSMYNNHEITLNAGVDNETTEHQIEALISAAVEGEIGRGQSRVTSGQTVRIHTAPFLGQSGTIEKVLPGLTLLPNGLRVCAASVIMDNKDRKTIPVNNLDGIGFTQSNLG
>MGYP000016403168 FL=0
LQTVEQIALMLPLCSDLKYRFHYIGNSFIALDCFCAFY
>MGYP001020068561 FL=0
DFVKVCRHAGIAAEAGVQLFFQELAHIQIHIAARRRGLPPQDPAPRRAHQFAGSFMAEPHPTSAEEDLELLRASAVTAGIIAAGYFRRDLKSWTKEFGSPVSEADIVLDKFLHSALTTARPDYGWLSEESVDNADRLGRNRVFIVDPIDGTRGFIRGEDSWTVSLAVVENGIAVAGVVYAPARDQMYEAFAGGGARLNGASLQRQQEPGRRAPLIPAPGAVHQELQAAGLDYTRGPAYPSLAYRLVQVASGTLDAAVARRGAQDWDIAGAAVILAEAGIAFEDVCAGAM
>MGYP001126300050 FL=0
WMVWKEKMMLNWFEKSNRQIYYGILITVSFHIFVVAFQ
>MGYP001386794033 FL=0
PLGGNAAVALLDAAMERQAALIVEWMRVGFIHGVMNTDNMTLSGETIDYGPCAFLDAYDPAATFSSIDRQRRYAFANQPPIAQWNLARLAESLLPLIDEDENKAVEIASERIGRFKPLHEERWKAMMRGKLGLAGEEEGDATLALELLEWMRASRADYTNTFLALAGRVVEGGNAPLPVGTDAWNLQRRARIERPEGGGGAAHAPGGRHNQR
>MGYP002527839631 FL=0
KAFERTHQMYNLGIEGLPYELIINSNPSIAYLMKQNPLHLQILIMAHCVGHSDFFKNNRMFKDTRPDSSVSRSRNARKRIQGYSEDPLIGRKKVEKFLDVLHTIRFQTERNGRKRNTRNDIKKGLIEEYNRNRSSGKNIPVPDLDRKLLHQDDDLLSFFIEYGNHFSD
>MGYP001804104866 FL=0
MLTFPHANTLLFLGIPTYYVSFVPCAWHVCDMHMAFVHFRDWVXKRQNRTHXQKRRLLYSLVSTSINLQXHGRGXWTLTIDSSERLLXDRVLLNKAEQGRXVQCXKSYFFX
>MGYP000506167729 FL=0
SKETMDKCPNLKAIAVLATGYNVVDYEYAKAKGIPVMNVPVYGTDNVSQFAVSLLLEVCSHIGHHNESVHKGEWASNADWCYWHYPMIEVSGKTAGIIGLGRIGRDTASLCTGIGMKVAGYDPFLTKEQIEGMGYEYYANYEDLLKDCDVISIHVPLTKETENMVSAKQLKEMKNTAIIINCSRGGIINEADLIEALDSGEIAGAGLDVF
>MGYP000552990992 FL=0
GGMHEKFLNLRTKIQMLGGGFGNVQGGNLSFYGGDSNLGNGGDLLLAGGPTVSGDGGSIAFEGGIGEEGVGGSINFSSGQGVDLPSEGEINFNTNYKPVFFNTAGNKYKLLTTTQRDALPTTESLLLWNTSTKNFNWYNGTSFASPITDLDNAAGDVTGLFSNLQLGANVVTNIEVADNAIGSAEIINSSITNADLAPNSVTSGA
>MGYP001062954301 FL=0
IYNECHIDKLDSYQGYTVFVDDYDGYVTLYDELKDKRIGIHLFFDSIFDINELKKINVIIKMIIIAMSFILIIVQVWLELKMPDYMSEITKLVQTKGALMSDILIQGGYMLLCAFGSLVSAIIVGYLISNIAASFSMRTRKSLFEKVENLSMEEVKNFQASSLITRTTNDITQIQMFIAMGLQLLIKSPITAVWAVTKILGKNLTWSMITAIAVVILLVTILVLMIIVMPRFKIVQNLIDKINGVTRENLTGIRVVRAFNAEKYQEDKFEKVNNDLTKNQLFNQKAFSVMQPVMYLVMYFLTLSIYFIGAGLIESANMTDKISLFGDMVVFSSYAMQVIMSFLMLAMIFMMLPRANVSAKRVNEVLDTVISVKDGKGAKAKEVGTVEFKNVSFKYPDAEEYLLEDISFKAKKGETIAFIGSTGSGKSTLINLIPRFYDATKGEVLVDGVNVKEYKLKDLYNKLGYIPQRAVMFNGSVSSNIAYGENGKGEITKEKIKDAVKVAQAEEFVSKMENAYDAHIAQGGTNVSGGQKQRLSIARAIARDPEIYIFDDSFSALDYKTDSVLRKELKKYTKDATILIVAQRIGTIMNADKIIVLDNGKCAGIGTHKELLKTCDVYKEIALSQLSKEELENE
>MGYP000237869789 FL=0
GGGREKNTERSGRVGPNGPRVQLRFRVTSSGVTRIKGLTFNDGAREIFSRNSLRPRLPPPIFVSPSVSGA
>MGYP003956841209 FL=0
SDISSIELLERARAVIPGGVNSPVRAFKSVGGSPVFVREASGPW
>MGYP000266856341 FL=0
MSDCNLDKRITRRQFLTFAGGLTDAGFGALPRWVREASAQAKQGRKVLIVLFQRGAADGLNIVPPFNDEVYRKARPSIKIEAPIAGSRTIDLDGKFGLHPKLASLMPLWKDNRFAIVQAAGSPEETRSHFDAQDYMESGTPGVKVTEDGWLNRALVSGKIPQDPMAAISVTARL
>MGYP000179581380 FL=0
MYFHFTVILDIIKELWADFFRKHHVRPIAVGLQPVKQGAKIGAPSVNVQRKYGILPRCFISLPALICSMFRI
>MGYP000648191730 FL=0
IGIEKTNSGSIFKGKEDITKADPSKRGMGIVFQNYCLFPNMTVLQNVMYALNIKIKNKDEARKLSLEMLELVKMEEHKNKYPHELSGGQQQRVAIARTLVLKPDIILFDEPMSALDADNRLTLRKELKNIQSKFKTTMIYITHDQEEAFSLSDRVMVMKDGNIVDNLCATIKLVLPSINFRIRCQ
>MGYP001537497899 FL=0
AASDVYKRQICKQAKNLFLEITIPEQKAYHVQTMLETSGNFQHSWQKFPA
>MGYP000667005491 FL=0
QGQEHPADTAPRQAEQTGAEPDVRFYAVELDRGSQIAYGVWDDQNDRIYVDDEGVSEEFTSRWQAEEYARQLNQVNPLARYYGEGETILIRQYPNGQYYVQYCYDDQDNTVYATAGGFDTFEQAEAALYTHRPKAKKDPIAAQDLAYRQAAEYWSGDEHLVIFREPNGTFCNQYGFISGRVTPTTGSFAKLEEAEKQLYADRPLAQKVQAREKPPAHAPADRDEAERRYQVVVYHHLENGMDEKLEYATPEEAEQAARGYLEGTMEPDGFAYEGTAVYDLLEKKWLRVIGDFPTPEPPAAKEEQPLPSREDTETAASDRDLLGKEITLEGRRFRVEKIDEDGRASLRDLTFEGAVGFPIERVEHISVIRRLMGPAEKTAGPGKGVESLADGHDQGGTEPPLAPQRRARVSPFVLHPEVPNADRHEYHITDDAIGTGTPGERFSNNVRVIRLLKRLEAEDRLATPEEQEVLAQYVGWGGLADCFDERHSKYAELKALLTEEEYAAARESTLTAFYTPPVVIRSIYQALTNMGFQTGNLLEPSCGIGNFIGMRPEALADSKIYGVELDGISGRIAQQLYQQSSIAVQGFEKTDLPDSFFDAAIGNVPFGSFKVIDKRYDRYNFLIHDYFFARTLDKVRPGGVIAFVTSKGTMDKDTPTVRKYLAQRADLLGAIRLPNNTFKDAAGTDVTSDILFLQKRDALSSEEPDWVHLNTDANGLKMNQYFIDHPEMVMGEMREISGPYGPETACLPIEGRDLGEQLAAAIQNIQGSITEYVMDDPEIEGEDKSIPADPEVRNFSYTIVDGKVYYRENSRMNPVEVSVTAANRIKGLIGIRDCVRTLIEYQTEDWPDQDIQAQQRKLNALYDAFVDKYGRINSRANSSVFSMDSAYFLLTSLEVLDDERNFVRKADMFTKRTIKQRVTITHVDTASEALAVSLAEKAKVDMDYMAELTGKTEQEVYADLTGVIFLNPMHGYGGGSEEKYLTADEYLSGNVREKLEWAKRSAELYPEDYTAHVQALERVQPVDLTASEIAVRLGATWLPTEVIDQFIYELFGTSPRSQRMIRSHYSQHTGAWNIESKFADRGNVKAENTYGTTRVNGYKIIEETLNLRDLRIFDYVEDEHGNRVPILNKKETAIAQGKQQLIKQSFQDWIWKDPQRRERLTRLYNDKFNSIRPREYDGSHLNFVGINPEITLRPHQVNAIAHILYGGNTLLAHVVGAGKTFEMVAAAQESKRLGLCQKSLFVVPNHLTEQWASEYLQLYPSANILVATRKDFETKNRKRFCGRIATGDYDAIIIGHSQFEKIPVSVERQRYLLEQQRSEVLNGIAELKANHGERFSIKQMERTKKSIDAKLAKLNDQSRKDDVVTFEELGIDRLFVDEAHYYKNLAAFSKMRNVGGISQTEAQKSSDLYMKCRYLDELTGGRGVVFATGTPISNTMVEMYTMQKYLQYHTLEEHGLLNFDAWASTFGETVTAIELAPEGTGYRAKTRFSRFYNLPELMSMFKEVADIQTADMLKLPVPKANSHNIVLKPSEQQKEMVAALGERAEKVRNRMVDSTEDNMLLITNDGRKLALDQRLLNPLLPDSDTSKINACADNVFEIWQRTADQRSAQMVFCDRVAIRCYK
>MGYP003718977623 FL=0
SKQHVNSAGTNTRGDLSPLSFPPPAPQPFPLVAPHHQLNCQTPYNQGSLLESGDLQKKSHTVGLHLR
>MGYP001491601391 FL=0
EDSFQKSSSLLKHGFLDAIIERDALNEKIGNLCSILLKKNEIETSDAQPQQDREFIKKTAASS
>MGYP002264516364 FL=0
IRYNDVPADLRTADEDLIGGVQTHDHADGDDHLELAVLVVGILAADLGKQVGPAPAEQGNEGKPEPHVFFFLLYYVCVIFVFWIIFSLKGYKIKIKGKRFFHALFFIPSMLPIALMATVFGSMLEYKNGIVNQILRGVGLGALAQRWLADPKLAMGAVCSVSIFMIGIPIMYYTADLTTISRSILEAATIDGAGMKDQLLLIIFPVLKNTHKTIILSMLLGGFREMERVYLMTDGGPGGSTEIIGTYIYRATRSAGSNIGLVCAAAIIVLIVAFIISFIQLKMTSKNG
>MGYP001571232008 FL=0
PLCEYEYGVHWFWPSAECAREMIDSDSEDDWNHSGVSQCEKDASVLSVFYQESMHLLKLDISIAEFVIKHSKGRSXXXXKFKRHQRACGSRFAASAQIIRTEWKCSPLLVAILRELQPCCQRRSEDFIETVLGRSSQLRFGKIDG
>MGYP001478861697 FL=0
MEKNPSLILVVAAAMLGHDGRVLMQRRRHDAQHGGLWEFPGGKVEPAETLQSALVREIAEELGVVVQQAGLVPLTFAAAESASDGRQIVILLYTCREWVGEPVCVDAEELGWFHPRELPGLAMPPLDYPLANALILSN
>MGYP003588991860 FL=1
MKKMGSRCLAALAMVLCSSAFAADKVDLARAEEIVSGRCFLCHGLEGESASPVFPLPVGA
>MGYP000788765185 FL=0
MDMTNIMYELVNTKTSLTIADRTIETLQKQNRRLNRRCLRQSLMIAGLTLSLIHISEPTRRSYIS
>MGYP001606674547 FL=0
ASRDHIRRVIPLTNEVLAQSGQALEAIDMVAFTRGPGLAGALLVGAGMACALGAALGKPVLGVHHLEGHLLSPFLSADPPSFPFIALLVSGGHTQLMRVDGVGRYQLLGETIDDAAGEAFDKTAKLLGLPYPGGALLSQLAEQGDPRRFTLPRPMLRSGDFEMSFSGLKTAVLTLVRQQEALSPTGQLDDRTRADICRAFQEAIVEVLVTKSLAALKHTG
>MGYP000296153156 FL=0
METPTKSKKRFLPAGRRIFLLQAATSVKKKREGKGEHVKSKKGAEAKEIELT
>MGYP001120318111 FL=0
SIATCESEAETTCAFIIDIAGDQDHIANCVGSVY
>MGYP002231636691 FL=0
VGIIGFGRMGRFYWEAMTKSDGWNIAYICDTDPASRQLAKKLSPNSIIVEDNQKIFEDEKLCRLVGLFTLADSLEWKQIEKAIRYGKHIISEKPVADTMENEWKVVEMAEVQMSFLR
>MGYP001205799662 FL=0
NMVSHTVDKLVGTDATNGATRTVYSLTESPTNPDAVSVYLNGVYQRSGSGGANNYDVSGSTLTFTSSLATTDQIDVHHHTFRSTLTKVADNSVGDAQLASGTLTTKGALTVTGNVIIANAGNIGSVGDTDAIAIASGGDVTMTQNLVVNGNMTVSGTTTTVDTTLTLSDAMVINNAGSDVGLLINSTSTGNIIQLQDGGVNKFVIADGGALTYTGAATI
>MGYP000237547906 FL=0
IREQAWSQLLPGLGFMRWPIFRGAVVLAESLHNGYSALKFSTEHGLPPDDDGKPHDAEPHANHRRDHVRVPLGERVKVQEGPRVRRGLPAARRPAGEGDVEAEAFQHLQRGDGGARGELVDEAGREERDAHCRDGAIGQRTDGLLIMGHKQQRRPVAAQMLHPLEAALLEQGIAHRQRFVDDQDLRLDAHLHRKGQPHQHPARIGLAGLVDELADIRKSLDVGDPGFHLLPREPEHGAVHEDVFPPGELWVESRPELQQGGDPATGFNAPRGRVQGAADELQEGGLP
>MGYP003113969438 FL=1
MAHLPPLYHLRPAWLRQAFFLIALTCAVCAGQASACVGSADPVISRLEIEVGRNPLAALDSITQEIADTDPLDKRRLAELYIVQAKALNMGGLDSAPALKKARSAASKLSERAPANILLQMNAYYDLPDEAAKRRAMSSLLRGYRSLPDGSSAKTCRAVDLAFNYSFQEKPREAFTFASQAYLNSADDKSSPARAEAASALAYLVSNSHDFDYAKQLHSEALAIQLKLGMSDLAANELLVRGYTKLKDGEWTDAVADFRESAKQARSYGNQYAVDYALLGVCQAASEGGKIADAAPECERAYQGLGKPDEAMALPATALMAKLFVERGNPGRALAILDPMIAKGKQENASDDWVMALETRAQALFALGRNAQAYEQMREANEAAKTFHNADMQSGAAALQARFQTRELQNLLAEEERASSTRLRLAIAVIAGSTTTLLLLGTLIFFLLRHRRRFRRLAMTDPLTGLANRRATLERVGAALPGPDAPHPRASFALLDIDHFKSCNDTFGHDAGDQVLSQFARVVERCVRPTDIVGRWGGEEFLVILPATGLKDALDIIERVRSEAALEEFDFAPGYRLRFSAGIAMPSETGGVTDACIKLADRRLYAAKHNGRNRTCIDAGIAWAGPPAPTPPPSSGVSGTGSGSAQAA
>MGYP000344450175 FL=0
STQGVSSAASDVYKRQNKAYIVGEEGPEIMISKSSGKVLSNDDSQIFAMLLAANPQLQKVSKARAEKIMRSRFPEYFE
>MGYP001069234379 FL=0
MVSLSERTDLLGAAIEAARLGGVVLREFFGQKKEIAFKGAIDPVTNADVASERAIVEFISRRFPGHDIVTEETRPDLSGSSYRWVIDPLDGTVNYAHDHPMVAVSVGVEVDGVV
>MGYP001488139253 FL=0
MDNLIGKKLDGLYEVKELIGSGGMANVYKAVMLGRNGPVPAGTVVAVKVLRQEYTHDPELVRRFKNESKAISLLNHPNIVKVYDVSVNDQLQYIVMEYVDGMTLREYLNERGGKLTSRETVHFISQILKALEHAHANGVVHRDIKPQNIMLLDNGQLRMMDFGIARISRAENQLLSGKTMGSVHYISPEQAKGDETDCTSDIYSVGVMMYEMLSGQLPFDAEDAVEVAIKQISDQPKSLHEIAPQVPAALVEITEKAMAKLPQNRYASAREMLDALDTYVQNPSVMFEYQYITEDAPEKVVKRTMNQNKAARQNHPNESAAPRGKNAKRKRRTIFLPVLFGITIAFALACLALCWLILNDSSNLMNNKADITLNDYIGMTQEEAQATEQVASGQISVTWEQEYNSNYAAGYIYKQSPVSGRTVREGQGVTLTVSLGTQYVTVPDLTNYVQADAEQQLKSLGVSVLVTQAVDTSVASGAVI
>MGYP000855914706 FL=0
VSSDKMEKTITVSVETVKQHPLYKKTIRTSKKYTAHDENNEAKTGDVVKIMETRPLSKNKRWRLVEIVRQQETMLQVGDNTGAKKVLCIKIPGGSSRRYATVGDVIVASVKEAAPGGVVKKGEIVKAVVVRTKKEIRRPDGSYIAFSENAAVIIDDNNNPRGTRIFGPVARELREKNFMKIVSLAPEVL
>MGYP000079949637 FL=0
EQEALYPFGYGLSYTEFSLSEPEITVYEGDKVSETGIIRKGTGMTVRTVIRNIGKMAGGETVQVYVKSCCDGTPNPQEVVLTLKPEAFELFDIDGAAQILSGEYCVYTGTSQPDKRSKTLTGKGGFVNTFAAEV
>MGYP003113302263 FL=0
KKKKKSSKLTVDVVFDSLYSSLSRNEINGFRSKRINFTGLIGDAVYEVEVPLEDDKDYEGFETGIFSLQNLSTGRFGDFISHTVMVSDNELPEIKIEIVENLNKKVLVLHNLESRELDLRNWELVKGDIKIVFPKNTRLKVGESIVILAGEDQGLFANSLLLDNEKAELLNSNGTIHLKNYEGTKVAEVSISKKEESSNSLVASGQVSSN
>MGYP001378584181 FL=0
ITIVVTNVLDLAGNPIDLYNNSGTDVGIGVSPTVIISSTATNPTNSSPIPIIVTFSEPVTGFDLTDVTVGNGTADNFASSSATTYTFDITPSADGLVTVDIPAGVATDLAGNGNEEATQFSITYTSITYDETPPQVISVDVTDPFTVDVTFSEAMGDGVTTADNYAISGDGQGTLADHPDSVVHKSDNTYTLTWNTGEMRNGASITIVVTNVLDLAGNPIDLLHNFGTDVGIGVSPTVVISSTATNPTNSSPIPITVTFSEDVTGFDLTDVTV
>MGYP000737688134 FL=0
MYRIAVLTNSRAQEAFLTEQILQFCAEHCLFPQMDCYHDQESFFETARSEPLTNAVIALPGVDGLNAVEHLRALCPQTRVIWCSDLDFSLHAFRLRVDYFLLEPITEEAFQQGLSTWLDGKKTSALFRADHNKHNNEEDY
>MGYP000609830271 FL=1
MDFNDTTEEAKFRKEVGDWLSANATLKEDEESGSYPGMGEDDALSLAKKWAAKLYDSGWACLHWPKEYGGRGSTPIERVIWGQEASKYRIPGGFFEIGQGMAGPVLMMYATEEQKKRYLPPMAKGEEIWCQLFSEPGAGSDLAGLKTKSVLEGDTWTINGQKIWTSGAHYSDYGILVTRSDPSAQKHKGLTYFFLDMKSPGVEVRPIKQISGGANFNEVYFTDVKIPDEQRLGSVGDGWKVALTTLMNERLAVGDASGPDFQEAFNLACGHDLNGDLAIKDGSVRDKLADWYCQASGLKYTKYRNISALSRGETPGPQASITKIVSGNKLQEIANFGMDIMDAAGIVRPESADAEQNMYQMGFFGAAGIRIAGGTDEILRNIISEQVLGLPQDMRADKGIPFNEIPSSNK
>MGYP001094161847 FL=0
MNPRYILVLFSGIVVCTLEYYIHILRPQLESAPPMKKPVLQVGNRAKHSTEIVNEMQVTFAYLEGTFLKSAMGMDELTTEMHNYTLLAGIVSASGGPYYFKDSGSAATMIEHKKMFKSFIYSIDVL
>MGYP002524929742 FL=0
MKAVDNDEDFALVTPRDTGDGPVNEVVATVKAKDLWDDIAESAWKTGDPGVVFVDRVWETAPNPQMGKIKTSNPCGEEFLENYSNCCLGSINLDLHINGTDFNWELLEDTTRTAVRFLNDVIEVKDRKSTRLNSSHSWISYA
>MGYP003440339087 FL=0
IIHRINMDTHVVIMAGGIGSRFWPMSTPQMPKQFVDVMGVGKTMIQMTVDRLASLCPMKNFWVVTSERYVDIVRKQLPEIPVDHILAEPAARNTAPCIAYACWKIRKHHPEANVVVTPSDALVLNIEEYRRVISSALEFTRSGERIVTVGICPTRPETGYGYIKTGEYVESEICTVSSFREKPSLEVAEEYLADGGYLWNAGIFVWNINTITEALRRHSPGLASIMDEMSISFYTTEEKAVVEKLFPTCEKISSDYAVMEKADNIYTLPAEFGWSDLGTWGSLWTLKERDENGNAVVGDDVRLFDCKNCIIHTPDLKRVVIQGLEDCIVSKHGDRLLISRKDHEQQITDYSKD
>MGYP001086002945 FL=0
AEQSTRYSMWTEITRPKYERKGLGYSSDLGDAEWAMIEPRLPQRHRLGRPPKTEMRRVVNALLYMVRTGCQWRQLPREFPPYTTVQHYFYAWRDDGVLQRINFELLLEARETAGRAARDHRRNSRTTTVAAHVMRSD
>MGYP003329493463 FL=0
SCKLHEDGSTRRTYQNEIASVWSKEIPIEIPSSEWSNDDVEPETIASLIQRNQKLKALIYEDAESLNLVKEKISKLPV
>MGYP001213017408 FL=0
GPGSGPGQGDARQDTGLGTPGPPLLQVCSLTQRYGNKIVLQDVDLEVRSGEIVGVMGDNGSGKTTLLLSIMGILRPVSGRVMLEGEDITNVPVSARARRIGMVFQNPNHQLFTDQVWREVVAGPLSRAVRRRRAVPRPRRFSTGLTSSRFARATR
>MGYP003197570824 FL=0
KDSEGWLKHTDFIILDMICLQLAYVLAYAISGYGFNPYETIIYRNMAVFLELADLVMIFAYGTMKSVLKRGFCSYVKSCDYGRCLSGFIFIPAS
>MGYP001590617569 FL=0
YNTLFIHFRQSIHTLLRSRPVGKRFSKFLAITGEAFWASLGSFGGVQYWYGAVVNEWIVADAWASSCVPHAILYRMDSGTHVEVDQAFERAYEHSLFLCAVFCDCTFWSAPREVEWVFVFFALGTPFKRKNTILISNVKCTDELACLIPHHQIQRGFRFTDPVLQYVTRHWISLMVYLILCASQCRT
>MGYP000882899174 FL=0
MLLNVTLIVLCAGNSTRFEHKTKKQWIRIENEPLWLNVSKRLASFSQFDKIIIASHEDELNYMKNFTDNFIFVKGGETRQKSIINALELVTTKYVMMSDVARACVPQSAIKNLL
>MGYP001793805036 FL=0
MRGNSKYMRREILFDSTRPILCNTLTSGVCDGILLLARCIRFDISPYDPPSPPI
>MGYP001580518470 FL=1
MSWIGGIDKVSRERRGIKDLVNGWDKGVGFGIYLLNI
>MGYP000055909560 FL=0
EALLVWTAHRCITSLELVLTAMSEHAPLDDRPFWALVGDAGYNKDPITAFGISDAFRDAQLLSEAIDDGMSGRAGLEEALGEYERRRNESAMPLYETTLRAAEYDQHHPRSLELRAALRGNQPDTDLFMGVLTGSVPKEEFFNSQNIRRILSQAKDGGSAA
>MGYP000181573229 FL=0
MGSKKILLVEDDPNFGTVLKDYLALHDYNVTHAKDGIEGLIEFKNGEFDLCILDVMMPRKDGFSLAADIRSTNKEIPIIFLTAKTMKEDVLRGYQVGADDYLNKPFDSEVLLFKIKAILQRKESDVNKESELLQEIRQFCIAAGRNPNLDSIITYNYDDLLESCLANIEVDIPFKSIHASGMKHKPHELPIYHVHGFLPQKSKLTNKNRVVLSEDGYHQQYTDVYGWSNLSQINKSVSYTHLRAHETVLDL
>MGYP002759741552 FL=1
MSNPVPASPFSPVAIGPLTLKNRFIKAATNEGMSAGGVPSKQLAQLHGNLAAGGVALTTVAYCAVSRDGRTLPNQLILEPASLPHFKALTDAVHGNGGLASAQITHGGCFTFIRERSTRRPLSASGGFNKIGVMSGMFFKQAMSEADMAQVVADFAQGARLAREAGFDAVEIHMGHGYLLSQFISPIYNKRRDQYGGSLENRLRFPRRVLRAVLDAVGQDLAVICKYSITEGTRAGNSADDGARIARMLEAEGAHLLVLSAGMNAESITTMFGSSFPKENRVQQKNPLIALAMAIQRRTEPEVKFRELYLLEHARKVRAAVKMPLAYLGGAQGLAGIEQVIGEGFELVAMGRALIAEPGYVNKLASGEERNNRCTACNRCVAMMYTPGGTSCVLGEPGDAALNRVPAGSA
>MGYP003289090808 FL=1
MKKSILLWLMVLCVGIVSAQTIEINTVEDLSALATNNESQNGYVGQTIDLKADLTITKVWRPIGTRDYPFRGTFKGNGHIISGLGAIAGTDGVGLFGYVGEEGVIEEVGIGTGHIKTMKNDECQYVGALVGRNNGTIRRCWNMATLEVNAIHVGGLVGQNSGTTEDCYNAGPILKAIDYIGGLVGTNTNTGAIRYCYNIGYAANGYGVVAQNTGTINDCYYDRQLYIQNPDAGHQDPTGVTAMEKSADMYTIFSARSAWQQMGDNYPILKVFQNQDAAIVSAASIDLTNKGDALADNHMNLLTSDFIVNSKNGVHWEVTSPLMEQWVYPDAANANQWRVAFPCRPTDVIMQVSKNGNVREVYAFPKPVPDFIPGKFAADSFVVCLSETLNFKDIEFKEKGYEAPSGGAGNYQVKLMLNYLDEKGEVDHNEILISAPSWGDYIALYNSGSWTPSEPGHYTLQRYAADEQCHPELMEAEGVVPIFVPANLTAGDIAGDAILCGIDQTITIHSVEPAICEGTEVYYFWTKNGIEITGEDNASLENYPMNTSGTFVFKRYAYNNACVSKDHPLEAEHSVTITVYEEFVWGAIVEPSDTIIGCTVQDVLNQLSVISEQETVRGGKKPYSYQWMMKIDDGAAQPITGADQHDLNLRDAGLEDAHDYVIYRTVKDSHCQTEWIKSDGQVKIQIYSKITGGKIETKTIQADCIMPEEKGAIPVQIQSRQPAQGRGDIDYKWYMVVNDETFNPIDLKQHTESLDYKLDYGSVQNNATYTFFRTATNKSCGGEEVRSEGETTLQVVIATNVDSTLLICESMFENGQYTFYYPNAENPRQTNIFYKDDLQIWEFNDKLESGCEPRVTIRPVLTLAPKIHADNVSTICQDGDAGTLTIYFEMLEGKADTYNIELSESLRPFFDGKQYISGTIPTVTAGNSGAITVQCQRIGISGGDKIMNLQVAQQIDGQELCYSAMSEIVLNVTQGGYVLDKYGKVLFIDNNPKHPTDPKFIAYQWYKNGQPVEGATGQYYHEDGASLNGSYFADLFYFNGGREMILRTCPIEMENGTKREQENATDSVSKRLENSQIIIQRGDAEYTILGSEL
>MGYP000988737932 FL=1
MRLILVFLTLLLAAASAMPQDAHPHEESLPAWFAETFLDLREDVAEAAKAKKRLLVYFGQDGCPYCRELLQTNFSQKRIVDKTQRHFTAVAINIWGDREVTTMDGRTQTEKEFARALGVQFTPSVLFLDEKGQVVARMNGYYPPHRFEAVLDYVAGHMERKRSITAHLRTAAREAASPDLHAEPFLIPPPHDLRRRPGGKPLAVLFETRHCAGCDELHRDGFRRPEMRNLLNGFDIVRFPLFGTEKITAPDGRATTAGDWARRLKIAYSPSIVFFAPDGREVFRIEAYLRPFHLAGSFEYVATGAYASEPEFQRFLQGRAGRLRERGEAVELWK
>MGYP003328125236 FL=1
MNIKTNISLKSYNTFGIDVNAKYFFEFSSVDDLQYLLSDKSLKNEEKLVLGGGSNILFTRDVDALVLKNEIGGIELINEDDTHFYIKAGAGVVWHEFVLYCINHGYAGIENLALIPGNVGASPMQNIGAYGVEIKDVFHSLEAIDIIENKKVVFTNSECEFGYRESVFKNIYKNQFVITSVVYQLNKTPKYNIEYGAIREELDNMKIDHLSINSIAQAVMNIRRSKLPDPKIIGNAGSFFKNPEISSAEFENLKTEFPKLVGYKNENNSVKVAAGWLIENCGWKGYRIGDAGCHEKQALVLVNFCNASGDEIYDLSEKIIESVKNKFGIQLQREVNII
>MGYP000122910653 FL=1
MLDLATAEYSLVGCVLIDARCLPAAREILPTAEAFASEPCRKAYAAACRLEDEDKGIDPVIVGRAAGLSNDFLMQCMDLAPTCTRAAEYAKAVLDGYQRRQLQALGEKLQTEALCAGSTADQLLTEARSTLDDLASTPGRCSVKSARDSLLDFMTFRAEVQQGKRQAIRTGFPSLDRILGGFAQGGFYVMAARPGVGKSALGIALADMMARDRRVLYVSLEMTEAELNARRVAAVSDITCTFGKLLFGKTTEEQDAAIANACGKLYAHKLQISAVSTLTVPELELQARNVGAEVVIVDYLGLLSAEDKRLSEYDRVTRISGDLKRLAKRLGCVVLALCQLNRESVSAPGQDTRPRLSQLRSSGAIEQDSDGVLLLHRPEYGRTETPREASAPQQFFVDVAKNRHGRTGTAELAWYAPVNRFEDYGGKWTVKSWM
>MGYP001552508999 FL=0
LAGAGISTLDPLEDNERGVIISTASVAAYEGQIGQAAYAASKGGVVSLTLPAAREFAQFGVRMNAIAPGIFLTPMLQGLPEDVQQCLAASVPFPKVLGNPAQYAALVLHIDHHHRADRARQVVX
>MGYP003447821379 FL=0
SCTKNRFLINNNIQLLKQQTIMDLNEFVAHFAEQFEDTDASVFTPETKYHDLEEWSSLIGLSVIAMVDDEYDVTLKGNDVKNSVTIEDLFNIVKERA
>MGYP001289232407 FL=0
ELTVSENRLVYDSLVRAGEAPPVVWDTVKAGNYGRVYIYTDDERAENLKISNLQSASRRILLSDKTINGQHYTTQVYLDKTLFLSTDGPKGPITIQVKSVSEDYFTYLKGYEQFEASSDFNALSQPVRVNGNVQNGLGVVGGAYVQEFQYLYDRW
>MGYP000237473348 FL=0
MTPVGLWALGWQNTATGRWSRAAASWSGGNIVARQAGNVNMLCYVVWASLFSIPPLFALSLWLEGWSAMVHGVRSADALTWVAVLWQAVGNTMLDRKSVV
>MGYP002446805835 FL=1
MLRVQLICTGKLKESFYAAACEEYNKRLQRYCSPEIIELPETGDIKARRRGDARAHRLWRPRRRHVH
>MGYP001329416472 FL=0
ETIQSKNGCLIKGNISSSGDRIYHVQEGQYYNETKISMSLNSARKCSECNGIGAKNASDVKTCTKCDGSGVFVQIQQIGPGMISQSTQTCGICQGKGKMLDPSKLCKRCNGKKVEKKRVKLDLQLNRSHKDGDKVVFSEMADFDPEATTQGDLIIILKEKNNQQFLRIDDDLVYTKTITLLDALCGMDLTITHMDNRKLFIKTSEVIQPDSIYRISGEGMNKNSNLFVKFKVVFPSKLSEERKKYLRKLIQTKVTENVQDKEENTKDREIKFLDDLNENEVVYINEKINILNLKGKTSSDNQPEYEYSGEEEGIPACAQQ
>MGYP000295350481 FL=0
MVRNRPKVRKKFVVIRPKNHRKKAAGCPIEQPAAYLFT
>MGYP003428885701 FL=0
NMITGAAQMDGAILVVSAADGPMPQTREHILLARQVGVPYVVVFLNKCDMVDDAELLELVEMEVRELLSKYEFPGDDTPIVHGSALKALEGDQSDIGVPAIVKLVAEMDRYIPLPERAIDGAFLMPVEDVFSISGRGTVVTGRIERGIVKINDEVEIVGIKDTVKTTCTGVEMFRKLLDQGQAGDNVGVLLRGTKREDVERGQVLCKPGSIKPHTKFEAEVYVLTKEEGGR
>MGYP001619181529 FL=1
MKRTVLWSAIGIALALTAPPVQAEPARSADLPTLIDQAMRKSPGLQAKKRAYEAARGRVVSAWLPDDPMVGVDVEGQPDLFNFGGRTNNEYMVSQTIPFPTTLILRGQVALRDAQMAFQQYKEKERDVVWHLEQPYYEFYLAKKTRAALEEVRALLEKLAETARRRYEANQASLQDVLKAQIERSKVDIELYQTAQEEHIAQAHLSHILNLPLNTPYELPEERHSPPLSWTHEELEHLAVRMRPELRAAELGIKRAKASRMLALTRWLPDVTGRIEARQFKADGRANERDTFIGVTVPVWSLLKGAGGEWKSAGKDVEETEAAYQELKNEVLLSVHEAYAKAKTAEHALGVYEQFTLPQAKQQVELALSAYEAGRAGFXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSPSATCTTARNSTRASRAR
>MGYP001234761162 FL=0
SGYKCGIDLVFIFIVVFKLILNLHYDLRLNPIDICKTVSTNFKTEIFDVRDRHEGTHI
>MGYP000998860503 FL=0
MKRMLSYVVWVLSAALLWGCSKRAMGRMESGAKLPVHFSCEGFSKTGGAATRVTGENFEPGDVVGMFSYPSDGPMFGSGDFTKGNVPYVYMQEGELLVREGEVPLYFPDDPSVPLTFKGYYPYSEQMTADGLLTLDLADQRAGEKNAVLYSDNAQRIVRTANYVGLEFGYAMAQVIIRIQYDPDEMPDGDLAAVSAVTLEGEGIYSACDFHMADGSVTAAAGVPARGTIGMRPGSAETTATVAPATARDLTVSVTTPAHTYVARPKDITYERGRQYTYNVTLKGGGEAQIGEASIVDWEPGNDGIPPIIGVPEYEQR
>MGYP003398871467 FL=0
YALIDLPEFFDWLEANAEKLRAGDKAALAEAVRVSCASKARIVAIDPATYADAVTWSEQFGADVDEVIEALSSSTEESIPVIAIEGEPVPEVGSFGLGRTYPYRVVATVRGFPTAGNRSVSVLASADAINEYAARGGDEDAPAVTESFRRTAVSQAGADVLTSLAQAQRIRRTPGTAAERDKARVDWLTQYNRSSAKDNAK
>MGYP002477722919 FL=0
CICVHQAEEEGASLGGWDERAESAWHATWVASLSRCIAYASKASAVAFVQKQVRVATLVVEIMIDHACVSLDLSLADQAANNNSDLVIMEDHKFTNPYEEQKDHINEYTAQEIATLQSRLDKQLGPEYISTRPGNGGGKVHYLAAEKVINLANEVFGFNGWSSAIRDVQIDFVSFSDSPRSLVMLTTTVRRESNNRKDQLRTVYHCARLFERWHIPRGKLSSALIYPLELTGVDIGYGHIENCKGKAAAFEKAKKEATTDALKRALRNFGNVLGNCLYDKDYLQRVTKVRIAPSKWDAENLHRHPDYAPIKKEAIAGPSAPTTIASNPPARMPSAQSNTSEFEDEFGGNLFDEVDFSHPDEVRLDNSITEVSVETPVRPPANSVSAQAMNRQQPNRVASMPNVRQFSGGPQQNGQQNGQQARPQVPSQTFKNTNGMNNQPPNRMMGPPHQASNQNGFRSNPSSASESTTTNGRQITPPESVITPSQVPSHVPSGFVSGAAASALVQPPESGAVPPIKLFDPHHESPSIRRTQGVDLRKSAPIKRSEVGAPTVPIPNPKPMMNGGAPANRSNFVNPAMDAGRRIGMPGMQQSPLANRSAYKPPAMKRPLPAEAPVGRPPLADMSNVQQTDGASDPKKLKMDAVQEPPNPASGETGAAA
>MGYP003292343469 FL=1
MPVLYISHDETLIEKTANMVIHLEQLKRKTEPKFTVAKMPYRQYVEERLHNFDRQEQQALNERREKRKRDERFAEIYQKVQTQLAGCSRQAPSVAKNLKDKMHSVKAMGKRFEREDENMTEMPEQEEAIFFKLGNKEDSIPAGKVVLEYELDEVFRYNSKTKKIMSDYWVKVKIAKNKVAPPFKTAEFDIIYGKGISREGDILDLAADVDIVNKSGAWYAYEGNKIGQGRENAKLFLQNNPEICNLLDAKIREYYSLGGAISGEKSE
>MGYP002583638056 FL=1
MGLFDFFKSLTNSKTEITSTDNDVTHLTNITKSGLSIHPDLVDLIWIGDGKYQNYSNQPHPTMTYPYRGFVVKVAAFGAEEPSLLYLKYPIEQVQPSEQIERPPYYPFYGELTPKQKYLYWKFLNDPYNPHNDIGYVFIFYYGLERHLLYGDFEKAFNVILKLRDVYNNRSFQHYSAGALILSTLIHKRADYTQKFINSLDKDYEFQMPGELYFLCKLSLGIPITAFDIMKFHKFFNFTNTRYIKNNSDMFLKNLRQNICYQNNGRESLDASLYCTESNFSHLPTISLPIFANVSIREKEVTIPNLSCDSHFMGCIFLLLDKAHQDTKQELANLRKGKSANSTTEEQSTESHTPYAGSYFDDKKFMSLQQIYYDNSQKIESQWSILYNLKTYTGSNADRYMELCRLNIQQYTKMNDRGKHYTDYESPLGVPAYRRLAMLYEKQGNYEASFEVCIEAIKSGILYDGNKSGFKGRAARMIKKGNIQPDEEIITLLME
>MGYP001139541149 FL=0
MDIQEILEHLPHRYPFLLVDRVLECEPGKR
>MGYP003566972480 FL=1
MRLSIRNNGRYLVEFDRLDVQGRNAISGCGLVFSLKGSSPGSEKNVNIFGIQIGLYHSEDSKFIVPSISCADSLRQVSQYSNNNENFHFEAVLTSEQINAIEEIRQDGDLKLTLTLKALLSSSSGLANSYERSEVVVPRELWLKALRSSGFCRTVLYEIPLPASDIDIEGLITKARGFIETGHYKDAVMQCRHIIESLEELRGDKRQAQAANRMAHSDSRKDMTSIERLLSLREQLKNVCQLGGHGREAFTRSQALSVLGMTMALVSEPTVGALVNAVSEGTERGEA
>MGYP001095359691 FL=0
MNSRRSWSRNRCRFDARTDAAGEPVLLADQDRTRWDRTLVMHGLAALDRATTLGRPLGPYTLQAAIAACHSRAPRFADTDGEAVVALNDSRPQLAPSSVV
>MGYP000548248604 FL=0
MDEQKRPRAWVYARIPGDYDGTMNSYKVCSMQALHDGCDIVGGSIDERGGWLLRPGYRDNPFGGDRPSQT
>MGYP000364143963 FL=0
GDGTFQPAASYTAGIPYWDPAHAVAVGDFNGDGRADLAVANLGTVSILLGNGNGTFQSEVKYGTAGGSTIQPIAVGDFNGDGKTDLAVASLGGTNVAILLAKSDGTFQPAANYAVGHQPYGVVVGDFNGDGWADLAFASNVDKNVTILLGIGATSTPDLIISKTHVGSFVQGQTGATYTITVSNRGGSTTSQVTVTDSLPVGLTATALSGTGWTCSLGDRKSTRLNSSHLVIS
>MGYP000838638459 FL=0
YTRLFVGSSDVYKRQAAGQLLYEKGFFFVTFVWGAALAAALIKRWRDGGSLSTVKK
>MGYP000110898291 FL=0
CKIICQKLAEMGFFDSAMNDADQQFGVLLRNNDPDAYTGYLRWAKPVVELLEGKGSATFRKVVFFWVRDEQRRQQMQSNIVAHYLDVIARPWAEEMAYRMQAQGYDKSNPAGRFIMNIGLPMCRVISKFGKKTELPMWLKTALIWGTTTVLLVAVSAISGTDKVLNKLRKHLYRDWE
>MGYP001080633953 FL=1
MSPGQAASLQLSTARLRILPLDSENLRLSLEAPEQMEMNLGLQVTGNRPQGEVRDAVESMLAHVQQDPENWLWHTHWQIVLKRDKLIVGGCCFKGPANVRGEVEIGYGIEPEHRRQGYMEEALSETVRWARQQPGIRSVTAET
>MGYP003432707236 FL=0
MAGGSQIIISSDGIIIKTPGEFKVFAGQHIFNEASVASLKATHLQHLLPPCDVIPKAKITPDVHFPVMGILARIERLDGEKINSTDKLLINGSPLKEVWIAENAYEPAYGARPLKR
>MGYP000920430015 FL=0
RELAEVWDELREYGEQVIIELKSQPSVYRIKDKLVKWDYGYDLFNDKLVAIKGSLTLNAFH
>MGYP000639132496 FL=0
MGAYILRRLLLVIPTLFGVMVINFALTQFVPGGPVEQVIARLEGGGDSIQNLGGSENAGVQEEEAVGEGGDNGYVGARGLPPEFIAKLEVQFGFARITCDEGFTGTPSVTAPECRKEKIPAVERFFIMMGNYLTFDFGQSYFRSISVVDLVIEKMPVSITLGLWSTLIAYLVSIPLGIRKAVRDGSGFDTWTSGVIIAAYAIPGFLFAILLMVVFAGGSYFQWFPLRGLTSDNWEELSLWGKIVDYLWHITLPVTAQLISSFAVLTLLTKNSFLDEIKKQYVLTARAKGLSESRVLYGHVFRNAMLIVIAGFPGLFLAVFFGSSLLIEVIFSLDGLGQLGFRSAVERDYPVIFGTLFAFGLIGLVVGILSDLMYVFVDPRIDFERRG
>MGYP001328790198 FL=1
MSELYEKTAVELGKVLSSGEASSEEVARSFADRTAKVDDKVHAFLNRDDEDFIRQAKESDERRSKGAALGPLDGVPVALKDVISHKGQPLTAASRILENYVSPYDATTTRKLKEAGALVWGRLNLDEFAMGSSTENSAFGATRNPWDVDCVPGGSSGGSAAAVAAREAPLTLGSDTGGSIRQPASLCGVVGMKPTYGMVSRYGLAAFASSLDQIGPFSQTVEDTALALGVIAGHDPLDSTSFPTEVPNYLETITKPCPKMKLGLPKEFFGEGIDEEVRKLVDEAISFYRKEGHELVEISLPTTDLAVPVYYLIATAEASSNLARYDGIRYSHRSERAENAVDVYAKSRGEGFGEEVKRRCILGAYALSSGYYDAYYLRAQKTRTLIRRDFEQAFQEVDAILTPTSPTPAFKQGERAEDPIAMYLSDVFTISVNLAGLPAISVPCGHTSSGLPVGLQVIGQAFGETEMLAVANAYDSVHGFGRKCPEL
>MGYP003694182255 FL=1
MKLNCAAIPTGLLESELFGHEKGAFTGAMAQRIGRFELANGGTVFLDEVSEIPLDLQTKLLRVLQEREFERLGSGRTLRTDARLIAATNRELGALVDEQKFRADLFYRLNVFPIHVPSLRERPEDIRCSSGISSSTMRAG
>MGYP000441261351 FL=1
MRLNIRKSIITGISLATLLPAFSLLQSCDDSEAEKWVDLRYRVEDSYLVEAKNPEPVSFQVKSTDPWEVFGKYDWYTISPSTGEAGETYTVTVTCKENTELDDRIDTLNIKSDYWTGKRFVLTQKGTAYLNVEGVDMIDQEGNSETFSVLSNQKWTAKVTDGDVWLLHPIRSIGRNERRNYCHRFTEYRRTTYRYCNHL
>MGYP002925163669 FL=0
FAARKAFVRECIDANLVLETPDPVIDTQFRYAKLRAAESIVATRGGYMHAPGGESYYAAIWANDQAEYVNPFFPFLGYGVGNASALNSFRHFARFMNPAYEPLPSSVIAEGDDIWITDPKGREHRLAMLRNQTRGQDNLSLADFIAPKGDWIGCFAVTAGIGLKELCEKFRAGGDDYNAITVSYTHLTLPTNSR
>MGYP000555143592 FL=0
FTTTGLKNNITRYMIASANWNLGGTSSKTLYANQLYTSERGTAVYSGHTTMWQGKVALPYASDYAYAAAFGNGSSLLCSSNINSYSSTNCKNNNWLYTQFKSGSAWLITPYSGNQYDPWLVDTTGIGNYGSVAYNANAIYPTVYLNPDIVISKGTGTSDEPYQLSADTVTSSQVGEYFNGYTSYKNLDFAYYDFGSSVSVIAKFKIDDYPIKFADIVANWETGGFGLVIDTDKKLKFGIRTTTGSDYVYAASSGAVSLSEWHTAVGTYDGTTIKVYLDGSLVGSTTISGSIKSTSAQIAVGADPYTGGSASGEYFPGYVSEVSVIDQAIGASTIATYFSKSTPSTTTYTNTKTLVKAKSTSLNSPTLVKDSIYRGKYFDGTIESGSYVARAELTGDTYFSLGTQWNDITKAYGLSDKEMFNLFNTRALDDAVRQGKSIRFSQNPLEWKGTALGDEWLYLQSKHGYTRLKKIGDYWYAK
>MGYP001202979195 FL=0
LCLIRNEYLWYPTPKQSPLLGVAGLGGGIASRLGGKAPNPYRGLVGNGSLRSGFTNLQMAFPFTDSKNGLDLSGNNRNLSNWSTNTPVEYAVTGVDKNGDPPPYTTSYGKTQSGPDYGWKNLSSDFNFQGSKTYTMECWFQVNSPDTGILMISMRSNESEGQVLTASTSYGIKSLAWSGSEDYTLSGGTIVVGQWHHGAYTRDSSTSPDTHTLFLDGTQVAQITSDTYGDAYDYNQYGFATFGGGGVAYYPNSFMQDLRVFDTVKYTSDFDIAEYLPTLDA
>MGYP003457825976 FL=0
LEAACRRDEPAALIVEPLVLGAGGMLMYAPQVLADMARICAEHGVLFIADDSGAYDVYDIPASGGPVRRLTRLAAGALDPLELDGNLYFAGYRAAGWDLARASPFEYTAICLSNASGAVISSIFSARSNRVTMSSTESDCSA
>MGYP000975471581 FL=0
MSNYVINHLRELESEAIFVIREIAAQFENPVLLFSGGKDSILLTHLAKKAFYPAKIPFPLIHVDTGHNFPETIAFRDMLVKELGVQLIVGSVQESIDKGRAKEETGADASRNALQIVSLLDTLEENKVDAAMGGARRDEEKARAKERFFSHRDEFGQ
>MGYP002779293856 FL=0
YHWLTETIKRNSMKYKRVLLKLSGEALMGNQGYGIDTTVLTTYAQEIKNVVDKGVEVAVVIGGGNIYRGIEATATGIDRVQGDYM
>MGYP001768057102 FL=0
ISEHDALLATHVATILSGGDRSPGVASEQDFLDLEREAFLSLLGTQKTKERIQHMLKSGRPLRN
>MGYP000742296790 FL=0
MKTRNDTNFTSTKKFLPLFVAIIITAIFLSNCVPIEQPKPEAPMAVTEPAPEPR
>MGYP003387108590 FL=0
QLAKAEGLRVIADSSTEDKELVTELGADVVVPRGDNISEQIRNIMPEGVDGLADGSVQNELSVGAIREGGSFASVRYWEGTGERDIKFHRTSVSDYFQRSDLLDQLSKQVDDGILTLRVAETFSAEQATEAHKKLEAGGTRGRCVILL
>MGYP001556444362 FL=0
MKLKIQQIKNPLLFIGLLLGLVFMVTSCQKETNEPDQAFHKAKKGPQKEEIVVVANRLDGSISFIDAISDQVQNTLSIAGSEPMYVVYVPDNDRLYVGDRAQDKVHVIDPATRQVESSIDVGNGVFHMWAGGNGDQLWVNNDQDETTSVIDLSTNTVIQTISIVLK
>MGYP002617661281 FL=0
GRGGVAGHDDHLASLRDEAGDGLVGEDVTENLKTIRSIPMTLEGAPARLIVRGEVFMPRASFARLNEAREAAGKSLFANPRNAAAGSIRQLDTSVTASRPLRFLAYGFGDVRFGGVQPWSTYEEVMGRLRDFGFETPPGGRLCRGSEEVEAYYASLSEKRESLAYEIDGVVMKLNDLEAQEALGYTARAPRFAVAWKFPAQQATTLLLDITVQVGRTGVLTPVAELEPVNVGGVLVSRATLHNEDEIRNRDVRIGDRVVVQRAGDVIPEVVRAVLSERAPDSQ
>MGYP000022545691 FL=0
IAQKGGIIMDGRDIGTVVLPQANLKIFLVASVDERAERRYKENLSKGIPTDLERLKVEIAERDRKDSTRVVSPLKQAEDAILLDSTGKTIKEIVQFIEEKAKKLMENEFFYIFLYYKSFASFCRNYQTLI
>MGYP000539356882 FL=0
PPAWAVYIPIETPNTRSGETATAANADDAGYIDANKKCHWYSQENTGNAVANVKGAWFTYIVFFNGVHITNNTDPAIWNTGAAGTGTNGTSGRAVLTLKLIHQDPREYVLQLNGVDLKATDNYSVMRMTYVQPNFNNMPSSPYTIGSSSYEEFRHHNESQAAFTLPAAGYWISADEVSYSFWEEISGDATLDATITQHLQDDLITGFRNNYIGLNQPITYMSYDEVTAFCSGQLSAKIGTTARLPNEAEWEFACRAGKDSTYSNMKGYTLDGISSNPFDAGNNDPVDDNNIKDYYEKVEVYVNGSNTMPCPVPTILSNENQWINGAWESKAFSVFYTIESEIKAIKQMI
>MGYP001030690318 FL=0
MHVLLDELAEFVRSHRLENEKFHEGAPGAANILLIWRIDVICKNLTFKQVLPSLLILAKVFDQW
>MGYP001004560480 FL=1
MARKVGFVIGLILLVCLTPMFATGAAETPVTGAGPKVINLWSFTDEVPKMLEKYKELHPEFDYEIKTTIIATTDGAYQPALDQALIAGGADAPDIYCAESAFVLKYTQGDAAQYAATYKDLGIDVDTLLKQADIAQYTIDIGSNERGLVGLGYQATGGAFIYRRSIAKAVWGTDDPAVIKTKVGPGWDKFFEAAAALKAKGYGILSGDGDLWHAVEGASEKGWVVDGKLYLDPDREAFIDMSMELMQKGYHNDTRDWTDAWFADMKDANPKQVFGFFGPAWLINYVMAGNSGGTKPGEGTYGDWAVCEPPVGFFWGGTWLLANKDSKVKDAVADIIEWITLDSSDTGLQYFWANGTLAGPGGTKDTVASGTVMKKSDGSLPFLGGQNMFDVFVPAGQFATGKNKHQYDETINTYWRDQVREYTGGKKSRAQTIADFKQMVADNLAIPVK
>MGYP000510584249 FL=0
MEVLVENLTFLTWQQVLMWIIGGTLIYFAIVKEMEPSLLLPMGFGAILVNLPNSGAAGVIAHLFQLGIAGHELFPLLLFIGIGAMIDFQPLLANPKLMIFGAAAQFGIFFTLGLASLLGFELNDAASIAIIGAADGPTSIFVANVLKSHYTAAIIVAAYSYMALVPIVQPFCIRLITTKKERMIRMEYTPGKITKTTR
>MGYP001059407761 FL=0
NGTQAKDEGALPLTAAQSATLKQGLKLVTGPNGTAASAFANLGYNDFLGKSGTAEDSGEQSHVDFVAAAPAETPTVLCTVFLDHGTSGSTQAGPIARDIVLAALAEGL
>MGYP002518956829 FL=0
MVSWNNLDTLASYKELSEVARVNLAEAMTGENGAERVKKYSVPMAAGMAFNYAAKQVDDNVLAVLAKLADEMQLVEKFQALYNGEVINTGEKRMVLHHMTRGQLGEAVTADGGDKRAFYLNEQKKIAEFANKVHNGEITNVQFGLYADADMIADDGKVIPKGALLETAYCDKDGNIIKSGKCDPWIIKELYPTENGYMTKVVGSNVALDLIILPSLKNSLPLCQTEVTPTVDTSTACPLVKSII
>MGYP001810087265 FL=0
IMRRCSQTADLLNAALSGSHGXCPGREFLCTLHRCGFKWXDVQTDAVCRHTCFRRLWVGCVCMLCVCVXGXGXVSXEGVVIGVWLAGTGALCVCLXRCGFLLX
>MGYP000952481259 FL=0
FELESHFVAQAGQQTDSVSKNKTKQNKNKKQN
>MGYP000924557708 FL=0
WRTDHQSFAENGVNRWLRTWPGNELTKTNIAFYWFRGLHLSMDYVPDVAIRQPDHAERIHQALMQSPHEAPMPEAVQAQFAQLAADNRAREPWIARLWVPLVHLQTMLMQASAYPEVARLLDRVAPGLGQIVLALLRAGILVGLLLLVLHWRRLRLWDQQVRLARGFINALAGDCEVIRVQFNSRPVTAHALASDKG
>MGYP003568761090 FL=1
MSRLDSMLRRFTAQRDGLNWAASFIEGMEGDALDMGLGNGRTYDHMREIMPDRRLWVMDRILQCHPSCVPPEEDFLQGEAEDGLAGLKEMGAKIVISHYDFGFGVKEKDVEEAARFSPLIAEVMAPNGVIVSGQPLIGFEAVKGPDHIAPDRYYFYRT
>MGYP000894995155 FL=0
TLPLFGGCTGQDGDKGQSNAKTAGKDSPLVTIRWFQEARGQDPNKDRILQEIQNKLNIKLEFVAAPAGQESEKLNLMVSTGEQLELVTAFDIDRAAIQWAKDDFIYAYDEFMESGDYPRIKAILDSDVYKDLKVNGKSYFKPQPLWPGLRGYVIRKDWLDNLGLEIPTTIDEYYNVLRAFRYDDPDNNGKEDT
>MGYP001069368337 FL=0
PALGGGEQALEDRPIVDALDKAEIPATIVIAFEIVVIELRADAPDRPAIADRQPIGDLGMIEIRIGFRIEMVAPLKHQRRDPMGVIGVDVERDSDEAVYTGTVADLLDAEISHRQRHRSLRRAQSTAL
>MGYP001036930292 FL=1
MRCIFLFVFLISHLVMPFLFFLLYFCFLTLCYDSNSK
>MGYP000703538265 FL=0
MLSYPVNVAGLEKLDIGFAAYTRYVAPLLEEALKGLIIVALLRSHRIGFLVDAAIFGFAVGAGFAIFENLFYLQALPQTQMGTWIVRGFGTAIMHGGATAIFAIVSHTLIEQERSFALLPGFAGDVIKTVQAMPGVARPTATDPGAVVVRGSGNYDTRFFVDGIDLLVVVLANEITALSGGQPHPGTAHDTQGRRRKPVDLYALAQAALGNGLFAVLLWLLLDPKLWYTDGVSPDPVATTESPEDPAVAAPSGDAADKSAKAESVRPHDVLRSAGRLLAALILVATALGYVRLANFVFHRGVLLAAFLISVWSVRVLAAWGLSRLPAAKPPGAHA
>MGYP001563729933 FL=0
MVERNLLREGFVVNTRTPLGTISGTQVVTPQEIDRLADSDIATTALIASGTKLLSLDADLGARFKISRLELYTAE
>MGYP000417054785 FL=1
MTTAEASGKNFGSLKITFKYPCDFYISGHHVVITIVFEYHGDIEELLSHNPNYD
>MGYP003967751787 FL=1
MIYEKYNNMIQQLVMFNCTSVIIINELTQSNTDYYIGLCIKILTIFLIILYKI
>MGYP000178255560 FL=0
MIKKTIKYVDFNGVERTEDHYFNLTKAEITEMQLGVKGGLDKYIEEKVYENDTE
>MGYP000422954699 FL=0
MSARGLWIKSLEAILLVVLCFVIFAPMLGLLLWSIAIRWYWPHVLPQQVGLDYWKQALGFERSLAIGAVSITDAFNTSVLIALIVVAIVMVIATPVGYVLAR
>MGYP000957065041 FL=0
MKNDVNKSLERRFSTVQLYSQSEDFELSISGEEGTYYKFRSEDLLYVTKK
>MGYP001611453920 FL=1
MMLFHISGVLAEANPDSNPESVPAATTGARRINQSPTSQNDFMSSLANASEPSG
>MGYP003568452137 FL=0
MDDGFRRCQAATFKMSCFEFSHSNTDEKEIHIFIWTEKRKSYN
>MGYP001429666462 FL=0
FTQRAFRVTIRLVTDTPGMRAWVKLSGDDLVTGGNIGRPMADALLDEHDRRVEAGTLYGFQPFVTLVAERV
>MGYP001129982810 FL=0
LYDKENRREVFKSGQKGTLMRMYEDKPIYYDNWDVDLFHMLKHEEAAADGAPELIAEGALRVTLRFHYTYRHSTFEQDVIFHAGSRRIDFETRADWHETHRLLKAAFPLDIRTTKATYDIQYGHVERPTHFNTSWDYARFEVVAHKWADMSEEGYGVSVLNNCKYGHSAHDNVLRITLLKSGKYPDTEADMGRHEFTDALLPHAGSVVEGDTIEESVKLNLPLHKAEGMLWAAAPLVETGSRSVIVDAVKKAEDDGCLVVRIHECRG
>MGYP000615634015 FL=1
VKLEANTSDGYKDESYSVDGNILEVVNGSVLSISNNGYNGYNYGKPSEIGKDTALGRKDRLADFHNALVLFFGEDIGKELYQEVKNSSAYAICRVNQTAISEEEKFDVYCQTVFAYSDPKMDCPEDFSSFLYKANTKRKNLNSLRAALQGHYGKDKGMKYYSLFKSHIKIMNRM
>MGYP001275058744 FL=1
MSEMTPREIVEELDKHIIGQAQAKRAVAIALRNRWRRRQVPDEFLRSEITPKNILMIGPTGVGKTEIARRLARLARAPFIKVEATKFTEVGYVGREVDSIVRDLVDMAIKMTREEALERVRPRAEDAAEERLLDLLLPPARGSSAPDQETAPTNEEGAGRQRLRKLLREGTLDEKEVEVEVASPTVGVEIMGPPGMEQMTDQLQGMFQNLGGQRKITRKVRVREALRLLTEEEASTLVNDDDLKHEALERVEQDGIVFLDEIDKIVGHSERQGGDVSREGVQRDLLPLIEGCTVSTRSGMVKTDHILFIASGAFQLNKPSDLIPELQGRLPIRVELDALGTTDFVRILTEPDASLTEQYAGLMNTEGVTLEFDPAGIDRIAQVAWQVNEQTENIGARRLHTVMERLLEGVSFEAADRSGQHVVVDQDYVDGQLVGLAEDEDLSRYIL
>MGYP000812623567 FL=1
MKRKVTLRKKQVLAIAVAVIAVIGAIAAWQTWGATTRIAFLNFQVTELGQISKANDNSMIELCEISADDIADLDSYDMVMVTAMGLKLTEEQRAMLKEKAEKVAVYTRMATNPDNYICSVDSVDADFISQYLDNGGRTNYRSMLAYIRKFIDGKKLNAPEPELVKERPDCLLTHYDPSDVDGEELGFNSVAEYNAFLAKHGLYSEGSPQVMLTGFMGATDDMTRALEKKGMTVYRVNKPQLFIGGKHADSIHVAAVVNMAHGRMGDYMVEFLKMKNVPLFSPVNVNRLVDEWLDDKQGMSGGFMSQSIVTPEIDGAIRPFVVFGHRTNDDGLRETYGIPGRMDDFVETVSRYITLQKKSNAQKRIAVYYFKGPGQNSLTASGMEVIPSLYNFLCQLRSEGYNVSGLPATVKEFESMIMAQGAVFGTYAEGAYANFIKTQHPALVTAAQYSEWTGKALSTQQIKEMNEINGEFPGKYMATADGRLAVARLQFGNVMLLPQVIAGAGDDSFKIIHGTNVAPPHTYIASYLYARYAFNADALIHFGTHGSLEYTPRKQAALDSNDWPDRLIGTLPHYYVYTIGNVGEAMIAKRRTYAQIQSYLTPPFRESELRNTYRQLNDAIDSYNKAPNAAAAQKVKQLTDKMEIAAELGLSKKAAYTADDIQRVESFAEELANEKITGQLYTMGEAYSQADIRTSVFAMTTDPIAFGLLGIDKLKGRADGNAEKHKQTFNRQYVEKAKAIVTRLMAAGGNMTDEEICRTAGITAAELKMAREVEAMQAAPDPIMMMMQMAEKMGAKSGKPQMQASQKKLTVSELRKMRLPRHGKIPQLSKAVFDKMEQSGRFPEKMMTAIRNEQKWYKESLKKGAKKPAAKKANAPRFSRSEIRLAQAITAVEHALKNVKAYSDALAESPRMEMASMINALNGGYTAPTPGGDPIVNPNALPTGRNLYSINVENTPTEDAWDKAKELCDNTIKMYRERHNGEYPRKVSYTLWSSEFIETGGATIAQVLYMLGVEPVRDAFGRVADIRLIPSSQLGRPRIDVVVQTSGQLRDLAASRLFLVNRAIAMAANANDDKYDNLVKAGVTESERLLVEKGMSPKEAREVSMFRVFGGVNGNYGTGIQSMVTAGDRWDKESQIAEVYLNNMGAYYGDDKNWESVRKDAFEAALTRTDVVVQPRQSNTWGALSLDHVYEFMGGVNLAVRNVTGKDPDAYLADYRNHQNMRMQEVKEAIGVESRTTIFNPAYIREKMKGGASSAGTFAEIVTNTYGWNVMKPKAIDQHIWNEIYNVYVKDKHNLGTKEFFEKQSPAALEEMTAVMMETIRKGMWKATPQQTADIARLHVEMVNKHKPSCSGFVCDNAKLRQFIASKTDAASAREYQANVENIRQEQLADGKKSTVMKKETLNDDSNKTKAVVSGVLVAAIAIVAVIAIVVLIRRRRKNLN
>MGYP001306074617 FL=0
DIMRTKELQNGVLWNPETGQKVEQIEKGLHVVVLARRRRDRPARLPRIVETSIHV
>MGYP001598923031 FL=1
MVNAITQVGNVMGIMSVAVLVESRVVLDTLVAIGF
>MGYP000619228673 FL=1
MYMHFLHSWIFVCYRAMFVCIFLHLDCLSFFHSFQSIFKNLTISSPLC
>MGYP003648209433 FL=0
GFQIVGIPLIDGGFGFELHWHQRSVDLFLGLPFNIASYAALGLILEKITGYKCIAVQGDLKNVYLYENSYSSAAEIMKRGVEVIS
>MGYP002561378225 FL=1
MMDSPKHEAYENGGTIVNRYARIAIAVLASVGLLTSASACGTSQDGAGSAHGAIPVVSSINQWGTLAEQLGGSGVQVTSIINSTNVDAHDYEPTTSDIAKLQKARIVIVNGAGYDSWAVKAAQSAKSQVINAAEIGGVKDGGNPHVWFSAAVRKAVAQAITRAYEGTRPDGKADFDKLNQQWRSKEDEVARKITETKRKADGEAYAATESVAEYLAGDLGLKDATPTGYMRATANESEPTPTDIKQFTDMLEAGKVGLLVVNIQEETELTGKIVTVAKSSNIPIVELTEQMPEQYDSLTDWMAALVDAFSQAI
>MGYP000499357948 FL=0
MRLFSDFFQPSIYIFLLLNKNALNGCPKIPNFYEKIAEYYDRHSAAKKNIFTTFHLLNQFYYQKNILERILAD
>MGYP001675491746 FL=1
MTHEYTIFEIKARGVGRNKTTCYSIFMSEKRSDNIKKQRQRTKPKRLSVKQYMFIAVVLVLLITTVGIFGIIRYSDTRRLDVAYYGVPESIATAINAVLENPDNATVQKKYSRLRIVQLAESDIRNTKRIAKKYDLLFMWNGANAANAAEKAVVLPESVYNLFPASVRHTGKVNNVPKMLPLLLDHYELACYRTYRNNAGLALPETFNELESYLHTIKGYADYPLICAGKTDATLTAFISAFTESLAGSEGYATLVKAAAGADCLSDVLDVSLGKNISLASILGIIKQWQHEGLIHPQWYNVTEKDIESYMEEHRLGAIFMPLSEHRVKPLILIKYYDTVQFPKGDVANHALIAPVLVGMAFRNDASQLAVLEHFAHTDLQMLLSQHSKLAPASARAEAHDVQADDVRFWAASCTDGPVPELGKAAFASPVKTAAFAEEIRAYMAFTQE
>MGYP000328593210 FL=0
MVPVIALVGRPNVGKSTLFNRLTKSRDAIVAEYAGLTRDRQYGEARWQGRTYIVIDTGGISGDEEGIDAKMAEQSLQAIEEADAVLFLVDSRAGMTAADQMIAEHLRKRNKRSFLIANKVDTIDPDLARAEFSPLGLGDALPIAAAHGRGINHMLQEALGIFPKDNAEEEGEGEPASEEVAEGEEPTRIPGPSEKDGIKIAIIGRPNVGKSTLVNRMLGEERVIVYDQAGTTRDSIYIPFERNEEKYTLIDTAGVRRRGKIFEAVEKFSVVKTLQAIQDANVVIFVMDAREGVVEHDLNLLGFVLETGRALVIALNKWDGMEAAERDYVKTELERRLLFVDFADIHFISALHGTGVGHLYKSVQESFRSAVTRWPTSRLTSILEDAVQVHQPPMVNGRRIKLRYAHLGGANPPLIVIHGNQVDAVPKAYTRYLEKTYRRVLKLVGTPIRIEYKGGENPYEGKKNSLTARQVNKKRRLMSHHKKAEKKKKKDKRR
>MGYP000632763877 FL=1
MASEDGCGGGNRRVVEPEARISRFAEPVVEVEFVDVGDLVEAHAHDPDEDEDPDGGHDHAEAETEIGYSERVSLFIPTGDW
>MGYP003625842865 FL=1
MKSLFDFIIQPLGGKYDNEITIGDKKLILNNKIESFKSVNNLAIVIETPKAYKTPIKKGDIIVIHHNVFRTFYDMKGKKKKSRGFFHDNLYFCQIDQIYLYKKNQQWKSFGDRCFIMPLKNDNYLTADKERKLIGIVKISNSSLEAAGINTGDLVGYTPNGEWEFIIDDQRLYCMKSNDIVIKYEYEGNEVEYNPSWAHSVCLYII
>MGYP003126176265 FL=0
MATIITADRVSGSFTSTGSLGQLSLGGTSTSGSIQPSSSLHIQGNNAEGGIHMFRDAFPGAYGMRMYLVDSGADGQYLRFDSQRNLNWTEVLRIGNGGNTSNQTLQLVTGNLSGSVESTASFGALRVESEEDGTTITTDRFGLTIDGQAGYYPLTVQSPYETAARFISTDGTANIEIGDNSSTTNYNRIQVVGDTRLQIIQNNVDKVRFNQNTTIFNENSNDINFRVESNNDQHMLFIDAGKDKISIGSDIFGDDKMLVAGNVGITGSLHVSGNISTSGSIIAKEFRTEFVNQIIATSSGSTEFGDSIDDTHDFTGSIEVSGTLNIPTGSITVEGGIGGANIARFSRNQGTT
>MGYP001636533327 FL=0
AAAAVLVLLAAGLLAAVVVPEDPGAGKAGGLAGLAFQGQAMDTVL
>MGYP000052352460 FL=0
IDKQFRLLELILFYYETAGEALRKGAPMQPVFDIPARTDWVLLNANYYVREFFALGKTLLFD
>MGYP001423369931 FL=1
SMIAKLIVTADDRPRAVARLSRALSEFVVEGIRTNLPFHRRVVEHPDYLSGNLDTHFVERLLGPQAT
>MGYP000606642193 FL=1
MDPILLAIIVVTVIGLIGAVILVAASIFMYVPVDERVEQITAVLAGANCGACGCAGCADYAKSIVEDGNAVNKCTPGGAACAAKVAAIMGVEAGSSTPMKAVVACSGTCGKTGKKYEFQGIQSCQAVKGLYGGDGLCKFGCLGYGDCTRACAFDAIHIVDGIAKVDRSKCTGCGACAAVCPNAVISIVPEHKRKPVVLCQNKDKGADTRKACTAGCIGCMKCAKACPKEAITVENFLAKIDQDKCVGCQLCVKECPMGVIHVPASE
>MGYP001134501289 FL=1
MFFAVLAVQIYLLKTTTTRDHQNITEFTFMIHHVCMNKPMVTCTLDELDVDFLLYPLSIPNSAKKFEDFGGATCPLIWLSSELLPVLAAGAFSTYSNREVQDLLLVIVLSVTDGRTGAGSSGFCS
>MGYP002743407678 FL=0
MAKIFDDLGYNWKFKVLNSKEYGIPQNRERVFVVGFRNDLNINDFNFPNKLELNKTMQDFLLDSVSGKYYLAKKGVEFVTSKKNIDKRYTQIDGEIQLCQKKNQQFNWHGDFIFQAAREFEFDDFIFDVNSVEEKYYLSEKIKNYVLAGGTKNFKTSTETDLPVARPLLQTMHKMHRAGVDNYVTHNRGRIRKLTPRECLRLMGFRDDFKILVSDTQMYRQAGNSIVVD
>MGYP000205383798 FL=1
IHAIEAHHGVAEDAHAGDWHRQVSLLAWESIEKARARGLELGGLDVSLESWKEVLEAMARLPE
>MGYP000432900193 FL=1
LIPMDIIEEMAELGVFGLTIPEEYGGLGLGALELCVVAEELGRAAAPVPFSSSVYLGTEAIVKYGTNSQKEKWLPKLSSGELISTFALPETNSEPTEKNIKTTFSNGKINGKKLPVADGSYADISIVVVKNTDNDDIALAIAELTSENVKRKQISTLDPSRDHAEIIFENSEAEIMDIGDEGWGAVDSILNSAAVLMAFEQIGGAEASLNMAKEYALDRYAFGRQIGSYQAIKHKLADMYIAVELARSNCYYGAWALSCLLYTSPSPRDS
>MGYP000580577341 FL=0
MKIVPLTLESMWPSAALLSANKEASRENFLKFLEGGFKATQLKFKNMGPSFKNLKMWMDHLRTGVQDQAGQHGETPPLLKIQELARCGGR
>MGYP001331097511 FL=1
LNLNSARQLSFQGDVAGAQKEILNQVRQMGDFNKMNVFQQEALAKATGYSAVELTKMLKNEEKLAQLSDKEKASYEKALEAMKEQNEETGKDLLMKTQMQSAMAQLNNTYEAFKQILADILTPVVNVAVKLLIPALKLALLVFNLILIPVKVLANALYKLFEPLEPVVQSISDAFDGINSKIEEAVQF
>MGYP000153268017 FL=0
MIVSCLYCGYVAPIHRVMKRQARALACLALAATVVGFMLRGAALTGGIDGMVDPEMLGLLWQTSVGDVLVYRLIGAVMILVGLSPALGTFLAGVVLANSEFRHELESDIAPFKGLLLGLFFITVGAGINFAVFFRDPFELLGFTLLLMGGKGMVLYLLALIFRMKGRDKWLFTLGLAQAGEFGFVLISFSLQQNVLGAALGERLLLVVALSMLLTPLFFIAYERFQHRMSGDTSDAPEADQIDEKQKIIIAGIGRFGQVVNRLLMLAGFRAVVLDHNLEAI
>MGYP000930301694 FL=1
MADDVIPDVIGGAIPVTVIGGYLGSGKTTLLNALLRGGHGRRLAVLVNDFGSINIDADLITAHGGDTISLANGCICCSLQDNLGTTLHSLAARSDPPDQIVIEASGVANPSRIGHYAMSLPGLHLDAVIVVADAEGIRRQARDKYVGDVVLQQLAAADLLVLTKTDLVAPQVVQEVRQWLETQVPCVPCVERGNDQVPPALILGLRSELAGPDHGLGCDHEPYEHVHGEEPHDHRFAQVTFTTEEPLDRGALVAAIDALPPGVVRAKGIFYLADALGEQVILQMAGRRREWQTGEPWGDERPYSRLVLIGPRALVDEESLHARLSVLLTPTIE
>MGYP001478987189 FL=0
MRMRRGVIFAALAFFLSAGAFAQDKRPDPKFFIYLCFGQR
>MGYP001414076324 FL=1
MLDDFFTRAVIGGIGVALVAGPIGCFIIWRRLAYFGDTLSHSALLGIALALLLEVNITLTVFLISVMISFLLLLLQRRAVLSSDALLGLLAHSTLAIGLVVLAFMTWVRVDLMGFLFGDILAITSYDLVIIWGGGVIVLIVLSFIWQPLFAATVSYDLATAEGVRPEIINMIFMVILAGVIAVSMKLVGVLLITALLIMPAATARRFSTSPEWMAVIAAAVGAGSVLIGLNGSLKWDTPAGPSIVVAALVCFLFSLLPFPNFLGKKHK
>MGYP000072544056 FL=0
MAIPMTTGNIFSSCTDDFEKLNTSNIQVDPADLPFAAQCTEPMTYCYPPQQNMFQFWTNLTIDLYGGYFMTPNGNFTNGDMGENRGHSGGMYENYYLHIFNNTRRIIAQCDASGERGLSGVMRIVQAYGTLMTTDAYGPIPYSSILSGENEVYFEFDSQKDLYKAMLEDLSTAITDISAMGADEIAKLKSFDCWCNGDKDLWVKIANTMKLRMALRLSKRETEAGNAGMNLKAIATEAAQNTLATVNKDILIDKSLENEMWLMFNWGDCGFNANLVTIMSGTKDQRQPLYMTPVS
>MGYP002856813101 FL=1
MSLNLMYITNKPAVAKIAEEVGVDWIFLDMEFIGKDSRQGGLDTVQNHHTVEDIKNIRKAITKAKLLVRVNPIHEALTDYPSSKDEIDAAIQAGADILMLPFFKTVKEEGQFIRFVGGRAKTLLLLETVEAANLIDDILKVPGIDMIHLGLNDLHLEMGMKFMFQLLADGTVDKLGDKIKAKGIPFGFGGLATLDGGALPGSMVLKEHYRTGSSMVIVSRSFCNTDIVTDLDEVRHIFETGIAAIRDLESKVQHESKEYFEKNHREVVAAVNQIVKNIEAKEHGNQ
>MGYP003291001117 FL=0
RSRRPATSNARTGAPMRTIWALCAAAACVVALAATQTTEFPLLIVLMAVLTMVVSWL
>MGYP002777180191 FL=0
VRVIVVGTALPTWAAGADVVLPITTMAEEEGTFTNLRGRVQRYLQAKPAPGLARPSWFAAGDLLAAAGEGQGFFTASEAFDAMAAQHPKFAGLSYARLGLRGLPVIEAEPAGELAGVGA
>MGYP003430828053 FL=0
WLNDLLYTHSENPPLEFIENVKGDLAQDALYVFTPKNELIRLPAGSTPVDFSYAIHTNLGNRTVAAKVDGQFVPLASPLTHGQTISIVTNPNATPNPAWLSFIKTPRARQAIRDQLKTLREDEARKLGKRVLTLAMSSVGLSSQRIKKSQLAKTLNQWGEPSLDSLYTSIGLGQKLAPVVARQLLPQDDAHSDRETLPLVLDGSETQVVEYAKCCKPLPGDPIVGHMSAGRGLVIHRKQCTQIGQKRHKNMPPPQKQDGNWLSVTWGGQV
>MGYP003343356212 FL=1
MKVSIDKSVGGLQQGLTFLASTGATAPFIGLFCTVWGIYHALISISTSGSAQIDQVAGPIGEALIMTALGLAVAIPAVLGFNAINRANKLLVADLNRFGNDLLAYFVTGARVHSGE
>MGYP002238360443 FL=1
MSQQELASMVGVSYRTIRSWEVEGRFPKQNVLYQKLADALQCDVSYLMSENEAFITEASEQFGNRGARQAQQILEQAAAMFAGGSLTDEDKIAFMDEIQSLILGFPKDVQRKFTP
>MGYP003335923377 FL=0
DSCCRGCFSFVSALFNLVASGCLSGRFSLVSSCFARPSRFFRMSFWGNGDHSLVARGXSTQFPGGYILHDKGTPLQTRTVRRVLQILGRSPEMELCLCLREKRESSCHTSDAQKCEVHAXRRGWRERQLHLWSTPXAEPMDTACAPGRTQQDSMLHSAGGLLLRPRAKPACTRPAESAADPTVLPSVFPWRPWTDIPLTX
>MGYP003595024705 FL=0
HPWFVATQYHPEFKSQPLAPHPLFSAFVAAALRHAGERP
>MGYP001183065379 FL=1
MNDHQNITGIYPGTFDPVTFGHLDIVERACNIVDKLIQNHKIAWICGAFVAAMNNYLCSKYLLFDD
>MGYP001772517118 FL=1
MSTYIRAVVAAMAIEEKYGIPLGDLVDTFADIPAADVVEVVHGRWVFGKDLADSFGSINKNKYHLYCSECRNQAFNKTVDNDPDFDVDTPFCPWCGAKMDKEVIL
>MGYP000932959631 FL=0
MAELLKVEKLWAGYGEAVVLEDIAFSLQEGDSLALLGRNGVGKTPLLSTLMGAARHRSGTIQFAGRDQDRIAVGIFE
>MGYP001710201224 FL=0
MEKELDLLIATEMSGDGDSVAEELRSVFAKRGVTVHRIEFRSGKDSVIRSVRANPQIHAVVLSQYQDQEKLSPRDIDQICSTAEGDLQVFVVVSEMRGSDYMKEIESLGIYTAVYQEDASFEKIADCEAIRPDIAGIMGAFGAALIAREHYEDGYVTTMLDYQKICELQFETSMAKCKGCTNNCRLTINKFSGGRQFISGNRCERGIGGQKNAHNVPNLYEYKLHRLFSYESLDADKAPRGVVGIPRVLNMYEDYPFWFTFFTELGYRVVLSPSSNRKIYELGIESIPSESECYPAKLAHGHVTWLIRQGIKFIFYPALFYERNEFEDANNHYNCPIVTSYSENIKNNVEEIAGGEITFRNPFMSFRDLGTVTDALTKEFTEIPAGEIAAACEKGWQELANARHDMEKKGEETLEYLRQTGKRGIVLAGRPYHVDPEINHGIPELITSYDMAVLTEDSISHLAKPERPLIVSDQWMYHSRLYAAASYVKT
>MGYP002084656506 FL=0
LLGFVDVVGGEDDGHARVAQRAHHAPHVLAQLDVDARRRLVEKQDARLVRQRLGDQEAALHAARQSEDLAVLLVPQREVFQHLLDVGRVRALAEQAERIDLAVVSANFFEVFGARAAQGRLFSSADEQAGHAPVVVLSHAFWERRLGADNAARVAELVGANASFELCETLKDLANLPRVVQAKRN
>MGYP003719918597 FL=0
LGLTVSGPLEPEPGPALDKIVTFVPVGPSIAAVHTALSDAGAGAIGNYSHCSFATAGTGQFLPLDGAAPVIGSVGRLERVAETRLEMVLPRSRRRDVVAALRAAHPYEEPAFDLLEMAPLPSSLGLGRVGELAALGQQRHAVQQLDGAALVLPRGAGVAQPGDQRMRRVX
>MGYP003357866643 FL=0
FVLQMIWKNKSQQSFSRLFYHSTGLLAPGGWNGAFRSIYPTLLCITISGAATLYGSIQKFVPTTWVEFYFHPTINPFSLEPAHLGSFYNQRLVYLYYLVHGSYRFVASWTVSTSSYSFYRTCLHLCDSLSNLYHHCSKLCRLSSPLDLLDLCYFAVSQSTLYNTVLWQLRSRNTSARNLPILWRNQQIVAHSR
>MGYP001703284989 FL=0
SNLETACCQIVSCSLXNXXXFYIHLGXGNKKQFIKIRIFRNSFWXFFFYIYKRFNFKIXRYNPNRQNRVYKXVDVLX
>MGYP000305843427 FL=1
MAQIIVLGAGTGGVPAAYELKSALGSDHQVTLVNASSRFQFVPSNPWVAVGWRKPDDTSLDLT
>MGYP003518858476 FL=1
MILAGITLFNPDVARLEENISSIYGQVDRVICVDNGSDNIKSIEDCVLKNWKNITIINIERLKSGQF
>MGYP000766296581 FL=1
MVCSIEKVSLRHERRVSRLAEDYVIEMLHITKEFPGIKANDDITLQLRKGEVHALLGENGAGKSTLMSVLFGPVSYTHLTLPTILR
>MGYP000585817851 FL=0
AVLVAFDTAEEFEAYQEGIEDAFLIALNGLFETSESVCNRDFRFVESVQAKLGVDVNQDYFDRRLQEDSLTTSNPSERPLNEPISFQATVEPANQEPTTNPSISLGPSTSHQPTFEPTYAFSSSLNAILFVSGICNGCENSIIWTNQINGRARHLGGEDDQPQNWSPRRSLEEEQAESSCFCPISAIVQDVALVASDVEQQFQSQLSRSS
>MGYP000583006313 FL=0
MTGQRFSNKQVRDMERLAHLTSALLVAV
>MGYP001048952483 FL=1
MKRNRILIVEDEQKLARTMGDFLRFQGYETCRAANGREALAIFYRERKTLDLILLDVMMPDISGYEGLKEIRKTSNIPVIMLTARSSVEDQMSGFEKGADDYITKPYTLELVKLHIEAVLKRSGKLAKVLEYQDISINVEAQKVYWKGNYIETTRKEYELLVYFIENSGIVLARNKILDAVWGYDYVGDIRTVDTLVKQLRKKLTEECTYIKSVYGVGYLFGEGGYEE
>MGYP000370032573 FL=0
TATTEIYTLSLHDALPISARFWYAAASMKSHLSGGKALTAQKY
>MGYP003323358317 FL=1
MASIRSRNGRYQVQVRRADLGSRSRTFVLKQDAERWARKMEAQFDQGELQQLRTKDVVLHDLIDRYRREIAPAKKSRDTEGVRLARLMRDPIASLSVGKLTAHELALFRDRRIKDGIRTCQYDLVLIRHILEIARKEWNLGLAVNPVDQIRKPNGLRPRNRRLEPHEETLLLDGCSKSSVTHLKPIITLALETAMRRGEILAIQWGDINESLRILSIPVTKNGRLGHPTIKYGPDDSPGDSKGHF
>MGYP003316122480 FL=0
PKVTRLTHPHRRHLAAARLDVHHRGELRVGLGGERRGDAHALDAGLGGGHGRAVIVLARWRCWRRIAQAVRAARGVTIFAREVRQLGELKGNSAQLPADA
>MGYP004316249655 FL=0
MIRNDTLRLYNQRLTSGDKMSTNPDEWKDNLIRQLAEMFKGMNMPFDENMIRQMMEQFSEQFEEMGIDPEKLGSVDMKVDMKNFAKAFSGGADMTEIFSNFGFNVEVNSPPVEVEVDGTPNSSKNEIMKLPEADWYLDGWNMCLTVDCNNSLSSDDEKVNLSIVNNGGLLEISLENAPQPFARIELPHPCESVEEIEINNGIVDVILKLMPQGSALDDEDD
>MGYP002631629027 FL=0
KPEITLNMTDGSNNRFAKIYYLDNATTSFDNGYDGETFGGIANTTDVFTHLVANSEGKKYQVQSLPNSDFENMIVPVGIKAAAGKEITFSAEAINLPDGIKVYLEDRTANSVTLLSEANATYKVTLGESLDGIGRFYLHTKASGVLSTSEVALDNISIYSPAKSTLRIAGLTQGKASVKIYSVLGKQVFANTYNTTGVIDMNLPTLATGLYVVQLATEKGTLNKKITLE
>MGYP001549131463 FL=0
QLARRFCTVTITRMPDHKGRKTMKFILIAPVLANLLFFASIASAEKTILAGGCFWCMEADFEKLEGVSDVISGFTGGTLIDPTYNGNHEGHVEAVQITYDPDTISYQDLLKHYWVNIDPFDARGQFCDKGPSYLSAIFVSNETERGIAEQLKKDVEEQFPDKTVVTPILDASTFYPIKGSEGYHQDYYKKSPFRYKTYRWNCGRDKRLKEIWGDKAVDT
>MGYP001793035123 FL=0
MRTLWVSAAAGAPLQSNPTTPGTQARGVEDGHRATTAAAGKCHR
>MGYP000255802630 FL=0
MEEKNISRHPDQSLKQGRKCVTYMYENRPNIWLQIQRDFNMIRAQTPAKVEMDPEEIYILG
>MGYP004001795269 FL=0
GETIGFWDGDALITWTSNIQGWMSHSGFEFSNKMQTIEIYKSNYDSNGNFSGINHEAIFYDPEALLEPVRIVRDLNKLSSFREGDPIVFTECIQTIFPQNGRGEPVAPGTVIEYKVPDMYGQPWRQIWEEYFEQDMDIPKEDDIFSF
>MGYP000644120371 FL=1
MKKRTPWKLIPLKSVPIFILLLLSLGGTQAFSFSPTVVLGGRLDQVFSPQSAALWGDMYGFGSWRTTLGSEAYAVFNADSSFSLPLDQQAASVDQHSLSAQVGLSLPRGSLLLSSETFFSIKDPLYGLTMLPDWRGRYGIALDQKSTKKAYVGYSGSYLYQEKGTEDRLSQSTAIGFIYEPSFTRSYRFELNGSLDDLRQRETSSGQQRRDYGTAGEFEVSGLAGYFMDWSLQILAGARLSNDPTYEASIADLEAQISWGPTRNLNLSALLYGEGLSYWERTTEDGSDELTRIDIGGQVELDWTFNNSLYYTVRLTGAHILSNEPSLASWDISLGLGIEWGF
>MGYP002638041597 FL=0
KAYRENMPFDQFTIEQLAGDMLPDATEQQRLATAFNRNHRQNGEGGALAAEYFVENVIDRVETTSTVWLGLTTGCARCHDHKYDPISQKEFFQLYGYFNNIGEKGIGNGTKANPLMSIGSPLERAPADHAEKVAALDAAVATAEKDLPARFNKWVTGAHAAAIDPEAVWFSADSVMSNTVAGKKGSLKLLPDSSFRYSGKTTTGVDYNLKLAPG
>MGYP000692869867 FL=0
MESRTVAQAGVQWRDLRSLQAPPPGFTPFFCLSLPSGWGYRHPPPLPANFFVFLVETGFHHVSQDGLE
>MGYP000986204494 FL=0
MKRLILVPLALILLKVLAACSSDEEAEPEINQVAYSAMDNYFVGPQYLPAGMTKLTLTNDGQELHHQQLIAIPEGMTADRLLVGMAEGGDAPPPPGVEAAGGASALNPGLAGLVTQNLAAG
>MGYP003576055532 FL=1
MFRTALMAGVAVLAGVAVGFGAIEASAPVSAAEAIPNFAPDRNTGWVLDRGNHDDLLPDGSRPGPVTFDKAHPYIPNAQAKGRQPTYRVADLSNPILQPWAKEQMKKANDQVLAGKMPFRARELCWPIGVPGFAVFSAVEPTYIFQKRDEVIMINQGGPEIRRIRLNAQHSANPKPSWYGESIGRYENGDTLVIDTIGVTTRTFVDNFRTPHTDKLHTVERYKLVDGGKAIEISIEVDDPGAFTTKWYARQRWNRVQEPLTEIHCNENNEDLFNLYPMPSPKAEKPDF
>MGYP001236546810 FL=0
MKQAIRVAEAQEIVLQSVQPLGIEKVDLLQALHRLTAEEVIAQRYIPLEDNSAMDGYAVQHHDIATATTERPALLTVLETLPAGKTPHYQVAPGTAIKIMTGAPLPAGAE
>MGYP001162411550 FL=0
MLSRIVTLKVLLKELLGHTTPIIPLMISWMIFKFSTNFYDGSTDSSKEKLKSLDINVISHPHNLGYGAALKTGIKNAKFDTIVISDIDGSYPPKHIPELIKIYEDSFDLGNGLDMVVGARKGKEYDGSFAKFIFRKLLKFLVEWTTGRTIVDINSGMRVFSKKTVSNFLQQLCNTFSFTTSLTLAYMLNAKFVKYESIEYDARQGNSHVRIFRDSLRTLQYIVEAIIYYNPLKLFLLFFIFFIFISLIFLILSIYIKSILFMMIMASSVIVAFISLFFGFLLDLIRQNSKQK
>MGYP001489463811 FL=1
MFAGACCRVEKADSVLCGDDQFVSVGHDVAYNIRGQCGRVARFHPVNGKAVGVQVEFVQSSQVCADPHNLLCPVVIDCLELLCEILFLPSSWRYQR
>MGYP001439564737 FL=1
MSFIIRAARMDDVQALYEMAKRTGGGFTNLPPDRKSLTAKLERASAAFARTGDGIADDLFVFVLENLDSGEVRGTCQIFAQVGQKWPFYSYRIGTLTQHSVELDKTFRAEMLTLTTDLEGSTEVGGLFLHPGERAGGLGMLIARSRYLFIRNHRARFGDRTIAELRGVIDEAGGSPFWDGVAGRFFGMNFQQADEFNAVHGNQFIADLMPKHPVYTAMLPESARSVIGIPHPSGRAAMRMLENEGFAWENYVDIFDGGPTMTARTDQIKSLREAIDSRIVAIDPSLSERSSGETASPAHGQLPPPRAAYDLLDRREDGIAIDPDAARLLAVEPGNEVSHVSRA
>MGYP000479884579 FL=0
MRLKNPELFRQQCFVAGEWIDAKSGKTFEVYNPATGGSVGHVPVMGRDETRAAIAAAEAAWPAWRQLTARRRSRIVRRWYELIMENQEDLAVIMTVEQGKPLVESRAEIANGANFVEWFAEEAKRVYGDTIPMAQAGKRIVVIKQPIGVCGAITPWNFPSAMITRKAAPALAVGCPVVVKPASRTPFSALALARLAEEAGMPAGVFNVLTGPAVEIGAELTGNPVVRKLSFTGSTEVGKKLMRACASTVKKISLELGGHAPFIVFDDADLDEAVAGAVASKYRNSGQTCVCANRFLVQEGIYQTFADKLIRAVSAGLTVGNGFTEGVNQGPLISLDAVQKVERQIEDALSRGARIGCGGKRIEGNGFFFEPTILLDVTPDALISREETFGPVAPLFSFATEEEAIVMANDTPYGLASYFYSRDVGRIWRVAEELEYGMVSINTGIMSTEAAPFGGVKESGIGREGSKYGIEEYLEIKYLCLGGLDKT
>MGYP001249954087 FL=1
MRPGFAPDFAEANQDKLMIFGLLRKNNVNAVIVERQYGILTTAARRPEFYLEANVPDTVMGRFEMLSAVLILYFRRTRQSGEAVKTIAQEIVDAFFEDLDHSMRELGIGDNGVPKRMKKLASMFYGRVDSYGTALDANDSQALAAALKRNFHPENSDETLTMERLALYMTEAARALDSVPESVLERGELELPPFNGGAADAAHV
>MGYP001276526933 FL=1
PQHSDTKGFTTTSVALPDGTAGVQVSMTIVSAGSSILEFAAQADNRTEKMINGAVRKRVS
>MGYP003150834777 FL=0
MALISRSQHEAFECFENDVLMMAESDEMSGSSDDKTPVERLQVA
>MGYP000526089798 FL=0
PYAEWIAGYGDPAYAGTVDRAMGIGSEIAETLKTEERLAMTAAFLRSNRLEWMFWDAAWRLEAWPPIHRDAGVPPRQ
>MGYP003495424184 FL=0
MEQIVANLALMKKNLKQIGYQGEILLESLDYHEGGAYERVTEPDFIREVVEKSGVKLLVDFGHLLMAATNNSLYKPDQ
>MGYP000214496963 FL=0
QHPNVPEAHYELIPKRAANPMKTDWLHPVRTWRRRRATSVPFPREWDEILARNFPLDARLPERDRKELRKRIQIFIAEKHFEGLGGLKLTDEVRVTVAAQACLLLLHCGEKDYPRLSSILVYPTAYKAREVSRSADGLVTEGEEVRLGEAWNLGAVVLSWHDVQFGAGDYHDGSNLVLHEFAHQLDMENNVANGAPLLPRRSMYVAWARVLGREYEHLRQEVAKHHRTILDRYGATNPAEFFAVATETFFEKPAQLHDRHPELYELLREFYRQDPRSYFTRPPGAGSPGSETAG
>MGYP000694618993 FL=1
MVSLAFISVHLSAVIGPVGRLHGLAHDLAIRVLGQLLHKLDMARALETAQAIGAEAVDGLVDARVTGCLPLLEHDVGSHGFAPFVVGAGDDGGLEHVGVAVEDVLDLDRGDVLD
>MGYP000858948085 FL=0
WTRRVPHPVLIGHAASLTSVLLSPLRGAARAGGRTAQARRGPAAQVRGAPGARRPAPPTRDAPRLRPDIGRASGPRRGALTCGVLAEGYHGLGSRTRRLQCPHRHPRCGEVVGEPRRGARRVAAGRRRRRPKWTRSVQLVREGGGGGGGGGEGAGGGGRTLRVGSSPAVHSRQHNQYVFQAA
>MGYP001041972360 FL=0
HGGDYNPDQWIRTPEIWDEDMRLMKLAGCNAMSTGIFSWSSLEPEEGRFEFGWLDTIMDKLAANDAYAVLATPSGARPAWMSEKYPEVNRVNEAGVRALHRGRHNHCSSSPVYRDKCNIMNSKLAERYRDHPALLVWHLSNEYNAGACHCDYCYAAFEKWLRAKYNDDLDELNHQYWSGFWSHSYSKWNEVRPVDGSVHALMIDWRRFLSDQLIDFCKAEIAPLKKFTPDVPVTTNFMGF
>MGYP000630167433 FL=0
NFTRKYPTLESGSKVKIFRKKKNFEKERTSTWQNEIHEVISIGTSHGQTFFKLDSLPKEYLHNELLKVS
>MGYP003587511970 FL=1
MGKILLVDGSSILFRAFFALPHFTTTSNIPTSAVYGFLRMLIRIIKDEKPDYLAVAFDKKAPTFRHIEFKEYKAQRPKMPDELSLQFDIAREILQSFGINYFEIDGFEADDIIATFVERLKGENIKISILSSDFDLSQLIDDNVELISPKKGVTKIEKIDKEKFIQEYGFEPTSVPDYKALTGDPSDNIEGIKGIGEKTATKIIQEFKNVENLLKNEETCKKYGIIGNEEKILQNKSLCVLVRNVPIAFELESLKLRDFKTENVKAILEKYEFKSIVKELGLDKVDFNEESIFNSLPKEIGKEEYRVNLESENTAVVYLISSEKRIDKAILFYNERFYDFDFSSNLFLNPSELDVLKKVLEDETVIKYTNSYKSLLKLGNFLYTFVNNVKLDSTLASYLIDPDQSEFSLKNLAFLLGKDETFNSFSDEVVFLKKNGDYILDFLKKEKLFELYETLEMPLSRVLFEMERKGITVDVKVFKSLKEEVEAELSKLENEIYKLAGLSFNILSPKQLSSVLFDVLGLEAPPDSKGSTGSSTLLEIVNKHPIIPLILKYRHLTKLLNSYIEPIPRLVSKETNKLHTIYHQIGTATGRLRSTNPNLQNLPVKDEWGERIQSGFVVSSPDSVLLSADYSQIELRVLAHLSSDENLIDSFLNNYDIHERTAMEVFNLKKQEVTKDKRNLAKAINFGIIYGISPYGLSKQIGTSKEEAADYIDKYFKKYPKVYEYINVAVEEAKKTGETRTILGRRRLIRGLDDRSAAVRDAARRVAINSPIQGSASDIIKLAMVKIFNDVSDVDILLQIHDELVFELKEALVSEKGEQIRNIMESIVNLKVPLKVDVSFGKNLGTARK
>MGYP001804161484 FL=0
YWMIGTNSSNLRPPTGEQSREGIMLYFTMKTICTKISCLXQSQMALVHRTXSCNQPLNAMFTFMLLWDFAKKTQPTXSLFFGSIVIFSLAHIGSQIWVEKNFMKNHWPD
>MGYP001421152768 FL=1
MLVGGAAGDAGPPVRPVPPRPGRPAGVDPWSPRGAALSAARTGLSPGAPGLGASGDTTRAARRAPRASDAQKTLRPPRPGDVAARRGPARVRPRAR
>MGYP000446294339 FL=0
LIVAYPITKNGAPATAADIDGTNNHGDLNDGDRITFTFETTVTGTVDQWVEAEGRLDWEDDTITSPYHNESKGRVQIQDDEQTYTPKDTDDMSIQSVPVYFNHGTNPIMSTAQTYHLHSMNYQSNTKVVTDGFYTRIKDDRAISTGWKLTAKLSDFKDSSNAPMPNGTGTSLKLENMSIERVTDRDTPQETIDPSPTGTDVPSSVQSTETIVAGQPTAKTLVTAQPNQGQDTWQLRMPFDKISLNLPANAGKKGTVYKAKLTWSLDDTP
>MGYP001472249376 FL=0
MDYSVSEGINFFDTAEIYSVPPTAESYGKTEEMIGNWFEKRKNREKIILASKVAGPGCDWIRGGGNSFDEKKIGEAIDGSLKRLKTDYIDLYQLHWPERSTNFFSKLGYRHNKNEGSWTAFEDILATAQKFVDQGKIRYLGLSNETPYGLSKYLHLASTHKFPRVVSVQNPYSLINRTYEVGMAEMSVREKVGLLAYSPLAFGMLTGKYLNGQMPEGSRLKLYSKNFPRYQGTRSQLAVEEYYKIAQKYEMSLTQMSLAFVNMQPFVDSNIIGATNMKQLEENINSIHIDLSDEIIKDINAIHENNPSPAP
>MGYP001245916141 FL=0
VDTMQSTPVESGTTTFTAEEEEMAQFVSVVLKDTETIWGEIFKQAGSTYRQPSLVLFSGQVQSACGYASAASGPFYCPGDEKVYIDLSFCDELKTKFGAYGDFAVAYVLAHEIGHHVQNLMGILDQVNAQRSRLSETKANQLLVRLELQADFLSGMWAHYEQQMDYLETGDIEEAMNAAAS
>MGYP003647845281 FL=0
DYVTMPDSDVFDWGTGDFSISWSIYFTTIHTTTAAYVNNMFGSSLSGVGLVIAYKNGANLFLLMNNTTVIDQSYSLSTGQWYQMEITRSGTSINWFIDGVSRATATSSANADKAAPLAIGASNEGGYRASDRDIAGYMDEIQIIKGRALNTSNFTAPSAAYSDPQAPANNFTNNNTVTTTTHTPTNLNCLLSPLDKNSATVLSNGNRTQSDLGASW
>MGYP000974398092 FL=0
MVRRQEADRYGLAAVDHRAPAAVVFRRVEVAQRLRNVVVVNLGVVLGDDAVERRQRTVVDGVGIPVARHLPVGHAQREVGVGVEGPLAVPFAQTFNIGGVEFVENFAVEVAQRLGSQHPRDMVEHAFGLLAQSGGRLHGHAVGAFPDGLEKGVGMGFRRFVAGYAFGEGGYAVDLRATAVFAECLAPERPLGGLAPCETLLGAFFGGIGCRQRRQRFAGDLVSEIGIHDTAVFGAQAHHFGVFGVLHGPESELRLVIEFCCDGPAAVDAQRFALPFFPGVGDRGVFGGIVDAQRGVGLLRFGDDVEAPRADSDLGRIGTFGDVGHGVGKDILLRVARESVDHREIALFDPFRRYREMFFRTIRNVPGRVGRRAVVFRSIDAEHREVARVAGPDPVVGVAAELADRRGRRGHEAHVVELLVDEQELLVAVVHLLDRGPETLAFGLGPADDLLGRLPGLQAVGHLLHAHEEADVEPFVGQLFGPRHGPESVREVVVLDGRVALDGVVAAVVVGQQQPFGRDQLARAAAVEEHYGVLHRGLVDRIDVFGREAESFRAHVVDALRDEARKPHALVGQSRQDSEGREQ
>MGYP000161612758 FL=0
MAKQSKNLAKVQSMLDGTYGGKTQVGYGDQDSKHRSVGDTWTDSEGYEWEQKEGFRVKNSVMPAVGMFNHQCKDCKKNCSPKTAKPWDRDCFKADGRCYYCQLDYEVELKTKPIRWFAYRRLKDLQNMESLEKDMIQWVDEMTKQREKNPFDMKVANAMANGEVEMSIKKNTQ
>MGYP003493975136 FL=0
CIQPXRXMXGFLIVKLRPIHQLPLPQVQHGHPGAIQLGQDIRVRYXHETSESPNHALQIIVYPKSKDLVSQSMCNHSIKDTNMPSITWILKLVSKRYSR
>MGYP000200203148 FL=1
IWGVLPVFGGILIFVSMASLGLPGLNGFPGEFAITRSAWGIYTWQVAISMVGLLMTGAYVLKGIGETLHGPVKPEWRNLPKMTITEHAVVWPLMILILSLGIWPQWLQAVINDTATMILGG
>MGYP000071017550 FL=0
MKKFLSLMLAGLMSASLFVVGAAAEEPKKETVVGKDGGVLDADFTKNETSNDNNINVKVEAVTHKYAVDLTFNFTDLTIGGLVWNVETLRYDFAEGKALTDSEQTITVTNRSDKPVYAWGTVTDGDANDYVTVGMKTGETGSGTNDRLEVAKATAGQTANGTATNGKLTVSISSANWANVANYYGKKVAETEDPSTVNFKAATVTVTISKNATK
>MGYP003685103309 FL=0
MKKNIISNIVKQVRTNEPIEPDTVLLGLILVSLGPLNIFPTT
>MGYP000129413943 FL=0
NLKSIQYGGSLQFPACTHRKDKYDGIREEIELWLDDMMVKVNDFTVEKRYGEALNYYVHDIFPTALKLIVKIERWMAREKRREMEKRLARSMLGNINTHMVDPEELTNKRLRGLDTYFYGMMNEQIVVLIEHLKKCRMEGKNGWDPSFLRRDLIMRLAELYRGEFRSKNYKKKPEYVGEKYRYLITR
>MGYP004202648141 FL=0
FQTQFFEFCNEIEPFLYELAQILLRGEKRENDVRRLSQNTYKRLGM
>MGYP003594687530 FL=0
MYPQLTTQPGAIASAAAIARGELSPLEAVDAAIARIEALDGPLNAVVVRDFDRAREAAKALDGKQPGADQPLFGLPMTIKESFDIAGLPTSWGIAEHKGHIAQGDAVVVRRLKRAGALFLGKTNVPPFLADWQCDNPNYGRTSNVHDHARSPGGSSGGSATALASGMVAAEYGSDIGGSIRIPAHFSGVWGHKTTWGAVSGDGQNFPETDGHEIALGVVGPLARNGEDLALLLDLTLDLPLPKADKPIGQSRFLYIDRHPLCEVDDAVRGP
>MGYP001596028094 FL=0
SERAGGSAIPRERDSGGVRRSDSEIRGSDNRRFGKRKPHHEKSDRKNEKKLLHKC
>MGYP001229890441 FL=0
TGRIPVWWGFVHIVSKAVVSASIAGIPCAHDLASIDATLANDRIDDPHVAMELAEFIRDCFMKSKSKLYQLDNTATLTEAENKSTAWIGSKYFLQKSGYYDSNYSESGRKDWSFNPTRDAGFESSKTPGGKGGHPICSEWWLDRNVGLRKKLIGSIDNNYFTNLMTIIGSPKYFNPVGNATDRENILLRKYLALQTNNSGYSGSGLNQSFGNSYAERWTLDRSQGSDIQASISYGLGNVAIDGLVVASAAVGGLLKGPGALVEGVMIREGVTLFQGFLLMVFVIILPFL
>MGYP003333085768 FL=0
MDGLKFDLAQFCKEIRTLLQVAAEGHVAFGMRNETYCFDFAYRKFVTAEASRRKEEVNWETTMSEIQEITADSGDLLGEVDTHVVSVALSHAVFGRADWAIMLSCFACLWHEVKTKYVDKEKWSLTILLDLLRSGRLSSIVAEYKQKHGYAPHPCTLLELYEKEHPDELDLHPPTPRMKKKRGAPTQLLDAKADPDQRTASNGEDAFMLAATLRTAH
>MGYP001563487917 FL=0
YNSQSPSYTQSNSILANVHANARSVYYNVLMSLVRGAQCDPADPYIQQPYMQQPFVYQPLMSPQFRAFVNSRYKGVGIGIKQADSLHIVKATTLPPFYLYVLAQSEVASHYVKGVPAAGGEAAPVNVLTYTLVPNVLFDADAGLVRIVNDDAEQSPIIIASTKDDQLNYNLGAASSLVLVGDQLHDTN
>MGYP001435143440 FL=0
MKEVIELRLSCIVYARIRVILPPNLDQTKRKRFSKRADIWGTQDPGPQRPDI
>MGYP001552004220 FL=0
NQAIFQLAQLEYLANMPGNEGLRPLVEAQRQVIMGGMPPSGAGATPSVTTGATPRVVPAGGAPGATPSVVQPADQYLADQAILLDSETGGVNADGTPFEPPAPVVTPSEPLPEAAPTPDVAAPTETPAPQSTILDDLQQEIDQNNALIAQRREELEAAIEQYGRAETGAGMGLPTSPGGAELIVEQIQSDINNLTNRNETLEQRIFEQRQVERETQAAAEQEAAEQAETESRMQPLIDDA
>MGYP003921459353 FL=1
MENLKKQGRLIMPQKKPKGNQKLLLIKKNNGTYLEEEFFDVKFVPLLNKDIK
>MGYP000745101651 FL=0
RSEKRLRTLAWQYEGKHIVVANATIFIEEKPAMPNRRIRRNRTENASKRGTKETLREICNRNFNVVTLINLLVMTAYPLIFTFVYSFTDYNLLRSLKKGSHFIALQNYTKLLSDPYFQQSILNTVKFTILAVIFEMFIGLVMALFVNSLKRGQKTMRTLLLLPYLLPTVTVALSWRMMLSPNYGIVNQVLQALHLPVYNWFSDIHTAFGMLVLIDVWQSAPFVFLLLYAALQSVPQSQYEAARIDGANRFKILFYVTLPNIKNSLALCALLRTIDSFRLFDKVNLLTGGGPANSTSTITQYLYNYGIKSLDFGFGSAGAIVMTVLVLLLSSVYIKRAIS
>MGYP000475249838 FL=1
DALPICFNLDFTYQRGFIKTWECNTSNVLIRLGVAF
>MGYP000373718212 FL=0
AAEMWYSMHSKVLGDSFTVKNPLIIYNDHPGFQQTNAIQGAISVGTGGVTEGLRNRVIFPVAPTNQQTNHVLGHELVHAFQYHMIINGDSTNIRNLGNIPLWMIEGLAEYLSIGRIDPHTALWMRDAVLNDEVPRIKDLDNGKFFPYRWGQAFWAYVTGIYGDEVIAPLFENTAKYGLKMSVPMTLGVKVDSLSENWRSALKSHYGRWAIKGKKEDLPGKTLLDDANAGEMNISPVLSPNGKYVIFLSEKNLFTTDLFLADAKTGKLMRKVASTASDGNVDHFNFLESAGTWSPDSKRFAFDVYENGRSVLVIKGIFKGAKSEKIRIPDVPAFSNPTWSPDGKTIVVSGLVRGQTDLYEYNLKSKKVRRLTNDLYSEILPTWSADGLTLAFSTDALSVQRGRTNGAWAMNLAVMDIAFGKTENLDVFPGADNMNPQFDKNGNLFFLSNRDGRRNLYRYDMLTKKVFQLTDLMTGITGITPYSPAITVADDRDRILYTHYNKGRYTIHQAKDADFSPKEIDPMSVDQVPATLPPFSTKQRDMVNTSLRLMDTAKDSVSMTSKKFKPKFKLDYLGGSTGVGVNTGNSSFGTQTGLAGGIDALFSDILGNNQLYAGAVLNGDIQDAGGQVSYINQKNRIGWGLNASHIAYQTGGYSYLAYTPVETSPGQTDTVLASVFGLERVFQQRLGASAFYPFSVTKRVEVGAAAEFYSSRVTEYSDYYDPVFQNYLGSDQKKQPKGPSLNLNNINAAFVGDNSYFGLTAPLQGWRYRFGAEQYFGDYQFTALLADARKYLYLKPITLAVRGLSYARTGGNSTAFSLQYPLFAANSNFVRGYDRKVFAATDDPDFIYRTVGSKMIVGNVEIRLPFTGPRRLSVIKSN
>MGYP000608946936 FL=1
MLSLAKRALASDYVKSAELAKKADDKQAEIDALYSQWEQAQQALDELCEESSKQG
>MGYP001546073984 FL=0
LIAAREERQRRKEEERRAAAEAIERAKREAEEARVRAEEEARAEAGRKKEEELQKMMQLLAEQKAARDARYAARKERLKKGRR
>MGYP003398203515 FL=0
LLPPWEQGYKNVFVNKAKEILAMLLFNEESLEGQLKVRTSGTPDGAETHATTQVYPLPTFHPDCQVVSPSDFSMKPVPCGYDLTRLLPTPDIARTHIKLANSVSTSSMLVIDPDNVIKHKIVPPPILDKIYIYQAINPYNGLVYGHGAPKIFPVDGLRKLDLSKFPIDGDFTLWAAREIGCGVEVLNETVAVHEFGTSQTSGAITAYREAYKLQRTLVGAAPYDSLFVPRIDSPRMGAPRTANTDAKNSTMDSVFNVTDALLEAERRTVLKRLETWISVNCYPSTFKYMA
>MGYP001150268012 FL=0
MQLESTGESGEDMGAVSDDMFTEFFTQVLNPELGCVDMVIFLLCSFC
>MGYP001140916756 FL=1
MISLIFLVMEVGICYNKWEKIFYTNGGCIIMSEENFNTENGTNEQTCSQPQQAYSQPQQTYSQPQQTYSQPQQAYEQPQQNYDQQAYNQNQQYAQQNYGYDQSQQGYGTYQQPQQQAYGSFDQTQYGYNQPASSGKGMAIASMVLGIISIPAICFWIVGLPCAIVGLILGILYNKKNEHSPMATAGIVCSIITIALLVLVLILCIVGAVSLSSLEYSYYY
>MGYP001587054973 FL=0
MQPKPVTNRRSTAQEIFAGCADSARQPYMNTPLQLRPVHTLLCPWPXFPGRSSRPNGAFSPVRTESSPANRAGSRAGSHAESAPTFVLRGRVCGAXXLX
>MGYP000208465860 FL=0
SSDLQLVEYPVISAELIMMPQNMTEISDEETAGKVLKLIDVLEDHDDVQNVFANFSIDDELLEKINF
>MGYP003351738706 FL=0
MKQSGGFIWVYSELGRGTTFKIYFPRVGQTVEPRTVETPRIILPADTGATILLVEDEDSLRRSIQQMLTKAGYPNGFSTELVTYVLPQWAASVQGYLKAVGIDAKISQLQVQALVQRCQGRGECPMDMGSWGSYSINDVSAVMPVFLGGGV
>MGYP000525123928 FL=0
MFDLFIKEVDKKLADKSLNNEITSKEYYAEKQKLKYLKPAKEYTNNLKYAKIEDMILDFKTKLEQLKFDTKLTTFEQKEFNIKDLEKNKKNNQTELEYQKEDIQKEKYDYEYHKIYQERDELSEEKLKEKIKELEDKEIEPPTEKEVDDMYNDLGYKYLGKEMSDRENYKLAETWKNLEKQDINEEHESMYMNYDELDNKITRYTFDNDLDNNEIKTYIGKRLGEDYGKNLDREKKELASKFAELEVSGRYRDIDINNPKLLLQLEKVDGLNIETLEETIGLDTKDLKKEIYIATYEEYLDENKGIMSPAKEYYTKDEKGEYIKIGESDKEETTITVDGFDFKLKNDEILKGEELEKVTQKEMVEELIKNEVEKSLGDGKRVTGISKVLDVNFLKELEKQCGYDKKDETLWDRVSLVSTINEKGEEDFQILEKYYDEDGNITYKDLEGISTLENSNRDIAIETEEIIYGKYKKVESTKTLKEYQTESGDRYAITRDEDGNLGFSEIYSEIHREDYHILEAKEIDTYSFETKWLTEGYDEFDINQSDIENAKEIFDRSKDEMEKTQENTKEDKGREL
>MGYP001623022299 FL=1
MEVDLEHLRKPCTCGRAHEISVRGIWIESGASGRLYEMLTEGELREFTAPVIVWDDNTSEAAEKILGDVSEICQEICLSAGNLRADSRSVEILEETLPEETDLILAVGGGTIHDLSRYVAAQRRIPFLSVPTAASMDGFLSTTADLSQDGMKKRVPARAPLYVFADTDIFSKAPYRLTAAGISDLLGKYICLADWRIAHAVTGEYICEEICSLEYKAVKDVVKRLDDIREGDAEACERLMYALLLSGLAMQMAGGPRPAFCAEHHLSCLWEMEVINESTDALHGEQVGVGLLLAEKYYRRIQKAIENGRCEIRRHEGLEKELLQTTFGSHGLYEAVMDENTPDPLDEVDPERLRRAFLEIAEILDDIPSRERLMDMMEEGGCRVSLSEIGLPESLEEESLALAPYVGRQMSLLRLGKLLVI
>MGYP003326090123 FL=0
VYKRQIVKTVEESFSNDFNVDKCLLKFYKNKDIEKIEKETGLSLHKGAIHCGSFSSEKADILFGDNKIESMVIAVIILEKEIGLLKLGSLDRAKYLGDEDTTFIQAHDYVDLDWYGNYDTWADFPDGNTTYRQILMHYDMRCSSSGCSGWDYTTKIIILKPNGEYNADGDPTFINAQTLANVVTPYGTYMQEGNSQGSGFSPNWVQRYTYDVTDFAHLLVDSVKMRAFYGGWSTGFNVTLNFEFIEGTPPRDVLDVQQLWSGSTS
>MGYP001037461204 FL=0
MTRMLAKRIIPCLDVTAGRVVKGVNFVELKDAGDPVEIGRASCRERVSDTV
>MGYP001119331046 FL=0
LEERIKAIMKRKHISITALVAVLVVMCVTTTVFASAAPEDREDPHQNAPETGYVYDHLGIVEDNGVSIMSKGGENGEKLYSADDGKTWMTEERYHAEYGSCYKGKLSAFESGGSPFPVGL
>MGYP001570668198 FL=1
MSLNKRLSWTLLTLFFIFDNFVSYYAVTYHGGREANLAIAWLVEKYPLLYFVCIPGQIVIIYFIVKWLTRFASEKVILTALVIYWPIANSSMNLTFILGHRQPAKNWLMFTAVGVLLAVVYALRNWKNKNHRKF
>MGYP000837251816 FL=0
GLGDVYKRQHFKAKREMEASHQLEKVGEGIRAMYSWNGDDKYAEK
>MGYP003705394679 FL=0
TDLNKVVTLAENGNREAQIGIAHVFEQRGQSRENIMRAIAWFHLAHNTDEDHFSSGRERGSRITDEFKRIRVESELFTEGLRSELTGTNVGVAMAGRNCSAEQRA
>MGYP000950492884 FL=0
MSEMHATVEAVTARIVERSKRGRQAYLDLIAKQRDAGVNRPVLSCGNLAHGFAASGEDKASIRDGKAMNIGIISAYNDMLSAHQPYGRYPEQMKIFAREVGATAQVAGSTPAMCDGVTQGQQRDVLDAASQLNRMLDERVDDPEIANKVNEELRLQYRYLDLRRPEMIRNLRLRS
>MGYP000774599694 FL=0
MALEKISDKQKEILEFIKSEILNRGYPPSVRDICEGVHLKSTSSVHAHLETLERKGYIRRDPAKNRAIEIIDDSFGLQRREMVNVPLVGRVACLLYTSDAADDL
>MGYP000900149593 FL=1
MKIKINRFKNIHDGTIGKLTITDDGKKLFECFTLEPAGADTIERGKDRRIPAGLYNVEWYNSPSQRRICPLLWNELVPKSRYILIHTGNFPKDTAGCVLVGDGHNAAGVTNSLKTYNTLFKLAQKHGLQSVEIINGAGV
>MGYP003625506155 FL=0
MKEVKVKLTLDDKGAVVAAKNIQDSIKDIGDEAEKTGGKVGEVGKSASKSKKGFATMAKGLKSVGVALKAAGIGLVVALVAGLTEAFSRNKRIMDGVSIVLGTIQEVFTQVADALIATYDAVAQSSDNFDALGKVMGGILTLFINPFKISFFAIQLALQAAQLAWEDSFFGGGDEEKMAQLRLDIEDTKTSISEVADEMVEAGSTIVDNFAEAVTEVGKITDIASENLSKVSIKAANETAKAHKAATDAAIIAQAMAAKNIALFDRQAEQQRQIRDDANKSIKERQEANIKLGEILEKQEEALLKQAAAVEAGARAEFAKNNSIDNRAALIAAEAATAQVLADIEGKRSEQKSNTNTLL
>MGYP003576697368 FL=0
ITTKLDLNALHAGIFTEGEVTENSAFYLSARGSIQQYLFGDKAKEDLEKEDGIRVQQVPQDSDYQFKYQYNLDDANSITLSANGATDLAEAEFLDLSTDVLEDPDMAGDARIKNNFQNAFISWRSQPDDSSQLNVQLGQYINKGDTFWGDKKYFFNIKTTDSYVTAQYEFLLAKDHSLTLGAEAHSTDY
>MGYP000113647356 FL=0
VTLWIVAEGRYEPQNFQWYAIRNDDLEWDWAVGASNYKDIRAERSAVQPGKMWEIESSVDILRQQVETPLRNGFFGASGGPGGGSVTAARSSASRRSLSARSASSLAWRSAASRCLRSASSLASRTSVSAVRWALTSVLRNVSSKSGMGAGGAPGGMGVCEGLRASISRASADQRAGRAGRTQPGIAVRLWRAEQNAALPAFTPPEI
>MGYP003702691201 FL=1
MLSRFGYKRFIKSYKYIIGKEAVILLQFYNKDIGHYSLLINTRSSLSDPFPSIFSDFPVVSEVGGGPTLIH
>MGYP001051415245 FL=0
EALAVYKELVDKGADFFKSQAMFDQARVLAKKGDTAGAKDLYKKILEKQATGPLHDEVQARLGAIGG
>MGYP000892997868 FL=0
LSYSLAQGDGINDAHNSLVEIIDNLGVVAQDADINFEADPVLRIFLEVSDGDLSYQQSFAIDVLNLDEIAPAITSGATATAIDENSGAAQVVYTATSDDSSDVSGGVSYSIKPGSGDGEAFSIDSSTGVVSLIGNPDFESKPSYAFTVVATDAAGNSTEQTVALSINNLDEIAPLITS
>MGYP003509546382 FL=0
NTAEDARRAVAAVKFGPGNHRGLAAGTRPDNYGLAKSMEEFVERSNAETLVCVQLEHAAAISNVDEILAVDGVDVLFVGPSDLSQSMGFPGNPTAEPVRAAIEETLRKIAAAGRISGMPASTDSVVSVLKTGAKYIYTHLPRLIGAGAAQFRNAAASSK
>MGYP002781630755 FL=0
AYIRRGDGGFEEVMRIRVADVIKTVRVKATVIGSGSRARVLGVDLDITDQLLAQEKIEETAENLQAVLDGSP
>MGYP000437988234 FL=0
TTVASASSATGAGATGVALLEIYEVP
>MGYP001158237079 FL=0
MNRNLFTSESVTEGHPDKVCDQISDAILDDILTHDPNGRVACETLTTTGLVVISGEITSSYNPNYEQIIRDTIKKIGYDDPKSNFCSKTLKVLLYIDRQSSEIAQGVNENNNQEQGAGDQGLMFGYACLETPEFMPLPIQLSHRLTQRLSDVRKNKKLPWLRPDGKSQVTIEYDGYKPVSVSKVVIATQHEDLIEKFSSEEKEHSYIKEEVIKEVVLPVL
>MGYP001046820937 FL=0
MPEVLDGLRAAGVNDVPVIVGGIIPEADAARLLGWGVAAVFTPKAFSITDLRGDVVRLIRPAPRLAAAVCVWGLALLALSQPVADQVHLG
>MGYP000228404273 FL=1
MSLTMADLLFIWQLFILFEIVLFASYTFIMYIYSRKEEEFPINNNLPNVTLIIPMYNEEKVIREKIENTAHLDYPKDKLEVI
>MGYP003201765208 FL=1
MLTSGLGVDKNGVENTLYELLLGEADVKKTIVKDVVENLDLIPSNINLSGAEIELINMDDKEYILRKITEKLRRKYDYIIMDCPPSLNMLTINALTAATSVLVPIQCEYYALEGLSQLIHTIDLVKDRLNKKLVMEGVVFTMYDARTNLSLQVVENVKDNLEQNIYKTIIPRNVRLAEAPSYGQPINLYDSRSAGAEAYRLLAEEVINREDK
>MGYP000603741297 FL=0
MVPFQETPIEEPQQLALPRPQDVEQAPQEPGVEYGGILEALRDTGRQALASFPTLVAMANKPGIYDPGIYQDKEEYIEKVNDFRAEMLTDALKILEGKENEKQAYHDLFDLIKNGEWDKLDNWAGTFLGQTVPQLAMSYLTKGISGFVLESASSYQESVRKISEKKGISVEDVIREGHDKPALDFLIGTINASLELMGAKSVIKPGATGVRSIFRRIFQSAGTESGTEALQGNITKLG
>MGYP004409704841 FL=0
LKQVSKDFAQPARNTLCDVQWLMRNNVSLHGLLKQGSPSPALVTKLAKASPGCLMQRDGDGLLPLQFAAAYKSRFGDALVSTIREVTVRAVPGSVWPARSDEARGLRKGLRPVRTRVSGVIVAA
>MGYP000111574240 FL=0
HGMAEEHEPAVPALLRDWIPEVQDYRMLVFGAFLAAMMVVRPGESKPERLREIIDDINSQPKGPASAFSNMAQQLARDNIRVNSVAPGSILFEGNNLYAKDIDPVEVRYRIGMVFQKPNPFPKSIYENIAWGARIHGYTGNMDELVEQSLRGSALWDEVKDVLKKSAYEVSGGQQQRVALARALITQPKLILLDEPFAALDERSRFRMQDLLLDLKQGRHAPVHTLIDLTFVHEMAALEVRGDDLYIGAAVPVNRVALDPLVGTHAQALVEACNLIAGPQVRNTATLGGNVAHALPAA
>MGYP001611773216 FL=0
DDITKSLEAGAFWDAHLKEAFDQTPADGWAIDLGANIGFFSLYFAERFERVVAVEAHPDTARLLYQNVMVNGQGGKVLVITAAAYDRHTTLELATSKVHGWLEDERSFLDTDSVLHSAGFSFVEDPSQQHHLHEIRVPTVVLDEIIPESAPIRLLKVDVQGAALRALHGCDRILARC
>MGYP000527795113 FL=0
MKTTQYKDQSAIKTIQYKDQSAIKTTQYKDQSAIKTTQYKDQSAIKTTLYKDQSAVKTTQYKVQSAIKTTCFWSLTSLFQCN
>MGYP000852577756 FL=0
MARNRAEEEVEQLHFLRVGEVFEPFVPWRRNEQGKQVYIKLTRAEEVSFLYVGSQLSVRAELQQALMRLVNDGWSVEGEVVVQFDGRSEPGTDPYVYREPLVIELGKGLLPLIDPQNGAPLISKFEQIREEVAREVGLVIPPARVVDNLQLDNQYLLRVKDSPIAMGEVFLDRLLALGSLELLGQVEGWTCQDPVHRMPAKWITEEH
>MGYP001572973866 FL=0
GLKKLGFNTGMSETPITPVIVGDAALAHQFSRDLFAEGVFAMSVGFPTVPVGKARIRTIVTATHSEEELSQALEILGSVGKKLGII
>MGYP000527111928 FL=0
GLKSIWIPWLWPVFNQIFLMVFLSIWLRRSKVTTGAEWITTRFGRTRDSNLSHGVVVVFALIMCLGYLAYGFIGLGKFVMIFIPWEIVQPYIPVHIPLEYVPHVYGIAFTLFAVFYAVLGGMSSIVWADVLQYIIMTISAILIGILAMKALAVETLNVPETWKSPFFGWNLDKLDWRGIIDEVNTKIASETKT
>MGYP000292924687 FL=0
MKKILYMTIGIVSVILGLIGVFVPGLPTTPFLLLSSWLFYKSSKSLHDRLHRSRLGKYIRHYEAREGVSWLSKLISIVCMWNMIRIFSNREFTCTDLIIGAGMYWNWKCVVYSAYSKEVKDELSKNILDSFLLFLDHYVYNFSGNNDHFADFFAFKPFCSFRGRFYCSFNFGIGGS
>MGYP000084281174 FL=0
EALGGPGDRHPDDGVADGHDGGTDVGREPRDALAPARVLGQPEEAHPLSILNDPGGRELAQEEGRLRRGDRGRAHAFRPDEPGDQREEGFDVSPANERLYGRVVRNYYRFVDGVIADYLAEVGENS
>MGYP003569383907 FL=1
MPTYTFRNEETNEEFTTLMSLNEREIFLKENPHIKQCLSTPAFGDAVRMGMHKIDRGFNDVLQKAKSAHLHSTIDTL
>MGYP000625040987 FL=1
MSKRHLHLGQTLTFTADPFVEGPGAARHDTQGALVVEDGVITQVGEAGALRQGEFASVTDHGQALLLPGFIDAHAHYPQTAMIASWGKRLIDWLNTYTFPEEMRFGDPDYAAEIAGRYLDLLLAQGTTTVCSYCTIHPTSVTAFFEAAEARGMRVLAGKTCMDRNAPEGLRDTAQSAYDDSKALLGRWHGQGRASYVITPRFSPTSTPDQLSALGALWAEHPDCLMQTHLSEQTDEIAWVKSLYPQARDYLDTYEAHGLLGANGLYGHAIHLEPREKDRLREVGAALIHCPTSNTFIGSGLFDMDGLTRAGHRVGLATDTGGGSSFSMLRSMAAAYEIAQLRGRALHPAELIWLATTGSARALRLDDRIGSLAPGMEADFIALDLASTTAIAQRSARANDLWEALFPTIMMGDDRAIASTYVAGRRVA
>MGYP003399258141 FL=0
AGSADILTAGIAIIAASDIIIAILFIVLSIKFL
>MGYP000308143635 FL=0
MKRIAWVDAARGFAIILVVFGHVLGGVMSRRRLDGEGLYRAIYNYIYLFHMPLFFMISGLFCIEAMRKSPINAFISRTESIASPYIFWDFFVRTAALPLIGAFMSNPPSDIGWHARLEQALTGEVSWFLWTLYVMQILLIPFARMPIWVLFLVSLAVILYLPNSHLGTINSVVDHLPFLLFG
>MGYP000676410644 FL=0
MDGNISLENRLELCNSKLSEKEKMKKITAALCDMPLFKGLSEPQIQQALESFHAYTRCYDKGTYLLSCGQPPQFGLVIAGEVHIIKEDFWGHRSLLAQLGPGALFGESFSLSATPSLPVSVLAGTQVEALFFRAELFFQPSVVSACSISLVTNLLGILAEKNQLL
>MGYP000176506859 FL=0
MVVNKLLITSTILIATTLITYSCTEDTKSKDRLSLEQKTSVKSDAKKVCELVSNIKIAISEVSNAINEGANSSYVEALNAKAKALDVRIKEIQKRNAGNEEFMKLQQSCYEVMNK
>MGYP001197552457 FL=1
MSNFVQLGRYRHYKGKEYQVLGCARHTETEEEFVVYQALYGERRLWIRPKSMFLEHVQIGTKLIPRFILIERA
>MGYP003478946207 FL=0
MSPQSVNTRQATRQVRDVVFVDGVRTPFGKAGDKGIYHGTRADDLVVKCIRDLMRRNPSLPAERIDEVAIAATTQTGDQGLTIGRTAAMLAGLPQSVPGFAIDRMCAGAMTAVTTTAGSIAFGAYDVVIAGGVEHMGNHPMGAGADPNPRFLSERIVDPAALNMGNTAENLHDRF
>MGYP001199610918 FL=1
MQSIGTYLKQRRESLSLKQKDVANSVGVSSAYLNKVEKGDSIPAPAFLEKIARTLELDFIDLYLRSLEDRPLPDTLMHAMREYRSLRPLLAPGMPVERFRSFIRSMSPEQTHRILLMIESVVLMIHEAEDRGAGARAIREPVPGDGTGADRIPPE
>MGYP003348169323 FL=0
HQPLLHAKEKLASIINTTSGRGGKIIAPAFAVGRTQQLVLMIHELIHEGKIKEIPVFVDSPLAVNVTDAFRAQRHARKTGGHAKEKTGPALPAGEHGAHLGARQAGEVDHGVGGLAVVPGMNGRAHLERIGGIDRAHRIGEARRLHRIERRLRPVERQQPHIRPRPSRRRHRQHARLARADE
>MGYP001430805213 FL=1
MRIESREDLKTWASFKNISVYLDQKKILSNININIKHGENILILGPNGSGKSTFLKLLNRSIYPITKKDSSLKLFNKENINIWDVRKRIGFLFKEMEGRVNHGVKLYDLITSGFSGTFNSRYSKLLSEIEKVKVDNLINEWELNNIVNNEFLSLSDGEKRRALLARALVYEPDILILDEPFCNLDIKSSFILNQNLNRLIEQSINILYVTHNLESILPKTNRVILIKEGKIIKEGNPNEIINSKIISDLFKISINVVKQDGYWRSYPVSI
>MGYP001428761037 FL=0
MRIDGIQGVYVPSKKPPINPLKKAVGRIRDVIATPKKYTHKDRLREQWSNSGSSLSYREYATTHDHTIKTPASELVKRFK
>MGYP001559191903 FL=0
MLILMAYIYKKTIHGKQYYYLRVSKRVKGKIVVKDIAYLGNDASKLDYAMQKLPLLYKKDIRKAYRNIRKFVQEESFSVANKSPATIACAGAINPPETKEKIQYLKKSFKGMPYGAAF
>MGYP003492916345 FL=0
TMGKNAKFFPENIWKFELKKHELLIIMP
>MGYP001589567138 FL=0
VQDVEQIVARALAEFAAAPDPAALENSKARYLGKSGELTALLKSLGTLAPEARRSAGAAINTAKARLEQALEQRRAELANERMQARLAQEALDVTLPGRGRGRGGVHPISRTWARIEAIFGSIGFEVADGPEIETDWYNFTALNNPENHPARSMQDTFYVDLRDSGGLPLVLRTHTSPMQVRYARTHRPPIKVIAPGRTYRVDSDATHSPMFHQVEGLWIDEDVSFADLKGVFADFMRRFFESDDIEVRFRPSYFPFTEPSAEIDMKFDSGPLKGRWLEISGAGQVHPEVVRNFGLDPERCIGFAFGAGLERLTMLRYGIDDLRLFFDGDLRFLRQFA
>MGYP001206066660 FL=0
MIVTLNKKVLIVIRVVKIFMTFLTSKAFNFN
>MGYP001314004753 FL=0
FHTPNYKYEVFGSFINSKNSVKETFGLANPTEFDQLSGRAKTYAGTANFYDASNLFIDRTWSITQFFRPGKRTIQLNDTTIVPDTNTSNIKSQWFHELRYRRHINRFTDSDTNTDLFPVRYVSLETHDSMFHAVLSNRIGKVIKSKSQLIKLWGLHEAIQVKQQYFHSSNLSHLRFGAEMSKTLLSVKHDFYAHISALGYYQGDIKALYGFNPELEKVDVRAEASITRRRPDYNDQFFGSNNYYWNQDLNQTQTSKLLLTIDNKKATQGIELAYFNINQFVYYDTSGFAQQFNESINHLRATAKLQLQLGSWFWQHRLTYQSTSSNVLALPDLSVKTRLYKEGYLFNKNMWARMGVDLQYFTPFTGTVYNPIVRQMTLSNTEIGGFP
>MGYP001770970470 FL=1
MIRSIKYGLLLLLPGMLFTAQAADRQDVKCHLITSKGEQIAFYRWDLDKQQLFMARLSGKSLKDARGKRYFIREARECVLLKEAFSSEKARKLDEMALR
>MGYP000978871530 FL=1
RAEPAELDAELARLILLSEQRRLAILAPLLTGLTLLVACFGVLANARGTLPNGFGWILCIASVACAYEWLAGLFVARLAQKGRQPARFRFYLNALVELGALAVMTLVLARTNNPVHAISGPASYSYFLFIILATLRLDFRICVFTGTVAAAAYTLTGLLHWNALEASFSE
>MGYP003540537710 FL=0
TPTAVTPAAPVITPTIVPNAPSVTGQAIVAASTTVTPPAAPKTVAEAYPTLISNDRGVTSLDKAFSLRKIASRFLGSVSPIETLVNALSSTKAMINFVGSTTTKHTLTPLAQVFYRETLPEIAGKLINTLNTRLSAALDGTNGKSALGDLFSNPTMSKKGELNIPQDMVRGRVFNITEMDA


================================================
FILE: src/alphafold3/test_data/miniature_databases/nt_rna_2023_02_23_clust_seq_id_90_cov_80_rep_seq__subsampled_1000.fasta
================================================
>XM_032924760.2 PREDICTED: Daphnia magna juvenile hormone acid O-methyltransferase (LOC116918952), mRNA 
CAACAGTGTCTCAAAGAGTCCGTGACGACCGAGTGACCGATGCTTCAAGCAGAGCGGAGAGATGGAACTGCCTGAACTCTACGCTGGCGCGAGTCCGTTCCAAAAACGTGACGCTGTGCACGTACTTACGCAGTACCTTCCTCAGTTCGATTGGGCGGAGGGCGACTCCGTTTTGGACTTCGGTTGTGGTGATGGTGACCTGACTGAGTATTTGGCCCGTTGCATCCCCAGGTGTGCGTCGTTGACGGGCATAGATATTTCAAAGAAAATGATAGACTACGCCAGGTGCCATCACCAAGAGCATGATTTGCGCCTTGGATTTCAGCAAGTCGACATCATGAAATCTATTGACGCCAGAGATGTATTTCCAGATGGATTCGATAAGATATTTTCTTTCTATTGTCTCCACTGGATCAAAGACCATCAACGGCTAATGGAGCATATGTACGACATCCTCAAGCCAGGCGGGGATATCTTGTTGGTATTTTTGGCATCCAATCCTATTTTTACCATGTACGAACGCATGGCAGAACGGACGGAGTGGGCCGAATACATGAAGGATGTTGCTGATTATGTTCCTCATTACCAGTACGCTGCTCGACCAGCTGAAATGTTTTCTTCTATTTGTCGCTCAGTTGGTTTGCAGGTGGTCGAATGCACGGCCCAGGAAAGGAGCTTTTCGTTTCAGAATATCAATATTGTTAAGAATGCGGTGGCTGCTGTCAACCCGTTCCTTCGTCGGGTCCCTGTTCGACTGCGCGAGAGCTACCTTCTGGATTGTTTGATGGAATTGCAGAAATTAAAGGCACCATCTGCAGATGAAACAACTGTTGCAAGTTACCGTTTGATGATTGCGCACGTTCGCAAACCATAAGCGCAGGATGGCTGTTGAGACTTGTGGAGGGGGCAAAACCCGGAAGGCTCCCATAAGACAAGTGCTAAAATAGCAAAAAACAAAACAAAAAAAACAAAAAACAAAAAAACAAAAAAAAATTAGTTATCTCATAATCCGCATCAAGGTGAGGTAAGATGATGACGAATCTAATGGCAAACCGGTGCTGTTACTGTAAATAAGGTTTGGGTGGTTATGGGATGGTTACAGCCAATGGCTGCAGTGAGTGATTCCAGTGACAAAGAGAGCTTTAAAACATTAAAGAATAAAAAACAAAAACAAAAAAACATTGCGGTACAGTACGTGTTCGAAATGGAAATAATGATCTCGTTTTCGGGGTCCGAACGGTATGGATGGATTTTTCTAGATTTGCATAAAGGGCGGTCGATGCGGATTTGTAGTCACGCAGTAGTAAAAACCTCAATACTCCCGGTTCACTGAAATCAGCAAAAAACAAAAAGATTAGATGTACAATACGTACTCCGTGTAGTACGTAACATTTGGAATTTCAGATTAATACAAGTATGATCCACA
>XM_052522147.1 PREDICTED: Oncorhynchus keta serine/threonine-protein kinase DCLK1-like (LOC118377397), transcript variant X16, mRNA 
TGAGAGAGGAGGGAGCATTCGCGAGGTGAGATGCTTGGTGCTTCCCTCGGAAGGCCTGCATGTCAATGAGGGACGGCCATCTGGAAATCACTGCTTAAGACACAGAAACCAGCTGCAGCTCTTGCAGCGCACACTTGCTCAATCACAGGGCAACAAAGGGACGGATGCTTTTTCTATCGCTCGGGCCATTATACTACACATATATGCACTGACACAGTCTGTTGGAGAGCTGCTATATGCAATTGCTAAAGAATTGACGCGGTTGACTGCATCAGACTTCAATTAAAGTTATGGAGCTGGAGCACTTTGACGAGCGGGAGAAAGCCCAGAGAAACACCCGCCGAGGCTCCAGGAACAACGGGCTGCCGAGCCCCACTCACAGTGCCCACTGTAGTCTGTACAGGACCCGGACACTGCAGTCCCTGGCCTCGGAGAAGAAAGCCAAGAAGGTCCGCTTTTACCGCAACGGAGACCGCTACTTCAAAGGGATTGTCTATGCCATTTCCCAGGACAGGTTTCGGTCTATAGACGCCCTGTTAGCCGATCTGACCCGCTCCCTGTCAGATAATGTGAACTTGCCCCAGGGGGTCCGGACCATCTACTCTATTGACGGGACCAAGAAGATATTGGGCATGGAGCAGCTGGAGGAAGGAGAGAGCTATGTGTGTGGCTCCATAGAGCCATACAGGAAGCTGGACTACACTAAGAATGTCAACCCCAACTGGTCAGTTGGGGTGAAGACAGCTGCCTCGGCACGTGGCCCATCCTCCCTGGGCAGTGCCAAGGCTGGGGCCCCAGAGACCAGGGAGAGTAAGGACTTCATCCGGCCCAAACTGGTCACCATCATCCGGAGCGGGGTGAAGCCTCGAAAGGCCGTCCGCATCCTCCTCAACAAAAAGACGGCCCACTCCTTCGAACAGGTCCTCTCTGACATCACAGATGCCATCAAGATGGACTCTGGGGTCGTCAAGAGACTATACACCGTGGATGGGAAGCTGGTGACATGCCTTCAGGACTTCTTTGGTGACGATGACATCTTTATGGCCTGTGGTCCAGAGAAGTTTCGCTACCAAGATGACTTCCTCTTAGATGAGAGTGAGTGTAGGGTGGTGAAGTCGACGTCATACGGTCGGATCTCCTCTCTGCTGGGACGCTACTCACCCAGAGGAGGAGGCTCACGCCGAAGCTCAGGTTCAGCCAATGGGACGGCAGGCAGTCAGCTGTCGACTCCTCGCTCAGGGAAGTCCCCCAGCCCCTCTCCCACCAGTCCTGCTAGTCTCCAACGACGCAGGGGGTCCCAACACAGTGGCTCGTCCCTGTCTCTAGCCTCCACCAAGGTGTGTAGCTCCATGGATGAGGGAGACGGAGCAGGTAGTGAAGCGGAGCTGAACCTGCTGAGTGATGAATGTCCCTCCATCCCTCCGTCCATCGCTGAGAGGTACAAGGTGGGGAGGACTTTAGGTGACGGTACCTTTGCTGTGGTTAAAGAATGTGTGGAGAGATGTACCGGCAGAGAATACGCCCTGAAGATCATCAACAAAGGCAAATGTAGGGGAAAGGAACACATGATCCAGAACGAGGTGTCCATCCTCCGTCGTGTCAAACACCCCAACATCGTTCTGCTGATCGAGGAAATGGACACCTACAGCGAGCTTTACCTGGTCATGGAGCTGGTCAAGGGGGGTGACCTGTTTGATGCCATCACTTCCTCTAGTAAATACACAGAGAGAGATGCTAGTGGGATGCTGTATAACCTGGCCAGTGCCATCAAGTACCTGCACAGCCTCAACATCGTGCACAGAGACATCAAACCTGAGAACCTGCTGGTGTATGAACATCAGGATGGTAGTAAGTCTCTGAAGCTGGGAGACTTTGGCTTGGCTAGCCTGGTGGATGGACTCCTCTACCTGGTCTGTGGCACCCCCACCTATGTAGCACCTGAGATCATCGCTGAGACAGGGTACGGGCTGAAGGTCGATATCTGGGCAGCTGGAGTAATCACATACATCCTGCTGTGTGGCTTCCCTCCCTTCAGTGGGAACAGTGAGGACCAGGAGATTTTGCTGGACCAGATTCTAACGGGACAACTAGACTTCCCTTCCCCGTCCTGGGACAACGTGTCTGTCACTGCTAAGGAGCTGATTACTGGGATGCTGCAGGTGAAGGTGGAACAGAGATACACAGCTCTGCAGGTTCTGGATCACCCCTGGGTCAATGATGATGGGCGATTAGTGAACGACCAGCAGCTCTCTGTGGCTGGGAAGATTAAGAAACACTTCAACACGGGTCCTAAAGCCTGCAGCACCACTGCTGGAGTGTCTGTTATCACAACCACCCCTCTTGATAAGGAGCGGCAGGATTTCAGACTAAGACACCAGCAGGATGTGAGATTGAAGCCCCGCCCCTGCCCCCAACCAACCGGCTTCCCCACCAGTGCCAGCCAAAGCTCAGCCCACAGCTCCAATAACCCTGCCCTCTCTCCCGCTGACTTTACCTCAGAGTCAGAAGATTACTCCCCCAGCCCCTCCCCCACCTCTCCTAGCTCCGCTGATACCGTCCGCTCCCCCACCTCCCCCTTCTAGACCCCGAAGGAAGAGAGAGGGGAGAGGAGGAAGGATAGGGGGTGCGTGTCCCTGTACTAACACTAGCCCATGTCCCTGTATTCACGACGACACTGTCAAGATGCCTGCCAATTACTTAAACATTGATTTTCCATTCCGGCTACAGTGTCAGTTTACCAAAAGATACACTGGGGTCAGAGCCATGCATAGGGGTCAGTTAGGGTGGGGTTAGGGTTAAAGGTTAGAGGTTAGGGTCAAGGATAAAGGTGTATTCTGGATGGGTTCTGCTCTGGCCCTGAGAGGTTACTAAGGCTGAGAATCTGTATCTGCTTATCTTTTTAAGACACCACACAGACATACAAGAGTTAAGCCTTATTTCAGCAAATACTGAATAATGATCCACTGAGGTCCCCTGGTGTTGGGAGGTGAGTACTGCAGGCCAACCAACCTGCTAACAGGACAGCTTAAACTGCAACACAACTAACCTACAGATCAAAATCTTCCATTTAACTTGACGGGACCTCATACGCCCTAAATAGGGCATCTTAAGTATTTATGTGATTATACATACATTTTGAAAATAATAATGATGATAATAATAATGACGTTGGGTCCTTGAAAAGTGCTGTATAAACAAAATGCCGCGTATTATTATTCATTTTGACAATGTATGTATCAAGTCAGGTATCTATTTGTGTGAAGTTATATTGCACCCAATTCATTACAACTTGTACAGTTCATTCTGTAGAAAAACACTTTCATGTCAATAAGACATGCTGTATGATGTAACGTGAAGATATAATCTACGTGTGTCTGGAAGGACACGTGGCTACGGTCATGTCCACTCCAGTCCACTTTCATTTATCCAACTGTCTAGTGTTCAGCTATTCTCCAGTTCTTGGTGCTGTTGTAGACATAATATACTACACACTTTACAGAGGACCAGAGAGGGGCGCTGGAAGATCTCCAGGCATTCTGCGATACCATATCTATTGGTTGATTGATTGTGTTTTTGTCCATGACTGTTATGCCACTGTGCCAGTTCATGTACAGTCGTCATTTAATGGACTACGAAAAAGGTTGTGTATTTGGTAGAGTATTAACAGACATTTTCATGGCTTTTTACTTTTGTACAAAATTGGCCTTGTTTCAGTTAATATGTTAATATGTTGATAGTGAAATAATGACCTATTTAAAGTACGATTATTGGCCTGAACACAATGGACCAAGTGCAATTAGGTTCTGGATCTCTTACCAATATTAGACAGCACAGACTTTTTCAAGCTATTGTTAACTATAAACAATCCATACATTGTGAATGTATGTCAGAACAGAGGTGCTATGGCAGCGTCTTTCAGTGCTGCCTGAGTTTTCCGCTTGCTGTGTGTGAGCCAGGGGTTGGAACCGGTTCAGTGAACAGAACTGAAAACTGGAAAATCATGTAGTTCAAAACAAGATGCCCAGCACTTCAAGCCTCCTCCTCCACCCTCTCTTCCCACCCACAACATTTTAGTCACATCTCACTCCCTACAATTGTCTGTCCAATGCATGTAAACAACTACAGCTTGCCCACTCCATAGCAAGCTACTATATCCGCACTGATTGGTAAAGTAATTTAATGTTGAGTTCAATGTTTTTTAGAAACTATGATTGCAGAGGTTTAAAAAGGAACAGAAAGGAACAATATAAACTGCTACTAATTTGGGGAATCAATCCGGTTCAGAACTTTATTTTGCTGGTCAGAACAATGGAACTGAACAAAAAAAATGGTTTTGTTAAAAACGATGCGATTGGAAAATACTTTTGCTTCCAACCCCTGGTGTAAGCACAGTGAGTTGGCAGGTCTAGAGAGAGAAGCACAGTGAGTTGGCAGGTCTAGAGAGAGAAGCACAGTGAGTTGGCAGGTCTAGAGAGAGAGAGAAGCACAGTGAGTTGGCAGGTCTAGAGAGAGAGAGAAGAACAGTGAGTTGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAACACAGTAATTCAGACAGGTCTAGGGAGAGAAGAACAGTAATTCAGACAGGTCTAGAGAGAGAAGCAAAAAGCACAAGAGAAGCATGAGATGATTGATGTGTGGAACACTTGTTTGTCCTCTAGGACAGACAAACAACTATGTTAGTACTGAATTTTAATCATAGAAACAGAGGAAGTGAAGTGTATCTATCTGCTGAATGTAATTGTCCAAATTTCTGTTGTGAGAGAATGAAAAAGTACAGATTGAAATTATGTTGCTATGCAAAATATGTATTGATACCCAATGATATGTAAGAATTAGTGACTACATGTGAAGCCAATTTGATCGGGATTCATCACCAGTAGCACATCTTTTTTCCTGATGATGGTAGTGAATGGTCATTGTTCCTGTATAGCAACCCTTTAACAGTGGTCATCACCAAGCCAAACCTGTGAATAAACCACTTCCTCAATCTGAGAGCCTGGTCATTGTACTGCGTCCGTCCAGGGGGACTACAGTCGGACAATCTGGGATTTACAAACAGCAGCCACAGACGCAGCAATAACATCATCCAGCCAGTAGATGGCAGTATAGGATAATCTGTACCAGATCTAGAAGGTAGTAAGTAATAAGACAACAAACACATGCATTTTGAGTTTCCACTATTGAGATACCTTTTAAGTGCATGGGGTTATATTCCATTTTTTGTTGTTTAAGATATGAGTAATATACATATAGATATTCTATTGGGGCGGCAGGTAGCCCAGTGGTTAGCGCGTTGGACTAGTAACCGGAAGGTTGCAAGCTCGAATCCTTGAGCTGACAAGGTTGTTCTGCCCCTGAACAAGGCAGTTAACCCACTGTTCCTAACTGACTTGCCTGGTTATAATTCTATATGTCAGAATATTCGAAAAACAAACTACTAGTTTTGTTCAAACTGCAATTAACATTTGAGAATTCAGTCGCATAAGAGCTTGCTTTATTTATTGTTATTATAAACACAACAAAAAGGAAAACAATAAAAAATGTTACTGTTCATCAATCTTTATATATTGTCATAAGTTAATGTATAACAGCTCCAAACAAACACAGGGTAAATGCCTCAGACATTGCAATCTACACAAAAAAACAACATGTAAATACAAATAACTTGTGAAATCATGATATACTTAAATCTATACTTAAATCAACAAAAATACAGATCAACTAAATATTTTACAAAAAAATCTAAATTTGTTTTTTAAAGCAACAATGTCAACACAAATAAAATGCATTTATTTAGCAAAATCCTCCAAAATCCTCCTTACACAAAGATTTAAGTCAAATATTCAAAATAAACCCAGTATGTCAAATTCATATTGATGGGTATTATGAACCAAAGCAGTAAAGTCA
>XM_051681377.1 PREDICTED: Myxocyprinus asiaticus CDC-like kinase 4b (LOC127431112), transcript variant X2, mRNA 
GCCAAATGGAGCAGGTCAAAGAGACCGAGAGGGAGAAGAATGGTTACCACTACAGCAAGTCATCCGGACGCAGTGGGAGGAGTCGGCACAGCAGTAGAGAACGCCAGCGATCACGCCATCACAGCCCCTGCTCAGACTCGATGAGATTGTAGGCACCCTGGGCGAAGGAGCCTTTGGAAAAGTGGTGGAGTGCCTTGACCGTTCAAAAGGTGGTGCAAGAGTGGCCCTGAAGATCATCAAAAATATTGAGCGCTATCGGGAGGCAGCCATGACAGAAGTAGATGTGCTTGAGCGGATAAACTCGCTTGATGGCGATAAGAAATTTGCCTGTGTTCGGATGCTGGATTGGTTTGATCACCATGGTCACATCTGCATAGTATTTGAGCTGCTGGGACTGAGCACATATGACTTTCTTAAAGAGAATGGATTCATGCCCTTCTCAGTGGACCAGATCAGATGCATGGCAGATCAGATCTTTAAAGCTATACGCTTTCTGCATCAAAATAAACTGACGCACACTGACCTTAAGCCTGAAAATATTCTCTTTGTGGACTCCACGTATGACATGGATTATAACTCCAAGATGAAACGAGATGAGAGGACCTTGAAGAGGTTGGATGTCAAAGTGGTAGACTTTGGTAATGCTACATATGACCACGAGCATCACACCTCTGTGGTGTCAACTCGCCACTACAGAGCCCCCGAAGTTATTTTAGAACTGGGCTGGAACCAGTCATGTGATGTGTGGAGTTTGGGCTGTATTCTGATTGAGTTCTATCTAGGATTAACATTGTTTCAGACTCATGACAGTAAGGAGCATCTTGCCATGATGGAGAGGGTTCTAGGCCCCATTCCTACTCACTTACTCCAGAAAACCAGGAAGCGACGCTATGTGCATCATGATAAACTGGACTGGGATGAACTCAGCTCGGCTGGGAGATACGTGAGGAAACACTGTAAACCTCTAAGGCAATACATGTCCTCTAAAACCCCAGAGCACGAGCTGTTGTTTGACCTGCTTCAGAAGATGATGGAGTATGACTCATCGAAACGGATCACCCTGGAACAAGCCATCGGACATCCTTTCTTCAACCCATTACGAAAAGTTAGGAGAAATTGACTTTGAAGGGGACACTTGAACATTAATGCTCCCGGGGAGACCTGCTGCTGACTGTATCAGTCAGCTTAAAGACTGCCTACTTTACATCCTCTGTCTGTTTTTATTGTCTGTTTGAATATATGGGCCAAATTCCTGTGTATTTTCGGCAAAATAAACTTGAATGCTTTGTATGCA
>XM_039837429.1 PREDICTED: Pteropus giganteus SEC22 homolog C, vesicle trafficking protein (SEC22C), transcript variant X2, mRNA 
CCTCGGCTTGTCAGTCCTGTCCGCTACCCTGGCAGGAATCGAGCTTACACCGCGAAGCCTCCTCGCATCTCCAGACGTGGGAATTACAGGCCTGGACCTCAAACCCAAGCGTGTGTCCTCATGACTTCTCTTGCGGACCATGTCCATGATCCTCTTTGCCTGTGTGGTAAGGGTGAGGGACGGACTGCCCTTCTCGGCCTCCACTGACTTTTACCACACCCAAGATTTTCTGGAATGCAGGAGACGGCTCAAGACTTTAGCCTCGCGACTGGCCCAGTATCCAGGTCGCGGTTCTGCACAAGGATGTGACTTCAGTATACATTTTTCTTCTTCGGGGGATGTGGCCTGCATGGCTATCTGCTCCCGCCAGTGTCCAGCAGCCATGGCCTTCTGCTTCCTGGAGACCTTGTGGTGGGAATTCACAGCTTCCTATGACACCACCTGCATTGGCCTCGCCTCCAGGCCGTATGCCTTCCTTGAATTTGACAGCATCATTCAGAAAGTGAAGTGGCATTTTAACTATGTAAGTTCCACTCAGATGAAGAGCAGCTTAGAAAAAATTCAGGAGGAGCTCAAGTTCCAGCCTCCCACTGTTCTCACTCTGGAGGACACAGATGTGGCAAACGGGGTGATGAATGGTCACACGCAGATGCTCCTGGAGCCTGCTCCTACCTTCCGAATGGAACCAGTGACAGCCCTGGGTGTCCTGTCCCTTATTCTCAACATCATGTGTGCTGCTCTGAATCTCATTCGTGGAATTCACCTTGCAGAACATTCTTTACAGGTTGCCCATGAGGAAATCGGAAATATTCTGGCTTTTCTTATTCCTTTTGTAGCCTGCATTTTCCAGTGTTATTTGTACCTGTTCTACAGTCCAGCCAGGACTACGAAGGTGGTGCTGATGCTGCTCTTCATTTGCCTGGGCAACGTGTACCTGCACGGGCTGCGGAACCTCTGGCAGATCCTTTTCCACATCGGAGTGGCTTTCCTGTCTTCACATCAGATACTGACGAGGCAGCTTCAGGAGAAGCAGTCCGACTGTGGAGTGTGAGGGTGACAGTGTGCGAGGAATGGATCCTTTGATTTTCTTAGAGGGTCAGCCGTGTGTCCCTTTCGGCTTCTCGACTTCACCTCAAGTTTCCATTCTTGAAGTTCATCTTGACCAAACCCGACTGATACCGAGACTTGGGGACTTTGAACGGGTGCAGTTGAGGGTACGAGGTCGCTTGACACCCAGCCCCGGTTTTGTGCTGAGTATAAATTCCTGTGAGACCTCCAGTTCGGCACGTTTACTTAGGACAGCAGACGCTGGGGGCTCATTCAGAGAGAGCATTATTACAAGATCAGAATGGAATTATTTTGGTCTTTCAAATTGAATGATGTAATAAACCACTAGGCTCAGTAATACTAGTTTATGTTATTGGCAGTTGTCTCCAGGGAGCTACCTTAAAATCCATATCAGCTTTTCAGTATAAGTGTGACTTGGTTAGCTTTTATAGTGGGTCAGTACAGGTGCATTAAAAACTTAAAAACATGGTTCATAAATGTAAGCAAGGTAAATTCTGTTTACATATTTGATAACAGGTTCAATACAATACCTTTAGAATATTTAAATATATTTTGGATATAAATTGAACTTGGTTTAGGGTAAGGACAGACAAAGAAAATGGTTTAAAAGCTGAGTTTAATTTGTACATAACCTTTTGTGGTGGGACTGTGTGGGCACAGAAATATTTTGTATTTATTTGCAGGGTATATCTGAATATTTTAAAAGTTGAATAACCAGTGCTACTGGATCGTAAGCTTTTAAGCATGAACAGAAATGAGACTATCAGGATTCTTTGCGGTGGGCCACAAACTGGAGTAGGTGAGTCACGTGGATTCACACAGCGGCACTTTTCAGACGTAGGTGGGAGCGGCCGCCGTCATCAGCCTTGTACAAGGTAGTCGAGTGCCTGCCATTTTAATGATGGTGAATGCTTGACCCGTGTACCTGTTCCCAGAACACCTCCCAAATTAATTACTCCTCTACACCATTCTCAATCCTCTTAATTAGATCAAGGGCTTCATTTTTTATGAATAAGAGTTAAGTAGATATTAACTTTTTAAAAGCTTTATGAAGATATAATTAGCCCTCTGAAAAGTTCCTTTTGTTTTTTCTCAACTATGATTGATCATAGTTTTCCAAAACGTAGACCCGAATCAGGTCCCTTAGCTCTCTGGACATTGCAGCCTGGGCTGTCCGGCACCACTTAGGAGGCCTTTTTGGGAGCCTGCCCTTAGGTTGTTCCTGGTATAAGTCTGGAATATGAATGGCTCAACCACAATTGCATGGAATACTTGGGGTTGAATTATGTAGTCTTGAAAATTCAACACATCCTATTTCGATAGTTCTTCAAAGTTGAAAACCATTGATTGCAAGAGTTACTGAGCACATGAGGGAAGCAAGGAGGTTTTTCAGGGAATTCCGTTAGACGTGGTTGTTACCAGTGGTGTATCGTTGCTGAGCTACCTTGATATCGTTTTAAGAAAAACAAGTTTACGTAACTGGAAACCGTTGGGGGAAATGTTGCCAAAGTCATTTTATTTTCTTATAATAGAATTTTCTATTTTTCATCAAATAAAATATCTGGGTATGAAAGTTCTGTTGGCAACACCGTCAGATGGAAACTTCAGAGCTGTTTCTCTGTCGACTACGTCTACATGATTTTCTGCATACCCAGCAGGTGAATGTTCAGGCTTTCCGGGAGATAATTTTGAAGAGACAGTAAAATGGAACGGGAAGACAAGGAGGAGAAAAAAATTCCTTTTTTGTGATAGAAGCACAAAAAGCTTGAAAAGTTGGTAAGAACAGCTTACCAATGAATTGTTTTCTTTTTGAGCCCCTGTGCCATTGGTGTTGCCATGTAGCCCTGTACCCCAGAAGCTCTGGGGGTCTGGGCCTGTGACCCACATTCAGCAAGCAGTACAGAACAATCCTTGAGGAGGACTCCCTCCTAGTGAAGGCTTTCTACCCTAGCAGAGATGTTATCCTCACTGGGTTGAATGTGGTCTTAATCCGTTAACATCTGCTTGGAGGTTGAGATTAATTTTGCAAACAGGAAGGAAAAGATGCACTGGGTGAGCAGCACCAAATAATGGCCACGAAAACATAGTGTGACTAAAACCCAGCTAAAACTCAGCTCACTGTGGGGAGAAACTAGTGATGGGAAAGAATTTCTGAAGATTTTGTCCAAAGGAAGTCCCAGGCTCAGGGTTGGCTTGGTCCAGGCCTGGAGTTTCGTGGCCCCCGTGTCATCCTGGGTGCCAGAAAGCGGGCTCCACATCGCAGTGGTTATCCTCACCCCACCATGACTCAGTGCCGCTCCAGCACCTTTTGTTTTCCCAGTGGTTAAATGCCGCCTGCCTGGCCCACCTCACAGGGCTAGATCTGGGAATAGATGAAATCACGTTGAACACAAAACCTTAAAAGTGCCTTCTGGTACCAGATGCTGCAAGGTCTGGAGCATCAGAGTGTGTTACATCTCGACTACTATATTGGGGTGGGAGTGTGGCTCTGTTCGCAGGCTTTGCCCCTTTCTCAAGCATAACTAGTGAAGGACAGCTGTAGACTTTGGTTTTCTTCTCCCCGGGCTAGCCTAACTGTGATAGGACCATTTCTGGGTTTCTGTTTCCTGTGTGGGGACAGTCAGGGCATATTTGGGGTGGTATCTGCCTCGGTGCTAGGAGCCCCCACTGCCCGCAGCAAGAGGAGTACGACCACAGCCTCCCGGCGTTGCTTTCCAGCCTCGCACCCCTGTTACCTGTGAGCTCTGTTGATGGACAGTGTGAATCGAGGCCCAACATTTTAAAGTTCTTTAAGAGGTGGGAAAAGGGCGTCGGGACGAGTGCTGAAATGAAAATGTGTAATCATCGTTTCTACCCACCTCACTTTGAGCTCCCTGTTCTTTTCCTAGGTGCCCCTGTTCTCCAGGTCCCCCCGCCCCCACTGCTTCCCACCTCTGCCCCCCACACTCCAGCCCTGGGGACAGAGGCTGGAACCGGAGTCTCTGAAAGGGAGGGAAAGCCACCTTTAATTGTATCAGTAGGGTGGGTGCAGGAGCTTCCGAGGAGAGCAGAAGGTGCACTGTGCACCCTGGGGAGCTCAGCACATACTGGGAGTTGGGTCTCGGAGGGAAGTAGCACTGCTTAGAGTCAAAGACAATAGCCAGCAAGGTGGGCTGTTTGGGGTGCTGGAAGCAGGGGGGTAGGTGGGAAGCAGAGCTGGAAGACAGCAGCCTCCCCTTGGTGTGTGGGAGCTGCCGCTTGCTGTTCCTCCAAAGAGTCAGCCACTCATTGTAACAATCAGGACAGGTGGCCCTCAGAGAATCTGCTGCTTGCACTGTGTAACACAGGTGAGGGCCAGTGGATGGGAGTGTTCACGGGGACCGGATGTGGGCCCCTGCCCTGACCGGATGTGGGCCCCTGCCCTGATGCTCCCGGTCCGATAGTTCCTACGGGGAATCCTGCCTGAGGACAGGGAGGCGCCACCTGAGTGCTGTGAATGTTCACGGTGGTGGAAGAAGAGAGAGCAGACGTGCCCTTGAGAGAGGAGGCTGGGGAAGGAGTGTACTGGTCAGCTGGCTGGAAGCCTGGCTTGGCTCTGACATTCGGTCTTGCACCACAGTGGCCAAGTCACTGCCCTTCGGCCCCAGTGTTCCCATCTGGGAAATGGTGATAACATCCGCCTGTCCCCTGCTGTCACGAGGATAAAAGCCTAGTGGAGGGGAATACTGGGTGAACCCATTGTGTGTGTGCAGGCGGGAGGCTTTGAGTTCACCTGCCACACGGAGGTGTCTTCTGGCCTTTACACAGAAAAAGACACCGCAGTGTAAATGGCTGTATTCTTTCCCTCCAGAAAGGAAGCGGACTCTTCCCCTTCCCCTGACCCTGCCTCCTTCCTCCAGGCACAGAGCCCCTTGGTACCGCTGGCTGGGGTCCTCCAGGGTCCAAGGAGGCCAGTTCTGCTGGTTGTGTTTGAGGCTTGTCCTGGGGAACCAGGGGCTGAACCTCAAGGTTTGTCCCTGACCCAGATGAGGAAAGCTCTGCTTCTCCCATCGGGGAGCAGTGATGTCAAACGTCTGTTGCTGGGGAAATGTCATTGGCAGGGGACCTGTGGAAAGGGCTTGTTGGTAAAATCTGGGAATGGCCGGATATGGAAACATCTGGCTGTGTGTACCGATGGCAGAGCCGTTGCCCACAAGCGCCCTTTATTTAGGGTGAAATTATCAAGTCCATTCTGTTCCTCTAATCTGTACTTGGTACATATGACCTTCTCGAACGCTTATCCGTGTATGGTTCTGGGGTTGCTTCAGAAGTAGTATTTAATGAGTTGTTTATATGACCCCAAGATTCTATTTTGTTTAATGAACTTTTCTACTGAGAGCGTAAAAGACTGAGTCTGATTTAGCCAGGGCAAAACCATTCATTTCATATATTCATTTTGAATGCTTGCTGTCCGTGTTATACAAGCTTCTTAACTGTTTTCATGTAATAACAAAGATCTATTTTGAATAAACGATGGGTACGTTTTAACAAACTTCCACACAGTAGTAAAGCCTAACCTTGTGTTAACGTATGTGCAGAATGTTGCATAGCCATTTATATACTGTGTATATGTAAATTAAATGGGGTGGCTTCAGAAGTGAGAAGAGAATAAATCTAAGGTGCTTCTTAACGA
>XM_028554974.1 PREDICTED: Dendronephthya gigantea vegetative cell wall protein gp1-like (LOC114533457), mRNA 
TTACTGAATACAGTACAATGATTTTTAGTTTAAATTACAAAGTCAGAGGGGCTGAAGCACCATGTTACGCCTATGCTCTGTTCTTTCGATATTTTCCATCATCTTATCAAATTGTGGAGAAGTACACACAAAAAAAGAAGCAGACAAACTTACTTTGTTAATGAAAACAAAATGCAAGCAATGTACTCATATTTTCATATGTCCTATGATATGCGGTAAAAATAGCACTAAGCCAACCATTAAACCCCCACCCACCAAGCTACCTCCAACCTCTACACCGATCTTTCCACCAACGCCACGTCCGCCGACACTACCACCCCTTCCTCCAGTAACCCCTGCTCCACCGATCATACCGCCATCTCCATCCCCTCCAACCAAACCTTCCCCACTGCCGCCAGCAACCCCTGCTCCACCGATCATACCGCCATCTCCACCCCCTCCAACCAAACCTTCCCCACTGCCGCCAGCAACCCCTGCACCACCGATCATACCATCTCCACCCCCTCCAACCAAACCTTCCCCACCACAGCCAGCAACCCCTGCACCACCCATCATACCATCTCCAGCCCCTCCAACCAAACCTTCCCCACTACCGCCAGCAACCCCTGCACCACCGATCATACCATCCTCACCGCCACCCACAACCCCTACTAGTCCTTCTGGTGGTCAAGAAAAAATCCGACCACCCTCACCAGTGACCCAAGCCCCACCAGTTATTGTTCCCACATCTGCCCCAGTCCCACCACCATCGCCATCCATTCCTGGAGAATTATCATGTCTAGTACGTCTTGAGAAGAAAGGATGTTTTAAAGACGATCAAATTCCTCCACGTCCTCTTCCAAACTACATCTTAACTGATCGCGACAATACTTTATCGATTTACAGTGGCAAAGGAATTGACTGGGGAAATTGGGTGAACTATCTTCCTGATTTCGTGTGCCGTTGTGCCCAACTTACTAAGTCTAAAAATTTTAAATACTTCGGAATACAATATTATGGTGAATGTTGGTCAGGTCCTTCAGGAGACGAAAATTCTTTCAAAGAAGATGGAGTTTCAACAGAATGCGTCAACACGAACTGGAAGACATGTTCTGATCAATCAAAATTAGCTTGTGCTGGAAAGGAGAAAAATAACTATGTTTACGCAATTGTTTAATGTATTTTGTAGTAGTTTGAAATGATCTGTAACCTAGTCTGGGAGGAATATAAATAGGAAATAGCCTAAAGTGTTATTGCATGCATTCACCGCTAGATCATAATGTTATTGTTAGATCATAATGTTACTGTTAGATCATAATGTTACTGTTAGATCATAATGTTACTGTTAGATCATAATGTTACTGTTAGATCATAATGTTACTGTTAGGTCATAATGTTACTGTTAGATCATAATGTTACTGTTAGATCATAATGTTACTGTTAGATTATAATGTTACTGTTAGATCATAATGTTACTGTCAGCGTTAACCTATAGTTAACATGGCTCCAGTTTCGGCTGACCGTTGATAAATAGAAACGAAAATGTCAGCAAAAAGGAAATGAAATTTATTATAAAAATTATTAAAATTTCTCCTGCTGCATGGGCATATATATGCTTCACTAAAGTTTTACATTACCCCATGCTGAACTTCGACATAATTTAATTTGTTCGAAATGCCTTTTTCAAACAAATCTATCCCCTTTCATGAAAAAGTTCCAATTCCATCTCAAAACATTTACATATCCGGGGGCATAAAATATTCCTTACCGCTACATGGCTGGTTTGGGGTTGGTTTATTACTGTTTCCTTGGCACAGTTTATAGACAAACAGTCGGACTGCAGTGTGGAGAGTACTACTTAGCTATATACGGTGCCGTTTATAAGTAACACGTATCAGGCCGAACGAAAATTTTACAAAATATACTGATAACAGTGAGTCAAATCCAACGGGGGTGGAAGTCAATTTGATACCTCCTCACCTCGTCCTTTCATATCTATAAACTGTGCCAGGGAAACAGGAATAAACCAGCCGTAAACTAGATAAAATGAAAATATTTGTTCCGTTGCACGAATAAAAACATTCAATACAGCAAATACACAAAAATAGAGCTAATGCGTTTACCGTAAACGTCGAATTCGTACTATTAATGTA
>XM_039788533.1 PREDICTED: Perca fluviatilis E3 ubiquitin-protein ligase MARCHF7-like (LOC120551252), mRNA 
GCAACAGGGCGCTGAAAACCTCATTAGGCGCTGAATACAGATCAAAAGTGGTAGATACAGAAGTGAAACGACAGATTCCAGGCATGCAGGCTTTTTCGACACTGTTGCAGCGCATGTCTGCAAGGAAGGCCTCAAAGCAGCCGTCCCCCTGCAGCGCTGGGAAAAGTGCTTTGTCTGAACCAGAGAGCCAATTGAATAAAGATTCGGAGTCCTGCCTTCAGGCTATCTCCAGTGGAACCCGGAGCATGTCTGCAGAGCTGGCAATGACTTCAAAGATTCCCCACAGAGAAAAGGCGCCCCTGGCATCCAGATTACTCCCCGCAAAGGATCACAACGATCACAGGTCTGAGCGTGTGAAACACAAAGGATTAAAAGGATCCACCCAAGCGAGCAAGCAAACACAAAGCCGGGACGTCCTGAAGAGCAACAGCAAGATGAAACACCTTTTCAACAAAACAAACGTTGAGGATGTCATACACCCCAAAGCTGAGACTACGTTTGCCTTCCCAGCAAGTACTGACACTGTCCCGCATGTTCCCACACGTGATACAGGCTCACTGTACAGTGAATCTGAAGAAGAGGAGGAGGCAGATAATGACCCATCAAGCTCACTGTACAGTGAATCTGAAGAAGAGGAGGAGGCAGATAATGACCCATCAAGCTCACTGTACAGTGAATCTGAAGAAGAGGAGAAGGCAGATAATGACCCATCAAGCTCACTGTACAGTGAATCTGAAGAAGAGGAAGAGGCAGATAATGACCCATCAGGCTCCTGTCAGGGCACATTTAGAGAGGCCACCTATCCATGGCAAGTTTCTCGGTCAAGCTCAGCCTTCCGTTGCTTCTCTCACAGTTCACACCTAAGTACATCAACAGTTTCACCTGTTGGTCGTCATGGATACGGTCCTGGTCCTTTCCTGGAGCGAACAAGGCGACCTCATGCAGCATCGCTGTTATCTACCACTGACAAACTCAATAGGGGTTTTGTAGGCTGTGTGAGTAGCACTCAGCAGACACACCAACATCTCCATAAGTTTCAAAGCAGCTGGCCAAGCACAGCCTCTTCACACAGGACTGTCGGCTTCTGTTCTGCTGGGTTTGCTGAGAAGCAAAGCTACCGTACCACTGACTACAAATCGAGGTCTTCTAATGAGTCCTGGCGTCTAAGTGCCTCTGGACAGGTAGATAATCTGAATGTGGATGATATGACGACGTGTAGTGATATCAAAGAGCGAGTACCCAGTCAAGAATGTCAAGAAGCCCGGGAAGGAGCTACTGCTGCCCAAAACGCTCAGTCTCTAAAGGATCGCAGCAAAGAGACTGTTTGCAGACCCAAACAAAGGTTATTAGATGAGTCATCTGATGAGGAAGAAGGGGAGCAATGTCGAATCTGCCACAGTGGCGAGAGTTCACCAACCAACCCACTGATATCACCGTGCCTGTGTTCAGGCAGTATGCAGTTCGTTCACCTCGACTGCCTGAAGAAATGGATTAGGACAAAAATCGAGTCAGGGTCAGGGCCCTATACTGTCAAAAGATGTGAACTTTGTATGGGGAGGCTGACTCTGGACCCGGATACACTTCACTTGGACGTTTACTACAGAGAACAACAGCAACAGATGTTGGGCAACCCTGACCTGTATGATCTCAATGATGTGTTTGGAATGCTAAGGCGGCCAAGACTTGTGCACGTTCCGATATGGTCATTGCTTTCCAACCTAAGGAGAAGACTCCTCAGAGGGAGGAGGAACCCCTCACCACAAGAGACATCGGACACTTGATCCTCAGCCAAACTCCTTTTTTTTCCACATCTTTGCTGATGTGGAACTAAACACACATGTTTTACAATAAACCACCATGCATCTAA
>XR_006693933.1 PREDICTED: Macaca fascicularis uncharacterized LOC102122981 (LOC102122981), ncRNA 
TAGAAACAGGGGTTTCACAGTGTTGACCAGGATGGTCTCGAACTCCTGGACTCAAGTGATCCTCCCACCTCAGCCTCCCAAAATCCTGGGTTTACAGATATGAGCCACTACGCCCAGCGTGACAGAGCATGACTTCTGAGGGTAGGTCATAAAAGACATTGTGACTTCCGGTTTGTTCTTTGAACACTTGTCTAAAGGAAGTCAGCTGCCATGTCTCAATGACACTCAAGTGGCCCTATGGAGGGGCCTAAAACAGCATCCTCCCGCCAACAGCCATCAAGGAACTGAGGAACTGAGGCCCTTTGCTAACAGCCATGAGGGCACGATCATGGAAGTAGATCTCCCGCCCCTGTCAAGCCTTCAGATAACTGCAGCCCCAGCTGACTGCTCAACTGCAACCTCGTGAGAAACCCTCAGTTAGGACAACCCAGCTAAGCTATTCTCAAATTCCACAGAAACTGTGAAATAATACATGCTTTTGTTTTAAGCAACTAAGCTTTGGTTAATTTGTTACACAGTAATAGACAACGAATACAGCTGGCTTATCAGCCTCTCCTCTTTTTGCAGGCTGCAGGACTGCCGAGCTTCGAGGGAGCTGAGAGGAATGCTGTATTCAGGCCCTCTTACCTGACTTGACCTTGAGACCAATGGGTGTGTTGGAAAGAGGCTGGCAAGGTCTGAGGGTACAGCCTGTGGCGGAGGTGGGGCCAGGCAGGCCCAGCCCCTCAAGCCAGGCCGTGGGCCCCAGGGCCCTGCCGGATGGCCGCTCTCTGGGAGCTGCATGCAGAGGTGCCTGGCACCCCCAACCGCGCCCCACGGGGCACCTGACCTCCAGAGGAAGGAAATGAGTCTGGAGATGCCGTAGACGAAAGAGTTGCCGCTTCCTCCGCCTGGGATCACTCACAGATGCCTCAGGGAGGCGGCCGGCCCTGAGTCACGCTGAGCGCTGAGCCGGCTGTGACTCAGCGGGACCGCGGTCCCTTGGTTGCGCCTGGGTTGATTTGCGCCCCGCTTGTTTTCTGCAGAAGACAAGGCCGTCTCGGATTAGACTGCCCCTCCTAAACAACCAGCAACTGTTTTTCTTCCTCAAAGTGCAGTTTCCCTCTGGCACAACCAAAAATAAACACAAACCAGGCTCCTGCCCAAGGAGGAGGGGGGGAGGAAGACAGTCCCCGGGGCGCCCACCGAACGCATGTGAGAGCTCGCAGGTCACCTGCTTGCATGAATCTGTGAAGCAAGCAGCCATGAAGGCAGAGAAACCTCTCCCATCGCAGGCTGCCAGCACAGAGGCTCTGATTGTTGAGTTGGCGCTCTGTTTATTTCCCCAACTGCCTCCTCTCAGGTTCCGTCCTAACTGCTGGACTCACTGCCGCGTGGGCCTGAGCACATTTCCTTGGCAAATTGTCCTCAGTGGAAGTTTTTTCTTCTCGATGTGGTGAGTCAGAGCTGGCTCACACACAAACACCAAGCAGCAGCCTCAGGGACTAAAGTGCTTTAAGGACACGAGGACCTATCCTCCCTCCCCCTATCTCAGTGGGGTGGGCCCACAGTTCCTGAAAGCTGGCCCAGTGCAGTTCATTTGACAGGCAGAGGCTGAAAATGCAAATCACCCCAGCATAGGTGAGTGCACAGCAGAGACCACGCCCGGGCTGCAGCTTATCCTGAAATCCTGAAGGCAGGAAACACCGTGCCCACAGGAAGAGCTGGGAAGCCTGAACCATGCTAAGATGTCCCAGGGTGAACCGGAGCCACTGGTTAGTCACACTGACTTCACATTTCCTTCGTGAGAAGGAACTGAAGACAGATTCCAGACTTGCTGTGCATAGAATGTATAGTTCATTGCATGTGAGAACACAGCAACAAGGCACCATCTTGGAAGCAGACAGCAACCCTCA
>XM_043685587.1 PREDICTED: Chiloscyllium plagiosum uncharacterized LOC122546987 (LOC122546987), mRNA 
ATGGGAAATCAGACTTCTAGACTTACTAAGGAGAAGTCAGGGAAGACTGCAAATGGGAAAGAAATACCCCCCGATAGTCCACTAGTTCGGAAGGTAACTCTATGGACGGACAGTCGTAGAACGAAGGACTTAAAGAAAGACACCATGATAAAATATTGTTGTTTTATATGGACCAAAGAATCTATCCGCGCCCCCTCGGTAGTTTGGCCCGAGTATGGTTCTGATGAAGACTGGGTGTGTCTAATCCTAAATGTATATGTTAACAGAAAACAACCGTTTGACCCAGAAGAGAGCAAATACGCCGCCGCCTGGTTGGCGGGCGACGGCGAGAGTCCCACGCGTCTCTATCCTCTGATTCCCCAAACAGACCCGAGGAAGCCCCAGAAGTCTTGGGACATCCTCACTGACGGTGCCGTTGGGAACGAACGGACCGGGTTCGTAGTACAACCTTTAAATTCTGGGGATATCCGGCAACTCCGTAACGAACTACCCCATCTACTGGACGACCCCATCAGTGTGGGAATACAACTGGACCAATTTCTGGGGCCCAGTATATACACATGGGCTGAACTGCAGGCCATGATGAGAATACTATTTAATTACGATGAAATTGTTATGATCCGGAATAGTGCAATGGCCATTTGGGATAGGGAGCATCAGGACGGCCCTCAGCGTGGAGAGCAGAAGTACCCCTTAGAGGACCCCCGGTGGGATCATAAAGACGCGGGGGGATGGGCCAATATGACAGATCTCAGAAGCCTTATAATCAGGGGGATCCAAACCTGCGTGCCCAAACAGCGGAATTTAGCGAAAGCATTCGAAGTTGGACAGAAAAAGGATGAATCCCCGAGTGAGTTTTTAGACCGTTTGCGGGAGTCCATGCGAAAGTATTCAGGTTTAAACCCCGATGGGGAAATAGGCAAGGGCATGCTTAAGGTGCACTTTGTGACTAAGTCATGGCCTGACATTCAGAAGAAATTACAGAAAGTGGAGGATTGGGCTGAAAAAGATGTTGCAGAATTATTACGGGGAACACAGAAGGTGTACGTTCAGAGGGATGTAATAAGGGAGAAACAAAAGACAAAAATGATGGTGGCAGCCGTACGGGAAGCTTGTAAGTCCACCGGAATGGGGGAGGGAGGTTATGGGGTGGAAAGAGGAACGTCGAAGAAAAGTTGGAGAGGGAGAGAAGAGAGACGGGGCAGAAGTGAGAGAGGAGGATCTTATGGAATTGAGCGGCCTCAGGTGGCCGGATGTTATCATTGCGGGAAACTGGGACACTTCAAAAGGGATTGTCCCGAGTTTAAAAGGGAAAGAGAAGGGATGTATGAAATGGAGCGTGAACAAATGGATTAGGGAAGTCAGGGGAGGATCGGACAAACGTGCGAATTGTACGCCTTGCACC
>BT024918.1 Arabidopsis thaliana At5g50110 mRNA, complete cds 
ATGAACCTTACAGCAACTAAAGAAGCTGATGAAGTAATGGAGAGGCATATCGAAGATTCTCTTGCGATATTGCCTCCTATAAAGACTTGTTACAACTTACATTCCAGTGATTTGTTTGATCACATCAATTTAATCGATGTTGGAAGCGGGGCTGGTCTTCCTGGGTTGGTTCTAGCCATTGCATGCCCAGATTGGAGAGTTACTCTACTGGAGTCTATAAATAAGCGATGTGTTTTCTTGGAGCACGTTGTGAATGTTACCGGGCTTACAAATGTTACAATCGTTAGGGGCAGAGCAGAGAGTTGTGGGCACGATGTTATGTACAGAGAGAAGTTTGATGTGGCTATTGCAAGAGCTGTCGCGGAGATGAGAGTCTTAGCTGAATATTGTCTTCCTCTGGTTCGGATTGGTGGATTGTTTGTAGCTGCTAAGGGTCATGACCCAAAGGAGGAAGTTCAAAATGCAGAAAATGCTGTTCGCTTGTTGGGTGGTTCAATACTACAAATTAGTCCAGTGGATTCACATAGCCCATACGGACAGCGGACAACGGTTGTTTGTCGTAAAGATCATTCCACCCCACAAAAATATCCACGTGAAGCAGGTACTCCTGCTAAATTACCGTTGTAA
>XM_041034442.1 PREDICTED: Toxotes jaculatrix potassium channel subfamily K member 15-like (LOC121179542), mRNA 
ATGAAGACGCAGAACATCAGGACCCTGTCTCTCATCCTCTCCATTATTTTCTACCTGCTCATAGGAGCCGCCGTCTTCGACGCACTGGAGTCCGAAAGTGAAACTTCGAGGAAAAAGACGCTGGAGCAGAGGCTGAACGAGCTGAAGAAAAAGTACGGCTTCACCGAGGATGACTACAGGGAGATTGAGAGAGTGGTCCTTCTGTCGGAGCCGCACCGAGCCGGCAGGCAGTGGAAGTTCACCGGCTCGTTTTATTTTGCCATCACTGTGATCACCACGATTGGTTATGGCCACGTTGCTCCTCGAACTGATGCTGGCAAGGCCTTCTGTATGTTTTACGCAGTCTTGGGGATTCCTTTGACGCTGGTCATGTTCCAGAGCCTGGGCGAGAGGATCAACACTTCTGTCCGCTACCTGCTGCGAAGAGCCAAGCAGGGCCTGGGCTTTCAGAAGACGGAGGTGTCCATGGGGAATATGGTCCTGGTGGGTCTGCTGTCTTGCATGAGCACTCTGTGCATCGGAGCTGCAGCCTTCTCCCATTTTGAGGACTGGACCTTCTTCAACGCCTACTACTACTGCTTCATCACACTCACCACCATCGGCTTTGGGGATTTTGTAGCCCTGCAGAAGAAAGATGCTCTCCAGAAGCGACCCCCCTATGTGGCCTTCAGCTTTATGTACATTTTGGTCGGGCTGACAGTGATTGGGGCTTTTCTTAACCTGGTGGTCCTGAGGTTCCTCACTGTAAGCTCAGATGAGCCCGACGTGAGGCTTGAGGATGGGGAGGTGTCACACGCTGAAGCAGAAGCTGCTGAAGTGGCATATAAAGACAGAGAAGATGGACACAGCAGCCAGTGCAACCTGAGCCTGCCCATGGAGGGGGGCACTAGCTGTACGAACCTCCTCCCTTCACCTGCAGAGGATCGCAGGCTTATTATATCCGAACAGAGAGAGCACTCTAAGCTCCCTGAACCCAGCAGACTCAGAGCCTTGTTCTCCTGCATCTGCTGTGGCCTGGACATTTACGACAGCCACCCTCCATCTCACCATGAGCAGGAGCGCGGCCACAGCAACCCCGTCTTCTACAACTCCATCTCCTACAGGGTGGACCAGGCCTCATGCAGCTCCTGCACCGTGTCGTCACAGGACTCCCCCACCAGCATAGCACTCTGCCTGGGCAAGAACAATCCTCACAGCAGGAGGAAGTCACTCTGA
>XM_015424951.1 PREDICTED: Gekko japonicus serum amyloid P-component-like (LOC107121936), mRNA 
ATGGCTGTGGAGCATTTGCACGGCGGGCCGACAGACCTCAAACAGAAGACCTTGGTTTTCCCAGAAGCGTCCAACACGGCTCATGTGGTTTTGAGGCCTGCGCGCCAGCAACCTTTGACCAGCTTCACTGTCTGCCTGAGATCCTACACAGACCTGAGCCGTGCCCACAGCCTTTTCTCGTACGCCACCAGGACGGTCGACAACGAGTTGCTGGTCTTCAAACCCAAACCCAACCAATACAGTTTGTATGTGGGGGGGTCAGTTGTGACCTTCAGCGTTGCAGACAATCCGGTCCCCAAACCGCTGTGGGAGCACATTTGTGTGAGCTGGGAGTCCGTCACAGGAATAGCAGAGCTTTGGCTGAACGGGGTTAGCTTGCCCCGCAAGGGAATGAAGAGAGGTTACACCATCGGTCCGGAAGCTTCTATCGTCCTTGGGCAGGAGCAGGATTCCTTTGGAGGAGGCTTCGACACCAACCAGTCCTTCATAGGGGAGCTCATGGATGTGTCTATGTGGGATCGGGTGCTTTCCTCAGATGAGCTGGTCGTCATTCAGAACAGCGGCCGCCTTTCCAACTATTTGATTGACTGGCAGTCCCTAAATTACGAAATCAAAGGCTATGTGGTGGTGAAGCCCTCCTGGGGGTGAAGCCCTCCTTTGTAAGCCCCCCTGTAGGCTTCGCAAAACAAAGCAGAGAGCTGGAAACAAATCGATAGTCTTCCCCATAATTAATGTTTCTGTTAGTAGTAAGGCAGCATTCCTACAAACGATTTCCTGGACGTAAACTCCTTGGAGTAGCATGGGACTTCCTTCTGAAAAAGACCTGCAGAGACTTGTTCTCGTAGTCCTCAATCTGTTTGTGCAAACGCATTCATGAAGCTTGTAGATCTGTATTCTCCAATGAAAGATTTCAACCCCCCCCCCCCAAGTATTTTGCATTCCCTGACACC
>XR_005453858.1 PREDICTED: Tachyglossus aculeatus small nucleolar RNA SNORA7 (LOC119936833), ncRNA 
CCCCTCTTAGGGTCACACCTGGAGAGTTTCTAGTACTCTACCAGTCTCAGTTATGGGAGGGAGAGTCAAGTAGAGGCATACCCATTCCATTCCTAGCTTGGCCAGTGACTAGCGAGTGGAAGACAATCTGCTACAAGT
>XR_008035993.1 PREDICTED: Dreissena polymorpha uncharacterized LOC127851864 (LOC127851864), ncRNA 
TTGGCAAGCGTGGTTAAATGTTATCCTGTCACATAACGTGTTACATAGTTACTTTTGTTTACTGGAGACATAACCTTGCGAAACAAACTTCAAGTTGATTTTAATTAGACTCCGTTAAGGTTGACATTACGTGTTGAGACTTTGGACAAATGCTAGATTGGTGTGTTTTGTTTTGTTTAATAATCAATTAGCTTTAATACCTAAGTTATTTGAGTTAAATCAAATATATTGAGATCAAAAGCTTCAGGGTTGAACAAAATGGCGACCTTTTCACAGTCCACCATCGAAAAAGGATCTGACATCGTCCAAGACTTCTTGTGTTCGGCGTGCGAAGACAAGAAACTGGAAATCTCAGCTGATAATATTTGCGGATCTTGCGTGAAGTTTTACTGCCAATCATGTATTCATTTGCATCGCCAGTTGTTTACAAACCATTCTACTCATGGAAGGGGAAATATGAAGAAATGGCCAGTTGCGAAGACGGTGGAAGATTTTCTTCTTAAATGTGATGTTCACAAAGAAGAAAACTTGGCAATGTTTTGCAAAGACCACTGCAAGCTGTGTTGCAATAATTGTGCATTCCTTAATCACAGGCAATGCCAAACAGTGATGATCTTATCAGACTTAGTAAAACATACCTCCACAGACCTCAAAAAAGTATCAGCTACTATCCAAACTACTCTGGCAGAACTTAAAAAACTTCAAGACAACCAGGAGGCAAGCGTACGGTCTGTGCAAAGTTCCTTCGATGAGCAATTAAAAGAGATACAGGAAACTCGCAAAAAATAATTGAAGCCTTAAACATGCTTGAAAAGAAGACACTGAACGATATGAAAGATGCGCTGGGAAATCTGCAAGCCTCTCTAAAAGCAAATGTTGACAAATGTGCCACTCTTCGTGATCAATTAAAGCAACTTGGAGATGCAATACATGACTTAAGTGATAAAAGCAAGCAATAACTATCTCTTATAGCCAGATTTAAATGCCAGGACAAAATACAGCAGTTTGAAAATGAGAAGAAGAACTTTGTTCAAGTAAGATCTTCAATCACTTTCCAACCTAATAGAAAAATTGTGAAGTACCTTTCTAAGTTGTCAGGTCTTGGGAGGGTTGAAACCAGTACCCAGATATTGACAATGCCGGGAAATCCAGACAAAGTAATAAGGCTGAAAGAGAAGTATGAGTATGACGTGCGCACGCGAGGTGATTCATATGAAGAGTATGCAGTATGCAGTATCAGAGACATTTGTGTTCTCCCTAGGGGACAGGTCTTGGTTGCAGACGCGATGAATAATAATGTCAAGCTGTTGAACCAGCAGTACAAGGTGTTGAGTCACTGTGTTAAACTTGATACGCCATCGGGCATTTTTCAGATCACACCCAGTGAGGTTGGCGTCACTTCTGGTTCAGTAGTCCAGTTTATCAAAGTCAACTAAAGCCGACTGGTGACAGACAGAAAGCTAACATTACAACGTGAATGTAAAGTAGATGTATGTGCAGTGAGCCCGACAGGTGACAAATTGTACATCACCAGCCACTACCAGCACAGGATACTCACCCTTGCCAGAGATGGATCAGTCCTTGCCACATTCAGGGACCAAGAATTACAATGGCCAACTGGTGTACACGTTACATCTGCAGGCCAGGTGCTGGTATGTGGATATGATTCAAAGACAATCATTCAGGTTAACCGTAATGGCAGTAAAAAGCTGGCAACTCTGGCTACAGAGAGGGATGGGCTTCAGGGAGGCACATGGTCCGTCTGCTACAACAGCAACAATGATTCCATTATCGTGGGGCAGTTGAACAACAGGATACTGGTGTACAAATTACAATAGCTTATCATTCTTGTATTTTATATGAGTAACAATAAGTGATATACATTAAAATAGCTATTACATTGAGTGCTTTGTTACTTTGCAAAAATATTTTAAACATATAATATGTTTGTAGGAATAATGTATGTAAATAACAATAGTTGTTTATGTAATAGTGCTGTGTAACCATGCAAACAAACTTCAAATGTGCATACCAATAGTTTTGTAAAAAATAATCTAATATTTTTTTTGTTTTTAAAATCTAGCGTGTTTCTTAATTGATGAGTCTTAAGTGGCAAATATGAATGTTTACTTTTGTTCTTAGAACTCAATATCTTAACATATTATTTATGATACAATATGTTTGTAAAATAGTTTATAAGACATTTTTTACTATAAAGAACTCGTACAGAACAATCATGCTAGTGTTAGACCGTCATGTATAAGATGCATAGCAATTAGGTTATTAATTTATTTCTATTTAAGTAGCAATCATAAATCTATCTTTAACTCACTGGTCTATAAAAATAGCTGATATAATGTCAGTAGCATTTATTAAAACACCTTTTAAATG
>XM_028615390.1 Sodiomyces alkalinus F11 IKI3 family protein (SODALDRAFT_45849), mRNA 
ATTTGATGCGCAAGAGTTACATCTGCGGAACCCCCACCAAAGTACCAACGTAGTCCCTTTTCATACCTCGAAGATTTTCATCGCAACCACAACGGCAGCAGCACAAAGCGTCCATCGTGACCACCTCAGTCAATAACTCGAAGACGACCTCCACCTCCCTCTCCCTCCCAAGCCCAAACGCCGGGACAGGGAACACTTATTATGACCAGTGATTAGTGACTTCATCACCAACCCGAGAATGCGGAATTTGCGCAACATCCGCTTCGATGCCTGGCGCCTCGCCGACATCACTTCCACCTGCTGGGACCCCGCCAAGGATGAACTCCTTTGCACTCTAGGTCCGACCGAGACGAGACGCTCCATCGAGCTTGTCCGGATTGCAGATACATTTGAGCTACAATCTCACACTATTGCTTCGTGGGACGTCCCGAGTCCCCATCCCGATGTCCCAGCCGACTCAGTAGTGAGCCTTCACCACTTCAGCGACACGTCTACCACGTGTGTTATTCTTGCCGGCGGCGATATCGTCACTATCAAGGAACCCGATGCCTTCTCTTCCCAGGATGACGTCCACATTGAGATTATCGGCTCCATCGATGCCGGAATTACGGCGGCCCGCTGGTCTCCCGACGACGAGCTACTCCTCGTAACCACCAAAGATGGCAAGGCCGTCTTCATGGGCCGCACCTTCGATGCCATCGCCGACGTGTCCATGACCTCGGAGGACCTCAAAGCATCCAAGCACGTCTCCGTCGGCTGGGGGAAGAAGGAGACCCAATTCGAGGGGCGGGGCGCGAAGGCCCTCAGAGACCCCACCATCCCCGAGAAGGTGGACGAGGGCGTTCTCAGCCCGAAGGACGACGGCTCGTCGTCCATCAGCTGGCGCGGGGACGGCGCCTACGTTGCCGTCAACTCCGTCGAGGGCGGCTTTCGGAGAGTCGTGAGGGTGTACTCGCGAGAAGGCGTCCTGGACAGCGCGAGCGAGCCTGTTGATGGACTGGAGGGAACTCTGAGCTGGCGGCCGGCGGGGAATCTCATCGCCGCCATCCAGCGTCGGTCGGACAGGATCGATGTCGTGTTCTTTGAAAGGAACGGTCTGAGGCATGGCGACTTTACCTTGCGCTCGCCTGGTGGAGATATCCTGTCACACGATGGGATCAGGCTGGAGTGGAACAACGACTCGACTGTTCTTGCCGTCATCTTGTCGGATACGATCCAGCTCTGGACCATGGGGAACTACCATTACTACCTCAAACAAGAGGTGCCCATCACGTCCCCGTACGTCCACTTGGCCTGGCATCCTGAAAAGGCCTTGCGCTTTGCCGCGGCGACGTCCAGTCTCCTCACCTCCGCCGAGTACATTTTCACTGTGGCAAGGGGTTCTCAGAGGCCACCCCACGATCATGGCGCCGTTGCGGTCATCGACGGCCACACGGCGAAAATTACCCCCTTCCGGACGGCAAACATGCCTCCTCCCATGACCATGTTCGACTTGGAGGAGGCATCGAGTGTTGTTGACGTCGTCTTTGATTCTGCCAATTCCTCCATGGCCGTCCTGCATCGTACCGGAATAGACGTCTATGCATGGCAAACTAAAGGAAGCCGCTCCCTTCACCCCAAGAGGGTGAGCCGAACAACTTTCTTTGAATCATCATCAACGGACGACTCGCCTCGGGTTCCACTTCAAGCATGCTTTTCCTCGTCTGAAGAAATCTCTGTCCTCGTTCACGACGGAGGGGACCTAAAAGTTGAAGTATACAGCTTTGGGCCTGGGGATAGTAACCTCCAGGATGTCGTGGAAATCGATCGATCGGAGCCGATTTCTTCCATTTCGAGCTACTGCGGTCTACCCGATATAGGGGCCTACGCCCAAGATCGCTCTGGAAAGTTATACAACTTATCCGGACAACAGGGCCTTATGCCTCTCGGACTTCGACTGCCCGTCCAACTGCCATGGTGTCAGCTGGTTGCCGTCGGAGACAATACGGTGGCGGTGGGAATGGCTCGCAACGGACGCCTCTACGCTGACAGTAGGCTGATAGCCAAGAACTGCACTTCCTTTGTGGTTACTGATGCCCATATCATCTTCACAACAACCAACCACTTCCTCAAGTTCGTCCATCTGGTGGATCCTCAAGAAATGGAAGTCCCGGAAGACGACCCTGAGGTGGATGAAAGGTGTCGCAGCATCGAGCGAGGTGCTCGGCTCGTCACGGCCATGCCTACCAACATGAGCCTCGTGTTGCAGATGCCCAGGGGTAACCTTGAGACTATATACCCTAGAGCCATGGTGGTCGCGGGTATCAGGCAACTCGTCGAGGAGAAGAACTACGGTCGTGCTTTTTCATATTGTCGTACACAACGGGTGGACATGAACATTCTCTATGATCACCGCCCGAACCAGTTCCTAGCCAACGTTGGCCTCTTTCTCGACCAGATTCAGGACGTGGCATATATCGATCTCTTCCTCTCGTCTCTCAGAGAGGAGGACGTCGCCCAAACGATGTACAAAGATACCAAGCGGACAACAGCTCGCGACCCGGACATTATCGCCGAGGAAGCGGCCGCAGATTCACTGGCTCCGCAGAACTCGGGGAACAAGTCCAAAGTCAACAAGATCTGCAATGCTGTTCTCAAGGCTCTGCAGCATAAGAAAGAAACCCACCTCCAAAACATCATCACCGCCCACGTCTGCAAGGTGCCTCCCGCCTTGGATGACGGCTTGACTCTGGTTGCCGAGTTGGTGCAAGAAGACGAGAAGCTTGCAGAGAAGGCCGTAGAGCATATCTGCTTCCTCGTAGATGTCAACCTTCTCTATGACCATGCTTTGGGGCTTTACAACCTCGACCTTGCCTTGCTCGTTGCCCAGCAATCACAGCGAGACCCGCGGGAATATCTGCCCTTCATCCAAAACCTCCACAAACTCCCCGAGCTTCGCAGACGGTTTGAGATTGACGACCACCTTAACCGGCGATCCAAGGCCCTAGCACATCTGAAGGCGTTAGATGCGTTTGACGAACTACAGGCATATACTACCAAGCACGCTCTGTACCAAGACGCACTCGGCCTCTGCAGGTACGAGAGGCAAAGACACCGTACTCTCATCAACCTCTTTGCCGAATATCTCGAATCCAAATCCAAGTTCCGGGAGGCTGGTCTAGCCTTCGAGTCTCTCGGGAACTACGAAAAGGCCATGGTCTGCTACCGCAGCGACGGCGCCACGAGCTGGCGCGAGTGCCTCTTCGCCGCCCAGCAGGTACAACCGCCTCTCTCCAAAGAAGCGCTCACCGACCAAGCCACCACCCTCGCCGAGGCGCTCACAGAAGCCAAAGACCACGCCTCAGCGGCGACCCTGCACCTGGACTACCTCGACTCCCTCGAAGGCGCCGTCCGCTCGCTCTGCAAGGGGAACCACTTCGCCGAAGCGCTCCGCCTCCTCGCCCACCGCAGCCGGGCCGACCTCGTCCCCTCCGTCTTCGACCCCGCCCTCGTCGACACCCTCAGCACCACCACCGAGTTCCTGGCCGACTGCAAATCCCAGCTCCGCGCCCAGGTGCCCCGCATCCTCGAGCTCCGTCGCCGCGCGGCCGAGGATCCCCTGGCCTTCTACGAAGGCGAGCGCGCCGGCGGCGCCGACGGGATCCCGGACGACGTGTCGGTGGCGGCCAGCTCGCGGCTCAGCACCGGCGGCGCGAGCTTGCTCACGCGGTACACGGGCAAAGGCGGCGGCGGCGGGGCGAGGACGACGAGCACGGGCACGGTGGGGACGGGGGTCAGTCGGGCTACGAGCAAGAATCGGCGGCGCGAGGAGAAGAAGCGCGCGCGGGGCCGCAAGGGTACCGTTTACGAGGAGGAGTACCTCGTGAACAGCGTGAGGCGGCTCGTGGACCGCGTCGGTGCCGTGCGCGGGGAGGTTGGGGCGCTTGTTTTCGCGTTGGTGAGGCGGGATATGGCTGAGCGGGCTCGGGCGGTGGAGACGCTGGTGGATGAAGTTGTGGAGGGATGCAGGACGGCTGTGGCGGAGGTGTTTGGATCCCCCGAAGAAACCGAGCAACAGGATGGGGAGGACCCGAACGAGGGTCTGGCTGGTGGTGGTGGTGGTGGTGGTGGTGGTGTTGGTGGAGACATGGGATATGTGGCTACAGGAGGTGCGGGTGTCTTCCATGAATACTTGGAGGCGAGGAACAGGAGGCAGGAAGTTCCCCTTGTCCAGGCGGTCCAAAAGCTATCCTTGCTCGGAGGATAGCGTAGTCCTAGATTATGGCAATCCACATAGATGATGTACATAGAAACGATTTTTCCAAGGTGGGAAAATTCCGGAACCATTCACACGACTAAAGATGATCATGATAGCTGCAGTGCTATCTGCTGATAAAAGTACACTATTGCACAAGTGAAGATCGCCT
>XM_002560539.1 Penicillium chrysogenum Wisconsin 54-1255 hypothetical protein (Pc16g02130) mRNA, complete cds 
ATGGACGCCTACCCCGAAGACTACGTCAATCACAATCTGCCTTTAGTCCTACTCTCAGGGCTGGAGGCAGACACTGAAAATGAGCCAGGAACACCATCGGATTATCCTCTGCTATCAGAGAAGGGGACGCATATCTTCTCAGACTTCCCACCTCTGAGCGGGGCTGTTGCGGAGGAGCTCCGGAGCTTGCTTCTAGAGGAAGATAGCTCTCAATCGCCATGGAAGTCTAGAGTTACTGTAAGCGGGAATACTACGATTGCGAATATTGGTTACCGCATCAAAAGTTCTGGCCGCTCATGCAGACTCCCTCCACAAAAAGCTGACCCCCCTATCCCCTCACCACCAACTACTCCCAGTGATGACCATGATAATGAACACTCCGAGCCTAGCGCACACTATGTCCTCCACTCCCCGATATCGCCTCTGTCACCGGGTTCCCCAACTTTCCCAGATGGCTTGCTCACACCTCTATGGGTAACTAAACACCAGGACCTGGTTCCAGCAGCAGTGATAAATTTCTTCCCGTTTTCGCTGGACCCAAATATGAACTCGCTGCGAGACAATCAACTCAAGATCGAGATCAATAGCTTGAAAAAAGAATGGCAATCCTCCGGGTACAAGACGCGGTTCGTGGTCGTTCTGTTATCAGAAGACGGAGAAGAAGGCGGCTATGAGGGCGAGATTGATGACCGAATTGCGGGGATTCGGCGGGCAACAAACCTTGACCCCAGGTCAATATTTGTGATTCCACCAGACGCGACTTCATCGGAACTGCAAGACTTTGTGAAATCACTCTTCTCTTTACTGCAACCGTCGGTTGTTGAATACTATCGGGATCTGTCAAAGCATGCCAGGCGTAAACGGAACAGGGGGAATATCCCCCCTCCGACCGCACCACCAACGACCGGAACTTCTCAGACCCTATCGTCCCAAGGCTGGAACGTACGGTATGAATTCAAGCTTGGAATTTTTGCCGAGTTTCGCCAAGAAATGGATGCAGCCTGCCGGAACTATGAGAGTGCGTACGAAACCCTGTTTGGGCATGAAGTCTTCGAAAATATTGCAGGCTGGAATCCTCGATTCAACGATGCGCGCCTTTTGGCCGACGCCCTGGCCATTCGGATTATACGCTGCCTGCTATGGACGGGCCAGACGACCACTGCAGCTCGGCTTTGGGTTGACCACAGAGTCCGTGTAAAGGATATTGTCGATCGCAGAGGAAAGGGCAGTAAACACTACGGGTGGGAGGCCTGGGAGGCGCGTTGGTCGATGGTAATGGCACAGCTTATCCGCCGAGCGGAAATTCCGCCTATCTCCAGCGAAATCTCTTCTGAGCAGCCCAGAAAGCTCTATGCTCTACCTGAGAAATCGATTCCAACCGGGGAAAGAGTCAGGCCCTGGGAACATCTCCATCACGAGGGTTACTGGCTACACCGTTCAGCGAAACATACGATGTTGCGACGTGCCCTTGCCCAGGAAATCCCCTTGGAAGATCGCAAGCCCCCCGGGCAATCACCCGCCTCACAACTCGCAAATAAATCCTACTTGTACGACACGTACCTTGTTCCCGACGCTCACGCCGAAGCACCCCAAGAAGGACGAACTGGCTTCGACCATTCTGGTCTAATATTAAGCACGCTGAAGGCTGCTATCGAGGAATTCGCAAAACGCGACCAAACAAGGAAAGTCGAGAGCTTGAGTCTTGAGGCGGCCGAGGAGTATATGCGTATTGGCTCATGGTCCGAAGCGCATGGCCTTCTTCGGCCGCTGTGGTCTACTCTTAGCTGGCGCCGCTCAGGGTGGTGGCATCTGATGGCCAATTTCGGGCGGGCGCTCAGAGAATGTGCCCTCAGGATGCAGGACAGCGAGACAATCTTGCGAGTGGACTGGGAGCTGTTGAATAAGAATCTCAAACCTAGATCTGCGTGGCATTATGACATCCACAAGAGTCTTGAAAGTTTACCCTCAGAAAAGCCTAAACCTTCTCTTATCCTTCGCGCAGAGGATGTTATAACAAGTCTGACCGCGTCGCTGGTGTTCGAGAAATCTGATGGCAACGTTGGCGAACCTCTACATGCACAGCTTGCCATCACATCCTGTGCTCATAAATTCTCGGCGCCTATTCGGCTTTCGGAGGTCAAACTGGTTTTCGAAGGATGTCTTCGACCGGTAAAGGTTCAATCTGACCAGAACCAGGATGCTGACACCACAACCTCATGTTGTATCGCAACTCTTCCACTCCGGGAACCGAGCAACGCTGATACTGCGGTTCAATCCCCAGCCGGTGGACTGACCGCATTGACCAAGGTGTTTGACCTCACCTGTGTTCCTCGCGAAGCTGGTGAAGCCAGGGTTGCTTCAATCACCATGCTGATTGAAGAAGAACAATTCGATTTGGGTTATGCGGTCACTGAACCAGAACAGCGTGAATCGTTCTGGTGGGAGCAGACCCAGAAGGGCGTGACCCGTAGGAGAGTGGGCAAGGATAGGGATACTGGCAGGTGCAAGGTTATGCCTAAGCCTCCCAAGATCCGCCTCACAACTCCCAACCTGAAGCGGACCTACTACACCAATGAACGAGTGATGCTTCAGATTGGTATACACAATGAAGAAGACGAAGCTGCCGATATATCTGCTGAGATCAGACTATTCGGCACCGAGTCCGCAGCTCAAATCCAGTGGCTCGACGGCGACAGCAACCCCGAACTCCTCGAATCAGGCGCCAGCACTCCGATTGAGGGGCCGTCTCATTACTTGAAACGATCTGTGGGTGTTCTGGAGCGCTCCTCCCAGAAAACTCTTACAATTGTGTTGGTCGATACCCAGGAGGCTACGGATTTCACCTTGGAAGTTTCGACTGTGTACCATTTGGTGTCTGATACCCAGACCCCGATTATGAAGAATACTACCGTGGATCTATCATTTATTCGGCCGTTTGAAGCAAACTATGAATTCTTGCCGGCAATTCACCCTCAGCCATGGCCCAATTTCTTCGCAGTTAGCGACAACTTACTCGAGGATGGCTCTGCGCCAAGTCCTGGAGGCCTGTTCCAGAAATGGTACCTCAATTCCAAGGTAGTTTCCTTTGCACTGGAGCCATTGGTAATTGACAAGATGTCCCTGGTTCTTCTCGAAGCCAACGGGGGAGTCGTTTGCGATGTTCACTCAGAGGAGCTTGTGACTCCCGGAACACCACATCTCGCACCGGAAGAACTGCGAGAATCCAACTTCTGCCTCGATGTCCAGAAGCTCCTTCTCGGAGACCGCCGGCCAACTGCGCTCACCTGCACATTGGAGATCAATTGGCGCCGGCAGTCATCTGAATCTGTAGCTTCCTCGGACGCAGAGAACTCAGTCACAACCACCGTCCTTGATATTCCCCGATTTGTGGTCCCAATGGGCGAACCTCGAGTCCTTGCATCAGCCACCCCATCCAGCAGTATGGCGGGGTTGATTCATATGGGCTATGTACTGGAGAACCCCTCCACCCATTTCCTCACCTTCAACCTGGTCATGGAAGCTAGCGAGCACTTTGCCTTTAGCGGACCGAAGACCACCGTTGTGCAGCTTGTGCCGCTGAGTCGCCACACAGTGAACTTCAATTTGTTTGCAGCGAAGCGTGGCTTATGGATTCAGCCACAACTGGTAGTTATTGATACCTACTTCAACAAAACGCTCCGCGTCCTTCCAACGGGGGATATGAGGTCGGACAAGAAGGGGGTTCTGGTATGGGTTGATGCCGACGATTGA
>XM_011327141.1 Fusarium graminearum PH-1 hypothetical protein partial mRNA 
ATGACATCCTCCATCGTGGAGGCATTGGCGAATGTTCAACCACCAGAAACACCAGACAGCGAAGATCATGACATCGAAAACGAGACCCAAGAATCACCACAACCTACAAACGAACCTTCCCTAGACGACCCCCAAATCGGAAAGCCCATATCTCATGGCCAAATTGTCGACCTTTGGAAGCGCTCCAAAGCACAAGACGATGCAAACTACACTCTAGAACAACTCCTTCGCGGCGCATCCGTCTACATCCCTCCTCCACCACCTAAACCCGAACCTCTAACCAAGTGCAGTCTCCCGAATACAAAGCCCTCATGGCCCGTCTTCGCCGCCAAGAAGAAGCCCGCTCCTACGAACGAATGA
>XM_039262098.1 PREDICTED: Dioscorea cayenensis subsp. rotundata uncharacterized LOC120253894 (LOC120253894), mRNA 
ATGGCCACAGTTCAAGGACCAATAGTTCTGGTTCCTGAACTAGAACCGAACTGGCTAGGTTCCAGTTTTAGGACAATTACGGTTCTGCCGGTTCCAGCCCGAAGAAAGAGTAACTACTTATTGGCCCACTTCATCTCTCTTCTACTCAGCCCTAATTCCTCTTCTTCTCTGTTTCATCACCACGCTCCTCCACCATCGAACCCGTTGCCGATCACCCGCCCGTCACCACGGTCCTCATCTTCGCACCATCGTCGGACCCGTCGCCGGTCACCCACCCGATCACCACGATCCTCATCTTCACCATATCATCGAAACTCGTCACCAGTCACCTACCCGTCACCCGCTCGTCACCCACAAGCCTGCAGACCTTCTTTTTCTTCGAAGAAGGAAACGATCTTCATCTTCTTCTTTGATGATTCTAGGGTGGGTGGTGGTGATCTTCCTGATGACACTGTGTTGACTTGTTCTCACGGCTTAGAAAGGTGGGCTTATTACATTCTTTGTCTGGCTTCCTATCCGTCATTAGGTCCTCACATTATGTTTGTGATGCATTTGCATCAACATTAAAGGGCTCTCCAAACAGTGTTACAGTTGCGAGAACCCGAATTGAAGGAGGTGCAAAGGCTGTTTGGACTAGTGGAAGCCTGGTGCTTCAAAGTATACGAGCCATCTATGCTCGCTAAAGCATCTTCTTCTGGTTCGAAGTTGGGGAAATGATTGTTGCCTAATGATAGCCCTTGTGTATGTAATGTTGTACTTTGAGTTCCTCATCATCTGATTTGTATGTCATTTAAGCATTAGTGCTTTTCCAATTGAATCAACTTCGACAAACGAATATATTTGCTTGT
>XM_040352829.1 PREDICTED: Rana temporaria histone deacetylase 9 (HDAC9), transcript variant X3, mRNA 
TCCCTCTATTGAGATGCTATTTTTAGCAAATCCTACTCGTGTCGCCACGGGCTGTGATCACATCTTTCTCTCCCCGTTTCTGCCTCCCTCCCATCCTCAGCCATCCCTTTCCCTCTCTGTCTGCAGATTTGAAAACATCACTGGCAGCGCTCCCCGGCGACTCAGCACTCATGTAACCTGCACGGGCAGCGAGCACGGCGTCAACTTTCTTCTGCTTTGTGTTGTACGCTTCCTGGCAGCCTCCTTTCTGAGGATGGATGGTCTGGATGAGCGGCCAACTTCTCCGAGCAGCTACTGAATGAGCAGCAAGATCCTGCTTTTCAGTTACAAACCACTGAAATACATTCCTATCAGATCTGGGATCTCTATCAAACAGCTGGTCGGCATGTCTTCTCCAACCATGAGCACCACAACACAGTCAGATGGGGTATCTGGACGGGAGAAGCTCCTGGCACAGCACAGAATGCACAGCATGATCAGTCCAGATGTGAAGACTGAAGTCCCAGTAGGTTTGGACCCCATCACACCACTGGACCTACGGACAGATCTAAGGACAGTCATGCCTATGTTAGATCCTAGCTTACGAGAGAAGCAGCTGCAGCAAGAGCTTTTACTGATTCAGCAGCAACAGCAGATTCAGAAACAGCTGCTCATTGCCGAGTTTCAGAAGCAGCATGAAAACCTCACAAGACAACACCAAGCCCAGCTGCAGGAGCACCTCAAGCAAGAACTTCTAGCAATGAAACAAAAACAAGAGATCTTAGAACGGGAGAAAGAGCACAAAATGGAACAACAGAGACAGGAACAAGAAGCAGAAAGGCATCGCCGCGAGCAACAGCTGTCTCACCCTCGCAGCAAGGACAGAGCAAAAGAGCGAGCCGTTGCCAGCACTGAAGTCAAGCTGAAACTACAGGAATTCCTTCTGAGTAAATCTGCCACAAAAGATTCCTATACAAACGGAAACAGTCATTCCATAGGCCGCCACCCAAAGCTTTGGTACACGGCAGCACATCATACTTCATTGGATCAAAGCTCTCCTCCATTAAGTGGGACCTCTCCATCATATAAATGTCCTCTTCCTGGAGCACATGATTGCAAAAACGACTTTCCTTTGAGAAAAACCGCTTCAGAGCCCAATTTGAAAGTTCGCTCTCGATTAAAACAGAAGGTAGCAGAGAGGAGAAGTAGCCCTTTACTAAGAAGAAAAGATGGCAGTGTTACCAGTTCATATAAAAAGAGAATATTTGAAGTGGCAGAGTCTTCAGTTAGTAGCAGCTCTCCAGTATCTGGACCCAGCTCTCCAAATAACGGCCCAGTTAACATGGGTGTGGAGAATGAAAACTCAGCATCACCATCCAGCTCACATGTCGAGCACTTGGTTTCCCAACAACATATAGTTCATCATGAAAAGTCGATGAATCTGCTAAGTCTTTACACATCTCCATCATTACCCAACATTACTCTAGGACTTCCAGCAGTAGCTCCCCAACTCAGTGCCTCATCTTCATTAAAAGAGAAACAAAAGTACGAGCCTCAGGCACCCAGGCAGGGGGTGTCACTGCCTGGATCGTATGGAGGAGCCCTGCCTGTTTCTTCAGCTCATGCATCCCTGGAGAGCAAGACCAACAGCAGCCACCAGGCCTTACTGCAGCACTTACTGCTAAAAGAACAGTTGCGACAACAAAAGATTTTAGCTACAGGTAGTGCTGCAATTCTTCACCAATCTCCACTTACAGCAAAAGAGCGGGTTTCTCCGGCGGGCAGGGTGGCGCACAAACTTCCTCGGCACCGGCCACTGCACAGAACACAGTCGGCTCCGCTGCCTCACAGCACTTTGGCCCAGCTTGTCATTCAGCAGCAGCACCAGCAGTTTTTGGAGAAGCAGAAACAATATCAGCAACAAATCCAAATGAACAAAATGCTTTCAAAATCAATCGAACAACTCCGCCAGCCTGGAAGCCATCTAGAGGAATCGGAGGAAGAACAGCATAGTGATTATCTGATGCAAGAAGAGAAGGTGTCCTCCTCGGCTTACATACGAAGTTACAGCAGTACTGACATCAGAACTGACCACCTCAGACCTGTGAAGGTGAAGGAGGAGCCACCGGACAGTGATGACGAAAGCCAAATGCCACATGAATCTATTCACAAAATGGCTTTTGTGCAACAGGTAATAGGCCAAGAAATAGCTCCAGGATTTGTTATTAAAGTTGTCCTTTGAACTTTAGGACTGACTAAGAAAAAGTAAGACCCCTACATTATGTAAATAGACATTTTTATTTGAATATGTTAATACAGGTTCTTTTCTTTTTTTAATCTTAGTAAAGCTGGTCATATACTAGATTTTTGAATAACAGTCCTTATAAATATCTGTGCAAACATTTGCAATGAAATTCTCAGTACATCAGATGACTGGACAAATGTCATTCGATTTTGGAGTGAATGGAATTTCCTAAACAAAAACTACATACACTATTGAGAAAAAAAATCCATCCTGCACCTTCAAGCTTTCTCATTACTATGGTTTAAAAAAAAAAGTTATTTTTATCCCACTAACAATTAGAAAGTCAAATGAATGTCAACAAAAATCCTATAATGCCGTGTACGGAAATTCCGTGGATTTTTTTTTCCGACGGAATGTTGACTACTTGTGTTGCATACACACGGTCACACAAAACA
>XM_039196864.1 PREDICTED: Hibiscus syriacus probable prolyl 4-hydroxylase 3 (LOC120194605), transcript variant X1, mRNA 
AAATTCTCTGATACTTTTCATCCGAGTTTTACCCAGAATCAGGGGTGATTTTCTTCCACCGATCCCTGGGTTTTGAGCTGATTTCTCTCGTGTCATCTCCGTAAATTCAAGAATGCCGAAATTGAGACATTCTCGGTTGCAGGCGAAGAAGCTGCCGACAGCGACGCTTGTATTATTCATGTTGTTTATGTTAACGGTAGTTTTATTGATGCTTTTAGGACTAGGGATTTTCTCTCTTCCGATAAACAGTGATGATTCTCCGCCCACTGATCTTACTTCTTATAGACGCATGGCCTCTGAAAGAGGAAAAGGCTTGGGGAAAAGAGGGCAGCAGTGGACTGAAATCCTTTCTTGGGAGCCTAGAGCTTTCATTTATCATAAATTCTTGTCCAAGGAAGAATGTGAATACCTAATCAGTCTTGCTAAACCTCACATGGCAAAGTCCACTGTTGTTGATAGCAAAACAGGGAAAAGTACAGATAGCAGGGTGCGTACAAGTTCTGGTATGTTTCTGAGAAGAGGGCAAGATAAAATCATTAGAAACATAGAAAAAAGGATAGCTGATTATACTTTCATTCCTGCAGAGCATGGAGAAGGCCTTCAAGTTCTCCACTATGAGGTTGGACAGAAATATGATGCACACTTCGATTACTTCCTTGATGAATTCAACACTAAAAATGGAGGCCAGCGGATGGCTACTGTGCTTATGTATTTGTCAGATGTTGAAGAAGGAGGTGAGACAATATTTCCAGCGGCCAAGGGAAATGTTAGTGCTGTGCCTTGGTGGAATGAATTGTCTGAATGTGGTAAACAGGGTCTAGCTGTGAAGCCAAAGATGGGAGATGCATTGCTGTTCTGGAGCATGAGGCCTGATGCCACACTAGATCCTTCAAGTTTGCATGGTGGGTGCCCTGTGATTTCGGGGAACAAATGGTCCTCAACAAAGTGGATTCATGTTGAAGAATACAAGGCTTAAGCTGCTGTATAGAGGGTGCAGTTCTGAGGAAGTGTGATTGAAGCAACCCCCTTTAGACTCGGGTCCATCAATCTCTTTTTGACGGGGCACGGTGTCTCTAGACCTAATCCTTAGGTTGAGAAGTAATTGTTCTCGTGTATTCTGCTGGAAACTATCGGGTTAAGAGAATGCGGTTCATACGTGTTAGGTCCTATAAAATCCGATTGTAAAGTAGCTAAATAATAATGAATAGAAGTATCTTGGAGCTATTGTGAGTCTGGTGGTTTTAAAATCAAAAGTACGTACTAAAGTTACCGGCTATTTTGTTGTTAACACACTGATGTGGCCCATAGTTCATAAAAACAGAAACAAGCTGGATAGACAAAA
>XM_045620325.1 PREDICTED: Harmonia axyridis 26S proteasome non-ATPase regulatory subunit 14 (LOC123681941), transcript variant X2, mRNA 
TATAAACCAGCTGTCAATCTGTCAGTGGAAGTCAAATATCGTCAAATAACAAACGGTGATTTGCAAAATTAACACTCCTTGTTTTTTCACTTTATAAATAAGAATATTAATTCATTTAATAGTACTTTTATATTATAGCCATGGATCGACTACTCAGGCTTGGTGGTGGAATGCCCGGATTGTCTCAGGCAGCCCCTGCTTCTGATGCTCCTGTTGTAGATACTGCAGAACAAGTTTATATTTCTTCATTGGCCTTATTAAAGATGTTAAAGCATGGAAGAGCAGGTGTACCCATGGAAGTGATGGGGCTCATGCTGGGTGAATTTGTTGATGACTACACCGTTAGAGTAATCGATGTATTTGCTATGCCCCAAACTGGTACTGGTGTAAGTGTCGAAGCTGTGGATCCTGTATTTCAAGCAAAAATGTTGGATATGCTTCGACAAACAGGCAGACCTGAAATGGTTGTTGGCTGGTATCATTCCCATCCTGGTTTTGGATGCTGGCTTTCTGGAGTGGATATAAATACGCAACAATCATTTGAAGCATTGTCAGAAAGAGCTGTTGCAGTTGTTGTTGATCCTATCCAGTCTGTAAAAGGCAAGGTTGTTATTGATGCATTCAGACTGATAAATCCTAATATGATGGTACTAGGTCAGGAACCCAGACAAACCACATCAAATTTGGGACACCTTCAAAAACCTTCCGTCCAGGCTCTCATTCATGGTCTAAACCGTCATTATTATTCAATCAGTATAAACTACAGGAAAAATGAACTTGAACAAAAAATGTTGCTTAATTTACACAAAAAATCTTGGATGGATGGCCTCACTTTGGCAGATTATTCAGAAAATTGTAGTGTGAATGAAAAAACCGTATCAGAAATGCTGGAACTGGCTAAAAATTATAACAAAGCCTTAGAGGATGAGGAGAAAATGACACCTGAACAGTTAGCAATTAAAAATGTTGGAAAACAGGACCCTAAAAGACATTTGGAAGAGAAAGTTGATGTACTTATGACGAATAATATTGTTCAGTGCTTAGGTTCAATGTTGGACACTGTAGTGTTCAATTAATTTATTATTTTTACAATAAATTATCAACATATTCAACTTCATCATTTTGATTCAATAGTTTTTCATTTCACTTATCGTTTGCTGCAAGTTAAACACTACAGTAGGCAAAAATTACTCCAATCTTCTATTGGAACTCATAATATTAATTCATTAATTCTCAAATGAACTAAAGTTTATTTTCAATGAGTATGAAAATATTAAGATAAATAAGGATTTTATAAGAATAAAATTTCAATGATCTGTAATAAAAAAACCAAATGTCAA
>XM_018196263.1 PREDICTED: Atta colombica NADP-dependent malic enzyme-like (LOC108689497), transcript variant X2, mRNA 
CAATAATGGAGAAGCCAACGTACCTCGTCCGCCGATTTAATTACAAGTGAACGAACCGCAACCGGTTCGTCGTGCCGCGCGTTTGCTTCGGGAGTGCCGTTAAAGTTATCGGACTCAAGTTATGGTCCGCGCGCGATTATAGTGCACTATTCGCGAGTGTTTTACGGGAGTGGATGTCAATCCAATTCTGAGAGGAGGAGAAGGGAGAGACATCGGGCACCGGCGGAGCATTTACCTTGCAAATTATCGACGTTGCAGATAACTCCACTGTTGCGCATCGGGATGATAACGATGTTCAGAACAGACAGCTGAGAGACATGCCGCTATCGATGAATGGCTGTCAGAAAAAATTTGCTCGCATTCTAGAAGACTCGAGCGAGGAATTGTCTTCTCAGTCGCATGAAGCCATCCCTCTCTGCGCACGACACACAAAGTTACGCACGCATGACCCAGAGCAGTACACAACCTAACTGTAGCAAGAATAAAAGCATGTCGAGCTTGGAACGCGATCAGCTGGGCCAACGAGGAAGCGGCGACACGGTCTCCGCTGGTCTTCTGCGTGGCCTCGATCACATTAGAGATCCGCACTTGAACAAGGGTATGGCGTTCAGTATTGAGGAAAGGCAGATACTGGGTATACATGGTCTTCTACCGGCAGCCGTAAAAACCCAAGAAGAACAGTTAGAGCTTTGTCGTCTTAATCTGGAACACTACACGGATGATCTCTCAAAATACATATATCTCATAGGCCTACTGGATAGAAACGAGAAACTCTTCTACCGTTTGTTGGCAGAAGATGTAGATAAAATAATGCCATTGGTATATACGCCGACCGTGGGTTTAGCATGTCAGAAATTCGGTCTGGTTTACCGTAGGCCGCGTGGCCTTTTCATAAGCATTCACGATAAAGGCTATGTCTATGACGTTTTGAAAAATTGGCCCGAACACGACGTACGAGCAATCGTTGTCACGGACGGTGAGAGAATATTGGGATTGGGTGACCTAGGTGCTCACGGCATGGGCATTCCCGTAGGTAAATTGTCATTGTATACCGCATTAGCTGGTATCAAACCCCATCATTGTTTGCCTATCACTTTGGACGTCGGCACTAATACCCAGTCTTTGTTGAATGATCCCCTATATATCGGTCACAGACACAAACGTGTTACTGGACAAGAGTATGACGACTTCGTGGACGAATTTATGAAGGCTGTTGTGAAGCGATTTGGTCCGAATACGTTAATTCAATTCGAAGACTTCGGAAATGTTAATGCGTTCAGATTGCTTCAAAAATATCACAAGGAATATTGCACCTTTAATGATGATATTCAGGGTACCGCCTCTGTCGCTGTTGCCGGGTTATTGGCATCACTTCGTGTTACGCAGACAAAGCTCTCAGAGAATACAATCGTATTTCAGGGTGCTGGAGAGGCGTCATTAGGTATCGCGGCATTGTGCGTGATGACAATGCTAAAAGAAGGAATAACTAAGGAAGAAGCTAAGAGCAAAATTTGGATGGTAGACTCGAAAGGATTGATAGTGAAAGATCGTCCAAAAGGCGGACTGACGGAGCATAAATTGCACTTTGCTCGTGAGGATAAGCCAATCGACACTCTGTTCAATGTTGTTAAGACCGCCAAACCTTCGGTTATTATTGGCGCAGCTGCTATCAGGGGTGCCTTCACAACAGAAATATTGAGGGAAATGGCGCGTATCAATGAGAGACCCATTATTTTCGCTCTGAGTAATCCAACGAGCAAAGCAGAGTGCACCGCGGAAGAAGCATATATTGCTACAGAGGGAAGATGCTTATTCGCAAGCGGCTCGCCTTTTCCACCAGTCACATATAACAATAAAACTTACTATCCTGGTCAAGGTAATAATAGTTACATATTCCCTGGAATCGCGCTGGCCGTAATATGCGCTGGTATGCGCACCATTCCCGAGGAAACTTTCCTTATTGCTGCGACGGCTCTCTCCGACTTGGTAACGCAAGCCGATTTGGACAGCGGTAATCTTTACCCACCATTGGCCGATATACAGAAATGTTCGTTGTGTATAGCATGTGCAATCATGAAATATGCTTATGAAAAATCTCTAGCAACTGTCTATCCGGAGCCTTCAGATTACGAGAGTTTTATCAAGGCACAATTATACGATCCAAGCTATAAATCGGCAATTCCTCCAGTTTATTCATGGCCAACAATAGAATTCTTTGGGAATCTTCCTCGCTTTTTTAAAGTCTGTTGACCGGGCTTATTTCTAACAAGTATGTGCAAACGTGATCAATATTTAATTATTAAAATTCGCAAGAATGAATTTGTGTTTAA
>XM_051723159.1 PREDICTED: Myxocyprinus asiaticus protein EFR3 homolog B-like (LOC127455345), transcript variant X3, mRNA 
TGCATGCATGCACATGTGTGTGTTTGAGTGTGTATTTGTGTGCATGTGTATATATGTGTGTGTGTGTGTGTGTGTGTGCACCTGTGTGTTAAACCAGCATTGTTCCTGATAGAGGGAAAGCTGTGCCGCACTGTTTGGAAAATCCAAGGTCATTGAAGCCCGGTCACATGCACCATATGTGAGCGTGCATGTGTGATTTAGTGTCTGAGTGAGTGAGTGTGTATGTCTCTCTTCCTCTCTCTCTCTGGCTGGAAAGAGGCTTCAGGCAAAGAATAGTGAATTTCATCAGGTTTTCCATCAATGTACGGTGTGTGTGGATGCTGTGGGGCCTTGAGACCTCGTTATAAGAGGCTGGTGGATAACATCTTTCCTGAAGACCCTGAGGTATGTTTGTATTGCTATGGAGGCTTTGGACCAGCTGCTGATGGCCTGTCACTGTCAGAGTATAAACCTTTTTGTTGAGAGTTTTCTCACTATGGTGCGCAAGCTTTTGGAGGCAGACAAACCCAACTTGCAGATCCTGGGCACTAACTCATTTGTGAAGTTTGCAAACATCGAGGAAGACACACCATCATACCATCGCAGCTACGATTTCTTTGTCTCACGCTTCAGTGAGATGTGCCATTCCAGTTATGAAGATCCAGACATTCGCACCAAGATTCGTATGGCAGGTATCAGAGGTCTGCAGGGTGTGGTGAGGAAGACTGTCAATGATGAACTGCAGGCAAATATTTGGGACCCTCAACACATGGACAAAATAGTGCCATCCCTTCTGTTCAACCTCCAGCAGGAAGAAGGCATAGAGAGATCTCCCTCCCCAGAGACAGAGAAGGAAAGTCCAGTGGAGCTGACCGAGAGGTGTTTCAGAGAGCTGCTAGGACGAGCAGCTTATGGTAACATAAAGAATGCCGTCAAACCCGTGCTCATGCACCTTGATAACCATTCACTCTGGGAGGGCAAAACATTTGCTGTGCGCTGTTTTAAAATCGTTATGTACTCCATCCAGTCCCAACATTCACATTTGGTGATTCAGCAGCTGTTGGGTCACTTGGATGCTAACAGTAAGAACTCAGCCAGAGTGCGTGCTGGGATTGTGGAGGTGATCTCAGAGGCAGCGGTCATAGAGGCCAGTGGCTCAATAGGGCCGACAGTACTGGAGGTGTTTAATACTCTGCTGAAGCAGCTGAGACTCAGTGTGGACTACGAGCTCACCGGATCATACGACTCTTTTGGAAACATGGGAACCAAAGTCATTAAAGTGCACGAGGAGAGACAACTCCAAGAATCTGTCATCAAAACTATTGGCTCATTTGCGAACACGCTGCCCACCTACCAGCGCTCAGAAGTCATGCTGTTCATCATTGGTAAAATTCCTGTGCCAGGGATGTATCCGGCTCTGGGGTCAGCCAACACAGGGGTTGAGGGCAGTAGGATGATACAGATTATGCTGCTAAAATCTTTGCTGCAGGTAACAGCAGGATTCCAGTCTACGAACATTCTGACAACTCTTCCCACCTCATTCCTGGACCCTCTCTTGTCCTTTACTCTGATGGAGGAGGCAGAGATCCGGCTACTTGTTCTGGACATCCTCATCAGCATCATTGATCGCCATGACAACCGTCACAAATTCTCCCCTGTCAGAATTGTGTCAGATATCGCTGTACTGAAACTGAAAGTAGACAAGTGCTCAAGGCAGGATAATCTCTTCATGAAGAAACACAGCCAGAGGCTCTACCGCCACATTTACCTGGCCTGCAAAGAGGAGAGCAGTGTCCAGTGGCACTTTGAGTCTCTTTATACGCTGCTGGGGTTGATCAGTGTTGAGCTGGCCAATGAGGAAGTGGTGGTGGACCTGATTCGACTGGCTTTGGCCTTACAGGACCTGGCCTTGACTGAAGAGGCACTTCCTGTGTATAACCGCTGTGCCATCCATGCTCTATCATCTGCATACCTGAACCTCATTAGCCAGCTGACCACTGTGCCCACCTTCTGCCAACACGTCCATGAGGTGATTGAATCAAGAAAGAAACTGGTCCCCTGTCTGCTGCCTGAGGATGTGCTTGTTGAGACCTCAAAGATCCCAGAGAAACTGGAGAAGGTGGAAGGTGAGGTTCTGTTCATGCAGGCTAAGATAGCGGAGATGCTGGGCGGCAGTGGATACAATACAGAGAGACTGGCCACTCCATACATCCCACAGATCACAGATGAAGACAGACTATCTAAGAGGAAGAGTATTGGTGACACCATTTCCCTGCAGTTAGAGATGGAGTCCAGAGACAGTCCAGAAAAAGAGCAGAGATCCAAAGCTGAGCAGATAACATTTGAAACCCTTAAACAAGCCATTGTAGACAGTGTGAGTGTGGAGGAGCTGGAGAGAGAACGCAGGAGGCAGGTGGTGGAAAGGTTTCAGACGGCTCCATTTGAGGAGATCGCAGCACACTGTGGGGCCAGGGCTTCCTTGTTGCAGAGTAAACTCAACCAAATCTTCGAAATCACAATCAGGCCTCCTCCGAGTCCGTCTGGCTCTGTCGGGAATGGCCGAAATCGTTCTGTACCAGTCTATGAAATGACGTTTCCAGACCTTTGTGTGTACTGAGAAAACCTGGAGCCACAGTCACCAGATACAGACCTATTTCAATCCCTACAATATTGTCACTCCTTCTCAATGTCCAGTTGAAACTATGCGTCTTCTAAACTGTGTCCTTTAGTTTAATATCTTTAGATAAAGATCAAAACTTGACTTGATCCCGAGGTGTTCACCAAAAAAGACAACCAAACCAAGAGAATATACATTGGTTATATATGCACTGTATCACTAAAAATGACAAAACAATGTTCACACAGCTTAATCTAAATGCAAATAGATTGAATGTATTTAGAAACATTTGTGCCATTGTCTGATACTAGCATACATAGCAGAACAAGGTTTTCATGTTTAATCAAATGTCCAGTGAATAGGCCAGGTTACTGTGTAAGTCTATTGTTCAGAGCAAGTGGATGATATTCTTGTACAAATAAAAAGTACAGCTGCCTTACATTTTGTATCTTAAGTTAAGACTTAAAGAATTGTTAAAGAATGTTCTCGGCATGTTTTCTGTAACTATGTTTTTCAATCTATTGATTATTAAAGTGACGGTGCACTTAAAGGTAGATAAATATAAGGTTGTTTGCCTGGTATATACTGTATTTCTTTGTGCATGTTTAAACCTTCTCTACATTCTGCAATAATATTTGTATTTAAAGCAATAATTAATGAATTTAATAATGCAGATTCTTCTGAGATAAAAGCTGAAGAAAAAATGCAACACATTTTGTTTGCGAACACTGGATGATGCAGTATTACAATCAGAACTAACAGCTTATTGACACGCTGTGTGCAAGAAAGTAAATTCAGTAGAGCCTCTGGTGTATTTGCATAGTAACGTCATGTTAATTATGTTCTAATTGAGTTCTGTACATCTGTACCTCATTACCACAAGAAATATGTCATATATTTCAAAGAATATGTCAGTGAAGGGTAGGAGTTTTCATTTGCTTAATAGTCTAACAATGATTGTGTACATTTCCCAAATGACCATTTTCCTTTTTTGAACCAGAGTGAAGTGGTAACACTTCTCATAGTCCCCTACATTTGGGGTCTAAAGGGGCCAATTAGCTCTCTATTTGTTTTTGTTTTTTAAATTAGCTATGATATATGTTTGTTCCTTTTGTCACTTGTATAACTTTTCTCTCTTCATAAATCCTGTAATTTCAGGTTTACGTCAAGATTTGGTTCTCTCTTGTATTTTATTGCAGCACTTTAAAGATCATTGTGTAAATGTGGTGTATGCTAAAAAATATATGTTCTGTGATTTTCCACCTTGACATGTGAATGTGTTCTTGAGTGTCATTTTAAAGTGAATTATCTTTTATCGTCTCATATTTTCCTATTCCACATGAAAGTTTGCCTGTTTTTCTGCTATAATTCCATGAAGTCCTTTTAACTTTTTTTTTTCTTTTTAAAGTTATTTAATCAAGTCATTGTGTTTTTTGTGATGACTTGAATTTATTTACTGTTTCTACATACTGGTTTTAAAAGCAAAGCATCCAAAAAGAACTTGACTTTTGCCATCTTTAATATGGGTATAATGTCCAACTGATAGAACATTCTAGACTTCTTACATGTGAGGTGTTTGACGATGTACTGCATGTATGAAATATCAAAGTTTAGTCTTTCCTCTCAAAAAACTGTGTCCTTGACAGTTGCCGCATGCACTGGGAGTTTTGTCTGTGCTTTTACTATTTTTGTTGTTGTTTAATTTTTTGGGTTGAATCCTTATTAAGAAAATTAAAACATTGTGGATTGTAATTAGTAATTATTACATGTCAGCTTAGTCCCTGTTATGTGTTTGGTACCGTCAATGCAAACTGATGACTTCAGAACTGTGTTCTGTGAATGTTTGCCTAAATGAAACAATTCCTAAGTAATGTACAGAAGTGGTGTGAATAATAAGAATATCAATTAAAGACTAATTTTATGAA
>XM_039521359.1 PREDICTED: Mauremys reevesii poly(rC)-binding protein 3-like (LOC120396454), transcript variant X13, mRNA 
GAGGGAGGGGGGGGAAAGAAAAAAAGAAAAAAAAAAAAAAAAAAGCAAAGCTTTGCCTCATTCCAGTAGGGCTCAGGGCTCCCGGCCATCTGTCCACCCTTGGAATCAGAAGACAAATAGAGGGACCACACTCACTATAACTGTGCAGAAGGAAATTGTTCGGAAAGTCTGGCTGAGCTTTGCATTTGAAGTGCGGGCTTTGAGAGCAGCTCAGCAGGTTGACGAAGTGAAAAAACTAAGAAACTGCTTTCAAGCATTGAAGATACCAGGCCAGGATGAACACGAAGGACACAAAAGTGACAGAAGGAGGTCTCAATGTCACACTTACCATACGTCTTCTCATGCACGGCAAGAAATATTCACTTACTGTGGTGTTGTTTTTTCCTGTTCCAGGAGGTTGGGAGCATTATTGGAAAGAAAGGGGAGACAGTTAAGAAGATGAGGGAGGAGAGTGGTGCACGAATCAATATTTCAGAAGGTTCCTGTCCAGAAAGAATTGTGACAATAACAGGCCCAACAGATGCGATTTTTAAGGCTTTTTCTATGATTGCATTAAAATTTGAAGAGGACATAAATGCTTCAATGACAAACAGCACAGTGACAAGCAAACCACCTGTGACATTGAGACTTGTAGTCCCTGCAAGTCAGTGTGGATCCCTTATAGGAAAAGGTGGCTCCAAAATCAAAGAAATCAGGGAGTCCACAGGGGCCCAGGTACAAGTAGCAGGGGATATGTTGCCAAATTCAACAGAACGTGCTGTAACTATATCAGGCACTCCGGATGCCATTATTCAGTGTGTAAAACAAATCTGTGTGGTCATGCTAGAGTCCCCACCCAAAGGTGCCACCATTCCCTACCGTCCCAAACCTGCCTCTGCACCTATCATTTTTGCAGGTGGCCAGGTAAGAGCAGACACCATTTTGGCTTCAGCTGGAAACCACACCGTCTTGGCCCAACCTCAGCCAGCGCCTGCATTTACAATTCAGGGGCAGTATGCCATCCCTCATCCAGATTTGACCAAGCTTCACCAGTTGGCTATGCAGCATCCCCCCTTTACTCCCCTTGGGCAGACCACCCCTGGTTTCCCTGGATTGGATGCCACTACTCCAACCAGTTCCCATGAGCTTACTATTCCAAATGATTTAATAGGCTGCATTATTGGCAGACAAGGCAGTAAGATAAATGAAATCAGGCAGATGTCAGGAGCGCAGATCAAGATTGCTAATGCCACAGAAGGCTCGGCAGAGCGACAAGTTACAATCACAGGCTCCCCGGCAAACATCAGCTTAGCACAGTACCTCATTAATGCAAGCTTAGAGATGGCTAAAGTCAGCACCCAGACTGCTTCCGTCACGACCCCTGTTGACCTCAACATGAACCTCTCTCAGTCTGCCACCCCTACCTCCACCCCCACCTCTATGGCTGTCTTGGCGGCAGCAGCAGCTGCCTCCGCGGTTAACGTCAGTACCCCTCCCCCTTTACCAACTTTACCAACCACCCACTATGCCGTTCCTGTCTCCAGTCTGCTTGGCATGAAAACTGTCCCACTCCTGGCACTAAATGCCGCGGCCGCTGCGGGGGCCACGGGGAGTTTATCTGCTTACACTGCCAAAATTCCATCGACGAGTGGGGTTAAGAAATCTGACCGCCAGAAGTTTGCTCCATATTGAAGGGATGAGAAACAAATGCAAGGTTTTTCGAGCTCTACCAAGATTCTGTGGTAGATAATAGCTATCAAGGAAACAATATGGCATATTTTTATTTTCTGTTAAATTGCTAGTGTTAACTGTTGCCACCTCAAATTGTCTTCCACTTTCCATAACTATTAACACGTGTGCACGCACACACCCACCCAAAATGTAGCAACTAGTTCCAACAGCCTCCCTGAGTCTTTTAAACTCTAGTTGGTAACCATACTTAGCTAAAGTTTGTCATGTAACGGGTATGGTTCCCACATAATCTAGCGTGTTTAGCTTAATACAGCTATTAATAAAGGGTCCAACACTAGGCTTAGAATGGAGACAGATTTTCATTCTGAGGCATCACTGCTCTGACAACAATAATAGAGAGCTGCAGGCTCAAGTGTTGACACAAACAAATGCTGCCTGGTCTAGCCAGCGTATAGGAAAAGACTCCTTCCCAGGGCTAAGTTCTGTCCTCATTTATGCTTGATGCATTTCAGTAGGGTTGCATGGGGGACAGCAAGGACAGAATTGGGACCTTCAAAAAGGGGGGGGAAAAATGATACCTAAGACAAACGTCTTTGGCATTAGAAATAGTTATTAATTACTGCCTAGCGCATCAGTATTTATATCTATTTGAAGTGATCCCTTCAGCTGTGAGACTACTTCTCAGTTGATGTATCCTTCAAATTTGACATTTGTCTTCATGAACATTTTGATAGGCCTATAGCTAGAAAGCACCATGCGTCTCTGAAAGGAAATGCCCATGCATGCCTGACCTCCAGCGGTCATTCTACTAAAGTTCACAAAGCACTGAGACTTGTATTAATCTGCTTGGCATTTACATCTTACTAGATAATGAAGCTAAAAAGAACACCAAATATTCTTCTAATACATACATGCATATAGTCATGGATCGCCCATGTGTATGAATCTTGCTGCACTGAGAAACTCTTAACAGAATGGAAAGAGAGAGAAAAAACATTAAAGGAAGAGAAATATTAAGTGGTAACATGAGGTAATTTTAACAAGCTTTTAAATCTTCTATGTGCCATCCTTATAGCCATACTAATGTATCAGCCAAGCCTCAGTACTCACTTAACCAATCTGTTTCTATAGGATATTTACAGAGCACAATGGTTCATCTTAATTTAGGATACTAGTGAAGGATAATGTACTTTAAGGAGGCCATTTTCAGGAGGGCAGGCTCCCTTTTGGATGCACAATTTGCCCCTATATATTTTGCTCCTGCTTATGACCTGGAGGTGCAACTCCAAATACATGCATCTCGAAGTATTGAATTATGGGTACAAATCAGAGGAGCAAGTATTCAGATTTGTGCCCACAGTTTGTTTTGCAGGCCCAAGATACACTCCCACAGCCAGGCATCAGACTGGCTGAAACTAGACCCCATGTAATTTAGGGCCCAGATCATCCTCCCGCTGAAGTCAATAATAAAACACCCATTGACTTTTTCATGGGAGCAGGGTCACATGGCCTTCTTGGCCAACATGCATTGGCTAAGGTTTACTAAGGTTACTGTACAAATCCTAAATACATTCCAGTTTAAAAGCTTGGCAACTCATTTCACAGTGTAAGTTATGGTTAGAAAACAGGCATTTAAAAATGAACTACACGTACAAGCTATTTCATATCAAATGTTATTTGAAGGTTGTCACGTTGATTGGATGCCAGCCAGCAAACATAATTACACACAAGTTTACTATGAAAGGAAAAATAATTGCAAGCAAACTGAAAGTAGCTGGGAGATGTACGAGCTGGTTGCTAGCTGTTGGAACTAGTTTTTAATTGCATTTTCTGTTTGTCCATTCACCTTATTTTTAGTTTACGTTGCATAGCACTGGCTCAGTAATGCAATATTGTTTTCCTCACAACTTCAAAATTCAGAATCCCATTAGCCTGCCATGTTCATCCACTTTGCACTCCTTGGACACAAAGCTTTAACGAATTGAACTGTATTCGGTGCATTTTAATATAAACTAAAAACACAGAATGCAAATGCAATACTTTTTAAACCATGGTATTTAAAAGTGTGTTGTTATTGTATAGGGCTAAGTACTATTTCAGTATTCTTTGTCATTTCTGTATTTTATAGGCTTTTCTCCACCTTCGTACCTTTGCGCTAAGTTTTGTCACTGTAACCATTTGTAGAACTGTCGTTGTTACAATTTTCACTTAACAAAATGGGGAGGCGGGGCTGTTTGTATATAATGAAGGAAAAACTGGAACAAATGTCATGGTACCTCAGATATTTGACAGCTCTAGAAAACTGCTGTAAAATTGTTCTGGACTATTGTAACTGTTTTAATAACTGAAGTAAAAAAATGTGAGAAAACTTGCCTGCATTGAAATGCTGTTCTATGCTAGTTGTACTCAAGTGTAATTTTTTTAATGGTGCGAAGATTTTTTTTTCTTTTTTTTTTCTTTTTCTCCTCATTTTTGTTCCTACA
>XM_039832640.1 PREDICTED: Medicago truncatula lichenase-like (LOC25491909), mRNA 
ATGATTATTTTGTTTCTTATTGTTCTTATTGGGTTGAAGACTTCAGGAATAGGAGCACAATCTATTGGAATATGCTATGGGAGAGTGGCAAACAACTTACCTCCTGCAAAGGAAGTAATAGATCTTTACAAATCAAATGCTCTTGAGAAAGTTGGAGGTGCTAATTTGGAAGTAGTCATATCAGAAAGTGGATGGCCTTCTCATGGTGATGTTGCTGCATCAGTTGAAAATGCACAAATCTACTATGAGAATTTAATTAAGCATGTTTCTAATGGGACTATTAGTAGACCTAATCAAGCATTAGAAACTTATTTATTTGCCATGTTCGATGAAAATAAAAAAGGACCTGCTGAAATAGAGAGACATTACGATGTCTCGTCACTGCAGTCAGAGTTTGTTGTGCTCGAAAGAGCCGTAATGCTTGTTGTGCTTTGTTGTTGCAGGGATAGTTGGTCCGTGGATCTGTCCGTGTTGGCGGTCAGTTCATATACCATGTCTGAAAAGATGGGTTTGGTTTTGTTCAGATCCGTCTCTGGTTTGATTATGATGCTCGCGAATGTATTGCTCCTCCAAGATCATGATGTGCTTCGTAACATGTCTTCTAGGCTAGAAATAGTCATGTACATGTTGTCCATTGTTGTTGCGAATGGAGGGTACGGGTGTTACCGTGTTGGCGGTGCTCAGACTCGTTGA
>XR_005989539.1 PREDICTED: Vulpes lagopus uncharacterized LOC121497833 (LOC121497833), transcript variant X2, ncRNA 
GGTTCTGCGTGATTGGCCCGGGCTGCGGCCGACCTAGACTTAAAGGGACGGCGCCCTCCAGGGGCAGGAGGGAGGGAGGTGACCTGGGGAGTTCGTAGCGGGGTTGGACCACGAAGTTCCAGGGTTCTTTCTGGCGCTGGAAGGAATTTAGAAATCGCCTGGCCTGGTCCTGGTCACCTGTTCTTTCCAGAAGCCCAGAGAGACCGTGCTGCTCGTTCAGCTCCACACGGCGCTCCTCCCGCTTTCAGTGTGGCGGAAAGGCGGAGTGAGGAGTGAGATTCCCAATGTACAGAAGAGGAAACCGGGACCTACACACGGTTGCTTCCCCAAGCAGAGGACTGCAGAGGTGAATGGTGCTGGGCCACCCCCTCATCAGGTCTACTCCTCTTTGGGCTCAGGGCCCATGATTCTAGGCCTGTGTGCAGATGGAGGAGTAGTGCCTGCAAGCAGCCCTCAGTAGGCCTCCCGCATAAATACCTTGTCTCCGTGTCTACTTCAAGGATCCTGAACCCAGATGAGGTGGCCCCCGAGACAGCCATCCAGCCATGGGACCTCCTACGTACCAGGCCTGCACTAAATGAGGAGACGGGCCATAGCACATACATGACACACATAATACGAGGCGGTGCTCTGGAAGAAAGCGAAGGACAAAGGGTAGAAGGAGGGAAGATGCCATCTGTTCTGAGAGCTGTATGAGGTGAGAAGAAGCCACAGAAAAGTCTGGGTGTGGAACATTCCAGACAGGGGGAACAGCAAGTGCAAGGGGCCCTGAGGCCAAAGAATTTGAGGGACAAGGAAGCCAGTAGACCCAGAATGGAAAGAACAAGGGCCAGAGCGACAGGCGACAAGGCAGCAGAGGTGAGAGGACGCTGGTCACGCGGGGCTTGTGAGGCCGAGGAAAGAGTTTGGATTTTATTCCAAGTGGGAAGCTGATGGGAGGCTCAAGGGTGGCGGTTAGGAGGCTGTCGGCACTGCCTGGCTAGTGGAGAACTTTCTGCAGAAGGGAAGCCGGAGGCCTCGTTCTCAGGAGAGGGCAGCTGTCCTGAGCAGGGATGGTGCTGGCCCGGCGGGGCCGGGCGACGGGGGTGGACACGGGATGGAGCAGGCGGAGAGCTGACGGACGCCCCTGTGGGTTGCCTGACATGACGGAGATATCACAGGATGACACCTGCGCTTTGAACCCCTGGTTTTTATGTGACTACTTGGTTACTTTCTATCTTTTTCGTCCAAGAGAGCAGGGACTTTGTCTGCTCTGTTTTGCTCACTGCACTTAGCCTAGACTCCAGTACACTGTAGATGCTTCGTGAGTGTTTGTTGAATGACTGAATGATGGAGATATGGCATTTGCTAGGACTTGAACCCTGATCTTTTGGCTCCAGGCCCCAGTGCCTTTTCTCTCCCACCAGGGTTTTGATGAGGATCAAAGAGATAGGAGTTGTGCAAGGGGGTTGCAGGTGGCAAAACAGCCCACAAGCTGGTGGCTCTGGGGCCATTTACCAAACAGTAGCTCAACAGACTCGCCTCAGAGCCCAGCACAGGCTACAGCCTGTGCTGCCTGCAGGGTGGGCACCCCCCTAAGCCAGCCTGGCCAGCCTCCCCTGGGGAGCAATCCTGCCCCTACTCACAGCCCCTGGAGCCCACGCTCGGAGCAGCTCTGCCCAAAGAGTACACAGGTGCCCAGGCTGATGCCCAGGGGAGGGGACGGTATACTCTGCTCTTCGGACCCCAGGGGCCTAAGCCAGCCCCCCACCCCCTTCAGGAGATGTGGAGCAGATGTGAAGGGAATGTAGGCCTACCCACAGGCTCGCTCCCCCAGGCCTCGCCCCAGGGAGGCTCCTCTGGGAGACCTCTCCTTCCCCTGGGCCAGCTTGGGCCCCCCTGTTCCTTCACCCTACCTCATTGGTGCCCTGGGGCAGCTGCCTGCCCTGTCCTGAGATTTGGGGTCTCCACCGAGGCCCTGGGAGTAAGAGTCATCCTTGGCCACTGCTGGGCGGCTTTGTGGAGACCGAATCCTTTGTGATTCTCCTGACCCCTGTATTGTTCTCCCCAAGCCCTTAATCCACTTGCTACCTAGACATTCATTTGTGTGATGAACTACCTGGTGTCAGCTCTCTGGGTGCCAGGAAGCGCCTTCACCAGGAGATACCCAGCCCCCAGCCTGGGCTGGTTTTCACAGGAGGCACCCAGTAAATGTTGAATGAATGGCTGAAAGCGCTTAGCAAGCTAGGGAGCAGGAGTGATGGGAAAGTTTGGGTCATGAGGGTGGAACAGTAACTGTTCTGTCCACAGGCCGTGGGGGCAACACAGCAGGAGGCCACCAGCCCATGGCTGTGGCTGGGGTGGGGGTCGGTGTAAGCTGAGCGGCCTCCCCGCCCCACTTCTACACCCCAGCACTTAAATAACAGTAATAACAGCCTTTCCATCCATCCCTGAGTCTGTGCAACAAAATTACGAGGTGAGGACTACCGTTAATCCCATTGTGAAGATTTGGAAACCGAGGCTCAGGGAGTTTAAGGAATTTATCCAAGGTAAATAAATGGTGGGGCTGGGATTCAAATCCAGGTCTGTCTGAGGTCGGGTCCACCAGAGGGTTAGCCATGGCATCCTTCTGCTCCTCTCCTCACCTTTAAACTTCTCAGCCTCCCCCATCCACATCTGGCCTCCTCCAGACTCTGCTCTGTCCTCAGGCGCCTCTCAGAGCCTCTGTTTATCCATCTGTAAAATGGACACACTAACCCCTGCCTGTTTTGTAGTGAAGGTCCGTGAGGATGGGGATGCTTTCTGTCAGACAAGGGCTGGGCGAGCTGGCACCGAGGGAGTGGAAGCCACTGCAGGGTCCCGTCCGAGGCCACCAAGAGGGGCCGATGAGCAGGGCCCTCTCCCAGCTCTGTGGCTGCGCACGGCGGGCGAGGATTTGTTTGCAGTGGCTCCCTGGATGAATTCCCGGCAGACCTCTCCTCTTCCCTTGACATTCCTGCTGGAGGCTGAGTCTGCGGTGAAGGCCATGCAGCTTCTCCCATCCCGGACCTTGCTCCTGAGGTGGCCTCCACATTTTCCCCTTCCTGCCCTTATAGGTCTCATCTCTGCGTGGTTGCTTTAGGGCCTCAGGGCAGGGCAAGGTTAGGAGCCTCCTCTGCGATCTGGAAACTCTGTGCTTCCCTTTGGGAAAGCCTTGAGGGAAGGCAGATGTGTGTGAGGGAAGTGGTTTAGGAACCACATCTGCCCTTTATCAATCTGCCTTCCTCACTAGACTTTTGGTGCCTTGAGAGTGGGGGCTAGTTTGTGGGTTTTCTTTTGTTTTACTTTAGGGTTTTTTTTTAAGATTATTTATTTATTCATGGGAGTCTCAGAGCCCAAGTCATAAGCAGAGGGAGAAGCAGGCTCCCTCCGGGGAGCCTGATGCGAGACTCGATCCCAGGACCAGGGATAGCAACCTGAGCCAAAGGCAGACACCCAACCAGACGCTCAATGCCTGAATCACCTAGGTGTCCTGGTTTTTTTTTTTTTTTTTTTTTTTTTTAAATAAATCTTGTATTCATTCACTGATTTGTTAGGTTGTTCACAAAGGTTTATGGAGCACCTATTCTGTGTTCTGAGATCAATTCTGAGCTCTGGAGATGCAGCAGCTAAGAGAACAGACTATAGGTCCCTGCTCTCAGGAAGCCCACAGTCTAGGTGGGAGCTGGACGCTCAAGAAGGAAATCAGGCCCTATAAGCAGTGAAGAATGCCCTGGAAGGGATTAACGGGGACTGAGAGGATTACTGGAGATCCTGGCGCCCAGTGTAGGGTCTGGCAGAGAATTGGCACCAAAAACATTTGAATTCGAACTAAAGGGCCTCAAATCAACTTGTTAAGCGGCAGGATCAAGGGCCTCACCACCCCTCTCCTGTGTAGAGAGGAGCTCTTCTGGCCCACCTCCTTAGCTGCACAGCCTTAGGAAAACTCCTTCACTTCTCTGTGCTTCAGTTTCTTCATCTATATAATGGTACTAAGTGTTCCCTGCCTTTTAAGATTGTTCCAAGAACTAAATGTGCTACAGGCTTGAAAAGGGCTGAACACTCAGCCTGGAATATCTTCAGTGCTCAATAAATGAAAGGGTGAAGATGAGGATGAAGAGGATGGAAGCCAGGAAAATGGGAGGAGTGTTGGCCTGGCTCCCCTTGCTCTTGGAAGTCGGGGCTCTACTCCGCCTGGATAGGCAGTTTCAGGAATGGCCACGAGATGGTGCCCAAACACCAGTTATTCAGGAATCTTGATTTCTCCGCAGATGAAGCTGTTTAGGGAAGTAGGGGCCAGAGAAGCAGGTGCATTCTGTGTTGTAAGATGGGCTGGGGTGGGGATTTTCAGCTACTTGAAATCCAGCCCCTTCCCACCATTCTCTTCCTTCAGTTTTCTTCTTGGGGTTCCTGTCCGTGTTTGGGGGTCCAGCCCTCCCTTGCCCCTCAGGCCCCCAGCACTGGAGTCCAAGGCTTCTGTTGAGTAGGTCCTGGTTCTTGTCTACCCAATGAGGGCACCCTGGGTCCTCAAGCCATCACTTCTTCCCCTTCTCATTCACGAACCAGGCAGGGGTACTTAACTGAACACTTCCTTGGGGGCCTTGAAGGATGGAGAGCCAGAGGAAATGACCCTGTTTCTGTTCATCATATCCTGGGGGGGTGGGAGTGGGGGGAGGGGGCAGTAGAAACCGAAAGAGGGAAAAGGAAAACATGCAACAGTTACCAAAGACCTCCTTCTCATCAGCACGTAGGAAACAGCCTCATTTCACACACGCAGGAACCGAGGCTCAGAAGCACTAGGCCACACGAATGCGTTGCCCTTTCCAAGCACCAGGGGCTCCTTCGCCAGCAGCGAGGTGTGGCCCAAAGTGAGTATATTCCTAAATTCATTCCACAGCATCTACTGAGCTCTGCAGATCCAGCGAGAATCAGACCTGGCCCCTGCCCTTGGGAGCTGGGAGTCTGGAGGGAGATGCTGGCAGAGAAGCACACAAGGGCAGCTTGTCCCCGAAGTCTGTGCTGCACCGCGGTGACCCAGAGGCTGCTGTTGCTGGTGCCACCTGAACAGATGGGGGGGGGGGCAGGAGGGATGGAAGGTGTGAGAGACTTTGTAGATTCCATGGGGACCGAGGGTCTGTGGAAATATCATTTTCAAGAAGGTGAAATCATGACCCTCATACAATAAAAACAAGTGAATGCACGTCCAAGATTTCCTTTAGCTCATTAATTGACAAGGAACCAGCAAAATGTTAACACAGCTCAGATGAGGATTCCACTTCAGGCATTTACATTCTCTACTGGACAAAACTTCTTTGTGTTATGAACAGGACTCATTTGCTTGCTCTTGGGCAGGAATCATTTCCATGATTATCTGTTTTCTACAAATCGCCTCTATCCCTACAGAGTTATAAAATCAATCAAATAATCAATAGCACACAACCCTAAAGAATCAGATGATCATCCAGAGGACACGTAGCTGACACCCAGACCTCCTCTGAAAGGACACCCAGGAATCGCTCAGGCCTTTTTCCAAGGCTTTGATATGTTTTCTTGACTGACCCCAGAAGGATCGGGATAAATTAGGTAGCAGGTGTTCCAGAGGAGGCAGGTCATCTGGGTTGTCTAGTCTCAGCCTTCTGGGGTTCCCTTTCGGCTCCCAGGAGACAGACTTCCCAGTCCGGGGGGAGCTGGCCCCGCTCAGTGCCCACCAGCAGGTGGCGCCGAGGCAAATTCGCAGCAGGAACCTAGTGGGTTCTGGGGCTGGGAACAGGGGGGCAGCTCCCAATTTTCCGCCATTCCTGGTCTCCAGCAGTCAGGTTTCACGATTTCAGAATTTCAGAGGGCCCTTCCCACCTAGAGTTGTTGGTTTAGTCATTCACTGATTCAGTTTTGTTTTTTTTTTTCATTTGACAAACGTGCCCAGGCCCACAAGTCAGGTTCCCGAGTTTCTCCTTCTCCAGACAGAAACTCACAAGTATCAAAGAATCAGTCCTTGTCTTTGCTTGTCTGGCTTTGCTGCCAGGATTTGGAGCCACCTGAAATTCTGAAATCTCACTCCACCCCACTCCTGCCCTGCCTACCAGGGTGT
>JQ061302.1 Uncultured Pneumocystis clone CS13 large subunit ribosomal RNA gene, partial sequence; mitochondrial 
TGTGAAATACAAATCGGACTAGGATATAGCTGGTTTTCTGCGAAATTTGTTTTAGCAAAGAGTTTATAATAACATTATTAGTGGGTATAGCACTGAGTATTTTTAAGAAGGAGTACTAGTAATACTTATTTCGAATACTTAATCTCAAAATAACTAATAAGTAATTAAAATAAGCTTTCAAACTATATGCGATAAGGTATATAGTCTAAAGGGAAACAGCCCAAAACAGTAATTAAAGCTCCCCAATTATTATTAAGTGAAATAAAGGAAGTTATTCTTTTGAGACAGTCAAGAAGGGGGCT
>MF242562.1 Uncultured bacterium clone denovo36630_N25_23851 16S ribosomal RNA gene, partial sequence 
ACCAGACTCCTACGGGAGGCAGCAGTGGGGGATATTGCACAATGGGGGGAACCCTGATGCAGCGACGCCGCGTGGGTGAAGAAGCGCCTCGGCGCGTAAAGCCCTGTCAGCAGGGAAGAAAATGACGGTACCTGAAGAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGGGCGCAGACGGCGATGCAGGCCAGGAGTGAAAGCCCGGGGCCCAACCCCGGGACTGCTCTTGGAACTGCGTGGCTGGAGTGCAGGAGGGGCAGGCGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGGCCTGCTGGACTGCAACTGACGTTGAGGCCCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCGGGTACC
>XM_044441890.1 PREDICTED: Varanus komodoensis zinc finger SWIM-type containing 5 (ZSWIM5), mRNA 
AGATTAGGTTTTCTTTCCCTTTGTGTGTGGCAACACCTGCCCAGGGAGTCTGTGTGTATCAAAAGAGCAACAAAAAGTGGGTTTAATTGCATGCATCTTCAGTGGAGGCTTTCTGGCACTTACAGCACAAAAGGCCATTACTGAGCTGTTTTCAATGGAGACTAGGAGTGCAGGACTGAGAAGAACTCTCCACTATTCTCACAGGCAAGCAAATCACTTTACAGGAGCATTGTCATGTGGAAATGAGTTCATGAGCCCATCTTCTTCCAACTGCAAGGTCAGGGAGAGAGCAATTGTCAGTTTCAGCTGGCTGGAGCAATTGATCTGTTTGCTTGAAAATGTTTGCTTACCTCCCTTCCCTGCTGTGCTAGTATATAGATATCTCTCTGTGTGTGTCTGTGCACAGGCATGTGTACACTCCACCATATGCTGAATGACTGAAGTTCATAACTATATGTTAGCAGTTGCTTACCATATGACCATTAGTGTGTCATAGGGATGTACAGTTTTTGTTAAATCCATTCCATCTGCATTTCACAGATTGTGAGGTACTTTTCAATCTCTCCTCCATTCTCATTGACAGTGTGTGTGTGTGTGGGGGGGGAATTGTTACAAGTTCCTGAACTTCTTGCATACATGTGCTTTTTTGCAAATCTCCACTGTTAAAAATGCACAACCTCCTCCAGAATGTGCATTTGCATGCTTTAGTATGCGGGGAAATGTGCTTCTTTTCTTTTTCTTTTCAACAGGAATGTTTGTGCAAAATTCTGAAAAGTAAAGTAGTGGTTCACAAGTCCACAGAATCCATGTGATTCAGAAAGGGCTGGTAGACTGCAGAATCTGGGGAATCCTAGAAATCTGAACTCATTTAAAACCCATGGCAGGTTCTCCAATATCCCTAGAGTGTTATAAATAACTAATAGTACAGCAACCTTAATTTAATGCTAGTTAAAGCTCTTTTTGAAGAGGGAAAATCATCAAGGTCCCCCACACACATCCCCAGTCAGGCTTTCAAATATGTTTTTGGATCATGGTCAATACTGTCAGTTCCTGTGTTAGGTGTGTGTTCTTTCCCCACATATTTGCATCTCTGAAGAATTATGGCTTCTCATCTTAAGATGAAAGGCTCAAACAGTGATGCAGCTTTGGCTGGACTCTGGGGCCAAAGTCCAGGGCCCTGCATTCCAGGAAGGCCTGAATAACCACCCAGAAAATGTCAGGTGATGAAAGTCAAAGAAGCAAGTTCCATGTTATTCCTGTAGTCACGATAATACAAGGATTTCAATATATTTTAAATGCAAAACTGCACATGCTCTGTATTTTATTACTATTTTTATTATGGAGGGCAAATAGCTTTTTCATTGTTCTAACACAGCAGGTGTGCAGAAGCAGTTGTAAAGCGTGGAATAGTGGTGGTGAAGGAGGAGAGAGTCGCATGCTTCACAACTTGAAGTAATACAGCCATTTAAAAGGGGGACATAATAAGAACTGCTCTCACTCTTTGGCCTCACAGGGCATCCTGAATTGTGCTGCTGGTCAAGACTTTTGTTCTAAGATGAAAAGCTATATTCTTCAGATATTCAAATATGCGGAAAAAGAACAAACAAACAAGAATCTAAAATGACTAAGCTGCACCCCTGTCTCAAACCCAGGCAAACCATTCTCCAGATAGCTCATGATGTCCCATGATTGACCTTCACTCTGGTCTGGAAGAGTGATGTGTTTAGGGAAGGGGAAATGCTGTTCATTTGTCCAACAGAAAAGAAGAAGCTGGTAAAGTCAGAAAGAACCATGTGATCTTAGCCATTCATCACTACCACATTTTCTTGGTGTCAGGCAGCTTTATAATCGGACAGCAAGCTGTTATGCAGCAGACAGTTGAAATTGGGTTAGTCTGATTAGATGTGGGTGTTTTGGAGCTGGAGGCTGAACATGCTCAGTAAGATGATATGCTACCTCAGGGTGACAGAGAAAGGCAGAAAGCCTCTTTGTTATGGAGCGGCAGCACCTTGCTGGAAGCATGCTAGAAAGTATCAGCAATGCCTGCTAGAAACAAAATATATGGGGCACAGCTTTCTGCAATATTTTTTTAAAAAAAATTCAGATTCTGTAACAAAAAGAAACAAATACTGAGCAGCATGTAGCTTGCTGCTTCTAGAATTTATACTGCTACTACTTAAACAGCCCCACAATTTGGATAGCTTTAAAGGGGATGGGACAAATTTATGAAGGCAAAGCTATCTGTGGCTACTAGTCCTGGTGGTTGTTTGTTACCTGCAGTATCAGAGGCAGTGTGCCTATGCACAGCTACTGTTTGCTTCTGTTCTTTAACCAGTTACTGATCCATGAGAGGACCATGATGCTAAGTTTGTTCAGGAACCTTTGGTGAAGGACTTCGTGAAAAGTGCTAGAATACACTGCCTGATGAATTGTGATGTATCATTCAACAATTTGAATATGTCAGTTCTTGATTTAGGATACAGCCTGCCTCCTACTGACAGCTCAGGGCAGACATCCATATTCATCTGTAAACATAAAAACAGAAATTTAGATAAAATGAATAGAGCCTAGCAAATCTTAGAACACTACCTTATATATCAGGTGCTTTTAGGCATCCAAGGAAATAAACTTGTACCAGATTGGGGAAGCGAGATAGAAGAGAAGCACTTCATTCCCCAAAGCCAAGAAATTATATTATTTATGAGTGAACATAATGTCTTACAGAATAGCACCAACAGAAAACTGGTATCTTTCTCGAAGTGCTTAAAATCTAAATTAAGGCCACAGCTTTTGCAGGTGGGCAAAGAGAGAAAACAGAATGAAGGCAATGAGAACAATGGTGTGAACCCTCTACCTTTTTCCAAAAGTTCAAAGTAAGTTGTTGCCAACTTAATTTGCACATATGTTATAAGAATCATGAGAACAATTGGGATAAAAACTGTTTGGCATTCTGAATTGTTTCCTTCTCTTATATTTCGTATTTGAAAGTGTCCAAATTTGGCCAAATGCACATATTTCTAATTATGTAGTATTTTCTAAGCCCCATAATTCAGGATACTCCATTATTCAGCCCCATAATTCAGGATACTTGCTCATTTTCCAGACATTCACACACCACTCACCACTCACCAGGAGACCATTCTTTTCCTACATTCCATGTTGTATATTTGGGAAACAAACAGGCTCAAAGTATTATCGTGGCATTTTAATTCCATTCTTCTTTGGCATATATGCTTCCCTCTTTTATACTCACAACACCCTGAGCTAAGTTAGGCCAACCAGTCTAGATTTTACTGAAGAGAAAGGTATTTAAAAATAAAATTACTAAAATAAAAGACAATAGTAACAGGCTCAAGCTTACAGTAAGTTTCACAACTGAGTGAAGAATTGAACACAGGTTCCCATGGTTAAAGTTCAGCGTGTTATCTGTTACAGCACACTAGCTCTTACTACTGCTTTGACAGCTGCATCTGTAAGTGTTTACTGAATGAACCTGCATTGTTTCACTTTCAATGAACTTTTCTTTCCTGTACCAGATTCACATTTCTGGGGCTTGAAGTACCTGACAGCCCAGTTTTCTTTGTGGGAAGTATGGTTGGGGCAGTAACCTTTCGTAAAACATGTATTCCTATATTGGCTTTGCTAGTGATTATTCAAAAGTATGACTACTGAGGCAGCCAGTTGAACAAAAGCATCCCATGTACTCATGTAAATACTTCAGATAAAATAAATATCCTGATGAACTTTTTTCCAGAGCAGTGTTTAATCTTTGGCTAAACATTTGATAAATATTTTACATTTTTTCCTAGTTGATATTAAATATATGTGCTGTCATGAAAGCTAGAAATTAAACTAATGCTTGATTTAAAGCCTAAACATCAGATAAACTTGGCAGACTCCAGAGATACTTGCGCAAGACGTGAGTTGTGTCCCTTTCCCCTTAGACTGTTTTCCAGCTGTCATCAACACCAGACCAAGATATTTTAAGGTAATTTAATATGCCTAAAAGCCAGTGTTTAAAATGGAGCAGCTACTCAGTTGGTTCCTGGTCTATTTTTCTGATTTGCCTGCAGACACAGATCACAGAACAAGGTTTATACTTGGTTTGGATACTGGTTGGAGAATGAGAAATAAGCTGTGGGCTTACACACTTTGCTTTCCCTTTGCAAGTAGATTTCTTTCCTTGCCCCCTGGCTTCTACCGCATCTTCTTCATTCTCTAACAATCAGCCCTTCTCCCATCCACCTATGAACCAAACAAATGCATACAATATTTTACTTTGAATGTAATATATGCAGGTATTGATGAATGGGAGGCAATTAAAGAGGAACTGATTGAATTTTGCAGCAGAATCTGGATAGGAATTGGGAAATTAATTGAGGTGATATCCTGACCCATCCTTGGCTGGCTTTGTAATTTTCAATAAATAAATACATAAATTTTAGGGATGTGTGTAAGAGGACTTATTTGGAAAAGTTTCCCAAACATTGTTTCTTGTTTGTTTTTTCACTTCTGTTCACAGCCATTGCAAAGTAATTTAAAATAGTTGATGCACAATTTAGCTAATTAAAAATTATATGGTTTTATAGTTGATTAACCAACTGATAAATTGCAGCCCTTGTATTTGTACAAGCAGACAGTGTGACTATGGCCAAGATAACTATAGTATCAACTGAGGTATTGTCAACTTGGTAAATGTCTGTAAGTTTCTATCCCTGATCAGATGTAGTCTGTAGGCTACCCAGTATAGCCTTAAGGGACAAGAGCCTCCACGACTCTGGCTGCTCATTTGCATGAAATATTTCTTTATAGGTGGTAAGGATTTCAGTTCAATTGCCAGTATTAAAATATGAGTGGAAAGAAATCTAGTAATGTGGCTAAAGATTATTTTTCAAAGAACAGGTAAAATATAAATGCCTTTGAATTTTTGCCTTTTTGAGTGTTATCCTTTAACAAAAATTCTAATAGAGACTCTAGAATGAAATTGCTAAATTAGAAATTATCAAAGGTTGGATTATGTTGGGTTAGACCTGATCTGAGATATTGGTGGGGTTTACATGATCATGAGGAGAAGAAACCACAGTGGCATCTTTTCCCTGCCACTGTGCAAGGCAGCCATTCCTACGCAATTATGGTGTGTGGGTTGCTCTGTTGTCCAAGCCCAGTGGGGCAGCTTTCAGAGCATGGCTTGTTGTAGGTTTCTGGGGTCGTGGTGAAGCCACGTCCTCCTGTGCACCTTGCTTGATTTGGGCAACACAGCAATGGATGTGCTGTGAGGGTAGTTAGGTAAACTGTGCAGCGCACAGCTGTGTCTTATTTTTCCTATGATCTTGCCACAATAAAAAATCTACTAGTCTTTAATGTGCTACAAGTCTGCTGCTTTTGCTCAGCAGACCTTTTTTAGGATTTGTATGATGAACACCTCACAGGAAGAATGGAGCTCTTGGCTAAGATTTTCTTGTATAAAATGCATACCTTTGTTCCTATCTGCTCATGAAGAATCATACAATGGGATATCAAGAGAGGAAAAGAGAGGAGAGTGAGGCTGTTGATGATAATGTTACGGAGTCCTTTATACTGAGCTGTCTTTACCCTCAGCATGCAGTATCATTATGTAGGGGTAAAGAAAGGAAGTTGCTCCTGCTGTTGCAAAGGAATAATTGTACAGAACTGGGAGTTACCATGCATATTGGTTAGAATGAATTAAATGAAGAACATGGATATGTTGATTGGACAGGTTTTGAATGGAGGTGGTTTTTTGGGTATATTCCTGGTTTTTAGATCAGTCTAAGGAGTCTATGATTTGTTTAGAAGGCCTTTAGAAAAATCTAGTTCCTAAAGCGAAAAAGAAAACCCCTCTTAGTACTTAATCAGATCTTGATGTGGGTTTTGGCATCACTTTAAAGAAGATGGTTTTGATACTGTTGATTAAAAACTTCTGGTAGAATTTGACTCAGAATGGTTGTGCTGTTTGGCAAGCACACAAGGGCTATATGCAGTTAATGTAGTTAAATAAATTTTCTCTTTTGCTGTCTGTAAGCCTTTCAGATTCCTCTGGTATGAGTTAACATTTGGAATCATAAAAAATTTCTAGCAGTATAGTCAATAGTCATCTGAGAGGAAAATTACAATGTGGTTGAACTTGTGCGGTGGGAATCTGGACTCACAGATAACTTTTTTTCCAATCATATTTTAAATTTAGGGAAGTCATCTGATATTTCACCTTACTGTTTTCATATTTAACTAACTGGAATATTAGATGATGACTATTCTGTATCCACACATTTTGGGAACTATTTTCCTTACATTTTGTTGGTTGGAAGCTGGTGTGTTGAAATATTAGTGAATTTTCTGCTATGAATTGTGTGAATTTTCTGTTGACCACTTTGGAATGTCTTGGCTGTCAGTCTTTCCCTCCTTCTTTAGGACAGCCAAGACCTGCATGCCACATTAACAAACATTCCTTTGCAGTTACCAGAACTGAAAGCATCTCATTTAGTTCCTTTGAGAGCCTAGTGGGTTGAAGAGCTCTTCTCAAGGACTGTCTTGATTGCATAAGATGATGATCAAGTGTTGGTACCCCCTTTTTTCTGGATCACCATTTATTTTGACTGCTGTCTCTCTAAGCATGTGGATCTGTGCTGTGGAGTAATGCTCCAGGATAGCGTCTATGTACCTTATACAATACTGGTACAAAGGTGAATGCCATTTTGGTCTGTATGTATCCATGATCATGGTCTCTAGTTCTAGCCTCCTGTAGTAAAGATCCAGGAGAGAGTAACAGCATAGATTTTTCCTATTACTTTTGTCCTGGTAAAATAGCAGTTGAAAACTGGGTTTTCAGAGTTGGGGTAGGAAAAGAAACCACAGTTGGACCTTATTTCCCCACCTGGGCCAATTGCATACTGCTTCACTTCCATAATTATCCATGCCAAATGTGGGTTGCTGTGTCATCCAAACCTGATTGGGGGGGGAGGGGGGAATGTTCTAAAGCACTTGAGAACCCTAGAATAAGCAAGGTGGTTTGGAAGTCATCTCTGTGGGTCTGGTCAAGCCAAGGCACCTCCCTTCAGATTCAAGCATGCTCAGAATGGAACAAAACCACTTGTCAAGAAATGATATACAGTTTATGAATACAATGGTGAAATACGGATGCAAAACATAAACTAGCAAACAAAAGATTATAGTCCCCTTATTTGTGGCCATTTGTTGTTGTTCCCTAAGTAGGTCAGGGATGCTCCATGGGCTTCCAGAATTGCCTGAGTGAATGACTCATTAATTCTTCTCTTCAAGCCAAGAACAAAAGATAATGCCTTTTGGCACAGATTTTATAAAGTTCTTTTCTCACCTTGTTTTGTAGGCTTTCAGTACAAACAGCTTTTAATTTCATTCCTGGGAGACAAGAAAGGACAAAGCTGCTACAATAAAGCAACAGTTTTTGTTCTTACAGTAAGAGCAGGGCTTATCTATTTATGTTTGCTGTTATAACCTTGCATTTCTTATACAGATGGTTGTTAAATTTCCTTGGAGTTGTTTCAGTGCTTCCTTTATCTTAAAGTTTCTACATGGCTTTAATATTTATATATTACTTTCCTCAAGAGTATATAGGCATTTATGTTACCTCAGTAATATATAGAAATCTGTATGGTAGGATTGAATTATTATTCCTAAATTGCAGATGTGATAACTGAGATTGAGAACAATTTGCTTAAGGGCTAATGTAGACATCTTGGCTGCAAGCCCATCTGTTACAGTGTGGATCGTGCAGCTTTCTCATAAATCAGGGGGGGAATTAAGCACAATTTGACATGGGTGGATAAGATGTATGCTCAACTTTCCTGCTACTCTTTCTCTGCTGCCATTTATTATTTAAAATATTTATATGCCATCCTGTCACGAAAGCCTCAGGACAGCTTACATATATGAAATAACATAAAATATAACATAAATATTTATTTATTCCCCTTCTTGTGGCTGCAGTGTGGAAAGTAGCCATCACTGGGAGGAAACATCTGAGAAGAAGCATTTTTGTGTGGAAGTGTACTTTATGGAAAATTGATATGATCTACATTGTAGATCACTTACTTCATTGTCCACGTTCTTAGATGGAAATACACAGAGAATTGTGTTTTTCACCTGGAATAATGAAGGAAAGAAGACATTATCTACAATTTTACTTAAATTGATTGAGGTCTTGAAGGGAAGGGCTGCATAAATATTTTAATGCAGTGTGGTTTTGCTTTCGTATTTGCTAAAATGCATTGGTGCTCTTTCTCACTCAGTTTGTGTCCATTACACCATCACAAAATAAAGGGTGAATATTTTTGTTTCTTTGCTTTGAACTGTACCATTTTCTGACACAAAATAATTTTCTGTTAAGTTTCTGAGCCATTCTAGATGTGTCTTAAGATTGGGTCTGCTCAGCTGCAGCATTTATATGTCATGGGAATGAATATAGACTATTTTACCATAGCAAGTTTATATATAATTTTCCCTAGATTTGTGTTGTCTTTGTTAGTGAGGCATTGTACTTTTTGTTCTTTTTCCCTAAGAGCACAATCTTATGCAATTTTATAAAGAAAGTATAGACTGCTGGGTGGGGCATGCTGGATGCTATAGGCCTTTTTCTGGCTAAACTTGCATAGGCTTGTGTCTTAAAGCAATGAAATATGAATTGATATGTTGCAATGTTGTTCAACGGCAATTAATGACCTTTTAAATCAGATTTGGTGGTGTGTTATATTTTGCATGGATATCTGGCAGTTGACTGATTTTTGCAAAGCCTACCTTTCCCAAAAATACTAAACCATATTTTCTGGCAGAGAAAATGTCCAAGATGCAGCATGATATTAAACCCCTTTTGCCATCAGATGAAGTATCTCTCAGTTGCAGCCAATCCTTGCTTATTTGGCAATAAAGGACTGGAAGGAATGCAGTTACGTTACAGGGACATGAGACTGAAAAGGGAGCAACCACTCTTTTCTCCAAAAGTTTAATGAATTTGCCCATGGGTTTGATAGTAGCTGAAAAGTCTGAGACAATTTTGGAGTGGGTCTTATGCTAGTCCAACTGATTTGAAAGCAAATTGAATATTTTACATTCCGTTGAGTACTACAGTTCATTCAGCTTGGAATCATTCTAAGCTGGCTAAAGAATGCAGAATGTGACTGTTCAACTGGAAGCAGCCTTCATGCTGGGTAGATAATTTTCTTGAGCCCTGAATATATTTTGGTTTTGGAGAGAGGGTACTGCTGCCAGTGGCTATGACCTGTCTTTTGTGCTCAACAGTTTCAAGGAGGGTAATGTGTGCATTCTTGTAAGCATTATTGAAGCCTGAGCTTAGTGGTGTTCTATTAAGATGAAGTTTCCTTGCAAAGCTAAATATCCTTCTCCCTGTTTTATTCTCCTTCTCACAGGATTCCACCTGAGTGGCACAGTTACAGAGCCTGCTACTTCAGCAGAGCCAGAAATGACCTATAAAGTGGCCATCAGCTTCGACCGATGCAAAATAACTTCCGTGACGTGTGGTTGTGGGAACAAGGACATTTTTTACTGTGCTCATGTTGTGGCACTCTCGCTGTACAGGATACGAAAACCTGATCAGGTCAAACTCCGTCTTCCTATCTCAGAGACCCTTTTCCAAATGAACAGGGACCAGCTCCAAAAGTTTGTTCAGTATTTGATCACAGCCCACCACACTGAAGTGCTCCCAACAGCTCAAAAACTGGCTGATGAAATTTTGTCCTCCAACTCTGAAATCAATCAAGTTCATGGTGCACCAGACCCCACTGCAGGGGCCAGCATTGATGATGAGAATTGCTGGCATTTGGATGAGGAACAGGTGCGGGAGCAAGTGAAGCTGTTCCTCTCCCAAGGAGGGTACTATGGCTCTGGGAAGCAACTCAATTCCATGTTTGCTAAGGTCCGTGAAATGCTGCGCATGAGAGATTCCAATGGGGCCAGGATGTTGACACTAATAACAGAGCAGTTTATGGCAGACCCACGTCTTGCTCTTTGGAGACAGCAGGGAACAGGCATGACAGACAAATGCCGACAGCTCTGGGATGAGCTGGGGGCGCTGTGGGTGTGCATTGTGTTAAACCCACACTGCACGCTGGAAGAGAAGGCATGCTGGCTGCGACAGCTCCGGAAGTGGGGAGATATGGATGTTTGCCCGCTGGAGGATGGGAATTATGGCAATGAACTTCCCAACATCACTAGTGCACTTACTCAGAGCTCCAGTCACAGGCAAAGCTCTTTAGCAAGGCCGAGACGCACAGTGTTCACTCGTGCCATCGAAGGTTGTGATCTGCACTGGCAGGATAGTCACCTTCAGCGGATAATCAGCAGTGACTTCTATATTTCTCCCTCTTACCAAAGGGATGGAGAGGGCCTTCTCTTCAACTCGCAGGGGCAGCCATTGTGGCTGGAGCATGTCCCTACAGCCTGTGCCCGTGTTGATGCCCTTCGTTCACATGGATACCCCAAGGAAGCACTCCGTCTCACTGTAGCTATAATCAACACCCTGCGATTGCAACAGCAGAGGCAGCTGGAGATATACAAGCATCAGAAGAAAGAACTGCTGCAGAGAGGAGCGACCACTATCACAAATCTGGAAAGTTGGGTAGGGCATCCGCTCAATCCCATTGGCTGCTTATTTCTCACATTGACCGAAGCATGCCGAGTAGAAGACGAGAACTGCCTTGAAATTTCAGATGCTGGTGACCCGAAGCCTCCAGTGTATCAACACGTGCCAGTGGCCAATGGCACTCCTGAGAATGGGGAATCCTACCTCTCCCTAGCTCTGGAAGTAGCACTGATGGGAATGGGGCAGCAGCGGGTGATGCCCGAGGGCCTTTATGCTCAAGACAAAGTGTGGCGGAATGAGGAGCAGATTATTGCCTGCCTGCAGGAGCTGGAGCTGGATGCCGTGCTGGTGCAGACACTACGCAAGCAGTGCATCCTGCTCCTGGAAGGTGGCCCCTTCAGTGGCCTTGGCGAGGTGATCCACCGAGAAAGCGTGCCCATGCACACCTTTGCCAAGTTCCTGTTCTCTGCCTTGCTGCCCCACGATGCTGACCTAGCCTACAAACTGGCACTGCGTTCCATGAGACTTCCTGTTCTGGAAACAACTCCTTCAAGTGATGTCACACATTCTCACCATCTGGTTTCAGTGGTGCCTAGTAGGTACCCACGTTGGTTTACTCTGGGACACTTGGAATCACAGCAGTGTGAGCTGGCTTCCACCATGCTGACAGCAGCCAAAGGTGACATGCTGCGTCTACGGACGGTCCTGGAAGCAATTCAGAAAAACATCCACTCTTCCTCCCTGATCTTCAAACTGGCACAGGATGCCTTCAAGATTGCAACTCCTGCTGACAACAGCTCTGACACAACCCTGCTCAATGTGGCACTGGAGCTTGGGTTGCAGGTGATGCGCATGACCCTATCAACCTTGAACTGGAGACGGAGGGAAATGGTGCGATGGCTGGTGACCTGTGCGACAGAAGTGGGTGTTCGGGCCTTGGTCAGCATACTGCAGAGTTGGTATACCCTCTTCACCCCCACTGAAGCCACCAGCATAGTAGCAGCGACAGTGATGTCTCATAACACCATCTTGCGCCTCAGCCTGGACTATCCGCAGCGAGAGGAGCTGGCCAGCTGTGCCCGTACACTGGCCCTCCAGTGTGCCATGAAGGACCCGCAGAACTGTGCGCTCTCAGCCCTGACTCTGTGTGAGAAAGACCACATCGCCTTTGAGACAGCCTACCAAATTGTCATAGATGCTGCTTCCACGGGCATGACTTACTCGCAGCTTTTCACCATTGCACGGTACATGGAGCACCGAGGGTACCCACTGCGGGCCTTCAAGCTAGCCTCGCTTGCCATGACGCACCTCAACCTTGCCTATAATCAGGACACACACCCTGCCATCAATGATGTGCTTTGGGCATGTGCACTCAGCCACTCCCTGGGCAAGAATGAGCTGGCAGCCATTATCCCGCTGGTGGTGAAGAGCGTTCACTGTGCCACTGTTCTGTCTGACATCCTACGGCGCTGCACCATGACAGCACCTGGTCTGGCAGGCATTCCTGGCCGCAGGAACTCTGGGAAACTGATGTCAACGGACAAAGCACCTTTGCGCCAACTGCTGGATGCTACAATAAGCGCTTACATCAACACCACACACTCCCGGCTCACCCACATCAGCCCTCGGCATTACGGAGAATTCATAGAGTTTCTTAGCAAAGCTCGGGAAACTTTCCTGCTGGCTCAGGATGGCCACATCCAGTTTGCGCAGTTCATAGACAACCTCAAGCAGATCTACAAGGGCAAGAAGAAACTCATGTTGCTAGTGAGAGAACGGTTTGGATGAGCTGCTGCACGAGGAAACCCTGATCCCTGTTGGTGGAATTACGCTTACCAGGCAAGACTGATGGAGTTTTCCATTCAGAGAAGATTGGACTGTAAACCAAAAGCAGCATGGCAGGAAGGGTTTGCGTCCTACCTACCATTCATTTGCAAACACCTCGGCAATACCAAAAGCTAACTAGGAAACTGAATACCTCTTTCCCAAAGGGCATGGCAAATGGAGGCTGGAAAGCAAACCCCCACC
>XM_031777163.1 PREDICTED: Contarinia nasturtii U1 small nuclear ribonucleoprotein 70 kDa (LOC116346891), mRNA 
GTCCGACGACCAACGAAGACACTTCACAGCAGATATTCATTGCGAACGATACATTGTAAAAATGTATCGGTAAAAAAGTAAATTTGGAAATTAACCAACTCGTTCTCAAAAGTTACAAAGAAAAAAAAAAAGAGTGAAAAATCTGTCATTTTATGCAATATCAACGAAAAAGTGCACTTTTAAAGTGAAAATTATAAAATATTAGTGAATTGCGTTGTTTGATACATCGACATAAACATTAGCACAAGAAAAGAAACATTCAGATCTTGTGTCATTTGAAATTGTTTTTCATACGCATACTGCGAATAGTTTTGAAATAAAGACGACGAAAGGTTTATTCAGAAATGACACAATATTTGCCACCAAATTTATTGGCACTATTTGCTCCACGCGATCCATTACCATTTCTACCACCACCCGATAAATTGCCACATGAAAAGAAAACAAAAGGTTATTTAGGCGTTGGACAGTTTTTGTCGAATTTTGAGGATCCTAGTGAAACTCCGCCACCAACCCGTGTTGAAACACGTGAGGAACGTTTAGAGCGACGTCGAAAAGAAAAGGCTGAACAAGTTGCTTATAAATTAGAGCGTGAGATCGCCATTTGGGATCCAAATCAACTTCAAGATGCCACAGAAGATCCCTTCAAAACATTATTCATCGCTCGTATCAACTACGATACCTCGGAATCGAAACTGCGTCGTGAGTTTGAAGTGTATGGGGCAATTAAAAAAATTGTCCTAGTTCACAATGTTGACACAGGAAAGCCTCGTGGCTATGCTTTTATCGAGTACGAACATGAACGTGATATGCATTCTGCGTACAAACATGCTGATGGTAAGAAAATTGATGGTAAGAGAGTATTGGTCGACGTTGAGCGCTCAAGAACGGTCAAAGGATGGCTTCCTCGTCGTTTAGGTGGTGGTTTGGGTGGAACAAGACGTGGCGGTCCTGATGTAAATATTAAACATTCTGGACGAGAAGACAATGACAGAGAACGAGAAAGATATCGCATGGAAAGAGAGCGTGATGATTATAGACGCGACTTTCGAGACAGAGAACGACGTGATCGTCGATCACGGTCTCCGAAAGTTCGTGACCGTGTTAGAAGTAGAAGTCGAGATCGCAAAGAACGGAAACGACGACGATCAGAGGAAATTGAATACGAGAGAAGAGACTCACGTCGTGATCGTGAAAGAGAAAAGGAACGTAAACGTAGTAAGCGATCGAGATCCCGAGAAAGAAAGCGAGATAAACGTGATAAATCACGTGACAAACGCGATAAAGAGCGTAAAGAACGAAAACCAGAATATGGTGAAATTAAAATCAAAGAAGAACCAGTTGATGATGATTATCCTGACTATAATTCACGTATCTACAGTTCATACGGAGCCGAAGTCAAGTATGAAGATGGCGAAGAACAGAAATATCGACCGCAGGAAAACAATGGCCAGTACGGACATAATGACGATGATGACTATGATGACAGAGGATACTAAGTTTTATAAGTTTTTAGCGTGTAGCAGCGGAGCTCATACAAATGCGTTACTGTCAATTTATACGGTATTGAAGTAACGCAATATTGAACTCTCCACAATTAATATTAATCAAGCAAAAATGATTCGATTAATTATTAATTTTTATTTTTATTTTTGAATCTAAGAAAAACAAGTTAAATGCTCCGTAAAATATTTCATTTGCGCTACTTTTATCTCGCTTTCGTTCTCCAAAATATACAAAAATCGTTTTTTTGGTAGGTATACACAAGTTAATTACAATTTTCCTATAAACAAACAACAACAAAATTAATAACTTTGACAGGCGCTATGATTTGTAAATTTTATTAATCAAATGTTATTTTGCAAACGGAATAAAGTGAACGAAAACGGCTTTTGCAGTGGCAAACACAATAAAAATTACAAACATATTTTCA
>XM_047789246.1 PREDICTED: Phacochoerus africanus adenine DNA glycosylase-like (LOC125132267), transcript variant X10, mRNA 
GCGGGGAGGGAAGGGGAAGGCGTGTCCTCGGCAGCCGTCAGGCCAAGTCCTCTGTCGCTCGTGAGATGTGGCAGAGGTCACAGCCTTCCGGAAGAGCCTGCTGAGCTGGTATGACCGAGAGAAGCGGGACCTGCCCTGGAGGAGGCTGGCGGAGAGTGAGGTGGACCCCGACAGGCGGGCATACGCTGTGTGGGTGTCAGAGGTCATGCTGCAGCAGACCCAGGTGGCCACGGTGATCAACTACTACACCCGGTGGATGCAGACGTGGCCGACCCTGCGGGACCTGGCCAGCGCTTCCCTGGAGGAGGTCAACCAGCTCTGGGCTGGCCTGGGCTATTACTCTCGAGGCCGCTGGCTACAGACAGGCGCCCGGAAGGTGGTCGAGGAGCTAGGAGGCCACATGCCACGAACAGCAGAGACCCTGCAGCGGCTCCTGCCTGGCGTGGGGCGGTACACAGCCGGGGCCATTGCTTCCATTGCCTTTGGCCAGGCAGCTGGTGTGGTGGACGGGAATGTAGTTCGGGTGCTGTGCCGCGTCCGAGCCATAGGTGCTGACCCCCGCAGCCCCCTCGTCTCCCAGCAGCTCTGGAGCCTAGCCCAGCAGCTGGTGGACCCAGCCCGGCCAGGGGACTTTAACCAGGCAGCCATGGAGCTAGGGGCCACGGTGTGCACCCCCCAGCGCCCACTCTGCAGCCAGTGCCCTGTGCAGAGCCTGTGCCGGGCGCACCAGAGGGTGGAGCGGGAGCAGCTTTCAGCCCCCCAGAGCTTACCGGGCACTTGTGACATAGAGGCGTGTGCTCCCGACACCGGACAGTGCCAGCTCTGCGCACCTCCCACAGAGCCCTGGGACAAGACCCTGGGAGTGGCCAACTTTCCCAGAAAGGCCAATCGCAGGCCCCCCAGGGAAGAGAGCTCTGCCGTCTGTGTTTTGGAGCAGCCCAGGGCCTTTGGAGGTGCCCGACTTCTGCTGGTACAGAGGCCCAACTCAGGTCTGCTGGCAGGACTGTGGGAGTTCCCGTCTGTGGCCGCAGAGCCCTCAGAGCAGCTCCAGTGCACGGCTCTGCTGCAGGAACTGCAGAATTGGGTCGGACCCCTCCCAGCCACCCGCCTCCAGCACCTGGGGGAGGTGGTCCACAGCTTCTCTCACATCAAGCTGACTTACCACGTGTACGGGCTGGCCCTGGAAGGACAGACCCCGGTGACGGTCCTGCCCGCTGACGCTCGCTGGCTCACCCGGGAGGAGTTTCACGCCGCAGCTGTCTCCACAGCCATGAAAAAGGTGTTCCGTGTGTATGAGGGCCAACGGCCAGGGACCTGCAAGGCTTCCAAAAAATCCCAGGTGTCTACCCTGTCCAGACGGAAAAAGCCCAGCCCAGGCCAGCAAGTCCTGGATAATTTCTTGCGACCCCACATCCCCGCTGATGCACCCAGCCTCGACAGTACAGCCCAGTGATGCCTCTGGAAGTTCTCATCCCCTGAGAATCTTGTTTAATAAAGTGCTTATTTTTGTAATCA
>XM_007261321.1 Fomitiporia mediterranea MF3/22 uncharacterized protein (FOMMEDRAFT_143842), mRNA 
CGAGTGGTTACAATATTATGCGCGATGACATCGCACTGCTCGAGGTGCATGAGAAGCACCCTCCGTCTTTCTCAGCAAATCTCTATCCTGACTACTGGACTCTCAATCACGGACCCAAGTTCTCATATAATAATTCTGTTTCGTCAATTCTGGAAGATATACGGGCCTTCAGGATACCTACTGACTTCATTAAAGTTTTCGACGAGGCAGGTATACAGTATTATAATGGGTGCTTAATTGTTGAACTCTTGGATTTCCGACCTGCAAGGGCGAAGGAACCAGTACTGGAGAAGCCAGATAAGCAGCGCGTAGTACTGCGACCTAACGCTGAAACAATATGGGCAGACATTTGCAACATGAACGAGAAGACGGGGTCGAAATGGTCAGATATGGATGCTCTACTAGTCGAATCAAAGATTCTGTTGTGTACTTCGGCTCCGTTATGTCTGGATCCGGATCCGTCTTTGACACGAGTTGTTAATAGTATTCTCCGTGTCTCCACGCCAAACGTTCCGAATTCACTAAAACGCAAGGCAACTGCTATGGTTGACATCGAAGAAGACGAAACCGAGAAGGCCAAACGTGCGAAGATTATGCAGTTCATGAATCCGCAATTTAGCAATACGCATAAGCCATTTCATCCTAGTTATAAAATTCTCTCAGTTATGGAACAGAAGCGTGCAGCGGCAGCCTCTCAGCAGACCTCACAGCCTGCGACGACTACATCAGTTCCAAACAACATATCTTCTGGTACTATGGCTCCGCAGAACCTGACTCGCCAACAAGCACCTGAAAAACCTTCAGCGCCTGTCGCGCCTATCGCACCCACACTTACCACGTCGTACTCACAAACAAATACGAACACGATTCCACAACCCGCACCCACCACAGTCCCCCAGACGCAGGCGCCACCTGCTATTGATCCTGCCCATAGGCAGTCGCCTTCAAAACAACAGCAATCCGCAAGTCAGCCTCTCCCACAACGCCCACCGTCGCAAACTGCCGCTCCGCCGCAGGCGAGCGCGGTTAGCCAACCGCCTCAAGCTCAAGTTCCTCAGCCAACTCGACCTCAACCGACTCAGTTCAACCCCCCATTACCTCCGGCCAATTTCCTCAACCCTGCTCTTCCCCCTGGTCGGCGCCGACCTTCGACAGTTGTTAAACCTAGCACTCCTGCTGTTGCGACCTCTTCGCTGCCGACTCAACAACCGGTAAATCAGAGTCAACCGCAGACTCAAACACAAATACCGACGCAGACTCCGGTTCAATCTCAACCGCAAACACAACCGCAGCCAGCATCGCAACCACAACCGCAGCAGCCCGCACCACAGCCAATTGCACATCCAACGCAGGTACAGGCACAGGCTCAACCGCGTCTCGCACAGATTCCTGCAAATATGGCACAATTCTACCAGACCGGTAGACCAACAATGGCCATGACACAGGCTGCAGCTGCGACCATTGCAGCGCAGAGACAGGCACAGAGTGGTCGAAACACGCCTATTACTGTGAACAACCCAAGTTCCTCGCCCGCACCACCTCCGTCGGCGCTAGCACGGAGCCCTATGGTACCGCCGGCTGTAGCTGCAGCGATGATGTCAAGGCAGAGCACACCGGTAGCAACAAGCAACCAAGTCATGCGTGGTAGTCCGCTAGTTGGAAGTCACCCAGTTGTCGCACGGCCAGTTGCAGGACAGACACCAGCTCCAGTCCAACAGCAACCCCAGCAACCTCAGCAGCCGATCCCGGGCAGCCAGGCGATGATGATGCAACCAGGTGCGAGCGCGAATCCCCAGGCAGTCCTCCAGTACCAGCAGCAACGTATGGCCATGTATAGGTCGCTACAAGCGCAGGCGGCCCACGCACAGGCAATGCATCAAGCGCAGATGCAACAGCAAGGTCATGTGTCACCGGCGCCGCAGCAACAGCAGAATCCACAAGGTGGCAATACCCAAACAATCCAGCAGACCGCGCACGATCAAGCTCCCAGAACACAGCAAAACTTCGCCGGCGTCCAGATGCCTCTCAATTATATGCATATGGGCCAAATGGGCCAGATGGGTCAGATGGGTCAGATGGGTCAGTTGACTCTACAGCAGCAACAGCAATTCCTTTGGGCCCAGGCCCAGGCCCAGACTCAGCGAAGCATGGGTCGAGGAATGCCCCAAGTCGGACCAAACGGGCAGCAACAGATGCCAACTATGCCTGCAAACATGACACTCCAGCAATATCAGCAAATGCAGGGGTTGGGACGTGGTGGAGCCCCACCGAATCGATGAATGTTATTCTTTCCACTTTTTCTTTTCCAATTTGCCATGTATTTCAATCTGTGTTTCCTCGTCATGCTTGCGTCCGGACAGGTGTTAACGTAGATGTACCTCAGTGTATCTTTATCTCAGCTTCTTCGTAACGAACAACGCCATGAAATGCTCCCG
>XM_045941201.1 PREDICTED: Trifolium pratense germin-like protein subfamily 1 member 17 (LOC123891348), mRNA 
ATAATTCACACGAGCAATATATAACTTTTACATAAGAAGAATAAATAATTAAAGAGTATTAGCTAGTGAGTTTGAAAATGAAGGTTCTCTACTTCCTAGTTAGCATCTTGGCTTTGGCATCATCAGTTACCTTTGCTTATGACCCCAGTCCTCTCCAAGACTTTTGTGTTGCAATCAAAGACCCCAAAGATGGTGTATTTGTGAACGGAAAATTCTGTAAAGACCCTGCTCTTGTTAAAGCTGAAGATTTTTTCAAACATATTGAAGCTGGGAATACATCAAATCCATTAGGCTCTCAAGTAACTCCAGTTACTGTAGACCAACTGTTTGGACTTAACACACTCGGTATATCTTTTGCACGCATTGATTTTGCACCTAAGGGTTTAAACCCACCCCACACTCACCCCCGAGGCACAGAGATCCTTATAGTCCTCGAAGGAACTCTTTATGTTGGATTTGTCACGTCCAATCAAGGCAATACTAATCGCCTTTTCACCAAAGTCCTCAATAAGGGTGATGTATTTGTGTTCCCAATAGGCCTAATTCATTTTCAACTAAACGTGGGATATGGCAATGCGGTTGCTATTGCTGGGCTTAGCAGTCAAAATGCAGGAGTTATCACAATTGCAAATGCTTTGTTTAAATCTAATCCAGCCATTTCTGATGAGGTTCTTACCAAAGCTTTCCAGGTGGATAAAAGCATAATTGATTATCTTCAAGGACAATCTTGGTATGACAACAACTAGTTCGAGAACATGATTAATCGTTTTATTATTATTAATAGATGATTCATCTCATCTTTAGTGTTACAATCACCTAGTGGAATCGACCTTCTCTACTTACTTATTTTTATTGTAATAAATAAAATAAATGTTGTTTTATTTAAACACATGGTTGTTTTAATTTTAGTTTAATTTGGTTCAATAATAGATTGTTGTTGCTGATATGTTCACCAATAAATAAAAAGATTGTTGTTGAGGTTTTTGTAATATAATAATTTTCTATCCCA
>KX055998.1 Phytophthora gonapodyides isolate H18 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
ACGTGAACCGTATCAACCCCTATAATTTGGGGGCTTGCTCGGCGGCGTGCGTGCTGGCCTGTAATGGGTCGGCGTGCTGCTGCTGGGCGGGCTCTATCATGGGCGAGCGTTTGGGCTTCGGCTCGAGCTAGTAGCTATCAATTTTAAACCCTTTCTTAAATACTGAACATACTGTGGGGACGAAAGTCTCTGCTTTTAACTAGATAGCAACTTTCAGCAGTGGATGTCTAGGCTCGCACATCGATGAAGAACGCTGCGAACTGCGATACGTAATGCGAATTGCAGGATTCAGTGAGTCATCGAAATTTTGAACGCATATTGCACTTCCGGGTTAGTCCTGGGAGTATGCCTGTATCAGTGTCCGTACATCAACCTTGGTTTTCTTCCTTCCGTGTAGTCGGTGGAGGATATGCCAGACGTGAAGTGTCTTGCTGGCGGTCTTTCGAGTCTGCCGGTGAGTCCTTTGAAATGTACTGAACTGTACTCTCTCTTTGCGCGAAAAGCGTGGCGTTGCTGGTTGTGGAGGCTGCCTGTGTGGCCAGTCGGCGACCGGTTTGTTAGCTGTGACGTTTAATGGAGGAGTGTTCGATTCGCGGTATGGTTGGCTTCGGCTGAACAATCTGCTTATTGGGTGCTTTTCCTGTCATTGGCGGTACGAACTGGTGAACCGTAGCTGTGTGGTGCTTGGCTTTTGAACCGGCTTTGCTTTGCGAAGTAGTGTGACGGCTTCGGCTGTCGAGGGGTCGATCCATTTTGGGAAACTTTTGTGTGTGCGGCTTCGTGCTGCGCGC
>XM_008173413.3 PREDICTED: Chrysemys picta bellii NECAP endocytosis associated 1 (NECAP1), transcript variant X1, mRNA 
CCCTTAACAAAAATGGCGGTCGGAAGCATCCCCGGTTACTAGGACCCCCCGCCCCTCCCGCTGGGGTCTCAGATCCGAGATGGCGGCGGCCGAGGCGGAGTACGAGTCCATCCTGTGTGTGAAGCCCGATGTCAGCGTCTACCGCATCCCGCCGCGGGCCTCCAACCGGGGATACAGGGCATCTGACTGGAAACTGGACCAGCCGGACTGGACAGGGCGTCTCCGTGTCACGTCAAAAGGCAAAATTGCATATATAAAGCTAGAGGATAAAGTTTCAGGAGAGCTCTTTGCTCAGGCTCCCATAGACCAGTTCCCTGGCCTTGCAGTGGAGACTGTGACAGATTCCAGCCGGTACTTTGTCCTCCGAATTCAGGATGGGAATGGGCGAAGCGCTTTCATTGGCATCGGCTTTTCAGATCGGGGTGACGCCTTTGACTTCAATGTCTCCCTGCAGGATCACTTCAAGTGGGTGAAACAGGAGACCGAAATCTCCAAGGAGTCACAGGAAACTGACACACGCCCCAAACTGGACCTAGGGTTCAAGGAAGGACAGACCATCAAACTAAACATTGGGAACATGCCAACAAAGAAAGGAGGGGCACCCAAACCCCGTGCAGCTGGATTGGGGGGGCTGAACCTGCTCCCACCCCCTCCAGGTGGCAAAATCACAGCCCCTCCAATCCCTCCCCCATCTTCAACAGCCATTTCCAACCATGTGACGCCGCCACCAGTGCTGAAATCCAGCAACATGGGCAATGCTGATATCCTGTTGGATTTGGACTCTCCTGCATCCATCTCTAAGGCACCAGCACTTGCTGCTGTTCCAGCCACCACAGACCTCTGGGGAGACTTCAGCACTGCATCCAGATGTGCTCCAGCCTGGAATAGACAGGAGGTGGTGGATCTCTTGGGCCTGTGGAGAGAAGTGGCTGTGCAGGAACAGCTCTGAACCAGCCATAGAAAT
>XM_029877336.1 PREDICTED: Aedes albopictus nuclear inhibitor of protein phosphatase 1 (LOC109424494), mRNA 
CTTTTGCTCAGGTCAAGGAACACAAATCGCCCATTATGTGGTTAGTGCGTGAATTTCGTTCCAATTTACTTATTTTCCACCGTAAAAACTTCTAAAACTATCGTAATTAGTGTATTAAGTTGAGGATTCGTGTTTTCCTGATCTGGGACAACAACTCATTCTGAGCGTAATGTCCAACCACTACGACATACCCTCTTGGGCTGGTAAGCCGCCCACGGGGCTACATCTGGACGTGATGAAGGAAGACAAACTGGTTCAAAAGTTGATGATTGACGAAAAGAAATGTTATCTCTTCGGTCGGAATCCCCAGATGAACGACTTCTGCATCGATCATGCGTCCTGTTCCCGCGTACACGCCGCATTCGTTTATCACAAACACTTGAACATTGCCTACCTGGTGGATTTGGGCTCCACTCACGGGACGTACATCGGCTCGGTCCGGCTGGAAGCTCACAAACCCACCCAGTTGCAAATTAACTCGACGTTCCATTTCGGCGCTTCGACCAGGCACTATATGCTCCGGGAGAGACCCAATGTCCGATCCAACATTATGGAAGACATCCCGATGATGGACACCAGCGATGGAACCTATCTAGGCCTTCCCGAGAGCCAAACGGAACTTGATAACTTGACTGAATACAATACCGCTCATAACCGGAGGATTTCCATGCTTGGAATATCGGACGAAACCAGCACTTTCAAGAAGAATATGAAGAACAAAAGGAAAAGGAAAGGCGTCCAGTTCAATGAGGATGAAATCGTTATAAATCCCGAAGATATCGATCCAAGCATAGGACGCTTCCGTAATCTCGTATCGTCCACAGTTGTTCCAGTACAGGCGAAACGTGCAAAACTAGAAGTTCACTCAATGGGTCTCTCTACGTCGCCCTCATCCAGCAAAATCCTTCATCATCCGCACAGCTTGGTACCAAATTTGTATCATGGAATCGACGACCAAGCGCATGATCCACGAGGTCCGCCCGGCAATGGTTCCGGATTCGGGTTCGGCATGGACACCACACCCAGTGGACTCACCACTAAGCTGGGTATAATTTTGCCGAATCCAGCACCGGATGTGAATCCGGCCAGTTCCAGCACTGCTCTAATGCCTCCTCCTATCTACAGCAGCATGGCTCCCAAAAGTGTTAAAATTGTCGACAAACCGGACCTATCGGACGAACCCAAAAAGAAGAAATACGCCAAGGAACAGTGGCCCGGAAGGAAACCTCTGGGATTGGGAGGTTTCTAAGCGGTTACAATACAAATGTAACGTTACATTTATCTTATATTGGTGTGACTATTTGGTAAGTGAATAAGGTTTACCGAATTTAATCTAACATCATAATAATCGAAAGTTAA
>XM_053193968.1 Colletotrichum fioriniae uncharacterized protein (COL516b_007061), partial mRNA 
ATGGGAAAGTCAAGACGAAACAGAGGCGGCCCAAGCCATCGCAAGGACCCCATCGCCAAAACCGTCAAGCCCCCCTCCGACCCAGAGCTCGCCGCCCTCAGGGAAAAGTCCATCCTGCCCGTCATCAAGGACCTGCAGAGCGCTGACCCCAAGTCGCGCACCGCCGCCGCCGAGGCCGTCTCCAACCTCGTCTCCAACGAAAAGTGCCGGAAGCTGTTGTTGCGTGAGCAGATTGTCCACATCGTCCTGAACGAGACCCTCACCGACGCCAGCCTCGACAGCCGCGCCGCTGGTTGGGACATCTTGCGCGTTCTCGCCGAGGAGGAGGAGGCCGACTTTTGCATTCACCTGTACCGTCAAGATGTTTTGAGCGCCATTGGTTTTGCTTCTCAGACTATTCTCCAAAACCTTGCAAAGGGCTCATCTCTGAGCAAGGGCGAGACAAAGGTCACCTGGACCATCACCGAGTCTGTCATTGGCCTTTTGTCTGCTCTTGCCGAAGCCCAGGATGAGGTTCTCGAGGCCATTGTGGGTATCGAGGGCATCAAGCACTTGCTCTTTACTGTCATCGCTCACCCCGACACACCATCAAGCATCTGCCTCGACGCCCTCTCAGCCCTCCTGACCCTGTCCGAAGACAACCAGCGCCTGGCGCAGGATGTCGTCGCCGACGAGAGCCCCAAGCCGCTCACGTCGTTGACCAAGCTGCAAGAGGTCGCTGGCGCAAAGGGCGTCCTAGCCTGTGGTATTCTGCATAACATATTCACCACCTTGCATTGGTTCGACAGCACGCCGGGCCCCAAGGACCTCTCTGACGCCTCTCTCATCCCAACTCTGTCATCGGCACTCAAGAACACCACGCCGGAAACTGATTTGCCACCCAGAAGCCAATGGTCTAACCCGACCGAGGTTCTTCAGCTTGCCCTGGAAATCCTCGCCGATGTTGGAACGACGCTGCAGCAGTCTCTCCAGGGAGGCGACAGCAAGAAGGCCAAGAAGGAGGAATGGAACGGAATCGAAGACGACGACACCGCCATGGACGAGGACGTCAAGGAGGACAACGGCTCCGGCGACGAGGACATTGGCGAGGGCGACGAGGAGGACGACAATGACGACGACTCCATGGACGAAGACGAGATGCAGGCCGACATGGACCTCGTCACCGGCGCCGACGACGACGTCGACGAGGAGGCGAGCATGGACGACCTGCCCACCCTGCGCGAGCTGGTCCAGCAGGCCATCCCGCAGCTCATCACCCTCGCGACGCCGTCATCACAAGCAGAGGGCGACAACGTCCGGGTACAAGCGCACGCCCTGGCCGCCCTCAGCAACATCGCCTGGTCCATCTCCGTCTTTGACTTCTCCGACGATCACAACGCCGGCATCCTCAAGGCCTGGGCCCCGTCCGGCAAGGCCGTCTGGGCCCAAGTCATCGCCCCTATCTTGGCCGCCAACACCGCCGACGTCGAGCTCGCCACAAAAGTCACCAGCCTCGCGTGGGCCGTGTCCCGCAGCTTGCCCCGCCGCCTACCCCTCAGCGGCGACGAGCACACCAAATTCATGGCGCTGTACCACGCGACCAAAAACCTTCCCTCAAAACAGGCGGCCGAGACGGCGGCCAACGGAGACAAGGCAAAGGACGAGGATCCCGAAGATCCTTTCCAGGGTCTCGGCGTAAAGTGCATCGGCGTCCTGGGCCAGCTGGCGCGGGACCCGGCACCCCTTGCGCTCAACAGGGAGATTGGTGTGTTCCTTATCGCGGTGGTGACTGCATTGCCAGAGACCCCGGCGGCGGATGCCGTCGAGGCCCTGAACCAGCTTTTTGACATTTACGGAGACGAAGACATGCCATGCGACAAGGAGGTCTTCTGGAAGGACAACTTCATCCAGCACCTCGAGGCGGTTCAGCCCAAGGTCAAGGCCTTGGTCAAGACGATTGATAAGCGAACTCTCCCCGAGTTGCGCACTCGTACTGAGGAGGCTGTGTTGAACCTTGGACGGTTCATTCAGTACAAGAAAAAGAACAAGGCATAA
>XM_046724795.1 PREDICTED: Haliotis rubra E3 ubiquitin-protein ligase parkin-like (LOC124288282), mRNA 
AACAACAAATCGAGTGTCAAGCACGTGTTTCTTGTCATTATAGGAGGGGATTTTTTTGTTTGTCGTTATCGGATGTGGACTACACAAAACTGACGACACCAAAACAACCCAGGGTGCACGTTTCTCTGTCTTTAAGCAGATGACAAGTGTGCCAGGTTGTGCTTTCGATCGCATACCTGTGCTAACTACGATGCAGGAAGTTGTTTGACAGCCACACTTAGCCTTCAGGGAACATACGGCGCATTATATGCAGCGAATGAACATGGTGTAATCTTATCTACATAACTTGCATCATGATTACCGTGAATGTGAAATTTCACAGCAATTGTGCAGTTCTTGTTGAAATTAACCCCGACAGCAGCTTGCATGAAATCAAAAGAGAAATATCAAAGAAGGTCAATTTGCCACTGGAAGAAGTCAAGATTATATTTGGGGGGAAAATTGCTGACGGACGATTGTGTGTTTCAAGATTTGGATTTTGGTGATCAAAGCACTCTCCATATCTTCAGACAGATATCAGGGAGTGAAAAAACTCTGACATCAGAAGCAAGCGAGGAAAGAGAGCTCAAGAACCAGTACTATGTGTACTGTAAGGAATGTAGATCAATACAGCCAGGCAAGCTTAGGGTCAAATGTGCTACATGCCAGGATGGGGCCTTTGTTCTCAGCAGGGACCCCGAGGGCTGGAGCGATGTGTTGCAGTCAAGGAGCATGGGTGGGGAGTGTCGGAATGATGGCTGTGAAGGGACAACTGCGGAGTTTGTGTTCAAATGTGGCAAGTCCCACGCTGATGGCATATCAGCTGTCGTTCTACGACATGTCCGACCAAACAGACGGGAGGTTGAGTGCATTACCTGTGCAGATGTGAGATCTCCTGTGCTGGTGTTCCCCTGTGAGTCAGGACACGTGATGTGCATCGAATGCTTCAAAATATATGGAATCACCCAGTTGAGTGAACGCAGGTTCATTAAGCACCCAGAGCATGGGTACACCCTGCCTTGCCCAGCTGGCTGTCCCAGCTCGGAGATCCAGGAGAGCCACCATTTCCACCTACTGGGAGATGAGCAGTATGAACGGTTCAACACGTTCGCTACAGAAGAGTATGTACTACAAGATGGTGGCGTGCTGTGTCCAGGACCAGGATGTGGGATGGGCTTCGTCCTTGACACAGCGGGGAGGAAAGTCACCTGTGTTGCCAAGGACTGCATGATGACATTTTGTCGTGACTGCAAGAATGAGTACCATGACGGGCCTTGTGATGTCAACCCTCTCCTCACACTCTCACCTCTGGACTACTTGGTGGACCCACTCCAGGCTGACGGTCTCTGGGAGGACCAGTCTCGAACGCTGATAGACCGCACCACCAAGCCCTGTCCAAAGTGTGGCTCCAGGACTGAGAGAAACGGTGGTTGTATGCACATGCTGTGTCCACGGTGCGGGGAAGACTGGTGCTGGGTGTGCAACAAGGTGTGGGATCGGGACTGCCAAGGCCAGCACTGGTTTGGATAGTGTGCATATCCTTCCAGATAGTGATTACAATAATAATATACAGGATATACAATTCGGGAAGAAACCTCCTATATTTTCATACACTCTGAACCTCCACCATTCATATGTATAAATGATATTGATGTCATGTTGATATATGTGTGAAATATTCCAGAGACCTGCTGAAATGGTATTTGATGGCTATGTTGTATGTGATGTCAAGAGTGAGATGCTATGCTGTTGCCATTGGAAACTCACAAAACATGATATTCACGGCTAGATTTAAGCATTTAGAACTTGCACTGGTGCAGCCTGAAACTGCAAAATGCAACCTCATACTTATACCGGTACCAACTGGCACCCACTGCATGTTTTTATTTTTGCTGCTCAAAGAACACAGACTTCAGTTTGAAAACAGAATGGCAAGGAAATGACTTGGAGCAGTGACTCTGATGGCTGCATGGACAGTAAGACCATGACCGTTAGTGTTCATATGATGGAATTTTATTAAGTTAGATAAAGTGACCTCATCAGACTCTTACTAATTTTGTCTCAGCACCAGATGCAAACTGTTTTTGTCTGGTGCTACAAGGTTAATACCAGTTGGAAGTAGGTTTCCTGTTTTTAAATCAAGCCCTGATATCTGTTTCAGTTTCTACTATCAGCATGGTGATCTCACTCTGTACACAAAAATAGACAGTATTCTTCAGGAAGTTAACATGGGAAAGTATTTTTAGATGTCTTTTACATATAGAAATATATGGTAAGTGATGCTCAGGTTTATTCATGGGCCATGTTTCACAAAGCAATATTGGAGTTACGACCATCATAAGCAAATGTT
>KC455192.1 Uncultured eukaryote clone T2S303B03 18S ribosomal RNA gene, partial sequence 
AAAGATTAAGCCATGTTTGTCTAATTATAAGCTTTTATACAGTGAAACTGCGAATGGCTCACTAAATCAGTTATGATCTACTTGACAAATTTACTACTGGATATCCGGGGTAATTCTAAAGCTAATCCAGTGCATTCAACCCCGGATGTTTTGATGGGAGCACTAGTTAGATCCATAGACCAAACCCCCAGGGCAACCTGGTATTGCTTAGTCATAACTATTAACCTTACCACCCGCAAGGCCGACGGTTCAATCAAATTTCTGCCCAATCATTGCCCTGTTGGTAGGAAAAAGGCCTACCATGGCTGCAACGGGTAACGGGGAATAAGGGTTCTTTTCCGGAAAGGGCCCCTGAAAAATGGCGACCCCATCCAAGGAAGGCAGCCGGGGCGCAAATTACCCAATCCCCACCCGGGGAGGTAGTGACAATAAAAAACAAAGCAGGGCCCTTTTGGGTCTTGTAATTGGAATGAGCTCAATTTAAACCCCTTAACAAGGAA
>XM_047242661.1 PREDICTED: Schistocerca piceifrons protein O-mannosyl-transferase TMTC2-like (LOC124712366), mRNA 
CGGCGCCGCGAACGTCGGAGGCAGCAACGACGCGTCGCGACGCTTTCGACGCACGACACGTGGACACATCCTGCAAAAGCTGCTTCTGGTCGCCGCGGAACTGTCAGCGAGCTTCTCTTGTACAGTCGTCCGCCCCTGTGAGCGCGCCTGTCGCCCCGCTGCCCCTGGCGGGGTGTCTGCAGCCAACAAGTGTGGGAGCGAGAGGCAACAGGTAGTCTGCTGGTGTGACGCGGCCGCCCTTATCTGGATGGACGGCACGGCCGTGGCGTGCGCGCTGCTCGCCGCCGCCGCCTACTACAACACGCTGGACGCCGGCTTCGTCTACGACGACAGGCGGGCCATCCTCGGCAACCCGGACGTGACGGGCAACGAGACGTCGCTGTGGCGGCTGGCGACGTCGGACTTCTGGGGCACGCCGCTGCGGCTGGCCGGCTCGCACGGCTCGTGGCGGCCGCTGGCGGTGCTCAGCTTCCGCGCCAACCACCTGCTGGGCGGCGGCTGGCACGCCGCCAACGCCGCGCTGCACGCCCTCTGCGCCGCGCTGCTGGTGCGCGTCGCGCGCCGCCTCCGGGCCGCCCCCGGCGTCGCGGGGGCGGCGTTCGCGCTGCACCCGGCGCACTGCGAGGCCGTGGCCGGGCTGGTGGGCCGCGCCGACGTCGCCGCCGCCGCCTGCTCGCTGCTGGCGCTGCTCTGCTACGCGCGCCACGCCGACCTGCGCGACGCCGCCGACGCCCGCCGGCGGCGCTGCCGCGGCTGCGGGGGCCCCGTGCACCGCCAGCAGGGCTGCGCCCTCCGGAGGGCTCTCGCCGCCGCCAAGGGCCTCCTCGGCGCCGCTCTCTGCTCGGCGAGCGACCGCCTCTCTTGCCAAACCCGCAACTCCTCTCACCCCCCTGCCACCGGCACAGTCACGACGAACGGTACTGCTTATAAATCCGGCGCCTGGCTGGGACAAACTTCTAAGTCACCTCGAGCTGACATCGTCACTGAGTCCAATGACGCCAACAACAACACCAGTACGAACGCACTCGCGTGTCAACAGGCTCCGTCGAAAACATCCGTCGACTTCGATACACCGCCATCAATCTCGAAAGCGATCACGGCAGAAATCACTCGCATTAACGCCTCTCACACCACATGTTGCAAACAACCTCGCACTTCAACGCAACATTACAATGGAACTGTTCCTCTCGCCTCTTGGCCGTCGACCGAACGGACGGAAAATGAGGACGTTGCCGAAGGCAGTGATGCGACACGAGACGCTAATCACAACACTGAGTTCGTCAGTTCGTCGCAATTGTTTTCAATTAGCCAGTGGCGATACCAGAACGCTTTCGACCATCATCTTGAAGAAAAGGTTGTGAGACGCAGCCTCTTCAGAGCCAAAAGGGAGGCGTCCAGCAGGCTCGGAAGTAATGTGTTGAGGAGGAGGTGGAAGAAGTGTTTCAAGGACAAAAATTTAATCACAGACAGCGGTGAAGATCAGAAACGGCTTCTGAAGACAGCAGAGAGGAGCACCTGTTGCGCCGCGGAGGGCTGCAACAAGGAAGAGTCGCGCTCGTGTCGGAACAGCGCCAGCGGCGGGCCGCTGCTGCAGCTGGTGGCGTGCGTTCTTCTGAGCGCATGCGCGCTGCTCTTCAAGGAGACGGGCATCGCGGCGCTCGCAATCTGCGTCGCCTACGACGTGGCGCTGCTCGCAGAGAGGGGCGTCGCCGGGCCGCGGCAGCTGCTCGCCACTCGAGCGATCGAACGCCGCCGGCTGGCGCAACAGGTGTCGCCTGTGGAGAGCCAGAGGCGGCCTGCGGCCTGCCCCTCCAACCGAGCCAAGGGCAACCGCTGCTGCCTGCTCGGCGGATGCGCCGAAACGCACGCGTGCGCCGACAACAGCGTCAGTGGCCCCTGTGGCAGAGGTGCGCTGCTGGTGAGCCTGTCGCTGCTGGTGGTGCCGTTCCTGCCGGCCAGCAACGTGGCGCGCTACGTGGGCTTCGCGGCAGCGGAGCGCGTGCTCTACCTGCCCAGCGCCGGGCACTGCCTGCTGCTCGGCCTGGGCTGGCAGCGCCTCAACCGGAGGTCCCACCACCACCAGCACCAGCACCACCACCACCACCACCACTGGGCGTGGCTGTCAGGGTTTGCACTGGCTGCCACACTGGCCAGTCTTGGAGCACGGACCGTACTCCGCAACAGGGACTGGTACGACGAGGAGAGCCTCTTTCGCTCTGCGCTTCACATCAACCCACCCAAAGCGTACGGCAACCTGGGCTGCGTGCTGAGCTCTGCGGGCCGCCTGGAGGAGGCGGAGTGGGCGCTGAGGCAGGCGCTCAAGCACAGGCCCAACATGGCGGACGTCCACTACAACCTGGGCAACCTACTGCAGGCTAGAGGCCGCCCGGAGGAGGCAGAGCGCAGCTACCGGCTCGCCATCCACTACCGGCCCTCTCTCGCAGCGGCGTACGTGTCACTGGGGCAGCTGCTGGAGGCACGGGGTCGGCTGCGGGAGGCGTCGCAGGTGTACGAGGACGGCACACAGCTGGACGGCGAGCGGCTGCGGGACCCGGCGGCGCACCTGCAGGCCACCCTCAGGGCGCTGCTGAGACTGGCCCGGCTGCGGGCCCAGCAGGGCGACTGGCAGGCGGCGGCCGACAGCTGCAGGCAGGTGCTGCTCAGGCACCGCACTGCCCAGCTGCAGGGGCTGTTGACACAGGTAATGGCGCAGCAGGGTGCTGACCACTTAGTAAACAAGTGCTGTTCAGGCACCGTGCTGCCCAGCTGCAGGGACTGTTGA
>XM_020923618.1 PREDICTED: Boleophthalmus pectinirostris sodium bicarbonate transporter-like protein 11 (LOC110159053), mRNA 
ATGAACAGCAAGAAGAACGCAGAAGAAACACCCACGGTCATCGTCACCAGATTCACTGAGGAACTCAAGGATGGGGAGAAGGAAGAAACAAACATTTATGAAATCCCAGTTAGTACTACAGCCACTGAAGGGCCCGGATTTGGACTTTTAAATACAACCAGAAAGTATGTGAAGCCAATGAACTTCCAGGAGGAGGTACGAGCTCATAGAGACCTGGACAGCTTTCTGGCCCAGGCTAGCATCGTCTTGGATGAGAAGGCTGCCACTCTGGACGAGGTGCTGAGGAGAATGTTGACGAATCTGGTTCAAGAGGGACATGGGAGCTGTGACACTGAAGAGGTCATGAACACACTGTTCACAGACGCAGGGGGACAGGACTGTGATGTGCACCTTCTAACAGAGACCATTCAAGGAGTAACGGCTAATTCTACTGGGGTTCACTATCAGCAATCATGGCTTTGTATACTCTCTACAGTGAGGACTCTGCAGCGGCGCCATGTCTGTGTCACTCGTTTAGAGCGACCTCAGAACTGGGGAGTGAACTGCTGCGAGGCGCGATATGTCATACTAATCCTCGCTCCTCCCAGAACGAAAAGCACCAAGACAGCCATTGAGCTCGGTAGAACGTTCGCGACAATGTTCTCGGACATCTCCTTCAGACAGAAGCTTTTGGAGGCCAGAACACAGGACGAGTTCAAACAGGAGCTGGTCCTCCAACGACAGCAACTCTCCATGGTGACAGAGAAGCCAGTGATCGAGGAAGTGGTGGACTCGGACCCCCGCAGGGCCAAAGATCTACAGTGCATGGACTTCTTCAAAGCCGGCAAAGGTGTTTATGAAGATCTCCGCCGCAGACTCCCACTCTACCCGTCAGACTTCACAGATGGAATTACTGGAAATGACCGCTCACTACTCAAGTACACCACCACAGCTATTTTCCTCTACATTGCTATTCTGCTCCCAAACATCGCATTTGGCTCTTTGAATGATGAAAGTACAAGAGGTGAAATTGATGTTCAGAAGACAATAGTTGGCCAGAGCATTGGTGGAGTTATATACGCGCTGTTTGCAGGCTCTCCTCTTGTCATCCCACTAACTACAGCTCCGCTTGCTATCTTCATTAGTGTGATCCGTGGCATCTGTGACGACTACAACCTGGACTTTGATGCCTTCTACGCCTGCATTGGTTTATGGAACAGTCTCTTCCTTATCCTCGGGGGCCTATTCAATGTCAGTCTGCTGATGAAGCTCTTCAAACGCTCCACAGAAGAAGTCATTGCTCTGTTCATCTCCATAGCATTTGTCGGCGACGCGGTGAAAGGCACAGTCAAAATTTTTGAACACTACTACTATGGACCTACCCTTGCTACCTCCAACAGTACAGTGGTGCTCCAGCAGATTAATGAGATTCTGGAGCGGGCAAACAACCACACCTCCACCAATGGCACTGGGTCAGAGACTGGACACTCAAACCTCCTCCTCCTGCCTGAGTCTCTTATCGTGTGCACCAGGGAGAGACCCATCCTATGTCTGCTGCTCATGCTCGGGACACTGTGGCTGGGATATGCTCTCTACCTCATCAAGAGAAGCCCATATCTGAATGCCAAAGTGCGGGAAGTGGTGTCGGACTGTGCTTTGCCCATATCAGTCGTCATTTTCTCATTCATTGGGTCCTACCTGTTTATCGATATTCAGCTTCCTCAGTTTAGCGTCCACAATGGTCCAGTTTTCAACTTCCCTCCCTTTGACAGGCTGAGTGGCATGACAACATTAAGTGCAGTAGGGCTTGGGTTCTTACTCGCTCTGCTCATCTTCATCGATCAGAACATCGTCATCTCACTCACACATGTACCTGAACACAAGCTGCTAAAGGGCACCACATTCCACTGGGACTTAGTGCTGACCGGCCTCATCAACATCCTCATGTCCTGTCTGGGGTTGCCATGGATGCACGCCGCTTTCCCACACTCGTCTCTGCACGCCCGTCAGCTGGCCAAAATGGAGCAGCATGTGGAGAACGGACATGTCTACTCTACCATCGTAAGTGTGAAGGAGACTCGGCTAACGGCGCTGGTAGCAAACATCCTGATCGGCGTGTCTGCCTTCATGCTGCCCGTTCCCCTGCAGTGGATCCCCAAGCCTGTGCTCTACGGCCTCTTCCTCTACATCGCTGCCACTTCTCTTGATGGGAACCAGATGGTGGACCGCATGGCTCTACTGCTGAAGGAGCAGACGTCGTACCCTCCCACTCACTACATCCGCCGTGTCCCCCAGAGGAAAGTGCACTATTTCACCGGGGTGCAGATGGTTCAGCTCGTGATCCTGTGCGCGTTTGGCATGTACCCTTTGCCCTATATGAAGATGGTATTTCCTCTCCTCATGATCCTGCTCGTTCCTGTCAGGACAAGTCTCCTTCCGAAATTAATTGACGCCAAATATCTGGATATCATGGACGCCCAGCACATGTAG
>XR_545375.1 PREDICTED: Equus przewalskii uncharacterized LOC103553015 (LOC103553015), ncRNA 
CGTCTACACAAAGACTTGCACACGAATGTTCACAGCAGCACTATTTGTAATAGCCCAGAGTGGAGACCACTCAAATGTCCCTCAGCTAGTGAACGGATAAGCAGGGTGTGGCCCTTCCACACAATGGAATGTTTTTCAGCCATAAGAAGGAATGAAGTACTGACACAGGCTGCAACGTGGAGGACCCTTGAACACATTCTGCCAAGTGAAAGAAGCTGGCCACAAAGGACCACATGTTGTGTGATTCCTTATATGAAATGTCCAGAACAGGCAAATCCATAGAAATGGAAAGTAGATGAGTGGCTGCCTAGAGCTTGGGTAGGGAAAT
>XR_002766617.1 PREDICTED: Eurytemora affinis uncharacterized LOC111708265 (LOC111708265), ncRNA 
CTGGTGAATTATAGCTGAAATTGTGATAAAGTTACGCATCTATTTTGTATCAAAAATAGCCGATAATTGTTTGTGAAAATTTTCAGATGTCGTCAAATATTTTTTCTGAGGTACTATGGAATGGAATTTTAGGCGATGAAGAAGAGAGGGGACCCGAAATGTCCAATATTATAAACGGTCTGTCAGTGCCAATCAAAGCTCCAACATGTATAATACAGAGCTGCAATCCAAGAGTATGAGGATCACGGTTTAGATTTCCAGCAAGAAAAAAATTGTGGCTGAAGGCCCTTCATTTAAATCAAGAGTATATCACAGTAAAAGATCCAAGAGTATGTGAAAAACATTTCAAACCCTCTGATTTTAAAAGTAATTTATAGTATAATAAATATTACGACGTTAA
>XR_006947954.1 PREDICTED: Xenia sp. Carnegie-2017 uncharacterized LOC124444429 (LOC124444429), transcript variant X1, misc_RNA 
GCTTAATTTTAAAATCAAAGTACTTTCAGAAAAACGCTATTGGTTTTGAATTTGTAAAGATCATAATTTTACCAATTAACTTGTCTCTTAATTGCTTAGAAATTTAAATATATTCCAAATTGCGCTGCGGTAATTAATTTTGAGGCACCTCAGATCCTCCAAGGGTTTACTACATACAATTTGGGACATCTTTTCGTAGGTTGCCACCGGCGGGCAGTGACGCATTTGACTTTATCACTCAATCGTTTTAGCTGTTTGAAAAGTACTTGACTCCTTTGAGAAAAAAAGTTCACATCACGTTGGGTAAAGATAGTCATCTTGGCCGTTATGAAACAGGAAGGTGGTGGGGAACTTTGATTGTTGCTCTCGTCGTTCTGTTCACGTCAATGGCAACGATGACAAGTGTCGCAGTAAAGCAAACGCAAAATTTGTTTCGTCGACGACCTATTGTGGAAAAATTGACAAAATGGTATTCGTCGTTGTCTCGGAAACTTTTTTTAAGTTCAGTGATCGCACAACTGCTTATCATCGTCATTCTCAACGCATGCGCAGGAATAACATTCCTCCTGGCATCCAACATGTCTCTTGTGTGTGACGTCACCTCTCATCATGAAAATATTGACAGGATCTTCGATATTTCAAGTGTGTTACCAAAGTCTACAATGCTTCCCAGGACAAAATCAATACAATTATTCAAGAAACTTAGCGAATGTCCCGAGAACGGCACTCTCTGGACGATGTTGGATCTGGATGATAAAGTGGACATCAATTCTGGTATTAGTCAATTACGTAAACTTCCACATTTTGCTGAGCGTCTGTTTCTCGTCGGTGACACATTCCATGATTTCCAAGCCGATAAAAAATATGCAAGACTTTTTTTGAAATGGAAACGGTTCATGTTGGAAAGCCTCGAGATTGATTCTATGGTGAATGAGACTATAGAATCGTTCAAAACGTACCGAAAGAAGGCTGTTAAAAATGGGAATGCAATCCGGAACGTTCATATTGAAATTTTTCCCATATTGTTGAAGCGACTTCGGCAAGATTTCAAGAGATTCCAAGAATCCAGAGCTCAAATTTCCAAAAGCATTAAAGAAATAAAAGACACTTATTTTGATATTACTTCAAATACTTCAAAAAAGGTCGGTCTTCAGGCTTCCAACGGTCTCGCCGTCCAAACTATCGAATCACTGAAGTCGTTTATCAACGAGGGTGTTTTCAAGATCAGAAGTCACGTGGGAAAATGTTTGCCAATGAAAAAAGCCTATTACAACATCACGTGTCTGTTATGCCATGACATCTTCCGATCTTGGAATCGCTATTTTCTGTTGTTTTTTGCCTGCGCCTTCCTTACGACAATCTCCATCATCGTTTCCATGGTTACTGTGATCTGAATAATCGTGTTTTATCGCTGGAAAGTTCGCGTAGACTGGTAACGAATTAGGACTGAGCTCTGAAATTCGCTTTGGAGATCGAGAACGAGACGAGGGAAAGACAGCTCCTGCTCAATTCCCGAGATGATTTG
>MW805831.1 Corticium thailandicum isolate MG242 TYPE large subunit ribosomal RNA gene, partial sequence 
TCTAGCATATCAATAAGCGGAGGAAAAGAAACTAACAAGGATTCCCCTAGTAACTGCGAGTGAAGCGGGAAAAGCTCAAATTTAAAATCTGGCGTCCTTAGGGCGTCCGAGTTGTAGTCTGGAGAAGCGTCTTCCGCGCTGGACCATGCATAAATCTCTTGGAACAGAGTATCATAGTGGGTGAGAATCCCGTCTTTGGCATGGACTACCAGTGCTTTGTGATGCGCTCTCAAAGAGTCGCGTTGTTTGGGAATGCAGCGCAAAATGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGCACTTTGGAAAGAGAGTTAAACAGTACGTGAAATTGTTGAAAGGGAAACGCTTGAAGTCAGTCGCGTCGTTCGGGACTCAGCCTTGCTTCTGCTTGGTGTATTTCCTGTACGACGGGCCAGCATCGATTTTGATCGTTGGAAAAAGTTCAGGGGAAGGTGGCACCTCCGGGTGTGTTATAGCCCCTGTTCGCATGCAACGGTTGGGATCGAGGTTCGCAGCACGCCTTTATGGCCGGGGTTCGCCCACGTACGTGCTTAGGATGCTGGCGTAATGGCTTTAAACGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGCCTGCGAGTGTTTGGGTGTAAAACCCATCCGCGTAATGAAAGTGAAAGTTGAGATCTCTGTCATGGAGAGCATCGACGCCCGGTCTTGAGCTTTGGCGACGGATCTGAGGTTGAGCATGTATGTTGGGACCCGAAAGATGGTGAACTATGCCTGAATAGGGTGAAGCCAGAGGAAACTCTGGTGGAGGCTCGTAGCGATTCTGACGTGCAAATCGATCGTCAAATTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCTGCCGA
>XR_004926052.1 PREDICTED: Halichoerus grypus uncharacterized LOC118553476 (LOC118553476), ncRNA 
GCCCAGACAGAAGAGGCAGGCGCGTGTAACACAGAGCCTGGCCCTGGCCTGTCACGGCCTTCCTGTCTCTGCAGCTGGGCTGGGGCAGAAGCCGAAGTGAACTCGGGCCTGCAGACAGAGGCTTACCGCCAAGGTTTTCCAGAAGAGGGAAGTCCACTCTTTCAAAGACACAGCTGGAGTCAGACGGGGCAGGACAGCCCCTCTGAGGCTGACCCCTGCACAGTGTCCCTTCCTGACTCAGGAAAGGTCTACTCCTGCGCTGTCCCAACATGCCGGCCGCCAGCCACGCGGGGCTCCTGGGCACTTGAAATGCGGCTGGCGTGACCCTAGGTGTGCTACAAAGTACCAGTACACCCCAGGTTTTGAAGACTTGGTATGGAAAAAAAAAAGTAAAATATCTGTAATAATTTTCTGTATCGACTGCATGTTGAAATGACAGTACTTGGAGTAA
>XM_028734882.1 PREDICTED: Podarcis muralis zinc finger protein 341 (ZNF341), transcript variant X4, mRNA 
ACATTAGTCCAGGGGAATATCTTAGTGAGTGATGAGGTCTTGATGTCAGCTATGTCTGCTTTTACAACCCTGGACCAACCAATGTCCACAGTACAACCCTCTGTGCAGCCTGAATATGCATACTGGAGCTGGCTACCTTTCTCAACCACCACCTCCTCCTCCTCCTCCACCACCACCACCTCAGCCTCCTCCTCCCACACCTCAGTCTCTTGGAGCACCAGGTCAGGCCAACTCAGGCAGCAATGGAGTGGTGGAAGTGTACAGTGCATCAACCCCCATGACTGGGAATAGCACAGTAGAGATACAGAATCTGGGGATGCAACCCTACCCACCTATGGAGGTGCCCAATCAATGTGTGGAAACCCCAGTGTACCCCTCCCCTCCAGTATACAGTCCAGGGAAGCAAGGTTTTAAGTCTAAAAGCCCCAACACTGTTTCTCCCTTGAACAATGCCTGCGGAGGAAATGTGACCAGTTTTGATCCGGCTTCAGCTGCCAAGAACCGTCGTCTTAAGACAGACAGCAGCCTGCTAGAAGGGAAACCCAAGTCACCAAAACTGAAATGCACATACTGCGATAAGGCATTCACCAAGAACTTTGACCTGCAGCAGCATATCAGAAGTCACACAGGGGAGAAGCCATTCCAGTGCATCGTATGTGGTCGTGCCTTCGCCCAAAAGTCCAACGTGAAAAAGCATATGCAGACGCATAAGGTGTGGCCACCAGGAATTGGGTGTACCATCTCTCGGAGCTCTGTCACTGTGCAAGTCATGGCACTCAACCCCAACCAGCAGGAGGAGGAGAATGCAGGTTTGAACACGGTTCCCAGAAGCAGCCCCCCACCGCCACAGGTCATGCCTCCTGCAGAAGAGCATGAGGCTTGCAAACTGGAAGCTAAGCAAGTGGTCTTGATAGACAGTTCTTACCAGTGCCAGTTCTGCCCCAACAAATTCTGCACATATTTCCAGTTGAAATCGCACATGACCCAACACAAACATGAACAGGTTTACAAGTGTGTTGTGAAAAGTTGTGCTCAAACATTCCAGAAGCTGGATTCCTTCTTGGAGCACATCAAGAACCATCAGGAGGAGCTGAGCTACCGTTGCCACCTTTGCAGCAAGGACTTCCCCTCCCTCTATGAACTGGGTGTCCATCAGTATTCCCACAGCTTGCTCCCTCAACACAGTCCCAAGAAGGACATTGCCATTTACAAGTGTGTCAAGTGTGTAAATAAATATTCTACCCCAGAAGCCCTGGAGCATCACTTACAGACAGCAACACACAACTTTCCCTGTCCTCACTGTCAGAAGGTGTTCCCTTGTGAGAGGTACTTACGGCGACATCTACCTACACATGGGGGTGGAGGGAAATTCAAATGTCAGATCTGCAAAAAATTCTTCCGCCGAGAACACTACCTCAAACTACACGCTCACATTCACTCGGGTGAAAAACCTTTTAAATGCTCTGTGTGTGACTCAGCCTTCAACAGGAAAGATAAACTCAAACGGCATATGTTGATCCATGAGCCTTTCAAGAAATATAAATGCCCCTTCTCAAATCATACAGGCTGCAATAAAGAGTTCAACAGACCGGACAAATTGAAAGCTCATATTCTCTCCCATTCAGGGATGAAGATCCACAAGTGCCAATACTGCAGCAAGGCCTTCAGCCGGCGAGCTCACATGGTGGAACACCAGCGCTCTCACACTGGAAACTATAAGTACCGCTGCCCTACATGCAGCAAAGGCTTTACACGCCAGAAGTACATGAAGGACCACAAGTGTAGACTGAGTTCAGCCAAGGACAAAGAGCTGCCAGTGAGAAAATCCCAGAAGAAGTGGGGGACTCGTGGCCGGAAAGTGGGGCTTCCTGTTTCAGCTCAGTTGACCTTGACAGAACTGAAAGACAGTACAGATGGAGGAAACCCTCAGAAAGGTGGTCCCAATAAAGAACAGTTTCCAGTGTCTGACACAGTCCTGTCCATTGTGGTTGGCAGATCAACGGCCGTGTCGGCAACAGACTCTGATCTTGGCAACCCTACCCAATGCAGTGGCATTCCATCCAACCTTGCTCTGGCCGAGTTGCAGCCTGGCTCGGAGAGTCCATGCGCCATGCTAGCAGTTCCTGTATACATTCAGGCTACTGAATAACTGAATAGTACTGTGACTTAATGGGGGAAATAATTCCTCTGCTGTTTGATGGAGATACGCTGCTGCAGGGGATTGGAAATGAATGAAATGTGTATGTGTACTGTATGTGTGAGTGTATGTTTCAGCTGCCGTGATGCAGTGATCAGCATTCATAAAGAATTTTGTTGATAAAA
>XM_046012474.1 PREDICTED: Meles meles microfibril associated protein 5 (MFAP5), transcript variant X3, mRNA 
CAGCCCCCTTCTCATTCCCGCCTCATCACACTCCTCTAGCCTGGCTTTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCCCTCGCTCTCCCTCATCTCATTGTTTCAGAGTAGGCCGAATTTGAAGTCCTTCCCAGGGAGTGGCCCTGTTCATCTTATTCGCCAGCCAAAGTAGAAACAGTGTGAGAAGGAGAGAGGCCCATTCGGCAGCCAAAGGACTCGGTGGAAAAGAGCAGAGGAAAAATACACAATATGCTGCTCGTGGGACCCAAGGTGCTGCTGTTCCTCACCGCCCTCATCATCCCCTCTGATGATGTGACTCCAGTGACTCCAGAGACATTCACAGAAGATCCTAATCTGGTGAATGAGCCTTCTACAGATGAAACAGTTCTGGCTGATATGGAGCCTTCCACAGATGACCTGGCTTCTCCTGCTGATAAAAATACCACAACAGACTGCCGGGATGAAAAATTTGCTTGCACGAGACTCTACTCTGTGCATCGGCCAGTCAAGCAATGCATTCATCAGTTATGTTTCACAAGTTTACGACGTATGTACATCATCAACAATGAGATCTGCTCTCGTCTTGTCTGTAAAGAACACGAAGTTATGAAAGACGAACTTTGCCGTCAGATGGCTGGTTTACCCCCAAGACGACTCCGTCGCTCCCACTACTTCCGACTTCCACCCTGTGAAAATGTGAATTTGCAGAGACCCAGCGGTCTGTGATCACCAAGGAAGAGGAAAGAATAATGTGTGGGTGGGAGGAAGAGAATGCTCTAACAAGAGGGAACTCCTTCTTGTCCAACCATTGTCCACTAACCCATAGACATTAGGATTTCTTAAACCAATCCCTTTGCAGCGCCTAACTTTTGCCTCCATTCCCTGACTGATAACAAAGTCTATATTATTGCATGGTTTTGCTGTTTCTCAGTATCATAGATGTAGATTAATGATAACCATGTGGCTTATATACAAACATCCTACACACAATTTCAAAGGAAAATAAACTTTAGGTTAATATTTA
>XM_052001689.1 PREDICTED: Antechinus flavipes supervillin (LOC127564871), transcript variant X20, mRNA 
CTTCCCATCCTATTCGTCTTCCCTTTTGTCATGATTTTTCCTTTTTTCTGTTTCCTTTCTATCTTCTTTATTTTTCTCTTCCTGATTTTCCCTCTCCCTTTTTGTGTTTTTTCTTTCCTTATCTCTTCTCTTACCTTTATTCATCTTCTGAAACCAAAATCAAGATCTCTACTCATGAATATCTATTTCAACAAGAAAAGATCAGACCTTTTCCAGCTACCACATCAAAGAAGAATATCAAGCTTTCAGAGAGAATTTTCACTTGAAGAAAAGGAACAACTTGTCAACAATAGAAAGGATATCGATGCTAATCTTTTAACTGTACTTCCCAAAGTTGCAGAACTAAGAAAACTCTTTGAGCCAAAGAGAAAAGAAGTTTTAGAAATGAAGAGAAAAGAACGGATTGCCAGACGCTTGGAAGGCATTGAAAATGATTCGCAGCCCATACTCTTGCAGAGCTGTACAGGATTAGTTACCCACCGATTACTAGAAGAAGATACTCCCCGATATACGCGAGCTACAGACCCTTATAGCCCCCATATTGGTCGATCCAATGAAGAGGAGGAAACTTCAGATTCTTCTGTAGAGAAGCAACCTCGATCCCGATATTGCATAGAAACTACCACCCTCAATACAGAGTCATCCTACAGCCCAGTGACGATGGACACCCAGGGACTGGACTCCAAAGCTGAGAGAATAGCCAGATATAAGGCTGAAAGAAGGAGACAGCTTGCTGAAAAATATGGGCTGACTCTGGATTCCGATGCAGACTCTGAATATATGTCGCGTTATACTAAGACCAGGAAGGATCATGATGTCGAGAGGAGGGGAGGTAAAAGTGAGAAGCAGGAGGAGGAGAGCAAAGACTTGACTTATCATTATTCTAGGACTGAGACTGTGGAGCCCAGGAGCACCACAGCTGAATCCAAGGACTATAGCTTTCATGGGAGTGATGGTGTTATTGATAAGGAGGCGCTGTTGAATGTGGAAAACCACAGAAGAGCCCAAGAATTGAGTGCAATTGGCCAGATCCGTGACTTGCCACCTGCAGCTGATGGTTCCCCCTCCTTTTCCTTTTCTGGACGAGAATCCTCATTCAGTGACGTGCCAAGGTCTCCCAAGCAGACCCGCAGAGTATCCCTTTCTTCACCTAAGCAGCCAGCATCACCAAGTCATTCACTTACTGACTCATCATTACACGGTGATTCCAGAACGAGATCCACTTCAAATTCAGAAATGCCAACTGCTGAGGATGAAGAAAAATTGGATGAACGCGCCAAGCTGAGTGTTGCTGCCAAAAGGCTCCTTTTCAGGGAAATGGAAAAATCATTTGATGAAAAAAATATTCCAAAGCCACGTTCCAGAAATGCAGCCGTGGAGCGACGCCTTCGCCGTTTGCAGGACAGATCTCACACACAGCCCATCACCACTGAGGAAGTGGTCATTGCAGCAACTTTGCAGGCATCGGCACACCAAAAGGCACTAGCTAGAGAACAGGCAAATGAGGCCAAAGATTCTGCTGAACAAGGTGAACCTGATTCCTCCACTCTGAGCTTAGCAGAGAAGCTGGCCTTGTTTAACAAATTGTCCCAGCCAGTCTCAAAAGCGATTTCTACCCGAAACAGAGTGGATGCTAGGCAGAGGAGGATGAATTCTCGTTACCAAACTCAACCAGTCACCCTTGGAGAAGTGGAACAGGTTCAGAGTGGAAAACTCACTCCTTTCTCTCTTACTATTAACACATCTGTGTCTACTGTGGCATCGACAGTTGCTCCAATGTATGCAGGGGATCTACGGACAAAGCCATCGGTGGAAGAAAATGCAGGTGCTGCCGACTTTGGATTCCATTCACCAATGGAAAATGCAGACTGTTCAGTGAAGAGCATCCTAAAGCCACAAGGGTGGCAACCTTTGGGGGAAGATATCAGAAGCAAGCGAGGATCGAGGGAATTTGGGGAGATGGAAACTGAGAGAATCTTAGCTCAAGAGGAGAGGGAAGTGAGAAAGAACAGGTCCTTTGAGGAAGAAGGGAGTTCCTCCCTTTTCCTAAATAAAACTGGGGAAAGGGACAACCAAAGAAAATATACTCCAAGAAAAGGCAGCATGGAACATGCTGACCTCCTAGTGCCATGTCATGAAGAAATACGGGAGTTTTCAGTCACCAAAAGCACTGGACAGAGCAAACAGGACCTGAAGGAAGTGCAAACCTTGGAGGAAAAGATGGATTTGGAGAATGTTGCAAAAAGCAGGTTCATGCTACGAGAGCCTGCTGAGCCCACGTCCGAACTTCCTGGCACGATAGCTACAAAAACTGTTTCTCAGACCACATCCCTGGTCTCCAGTAGACGAGAGTCTTCAGAGCAGTCGGAGGAAAGACTTTCCAAGAATCCATGTAGGATGTTTGCTGGTGGAGAGAGCAAAATATCAGAGGATGCCCTTGATGCATCTAGCAAAACCATGTCCATCAAAGAAAGGTTGGCACTATTGAAAAAGAGTGGAGAAGAAGACTGGAAAACCCGGATTAGCAAAAAGCAAGACTACAGCAAAGTGTGCGTCACTGAACGAAGCACGAGGCTGCAAGAGGCTGAGCAGTCCTTCAAGAAGAAGGAAGAAGGAGGATTTACAGATGATAATGCCATTTCTAATCTGCTTTGGGAACCTGTATACGCTTCTACTTATTTTCCTGCTATGCCTGCTGTCCATAAATACCAGTCTTTTGTACCCATTAATCAGCAGAGGATGGCAGAAAGTCATGAAAGCCAAATGACAATTGAAGAGAGGAAACATCTTATTACTGTAAGAGAAGAAGCCTGGAAGACCAGAGGAAAAGGAGCAGCCAATGATTCCACCCAATTTACCGTTGCTGGCAGGATGGTAAAGAAAGGTTTAGCATCACCTACTGCCATAACTCCAGTAAGCTCCCCCTTTAGCAATCGAATGAAGGGCACTACACCGATCTCCAAACCCCTTGAAGATATAGAAGCCAAACCCGATATGCAGTTAGAGTCGGATCTGAAGCTAGATAGGTTAGAATCATTTCTGGGGAGACTGAATAACAAAGTCGGTGGTATGCAAGAAACCATTCTCACTGTTACTGGAAAAACTGTGAAAGAGGTGATGAAACTGGATGACTATGAGACCTTTTCCAAATTTTACCGCAGCGTGGATTCTGTGCCTCTAGGAAGAGTAGAGTTGGATGAGGATTTTGATGCAATTTTTGATCCTTATGCTCCCAAGCTGACATCTTCTGTGGCAGAGCACAAACGTGCTGTTAGACCTATGCGCAGGGTTCAATCTTCAAGAAATCCCTTGAAAATGCTGGCAGCAAGAGAAGATATTCTTCAAGAATATACTGAACAGAGATTAAATGTTGCTTTCATGGAGTCAAAACGGATGAAAGTTGAAAAAATGTCTGCCAACTCAAATTTCTCAGAAGTCGCCCTCGCCGGTTTAGCTAGTAAAGAAAATTTCAGCAGCGTCAATCTACGGAGTGTCAACCTAACAGAACAAAACTCCAACAATAGTGCTGTGCCCTACAAGAAACTTATGTTGCTACAAATTAAAGGAAGAAGAAATGTGCAGACAAGATTAGTGGAGCCACGAGCTTCATCGTTGAATGGCGGCGATTGCTTTCTCCTGTTAACTCCCCATTACTGCTTCTTGTGGGTAGGAGAATTTGCAAATGTCATCGAGAAAGCTAAGGCATCAGAGCTTGCAACTCTAATTCAGACGAGGAGAGAACTCGGCTGTAGAGCTACTTATATTCAGACCATAGAAGAAGGAATAAATACGCATACCCATGCAGCAAAAGACTTCTGGAAACTCCTGGGTGGCCAGACAAGTTACCAGTCTGCCGGAAATCCAGAAGAAGATGAATTGTATGAAACTGCCATCACAGAAACTAATTGTGTTTATCGCTTAGTGGAAGATAAACTTGTTCCTGATGACTACTACTGGGGCAAAATACCAAAATGTTCTCTTCTGCAGCCAAAAGAGGTCTTAGTGTTTGATTTTGGCAGTGAAGTTTATGTATGGCATGGAAAGGAAGTCACATTAGCACAGAGAAAAATAGCATTCCAATTGGCAAAACACTTGTGGAATGGAACCTTCGACTATGCCAATTGTGACATAAATCCTTTAGATCCTGGAGAGTGCAATCCTCGTATACCCAGAAAAGGACAGGGGCGACCTGATTGGGCAATATTTGGGAGACTTACTGAGCACAATGAGACTATTCTCTTCAAAGAAAAATTTCTTGATTGGACTGAAATGAAGAAGCCTTGTGAAAAGAACTCAAGTGAACTCACCCCACAGAAGGAAGAGCCAAGGTCTGAGGTTAAGGCTTACGATATCATGCTGATGGTCCCCGTGCCCCAAGTGACCGTCGGCACCATCTTGGATGGAGTCAACGTCGGCCGTGGCTACGGGTTTATCGAAGGAGATGACAGGAGGCAGTTCGAGATTGCCAGTGTTTCTGTGGACGTCTGGCACATCTTGGAATTTGACTACAGTAGGCTCCCCAAACAGAGCATCGGGCAGTTCCACGAGGGAGATACGTATGTGGTGAAATGGAAGTACATGGTGAGCACTGCAGTTGGGAGTCGGCAGAAAGGCGAGCACCCGGTCAGGACGGCCGGCAAGGAGAAGTGCGTCTACTTTTTCTGGCAGGGCAGACATTCGACCGTGAGTGAGAAAGGCACGTCGGCGCTGATGACTGTGGAATTAGACGAGGAGAGGGGGGCCCAGGTTCAAGTGCTTCAGGGAAAGGAGCCACCATGTTTTCTGCAGTGCTTTCAAGGAGGAATGGTTGTACACGCAGGGAAGCGAGAAGAAGAAGAAGAAAATGCACAAAATGACTGGAGATTGTACTGTGTCCGAGGAGAAGTTCCCATTGAAGGAAATTTGCTTGAAGTTGCCTGTCACTGTAGCAGCCTGAGATCCAGGACTTCCATGATTGTTCTTAGTGTCAATAAAGCACTCATGTACCTTTGGCATGGGTGCAAAGCACAGGCCCATACAAAGGATGTTGGGAGAACTGCTGCAAATAAAATCAAAGAACAATGTCCCTTGGAAGCAGGATTGCACAGTAGCAGCAAAGTGACGATCCATGAGTGTGATGAAGGGTCAGAGCCACTGGGATTCTGGGATGCGTTAGGAAGGAAAGATCGGAAGGCCTACGACTGCATGCTACAAGATCCTGGGAAGTTTAATTTCACGCCCCGCCTGTTCATCCTCAGTAGTTCATCTGGAGATTTCTCAGCCACGGAATTCATGTATCCTGCCCGTGATCCTTCTGTGGTCAATTCCATGCCCTTCTTACAGGAAGACCTGTACAGTGCCCCTCAGCCAGCACTTTTCCTCGTCGACAACCACCATGAAGTGTATCTCTGGCAAGGGTGGTGGCCAATTGAGAACAAGATAACGGGGTCTGCCAGGATTCGCTGGGCCAACGACCGAAAGTGTGCCATGGAGACGGTGCTTCGGTACTGCAAAGGAAAAAATGTTAAGAAACCCCCCAAGTCCTACCTTCTTCATGCTGGGTTAGAACCTCTGACCTTCACCAATATGTTTCCAAGTTGGGAACATAGAGAAGACATTGCTGAAATCACAGAAATGGATGCAGAAGTTTCTAATCAAATAATTCTTGTGGAAGACGTGTTAGCCAAGCTTTGTAAAACCGTTTATCCGTTGGCTGATCTCTTAGCCAGGCCCCTCCCTGAAGGAGTGGATCCTCTGAAGCTTGAAATCTACCTTACTGATGAAGACTTTGAAATTGCACTAGAGATGACCAGAGAAGAATATAGCATGCTGCCATCTTGGAAACAGGTGAACCTGAAGAAAGCGAAAGGGCTCTTCTAAGCATCGATGCTGCCAGTGGAAGATGAGGCTGGAGAAATCTCTGTGGTCACTTTCAATACCGTTGGGCCAGGAAGATTGACATCTATGTGTCCTGGTCTTCAAATTGTTTAAAAGTCAAAGTAGAAATGATTTGAAGTTATTAGATACTGCCTGAGCTGGAGTTGTGTAATTTTGTAAATGTGTAAGAGAACTCTCTGAAAACTTTCTCCTCCCCGACTCAGAGGGTATTTCCTGTTTGTAAACTTGGCTCTCCCGTGCACTTAAAGCAGTAGCACCTCACAGCTGCTGCTCAGCCCTCCTGGCTCCATCCAGCCTTCGCCTATTCATTTTTGAAGATGCTCTCTTTGTAAAGTGTTATTTTGTTAGCTTGTGGATTATTAAAAAAAATTATATTTATATAAACACCATATAGTTCAAGTATGTATTTAACAAAACAAAATATGTATTCACTTAAAAAAAAATTTTTTTTTGGTGTCAAAACAATACCGAGAAGTAGATGGAGTTGCTTCTACTGAATTATCTATTCCACAGTCTATGTATCTTATACACGTTCTGAAACGTTTCCTTTGGCAGTGGGCAAGGGGCTATTCTAAGGAGTACCACCGGTGCTTAAAGGAACAAAACTTTTATACTTAGGGCTGGAGACTCTGGAGAAACTCTGTGACCTTCATACCTTAATATCCAAAAACAAACAAAAACATGTATAGTGCCTTGTTTTGTGTACAGTTTATATACAAAAAAGTTTGGGTCTGCGTTTTTGAAGATGGTTTGGAACAGTATCAACAATTTTACTTTACAATGATCGAGGTTTAAAAAAAAAAAAAAACATCTCAGTTTATAATACTTGTAAACACATCTTTTTGTGATATAAGATTCCAAAGTACGAGCTTCAGAATAAAACTTTGGCAATGA
>XR_003381398.1 PREDICTED: Zonotrichia albicollis uncharacterized LOC113459830 (LOC113459830), ncRNA 
TACTATGATGATGAAGATGCTCTAAAAATATACAGAATCTAATCTAGTTTAGATTTGACTGAAATAAACATGGACAAGGATATGTTGGGAGATGATCCTTTTACTTGGAACTTTCACCTTAGTGTGGGACTGTGCAGATTGATCTGGAGGATTTCTATTTTGGATGCCATTAAGCCATCTTGTATCTTCTAGCAGGAAGTCAGAGTAGCATCTCGACTGCATCTTCAAACAAGACTTTTGCAAGCTGATGCTCACAAGGGGCTCTGTTTAGAGGTTTGTTCCTGTGGGGAGGCAGGCAGCTCCTCCTGGTTGCTTCTGAAAGCTTCTCTTCATTGCACTTTCCATCTGCACTGGCTTCTGTTTTAGCCACTAAGGTCAAGTCGGTGTGGTTTTCCCACTCTGCCTGTTGCATTAGTGGCACTCTGGAAGTGAGACTTGCACTGGATGGGAAGTGTTTGGTGAATTTTTAAATACCATTATTGATTTCACATTAATTTTCTTTATGAACCGGGCAAAGCTCTTATGCGAGGGTATAACAGCCAAGAAATATTTGACAAGTTGTTTAAAATCTATTGCCTGGAAGAAGCCTGATAGATCAATTAATTTATTTCCCTGCTATTTCAATATATCCTTTAAACATATTTTCACTGATTGTTATTACCCATCCTGAAGTATACAGCACAAAAGCAATCATATATTACCTGCAGCAGAGGGGGCTGCCTCCTGGATCTCTGTCCACAAGAGATATAGATATTTTGCCCAAAGTTGGTTTTTTCCTTGCCTTCAATGAAACATGATTAGAACATAATGATTTTGCCTCTGCATCAGTCCACACCAACTCTATGGTGTTTTAGGGCATCAAACCTGTAAAAAGGGCAGATTCTTTTACATATGCAAACTCCTCTACCTGTTACATCAGTTTATTTCACATTCCACCAGTGTTCCTTTGGATACAGATTATTGATTGCTCCCTAGTGAATACCTTTTTAGTCATTCTTTGGCCTCAGAAAATTACCTTTGAATGTTTTATGCAAGAGTATTCATTATGAACAATTAATGTACTGAAAATGTCAGCACCTCAAGCAGGCATTTTATAAAAGATGAGTAAATTTATGGTAATGCATCATTCAAACTTCCTGCACTTTTCATTCTTTTAAAATTTATGTCTTACATTGCAGTTCAATAGCCTGTAACAATTTGATGACCTGAGTGGAATAATGTCAAAAATGTCTGTGTATTTTAGAAAAAATTTAGAAATTAAGATTTTTATTTTTGCTATTACTGTTTTTAGGTATGTCACAGCTTTATAGTAACGCGAAGTATTTGCTTTATGACAGCTCTTCACATGCTTTTTAATCAGAAGTGAAAAAAACTTGGTTCAGAGCAAGCTTCAGTCTACATAGATCCATTCATAGAAAGTGAGGAAAGTCTTTTGTATCAAGTGGAGGGTGAAAAGACTACTTGTACCCATTTATATTGATATTTGTTAAGTTTTATAATATAGAACACCCTGAATTTAAACCTCTTAAACTTTTCCCTTTGACATGTGGAAGGATCTCAGATTGTTTTGCTTAATTTAGTAAGCTTTAAGCCTCGAAAATGATGCGTGTTTCACATCGCTGTCCAAACGCTCTAAAAAAGTATTTTTAAGGCACTGCCAGCTAATTACCCAA
>XM_020665074.1 PREDICTED: Amborella trichopoda ABC transporter G family member 11 (LOC18430567), mRNA 
TAATCTGTCTCGATCTCTTCAAGAATTGGGTTGATCTCTCTCTCTGTGTCTCAATCTCAATGGCCTCACTCCATTCTGTCCCAAAATGGATGCCGAGCTCGAGCCCAACACAATCCACAAACCCTCTCCTCAGCCACCCTCCCTTCCAACAAGAATCCGAAGACCACATCTCTCTTGATGAAATTACTCCGAAACCATTGCAAAGAAACCCGAGCCTAAAAATCTCTGACATTGATGAAAATGCATCGGGCACCAGCAAGCGCTTCTTCCACCTCCATGCACCAGCTCTCCAACCAGGCAATATTCGCTCCGAGCCCACTTCTGGGAGGAGTGTCGAAATGGGCAGGACCCAGCACAAGTCGGTTCAAGTGGATATGGATCCACTTGGCTCGGCTGGTTCCGGTGTGTCACTAACGTGGACCAACCTATGTGTCATGGCTGATGGGAAAGAGGGTGGAAGCACAATTTTAAGGGGGCTCAATGGGTGCGCCCAACCAGGCGAATTTTTGGCTATCATGGGTCCATCAGGCTGTGGAAAGTCGACCCTTCTCAATGCACTTGCTGGGAGGTTAAATTCTAATGTAGTGCAANNTATCAACGGTCGTAAACAAGCCCTGGCATATGGAACCTCGGCTTATGCGACCCAGGATGATACACTCATGAGCACTCTAACAGTATGGGAAGCGGTGTACTACTCAGCCCAGCTCCGATTGCCAAGCTCCATGTCGAGCTCTCAAAAGATAGAGGGGGCTGAGATAACCATTCAAGAGATGGGTTTACAAGATGCAATACACACAAGGATTGGGGCCTGGGGGGTTAAGGGACTCAGCGGTGGCCAAAAGAGAAGAGTGAGCATTTGCATTGAGATCCTCACGAGACCTAGCCTTCTCTTTCTTGATGAGCCCACTAGTGGGCTCGACAGTGCTGCGTCTTACCATGTCATGACTCGAATTGCCCGTTTGGCCCTGCATGATGATCGAACTGTGGTTGCTTCGATACACCAGCCTAGTGCTGAGGTCTTCGGCCTCTTCAACACACTATGCCTCCTCTCCGGTGGGAAGACACTGCATTTTGGCCGGGCTTCCGAAGCCAATGCCGTTTTTACACTCAATGGCTTCCCTTGCCCTTCATTGAGAAACCCCTCGGATCATTTCCTCCACACCATTAACACCGATTTTGACAAGGATATTGAGCAAGGTTCCGATGCCGAGGCAACAGAAGCTGCTAAGGCGATTGATATCTTAGTCAACTCTTACAATTCCACCATTGCAAACCAAGTCTTTGCTCATGTAGCTGATATCTCCAAGAGGGAGGGAGAAGCATTGACAAAGAAAGGGAGCCAAGCAAGCTTCTTTACACAAGCGTCCGCCTTAACAAGAAGATCTTTTGTGAATATGTATAGGGATTTCGGTTACTACCGGTTGCGCCTAGCAATCTACATTGCGTTGTGCCTGTGCATAGGTACCATCTTCTTTGACATTTGCCACAGCTTTGGCTCTATTCAGGCAAGAGGGTCCATGCTCATGTTTGTTGCAGCATTCTTGACGTTCATGGCGATTGGAGGCTTCCCCTCCTTTGTGGAGGACATGAAGGTCCCTTTTAATTACTATATTTTCATATAG
>XM_457077.1 Debaryomyces hansenii CBS767 DEHA2B02508p (DEHA2B02508g), partial mRNA 
ATGTACGATTCGTTCGCTAGTTATCCGCATAATTACTATACTAAAAGTGATGATGAGACAGAAATTCCTCCAACTACTTTTCCTGGTGAAAATTTGTTGACCAAGGACCATTTGCTAGAACAATTGCAGCCAATATTAATCATCAGTGATCCATCCGAATGTAACAATAACTTAAGTCTTTTTATGAAGTTAATCGTTGAGAATATATATGACCAAAATGAAGAAACTACACATAATTATCAAAAATTATCATCTTATGCACTTAAATTGTTGACCCTGAATTTATTTATCAAGAACTACGAATTGTGCCTCGGTAAAATATTAGGATTATTGGCAGCTTTAAGTCGGGACACATTGTGCTCAAGTGAAGGTATCGATGAAGATGTGAAGTTTGAAATCGAGTCATTACGGGAGTTCATTTGCATTATTTTACTTTTACTTTTGAAGTTGACTAATAGCCCAGGAGAGAAGAGCGAAAGATCAAAAATATTGGAAACAGTCGATAGAAATGAGTTGTACGAGATCTTGTCCGACCTTGGAATTATACCTATCATCGCTAATGTTATAACAAATCATATTGTGACCACCGATAAATCTAAATCCCCGTTCTTGTTATTGAAATTTGGTGGGGATATTATATTTGAATATCTCTACAATTGTGAATTATTGTCTGATGTCGAGTTTAATAGTTTGACTAGCGAGACCAACTTAATCCCTACCATTATTAAGCATTTACTAACAAACGACGATTTTGATAATTATGATACTGATGCTGACGATTGGGAGGGTGAAAATAAACTATTTATATATGAGGAGTTTAAGTTATTGTTACTCATCAATGAACAATATTTGATGAAATCATATTCGTCCAAAGAATCAAAAAATAAAGTTTTTGATGGCTTAATGATGGGAGATGCTCATCTATCCTCAGAAAATTCACAACCAAGTAATAAACAGATTAATGGGTTTATCAACTTGTTGATTTATTACATTAATCGTGAGGAGTCTCAAATTATTAAAATCCTTATCTTAAAATTCTTATACCTTATATTTACAACTTCCTACACTGCAAAATTGTTTTATTTGAACGACCTAAAGATTTTGTTGGATATAATCATTCGTGAATTGAACAATCTAGACTATAGTGGGAATGCGAATGGAATATTGATTGTCACATATTTAAAAGTTTTGTATCCTTTGTTGATGTTCTCTCAATTAAGTGAATTGCCCGAAGGTTATAAGAATGAAGGTATATTAGAAATTTTGAGAAACTTGGTTCTTAATTCTGAGTCAGGTAATCGTAAGACAACTGAAATTTCTGAAGCAACCGACGAAAACCAAGCAGATATTATTGCAAAGCTATCATTACGGTGTATGTCTATACCTTGGTTGAGGAAGCCACAATTGAGTAAGAGAAAAAACCAAGACAACCCTAACTTGATAAATAACGTTTATGGAAAGTTATCTGCTGCTTCCTCTTCATCATCCTTGAATTCGAAACTGAGCTTTGTGGGAAAACGTTCTGAATTGTACGAGAGTTCTGATATTTCAAGTGAATCGCTTGGTAAGGCCTTCACCCGAATTGCATCCGTCAGAACTTCAGTAAGAAGCGACTATCATAAGCATGCACTAGTGCATAACGAAAACGACCAAGTGGGCCCAAACGGTCTGAAGAGCTCTTATGTCGAAAATAACCATAATATTTTCTTAGATAATGATTTTAAGTCATTATCAATTAATACCACGGAAGATTTTGCTAATTCTCCTTGGATTCCAATATCAGATGAGTCGAATTTGCTAGATTTACCAAAAGAATATTTAAAAGATGAGCCAGTACAGCCCTTAAAAAGACCAGAGTCTGCATCATCCTCAATTAAGTCAGATTCGAGTCTAGCACAAAAGGCATCAAAGAAGAAGGCACCGCCACCACCTCTTCCACCGAAAAGTTTCCTGCCGAAACCTAATCATATACATTTCGAAAAGAGATCTCAATCACAAACACCACCACCACCACCACCTCCTCCTCCTCCAAGACGCAGGCGTTTGTTACATCTATGTGAGCATTAA
>XM_042466471.1 PREDICTED: Sceloporus undulatus RNA binding motif protein 46 (RBM46), transcript variant X1, mRNA 
GGCGCGGGAGAGGCTCAGAGGCGCTGGCCTCTGCGTGGGGCAGTTGTTGTTTGTTTCTCCACGTGGGAGGAAGGAAGAGGGGAGGCATTGCTGCTGCTTCTTCTTCCCTCAAGGCGATATTTTCCCTGTCAGGTTTGTTGGATGTGGATGACTGACCAAGTCGGAATCTAATTGTGCACATTGTGGATTTGAAAACTGTTCAGATTTTATTTCTGAAGGCTACAGAACAGAGTAAATAAATTACAAAAAGTAGAACTCTGTAAGTTTCCATCATAGTTATTTCTTAACGTTTTCTGAAGACGGTAAAGCAATGAATGAAGAACAGACAGATGTTACAAATGGCTGCAGCAAAGTTAGAACGGGTACTCAGAACGAAGCTGCGTTATTGGCTCTTATGGAAAAGACTGGTTACAATATGGTTCAAGAAAACGGTCAAAGAAAATTTGGTGGACCTCCACCAGGTTGGGAAGGTCCACCACCACCACGAGGCTGTGAAGTTTTTGTGGGAAAAATTCCCCGTGATATGTATGAAGATGAACTAGTTCCTGTTTTTGAAAGAGCTGGGAAGATCTATGAATTCAGGCTGATGATGGAATTTAGTGGCGAGAATCGTGGATATGCATTTGTAATGTATACAACCAAAGAAGAAGCTCAGCTCGCTATTCGGATCCTTAATAATTATGAGATTCGTCCTGGGAAGTTTATTGGAGTTTGTGTAAGTTTGGACAACTGCAGACTATTTATTGGAGCTATTCCAAAAGAAAAGAAAAAAGAAGAGATCTTAGATGAAATGAAAAAAGTCACCGAAGGTGTAGTGGATGTTATTGTGTATCCAAGTGCAACCGATAAGACAAAGAATCGTGGGTTTGCTTTTGTTGAATATGAATCCCACAGAGCTGCAGCTATGGCAAGAAGGAAACTCATTCCTGGAACATTCCAGTTATGGGGCCATACTATTCAGGTAGATTGGGCAGACCCAGAAAAAGAAGTGGACGAAGAAACAATGCAGAGGGTTAAAGTATTATATGTTCGAAACCTGATGATCTCAACTACAGAAGAAACAATTAAGGCTGAATTTAACAAATTTAAGCCAGGAGCTGTTGAGCGTGTGAAAAAACTTCGAGATTATGCTTTTGTTCACTTCTTCAATCGAGATGATGCAGTTGCAGCTATGTCAGTTATGAATGGGAAGTGCATTGATGGAGCTAGTATTGAGGTAACACTAGCCAAGCCAGTAAACAAAGAAAGCACTTGGAGACAGCATCTTAATGGTCAAATTAGTCCCAGTTCTGAAAATCTTCTTGTCTTTGCAAACAAAGAAGATGGTCATCAGAAGTCTCTAGCAAAGCCAGCAAATCTTCCAATTCGCCTTAATGGACAGCATAGTCCTAGTCCTCCTGAAATTGAAAGGTGTTCTTACCCATTTTTCCCAGGAACAAAGCTTACTCCAATTAGTATATTCTCATTAAAATCTAGTCATTTTAGTTCTGCAACAATGCAGCTAGATTATTATTGCAATAAAAATAACTGGGCACCTCCAGAATATTACTTGTATTCAACAACAAGTCAAGATGGAAAGGTACTACTAGTATATAAGATTGTTATTCCTACTGTTGCCAATGGATCCCAGAGTTATTTTATGCCAGACAAACTTTGCACTACAGTAGAAGATGCAAAAGAGCTGGCTGCACAGTTTGCTTTGCTGCACTTGGATTACAATTTCCGCCGAAGTTCAATAAATAACATTTCCCCAGTTAGTGCTACTCTTTCTTCTGGAACCACCAGTGTGCTGTCATATACATCAAGACCATACTCTTATCCAAGCTATCCTTTGTCACCATCAATTCCACTTGCTAGTAACAACCATGTTGGGCAGCGTCTGTATATCTCCAATCAGGGCTCATTCTTTTAAGGAAAAGAAAAACATGGATGAAAATAGTATACTCTTATTTTAATATTATGTAGTTTCAGTTTTAATTGTGTCCATGCAATTGGTTTTGATGAGTTCAGTATATCTATATATTTCAAATTACATATAAATTAACTGAATTTGGGTGAAGATAAAAGTTCCAAATGTGTTCTATCTTGGCAAGAAGAAATGCTTCCTAAAATATGGCACAGAATTTTATGATTGTCAAACAAGACAAGAAAACCCATTTAACATTTTTAAAGTAATTACTTTCCTGAATAGTAGCTTTAAAATATTTAAAGTGCATGCAATTGTTGGTTCTAATCTTGTTACCAAGGATCACCTCTGTTTTTTGGAGATGAAAAACAAAATAGTCAAAATGCATGTAATCAAAAAGCAAAGTATTATGTAAGAAAGAAATGATGCTGATGAAAGATTTTTTTAAAGAATACAAACTTTATTTAACTCCAGATTAATAACCTCTATACTACTGTGGTCCTTATAAATCACTTTGCATATTTTAGTTGCATGACAAATATTTGTTTTATGATTAGAATATATTATTTTGTGTTACTTTATCCATGTTAACACTGTTAATCTCTATTTGTTAAAGGTACTGTTCTGTTTACGTGTTGTCATGTTT
>XM_019277554.2 PREDICTED: Larimichthys crocea E3 SUMO-protein ligase RanBP2 (LOC104918663), transcript variant X1, mRNA 
TTGACGGTATTGAGACTGCGCAATAGCATCATGGGGAGCTAACGTCAGTCGAGGCTCACATTAATGTCGGTTTGTTTTATAGTTTGTTAAATCCTCCCGCTGTTCGGTTGTGCCCGGAATAATCAGCCGTTTTTAGGGAGCCATGAGGCGGAGTAAGGTTGAAGTGGACCGGTACGTCTCCTCCGTGCAGAGCTCCTCTCCTTCACTCAAAGAGAAGCCAGTCAAAGGGTTTTTATTCGCTAAATTATACTTTGAAGCAAAGGAGTATGAACTTGCAAAAAGACACGTGTCGGAGTATCTGAAAGTCCAGGAGAGAGATCCCAAAGCACACAAATTCCTTGGACAGCTCTACGAGAGAGAGGGAGACCTCAACAAGGCGATAGGATGTTACAAGCGTTCGGTGGATTTGAACCCAGCCCAGAGGGACCTGGTACTGAAGGTGGCTGAGTTACTGGTCAGTAAGGAGGAATGTGACAGCAGAGCAGAGTTTTGGGTGGAGAAAGCTGCCAAGCTCCTGCCAGGAAACCCTGCAATCTTCAACCTGAAGGAGCGTTTGTTGAGTCGTCAGGGTCAGCAGGGTTGGAACCGGTTGTTCGACCTCCTCCAGGCCGAGCTGGCAGCGAGGCCAGCTGACGCTCATGTGAATTTGAAGTTGGTTCAGCTGTTCTGTCAGGACGGGCGGCTAGAGGAAGCCGTTAAGCACTGCCTGGCTGCTGAGAAAAGGGGTGTGCTGAACCACAGTCTGGACTGGTACACCATCGTGCTGCGCACACTGCAGGAGTATCTTGCTCAGCCCAGCGTCTCTAGTAATGAGAAGATGTGTCGACGTCTCCAGAGGGAGCTCCTGTTGGCCCACTGCAGCCTGCTGAGAATCACACTGTCTCAGAGCAGCGTGCAGCCCAGCCTCGATGCCCTCAGAGGTTTTGATGAAGCTATGCAGACGCTGAGCAGCGTTGCTGCTCGCCACATGGACGATCTTTGGGAGGTGTTTGTGGAGATGAGAGGTCACCTCTACATGCATGCTGCCACACTGCTGTTGAAGCTGGCTCAGGATCGCCAACAGACCTGGAGGGCTGTCATTGACCTGGCTGCACTATGCTACCTGTTGGCTTACCAGGTTCCCAGACCAAAGCCTAAAGTGACCAAAAGAGACCAGTCAGCCCCACAGCCACTGGAGCTGCTGGCCAACAGCCGACAGAGTCAGGCCGGCCACATGTTGCTAAACCTGAGCACGGATTCATCCACCTTGATCAGAGAGGTGGTGGAGGCGTTTGGGAACCGTAGTGGTCAGGACTCTCTGTTTGAACTCCTGTTCGGACCACAGGCCTCTGCTGCATCGTCCTTTATTGCAAATGATGACATTCATTCTGTTAACACCACGGCTCCAGAGCTCTCTCAACTGGCCAAATGGGACGCAGGCTCCATCTTGCTGCATGGTGGTAACTTGCAACATCTGAGCTGGCTGGGGCTTCAGTGGACCCTTCTGGCCCAAAGACCGGCCCTGCGAGACTGGCTACAGCAGCTCTTCCCTAGACTTACTCTGGAAACCTCCAAACTGGACACAAACACACCGGAGTCAATCTGCCTGCTGGACCTGGAGGTGTTTTTATACGGCGTGGTGTTCTGCAGCCACTGTCAGCTCCAGGAGACAGCGAAGCTCAGCAGCGGAGTGAACCAGCAGCAACAACAGCAGCTGTATGAACCACGCTGCCTCCCTCTTCCCCTCATTCGCCTCTTGACCACCGACAGACAGAGGGAGTGGTGGGACGCCGTCTACAGCCTCATTCACAAACAAGCAGCTCCTGGTACTTCAGCCAAACTTCGGATGATTGTGCAGCACGGACTGAGCACGCTCAGGGCTGGAGAGAAGAATGGGCTCCAACCAGCACTGGCCATCCACTGGGCTCAGTGTCTCAGCCAGACGGGTGATGGAGTGAACTCGTACTACGACCAGAAGGAATACATCAGCCGCAGTGTCCACTACTGGAAAGTTGTACGTCCTCTGTTGGACAAGATCAAAAACAGACGCAGTATACCAGAACCACTTGAGCCCCTCTTCATGCACTTTCAATCCAAGGATATTCAGATTTCTTCTGTTAGGGGATACGAAGACGAAGCAAACATAGCGTATGCGGCTCTCCTTGACATTGAGGGCAAGACAGAGGAGGCTATCGCTACGTTGGAAACCATCAATAACATGTCATCCATCTGGCATTTGGCACAGATCTACCAGCGGCTATCAGAGGAGGCCAGCAACGGGGTTGAGGAGACCCAAGATAGATGCATAACATTTCTGAGAAAATTCAGGACGTATTTGTCAAAGATCTATAATGCTAATGCAGATGACATCGAGAAGCTGCCTGTTTCTATGGAGGACATTGTGGACCTTCTGAATGATGTGAACCAGCAGCTGGGAGAGAGTGGTGAGGCCATGGATGAAGAAGAAGAGAAGGAGGAACCGGGCCGAAGAGGACCAGCCCACTCCAGCCCTGCTCATCCCACAGAAACCTCTGCCACCATATCCCACATCAAGTTTTCCACTCCCTCCCCGAACAAAAGCCTCATCTCTCCCTCCAAAAGACACCTGATTTCTCCCAAGACACCACCTCACTGGGTCGAGGACCAGAAAAGTCTTCTCCAGATGCTGTGTCAGCAAGTTGAAGCCCTCAAGAATGAGGTCCATGATCTGAGACACAACTCTTCAGGGAACGCAGGTTCCCCTCATCACAAAATGTATGGAGAGAGCTATGGAGCCGAGGGTCTACAGGAGCCTTTTACCCCAGTTCAGTCTTATCATGGGGCCCCCCTAACAGTTGCCACAACAGGCCCCTCTGTGTACTACAACCAATCTCCTGCTTATAACTCTCAGTATCTCCTGCACACAGCAGCAAATGTAACCCCCACCAAGGGCCCAATGTATGGTATGAACCGTATGCCACCTCAGCAGCACATGTATGCCTACCAGCAGCCCACTCATACACCTCCATTGCAAACAGCCCCAGCCTGCATTTACCCTCCTCAAGAACAGGTCTTTGGTGCCCCTCTTCGGTTTGAATCGCCAGCCACAAGCCTACTTTCCCCATATAGTGAGGAATATTATGGCCAGAGTGTAACCCAACAAACGACTAACCCTCCCCTGCCTGAACCTGGCTACTTTACCAAGCCGTCTGTAGTCCCCGTTCAGCCACCAAAGAGCATCGAGGGCAAGCCTGGGAAGCTCTCCTTCAGCCAGCAGGCACCTGCTGAAGTCCCCAAAGTGCCTAGTTTTGGAGCAGGGGCAGTTGCTCAGTCAACACCCTCAAATGCTTTTAAATTCAACTCCAACTTCAAATCCAATGATGGAGATTTCACTTTCTCAGCCTCTCAGGCCAAGCACAGCGAAAGTCTGCTTGGTCTTCTTACATCAGACATTCCCACTAAAACTGACACCGTTCCAGACAAGCCTGCAGCCCACGAGCAGCCCCAAAGCCAAACAGGCATCTTCACCTTTGGCAATAAAAATATTTCTGGCTTTTCTTTTGTTGATTCCACGCAGAACACAGTCAACACTGGAAGTCTATTTGGAAAGGTGGACCAGCCATTTAAATTTGGTGTTGCAAAGTCTGCAGCAGAGGAGGAAAGAGCAGTAGAGAGCGACAATGACAGCACTCATGTTGAGGAGGATGAGGATGGTCCACACTTTGAACCCATTGTACCCCTTCCTGATAAAGTAGATGTGAAAACAGGTGAGGAGGAAGAGGAGGAAATGTTTTGCAACAGGGCAAAGCTATATCGATTTGACACAGAAACAAAAGAGTGGAAGGAGCGGGGCATTGGCAATGTTAAAATCCTAAGACACAGCACAAAAGGGAAGGTCCGCCTCTTAATGAGAAGGGAACAAGTCCTTAAGATTTGTGCCAATCACTACATCACTGCCGATATGCTTCTGAAACCGAATGCCGGCTCAGACAAGTCCTGGGTCTGGAATGCCATTGATTATGCGGATGAAGAACCTAAGCCCGAACAGCTGGCCATCCGCTTCAAAACAGTAGATGAAGCATCACTATTTAAAGCTAAATTCGAGGAAGCCCAGAAAATTGTGCTCAAATCCCCAGAAAAGGACAAACGACAGGAGGAGAAAGAGGAAACTGTAAAAGTTCCTGAATCACTGGCAGCCCAGTTTGCAGCCAAAGCAGGGGAATGGGACTGCACTGTGTGCTATGTAAGAAATAAACCCACGGATATGCAGTGTGCCGCTTGTCAAACTGCCAATCCCAACGCTTCATCCAAGCCAGATATTCAGGCTACTGGTGAAACCAAAGCCAGTCCTTTTACTTTCAAATTTGGAACTGATGCGTCAAAACCCAGTAGTTCTGGCTCTACGTTTACTGGATTTGGTGCTTTTGGAGCTTCTATACCTTCGTCATTTACATTTGGCACCAGTGCCTCAAAGCCTGCTGACACAGTGACCAGTGCATTTGGTTCTGGCTTTGGGGCTCAGTTTGGCAAGAAGCCAGGGCAATGGGACTGTAACACATGTTATACAAGAAATGAGTCCTCTGCAGACAGCTGTATTTCTTGTAACGGTCTTAAAGCAGGCCCTAAAACAACTGTGACGGCACAAACGGCACCAGCTGCTCATGTACCTGATGCACCCTCTGTATCTGCTGTTGATTCTGGGTTTGGTGCCCAGTTTGCCAAGAAGCCGGGGCAGTGGGACTGTGATACATGCGCACTGAGAAATGAAGCCTCTGCTGACAAATGTGTTGCCTGTCAAACCCCCAACCCTGCAGCTAAATCAACAGAGAAGGTTCCCGTGGCATCAAATCAGCCTGCAGTGTCAGGATTTGGGGCAGATTTTGTAAAAAAGGATGGCATGTGGGACTGCAATGCCTGCCTGGTCAGAAATGATGCAACAGCTGTTGAATGTGTTTCCTGTCATGCACAACGTGACACTTTAGGAGCCATGTTTGCCAAGAAGGCTGGAGAATGGGATTGTGACACTTGTCTGGTGAGAAACGATGCCTCTGCCAATCAGTGTGTGTCCTGTCAGACACCAAATCCAAATGCTAAAAGCACAACTAGCACTGCTCCCTCAGCCTCTTCATTTAGCTTTAGCTTTGGAACAAAGAATTCATCAAGCCAGCCTACCGCAACTGGATTCACAATGCCTTTTGAAACTGGAAGCGGTTTTCAGTTTGGTCAAAGCAAAGATAAAAGCTCAGCGGCCTCTTTCAAGTTTGAAGCTCCTCAGTCTGGATCTAATACCACAAGTTCTTCACCCTTCTCTTTCTCAATGCCCATTCCAGCTGGTGGCTTCAAGTTTGGCATTCAGGAGCCTGCAAAAGAAACCCCCTCAACTGATACTCAAGCACCTCCATCAGGGTCAGCTTCCAGTTTTCTGAAAAGCATAGCTGACAAACACAAGGAGAAAGAAAATGTGCCCACACCCTCCGTGGCCCAAACAGAAGAAGATCAAAATCCAATAATTGCTGTTAAACCCAATACATTCAGCTTTGCAGACTTGGCAAAGTCCTCTGGAGGAGATTTCCAGTTTGGCCAGAGTGACCCAAATTTCAAAGGTTTTTCTAGAGCCGGTGAGCAGTTGTTCTCATCATTAGAGGCAACCCCCACCAAGAAGGATGCCTCAAATGAGCCGGAGGACGATGACATGTACAAAACGGAGGAAAATGACGACATTCAGTTTGAACCAGTGGTCCAGATGCCTGAGAAGGTGGACTTAGTAACAGGGGAGGAGGATGAACAAGTGCTTTATTCTCAGCGTGTCAAACTGTTCAGATTTGACTCAGGCACCAGTCAGTGGAAAGAGCGTGGTGTGGGAGTTCTTAAATTCCTGAAGAACAGCACCAATGGCAGGCTAAGGGTGCTGATGAGAAGAGAGCAAGTTCTGAAGGTGTGCGCCAACCACTGGATCACCACCACCATGAATCTGAAGCCCCTGGCAGGCTCAGACAAGGCATGGATATGGTTGGCCAATGACTTCTCTGATGGCGATGCTAAACTTGAACAGCTGGCTGCAAAGTTTAAAAGCCCAGAGCTTGCTGAGGAGTTTAAGCAGAAGTTCGAAGAGTGTCAAAGACTTCTCTTGGACATCCCCCTACAAACCCCCCACAAGCTTGTTGACTCAGGCAGAACAGCACGCCTCATACAGAAAGCAGAGGAAATGAAGTCTGGTTTGAAAGACCTGAAATTCTTTTTGACGGATGAGAAAACTAAGATCAAAGATGATGACAGCCAGGCAGACATTACAAGCAATGTTTCAAGCCTTGTAATCAAGCCACACGGTGAGACCACCGGCCCCACCTTGGAGTGGGATAACTACGACTTAAGAGAAGAGGCTTTAGATGACACTGCCGACTCATCAGTTTATGCATCTCCCATTGCCAGTAGTCCACTGAGGAAAAACCTTTTCCGTTTTGGAGAATCCACTGGCGGCTTCAGCTTCAGCTTCCAACCAGGCATCAGCCCCTCCAAGTCTCCTGCTAAGCTAAACCAGAGTAGGGCCTCAGTGGGCACTGATGATGAGCAGGATGTAACCCAGGATGAGGAGAGGGATGGCCAGTACTTTGAACCTGTAGTCCCCTTGCCTGACCTGGTGGAGATTTCTACAGGAGAGGAGAATGAACAGGTGGTCTTCAGTCACAGGGCCAAATTGTATCGCTATGATAAGGCTCTGGGTCAGTGGAAGGAAAGGGGCATCGGAGACCTCAAGATCTTGCAGAATTATGACACCAAACGAGTCAGGTTGATAATGAGGAGAGACCAGGTCCTTAAGATATGTGCCAACCACTGGATCACATCTGTCATGAAGCTTGAACCTATGAAGGGTGCCGAAAAGGCCTGGGTCTGGAGTGCCTTTGACTTTGCTGAAGCAGGAGAGGGTAATATTGAGCAGCTGGCTGTGAGATTCAAGTTGCAGGACACTGCAAACACATTCAAACAAGTCTTTGAAGAGGCCAAAGTTGCACAAGAAAACAAGAAACTGATGACTCCAGTGACACCTCGGGTCACCACACCCCAAGACAGTGGACCCACAGGATCTGCTCAGACTGCTCCAACTGTATGTGGAAAGGCAGCCATCGCTGTTCTTGAAGAGACCACAAAGGAACGCACAGAGCTTTCCACCGATGGTAAGCCATGTGCAGCTGGGTCTCCGAGTCCAGCCAACCCAACCCAACCCAAGACAGTAGTGTCACCCCCAAAGTTTGTCTTTGGCTCTGATAGCCTTCAGAGGTTTTTTGGTTCTCCAAAATCTCACTCTGAGTCTGAGGAGTCTGCATCCAGCTTGAAAGCCAAAGATTCTGGACGTCCTGCCAAGGCTTCACCTGCAGCGCCTGCATTCAAAATCCCAGAGAGAGGGCTGGATTTTAGGCTTTTCAAAGATAACCCAATGGCTTTTTGGACCAGCACATCAACCACCCAATTTGAACCCCCAGGGCCGCCTCAGACAGAAGGAGGCAGTGCAGGGTCGGATGAGGACTCAGAGGTGGAGGTTGTGTATGTCAGGGAGCCCACTGCTGAACAGGCAGCTTTAGCCAGAAAACTCCTGCTGCCTCTCACATTCTTTTGCTACAAGAATGAACCGGGCTACACAAGCAACGATGAAACTGATGATGAGGACTACGAGTCAGCAGTAAGAGCCTTGAATGGAAAGCTCTACCTTGATCCTCCCGAGAAAAAGGCTGCAGCATGTGGTGGTGATGAGTCAGACTGTCAAGTTGTGTGGGAGAAGAAGCCGACGCCAGAGGAGGAGGAGAAGGCCAAAAGCCTTCAGCTTCCACCCACCTTCTTCTGCGGCCTGAGCACCACAGACAGCGACCCGGATCACGACAAGCCCGAAGACTTTGAGACAGAAGTCCGCAAGGCACAGCAAGACCTGGATGCTCAGTTAAATCAAGCTGACAAGGCCTCCAGCAGCGATGCAACAGCCACAGAGGAGCCAACGTCGAGCCTGGCATCAGGTAGCGCAGACGCTGATGGCAGCGTAGAAGCTGAAGGTAGCACATCTACATCGAAAGAGCAGACCTCAGACCAGCCAGCAGAGACTCCGAGTGAAGCTCCCAGGAGCAGCTCTCCCATTGACCTGTCAACAAAAAAGTGCCCAGAGCCAGAGTCCAACTTTGGGACTGCAGCTGCAGCACCTACTGCTACGACTGCAGCAGGGCTTACTGTTACCACGGCGGCGTCTACTGCCACAACAGCTTTTACAGCTACAGCGCCTTTCACAGCCATGACAGCGGCGTCCACTGCTACAACAGCTTTTACAGCTACAACAGCTTTCACTGCTACTACAACCGCTAGTCAAGACACCTCCAACTTTGGCTTCAACGCATCAGGAGGCTTCTCTTTTGCTGACCTGGCCCAAAACACAGAAGGATTTGCATTTGGATCTAAAGACTCCAACTTTTCATGGGCAAACGCTGGAGCGACAGTGTTTGGGTCGGCTGTGGCCTCTGCACCAAAAAACAACGGCAATGAGGAGGGCAGTGATGAAGAAGACGCTCCTAATAATGTGGACATTCACTTTGAGCCAATAGTGTCCCTACCAGAGGTAGAGACAAAGTCCGGAGAAGAGGACGAGGAGATCCTGTTCAAGGAACGTGCCAAGCTGTACCGATGGGACCGGGACCTCGGCCAGTGGAAGGAGCGTGGCATCGGTGATATTAAGATCCTCTTCCATCCAGTCAAACGTTTCTATAGAATCCTGATGAGAAGAGAGCAGGTGCTGAGGGTTTGCGCCAACCACACAATCTCACCGACGATGGAACTCCAACCCATGAACGCCTCGGCCAACGCACTCATCTGGACGGCCACCGACTACTCAGACGGCACCGGCGTCGTGGAGCAGCTGGCGGCCAAGTTTAAAACCCCAGAGATAGCCGAATCCTTCAAGAAGACTTTCTGCGGGTGTCAGAGCCGAATTGGCAACACTGGTGACGATGCCTCATCTAGTTTCACACAACAGATGTCCAGAGTTCAAGAGCACTCCAGAGACACTAACCCGCGGGTGTTCCTCAAAGTGGCAGCCGATGGCGAAACACTGGGCACGATCACCATCGAGCTTTTCTCCCATATTGTCCCCAAAACTGCAGAGAACTTCAGAGCTCTCTGCACCGGCGAGAAAGGCTTCGGGCTTCTGAACTCCATCTTCCACAGAGTCATACCATCCTTCATGTGTCAGGGTGGTGACATCACCAACAGTGACGGCACAGGAGGCAAGTCCATCTACGGCAGCCAATTTGAGGATGAGAACTTTGACGTTCGTCACACAGGCCCGGGCATCCTGTCTATGGCCAATCGTGGGCGCGACACCAACAACTCGCAGTTCTTCATCACCTTGAAGAAAGCCGAACACCTGGACTTCAAACACGTGGCTTTCGGCTGGGTTCTGAACGGCATGGATGTGGTTCTGCAGATGGGAGAGCTGGGCACAAAGGGAGGACCGCCCACGAAGAAGCTTGTCGTCACAGACTGTGGACAACTCTGACTTTTTTAAATGTTAAGATCAAGATTCACAGCTTGGTTTAGGTTATAAAGACTTTGGATAATGATGCGTTCCCCGTGCAGTGCATACTTTCCTGATTATACTGAGTCCATAGTCATTAGACAGCTGAGAATCAAACACTGATCACACAGGCCTATTGATCAATCATAATAGAAATTGGCTACAGTAGCCTGAGATTAGAAAATATTTTGCTATCCTCTAACAGTCACAGATGGGAAACATGGAGTAGTATGCGGGAGGAGACAAATATAGTACACTTCTTCTGTGTTGCACTTGCATCTTCATCATCGTCTGTCAATAAATTCTGTTTATTTTGTGTACATAATTGTATATGAACTACTTTTTTAATGTTTTTTGTCTTGCATGTGCTCAATTTGAATGTTCTGGTCGTCTTCATAAGCTCCACTCGGGTATTTTTTTTTCTCCCCTTTTTTCTTTTGAAGTCTTAACTATAATTGAAAGGTGAGGCTGTTCTTTGAATGCACTTGTTGGTTTATAACTGTGCCCCTGCCTTCACTCCAAATGCTGCCTCTGTGTACTGTTTACCGTAGGGCTCCCCCAGTGTTTTTTTTTTTTCTTTCTTTCTTTGTGTATGTGGATTTCACAGGTGAATTGGACTTCATACTTTCTCAGAAACTCGAGTCATCTCACTGTGTGGCTAGATGATGACGTTCCATCTGTTTTGAATTTTACCAGGCGATCCTCCAGAATTTGAGATTATTATTACATCGCTGAAGTGAAAAAATAATATGCTGATAAAGGAGAAATAAAGTTTGCTTCACAAGTAA
>XM_051564479.1 Radiomyces spectabilis CAP domain-containing protein (BYT42DRAFT_497200), partial mRNA 
ATGGTTTCTCCCACCTTCATTTCGTTGCAAGTGTTATTCATTGTGGCCGCTTTGATTCAATTGGTCTCGGCGACATCGGCCAAGTCAGCTCAGCACATTGTGGAGCTGCATAACCAGTACCGGGCCAAGCATCAAGCGCCTCCTGTCAAATGGGATCCGAAATTAGCAAGATTTGCTCAAAAATGGTCGAATCGTTGCATATTCGAGCATAGTACCAGCCCGTATGGCGAGAACCTGGCAATGGGCCATAAGAACTGGGCTTCCGCCATTGCTGGTTGGTACAACGAAGAGAAAGACTATGATTACAGCAATCCTGGCTTCACTTCGTCTACGGGTCATTTTACCGCCGTAGTCTGGAAAAGTACCACTCGCATCGGTTGCGGTGTCAAGAATTGCAACGGTGCCAAGCTCTACACATGCTCTTACTCTCCTGCCGGTAACGTTGTCACCACTGACAATCTTCGCTTCAAGCAGAACGTCTTGCCCCCTGTATAA
>XM_043120008.1 PREDICTED: Carya illinoinensis HVA22-like protein k (LOC122307253), transcript variant X1, mRNA 
ATCCTGAAAATTTCCATGATCGCCACTCTTAGGAACCTGCAAAATTCGGTGGGTTTGCGGTTGCTTCTTTGTCCTCTCGGTTCTAATATTGTAATACGGACAGCTTGCTGTTCTGTTGGGATTGCTTTACCTGTGTACTCTACATTCAAGGCAATTGAAAGGAAAGATCAAAATGAGCAACAAAGGTTGCTTTTATATTGGGCAGCTTATGGATCTTTCAGCATTGTGGAAGTCTTTTCTGACAAGCTTCTTTCTTGGTTTCCTTTGTACTACCACGTGAAGTTTGCATTTCTTGTTTGGCTTCAACTTCCATCCACAGATGGGGCCAAGCAATTATACATGAACCACCTACGACCATTCTTCTTGCGGCATCAAGTTAGAATTGATCAAATTATGGGTATTGCATATGGTGAAATGCTTAAACTTATAAGCGCACATCAAACTGAAATTCAATTCGCTAGGAATGTGTTTGTGAAGATTATGGGGGCAGCGGACCAAATGTTAAGAGGGGCTATGAAGCCCGATCAACCTCGACAGAACACTGCAATTGAAGGCCCGTTAAGATCCCCAGATACCCACTCAGATCATAACGATTGATTCCTCTTGTAAGTTTGCATACAACTGAATCATTTTTCCTTGCCGATGAATATAGTCAGCTTGTAGCTGTTATCACTCTTTTTCATTTCCTTGTAAGATGAAGGACCCTTTGCTGTATCTTATCCAGGGGATAGGTGGTATTAGTCTTTGAATGTAAATATTCGGCCATACATGTGGACCTTTAGCGTACATGCGGTTGATTAAAACTCGTATCTATTTGTTTTACCCTGTAATAACACTTCATTTTGTTTTTGTTTTTA
>XM_007831313.1 Pestalotiopsis fici W106-1 hypothetical protein mRNA 
ATGGATTCTCGCTTTCCAGTGTTTCGAGAAGAACTATACAATGTTCAGATGGACGTGAAGCAGCTTGCTCATGTGCAGGTCAGCCACGCTGAAAGATTGGCTCGGCTGGAGAAGCACCAAGCAAATGAGTCGGCTATCAAGTCTGCCTGGAACTCTCCATTCCCCAGCGCTATCGGTGGCACCCCGCAGCATGGCCCTATTCAAATGCCCCCAGTCGATTTATTCGATGACTTTGATGAGGAGCAGGGCCAGAACTTGCTAGGCAGCCTCCATCTCGATGCTGAAGAGGAGCCTGTCCGGCGCGGCGCGGCCTCAAGGGCGAACAGTGTTCGTTTTGACGAGAGCGCCCTTCAGGGCTCTAGCTGGGCTCAGAACGGCCGGCAGTCTGGCGAATTTGTGCCTATCCGACCTGGCAGTGGCATGGGAAACATGATGGAACGCACGTATTCCCACAAATCGGATGGCCGACATAGTTCTGCCGGTTATTCTGTGCACTCTGTGCATTCCCATCATTCTGTAGCTTCTGGTCGTGGCAGTAGTCTTGGTCTAGATACTAACTACGCAACGACTGGTTCCGAGGAGGACTCGCCCATTGATGCACCGGCACCGCCGCCCGGTTTTTTCATTCTGGGCTCTGTTCCGTCCATTGTTCGTTGTTGGCTGACAACAAATTTCGCACACGAGACGCTCTTGTATGCAGATATCTGCTCTGGCTCACAGCAATCAGTGCTGGACTATTCACTGATCAAGGAGCTGGAACTATCAGACGAAGTGCACAAGGACCTGGACGGAGTGTATCGAATTCGCTTGCCAGTCTACCTGACTGAGGCCACTGTCACCCACCCGAGCTCAAGAAATTCAAGCCCAACACCGCAGATGCCGAATTTGATTGTTGGCTTTGAAGTCGTTGGACTAGAGCAAGCAGAGTTTCCTGATTTGAAAAAGGGCATCCGCATTTTCATAGGAAGTGAGACTTTGCGAGAACATTCTGCTGACATCTTCTTCTCCCAAAACCGCATGACGCTGTACGGCAGTGAAAGAGAGAAGCTCTCCGTGCCCTTCGTGCGCCCGGAAGATCACAGTGTGTTCAAGTACATTCGTACAGTGGCTGTCCTGCCCGAGAAGCCGCGGCTGAATGCTACAGCGCGTCCTTTCGTCTTGGGTGAGCCCAAGGCGGCGGAAATCTCCAATGAATCTGTCAACGAGATCCAAGAGAAACACGAGCGAGGCGCGCTCGACAAGGAAATACAGTCTCGTGCGCCTGAGGTATCACAGCAACCGACGACTGACCGTGTTACAAGCAACCTGCCTGAAGCCGCAAACGACCGAGACACCCAGGGCAAAGAGGACACTGATGTCTACGAAGCTTCGAACCAAGACCTGTCCGTCTCTGGTGACAATCGCAGTGAGACCACCAGTGACAGCCAGCGCCGTGAGCCAACTGCTAGTGGCATATGGTCTTCTTGGAGACAAGGCTCTTCAACAAACAGTGGTGACCCGAAGGAAAATGCCCCATTGAGCGGATATCAACCACCTGGTCGAGTTCGAAACATGAAAGTCCTGAAGCCAAGCAAAGCCAGTACGTCTTTGTCTACCCGAGCTGGAGTCACTTCGGAGGCGCTTCCGAAATCCAACGGTGAAAATCGTCGTAAAAGTCAACCTGCGGACACTACTCCCACAGGTGTCCTTCGATGGGGCAAGCTTGATCGGGGTTCTGCTTCAGGATCAGACAAGGACTCCAAACCAGCGGCCATCAATGCGGTGCATCGCGAAACCCGGAGCGTGTCCAGCACACCGCGCACTTCTGCCAACCCCGTCGGCGGAGCCTCGGCTTTCTCATGGATGACGCCGATAACTAAAACAAAGCCTTCTACAACCACTGCAGATTAA
>XM_047249926.1 PREDICTED: Schistocerca piceifrons uncharacterized LOC124775103 (LOC124775103), transcript variant X2, mRNA 
ACAGCACACCACAGCGCGCGCGGTCCAGCTGCGACGCAAGCCCGGTGTCCGGAAGCGCCGAGGCCGACGCACACATCCCGGAAACTCACCTCTACGTACCTGCGAACACGCGCACCGTCAGAAGTTGCTTTTTCCAGAGCAGTTCGACCGGATCGGTGTTGCCATTCAGAGACACACCGCATGGTGGCCACCAAAACTGTGAATTGCTCGCCTCACGTGCTCCTTGGACCACGTCAGTGGTCCTTTATGTGCTCTTGGCCACAGTTATTGGGCAAATGTTATCCTATTACGAAGTTACTGCAGGGCTGGCCCAGACAATGGACAGAAATGGTGTTCAAAATCCCTCTAAATTGACTTGGTGCTCCAATGGTGGAAACATTAGGGAATGGATTTAAACAAGAACATAGAATTACCATGATGCTACAAGTTACCAATAACTGATCTTATTTATTTGCTGTTTCAAAATTCCTTATTTTTAGTGCATTGAGAAATAAGTGTATAAACAACCCGCTTCGTTATGGTGACTCCACCATCAGAGGAAACACCTACAGATGCATCACACCAGAAACGGTTGTCAGTGGATTTGTCATTGCCAGCCCGTTGCCATGGTGTAGATATTGCTTTCGATGTGAGAGAAATAATTCCTCGTGACAAACTAAAACAGGAATTTAATGGTAAACTGGCTCAATATGGCAACTTTCCAGATTTCAAAAACGATTTTAGAAATTCTTACCCATCTCAAGTGTCAGATACATCTCCAATCTTGGAGCCCATCTCCACCATTTCATTACACACTGACCAGAAAGCAGTCAGTGACACAGCAAATTGTGCAGTTAAATTTGAAGAAGGTACAAAATCATCAGCAGACAAAAATTCAGAAAAGGATAGCATCTGCAGCAGTAGCCCCTCCAGCAAGGATCATTCAGAGAAGACCAAAGTGCCGGATGGAGGTTGGGGCTGGGTGGTTGTGATTGCATCACTTGTCATCAGCATGATTGCTGATGGTGTAAGTTTCTCCTTTGGGTTATTGTTCATACAGTTGCTGGATCATTTTGGTGAGAGCAAGAGCAAAACATCTTGGATTGGAAGTCTGTTCATGGCAGTCCCACTTTTATCTGGACCGGTTGGAAGTGCTTTGGTAGACAGGTATGGCTGCCGTTGGATGACCATTATAGGAGGCATTGTTTCTGGCATAGGTCTTACATTGAGTGCGTTTGCTGATTCTGTGGAGATGTTGTACATTACATTTGGTCTGATTGCTGGCTTGGGATTAGGACTGTGTTACGTGACAGCAATTGTTAGCATTGCTTACTGGTTTGATAAGAAGAGGACTTTGGCGACTGGTCTGGGCTCATGTGGCACTGGAATTGGTACCTTCATCTATGCACCAATGACGACTTACTTTATTGAAGAGTATGGATGGCGTGGGACGACGTTGCTCCTAGCTGGTACATTCTTCAACATGTGTGTATGTGGAGCACTGATGCGTGATCCAGATTGGTTGGTACTTGAGCAGAGAAAGCAAGCCACAAGCCACTTGTACAAATCTGGACGAGCATCTTCAAGTTGTGCCTCTGTATCTGGCCGATCAGATAATGCTGGTGACTTCCCGGGTGTAGATGGGATCCGCAAAATGCTCTCAAGTGGCCATTCGCCAGAATATGTGCTGACGACATTAGCTGCCAATTTGCAGGACACAGACTTACCCCCAGGAGAATCGGAGGTGGATGGTACAAAAACTCCAGCTTATAGTTCAGTTGTAAATCTCCCCACATTCATTCATAGAAGTGAGAAGGTTCCACTGGAAGTGCTGGAATCACTCTGCACTAAGAGGAGAGTGTTCAGTGTAATAATGGAAAATTATCCAAGCCTACTTTCGTGCAGAAGTATGTCAGATAAAGGTATCAACAAGCTTCCTGTAACATCACACTCAGTTTCTCACCGTATCCCAGTGTCAATGGAGGTCCACATTCCCAAGAAAGAAGAATCAATTCCAGCTTGCGAGTACGAAGGAAACGATGCAGAAAAACCTACTCAGCAGGCTACATCACCACTGCTGCCTAATGGAGGAGTGACACAGCCAATGAATATAATTCCACTGGCTACAGGGCCATCAAACTACCTAAAAGGCATCCGTATGCACAGGAATTCTGTAATGTACAGAGGCGCTATGTTGAAAATACACAAGTATCGGTTGAGAGCGTCATCCTGCCCTGATATCTATCGTAACTCTATGACCACCATAGCAAAGGAAACAGAGGAGAAATGGTATTCTGATATACTGGACCTTTTGAGGGACATTGTGGACTTCTCAATGTTCTTGGAACTGCATTTCCTATTTACATCACTTTCAACTATCCTGCTTTTTACATGGTTTATCGTCCCGTACTTCTATTTGGCTGATTACATGATGCTCTATGGATACACTGAAAATGAAGCATCACTTCTGCTCAGTATTATTGGCCTCACTAACTGCATTGGAATGATTGCTCTTGGATGGGCTGGTGACAAACCCTGGGTGAATGTAACCAAGTCATATGCTTTGTGCTTAGTGATGTGTGGTGTGGCAACTGGATTAATGCCACTAGTCATTACTTCATACTGGATGTTGGCATTACTTTCAGCTCTATTTGGTTTATTTTTTGCATCTTCATTTTCATTTACTCCAGCCATTTTAGTGCAGCTAATACCTCTTGATCGTTTCACAACGGCGTATGGACTGATGCTGCTTTGTGAAGGAATTGGAAATCTTCTTGGCCCACCATTAGGAGGTTTGGTTTTTGATCTGACTGGTTATTGGGATCTTTCCTTCTACTTAGCTGGTGTTTGGATTGTTTTATCAGGCATTCTCATTGCCCTGATACCCATCACGAAGAATCAAGTTATATGTGGCAAAGGAACACTTGAATTGGAAAAAGAACAAGATCAGGACTCTGTTGATGTACCATAAAACTTCTTAAGGAAAAAAATCATTTTCATGGAAAATGAGGCATCTTGATTCATGTTTGAGGCACATAAGAACCTCAGCATCCTGTAATACTCTTATTAGGTTGTGACACCAATCTAAAAAAAGCTGTTGGGTAAATGTTATGTATGTGAAACTTGTTTGTTGCAATTGTAATAAATAGCTTTAATCTCTTCAGTGACTGACGACCTAATGATAAACTGGCTTAATATACACAATTTCCATCAGAGGAACTTCACTTTAATAGATTTTCACAGCCTGATTATCAGTAAGGAAGAATGCTAAATAGGTTATGTTCAATTATTAATTGTATATTTGTGTATAATATTTAATTTTGTCTTATATTAAGCGCAATCAATATGAACAGAGACTGACCATAACTGGAGAGGTTCTTACTGGATTTGATAGTATTTGGTTTCTCTTAAGGATAAGAACACTTACAACCACGTTTATGATTGCAGAGCTCCAGGATAGTCAAAATAGCTATTTTGTAGCCAATAAATTAGTGTCAAGTGTCAGAGGTTGATGTTCACAAGGGGATAACGTGCTAACAGCTCTGATTATAATATGCAGTTATGGTCTAGGCAACACCAAAACACTGACAGTAATTTAGTAGTGACAACACAAATTCTTTTATCATTTTAGTATTTGAAATCATAATCACAGAAATAAAAACAAAATCTTTTGACATACCGTGTCTAGTTGAGTAGAATGTATTGGATATTATTGTGTTCATACAGCATGTGAAACACATTTGACAATTATACAGTGTGTCTTAAACAGATTGAGGCTATGCTCTTATAAATGCAGGTAGCATTAATATTAATCCTTTAAATTGCTTGCCTGTAATTAAAAATTTAATATACTCCTTCTTTTTACAAAGAAAGAATTATAGAAGTTCCTGAACTTTTTGTGAATGTTGTAGTTGCACAATTAAGTGGAAAAAATTCGTAGCAGATCTACTTCTCTCCTACACACATTCTTAGCTTTGCATAGCATAACAGTTATTGCTCCAAGTTTGACAGTTATTTTATTTTCATTGATAAAAAGTTATTGTTATCTAAATTAGTTGCACTTAAGTGTTAGATATGAGCAGTTAAAGTTAAAATGATCTGAGTGAGGAACAATTCCATAAATTCCCCAGAAAATGTGTCCAGACCTTAAATAAAAAGAGTACTCCATTAATTGGTTTAATTACATATACAGTTGTCACACCATAACCTACCGGAATCAGTTTTCTATTCTATGACTACTTATACCACATATATGCGAATAATATAATTCACCAAATAATCTGCGCACCCAAATTTTAAGGGGGGGGGGGGAGACTGGTTTTAATTTGTTTTTGTTTATACATTGTGTATCTTGCTGTTTAAGTGCAGCTTATATATCGAGTTGTTGCAGGATGGATGTTATGCCTCCGGGGGTAATAACAGCTAATTTTCCCTTTTTGTAACTTGTCTCGCACTTCCTCAATTCTGTCTCTAAAAGCTGCCCAGGACTGACATGGTACATAAATTCAGTAACGCTACAGGGTGACATTGCCAAACCATGCCACCCAGTCAACCGCAAGGTCATTGTCCATCCGCCCCTTCACGTTCACTGTCACCAATATGGCTTTCAGTGATCTTTTTGCAATAGTTTCTTTTACATTTTACGTTAGGTGGTAGCTATCATCCATTGCCAGTTACACACATCACTGTACACCTTTGCCACTCATTGCTGCCAGTTCGAATCATGACGCTGCAGTCCCCTTGGATCTGTATTAGCAACTTGCAATAATATAAAGGAATGTTTGCAGTGCAAATTTATCACTTAGTGATGAAAATTCACTACTTTTCCTCCAATCATCTGGCAGCTGTTGAGCAATGGTAGTTTTGCTCTGGAAGCCTAATCCATTGTGATGGAAAAATATTGATAGCCAGCCCTAGCTAACATTGAAACCGGTGATGCTTAGTTCTTTGGCTGAAGCCAATGCTTTGATTTGGCACCTTTCACTTGTCACTGGGCATCCACATTGTCACTTCTTGCCCACGTAATTGCAGAGCCTTTTTTCGAGATCCATATGCTTTGCTTTTTGGCTGTGAAATCGCTGGCGATTACAGTTTGTTTCTTGGAGGCGCATTTTGTTTTTTCACCATTCGCAAATAACACTTGCTCACATCCTACTTTATTCCCACTGCACGGTTTCCAATGTTCTCTGCTCCTTCAGTAATTTCAAGTTTTTTTTAGCTGTGTATGAGCAGTATTGAGAACATCCATAATTAATTAGTGGTTAATGCACTTCTAATGTGCTATTGATGTCACAGACTGAGGCCACGACAACACTATAGTATAATGGGATCTATTGTTGGAGGTGGACAGTACCAACCTTATTACAATTAATCTACACAACCCAGCATTTCATCCTTAAATTCAGGGTAAAAACGAAGCCCAGACTACTCATGTCTATACGGTATTTGAACTCTTCGATTTTGTGCTGAGATTGATTTCTAGATTCCTTATTCTAGTGAACATATAGCAGTAAGAGTACAAAGTGTATTTGGAATGGGATGTTGCATTCATTTGTCGTAGATAATTTTCTGAATGTTTTCCATTTGAGAATCCCTAACACAGTACTTGAAAGTCTGCTACAGTTTTTCTATAATATCTTCTGTTTTCATCAATGTGGAAGCAAACTATTCTTTACCCAAGTCTTTTTCGTTTGTAAGGATGATTTTTATCTTAGAATCATTAAAAGACTCATCCTAGGGCTGTGAAGAAAAATCTGTTAGAACGACTATTACAGTGGTAGAAAATTATTTATTTCATTTGACTGTTGTTGCAATTTGAAATGCAGCAGCTGCTTCTCAATTAGTTGGTTTGGCATTGTTATAGTTTTTCTTTGGTTCTTTTTTACTTCTGGAGAAAATTTTAAATTATCCATAGAAAAATATTTTAAAACATTGTGTTTGGAATATAATGTGACTTGTGGCTCCCAGTTTTGCAATAGAATTGAGAAAGATGTAATAGGATCTGTCTGCTTAATTGATTTTTCCCTCCTCTGCATTTCCTGAAATGGTTGATTGTATTAAAAGTGTGACGTTTAAGACTGTGAGCTATCAGTGAGTTATTGAGTTATCAAGTGAATTATTGAGTTATCAAGACAATGAAAATCTCAAATGCACATACTCATCAGTGGAAATTCACTTGGGAAACTGAATTAGTGGAAATAAGAGGTGAAATGAGCTTCATGTATGATAACAATATCTTAATGTCCATGAGTAAGGCATATGTTGAACAAAAGTAGTAGCTAATTGGTGGCTACTTGTCTCTAAATTACTGATGTAGTAAAATATGACGTTAACAATTGGATGTCGATTGTTAACCATTGTGATTAGAACTTCACAAGTGTATAGTAAATGCTGAAACCATGTCTACAATAAATCCTTTTGGATCTTCTGAATCTGTAACGACATTTTGCTTTCTTTTCTTAAGACACGAAATTTGAAGGATGTAGCAAAGAATTCTGCATCTTCGTCAATCATCCCGTTGAAAATTTACCTCCTGTGTAGGAGGCTTTTAGCAAGCTAGACAGTTCTGGATGTGATGTTTCTGGGTGTCCAGTCATATACTTCATTTAACTCATTTTTGAATGTCCTGTTGTAAGCATAATAAATTTGTTGTTAACTTTTGCATACAATAATTATTACACGCCATGCTGAATGACAGAATAGTGGTTTGCATCCTTGTGGCCTACAACGAACCACACCAGTATATTGATGCCCTTTTTCTGTGCAGTACAGGTGTAACAATTTGTACATACATGATTGTACACGATGACAATGTATTCATTCCAGCTTTTGCTGGAGATAATGAATGTGAATTTCCACACCATTAGAATTTCAAACTTTCCACAGAAAGTTATAATCATGCATGAAGTTTCTGATACAATTGATAAGTACTCCTATTTGACAGGGCAGATTTTTTTAAACATCACATAATTTTGGACTAATGATAAATGGTAGTATTGCACAAAATGATTTTTTTGAAATCTGGAGATGATCAGAATTCATTTAGACTGGTTACTCTCCTTCCTTGTGCTTCAATAATTATTAGTCTGTGGTAGCCTTAATTTCAGTTTATTGTGATCTTAAGAGATTAATATATTAGCATTTATACAAGGAAATTTGTAATTTTGATAGCATAGTTTGTCAAGCTGGTTATTGAAAGTGCATGAAGAAGTTCACAGAGAAAGTTTGATGCTGTATTGAAGAAATAGATCTTGTGCCTTTTCTTGTCTATATAGTGTATTGATTGATCTGTCTTCGCCAGTCATCATTCACATTTCATTGTTAAAATTAAAATTAATGTATTTACATAAGCAAATTGTTGTTTGTAGTATTCTCAGGACCATAATTGTATTCATTAGCTTTTTCATAGTGTCCTCAATTTATATGAAATGAGACATTACTTTTACAAATTTATTCTCAGAACTGTTCTAAAATTATTGCACTCAAATGTAGTGCTTCGTTGAATTTTGTAAAGTCTAAACTAAAGCAATAATGTTTATTCTACTAGCTATAATTATTTTTGTGTGTAATGTCTTTCATATGCTGTTATGGCATGTGATACATAGTGGTATTAATTAGGAAAGCTCAAAAAAAGGTAATTACTTGTGAAGATTTCATTTGATTTCCCAACTCTGTTTGAAATTACACATGACATGTACATAATCTGTGTCTTTCAAGTGAAGTGCTATATCTTTTAATTGTATTTATCTTGCTACAGTTTATCTCACTTTCACATTAAGAGTAGAGGAAGAGAGAAATTGAGACGAGGAAACCTTCATGCATGGAAATAAGATTCTCTCTCCCCTACATTACGGGTTATCAGACTGTTTATTTTTGGTAATCATGCAGTTACATTCTCTGCATTTGTTTAATACTGATCAGATGCTGTAAAGCCAAAGTGATATTATTTTACAGATGACATATTTCTTTATTTGATGAAGAGTCAGTGAAGTATCTATGATCAAACATTATTACGCCTACTTTGAAATGTAAATACATACTGAAATTTTGTTCTGATACAAAATTCAGCGACTGAAAATATTGTGGTTGTAATAATTATATATATCACTGAAATCATTTTTTTTAATTGTTCATATCATCTGCCATGTTCCTCTCACTAAGTGTTAGGCAGACTAGGCTGTGATTGTGAAGTATTGTTTGGTTTGTTGTAGAAAGTTTCTCTTTATTTCTGTCAAAGTACAACTTACATTACCAAAGTCCTGCTCAGTATTTTAAGTAGATTCTATTGAAAGTACTAATGTAAGTACTCACAATTTAAAGACTGTAGTAGTATCATAATTATACATTTATTATTAATTCATTTAGTAAAAAAAGAATTTATCTTGTAATTTGTTAAACACAAATTAAAGGGGGCTGTCAAGTTTATTGGGTGTAATGTAGTGCCTTTCAAAATGAAAATTTTAGAAATACAGGTTTATTGTGAGACTGATCTCTTGTCTTTTTTTGTGAAATAGTATTCATTGGTATTGACTTGTTTAAAATTACAAGAACTCTGATTGTGTATGTCGCATTTTTGCCAAGACATAAATTTCTCAAATGTAAGTAGTTACAGTAAATGATTGGTAAAATTACTAACAACAGGTTTCATTGTCTCAGAGATGATTATAGTTACAAATGAAGCAATAATGTTAAAAATTTATATATAAAAATTTTTTGATGGCCAGTTTGTACATATTTTTCTGTCCTCAGTGGAGCAGATGTGTTGAGTCCACAAGTAAAACAAGCAGCTACTGCAGGCCAGTTGCCTGGCCTCATTGAGTTTAATCGTA
>MW362430.1 Lactobacillus acidophilus strain BCCS A50 16S ribosomal RNA gene, partial sequence 
ATTCACTTCGGTGATGACGTTGGGAACGCGAGCGGCGGATGGGTGAGTAACACGTGGGGAACCTGCCCCATAGTCTGGGATACCACTTGGAAACAGGTGCTAATACCGGATAAGAAAGCAGATCGCATGATCAGCTTATAAAAGGCGGCGTAAGCTGTCGCTATGGGATGGCCCCGCGGTGCATTAGCTAGTTGGTAGGGTAACGGCCTACCAAGGCAATGATGCATAGCCGAGTTGAGAGACTGATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCACAATGGACGAAAGTCTGATGGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAGCTCTGTTGTTGGTGAAGAAGGATAGAGGTAGTAACTGGCCTTTATTTGACGGTAATCAACCAGAAAGTCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGAAGAATAAGTCTGATGTGAAAGCCCTCGGCTTAAC
>XR_006102310.1 PREDICTED: Sceloporus undulatus uncharacterized LOC121923102 (LOC121923102), ncRNA 
TGGCGAGGAGAAGGAGGAGGGGGAAACAGGAGGAGGAGGAGGTACCAAGTATCAGGTTGTGGCTTGCATCAACAGGTCCCATGCACCTGACCAAGAGAACAGGCTTTCTATTGCTCAGGCTTGTGATATACAGATGAAGGTAATAGACTGGAACCGTGAAATGCAGTTGTGAACTGCTAAAGCCTCATCGAAAGTTTACGCCAACAACTGCAATTTTATAGGCACTTCAGGAAAAGAAGACAGCATTGGCCATTTAACATAGCAGTAATGTTTGTTTTCCTTCTGCCAAGTATACAACATTATGATTAAGAAAGAGAGGAGCCCATAATTTTTCTTGGTTAACATGGGAACGCAAAACAGGAGGGTGTGTTTATCTTGTTTAATGTTTTTTCTCTCCTCTGACCTCTAAAAGGCTTTAAGTAAATTTTGTGGTAAAGCAAAGCACATGAGCAGCGAGGGAGTCTCAGACAGTTATAGTGTCTGAATACACTCTTTGTGGTATTGGCAAAGATGCTGTGATTAAGAATTGGCAAGCTGGTGGCTTCGACTGATAGAACTTTTATTTTCCTTCCAAGAAACCTGCAACATGAGGATGGACAT
>JF772131.1 Bacillus sp. NA-107 16S ribosomal RNA gene, partial sequence 
ATACATGCAAGTCGAGCGGACAGATGGGAGCTTGCTCCCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATGGTTGTTTGAACCGCATGGTTCAAACATAAAAGGTGGCTTCGGCTACCACTTACAGATGGACCCGCGGCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTACCGTTCGAATAGGGCGGTACCTTGACGGTACCTAACCAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAAGGTGTATGGTAACCCTTGTTGTGTGGGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGT
>XM_047969201.1 Xylaria bambusicola uncharacterized protein (F5B22DRAFT_156494), mRNA 
CACAGAACGACATCTCAGGTGAAAGAGGTGAACATCATCTAAGACATTATCGGATTGGACGTAACCATGTCACCAGATCGAGTCCCTAGTAATCGAGTTCCGCCTCGCCCGAAGACGCCTACAGACTACGTCCCTACGCCGATTCGTGCAAAAATAACCCCCTCAGAGACTTTCAGCCACCTCGTGAATAAGAAACAGAGATCCGCCAGAGTGCACGCGCTTGCTAAAGAGCGACTCACAAGTTCTAGGCCAACCACGCCTCGGACCCCTACTACCGTAAACTCCATTATCAAGTCCGCAAGAACCAGCCGGTCCGCTCTCAGTTCCGCAGGCAGAAATATAGCGTCCAGCCTTTCAAAGGCAAAGCCGGTGGTGGAAACAGCAGTCGCAGCCAGCAAGAAGGCTGCCGTCACAACTGCAAATCGCTTGACAAGAATGGCAACTGATGTGCCGAAAGTGGCCAAGCAGAAGGGAAAGGAGGTCGATGTATTGTCGACTCCATCTAGCTCATCATCGCAAAAATCACTGTATCATCGACCTAGGCTGCCCAAGCTCAAGATCCCCGAAGTTGATGCTGCAGTAAGAGACGCGTTAAATAGTGCATGTTCAACTGATACACAGAACAGCGAGAACTTTCGAATACTCCAAATTTCGCCCACGAGCCGAGAGCTCGAGTATGAATGGCAGAACGATGATAACCCACCTGACGTTGCTGCAGAGTTTCACAACATGTTAAGCGCACGCCGCAGAGTTCGTAAAGGTAAGTTTGGATCGAGGGTCACAAGATATTGCCGGGAGCGGCCAACCTGGCAAGACAGTTTCGTTGCCAGAGCCCATCTCGATAACCACGAGGATAGGGCGCTGTTGAAAGAGCTTACAGACGCTGTCCAGGAACAAAAGGATTACGCCGCCCGCCTAGTACAGAGAATCCCAGATCGTTTCCCCGGGCTCGAGGCTGTATCTGTGCCGGGGTCAACATTAAAATTATACTGGCAACACAAAAGCACATGGCCTAAGCAGTAAGGGCTCATGGGAATGATGGTCCATTCAGTTAATGATAGAACTGGCCGGTTCCAGGGGTCAAATATGGTCAAGTATGCGTACTCACTACTAATATAGATCTAGACTGTGATTTTGTGTCTA
>AB726205.1 Uncultured fungus gene for 18S rRNA, partial sequence, clone: a70-1 
AGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGGGATCAATTTATCGGTCGTGCCTATGGTATGAACTGGTACAATTGGTTTCTCCCTTCTGACGAAGCATGATGTCATTAATTTGGTGTCGTGGGGAATCAGGACTGTTACTTTGAAAAAATTAAAGTGTTTAAAGCAAGCATTAGCTTGAATACATTAGCATGGAATAATGTAATAGGACGTTTGATCCTATTTCGTTGGTTTCTAGGATCGACGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGATGATGTTAATTTTTTAATGACTCA
>KX928124.1 Williamsia sp. strain AC048_ELMA209 16S ribosomal RNA gene, partial sequence 
GCTGTGGATTAGTGGCGAACGGGTGAGAACACGTGGGTGATCTGCCCCAAACTTTGGGATAAGCCTGGGAAACTGGGTCTAATACCGAATATGACCACTGGATGCATGTCTGGTGGTGGAAAGCTCCGGCGGTTTGGGATGGGCCCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCACCAGGGACGAAGCGAAAGTGACGGTACCTGGAGAAGAAGCACCGGCCAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTGTCCGGAATTACTGGGCGTAAAGAGTTCGTAGGCGGTTTGTCGCGTCGTTCGTGAAAACTTGGGGCTTAACTCCAAGCGTGCGGGCGATACGGGCAGACTTGAGTACTACAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGTAGTAACTGACGCTGAGGAACGAAAGCGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGTACTAGGTGTGGGTTCCTTTTCACGGGATCCGTGCCGTAGCTAACGCATTAAGTACCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGATTAATTCGATGCAACGCGAAGAACCTTACCTGGGTTTGACATACACCAGAAAGCCATAGAGATATGGCCCCCCTTGTGGTTGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAAC
>XM_023377893.1 PREDICTED: Centruroides sculpturatus glutamate receptor 2-like (LOC111633339), mRNA 
TTATAAATCTATTCATGCCACAACGGAACTTCAAAGGCTAGCTACGAAATACGAAATTACACTGCTTTCTATTCAGAGATTTCCTTTGTCTGACTCAAAATCTCTCGATGTAACACCACAATTAAACGCCATTAAGGAAAAGGACGTGAGAATAATAATTCTTTATTGTGATATAACGATAAGTAAAACTGTTATAAAGCAAGCTGAACGCATGAACATGTTTCGTTCTGGATGGACCTGGCTCGTCATGGATAGCATTACATCGTTCAGTCTTAAATACTTATCGGACGATGACGGATATATACCATCTTCTTTAGTCGGATTAATAGGAACAGCATTTGTAGTTCCTGATACCATTTTGTATTTAAAATTAATGAATCAATTAAAAGCGAATAATTTGGAAAATCATATAGAAAATCAGCAAGCTATCACTCGTGTGTATGATGCAGTGTTAGCAATTGCCAACGGACTTCACAGAATTCTTTACGAAGAGAAAGTATCTTTCGAACTTCCTACTTTCCAAAAAGGAAGTTGCGCAGATTCTGTCAATGACTGGAAATGGGGTAGAAATTTGTTGGAAAGTATTCTTAATTTGAATAACGTTAATGGAAGTTTAGGGCCTATAAAGTTCACGAAATTTGGTTACCATCATCTCACCAGTTTTGACATCGAAAACCTTCAAACGAGAGGTTTCGTTAAAGTAGGAAAATGGTTAGGAAACGAAAAACACTTGACAATTAATTCAGAAATCATATTTCCTGGGCAAACTGTGAAACCTCCTGATGACTCTCATCACAGTCTTCACGGAAAAACTCTTAATATTGGAATAGTTATAGATGAGCCCTTTATAATGAAAATCCCTTATTATAAAGAAGGAGATCCTATACATTCTAAATACGAAGGATTACTTATAGACCTTCTTTTGAAATTACAAGAAATGCTTAACTTTAAATTTAAATTTCACGAAATAAAGGAATATGGAATTGAAAATCCCAAAACAAAAGAATGGAACGGATTAGTTAGACAATTAATGGATAAGAAAATAGATTTGGGCCTAGCTGCCTTCACGGTATCTTGGAAAAGACAAGAAGTTATCACCTTTACAGCTCCTTACTACGATTTAGGTTTGGCTATATTAATGCCAAAATATAATGCAAAAACTAAACAAAATTATTTTGCATTTTTATCACCTTTCGAAACAACAGTGTGGCTTACCATTGCTGTGTCGGTGATTTTTACTTCTCTAGTGCTTGCAATATGTGTAAATTTAACACCAAGTAATTTTAACAATAGAAGAAAGGAGATAAGGAAAACAAGTCAAAGCGTTAGAGATTCTTCTTGGATCACTTTTCCACAAGCACTTTGGTGGAGCTTCTCGTCGCTTGTAGCCCCGGGAACAGAATTTGAACAACAAAAGAATCTTCCGGCAAGAATTGTAATGGTGACATGGTGGCTAACTACGGTTATTCTTATTGCAGCATATACAGCAAAATTGGCAGCATTTATGACAGTCCAGAATATGAAACAAGAAATTAATTCTCTGGAAGATTTGGTGAAATTGAGTTCAATTTCATTTGGAAGTCTGAATGATTCTTATGTTGAGAACTTCTTCGCCAACAGTCACTGCGAAACGCATAAAATAGCTTACAAACTGATGAAAAATTATAATACATTCATAAACGATACTTTCGAAGGCGTAGAGAGAGTTAGAGCATCGTATTATTTGCCAGAGGGCCACAAGGATCGTTTTGCTCTTATTTCTGATTCACCACTTGTGGATTACGCTTCTATGCAGAGGCCATGCAATGTCGAACGAGTTGGAAGACTTTTTGGATTAGTAAATTATTTTTAA
>XR_004836665.1 PREDICTED: Folsomia candida uncharacterized LOC118438235 (LOC118438235), ncRNA 
CTGAGAACAAGGCGATGGGGATGAGCAGCATAATACTGGCTTCGTCGGGGGCGAGGGTTTTAATTCTACGGTAAACTTGTACTTTCGTTTCGAGCACAGGGTTTGGAGTGAAGCCAAAACTTTCTTCGGGCTAAGGTCTGTCATGAAACTTTAAGCAACTGTCGGTTGCACCACAGTCGGAGAACAGAACAACAGCAACCATCAACATGATACTGGCTTCATCCGGAGCATTGGTCCGAATTCTTTTGTGAAGTTGCATTTGCATCTCTTTCACCCCGTCGGCACAATTACAGGCACATTCGCCACCCTGCACAGAAAAATACACATATTCAAAAAGTGTACACAGATTTCTGAAATTACATATGTAACTTCTTAGTGGAAAACCAAAATGTGTATAAATTTTGAACCAAATTAAAAATTTTGAGGATATTCATCATGTTATAACATGAAATGTATATATTTCACATTTATCTTGCGAATTAAAAATGGTGTAAAAATTATTAATATGCA
>XM_039871033.1 PREDICTED: Pteropus giganteus Scm like with four mbt domains 2 (SFMBT2), transcript variant X6, mRNA 
CATATCTCCTTCTGCAGACTTCGACCAGTTGGTTGGTGTCAAGAGAATAAATACAGAATGGACCCACCTTCAGAAATCTATCCTTTGAAGATGGCCTCTGAATGGAAATGTGCTCTGGAAAAATCCCTTATTGATGCTGCAGAGTTTCCTCTTCCGGTGGAAGTGTTTAAGGATCATGCAGATTTGCGAAGCCACTTCTTCACAGTTGGGATGAAGCTCGAAACAGTGAACTTGAGCGAGCCCTTTTCTATCTGTCCTGCATCAGTGACCAAGGTTTTTAACAATCATTTTTTTCAAGTGACTATTGACGACCTGAGACGAGAACCTAGCAAACTCTCAATGCTCTGCCACGCGGATTCCTTGGGGATTTTGCCCGTGCAATGGTGCCTTAAAAACGGAGTCAATCTCACGCCTCCCAAAGGCTACCCTGGTCCGGACTTTGACTGGGCAGATTATCACAAGCAGCATGGAACAGAAGAAGCACCTCCCTTCTGCTTCAAAAACACGTCATTCAGTCGGGGTTTCACAAAGAACATGAAACTGGAAGCCGTGAACCCCAGGAATCCAGGAGAACTCTGCGTGGCCTCTGTCGTCAGCGTGAAGGGGAGGCTGATGTGGCTTCGCCTGGAAGGCCTGCAGACTCCCGCTCCGGAGTTTATCGTTGACGTCGAATCCATGGACATCTTCCCAGTGGGCTGGTGTGAGGCGAATTCTTACCCGTTGACCACACCGCACAAAACGGTCTCACAAAAGAAGAGAAAGATTGCAGTTGTACAACCAGAAAAACAGTTGCCATCCACAGTGCCTGATGAGAATATACCTCATGATCTTTACTTATTCCCTCACTTGGACAACACAGGTACTGTCAATGGGAAGTACTGCTGCCCTCAGCTGTTCATCAATCACAGGTGTTTCTCAGGGCCCTACCTGAACAAGGGGAGGATCGCAGAGCTGCCTCAGTCGGTGGGGCCAGGCAAATGTGTACTGGTGCTCAAAGAGGTTCTTAGCATGATAATCAATGCAGCTTACAAGCCTGGAAGGGTCTTGAGAGAACTGCAACTGGTGGAAGATCCACACTGGAATTTTCAGGAAGAGACACTGAAGGCAAAGTACAGAGGCAAAACGTACAGGGCCGTGGCCAAGATTGTACGCACGTCTGACCAGGTAGCAGACTTTTGCCGACGGGTTTGTGCCAAGCTGGAGTGCTGTCCAAACTTGTTCAGTCCTGTGCTGGTTTCTGAAAACTGCCCAGAAAACTGCTCCGTTCATACCAAAACCAAATACACCTATTACTACGGGAAGAGAAAGAAGATCATTAAGCCCCCAATCGGGGAAAGCAACGTTGAGAGCGGATGCCCGAAACCAGCCAGGCGTCGGAAACGGCGAAAATCCATTTTTGTGCAGAAGAAACGGAGGGCTTCTGCCGCAGACTTTGCCGCAGGCTCGGGGGAGGAGAGTGAGGAGGAGGAAGCGGATGCCGTGGACGATGACACAGGGAGCGAGGAGACCGGCTCCGAGCTCCGGGATGACCAGACGGACACCTCTTCGGCCGAGGTCCCCTCCGCCCGGCCCCGGAGGGCTGTCACCCTGAGGAGCAGCTCCGAGCCTGAGCGCCGCCCACCTGTGGACAGGGCACGACGGGGCCGTCGCGTGCAGGCCACCTCCTGTGCCGTGGGCGACAAGGGCCCGGCAGCCGGCCAGGACACGGCAGAGGAAATAAAACAGGAGGAGGAGGGGAGACTGGTTCTGGAGAGCAACCCGCTGGAGTGGACGGTGACTGACGTGGTGAGGTTCATTAAACTGACGGACTGCGCCCCCTTGGCCAAAATATTTCAGGAACAGGACATCGACGGGCAGGCGCTCCTACTGCTGACACTTCCCACCGTGCAGGAGTGCATGGAGCTGAAGCTGGGACCCGCCATCAAGCTGTGCCATCAGATCGAGAGAGTTAAAGTGGCTTTCTACGCCCAGTATGCCAACTGATTCTACCTTCAGGGGATGTGGCCCATTGTGTTGGTGATGCCGCGTCTTGGGAAGGTTTTCGGGACTGGAACTTTTATTTTTCTGGGTTATGAGAGATGGTTCATATACTGTTACTGAAAAGCAAGAAGCGTGAAGGACCTCCTTCACTTTCATCCACCAGCCTGTTTCATAGTTTCATGTTTTAAAGCTCATGCCAGGACCACAGCAGTGGCCTCTGGAGAGTGTAAATTAAAGTTCTGTGTCAGA
>XM_028176078.1 PREDICTED: Bombyx mandarina disheveled-associated activator of morphogenesis 1 (LOC114244323), transcript variant X2, mRNA 
GGACGCGATGCCTGGGTCGCTCAAACGTACGATTCCGACGAATTGACGATTTTGGGCTGAATACAACGAGGACGCAGTGCTTTAAAAAACAAAACAAAAATTTTGACAGTTAAAATTACGCGCGTTTTTTAATCTGTGGACAGTGCTTTAATGGTATTTGTGGGAAAAGTGTGCATAGTTTTTCGGACAAATACTTCGGTTGTAAAATGATGATTGAAATCGAGTGATAGATGTAAAATGTGATAAAGTGAATAAATAGTTAATTGATAGCAACAAGACAGCAAAATGTGCAGCAAGGATCAGATCAATCACATACTCGGGAAGATCAATGTGGGTCTGCCGTCGTGGTCCCGCGGTGTGGAGGCGGTGGAGGCGGCCCGGACGCGTCTGGTGCGTTGGGCATGTGGCGACCCACCTATCGAGCCTGACCCGCCAAGGAAGAAGATGCCGCATGCGCTAAGACGGAGGTGGCCGCTCTGTCCTTGTTTACAGAATGACGAACCGCCCGAGATCACGTACTGCGTGGTGGGCGGCGAGGGAGGTCTCGCCCTCCAAGCGGTCACCCCCACGCATCCCATGCCCCCGGAAGATGAGCTGGACGCCAAGTTTGCGGAGCTGGTCGAGGAGTTGGACCTGACAGCAGTTAACAAGGCCGCGATGATGGCGCTACCGGCTGCCAAGAAATGGCAGATCTACTGCAGTCGTAGGCCGCCACCGGGCCAGGCGCCTCCACTGGCCACCGCACCACAAGTCGAGGAGTACATCAAGGCTCTTAACGAGATCGCTGATGCATTTGCGTCGTCTGAAGGCGTCCCCCCGACGGAATCCTGCGGCCTACTCGAGGGCCTGAAGACAGCGCTCAGGACGAGGGCTCACAGCTTCGTCCTCCGGTTTATCAAGCAAGGAGGACTCGGTGCCATATTGGACGCGTTGCAGAAGGCGCCCAGGGACGATGCTGTCACGAGACATAACCTTATAGCTGCCATAAAAGCCTTGATGAATAATTCGACTGGTCGTGCTCATGTATTAGCTCATCCCACGAGCATCGATCTGATCGCTCAGTCCTTGGACACGGAGAACGTGAAGACGAAAGTCGCAGCACTTGAGATACTCGGCGCTGTATGTCTTGTCCCCGGGGGACATAAAAAGGTGCTAGAAGCGATGGTCAACTTCCAAAAGTATTCCGGCGAGAGGGCCCGCTTCCAGAGCATCGTCAACGAGCTGGACCGCAGCACCGGCGCCTACAGGGACGACCTCGGCCTGAAAACGGCCATCATGTCGCTCGTCAACGCCGTGCTCAACTACGGGCCCGGCGAGGAGAGCCTCGAGTTCAGGCTCCATCTGAGATACGAGCTGCTCATGCTGGGGCTTCAACCAGTGATCGAAAAACTCCGCAAATACGAAAACGAGACGCTGGACCGGCACATCGAGTTCTTCGAGATGGTCCGCGGCGAGGACGAGCGCGAGCTGGCGCGGCGCTTCGACCGCGAGCACGTGGACACCAAGAGCGCCTCCGCCATGTTCGAGCTGCTGCGCCGCAAGCTGGGCCACTCCGCCGCCTACCCGCACCTGCTGTCCCTGCTGCAACACCTGCTGCTGCTGCCGCTGGAGTACGGCCCGCAGTCCCAGCACTGGCTGTTGCTGGACCGTGTGGTGCAGCAGGTGGTGCTGCAGCAGCCGGCGGCGGGGGCGCGCGCCGACAGCGAGCAGGGCAGCGAGGGCGGCAGCACCAGCGACCAGACCAGGATATACGATCCGGACGTGGCTCCCCTCGAGATAAACGTCGGCGAGATAGTGCATTTGCTCGCCAAGGAGGAAGAGCTCGTCGCCGCCAGGACCAAGGCCGAGAATCTGGAACGGGAGAACATCGACCTGGCCACAGAGCTGGCTAAGAAGTTGACCCAAGAGAGAACCGAGAGAGCGAGATTTGAAAAACTAGTCAGCGAGGGAAGCATACCTGATGATGCTAAGGTGAACAATCTGAAGAACGCGGTGATCGAAACGTCATCGGTACCTCCCCCTCCTCCGCCGCCGTCAATGTTCCCCGCGCCCCCCGCCGTGCCGGCTCCTCCCCCCGCGCCGCTCGCGCCTCTCGCCCCCCTGGCGCCGCTCGCCCCCGCCCCTCCCAAGCCCAAGAAGAACGTCCCCACTCCCGGGAACCCGCTCAAGAGCTTCAACTGGAGTAAATTACCTGATACCAAGCTGCACGGCACGATATGGCAGGAGCTGGACGACACGAAGCTGTACAACGCGATGGATCTGCACACCATCGACAAGATGTTCTGTGCCTACCAGAAGAATGGCGTCCAGAACGAGGGGTCCGTCGAGGACCTCCGCCAGCTCGGGTCGAAGCCCAGGACGAAGATACTGTCCGTGATAGACGGCCGCCGCGCCCAGAACTGCACCATCCTGCTGTCCAAACTTAAAATGACCGATGAGGAGATTTGCAGAGCGATCCTCAAAATGGACAGCGGCGAACAACTGCCCATCGATATGTTGGAGCAACTCCTGAAGTTCACGCCGAGCGCCGAGGAGGCCGCCATGCTAGAAGAGCACCAAGATGAACTGGACAGCATGGCGAGGGCGGATCGCTTCCTCTACGAGATCTCCAAGATCCCGCACTACTCGATGCGGGTGCGCACGCTGCTGTTCAAGAAGCGGTTCGCGGCGGCGAGTGCGGAGGCGAGCGGGCGCGCCACCACCGTGCTGCGCGCCGCGCGGGACATGACGCGCTCGCGCCGCCTGCGCGCGCTGCTCGAGCTGGTGCTGGCGCTCGGGAACTACATGAACAGGGGAGCCCGCGGCAACGCGTCAGGGTTCCGGCTCTCGTCACTGAACAAACTCGCCGACACCAAGTCCAGTGTTACAAGAAACACCACGCTCCTGCATTTCCTGGTCGAAATGTTGGAGACACAGTTCAAAGACATACTGCTGCTCGAGGAGGATTTACCGCACGTCCGAGCCGCGGCTAAGGTTTGCGTGGAACAACTGGAGAAGGATGTGGGTGCTTTGAGGAGTGGCCTCCGTGAAGTCGCGAAGGAGGTGGAGTACCACGCGTCGCTGCCCTCTCCGCAGCCCGGTGACGCCTTCCTACCAGTCATGAGGGAGTTCCATGCGCATGCTGTTTGTACCTTCACACAACTGGAAGATCTTTTCCAGGACATGAAGAGTCGTCTCGAAGCATGCGCCCACGCCTTCGGTGAAGAGACAAGTGCGTCCCCGGAGCAACTGTTCGGCGCCATGGACGCGTTCCTCACGCAGCTCGCGGAGGCGCGCGCCGAGTGCGACGCCATCAGGAGGCGCCGCGACGACGAGCAGCGCCGGACCAGGCACGAGCAAGAGTTGAAAAAGCGTACAATGGAACGTAAGCAATCAAACTCGCTAGGCTCGGTGAGCAAATCCCTAGCGAAATCCAACGGGGATTGCAACGGACACTCCAACGATAGCTCCCGGGACGGCACCATGAGTAACGGACAAAAAGGAGAGTTCGATGACCTTATATCCGCATTACGAACAGGAGATGTCTTCGGAGATGACGTGGCCAAATTCAAAAGATCAAGAAAGACTTCCAAAGTCACTCAGAAGGGTCGCGACTCTCCTCCCAGGGGCGTGTGCAGGGAAGACTCTAGGGAGAGACAGAAGAATTGAGATTGACAGCAGTTATTGATGTGTCAAAGAACGTGAGTACGGCTCTATGCGTGAACGTTGCTTGTAAGTACAGAAATTTGTTACACCAACTTTTCTGTTACTAGAATCGACCACATGTTTGTCAATATTTCGAAATACCCTCAAATAAATAATTAGGCATTAAACTGTAAGTTTTGAAATAGTATACATGTACTTATTCGTCGATGCTAATTAAAGTTTGGGAACGGAGAGCCGATGACCGTCATACGTCGGAATATCGATTAGAATGACTGCTTTAAAATAATCGATTAGTATAATTGTAACAAGTGATATTTTCGAAGTAGATTAGTTTGGACGGTGATGGTGTGTACGTCACAAAATATTTAGAGATTTATACAGAATAAAAGATAGGACGTTTAATGTGCTAAATACCAATTAATTAGCGTGATCGCTTATATATTAAATCGATTAATAAATAATCGATATTAAATCGACTAATAAATAATCGATATTAAATCGATTAATATATAGCAGAGTTAATTTAATTGTTACACAAATGTATTAACTATAGACGATGGAATAATTTTAAACGAAGTCAGCATTAACTATTAATTTAGACCTTAAATTGCAGTGGATAAGGACTGATCTGTGATTTCACAAATTGTTTACCTTGTGTCTGTTTTTAATTATCACAGGTATATGTTTGCGGCTTGGTCTTAATTAATTAATTTCATAATAAGTAGCGTTTTGCCTTTAATACTTTGTAATTTTTGTATGCATTTTACCACGTATTTTAGTGGTGTTTTTTGGTACTAAAATAAAGTATTTTGAAGAGTATTTTTTTTGTAATAATTTTTGCAAAAATTGAAATAATTGTAGATTGAGATACAGTTTCAATGTTTTGTATTTTTTCGTAACGACTGAAGTAGTGAAAAGGCTGCAAATAAATGATTCCGTAAACAATTTTTTTTGATAGTCTTAATCTTACTATAGAGCTATATGTGTTTGTATTATCTATGTACGTAGTATTTAGATACTGTATTTAATGCGTTCGATTTGACACCGTACCCGGTGTTGCCAACACACAAAAACAAACCTAACATATCCCCGTTAGG
>XM_042445786.1 PREDICTED: Sceloporus undulatus transmembrane protein 258 (TMEM258), mRNA 
GAGAGAGGAGGCGAGAGGGGACTTTCATTCTGGCCTGGACAGGAAGTTCCCGGATGGATTTCCGGCGTCTCCGCCGAGGAAGAGACGTGTCCCTGCGTGGCCTGGGAGGAGGAAGAGGAGCCTGAGCTGACTAGAGAAGGGGCCAGGGAGCAAGATGGAGCTTGAGACGATGAGCAGATACACCAGCCCAGTGAACCCGGCTGTGTTTCCACATCTGACCGTGGTGCTCTTGGCCATTGGCATGTTCTTCACTGCCTGGTTCTTCGTTTATGAAGTGACCTCTACTAAATATACTCGGGATATTTACAAGGAACTGCTCATTTCCCTGGTGGCTTCACTTTTTATGGGCTTTGGAGTACTCTTCTTACTGCTCTGGGTTGGAATCTATGTTTGACAATAAGCCAAGAGCTGTTTCAGGTTCCAGAAGAATTGCTGAAGTTTCTTTTTTATTTTTGTACTTAATGTAGCTCATCACACCTGTAGTCTGTGTAAATCCTGACACATTGTTACAGCCCAGAATATCGTAACATCAGATGAATAAAGCTGACTGTGATGACATGAA
>XM_024284361.2 PREDICTED: Oryzias melastigma peptide Y (LOC112153899), mRNA 
TCTCTCTTCCTGATAATGTAATCAACCGCGCGCGCGCGTCAGGTGTCCGTGGCTCTATAAAAGCCTCAGATCCGCGAGGAGAGGAAGAAGAATCCACGGAGACACCAGTCCAGCTGACGATGGCCAGAATCCTGAGGTCGTGGGCGATGCTCGCCGCGCTCGTGCTCTGCCTGCTCGTGTGTCTGAGCAGCCTGGCGGACGCCTACCCGCCCAAACCGGAGAGTCCCGGGAGCAACGCGTCACCGAAGGACTGGGAGAACTACCAGGCGGCGGTCCGGCATTATGTCAACCTCATCACCAGGCAGAGGTACGGGAAGAGATCCTCCCCTGAGCAGGCCGCGGCTTGGCTGCTGTTTGGGGCGGATTCAAGTCAAGATGCTGAGCCCCGGTCTGACTACGTTGAACCGTGGTAAATGAGCTCAACTCTACCCTGCACTACTGGACAAGTCCTCTAGATTTGATTATTTAATGAGCATGCAAATTTCTTTCTCTCTCATCCTGTTTGTCTGCTGCTGTCAGTAAATGTTTGTCCTTTTCTCAAAATTTGTAAATAAATTCTTGTATGTAAAATAATCTCTTTACAATAAAGATTTAAGTGGA
>XM_004989695.1 Salpingoeca rosetta mitotic checkpoint protein BUB3 (PTSG_08955), mRNA 
CGTTAATAACCGCCAGTGCCAAAAAGGAAAGGAAGCACAGAAGACCGTGAGGAAGCACAAGCACACGACACCACACCACACCACACCACCGCACGCACACCGACACACCACACCACTCGCCAACATGACGGACACTGAGCTTGTGTCGCCACCCCAGGATGGCATCTCCTCTGTTGTGTTTTCTCCGACCAGCAACTTGCTTCTCGTTGCTTCCTGGGACAAGACGTGCCGGCTTTACGACGTGGACTCCAACACGCTCAAGTTCACGTTTTCGCACGATGCACCGGTGCTGGACTGCGCCTTCCTCGACGACACAACAGCTTTTGGTGCGGGGATTGACAAACAGCTGCACAAGTACGACTTGACGACTGGCAAGAGCTCCGTTGTCGGGTCGCACAGCGAGGCCATCAAGTGTGTGGAGTGCTCGATCAAGCACGGCGTGGTCATAACCGGCAGCTGGGACAAGACCATCAAGCTGTGGAATCTCGAGTCCCTCGAGTGCGTCGGCGAATACGCCCAGCCAGACAAGGTGTACACGATGGCGTTGGCTGATGACCGCGTGATCGTCGGCATGGCTGGTCGACACGTGTGGGTGTGGAACCTCAACAATATGAGTGCGGTGGAGCAGCGACGAGAGTCGAGTGTGAAATTCCAGACCCGGTGCATCCGTGCAATGCCGGACGCCCAAGGGTATGTGCTCGCGTCGATTGAGGGCCGTGTTGCTGTGGACTATCTCGACCCGTCTGAATCGTCGCAGAAGCGCAAGTTTGCGTTCAAGTGCCACCGCTCGAAGGAGAACGGGCGTGATGTCATCTACCCGGTCAACGCCGTCGCCTTCCACCCAACCTTTGGCACGTTTGCGACGGGCGGGTGCGATGGGCTCGTGAACGTGTGGGACGGCGTCAACAGGAAGCGCGTGTACCAGTTCCACGAGTACCCGACGAGCATTGCGTCGCTGTCGTTCAACCACGACGGGTCGCTGCTCGCCATTGCCGCATCGTACACATATGAGGAGGGCGACAAGCCCCACCCGCCCGACGCCATCTTCATTCGTCGAATCACGGAGGAGAACGTCAAGCCAAAGCCACGCTCATAGACACACACGCGCGCACGCACACACACACGCACACGCACACGCACACGCACACGCACGCACACTCAAATCAACACACGCACCATATGTTCCACGTTTTTTTCTGGTGTTGTTTCTTCACTGACTAACAATACAATCACGTTTCGTTTCAAACAAATGAACAAGAAACAAGCAATAGC
>XM_002366755.1 Toxoplasma gondii ME49 hypothetical protein partial mRNA 
ATGTTCCATCTAGCCTGGGTTGTCAGTCGAGAGATCCCCTTCTGTTTCGTCTCAAGCGTCTCAGCTACTTTGCCTCTCGCTCTGTTGCCTGTAAAAACGCTTTGTCAGAAACGATCTCTTCAGATGCAGAAGGAAGTTGAACAGAGAGGCTTGCTCCGTCTTGAGCAGTCACGTCTCATCCAAAAGGTCAAAGAGGAAAGCCAACTCATGGAGGAGTACGTGGTCGAAATCGACCGGCTAAACAACGTCATCAACGTCCTTGAGAAAGAAATGCTCAACACCAAGAGGGTGTATCAAACAGCGATTGAGTCGCGAAATCTCACTGGCATTCAGCTGATTGACAGGCAAGCGCAAGACAAGGACACAGAAAAGAAAAGCCAGCGCGCCCTCCACGAGAAAGAGCAGGATGTCAACACGCTCCGGCTTCAACTGCAAGAAGTCGAAAGGCAACTGCTTTCGAAAAAGAGAAGGGCGAAAGAGGTGCCCATTTTGACGGCGGAAGTCGAGAACTTGAAGACGCAACTTCAGGAAGAAAAACAACTGGCAGAAAACATCAGTCGCAAACTAGAAAACCCAACTGAGGGCAGACAGTGGCAAGAACTTGGAGGGGAAGATCCAGATATGGAAACATTGGAGGCGAAATATCGGGTGATTGAGCAACGTTTCAGAAGTGTAAAGAGCGAGCTCATTGATCAAGACTTGCGCCTTGAAGACTTAACGGAGTTGACAGAAAAACAGAAAGCGAGAGCCGCAGAAGAGCACTCGGACGCGATTCGAATTCGCAGCGAAATTCTTAGACTCCACGGCAAACTGATCGAAATGAACCGGCGCATGAAGGTGACGATGTCTGAGTTGACGCTCTACAAGGAGTATTTGCCGAGACTTAAGCAGCTTCAGGCAGAAATAGCACAGAGCGTGGAGAACGCCCGTGAAAATGTCTTCTTCGGTAGACCTGCTACACCAAACGCAGAGGAAGAACTTGCCGATATGCTCAAGAGAGAGGTGGCTAGAAATCAGATCCTCTACGCAGCTAAATTGCGCACTCTCGAAGAGCAGCGTGAGGTAACAACATTACGGTAA
>MW050496.1 Uncultured Ascomycota clone OTU1949 5.8S ribosomal RNA gene, partial sequence; internal transcribed spacer 2, complete sequence; and large subunit ribosomal RNA gene, partial sequence 
GAAATGCGATAAGTAGTGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCATGGGGCATGCCTGTTCGAGCGTCATTTGTACCCTCAAGCTCTGCTTGGTGTTGGGTGTTTGTCCTCTCCTTTGCGATTGGACTCGCCTTAAAATAATTGGCAGCCAGTGTTTTGGTATTGAAGCGCAGCACAATTTGCGATTCTATCCGGTAATACTGGCGTCCATAAGCCTATTTTACACTTTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAA
>XM_053179842.1 Colletotrichum chrysophilum uncharacterized protein (COL26b_007034), partial mRNA 
ATGGAGCCAGAAGGCCCATTGAATGATGAGGACTCGGATGAAGACTGGTTCTGTGGATCACCCGCATTCCCAAACCAGTATGCCTGTATCACTCTTCGCGGTGGCTCTTGGAATGGTCCTCCGGAGTGGGAAATCCCTGACGATGGCGAAGGGCCGGTTTTTGAGGGACCGGGAAGTACTCCCAGTCTCTCCATTCTGGAAAACCCAGCCTCGCCGCCCACAAATATGCAAGAAGGCATCGCGTCTGGCTGCAACCGCTACGTCCAGGCCAACATCACGATTGCCTCATGTTGGAAGATTACCAATGATGGCGGCACCTTGCAAGCACGCTTGTTCGAGGTCGACCTCGTTGTCGGCAAGCCGGGCGAGCGCTGCGATACGCAGGTGTGGCTTGGCTACTAA
>XM_012089747.1 PREDICTED: Cercocebus atys germinal center-associated, signaling and motility-like (GCSAML), mRNA 
AGATGCAACGTCCTGCCTCATGCATTTTCCTCTTGGTGCTTTGGTCAGAACTTCCCCAAGTGGAGTGAAACTCAGGAGCTGAGAAACCGAGTCACTGTGAAAAGATGGGAAATTATCTCCTGCGAAAACTCAGTTGCCTGGGAGAGAATCAAAAGAAGTCCAGGAACGGAAACCCAGATGAGGAAAGAAAACGGCAGGAAATGACTACATTTGAAAGAAAACTTCAAGATCAAGATAAGAAAAGCAAAGAAGTTTCATCCATTTCTAATCAGGAAAACGAGAATGGCAGTGGTTCTGAAGAAGTGTGCTACACTGTCATTAATCACATCCCCCATCGGAGATCTTCCCTGAGCTCCAATGATGATGGCTATGAGAACATTGACTCCCTCACAAGGAAAGTGAGAGAATTTAGAGAAAGGTCAGAGACAGAATATGCCCTTCTTAGGACTTCTGTTAGTAGGCCTTATTCCTGCACCCATGAGCATGATTACGAAGTTGTGCTTCCACACTAAAACCCTCAAGCCGCTTTATCACCTTGTAGCAATGAAGATGATGCAGAACAGCAGACTCTGGAGAAGTTCTTCACCCTGAGCAGTGCATGAAACATTCCTTTCTGGCTAAAGTTTAGAAATATTATCTTATTATATATCCTTAGGCAACTCTGAAATGTGGCATCTCTGTGGTTTAGGTGGAATCATAGAAATTGAAACAATGATCTAAAATATTCTATGTGTTTTTGCTTGCAAAGTTTGAGGACATGGAGGTGATAAAAAAACTTTCTTAGGACAATAATGTAAAATGAAAATAAATTCCTAATCCCCCTGACTAACTGAATGGACCACCTTCTGGGCCAAGGAGACCTCAGATGATCTTGAAAGACTGAATTCTGGCCATGATAGGAAGGGAGATGAGACACACCTTGTTATACCCCTTCCCTTTTGGAGTTTAGGCACAAGTGACCAGGATGAGTCATAAGACTGATGAAACAGACTGATTGTGGCAATAAGAGTCCAAATTCCTACCTGACTCTGGTGTAGATCACACGCTGTCTGAGGGGTTCCATCTATGAGACTTTGTCTACATAACAAAGACCTTGGTTTCCACAACCCCTTTATTTTAGCTAAAGCATTCTTCTCTACTGACTTCTTAAGTCTTTAGACAAAGCTTAACTCTTTCAACCAATTGCCAATCAGAAAATATTTGAATCTACCTATGACCTGTAAACTCTCTCCTGCTTCAAGATCTTGCCTCTTTAAGCTGAACCAATGTGCACTTTCCATGTATTGATTTGTGTCTTTGCTTGTAACTCCTGTCTCCCTAAAATGTATAAAACTAAACGGTAACCTGACCACCTCAGGCACACTTTCTCAGGACCTCCTGAGAGTGTACCCCAGGCCATGGTAACTCATATTGGCTCAGAATCAACCTCTTTAAATATTTTACAGAATTTGGCTTTTGGTTACCAATAAATCTCCACAAATAAATGTCCAAGAATCTTCAATTCCAACCCTGCTCACCAAAGTTCAAATGCCAACATCTCCCCATCCAATTACCTATTTCATTTTTGAGGTGTAATCTACTCAATAAACTGTATAAGACCAGTGACCAGACCCTTTGCTAACCTGATATTTACTTCAATTTTTCTTTTTCTGTGTACTGGAGATTTTTGCTTATAAACTTACAGTAATAGTTCAGAAATTAATAGTTTTTGACATTGGCTTTTCTGAGAAGAAAATTGAAAGTGTCACAAAATAAAAAAAAAAGATGAAATGAATCATATATAATTGTCCATTTTTTCAATTTTCTAGCCAGTAGAGGATTGAAGGATTCTGTTTAAAGATTAGTAAAAATTGAAAATAAACTTGTGCTTATACTTTGTGTGCAACACACTAGTTAATTTAACCTGTGACTAGTTATCTCTACTGAAGGTGGATGTATAGTTTCTGGTTTTAAAATTCAAGCAAACTGGAAAATGATCCATCTAATTATACTTTCTTTCCCAAGAAATTTTTAAATGATATGCCAGCTTCCTAATTTGGAGATAAAAGCCTTAATTGACAATGCATTTATGATATATATTTTTTGTATAGTTACAGTATACAAGTTGAATATCCCTTAGATAGATGCTTGAGAGCAGAAGTGTTTTGGATTTAAGATTTATTTTTGGATTTTGGAATATATCCATACACATAATGAGGGAGTTGGAAGATGGGATTCAAGTCTAATCATAAAATTCACTGACAGACTGGATTAAGAAAATATGACACATATACACCATGGAATACTATGCAGCCATAAAAAAGGATGAG
>XM_028615259.1 Sodiomyces alkalinus F11 hypothetical protein (SODALDRAFT_392700), partial mRNA 
ATGATGGGAATGCACCCAAGCCACGAACTATCCGCCATCGAGGAAGTTCTCTCAGATGAAGATGAAGATGATAACAACAAGAAGCTGAATGATGTTGACCATGAAGTCTCGGACCAACCGTACCCTGCCCTTGGTTCGGGTCCCATCGCCGAAGAGAGTCAGAATGGCCAACAATTTCCGCCGGAATCTGCTGAACATGACACGAAAGACTCCCACCGCTCGCAACAGGTAGATGCTCAGCATAGCCCTGATGCGAACACGGTTGGCTTGGCCATCTCGGAGCACGAGGACGGCCAAGTTAACCAGTCTGGTTTCTTTGGCTATGTCCAACGGAACGACGAGGGGCACTATGCTAATGCCCATGATACCTCCGATGGGGATTCGTATGATCCGATGGACCTTGCTCCGCTTCAAGACATGGTCCGTAGCGTTCCCAGCTCGGGGGGCTGGGAGCCCGAGGAGCAATATGAAGCCAAGGCTCTTGAGGGTCTTCAACGGGAAGAAGAGGTTGTCCATACTCGAAAACCAGTCCGTTCAGCCTCCCTGGAAGAATTATATAAACTTACTACCGAGGGGTGGCTGGATGCCAACGAAGGATCGAACGGTTGGTATCCTATCAATGGCCGTGATGATCCAGAGGGAGACGAGGTTGTTCATGCGAATCAACCCACCCGTCCAGCCTCCCTGGAAGAGCTATACCGGTTCACCACAGAGCAGTGGCTAGATGCCAATGGAGAAGAGGACGGCTGGTATCCTATCAATGGCAGTGGCCGTTTATCGGACCCTCCGGCGTCCGAGTCTCGTCAAGATGACAGCCCAGTTAACTTCGACCTATTTCACGCGGTGGTTAATTATGTTCCTCCTTACTTCACTACCAATTACCAAGGGAGACAGGCCGGAGACCGTACTGGTCAGCCTGAGGCCACTGGCGGTGCTGTCTATTCCCCGAACACCCGTGACTGGGCCGATTATGGAAGCGCTCTCGTCGACTACGCCCCTGAGACGGCGATTCCCAAGGTTCCTGGTTGCACAGCTGGCCAGCATCATGCCCAGAATTGGACCTTCGGTGCTTCTGCCTTCATAGCATATGCTGCCATGCGTGGTTCGGGCATGGATACGGGCAACCCGCTCCAGACCTGGATGGGGGTTAAGGGTATAGAGCGTCACGGCCATGACCACGACCTCGACTACGACCACAACAACTCCCGGGCCACGGACTCGAAGGCCGACGACTTCAAATTCAAGCAACTAAGAAGTTTCACCGCCGAGGTTGAAGTGGCCCTTTGGGAAAGACCCTTGGTCATTGATGAGAACCGTCAGCAGCGAGTTGAGATCCCCCGACCCAAATACAAGCACCTGAACCCTCCCGAGGGGTTTGAATATCCCCATCACCTCGCGTCGTCGATCAACGGCATCGCCGCGGATAGCTGGGAGAGAGCGAAGACTTTCGAAGAGGAGTACGATATCTCGGATGACGAAGGATCGCCTCCCTCTGGTCGTATATCACCTTGCACATTCCGCGTCCTGGCCGAGGGTTGCAAGCGCTGGGAAGACCCGGCCAAGGACCACAGAGTCGAGATGCCCCCTGAAACGAAACGACTTCGACCTGAGACTCCTCCCCCGACAGACATGCCGACATATCATCGCAACCGTATGGGCCACAAACGCACCTTGCAGCAAGACGTGGAAGACGGTAGCTGGCTCTCTCCCATCTACTCTGTGACTGAAGACCCGAGTATCATCTACACGCCTCCCGGAACCCAACGTCATCCGACAAACTTTGCCATATGTAACTGGCAAGACAACGTCCACGAGGTCATGGACCCTCTTGGCGCCCAACATCTGCGTGAATTCCAGCCCACCAGCCATATCGCCCCTAAAATCACCACGCCCAACGACCTGGCCCCGGCCCGCATAGCCTCAGCACACACCGCCGCGACGCGAAGCTCAGAGAACCGGCCCTACACAGCAGCAGAAGTGCAAGCAGCCCTGCTCTCCCCGCAAGCGCGACCGCTAGTAGACGGCAGCATAGCGCCCGAACACGCAGCGGCGGTGCTCGGAGCCCACTGGCAATGGGCATGCCAGATGCGCGACGCCGCGGCGCAGCAGTCACAGCGCAACGAAGAAGCGCGGCAGCGCATCAATTCTCTGCGCGACGAGCTGCGCGACATGGAACTCTGCGTCGACCACGTCCTGCAGAGGCGCGAGGAGGAGGAAGAAGAGGTGGTGGAGGAGGAGGACCAGCGCCGCGTCGAGCGCCGGAACCGCCGCATCATACGCCAGGTCAGCGCACACCTCCGCGAGGTCGCGTACGAGGTCCACCGTCGTAGGGAGCAGCTCTGCGTTGTCCTCGGCGAGGCGGCGCAGCTGGAGTGCGAGGAGCAGGTCCTTACTGCCGATGTCCGGGCTGAGATTGCGCGGTCTGGTCTTCCCGATGCTGATGCCGTTCGTGCGGAGGCTGGGCGGGAGTTTCTTGAGCTTGCAGGAACTACGTGA
>XM_017399093.1 PREDICTED: Daucus carota subsp. sativus histone deacetylase HDT1-like (LOC108224459), transcript variant X2, mRNA 
CGAAATTATAGTGGTCCGCGATACACAGTATCCTCACCCCCTTCCTATATAAACATATGCATTCTTCATCTTCTCCGTTAATTAGCCCTAGCTTTTACTCGAAAAATTACTCGAATTAGCATCAACACAGCTGCAATGGAGTTTTGGGCTGCTGAGGTCAAAGCTGGAGAATCTTTCAAGGTGAAAATTGATGAAAATAAGGCGTTGCATCTCTCACAGGCTTGTATTGGTGATGTCGAGAAGGACATTCCTGTGTCCATTTGTCTCTATGTGAAAGTCGATGAGAAAAAGCTTGCCCTTGGAACACTTAACTCTAAAAAGTTATTTCAGCAGAGCTTTGACTTGGTGTTTGATAAGACATTCGAGATATCCCACAACTGGAAAAATGGAAGTATATTCTTCCTTGGATATACAGCTGATAATGAAAAATCTGATCGAGCTTCAGATGTGGATGATTCTGATGCTGAATCGGATGAAGATATCCCAGTTATTGCTGCAAATGATAAACAAAAGGATAAAGAAAAGGCGAAGATTGTAGAACCCAGAAAAGCTGCGAGTTCAGATACTACTGATGACTCTAGTGAAGATGATGAAACTTCAAGTGAGGATGACCCGAAGGTTAGTGTTAAGAAAGATTCTGCTGCTGGAAAACAGAAGGCGAATATTGTAGAACCCACAAAAGATGTGAGTTCAGATGATACTGATGACTCTAGTGATGATGATGAAACTTCAAGTGAGGATGACACGAAGGTTAGTGCTGAGAAGGTTTCTGCTGCTGGGAAACAGAAGGCGAAGATTGTAGATCCTAAAAATGATGCCGACTCCGGTGATGATGATGCAATGTCTGAGGATTATTCAGAGGAAGCTGATGAGTCAGATGAAGATAGTGACAGTGATGAGGATGAAGAGACACCAGTGCAAGTTAAATCTAGCAAGAAAAGAGCTCTGACGCCTGCTAAAAAAGCTCTCCCCGAAAAGAAAGCTAAATTGATTACTCCTCCAAAAACTGATGGCAAGAAGAGCAGTGTCCATGTGGCTACACCCTATCCTTCAAAACAGACTGGAAAAACTCCTGCTAATAAGCTGAACCAGCAGACTCCCAAGACTGACGGGTCTCATACTTGCAACTCCTGTAAGAGGACATTCAAATCGGAGGTTGCTCTGGAATCTCACAACAAAGCAAAACATACTGGTGGAAAGTAAATAGGATGCGAACATTGATTTTTGGTGATGTACTTTAGAATTGCGATGAACTAGGTATATGGTAGGCTTTTGGTTGTTTGTGGTGAAGTAGTTTGTTTCCTTGTCTCTTCAAGTTGTTTTCAATTGGATGCTGTGCCTCTGTAACTGAAGAAACTTGGAGGGTATGGAATTTGAAAGACTATGTTTGATGTTTCTTGTTTGTCTTTTTA
>XM_009911451.1 PREDICTED: Picoides pubescens F-box only protein 15-like (LOC104310052), mRNA 
ATGGACTTGCTCAGAAATCCTCTGCCATGTGAAAACAAAGAAGCCATGAGAGCTGCTGGCTTGAGCTGGATGCTTGTCCTGAAAGAGAAGNNAAAGGAACACCTAAAGGAGAAGAGAAAAGTATCATTTCAGGATGCATTTCTTAACATATTTTGGTATGGTATCAACTGGCCATGTCTGGATGTCCTCGCAACACTCAGGCTCTATGGAGTTGCGCCTTTATTTCCTTAGAGCAGGAAGGGACCTCGCTACCATTCCCTGGTTGCTGAATACCATCTTGCTGATCTGACAGCACCTGGTGCTGACAACATTCTCCAGCTCTTCACTCTGAAGCCAGGACTCTTAGTAGGCCTTTGGAAGGACACAAAGGAGATCGCTTCTGTCTCAGCCAGTCTTCATTATCATCAGTTCATGGAGAGAAGCATCTTGGGTTCTGCTGCTTCTTCTTATGCCCGTCCACTTCATCAGCCTCTACTGGGTGATACTGACCCAGAGTATGGACTGCATGGCTACTGTCTACACTTTGAAATCCACAATGGAACCTGTGCCTACATGTGTGCAACATTCAGGGACCTCTTCTGCAAAAAAGGTGAGATTGCAGATGGGTATGTGAGGCTCACAGCTGTCAGCAGCCTGCAGGACAACATGGACCACTGTCTTTTAGCCACCATGCCTGGCTTGCCCTGTCAGCTGGAAGGCACTGTGAAGGAGTGCTGTGTGCTGGATGTTACTCTCTTGTATGAAGACGGAAAAGCCTTCTGTTGTTTCAGTGGCCCAGTCTCTGTGGGACTGTCTTCCAGGACTTCAAGCTGTTATGACTTGCTGGGTCACAGCTCCAGCAGAGAGTATTGTGAACCTTCAGAAGGCGGAGTCCGTGCTCGGTTCACCTGTGTGAGTGAAAGCAGGCAGCACCTTGGAGTCGTCTTTGCTGTCTGTCCACCTAACTCGTGA
>XM_019704704.3 PREDICTED: Aedes albopictus 60S ribosomal protein L29 (LOC109428867), mRNA 
ATGGCCAAGTCCAAGAACCACACTAATACACACAACCAGAACCAAAAGGCCCACAAGAATGGGATCACCAAGCCANAGCGCCAGCGTAACGAATCGACCCGCGGTATGTGCCAGAAGTTCCTGCACAACCTGCGATTCTCCAAGAAGGGAAACCTGTCCCGTGAAGAATCCCTGAAGCGCGCCGAGGAACGCAAGGCCAAGTTTGCCGGACAGCCAGCTCCGGTCAAGCTGTAAACTGCTTCCTTCTCGATTCCGCTTCGGATGATGATGATGATGGTTGGGTGGTGTATCCGTTTTGATCCGTGATCAACATCAATTCCTAATCTGGTACGCGTTACGATATCCAATGATACCGTGCAGTTGATGAGTACAAGTGAGTTCAATGCGGAATGAAAATTCAGTTGGA
>XR_007260822.1 PREDICTED: Pyrus x bretschneideri uncharacterized LOC103942768 (LOC103942768), ncRNA 
CAATTATGGAGGCCAGAGAGAGAGGGGGTGCGGCATAGAGAGAGAAGAGATAAATGTGTAATTGTGAGATAGACGGTTCTATGCTCACATAATTTTCTGCTTGGTTCTTCAGATACCTTCCGTGCAACATTTGATGTGGTATGGTTTTCCAATTTCCCCTTTGCAACAATTTCTTTTTGGTTTTTGGAGTATGTATGATTTATTTTTAATTAGAGAAGAAAAATTAATAAAACACAAGAAGCAATTGGAAACATGGCTGCAAGTGATAAGCCAGAGTCTTTTTTTTCAATTAACTATATTACTTTTGTAGTATATGCATGCGCAGGAAAAATCCAAATCGTACTACAAGATCTTAGGGCTCTGTATTTTGTGTCAAACCAATGCATTGAGAGAATATGAACTATTGCGTCTGGTTTGGATATGTGTCTATGGTGGTACCCCTATTTCAAGGCAACTGAGAGCGCTTGACTATGGTAACCCAATGGCTTTCTTTGTTGTTTTTCCTTAAGAGGTTATCGATTCCTTACTTTTTTAACTGAGTTTTTGACTATCAATATTTTGCATTTCTGAGCTTAAAGGCACAAAATGATTATTTGTTATTGGGTAGATGGGTTGCTAAAGGCAAGCAAGACACATAAAAATGACCATTGGGAACGAAAAGTCGCTTCTTCGGTGTATTTATACTTTTTTTAGTTGTATCATGCGAAATTAAGTATCGATTTGCTATGTGTATTTTGTTGAAGTTATGTTTTGATGAGCTTGGATTCCTGAAACGTTTGATACTAAAATGACATGAATAAGCATAATGAATGGTTTGAAAGATGCTATTAATGGTTTTGCGAGTATATCGTTAGTCGTTTGGTTGTATGATTTGTTTTTGTTTTTTCTTTCAAAGCACTTTGCTCTTAATTTTTTGGGGCTGCAGCTTTCGAAGCCCTTTATGCTCAAGGTAAACAATTTTGGATTTCAGCCTTCCAACAATTTTTTTATTTATTTGAATATTGTGAAAGTTGTGTTTTATATGCTATGAAAGTTGAATCTGTGAATTTTTTTTTTTTTAATTCATGGTATATATTCTATTTCATAGTTTTGGATGATGTTGGATTGAAAAGCTTTTCTATAGAACTTATAGTTATTTAAAGTGTTTTATCCATTCTTACATTTACTCTCATAAATTATAGCTGATTTGTTAATCTCTTACCAAAATACGCAAATTATTTTGTAAATTTGTTCTTATTCTAGCAGGAACAACAAATGCAGAAGGGGAACACATATATAATCAGTGTTATTCTAGCCAAAACCTTTATTCTCACAACATTGGGTACGATTGTTATAAGTTTCAATTCATTGTACCTAAATTGAAACAATTTACTATTAGCACAAACTTTTTTATATTTTAAACATGATATTTCATGCATTTTCTAATCCTGCAGCAACGTGCGGGTAGTACTTTCTAATATCTTCTATACATCAAATACATTTCCTTGGCTCCA
>XM_022304284.1 PREDICTED: Myzus persicae uncharacterized LOC111026242 (LOC111026242), transcript variant X2, mRNA 
ATTTCAAATTTTTCTATATAGTATGAATACAGAATATATGATAATATTTAGGAATAAAATTACCTATGTCCTATATTAATATAAACATATTTAAGTACAAATCAAAGTATAAACGCATGTCGTTAAGTTAAATAAGGGTTTAATTTGGTTTATCTGCTGATATTATTTTTTTTACTAAGTATTTTATTCTAATTTCTGTGTATCATGTCGTCAGTAAAGGAAGTTTTCAAAATAAGTTTTCAATTTTTGGCTCAACAAACAGATAATGTTATCAAGGATTTCTTGAGGCTCACCAAAGATTTTATGGACAACGGACCTAATTCCAGTCTTTATAACAAAGCTGCAGAAAAAATGCAGGTTGATGAGGACAAAATAATATCAGTTGTAAAAAGCATATGTCTCATGTGTGTGCAAAGCTGTAAGCATAAACTAACTGATTTGGAAATAAAAGAATCACTGACAGAATATGGTTTTAGTGAAACCAAATTAGATATGATTATATTATTTTTGGAAAACCAAAAACCTCATTTACTAGATATTTTGTCATTAAGTGCGTTTGTATTCCCACACTTCAAAGAACTGGAGTGGCGATTTGAAACCGATATGGGATCCAGATCTTTATTACATCAAACCGTGCCAGTTGTTACATTGAAATTAGATTTAGAAAAAAAGGATATTTCCGAATCGTTATTCCTACAAACAAATCCATTAAACTTGGTTCATATCAAAGATACACTAGAGACTGCTTTGAAACAGAACCAATCTCAATGGATAAGGAAAATACGTAGAAAATTGAAATAAAGGTATAACTGTTATAAACAATATAAAT
>KY530257.1 Liriodendron chinense AT4G19003 mRNA, partial sequence 
ATGGCTCCTGGGAAAGCCATAGTAGGGGCTGCTGCTGCAGCAATTTCCATGTCTATACTCTCCATCTTCCTCTGCAAATCTCTCTGCAATCTATCAATGAGAAAATTCCAAAGACCCATCTCAAAAACCAAAGCTAGAAAAGGCCTCATCGACGCCATCGGCAATACCCCTTTAATCAGAATCAATAGCCTTTCAGATGCCACTGGCTGTGAAATTCTGGCGAAAGCTGAGTTCTTGAACCCTGGAGGCAGCGTGAAAGATCGAGTAGCGGTTAAAATCATAGAAGAGGCTCTGGAGTCTGGTCATCTTGTTCGAGGCGGTGTAGTGACTGAGGGGAGCGCTGGAAGCACTGCCATTAGCCTTGCTACGGTGGCTCCTGCTTATGGATGCAAATGTCATGTGGTTATACCCGATGATGCTGCTATTGAGAAGTCTCAAATACTCGAAGCTCTTGGAGCTACTGTAGAAAGAGTAAGACCCGTTTCGATTACACACAGAAATCACTTCGTCAATATTGCAAGGAGAAGGGCATCTGAGTTTACCGAATTAGCATCAAGACAGCGAGAAGCCGAACGCTCCGTACATGTCAACGGTCATGTCTCAGAAGAAGGAGACCGCCCATGCGCTTTCGCTAAAGATTGCAAAGGTGGTTTCTTTGCTGATCAGTTTGAAAACCTGGCTAACTTCCGTGCTCACTATGAAGGCACTGGCCCTGAGATCTGGGAACAGACTGGTGGCTACTTGCATGCTTTCGTTGCAGCTGCTGGTACAGGTGGGACCCTTTCCGGCGTTTCGCGTTTTCTTCAGGAACAGGATCCTAATATCAAGTGCTTCCTGATCGATCCACCCGGTTCGGGTCTCTTCAACAAGGTGACAAGAGGGGTGATGTATACACGGGAGGAGGCTGAGGGTCGGAGGTTGAAAAACCCGTTCGACACCATAACTGAGGGGATCGGAATCAACAGGCTAACCAAGAATTTCATGATGGCAGAATTGGATGGAGCTTTCAGGGGTTCAGACATGGAGGCCGTTGAAATGTCTAGGTTTCTTTTGAGGAATGACGGGCTATTCCTCGGGAGTTCTTCAGCCATGAACTGTGTTGGAGCCGTGAGGGTCGCACAGTCGTTGGGCCCCGGGCACACGATTGTGACCATCCTGTGTGACAATGGGATGAGGCATCTGAGTAAGTTCCATGAT
>XM_052888826.1 PREDICTED: Bicyclus anynana jerky protein homolog-like (LOC112047489), transcript variant X2, mRNA 
CGCACTGTACGCGACGGCCGTAAACCCGCGCTCCATCTGAGCCCGCGTGCAGAAGGCAGTCAACGTCATAGGGACTTGGTTCCGCCTTTGGCGGATAGAAGTCAACCCAGAGAAGAGCGCAGCTGTGCTCTTCACTGGCAAACCGTTTTGCCAGAACAAACTCAAAGAAGTCTCACTCTACGGAGCTCCCATCCCCTGGCAACGTACTGCCAAATACCTAGGCGTGACCTTTGATAACCGCATGAGCTTCTCCATGCACATTAGGGAAGCTAGAAAAAAGGCTGCATACGTAATGCACCGCCTCTACTCGATGATTAACGTTAAAAGTAAATTGTCCCTCCGCTTAAAACTAACGCTTTATAAAACTACGATCCGTCCGATCCTAACCTACGCTAGTGTAGTGTTCGCCAACCGTCCCAAAGCGACCCTTAAGCCGCTTCAAAACTCTGCAAAATCGATTCCTACGGCAAATCACGGGCGCGCCGTGGTTTGTACGTAATAACGACCTCCATAGAGATTTAGAACTACCTTCAATAGCTAATCACATGAAACAGCTCTCTCAAAACTATTTTGAAAGAGCTGCCATCCATCCCAACCAACTAGTGGTTGAGGCTTGCAACTATACTCTCAACCTTAACGCTAACTCCAAGCAGAGACGTCCCAAAAACATCCTTTACGATCCTGACGATGACATGACAACTGACAATGCTTCTCAGGCAACACAATCACAAGCTACACAGCGTCTTCGCCGGCGAAGACGAGGTCCCCGATATCTAACGTCACCCGGAAGTGGGTTTTCTAACTCACGATCTCGGGGGCGTCCGGACTGATTCACTCAGGTCACGGTCAAACCCTCCCGAATGGCCCTCTAAGCCGAGGCCCGAGTCTCATAGGAGACGACCTTACAGAGCCGTTCCGTCCTCTGTTTTTATTTCAGCCTTCGTGCACAGGCGATGCTTCCGCGCTCGCCCACCCCCTACCGGTGACGTCGTAGTGGTTCCACAGGGAGCTAAACGGCATTTACTCAACAAAAAAAAAAATATTTTCATTTGTGGTCTCGCGCGCAATAGATGATACTTACGCCTTCTCTACAGTACTCGCGAAGTTGAACGTATTTCTCAAAGCAAAACAATGTCGGAAGTAAAAAAGAAGAGACGGCAATACTGTGCGGAATATATTAAATTCGGATTTATTGAAAATCCCACAAACCCATCGTCGCCTTTTTGTCTTCTATGTCTAAAAACATTTTCGAATGAAGCAATGAAGCCTTCAAGGCTGCAAGATCATTTGAATAAAATGCATCCAGATAAGAAAGACAAGAATGTAGCATATTTTCAAGACCTAGAGAAGAAGCATAATACACAGCCAAGTGTAGCAAAACTATTTGTCCAAGCGCAGACGTCGGACGACTACGCGGGTTGCGGGGTGCGGGGACACCGCGCCGGCCCGTCGTGCCAGCGACCGACGCGCGGACACTTCGAAATTGATTCGCACGGACTGTGTGCGCATACACAATACAATATTGTTGTTTGGTCTTTTATATACTTAAATAAAATTCACGAAGAGCACCAGTATTCATATTTACAACCACCAGCTCGTTAACACATCACTATTTTTGGTCTTTCGCCCTTCTAACTTTGTGGATTTGGAAACAAGCCATACGACAAACAAGAAAGGATTTCTGCAAATGGGAATACCTACAACACACAGCTGTGAAGAATTACGAGAAGAACACCACGGAAACAAAGGACGAGGGACACGATACTGAGTGAGTTCGTTCCATTTTCCTTCTTATTTTTCCGTCTTCCTTGCGCCTTCCTTTCGATTTTTCAAAATTAGAATTTCTTCACACGCTTAAGGTAATCATTATTACGTAATAAACTTACATCTAATTCTTATAATAATCATAATCTTCATATGTACTTAAATACTTTTATTGAGAATTATAATAATCATTCATTATGCTCCAAGCTAATTTTTTTAATTAATTGCTTGCTTATTCATTTAATATTACACGTAGTTAACTACCTACACGTATTCAACTCGCTTCGACCGCTCGGCCGCTCGGCCGCTCGGACAAAAAACCGGTTCCTTATCGCTAGCGACGTAGTTCTCATACCTATCTTGCAGTCAATTTGCATCGTAATAATATAATATGAATGCATCAAATAGGTAACTACTCATCACGCGCGGCTTTTTAGCTGTTTTCGGCGGCTGCTAAGCAAGTTGACGACGACCTTCGAGCTTCGTACAATATCTCTTTGTTAATTGCTCAAAAAGGCAAACCACATAACATCGGAGAAGAGTTAATATTGCCAGCAATAAATCAAGTTATAACTACAGTGGACCCCCGGTAATCCGGCCTCTGACTAATCCGGCGCCCCCTGTAATCCGACATGACAGAATTATGTTTGACAATTCTTGCTAATATCACGCAAGTTTGAACAGGTCACAACTCGTACGCGCCACCGCTATTGTGCTCGACGCGTATGCATTGTTTTACTTAGTTTGAATTTGACTACTAGTGATAGCGGTACGGCTTAGCGTACGTTCATTGTTTACTACTTATTTATTCATTGTGTATTAGGTATATGTAGTACCTAGTAATGTCGTCATAAACCCACAAGCGAAAGCACAAAACGTTGACAATTAAAGAAAAATGTGATATTTTAGATCGCTTAAATCGCAATGAAACTTTCAGTAGTTTAGCAAGTGAATACGGCGTAGGCCGATTTACAATTTATGACATTAAAAAAAAACCACGAGAAGAAGTTCGTGTCAACTACTGACTGCGGGCCAGGTAAGAGATAGACACTCAAGGAAGCTGAACATCCAGAAGTGGAAGAAGCTTTGTACATGTGGTTTCTTCAGGAAAGAAACATGCATGCACCAATTTCGGGACCCATGTTGGCGATGAAAGCTAAGTTTTTTTATAAGGAAATAACAAAAAAAGATGATTTTGTGGCCAGCAAAGGATGGCTAGAACGTTTTAAAAGTCGTCATGGCATACGTTTAATGACTATTACAGGAGGGAAACTTTCTAACGATGCCACCTGCATAGAGCCCTTTAAATTAAGATTTTTGCAAAAGGTGAACGATTTAAATCTTGGCCCGTCACAGGTGTATAATGCAGACGAATCAGGGCTTTTTTTGCGTGTGATGCCTAACAAAACTTTCGTTTCTTGTAACGAAAAAGACGTACCTGGACGAAAAGTGAGTAAAGAGCGTGTAACCATACTACCATGTGCTAATGCTGCAGGTACACACGCGCTTACGATGGTGGTCATTGGGAAATCTAATAAACCAAGGGCATTCAAAAACATTGATTTACCTGTACACTATTACGGACAAAAAAGTGCATGGATGACAAAAGACCTTTTCAAAAAGTGGTTTGATGAATGCTTGGCACCTGAAGTTAGAAAATGGTTAAAAGATCATAATTTTCCTCAAAAAGCGTTGTTGCTTCTTGATAACGCTCCCGATCATCCGTCTGAAGAAGAACTGACAACTGAGGATAAATGCATCACTGCGATGTTTCTTCCGCCAAATTGCACTGCACTGATTCAACCAATGGACCAGAACATCATTCAGTTTGTTAAGCAAGACTATAAAAAAAACCTACTTTTAAGAGCCGTATCAAAAGACCAACCAATAGAAAAAACTTTAAAAGAATTTAATATGAAAGACTTGGTTTTTGCTCTTAGTCAGTCGTGGAGTGCGTTACCGTCATCAACTATTAAATCGTCTTGGAAAAAGTTATGGCCAGATATAATCACCACTCCTAGCAACGATCCACAAATCAGTGTAACTTCGGAAGTTATAGAACAAGTCTCTACTGAAACACAGATAAGTCCGGAAGATTTGGAAGTCTGGTGTCGTGGAATGGATAAAGAAGAAAATGTTTTTCTTGAAATGCCTGACGAAGATATTATAAAAGAGGTTTCTAATAATACAACAAACGATCAGGAAGATAACGACGACGTGATTGCAACTGCTCCACAAGTCACAGATCAAGACGCAGTTAACGCTTTTGAGCTAGGTTTTGTGACGGAGTAAAGCGCCATCTGTTGGTATGATGACGAAATCCGTAGAAAACGCGCTCATAAAAGGTGCGAAGAATTGATTATATTATGGGTCGCTAGTGAATGGCCGTCTAAATCATAGATGGCGACAGGATCGTGTCTCTTCGTGTGAAATTGCGTTTCGTTTCAGGGTCGGGGTGTGCAAATTGGCAATTTTCGGGTAAAACAAACTTCGTGGGGGTTCAAAAACATAAAATAAGGCACTAGAATGGTGTTGGCAAGCTTATGATTTGTGAATACAAAAATAAAAGGGATAAAGATTTTCTATTGTTATAGTTAAGATTTGTATGAACGAACGAATTTTTTGATGCGTCGAACGAAAACGTGTGAGCAAAGTTCTCGCCGGGGACAGGGTTTCGGTGATTTTCTGGAAACAGCCACCATGAGCTGAACAAAAATATCCGGGGGGAAGGATTTAATGTAGCAGGTCTGCTGAGACCAAAAACCTTAACTAAAATATTATGTTCAGCTCATTGAAAATATAAGTTTTATTAAGTCTTGGGAAAATCACAGGAGTCTTCCTTCCCGTTGGCAATGAATTCGTATAGCGACTAAATTTAATATTCGGGGGGGTGGGCCAGAGAGAACTGATATTATCAGGTAAGAAATATTTTTCACTTTACGGGACATTGTGCGGGGTCATTGACCACGCCGGTAGAACTTGACAATGACGTGTCATTTTTTTCGTTTCAGTGGGAAAAACAAGAAAGAAATATATAAGAATGAGTTTCGAGAACCTTTGAGAATGTAAAAGGGTAATTTATGAGTTTTTACGAGTTTCGAAGAGGTTGTACGAATCCGTCGTGACGTCGCGGGATTCGTGGAAGGCTTTAAGAAGATAGTCATTTGCCGGTTACAACATCCGGGAACGTCGCAAGCTGAGGCAGACGGAGTAGCCGTACCAGGTCAAGGGAGTCCGGCAGGACATATAACCGGGTAAATACCCAGACAAGGTCAGTCCTAACCTGTTTACCAAGCTTGCGTTGATCTTCGGTGTTATGGACGAGAACATATCTATACAGTGTTAATTTCGGGGGGGGGGGGGGGGGATTTTTGGATATTTGGACATTGGATCTGAACCGTGTTCGGATATAATTTAAAGTTTAGTGCTTAACGATTTATGGTGGTATTTTGTATGTGGAATTTTGTATTTTGTACGCGGTATTTTGGTATATTATGATACTTTGTGTAATTTTGTCCAACAGCAAATATTATGCTGTTTGAGGATTCTATAGTAGTACATGCTTAATTAAAGGTTTGGTTATGCTTTCTCTTACGGAGGTGGGATTGTGGGAAAATAAACAAACTTTCCGTTTGGTTGGTTAGTGACCGGTAGTGTGATTTGGACCCACGGGCTCTCAATTCAACGACTGAGATACCGGGACATTAGAGCCTTTGAGTCCGGTCCAAGTAACCCACATCTTCTTTCCTCCGTGGGACGAGAAAA
>XM_029190890.2 PREDICTED: Osmia bicornis bicornis bromodomain-containing protein 7 (LOC114877834), transcript variant X1, mRNA 
CGTTTCTCGTCACTTTTAATTGTCTCGTAACATCATCTTGACATCGCCAGGTCGTCGCGTTATGTGCCGTCTTATATAAATAGTCGTTGTACTTCGTGCTGTACAGTGTGTTCCAAATGAGCTCGCTACGCGCCTTCAATTCAAACGTTTCGATTGTCGCTTTAGTGCGATATTTGTTTTTATGTTCGCTGATCAAATCATATCCGCGATGACAGCTCATTGCTACGTTATCAGGTGTTCTCATTGCATACTGTTTTCACAGCTTTTTGTACTTGAATGCATACATACGTTCATCGAAGCAACGGCAGAAGGGCACTATACAATCACGGATAAACCCCGTACCTTGAAGTTAATTTTAAAGGTGGGGGGTAGTAGTGGCACACCTGAATACGGCAACGAATCTCCAAGTCAAACAACAATGTTGTCTCAACATTTAGGTGTGTACCAGCAACAGTTGGGTCTCAACTGTTCCGTAACGCAGGAGTCTGAATACGATAGGTATTTGGGGCATAAGAAACTCAAGAAGAAAAAGAAAAAGAAGGATAAAAGACACAAGCACCATCATAAAGATAAGAAAAGACGAAGAGAAGAGTCAAGTCAAGAATCCGTAGGAGATGCGGATGAAAGTTTCGCAGAAGTCCCCAAAAAGATTCCTAATCACCAGTTGCTACCTCCTAGACCCCCATCGAGCGGAGAGCACAGAGTTGGCATTACTAGCCATATTAGCTCTCTGTCTCCGCATCGTGAGCCTCGAACTTGTGTGCTTCGAAAAATTGCCGAGCGTACACCCCTTCAACGATTGTTAGAACATCTTCTCAGGTCAATGGAAAAACGTGACCCACAGCAATTTTTTGCTTGGCCAGTCACAGATAGCATTGCGCCTGGTTACTCTCAAATCATTACTAATCCTATGGATTTCAGTACCATAAAACAGAAGATAGATGATAACAATTATCAAAATTTAAACGAATTTATAGACGATTTCAAGTTAATGTGTGATAATGCTACTACTTATAATCACCCAGATACAATTTATTACAAGGCAGCTAAGAAATTGTTACACGTTGGTCTAAAAATGGTTACACCCGAGAAGCTTCGTCAATTAAGACCCGTTTTAACTTATATGCAGGATATTTCAAGAGAGGAACTTGGATTCGAATTAGGTACAGAAGATCCTAACAATCCAGATGTTCCAGTAACGGAAGAGCAAATCGAACGGGAACGAGAACAGGAGGAGCGCAATGAGGAAGCGGAGGAACTTAGAAAGGAGAATCAGAGGAAAATGAGATTAGCGAATTTAGGTAAATTCGAAGCTATCCCGGACGATTTGACTCCTGAAGAGATCTTGAAACAAGCGCGAGGTGCTGCTAAAGCAGCATCCGAAAAGTTAACGTTGAAAAGGTTGAACTCGAAGATGGGTTTCCTTAGACAAAAGAAAGATGGAACTACTAGTTTACAGATAATAGTACCCGGAGATGGAGTGATTCCAGGAACCAATCAAAGACCGGTATCGTTAGGTCAACTGATAGGAAAATTGAATCATGGTACTGGGGCATTAGCAGGATTTCGTGAAGACAGGAGAAATATGTCTAAACCAGTAAAACCTTTATACTACGGTGCCTTTGGCTCATACGCGCCAAGTTATGACTCTACGTTTGCCAATCTTACAAAAGAGGAAACAGACTTGGTGTACCAAACGTATGGCGATGAGACGGCTGTACAATACGCGGAATCTATTTTAGACTTTGCTAAAGACTGTGATTATACTCTGACTATGGTCGACGATTTACTGGATATATTGACAGGAGGTGATCACAGAAAGACCAAGAAGTTCCTCGAGGAAAAACGAAGGCTCAAAGAAGAGGAGGAGAAGATAAAGCATTTACTAGAGAAACCTATGCAAGATATAATTCGAAATATCTCAACTGTTGACAACGTTAAAGTTGATATTGATCAGTTGAAAACACTTTCAGAGCTAGGAATCGATGTCAATTTCTTGGAAAATCTAGATGTTGATTTAAAGACCACTGAGGAACGTACAGCCTTGCAAAGTCGTTTGGACGATACGTCGCAAATGTTGAATCGTTTGAAGCAGGTACAACACGAACGACTCTCGGCTCCACCACCCCCTCATTTGTCGAATGTTCCTAAACCATCAGAAATCGAGGTGGCGATAGCTGACAAAATCACAGACAATTTAACGGAAATAGCTAAGAAGCTTCCTCCTTCGGCTATCGCACCCGTGGAAGGTTTGAGAAAGGCCATGGGTATAGCACCTCTTGGAGGACCAGAGCCTATGGAGGTTGAACCTATCACTCATAACCCGACTATCGTCGCAGAAAGTAATCTATTATCGCAAGCTAACGCTAATCAAGTTCCGCCGAATTTGTTGCCAACTCCCTCACCGATTCCAAACACAAATTTACTCAGTTCAACGACTAGCCAACAAGCTCAACCGATCAGTATCGTGAACGCGAATCAGCCACCTATTCAAATACAGATTGGCATGGCGCACAGTCAGACGCCGCCATCTTTACTTGGTACGACAGAAACATCCGCGGTTCCCGATTTGGAAACCGAACTTCGTGAATTTCTAGAGAGCGATCCTACGTTAGGACACTCCCCTCTTCACGACGATAAAACATTGGAGGACATTTTATCTGAGTCTTAGTGTGTACGATTCGCGATAATATATTTTTCGTTTATATACCTCCCACAGGTTGTACATTTTTCTTACGTATCAACAGCAATAGGTTTAATGCGAAAATGCGTACTGTTTAATAAATATAAGGTCGTGTCCCCATATCGTGTTGTCATGCAATCAACACCGTGCTTATTTTATATAATTATTTATGAAGTTTGCGTAACAAATAATATTAATGGAACACTTGTAAAATTTTTATGAGATACACATGTAATGCGGAATATTGTTTCATTATAAATGTTGAAGAGATTTTAATGAATTATACCCAAAGATAAATCAAATGGAATTTACTTTATTCTTACTTTTGTTTTTAATCCTAAATTTTGATGTTAATCGTTTGTCGAAATGTTACGCAAACGCAAATACGTATTTTAAGAGCAAGGAAAATACTTTGTATTCGAATAAATTCAGACTTTTCTGTTGCACA
>XM_028730195.1 PREDICTED: Podarcis muralis actin binding LIM protein 1 (ABLIM1), transcript variant X39, mRNA 
ACAGTTGCCATAGATATGCCATCTTTCCCCAGTCTAAACAGTTTTGGGAAGCTTTGTGGATCAGGGAAAAGCAAGAGGTTGGTGTCTGAGCGGATAAAGTACAAAAACTCTATCAAAAGGATGTCTATTATAGAGGACGGTGATATTGCTGAGGTCTTGTACCTCATCCCCAAGCAGTCTGTGATGAAGCAGCTGCCATACCTGAATCCAGATGACTACTATTTGTGTGAATGGTTGTTTGATTATCCAGAAGGTTCAGTGGCACATCCTCAGGAGCCTCACCATTCCACAGAGAAGCCAGTCATCCACTGCCATAAATGTGGGGAGCCATGCAAAGGAGAAGTTCTTCGGGTCCAGGCCAGGCATTTCCACATCAAATGCTTTACCTGCAAAGTGTGCGGGTGCGACTTAGCTCAAGGTGGCTTTTTCATTAAGAATGGAGATTACCTTTGTACTGTGGATTACCAGCGGATGTACGGGACCCGATGCAATGGCTGTGGGGAGTTTGTGGAAGGAGAAGTTGTAACTGCTCTTGGGAAGACCTATCATCCTAACTGCTTTGCCTGCACTGTATGCAAACGTCCTTTCCCACCAGGAGACCGGGTTACCTTTAATGGAAGAGACTGTCTCTGTCAAATGTGTGCTCAGCCTATGTCATCCAGCCCAAAAGAACTCTCCAGTTCCAGCAATTGTGCAGGCTGTGGAAGAGATATAAAGAATGGACAAGCATTACTAGCACTGGATAAGCAGTGGCATCTGGGATGCTTCAAATGCAAGGCCTGTGCAAAAGTCCTGACTGGAGAATACATCAGCAAAGATGGTGCACCTTACTGTGAAAAGGACTATCAGGTTCTCTTTGGTGTCAAATGTGAAGCATGCCACCAGTTCATCACTGGGAAAGTCCTAGAGGCAGGGGACAAGCATTACCATCCAAGCTGTGCACGATGCAGCAGATGCAATCAGATGTTCACAGAAGGAGAAGAAATGTACCTGCAAGGTTCTACAGTTTGGCACCCTGACTGTAAACAGTCCACAAAGGGTGAAGAAAAGCTAAGGCTGTTTTCACCACCTTGTATAATGAACTCCATCAAAAAACTAAGGCAGCCTACAAGAACATCTTTGGAAAGTATTTATTCCAGGCCTGGATCCAGTATACCTGGCTCACCAGGCCATTCAATCTATGCAAAAGTAGACAATGAGATCCTTGATTATAAGGATTTAGCAGCCATTCCCAAAGTCAAGGCCATTTATGACATTGAGCGTCCAGACCTAATTACTTATGAGCCCTTCTACACTTCCGCCTACGAGGAGAGACAGGAGAGGCAGAGTCTTGGAGAGACTCAGAGTTCAAGATATGGCAGTTCTCCTGTGCACGATGAAAGTTCTCCAAGGACACTCTCTCCAACTCCATCTGCAGAAGGATATCAGGATCTTCGGGATCGGATGATACACCGGTCTACCAGCCAGGGGTCCATTGGTTCTCCTGTGTACAGTCGTCACAGCTACACTCCCACAATGTCACGTTCACCACAACATTTTCACAGACCTGATCAAGGCATCAATATTTATAGAAAACCTCCTATCTACAAACAGCATGTACTGTTGGAAGGCATGTTTTTGTAATTCCCTGAGCAATGAGCCAAGATAGCTGCTCCTTATCCATTAAAGGCAGGGATGGGAAACCTCCGATCTGGGCATCAAATGAGACTTCTCTTCTGGCCCTCAGGACTCTCCGCAAGCTACACACCCTCCTCAGTCACCCACCCCTGCTCCCCAGCCACACCATTCTAGGACTGATCTTGGCTGGCTGGAATGTGTCCCTTGCTTGCCTGGGTGGAGGATAGAAAGGGGTATATTCAGTATGTTTAGAAACTGACCTACTGTAAACAGGTTAAATCTACATTCATTGCTCTGCCCACTTTTGCCTGTGAGCCCCCCCACCCTTGGGAGGCTGCCTAGAAGGGAATGTGCCCTCAGTCTGAAAAAGGTTCTTCACTTCTGCATTAAGACTTCACAGTTTTTCAGGAACTTTTCTTGTTCATAAGCCCCCTTTGAAATGAAAGAGAGCTGCTAGTCTGCACAGGATGAAACTCTTGTGCAGCTTTCATTTGTTTCACTTAAGCCTGTGCACAAGATATTTCCAGTTAGTTACATCTCTTATGAACAATTTTTATTATATTTCAAAATAGTAAGGGGGCTTCTGCAAGTAAACATCTTTTGTTTCTTGTTTGCTCTTCCCTAAAAATTCTACATTTTATTATAACTTGCAAACTTTAAAAAGTTAGTATTCTTTCACTCTGCTTTCTCTTCTTCTGGAGAATGAATCTAGTTAAGGTTTTAACTATGTAGTAGCATCTGATAAAGACTTTCCCTTCCATCATGCATGACTAAATAGTTGCAGGACTTTCATTTAAAAATGTACTTTAAGAAATGTTAAAAAGTCTTAAAATATCATGGAGTTGCAGTCTAAGGCTGAGATGGCCATGGTTTAGGGGAAAGGGTCTTAAGGGTCAAATTGAGAACCGTTCAGGGCCTGATTAGGTCCATTGGCTGGTGGTTTCCCACCTCTCCTCTAAGTGATCACAGGTAAAATGGCCAAATTCATTTGAACGGAGCATTAAAACATTGAAGTATATTTATATAATATGCAGATGGACAATCAATATCTGGATTTACCCTTTCTCTTCTTATGCAAGCATGGCCCTGTATAACTTTCTAACATTTTCTGATACAGGCCTCGGTTTTAGCTAAGTTTGTGACATCTGAAAATACTCTTTGGAGGCTTTCAGAAACACAAACCATAAAATAGTAAAGACACAAAATATATCTTGGGAAATAGTTTTTTCTAGTTCACATTCTTTTCTATCTTTTTTTAGTTGCTTCATACACAGTGGAATCAGCCTAACATTTGGTTATTGAAAACAGCAAAGGGTGAAACTACACTGTCATTTTGTATATGTAAAACTCTGCCCTGAGGTGATGTTTTTTCTTTGTTATTTACTGGCATTAAATCTGCCTTCTTCTTTTCAAATATACATGAATCTTAAGAACAGTTGCATGCATCTCATGGCGATGTTCCCTCATACATAATGATAGTATAATTTCACCCTAAGTGAATTGCCAGGATAAATATTACACTATTACTATACCTTGCTTTGGGATCAATTTCACATGGTGATGACAATGCTCTGAAGTAAACATCAAGGATGCTTAATAAGAGATTTAACCAAAATAAACTGAAGCTAATTATTATGTAGCA
>XM_030853958.1 PREDICTED: Globicephala melas ubinuclein 2 (UBN2), transcript variant X2, mRNA 
GAGGAAAAGAGGAAAACTGAGCCACAGCCACGACGGTGGATGTGAGCGTCTCCTGTCTGCGCATGCGCCCGCTCAGCGGCCTGCTTCTATTTATGTGGGGGATCCAACATGGCGGCCGCAACGATCCTGGCGATGGCGGTGGAGCCCATCAGAACATAGTGGCGGGGAAGGGGGGACAGTCCGCACTCACGGTGGCGTCGGCGGCGACGGCTGAGGGTGGTGGAGGGAAGAAAAGCGACGGAGAGCAAAAGGAAGGGCAGGCAGGCAAACAACTCGGCGTAGAACCGAGCGCCGGCTCGAGCGAAGGCAGAGGGCCAGAACAGTGGGGATGGCGGAGCCACGCAGAGTAGCGTTTATTAGCCTGTCACCGGTGAGGCGGCGCGAGGCCGAGTTCCCGGGGGCCGAACGCGAGCCCGACTACCCTCGCGAGCCCCCCCGACTGGAGCCGCAGCCGTACCGCGAGCCGGCCCGGGCGGAGCAGTCGGCCCCGCGGGAGGTTGCCCCCCGGTCGGACGCGCAGCCCCCGCCGCGGGAGAAGCCGCTCCCCCAGCGCGAGGTCAGCCGCGCCGAGCCGCCCATGTCGCTGCAGCGCGAGCCCCCTAGGCCCGAGCCGCCGCCGCCGCCGCCGCTCCCGCAGTTGCACTTGCAGCCGCCTCCGCCACGAGAGTCGGCTTCCCGGGCCGAGCCGCAGCAGAGGCCGTCGAAGGAGACAGTGCGCCTGGAGCTGGTGCTCAAGGATCCCACCGACGAGAGCTGCGTGGAGTTCAGCTACCCGGAGCTGTTGCTGTGCGGAGAACAACGGCAGAAGAAGCCCATTTACATGGAAGACCCGTTCAATGATGATCATCAAGAGAGGCAAGAAGTGGAAATGTTGGCTAAGAAGTTTGAAATGAAATATGGTGGGAAGCCCCGTAAACACCGGAAGGATCGGCTACAAGATTTAATCGATATAGGCTTTGGCTATGATGAGACAGATCCATTTATTGATAATTCAGAGGCTTATGACGAATTAGTTCCTGCTTCTCTAACAACAAAATATGGAGGGTTTTATATCAACACTGGCACTCTCCAGTTTCGCCAAGCTTCAGATACTGAAGAAGAAGATATTACAGACAACCAAAAGCACAAGCCACCCAAAATTCCCAAAATGAAAGAAGATGATATTGAGATGAAGAAGCGGAAGCGGAAAGAGGAAGGGGAAAAGGAGAAGAAGCCAAGGAAAAAAGTACCGAAACAACTGGGAGTTGTGGCTCTAAATTCACACAAATCTGAAAAAAAGAAGAAACGTTATAAAGATTCTCTTTCTCTAGCTGCCATGATAAGAAAATTTCAAAAAGAGAAGGATGCATTAAGGAAGGAGTCTAACCCTAAAGTCCCAGTGAACTTCTCGACCTCCTCTCTGCATAAAACCCCCTCTGCTGCTGTGGCATTGGGGAATGATGTCTCGGACTTAAATCTGAATAGTGCTGATCCGGACCTCCCCATTTTTGTTAGCACAAATGAACATGAACTATTTCAGGAAGCTGAAAATGCCCTAGAGATGCTAGATGATTTTGACTTTGACAGATTACTGGATGCTGCTTCTAATGGTAGCCCCCTGTCTGAGTCAGGAGGAGAGAATGGAAACACCACCCAGCCAACCTATGCCTCTCAAGTTATGCCCAAGGTGGTACCTACACTCCCAGAGGGTCTGCCTGTCCTTCTTGAAAAACGTATCGAAGACCTCCGTGTAGCTGCCAAACTTTTTGATGAAGAAGGAAGGAAAAAATTCTTTACACAGGATATGAATAATATTCTTCTGGACATTGAGTTACAGCTGCAGGAACTAGGCCCTGTCATTCGTAGCAGTGTCTACTCCCACCTTGAAGCTTTTGTGCCATGCAATAAAGAAACACTGGTAAAACGTCTAAAGAAGTTACATCTCAATGTCCAGGATGATCGTTTAAGAGAACCTCTGCAAAAACTGAAACTGGCTGTTAGCAATGTCATGCCTGAACAGCTATTTAAATACCAGGAGGACTGCCAGGCTCGTAATCAAGCTAAGTGTGCCAAGTTTCAAACAGATGAAGAACGAGAAAAAAATGGATCTGAGGAAGATGATGATGAGAAACCAGGGAAACGTGTCATAGGACCAAGGAAGAAATTCCACTGGGATGACACCATTAGAACTTTGTTATGTAACCTTGTTGAGATCAAATTGGGATGCTATGAGTTAGAGCCAAATAAAAGCCAGTCTGCTGAGGATTATCTTAAATCCTTTATGGAGACAGAGGTGAAACCATTGTGGCCTAAGGGCTGGATGCAGGCAAGAATGCTTTTTAAGGAAAGTCGGAGTGTACATAATCATCTTACTTCTGCTCCGGCAAAGAAAAAGGTGATTCCTGCACCTAAACCCAAAGTGAAGGAGTGTAGTCCAAAAAAGGACCAGAAAACTCCTGCATCCTTGGTGGCTTCAGTTGGTGGCCCTTCAACGAGCTCTAGCACATCTGCTGTGGCCTCCACCAGTTCTAGCTCTACACCGGCCCAGGAGACGATCTGCCTTGATGACTCACTAGATGAAGAACTTTCTTTTCATCCACCTGCACTGGATCTTGTTTCTGAAGCTTTAGCTGTTATCAACAACGGGAACAAGGGCCCTCCATCTGGCTCAAGGATAAGTATGCCAACTGCAAAACCTCGTCCAGGACTGAGAGAGGAAAAATTAGCAAGTATCATGAGTAAACTGCCACTGGCTACTCCCAAAAAACTAGATTCTACTCAGACCGCACATTCATCAAGTCTTATTGCTGGCCACACAGGGCCAGTACCAAAGAAACCCCAGGATTTAGCTCATACTGGCATCTCTTCAGGCCTTATTGCTGGTTCTTCAATTCAGAACCCTAAAGTTTCCTTAGAACCTTTGCCAGCCAGGCTACTTCAACAAGGACTACAGAGGTCAAGCCAGATTCATGCTTCTTCCTCTTCGCAGACCCATGTCTCCTCTTCTTCCCAAGCCCAAGTTGCTGCCTCCTCTCACGCTCTGGGAACATCAGAGGCCCAAGATGCTTCTTCGTTAACACAAGTAACAAAGGTGCACCAGCATTCAGCTGTCCAACAGAACTATGTGTCTCCATTACAAGCAACTATTAGTAAATCACAGACCAATCCAGTGGTGAAATTAAGTAATAATCCCCAACTTTCCTGTTCATCCCCACTTATTAAGTCTTCAGATAAGCCACTTATGTACCGCCTTCCCTTATCTACTCCCACACCTGGAAATGGTTCTCAAGGGTCCCACTCCCTGGTTTCTAGGACAGTACCTAGCACCACTACCTCCAGTAACTATTTAGCCAAGGCAATGGTGTCACAAATCTCCACGCAGGGTTTCAAATCTCCCTTCTCAATGGCTGCATCCCCAAAACTTGCCGCATCTCCGAAACCTGCCACGTCTCCTAAACCCTTGCCCTCACCTAAGCCTTCTGCCTCACCCAAGCCCTCTCAGTCAGCTAAGCCTTCAGTATCAACTAAACTTATTTCTAAATCCAACCCAACTCCCAAACCTACTGTATCCCCAAGTTCTTCCAGTCCAAATGCACTAGTGGCCCAGAGTAGCCACTCTAGCAGTAACAACCCAGTCCATAAACAGCCCAGTGGAATAAACATCAGCAGACAGTCTCCCACCTTGAATTTATTGCCCTCTAATCGCACTTCAGGCCTTCCATCTACAAAAAATCTTCAGGCCCCTCCAAAGCTAACAAACTCATCATCCACTGGAACTGTCGGCAAGAATAGCTTGAGTGGAATTGCAATGAATGTACCGGCCAGCAGAGGTAGCAACCTTAACTCAAGCGGAGCTAATAGGACTAGTCTATCTGGGGGAACAGGAAGTGGAACACAGGGTGCTACTAAACCGTTGTCTACTCCACATAGACCATCCTCTGCCTCAGGGTCGTCAGTGGTAACAGCCAGTGTGCAGTCCACAGCAGGAGCATCATTATTGGCTAATGCCTCACCTCTGACTCTCATGACATCACCTTTGTCTGTAACAAATCAAAATGTGACTCCTTTTGGGATGCTGGGTGGCCTTGTTCCAGTGACCATGCCCTTCCAGTTTCCCTTGGAGCTACTTGGCTTTGGAACGGACACAGCTGGAGTGACAGCCACCTCGGGATCTACCTCAGCCGCTTTCCACCATAGCCTAACTCAGAATTTACTAAAGGGTTTACAGCCAGGAGCTCAGCATGCAGCAACACTTTCCCACTCACCTCTGCCTGCACATTTACCGCAAACATTTAATGATGGAGGCCAAAGTAAAGGGGACACTAAATTACCACGGAAATCTCAGTGACTTCCAGCAAGCAAAGGAGATGACACACTTGGCTGGCTGATGGAATCTACCTGATGGAAAAGTACTCATGTGGTCATAGGGCTGCTGTTCTGTCGATGTTTACATTCTCTCGTCCCAAGCACTGTGTTTCACCAGAAACCCCAAAGGCTGAGAACAAAACAGTAGGTGCCAAGTCCATCCACATTCTAAAGGGAAAAGGAGCTAGATCACCTGTGCGCCACATGCTAAGAGATTGTGAACTAGATACTGGGAAGCACTGGCTCAGTGCTGGGAAGGAAGAGCTCGGCACCCACCTTCAGGCTCTGTGAGAGAATGTGAGAAGATTCCTTTGGAAGCAGCTGTCAGTATGCTGGACGTTTCCATTCCGCTCCCCAAGCAGGAGAGGGTGGAGGTGCTTCCTCTTCACCTCATGCCAAATGAGGAGGCTGCTAGAGGACCATTGGGAGAGCGTGACACATCCTGTGGAGTATGAGGGACACAGAAACTGGTGTCTGACTCACTCCTAAAAGTCTAAAGACAAATGAGGAGTAGGTGGCTAGCTCCTGGAGAAGACAGAAAAGGAGAGAAGGCTGCAATGGGAATGGTTTACACTCCCAAAGTTTCCGAGTTCCTGTGGGCCTGATGTGGTTCTCAAGAAAGGGAGCCAGATTTGGTCATTTTAAGAAGGAACCCAGCCAAAGGGAACACCTGGACGGATGGAATGACCTCAGTGGAGGGGAGGCTCCTGGAAACTAAGGGGCCGGGGAAGGAATTCTAAGTAACTAGAGAAGGCATGGCCTACAAGGGAACTACAGCTGAGAGATCCCCAGAGAAGGAGAAACTATTGAGAACCTATAAAAAAAGAAGCAACACTGGAATCTGCTGCTCCCGGAGGACACGGACACCAGCTTATCTCTACCAACAAAGAAAGCTGTGTGAGCCACCCACGATTTCATGCCGGAGAGGAAGAAATCCACAAGCAGCAGTGGAAGGAGGAATAAATTGCTCTCTGCTTGTATCTAGCAAGTCCAGCTTGCTGGGTAATAGTCACCTCTACTTCTGAGTATTATAATGTACTGCAGTCTATATGCTACAGGATGTTATCAGTAAGGTTAATTTGCTTAAGAGTAAGACATTTAAATGGCAGAAACTACTATGTAATGGGAAGTAAACGACATAAAAATCTGTAAACTACACAGATGGAATGATTATCTTGCTGAAAAGTATTTACAAGAGTTGTCAAACTTAAAAATTACCTATTTTTCTTTTGCAAAAGAGGCAAGTGTTTCTCATTTGCTGTCCTCCTCTGTGATGACAAGAGGGTATGAGGAGTATGCTGCTGTGTGGTCTGCAGTCTGGTTTTTGGCAGCCAGCATTCATTCCCATATCCTTATGTATTACAGGGGCTAGATTTATGGAAACATTCCCAAACTCCTTGCCTTCAAGGTTCTGGATGTGATTTCTTTCTGCTAGATGTATTCATGAGGTATTTTGTAGGTGGGAGGAAAAAGTGATATTTTTTCTTCTGGCAGCACCTAGCAAAACGGGCAGGCCATGGGAGACTTAAAGTTCTGCCGTAGCTCCCAAGTAATCTCCTATCAGCCCCTACGTGAGCACTTGGGGACCAGCTCTGATCAGCAGTGGGGGGACCTGTATTTTTCTGACCTAGGTGATAGCAGCAACCTCCCAATACTCTGAACTGCTGAACGTTAGTGGCAGCTTTCCTTAACTCCTGCAGCTCTTCTAATAGTGCCGTCAAGCGTCTACTGAATTGAATGCCCTGCACTCAGTTCCTTTCTGCTTGAAAAGCCTGCAGTGGTTTCTCTTTTTCTGACTGAGCCCTGATGGATACAGGTGCATAGCTGATCTTCTGAAAGAAATGAACATACTTAATGGGTCCTTTTAAGCTAAAAGTGATATTTTAAAGCTAAGTGAGGCACTGACTGCCTTTTTAAAAGAAACTCAAGCAATGAAGAAATTTGAGAATGGATGTTTAGAAATGTTTTATCACTATGTGATTTTGTTGTCCCAAATGATGTGTTAAACCAAGATTTTCAAAATAATAAAACATACTGTATTACATTGCATTTTCAATAAAATAAAGAATAATAATCTTTCTTTACTGAGAGAAATTAGTACTTTTTTACTGTTAATAAATAAAATAAAAATATTTTCAAAA
>XM_011942543.1 PREDICTED: Colobus angolensis palliatus ADP-ribosylation factor-like 2 (ARL2), transcript variant X3, mRNA 
CGTCGGCGAGCGTGATAGCCAATAGGAACCGGGAGCGGGGTCCCGGGACTGGGAAGAAACGGCGGCCGGGAGGGGCTCCAGGGACCATGGGGCTCCTGACCATTCTGAAGAAGATGAAGCAGAAAGAGCGGGAGCTGCGACTGCTCATGCTTGGCCTGGACAATGCTGGAAAGACAACCATCCTGAAGAAGTTCAATGGGGAGGATATCGACACCATCTCCCCAACGCTGGGCTTCAACATCAAGACCCTGGAGCACCGAGGATTCAAGCTGAACATCTGGGATGTGGGTGGCCAGAAGTCCCTGCGGTCCTACTGGCGGAACTACTTTGAGAGCACCGATGGCCTCATCTGGGTAGTGGACAGCGCGGACCACCAGCGCATGCAGGACTGCCAGCGGGAGCTCCAGAGCCTGCTGGTGGAGGAGGCCCTGGAGCTGGACTCCATCCGCAGCCACCACTGGTGCATCCAGGGCTGCAGCGCCGTCACCGGGGAGAACCTGCTGCCAGGCATCGACTGGCTCCTGGATGACATTTCCAGCCGCATCTTCACAGCTGACTGAGCCACTCCAGATGTCCCTCCACCTAGCAGTCCAGGTCCCCCAACCCTCACCAAACACTATCCATGGGGGCATGGGAGTCAGCCAGCCAAACTAACACTCCCCCTCCTCCATCCCAACCTGCTGCTGCTACTGCTGCCCGCTGCTGCTCTGTGGCCACCCAGCTCCTGTGGCGGGAGGGCTGTGCCCTGGCTGTTTCCCTGGCTCCTGACCTGGCCTTTGGCTACCATACCAAGAAGAGAGGACTGGGCGGGGAGGAGCTGCTACTGCTGCTACCGAGGCTGTGGGCCTCATCCTTCACTCAGCGGTGAAATAAACCACTCCTTGCCCTGA
>XM_021957819.1 PREDICTED: Prunus avium uncharacterized LOC110756391 (LOC110756391), mRNA 
ATGCATTGACTTGGAGTCTTTGATAACATTGACTTCGGGTCTTTGAGTCCATGAAAAACCGTTCGCATTTTCCATGATCTTTCTTTCTGTCTGTGACCCAAACCTGCTTCCCGAGTATATTCCAAAATCGCCATTTCAACCTCGAAGTTATAATCAATTTACGAATCAAACCATCGGTTTCAAAAAGAATCATCAACGCACCGCTCGTTTGTTCATTGTCGCGTTACGATTTTCCATTTCAATTGGACGCTTTGAAACTGCTCATACTCGAAGATTTTCCGGTTTTTGAGCATTTCATTTCATTCCATTGGGTTAAGAGTTGGAATGGGGGTCGTAGGGGCGACGAAGCATTTGGAATCATCGAGAATAATTGCTGCGCTTGATGTAAGTCATTCTGAGGAAAGACTGGGACAATTTACCATGGAAAATGGTGAGTTATTTTTCCATACCAAGTCAACTAAGTTCAAGAGGCAGATAGTATCTGCTGTTCGTGATTTCCCCCCGGGGTGTGGACGATTTGCTCATTTGAACTCTTTGAGACATGCTAAGGATGCCACTTCTGTGGGTACTTCAACAGAAAGTTTGCTTAGTGGGGGTAAAAATGTTGGTGGACATCGTGGGGTTGAAAAGCTGATGCTCTCAAATGGTCAGGGAGACGAGACTGACTTGATGAATGGTAATGATGTGGATTCTGTGGAGACAGTTGAATCAGTAAGCGCCTTAGAGCATGAAAGATCTGATTCTCTGAAGAATCTACTTCAGTTAAACAATTCGAGAACTGTTGAAGAGGCAGCTTCTGTTGGTACTGAGGAGAGTTTGATCAGCAGGGATACTAATGTTCATGGAAAAAGGGTTGAAAACTTAATGCTCTCAACTGATCATGTGCATGAGACTGACTTGATGAATGGTAAGGCTTCTGGTACTGTGGAGACAGTTGAACCTGTGACAGATTTGGAGCATGAAGCATCTGATTTGCTGAAGAGTATGCATCAGTTGTCAAACAATTTGAGACCCGTTGACGAGATAGCTTCTGTTGGTACCGCTGAGTATTTGCTGAGAAGGGGTAAGAATGGTGATGGGCAGGAGATTGATAAGCTGATGGTGTCAACTGGTCAGGTGGATGTGACTGTCTCGATGATTGGTACGGCTTCTAGTACTGTGGAGACGGTTGAATCTTTAATGGCCTTACAGAATGAAGTATCTGATTTGTTGAAGAACCCATATCAGCTTGGTGTGGCTACTCCAAAGGAAGAGATGGTTGCTGTTCTTTCAGATAGAAATTTTTGTTCGCCACGTGATGGATCCATTTCTGTTTCTATTGGAAATGGTCTTGAGAAGACTGCAGCGAAGAAATGTCCTTCTCGAAGACTAGTATCAGCTGTTCGGGACTTCCCTCCTCTCTGTGGAAGAAATGCTTGTAAGTTTGGTCAAGTGAAGTCGTGTATGGGTGATGAACCAACACAATCGAACACAGCGAAGACTAGTGTAAAACAAATAAGAGAGGATTTTCAAGAAGAGTTTCATAAGAATGAATTGGGAGGGAATGTTTCTGAAGTTATTAGAGACAAGGTTCAACCTAAATGCAAGGGGCATGCTGTACAAGAAATGGAGAGACGGGATAAATGTAAACCAAGTTATAAGCTGAAGGCGGTTTGGAAAGATACAAGAGAAAAGTGCATTGAGAAAAGTCCGCAAGAAAGTTCACAGCTTCCGTCGAATAGAGTAATTGTGCTGGCTTTGATGGCTCCGTCAAATTCTCAATTTAGGAAGGGGAGAAGGGTCCGCAAGCATATACCAGATTGCATTTGATGAAAGGAAACGAAAGAAACTTCGTCTTAAATGTTAGCTAGAAAGACCTAAAACTGCTTCCAGGACAGAAAAGGCAGCTAAACTCATCAGAACCATTCATCAACAAATGAGCCTTCAAGTTTTGACGTGGAGGTTGAACGCTGACATTTTTCAATGAGCCGGCTGCCCTGTTTTTGCCTAAAAGCTAAAATGATCTGTTATTGGCACTTTGAAAATTACACGTGGAGGAGCATGATGACTTTTGTGGAGTGCCAATAACAGCTTCCGTTTTTTTTATTTTTGTAAAGTGAAGTATGAATCCTGGAAGCATGCTGTGGAGCATCACAATAGGAGTTGGTTAATTGTTACATCTGTTCTTTTTTACACCATGAAAATTTCCCCAAGCTACGGATTTCTAGCATGAAATTTGGCTTTA
>JF936918.1 Taeniopygia guttata clone F5CD66-14 T cell receptor alpha chain (TCRa) mRNA, partial cds 
ATTGCTCGAGTAGAAAACTCAGCAAACACGCAGCTCGCTCTCGGCATGCACCTCGCATGTCTCATCCTCAGCGTCCTGCTGGCCCAGCTCCTGGGCACCTCGGGGCAGGACACGGTCACCCAGAAAGATGGAACCGTCACGGTGAAGAAGGGACACCCCTTCCACACCACCTGCAAATACCAGGCCAGTAATTTTGGGGGATTGCTCTGGTACCAGCTGCAGAAAGGCCAAGCCCCACAGCTGCTCTCCTATCAAACAGGGACCGGCCGCAAGCACAGCGGCCGGATCACCACGTACCTGAACACCACGGGCAAATCCAGTGTCCTGCAGCTGGAGGAAGTGGAGCTCTCTGACAGTGCCTTGTACCTCTGTGCTCTGGTAAATGTGGCAGCCAGAGTCATTTTTGGCAAGGGGACGGTGCTTTCAGTCCTGCCAGAAATTACTCCATCTCCCTCAGTCTACAGGCTGACCTCCAAAGATGACCAGGGTCTGGAAATGTGCCTTATCACAGATTACTCCCCTGAGAAGCTCACTCTGAACTCAGCTGAGCAGCACACATCTGCTGTTGTGGAGGTGGCAACCATGGAGAACAGCGAGGA
>XM_041785118.1 PREDICTED: Cheilinus undulatus N-sulfoglucosamine sulfohydrolase (sulfamidase) (sgsh), transcript variant X2, mRNA 
GTTGAGGAACTGCGCTGTGTTTTCTTAGATTTTAATGTCAGCTCTATCAGTCAGTAACTGTTCACCATGCATTGATTTAAACGAATACAATGACTCTATTTAAATGATGTATTTATTATGAGTTAGACGAAATGTTTAAAATCATAACCAGCGCAGTTTTTCAGCCTTTATAGACAGGTTTTAGGGAAGGTCTGAGAGAAAATCATCATGGTCAAGCTGCTTTTTCTCATTTTGGCATCATGTTGCATCGGAGAGTCAAAGAGGAGAAATGTCCTGTTAATAATTGCTGATGATGCAGGCTTTGAGACGGAGGTGTACAACAACTCTGTGGTCCATACTCCACACTTACGATCTCTGGCCCAGCGCAGCCTGGTGTTCAACAACGCATTCACATCTGTCAGCAGCTGCTCCCCCAGCCGCTCCACCATCCTCACAGGACTTCCACAGCACCAGAATGGCATGTATGGGCTTCATCAGGGTGTTCACCACTTTAACTCGTTTGATGGAGTACAGAGTCTACCGCTGCTCCTTGGCCAAGCAAACGTACACACAGGTATAATTGGGAAGAAGCATGTAGGTCCTGGATCTGTTTACCCGTTTGATTTTGCCTACACAGAGGAGAACAACTCTGTGCTACAGGTGGGAAGAAACATCACCCGCATCAAACTTCTGGTCCGCAAGTTTTTCCAAACCCATAAGGAGGAAGACCATATAAAAGATGAAGAGAGGTCGTTTTTCCTCTATGTTGCCTTCCATGACACCCACAGATGTGGACATTCACAGCCTCAGTACGGGGCTTTCTGTGAGAAATTTGGAAATGGTGAAATGGGAATGGGAAGAATACCTGACTGGACTCCAGAGTATTACACCCCAGAACAAGTGAAGGTTCCTCCTTTTGTGCCAGACACGCCTGCAGCACGAGCAGATTTGGCTGCACAGTACACAACAGTTAGTAGGCTGGACCAAGGTATTGGTCTGGTCCTGCAAGAGCTCAGGGACGCTGGATATGAAAACGACACTCTGGTCATCTACAGCTCAGACAATGGCATCCCTTTCCCAAACGGCAGGACTAACCTGTATCACTCTGGGACTGCAGAGCCCATGCTGGTGTCCTCTCCAGAGCACCGGGAGCGATGGGGCGACATTAGCCAGGCCTACGTCAGCCTGCTAGACATAACTCCCACCATTCTGGACTGGTTTTCTGTCCCCTACCCGTCCTACAGCCTCCCCGGCAGCCCTTCAACCCCCGTCCACCTGACTGGGCGCTCCTTACTGCCCGCCCTTGTCTCTGAGCCCAGCAGCTGGCACACGGTCTACGCCAGTCAGTCCCTCCATGAGGTTACCATGTACTATCCAACCCGCTCTGTCCACCAGGGGGCGTACCACCTCCTCCACAACCTTCACTACCGCATGCCCTTCCCCATTGACCAAGATCTGTACGTGTCACCCACCTTCCAAGACCTGCTGAACCGCACCCACCTCAGAGAGCCCACACACTGGTTCAAAAGCCTGCAGCAGTATTACTACAGAGAGCGCTGGGAGCTGTACGACTCCAGGGCAGATCCACTGGAAACAAAGAACCTGGTATCAGACCCCTCCTACAGCACCGTGCTGGAGAGCCTGAGGCAGAGTCTGCAGAAGTGGCAGTGGGAGACAGGAGACCCCTGGGTCTGTGGACCTGACTACGTCCTGGAGGACAAACTGGAGCCGCACTGTAGACCACTCTACAATGGACTCTGATGATATTTGTACATTTCTGACCGACTCAAAGTCTGCTTAAAGTGACACATTCTTCTAATGAAATAAATTACTTTTATAGGCATTTGTATTATATTAAAATGTTGCTGCTTTGTTCAGAAATAAAAAAAACTTGAATTA
>XM_026823756.1 PREDICTED: Diaphorina citri dipeptidase 1 (LOC103509407), partial mRNA 
GCACAACGATCTACCGTGGAACATTCGTAAGTTCATTCACAATCATCTGGTCAATTTCAACCTCTCCTCGGATCTCAGTGTGACGGAGCCGTGGTCCAAGAGCAGCTGGTCTCACACCGATCTGCCTAGACTGAGAAAAGGTATGGTAGGAGCCCAATTCTGGTCGGCCTATGTGCCATGTTCGTCACAACATATGGATGCAGTACAGATAACAATGGAACAGGTGGATGTTATACGCAGGTTCACGGAGTTGTACAGCGACGACCTTAAGCTGGTCACCTCAGCACAAGAAATCCGAGCGGTCCATCGGGAGGGTAAAATCGCCAGCATGATAGGCGTGGAAGGTGGCCATTCTTTGGGGAACTCGATGGCCGTTCTGCGCATGTTCTACAAGCTCGGGGTCCGATATTTGACCCTGACCCACGCCTGTCCTACACCATGGGCCGGATGTTGCAGTTCTCTTTTCTCTCCCTCCCCTGGTTCCCAGCTGGTGGTGCGGGAATGCAACCGGCTCGGCATGCTCATAGACCTCTCCCACACCTCCGTGCAGACCATGCGACACGTCCTCAACATCAGTTCCGCCCCTGTGATTTTCTCCCACTCGTCTGCCTTCGCCCTCTGCCCTTCTCCCCGAAACGTGCCCGACCCTGTGCTCAAACTAGTGGCCTTAAACGACGGAATAGTAATGGTTAGCTTCTACTCTCTGTATCTCACCTGCAGTCTGAACTCCAGTATAGATGACGTTATAGCTCATCTGGATCATATCAAGAATGTAGCGGGTGAGGATCATGTAGGTCTAGGTGCTGGATATGATGGAATTAACTAG
>NM_001168050.1 Saccoglossus kowalevskii cripto-like protein (LOC100313583), mRNAGU075970.1 Saccoglossus kowalevskii cripto-like protein mRNA, complete cds 
GGCAGAATAAGCTATATAAGACATCTTGGCGTTATCTGGTCACTTGTAGCGTGGACTCACAACTCCGCACACTCTCTATCATAACCTTGGATCTTACACTGTAGTCTTCCCCAGTACCCTAACTTTGAGTTGACCATGAATTGTCACCTTGCCAATTTGTTAGCAGCGATTTTACTGCTCGTGATGGTCACTAACGTTTCGTCAGTAAGTCTAGGAGAATGGACTAACACCCGATCTTCCGCCAACATCTGCCATAACGGAGGGATAATGATCCTTGACAGTTTCTGCATATGTCCCATTGGATATGGTGGTCAATACTGTGAAAGCAAGCCTTGTGGCGCAGTTGCCCACGATGAAAAACTCACCGTACAATGTAATACCTGTCTGTGTCGAGACGGGAAACTCTACTGTGTACCACTGGGATTCCCTGCTTGTGAAACTACAGATGAAGTGATTATTGTGATTACGTCAGCCCCGATCACCACCAGCACCTATGCGCCGACGGAGGCCGAAGACGTCATAATGTTTTCTTACGGTGAATTCGAGGCGTTGTCATCTGTTGCAGCAATCACTCCCCGTTTTATACAGTTAGTTCTGCCCGCATTGGTGTTGCTTATGACACTGTGGACATGAGTTGCATATCTGAGAAAAGGGACAGCGAGGTTTATTGGATCCAGGCAATGATAGTTCTGATAAGACGACCGAAATCCCCGACTTCGCGGATTTACAACCATACAAGATGGTAGTTTACCGTCCAACAGCCCGGATAGGGTGATTGAGAAATAACAGTGGACGCACTCCATGTTTCCTCTGGGCCAAGAGGCAATACAGTATACATTCAATGTATCTTCCTAATTCAGGCATTATGCTGTTTAATTGTGATACAAACCGGGAAATGTACTAGGGCCTGTGCTATTATATTATCATCAGAAATTATGTTTATATATGCAGTATTGTGAGTTGTATTGTAAGTTGTATTGTAAGTTATTTGTAAATAAGCTACATATATTTGTAAATTATGCATTTTTATATGAAAAAAATAACAAAAGACAATACAAATATAGAGGAATGAGATTTTAATAAATAATTTAACATAATTATGTAATTTTATATTTTTAAACTGGGTATCACTAAATAAAATCATAAAATCACAAAAAAAAAAAAAAAAAAAAAAAAAAA
>XM_053452891.1 PREDICTED: Spea bombifrons zinc finger protein 217 (LOC128471049), mRNA 
AGAGAGGATGAGAGCCTCACACCCAGGAAGTGCTTTCCCAAAATGACTAGAAGAAGAATAAGAGGCAGCAGGTACAGCGGCCAGAGGTAGCCCCAGCTCCAAGTGATGGACCTTTTGGGTTTCCCATGACGATGCGCAAATTCAGTCCTATTTACATCTGAAGGAAACGTGTGCATTGTTCAGGGGTTCTTCTCTCATCCATTATAACAAAGGATACATACCAATGTCTTCACAGAATTGACAAATGAAGAATTGACAGCTAATCTTCTCTGGAAGGAAACTACGAGCAGTACTTGAGATCTACAGTGGCATTCACATGTATGTGTCTTTAATTGCCCACAGCTTTCCTTATGTTCCTAAGGAACTTCTAACTAAAAAGTTGGCCCGCAGCACTGGAATTCTAAATCTGGCAGCAACCATGCCGGTTCAATCAATTTCCGATGGTTCTGATGTCTTGGGTACTGGCTTTAATTCCCAAATGGAAAGTTCTCATTCATCATTGGCACTCCAGCCTGCAAACACCCTTTCCAATGCAGCATTGCATGAAAAATGTTTAATGCAGACAGAGGGGGACATGCTGTTCGATTGCATGTTTTGTGACAAAACCTATACCTTTCATGAAGAACTTGGGAAACATGTCTTGGTCCAACACAGGCCAATACTGTGTGAGCCAGCCGTTCTTCGTGTGGAGGCAGAGTACCTCAGTCCCCAAGATAAACGCAGGAAAAGTGGAGAGCTTTCAACGAACGATGAACTTGATGAAGCTGAACATAGACTAGGCTTTGACTGCGAAGTATGCGGCCAGACCTTTAATGATTCTTCAGATGTGGAAGGTCACATGAAGAAGCACAAAGATTCGTTCACGTACTCTTGTGATATCTGTGGACGGAGATTCAAGGAGTCGTGGTTTCTGAAGAACCACAAGAGAACACACAGTACAAAGTCTGGAGGCAAAAACAAGCAACTGATAATCAGCGAGATGCCTATGACCATTAATGAAGTGGTATTGGAGCAAGTGGACAAAAATGTCCTGTGTCCTTACAAGCTGTGTGTGGTTTGTGGATTCTTTTTCCCCAATAAAGAATGCTTAATGGAGCACAGTAAGATACACCTTAAGGAATCTACCTCATCCGAAAATGGCTTAAATGAGCTGCCACCTCCAACAAATAATTCTGTACAATCTGAGGCTAGCGAAAATGCAAAAGGAGATGCTTCAAAAGAAGCCTTAATGAGGATGTTAAACTTACAACCTAGATCTGCAGGACCAAAGAACGCTGAAACATCTAGAAGATGGATTGGGGCCTTAGATCCATTCAACACCTACCAAGCCTGGCAACTGGCTACCAAAGGTAAAATTGCACTTGCCCATGGTAGAGTTAAAGAACCTTCGCATGAAGTAAACTTTCATATAGATCCATGTTCGGACAAGGACAAACCCAGTAAACTTTGGAAAACGGGAAAGGTTAGTCGTGCTGGAAGCACCCATCAGACCAAGAGTGAGGTCTGCGAAGGACACACGACTTCCCAGGATGGCCAACATGTACATCTGCAAAACGAAGCCAACGACGTGCCTTACGTAGACGACAAAGACAGGCCAACGTTTTGTGACGATTGTGGGAAAACGTTCAAGACCTACCACCAGCTTGTGTTACATTCACGAGCGCACAGAAAAGAGAGGAGCGATTCCGAATGTTCCGCGATGAGCGGGGAAGTCCTCTTGCCTAAGGTGGCCTCGCCGGATATCGCCAGCAGTTTGGAAGACGCTGATGCTATGAAAATGCACGATGATTCCGAGGATGGGTCAGAAGATCCTGGAGGCGATCCTACACAGATTGATGATAAAAATGAAGACGATCTAGAAAGGGGGAAAGCAAAAGGCCTCTCTGTATCTCGGAACTGCAGTTATTGTGGAAAGAGTTTCCGCTCAAATTATTACCTCAATATTCATCTCAGGACTCACACAGGTGAAAAGCCATACAAATGTCAGTTGTGTGACTATGCCGCAGCACAGAAGACCTCGTTAAGATACCATCTGGAGAGACATCATAAATTTAAACCAGGAGATTCCAACGCCATGGTGAAAAGCATCAGCAAAACCGTACAACTCGCTCAACAATCTGGCGAACATGCGTCTCTTACTTCCAACCTAACAGAAACAAAACCTCTGAAAAAGCTTGAGGCAAACTCTAAAGAGGAGAGCCCACCATTAAAACCGAAACGTGTTTCTTCTTCGCGTAACAAGTTTGTGACCGCAGCTCAGTCTCCAGAAACCGAAGAAGCCGTCGTTGATGGATACCCAATCTTTCCAAACGACTCCAATGTGAAAGAGCTACCTCCTTCCCAATCTGTGACCAAAGACAATGTGCCTGTTGATATGGAAGTTGACCGAGAAAGCCATACCACCATGGATGAAAGCTTTGCCGAGCAGGGTCATTTTGAAATCACTCCTATGCTGGCCGAGGAGTTGGTCCTATTAAACTTGTGTTTAAAATCGGATAATGGCCTTTCAGCACCTCTGGATACCAATGCCTTGCTTTTTAAGACCTGCCCTTATTGTACTTTCAAAACCTTGCACCCAGAAGTGCTGGAAATTCATCAGAAATTGACTCACAAACCTAATCTTGCCGAGAAGAATGGCGGCAAACTCAAATCTGTGCTGAATGCCATTAAAAAGAGGCGTACCGGCTGCCCTCCTGCACTTAACGGAATGGACATTTCTCCTGCACCTTGCAGTGGTCTTAAAGCCAAAGCTCCTCTAACGCAACCAAAAACCCTCAACAATGAAAAGGTGAAACGGGCGGCTTTTTTGCCTGCGAAAGCCGTGCCCTTGGATCAAGAGAATGCAATGCTTGCACATAAACACAATGGGGCTTTGCTGAACAATTACACGTACGTGCAACCTGACTTACAAGGAATTTCTCACCTGCTTGAAAGGATGCAACCGCCTGAACCAAGTAGGGCTTCTTGGAATGCGCCAACTACCAGCAGGGGGAATTCTACCGCTGCAACTACAGAATACGCCTATCAGACATCCCAGGCCTGGCCTGGCGCTCAGAATCTGTTTGCCAGACCCCTGAACTCAAATCACGAGCCGTGCCCAAAGAAGGCCAAGTTCAATATTACGACAAAGGATGACATGTTCAAAAAACCGCTTCCACTTGGGCATACTGGGATGTTTCCACAAGATATGGCAGCGGCAACTGGAAGCTCATTGCTACCTAACAAGGGCTATAACACCTGTGAAGCTGGTTCTTCAAAAGCAATGAAGCCTCCTGCCCAAAGCACTGCTAGATTTGCATGCGTTAATCCGGGATCTACCTCCGCCACCGACGGAAGAAGTCCACCATACCGTCGTGTATCCAAGAGAAGCTTGACACCAAATGATAAACGGGTGTGAAGGATACCCTTTGTTTAAAAAGGGTAAGCAATGATTTGCTGTTCTTTGAGCCACTGTAGCGTGAGTGAGTGTGGGATCGAGTATTGTATAAAAGAGAAGTGGAGCGATTCTATCCAGCTGCGAGAGCCTGTCTC
>XM_039175744.1 PREDICTED: Hibiscus syriacus profilin (LOC120166485), transcript variant X2, mRNA 
AAAAGACAGAATTTCATCAACGGAAAAATAATATATTCGAGAGAAGTAGAGGAAGGAGAAAATGTCGTGGCAAACGTATGTAGATGATCACTTGTTGTGTGAAATCGAAGGCAACACTCTCTCTGCCGCCGCCATCATCGGTCAAGACGGCAGCGTTTGGGCCCAGAGCTCCAATTTCCCTCGGTTCAAGCCAGAAGAAATCTCTGCTATTATGAATGACTTTGTTGAACCTGGATCACTTGCCCCCACCGGATTGTACCTTGGTGGCACAAAATATATGGTGATCCAAGGAGAAGCCGGAGCTGTTATTCGAGGGAAAAAGGGGCCTGGAGGAGTTACTGTTAAAAAGACCAATCAAGCCTTGATCATCGGGATCTATGATGAACCAATGACTCCTGGCCAATGCAACATGATTGTTGAAAAGCTCGGTGATTATCTCATTGAACAGGGTCTTTAATTTATTTAGCTTGCCTTAATTGTCGCAGTTCTTCTTGGCTTCTTTTTTCTATACGAAAGTGCACCTGCCACCTCCCGTAATAATGGTTGGATCGAGTTAAAATAACAGTATTAGTAGTATTAAAAGTCAAGGGGAACCTTTTTCCAGAAACAATAAGCTTGATGTTTGTAATAGTGATATGCTTGTGATCCTCTTGCTTTGTTTCTGTTCTTGTTTGATGAATGGTATTGTCAAGATTGTGGAGCGAGGTACTTTTGTCTACATTT
>XR_004882887.1 PREDICTED: Helianthus annuus uncharacterized LOC110916910 (LOC110916910), transcript variant X15, ncRNA 
TTGTGTACTCTCCCATGGTTTGTGGCCCATCTTCTCCACTAGGCACGGTTGCTAGGACGTGGGTAGAATGCAGTTGCCCAGTGGTCTTATATAATATAGACCCTTGCATCCAAATATTCACCTCCATACATCTTTCAGTTTGTAGCAGATATGATATATGCACATAAATAAACACACCGTTGGTACCGCGTTCTTCAATCGTGATCTCAAACTTACATTCAATTGTTCTTCATTCAAGATCTGCCCTTCTCCTCTACTCGCCGCCGCTGTTGTTTGAGTCGGACATCGGCGCCGCCTCCGTTCTACACCCTTTTGTCATTTAACACACCCTGGCGCCACAAAATTTCTGAAATCAATCACAAGGTCGTTGATGTTCTTGGATAGGTTACTATCTCAGTTAAGGCTTAGTGGAGATAAATTATTAGTTGCAGAAGATCCTAAAGAGAAAGACATATCAACTTGAAAGTCCCAAGTGAGAGGAGGACAAAGGTCATTACTTGAGGCTAGCAATCTGATTGTTCTCAAGGGATATAAAAAGTAGTTGAGTGGAACCCATACACTAAAATTACTAAGTACTAATTACACTAGATAATGTGAGTTTGGAAGAAGGGGGCAAGGGGCCATGTGTAAGCCACTTAATGCTGGTATCCATGCCTATAGGCGTGTCGATATCAACCCAGACAATAAAGTTTCGATCTTTGGGGATGGACCCATCTCCACTTTTACACGGCAGGCTGAGCTCACGGTACTGGTTGGTTATTTTGGGACACAACAAAGTATGCCATGAATGGTTCAGCAAAACTTGATGCCAATCTTCAAGAGATATTTTTAATGGAAATTTGAAGGCTATTCAGGGATTGGGATAGTTTCAATAGCACCAAACCATGAGGGCTACTAACGGGCCAACCAACCCAACCCTTCTGAACTTGTGCAGAATTCTTGCTTGAAGCAATAAATGGACTTCTTTCGGACACCAGGTTTCAAATATGGCATTCAGAAAAGTGTACCCGTTGTCTGGATGAATACCCACCATTGTCGAATGAATCATTTGTCAATGAATGATGGGTATTACGTTCTTCAAGAAGGCTTTTGTAATGGTGTCAATCTTGATTCTGTTAGCTCTCAAGGTTGCCTATTATTTGAGTATATGGAATGGAATCAGCCTTGGGGTAGAGAACCTTTAGCTGATAAGGTTAAGCCTTGCCACACGCCATCCTATTTACGAGGGTTACGCCTTGCCACATGCCATCCTCCGGTTAGATCTAGCAGGACGTTATCTAACCGTCTGGTTGATGAGATTCTACCAGAACGTAGAACGTGGGTATACATTCACCAGAACCGCAAAACGGGAAATTGTTAGAGACATGAAAGAAAAACGGGCGTACATCGCTCTAGACTATGTTAGAGACATGAGAAGAGTTTCGAACTGCCCGGCGAGCAGGTCATTACCATTGGTCAACAATGTTAATATTCCTAAGAATCAATCCAGATTCTTTGAGCAACAATCAATCCAGATTCATATTTCACTAAAGATGTAAACAACTACTTCCAATTCTTTAATTTGCAAATAGAGTTTGAAATTGTTTATTAGTTTGATTTCATAAACTTGAAACGATACCATCATACAGATTCTAATCATTGTATTT
>XR_007968113.1 PREDICTED: Xyrauchen texanus putative uncharacterized protein FLJ46204 (LOC127624086), transcript variant X2, misc_RNA 
CACACACACACACACACACACACTCACACACACTCACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACATGTTGTGTTTCCATGTTTTATGGGGACTTTCCATAGACATAATGGTTTTTATACTGTACAAACTTTATATTCTATCCCCTAAACCTAACCCTACCCCTAAACCTAACCCTCACAGAAAACTTTCTGCATTTTTACATTTTCAAAAAACATAATTTAGTATGATTTATAAGCTGTTTTCCTCATGGGGACCGACAAAATGTCCCCACAAGGTCAAAAATTTCGGGTTTTACTATCCTTATGGGGACATTTGGTCCCCACAAAGTGATAAATACACGCTCACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACACAGGCTGGTGATTCTCAACGGATGGGTCTCAGGTCTCATTTAAGAGCAGACAGCAGGTTAAAACAATTCAATGCAACTAACCATATAATCATTAATAGACAAGATAGAGAAACAAATAGACTTTATCGACTTTTGAAAGGTTGGAGTAATCACTTCCCATATCAG
>XM_026403930.1 PREDICTED: Urocitellus parryii CUGBP Elav-like family member 3 (Celf3), transcript variant X37, mRNA 
ATGAAGGAGCCGGATGCCATCAAGCTGTTTGTGGGGCAGATCCCGAGGCATCTGGAGGAAAAGGACCTGAAACCCATCTTCGAGCAGTTTGGTCGGATCTTCGAGCTGACTGTCATCAAGGACAAGTACACCGGGCTGCACAAGGGATGTGCCTTCCTGACATACTGTGCCCGCGATTCAGCCCTGAAGGCCCAGAGTGCCCTGCACGAACAGAAGACGCTTCCAGGGATGAACAGGCCGATCCAGGTCAAGCCCGCCGACAGCGAGAGCCGAGGAGACCGGAAGCTCTTTGTGGGGATGCTAGGGAAGCAGCAGACAGATGAGGACGTCCGGAAGATGTTCGAGCCCTTCGGGACCATAGATGAGTGCACTGTGCTCCGGGGGCCAGATGGCACCAGCAAAGGCTGCGCCTTCGTGAAGTTCCAGACCCATGCTGAGGCCCAGGCCGCCATCAACACCCTCCACAGCAGCCGGACCCTGCCTGGTGCCTCATCCAGCCTGGTGGTGAAGTTCGCTGACACCGAGAAGGAGCGAGGTCTGCGACGCATGCAGCAGGTGGCCACCCAGCTGGGCATGTTCAGCCCCATCGCCCTCCAGTTTGGAGCCTACAGCGCCTACACCCAGCTGATGCAGCAGCAGGCGGCCCTGGTAGCGGCCCACAGTGCCTACCTCAGCCCCATGGCCACCATGGCTGCCGTGCAGATGCAGCACATGGCCGCCATCAATGCCAACGGCCTCATCGCCACCCCCATCACCCCCTCCTCAGGAACCAGCACCCCTCCTGCCATCGCTGCCACGCCCGTCTCTGCCATCCCTGCTGCCCTGGGCGTCAACGGCTACAGCCCGGTGCCCACCCAGCCCACTGGGCAGCCTGCCCCCGATGCTCTGTATCCCAACGGGGTTCACCCCTACCCAGCCCAGAGCCCTGCGGCCCCCGTGGACCCCCTGCAGCAGGCCTACGCAGGGATGCAGCACTACACAGGCCCAGCAGCCTACCCGGCAGCCTACAGCCTGGTTGCGCCCGCGTTCCCGCAGCCTCCTGCCCTAGTGCAGCAGCAGCAGCGAGAAGGCCCTGATGGCTGTAACATCTTCATCTACCACCTGCCCCAGGAGTTCACGGACTCAGAGATCCTCCAGATGTTTGTCCCCTTTGGCTTTGTGAGTTTCGACAATCCGGCCAGTGCCCAGGCGGCCATCCAGGCCATGAATGGTTTCCAGATCGGCATGAAGCGCCTCAAAGTCCAGCTAAAGCGGCCTAAGGATGCCAACCGGCCCTACTGA
>XM_034920330.1 PREDICTED: Acipenser ruthenus E3 ubiquitin-protein ligase TRIM52-like (LOC117972083), transcript variant X1, mRNA 
CAAACATCAGAAACAACCATAAATCTAGAGGACCACTGTCACTGTCATTGTGAAATACACAGCGGGAAATGAACTGACTCATACTGAGACTGAGAGAGAGAGAGGAATTGAAATCAGCAATTAAGGTTTGAGAGATTTTCAGCCTGTCCTCAACATAATGATGTCATCGTCTCCGGAGGCGGAGCTGGCGGAGAGCCTGACCAATGAGGTGACGTGTCCCATCTGCCTGGAGCTGTACTGCGACCCTGTGCGGCTGGAGTGCGAGCACAATTTCTGCCGTAGCTGCATCAGTAAGTACTGGCTGCGGGGCGGGGAGGAGGGCAGTGCCCCGGAGGGGCAGAGCCAGGCCTTCACCTGCCCCCAGTGCCGCGAGATCTTCCCCCAGCTCCAGCTCAGGACCAACCGGCTGCTCTGCAACATCGTGGAGCGCGTGCGCAAGCTCCGAGTGGACTCCTGGGGCACGGCTTCGGCCTCTCCACCAGAGGGCAGCGGCGCAGCAGAGAGGGGCACTCCGGCGGGGTTCTGTGCGAAGCATGGCGAGAGACTGAAGGTGTACTGCCAGGATGAGCAGGTGGCAATCTGCGTGGTGTGCGCTGTGTCCAGAGATCATAAAGACCACAGCATGGCACCCATACAAGAAGCACTGCAAGAGTGCAAGGAGAGGTTTGAGTCGGCGCTGACTGAGTTTGAAGAACAGAAGGAAAAAATCCGGACTATGCACTCGAAACACGAGAGAGAGCTGAATGACCTAAAGGACTCTGCTGCCTCTCTTGAGAGGGGGATCTGCTCCCAGGTGGAGGAGCTCCTGCAGTTCCTGGAGGCTGAGAAGAAGGCGCTGTGCTCCCAACTGCAGGCTGACCTGCGCAGGCTGGAGCAGCAGAGAGAGGGGGTGCTCAGCGCAGCACAACAGGAAGTGACCCACCTGCAGCAGGACGTGACCTCACTGCAGGGCAGGCTGGCAAGGGAGGGGCTGGAGAAGGATGGGCAAGAAGTGGGCGACGCCCCAGCGCTAATTAAGGAAAGTGACTTCCTGTTTTTTTTTATTATTATTATTATGGAAGTTTATGTAAGTTTGTTAGCGTGAAGGATTGCGATTCTTTTAACTTTTGAGCAGCTTTTTGGCTGGATTTGAAAGTGTGTATACAGCTTCATACCTGCAGAGGAACTGAACTGCTTGACTCAGTTTCTTCTAGTTTCTGTAACACTGATGAAGGCACTCGCTGAAACGCTTGTCTGC
>XR_007189094.1 PREDICTED: Ursus arctos uncharacterized LOC125282004 (LOC125282004), transcript variant X1, ncRNA 
TTTTTTTTTTTTTTTTTTTTAACACAGATAGAGACAGCCAGCGAGAGAGGGAACACAAGCAGGGGGAGTGGGAGAGGAAGAAGCAGGCTCATAGCGGAGGAGCCTGATGCGGGGCTCGATCCCATAACGCTGGGATCACGCCCTGAGCCGAAGGCAGATGCTTAACCGCTGTGCCACCCAGGCGCCCCGGAAATTTAAATACTTTTAACATATTTTTCCAGTTCCTTGGTCCTTCTCTCCCCAGTCATTCAATGGGAAGTAACGTAGATTTTTTTAAAAATATTCAAATTATACGTACATATATATCTATCTGTGTATACGTGTGTGTATTCAAATTAAACATACATATATGTATATATGTATACATATATATGTATATGTGCATATGCATGTATTGTGTGTATATATGTACATGTATGTATGTACACACACGTTTTAAGTAACTCTTGTATTATAGGAGATCCACTGTTTCCCCTTAGGATCAGATTTTGAATGTGTTCAGTTGTTGCTGTTAATTATCTTTCCATCTGTTTATGATGTTTAGTTTTCCTGCTTTTAGTGACCACTCTTATTATCTATAAGATGCATGGAAAGACTGCATCCCAGAAGAGCAGTAGTCAGTATTATAATGGTTTTATTTAATTAACTGAAAAAGGTTTTTTTCCTAAAATAATATCTTTCTAGGAAGTTAAAAAAATGTTCTCCAGAATACCTTCTATCTTAATGGATTGAAGGCTGCAGGTACAGGTAATTTTTTAGATTTCAACCTTTTATGGGGCTTAAGTTGAAAATGTTGTATAGTGTTTCAGCTTATAATTTTGCCTACTTTTCAAATGTAGTACACTAAAGGGCATGACTGTGGGACTGGTAAGTTTTGAGTTGCTTTTTTACATTTGCTCTTGGAGGTGTGCAGAGGCCTTATAAGGAGTTTCAGTTTGGGAATTAGGAACAGACAGACTGTCCTTGAGGTAGGTCAGGATCTGATCTTCTTCTCAGGTCAATTAAGGTCCCTCAGTGGGACAGGCGGAGGCAGGAAGGTGCCCACAGTTCGTGTCCCAGGTGAAATGGATTGCCAGCCGGTTGCTCCTTTTGTCTTGGTTGGGGTGTCTTTTCCAGCACGGCTCCCGACCCGCTCCCCAGTCTTACCTGTTAGCCACTTGTAGACTTTGTGATGCTCTGTGCATTTAGCTGTAAATGTTGCTTCATCTGTACGTGTTTTTCTTCTGTTGACCTCCTCAGGGATTTTAGATTTATAAAAAGTAAAATGCCCGTTGCGTCTTCTGGTTTGGCCACTGTTGATTGTATTAGTTAAAAAAAGATTTGAATTGAGAAAGGTTTGACCTACTCTGAAAGGATAAAGACATACTGAGAATTAAGATTACATAGATTGTCAGCACATTAAAAAAAAGTACTTCCCTTTTGTTGGTTTCAAATAACAGAGTGAATCTGAGATAGGGCTTCAGAAGCCGGTTTAGAACTGGATCTTGGCTTCAGATCCCTGAATCCCTCGTAGTCCGCCCAGGATGAGATAACCCTGTATGAGCAGGGAGGTAACTTCCTTATGGGAGGACGTGTCCAGTCAGGGGTCCCTGCAGCCAGAGAGTCATGGATACATCCGAGTCTCCGTATTGTTTATACTGAGAATCTGTCAGGATAAGTTATGATGAGACCTACCTGCTCACCTCTGCACCAGGGGAGCTGCACCTTTGGTGAATTGTAATCTTGATTCTGGATCCCTTCTCAAGACATTCATGTGAACATTTTTTCCCAGAGTAGCCTGTGCTATAATGTGTGTAATAGAGCAGTTTCCTGGAGCATTGCACGGGTGGGAAATGTTGCTTCTTTCTTCATTTTGGTTCTCTCAGTTGTGGATGGCTTGCCTGGCAGACATGCAGAAAACATCTGTATACTGCTGAAGTTGTTCTGCCCCCACACTTTCCTTTAAAACTCTCTGGATTCTGATTGGCTCTACACGTTAAACATACTGACTTCTGATTACGGGCTTAGGGTGTGTGTGACAACGTTGTATTTACAGTGCTGCTTCATCTTTAACTCAGTTGGGTGTTAGAAAAATAAATGTGTGTGGTAGGTGTTCCCTCAGTTCTTTTAAAAGACTTTTTGTGGAAATTTTGGAAAAATTGGATAATGAACCCTTTTTCAACCTTCTGCCCTTGTTTGTCCTATTTCTTCTCTCCCAGACTTTTGTTTCCTGGGGTATTTTATTACTTTTAAAAATTTTTTTATTTTTTAATATTTATTTATTTGAGAGAGAGAACACAAGTAGGGGGGAGTGGCAGGCAGAGGGAGAGGGAGAAGCAGGCTCCCCACAGAGCAGAGAGCCCCATGCGGGGCTGGATCCCAGGACCCTGGGATCATGACCTGAGCTGAAGGCAGACGTTGAACTGACTGAGCCACCCAGGCACCCCAGATTGACTCCTTTCAATATGATTTATTGCCCAGTTTGAGGTATACTATGTGTGTCAGAACATGCCATCTAAAACATACCTGTCTATATGCAGAAAGTCAAACATAATATAATCATTATGTAAGATAGTGTTGTTCCCCAAGTACTACCATTAATAACAAAGTTCTAGCATTTTTTTCAAATGTTTAAGAATTAAAATATACCAGGATAATTAAGAATAATGTTTGGCTCTTTATTTAATTCAGCCTGAGGATAAACCTGAAAGATTAGGGGCCTTAAGATATTTTTCTTTTTTTTCTTTTTTTTTTTTTTTTTTTTTAAGGATTTTATTTATTTGTCAGAGAGAGTGTGTGCGTGCGTGCTTGAAGGGGGAGTGGCAGGCAGAGGGAGAGCAGGTTCTGTGATGAGCAAGGAGCCCAATGAGGGACTCGATCCCAGGACCCTGAGACCATGACCGGAGCCAAAGGCAGACACTTAACTGACTGAGCCACCCAGGTGCCCCTGTTTCGCTGGAGTATTTTAGAGCTAATCCCAGACATTGTATAAAGTTTCACCCATGAAAGTTCATTGTATGTCCCTAACAGATAAAATATATAACCATAATACCTTTACCATGCCTCACATAGTTAAAAGTAATTTAAAATCTTTTCTCTCAGGGCACCTGGGTGGCTAAGTCGGTTGTGTGTCCAACTCTTGATCTCAGCTTAGCTCTTGATCTCAGGGTTGTGGGTTTGGGCCCTGTGATGGGCTCCACACTAGGTGTGGAGCCTACTTAAATTAAAAAAAGAAAGGAAGAAAGAAGGAAAGAAAAAAGTAATAAAATCTTTTCTCTAATAAAACTCGGTAATGTTTAATTTTCAAATTTCCCCATTTTTTTAAAAAAGTCTTTGACCTATCAGTTGGCATATCTCTAACATTTCCCACTCCTGCCTTGCACCCTTTCCGTTTTATTTTTAAATAACAGCTTTTGTTGATGCTCTGGAAGAAACTGTCATTTATCCTATAGAATCTCCCACATTCTGAATTTGGCTGATTGTATTATGTGATGTCATTTAATTCATAAAGTTTAAAACTGGTTGCTAGAAGTCCAGCTAGAATGAGCTTCAACTCTGGGGGTAAGAATACTTGCTGTTGGCTTCACCTCTTAGGGACGGTGACATTAATCATTTGTTCAGATGGTGGTGTGATCCTTCCACCTTGTGGCTTTTGTGGGTGTTGATGGTGGCTGCCTGGGTACTTTGTATCAGAATTGCAGACACGGTGACGATCTGATTCTGCCTTCTGTATTTGTTTGCTGGAGCCCGTGCAGAAAAGGTGGGATAAATGGATAATTCTTGTATTTACTAGCTTCAGAATGAGTTTGTTCTCTACAAGTGAAAATTATTTTTAGTCTCATAAATGCATAGATGTTAAGATGACCTATATATGTGTATGTGTACACACATACGTAGATGTTAATTTACAGCATTCTTTCTGATGGTCAGATTGCCCTTCAGAGGTATCTTCTGTGTCATATGCAGACAATGAATCATTGCCACTAGATCAAAAACTAATGACGTACTGTATGGTGACTAACGTAACATAAAAAAAAAAAAAAGATATCTTCTGTGTCCTTTGGAAATGGCTCCAGTAATGTTTTTATAGTTTTCTTGTTTATGGGCACTATAAAATAGTTTCAGACTCAGTTTGTACCCTTATTGCCGCAGACCTGAAACCAGCCATCTCTCTAAGGAGCCTTGATTCCTTGTCACGTTTTAGTGGGAAATGGTGTTCAGGGACTAGAATCTGGATACTGTGATAGGTAATGCTGGAATCTTATTTCTTCTGGGCTTTTTTAGGGTATAGAGATAGGAAGTGTGTATTTTTCAGAAAGAAAAAAAGTCATGAGTTTATCTCGATACTTCCAACTTAAATTTAAGATTACAGTGGGGCGCCTGGGTGGCTCAGTCAGTTGGGCACCTGCCTTCTGCTTGGGGTCATGGTCCCAGGGTCCTGGGATCTGCCCTGCGTCGGGCTCCCTGCTCAGCGGGGAGTCTGCTTCTCCCTCACCCTCTGCTGCTCCCCCTGCTCGTGCTCTCTCTCTCTCTCTCTCTCGCTCTCAAATAAATAAAATCTAAAGTAAAAAAATTATAAGATTAAAATGGTTTACTTCTTTGATTTTATGTTTGTATGTCATTTCTCTTTTGCTTAAAATCTTGGTTCTTAACACTAACACGTTTGTGTCATTGCTTCATCATTCATGTCTGTGAAACTTGCGTGTCATTTCAGAATAACAGTGCCAGTGTTGTCACTAACAAGACCTCTGAACGTGTTTGAACGTGGTTTCTCTGTTTCATCTTGGTTTCAGTGATGCTATTACTAAAAGCAGTGTTAGACTTCATTATAGCTCTTGTACGCCATAGGGTGTAGCACACTGGGATGTACGGTCAGATTACAGCTCCGCGCTGAAGTTACACCACGCTTTGAAAGTTAGGCTTATTTCTTTCGTTTTTGAAGGGTAAGGAGCAGTGGGAACTCTCAGACACAACTGATGGGAGTATCGTTTTGTACGTCCACTTTGGACAGTAGTTTGGTGGCACTTACTACAGTGGAACGTGCACACTGGCCTCGTGGTTCCGTTCCAGGTGGACACACAGCAGAGATGCGTGCACGCGTGTACCAAGAAACAAGTGATTTGTACTAGTCCCAGACTGGAACGGAGAGAGAACTGGGGTACATTCATATGATGACGTGCTCTCCAGCAGTGACTGTGAAGCTCCAGGACACAGCGTGGGTGCTTTTCACAGCATACTTTGTAAAGAATGGCTAAGCCCCAAAGGATACATACTGTGTGATTTTCTTGTAAATTAAAAAAAAAAAGGATGTTTTTGAGTCTCCATGTTCTAATGTACACGCGTGCATATTTCTCAGTGTAGCTCATCTTGACCGCTTTATTTCACGCTGCAGCCTGCATTCCCCTGCGCGCCCACTTCCTGTCCCTCCGACCCTGCTGAACTTAGTAATTTTTAAAATAACACCACTTGACAATATACCGTATAATTTAGTTATTTATGATTTTATTGTTGTCTGTCTCGCCTAATAGAATGTAAACTCCATGTGGGCAGAAAAAATGTGTGTGTGTGTGAGAGAGAGAGAGAGAGAGAGAGAGAGAGCTACAGAGTCGGTGGTAGCTGGTTGACGCCATATTGGTAGCTTGAAACCGAACAGGGTGGGTGTATTTATACCACAGAAATCAGCACACACCACAGAGCGGGGCTGCCCCCACTGACTCCGCACAGAGCCAGTTGTTACACACTCACCAGGGCGTCCTGGTGCACATCTCTGTCTTTGCACACACACTGAGGTAGGGATTCATGGTATCGGAACAGTGCCCGGCATGCAGGAGGTGCTCACTAAATTCTGAGGTGAATTTTATTATTGAAGAAATGTTGAGGTGCAAATGGCAGAAACTTACACTAGCTAAAGTGAAAAAAGGGAATATATCATTTTATGTAACTTGGAGTGTATTTAACGAATAAGTTACCGGTTGGTATCTGGAAATAAGTCTCTAGAAAGTCAAATGAGAAAAAGAAGTACCAATAAATCCTAAAGGAACTGTAACTACCGTGGAAAATAAATAAGTCTAATAGTTCTTTGATGTAGCCTTGTTTAAAATTACAAGAAGTTAAACATCAACTCCCAGTCCGCCCAGCGCCGCCAGCCGCACACCCGCTGGTAGTTGCTGCATCCGTCTTTCTCCCCAGCCCTCGGCAGCCGACCACTGAGCTCTCTGACCCACAGATGTGCCTGTTGTGCACATTTCATGTGATCGGAATCCCGCATCCCGTGCTCTTCCGTGTCCAGCATCTCACTTAGGCTTCCATCCACGTGGGAGCACGTGTGGGCACCGTCGCTTTTTGTCGTGAGTGACGTGCAGCCGTGAAGACGCTGCGTTTGCCTCTGGGTGTCCGGCCCGCCGGAGCGTGCGAGCTGCCCTGGCCTCTGGCGGCAGTCGTGTGCGCGGAGCCCGGGTTCCACTCGTTCCCCAAGTTGACAGATACGTGGCAGAGGTGGACGCAGCTGCGGAGGCCCAGCCCAGCTTCTCGGCTCTTCACCCTCTGAAGCTCTCGCGGCCTCTCTTGTCCCCACTGCCTCAGCGGCTCTCTGAACGGTGTATTTTATGTGCTTTTCACCATTTTCTACTGCCAGCTGTTGCATCCGTCTTGGATTCAGAAATCTCACGTCTCTTTTTTTCATTTTACCTGTTAGAGACTAATTTTTTGATTTAAAAGAAGGAGGAAGGAGGAATGTTTTAATAAGTCAGCCATTTACAAATGTCCTTTTGTGTCAGTCTGGCCCTGATGAGGTTCAGCGTGGCTTGCGGAGTGGAGGCATTGCTGCTGTCAGTCAGGCCCTTTGGACCGAAGTAAGAAGGAAAGAACTACGATTTCTGCCATGTCAGGGGACATGGGAATATCCACAATCAAGCATTGATTTTGCTAACAGATTTTTAGGACTTACCTCCTTTATTTAAATTCAGACATTTATAAGTCATCGAGTTTTCTGGTCTAATGTAAAAAATTCATTATAACTGTTTCAAGTAAGATAAGGCTCTGACAGTTGAGTTACTGTAGTTCTGGTCCTTGAAAAAGAAACGTTAAGTACCTTTTTTGTCCTCAGAAGAGAACTTTAAAAATTGAGTGATTGTATTTAAGATGCATTGGGCAGAAATGTTTCTAGTTTTACAGACCCCTTAGGTGATAAGGCCTGGACGTGGGGAGCCTTGGAGTTGAGGTGGACGGAGCCACTGGGAGAGAGTGAAATATGGGGAGGACCAGGATTTTGGGGAGGCATTGGTGGAGCCAGTGAAAACCTCGGTAGTCAAGATAAGTAATAGCTTGATGCAGCGTTTAAAAAAGAAAAAACAAAAAAAAACCTTAATGCAAAAAATCCATGGTGAACAAGATACTAAAATTTTAAATAAAGATAAGAGCAGTATTTTTCATTTTTCCTTTAGCCTTATGTGTTAGCTAATGTGCAGCATTGCTCCTTATTCTGTCTTTATTTCTACTTAGAGTTTAATTTGCTCTTATTTTTCTTACCTCTTTAGACAGTTGATGTTTTTACCTTTTAAATAGAAGCACTTGAAGTTTGAAATGTCCCTCTAAATACTCTCAGCTGTGTCCCAAAGATTTTGATGTTCTAGTTTTATTATCACTGTGTTCTGAACATTTTCTGATTTCTTTTTTGATTTGTTATTTGATGGGCGTGTTACTTAGAAAGGATTGCTTTCTTGGGAAATAGTGGGGACTTCGCTAGGTACTGTATCTTTAAAATAGTTACTTTTTATGTTCACTTATTATTTTGAACAGAAATATAGATGGCACAATATTCAAATGGGCAGGCAGGGAACCCTAACCCTCCCCCTCTTTAACCCGATTTCTGCTGAATTCTGTCTGGAAGAGTCACTGTTCATAATTGTGTAAATGTCTGTGGGTGATCTGTGCATATAACAGGAAGCACATATGTGCATGTATTTTTCCTTTACAATGAAATACCACAGTCTACATACTCTTCTATACCTTTTTATTATTTGAAATATATATCTTGGGGTTCCTGGTGGCTCAGTCCTTTGAGCGTCTGACTCTAGATTTTGGCTCAGGTCATGATCTTAAGGTCGTGCGATCGAGCCTTGTGTAGGGCTCTGCTCTGGGCAAAGAGCGTGCTTGGGATTCTCTCTCTCCCTCTGCCCCCAACCCCTAGCTTGCATGTGCTCTCGCTTGCTCTCAAAAAAATTTTTATATAGACAGGTATATATCTTGAAAATGTATGCATTTTAGGACTGGGAGTTACAGTTTTCTTTTATACTATGTGGACTTTTTTCATTGATGAGTGTTTTCCAGTGTCAGTGAAGAATTTTCAGTGAGTATCTTTTTCCAAACTTTATTTACTCATTTCTTTTCTATTGACATGTAGGCTGTTCCTAGTTTTTTAGTTTTGTGAATGAACCTATGATTCATTTAAGCCTCAAACTGCCTTAAACCTTAAAGGGGATTACTGGAGGTTTCTTGGACCAGTCTGACGGAAGCTGGATCTATGGGTGCAGTGACTTAAGTGCTTGTCTTCTTGTGGGCTCTGAACTCCTTAGGGGCCAGACCTCTGTCCGTATTGTCTTCCAATCCCTGATGCTTAACTCGTTGCACCAACACAGAAGATGTGGAACAGTGCCCTAGGCACGCAGCACTCTCAAAGCCCTTGATGCTTGTAATACTTAATTCTCATAACAACTGTTTGTAACTTTATTTAACTGATGAGAAAACCAAGTTCTAGAGAACAGTTTTTTAAGAAAGTGCCCAGAGTCCTATATCTAGTATGTTGCCACGTGGGGATTCAGGGAGTACTTACCAATAAGCTGAATGGACAACACTGGACTTTCAGGTTGAAGGTGGTGGAAAGATGAATGAGTTTGAGCTTTGGGGTCATTGATTTTACAAGGTCCGATCTTAACTCCAAGTCCTTTATCTCTGTCAGCCTCAGCTCCCTCTTTCTTGAAAATAATGTTGTTAACCTTGAAAATAAAACTGCCAGTCATTTTACCAGCGAAAATGGGTTTATTTGGGAACAGCAAAGAATTGCAAAGGCAGGCAAGCAAGCAGGGAGGCAGCACAAAGGAGAGGACTGCTCTTTTATAGAGGAAAGGTGGGGAGTTGGGAGGGAGGAGGAACCTTCCTCCTGCTGGGTTAGTCAAGTGGTATCCGCCTGCAAGGTGCACCTCTCCTTGTTGGGCCTGCAGTGGGGGAGGAGTGGGGAGGTGAGAGCTACCCCTGCTGGCCTCCAGACTCCATCCTAAGTGGGGCCTCCTGTTATTAATCTTCACGACGTATTGGTAATGACCTCAGAGTTTATTAAGGAGTTAACTTTTCCTCGTAGTATTGGACTAGTGTCCTGTCTTTACTCAAGGACCGGTGGTTGTCATTCCCTTTTGCTGCTGCTTGCGCTTTGGGCAAGTTCCTAGCGTCTCAAGGCTTTTTTCCCTCATCTACAAAAGTAGACATAATTATATTCGCCAGCTTGTTGTAAAATAAGCAAGAGACGCTCCATTAAAGTGGTTTTAGCATTCTTTGAATTTTTATTGTGGTAAACAAAAAACAACATAATTTATCCTCTTAACCATTTTTGTACAGTCGTGTTACATATATTTACATTGTTGGGAACCAGATGGCTGGCACTTTTTATCTTGCACACTGAAGCTCTGTCCCCATTGTTTTCTGAGGTGATAGCACCCTGGGTCACACCATTTTATATTCCCACCCATGGTGCACAAGGGTTCCGGCTTCTCAGTGTCCTGGCTAACGCTTGTTATTTCCTATTTCCCATTTAAAAAAAAAAAGAAGAAGTAATCATCCTGATAGGTGTGAGGTTATTTATAACATTTTTTAATGATAAAAATTTTAGGGAGAATTGGAAAAATGACTTTAAATTTCTTGCTAAATCGGAATAGTATCTGTTGATACCAGTGTGAGAAAACCAAAAGCATAGAGGAGGGCCTTTGAGCAAGAGGACCCACGACTGTGTATCTGTGTTTGGGAAGAAAAGTCGCCTTCTTCAGGGCTCTCCTTAGGATACAGCTGGGGGAGGACTGGACCCCTACGATGCTGCTGATCCTTCCTGAAAATGGGCAGTGTAGGTGGTAGAAGGGACCTGCTCGCCAGCAGGGCCCCCTGCCACCCACGGGCCTTCCCGTGTGGCTGTGTGGGTGTCACCGCACAGCCGATATCCCGCAAGCCACCACTGTTTTCTCAGCCGCAGTCCCAACAGGGCACTCTGCTGTTTGCTCGGTCAGGTGAGCGATCACACTGGGGGTAAACTGGATTTACTGGGTAAAATAAGAATTTACGGTGACAAAATGATAAAGTAAGTTGGCTGTATATTGATGTTCACTAAAACAGGAGTTGCAAAGTTTATTCGAATGGTGTTAACATTCAAATAAATAATGGCTTGTTTTTCAGTATTTGTTACTTGGTCAGTATACGCCAAGAAACCCCACTCTGTTTTATAACACGTACAGTTAGGGTGACAATTTTGGTCAGTTTCTGGCCCCGTGCTGTGTTATGCCTCTACTAGTATATTTGAAAAACTCAAGTGGCGTCGTCTTTGAGATTTCAGGAGCCTTTTTTGGTGGCAAATAACCTCCCAGCAGTTTCTAAACCTAGAATTAGCTTTCATCTCCTCTTTGGCAGAACACATGAGAAATGGCCATTAGTGTCTGTGAAAATACTCTAGTTGAGTATTGTCTAAATTGATAAGAAGTTCAGAATTTTCTGCCTCTTGCGGTTGCAGTTGCCCTTCTATTTTATGTATCTTATTTTGCTTAATTCATTGCTACGTGTATTTCCTGGTGATTGTGGTGCATCTCCCCGGTCCCCGCTCCATGTCCAGCATGTACTGTGTTGGCTTGTATCCGCAGTCGGGGGATCGCGGACTCGGGAGGACTGTCATGGGAGCCGCAGAATTTAGTGAGTTGGAGTGCTGCATGGGGATGAGAGCAGCCTGTCTGTCTCATATTCTTTCTGTGATTCAGTCATCCTTTGTAAGCCGAGGGAGGCCTGTTTCCTGGTTCTCTGGAAGCCTTTGCAGCCTCCGGAGGTGGTGTCGTTACCGGTGGTGGCTTGAGTGTGTGCTCTGGCAGGTGTCCCAGTGCTGGGGCCAGCTCTGCCGCCGACCAGTTAGCTGTGACGTCAGGCACGTTGCTTCATTTCTCGGTTCCTCGGTGTGTCCGCCTGTCAGGTGTGCCTTGTGAACTTGCTGGTTGTTGGAATTATTGATTGAAAAAATAGGTGAAGTCCTGCAGTGGGTTAGCGAAGGAGCACACGCTGGAGGCTGACTGCTGGAGCGCGATGTCCAGCTCGGCTCTGCAGGAGGTCTGTGACCTCAGACAAGTTACCTAGCGCCCCATGCTTCTGTTTGTCATCTCTTACACGGGGGTAGTAGAATCTACCTCATCAAGTTGGTTATTAATACCTGAGTCCATATGTTTAAAGTATCTAGGATAGGGCTTGGCACAGAGTAAGCATTAACTTGGCATCCCCATTGTATCATTATCATTATCTTTTCTTTGTCATTAGTGTTGCTATTATGCTATTTGCTGACTGCCACGTAGTCCCTACTCACGTGATAGGTATTGTCATTGTCCTTGTGGAAGTTCAGGATGGCGAAACGAGTCTTTCCTTGTCTCACAGATGGAACCGGGGTTCCTTTGTATCTTCCAGTTGCAAATTTAGTGCCTTCCTCAACTTCCCCAGAGTTCCTTCAGAGTAACAGAAGGGAGGAGGTATAGTAATTGTTAGAAACTCTGCAAGAACGGCGAATAACACCGTCCCCTTTTGGAGTATGTTGTATTTTGATACCTATTATCTGTTTGTCTTTGGAATATGCTTATATCCATTCTTATGATTAAATTTCTTTAGTCCTTATCAAGTCTTAATTTTTGTTGATAGATTAAAATTTTCAGAAAAGTTACTTCTGTTTTGTGGTGGAAACAGGCACAAAGACATAGGAATGATAACTCTGTGAATCGTAATAGAATTAAGTTTGGGATAGCACACCCAGCTTTTGGAAGTCAGGGTGTATTGTAGTGATCAGCTGCTAATTGGAGCTATCGTAGTCTAATAGTGTTGATTTTACTTAGATCTAGAACTCTTGATTAAAGCAAACATAAAAGAAGTAAGAGAGGTAAATTTTGAATTCTGTATGTGTAATATGAATTCCAGTTTTCTTTCACATTCCTCCTGTTAGCTGACTTGGAAGCATTGACTAGGGCTTTCCTCTTCCCAGAAGTACTGCCCTCAAGTATTAAGGCCAGCAAATAAAAGCATACAACTGTATGAGAAATGTGCGAGTCAGACTTGGATTTGTGTGATTTGCTTTTGGTGATATTTATAAGCAGCTTTTTTTTTTTTTTTTTTTAAAGATTTTATTTATTTGAGGGAGAGAGAGAAAGTAAGCACAAGTTGGGGGCAGGGGCAGAGGGAGAGGGAGAAGCAGGCTCCCCTGACATGGGACTCGATCCCAGGACCCTGAGATCATGACCTGAGCTGAAGGCAGATGCTTAACTGACTGAGCCACCTAGGCGCCCCTCCCCCACCTTTTAAAAGATTTTATTTATTTGCGCGAGAGAAGCAGTTTTTTCCTTAATCATTCTTTCCGGTGACTTTCTCACCTAAGACCAGGTTTCTGTAGGGAAGCTGTAGTGGACAGTACTGCACAGTGTATGAAGGGCTTTGGATTCCCTTTTCTCTCCCTCATCTTGCTCATCACCTTGTTTGCTGGCCTTCTAATGATTTCTGTCTAATCTTGCACAGTATTGTCACTTTTGTCATCCTGAAATTTGAAGTGGAGGTTCTCATGGGAGTACCAGAATACTACAGTTGTGTGATTTATTTTTTATGTGGGATGGGGAGAGGTGGTGTGCATGGTCTTCCTAGATTTTGTGTCAGTTTTTCTTTTCCAATTTTTATATTCTTGAAAAAGCAACATTTTCATATGGTTTACTTCTACTTATTCGGTGAATACTTACCAAGCACCTGAGCTGAGTGGGGTCTCGGAGGTAAAGCCGTGCCCAAGACTGAGGCAGGCCATGCTGCCACTGAGCTTAGTGCCAAGTCCTGACATCTAGAACGTCTAGATGCTTTTTTTGTGACCACGGCCTCTAAAAGAGAAGAGAAATTCCCTCTGTCCTCTCCTTGTTGCCTGTAGGTGACTGATGGATGTGTGGGATGTGGCCTGTACCTCTTCCTGGTCACTTCAGTAAGAAGGCCTGGAAGACAGTATGTGCAGAACAGATCAGATTCTTTCCTATTGTGGAGATGGGGTTGTAGTGGGGGCAGCTGGACAGCAAACGAACGTACTGTGTCAGTCAGTCCCGTGGTATTTGAGAAGGTGTAAGTGCCGTGGGAAATGAAGCAGGGTAAGGGCATGGGGCAGGCAGTATAAAGGTGGGCACGGGCCTGGTGTGGGCAGAGGACAGCAGGGAGGTCAGTGTGCAGTGTGTGGAAGGCCACGAAACAGGAGCCAGGCCGTGGCGAGACAGAGGGTGTAGGTGCGAGGGGAGCCACCTGTACAGGGCCTTGCGGACCATGCTGAGTATGTAGTTTGCACTGCTTCTGGCAGAATTGGGGAGCTGTCGGTGAGTTTTAGCGGAGTGAAATGGTGTGACGGGCGTCACGCAGGGAACTGGTTGGGAACAGAGTATAGGGCAGTGAGGCCTGTAGCCGCGGCCTGGTGGCACATGGCAACAGCTGGGCTGGTGGTGGCAGCGGACGTAGGGGCATGTGCACGGTCCAGATTGGGGTCCAAGCAAATCGTAGTCTCTTTCTTGTAAGTTTTAATGAGTTTACCTGTGAGGGAGGACTTCCCAGAGTTGCTTTTAACTATACTGATACGATAAAGAGTTTTTTAAAGAAACTAGAACTTTTTAAGGAATGATGGCCTTTATGTTAGTGCGTGAGTTTCTTATTCGGAGCGCATAAAGGGACTGCTCACCGTTTTCACTTAGGCCACCATTAATGTAGGCCTTTCCCGCTCTTTTCAAGACCTCACCGGCTCGAGAATCTAAGAGCCTCATTGGTCTTTCCTGTTTATCGAGAAGCAAACAGGAGTGGTGCCGTCCCAGAGTGACGTGTCCTCGTGTAATTTCTCAGCCCTTTGGCCGTAGGCCCGCGCCCCACTGCCTGAACCACACTCTCCTCTTCGCTGCACGCGGGGAACGAGCTGCTGTGTGTCGGGAGTGACGTGCGGCGGTTTTCTCTGTGACAGCGCCCAGCGCCCTAGCTTCTCCTCGGTGTGGCGGAGCCCCGTCCTCTCCTGCCCGCCCGCTCTTCTCAGTGGCCCGAGTGCTTCTCGGCTCTTCCGGGCTGCTGCTTCCGGCGGGGCTCTGCTTGGTGGCCTGGAGGGGTCTTGGCCTCTTTCGTCTTGTCATCTTTTGTATCCTCAGAACTCTGCACATGCGGAGGTGATATTTGGATATTGAGATAAATATAAATTAGCTCGAGGGGTGGGAGAGAAAGCTGCCGCCCACTGGTTACTTTGCAGTCAGAGAGTTGGCTTCTCCTCTCTGTCACCTAAAGAGCTCCCACGTCTGTCCTCTCGTCACCTCCTCTACTGCTGTGGAGGCTCCAGCCGCCGTGCCACTTGCTTGCACCAAGCCCTCTCTCTCCCGTGCAGGTGGTGCCGTGGCATTCATTCAGTCTGGCTCAGAAACCTTTTCTGGGTGTGTGCGTACAGGAAGACCTCTGGCTTCTTGGATGACAGGTGGGCTCTGCGAAGCCGTGTCTCTTCCTAGCTAAACGACTCCATCTTTAACTCCTCTTTCAAAGATGTGACAGCACTGGGGTGCCTTCGGCTCAGGGCGTGATCCTGGCGTTACGGGATCGAGCCCCACATCAGGCTCCTCTGCTATGAGCCTGCTTCTTCCTCTCCCACTCCCCCTGCTTGTGTTCCCCCTCTCGCTGGCTGTCTCTATCTCTGTCAGATAAATAAATAAAATCTTAAAAAAAAAAAAAAAAGATGTGACAGCACCGATGTTCCTCAGAAGACGTGAAAATTGGGTGTGTAAAATATCGTTGGCAACTAGTAAAGGTAGCTTCTGTTTTTTAAAGTCTTGAGTCGTAAGTTCCAAGAGAGACTCCGAGTTTGCCTTTGTGGTTGGCATGTCTGTTACTTGATGGTTCAGATTAAACCCGAAGCCATTCTCAGGGGCCTGGGTCAGATACCAGACTTGCTGCTGTGGCGTGCTTGGATTCCTCCTATGATGAGAGTAGGCCTTTGTGTCCCGAGTGTCCTCAGTAATGGTGATCTTTCTGCTTGTTTCTTCTGTTTCTTTCCTAGCTTGCTTGCCTGTGTTTTTCTGGAGCCCCTTTTCTTCCCAGTGTTGCCTGGGGTCAGAGTTCCTTCTGGTGAATGATATGTTTTCACTGGGGGCATCTAGGAGGTTATTTGAGCTCTGACTGCTATTAGGAGGCTGAATGTAACGCCTGGAGACAAAGCCATCATCGAGAGTAGTATGTCAGAAATGAAACTAGCTGTCCTGGGGCATCACTGGACACAGATAGGCCTCTTGTTCCCCTAGCCTTTTTCAGCTCTTGTTTTCACAAGTTAGTGAATTCATAAAACCCTGGTCGTGGTCACAGTTAAGCAGAGGACTCGATTTTTTCTTCGTTAATGGGATTTGCTACGGACAGAATTACCCGCGTAGTAGGAGAGCTGAACTGTCTATGTCTTGAATGTGTATCACATGTGCTCAGACAACAGAGGCTGTAGGAGCCCAGTTTCTTACTGTCTTACTGCCAGAGTGGAGTGTGTTTAAATAGCTACATTTTAGAGATGACCCAGACTATCTCTCAGTTTGAATGGAAAAAGTGTAAGTAGCTTTACATTTTTTTGAAAAAAACTTACTCGTACAGATTGTTAGAGTGTTTTTCTGTCTTCCTTCTTCAGTATGAGTTTCCTACTCACTCATGTTTTGAAATTAAGAAATTGGGCATCTTGTATTCCTCAATATTCCCTAAGCTAGTTTTAAAAGAATCTCGCAACTTCAAATTCTTGTTCCTGTGTGTTTTCTAAATACTTTTATAAATTTGCAGACTTAAAACTATCGATCTGAAAAAACCTTTACCTTGGAAATATCTGGGTTCCTATAGACATAGTTTCTACAGATTTGTTTTTAATGTTGATCAAGATGTTTTCCCCTGCATTATTCATTTTTCATCAAGACAATTACCTTAAGTCTTAAGGTCAGAATTAGGCTGGAAAAAGGCCAAAGGCATGAGTTTGAAAACAAAAATAGTCGGAGGAGCCATCTACAGACATGATCTGGGTCAGACTTGATTTGCAGCTTACTCAATTTTAGAATCGCCTGTTGGTTTTGTGAGCAGAGGTCTGCCAGATGAATTGAGCAGAAGGGTGGGATTAGCATATTAATCGGGTGCTGGCTACTGGCCTTCTTTTTCTCCTCCCTCTTTCCCCTCCCTCCCTCTCTCCTTCCCTGAATGAATCTAGGAACACAGGCCCCTGGGGTCACATTACTGGCTGGTTTCCTTCTGCTCTGGAGCTTAATCTAGCCAGGATGGTCTGTGTTTCAGATCGCAGAAGCAGAAGATTCTGTAACTGAGAGGCATTCTTCAGGCTGCCGGAAAAAATTACAGAAGGAGCACCTCCCAAATTTTGCTTCAAGCTCTGAGAAAAGGAGCACACAGGGGAAGCTTAGTGTGGCTGTGGATGGAAGCGAACGCTGTGGGAGCGATGAAAGGGGACTTGGTGCGCGGACGCCTGGTCTGATCTTGAGGCCTGAGTTTATGTTGCTGGAACTGGCGGGCCAAGAGGCCCTGAGACCAGCAGGTGCCGTCTGTATGGGGAAGAGCGGCTGTAGTCCCATTTCCGATGTGTTGGGCTAAAGGTATAGGTAACTTAAAAATCTGTTTGGTTTAAATTTTATTCAGATTCATGCTTTTGCATTAAAAAGGTGGATAAGAGTTTTTCAGACCTTATTTCAAATAGATTTACAACGAAATTTAAGGAAAAATGGAAATTGATGTACTACAGGTTTGCAGCTCTTGGCATAAAACCAACTAGATAGCTTTTAGAAGTAAATAAAAATATTTTTATCAAAGTGCATTTTAAGTAAGTTATCTTTTCTGTTCTGTGTCTCTTATAGTTTTATGTTTTATTTCGTGTGTTTTAATTAAGGCACCCATATCCGTTCTGTGATGTGGAAGTACGAGGCTAATTTTAACTTCAATAGGATTGGAGGGAAAAAGTGATGTGGTTTTTCTTTTTTCAAAAGTTGGTTCTCTTTACTCACTGTAAAGATTGTGCATTTAATTTGCAATTCCATATTATCGTAAGGTGGTCTTATCACTAAGGGTCAGTAATACTTGGATAAACATTTTCCAGTTTAATGTTTTTAGGGTTTTTATTTGTATAAAAATATAAAATACAGCATTTTCATTGTAACATTCAAGACAGTATTTGGGAAGCATGTTTAGAAGTTAAAAATGCCATGTAATCCATGTATGAATAAGACCAAATAATTTATCTGCTTCTCTTAAAGTATTAGTGAATATTATTCCCGGGGGATGAAGTCCGTAATAAAGAATTTAATACAGATACTGGTATTTTAAAGAGTATATTCAAGTATCACGTTAACCTACTCAGGAAAGACTTTTACAAGGAAGAAACCTGCGCTGGGTGAAGACCTGAAGTATTATAGTAGACCTTCAGGCTGATTCGGTTCAGTGTTTAGCTTGGAACTTTCAGAGCCGCCAGGATGTGGGGGTGCTCGCGCCCGCCAGACCACGGTTTAGATCGCTGTCAGATCGCGTCTCATTTACCAAGTTGTCGGCATCATCTAGTCATTCTTGTCTAGGCTTTTAAACATTTCCCCTTCCTTCCTTCCCTTCTCTTCCCTTCCCTTCCTTCCCTTCCTTTCCTTCTTTTCCTTCTTTTCCTTCCTTTCTTTGCTTTCTTTCTTGCTTTTTAGGTAATCTCTACACCCATCGTGGGGCTTGAACTCACTAACCCCAAGATCAGGAGAGTCGCCGACTGAGCCAGCGCCACTTTTAAACATTTCTAAAACATGTGACGTCAGACCTCAGATGTCAGACCAAACAAAACGCCTGTCACTTTATTACCTAATTAAGTATTTAGAGTAAAGATTTTGCTGAGTTAAATTCAAATTGTTGAATTTTAAAGGGCTTTGGGTATGGAAACTTCTGAAAACTGTAATTTCTCACCTGAGGACTGCACAGTATAATTGAGCATGACCAGTAACGAGTGCTCAGAGGCAGAGAGCTCTTTACTATTCTTGTTGAAGATTTTGGTCTCTCCCAGACTTGTTGGGACCTGTATGCACAATGCTGCCTCCGTGGTGTGACAGTCCTCTGTTAGCCCTGATCCTTAGCAATAAGGCTCTGATTTCACTAAGTCTAGGCTAGATTCATGTCTATGAATCCAGTAGCAATGGATATTAAATAGTTGGCTACTGGGTTTTTAAGAAATTCAAGGTGACTTTAGAAATATGAGCTTCAGAAGGAAAGAGAGACTGAGGTGCTTTTGCTCATCCCAAAGCAATTGATAGAAGCAGCTTATTTCCCAGTATGTTTACTGACTGGCAGAGCTCGTGAGGAGAGGCGTTTTTCACTGAGACGTCATTTCGATAGCGGTCAGGGTTGGGTAGGAGAGCAGAACCACGTGTATGAAAGAGGGGAAGAGGTAGGGACAGCATCAGGCTTAGATCATTGCATTTGCAGGCTGGAGCAGGCCGTCACCTCTGACGCATGGTCTTGTTTCTGGATTGTGCAAGAGGAGTTTTCTGACAACACTAAGGAGGTTGTCACCCTGTCCCCTTCTCAGGGCTGAGTACACCATCTCCCCAGGGGCACGCAGTGCTTATTGCTGTATTGGGATCAAGTGCCATTTAAAAAGTCCAGTCTCATTAAGTGTATGAGTTTCATGAGTCATTGAGTTTTATGGCTTCACAGGTAGGTGAAGCTGGTTACTCCCACCTAGTGAGATGGCCTTTGTCAGGAGCTAGGGAATTACAAAACAACTAACATGTATATAATGCCGAAAGCACTCTGACAAGCTGATTTTATCCCCACGGGAGTCCTACGCTGTAGGAACCATTGATGGCCCTATTTCTGAGATTGAAATTGAGGCAGAGAGTGCTTAAAAAAAACTTGTCCAAGGCCCTATAGCTTCTAGACTTTAGCCAGGCAGTCTGCTCTGGACGTTTTTGCCCTCAACCTTTGCTATTGCCTTTCAGCTAAATAGGGAGAAATAATTGTCAACAAGAGGTTTTAGCTGGACAAAGGAGAGGGAGAGGGTAGCTTTTGGTGTGGTTTATAGATTATTTTCTGGATAAAATGTAAAAATAATAGGAACGGTTTATTGGCTCTTGCTTGGTGGTAAAGGAGAATGAGAAATTAAAGATTTCTTTAAAAATTCAGGAGTGGGGGAGCCTGGGTGACTAACTCTACTAAGCGTCTGCCTTGGATTCAGGTCATGATCTCAGGGTCCTGGGATCCAGCCCTGCATCAGGCTCCCTGCTCAGCGGGGAGCCTGGTACTCTCTCTCCCTCCTCCTCTCCCCCAGCTTGTGTTCTTTCTCTCTCTCAAGTAAATTAAAAAAAAAAAAAAAAAAATTCAGGAATGACCCCAGCTCTGTAAAGGTATCTGCTGGTTGTTTCTCTGTGGTTAGTTTGAATGTACTTCTCTGGGGTTCGTGATGATAGTAAGGCAGTGTGCTGGTGTGTCTGTGCCCAATGCTGAAAATCACCACCCCAGAGGCAGTTTGAGGCCTGAGCTCGGTTGTTCAGCACTTGTCCCCCGTCTCTACTCACCACGAGTGCTATTTGAGGGAACTGCAATGAGCTCCTTCACAGGAAAATTGGCAGTTTGACGTTCAGTGCCACTCACTCCCATCATTTCTCACCTGACTACTTATCTTCCCACTCTTGCATTCCCAGGGTGATGCTTAGTTTTTTCTGGTTTTGATTTATTCGCCCTTGTCTCTGAGGCCTTTGTGTGGTTCAGATTTGAGTTGGGAGGCCAGATAGGAGTTCTGCCCACATCTCTGACTGACTGTGTTACCTTGGGCAGGTCACGGGAGATCTAGAACCCGTGGTTTCTTTATCTTCATTGCACCTGCGCCATGTACCTCACAGGGTTATGGGTGAGGGCCAAAAAAAAAAAAAGAAATTCCTGAAAGTGTCTTTTGAAGTATAAATGTATAGCATTATTAATGTTCCCAACCTCCCCAAGTTTCTTTGTCTACTCCCTGCTTTGATGCCATGCATAAGCTTTGGTCATGGTACCTTTTGCATTACTTGTTTACCTCTGTACCCTCAAAGGCCCTGTGTCTTACTGTCTTTGAATTTCCTAGCACTTGGCTCAAGGCACGTTGGAATGGGTACTGGCTCAGTAATGTTCAAATGAATGAGTAAAGAATGTCTGTCTAAGGGATGTTTCTGGTCATAGTTGTTTTTGTCGTTGTTCATCGTTTTTTCTGAATGAAGACTTCCTCCTTGTCTCTATGCTTCTTGAAGTTAGCCTTGTTAAAAATCTGCCCTTTCTTACTTTCTTGTGTTCCCTTTTGCAGGATGTTAAATTCCAGTATCTGTGGCCTCCTTCTTCAAGGGCTAGGCTTACTTTTAAATATTCATCTGATGAGTCTTGCTTTTAAACAATCAGATAAACAATCAGATAAATCAGTTCTTCCAGCTATTGACTTAGAGATAGAAAATATTTAATATTTATTGTTTGTGTATTCATTTAACAAATACGCCTTGAGTACCTTTTGGGTACCAAGCTCTGTTCCTGGGGCTAGGAACAGAGCAGTGAACAAATTGGATGAGATTCCTGGCCTTATGCAGCCTCCGGTCTAGTGGCGTGTCAGTCAGTGAAGAAGGAAATGAATACATAAGAGAATTTCAACGAATCTTAAGAGCTGTAGGAGGGAATCACGTGAAGAGGGCTTCTAGACCAGTGAGCAGTCGTCATATTTATAAATAAAACTGAATATGTTACCGATGTCGTGCTCTTAGTTTCCCTTTGTATCGGGTTACCTGAAAGGTATCTAATGGTGTTGATGGTGAGTACTTGAAGCTCTAGCCCATCCATGCCTCATCCACAAGAAAGATACAGAATGGCTGAGGAGGAAGGTGGCTATTCCCTGGACTTTTGGTTTCATGAGAGCACCTCAGTCTGTATGAGTGCTCCTCAACCTTGACTAGAACCCTCTTTGTTCAGGTAGCTCTTTTTGAGTATCTCTGATGGACCAAGGGGGACCCAGGAAAGATAAGGGAGTCATCGATCACCCAGTAACTTCGCTGTGCCATCTTGCTGTGTGTCAGTGCACCCACATCCTCAGTGCCAGGGAAACTGCTTGCTTATGGCATTGTGTGTCCACATTCGTTCTCCACATTGTTTACAATGTGCTCTGGATTATAAAGAAACAGTACAAATAAAATATGCCCAAGCCAACACCAGAGTATTTCATTAAGTACATAAGGACTTCCTAAAAAAATTTACTTTTACATGAGTAATTAAAGAGGAATAGACTTCTTCTGACAAAAATTTTTAACAGAAACTGGTAATAGTGACTTCCCCCCACCAAGAAAGAAACTAGGAGGGTAGGGCACAGAATTTGGGATCACAAATTAGCAAATGTTACAAATATAGCAAATAACAGGAAAATCATTCTCTTCCTGGACTAAGGCCTGTTAGGCCACCTCCTAAGTAAATATGTCTTTAATCTGTTCACTTTCTATTTAGTCCAGGTCACCTCTGCTGTCACCTGCATGGCCAGCATGCCTCCCTCTCCTCTTGATCCCCTTGTCTACTGTCCACGCAGCAACTAGGGTGATCTTTTAAAACACAACCATGCCACCAGCAGCCTCACGTGCTTGAAATTCACACCTGGTGTCACCCTTTGCCTGTTTGCTAAGCTTCGGCCATACTGCCCTTCTTTAACTATCACTGTCCTGAGCACCCCACCCTCCTTCAAAGCTCAGGGCCTTTGCATATGCTGCCCCCTCCACCTAGGACGCTCTCTGCCTCACTGAAGCAGGCTTCTCCTTTAGATCTCAGCTGAAATGTTTCTTCCTTGGAGAGAACTTCCCTGATTCCTCAATCCAAGTCTATCTTTAATTAATTATTCTCTCTCGCAGAACTCTGTTGTTTTCCTTCATGGCATGTATTCCAATTTGGTGTATCTGTATTTATTATCTGTCTTCTGCATTAGATTGTGAGGGCTATGGGGGCAGACGTCTTTACTGTGTTGTTTACAGCTGAAATACCAGAGCCACTTATTAGCACATAATCATTTAGTACATATTTGTTACGTGAATTAATGAATGAACAAACTGCTTGGGAACTTGAGTTCAGGACTTTATATCTGCCTTACGCATACTGTAAACCTGCTATGGTTCCGTTCCTCACTCCATCGGTGAAGATTTTGCTGTATCTCTCCTTAAACATCGCAGTTGGAAAATGCTCCCATTATTCATGTGCTCCACAGATCTTACCAGCATGTTACTGATTTCTATGCCCAAGTAACTGATAAAAACACTGTACCTAACAAAGCCAAAAATGAAACATCAGGTCACAGACTGACGTCTCTCTAGGTTGAGAGCTGAATATCTCACTTCTGATCCCGGAGTTGATACTCCTTTGTGTCTTACTCTTCGCCAAATCAAGAGAACCTATGAAGTTTGTCACACAGCCACATTGTCCACTGTGCCACCACCACGCTCAGCTCTCGATGTTCTCTAAACCTAGAGCCCTCTCACACACCGCATCGTGGCCTTCTGTAGCACGGATTCTCGGGGAGCTCCACTCAAGCTGCTGGAAATCACTGCTGCTCCTGTTAAGTGTACACATCTCCTGTTATCCCTTTACTGCGCTAAGGTAGCTAGTAGTGAAAATGAGCAGGGGAAACTATAGGTTTCACTTTGTTAGGATTTTTATTTGCTCCTGTCTCATCTCTTTTAGATTCACTCTAATATCTTGCAAGTCGTATCATTCAAATAAATATTTACTGAGCATCTGCTGTGGACCATGCACTATTTGAATCCCCATAGATTTAGGGCGATCAACACAAACCCCCTCAGTCCTGTATAGCTACAGTATGATCAGGCGCACAGAGAATTAAAAAAAATCATATCTAAAAACTGATGGAACATTATCTGATTTCAGTATCCTATTTCTTAAGTTGCTTTAAAATACCAATCTCATTAGGGTGCCTGGGTGGCTCAGTTGGCTGGGTGTCTGGTTCAGGTCATGATCTTGAGGTCCTGGGATTGAGCCCCATGTCAGATTCCCTGCTCAGCGGGGAGCCTACTTCTCCCTCTCCCTTTGCTCTTTGCCCCTGCTCGCGCTCTCTCTCTCTCAAATAAATAAAAAATCTTAAAAAAAAAATCAATCTCATCAAAACTTACACATCAGACTGGTTTTGTTCATATAAAGCTTTCATCTCCTCCAAAACTTGCCTGAGTCCATCCTCCTAGAACATACAAAATGATATTGATACACGTCCATTAATTCCACCAAGTCTGTAGCAATGTCTAATCTACTCTATGTTTATCTTTGATTCATATATCTTATCAAAAAGCAGTACCTGTGGGAATGCCTAGAACAAGTGTTGGTGAGGATGAGGAGAAAGTGGAACCCTCATACATTGTAGGGAGGAATATAAAATGGTGCAGCCCTATGAGAAACAGTCTGATGGTTCCTCAAAACGTTTAACATAGAATTACCATATTATCCAGCAATCCCACTTGTAGGTATATACTCAAAAGACTTGAAAACATATGTTCATTCAAAAACTGTGTATAAATGTTCAGAGCAGCATTCTTTATGGCAACCCCGAAGTAAAAACACCCAAACATCCATCAGCTGATGAACTAATAAACCAAATATGGCATATCCGTTCAATGGAATATTATTGGGGCATAAAAAGGAATGTAGTCCTGCATGCGTCAACATGGATGACCTTTGGAAACATTATTCTAAGTGAAATAAGCCAGACACAAAAGGATAACTATTGTGTGATTCCACTTACCCGAAATATCTAAAATAGGCAAATTCGTGAAGACAGAAAGTAGATTAGATGTTACCAGGGGCGGGGGGAAGAGGGAAATGGGGAGCTATTGCTTAATGGTTACAGAGTTTCTGTTTCAGTTGATGAAAAAGTTTTGGACAGAGGAGTGATGGCCGCACAATGATGTGAATGTAATTGAGGGCACTGAAGTGCACACTTAAAATTGGCTAAAATGGCAGCTTTTATGTTATATTTTACCACAATAAAAAATAGAGGAAACAAGCAATAAAAGGAATGAATTACTGACAACGTAAGCAATCAACATACTGATGAAGGATATTCTCAAGTACACTGTACTCAGCAAAAGAAGTCCGATACAAAGGAGTACATACTGTACGATCCCTACTGGCCCTTCCCAGAAAAAGTATGCAACTCCTGGCACCCTGAATCCAGACACCTCCCCGCAAAAAAAGACAACTATAATCTGTAGTCGCGGAGAGTACATCAGGGCTTGCCTACGGCTACAGAGAGTAGGTAGCTACAAAAGGGGAAAAGGGAACCCTTGGGGTGACAGAATCCTTGACTGCGGCACTAGTTATAAGGATGTATAAATTCGTAAAAAACTAAAAAAATCTGCTAAATTTGTATTTTGTTGTATATAAATTATATCTCAATAAAATTAACCAAAAAAACCCACCACTCCTTTAGAAGCAATAAAGCATGACAAAAGTATGTAAATAACTTTAACGAAAACAGATCTTAAAAAATTACTACAAGGGTAGTAGTGATACCTAGTCCTGGGATCAAGTCCCCCATCAGGCTTCTTGCTCAGCGGGTGTCTGTTTCCCCCTCTCCCCCTGCCCCTCCCCCTGCTTCTGTGTATGCTCTCTCTCTCAAATAAATAAATAAAATCTTAAAAAAAATCACTACAAAAAATGAACACTTTGGTTTGCAACAACAGAAGGACCAAAGGTGTTTCTCTACTATCCACCTTGGGGCAAATTTTTTAAAAAATTTCCTTTCGAAGGATAAAAATATTAAAATTCTGAAGTTCATAGATATTACACAGTAGGTCTGTCAGCAATCCAAAGATAAGTGACCCAACTACTTTTAGGGCCAACATACATGTAGCAAAAACATTTTGGCGCTATTGGTATAACTACAAAATCAAGAACTTAACCCTCTTCAAACATAAGAAAATACGTAATTCCCAATGAAAAACGTAAGCATGTCTTCTATCTTCCCTTTCATCAAGTAGTTAAACAGAGATCATGGAAAAGTCTGATTTATTAGAATTCAGTTAAATATTCCTATTATCAGCAAATACTATTTTAAGGAATAGCTGAAACTCCTGTATGATTCATAGATCTGCAGGTATACAAAAGACATGTGTGAAATAATTTTATAAAAATACACACATGGGGGCACCTGGGTGGCTCAGGCGGTGAAGTGTCTGCCTTCAGCTCAGGTCAATCCCGGAGTCCCAGGATTGAGTCCCACACTGGGCTCCCTGCTCAGTGGGGAGTCTGTTTCTCCTTCACCCTCTGCCCCTCCTCCCTACTTGTGTTTTCTTTCTCAAATGAATAAAATCCTAAAAATAAAAACACACACACACACACATATGCTGGGGCCCCTGGGTGTCTCAGTTGGTTAAGTGTCTGCCTTTGGCTCAGGTCATGATATTAGGGTCCTGGGATCAAGCCCCATGTTGGGCTCCCAATTCAGTGGGAGTCTGCTTCTCTCTCTCCCTCTCCCTCTGCCCCTACCCTCTGCTCGTGTTCTCTATCAAATGAATAAAATCTTTTTAAAAAATTAAAAAAAGATAATACACACATGCTTTCAGATTTAGATTTATCTATAGTAAAAATAGTACTGTTTTGTGTTCCCACCTCAGGCTGGGAGCCCAAGATAATTTTTCTAAAACCTCACTTAAACTATTAGCAGTTCTGCATATAGAAAGTGGACAATTATTTCAATTTGCTGAATACAGCACCTAACCTTGAGGTCGTGGAATGAACAAGGCAGAGTCCCTCCTCTAGACCCAGTGACTATCATCTTCCTGGGAACAATGATTCTTGAAAGGTCCTGTGGGTCATGGGCCTATCAGCCCTCACATCAATCAGATAGATTGGCCTGTCCCCGCTTGGCTGTGTCAGAGACTGGCCAACCTCCTCAGGCCGAGTCTTCCAGGCCGCTGAGTCACCTGAGCAGACGGGTTTGTTAGTGGAAGGTGCCTGTGCGGCAAAAAGCTGCAAAAGGTGCTCTGCCAAACTAAAACCTAGAAAAAGGAGTGATTTTATAACTTTTAAGTTTGCCTCTGAACCCCCCAAAAGTGGTAACTTAAGATTTGAGTGAAACAGAGAGCTGCATGGACTGAAGGTCTGAAGAGCCAGTCATAAGGCCGGGGCGGCCAGCTCCTGCTGGACGAGTCTGTGTCTCTTTGGGCTTGTCTCCTCATATGTTACATAACCTCCAAAGTGCCTGGTTGTCTGAGTGCAGCGTGGGGTCGTATTTTAGAGCCTGCGTGCCTTGGCATTCTGGCATCTCTGCTGCCCGTCCCACCACTGTCTCCTAACTTTTTAAATGAAGTAACTGTTCTGAAAGAACAACAGACAGGAAATCTAGGAAATCTGTGTTCAAGGTGAGGCTTTGCTCCAATATGCTGTAAGTTCAGACAAGTCCCTGAAGTTGATCTATAATTTCTTTTGGCTCAGTCTCATTTGCAAAATGACCTAACTGTTCGACCAGCCACTCTCTAATGTTCAAAACAAAACTCACCTTTCCCCAAACACTCTTCCTCCTGATCTCTGATGCTGTATCTGAGAGAGAATCCCCTCAAGATCCTCTGTGATTCCTCCTTCATTCATTACCCATCCCACCTCCACCCCTGTTCTAACAGTTACAAGTCCTGTTTGCCTCATCTCTGAAACCCAGACACTGATTTCTGGGCCCAGCGACCAGACATAGTTTGGACCATACGCAGCTCTCACAGTAGGTCTGTCAAAGAGCGATCATAAGCACCCCTGCCACTGTTCTTTCTTATCTCCAATCTATTCCATGTAGTGCTGCCATCACCACCCTCAAAACGTAAAAAACTGTCCTGTCACTTCCCTGTCTAAAATCCTTTACCAGCTTCCAAATGCCTTATACATGAATACACAACTCTCCTAGGCCTAGAACCCACCTTTGTAGCCTCTGCACACACATCAGTCCCCCCTTCCTATGTGACCATGAGTCTCTGCACGGCTGTATCCTTCAGCTGCATTGCCTATCTTCCTTCTCAGAGTGGGGACCTCATCCTTCCAGGCGTGGCCCCAACGCCCCCTCCTCTACCCCAGCTCCTACCAGCATTTCTCCTTATGCTCCTGTGTACACCTCTCTAGTGTCCTCACACTGCATTCTAATACTCACATTTCGTGCCCCTCTACCAGCAGAACATGCCCGGTATCCACGCAATGGCTGCCCTGTGTTAGGGAAAGTAGTCAAGGATGGAATTTAAAGTGCAAGTTTGAAACCAGACTGCCATGGTTTAAATCCTAGTTTCACTTCCCACTGGCTATGGCCAAGATACTTAATCTCCCCAAGCCTCTGGATACATGGCTGGAAGAAATGGTTTAAATCTCAAAGTGTTCTTATAAGAACAACGGATAACATAGGCCACGTGCTTAGCACCCTTTTGAGGTAGTAAGAGAAAAATAAGAATAATGGTAATAAGTAGTAGTGAGTAAGGGACAGGCAGGGCTAGGTAGGGAGAGAGAGGTAGGGGGCTACGGGATCAAGCTCATACAAATCTCAAAAATTCAGAGATATAAGGAAACCAGAGCTAAGGGAACAAACCAGACCATCCTGTCCCAGGTGTGGGAGCTGGGGTCTTATTATGACAGCTACGTGTGACCAACAAAGAATTACAGGACGCTAAAAAGGAAGCAAGCCACTGACGATGTTATCACTAGTCCTTACTCAAGGGTGCTATCAACAGAGAAGTAAAAAAGATTTAAGTTCCCTGGTTAGCTTTCTATAAAAGACCAACCCTAAAAGCCCACAAGGGTAAACCTGTCAGGACCCCTCCCCCTCCTGAGAGCTTCTTCTGTTTCATCACTTACTGAACCTCTATCGGTTTACTCTCCTTTGTCTGAGAGATTCAGTCTTCGACTAGGTGAGACAAGAACCTCGCTGGTCTCCCACTTCAATAGCAGCGGCAGTGGTAGACAGAAAATTAATAGCGAAGACTGACGTCGCTGCTACTTGTATGTCAGGCATTGTCCAGAGAAGCTGACATATATATATACCACTCCTAGGGCCCTCGCGACAGGAAGAGTTGAGTACTATTATTATACTCTTTCCCATTTCTGCAGAAGAAACGGACAGCACAGAGAGTCTGAGTAACTGCCCCGAGGTCACAAGTAGGCTCCATGCCCAAAATGGGGCTTGAACTCAGGACCCTAAGATCAAGAGTTGCAGGTTCTGACCACTAAGCCAGTCAGGCACCCCAACCACTGAACAGATAACTTATCCAAGGTTACTCAGCTTCTAAAGTGGCAGACTTTGTATGTAAGCTTTCAACCCCACAGAAGCTCCTTTGATTTTAGAAGAGTTATTTTAAAACATTTGGAAAATAGCTCTAATGGTGAAGTCTACAAAGGGGGGAAAATACCCAGATTCACACGAATTCACACAGCCATAATTTACCTATATGATTATGGAAATTTTCATAACCATAGAGAATCAAAGGTGGAAATTACTGCTATAGAAACAATTTGTTTTACTTGGTTACCTTTTAAAAAGCAACATTTCTAAAAAGAAAATAGGACTGCATTCTAGCTAACCCCAGAAACTATGTTCCTCTTTTGCAAATAAAGATACAATAGCTGTGTAATCTGAATTGAGTGACATTTCCTTTTCAGCTCTACAGTCAGGGATAATTTAGCTAAGTTTTATTAAATACACAGATCTATAGTGGACTGTGCTACAGAACTGTATTCCAAAAATCACCAGTATCCACAACCTTCCTCATATACCTTTTTAATTTCAGAATCTCGGCCTGAGCTTCATTTCCTTACCTGTACAATGGGGCCAACAGTACACACTTCTAAGGGGCTGTGGTGATTGATTACTCTTTAAGCAAATATTCATGAAGTGCTTACTCTATACTGCATATTGTTCTAGACACTGAAAATAAAGTAGTGAACAAAGTACTTGTTCTCAAGTCTACGTTCCAGCGTGGGATACAGATATACTGATGATAAATATATTAGTGAAAAGTGCTAAGGAGAATAAGCCAAGGCAGGTCAATAGAGTGATGATGAGAGGACCTGAGGGTTTTGTTGGTGTTCAGAGAAGGCACAGACCTGCAGTGTGGAGCGAGTAAGGCATGTGGAAACGGGGCCATAGGTTGGGTAGAGAATTACGGGCAGCAGGAATGTAAGTACAAAGGCCCCAAGGAGGGGAATGGGTGGCTCACACACGTGCCACCCACACCTCTCCTTGGGGTCCCCGCATCAGCAAGGAGGCAGTGACACTGGAGCAGAGTAAGGGAGGGAGACCCTGGTGGCTGACATCAGAGTGAGGACTGGAGGCCATGTCAGGTAGGACCCTTGTAAGCCCTCTCACAAGTTTTCTGTTTTATTTTCAGTGAGATGGGAAACCATACAGGTGTTTTGAGCAAACAAGTGACAGGATTGGAGCTACGTCTTTAAAAAGAACTTTCCGACGGCTGAGTTAAGTAGACAAAAGTTGGCAATGGTGGAGGCAGGAGACCACTTATGCTATTAAAATAATCCAGATTCTTCAGTGATCTGCACACCCGACCTAGGACTGGCACCTGCAAACCCAGATCAAGAGTCCTGTGCTCCACCAGCCAGGCGCACCTCCACCAGCGACTACTAACTGCTTTACACAAATCTAAAGTCATATACAGATTTTAAGAAGTTTTTTTCCAAGTGGAGATGTTTTGACCTGGAAGTTTCATTGAAGAAAGGTGACTGTGATCTTGCTGCCCTAGGCCAGAGTTTTCTGCACAGCCGTATTTCCTCTGACCCTCTAAGGAGGCATGGAAATCTGCCAGGGAACAAAGCCACACAGACAACCTCCTCACGTTAAACCCAACCCCCTGACAAGGGGTGGTGAAAGGCCAACCAGGCAGAGCAGCCTGAACAGCCGAGCAGCAGGCCCCTCCCCCAGAAGACAGACCGGAAGAACAGGAGCTGTTCAAGAAGCTGCTGCCCCATCAGTGCCTGGACTCCGTCTGGTCCAAGCGCAATAAGCCTGGCAATGAGCACCTGGCACCCACAGTCCGGGCCACTGTCGCCCAGTTCAACGGTGTGGCCAAGTGTGTCATCACCACCTGCCTTGGCAACCCAAGCATGACAGCCCGGGACAGGGCCATGGTGGTGGAGCACTGGATCAAGGTGGCCAAGGCCTGTCAAATCCTGCAGAACTACTACTCCCTGAATGCCATCGTCTCGGCTCTGCAGACTGTCTCAATATACCACCTCAAGAAGACATGGGAGAAAGTTTCCAGGAGCAACCATCTAATAAATCTGCCACCCTGGTGATGGCCCTCCGGAGAGCCTAGAAGAAGAGGCTGCAGAAGAAAGGTGTTGTCCCCTAACTTGGCACTTTCCTCACTGAACTGGTGATGCTGGATATTGCAATGGAGGACTATCTGGAGGTGGGTGAGCCTGAGGATTGTGGGGGAGGGACCAGAATCCGGAGGTTTGGGAGCAGAGCGCCCCTGTACTGAGCCCTGAGCTCTCAGGACTCGGCAAACCTCCCCTCATGACAGCCTCACGGCTACCCTGTGAGCCTGGGGGCTGTTGCCCATCTCAGGGATGAGCGAGGTGAGGCTGCAGTTAGGCCACGGCTCCCGGTGCCGAAGACTGGTGAAGCAGCAGAGCTTCCTGAAGGCAGGGCTGCATTAGGTCTGTCTGACTGGACCTCAGCCTCCCCCGGTGAGTTTGCCCGTGGAGGGAGAATGAAGTCAGGACCCTCCACGTCAGCAAGCACCTCAGTAGCCGCAGCAGCCCCTTCCTGCCTGAGGCTTCGGCCTCCCCCACTGTCTTCCGAGAGGGTGGTGCTGCAGGGTCCCGACCTGTAGCCAGTCCATCTGCCCCATGTCCTCCTTTCTCTGGACCCCAGAGCCTGGCCTACATCCCAGGCCCGCTATCTGTGTATGCACGGCCCCCTCATGGGTCCTGGCCATGGTGCAGCATGAGAAGGGATGGGAATCAAGTGCTCCTAAGAACCAGGGGCCTCATTCTGATGGACTTTGTCTGCTTTCCAGGGGAATGAGATCAACGACCACAAAAGAAATAAGAATGCAGTGCAAGACCCATCCCATTAGGAGATGGGGACAGACGCATGGCATCCAGGAGAACTTCCCGGAGGAGAGGCTACTGATATTCACCTCTGAGAA
>XM_012612283.2 PREDICTED: Gossypium raimondii prefoldin subunit 5 (LOC105786035), transcript variant X1, mRNA 
AATAATAGGAACATAAACAAACCACACAATTTGAAAGAATTCAAAACCAAACAAACAAATAAATAAAATAACGAAACTAAACAAATAAAATAACAACCCAACATTGAGCAGGCATCCACTTTCCCTTTCCATGGGCAATCAGCAACACCATGGAATCCAAAACGGCAACCTATGTTCCTAGCCAACATCATACCGTTCATCTCCCCTGATCTCAACCGAAACCCCCCAAACATTGTCGAACACTCAAAGAATTTAGCAACCCATCACCACCTCAAAAGTAACCCACCGGTCTTCGTACCCCCACCCTAGATAGTAGTAGCCCTCAATACCCTTCCCCCCTTCAAACCCCATTAAAGTTTCTTGCGATGCCATCAGAGAACATCTCCACCATTTCTTCCCCCAACTGTCATTCGCGCCGATCGTTGTCCATCGCATCCCTCGCAAAGTCCAACACACACCCTTCCAGATAAGTGCTCCCACCTCTCATCAACCCCTCTGTTGATAGTATATGTGCAACTCTATTCGCATCCCTGGGAACATGTCTAAATGAGCATCTTGTGAAGCCTTCTATTTTTTTCTTTGCATCGTATATATAAGCCCCTATAACCGGCCCATCTTCATTGCAGGACCTCATCTTTTTTATCACTGACAAGGCGTCCCCTTCTACCATCACCTATTGAATCCCTAAATCTATCCCCAAACTTACTGCCTGAAGACATGCAAGGGCCTCTGCTGCAAAACTCGTAGGGAAGAAAATGTCGGTTCCTCTCACTGCTTCCCTTTATGTTCCTGGCACACTCGATGATGCCGACAAAGTTCTTGCCGATATCCGCACCGGATACTTCGTTGAGAAAACAATGGATGAAGGCAGAAATTATTGCGAGCGTAAGATCAACTTAGTGAAATCCAATTTCGATCTACTTAATGAGGTTCTTTCCAGCAACTCGAGCAACCGAATTAAGAAAAGATATTTTCAAAATATGACAAAAGGAGACTGAATATGACTTCTGGGAACGATACAAGAAGTTATGTGCAATCTGCCTACAACACGACCTAACTGAACAATCATTTCTTCAATACTTCTATGACGGGTTACTTTGTATGAAAATGAAGATAATTGATGTCACCAATAGAGGGGCACCTGTTGGCATGACTCCTCAAAGAATAAGGGAATTAAT
>XR_008246896.1 PREDICTED: Vigna angularis uncharacterized LOC128195426 (LOC128195426), ncRNA 
TTCAGTGGAATGAAGGTTTCATTCATGCATGATGTTGTTTGTGGATGGTTTTGCTTATGTATGAAATGTCTCCCAAGTGCATTTTGTTGTGTTACTGATTTGTATACTTGTTGTTTGCTTAATCTTACATTGTTGTTGTAATTTTTTTCGATTGGTAGTCATGGACCGCGTTGGCCTTGCTGTGAAAAAAAACAAGCCACCTCAAAATGAGAGTGGTGAACCTAGTTGGCCTTGCTGTGAAAAAACTTGAACCCAATTACCCAGTTCATTCGGCTTTGGTACGAGTTATGTTGGTGAAGCCAGGGTCCTAGAAAATGTATTTTTATGTGACACGAATGTTAAGAAATTGTTCCCAGATTACTTAGAAGTAGCTGAAACGAGGGAAAACAAACAAGGCACCCCAAAATGAGAGTGGTGGACGTAGTTGGCCTTGGTGTGCAAAAATTGGAACCCAGGAAGAACTACAACAAGTTAGGGAGCAATATGTTTGTCAATGGATTTTGGATGTGGACAACGTGCGGAGGAATCAAGTGTTGGAAGATTTAGGCATTTTGTAGAATGTTGGAGATTATTGATGAAAGAAAACTTGTTACTTTTCATATTTATGTATTGGTTGGACATCAAATCTGATTTCAGAAATTGTTGAGAAATATATTTGGCAGTTGAAATTCA
>XM_017185738.1 PREDICTED: Drosophila ficusphila calphotin (LOC108088083), mRNA 
CAACGAGTAGTCGGTCGCTGTGAAGAACTATTTTACTGTTCGATGTCTACTGACCATGAAAGGCTGACCATGAAAATTTGCGTTCACTAATCACCGGATAAGTGAAAAGCTCCGCAAAAGGGCAAACGAGTTTAACCGTGAGAGAGGCCTGAAACTAGAAGGACATGGAACCTGCAGCGGCACCAGCACCTGCTTCTGCCCCAGTGGCAACGCCTGTGGCCCATGCAGCAGCAGCTCCTCCTGTGCAAGTTGCTAGCCCCGTGGCAGTGGCTCCTGCAGCACCGTCGCCGGTCGTTGCAACACCAATTCCTGCTGCTCCCCCCACTGCGAGTGTTCAGACAGTTACTGCTCCTCCTGCTGCTGCTCCCCCTCCTGCTGCTCCGGTTGCTGCTGCTCCTGCCCCGGTTGCTGCCACTCCCGTTGCTGCTGCTCCAACCCCGGTTGCTGCCACTGCAGTTCCTGCTGCCCCCGCTCCGGTTGCTGCCACTCCTGTCGCTGCTCCTGCAGCTGCATCTCCTGCTGTTGCAACTCCCGTCGCTCCAGTGGCGCCACCTGTTGTTGCAGCTCCCGTCGCTCCAGTGGCCACTCCTATTGCAGCAACAGCAGCTCCTGCTGCAGTGGCGTCAGAGCCTCCGGCTCCTGTAACTCCTGTGATCGCTGCTCCTCCTGTTGCAGTTGCTCCTGTGATCGCAACACCACCTGCTGCGGTTGCTGCGATTCCGGTGGCAGTTGTTGAGACACCAGTCGCTGTTGCTCCTGTGATCGCAACACTACCCGTTCCTGAGACTCCAGTTGCTGTTGCTCCTGTTATCGCTGCATCACCGGTTCTAGTCGCTGAAACACCAGTTAGTGTTGCTCCCGTGATCGCTACACCACCAGTTGCTGCGACTCCAGTTGCTGTTGCTGCCGAACCTGTTGCTGTCGCAGAGACTCCAGTTCCTGCGACTCCTGTTGCTGTTGCTCCAGTCATAGCTGCATCACCAGTTGCAACCCCGGTGGCAGTTGTCGAAACACCGGTAGCTGTTGCTCCTGTAATCGCTGCGACGCCAGTTGATGTTGCTCCGGTCATCGCTGCGTCACCAGTTGTTGTTGCGGAAGCTACTGTGGCTCCTGCTGCTGCTCCTGAGATCGCAACCCCACCTGTTGCTGTTTCTGAAACTCCGGTTGCTGTTTCACAGTCTGAAGCGCCTCCTGTTGCTGCAACACCGACACCTGCACCAGAAGCCCCTGCCCCGATTGCACCAACTGTGGAATCTCCAGTTATTGCAGCCCCTGCAGCAGATATTGCTCCTGTCGCTGCTCCAGTTATCGTCGACACTCCTGTTGTCGTGGCCGCACCAACACCTGCAGCAGCAGAAGCGGCTGTCATTGCACCACCAGCTGTTGTGGAGATCGCAGTTGCTGCTCCTGTGGCTGTCACACCGGAAGTTGCTGTTCCTGAGACTCCTGCTATCGAAGCTGCCACTGTTGCACCAGAACCAGTTGCTGTTGCACCACCAGAAGCTGAACCAGCTCCCGCTGCACCAGCGGCTGTTGCAATTGAGAGTGCTCAGCCAGCTACAGTTCCAGAACCAGTTCCTCCAGAGCCAGCAGCTGCAACCGTTTCCGAGCCAGTTCCTCCAGAGCCAATTGCTACACCAGTTCCCGAACCAGTTCCTCCAGAGCCAGCTGCCACAACAGTGGAAGCTCCAGCTCCAGTTCCGGAAACTCCTATAGTCTCTGTGCCATCGGTTGAAACACCTGCAGCTATACCAGACACACCATCCCCTGCACCAATTCCACAAGTTTCAGCCGCAGTTCCAGAGCCGATACCCACACCAGAACCAATCGTTGTCACTCCTGTGGATCCTTTACCAGTGGAGACTCCAGCTGCGAGCCAGGACCCACCAATTGCCAAAGAGGAACCACCAGCAGAAGCACCAGTTTCTGTGGCAGCAGAGATCCCACCAGATCCACCAGTTGTTAATGAAGAACCAACAGTTGCTCCTGTGACAGCAGAAGTTCCGCCGGAAACTGTTACAGAGGTTTCCGCTCCGGCCGAGGATGCTGTTCCGATCGCAGCTCCTACAACGACATTGGAAGCAGATACTACTACAATCGCAGAAGCTTCACCTGCGTCTGAACTTGCAACACCTGAAGTTGAAGCCGTTGCTGCGGCCGTCGCCGATCCCGTCGCACCTGCACCAATTCCGGAACCAGCCGCGCCGATCCCCGAACCAACGGTTCCTGAACCAACCGTTGCAGCTGCTGAACCAGAACCAGAAAAAGCGGAAGTCAGTGAGCAAACTGTTCCAGCAGCGGAAGAGATTACTGTATCTGAAGTAACAGAGACGGCTACAAAACCTGTAGAGGATATAGTTCAAGAGAGTACCAATGTAATTGACGAAGCAACTCCAACCACAACTGAGTCCGCAGTTATAGTTTCTGGAGAAGTATTGGAAAAACCTCCAGCAGAAGAAGTGGTTGCAGTAGAGTCTGGTCCTGAGGTTGTGGCCTCAGTAGTAGAAACTATTGAAGCTCCAGCTGCAGTAGAAACCACCGAAACTTCGCCAGAACCAGTGATTTCAGAAACACCTGTTGTTGCAGCTGAAGAGCCAACTGCAGAATCAGTAGAAACTATAACCAGTGGTGCGGCAGGTACTTCTGAAGAAAAACCAACAGAAGAGGTTCCCGCAGATCCTAGTTCCGTTCCCGTGGCAAAGATAACGCCCCTGCTGAGGGACCTTCAGACCACCGATGTTTCGCTGTTGGCCATCGCGGCCACTTTGGATGCAATTGGAGAAAAACTTAAGGACCAAAAGGCCAGAAACCAGCAGGTGATGGACAGACTCTGCGAGATCGAGAAAATTCTTGGACCACCTAAATCAAATTAGCTTAAGCTGAAGGAATAATTCATGGTAATGTTAAACTAAAATATCAGTCGAAAATATAAAAATTAACATTGAAATAAACTTATCAGTTTAAATTTCA
>XM_043518673.1 PREDICTED: Dermochelys coriacea RNA-binding protein 14-like (LOC119858569), transcript variant X5, mRNA 
GCTAGGGCGGGTCTCGCGGATTGTGACGGATGCAAAACAAAGGTTACAGGCGGTTGGGGCTCAAGTGCGCCCGCGCAACGACGTTGCTAGGAGAAGAGCGGAGGCGCGGATACAGAGGCAGGAGTGCGCAAGACAACAGTAGCACGCAGGCGCGGCATTAGCCGAGGGTCTCTCTTCGCAGGCGCAGTTGCTCGTAGGCGGTGGCAGGTAGCGCGCTGCGCAGGCGTGTCGACGGCTGGGTGGTTCCTTCCTCTTTCCTTCCTATCTGAGCGTTCGGAGGGTGTGAGGTGCTGCCGCCATTTTGTCAGGAGTCCCGGTGCCAGCTCGGCCGCGGCCATGCGTCCTGGAGTGAAGCTGTTCGTGGGGAACGTGCCCGAGGAGGCCACGGCCGAGGAGCTGGGCGAACTGTTCACGGGCGCGGTAGGCCCGGTGCTCGGCGTGGCCCTCATGAAGCAGTTCGCCTTCGTGCACCTGCGGGATGAGGCGGCCGCTGTCCGCGCCATCTCCCAGCTCAACGGGCACCAGCTGCATGGCCGCCGCATCGTGGTGGAGCCGTCCCGCCCGCGGCCCACCAACACCTGCAAGATCTTCGTGGGTAACGTTTCGGCGGCCTGCACCAGTGGAGAGCTGCGTGCGCTCTTCCAGCAGTACGGGCCCGTGGTGGAGTGCGACGTGGTGAAAGGAGACACAATCATGGAACAGGGGTTGGTACTCCTTTCCATTGCACCTGCAGAGCTGTTTCAGGTGATATGGACCTGCCACCAGATGCAACATGGGTGGTTGATAACAGTCCAATATGGTGTAATCTGCACAGCCAACTCAAGTGTGTTGAGATGTTTGCTGACTTCTTGAGAGACTTTGAGATTTATTCTTCAACTTTTTTTAGCTGCCTAGATCTGAGCAAGTCATTGTGATTCGTATTGCACTACTCTATTTGGACTAGGGATGTGGGAAATTCTTCATCAGTTGGAGTCTCTATGTTGAAATT
>AY571475.1 Uncultured bacterium clone RsaHf359 16S ribosomal RNA gene, partial sequence 
ACCTTACCTGGGTTTGACATGGTAGTGAATGGTGCAGAGATGTATCAGTCCCGCAAGGGACGCTATCACAGGTGCTGCATGGCTGTCGTCAGCTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTACTGCCAGTTACTAACAGGTAACGCTGAGGACTCTGGCGGAACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTATGTCCAGGGCTACACACGTGCTACAATGGACGGTACAACGTGACGCGAAACCGTGAGGTCATAGCGAAGCACAAAAAGCCGTCCGTAGTTCGGATTGAAGTCTGAAACCCGACTTCATGAAGTTGGAATCGCTAGTAATCGCGCATCAGCATGGCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATCCGAGTTGGAGGTACCCAAAGCCGGTAGCGTAACCGCAAGGAGCGCGCTGTCTAAGGTAAATTTAGTGAGGAGGGTGAAGTCGTAACAAGGTAACCGTA
>XM_017212262.2 PREDICTED: Drosophila eugracilis peripheral-type benzodiazepine receptor-associated protein 1 (LOC108105593), transcript variant X5, mRNA 
ATGGGGTTAACAGAGAGAACGGGGCTCTGTTAGTGGTTAACAGGGTAAAGTAATAGTAAATCGTAACTAACAGCCCCAGAGCATGAACTTACCCACTTGCAACCCCAAAGGAGCCCGTGAGCGGGAGAAAATTACCCGTTTTTCAGTGTCATTTCACAGAAAAATCGATTCCCCGCACACTGGGTACTGGGCATTGGGTTCTGGGTTCTCTGGGCCACTCTGCTCTGGCACACTGAGCACCGAGCTCTGGCAGTTGGGTAGAAATCAGAGTACAAACCAGCAGCGCGACCGAGATGACCCACTTTTCGGTTTTCGCACTGAGACCCAACTGCTACCCACAGAAAGTGGACAACTAGGCGGAGTTTTTTTCTATATAAGTAGCAGTTTAAACGATCGCGTTTTTCGGATAATTATGTACAGCCTACGTAGCCTAGTGTAAACTCTATGCATTTATGTGAATTTCCCAGCGCAAACGTGGAAGACGAAAACAGGCGACCTGAAAAAGCAGCAGCAGCAGCAGCAGCAGCGAGCAAGAAGCAGAAGCACAAGCAGCAAAAAAGTCGTCCGAGGGGCAGCCACAGCATGCCGTACGAGTCGATGCACCATCATCAGTCGGCGGCCGCTGCCGTGGCCGCTGGCACAGCCCCCAACGGAATGCTGGACGCCCTCAGTCTGCAGCTGCGCGATGCGGAAATGCGGCGCACAGAGATCGAGCGGGCGCATCAGGAAACCCTGGCACAAATACGAAATCTAAGCGGAAGCGCACGTCCCGATGCCGAGGCGGTTGAGAATCTGCAGTCGAGAGCCCGGGAACTGGAAAAGAAGGTTGCGCTGGAAAATGTGCGCTGCGAGGAGCTGCAAATCGAACTGACCTCGGCTCTGAAGGCCAAACAGGCGTCCCGCTCGGTCTGCTCTGGAATGGTCGGCGTGTCCTCCGGAGGCGGAGCCACCATTCCTACATCAGCCAGCAGCTCCACCGTCACTTGGGCACCGACAATCAGTCACCAGGACCAAGGCTCCGAGATTGATATCATAATGGCAAAGATTGAGCAGGATAATCGCGTGCTGGCCGAGCTGGAGCAGCCTCGCACCTCGGCCAGCGCCAGCATGTCAGCATTGCCGCCCAGTTCCATGTTGAGCACGGTAAATAGCGAATTTAGAACCATATCAAAGAGTGAACTCGAAGAAGAACTGAACCGTTATAAAAGGGCCGTTCTTGGCGGAAGTGGCGGAGGTGGTGGCGTTTCAGCTCTCTCCTCCGGCTATTCAAGCCTGCCGCAGTCGTTGGCCTCTACGCTGCCCAATGGCGGGGCAAGCACCAGCCTAAGCGGTACCAGCCTTGGCTCGCACAGCGTGGCCGCTGCTGCTGCCGTTGCCTCTGCTGGATCGGGGGGTGTGACTGGGGGTGGTGGAACGGGAGGTTTATCATCCATATCGGCCCTGGTGCCCAACTCAATCAGCGGCATATCCTCGAGTCTAAGCAGCCATGCCATACAATCGATGCAGTACGGAACCGGACAAACGTCCGTGGAGAAGCTGCTGAGCGGAACTAGTGGAATCACTGGGATTCCACCTCTGCCGGTAAATATTCACACGATGAAGGCTATGCCAACGGCATTAAGTCAGCGCGGAACAATACAGCTGTACAATTTGCAGAGCACAACCATGCCCCTCCTGTCACTCAACTCGCATAACCTGCCGCCCGCCGGCTCGACCAGCTACTCGGCCCTGGGCGCCGGCGGCGGCACCTCGCTGACGCATCCAACCAATCTGGCCAATCTTGGCCTGCTGGACACTGGCGCCCTCTTGGGTGCCACCGGTCTGAGCGGTTTGGGCGTGGGACCCGGTGCCGGTGGCATTACCGGTGCCACATCACTATACGGTTTGAGCGGCGGCGGAGGTGCCAGTGGTCTGGGCAGCTCCTATGGTCCGCCCTTCCTGGACGTCGCCTCGAGCGCCTCGTATCCATTCACTGCGGCAGCCCTGAGACAGGCTTCCAAAATGAAGATGCTAGACGAGATCGATATACCGTTGACGCGGTATAACCGCAGCTCGCCCTGCTCACCCATACCGCCCAGCAATTGGGGACTGGACGAGTTCACCGACGGCCTCAGTGTCTCCATGATGCACAACCGCGGCGGCCTGGCACTGGGTGCCCTTGACTTGGACACTCGCAATCATGGGTTAAATGGAGCCAGTGAACCGCAGGTGGATATGCTGGATATTCCTGGAAAGGGGCGCTGCTGTGTGTTCATAGCCCGTTTTCCATATGATCCGCCAGATGTTCATAATGAATTCCTTTCCATGCCTTGCAGGGAGGCTGAGGGCGAGCTCTCCCTGTGCGCCGGCGACTATCTGCTGGTGTGGACCAGCGGGGAGCCACAAGGTGGCTACCTGGATGCCGAACTACTGGACGGACGACGCGGCCTTGTTCCGGCCTCTTTTGTGCAGCGTTTAGTAGGCGACGACCTCCTGGAGTTCCATCAGGCGGTGCTGTCGACGCTGCGCGATGCCGAGGACGGATCGATGCAGTGCGACACCACATCGCTACCCTCCTTGCCGCCGCACAACCCATTGCTCACACACACCCACGAGGACCTGGCACGTTTGAGTGAGACGCACACCGATCTGGAGCACGACCAGGACGACATTAGCGACAATGTTCCAGCACCCAAGCACTTGACGCTGGAACGGCAGCTGAACAAGAGCGTGCTCATTGGCTGGTCACCGCCGGAGCCAGTGGGCTACAACCTCATCGACAGCTACCACGTCTACGTGGACGGCGTGCTCAAGGTCACCGTGAAGGCCAACGAACGCACACGAGCGCTTATCGAGGGCGTTGACTCCACGCGGCCGCATCGCATCAGCGTGCGGAGCGTGACTCAAAACCGACAGACCTCGAGGGATGCCGCCTGCACGATGATCATTGGGCGGGATACCGCCCACCTGGGCCCCTCGGCGGTGCGCGCTTCGCACATAACGTGTTCCTCGGCGGTCATCTCATGGCTGCCGGCCAACTCCAATCACCAGCATGTGGTGTGTGTGAACAATGTGGAGGTGCGCACCGTCAAGCCGGGCATGTACAGGCACACGATCACGGGCTTGGCGCCGAGCACCCAATACCGGGTGACCGTGCGTGCCAAGCACCTGCGGGCCGTGGGCCAACATGCCGCGAACGTGGGCCAAACAGGTGTAGCCGGCAGACCTGGTCAGGAAGAGGCGCCCGGAGCGTACGCTGACTTCCGTACCCTGACCAAGGGACTGCCCGATCCGCCACAGGAGATTCAACTAGAGGCCGGCCCGCAGGATGGTACCATTCTGGTGACATGGCAGCCGGTTAACAGGCCCACCTCGACGGGGCCTGTAACCGGCTATGCTGTGTATGCCGATGGTAAAAAGGTCACCGATATCAACTCGCCCACCGGTGACCATGCCCTCATCGACATTGGCAAACTGGGTGTCTTTAATCCACGCGCCGTCACCATTCGCACCAAATCCCGCGACTCCCAGTCGGCAGACAGTGCGCCCATCTTGATACCAAATACCGTGCGAAATGCCGTGGCCCGAAGGGTGCCTAACCAAATGGGCATGGGTCCACAGTTGCCGCAGGGACCGCATGGGATGCAGGTGCAGCAGCAGATGGGTGGAATGCCTGGACTGCCGGGTCAACAAGGTCAGAATATGATGGGTCAGCAGGATCATGGCCAGTACGATCCCAATCAGATGCAGCAGCAGCAGCAGGGCATGCAACCGCAGCCGGGTCAGCCGGGTCATCAGGGCTATCAACCAGGGGCACCAGGAGCGCAGCGGGGCATGGTCCCGATTCCGGGCAGGGCGCAGGGACCACAGCAACAGCAGCAGCAACAGCCCTACGGACCCCAGGGTTCCATGGGTGGGCCACGCTTTCGAGGACCAGTTCCGGGCCAGCTTAATATGCAGGGCCAGCAAATGCAGGGTCAAATGCAGGGTCAGATGCAAGGTCAGATGGCGGGTCAAATGCCTGGACAGATGCCTGGACAGATGTCTGGTCAAATGCCTGGTCAAATGCCTGGACAGATGCCCGGACAAATGCCCGGACAAATGCCCGGACAAATGCCCGGACAAATGCCTGGCCAGATGATGGGACCACGAGGACCGCTCAATCAGCAGCAGCAACAACAGCAGCAGCAGCAGATGCAGCAGGGCCAACAGATGATGCCAGGCCAACAGCCTGGACAACAGCAGACACAACCCGGACAGCCGGGTCAGGCCGGCCAAATGCCCGGGGCCCAGAAGAAACCCCGCTATTTCGTGGCCATGTTTGACTATGACCCATCCACGATGAGTCCCAATCCCGATGGCTGCGACGAAGAGCTGCCCTTCCAGGAGGGCGATACGATCAAGGTATTTGGTGATAAGGATGCCGATGGCTTCTACTGGGGCGAACTGCGTGGTCGCAGGGGATATGTACCGCACAACATGGTCTCGGAGGTGGAGGACACTACTGCCTCTTTGACAGCCGGCGGACAGATGCCCGGCCAGATGGGCCAGGGTCAGGGTGTCGGCGTGGGTGGTACTGCCCAGGTGATGCCCGGCCAGGGAGCTCCGCAGCAGAGCATGCGCAACGTAAGCCGCGACCGCTGGGGCGACATCTATGCCAATATGCCGGTGAAGCGGATGATCGCGCTCTACGACTACGATCCCCAGGAGTTGAGTCCCAATGTGGATGCCGAGCAAGTGGAATTGTGTTTCAAGACGGGCGAAATCATACTCGTTTACGGTGATATGGATGAAGACGGTTTCTACATGGGCGAACTGGACGGCGTGCGCGGCCTGGTGCCGTCGAACTTCCTGGCCGATGCGCCCGATCAGTACAACAACCAGATGGGTCCGGGCGGTGTGGCCGGCAGAGGTGGTCTCAGCCAGCGGGGCAGGGGTCAGGGGCCAGGAGCGAGGGGTCCACCGCCCCCGCCACGTGACAACATGATGCCCGGAATGGGCGGTCGCGGCCAACCGGGCAAAAATGCTCGCCCTGCTTCCCCTACACTGTTAGACAACACGGGCCATCCTGCCCCCGATCACCAAACGCAGGGGATGATCGGTCGCGTTGGTAATGTCGGCCTGCAGCAGCAGCAGCAGCAACAGCAGCAGCAGCAGCAACTCCAACAGCAGCAGCAGCCGTATGGTCAGCAACAGACGCAGATGGGACAGCAGCAGCAGCAACAACAGCAAATGGGACAACCTGGAATGATGGGTCAGCAGATGGGTCAGCCGATGGGTCAGCAGATGGGCCAGCAGATGGGACAGATGGGTCAAATGGGTCAGATGGGTCAACAGCAGCAACAGCAGCAACCGCCGGTAACGACACAGGCGCAAACGGGTGGCCTCTTCTCCGGTGCGACTAGCCTGCTCTCTGGTGCTACCTCGGCTGCCACCGGTGGTCTATTTGGGTCGAAGCAACCGCCCAAGACGGATCCAATGCAACCACAAGGTGGTGTGCAGCCAGCGCAGCAACAAGCAAATGCCTTCGGTGCCCAGCAGCCCGGCATGGGTATGCAGCAGGGGGGAATGCAGCAGGGGATGCAGCAGGGGATGCAGCAGGGTATGCAACAGGGGATGCAACAGGGGATGCAACAACCGGGCATGCAACCCGGTATGCAACAGGGTATGCAACCCGGTATGCAACAGCAGCAGCCACAGCAACAACAAGTGCCACCGCAAGCCCAGGCTCCGCCACAAGGACCGGGCGCCGGTCTGCTGGGCGGCCTTAAGGGTATCGCGGCAGCGGCGCCCGGCGGCGATGTCCTATCGAAAGGCAAAGACCTCTTCGGAAAATTCGGGTTCGGCTTTGGCAAATAACCCCGGTCATTCTATAGGGTCCTGTTATATTATTCGTAGATTAGACTTATTATTACTATTATGATTATGATTATTGCTATTGATTACGGATTACTAAGCTAATATATAAAGAAAAAAAAAAACACAGACGATGATGATTAGATCGAGGAGGACAGACAAACCAATGCTAAAGTTAAAAGAAAAACCCATACTTTTAGGCCCAGGCTGTGGGCCAATGTGTGTATGTTGTTGTTGTTGTTGTTGATATGAATATGATATGATATGACTAATAGTACTAATGGTAATATTTTTTATTAATTAAATTGATAGAAATATTATGAGTGACCGACAGACAACAGCAGCATCGGCCTAACAGCTGGGCCAAAAAAAACCAAAAACAACAAAAAGCCACAAGCCCAGATAAATTGTTGTAAAATTATTTAACAAATTGCCTGCCGGTTTAGGTGACTGCAACTCGATAAAAGATTCCACTAACCCATTTAAAGGATAAAGCTCTATATAATGCATAAACCAACACACACACACACACTGAGACACATACAGATGCAATACACACTCACATAGATACTGAGAACACAGATATATTATACAAAAAAAAAAAAGAAAAACCAATACAAATACAAAAGTAAGGGAGGAGAAATATATTATATACATACATTATATTTACAATTATTTGTTAACGCACATTGTTAAATTTGCTACTGTTGCTGACCAGTTTATAAATAAAAACCAAACCGGATGGTAAGGAGGAGAAGAGAAAAGGAGTATAGAGGAGAGAAGATAAAGCAAACACATAAGGTAAACTAAAACCAAAAAAAAACATAAACATAAACATACATATATTATATGTATATATTTCAAATATATTGAAAACTAAATTGAGATACACTATAAAACTTACATTTATAAATCAAAAAACAAAAACAAAAACACAACCGAATGTTGAGCAATGTCAGGCAGGCGAAATGATGAGGCCGAACCAAAAAACAAAAAACCAAAAAAAAAAAACAAAAATATAAATAATGAAGAAGAAGACGATACATACATTAAAGTAAAATAAATAAATCGATATGGTACATATTTACATATATTCGCATATACTAAATACGATTTCGCATTCAAAAGCCAACCTCCAATCGGGCGCATTTCCAAGACAAGGCGACCTTGACTTCCAGTCCAGCACAAGAAGCTAACTTTAATCCCTTGAACATCCCCACCCCCCATGCCTTCTTTTCAATCCAGTGATAGCCGAAGCCAAAATTTCTATCTCTTAATTCCTAGTAAAAACTTTCCCCCCTTTTCTCACGACTGCTCGACTCAAAAACTTCTCTTTATTCTATGCAACCGAAAGAAATTTTGTTCAGTGTTTGATGTCCATAGAAGCCATATGCGATAAAATATCAGTGTAACTTAAAGCAAACCAAAGACCAAGAGAGAGATCTACTCCTACATACATATATATATATATATATATATATATATATATGGGATACCCAACAAAATGGCAAATACAAAGCAAATATAATGTACTAAGCACAAGATCGTAGCATTAGACCCTGGAGACATGTTCACTAAATTCAGCAAAAAGGAGACTTTTCCACAACCTTCTTTAGCCACTTAAGCCGCCGCCCCTATTGCTTTTCTTACCAACTTTCTATCGCTATCTAACCCTAACTTTTACCTAACCAAAAGTACACATACCTTTTCGATTGTTATTTTAAATACTACCAATTAACAGATAGTTAGTTACTCGCCTATGCCGCATACTTACGACTACTTCTGTTCTCCTCTCGTGGAAACTTTATGCTTTATTATCCGATACGATCCGATCCGAGAGAGAGAATGAAAATTTGCAGATAGTCAAGGTGTTTCCTAATGTTTGAAAATTGCTTTGACTCAGCCCTCATGATACACACTCAGCATAACACAGACAAATACATTGCGTACCTCTTGCTTTACGAAAATACAAAATACATTCAAGAAATGGAAAGTATAAAGATAACAAAAACCAAAAAAAAACAATTATATTAATGACAAAATTTACCAAACAAATATATTAAACAAGGCATATTTAAAGAGCGCATAGAGAGTTGCATATGTACATGTGCTTGGCCGGCAAACAAGACAACATAATTGTGAGCAAATGATTACTTTAGACACACACACTTACCACAACTGATACATAGTTACACTGCAAAATGCAAATTGCAAATTGCAAACTGCAATACCGAACACTGTAAATTGTAAACTGGCAAAAACAAAAAACATATAGTAGAGAAGGGCTGTTATAGCCAGAAAATGTTGATCGAGAATGACTTACCGAAATCGAAACAAGCGTTAACTTTTCCCACGTAAACGATTTAAATCTAACAATCAAATCAAGTCACTGTATTATTCAGCCACATCGGATAGACAATTACAATCTACAAGCCTAACTTCGGCAACCACCGAAGCCGTGATGCCTACGTAAACCGGAAGATATATCATATTCGAATTTACAAGGGCACAGCGGAAATACACACACAAATACAAATACAAACAGCAGACAAACACACTTACACACACACTCTCTCTATAATCATTTACTAGACACCTACCTATACAAGTATACAAGAACAGTTTATTTCCTCGGAAACAAAGCGAACAATATAGAATAAATGAAATTAAATTCCCATTAAACACACACACTGGCAAAAAAAAAAATGATAATGGCAAAAAAACGAGTACTATGCAATATGAAATGGATAAAACAAAAACCAAAAAAACAAAAAAAATACAAATGAAAACCAACTAAATTGTTATACTGTATTATTATACTTTTTCTATAAATTATAATTTCCTTATTGAACGACAAAAAAGCGAAAAAAATAATAATTAAACAACAATTTCAAAGAAAAAAAAATCAAAAACGCAGCATTTCAATTGCCTTAATGAGGCGTTTCTTCAATTTCAGTGATATTACTCATACGACACGTA
>XR_003431942.1 PREDICTED: Lagenorhynchus obliquidens AVL9 cell migration associated (AVL9), transcript variant X2, misc_RNA 
CGGAAGCGGATGAGGGAAGCTCGGCTGCGGCCCGGGGGGGGCGGTGCAGAGCTGCAGGAGCCTCGGCCTCCTCCTCGGTCCCTGCGAGGCTCTCATGCGACGCCCTCGCTGACACCTGAAATCCACTGCTCGCCTCCTCCTGGGGGTCACGGGGTTGCTCGGCTTGCCGCCCTCGGCGGTTGCAGTCATCGTCTTGCGGGCCTGCGGCGGTCGCCCATGGAGAAAAACGGGCGCGGCGGCGATAGCGCCCCCCGTGGGCCCGTATTGCACATCGCGGTGGTCGGCTTTCATCACAAGAAGGGCTGCCAGGTTGAATTCTCTTACCCGCCCCTGATTCCAGGAGATGGACATGACAGTCACACTTTACCTGAAGAATGGAAGTATTTGCCCTTCCTTGCCTTACCAGATGGCGCACACAACTACCAAGAAGATACTGTGTTTTTTCACTTGCCACCCAGAAATGGAAATGGAGCCACTGTATATGGTATCTCTTGCTATCGACAAATTGAAGCCAAGGCATTGAAGGTACGGCAAGCAGATATCACCAGAGAGACCGTTCAGAAAAGTGTCTGTGTTCTAAGCAAGCTGCCTCTCTATGGCTTACTTCAAGCAAAACTTCAACTCATTACGCATGCATATTTTGAAGAGAAGGATTTTTCCCAAATTTCCATTCTAAAGGAGCTCTATGAACATATGAATAGTTCCCTGGGAGGAACTTCATTAGAAGGATCCCAGGTATATCTTGGTTTATCTCCTCGAGATCTTGTGCTTCATTTTCGACACAAGGTCCTAATCCTGTTTAAACTAATTCTTCTTGAAAAGAAGGTTCTCTTTTATATTTCTCCAGTGAATAAATTGGTGGGTGCCCTGATGACAGTGTTATCCCTTTTTCCAGGCATGATTGAACATGGTCTCAGTGATAGTTCTCAATATAGACCCCGAAAGAGTATGTCTGAAGATGTTGGGCTTCAAGAAAGTAATCCCACTGAAGATGAGTTTGTTTCTATGCCTGCTCCTGACATTTCAAATACCAACTTGGAAACTGTTGAGAAAATCATGATGAGAAACCATGGAAGAGATGCTGCCATGAAGACTGAAGAGCCTTTTTTCCAGGTAGATGATGACAGCAGTGAAGGACAGGAACCCAATGACAGCAATCAATATTTGAAACCTCCTTCTCGCCCATCTCCAGAGTCTTCAGAAAGTGACTGGGAGACCTTGGATCCTAGTGTCTTAGAGGACTCCTCCTTGAAAGAAAGAGAACAGGTGGGATCAGAACAGACAAACTCATTTCTAAAGGACTCTTTGCCCTCAGACAGTCCTCCGATTACTGTACAACCTCAAGCTAACACAGGCCAGGTAGTCCTGATACCAGGGATAATTTCTGGTTTGGAAGAGGACCAGTATGGCATGCCCCTGGCCATCTTCACAAAGGGATATCTGTGTTTGCCTTATATGGCATTGCAGCAGCACCATCTTCTCTCTGATGTCACCATTCGAGGATTTGTTGCTGGAGCTACTAACATCCTTTTTCGACAACAGAAACACCTCAGTGATGCCATTGTGGAAGTAGAAGAAGCTCTGATCCAGATCCATGATCCAGAACTCAGGAAGCTGCTTAACCCAACCACTGCAGACCTAAGGTTCGCAGATTACCTAGTGAGGCATGTGACCGAGAACCGAGATGATGTCTTCCTGGATGGCACGGGCTGGGAGGGAGGTGACGAATGGATTCGAGCCCAGTTTGCAGTCTACATCCATGCACTGCTGGCCGCCACGCTGCAGTTAGATAATGAAAAGATCTTATCAGACTATGGGACGACCTTTGTTACAGCATGGAAGAACACTCACAACTACAGGGTCTGGAACAGCAACAAGCATCCAGCACTTGCAGAAATAAATCCAAACCATCCTTTCCAAGGCCAGTATTCAGTGTCAGACATGAAGTTAAGATTCTCACATTCTGTTCAAAACAGTGAACGTGGCAAAAAACTTGGAAACGTCATGGTCACAACGAGTCGGAATGTTGTGCAAACAGGAAAAGCTGTTGGCCAGTCAGTTGGAGGAGCTTTTTCCAGTGCAAAGACAGCCATGTCTTCATGGCTTTCTACTTTCACCAGTTCCACTCCACAGAGTCTCACTGAGCTGCCTGACGGGAAACCCTGAGCGGAGCAAGCCACCCAGAAGCTGCTGTCGCTTTCTTAGGTTTAAGCATCCCCTGTCTGTCTGCTGCTCCCAGACTGTTCCTCTTCATCGACCACAGGTCCACAGCAGGGACCAATAGGTCGAACTGTTTACAGGGACGGTTGCCCTCTGTGTAAATGAATGTCACGGGATGCTGAAAAGACGAAACCACAAGCGTAGCAGGGACGGCTTCCCAGTGGACTTGGCCTGTTTTTCTAGAAGTACCCTTCATGTTGTCAGTGTGGTTTCTGGCCTGCTTCACAGTTGGAGAGAAGGGCCAGCTTCGTTTATTAGGAAACCAGCGGAACTAAAGGACTCATTGCTCGTTTTTTTTTTTTTACTCTCTCATTTTGAAAATACTTGTGGTGCTTCAGTTTGTGAGGTGGTGACCCTCGCAGCAAGAATGTTTAGTGCCTGGGGCTGCACAAAGTACCACCAAACGGAGTTTGGTCGTGCAGTAACATCTTGTCACATGCTCACGGACAGAAATCCCCAGGGGACTAGGATATTGCCCCAAGCAACCCATTTTTCCATCCGTACTGGTGAGCTTCAGAATAACCTTGACATTTCCACTGAGGACTCCTAGCACATTTTCACATATGTATTTCCATGTACCATGGTTTCCTTATAGCTGTTTTGCAAAACAGCTTCACAGAAGAAGGAGACAAATTTCTTTGTTCCCAGGAATGTGCGCTGCCTTGAGTACAGGGTTAAATTTAAGGTACCAGTGTTCTTACAACGTGGACTGTTGCTGCCTGGAGCTGACAAGGTGACTCGGGCAGTAGAGCTCGACACCGCCAACATCTCCCTTTTCCGAGGACCTGTTCCAGCTGCACTTCAGGCTCTGCCGTGGTGAGGGGATGGTCCCCCATTGTCTCCCAGGTCAGAGCTGCCTTCTCTTCATTCTGATAGAATGGGAGTTGCAATGATCAAACCTGGCAACATCTGGAAAGAGCAGGATTATAGAGGCAGTTTCTTCCAAGGAACCACACTTTGTGAAGGGCTCATCTCCTCCTGTGGTAATCACAGGCTTAGGGAACCGCTCTGCAGCAGGACTGATCTGTCCAAGTTCACAATCGACAAATCCCCAGCGGAGCTTCCAGTCGCGTGACCGACAGCCAACTCCAGTCGAGGCAGCTAAGGTCTAGTCATCCAGCGCAGGTCCTGTGCAAAACTTTGCCTCAGCATGAGTTTTTGAAGACAGAGGAGGGAACCCAATTTTTTTTTACTTTGAAGGGCTGATGTTCTCCAAGTCTAGCAATCACATAAATGTCCGGTGTGTCCGGAACTGTCCTGGGCAGCCACAAGCCCTAAGGACTTTTAGCACCGAAGCAGAGACTCACACTGGCCTCCAGAGATCCAAGATGTGCACATCTTTGGCTACTTGCCCTGGGAAGTCACTTTCAGAACTAACCCATGTCCCTCACACTGCATTTTAAACCCTACCTTCTTCCCATCAAGTATTTGAGTGCCTACTGTGTACACACACAGTACATGCCACCCACATAGCAGGGGGAGAATGGATGGTTACCATAGTGGGTAAAGAGGCTGGGTCAAAGGTCAGCCCAGTGTGTTTGAGCAGGTGGCCAGCTCCTTTTTGGCAGGGGTGAGTAGATGTTTCTTCCCCTGAAGGCTAAGTGATAGTTTTAGGAGTGAGGTGGGTTTAGATACAAAGGGCTCCAGGACCTAGGAGAACAACATAGGCAAAGACTGGGAAGCAGTGAATGTTCTTTGGTGTGACTGGAACCTAAATGGCAAGGGGGGATGGGCAAGAGATGAGGCTGTAAGATAAGGCCAGGTTTGGAAAAAGAGATACCTGTCAGCCTGGCAGAGGGGGGGTGGACTTGATCTAAAAGGGCAGGGGAGAACCTTAAAGGGCTCTCCAAGGGCAAGTGGCAGGTTGGGTGCTGCATTTGAGAAAGTTCATTCTGGGTTGGGCACCACTGCATTTGCATGGCCATTAGCTCTAGTGATGTCTCTCTGAACTCAGCCATCACCGCCTTCCTTTTCCTCAAGGGCCCAATCTCTTAGCTTTGTACCAACTTTAAATCCCATTTGCCCCAAACAATGGGCCCCAGAACAAAACTCCTATGGACCCAGCCCTCAGTCAAAAACCAGTCACCCTGATGTCACCCTAAGAACTGTTTTCCTTTGATTTCTCCAGCCGTTAGACTAGCGGGGGTGGGGGGGTGGGGGCTTGTGAACGAGGAGCGGCTCTAAAGTGATTGTGGGCGGTGCCGGGAGAGCCCGGAGGACACTTAAGCATCTGCTGAGGTTACTCTTTTTGGCAAAGGGGAGACCCAAGAGACCCGTGCCGCCACCACCATGTTGATAAACCTGGGCGAAACTCACTGTTTCTTCCTAAAGTTTACAAGCAGGAAGGGAATGCTTCGTATGTTCTAAAAGTCCATCTGCAGTTAACATCCGGACTTTCATTTATATTCGATCTAATCCATGGAATTTTTATTCTGATCAGCGTTACCAGATGAGCCATGTGCACTGAGGAATGATTAGCCCAAAGTAGGACAGAAGAGAATCTGAAAAGTAGCCTTTCCACCTGCCCCCTGGCTCTGCCCTAGAAAACAGTCAGTCAGCAGCACTTCCTAGAAACCACGGAGACAGAAGTTACGCTGCACCGTCTTCAGCTGCAGGAATCCTGAATTGGTTCTTTGTACAAGATCATCCATGAAACGCCAAAGCCTCAGTGCCCTCGATAGATCATTCACTCCCACTAAATGCCTTAGAAATGGAAATTCCAGAGGAACTTGACCACCTGCTATATAGATGTCATTATCGGGAGTTACAACGGTTCCAACCTTATGTAAATCAGCTGGTGGGCTGCATAGCTTGTAAACTTTTTCTGCTTGGGGGCTGTAACAGACAGAAGA
>AB179100.1 Macaca fascicularis testis cDNA clone: QtsA-12801, similar to human tetratricopeptide repeat domain 3 (TTC3), mRNA, RefSeq: NM_003316.2 
CAGATGTAAAGTCTACACCAGTGTCAGATTCATCTTCAGCACCAGCTTCTGAAGATGTGAAACCCAAACCTGTGTCTGCAAATTCTCCTGAGCCAGCGTGTGAAGATGTGAGGGCCAAACCAGTAGCCGACAATTCTTCTAGACAAGTTTCTGAGGAAGGGAAACCCAAAGGGGCCTCTTCCAATTCTCCCACACCAGGCTCTGAGGATGCAAATTACAAGCGATTCTCCTCTAATTCCCCCAGACCGGTTCTTGAGGATGTGAAACCAACTTACTGGGCTCAATCCCATTTGTTCACAGGATACTGTACGTATCTTCCTTTCCAGAGATTTGATATCACCCAGACACCGGCAGCATACATAAACGTGTTACCAGGTTGGCCCCAGTACACCAGCATATATACACCCTTGGCCAGCCTTTCTCCTGAATATCAGCTACCAAGATCAGTACCAGTGGTGCCGTCTTTTGTAGCCAATGACAGAGCAGATAAAAATGCCGCTGCCTATTTTGAGGGTCATCATTTGAATGCTGAGAATGCTGTTGGTCACCAGATTGCCTCTGAAACACAGATCCTTGAAGACTCTTCGGGAATATCTGTAAAGTCACACTGCAGCACAGGGGATGCTCATACAGTCCTGAGTGAGTCTAACAGAAATGATGGGCACTGTGGAAATTCTAACAACAAATGTGAAGTAATTCCAGAAAGCATCAGTGCAGTAACAAACATTCCACACGTGCAGATGGTTGCCATACAGGTATCTTGGAACATAATACACCAAGAAGTCAATACTGAGCCATATAATCCTTTTGAGGAACAACAAGGGGAAATTTCACGGATTGAAAAGGAGCACCAGGTATTACAAGAGCAACTTAAAGAAGCATATGAAAATTATGAGCAGATGAAACTTAAGGGCTTAGAAGAGACCAGGGACCTGGAAGAAAAGTTGAAAAGGCACTTAGAAGAAAACAAGATCTCAAAGACGGAATTAGATTGGTTCCTTCAAGATTTGGAAAGAGAAATTAAAAAATGGCAGCAGGAAAAAAAAGAAATCCAAGAAAGACTAAAATCACTGAAGAAGAAAATTAAAAAAGTTTCAAATGCCAGTGAAATGTATACCCAGAAAAATGATGGAAAGGAAAAGGAACATGAATTACATCTGGATCAGTCCCTTGAAATCAGCAACACACTTACAAATGAGAAAATGAAAATAGAAGAGTGTATAAAGAAAGGAAAAGAGGATTATGAAGAGAGTCATCAGAGAGCTGTGGCTGCAGAGGTATCCGTACTTGAAAACTGGAAGGAGAGTGAAGTGTATAAGCTACAGATCATGGAGTCACAAGCAGAAGCCTATCTGAAGAAGCTGGAGCTGATTAGCTGTGATCCTGCAGCATATCCTGACATGGAGTCTGATATATGTTCATGGGAACTGTTTCTTTCTAATGTTACAAAAGAAATTGAGAAAGCAAAGTCTCAGTTTGAAGAACAAATTAAGGCAATTAAAAATGGTTCTCGTCTCAGTGAACTTTCTAAAGTGCAGATTTCCGAGCTTTCATTTCCTGCCTATAACACGATCTTTGCCTGGGCTGTTCCCAGCCTGGAACACCGTCCCCGCTCTGCATCCTGCCTTCCCCTGAAACCCCATCAGAGGCTGCCCTCTTTTGGCCTCCCACTGTGGCCCTTCTCTCACATGCATTAGATCTCAGCCTGGCCTTGAATGTCTCTTTCCCGCCAGTACCTTGCACAGTAAACATCCAAACTTACTGTGAATTCATCTGAAAAAAAAAAAAAAAATTAAGTATGGAAAAAGTGTGACCACCCTGAACTGAGTAAAATATTCTGTTGAGATCCAGTTTTTTTCTCTCCATTGAATGTGCAGTTTTAGTTAGAATTACACTAAAGGGCGGCCGGGCGCAGTGGCTCAAGCCTGTAATCCCAGCACTTTGGGAGGCCGAGACGGGTGGATCACGAGGTCAGGAGATCGAGACCATCCTGGCTAACACAGTGAAACCCCGTCTCTACTAAAAAATACAAAAAAACTAGCCGGGTGAGTTGGCGGGCGCCTGTAGTCCCAGCTATTCGGGGGGCTGAGGCAGGAGAATGGCGTAAACCCGGGAGGCGGAGCTTGTAGTGAACTGAGATCCGGCCACTGCACTCCAGCCCGGGTGACAGAGCGAGACTCCGTCTCAAAAAAAAAAAAAAAAAA
>XM_018370368.1 Pneumocystis carinii B80 hypothetical protein (T552_01802), mRNA 
CTTATTTTGCTTAAAACTAAATACATCTGGACACTTTTCTATCTTAATGGATGATATTTTGGATATTACAGTTCAATTTTCAGGAGGGTTACAGACCCTATTTGGTAACAAAAATACTCATCATATTCAAATATTACTATCCGATCCTGCTTTAAAAGGTAACCCTCCTAACATTGCTTATTTGATACAATTTTTATCTGAAAACCTCATGAATGATGCTCGAAAAAACTTTTTCATTAAAGATGATACTGTACGTCCTGGTATTCTTGTTCTTATAAATAATGAAGATTGGGAATTAAATGATGAAAAGTATTATATACTTCAACCTAAAGATGAAATTACTTTTATCAGCACATTACATGGAGGATAATTATAAATAAATAAATAAATATCTCTTGAAAATTATTTTATTA
>XM_028690088.1 Plasmodium gonderi protein phosphatase 2C domain containing protein (PGO_140940), partial mRNA 
ATGGGTAATTGTATGTCCATTATTAGTTATTCCAAATTCAAATTAAAAAAAAAAAAATTGGAGGATTCGGATGTGCATTCAAACCCAGATTACGAGAGCGCAACTGATAGCAATATCCGTGATAAAGATGAAAAAAACAGAAAAGGAAAAGACTTAAAGCATAATCCAAATTTAAACAATTCCAATTGCGATAAAAAAAGTTTTAATGTCATCCATGAACATGATACAAATTCCATATATTCAAGCAATCCTGGTAACTTTGATCAAAATGAGAAAGATGAACAAAAGCAGCCTGTTTCCAATGAGGACATTGGTTACCTACGAAGGGAAGAATCGGATCATCATATGATAATCCAGAAAAACAAAAAGAAGAACAAAAATAGTAACAATGTGATAGGAAATGACGAGATGAATCAAAACGAGGGAAACCAAAACGAGGTGAACCAAAACGAGGTGAACCCAAATGAAGTGAACCCAAATGAAGTGAACCCAAATGAAGTGAACCGAAACCAGGTAAACCAAAGCGAAGTAGACAGAACCAAGGTGACAAAAAAAACGAAAAAAGAAAAAAGCGAATCCAAATCTAATATAAATGGAAAAGTAAAACGGAGCACGTCCAAAGACAAAAATACAAAAGACATAATTCCCAATAGTACGCATAACGACAGAGATAATTCAAAATCAAACGAAACACATGATTATAAAGGAGATGTGTTTTCAAATAAGAATTCCTCATTTAATAGCGAATCAGTTAATAGCAAGGATTTGCAAAAAAGAAACAAAAGAGAGAACTTACTGAACATAAAATACAGCAATATGATATTAAATGATATAAGAGATGTAGACATTATTGTCGTTTTTTTATTTAGTCTTTTCCTTTATTTTAATGCCAATAATATAGTAGACATGTTGGATAGAAATAAAAAGGATAGATATTCTCTTAGGAATTCATTGAATATAAATCATGATATCATAAAATTCCCAACGTTTCCCAAAGAAATTATTGACAGTTTTTTGAAAAATGATTTTACTTTATTAAAAAAATATATAAAAAATAAATGTAATAAGTTGAAGAAGAAGTATAAAAGTACATATTTAAAAAAAGTCACAATAAGTAACGAAAAGGGTGAAAAAGTAGAAGCAGGAGAACAGAATCAAATCGGAAAAACAAATCAAAAGGATGAAAAAAACACAAAAAAGAAAAGTTTTAAATACGAATTAAAAGAAAAAAAAGAAAAATGCACTTTTTCAAAAATTATTGAATCTGTTGATAGAAATGAATGGATTCATAGAGACATAACCGAAATACCATGTGATCAAAATTTGCCAGATCTGAAAATTACTTTTATAGTTATGGGGGCATATTGCTTTTACCAAAAAAACATGAAACCATTTCAAGATAAAAATACTTTTTTTTACAAATCCCCATCATATGCTTGTGATGCAGAAATTTCTGTTGCATGTAAAAAAGGAAGAAAATTAGATTTCCCAAATCAGGATGATTTTACAATTATACAAACTAATGAATGGATTTTAATTATGGTATTTGATGGACATGGGCCATCTGGTCATGACATCAGTAATTTTGTACATGTAGTACTCCCTTTACTTTTTTCATACAATATTGAAAGAATATTTGAAAACCCTGTTCGAACAATGAAAACATTATTTTATATGATAAACTGCTACTTAGTTAATTATTCCTACTGTATAAATAATAATATAAATCCAATTAACATAAATTTTATTGATTATAATTTAAGTGGAACAACATGTACAATCATACTCTACAATTTTCTAACAAAAAAAATTTATTCTGCCCACACAGGGGATAGTAGAGCTGTTATGGGAAAACAAAATGAAAAAACAAACACATTTAGAGCTTATAATATTACTGAAGATCACAAACCATCTTTAAAATTAGAAAGAGAACGAATTGTTGCATTTGGTGGAGAAGTGAAAAAATTGCAAGGAGATGTTTCATACCGAGTTTTTGTTAAAAATGAAATGTACCCCGGATTAGCCATGAGTAGAGCTATAGGTGACATTACTTCGTCTTTCATTGGTGTTACTTGTGAACCTACCATAAAAATATTTGACAAATCTGATGAAGACAAGTTCATTATTGTTGCAACAGATGGTATCTGGGAATTTATAAGTAGTGAGGAATGCGTTCAGATGGTTTCTCGAAAGAGGAAGAAGAAGGTGCACGTTGCCATGGAAGAAATTATCAAGGAATCTTGGAGAAGGTGGGAACGAATTGACACCGTCGATGATATGACACTGGTTATTTTATATTTCTAA
>XM_024490585.1 Echinococcus granulosus hypothetical protein (EGR_01336), partial mRNA 
ATGCATGGAGCGCTTCAGATGCTGCATCGTGAGGACGATATTTATGGCGGTTTTCCTTCAGCCGTCCTCCTCGCTCCCTCTACTCTTACAAATGGTAGAAAGCTGCCCATTATCGCAACCTCCAGTGAAGGCACACCAATCGGCTACATAATTACGCCTAATCCTACCAATGCTGATTCAAAATTTGTCGCTAATGAGACAACGGTCCAAAAGCAACAAATAGGATCTGATGATGCTTCTTCCAGCTCTACCGGTCACGTAAAATCCACCTGCAATGGTCTTCTGTACCGACTACCTGATGGAGGCTATGCAAAGGTGGAAAAGAATTACATGACAATCAACCCCAAGCTCTATCAGCAAAGCATATATCGAAAGCTCCATGTTCATGAAGAATGGAACGGACCTATCACCCAAGCAAATAATGCTCAGGAGGATAATCACGGCATTAAGAAAAAGGTTGTTGTGGCCCATGAATCGTCGCCTGTTTTGGAGGGAGGAACGGGCCACGAGGAAACTGACGTCGACACACCACAATGA
>XR_004086260.1 PREDICTED: Quercus lobata vacuolar sorting protein 3-like (LOC115966022), transcript variant X5, misc_RNA 
ATTTTTGAACTTTGCTCTGTACGTAGGGTCCAAGGAAACTGATGAAAAGGCTGATGAGGTTCTAAAGTAGGATATTTTGGATTGTTGGACGCCAGAAAATCACTATGGATGGACTGAATCTAAGTGTTAAACATTTCTAAATTTAGACCATCTATAGTGATTTTCTAGAGTCCAATAATCCAAGATATCCAACTTTAGAACCTCATCAGCCTTTTCATCAGTTTCCTTAGACCCTACCTCTGAGGTCCACGAAAATGGAGGTGTATCATAAGAAGTCGGGTAGGTGTATTCAATCGATAAGTTTTGGTGGGGAAGGAGTTGGAGCTAGCGTTATTGCTGATGAGGAAGTTGGGAGTGGGAAACTTGTTGCTGTTGGAACACCCAACAAGGTTATTTGCTATCGTAAATTACCTTCTGAAGAACAAATCAAAGACGTTTTGAGAAAGAAGAACTTTAAAGAAGCCATTGCCTTGGTGGAGGAACTTGAGTGTGATGCTGAATTGTCAAAGGATATGCTCTCCTTTGTTCATGCTCAAGTGGGGTTTCTATTGCTGTTTAACCTGCATTTTGAGGAAGCAGTAAATCACTTTTTGCTGTCAGAGACAATGCAGCCTTCTGAAAGATAAAGGTACCTCCAGTGGTTGATTGAAGATCAGGACTGTGATGATACTCAATTCCATACATTATATGCTCTATCACTTGCCAAATCAGCAATTGAAGCCTTTCAAACTGAAAATACTTATCAAAACAGTGACATTGGAAGGGTAGATGAGACAGTAATTTCTGATAATAGAATGAACTCGATCTTTGAAAGTCCTCTTCGAGAAAGACTGCAGATATTTTTGTCGTCTTCAGACTTGTATGATCCAGAGGAAGTTCTTTACTTGATCGAAGGATCGGAGTTATGGTTGGAAAAGATCGTTTACTGCCTAATGATTTGCATCATTTCTTTCAAACTGTTGTTAGGCAATTCTTTACAGTAAACTGGGTCAAGAGGGATTAGTGCTCCAAATTTTGGCATTAATCAGCACTGAAGAAAATGAAGATGAAGTGACTGAAAATGAAGAAAATTCGGGTTCTGCTTCTACTTCTGCCAGTACTGAAGAAAGTATTGAACTTTCACCAGCAAGAGCAAGACCTCAAAGGGTGAACCGTGCACAAACAAGACTCATGTGTTCATTTCTCCAAGCAAGTTGAGGGTGAAGCTCATAGGGCCTCACCATCTTAGAAAGAAGGATGGATCAAACAGTAACTCTTCTAGACACAATTTGGTTTGCTGAGGAAGGTAGTGCATAAGCCATGGTTCTTGACAGCATTCTATCTTCTCCTCATCGTAGGTCACCATCATTCAGGAAGCAATTCTCGCGGGATGATTCATTAAGCTGGCCAACACTCCTTCAAAGGCACCGCTTCCTCTTAATAGCTCTAATTCTCCTAGCTTTCCTATGCACTATGTATCTTTATTTTGCTGTCACTTTAGGTGCTTCTGGATCATGTTCTGATTTAAAGGGTGCTCAGAAAGCGTCAGGTTTGGATGCAAAAGCTTCTGTGGGCAATGGAAAATTGAAATTCCTTTGACATGTAGATGATAATTATAGTTGGAAAGCATTTCCGTCCTTGGTTCTTTTCGATTCTAAGGAGATTGAATTTAACCATACTTTTAAAATTGCAATAGGTTGTTTGCTGTTTTTGAACTCAATTGTCCTGAATCTTATATATGAGAAATGTAACAAAATTTTCATTTGGAGACTATATAGCAAAAATTTGATTTGGA
>XM_033023418.1 PREDICTED: Amblyraja radiata transmembrane protein FAM155A-like (LOC116974698), mRNA 
AACTCCCGTGCCGTCTCCTGTTCAGTGCATGCTCCGAATTGATGAAAAGCCGCAGTTTCAGATGTATACTGCAGTAAGGAGACTGCACCGCAGCAGGATTGTGCTCAGCAACGGGCGGCTGTAAAAGGAACTAGTCTGGCACTAAATGCGCACGGCGGCACACGATACAATACTATTACACCTTTCGCCTCTTGTCCCATTGCTTTAGGCAGCGGCCGGGGATACATCTCACGCCAGAATGTGAACTGGACGATCGCCGCGAACACCGAAGACAGGATCCAAAGTGCCACTTTTTGGTGCACGGTTCGAAACTTCGCTCGAGGATTTGTTGTTGTTGTTGTGAAAATAGCGAAGGGCAGCTGATATTTGTGCGTGGCTGTGGCTGTGCCGCCGCAGACACGGCTGGGACGCGCCTGGTGCACAAGTGGATGATGCAGCGCCGGTGTGTGGCAGCGCTGGAGATGTGAGTCTCCCCTTCTCTCCCCTCAGCTCAATGTGCCAGGATGGAGCGATCTCGGTGCTGGGATGACGCAAACCACCGTCCTCAACCGCAACCCTCACCCCCCGCCCAAAAATAATAATAAGAGGTGTTTCTGGGCGAAGATGGCCGCAACTTCCACCCAACATGATGAACGCTGCGTTGCTCCAAACGCCAGGGCCAGCGACGTTTCGTCGGCATCAGGAGAAATAGTTCAACTTTTCTCTGCTTGCATCTGGTGAATTTGTTGGCGCCGATGTTGGCAGGGTCGGATGTGTGAGGCTGGTGTGATGTGAATCTGCAGAGAGTGGGCAGGGGAGAGAGGAGCTCGCTCGCCGTCGCCAGGAGCAGGCTTTCCCCCCGGAGTGCCATGGATAAGTCTGGTGTGACTCTCCTTGCTGCTCCTACGGATTGGATGGCAACAGTTGACCACCCGTACATGCAACCCAAGTGAACGCTCAACAGAATAGCAACGCGGCTGATCTAGCAAGACAAACCCGGTCAATGTATATCGAGGCAAAGGTCCGTTCGCCGCGGAGCCAGCCCGAGCCGCACTTGTCCACAATATGACCAGAGGCGCCTGGATGTGTCGCCGGCAAGACAACGGATTACAAATCTGGTATGTCCCCCGCCAGAACGACAAACCCTGCACGGATTCAGAGCGGGCCCAGAAATGGCGACTGTCTTTAGCATCTCTGTTGTTTTTTACCGTCCTGCTATCTGATTACTTGTGGCTGTGTGCGGATGCGAATCTCACCAGAAGCAGAGACCAGGAGCGGAGCACTTCAGCCGAGCCGACGGGGGGGAACCGCTCACTGTCCCCACTGTTCCTCAGCGCTGATCAGCCTAGGAGCACCGCCAGCAGTGACAAACGTGCTATTTTTCTAGGTAATACCACTAGCAGACCCATCTGCCAACTGGAACCGTGTCGCCCATATTATGTGTGTGAGCAGTGTGTAAGTATTGAAGATGCAGAGACTGTGTGCGGGAGCGCCGGCGAGGATGCGTCCAATGGGTCTCCGCCGCTGTCCTTCAACAATTTCCACCTTTCCTTTTGTGAATCCTACACCCTTTCTGAACTGTTCGCCGGGATGTCGAGACCAGAGGGCTCCAATTGCGATCTGAGCCTTGTGCTGGACGGCGACGCCACCGTCTGCATTCAGTGCGTTGAGATTTATCAACGTTTGGACCAACATGCCCAAGAGAAATACGAGGAGTTCCAGAGCTTGTTTCAGAAGTATTTACAGTGGGGAGATTACTCTGTGAAAAGTTGCATCGATGACTGCAAGGGACAGATGGTGCAAGGTGCCAGCAAGTTCACGAATTGCACATATGAATGTGTTTGCAGAAGTTCGGAGACTGCTGACACTTTTAAGGAACGGTAG
>XM_033152434.1 PREDICTED: Lacerta agilis small nuclear RNA activating complex polypeptide 2 (SNAPC2), transcript variant X3, mRNA 
AGCGACGGCTTTTCACTAACTAGGCGGCGTTGCGTTTGAGGTGAGGACTACCGGAAGATAACGAGCAGCGTTGTGTCGCCTTAGAAGCCAGGAACGGGTGGCTAGAGCGCCATGAAGCCGCCTTCCAGGCAGCGTTCAGCCCCTGCTCGCTACAGGATGGCCCCCACGAGCCAGGCTTGGACGGACCCAGAAAAGCGACGCCTTCTTCGGGCCTTGAGAGCTCACGGCCAGGGTCCGTTGCGGCCCGAGCTGTTGAAGGAGTACCTGCCTTCGAGGGATGAAGAAGAGATCATGGCATTTGTGGAGCACCTGAAAGAGCGTGTAGCAAAGGAAGCGGTCAAGGAACAATATCAGTATCGCCAGCGTAAACAGAAGGATGCTCCTATTCCAGCACCTATTGAGGTTTGGACAATTGCATCTACTGAGCCACTCACCTTGCTCCATTCCGTGCCTCCAAAGTCAGTGGTGACAAAGAATTCTCAATGTTCATCCCAAAATCTTCATAGTGAGAGTAGGAAATCCAACGAAGAATCTCATGAACCAACTGTATCATCCAGTGTAGAGGAAATAGCCCCTGCAGAAAACAGTGGGTTCCATGTGGACTTTGAAAAGATCTACAAGTACCTTTCTGTGATCTCACGTGGCTGTAAGGCACCTGAACTCCCACCAGGTGAGTCAGCTGTGGTCCTTGATTTGCTACTGTCACTGCCAGAAGAGCTGGGCTTTCTGGACTATAAGAAGCTGAAGAGTCACATGCACAAATGTTATACAGAGTTGAACACCCACTACACAGGTGAAAGAAGCAGAATGAAAGAGGGCAACCAGCCTGTAAACAATAATGGAGAGCTATTCCTGCATGTGCAGCCAGCTACTAGTGGCTTACCACAACAGGAGAGTAGTAGTTCTCCTACCACTTCCCAAGATGATGCAACTTCTGCCTCTGCCATGGACTGGAAGACTCTGGGTATCTGCCCTTTGAATTCATTCTTGATTCCTTTGGATATCCTTGCACGTAAAGAAGAAATCTTTGACTGAGGGAACTGGATTCTGTGCTGCCCAGTAATGAACTATGTGCTCTCATAACATGTGAGGGAAGACTAAACAAGCTTGCCGAGCCTACCTTAGCCATGCTCCCCCATCATAGCATGGAGTTTAAGCAGCCTGACCTGCTCTTTTACACCTTGGCTCATGAGTATGATACTTGTTTTGTATTAATACTATATGTACACTGATGTCTGGTCTTACTACTCCATGACAGCTGCTAGATCTTATTTAGCCAGTTGCTATGTAGCAGCTCATAGATGGCCTTGAGTGTTAATCTTGACCTTGGTCTACAGATCATTATGGTTAGTAAAATAAGTGATGTTAGATATCATTCCTAAGTCACAGAATAGTCAAATTATTTTGTAATAACTTATTTTTAAATATATATA
>XM_011762108.2 PREDICTED: Macaca nemestrina family with sequence similarity 192 member A (FAM192A), transcript variant X3, mRNA 
GGGACTCTATTGTGGCGGTGAGGAACAGGAAGCCCTGAAGGGTCAAAAGGAATACAAAAGCAAAGGCTATTTTCTTTTTTTTTTTTCTTCTTTCATTCGTTCCTTCCTGTTTCTTTCTTTCTTCCTCTCATTTTTGTTTTTCTTTTTTAAGAGCGAGCGGCTCTGCGGTGGCGGTTTGGGGTAGGCGCCGCCGAGGTGAGGGCGTCTCGCCTCCCGCGCGCCGGTAGAATAAACAGCCATTGGACTCTTCAAAGAAATACGCTGTCTGCATCAAGTACTGCTTTTGCAGATTGGTTGTTTCATTATGGATGGAGGGGATGATGGTAACCTTGTTATCAAAAAGAGGTTTGTGTCTGAGGCAGAACTAGATGAACGGCGCAAAAGGAGGCAAGAAGAATGGGAGAAAGTTCGAAAACCTGAAGATCCAGAAGAATGTCCAGAGGAGGTTTATGACCCTCGCTCTCTGTATGAAAGACTACAGGAACAGAAGGACAGGAAGCAGCAGGAGTATGAGGAACAGTTCAAATTCAAAAACATGGTAAGAGGCTTAGATGAAGATGAGACCAACTTCCTTGATGAGGTTTCTCGACAGCAGGAACTAATAGAAAAGCAACGAAGAGAAGAAGAACTGAAAGAACTGAAGGAATACAGAAATAACCTCAAGAAGGTTGGAATTTCTCAAGAGAACAAGAAGGAAGTGGAAAAGAAACTGACTGTGAAGCCCATAGAAACCAAGAACAAGTTCTCCCAGGCAAAGCTGTTGGCAGGAGCTGTGAAGCATAAGAGCTCAGAGAGTGGCCACAGTGTGAAAAGACTGAAACCAGACCCTGAGCCAGATGACAAGAATCAAGAGCCCTCATCCTGCAAGTCTCTCGGAAACACTTCCCTGAGTGGCCCCTCCATCCACTGCCCCTCTGCTGCAGTCTGTATCGGCATCCTCCCGGGCCTGGGCGCCTACTCTGGGAGCAGCGACTCCGAGTCCAGCTCAGACAGCGAAGGCACCATCAATGCCACCGGAAAGATTGTCTCCTCCATCTTCCGAACCAACACTTTCCTCGAGGCCCCCTAGTTTCTCTGTCCTTAACAGGGAGCTCCTCCCCAAGGGTAGATTGGACCGTTCATGCTGCCTTCGGGCATTACGTCTCAAAAAAAAAACTCCTTTGCCTGCATCCTGTGCACAACATGACACTTTTAACCAATCCAATCTAAAAATGTGCCAGAATCCACCTGTGGCCCGAATTGTGTTTGGTTTCTCTTTCTACTGCAGTGCACATGAGCAAACCTATCCCGCTGCCACTTTCCTCACTGATACTGGGAGGAGGGCAAGGCCCAGCTGAAGTTCCACTAAAAATGCCCTAGGAGAATAGGCACCGGCTGGCTTGCCAAAGGGTTTGGGTTTTATTGCTTTCTGTTTTTTTCTTTTCCTGACAGCACAAAGAAGTAAGGGCAGATATAAGTAAGAAGTAAGGTGTTATTTAAACATTCTATTGTAGGTGAACGTGTTGTTTGGTTCTACTGCATTGTGGAGCATGCGGGGGAAGAGAACTGACCCAGGTGATGAAATGGAGCCCTTCCCTGGAACTAACCAGTCCTTGATGTTGTGTGACTAAGTAAAGATGATAAACCCCATCTGCTGGGGGTGTCACTTCACACTCGGCATGCATTGTGAAAGCTTTCCATACCCTTGGCCATTCTCTCTCCCCTCTTTATCCAACCCCGTTTATGCAGGAAGGGACTGCTAACAAGAAAGCTTCCATCTCAGACCTTTTCTCTGCCTGGAAAATTATTTTATGTTTGTTTTTGAAATAAAGGATTTAGTTTAAGATTCTAAA
>XM_030051840.1 PREDICTED: Myripristis murdjan protein DDI1 homolog 2-like (LOC115359395), transcript variant X2, mRNA 
ACATGTCGAAAACATCCTGAAATGCGGCACTAGCACTGGTAGTTGATGTTAGTTGTTGAGATAAGAGAGGAAACTGTCCGAGCAGACCTGGACTTAGTGAGTGTAAACCAAGGCGTTGTGTTCAGGGGGGCAACACCAGTTTCCCTTTAATGAGAGTTTCACCAGAGACCGTCTTCACACCGGGTCACACTAGCTGTTTAGCTCAGCGGGAGAAGGAACTCCAGCAACGGCGCTTGTGTTGCAGCGGGCTCGTCAACTGATCCTCCCCGAAAACAGCGATGCTGGTCACCGTGTTCTGCGCGCCGAGGGACCGCCCGGAAACCACTTTCGCCCTCGACGTGTCTCCGGAGCTGGAGCTGAGAGACTTCGTAGCACTTTGTGAACTAGAATCAGGGATCCCGGCGGGAGAGATCCAGATCTCATATGTAGAGCAGCCCCTAAAAGACCCCACTCGTGCCTTGGGGAACTACGGCGTGAAGGATGGAGATGTGGTGGTTCTCAGACAAGCAGACAGAAAGCCACCACCACCAACTCAGCCAGCCTTCCCAGGACTGCCCCATATAGACTTTCGCTCCATCACAGTCCCAGGCACGTCTTCTTCGACCAGTCAGCAAGCTGCCACAAGGCAGCAGCGTCAGGCCCCACAGCAGCAGCAGCAGCAACAGCAGCAGCAGCAGCAGCACACCGCACAACCTTCTACGCCAATGGCCTTCCGTGGCTCTGGCTCCTCTCCACAGGGGCTGGATGACCCTGCCTTACTCCAGCAGATGCTGTTATCCAATCCACATGAGCTTTCACTCCTCAAGGAGCGCAACCCACCACTGGCTGAGGCCCTACTCAGCGGAGACTTAGAGCGTTTCACCAAAGTGTTGCTGGAGCAACAACAGGATCGGGCACGAAGGGAGCAAGAAAGGATCAGACTCCTGACTGCTGATCCGTTTGATTTGGAAGCCCAGGCGAAGATTGAGGAGGACATCAGGCAGCACAATGTGGAAGAAAATATGACCATTGCAATGGAGGAGGCTCCAGAAAGTTTTGGACAGGTGGTTATGCTCTACATCAACTGCAAAGTAAATGGGCACCCTGTGAAAGCTTTTGTTGACTCAGGAGCTCAGATGACAATAATGAGCCAAGCGTGCGCTGAGCGCTGTAACATCATGCGTCTAGTGGACCGACGCTGGGCAGGGATTGCAAAGGGTGTAGGCACCCAGAAGATCATTGGCAGAGTTCATTTGGCTCAGGTCCAGATCGAGGGGGACTTCCTACCTTGTTCTTTCTCCATCTTGGAGGACCAGCCGATGGACATGCTTCTTGGACTTGATATGCTGAAGAGACACCAGTGCTCTATTGACCTGAAGAGGAGTGTGCTGCTGATTGGCACCACAGGCACTGAAACTCGCTTTCTACCTGAGGCAGAGCTGCCAGAGTGTGCCCGGCTGGCATACGGGGCAGAGGGTCGTGAGGATGCCCGCCCAGATGAAATAGCTGACAGAGAACTGGCAGAAGCACTTCAGAGATCCATACAGGAAAGCGGACAGCACTGATGCATTTGGAGACAGCTGGAGAGGGCCCTACCAACCAGACACTGCAGATGGACAAACTACCTCACCAAAATCCCCACCATTCCCATTACCCATACCCTTAGACCAAATGTCTTCATCAACCTCCCCTTCCCAAAGACC
>XM_042461403.1 PREDICTED: Sceloporus undulatus damage specific DNA binding protein 2 (DDB2), transcript variant X4, mRNA 
GGAGGCTGATGGTCCTGGCCACTACCCTTGGCTCCCTCCCTCCTCCTCCTCCTCCAGCCGAGAATCAGGGCCCTGGAAATAGCACTGAATTGAAAACCGTTTGAAAGGTTTTAAAACGTAATAGATAAGATGAAAAGTACAGCACCACTCCTCCTCAGTTAAAAAAAAGTTGAAGCAGATGAACCCGGATTCCTAAAGGCAGGCGTGAAACCTCGCAAGAAGACTCATCATAGCACCCTTGAGGCTCTGGGTGGTGCTGTGCAGGCATACCAGATCCAGAGCCCAGAAGACAGGAAGGAAAACGAAAGACAGAGACTTGGCCAAGAGTTTGTGTTGTGTCCTGTTAAGTGTGTAAAAAACAACGAAGACAAGCTCCACATGCTCTAGGATGATAATCTACCAGCTGAAGCCAGTCATTTTTGGTTTTCATTCCAATCGCCATTGTTCAAGATACAGTGTTTTAATATAATGCATCCTGGGAAGGATTCAAAGGACAAGAAACATCTGAGGATATCTGATAGTGCATCACAAAAAGAAGCAAAATCAAATGGAAAAAGAAAGCGAGACTGTGAAGACCTAGAAAATGAGCCACAAGCAAAAAAAATACATCTGAGGAAAGCTCCCAAATGTCTGGACAAAACCGGGCAATCTTTCAATTGCTCCATGATCCGAAACAGAGGGGTATTCGTCCATCAGCTGGAAATGCAGAAAAATATTGTCCATTACATTTATCAGAACATGCTGGGAAGCACAATCAAGACACAGCTCAGAAAGTGTCTACAGGTGCCCTTTGTACGTTCTCTCTATTCATACCGCCTCTTCCGAACAGCAAGTCCTTTCGATAGAAGAATTACATGCTTGGAATGGCATCCAACATACCCTAGCACAGTTGCTGTGGGCTCCAAAGGTGGAGACATCATTCTGTGGGACTATGAAGTGCTAAACAAAACCTGCTTCATAAAAGGAATGGGAGCTGGAGGGGCCATCACAGGAATGAAGTTTAACCCTTTTAATCCTTGTCAGCTGTACACATCATCAATTGCTGGAACTACTGCCCTGCAGGATTTTAATGGAAATACAGTCCAGGTCTTCACCAGTACCAACGACTGGGATTTCTGGTACTGCAGTGTTGATGTATCTCCAACACGTCAGTCGGTGGTGACAGGTGATAATGTGGGCAATGTCATCCTGCTTAGTACTGAGGGTAAAAAGATATGGAACCTGAAACTGCACAAAAAGAAAGTTACTCACGTGGAGTTTAATTCTCACTGTGATTGGCTCCTGGCTACAGCGTCAGTGGATCAGACAGTTAAAATCTGGGATCTAAGAAACATAAAGGACAAATCAAGCTGTCTTCATATACTTCCACATGACAAACCTGTCAATGCAGCTTATTTCAGCCCAACCGATGGTGCTAAGCTACTGACTACTGATCAGCACAGTGAAATCCGGATTTATTCATCTTCTGATTGGTCCAAACCACAGCATTTGATCTCACATCCTCATCGCCAGTTTCAGCACCTTACGCCTATCAAGGCAACATGGCATCCTCGTTATGATCTCATTGTGGCTGGTCGTTACCCAGACCCTCTTTTCCCAGGATACACAGCAGATGAACTGAGAACAATCGACATATTTGATGGAAACAGTGGGGAGATGGTGTGCCAGTTACATGATTCAAATGCATCGGGCATTATCTCGCTCAATAAGTTTAACCCTATGGGAGACACACTGGCCTCTGGAATGGGCTTTAATATTCTTATTTGGAGCCGTGAGGAGATGGTGACCAAAAAGCAGGAGCATCTCATGCAAGCTATGACAGAGGAGGGAATTGGACACAGGAGCTTATCTCGACAAGGAGGTAGAAGGCAGAGACAGTCAAACCCAGGAACAAGCAAATCTAAAGCTAAACTACTCAGTCTTGAATTAGAGAGCTCTAAAACTCAGGCCAAAGAACACAAATTGCAAGAGAAAAAGAAAAGAAAGCATCCAAAGGACTAATCAGGCAAGCTTTTCTGTAATGCTGGTTAAAAACAGCCGGTGCAGACACAGTGGGCTGAAATGGCTTCAGAGGTGGCATGCCCATTACTCTCACCCAGCTTCTCCAGATCATAAAAACTGAGTTGTCAAAACAAGGCATCCTTTATTAAAGGCAATAATGGATAAATGTTCACTTGAATTTAAGTGAGCTGAAAGAAGCACCATATTTGTGCATAGCTGCTGATTTTTAATTGCCTAGGACATTGTACAGAGCAGCGATCTGGAGTATCCTGGCAGTTAAGATTGTATTTTCAGAACATTATTATTATTAAGTTTTATTTATATAGTGCTGTAAATTTACACAGCGCTGTACATACAGTCTTTTTAATTAGACGGTTCCCTGCCCTCAGGCTTACAATCTAAAAAGACATGACACA
>XM_022360255.2 PREDICTED: Drosophila obscura nurim homolog (LOC111069978), mRNA 
CCAGCGATATTTTCAATTGCGTCCGTCCAAGCAGTCAAAAAAATATTTATTTTGCAATTAATTTATAGTGTTTTTTTTTTTGTGTAAATCATGGCCAGTTTTGCCAAGGTTTTGCTGCTCCTGAGCTCGCTGGCCACTTTCGTGTATACCTTTTTCGTGGTTGGCAAGCTGGTGCTGTTCCTCTCCACACCTCGCTCGATTTCGAAGGCACACACGTGGATTTTCAATTTGCTGGACAACAAGTCCCGGCTGGAGACCGCCTATGGGCCCATTGTGTTCGACACACTCTACCTGATAGGATTCATCTTCCAGCACAGCTTCCTTAAGTCAGCGCTGGTGAAGAATTTATTGGGCAAATTGGGCTTGGCTGCAGCCGAGCGCACTATTTATAGTTTGACATCATCGCTTTGTTTACATTATCTGCTGAAGAACTGGCTGCCAGCCCAGTCGATTGTCTTGTGGCAAATTGATGTGGACGAGAGTGCTCCACTCTGGTGGACTTTTGTGGTCACACATGGCCTTGGCTGGGCCGTCATCTTTGGCGGCTGCCTTATAATGGATCTGCCCGAGCTGTTGGGCGTCAAGCAGGTCTACTATGACCTTAAAGAGTATGGGGAGCCCATTGCCTACAAGTCGAGCGAGCTGCGTCATCTGTACTCTCATGTGCGTCATCCGTCCTTTGTGGGTCTCTCCTTGATCCTGTTTGCCACGAATGTCATGAGCCTGGATCGCCTGCTGCTGGCCTCGCTGCTCACCGTCTACATGTACGTGGCCTGGTCCACTGACGATAGGGACGTGGCCTACCAGAAGCAACAACTGCAGTGCAAGAAACACGAGCTGAAGGCTCAGTAAATCGAATTCTTCTCATTTAGCTCTAGTTCCTATTTAAGCTGAACGTATAACACATTAAAGACTAACTCATCCTAACAATGGA
>XM_017911197.1 PREDICTED: Eufriesea mexicana RING finger protein nhl-1 (LOC108555529), transcript variant X6, mRNA 
AGGCGGAGGAACAGAGCGGCGAAGTAGCTGGCCAGAAATAACTAATAAGACATTCACTCTAAGACGGGCGGCCAACCGGCCCGGACAAACGCGCTGTCACAGCGCCGGATATTGGTGAACGACGAGTGCGACCACTTGGGGCCCCCATAGAGAGGGCCCCCAACCGGAAGAGGCCGCCGCAAGGCGGTCGATCTATCAGGCATGGAGCAGTTCGAGCAACTGCTAACGTGCGCGATATGCCTGGACCGATACAGGAACCCGAAGCTACTGCCATGCCAGCACAGCTTCTGCATGGAACCGTGCATGGATGGCCTCGTTGACTACGTGCGTCGACAAGTGAAATGTCCAGAATGCCGCGCGGAACATCGCATCCCCTACCAGGGTGTGCAGGCCTTCCCGACCAACGTGACCCTGCAGCGATTCCTGGAATTGCACATCGAGATCACCGGGGAGCTGCCGGACCCGACCAGCGGCCAGACAATGGAACGTTGCGGCGTCTGTTCGGAAAAAAGCTACTGCTCCCTCTGCGTCCACTGTGAGAAGAAGTGCTGTCCCGAATGCAAGGACGCTCACATGGACATCCTCAGGCGCGAAATTACGCGTATCAATTCCCAGATTCGCAGGGGACTGCACAGGTTGCAGGACGCGCTGGCTTTGGTGGAGAAAAACACGTTGGGTCTGCAAACAAACTGCGCCTCGGTCGCGGAAGAGGTGGACGAGATTTATCGGAGGCTGAGCAAGGCTTTGAAAGACCGTACGGAACATCTGCGTAACGAGGTCGATCGATACCTGAGCACCGAGCTCAGAGGGTTGATTCAGCTCAAAGAGAATCTCGAATTGGAAATCGCGAATATCCAGAGCAACTGCGATTTGGCGGAGGCTCACATCAATGAAAACGTGCCATGGGACGATTCGGAACTCCTCGACACAAAAGAGCTCTTCCTGCGTACGGTGGAATTCATCAGGAACTTCGAGTACGAGGCCGGGGATTACAGTCGGCGAGTGCGTTTCGTGATGGCACACGATCCGAACCAGCTGGTCCTCCATGTAGCAGGTTACGGCGAACTGAATATTAAGCCAGAAACCGGAAGCGGAGGATTGCTCGGTAGCTCGAGCAGTCTAGCACCTCCCGGAGGATCACCGGGCCTCATGAGAAGCAAAAGCGACCATCGTCTGGCCTCGCAGTACCGGCAGCAAGAGGAAGAGCGACTGGCGAGAAATCGATACGTGCCCGAATACGAGTACGACGCGCCAGAGTACGAAGTACCGAGGAACAAATCGAGGTACAGAAGTCGATTCATGCGACATCGGGACGGAGACGATTCCGATGGCGACTCGAGGTCGACCGTTCGGTTCACGTCCACGCCGCAGGAATCCTCGGGACTTCGTGAACGTGTTCTGGACACAGAAGACGCGGCACGTGGGCCACTTTCCGGGATTTTTCGACTCACCGACTCGCCGCGTATCATGAAGAAGCTTCAAGAATACGAGAGAGCCGGGAAAAGGAAGAAGGAGGAACCGGCGATACACCCTGCTCAACAACCTCAACCACCGAAACAACCTCAGGTACAAGTGAGAAAAGTGCCGACAGCGATGGCGAGGCAGACCAGCGAGGACGACGAGATTTCTAGGATTAAAAAGCAGAACAAAACAGCGGCCACACCTGCGACCGAAACGGTGGAAGAACGACAACCGGCGCCAACACCTGCACCTGTACATCCACCTCCGAGGGAGACACCCTCCGAACGAGAACCGGAGGAACCCGCGCGGAGACCGATGCCCGCGAGGAGAACTTCGACGGATACCCACACTCCTGCGACGAGAAGCGCTTCATCAGACTCGAGCACGGGCTCCGAGAGCTCGGGAGGATCAGGAATCCGCAGCACCGGTGCACCATTCACCGCCGAGGAAATGAAGCAGAAGTACTTGTCGAGGGCACCGGCGTCGAACGCAACATCCACGACCTCGTCGCCGCACAGCGGGACGCCACCGACTGCCAAAGACACCACCGCCAACGCCACCCCCGCGTCCCGATCCTTCCAGAGCCGTTTTTTAGGCACAGGTAACCGCGCAGCCCCACCACCGCCCACGCAACCCCCAGCGGCGCGAGAAGAGACCGCCGTAAAGAAGAAGGAGGAAGAGGAGGAGGAGGACGAGGAAACGAGTAGCTCGTCGGAAGAGACGGAATCCGAGACCGAGGAGGAATCGGAAACCGATGCTCATCCAGCGGGCACGACCACGTCCACGACGCCCTCTACCCCGGCTCAGGATCGTCAGAGGAGCGAGTCCGCGATGGCGAGGACAGACATAGGGCCTCTGCTCGCTAGGAGCGCGGAGGCGAGACGCGGCAGCAAGGAAAACTCACCTACGACCAGGTATTCGTCGCCGAGAGGAAGTCCCGCGCATTCGGTGACGAGCCCGACAGCGACGACGACGACGACGACAACGAGCGGCGCCGCGACGTTGACAACGCCGGCCGGCTACACCAGCAGGTTCCTAAACAAGAGCAGGAGCCAGGCGGCGATGATGGCGAGCCGGGAACGGGAACGGGAGCGCGAAAGAGAACGAGAACGCGAACGGGAGCGAGAAAGGGAACGCGAAAGAGAAAGAGAACGGGAGAGAGAACGCGAGCGAGACATGGACACGGAGGTCGATTCGCCCCTGTCGACGAGGTCACGGTATGCCGCGTTGAAGGAAAGAAGACAACGCCTGGCCCGGTCCAGAAGCTCGCACAACTTCGGCGGCGATGACCTCGACCTAGACGAGGAGCCACCCTCTCCGACTACCCAGTCGCCGAACGCTTACTTGGCAGCCAAGTACGGAGCCGGCTCTGAACTGGCCAGAAGTCGGAGTACTCATGCTCTAAAGTCGAGAGAACCGAGTCCAGAACGAGACAGAGTAGGTACCGAGAAGGATGGCGCCGCCTTGAGTTCCTGGGCGCGGTACTTGAAGAACAAGTACGGCAATCGTACCACCAAAGACAAGGAGCCTTCGTCCTCTGCCTCGACGATTCCGTCATCGAGTGGTAGCGCAACCTCGAGGAGGTTATCCCTCGGACTACCTCTCAGGCACGGTGGTCAAACATCCTTCGAATCCTCTGACGACGACCAAAAAAACCCGTCAGGCTCCCCCACGTCCCCTACAGCAGCTCCCGTTATACCCGCGGCAGCAGGTTCCTCCACTAGTAATGGCCGGAGGAGTCACTACTTGCTGAAGCGGCGGCAGCTGTTTAAGTTCGGGATGCGGGGGAGCGAAGCCGGATGCTTTACCTGGCCGAGAGGCCTCGCGGTTGGCCCTGACAATTTCATCGTCGTGGCTGACAGCTCTAACCATCGTGTTCAAGTATTCGACTGTAATGGGAACTTCCTGAAGGAGTTCGGAACGTATGGCAGCGGTGAGGGTGAATTCGATTGCCTCGCCGGGGTGGCCGTGAACAGGATCGGACAGTACATCATCGCGGATCGTTACAACCACAGAATTCAGGTTCTCGATCCTTCCGGTCGTTTTCTGAGAGCCTTCGGCTCCCAAGGGACCGCCGACGGTCGGTTTAATTATCCTTGGGGAATCACCACGGATGCTCTTGGATTTATTTATGTGTGCGATAAAGAGAACCATCGCGTACAGGTGTTTCAATCGGACGGCACGTTCGTGGGCAAATTCGGTAGCTGCGGAAGCGGACGTGGCCAGCTGGAACATCCTCATTACATCGCGGTGAGCAACACGAACCGCGTGATCGTGAGCGACAGCAACAATCATCGTATCCAGATATTCGACGTGAACGGCCGCGTGCTGACCTTCTTCGGATCCGAGGGCTCCGACGAGGGTCAGTTCAAGTTCCCAAGGGGTGTCGCTGTGGACGATCAAGGCTACATCATCGTCGCCGACTCCGGCAACAACAGGATACAGATATTCAGCCCTGAGGGGACGTTCCTCAAGTGCTTTGGCGGATGGGGTAGCGGTGACGGTGAATTCAAGGGCCTAGAGGGTGTCGCTGTCACGTCGGGCGGTAACATCGTCGTCTGCGATCGCGAGAATCACCGTGTTCAAGTGTTCTGATTTCGTTCCGCTTCGTTTCGTTTTATTCTCTCTTATTCTCCTGTGATTCGTCGACCAAACTCAAACGCGTCGAGCGATCTCAGAGGAGGCTCGCATTTCGACGAAAATCGATGCAGTATTTCTCGCGATGCTTTCGATTCTGGTTTTCTTTTTCTGCCTAATTGGGAGGAGAAATAACTTTCGACGGAGAAGGGTTTCCACGAATCGACGATGGGCGAGACGTCGCGTTAATAACCGCTTGCTTGCGTTAGAAATTAACATGTAGCTGTTTTGTGCTGAGCTAATCTTTTCATTCGGAAGCCCTTTCATGAGAAATGTTAAATAACGTAAGATATTCTGGACGATTGGTTGGAAATTTCGTAACATATATTCTACGTATATACATAGGTTTATATATAACATAGTTACCTTCGCTGTTTATGCATCTCACCGAGACGAATCGATAATGGAACTGAAAAGATACCCTTGGACGTCGGTTAATTGCAGATTGCAGCTTAAAAAATGAAAAAAGAGAGCAAAAATATCGTTTATCTGTTCTTCTCTCTCGTCTTACCCCCTTTCTCTCATTCTACCATCTTCCCCGTACGCACGTCATACTCGCGTAACTTAATTTAATTTATACTCGAAGTGACAACAATACAGTTTGTACCGTTTGTATGCTTTAAATAAATTGTTGCGGAAGTAATAAAGGAGAAACGAAAAAGAAAAAAAAAAAAAAGAAAAGAAAAAAGATATGAAAAAAGGACGACACGCGTTTTATTCGCTTCGACGCACCCCCGAACCCGCGTT
>XM_042027756.1 PREDICTED: Corvus kubaryi hydrocephalus-inducing protein-like (LOC121664448), mRNA 
ATGGTCTTCAACCTCCGTATTCCTGAGGACGGCTCGGGAGAGCTCAGTGTTTGCAGCTTCGATCAAGTGACCCTGTGTTCCAACACCGTGATGGAGTGCTACCAGTATATCCTGGTGGACGTGGAGGGTATTGGCGAGGGAGTGTTGGCACTGACCGTCATGGGCAGATGCATCGTTCCTAAGCTGACAGCGTACCCCTACATCCTGTGCTACGATGAGTGCCATCCGAAGGAGCCGTACGAGAGGAAGTTCCTCGTTGTGAATAACAGCCACATTCCTGGCTGCTACGGGCTTATTGCCCAGGTTTGGCATCACATCCGCCTCCTCCTCGCGGAGGAGATTATTAGCGGGGAAAAAAGGGTTTGGTTTGCTGGTTTCTATTCAATCTTAAAGATCTGCTGAGAACAAGATCCTACCGGAATGTAAAGTTTAGGGTGCAGTTTAACCTCCTGAGG
>XM_036088610.1 PREDICTED: Halichoerus grypus CD300 molecule like family member f (CD300LF), mRNA 
TTTTTTTTTAGGTTAGGGCTGGAATGGAGGCCCTGCGCCATGCACGGGCACTGCACCATACCCCCTGGTTCCCCAACACCCTGCCTCCACCTTGTGGGAAGTGGCCAAAGGAGGAAGTTCAAGGGTGGGGAAAGCAGAAGGTTGGAAGATGCCGGAGCTAGGTCGGAGTTGACTGGCTCCATCAAGGGGGGCTTGTGTGAAGAGAGAATGAACCTGCTGCTGCTCTTCCTCCTCTTCCAGCGTGCAGGCTCATCTGCCCTCGTAGCAGTGTCCAATGCAGTGAGTGGCCCAGTGCGGGGCTCACTGACCGTGCAGTGTCGCTATGAACCTGGGTGGGAGACCTACAGTAAGTGGTGGTGTCGAGGAGCTGAGTGGAGACGCTGCCGTATCCTCGTTCGAACTGATGGATCAGAGCGGGACAAGAAGGCTGACCGAGTGTCCATCAAGGACAATCACAAATTGCGCACATTCACTGTGACCATGGAGGAGCTCAGGTGGAACAATGCAGACACTTACTGGTGTGGGATTGAGAGAACTGGACCTGACCTTGGGGTTGAAGTTAAAGTGACCATTGACCCAGCACCAGCTACAATATCAACCACCACCACCTCAACCACCATGTCCGCAGCACCAGCAGAGACCAAAGGCCCCCCGACTGTGAGCCACCACTCCAATGGCAGCGCTAACTCCATGAAGCTCAGCATCCTGATTCCCCTCATCTTGGCTGTGTTGCTGCTTCTCCTGGTGACGGCCTCACTCTTGGCCTTGAGAAAGATGAAGCAGCAGAAGAGAGCTGCTGGGATATCCCCAGAGCAGGTGGTCCAGCCCCCAGAGGGGGACCTCTGCTATGCAAACCTGGCTCTGGAGCCAACCAGCACCTCCCACAACTCCTCCCAGAAGAAGGCCTGTACAAAGTCCTCCTCCTCTGCCCTGGATAATCAGCAGGAAGTGGAATATGTCACCATGGCCGCCCTTCCGAAGGAGGACATTTCCTACGTGGCTCTGTCTTGGGAGCCTTTGAATGAGGAGTCAACCTATTACAACATGAACTACCATGTTGCCCACGTTCCCAGCAGGAGCCACGAGGAATCCATGGAATACAGCAGCATTAGGAGATCTTAGCCTGAGCTCCAGGCTCCCCTCTTGAACCCCACATGAGGCCTGTGAGCATGTTCCTGCCCTGTCTGCTTTCTGCCCCCATTCACTTCACGAGGACCAACCAGGGACTGAAGCCTCGGCCTTGTCTCAGGGGGCTTTCGGGAGGTAGATAGGGGTCTCTCTACATCTCTTTTTCTCCCATACAGCTTAAGAGGGGTTGGGGATATGCTCTGGAGTTGCTGAGGGAGTAATAATGATAATGATAATAATAATAATTAACCTTTATTTATTGCTTAACATGTGTGGTGGGCTGAATAATGGCCCCCAAAGTTCTCTGTGTCCCAATCCCCAGAACCTGTGAATATGGCAAAAGGAGCCACGTGGATGTATGAAGTTGAGGGTTTTGAGATGAGGAGAGTATTCTGGATTCTCCATGTGGGCCCTAAATATAATCACAAGGGTCCTTGTAAGAAGGAGGCAAGAAGGTCATAAGAGGAGAAGGCAGCCGATGACAGAGGCAGAGGTTGGAGTGATGTGGCCAGAAAAGGCAAGCAATGGATTGTCCCCTGGAGCCTCTAGAAGGAACCAGCCCTGCCAACACCCTGACTTTAGTCCAGTGAAACAGATTTTGTCCTTCTGGCCTCCAGAATTATAGGAGAATAAATTGATGTTGTGTTAATGAATTCA
>XM_028783841.1 PREDICTED: Grammomys surdaster transmembrane serine protease 13 (Tmprss13), transcript variant X3, mRNA 
ATGGACAGAGGCAGCCACCGGAATGCTTCTCCAGCAAGGACACCTCCAGCAAGGACATCTCCAGCAAGGACATCTCCAGCAAGGACACCTCCTCAGGCTTCTCCAGCAAGGACACCTCCTCAGGCTTCTCCAGCAAGGACACCTTCTCAGGCTTCTCCAGCAAGGACACCTCCTCAGACACCTCCTCAGGCTTCTCCAGCCCAAGCGTCTCCAGTCCGGGCATCTGCAACCAGGGCACCACCTTCCAGGTCACTGTCAGGCAGGTCTTCATCTGCCAGGTCAGCCTCCACGACATCCTCCCCAACGAGAGTGTACCTTGTTAGAGCAACACCAGTGGCGGCTGTCCCCATCCGGGCATCTCCTGCCAGGTCAGCACCAGCCACCAGGGCCACCAGGGCCACCAGGGAGAGCCCAGGTCTCAGTTTCCCCAAGTTCTCCTGGCAGGAGACCCAGAGACAGCTGCCACTCATCGGGTGTGTCCTCCTTCTCATCAGCCTGGTGATCTCACTCATCCTTCTCTTCTACTTCTGGCGAGGCCACACCGGGATCAAGTACAAAGAGCCATTGGAGAGTTGCCCTAACCACGCGGTTCGCTGTGACGGAGTGGTAGATTGCAAAATGAAGAGTGATGAGCTGGGCTGTGTCAGGTTCGACTGGGACAAATCCCTCCTGAAAGTCTACTCTGGGTCTTCTGGTGAGTGGCTTCCTGTCTGCAGCAGCAGCTGGAACGACACGGACTCCAAGAGGACCTGCCAGCAGCTGGGCTTTGACAGTGCTTACCGAACGACTGAGGTGGCCCACAGGGACGTCACCAGCAGCTTCTTACTCGCTGAATACAACTCCACCATCCAGGAAAGCCTCTACAGGTCGGAATGTCCTTCCCAGCGGTATGTCTCCCTCCAGTGTTCCCACTGTGGTCTGAGAGCTATGACCGGGCGGATCGTGGGAGGGGCTCTGACCTCAGAGAGCAAGTGGCCCTGGCAAGTTAGCCTACACTTCGGCACCACCCACATCTGCGGGGGCACACTCATCGATGCCCAGTGGGTGCTCACCGCTGCCCACTGTTTCTTTGTGACCCGGGAGAAGATTCTGGAGGGGTGGAAGGTATACGCAGGCACCAGCAACTTGCACCAGCTGCCTGAGGCTGCCTCAATCTCCCAGATCATCATTAACAGCAACTACACGGATGAACAGGATGACTATGACATCGCTCTCATAAGGCTGTCCAAGCCCTTGACCCTGTCAGCTCACATCCACCCTGCCTGCCTCCCTATGCATGGTCAGACCTTCAGCCTCAATGAGACCTGCTGGATCACGGGCTTCGGCAAAACCAAAGAAACAGATGAGAAGACATCTCCCTTCCTCCGAGAGGTTCAGGTCAACCTCATTGACTTCAAGAAATGCAATGACTACTCAGTCTATGACAGTTACCTTACCCCAAGGATGATGTGTGCAGGGGATCTTCGAGGAGGGAGGGACTCCTGCCAGGGAGACAGTGGAGGACCTCTCGTCTGTGAGCAGAACAATCGCTGGTACCTGGCAGGTGTCACCAGCTGGGGCACAGGCTGTGGCCAGAAAAACAAGCCTGGTGTGTACACCAAAGTGACAGAAGTACTTCCCTGGATTTATAGAAAGATGGAGAGTGAGGTACGCTTCCGGAAATCTTAACCATGCCCTTCTCACTTTGGTGATTGCTATGAAGATTCTGGCTAAAGGGACAGGCC
>AY335457.1 Uncultured Sphingomonadaceae bacterium clone B101/6 16S ribosomal RNA gene, partial sequence 
CGTAACGCGTGGGAATCTGCCTTTAGGTTCGGAATAACTCCTCGAAAGGGGTGCTAATACCGGATGATGTCTTCGGACCAAAGATTTATCGCCTTTAGATGGGCCCGCGTTGGATTAGCTTGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCATAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGCCTTAGGGTTGTAA
>XR_002992789.1 PREDICTED: Selaginella moellendorffii uncharacterized LOC112347534 (LOC112347534), ncRNA 
GTGGCTCATAGGACGATGATTTGGAGTTGGATACAAAGTGACAATCAATGTGTTGGTGGTGGAATGGCTGTTGCTGTTCTTGCAGCTCCACTGTGCTCTGTCGTCTCTCGGAGACACTGCTGCCCTTTCTACTGCTCTGAGAGCCAGCACAGACGAACAAGGACTTCATTCTCCCCGCCCAGCCTGTAAAAGCTAAAGTTTGATCACAAAAACCATGCCACGAGTTTAATCAAAGACGAGTACATTGTGTTGGAGTGCTTCGCTCAAAGAAGATCTACTCGCGGTGTAAGCATAGAAGTGAAAGTACTTTGCGGACAAACTTAAACATCCTTTCAATCCATAGCTTTGCTTCTCAGGTGGAAGAAGTATAGAAGCTATTGGAGATCAAAAGTTCTTTACGGACACACTTAAAAAATTCTAACGAGAAGCTCCTCTCTTTGATTTGTGCTCTA
>FJ727014.1 Uncultured bacterium clone A72h_1235 16S ribosomal RNA gene, partial sequence 
TTTGATGGCGACCGGCGCACGGGTGAGTAACACGTATCCAACCTGCCGATGACTCGGGGATAGCCTTTCGAAAGAAAGATTAATACCCGATGGCATAATAGAACCGCATGGTTTGATTATTAAAGAATTTCGGTTATCGATGGGGATGCGTTCCATTAGGCAGTTGGTGGGGTAACGGCCCACCAAACCTTCGATGGATAGGGGTTCTGAGAGGAAGGTCCCCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCATG
>KY281550.1 Uncultured bacterium clone CP_Otu6690 16S ribosomal RNA gene, partial sequence 
TACGGAGGATGCAAGCGTTATCCGGATTCATTGGGTTTAAAGGGTGCGTAGGCGGAATGGTAAGTCAGGGGTGAAAGTTTGCGGCTCAACCGTAAAATTGCCTTTGATACTGTCATTCTTGAGTACATACGAGGTAGGCGGAATGTGGCGTGTAGCGGTGAAATGCTTAGATATGCCACAGAACACCGATTGCGAAGGCAGCTTACTAGACTGTAACTGACGCTGATGCACGAAAGCGTGGGGATCGAACAGG
>XM_017287255.2 PREDICTED: Drosophila miranda peripheral plasma membrane protein CASK (LOC108156021), transcript variant X3, mRNA 
GTTAAGTCCGCGGTCACACTGGGTTCGTGTTTTTAGCAAAATTAGTGAGAAATAACAAATTAATTAAAGAATTAAGCGTTTCTATGTGTTGACGTCAACCCAGGCGCGATCTATGAATGCCGCTGCTGTGTAAAGTACTCCGTCGCTGAGGGGCAGGGCACACAAAATTTCGGTGCGAGGCTGCGAACAGGGCCACGAAATGTATCTTTAACATCAGCACCAACCAGCGAGGAAACGAAAAACAACAACAACTACCATAAGAAGAACAACCCACAAAGAGCCAAATTTTTAGTTAGTTTTTTTGTGTTTGCTTTTGGAGGGCAGTAGGCGAACAGGGCCAAAAAACATTGGACACGGAGTAACACGTACATCTAGGACCCAAAACCAAACCCGGAGCAGCCAGGGACAGGGGACAGGGGACAGGGGACCGTCCCACTCATCAATATTCGAAAAAGCAATTGAGACGCGAACCATCAGCAGGCATCAGCATCAATTCATCAATTATTCAAAATGACCGAAGACGAAATTCTCTTTGACGATGTCTACGAGCTGTGCGAGGTCATTGGCAAAGGACCCTTCTCCATTGTGCGACGATGTATACATAGGGAGTCCAGCCAGCAGTTTGCTGTTAAAATCGTTGATGTGGCCAAGTTCACAGCGAGTCCAGGACTGAGCACAGCGGATCTGAAGCGCGAGGCCACAATATGTCATATGCTGAAGCATCCACACATTGTCGAGCTGCTGGAGACCTACAGCTCCGAGGGCATGCTCTACATGGTGTTCGAGTTCATGGAAGGCTCCGACCTGTGCTTCGAGGTTGTGCGTCGCGCCGTTGCCGGTTTTGTCTACAGTGAGGCGGTGGCTTGCCATTACATGCGGCAGATACTGGAGGCGCTACGATATTGCCATGAGAACGATATACTGCACAGGGACGTGCGTCCCGCCTGTGCCCTGCTCGCCACCGTGGACAACTCGGCGCCAGTGAAGCTTGGTGGCTTCGGTTCGGCCATCCAGCTGCCGGGCACGAGGGAAACCATAGAAACACACGGACGCGTGGGCTGTCCGCACTATATGGCGCCGGAGGTTGTCACCAGGCGGCTGTACGGCAAGGGCTGCGATGTCTGGGGCGCTGGTGTAATGCTGCATGTCCTACTATCCGGCAGATTGCCCTTTCTGGGCTCCGGGGTGCGACTGCAGCAGTCGATAGCGCGTGGCAGGCTCTCGTTTGAGGCGCCTGAATGGAAATCAATTTCGGCTAATGCTAAGGATCTAGTCATGAAAATGCTGGCGGCCAATCCACATCACAGACTTTCCATCACCGAGGTGCTCGACCATCCGTGGATACGAGATCGGGACAAGCTACAGCGAACACATCTCGCAGAAACGGTGGAGGAATTGAAGCGCTACAATGCTCGGCGCAAGCTCAAGGGTGCCGTTCAGGCCATTGCCGGCGGCACCACCATGGATCCCGTTTATGTCACCGATGCGGACATGCCCATTGCTGGTGCACCCGACGAATGGGCCGACGAGGAGGCGGGCATCGAAGCGGTCCAGCGTATTCTGGACTGCCTGGACGATATCTATTCGCTGCAGGACGCGCATGTGGACGCGGATGTGATGCGGGATATGCTGCGGGACAGTCGCCTGCATCAGTTGCTGCAGCTCTTTGATCGCATCACCTCGACGGTTGTCACCAGCAACGGCCGGGCGCCGGCCGCAGAGGCGGTCACCCGCAGTCGGGATGTCCTGGAGTCGCTCTCGTCGACGGCCGGCAGTTCGGTGGCCAATAAGTATGCCAAGGATGAACTAATGCTGCTGCTGGCCGCCCCACACATGCAGGCCCTGCTCCATAGCCACGATGTGGTGGCCCGCGATGTGTACGGCGAGGAGGCGCTGCGCGTTACCCCGCCACCGATGGTGCCCTACCTCAATGGCGACGAGATGGACAATGTGGAGGGCGGCGAGCTGCAGCATGTGACCCGAGTGCGGCTGGTGCAGTTCCAAAAGAACACGGACGAGCCGATGGGCATAACGCTGAAGATGACCGAGGATGGGCGCTGCATTGTGGCAAGGATTATGCACGGGGGTATGATACATCGACAGGCAACGCTGCATGTGGGCGACGAGATACGGGAGATCAATGGCCAGCCGGTGCAGCATCAGTCGGTGGGCCAATTGCAACGAATGCTGCGCGAGGCACGCGGTTCTGTTACCTTCAAGATAGTTCCTTCGTACCGTAGCGCTCCGCCACCCTGCGAGCTTTTCAGGATCAGACCCGCTCCGGTGCTTATTTTCGTGCGCGCACAATTTGATTATAATCCGCTGGATGATGAGCTTATACCCTGCGCCCAGGCGGGCATATCATTCCAAGTGGGCGACATACTTCAGATCATTAGCAAGGACGATCATCACTGGTGGCAGGCGAGACTGGACACGGTTGGCGGCTCGGCGGGCTTGATACCATCGCCGGAGCTGCAGGAGTGGCGCATTGCCTGCCAGACGGTCGACAAGACCAAGCAGGAGCAGGGAGAACCGGGTGCTGGATGTTCCGCTCACGCAGATGGGTGTGATGGATCAGCAGTAAACTGTTCGATATTCGGGCGCAAGAAGAAGCAGTGTCGCGACAAGTACTTGGCCAAGCATAATGCCATATTCGATAATCTAGATGTGGTCACATACGAGGAGGTTGTCAAGGTGCCAGTTGGTGATCCGAACTTTCAGCGCAAAACGTTGGTGCTACTGGGAGCCCATGGCGTGGGCAGGCGGCATATTAAGAACACCTTGATATCCAAGTATCCCGATAAGTACGCCTATCCCATACCACATACAACGAGACCTGCCAAGCCCGAGGAGGAGAGTGGACGCAGCTATTACTTTGTCTCGCACGACGAAATGATGGCGGATATCGCCGCCAATGAGTACTTGGAATATGGTACGCACGAGGATGCGATGTATGGCACCAAGCTGGACACTATCCGACGCATACACACAGACGGCAAGATGGCCATATTGGATGTGGAGCCGCAGGCACTGAAGATACTACGCACAGCCGAATTCACGCCCTATGTGGTCTTCATAGCGGCCCCCTCGCTGCAGAATATCGCCGATTACGATGGCAGCCTGGAGCGTCTGGCAAAGGAATCGGAAATGCTGCGTCAAATGTATGGCCATTTCTTTGATATGACGATTGTGAACAACGACATTAGCGATACGATTTCCGCGCTGGAAACGGCCATCGACCGGGTGCACACCACTCCCCAATGGGTGCCAGTCTCGTGGCTCTACTGACAAGACAGTGAACTGGAATGCCCCGATTGCCTCGAGGGTTGCGATTGCGAGTGGGATGCATATACACAGGCCTCCAATGTGGCGCTCTACTGAGTGCAATACCACAGTTACATCACACCTACTATACACCACAAACACCATTTAAGTATTACCAAGGCACAAAAATATACAACACAGCAACAGCAATAGTAGCAAAAGCAAAAGCAAAAGCAACCGAAACAGAAACAGAAAGACATGAAGACAGAATGCGCTTGGCGCCGAGATATATGTAGGTATGAGGATACAGGAGAGGGTATTGTGGGTAACTGCGGTCGCAACGTAAACACAAAATGTTAATTGTAAAACGAGCTGTATTTTGCCTTATACTTTGTTAAATCCTAAGTGATTAATTTTACATTGTATTTGCCATTCCAATGGGCTGCCCTCAAACAGGCAGCCTGTGTCATTATGTTTATTGTATTTATGATTGTTTGTTCTGTTAAAGTTTTTGTTTGTACCCGTTCTCGTACTCGTACTAGTATTTATTTTGTTTCTTTCTGTCAGACAGCATTAAACGCTTATGTTAATCTTGCACTTGTTAGTGTCTAAGTTAACTAAAACACAAACCGAAATCGAAACAGAAACAGAAACCGCAACTAAAAAACACTCTAAATTGTTTTAATCAAAGATTATTTCCATAAACACATACGAAAAAAAAAAAAATAAAAAACACACCCAAAAAAATGAAGAAATAGAAATCCGAAGAATGTTTGAAGAAAACGAGTTAGTAAATTATAGCAACAAAAAACTACGTAATTAGTTATAATTAAACATAACAGCAAACCAGAATAAAAACCAACAAGAAGAGAAGTTCAGGAAAACGTTAAAAACAATATGAGATGAGAGCAATTTCAAGTGTTTCAAGCCCAAAAAAAAGTATAAAAAAGCAAATTAATTACATATGGAAGAGCAAATGGGGACAAGCGATCGTAAAGTGTACGTTTTAAATGCAATAAACATTAACAAAAGGACCCGTATAACATCACTTACACACGAAACAAACAAACAAAAAAATACACTAAAATATTACCAAGAAAGAAAACAAAAAAAAACCAAATTGTTGACGTTTAAATAAATTCAATGGGAAATGATTAATAATGCAATCATAAACGAGTTAATAATAATAAGAAGCAGGCGCGTTTAAATCAAGCAAAAGCAATTAAAGGACAAAACATTAAACCAACAAAAAAAACATAGAGTGAGCACAAAAACAACAAAAAGAAAACACATACTAACAGCAATTACAGCAAAGAAGTAAATCAAATAAGAATTAAACTATTTAGAGGCCAATGAGAACTGGTGGAAGAGTGCGCAAGGGGCACAACAGGACACGTATAAATATAGAAAGACACGCAGGAAAAAGAGAATGAATGAATGAAAGAAATGATTAGTACAGAAAATATGTGGTGTATGCAGAACATACAGACATATATAGGTATATTTTTCGAACAACTCAAAACTCAGGTTGGATACATTGAAAATCAGTCAAGTTCAATAAGATAAATATAGCGGAGCGCTTCCTTTTAACCCACAGCCAAAAAAAAAGCAAAACGAAAACCTTAACAAAACCCAATCGAAGTTTACAATGGATTAAACAGAATCGAATCGAAATGAATTGCAGTTTACCCACAAGCCACAAGTTACCACCCTAGCAGCAGCAGCTTCTGCAGAAATCTTTTCTAAATGCTTTACAAGTACAAAACATGTCTTTAGCAATCAGATTTTTAGCCCCAAAAAACCCCAGGCTCGCGCTCATTAGCTTTCTCCTCTTGCTCTCACCGAAGCTTATCCTGCTCCCGTTTGATTGGCAAAATCTTATCCAGGCTTGGGCTTGATTGCGCTTCTCCAGAGCAGGACCTAAGCTGAATCTAGACCTAACACTAAGGAGTGCACATGCAATCACAACAAAGAAACAAAAACTGGTTAGAATTGGAAAATGTGGTTGAACAAGCAAAAACCACTTACGATTAATATTAGACTAAAAAAAAACATTTGACATTTGACTTTGTAATTCCTACCACCTACAACCCTCCAGCCCCACAAGCACCTCACTCCTCACTCCATTTAAGCCAGAGCTTAGTTCAAGCCTAACCACAGAACCCACATCGATTTCCACACACACACACACAAATGAACTACCAGAACAATTCTATGGTTTCAAAACGGTTGAACAATTTTTGCATAGAGAATTATTGTTGAACGCTGGGCTATGACTTTTTGGTTCGGAGCGTATGACAGAACAGACAGGCAGCAGGCAATGCAAATCATAGAAGTATCCCAATGAAAAACCTACCCGAAACTGAAGAACTAAACTACCTACCCACAACCAGATACAAAATAAAAGAAAAAACCGCAAAAAAAACAAGCAGCCGAGTGGCCAAATTAACTAAGTATTTTACCCTAAAAAAAAGAAAAAGTCAAAGAACAACCGGAAGTGGAAGTGTATGTATATGTTGCAGCTATCCCCCTCCCCCCCAACCTAGGCAGGGTGTGCCAGATAAAAAAAAGTCTAAGGAAAATTGCTCAAATCAAAAATCAAGTATTTTATGGTATAAAAACCGTGAGGAATGATCAGGATTAGAATGAAGGGGAAGTCGCGTGTAAGAGTTGGACATTCCAAGAATGAGCTAGAATTTCGAAGGGATTCGTTTCTTATTTTTAACTGATCCTTTTTTCTTAGCTGATGCGAGCAAATTGTAGCTGTACACTAAGAATAATTTCACACTAAGATTAAGCGAAAATTTATTGTTGATATTACATAAAAAAAAGAAAAGAAATGGAAAACGGATATTGGAAAAAAACCAGAAGACTCATTGAAGCAAGCCAAATGGATTAGAATTTTTCTCTAATTTGATAAGTGGTAGACGATGATGAAGGAGCTAAGGATAATGAAGATGGTGACGAGTTGATAATGCTTATGATCTCCAAAAGTCAATATGTGTAGGATTGACACGATTTGAGCAAATTGAGTGAATTGTTATTAAAATAATAAATGAAATGAGTGGCTCAATGGATCGATATCGATCCATTGATGCTGAAATAGGTCAAGACGTTAGAAAATATCATTTAAAGTAAATGATACAAATGTCATAATATATACATAGTTTAAAATGAAAATAATAATAACAAAATCAGAAGAAAAATGGGAAAAAATGGGAATAATGCGAATTAAAAACAGAAACAGAAAAAAAGAAAAACAAAAACAACCAGTAAACACTGAAATACCGAATTTTAAATACATAAGTTTTGAATCATGCATGCCGCAAAGACAAAGAAAACCCAACACAGAAAAAGAAATTAATAAAAAGAA
>XM_006681305.1 Batrachochytrium dendrobatidis JAM81 uncharacterized protein (BATDEDRAFT_27075), partial mRNA 
ATGCAAGTTTGCAACACTCGCTTGACTCGTTTGGCTCGGATTCTGGTTGATATTTACGATATCGATGCAAAGTTACATTCCAGAATGAACGTGCATAATCTGATGTGGTCAATCGTTTGGTTTCATTGTTATCGGTCATTGACACCAGTGATTGCATTGATTGCAAATAGTAGTCCAAGACTGACAAGTGTGTCTGAATTGATGACAGATGATACAGTCTATCCAACAAAAAGTAATACATTGATCGTGTCTGTGTGGCCAAGTGTAGATAGGTCAATAGGAGTAAAAGTATTTCCCACTGGGGTTGTAAAAGAGCCGCCAACAGATGCAAGTACCAAAAAAAGTGCCTTGAGTTGGGGCAACAACAGACTTGACTCTTACGACACTGACCAACTCTCACTCTCGTTGACTGATGGTGGAAAAGCTTTGCAACCATACGGCCCAGTTCCAGCATCAGTTAAAGAGAGTAAGATTTGGTCAGTGTCGTAA
>XR_006867874.1 PREDICTED: Ischnura elegans uncharacterized LOC124171616 (LOC124171616), ncRNA 
TCCCTAAATCCGCCAATGGTTATTAATCTCCTTTATATTGCCTCAAAATAACTACGAAGTTGAGTCGTTGCAACCCGCCATTTTAATTGCATCATAGGTAAATGGCCGGTTATGTAGTAGCATAGGCGGAACATCAAACGGGTGCCGGTTTTTCCTTTTTGTAATTGATTAATTTGGGATATGTGCGGTTTTTCTGCAACTAACTGTTCTAATAACTGCAGGAATGAGTTCCGTGTTTTTTCCGTAACCTTAAGAAAAAGGCGACATGACTACAAATGTGCCGGAGGAATCATTGGCAACGAACACCATATTCCACAATTTGTGAGATTCATGCCTGTTGCATCATGCTTTGCTGAATTGATGGCCAAATAATGGAACGACTCCTATGACGTCAAGAGACAATTTTTTCATTGCATGTCCAAATAACCTAAGCAGCAGAAGCATCCAGTAATCTTGTACTGCTCTGGTATTTTGGTGTCACCATCTATTTTGCTTGAGGAGAGAATTTATCTGGAGCAGTGTAATTCGGATTATCTACTGATGAGCTTCTCATGAGTGTTTGACGTTCTACACAGCTAGTTATGAGAAAGTCACACCTGTTAGTGTCTACTGTGATTGTTATTTTTATAGAAGAGTAATTTTTTACTTGATTACCTCTGAAATTTCCCATTATTAAATGTAGTAATTCAAAGTTATGGTTACAATGTTGTGTCCTTTCCATCAAATTTTAT
>XM_008649455.4 PREDICTED: Zea mays evolutionarily conserved C-terminal region 5 (LOC100502368), transcript variant X2, mRNA 
AGAAATCCCATCGTACGCGACTTCGTATTGGTAAAAGCCTTTGAGTTTGATACCCATGACATCTCTAATCGCTCTCATCAAATCACGATTCACATAAAAAAGGTGTGGGAGCCCGATCCGATCGCCAGATCCGCCGGCCTGTGCGCCGACTCGGGCGTCCTTCCACAGATCCTCTTCCTTCTATCGTAGGCTCGCCCTCGCCGCTCGCTGGAGCGGAGGTCTCTCCCTGCAGCCCATACTCCTTGATTCATTCTATTGCCTCGCCGCCGGCTCTATGGATAAGCAGGAGCCAGTAGCCAATGGTGAACAAACGATAGGTCTTGCTGAGAAGCCGAAGGAGCTGCCTGTTGCCAGTAAGGATGAGAAAGCAACTGTGCCCCCGATTTTAGTTGATTCAAATGCTTTCAATCTACCAAGTGAAGGCCAAACCCAAGCTGGCACATCTAACATGGATGGGGGCCATAATGGTGCACACAACTTTTATGCTTCTCAGGCACAACCATTCTATTACCAAGGCTCCGGTTCTGAAAACCCTACACAAGCATGGGATACATATCCTCCCTACATGAGTGTTGAAGGATTGGAAGTGGGTCCACCAGTTGTATACAATGAGGACCCCTCATTGATGTTCCATGGTGGCTATGGTTACGACCCATATTATTCTCCTATTGCAACACCTGTACCAAATGCTGTTAGTGGAGGTGGTCAGCTCTACTCCCCTCAGCAGTTCTTCTCGGCTCCTTACTACCAGCAGTCAGTACCACCTGACATGCAATATTTAAGCTCTCCTACTCCAATATCACAGGGTGATACAATAATGCCGATTGACCCAACACAAGGAGCTTTTATCGCTGATACCCTGAGTCCAAACAGCTTCCTGTTTGGCCCAAGACCTGAATGGTTCAGATCTTCAGAAGGAACTGGGTCATTTCCATCACCTGCAGCTTCACCTCAACCTTCTAGGGGTGTTCCAGGGTCCTATGACCAAAACAACTTTCCAATGGCTTCAAGAATGTCATCACCTCACCAGAAGCCCTTCTATGGTTTGAGATCCACAACTGACTCCTATGGAAGGGGTTTTTCTCATGGTGGAATGTTCCCACAGGCCAGTAATTATGGGGGATCCGTCACCAGCTTTGGCCTTAATGGTAGAAGTTTGATCTCAACCGAGAAAGGGCGCAGGAGGGGAAGGGGCAATGCACTTATTTGCAGCTGCAATGGTCCTCTTGACTTTCTTAATGAGCAAAGTCGGGGTCCACGTGCAACTAAGCCTAAGAAGCAACCAGAGGTTGACAGTAAGGATGAGGTGCCTACTACAGGAGTTGGTCGTGAGTTATACAACAAGCCTGACTTTGTTATGGAGTACACGAATGCGAGGTTTTTCATCATAAAATCGTACAGCGAAGATAATGTGCACAAGAGTGTCAAATATGGTGTTTGGGCTAGCACCACAAATGGAAACAAGAAACTGGACTCAGCCTATCGCGAAGCTAAGGAGAAAGGAGAGCACTGTCCCATTTTCCTGTTATTTTCGGTGAATGCCAGTGCACAATTCTGTGGTGTTGCTGAGATGATTGGACCAGTGGACTTTGAGAAAAGTGTGGATTACTGGCAGCAAGATAAGTGGACTGGTCAATTCCCTGTGAAGTGGCACATAGTGAAGGATGTTCCCAATAATCTTTTCCGACATATAATTCTTGAAAACAACGACAATAAACCTGTAACAAACAGCAGAGATACACAGGAGGTGAAACTAGAGCAAGGAATGGAGATGCTGAAGATCTTTAAGAACCATGATGATGATGCATCAATCCTTGACGACTTTGAGTTTTACGAGGAGCGTGAGAAAGCGCTGCAGGAAAATAAGGCACGCCTGCATCAGCAACATCTACCCAGTTCTATTGTTATTGAGCCCAAGAAACCCTTGACTGCACCCAGTGACCTCGTGGGCCATATCACCAAGAGTTTTGCTGAGGCTGTGCGGCTTGGTGAGGCCAAGACTGTAAGCCATTTGACTGAGAAGGTTTCTGGGGGTGATCCGTCTATTCCTGTGAAGCATGTTGAAGTTAAGCAGAGTGGTTTATCTTAGGAACTCTTGATCGATGTGAATGAACTGTACCAAAAATTCACCCATACGCTTCCTGATCAAAATGTCGGGAATGCATATGCAGATGGATGATGATGAAACCCAAGACATCGGCAAAAGCATGCATGCACACTAGGGTAGGTCTTTGCCAACCTTGGAAGCATAGTTTCTTGAATAGTTTCTCTCTTTTTTTCTTCTTTCTTCCTAGTATTTTCTCCCCTTCTCTTCGCATCATATGATGATTCCTTAGTGTCTAGCCTCAAGGAGAGTTGCTGTTTTTGTGTAAGCCTCTGTAAGTTTCCTGTTCCATCACATATGAGTAAGGCCTTTTTGTTTCTTTTTATTTAAGTAAAAGATCCATCTTTTATGTACTGTCGTGGCAGTTTTATTATACTATGTCTGAACAAGGCCTATTCACTATGTAAGCAAAACATAAACGCTATCCAGGTGACCTGGTTGTGATGACTACAGTAATAAGTAACTGAATAATTTTTTATGTT
>XM_312219.5 Anopheles gambiae str. PEST AGAP002709-RA (AgaP_AGAP002709), partial mRNA 
ATGGATTATAATTATGATACCGACGAAGCGTGGTACGCGGCCAGCCTGGGCGCCGGGCCCTGTACCGACGTGTCAACGCTGAGCGTGGCGCCGCTCTGCTCTAGTCTGAATCGGTACGGCACGCTGCCGAGCACGGTGCCGATGCCGACGCTGTACGCTTCCGAGGGCCAGCGCAAGCCGAAGCTTTCCATCATCGAGCTCGTGCTGTACAACATGGCCTCGATGCTGGCCAGCATTGCTTCCGGGTACGATGTGCGTGTGTCGAACGTAACGCCGCTCCATCCGCGGCTACACCCGGGACCGTTGCAATCGTACGAATCGTACTCCCAGCCCGTGAGTCCGTACCACCACCATCGGCACCAGCTGCCGCCAATGGTAGACCCACATGCGCTGCAGCTCGAAGGTATGGTACGGTTGGACGGGATGCCGCCATCTTTAACAACCGCGCCACACACGGTGGACAACGCTCTGAGCCAGGAGGCGTACGAGGAGGAGCTGGCTCACCAAGCTCAGGATGATAGACTTTACGCACAACACAGCACACCGTACCAGGAGACGCCGGAGAGACAGCGGCCGAGGAAGGTGCATACTCAATCGACCAGCCCAAGACAAGACGAGCGGGCGCTGAAGTACACGGACTCACCGCAACACTATCTACCATCGACGATGTCGACGACGAGCGGGCTCGGCTCGAACTACACGCCCTCGGGACCCAGCTCGTCCTTCAGCGTGGGAGCGGGAACGCAACCGCCAACGCCTTCGCCCCGCCGAAAGTCTAGCGCCGCGTCGTTCATGGATTTTGGCGATCTGCCGGAAGAGCGCGAAAGTAGAGCGGGCCTCTACATACCGGGCGAGTACGACGGGTACACGCAGCACAATCCAATCTTTAACGCGGGTACGCGCGGTGCCACTAGTAGCTACATCGGATCCCATTATTTCCCCTACCGGCCGGCGATAAACTTTGCGTTCGAGCGGGAAACGAAATCGTACGGCGGGGAACCGGTGTACGAAGACCATCACTACGACAGTGCCTCGTACCATGATTACGCGTACGAAGGTCCCGCCGGGGGACCGTCGGGAACGGCCAGCGCTAGAGCAACGGGTACGCGCGTCCCAACGATGGGCATCAGTGCGGCGGGCCATCGCCGGACGCACTCCAGCATTTCCAGCACGCTGCACAGTAGCAACGTTAACCAAGGGTTTCACATGGAGGGCGAAGAGATGGACGGTGCCGGAACACGCCTGATTGATGACGTGACGTACAAGCTGGGCGATCTCTACCTGCCCGGGGGCGGTACGGATGCGGCTAGCCGCTTACCGGCACCGAGCACCGCGAAGCTGCACGAATCTCCCCTGCCTGCTGCCTTTCATGCGTCGAGCCGAATGCATCAGTACGAGAACGTGCCCAACTTCTTCCGGCGGCAATCGAGCCTGCAGCAGGCGCACTACTCCCCCAGCAGTGCGCACAGTGGACATCTGTCCGGCGATTTTATGTCCGGTGGTGCAATCCCGGAGCCGGAGGAGCGTCCGTACACGGTGCTGGGGCTGACGGAGCACGGTGCCGACGGTGGATTGCTGTCCAGCAGCTTAAGACCCCAAACGAAGCTGCGCTCCAGCATGAAGAAGTACACGCACTCACATCCGACGCATCAGCAGGCCACCGCGTCAGCTGGCGGGCAGGGTAAGTACGGGGCGGGCTACGGTATGCACGGGACGACCAGCGCCACGAACCAAACACCGCCCGACAGTCTCACCAGCGACGACAGCTCGTACCTGAGCGCGAAGGACAACTCGTCCTCGATTTCCTCGCAAAGCCGGGTGCGCTTTACGCCGGAAATTGTGCTCGACGTGGACTCGCCGCTCCAGTCGCCGACGTGCTACACGGGCGGAGCTGCTGCGGCGGCTGCCCCGTCCGGCCATGGCTTAAAGGACAGACGCAGCTCCTCCTCCGGCAGCACGATGCTAACGGCAACGCCCGGTTCGGGCACGTCCTCGACGTCGATTTCGGGCCGGCGGTCGAATGCCTGCGACACGAGCCAATCCTAG
>XM_025275219.3 PREDICTED: Bubalus bubalis NPR3 like, GATOR1 complex subunit (NPRL3), transcript variant X9, mRNA 
TTGCCTCATACAGTCGCGAAGTCTCGCGAGCCTCTTGCGAGTGTGGGGTGTGGGACGGGCCCGTGGGCTCGGTGGGTCTGGCTCCGCTCGGCCCCCCCGCCTCCAGCCGGTCCTCCTCAGGGCGGTGGGTCCCGGGTCCTCAGCTCTCCCCCGGGCAGCTCCTCCTCAGAGCCCCACCCGCCCCTCGCCCCCGACCCGTCCTCCTCAGGGCGCTGGGTCCCGGGTCCCGGCCCCTCCCCGGCCCGACGTCCTCGGGGCCCCCACCCAGGCCCCGGGCCGACCCCTCCCCGGGCTCCCGGCAGGATGGGGGACAACACCAGCCCCATCAGCGTGATTCTGGTGAGCTCGGGGAGCCGGGGCAATAAGCTGCTGTTCAGGTACCCTTTCCAGAGGAGCCAGGAGCATTCGGCGTCCCAGACGAGTAAGCCTCGTAGCAGATACGCTGTCAACAGTGCCGGAGAGCATGCTGAAGACCAGGATGGGGACCCCAGGTTTTCAGATGTCATTCTGGCAACAATTTTGGCAACCAAGTCTGAAATGTGTGGCCAGAAGTTTGAACTGAAGATCGACAACGTGCGGTTTGTTGGGCACCCGACGCTGCTGCAGCACACGCTGGGCCAGGTCTCCAAAACTGACCCGTCCCCGAAGAGGGAGGCTCCCACCATGATTCTTTTCAATGTGGTGTTTGCACTGAGGGCCCACGCGGACCCGTCGGTGATCAGCTGTCTGCACACCCTCTCCCGCCGCATCGCCACCGTGCTGCAGCATGAGGAGCGCCGCTGCCAGTACCTCACGCGGGAGGCCAAGCTGATCCTGGCGCTGCAGGACGAGGTGTCCGCCACGGCTGACGCAAATGATGGGCCTCAGTCCCCATTCCACCACATCCTGCCCAAGTGCAAGCTGGCCAGGGACCTCAAGGACGCTTATGACAGCTTGTGCACGTCTGGGGTGGTGCGGCTCCACGTCAACAGCTGGCTGGAGGTGAGCTTCTGCCTGCCCCACAAGATCCATTACGCGGCCAGCAGCCTCATCCCGCCAGAGGCCATCGAGCGCAGCCTGAAGGCTATCCGCCCGTACCATGCCCTGCTGCTGCTCAGCGATGAGAAGTCCCTGCTGGGTGAGCTCCCGCTTGACTGCTCCCCAGCCCTGGTACGCGTGATCAAGACCACGTCCGCTGTGAAGAACCTGCAGCAGCTGGCCCAGGACGCAGACCTGGCTTTGCTGCAGGTTTTCCAGCTTGCGGCCCACCTGGTGTACTGGGGCAAGGCCATCATCATCTACCCGCTGTGTGAAAACAACGTCTACATGCTGTCTCCCAACGCCAGCGTGTGTCTGTATTCCCCGCTTGCCGAGCAGTTCTCACGCCAGTTTCCATCTCACGACCTGCCGTCTGTCCTTGCCAAGTTCTCCTTGCCTGTCTCCTTGTCAGAATTCAGGAACCCCCTGGCCCCCCCTGTTCAGGAGACGCAGCTCATCCAGATGGTGGTGTGGATGCTGCAGCGCCGGCTCCTGGTGCAGCTGCACACCTACGTCTGCCTGATGGCCTCGCCCAGCGAGGACGAGCCCCGCACCCGCGAGGACGACGCGCCCCTGGCCACCAGGGTGGGCGGCCGCAGCCTCAGCACGCCCAATGCCCTCAGCTTTGGCTCCCCAAGTAGGACTTCCTGCCCCTGGGCATCTGTCTGGAGGGGGCCAGCAGCGATGACATGACCCTCACCAGCCCCAGCATGGACAACTCCAGCGCTGAGCTGCTCC
>XM_017686507.2 PREDICTED: Pygocentrus nattereri complement C1q-like protein 3 (LOC108413828), transcript variant X2, mRNA 
AGCAGGCAGAGAGAAAGCAGCTGACCTCCTCAGTGGTCTCCTGTGACAGCAGACGTTGAAGATGTTTGGGCTGGAGGTGTTTCTCCTGATCTTCCTGTGGAGCACACAGGCTCAGGACGTGCTGACCCCCAGTGTGGACATTATCAGGGAACTGGACAAGCTCAGAGCTCTGGAGCGAAGAATGAAGGCCATGGAGGCTGAAATGGCTGAGCTGAAGATGATGAACGAAGGACTTTCCAGGAGCCTGGGGATCATTACGAAGACCATCACAGATCAGCCCAAAGTGGCGTTCTCCGCTACGCTGTCCAACCTGCAAGATGGTTTTAAGTTCCTGGGCCCGTTCCAGAACACGGTCACCCTGGTGTACGAGAATGCCTTCACAAACATTGGCTATGCCTACGATCCACAAACAGGAATCTTCACGGCTCCCCTGGGGGGAGTGTATTATTTCAGCTTTTCACTCTTCCACCCGGTCGGACCTGGTCCTCAGGCCAAGACCGGGGCGTCCTTGGTGAAAAACGGGGTGCTGGTGGTGGCTGCCACAGATAACGCCCCGGGGGCGGATTCTGAGGACACTTCTGGAAACTCCGCCTCCATCCGGCTGGAGGAAGGAGATCAGGTGTACGTGCAGCTTTGGGAGAAGCACAGGGTCTACACAGACGGAAACAAGCGCAACACCTTCAGTGGGCATCTGCTCTTCCCAGTGTGAATCTCACCTCACTTGGCTGTGGACGCCTTCAGCTGATGCTCTAATGCTGGGCGCCTAAAGTTGTAGCGTTGTAGTTCAGGTTAATTCAAATGTACTATTAGTAGAGCTTCTATGAAATAAAACAGTATGACTTCAGTTTACTTCTTATGTACTACACCGCTTCCAAAAAAGCTGTGACGTTCTGCAGAATGTAAATAAAAACAGGATGGTCTGCAAA
>XM_029369271.1 Trypanosoma conorhini pre-rRNA-processing protein TSR3 (Tco025E_02343), partial mRNA 
ATGGGAAAGCCAAAAGGCCACCCCAACAGAGAGGTGGGGCAGCGCAGCAGGAAAAGTGCGCCCCGAGGTGGACCTCGCGGCCATGCGCCGTGCAACAACCCTTGTAGTGTGCCGCTGGCGATGTGGGACTTTGAGCAGTGCGACCCCGACGCCTGCTCGGGTCGGCGCTTGTATCGGCACAATGCATTGCGCCTTTTAAAGCTGCGGGAACCCTTTCATGGGGTCGTTCTCACACCAACAGCCACAGAGGTTGTGAGCCCTGCCGATGCGGACCTCGTTGCCCGCTCCGGTGCCGCAGTGGTGGACTGTTCGTGGAAGCAACTGCATGCGGTGCCGTGGCGGCAGATGAAGATGGGTGCCCCACGTCTGTTGCCGCTTTTAATGGCCGCAAATCCCGTCAACTACGGTCGGCCGTCAAAGCTGAACTGTGCCGAGGCACTGGCAGGGGCTCTCGCCGTTGTTGGCCGCATGGAGGACGCGAGGTCCGTCTTGTCGTACTTTTCCTGGGGAGAAAGTTTTTTTGACGTTAATGCGGAGCTCTTGGAGGGCTACAGCGGGTGCGCCAACGCGGCAGACGTGGTGGCTTTTCAGGAGCAGTACGTGGCAACTGAGGTGAGCAAAAGTGCGGCACGGCGGGAGATTGACTTGAATAGTATGGATCTGATGGATGCGGGTCCGCTAAACCTTAAACGAGGCAAACTAAGGAGTCGGCATACATGGCAGAAAGACGATGACAACGAGGAAGAGGAAGAGGAAGAGGAAGAAGGGGAGGAGGAAGAGGAAGAGGAAGAAGAGGAAGAAATAAAAAAGGATGCTGAAAAAAAGGAGGTTCAGTTAGGGAAATTGGAGACGTCAGGTGATGGGGGGAGTCTGCGTTCTTAG
>XM_037232021.1 PREDICTED: Pollicipes pollicipes tyrosine-protein phosphatase 99A-like (LOC119108450), mRNA 
GGCGGGCGCGTGGTGTGTATGCGCGCCGGGCCCAGCGACTGCGGCAGGGGCACGTACACCAGAACCACCCTGCGCGGTTGGTAGATGAGCCGGCTCCAGGAGGTAGACGTGCGGCCGGTCGGGTAGACACGTTTTGAGCGTGTCTGCGGTGTTTAATCACTACTGTGAGTGACGAAGACTTTCTGTGTGACAGTCGTGCCATCTGGTGTCACACCAGTCAGAACCATGTTGAGAAGACGGGCTTTGGCAGTGACAGTCGTGCTCCTCGTTCAAGGCTGCTGCGGGGCGTTCGACACGCTCTTCTCGAGATCTAAAGCGAGCGTCATCCTGCCCTGCGACGGCATGACCGACCTTGACCCAGCCCAGGTCACCGAACTTGCCTGGCTCTGCTACGGCTGCATGGAGAGCATGATCGTGTCGGTGGACGCGGCGATCGAGACGAGGCTGCTGGAGTTCGTGGACGGCACGGCCACCGTGTTCCACAACCACGGCCGCATCAGCCTCCTGCCCGACACGCTCTCGCTCAAGTACGACCCGGTCGAAGTGAAGGACAGCGGCGAGTACCACTGCCAGGTCAACGGCCGCGAGCCCATCTCCGGCCTAATCAAGCTCGTCGTGCAGGATGTTCCTTCGGCACCCGGAAGGCCTCTCATCACCAACTTCACGTCTCGGTCAGTGTTTTTATCCTGGACTCCGGGCAGCAAGCAGAACAACAGCCCCATCAGACACTACATCATCCACGTCAAAACTGGCGAACATGGCGAGTGGAGCCAGCAGCCCATCTCCACGCCAGATAACCAGACATCGTTCGTGGTGGCAGACCTGCAGCCGTTCACCGCCTACAGCTTCAGGGTGACAGCCGTCAACGGCATCGGCGCCTCGCCAGACGGCATCGCCTCCTACCCCATCATCACGCTGAGAGAAGCCCCAGCCGGGAAGCCGGCGATCCTGGCGGCGCATAATACAAGCTCCACTTCGGTCCGGGTCCGCTGGAGGCCGCTGTCCAAGGAGGAGCTGCGTGGAGAGTTTCAGTTCTACAGGATCACTTACCGGGAGCGGAGCAACGTCAGCAGCCGGATTCGAGAGCTTCGGATCAAGGATGAACGTGTTCAGAGCCACACCATCTCCGGGCTCCGTCCGTACACGCAGTACATCATCTCGATACAAGTGGAGAACCCGGCTGGCCTGGGTCCCAGCTCCACGGTCGTGGTCACCACGGACGAAGGAGTTCCCGAAGCGCCACGGCAAGTGTCTGTCGTGAACGTGACAGATACCACGGTCACCATCTCGTGGCTGGCTCCGAATCGCCCCAACGGCCTGATCGAGGGTTACCGTATCTACTTCACTACCGGCAACTTCACCAATGCCACTTGGCTCAAGCTGCCCGTGGATGACATGCAGTACACGCTGAAGAATCTAGAGCCCTTCTCCAACTACTCGATCGCGGTGAAGGCGTTCACGCGGAGCGTGGAGGGCCGCGAGTCGGCGGCGCTGGCCGTCACCACCGACGTGTCGGCGCCGGCCGCACCGCGGCTGACCTCGCTGGCATGTCAGCCGGACGCGGCCCTGCTGCTCGCCTGGCGACCGCCGGGCCGCGTCCGGGGCCGCATCGACTTCTACGTGGTCGGCTACCGGACCGGCCAGGCGACGGCGCTCACGGAGCTGCAGGTCACCGCCGACTCGGCAGAGCAGGAAAGCATGCTGCGCTTTCCTGCTGGCGCTGCTGGCCCTGGCCATCTGGAGGTGAGGTCACTGCTGGCCCTGGCCATCTGGAGGCGGTACTTCCAGTCGTCCTACTACTACAGCCTGGATGAGCCGGTGACGGCACGCGCGCCCGTGACCTCTGACCCGGGCTGGGAGCTGGACGGTCCGAACGGTTCGGCCGGCCCGATCCCTGCCGATGCCTTCCCGGTGCACGTGGCCAGCCTACACGCCGATTCGGACATCGGATTCTGCAAAGAGTATGATGAGGTGCTGGCGCACACAATGAAGTTGGAACTCTCTTCGAACGTGTCACAGACCGAGGAAAACAAGCAGAAAAATAGATACCAGAACATTGATGCCTACGACCACACCCTGGTGCCCCTGAGGCCCCTTCCGGGCCAGCGGCGGGGAGACTACATCAACGCCAACTACATCGACGGCTTTCTCGTGCGCAACCAGTACATCGGCGCCCAGGGCCCGCTGACCGGCACTTTTGCGGCCTTCTGGCGGCTCATCTGGGAGCAACGCATCCAGATCGTGGTCATGATCACTAACCTGGTGGAGCGGAACAGGAAAAAGTGTGACATGTACTGGCCGAAGGAGGGCACTCAAGTGTATGGAGTTATACAAGTGGAGCTTTTGGACCAGAAGGAGCTGTCGACCTATACGATAAGAAAAATGCTCATCAAACATACAAGGCACAAGAAGAAGAAGGGCGTGTGCAGTGAAAGGATCATATACCAGTACCACTACACCAGCTGGCCGGACCACGGCGTACCAGACCACCCGCTTCCGATCCTCAGCTTCGTCAGAAAATCGGCCGCTGCGAACGGCGCCGGCGCGGGACCCATTCTGGTCCACTGCAGTGCCGGGGTCGGAAGGACGGGCACCTACATCGTCCTCGACGCCATGATGCAGATGATGAAGCTCCGGGGCGCCATCAACGTGTTCGGCTTCCTCAAGTACATCCGCACGCAGCGCAACTTCCTGGTGCAGACTGAGGACCAGTACATATTCGTGCACGACGCGCTGTTAGAGGCCCTGGAGGCGGGCGAGACGGATGTGCGAGCCACGCGGCTCACCGAGTACCTGCACCAGCTGCGCTCCTACGACCCGAACCAGTACCCCCGCTACACGCTGGACCGCCAGTACCAGCTGGTGACATCATACCGGCCGACGGAGAATGACCTGGCAGGGGCCTTGGCTCCGTGCAACCAGGCGCGAAACCGGAGCGCCCAGTTTGTGCCGTTGGACCGGTGGCGGGTCCACCTCTCTCCCCGGCCGGGCGTCGAAGGCAGCGACTATATCAACGCCACTCCCCTGATAGGTTACGAGAAGCTGTGCGAGTTCATCATCACTCAGCACCCGCTGCCGCACACGGTGGACGACTTCTGGCGAATGGTGTGGGAGCAGAACGTGCAGACCGTGGTCGTCCTCTCGCCCATCGACGACCAGCATTACCCGCGCTTCTGGCCGTCGCCGGACGATGACATCGACGGCGACAGCTTTCGGGTGCGGTTCGTCGACGAGCCGGCGTCGGCGGCGTACGCCACCGTCGACCTGGTGCTGCAGTCGGCGCAGGACGACTACCAGGTCACGGTGCGCGTCATCTCGTGCGCCGCGTGGCCGCACGGTGCCGCCGCCTCGCCGCACCACCTGGTGGACGCCGTGCAGCAAGCCACGCTCCAGTACCAGAACGGACCGGCGGTGGTGGTGGACAGGTTCGGTGGAACTGAGGCGGCCACCTTCTGCTGCCTGACCACGCTGTCCAAGCAGCTGGTGAACGAGAACTCCCTAGACGTGTACCTGTACTCCAAGCTGTACCACATGAGGCGTCCAGGAGTCTGGCAGACCCAGGACGATTTCACCATGCTGTACCACGCCATGGAGGGATTGGTCCGCCCAATACTGCCCCACTCTCCCAGCAGCCAATCAGAAGCCGAAGCCCTTCTGCGTCCACCCAGCCTGCGCACGAGCACTATGAGGGTACCTCCCGACGGAAGAGAGTGCTATGTGCCTGCAGAGTGTGTCTGACGTTCTGTCAGAGACCGTACGTGACTGTCACAGCAGAGGGTGCTCCGAGCCCGCCGAGTGCCTCTGACTCTGTCAGAAGCCGTGCTCCGTTTTGAACTGCAGGGGGAACCACGCA
>XR_005812777.1 PREDICTED: Oryza brachyantha uncharacterized LOC107305249 (LOC107305249), ncRNA 
GGAACTCACTAAAACCGCTCGCCGTTCGCTTCTACACCTGACAACCCCCGCCGTGCCTCTATCGACCCTCCCTCCTCCGCCTCGAGCCTCCGCCGCCGCTCAGCAGTTGCGGACCTCTCTCTCTCTCTCCCCGGTGCGAACCGGCCGTCACCGTCGGGAAGGATGGGGTGCGTGCCATGCCGGCACTCACCATCTCAGCATCCTAAGAACCGCAGTTTTGGGAGCTGGCCGAGTTCTTTCGGTATGTCACCAGAAAATTGGCAGCCAACAACGCTCCTGACATGCACAAGAAAAAGCTTTCAAGGTTACTCAAGGATCCAATGGTCGATGGAAGTGGACCGCTCAAGTTGTTGTAAGATAAGTCCCTGCAGATGATCTTAATAGATTTATCACAACCAAACAAGGTAAAAACTTTCACAGGTAGATTCAGCAACATTAAGGAAGAGTCCATGTTGCAGCTCTTGTTTATAACACTCAAAAGCTTTCTGTAAAATTGACAAACTTGTAGTACATACAGGTACTGTAGTTCTGACAATGACTGTACATCTCCTGAAAGTGACCCAGACAATCCAAAACTTGACAGCCTACTGTAAACCACAAGAAAAAAGACATCATTTAAATGAACATAGAAGAAACAGCATCTTGATTTAATGAAATATGTGTGTGTGTGAGAGAGAGAGAGAGAGTTGATTCAGATAAAATGGTTCTAACATCGAGGTGACACGATTCTGGATGCAGGATACTCCTGGCCATTTTTGTCCACAAGGATCATTTCCAACCCAATCCGATAGCTTGGACATGGCGTTATCCCAGGAAGCTGCTATGCCTTTGAGGGCAGAGGCTGTAAGGCAATGAGAGTGAAGAAACATCATCATGCAACAAAAGCTAGTTTTTACAGCAAATTAACTGGAAAACACAAGGAGGCTGATGAAACACTTACTATCTTGTGGATCTGTATCTGCTGATATGATGAGAGCACGGTGAATAATGATCAGGGAGACTAGCAGATGGATGATCCTCCAAGAAGTTGGAGGATGCGCCATGGTGAACTTTATTTCAGGTTGCTGAGAAGCCCTTTCTTGTGTTACCAACTCTCCACTACTCAATTCTGAGCACTTGCAGTGACATGATGTTATGAAGGCTGAATATGCACATCAATTGTGAACTGGTCAATGGAATCAGTCAAGAATGTGGCTTTCATCTCCTCTCAATGGATTGCCTTTTCAAATTCATCCAATTAATGGTGAAGTCCCAGATTTTAAAAACCAAGAGAGAGCTCACAATGGGAGTCAACGGTGAGCTATTGGTTGGCAGGGAGCATGAAGTTCTCTCCTATGAAATAGGATCCGAATGATTCAAATTATTTTTACCATGTTTGAAGTATCATTCCAATTGAATATAAAATAATTGCTGCTCCTTCTAAGACACTTGAATGTTTATTGCATGCATATTATGTTTTGTTGAATAGTGTAGATTTTAGTTGTCGTATATTCATGGTGGGATTGACTTTAGAAAACTATTGGGACCATTTTGTTGTGTACATGTGCTGAATCTGAGGTTTATTCGAATGATTTGCTAAGAAATGGTCTGGTTTGAACACAAAACATCTGATATTTCTAGACATAT
>XM_034077493.1 PREDICTED: Pseudochaenichthys georgianus non-SMC condensin II complex, subunit G2 (ncapg2), partial mRNA 
CGCGGGCTCTTATGGCAGACTGTCGTTCTGCGGCTGTCGGATCACAGCATTATTAATACAAAGGAATATTGGTGTTGTTTCACGTCTTTTGGAGAACCACAAACATGTCGAAGCGAGAGGCTTTTCTAGAGTCCTGCTGTACGGAGAATGTGGACGATTTCCTCCGCTTTATTCAGCTTAATCGGAACAAGACGGAGCCCTTCGATGTGGAGGAAGTTCTGCAGGAGATGAACAGAGACCAGAGGCAGACGCTGTGGGGGAAACTGTCCTCTCTCCTCCAGGACGTCCTGCAGGAGGAAAGGAGAGAGGAAGGGAGTGAGGAAAGGAGAGAGGAGGCCATGGAGGTGGAGGCAGCTGCAGACCCCAGTCACGTGAGGTCTGTCGTGGACGGTGTGACTCTGGTTGCTGCCGAGTCCCTAAAGGTCCTGCAGGACGGAGAAACCTACAGTTCTCTTCTGGAGATCATCCACAGGCTGCATGATATGTTGGAGCTGCAGCCGGTCTCCGAGGCTCCGCTGCAGCTCCAGATCCTCAGACTTTGTGACGCCTGGTGGAAGAAGGATCTGAAGGAGAAGGAAACGTTCGGTCGCAGCGCTATGATCATCGCTCTGACGAGGAGCTTCGACCTGAAGAAACCGGGCACAGAGATCCAGAGGGTGTGGAGTCTCCGGGAGGTTCTCCTGGGTCTGGATTACACGTCGGAAGACAACAAGCAGATGATGGATCTGCTGCTGAAGTGCTTCCAGCGCCCGGCCTTCCTCAGGAACGACGATGGAAAACGCTTCCTGGTGTTTCTCTTCAGCTGGAACATCAACTTCATCTCGGTCATTCACGGCACCATCAAGAACCAGCTGGAGTTCTTTAGCATGATGGTAACGGCTCACATCGCTGAGATCTACTTCAGAGCCTGGAAGAAAGCCGGCGGTGATTTCCTGGAGAAGATCGAGAGCTCCTGCGTTCAGGATCTAATGCAGAACGCCATCTTCCTCCACAGATCCTCTCCTGTGTACGCCAAAGTCCGAAAGATCGTGAGCTACTTCCACTCGAGGAAAGGCTGTGAGAAAGTGGACAAGATGCTCTCCAATCTCTACAAGCCCATTCTGTGGAAAGCTCTAAGTGCGCCAAACTTCGAGGTGCGAGCGAACGCCACGCTGCTTTTCACCGAAGCTTTCCCGGTGCTTGACGTGGAAACCGGCAACAAGAGCACGGACGAGGCCATTCAGAAGCAGCTGGACACGGTCATGGTGCTTCTGGACGATCCTCACCCCACAGTTCGCTCTAACGCCATCTTAGGAGTGTGTAAGATCCTGGCTAAATACTGGGAGGTGCTTCCTGCCGCCATCATCACCGACTTCCTGAAGAAGCTTGTGATGGAGCTGGCGTTCGATTCGAGCTCTCCTGACGTCCGCTGCTCCGTCTTCAAGTGTCTCATCATCGTGCTGGACAACAGCCTCAGCCATCCCATCCTGGAGAAGCTGCTCCCGACTCTGAAATACAGTTTGCACGACAACTCGGAGAAAGTCCGCATCGCTTTCCTCGACATGCTCATTAAAGTGAAGGCTGTGCGAGCTGCTAAGTTCTGGTCCGTGTGCAGCATGGATCATCTTCTCGCTCGCCTCGCCATCGACTCGTTATCCGCGTCGAAGCGCATCGTGGATCTACTTTTCAAGTCCTTCTTCCCCGTGAACGAGTCGGATAAGGAGTGGTGCAGCCGCTGCATCACGCTCATCCAGATGAACCCCGCCGCCGCCAGGAAGTTCTACACACACACACACAAACACACCGCGCCCACCAACATCATAAAGCTGATGTTGGCGATTCGCCGCGTTCTGAACTCTTGCCTCCAGGCCCAAGGTGACCTGTCTGAGATCAACGACACCAACAAGGAGAACAGCGCA
>XM_013920937.2 PREDICTED: Limulus polyphemus tyrosine-protein kinase Abl-like (LOC106461142), mRNA 
AGCGGCCCCTATGGACGGCGTAGAGGCTTGCTTTGAGAGTGTTCGGTCATTCGTTTCAGAGGTTTTTCAATATGGCTACTAATGAAATTGTTAGTGATTAAATTATTGATAGTCACAACTTGCTAACATGCTTGTACTTTTTATAATTGGCATATTTACGTAGTTTATCAATAATGCTATTAAAGGTCTCCTAAATAAAAGTTATGTTCTGAAAATATACTGCATAGTAAGGATCCCGAATAGCCTGAAGGTCGTTTTGACGTTAGGCTATGGGAGCCCAGCAGGGCAAGGAAAACCGTGGAAGTGGATCTTCGGTTGGCAGTGGACATGGTGGAAAGACTGGGAAGAGCTTTAAAAATAGATCTAAGGACTCTAGATTATCATCAGTTTCTGGAAATATATTTACAGAACACAATGAAGCCCTGATGCAAAGCAGGCCTTTGCCAGATATTCCTGACTTTGGAGATCATATTAGCAACTTATCCATCCCTAATGATGGGTCATCCCGGTGGATGTCCAAGGAGAATCTCCTGGCTCCTGAAGACTCTGATCCCCAATTGTTTGTAGCACTCTATGATTTCCAATCTGGTGGAGATAACCAACTTTCTCTCAAGAAAGGGGACCAAGTACGAGTGCTATCATACAATAGAACAGGTGAGTGGTGTGAGGCACAGTCACGTTCAGGTCAAGTTGGTTGGGTCCCTAGCAACTACATCACTCCTGTCAACAGTTTGGAGAAACACTCCTGGTACCATGGGCCCATCTCTAGAAATGCAGCAGAGTACCTACTAAGCAGTGGGATCAATGGGAGTTTTTTAGTCAGAGAAAGTGAAAGTATTCCTGGTCAAAGGTCAATATCTCTCCGTCATGATGGACGAGTATACCACTATCGAATTAATGAAGATGGCGAGGGTAAAGTGTATGTGACGTCTGAATGTCGATTCAATACTTTGGCTGAACTTGTCCATCATCACTCCATGCATGCCGATGGTTTGATCACCATGTTACTCTATCCAGCTCCTAAGAGAAACAAGCCTGCTGTATTTGCTCTTAGTCCAGAACCAGATGAATGGGAAGTGGACAGGACTGGTATTGTCATGAAACACAAACTTGGAGGAGGACAGTACGGAGACGTTTATGAAGCTGTCTGGAAGAGGCATAACATGACAGTAGCTGTTAAAACACTGAAAGAAGATACAATGGCCTTAAAGGATTTTCTAGAGGAAGCAGCTATTATGAAAGAAATGAAACATCCAAACTTGGTCCAGCTAATTGGTGTTTGTACAAGAGAACCACCATTTTACATAATCACAGAGTTCATGCCCCATGGAAACTTGCTGGATTTTCTCAGGAACGCCGTTCGCGATGATATCACGGCCGTGGTGCTAATGTACATGGCTACACAGATAGCTTCAGCAATGGCTTATCTAGAATCCCGTAGTTTCATACATAGGGACCTAGCAGCAAGAAATTGTTTGGTGGGAGAAAATCATCTCGTAAAAGTTGCTGATTTTGGTCTAGCTCGACTGATGAGAGATGACACTTATACTGCACATGCTGGGGCCAAGTTTCCAATTAAGTGGACTGCTCCTGAAGGCCTTGCTTATAATAAGTTTTCTACCAAGTCTGATGTTTGGGCTTTTGGCATCTTACTGTGGGAGCTGGCCACATATGGAATGTCTCCTTACCCTGGGGTTGAGCTAACAGACGTTTATCATATGCTGGAGACTGGCTACCGAATGGAGTGCCCACCGGGATGTCCACCAAAGGTTTATGAACTAATGAGACAGTGCTGGTTGTGGGAGCCTCTTGATAGGCCTACTTTTAAAGATGCTCACCACACTTTAGAAACTATGTTCCAGAATTCAAGCATAACAGAAGAAGTGGAGAAGCAGCTAGAAAGGCAGACTCCTGCACCGTACAGGTCCTATGGAGAGAGTTCGCCAAATATTTTTCAGCGTGATGAAGAAGGAGATTATCCACTAACTGAACAAGGTTGTCATAGTGGAGGTTCAACCAAACACCAGACCATTATCTCCACTAGATCTACTTTGGTTCAACTTCGAAGACATGGCCCTCGAAGTAAACAGGCACCTGTACCACCAAAGAGGACCAGCACTTTTCGGGATAGTGTCTATCAAGACAAAATGTATGGAACAATCGGACAGGAAACTAATAAAAATATTCTCAATAATGGTGGTGAGAGAGCCTTTGAGACTAGTAACAGGAAAGCTCAGGAGATGAACAGCAATGAAGAAGGGGAATGTGAAATAAGAGAGAGAACTCCTGATACTGAGGAATCTGATACTCATACAGCAGCTTCAGTTGCTAGTGTTCCAGCAATGTCGCTAAACCAGCAACATTCTCAGCAAAAATTGAAAAAAGCAAGGACCTACCCTCCTAATATTCAGCAACATAATAATACAAAAGAAAACAGTTCTTCAAATAAAGCAAGAGAACCCAAGAAAGTACAAGTTGCAGCTCTAGAAGTTCAAAATGTGAAACGAGCCATTAATCGATATGGGACACTTCCCAAGGGAGCAAGAATTGGTGCATATTTAGATTCACTCAGGGAGCATGGTCTCCATACTGGAGCTAAGTATCCTGAGCCTGTTGTTGAAAGTGAACCACAAGCTTTTAGTGACATAGGATGGGAAAGTGCAGCTTTAGATCCACTTTCCCAGAAACAGAATTTTAGCAACATAAATAATACTCATAAAGGAGAAACTGGAAGCCATTTCTCTTCTAGATATCCTCCTCCAAGTCGGCATAGACACGAATATGATGGGGTTCATCATTCACCTCATGCCTTTCTACAAAGGCAAAAGTCAGATCTCACGTACTCCAAGAACAATGACACATTTGAAACAGGATCTATTCCAGACTCTAGACACCTTAGTTCAAAGCCTATTCCATCTCCTAGACTTCCTAGAAGTCAGAGGGTGGATCGAAAATCCTCTCGTGATGGAAGAATTGAAGGACCACCTTGCATACCCCAGGAGATAAGAAATATTCACGATGTTGGTACTAACAGTGCTTCAAATGCTGGTGGTGAAACCAGTTTTCGAGATTATTCTGGTAGTAGTTACCCCCGGAATAATATTATTTCAGAATCCAGAAATGTTGATTCTCAGTCATTCTCATCTCCTTTTAGTTCTAATGTCTTTCGAAGGACACTCACTAAAAGACCAAAAGAAAGACCTCCAAGTCCTCCAAAGAGCCCACTTGTAAAAAGTGGTTCAATTGATGATCAGTTAGGATGGAAACCTGAGAGGATTTTTGATCAGAGTCCATCAGAAAGTGCACACACTGTGACTCCACTAACTTGGAGTGCTAGTGTAGACAGCCCACTTCCTCCTGGAAAAGTCAAAGTCCCATCGGGGAGTCCAAAGTCATCATGGAATATTGTATCTCCCCCTCCACCACCTCCTTGCCCAGAAGGTTTTCCTCCTCCTCCTGATTTTGTAAAAGATTCTCTGGAATCTTGCTCTGAACAGCAGACTGTGATTGAAGTTAAAGCTCCTTTAGTTGCCAAGGCATCACATAATAATCAAACTGCCAAGAACCCAGCAGCTCAGCTAGTCTCAGAACTCTTTGAGAGTCTTAAAATGAAAGCCAGAAGAAGAGCTGTAGAGATGGGAGATGCTTCTTCTCAAACCACTGAAGAAGTAGGAAGCTCTGCAGAAATATCAAAAGATCAGTCAGCTGTTGCACTGTCTCCTAAAAAGCAAATTCCTTCTGTAGACTTACCTGTAAAATCTGAATCTGTAAATTGCTCTAAGTTAGGCTATCAACAAGGAAATGAGCTTTCCAAAAGAATCAGCTCAATATTTGAAGCCAGCTCAAATAGGGAAAAAACAACTGGAGAATCACAGTCACAGTTTTATGTGCCCAGCAATAGACTCAAAAAGAAGACTCAAGATAATATAGAAAAAAGTGTCAGTGGAGATCTTGGCCAAAAAAATTTAGTTATACCAAAACTCAAAAGCAAACCTCCTGATAGAGATTTGGTAGAAATCTGCCAACCAGATAGATGTGAAGAAGAAGAAAGAAGACATAGTTGTGGAAGTATAACAAGTTTGAAGAAAATCTGGGAGAAAGAGAGCTCAAAACAGGAGTCGGAGCTAAATGCTGATGGTTCATGCATTGACAGTCCAAAAGTTGTGGCACGTCGACCAGAATCACTGAAAATAGAAAGAACACAGACTTTGGAGCTTGGAGATGATACTTTTAAAAGTGGAAACTATGAAACTGAACCTGTACAGAAAGCATCGCCAACCTATGTTAAAGAAAGTACTACGTCAAAAGCATTGTCTCAAGCATCATTAATAGGTGAACAAACAGAAGAACTAACTAATCAAGAAGATCAACAGAGTCATTTAAAAACTTCCCCTCAAAATAAAGAAACAGGAGGACAGTTATCCCCAGCGATTCCTAAACCAGCAGTTCCATTGAAACCACCAGTAAAAGGATCTCGAGCTGTTTTGCCTCCAGGTACCAGACCCTCTAAAACAAGTAATAAGCCCCAGGTTTTTCCTCGAGGAGGTATAGGGGGGTCTCCATCATCGCAGGCTGATGACGAAACACACGATAGCATAAGCAGCAAAGAAACTATATTGGAAATTTCTACAGCACTTGAAAATAGTATTCAGTTACTGAAAACAGCTACATCTCTAAGCAGTGGAAACGTAATGCAGCTGTCGGATAAAGTGCAACTTTTTCGAACTTCTTGTGGCAACTATGCAGAAAGTATCCCTCCACATGGGAGATTTCGCTTTCGAGAATTGTTAACAAAGTTAGAACGACAGGGTGAACAGTTGCGCACATGTAGCAGTAATAACAGTGCGTTCAGTTCCAGACTTTTTGAAGAATTACAAAACACGGTGAGGGACTTGGTAAATATGGTCCAGAGGTGAGCAGTGTGGTCAATATGTATAAAAACGTATATCAACTCTCATTTATATATCATGATATGTGTATGATTAGTTTCTTGATTTACTCATGAATTCCAGCATAAGAAAGTGGGATACATGGTCATCTAGTCGTAACTTTTGCTCATTAGTGAAATGGTGGTGAGAAAAGCTGACAAACTTACTTATAGTTACTACAACTTCAGCTGAGAACTGTCGTATGTACGCTTTAAATTTGTGATTTACACATTGTCCATGAGAACCAGCCTAAAAGATCTCTACTACGTGAATTAGATCCCTTAAAGTGCTTTTGAGAATGGAGTTCAACTAATACTTGTCATGTTAACACAGGTGTCATTTTTATCCTTAGAAAATAGTATTGTAAAGATATATTGATAATCCAGGAGAAGTGTAAGATACAAAATGTCGGGTATTTAATAAAAGTAGAGAGCAAAGCTATACAATTATTCATTCAGGGTTTGGTACAATATTACTCTTTATTCTCAAAGAAAATTAGATGTGTGTGTGTGTGTTGAGTCAGTCATGGTTCCTTTCATCTGTGAACAGTTGTTAACATAGTGTCACAAACAAATATATTTTGTAGTTTAAAAATTGATGTGTGTCGTTGTCCCCCCCCCCCTCCAAGGTAAATTTGTGGTTTGGACACACTTGCCTCGCAATGAGACAGTTAAGTGCATATTTCTAGGCTAAAGCTACATTGAATCCCATTTAACTTTCATTGTGAGTTAATGCTGGTCATAAGGTAAACTCTGTTGTACGTTTTATGGTTAAGAGTATTTAAGAATTGAATGTTTACTAATGTGGCTCTATCAGATCCAGCCCATTGTTGTTTTTGCCCTTATAAACAAATATGTGGATGTATTATATCTGTGTATTTAACTTAACCTTGTGCTACAGTGTCTGTACTAGTTTTTGTGACAGGGGTTAGTGGATGAATTCCTAATATGTATAGCAACATTTGCATTTCCTTTCATAATAAAGAAAATTCAGGTTTCGAAATTTTATCTCACTCAATTCAAATTATCTTAACTTTGTGGGTGGGAATACAAATTCTCATAGGGTTGGCAGTACAGGTGGAGTCGTCCAGTTAGAACTTTGAGCCATATTACTTACTTCCATTGGCTTTACGTAATGATAATAGGACATTGAGGGCACTTTCTATTTGATGCCTATCCTTTACCTTTGTCTTGGGGGGAGATTTCAGCTTATATATGTCATAGCACCTTTTTTATGCACAGTTCGCCCTTTAATTTCTCTTTTGACCTGTATTTGACCTGTACATATTTCGTGGTTTCTTTTACTGCAATATAAAATGTGAAGCCAGAATTAAGTTTAGTGTGAGTATGGTTTTATATGTATATTACAGGAAATATTTTGTGTTTTTTTGTTGGTTCTTTTGTAAGTTTCAAATAATTTTAACTTCAAGCAGTAGACAGGCCCATTTAAGAGAAATTGTACTTAGTATGAGAAGATTTCTTGGGAAAATAGATGAATTTTTTTTTTAATATTTATTGATAGGAACCTGTAGAAAACTGTTTATATGAGCCACTGTTTTGCTCTGAAGACTTCACTGGGACCGAAAACCGTTGTGTGTCTCGGAACTTTACATATCCTTTTAGCCCTGAGCAAAATGATGTTATGACTTTCTCATGTCTGTGTTCTTTATTTAGGCCTAATGAAACTGTAATGGCAAAATGTTGGCTTAAGTAAACTCTATCGTCTGGAGTAATAAGCCCTATTTCATTTATCCTAGAAGTTGGAAATTCGTCAGTCTGCTCCAAAAATCTTCATTGTAATGTTTTCATTAGTGGTAAAAATTTAACTGTTGAACTATCATTCACACCAAAAGTGTTTCAGAAACGCGTGTTATGTAGTTCTGTGTCACAAACACGTGCTATGCAGTACCAATATTTTGAAAATTAAAAGTGCTCTCTATCAGTGAAGTCGTGAACTTTTGATCAGTATATATATATATGTGTGTAAAGAGTGTGTTAAACGTTCATAAGTAACAGTTATGAGGAAATTGGATACAGTGATTATGGCGACTTGTTTATCTGTTCGTTATATTGTTGCTTGCTCATTAAATAATCCCTTTTTTTTAGTTCGCTTTTGTCTGCGACCAGTGTATGCAAACTTGTACACATTATTAATCACCTTGTTAAAACTTTTTCTCTGTTTTTTTTGTATTTTTTTATATCAAGTCTGTTAAAAGCGATTCATCTCTGTAACTTTGGCTAGATGGTGTTGCGTGCGTTTATTATGAGTGAATGTAACATCATCTAACTTTCTCTGTAATATGATAAGACAAACTGCCACAAAAGTATCGTAATTCAAAAATCAAGCCTTGTTTATTGGATGGAAGTTTTGAAAAAATGTCTTTGTCTAAAAACGAACATACGCATTGGACTGTTTGATACGTGAAAATGACGCTGAAGAAACGAGTCGTATTTATGAGTGATTGCCTAAGTTAACATTAAACATGGATTATGTTATAGCAGATATGTAACTAAATTTGTATTTTAATGTCAGAAAGCATGTGAATTTTTGGTGTATTTTAACTGTATATCATGGAAGGTTGTTTGTGAAATGTAGAGATAGGTTTGTTCTCTGTGCCTTGACCTGTAGGCGTGTCTTGTACCGATGTTCAGCACTATAATTATCGGCATTCTTTCCTCTTTCAGTACTTTCCCAAAGCGACTAATCAAGACTCGGTAAAATGGCAATAATCCACACTTGGAATATGTTGTAGGAACGTGAAGGTTAAGCGTGTGATTGTATATAGAGAGAGCAAACTTCCTTCTCAAAACGGTCTTCAATAAACTCTTCTTGAGAACATATCAGTTCTTATGTTGCTTCAACAATCCCTAATGCTAGCGAAAGGTATTTTGCCTACTTAATACATTTCTCCACTGTTAATGTGTTGCCATTATTTTAGTTCACCTTAGTTTCGTTCTATAAGATACCGTTTATAAAGCTTTAGACAGCTTATCCTATTTCTTGCATCGTATACAAGAGAAAGTTTGAGGCCTGGAGCTTTTGTTATTTTACAGGTATTTAATTATATTAATCAAGGACCAATGTTTTAAAAACGTGGTTTTAGGTTGAAATGTTTGTGCTCAGGATTGTACTCTCTTGGTGATCTGAAGGTGTCTTGTTGTAAAGCAGTCTTTGCGTTGAGTTTTTTACATTTAATCCTAACTCGTAATGTTTATAATTGATTAAATTGAAACAGAAAAGGCTATTATTTAATCGTTTTTAGATGAATGAGAATCACTGACTCTATTGATAACAAAGTAGCGGTGTCAATTTCGTATGAAAGATTCGTATTTTTGAAATTAAAATGGGTCATAGTAACACACTTCATAAACCTTACATTTTACCAGTGTGTTTGAGTTAAGAACAAATGACTACTAGACCTAGAATTACCTGTTAAGTGTGTTGCACATTCGCGTATCTAAAACTATTTTATGTGTATTGGAGTTTTCTCTTGTGTTTGTCTGTGTGCATAACAGTATTTCTTTTAACCCTTACTCAAATCCTTGGCAGATTGGTGTTTTTTTTAAGTATTTATTCTGTATGTAAACATAATTGAAACGTTATTTTACGATTTATGATATTCAGGTTCCATAACCCACGCTTTCGGTCGTCTTTTAGAATATTCGTGAAATTTACGATAATTGTAGTGGTTGTACTATTTTATATTTCGTGTAAATATATTGTCTTTTATCTTTTCTTCCTACTTCTCATCTCGCGTGTTTTGATCAGGGGTAGAAACTAATTATACTACTTCTACATTTCATTCTAATGTGTGCTACTGTGTAAACATTTCTTCAAAACACGCTGTCATGACTTGTCACATGTCTATACTTGAAGACCATTTCGTGTATGTAAGAACGCGGTTCCCACCCTACCGGTAGCACTTTTAATCGTGAAACTCCACAAACTGGAAAAAGAAAAATAGTTCTCTGCACCACCAGAGAACTACATAAAACTACAAGTCCAACACGAGTATATCGCAATGGATACTACTAAATAAACAGGAAAAAAAGTTTTTTTTATTGAAAGTACAGTGTGTGAATGATAAATCATAAATCATTAAGACAGTCTAATACTTTTGTTGTAGGTAGCTTAAGTATATAAATAAATAAATATATATATATATATATATATATAGCTATGTAGCTGACTAATTTAATGTAACATACCTTTATGAAACAAATTGAACATTTGTATATAGTTGAAGTGTCTAATATACTAATCAGTAAATGTTTCTTATGGATGCCTAATTTTGACTCGCGCTGTAAATTGTAGATTTTTCTAAGTATTAGTTCCCATCAGCGTAATAATTTAAGATTAAATCAAATGAGAAGTTAAGTTACAACGAATTGATTTTGTTTCAGCACCACGAAAGTGTTTCTTATTTATAAATTTCTTTTGCGTAAAAAAATGAATGGCTTGTATTGGACTTTTTTTAAACGTCTGGTATGGATTTTTTTTTATTTAGTCCTCTTTGAACAGAATAGATAATGCTTGATATAAATACGTCATATCAAAGTAAGAGATTGAACACTTCCGTAATACTTAGGCAGCATAACGTCGACCACCATGTTTGTTTATCTTTCTGAACACAAATGGAATTCCACCGTTATCACAATAGACTGTTTGTTTCAAAGTATGTTCATTTCAAGAAGTAACTGTGATTGTTTTATTTTTATTTTTTTGTTAACTATCGTTGCTCATATTAGACAGCAGATATTAAATAGTTGTGAATAAAATATACGACACCAGTTTG
>HQ716622.1 Uncultured bacterium clone T2WK15F91 16S ribosomal RNA gene, partial sequence 
GTTTGATTATGGCTCAGGATGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGAGTTAATAGTGAATGAGGCTTCGGCCAAAGGAGCTATTAACTTAGTGGCGGACGGGTGAGTAACGCGTGAGCAACCTGCCTTTCAGAGGGGGATAACATTTGGAAACAGACGCTAATACCGCATAAGATCACAGTACCGCATGATAGAGTGATCAAAGGAGCAATCCGCTGAAAGATGGGCTCGCGTCCGATTAGATAGTTGGTGAGGTAACGGCTCACCAAGTCGACGATCGGTAGCCGGACTGAGAGGTTGAACGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGGGAAGACGGTTTTCGGATTGTAAACCTCTGTTTTCGGTGACGAACGAAATGACGGTAACCGAGTAGGAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTACTGGGTGTAAAGGGAGCGCAGGCGGGATAGCAAGTCAGCTGTGAAAACTATGGGCTTAACCCATAAACTGCAGTTGAAACTGTTATTCTTGAGTGGAGTAGAGGCAAGCGGAATTCCGAGTGTAGCGGTGAAATGCGTAGATATTCGGAGGAACACCAGTGGCGAAGGCGGCTTGCTGGGCTCTAACTGACGCTGAGGCTCGAAAGTGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACACTGTAAACGATGATTGCTAGGTGTGGGGGGTCTGACCCCCTCCGTGCCGGAGTTAACGCAATAAGCAATCCACCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCAGTGGATTATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCAACTAACGAGATAGAGATATGTTAGGTGCCCTACGGGGAAAGTTGAGAGAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTGCCATTAGTTGCTACGCAAGAGCACTCTAATGGGACCGCTACCGACAAGGTGGAGGAAGGTGGGGACGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTAATACAATGGTCATAAACAGAGGGAAGCAAGGCCGCGAGGCGGAGCAAATCCCCAAAAATGATCTCAGTTCGGATCGCAGGCTGCAACCCGCCTGCGTGAAGTTGGAATTGCTAGTAATCGCAGATCAGCATGCTGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTTTGTAACACCCGAAGTCTGTTGTCTAACCGCAAGGAGGGCGCAGCCGAAG
>XM_041020936.1 Aureobasidium melanogenum CBS 110374 alpha/beta-hydrolase (M437DRAFT_44633), partial mRNA 
ACTTTGAGACATATATACCATAAAGGCTCTCATCAGTATCCGCATCTCTTACGGAAAGTCGATATCAACAAGGACACACTGCTTGAGTACGAGAACGAAGCTGGGACAACCATTCTTAGACCAGCTTGGGATGCGTTTTCTGTGCAGTCGGATACGTTGATGATACAGCGCCTTGCTGATCGCAGACAACATGTCGTTGACGGCTTATTAGAGCATGGAGCTACCTTCGGTGAAGCCAAAGCTCTCGATGCAGAAGCCTGGACTCTAGACGAGGTCTCCAGCCCTGATGTGACCGATAAGAAGACAGTCCTAAGCTTCGCCCACATGGCGGCAAACGCCTACGTCTCCATCCCTCGTAAAGGCGACTGGATCGACATTGGCGGCGGCTTCAACTATACCGAAGATTTCGGCTGGGAGTCCGATGGGCTCCGCGGCCACATCTTCGCCGACACGCACAACAAAACCGTCGTAGTCGGGTTGAAAGGCACGTCCCTCTGGTTCTTCGATCCTCCAGAGACAACAAACAACGACAGAGTAAACGACAACCTATTTGGAAGTTGTTGTTGCGGGCAAGGAGGCCAATATGCATGGAAAAGAGTTTGCGAATGCCAGACTGATGCAAAGACTTGCAATGCTACTTGTTTGGTGAGTAGTTTGAGGAAAAAGAGTAGTTATTATCATGCTGCGAGGGCGCTATATCATAACGTGACGGCTTTGTATCCGAACGCTGATGTTTGGCTTACTGGACACTCGTTAGGAGGTGTGGTATCCTCTCTTCTTGGTGCTACTTATGGTCTACCAACTCTGACTTTCGAGACTTTTCCTGATGCACTTGCTGCTCATCGATTAGGTCTGCCAACACCACCAGGTCACCAGATTGGTCAATCTGGTAGACAACATTATACCGGCACGTTTCATTTCGGTCATACTGCAGACCCGATATATGTCGGAAACTGCAATTCGTATGACTCGTCTTGCACGCTTGCGGGATATGCTTTCCAGAGCAAATGCCACACAGGGTTCAATTGCACATACGATACAGTTGGTGATAAGGGTTGGAGGGTCTCAATCGGCACACACAGAATCAGCAGCGTCATCAAAGATGTCCTAGAAGCTTATGACACGGTCCCGGTATGCACACAAGATGTTGGTTGCAAGGACTGCTCTGAATGGTCGTTCTTTGAGGGCAATGGGACAAAGACGACGACCAGCTCAACAAAGACTGCTTCTTCGACGGAACTCACTACTACCACGACTACGACTTGCCGCACTCCTGGCTGGTGGGGTTGTCGGGATGAGTCTACTACTACGAAGACAACATCGACGTCGACGAGTGTCTCTAGCTCAACGTGTTTGACGCCAGGCTGGTGGGGCTGCAAAGATGCTTCTACGACAACAAGCTCTTCATCGTCTCATAGCGCTGAGATGAGATCGACTGCCACGCCGATACCATGA
>XM_012484966.2 PREDICTED: Apis florea spindle and kinetochore-associated protein 1 (LOC100864548), transcript variant X2, mRNA 
AACTTATTGATAAGAACGCCATTTGTAAACGATATCGAATGAATTAAATTCAAAGTTTACAAACGGCGCCAGGAATGACCGTTATTTGTAATGCTATGTAAAAATGCAATTAAAGAAGAATTCCTTAAAATGCGCATAGTACTTTCACAAATGTGTAATGGTATTGAACAGATAAGGAAAAAATTAGTTGATATGAGAAAACAAAATAATCAATGTAGAGAATTATTGTCATTCATTGAAACTTTGGATAAAAGAATCATTCATATGGAAAAAAATATTCCACATGAATTAATTCGTGACTATAATGAAATTGAAAATTCTTTATCAATGAAAAGTATATGCAAGAAAGAGCTTATACAAAAATCACCTATAATAATAAGAAATAAGAATGTAGAAAAAGAAAAGACTCCAATAAAAGATTGTAAAAAAATATTATTTAACGAACTTGAAGTTTGTCCTACGATATCTTTGATAAGTGAAGATGAGTTCAATAAAGTTCCAAAATATATTATTGGAAGACAATCTTTAGAAACTGTAAATGATTTCATAAATACTATTAATCACATTTTAAAAACAAAATATACATTTTTATCATTGGGAAAAGCTCATGCAAGAAAGCAAGGAGATTTAAATCTTTATTTGCACTATAAAAAACAAGAATTAGATTTATGTAATGATTCTGAATACATATATTTCTTTACTGGTGAAGATTATGAAAAACAAATGAAGTCTAAATTAAATAAAATAAAATTAAATCTAATAACAGTTTTACGACATTGCAAAAGATTAAGAGAACATAGGATAAAAAACGACTTGCGATATGTAATATTAACAAAAAAATAATTGCTTAAGTTTTAAATTAAGTAATAAAATAAAAAGATTGCATAATAAATTGTTTCATTGTACAAAGAAGTTAAACATATAATTTTATATATTTTTTTTATAAGTTTTATAATAATTTAAATGATACATATTTTTATGTGTAATCAATACTATTGTAAAATATATTTCTATTATTCCAT
>XM_047672130.1 PREDICTED: Vanessa atalanta protein claret segregational-like (LOC125064848), mRNA 
ATCACGAACAAGCGTAAATATTCGAATTTTAAATTATTGCGTCCGTTTACTAATCTGACAAACGAAACAATTGTTCGTGTTTCAAGTGAATGTTGTTTTAATGTAATATTTAAATAAATAAATAAGATGTCTCGCATTCCGAAATTTCCTTCTACTGCTACAAAAGAGAATAAACCCACATTTACAAATGGGCGTAATACAACGCGAACATTAGGCATTGGGCTCAGTGACGCTGATAAAAAAAGCTTACTATTAAATCATACAAAACCAATGCGAAGTACAACATCCGCCAACACTGTAGCTGCGCCCCGCCTTAAAAGATCAGCTACAGCACCTTCCTCCGCTACGGTACCTAATAAAACAACTAAAGTCGAAAAAAAGACGACTACTGTAGCACCTAGGATTGCTCCTTATGATTACAAAGCCAGATTCAATGACTTGGTGGAAAAACATAAAGCCATGAAAAGTGAATTGAATGATTTAAGGGACAAACATTTGGAAGTATCAGACGAATATGAAAAAGTTAAAGAAACAGTTGAAGGAAGTATTACTGAAAGAGATACATTGAAGGATAAATTATTAAACACTCTCAAAGACTTGAGACAGAAGTCTAATGAATATGAAAGCCTAAAGCTGGATTATGAAATACAGAAACGGGAGAATGAGGAATTAAATAATAAAAGTAAACTTTTAGATGACGTAACTAAAAGCTTGAAGTTAAAAATAATGGAATTTGATAAACTTAAAACAGAATTTGATGATTTGACTCGACGTCATAAAAGTCTTAATGAAGAAACTGAGGCTTTAAGGGTTTTGACTGATCACCTTAAGAAAATATCTGTAGAATATGACAAATTGCAATTAGATTATAAGGATGCAGTTTCCACAATAACAAAAAATAAAACAGACTCTGAGGCTTTGCAAAATATTTTAGCGACTATGTATAGAGATCAAAGAGTTTTACGGAACACAGTGCAAGATTTAAAAGGTAATATTAGGGTCTACTGTAGAGTACGACCTCCACTTGAGTCAGAAGCATCCAAGCCTTTGTACAATCTTAATGTCCTTGATGCATGTTCTATAGAAGTTGAAAAGATTGAACTTCTGAATTCTGCAAGAAAAGGAAAATCACAACATTCTTTCTCATTTGATGGGATATTTACACCACACTCCTCTCAAGAGGATGTCTTTGCTGAAGTGTCTCCAATGGTACAATCTGCACTAGATGGTTATAATGTGTGTATTTTTGCATATGGTCAAACTGGCTCTGGAAAAACTTATACCATGGAAGGTGGTTGTGGAGTTGAACAGTATGGTATTATACCACGAGCAATAAATATGATATTCACATGTATGGAAGATCTTAAAAGAATGGGATGGGAATTGACAATTAAAGCATCCTTTTTAGAAATTTACAATGAAATAATTTATGATTTGTTAAACTCAAGTAAGGAACAAGAAAGTCATGACATAAAGATGGTTAATTCGAAAGGCACAGATTTGTATGTATCCAACTTGAAAGAAGAAGAAGTGAAGAGCTCTCATGATTTCATCAGATTGTTGATATTTGCTCAACGTAACAGACAAACTGCGGCTACATTGAACAACGAGAGGAGCTCCAGATCTCATTCAGTTGCACAAATTAAAATAGCAGCTATTAATGAAAAGCGTAAGGAAAAATTTACTAGTAATTTAAATTTGGTGGACTTAGCTGGATCTGAGAGTGGGAAAACCACTCAAAGAATGGATGAAACAAAACACATTAACAGATCACTTTCGGAACTTTCAAAGGTGATATTATCTCTACAGACTAATCAGTCCCATATCCCATACAGAAATTCTAAGCTTACACATTTACTAATGCCAAGTCTAGGTGGCAATTCAAAAACTCTTATGTTGGTTAATGTTAATCAATTTGATGAAAGTTTCAATGAGACTCTTAACTCCTTAAGATTTGCCACAAAAGTTAACAGCTGCCGAACTGTAAAAGCCAAGAAAAATATAACAATGGTTGACTCATTATAATTTTTACATTGACAATATTTTGCTTTAGAATGTAGTACACATGAACACCTATAGTTATACCATCTACTGTGAATTGAATATTATCAGTATTCTGCTTTAACATACATATTTGTATTGAATACTATTAATAAGTGGTATAACTAAATGTGCTTTACTATTTTGTTTTATAGTTAATTTTTACATGTAGTACTAACTTCCCACTGAATATTCCACCGATAAATGTTTTTACTGTTGTTCTATAGTATTTTGAAATATTGTGGGATTTTAGATAATCAAGAGCTCTTATAGTTTTAATTATTCAAATGACCTTAAATAGCTATTACAAAATAACAAGTCTCATTATTTTTATACAAAAGTTTTAGAAGCATTTTTTTGGATTTGTTACTATAAATGTGGAATTCGATATATTATTAAATAAAATAAATAGTGTGAAAGTTCATATACATTCTAAAGAATGTGAGTTGATATTGAAATATTTTGAAGTATTGTGTTAACTGAACTAAAATAATGACAGATTAATTTACTTACTGTTTATATAAATACTATGGCAATAAAATAATATAATTTTACAAATTGTCATAATTTGAATTTGATCCTTTTAAGGCAGGTCTTTGAGTACCATATACAGGTGAAGTTCTAACAATTGACTCACTTTAAATTCCTACTTATAAAATGCCTAATTGACTTATTTAGGAAATTATTATTGTTATTTTTTTACAAATTGGCAGGTTGAATTTGACATTTTAAAGTTTAATTTATTGGGTAGATCAAAGAATATCATATCTGCTTTTATGAAATATCTATTAGGTATGTTTATTACTACTTTTCATTTATATCCTATTCAATTCAATTGAATTGTATTTCTAAAAACACATTATCTTGAAGTAATCTGTTCAGTAAGGTGTTATTTTTAATTTT
>XM_025561023.1 PREDICTED: Sipha flava GTP-binding protein 2 (LOC112688017), mRNA 
GCTAGTTTTTTCGCGTCCGAAACGGTGCCCGATCGTTGCGAACGTCCCGAAATTGAATTTTATGTTTGTTCGCGATCCGTCAGCGTTTGGGGCCATTCGAGTGTTTTTCGTACCGACGCGGAAAAGCGGAAGCGACGGGAAAAACACCTGTTCGACGACCTTGAAAACCAACATCGTTAGTCATCGATTATTATTGTTTCGTTTCCCGTTGCGGGTCTCCGTCCCGCGATAATGCCTTGATAACGCTTGCCGCTATCTTATCCGCCGCTACTACGACGAGACTTCACTGACCTTTGGCTCTCGTTTTGTTTATAAATATAAGCCCGTCGCCGTACGTTGTTGCCGCCGTCGGCACTCCTCCGTGTCGCTTGGCATCGGTCGCCAACAGATCAACAGCTGTGACCCATCTGTCGAATGATCGTTTCAAGAATCCCGACGATTATCACCGCGCATCGTATACGGCCGTCGACGCTCAACGACGATGGATTCGTTCCTGGACCTGTTCGATCCGGGCACCAGCCCTCCGTCTAATTGCGACGTATGGCCAGCGGAGGACAATGACGATGTCACCGCAAGGCTACCGCCGGAGCCTCAGATGGGCAATGTCGAGTACAAACTGAAGCTGATCAATCCGTCCAAGTTGCGCTTTGAACATCTGGTCACGCAGCTGAAATGGCGGCTCAGAGAGGGTCACGGCGAAGCCATTTATGAAATCGGCGTTGAAGACACAGGCATGCTGACCGGCTTGTCTGCTGAGGATATGAAATCTAGTCTAATCACCTTGGATGAAATGGCCCGTAAATTAGGTGCTACTACGTCGGTGCTGCGAGAGAGATCAGTAAAAAAAGACAAAATGGTTGCTGAAGTTCTAGTTCGAAAGGTTCCAGATGACCAAGAATGTATAGAAGTGATGGTTGCTGTATTAGGAGGTGCTGATGCTGGCAAGTCAACTCTTCTTGGTGTATTAGCACATGGTGAATTTGATAATGGTCGTGGTAGTGCTCGATTAAATGTTTTAAGACATTTACATGAACTACGATCTGGTCGAACTTCTTCCATATCTCATGAGATTCTTGGTTTTGATACTGAGGGAGATGTTATCAACTATCAAAAAGCCCGTACAGCCGAAGAAATTCGAGATCGCTCATCAAAGCTGATCACATTCCTCGATTTAGCTGGACATAAAAAATATCTTAAAACTACTGTAGCTGGTTTGAGCGGTTACTGTCCGCATCATGTTATGTTGGTTGTGAGTAGTCCAGCTGTAACTGTTTCTAGTCCTACTCAATTGGATATGACCAAAGAGCATATGGATTTGGCATTAGCACTTAGACTTCCATTTTGCATTGTTGTTACAAAAACTGATATCACTCCAGCAGATAACACAATTAAATGGTTGGAGTCTATATTGAAATCCATTGGATGCAGAAAAGTTCCTTTTGTTGTTAAATCTGATGATGATGTTTTAACAGCGAGCTCTGCACAGCCAACTCAAAATGTTGTGCCTATATTTACCATTTCTAGTGTTACTGGTGAAGATTTAGACTTACTCACAAAATTTTTATATGTTTTACCACCAAGTATTAGTATAAAAGATAAAGAAAGATTGGAGCAGGAGTGCTGTCAGTTTCAAATAGATGAGATTTTTAAAGTACCTGATATTGGTACAATTGTTGGTGGTGTACTTGTCCAAGGTGTTGTTAATATTGGTACAGAACTAGTTATAGGCCCCTTTGATAATGGAACATTTGTTCCAGTAACTGTGCAATCTATACATAGGAATAAAGCTCCACGTCGAGTTGTAAAAGCAACTCAAAGTGCTTCGTTGAGTTTGGAACAAAGTATTCCTGGATTACGTAATGGAATGGTGCTCTTGGGATCGGGTGTGAATCATAGTGCTTGCATATTCTTCCAAGCTAGAATTGTTGTACTATATCATGCAACATCTATTCATAATGGATTCCAAACCACTGTACATATTGGAAACATACGGCAAACTGCGGCTATTGTTGCTATCATGGAATGTGATAAACGAGGTATGCATACTAATGACACAGCATCAGTAATATTTAAATTTGCACGTCATCCAGAATATGTCACTGAAGGTATGCGGTTATTGTTCAGAGAAGGACAGACTAAAGGAATTGGAATTGTTACTCAAGTATTTGCTTTGCAAGTAGTTGCTGGATAGATAACATTGTTTTTATTGACTTACAACTTTTATTTATATAACCAATAGAGGTAAAATGTACACAGTTACATAATTTAAACTTATAAAAATCACTTTATACACATAAGAATATATATATATATAT
>XM_036413688.2 PREDICTED: Pipistrellus kuhlii TATA-box binding protein associated factor 8 (TAF8), transcript variant X2, mRNA 
AGAAGCATCACCTGGAGAGGTGAACAACACGTGGTCTCGGCCCCTCCCGCAGACAGCGAGGCACTGATCCTGGGCGGGACCTAGCCAGGTGTTGCTAACAGTCACGTTTGGGGCGCTCCAGGGGGGATGCTCTTTATGAGAAACGATTTCAGGGGGAAAGAGGTGTGCAAGCGAGGACGCATTTCCCGGGCCAATTCCGAGGGTCACAGCAACCCGTCGCTCAGTGTGGGTCACGTGCCCAGGGTCATCAGAACCCCCCATCCCCCGCCTCGGCAGGGCTTTGGAAAACCCAGAGGTGCGAGCGCCGCCTCGCCCCGCCCCTCCCCGCCGGGCGACTACAAATCCCATCCTGCCCTGCGCTCGCGCACGTTACGCCAGAGCAAGATGGCCGACACGACGGCCTCTGCGGGGGCTGGCAGCTCCGGAATGAGATCAGGAAGTAAACAGTCCACTAACCCTGCTGACAATTACCATCTGGCCCGGAGGCGAACCCTGCAAGTGGTTGTGAGCTCCTTGCTGACGGAGGCCGGGTTTGAGAGTGCTGAGAAAGCATCCGTGGAAACACTGACAGAGATGCTTCAGAGCTACATTTCAGAAATTGGGAGGAGTGCCAAGTCTTACTGTGAGCACACAGCCAGGACCCAGCCCACGCTGTCAGACATTGTGGTCACTCTTGTCGAGATGGGTTTCAACGTGGACACTCTCCCTGCTTATGCAAAGCGGTCTCAGAGGATGGTCATTACTGCCCCTCCAGTGACCAATCAGCCGGTGACTCCCAAGGCTCTCACTGCAGGGCAGAATCGACCCCACCCGCCGCACATCCCCAGCCATTTTCCTGAGTTCCCCGACCCGCACACCTACATCAAAACTCCGACGTACCGCGAGCCTGTGTCTGACTACCAGGTCCTGCGGGAGAAGGCTGCATCCCAAAGACGTGACGTGGAGCGGGCGCTCACCCGCTTTATGGCCAAGACGGGCGAGACCCAGAGTCTGTTCAAAGACGACGTCAGCACGTTTCCACTGATTGCTGCCAGACCCTTCACCATCCCCTACCTGACAGCTCTTCTTCCGTCTGAACTGGAGATGCAGCAAATGGAAGAGACGGATTCCTCGGAGCAGGAAGAGCAGACAGACACAGAGAACCTCCCTCTTCATATCAGCACGGATGACTCTGGAGCCGAGAAGGAGAACACCTCTGTCCTGCAGCAGAACTCCTTGTCCGGGAGCCGGAGCGGGGAGGAGAGCCTCATCGATAACCCCTACCTGCGCCCCGTGAAGAAGCCCAAGATCCGCAGGAAGAAGCTGGACTGGGGCATAGGAGCAGCTGGTGACGACCTCATTCATTATCACAGGACCTCATTCCTTTGACCTGAGAGACCAGGGAAGGCAGCAGAAAGAAGGGGCTGTGCCTTCTCTGCTTACTCCAGAAGGACTGTTCACCTCGTTTCTGTTTCAGGCTATCCCGGTCCCTCTTATTGACTCACAGACAATGTGTAGCATCAGTTTATCACTTGCTTTGCCTTGGTGGGAACCTCATTCTTATTTCTCTTCTCACCTGGGCGCCGAGTGCCCTGCTGAGATGACGGAAGGTGACTTTGCCTTCCCACATGGCACTCCTTGACCTGGGCCGGCAGGAGTCGGGAGGGGTGAGCAGGCATGTCACGTGGAGGAGGGTGGTGCATCACAGCACACCAGCTCTCTCATCGCATTTGGTGAACTCTTCCTTCAAGGCAGCGCCCTCTCTGGGGGATTGGTATTTATCGTCCCTCTGTGGAATGTGTGCTTTGGGCCACTGAGTCCTGCCCCGTCCAGGAAAAGAGCTTTCTCTGACAAGAGCCTCTGCAGGATCTATTCTGCTGTGACTTGCTGGAGGAATCCGACCTTAAAGAGCAGGAAAGGGATTGGGGGGGAACGGGGGAGAACTTGAGGGCTGGATGGCCTGTTTGCTGGGAGCCGGGAGCCCGGGGCGTCTGCTGGAAGCCGGCACAGAAGGGCGCCGTGCGTGGAAGCCAGTGGGCCAGGCCACGGAGCTCTCCCAGAAGGTCTGAGTCTGTTCAGCCGCTTTGCATCCTGGGGAGAGATTTCATCCTGCCTGAACCTACAGATCAAAACAAGTGTTTAAGGAAGATGCTGGACAAGCTGATACCCTTTGGCTGGTCTCTGAAAGAAGAGATT
>XM_042281434.1 PREDICTED: Peromyscus maniculatus bairdii phospholipid scramblase 1-like (LOC102915703), transcript variant X4, mRNA 
TTTGAAACTGTTAACAAATACAAAATCAAGGACAAGCTTGGTCAGAAAGTTTACTACGCAGTCGAAGAGTCCAATTGCTGTGCACGCAATTGCTGTGGGGACTGCAGGTCTTTCTCTATGAGGATTCTTGATAACTCAGATGGAAGTCCAAGCTCCTCCTGGTGTGACAATAGGTTACGTTGTTCAGAACTGGCACCCATGTGTTCCAAAGTTTACAGTTCAAAATGAGAAGAAGCAGGATGTTCTCAAAATTGTCGGTCCATGTATCATATGCAGCCTTGGAGGAAACATTGATTTTAAGATCAAGTCTCTTGATGAAAAAATTGTGGTTGGTAGGATTTCCAAGCGCTGGTCTGGTTTTCTGAAGGAGTTACTGACAGATGTGGACAATTTTGGGATCCAGTTCCCGATAGACCTTGATGTAAAGATAAAGGCTGTGATGCTTGGAGCTTGCTTCCTCATAGACTTCATGTTTTTTGAAAGCAGGCCAAATCAGAAATGAACACTATTATATTCATGAATTGATGAACGAGTCCTCAGAATATGTGAAGCTGGAACACTGATTGAGAATAAAAGGCAACATAGTGATTTCTTTCATTGAAATCACTCATCTCTCCTTGAATTAAACTAGGATGTACATAA
>XM_019798545.2 PREDICTED: Ailuropoda melanoleuca pleckstrin homology domain containing A6 (PLEKHA6), transcript variant X5, mRNA 
TCCCCCCACCCCTGCGGGCGGGCGGACAGTGGGGGCCGCTGGGCAGGAAGCCCTCCCCCCTCCCCCGCGGCCCGGGGGGCCCGGAGCGAGCGGGGCTTCTGGACGCCGAGATGGCCGATGAGATTGACTGGCTCGACTTGCCCGGCCGGTGGGCCTACGGCGTTGACCGCGGTGGGAGAGTCTTCTTCATCAATGATGAGGAAAAGTCAACCAGCTGGGTGCACCCTAGCACGGACTCCCCCATCCAGAGTGGACACTCCTCCAGCCCAGAATTGCCCAATGGCTGGGAGATGGATTCTACCCAGGAAGGAGCTGTGTATTTCATCAACCACAATGAAAGACGGAATACATTTCTACACCCAGTGACTGGCCAGGTCCCAGAAGAAAACAAAAAATTTAACTTGAAAACATCGGCCTTGGACATGTCCAATAAAGCAGGTGGGAAACAACCGGCTATCACCAACAGTGACGTACCCAACCACAACATGGTGTCTGAGGTCCCCCCAGAGCGGCCCAGCGTCCGGGCAACCCGAACGTCCCGCAAGGCCATCGCCTTTGGGAAGCGCTCACACTCCATGAAGCGAAATCTCAATGCACCTGTCACCAAGGCGGGCTGGCTCTTCAAACAGGCCAGCTCCGGGGTTAAGCAGTGGAACAAGCGCTGGTTCGTCCTGGTCGACCGCTGCCTCTTCTACTATAAAGATGAAAAGGAGGAGAGCATCCTGGGTAGCATCCCCCTCCTGAGCTTCCGGGTGGCCGCGGTGCAGCCTTCGGACAACATCAGCCGAAAACACACCTTTAAGGTGACTGCGTGCTGGGTGGATGAGGCCGGGGCCAGTTCCACGCACTGCCTCTCCCCACAGGCCGAGCATGCCGGGGTCCGCACCTACTTCTTCAGCGCCGAGAGCCCCGAGGAGCAGGAGGCCTGGATCCAGGCCATGGGGGAGGCTGCCCGAGTACAGATCCCCCCAGCCCAGAAGTCCGTGCCCCAAGCTGTGCGTCACAGCCACGAGAAGCCAGACTCTGAGAACATCCCACCTAGCAAACACCACCAACAGCCAACCCACAACAGCCTCCCGAAGCCCGAGCCCGAGGCCAAGACTCGAGGGGAGGGTGATGGCCGGGGCTGCGAGAAGGCCGAGAGGAAGCCCGAGAGGCCCGAAGTCAAGAGCGAGCCTCTGGTGAAAGCCAACGGCATTCAAGCTGGACCGGAACCAGCCTCGGAGCCCGGCAGCCCTTACCCCGAGGGCCCAAGGGTCCCAGGGGGGGGCGATCGGCCCGCTCAGCCCAACGGCTGGCAGTGTAGCTCCCCAAGCCGACCAGCAAGCACAGCTTTCCCGCCTCAGGACTCAGAGAGCGGAGGACACCAGCGGAGCTTCCCCCCACGTGCCAACCCCGACAAAATCGCCCAGCGCAAGAGCTCCATGAACCAGCTTCAGCAGTGGGTGAACCTGCGCCGAGGGGTGCCGCCACCTGACGACCTTCGGAGTCCCTCTAGGTTCTACCCCGTGTCCCGCAGGGTCCCTGAGTATTACGGCCCCTACTCCTCCCAGTACCCAGACGATTACCAGTACTACCCCCCAGGGGTGCGGCCCGACAGCGTCTGCTCGATGCCTGCCTATGATCGGATCAGCCCACCCTGGGCGCTGGAGGACAAGCGCCACTCTTTCCGCAATGGAGGCGGCCCTGCCTTCCAGCTGCGGGAGTGGAAGGAGCCCCCAGGCTATGGGCGGCAGGATGGCACCGTCTGGCTCCCCGGCCCCTCCCCCTCCCGGCAGCCAGTCTATTATGATGAGATGGACGCCACCTCCGGCTCCCTGCGCCGCCTGTCCTTGCAGCCCCGCTCCCACTCTGTGCCCCGCTCGCCCAGCCAGGGCTCCTACAGCCGTGCCCGCATTTACTCCCCCGTCCGCTCACCCAGTGCCCGCTTTGAGCGCCTGCCACCTCGCAGCGAGGACATCTATGCCGACCCTGCTGCCTATGTGATGAGGCGATCCATCAGCTCCCCCAAGTATGATTACCTGGGAGACAGGCGACCAGTCCCTGCAGGACTGTTCCCCTACAACTACCCACCATCCCCCACGGTCCACGATAAGATGGATGAACTTTTAGATCTTCAGTTGCAAAGAAACCTAGAGTATTTGGATCAGCAGATGAGTGAGAGCGAGACTCTCATCAGTATGGTGAACCGCATGGTGGAGAACTCCTCCCCCAGGGCCCAGATCTTCATGCAAGTCCCTCCGTACCCAGAAGTGTTCCGGGACGGTCTCCACACCTACAAGTTAAACGAGCAAGACACAGATAAGCTGCTGGGAAAATTGTGTGAGCAGAACAAGGTGGTGAGGGAGCAGGACCGGCTGGTGCAGCAGCTCCGAGCTGAGAAGGAGAGCCTGGAAAGTGCCTTGATGGGGACCCACCAGGAGCTGGAGATGTTTGGAAACCAGCCCGCCTACCCGGAGAAGCTGCTGCACAAGAAAGAGTCCCTACAGAACCAGCTCATCAACATCCGGGTGGAGCTGTCTCAGGCGAGCACGGCCCTGGCGAACAGCACCGTAGAGTATGAGAGCCTTGAGTCAGAGGTGTCTGCCCTGCATGATGACCTCTGGGAGCAGCTCAATTTGGATGTCCAGAATGAGGTGCTCAACCGGCAAATCCAGAAGGAGATCTGGAGGATCCAGGATGTGATGGAGGGGCTGAGGAAGAATAACCCATCCCGGGGCACAGACACGGCCAAGCACAGAGGAGGACTTGGCCCCACGACCACCTACAGCTCCAACAGCCCCGCCAGCCCTCTCAGCTCCGCCAGTCTCACCAGCCCACTAAGCCCCTTTTCACTGGTATCCGGCTCACAGGGGTCCCCCACCAAGCCTGGGTCCAGTGAGGAGCCCGGTCCGCCGCGGCCCCCCCTCCCCAAAGCCTACGTACCCCTGGAGTCTCCTCCAAACGTGCCGCCGCTCCCTAGCGAGAGCCGCTTCTGGCCCTACCCCAGCTCCCCTTCCTGGCACCGCGGGGGCGAGCCAGCCAGGGGTCAGCCCAAGGCAAGCCATGAGCAGAGCAAGAAAGACACCCCCCAGACGTCACCCCTGGACACTGCTAGAGACATCAGCCTTGTGCCCACCAGGCAAGAGGTGGAGGCAGAGAAGCAGGCAGCTCTCAACAAAGTTGGCGTTGTGCCTCCTCGGACAAAGTCGCCCGCTGATGAAGAGCTAACTCCGTCGAGAGTGGTGAGGAGGAGTGCCAATGGGCTTACCAATGGACTGTCCTCCCGGCAGGAGCGCCCCAAGAGTGCCGTGTTCCCCGGCGAGGGCAAGGTCAAGATGAGCGTGGAGGAGCAGATTGACCGCATGCGGAGGCACCAGAGCGGCTCTATGAAGGAGAAGCGGAGGAGCCTGCAGCTCCCGGCCAGTCCGGCCCCCGACCCCGCTACCCGGCCTGCCTACAAAGTGGTGCGCCGGCACCGTAGCATCCACGAGGTGGACATCTCCAACCTGGAGGCAGCCCTGCGGGCAGAGGAGCCCGGGGGGCAGGCCTATGAGACGCCGAGAGAGGAGATTGCCCGGCTCCGCAAAATGGAGCTGGAGCCCCAGCGCTACGACGTGGACATCAATAAGGAGCTCTCCACGCCCGACAAAGTCCTCATCCCCGAACGGTACATTGACCTGGAGCCCGATACCCCCCTGAGCCCCGAGGAGCTGAAGGAGAAGCAGAAGAAGGTGGAGAGGATCAAGACGCTCCTCGCCAAGTCCAGTATGCAGAACGTGGTGCCTGTCGGCGAGGGGGACCTTGTGGACGTGCCCCAGGACTCAGAGAGCCAGCTTCAGGAGCAGGAGAAGCGGATTGAAATCTCCTGTACCCTGGCGACCGAGGCCTCCCGCAGGGGCCGCATGCTGTCTGTGCAAGCCCTGGCCGAGGCCAACGCTGCGAAGCTTCACAGAGCCACGTTCTGAAGGCCTCCTTCGCCCCCTGAGGTCGCAGTTCCCCACCCTGGCCCCCTGCCCCTGCGCTCCCATGGGCATGCTGCAGGGAGCCAGGCTGGGGGCCGGGGGTGCTGCCAGGACGTTACCTCCGTGTCCACATGCCCACCACGCCCGGCCCTGAAGCCCTCGCTGCTCAGATGGCGACCCTAGGCCGGGGCCTTAGATGGTGGGCAGACAGCAGCCCACATCCCAGGGGCTAGGCCTGGCCCTGGCTGGTGGTGTGACGGCCCTACTGGAACATTCCCAGATGAAGAGGATGCCCTGGTGGGGAAGACGCTCTGGGCTCTCTTAGGTTAGGAGGAGGGTGAGGAGAAGATGGACACTCGGCCTCTTCCGGCCCCTCCTGACACCGAGGACGGCACCTGCCATCAGGTCCTTCCCCCATCGACCCCACCCTGCTGCCCCAGCTGCACCCGGGGCTTTGACATGTCTCTGCTTATGGGTGTTCCTTTGGGGTCCAGTGGAGACTGACCACCCTGCTTGAGCCAAAGACAAGATGACAGGAGCTGGGGAGAGGCACCTCAGCTCCCGGAGGGGACAGTGCTGGCTGTGGGTAGAGAGCGGCACGCAGGTCTGCGCAGCGTCTGAGGACAGGTTGAGAAGGGGGAGAAGAGAGAAAGGGAGAGATGCAGGCAAGTGGGAGGACAGGGGAGCGGCAGGACTCCTTTGCAAGTAAGAGGGTGAGGCGGAGGTGGAAAGGGGCTGTGAGAGGGATGGGTTTCCCCGGGAGGGAACCTTAGCTTAGTGCCAAGTACAGTCCAGACTGTCAGCCCTGCTCCTGCACCGGGTACCCCCGATCCGCGGGCCTGCCCACACACTGGCTCCAGGAGGACCCACCAGCGAGCACATGGTGACCGTCGCTGCAGCCATGGGGACGAAGGTGTGGGGATGCGGGTGTGGGCAAGTAGGTGGGAAGGTGGCCCTTTCTGGGTCTGGGCCTGGTGTCTGCCTCCCCCACCTCGGCTCAGGGGCAGAGAGAGGGACCTGTGTCATGTAGGGTGTTGTCAGCCTTGGGGCCTTTCCTAACCATGTTCGGGACATTTTCTTGTCCCCCTTCTCCCTGGAATGTGCTGTGAGCCAGCTGAGAGAGTGCCCCGGAGAGGAAACACAGCCTTAATCTGGGAGGCTAGATTCTAGGGCCCCATCCCGCGTCCCAGGCATCCCCAAGGAGGACCAGGTGAGGCTGTACGGAAGGACCCCCTTCTGGTCTGGCTCTCTCACCATCTGCCTACCCGGGGAGGCCAGTGAAGGAGACACAGAAGCAAAGCTCACTTTTCCTCCTTGCCTCTCATCTGGGGGGGACGGTAGCCAGGGAGGAGGGAGGGGAGAGAGTGAAGCTGGACACACCGGGGCCCCTAGGCCTTCTCTTTGCCAGAGTTGCTGCCGGGAGACTTCAGCCTCCAGTGGCCCCAAGAACAACTACTTTATCTTCCAGCACTTCTCCACTCCTTCACAGCTGGGCCAGTGAGTGGTTCATATGCAAGTAAAGATGGCAGTTCATTCAACAAATATTTATCGAGCACCTTTTACGTACCAGGCACTGTTCTAGGTGCTTAGGGTATTCTCGTGCTTCTGAGGGCTTGCAGACTGGGGAATTCCTCTTCCCTTTTAGCAGACGTTTGGAACATGGCTACACTTCCCGTCTGTAGCATCACTCAAGCACCCTGTCCCTGTTTCCCCCCCCCACCAGACTGGCAGGTGGGATTGGCCCTCTCCCTCTTTCCAACACCTTTCTCCATCCTCGAGAAATGGCTCTTTCGGGGCCTCCATGCCTTTCCCCTTTGTCTCCCCTTTGTTTTAAGTGATGTTTGTAGACGTACGTGGAAAATACCAAGGGTTAAGGTCTGCATCTCTGCCACGTCTCGCTCTCATCTCATAAAGCTGGCTCTTTATGTTGCTTTACATGCCTTAATATATGTTTTATGAAGATTATACATATTATAGATATATACATAATATATATATTTGTTTGGACGTCTGATCCTTTCCCAGAACTCCTGCCCAGGCCCATTTTCCCTCCTTTACTTTCCACACCATTCCTAGCATGTGTCGGCCACACCCCACGCCTTTTGATCCAAAGAAGGGGAGAGGACGGTCTTATTTTAAGACAGATCTATTTTACGCTTTTGTTACAAAAGCAAATCTATTTTCAAAATGTGCAATGTCTGAATGGAATCAGCAAGTAATACGAGGAGATTGGGCGGCTGCCTCTAGGTCCAACCCTGTGTCCTTCCCTCTCCCCGCCCCCCCGCAGCTTCCTCCTCCCATCCCCCAGTCTGCAAAGGGCTGGTCCCCAGAGCTCACCCAGAGAGCATCTTACCAGGGCGGGACGTTCTCTTAGAAGTCCTGGTCTAAGGATTTGATTACACTGTCAACTCTTGACGGCCCTCTAGGGTTACGGGATGTGAATCCTCTCGAAGGAAATGTTTATAGCTGTGTGCACAAAAATACACCCCTGCGGGCAACCCGCCCCCCAAGTGTACTCCTGGACCACCTCCCGTCACCAATCTGCTGGAAAGGGCAAACAATTTAATGACAGCCTATGCCAAGTGGCACCAAGAACTCCACTCCCTGACGGAGCCAGGATACAGTACAAAGGCCAAAGGAAATGGTTTGGGACCACAGGTCCTTCAGCACAGACACATTTGAGTTCCTTGGACTTCTCACACTCCTTGATCCCTTTCTGGTCTGGGTCACATCTACAACATCTGTCTCCCTCTGTTACCCTTCCTCGGGGGGCTGTTGTTAAGGGGGACGGTTGCTCAGTCTGGCATCCAGACTGCACAGTCAGCTTCTGGGCTGAAGCGGGTCCCACGGATGAGGTGACATCTCAGCCTTGCCCAAGAAGCCCCTAGGACTGTCCTCTGGCGGGCTGCCACCGGGACGCTGAACTCCGCCAGCTCAGCCTTGCAAACTGCTTAGCAGCTGACGTAGTAGGCAAGGGGCTCTTGCCTCACAAGGATCTGGGCAGAATGGAAGTCTTTTGTCCAGATCTGAAATCAAGGGTTTGGGACTGTCACAGAGCTCCTGGCCAGCACTTGAAACCTGACCTCCCAACTTTGACATGTACTGGCGTCCTGTTCCCAGCCTAGAGCGTCTTGTTATGAAAGAATGGGGCCCAGATGGAGGCCCAGGGCTAAGTGACCCAGCGGGGACAGCCCTGGTTGCTATTCTGGGGCCTTGCCAATTAGCACATTACCTCCCTGATCAATAACCAAGAGGCTGTAATCAAATACGGCTACTGTCACTTTAAAGATTTTTCTGAGGTCGCAAGCTGTGCTCACTTGCTCTCCTGCCTTGGTGAGAGGCATGTTCTTGGGGCAGGGCTGACCATAGCAAGACGGAATCGATTCCTTTCCCCTTTAGGCACCCCCTACCTGGCAGCTCTTAAAACTAAGGAAAATACAAAATATACATATATATACATATATCTATTTATGCACATACTGGGGCCAATTTGATCTGCTAGTATTAGACAATAAACCATACAAGGAAATGTATGATCTCAGTGTCTTTATTTAGTATAAAAGTGACCTTAAAAGAAAAGTTAAGGTTAGCTGAACAGAGGGCATCTCTATTGGGGGACCAAACATCTGTAGCCACCCCATAGCATCTTTTTAGCCAACAAGCCCCTACCCAGGAGGGGCATCCTGACTGATAGGTGAGCGCCTGCTTCCCCACTCCCCAGCATTCTTTTCAGATATAGTAGGTACTGAAGAACCCCAGTGAGCTCTGCATTTGTATCTTGCAAGTTTGTATAAACCCGATGCAGGAAATAAAATGAA
>XM_053554548.1 PREDICTED: Nycticebus coucang SH3 and cysteine rich domain 3 (LOC128560913), transcript variant X2, mRNA 
CCTGTCATTTCAGCTCTGACACCAAGGCAAGAGGCTAGGAGGTCTACAAATATCGTCTAGGTAGCTGGTGTGAGTACAGAGGGTACTGGGGGGGCTTAGCCCCCAAGGAAGAGGACCAATCCTTACCCAGCACCACCATCAAGGCCCCAGGGCCTCCCACTTACTTCCTTCCACAGACTGTGGACTGACTTAGGGAATCCCAAATCTGCAGCGACTGAAGCAGTTATTCAGGAAGGGGTCTACGGGGACAAAGGAGATGGAGATTCCCTCAGAACCCCAGGCCAATGGGGAGGCAGTGGGAGCTGGGGGTGGGCCCATCTATTACATCTATGAGGAAGAGGAGGAAGAAGAAGAGGAAGAGGAACCACCCTCAGAACCTCCTAAGCTTGTCAACGATAAGCCTCACAAATTCAAAGATCACTTCTTCAAAAAGCCAAAGTTCTGTGATGTCTGTGCCCGGATGATTGTTCTCAACAACAAATTTGGGCTTCGCTGTAAGAACTGCAAAACCAACATCCATGAACATTGTCAGTCCTATGTGGAGATGCAGAGATGTTTCGGCAAGATTCCCCCTGGTTTCCGTCGGGCCTATAGCTCGCCACTCTACAGCAATCAGCAGTACGCTTGTGTCAAAGATCTCTCTACTGCCAATCGCAATGACCCTGTGTTTGAAACTCTGCGTACTGGGGTGGTCATGGCAAACAAGGAACGGAAGAAGGGGCAGGCAGATAAAAAAAATCCTCTAGCAGCCATGATGGAGGAGGAGCCAGAATCTGCCAGACCAGAAGGCAGCAAACCCCAGAATGGAAACCCTGAAGGAGATAAGAAGGCTGAGAAGAAGACACTTGATGACAAACACAAGCAGCCTGGCTTCCAGCAGTCTCATTATTTTGTGGCTCTCTATCGCTTCAAAGCCCTGGAGAAGGACGATCTGGATTTTCCGCCCGGAGAGAAGATCACAGTCATTGATGACTCCAATGAGGAGTGGTGGCGGGGGAAAATCGGGGAGAAGGTTGGATTTTTCCCTCCCAATTTTATCATTCGGGTCCGGGCCGGAGAACGCGTGCACCGCGTAACGAGATCCTTCGTGGGGAACCGCGAGATAGGACAGATCACACTCAAGAAAGATCAGATCGTGGTGCAGAAAGGAGACGAAGCCGGCGGCTACGTCAAGGTCTACACCGGCCGCAAGGTGGGGCTGTTCCCCGTGGACTTCCTGGAGGAGATTTAGGCGCTCGCCTGCTGGCGGGAGACACCCACGCCCCCATTCTGGGCGGGCCCAGTGGAGCTTGGGGAGGCAAGGGCAACAGCAACTGGACTGCCGGGTAGGCAGGGGCGGGAAGGCCCGCAAGAGCCTGACGGCTTCTGCGTAGGGGCTGGTTTCCGCCCCTTCCTGACCTAGGGCCTGGGGCCCTGACGCCCAGAGCAGCCGCACAGGCCTCGGACCTAGCCTTCGAGAGCTAGAAAAAGAAAATATCTCACTGGGGGTGGAGGGACGGAGGCACTAACTGTCGAATGTTTCGAATTCACTAAAGTTTTGACAAAAGTTAGAAAAGTTA
>XM_027475688.1 PREDICTED: Abrus precatorius basic 7S globulin (LOC113846927), mRNA 
AATAAAAATGGTGACATATCCCCGCCCACACAGATGAAGATAGAAGATAAGCACACACAGTGACACGCTTGCCATAAAAAAAGGTAAAAGACTTAGAAGAGAGTGAGCAAGAACCTAGACGCAATTTCATTCTTCTTCAGCAGCAAAACGTACGACCCTCCCAACAACCCTTCTCTTCTCCCATGGCTTCCTTTCCTCTCCTCTTCTCCTTTCTCTTCCTGTCCCTCGTTCATGCTCAATCTTCACTTTCTTTCCACATCCCAGTCACCAAGGACGGTTCAACCCTCCAATACTTGACCACCCTCTCTTACGGAACCCCTCTTGTACCCACCAAACTCGTGCTTGATCTGGGAGGCCCTTTTCTCTGGCTTCATTGTGCATCGAGAAACACCCCTTCATCTTCCACTCTCACTACTCCTCACCGTTCAATTCAGTGCCTCACTGCAAAAACCCACAAACCCGATGACTCATCCTCCTCCTCTTCGTTTCTCTCTAGCCCCGTGGACGAGGACCAGTACCAACCATGCCAAGTTCTCCCAGAAAACAGCATCACAGGCACAGTGGCCACAGAAGGAGAGCTTGTAGAAGACCTCATGGCAGTACAATCATCTCACTTAGAAATCATTCACCAAGTTAGCTTCACCTGTTCCCCCACCAGCATGCTCTTAAACGGCTTAGCAAAGGGTGCTAGAGGCATGGTTGGTCTTGGTAGGTCTCGCAGTTCCCTTCCCTCTCAGGTTTTCGATTCCTTCAGCACACACAGGAAAATCACTCTCTGCCTCTCATCATCAAAAGGGGTTGTCCTCTTCGGCGACATGGCCTATTACGAGTCTTCTCCAGCCGTAACTGAGAGTCTTAAGTCTCTTACATTCACACCCCTTGTTACCAATTTCCCATCTCAGGAATACTTCATCAACGTTAATTCAATCAAAATCAACGGCAAGAGGTTGTCGTTGGACACGTCATCACAGTCCCTCGAGCAAGAGAACAGTGGTGGGGCTCTTACTTTGTTGAGCTCAATTGTACCCTACACCACCATGCAGAGCTCGATCTATGCTACTTTCAAGGCAACTTTTTTGGACGCTGCTGTGGCTTTGAACATGACCATAGTGGCTTCCGTGGCACCCTTTGAGCTTTGCTTTGAGGGCTCGCACGTGGGGGCAAGTGTGCCGGCGATTGAGCTGGTGCTGCAGAGTGAGATGGTGAAGTGGAGCATACATGGGAGAAACTCCATGGTTAGGGTAAGCAGCGAGGTTGTGTGTTTGGGGTTCTTGGATGGAGGTGTCAACCCAAGAAATCCCATCATCATTGGGGGGTATCAATTGGAGGAAGTAATAGTACAGTTTGATTTAGCTACTTCCATGGTGGGGTTTAGTTCTTCCCTTTACACTAAGAACACTGGCTGTTCCCATTTTAGATTCGGTTCCATGCTTGCAGACTCAGTTTGACTATTCGTTATAACTTCGATTATAGTACTGATTATTAAATTTTCTTCTTCAAACTATGTTTCTGAACTTTCTCAATTTTGTACGAGCTTGATTTTTGTGAAGCTTTTTTTGTTTATTTTTTTGGGGGGGGGGGTTTACTATTTAGCTGTACTAATCGAGGCTGATGAGATATTATGATCTTGTATTTTGATGGGACTTCTGCGTCAATTTGAGTTTTATGATATTGGAATACTAGTCGACTTTCAAGATGCTCGATTGAATTGCGAAACCTGAAAAATATCACTGAAAGATTCGTTTCCTTTCCTCCCTCTGTTTGATAAGAAGTGCATCCCACTGGGGAATTTGGACAGTGCCGAAGGAATAATCCTTTATGTACTGCAAAAGAAAAGGGTATGCTCACATAATTTGTTATGTATTTCTTTTTTTCGTTTATTACATCAAGATCTT
>XM_023724909.1 PREDICTED: Trichechus manatus latirostris CKLF like MARVEL transmembrane domain containing 5 (LOC101347816), transcript variant X5, mRNA 
GGTTTCTTGGACCTTCCTGCTTCTGTCTGCTTCCTCATCCTGCCAGGTTTCAGTTTCCCTTCCAGGCTGCTGGTGGTGGTGTGGGGGGCTGTGCCTGGTGGGTCCCATGGAGATGCTTGGTGCTCGGGACCGCCTGGACTGGCCCCCCGAGGAGGGGACGGCTGCAGGGCTCCAGGCCTTCGCTGTGGACAAGAACTTCCTCTCCTCCCTCAGAGGCATCCTACTGGAAACCGAGCTGGACTTCCTCCGCTGTGTCAGTGCTATCGTCATCTTCCTGGTGATCTCCATCGCTGCTGTGACCTCCCGGGATGGAGCTGCCATTGCTGCTTTTGTTTTTGGCATCATCCTGGTTTCTGTCTTTGCCTATGATATCTTCAAGATCTACCAGACTGAGATGGCACCCAGGGCTACCGAGGCTCTTGGCCCGCAGCTTGTTGACCTGGGACTCAGCGATATCTGCCCGCTCCTCTGCCTCATCCAGCTCGTGCTGCACCTTGCGGAACTTGGAAAGGCATTCCTGGATGGCGAGAATGGTTAAGCACTTGGTTGTTAACTGAAAGGTTGGTGGTTTGAGTTCATCCACAGGCACCTTGGAAGAAAGACCTGGTGAACTACTTCCCAAAAACCAGCCATTGAAAACCCTATGGAGCACAGTTCTACTCTGACACACAAGTTGGAATTGATTTGACAGCAACTGGTTTGGTTTGGTATTTCGTTTTTAACAACAAGCTATGCTTTTAGGATATTCTTTGTTTTGCACTTCTTTTCCTTTTTCTATGAAAATGGGTATGTTCTAGACATTGCAGCTAAAATGACTCAGCTTTGAAGAAAGATTCCAAACAGCAAAGTTCTACTCCTGAACTCTTTAGTAACACGTTTATATGGGAACTATTCCGAGGAAAATGGAAACAACTTTTTTTTACTAGGGCAATATTCTTGAAATGATTGTAGTTGTAGAAAGAATGTATGTTGGGTAAGGAAGAGGGGACCAGGTCAGTGGATGGTGTCATCCCACATATATGTGCTAGATTATGGAACAAAACTCCACAGGGTAGTGCAATAGTTGGTCACAAAAACCCATTGCAGAATATAATTGAAGGGACCATGGTCTCAGGGAACATCTAGCTCAACTGGCATAACACAGTTTATAAAGACAATGTTCTACATTCTACCTTGGTGAATAGCATCT
>XM_006974484.3 PREDICTED: Peromyscus maniculatus bairdii ArfGAP with coiled-coil, ankyrin repeat and PH domains 2 (Acap2), transcript variant X7, mRNA 
TGGCCGCGGCTGTCACTCCGGGGCGTTTTCCCCGGCCGGCTCTCAGCTGGGGCGGAGGAAGAGGCGGCCTGGGCCTGCCGAGCCGTTGCAGTCTCCGCGGCTGCTATGCCCAGGGTGCGCGGCGCCCTCCGCAGCTCCGCGCAGCGCTAGAGGCGGCCGAGCGCTCGCCGACGCCGCCCGGATCCCCGGTGCCTCCGCTCTCCCGCTCCCGCAGCTCCCGCGGCTCCTCCGGCGTCGCCTGCGAGGCCAGGCAGAGGCAAGATGAAGATGACGGTGGATTTCGAGGAGTGTCTGAAGGACTCGCCCCGCTTCAGGGCTGCCTTGGAAGAAGTAGAGGGAGATGTGGCAGAGCTGGAACTAAAACTCGATAAGCTCGTGAAGCTTTGTATCGCAATGATCGATACCGGCAAAGCCTTTTGTGTGGCAAATAAACAGTTCATGAATGGGATCCGAGACCTGGCACAGTATTCTAGTAATGACGCGGTGGTTGAGACAAGTTTGACCAAGTTTTCTGACAGTCTTCAAGAAATGATAAATTTTCACACAATCCTGTTCGACCAAACGCAGAGATCAATTAAGGCACAGCTTCAGAACTTCGTTAAAGAAGATCTTAGAAAATTCAAAGATGCCAAGAAACAATTTGAAAAAGTCAGCGAAGAAAAGGAAAACGCACTAGTGAAAAACGCCCAAGTTCAAAGGAACAAGCAGCATGAAGTGGAAGAGGCCACAAACATCCTCACGGCCACGAGGAAGTGCTTCCGGCACATAGCCCTGGACTACGTCCTTCAGATTAATGTGCTTCAATCAAAGAGGAGATCAGAAATCCTGAAATCAATGCTGTCCTTCATGTATGCACATCTGGCCTTCTTCCATCAAGGGTATGACCTGTTCAGTGAGCTTGGGCCCTACATGAAAGACCTTGGAGCACAGTTGGATCGACTGGTTGTGGATGCAGCAAAGGAGAAAAGAGAGATGGAGCAGAAACACTCTACTATCCAGCAGAAGGACTTCTCCAGTGATGATTCCAAGCTAGAGTATAATGTAGACGCAGCGAATGGCATTGTCATGGAAGGGTATCTCTTCAAGCGGGCCAGCAATGCCTTCAAAACGTGGAACAGGAAAAAGCCCGATCATATCAGACGCTGGTTCTCCATACAGAACAACCAGTTGGTTTACCAGAAAAAGTTCAAGGACAGCCCCACTGTGGTGGTGGAGGACCTCAGGCTCTGCACCGTGAAGCATTGCGAGGACATAGAGCGGCGCTTCTGCTTCGAGGTCGTCTCTCCAACCAAAAGTTGTATGCTCCAGGCCGATTCGGAAAAGCTTCGCCAGGCCTGGATTAAGGCAGTTCAGACCAGCATTGCCACCGCCTACAGAGAGAAGGGCGATGAGGCCGAGAAGCTGGATAAAAAGTCATCTCCATCAACAGGAAGCCTAGATTCTGGAAATGAGTCAAAAGAGAAGTTACTGAAAGGAGAAAGCGCACTGCAGCGTGTCCAGTGTATCCCTGGCAACAGCAGCTGTTGTGACTGTGGTCTGGCAGACCCACGGTGGGCCAGCATCAACTTGGGCATTACCTTGTGTATTGAGTGCTCTGGGATTCATCGGAGTCTTGGGGTTCATTTTTCGAAAGTACGATCTTTAACTTTAGACACTTGGGAGCCTGAGCTTTTAAAGCTTATGTGTGAATTGGGAAATGATGTTATAAATCGTGTTTATGAAGCTAAACTGGACAAAATGGGAATAAAGAAACCACAGCCAGGACAAAGACAGGAGAAAGAGGCATACATCAGAGCAAAATATGTGGAGAGGAAATTTGTGGATAAATACTCCATGGCATCATCACCTTCTGAGCAGGAGAAAAGGGTTATCTCCAAAAGCTGCGAGGAGCAGAGGCTGAGCCAAGTCAGAGCATCTGTCCACACCGCAGTCAAAAGTAACGACAGTGGGATCCAGCAAGGCTCTGATGATGGACGGGAGTCTCTACCTTCCACCGTGTCAGCCAATAGCTTGTATGAGCCTGAAGGAGAAAGGCAAGAGTCTTCTGTGTTTCTGGACTCGAAACATCTTAATCCAGGACTTCAGCTTTATAGGGCTTCATATGAGAAAAACCTTCCCAAAATGGCTGAGGCTCTGGCTCATGGTGCAGATGTGAACTGGGCTAATTCAGATGAGGACCAAGCGACAGCACTCATCCAGGCTGTTCTGGGGGGCTCTTTGGTGACGTGTGAGTTCCTCTTACAGAATGGTGCTAATGTGAACCAAAGAGACGTCCAAGGGCGGGGCCCGCTGCACCATGCCACTGTCTTAGGACACACAGGGCAGGTATGTTTATTCCTGAAGCGAGGTGCCAATCAACACGCCACTGATGAGGAGGGGAAGGACCCCTTGAGTATTGCTGTGGAAGCAGCCAATGCCGACATAGTGACCTTGTTACGTTTAGCAAGAATGAATGAAGAAATGCGGGAATCAGAAGGACTTTATGGACAGCCAGGTGATGAAACTTACCAGGACATCTTTCGTGATTTTTCTCAAATGGCATCAAATAATCCAGAGAAACTCAATCGTTTCCAGCAAGATTCACAGAAGTTCTGAGCCTTTTAAGAGGGGAAACTATGAAATTTGGTGAATTCCTAATGTGTACAACCAAAATCTCACCCCCCCCCTTTTTTTTTTACTGCTTTAATTCTGCTTGATTTTGGTGGACATTGAATTGTTTGGAAAAAATGGTACCCATTCATTGGTATTTTTGAAAATGAAAACAGATCTTTCATAATTGGGAAAGGGAGAAATCCACTATAGTTCTTCTTTTATTTAAGAAGAAAAAAGCCTATTAATGGGTTGTGCTTTTATATAAAGTTGTATCCAGAGCTGGACCATCCTCTCTTAAGTTCTGAGATGCTACACTGTTAGGCCCCTGCACCCTTTGCCATGGGTGGTACACGGTTCCCCCAGGAACATTGAGTCACTATGCCTGCGTCAGGTGGGAACCAGTTTTCTTACCTGTATCAAGGATGTTTCTTTCCTATAGCTTCCCTGATAGATGCATGTGTGTTTTCTGGTAGCTTCGCTGTGGTACCCACGGTATGTGATGTAATTGCGAGGACTAGTGAGGGTGTTCCTCATTTGCTCGGACAGGCCATCGCACTTGCGGACTTGACAGACATGGCTGCTGCACAGTGGACCACACATTAGTCTTTAGACTCATTTCATCTTACGGTGCAGAGGAGCGCTTCCTTTTTCTTCTGTCAATCTCCACAAGACTCCCAGCTTGCTTTTTATTGTTGGATTGGTTTCCTAAAACCTTGACAGATCATCAGTGCAATAAAACGATTTCAGAGGTTGACTATTACAAAATTGGGCTTTCATCAAAACAGGGTGATTTCAAAGATAATGTAGGGCATTTTTATATTTGGAATTTATCCATTTATATATATATATATATATATAAAATTTATATATATATAAAATTTACTGTTACTCCTGGTGGAAGATGTAAGGAAAAAAAAGCTAATTTTTTTCTGTTTATATTAAAATTTACCAGCAATAAATTCCTTTTATTTTTTTCTACATTTATCTTATTTACTATACAACAGTATACATTCTTTTAAATTGTATCCTGTATATAGCTTTAGAATTAAGTAAAATATGTCATTGACCTTTGAGTTCCAAAATTATGAATATGTGATACAGTTTGGTGAGATTCCATCTCTGATTGACATGTCTTGTCAGAGTATGGAATGAATAAGTAATTACCTTATGGGTCATTTCCAGTACTGTTGATGACGTTCAGTCTTTTAGAAATTATTTGTAAGATACTCAGCTTCACAGAAACATTTTTAAATGTATATAAAATTATAGTTAATTAAATAAAAATTTTTAACATTTTCCCCACAGTATGTAGAGCCTTACTTTGATTGAATATAAAATCAGAATCTAAGCAGAAATCATATGGAAATAAATTCACAGCACAGATAAAGGCCCTGTCGTTCAGTCAGATTGCAAGCATGCAAAGCTTAGTAAGTCCCCACACATTAGGGATACAGAGCTATTGTGATTTGTTTCCAGGGAAGTGCAAACTTCCACAGGATGAGAGGAATTTTGTCTCTCCTGTCTCACCTCAAGCTTGCAGACCATCTGGCCTTGTAGGTATTTTGTTAAAGACAGAAGTCTAACTTTAACTGGCGTGTGTTGTAAAATTTATTGTCCTAAAACATGTTGAGGGAGGACCAGGCTACAGAAGGGCAGAAAGTCCGCCATGTTTCCCTCTGCTGGGCTCATTCTCGGTGACTGCTGGAGCGCCCCCCCCCCCTTGTCTGGAGGTGCTGACGGGCTTCCCTGCGGTCCAGCTGCCAGGAGACTGTCCCCCGGGCCTGCCTGCCTCCCCACCTCGTGTCAGAAGTTCTTGGTGTGGTGGTCAGTAGTGTCTGCTGCCCTTTAATGGCTAGTGTTTTTGAAATAAGCCTTAAAGATTCAGTGTATTTGAAATGCCTTAAAGGTTATTGTGGTTCTGAGTATCGTTAGAAAAAGCTACACCTTTTCGTATTGCATGGAGGCTGGCAATGCAAGAATATATTTCTACAGCTTAATTTCCTCAACGTGCTGAGAAATTGAATAGCAGAAAGGAATGGAATAGAGCAAGGCTTTAAATTCATAGTTACAAAGTAGCTTGGCTTTTAGATGAGTTTTGCTATAATAGCTTATGTGGCCTGTTGTGACGCCTTCTGTGCATTAGGAGAGAGGAGTATACGCAATGCCAGTTGCACACTCAGGCTGCTCTTTCTGATTGCTCTGTTTTCTCTCCAGGACAGACATGCTGAAAATAGTGTGATTCTTTATTATTAGTCTGTTCACTCTTTTTCATGCTCTCAGTAATGTCAAAATTGTATTACTGCCAAGAGAAGAATAGGGGTGCTATGAAGATTCAGAAAATGCAGGCGTAACATGGGCATAGATAAAGGTGATTGAGTAGCCGTTCACCAGGCCTCATTGCAACACTTACATGTTTAAGATTTCCAAGATTTCCAATTTATTTTTATTCATTTTTAAAAGTTTCCAGCATTCCAGTGTGCTTGACTAATTGATGCTGGTGTTTGCTGTAGTGGAGTGAACTTTGGTGTTACTGCCCCCAAAGTAATCCAGCTTGCAACTTGTACTTTAGAACGTCATAGGTGCATTTTTGGGGAAAAAAATTATACATTCACATTTTAGAGAATTTAAGTTTGTGATCATGTTAGCAGTATTTAAAAATAAAAATTCCTGCATATTAGATATGATCATAAACCAAGTTGTTTTATTTAAAACTAAACTCGCTACCCACTTGGAATAATTGAACATTCCTAGACCACTCATTCTCAAATTTTTTTGTGTGGTTGCATTTTGACCATGGCTAGAATTTTTTAAAATGAAATCTTATGTCCATAATAACTTCAGTTTATATCCTTCTTGGATCCAGGGCTCCTCACAAGTGAAAGGATGAAACAAAGGGAAACTCTAAAAGCTCCCCTCGTGTGTGTTTCATGACTTAGAGTGTTCTTCACACTACCTTTCCTCACCTGCTGCTTACAGGACTCCTAGATCCTAACCACGAGCATCAGCCTCGTCCGTCCGTGTCTCCATCCGAGCCCACTCCTCTCGTTTTACAGAGAGCGTCACTTCCTTTGCTAGTTGGAGGCCGAGCTGACCCAGGTCTGCCATAGCTTCGAAGCACTTGTATCATGGAAGGATTTGAAATCGCCGTAATGTAAAGCAGCAGCTTTCCCTGTGTTTGATAAGAAACTCCAAATACTCTGGAGAACCTCATGATGAAGTTTGAGGGACTAGATTGGGATTTGAAAGCATCAAATTGTAGAAAAGTCTCCAGATTTTACAATAGCAAACATTAATAAAAGCAAAGTATTATAAAGTTAAACTCACCATTTATTAACTTTTTGATGTTTTCAAATGAAACATAACCATGGAAGGGACTTGGATTCAGTTTGGCTGAGTCCTAACACCTAGAAGGATGATTTTTGTGGGCGTCTTTTCCTGTTTACATAGAGGGGGATCATGTGGACAAAGAGAGATGGAATGAAATACAAATTTTCTTTGCATTGCTGTTCTCACTATCTTATTTTCTAGATTTTTCTCATTCTCCAGTTTTATTTTGGGTTATTAATTTTTAACAGGGAAAGCTTGCTGCAGTATCAAGGTTGTTAGCACCATTTAATACGAAGGCTAAAGGTTAACTTTTGGAAATGACCAGCTCCTTTTTAAATATCTGTTTACGTGCGCTTTGTGATATTTCTGGATCATTCCGGTCATAAAGACTGATCACGTGTACTATTTCTTGCTACCTGTGAAAAGGGTTTTAAGAATGTATAACCAACACTCCATTAGTTTTTATTAGTGTGTAGAAGATTTGTATCTAATTCATGAATGTAGTTTTACTGTAGTTTGTCATTGTAAATGGAGCAAAGTACATTATCTTTATAGTTCTTCTAAAATGTACATTATGTAAGAATTGTAAATATACTTGATTACTTTGTATGCTGAAAATTTACAATAATAAGTCAATAAAAATATCTCACTTCTGGCACA
>XM_038145225.1 PREDICTED: Motacilla alba alba chromosome 9 C2orf72 homolog (C9H2orf72), transcript variant X3, mRNA 
TCTCGCCCCGCTGCCCCGGGGTGTTGCTCTTCGCGGGGCCGGGGCTGGTGCAGGGTGGCGGGGCGGGTGCGGGCCAGTGGGCGGTGCGGAGCCGGGGCCGGGGAACATGCGGATGCAGGCCGGACAGGGAGCACGGCGGGGGATGGCGGCGGCAGACCTGCAGGAGCTCCGGGCGCTGGTGGAGCGGGCGGGCGGGCGGCGGGCGGTACTGCTGGTGGCCGAGGTGGCGGAGGGGGCCCCGGCGGCGCCCGCGCTGGCCGCCTTCGCCCGCGACCTCCTGGACGACGAGGCGCCGCGCGCAGCGTGCCCGGGGCCGGCGCCGGTGCCGGGGTGCCGGGAGAGGCGGTCGCCAGGCGCCGGGCGCCGGGCGCTGGGAGCGCGGCTGCTGCTGGTGCTGTGCGGCGGCGGGGCGGCGCGGGACCGCGGGGCGCGTACTCGCCTGCGGGAGATGGTGCGGGACGTGCGCGGCCGCCTTCCCGCGGGACCGCCGCCCGCCGTCGTGGGCGTCCTGCTGCCCGGCGGGGACGGAGAGGACGCGGCGGTGCTGGACGCCGCGCTGCGGCGGCACTTCCCGGCGCCCGGCACGGTGCAGGCGGCCCGGTACAACCCGGGCAGCCCAGGCGACTGCCGAGCCGCAGCCTGCCGCGCCCTGCGGGCTGCCCTGCAGCACCCCGCAGAAGACATGAAAGACAGGGAGAGGTGGAGGCTGCCATCCTTCCTGCAGTGCATTTCTTGGAACCAGGGGAGCTGGAGAAAAGATTACAAAGTGAAAGCTGAAAACAACATTCATGAAGGTCTGCCTTGACCTCTCTCTGCTCCCTGCAGATGACCTGCAGGACCCTGAGGAAGAAGTGGCTCTGGCCAGCCTTTCCCCCAGTGGAAACTGTGAAGAAGCTGCTGAAGGCACAGGCACCTAGAGCTGCTGGGCATCCAACACAGTCCACATCCCAGACCTGCCCAGTGGATTTGGAGCAATGGGAGGAGGAGCTGGTGCAGGCCCTCTCCTCCAAGGACCCACAGCTCCAGGGAAAAGCTGCTTGGCTGAACTTGTCAGGGTATTTTTAGCTGCCACCAACACAGAGGGTCTGTGCCAGAGAGCCATTCCCTGCTGCCCCGGGGCACTTGGAGCTGCTGCTGGACACTGGGCTTCTGAGAAGCCCTTTGGGGATGTACCCCACATCCCGGGCAATATGACATTGGGACTTTGAGTGTGAAATGCAGCCACCTGTTTGAAGAATGAGAAATGTTTTCAACTTCTGAGCAAAGTTCCCTGCTGAGGTTGCTGGGACCGGCCTCCCTGGCAGACTGATTCTGCTGCCTTGTTTTCCTACTTTATTGGTGCTTGGAATTTCCCACCCTCTTTGCCGTTAAAAACCAAACCAAACCAAACCAGAACAAAACAAAACAAAAAAACAAACAAAAAAACCCCCACAAAAGAACCCACAAAAAACCCCCAACGAAGTAATACAGCAGCTTGGAGACTGCAGTAGGACTAAATGTGAGTGCCGGGATCTACCAGCTACTGAAAAGGCATGAATGTAACAGTGTAACAAGAAGAATGCAGTAACAGCCCAGCTTGAGTGGCAAGAATAACATGAAAGATACTGATAGTACTGGCATCTGGACCAGAGTGGGGTTCGGGAGCGGGATCTGTCCCTCTGGCTTGTCCCGGTGCTCATAGGCTAACTGAGGGATGCCTGGGTTGGAGGGGTGGCGGGTGGGCTCTAAGGTGTGGCTGCTGCTAGATGGGGCTACAGGAGAGAGCCATCTTACCTGGGAGATCTCCACAGGCATGGTGGCACAGTTTGGAGGTGGCCTGCAGCACAACAAGAGGTGGCTGTTTCATAAATAAACATAAAAATATAAAAAAATATATTTAAGTAGTTCCAAAGGGTTGCCGGTAGCCTGTGGGGCAACACAACTAACCAGAAATCATTGGTTTACAAGGAATATTACTTTAATGTTAAAAATATATTTTTAATTCTTTATGCAACATCAAAGAGGTCTAGTTTTATTTTGAGCACAAGCCTGGCTTTCCTTTAGGAGTTTCCTCCAGCTCAGATCAGAAATTTCAACCTGCCTGCCTCTACTTTGGGTGAATTGCCAAAGTGCATCCTCTGTGCATGTCTGTCCTCTCTCTGGCTCCTTCTTCCCCACTGGCAGCAGAAGTGTCTGGAGTCCTGCCAGCTCTGGCCAGCACTCTACCCCAGCAGTTTGCCTTTGGCATCCCTCTAGCTCTTACCTGGAGCAGGGGATGCTGCTCTGCAGAGAGGGCACTGACCCGCTCTCCTTCCAGCCTCCAGGATTTCTGGAGAAATGACCTGTGGAAAACACAAATGTAACCAAGTGGCTCGCTGTGGGTGGCTGTGTCACTGGCCCAAATGTCAGCACTGAGCACTCAGTGCATCTTGGTGAGATTAAGGCTCCCTCCTGCTCCATCCCTGCATGGCCCAGGTGGCTGTGCAGGTCTGTATTTCCCAGCAAAGCCCTTGGTTAGGTGGGTCAAGCAGGACTCACCAGCAGGAATCTTTATTTTCTTGCAGCATTTAGCCTTTGCTGCTAAGCATTCTCCAATGAAGAGGTGATCCAAGAGCACAGACTGGCAGTTAAACCTCCCTTAGTGCTGCAAATCCACTGGATTTATTTACTGGTAATTTTGAGGTAAATCATGCAAGTTTATCCCTGCAAGAGACTGCTGGAAGTGGATGAACTGCCTGGGCCTTAGGCAGTGTGAGTGAGAATATATTTGACCAAAAGTATTGTTTTTCTTTCACTGAGGAATAAAAGTGACTTGAATTACTTTTTTTTTTTCCCTTTTCTCTTTTCACTATCTGTGCACTTGGAGGTGTAAGCAGATAGTTTTACGTGTTTAATTAATTGAATAATTTAAGGGCACTATCACATGCTTGTAAAATAAAGACACTTTCCAAATTGGAATGTGCTTATTTGTTTGCCATGGTGTTATCCTTGAAGCAGCATTATGTATAGCTTAACTCATATTTATCTTGGCTTGAGAAAAATGGATATTGGGATGGAATGGAAGTGACCCCAGTGTTTGAAATGCAGAAGATCAGAACTGAGTGCAGTCCAGGTGGAGCAATGGAGAAGGCTGGACATCTTCCCAGTTGTCCAAGAGCAGGGCAGTCCCTCTTGGCATTGTGGGTCGGAGTTTGATAAGCTTTCATTAGTAACTTTCATTAATAACTTTCACTAACTGATACCATTATGCATCCTCAAGGAATTCAATATATACCCTTCATAGGGTATTTCTTCCTAGTCAGTAGCATCAAGGAGAAATGAATGCTGCCGAGGTCTGGGCACTTCAGTCTCTTGTTGCTCATCGTTGCTCCTGAGCTGGACTTTCCCTGGTGCAAATCCACCACCCTGGGTATCCCATCCGTCTTGTGCCGCAGAGGCGGCCGGCACGTGTTAAACCCATGGGATAAAATCGCTGATCCTTGCCCTGCCCTGGGACACGCTATGCCCCTACAGATGCCCACCCCCTGCGGGCGGCCTGTGCCGGCGGGGGAAGCAGCCGCTTCTCTGGGCACGGCACAAACGCGGGCACCGGCGGGGTCACTCGTGGGGAGCTCACAGCCGCGGTCCCGCTCGCGCCGGCAGCGGTGTGGGGTCTGCGGGCGCGGGAGCCCGCGGGGGCAGCGGGGGAGCCCCGGGAGGCCGCGGGGGAGCCCCGGGAGGCCGCGGGGGAGCCGGGCAG
>XM_030524043.1 PREDICTED: Scaptodrosophila lebanonensis synaptic vesicle glycoprotein 2C-like (LOC115628070), transcript variant X7, mRNA 
ATAGTTCAATTATTGAATGTGTTGTACATATTTAAAAGTGCTTAAAAATATAGAAAAACTATGTTCTGAAAAAACACCTCTTTCAAGTAGTAAAAAGTGGAAAGAGAGAAATCATTCTAAATGGGTGTAATATATAGTGTACAACCAGAATTGTGATATAGTGCCTTAATGATAAAAAGCATTGACATTCAACTTGGAAGTTTGCGATGTTTCAAGGCATGCATATGTCTTGACTTTTTGGAGGATTTAGGAAGCGACTATGAAGATGCACTTCTACAAGCTGAATTTGGAAAATTTCATTTTCTTTTACTTACGATATGTGGTCTTATATACCTAAACACAGCAATAGGAATAACTATAATATCATTTGTTCTTCCCACTGCAACTTGCGATTTTGATATGACGTCTAAAGATAAAGGCTGGCTATCTGCTTCTCCAATGCTGGGAATGCTGATAGGATCATATTTTTGGGGATGTCTCGCAGATACAAAAGGTCGACGCATTGTATTAATTGTAACTCTCTTAGCAGACGGTATATGTGGATTGGTATCATCACTTGCACCTTATTACCTCATATTCCTGTTTATTCGTTTTGCGAATGGTTTCAATGTGGCTGGAACAATGGGCATTGTGTTTCCTTACTTGGGAGAGTTTCAACCAACGAAGTACAGAGAAAAAATTTTATGCTGGATGGAGCTTTTTTGGACATTTGGAATCATTTTACTTCCAGGAATCGCGTGGAGTGTAATTCCATTGCAAATAAATCTCCAATTTAGTGTTTTTACTTACCACAGTTGGAATCTCTTTGTTGCAATATGCGCAATACCCAGTATTTTGCTGGGTCTTTGGCTTTTTTCATTTCCGGAAAGCCCAAAATTTCTATTAGAGCATGGGGAAACAGACAAAGCGCTGGATATTCTCGTTTGCATGTTTATACAGAACACTGGACGTAAACGTGATGACTACCCTGTAAGACAAGCAAAAACTCTAAATAAGCTAATGTAAGAGTCTACGTGGCCCAGACCGTTCTAATAAGAAAAATGGCGAAAAGGGAATTCCTAACCTTCGATTTAGAAGACCGAATGAGTTAAAGATATTAATATCGGAAATTTGGACACAAACTAAAACGCTTTCC
>XM_040248511.1 PREDICTED: Oryx dammah pre-mRNA processing factor 18 (PRPF18), transcript variant X3, mRNA 
TTGCAAAAAAAGAAGAGGAAGCATATTTTGAAAGATGTGGCTACAAGCCTATAAATGAGAAGCCACCTGGAGAGAGCAAGGATCAAATAACCCTGTAAGATGATTTTCTCAAAGAGGAGAAGCAAGCTGATTGTTTCCAAGAAGAAAGTAAAAATCTTGGAGTCTAGGGAGAAAATACAGCCAAAAGATGAAGACCAGAAACCATTAACTTCATCGAATCCAGTATTAGAACTTGAACTGGCAGAGGAAAAATTACCCATGACTCTTTCTAGGCAAGAGGTTATCAGAAGATTGAGAGAAAGAGGAGAACCAATCAGACTATTTGGAGAAACAGATTATGATGCTTTTCAACGTTTAAGAAAAATAGAGATCCTCACACCGGAGGTTAACAAGGGATTGAGGAATGATCTGAAAGCAGCTTTGGATAAGATTGATCAGCAGTACCTCAATGAACTTGTGGGTGGCCAAGAGCCTGGAGAAGAAGACACCCAGAATGATTTGAAAGTTCACGAAGAGAACACCACAATTGAAGAATTAGAGGCTCTGGGAGAGTCTTTAGGAAAAGGTGATGATCATAAAGACATGGACATCATTACCAAATTCCTTAAGTTTCTTCTTGGTGTTTGGGCTAAAGAGCTGAATGCCAGAGAGGATTATGTGAAGCGCAGTGTGCAGGGTAAACTGAACAGTGCTACTCAGAAACAGACTGAGTCCTATCTCAGACCCCTTTTCAGAAAGCTACGGAAGAGGAATCTTCCTGCTGATATTAAAGAATCCATAACAGATATTATTAAATTCATGTTGCAGAGGGAATACGTGAAGGCTAACGATGCCTATCTTCAGATGGCCATTGGAAACGCCCCTTGGCCCATTGGTGTTACTATGGTTGGCATCCATGCCAGAACTGGCAGGGAAAAGATTTTTTCCAAGCACGTTGCACATGTTTTAAATGATGAGACGCAGCGGAAATATATTCAGGGACTGAAGAGGTTAATGACCATTTGCCAGAAGCACTTTCCTACAGATCCATCAAAATGTGTGGAGTACAATGCACTATGAGATCTGTGTGCGGTGTGTAAATATCAAGAGAAACTTAAGGAAGCCTGTCACGGACTTCTGGAATTACCACCAGTTGCAATGAGGGAAGAAGAAAAAAGGAGTTTGTGGTCTCTGAGTTCTACCTAATGCAGCTCTTGGTTTTAAGAACGTGTGTTGGCTCTCATGTCACATCTGACTACAGAGTGATTTTTGTGTCTTACTTTTTAAGTAGTCAAAAAATTAAGTACTAAAGACTTTCCCCAGTAATTTAAATGTGTAAATTTAAAACAGTCACAGGACACGGTTTAAAATAACTTTTCCCCTCTAGACCTAAAAGTTGAAATGAGAGGATTAAAGAGGAACATTTGAGGATGGACTTAATGATTTCTATAAAATATGGTAATTTTCATGTTGCCTTTTATGTTGTGTTTATAGAGAAATATTTTTATATTTTTCAACAAAAATATGGAACTATTTAGTGAAACTTGATCATCCTTAAATGTTGCTTGACTTTTGCCACCTTGCAATATATTTGAATGTAAATGTTTTTACTATTGTCTATCTTGCATTTTAAAGCTTTTATCCTTTAAAGATA
>XM_027406478.2 PREDICTED: Cricetulus griseus probable global transcription activator SNF2L2 (LOC100770307), transcript variant X12, mRNA 
GGGCGGAGCCCGAGTTTAGGAAGAGGAGGGGACGGCTGTCATCAATGAAGTCATATTCATAATCTAGTCCTCGCTCCCTCTGTTGCTGTACTCTGGGTGACTCAGAGAGGGAAGATTCAGCCAGCACACTGCTCGCGAGCAAGTTTAGTGATACTCTGCTGACTGGCAGAGCCAGGAGAAGTAGATGTCCACACCCACAGACCCAGCTGCAATGCCCCATCCTGGGCCTTCCCCGGGGCCTGGACCCTCTCCTGGACCAATTCTGGGGCCCAGTCCAGGACCAGGACCATCCCCAGGTTCGGTCCACAGCATGATGGGGCCCAGTCCTGGACCGCCCAGTGTCTCACATCCTATGTCAACAATGGGCTCTGCAGACTTTCCACAGGAAGCCATACACCAGATGCATAAGCCCATGGACGGGATACATGACAAGGGAATTATAGACGATGCCCACTGTGGATCCATGAAGGGCGCCAGCATGCGCCCACCACACCCGGGAATGGGCCCTCCACAGAGCCCAATGGATCAGCACAGCCAAGGTTATATGTCACCACATCCTTCTCCTTTGGGAGCCCCAGAGCACGTCTCCAGCCCTATATCTGGAGGAGGCCCAACCCCACCCCAGATGCCACCGAGCCAGCCAGGGCCACTCATCCCAGGAGATCTGCAGGCCATGAACCAGCCTAACAGAGGTCCTTCGCCTTTCAGTCCTGTCCAGCTGCATCAGCTTCGAGCTCAGATTTTAGCTTACAAAATGTTGGCCAGGGGCCAGCCCCTCCCTGAAACCCTGCAGCTTGCAGTCCAGGGGAAAAGGACCTTGCCTGGCATGCAACAGCAACAGCAGCAGCAGCAGCAGCAGCAACAGCAACAGCAGCCCCAGCAGCCTCAGCAGCAGCCCCAGCAGCCTCAGCAGCAGGCGCAGCCACAACCGCAGCAGCAGCAGCCTGCCCTTGTTAGCTACAACAGACCATCTGGCCCTGGGCAAGAGATGCTGATGAGTGGCCAAAGCACCCCACAGAAGCTGTCAGCACCGGCACCCAGCGGCCGGCCGTCGCCCGCACCCCCAGCCGCTGCCCAGCCCACCGCCACAGCTGTGCCCGGGCCCTCGGTGCAGCAGCCTGCCCCAGGGCAGCCGTCTCCGGTCCTGCAGCTGCAACAGAAGCAGAGCCGTATCAGCCCAATCCAGAAACCGCAAGGCCTCGACCCCGTGGAGATCCTGCAGGAGCGAGAGTACAGACTGCAGGCTCGCATAGCTCATAGGATACAAGAACTGGAAAGTCTGCCTGGCTCTTTGCCACCAGATTTACGAACCAAAGCAACTGTGGAACTGAAAGCACTTCGGTTACTCAATTTCCAGCGTCAGCTGAGACAGGAGGTGGTGGCCTGCATGCGGAGGGATACCACCCTGGAGACGGCCCTCAACTCCAAAGCATACAAGCGGAGCAAGCGCCAGACCCTTCGAGAGGCGCGCATGACGGAGAAACTGGAGAAGCAGCAGAAGATAGAACAGGAGAGGAAACGGAGGCAGAAGCACCAGGAATACCTGAACAGTATTTTGCAACATGCAAAAGATTTTAAGGAGTATCACCGGTCTGTGGCTGGGAAGATCCAGAAGCTGTCCAAAGCAGTGGCGACTTGGCATGCTAACACTGAAAGGGAGCAAAAGAAGGAAACAGAGCGGATCGAGAAGGAGAGAATGCGGAGGCTGATGGCTGAAGATGAGGAGGGCTACAGGAAACTCATTGACCAAAAGAAAGACAGACGCTTAGCATACCTTTTGCAGCAGACCGATGAGTATGTGGCCAATCTGACCAACCTGGTTTGGGAGCACAAGCAGGCCCAAGCTGCCAAAGAGAAGAAGAAGAGGAGGAGGAGGAGAAAGAAGGCTGAAGAGAATGCAGAGGGAGGGGAGTCTGCCCTGGGACCCGATGGAGAGCCCATTGATGAAAGCAGCCAGATGAGTGACCTGCCCGTCAAAGTGACGCACACAGAAACTGGCAAGGTCCTCTTTGGTCCTGAAGCACCCAAAGCAAGTCAGTTGGATGCCTGGCTGGAGATGAATCCTGGGTATGAAGTTGCTCCCAGATCTGACAGCGAAGAGAGTGACTCTGATTATGAGGAAGAGGATGAAGAAGAAGAGTCCAGTAGGCAGGAAACGGAGGAGAAGATACTGCTGGATCCAAACAGTGAAGAAGTTTCCGAAAAGGACGCCAAGCAGATCATTGAGACTGCGAAACAGGATGTGGACGATGAATACAGCATGCAGTACAGTGCCAGAGGGTCGCAGTCCTACTACACGGTGGCCCATGCCATCTCCGAGAGGGTAGAGAAGCAGTCTGCCCTCCTCATTAATGGGACCCTAAAGCATTACCAGCTCCAGGGCCTGGAATGGATGGTTTCCCTGTATAATAACAATTTGAATGGAATCTTAGCTGATGAAATGGGGCTAGGCAAGACCATCCAGACCATTGCACTCATCACATATCTGATGGAGCACAAAAGACTCAATGGCCCCTATCTCATCATTGTTCCCCTCTCGACTCTGTCTAACTGGACATATGAATTTGACAAATGGGCTCCTTCTGTGGTGAAAATTTCTTACAAGGGTACCCCTGCCATGCGACGCTCCCTTGTTCCCCAGCTACGGAGTGGCAAATTCAATGTCCTCCTGACTACTTATGAATACATTATAAAAGACAAGCACATTCTTGCAAAGATTCGGTGGAAATACATGATTGTGGATGAAGGCCACCGAATGAAGAATCACCATTGCAAGCTGACTCAGGTCTTGAACACACACTATGTCGCCCCCAGAAGGATCCTTTTGACTGGGACCCCGCTACAGAATAAGCTCCCTGAACTCTGGGCCCTCCTCAACTTCCTTCTCCCTACAATCTTCAAGAGTTGCAGCACATTTGAGCAGTGGTTTAATGCTCCATTTGCCATGACTGGCGAAAGGGTGGACTTAAATGAAGAAGAAACTATCTTGATCATCAGGCGTCTGCACAAGGTGTTGAGACCCTTTTTACTGAGGAGACTGAAGAAAGAGGTTGAATCCCAGCTTCCAGAAAAGGTTGAGTATGTGATCAAGTGCGACATGTCAGCTCTGCAGAAGATTCTGTATCGTCATATGCAGGCCAAGGGGATCCTCCTCACTGACGGTTCTGAAAAAGATAAGAAGGGGAAAGGAGGTGCCAAGACGCTTATGAACACTATCATGCAGCTGAGAAAAATTTGCAACCACCCATATATGTTCCAGCACATTGAGGAATCCTTTGCTGAACACCTGGGCTATTCAAATGGGGTCATCAATGGGGCTGAGCTGTATCGGGCCTCAGGAAAGTTTGAGCTACTTGATCGTATTCTGCCCAAATTGAGAGCAACTAACCACCGCGTGCTGCTTTTCTGCCAGATGACGTCTCTCATGACCATCATGGAGGATTACTTTGCTTTTCGGAACTTCCTTTACCTGCGCCTTGATGGCACCACCAAGTCTGAAGATCGGGCTGCTTTGCTGAAGAAATTCAATGAACCTGGGTCCCAGTATTTCATTTTCTTGCTGAGTACACGAGCTGGGGGCCTGGGCTTAAATCTTCAGGCTGCGGACACAGTGGTCATCTTTGACAGCGACTGGAATCCTCATCAGGATCTGCAGGCCCAAGATCGAGCTCACCGCATTGGCCAACAGAATGAAGTCCGGGTTCTGAGGCTCTGCACTGTCAACAGTGTGGAGGAAAAGATTCTCGCAGCTGCAAAGTACAAGCTGAATGTGGACCAGAAGGTTATCCAGGCGGGCATGTTTGATCAGAAGTCCTCCAGCCACGAGCGGAGAGCATTCCTGCAGGCCATATTGGAGCATGAAGAGGAGAATGAGGAAGAAGATGAAGTACCAGACGACGAGACCCTGAACCAGATGATTGCTCGCCGGGAAGAAGAGTTTGATCTTTTTATGCGCATGGACATGGACCGGAGGAGGGAGGATGCCAGAAACCCAAAGCGCAAGCCTCGCCTGATGGAGGAAGATGAGCTGCCCTCCTGGATTATTAAGGATGACGCGGAAGTGGAAAGGCTTACCTGTGAAGAAGAGGAGGAGAAGATATTTGGTAGGGGTTCTCGCCAGCGCCGGGATGTGGACTACAGCGACGCCCTCACCGAGAAGCAGTGGCTCCGGGCCATCGAAGACGGCAATTTGGAAGAAATGGAGGAGGAAGTACGGCTCAAGAAGAGAAAAAGACGAAGAAATGTGGAGAAAGATCCTGTGAAGGAGGATGTGGAAAAGGCGAAGAAAAGAAGAGGCCGCCCTCCAGCTGAGAAACTGTCACCAAACCCCCCCAAACTAACCAAGCAGATGAACGCCATCATCGATACTGTGATAAACTACAAAGATAGTTCAGGGCGACAGCTCAGTGAAGTCTTCATTCAGTTACCTTCCAGGAAAGAGTTACCAGAATACTATGAATTAATTAGGAAGCCAGTGGATTTCAAAAAGATAAAGGAAAGAATTCGTAATCACAAGTACCGGAGCCTGGGTGACCTGGAGAAAGATGTCATGCTTCTCTGTCACAATGCACAGACATTCAACTTGGAGGGATCCCAGATCTATGAAGACTCCATTGTCCTACAGTCAGTATTTAAGAGTGCTCGGCAGAAAATCGCCAAAGAAGAGGAGAGTGAGGAAGAAAGCAATGAAGAGGAGGAGGAAGATGATGAAGAGGAGTCTGAGTCAGAGGGTAAGACCCTGCATCTGGCCCCTTCCACCTATCGGGCTATTTCCACAGCCAAATCTGTGAAGGTGAAAATCAAACTCAATAAAAAAGAAGAGAAAGGCCGGGACACAGGGAAAGGCAAGAAAAGGCCAAACCGAGGCAAAGCCAAACCTGTTGTGAGCGATTTTGACAGTGACGAGGAACAGGATGAGAACGAACAGTCAGAGGCAAGTGGGACTGATGATGAGTGAGCAGTGTGGACTTGATCTGACTGTGGCAGAACTGAACACTTTCTCCCCCTTTCTCCCTTCACCCCCAGTGAGTTCATTTGCCCTTTGGGCACTGGGTTATTCCTCCGTCCTCATTGTCATCTAGAGCTAGCTTTAGGATAGTGCCAGACAAACATATGATATCATGGTGTAAAAAAAACAAAACATGCATCTACACACACACACACACACACACACACACACACACACACGAATATTTGTAACATATTGTGACCAAATGGGCCTCAAAGATTCAAAGATTAAAAACAAACAAAAGCTTTTGATGGAAAAGACGTGGGTGGATAGTATATTTCTACAGGTGGGTCAAATTTGGTAGCCGTTTGATGTGCTTGCTTCCATCATCTATCCTGATGAGGAGATTTTTATCTTCTACAGCGCTGATGACCGGGAGAAGCCATTAAAAGCCACTGGTTATTTTATTTTTCATCAGGCAATTTTCAAAATTTTCATTTGTTCGGTATTGTTTTCTTGTTTGTTTGTTTTTTACACTGTGGTACATATAAGCAACTTTACTAGGTGACAGATGTACAGTAGTTAGAAATCACCTACATATACATTTTTCCATTTTATGCTCTATGATCTGAAGAACAAACAAAAAAAAAGCTTTTTGACTTGTATAAGATTTATGTCTACTGTAAACATTGCGGAATTTTTTTTTCCCTTTGGCTCTTGTTTTATTGACGCTATTGACTATTACAGTGTCTAGAGTGTCCCGATGGCTTCTTTTGTCCACCTGAGCTCCTGTGTTACCAATGGGTATGGTCTCCTTCTCCCTAAAGTGTACTTAATCTTTGCTTTCTTTGCACAATGTCTTTGGTTGCAAGTCATAAGCCTGAGGCAAATAAAATTCCAGTAATTTCGAAGGATGTGGTGTTGGTACTTTCCTAATAAACCGATAACTTACCTTGA
>XM_016163448.2 PREDICTED: Rousettus aegyptiacus junctional sarcoplasmic reticulum protein 1 (JSRP1), transcript variant X3, mRNA 
AAATATCGAGCCTCTTACCACATTCATTGTCATTTTCAAGCCTGGCCACTTCTGCTAAGTTATTCTTGGGAACAAAAAGTCTTGAGCCAGCAGCAAGGAAAAAGAGAAGTCAACAAGGGCATGCGTCAAACAGCCCAGGGCAGAAGCAGCCCAGCAAGGGCTTCCAGCCCTGCCGTGAGGCCACAAATCCACGGGCACATCTGCTGGCGGGTGATAAAGTGCCAGTGGCCTTGTGACAGCTCCCCGAAGACTCACAGGCCCCAAGGATGTGAGGGCGTGGCCGGATAAACAGGGCTTATCTCACACCGGAGGCCGTTTTTTTGTTTTTTTTTGTTTTTTTAACCCAACTTATATATTTTTTATCTTTTATGCTTCTCAATAGACTTTTCAATACTTTGTGATAGTTCAAATGCTTTGGCGAAGGTTTCGTTACGGAAAAAAGGGAGGCGTGGCGGGCTGGGTCTGAGCGCTGCGGCCCTGCAATCCGCTTCCTGCCTCACCTCGCCCGCGCCTCTGGGGTCGCCAGGTTTCGTCTTCGTTGCGACAGCATTTCTGTTGCCGGATGGAAGAGTGACGGGTGCTCTTGGAGGACACTAAGTGGATGTGGGTGTATCCTCGCCAGATCTTTTCTCTGTGTATGTCTTTTAGCATCTGTGGTCAGACTCCGTGTGCGTGTGAATAGCCAGACACACAGTGCCCCACGGCGTGCGCCTCCCTCCACATGACAAGTCCAGAACAAGCACGTCCCCAGACAGGAAGTGGGGGCCACCGTCCATCCCGTCCGCCAGGCCCAGCAAGGCGGCTGTGGACCCCGCAGCAGCCCGAGTCTGGACCCAGGCTTCTCAGACATCTCCATGACAACCAGGGCCCTGGAGGAGCTGGATGGAGGCCTGGGCAGCTGCCAAGCGGTGACACCCAGGCTGGCCGACTCCAGCAGCTGGCCCCACATGCTGTTGCTGGCGAGGCAGGTGCCCCTGCACCTGTCCCTGAGCCATGGGCCCCACCTAGTTCATCCCCCCAAAAGCCAGCACCGCACTTGTCGAAGCCCGTGGCCCGGGCACCCCCATCGGTGCCCCCTGCGCCCCAGGTGGAGGCAGAGGAGAGGCCCGAGGTGCCCGCGGCGGCTGCGTGGAAGGACGAAGGGGAGTCTGGGGAGGCCGCCGAGGAGCAGCGCGCACCCCTGGCCCACGGAGGGCCCAAGGAGAGGCCGCGGAAAGAGAGTCCGCGGAAGGAGAAGTCCCGAAAGGAGGAGAGACCGCGGAGGGCGGAGAAACCGCGGAGGGCGGAGAAGCCGGGGGCTGCCAGGGAGCCCCCGGGAGCCCGCCCCCGGCGCTGGGAGGCCCGCGAAGGGGGCCGCCGGCCCTGGGTGCAGGAGTCCCGAGACCCTGAGCACAGGAAAAGGCAGGCCTGGGCCTCTTTGCGGCGCCCCAGCGAGGAAGACCGGCCTCCGGGCCGCCAGAAGCACCGCGCCGGCAAGGGGCGGGACTGAGCCGCGCCAGGGGCTCGCGCTGGAGCCCCAGGCCTTCCCGGCGGGCCCCGGGTCCAGCCAAATAAAGAG
>KR839926.1 Uncultured bacterium clone OTU_8642 16S ribosomal RNA gene, partial sequence 
TACGTAGGGGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCGTGTAGGCGGCCACACAGGTCCGTTGTGAAAACTCGAGGCTCAACCTCGAGACGCCGATGGAAACCGTGTGGCTAGAGTCCGGAAGAGGAGTGTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCGGGAAGAACACCTATGGCGAAGGCAGCACTCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>XM_032296798.1 PREDICTED: Sapajus apella PTPRF interacting protein alpha 2 (PPFIA2), transcript variant X20, mRNA 
TAATTACATTGATATTTATGATGTTCTATAGGAGTTCAGAAAAGTGGAAAATATTTAGTACATTTTGTTTGATAGTACTCCTAGTATATAGAGTCTTACTGAGTTGTATGCAATTGCCTCTCAATGTCCTAGCCAGCTGTAACAGCTGTAATATACTTTGATCTATAAATTATAAAATAACTATCTACTTTAAAAAAAAAAAGGCTTTGTAAAAAAAATCGCATCTTGTTGAAAAGTCTGGGAATGACTAAAAGATTTAGAAAGATGCAGAATCAAGAGCGATAAAACAGCAATTTGTTACTAAATAGAGCTTTAAACAGTATATGAAACATACTTCAGGTTAGTCAGAAGAGGTCCTCTGAATTACACTGTGCATGCTTCCCTGAAATGAAACTGTATGTTATTGGTTAACCAGGATATTTAGCATAATCACTCTGCTAGACTGTGGTGGAGGGAGGTGATTATCACTGAGAACAGATGGGCAGGTCCACAGCACTGCCAGATTCTGCACAAGCTCCATTTATCGTTGGTTCTTGCTTTTTTCCTTCTGTGTTTTAAATTTTTTTAAAAAACATTGTATGTTCTAAAGAACTAGCTTCACAAAAGGCTGGTGGCTGATGATCTTTCAGCTAAGATTTCAAATGTAGAAGAAAGATTTAAAATGCTGTCACTGTGTATCTAAGAAGGATGGGGCAGATTTCATTTTACCCTGTAGTCTCCCTCAATGCATGCACGGATTTATCTGTACGCTAAGCTCTCTGCTCTGCATCTGTAGCTCCTTGTGGATTATATTGTCTCTGTGATCAGAAATGATTTTCTCGGATATGAACACCGTTTCTGGCTCCCCTAAAGTGCATCCTCCTAATGGGACCCGGTTTTACACTTTTCAAGAATTTGCTGCACTGACAAAAGAATTAAATGCCTGCAGGGAACAACTTCTAGAAAAGGAAGAAGAAATCTCTGAACTTAAAGCTGAAAGAAACAACACAAGACTATTACTGGAGCATTTGGAGTGCCTTGTGTCACGACATGAAAGGTCATTAAGAATGACGGTGGTAAAACGGCAAGCCCAGTCTCCCTCAGGAGTATCCAGCGAAGTGGAAGTTCTCAAGGCACTGAAATCTTTGTTTGAGCATCACAAGGCCTTGGATGAAAAGGTAAGGGAGCGACTGAGGGTTTCTTTAGAAAGAGTCTCTGCACTGGAAGAAGAACTAGCTGCTGCTAATCAGGAGATTGTTGCCTTGCGTGAACAAAATGTTCATATACAAAGAAAAATGGCATCAAGCGAGGGATCCACAGAGTCAGAACATCTTGAAGGGATGGAACCTGGCCAGAAAATCCACGAGAAGCGTTTGTCCAATGGTTCTATAGACTCAACTGATGACACTAGTCAAATAGTTGAACTACAAGAATTACTTGAAAAGCAAAACTATGAAATGGCCCAGATGAAAGAACGTTTAGCAGCCCTTTCTTCCCGGGTGGGAGAGGTGGAACAGGAAGCAGAGACAGCAAGAAAGGATCTCATTAAAACAGAAGAAATGAACACCAAGTATCAAAGGGACATTAGGGAGGCCATGGCACAAAAAGAAGATATGGAAGAAAGAATTACAACCCTTGAAAAGCGTTACCTCAGTGCTCAGAGAGAATCTACCTCCATACATGACATGAATGATAAACTAGAAAATGAGTTAGCAAATAAAGAAGCTATCCTACGGCAGATGGAAGAGAAAAACAGACAGTTACAAGAACGTCTTGAGCTAGCTGAACAAAAGTTGCAGCAGACCATGAGAAAGGCTGAAACATTGCCTGAAGTAGAGGCTGAACTGGCTCAGAGAATTGCAGCCTTAACAAAGGCTGAAGAGAGACATGGAAATATTGAAGAACGTATGAGACATCTAGAGGGTCAACTTGAAGAGAAAAATCAAGAACTTCAAAGAGCTAGGCAAAGAGAGAAAATGAATGAGGAGCATAACAAGAGATTATCGGATACTGTTGATAGACTTTTGACTGAATCCAATGAACGCCTACAACTACACTTAAAGGAAAGAATGGCGGCTCTAGAAGAAAAGAATGTTTTAATTCAAGAATCAGAAACTTTCAGAAAAAATCTTGAAGAATCTTTACATGATAAGGAAAGATTGGCAGAAGAAGTTGAAAAGCTGAGATCTGAACTTGACCAACTGAAAATGAGAACTGGCTCTTTAATTGAACCCACAATATCAAGAACTCACCTAGACACCTCAGCTGAGTTGCGGTATTCAGTGGGATCCCTTGTGGACAGCCAGTCTGATTACAGAACAACTAAAGTAATAAGAAGACCAAGGAGAGGCCGCATGGGTGTGCGAAGAGATGAGCCAAAGGTGAAATCTCTTGGGGATCATGAGTGGAATAGAACTCAACAGATTGGAGTACTAAGCAGCCACCCTTTTGAGAGTGACACTGAAATGTCTGATATTGATGATGATGACAGAGAAACAATTTTTAGCTCAATGGATCTTCTGTCTCCAAGTGGTCATTCTGATGCCCAGACTCTAGCCATGATGCTTCAGGAACAATTGGATGCCATTAACAAAGAAATCAGACTAATTCAGGAAGAAAAAGAATCTACAGAGTTGCGTGCTGAAGAAATTGAGAATAGAGTGGCTAGTGTGAGCCTGGAAGGTCTGAATTTGGCGAGGGTCCACCCAGGTACCTCCATCACTGCCTCTGTTACAGCTTCATCGCTGGCCAGTTCATCTCCCCCCAGTGGACACTCAACGCCAAAGCTCACCCCTCGAAGCCCTGCCAGGGAAATGGATCGGATGGGAGTTATGACACTGCCAAGTGATCTAAGGAAACATCGGAGAAAGATTGCAGTTGTGGAAGAAGATGGTCGAGAGGATAAAGCAACAATTAAATGTGAAACTTCTCCTCCTCCTACCCCTAGAGCCATCAGAATGACTCATACTCTCCCTTCTTCCTACCACAATGATGCTCGAAGTAGTTTATCTGTCTCTCTTGAGCCAGAAAGCCTTGGGCTAGGCAGTGCCAATAGCAGTCAAGACTCTCTTCACAAAGCCCCCAAGAAGAAAGGAATCAAGTCTTCAATAGGACGTTTGTTTGGTAAAAAAGAAAAAGCTCGACTTGGGCAGCTCCGAGGCTTTATGGAGACTGAAGCTGCAGCTCAGGAGTCCCTGGGGTTAGGCAAACTCGGAACTCAAGCTGAGAAGGATCGAAGACTGAAGAAAAACACATCTGGGCATGAACTTCTTGAAGAAGCTCGGAGAAAGGGGTTACCTTTTGCCCAGTGGGATGGGCCGACTGTGGTTGCATGGCTAGAGCTTTGGTTGGGAATGCCTGCATGGTACGTGGCAGCCTGCCGAGCCAACGTGAAGAGTGGGGCCATCATGTCTGCTTTATCTGACACTGAGATCCAGAGAGAAATTGGAATCAGCAATCCACTGCATCGCTTAAAGCTCCGATTAGCAATCCAGGAGATGGTTTCCCTAACAAGTCCTTCAGCTCCTCCAACATCTCGAACTCCTTCAGGCAACGTTTGGGTGACTCATGAAGAAATGGAAAATCTTGCAGCTCCAGCAAAAACGAAAGAATCTGAGGAAGGAAGCTGGGCCCAGTGTCCGGTTTTTCTACAGACCCTGGCTTATGGAGATATGAACCACGAATGGATTGGAAATGAATGGCTTCCCAGCCTGGGGTTACCTCAGTACAGAAGTTACTTTATGGAATGCTTGGTAGATGCAAGAATGTTAGATCACCTAACAAAAAAAGATCTCCGTGTCCATTTAAAAATGGTGGATAGTTTCCATCGAACAAGTTTACAATATGGAATTATGTGCTTAAAGAGGTTGAATTATGACAGAAAAGAACTAGAAAGAAGACGGGAAGCAAGCCAACATGAAATAAAAGATGTGTTGGTGTGGAGCAATGACCGAGTTATTCGCTGGATACAAGCAATTGGACTTCGAGAATATGCAAATAATATACTTGAGAGCGGTGTGCATGGCTCACTTATAGCCCTGGACGAAAACTTTGACTACAGCAGCTTAGCTTTATTGTTACAGATTCCAACACAGAATACCCAGGCAAGGCAGATTCTTGAAAGAGAATACAATAACCTCTTGGCCCTGGGAACTGAAAGGCGACTGGATGAAAGTGATGACAAGAACTTCAGACGTGGATCAACCTGGAGAAGGCAGTTTCCTCCTCGTGAAGTACATGGAATCAGCATGATGCCTGGGTCTTCAGAAACATTACCAGCTGGATTTAGGTTAACCACAACATCTGGACAGTCAAGAAAAATGACAACAGATGTTGCTTCATCAAGACTGCAGAGGTTAGACAACTCCACTGTTCGCACATACTCATGTTGACAAGCCACTCAAAGGAGGCAGCACTGACCTGCTATGTCGTCTTTTCAGTCTACTCTACCTAAAGTGCACTACCATCTAAGAAGACAAGCAGTGAAAATATTTGTGAAAACTGAATTCTAAGAAACTAATGATGTCATGATTTATTAAAAGCTGAAAAAAATGTGATTTTGGGGGGAGTCAGATGTTACATTTGATTAGTTTACTACAATTGTAATAAAATGCTTAAGTCATTTGAATAATAAACATCATCTACATCATAAACTCTGTACAACAGATGCTTTTATGAAATGAAGCCACTTGTTTTTCATGTTTTATTGTAATATACTAGGCATTTATGTATTACTGTGCATTTCTTTTTAAATGTGTAAGTCTTATGTAAATGGATATAAATATGATTTTTTAAAAAATAAAATATATGGTTCATGGAGTCTCGAGTACAAACATTTGACAATTCTAAGTACTGTTTGTATTTTACCATTCCACCATTTTTACAGTTTTTGAATTGTTAACAGTCAAATCAATGTTTCCTTGAAGCATGTTCCATGCTTCAACATGTTTCTCCTTCAAGTCTGTCAATACTTACTTACTTACTTAAAGCTGAACAACCTGCCTCTGATCATGTAAAAAAGAATGATTTAACCTGGAACTGGAGCCAAAAAATAGAGCTTTAAAGGCAATCAGGGATGTCCTATATCTTTAGAAATAGCACTGTGATGGCTCGATCTCCTTTTCAATACAAAACAAAGCCAACCTGTTTACAAGGGTCAAAAGCAATTATTTAAAAATTTATATTAAAAAACCATTATCTTCTCTTGTTACCTGTGGACCAAGAAAAAAAAAAAAAAAAAAAAAACTTCTTTACTAGAACCACATGTTCATTTAAGTATCTTGAACTGCCAGCCAGTACTGGACAGCGAAATGTCAACCGCCGCAGAGTCTGAGGCTCATTTCCACGAGAAAACAAAACCCAAGAAACCCTTCCCTTTTGTCAATGGAACAGGGCATTAGCCAAACTCATGTCTAATGTTATAAGCTTTCAGCCAAGATGGCCTTGTTGCGACTTCCCTGAAGTCAGTTTATCAGAGGAAATAAATGAAAGACAGAACAATTAACACATATAGTGTATAAAATTATGGAAGAGTAATCTCTTTCCCTGTGGCTTTATTTGGTGGTGTTACTGTTGTTTATTCTTTGTTTATATGGGAGATTCAAAGTAAAACCTATTTACTAATACCATTTATCTAACTGCGGATTTTCTGCTGCTTGATCTTATTAAGCGCAAGACCTGTCATTAGTAATTTTTTTTGTATTTTAATTTGCTATGTTTGCACGTACATTACATTTGTTTCGATGTCTATTTTTGTTTAACAGATTCAGTCAAAAGGTAATGGTAACAGAAACCCTTTCCATTGTCAATAATAAAAAAAATACTTCCA
>XM_021543360.1 PREDICTED: Lonchura striata domestica calpain 7 (CAPN7), transcript variant X2, mRNA 
CGAAAGTTTGTCAGGCTTCGGAGGAGCCGCGTTCTTCGGGGCGAGTTGCGAAACGCCTTTTCCCTGCGTCCTGGTTTTAGGAAGCTGCACAAGCCTTGATTTATGCTGGGATGGCTGGGTCCAACTTGGAAAATATTCAAGAAAAGATAAATGAGTACTTGGAGAGAGTTCAAGCTCTCCATTCAGCAGTTCAATCACAGAAGACAGACCCTCTGAAGTCAAAACAACAGTTGGACTTGGAGCGTGCTCACTTCCTAGTTACACAGGCTTTTGATGAAGATGATAAAGGCAATGCAGAAGAAGCTATAGAGTTGTACACAGAAGCAGTGGAACTCTGTTTGAAAACAGCTACTGAAACCTCAGAAGCCAGCCTCCAGTCCAAACTGAAACAACTGGCTCGACAAGCACTGGATAGAGCAGAAGCACTGAAGGAATCTATGTCAAAGTCATCACAGAAAGAAAAGTCAACTGCAGCCAAACCAAATCAGCCAGTCAGAACGTTCTTTCCACTGGGACCTGATTTTTCTTTAAATGATAAACCACAGACAATCAGAGCAGTACAAGCTAGTGAATCTCAAGGTCAGAGATACACTGCAGAGGAGATTGAAGTACTCAGGAAGACTTCAAAGATTAATGGCATTGAATATGTACCTTTCATGAGTGTTGATCTGAGGGAACGTTTTGCCTTCCCTATGCCTTTTTCTGATAAGTGTGGGAAGCTACCATTATCCCCCAAACAGAAAGCAATGTTTGCCAAGTGGGTGCGACCAGATGACATAACAAATAACCCTACAATGATCTATACTGTATCAAGTTTCAGCATAAAGCAGACAATAGTGTCAGACTGTTCTTTTGTGGCATCACTAGCTATCAGTGCAGCATATGAAAGAAGATACAACAAAAAACTGATCACGAGTATAATTTACCCTCAGAATAAGAAAGGAGAACCAGAATATAATCCATGTGGTAAATACATGGTGAAGCTTCATATCAATGGTGTTCCTAGAAAGGTAATCATAGATGACCAGTTACCTGTTGATCATAGTGGGGAACTTCTCTGCTCTTACTCCAATAATAAGAATGAATTATGGGTGTCACTAATAGAAAAGGCTTACATGAAGGTCATGGGAGGATATGATTTTCCTGGATCAAATTCTAATATTGATCTCCATGCACTGACAGGTTGGATACCTGAAAGAATTGCTATGCACTCTGACAATCAAGCCTTCAATAAAGATAGCACTTTCAGAATGCTTTATCAGAGATTTCACAAGGGAGATGTCCTTATCACAACAGCAACAGGGGTGATGTCTGAAGAGGAAGGAGAGAAGTGGGGTTTAGTTCCAACCCATGCATATGCAGTCTTGGATATAAGAGAATATAAGGGACTTCGATTTCTTCAGCTAAAAAATCCCTGGAGCCACTTGCGTTGGAAGGGACGATACAGTGAAAATGACACAAGAAACTGGACCCCAGATTTACAAAAATACTTGAACTTTGATCCCAGAACAGCTCAGAAAATAGACAATGGCATTTTCTGGATTTCCTGGGAGGACCTGTGCCAGTACTATGATGTTATTTATTTGAGTTGGAACCCAAGTCTTTTTAAAGAATCTACATGTATTCACAGTACGTGGGATGCAAAGCAGGGCCCGGTGAAGGACGCCTACAGCCTGGCCAACAACCCTCAGTACAAGCTGGAGGTGCAGTGTCCACAGGGTGGTGCTGCCGTCTGGGTCCTGCTCAGCAGGCACATCACTGACAAGGATGACTTCGCACACAATCGGGAATTCATTACAATGGTTGTATACAAGACTGATGGTAAAAAAGTTTACTATCCAGCTGATCCTCCTCCTTATATTGATGGTATTCGGATTAACAGTCCTCATTATCTGACCAAGATAAAGCTGACCTCTCCAGGTTCCCATACATTCACCTTAGTGGTGTCCCAGTATGAGAAACAAAACACCATCCATTACACCATCAGGGTGTATTCCTTGTGCAAGTTCACCTTTTCCAAGATTCCTACGCCTTACACCGTTTCCAAACGGGTTAATGGACAGTGGAAAGGTCACAGTGCTGGAGGATGTGGAAACTTCAGAGACACCTACAAAAATAACCCCATTTATCAATTCCAGCTAGACAAGAATGGACCATTGCTAATTGAACTACGGGGGCCAAGGCAATACAGTGTTGGCTTTGAACTTGTCACCGTCTCAACAGTGGGAGATCCTGGTTCCTATGGCTTTCAGAAAAAAAGCAGTGGTGACTACAGGTGTGGATTTTGCTACTTGGAGGTGGAGAACACATTTGCTGGAGTTTACAACATTATCCCCACCACATTCCTGCCTCAACAAGAAGGGCCTTTTTTCTTAGATTTTAACAGTACTACTCCTCTTAAGGTGTCACAGCTGCAGTGAGGAGACAGAACTGTGTAGTGTTGTTTAAGGAGATGGTTTTGATCTGTCCAGCAGCCTGAGAACAGGTGAAGAACCCTTACTACACATGCACAAAAGAAAATTACATCCTGATTTATAGCCAAAAGCATGGAATCACAGATTGCCAGTTAATTATGGCAGGGAGTTGGCTGTGGGTTTGCTGCTGTGGTCTAGGAGTGAGCACTGTTCAACAGGCTTGGGAATAGGCTAAAATGCATATATTCAAATGAACCAGCAGAACTCACTCAATTTATTGCAGTTTTTCCACACTTTGAATCAAAGTCTACTGAGTTACAAGAAAAACTAGCATTGAAATTCTCTCCTCCCCACATACAAGGTATAGGAGCTAAAGATTCTATTCTTAAAAGTAAACATGTAAGAAAAAATATTCTTGTGTATTCTGCTTATTCAGTCTCAGGACCAAATAGCTTTTATTACACATTTGTGCTGCTATCTGTAATGTTTTCAGCACTGAACGGGTTCTCAAATCTAAATGTAAATGTACTACTGCTGAGTCAAGAGTATTCCATGTGTCATCTTATCTGGAATATGTATATAGGAATAAAGGAAAAAGAAGGTTCCAGCTTTAGCTATTTCTAAAAGCAAAGCAAGTGCTTTGCTTATGTTATGTGTACCTTGAGAGCTGTTACTTCATATCTGTATGACTTTAGCACATAATACAGCATGAGGTTCTGTGGCTTTCTTCCTGCTATCTGCCAGACCTAGGTTGATCCTGAGGAGCAGGAAAGACAGGAGATCATCCAGCAGTAGTGATCAGGCAGTGCAGCACAGCCTTCTATGAGCAGCTGTGAAAGGTTTTCATCTGAAGATCCCCTGTATGATTCACTGTATCCACTGAGGGTAGTCTCAGTTACTGGTGCAGGGAGATGGGGAACTGCCCACCATCAGCAGCTCAGCAAAGAAATGTTTTATTTTCATCACTTTTGTAAGTATGTGTCATGTAGGGAAGGATCATTTAAATCTCTCTCCCAATACACCACAGCTTCAAGGAAGGCACTTGCTGATTCAATTATACAAGACATCTTTGAAAATATACTTTTTTCCTTTTAAAATGACACCAGTGAAGGAATTGAGCACAAGGCCAGTGTCATCAATAGAAGCAGGGTCACAGTTCTTAAGAAAATAGTGGAGGTGGGATTAATGCAGAACAAGTTATTTTTTTAGAAGTTCCCCCTGTATGTGTTCTTCCTCTAGATCTGTATAAATTGTATCTGAAGTGAATTCAAGATGAGCAGCTTTTATTTAATACCAACTGCCTGACAGATCCCAAAATTGATTAAATTTTGTCATTTTTACAAAATTTACAGTATTTCACAGCTGAGGGAGAGGGTGTTTTTAAAACAGCCATGGGAATTTTGCTGCCATTCACATTGGTTTGGCAGTTTTCCAAGCAAAAAGGTAGCATTTAAATCTTGCTTTAGATTACAGGTGTCACTTAGCCACTGGGAAACTGAACATACATTCTACAATAGCACCAGAAATAGCTGTGGGCTAAAGTTATTCCCACAGAAATCTGCTATTAGTCCTCTCCTCTCCTTTTGTTTCATTTCCTTCATCAGACAGCTGCTTAACAAGTATCTGGCTCTGAAAGGGCAGGGATAGCTCCTGCCTTGGAAAACACATGCCTTGCTGACTGCAGTTCTCTCAGAGACCATCTGGGCTAGGGAATTCATGACAAGTTTGTCACAGAGTGACTTACCTTCTTTTGCAGGGAAGTCTCTGATGTTTAGTGCAATAAATCAACAGAAGGAACAGCATGGTTGCAAGCTGAGAAGAAAACAGATTAGGTTCTTTGTGGTTATGCTTGGCTTTTGGAGTATGTGCCAAGGACTGCTTCATCCATAAAATATGAAAATTTCATTCAACGCCCATTTTCCCTACAGATTTCTGTTAAGTTTTTAGCCGAGGCTAAACCAGAGTAGCAGGAGAGTCCTCCATCTTATCACCTCTAAAGTTGGAGGTAGTGGGGAAGTATGAACCGAGTATCTTTTTGGCAGTACAAAAGGCAGATGCCAGAAGTGCCAGCTTTCAGCAGCAATTTCTTGCACATTCTCTGCTGTTTGAGATCAAGCTGGTAGACTTGCCTACAGGAAAATCTGTTGTTGTTCTTCAGTAGTTGGTTCCTACTCGGAAGGAAGGAGTTTTCCTTTCTCTTTCCCCCTGAGCACAAGTTAGTGCCAAAGCTTATGCTGCATGAAATGAGCAGAAGGCTCAGCTTCCATACTGTGCTGAACTTAAACTGAACTGAACTAAAAAGTAAGAAATGTACTCACTTTCCTAATGCCAGGCAAAAACATTAAGGCCAAAGGATCCTGTCCCCACCAGGATATGCCAATATTTCTTACGCATTCAGAACAGTCAGTGGATTGGGCTTATCCCCATTAGTGCATAGGACTTAAGCTTACTGTCAATCTTATATATATAAAGCAAATTCTATTCAAATATTGCATCTGGATAGGCTACTAGAATGCCATCACTGTGCACTTCCCTTCAGATACAGGACAGAACACTCAGGTGAAGTATTTCAGAGGTACTACAAAATATCCATATAAATTGCAACCTAGGGATTCTGGTTATGGCAAATTTATTTTACAACGAAATTTTCTTGTCCTTTTTTCTTAAGAAAAAGCATTGATATAAGCATTAGGATTTGCTTTAATATTTTCTGTCAAATATATACTTTTATATATTTTCCACAAGTAAGTCTAGAAAAATTATTGCAAAGTGAACTGATCCTTAGATTTTAACACAAACTCAGACCACTAAGTTAATATTTTCTTTTCCCTGTACTGTTTAGCACTTTTTGAACCATACGAGAGAGAACGTAGTTTGTTCTGTTAGGAAGACACAAGTTAGCCCTTGGTTGATCCAATCTCTCCGTTCTCAAAGATGCAGTGAGACATTGTACCATGGATGAATGGTATCAACACCTGCCCCAGACTGTGAGTCTGAGTTCAGTCCTAGTCTCCTGCTGCAAGCTTCATGTAACTATTTTGTACAGTAATTATGCATTTAACCACACAATGTCTGCAGCCTTTGAACAGCCACCTATTTAGATCTAAGTGTGTGTACATACAGTAGAGGTTTTCATTGCTTTATCTAAAAGGACATTGAAATCGTTTGATAATACCAAAGAGAAGTAGAACTCCTAGGTTAATACTGGCTTTATACATTCTCACATCAGGGCAGATGAAGCAATCATGTATACTTTGATACACCAGAGGCTTATTTTTATACCCATGAAGGCAGCTACCATCATGTTACACTTCAGAATCCACGAAGAGCTTAAGTAAAAACTAACTGGAGAAAGCTTGTTCCCTTACTTGTACTACATAGCAATGTGTGTTCATTTAAGTCTGTCATATTTATGATTATGGCTTTTATGAAGTTTAAAATAAAATGAGTTTTCCATTAATTTATTAGACA
>XM_017957302.2 PREDICTED: Papio anubis enhancer of zeste 2 polycomb repressive complex 2 subunit (EZH2), transcript variant X5, mRNA 
TGCTTGATTGGGTTGGGGGGGCCAAATAAAAGCGATGGCGATTGGACTGCCGCGTTTGGCGCTCGGTCCGGTCGCGTCCGACACCCGGTGGGACACAGAAGGCAGTGGAGCCCCGGCGGCGGCGGCGGCGCGCGGGGGCGACGCGCGGGAACAGCGCGAGCCGGCGCGCGGGACGAAGAATAATCATGGGCCAGACTGGGAAGAAATCTGAGAAGGGACCAGTTTGTTGGCGGAAGCGTGTAAAATCAGAGTACATGCGACTGAGACAGCTCAAGAGGTTCAGACGAGCTGATGAAGTAAAGAGTATGTTTAGTTCCAATCGTCAGAAAATTTTGGAAAGAACGGAAATCTTAAACCAAGAATGGAAACAGCGAAGGATACAGCCTGTGCACATCCTGACTTCTGTGAGCTCATTGCGCGGGACTAGGGAGTGTTCGGTGACCAGTGACTTGGATTTTCCAACACAAGTCATCCCATTAAAGACTCTGAATGCAGTTGCTTCAGTACCCATAATGTATTCTTGGTCTCCCCTACAGCAGAATTTTATGGTGGAAGATGAAACTGTTTTACATAACATTCCGTATATGGGAGATGAAGTTTTAGACCAGGATGGTACTTTCATTGAAGAACTAATAAAAAATTATGATGGAAAAGTACACGGGGATAGAGAATGTGGGTTTATAAATGATGAAATTTTTGTGGAGTTGGTCAATGCCCTTGGTCAATATAATGATGATGATGATGATGATGATGGAGACGATCCTGAAGAAAGAGAAGAAAAACAGAAAGATCTGGAGGATCACCGAGATGATAAAGAAAGCCGCCCACCTCGGAAATTTCCTTCTGATAAAATTTTTGAAGCCATTTCCTCGATGTTTCCAGATAAGGGCACAGCAGAAGAACTAAAGGAAAAATATAAAGAACTCACCGAACAGCAGCTCCCAGGCGCACTTCCTCCTGAATGTACCCCCAACATAGATGGACCAAACGCTAAATCTGTTCAGAGAGAGCAAAGCTTACACTCCTTTCATACGCTTTTCTGTAGGCGATGTTTTAAATATGACTGCTTCCTACATCCTTTTCATGCAACACCCAACACTTATAAGCGGAAGAACACAGAAACAGCTTTAGACAACAAACCTTGTGGACCACAGTGTTACCAGCATTTGGAGGGAGCAAAGGAGTTCGCTGCTGCTCTCACTGCTGAGCGGATAAAGACCCCACCAAAACGCCCAGGAGGCCGCAGAAGAGGACGGCTTCCCAATAACAGTAGCAGGCCCAGCACCCCCACCATTAATGTGCTGGAATCAAAGGATACAGACAGTGATAGGGAAGCAGGGACTGAAACGGGGGGAGAGAACAATGATAAAGAAGAAGAAGAGAAGAAAGACGAAACTTCGAGCTCCTCTGAAGCAAATTCTCGGTGTCAAACACCAATAAAGATGAAGCCAAATATTGAACCTCCTGAGAATGTGGAGTGGAGTGGTGCTGAAGCCTCAATGTTTAGAGTCCTCATTGGCACTTACTATGACAATTTCTGTGCCATTGCTAGGTTAATTGGGACCAAAACATGTAGACAGGTGTATGAGTTTAGAGTCAAAGAATCTAGCATCATAGCTCCAGCTCCTGCTGAGGATGTGGACACTCCTCCAAGGAAAAAGAAGAGGAAACACCGGTTGTGGGCTGCACACTGCCGAAAGATACAGCTGAAAAAGGACGGCTCCTCTAACCATGTTTACAACTATCAACCCTGTGATCATCCACGGCAGCCTTGTGACAGTTCGTGCCCTTGTGTGATAGCACAAAATTTTTGTGAAAAGTTTTGTCAATGTAGTTCAGAGTGTCAAAACCGCTTTCCGGGATGCCGCTGCAAAGCACAGTGCAACACCAAGCAGTGCCCGTGCTACCTGGCCGTCCGAGAGTGTGACCCTGACCTCTGTCTTACTTGTGGAGCCGCTGACCATTGGGACAGTAAAAATGTGTCCTGCAAGAACTGCAGTATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGCACCATCTGATGTGGCAGGCTGGGGGATTTTTATCAAAGATCCTGTGCAGAAAAATGAATTCATCTCAGAATACTGTGGAGAGATTATTTCTCAAGATGAAGCTGACAGAAGAGGCAAAGTATATGATAAATACATGTGCAGCTTTCTGTTCAACTTGAACAATGATTTTGTGGTGGATGCAACCCGCAAGGGTAACAAAATTCGTTTTGCAAATCATTCGGTAAATCCAAACTGCTATGCAAAAGTTATGATGGTTAACGGCGATCACAGGATAGGTATTTTTGCCAAGAGAGCCATCCAGACTGGTGAAGAGCTGTTTTTTGATTACAGATACAGCCAGGCTGATGCCCTGAAGTATGTCGGCATCGAAAGAGAAATGGAAATCCCTTGACATCTGCTACCTCCTCCCCCTCCTCTCTGAAACAGCTGCCTTAGCTTCAGGAACCTCGAGTACTGTGGGCAATTTAGAAAAAGAAAATGCAGTTTGAAATTCTAAATTTGCAAAGTACTGTAAGAATAATTTATAGTAATGAGTTTAAAAATCAACTTTTTATTGCCTTCTCACCAGCTGCAAAGTGTTTTGTACCAGTGAATTTTTGCAATAATGCAGTATGGTACATTTTTCAACTTTGAATAAAGAATACTTGAACTTGTC
>XM_028016850.1 PREDICTED: Xiphophorus couchianus intraflagellar transport 27 (ift27), transcript variant X1, mRNA 
ACCACAGGGAACGGTTGCTAGGAAACGAGCTTTGTCCATTTTTGCCGAGGCGAATGGAAGATTAAAGCTGCTAGCAGGAATGCTATTTAATTTATTAACAGACACTTACAATATTTCTCACGAGGTTTCGAATGTACGCCGAATAATGGTGAAGTTGAGGGCAAGATGTCTGCTTCTCGGGGATGCTGCAGTGGGGAAAAGTTCTCTTTTTCACATCTTCTACAATGATGGATCTCTGTTCCAGAAGAACTATAGCTTGACAACGGGAGTGGAGCTGGTGATGAAATGTATCAACATTCCAGAGACCAACGACTCCGTGGAGCTCTATATCTTAGACTCGGCGGGGAAGGAGACGCTAGCGGAGGGCTGCGAGAAAATGGTCAGAAGCTGCTCTGGATTCTTCTGTTTTCATTTGCATGAAACTAATCAGTGGGGGGAGCCATCTTTGCTGTGTCTGGTGTTCGATTTGACCAGTGAGCAGTCTTTTGCTAACTGCGCATGTTGGATGGAAAGAGTCCAAGCACACTGCAAAGGCCTCCGTGTGCCAGGTGTTCTCGTGGGAAACAAGTCGGATCTGTCAGCTAGAAGGGAAGTACAGGCGTCCGTGGCCGAGGAGTGGGCCCAAAGCAAGGGACTGGAGTACCACGAGACATCAGCTAAAGAGATGGTCAACTGTGATGCCCCCCTCCTCAGTTTAGCACAGTCCTTCTATTCTCTCTACCAGGAGCAGCGTGAGATCATGCAGAACCTCGGGCCCGGCTAGACTCCTCTTCCTTCACCACAGAGCTCACAGCCGTTTGAGACGAACCACTGCGAAGGAATTGCTTTAGGAGAATAGGATTTTCTGGCAAGGATACTGAAAGGCTTTCTGATTGTTTTTGTTTTAAATAAAGGACTAAATAAGGAGCAA
>XM_015847342.1 Paracoccidioides lutzii Pb01 hypothetical protein (PAAG_11752), partial mRNA 
ATGCAAGGACCAGAATATGTTTTAGATGAGCGGACGGAGCAATTGTTAACCCAGGGGACCAAGGGCGGATATGAGAATGGGTTCACATTTAGAAAGTTGCGGCTGGAAATCTCCTTTATTCGCAATCACCCATGGATGAAACGTCTCACTCCTTTTCCCTTTGGCCCACAACAGATGCTCAAAAATCAATTATGGGGAGTGTCTCCGCTATCATTTTCTCGTCCACAGACAGAGGAGGTCCCTTTGGATCAGAAGGCTCAAAATAATAGTGGATCCCAATCCCGCATCTTGGAACAGCGTGCCCGAAGGGTCAAAGCACTTGCTATCGCTTGTGGCGCTGGAGATGGCTGA
>XM_018786474.1 Plasmodium gaboni hypothetical protein partial mRNA 
ATGATTTTTAAAAGGTTCTTCCATAAGTATCCTGGAGGAAGTAAAATAAAATGTTATATAGAAAAACGAAAGAAAAAGAAATTAAATATAAGTTTATTTCATCAACCTCTATATTCTAAGAATTCGAAAAATTTTATTGATTGGAGATATAGTACTCCTAAGTCAGGGTATGAATATATGTATATATATGGAGAGAACACTATTGAAATAACGAATTTACCGAATAACAAAACTAATGAATATATTCAAGAACGTCTAAGAAAAAGTTTAAATAAATATGGAAGATTAAAAATTATCAGATGCTTAAGTCATAGGAATGATCCATATATAAATAATAATATTTGTTATGCTACATTTTATAATAGAAAAGATATGTATAAATGTATACGTAATATTAATATAAGACTTCCAATATCTTTACAGTATAAAATATTAAAATTTAAAAGTTTACTTTCCAATAAATGTAATGATTATAATTATTTTTTTAAACAAGACCATTATAATTACAGTGCTATAAATATAGCTTTGAATTTGTTTAAATATTTAGAATATAATAATTGTAGTATGAATATAAAGGATATCTACAAGCATGTATTTGAATATTCGTTTTATCCTCATAAAATTATTTCTTCAGGAATATCAGTTTATAAAATATTTAAAAACTGGACAAATTTTATATATTTTTTTGATAACTTATTTCATATTGTAAAAAAAGATGATGATATTTTTATTACAGCCAAAATTCTTAATGATCAAAATTTATCTATTTATTTAAACAACAAATTAATTGAATTAAAAAAAAAAACGGAACAGAGTAATTCCGTGTATTGGAGGGAGCACTCTTTACAATTACCCGAAGAAATTGAAAATAGAATAAATAACGATCGTCCAAAAAAGTTAAAAGAGGAACTGCAACTTTTGTCCAAGACAAAAGATTTTTACAAGATTCATGACGAACGACACTTATTTAAACTGAAATTAAACAAGGAGCGAAAAGAAAAAAAAAAGATGTTAAAAAAAAATAAGCAACAAGAAAAGGAAGAAAAGGAAAAGGAAAAACAACTTAAGAAGGAAATGTACTGA
>XM_046923823.1 PREDICTED: Gallus gallus integral membrane protein 2C (ITM2C), transcript variant X1, mRNA 
GGCAGTGAATGCGCTCGGCTGCAGATGAGCACTGTAACTTTCCATGGAAACTGCTGCATTGATTCTCTGCCTTTGGCTGCAGGAGGAGCAGGCTCCCGTGGTGCAGGGCCGCAGGTCATCGCTCAGCGGGGTGTGCTACCTGACCATGGGTCTCCTTGTGCTGCTCCTCGGCTTGGTCTTTGCATCAATGTATGTCTACAGATACTTCTTCATCACGCAGCTTCCCCGTGAGAGCGTGTTTCATTGCGGCGTCCTTTATGAAGACTCGCTGTATTCACCGTTCAAAGGGCAGCTGGAACTGCACGAAGATGTCAAGATTTACATCGAGGAGAACTACGAGCAAATCAATGTCCCGGTGCCCCAGTTTGGAGGGAGCGACCCTGCAGATATCATCCATGATTTCCAGCGAGGTCTAACAGCTTATCATGACATAACGCTGGATAAATGCTACGTCATTGAGCTGAACACCACTATCGTGATGCCTCCACGCAACCTCTGGGAGCTGCTGGTTAATGTGAAGAAAGGGACGTACCTGCCTCAGACATACATCATCCAGGAGGAGATGATTGCGACCGAGCACGTCAGCGACATGGAGCAGCTCGGCTCCTTCATCTACCGCCTGTGCAGCGGCAAGGAGACCTACAGGCTGAAGCGGAGGAGCACCAGGAGACGTATCAGTCGACGTGAGGCTGGGGACTGCCACCGTATTCGTCACTTTGAAAACACTTTTGTGGTTGAAACTGTTATCTGCAAAAAATCATGAAGCCCCTGTCCAGCTGTAACCTTCCGTGGCTTTGCTTGCACACACATGCTCTCAGCCCTCTTTTTAGACTTGGTAATCTGTCTTACTTTTTTTACGCCCTCTCCTGCTTGTGCAGCTCTAAAGCCTTGGGTCTGTCGTGGCCTCGCAGTTGATTCTCTTCTCTTTTCTCCTTACTGAGATGTTTTGCTGGGCTTAAATTTATGCAGCGGTCACAGATGGCCTTGGAGTGGATGCAGCCTCTTCCACCCCACAGGGTGGGGATCTGTTTTGGGAGCAGGTTTTGGGTAGAAGGGACGACCAAGAAATAGGATGCTGGAAATGGGCGCTCTTCTCATGTCTGAGCAGTTTCCTGCTGGCGCTGTTGTGAGGCTGGGGCAGAAGGTGTACTACAGGAGGAGAATTACCATTCTGATGCTGATGTAACGACCAGAATATGTCATCAGATGGACTTAGAATTAGATGCGAGGTTACAAACAGGGTGATTTGGAAAGCTCAGCAGGAGAGTTTCTGCCCACGCTGAACTGTGGTGCTCACAGTTTGTTGTCCCAATGAAGGCCAAGTTTTTGAACAGTGAAAGCAGCCCATATGCATTGTTTCTGTGTCTAGCTCCTGGCTGATTTGGAGTGGCATACCTGGAACCAGCCAGGCTACCCTCCCTCAGCCTTCAAAATAACAAGCAAGTGGTATCTGCTTGGGGCTCCTGAGCTCATCTGCTACGGCTTTGCCTGAGTAAATAGAGGTGAGCCGTCAATACATGCTGCCAAAGCTCAGCTGATGTCCCATCCTATGGGCTGCTGATGAAGCTGGATGCTTTATTTCAGCTCACCTCTCCAGGCCAGCTCCTCCTGCCTGGAAGATGAGTTATGTGAGTTATGTTCACATAGATCTGTCTTTCTGAGTTGTCAGGATCCCATCTGTGTGTGGATGGGTGCCATGCCAGCATGCAAAGCGGTATCAGCAGCAGGATCAGTAGTTACTGGCATCTGCAGAAACAGGGTGGTTTTTTTTGTTGTTGTTGTTGTTTGTTTGGGGTTTTTTGAGAGCATATTTCCACAGAACTCCTCTGAAGAAAGCCATTTTGATCATAACTCCTGTAGCCCAGCTGTGTGTTGTGTCATCTGTAGGCACCGCTAGAGAGCAGGTGTCGATGCAAGGCAAGATTCAGTGCATCAATATACTGCAGAGAAATTGTATGAACAAAATTGTGTTTCTATTGATCATCAGAAAGAAAAATTGCAGGGTACTTAAACATTCTTCCCTCTGTTCCATAAATATAGTAAAAACTAATGAGGTTCTTAAAATGCAGGCAGTTTTTTGGCTTGAAAGAACAGCTTGGCACATTCTTGTTAATTGGTTTTCAGCAAATCTGGACTTGTTCATCTGTTGAAATGAGCTTGTTGTTTCGGGAAGAGAAAGGATAAAGTAAATGCAAGAACAATCATTAACTCAGCAGGACCAAAAAAATTAATGTATTTGAGAGTCAAACTTCTATTAGTAATACTGTGAGCTAATTATATGAAAACAAAACAGAACCTTAAAATGATCGCATAACGCAGTAGCAATTAGTATGTCCTTAGAAGCTGAGGTTCTTATTTTTTTATATAAAAATAGAGTCAACCATAAACATTAGATTTTAATAGGTAGAGGAGGAGGTGCTGATCACCTGCTTTTTAAGGTGGATGTGAAATGTGAGATTGCATGTGTTTCGTGCAGACCAGTGAGGAAAGTTTCCCACTGCCAGAGGAGTATTTGCTTTTATAGTACAGCTGTGTTTTTCCACTACAACTTGCTATTAGTCCTAACCTTTCATTGCAAAGTGAATGATGAGAGTCAGAGAATCGGTTTGCTTGGTGGAAGTAGCACAAACTGGTAAATTTATGCCCTGCATTTCTCTCTGTTTCCAGGATCCTAAGCCTGCACTCAGGTGAGCGCTCAGACCTTTCCCCTTCCCTCTGATGCTGCATGAATTAACTGGTCATTGAATATGCTAACTCTGTGCAACCCCGCAGCTGTAAGGACAAGCCCTGATTCTTTAAGGTGAACTAACATGGTCGCTGTTTCATAGGGTGAGAATGCAGTTGTCTAGAAAGAAAACACAAAATGCTTTGTATATTTTGTCTGGTAGAACCTTTACCTCTTAGGAAACATTCATGGGATAATAAAATCTTTTACCTCTGATA
>XM_008488083.3 PREDICTED: Diaphorina citri protein rogdi-like (LOC103523006), mRNA 
GCACGATGAAGTTCGAACAGTACCAGGCCGAGAACTCAATACCATGGCTGAATGAGGTGCTCGTGCTGTTCACCGTGGCACTTCAACTGTGCCAGCAACTCAAGGATAAGATCAACGTGTTTGCCCAATACAAGGACTTCATCGTGTCACCTAATCTCTCCACACCTAGTGCTACCTAGTGGTAATTATGTAGATTAAGAAAGTGTGTACAGGGTGGTCCCATTGATGAGAGAGGGTTCACTGCAGATCATGGTTCACACAGTATATTATTATTGCACAA
>XR_001166349.3 PREDICTED: Fundulus heteroclitus uncharacterized LOC105928738 (LOC105928738), ncRNA 
CGTGTCTTGCACGTCGTCGCGAACGTTCGCTTGCTTCCGGCTTCCGTAGTCACTTCTGTGGCCACCAGGGGGGAAAATGACGGCGTGGAAGATGTGCGGTAAGCAGATGCATAGCTTTACCCTCGTGGGAACTACAGAAGCCGACGTCACGTAACTGCGCTTCGCTGAACGGCTGTTGTTACGAAGAAGCAGGGGATGATCGTCCGGTAAGGGCCTTCCAACGCCAGAGGAGGAGCAGGACAGATGTGCTTCCGAACGCATTTCAGTTTGACTGGGAGTCGTATGAAAATGCAGCGGAGCTTTTTGTCCCCATTGGTAAGGTTGGTTAACGGAGGTTAAAGAATATTAAATATATTGAGGAATTGAAAAAATAACGGGGATAAAACCTCGCGTCTACCTGAACGCAGCTTTACTTATTTCTCTTTTGTTCAAGCATCAAATGTTAGCTTCAGATGGAAAATAAATGTGACAATATGGGGGAATTCCCCCTAAGTGTGGACACTTTAAAAATGTGTGTGTTTAAAGACACATTTCCTTATTATAAGAGGAGCCGTGTGAAATCCCCAAGTTGTCTTCAGCACGTAGCAAGTCGCTTTCGGTTTTATCTGTTTATGATGACTTCCTTGTCATCGTCTCTTTGATGAAACAGCCATTTACTTTAGCGCTAGCGGCTAGTCCAAGTGGGCCCTAGGTCAGTATGTTCTGGGAAATCAATCCAATATCAGAAATATCCTAATGGTTCATGTGAATTCTACTTCATGAACACAGCTGTCAGATTTACACTAGAGGGTTATTTCTAGAGAACCGTATGGTTACAGCAGATAAAATTAGAAATGGACACAGGAACAATTTTCTCAGTAAATGTATTTCTAATACTTCTATTGAGGCCACCAGTAAATATTAAACCTTGTGATATTTATTTGCACATAATGGCTGGAATATTTTCTAAATACTAACAAGCCTTTGGCTGGTTTCTTGGCTTTCAATGCCTTTTGGTACATCCTTTTCTCATCCACCCTTCCACTTTATTACACATGACTCGAATTTATAGACTAATTTGCTTTGATTTCTGCATATGTGAGGATTACTTTGTGTGTTGCTAATATCCGTTGTGAATTTCATCTCAGTAGAAAGTAGGGGCATCCCGATACTGATTTTTTTTTTTTTCAGACCGAGCACGAGTACTTTAGTTCAGATACTTGCTGATTGCAAGTGCTGATACTGAGTATACTGATATAGCTTTATTTGATCATAATCAACTGGATTTTGGTCTTTTTGGTATAAGCATACAACGTGGCTCTATACCTTTAAAGACAATGTGCATATATATTTGAGAGTGGATATGTTTTAACGTAGTAGAAGACCGTTTTGGAACTTTGGGATTTTAGCGCTTAAGCAGATCAGCTTTAACACTGGAAGAGTTATGTACTACAGGCAAGGCATGTTCATAACCTCTAACAGAACGTGACAAACCTGAGCTACCCCTTTAAGGTCGCTCCATGAATGATAATATTTAAGTTGGTGGAACCTTCACAGGTGTTAGCTAAACGTTTTGCTTTTTAAACCCTTTCCAGAAAATAATCTGTGGATGTTTAAATAGATCCTATGTTACTCCTCCTGAGGAACCTGCCTGCAGCCTACACCCAGCTCCATGCCTTTGAGTTAAGTCCGTGGCAGATATAGTTAAGCCCAAAATGATTTACAGCCCTAGAAGACTTATGTTAGTATTTTTAAAATATTACTTTTAAACGAGTTTCTTCTGGCAGGAAGTAATAGCAACGTTCTTGAGCGACTCGTCCTTAGTGCTGGCTTTAATCTGGTAGAGAATCAGCGGAAGCAGCTAAAGATTAGGGTGATTGCTTGGAGGCCTTTCAACCTTGGAGGCTTGGTGCTAATCACCAACAAAAAAATCTTTGAAATATGAGTGGAAAAATACAAAAAGATGGTCAGCAATTTTAGGACAGGTTGAATTGCTGTGATGCCAATGAAGATTAGACCTTGGGCTATTGAGAAGGATGTGCACATTTGGCATAATATTTTGAATAAAATGTAAAACAAGAATGAATTGAAGCCTTCCATTTACATTTTTCAGTATATTTTGGGAGATGCCGCTCTCATTTTTTATCAGAAACAAATGCAAATGATTTAAAATCAAAATCGTCCAGGGGTCGGAATAATTTAGGTTTAACTCTTATTGTCTGTAAAAGTGCTGAAAGCCTGAGTTCTTTTAAATCAAGATTAAAAACACATTTGTTTAGGATTGCCTTCGACTGTTCTAGTTAAACTGTTTCACTGAAATATAATT
>XM_024809453.1 [Candida] sorbophila hypothetical protein (B9G98_02896), partial mRNA 
ATGGATCAACCATCTTTTACTATGGCCGAGCGGCTGTATAAAAAGGCGTACTCTGCTTCGTTCTGGAGCCAGAACGATTCTAAACACGGGTTTGACTCAGAGACCACGACTATTGTGCCGCATCTTGCCGATGCGCCCTTGTCTTTGAGACAGAAGGCACACATTTTGCTAGGGGTTTGCAAAATCATCTCGTCAAATGGGCGAATACTGAGTATAGAGGTTATACGGACCTGGAAATCGATGAACATTGTCAAATCTAAACCTAAAACAGACCCGCTACTGCTACCTGCTCGAAGGTCTCGCTCCCACACTCTCCCAGAGAACCCGCTCATCAACTTAGAGCTGGAAAAGGACTGGCCACCTTATAAACTGCCCAAACTCGCCTACACCCAGACACCGTCGCATTCCATCAGCGATTCTATTCGGTTAACAGACTTCCCCTTGGACCAAACCGAGTCCGACTACTCTTCTGTCACAGAAAGTATGCTTTCATACCAGAGTGATTTATTTGGTAACGCGAATCAGGTCTTGTTTGATCTGACGGAACATTCCGATACTCCTTTCAACCAAGTAACGCCAATTGCTTCGCCAGTTACGTTCAGTGAACCAGTCTACCCCGATGAACCGATCGAGCCTTTAGATTTCAGCGAACCGGATGAAACAGAGGACCCTACAGAAGCAAGACAAGATCCCTCAAGGAAATCTAAAGTGACTATTCAAAAAGAGATATTTTATTCCCAAGATAAACTAAATGAGTGGTTTGATGGCTATGATGAGTTCTGCAAAAATGCCTCTCGGCCATCGAAGAAAATAACATTTGAACGATTGTTTTGGGGTCGAGAAACTTGGTCTGCTAGGCATAATCGAAAACGCAGAGAGGCTGAGCTGCTGAAGAAAAACAAAGCAGCACCACCGGCCATGCCGACACCAGACCTGATAACACCAGACCAGAGCTCTGATGCGGATGAATCCCCTCATCTAGACGCTTTCGACAACCAATTTGATATAATGGATGATGCAGACAACAGTGATATTGAATTTGATGAGACACCGGGAAGTCCAATGCTGGAACTTCGAAAGGGGGAGTTTGAACACACCCTGGATACAGTGGGTCTTCTTCCTGAATCGTGGGATGAATTACCGCCACACCCACGTATCTCTGGGAGCTTTCAAAGAGACCAAAACGAACTTCAGGGTTTCTTACAACAGTTGACTGGCCAAGATGCGTTGATGGCTGGCCGAGTCACAGAAGAGGACGATGTGGCAATATTGGAAAAAGTAAACACCCTTGGTGGGAAATGTCTGTTTGATCAAGTCCACACAGCAACTCGTCTGAGTAAAGGGCATGCGTTTTTCTCGGTTTTGCGACTCGCTCAACAAGGCAAACTATCGCTGAACCAACCAGACGTGTTCGGAAAAATAACGATCCAGTCCTCATTTAGACCGCATTAA
>XM_044046427.1 PREDICTED: Solea senegalensis ret proto-oncogene receptor tyrosine kinase (ret), transcript variant X1, mRNA 
TGATACTGAGGAGGACTTCATCTCTCTGTGTCTGCCCAGACAGAGAACCGCGCACTCGGGACGCACACTGGTTTATACATCGCCCTTTTTTGACTCTTGTGGCTTGATTTTTTTTTTTTAACTATTTAAAGATTTTTTGTATTCTTTTTGCCAAAGGAACTTTTTTGAAGTCACGTTTCATTCACAAACCTTTACTTATGGTGCGCGAAAATGGGGTTAAGTTCTGGTTTCTCTCGTGGAAACATCGCCGTGTTGATGCTGCTGCTGCTGCTGCTTGAAGGAGTGACAGGGTTGTACTTTCCTCAGAAGGAGTACATTGAGACGGTATACGTGGGCCAGCCTGCAGGTACACCGATCCTCCAGGTCCACGCTATGCTGGACAACGACTCCGAGCGGCCGCATTTCTACCTGTGCTGGAGCGCGCTCAAACGTCCACCCCACAACTCCTGGTTCCACATGGACATTAACACTGGAATATTGTCCTTAAACAAAACCCTTGAGGAGAGCGACTTCACCTTCCCAAATCAACATTCGTGGTCAGTGAAGAAGTTGGTCCTTCATGCCACAGTCTTACCCAACGTCTCCAGGAAACCTCACTGCATGAACAAAAACGCCCCTCGGATCACTCTGGACTTTGTCAACGCCACATTGCCACAGTGTGCTCAGACAGATATGAAGGAACTGTGCTTCCCCCACAGAGACACCGCCAACCCTCACATAATGGAGAACAGGTTCCCCGGGGCCATCAGGCAACTCCGACGTCTTACCAGACTCAACGTTTGTCCTAACTACACCATCTCTTATAATGTGGAATCAGAGACCCCAGCGCCATTTGCTGTGAACGACAACTCCACAGAGTTGGTGGTGACCGCTCCATTAGACCGCGAGGAGAGCGAATGCTACAGACTCCTGCTGGTCTGTACAGTCCGAACAGAAACAGTCATCACCAAGGTGGAGACTTCCCTGGACGTGTTTGTTATGGACGAGGATGATAACGCACCATATGTAAATGGAACAGACGCAACAGATATTATCATCAGCTTCAATCGTACAAAGGGTGGCTCCTTTGGAACCTTGTTTGTCTTTGACAGGGATTTAACCCCCATTTTTCACATTGACAAGAGTCACAGTAAGTACAGGGGGACCTTGCTCAACAGTGATGCATGGATAAATAAAACGTTTGACATAAAAGGCACCTTCAGTGAAAAGAAAGCTGCTCATGGAGGCATTCGAGAGACCATTCACGACTACCAGCTTGTCCTGAAGAGGAACCTGTATGTGAATGAGAATCGCTCCGTGCAGCTGGACTACCTGGTCAATGACACAACCTACCCTGGTGTGGAGGGAACAGTGTTGCTGCACTTCAACATCACCATCTTACCAGTGCACATCCGCTTCGCAAACGTCACACACACGTTCACACTGACACGTAGAGCTTCCGTTTATGCTCAGGTTGGCAGAGTGTGCGTGGAAAACTGCCAGCAGTTTGATGGCTTCAGTGTCACGTACCGCCTCGAGGTGCCAGATAGGAACGCATCTGCTGACTTGCAGTTCTGCTATGGAGCCATTAGCATTACCCAGTCTCCTGGCGAGATGTGGGGACTGCTCTATGTGAACGACTCGGAGGCTTTGCGCAAGCCCGAGTGCCAGGACCTGCAGTACTTTGTTGTCGCCCAGGAGGAGCACACAAAGCAGGAGGCCACCACACAGATCCACATCCAACTGGATAGTGAAGTAAACAAAGGCAGCCAGGAGAGCCAGCAGTTCCTGTCCTGTGCCGAAAACAGGCGACGGGGAGACTGTGAGTCTGTCCGAGGCCTGGGGGCAACCACAGGGAGCTGTCAGTGGAGGCAAGGCACAGAGAAAGGAATATCTGAATATTACTCAACCTGCTCGCCTGATCTGCGGACGTGCCCAGATAGCTTTTGTGATGCAGTGGAAAGCAAAGACCCATTAATATGCCCACAAGACTGTACAAAGGAGACCGTAATTGGAGGTCATGAACGAGGTTTAGGGAACGGGATTAAAGCTGGATATGGAACCTGCTACTGCTACTCTGAGAGATGCTTCTGTGAGAAGGAAGATATTGAGGAGGCGATATGTGATGACATGTGCAAGACCATCATCGCCACGTCTCTGCTGCTCTCCTTTGTCGCCTCCATCCTCCTGTCCTCATACTTCATTCACCGGTATCACAAGAACTCGCCGAAACCACCGATAGCCTCTGCAGAAATGACGTTCCGTCGGCCAGCTCAGGCTTATCCCATCAGCTTCCCTGCAAACAACTTACGCCGGGGCTCACAGGACTCTATTGAGCCTGATACCTTTAAAATCCCTGAAGATCCAAAGTGGGAGTTTCCTCGTAAAAACCTTGTACTTGGCAAGACTTTAGGAGAAGGAGAGTTTGGAAAAGTTGTCAAGGCTACAGCTTTCCGGCTGAAAGGAAAAGCAGGTTACACCACTGTGGCTGTGAAAATGCTTAAAGAGAACGCCTCACACAGTGAGCTGCGTGACCTGCTGTCGGAATTCACTTTACTGAAGCAAGTCAACCATCCGCATGTTATAAAGATGTATGGAGCATGCAGCCAGGAAGGACCATTGTATCTGATTGTGGAGTACGCCAAATATGGGTCGCTCCGCAACTTCCTGCGCGAGAGTCGGAAAGTTGGCCCGAGCTACATGGGCAGGGACGCCAACCGAAACTCCAGCTACCTGGAGAACCCAGATGACAGGGCGCTCACCATGGGCGACCTGATCTCCTTTGCATGGCAGATCTCCAGAGGCATGCAGTACCTGGCTGAAATGAAGCTCGTTCACAGGGACCTTGCAGCACGAAACGTCCTCGTCGCTGAGGGAAGGAAGATGAAGATCTCAGACTTTGGCCTCTCCAGAGACGTGTATGAAGAGGACTCGTATGTTAAGAGGAGCAAGGGCCGTATTCCTGTTAAATGGATGGCAATAGAGTCCTTGTTTGATCACATATACACAACCCAAAGTGATGTCTGGTCCTTTGGTGTGCTGCTGTGGGAAATAGTGACACTGGGAGGAAATCCATACCCAGGCATCGCTCCTGAACGCCTCTTTAACCTCCTCAAAACTGGCTACAGAATGGAAAGACCAGAGAACTGCTCAGAGGAAATGTATAACCTCATGCTTCGGTGCTGGAAACAAGAACCAGACAAGAGGCAGACATTCTCAGACATCAGCAAAGAGCTCGAAAAGATGATGGTGAAAAGTCGGGATTACCTGGACCTTGCAGCTTCCACGCCTGCCGATGCTCTGCTGTACGATGACGCCCTCTCTGAAGAGGACACTCCACTAGTGGACTGTAATAACGCCCCTCTCCCTCGAACCCTCCCTTCCACATGGATTGAAAACAAGCTCTATGGCATGTCATACCCGAACTGGCCTGAGAAGAGCCCGGTACCGCTCAACAGACATGATGCCACTAATCCAGTCTTTACAAGATATGCCAATGATAGTGTTTATGCAAACTGGATGGCTTTGCCTTCACCCGCAAAAGCTGTGGACAAGCTTGATAGCTAAAGACAAACCGACACTGTAGAAAAGATGACTAATTGGTAGATGTATATATTTCTATAAGACTGTATATATATACGATCTGATGCTAAAGTTGGTTCCCTTTTATTTCTGTTGCATGGGTTGCATTCAAGGTTTAAAGCTGAGGTGTTTTGGCTACTAAAACTGGCTGGATCAACGTAGACCATGCTTCATTCTGCTCTTCAGTATGTTAATTATTACCTCATGGGTCATGTTGGCCAAGTTGTATCACTGCATGACTAGTGTACCAGATTGTATGTCAGTGTCAATGTCTTTAAGTGCCTGTGCCGCTTCTACAATACCCTCCAATTGTTAATGTGCGACCGTGAAGATCTTGTTCCAGCCCAGGAATTAAAGGGGACGTCTTTACCATCACTGTTGTAGACAGCTGGGATTGAGTGGACAGAAAATGCTGAACTTGTTCTGCAAATGTAAAGTTTCTACTGTGGAGAATCCAGCTCCTCGAAATGTCAAAGGCCCATTTTGTGTTTCTCCCACAAGATTTTTCAAAGCTGTTGTTGCCAAAGAAAAAAGTAACACAGACATGTTCAGTGAACGAGTTCATATTCTTTTTTTTCTGTTTTCTGTTGCTTTTTTTTACATGACAAATATCAACTAGAGAGTGTTACTGCAGTGTGAGGACATGAGATTTAATGTAGATCGTGACAATGTTCTTTCGTCAGACTATGGTTCACTTTTTTTTGATTCACTGTAATTGCAATCTTTGTGGAAAAACCGTACGGTGATGTAAAGTAAGGAGTGTTATCATTGTCCTGTTATTATTTGATTATGTTACCATTAATAATAAACATTCAAAATGTGCAGTTTGTCTAAAGACGGATAAGTTTCTGTATGATAGCTTTTTTCACAATTGAAA
>XM_029888545.1 Pyricularia pennisetigena uncharacterized protein (PpBr36_01358), partial mRNA 
ATGGAATCGTCGCTGAAGTGCAACACGCTTCTGTGCAGGACAGAGCTGAAGGACGAAGCTGTCGTCACCAGCTGCCTTCATGTTTTCTGTATTGATTGCGCTTCTCGCGCCAACTTGATCACTCCAGGCGCGGAGCATCTTCGCCAGTGTCCCGCATGCCGTTCGCCCTTGCCGGGTCCAGATCACGCAGTCCATGTCAATCTAAGACCTTCTGATGACTACAAAGGCAGCATTTTACGTGGATTAAGTCCGGTCGCTGTGATTGACTGTGCCAGTGCTGCCTTGAACTTTTGGGAGTATCAGATGGCCCAGGAGATCGTCTATCATGCCTACTTTGAGCAAACATTGACAGACAAATACTCACAATCGAGAGCCGAGCTGGACAAGATTACAGGAGAAGCAAATGGCCAGATAGGAATGCTGTCTGACAAGCTATCCGCGGTCACACTAGAACGTGACTCTGTGCGCCGAAAGAACGATGAGCTGATCGTCATGCTAAAAGAAAAGAACAAAAAGCTCATGCAAGTCCAGGAGCTATACGACAAGCTGAAACGCAAGGCTATGCTAGGTTCACTGCAAGACGGTGCCTCAGAGGCGGTTGATACAACCTTGGATCGAGTTGCAGCTGTTGGTGCCACGCCTGTAGCCGCAGATCGATACCAGCGGCTGGGGTTTTACCAACAACAGGCCGGCGACGTTAGACCTCATGGAGGTTTACAACCAAGAACAGGAAACACGTGGGACCAGCAGTTTAGACGCGATCGCATTGCAGCAACGCCAGAGCACAGAAACCATTCAAACAACACCGCTGGAATTAGACTTTCGAATATACCGGGCTTAGTTGTTGGCGGCGCGCCTCTGCTCAACCAGGACCGCCGTCACGGCTTGAGGTCAGAGCATCAGCACCTAAACGGTGTCCACGGTAACTCTGGGTATGGCGGTGCCAGTACCAACAACGGCCTTGGGCTGAACACAAGTGGTACAACTGGTGCTCTCCCGGGCGGAGCTGTTGGACTCTCATCCGCACAGAAACCAAGCTGTATGGACTCTCAGGATCCTTTTTCGATCATACTTAGAGCTGACTTTGGATATCTTCTCCAGTAA
>XM_033983629.1 PREDICTED: Periophthalmus magnuspinnatus butyrophilin subfamily 2 member A1-like (LOC117386288), mRNA 
GAGGCGCTGTCAGAGTCTGATCCTGAGATCCGTGGACTTTGCACTGCACTTAACTGAAGGAATTTGACCTCAAACAAAACAGAGTTTCACTATGGGTGTGGAGATGCTCTCTGTGTTTTTACTCATGCAGACTCACTTTTGCTGGGGTCAGAACACACTGGTCGTTCCCTCTCAGCCAATCATAGCGCCCGTTGGTAGTGATGTCACTCTGCCCTGTCAGTTGGACCCTGTTAAAGACCTCAGGGACATGGTGGTGGAGTGGTCACGGCACGACCTGACGCCGCGCTACATCCACATCCGCCGGGACGGTCTGGACTTCCTCATAGACCAGAACTCCCTGTACCTGGGCCGCACCTCTGTGTCCGAGAGCCGACTGCAGCAGGGGGACATGTCCCTGAGTCTGACCCGAGTCAGGGCCAGTGACAGGGGCAAGTACAGATGCTACATCCCCCTGGTTAACGTCAAAGCAGAGGTCACTCTGATGGTCGTGTCCGTGGCCCCTCCCTCGATGAGCCTGATCAAAGAGCGCTCGGGGTCTCCCGTGCTGAGGTGTGAGTCCAGGGGCTGGTACCCGGAGCCGGAGCTGGAGTGGCTGGACTCAGAGGGGACGGTTCTGCTCAGGACTGAGGCTCAGAGAGGAGCGAGCGAGGAGCTGTTCAGTGTGAGCAGCAGACTGAGTGTGGAGCAGAGGCTCGGCAACACGTTCACCTGCAGAGTGAGTCAACAGGAGAGCGGCCAGAGCAGAGAGGCCCAGCTCAGCATCACAGATGAATTCCTGGAGGCCTGTCCCTCGTGCTCTGTGGCCTGGGTCCTCTTTAGTTTGCTGCTGTGTCTCGTTGCTGCTGCTGTTGCCTTTGCCGTGTGGAAGTTTCAAATCAACAAAACCAAGACTATGGAGAACAAACTTAAAGACTGTGAAGAAGGTGTGCCAATGATGAGGGAAAAAGAAGATGAGAAAATCCACAGAGGAGACGACAAACACAGAGGAGACGACAAACTGACTGAATACAAGGAGCAATTAGAGAAGATTAAAGAAGAGCAGACGTCTGCTGCACAGTTGAGTGAGGAACTAACAGGAACAAAGATGTTTCTAATGAAACTAAAAGAAAAACTAAACCAATGTAAGTATCAACTCAGCACTGACATGAAGGAGAAGGAGAAGACAAAGTATGACTCTAAGAAAGAGGAGAAAATTAAGAAAATGCAGCAGCAAATGGAGGAGTTTAAGAGCATTATTAAAGATGTTGACACAGAAATGTCTAAAATTGAGAAGCTTCTTTCAAAAACCAGTGAGAAGAAAGGGAAGCTGGATGAAGACGTCAGGCGTTTCACAAAACTGGTGCAACAACAGGAGGCAACAGAAAAGAAGAAACAGGAGGAGAAGAAACAGGAAACCAGGAATGAGGCTCATGATGACACCAGTGGAGGAGAGAATATGAACCCCAGTCCTCAAAAACCAGTAAACCCTCAGGAGCAGACAGAGGAGCTGCAGGCACAGGGGACGGAACCGGAACAAACAGACACAAATACAGAGCACTACTGAGAGAGAAGAAAAGTAAGTGGTACAGCATACCAAACAAAAAATGTAAAAATCAATAATCCATCAAAATAACTAAGTTTATTATTGACTACACGCACACGCACACACACACATTCATAATAGACAAGTGTCTTGCCTAAGGACACAACATTCTGTCACTTCTGTCCCGCTGTGGCTCCTGGTATCACACGTCGTCTCATCCAAACACTGACCAGGCCCCTGTTTATCTTCTGACGTCTGAGGAGATCAGGTTTTGACAAAGAGGTTTGGTCAAGTCAATAAACTTCATTATAATTTACAATATAAATAATATCTGAATAAAACACTGAAATACAGGTTTGAAGTCAGTGATAAATATTTACATTTGTCAGACTAATTGTGCTGTTTTCATCTCAGTGAAAATGTGTCTGAATGTGACAGTTCTGTTCATCAGTGTTTTACTCTGTTTATGTGGTGTCTATGACTGTGACATTATCCTCAAAGTTTGAACTGAACACAAAAATACAAACGTGACAGAGCGGATGAAGAGAAGTAATATTTTTTGTAGGACATGGCAAATAAGCAACTTTTATATCTTATTTTGTAACACTAATCCAAGAAATATGACTAGTTTTATACACTTAAGTTTGTGTTTGTTTACTGCTTGTTACTGTGGATAAAGTTTAATGGTTTGGTTCTTGTCATTCCATTCAACTAAACTAAACTTTTTAAAACGAAAAACTATGAATTATTTTTTTTATGTATTTGAAATGACTGTTTAACTGTGAAAAAATGTGCAATTGTGCCATCTGTTGGTGTTGAAAAGTAACTACATGTCTAAATAC
>KJ347058.1 Uncultured bacterium clone Evans.12.9_05674 16S ribosomal RNA gene, partial sequence 
TACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGGCGGCCATGTAAGTCAGAAGTGAAAGCCCGGGGCTCAACCCCGGGACTGCTCTTGAGACTGTGTGGCTGGAGTGTCGGAGGGGTAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACGATCACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGG
>XM_027695588.1 PREDICTED: Neopelma chrysocephalum KIAA1217 ortholog (KIAA1217), transcript variant X7, mRNA 
CTCCTAAATCGCCTTTATCTAGAAAAGAAGATTTTAACAGCCGATCACGAAAAATTAGGCTAGGTGAAAAGATTTTGAGAGCTGGCAGCGAAGGAAATCTGGTTAAACAGCATCAGCAGGAGCAGGTGGAAATCACAGAAGGGCTTGTGCCACGGAGGGCTCCTTTCCTGAAAGACCAGGCAAAAACCAGTTTGCATGTAACATCACTAGACGATGCAGAATGTCTCCGATCTAAAGAGCTCCTTTCGACCCCGAACAGTCACACCTCTTCTAATTCAAAGTCCACCCGCAACATCCCTCGAAGACATACAGTAGGTGGCCCTCGCAGTTCCAAAGAAATACTGGGAATGCAAACCTCAGAAATGGACAGGAAGAGAGAGGCTTTTCTTGAGCATCTGAAACAGAAATATCCCCACCATGCTACAGCAATAATGGGACACCAGGAGAGACTGAGAGATCAGACAAGAAGCCCAAAGCTGTCCCAGAGCCCACAGCCCAATTTGGGTGACCAGACAGAACACCTCTCTGAAGCATCTGCGGATTCCTTAGAGGCCATGTCTGAGGGTGATTCTCCAACCCCCTTTTCGAGGGGCAGCCGCACGCGGGCAAGTCTTCCAGTTGTGCGGTCAGCAAACCAGACAAAGGAAAGATCACTGGGTGTATTATATCTTCAGTATGGAGATGAAACAAAGCAGTTGCGGATGCCGAATGAAATCACAAGCACAGACACAATTCGTGCCCTTTTTGTAAGTGCCTTCCCCCAGCAGCTGACAATGAAAATGCTGGAATCGCCGAGTGTCGCCATTTACATCAAGGATGAGAGCAGAAACATATACTATGAATTGTGCGATGTGAGGAATATTCAAGACCGATCTTTCCTTAAAGTTTACAACAAAGATCCTGCACACGCATTTAATCACACTTCCAGAGCTGTAAATGGAGATATAAGGATGCAGAGGGAAATTGCTTATACAGGACGAGATGGCCCAAGTGGTTCCCGCCCTGGATCTGCCACGCACCCTCTGCATGCGATGCCCAGCTCTCCACCCTCCACCCCAGTGCCCCACTCCATGCCTCCCTCTCCGTCCAGGATTCCCTATGGTGGGGGCCGGCCCATGGGTGTGCCAGGCAATGCCACCATCCCCAGGGACCGTCTCTCCAGCATGCCAGCCTCGCGCTCCATATCGCCCAGCCCAAGCGCCATTTTGGAGAGACGGGACGTGAAGCCAGATGAGGACATGAGCAGCAAAAACCTTACCCTGATCCGAAATGAAGGTCTGTACGGTGACCCCTACTTGTTTCACGAGGGGAGGATGAGTGTGGCTGCACCGCACTCCGGACACCCCCTCGATGTCCCCGATCACATTGTAGCCTACCATCGCAGTGCCATGAGGTCATCAAGCACTTACTGCAACCCTTCAATGCAGCCTGAAATGCTGGAGCAGTCCTTGTACAGACAAAAGTCACGGAGGTACACGGAGAGCCATTTGCCCACTCTCGGCTCTAAAACACCTCCTGCCTCGCCCCACAGGGTGGCTGACATGAGAATGGTCGATATTCATCCTCACCATGGGACTCACATTCCCCACCACACCATCCAGCCTGACAGGTCTTCCCCCAGCCGCCAGTCCTTCAAAAAGGAGCCAGGACCGCCTGTGTTTGTGGATGCGAAAGCACGGAGTGCTGTTGGCCTCCCGGGCATGGCCGAGGCAATGCCCTCTCCAGCTGACAAGCAGGCTTTTGGCTATGGGTCACCTACCATGCCCAAGGACAAGGAGACAAGTGAGAAGATGATGTTGAAAATTGTGTCCAGCAAGAGCAGCGTTGACACTGCAGGTGTTTCTAACATGTCTGGGGGGAAGAATGCACTGGCAACTGTGGAGTCAGCTGTCGTCCATCACCCTGCTGGAGCCCTATCAATGCAAGTCAGCCTGCATGGTATGAAACGCAACGTGTCAGACCTGCGGCTGCAGCTGCATCAGATGAAGCAGCTACAGCTGCAGAACCAGGAGATGCTGAGGGCAATGGTGAAGAAAGCAGAGCTGGAGATCAATGGCAAAATGATTGAAACAGTAAAGAGGCTTGAAGATCCTGTGCAGCGACAGCGCAACCTGGTGGAACAAGAAAGGCAGAAATACCTCAACGAGGAAGAAAAGATTGTAAAGAAGTTATGTGAGCTGGAGGCATTTGTTGAAGACCTGAAGAAGGATTCTGCTGCTTCCAACAAGACAGTTACACTGAAAGATGTTGAAGATGGAGCCTTTCTTTTACGTCAAGTGGGAGAAGCTGTTGCTACTCTAAAAGGAGAGTTCCCAACACTGCAGAATAAAATGCGTGCGATCCTCCGAATTGAGGTAGAAGCTGTGAGGTTCCTAAAGGAAGAGCCACACAAGCTAGACAGCTTGCTGAAACGTGTGCGCAGCATGACCGATATCCTTACCATACTCAGGAGACATGTTACAGAAGGACTGCTGAGGGGTGTGGATCCATCCCAAGCCGTGCAATCCTCAGCTATGGAAAAGTCCACTGCAGCTGACACTCTGAAAAACCAGGAGGAGCACAAGTCTGCCCAAGGACATGCACAGCAGAATCTCACAGCAGTCACATCAGAATCCCAGGTGTCATCAGTGAAGTCAGAAGTCATCCCCTTCTCAACAATGACTGTCCATCACGTGCAGAGCTCGCCAGTTGTCATCCATCAGTCTCAGCACTCATCAGCCCTGGTCAACCATGCCCAGGGCTCACCCACTGCAGGCACTCACAGCGAAGGTGTGCCAGGTCATCTCTCAGCCACCCCGCCAGCCCCCCTGCAAGAGCCCACAACAGGATCCCAGCCCACACAAGCCACACCAGCACCACAGGTCTCTGTCAATGGCACCACCATGCAAAGTCTTTTCATTGAGGAAATTCACAGTGCAAGTACCAGAAACCGAGCTGTATCAATTGAGAAAGCTGAAAAGAAGTGGGAAGAAAAAAGACAGAACCTTGATCACTATAATGGAAAGGAATTTGAAAAGCTCTTGGAAGAGGCCCAGGCCAATATAATGAAGTCAATTCCTAACCTGGAGATGCCTCCCCAGCCAGCAGCCCTGCCTAAAGGGGATGCAGCAGAAAAGCTAGAAGTCTCAGAAGAACTTCCTGATGGAGAACAGGATAATGACAAGCTGACCAAGTCTCCACCTCCTCCACCTCCACGGCGCAGTTACCTGCCAGGGTCAGGACTAACCACGACGAGATCGGGAGATGTTGTCTATACAGCCAGAAAAGAGGCTGCTGCTGTCAAGGAATGCAGTGAGGATGCTGGGCAAATAGCACAATCCAAAGCCCCTAAAGAGGATCAGGCATTGTCTCGGAGCACAGGACATGCTATAGCATCAGCTGCAAAAGATGAAGAGGAAGAGGAAGGGGATAAAATAATGGCTGAATTACAGGCTTTCCAGAAGTGCTCTTTTATGGATGTAAACTCAAACAGTCATGCTGAACAGTCCAGAAATGATACACATGTTAAAGACATAAGGCCTGGGACTTTAATGCATCACAAGGAAAAGAAGGTGTATGGGGCTACAACAGGATCTCCCACAGATAGTGATCATCCTAAAGAGAAGAGGGAAGGGAAAACTGAAGAAGAATTGGGTTCTGATTCATCCAGTACAGCTGACAGTAAAATTGGCTTTTCAATGAATGACAGTCCTACATTTAGCAAGGGTTTGTTTGTAGACAGTACAGACTATTCTAACAAAAACCTTCAGAATAAGAGCACAAACCTGTCTGGTGTCAGTTTGCCAGAGGATGACAGACGAAGAGGGGCTCAAGATATTTTAGGATCCCATATTCCAGCTGTTGAAACTGGAAAACAAAAGCCAAACTACAAACTCTCAAGAGATGCTCACCAGGGCCTGCCACAGGGTGAAGTCTTGCAGAGCACAGGCAAGCACATCCCTATCAGCAGCGTTGCCCCTCTCGTGAGGCAAAGCCAGGAGGCCACAGGGCCTCAACCTGCCTTGCAGGAGCAAGAAGGTTCTGCAGTGAACTACAATCAGGTTGTGCTAAGACCCAAAGTGTCCAGAAGTAATAGTGTGAACAGCATTGAAGAGACAGACTCTCCAGCCACCTCTCCAAGTGAAGATGGCCCACCCACAGAAAACATCGCCTTCATGATTACCAAAACAGCTGTGCAGGTCCTCTCAAGTGGAGAAGTTCACGATATAGTCAGCCGGAAAGGAGGAGATGTGCAAACAGTGAACATCGATGCGAGGAAGGACGTAGCATCAGAAAAGGGTATCCCAGAGAACACAGACAGCGAAGAGCCAGTGGTGTGTCTGGACAAAAAACCTGTCATCATCATTTTTGATGAACCAATGGATATCAGGTCAGCATATAAGCGGCTTTCTACAATTTTTGAGGAATGTGATGAGGAGTTGGAAAAAATGATGACAGATGAAAAGATAGAAGAGGAAGAGGAGGAGGAAGACAATGAAGCACATGATGTCTCTGAGAGCCAGAAGGAAGAGTCACCAGTAGTTAATGACAGAAAAGCAACTGCAGAGCATTCAGCAGCTCACAGTCTCCAGGAGCCGTACCTGTTTAACCTTCAGTCTGACTCTGCAGAAAGCAGACCTCCTGCAGAAGAGGAAAGCACAAAGACAAATTTGAACAAATACCGTCAGATCTATGGGCTAAACACAGAAGCAAACTCAGACTCTGCCGATCAGTTTGGAAGCAGGCAGGATTCTAAGAAAAAATTTAAGTTTAAATTCCCTAAAAAGCAGCTGGCTGCTCTGACGCAGGCGATACGGACAGGGACCAAGACTGGGAAGAAGACCTTACAGGTTGTGGTCTATGAAGAAGAGGAGGAAGATGGGACCCTGAAGCAGCACAAGGAAGCGAAGAGATTTGAAATCACTAGGTCTCAGCCTGAGGAGAGTGACAAAAGTCCTTCTGGGAAGCAAGAGGGACCCTCCGGAGCTGCAGCGCCCCTATCTAGGACTGATGAAATTCGACAGAGCACATACAGGACACTAGACAGCCTTGAGCAGACTATAAAGCAGCTGGAAAACACCATCAGTGAAATGAGTCCAAAACCTATCCCTGAAAACACATACACCTCTGAGGGAAGTACTGTCCCCTTCTCTGCCCAGATAGTAGCAGAGACCCCATCCCGAGAGCGTGTAGTGCTGGATGAGAACCTTGCTGGTGTAGAGCCCCCTGCGTCCATCCCAGCCACTTCACGTAAGGGCTCCAGCGCTGCCTCCCAGACAAGCCGGATGCCAGTCCCCATGACTTCAAAAACTAGACAAGGAAGCATGGAGAAATCCGGCAAACAGCACAAGCTGCAGGATCCACGCCAATACAGACAGGCTAATGGAAGTGCTAAGAAAGCTGGTGGGGACTGTAAGGCTACTTCCCCTACCCTACCTGCTTCTAAGATCCCAGCCTTTTCTCCCACTTCTGGGAAAAGCAGCTCAGCACCTGCTTCTAGCGGTGACAGCTCTAACTCTCTTAATCCACCTACTAAAACCTCCATTCCTTCCTCCAACCTTCTTGGTCCTCAGTCAGGTCGCATAACTTACTCTACCTCCCTCATCCCCTCTGTCTCTAACGGCTCCTCCAAGTTTCAGAGCCCCACTTACCCAGGGAAAGGTCACCATCTCTCCTTCTCACTACAGACTCAAAATGGCCGGCCACCCCCTCCTTCCTCCTCTACCTCCCCCCCCTCCTCTCTGTCCCCCCCTTCACTGAACCAAGGTATGAAGAGCATCAGGACAATCCACACACCTAGTTTCAACAGCTACAAGGCACAGAATGGAAATGCCAGCAAGTCCACCCCATCCACGGTCAAGGAGCCATCCTAAAGGCTAAGCACGGCACACCTGCCAGGTCACCAAGGCTTTTTGTTCATTTTCTGCAGCCAATATTTTAACCAGGGAATGTAACCATTTAACTGTATTGCTGGAGGCTTAATACTAATCACGTGCTAAATACTGAATTACTACACTAGATTAGAGTGAAGCTTTTTGGAAAACTGTTGCTGTTGTACTGATAAAAGAGCATTTTCTTCCTATAGGCAGCACCTCTTACAAAAAGTGTGAAGGTGTGTGAGTGAACTTGACTGCGCGTGCACAGCGGTGTACTGAGCATGGGGAATTGTATGGTTAAAAATTTAGTAAGTTGTTTTGTATAAAGCTATTTTTCATTATGGGGTCTAGAAGTGAACAGAGATATACTAAAGTGTGATTATATTCAATTGTAAAACTGAAACTAAAATATTTTTCTTTTATTTTGGTGTTATTTAGCTTTGTTACAGATTTCTATTTTTGTCAACAAATGTCATGGTTCCTTTCGAGATCTTTTTGCCAAAACATTTTGATACTATTGTAATGTACATTTGAAAGTAGTATGCTGGACAGTAAACCTCTACACAAGAAACAAAACAAGACTGGTCTTATGTGTGTATGAGGCAACTCAAACTATTGCACTGCCATTCAGATTATATTTAAGAATTTGCCAGCCAAGAAAAAAATAAATTGTTTTACACATATAGATAGTTGCTGATTACTTTTTTTCTTAGCTAAATCCACCCTTTTTCCTTCAGTTTTATTTTACTGAGACCTGGTAGCCCATTAATGCATTGCATTGTGGATTTTAAAATGTACACTTCAGTACTGTTCTGTATACTGGCAAACTTTTGTACATATCTATAAATATCTATAAATAAAGAAATACTGTATGTGGCTGGGCA
>XM_001989357.2 PREDICTED: Drosophila grimshawi DNA-directed RNA polymerase II subunit RPB11 (LOC6562570), mRNA 
CCATGAAATTGCTTGTGAACACAAGCCAAATATAGAAGAAATATTTCGCAAACAGTTTTAAACTTTTTATATTGACTTTTTCATTATCGATATGTAAAGAGGGCTTCATAACTAGACAGCACATTGATATAAATACCACAAACATCGCGTACATGCGATAGATCGACTGTGCAGTGTTGTTAAGCATGTGCGCACTTCAAGCGTTTAACAGCACATACTCAGCGCATTATTTTCGTGTCTGCAGTTGATTTTCACAAACAATTGCAATTTTATAAAACATAAATAAATAAGTAAATTAAAACAGCAAAATGAATGCACCGCCCACATTTGAATCGTTTCTGCTGTATGAGGGCGAGAAAAAAATAATCAAGGAATTGGATACGAAGGTGACAAATGCGGCGATATTCACCATCAACAAGGAAGATCACACGCTGGGCAACATGATTCGCAACCAATTGTTAAAAGATCCAAATGTTCTGTTTGCCGGCTACAAAGTGCCGCATCCGCTGGAACATAAATTCGTGATTCGCATTCAGACAACGGCCGATTATTCACCACAGGAAGCATTCATGAATGCCATCACTGATCTGCTGGCGGAACTATCGCTCTTCGAGGAGCGATTTAAGGATGCTATTAAGGAGAAAAAGGAGGGCGGCGATTAGTTTTACACATTTTTATTTTCGACAAGAAATTTACGAAACAATAGAAATATATATATTTTCACTAATTTGTATAAATAAATAAAAGTAATATATGCTATTAGTGAAATGTAATAGTTTCTCAGCTGAGGTAAAAGAAAAAAACAGA
>XM_027211675.1 PREDICTED: Coffea arabica probable tocopherol O-methyltransferase, chloroplastic (LOC113693095), mRNA 
AGTGCCACATTGTTCCCTCTCCCTCTCTCTCGTTCTTCTCACAAGTTGTCTTGCGTGCTGCTTTGCTTCTCAGGACACGTTGAAGCTTTTGTTCTTTGCTAGCTAGGATTGTGCGGTACAACCAACAATAATGGAGGGGGAGAAGACGGATACCGAGGGAAAGGTGGAGACAGAGAAGATGAACAAGGAATTTGCGATGACATATGATGTCCACTCTAAAATGTTAGAGGATCTAGTTGGGGATCACTTCCATTTGGGCTTCTATGACTCTAGCTCCGTTATCCCTGGTTCTGATGTCAATTCTGCTCAGACTCGCATGATCGAGGCGGCCCTCCGTTTTGCCTCTGTATCAGAGGATCCATCTAAGAAACCAAGAAACATACTTGATGTTGGATGCGGTATTGGTGGCAGCACCAGGTACCTAGCAAGCAAATATGGTTCTCAATGTAAAGGCATCACCCTTAGCCCTTTTGAGGCTGAAAGAGCTCGTGTTCTAACTGCTGCCCAAGGATTAGAAAGCCAGGTCTGTATTGAAAGATTTGCAAGAAGTTATCAATTGTTAAATCACCCTTTATGCAAGTGCACAATGAGTAAAAATTTTCATTCTTCCATTTCTTAA
>XM_018222954.1 Mollisia scopiformis ARM repeat-containing protein (LY89DRAFT_786121), mRNA 
CTCTAAACTGCGACCAAGGAGCCCACGAACGCGAAATAAGGCGCCAGGACTGCTTGGTCATGACAATATTCTCGATTCTACAATATGACTGAGGTGGAGGTCAACGGGATAGCGGCGGGCGTGGTGGACCTAGATCTCAAAACATCACTCTCTTCTTCATCAACTTCAAGGCGGATCAATACCCTCGCAATCTTGCAGGAGAGGCTCTCAAAGAATGAAATCAGCCCGAAATTATTCCCCCCTCTTCTACAGCTGTTATTTGACACGCATGCATACTATCGCGACCGCCCCTCTCGTCGAGCTGTTGAGCAATGTCTAAGACTTGCTTTTCGCTCAGGCTGTGCTCCTCCAGCATTAGCGGGCTTCATCAAGAATCTAGAGGCCGAGTCTTTGAAGCTAGGGATCGCCCCCAGCAATGCTTTTGTTCTGGTAGAATGGTGTAGCATGCTTCTGCAGGTGCTGACTGGAACCGACTACTGGGATATCTGGGGCTTCCAAGTTCTCGAGAGCCATGCTCGATTGCTGGAATTGTGTGTTGGAGAGTCTCCGCGGGACAACATTAGACAAACCGCACTGCGCGTCACATGGCGAGGACTCCGGGAGGCATTCTCTATACCCGAGAAGAGGCAAAATGTGATGAAAGGAGCTATCCAGAAACTTGCGTCAAAAGGTGCTCAGTCATCTGCGAAGAATGCTATCATGCTTGGAGCTATCGCTGGAACATGTGCGAGGAATTTCCAGAAAGAGTCCACGAAATCGTCAGAGATGAAAGAATGTCTCACGAACAAGAAATCCGAATACTACGCATTCTACATTCGAGAAATCATTGGTTCGCGGACTCTTGTACCAAGCCACATATCGAATGCTTTACATGACTTCTTTGCTTCGTTCGCAACAAAGGAGGACATAGAGAGGGAGATTGTTCCTGCTCTGGAAAAAGCTCTGCTTCGTGCACCGGAGATAGTGCTCAATGATCTCGTTACGCCACTGTTTCGTTCCCTTCCTGATACGATAGATCTTACAAGTATTCTTAAGAACAACCTTCTCAAACCTCTGCTTTCCAATATCAAGTCAAGCAATGCTACTATTCGCTTAGGAGCGCTTTCGGCACTTCGTGCTGCGGCTCCCAAGTGTCACGAGGTGAATGTTATTGCTGAGGTTGCAGAAGAGATTGTTACCCCTCTCAAAGCTGGAAAATTGCCTTCCGCTGATCAGAGAGCTAACCATGCCGAGATGCTTGCTCTACTCCCTGTCACAGAGACAACAGCTACCAAGATTGGTTCAGCTATTACCGCCGTTGTCGGCAAAGAAGCAAACGAGGCAGCGCTTACATCGGAGACATCAGCCCTCCTGCATTATGTAAGTTGGGCAATACAGCATGGAATGGATCTGGATAAGCAAATGACAGATGCTTTCACCAAAGGGATCTCGGATAAAAAGGTACCTTTCAAGAGTCTTTGGACCGGACGACTGGGTGAACTGTTCTGGGCCACGGATGATCATGAGATTTTGCGAGGCAAATTAGCTAAACTCGCTGAATGCACAATCTCACCTCTTATGGATATCTGGCAGGAAGTCACGGCGAACCCTTTGGCTGCAGCACAGTCTGGTCTCGTCGCCAGCGCTTTTGTGCTTACTGCTATTGCCTTTACGAAGCTACCACATGTTTCGAATAGCAAGGTTGATACGGCTCTGAAGAAAGCTCAGATAGGAAGACAAGCCTTGGTTATGGAGCCAAAACCTTCCTTCCTGTTGAACCCACGCATTTATGGGAAGCTTACAAGTGAGGAGGATTTCATCTGGCTTCTTCGAGCTCTTGCATCCACTGCACAAGATGTCGTTACGTCTGATACAGTTTCACCTAGCTCTATTGCCTGGTCTCAAGCCGTAATATTCTGCATATGCTCTTCAACCGTCAAGCCGAGTGTTAGAAAGAATGCTTCCGAAACCTTGACTAAGCTCTACCTCAATTATCCTTTAGCAATTGTCAAAGTTATCGTGTCGGGACTTTGGAGGTGGCGAGACTCCATCGAATCAGGCGACAAGGATAGTGCTGCTGTGTTGTCTAAAACAGAGAACAGCAATATTCACCATGTTATTCGAGCCATCTGTCTATCCCCAGCAGAAGTCACTCAGCTTGGTGGTCAAGTCGAAATGTCTGTCCGGATGGAGCAGATGATTTTACTGTTGGTTCTATCTCGACAGGAATTGTTACCGCGAGTGAGCTGGATCCAGCTGTGTCTCAAAGTTGAGGTAGATCCTGGCAACCTTGCCAGGAAATCTGGAGATGCTCTGGTTCAGCAGATACTTGATTGCACTAGATTTGACGAAAAAGCGACCTTCCAAAGATCCGACAATGTCAAGATCGCTGCTTTCCAAGCAGCAGCAGAACTTGCCTTTGTGGCCCCCGATGCAATGACCCCTAGAATTGTAGAGCTTCTTGAAAATGATCTGGACTCAACTCAATTGACTAACATCGGCCCAACAGAGGCGGCTATCTTCAGAACAGAAGAAGGCACGGCTTTTGTCGATGTGCTCGCGTCCAAGTCCCAAAGCTATGTTCCCAACAAAAATACAAAAGATTACGACACTTTGAAGTGGGAAGAAGAGTTACGAGCTCAGCTCGCACAGAAGAAAGGACAACAGAAGAAACTCACTTCCGAAGAAACTGCCAAGGTTAATGCTCAGTTGAAAAAGGAGTCTGCTATTCGTCTGCAGATTCGCCACCTTCAAGCAAAGCTCCTCCGTGGGTTTGGTATCATCAACAGCCTAGCCACAGGACCGCCTACTGAAGCAGGTCTTTGGATGGGGCCGGCTGTCAAGGCATTAGTGGAGGTAATTAAGGCTGGTGCTGGGCTCATCACAGGCAATGCAGCTCCCGATGCGTACATTGCCTGCGCAGAACGACTTCCGAGCCGCGTTGGTGCTCTGAGGCCATTCATAGGTATCGCGACATTGAGAGCTTTAAATGTACCACACCTTCCAGAGCATCTAGAGGAAGAGCCTCTAGGTGCGTTGATTACCAGAGTCCTTTATCGACTTCGCTTCTCTGGAGAACAACGACCTTTCGATACAGTCTCCTTGATCTACATTCTCCCTCTTGTCTTTCTCGTCCTGCGCGAGAAAGGCTTTGGAGAGTCTGATGACGCTGAAGCTCAGATTGTCTTAGCTTTAGAATTCTTATCTTACCATACAGATGCCTGCTCTGACGAGCTGGTACCACGCGAGGAGATCTTGTCTGTGCTAATATCATCGATGCAAAACTATAATCAGCATTACAAGATGATCAAAGATTGTCTGGCAGATCTTTGCCGTTGTATTGCGCCGAACATAACTGAGATCGAGCTGTCAATCCTTGCCCGCGGAGCAATTGTCCCGCAAGTTTCGGTTCGTTCCTCAGTCCTACAATCAATTAGTGCTGAGATCGATATGAGTGATGTAGACTTCTCTGACGAGATATGGCTCGCTTGTCATGACGACGTGGAAGAGAATGTCGAGCTTGGAAAAGAAATTTGGGAAGAGAGCGAATTTACAGTCTCCGAAGATGCTCCCTTCAGGATGCTGCCTTATCTCGAGATTGTGGACAAGCAATTGAGACGAGCGGCGGCAAGATCGTTAGCGGCAGCTGTGAAATTACGGCCATCAACATTTCAAGATGTGTTAGAACGCTTGAAGTCGACATATCAAGAGCTTGCAAAGCCCCGTGTGCCCCAGCTCGACGAATACGGCATGCCCAAAAAGATGGATCTGTCGGATCCCTGGGAGGCTAGAAACGGTATAGCTCTTGCGTTCAAAGAGCTAGCTCCCATTTTCGAGATTAGCCTACTTATTGCATTCTTGCAATTTCTGATTGAAGCTGGTCCTCTTGGCGACAGAAACCCAAATGTGAGAGAAGAAATGGTAGAAGCAGCTACCAGTATTATCGCACTTCACGGCAAAGACAAGGTGGAGGAACTAATGAAAACCTTCGAACAAACTCTTGAAGCTCCAGACAAAGGCTCCGAATTCGCGGATCGAGTCAATGAAGCTGTCATCATCATGTACGGAGCTCTCGCTCGACATTTGAAGGCGGGAGATCCACGAGTTCCTAAGGTAGTGGAGAGGCTGCTAGAGACTCTGAGTACACCTTCTGAAGCAGTGCAATACGCTGTTGCTGAATGCTTGCCGCCACTGGTACGTGCGTCGAAAGAGCAGAATCCAGAGTACATCAGGCATGTTCTCGATCGCTTGTTCAATTCCAAGAAATACGCTGCTCGTCGCGGTGCCGCCTATGGACTTGCAGGTATTGTTCATGGCATTGGTATACTAGCTCTGAGAGAATATCGTATCATGTCAACGTTGAAAGGTGGGATTGAGAACAAGAAGGATGTCAATCATCGTGAGGGTGCATTGTTGGCATATGAATTATTCTCAACGATTCTAGGGCGAAACTTTGAGCCTTACGTTATTTTAATCGTACCCCAGCTCCTTTCCAGCTTTGGAGACGCCAGTGCGGATGTACGTGAGGGTTGCTTAGCAGCCGCAAAGGCCTGTTTTGCAAGTTTGAGCTCATACGGTGTCAAGCGAATATTGCCTACGCTCTTGGAGGGCCTTGATGACCAACAATGGAGAAGTAAGAAGGGAGCATGCGACCTTCTGGGTGCTATGGCCTACCTTGATCCTCAACAATTAGCCCAGAGCTTACCTGAGATCATTCCACCATTGACTGGGGTACTCAACGACAGTCACAAAGAAGTTCGACTTGGCGCAAATCGAAGTCTGAAACGCTTTGGTGAAGTCATCAGCAATCCCGAGATCAAAGGCCTTGTGGACGTACTGCTTAAGGCTCTTAGCGATCCTACAAAGTACACAGACGATGCTTTGGACTCTCTCATAAAGGTACAATTCGTTCACTACCTGGATGCACCATCACTTGCACTTGTAGTTCGCATTCTAGAACGTGGACTAGGGGATCGCTCGGCGACCAAGAGGAAATCATCTCAGGTCATTGGCAGTCTGGCCCATTTGACGGAGCGAAAGGATTTGATCTCGCATCTGCCAATTTTGGTCGCTGGTCTCAAAGTTGCTGTGGTTGATCCTGTGCCCACCACACGTGCAACTGCCTCGAAAGCCCTTGGCTCACTGATCGAGAAGCTTGGCGAAGATGCTCTACCTGATCTTATCCCAGGATTGATGCAAACACTGAAATCAGATACTGGTGCTGGTGACCGACTCGGATCTGCTCAAGCTCTGAGCGAGGTCCTTGCTGGTCTCGGTACCAGTCGCTTGGAAGAAACACTGCCCACAATCTTGCAAAATGTTGCTTCCTCAAAGCCTTCTGTCCGAGAAGGTTTCATGTCACTCTTCATCTTCTTGCCTGTTTGCTTCGGCAACAGCTTCGCAAACTATCTCAGCAAAATCATTCCACCAATTCTAAGTGGTCTGGCTGATGAGATCGAGTCCATTCGTGACACCTCCCTCCGAGCTGGACGTCTTCTTGTCAAGAACTTCGCAACTAGAGCTATCGATCTCTTGTTACCCGAGCTGGAACGAGGTCTTGCTGATGACAGCTACAGAATTCGTCTTAGCTCTGTGGAATTGGTGGGCGATTTGTTGTTCAACCTCACAGGCATCAACGCCGGTACCGAGCAAGATGAGGTAGAAGAAGGTGCCCAGGAAGCAGGAGCCTCGTTACTGGAAGTCCTTGGAGAAGAGAAGAGAAACAAGGTCCTCTCGTCTCTTTACATTTGTCGTTGCGATACGTCTGGCTTGGTTCGTACCGCCGCAGTCAATGTTTGGAAGGCTCTTGTGGCCAGCCCAAGAACTCTTAAGGAGCTTATCCCAACATTGACCCAACTTATCATTCGCAGACTAGGAAGTTCCAATATGGAGCAGAAAGTTATTGCGGGCAACGCACTCGGCGAGTTGATTCGAAAAGCTGGCGACGGAGTCCTATCCAGCTTGCTTCCTACACTAGAGGAAGGTCTGCAAACATCGACAGATACCGATGCCAAGCAAGGTATCTGCATTGCTCTTCGAGAACTAATCTCATCTGCTTCTCCTGAAGCTCTGGAGGATCACGAGAAGACTTTGATATCAGTAGTCCGAACCGCTCTTATCGATTCCGACGAGGAAGTCCGAGAAGCTGCCGCAGAAGCTTTTGACTCTTTGCAGCAGATTCTTGGCAAGAGAGCTGTCGATCAAGTGCTACCCTATCTTCTTAACCTGTTACGCACAGATGAAGACGCAGACAACGCTCTATCTGCCCTCTTAACGCTACTTACCGAGACAACAAGATCAAACATCATCTTGCCTAACTTGATCCCAACCCTCACGACCTCTCCAATTTCGTCTTTCAACGCCAAAGCTTTAGCATCCCTATCCACTGTCGCTGGCTCTGCCATGACCCGAAGATTGCCTACGATATTGAATGCGTTAATGTCCAACATCATCTCCTGCAATGACGAGGGCTTACTCGAAGATCTCAACACATCATTCGACACCGTGATCCTTTCGATTGATGAATTTGATGGTCTGAACACGGCTATGAGTGTATTGCTTGGGCTCTCGAAGCACGATGACCACCGCATAAGAGCAGCTACTGATCATCATCTCGCAAAGTTCTTCGCTGCGGCCACTGTGGACTACTCTCGCTATAACCAAGATATCGTAAGAGCTTTACTTATATCTTTCGATGACCGGGATCCGGACGTAGTTCTAGCCGCCTGGACCGCGTTGAGCGAATTCACTAAACACATAAAGAAAGAAGAGATGGAAGCTCTTGTGTACTCCACACGACAAATCTTACAACATGTTGGAGTTGCTGGATCAAATCTGCCAGGCTTCAATTTGCCTAAGGGCATCAATGCCATCCTACCTATATTTTTACAAGGTCTCATGAATGGCACCGCAGAGCAGAGAACACAAAGTGCTCTTGCCATCTCGGACATTGTAGATCGTACAAGTGGGGATGCTTTGAAGCCATTTGTCACTCAGATAACTGGACCGTTGATCAGAGTGGTATCCGAACGCTCAGTCGACGTAAAAGCAGCGATTCTGTTGACTTTGAACAATCTCCTCGAGAAGATTCCTACATTCTTGAAACCCTTCTTACCTCAACTTCAGAGGACTTTCGCCAAATCCCTGGCAGATACATCAAGTGAAGTTTTGAGAACTCGAGCAGCCAAGGCACTAGGCACGTTGATCACACTCACTCCTCGAATAGATCCACTCATTGCTGAGTTGGTCACTGGATCAAGGACTTCTGATTCAGGTGTTCGTAACGCCATGCTGAAGGCCCTCTACGAAGTCATCAGTAAGGCAGGAGCGAACATGAGTGAGGCATCTCGAAGCGCTGTTCTTACTCTTATCGACACTGACCCAGAGGATAATGATGTTTCTATGGCAATCACAAATGCTAAGTTACTTGGAGCTCTGATTAAGGTTGTCCCCTCGGAGAGTGCTGTTGCCCTCATCAAGAACAGAGTCTTACCAAGTCACTTCACTCAGTCCTCTGTACTGGCTCTGAACGCTGTGCTGCTAGAATCCCCAGCGACTTTAACGGAGACTGCCTTCGCCGATAGCTTACCACAAAGCATCTGTGAAGGCATGCAAAACAAGAACAACTTCATTTCTGACAACTGCGTCCTCGCGGCCGGAAAATACCTTCTATCCGACTCACGCAGCAGTGACTATGAGACGATCAAGCCAATATTCGAGACACTTGCCACATTGATAGGACCTGGACAGTCGGCTGACACTCGACGTCTAGCTTTGGTGGTGGTGCGAACTGTGTGCAGACATCACATGGAGCTCGCTCGTCCTCATCTTCCACTACTCGCACTTCCCGTCTTTGCTAGTGTTCGAGATACCATCATTCCTATCAAGCTGGCGGCAGAAGCAGCATTTATGGCGCTATTCAATGTCGTAGATGAGGAGAGCAAAGTATTCGACAAGTATCTTGCATCTCAAGATCTAGCTGCCAACCAAAAGCGGAGCATGCAGGATTACTTTAAGCGTGTTGCATTGAGGCTGGGAAATACTGCACGAGAGAGGAAAGAGGCAGAAGGTGGACAGGGCGGCTTGGGACTCTCTCAAGATGAAGTTGATGATGAAAAGGAGATAGCTTCGGTAGGAAGAGTCGACCTTGGAGAGGGAGCTTTTGATGAGTGATGAGTTACGAAAAGGCATGGGAGGTGGTCAAAAAGCGTGCATTGTATTTGGAGGGATCGTTTTTAGACGAATGAATTCTTGCG
>XM_047966548.1 Annulohypoxylon maeteangense uncharacterized protein (GGS22DRAFT_23129), mRNA 
CCTGAATCACGGTCATTTTACATCATCTACATAGTCTACAAATCGTAACCATATTCCGCAGACTCAGTCAATTGTTTTCTTAACGAAATAAATATGGCCGATCAACCTCGTCGGCGTCGGAACCGCCCCGATAGCAAACAGATGTGGGATGAATCCGACCGTCGCAACCGCAACGAGCCCAACGCGCGCGACAAACGAGACGACCGCGGCCGGGATCGAGACGAACCACCCCGCGAACGAGAACGAGACCGCCGCTATAGATCCAGATCCCGATCTCCTCGACGAGACCGACGGGACAAGAACCGCGACCGTCGAGACAGGGACCGCAACCTTGATAGGGGTAGACCACGTGAGAACGACGAAGCGCGGCCTAGAGCAGACGAGCGTCGCGAGAAGAATAAGAATAAAGGAGATCGTCATCGCGATAGAGATGAGCCTGCTCCAAAGGGTCCGGCTCGAGATCGAAGTCCCCGACGCTCTGCATCGCCAGCTCGAAGCCCGGCTGGGAAGGTAGATCGCAACACGCACAACAACTCACCACTCCCAACGCGACCAAGACCCGGCGGAAAAGCTGAATCAGGGTTGGGATCCTCGCTTCAGTTTAAGGTTGGAGGAAAACATGACGACGATGCGAACCGTGGAGGGAAGAGTGCGGCGGGAGGCAAATTCTACGATGCCAGAGGTTCTACTGATGAGGCTGAGGACCGAAGACGACGAACCGAGACGCCAAATTCCGACCGCGGGGATGCCATGGACGAGGATGTCGACGAAGAGGATGTTGTTGTCGAGGATGACGGACTAAGTGCCATGCAAGCAATGATGGGATTCGGCGGTTTCGGTACCACAAAGGGAGCCCATATACCAGGCAATAATGCCGGCGCAGTGAGGAAGGAGAAGAAGACCGAGTACCGACAGTACATGAACCGTATCGGTGGTTTTAATCGCCCGCTGAGTCCATCGCGGTAATCGTAATACCTACCTACTGTTTTTTTATTGCTTTTTTTGATACACTACGAATCAGACTATGGAGAAGATGAGTTTCCTTGAAAGGGGCGTAGGGAATACACGGACCAGAGGTTAGGTGCTCTTAATTTGATGATCATTATAATCCTTGTTG
>KF726604.1 Pseudopachylus alticola voucher MZUSP:59952 16S ribosomal RNA gene, partial sequence; mitochondrial 
GCATAATCATTAGTTTTTTAATTGGGAGCTGGAATGAAAGATAGAGACTGAAAAGATAGTTTTTTTTAATTAGTTTGAATTTAAATTTAAAGTAAAAATGCTTTATTTATTTCTTGGGACGAGAAGACCCTAGAAGCTATAAATTATAAAATAATTTTTTATTGGGGCAATAGTTAAAGAAATTAATTTTTAATTTTGGTTTATGGAAAAAAAAAGTTACTCTAGGGATAACAGCGTTATATAATTAGTGAGTTCTTATTGAGAATTATGGTTGCGACC
>XM_033398930.1 PREDICTED: Drosophila miranda uncharacterized LOC117194359 (LOC117194359), transcript variant X1, mRNA 
CCAACGCATGAGCAACATCTCGCTGTCCTCCGGCACGGACTCCGTGGGCCACATGGATCGCGGCAGCAGCTCCAGTCTCGCTAGCAGCGCCACCGTAGGCACCAACACCATCACCAGCGGCATTTCCAAGGAGTGCGCCAATTACCCCGTCGGCAGTCAGTCGGCCCGTCCATACGTCCAACTGCCGGGCATACACATTTCCAACCCTCCCCAGTACGGGCCAGGGAATATGCAGGAAATAGACGCTGGCAAAATGGCGCACAACGGCAAGGCACTCACAGGGCGCTACAATGCCACGCCCACCTATGGCTTCGACAACGAGCAGAACTACTGCCTGAATTCCCAACAGTTGCACAACTTCGAGCTCGAGAACCACACACCGCCGGCATGTCCCGGCTCTGGACCCATTGCCATGACGAACGGCACCATCCAGTTGCGCCTCCGCGATGGCGTGCGCATTGACATGACTCTGGACAAGGCGGTGCGCGTGCTCAATCAGCGCAGCATGGTGGCAAATGCTCTATCACGCAACTGCAGCAACTCGGCTTTGATCCACCCCAATGGACGCATCTTGCAGAGCGGCGCTAAAGTCGAAATAGTCACCTACGACGGCATGAAGGGCAATAACTTTGTTCGCTATGCCAAGATGTGGTACAAGGTGTGAGCAGTGTTCTATGA
>JF368683.1 Uncultured soil bacterium clone GO0VNXF07IAPWG 16S ribosomal RNA gene, partial sequence 
AGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCAGCACGGGTACTTGTACCTGGTGGCGAGCGGCGGACGGGTGAGTAATGCCTAGGAATCTGCCTGGTAGTGGGGGATAACGCTCGGAAACGGACGCTAATACCGCATACGTCCTACGGGAGAAAGCAGGGGACCTTCGGGCCTTGCGCGTATCGAGATGAGTCCTAGGTCGGATTAGCTTAGGTTGGTGAGGTAATGGCTCGACCGAAGGCGACGATCCGTAA
>XM_052578998.1 PREDICTED: Carassius gibelio triosephosphate isomerase 1b (LOC127975165), transcript variant X1, mRNA 
CCTCGCTGTCTCTTCAACCGGGGGCTGTCTGTCATTTCTACTGTTTTTTTTTTCTCTGTATTTTCTGGTGAACGCAACACGTTTCAGTCATGACTGGCAGGAAATTTTTCGTCGGAGGCAACTGGAAAATGAACGGAGACAAAAAGAGCATAGAAGAGCTCGCCAATACACTGAATAACGCCAAACTCAACGCAGACACCGATGTTGTGTGTGGTGCTCCATCCATCTATCTGGACTACGCCAGGTCCAAGCTGAATCCTAACATTGATGTGGCTGCACAGAACTGCTACAAGGTTGCAAAGGGAGCGTTTACTGGAGAGATCAGCCCTGCGATGATTAAGGACTGTGGAGTTAAATGGGTTATTCTGGGACACTCTGAGAGACGCCATGTTTTTGGAGAGAGTGATGAGTTGATTGGGCAGAAGGTCGCTCATGCTCTTGAGAACGGTTTGGGTGTGATCGCCTGCATCGGTGAGAAGCTGGATGAGAGGGAGGCCGGAATCACAGAGAAAGTTGTTTTTGGCCAGACAAAGTTCATCGCAGATAACGTGAAGGACTGGAGCAAAGTGGTCCTTGCTTATGAGCCTGTGTGGGCCATTGGCACTGGTAAAACCGCATCACCCCAGCAGGCTCAGGAGGTGCATGACAAGCTCAGGCAGTGGATGAAGGCCAATGTCTCAGAAGCTGTTGCCAACTCGGTCAGGATCATTTATGGAGGATCCGTCACTGGAGGGACCTGCAAGGAGCTTGCTTCTCAGAAAGATGTGGATGGCTTCCTGGTCGGTGGCGCTTCCTTGAAAGCAGAGTTTATTGACATTATTAATGCAAAAGCATAAGGAGATAAAGCCACCATCTACCTAAAGCCTAAGGCTTAGGTCTGTTCCCAAACACTGCTCTTCTTTAGAAAGTGTTGTTGTGGTTTTGTTGCTGTCGCTTCATTTTTTTTTATATTACAAAGGGACAGATTGCCACACACTGAACACTCAGCTGAGTGTGTTATTGGCCCTCCAACTAGTTTAGTGAACTACATGACTGTAATGAGAACCATCACGGGGCTTAGAGCCCACACCTTTACTTGAATAATATTAACCAACATTCTCATGTATACAGTGTCAAAAATCTAGGATTAAGTCAATCAACCTCAGTGTCGTTTTAATTCAAGCGAAAGTACTTTCCATGAATGTGGTTGTCCTGATGTTTTCCTGTCCCTCAAAGAGTGTTTCTCTGAGTGACCTATCCTGAAGGTGCTCACATGAAACCAATATGTTTTGGTATAAAGGATAAGACAAAAAATATTCTAATAAATGTTTCAGAATCATAGACTTAA
>XM_007110546.3 PREDICTED: Physeter catodon golgi transport 1A (GOLT1A), transcript variant X1, mRNA 
TGTGAGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGAGCGTGTGTGTGTCTGTCTAGGGGGAGTTAATGATTTACCAGAGGCTCATTTCACAGCTTACCAAGGGTCAGCTTCCCTTGGGCATGTACAAGTTCGACCTTCTGGGCTCCTCACCCCTTGCCAGCTTCCACCTGGAAGGTCCCCCAGGCAGCCCGCAGCATGATCTCCATCACCGAATGGCAGAAGATTGGTGTGGGCACCACCGGCTTCGGCATCTTCTTTATCCTCTTTGGAATGCTCCTGTACTTTGATTCGGTGCTCCTGGCCTTCGGAAACCTGCTGTTCCTCACCGGCCTCTCCCTCATCATCGGCCTGAGGAAGACGTTGTCCTTCTTCTTCCAGAGGCACAAGCTCAAGGGGACCAGCTTCTTCCTGGGGGGCGTGGTCATTGTGCTCCTGCGCTGGCCCCTCCTGGGCATGTTCCTGGAAACCTATGGCTTCTTTAACCTCTTCAAGGACTTTTTCTCTGTCGCCTTTGGCTTCTTGGGCAATACCTCCAACATCCCCTTCCTGAGCATGCTGTTCCGGAGGCTTCAAGGCACCAGCTCAATGGTCTGAACAGCAGAGATAAGCTGCTTGAACTTGGATCATTGGTTGAAGGGGCTGGAAAGGAAATGGGGGCCACCCCCTTAGGCCCCCACCCCACACTGACTCATCTCCCCATCATACCCGGACCTCTCCAAGTCCAGAAGGAAGGATGGAGCCGAGTGACTGACCTCAAATCCCCAAGTCAACGCAAGAAGCTATCAGGACAGTTGGGAGCAGAGATCCAGGTCCCACGGATATTGAACGGGGATCACACCCCACCCTGTATTTATCAGAGGAAAAGCAAAGATTAAATCCCCAAGCTGGGGCTTCCCTGGTGGCGCAGTGGTTGAGAATCCACCTGCCAATGCGGGGGACATGGGTTCGAGCCC
>XM_009871050.1 PREDICTED: Apaloderma vittatum myosin VC (MYO5C), partial mRNA 
TACAATAGGGTTTGGATCCCTGATAATGATGAAGTTTGGCAGTCTGCGGAAATCACGAAAAACTACAAGGCTGGAGACCGTTTTCTCCATGTGCAATTAGAAGATGGAACTGAACTGAATTACCCTGTTGATCCAGCTGCCTTGCCACCCCTACGAAATCCTGACATACTCGTTGGCGAAAATGATCTCACCGCGCTTAGTTATCTCCATGAACCAGCTGTTCTACACAATCTTAAAGTTCGTTTTATGGAATCTAAGCTTATCTACACCTATAGTGGAATAATTTTGGTTGCAATAAACCCCTATAAACAGTTGCCGATATATGGAGATGCTATTATCCATGCATATAGTGGGCAAAACATGGGGGACATGGATCCACATATATTTGCTGTGGCGGAAGAAGCATACAAGCAAATGGCAAGAAATAACAAAAATCAGTCTATTATAGTCAGTGGAGAATCAGGAGCTGGAAAGACTGTGTCTGCAAGATACACTATGAGGTACTTTGCCACTGTGAGTAAGTCAAGCAGCAATGCACATGTGGAGGATAAAGTGTTGGCATCCAATCCAATAACTGAGGCTGTCGGCAACGCAAAAACCACACGGAATGATAATAGCAGTCGATTTGGAAAATACACTGAGATCAGTTTTGATCGGAGTTACCAAATCATTGGAGCTAATATGAGAACATACCTGCTTGAAAAATCCAGAGTTGTCTTTCAGTCAGAGAATGAGAGAAACTATCATATATTTTATCAGTTGTGTGCATCTGCTATGCAACCTGAATTTAAGCATCTTAAATTAGGAAGTGCAGAAGAATTTAACTACACAAGAATGGGTGGCAGCCCAGTAATAGAAGGAGTTGATGACAGAGCAAATATGGTGGAGACTCAGAAGACATTTGCCTTGCTGGGTCTGAAGGGGGATTTTCAGATGGATGTTTTCAAAATGCTGGCAGCAATCTTACACTTGGGCAATGTGGAAATAACAGCTGTTGGAGATGAAAGATCATCCATCAGTCTGGAAGATAAACATCTCAATATATTCTGTGAACTCCTGGATTTAAAACGTGACAAAATGGCACAGTGGTTGTGCCACCGAAAGATTGTCACTACCTCCGAGACTGTAATAAAGCCAATGACAAGAGCTCAGGCTGTTAATGCAAGGGATGCCCTGGCGAAGAAGATCTATTCACATTTATTTGACTTCATTGTGGAAAGAATTAACCAAGCTTTGCAGTTCCCTGGCAAACAACATACTTTCATTGGTGTTTTGGACATTTATGGCTTTGAAACATTTGATGTGAACAGTTTTGAACAGTTTTGCATCAATTATGCCAATGAAAAGCTGCAGCAGCAGTTCAACCTGCATGTCTTTAAACTTGAACAAGAGGAATACATGAAGGAAGATATCCCATGGACTTTAATAGACTTTTATGACAACCAGCCTGTCATTGACCTTATTGAAGCTAAAATGGGAATTTTAGAACTTCTGGATGAAGAGTGCTTGTTACCTCATGGAACAGATGAAAACTGGCTTCAGAAGCTCTATAATAATTTTGTGAATAAAAACACACTCTTTGAAAAGCCGAGGATGTCGAACATGTCTTTCATCATTCAACACTTTGCTGATAAGGTGGAATATAAAAGTGAAGGATTTCTGGAAAAAAACAGAGATACAGTACATGAAGTATTGATTGAAATCTTGAAGGAGAGCAAGTTTCATCTGTGTGCAAATTTTTTTCAAGACAATCCAGTGTCCGTTTCACCTTTCAGTTCAACTATAAACATCAAATCTGCAAGACCTGTTCTCAAGCCACCCAACAAACACCTCCGGATGACAGTTGGCAGTAAGTTCCGGAGCTCTTTGTCTTTGCTTATGGTGACTCTTAATGCAACAACCCCTCACTACGTACGATGCATAAAGCCGAATGATGAGAAGTTGCCTTTTGAGTTTGATTCGAGAAGAGTTGTTCAGCAACTGCGAGCGTGTGGTGTTCTGGAAACTATTCGAATTAGTGCACAGAGCTACCCATCCAGGTGGACTTACATTGAGTTTTTCAGCCGTTACAGCATTCTTATGACACAGCAGGAGCTCTCCATAAATGATAAGAAGCAGATTTGCAAGACTGTTTTGCAGCGGCTAATCCAGGATCATAACCAGTATCAGTTTGGGAGAACAAAAATTTTCTTCCGAGCAGGGCAGGTTGCTTACTTAGAAAAACTGCGATCAGACAAACTGAGATACGCATGCATCACGATCCAAAAGAGCATTCGAGGCTGGCTGCAGCGGAAGAAATTTCTTCGCATAAAACAAGCAGCTGTTATAATCCAGCAGTATTTCCGAGGGCAGCGGACTGTGCGGCAAGCTATAACTGCAAGAACTCTGAAGCAAACGTGGGCAGCTATAATTATTCAGAAATACTGTCGAGGTTACTTGGTCCGTAGACTTTGCCAGCTCATCCATGTGGCTGCTGTAACAATTCAAGCTTATACAAGAGGATTTCTAGCAAGAAAAAAATACCGGAAGATGCTTGAAGAACACAAGGCTGTGATCCTCCAGAAATACGCCCGTGCATGGCTTGCCAGGCGCAGATTTCAGAATATTCGTCGGTTTGTATTGAATATCCAGCTTTCATACAGAGTTCAGCAGCTGCAGAAGAAGATAGAAGAGCAGAGTAGAGAAAATCATGGTTTGCTGGAACGATTGACCAGCCTGGCTTCGACTCACGTGAATGACATGGAAATAATACAGAAACTCGAATTAGATCTTGAAAAGGCAACTGCTCAAAAGAGAACGTATGAAGAGAAAGGGAAAAAATATAAAGAGGACAGTGAACAGAAAATCCTAAAACTCGAGAATGAGAATAAAGAATTACAACAACAGAAAGAGACCTTGGAAATAAAGCTCCAAGAGAAAACTGAGGAAATGAAAGAGAAAATGGATGATCTCACAAGGCAACTGTTCAGTGATGTACAAAAAGAAGAAAACCAGAGAATGATACTTGAGAAAAATTTCCAAAATCAGAAGCAGGACTATGAAAAGGAAATCGAAATGCTCAAGGGAGAAATTAAAATTCTGAAAGAAGAAAAAACTCGGCTACAACATCAAATTCAGCAAGAAATTGTCATTCAGGACAGCTTGAAAATGGAAGTAGGACAACTTACAAAACAAGCACAGAAAATACCTGAGTTGCAAAAGGAAATTGAACTGCTGCAGACACAAAAATTGGATATTGAAAAGCAGGCCCAGTCACAGAAGCGAGAACTGAGGGAAAAGATGTCAGAAGTTACAAAACAGCTTCTTGAAAGTTATGATTTTGAAGATGTAAGAAGCAGACTCTCCACAGAGGATTTGGAACACTTAAATGAGGATGGGGAACTGTGGTTTGCTTATGAGGGCTTGAAAAAAGCTACAAGAGTATTGGAAAGTCATTTTCAGTCTCAGAAAGAAATATATGAAAATGAGATCGAAGGCTTGAACTTAAAAGTTGAACATCTTAGCCAAGAAATTAATCATCTACAGAAGTTATTTCGAGAGGAAAATGACATAAAGGATGGCATTCGATTGGAAGTTAGCAGGCTAACTTCAGAAAACCTGGTGATCCCAGATCTTAAGCAGCAAGTTTCTGAACTTGAAAATCAAAAATTAGATCTTGAAAACCGTCTTCAAGAGCAAACTGTAAAGTTGAAAGGTAAAGTAACAAATGATGTAGATATAAAAGAAAAAGAGAGACTGAAAGTCACAACCCAAGAAATTAAGGGGCTGAGCAATGGTCTAATGCAAGATGAAACCCAGGATGAAGTACAAAGCAAGATGAAGCAAGAGACAACTCGACTTACTGTGGAAAACATGGATCTTGAAGAAAAACTAGACATGAAAGACAGAATAATAAAAAAATTGGAGGATCAAATCAAAACTCTTACCAAGACTATTGAAAAAGGAAATGAAGCTCATATGCCACCTTTGTCCAGAGAGTACATTGGAATGATGGAGTACAAAAAAGAGGATGAAGAAAGGATCATCCAAAATCTGATCCTCGATTTAAAGCCACGTGGAGTTGTAGTTAATATGATACCTGGCCTTCCAGCTCACATCCTCTTCATGTGTGTGAGGTATGCAGATTATCTGAACGATGCTGACATGCTGAAATCTTTCATGAATGTAACCATTGATGGTATCAAACAAGTTGTTAAGGAACATTCAGAAGACTTTGAGATGTTGTCCTTTTGGCTTTCCAATACATTTTATTTTCTTAACTGTTTGAAGCAGTACAGTGGGGAAGAGGAATTTATGAAGTGTAACACGCCACGTCAGAATAAGAACTGTTTGAAGCATTTTGATCTCTCAGAATACAGACAAATTCTTAGTGATTTGGCCATTCATATCTATCACCAGTTCATTACTGTAATGGAGAACAACATTCAGCCCATGATCGTACCAGGCATGCTGGAATATGAAAGTCTTCAGGGAATTTCTGGCTTGAAACCTACAGGGTTCCGTAAACGGTCTTCTAGCATAGATGACACGGACACCTATACAATGACCTCTATCCTGCAACAGCTCAGCTATTTTTATAGCACCATGTGCCAGAATGGCTTGGACTCTGAGCTGCTGAAGCAGACAGTGAAGCAGCTTTTCTTTCTGATTGGAGCTGTCACCCTCAATAGCCTCTTCCTCCGCAAGGACATGTGCTCATGTAGAAAAGGAATGCAGATAAGATGTAATATCAGCTACTTGGAGGAATGGCTTAAGGACAAGAATCTTCAAAGTAGTAATGCCAAAGAAACTTTGGAGCCGCTATCTCAAGCAGCCTGGCTTCTGCAGGTCAAAAAGATCACAGATGAGGATGCCAAGGAAATATGTGAACACTGCACGTCTCTTTCTGCTGTGCAGATAGTTAAGATCCTCAACTCGTACACTCCAATAGACGATTTTGAGAAAAGAGTGACTCCATCGTTTGTTCGTAAAGTCCAGGCTATGCTAAACAATCGTGAGGATGTTCCACAGCTGATGCTTGATACCAAATATGTCTTTCAAGTGACGTTTCCTTTCACCCCCTCTCCACATGCCTTGGAAATGATACAAGTCCCCAGCAGCTTCAAACTTGGCTTTCTCACAAGGATTTAA
>XM_020048109.3 PREDICTED: Esox lucius basic helix-loop-helix and HMG box domain-containing protein 1 (LOC105026992), transcript variant X2, mRNA 
CCGCAGCTTGGTAATAGACTGGTTGTTAGTTATTGCACACATGTAGCATTTCTATGTAGCTAGCTAGTACTCTTAGCTAATTTATATTTTGCTGGCTTATCTGCTCGCTCTCGCTGTCACAATTGGCTACTAAGCGGTTTTACAGGTGTGGGTGAATTTTGAAGTGGTCTATTGTCCAGCCTAACTGCATGTTTGATCCCGATGAAAGATTTGAGCCATGGCACCTGGATCCAAAGGCAGAGACGGAACTCGAAAGAAAAGAAGGAGACTCTGGTCCACATGCTGCGCTATTTTGACTTCCTTCAGAGTAAAATACAGACCTTGCAGAGGTGCTTGCCCCCTGAAAGCATCCCCAAGCAGGAACCTGACACAGGATCTGAGAGTGAAGAGAACACCCCCTCTGAGCCCTGTACACCCTCTCATATTCTAAAGGCTAAGCGCAAGTATGTCTGCAACCGTTCCCATAAGAGACTACCTGCCTCCAGCTCAGAGGTGAAAGCAGAGCTTCAGGGGAAAAGAAGAAGATTGTGCACTGCAGATGTCAGTAGACAGAAAGCTGACCCAAAGGAGGAGGATGTGCCTGTCCCTATGTGGGGTGTGCATTTTGATTGGTCAGAGTGCCATTCCAGTGATAGTTATGGGGATTGGCATGTGCGTGAAAGTGACTCCCAACCAAGCTCCCTGGATTCGGGCTTCAGCTTCAATCAGTTGCTTCCCCTGAGCACCCCTTTGGAGGGGTGCAGTGGGACTCTGAGGACTCCATCCACTCTTCAGGGAGGCCACTGCTCTGCCTGTGAGGACGGCAGTGAAAGCAGCCCAAGGAGCGGTGTCCTCCATACCCCAACTACTCCAGTTACTGGGCCAGGGTCACTTTTCCTGAAGGATCACATGGTTGGGGTCATCCCGTCCACAGGAGGCCGATGGAAACCCTTCCTGAGCCCTGCTGCTACACCAAAACGGCCCATCTTTCTGCCGTTTGGAACTGAGGACAGTCTGAACTTGGGCGAGAGTCTGAACCTTAGTCCGTCTCTCCTCACATCACCTGGCCGGGGCCTCAGCCAGTGCCTGCTACCTGAGGGACCGGAGGAGCTCCATGTGCTGTTTGAGGATGTTTGGGTCACCCCTAAAATGACCCAGGCCAAAGTGTCCCACCTATCCTACCATGACCCCACTGACACGCTGTCAGATGGAGAAGCTGTGGTGAGGCATAGCGGTGGAGGGTGGTTGTCCTCCCACAGTGAGGGGGAGGAGGAGGACGTCACCTGGACCCCCAAGCAACAACAAGTCTCTCTGAAGTCCAAGACCAGTGGGACAAGACGCCACCGCAGAACCAACGCCTCCACCAGGGGGCACCCTCTCCTCCCTCCCAACCTGAAGAAGAAGTGTATTAACGGCTTCATCATGTTCTGCCGCATCAACAGGAAGACCTACCTACGCACCCACCCAGGCACGCCATCCACCGTGGTCACCAAGGAGCTGGCCAGCCTGTGGCACGACATGCCCAAGCAGGAGAGGCGTGTGTACTGTCTGAAGGCTCGTCGCTTCAGCCGTCAGCAGAACCGTAACGTGAAGCCTCAGCCGGCGGAGGGGGAGGAAGAGGACTTTGTGCCCAGTCCACTCCACATGCTGCTGGCGCAGAGAGACCTGAGGGCTTCAGCCAGAGGAGACTCCTAGAGCAGTTCCCTTCACACACACTGGCCCTTCGCCAACCATATGCATGGGATGGATATTGATATAGATGTCCATATTAAAATCAACAACTTCTCTTTTTAAGTCACTTACTGTACTAGTTAATTATGGAGTTGTTTAGAGATTTATCTGAAATGCAGACACACTTTGTGTGTGTGTCTGGCACGTCACATTTTAACTGTTACTGTTTACTGCTTCAAGTTGTTTCTAGACAATGTTCAGACTTGGTTTTACAGATATCATTGAGGAGCCTTTTAGACAGGGTTTATTGACAGAAGTCTTTCTGTGGGTTATAATGCCAAGGCATTGTTTTGCTATTCATGTCAACCTGACGTTGAATTCACCAGTCTATTTATGATCATAATGCAAAGGACCAAATAAATGACAGTATGTGGCTGACAGCTTTATTTATTACCTATTTATACTCAGAATATATTCATATGTGGGGAATGTTAATGTGTCTGTGTGAAGTCCTTCTGTACAGGACAGATGAGAACCAAAGTCTTACCGTTTGGAGTTATTCACACTGGTTGGTTGATGTTTTTATGCGGTGTGAAAATGTTTTGATGTTTCGTGAATAAAAGTTATTACTACTTAGTAGTGGGTTATTTGAGACACATCAAATAGTTTGTTTA
>XM_034078853.1 PREDICTED: Pseudochaenichthys georgianus glutamate receptor interacting protein 1 (grip1), partial mRNA 
GACGGGCGCGATCCACGTTGGGGATCGCATCCTGGCGATCAACAGCAGCAGCCTGAAGGGGAAGCCTCTGAGCGAAGCCATCAGTCTGCTGCAGCAGGCCGGAGAGACGGTCACGCTGAAGATCAAGAAGCAGGGCGACCTGGCGAGCCCTAAGTCCTGTTTGATTGGTTCAGGCATGGGGGCGGGGCTTGTGAGGGAACACCAGGACGGCGTTGACGATCCGGTCATCGTGGTTACGCCGCTGTCGGGTCAGCGAGCGTTCAGCACCCTGCCGTCGGTGGACAGCGCCGTGGAGTCCTGGGACGGATCCAACGTGGACAGCTTCACCCCCCCGGCTCCTCCCTTTCAGTCGTCTCCGTACAATTTCCACGACTGGCGCAACGCAAAGACGACAAACAGCCAATCATCTTCCTGCGCTCGCCAGAGAGCCAATCAGCTGTCAGACCTCGGCCTCAGCGACGACGAGTGGGACCGCCCACCAATGGGAGGAGCCTATAATCTGCCCAGCGGTTTGATCACCGACTGCAGGTTCAGCGTGGGTCATGATGGGACGGAACCGGATCAGGAAGAGAACTTCTGGTCTCAGGCTTTAGAGGATCTGGAGACATGCGGACAGAGCGGCATCCTCCGAGAGCTGGAGGCTACCATCATGTCCGGTTCCACGCTCAGTCTGAACCACGACCCGACCCCTCTGCGCAGCACTCTGGGACGCCAGGCCAGCTTCCAGGAGCGAAGCAACTCCAAGCCATCGGTAAACTCTCGGTCCAACACCTTGCCCTCTGACCCCACGCGCCGAGCCTTCGCCATGAGGAAGATGAGGCAGGAAGTCAACGAGATCCTAAACCAGAACCCCGTGGAGCTCCACAAGCTGACTCTAGAAAAAGCCACAGATCTGGAAGATTTTGGGTTCAGTGTTTCTGACGGCATGTTGGACCGCGGCGTCTACGTGAACAACATCCGACCGGGAGGACCAGCAGAGGGCGGCGGCCTCCGAGCTTACGATCGGATACTACAGATTAACCACGTTCGGACTCGGGACTTCGACTGCTGCCTCGTGGTTCCTCTGATCGCCGAGTCTCCGAACCACCTGGAGCTCGTCATCAGCCGAAACCCGACTTCCTCGTCCACCACGCTGTTGACCAATCACACTGACGGCATCTACAACAGCGGCCACTCCCCTCAGCCAATCGGCAGCGACCTCGGACCTTTGGAGCTCTCCATTGGCCAGTTGGAGGACGGCGGTCCAATCAAGTGGAGCCAACCGGGGGACATGTTGGTGGCGGGCCTTGGGATGGGTCAGGTCAATAATAATTCCGTATAGCAGACAAACAATGGATTCAATTAACCAGATTGGACTGGAGAGGCCGACCAAACAGCAAAATGACTGGTTTTGACCAGTCCAAACTGGTTTAGAGTACCCTATGGTGCTACACACACCCTCTGGATGACCTTTGAACTGTTGAGGCAGCCTGAAAGCACACTGATGGACCGGAGCAACTCCTCACCTTTTCACAAGAACCAGTTCTGCATACTGGTCCTTTATTACTGGAGTCACTGGAACTATAACTACTGATCCTACTGGAACCACTATGAGAGAGCTACTGGTCTGACTGGTCCGACATTAATGGGTACTCGAGTCATGGATGCTGATTCTTCTAAAGCCAATGGTTTTACTGGTTTTAGATTAATGGTTACTGGTCCAACTGAAGCCAGAGCCACAGCCAATTAATGGTCCTACTGGCCAAGACACATCGGCTCTGGTCTTATGGTGAGTTCACACCAAATGCAGAGCTGATGCACTTTGGGTAAACTGGCAAAAGATGGGAAGGCAATTGGTTTGAACTCGGCATAAGTGGGAACAAAACCAATCTGAAGCCAAATTGATTGGTCTTTTTGGTCTAGAAGACTCGGGTTCTGGTCTGAGTGGTGACAGCATCACGAGTACTGGTTCAACTGGTCCAAGACATGGTTGTTATGGTCAAAGAATCATGTGTACCACCAAGCAAGATCCATGACTACTGTGGAACTGGGTCTTCTGGGCCATCTGGTCTTACTAGAATCAGAACCATGGCTCTAATGGCTGTACTGGCCAAGGACCACAGCAGCACAAAGACTGATGGGAACCAGAACCTGCTGACGGACACACGGGTTGCCATGTAGACGAGGGACGCCCCGATCTAGAGCCAATCCAAACCATACTGATTACTGACTGGTTTCTGGTCTTACAGGTTCATTTATGTCGACGGTATAGGTATACATATCTATATTCGGCGCAGTGTGTTGGGTTTAGGCGCACAATTAAAACTAGTGATGGTTAAATACAAGTCTGAAAATGGTCAAATGCAAGTATAATATTGACAAAGTTGGTTTAAAGATAAGGACTAAGGACGTGGATGGTGTTAGGTGGGGTTTAGGTGTAGTTCAGTTTGTTCTAATACAGGGCTGTCAAACTCAATTTCATCACGGGCCACATCAGCATTATGGTTGAACTCAAAGGGCCGGTTGTAACTTTAAGACTATATAAAAATACATATATAAATATTTTATATATTTAAAATAATGTATTATATTACTTTATTGCCTCTGCTTTGGATTATTAAAAAGCTTCATAGATAACTACGTCTGAAAGAAGAAGTCTAGGGCAAATAAGTGCAAGTCTCTTCA
>XM_046869510.1 PREDICTED: Silurus meridionalis nucleolar protein 9 (nol9), transcript variant X4, mRNA 
GTATATTAAGAACATGAAATAATTCGTTTTAAACCCCGGGATATTTCGTATTGTCCATCCCCTTGTTCGTTCCATACCGCTTTTGGAGCATACGCTAGACAACGGGCTGTGTTTAGATTTTTTATAATATTTTAACAACATGGTCGTTTTTGTCTCACTTTAGTGTAGGAGCGTTTGCAAAGCATAAAAGGGGGTTAACGTTTGTCTTCGTTTGAGGGTTAATATTATTGTTAACGTTGACGTTAAAGAACTGCAGGACTGCTCACATGGAGAGATCCTAGCTGTGAATTCCTGTTTATGGCTGCAGATTCTTGAATATTTTTATCAGCTAGCCATTTAAAGAGGTGGTTTTTCACACCATGAGCCAGTGCCAATGAAAGTTCACAAGCCACAACCATGAAGGTGCATAAAGTCTCCTCTCGCTCCAAACATGAGAATCGAAATGCTACGAAACGCCACTCCAAAAACAAGTGGCGCACTCACGGGAAGAAGAACCAGCACGTGGACCCTTCTGGCCAGAATCCCAGGCCTTCGACGGCAAAGTTTGAGAATGAGCTGGTTAACAGACAGAAGCCCAAGGTGAAGCGCTTACAGAAGGCTTACACCAAGGCTGCAACTGTGACGTCCAAAGACAAATGTTCATCTCAGGCTAAAGGCAAGGCTCTGTCTGCACCCTGTCCTCACGTCCACACCAACGGGGGTACTGAGCTGGAGACGGAGAGCGACTCGGAGGACTCCCAGGTCTGGAGGTCTTACGCCAAGAGCGTTCTTCAGAACGGTGCCGAGAAAGAAGGAGAAGGGAACTCGGTTTTAAATCAGTCTGAGGAAGTGGAGGTGTTGGAATACCACGCGCAGTATGAACGCTCCCAGAACCACACAGTGTTAGTACTGAAGCAAGGCCAGTCCCTATGTTTCCGAGGAACGTGCCTGCTGATGTGCCTGAGCGGTCGTGTGGAAGTGATGGGCTTTACAATCGAGCAAGGCCAGCAGCCGTATCCGCTCTTCTCCCCATCGTCCCACTGTCCGCTCACCATCAAGGCCATGGTCGAGTGCACATCCTCAGCCAAAAGCAGGAGGGAAACTCGATTAGAGGCCAAAGCCATCGTCCGCAAGTACCTCCTGCCAGGCGGCGCCGTTGCCGAGGCTCGTACGAGACTGCTGAGCGAGGTGGATGCAGATTCATGCGTGGTGCTGCTTCAGCCGCTGGACACGCCCCTCACACGCTTCCTCTCCAGCTTCGGCAGCTCCTTCAGCCATCTCTTCGACCTCAGCTCGAAGGAGCTGCACTCCCAGGCTGCCGTGTATAACCCAGCTCTCTCTGCCGTGGGCGTGACGGCGCTGCAGGGCCCCTGTGCACGTGGTCTGGTGGCATCAAACAGCTATAAAGAGGCGCTCAGTCGCCTGCTCAGTGCATGGGAAGGGGATTTTGATCGCTGTCCCATTATTCTCGTCTGCGGGGCCAAAAACTCTGGCAAGTCGACTTTCAACAGGCATCTCATCAACAGCCTGCTTAACCACACTGCAAGCGTGGAGTATCTGGAGTGTGATCTTGGCCAGACGGAGTTCACGCCTCCCGGGTGTCTCTCTTTAATCACTGTGACCGAGCCACTGTTAGGCCCTCCATTCACACACCAACGAGAGCCAGAGCACATGGTGTTTTACGGCCAAGCAGAATGCCAGTCCGATCTAGACCGCTACCTGGACTCACTCAAGACCCTGTGGAGACACTACAGCGGAGAAAACCCGGTCATTATTAACACCATGGGATGGGTTAAAGGGCATGGCTTCCAGGTGCTGGTCGACCTCATTCGCTTATTCTCCGTCACCCATGTGGTGCAGCTGAGCTACGGTGACACGCCCCAGTGCCATACTCTCAACCCCGACTTCCTGCGCTCTGCCCAAGGCTGGCACACTCATCCACCGGCGCAGTCTGCCCTCGCGGAGGAACCGGCCAATCAGCTCTCGGCACGGGGTCACCTCCTCCTCAGCATCCACTCGGAGTTCGAAGGAGCCGGGACATCCGGGGAAATGCGTCATCAGCGCAGTAACGAGCTGCGTGAGCTGGCATTGCTGGGATACTTCAGCCAGCTACAGTCTGCAGAACCCGGCCCTATCTGCCCCCTGCACTGCTTCACCCCCTACCAGGTGCCCCACTCGGCTATCGCTCTCGGAGTCACTCACTGTGACGTGGCACCCAACCACATCCTGTACGCCGCTAACGCCGGTTTAGTGGCTCTCTGCTGTCTGAGTGAAAAAGTGGCAGGAAGAGGTGGACCTGTGCTACTGCCTCAAACGCCCATCTGTCAGTGCGTAGGCTTAGGTGTCCTCCGAGGGGTGGATATGGCCCGAGGGCTCTACTTTCTAGTCACCCCAGTGCCTCCGGCGACCCTGAGGCAGGTCAACTGCCTGCTGCTCGGGGAGATCACACTGCCGAAAATCCTGCTCACTGTCCAGCATGGTGTTGAGACGGAGCTTCCTTACGTCACCACAGATTACAGCTTTGAGATCACGGGCGCAGGAAAAGTCCACGTTTTCAAAGGGCTCGCGAGGTCCGGTTTCGTCAAAACTAAAACAAATAACTAAGCTCTCTTATACGGATTTCACTTTCAGCGAACGATGTTTGTATCCCTGTACTTGTTTTTTAGACCAAATAAAGAGGCTTCAGCTGCCACCGAATGTA
>XR_003057350.2 PREDICTED: Ziziphus jujuba var. spinosa uncharacterized LOC107427618 (LOC107427618), transcript variant X2, misc_RNA 
GTAACTTGCAAGCAAAATAGGGCTGGTTATATATATTACACTTTGCTTACCTCTCTTTGAGATGGTCTTAGGCTTGAAGCGAGACCATTTCTAAGCAAATTAAAACTACGTCATCCCTTGGCGTGTTTGTAGTTTGAATGTTCATTTTTTAGTGTTTTTTGGCTTCCAAGAATTCTCACATACCCATATGAAAAAGCACATAAAACCCCCTTCATAAATAGATGAATAAGAAACTATATATAATTCCAGAGATCAAATTTTCTTGGCTTAACATTATTATTTATATTTTTTTCTTATTGGTGAATTCAAGAAATTAAAGATCAATTATGTGGCAGATACGATCTTGGGCTTCTTACAAATTCCGAAGTATGCTTGAGTTAATTCGTCCCGGTATATCTGCTTTCTCATCCTCCATGAATACTGTCTATCACAGAAACTCTAATTCATCAGGTATGCCGATGGCTAAGTTTGGATATGGTTTTCCAAAGCACCAAGGACTGCAGTTGTTCGGCAACACCACCGGTAGCAAAACTTTGACAACATTTGGTACCAACATGGTAAAGGATGGCAATAAGGAGCAAGTTCCACCACCAGTGCCTCCTAAGAACAACATTCTTTATTGGGCAAGATGGGTTTTGGGCTCTATATTAACATTGCTGCTGCCATTTTGGAAGCAATATTGGGGAAAACTACAAAGAATAGAAGGAAAGGTAGAAATGGTTGCTGAAGAGGTGGAAAGTGTGGCAGAGGTGGTGGAAAAGGTAGCAATTAAAGCAGAGAAAGTGTCATCAGAGGCTGCAAATGTACTTCCAGATAATGGAAAACTGAAGGAAACAGCTTTGATTGTAGAACACATTTCAAAAAAAGCAGCCCAAGATGCTCAACTAACTCTGGATATCATTCACAAGGTTTATATATATTTTCCAAACCAATTAATTCTAATTAATTTTGACAAGTAATTCTATGGTATTCCAGGAATACATACCCTCAAACTCATAATAGAATGGACTCCACGTATGTTTACGAGTGTGGATGCATTAAAGCATGACTTCGAAGAATTGGAGACTTTAGTTGAGCCTGTTGTCGATAAGATTGTGGTAAATCATGAATCTGATGGAAAGTAATTAATTTGGGTATTGATCATAATATCATTTTTTTCCTTGTAATGTATTTTCATAATTTGGGCAACCGCATTTTGCCCATGTGAATCGTACAACTTTTGCGCTTTGTTCTTTCTA
>XM_010349232.1 PREDICTED: Saimiri boliviensis boliviensis guanylyl cyclase domain containing 1 (GUCD1), transcript variant X2, mRNA 
GGATTGGGCGAGGGGGCGGGGCCACCCGACGCAGAAGCGGCAAATGGCCAGGGCGGGCTTAAATTGGGAGGCTGGGGGCATCTAGAATCAAAGTTTGGGGCGGGGCTTCTAGAAGGGGCGGGGCCTCCAGATTCGAGACCTGGAACGACCGGGGCGGGTCTCGGGGCGGCCCAGCCGCCGCCTCCAGTTCTCCCCACCGCAGCGGCGCCGGCGGCGGTGGCGGCGGAGGAACTCGATACGCACCGACCGTCCTCCCGTCCTAGCCGAAGCGGAAGCTGTAGCCCGCTCTGGGCCGGGGCCATGGGCGCCCCGCGCCGCCCGGGTCATGAGGACGGAGGCGGAGGCAGCGGGGCCGCCGCTCGAGCCCGGGGACTTTGTGCAACTGCCTGTGCCCATCATCCAGCAGCTCTACCACTGGGACTGTGGCCTGGCCTGCTCCAGGATGGTTCTTCGGTACCTGGGCCAGCTGGACGACAGTGAGTTTGAGAGAGCCCTGCAGGAGCTGCAGCTGACCAGGAGCATCTGGACCATTGACCTGGCCTACCTGATGCACCACTTTGGCGTGAGGCACCGCTTCTGTACCCAGACCCTGGGCGTCGACAAGGGCTACAAGAACCAGTCCTTCTACAGGAAGCACTTTGACACAGAGGAGACCCGGGTCAATCAGCTGTTTGCACAAGCCAAGGCCTGCAAGGTGCTGGTGGAGAAATGCACGGTGAGCGTGCAGGACATCCAGGCGCACCTGGCTCAGGGCCATGTAGCCATCGTGCTGGTGAACTCGGGGGTGCTGCACTGTGACCTGTGCTCCAGCCCTGTCAAGTACTGCTGCTTCGCCCCTAGTGGCCACCGCTGCTTCTGCCGCACTCCTGACTACCAGGGCCACTTCATCGTTCTGCGTGGCTATAACCGAGCCACTGGCTGCATCTTCTACAACAATCCAGCCTACGCCGACCGAATGTGCAGCACCAGCATCAGTAACTTTGAGGAGGCCAGAACCAGCTATGGCACAGATGAGGACATCCTCTTTGTCTACTTGGACAGCTGACACCAGGAGCCTGGTGTGCCCAGGCCCTCGGACCCCATCCCCACCCCAGCTGGGCCCACTCAGGATGCCCTGGCCCAGGCCTGGGGCTGCTGGGGCTGGAATGTGGAACTGCAGCCTCAGCCCATCTGGCAGGGCCCCGGGAACTCTGGGAGACTGTGGCACAGCTGCTTTGTCTGCCAGTGCCCTGTGTTGTCATGTCGGTCACCCCAAGCACTTGCTGGCTGCTGGAAGCATCCCCCAAGACCCCAAGCCTGACTCCAGCTGTACCCACAGAAAGTCCAGCTCCAACAGTGCCCTTGTTGCCTTTGAGCCAGACCCAAGGCAAGGGAGAGGCTTTGTCTCCCCACAGACCGCAGGACTGGGCCTGGAGAGAGAAGTCGCTTGACAGATGCCACTTGTCAGGATAGTATGTGAGTGTCTGGAGACAGCATAGCTGACCCCAACCCCCCCAGCACTGAGGACCCCTCCAGGCTCTTCTCTCCTGGAAGTGCTGAAGATGCCTCTGTGCCCCATGGTTGATGACACCACCACTTCCTGCCTACCCATGGGCCCAAGTTTCTGTGGCTGGTTTCAGAGCATCTGGTCCCTGCCACCCAGCATAGACACACCTCACAGCTGCTTTGCCATGCAGAGCCCTGGCCCCTGGGGACTCTTAAGCCCCCCACAGTCCTCCAGGTCCTCCAGCTCTGTCAGATGGAGGGGTCTCGGGTGTGACCTGGGCCTGGATCCCACTGGTAGGCCTGATGGCTGGCAGCAGTGTGTGCTCTGGAAATAAACAGCAGCTCTAACCCCAGAGGGATCCCTGCACCCAGGAGGCCTCCCAACAGCAGCCTAAATCCTCACAGTGGGGTCTGCCCTGAGATGGGGACCCCCTAGTACTTTAAGGTTGCCTGCTAGGGCCTGTGCTCCAAAGCAACGGGCAGGGGCAGCCTGCAGCTGCCCACCCAGCCTGGTCTTCACACCAGGTTGCACAGGATACTGGGTCTCTTCTATCTTGATGGAGAAGAGGGGTTCCTGCCCAGGATCATACAACACAGCAAATAGCATAGAGCTCTTCCTTCGGTTTTGGTTTTTTTCTTTTTTTTTTTTTTTCCTGGTTGGGATCAGGGGTTGTTTCTTTGAGATTTAAGTTTTCATTTTTGAGGGGTAATGACCTTTAAGTAAAACAGTAATAGCAAGAGTGAAGGTACTTTGGAACCACCAATACCTCTGCACAGGGCAGTTAGCCAGCTCAAGTTCTTTTTTAAAGAAAGGGACTTGGCTGGTGGTTTGAGTACCCACCCCTTCACTTCACAGACAAGGCAGTTGGCCCAGTCTGGGGAGTCTGCCCAGGACAGTGGTGGGGCTGGGCCTTAAACCCCAGTCTATACCTAAAAAACTAAGGGAAATGGATCATTCTCAAAGGGGCAACAGTGACACCATCCCTGCACTCCTGGGTCCTGGTCTTACAGTGCCCAAGGCATGGCATGGTGGCAGCTGGACCCTCCCCCATCAGGTGGCTCTGGTGGTAGAGGTGGGCTCTTTTTAGGAGGGTGCTCGGACCACACAGCCAAATTGCTCCTCAACCCTAGACAAAGCCTTGACCAAGAGGGAGGTGCTGTTAGCTGGGCAGCCCTTCTGGGTTTCAGAGACTCGTGTGGGCTCCAGTCTGGTCTCATCTCCATTGCCTTAATGACAGGTGGCCCAGGAGTACCCATGCACAGCAGCTGTGGGGTGTGGGCATCTTCAGATGTTCTGGTAAAATTGTGAGATTAGCTGTATGAAGGAAACCAGTGGGAGGAAAGGAAGTTTTCAGGATGGCAAGATTTGATTCAGACACAGTGCACATGCTACTAGGGCTGTCACTGGGCAGTGGCCTTCATGGAGAGTGGTACCAGCACCTCAGTCCATCCAGGATATTTAGAAACACTCAGTCTCTGGTCCCAGAGGATGGCTTCTCAGGGCATGCCACAAGTTAAAGTCACCTGCCTGGAAGATGAATGAGAAAGCTGTCCATTCTCAAGACCCATCTGCCTAGGGAGGGTCACAGAGGCAGGATGTAAGCCACACTGTATTGCATTCTTGCATAAGTCATGAAAATGGGGCCAGAGAGGGAGCCTGGACATCAGGGACTTCTGCCCACAGCACATGGCACCCACAGCTGCCCAGCCTGTCTACATGCTGGGGCCCAGCACAGCCCCTGAAGCCACATGGGACAGTGGGCTTTGTTCACTATAGCCACAGGGGGATGAAAGGGATCTTTTACATTGCAGAGATTTTATATATATTTTGTTTGTAATGAGCCATTCTCAATAAATTCTCGCTGCAAAA
>XM_053281253.1 PREDICTED: Hemicordylus capensis transmembrane and coiled-coil domains 4 (LOC128338576), mRNA 
TCCCTCCCGCGGCTGCCGGCCTAGTCGCCTTTTTCTGAGCCTCGGACTGGAGTGAGCGCTGAGCCGGCCCAGAGTGAAGGCAAGGCGGGGGCCGGTCGGAGCCTCGATGCGGCCCCTTTCTCCCTCGAGGACGGGCAGAGGCCGGTGAAGATGGCTGCCGGTCACCACCAGCGCTGGAGGCCTTGGAGAAGGGGGCCGATAGGAGAGCCGGAAACGGAGGAGCCGTCTGCACACGTCGGCCGGCAGCTGGGCGAACCGGGGAAGTTTGCCTACGCCGCTCTTTGTGCTGTATCCTTGGCATCGCTGTTTCCAGAGCAAGCCGAAAGCTCGTATCGGACGGGATTCGTCGAGAGCCTGGTGCGGTGGCTAGACCTCCCGGAAGGCGTCTTGCCTGCGATGCAGGCCTTTGCCGGCGGCTTGGGAGGCGAAGGGACAGACACCTTTGCTCAGATCCTCTTGAAGGACCCCGTCCTGAAAGACAACTCTGACATCATCACCCAAGATCTCGTGGCCTTTTCCCTCAAAGATGGCTACTATGATGCCCGAGCAAGAGTGCTCCTCTCTCACGTCACCTGGCTTTTAAGAATCCCGTTGACTGAGCTGGAGGCCTCGGAGGAACGACTTCTTGAATGCTTGAAAGATGAAGAAGAAGAAGAATCTGCAACGGCGGAGGCATCGCGGAAGAGGAAAGAGAAGAAGAAGAAGCTAAAGCGGTACTTGCTGATCGGTTTGGCGACTATTGGAGGAGGGACGGTGATCGGTCTGACGGGAGGCCTCGCCGCCCCTCTGGTGGCGGCCGGAGCCGCGACCGTCATCGGAAGTGCCGGAGCGGCCGCCCTGGGCTCGACAGCTGGGATCGCTGTCATGGCGTCGCTCTTTGGAGCAGCGGGAGCCGGTCTCACCGGTTACAAGATGAAGAAGCGTGTGGGAGCCATTGAAGAGTTTGAGTTTCTCCCGCTAACTGAGGGGAAGCAACTCCACATCACCATCGCGATCACTGGTTGGCTTTCTACGGGCAAATATGGGAGTTTCACGGCCCCGTGGAATAGCCTGCTGCAGTCGAAAGAGCAGTACTGCTTAGCCTGGGAGTCCAAGTACCTGGTGGAGCTTGGAAACACCCTCGACGCCTTGCTGAACGGGCTGGTGAATGTGGTGGCCCAGGAGGCCCTGAAGTACACGGTATTGTCGGGGATCGTCACCGCCCTGACCTGGCCTGCTTCACTGCTCACAGTCGCCAGCGTGATCGATAACCCCTGGGGTGTGTGTCTTCATCGCTCGGCCGAAGTCGGGAAGCACTTGGCGCAGATTCTGCTCAAGCGGCAACAGGGCAAACGGCCTGTTACGCTGGTTGGATTTAGTCTTGGTGCCAGGGTCATCTACTTCTGCCTCCAGGAAATGGCCAAGGAAGAAGATTGCAAAGGGATCATTGAAGATGTGGTTCTGTTGGGGGCACCCGTGGAAGGAGAAGCCAAGCACTGGAAACCGTTTACCAAGGTCGTTTCGGGCAAGATCATCAACGGCTACTGTAGGGGAGACTGGCTGCTGGGCTTTGTGTACCGGACGTCCTCCGTCCAACTCCACGTTGCCGGACTTCAGCCAGTTGACCTGGACGACCGGAGGATGATCAACGTGGATCTCTCCTCTGTCGTCAGCGGCCACCTGGACTACATGAAGCAGATGGACACGATCCTGAAGGCCGTGGGCCTCAAAACCAAGCAGTGCCGTCTGGAAGAGAGGGGAGATCTCACCCTCCTCTCCGCTGAGCCCAAGGAAAGCCAGGAGGAGGCCCCATGTGTAGACACTCGGGAAGAGCAAAACCTGCTGGGAGGAGGAGAAAGTGGCAGCCATGACGGCGGCAGTGATGACTGCTGGTCATGGGAGCCAGTGCCCAGCCGCGGATCGTGCCCAAGGGAACCTCCAGAGGGGGCAGATTCTGAGCCGAGCAGTCTCCTCGATGCCGAAAGGGACCCACAACTTCCTGGCTTGGAAGACCCCTTCCCCACCAGCTCCTCAGGAATAACTGGCCACTGCGACCGCTCTGCAAGCCCTCTTTCTCCAACCGTCCGATAATGCACGAGGTGGCAGGGCATGATGGTGGTTGTAGTACTTGCACAGAGTCTGCCATAAATCTCCCACGGGGCTGGCGCCTCTTAGTGCTTGATGGTGGCGAGACCGATCGTGCAGGATTGGGCCAAAGGACTTATTTTTGTAAAAAAAGTATTTCTCCCCCCACAAAACCATGAATTGGGTACCACTGAAAATCTCGCGAGCATGACGGAGGTGCCCGTCCCTTTTATTCTTTTCTGTGGCTTCTGTTAATAGGAGATGCTAGTCCTGGAAGCCAGCAGTTAGTAACTACTGTTCTTCCTCCATGAGCATATCTGGGCCTTTAAAAAGGCCGTCTAAGTTACTTGTATATTGCATTAATTCCTTCTTATGTGATTTCCTCAGTTGATTTCCCCTTAAGTTCTGATATAAACAGAGAGGGGAGAAGGGTATCCTGCTTCCGAATATGGAGGTTCTGTTCTATACTGTCAGTTTTTCAGAACTGTTAGTTACCTAACTAACATATTGACTGTTTTATGTCAGTGTATGTAGCCTAGGGCTGTCTGCTCTGGCTGGCAGACAGGGTCAGATCATTGGCCCATCTAGTTCAGTGTAGCCTACCCTGACGGGCAGACCCTCTTGAGGGTCAGGGGCCTCTTTGAACTGGAGAGGGAACCTGGGAGCTTCTGCATGCAAAGTGTGTGCTCTCCCCACACTCACAGATCTATTACCCATCGCCATATCTTGTGGCAAAGAGTTCCTAAGATTTCCTAAGAACTCTTGTGGCAAAGAGTTCCTAAGATTTAAGTTCAGAGTGAGAAGGGAGAGAGCTTGCAGGAGACTTAACAAGGTCTGTGTAACCGAAAAAGACACACCCCTATTTATTTACAAATTCACAGGGTTCTGTACGTGGCAGAAAGGTGGGATATAAAATGCAACAAAGCTTTGCTTGGCTTATGGGGCCAAACCAAATAATGCATGTGAAGTATCCTTGCGTACTAAGGAAAGTCCTGTAGTCCTGATCCAGAACTTGATTCCGATCCATCGGTAGATCTCGTAGCTAGACCTCCAATCAGAACTCTGTTTCCCCAGCCCCCCGTATGGCAGATCTAGCCTTGCCATTGGACCCAATTTCCATTTGCAACCCACTTGTTGTCATTTCATCCTTCGGGTCTACCTGGAATGCAAGGCGGGACCATGGCAGCTTGGGCAGGATTCCTGTGAAGCTTTGTTAAAAGCAATTCCAGTTTCTGTGAACTGCGAGCGGAAGGTGGGCTTCCGGTCCGCTACTGTTTAAGAAAAATATTTATTTTGTCAGGAACACTGAAAGGTTGGGCATTAAGAGGATTTGCAGGAGAGATGTGTGGGTGTGCCTGCTGGGAAATAAAGCAATTGTATTAAT
>XM_029611915.1 PREDICTED: Rhinatrema bivittatum neurofibromin 1 (NF1), transcript variant X2, mRNA 
ACTTCCGGTGTGGTGTCATGGCGTCTTCGCTGTGATGGCTGAGGAGAGGCTGCGATAACAGGGGAGGGGGGGAAGCGAGAAGAAGGGGAAGAGGGAATTAAAATAATAAGAATAACCACCCCCTCCTCCAAGCAAGCCAAAAAATAAGAGCCCTTCCAAAAACAGCAAAATAAAAAGCAACGTAGTCGCGGAGGTGGGGGGTGAAAACCTCCCACCCCTTTCTTCCCCTCCCCCGAGGGAAAGAAGGTACTTTTAAACAATATCTAAACATATATATTATATATATATGTAATATAGGAAGGTCGAATCCAGGCGGCCCCGGGGGTGTTTCCACTCCCCTGCCCGGGCTCTCCCCGGGCTGAGATGGCGGCGCACAAACCGGTGGAATGGATCCAGGCCGTCGTGAATCGGTTCGATGAGCAGCTTCCAATAAAAGCGGGACAGCAGACCACGCACACCAAAGTCAGCATGGAGCACAATAAGGAATGCCTCATTAACATTTCCAAGTACAAGTTTTCTCTGGTCATAAGTGGACTCACAAATATCTTAAAAAATGTAAACAACATGAGAATATTTGGAGAAACTGCTGAGAAGAATCTCTACCTGTCCCAGCTGATTATATTGGATACTCTGGAAAAATGTCTTGCAGGGCAACCGAAGGACAGCATGCGGCTAGATGAGACGATGCTGGTGAAACAGCTTCTCCCCGAGATCTGCCACTTTATCTACACCTACCGTGAGGGAAACCAGCACGCAGCCGAACTCCGCAACTCCGCCTCTGGCGTCCTTTTCTCTCTCAGCTCCAATAACTTCAATGCTGTCTTCAGCCGCATTTCTACCAGATTACAGGAACTGACCGTGTGCTCGGAAGAGAACGTTGACATTCATGATATTGAACTGATGCAGTATATCAACGTGGACTGTGCAAAGTTAAAACGATTGTTACAGGAGGCAGCGTTTAAATTTAAATCTCTCAAGAAAGTTGCTCAGCTGGGAGTTATAAACAGTCTGGAAAAAGCATTTTGGAACTGGGTAGAAAATTATCCAGATGAATTTACAAAGCTGTATCAGAGACCACAGGCTGATATGGCGGATTGCTCAGAGAAGTTGTTTGACCAGGTGGACAGCTTTGCTGAAAGCACGAAACGCAAAGCGGCGGTTTGGCCCCTTCAGATCATTCTCCTCGTCTTGTGTCCTGAAATCATACAAGAAATCTCCAAAGATGTGGTGGAGGACAGCAAAATGAACAAGAAGTTGTTTCTGGAAAACCTTAGAAAGGCATTAGCTGTGCATGGTGGAAGCAGACAGCTGACTGACAGTGCTGTCATTGCCAGTGTTAAGCTCTGCAAAGCATCCACCTACATCAACTGGGAAGATCACTCCGTCATTTTCCACCTTGTACAGTCCGTTGTGATAGATCTAAAGAATTTGCTATTCAATCCAAGCAAACCTTTTTCCAGAGGTGCCAGCAATCAGAATGCCGATGTGGATCTAATGATCGACTGTTTGGTTTCCTGCTTTCGCATTAATCCTCACAATAACCAGCATTTTAAGATCTGCTTAGCACAGAACTCCCCATCACCATTTCATTATGTGCTTGTGAATTCTCTACACAGAATCATTACAAATTCGGCCCTGGACTGGTGGCCCAAGATCGATACTGTGTACTGTCACTCAGGAGAGCTCCGCAGCATGTTTGCAGAAACCCTTAAAAGTGCCATGCAAGTCTGTGGCACGCATACCACCACCCGCCTGACTCAGAGTCTTCCATTCAAAGACAAAAGAACAAATCGTAAATTTAAAGACAAACCTACAGACTTGGAAACCAGACTTGGAAACCAGAAGTACCTGTTGCTGTCCATGGTGAAGTTGATTCATGGAGATCCAAAGCTTTTGCTTTATAACCCAGGCAAGGTAGGACATGACACCCAAAACAGCACTACTGAGTTAATTACCGGACTTATGCAGCTTGTACCACAGTCCAACATGCCAGAAATAGCACAAGAAGCCATGGAGGCCTTGTTAGTCCTTCATCAGCCAGAAAGCATTGAGCTGTGGAATCCAGAGGCACCAGTAGAAACGTTTTGGGAAATTAGTTCAAAAATGCTTTATTATATCTGCAAGACATTAATTGGTGCCAACATGCTGAACAGCACAGAAATTCTCAAGTGGCTGCGAGAGATTTTTATTTGCAGAAACAAATTTCTGCTCAAGAACAAGAGCGCCACAGCGGGCAGCAGCATTCCAATCTGTCGCCAGGCACAGGCCAAGTTAGAGGTTGCTCTCTACATGTTCCTGTGGAGTCCTGACATCGAGGCTGTCCTTGTTGCCATGTCCTGCTTCCGTCACCTCTGCGAAGAAGCGGATATCCGGTGTGGGGTCGACGAAGTGTCTGTGCATAATTTTTTGCCAAACTACAACACTTTCATGGAGTTTGCATCTGTCAGCAACATGATGTCAACAGGGCGAGCAGCTCTTCAGAAGAGAGTGATGGCATTATTGAGGCGCATAGAACATCCAACAGCTGGAAACACAGAGGCTTGGGAAGATACACATACGAAATGGGAGGTGGCTACCAAACACATTCTTAACTACCCGAAAACAAAATTGGAGGATGGCCAATGCACTGAAAGTCTTCACAAAACCATCGTGAAGAGGCGAATGTCTCATGTTAGCGGAGGTGGGTCAATAGATTTGTCTGACACGGACTCTCTGCAGGAATGGATCAACATGACAGGCTTCCTATGTGCTCTGGGCGGTGTCTGCCTGCAACATCGCAGCAGCGCAGGCTTGGCCACGTACAGCCCGCCCATGGGACCCATCAGCGAACGCAAGGGCTCCATGATCTCCATGGTGTCCACCGAAGGCAACACAGAGACACCCGTCAGCAAATTTTTGGATAGGCTGCTTTCCTTGATGGTGTGCAACCATGAAAAAGTGGGAATTCAGATTCGGTCGAACATTAAAGATCTGGTGGGCTTGGAACTGAGCCCTGCGCTTTATCCCATGCTATTTAACAAAATGAAGAATAATATCAGCAAATTCTTTGACTTACAAGGACAGGTTTTGCTGACTGACACCAATACGCAGTTTGTAGAGCAGACCATAGCTATATTGAAGAATTTGCTTGATAATCCTACAGAGGGCAGTTCTGAGCACCTGGGACAAGCTAGCATTGAGACCATGATGCTGAATCTAGTTCGATATGTTCGTGTGCTTGGAAATTTAGTGCATGCCATCCAGATAAAGACAAAACTCTGCCAGCTCGTAGAAGTGATGATGGAAAGGCGAGACGATCTTTCCTTCTGCCAAGAAATGAAATTTCGGAATAAGATGGTGGAATATTTAACAGACTGGGTTATGGGAACGTCTAACCAAGCAGCGGATGAGGATGTAAAATGCCTAACCAGAGACTTGGACCAGGCCAGCATGGAAGCAGTAGTCTCTCTCCTTGCTGGTTTACCTCTGCAACCTGAAGAAGGAGATGGAGTAGAGCTGATGGAAGCCAAGTCCCAGTTATTCCTCAAGTATTTTACTCTCTTTATGAATCTTCTAAATGACTGCAGCGAAGTTGAAGATGATGGTACTCAGACTGGTGGAAGGAAACGAGGGATGTCTCGGAGGCTAGCTTCCCTGCGACACTGTACTGTTCTTGCTATGTCAAATTTACTGAATGCTAATGTGGACAGTGGTCTCATGCACTCAATAGGTTTGGGCTATCACAAGGATTTGCAGACAAGAGCCACATTTATGGAAGTCCTTACCAAAATCCTCCAGCAGGGGACTGAGTTTGACACCCTGGCAGAAACTGTGCTTGCGGATCGTTTTGAGAGATTGGTAGAATTGGTCACTATGATGGGCGACCAAGGAGAACTGCCCATCGCCATGGCTCTAGCCAATGTGGTGCCTTGTTCACAGTGGGATGAGCTAGCCCGTGTCCTTGTGACCCTTTTTGATTCACGACATCTGCTTTACCAGCTTCTCTGGAACATGTTTTCAAAGGAGGTTGAACTGGCAGACTCCATGCAGACCCTTTTCCGGGGAAACAGCTTGGCCAGTAAAATAATGACTTTCTGCTTTAAGGTGTATGGTGCTACATATCTGCAAAAGTTGCTGGAGCCTCTGCTCAGGGCCATTATCACATCACCTGAGTGGCAGCACGTCAGCTTCGAAGTGGATTCCACAAGGCTGGATGGGATGGAAAGTCTGGATGAAAACCAGCGCTGGCTGCTGCAGATGACAGAGAAATTCTTCCATTCAATAATTACTTCCTCTTCAGAGTTTCCTCCCCAGCTGCGAAGTGTCTGCCACTGTCTGTACCAGGCAACTTGCCACTCTCTTCTGAGTAAAGCTTCCGTAAAAGAAAAAAAGGAAAACAAAAAATCAGTTGTCAGCCAGCGATTCCCCCAGAACAGCATTGGGGCAGTCGGCAGCGCCATGTTCCTCAGGTTCATTAACCCTGCAATCGTCTCTCCATACGAAGCAGGAATCTTGGACAAAAAGCCACCACCTAGAATTGAACGGGGCCTAAAGTTGATGTCAAAGATCCTTCAGAGTATTGCCAATCACGTCCTGTTTACAAAAGAAGAACACATGCGCCCTTTTAATGACTTTGTGAAAAGTAACTTTGATGCAGCTCGAAGGTTTTTCTTTGACATTGCTTCGGATTGCCCAGCTAGTGATACAGTCAATCATAGCCTGTCCTTTATCAGCGATGGTAATGTGCTGGCTTTGCATAGGTTGCTTTGGAACAATCAGGAGAAAATTGGCCAGTATCTCTCTAGCAACAGGGACCATAAAGCAGTGGGCAGGAGACCTTTTGACAAGATGGCAACTCTGCTCGCATACCTGGGACCTCCAGAACACAAACCTGTAGCAGACACACACTGGTCCAGCCTAAATCTCACCAGTTCCAAATTTGAGGAATTCATGACCAGGCACCAGGTACATGAAAAAGAGGAGTTTAAGGCGTTAAAAACTCTCAATATCTTCTATCAAGCAGGGACATCAAAAGCTGGAAATCCGGTATTCTATTATATTGCCAGGCGATTCAAGACTGGCCAGATAAATGGGGACTTGCTAATATACCACGTGTTGCTGACTTTGAAGCCATACTACGCCAAGCCATATGAGATTGTAGTGGACCTCACCCACGCTGGGCCCAGCAATCGCTTTAAGACTGACTTCCTTTCCAAGTGGTTTGTCGTTTTCCCTGGGTTTGCATATGAAAATGTGACAGCAGTTTACATCTACAACTGTAACTCTTGGGTGCGGGAGTACACAAAGTATCACGAGAGACTGCTCACCGGCTTGAAAGGCAGCAAGAGACTAATTTTCATTGACCCCTCGGGGAAGTTGGCAGAGCACATTGAGCATGACAAGCAGAAACTACCAGCTGCCACTCTAGCTTTGGAGGAAGACTTGAAGGTGTTTCATAATGCTCTCAAACTGGCGCACAAAGACACCAAAGTTTCTATTAAGGTTGGTTCCACAGCAGTTCAGGTGACATCTGCTGAGCGGACAAGAGTCCTGGGTCAGTCAGTTTTTCTGAATGATATTTACTATGCCTCCGAGATTGAGGAGATCTGCCTCGTGGATGAGAACCAGTTCACGCTAACCATTGCCAACCAGGGAACACCTCTGACTTTCATGCATCAGGAGTGTGAAGCCATCGTCCAGTCTATCATTCACATAAGGACTCGATGGGAGTTGTCACAGCCCGATTCCATTCCACAACATACTAAAATCCGTCCAAAAGATGTGCCTGGAACATTGCTCAACATTGCATTGCTTAACCTAGGAAGCTCAGATCCAAGTTTAAGGTCTGCTGCCTATAATCTTCTGTGTGCCTTAACATGTACCTTTAATTTAAAGATTGAAGGCCAGTTACTGGAGACTTCAGGTCTGTGTATCCCTGCCAACAACACCTTGTTCATTGTCTCCATAAGTAAGACTTTGGCAGCTAATGAGCCCCATCTCACCTTAGAGTTTTTGGAAGAGTGCATTTCCGGATTCAGCAAATCCAGCATTGAACTAAAGCACCTTTGCCTGGAGTACATGACCCCCTGGTTACTAAATCTGGTGCGCTTCTGTAAACTCACCGATGATGCCAAACGGCAGCGAGTCAGCGCTATTCTGGATAAGCTGATAACCATGACAATCAATGAAAAGCAGATGTATCCTTCCATTCAGGCAAAGATATGGGGAAGTCTTGGACAGATCACAGATTTGCTGGATGTGGTTCTGGACAGTTTCATTAAAACCAGTGCCACAGGTGGTTTGGGATCCATAAAGGCTGAAGTTATGGCAGACACAGCTGTAGCTCTGGCTTCAGGCAATGTGAAATTAGTCTCAAGCAAGGTGATTGGAAGAATGTGCAAAATAATTGATAAGACCTGTCTGTCGCCTACACCTACATTAGAACAGCACCTGATGTGGGATGATATTGCCATCCTGGCCCGGTACATGCTAATGCTGTCCTTCAACAATTCACTGGATGTGGCAGCGCACCTTCCCTACCTCTTCCATGTTGTCACTTTATTGGTGGCCACAGGTCCTCTGTCTCTGAGAGCTTCCACCCATGGCCTGGTCATCAATATAATTCATTCCCTGTGTACCTGCTCACAGTTGAACTTCAGCGAGGAGACCAAGCAAGTTTTGAGACTCAGTCTGACGGAGTTCTCATTGCCCAAATTCTATTTGCTGTTTGGAATTAGTAAAGTGAAGTCAGCCGCTGTCATAGCCTTCCGATCCAGCTACAGGGATAGGTCGTTCTCTCCTGGCTCCTACGAGAGAGAAACGTTTGCTTTGACGTCGCTGGAGACGGTCACAGAAGCTCTGCTGGAGATAATGGAGGCTTGTATGAGAGATATTCCAGCATGCAAGTGGCTAGACCAATGGACAGAGCTAGCACAAAAGTTTGCATTTCAGTATAATCCATCCCTGCAGCCCAGGGCGCTAGTAGTCTTTGGCTGTATCAGTAAACGAGTGTCACATGGGCAGATAAAACAGATCATCCGCATCCTTAGTAAGGGACTGGAGAGCTGTCTTAAAGGCCCTGATAATTATAACAGTCAGGTTTTAATAGAAGCCACAGTTATAGCTTTAACCAAACTACAGCCACTTCTGAATAAGGACTCCTCTATGCACAAAGCCCTCTTCTGGGTGGCTATGGCGGTGCTGCAGCTGGACGAAGTGAATCTGTATTCCGCAGGCACAGCCCTCCTCGAACAAAACCTACACACATTAGATAGCCTTCATGTGTTCAATGACAAGAGCCCTGAAGAAGTATTCATGGAAATCAGGAGGCCCCTGGAATGGCACTGCAAGCAAATGGATCATTTCGTCGGGCTCAATTTCAACTCCAACTTTAATTTTGCACTAGTAGGACACCTTCTGAAAGGTTACAGGCATCCTTCTCCTACCACAGTAGCACGGACGGTCCGCATTCTACACACATTGCTGGCGCTAGTTCACAAACACAGGAATTGTGACAAGTTTGAGGTGAATACCCAGAGTGTGGCTTATTTGGCAGCTTTACTCACAGTGTCTGAAGAGGTCAGAAGTCGCTGCAGCCTAAAGCACAGGAAATCTCTCTTATTGGCAGATGTTTCACTGGAAAATGTTCCTATGGATACATATCCCATGCATCACAGTGACCCAAGCTACAGGACATTGAAGGAAAACCAGCCGTGGTCCTCCCCAAAGGGTTCAGGCATCCATCTTGCTGCAAATTACCCAACAGTGGGGCAGATTAGTCCCCGAACCCGAAAATCTATGAGTCTGGATATGGGGCAGCCATCACAGGCTAACACTAAAAAGCTTCTAGACTGCTGCTGTAACTCTGTTAAGTTTTGGCTAGGCGTGGCTGAAAACGGGATATTTGTTCCAGTCCACTTTCCTGGTACAAGGAAAAGCTTTGATCATTTGATATCGGACACCAAGGCTCCAAAAAGACAAGAGATTGAGTCTGGGATCACTACACCTCCCAAAATGAGAAGAGTTGCAGAGAGTGACTACGAAATGGAAACCCAGAGAATAGCATCGCCCCAACAGCACCCTCACCTGCGCAAAGTCTCAGTGTCCGAGTCCAATGTGCTTCTGGATGAAGAGGTCCTAACAGACCCCAAAATCCAAGCTCTGCTGCTTACCGTCCTTGCTACACTGGTAAAGTACACTACAGACGAATTTGACCAGCGAATTCTTTATGAGTACTTAGCAGAAGCGAGCGTGGTCTTCCCTAAAGTTTTTCCTGTCGTGCACAATCTGTTGGACTCCAAGATTAATACCCTTTTGTCACTGTGCCAAGATCCAAATTTACTGAATCCAATTCATGGGATTGTACAGAGTGTGGTTTACCATGAAGAGTCCCCGCCCCCATACCAGCCATCCTACTTACAAAGTTTTGGTTTTAACGGTTTATGGAGGTTTGCTGGGCCATTTTCAAAGCAAACACAAATTCCAGAAGATGCTGAACTCATTGTAAAGTTTCTGGATGCCTTGATCGACATGTATTTGCCTGGAATAGATGAGGAAACCAGCGAGGAGTCCCTCCTGACTCCCACATCTCCTTACCCTCCTGCCGTGCAGAGCCAGCTCAGTATTACTGCCAACCTGAACCTTTCCAATTCCATGACCTCGCTTGCCACCTCCCAGCATTCCCCAGCTTCTCTGCCTTGCTCTAAATCAGCAGTTTTCATGCAGCCCCTCGCTCATCAAGGAATCGACAAAGAGAACGTGGAACTCTCACCCACGACGGGACACAGTAACAGTGGCAGGACGCGTCATGGATCTGCGAGCCAGGTGCAGAAGCAGCGGAGTGCTGGCAGCTTCAAACGGCATATCATTAAAAAGATTGTGTGATGTTTGCATGGGGGAGAGGGGTTTTAGAGAGAAAAAGCATACAAGAAACCAAGAAAAAGACTTCTGCTTGTGAGCTTCTCACCAGTGACCCCTACCAGTCAGGATGCTGCACTTAACTTTTAATGTCACCGTACAGTCAGCCATGTTGCCAAAAGAACAACTCTTTGATGTATTGCCTGAATTAACATAGTTTAATGCCTCCTTCAGGTTTCTTCTGTTTCTCTTTGTTCTTTTCATTTTAAAGCAGTGTTCCAGAACCATTGTAGAAAAATTGTTCGTAGATCCCAAGGTTCCAGAATGAAGAACTTTGCAGCTAAAGAAAGCACTGAATCTGCTTCAGTACCTAAACTACAGAAGCCATTTTTTTTTTATTTTTTTTTTTTAGAGATGGTTCTCTGGCTTTTTCTTCCTTGCCTTGCTTTTTTAATTTTGTTTTTGTTTATAAAAAGGAAAGTGTTAATGCTGAATTATTTTTGCACACTTTTCAAAATGGAAAAAACAATAGAGGGATAAATCCTGTTCTTAATGGAAACCCCTTTTAGACTTTTTAGTAGTCCTCTTTTATTTCTTTTTTCTTTTTTACCTGGAAATGAATCTGTAAAAGTTGCAATTGTTCAACTGTGGGCCTAACTAACCAGAGATTGTGCACCTTTAAATAATGTAACTACTTTATCATTTATGGTGGAATTCATGGGAATATAAAACTCTGGCATCAACAAAATCAGCATTTACTCCTTGATACCTGTCAGTTTCTCTAGTGTTCATTTATATAAGGCAAAACTGTTTGTCCCCCTGTTTTTATTGTCTGTAACATTTTAATGGAAAATTGCAGGGTTTTTTGAAAGAGTGAGGGGTTCCAATTTTCAGTGTTAGTTGCTGAGCTGTTTCTCTTCCTGAGTTTGTAGATAATGGTTAGGGTTAAGTCTCAACGTACCCTGCTGCCAGAATGGAATGGTTTGTTAATGCAGGTGTAGAGAATTCAAGTAATTTTTTTCCAGCAATTTCTGAAAACTTCTCTGTGAAGACCTGTTATGACAGCCTCCTGAAGGGAGATGGTAGTTTAAATTTTCTATCTGTGTTTTCCTGGGGGTTCCCCTCAAAACAAAAATAACTACTGGGAGAATTTAGTTCAAAATAACTAATCCCCCTAAATTAATTATTTAATAAGCTTGAAAGCAAGGAGCAAAATACTGATTTTATCATGCCTCTGTTCATGTGTTCTGAATGTAGATGCACCTGCCTGAAGCAATGCTGCGCAATCTTGTTTTTTTTTAAGCAAACTAATCTGTTTTAACCAATTTATATCTGCACTAAAACACATTAGAAGGCGAGAACTGACATCTGTGGTGACACTTTGAATAGAAAAGACATTTGAGACTATTTGTTCATCCAATGTCGTCCTGGGTTTTTTTTTTGTTTGTTTTGGTGCCCCTTAAGTTTAATAGATTCTTCCCCCGGGGACATTGCAAGCAGAATAAATACAGGATTAGGCAATGTGGGAGTTAGAAGCATTACGTCCATGCAGCTCAGCCCAAAAATCAACGCATGTATTATGCCCACATAAATGCAAGATGGAACGGTACATGACCGGAGCGGGCTTAACAAAAAATCCGCTTCATGATGTCAAGCTCTCCCAGTCAAGAATTCTGGCAGTACAGTTTGTCTTATCGCCAGACTTTCCAATCAACATCCACTTATGCTGTAGAATAATCAGAAATTCTAAGAATCACTTTAGAAACATTTTGGGGGTTTATAATTAAACTGAAAACCACATTCTATCACTGTGAAAGCCGTGTCAACCTAGCATAGTATAATGGCAGTGGATGACTGTCCTGGTATACTGCTGTTAAGGTTAATATGTACTATGGAATAGGGCAAGTGGTTAAAATGCTATAATGGACGAAAATGTAAACATTCTGATCATGGAGATAAATACACGTTTGACAGCTATGAGTCAAGGTCATGTTATTTAGGTGCTCATTTTTAGATTGACTGTATTTACTGCTTTAACAACATCTATTCATGGCCCCAGTATAGTACTAAAATTACAAAAAGCTTTAAAAAAAAAAAAAAAAAAAAAAAAAGTATATTGTTAGTGTATTTCAGTAAATCAAATTCCACAGCTAAATTACTAGAAAAAAGGTACAATAAAGTGTTCAGATTGTATTTCTATAGCACATAACACACTTATTCAGACACAGTAATCAGTTTAACATTTATGAATGTAAAAAAATGCCTTTATTTTATTGTCACAAACAAATAACTTAATTTCTTTTTAATTTGTTTACAGTCCTGGAAAAACTATGAACAGAAACATAATATGCAAATATAGTTTGCCAAAATAAGTTTTAAAAAACAAACAAAAAACCCCGTAGTATTAGTTGTGGCTATTTTGAAGTAGCTGACATGTTCAAAATATTGAAGGTTTGTGCAATTAACCAAACTTTTTGTTTTTTATTATTATTATTATTATTACTGTTATTGATAATGTAGAAGTTGCAAAATAGAAATAATTAAAATGCTACAAAATGTATGAAGGGTATTAAAAGGTGAATGAAGTTAGGAATAGAGCAGGGACCCAGTGGCAGGTGCTATACCCATTAGTTTATTTTCCCCAGTCCTGAGATTTCACATGTGAAAACCTACTGTACTGTACACGAGATTCTACTGTAGATTGAATCAAAATTTATTGAAAACATGTACCAGTTTAGCTCGTAAGTGATTGCGTACCAAACTGTATTTTCTCTTTTTTAAAATTTTCATTTCAAATTGAGCAGGAAAGAAAGCAGGGGGAGAAAATGTAATAGATGCCTTGATCTGATTTTTCAAAACACTACAATTTTCTGAAACTGTTGCAAGATTGGATTTCTTTAGTAACCTATTCAAATCATTGACTCTTTCCATTGTGATTCTTAGTGTTAAAAGTGCACGTTGCTTAATCATAGGCTGAGTTGCACAAAAAAATGTCAATTTGGAATGTACACCCTCCACCCTTCCTCCCCCCTCTATGAAATTTAAAAAATATCAGACAACTAAAATTGCTTCTCACTATTGGAATCCAAAAAAATGACCAGGAAATGTTTCACTTGTCCTAACAAAACTTGTACAAAACAAAATGCACACAGCATAACTAACATTTACTTAAAAAAAAAAAAAAGCAAATGAACATGTCCATTACTGGTACCTGAGATCT
>XR_005095104.1 PREDICTED: Pollicipes pollicipes uncharacterized LOC119106218 (LOC119106218), ncRNA 
AAGAAATGAACTTCAACTGCCTGATCTGTGGAACCAGATGCAAGCTTCACAAGAGCCAGCTTAGTTCCAGGCTGGGAGAGTGGCAACAGGAGTGGTCCTCCAAGGAAGCTGATCAGGGACTCGTTTGGATACTGGATCTGGATCTGAACTGCTTGGACGAGGAGCAGTGCCTGTGTCCAAAGTGCTCACAACTCTTGCGTGATCTTCGGAGCTATGAAGCTAAGGTCACCGAAATCCGAACTGAGCTCATTCAGAGACATGAGGGTTGCATGCATACAGACACTCCAGGATCTGTAGACATCACTGTCACAGAAGCGTCTGTGAGGCATAAGCCGAACTCGGCGAGGCCAGAGCCGGAGCTGGAGCTAGAGCCAGAACCAGATCCAGAGCCGGAGCCAGAGCCAGATCCGGAGCCAGAACCAGAGCCAGAGCCAGCGCCCTGCCTGCGGCGAAGCTCTCGTCGTTGTGGACGACCGCCGGCGCCGGG
>XM_024031699.1 PREDICTED: Quercus suber uncharacterized LOC111999568 (LOC111999568), partial mRNA 
AGTGCAGACCTGCGTTGGAAGCCACCTGACTTGGGTGTCTATAAAGTCAACTTTGATGGGGCTTTATTTATGGATCAGAGGTGTGCTGGTTTAGGGGTGGTTGTTAGGGATTCAGCTGGGCTTGTTATTGCTGCTTTAAGCCAGAGAGTGAGGCTGCCAGGATCGGTTGATGTGGTGGAGGCCTTGGCAGCTCGTAGGGCAATGTGTTTTGCTCAGGAACTTAGCCTTCATCATGTGGTGATTGAAGGGGACTCTTTGCGAGTTATTCAAGCCATTAACAACACTAGGCCAGTGCAGACTTTGTATGGACACATTATTGACGAAATTAGACTTTTATCTTCGTCAGCTAATTGTAGTTTTTCGCATTTTAATCGGAATGGCAATAAGTTAGCTCATGCCCTTGCTAGACGAGCAATTTTATCTGCTGATACTGATGTGTGGATAGAAGAACTTCTATAG
>XR_001602060.1 PREDICTED: Miniopterus natalensis uncharacterized LOC107525510 (LOC107525510), ncRNA 
TCACGGGCAGCGGGAGTAAAACCGCGGGCGCTGGAAGGGGCAGAGTGGTGAGGGCTTCTGAAGGCGCAGCCGCGCTCCCCGCGGCCCGGCTGAGCGTCCACCAGGAGCTCGCGCCAGGCCTTCCCGGCTGGGCCGGCCGAGGGCAGCCAGAGCTGTGTGATGACCCGGTTCCAGCTCACACCGCCTCGTGCGCCCGGTGTCGGTGACTGAGCAGCTGCCACAGGGCTTCCCAGTTCTGGAGGCTGGAAGTCCAAGATCAAGTGTTGGCAGAGTTGGTCTCTGCTCACTCTAGCGAAGGTTAGCCACCCTGTCATGAGGACATTCAGCACCCCCTTGAGAAGTCCATGTGTGCCAATGTCCATGTGTGCCAACGTCCACGTGGAAAGGAGCTAATTCACCAGCAACAACTTTCCAGCCAGCTGCAGCTCCAATAAAGGCGAAACCACCGGCCACCCTCCCTCTGGATCTGAATGCTTTCAAGGAACTATTTATTGAGACTGAGCAAGGACTACTTTCTCTGGTTTTCAAATATGTTTAACACACCAATCAATGTGGCACCTTGTTAATCATTTCACTCAACCAATCCTCATCGAGCACCGAAATACACAGAGCACAATCCCCAACAGTGAGGTTCAAGGTGGTGAAACCCCATCACTGCCATAGGAGCTTCCTGCCCAGTGGATTCGAATTACAGAATACAATATAATCAGGTAATAATCACCAAAAACATCAGGTCTAGTTTTACTCATTTACCAAAGGCGTGAGAAAGCTGGGTGTGCCCTGGGA
>KP885581.1 Homo sapiens isolate SLS040 tRNA-Pro (trnP) gene and control region, partial sequence; mitochondrial 
ATTCTAATTTAAACTATTCTCTGTTCTTTCATGGGGAAGCAGATTTGGGTACCACCCAAGTATTGACTCACCCATCAACAACCGCTATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATAAATACTTGACCACCTGTAGTACATAAAAACCCAATCCACATCAAAACCCCCCCCCCATGCTTACAAGCAAGTACAGCAATCAACCTTCAACTATCACACATCAACTGCAACTCCAAAGCCACCCCTCACCCACTAGGATACCAACAAACCTACCCACCCTTAACAGTACATAGCACATAAAGCCATTTACCGTACATAGCACATTACAGTCAAATCCCTTCTCGTCCCCATGGATGACCCCCCTCAGATAGGGGTCCCTTGACCACCATCCTCCGTGAAATCAATATCCCGCACAAGAGTGCTACTCTCCTCGCTCCGGGCCCATAACACTTGGGGGTAGCTAAAGTGAACTGTATCCGACATCTGGTTCCTACTTCAGGGCCATAAAGCCTAAATAGCCCAC
>XR_003958643.2 PREDICTED: Taeniopygia guttata SFT2 domain containing 2 (SFT2D2), transcript variant X1, misc_RNA 
GTGGGCGCGGTGGTTGCCGGGGCTGGTAGTCCCTGGGGAGGGCAGGGCATTCCGGCCGGCCGGGCGGGGTGCGGAGCCATGGACAAGCTGAAGCGGGTGCTGAGCGGCCGCGACGCGGAGGAGCCGAGCGGCCTGGCCGAGGTTATCGATGCGACTTCCTTAGGTTGGGGCACCCGAGTGAAAGGTTTCATTGCGTGTTTTGCGATCGGATGTCTGTGCTCGATCTTGGGTAGTTGTCTGCTATGGATACCAAAGAAAGGGCTGGTATTCTTTGCGGTGTTTTATACCCTGGGGAATATTGCATCCATTGGGAGCACCATGTTTCTTATGGGACCAATGAAACAATTGAAGCGGATGTTTGAGCCCACACGTTTGATTGCTACTATTGTTATGCTATTGTGCCTCATACTAACACTGTGTTCTGCTTTCTGGTGGCGTAAGGCAGGACTCGCGCTGCTTTTCTGCATCTTACAGTTTTTTGCCATGGCATGGTACAGCATTTCCTTCATACCATATGCGAGGTTGGAAAGATGGAAAGATGTGTCAGTGGTGAACTCTGCCTTCTGCTACATACAACATAAATTGCTCTTAGGCTGAACTCTTAGAGTTGAAACAACCTTCCCCATGCTGAGAATAGTAATTGGGCTGTTCCCACTAACCAACTACAGCTCCTTCAGTTAGAGTCTGCACCAGCATGAATGCAATTTCCATGCATTGTTTCAGTCTGGAAATGAAACAATTTTCATTAATGG
>KJ543947.1 Bacterium AM0179 16S ribosomal RNA gene, partial sequence 
TACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGAGAAGAACGTTGGTGAGAGTGGAAAGCTCATCAAGTGACGGTAACTACCCAGAAAGGGACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTCCCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGTGGTTTATTAAGTCTGGTGTAAAAGGCAGTGGCTCAACCATTGTATGCATTGGAAACTGGTAGACTTGAGTGCAGGAGAGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCCTGTAACTGACACTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGATGTAGGGAGCTATAAGTTCTCTGTATCGCAGCTAACGCAATAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATACTCGTGCTATTCCTAGAGATAGGAAGTTCCTTCGGGACACGGGATACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATTGTTAGTTGCCATCATTAAGTTGGGCACTCTAACGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGATGGTACAACGAGTCGCGAGACAGTGATGTTTAGCTAATCTCTTAAAACCATTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGG
>XM_007779277.1 Coniosporium apollinis CBS 100218 hypothetical protein partial mRNA 
ATGTCGGGAATCAAATCCGCCGCTGCCGTAGGACTTACTCTCCTTGCCAATCTTGTTTTGGCCCAAGAAGTTATCATCAACGGTGTAGTCCAACAAGATGTCTTCTTCTACGGTCAGAGTCCACCGGTCTATCCATCACCTGATGCTGAGGGTGACGGCCGCTGGGGCGACGCCTTGTCAAGCGCTCGGGCGATCGTTGCTCAAATGACACTTGAGGAAAAGGTGAACATCACCGGAGGGTTCTCTAACACCACGAATGGATGCGGTGGAAACATCCCGGCCATCGAACGCCTGAACTTTCCTGGAATGTGCTTGCAGGATGGCCCGAATGGTGTGAGAGAGACTGATTTCGTCAATGGCTACGCTGTGGGCATTCACGTTGGTGCAAGCTGGAATCGGAATCTGACTTACGCGCGCGGTTCTGCGATCGGTGGCGAATTCAGAAGGAAAGGTGCCACAATCGCCTTAGGCCCTATGGTCGGACCGTTGGGAAGGATTGCTCTTGGTGGTCGCAACTGGGAGGGATTCAGCAACGATCCCTACATCAGCGGTATCCTTGCTGCTGAAACAGTTAGGGGAATCCAAGACAGAGGCGTAATTGCTTCCACCAAGCACTTTGTTGGAAACGAGCAAGAGCTTCTGCGAAACCCCCGCCCAGATCTCAGCAACCGCAACAAGACTATTGAAACTTCGTCTTCGAACATGGACGATGCGACGATGCACGAACTATACATGTGGCCTTTCGCGGACGCTGTACACGCTGGTACAGGCAGCATTATGTGCGCATACCAGCGCCTTAATAACAGTTATAGCTGCCACAATAGCAAAGCTCTGAACGGTCTTCTAAAGACCGAGTTAGGCTTTCCAGGTTTCGTGCTGAGCGACTGGGGTGCTCAACACACTGGCATTGCCAGCGCATTGGGCGGTCTCGACATGGTCATGCCTTTTGGATTCCGCTTCTGGGGCCCCAATCTCACTGAAGCAGTCCGGAATGGCTCGGTTCCAGAGTCCCAAATCAACAACATGGCAACGAGAATCATGGCAGCATGGTACTTTGTGGGCCAGGACAGTCCAGACACGCCTCCTTTAGCAGTTGGCATGGCACGCAGCCACTTGCGTCCTCACACTGTGGTCGATGCCCGAGATCCCGCGGACGACGCCGTCAACCTCCAGGGAGCTATTGAGGGCCATGTCCTTGTCAAGAACATCGACAACGCCCTACCTCTACGAAATCTCAGCATGATGTCAATCTTTGGCTACGATGCCAAGAACCCTAACTACAACAGTCCGGCAGAAGGATTCAGTGCTTGGTCCCTGGGTCTCCAATCCCAGAATTACCGCTCTATAACCGGAGGCGGCTCAGGAGCTATTACCCCTTGGTATATTGACGCACCGTTCGAGGCCCTGTCCCGACGCACACGTGCAGACAGAACCGCCCTGTTTTGGGATTTTGACACCAACGGAGCGAACAGCACGATTGACACCAACAGCGAGGCCTGTCTCGTGTTTATAAATTCAGCCGCTTCTGAAGGTGTTGATCGGCCATCCCTACGCGACGACTTCTCGGATGCATTGGTAGAGAACATTGCCTCCTCTTGCAACAACACAATTGTTGTGATCCATAACGCTGGCGTCCGTCTAGTTGACCGTTGGATCGACCATCCTAACGTCACAGCACTCATCTTCGCTCAACTGCCGGGTCAAAACTCAGGCGAGGCGATCACGCAGATTCTCTATGGCGACGTTTCCCCCAGCGGCAAGCTTACTTACTCTATACCACGGAACGAATCTGACTACGGGTCGCTACTGGCACCCGTCAATTACACTGGCTGGGACCGCTACTTCCCGCAGGACAACTTCACAGAAGGTGTCTACATCGACTATCGCGCTTTTGATGCAGCAGGCATTGAGCCCAGGTATGAGTTTGGCTTTGGCCTCACCTACACAACCTTCGAGTACTCTGATCTCAATATTCAAGTTACAAGCGATGGGAACCTCTCGGAATACCCTGTTGGGCCAGTAATTCCCGGAGGGGAGGCGGACTTATGGGACAACCTAGCCACCGTGACAGCGGAGGTCACCAATACCGGCGATGTAGAGGCGGCCGAGGTGGCCCAGCTGTACCTTGGGATTCCAGTTGCCGGCCAGCCTGTTAGGCAGCTGCGGGGCTTTGACAAGGTGATGATCGCGCCGGGTGAGACGAGACACGTTCAGTTTGATCTGAGACGGCGCGACTTAAGCGTGTGGGATACTGGTGCGCAACAGTGGAGACTTACCCTCGGAACCGAATATCGTGTTTGGGTGGGAGCGAGCTCCAGGATTCTGCCACTGAATGGAACCATGGTCTTGTAA
>XM_034834249.1 PREDICTED: Vitis riparia plasmodesmata-located protein 2 (LOC117917828), transcript variant X2, mRNA 
GAAACCCAAAAACAAAAATCACCCAAAAAAAGGTTGGAACCCCACAACGCTCCTGAGCTTTTCTCAACCAGAATCCATCACCCTTGCCTTGATTTCAACCAAAACCCATTTCTAGAGACCACCAAACCCTGCAAAAACCATTCATGCTCTGAACGATTTCATGTTTCCTAGATGGGTTTGCCGCCAAAACCCCTGTCTCTCCTCTCCCTCTCTCTGACTTTCCTCACAATTCTTGGCTTCTTCCCATCTGCCAAACCCTCCACAGATTTCACAAACTTGGTGTATAAAGGCTGTGCCGACCAAAAATTCCAAGACCCATCAGGGGTTTACTCCAAAACCCTCAAACCCCTGTTTGATTCTCTGGTTTCACAGTCCTCCACAAAGAATTTCTCCACAGCCACCTCTGGTGAGGGCCAATCTTCCATCACAGGGCTGTACCAATGTAGAGGTGATCTCTCCAATTCCCAATGCTACACCTGTGTGGGAAAACTCCCAGGCCTCTGCACCAAGCTCTGTGGCAAAGCTATAGCCGCCAGAGTTCAACTCAGTGGGTGCTACATGAGGTATGAGCTTGCTGGGTTCAAGCAGGTCACTGCAACTGAGCTTCTGTACAAGGTGTGTGGATCAACTCAGGCAAGTCAGAGTGGGTTTGAAGAGAAGAGAGACACTACTTTTGGGATGATGGAGAAGGGAGTTGAAGGTGGGGATGGATTCTACACTGGGACATATGAGTCTGTGTATGTGTTGGGGCAGTGTGAGGGGGACATGGGAGGTAGTGATTGTGGAGATTGTGTGAACACTGCAGTTGAGAGAGTCAAAACCGAGTGTGGTGACTCAATTTCCGGGCAGATTTATTTGCACAAATGCTACATCAGCTATAGTTACTATCCAACAGGGGTGCCCAGCCAATCTTCAGCAGAATCAGGTCAGAGTACAGAGAAGACAGTAGCACTTGTTGTGGGAGGGGTAGCAGCTCTAGGGTTTGGAATTGCTTGTTTGATGTTTGTTAGAACAGCTTTCAAGAAACATCATAGTAATTACTGAAAATTTTGAGATATGGGTCTAGAAGATGCCACTGTTTTCTGTAGTGGGTCTCCTCTTTTCTTTGATAAAGAGGGTGGGAAGAGGGTGGTAAAGTTAGGTGAAGTATTCATTGAATCATTGGGAGTGTTGTAAATGGGAAAGGAGAGAGGGTGGGAAGAGATGTTTTTTCTCTCCTTACTTCACACTTAGACTCTACTAGTATTTTGTCATTTTCCATTTTCCTTGTGCATTACATTCCCACACATGAAATTGATACATATGATTCAAAGTATTTTGCTTTCCAATGAAGTTTCCCACTTTATCACTTTATCA
>LN615563.1 Uncultured Glomus partial 18S rRNA gene, isolate ACyCA VTX00247, clone GAMF284 
AGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGGGGTTAGTAGGTTGGTCATGCCTCTGGTATGTACTGGTCTCACTGATTCCTCCTTCCTGACGAGCCTTAATGCCATTAATTTGGTGTTTCGGGAAATTTGGACCGTTACTTTGAAAAAATTAGAGTGTTTAAAGCAGGCTCACGCTTGAATACATTAGCATGGAATAACGAAATAGGACGTTTGATTTTATTTTGTTGGTTTCTAGGATCGACGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATTGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGATGATGTTAATTTTTTAATGACTCATTCGGCACCTTA
>XM_026558135.1 PREDICTED: Papaver somniferum 60S acidic ribosomal protein P0-like (LOC113309662), mRNA 
TGCTCATCACTTTCTCTCTCAACCAACTCTTTCTCTCTCCTCTCTGAAATAGTGAAAAAAAAATCTTTACAGTTTTTTCGTCATGGAAGAGTAATCTCTAGGCAAACCTTCGGGTGATTAACGGGTCAAGAGCTGCAAGGAGCGGATCTGAATGTTTTCGGATTGAAAAAGTGGTGATGAAATTTTAGGATTTTTTAATCTTGTTTTTCACTTTTCTTGCTTTGTTCTTAATCCTCTCTTCTTTCCGGGTTTGAGAAATACAAGCTATGGTTCCAATTGACACAGGTATTCCCTTGGATTGTTGTTCTTTTTGGGTTTTGTATTGATTCTTCTCACTTCGGGTAAGTGAAATACAAGTTGTGGTTCCAATCGAGGACCGTGGCTCCTTTTTATGATCTTGATTGAATCTTTTCTTCCTTTCTTTGGGTTTTTGGGGGTACTGTTGTATTAGGTACAACAACAACAGGGGATCTAAGATTTCTCTTTCAAATTTCTTTTGTGTTCTGATTAGATTTGCCACTGCATATAATTATCAAGCTGTTTTTCTCATTCCTCCCCTTTTAGGTTGTTCTCGGTATGGTAGTGATAAAAAAAAAACGAGGATATAGAGGGTTGAATCTACCTTTGGTCTGATTCTCTTAAGCTTGCAATTATTCTTTTTTTTTCTTTCATGTGTAACTGGATTGTAGACCAATTAAGTAGTTGTCGGTATCCCAATTGAGATTGGGTATGTGGATTCGAATTTTGCAATCTAATTTCCTTTGCCGTAAATACCAATGTTGATTGGGTCTGTTTATTTTTGTTGCCTCTAAGCTGTTTGGTGAAAGTCCTGAACTGTCTTTCTCCTGTATTTGGCCTCTCTTGCATCCTATCTTGAATGATTCATTCTAAAATTTTAGGTTTCTTACATCAGTTTGGTCAAATTTTCGTTTTGAAAACTACTTTCAATCTTTAACCTTTGCCTTAAAATTAGTATAAATTTATCAGTTAAATTTTCTTTGGTGTTGTTAAACACTTGGGTTGACAATTTTGTCCCAAAAGTGGTAGGTATCTTAAAATAAGTAATTCACAACTATTATTACCTGTTCAGGTGTATGTGCAGATGTTCGTGTTAATTTTTAAAAGTCATCTCCGTTAGGTGTGCTTTATGAACCAAGTGTATGTGCATTGGGTTTTAAAGGAATCGTGTTTAATTTCGAAATTTTCTGATCTTAAAAGTGCTTTCATAGTTCTTAGATGAATAATAGGGCCTAGCACTTCGGAAAAGGCGAAGTCACTTATTAAAAAACAATTTCTTCATTTTTATGCACTTTCACTTATAGTAGTGGTTTCTTTTTAAGATGATTAAGAGTTCTGTTATGTCTTTTATTAGAAAATTTTAGAAAATGGTTTTGATCATTCGTTTGGGTTAATTTTAAAAATCCATGTTGGTCTAAACATATTCAAGAAATCTAAGGAGTTAATATTGGTAGGATCAAAGTCGTTGTTCTTACTAAGTAAATTGTTAAAAGTAAAATTGATAGGTTAATTTTTGGGAGGCTCGTTGATCTGTTTCTGGTTATAAGATGGTTTTAAGGGTATTCACATATAGTTTCTTGGAAGATTAAGGACTAGGATATGATTAATGAGAATTATCTAGCGATAAGGTGTTTCCATCTCTAGTCAATTTTGTTCTATGTATTGTTAAACTTTCGAGGCATGTCTTCGCCTTTGCTTGATTATTTTCCATTAAGAACCAGTGGTAGCCCCATTGTTTTAGTACCCTTATCTCTGCGTCTTTACAAATTAATTTGAGTAAAATCATCATCACTTTTTTGCGAGTCATAAAATCATATCTAAACCTCCGCTCCTCTGTCCCGATAAAACCCAAAGGTAAGCTGACGTCATCTCTTGATTTCTCTCCTTCTTTTATCTCCCGTCTTAACCTTCTTTTATTTCGTCGTATCTTCTTATATTCAAGATATTTTGTGTATGTTTCTGGTAATTCAATTTGAAGTTATTTCTACTGTTTCAACAAACAAGATTTTACAGCAGGAATACAGGTAGCAAAAGCTTGAGGGATTTTTCCACTCAAGCTTTTGACTTACATCTTTTTTTTTAAGATAGTCTTTTGTTTTATCTTGAGTTACGTTTTTACAGAATTCTTATAATCTATTGCATACATGATTAAATCTTAGTTGTTGCTTTAATTCCTAAAACATATTTAGCTTGTTTTTTAGCTTAGGATTATAAGCTGAGGTTTCAATACTTTTTCCTCAACATTCCCTGATGTTTTTAAAACCCCTGGTTATCTTAAAATCAAGCATATCATTAGTTTATATTATGTTTTCACTCATAATTTGTTGTTGTTATATTATATTATTTTGTTTTCTAATACAGAACTTGCTAATGAAAATATTGGCCTGGAACACACAAGGGTGTGGTAAAAAAAAACTAGGCAACAGCTAAACCACTTAGTAAATACTAAAAAAAACAGATGTTCTTTTTTTTATCTGAAACCCAATCTCAAAGGTGCTTAATGAAGCATGTGCTTAATTTTTCCCAAACACCCACATTGTTGACCCAGATGGAATCGCTGGGGGCTAGCAATTGCTTGGGTAGATGGTTTTCATTTTGAAGTGGTTCAATGGAACCTTAACATGATTAATATCATTGTTAAAAACAATTTTCATTCAAATGAATGGCTTCTAACTTGTTTTTATGGTTCTCCGAAGAATGAATTTAAACTAGAAATAATGGGTTACTTAGAGAATATTGCTAATCAAATTAATATGATTTCAGTGTCATGGTTAGTAATAGGAGACCTGAACATTATCTTCAACAGTGATGAAAAAGAAGGATGTCTTCCTTTCAATAGGAAAAAACTGGAACCAATCTTAAATTTAATCCAAAGAACTGGATTAGAGGATATAGGTTTCCGAGGTAATATTTTTACCTGGAATAACAAAAGAGAAGGGCATGCAAACATTAAGCAAAGGCTTGATAGGGGCTTAGCTAATGCAGAGTGGATTCTTGAATTCACAGATGCAACTGCAGAGTGGATTCTTGAATTCACAGATGCAACTCTTGAAAATTTGGTGGAAATAGGATCTGATCATAGTCATATCTGTCTTAATCTCATCTCTTGTAGTTTACATTTAGTTCCAACTTTTAAGTTCTATGACACCTGGCTAAAAGAACCTTCTTGTATAAAGGTTATAAGACAATCCTGGAAATGTTTTTCTGATTCTCCGGCTTTGAAATAATTTGGGAGAAAATTTGAAATTTTGGAAAAAAAAATATGTTTAGAAAGCCAAATAAAAAAATTAAGCATATAATCAAACGAATTGAGAATCTCTCGGCTAAAACATCTCAGGGGAGTATTAGTGAGCTAATAAACTAAAAAACTTTGGAATTAGAGGCTTTGTACGACACTCAAGAAGAAATAGCTAAACAACAATCTAGGAACAACACAATTTCCTAAGGAGAAAGAAACACAAAAATTTCATGTCACAACTTTAAAAAGAAGAAATAGGAACAATATAGATTGCATTCAGGATAGAGATGATAAAGTCGTTACTTCTAGACATGAAATTGAAGATGTTCTCACATCTTACTTTTCTGATCTTTTTTCTGAAAACTCTGTTAATACAGAGGATGAAATTTTTAAACATATTATGTAACACCCCAATTTTCGGGCCCGGATCCTGCTCTGATACCAAACTGTAACACCCCGAATCCTTCCCGGATCCCATGCCTGAAAATCGGGGTGTTACATATTAAGCCTTGCATCTCTTTGGAAGAAAATATAGCTCTAACTGCTATCCTAACTTCAGAAGAAATTTGCGATGTAGTGAAAAAGCTTAAGTCTAATAAAGCACCTGGGCCCAATGGCTTCACAGTGAGCTTCTTCAAACAAAACTGGGAAACTGTAGGAACACAATTGATAACAGTAGTACAAGATTTTTTTCAAAACTAAACAACTACATGTGGATCTAAATAAGACTTTCTTGTTTTTAATTCCAAAAATTAAAAATCCCAAATCCCTTTCAGATTTTAGGTCAATTGGACTTTGTAACACTCTTTACAAAGTCATAGCTAAATTAATGGCTAACAGGTTCAAAATATCTTTAGGAAAAATCATTTCCCCCTTCAATCTGCCTTCCTCTCTTCTAGACAAATCTCAGACAATATTATTGTTGCTCATGAGATTGTCCATTCAATGAAGAAAAGTAAAAAGAAAACAGGAAACATAGGAGCAAAAATTGACATGTCTAATGCATTTGATAGAGTTAATTGAAACTTCTTGATAAAAACTCTAGAGGCCTTTGGTTTCTCTAGCCATTAGAGTGAATTGATTTATCAATGTATCTCTACTTCTTCCATATTTATTTTACTAAATGGGAACCCCTGTAAGGAGTTTAAACCAACTAGGGGAATAAGACAGGGGGATCCTTTATCTCCATATTTATTCATCCTATGTATGGAGGTTCTTTCTAGACTCCTCTGTCATTTGGAATCTGTGAAACAGGTAATAGGTATCAAACTCATCCCAAAATCAACACTTATTTTTCATTTATTCTTTGCAGATGACCTTTTGCTTTTCACTAGAGCTGATTTAGGCAGCTGTAAAAATCTTCTGGAAGCTATTAATCTTTTTAGTAAAGCCTCTAGGCAAGTAATAAATTTTTCAAAATCTGGTCTGTTTTTTTAGTAAAAAAGTTCATAATAAACACCAAGGTATTATTTCTAGGTTAATGAAAATCAAAAAAATAAATATCAAAGACACCCATTTAGGAGTACCTTTATTCATAGATAGATCAAAACTTAAGTTCTTTGATAGCATTATAGAAAAAATGGAACAGAGAGTTAAGAACTGGCTAGCAAAAATCTTATCCCAACCAAGTTAGATTGTTCTAAATAAATCTGTTCTTTCTTGTATGCTAATTTTTAGCATGGGATGTTTTGTTTTGCCTAAAAAAAATACCAAAAGAATGAATGATATTCAGACAGATTTCTGGTGGGGAAAACATACTAATTCCAAAGGTATTTACATAAAATCTTTTGATTTCTTATGTAAACCAATTGACCAAGGGGGTTTAGGTTTTAAAGAGGATAACAAAGTGAATCAGGCTATGATTAGCAGGATATCCTGGAGATTGGTGAGTAATCCTGATAATTTATGGGATCAAATTTTAAAAAGAAAATACTTTAAAAAACAGGAGCTCTTCAATCCAAAAAGAAATCAACAACTTGTTAGATTTGGAAATGCATTTTACAAGGTATTGAGCATATCAAAAAGTATAGTGTTTGGGATGTAGGAAATGGATTCCCTATATATTTGATGATAAATGGTTACCAAACATGGAACAAACTCTAGCTAGTTTTGTCCCTAGAAACTCTAATATAACACTTGTGTCTGATTTGATAAATCATGACACAAAAAAGTGGAATGATTCTTTGTTACTTTCAACTTTTGATAGATCTTTGGTCAGTGAAATAATGAACATAAGATTATACACACAAAGTGATGAAAAACTGAAAAAAGATAAATTGAGATGGTTACTTGCTAGAAACGGTGAATTTTCTGTTAAATCTTTATATGCAAAGTTACTGAATCCATCTAACACCATCCCTGACTAAACAAAGAAGTTTTGGAAAGGATTGTGGAGCATTAATACTTCGCAGAGAATCAAAATGTTTATTTGGAAATGACTGCAAGATGCATTACCTACTAAACAAAAGTTAAAATCAGTGGACAACAAATGCATTTTCTGTAAGACTGAGGTGGAATATACTTTTCATCTGTTCTTTGACTGTGACTATGCTAAAGCTGTGTGGAATCTACAACCAATGGAAGTTCAGAGAGTACCTCACAACTTAGTTTCTCTTAATACTTCTTTCTTGCATAAATATAATGGATGGTTAGCAGGAGATTCGAATTCCATCTCAATGGCACTAGCTGCAACAAAGTGTTGGTTTATTTGGAAAGAAAGGTGTCTGAGGATATTTGAAGATAAATCTATAACACCAATTCAGTTATCACTAGATATATCAAGACACTGTGAGTACTGGCATCCAATGACTTTGAACAGTTTGAATTAAACACAAGACAGAACTATCAAACCAAAACCACAATGGACCTTCCCAATCACAAATACTTTCAAACTAAATTGTGATGCTTCTTGGTTGTCTGAAAAAAAATATAGGCTTTGGTTTTGTTCTTCATAATTGGACAGGAACCTTCAAGGGGGCAGAATCAGGCATCTTCAGGTCTTCCACTGCGGAAGAAGCAGAAGCTATAGTTCTCCTTCAAGCAGCTAAATGGGCTAAAATACATAACATACAACATCTGGTCGTAGAAGGAGATAACAGGGCAACAATTAAGTATTTACAGGGAAAGGAATCAACTATCCAATGGCAAAGCATTGTAATACTAGATGAAGTTAAGAAGCTAGTAGAACAAATGGTATCTTTTTTGGGTTTCCGGTACGTAGACAGGTGAGCAAACAAAGTGGCAGACCAGTTGGCAAAGAAAGGAAGAAAAGGTAACATTGCAATTTCTTGGTTAGACCAAGCTCCCTTTATTTTGATTCCAACAATTTCTTTTGACATGGTCAAAGCTTATGAATCTTGTAATATAAGTACAAACCTTGTATCAATTCAAAAGAAGGTTAATCTTACATATTCAGTCATCAACAAGACAACTCTATCTGAGTTCGCTCCTTATGAGACTGAATCAAATGCTTAGCCTTCTTTGTTTCCAGTAATATATTTCTATTTTCAAAAGAAAGGAAGTCGTTGCTCCTCAGTCTCCCTTCGGGCAGGAGCGGAAGCACAACCATGCTTCCCCTGGCTGGAGCCACCCACAAAGGCCCAAAACACATTTCTTTGTGTCTAATTCATGTTGGACCACAAAAACAGTAGGAACAGTATGGTCAAGCTCAGGGTGAAAATATGGTCAAGCCTGGCTGCCTGGGGTAAGGAAGGTTTCTGGTTCTGCCACTGCCTCCAGCTCTAGTTTAGGTTCATCGGCACATCAAGTTAGATTCATCGGCACATTAAGAAAGGTAACTTAGCTGGTGCCGCGTTGGAATTGGTGCGCCTTTTGTTTTTTGACGCCGCAAAGGAAAGTATTTAGGAATTCTGTTTCTAGAAAGAGGGTATATATGGAAATCGCACAATGAGATATTCAATGCATCTCGCATTATAAATAGAACAATAGAGTAAACCCCGTTACTTGCATAACACACGTAAAGATTATTTTAGGGTTTCATTAGGGTTTCAAAGCAGCAGCTCAAAACATGGCACCCAAACCTTCCAAGGCTGAGAAGAAGATCGCTTATGATAAGAAACTCTGCAAGTTTCTTGATGAATATGGTCAGATCTTAGTTGTTGCTGCAGACAATGTTGGATCGAACCAGTTACAAAACATCAGGAAAGGTTTGCGTGGCGATTCAGTTGTTTTGATGGGAAAAAACACTATGATGAAGAGAACTGTTCGTCTTCATGCTGAGAAAACTGGAAACAATGATTTCCTTAACCTCATTCCTCTTCTTGTGGGAAACGTTGGGTTGATCTTTACTAAAGGAGATTTGAAGGAAGTTAGTGAAGAAGTCAGCAAATATAAGGTTGGAGCCCCTGCTCGTGTTGGACTTGTTGCTCCTATCGATGTTATTGTACCACCAGGCAACACAGGATTGGATCCATCACAAACATCCTTTTTCCAGGTTCTCAACATTCCAACCAAGATTAACAAGGGAACCGTCGAAATTACAATCCCAGTTGAGCTTATCAAGAAAGGTGACAAAGTGGGTTCTTCCGAAGCTGCCTTGCTATCAAAGCTAGGCATAAGGCCGTTTTCTTATGGTCTCGCTGTACTCTCGGTGTATGACAATGGTTCAGTCTTTAACCCAGAGGTGCTTGACCTTACTGATGACGATCTAGTTGAGAAGTTTTATGCCGGTGTATCGATGGTTACTTCACTCTCATTGGCTCTCTCGTACCCTACCCTTGCTGCTGTACCTCACATGTTTGTCAATGGATACAAGAATGTTCTTTCTGTCGCTGTTGCCAGTGAATACTCCTTCTCTTATGCTGATAAAGTGAAAGAATACTTGAAGGATCCAAGCAAGTTTGCAGTTGCAGCTGCTCCAGTTGCTGCGGCTGCTGCTTCTGGTGGTGCACCAGCTGCTGCTTCAAAGGCAGAAGAGAAGAAGCCAGAGCCTGAAGAAGAGTCTGATGAGGATATTGGGGGGCTGTTTGGTGACGACGATTGAGAAACTGTTCCCTGATGATTTTTCCTGCTTGCATTTGCATCTTATTATCTTTAAACTCATCTTTAGTGTTTATACAGTTTGTTAGAACTATCACCCATAATCAGTGTTTTGTTGATATATTGCCATTTTATTGGGTGCGGTTGTTTTTCACTCGTATGGTAGGAGAAATAAAATCATTTTGGAACTCAGAAATCTGTGTGTGTGTTTTGTTCTACCTTTTCTTGTGTTCAATGTGAGTATTATTCGAAGGGAGTACAAGTTTTTACA
>XM_034856521.1 PREDICTED: Etheostoma cragini testis associated actin remodelling kinase 1 (tesk1), transcript variant X2, mRNA 
TAATAGGCCGCAGCGTCACTGAGGCAGCTCTGTGCGCACTGGAAACCCGGAATTCAATTGGTGGAACCAGGAGGGAAGCCCCGGCCTTTTCTACTGCAGAAGGAGCAGTTTGAAAGAAACCGTGAGAGAGACGCCGCTGCCAAGACAGCAGCAGGAGCAGTCTGCGCAGTTTAGAAAACGGCACAGCCTAATCTGCTGCACGGCATGATGGACTTTACCAAAACTGCGTACTGACTCTGCAAGATGCAACGCTGCAGCTTCGTAGTTCGTTAGACACAGATAGAAACAAGCCCGTTCCGGACGTGTGCAGGAATTTGACAGAGGAATTAGGCCTAACCGGTCGCTGACCACAGCTGCGACATTTGGTTTTCCCACTGAGAGTTTATCACTCCTCCCCTCCGTAGAGCCCTGCTCTGTGGCCTTGTAGCGGACATGGGAAATGTAAACAGTGGTCGGGCTGGATTTTAAACTACGCACACGTCATACGTCCTCCTCTCGCCTCCACCTCCTTCTCCTCCCGGGGCGCCTGAGATGGAGATGGAGACGGAGAGGGTCGAGCAGGGAGAGGCAGAGCTGCCCATGCACAGCGTCCACGGAACCAACCGGATCAGACCGTCCTCTTACCGGGCACTGCGCAGCGCCGTGTCCAGCCTGGCCCGTCTAGATGACTTCAACTGCGAGAAGATCGGCGCTGGGTTCTTCTCTGAGGTGTTCAAGGTGCAGCATCGAGTGTCGGGCCAGGTAATGGCTCTGAAGATGAACATCCTGGCCAGCAACAGAGCCAACATGCTCAGGGAGGTCCAGCTCATGAACCGACTGGCGCACCCCAACATACTCAGGTTCATAGGAGTGTGTGTCCACGAGGGACAGCTCCACGCCCTCACAGAGTACATTAACGGTGGCAACTTGGAGCAGCTGTTGGGGAGTGACGTGTACCTGTCGTGGAGTGTGCGGATGATCCTGGCCCTGGACATCGCCCGGGGACTGCAGTACCTGCACAGCAAGGGCATCTTCCACAGGGACCTCACCTCCAAGAACTGCCTGGTGCGCTGGGAGGGCTGTGTGTGCTCAGCCGTGGTTGGAGACTTTGGCCTGGCGGAGAAAATACCAGATTACAGTGAGGAGGAACAGGAGCCTCTGGCGGTCGTCGGCTCTCCCTACTGGATGGCCCCGGAGGTGCTCAGAGGAGAGGTGTATAATGAGAAGGTGGATGTGTTTGCATACGGGATTATCTTGTGTGAGATCATTGCGAGGATACAGGCCGACCCCGACATCCTACCACGCACTGAGGACTTTGGTTTGGATGTGGACACCTTTCAACAGATGGTGGGAGATTGTCCTCCTGACTTCCTGGAACTGGCCATTGCCTGCTGTAATATGAATTCAAAGCTCCGTCCATCCTTCTCCCAAATTGTGGTAGAGCTGGAGAGGAGACAGGCTGAAAGGAAACAGAAGGATGAACCATCAGTCAAAGCCGTTTCTCCAGTCATTGGTCCTCTACGAAGACGATCCCTCTGCCTCCTGTCAGATCCTCGACTCTCCCGTAGCAAATCCGACATGCTCCACCCCCCAAACATGTCCCCCTCTGTTACTACGGCAATTCCTGCTCGGGTCAACCCCTTCTCTCAGAGGGAGGACCTTAAGGGAGGCAAGATCAAGCTGTTCGACACTCCCAGCAAGTCTGTCATCTCCCTTACCTTCACCCTGCCTCCTCCACCTGACTGCGATGACCCCTCTGTCTCCGAGTCTGACAGCAGTGAGGTACCAAGGAGACACAGGCGCTGCCACTCGCTGCCTTGTACGCCTCCTCCGCACCTCACATCAGCGCCGAACACAATCCTTACAGAGCAGGAGTCCATGTCCAAGATGGACACTGTAAATGGAGAGACAAACCGAGTGAGTGAAGAGGAGAGATTGTTAGAAGAGATGGCAACTATGGAAGGGAATGGAACTGATTCAGGCCTTCCTCTTTCCATTGAGCCCCTGTCGCTGGACCAAGAGAGGGAGGAGGAGGAGGACAACGAGGAAGAGGAGCCCATGGACTGTACCAGCTCCCCAGACACACAAGACAGCACATCATCTCCTTATTCCAAACTCTCCTTTCCTCCGTCCGACTCCTCAACTCCCATCCAACCCTCCACTCCTCCCTTCTCAAATGGCTGGGGGTCAGCAATCTCCAACGGGCCTCCTTGCCTACCTCCCCTCTCTCATTTGGACAACAACAACGTGGTCATCGGTCGACCCTTGGGATGGAGCGCCGCCACCACCACCACCAGTGCTCCCACAGCAAGAACCACCAACAACAACGGCTACCACTTCCCTTCCAGCGACCCCGCTGGATCGTCCCCATTTGGCTCTGGCAGCGGACATTCTCTGGACCAGGAAGAAGTCATCTCCTGTCCCGGCTGCTGCATTGCCGGCCTTCGCTTTCCTTCGATGTGTCCCCGAGCTCCACCGCGCAGAAACCCCTACAAGAACTTGAACGGGGACCATGCAGCTTCACGTGGGCTGCTTGGTCCGGGACCCAAGGGTCTGCCGCCCTCCCCTACCACCACCACCAACCTGGAGCCAGGACTTGCCTTGCCGGAGGCACAGACATGAACCCCAGCAAACTGAAAAGATTTGTGTAAACTCTGCACCAAAAGCTCATCCCTGGAAATTAAGTGGGTCTTGGAAGAATTTGCACAGATTTTAACTCAGCAATACCCTGATTTTTTTTTTTTTTTTTTTTTCAGACAATCTTTTTGGTGCAAATCAGTTTACTAAAACACACTCCAGGTTGACTTTTTCCGTGAAAGCTGTAGGACAAGGTGCTGGTGACTTGTTGCACGTCGCCCTCTGCTGGGCTGAGGGCGACATGCTACGTCAAGAACTGTTAAGCATGGAAACACTCCAGTTTGGGGTCCATTTGGTTTGATCCTCTAAATGTGCATATGTAAAGATTCTTATGACTGATAATATTGATGATGATGCTCAAATGAGGAATGTTAAGCTTAGTTAAGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTCTGTTTTTTGTTGCTGTGTGATCTCTAATGGCCCTTCTGGTCGCCTGGTTAAGCACTTCAACTGTATTACTGAAACTATTGATGTTATTATTTTTGGGAATGAATGGTCAAAGACCTGTATAAGAGATGTACAGATTCATATTATTTAAAGGATGCATTGAATAAAAAAGATAGAAT
>XR_001760135.2 PREDICTED: Cynoglossus semilaevis uncharacterized LOC107988670 (LOC107988670), transcript variant X2, ncRNA 
AAAACTCCCCCGCTCTTTGGGGGCATGTCCAAAAGGTGCAGCCCACTTCTCCTGTGTGACTGGGGGGTGTTTCAAGAATCTGTTAAATGCAGAGAATGTTTGGAATTTCTCTTACAGAAAAGTAGAGAATTGAAAAATACATTTAAATAGAGACCTGGACTTCTGGCAGGACAGTCAGGCAGATGAACTCCAACATGATTTTGTCATTTGTACAGAATTATGCTGTAAATGATCCGGGTAAAAATCCTAGATCTGGAGTTCTAGAATGAATGTTTTTAAGCCATCGATTGTACATTGTTAACATGATGCAGCCCTACCTCGACACAGATGATTGATCACTCAGTTGATCAACTGTTTTTTGGGCAAAACGGACTGTTATCAACGTCACATTTGTGTGCACTAACGACTGTATTTGTTTTTTGCAGCACTGATGTACGGCTTCCTCGTTGGGTAACGCACACTCTCAGGGAGGCGTTCTCCAGGTAGGCAGACTGCGTTTAAGCAACAATGATTTTCTAAAGTATTCCACACCCTGTGCCTATGAGCTTGAAGGTTATACTCATTCAGCAGCAATGTTTTTCCCTTTTACTACAACAACATAGATTTCCCCAGACTCCCTGGATCGTTTCACAACAATATTAACTCTTGTTGGTGACAGACCTGATTTTTCTCCAACCTTTTTCTAACAAACACTTTTTTTATCTCTAAATAAATTTCTGAAGTCGAACATAAAGTTCCAAAACATTTTTACTTAAGGCCGAGTCTTGAGCAACTAGTCAAACTAATAAGGTGATTACTGAATGTTATTATTATGACATTTTTAATCCCTTAAAACAACTTTTGGGAGTTTGTTGCAGTCTTTTGGTTCTTCATTTGTTTATGTTAAATAGACAGAATTATGATGGTCAGTGGTCAGTTTTTTTGATTTGAGGGTTTCGTGCACTTTAAGAAGTGTACCAACTTTCTGGAAATAGGATTTGTATTGTATTCAACAGTCACACAAACAACCAAATGACTGTCCTCTTCATTTGCACTGTTGGCTGTTGTAGGTTTGGGCTCATGCCACATGAAGAGCTGTTACATCCATGAGCGGTAGAAAAGGGCGAAGTTTCCTCCCAGATCCAATCCAACAAGTGGCCAGGCCTAAATGTCAACCCGGGGGTCCTCAACCTGCGGCTCCACTACCACATAAGATAGAGATCGGCTCCTCTCGTACCTTGCTCTCTGGGACGCCAGCTCCGACAACCAGCACCAGACCACAGCCACTATTACAATCATTCCTATGAAGGGGATGGAGAGAACAGGGTGCTCAGATGGATGGATGAATCTCTGAGGAGGGAAAAAGAACAAACACACGGGACGTGGAGATGAAGGGAACAGATGAACTGATGGATTAAAACTGGAGACTTCACGGACAGTCGGAGAACACGGACATGAGCAGAGGCACGGGCAGACAGTTTGACAAAACGCTGAGAGACATTCACAACAGGGCTGTTGTAGACGAAACACATTCCAGGGCATCACTGTCACACAGAGGCTTGGACACAGACACAGTCAGGCAAGGATTCACCACTTCAGGCCACACAATAATTTCTGATATGTGCTGACAGGTCCTGTCAGTTCATATCAAACACACACACATATATATATATACTGTATATATATTCTCCTCACAATGAGAGACATATAAAGAGGTGCTCGACACACAGGAGATACAGCAGGTGTGATGTCGGGTGTTGTTATGTGTTAGTTGAGGACATGAGCAGAAACAAAGCTGGAAATAGCCAAAAGTTTAGCAAATTTCTTTTTCAGTCCTAATGATTGTAGCTACTTAAAACCTCAGTGGTGTATCTTTTAGATAACTTTTTTTTTTT
>FJ579386.1 Uncultured Methanobacteriaceae archaeon clone KR-H08-A02 16S ribosomal RNA gene, partial sequence 
GCTCAGTAACACGTGGATAACCTACCCTTAGGACCGGGATAACCCTGGGAAACTGGGGCTAATACTGGATAGATGATTTTTCCTGGAATGGTTTTTTGTTTAAATGTTTTTTCGCCTAAGGATGGGTCTGCGGCAGATTAGGTAGTTGGTTAGGTAATGGCTTACCAAGCCTATGATCTGTACGGGTTGTGAGAGCAAGAGCCCGGAGATGGAACCTGAGACAAGGTTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAACCTCCGCAATGTGAGAAATCGCGACGGGGGGATCCCAAGTGCCATTCTTAACGGGATGGCTTTTCTTAAGTGTAAAAAGCTTTTGGAATAAGAGCTGGGCAAGACCGGTGCCAGCCGCCGCGGTAACACCGGCAGCTCTAGTGGTAGCTGTTTTTATTGGGCCTAAAGCGTTCGTAGCCGGTTTGATAAGTCACTGGTGAAATCCTGTAGCTTAACTGTGGGAATTGCTGGTGATACTGTTGAACTTGAGGTCGGGAGAGGTTAGCGGTACTCCCAGGGTAGAGGTGAAATTCTGTAATCCTGGGAGGACCACCTGTGGCGAAGGCGGCTAACTGGAACGAACCTGACGGTGAGGGACGAAAGCTAGGGGCGCGAACCGGATTAGATACTCGGGTAGTCCTAGCCGTAAACGATGCGGACTTGGTGTTGGGATGGCTTTGAGCCGCTCCGGTGCCGAAGGGAAGCTGTTAAGTCCGCCGCCTGGGAAGTACGGTCGCAAGACTGAAACTTAAAGGAATTGGCGGGGGAGCAC
>XM_007564720.2 PREDICTED: Poecilia formosa hexokinase-2-like (LOC103146708), transcript variant X3, mRNA 
AGAAGATGATAAGCGGGCTGTACATGGGGGAGCTGGTGCGTCTCATCTTGGTGAAGATGGCCAGAAAGCAGCTGCTGTTCCAGGGACAGACCACGCCACAGCTTCTTACCTCTGGATGCTTCAGCACCAACTACATCTACGCCATTGAGAGCGACAAAGATGAAGAAGGCCTGGCTAGCGCCGAGAAGGCGCTCCGCAGCCTGGGCCTGGACCCGTCTGCTGAAGACTGCGCCGCCACTAGGAGGATTTGCCAGATCGTTTCAACCCGGGCTGCACATCTGTGCGCCTCTACCCTGGCGGCGGTGATGCGACAGATCCGGGACAACAAAGCGGCCGAAAAGCTGCGCATCACCATCGGAGTGGACGGCTCAGTCTACAAGGGTCATCCAGAATTTTCCAGGAAGCTCAACAAAATGGTGCGGCGCCTCGTGCCAGACTGCGACGTGCGCTTCCTGCAGTCGCAGCACGGCAGCGGGAAAGGCGCGGCCATGGTGACGGCGGTGGCCTACCGACTCGCCACCCAGCACGCCGAGCGGCAGCGCGTCCTCGACACCCTGCGGCTGAGCCGCGAGCAGCTGCTGGAGGTGAAGCGGAGGCTGACGGAGGAGATGGCACGGGGTCTGTCCAAGCAGACGCACGACCAGACCAGCGTCAAGATGCTGCCGACGTACGTCAGGTCCACCCCGGACGGAACAGAACAAGGAGATTTCTTGGCTTTGGATCTTGGTGGGTCCAGTTTCCGTGTTCTTCTCGTTCGGCTGAAAAATGAGAAGAAGCAGAAAGTGGATATGCACCAGAAGATCTACAGTATCGATCAGGACACGCTGCAGGGCACGGGGGAGGAGCTCTTCAACTACATTGTGTACTGCATTGCTGACTTCCTGGACTACAGGGGGATGAGTGGAGCGTCCTTACCTCTGGGGTTCACGTTCTCTTTCCCATGTGATCAAACCAAACTGGAAGAGGGAATCCTTCTGAAGTGGACGAAGGGCTTCAAAGCCAGCGGCTGTGAGGGGAAAGACGTCGTGAAGCTGCTGAAGGAGGCGGTCCAGCGCAAGCAGGACTTCGACACTGACATCATGGCAGTGATCAGCGACACGGTGGGGACCATGATGACCTGCGGCTTTGACGACCGTCACTGTGAAATTGGCCTTATAGTGGGAACGGGCACTAATGCGTGTTACATGGAGCAGATGAGGAACCTCCAGCTGATGGACGGCGATGAGGGGCAGATGTGTGTGAACACAGAGTGGGGAGCGTTTGGAGACGACGGCGCCCTGGAAGACCTGCGCACCGACATCGACCGGGAAATCGACGCTGGCTCGCTGAACCCTGGCAAGCAGCTGTTTGAGAAGATGATAAGCGGGCTGTACATGGGGGAGCTGGTGCGTCTCATCTTGGTGAAGATGGCCAGAAAGCAGCTGCTGTTCCAGGGACAGACCACGCCACAGCTTCTTACCTCTGGATGCTTCAGCACCAACTACATCTACGCCATTGAGAGCGACAAAGATGAAGAAGGCCTGGCTAGCGCCGAGAAGGCGCTCCGCAGCCTGGGCCTGGACCCGTCTGCTGAAGACTGCGCCGCCACTAGGAGGATTTGCCAGATCGTTTCAACCCGGGCTGCACACCTGTGCGCCTCTACCCTGGCGGCGGTGATGCGACAGATCCGGGACAACAAAGCGGCCGAAAAGCTGCGCATCACCATCGGAGTGGACGGCTCAGTCTACAAGGGTCATCCAGAATTTTCCAGGAAGCTCAACAAAATGGTGCGGCGCCTCGTGCCAGACTGCGACGTGCGCTTCCTGCAGTCGCAGCACGGCAGCGGGAAAGGCGCGGCCATGGTGACGGCGGTGGCCTACCGACTCGCCACCCAGCACGCCGAGCGGCAGCGCGTCCTCGACACCCTGCGGCTGAGCCGCGAGCAGCTGCTGGAGGTGAAGCGGAGGCTGACGGAGGAGATGGCACGGGGTCTGTCCAAGCAGACGCACGACCAGACCAGCGTCAAGATGCTGCCGACGTACGTCAGGTCCACCCCGGACGGAACAGAACAAGGAGATTTCTTGGCTTTGGATCTTGGCGGGTCCAGTTTCCGTGTTCTTCTCGTTCGGCTGAAAAATGAGAAGAAGCAGAAAGTGGATATGCACCAGAAGATCTACAGTATCGATCAGGACACGCTGCAGGGCACGGGGGAGGAGCTCTTCAACCACATTGTGTACTGCATTGCTGACTTCCTGGACTACAGGGGGATGAGTGGAGCGTCCTTACCTCTGGGGTTCACGTTCTCTTTCCCATGTGATCAAACCAAGCTGAATGAGGGAATCCTTCTGAAGTGGACGAAGGGCTTCAAAGCCAGCGGCTGTGAGGGGAAAGACGTCGTGAAGCTGCTGAAGGAGGCGGTCCAGCGCAAGCAGAAATTCGACCTAAGCTTTGTGGCGGTGGTGAACGACACAGTGGGCACCATGATGACCTGTGCCTATCAGGACCCCAAATGTGAGCTGGGCCTTATTGTAGGCACAGGGACCAACGCCTGCTACATGGAGGAAATGCACAACATCGAAACGGTGGAGGGAAATGAAGGCCGCATGTGTGTCAACGTGGAGTGGGGAGCATTCGGCGAAAACGGTGAACTGGACGACTTTTGCACAGAGTTTGATTATGCTGTCGACGAAGCCTCCAACTACCCTGGGAAGCAGAGATATGAGAAGATGATCAGTGGGATGTACCTGGGAGAGATAGTGAGGCATGTGCTGATGGATTTCACCACCAAGGGTCTGCTGTTCAGGGGCAAACTGTCGGAGCGCCTGAAGACCAGGGGCATCTTTGAGACCAAGTTCCTGTCACAGATTGAAAGCGACCGGCTGGCCATGCGTCAGGTCCGCTCCATCCTGCAGCACCTGGGCCTCACCGGCTCCACGTGTGACGACAGCGTCCTGGTGAAGGAGGTGTGCAGCGTCGTGGGTCGCCGCGCGGCGCAGCTCTGTGGCGCCGGTTTGGCCGCTCTCGTTGACAAGATCCGGCAGAACCGCAACCTGAACCAAATGTCCATCACTGTGGGAGTGGACGGTACCCTTTATAAGACCCATCCTCATTTCTCGAGGATCATGCAGGAGACCCTGCAGGACCTGGCCCCGCAGTGCGAGGTGACGTTCCTCAAGTCGGAGGACGGCAGCGGGAAAGGAGCGGCGCTCATCACGGCCGTGGCCTGCAGGTTGAAGAGCGAGCAGTCGCTGTGAAACCTGCGAAAACTTCTCCCTGTGGGTCAACACGCGCACTGTGTTCAGTCGGTTGTCATTCTTTTTTCGACGTGAGCGCGTTCACACGAGAGTGTCCGCTTAACGGCGCGAGGCGAAGCTGTGACGGAGGTTCGGTCGGGCGCGAACTGAGCTCAGAAATCACAGTTCTGCTGGTAATGAACCTGCACCTTCAGTGAGACCCGACTGTTACGAGCTCGTTGCTTTTCGTTTTTACACTCTGTCGTTGTCTTTTACTTTTATATTAGTTCTGTTTTTAAGTCAAGTCTGTGAAAAATAAAACTTTTTAGCACATTTACTGTCTGGCAAGTTTAGAAAAGCACATTCCTGAACCAAAGAGAAGCAAACCAGTACATTCAGCAGGTAAATGAAGCAATAGTTTCTTTCCTTTTTTTACATTTTATTTAAGTTTTAAAGCAATTTTACTTTGTTACAGGAAACTTCAGAAAAAATGCAATATTGTGATGAAATGTTTTTAAAATGTAAACACTAGTCCATGCATCAGAAACATAAAGATGTTTTAGAAATTGCAGAGGCTCCGTATAACTGGAGGTATAAATAATTCAAACTGTGTAGTTCTGATTGCAGCAAGCTTATTATGATGTGCTGTGAAAAATATCAACTCCAAATAAAGTGAGAAATCACCAGGGTCTATTTTTTTTATTATTATTTATCAATAAAACCAAGATTACTCCAACTTGGACTCATTTTATTACTGGGGTGTTGAGAATAAAGAGGACAATCTGCACCTCCATAATTGGACCAATCAGTTTAATTTGTAGTTTTTCTCACAAAGCATATTTTCATTGGCTTTTTTTTTTTTTTTTTACAAAATCATTACCTTACAATGGAAAACTACCCTGAATACACATAATCAGACAGCTCTGAAAATACTGTAACATGTGATCTTCATTTTCACTGTTTTTCATCCAACCAAACCCAATAAATCTTACTTGGCTATGTTGTT
>EU380792.1 Rickettsia sp. GDM18 16S ribosomal RNA gene, partial sequence 
GCTTAACACATGCAAGTCGAACGGACTAATTGGGGCTTGCTCCAATTAGTTAGTGGCAGACGGGTGAGTAACACGTGGGAATCTACCCATCAGTACGGAATAACTTTTAGAAATAAAAGCTAATACCGTATATTCTCTGCGGAGGAAAGATTTATTGCTGATGGATGAGCCCGCGTCAGATTAGGTAGTTGGTGAGGTAATGGCTCACCAAGCCGACGATCTGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATACCGAGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTAGCAAGGAAGATAATGACGTTACTTGCAGAAAAAGCCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAAGACGGAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGAGTGCGTAGGCGGTTTAGTAAGTTGGAAGTGAAAGCCCGGGGCTTAACCTCGGAATTGCTTTCAAAACTACTAATCTAGAGTGTAGTAGGGGATGATGGAATTCCTAGTGTAGAGGTGAAATTCTTAGATATTAGGAGGAACACCGGTGGCGAAGGCGATCATCTGGGCTACAACTGACGCTGATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGATATCGGAAGATTCTCTTTCGGTTTCGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGGCTCGCACAAGCGGTGGAGCATGCGGTTTAATTCGATGTTACGCGAAAAACCTTACCAACCCTTGACATG
>XM_045299987.1 PREDICTED: Echinops telfairi calcium voltage-gated channel subunit alpha1 G (CACNA1G), transcript variant X9, mRNA 
TCGAGCGCATCAGCATGCTGGTCATCCTGCTCAACTGTGTGACCCTGGGCATGTTCCGGCCGTGTGAGGACATCGCCTGTGACTCGCAGCGCTGCCAGATCCTGCAGGCCTTTGATGACTTCATCTTCGCCTTCTTCGCTGTGGAGATGGTGGTGAAGATGGTGGCCTTGGGCATCTTTGGGAAAAAGTGTTACCTGGGGGACACTTGGAACCGGCTTGACTTTTTCATTGTCATCGCAGGGATGCTGGAGTACTCACTGGACCTGCAGAACGTCAGCTTCTCCGCTGTCAGGACCGTCCGTGTGCTGCGGCCACTCAGGGCCATTAACCGGGTGCCTAGCATGCGCATTCTGGTCACGCTGCTGCTGGACACGCTGCCCATGCTGGGCAACGTCCTGCTGCTCTGCTTCTTCGTCTTCTTCATCTTCGGCATCGTGGGTGTCCAGCTCTGGGCCGGCCTGCTACGCAACCGGTGCTTCCTGCCCGAGAATTTCAGCCTCCCCCTGAGCGTGGACCTGGAGCGCTATTACCAGACTGAGAATGAAGATGAGAGCCCCTTCATCTGCTCCCAGCCTCGCGAGAACGGCATGCGGTCCTGCCGGAGCGTGCCCACGCTGCGTGGGGAGGGGGGCGGCGGCCCACCATGCGGCCTGGACTACGAGGCCTACAACAGCTCCAGCAATACCACTTGTGTCAACTGGAACCAGTATTACACCAACTGCTCCGCCGGGGAGCACAACCCCTTCAAGGGGGCCATCAACTTCGACAACATCGGCTACGCCTGGATCGCCATCTTCCAGGTCATCACGCTGGAGGGCTGGGTGGACATCATGTACTTTGTGATGGATGCTCACTCCTTCTACAACTTCATCTACTTCATCCTCCTCATCATCGTGGGCTCCTTCTTCATGATCAACCTGTGCCTGGTGGTGATCGCCACGCAGTTCTCAGAGACCAAGCAGCGGGAGAGCCAGCTGATGCGTGAGCAGCGGGTGCGCTTCCTGTCCAATGCCAGCACCCTGGCCAGCTTCTCGGAGCCCGGCAGCTGCTACGAGGAGCTGCTCAAGTACCTGGTGTACATCCTGCGCAAAGGTGCCCGCAGGCTGGCCCAGGTCTCCCGGGCGGCAGGCGTGCGGGCCGGGCTTCTGAGCAGCCCAGTGGCCCACGGGGGTCAGGAAACGCAGGCCAGTGGCAGCTGTTCTCGCTCCCACCGCCGTCCATCAGTCCACCACCTAGTGCACCACCACCACCACCATCACCATCACTACCACCTGGGCAACGGGACGCTGAGGGGCCCCCGGTCCAACCCGGAGATCCAGGACAGGGAAGCCAGCGGGTCCCACCGCCTCATGCTGCCACCGCCCTCCACACCCACCCTGTCTGCGGGCCCTCCGGGGGGCACAGAGTCTGTGCACAGCTTCTACCACGCCGACTGTCACCTGGAGCCGGTGCACTGCCAGGCACCCCCTCCCAGGTCACCATCGGAGGCGTCAGCCAGGACGAGGGGCAGTGGGAAGGTGTACCCCACCGTGCACACCAGCTCGCCGCCAGAGGTGCCAAAGGAGAAGGCGCTGGTCGAGGTGGCTCCCCATGCTGGGCCGGCCACCCTCACCAGCCTCAACATCCCCCCAGGGCCCTACAGCTCCATGCACAAGCTGCTGGAGACGCAGAGCACAGGTGCCTGCCAAAGCTCCTGCAAGATCTCCAGCCCGTGTCTGAAGGCAGACAGCGGGGCCTGTGGCCCAGACAGCTGCCCCTACTGTGCCCGGGCAGGGGAGGTGGAGCTTGCCGACCGAGAGGTGCCGGACTCTGACAGTGAGGCGGTTTATGAGTTCACGCAGGATGCTCAGCATGGTGACCCCCGGGACCCTCGACGCAGCCTGGGGCTGGCTGTAGGGCCCAGCTCTGTGCTGGCCTTCTGGAGACTGATCTGCGACACCTTCCGGAAGATCGTGGACAGCAAGTACTTTGGCAGGGGCATCATGATTGCTATCCTGGTCAACACGCTCAGCATGGGCATTGAGTACCACGAGCAGCCTGAGGAGCTCACCAATGCCCTGGAGATCAGCAACATCGTCTTTACCAGCCTCTTTGCCCTGGAGATGCTGCTGAAGCTGCTGGTGTACGGGCCCTTTGGCTACATCAAGAATCCCTACAACATCTTTGACGGGGTCATTGTTGTCATCAGCGTGTGGGAGATCGTGGGCCAGCAGGGGGGTGGCCTGTCGGTGCTGCGGACCTTCCGCCTTATGCGGGTGCTGAAGCTGGTGCGCTTCCTGCCGGCGCTGCAGCGGCAGCTCGTGGTGCTCATGAAGACCATGGACAACGTGGCCACCTTCTGCATGCTGCTCATGCTCTTCATCTTCATCTTCAGCATCCTGGGCATGCACCTGTTCGGCTGCAAATTTGCTTCTGAGCGGGACGGGGACACGCTGCCAGACCGGAAGAATTTTGACTCCCTGCTCTGGGCCATCGTCACAGTCTTCCAGATCCTGACCCAGGAGGACTGGAACAAGGTCCTCTACAATGGGATGGCCTCCACATCCTCCTGGGCCGCCCTTTACTTCATCGCCCTCATGACCTTTGGCAACTACGTGCTCTTCAACCTGCTGGTGGCCATCCTGGTGGAGGGCTTCCAGGCGGAGGAAATCAGCAAACGGGAAGATGCGAGTGGACAGTTGAGCTGTATTCAGCTGCCTGTCGACTCCCAGGGGGGAGATGCCACCAAGTCCGAGTCCGAGCCTGATTTCTTCTCGCCCAGCCTGGACGGCGATGGGGACAGGAAGAAACGCTGGGCCTTGGTGTCCCTAGGAGAGCACCCGGAGCTGCAGAGGAGCCTACTCCCTCCTCTGATCATCCACACGGCCGCCACCCCCATGTCACTGCCCAAGAGCTCCAGCACGGGCCTGGGGGAGCAACTGGGCCCCGCCTCCCGCCGCACCAGCAGCTGCTGGTCTGCAGAGCCTGGGGCAGCCCATGAGATGAAGTCACCGCCGAGCGCCCGCAGCTCCCCACACAGCCCCTGGAGTGCCGCCAGCAGCTGGGCCAGCAGGCGTTCCAGTCGAAACAGCCTGGGCCGTGCCCCCAGCCTGAAACGCAGGAGCCCTAGTGGGGAGCGGCGGTCCCTGTTGTCTGGCAAGGGCCGGGAGAGCCAGGATGAGGACAGCTCGGAAGAGGAGCGGGCCAGCCGGGTGGGCAGTGCCCGGCACCCTGGGGGCTCCCTGGAGCAGGAAGCCAAGGGATCTTTCGACCTGCCGGATACCCTGCAGGTGCCCGGGCTGCACCGCACGGCCAGCGGCCGCAGCTCGGCCTCGGAGCACCAGGACTGCAATGGCAGGTCGACCCCAGGGCGCCTGGCCCGGGCCTCACACCCAGACGAGCCTCCACTAGATGGGGATGACGCTGATGACGAGGGCAACCTGAGCAAAGGGGAACGGATGCGGGCGTGGATCCGAGCCCGGCTCCCTTCCTGCTGCCGTGAGCGGGACGCCTGGTCAGCCTACATCTTCCCTCCACAGTCAAAATTCCGTCTCCTGTGCCACCGGATCATCACCCACAAGATGTTTGACCATGTCGTCCTCGTCATCATCTTCCTCAACTGCATCACCATCGCCATGGAGCGCCCCAAAATCGACCCCCACAGTGCCGAACGCATCTTCCTGACTCTCTCTAATTACATCTTCACCGCCGTCTTCCTGGCCGAGATGACAGTGAAGGTGGTGGCGCTGGGCTGGTGCTTCGGGGAGCAGGCGTACCTGCGCAGCAGCTGGAACGTGCTGGACGGGCTGCTGGTGCTCATCTCCGTCATCGACATCCTGGTGTCCATGGTCTCCAACAGTGGCACCAAGATCCTGGGCATGCTGCGGGTGCTGCGTCTGCTGCGCACCCTGCGCCCACTCAGGGTTATCAGCCGGGCGCAGGGGCTGAAACTGGTGGTGGAGACGCTGATGTCCTCCCTGAAGCCCATCGGCAACATCGTGGTCATCTGCTGTGCCTTCTTCATCATTTTTGGCATCCTAGGGGTGCAGCTCTTCAAAGGGAAGTTCTTCGTGTGCCAGGGCGAGGACACCAGGAACATCACCAACAAGTCCGACTGTGCCGAGGCCAGTTACCGGTGGGTCCGGCACAAGTACAACTTCGACAACCTCGGCCAGGCCCTGATGTCGCTGTTCGTGCTGGCTTCCAAGGACGGCTGGGTGGACATCATGTATGATGGGCTGGATGCTGTGGGCGTGGACCAGCAGCCCATCATGAACCACAACCCCTGGATGCTGCTCTACTTCATTTCCTTCCTGCTCATCGTGGCCTTCTTTGTGCTGAACATGTTCGTGGGTGTGGTGGTGGAGAACTTCCACAAGTGCCGGCAGCACCAGGAGGTGGAGGAGGCGCGGCGGCGGGAGGAGAAGCGGCTGCGGAGACTGGAGAAGAGGAGAAGGAATCTAATGCTGGACGGGGTAATTGCTTCCGGCCGCTCAGCCAGCGCGGCACCAGAAGCCCAGTGCAAGCCCTACTACTCGGACTACTCCCGCTTCCGGCTGCTCGTCCACCACCTGTGCACCACCCACTACCTGGACCTCTTCATCACAGGCGTCATTGGCCTGAATGTGGTCACCATGGCTATGGAGCACTACCAGCAGCCCCAGGTCCTGGACGAGGCTCTGAAGATCTGCAATTACATCTTCACCGTCGTCTTTGTCTTGGAGTCGGTGTTCAAGCTCGTGGCCTTTGGCTTCCGCCGCTTCTTCCAAGACAGGTGGAACCAGCTGGACCTGGCTATCGTGCTGCTGTCCATCATGGGCATCACGCTGGAGGAGATCGAGGTCAATGCCTCGCTGCCCATCAACCCCACCATCATCCGCATCATGAGGGTCCTGCGTATCGCCCGAGTGCTGAAGCTGCTGAAGATGGCTGTGGGCATGCGGGCGCTGCTGGACACGGTGATGCAGGCCCTGCCCCAGGTGGGGAACCTGGGACTTCTCTTCATGTTGTTGTTTTTCATCTTTGCAGCTCTGGGCGTGGAGCTCTTTGGAGACCTGGAGTGTGATGAGACACACCCGTGTGAGGGTCTGGGCCGGCATGCCACCTTCCGGAACTTCGGCATGGCCTTCCTGACCCTCTTCCGCGTCTCCACTGGCGACAACTGGAACGGCATCATGAAGGACACCCTGCGAGACTGCGACCAGGAGTCCACCTGCTACAACACGGTCATCTCCCCCATCTACTTCGTGTCCTTCGTGCTGACCGCCCAGTTCGTGCTGGTCAACGTGGTGATCGCCGTCCTGATGAAGCACCTGGAGGAGAGCAACAAGGAGGCCAAGGAGGAGGCCGAGCTGGAGGCCGAGCTGGAGCTGAAGACACTCAGCCCACAGCCCCACTCGCCGCTGGGCAGCCCCTTCCTCTGGCCTGGGGTCGAGGGCTCCGACAGCCCCAAGCTGGGGCCCCTGCACCCTGCAGCCCACTCCAGGGCAGCCTCCCGCTTCTCCCTCGATCACCCCACGATGGAGTCCCAGGCTACTGAGGTGCCGGTCACCCTGGGACCAGACCTGCTGACCGTCCGAAAGTCTGGGGTCAGCCGCACGCACTCCCTGCCCAACGACAGCTACATGTGCCGGGATGGGAGCACTACTGCGGAGTCCCCTGGGCGCAGGCCCTGGGGCCTCCCCAAAGCTCAGTCAGGCTCCATCTTGTCTGTGCACTCCCAGCCTGCGGGGTCCAGCTACATCCTGCAGCTGTCGAGAGATGGGGCCCATCTGCTACATCCCCATAGCGTACCCCCCTGGGGCGCCATCCCCAAACTTCCCCCACCGGCCCGCTCCCCGTTGGCTCAACGGCCACTCAGGCGCCAGGCAGCAATAAGGACTGACTCCCTGGATGTGCAGGGCCTGGGCAGCAGGGAAGACCTGCTGTCAGAGGTGAGTGGGCCCTCCCCGCCGCTGGCCCGGGCCGCCTCTTTCTGGGGCCAGACAAGCATCCTGTTGCAGCAGCAAGCCCAAGCCTGCAGCCAGATCTCGAAGCACACACCACCTCTAGTCCCCCATCCAGGCCCAGAGCCCACCCGGGCCAGGGTCCCCCGAGAAACCAGCAGCAGCTTGGAGCTGGACACGGAGCTGAGCTGGCTTTCCGGGGACCTCCTGCCAGCGGGCAGCCAGGAGGAGCCCCCCTCACTTCGGGACCTGAAGAAGTGCTACAGCGTGGAGACCCAGAGCTGCCGCCACCTGCCGGCCTCCTGGTTGGACGAGCAGAGGAGGCACTCTATAGCCGTCAGCTGTCTGGACAGCGGCTCCCAGCCCCACCTGGGCCCCAGCCCCACCAGCTTTGGGGCCCAGCCTCTTGGGGCACCAGGGAGCCGGCCCAAGAAAAAACTCAGCCCACCCAGTATCTCCATAGACCCTCCAGAGGGCCAGGGCTCTCGGCCCCCACCCAGCCCTGGCGTCTGTCTCCGGCGTAGGGCTCCGTCCACCGACCCCAAGGACCCCTCGGCCTCGGGCCCCCCCGACAGCATGGCTGCCTCGCCCCCCACAAAGAAAGACGTGCTGAGTCTCTCTGGTTTAGCCTCTGACCCAACAGACCCGGACCCCTGAGTCCTGCGCCCACTCTCCCTTCCTCCACTGGGGGCCAAGTCCTAGCTCCCCCTCCTGGGCTGGTGCCCTGAAAATGTCCACACAGACACGGAGGCGCCCCTCCTCGCCTCAGTGATGCTGGGCCACGCCACACAGGAGTTCCACCCTGGGCCGCCGAGCCAGGGCACAGAGAGGCCCCATGCCGCCGAGGTTCCCGACACCAGGACTTGCTGGGAGAAAGCAATACGTTTGTGCAGAATCTCTATGTATATTCTATTTTATTAAATTAATTGAATCTA
>XM_020899216.1 PREDICTED: Odocoileus virginianus texanus LCA5, lebercilin (LCA5), transcript variant X2, mRNA 
GCGGAGAGAAGGCAAGGCGGCGGGCGCCGCGTCGGCGCTGAGGAGGGGCCGGAGCGGGTTGGAGAGGAAAAAAGTGTATCTTCTGGTTGCTATTGTGAATTGTGGACTAAAGGTACATAGAGAAAACGGATTGCACAGACTTGAATATTATCCCCAGGATCTGAAGACTCAAAATTGCTCTTCAGGCTTATTTTGGATTTTTCTGAGAAGACTCTGTGAAATTATGTGAATAGAGACTATTTTTCAAAGCCATGGGGGAAAGAGAAAGAAGTCCAGTTACTGATCGAGAAAGTAAGACAAGCAGACCCTATTACTCTTACTGTTCATCTGAATTTGGAACTACTCCACAGTCTTCTGGCCGGTCGTCGCTGGTGCATCCCTCCCCACCTGCAAGTGTTAAGGAAAAACATCCTAAGAAACAAATTTCAGATAGCCAAGTGCATCATCACGCCCCTAGGAAACCAAGCCCTAAGGGTTCACCAAACAGAAAGAGAGTCAGAGCAGGATTTCGCTCCCAGAGCCTCAATAGGGAGCCCCTTCGGAAAGATCCTGATCTTGTTACAAAACGGGTTCTTTCTGCAAGACTGCTAAAAATCAATGAATTGCAGAATGAAGTAACTGAACTCCAGGTCAAGATAGCCGAGCTGCTAAAAGAAAATAAGGCTTTGAAAAGGCTTCAGTACAGGCAGGAGAAAGCCCTGAATAAGTTTGAAGACACAGAAAATGAAATCTCACAACTTATTGCTCGTCATAACAATGAGATTACAGCACTCAAAGACCGCTTAAGAAAATCTCAAGAGAAAGAACGGGCAACTGAAAAAAGGGTGAGAGAGACAGAAGGTGAACTGCTTAGGACAAAAGTTTCCTTACAGAAACTGAAAACGATCTCTGAAGCTAAACACCTACCTGAACGAGATGATTTAGCAAAGAAACTCTCTTCTGCAGAGTTAAAATTAGATGACACTGAGAGAAGAATTAAGGAATTATCAAGAAACCTTGAGCTAAGTAGTAACAGTTTCCAACGACAGTTGCTTGCTGAAAGGAAAAGGACATGTGAGGCTCATGATGAAAATAAACTTCTTCAAAAAGAACTACAAGGACTATATGACAAATTAAAGGAAAAGGAGAGAGAACTGGACATAAAAAACATATATTCTAATCGTCTGCCAAAGACTTCTCCAAAGAAAGAAAAAGAATTTACATCAAGAAAAAATGCTGCATGCCAGAGTGATTTTACAAACCAGTGTACAAAAGGAGTACAAACCAGTGAAGACTTCAAGCTGGAGGACTATCCTATAACACCACAGACAGTTATGTGTTATGAAAACAAAAGGGAAGAACCCGAACGTCTTTCTTTGGATCTGGAATCTCAAAAGAGAGATAATCTTGGAGAAGCTGGGATTCTAAACCCAACTGTGGAAAGAGAAGACAAATTTGCTAAAGATCAAGGACTCCATGTTGTGAAACAGGATGTTGAGAAGCTGGATAATGGGTGGGAAAGAGAAGAACTTGCTAAAAAGCCAAAGGAAAAGACATCTTTGTTGGAGAGAGAAGGAAAGCCAGTGTTGGAAACTGGAAGATATCAAGTGGAAATGCACCAAGTTCAGAAAATTGATAAACTGGAAGAAGAGGAAGAAGAAAGGCTAAAAGAAATGCTACTTGCTAAACTGAATGAAATCAACAGAGAACAAGACTCTCAGAATGTAAAATATCCTTCTCTGCCATTGCTTCCTGACGTGAAGCCAAAACTGCATTCCCCAGAGAGAAACCCCAGAACACACACGTCCTCTGGATCCTCAGAGAGATTATTTAACGGGCATTATTTGCAAGACCTCAGTCTTTCAACAACGAAAGGAGATGGTCAGAATCCAGGCCATACTCGAAGCCCAGCCTCTCCAGATGAGCTTGTGTTTGGTAGCTATGTGCCTTCATTTGCAAAAACATCAGCGAGGTCAAATCCACTTAGCCAAAAAAGTGACCTTTTGGGTTTCTCAGGAAATAATACAGAGAAATTTAGTAAAGACAGTGTAGATTCAATTACCAGACAAGAAAGAAAAGCCACCCTGATGGAACAGCTGTTTGGTACCAGTGGTGGCAGCAGCCTTTCCTCTAAAAGCAGTGACCCAAATTCTCTGGCTGTCACTAAAGAAGACTGTGACCCTCTAAATTATCTCCCTGGGGATAAAAACAGCTGGGGTAGGGAACATAGTGATGATGATGACTTTTTCCTCAGCGAAGGAAGAAGTTTTAATCCAAGTAGACACCGATTAAGACATGCAAACAGTAAACCAGCAGTAAAAGTAGTTGATTCTGTAGAAGATGAAATTGAAGAAGTAGTGCTGAGATGACTGACTAGAATGTTTTTTTCCAATTGTAATTATTAGGATATTTTAATACAGTATTTATTATGAACATTTAGACTTTCTAATATTAAAAAGTCATCATTAACGGATAATTTTTAGTATATAAATACAGTGAAAAGTAGCTGATACCACTAGTAGCTACACACATGTAGCTAGTTTGCTAATAAGGAAGGAGGCTCTTTTGAATGAAACCAGAAATAGAGATGTATCTTACTTTCTTTGTGCAAATAAAGATGTATCTCACTTCCTTTTTGCAAATAGGTTTTACCTCTTGAATCAACTCTATGAGGAGTTTTACTCCATTGGCATACACATTCATTTTCTGTGTTATCCCTATTATTTTTGGTCTTATCCTCACTGAGCTAAGTACAGTTTTCCCGCTGATGGTTGTGTGGAAATGGAGAGATGCTGTAGGGAGCTGGTGCTACTAGGAACCTCTCCACTGTGACTAGGAGTGAAGGGGGTCCCTTTCTTATATGCCAAGACTGAGCTACTCTTAAGTGGAAACAGTGACAACGTGAGAATTTCCCATTCTTCTGGAAGTAACCACAGTTAAATGGTACTGATTTCGCAGTGACAGAGTCTGATTATATCACTTACCTACAGCTGTGCTAACTCATTAGGCTGAATTCCGAAGACGTCTTTCTGTTGGCATGAACAGTGCCCTCCCTGTCCTGGCTTCCAGAGGTTCCAGTGCAGTGTAATCGGTAATTCCTCTCCTTGAACTCCTAATGCTATCTGTATCTCAGTGACTGGTTGTGAGAGGTCATACCAAATGCACAGAATGGAAGAAATTTCACCCCACTAGAGCAGGATTTTCAACTCAATTATGATTCCAGAGTAACATAACTTGGAAATTTTAATATGTACTTTAAGATTTGAACTTACTGTCAAACCAAAGAGACAATGATCACATGATACCATTGGACTTAAGCGGACTAGTTTTAAAGCAGCCTTGGTGAAAAGTGTTTTACAGATGGAGCTCCTCCCTTGCTGAGTAGGGTGGAAGATGTTCTGTTGAAAAGTGTTAGTTTTTTTGCTGTTTCATAGCTCACTTCAGCTCCAGAGAGGAGTCAGGGACCTTGGATTATGCTGGGCATGAGTGGTCTCTAAGAAGCAGAAATATGCCAGTGGCCTAGGAGAAAACTCAGTGCAAATGAAGAGTGGTGGGAACAGTGTATCAGGGCAAGAATAAGTGGTGATTGGCACTTGTTCTGAAATGAACTGTTGTTTTCTAGAATTTGCTACATATTTGTTCATAGTAGGATTTCTGATGCCAGGCATACATACTGATCAGGGGATTCGAGTTACTATCTTGAGTTCTTATAAATGCTAATTATTGAATATAATTTCATAATTATCTGACAAGACTTACTGGTTAGGTCTCTAATTACAAGATGTACTACCTACATCTTCTAAATTGTGTTCCTGTTACCTACTAGGAACCGAATCTCTCAAAAGTGCTAAACTATATCAAATTTTTTTATAAAGAGATTTTTGGATTGATATAAATAAGCATTTACTATGTTGTAAGTCATTCTAATATATGTAAACCACAATATTTTTGTAATGCAGTTCTTGATAAAATATTATATATTAATTTTTTTCATAGCTGCTAATTTTTCAGCCAAAAGTATTCTCATTTTTAGGCTGTTTTTGTATTAAAGGTTTTTTTCTTTCAAAAGTCCTTTAGTAAAGTTTTAAATTCAGATCATTTTAATTAGTCTCTTTTTTCTACTTGATGTTTTCCAATCTTTTTAAACAGATGTAATAACACAGAATTGTTAAAATTAAATCTAAAATTAAGTTATAGACTTGAAGCATTATGGAGTTAAGCATTAAAATTGGAGACTAAAATGTACAGAACAAGTTATTCTTTATGAACAAACCTTAATGGATAACTTTTTTTTCTAAATGTCAAGTTAAATTTATCTGTACTCCAAACTATTACTAATAAAAATTTAAAATA
>XM_045922658.1 PREDICTED: Maniola jurtina cleavage and polyadenylation specificity factor subunit 6 (LOC123876410), transcript variant X5, mRNA 
GGTCACACTGGTACTACACTTTTCTTCAATTCGCAAAATGGCGGATGGAGGCGTGGATATAGATTTGTACGCCGACGATATTGAATCTGATTTTAATAGACAGGATGACTTTGGAGGTGAAAATGTCGATTTGTACGACGACGTGATCGCAGCCCCGTCGAAGCCCGAAGACGGCGACGGGCCACCCAACTCCGGACCGCCGCAGCATCAGCATCCACCGGAGGAAACCAACGGTTCAGTTCCGTACCACCACAACACCGTATCAAGCCACGGCCATCATGGCCGCCGCTTCCAACTTTACATCGGCAACCTCACCTGGTGGGCGACTGATCAAGACATAGCTAACGCGGTCGCCGATATCGGCGTAACGGACTTTCAAGACGTGAAGTTCTTCGAGAACAGGGCAAATGGACAGTCGAAAGGATTCTGCGTCATATCGCTGGGTTCCGACCAATCCACCAGGATGGTCCTCGATCGACTGTCCAAGAAGGAGATTCACGGTCAGCATCCCGTTGTGACGCTGCCAACTAAACAGGCGTTGAATCAGTTTGAGAGTCAGTCGAAGACAAGGTCAACACCGCCCGGACCCAACAACCCCGGTATGAGAGGTCCTCACCCTGGGGGCATGCCTGGCCCACACCCTGGAGAATTCTTTGGTGGCGGACCAAATGGACCGGGACCAAATGGCCCACGCATGATGATGCCTGGGCCAGGCCCCCATCATCAGCTTCGTGGGCCCCCACCCGGACCCCATGGCCCCCCACCGCACCACATGCAGCAGCACCAAGGCCCCCCACCGCACCATATGCCGCCTCATCAGGGCCCGCCCCCGCACCAGGGGCCCCCACAACACAGGCCACCGATGCAGTTCCAAGGGCCGCCGCAGATGCAACGCGCCCCCGGAGGCCCTCCAGGAGGCCCGCGAGGGGGCCCTGACTGGCCCAGGCCCCACCACATGCAGGCCCCAGCTCCACAATACGGACCCCCGCAACACCAAATGCCGCACCAAATGCCCCCGCCGTCACCGCATGGGCCGCCCGGGCAAGGCATGCCGCCGCCTCACCATCAGATGCCGCCGCACCAGCAGGGCCCGCCCAGGGGACCCGCGCCGATGCCGCAACATCCAGGCGGGGCTCCAGCGCCGCACGTGAACCCGGCGTTCTTCAACCAGCAGCCGCCCGTGCAGCCCGCGCCCGCAGTGCAGCCGCCGCCGCAGCCCGCGCCGCCCGGACCAGGCGCGCCCTACGGCCACCCGGCGCACGGAGGCCCGCCGCCCGCACAGGGCCCGCCGCCCGGCGCGCGCCAGCCGTACGGAAGACCACCTGCAAGCTACCCCGGCGGTGCCGAGGCGCGGCCCGCGCACCACCCTTCGCCGCTGGGCCCGCACGCGCCCCCGCACGCGGCGCACCCCACGCACCCCGCGCACCCGCCGCACCCCGTCATCAGTGAGGCGGAGTTCGAGGAGGTGATGGGCCGCAACCGCACCGTGTCGTCCAGCGCCATCGCGCGCGCCGTCAGCGACGCGGCCGCGGGCGAGTACGCGTCCGCTATCGAGACGCTGGTCACCGCCATCTCGCTCATCAAGCAGAGCAAGGTGGCACATGATGACAGATGCAAGATTCTCATCTCCTCACTCCAAGACACATTGCACGGCGTAGAGACCAAGTCGTACGGGGGAGAGAGACGGCGGTCGCGGTCGAGGGAGAGGGATGCGCGCGTGCACCACCGCGCGCCGCGTCGCAGGGAGCGTTCCGCGTCGCGCTACAGGGACAGGTCGCGTGACAGGGAAGAGCGAGACAGGTATTACAGGGACTATCGTGAGAGGGAACGCGACCGCTCAAGGTCCAGGGACCGCGAGCGTGCAGAGCACTACAACAGGGGACACAGCCGGACGGAAGAGAGGCCTCGCAAGTCGCCCGTAGAGCCAGCGGTGGAGAGTGGCGCCGGAGATACAAGCACGAGCAAAAGTCGTACAGCGGCGACGCCCTACTACGACGAGCGGTACCGCGAACGCCGCGAACGCGACCCTCCCACCGCGGACCGCGAGCGCGACCGCGAACGCGACCACCGCCGGGACGCTAGGCATTAAATGACTAATAAACTAAAACTAGACCATACCATAGTCTAAATAAAGTACAGTACTACCACTTTCAGAAGTAACGCTGATGTACATTCAAAGGCCGTAATTTGTTTAGCACCTTAATGATCATATTCGCGTGGCAAGGTTATGCACATGCGTTAGGTGTGTGTAGCGTGTTTATAGAAAAAAGCCATAAGTGCGACAGGTTTTTGATGCAATAGTTTCGCGGAATTGCTACTCGAATTCTGAGGCCGACCGTACCTACGCAGATATTATATTATATATTATGTATGTGACATTGCCATTACGGGATAGTGGGAGCAAAATTCTATTTTGTTATTCTGGGACTTTGAACTTTCTCTCTTCTGATTGGTCCACAAACATTCGTATGTCTTGTTTTTGCTCATAGGTAGTGATGTAAAATAGTGCCACTCGGGGCCAAAATTTTATGTTTAAGGGCGACGTATATCAATTCCTCTCTCATAACCCCATGTTGATTCCACAGTTTGTATGTGCGTGGAAAAAAGGATCTGGCACAACGGGCGGTCGAAGTCACCAGGCACCCAGGTGGTTAGGGTGAA
>XM_034343108.1 PREDICTED: Prunus dulcis protein DECREASED SIZE EXCLUSION LIMIT 1 (LOC117614330), transcript variant X3, mRNA 
CACCCTCACACCACTAGTACTCTGATACAAGTCTGTCTACATCTACATCCTCTCTCTGTGTGTCTGATGAGAGAGCACAAAAAGTTGAAAATTATTCTTCTATCTGACTATTTTCCCCTTGCACGGGTTATCATCGTCTTCCGCGAAAAACAGGGTTTCTCCAAACTCTTTCAGTCTCTCGCCGTCTCTGAATCGGTTTGTGTGTTGACCAGAGGACGAAGTCAATTTTAAGTTCGTTCTTCTGTCTTGACTAGTCCAATGGAACGTTGGTTTAGTACAATCTGTAATAGCACCTCCTCTTGAATAAGTCGTAAGAATAACACGAAGAAACCCCTTTCAACCCCGTCGGGTCGTGTACTCAGCACCTCCCTCTAGTGCTATAGCGGCAGTCTGTGACTCTGTCTGTGACTGCCGCATTGCTTATTGAAGAAGCAGGTCCAATGAGCAAACAGAGACTGCCACCGGACCCAGTGGCTGTGCTGAGAGGTCACCGCGCCTCTGTCATGGACCTCTGTTTTCATCCATCCCAACCTCTCCTATGCACCGGTTCCGCAGACGGCGAGTTGCGGATTTGGGACACTATCCAGCATCGGACTATATTATCAGCAGGGGTGCATAATGCTGCACAGGGGATTGCTTCTGTTGCTTGTAGTTCTTCAATTGGAGCCAATAAAGTGATCAGCCAGGGTAGGGATGGAACAGTGAAGTGTTGGGATATTGAAGATGGAGGTCTGTCCAGGACACCTTCTGTTACAATCAAGACAAACTCTTACCACTTTTGTAAACTTTCCTTGGTGAAGAGACCTCATTCTAGTTCTAAGCGAGTTTACGGGACTACGCATAATGACAGTGATGAAACAAGGGTTACGGAGAATGCTGATACGGATGCTCTAGACAATAGCAGAGAAAAGTTTCAAGAGTATCTGCCTGAGCAGTCCAGCACCTTTGAAGAAAATACTCAAGTTGAGGGATCTAAATGTGTCGCTGTAGCAGGGGAGCAGCCTTCTGAGGTTGAGATTTGGGATCTTAATACTGCAGAAAGGTTTGCACGGCTACCTCAAAGCTGCGTTGCTGGTTTCTCAGGTATATCTACCACAGAGAGAGGAATGTGCATGGCGGTTCAAGCATTCTCACCATCCGAATCACAGGGATTCCTAAATGTCTTGGTGGGTTATGAGGATGGTTCCATGCTTTGGTGGGATATTAGAAATCCTGGGGTTCCATTGACCTCTGTCAAGTTTCATTCAGAGCCAGTTCTAAGTCTATGCGTTGATGGGTCATGCAATGGTGGTGTCTCAGGAGCCGCAGATGACAAAGTTGTGCTGTACAGTTTGGATCATTCCATGGGTACATGTGTGATCAAGAAAGAAATTAGTTTGGAACGACCTGGCATATCGAGCACTTCTATTCGACCTGATGGTAAAATTTTTGCAACAGCTGGCTGGGACCACAGAGTGAGAGTATATAACTATTGCAAAGGCAATGCTCTGGCGATATTGAAGTATCACCATGCAACGTGTAATGCTGTTTCTTATTCACCCGATTGCAAGCTAATGGCATCTGCATCAGAAGATACGACAGTGGCACTGTGGGAACTTTATCCTCCTCGAACTTGAAATGATATGGTAGTCCTGAAGTGGAAATGAGTTTGTGTTCCCTATAATGTAATAAAAGAGCATCAATAATCAATATCATTACCGTTTGTGTGCATAAGGTTAGATTAAATTCATTTAAATTATGGATTATTGCTTCTTTAGGAAAAAGATAAGATGTTAGACCTTCAATTTAGCAATAAGAGAAGATGTTACTCGCCTACAAGAACCGTGTGCTGGGATGAAATATGTGTTCTCCTTGTGTAATTTTCAGTTGTTTCAGACAAAGCCTAAGAAAAAATCGACATTTTGGACTGTTATGTAATTTGATGGCTGCCTGCAGGTTTGTAATTGAAAAACAGAACCAAACTCGCAGGCTTTCAGACGCAAAAGAGAGGGCCAAGTCGCGTTGATTTGATTTGGACATTTAGTTTGGTGGCCAGCCTCCAATCCAATGGTATCGAATAGAGGTGCCACATTCTTAGCCTCTGATCTACAAAGCAATGATTGGCTTGGCTATGCCGGGGATTATTGCTTCAAAGCTCCCAATTTGATCTCTCTTACTTTGCACTAGAAAAAGATGACCCGTTGTTGACTTTATCAATTACTCTTGAAATATTTTTCAATATAGCAGCCGGGGAAAGAAGTTGCACCTA
>XM_035481792.1 Colletotrichum scovillei uncharacterized protein (HER10_EVM0012396), partial mRNA 
CGGAAATTTAGATCATTGTAAAAACTGTTCGTTGAGTTGTTCTCGGGCGTTTTTTTCTTTTCTTTAAATAGCGTACAAGTCTCGCAACTCAAAGCGTCGGGCGCTCTTCCGTTGATCAATCGGAACGTGGCCAGAGACCAGACGATGTCGAGGGACGGGAACCCCGCAATTAGTTCATAAATCCTGTTCAGCCGCGGGCTAATTCCGATGAGCATTGCACACTCATTCGCAGACGACCCATATCACGATTATCGGGGCCATGGGATTTCGACAGCATGTCAGAGGGGAAGGTTCAAAGAGGTGCTGCTGAGTCTACTGGGGAAGTGCCCGCAAAGCAGCTCAAGGGCTGCGCCAACTGTGAGCGTCGTCGAATTCGCTGCGATCGACGGCGACCCCATTGCGCCAAGTGTGACAAGAAAAGACTTTCATGCCCTGGCTATGACCGCCGACTTCGATGGGTGGAAGGGGTTGCCGCGAGGGGACATCTGCGGGGTCGAACGGTCCCGACGAGGCCGTCTTCTGAAGATAAGGCCGCATTTCGAGAAGAGGACTCGAAAGACATCTTCACCGAAAGTCCACAGCTACACAAAATAAAAGACTTCACGACTTCGGTCGTCATTCTCAATGCGCCAACCGCCCAAGCAAGTCAAGCTTGCGAGTACCCCGACTCCCTGACAAGGGTGTTCATGGACTATTACAGACGGAACTTAGCCGGTCTGATGGTATGGATGGACTCAGACCAAAACCATTACCGTACACAGGTTGTTCCTCTGGCCGCGAATCAACCAGCGATCGGCTTCGCCATCATGGCTTTCGCGGCTCAACACGGCGCCATGGCGTTGCCTGATGAATCTATCGCTGAGACTGCTCGCGATAGGTGCTTGCACCTGATACAAACCCGCGCTCAGGATATGACGGCACGGCTTATCGAGGGCGATGACTTGGACAATCATGGTGACTTGGCTGATGCGGAATGGATGCTGGCCTCGATTCTCATCATGTGCAACTACGAGAATGCCCGTCGCCGCCTTCAAATCGCCGATGATCACAGGCGCGCGGCAAGGACGATTGTCAACCTTTTCAAAAGCCAGAAGTCAATCAACAACCGAGATCTGTTTGCGTTCTTGCGAAACCAACTAGCTATAGATGATGTACTGGCAGCTACGACATCGTGCGACCTGCCTCTCATTCGGAGCGCCGTCACGCCAGCACCTGGCTCAGATTATCTCCTCTTTTCGAGATATCTGACTTTTTTGCACCGTGTCACGCTCATTTCGGCAGATGCTGTTGATTCTTATCCTTCAATCTCGCGCTTACGCAGCGGCCTCACGGTGCCTCTCATCCAATCCGAGTTTGAGCAGGCAAGAGGCGCCACGCTGATGGCAGCCGGACGACTCGGACTGGCAGGATCAAGCATGTCTCGTGACTTCATACGCTTAGTCGAGGTTTATCATAACGCGGGGTTGCTTTACTCGTTAAGATGCCTCGACTACGCCATCGAGCACGCCTCGGAGCGCCTTGTGGCCGCTGCTAGTCTGTTCGACCAACTGACCGAATTGGAAGACCTAGCTGCTTTCGTTCAGAATCTAGCCTGGCCGACGTTCATTGCCGGTACCGAATGCCATGGAGATCGGCATCGACAAGATATCATTGCGGGTTTGCTCACGGCAATTCATGAGGGCACGCGCTTCAGTTATTACTTGGACGCGGTGAACTTTCTCAAGGAGTTTTGGGCCGGAGAAGACAACGACTGGCGTCCTCTCGCTCGCATGAGAGAAGCCATAGGGCAGCGAGTCCTTGTGGTATGA
>XM_006964907.1 Trichoderma reesei QM6a uncharacterized protein (TRIREDRAFT_61223), partial mRNA 
ATGGAGACGTACCACGGCTATGTACGGACTCCAGCTGATGCCATCAAACTGTTCGAAGCCTGTCGGCTAGGCCATCTGCCTCGGGTCCAGAGGCGACTCTCTGAAAAGGAGAGGCAGTCTATCAGATCCGGCTCAGTCTTTGTGTGGGACGAGCGCGAAGCAGGCATGCGGCGATGGACGGACGGCAAGTCTTGGAGTGCTAGCAGAGTGTCGGGCAGCTTCCTGACGTACCGCGAAATGGAGGGCAAGCGAGGAGGCGGCTTTGGAGGAAGCAGACGGGGCAACGGCAAGACGCCCGAATCTGGGCGCGGTAGCGACGAGGACCATGACGACGGCGAGCCGGAAGGATACCGATACAAGGCCGACGGCCTTATGAAGCAGTCGTTCAGCATCACCACGTCGACCGGCCAGCACCTCCACCTCATCTCGTACTACTCTCGGCCTCAGCCGGGGCAGCCCGAGCTGCCTCAGCCGACCAACGATCCGATGCTGCGATCCATCATCCCGATGAAGGGCATGTACCCGGAGTCCAGCATGGGCGAGACGAACCAGACGCCTGCACTGACGAGGGCGCCGATGCTGCAGCAGCCGCCTTACATGATTGCTCCTCAGCATCAGCACCACCACCCTCCTCACCCGGCGCATCATCAACCGCCGTTTGCGAGCCATTACCAGCCCGGGTATGGCTGGCCTCCGTCGCCAGTCGCGACCCCTCCGTACAGCCATTACACCTATAGCCATCCTCCTCCCGTCCACCATCTGCCTCATCCGTATGCCCCCCAAGGTCCGCCGCCGCCTCACCACGGCTATGCACCGCCTCCGCCTCCTCCGCCGCATCACTACCAACAACATGGCGCGCCTAGTCCCTACGACCGGCCTTCATTACCGCCTCTGCAAAACACGCCAAAGCCGGCCCCTCTGCCTCCGTACCATGGCCCGCAGCATTCCCAAGGACCGACGCCGCCCCGTGGCCACGAGTCTCCCCACCAGCCAACCTTGCAGGCTGCCGCGCAAGCCGCCATGGGCGATTCACGGACCCCGCCCGAGAAGAAGCCTCAGGGGCCTCTTCCAGCTCTGGGGACTGTTGCCAACGGGCCTCTTGTCTCTGCCCACAGCGGACTGCACACTCCTCCCACACGGACGCTGAGCCCGAGTCCGCCTCAAAGTTCCCATGTGGAGACGCATACTAGCACCAGCACCAGCAACAAAGCAAGCCTGTCCGCGCTGCTGCACCCCACGACGTCTTCCTCCACAGAGGCCGGTGCAAACGGCAGCGCTCACAGCAGCCCAAGGACGGCCAGTATCACCATGGCTGAAAAGGGAGGCGCCAGCGAAGACGCGCGAGCCCTGCGGATGCTTGACCGCAAGTTTTGCATCTAG
>XM_032861574.1 PREDICTED: Lontra canadensis endothelin 1 (EDN1), mRNA 
TCAGACGGCGGGCGTCTGCCTCTGAAGTTAGCAGTGATTTCCTTTAGAGCCTGGCCTTATCTCCGGCCGCACGTTGCCTGTTGGTGACTAATAACACAATAACATTGTCTGGGGCTGGAATAAAGTTGGAGCTGTTTACCCCCACTCTATAGGGGTTCAATATAAAAAGGCGGCGGAGAGCTGTCCAAGTCAGACGCGCTTCTGCAGCGGCGCTGGGGCGAGCGCGCACAGGGTCCTCGGTCCGCGCTGCTGTCCCCGCACGCCACCGCCGCGTGCGCCCGCAGACCGCTCCCACTGCCGGCCCTCCTGGCAGAAACTTCTTTTTTCTCTCCGTTAAAGAGCACTTAGGCTGAAGGCTCACTTTGAGATCTGAATAACCAGAAGAGCTTTGAGGGACCCGAAGCTATTATTTTTCTTCGTTTTCCTTTGGGTTCAGTTGGCAGGGGAGGACTTTGATCCCCACTCCCTCCCCCCTTTTTTTTTCAGAATGGATTATTTCCCCATGATTTTCTCTCTGCTGTTTGTGGCTTTCCAAGGAGCTCCAGAAGCAGCGGTCCTGGGCGCGGAGCTCAGCACGGGCTTGGACAGCGGAGGGGAGAAGCCCGCCCCCAGTGCACCCTGGCGGGCCCGCCGGTCCAAGCGCTGCTCCTGCTCCTCCCTGATGGATAAAGAGTGCGTCTACTTCTGCCACCTCGACATCATCTGGGTCAACACTCCCGAGCACATTGTTCCCTATGGACTCGGAAGCCCTTCTAGGTCCAAACGATCCTTAAAGGATTTATTTACCACAAAGGCAACAGACCACAGGAAGAGATGTCAGTGTGCCAGCCAAAAAGACAAGAAGTGCTGGACTTTTTGCCAAGTGGGAAAAGAATTCAGGGACCAAGATGGTATGGAGAAGAGCTGGAATGACCCTAAGAAAGGCAAAGACTGTTTTGGGCTTGGAGAAAAGTGTGTTCATCAGCAGCTGGTGGCAGGAAGAAAAATGAAAAGGTTGGACGCCATCAGCAACCGCATCAAAACAGCTTTTCGTGTTGCAAAGCTGAAGGCGGGGATCTACACAGAGAGGCAAGTGACTCACAACCGAGCACACTGATGGCAGGTCACCAGGGCCCATGGCTGGCCCGCCCGAAAGCCTTCTCCTCCGAGGAGGGAACCCTGTGGCTGATTCTGCACTCTCTCCCCATGGCTGGGATCAGAGCAACAGCATCCTCCCTGCTTTGACCGACCATTTCTTGCTCCAACTGGCAATGGACCAGTGCCCTCGCTCTAAACATTCCAGGGAAGGTTAAGGAGTCCCCCAATCCATCTTCATTTGCCTCCATTGGTGATAACTGCTTTCGTCTCTCCTCGTTTGGGGTGACAAGAGACTACTCAGAAGGCAGAGAGACACACAGTGACTTGTGATTTCGGGTGTCACCATCCAGAGGGAGGACAGGAGATTCCACACATGGTGGAATTTCTGAAGAGGGTCCGAAGGGAGTGTTTGTGTCTCACTCAGGCGCCTGGCACATTTCAGGGAGAAACTCCAAAGTCCATGCAAAGATTTTCTAAGGAATGCACAAATTAAAAACACTCTCGAAGGACACTCAAGTTAAAAAAAAAGAAAGAAAGAAAGAAAGAAAAAGACTTTTTTTTCTTTTTAAATTCACAAAATGCAAAACTAAAAGATACTGCTACTACTGTAAATCAGGATGGGTTTGATGAATCTGAGTCTACCTCACCTCTATTGCACTCTGGTAGAAGTACTCCCCCCCGCCAAAAAAAGAAGTACTTCCCCACCATTAACTATATCCCCCCC
>XM_030076989.1 PREDICTED: Myripristis murdjan Ras and Rab interactor 1 (rin1), mRNA 
ATGCAGGAGGTGGGCTGCTCCCAGCAAGGCTCCCAGAGGGCCTTCAGCGTCTTGGACCGTCTGCTCCTCACACACCCCGTCTGGCTGCAGCTGTCACTCAACCAAGACTCCGCCCTCTACATCCTGCTGAGAGAGCCGGTCGGGACGTTCTTGGTGCGTAAATGCAGCTCCACTCAGAGAAAGGTGCTGTGTTTGAGAGTGACAGCGGACCGAAGTGCCTCCTCTGTGAAGGAGTGCTTCATCTGTGAGGAGGACTCCACTTTTGCCTTGGAGAGCTCTGCGCTCAGCTTCCCTGATTTGTGTCGATTGGTGGCCTTCTACTGTATCAGCAGGGATGTGTTGCCGTTCCCGTTGCAGCTACCGGATGCCATCGCTAAAGCCACGTCCCACAGGCAGCTGGAGGCCATCTCACATATGGGACAAGAGTTTTGGAGCCCGCCCACTGCCTCAGAGATGCTGAACGGACCAGTGGACCAGTTGGCATCGACCAGTCAGGACCAGGCGGCGCTGACCCAGGACCTGTGCAACCTGATGGCCCGAGGCAGATACAGCAAACTGTGCTTCATAAACCCCCTCTTCATGCAACTGGAGCAGCCACAACATTCAAACCACGGTGCCTCCAGTAAACGGCACCGCTTAAAACGCAGCATGAGGCTCCGGCTCTCCAACGAATGCTCCATGAATCTGTCTCTGGAGGGCGTCGGCTCCTTCTCGCCTCCCTCCTCCTTGGAGGTGCCCGGCGGTGGAGAGAGGCTGCAGAAGGCCAGTCCTAACCCACAGAGAAGAGTTCATCCCGGGGCAGGGGTCTTGAGGCGAACCCCTGCTGTTTCCCCCGGCTCTGCAGAGGAAGATGACATCATGTCGACCTTTGTACCCCAGGTAAGAACCAAGGCTGGCGTGGACGAACCTACAAGGCCCCAGCATGGTGTCCGAGCGGAGGAGCCGAGCATCGAGGTGGCCGTGCTGGCCTTGGAGAGCCGTCCCGCTCCCTCCCTGGTCGAGCTGGACAGCAACAGCTCCTTCAGCAGCATGGACGACTCGGATTCAGATTCAGAAACTATGAGTCAGCCGCGAACGCAAGCCCACCAGCGCCCGCCCCTCGTGCGCTCGCGATGCCGCGGCGGGCTTCACCGCATGAGCGCGGCGTTTGTGTGCTTCTTCGCGCCGGAGAAGCGCCTGACGCGGCTGGTGGAGGAGCTGTCCCGGGACAGGCGCTCGATGTTTGGGGCCATGGTTCAGGACTTCATCGCGCAGCAGATAGAAGTGCTGAAAAAGCTGGATCCCTCTTCATCCTCTTCCTCTCCATGCGTGACCTCGGTGGAGCTGCTGCAGGGCCTGCGTCTCTTTCTGTCCCAGGCTAAGTGCTGCTTGTTGGACAGCGGAGAGTTGGAGCCTCCCATTGAAACTCTGGTGCCTGAGAATGAGAAAGACCTGGCGCTGGAGCGGGCCATGTTCACCTGTGTGCTCCGGCCGCTCAAGTCCCTGCTGGACCAAGCCCTGGTCATGCTGCACATTCAGGATGGCTCCAACCAGCGCCTCAGCAAGAGCCTGCTGCAGCTGAAGGGGGACAGGGCCATGGAGCATCTGGGGGTGCAGACGGGCGTCCCGGACAGCCGTGACGTGGAGAGGGTGAAGCAGAAGCTGATAATGATGCAGAGGACGTACTCACCTATTGATAAGGTGCTGCTGCTGCTGCAAGTGTGCAAGTGCGTCCAGAAGGCCATGGGGTCCTTACACGGCCAGCCGGTGAGCTGGGAGGACTTCCTGCCTTCGCTGTCGTATGTGATGGTGGAGTGTAACCGGCCCCACATCCTGATAGACGTGGAGTACATGATGGAGCTGCTGGAGCCCTCCTGGCTCTGCGGAGAGGGTGGCTACTACCTGACCAGCGTCTACGCCAGCCTGCGTCTGATCCAGAGCCTGGAGGGAGACCAGCCGCCCCCCGCCGGTCTGACCCAGGAGGCCCAGGAGGCGCTGAGGGAGTGGGGCTGCAGACGGAACCGAGAGGCCCAGAGACACAAGGAGAACCAGCAGACTCAGAGGTACGTTCGGATACTGTTCCAGGACGGGGAGCGAAGTGCGGTGCGGACGTTGCAGTGGAGAGCCGGGGAGACCAGCCAGGCCCTGGCACAGCTGTGTGCCGACACCTTCGGCGTGTCGGACCCCCAGCAATACACCCTGTACTGGCGCAGCGGCGGTGAGATGAGGGCGCTGCCGCCCCAGGCCCAGCCACAGGACCTGGCCAGCCACAGCGAGGGCGGCCCCTCGCTGTCCTACCTGAGGACCGACCACGACTTCAGCAAGATGCGGCGGCTGACCAGAGGCGGCGCTGTGGACCTGAGCGAGTCGGTGTGTGAGGAGTGAGTGGGAGGGATGGAGGAAGGAAGGAAGG
>XM_013321598.1 PREDICTED: Papilio xuthus rab11 family-interacting protein 2 (LOC106124683), mRNA 
TGATGCGACTGAACGGTGAACGGACTTAACAAACAAATGGTGACGGGTGACGGTCTATGATTATTGACTGCGACAGCTCATCGTTTGTATAACAGTAGTTTTTTTGTACATTCCATCAACAAAAATATTGCTTTATTATTACTATTTCTTTTAATAAAATGTGGGATCCGACACATGTGCAAGTAACAGTCCAAAGAGCCCGTGGATTATTAATTAAAGGTAAAAACGGTACTAATAACTGTTTTGTTACTATTGCCCTCGGTAAAGAAAAGTTTCAAACTTCCGTGAAACACAAAGCTACTGAGAACGTCGAATGGTTAGAAGAATGTGAACTACGTATTCCATCTCACGGCAACACTGCTGAAATCGTTTTGAAAGTTTACGACGAGGATTTTGTAAAGGATCACTTACTAGGTCAAGTATCGATTCCGTTAAAAGACCTCGATGTCTATGAACGTCCAAGAAATCGCTGGTATACATTGCAAGGTAAAACTGGGAAAGAAAGTGATAAAAAAAGAGGCGAGCTTGAAGTTAAAATAGGTTTTACAGTAAAAGAAGGAAGCCTGACAGATCTTAGCAAAAAGGAAAAACATAAATCATCTTTGTCAAGTATTGCTCAGAATGTAGGCGGAAGCCTTATGAGTATCGGAAGCATTGAAAAACGTAAAGGTATCAAGAAATTCGCTAAGAATCTTGGTTCCAAAATTAATCTGACAAAGAAAGATAAGAAAAGTGATACTTTATCACTTGATGGCAGTGTGGGGAATCTCAAAACTCCGACTTTGCTGACGCCCGACCATTCAACACCAAAAAGATTGTCAGGGGAAGCAGACCCTGGTGTAATTAGTGAAGATGAAGATGAATTTGCTTTTGATGATCTGTCCCATAAAAGTTCTGGGAGTTCACTCAATGTCCACACACTACCAAGAGGGCATAAATATACTCCATCGCCAGTTAATGCTTCCCTTGAAAACCTAGGAGGTGGAGAATTCTTAAGAAGATCAACAAGCAGTAACTTAGCAGTACCTGATAAGTTAGCACCTCAAAAACCTGTCCGCTTGAGTTTAGACACATTCACAGCTCCGCAGCTGCCTGCTCAAGTGATAGATAAAAATGATGAGTGGTCCCAAAAACTTTATTCCCGTCCAAAATCCAATAGCCAGAGTACTATTGACAGAGAAAAGTCATCAAGTCTAGAAAGAAATAAGAAACTGGATAGTCCCAGTTCTCTGAAAGAAAAGCCTAGCCCAAAGTTCTTTAAAAAGTTTGGTAACAATAACAAACCAAAGAAATTGTTAGAGGAGCGAATTATTGTTGGTGAAGAGAACATTGTTGAAGAAGATGCTATCAATCCAGCCTTTAATAACATTCCTAAGACGGTCTTGCAACAGTTTGATGGAAAGACAAGAGAAGATTTAATTGTCATGATCTACAACATGCAAAAAGATGCAGAAGCTGAAAAGAAGAAGAATAAAGATTTAGAAAATTATTTAGATGAATTGTTGCTTCGAGTTATGGAAACAACACCAAGAATCTTACAAAACCCATACACAAGAAACAACAGTATGCATATGAGAAACAAGTGAATTTAAAACTTTCTGAAATCAATATTTACAATGTCAGGAGTGAATTATATTAATATGATAATCACTGTTTTGAAAATTTTACAGAATTGAGTCCATCCAAAGTAAAATTATTAATGCAAAGATTGTGTCATAGTGGATTAGTATGTCTAAATATGGTATAATTTAAAATTAATAAAAATTTAAATGGATGCCTTGAGAACTGTGGCACAGTATTATAAAATAAACTTAGGTAAGTACTTGTCAGTTCAGTTATGAGATTTCTAGTTATAAACATGTTACATTATTTCTCATTATTTATTATGCAGGTGAAATTAAAATGTACTTCCTTATGTTCATTAATTGCTAGTAAGATTTCTTCAACCTAGTGCCTTATAAATTTTACTAAATCTGTGATAAAAGCAAATTTGATTTGATACAGAAATATATTGCTTATTTGATAAATTACTATGAGAATTATGAAACTATTAGCTACTAAATATTTCAAACATACTCAATTTATACATAATATGTCTATGTTATTAACTCATCTATATATCTATATTTTTATATCATTAAAAGCAAACATGCTAACACATCACCTATTGTTATGTGACCACTTTAACCTTGGTGCCAAATTTTGTTGTTTGAAAATTGTGGATAATTTTACTACCAAATCAAGATTTTTATTTTTGTATTATCTGATATGATATGGAATGTATTCATTTGTAAATCTACAATCTACAAGTTTTACAACCCTAAAATATAGTAACTTTTTGCTTCTATGGAAATATTATTAATCCCATGGGTGCGGAGTTATTTGAGAATATATTTGCATGTGGAACGGAATAACTTTTGATTGCTTGGAGTATTATGTAAAGGCAGTACATTTAATTTAAGAATGTTATTTATAAAATATTAAAAGTTTAATTTTTGGTTTGACGTCTTAAACACGTCATCCGTTCTTAGGGGGGAAAAGCAAATGACGTAAATGTAATGAAACAAAAAGAAAAGCAAACTGGAAACCATATGTGTGTCACAATTATTAATATCTAAATATAGAAAACTATTAGTTGATTTGTGAAATACTATTATTGCATTGCATATATTTTATGAATGTATATATACTTTATCATTTTTATAACTACAGTGAACCTTTGCTAAATAAGTTTTGGGCAGTATTGAAGTATTTAGGTGACTCTTTCAATTTGTCTGGGCGAATTACAAACAGACGACATTCACAATCGATCAGTTACATAAATATGAGTGGGTGAATCATGTGTTTAGTGATTCACTTATAATGAAAACTCTTAACGAGTCATGTAATAAACCATAGACATACCGGTTTAAAAGAGTTGACCATTATTATTGTTTATATAACTTTTTTACAAAAAATGTAGCTATTTCATAGACAAAACTGAGTTTCAAATTACTTCATAATATGTGCAATATGAATTAGCTCATAAGTAATTATACATCTCATTTATTAATGAAAGGCAATTTAGGTGTAATACATATCAAGGTCCAAGTTGTTATGTCTGAAACATGGAGAAAAAGTTCATATTACTTTGGTACTAGATGAACAAGCCTTTATTTACTTAAATTTATATTAGTGTTATTATTCTTATGTAGTTGTGTTATTTCAGTGCAGTCAGCAAAAAACATCGATGATTTTTAATCTTCCTTCACTTACACTTATGTTCACCAATACACACAGCTGAGCACTGGGCTCTCTGACCTTTTTAAGACTTGGACTGCAGTGAGAATCACACAACTATTATATTTATGGTTGCATATTGAACAATGTAACCTTGATTATATTCTCCACTGAGTGAGTTGATAAATTGTAATTTTAGAAATAGGATACTATAAGCCTTACTTGTAATTCAAAGATTTGTTTAGTGTTTATTTATTTTTTATTTCATTTAAATACTAAAATTGATTTTATTTACTTCCTTTACCATTTTTCATTAACCATCAATTGTTTGATTTTGAACTTATTTTTTATTAACAATTAAACTACTAACTCTTAAATTATTTAGTTCATGTATCTAATAGTTAAGAGTAAAGTATGTTTATATTCATTGATT
>XM_031377017.1 PREDICTED: Mastomys coucha olfactory receptor 2A12-like (LOC116095757), mRNA 
ATGAGGATGTTTTCAGGACAGAACCAAAGTTGGGTTTCTGAGTTCATCCTGCTTGGTTTCTCCAGTGACCCCATGACCAACAGCATCCTCTTCATTGTCTTCCTTCTCATCTACCTGAGCTCAGTCCTGGCCATGAGTCTGCCATATTGTGGGCCCAATAGGGTCAACCATTACTTCTGTGAAGGTCCTTCAGTGCATAGCCTGGCTTGCATAGATACCCACCTCATTGAGATGGTGGATTTTGTATTGAGTGTTTTTGTGGTTGTCATTCCCATTTCCCTCATTGTGGCTTCCTACATTCATATTGCCAAGGCAATTCTCAAGATCAAGTCCACCCAGGGCCGCTGCAAGGCTTTCTCTACCTGTGCCTCCCACCTGACTGTGGTCACATTCTTCTATGCTCCAGCCACTTACATCTACATGAGGCCCAACTCCAGCTACTCTCCTGAGCGAGACAAGCAGATCTCACTCTTTTACAATGCCTTCACAGCCTTGCTCAACCCTGTGGTCTACAGTCTGAGAAACAAGGACATCAAGAGGGCATTTCTCAAGGTGATGGGACATGGTAGGCTGGACCAGTGA
>XM_021109787.1 PREDICTED: Arachis ipaensis putative amidohydrolase YtcJ (LOC107613187), transcript variant X3, mRNA 
AACTTATAACAGACATTTAGTTTCCGATCATTGGAGATGCTTTAACTCACCTCTTCTCAACATAGTTCCCCCATTTCTCTTCCACTTCCTCTCCCGCTGTCGTTTGTCAGCGCCGCCAGAAACGACTCTTTAGCCCTCCTCGACGTCGTTCCTCTGGTTGAGCTTCGTGCTGCCGTTTCATTCACTGTGTCTGTTATTTGAAATTTTTTACGTCGTTGATGCTGCTGTTCCGAATAACATTAGCACATCAAGACGTGAATTTCATGATTTGCTGAGGCTATTTTAGGAAATTGCTACAGTACTCCTGGATATTACATTGGGACAGAAGAGTGCCCAATGAACTCTTTTCTGAAGCTGCTCTCCATTCCCATAGCTCTCCTCTCCATTCTTTCTTTCTCCTTTCTTCACCCAACTCATTTCTTGGGTTGGAAGGCACTAATGTCGTCTCAGCAAGTGGCAGATTTGGTTGTGAGGAATGGGGTGATATATACAGGTGATGATTCTCTCCCGTTTGCAGAATCCATGGCAGTGGCCAACGGGAGGGTTGTCCGTGTTGGAAACCATTCCTATGTGCAGGAGTTGGCCAGCTATGGAACTGAAGTGTTGGATCTTGGTGGGAAAGTTGTGGTTCCGGGGTTTATTGATTCCCATGTGCATTTCATACCTGGTGGATTGCAGATGATGCAGGTGGATCTGACAGGTGTGAATAATAAGGATGAGTTTATCAGAAGGATCAAAGATGCAGTACAAAGTACAAAACGAGGTTCTTGGATTTTGGGTGGAGGATGGAACAATGATTTATGGGGAGGAGATCTGCCAGCTGCATCTTGGATTGACGATTTCACTCCTTACAATCCCGTATGGCTATCAAGAACAGATGGTCACATGGGCTTGGCTAACTCAGTGGCACTAATGTTGTGCGGCGTGACAAACTTAACAGCTGATCCGAGTGAAGGGACTATAAAGAGGACTCCAGATGGAGAACCTACTGGATTGCTGATCGAATCTGCAATGTCACTTGTTATGTCGCAGATTCCAGAGGATTCAGTAGATAATAGGAGGGAGGCACTGCTTAGAGCAAGCAATCTTGCCCTGGAAAGGGGTGTGACAACAGTTGTTGATATGGGAAGATATTATTCAGGGACTTCAGCAAATCTTTCTTGGGAGGATTTTACAGATGTTTATCAATGGGCTAATTCTATGTCAAAAATGAAAGTTAGAGTGTGTTTATTTTTTCCAATGGAGACATGGTCACGTTTAGTGGATGTGATCAACAAGATGGGTTATGCCTTGAGCGAATGGGTGTACATTGGTGGTGTCAAAGCTTTTGCTGATGGCTCATTGGGTTCCAATAGTGCATTGTTTTATGAGCCGTATGTTGACGATCCAAACAATTATGGCCAACAACTTATAGAGTCCGAAGCTCTTTTCAACATGGCTTTGGAGTCAGATTTATCTGGTCTGCAGATTGCAATCCATGCTATAGGGGACAAAGCAAATGACCTGATCTTGGACACATATGGCTCAGTTGCCTCTACAAATGGACCGAGAGATCGAAGATTTAGGGTAATATGGTTACTATTGAGCATGCTCAGCATCTGGCTATGGGAACTCCACACCGATTTGGCAAACAATGGGTTATTGCTTCTATGCAGGTATACCATTTCCGCTGCTCGGGCAAGCTTCCTTGACAATGATCTGGGATCCTTATCTCCAGGGAAACTTGCAGATTTTGTCATACTAACCACTCATTCCTGGGAAGAGTTTGCTGAAAGTGCATCTGCATCTATTGCCGCGACATATATTTCCGGTGTGAGAGCATATCCTTGAAGGTATTCCATAATCTATTTCAAGTTTTACAATCAAATTTGCATCAGATGTGCAGAAGGAAAGAAGTGTTGTAGCGCCAGTCCTCTGAAAGGTTTTAAATACAGTCATCTTATTTTTTATTTTTTTAGGAAGATTAATACATACGCATGAGAATGTGAACATTATTTTAATTCCATATTGGTGTATTAATTATTTCATATTTGTTCTTGTCATGTGAGTTTTTCTATATTTCTTTTATACGACTAATACTAGGCGTACACCAAAATCAACTATAAAATCAGCCATTGTATTTTTATACG
>XM_010548157.1 PREDICTED: Tarenaya hassleriana uncharacterized LOC104818540 (LOC104818540), mRNA 
ATGGGAAGAAAAAGTTCGAGAGGTGATAGCGTTGCCGAACGGTTCTTCAAATGCGCTGAAGCTTATACGTTGAACGAATTTGAAGACCTGTTTAATGATATAAAGGACAGGTATCCCAAAGTTGCGGAGTATATGCAGAAAGAAGAACTTGATCCCGAGAAATGGGCAAGGTGTAAATTTAAGCGTCAAAGGTACAATTTATTGACAACAAATGCAGAGGAATCAATAAATTCTGTAATGAAGAAGGCCAAAAGGTTTCCGATGCTGGGCCTTCTGGATATGTGTGTCTCCAAGACCGTGGAATGGTTCAATAGATATAGAGTTGAAGCAGGATGTGCCGATGATTCACAAAAAATGACACCGCATGTTGACAAAGTGCGCCATAAGAGGTATGAGACTGCATGTACGTATGAAGTCATTGTGCTAAACACTGTTACAGAGGAGTTTGAAGTGATGGGTGAAAAGGGTAGAAAACACTTTGTTAGCATTGAATGTAGAACGTGCAGTTGTAGGGTGTTTGATATCGATAAGATCCCATGCAGCCATGCAATTGCAGCACTTCATAAGGTTGGTAAAGCGAATGTTATACTAGACTTATGTTCTCCATACTATACACGGGAGGCATGGCGTCTTGCCTATCAGGAAACCGTGTATCCGGTCCCCGATTGCTGTGAATGGATTATCAATGACCCGGATGTTACAAATCTTGTGGAAATGCCTCCTATCATGGATGAGAAACGATAA
>XM_032257218.1 PREDICTED: Sapajus apella replication termination factor 2 (RTF2), mRNA 
AGCGGTTTGCGTCACTGCGGTGCGCCGGAAGTGGCTGCAGATTCCGTCAGTAATCCCGGAAGTGGCTTCTTTAGGGTTTTGCTGCTGGCTGTGACTCCTGTTCTGCGATGGGTTGCGACGGGGGAACTATCCCCAAGAGGCATGAACTGGTAAAGGGGCCCAAGAAGGTTGAGAAGGTTGACAAAGATGCTGAATTAGTGGCCCAATGGAACTATTGCACTCTAAGTCAGGAAATATTGAGACGACCAATAGTTGCCTGTGAACTTGGCAGACTTTATAACAAAGATGCCGTCATTGAGTTTCTCTTGGACAAATCTGCAGAAAAGGCTCTTGGGAAGGCAGCATCTCACATTAAAAGTATTAAGAATGTGACAGAGCTGAAGCTTTCTGATAATCCCGCCTGGGAAGGGGATAAAGGAAACACTAAAGGTGACAAGCATGATGACCTCCAGCGGGCACGTTTCATCTGCCCCGTTGTGGGCCTGGAGATGAATGGCCGACACAGGTTCTGCTTCCTTCGGTGCTGTGGCTGTGTGTTTTCTGAGAGAGCCTTGAAAGAGATAAAAGCGGAAGTTTGCCACACGTGTGGGGCTGCCTTTCAGGAGGATGATGTCATCGTGCTCAATGGCACCAAGGAGGATGTGGATGTGCTGAAAACCAGGATGGAGGAGAGAAGGCTGAGAGCGAAGCTGGAAAAGAAAACAAAGAAACCCAAGGCAGCAGAGTCTATTTCAAAACCAGATGTCAGTGAAGAAGTCCCAGGGCCATCAAAAGTTAAGACAGGGAAGCCTGAAGAAGCCAGCCTTGATTCTAGAGAGAAGAAAACCAACTTGGCTCCCAGAAACACAGCAACAAATGAGAGCTCTTCTGGAAAAGCTGGGAAGCCTATGTGTGGAGCCACAAAGAGGTCCATCGCTGACAGTGAAGAATCCGAGGCCTACAAGTCTCTCTTCACCACTCACAGCTCTGCCAAGCGCTCCAAGGAGGAGTCCGCCCACTGGGTCACCCACACGTCCTACTGCTTCTGAAACCCACCCGGCCACTGCTCCTGCCCCAGAAGGCTGTCTGGTTTCCACCTAGGCGGGTCGCTGTGCACGCTGCTGTGTGTTCTTTCTGTACATCATAAAGCTGACCTGGCCAGCCTTGGAACTGGTGTGGCCACTCTTGTTGTGAGGTGCGTGTGTTCCAGGGGGGACATAGGACGGGCTGCACCGTGCCTGAGGTCTTGCTTGCTTCCACCTGCAGGTACGCTTGGTCGTTTCTATGGCCAGGAAGCCCTGCAGGCCGCACTTTTTATGCTTCCAGTAACGAGAGATCCCGGAGTCTTCACGAGAGCAGAGTTGGCACATATTAACTAAAATTATGATTTTGCTACCAGCAATAAATTAAGTAGGCCAAGTGAAACTGGGCTTTAGAAAGGGTGGATTTCAAATACACTGTGCCCACTAGAAGCTTTGAAGGGCCTCATCCCTCTGCTCCATCCCTGGGAGGAGTCCGGATCCTTGTTGGTCTAGCTAAGTACTATTAGGGGAGTCTGCCCCTAGCTCATCATTTGAAGACAGCAGAGTCTCAGTTGGGCACCAGTGATTGGGTTCAGAAATAAAGTTGGTCTGCCTCTTCTC
>MG651402.1 Priestia aryabhattai strain FJAT-46583 16S ribosomal RNA gene, partial sequence 
TGCAGTCGAGCGAACTGATTAGAAGCTTGCTTCTATGACGTTAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTGCCTGTAAGACTGGGATAACTTCGGGAAACCGAAGCTAATACCGGATAGGATCTTCTCCTTCATGGGAGATGATTGAAAGATGGTTTCGGCTATCACTTACAGATGGGCCCGCGGTGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGCTTTCGGGTCGTAAAACTCTGTTGTTAGGGAAGAACAAGTACGAGAGTAACTGCTCGTACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGAAAAGCGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGGCTTTTTGGTCTGTAACTGACGCTGAGGC
>XR_007238697.1 PREDICTED: Ziziphus jujuba var. spinosa serine/threonine-protein kinase ATG1t-like (LOC125420078), transcript variant X3, misc_RNA 
AAAAATAAATGGAACGCGTAAGTCAATCCTGTTGTAACCTGCGAGGTTGTTGATGGAAGAAGGGGAAAATGGAAGAAGATGGAACAACTCTCTGCAACTGCGACGGCATTAGAGTGGGAGACTATATTCTAGAATCAAAGCTTGGAGAAGGCTCTTTCTCTGTAGTTTGGAAGGCCCAGCACAGTCTCACTGGCCAACAAGTGGCTCTGAAGCAGGTCTATCTTTCAAAGCTCAATAGGCACCTCAGAAGCTGCTTGAACTGCGAGCTTACCTTCTTGTCCTCTGTTAACCGCCCCAACATAATTCGTCTCTTCCATGTCTTCCAGGCCAATAGTCCCCATCCTCCGGGAAAAAGTTGCATCTTCCTGGTCCTGGAATTTTGTGCTGGTGGGAACCTAGCTTCTTATATCAATCAGCACGGGAGAGTTCAAGAACAAATCGTTGGAAGATTTATGCAGCAGCTTGGGGCTGCTTTAGAATTACTTCACTCTCACCACATCATTCACAGAGACTTAAAACCAGAGGTAACATCCGTACTATCAGGGGCACTGAGGTTCATTTCTTCAATGCTTTTTGGAAGCTTGTTTTGGGAGTTTTTACAATTAAACAAGTACTTACACCAAGTGCCAACCTTCAGTTTGAAGATTTTAGAGCGCAAAGTTTGGAAAAATCTAAGGATTTTTAACAATTTCATGATGAAGCTTTGGTAAAATTTCGAGCTAAAAAGAAAAAAGCCTACCAAGAAGAAAAGAAGCAAAAGGGTCGTGCAACTTTATTCTAGGCACTAAGGCTAATTTCTTCAATACTTTTTCAAAGATTGTTTTGGGAGTTTTTACAGCTAAACAATTACTTGCATTCAGGGTTGTTGAGCTTCAATGTGTAAAAGATGGAGTAATTTGGGTTTATGGTAAAAGAATTAAACAATCTTTTGAGGAGAAGAGCTTAAGCATCCAATTCTTTCATCACTTAGCTTTATCTAGCGAGAGAGGTAAAACCAAGCTCTTATTAGGATGCAACCCAAATGTCTCTTACAATTTCTCTTTATTTTTAAGTTTAAGTTTTTATTTTTGAAATTTAAAGTTTGAGTTTGATCATTTTAGTTGTTTTCATAATTAGTAGAATTTATATTTTTGAATTCCATCTTGTTTGACTAATTTGGGTTTATGGTAAAAGAATGAAGCAATGTTTTGGAGGAGAAGAGCTTAAGGATCCAACTTTTTCATCATTTGGCTTTGCCTAGCCAGAGAGGTCAAACGAAGCATTTCTTGAGAGGCAACCCAAGTGTTTCTTACCATTTCTCTCTATTTTAAGTTTTTGTTTTTGAAATTTGAAATTTGAGTTTGATCATTTTAGTTGTTTTCATAATTAGTAGCATTTATATTTTTGAATTTCATCTTTTTGGCTAGTAAATTGGGAGTTTAAAACCTCAAATTTAGATGATTAAGTTGGTCAATCAAGAAGTATTCAAGAATGGCACAAAGTTAATGACCAAGGTGATCTAAATGGGGGTCATCTCACTCATCCCCGGAGAAACAACCTGGATGGGGC
>XM_053020070.1 PREDICTED: Gossypium arboreum probable pre-mRNA-splicing factor ATP-dependent RNA helicase DEAH9 (LOC108487114), transcript variant X2, mRNA 
TATTTGGGCTTAGAAACCCTAAACCGAAGCGAGAGCGAAGCTAAATAAAAAGCCCGTTTAGTTACATTACTGAATTTTGATTCAATTTCCCTCGAATCGGGAAAAGTAAAACTGAGCTTAAAATTATGGCGCAGTTCTGGAAACCGGGAACCGAGAAGCCCCGCCTCCTCGAGGACGAGGATGGCGGTGTTATTTTCTTGTCATCTTCTTACTCTTCATCTTCTTCTGGATATGGGTATGTGAGCATTGAGAAGCAAAGACAGAGGCTTCCAGTTTATAAGTATAGAACTGCTATTCTTTATTTAGTGGAGTCTCACGCTACTACCATTGTTGTTGGTGAAACGGGTAGTGGTAAAACCACTCAAATTCCACAGTTTTTAAAAGAAGCTGGTTGGGCTGATGGTGGGCGTGTTATAGCTTGCACGCAACCAAGACGACTAGCTGTGCAGGCAGTTGCTTCAAGGGTAGCTGAGGAGATGGGGGTCAAACTTGGAGAAGAAGTTGGTTACACAATCCGGTTTGAAGATATCTCTAGTCCAGATCTTACTAGGATCAAATTTCTCACAGATGGAGTCTTACTTAGAGAAATGATGGATGATCCTCTTTTGACTAAGTACAGTGTCGTTATGGTGGATGAGGCGCATGAAAGATCCATTTCAACAGACATTGTACTTGGTCTTCTGAAAAAGATCCAGAAACGTCGACCGGAGCTGCGACTGATTATATCTTCTGCTACGATTGAAGCGAAATCAATGTCTAATTTCTTCCTGTCCAGTAAAAGGCGCCAAGCATTGGAAGGTGAGGAGCTTAGACCTAGGTTGGAGCCTGCTATCTTATCCGTTGAGGGTAGAGGGTTTAATGTGCAAATTCATTATGTGGAAGACCCTGTACGAGACTATGTTCAGGCTGCTGTTTCAACAGTGCTATTGATTAATGACAAGGAACCACCAGGTGATATTTTAGTATTTCTTACTGGTCAAGATGATATTGATGCTGCTATTAAGTTGCTTACTGAAGAAGCTCGAAGCAATGGGAAAAATTCCTCAGGGTTGATTATTTTGCCTTTATACTCTGGACTTACACGTGCAGAACAGGATTTGATATTTTCTCCAACTCCTAAAGGCAAGAGAAAAGTAGTGATATCAACAAATATAGCAGAGACATCATTGACTTTAGAGGGTATTGTCTATGTTGTTGATAGTGGCTTCTCAAAACAACGATTCTACAATCCGATCTCGGATATAGAAAATCTTGTGGTGGCACCCATATCCAAGGCATCTGCTAGACAAAGGGCTGGTCGAGCTGGTAGACTTAGACCTGGGAAGTGTTACAGATTGTATACAGAAGAGTATTTTCTCAATGAAATGTCTATTCAAGGAATTCCTGAGATCCAAAGGTCAAATCTTGTTTCTTGTGTGATTCAGTTAAAAGCATTAGGCATTGATAACATTCTGGGCTTTGACTGGCCGGCATCTCCATCTCCTGAATCAATGATCCGAGCACTTGAAGTACTTTATTCACTTGGAGTCCTTGATGATGATGCTAAACTTACTTCACCAGTTGGTTTTCAAGTTGCAGAAATTCCACTGGAACCAATGATCGCAAAAATTATTTTATCTTCAAATGAGCTTGGGTGTTCTGATGAAATCATAACTATTGCTGCTGTTCTCTCTATCCAGTCTATCTGGTTTTCTGCTCGAGGAGCACAAAAGGAACTGGATGAAGCCAAATTGAGATTTGCTGCTGCTGAGGGTGACCATGTTACTTTCCTGAATATTTACAAAGGGTTTCTCCAGTCTGGCAAATCTTCAAAGTGGTGTCACAAGAACTTCATAAACTACCATGCCATGGTGTGTATTTTTATTTGGGCATTTTTGAGAATTTAAGATACTGTCCAGTTTCACTCTGTTACCTGTCTTCAAGTACAAGAACATTAAAAAGGTAATGGAAATTCGGGAACTACTCAGAAGAATAGTGCTGAGGTTGGGCATAGTCTTGAAATCTTGCGAAACAGATATGCAG
>XM_020956221.1 PREDICTED: Drosophila serrata CTD nuclear envelope phosphatase 1 homolog (LOC110186899), mRNA 
AAGCCCTGGCGATCATTGTCAGTTTTTCAAATTCTGTAAACTTGTAGAAAAATAATTAAACTCTTTTCAAAAAACCTCACTAAATTAGTTTTGAGATTATTTAAGATTCTTAATGGTATTAAGTTAATTGGTTTCAAATTTAATCATAAGCTGGTTGAAATCTTAATAAAACCATGACTGGCGACTCGTTTATGTTTTTCTCATATGGACTGATTACTTTGGCCCTGCTGCTGGCGATCATTTGCCTGTTTTTGCCCAGGGTGGACAGGTTCATCAAGTTGTCAGCGGGCAGGATATACAAGATCTATGCAGAGTACACTCCTATAGGATACATGATCGATGATTCCTTGACTCCTGTTTCCCGACGCCGTCTGCAGCGGGTGGCTAAGAAGACACTGGTGTTGGACATGGACGAGACCCTGATCACGGCCTGGATTCAGCGACAGGACAAACGTCGGCAGTCACCACCCAACGTTCCCCACGACTTTAAGTTCGTGCTTTCGGATTCCAAATATAAGGGCAAGGTCTATGTTTATAAGCGTCCCCATGTAGATCACTTCTTGAACTGCGTATCCAGATGGTATGACCTGGTGGTTTTCACCTGTGGAACGGAGCATTACGCAGCACCTATTCTCGATTTCCTTGATAATGGCCGTGGGATTTTAACCAAGAGGTTTTACCGTCACAACACCATCGATGTCGCTGGCCTAAAGGCCAAATATATATCGCTGTGTTCGCCTGACATGGCAAATGTCCTGCTGCTAGACAATTCCAATACAGAATGCAGCTTCAATGTGGGAAACTGCATCCCAATCCCATCGTATAAGATTGGGAAAAAGGACGAAGCCCTTCTCGACCTCCTGCCATTTCTGGACGCCCTGCGCTTTACAAGAGACGTGAGATCGGTTCTGGGAAAATGCACTCGCTTCGAGTGCCTTACCACGCTTCTGGAGAGTCTCGGCAATTACGATTAA
>XM_046865945.1 PREDICTED: Silurus meridionalis translocase of inner mitochondrial membrane 29 (timm29), mRNA 
TGAATGGGACCTGCACCCTACGTAGCGCCCAGTATGTCCACTAGATGGCGATTTGGCTTCCGTCCCGGACGCACGCTGTGACTGAGACGCTAACATGGCGGCCTTGAGGAGGTGCTGCTCCAGTGTAGCTGCTGCTGCTGTCAAGAGCAAGGGGACGAGATGGGAGAGACTGTGGGACAGCCGTGCAGGTGTGTGGTGCCGCAGTCTTCTGAATGATTACAAGGAGGCGTGCCGTGAAATATTTGTTGGAGCATATGAGCGCCCTTTGAAAGCCAGCCTTTACGCGGCTTTGCTCGGAGGCACCTACGCCTGTTGCTACACCAACCCGGATGAAACTTCCTTCCAGGCACGGATACTAGAGACCTCCAACCAGCTCGCCCTCCTCTCTCCGTGGATCCGTAGCGGCACGTCTGACGGGCACGTGCAGAGCTTGGCCAAGCTGCGCAACGAGGGCCGTTTGCGACACATCAGCCTGGGTATCATCTCATTGGCATACGAGGCCGACTACGACCCTGAGTCCAGCCTGTACGAGGCAAGGTGCTCTGCGCTTTACGTACCCTGGGCACAGTTGCGAGAGCGGGTGCTGGACGTAGGCTTTGCAGGCCGTTGGTGGGTGTTGAAAAAAAAAATGGAGAACTATGATATAAATGAGGAGGAGTTCAAGTATCTTCCGCCTGTCCTGCTGGCCACAGCCCCGCCTACGGTACAGGAGACCGAGAGAAACGAAAGACTGCACCAGGAGTCCTTGAAGGCACTGGTGATTGAGGGAGAAGAATAGATGGGGGAGGGTAGCAGGTGAAGGAGAAGAGAGCAGTACACAACAGAACATTTGGTAATGTGAACAGTTCCTGATTGAGACCTGTGGACATGTCCTGTATGGTCAAATAATTTGATGTATAATGGCCTAAGAGGACGTTTCTGAAATATTTATTGTGGTGAAACATAATGCTGTTTATCCGTTTGTCTTGTGAGAAAATGAATCTTTGGAATCTTTGA
>XM_039776918.1 PREDICTED: Perca fluviatilis serine-rich and transmembrane domain-containing protein 1 (LOC120543720), mRNA 
AGGGAGGGCAGAGACAGAGGAAGTCACAGAGGGAATGAGATTAGAGCGAGCACTACTCCCTCTCTTCTCTTCTCTCTCTTCTTTTCTCTTCACCACTTCAGTAAAAAAACCCATAATTCATTAGTTACAGCCTCTCAATTAGAGACCTTGTGTATGTGTGTTTCCTTTTGTATGTGAGCCCATTCATAGAGAGAATCCACATCTGACAGTGTCTACTCCAGCTGTAGTGCATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTGTGTGTGTGTGTGTGTGTGTCAACCTGAATGACAGAAAGAGAGAGGGAGAGGGAGCGGACAGGCTCATAGGGAAGATCTCAGCAGGGGCAACAGATCTGGATTTGCTCGGCTGAAAACACCAAACACAACAGGATGGATTTCTGCACGACGTGAACGCGACCGAGGAACACCCGCATCACACATTAAAAAAGCCAGGATGTCAGGAATGGACGCGCTGTTGGTGGACCGTAATGAGACTGAAATCTCTCCAATAGACAATGGGACCTTCCTCCGTTTCTCCCCAACCTCTGCTTCCACATCTGCGGCTGCCTCGTCACCAGGACGTCCGGGCAACGTTTATGTTTACGTGTGGCTTTTTTTCGGCCTGCTGGTATTCCTCCTGACGCTGCTCATCATCTCCCTCCACAGGCTGAAAAACATCATCTCCTCCTCCTCGTCTGTTCCCGACTGCAGCAGCGAGGGAGGGAGCTCCTTCACCAACATGGAAATCTGTAGCATCTCGTCCCAGAGGTCCACCATCTCCTCACTGTCCACCTAAGGGAGATGGGATGGAGCACATACAGACACATAGACATACAGTATATGTCCATGTGCTTACATGGTAAGCATGCACACACACAAAGCCCATGGAGGTCCAGTGCCTTCTCACTGTGACATACAAATACAAAAACACTTTTTCAGCCACAAAGAAGCGGACAGCATGGCATTATAGTACATTCCGTGCATGTATATTCTATTTCCGGTGGTCCAGTGAGTCAGGTATGTCCATGCGATTTGCATAGGCACAGGTGAAATATAGCTCACAATGTGATGAAGAGGTATTGAGGGTTGAGACTGACTGAACCCCTTTGAGCCTTATTTCAACGACAAAGACAGATGAACCTGAGAAACTGCTCTTCCTCAGCAGGAAAAAGCATTGGAACTATTGTCTTTCTTCACTGTTTTTGTAAAGGTAATTTATTGTACTGTACTTGTCATATTTACTGTGGAACAAATAATATTGCTTTATAGTGCGTACAGCATGTCTCATAATGTCTGTAGACTACAGTACATTGCCAAATCAGAATTACAATAATATTTAAGACCATACATTGTACAGAAATGCATGCTTGTGTCTCAGTTGTTCAGTAAGGCTTTGGGAACTTTTTTTTTTTTTTTTTACCACTTGGCAAATTTCTGTATGATGCCCCTGGGGAAAGGACAAGACATACTGCTGTGGATGTAAAGGTGAGAAAGAAATGAGGGCTGTCTCTTGGACTCTTGACAGACAGTCTGACTGCAGCTATAGACCAGGTCAAAACTGGCATAAACAACAAGATGAAATTCTGGTCCTGAAAGACAGTTGCAGTCTCCATAGTGACTGATGCTCTGAGAGCTCTGTGCAGCTGTCAGCCTTGTCTGTATTCCAAGTATAACTACAATAATGGTTGTTTTGGCTCAACATACATCATTTTTGTTTTAATACCGTAAAATGTTTCTTTGACATGGCAACAAAAATACACACTCGAAACAAATTATTAGAAAAAGATTCATTCATCTTTGTCACACTTTGCCATAAAATTCAATATGAACTGATGGCTTGTAGAGCAGCGATGACGGCTACGAGGCCACGGACAATACAAGGAGTCATATCTGTCAGTGTTCTTATCAACAAATCCTAATTTTTTTCAGTTGATGGTACTGTGTCAGCCAAACTCTTTGGTTCCCCAATCACAGTGTTGACTATTGGTTCATTATCTCAGCTGTTGACAAACATGTATGGTTATTATGTCTAGAACCTGTTTGGTTTAAAGTACAAAAGATGTTTTAAATAATAGCTAAATGTTGGTTTTCAAGTTAACCAGGAAGTAAACTCTTTGTTTTAGCCTGGTGATGTTAAAAGAATAACCCCCTGATTGAACCCCCTGACTGTGTTTTGTTATATTAAAGCTCACATTTTCAGTTCTAGTCCTGCAAACACAAATCATTCAGTGAAAGTAGATTCAATTATTTTCCTTGCATGATTTACTGTACTGGATGTAACTGCAAAGCTGACTTTTGTCCCTGGATTAAATGAATGCAACTAAGGATTCCATCCTCTCTTACACATTGTACATATTCTCTTTTTTCATGCTTGTAAGGGATGTGTTCCTACTTGTATCTCTATTTGATTACTGGGTCTGCTGCATAAGGTGCTTTAATATCCTGTTAACGGAAACTCCCAGCACCATGAGCCCAACAAGTCTACAGCAACTTGTGACGCATGCAATTAACCAAACTCACACCTGAAACTTTACACAGTTTATCTTTAAGAAGCTCCACAGGAGAGGCTTTGAGTTACATGACTTGCTTAAGGGAACTTGAGTTCTTTCATTGATTCGATTTAAGCAGGAGACAATGCAGGACCAGATCCTACAGATGGAAAAAACATACAGCTAGTGCTGGAAATAGAAACTGGACACGTTGTTAAACTAACGCTGCTCTGTACGTCTTAGGTCTGTGTTCTTAGGAGGTGCTGCAGAGAATGACGGACAGTAACAGACTGAAATGTGTTTCTTGAAATCATCTGAAGAAGACTGGTGTCTAGTGAATGCAACAATAACACACCCTTGTGTGTTAAAAAGGAACCTTTTAGTGAAAAAGCATATTTGACCAATAAAAAGTAAAGTCATCAAA
>XR_006253100.1 PREDICTED: Puntigrus tetrazona uncharacterized LOC122362386 (LOC122362386), transcript variant X1, ncRNA 
GTGTGTGAGAGAGAGAGAGTAAGAGTCCTATCATGCCTGTGTGCTGAAGGTAAGGGTTATTCCAGTCAAGCACTGAAGTCACTGAGGGGCTTGTACATGTCGGTTCTTGTCAGACGCAGCAGCTTTTTCTATCTCTCTTTCTCCCTTTCTTCCCCTATTCTTCCTGCCGGCCCGCTTTTCTTTTCTTTCTGTCTTTGTCTCTTTCCATCTTTCCTCTCCCTTTGAGTCCTGCTCCAGTAGACCTGCAGGTTTTAATGGCTCTGTGAAACAGTATAAAAGCAGCGGGTGCATTGAGTCATTTTAGCCTGAGGACTCAGACTGACTCTGTTTGTCTTTCTGTTGCAGCTGTCACTCTGCAGCCCTCCACATTCACAGCTTCACTTAAACGCCAAAATAGAGAGATAAAATGGTCGTGGTCATTTTATTGTGCATGGAATAGCCCTCGCCTGCATCCTCGTATCAATCAGTTAAATGAGGTGCTCAGACAGGAGCACAGCATGGCAGTAATAATGGAGTAGATTCTAGAGTTGATGGCCATAAGACAAGCTGAGAGCTCACTGTGCTATGGTCAGCTACATCATTAAACACACGCATGCACTCAGCTCCGAACGCATCTAATTTGACAAAATTGCTAGAATAATAATGAATGATGTTTGCTAGACACGTCTTATCACATCATATCCTTCCTAGTATACAATTTGGTGAGGTCGGTGCAGTCAGTACTGGACTGGTGAACTTTTCCCCTTCATGAAAGCACACAGAAAGTACTTAAATTGTGAAACTTGTGATTCATTAGCCACTATAGGCCTTAGTCTGAGAATGGCCATATTTAATTTTTGACAGCAATGAACAGGAGGCTGAGGGTTAGTACATCGTGTTCAGTGGATTGTACTGTTTAACAATATACCAACTGTTCGGCTGACAAAACAACTTTCCAAAAGACAGAGACTCCAGTTTTAGTTTTAGTTGTGAACGTAATCTAGGAGCTTTGAACAGATTGTAATCTCCCACATTTCATCCTGGGAAAATTCAATATGGCATCTGCCCTGATTAAAGTGTACATGTAAATAACTAGAAATGCAGTAAATTTGGTAAGCTGGTTAGCTGTTTTGAGCTGGTCAGCAGGCTGGTTTTAGTCGGGTTTTGCCACATTTCCCAAATCATGCCAGGCTGGTCTTAGCTGGGAGACCAGCTTGAACGACCAGCTAAAACCAGCCTAGCCTGCTGGGAGACTAGCTCAAACCAGCCACTTCTAGCTTAAACCAGCTAAGACCGGCCAACCAGCCTTTCTTTTCTTCTTCAGCAGGGCTACCACTTCACAATAACAAGCTGCATAACTGACTGTTTCTTAAACGTTGGCTGTGACCGCCTTGCACAATCAAAATAAAAATGGAAGTGCCCATTCTTACTTTAAAAATAAGGACACACTCAGACATGTTTGGGTCAACTCTGGAATGTAGTGTCGCCTTAAATTGAACATTTAAACATGTTGTTGTTTTTTCAAACCGTGCAGTAGTATGTGACATTTTCTATTTGAAAGGAATGACATTTAAAAGAAATGTGTTGCCACTGGCTTTAGCATTTCAAGAAATATGTTCAAGAAACAAAATAATATTTTAACCATTTATCAGAATTTAAAAAGGAACAAAAGGCGATTTTGTTCTTGTTTTCTCAAACTGTCTAAAGTAGATGTATTAATTAATCGTCAACTCGTGAAAATAATCACGAAAACCACCAGTGACCATTTCGCTATTAAAATGAGTAAAGTGAAATGGCGGCGTCCATAATGCTGGATGGTGTTTTCACGGTTGATCCCACTTCAGTCGAGTCTAATAAGGCTTAAACGCAGGAACGCAGAACTTCGGACACCACATTTTTTTGGAGTAACTCCTCTAGAAGACGGACCGGATCCAAAACCTCCGAATAACACACGGTTCCTATCTCCGTCTATATCCAGCACCCCAGACCAGATGCTTCACAATTACCCACAATTCCCCTGGAATTGTTCCTGCCTCATTGAGTCTTCAGCCAAAGTCAGGCAACTGCAACTAGTCAAAACACACACATACACACACACTACAGGGCACAGCCTGATGTGACCGCCTCTCCCCACCCCATCTGTCAGGATGACGTCAACTCTCTTCCGTCAGACAGGTGGTATCACCTAAGACCCCCCAGCTCTGCCACTCGACACAAAGTCATCCATCACCACAGCAACAGCTCCTGTCATTGCCTGGGAAGCGAGGGACTGCTAGGGCAGATGGGAAGAGAGGCAGCCCAACTGGTCTTCCAGCATCAGGTGGTCTGGGAATGATAAAGAGAGACTGAAAGAGAAAGAGGGCATCTTCCTTTGACACCAAGAAGTTTAAAATGGGGAAAAAATAACTTTCTTTTTGACACACAGACAGTAATGACAGGTGTGTCCGTGACTGGAGCTCCCAGCTGGAAACTCCAGAAAGAAATGTCCAAAGCCTCCTCAAAAATAGTCCGAGCTGACCCTTTTTGTGCAAAACCTCTGGCCCACAACATGGACAACCCGGAGATGAAGGGTAAGAGTTAGATGTGCTTCCTAGGAAGGTTTTGACTGTGCGTGACTGGTGTTGGCTGTAAATGCATGGAAATGTTTCATCACAGGTCAGTGGCATCTTTTCTGCAAGACAGCAGTACCGTATGAATGCAAGTGACCTGAAGGAAAAATTTCAAATCTTTCAGAGTTTCCGTTGACATACTGGAGACATTTAAAGAGAGAACACTTATCAAGCTGTATTCAGGCATAGAGAATGCGTCCCACATCTTAACGACACAATGATGAAACAAAAGAGCATATTCAGTACATGTCTGATTGCACTAAAATGCCATAAAGAGAGACAAGGCATCTTTTGTTCAATTCTGTCAGGCATCAAAATGTCTGGTCCATTGCTTAGCTAAATATAGAATAAAGGAGGGCAGTTATAACACTTCTTACTGCAGTGGATATTTCTAAAGGAAGGTTTATTTTATTGAGTCTTTGTGTTGAATTATGTTGCATTGACACACACAGTCTTTTGAACATTTCCACAATTATCACCCAAATGACAAAAGTTTGTGAATATGTGTAGAGCGAATGAGAGAGAGAGAAAACTATACTATAATTGCAGAACTTTTGTATAATTGCGTACCTTAGTAGTATAAACATATATGGCTAGGTTCGTATATATTTGGACACTATACAATTTTAAACATTTCAGTTCTGTATGCCACCAGAATATAATTATAAAATAAATTAATAATAAAATATTAATAATAAGGAAAACATCAATATGAAACTGAAGTGCAGACATCAAGCTGTGATTGGAGGGGTTAAACAGAAATATAAGATGTTTGGGAATTACAACCATTTTTATACACAGCCCCCCCATTTTCTGGGGCTTAAATGGAATTGGACAAGTAAATAAATAAAATATATAAAATGTTAATTTTTAATATTTTGTTGAGAATCCTTTTCAGGCAATGACTTCCTTAAGCCTTGTTTGTTTGTGGGTCTTTTCTGCCTTTAGTTTTAACTTCATGGAAATGGATGGAAATCAGGAGATTGACTTGACAATTACAGAATACTCCACTTTTTTTTTTTTTTACCTTTAAAAGCTCCTGGGTTGCTTTTGCAGTATGTTTTGGGTCATCATCCGTTTGTACTATGAACTGCTGTCCAATCAGCTTTGCTCCGTTTGACTGAATCCGGGCAGAGAGTATATTCCATGCATGCTCACGCCATCACACTACTCCACCATTAACAGATTATATTTTATGCTTTGAATTGTGAGCTGTATCAGAGTGTATACTACAATTGCACTCCTGTCGGCAACAATACATTTGCATATTCGAGTTTTGTACTATTTAATCTGCTTCATGATTCAGGGTTTGTGTAGCTCAGTTCGTAGTGAGTTGTGCTATAAGATGAGATGCAATCATGCGAACATGGGTTTGAACCAAGAGAATGTGTGGCCTCATAAAAGGTATATGTCCTTAATTTATGGTTTTACACAATTTTTTGTAACTGGTAGGTTTGGGGGTGGGGCCAGGTGTGGTCATTGGAATGAATTACACCTAGTAAAATCTGTTTTAATCACTGTGACTTTGGTGTAAAAAGTTCACACACTGCATTTAAACAAAACAGGCATTTTGACTAGTAAGGACAGTCATATAAGTCATTTCATGATGACAGATACAACACAACACTTTTACTTTTTACGCCTGCTACAAGGACGCTTAACTTTTAAACATTAAAAAAAGGTCTTAATAAGGTACTTCCACAAACAGGCTCGTAATTGAAATATATTTTGGTCAACAGATAAAATAATAAAAACTGTACCTGTGTACAAATATGCATTGACCTAAATGTATAATTAAGAGTGCAGCTTGTTATGAATTTCTATCAAACTTATTACCGTTGTTAATTGAATTTTCTTTCAAATTTGGGATTAAAAATCACTAAGTACACTCCTCAGAAAATAGTCGTCTTTTAATAGGCACAAGAAGTGATAATTACAAATTCTAAAACTTTTTTTTTTTCAGTGTTTGTTTGTTTGTTTTAAGAACTTGAAACCTGCAGCACCAACATGCTTCCCATGAGGTAATAAAAGAATGTTTTATTTGAAGCCTTTTTATGTGTAGATCAAACCACACCATTAAAGCACGGCTTTTTTGCCTGTATGTTTCATCTCGGGTTTACACATCAACAAAGCACTAATTAGCAGATGACAATCACATCAGTCCTGTTGTCACCAGTTTAAATGACACTGACAAACATTAGGGACCAGATTATATGCTTTAAACAAACACCACTTCTGTTATTGTAATGACTTCAGAATATAATAATTGCATGCTCCCAAAAGCTACACCAAATGGCACTTTGCAAATCTGCTGGGACATTTCTATGGGTAAATTCCAGGCTCTCTGATAACCATGTAATGAAATGTCTAATGTAAGATTTACTGTAAGTTCTTATTTCTAACAACAAAAATAATATAAAAATAGCTATATTGTGATTATCAATCTAGTAATTATTCTTAAGAAATGGTGGGGGAAGATGTAA
>XM_001704125.1 Giardia intestinalis Myotubularin-like protein (GL50803_008210), partial mRNA 
ATGGTGCTTCTTGACGGGGAATTTATCGTCTTTCAACCGTTCTTAGCTGCTACATCCATACCATCTTACACAGAAGGAAATCTATGGCTTGATCCTTCCGAATACGCAACTGCCACAACCAACTTGCCTCCTTCAAACGGGCACCTTCTGGTTGCAGGACAGCTGTATCTGAATATTGTGCTGACGAACTACCGCATGTTGCTCTTTAGAGCAATTAGTCCAACGGAATTTACTCCCTTTGCAAGTATACCCCATTTTATGGTCGTTTCTATTTCTAAGATTGGAGGAAAGAAGTCACGCGACGCCTATGGTGTGCTAATTAGCCTCATTACACCTCTACAGTTTGCCGTCTTTTTGCCTCGACATAACAAACAGCGCACTATCTTTATCGGTACGCTACTAAAGTACGCATCACCCAGGCTCACTCTGACACACCTGTTTCCTTGCTTTTCTCTTTTCACGTCTCCTAAGGCAGAGAAAGGCTGGTTTATATACGATCCATTTGCAGAGTACTGTAGGCAAGGCGTGGGGACGCCGCGTTTAGATCTAGAGAAATTCATGAAGCCCTTTGATCTATCGGTGGTCAAGCGGCCACTAGGGACGCTTGGAATCAAGGCCTCAGATGTCAAAGACGGCATGTACCGCATTGTGACCGGAAACCCAAAGCTCATGGTGTGTATTCACGAGTATGAAGAAATGAGAAAGGAAAAGGAGCGGGCGCTCCCTTGTAATCCTGGACACGTTCCCTTTTGGTCGCTCACCGACGCAAACTTTGATTACTCAGTTTGTAACACTTATCCTTTCTTACTAGCAGTTCCTAGTCGTTACTCAGGAGAGAACAATCTTGACGCACTTCAGCTCGTTGCTGGGAATCGTTCTCATAGGAGACTCCCAGTGTTGGCGTGGAAGGACAAGGATGACCGCTACGGGGTCATTCTGCGTTCCTCTCAACCCTATAACCCAACAAAGAAAAGCGATAGCAAATTTGTGGCTGATAGAGCATACCTGCAACACATATGGCAACACTACGGCGCCCTGCATAAGAAGGAGAAGCTCTTAGTGATTGATGCTCGGACAAGAGCTAACATGCAGATGAACCAGTTTGTTGGTAGGGGAACGGAGGGGTATCCCTTTGTGCATGTGGAGTTTCTTGATATACCAGGATGTCAATACATTCAACAGAGGCATATTGCAGACTGTGCATTGTTTGCCTCCACACAAGATAATTTTCAATATCATCGCTTGGGGCGCGTCGGTGGCATTACTGAGGTACTCGGAGTTGATCCGCGTAACTACATATTGCAGGACACAGAGTGGATGAAGGTAGATGAAGTACAGACGACAAGGAGTCAGCAAGATTTCGTGGCAGATAATCAGCCACCTGCTGAACTTGTTAGTAGGGATAGAATCAGGGAGGATGGCGTTGATCATGAAAGCTCCGAATGTGATATCTCAGGGGTAGAGCAGCTATCTCCAAGTATAGACTTTAACACGATTGCAGTACCGCAATATGTCGGTAATGAAAATGTTGACCATAGCTGTCAGGCGGGCTCCTCCGTTGTTATGATTAGGACAAAATGGACTAGCACACGTCAGCTTGAAGAAGTACACAGACTTGTCATTGCAGGAGCCGTTTCTATATGCGAAAACATCATTCGAGGAACTGTGGTTCTTGTTCACTGTTCGGATGGCTGGGACAGGACCGCCCAGTTAGTCGCTCTTGCGATGCTTATGCTTGACCCCTATTATCGATCTATGAATGGCTTCTTTGTCTTAATAGAAAAGGAGTGGTGCTCGTTTGGACACAGGTTTTCTTCACGGTGCGGAATTCTACAAGTTAGCAATCAGGACCAGGAATCTCTTGAAGACGCTGATAGAGGAGACCTCTCATCGAGTCTATGCAGCCCTGTCTTCCTCCAATTTCTGGAGCTCGTCTACTACCTTTTGAGCGCATATCCGTCAGAGTTTGAGTTCACCGAAGAGGTTCTCAAGTACCTTGCCTATCACACCTATAGTGCTCGATTTGGGACCTTTATCGGCGACTGTGAGCTAGATAGGCTCTTGTGCCAGCTTCCTATACGGACCGCCAGCATATGGGATCATCTGTTGGCATGTAAAGATCACTATACAAACAAAGGGTACTCGCCAGAGTCTATTCTGAAGAAAAATGGATGGGTGTATCTCAAGCTCAATTGCAACAGACAGCTTCCTGCTTGGCCAGGCTATTGGGAGCAGCACATACCTAAGCCTTAA
>XM_022698119.2 PREDICTED: Brassica napus long chain acyl-CoA synthetase 1-like (LOC106386204), transcript variant X3, mRNA 
GGTTTGTACTTTGGTATTGTTAGGTTGACCGGGCTGGTCGCAATAAATGCCATTGTACCAATTACTCATAATAACAAAACTATGCAACTTATGTGTATATATAACAAAATTCAAGTACGGAGTACGCAGTCAGATTAATCAATGAAACTTTAGTATCTGTTTTCGCAACGATTATATATATTGTTCACAAATAATTCAATTTTATGAACATGCAAAATACGATAAAGACCCTCATTTTTAAACCAAGTTATTTCCTTTAATGATCTTTACCTATTTCACGTTTTTGTACCTAAAATTTTGAACCATTCGTCAGCTACGTCGGCGTTGGCTTCATTGTATATCTATCTCATTTATCCATCATTTCCGGTTTTTCTATCTAATACATTTCTTTAACATAAAGAAAATAGCTTCAGAGAGTTTCTCTTCAAAAAACGGAAAACAAAGAGAGAATGAAGTTTTTCGCGGCGAAGCTGGAAGAAGGAGTTAAAGGAGGAAACGGGAAGCCGTCGGTAGGTCCGGTGTACCGGAATCTTTTGTCGGAAAAAGGTTTTCCGCCTATGGATTCTGATATCACCACTGCTTGGGACGTTTTCAGTAAATCAGTGGAAAAATTCCCTTACAACAAGGTGCTTGGATGGCGTCGAATCGTCGATGAGAAGGTTGGACCGTATATGTGGAAAACTTACAAGGAAGCATACGGAGAAGTTCTGCAGATTGGTTCTGCAATACGTGCTCTGGGAGCTGAGCCTGGGTGTCGAGTGGGGATCTATGGAGTTAATTGTCCTCAGTGGATAATAGCAATGGAGATGACACATGAAGATGTGTATCTTTCCTTCTTGCCGTTGGCTCATATTCTTGACCGTATGAATGAGGAATACTTCTTTCGCAAAGGGGCTTCGGTTGGCTATTACCATGGAGATTTGAATGTGTTACGCGATGACATTCAAGAATTGAAACCAACTTATTTAGCTGGAGTTCCAAGAGTGTTTGAGAGAATTCACGAGGGAATTCAAAAGGCTCTTCAGGAACTTAATCCTAGAAGGAGATTTATCTTCAATGCTCTCTACCAACACAAGCTTTCATGGTTGAATCGTGGATACTCTCATAGTAAAGCTTCGCCCATGGCTGATTTCATAGCTTTCAGAAAGATTAGAGACAAATTGGGAGGTCGAATCAGGTTGCTAGTATCTGGAGGAGCACCATTGAGCTGTGAGATTGAAGAGTTCCTTAGAGTTACTTGTTGTTGCTTTGTCGTCCAAGGGTACGGTCTAACGGAGACTCTTGGAGGAACGGCTTTGGGTTTCCCGGACGAGATGTGTATGCTAGGGACAGTTGGTATTCCGGCCGTTTACAACGAGATACGACTTGAGGAGGTGGCTGAAATGGGCTACGACCCACTCGGGGAAATTCAGGCAGGCGAGATCTGTATAAGAGGAACATGTTTATTTTCTGGTTATTACAAGAACCCTGAACTTACTCAAGAAGTCATGAAAAACGGATGGTTCCATACAGGAGATATAGGTGAGATTCACCCAAATAGAGTACTCAAGATAATTGATCGCAAAAAGAATCTTATCAAACTCTCTCAAGGAGAGTACGTTGCTCTTGAGAACTTGGAAAACATCTACGGTCAAAACTCTGTTGTCCAAGATATATGGGTTTATGGAGATAGCTTCAAATCAATGCTTGTAGCAGTGATTGTTCCAAATCCTGAAACCGTGAACCGGTGGGCTAAAGATCTCGGCTTTACTAAGCCATTCGAAGAACTATGCTCTCTCTCGGAATTACATGATGAACACATCATTTTAGAACTGAAGTCCACGGCAGAGAAAAACAAGCTAAGAAAGTTCGAGTATATAAAAGCAGTGACAGTGGAGACAAAACCTTTTGACGTTGAGAGAGACTTAGTGACTGCGACCCTCAAGAATCGAAGGAACAATCTTCTCAAGTATTATCAGTCCGCCAACGTTCCGTTATACAGGTACAAGTCGACGAAATGTACCGAAAATTGTCGTTGAAGAAAATGTGAAAGTGTTGCATGACCATCGATGTGTGTGTTATTATTGGTAACTATGTTATGTACGTATGTGTCAATCATTGATTAAAAAAGCCTTATGCGTTCTGTAATGTTTTAATTCTAAGCTATGTTGAATAACCATTGACATCATTAATTATTATTTTTTCTTTTGTTAA
>XM_040148298.1 PREDICTED: Xiphias gladius tensin 1b (tns1b), transcript variant X3, mRNA 
GAGGCAGAGTGAGCACAGAGGAGAGGCTGTCAGGATCCAATTTAGGTTTAGAGGAGAGACACAGGAGGAGAAAGCAAGTCAGACAGTGAGGAAAAGGGAGAAACAGGAGCCCGAGGTGAAAGAAAGTGTTTATGTTCAGGATAGTCATGGCTCTGCAACGTTGGGAAACTCTTCTCCTGCCTGGATTAGACTTAAGGAAGACCAGTGGTCTGTAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCATCATCACCAACACTCCTGTCCGTCAACATGCCGTCTGTCTCTCTCAGCCTGCCAGCAGCTCTGGCTGGACCTGCACGCACCTGGGTCTGCCTGTCCTGCATGTTCTGGCCAGAGGAGTTGGAGGCTCTTCATTCCCATACGTTCCGGGTGAAGACTTTCAAGAAGGCCAAGCACTGCAGCGTTTGTAAACAGACCATCATCCAGGACGGACTCGTCTGCCGAGTGTGCCGAATACCTTGCCACAAGAAATGTGAAGTCAAGGTGTCTTCATCTTGTGTTCCAGCAACAAACTATGAGCTGGCCCCAAGCGGTGACCTCCCTCTCAAACATGTAGACACCATGGGCTCAACAAAATCGTCAAAGAGCATGGAGTCACGGCGCAGACCATCAAGGAGTGTGAGTTTGCTGCAGGCTCTGGAAGAGAGCTACGAGTTGGACCTGATCTATATCACAGAGAGAATCATCTCCGTCTCCTTCCCCAGCAGTGTGGATGAGCAGAGTTATGCTGCTAACCTGCAGGAGGTCGCCTCCATGCTGCGCTCCAAACACGGTCACAACTACCTGCTCTTCAACCTCAGTGAGAAGCGTTATGACATCAGCCAACTTAATCCAAAGGTCTTGGACTTTGGCTGGCCTGACCACCATGCTCCAGCCCTGGACAAAATCTGCAGCATCTGCAAGGCCATGGACACTTGGCTGAGTGCGGACAGCCACAATGTGGTGGTTATACACAACAAGGGCAACCGGGGCAGAACGGGAGTGGTGGTGGCGGCCTACATGCATTACAGCAATATATCTGCCAGCGCTGACCAGGCTCTGGACAGGTTTGCCATGAAGCGCTTCTATGAAGACAAAGTGCTTCCTGTGGGCCAGCCATCACAGAAAAGATATGTAGAGTACTTCAGTGGCTTGCTCTCTGGACACATCAAGATCAACAACAAACCCTTGTTCCTTCATCATGTTATCATGCATGGCATCCCAAACTTCGAGTCTAAAGGGGGTTGTCGTCCTTTTCTCAAAATCTACCAGGCCATGCAGCCCGTCTACACATCTGGGATCTATAATGTTCAGGGCGACAGCCAGACGAGCATCTGCATAACCATTGAACCTGGTCTTCTTCTGAAAGGGGACATCCTGCTGAAGTGCTACCACAAGCGCTACCGTAGCCCGTGCCGAGATGTGATATTCCGGGTGCAGTTTCACACCTGTGCCGTTCATGACCTGGGGATCATCTTCGGGAAGGATGAGCTTGATGAGACATTCAAAGATGAAAGGTTTCCAGAATATGGAAAAGTAGAGTTTATTTTCTCGTTTGGGCCAGAGAAAATACATGGTCAAGGTGTGGACCACCTGGAAAACGGGCCGAGCGTCTCGGTTGACTACAACACACAGGATCCCCTGATCCGCTGGGACTCGTATGAAAACTTCAATCAGAACTGTGAGGACACCACAGATGAAGTCATCCATACCCAAGGACCCCTGGACGGCAGCCTCTACGCCAAAGTTCGCAAAAAGGAGTCTGTTGAAGGAACAGTCACAGCAAATGGCCTGCCACCCACTGCTGTTGAACATGCCCTACCTGCGGTTGACCATGCCTTATCAGTAAGCAGCGACTCAGGAAACTCTACTGCCTCCATCAAAACTGACCGAACTGATGAAGCAGCAGCAGTCCCTCAGGTTTCCAGAGTGAGCCAGACACACGTTCCTGTGGTTGAGGAGTCACCATCAGTCCATCACCAAGCCCCACCTGCGCAACAACCAATTAGTCCCCAAGAGAAACAGGAGCTGGAGCAGCTGCTGAGTGGCTTGGAGGGGCCCATGCACCAACAGGGCTACCTGTCCACCCCAACATCAGCTGTTGGAGGGATGCTTCACCTGGTGCCTGCTCAGGTCCATGTCAATGGGCACACTAGCATTGACCGTGAAACAGACATTTTAGACGATGAGCTACCTACCAGTCAAGAGGGCAATAGTGTGGACAGTCTAGGAACATTCTCCTCCACAGATGGTAGGGCTACACCAGCTGATCTGTACTACCAGACTGAGTCCCTTGTCAATGGCCAGGACCATGTGCCATATCTAGAGCGCAGCGTCCCCGAAAAGCCTCTGGAAACCGTCCAGCCACATGTTGGCATATCTGACAAACCTGTCACTTTGACCCAAAGTGATTTAGCCAAATCATCTGGTACTTACATGGCCACCCAGAATGGCAGTCTGTACCGTTCTCAGTCATTTGGTGCAGAACCAAAATCTATGCCACAAGCTCCAACCCGCACCACCAGTAGCAGGGATGCCGTCCAGCGTGGTCTTAACGTTTGGCAGCAGTTTGGTGTACCTGATGAGCCAGTAACTGAAGGGTTCACTTTTAGTCCACCTCCTTCTGTAGCAGTGATGCCCAGCCACCACAGTCTCCCACAGTTCCCTCATCGCCACAGCACCTCCCAGCAAGAAATTGAGCAATCTATTGAAACCCTTAATCTCCTCATGTTGGACCTGGAACCAGGGTGTTCGCTGGTGCCAAAGTCCCAAAGTGCTCCACTGCGGGAAAACAGTGTTGTAGTGACCACCCAGCCGTCCTTTTCCCAGAGCCAAACCAGGCCCACCTACCAGGGTGATGCCGCCATTCATACCCACTTTTCGGGTCCCATGTCCAGCCTGGCAAGCCACTCGTCAACAGCTCAGATGTCACCTGGGAAGCCTAGAACACCAGAGCCTGCACCTGCCCAGGGATCTCTGAGTTACAGCTCTGAAACCTCTGGAACTAGTCCTCCCTCACAAGACTCCCTTCCTGTAGCAGGCCACGTCCAGCTGAAGCCCATCAACACCTACCCTCCAAGCACACTGTCCCATTCTGCAGACATCTCTGAGGCCCAGAGAAGCCCTAGTGCTGCGTCAGCATCACTCCAGCCAAGGGACAGTGAGCCCGATGAAGTCTTCAATGTTGAAGGTCTGGTGGCTCAAAGAGTGGCTGAATACTCGGCTCGTGCCCAAAGTGTCATCCCCAGCATGACCTCTTCTCAGTCTGAGCACCGCCGTTCTCACTCCCTCCCGGGTGTCCAGGCCCGTGCAGTGTCCTTGGATGAGCCTGCAACTCTGCCTCGCCATCGCATCGTCAGTGACGGCCATTATCAAAATGGCCCTGACGACAGTCCCTCACCTGATATCCTAGTTCGTTCCCCCATTCGATGCGTTTCTCCAGAGTTTGCCAATGCCATAGCGATGAACCCCGGAGGACGGCCTAAGGAGAGAAATATGCACAGCTACCGGGAGGCCTTTGAGGAAATGGAAGGAGTCCCCATTAATCCTACACCCACAGTTGGTGGTGAGGTGTTTCCCCAAACCCCTGCCTTCCCCATCTCGCCGCAAACCCCTTACTTCAACCTGTGTCGGTCCCCTCCTGGTCTTGCCAAGACTCCGCTGTCAGCCCTGGGATTGAAGCCCCACAACCCAGCAGAAATCCTCCTGAATCAAACAGGCTCAGATGATGAGAGCAGTGAGGGTGAGGAAGCACCAAGAAGCTATGTTGAGTCTGTGGCGAGGTCGGCAGTAGCAGGTGGAGAGCAGCCCACATCACCTCTGAGCCTTAGCCCACTGGGAGAGACTACAAGCCAGCAGAGAGGTCCAAGTCAATCGACCCACACACTGAACCCACCTTTGTCCAGCAGCAGTCCCTTCCAGAGCTCACAGGGTGAACACCCCTCAGCACACTGCAATGTTAGCACTCCGTCCCAACCCACTACTGATTCGAGCTTCCGCTCCCAGGCTACAGAGAGTGCCTACCCCACTCCAACCCCCTCATGTCCAGCCGTGAATACTCCCACCTCTTCCTACCTGGATTCCAGCTCTCCAGCCTCTTCCTACCTTGGCACTACTACCCCCACACTGTCCTACCTTGGCCCCAACAACCTCCTGGGAAACTATGTTGCCTCAGATCCAAGCCTGTCCACCTCAGAACCCTCCCAGACCACACTCAGCCATGGAAGTCCCCATGCACAGCACTGGACCAACACCCTTAGCTCCACTCATAGTCCTGTCCTCCAGCAGCGCTCGAGTGCTAATCAGGATGGCTCCATCATGGGTCAACAAACATCAACAGCTAATGGCTTTGATGTGGGCATGCCAGGCCTCATGACAGGTGGCAGTCCCATCCTCGGTCATCGTCTGTCTCAGGGAGCTCAGAATAGCCCAGTCCTCAGCAGACAGGCCTCTTTGGGACAGGGGTCTCAGCGGAGCCCTGTCTTCAGCAGACAGCCGTCCCTGGGTCAGCCCATACAGAGCAGCCCTGTGCTCAGCCGACAGCCATCTATCACACACCCCCAAGGAAGTCCGGTTTTGGGCCGTCACCCATCTGTGTCACAGGTGTCCCAGAGAAGCCCCAGTTTGGACCGTCACCCCATGCACAGCGGTTACACCACCCCAGATGAGAGACATGGGAACCTGTCGAGACAGAGCAGCTCTTCGGGCTACCAGGGGCCACCCACTCCCTCCTTCCCCATCTCGCCTGCAGGCTACCAGGATGGGGGGATGATGGGGACGGGTGTAGGGTTCAGGCAGGGTAGCCCAGCCCCTGGTCTCCAGCCCCAGCTTCCAGAGAAGAGGCGCATGTCTAGCGACGACAGACCAAACGGAGCTCTGTCCTATGGCACGCTAAACGGAAAAATAATGTCCCCAGTGAGTGGAGGAAGCACTCCCAGCTACTTCCACACCCTCTCAGACTTCTCCAAGTTCAATATGCCCGACGAAAGCCCTGAGAGCAGGCTGAATGTCAAGTTCGTCCAAGACACGTCCAAGTTCTGGTACAAGCCAGACATTTCCAGGGAACAAGCTATTAGCCTGCTGAGAGAGAGGGAACCTGGAGCCTTTGTTATTCGGGACAGTCACTCGTTCAGGGGGGCGTACGGCTTGGCTATGAAGGTGGCCTCTCCCCCGCCCTCCGTGCATCAGAACAAGAAAGGTGACATCGCCAATGAGCTGGTGAGGCACTTCCTGATCGAGAGCAGCCCGAAAGGAGTGAAGCTGAAGGGTTGTCCAAACGAGCCTTACTTTGGCTGCCTGTCTGCTTTGGTCTACCAACATGCTATCACACCATTGGCCCTGCCCTGCAAGCTGCTCATCCCTACCACAGATCTCATTGAGGAAGCACCAGAGGTCGCAACAACAAATCCACTGGCTGAGAGGCTGAAACAAGGAGCAGTGCAGAGGGCCCCTGCTGATTCCCATGCATGCAACGTGCTCTACATCAACTCAGTAGAGATGGAGTCCCTGACGGGCCCTCAGGCTGTTGCCAAGGCCATATCTGAGACACTGGCTGCCGCCTCTCCACCTACAGCCACCATTGTGCACTTCAAGGTGTCTTCACAAGGCATCACGCTGACTGACAACCAGAGGAAGCTTTTCTTCCGACGCCACTACCCCGGCAACACTGTCACGTTCTGCGATATTGACCCTCAGGACAGAAAGTGGAACAAGCCTGAGGGAGGCACAGCCAAGCTGTTTGGGTTTGTGGCGCGTAAGCAGGGAAGCACAACCGACAACGTCAGCCACCTCTTCGCTGAGATGGATCCCGACCAGCCTGCCAGCGCCATCGTCAACTTCGTCTTGAAGATGATCGCCTCGCAGAAACAATGAGAGCTGTCAGCAAACCCTGGCGCTTTTTTTTAATGCCTTTGGTTATTTTCTTTCCTTTTAACCACAGACACTTTCTGTTTTGGAAAATTTGCGTTTGACGCACCACCTTGTTTTTCCTGCTCTTTTACATTTAGGCAATTGTGTAGCTGTGTGTGTTTGTGTATGTAAGCGAATGAAAGAGAGCAAGACAGAGTGTGTGTGTGCGTGTGTGGTGTGTTCGTGCGTATGCGGCTTGCATTCATGTGCTTTTCTTCTTGGATGGACTCCAGAATGGACCAGAGGAAGTGCAGGATGGGGAAGTGGCTGTGTGTGACAATGGGATGGGAGGTGATTTTAATCTCCCTGGCAGGGTAACTCATGGACAGGAAGAGGGAATGAAATTGTGTGTGCAAATGTTATTTTTTTAGCAATTGTTTCATTTTTATTTTTTTAAAGAAGAAGTGAAGTTGTGTGATGTAAAAGTGGGTTGTATATCTATCAGGCTTTTGACTGGTCAACCAAAGATTTTAAAAAAGTTGTCAGGGCGTGTATAGTGTGCCATTGTCAGAGGGTCAGAAGTATTTTGTAAAACAAATATGGCTGCTTAATCAAAAATACTGAACTGTTTCTTTCTGTATGTACTGGTCAATTCTGCATCTTGCAAACAATGTTTTCGGACATTTTTGCAGCTGGTGAGGTCTATGTAAATATTCTAGATTGCTTTATGAGTAGGACTGTTCTAGATGACATTTGGTGCCTGACTTTTTTTCTAATGCAGAGCTTTTTAAGAAAAAAGAAGAAGATCAATCTCACCCAGGCTGTCTTAAATATGCAAATAGCCAAACTTTGAAATAAGGTTGTTCTCCCAAATTCCACAGGTCCTTCCCTGTTCGACGTAGTAGCGTAGCTAAAGATGCAACTGATGTAATTCCTCTGAAGTGCAGCTAGAGTCTGACAAAATCGGCTAAACCTGTTTTTCGTGAATTTGCTGTATCCAAGTGAGCATCAGTAAGAAGGCCACTGAATCCTCAACAATCACGTCTCGGGATTCTGTTGGTCAGACAAGCTTCCTGTCTGCCACCATCCTCTGTTCAGTCTGCACAGCACATAGCCACACTATTTTGCTCATGATTGAAGGGCCAAGGGTTGTTTTATGGGGACAATCTTAATAGAGAAGTGTTGTCCTGCTATACTGCTCTTCAGTTTTCTGTGTTGAAAGTTTCCGTCAATAGAAAGAAGCTCTTTGCGTCAGCCGGCCAAAACTGTTAACACTCACACCCTACCCAAAAGTAAGCTATACATATAAATAAACATATATAGATATATATAAAAACTTCCAAACAGTGACTTAAGATATTTATTTTTTTGCTTTGTTGCTGTATCTTATCTTGTATACATGTATTATAAAGCATACACCAAGATTACTGAACGCGTGAAGAAAAAAAATGCTTTTTATTTTGGCTAAAGTCAAGAGCATTGACATATATAAGGTGTAAAGTGTGTGCATTTAAAAGTGTATCACTGTTGTTTTTGAATGTTTTTATTTCACATTATTACTTCCTTTTGTTAACCTTTTGTTTTCTTGGGGAGGCTTTTTGTTGTTTTTTTGTTGTTTTTTTTTTTTAAGAGAGGGGAAATATTTTGTATGACAGATTGTTGTTACTGAAGTCCAAATTGGAGTTATCCTAAAGTGATGCCAACAAAATTGTTTTATTAACTTAAACCTGCCTAGAAAATACGTTGTCCAATTTAAGCACTTAAATGTTGAGCTATTCTCATTGTGTTTCTACAGAAAGACGAGATATGGACGTTGACAGACCCATTTCATATCATCACTGCATGTGTGGGGGGAAGACTTGCTAGTTCCTCAATCCCCACAGCCTGGGACTGATCCTTGTACATGGAACATTATTAAGTTCAGTCAGTAGCTGCTGCCCTCATGTGGTGTGGAACGCTCATTACAAAGGAACCACTTTTATTCTAATACAGTGTTTTAGCTGTGATTACGGCAGGTCAAAGGGTAAATGTTTGAGTTAAATTTGATCACTGAGAAAATGAACTAAAACTACGTTAATTTAAATGCTGATTCTTATGCTAACTTTCTTAGAAAATTTGTTTTTTGTTTGCATTTCAAAGTCCCATTCAAGGATTGAGTGTGTCGAGATCACATCTCCTTTCTTTACGCCTGATACACTAGGATCAGTTGGCAGCATGATGTAAAATAATTAGATAAGGGTTAGTTTTTTGGGCCTACATTGACTCAAATGTACTCCTTCAAAAATATAAAAAAAATAAGAAATACAGCACTTACAGGACTTTTATATCTGACTAGAATATTCCATTATTTATTAGCAGGCTCCTGCACGCTCAAGTCAGCTTGCCACCTTAGTGCTGCTGACTGTAATGTGTACACAGTATCCTCAAGTCTTACACGACCAGTCTTTTCAGAAAGATGCCCATAGTTAGTTATCATCAGGTTTTGATTATCATGTGACGACTGTGTCTTGACTCTGCTTATGAGACAAAACAATCTATATTTTTGCCTACAAAATGCTTGTTGAGAGGACTCCCTCTTCTTCAAACTGAATGTTAGCCATTTGTTTGCCAAGATGGAAACTCCAGTGGCATCTGCCCACTTTGACAGATCAGTCTGGACTGTAGAATGTGTGTGAATGAGCTACTATGTCTGTACAGAGCTTTGTCATTTTTGATTTGCTACATTGTATGGCTTTTACTATTTCTGATGGAAAAAAAACACATTAAAAAGCAGTACAAATCAAAA
>XM_044234934.1 PREDICTED: Neovison vison P2Y receptor family member 8 (P2RY8), mRNA 
GCCAGGATGGATATGAACATGACCCGGCCGGACAACGCCACCATCGTGATGCTGCGCGACCCGACCATCGCGGTGGTCCTGCCCGTCGTGTACTCGCTGGTGGCGCTGGTCAGCATCCCGGGCAACCTCTTCTCCCTGTGGGTCCTGTGCTGCCACATCGGGCCCAAGTCCCCGTCGGTCATCTTCATGATCAACCTGAGCGTCACGGACCTGATGCTGGCCAGCGTGCTCCCTTTCCAGATCTACTACCACTGCAACGGGAACCACTGGGTGTTCGGGGAGCTGCTGTGCAACGTGGTCACCGTGGCCTTCTACGCCAACATGTACTCGTCCATCCTCACCATGACGTGCATCAGCGTGGAGCGCTTTCTGGGCGTCGTGTACCCGCTGGCCTCGGCGCGCTGGCGCCGGCGCCGCTACGCCGTGGCCGCCTGCGCCTGCGTCTGGCTGCTGCTGCTGGCCGCGCTGTCCCCGCTGGCGCGCACCGACCTCACCTACACCGTGGAGGCGCTGGGCATCGTCACCTGCTTCGACGTGCTCAAGTCCACCATGCTGCCCAGCGTGGCCATGTGGGCCATCTTCCTCTTCACGCTGTTCATTGTGCTGTTCTTCATCCCCTTCGTGGTCACCGTGGCCTGCTACACGGCCACCATCCTGACGCTGCTGCGCGCCTCGGACCCGCACGGCCGCGGCCAGCGGCGCCGCGCCGTGAGCCTGGCCGTCGTGGTGCTGCTGGCCTTCGTCACCTGCTTCGCGCCCAACAACTTCGTCCTGCTGGTGCACATGGTCAGCCGCCTGTTCCTGGGCCGCAGCTACTACCACGTGTACAAGCTCACGCTCTGCCTCAGCTGCGTGAACAACTGCCTGGACCCCTTCGTGTACTATTTCGCGTCCCGCGAGTTCCAGCTGCGGCTGCGGCGCTATCTGGGCTACGGGCGGCTGCAGGCCTGCGGCCGGGACGCGCGCAGGGATCCCCTGTTCTCTGCCCGGACGCTGTCGGCGCGCTCCATGTCCAGCGGCCACGGCGACGGGCTGGACGGCCCCAGCCGGCCCTGCCTGCAGAGGCAGGAGAGCGTGTTCTGA
>XM_006814478.1 PREDICTED: Saccoglossus kowalevskii uncharacterized LOC102803486 (LOC102803486), mRNA 
ATGATATCAGATAACGCGTCTACATATCTGTCTGCTGCTAATGAAATTAAACGATTATTGGATTCCCCTGAAATTCAAACCTATCTTACGAACAGACGCGTGCAATGGTCATTCATACCCAAACGAGCACCGTGGTTCGAGGGTTTTTGGGAGCGTTTGATTGGCCTCGCCAAAACTGCTATAAAGAAAGTCTTGGGTCGTTCATTCGTAACATACGACGAACTCAATACTATCATAACTGAAATCGAATCTACTCTAAACGACCGTCCCCTGACGTATGTGTCTACGGACATTGACGACGCAACCCCGCTCACTCCGTCACATTTATTAATTGGTCGCTTGGTTACGCCACTTCCGCATTTCGTCGTGGACGACGATGAATTATCTGACCCGACATTTGGAAACCGACTAGATCTCGAGAAACGCCACGCTCATATATGTAAATTACTAGAACAATTTTGGAAACGTTGGACTAGCGAATACCTCACGTCTTTGCGAGAACGACACAACAATACGGTTGGTGCAACGGACAATACAATTAAGGTCGGTGATGTTGTGTTAATGCATAGTGATATCGCTCGTCGTGTAAATTGGCGTTTAGCCACCGTTCAAAGATTAAATGTCGGAAATGATGGACTTGCACGTTCTGCTGAACTCAAGACTACCAGTGGATTTACAAACAGACCGATTACGAAACTATATCCCTTAGAAGCATGTGGGAACAACGCGCCCACGCTATCTATCGAAAAATCTCTTGCTGTGAAGTCTGTTCTACCCGGAATTAATGAAACTGTTACTCGCTGTCCACCCAGAACAGCCGCGACTATAGCCCGACTACGCATTCAGGACATGAACGATATGTGA
>XM_026561538.1 PREDICTED: Papaver somniferum uncharacterized LOC113312801 (LOC113312801), mRNA 
ATGTTACACCATAAGTGTACTAATGGGTTGAGTAACAAAGCTTTTGACGAGTATTGTACTATATTACAGTCCACGAAAGCTTTTCTAGATAGCAGTATCCCTAAGAATTACTATGAAGCAAAAAAACAAATTCGAGATCTTGGTGTGGAATGTATTAAAATAGATGTATGCCCAAATGATTGTATGTTATATTGGAAGGATAATCGTGATAAGGAAAGGTGCGACGCCTGTGGTGAGTCTAGATGGATATCAGGTACTTGTCAATCTGGAGAAAAAGAAGCAAGTGGAAAACAGAAAGTCAAGAGAAAAGTTGCCAGGGTTTTGAGATGGTTTCCGTTAATACCACGGCTTCAAAGGTATTATATGGACCCTAAAACCGCAGAGGATATGATATGGCATGATAAAGAGCGTACCAAAGATGGTGTTTTAAGGCATCCGGCAGACTCGCAATGTTGGAAAACCTTGGACGAAAAGCATCGGGTATTTGGTTCAGAACGTCGCAATGTTAGACTCGGGTTGGCAAGTGATGGGTTCAATTCTTTTGGTGTTATGGGTACTGGTCACAGTACATGGCCAGTCTTTGTTACTTCTTATAATTTGTCACCAGAGAAGTGTATGAAGCAACCCTATTTTATCATGTTTCTGCTTATTCCTGGGCCTAAGGGTCCTGGGAATAATATTGATGTATACTTACAGCCACTAATCGGAGAGCTAAAGGAATTGTGGGAAATGGGAATTGAGACGTATGATGCTTATTCCAAGCAGAACTTCCAAATGCGTGCAACTCTCTTATGGACTATTAATGACTTTCCAGCATATACCAACCTGTCAGGATGGAGGCACCGGAGATTCTTACCTATTGGTCATCCGTTACGAAGAAACCTGAGCTCTTTTAATGGCCGCAGAGAACATGATAGTGCACCAAAACCTTTAAGCGGTGAGGATGTTCTTCGGCAGTTCCGTGGTTATCATCAAATCACTTTTGGCAAGGAAGAACATGCTGTGTGTGGGGAGAAAAGAAGGAGGGATGACAATGAGCTGCCTTATAATTGGAAGAAGATAAGCATTTTCTTCGAACTACCTTACTGGAAAGATCTTCTCTTACGACACAATATTGATGTGATGCATACCGAGAAGAACAACAGTGAGAGTTGGATAGGGACACTGTTGAACATAGAAGGTAAGACAAAAGATAACTTGAACGCTCGGGAAGATTTGAAAGTAGTGGGTATACGTGGACCACTTCACCCTGAAGCTTTGGGGAACAACAAATTCTACCTTCCTCCAGCAAAGTATACCTTGTCTTTGGCGGAGAGGAGGAAGATTTGTCAATTCTTGCGTGACATAAAGGTACCCGATAGTTATTCATCGAATATTTCGCGGCACGTTCAGGTACAAGAATGCAAGATTCCCGGGCTAAAGAGTCATGACTGGCATGTTCTCATGCAACAACTTTTTCTTGTTGCGGTGCGTGGTATCTTACACGATGACGTGACTAGAGTTTTAGTTGAGTTTTCTGATTTTTATACTCAATTATGCTCCAAGACATTGAGAATCGAAGATTTGGAGGCGCTTAAAAAAATGTATCTCACTTTGTGCAAAATGGAGATGATATTCCCTCCTTCGTTTTTCGATATTATGACACACTTGCCTGTTCATATAGCAAGAGAAGCTATAATTGCTGGACCTGTTCATTACCGGTGGATGTATCCAATCGAACGGTACTTGTACACCTTGAAAAAGTATGTGCGAAATAAAAGTCAACCTGAGGGATCGATTGCACAAGGGTATCTTGCTGATGAATGTCTGACATTTTTCTCCAGATACTTGAGTGCTGAGATTAATACAAAGTTCAACCAGATAGGGAGAAATAGTGATGGTGATGGTGCGACGACATCTAGTCATGAATCGCCTATCTTTGAAGACGCATGTCGTTCTTTAGGGAAACCAATTTTCCGAACTTTATCTGACAATGAGTGGGAGGAAGCCCGAATGTATGTGTTGAGTAATTGTGATGAAATTCTTCCGTTCATCGAGTAA
>LC340153.1 Symphorichthys spilurus mitochondrial gene for 12S rRNA, partial sequence, specimen_voucher: KAUM:I:93808 
CACCGCGGTTATACGAGAGACCCAAGTTGTTTAACAACGGCGTAAAGAGTGGTTAAGATCTAAACTTATATTAAAGCCGAACGCCTTCAGAGCTGTTATACGCATCCGAAGGTATGAAGTCCAACCACGAAAGTGGCTTTATAACATCTGAACCCACGAAAGCTACGGCA
>MF223903.1 Uncultured bacterium clone denovo5551_560_46813 16S ribosomal RNA gene, partial sequence 
TTTTTCCTACGGGGCGCAGCAGTGAGGAATATTGGTCAATGGGCGGGAGCCTGAACCAGCCACGCCGCGTGAGGGAAGAAGGTACAGCGTATCGTAAACCTCTTTTGTCAGGGAACAAAGGCGGGGACTAGTCCCCGGATGAGGGTACCTGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGCAGGCGGCCTGGTAAGTCAGCGGTAAAAGCCCGGGGCGCAACCCCGGCTAGCCGTTGAAACTGG
>XM_024271454.2 PREDICTED: Oryzias melastigma visual system homeobox 2 (vsx2), transcript variant X2, mRNA 
TCCAAGCATGCTGAATATCCTCCTCATCCTCGTTCCCTGCAAAATGCAATAGGAGAGGGAGTAACTGCATCCATGATCCACTGGAATCCTGAATCCTTGCAGCTGATTGGCTGCTGCGGGCTGCCTCTTGTTGGGATGGACCTGTTGGATAAAAGGAGAATTTTCTAAAGGACTATGTGATACAGAGGATGTTGTGCGGGGGACAGTCCAGTTAGACGCTTTTTTTTCAGAAGAAAAACAAACAAACCATAACGTCATGACGGGGAAACAGGGCGCCGCGCTGTCGGAAAGTTTAGAGAAAACCTCTCTGGTCGTGAACGGCGGGAGCCTCCAGCCCAAAAGCAGCAACCCTCCACCCAGATGCACCGGCTTTGGCATCCAGGAGATTCTGGGGCTGAACAAGGAGCCGGCCAGCGCGCCGAGGAGCCCTCTGAGCGCGCTGCCGGCCGGGGCGCACCTGATCGCGGCGCGGTCGGTGCTGGGACCCGCCGGCGTGGGTGTCGGGATGGGATTAATCGGCCCCGCCGGGATTCCGTCGTTCTACAGCCAACCCGCCTTTCTGGAGACGGTGCTGGCGGACGGACACGACATGCGCCTGCAGCCGCACAACAGGTCTGCGAGGCCGCTGGACGCCAGCCAGTCCGTCAGCTCAGATTCCGAAGATTTATCTTCCAGTGAACGGAAACTTTCCAAATCATCAGTAAATCAAAGCAAGAAACGCAAGAAAAGACGCCATCGAACCATTTTTACATCATACCAACTGGAGGAACTGGAAAAGGCCTTTAACGAAGCGCACTACCCGGATGTTTACGCGCGAGAGATGCTGGCTATGAAAACAGAGCTGCCTGAAGACAGAATACAGGTCTGGTTTCAGAACCGCAGAGCCAAGTGGAGGAAGAGGGAGAAGTGCTGGGGCCGCAGCACAGTCATGGCGGAGTACGGCCTGTACGGAGCCATGGTGAGGCATTCCATCCCTCTGCCAGAGTCCATCCTCAAGTCTGCCAAGGATGGCATCATGGAGTCCTGTGCTCCCTGGCTGCTCGGGATGCATAAAAAGTCCATGGAAGCAGCAACTCTCCCGGCAACAGCAAAGTGCGATGCCCCCCAGCAAGCAAGCACACAAAGGCCGGAGGACGTTGAGGCAGAGGAGAAGAGGTCGGACGGCAAGTCCAGCATATCTAAAGAGGAAATGAGGGAGAACAGCATCGCTGCACTCAGGGCCAAAGCACAGGAGCACAGTGCCAAAGTGCTGGGGACAGTTTCTCATGACAAACTGCTGGAAGGCAAACAGGAGAAACAGGCGGTTGGGGAGAAGGTCAGTGACCCACCGAGCCCGTCAGAGGAGCAGAAAAGTCCCTAAAGAAACACATTTTGTGAATACTGTGGACCGACAGCTGTCGAAGCAAAAACAGACTCAATGATCTCCACTAAAGATATATAGCCCGCATCCAGACCGCTCTGAAGGAGAACTTTGATGATTCTTCTGCTGCACAGAAGTTGAAATTCGCACTTTTTCTGGTTTGCTTCTGAAACCCACTCTTGTCTGCAGTAGAGGAGACTGAATAAAAGTAGGAAATGATGTACAGAAATGAGACAATTAAAGGTTGAATCAATGGATCAGCTTAAGCACATACAGGAGGAGGAATTAGAAATTAAAGTGTGCAAAAATATGTTCCATTTCACATTTATTCTAAACCTGCTTGTACAATAAATGTGACATTTTAGAGGAGACCCATCCCACTGACAGTAAGAAAGTCAATGTTGTCTTACATGCCGCTGTATAAAAGTGATTTACAACGAAGGCACAACTTTTAAAGAACATTTTCTTCTTGTCTTAAAATGTCTGTGTTTTAATTTTAAATATGTAGAGGTCAAATTTCAAAGCATA
>XM_039993337.1 PREDICTED: Panicum virgatum casein kinase 1-like protein HD16 (LOC120708211), mRNA 
ACGGGAAGGCTTCAAAAAGCCAGCACTCCTCCTCTCCCTTCCAGACAGCCAGCCAGCCAGCCACAGCGCAGCGGTGTGTGTCTGCGGGAGAGACCAAACACCAACCTCCCACCATCCCGACCCATCCCTCCCCGCATCCCCACCTCGCCGCCGCCGCCGCTGCCGCCCGCACGGTCTCTTCTCCCGAGATTCGTTGGCGATTGGAAGTGCATGGGGAGAAAGGATGCCAGAGTTGCGTAGTGGAGTCCGGCAATCTCGGTTGAGGGCAAAGAAGGTTCAGGATCTCGTGGCACAGGACCCTACGGACAACTTGGTTGCTGCAGCACCTACGGTGGCAGGAAGGCGTGGTAGAGGAAGGGGTGGTAGGGGTGGAGGGAGAGGAGCAGCACGGGGAAGGGGAGGAAGAGGGCGAGGTGTTCCGGTGATTGACTTGGACCCCGACCAACCTTGTGGGGTTTTTCCAGGAGCTGCTCTGGGTGGTCGTGCTGCAGGTAGGGCACAGCCCATTGAGGAATTTGCTGATAGGGCTTTGAAGATGGATGGTGGGAGTGCTGAGAAGATTGCTGGCGGTGAAGATGATGGGACTGTAACCCCTGTCCCAGAGAAGGTTCAAGTAGGTCATTCTCCGCAATACAAGGTAGAGCGGAAGTTGGGCAAAGGTGGTTTTGGTCAAGTTTATGTTGGCAGAAGGATTTCTGGAGGAACAGAGCGTACCGGACCTGAAGCTTACGAGGTTGCTTTGAAATTTGAGCACCGCAACAGTAAGGGTTGCAATTATGGCCCTCCATATGAGTGGCAAGTTTATAGTGCTCTGAACGGTTGCTATGGTGTACCTTGGGTTCATTACAAAGGCCGGCAAGGGGATTACTATGTTCTGGTGATGGATATTCTAGGACCTAGCCTTTGGGATGTCTGGAATTCATTTGGGCAGACGATGACAGCTAATATGGTCGCTTGCATAGCTGTAGAAGCAATTTCTATACTTGAGAAACTCCATGCAAAAGGGTTTGTTCATGGAGATGTTAAACCTGAGAATTTTCTACTTGGCCAACCTGGATCACCTGATGAGAAAAAACTTTTTTTAATTGATCTTGGATTAGCATCTAGATGGAAGGAAGGAGGACCATCTGGGCAACATGTTGAATATGATCAGAAGCCAGATATTTTCAGAGGTACAATAAGATATGCTAGTGTCCATGCCCATTTAGGACGTACTGGTAGCAGAAGGGATGATCTGGAATCATTAGCATATACGTTGATATTTCTTCTCAGAGGGAGGTTACCGTGGCAAGGCTATCAGGGTGAGAACAAGAGTTTTCTTGTTTGCAAGAAGAAAATGGCTACGTCTCCAGATCTACTATGCTGTTTTTGCCCACCTCCATTCAAACTCTTCCTGGAGTCCGTGACAAATATGAGATTTGATGAAGAACCAAATTACTCGAAGCTTATTTCCCTTTTCGATGAATTGATTGAGCCCCAGCATTTGAGGCCTATTAGAATTGATGGTGCATTAAAGGCTGGACAAAAACGTGGAAGATTGCTTGTAAATCTAGAAGAAGATGAGCAACCGAAGAAGAAAGTTAGACTTGGGAGCCCAGCAAACCAGTGGATTTCAGTTTATAACGCTAGAAGGCCCATGAAGCAGAGATACCATTACAATGTAGCAGATGCCAGACTTCATCAACACGTAGAGAAGGGTAATGAAGATGGATTGTTCATTAGTTCAGTCGCATCTTCAGCAAACCTTTGGGCCCTCATTATGGACGCAGGAACTGGTTTCACATCTCAGGTTTATGAACTTTCACCCATATTCCTTCATAAGGATTGGATTATGGAGCAGTGGGAAAATAACTACTACATCAGTGCCATAGCCGGTGCAACGAACGGTAGTTCCTTGGTGGTCATGTCAAAAGGAACTCCATACACTCAACAGTCTTACAAAGTTAGTGAATCATTCCCCTACAAATGGATCAACAAGAAATGGAAAGAAGGTTTTCATGTTACATCAATGACAACTGCAGGAAGCCGCTGGGGTGTAGTTATGTCGAGGAACTCTGGATATTCTGAACAGGTAGTAGAATTGGATTTTCTTTATCCTAGTGAAGGTATCCACCGACGATGGGAAAACGGGTATAGAATAACTTCTACAGCAGCCACTGGTGATCAAGCTGCTTTTATATTGAGTATACCCAAAAGAAAGTTGATGGACGAGACACAAGAAACCCTTAGAACATCAGCTTTTCCAAGCAACCATGTGAAGGAGAAATGGGCCAAAAATCTTTACATTGCTTCAATATGCTATGGCCGGACAGTGTCATGAGGCTTGCTCGGCACTTCATCCCAAATCGGGAGAGAACATATTCAGATGAGTAGATATCAGAAAAATCAGCAATTTTTGTTGCTGGTCTCTGTTACTCTGTATGTGTAGGTAAACTGGTCAAGATGAACCACCTTACCATGGCCAGAGTAGGAGCTCAAGAAAGAAAAGGAAGGTAGGTGGAAAGCAAGCAGCCAATAAGCAGGCGTGGAGGATGTACCCGGCTAGTGGCGGTGCAGACGCCGATGGTGTCAACTGTTTTGCATCAGCGTGTTTTGCACTTTTGCTTCGCTCCTGACTGCTGTGCAAGAGTAGACAGCTTGTAGCCTCCGTTCGGAGGCAAGTCAATCTGAGAACCCATTGTGTATAGCGTATCATGTCATTGCATTTTGTTTAGTGGAAGCCAAGTTCCACGTTTCTGGAACTCAGGAAATGCTAAGTTATTGTGTGAGGAGAACAAGTGTACTGATAAAATTCGGTGTATCGATTCCATTATTTGATAATTCTCATTGCAGTAATTAATGCAATAATGTTGCATGACT
>XM_003142805.1 Loa loa hypothetical protein partial mRNA 
ATGCTGAATGATACAGAAAATGAAGAAATTAAGGAAGATGGAAATGTTGAATTAATCATAGAGATTGATGAGAAGAAAATTGATTACTGTAGATATGATGTCGTAAATGTGATATACTATTTATCAGTGGCAGATTCCAATAATTATACAATTATTTGCATCAACCTGCTTAGTTACGGTAAAAGTCGTTCTCTAGACCGACAACACGAAGTAAATCGATGTATGAGGAATGTATCTTTTTGTGTGGAGCTTATGCAGGGGGAAGATCCTCGAACAGCAATACATATTGCTAGACAAGGAAAACAGCTCGTCAACGGTGTGATTTTGTTGGCCATAGCTGCTTTCATTGATCTACGTGGAACACGCGTTTTCCGTGGTGTAACTTTGATCAAAACATTGAATTTCTCGGAAATTGGAAACAAATTAGTGGGAAGACTAGATTGGCATTTGCCGATAAAAATGCGTACATAA
>XM_050796503.1 PREDICTED: Macaca thibetana thibetana RPGR interacting protein 1 (LOC126958262), transcript variant X8, mRNA 
AGTAGGACTCAAAAGTTCCAAGGCAGTTGGTAAATGACAGTTATGAATAAAGCAAGGGGCAGAAAAAAACATGTAGGGGAATGAATGAGGAACTAGGTCCAGGAGATGCTGAACCTGGATAATAAAGACGTCATATCACACACCTTGGGGTATCCATCTGAGAGCTTGCTTTCTGTTGTCAGCATGCTGGACAGCAGTAGTCAGCCCCACTGGAGCAACGAGCTCATAGCAGAACAGCTGCAGCAGCAAGTCTCTCAGCTGCAGGATCAGCTGGATGCTGAGCTGGAGGAGAAAAGAAAAGTTTTACTTGATCTGTCCAGGGAGAAAGCCCAAAATGAGGATCTGAAGCTTGAAGTCACCAACATACTTCAGAAGCATAAACAGGAAGTAGAGCTCCTCCAAAAGGCAGCCACAATTTCCCAACCTCCTGACAGCCAATCTGAAGCAGCCACTCACCCAGCTGTGTTCCAAGACAATACTCAGATCCAGCCAAGTGAACCCAACAACGAAGAAGAAAAGAAACTGTCCCAGGTGCTAAATGAGTTGCAAGTATCACATGCAGAGACCACATTGGAACTAGAAAAGACCAGGGACATGCTTATTCTGCAGCGCAAAATCAACGTGTGTTATCAGGAGGAACTGGAGGCAATGATGACAAAAGCTGACAATGATAATAGAGATCACAAAGAAAAGCTGGAGAGGTTGACTCGATTACTAGACCTCAAGAATAACCGTATCAAGCAGCTGGAAGGTATTTTAAGAAGCCATGACCTTCCAACATCTGAACAGCTCAAAGATGTTGCTTATGGTACCCGACAGTTGTCATTATGTTTGGAAACACTGCCAGCCCATGGAGATGAGGATAAAGTGGATATTTCTCTGCTGCATCAGGGTGAGAATCTTTTTGAACTGCACATCCACCAGGCCTTCCTGACATCTGCCGCCCTAGCTCAAGCTGGAGATACCCAACCTACCACTTTCTGCACCTATTCCTTCTATGACTTTGAAACCCACTGTACCCCGTTATCTGTGGGGCCACAGCCCCTCTATGACTTCACCTCTCAGTATGTGATGGAGACAGATTCCCTTTTCTTACACTACCTTCAAGAGGCTTCAGCCCGGCTTGATCTACACCAGGCTGTGGCCAGTGAACACAACACTCTTGCTGCAGGATGGATTTGCTTTGACAGGGTGCTAGAGACTGTGGAGAAAGTCCATGGCTTGGCCACACTGATTGGAGCTGGTGGAGAAGAGTTCGGGGTTCTAGAGTACTGGATGAGGCTGCGTTTCCCCATAAAACCCAGCCTACAGGCATGCAATAAACGAAAGAAAGCCCAGGTCTACCTGTCAACCAATGTGCTTGGAGGCCGGAAGGCCCAGGAAGATGAGTTCAGATTGGAGTCTTGGGAACCTCAGAACGAGCTGCAGATTGAAATCACCAAGTGCTGTGGCCTCCGGAGTCGATGGCTGGGAACTCAACCCAGTCCATATGCTGTGTACCGCTTCTTCACCTTTTCTGACCATGACACTGCCATCATTCCAGCTAGTAACAACCCCTACTTTAGAGACCAGGCTCGATTCCCGGTGCTTGTGACCTCTGACCTGGACCAATATCTGAGACGGGAGGCCCTGTCTATACATGTTTTTGATGATGAAGACTTAGAGCCTGGCTCATATCTTGGCCGAGCCCAAGTGCCTTTACTGCCTCTTGCAAAAAATGAATCTATCAAAGGTGATTTTAACCTCACTGACCCTGCAGAGAAACCCAACGGGTCTATTCAAGTGCAACTGGATTGGAAGTTTCCCTACATACCCCCTGAGAGTTTCCTGAAACCAGAAGCTCAGACTAAGGGGAAGGATACCAAGGACAGTTCAAAGATCTCATCTGAAGAGGAAAAGGCTTCATTTCCTTCCCAGGACCAGATGGTACCTCCTGGGGTTCCCGTTGAAGCTGGTCAGTATCAAGCAAGGAGAAAATCTCCTCATAGGGGAGAAAGAAAGGAAAAGGAGCACCAGGTTGTGAGCTACTCAAGAAGAAAACATGGCAAAAGAATAGGCGTTCAAGGGAAGAATAGAATGGAGTATCTTAGCCTTAACGTCTTAAATGGAAATACACCAGAGCAGGTGAATTACACTGAGTGGAAGTTCTCAGAGGCTTACAGCTCCATAGGTGATGGCTTTAAAAATGAGCCAGAGGAAGAGGAAATGACATTATCCCATTCAGCACTGAAACAGAAGGAACCTCTACATCCTGTAAATGATAAAGAATCCTCTGAACAAGGTTCAGAAGTCAGTGAAGCACAAACTACAGATAGTGATGACGTCATAGTGCCACCCATGTCTCAGAAATATAAGGCAGATTCAGAGAAGATGTGCATTGAAATTGTCTCCCTGGCCTTCTACCCAGAGGCAGAAGTAATGTCTGATGAGAACATAAAACAGGTGTACGTGGAGTACAAATTCTACGACCTACCCTTGTCGGAGACAGAGACTCCAGTATCCCTAAGGAAGCCTAGGGCAGGAGAAGAAATCTACTTTCACTTTAGCAAGGTAATAGACCTGAACCCACAGGAGCAGCAAGACCGAAGGCAGTTTCTGTTCGACGTGCTGACTGGACAAGATCCTGATCAAGGACATTTAAAGTTTACAGTGGTAAGTGATCCTCTGGATGAAGAAAAGAAAGAATGTGAAGAAGTAGGATATGCGTATCTTAAACTGTGGCAGATCCTGGAGTCAGGAAGAGATATTCTAGAGCAAGAGCTAGACATTGTTAGCCCTGAAGATCTGGCTACCCCAATAGGAAGGCTGAAGGTTTCCCTTCAAGCAGCTGCTGTCCTCCATGCTATTTACAAGGAGATGACTGAAGATTTGTTTTCATGAAGGAACAAGTGCTATTCCAATCTAAAAGTCTCTGAGGGAACCACAGTAAAAAGTCTTATAAAGTTAACTTGCTATAACATGAA
>XM_032861595.1 PREDICTED: Lontra canadensis mitochondrial calcium uniporter regulator 1 (MCUR1), transcript variant X2, mRNA 
CGCAGCTGCTGGTGTGGACTCGGGCCGGCGCGCCGCGCGAGCGGGATGAGCGCGCGCCCGGGCCTGTGACCGCCGTGGCGATGGACTGCGGCTTCGTCGCGGGCGGGAGATCGAAGCGCCCGCCGGGCCGCCGGCGGCTTGTGCTCTTCCTGCCTTCAGGCGGCTGCGGAAGCCCGGGCGGCCGCGGCGTCCCGGCGCGCTACTGCCTGTCAGCGCTGTCCGTGGGTCTGGGGGCGCTGAAGCCTCGCGCCCCGGCGGCCCCCCGCGGCGCGTCACGTGCCTCCCCGCTGCTCCTCCTCCTGCTTGTGCCCTCCCCGCGCCTGGCCACCGTCGCCCAGCGCCGGCCCCTAGCGGACCGGGAGCGCTCGCGCCTGGGGCCCTCTGTCCCCGCGGCTAGCCGCGGCGGCGCGGGAAGGTGCCTGCGGGGCCTCGCCCCGGGCGTCGCCTGGGCCGCCGGCGCCCTCCACCTGTGCCGCGGCCGAGTGGCCGCCATCACTTCGTCCAGGAGAGAGCTAAGCCTCTCGGCTGGGAGCCTGCAGTTGGAGCACAGGAGAGATCTGGAGCACAAAAGGCGAGATTTCACCTCTTGTGGGAACAAGAAGCTCTACTTTGACACCCACGCCTTAGTGTGTTTACTGGAAGAAAATGGCTTCACCACCCAGCAAGCAGAAATCACTATCTCTGCATTGGTCAAGATCACGGACGCCAACATGGATATCGTCTACAAGGATATGGTCACCAAAATGCAGCAGGAGATCACTGTTCAGCAAATAATGTCTCAGATTGCCAATGTGAAAAAGGATATGATTATTTTGGAGAAGAGCGAATTTTCGGCTCTCAGAGCAGAAAATGAGAAGATAAACGTGGAGCTACATCGATTAAAACAACAAATAATGGATGAAGTGGTCAAAGTCCGAACAGATACCAAGTTAGACTTCAATCTAGAAAAGAGCAGAGTGAAGGAATTGTACTCGTTGAATGAAAGGAAGCTGCTGGAAATGAGGACAGAAATGGTGGCATTGCATGCCCAGCAAGATCGGGCTGTCACCCAGACAGACAGGAAGATAGACACTGAGGTCGCTGGCCTCAAAACCATGCTGGAGTCACACAAGCTTGATAATATTAAATATTTAGCAGGATCTGTATTTACGTGCCTAACAGTAGCTCTGGGATTTTATCGCCTATGGATATAATAAAGTGTCTATTTAAAGA
>XM_032539735.1 PREDICTED: Etheostoma spectabile DNL-type zinc finger (dnlz), mRNA 
CACGAGATTTGACGTCATCGGTCCGCGACACACACCATGTTGATGAAATCGTTAGTAACGTATACATCTACGCGTGTATGTCCTTCAAAACCTCACCTGTCGTGTTGGTTTTACAGACGTGTTTTGATATTTTACCTCCGGCCGATTCTTTGAGGACGATGTTGGCGGTTAACCGGTTGTTTCGCTGTTCTCGCGGTCGTTCAGCGCCGTCTGGACTCTGCGTTGTGCTCCACTGCCGTCGTCCAGGACCACCGACGACCACAGCCAGGTCGGGGCTTCTCTCCTCACAGGACCAGCGTGGTTGTCATACTTTGTTACCTGCAGACAGACGTGAAGCTCATCTTAGCGGTTATAGGGAGTTCTCAACCTGCCAGAGTATCAGAAGTGACGCTATTGGACAGATCCAGTCAAAACATTATCGACTCGTTTACACATGCAAGGTTTGCTCTACCAGGTCCACACAGAAAATATCCAAGCTGGCTTATCACAAAGGTGTTGTGATTGTGACATGTCCAGGGTGTAAGAATCACCATATCATCGCTGATAACCTCAACTGGTTTTCGGACCTGGAAGGGAAGAGAAATATTGAGGAAATCCTTGCTGCCAAAGGAGAGACTGTAAAGAGGATTGAAGGAAGTTCCGCTTTGGAGATTGTGGTGGATGAATCTATCAAAGAAAAGTCACAACATGGTGAAGACACAGAGAAATCAGACAATGAGCCAGAAAAACAGTAATGCTGTGTTCATACTGTATATGTATTTTGTAAGATGTTTATATTGAAATCCATAATAAAAACAAATATTTATATATAAATAAATGTCTTTATGAATTCTAAGCAAGGAAAAAGGGAACTGATCAAGATAGCTTTTAATATCAGGAATAGAATAGATGGAACTATAAATCCAGCTAACTGATAAA
>XM_027304875.1 PREDICTED: Coffea eugenioides probable LRR receptor-like serine/threonine-protein kinase At4g37250 (LOC113761756), mRNA 
CCTTTTAGCCTTGTCTTCGTCCCCCGTCTCTCCTTACCATCTCTCAAACTGACTCCATTTACAATATCTCCTTAGTTTTGGTCCTTATATTTTTGGTCACCAAAACAACATCTGTGAAGTTGGTTACCGTCTCAATCGTTCTTATTTTCTCCACTTCTTCTTGCTTATGAATAGCAATGACCATCTCGGACTTCTATGAGCGCCTAATACCAAGAAACCAATGAGCAGCTGGTTTAGAATGAGAAGTTTTTTTCACATACTTTGGTGCTTTTCCACCCTGTTTTTGCGTCTTTTGCTTCCTTCTCTGGCTCTGAACGTAGATGGAACGCTCTTGCTTTCCTTCAAATACTCCATTCTCAATGACCCTTTGTCAGTGCTTGATAACTGGAACTATGATGACGAGACGCCGTGTTTATGGACTGGTGTGACGTGCGCGCAAGTTGAAACGCCCTTTGGCACGCCGGCTATGTTTCGAGTCATAAGCTTAGTTCTTCCGAACTCTAAGCTCTTGGGTTCAATTCCTGAAGATTTGGGATACATCCAACACCTCCGTACTCTTGATCTCTCTGGCAATTTCTTGAATGGGACCCTTCCCAATTCGCTGTTCAATGCTTCAGAGCTCCAAGTGCTGTCGCTGTCCAGCAATGCAATAACTGGCGGGCTACCGGGGTTCAGCGGAGGAGGACTGAAGAATCTCAAGCTCCTCAATCTCTCTGACAATGCTTTAGCTGGAAATCTCCCTCCGAATTTACCGTCTCTGCAGGAGTTAACTGTGGTTTCTCTGAAAAGAAACTTCTTTTCGGGTACTATTCCAAATGGGTTTCTGTACGTTGAAGTACTAGATTTGTCTTCGAATTTGCTGACTGGATCACTACCACTTGAATTTGGTGGAGAAAGATTAAGGTACTTAAATCTTTCTACCAACAAGCTCTCTGGCCCGGTATCTCCAGAATTTGCGAAGAAAATCCCAGCAAATGCAACTATTAATCTCTCATTCAACAACCTCACTGGAGAAATCCCTGAATCAATGGCATTATCTAACCAGCAAACAGAGTCCTTCAGGGGAAACATGGACCTCTGTGGCAAACCGCTCAAGAAACTTTGTACTGTTCCTTCAAGTTTATCGGCACCACCCAATATATCCACAACAAATTCCTCTGCTCCGGCAATTGCGGCCATACCACAGACAATCGACTCGACCCCCCTGCCAAGCTCACCGGGAGCAGCAGCAAATGCAGCCCAAAATCAAGGACAACACAGGCTAAAACCAGGAACGATAGCTGGAATTGCAATTGGAGATTTAGCTGGCATTGGAGTCCTTGCAATTATCTGTTTGTATGTCTACCAACTAAGGAAGCGAAGAGCAGATGAAGGAAGCAAAGAGATTCCACTTCCAGTAGCAGTAGATAAACAGCAGAAAGATAACGTCAAAGATTCACAGCTCTCAACAGCGAAGGAGACAACTTCAAGAAGCCTGCCCTCTTGGTCGTGCCTAACTATAAGAAATGGTGAAGAAACATCAGAGGCTACCGCCTCGGACTGCGATGATGAAAACAAGAACATGGACATTGGACATCAAATAGATCAGTATCATGAGAAGGAGCGGAGCACTAAGTACAAGAGCGAAAGGTCACTTGTGATGGTTGATGGAGAAACTGAACTTGATATCGAGACTTTATTGAAGGCTTCTGCATATATACTGGGGTCTAGTGCTGCTGCAAGCATAGTTTACAAAGCTGTACTTGAGGACGGTTCTGCATTTGCTGTTAGAAGGATTGGAGAGAGCGGTTTTGAGAGGTTCAAAGACTTTGAGAGTCAAGTTAAAGCTATCGCAAAGCTGCGCCATCCAAACTTGGTTCTGCTCAGAGGGTTCTACTGGGGAGACGATGAGAAGCTTGTCATCTATGATTACATCTCCAACGGCAGTTTAGCTAATGCCGGTTACAGAAAGGTTGGCTCATCACCTTACCATATGCCCTTTCAAGTCCGGCTAAAGGTAGCAAAAGGAGTTGCTAGAGGACTAGCATACGTCCATGAAAAGAGACATGTGCATGGCAACATCAAGCCTAGCAACATTCTTTTGACGCCAGAAATGGAGCCAATAATCAGCGATTTTGGGCTTCATTCGCTTCTACATGGCAAAAATAGCTACAAAACAGATGCCTTTTCATCTCGGCATTTCGGTAGCATGAGAAGCAGTACTAGTACTGCTACTGCTGCTACATCATCTTCTCGCGATGGGCTGCACGACCACTCTATCAATGGCAGCCCTTGCATTGCACCTGCAGGCTTCATGGGTTGCACATCACCTTATCACGCCCCAGAGTCGCTCAATAACCTGAAGCCTAATCCCAAGTGGGACGTTTACTCCTTTGGAATTCTACTGCTCGAGCTTTTAACGGGCAAAGTGTTTTCAGACCGGGAATTGGGCCAGTGGACCGCCGGCCTGCTGATGGAAGACAAGAACCGGGTGTTACGGTTGGCTGATGTGGCAATTAGAGGAGACGTGGCAAACAGGGAGGATGCCATGCTGGAATGCTTTAAGCTAGGCTTTAGTTGTGCTTCATTAAACCCGCAAAAGAGACCTTCCATGAAAGATGCGCTTCAAGTTCTTGATAGAATCCAGACTTCTCCTTCGTACTAATCATGGTGCTGGGCAAAAGCTTAAATATAGTGGAGAAAAAAGAGAAAGAGAAAGAGAAAAAGGGGCGATCGCCTTTGGTCTTTTTGACTTGGAAGAATGTCTGGCGGGAGGAATGCTTTTGTTGATAACTCGTACAAGTGTTGCAAAGTTTGACTGATGATGAATGAAATTGGTATTTGTGTAAGACAGAATTCCGACGGTCTATCATATGATATGGTGCATTTTATCTTTACTTTGTTGTTAAGAAAGTGAGCACCATAATGAGAACTTGCTTGTCTTGATAAGCGTTTGACATGCTCAGAGAAGCAGAGTAATTGCTCACTAAAGGAAAGGAGATTACAAGGAAGAATCAAGGAGCTGCAATATGAA
>XM_019217988.1 PREDICTED: Vitis vinifera uncharacterized LOC104878060 (LOC104878060), transcript variant X2, mRNA 
CTTTAGTCTTGAGACTTTCCTCTCTTTCACCACTTTTTCTTCTCCTCTTCTCTTTTATGTACCTTATTGTCGTCACAATCTCACCTTCTCGTTCCAAACAAATTTTTTCCCCTGCTAGCTTAGAAAGTGAAAGAAACTGGAGGTAGGAAGACGAGGCTTATGGTGGCGTCTCCCCGAAGTGGAATCTAGGGCGCGGCGGAAGCCATAGGCTTGAAAGAAGGGGAAGTGAAAGGCGGAGGACTTTCGAGTTTTATTGGCCGAGAGGCTAGGGCACGGTGTGATTTGGTTCGATCTCGGTGTGGAAGCTCGGGGAATCAGCTTATTGCGTAGTGGTTTTGTGGTTGTGGGATTTTGGAAACCTTAGATTTGGGTCAGGGTTGTGTGGTTGGCTGATTAAGCTAGGGGCGGGGCTGCCCTTGCGATTGACTGGGTTTTCATGCTGTCAAAACCACTGCCTTGGGATCGGAAGGACTTCTTCAAGGAGAGGAGAGGAAGCACGAGAGGTTGGAGTCTTTAAGTTTGCTGCAAGATAGAGGACTCGCATCAGGGTTCTTGGGAGTTTGCTCGCCGGAATCGGCAGACTTGCGCCGTCCTACAGAAGCACGAGAGGTCTGAGTCTTTAGGTTTGCTGCAAGATAGAGGGACTCGCATCAGGTTCTTGGGAGTTTGCTCGCCGGGATCGGTAGACTTTCGCCCCCCTACAGGGACACTTTTCTTTGCCATGAGCAATGTTGGTGAGGTGGGTAAATATCAATACACTTGAATATGATTGTCACATCATTTGGGGGCTTTTGACTCTGGAAGATTTCTGATTAATGTCATTAAATTTTTTCTTTTTCTTTTGAAACAATATGCCCCTTGAAGACTTGCTTTGAATAAATAAGATTTTAACTTGTTTAGCATTGTCTATTGTTGTCTTATTGTATTAGAGAGAAGAAAAAATTACACCTTGATTCCATTATTCTCCTTTTCAATTCTATCTAGTTTATCATCTTTGAAAACTTGAAGACCTTCTACTTCTAGCTTTATCTTGCAGAAGGACAATGATTCCTGATCTATCTGAATGAGGTTTAACACCAAGAACCAGATCAGGCCTTGGACAACTCAGATGGAAATTAAATCTTGGATAAAGCGTCCCTGTGAGTGTACCATTGCCCATGATATATCACTGGAAAATGTTTCAAGAATGCATGAGCTTTCAGAAGCCTTCCATGCTATTTCCTTAAGACACACATGCCTCTTGTCTATCTTGGAGCAGTTTAGTAAACTGAGTTCTAGGGCCGGTGAACTCAACTTACAGGTGGAAGCTGAGAGATCTTATCATCAAACTGTACTTGCTACTTTAGAGAAACTATTCGATGAGATGATTATGGAGAAGAAACGAAATGAGTCTTCATCTCAGCCAATAACTATGGAGAAAGATGTTTGCGTTCCTACCACATCCAAGGATGCAAATTCAAATGGATTTGACGATCATGGACATGCAAATCAAAATGGTTCATACTTTATTGCAAAAGTTATACACCCATTTGATGCTTAAGCAGATGGAGAGCTCGGTCTTTCTGTTGATGATTATGTTGTCGTTCGCCAGGTACCACCTGCCTCTATTGCAAATCCATCTAGCAATAAGAGGAATGTTTGAGACCTTTTAACAGCTTATTGGAACTTTCAATGTTTTGTATTTC
>XM_024297971.1 PREDICTED: Oryzias melastigma barrier-to-autointegration factor (LOC112162223), mRNA 
TGACTCCTCTTTCATACAAACGATCTCAACGCTCTGCCTCGTGACGTCACAAGAGGAGCGTCAACCGCCCCAGCAGCGTCCGGGTTCGGTTTAAAGTGTCCGGGGCAGAGAGCAGCGCTGACGCCTCTCAGGTGGTCACGTTCCAGTCGCCATGTCGACCACGTCGCAGAAGCACCGGGACTTTGTCGGCGAGCCTATGGGAGACAAACCTGTGATGGCGCTGTCGGGTATCGGAGACACGCTGGGGAAGAAGCTGGAGGAGCAAGGCTTTGATAAGGCCTCCGTGGTTCTGGGTCAGTTCTTGCTGCTGAAGAAGGACACAGAGATGTTCACTGACTGGCTGAAGGACGCCACCGGCGCCAACTCTCGCCAGGCCGGATCGTGCGCTCAGTGCCTGAAGGAGTGGTGCGACGCCTTCCTCTGAGACCCCGCCCCCTTTCCTGCTCCACCTGGTTCTGCTTCTGTTCTGCTCTCCGTCAGAACTGGTGTTCTCTGGATTTCTGTGAGAGAGCTCGCGGCGGCGACGCGTGTTTTATACCAATGTTTGCAGTTCACATGAATAAAAGGTTTGAATGTTTGAA
>XM_006985027.3 PREDICTED: Peromyscus maniculatus bairdii WT1 interacting protein (LOC102927739), partial mRNA 
GCAGAGCGGCGGCTGGAGGCGCTCACGCGGGAGCTGGAGCGCGCGCTCGAGGCGCGCACGGCGCGAGACTACTTCGGCATTTGTATCAAGTGTGGGCTTGGCATCTACGGAGCGAGGCAGGCGTGCCAGGCCATGGGGAGCCTGTATCACACCGACTGCTTCGTCTGTGACTCCTGCGGGAGACGACTCCGCGGGAAGGCCTTCTATAACGTGGGTGAGAAAGTGTACTGCCAGGAGGACTTCCTGTACTCCGGGTTCCAGCAAACAGCTGACAAGTGTAGCGTGTGTGGACACCTTATCATGGAGATGATCCTGCAGGCCCTTGGCAAGTCCTACCACCCCGGTTGCTTCCGCTGCTCAGTGTGCAACGAGTGCCTGGATGGGGTCCCCTTCACCGTGGACGTGGAGAGCAACATCTACTGCGTTAGAGACTACCACACGGTGTTTGCACCAAAATGTGCTTCCTGTGCCCGCCCCATCCTCCCTGCGCAGGGCTGTGAGACAACCATTCGCGTGGTGTCCATGGACAGAGACTACCATGTGGAGTGTTACCACTGTGAGGACTGCGGGCTCCAGCTGAGCGGGGAGGAGGGACGCCGCTGCTACCCCCTGGAGGGGCATCTGCTCTGCCGCCGGTGCCACCTGAGGCGCCTGGGACCCGGCCCGCTCCCCTCGCCGGCTGTGCACGTGACTGAGCTCTGAGAAGCAGCCATCAGGAGAGACGGGGTGACCCACACCCCCCTCTCACCCCCTCCACCGAGCTGCTGTCCCTTACGCAGGGGCCGGACCCCTGCGACAAATAATCGATTTCTATTTATTCACCGTCCGTGCCTCAAGCTACTCCCCTGCTGGGTTCCAGGACACCCGCACCCTGCAGCCTCGGGACAGGCCCAGCTCCTCTGCCCAGCTCCTCTGCCTGACCTCGGCTCCCAGAGGGGCAGGGCTTGGAGGGCCTTGGTGCCATGGGGGAAGGGTGCCTTGTTTGTGTGTGATCACAGCCAGGGGGCAGTGACAACCTGGGAACACCGCGGTTTGGCCTTGATGGGTGTTTTCAGCCACAGTCCTCCACCTCTCGGGATCCAGTCTGGGCCGGTGCTTTTCCAGCATCAGTCTCAGAAGACCCTGAGCGAATTCAAAGGCAGAGAGAAAGCCCACGAGAGCTCCCAGCAGACCCCGGGAGCATCTGCGCGCACTGTATCAGGCTCCACCACAAAACTATGTGATTTGACTTAAATTAAGTTCCCCCCAAGGAGGATGTTGACATTTTCTTGAAAAGAATATAGTTTTCTTCTAAAAACTTGGA
>XR_005799689.1 PREDICTED: Rosa chinensis OVARIAN TUMOR DOMAIN-containing deubiquitinating enzyme 12-like (LOC112165159), transcript variant X19, misc_RNA 
TAATTGTGTCCCATAGACCGAGTCACATCTCGACCTAATTGCAAAGTGGAAGACAAAACCTCTCGACCCTCTCAGTCATCTTCTTCACCACTTTCTCTTCCCCTTCTTATCCAAAATGAAAATCTTGTGCCCTCCTCACTGCTAATCCAAACCACTAATTCAATTCCTCAAGTTCCTTTCAATTTTTCGAAATCCATACCAAATCCGAGCGTCCTGACCTTGAGAAGCAGCAGCAGCGTGACGGAGGCGCCGAGGCGGTTACCTTAATTCCTAATTCTTCTTGCGTTGAGACAGGGGTTGAGTCTAGCCATCTGCGTTTCGACTTGTTCTGGGGAATCTCGAGCCTCTCATCGTCACTGTCGAAGACCTCGATGTATAGCAACAGATTTATTCCATGCCAATCGTCGTCCAGGCTCCACCAGTTTGGGCTGAACGACAAGGCGTTGCCGGTGAAATATAGTGGATTCAGAGAAGGCCAGTAGTCCTCTCCAGTCATTGTGTTTCTTCGCTCTCTTTCTCTCTCTAAATTTCCAAATTTGATTCTCACACTCTCTCTCTCAAAACCCTAACCCCCATTCTCTAGACCACAAGACTTCCGCTTCTCATTGCCGCTCGCCGTCGACCTGCCACGGCGTCGTTTCGGCTTCGTGTCGCATTATCGGTATTTCTCGGCGTTGTCGGTGATAGCCGGACGGAAGAAGGAGGGAGAGTGGGGGTTTTGGCTTTATGGGACTTGTACGACGGCGTTGGTGATTGGTCTTTGTTTTGATCAACATTCTGGCGTTTTGGCTCTCCGGAGAAGAGCTATTGGGGTATCGAAGGCTCTGTGGGAAAAGAGGTTTGTTGAGTGAAACTGCGAAGATGCTTCAAGGCTTTCCAAAGAGCAAAACATGAGCATGAGGCATTAAAGAGGCAGCTTGAAACTTATTTCCAGCTCAAGAAAGCAACCACAATCTCCTAAAAGCTGAGCTGAGAGGTACACACCAAGATTGAAATGGGGGAAAGGAATTGTATTAAAGATTTCATCTTTAGTAATTTTACTAATATCCCATCAGCTAAACTGAGTTTCAGGGATGTGTGAGCTGTTTTTTTAGTTGGGTAGTATGAATGGAAGCTATAGCAATGCAAATGTGAGCTCAAGCTCGAGTTTGAATAGCAGCTCTCATGATACCGAGGATGACCTGACCATTGCAACTGTTTTGGCAGAAGAGGAAAAGCAGAAAAATGATGGCAAGCTGGGGAAAAGACTCTCCCACTTAGATTTGATTCCGCACACTCTCAGGGTGAATGGGGAGATACCTGACGTGAATGATGCTACTCAAGACCATAAGAGGCTTTCAGAAAGTGTAAAAGTTGGAGCAGCTCAAGTCAAGTACGCTCAAAGAGATCATTCTGAAAAAGAAGTTAAAACTGGAGGACAAGCTGCTGGATGCTCCACCCGACACATTAGGTGCTGCTGTCTTGGCACTACACTATGCAAGTATGAGAGAACTTTAGTGGCAAAATTTCTCTCAATCACATTTGATTGTATCAACTTTTGCTATCTTTCAATGTAATTAGGTAGAATGCAGTAGTCATTAAACTAGCTAGAATGCCTTTTGTACGGTATGGATACAAGAATGTATATATGATTGACAAATGCTAGCTCCTTTGGTACATTAGATGGTTGAATTAGAATATTTCAATGCCTAAATCTTATATTAAGCATTATTTTTGTGCAAA
>XM_031791253.1 PREDICTED: Oncorhynchus kisutch protein-tyrosine sulfotransferase 1-like (LOC109884214), transcript variant X2, mRNA 
AGACTCTAGTAAAGTAAGGGTGACGCGTTTGCAGCGATACAATTGAAAAGAAAGCAGTAACAAGTAATCTTGTGTGTCGGATCAGTGGAACAACAAGGGAGCAAATTGAACGGATGGAATTTACGAGTAACGGTGTTCACCTATGAGATAAGCAGCTTGATCAACTCTCTCCCGCGGTGGATCCTCTACATTTAGGCCTGATGGAGCTGGGCACGCGACAAGCGTTGACCACCGGGGAACACACAACACGCTCTGCCCCCCATCGCCGACCTTGAAAGGAGGGACACTCCGCTACTCCCAACCTTCCCTCCTCTTCCACTACCTCCTCTGGTACAACTCCCCCCTTCCTCCCTCCCTCCCTCCTCCCCGGTTCTGAAATGGTGATGGTGATGATGATGAAGCTGAAGCAGAACCTGCTGGTGGCCTGTCTGGTCATCAGCTCAGTCACAGTCTTCTACTTGGGTCGTCACGCCATGGAGTGTCACCACCGCATCGAGGAGCGCAGCAGCCAGCCTGGGGACCAAGGGGTTCTGGGGGGCCTTCAGGGGTCAAGAGGGTTGCTCCTGGGGGGTTCTTTGAGCTCCTCCACCATCCTGCGGGGCTCTGGTCCCGGGGGCCATAACCTCTCCGCTCCATTCGTCTACAACAAAGACATGCCTCTAGTATTCATTGGAGGGGTTCCCAGGAGTGGGACCACATTGATGAGAGCCATGCTGGACGCTCACCCCGAGGTTCGTTGTGGAGAGGAGACCAGGGTTATTCCACGTATCCTGGCCATGAAACAGATGTGGTCGCGGTCTGGGAGGGAGAAGATGCGTCTGGACGAGGCCGGGGTGACAGACGAGGTCCTGGACGCCGCCATGCAGGCCTTCCTCCTGGAGATCATCGTGAAGCACGGCGAGCCCGCCAACTTCCTCTGTAACAAGGACCCCTTCGCTCTGAAGTCCCTCTCCTACCTGGCTAAGATCTTCCCGCACGCCAAGTTCGTGCTCATGATCCGGGACGGACGCGCCTCGGTCCATTCGATGATCTCGCGTAAGGTGACGATCGCTGGCTTTGACCTGGGCAGCTACAGAGACTGCCTGACCAAGTGGAACAGGGCCATAGAGACCATGTACACTCAGTGCCTGGATGCCTCAGACAAGTGCCTGCCAGTGCATTATGAACAGCTGGTGCTCCATCCAGAGAAGTGGATGAGGACGCTGCTCAAATTCCTGGACATTCCCTGGAACGAGGCGGTGCTTCACCATGAAGAACTCATAGGGAAAGCAGGAGGTGTTTCCCTCTCCAAGGTGGAGAGGTCTACAGACCAGGTGATCAAGCCGGTCAACGTGGAGGCCTTATCCAAGTGGGTGGGCAAGATCCCTGTGGACGTACTGCGGGACATGCCCGTCATCGCCCCCATGTTGTCCCGTCTGGGGTACGACCCCCACGCCAACCCTCCCAACTACGGCCGGCCAGACCCCAAGGTCCTTGACAACACCAGGAGGCTTCAGAAGACTCCAGAGAAAACAAACCCCAGTTAGGAGGAGCAACCAACATGCCACACAGACAAGACGGGGCACCGATGGACAAACATCCAATACAACACCACTTTTTGGGGACCTCAGTACTCTTCCATGGACACACACACACAAACACATACGCTATATATACAAAAGTATGTGGACATTACTTCCAATTAGTGGATTCGGCTATTTCAGCCACACCCGTTGCTGACAGATGTATAAAATCGAGCACACTGCCGTGCAATCTCCATAGACAAACATTTGCAGTAGAATGGCCCCGAACTGAAGAGCTCAGTGACTTACAACGTGGCACTGTTATAGGATGCCACCTTTCTGCCCTGCTAGAGCTGCCCCGGTCAACTGTAAGTGCTGTTATTATGAAGTGGAAACGTCTTGGAGGAATCAACGTCAAAGCCACGAAATGGTAGGCCACACGAAGTCACAGAACTGGACCGCCGAGTGCTGAAGCGCGTAGAAATCGTTGCAAACACTCACTCACGAGCCCCTGGAAGTAACTTCAGCACAATAACTGTTCGTCAGGGGAGCTACATGAAACGGGTTTCCGTGGCAGAGCAGCCGCACACAAGCCTAAGATCACCATGCGTAATGCCAAGCGTCGGCTGTAGTGGTGTAAAGGTTGCCGCCATTGGACTCTGGAGCAGTGGACCAACTCCATATTAATGCCCGTGATTTTGGAATGAGATGTTCTACGAGCAGGTGTCCACATACTTTTGGTCATAGTGTATAACATCATGACTGGATATAACCGTATTCCACACTGGCTTTGTGGAGAAACTCTCTTGGCCTTTTGATGTTCGTACTGTAAACAAATGATGCATTTGTCACAAAATGGTGACCAGAGAATGTCTATGTTACTATCTTTCTTGTCGAGGGTTGCAACATTTCCCCAATTTCCTAGATTTTCCAAAAAAATCCCAGTTGGGAGATTCCTGAGATCCTACAACCAGGATTTCTGGAAAAACATGGAAATATTTAGAAAGTTACCAGAATTTTTAAAAACAATTCTCGTGACACCAAATGTTTTTTTCTTCTTTTAAATGATTTCTCCTGTAAATATAAATATATAAATCTGTGATTCTGTTGTAAGAAAATACAGTGGACTTAAACATCAAAAAAAGTGAATAATGTATTTATGGATGACATTTTGCTTTTTGAAGATGCAATATCTATTTTAATGTTTGTTTTTCATGCCTTTCTATAGTGCGATTCCATGGGTACGGATGTACAAGATCTGTTTTTAAGTATTGACAGTGATAAAAGATGGCATTTTGTAAA
>XM_031379489.1 PREDICTED: Mastomys coucha kinesin family member 1B (Kif1b), transcript variant X9, mRNA 
ATGTCGGGAGCCTCAGTGAAGGTAGCTGTCCGAGTGAGGCCCTTCAATTCTCGAGAGACCAGCAAGGAGTCCAAGTGCATCATTCAGATGCAAGGCAACTCGACCAGTATTATTAATCCAAAGAACCCAAAGGAAGCACCAAAGTCCTTCAGCTTTGACTACTCCTACTGGTCGCACACCTCGCCTGAAGATCCCTGTTTTGCATCACAGAATCGTGTGTACAATGACATTGGAAAGGAAATGCTCTTACATGCCTTCGAAGGATATAATGTCTGTATCTTTGCCTATGGGCAGACTGGTGCTGGGAAATCCTACACGATGATGGGGAAACAAGAAGAGAGCCAAGCTGGAATCATCCCACAGTTGTGTGAAGAACTTTTTGAGAAGATCAATGACAACTGTAATGAAGAGATGTCTTACTCTGTAGAGGTGAGCTACATGGAAATTTACTGTGAGAGAGTACGAGATTTACTGAATCCCAAAAACAAGGGTAATTTGCGTGTGCGTGAACACCCGCTGCTTGGACCCTATGTGGAGGATCTGTCCAAGCTGGCAGTCACTTCCTACACTGACATTGCTGACCTCATGGATGCTGGGAACAAAGCCAGGACGGTGGCAGCTACCAACATGAACGAGACAAGCAGCCGTTCCCACGCCGTGTTCACCATTGTCTTTACCCAGAAGAAGCAGGATCCTGAGACGAACCTTTCTACTGAGAAGGTCAGTAAAATCAGCTTGGTGGATCTAGCAGGAAGTGAACGAGCTGATTCAACTGGTGCCAAAGGAACAAGATTAAAGGAAGGTGCAAATATTAATAAGTCTCTTACAACTTTGGGCAAAGTCATTTCGGCCTTGGCAGAGGTGGATAACTGCACAAGCAAGAGTAAGAAGAAGAAGAAGACTGACTTTATTCCCTACAGGGACTCTGTGCTCACTTGGCTCCTTCGAGAAAACCTAGGTGGCAACTCCCGAACTGCAATGGTTGCTGCTCTGAGCCCAGCAGACATCAACTACGATGAAACGCTGAGCACGCTGAGATATGCAGATCGTGCAAAACAAATTAAATGCAATGCTGTTATCAACGAGGACCCGAATGCCAAGCTGGTTCGTGAGCTGAAGGAGGAAGTGACCCGACTGAAGGACCTTCTTCGTGCTCAGGGGCTGGGAGATATTATTGATACATCCATGGGGTCCCTTACTTCATCTCCATCTTCATGCTCACTTAATAGTCAGGTGGGCTTAACATCTGTGACCAGTATTCAAGAGAGGATCATGTCTACACCTGGAGGGGAGGAAGCCATTGAACGTCTGAAGGAGTCAGAGAAGATCATTGCTGAGTTGAATGAAACCTGGGAAGAGAAACTTCGTAAAACAGAGGCCATCAGAATGGAGAGAGAAGCCTTGTTGGCTGAGATGGGAGTTGCCATACGGGAAGATGGGGGAACACTTGGTGTTTTCTCCCCTAAAAAGACTCCACATCTTGTTAACCTCAATGAAGACCCACTGATGTCGGAGTGTTTGCTTTATTATATCAAGGATGGAATTACAAGGGTTGGCCAAGCAGATGCTGAGCGGCGCCAGGACATAGTGCTGAGTGGGGCCCACATTAAAGAAGAGCATTGTATCTTTCGGAGTGAGAGGAACAACACTGGTGAAGTTATTGTGACCTTAGAGCCCTGTGAACGCTCGGAAACATATGTGAATGGCAAGAGGGTGGCCCATCCTGTTCAGCTGCGCTCAGGGAACCGTATCATCATGGGTAAAAACCATGTTTTTCGTTTTAACCACCCTGAACAAGCACGAGCAGAGCGGGAGAAGACTCCCTCTGCCGAGACCCCCTCTGAGCCCGTGGACTGGACATTTGCTCAGAGAGAGCTTCTCGAGAAACAGGGAATTGATATGAAACAGGAGATGGAAAAGAGGCTTCAGGAAATGGAGATCCTTTACAAAAAGGAGAAGGAGGAAGCTGACCTTCTTCTGGAGCAGCAGAGACTGGACTATGAGAGTAAATTGGAGGCCCTGCAGAGGCAGGTTGAGACTCGATCTCTCGCTGCAGAGACAACGGAAGAAGAGGAGGAGGAGGAGGAAGTTCCTTGGACACAGCATGAATTTGAGTTGGCCCAGTGGGCGTTCCGGAAATGGAAGTCTCACCAGTTTACTTCATTAAGGGACTTACTCTGGGGCAATGCCGTGTACCTGAAGGAAGCCAATGCCATCAGTGTGGAACTAAAGAAAAAGGTGCAGTTCCAGTTTGTTCTGCTGACTGACACACTGTACTCCCCTTTGCCTCCTGAATTACTTCCCACGGAGATGGAGAAAACTCACGAGGACAGACCTTTCCCTCGGACAGTGGTGGCGGTGGAAGTCCAGGATCTGAAGAATGGAGCAACACATTATTGGTCTTTGGACAAACTCAAACAGAGACTGGATCTGATGCGAGAGATGTATGACAGAGCAGGAGAGGTGACCTCCAGTGCCCAAGATGACAGTGAGACGACCATGACCGGCAGCGATCCGTTCTATGATCGGTTCCATTGGTTCAAACTTGTGGGAAGGGCATTCGTGTACTTGAGCAACCTGCTGTATCCGGTGCCCCTGATTCACAGGGTGGCCATTGTCAGTGAGAAGGGGGAAGTCCGGGGATTCCTTCGTGTGGCTGTGCAGGCCATTGCAGCCGATGAAGAAGCTCCTGATTATGGCTCTGGAATTCGACAGTCGGGAACAGCTAAAATATCTTTTGATAATGAATACTTTAATCAGAGTGATTTCTCTTCAGCTGCAATGACTCGTTCTGGTCTGTCCTTGGAGGAGCTGAGGATTGTGGAAGGTCAGGGCCAGAGTTCTGAAGTCATCAGTCCTCCAGAAGAAGTCAGTCGAATGAATGACTTGGATTTGAAGTCAGGCACTTTGCTGGATGGGAAGATGGTGATGGAAGGGTTTTCTGAAGAGATTGGTAACCACCTGAAACTGGGCAGTGCCTTCACCTTCCGGGTCACGGTGCTGCAGGCCAACGGAATCCTCCCAGAGTATGCAGACATCTTCTGTCAGTTCAACTTTTTGCATCGACATGATGAAGCATTCTCCACTGAACCCCTCAAGAACAATGGAAGAGGAAGTCCCCTGGGCTTTTACCATGTACAGAATATTGCGGTGGAGGTCACCGAGTCATTTGTGGACTACATCAAAACCAAGCCCATCGTATTCGAGGTCTTTGGACATTACCAGCAGCACCCACTTCATCTGCAAGGACAAGATCTTAATAGTCCACCTCAGCCATCTCGAAGATTCTTCCCCCCACCCATGCCACTCTCCAAACCAGTTCCAGCTACTAAGTTAAACACCATGAACAAAACCACCCTTGGGCAAAGCATGAGCAAGTACGACCTTCTGGTTTGGTTTGAGATCAGTGAACTGGAGCCTACTGGAGAATATATTCCAGCTGTGGTTGACCATACAGCAGGCTTGCCCTGCCAGGGGACATTTTTGCTGCACCAGGGCATCCAGCGACGGATCACAGTGACTATCATCCATGAGAAGGGCAGTGAGCTCCACTGGAAAGATGTTCGTGAACTGGTGGTAGGTCGGATTAGGAACAAGCCTGAGGTAGATGAAGCTGCAGCTGATGCGATCCTTTCCCTAAACATCATCTCCGCTAAGTCCCTCAAGTCTTCCCACAGCTCCAGCAGGACCTTCTACCGTTTCGAGGCTGTATGGGACAGCTCCCTACATAACTCCCTCCTCCTCAACCGAGTGACCCCCTATGGAGAAAAGATCTACATGACCTTATCTGCTTATCTGGAGTTGGATCATTGCATCCAGCCAGCCGTCATCACTAAGGATGTGTGCATGGTCTTCTATTCTCGAGATGCCAAGATCTCACCACCACGTTCTCTGCGAAACCTCTTTGGTAGTGGCTACTCAAAGTCGCCAGACTCCAACCGAGTAACTGGAATCTATGAGCTGAGCTTATGCAAAATGGCAGACACTGGGAGCCCAGGCATGCAGAGGCGGAGGAGAAAGGTCTTGGATACCTCCGTGGCGTACGTGCGGGGGGAGGAGAACCTAGCGGGCTGGAGGCCTCGTGGAGATAGCCTCATTTTGGAACACCAGTGGGAGCTGGAGAAGCTGGAGCAGCTGCACGAGGTGGAAAAAACTCGCCACTTCTTGCTGCTTCGGGAGAGACTTGGTGATAGCATACCCAAGTCTCTGAGTGACTCGTTGTCTCCCAGCCTCAGCAGTGGGACCCTTAGCACCTCAACCAGCATCTCTTCTCAGATCTCAACCACCACCTTTGAAAGCGCCATCACACCGAGCGAGAGCAGTGGCTATGACTCAGCTGATGTTGAAAGCCTGGTAGACCGAGAGAAAGAGCTGGCTACAAAGTGCCTGCAGCTTCTCACCCACACTTTCAACAGAGAATTCAGCCAGGTACACGGCAGCATCAGTGACTGTAAGTTGTCTGACATCTCTCCAATTGGACGGGACCCATCTGTGTCCAGTTTCAGCAGTTCCACCCTCACACCCTCCTCCACATGCCCCTCTCTGGTGGACTCCAGGAGCAGTTCTGTGGATCAGAAGACCCCAGAAGCCAACTCTCGGGCCTCCAGTCCTTGCCAAGAATTTGAACAGTTTCAGATTGTCCCAACTATGGAGACACCCTATTTGGCCCGAGCAGGAAAGAATGAATTTCTCAATCTTGTTCCAGACATTGAAGAAGTCAGAGCAGGCTCAGTGGTATCTAAGAAAGGATACCTGCATTTCAAAGAGCCGCTTTCCTGTAACTGGGCTAAACATTTCGTTGTGGTTCGTCGCCCTTACGTCTTCATCTATAACAGTGACAAAGACCCAGTAGAGCGTGGCATTATTAACCTGTCTACAGCACAGGTGGAGTACAGCGAGGACCAGCAGGCCATGGTGAAGACACCTAATACTTTTGCTGTATGCACAAAGCACCGTGGGGTCCTTCTGCAAGCTCTCAATGACAAAGACGTGAATGACTGGTTATATGCCTTTAACCCACTTCTGGCTGGCACAATAAGGTCAAAACTCTCTCGAAGATGCCCGAGCCAGCCAAAGTACTAAGCGGTTCTTCTGAGCCTTGCTCACCTGTGACAGATAAAGAAAGTGTTACCTCTCATTCTCTCTCTTTGTGATTCTTGACGGTTATTCTTGTATGTAATCCTGTGGCTTAATGACTTTTCCCTCCCTCGTCATCCCGCACTTCTCTAGTTCTCCTGTTCCCTCTCTCCATGGCTCTGTACTCTTCTTATTCTTGTGCTAAGACTTGTAGCATGTGGCCTAACAAAGGGGAACAAAACCACTACACATTCATATACACTCACACCCACGCACCCTGAGGGGATCCAGCACATCTCCAAATGATTTTCCTGTGTACGTTAGCTTCCTTTTGGATGATGGGTCCCCTTCATGGTCACTGTCCCCCTGTTGTTTCTGTATGGCTCTGGTTTTCAGGGTAACTTCTCTGTCTCTCTTTTTTCCCTCCTTTGTTTATGATAATCTACTTTTTTCTGGGTGGTTTAGATACTAAGGGAGGAGACGTTTGGTATTGTCAGCCAGGAGAAAAAAACTTGCTTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTGTCTCTCTTTGTGTGTGTGTGTGTGTCTGTGTCCATGTTTCTCTCTCTGTCTCCGTCTCTCTCAATGTCTCTGTCTTTGTCTCTCTCTTTGGTTGCTAATCCATGTATTTCCATTCAGGGAAAGCACTGTGGGAAGCTCAGAATTGGGATTTTAAATTCTCTGTCTAAATCAGGGCGCAGAGCATGGGCTTATAGAGAGGAAGATGCAGAAGGGCCTTTGTGATCAGCCTGCAGCAGAGGCTGCTGCAGTAGACTGCTGGAGCTCCTCACAGCCGGGTCCTGCAAATGTCTCCTCCCTGGGAAGGAAGCTTTTGTCTAGGAGTTCCCCAGCCCTATTCTCAGCATTACTGTTTAGAATTACGAGATGTCATGAACAGATTTCCCACAAGAGGGATTGGGGAATGTTTGACTTTCTAGTGATAGACTGGACCATTGTTGCTTTGAGAGTGCTGAGTGCAGCTTGTGATTGTTGTAGCTCCCTTTGATCAAAGACTTGTAGCTTCAGCATAAATCTTGAGGTCTCCATCTAAATCCAGTGGCCATTTTCAATGTATGAAATATGAGCAAACATGGCATTGTTTTTTAGATGCCAGAACTGGCCGGTCCTTACCACCACTCCAAACAAATCACAAGATATTTAGGGTTGAAAAAGATTGTGGATTGTGACATGCCTCCTGTGTGACATGCCCCTGACCCCACTATCCCCATGTGGTTTGGAAATACTCCCTTAGGAAGAATTCACTGCTCCCAGTTTCTGTGGCTTCTAACAAACCAGGTCTCTGGATTCAAGAAGTTATCATAGAAAATAACACTCTCCCTCCACCAGCTAGTCAGTGTTGGGGACTGAGTAGGGCACAGAATGCCCGCTGGAGCTACTTGAGTTGTGTGCCAGCGACTTGAGGCTCATTCACACTGCTGTGTCCTGGCTTCGCCAGCCTGCTTCAGTGCCACTCATGCACCCAGGAAGGCATCTGCTCACCTCCACTCTACAAAGGCTCCTGGCTACCTGAGGGTAGAGAAGGAATGGATTGCCTTCTGTTGGGAGCTCATCTCCACTGCAGAGCAGCCACCAGGGAGGCGAGCGAGCATGCAGCCCCTTGCTGCTGACCTCTCGGCAGGGCTTCTCTCGGAAGAACTGGTCTCCAGCTCCTTTTGTTACAGCTGCCTTGCAAAGAAAGGGAAAGTGGACATGGAGAAAAGAAAGGGCAGAAATCAGACTGTTCTTATCTAAAAGATGATCAACTCCAGTAGACTTGTAAAACTTTCTTTCTCTCCTTAAAGTATAGGTTACTAACTGTAATGTTACTTGTTTTCTAAGCATATATATGAGATTTTTAATGTAGTTAGAAGTCTCTGTTGTCTGATGGACACAACATGTCCTTCTGGTGTATACTCAAATTCAGCAGGCTCTGTCTATGCTTGTAGACAGTTTCCTGGACCGGAACTAAATATAATTTCAGGGAAACAAAGATCAAAGGTCGCTTTTAAACTGAGTCACTGATGTTGCTGCTGTTAGAAAGGTAGATGGAAGGATCCGCGTCTGTGCGAGGTGAGAAGCCTGAGGGAGGGTGAAGTGTGCGGTACACTAAACCCTGCGATGACTTGTGTTTTCTTTTAACTCAAACAAAACTGGTTTAGAAAGTCTTTGCTTTGCAAATATCAAATATTAGCATGAGCCAAACTGGACTGCCCCTTCATCAGAGGCGCCCCCCCATAAGGAGGCCTCATTAGGAAGCCAGGGAAAGGAAGGTTGGAGCTTGGGCACGTGTGCTGCTACCTGCCATCATTGGGGCCCCCCCTGACTGTAAGGCCCATGGTCAGATCAGAATCAGAGCATTTGGGGGCTTTACTTTCTGTTTCCAGACAAGGTCACCTCTGCTTCGAAGCTCTGCAAGAGAAAAGGTTTTATGGCAGGACCTGTTCATGAGATTTTTGTGGTTGCCATAGTAGCAGGAAAGTTAAGACAACTAACCTTAAAGAAACTTTTTTTTGGGGGGTGGGGGGTCTGAGACAGGGTTTCTCTGTGTAGCCCTGGCTGTCCTGGAACTCACTCTGTAGACCAGGCTGGCCTTGATCTCAGAAATCCGCCTGCCTCTGCCTCCCAAGCGCTGGGATTAAAGGTATGTGTCACCACCACCTGGCAAGAAACTATTTTTAAGGTAATTTTAAAAAAAATTTCAAAGCACTCCTTTAAACAAAAAACCTACAAGGAAAACATACAGATTACAGAAAAGTGAGTGCTGGTTGAAATGAATTAGCCTCCCCCTTCCTTCTTTATCCTCCTTCCTCCCAAGCAGATATCACTCCTAACTGTCCCCCACGCCAGTGCTCAGGCCCAGCCTGCTTCTGGGGCTCTACCCTGGGAGTCAGCCAGCTCTCAGCCCCAGACTGTCAGGGACCAGGCAGTCCCTGCACAAGGCTAGGCAGGAGCACAGGCCAGACTGCTTCTGAGCAGGCCCCTGATCTCCATCCATAAATGAGGCGAGCTAAAGCTTCCTCAGCTAGGAAACCTTTCCTCCCCTTCAGCTATATGGAATGTATATATCTATTAAATTTTTATCTTGTTTTGATGAAAGGATGAATGGTTGTGAAAGGTATTTGGGGTCTAAAACCATGATTTTTTCCTGGCACATATTTCAAAGCATAGACTTTGTTACCTGCTGCTTCTTGTCTAATTTACAGGGATATTTAATTTTGTAAGGTATTTGTATATTTATACAGCTGTAATGAATTGCACATTGGACTGGAAGGGGAAGGCTCTGCCCTGTGTGGCTCCTACTGGAACTCTTGCATTTTCCTCTTGGGCGCTGTGCTTTGGCCCATCTGAACAAAATCAGGGGTGTGTGGTTTGTTTAGCGTGGGTCCATCATTTTCATTTGGGTTCCTTTTGGAAAATGTAATCTTTAACTTGCTCTGTGAGAAGAAAAGAATAATTGTGTTGCTGCTCTTGGAAGGTCTGCTGAGTGCATTTGAGTGAACTCTGGCGCTGTGTACTGCAGCCATCCACCATGACCTGTGATCCACCAAGAGTGAGTAAGACCACGACCATGGAGCAAGTCAGAGATTGTCAGGCGAGAGATTATTGCTGTTACTGTTCAAAAGGCCATTTATGAAGTAGATATTTGAGCTCTTTAAAAAAAAAATCTTAAGAGAGCCCCTAATTACTTAAAGAAAAAAAGAAATTTAAAGAGTTAATACAGAACTGGTATTAAAAACTTGCAGGCAGAGGTTAGAGCACTTGGCAATTTTACGTGATGCCTTTGGTTCAATCCCGGTGCTGCAGATCAGACAGAAAGCCAGGAGGCAGAGAGCTGCGCAGACAGAAAGTCTGTTATATGTTGTCATGTCTTTAATTGATTCTTTTCATGCTGTGTATTCTGGCATCAGTTCACCTAAGGGACCCACCAGCCTCCTCATGTTTAAGCATTGTCGTAGACTTTGTGGCTCTAACATACTTGTCTGTTGAGAGTGGCGTCTCTTGTCACCATCCCCATGCTATAACAGAACCCATGAAGCATAAGTGGCCTTTTTGAACCAAGACTTTGCAAACTGATCTCTCCCCAGGGAAGGAGTTGAGCACAAGCAACAATGTACATTATTAATTTTGGATTTCATTTTCATGTTTTATTTTGTAAATATCTAATGTTTGGAGCTTGAGTATACAAAATGTAAATACAGTTCTCGTATTTGTACTAATCCTGATTCTTTTGCTGTATAGCCCTAGCTGTGTAATGCAGACATTATCTGACTGTGTATGGTAACCTTGCATCACAGAACTGCTAGTGAACGAGCTAAAACAATAAAGGTACAACCAGTGCA
>XM_039680831.1 PREDICTED: Pimephales promelas family with sequence similarity 49 member A, like (fam49al), transcript variant X3, mRNA 
AGATGAGCAGCTGCTAGGCAGGACTGTCTTGAAAGCAGAGAGACAGTGAGAGAGACCATTTGGTGCCTGAACGCGAGCGAGGGAGGGGGCGAGAGAGACGCACACACTCAGCGTGAGCCTCTGGTTTAAGTAGACACTAACCGTGCGTTTAGGGAAACCCACAGTCTCAGCTCCCTGGGATACAGGAGTTTCTGGCCCTGCTCTTTTTCCCCTTTTCATTCTTTTATTTTACTCCCTCCATCTTTTCTCTTCTTCCCTTTGCCTACGGAAAGCGCTGGACCACTGTTTTCTCCCTGAAACACGCCAAGCCGGTAGTGGAGGCTGATGCTGTGATACACTGCAGGAGAAACATACAGGCTCTCATTTGATGCAGTGAAGTGCTCTGTGAGGAAAATCGCAAGCAAAGGTTTGCCGGCCATGGGGAACCTCATTAAAGTCCTTGGCAAGGATTTAGAGAACTGTCCTCATTTTTTCCTGGATTTTGAAAATGCTCAGCCCACAGAGGCCGAGACAGCCGTGTATAACCAGGTTAGTGCTGTTCTGGAAGAGGCCCATGGGATACTGGCAGAACTACAGTCTTACAATGGAGCAGGACAAGAAATAAGAGAGGCCATTCAGAACCCCAATGACCTCCAGTTGCAGGAGAAAGCCTGGAATGCAGTCTGCCCTCTGGTGGCCAAGCTCAAGAGATTTTATGAATTTTCTCTCAGGCTAGAGAACGCCCTGCGGAGTCTATTGGAGGCCCTAACAAGCCCACCCTACGCTCCCATGCAGCATCTGGAGAGAGAGCAGGCCCTCGCCAAACAGTTCGCAGAAATCCTGCACTTCACTCTCAGCTTTGATGAGCTTAAAATGACAAATCCAGCCATACAGAATGACTTCAGCTACTATAGGAGGACCATCAGCAGGAATCGTCTGAACAACCAGCAGTTAGAAGCTGAGAATGAAGTAAATAATGAAATGGCCAATCGGATGTCGCTCTTCTACGCTGAAGCCACACCCATGCTCAAAACCCTGAGCAATGCCACGACTAAGTTTGTGTCGGAGAATAAGACTTTGCCAATCGAGGACACCACAGATTGCCTGAGCACTATGGCCTGTGTGTGCCGTGTCATGCTGGAGACTCCGGAGTACCGGTGCCGTTTCACTAACACAGACACCATGCTGTTCTGCATGCGTGTGATGGTGGGCGTCATCATCCTTTATGACCACGTTCATCCAGTGGGTGCCTTTGCCAAGACCTCCAAGATTGATATGAAGGGCTGCATCAAGGTGTTGAAAGAGCAGCCTTCAAACAGCGTGGAGGGACTGTTGAATGCACTGAGGTATACCACAAGACATTTAAATGATGACAGCACCTCAAAACAAATCAGGGCTCTGCTTCAATGAGAGCAGGAGGAGAGGGAGGAGGACCCACAGAGACAGGGACTGTCAGAGAACAAGCGATGGTGGCTGGCAGTCCTCTGAAACCTGTTTGTTTACAAGAGCAACTTGATCTCAAATGAAATAAGATATTCTAGAAAAGAAAAAGGAATACGAAAATAAATATATATATAGAGAGAGAGATTGTTGATGGTTCATCACCGTGTGTCATTTTATAAAAGCAGGAAAAATAGAGATATATATGTATATTAAAATTCATTACTTAAAACTACCTGGGTGTGGATATAAAAGTCTTTCAAAAACATATTAAATATTTAAGAATTGAATTTAAAAGCGGTAGTTAAAACCACCAACAAAACTGGTTCATATTCCAAGTTCCGCCTGAGAGTATTTTTGCACACTTGAAAAGGAATCCCACCTCACAGGAAAGACATTAACATGGCTTGAAACTGTATAATTCAGATCCCTTTTCACGCGTTTTTAGACTTGATTTGATTTGCAACGCCTCGTTATTCCCGTATGTGCTTCGTCCAATGCATTCTGGGAATTAAAACCGGAGTCCTTGGCATTTCAAGTCTGTTGAAGGATAAATGTAAAGATCACATACTTGAGACGCATCTCTGCTGACATCGCCAGAAATCAAACTATAATCCTCTAGCTGTATATACTCGGAAAGCACAGGATAGTTTTGTAAAGAAATGAAGCGTTTTGTTAGACTTCTTCACTAGTGCTGTACAGCAATACTCTATACCACCAATGTGACAAACCCGTTCATTTGAAATGCCTTCATACCAATGTATGAGACGCCGGATAATGCTAACAGTTCATCTGTGGAGTTGTACATATCATCAGACGAACAATCCTTTAAAAGTTACGTTTTTGCTCTTGTAAAGTTGACGTTCAAACGGAGCGAGTAAGCCATGAAACTGTAATTCAGACGCAAACACACATTCTGCCCTGTGCCATAGCTGCTTCCTGTACCACTGCGTCAGAGTGACGTATAACAAACATCATTCGTAGAAACCAAAACACACCATTGAGAACAACACAGCGATGTGGATTTGCTTTCCTCTGTATCCAAAAGCAAATCATTGCCAAATGGGACTGCAACTTTGCCTTTCAGATAAATAGAAGTGAGACGTTTGGTCATGAACACAATCTCAAAACAACAGGCTTGAAGGTGCAAAACACTTGACTTGGTGTAAATAAGAGGATTTTTACTAAACAAACGTTCCATCGAGACTCTTTGTTAGAATTACAGATGCATATTAAAAAAAAAAAA
>KC305230.1 Stachybotrys sp. HGUP 0107 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene and internal transcribed spacer 2, complete sequence; and 28S ribosomal RNA gene, partial sequence 
TCGTTGCTTCGGCGGGAACGCCCCGGCGCCCTGCGCCCGGATCCAGGCGCCCGCCGGAGACCCCAAACTCTTGTGTTTTTTTCAGTATTCTCTGAGTGGCAAACGCAAAAATAAATCAAAACTTTTAACAACGGATCTCTTGGCTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCGTTAGCATTCTAGCGGGCATGCCTGTCCGAGCGTCATTTCAACCCTCAGGGTCCCCGTTCCGGCGGGGAACCTGGTGTTGGGGATCGGCCCGCCCCGTGCGGCGCCGTCCCCCAAATTCAGTGGCGGTCTCGCTGCAGCCTCCCCTGCGTAGTAGTTACAACCTCGCATCGGAGCTCAGCGCGGCCACGCCGTAAAACCCCCGACTTTCTGAACGTTGACCTCGGATCAGGTAGGAATACCCGCTGAACTTAAGCATATCAAT
>XM_052206935.1 PREDICTED: Mytilus californianus uncharacterized LOC127702642 (LOC127702642), transcript variant X2, mRNA 
AGGTTAATAGATGTAGTATTTAAGCGTATATCAGAGCAACGTTACCCAACATACCACATACGAAAAAAAAAAAAAAAAAGGGATAGCATGCTTAACAAATTACAAGTATTCGTATGTTTTCTGATTGTCAATTATATATTTTGCGAAGACACCGATGATTGCAAGGATGAAATATGTAGGAAGTCGTTAGCAATGCCACTATTGAACAATCTGAAAGCACCTCTTGTTGCCAATTTGGATATAACTCAGTTTAACAAGCAGCTACGAGGGTACATTACAGAACAGATCAAGCAATGAGTAGAGCAGGCAAAGAAAGAAATAAGGGGCGAAATGGTAGAACTCGTCGACACATTCGAAGACGCTCATGTAAACGTTACACAAGACCTTAGCAAAGATTTGAACGAAATCAGGCGTCAACAAATGCAAATGGAAGATCGTGCAACTAAAGAAAATGAAATATCGGGTAATTTTACGTTTGAAATTATCGATGGAATGAAGAATATAGAACGACATCAGAAAGATATTCTGACAGATGTGGAGCAGTTGAAACGTTATAAAGAATCAGTAATTACAGCAAATGAAGAAAAAAACAATTTCACAGCAGAAGTCAAAGATACACTAAAGAATTTAAATCAACAACTGAATGAAACTCATGATGAAATTCATCACTTGAAAAGTTTTCATGCATCTTTAAACTCCAAAATTAATTCAGCCGACAAGAGGATATCTGCAAATGAAGAAAAAGTACCAATTGTCAACGAAAAATTACGTAATTTAAAAGGAGAGCTAACTTCAATTCGATCGGACATTAATAGTGTAGAAAGTCGTCAGAAATCATTGTCCTCTGACATCAGCAGTGCTTTCAGTCGTCTTACAGCAAATGAGAAAAGAGTTGGTTTTACTGCTTGCGTTAGTAAAGATGATGGATCAACCATATCAGCAGGTCATCCAATACCATTTACCACTGTTACATCTAGTTATAATGTTGATATGTCAAGCGTTAAAAGCAATGGAAAGTTCACCGTTAAAATAAGTGGTTTATATTTTATATCGGCATCAATAAGAAGTAAAACAGACCATGGATTCTTTGCAATATATGATGATTCGTACTTTTTAGCTTATGGATACACAGCTGAGCATGACGGTAAAGATACATATGATCACAGTGGTACAGTAGATGCGGTGCGATATTTTAATTACGGTGATATCCTAGCAGTAAAGCCGTGGAAAACTATGGACATTGGTGCTTGGTCTTGTCTGACTTTTGTCAAAATAAAATAGAAACAAATTATAATTAATATCTGACATTTTGTATTTTTGCGCAATAAGATATCACAATTGAACATTATATTTTGAAACAATACTATAAAGGAACTGTTCTAATTATTGGAAGTACTAAGTACGTACAACAAAAGGTGTTTCTACTCACAACTTGACATTCTGTATTGTCACCAATTGGAAGTTTTCATGTTTTGTTTTAACAATTATCGCTTTCAAATAGTCAATTAGCTTATAGTAATTCTAATGTTCAATTATTTATTATTTCTTCATTTATGAATAACAAAATAATAAACTGATATGATATTTCAAAAA
>XM_050245764.1 PREDICTED: Anopheles aquasalis tyrosine-protein kinase Fer (LOC126581837), transcript variant X1, mRNA 
GCGCGTGGTTGTGTGAAGCTGCGGTGCGTGAGCTTTCTTTTGCTTGTTTGTTCTGTGTTGTGTTGTTCTCCGTGCATCGCGGTGATCGTGCAGCGTGATTTGTGTGCGTGTGCACGTGTGTTCAGTGCGCCTCCTCCACGCCGTGATTACAGAGGTACGCCTTTACCTGCGCTACGTGTTTGCTCCTTGCTAGTTTACAACAGGAAGGAGAAAGAAAAGATCAAAGTGTCGGTGCGTTGTGCGTATGCTTATGCTTGAAATACGAAGATAAATACAACCGCCTGCTGCGTGTGTGCTTTTTCGGTGTGGCGGTTTGTTGGTGGCACCTGCAATAATCGCACGTTTTATCAATTCGATAGTGTTGGGTTAAGGATAAGATACAACATATCGCGCAAATCATCAATATCAATCCCTACCTACTGACTTGGTGGATAGTGTCGTTCCTCCATTTTCCAAAATGTAACGGATATTACTACATAAGACCGGAACGAAACGGCTACGAATTAACGCATTGAAAAAGTGAAATCCTAGTGCTAGAAACGGATTCAAAATTGCTTCAACAAATTAGAATATCCCTTTTGCATTTGTATCGCTTAATTGCTGTGTTTTTGTGTTACTAAAGTAGTGTTAGTAGTGTATGGCGATTCGCCAGGGGATGGCTGCGTGTAGTGTCGTGTAGTGTCTAACGCGCGAAGCGTTAGAAGTGGAGTGAACAATAGAGCCAAGAGAAGAGGTCAATCAAGTGCATAGTGCCTTTTTTGTTTTTTTGGTTGATTTTTTTTTCCTGCGCGAGAGGAAACCAATTCTCTCAGTAGGCAGTGGCAAAGCAACGGGGGGAAACCATCATGGGCTTCTCGTCTGCGCTGCAAGGCCGAGCGGCACACGACGCGCTGCTCAACCGGCAGGAAGCGGAGCTGAAGCTGCTGGAAACCATGAAACGGTGTCTGGCACAGAAGGCAAAGTGTGACCGGGAGTATGCCGTCTCGTTGGCGGCCGTCACCCAGCAAGGATTGAAAATCGATCGCACCGATGATCTGCAAGGAAGCCACATTATGCGTGCTTGGCGGGGTTTTATGGAAGAACTCGAGCACACTGCCAAACAGATTCGCTCCAATGCCGAGCAGCTGGAAACGGTTTGTCACGAGAAGCTGGCCAGCCTCTACCAGGAGAAACGCCGGGTCCGCAAGCAGTACCAGGAAGAGCACACCAAAATTGCCACTCAGTTCAGTCATCTCACAGAAGACGTCGCACGGAAGAAAAGCGAATATCAGAAGCATTTAGACTACTACAAACTGCTGCGAGGTCGATTCGAGGAACATATCAAATCTGGTCGGTCTGGGCGAAAGCTGGACGATGTCATCGACAAGTATCAAAAAGCCTGCCGGAAGCTGCACCAGGCCCACAACGAGTACGTTCTGCTCATCAGCGAGGCGGTCGAGGTGGAGAAAGATTTTCGAACAACGCTACTGCCCGGCCTTCTCGAACACCAGCAGACGCTCCAGGAAGGATTCATCCAGGCATGGAGCAATCTGCTGTCAGAAATTGCAAAACTCAGTGACACCACATCGGAAAAGTACGTGGAAATACAGCGACGCATTGATACGAGTATATCGAGCATCAACTCGACGGAGGAGTATCGCGAGTTTACGGATAAGCACAAAACATCACCGACCACGCCGGTCGTCTTCCAGTTCGACGAAAGCCTCGTCGAAGACAGTCTCGGTAAACTCCAAGCGAACACGTTGACCGTCGACAACCTGACGGTGGATTGGTTACGCGGTCGCCAGGTGGAACTCGAAGGTACGATTAAGGATCTGCAAGAACGACAAGCCAAGCTGCTCGCCGAACCGAACGGAACCGGTACACTGGCCACTAGCAGCTCACCCGCTTCCAGCAGCCCGGTCAGTACACCGGGAACAAAGCCATCCACACCGATTCTCAACGGTACCGGAAACAGCAACGGGGCATCAGGCAAGGACTCTCAGCAGATTGCGGCCAATAAATCATCAAAGGAGTTGAACAACCTGCGGTGCCAGGAACGCCAAACCATGAAGCTGGTCGAGATGATACGAACAGCACTGAACGAGGTCGGATGCGAAGAGCTACCTTCCGGATGTGACGACATCGCGGTAGAGCACCTTATCGAGAACAAAAAGTCTGTCAGTCAGGATCTATCGCTGGACTCGCAACATAACAATCCATCGCAGGCGGGAGGATTTTTCACACTGCGCACGGGTAACGGTGGCAGTGGTGGTGGTGGTGGTGGTGGTGGAGGTGGTGGTGTGATGTCAATGTTAATAGATCAGTTGCGACGCAAATCAGGGCCTCCGGGAGCGGCGACTAGTGGTGGTACTGGTGGTAAGGCGGCACCCCGATCGGTGGGTACCACTCCAGCTCAAACACCCAAACCAGGACATCGCGCGACAGCAGCGAGCACGGTAAATAGTGTTTCTAGTCCCGCTACTATTACGTGTGAGCGTGTGCAAGCTTCTTTGGATGGCTTTCCGCCGCACGCTACTAACCACTACCAGCAACAACAGCAGGAACAGCCGCAGCTGCGACCGTTAGCTCCCTGTTCATCAGCAAGCTTGTACGCTGAGCTCCGTTCCGTTAATCCAGAGATCGATGATGAGCAATCCTTTCCATACCCCGAAAACCGCATTTCAAACGTTTACGTAGACATGGAAGCGTATCTTGGGATGCGGGAGCTCAGCCCCGATGAGAACAGCAGCGAACATGCATGTGCATCGTACACTAATATCAACAGCGACCATCTTCCTTCCCTCCGCCATGAACAAAGTTCAACCGCACACAACTCGCAAAGCAGTCCAATGGGCGATCTCCCTAATTCACGCACCCCCATGCTAGGGGACGATGATGGCGAAAGGCGAAAGTATCGTCGACTACGAACCATGGGCGATCGTATCGATGATGAGGATGATGATGCCGATACTGCTGAGGAGTTGAACGATTCGAAAAACAATTTACTACGCGAAGAGAGCTACGATGGTGGGGATCAACTAGATGAAGGGCCGACGGAATCGGAAACAAAGTATCTGACGATGAGGAAACGTTCATCGCCCCGCGCTGATACGACGACCCGCTGGAAGTCCTCCATCGAGCAGCACCTGGATGTGATAGATGCGCTGAACATCAAGCTGGACGAACATCAACGCCTCTCGGCCCGCCTTTCTGAGGATTACGAATACATACGGGTGCAGACACTGCGCCGTGAAGCGGAGCTGATAGCAGCAGCAGCAGCGGCAACAGCAGCATCTTCAACATCCTCTACCGCTGTACCGCAGCGTGCAGCAGCAGGAGGGACACCGTTCGAAAAAGCAAATAGCTTCCGCGAGAAGATCAAACGGCGCATCCGAGGAGCAAAGAGCTCGCAACTTAGTGAACCGGTAGAACCGGAAACACCGGATAAGGTGGCGAATGTGGTTGAAAGTTTTTCCGGCCGATTGCGCACACGCATTGCTTCACAGCGGCAGTTTCGGTTGATGAAGGAAACGGACTCGGCCAGTCCTTCCACCGATCGTGGTTCGATCACCACAAATGGCGGCGCCTCTAACTCGGCGGGTGGACGCCAGAAGAAAAAGAAGCGTAAGTCGTCCAAAGCGCACCGTGCCTTCAAGCAGCAGCAGCAGCAGCAGCAGCAACGAAGTGGTCTAAAACGGGATACCGAGAGTGAGCAAGAGGTGTATGACCAACCGCAGCAGCTGCTCCACCCGGCAAATACCTTCTCCGAGGATGAGCTGTTAGTAGACGAGCCACCAAGAGTCGGTTCACCGGAGCAGATGGTTAAACCGAGTGGCCAAAAGTTCTCGCAAACCGTACGCGCCACGTGGCGGGAACTGTTGCACTCGACGAACAAGGTCAAGGATTCGTCAATTAATCTCACCAACCAGCAGCAGCAGCACGATCGTATGGAAGAAAAGTTAGATCTTATCCCCAATCAGGACCGTCCCGGGTTGCTAGCAATACGGTTTACCTTTTCGGACACTGAGACACCCGAACATCACGGAAGCCGCCAGCTCGATGCAACATCATCAACAACAGGCGAAGGAGGAGAGTATTGTGTACCATTGCTTTTATCGCAATCGAGTGACGATACGAAGGCTCCTCAAATTCTCTCTTCCGGCGATAGCAGCCACCCGGCTGGTAGTAACAGCACCACCAGCAAGCTGGCTATGAACCTGAAAATCAATCTGAAGGAAAGGCTCACCAAATTGGTACACAAAAGGGCACTGATGATGGGTGGTGGAGGGACAGTGCCAGGTAAAAGCAATCTTCTGCCGCTCCATCAACCATCGGGCGAAATATGTAGGTCCTGCTCCAAACGTATCGTTCGCCCGGGAACCATACACCCGAGCCAGACGGTGTTGGATTTTGTAAAAGAATTTCCTGGCCTCGATATCTGCAACGGTGGCCACGATGAGGACGACGAAAACGACGATTGCGATGGCGACGGTGACAACAAGAAGGCAGACACCGCCCGTCCAGGCCGTGCAACCGAATCGGAAATGATCAATCTCGAGTATGAGGATATCGATGTGATAACGATTAAGTCCCACAAACTAACTGACCATTGTGAGGGTGGTGATGATGATAATGATGATGATGGTATGACGCTGTCCACAAACCGGCCACTGCATGAGGAAGAATGGTTCCACGGTGTGCTGCCGCGGGAAGAGGTGGTGCGGTTGCTAAGAAACGAAGGTGACTTCCTGGTGCGCGAGACGACGCGAAACGATGAAAGCCAAACCGTACTCAGTGTCTGTTGGAACGGTCACAAACACTTTATCGTGCAGACGACGGCGGAAGGCCACTACCGTTTCGAAGGACCGGCATTCCCCAGCATACAGGAGCTGATCGTGCACCAGTACCAGTCGGAGCTGCCGGTGACGGGCCGGTCAGGTGCGGTGCTGCGTAAGCCAGTGTTGCGCGAACGCTGGGAGCTGAGCAACGATGACGTGATACTGCTGGACAAGATTGGCCGGGGCAATTTCGGCGATGTGTACAAGGCGAAGCTGAAATCCTCCAAAAACACGCTGGTCGCGGTGAAAACCTGCCGCATGACGCTACCGGAGGAGCAGAAGCGCAAGTTTCTGCAGGAGGGACGCATCTTGAAGCAGTACGATCATCCCAACATCGTCAAGCTGATCGGTATCTGCGTGCAGAAGCAACCGATCATGATCGTGATGGAGCTGGTGGCCGGCGGATCGTTGCTGATGTTTTTGCGCAAAAATGCAACCACCTTGGGCCAGCGCCAGATGATGGGTATGTGCCGAGATGCGGCCGCCGGGATGCGCTACCTGGAGTCGAAAAACTGCATCCACCGTGATCTCGCGGCTCGAAACTGTTTAATCGGGAGCGAGAACATCGTGAAGATTTCTGACTTTGGAATGTCCAGGGAGGAGGAAGAGTATATCGTATCTGGCGGTATGAAGCAGATTCCAATCAAGTGGACTGCCCCGGAGGCGCTTAACTTTGGAAAGTACACCTCGCTGTGTGACGTCTGGTCGTACGGGATCCTGGTGTGGGAGATCTTTAGCCGTGGCGATACGCCCTACTCAGGAATGAGCAACTCGATGGCTCGCGAGCGAATAGACGAAGGCTACCGGATGCCATCGCCGGAGGGTGCTCCACCGGAGATGTACCGGCTCATGCTCAAGTGCTGGTCGTACGAGCCCGAAAGCCGGCCACACTTTGACGAAATCTATACCGTGGTCGATGCCCTGATTCTATGCACCAAGGACTGACCGGAT
>XM_009229646.1 Gaeumannomyces tritici R3-111a-1 hypothetical protein partial mRNA 
ATGGAATGGAAAACTCAATATCTTGACGACACCGGAGGAAACTCTGAGATGAGGGGGTCGGGCTGCGACATTTACAGCCTGGCCGAGGGTGAGGGAAGAAGAGGGGAGGGGGGGGACGTGACGGGATACCAGAAGCGGCTCGCACCATGCACAGCACCCCGCCGCCGGCCTCGAGGACAGCACAGTCTGACCAGAGTGCCGAAAGCGATTACTGTAGATGGAAATGCAACAGAGGCGGACATGAGACGTGTCGCCGTCGGACAAGAGTTCAGACGAAGTCGCCTCAACATCATGGAGAGCCGACATAAGTATCTGCACGTGAGCATTAGCCATGGGAGGCGCTCCGGCTGA
>XM_014964222.1 PREDICTED: Calidris pugnax CCR4-NOT transcription complex subunit 4 (CNOT4), transcript variant X8, mRNA 
ACCTTCAAGTGCTGACCTTCTTGGTCTATTAAGTTATTATAAACTTTTGCTGCTCTGCGAACATATAAAGATGTCTCGCAGCCCTGATGCTAAGGAAGACCCTGTGGAATGTCCCCTTTGCATGGAGCCTCTGGAAATTGATGACATCAACTTCTTCCCTTGCACCTGTGGCTACCAAATCTGCCGTTTCTGTTGGCATCGTATCCGTACTGATGAGAATGGACTTTGTCCTGCTTGCAGAAAGCCATATCCAGAAGATCCAGCAGTGTACAAACCACTCTCCCAGGAAGAGCTGCAAAGGATAAAAAATGAAAAGAAACAGAAACAAAATGAGAGGAAACAGAAGATATCAGAGAATCGCAAACATTTGGCCAGTGTACGGGTTGTACAGAAGAACCTTGTCTTCGTGGTAGGACTGTCTCAGCGCTTAGCAGATCCAGAGGTTTTGAAACGACCAGAATATTTTGGGAAGTTTGGTAAAATACATAAAGTTGTCATTAATAACAGCACATCATATGCAGGCTCACAGGGTCCAAGTGCCAGTGCATATGTAACCTACATCCGGTCAGAAGATGCTCTTAGAGCCATACAGTGCGTCAATAATGTGGTGGTAGACGGCAGAACACTTAAGGCATCGTTAGGTACAACAAAATACTGCAGTTATTTTCTAAAAAATATGCAGTGTCCAAAACCAGACTGCATGTATCTACATGAACTGGGAGATGAAGCAGCCAGTTTCACAAAAGAAGAAATGCAGGCGGGCAAGCACCAGGAATACGAACAGAAACTACTGCAAGAATTATACAAACTAAACCCCAATTTTCTCCAATTATCTACGGGTACAGTTGACAAGAACAAGAACAAAGTGACAGCACTGCAGAGCCCTATCGACAAACCTTCAGATTCCCTCAGTATAGGAAATGGTGACAGCTCCCAGCAGATAACAAACAGTGACACACCTTCACCACCGCCTGGTTTAACAAAACCCAATCCAGTCATACCCATCAGTTCATCTAATCACAGTGCACGGTCTCCTTTTGAAGGGGCTGTAACAGAATCACAGTCGCTCTTTTCTGACAACTTTCGGCACCCTAACCCCATCCCTAGTGGGCTTCCTCCATTCCCCAGCTCTCCACAGACTTCAAATGACTGGCCCACAGCACCAGAACCACAGAGCCTCTTCACATCAGAAACTATACCAGTATCCTCCTCCACAGACTGGCAAGCGGCTTTTGGGTTTGGTTCCTCCAAACAGCAAGAGGACGACTTAGGGTTTGACCCCTTTGACATCACCCGCAAAGCCTTAGCAGACCTGATTGAGAAGGAACTGTCAGTCCAAGACCAACCTTCCCTCTCGCCCACATCTCTTCAGAACCCTACCCCACACACTACAGCTGCCAAAGGGCCAGGCTCTGGATTCCTGCATCCTGCTGCACCCGCAAATGCCAACTCTCTCAGTAGCACCTTTCCAGTCATGCCACAGAGGTTCCCACAGTTTCAACAACATCGAGCAGTTTACAACTCCTTCAGTTTTCCAGGCCAAGCAGCTCGCTATCCTTGGATGGCCTTCCCACGCAATAGCATCATGCACTTGAACCACACAGCAAATCCCACCTCAAATAGTAATTTCTTGGACTTGAATCTTCCACCACAACACAGCACAGGTCTTGGAGGGATCCCTATATCAGGTATCCCAGCCTCCACAGGAAACAGTTTAGACACCCTTCAAGATGACAATCCTCCACATTGGCTAAAATCTCTTCAGGCCCTCACAGAGGTGGACGGCCCCAGTGCAGCACCATCACAGACGCACCACAGTAACCCCTTCGGCACACAGATCCCTCTGCACAGAGCCAGTTGGAATCCCTACTCTCCTCCTTCAAACCCCACCAGCTTCCATTCCCCACCCCCAGGCTTTCAGACAGCCTTCAGACCCCCCAGTAAAACCCCCACAGATCTACTACAGAGCTCAGCGCTGGATCGTCATTAGGAAAGGAGGAAAAAGAAGAGGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGAAAAAAAAGAAAAAGAAAACCCAAAACGTTAGAAATGCAGGAAGTGTCCCACCCTGACTCCTCCCCATGCCCACCTACTGTTCCCTGTCATATCTTTCTTTCTGAAGAATCCAGTTCCTGATCAAACCTCCCCCCCAAATGCAATGCCATCACAGGGTCGTGACCGTATCTTTTTGTTAAGTTTCTGCTGAGCCAGTGTTTGAAATACACTGTTTGAAATATTTTCTAACCGTTCTAAGGAAAAAAAAAAAGAGAGAGAGAAATCAAAATGCAGTCTCAATGCTTAAGGAGAATATTACTGTCTTATGTCTTTTGCACATGAGTATTTCTGCCTAGTGGAAAAGTGTCAATCTGCAGTAGGGGAAAAATTGCAATGCAGAATCAAATGCAGAAACATGAAAAAGGTATTTAATTTAAATGAATTTACTGAACATGTGGGGCAAGCAGTGGCCTAGCATTTATTTTGCATTCAGTGTGGCACTACACAGGGAAATTGCTATGTTTTTTTTTTTTAAGGGGGATTTTGTGTCAGAGTTTGACATGAAGTGTGTTGAAAGACAAAAAACACTTATAGCTACGAGTAAGTGGCATGTTGCTAAAGAGTGATTTAAAGAGGGGAGAATAAGATTTTTCTTTAATTTTGGCTTTAGATTTAAAGTAAACTTTAATGTTTTAAAAGTATTCACAGATTTAATACCTAGCGTATACATAATATAATTATAAGCAGCTGAAACACGAGTGATATTTACTTCAGTCTTTCTGTCTCCTCTGTCAGTCTCTCTTTCTTTTTTTTTAAAAAAACAAAGATTCACCTGATTAGGGCACTCTGGGATAGCACTGCATTGGGGCCACATGATCACCATCAGGAGCAACCTCTGACCTCCTCTGCCTGCAGCTTTTACTTAACCCTGTAGTTTCTGGACGTTTGTGCAGTATTGAAAAGACAGGAAAAAAGAAACAGATAAATAAACATGGTTATAACCTGACTCTAAAACTAAAACCAAGGAAATGTACCTCTTTCTTCAGAATTAAAACTAAAATCTTAAATAAAACAGAAAACTTGATGATGA
>XR_005915111.1 PREDICTED: Gossypium hirsutum xylose isomerase-like (LOC107963207), transcript variant X1, misc_RNA 
ATTTTGCAGGGTTTAGTTTGATACTTTGAGTGATATCAGTAAAGAAGAGTATGGCAAGGAAGATTTCATATATATTTCTTTGTATGAATGTGATCCCCCTTTTAGCGGCTGCTGCATCACAAGCTTGCTCTGCTCAATCTGATGCAAAATGTTCTCAAACCGGTGAATGGAATGGGGAATTTTTCCCTGGAATTCCCAAAATCAAGTATGAGGGTCCTTATACCAAGAATAAATTTGCATATAAATGGTATAATGCAGAAGAGGTGATTCTTGGGAAGAAAATGAAGGACTGGTTGAGATTCAGTGTGGCATTTTGGCATACATTCCGTGGAACTGGTGTTGATCCTTTCGGTGCACCTACGAAATTTTGGCCATGGGAAGATGGTACCAATTCCATTGCTATGGCAAAAAGAAGAATGAGAGCCAACTTTGAATTCATAAACAAGCTTGGTGTTGACAGGTGGTGTTTCCATGACCGGGACATTGCTCCCGAGGGCAAAACACTTCAGGAAACTAATTCAAACTTGGATGAAGTGGTGAAACTTGCTAAAACACTTCAGGGAAACAATATCCGTCCACTGTGGGGTACGGCTCAACTATTTATGCATCCTCGTTACATGCATGGTGCTGCTACAAGCTCTGAATTGGGTGTATATGTATATGCTGCAGCTCAAGTCAAGAAAGCCATGGAGGTGACACACTATCTAGGGGGAGAAAACTATGTGTTTTGGGGTGGTCGTGAAGGTTATCAAACACTATTGAACACAGACATGGAATTTGAACTTGATCATATGGCAAAATTTCTTGAAGCTGCGGCTGCCTACAAGAGGAAGATTGGATTCACCGGAACTCTACTGATTGAACCTAAGCCTCAAGAACCTACAAAACATCAATATGATTGGGATGCTGCAACAACAACTAATTTCTTGCGAAAATATGGGTTGATCGGGGATTTCAAACTTAACATTGAGTGCAACCATGCCACACTCTCTGGTCACAGTTGCCATCATGATGTTGAGACTGCAAGAATCAATGGATTGCTAGGAAATATTGATGCAAACTCTGGCGATGCTCAGACAGGTTGGGATACAGATCAGTTCTTGACAGATACTCGAGAGGCAACTATGATCATGCTAAGTGTGATTAAAAATGGACACTGAGCTTCTTATCGTTTGACCCAACAGACCTTTGGTGTTCGATGAGAATTTATTTATCATATTTGGTTCACTTTTGTTTATGACAGGGATGCAAAATTACGGAGAGAGAGCACAGATGTTGAGGACTTGTTCATTGCTCATATTGTTGGTGTTGACACCATTTTTTTTGATGAAAAACGGTGGCGACTTCCGTTTTTTTCGAAATCATTTATTAAAAACAACCACTTTTGGAGGTGATCCGATCACACCTCATCAAAAAGGATCGGTGGCGACTCCCGTTTTCGTTTTCATTTTTCAAAACCCAAGTTGATCCCGTTTTTCATCCAAAAAAAATGGTATCAACAGTTGGAATGGACACCTTAGCCCGTGGACTCCGATATGCTGCCAAGTTGATTCAGGTAATACCAATACGAACATAAAACAAATACATATATGTAAAATACTTTAAACATGATTATGACACGATAAATTACATGAATACGATATAGATACATGATATTAATGAACTTGATGATTATATAGGATGGTTCTTTGGCTAAGCTTAGTCATAAACGATATTCAAGCTTCTATAATGAACTCGGTGCCCTCATTGAGGCTGGTAAAGCTGATTTTGAAATGCTTGAGAAGAAAGCAATGGAATGGGGCGAACCTACGGTTGCTTCAGCCAAGCAGGAACTTGCGGAAATGATCTTCAACTCTGTGCTATAAGAGGGACCTTGGCTAGCAATGTCTTTTGCAATTTAGCATTAGGAGTAATTGATGATGTTCAATAAGTACAGTTTATGTAATTTTCATTTTTTTTTTTAGAAATCTTTTGTACCTAAATTTCACTCTCTCTTTTTTAATTTGGTATTTAATTTTTTTATGTCCAATTTGGTAGA
>XM_033267273.1 PREDICTED: Anneissia japonica uncharacterized LOC117121888 (LOC117121888), transcript variant X1, mRNA 
CAGGCGCTGACATTGTTATTAACAAACCTACTTGGTACTTTGTAGATTTTTTATTTATTTGTGCTCGGAAAATTACGAGAACCTGGGATGCAATTTTTTTGTTATGACCCACCCTTTCTACTGAAAATGAATTCCCTAAGATTATTTTACACCATCATTATGTTTGTGGCAGTCAAAGAAGTAGAGTGTGAGGTGAAAACAATATATTTTTGTCCTGAACAGAGTGCAACAATATATTGCAATGTTACCAGTGATTTCACCAAATTATATTGGAAAAACTCTACAGATTATGTTGTAGCATCACAGACTGTTAATAATTGCAAAATTACCAAAAAAAGTCCAAATAAAACATACTCCTCATCTGACCGATTTGAAGTCCAAGGATTATCATTGAAAATAGCATTTCCAAAGGATGGTGAACAATTCTATTGTGATGTTGTATCGAGGAAAAAAGAAATAAAACAGCATTTTACTCTAGACGAGTACAGTGAACCTTATCCTGATGATGTGTGCAGTTCACCAAAAGACACTAACAAAACAAAAAGCAGGCAGTTAAGAAGCGGTGGAACCAACAAAATTACCCGGGAAATCAATGAAACAAACTTTGTATGCATAAATGGAAGAACTGTTTTAAAATGTGATAACGGGCAACACGATAGGCCTATCGCAGAGTACTGGGAAGATAGATATGGCAAATTGATTGTGTCTAATGTGGATGGGAGACTATCAAATACGTCCGATGCCAGATATGTATTTAACCATATGAATTCCACATTGTTAGTCCAAAATCTATCAGAATGGGATCATCTATTTGTTTGCAAAACTGTCTACAAAAATGAAGATATCATAAAATGTTTCAATTTACAGGAATATGGTACACCAAAAGACAGCTTTTTTGAGGGATTTGAAAACAATAAATGTGAAGTAGATGCAAATGAAAATGGCCAGGTCATTGTACCATTCACGGTGGCTTGTTTCAGTCCAGTGAATGCAGTAACTGTAGTTTGTGAACTGAATGGAGAGTGTAATGATACAAACCCGCAGTATAATGTAACCGATGACGGGAAATTTAATTCACAAATTTGTATAGATAGGAAAATCGAAGTGAATAAAAATTTGACATGCACATTGACTGGTCCTGCTATGTGTAACCATTCTCAAGAATTTGTTTGTCACTTCAAGTTCAAGGAAAACAGTTCAAGCAGTATCAGAAATTTAGTTATTGCTATTTTGTGTCCTATTGTGGGTCTTCTTGTGATTGTATTTGTGTACTTACGTTGTTGTCAAAAAGAGGAAGAGGAACATAGCAAATCACAAGTTAAGATGCCATCTGAGATTCCCCCCATCCAATACATCACAAGCTCCGACCAAGTAACAATAACTGCACCTCAGGAGGTCACTTAATTGAGGCATGTCGTGGTGAAATGGTTAAGTTGTCGCACAGACCAGTACTGAGTAAATGAGCTATAAAAAATGGGAGCTCAAAAAATTTCCTGAAAATCCAAATTTGTTTTCCACTATTATGGATCAACAGTTTAATGTCTTATTAATCATGTCCCAAAGTATTAGTTCTGGAAAAGTTCATCAAATTGTTTATTTAACGTTATTTTGATATTTAATTGTATTTAACAATGCACAAATAACTTCAGAAGGCAATACTGTACTCAAAATTATGTTTATCTTGGCTATAAGAGTGCTGTACATTCACTTACCAATAACTTGGGCTTGAAATTTCCAATTTTAATGAATGACCCCCCGTTTTAAAGATTCCTCTTTTGTCTTTCATCTTTTGTGATCTGTTGGGCTTTGTCCCCTCCCTTGTCGTTATTTTAAGGACGTGACCCTAGAGAGTTTCATTTATATTTTCCTTTTATTATTTTTGTAACATGTTCTTGTTGGTTCTGAATAAAACTGATTATATATATATACTCAGGTATCTTAAAATATGGATATTTTAGAGGAGTCTTGAATTGGTGGGTGCATTGTACTATCTTCACTCCTTTAATCCCGACATGTCTTCAACATGGGGATTTCTAATTGTCAACATGGTCTTGTCAAATTGATCCTGCATAACTTCTCCTTGGCTGTGTTCTCCACCACAGGACACAGAATCTTGATGAGAGGGAACCAGCTCCTCATATTGATGTCATTTTCATTGATTGGAGAGGTGTATTTTATCTAATTTGATATGCTTCTTTCTAAAATGTGCAATTCAATGCTATTAACTTTTCGTTTTATATTTAATCTAACTTTTAGTAGATTTTTAACTGTTAACTTAATTCAATCTTATATATATTTTATCTACACTTTTTAATGTTTTAAAACCATTAAAAAGTAATCGTTTAATGTGCAATGTATAAATGCCAAGGTCAACTTTTTAATTATGATGCAATATATTATTACTATTACTAAAACTCTATACGGCTATGTTTGCTCTATGCTCTATGTTATAATGTAACAATACCTTAGAATAACTCTGTACAATATTTATATTCTTCTAACTTTTATGAGCTTTGTCAGTTGTGGAGACTGCATACACTTTTTAATGTTACATATTCTTCATCAATACCTCCACACCAAAGTTCATCGTCGTAATTTTGTTACCGTCAATCCCGCGTTTCCGATCTCTGTATTTGTTATGATATCACTAAGATTGATATAATCAAATTTTCTCCATTTCTATCATATTGATAGTGGACTAGAATTACTGTTGTTGGTTTTACTAACATGTTTAAGGGCAAATTTAGACAACACTGGGTTGAAATTTTTCATATTTAGTGTTATTATTGTACTTTGTATACTAGGCTCCTAAGCCTCAACTAGTGGAGTAAATATGCTCAAACAAACTGACACCATTCAAATAATTTAATTCTCGAACTCTAAATAATATGGTAATAAAGAGGGCTTAATTCCCACGTTTGCCATCATTACTATGTTTGCCATTCATCACTACAACTGAAATCAACAATAAATTCACCACAAATAGATGAGATAGTAAAAAATGATTATGTCTGATTCTATTTAATTTGTTATTAATAATAAGCCTGAAAAAATGAAAAGAGAGAAAGTATATATTGTAGTTTAAAATGTCAACTGTTCATAGTAGGGCCTATCAAATAGGGCCTAGGCTTAAATTAAATGACCAATCAGAACGTGTTATTTTTTTTTTCTTGTATTGCATTTTACGAGAAGTACCAATACTGAGTATGATGGTATGGCTACATGATGAATATGTAACATTAAAAAGTGTATGCAGTCTCCACAACCAAGTTCGTCATCGTAATTTTTGTTACCGTCAATCCCACGTTTCCAATCTTTGTATTTGTTATAATATCACTACGATAGAAATAATCAAATTTTCTCCATTTCTATCATATTTACAGTGGACTAGAATTACTGTCGTTGGTTTTACTAACATGTTTA
>XM_004993437.1 Salpingoeca rosetta uncharacterized protein (PTSG_12341), partial mRNA 
ATGTCGCGGTTTGTGGTGGCGCTGCGGCCGTGTGGACAGCTGCGTGAGCGGCTCACAGAGCCCTTGGAGCTGAGTGCTGGAGTGCACATCCTGGGGCGAAGCCCACAAACCAAAGTGAAGCAGCAGTTGTGCAGCCGACGCCAGATTGAGCTGGATGTCGACACCGCCCGCGGCACCGTCACCCTCAAGCAGCAGCTTGGCCCAAACGCATGCTCTGTGAATGGACAAACCATCAGCCGAGGGAACAGTGTGGCGGTTTCGCGAGGCGCCCGCATCTCCATGTTGGCAGACAGTCCAGACGAGACCACGTTCACCCTGGACATCCACGAGTACGCGCCCTGTGGCATGACAACGCCCGAATCAACGCCGCTAACCCAGTTTGACACGTCAGCGTCCAGCACCGCGTCTTCTGTACGACCTGACGCGACTAGTTTTGACACAAAGCCAAGCGCACATGCCCCAGCCATCACCATCAATCTCACAAGCAACACTGGCGCCGCCACAATCACCATCACCAACAATATCACTGCTGCAGACGATGCTGATTCATCGCGCTTGACGACACCAGGCGGTGACGCCGTTACTGAAGAAGACACTGGACAGCCCAAGCAGCGCAGCGACAAGCAGCAGCGACGTGTCACCAGCGAGTGTGTGGACCACTGGGCAAATGCGCTGACGGAGTTGGTGCGTCACCCGGAGCGCCATGCTGATGACATTGTCTACGAGACCGTCGACACGCTCGTCATCAACGACAAGTACCCAAAGGCGCGGTACCACTTTCTTGTGCTGCCCAAACGCGTGATCACGGATCTGACGTGCCTCACCCGACATGACCGCCACCTCATCCAGAGACTGCAGGAGACAGCCATGACCTTTGGCAAGATGATTCAGGAGGACAAGCCAGGCGTCAAGTTTCATACGGGGTTTCACGCCGTTCCCAGCATGAATCAAGTGCACCTTCACTTGATTTCGCAGGATTTCGACTCTGTGTCCCTCAAGAACAAGAAGCACTGGAACTCGTTCAACACGCCGTATTTCGTTCCTGCTCGCAAGGTGTATGAGATGCTGAAGAATGAGGGCCGAATCCACTTTGATGAAGCAAAGTACAAGGAGTATTTGAAGAAGCCGCTGGTGTGCCACCGGTGTCGCCAGGAGATGCGCAACATGCCCACCCTCAAGCGGCACCTTAAGGAGCACCTCACCAACCCCTAG
>XM_046397594.1 PREDICTED: Scatophagus argus UbiA prenyltransferase domain containing 1 (ubiad1), transcript variant X2, mRNA 
TGCACGATGTTGCACTTCTGGAAGAGGAAATGGCGCCCGTCAGGTGCAGCAGGATTTACAGTGGCCAACCAGTCAAGTCCCCTCGTAGTTGACACGTAAGCCACCTAACTGCCTCTCGCTGCATCAGGCTCATCGGACACAGAAGTATGATTTTAAGTAGTGAGAAACCCAGTTTGTGTCGGATGGTGAAGACGTAACGGAGCGCTGCTGGTACTGCAGACCCCTTGCATCGGAATGGCCAAAGAGCAGAAACAAAGCAGGGCAGAAACATTTGTGCTGGCTGGATCTAATGGTCACAATGGCCAGCAGTGGCAGACTGGTATGAATAACTTGGTCACTCACTCTCCTGGCACTAACCACAAGTCGAGGATGGCTCGCGTTGCCTCGGACATGAGGCAAAAGTGTGCGGCCTATGTGCTAGCACTGAGACCGTGGAGCTTCAGTACCTCGCTGACGCCGGTGGCCCTTGGCAGCGCTTTGGCATACAAACTGGATGGCTCTGTGGACTTGGTCATCCTGATGGTGTGCGCTGTGGCTGTTCTTGTTGTCCATGGGGCAGGAAACCTTGTAAACACGTACTATGACTTCTCCAAAGGGATAGACCACAAGAAGAGTGACGATAGGACTCTTGTGGATGAAATCTTGGCACCGCAGGATGTTGTTATGTTCGGAGCATTGTTATATTCTTTAGGCTGCTTGTGTGCCACTCTGCTCTACTTCCTGTCAACACTTAGACTGGAACACCTAGCCCTTATTTACTTTGGGGGACTCTCCAGCTCTTTTTTATACACTGGAGGCATCGGCCTCAAGTATGTGGCCCTAGGAGACTTGGTAATCCTCATTACCTTCGGTCCTCTGGCAGTCATGTTTGCCCACGCTGTGCAGGTTGGCTACCTGTCAGTGCTGCCGCTGGTCTATGCCGTCCCACTGGCCCTCAACACGGAAGCCATCCTCCATAGCAACAACACCAGAGACATGGACTCTGACAAGCAGGCAGGGATTGTCACCCTGGCCATCCTCATAGGCCCCACACTGTCCTACGTCCTCTATAACCTCCTGCTTTTCGTCCCCTACGTGCTCTTCTGCATCCTCGCCACACGTTACACCATCAGCATGGCGCTCCCTCTGCTCACGCTGCCCATGGCCTTCCCACTGGAGAAGCAGTTCCGCAGCCGACGCTATGCCAAGATACCCCAAAAGACGGCCAAGCTCAACCTCCTTATGGGACTTTTCTACGTGTTTGGGATCATTCTGGCACCTCCTGGCAGCTTGCCGTTACTGTGATTAATTAGCTTTGATATTTCAAATTTTGTTGTTTTAATACAGACTAGTTTATGCACCTCTTTGTATTTGTACAACGCTGAGGGCTTTTCAAAGGCTTTAATTTATTGTCTAATTTATACATTGAACAGAGATCTAGTTTAGGTCCTGCTCTGTCACACTGAAGGCATAATCAGATGTATTTTTTCAGTATTAAGCCTGCTGTAATGTGTTGGTGCAAGTAAGAAGTGTTGGTGTCATTTTGTAGAGGTAGGCAGCATTTTTATCATACAAGGACAGACAGTAAACCTACAGTTGCCATATTTGCTGTTCTTAAAAACACAATACTACAATGT
>XM_045050371.1 PREDICTED: Felis catus zinc finger protein X-linked (ZFX), transcript variant X5, mRNA 
CTCGGGTTGTTCCGCTTCCAACTACCACATTCAGAGTTGGCTATCAAGTGGACGGATTGCTAGACTCTTACGTTGATATTCACACTTACGTATCTTTTTGTCCTGTATCTTTTTGGCCTCCATTGGTTAAGGGGAGCACATTCTTATTCCCTTCGTTAAAAACCTGGTTCCCTCATAACCAACACTCCTATTCTTGTCTTTGACAGCAGCGGTCTCAAAACGTCAGTGTCCTCTTCAGTTAATCTCTTGCCCATTTCCAGCACTGAGTCCTATTATTTCTCCCTTGCTTACATCTCTTCCTTCTACTTTCTGCCACATGGACAGGCTCCGTCATCTCATTCTTAGTTTGCGGTAACTTTTATTTTCCTTACCCTTAGTCTCTTTTGTCTAGCCCAGCAGTTAAAACACTCATCATAAGATAACATGTGGATTGTGTCATTTCTCCATTTTCCGTTCATGACCCAGCAGTTTTTCAGAACACTTCCCATACATTCCCATTTGATCATCACAACAGTCCTGTGAGGAGCTGATGCTACACACATGGATGGTGATCAAATTGTTGTGGAAGTACAAGAGACTGTTTTTGTTTCAGATGTTGTGGATTCAGACATAACTGTGCATAACTTTGTTCCTGATGACCCAGACTCTGTTGTTATCCAAGATGTTATTGAGGATGTTGTTATAGAAGATGTTCACTGCCCCGATATCATGGAAGAAGCAGATGTATCTGAAACGGTCATCATTCCAGAGCAAGTGCTGGACTCAGATGTAACCGAAGAAGTTTCTTTAGCACATTGCACGGTCCCAGATGATGTTTTGGCTTCCGACATTACTTCAGCCTCAATGTCTATGCCAGAACATGTCTTGACGAGTGAATCCATACATGTGTCTGATGTTGGACATGTTGAACATGTCGTTCATGACAGTGTAGTAGAAGCAGAAATTGTCACCGATCCTCTGACAACGGATGTCGTTTCAGAAGAAGTACTGGTAGCAGATTGTGGCTCTGAAGCAGTCATAGATGCCAATGGGATCCCTGTGGACCAGCAAGATGATGACAAAAGCAACTGTGAGGACTACCTTATGATTTCCTTGGATGATGCTGGCAAAATAGAACACGATGGTTCCTCTGGAATGACCATGGATGCAGAGTCGGAAATCGATCCTTGTAAAGTGGATGGCACTTGCCCTGAAGTCATCAAGGTGTACATTTTTAAAGCCGACCCTGGAGAGGATGACTTAGGTGGCACCGTAGACATTGTGGAGAGTGAACCTGAGAATGACCACGGAGTTGAATTACTTGATCAGAATAGCAGTATTCGTGTGCCAAGGGAAAAGATGGTTTATATGACTGTCAACGACTCTCAGCAAGAAGACGAAGATTTAAATGTTGCTGAAATCGCTGATGAAGTTTATATGGAGGTGATCGTGGGAGAGGAGGACGCTGCTGCCGCGGCGGCCGCCGCCGTGCACGAGCAGCAGATGGACGACAACGAAATCAAGACCTTCATGCCAATAGCGTGGGCGGCAGCTTACGGTAATAATTCTGATGGAATTGAAACCCGGAATGGCACTGCAAGTGCCCTCTTGCACATAGATGAGTCTGCTGGGCTCGGCAGACTGGCTAAACAAAAACCAAAGAAAAGGAGAAGACCTGATTCCAGGCAGTACCAAACAGCAATAATTATTGGCCCTGATGGACATCCCTTGACTGTCTATCCCTGCATGATTTGTGGGAAAAAATTTAAGTCCAGAGGTTTTTTGAAAAGGCACATGAAAAACCATCCCGAACACCTTACCAAGAAGAAGTACCGCTGTACTGACTGTGATTACACTACCAACAAGAAGATAAGTTTACACAACCACCTGGAGAGCCACAAGCTGACCAGCAAGGCCGAGAAGGCCATCGAATGCGATGAGTGTGGGAAGCATTTCTCTCACGCTGGGGCTTTGTTTACTCACAAAATGGTGCATAAGGAGAAAGGAGCCAACAAAATGCACAAGTGTAAATTCTGTGAATACGAGACAGCTGAACAAGGCTTATTGAATCGCCACCTTTTGGCGGTCCACAGCAAGAACTTTCCTCATATTTGTGTGGAGTGCGGTAAAGGTTTTCGTCACCCGTCAGAGCTCAAGAAGCACATGCGAATCCATACTGGGGAGAAGCCGTACCAGTGCCAGTACTGCGAGTATAGGTCTGCAGACTCTTCTAACTTGAAAACGCATGTAAAAACTAAGCATAGTAAAGAGATGCCATTCAAGTGTGACATCTGTCTTCTGACTTTCTCAGATACCAAAGAGGTGCAGCAACATGCTCTTATCCACCAAGAAAGCAAAACACACCAGTGTTTGCACTGTGACCACAAGAGTTCGAACTCGAGCGACTTGAAACGACACATAATTTCAGTCCATACGAAGGACTACCCCCACAAGTGTGACATGTGTGATAAAGGCTTTCACAGGCCTTCTGAACTCAAGAAACACGTGGCTGCCCACAAGGGTAAAAAAATGCACCAGTGTAGACATTGTGACTTTAAGATTGCAGATCCGTTTGTTCTAAGTCGCCATATTCTCTCAGTTCACACAAAAGATCTTCCGTTTCGGTGTAAGAGATGTAGAAAGGGATTTAGGCAACAGAACGAGCTTAAAAAGCATATGAAGACACACAGTGGCAGGAAAGTGTACCAGTGTGAGTACTGTGAGTATAGCACTACAGACGCCTCGGGCTTTAAACGGCACGTTATCTCCATTCATACGAAAGACTATCCTCACCGTTGTGAGTACTGCAAGAAGGGGTTCCGACGACCTTCAGAAAAGAACCAGCACATAATGCGACATCATAAGGAGGTTGGCCTGCCCTGATAGTCCTTCTACAGACATTTATGGAGATGTTGGCCTTGAAGCAGAAATCTCATTTTAAAGCCAGTCAGTCTCGTTCACATACAATACTGTATATTGATTTATGCTGTGTACAAATAGAATTATTGCTTCTAGTTGAGTTTTGTTGTTTTTTTTTTTTTTTTTTTTTTTTACATTTTGTTTAATAGTGTGTTCTGAATTCTATTCAGTTTGTTTAATAAATGGGGGAAAGCAGCAACAAATAAGTTGCTTTTAATAAAGTAATCCTTGATGCTATACTGGATTTTTCTATCTTACAAGTTTTATATTTATTTAAATATTTACCTTGCTTACCTTGATGGTACTCTTCTAAGACCATTTAACTTAAAGTTAAGGTAACTTTAGATTGGTAACTCTGAAAGTATTCGTGTTGACTCATTTTTTTTTTTTTTTTCCCCATGAATTTCTCACAATAAAATTGTCAGAGACATCTACTAACATAAACGGGAGATTTTACAGTCAGGTCTAATTATCCTAACATGGAAGTCCTTGACTTGTCTTGCTTGCTCTTCTCAGACCACATGACAGTGAAAGTTTCCATTTGAGCTTTTGCCACCCGGGCATCGCTGAGGAAAGAACAGTGGCTGGGTTCGTCTTTACTTTTCATTTCGTTGAGCAGACAAGCTGTACTTTTTGCAGGGAGGGGGGGGTGGGGGGGGGGCTTTCTTTGGTGTATTTACATCTTTTGTCAGCATAGCAGACTTCTAGAAAACTTCCTTGACAAATTTTGCTTGGTCATGTTGTATTTTGATTATTCCGTCTGTGCTGCTTTGTCTCGGAATGGTTGTGTGTTACAAATGAGATTATCGAGGACTGCATTTTGGAATCTCCTTGAGGTAATTCGTGGCTCGTAGGATCTTTTGCGACTTTATATATGTAAATGTACCCTGAATTATATATATGCACATATATAGAGAACATGTATCTGTGTGTATTGTTTATTTTACATATTTATACACACAACCCCAGTAGTAGTTGTTTAAGATCTATAATGAAAAGTATTAAATTTACAATAACACGAAAGATGCAGGGATGCATGAGAGAGCATTTTGTAAATCATGCTCTTCAGAGAGACTACTCAGGTGAAGAATTAGAAGGAAAATAAGGACACTAGTATTTTTAAAGAGTTAAAGGTATTTTCTTTTAAATATCTTTGGTAATTGAAAAATAGACGTTACGATGTTTCTAGATAGAATGTTTTCATACAACTTCAGCTCCATGCCTTTATATTTTTCTGAAAAGCTAATGAGCATCCAGGCAGAACTCCCTCCGTTCTCTCAGAGAAACTCTTGAGGGAACTCTGTGTCTGTCACCCAGTGAAGGGGGATTAAGGAAGCCACAGCTCCGTGTCCCAGAGATTGGGTGCTAATGATGACTTCCGCTTGGCAGGTCCAGCCTGCTCTGTTATGTCTTAGTTACAGTTAGCAAACTTTAAAAACCTGAACACCCAAATTGGCTTTGGTTAGAAGATAAAGGTGTGTTTAAGTGCATGAGGAAAATCTGAGGCCTTATTTGGAACATCCCCAAGTCTTTCACGGTTTCGTTTTTCTTTGAGAGTTGGTATTTTTTAAACAGTTCTGAATCAGTTCAGAAACGCATACACTGAAGTCAGTTACTTAGAATTGGATCATGCGAAGATGGGTCTTGGAAAATGGAAAACAGTTTTTGGGGTCCTTTAGATGGGATGTCAGCATGTGAGTATCCGGCACGTTGTAGGAGATTTAGTAAGGACTTTTCTTCCCACCTGATAGCTGCCTTGCCACTTCATGATGGTGCTCCTTCCCCTTTGTGCTGTTCGGGTTTAACCTTTCATCTTTCTCTTTGCCATTGATACTTGTATTCAAGAATTCTATTTATAGGGTTAGAAATCTAAATATTTGGTGTTTGGCAAGCCTCTGAAGTGCTAGATTGATTTCATCCACTTGGAAATCAAGTGCTTTAGGCTGGTATGAACTCCAGCCTGAATGCCAGTTAAAGCCAAGGCATGGGCCTATCCCAGCGGGAGCTCCTGTGCTCTCTTGGCCCCATAAACATTCTTTTTTTTTTTTTTTTTTTTTTTTTAAGCGTAACTTACAATTGTGTGATTCATTGCCCTGCAGTACTATTCTTGAAAGCTCTGTCTGTTTTTTTGTGAGAACCTTTAAAATCTCCCTTAATTTCTTTTTCCCAGAAGTCATGTAAAAGAAAACACTTAAGTGAAAGTGGAAAGTTATTAACTTTAAAACATGCTGTAAAATTAGTACAGAAAATATAAAGAATTGGTCATTTAACTATATTTTTTTAAATAAACTGAAAGATAAAGAACACAACACTGTACACACTTTATATTTCTCTTACATAGTCTGGAATCATACACAGCTATTTTCTTTTTAAAGCACAATATTGAAACCTTTAAAAGGTATTTAAGGGTTTGGTCAAGTGAATATGATAAGATGTATTTGTCTGTATAAAGAGAAAATGAACTTGTAGTCACTGTTATGTACTGACATTAGTTACAACCTAGTTTTAATTCTTAAAACAATTTTGATTAGCAAAGCTAAAAAAAATGGATGTTTCAGTTAAATGTTTTAAAGAGGTACAGATTTTTACAAGGACATAATATAAGTTATTGTTCTGTAGAAATATCCTATTAAATATTGTATGTCCCTCCCTCTGTACACTTTGTAAAAAAAGTAAAATACATAAAAAGAAAATCATATAGGGATGTGTGACATTATTGTAATTGTGTACTTGAGAATAACGTGCAAAAATAAAAATCAGAATATTTTCCTGTTAATGGATGTTTAGTCTATTTGATACCAGTACTAAGTTAATGCTTTTTCTTAAGGAAAAAAATGTACAGTTTTTGTAAACCTAATAAACATCAAAAGCAGTGGATTA
>XM_008507523.1 PREDICTED: Equus przewalskii developmentally-regulated GTP-binding protein 1-like (LOC103540855), partial mRNA 
ATGAAAGATGAAGAGTCATGGACTCTGACAGGCATGACATGGAGAACGGCCCAAGGTGTGGTCCCACCAAGCACTAGGGGTCTTCAGGTCCCCTCCCCGAGAAGCCTGATGACCTACCTCAAGGGCATGACTGGACCTGGCCACCAATCTAGGGCAGGGTGGGGAGACAGAAGCTGTTCTGTCCACCTAAGCTCCTCTCAGCCCACCCTTCGTGGCCCCCAGCTCTGTCAGCTGCACCCTGGCAATCGGATAAAACTGGCTTCCCTCCAGGATGGGGACGGAGGGTGGTTGGCTGAGAGGGAGAGGACTACTCCGCTCTGTCTCTTGCGAGGAGTAGGACGTACGCACCTGCGCACTGCAGTAGCGCCTGGTGGTCGTTGGCCGGTCCACTGGTGGGTGAGCCTCCAGGGACTCACCGCTGTCAGCAGCACCTTAGCCAAGATCCTGAAGATCGAAGCCAAGATGGCTCGGACTCAAAAGAACAAAGCCACAGCACATTACCTCGGGNCGGTTAAGGCTAGCTTTGCTAAGCTTGGCAGAGAACTCATTACTCCAAAAGGTGGTTGTGGTGGTGGGCCAGGAGAGGGTTTTGATATGGCCAAGACAGGTGACACTAGAACTGGGTTTGTGGCTTTTCCATTTATGGGGAAGGCAACACTGTTCAGTAAGCTGGCAAGGGTATATTCCGAGATGGCAGCCTATGAGTTCACTACTCTGACATCTGTGCCTGGCATCATCAGATACAAAGGTGCCAAGATCCAACTCCTGGATCTCCCAGGTACCGTAAAGGGTGCCAAGGATGGGAAAGGTAGAGGCCATCAAGTCATTACAGTGCTGCAAACGTATAACTTGATCCTGATTGTTTTGGATGTCCTGAAACCCTTGAGACATAAAAAAGTAATTGAAAATGAGTTGGAAGTCTTCGGCATTTGCTTGAACAGCAAACTCCCTAACACTGGCTTTAAGAAGAAAGATAAGGGAGGGGCTGGCCCCGGAGGCATTTATCTCATGGCCACTTGCCCTCAGAGTGAGGTGGATGCTGAAACCGTGAGGAGCATTCTGACTGAATACAAAATTCATAATGCTGATGTCACTCTGCTTAGCAATGCCACAGCGGATGACTTCACTGATGTGGTAGGAAGAAGCAGAGTTTATATCCCCTGTATCTATGTGTTAAATAAGATTGATGAGATTTCCGTTAAGGAATTGGATATCATTTATAAGGTGCCTCACTGTGTAGCCATCTCTGCCCATCACTGCTGGAATTTTGATGACTTGTTGGAAAAGATCTGGGCCTATCTGAAACTAGTGAGGATTTACATTAGACCCAAAGGCCAGCTGCCAGATCACAGATCCCCAGTGGTGGTGCATTACCCCAGGACCATGGTGGAGGATTTCTGCTTGAAGATTCACAAAAACCTTATCAAAGAGTTTAAATACACTCCAGTCTGGGGGCTTGCTGTGAAACACAATCCTCAAAAAGTGGGTAAAGACCATACGCTGGAGGACGTCATTCAGGTTGTGAAGTGGAACCTTTCCATTTCCCCATCTGCCAGGCCAAGCACAGCAGCTTTCCCGGTGATCACCCTACTCCAATCCCCTTCTGGCTTTGGCAGCCTCTTGATCAAGATTCAGGGGAGGGAGATGGAGACACTCAAAGTGGAACTTCACTTGTATTATCTTGGTGTCATCTTGTATATTGAACTGCATAAAGGACATGACAGGAAAAAAAGAAAAAATAATGACCACATTCGCTTAGTTGCTCTGCGATTCTCCATGACTACACCAACAGTTGGGACTATGAAAATACAGGGCCCACAGCTGATGCTCCATAAGAGAGATCTTGGATACCTGATGCTTCAAGCCCA
>XM_052662140.1 PREDICTED: Budorcas taxicolor EH domain binding protein 1 like 1 (LOC128068878), transcript variant X12, mRNA 
AAACGGCGCGCTCGCCGCTCAGCGCTCCAGCGACCCGACGCGCCCCAGACGACCCCGCCGAGGCGGCCAGATCATCGGCGGGCCCTGCGGCGGCCGCGGCGGAAAGAGCGGCCCCGGATCCCGCGCCTCGGACCCCTCCGCACGGACGGGGCGGGCGGCGCGGATAGGATCCTGGAGGCCATGGGGACCTGGGCCGGGCCAGCGGTCGCGGACTAGCGGGAGTCCCGGGTCTGAGGAGCGGGCGGCGGAGGCGGCGGGGCCATGACCTCAGTGTGGAAGCGCTTGCAGCGCGTGGGCAAGCGGGCCGCCAAATTCCAGTTTGTGGCCTGTTACCACGAGCTGGTGGTGGAGTGCACCAAGAAATGGCAACCGGATAAGCTGGTGGTAGTGTGGACCCGGCGGAACCGACGCATCTGCTCCAAGGCCCATAGCTGGCAGCCGGGCATCCAGAACCCATACCGGGGCACCGTGGTGTGGATGGTACCTGAGAATGTGGACATCTCTGTAACCCTGTACCGGGACCCCCATGTGGATCAGTATGAGGCCAAAGAGTGGACGTTCATCATTGAGAATGAGTCCAAGGGGCAGCGGAAGGTGCTGGCCACGGCCGAGGTGGACCTGGCCCGCCACGCAGGGCCCGTGCCAACCCAGGTCCCGCTGCGGCTGCGGCTGAAGCCCAAGTCAGTGAAGGTGGTACAGGCCGAGCTAAGCCTCACTCTGTCCGGGGTGCTGCTGCGGGAGGGCCGTGCCACGGATGATGACATGCAGAGCCTTGCGAGCCTCATGAGCATGAAACCTAGTGACGTGGGCAACTTGGATGACTTTGCCGAGAGCGACGAGGAGGAGGCCAATGGTCCAGGAGCCCTGGAGGCACGGGCACGTGTCCCCCAGCCAGGCCCAGGCAGTGCCCTGAGGCTGGGGCATTTCCCAGAGACCCCTCGGGAGCTGAAGACACTTTGTGAGGAGGAGGAAGAGGGCCGACTGCGGCCTTGGCAGGCAGCTGCCAGCCCTTCTAGTGCTGAGGATACCAGCCCAGCCCCTGTGAGTGCCCCTGCACCCCCAGCTAGGGCCTCCCGGGGCCAGGGCTCAGAACCAGCTACTGTAGCAGGGGGCCAGGTAGGGCTCAAGGCCCCAAGGCCCCCTGGAACCCTGCCAGAGACAAGGTCCCCAAGACAGCCAGGCCAGGACGTGGCCCCCACTCCAGCCCCTCGGCTCCAGAAAGGCTCTGATGCCCCCTGGCCCCCAGTCCACCAAGGAGAGGATGAGGCCCCCAAAGCCTCCAGGGCTCCCCCAGCAGGAGTGGATTCTGCTGTGGAGACCCAGGCTCGGGCAAGCCCTCAGGAAGGGACAGAGGCCCAGGGAGCTGGGCTGGGCCCAGGCATTGAGAACAGAGACTCCAGCAACTCTTTGGAAGGGCAGAAACCCAAGGTTGAGGAGGGGCCCGCTGGAGACAGGGCAGAGGCTAGTGGGGTGGATACTGGGCATGGGCCAGGAGTCAGAGAGGTGAACAGTCAGAGGTCAGTGGTCAGACCTGGGGAGGTTGAAGAGAGTTTAGAGATCGGTCACGTGGATGCGGAGCAGAGGTCAAAGGTGAAACCTGTGGACACTAAGGGACCAGAGGCCACAGAAGTGACATCTGAGGCAAGATTCAAGGGGACTCCCGAGGCTCCTCCAAGGGGCTCTCAGGGGAGAATAGGGGTCAAGACCAGGGATGAAGCTCCCACAGTCTTGAGCCCAACGCCAGCAGAGCCTGCGGGGCATTCCAGGCATCTTGGTGACCAGGCGGCCAGGGCTGCTGCAGGCCAGGAGAGAGAGTGTGCAGAGGTGAGGGGCAGAGCCCCTGGTGTTGGGGGGACAGGCCTGGAACAGGGGCCCTCTGCTGGAGCACCAAGCGCTGGGCCCCAGGTGAGCTGGTACGAGGGGCCCCCAACAGCAGCTGAACAAGGGGTGATGTCCAGGGATCTGAGGACCTGGGAAGTAGAAACTGGGGATTCGAGGGTCCTGGGGACAGAGCCTGGGGTGGCAGAGTCAGAGTTATCGGGGACCCAGGAGATCTCAGGGTCCCCAGAGATAGTGTCTGAGGCAGCAGAAGCGAAGACCTTGGGGACCCAGGAGACAGAGGCAGTGAGATCGGGGGTCCTGGAGTCAGAGACTGCTGAGATGGCAGAGTCTGAGGATCTAGGGATCCAGAAAACAGGGACAAGCATTTCAGGGGCCTCAGGGACAGAGGGTGGGACGGCAGAGTGTAAGGCACTGGGGATCCAGGAAACAGAGGCTGGGGGCTCAGGAGTTCTGGGGACAGAGACTGGGGTGTCGGAAACTGAGATGTTAGGGACCCAGGAGATATCTGGGTGCTCAGGGATACAGAGAAAGGAAGCTGAGACAGCAGAGTCTGAAATACTTGGGGCCCAGGACACAGAAGTGGGGTGTTCAGGGGTCTCAGAGATAGAATCCAAGATAACAGGGAGCCAGGAGACAGAGGTAGGGAGTTCAGGGGTCCCAGGGACAGAGACTGAGGTAGCAGAAGCTGAGATACTGGAGATCCAGGAGATTGAAGCTGGGGGTTCAGGGCCCCCAGAGATGGACACTGAGACCCTGAGGACCCGGGAGACAGAGGTGGGGGGCTCAGGGGCCCCACAGATGGACACTGAGACCCTGAGGACCCGGGAGACAGAGGTGGGGGGCTCAGGGGCCCCAGAGATGGACACTGAGACCCTGAGGACCCGGGAGACAGAGGTGGGGGGCTCAGGGGCCCCACAGATGGACACTGAGACCCTGAGGACCCGGGAGACAGAGGTGGGGGGCTCAGGGGCCCCACAGATGGACACTGAGACCCTGAGGACCTGGGAGACAGAGGTGAGGAGCTCAGGGTTCTCAGGGTCAGAGGCTGGAATGGCAGAGGGTGAGGGACTAGGGAATCAACAGACAGAAACTACAGTTTTAGAGGCGGAGAAGGGAAAGGCTCGGACTTCCGGGGTCCAGGAGGCAGAGACTGGACTTGGGGAGACCCTCAAGTATGAGGCTTTAGGGGTCCCAGTCGTAAAGCATGAAGTTTCAGAATCCCAGGGAACAGAGGCAGAAACTACAGTTTCAAGGGGCCAGGAGGCGGAGATTGGGATTTGGGGGGTTTCAGAGGCCAAGTCTGGGGTTTGGGGGGCCAAGGAAGCAGAGGTGGAAGTTTCAGGGGCTTCAGAAAACCCATCTGGTATTTTTGAGGCCCAGGAAGCAGAGGCTGGGGTCTCAGGAGCCGAGAAGGGAAAAGAAGCTGAGGGAAACCTCCCAGAGGCCAGCCTGATGGAGGTGCAGGTGGCCAGTGGGGCAGGGGCTGAGGTGTCCAGGCCCTCCGGGGCCTCTTCCCCAGAGGAGCCTGAAGAGGACAGGAGGCTGCCGGGCAGCCAGGCACCACCTGCCCAGGTCAGCTTCAGCCAGTCCCTGTTGGAGTGGTGCCAGGAAGTCACTGCAGGCTACCGCGGTGTGCGCATCACCAACTTCACCACGTCCTGGCGCAATGGTTTGGCCTTCTGTGCCATCCTGCACCGATTCTACCCAGACAAGATAGACTTTGCCTCCCTTGACCCCCTGAACATCAAACAGAACAACAAGCAGGCCTTCGATGGCTTCGCGGCCCTGGGCGTGTCGCGGCTGCTGGAGCCGGCGGACATGGTGCTGCTGTCGGTGCCCGACAAGCTGATCGTCATGACCTACCTGTGCCAGATCCGCGCCTTCTGCACGGGGCAGGAGCTGCAGCTGGTGCAGCTGGAGGGCGGTGGCGGCGCGGGCACGTACCGCGTGGCCAGCGCCCAGCCGAGCCCCCCCGACGACCTGGACACCGGGGGCCTGGCGCAGCGGCTGCGTGAGCACCGGGCCGAGGCGCCCCAGCAGCCCCAGGAGGCCGCGACCCGCGTGGACGCGGCGGCCCCCGAGGCGGCCTCCAAGGACCGCGGGGCCGCAGCCGCCCAGGAGGCGCGCTCCGCCGAGGCCCCGGCCGACGGTCCCGGAGCCCGGGCGTCCGTGCCCCCAGCAGAGGGGCTGGTGAACGGGGTGGGGGCGCCGGGCGCCGCGGGCGGCGTGAGGCTGCGGCGGCCGTCGGTTAACGCGGAGGCCGGGCCGGTGCCCCCGCCCCGCGCGCACGGCTCCTTCTCGCACGTGCGCGACGCAGACCTGTTGAAGAAGAGGCGCTCGCGACTCCGGAACAGCAGCTCCTTCTCCGGGGACGAGCCCGACTCCGGAGCGGCGGGAGCGGCGGCGGAAGGCACGAGCCCTGACCCCAGCCCTGCCCCTGGCCTTCCCGCAGCCTCAGCCCCACAGCAGCCCGCTGGTGGGACTCCTCCGGCGGAAGAACCGCCCCCAAGCCCAGGGGAGGATGCTGGGCTGCAACGGTTCCAGGACACAAGTCAGTACGTGTGCGCGGAGCTTCAGGCCTTGGAACAGGAACAGAGGCAGATAGATGGGCGGGCAGCCGAGGTGGAGAAGCAGCTAAGGACCCTCATGGAGTCAGGTACCGACAGGCTGCAGGAGGAGGTACTGATCCAGGAGTGGTTCACTCTGGTCAACAAGAAGAACGCTCTCATCCGGAGGCAGGACCAGCTGCAGCTGCTCATCGAAGAGCAGGACTTGGAGCGGAGATTTGAGCTGCTGAGCCGGGAGCTACGGGCGATGCTGGCCATTGAAGACTGGCTGAAAACGGCTGCGCAGCAGCGCCGAGAGCAACTCCTGCTGGAGGAGCTGGTGTCGCTGGTGAACCAGAGAGACGAGCTGGTCCGGAACCTGGACCAGAAGGAGCGGACCGCCCTGGAGGAGGATGAGCGCCTGGAGCGCGGCCTGGAGCAGCGGCGCCGCAAGCTGAGCCGGCAGCTGAGCCGGCGTGAACGCTGCGTGCTGAGCTGAGGCCACGCGGGCCCAGAAGCCTTCGCCCCTCCCGGTCCGCAGCCTTTCTCGCCGCCGCGCCGGATCGCCGCTTTGGCCCTGCGCTCGGGAGGACCGGACCCTCCCTGGTGCCGCGCGCGACCAGTAGGGGCCGCCGTGACCCTTTACCGGGAAAGGAAGCGCAGCCTTTCGGGCCCCGACGGACGAGGGCGGCTGGCTGGGCGGCCGCGCCGTCCGGGCCGTATTTATTAGTCCGTGTGAGTGAGTGTGCGTGTGTGTTCGTGGTGGACTGAGGGTCCCAACCGTGCCCACCCAGAGCCCGTACCCAATGGCCGGACCCCGCTGGCGAGCTCCAGGGGTGGGAGGGACGGATGGTGAACTGCCGCGCTCAACACCCCGCCCCCTTCCTGTTCCTAGCGAGCAATAAAGTTGGAAAAGGCCACGCCAACGCGCCTGGGCTTTCTCAGGGTGACCCGGGCTTTCAATAGACGGAAGGGGGTGGGGCCTTGGCCGATACGGCGGTCTGCGATCCTCACGGGGACTGTGCAGGAATGGGGAGGTTTTCAGATGCCAGCCGAGGCAGGACCAGAGGCCTGACCTCTGCCTTTAAAGGATGATGGGGTTTGGGTTGTTGATGGCTGTAGGGAAGTCCCGTTTCGAAAGAAGAGACGAGAACA
>AY338304.1 Uncultured bacterium clone BREC_93 16S ribosomal RNA gene, partial sequence 
TGAGCGGCGGACGGGTGAGTAACGCGTGGGTAACCTGCCTCATACAGGGGAATAACAGTTAGAAATGGCTGCTAATGCCGCATAAGCGCACAGGACCGCATGGTCTGGTGTGAAAAACTGAGGTGGTATGAGATGGGCCCGCGTCTGATTAGGTAGTTGGCGGGGTAACGGCCCACCAAGCCGACGATCAGTAGCCGACCTGAGAGGGTGACCGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGAGGAAACTCTGATGCAGCGACGCCGCGTGAAGGAAGAAGTATCTCGGTATGTAAACTTCTATCAGCAGGGAAGAAAATGACGGTACCTGATTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGACGGGCAAGTCTGATGTGAAAGCCCGGGGCTTAACCCCGGGACTGCATTGGAAACTGTCCATCTTGAGTGCCGGAGAGGTAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACGGTAACTGACGTTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATACTA
>XM_053628787.1 PREDICTED: Ictalurus furcatus calcium/calmodulin-dependent protein kinase (CaM kinase) II delta 1 (LOC128609903), transcript variant X2, mRNA 
GAAGAGGCGAAAGCGGATCATTTACGTCTGAGCAGCCGCAGGAGCAGATCGACGCTCTCAACTTCACTCAAGCGCGAGCCATCTGCAGAACACAGACACAACACACCTGCGCGAGCGGAGAGCTGACAGACTGGACTTTTTCTTCTCTCCGCAGCATTTAGGCGTTTACTTTCATTCTGTGAAGCACAGCTGAGGAAGCGAGGCATTAGACTTGATTGCTGTTCAGATTTGTCCTGGCTGTCTTTCTCGGCATGGCTGCGACCACCTGTACCAGGTTCACCGACGAATATCAGCTCTATGAAGAACTGGGCAAAGGAGCCTTCTCAGTGGTGAGACGATGTATGAAAATCTCCACTGGACAGGAGTACGCTGCCAAAATTATCAACACCAAGAAGCTGTCTGCCAGGGATCACCAGAAGCTGGAACGTGAAGCTCGCATTTGCCGTCTGCTTAAACACCCCAACATTGTGAGACTCCATGACAGCATATCTGAAGAGGGATTCCACTACCTCGTCTTTGATTTAGTCACAGGAGGGGAGCTGTTTGAAGATATTGTGGCCAGAGAGTATTATAGTGAAGCTGATGCCAGTCATTGCATTCAGCAGATCCTTGAGGCCGTTCTCCACTGCCACCAGATGGGAGTGGTCCATCGCGACCTGAAGCCTGAGAACCTGCTTTTAGCCAGCAAACTTAAGGGAGCTGCAGTGAAACTGGCTGACTTTGGCTTGGCCATTGAAGTGCAGGGAGACCAGCAAGCATGGTTCGGATTTGCTGGCACTCCTGGTTACTTGTCTCCTGAGGTGTTAAGGAAGGAACCCTATGGGAAGCCAGTTGATATGTGGGCTTGTGGTGTGATTCTCTACATCTTGCTGGTGGGCTATCCTCCATTCTGGGATGAGGATCAACATAGACTTTATCAGCAGATTAAGGCTGGTGCCTACGATTTTCCTTCTCCTGAGTGGGACACAGTGACCCCAGAGGCCAAAGATCTGATCAATAAGATGCTGACAATCAACCCTGCCAAACGCATTACTGCTGCAGAGGCCCTCAAACACCCATGGATCTGTCAACGCTCTACAGTGGCCTCTATGATGCACAGACAGGAGACTGTGGAATGCCTGAAGAAGTTTAACGCCAGGAGAAAGCTAAAGGGAGCAATCCTGACCACGATGCTTGCCACAAAGACCTTCTCAAAAGGGAATCCATATAAGAAGCCTGATAGTGTTAAGATCAACAACAAAGGCAACGTAGTCACCAGCCCTAAAGAGGCAGTCCCCTCTCCTGCTCTGGAGCCTCAAACTACTGTTATCCACAATCCGACTGACGGAAGCAAGGTAGAATCCTCCGAGAGTGCCAACACCACCATCGAAGATGAGGATGTGAAAGCACGGAAGCAGGAGATTATAAAAGTGACCGAGCAGCTGATCGAGGCCATCAACAATGGAGATTTTGAAGCTTATACCAAGATCTGTGACCCTGGACTGACCTCTTTTGAACCTGAGGCTTTGGGGAACCTGGTGGAGGGAACAGACTTCCACAGGTTCTACTTTGAAAACTCTCTCTCAAAGAGCCACAGGCGTACCGTCCACACCATCTTGCTGAATCCTCACGTGCACCTGCTGGGAGAAGACGCTGCCTGCATAGCTTACATCAGACTCACCCAGTACATCGATGCTAACAGCATGCCTCGCACCATGCAGTCAGAGGAGACTCGGGTGTGGCATCGCCGTGACGGCAAGTGGCAGAATATTCATTTCCACCGCTCAGGCTCGCCAACCGTGCCCACCAATTAACGTGGTGTCCTGACCAGCGCAGTTCAGTGTAAAGGACTTAATGTCAGATGGCCACTGAGTGTCTGCTTTATTCAAACCCCACCTTTACAACTTCTCCACCCTGTCAGTCTTGTTTACATATCGTCACTGCTGGACTTTAGCCTACACACAGGTGGGGAATTAATATCATTTTGTATTAGGATGTGTGTATGCGTGCGACTTGCACGCTCTCCTCATAAACCATTGATGTTAAAGACTTATGTATACATATTTTTTTTTTCCCTTTTTATAATTTAATGTTCTATTTTCTATGGTGTGAAAGTAGGGCGTCACACTTGCTGATATATCTTTGGGTGTGTGGGTACATCAGGAAAAGAAATGCTTGATCTCTGTACACAGTCAGATACAAAGTCAAACAGTACATAGACGAATCTGGGCGCACGTGTGACATGTTCATATTAGAGTGATTAGTAATCTAGGCACAATATCCGTCACTGATCTTGAGGATATGATTAGCAGCAAATCAAAGCCAATTCAGTCTTGTTTCAGTGCTTTTCTATTTTAAGTGCAATACAGCTGAAAAAAATTCATTATGAATCTGACAAATGAGCTCGCTTTTGTTTTTTTGGTGAAGTTTTTGTGAAGTTGTGTGAAGTGCTATTCCTGCTTTATCTTTTAGAGAATTGACAGTTGACCGTGATCTTAGTTCTGCGAGCTTTGTTCGGTTTTAGGTTGCTATGGCCTAATGGGTTTAGCAACACTAATGTGCAAAACTGACAAAGGAAGCACATTTAGCCTACAGTTCGCTATTTTATTCTGATGTTTTCCACAGCATCACATGAACACAGTAGAAAAAGTGTAAAAATTTCAATTAAAGAATGTACTTTATCAATCAACACGAATAATTGGTAAACCAAACTATTTTATTTTATTCAGTTGTTGTGAGAGTTTTATGCTTCTGTTTTCATTTTTATATTGTTTACTAACATTTGATGGGGGTATTCTTTGGAAAGAAAAAAAAACGAGTTTTCTCTATTTTTCACACCTTCCTTAATTAATTAGCATTAGCTGTTATGTATTGCATGAAACATCTTTTATCAACTTTTATGTACTTTTATGTACTTCATGTTTATGATCTTGTGATGGTTCCCTTCTCAAGGGTGAAGTAGAATAAATGGTTTATGCTTTGTATTCCATACTGTCCATTTAAACCGAAAAAGAGATGAGTAGTTAGTGCAGTTTGAAAATGATTTATATTTGCAAAAACTATTACGATTATCAATGCAAAATCCAAAAAAAAAAAAAAAAAAGAAAAATAGGAAAATTTGAAATGGGAAACATTTGACAGATTAATATAAAAGATGATTTATTTGTAGCACAGTTGATATTTGATTTAAATAAAGCTTGCCTTTGTTTACTCAAACTTTGTTTAAGATCGACTGTAATGCTTCATAACATCAGTTTGTGGAAAGCATTGGGAGGAAACCTGAATTTGGGACTGATTATTAATCAGTCTGATTATTAATGATTGTTTAATTTGGATTCAGTGTCTGAAATGCTATCAGCGGTTTGAGACTTAAAGATTATCAGTTGTTATCTAGTTCCATTTTATTTGCTTTGCATTTAAAATTTTTTGTTATTTTTGTTACTTTTTTTTTATTCTAGTCCAGTTCCCTTTGTACTTTTTATTGCTGTAACTAGATGAAAATCCCCAATCCCACAAACCTGTACACTAAACAGAAGTACAAATACTCGAGCAGTTAAAAAGGACACGATAAAGCAAATAAATAAACTGTGAAAACATCCTCTTTTTTTCTCGGTTAATACATATTCATTTTGAGATTAAGAAAATTAAGGAATTTAAATAGTTTGTATATGTGGATACAGAGAACAACATATTACTGTGCACAGAAAAACATATTACCAACCCAATGCATGAATAAAATATTTCTGCCTATTTTTTGTTGTTGTTGTTGTTGTTGTTGTTGTTGTTGTTAATCTTAAATTGGGTTTAAAAGTTAAGTTTAATGGAAAACTATTAGCCATTTTGTGGTTTCTGTACATAAAAAAGGTTGGGGTTTTTTCCTCCTTTGTTTTTTTGTAAAAACTTTTTACAAAGAAAGTGTCCCATGTTAAATAAAAAAGCCCCAGGCACCAGCA
>XR_003317481.3 PREDICTED: Ursus arctos uncharacterized LOC113259124 (LOC113259124), transcript variant X3, ncRNA 
GGGCCATCTGCAGAGCCCTCTATTGGACGAGCCATGCTGAGGGATCCCTCTGGGAACCAACCAAAGGCGTCAATCTGGAGCCGAAGAGGCGTTATCGCCCGGCGGACCAGTTTTGGAGGTCAAAGCTCCGCGGGGCGCAGCTAGTGGCGGAGCGAGCTGTGAAGGGAGGGTCTTCCACTTGTCGCCAGCGTGAACTCTGGTGCCCCGTGAGTGTTCGGAATGAACCCCCAACTCCGGACCCTCAAATCCGCCCACGCCCAGGCGTGCTTGTCTCTGCTTCGACTTTGTCATGTAACACTTTCTCCTTTTTTCCCCTGGGATCCTTTTGGTCCCTCCCCGTCTCTTCGCGCTCGGAAAGCCGAATTTCGCTGATGCTCTCAGCTTAGAGGAAAAAATTTTGTGCGGAATTCAGTCCTTCCTTCTGTTAGGCAGCAGTCGTTGGATGGGAGGGACTAAAAATCACTTGGTGCCCTGACAAGATTTGTTACTGTTGCTAAAATCGTCAACTCTAATGCTTTAAGGGAGATAACTTCCTGCAAATCCAGAACTTTCGGATTACTTCCGAGCTTAAAGAGCACGCCACATGAAGATGAAGGCAGAGATTGGGTTGATGCTTCTCCAAGCCAAGGAAGTCCAAGATGGCCAGCATACTCTCAGAAGCTATGGGAAAAGCCTGAAACAGATCTTTCCCTCACAGCCATCAGAAGAAACCATTCATGCTGATACCACGATCATGGATTCTAGGCTCCAAAACTGAGCTGCTTACAGAGTGTTATTAAATATGTGGATACATTTCGGGCACCTGACTGGCTGTTGGAATAGCATGAGACTCTTGATCTTGGGGTCATGAATTCAAGCCCCACACCAGAGGGAAAATACAGACGTCCATTAACTTCAATCCCTGGAGTCAGAATTCAACTTGAGACATATGGATGGGAGCTATGCTCCATTTGTGGGATGGGAAGAAACCAGTTCCCCTTTTCTAGCCTCACATCTGTTTGGATTGTATCTTAGTAGGCAATAATGAGAAGGCTGCCTAGGGCTGACTCAACCATAAATATTAGAATTAGGAGAAGTATTAGAATTGCGAAGCCATGTTTTTTTGTGAATGGTGCTCCCTATTCTTTGATTAAGAGCTTAAACCTCATTCACACTCATGACTTACAGGCTGAGCCAGCAGGAAGGTGGACACTAACTCTAATCTCCTAGGAATGAGGAATGAAAAACCAAGACAAGCAGACACTGTAAAATTGTTTTTGTTTTTTTAATGCAGGTCAAATATCCTGAAACATACATGTATTTTGATAGTCTTCTAATGCCACTTTAGTTCAAATATTAAAGTAACACACACGAGCTAAGAGAATTCAATATTGTTCCAAGGCACTTACTGAATCTCCATGACTAGATGAAAACAAGGACAATTAAGATGAACAATTAGTATATAATATAAAAATAACTTTTTGCTTACAATTTACAAAATGTATTATTATTACAATCTTTGATCTCTGATAACCTGCAATGCTGGCTGCATGAATCCAGCAATTTTAAAATTCAGAAACTATTTTCTAAAACTTCAGGGCAAATAATTTACAAATAAGGTACACAAAGATTTAGACCATGCAGAAATTTCTTACATCTTCTGTTAATAATATTTTATGACTGCAACTTTATCAAATTATATACCTACTTGCCCTGTACATATACAAAATAATGCATACATGATAAAACATTAGCAAAAGAGTAGTCCTTAAATTCAATTTATCATAAAAGTATTACTATATTAACATGTCTACAAGCAGCGTGTAACAGGTTAAGAGACATTAAGGCAATAATACTTGAAGTTACAAAATAAACCAATGTAATACTTTCCTAAGTGTAGTATAAGGCAGGTAGATGGTCCAAGCAAAAAAATACTAAGGTAACAATCTACACTGCTGTTAGTCCCACATTTTTAAGATGGAATACTATAAATCTGGCTTTCAGTGGCACTTGAATTTTCCAGTATAATTTAAAGTGTCTTTTAGCTCCCTGAATCATGTCCATTCTGAAGGTGGATCTCTTGGTCCTTTGGGTTTTCCACAGCGATTACGAAAACCTGTAATCAAAAGACCAGAGTAATTGGTCAGTGTTCAGAAATGTATTTTAATGTACTAGAAACTCTTAATTTGCTTTGGGTAGTTCATTTAAGAACCTAAATAAATCAGCACAAAGTATGGTAAACTCTGCCTTCAGGAAAGCCTGAAATGATGGCAAATAACCGTTTCTCATTCTTGCCAGCACTAACTACATAACTAAAGTTTTAAAATTATTTAGTAAACAAATTACCAATATCTGTGGCCTCTGTTGGACTTTCTGATATTTGATCTTTCTTGTTACTGAAAAGAGGCGGACATTCTGTACAAGTCTCTGTGTGAATACCTCCTGCTGGATGATCTAAAATGCAAAATAAAGCCATTGTTAACCACC
>XM_011504069.1 PREDICTED: Ceratosolen solmsi marchali transmembrane protease serine 3-like (LOC105365808), mRNA 
TTTTCAATTTAAATTTTTGCTCTTCAGATACTATGAAAATTATTTTCAAAACATTAATTGCACTTCTACTGGTGCAAGTCAGTTATGTAAATTCGTGGGATCATCTCAGGCACGCCAGTCCTGGTCAGTTTCCACATCAAGCAGTATTGGTATGGATCGGAGCATTACCATTTCCTCCATTTCACTTATGTGGTGGTGCAATCTTGAACGAATTCTGGATTTTAAGTTCAGCGTACTGCGTTGTTGATATATTACATTTAAATAACGTACGTATCAAGGTTGGTAGTCACAATATTTCTTTAGATGACGAGCACGTACGAAACGTTGAGGTGGCAAAGATTATCGTTCATGAAAAATATACTAGGTGA
>XM_048344465.1 PREDICTED: Perognathus longimembris pacificus LRR binding FLII interacting protein 1 (Lrrfip1), transcript variant X23, mRNA 
GACGGCCCCGCGGCGGCGGCGGCGGACGGCGGCGGACATGGGCACCCAGGGCTCGGGGCGCAGGCGGCTCCCCAACCGGGAGCGGCTCACGGCCGAGGACGACGCGCTCAATCAGATCGCGCGCGAGGCGGAGGCCAGGCTCGCAGCGAAGCGTGCGGCGCGGGCGGAGGCGCGGGAGATCCGCATGAGGGAGCTGGAGCGGCAGCAGAAGGAGGTTGAAGAGAGACCAGAAAAGGATTTTACGGAGAAGGGGTCTCGCAACATGCCGGGCTTGTCTGCGGCCACGCTGGCCTCGCTGGGCGGGACTTCCTCCCGGAGGGGAAGCGGAGACACCTCCATCTCCATGGACACCGAGGCTTCTATTAGGGAGATTAAGGACTCCCTAGCAGAAGTGGAAGAGAAGTATAAGAAGGCCATGGTGTCCAACGCCCAGCTAGACAACGAGAAGACCAACTTCATGTACCAGGTGGACACGCTGAAAGACACGCTGCTGGAGCTCGAGGAGCAGCTGGCCGAGTCCCAGCGGCTCTACGAGGAGAAAAGCAAGGAGTTGGAGCGGGAGAAGCACGCGCACAGTGTCCTGCAGTTCCAGTTCGCCGAGGTGAAGGAGGCGCTGAGGCAGAGGGAGGACATGCTGGAGAAACACGGAATAATCCTAAATTCAGAAACAGCTACCAATGGAGAGACTTCGGACACACTAAATAACGTCGGATACCAAGGCCCGACTAAGATGACAAAAGAAGAGTTAAACGCCCTCCAGTCAGCCGGCGACGGGACACTGGATATTAGGTTGAAAAAGCTCGTGGATGAGAGAGAGTACTTATTGGAACAGATTAAGAAACTCAAAGCGCAGCTGGAGGGGAAACAGAAGAACAACAAGCTAGACAATCTGCGATCTGAAGATGAGGTCTTGGAAAACGGGACAGATGTGCACGTCATGGATCTACAAAGGGATGCCAACAGACAGATCAGCGACCTCAAATTTAAACTTGCAAAGTCAGAGCAAGAGATAACTGCATTAGAACAAAACGTAATAAGGTTAGAGAGCCAGGTATCGCGTTATAAGACAGCTGCTGAAAGTGCAGAAAAAATAGAAGACGAACTTAAGGCAGAAAAGCGGAAACTCCAAAGAGAGCTTCGCTCCGCATTGGATAAAACGGAAGAGCTTGAGGTGAGCAATGGCCACCTAGTGAAGCGTCTGGAAAAGATGAAAGCGAACAGGAGTGCACTTTTGTCCCAGCAGTAAGCACCAGCCTGCGGGGCAGCTGCGCGTGTGTGTGTGGCCCCTGGGCTTTTCCCTGTCCTATGAGAGCGCCGCTTCCCCTATGCCTCCGCAATGCCTCCGCGGAACGCTAGGGGGAGCCCCTGGCCCTTCCCACCCGGGCCACATCCACTCCAGAGAAGCCCGCAGCCGCCGGGGCGGCCTGGTCTGCAGCCGCCTTCTCCAGGCTGGGCCGGCTCTCAGAACCTCCAGGTTTCTTTGTAAGCACACTGGGCCTCGTGGAAGCTCGGCGTCTCCGTGGCACAGCTCGGGCCGACCGAGGCCAAGATGAACGTGGAACATGAGTTGTCTTTTCATGTGTCTTGCTGAAGGTTAAGGGGAAATGTTACCGTGTGGGGACTCCTCCAGGGCAGAACTACAATTTGAGTGACTTCCGTAGTATCTCTTAGTCTATGCTTTTCATACACGAAACACTGTGGAACCACAAGCCATTACCAAGCGAAACTCTCACTGCGAACAAGAGGATGGTCTAGGCGTAAAAGTGACCTTAAGAAAACTCTTTACAGGCAACAAATGAAGCTTTTCTAAGGGATTTTTTGCATCTGTTCAGTCATGAGAATACTTTTTTCCAGGGTAATTAGGCAATAGCTTCTCTGAAAAATGACAGCTTTTCATTTGCATTATATTTGGAATTGAAGTTGTTAACTTCTTTTAAAGAATGTACTATTAGGAAAATAAAATATGAAATGTTAAAAGACTTGAGCAATGTGGTTTTTATTTTTTTC
>XM_005356914.2 PREDICTED: Microtus ochrogaster leucine rich repeat containing 71 (Lrrc71), transcript variant X2, mRNA 
CAGTTGCTGGCCAACTGGGTCTGGTGAGTGGCGATCCTCAGGGCGAGGCCCACAGAGTCCTGTCTCATCTTGCCTCTCACTCAAGGAGTCCAGAGCCACCAGAATGTCAAATGAGCCGAGTGCCACGGGGACCTCACCTAGGACACCTCGTCCTGGGGCCCAAAAGTCATCCGGTGCGGTAACCAAGAAGGGGGAGCGGGCTGCTAAGGAGAAGCCAGCAACTGCCCTGCCTCCAGTGGGTGAGGAGGAGCCAAAAAATCCCGAGGAATACCAGTGCTCGGGGATCCTGGAGACAGACTTCGCAGAGCTCTGCGCACGGTCAGGCTACACGGACTTTCCCAAAGTCGTCACCCGGCCACGGCCCCATCAGAACTTTGTCCCTTCTGCCTCCATGTCAGAAAAACCCACCCAAGACGACCAGCGGCTGTCGGCATCCTGTAGCCAGAACAGCCTGGAGAGCAAATACGTGTTCTTTCGGCCCACCATTCAGGTGGAGATGGAGCCAGAGGACAGCAAGGCAGTGAAAGAGATCTACATCCGAGGTTGGAAAGTTGAGGATCGGATTCTGGGTATCCTCTCCAAATGTCTACCCTCCCTCAGCCAGCTGCAAGCCATCAACTTGTGGAAGGTGGGGCTGACGGATAAGACCCTGACCACGTTCATCGCCCTTTTGCCTCTCTGTTCCTCCACACTCAGGAAGGTATCTCTGGAAGGGAACCCACTGCCGGAGCAGTCCTATTACAAGCTCATGGGACTGGACAGCACGATCGCTCACTTGTCTCTGAGGAACAACAACATCGATGACCATGGGGCGCAGCTCCTAGGCCAGGCACTGTCCACACTGCACAACAGCAACAGGACCCTTGTTTCACTGAATCTGGGATTCAACCACATTGGAGATGAGGGCGCAGGCTACATTGCGGATGGCCTGAGGCTGAATCGCTCTCTCCTCTGGTTGTCCCTGGCACACAATCGTATTCAAGACAAAGGAGCACTGAAGCTGGCCGAGGTCCTGCGCCCCTTTGAGCTGACCCACAGGGAGGTGGTGGAGAGGAGGCGCCTGCTGCTGGAGAAAGGATCGCAGGAGCGGTCACGATCGCCTTCCTCCTCCCGACATGGGGACTCCAAAACAGAGCGTGAGAAGTCTCAGACAATGGGGATCAGCAGTGTTGCTTTGGCAGACAAGCCAGAAAAGATGCAGACAGTGAAAACACCCAAGGGCCTGGGCAAGAAAAAGGAGAAGTCAGGGGAAGTTGTAAAGAAGGAGGAGAAGTCAGGCTCCGGGCAGTCACCCACACAAGGAACCCCTAAGAAAGAAGATGCCACAAAGGCAGGCAAGGGGAAGGTCACCATCCCCGAGCAGAAGATGAGCAAGGGAAAAGGGCCCAAGACGGGGAGCAAAGAGAAGCGCAGCATCCTCCTGGAGTCTGAGCTGGTTGTCGAAGCTACAGAGATGGTCAACCCTCTCCTGGAGCCTGTGGAGCACCGAGATGGGAAAGTTTTCATGCCTGGGAACAAGGTCCTTTTGCACCTCAACCTCCTCCGAAACCGAATTACAGAAGTGGGGTTGGAAGGTTTCCTTACTGCCGTGCAATACCAGGTTCAGGTCTCCAAGCCCAAGAGTTCATCCAAGGGTCCCTTGGGGCTGCTGTGGCTATCCCTGGCGAAAAACTGCTTTGACCCACAGTGTCCAACATACACCATGATTCAGGAACTGATGCTGCCAAGGGACCCTGTGAAGGCCAAGGTCAGGGAGGAGGAGGCCACAGCTACCTAGGCTTCCCATGGGAGACACCTTGGACCATTATCAGCCTATTGCTGTGCTATTCTTTGAAAATCACTTCAGAACTGTTGGGAACATTTGGGCTCCTGAGTCTGTTCATATTGCCTGGTTAGGCATGGCAGAGTGGTGGCCTGAATCACACGGTATCTGTTGGGGGGATGAACTGAGCTCCTGGCTCCACCTCCCGAGTGCCCCAGCAGCATCCCCCAGCCCCTCTCTGCCAGCATGCACACAGCTGATGATGGAACTAGGACCCATCCCCCAGCATCCTTGCTGCTTATCTCCAACCCATGTGTTTGCCTGGCTTGTGAGACAAATGCACTCTGGAGAGGGTACTGTAGCCATATTTGCATAGCAAAGGCCAAACATTAGACATGGCAGGTGAGCAACCTGAAATCATGGACATCCAGAGTTGGGACTGCCAGGCTGCCTCTAAATTCTGGAGAGCCCATGCTAACCTACAGGGAATCTCCAACCTCTTTCATCTCTTGGCCCTCCGCACTGGCTGCTGAGTGGCTCCAGGGACATCTTTCTCCATTGCTCTGAGTCC
>XM_030788246.1 PREDICTED: Chanos chanos meiotic nuclear divisions 1 (mnd1), mRNA 
ATGGGCGGACAGTCTAAGAAGAAAGGATTGAGTTTGGAGGAGAAGAGGAGTCGCATGATGGAGATATTTTTTGAGACTAAGGACGTGTTTCAGCTGAAGGACATTGAGAAAATTGCCCCCAAAGCCAAAGGGATCACGCCCATGTCGGTGAAGGACGTCCTCCAGAGTCTAGTGGACGACAACATGGTGGACTCAGAAAGAGTGGGAACCTCCAACTATTACTGGGCATTTCCCAGTAAAGCTCTCCATGCCCGTAAACGCAGACTGGAAGAACTGGAGAAGCAGCATTTGGAAGGGAAGCAGAAGAAAGCCAGTCTACAGCAGGCCGTGGACAAAGCCAAAGTGGGACGCCAAGAAACGGAGGAGAGGAGTGCTCTGAGGCAGGAGTTGCAGACCCTGAGGGAGCAGCGGGACCAGCTCAGGGAGGAGGTGGAGAAATACAGGGAGTGTGACCCTGAGGTGGTGGAGGAGATCCGCAGAGCCAATGTGACTGCCAAGGAGGCTGTCTCACGGTGGACAGACAACGTCTTTGCCATCAAGTCTTGGGCCAAGAGAAAGTTTGGATTTGAGGACGCACGGCTGGACAAGGCCTTCGGAATACCGGAGGACTTTGACTACATGGACTGA
>XM_051990939.1 PREDICTED: Antechinus flavipes zinc finger protein 665-like (LOC127557627), mRNA 
ATGAAGTACTACCCACCTGCCCCTCCCATCGCCTTGCCCACCAGACGCCCCTTCCCTCTCCGAGAACACCCGCCCTCTCCGAAAACACCCGCCCTCCCTGGGCACACCCGCCTTCTCCGCATCCCCCTCTTAGGCGCCATCATGCTTGCAGTAACCAACGACACAAGAGTCAGCCGCTGGGAGAGGGCAATCATATGCCCACCCACCTCCCCCGGCACGCTCACCCTCCTCTGCTCTCCTGGTCTCCTGCAGCTTTTCTCCCCCTCTTCTGGCGAACCCGTCTCTTCTGTTGCCCTTGGTTACGACCCTGGTGCCCACACACTGCCCCTCACCCACATTCCCCCTCCGCGCCATACCTGGGCAGCCCCTCGACCAAGCAGCGAAGGAGTCGAGCTCCACGCCCGCTCGCTGTCCGTGTCTCTGGGATCAGGGGCTGCGAAAGCTTCCGGTCTAGCCAAGGAGGACAACATAGGGGGAGATAGGTACAAGGAGTGCGGTGACACTTATGGACTCTGGAAGGGCAAGGTGGCCCGCCTGAGCAGTGGGGATGATCAGGGGGACATGAGGGAAGGTGAAGTTGTGGAGGGCACAGGGCAGTGGAGCAGGAGAGTTCCTCGTGACCAACTAGTGAGGCCCCGCCTTTGCAAGCGCAGCCCTGGCCACCTCCTGGAAGAATCCTTTGTGGCTCGCAGTGGGATCGCATCTCTGGCTGGCCCAGCCCGGGGCCCAGCCAAGAGCGAGCCTACGTCCTGCCTCGCCTCCCTTCCCGTAGCCCCAGGGGCCGCCCGCCTCCCCCAGCCCACTCCTCTGTCTTCCTCCTCTCTGCTCTCCAGTTTAGCCTTTAGGATGTCCAAGCCTGGCCCAAGAGAGAAGCTTGGAGCCAAGGGAATGGCCCCTGAGACTCAGAGGACTCCATCCCAGAAATGTGTGACATTCAAGGATGTTGCTGTGTTCTTCAGCCGGGAGGAATGGTGCTCCCTGAACTCTTCACAGCAGAAGCTGTACAAGGAGGTCATGCTGGAGATCTCTCAGAACCTGCTCTCTCTGGATGGAAAGAATAGACCTAAAACCCAGAAGTCTACTCCAAAGCTGAATAGTTCCTGTGACTTTCATTTGAGAAAAATCAAGGGTAGTGAAAATAACTCAGAGAAGAAGCAAGGCAACTTGAAGAGTCATTCCAAAAAATTAAATATTATCATCAGGAAAACTCCTCAAGAAAAAAAAGATGATGACCATAATAAGTCTGAGAGTAGTTTTACTCCACAGTCGACCAATGAGGGTAATCAACTTGAGGGGAAGCCAGATCTTACTAAAGATCAGAAAAATCCAAGTGTCAAAAAGCCTTACAAATGTAATGAATGTGGGAAGACTTTCAGTCGAATCTCATACTTTAATGGACACAAGAGGATTCATAATCCAGATAGATTTTACGTTTGTAATCATTGTGGGAAAAAGTTCTCAAGACCCTACAAACTTGCCGTACACCAAAGGGTACATACTGGAGAGAAGCCTTATAAGTGTAACAAATGTGGGAAGTCCTTCTCCCAGACCTCATCCCTTACTCTGCATCAGAAGATTCATAGTGGGGAGAAGCCTCATAAATGTAACGAATGTGGGAATACCTTCAGCCAGCGCTCAACACTCACTGCACATCAGAAAAGACATACTGGAGAGAAGCCCTATGAGTGTGGTCAGTGTGGGAAGGCTTTCAGCCGGAGCTCGAGTCTTAGTGTCCATAAAAGGAGCCACACCGGGGAGAAGCCCTATGAATGTACCGAGTGTGGAAAGGCCTTCAGCCAAACCTCATCCCTTATTGTGCACAAGAAGATTCATACTGGAGAGAAGCCCTATAAATGCAACGAATGTCAGATGGCCTTCAGGGAAAGCTCAGCCCTTCATGTACACAAGAGGTTACATACTGGCGAGAAGCCCTATCAGTGTAATTACTGTGGAAAAGCCTTCAGTCAATCCTGCAGCCTTGCTGTACATAAGAGAATACACACAGGAGAAAAGCCTTATAAATGCAATGAGTGTGGGAAGGCCTTCTGTGAGAGCTCATCTCTCAGTACACATCGGAAAATTCACACCGGAGAAAAACCCTACAAATGCAAGGAATGTGGGAAGTCTTATTGCCAAAGCTCGACGCTCAGTGCTCATCAGAAGACTCACACCGGGGAGAAATCTCACAAATGTCATCAGTGTACAAAAACTTTTGTAAAGCCCTCCCAACTTGTAGCCCATCAGAGAATTCATACTGGAGAGAGACCCTATAAATGTGACGAGTGTGGCAAGACCTTCGGCCACACTAAAACCCTTCATGCCCACCGGAAGATTCATGCTGAGGAAAAACTTTATAAATGTGATCAGTGTGAAAAGTCCTTCCAGTGCAGTTCCTACCTGGCTGTGCACAAGAAGATTCATACTGGGGAGAAACCTCATCAGTGCAACGAGTGTGGAAAAACTTTTAGACAAAACATATCTCTTATAGTACATCAGAGGATTCATACTGGAGAGAAACCCTATAAATGTAATCAGTGTGAAAAGTCCTTTCACGGCAGCTCGTATCTGGCTATCCACAAGAAGATTCATACTGGAGAGAGACCTCACTCGTGTAATCAGTGTGGAAAGGCTTTCAGAACCCACTTGAACCTCGTTGTGCACCAGAGGATTCATACTGGAGAGAAACCTTATCAGTGTAATGAATGTGGGAAGTTCTTCACCCAGAGCTCCAATCTTGCCGTACATCAGAAAAGCCACACTGGAACCAAATCTTCTAAATCTAATTAACGTATGAATCACGGACTTGATGACACAGAAAATTCATGTGAATGTAATTTTTTTCTCCTCTTCTATCAGTGAAGAAAGGAGGAAAAAGCAGATGGGACTTTATATTTCCTGTAATTTTATGTAAAGATATATAGGAAGGGACAAGGGGAGAGAGCACAAGATGATCTGTACTTTTAACAGGACAAAGGAGGGTTGAACACATGCACACACACACAACTTTATCGTAGGAATAAATCAGACTCAAATCAATAAGCAGGGATGAGGAGTAGGGTTAATGTGGAGAATAATGGGGAGGGAATTATCAAAAGCACAATGAATGTTCACTTGAGGGAAGTGAACACTGAAGGGGATATTAAAAGTTAAAAAAGAAATCAAAGAAATGATACAAAGAGGACCCCATTATTTGGATAATGAGTAGGTAATGCAGTGGAGACAGTGTGAAGTCTGGAGCTGGAAAGATCTGAGTTAAAAAATGGCCTTAGATACTTAATAGCTGGATTACTCAGAGCAAATCACTGAATTACTTACCATCTGCCTCTATTTCCTCATATGTAAAATGGGATTAATAATAACACCTCTTTTTCAGGGTCGTTTTGAAGATCAAATGAGTTAATATTTGAAGTGATTTCTAGATCTTAAAGTATTTTATAAATGCTAGCTCTTAAGAATATCTGATAGGATAGTATTGTATCATAAGAACTGATGACAAGGACAGGTTCAGAGAAACTTGGGAAAACTTGTAACTGAGGCAGAGTAGTGAGCAGTACCAGGAAAACAATTTATGCAATAGCAGTATTATTTTTTTAAAATTTTAATAGCTTTTTATTTACAAGTTATATTCATGGCTAATTTTACAGCATCGACAATTGCCAACCTTTTGTTCCAATTTTTCCCTTCCTTCCCCCACCCCTTCCCCTAGATGATAGGATGACCAATACATGTTAAATATATTAAAGTATAAATTAAATACAAAATAAGTA
>XR_004154822.1 PREDICTED: Punica granatum luc7-like protein 3 (LOC116196428), transcript variant X3, misc_RNA 
CAGTAAGTACAGTTGATCGCCCCTCCACCTCCACCGTCGTCAAAGGGATTTCTTGCTTCCCCCTCCCACTCCGAACCCTAGAAAGTAGAGGAGCTCTTCCCCTCACCCACCATCGCAGCTTCCTGCTATTCCATTTGAGGGAAAAACCTATTGTTCCCAGCTGAATTATCCATCTGTTCCGAGCTCTTACACTACGCGATAGCGAAATCTTATCCATAAGCCATGGACGCGCAGCGAGCTTTGTTGGACGAGCTCATGGGCTCAGCTCGTAACTTGACGGAGGAAGAGAAGAGGGGATACAAGGAAATCAGATGGGACGATAAGGAGGTCTGTGCATTCTATATGGTCCGGTTTTGCCCTCACGATCTCTTCATCAATACTCGAAGCGACCTCGGTCCGTGCCCAAGAATCCATGATTTGAAGCTGAAAGAAAGTTTTGAGAACTCTCCAAAGCATGACGCCTATGTGCCAAAATTTGAAGCTGAACTCGCGCAGTTCTGTGAGAAACTGGTGATGGACTTGGATAGAAGAGTTAGGCGCGGGCGGGAGCGTCTTGCGCAAGATGCTGAACCTGTGCCACCTCCTCCTCTTTCTGCTGAAAAATCTGAACAACTATCAGTGCTCGAGGAGAAAATCAAAAACCTGCTGGAGCAGGTGGAAGCCCTTGGTGAATCTGGAAAAGTAGATGAAGCTGAAGCACTCATGAGAAAGGTGGAGATGCTTAATACTGAAAAGACTGCTTTGACACAACCTACCCAAAATGAGAAGGTTCTGATGCTTACACAGGAGAAGAAGATGGCTCTTTGTGAGATATGTGGCTCGTTTCTGGTGGCTAATGATGCAGCAGAGCGGGTTCAGTCTCATATCACAGGGAAGCAGCATGTAGGTTATGGCATGGTTAGGGATTTCATAGCAGAGTACAAGGAAGCTAAGGAGAAGAGAAGGGAGGAGGAAAGACAAGCAAGGGAAAAAGAAGCTGAGGAGCGGAGGAAGCAGAGAGACAAGGAACATGATAATCAGAGAAGAAGTGAATCAAGAGACAAGGATAGATCCCATGATAAGGAGACAGACAGGGACAGGGAGCGAGACCGCTACCGGGAACATGATCGCTACCGTGAAAGGTCACGAGATCTCAATGGTAGAAGTGGTCGGGATGGAGGGAGGGGGATGGATTGGAGATCTAGGAATGGAAGAGATGGAGGCAGGGACAGGTACCGGGACAGGAGCAGGTCTCGATCCCCTGGTAGACATGGATACTGAAGGTCATCACAAAGTCCAGTTCACTAATATTATGGATCTTGTAGACAGATGAAGATCTGGACTTGTTGAGATTTCTTGAAAATATGTGATCTTCAAGGGTTGAGGTAGGTATTACCTTGGCGCTAGTCTGTTAATTTTACTATGCGGGTTTGGATTTTGTTTTTGGACCAGATTCATTGTCTCTGAAAGGCCCCTTTCAGAGTCTTAGCCTTTGCCTGAGCATGAATCTCAGCTGCTCTGATGTCCCAAGCATATTAGAGTTAATATTCTTGGAAGAAACATGCCTGGGCTTCAAGGAGATGCATTTGGAGTTGGGTTTTATGATGATCATTCTTAAGGCAAAAGACAGAGCACTGCCCTTATTCACGTTCAGTGTCTGGGGATCTGGTTATTGGGCTGGTTTAGCATGGATGAGAAAGAGTGATATATTTTGCTGGCTTTTTGCTGTCGGCTTAGAAACAGAACTTTATTTAGCTGATGTGCCATTCCATGATCAAGAAAAGTGGTAGCATTTCCACTAATGTCAAGGTATAAACTCGTGTCTCTATTACGCAGTGTTTTCAACTATGCAGGAAGAGAATGGTATCGTGGTGTATTATAGACTCGTAGATGGTGGAAGGGGAGTGAGGAGTAGTTCTTGCTGGGCGTTGGCAGACTTAATTTACTCTTCGGTTCCTAGCTGTCTGTAATGAATGAAACTGTAGGAGGGTGATTAAATCTAGAAAAGTCTCCATTTATGGTGGTGGCTTTTACAATCTGTTCTGCCCATTGGCTTGAGACTTGTTCGGTTGTTCCTGAACTTTCTAATGATTGTACTTGTGGTGTGAATGGTCCAACAAGCAGGCAATTCTGGACATTATACACTTTACCGGCTTTGAAGGGTATTCCGAACTCAA
>KX758048.1 Babesia microti Trx1 mRNA, complete cds 
AAAAAGTATTGACAATGGTGAAAGAAGTACAAACTACTGCTGAATTCAAGACTCTAATTTCTGAAAATGCCATCGTTGTTGTGGATTTTTACGCAACATGGTGTGGACCTTGCATGAGTTTTGCCCCCAAATTTGAAGCCCTTAGTGCTGAGTTCCCCAACATCTTATTCATAAAAGTGAATGTGGATCAAAATTCGGAACTACAAGCACTATATTCCATCACTAGTATTCCGTCATTCAAAATTTTCAAAGACGGGGCTGTTGTAGATTCGTGCACTGGAGCTAATGATGCGATTTTGAGGAGCACTATCAAGAAGCACGTCTAGCAGTTATATGCAATGGGGACTAATACCTCTGGGTATCACCTAGCCCTGGGACTTCTGGGTTTGTCCATAATTTTATTCAATTTAAAAAAAAAAAAAAAAAAAAAAA
>XM_027775713.1 PREDICTED: Tupaia chinensis melanoma-associated antigen B4 (LOC102498282), mRNA 
CGTTGGGGGTGAGGTGTCTGTGGAGGAGGTGCAGCCTCAGGCCGTTGCCGGAGGCGTCTGATCCGTGTCTTATCAGTTCTGAAGACTGTACACAAGTGGAGCCGAATAAGGACAAGCTGAATTGTTCTGCTTGGCTTTTAGGTGCCTGCCTTGTCAGCCCTCCAGCTGTCCCTGGAAAGACACCATGCCTCGCGGTCAGAAGAGTAAGATCCGTGCCCGGGAGAAACGCCAACAGGCCCGTGGCATGACCCAGAGCCCCAGGGTCCCTCAGATCACCGCAGAAGGGGAAGAAGAGTCTTCCCCGTCCGCCTCTCCTGCCTGTGGAGGACGCAGCTCTCCTTGCAGCTCTCCTGCTGCCTGCTCTCCCCCAGAGTCTCAGGGAGACCCACCCACTAGCTCCCCTGATGCAGGTGCCTCAGGCACAAAATCTGATGTAGGGGCCCAGAGCCTGGAGGAGGCAAGTCCAATAACCTCTCAGGCAGCANTTTGCTGCCCTATGGTCATGCAGAATAAGCAGCACTTCCCTGAGATTTTGAGGAGAGCCTCAGAGCGCATGGAGCTGATCTTTGGCCTAGAGTTGAAGGAAGTTGACCCTGTCAGTCACTCCTATGCTCTTGTGAGCAAGCTAGGCCTCTCCAACGAGGGAAGCGTGAGTGGTGACAAGGGGCTACCCAAGACCGGTCTCCTGATGACGCTCCTGGGTGTGATTTTCATGAGGGGTAATCGTGCCACTGAGGAGGAGATGTGGGAATTCCTGAATATGTTGGGCTTATATGCTGGGAGGAGCCACTTAATATTTGGGGAACCCCACAAGCTCATCACCGAAGATTTAGTGCGGGAAAAGTACCTGGTGTACCAGCAGGTGCCCAACAGTGACCCTCCATGCCATGTGTTCCTGTGGGGTCCCCGGGCCTATGCTGAAACCAGTAAGATGAAAGTCCTGGAGGTTTTGGCTAAGATCAGTGACACAGTCCCTAGTTCCTTCCCTTATCTGTATGAAGAGGCTCTGAGAGAGGAGGCAGTGAGGGCAGGAGGGAGATTTGCAGGCAGGATTGGCACTGTGGTCCAGGTCAGGCCAGGTCCTAGGGCCATGTCCCACTGCTCTACCCACATCTAG
>XM_046141267.1 Boeremia exigua Molybdopterin synthase sulfur carrier subunit (C7974DRAFT_388246), mRNA 
CAGACACACACAATTGATGGTAAGCATCAACCATTTTCTTCGCACTCAACCCCCCTGTCTTGTGATGTTTTCCAATAGCATGTATTATCCGACTGTCGCTTCGGTGACGGCCTGCGGAACACCTTTTTTGGCTGATCAGAAAATTTGCTCACCCTTGTTGCACACTGTTCCTAGGACACAAAAGCTAACAAGGTCCAGTCATTGTTGCTGTCATGGTAGCCTCAAACCCTCCAGCGGGGCACTTTACCATCTTGTACTTTGCGGCCGCCTCGACCTATACAGGCAAGACCACGGAGCATCTGCCCGCACCCCTCCGGGTGCGCAACCTGTTTGCACAGCTCGATGCCGCATATCCTGGCTTCGGACTGAAGGTGTTGAGCAGCTGTGCTGTGACTGTTAATCTCGAGTATGTTGATCTAGACGATAGTGATGCTCTCGATGTGGATGCCGAGATAAAAGCAGGCGACGAGGTTGCTATCATACCGCCTGTAAGCTCAGGCTAGGGCCAGCAGTGCTGCAACGGAGTGGGTGCAATGTGGACCGAGGATCGCATGCCTGCTGTCTGGTTGAATGGGTCACGTGAGGAGGCCGGCCGCGGCTGCTGTTGACCTCACCGCACGAGGACTACGATTAGCGAGTAGCGACCGAGGACGGACGGTGGCTGGACAGTAGAGAATGTTAGCTCGCGTGTTAATTGTGATTGTGCCTCAACGTTCTCGCGTCACGCGTCACGCATCACGTAGCACGCTCTCACGTTGCAAAGTAAATGGCGGACTATGAATGAGCCGGACATCCTACTACGCGACAGTAACGTGGGGAGAATGCACAAAAACTCTACAGAATATTTTTTTGTCTACAATATAAGTAGTTCTTATACAAAGTTTAGCTTTTAGTATTGTGATAGCTACAAGTTCTATATGAAAGTTAGTGAGCTCTGCTTATCCACCGTTTTTTCTGAAACTTG
>JX990552.1 Uncultured thaumarchaeote clone H7_Parch519F_24 m 16S ribosomal RNA gene, partial sequence 
CAGCCGCCGCGGTAATACCAGCACCCCGAGTGGTCGGGACGATTATTGGGCCTAAAGCATCCGTAGCCGGTCCTGCAAGTCCTCCGTTAAATCCACCCGCTCAACGGTTGGGCCGCGGGGGATACTACAGGGCTAGGAGGCGGGAGAGGCAAGCGGTACTCGACGGGTAGGGGTAAAATCCACTGATCCATTGAAGACCACCAGTGGCGAAGGCGGCTTGCCAGAACGCGCTCGACGGTGAGGGATGAAAGCTGGGGGAGCAAACCGGATTAGATACCCGGGTAGTCCCAGCTGTAAACGATGCAGACTCGGTGATGGGCTGGCCTTGTGCCAACCCAGTGCCGCAGGGAAGCCGTTAAGTCTGCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTTAAAGGAATTGGCGGGGGAGCAC
>XM_020038344.1 PREDICTED: Musca domestica GATA zinc finger domain-containing protein 4-like (LOC109613490), partial mRNA 
GTGGAGACACGTGCCTATCCCGAATTAAGCGGTCAGCAGCGTGACACAGCCACACCCCTGTGGATTATCATATTGGCCATAATTGGAGGCCTGCTGCTGCTGGCGCTCTTCACCTATGCCATGTGGAAGTGTGGTTTCTTCAAGCGCCGAAGACCGGATCCAACGCTTAGCGGAAATTTGGAGAAAATGAACGAAGAGAAGCCATTCTTAAATTCATCACAGAAAAATAATCCTCGCGGTTTCTAACAAGAAGGAACAGTTGGGTGGGATTTAATGCAGCAACAGAAATTGAGACCGGAAACGGTTGAGCCACCCAAAAATTGCTGTAGCAAAACAACAAAGAAGGATAGCGATACTTATGATTTTTGGCAAACATTTCAACAAGAGAATAATAACAATAACAACAACAACCACAATACATCTAACAATATCTATCAGCAATTGGGTGCCCATAATAGTAAATCAATAAATGAAATTAATTTGGCCGAGGTACGTAATGCCCTGGACCGGCGAACAATTGCAATGGCGAGCAATAATCAAACAACAACAACAACGGGCAATAATCATAATCACAATAGCAATAACTCAGGAATACAACCGATGGGCGGTAGTGCTGAAATAATATTCACCTCCAATTTTCAATCATCCCCCTCGCCCAACAATCCTCATGGTGGCAATACATCAATGTCCACCGGCAATAATGTGGGTAGCAGCAATGAAAATCTTCTAGATATCTATAATGGAAATGGGAAATTTGCAAACTCCCCCAGTGATCTATATAAACAAGCGCCAGCCATATCGGCTAATGGTGCTTTGGTACCACCACCCTACAGAGATCCACCGCCACCACGTAATAGTCCTTTACAACAGCCAGCAATTAATGCGAATGCTTCAAATGCCCTCTATTCAAATCAACCACCACCACAACAACAACAG
>XM_019441788.1 PREDICTED: Panthera pardus solute carrier family 51 beta subunit (SLC51B), transcript variant X2, mRNA 
CTACTCTGTGGAATTCCTCCTCTCTGGGTCACTTGCCTTGCCTCCCCCAACACTTAGCCCTCCAAAGGTCTTGTTTTACTGCTTCTTGTAGGGAATTTACATAAGACCATGACCTTCACTGTGAGAAAGCACAGGCTATAAAAGGCCAGGCTTGGCTCCCAGCTCTGTGGTTAAATATTGATAATAGCAGGAAACAGAGGCCTGGGGCGGGTATACCACATATCCCCCTGCAGTAATGGAACACCCAGACTGAGGGTCTTCCCCAGCCCATTGCCTGGGCTGGAAAGACAGTCCACATGTTTTCTCTTTACTTCAGATCAACATATAGGAAGGAAAGTATGGAGCTGCTGGCTCTTGCAGATCGTGAAAGCCAGGCGGAGCCTGTTTGTCATCTAAGGCCACTCATTCAAGAGGTCATTCACCCTGGAGTGACAGAGGAGGTTCCAGGCCTGGGCGTGTGCTAAGGGCAGAGCTACCAGCTGGGCCCCACTGCCACAGGCTCTACAGCACTGTTCCCCCAGGTGACGGCTGTGACGGGTGCTCAGGCACAGAGACCATCCAGTGCTCCGGTAAGGGGAGGACATAGAAACCAACGCTGCTCCCAGCAGCAGATCAAGGCAGGCCCAGGAAGTCAGATCCCAGGTCTTTAATTTTGGTGTCTCAGTTTGCTGTTTGTTAGATGTGCACCTCGTCTTCCTTTTCTTCATCAGTAGCTAGTTTCCCTGACATCATCCACTGAACAATTCCTCCTTTACCTACTGGGGTCTTCAGGGCTTTGCTCAAGGGCCAGAACCTAGGAGCCCAGGCGGGCAGCTCGGGAGCAAAGGGGCCTAAGGATTTCATTGTCAGAAACGTATCCCAACCGTGAACAGGGGCATGGACCACAATGACGGTGTCATCCAAGCTCCAGCTGGCACCGTGGTGCCTCAGGAACTGCTGGAAGAAATGCTTTGGTTTTTTCGGGTAGAAGATGCATCTCCTTGGAATTATTCCATCTTTGCCCTGGTGGGTGTGGTGATTGTGATAAGCATCGTCCTCCTGAGAAAGAGCATCCAGGCAAACAGAAATCAAAAGACACTGAGGAAAAACAAACTGGAAACAACAACTCTGGAAGTCCAAGACTTGGCTGAGGCCGGAGCCAGAGAGGACAACAATCTGAACATGCTAAGAGAGACTTTGCTCTCAGAAAAGCAAAATTTGGCCCAGGTGGAAACTGAGTTAAAAGGGAGAAAGGTGCCACTGGTTCTCCTTCCAGACCCACAAGAATCCGAGAGCTAGAAGGGGTCCAGAGCACCGCCCCATGTTGTCAGCAGATTCAGTGAATGAACTGCAATCAAAATATTGTTATGAAAAAAAAAACCCTCCCTTTTTATTAAAATGCATCTGAAGTGGGCATTTGGAAATGCAGTTTGTTCCAATGGGGGTGGTTCAACACAAGGGGCTTGGAGCAAAA
>AY749834.1 Labidiosticta vallisi 16S ribosomal RNA gene, partial sequence; mitochondrial 
TGCAAAGGTAGCATAATCATTAGTCTTTTAATAGGAGGCTGGAATGAAAGGTTTAACGAAGTACTAACTGTCTCATTTTTATATTAGAATTTAATTTTTAAGTGAAAAAGCTTAAATTTTGTTGGAAGACGAGAAGACCCTATAGAGCTTTATAACCAGTTTTCAAAATATTTTTAGTTAAATATTTTATTTTTATTAAATGGGTTATTTTGTTGGGGTGACAAAAATATATAATTAACTCTTATTATTCTATTGACCATAAATTTATGATTATTGGATCCAATAATATTGATCGTTAGTCTAAGTTACCTTAGGGATAACAGCGTAATCTTCCCTCAGAGTTCAAATTTACGGGANGGCTTGCGACCTCGATGTTGGATTAAGATAATAGTTGGGTGTAGAAGCTTGATTAATAGGTCTGTTCGACCTTTAAATTCTTA
>KR841045.1 Uncultured Stella sp. clone OTU_9761 16S ribosomal RNA gene, partial sequence 
TACGAAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCGCGCAGGCGGCCTTTGAAGTCGGGCGTGAAAGCCCCGGGCTCAACCCGGGAATGGCGCTCGATACTCTTGGGCTCGAGTTCGGGAGAGGAGGGTGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCGGTGGCGAAGGCGGCTCTCTGGACCGATACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGG
>XM_050429574.1 PREDICTED: Quercus robur uncharacterized LOC126725075 (LOC126725075), transcript variant X1, mRNA 
AAAAAAAAAAAAATCCCTTACGCCGTTGCCATTGTCTCCACACTGCAAAGTTTCAACACTTTGTCTCCACAAGTTGCTGTTTTGTGACCTCAATTGTGGCTGAGCCATAGCTGGACTTGACAAGCATGCCCAATGGTAGTATCTCTCTCTGTTGGTCTGTTTTGGCCCTTTTGGGTTTCCCGTTTCTGTGGTTAGTTTAGGATTTTATGTTTATTTGTTTATTGACTACTTTATTGATATTTGTGATATATTGATATATTTTATTATGTTTATTATATTTACAAGTGGTTAGTAGCTATCATCATTTATAATTTACAATTTGTATTTTATTTTTTAAATTTCATAATGGTGGCGCCGGCTTGTTATGGTTTATTTGATAAAATTGTTTGAGTATTTGTATATATATAATTATATTTGAACAAGTAGCAGTCTAATTATTTTATAGATACGAATTTACACCTTAGTTGCTTGGTTTTGTCTGACTGCACATAATGAAAGTACTAAAAAAACACTTTAGAATCAATTATAAATTGTCAGAAAGTCTTATAGTTCAGTAAATATTTGTTGGTGTTTTCAATACAGTCTAAAGCTCAAATCTTTCGTCCCCAACTATTGAATTGCCAAATTATAAAGAATTAATTATTAATTATTTTGGTATAGCACCCAAAAACATAAGCCAAAACTTTAGAGTTAATTTAATTTCTGAAATAAAACTTTTTTTTAGTTATGAAACTTTTTTCATACTTAGCTTGGCCCTCCCCAGGAAAAATTTATGGCTCAGCCATTGCCTAGTTGACTACATCCCAACAAGACTTAGGATTATTGAAGGGGTAGCAGATCATCACTTAGATGATCTCTGCTTTCCAATTAGACTATGCAACAAAAACACACTAGGAGCCCCTATTGTAGTCCCATTGCAACAATCTGTCCCAGGTAGACAAACTATTGTTGAACACAAGCCAGCCAATAACCGCATGCTTGCACACAACTAAAGGAAACTAGACTATTTCCCAATATGGAGTTTCTTGCTTCTTCAATCTAACTGCATTCCAGTCTTCAGTAGAATCAAATTTTCTTGATTAGGATGGCAACCACAGAAGCCGAAGAACTTTACCACCAACTTCAACCAAGCTTATCAGGCCTTGATGTACATTTTCAGATTTTAATTTAAAAAAAAATAATAAAAAAATAAAAAAATAAAAACTGTGAAATAGACTCTTTCTATTTCAAATGAAACCAAGAGAATCTTGTGATGATGTGGGTGTGTTTTTAGTAAGTGATGTTCATAACAGAATGGAATGGAGTCCATAAGGAAAGTGGTATTATGTACTCAACCAGGGACAAACAAGGACGTGTGAGTAAAATTGGTACAAGAGCACATTTCTAGGAGGAGAGAAATTTGAGTAAAGCTTCAAAGCTATCACTGAATCAAAAATGGGATAAACAAATATTTAATATTGATTTAAGCTAAAAATGGGATTGAGATAAAATAGATAATTTTTAAGCAGCTGGGGTTTTTTTTCAACAGGTTTTCTTAATGTATGGGGTTAATTTTACATTTCAGAGAACTCAAATGGCCTATTCATAAACCCACAAAAATTCCTAACCTTTATCTAAAACTTGGTCTGGAGTTTGAAATTGCTATTAAATATTTGTCTTTTTAACTAATTTGTCAAGTTTTTGGAAATTGCAGTTTGTGTTCTACTTTAGCTTATTATCCATTTTTCATCGCATTATGGCCTTTGTTATTGCAAGGGATTGTTCTAATTGCTCTGTTATAATTTCCAACTACTGAGTGGGTCAAGGGGAAGCAATTGGAAGAAGCTATAACCATTAAGAACACTTGCAGAAATGGCCAAAAAGGGCAAAGACACTCATAATAAAATAATGAAATATGAGATGGAAAGAGCACAAAGAATCAAGCAAAATCAAGAGAAAATAAATGCTTTGGGATTGAAGCATCTGTCAACTTTTTTGCCTAAATATGCAAATGTGGGAAGAAAGAGAGTAAGTGCTCAGGTAGATGACGACGATTGTGTACCAACTATTGGTGATGATGAGTTATCTAGTTCTTTACATAATGAGATGGCACCAAGATGTAGCACTCATTCACGCCGTGAGGAATTTACCCCAACAGTCCAGCATAAGGGCCCATTATTGAGACTACTTTGCAATGGAGATTCTGAGATGGCTCATTATAGGCGTGAGGAATCTACCCCAGCAGTCTAGCATATCGGCCCATCATCGAGCACACATCTTGGTAGAGATTCTCTTGTCGAAATTTCTACTAATGTAGAGGCACAGCTTGTGGGCACACCGTCTACCACAGATACATCGACTAGTAGACGTGCCCGTGGCATGACTCGTGGATTAAGGGTACGAGGACTTGTTGAGAAACATAGGAAGCTACCGGTCCTCATTGCCCCAGAGTTTTGTGCTCCTGTTGGTGAACATGCAGGGAAATTTGCTAGCCAAATTGGTGTACAAGTGCGTACGAACTTGTCCACTATGAATGCTTATAGTTGGAAGAATATTGATAGCGGTGAAAAAGAGGCGATCATTCAAAATGTGGCGGATCAATTTGATATACAAGGAGAATCTGTACTTGTCAACAAATCTCTAAATACAAAGTGTGGTAAATTATTGAGCAGCCACTACTACAAGTTGTTTACAAAATATAAAAAACTTGTAAAGGATGAAGGAAGCACATATGCAAGAAACCACCCACCAAAAAATGTCACACGAGAAAAATGGATTGAACTAATTGATGGAAAGTGGAGTGATGAAGATTGGCCGGCAATTAATACTTCGAAAATTTTAATTACAAGTGAAAAAGTCTCAACAAGAAATGCTAGAAACAGAAATAAAGAGGGAATGCTTGACAAACACATTCATAGATGTGGAAACAAGTCACTTGCAATTAGAGTGGATGAGGCAAGACGGAAAAATGGAGGTCATATTCCTAAGCTGGCACAAGTCTACTATGATACTCACTTCAATTTAAAGACAAAACAGTGGGTACACCATGATTGCGAACATACATATCAAGAGATGTTGAGAGTACAAGATGAGCATTGTAGCACTCTTGAAGCACAACCTTTGACCGAAGAGGAGATATCTATGATGGTTCTTAAGTCGAGATCTGGCTATGTAAAGGGACTTGGCATGAGGCCTTCCTCGTCTCTTAGGACTCTTGCCTCATCTTCCTCAACTCCGTATACTCAACAACTCGAAGGTCGAGTAGAAGAGTTCCAGGATGCAAACTACAAGCTGGAGGGCCGAGTAGAAGAGCTCCAAGATGCAAACTTCAGGCCAGAGGAGAAGATGGATTGCATCATACAATATTTGAGGAGCAAGGGCGACAATGACATTTGTGGTAGTGGGGGGAGCTCATCTACTAACTAGAACACACCTTGATATGGGATTGGTGACAGAAAGATAGCTTTTGTGGGACTACTTGAACTCAAATAATTTTTTGTAAAATTTGGAAGTTAAGACATCATTTGTATATAAATGGTTGTAACTTTGTGAACATCTTTATTACGTTTTTAGATTGTATGGATGTATTTTTTATGGATTTGGTTAGAAATGAATGGATTTTTATTTATTTTTTT
>XM_035972485.1 PREDICTED: Aplysia californica uncharacterized LOC101852208 (LOC101852208), transcript variant X5, mRNA 
GCATGAGGAGTGAATTTTACTTTTAGTTTTAGTGAATTTAGTCGCTATTCCTCTTGACAAACTTGTTTTACAGTGATATAGTTCAATAAACATTAGGTCGTGCACTTGACTGTATGTTACATGAAAGGATAAAAAAGTAACTAGAAATCTTCCCCCTTTCTGTCCTGAAAAAAAAAAGCTCTTCACTCCCATTCTATTTTCCCTTTAACAACAATTAATTAATAAACTCAAGCCAGCCCAAGCGGATTTCTTGTTTCGTAAAATTATACTAACCCTAATCATACATTTTTAGAGAATTAACAAATAGTTACTTCCATTTCTAAAGAGCAGTTTGGGTATTAATGCGCTCTCTTGGATACCAACAAAACAAGTGACTTAAAATAAGAAAAATAGATATGGTGTCAACGTTTTAAATATTGATATCGACTTATTTTATTACTAATAAGATCCATTTTGGATCGAGAAATGAACATATTATATTGTATTTTATTAAATTTCTTGGAACTATTTATGTCCTTCTGAAAGGCGCAGTACCACATTGTTTATGATGAAGTAAAGTGGCGCCTTTCATTTTTTTTCCTATTGACTAAACGGTGAAAGCAATATCGAGTTTTTATAATGTATAGGGTCTTTTGATAGTCAAACAAATGTGCCAAGGATGTCTTCGAACGAAGTTGTAAAGACCGTTGCCAAAAAGTTGAAATACTACTTTGAGATCAAGCGTCTAGAGGATGGCTTTGATTTATCAGATGTGCACCAACCCCAACTGGATCACCCTCCTTTGAAAGCGCGTCCAGCACTTCAGTATGAGGGCCTCCATGACCGTGCCCTCAAGCACTACTTCAGCCAGCCTGAGGTGCGCGTGCAGCTCACACAGATGCACGGGCCAAATGGAAGGGGCACATTGCATGGGCGGAGGGAGCAACAAGTTCGCAAGATGCTGGACAACTACATGAAACATTACTCCTTCCAGGAAGAGTTTCTGAATGCCTCCCCAAGAAAACGTCCGGCCAGCCCAAAGAAGAACACACTGCCCAGCTGCTACTACTACCACACACCCAAGGGCTGTAAGATGAACACCAAAGCCACTGGAGTCCTCCATAGAGCCAAAAAACCGAAAAATCTGATTGGAGGCTGGCCTACCCTGAGGTCTGTCCCAGACCAGCACATCTCCAGAGGGGAGGCCACCAGGCTGGTCAACTCAGCCACCAAGATTCTTGTGGCCTCAGCCTATGATGACTCCTACATCGATAAACCCAGAGCCACTTCAGCCCAATCTCGGCCAAGATCACCAACTCCATCCCAGAGCACAGCAACAACCACGTCAGCGACAACTGCCACAAGCACGTCCACCGATGATCACCCACCCGTGCGGCCGCAGTCAGCCAAGTACCGATCACGCACAGTCATCAATGTGCCACAGCGCAGGGCCCAGGAGGAAGTGGCTGTGATCAGGGCTACTCAGACGGCGGCTGATTTTGACGTGGGAACCAAGCATGATCGGCAGCTGCTGGAGAAATATGACAAGCTGGAGGAGGAGGTCGATGATGGAGCATGGTGTGAGTACCAGGTCTATGTCTGCACGGGCACGCGTATTGGCTCCAGCACAAAGGCACCCATCAAGCTGACAATGTACGGGGAGAAGGGCAGAACAAAGGAGTTCATTCTCAATGACTCCAAACGCCACAAAATCCCATTCCAGAAAGGGAAGGAAGATCTTTTCATGCTGGCGGCGCATCACATTGGTAGGATCAGGAGAATACAGATTGGCCACGACAGGCCTGAGCTAAGCTATGCATGGTATCTGGAAGGGGTCACTGTCTACGACATGCATGCAAGGAGGATTTTCCAGTTCCCCTGTGAACAGTGGCTTTCTGGACAGGCCGGGGATAAGAAGACATACCGTATGCTTCAAGTTGATCGTGAGAGAGAGTTTATTGATGCACTGGGGGATGAAGCTGGCTTGGAGAAGTCCACGAGAAAACACAGATACTCTGCAGAGCCAGAATCATCGACACCCAGTGAGGCGTTCCGGTACCAGCCGAAAGGAGAGGACAATGTGAGCACACGGGTGCGACCGGGCGATGACTACAGCGACACCGACAGCTCTGACAGCTCTAGCTCCGGCCGCTCACAGGACGCCGAAGTTCCTGTCAATGAGCATGGCTCTACGCCACGGCAGAAGAAAAAGGTGGCTAAGGACGACTACGAGGAGAAGACACGGGCTGGGACTGTGATAACGCTCCATTCTGCCACTGACTCCCAGCAAGTGGACGAGATCTTCATGGAGCCCAAGGGACGAGCCGCTAATGCCAAGTCTGGCTCTGATTTTCTAGAGGGATATAAGACAGCACTATCTGCATCAGAAGCTGAGAAGAAGAGAGGGCTTGAGCGAGAAAGAGAGATGGAGCGAGCATTGCTCCAGGGCAAGAGTATTCACGAGGCAGTGCGGGATGGGGATGTGGACAGAGTCAAGGATCTGCTGCACCATTTCCCTGAGATGAGAGATTTTAAAGACGAGAGCAGCTGGACACCTTTGCACCTCGCAGCTGCCAGAGGAAACATCGAACTTTTGAGATGGCTACTGACCAGTGAGGCGGACATCAATGCAGAGACGTCCACAGGCTACAACGCTATGCACATTGCTGCCATGAATGGCCATGTCAGCTCCATGATGTTGCTTCAGGCGATGGGATCCTCCATATTTGGCTTGACAGCAGAGAAACAGTCGGCTCTGCACTTGTCTGCTAAGAGTGGTCATCTGGAGTGTGTCAAGTGGCTTGTGGCCAACCGTGCCTCTCTGCCAGCTGAGGATGCCTTCGGTCGCACGGCTCTCAAGTTGGCCGAGGAGTTCCGTCACGATGCCTGTGCTGACTTCCTGCGCATCTGCCTCCGGGAGCTTGCCAACCCCCGCAGCACGTTTGCCATGATGCAGGGACAGAGGTTGAGCCAGAGTGGCCTCCCTCCTATTGAAGAGGACACAGGCTCTGCCTCCAGCAGCTCACAGTGGAAGGACGATGTGAAGGGACACTCAGCCTCAGAGGATAGTGAGAATGAAAAGAAGAGCCAGAGAAAGTCCAAGGCTGAAGAAAAAGAGCTGGAGGAAAAACGGAAACTGTACAAGGAGCAGCACGAGCTGATGGAGGACAGAGGGTTGTCTTTCCTTGATAGCATCAGACAGGACGCAAGCAAGGCATAAAGCAGGAAAGCAGGAGTGAAGGAATGGAGGAGAGAAGGA
>XM_048336008.1 PREDICTED: Perognathus longimembris pacificus SH3 domain containing kinase binding protein 1 (Sh3kbp1), transcript variant X4, mRNA 
TTTCGTAATTTCCACTCACGGAGAGCAGGAAACCCGGTGCAACCGGGCGCAGCGGGCCGCGATGCAGCAGCAGCAGCAGGAGTCGCCCCAGGGCAGCAGCGGTAGCAGCAGCAGCAGCAGCAGCAGCAGCAACAGCAGCAGCGGGCGGCGCTGAACCCCCCACCGCCGCCACTGAGGAAGAAGCCCGCCCAGTCGCCGCCGCGTCCTGACGCCCGCACCCGGATCCCCGCGCCCCGATCCCGGCGCCCAGAACCTCACGCCCGCCTCCGCCAACTTTCAAGCTGCCTCGGCGGCCCGACCCGGCTCGGCGCCAATGGTGGAGGCTATAGTGGAGTTTGATTACCAGGCCCAGCACGATGATGAGCTGACAATCAGCGTGGGTGAGGTCATCACCAACATCAGGAAAGAGGATGGAGGCTGGTGGGAGGGACAGATCAACGGCAGGAGAGGTTTGTTCCCTGACAACTTTGTAAGAGAAATAAAGAAGGATGTGAAGAAAGACCCTCTCACCAGCAAAGCTCCGGAAAAGCCCATACACGATGTGTCCAGTGGAAATCCTTTGCTGTCTTCTGAAACAGTTCTAAGAACCAATAAGCGAGGTGAACGACGGAGGCGCCGATGCCAGGTGGCATTCAGCTACCTGCCCCAGAATGATGATGAGCTTGAGCTGAAAGTCGGGGACATCATAGAGGTGGTAGGAGAGGTAGAGGAAGGATGGTGGGAAGGTGTTCTGAATGGGAAGACTGGAATGTTTCCTTCCAACTTCATCAAGGAGCTGTCAGGGGAGTCGGATGAGCTCGGCATTTCCCAGGATGAGCAGCTTTCCAAGTCAAGCTTAAGGGAAACAACTGGCTCCGAGAGTGATGGGGGTGATTCGAGCAGTACCAAGTCCGAAGGTGCCAACGGATCAATGGCAACTGCAGCCATCCAGCCCAAAAAAGTGAAGGGAGTGGGCTTTGGAGATATTTTCAAAGACAAGCCAATCAAACTGAGACCAAGATCAATTGAAGTAGAAAATGACTTTCTGCCAGTGGAAAAGACTATTGGGAAGAAGTTACCTCCACCTGTGGCAACTCTAGACCCATCAAAATCAGAGATGGATAGCAAGACTAAGACCAAGGATTACTGCAAAGTAATATTTCCATATGAGGCCCAGAATGATGATGAATTGACAATCAAAGAAGGAGATATACTGACTCTCATCAATAAGGACTGCATTGATGCAGGCTGGTGGGAAGGAGAGCTCAATGGTAGACGAGGCGTGTTTCCTGATAACTTCGTGAAGTTGCTTCCAGCAGACTTTGACAAGGAGGGGAGTAGGCCCAAGAAACCACCTCCTCCATCCGCTCCTGTCATCAAACAAGGGGCAGGTACCACTGAAAGAAAACATGAAATGAAAAAGATACCTCCTGAAAGACCAGAAACCCTTCCAAATAGAACAGAAGACAAAGAAAGACCAGAGAGAGAGCCAAAACTGGATTTGCAGAAGCCCTCGGTTCCTGCCATCCCACCAAAAAAACCTCGACCACCTAAGAGCAATTCCCTTAGCAGACCGAGCGCGCTGCCTCCGAAAAGGCCGGAGCGACCAGTGGGTCCGCTGACCCACACCAGGGGTGACTGTCCCAAGATTGATTTGGTGGGAAGTACTCTGTCTGGAATTCTGGACAAGGATCTCTCTGACCGCGGCAATGACATTGACCTAGAAGGTTTTGACTCTGTAGTGTCATCTACTGAGAAACTGAGTCACCCTACCACAAGCCGACCAAAAGCTACCGGAAGACGCCCTCCATCTCAGTCGCTCACCTCTCCAGGAACCATGGCAGCAGGCAGTGGCCCAGCCTCGCTGACTTCACTGGCTTCAGTCCCCCTGTCATCTTCTATGGGAGCACCCGGACACCGAGCCAATTCCCCATCTCTGTTCAGCATGGAAGGAAAACCAAAGATGGAGCCGATAGCCAGCAGCCAGGCGGCTGTGGAGGAACTCCGGACACAGGTCCGCGAGCTGAGGAGCATCATTGAGACCATGAAGGATCAGCAGAAACGGGAGATTAAGCAGCTACTGTCCGAGTTGGATGAAGAGAAGAAAATCCGCCTTCGTTTGCAGATGGAAGTGAATGACATAAAGAAAGCTCTTCAATTCAAAGTGAATACTTGATAATTGAGATTTTGCATTTTTCATCATGAGTCCAAGACTCAAAATTTTCTGCCCCAGCCAAAATGAATCCTGTGCCAAAAGGTTACAGATTTGCCATCACATGTCCCTGTTTAAAAGATTAGCACAAAAAGTCTTGATAGCACAACACAAATTCCATCCAAGAGGAGAATCTTCCCCATGGTTTAGGCCTGGGTCTGGCACTGGTTGTGACTTAGAGCAAATTGTGCTAAAAAGGCTTTTCTACCTTGAGATCTCATGTGAAACGAAAACTCAGGCAGTTTAGTCCATAGTGGTACTATTTTGATGATCTTTTCCATTAATGAAATGTAATTTCAGATTATTCTTTACAAGCTTTATAATTTTATGATTTTTTTAACCGTGTTTTGTCACAGAAGCCCCTAGCGTTTGTATTACACCTAGTCAGAAGCGAGAGTCTTGGTCTTTTTGCTTCAGGCAGAAAGCTGCCTGGCTTTATGTTCCCTTTAGGATTCTATTTACATATGCAATTTTAGGTCCAACCCTCCCTTCCCCTGCCAGCAGACCCACCCCCTAAGAGAAATTTAGCTTATATATGATGGTATATTTACAAAAAGAGAGAGAGAGAAAAAAAAATCTGGTATTTGCAATGATCTGTGCCTTCTTTTTACCACCCTCTTGATTGGAGTTTTTGTGATGCAGCTACCATGATTCAACAAATCAAAAAGAAAGAAATGAAAATCTACCACTTCTCCAAGTCCACTAGAGGCCGCTGTGTTCGCAGTTTCTCTCACCCTAGCCAAAGGTCCTAAGAGGAGACAACTGAGATGTCAGGCGTGTGCTGGATCAGACCACCTGTGACTTCTCAGTTTCTCCTACTTTGAGGTTGTTCATGAAATGAAAAATGGCATCCCTGCTTGATTTTTTTTTTTCATCAGCCAAGTGAAATCCCTGCTTCCTGTCCTTTGGCGCCTTTTTTTTTTTTTTTCCGTGAACAGCATATGCATTATTAAAGCAAAGCTAAATAAAAGTTCAAATGCAAATGAAAACAAGGGGGGGAAAGTTGTATTATTTCCTGCACTGGGTAATCCATGTGTGTTATTGTTTAAAACTGTATTCACACAATGTCATTTTGCCTTGCTCACTTGTAACCCCCCTTCCTCGGGTCCAAACGAATGGGACGAGGGTCTTGTTGAAGTGCAGCCAATGGATCTTTCTTGCATTCATGGAATTGCTTTTTTTTTTTTTTTCCTTTCTGAGGGAATTGATGTTTGCTTGTCTGATTTAATCTTTGTAGCACTTGGAACAGTTCAGCCTTAGATTATGTAACTGTTTTTCCTCATCCTCTGCTGAAAAACTATGGGGCATACCTTACTGCAAGATTGTTCAGGGGTTAGAGGTGGAGGGGCTGGTCCCTTAATGGCCCCAACAATGTCTGATGTGTTTCTAAGCAGCTGCTTTGTCTATTTCTTGCATTTTATAGTGAAAACTACTCAAAAAAATGTCATAGATTTGCACAACTATGAAGAATGAGAAATGATGTCACTAAAGGAATGATGCAAAAAAAAATCACATTATTCATCCTTGAAAATAGAACAAGTGTCTCTTTCCTTTCTCTTCCTCTCTCCCTCCCCTTTGCCTTGCTCTTGCCTGCATACTCCTTTCTTTCCTGAGAGTATTTACAGAGCCCAACGCCCTAGTCTTCCTTGGTGGGGACACAGTTAAGGGAAGGGAGTGTGTAAGGAGCCAGGCACCTTTTGCTCCGAGTGTGGCTATATGTACGGCTTGTGCAGCAGCCTTGGCCTCAGTGTGCATGGGGCTGGGAACAGCAAGTTTCTAAGGGCAGCACAAAACATTCCTGTCCCCCTTGAACTGTTCTAAGCATTTCTGCATTACACTTGAAGCCTTCAGAGATTTCCCACCACCTAATAGAACAATGAAGATTGGATTCTTTGGTGTTTGAATTTCTCATTTCTACATCAAGAAAATCCCAACTGATATAGCTTTATCAAAAGTGCATACAGAGTAAGATTGTGGACAAGGAAACGGCAAGGTGGAGGTATCCTCGGTGGGGCATTGGCAACCTGGAATGTGTAGGGCTGATGTCAGCGCCTCAATAGAGGCCATTGGCTTTCTTCATTTAAAGAGGGGAGAAGTAAGTGATTGTAAAAAGAAGTTGCCATTTTCCAGCCTCCTTATTGTCCCTCGGGCTAATCAGCAAAGAGGATTCTGCATCATGGGACTGGGTGAGCCTCTGCTTGAACGGCTACCATCTTTACTCTTGTCCATATGAATCCATCAAGGAAAGCTTG
>XM_001582328.2 Trichomonas vaginalis G3 uncharacterized protein (TVAG_2v0998720), partial mRNA 
ATGAGTGAACTCGCTGTAGACGCACCAAAGGTTGTTGAAGCTTTCAATGGCGGCCTCACATGGCTCAACAGAAAATCAAACTCCCTCCAGAAGTTCCAACTTGACAAGATTTTAAGCGCTAAGGAAGAAGCAAACGGCGAGCTTATTATCGAGAGCAACCTCAAGATGTTCAACAAGGATCACCACTTCAGATTCGTTATCGATACATCCTTGGCACCAACAAGCCCAGAATACTTGAAGGACTTCAAGCAATTATCTCCATAA
>XM_018438955.1 Phycomyces blakesleeanus NRRL 1555(-) hypothetical protein partial mRNA 
GCAAAAACTCCCCCCCTCTTTTTTTTTTTTTTTCTTCGTACTATTTTTTTTTTTCATTTATTATTTTTTATTTATTTTTAAATACTAAATGAATGTACCAGAACAACAGCTCCATGATGACCTTGTCAAGGACTGGATTCTTTCAAGTCGTAATGAAATCGATGCGTCCTTCATGGCTCACGTTTTATTAATGACAACAAAAAGCTCGACAGGGTTATCAGATCTTGTCAAGTTTCTCTCAAATTATTGGAAGGATGAAATTCACCGAGGAAAATGTGTCGAATTACTTACCCAGGTCACAACTCATAGTCGTTCCTCTCTTGATTATGAGACAGTCGAGGTGTTGATGTCATTCTCATGCGACCGTTTAAATGACTCTACATCAGTTCTCCGTCTTCTTGATCTAGTTGATGTCCTATGCTCAACACCTCATTTCGATGGCCATTACGCTGTCATGTTATGTCAATCAATCTTTCGACACATTGGCCAGAAAAAACAACCTCAGGGAACTCGCCACAAGATATTCTCACTACTCAACAAGCTTCTTCAGACTTACACTTCCGATCTACAACGTGCAAGAGTGAACTTTATTGGTAGCTTCGTAGCTTTTATGGATGGTGAAAAGGATCCACGTAATCTTGTGATTGCATTTGAAATTGTTCGATTCATCATTGAAAAATTTGACATTTCACAGCATGTTGAAGATTTATTTGACGTGCTCTTTTGCTATTTCCCAATAAGTTTTAACGCCCCGATTAATGACCCGTTCAGTATCACCACCGAAGACCTGAAGGACAGCCTCAGACGTTGCTTGGCTGCCACACCTTATTTTGCAAACTATGCTACTCCTTTACTAGCAGAAAAACTATTGAATACGACTGGAAGTGCCAAGAAAGATGCCATGGAAACAATTGGCCTTTGCGCTCCCGCGTACGGTGCACACGCTCTCTTACCACACGCAAAAGATATATTCGATGCCCTCGTAAACGAAGTCTATCATGCAACCGAGACCTCAATGGAGGCCACAGCTCTCAAGACCATTCATAATGTTGTGGCTACTCTAGGAACTGGTGTCAGCATAGCCAACATCAGAGATCCTGTAGAGAAAACCATTGATGCCTTACTATCCCAATGCGTCGAGAAACTTAACGAACCCGAACTCAAATATGCAAAAGCTGCAGCATTGATTCTACGTTCTGCCGCCTCTGCATCAGATCCTGCTTGTACATCTGTAGTACATACGACCTTCCCTATCCTTCACAATATGTTTAAAGATGCCAATTCTCTCAGTCGACAGCTCGCTGTTCTTGATATCTTTATCGAGATTCTATTTGCAAGTAAGAGTCTTTATGGCTCAATCGAGGATATTGGATTTGATCGAGATTTCCAGACCCCTTTGCTTTCTTACAAGAAACCGCTGTTGGATATCTTTATCACATCTTTGAATATTCGTTCTGATGAAGGACGTGTCTGTCGAATGTCTGCCTTGAAAGGAATTCGCCAAATGGTTGTTATGAAGCAATTCTTGTCGGCAGAAGAGATGGAGAAACTTGTATTGCATCTCACCCAGTTGATTCCAGACACAGACGGTGAATTAAGAGCGCTTGTTCTCTCTTCCCTTTCTGTATTAGCAAAGTTGAGTCTCCCTGCACTCTCCAAATACACCTTCCCACTCCTGTGGAGACTACTTCCAGGACACCAGAAACCAGACAACAGCAACTACCATAGTACCCTTGAAGCCGTCGAATACTTGACGATCAACCCCACCATTTTCAACACCATCGTTGCCTCTTCTCTATTGGACAAATTTGATAAGTCCTGCCGTCTATCTGACCAGTCGCGAGACTACGTTTCCGCGTTGGCTAAAACTATGCTCAATTTATTTCAAACTATGGCCCCAAAAGACCCAAAAACTATGCAACTAGGACAACGTATTTTTTTCCCTCACATTATGTCAGAGTGTATCAAATCTACTCTTCACTATCCAGGTTCATGGCTACTCGATACCCAACTTGTCGATATATTGTCGCTCTTTGTGGCTGGAGTCGTAAAGAACTCCAATTCAAGTCATCAAACAGCACTGACTGCAATTGCGTTCCGTCTTTTTGTTAATGGTGATCTGACAGCTGTTAACCTTCAATCTACAAGTGATCCTACCCTTCGTCTCTTTCCTTTATCAACCGTTGTTCTTCCTATCCCATCTTATAGTGAATTCATCCAAGGACTTGTCCAGGCTGCGTTAAATACTCCATGTAGTGCCAAGAGTCTAGCGTTGACAAAATCCTTTGCCTCAATTGTAAACAAGTGGGGAAATGAAAGTGTAATGTCTTGTGTGGACAATATTATTCCTACCTATCTTATTCCTGCCTTGGAATCCTCGGATATCAAAGTAAAGAAGGCTGGGTTATTGCTTCTAACATGGTTGGCCAAGGCACTCGTTATTCAAGGACATGCTTTGGGTTTCCAGATACTTGACATTATTGCAAACCAATGCCAATTACCTGATGTGGGGCGCGAGGCTGCAAATCATTTTTCTACTATCCTTCAAGACGACGAACTTATGCTCAACAAAAAATCCTATGCAAATGTTTCTATTCTTTACAGACAACGCGTCTTCAACTACTTGGCCCCAAAACTCATCGAGACAGCAAATATATCTTCTGCAGACTCCAAAATCAATTACTTTACCGCACTCTCTTGTTTGCTCGTGAACGTACCTGATTCTGTAGTTGCTAGTGAATCATCAAAGCTTATTACCTCTATCAATGCCTCCCTTTTATTGTCTGACTCCAACCTCTCCTTGTCTATGATCAAAGTAACACGCGTCATTATTGCCACTTCTCCAGAAAAGATCGAACACGCCACATCACCCACTATCGATGGACTGCTACACTCGGCTGATCCTGCTCACAACCTCTCCTTGCCCGTTCGAATCGAATCTATCCAATGTCTAAAGGATATCCCAGATAAATTTAAGCCAACAACCCTATCGCCACATGCACCCATTGTAGTCAAGCGACTTTGCAGATCCTTGGATGACAAGAAGCGGCTTGTTCGTAAATATGCCGTTGACTGCAGAGAAAGATGCTCGCTTTTACGGTATCTTCTCGGAGCATTTTCTCAGCCACTTTGCATTAAAAGATATATCAATAATAGAATGACAAGCCTTCTGTTTTACGATTGTATTACCTTAAAACTCGAGATTTTATGTGTCGGTGATCCTACATAA
>XM_023978471.2 PREDICTED: Salvelinus alpinus phosphatidylinositol glycan anchor biosynthesis class Q (pigq), mRNA 
CTGTCTGTCTGTCTGTCTGTGTGTCTGTGTCTAGCTCCGCCTTGTGGTAGTGATGGTCCAGGGAGTGGTCCATCTCAGTGTTGACTTCATCAACTCCTTCCCTCTGTTCGCCATGGGCCTCCGACTCTTCAGATCCTACAGACTGGCAGAGGGGGTGAAGTTCAGAGTGCTCTGTGAGGAACCAGGAACACCTCTACACCTCATGATGGATATTAACCCTCTGAAGGTGAGCAGTGTGGTTCAGACCTACAGGACCCCCACCTACAGCTGCTACCCTAAAGACTCCTGGCTGGCCCTCTGCAAGAAGCTGTTCCTGGGAGAACTCATCTACCCCTGGAGACACAAGACTACCAAGATAGACTAGGACCAGGGGGGAGAGACAAAGGGGA
>XR_002711448.1 PREDICTED: Cucurbita moschata uncharacterized LOC111448527 (LOC111448527), ncRNA 
ACCAAATACATTGATCGAATGGCGCCTTCTTCCTCTAGTGCCGCCGAAGCATCGTGAAATTCTCCCCTCCTTCCTCCTGTAATGCCGCAGGATCGTGAATTCATTCTCTGTCTCCTTCACTGACTCTTCGACGAGCTGACGATTCGAGTTGTAAGAAATCCGCTTCGAGCCGTAGTCCTAGTCCTTTACGAATTTGGAAATCATTGAAACTTATCATTCAGACTAGCATTGTTGATTGAAAATCCGAGTCGCAGAGGATAATCCAAAAGCCTTGTTTAGTGCACCGATGAACAAATGTTCGACGCATTAAGGCTATTACAGACAGGATTTTAGTAAATAGACAGGATTGTATTAAGCACTGTCTTTTTTCTATGACGGAGATGTGATGATCTTTACTCCAAATGGACTTCCACAAGTATACAACGTTCTTCGGACATCGTTACGAGCGTTAATTGAGATTGTTCGTTATGAAGGATTAGGAAAGGAGGGAAAGAAGATGCAGGAGAAGAAGATGGAAGTAAGAGGAATGGTGAGTTACAACCCGAATGAGCGAGAGTTGACCAGGCTGAGAATCATCATTTATTATTGATGTGACTCGAAAGTCGAAGACTGAATTATAAGGAAATTCACTCGATGATTATTACTCAGTAAGCAGGTAAGTCTTCTATTCTTTTGTTATATAATCTGTTGCATCCGCTACCATCTACATTTCTCGTTATGATTAATCATCATTACTCAGTTTTTGTTGGATGAAATTTGTTGTTTGCTGT
>XM_041901937.2 PREDICTED: Coregonus clupeaformis protein lin-28 homolog A-like (LOC121585613), mRNA 
GGAAAATACACTATTTTCCAAAGAGGGATTACCGAAAAACGTGCACCGATAAACCAGAGTTTATTGCCTGATTCTTCTGGAGTTGTATGAGGCCCAGGAACCCCCCAAACCATGGCAGAAGGGGGCTGTGCAAAGACCGAAGAGGAGGAAACCACGGGCTCCGAGGAGGATCTGGGTTCGTCTCGTGGCAGCGGCGTGTGTAAATGGTTCAACGTCCGGATGGGTTTCGGGTTCCTGTCCATGACCAACCGAGATATGACACCGCTGGAGGAGACTGTCGATGTATTCGTTCATCAGAGCAAGCTGCACATGGAGGGCTTCCGTAGCCTGAAGGAGGGCGAGGCGGTGGAGTTTACCTTCAAGAAGTCGTCTAAAGGCCTAGAGTCTGTTATGGTGACGGGGCCAGGGGGAGCACAGTGTGTGGGCTGTGAGAAGACACCCAAGGGGCAACAGAAACGACGCTCCAAGGGGGACAGATGCTACAACTGTGGAGGACCTGACCACCATGCCAAAGAATGCCAGCTACCTCCTCAGCCCAAGAAGTGTCATTTCTGCCAGAGCATCAGCCACATGGTGGCCAACTGTCCAATCAAAGCACAGCAGTCCTTCCCTGGCTCTCAGGGAATAGCATCATCATTGAGGGATGAGAAAGAGGAGCAGAGCCACGCCCCCTTGCTCCAGAGGGAGAGCACTGAATGATCCATTCAGGGATTCAGCCAATCACAAGGTTTCATTGTAATGCTGCTTTTGGAACTACATCAGGCTGTCTTTATTCATCGAACTAACAGCAAGAAAATGGTAAATTTATTGATGCGATAGTTGAGATTGAGAGTTAGCTCTGTGTTTTAATGCACAGAGAGACACATCTATCCACCTTCTTTGCAACTCAAATACTTTAAAGTAATTCCTTTTCTGTCTATGAAGTTATTATTTCTGCATTAGATACTGAAATAATCTAAACTCACTGTGTTTACAAACTGCAATAAGCCTTGTATTGTCAGTTTTTACCACTGTACGTAT
>JN498124.1 Uncultured organism clone SBYZ_7200 16S ribosomal RNA gene, partial sequence 
GTTAGCTTTGGCTATATGGATCAAAGGTGGCCTCTGCATGCAAGCTACTGTNTGGGGATGAGCCCGCGTACCATTAGCTTGTTGGTGGGGTAAAGGCCCACCAAGGCGACGATGGTTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGGAACACGGTCCAGACTCCTACTGGAGGCAGCAGTGAGGAATTTTGCGCAATGGGGGTAACCCTGACGCAGCAACGCCGCGTGAGTGATGAAGGCCTTCGGGTCGTAAAGCTCTGTCAAGTGGGAAGAACCCATTCCGGCACAACAAGCCGGGGTGCTGACGGTACCAATGAAGGAAGCACCGGATAACTCCGTGCCAGCAGACGCGGTAATACGGAGGGTGCGAGCGTTATTCGGAATTACTGGGCGTAAAGGGCGCGTAGGCGGCCGATTAAGTCAGATGTGAAATCCCGGGGCTTACCCCCGGGAAGTGCATTTGATACTGAACGGCTTGAGTATGGGAGAGGGAAGTGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGACCTCCTGGACCAAATACTGACGCTGAGGCGCGAAGGCGTGGGGATCAAGCAGGATTAGATACCCTGGTAGTCCACGCAGTAAACGGTGATCACTAGGTGTAGCGGGTATTGACCCCTGCTGTTCCGGAGTTAACGCATTAAGTGATCCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGACGCAACGCGAAGAACCTTACCTGGATTTGACATCTCGGGAATCCCGCGGAAACGCGGGAGTGCCCTTCGGGGAGCCCGAAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCTTCAGTTACCAGCGAGTAAAGTCGGGGACTCTGGAGATACTGCCCCGGTCAACGGGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCTTTATGTCCAGGGCTACACACGTGCTACAATGGGCTGTACAGAGGGAAGCGATCTCGCGAGGGTGAGCCAATCCCAAAAAGCAGTCCTCAGTTCGGATTGGAGTCTGCAACTCGACTCCATGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGCGCTACGTTCCCGGGCCTCGACACACCGCCCGTCACACCATGAGAGTTGGCTGTACCAGAAGTCGTCGG
>GU967443.1 Rosa rugosa putative MYB transcription factor (MYB4) mRNA, complete cds 
ACTTTGTATAACCAGCCTCTTTCTTTCTTTCATTCACTCTCCCTTCCTCACAAACACATAACACACTACGGGAGCAGCCATGGCTGGTGTTGCAGACAGTGAGTACACAAGTCCTAATGAAGAAGAGAATGAGATGAGAAAAGGGCCATGGACGCTTGACGAAGACACCCTGCTCATACATTACATTGCCAACCACGGCGAAGGACATTGGAATGCCTTAGCAAAATGTGCAGGATTGAAGAGGACAGGAAAAAGCTGCAGATTAAGATGGTTGAATTATTTGAAACCTGACATCAAGCGTGGGAACCTCACTCCACAAGAACAACTCTTGATCCTTGAACTCCATGCCAAGTGGGGTAACAGGTGGTCGAAAATAGCACAACATTTGCCAGGAAGAACAGACAATGAGATTAAGAACTACTGGAGAACAAGGGTGCAAAAACAAGCGCGCCAACTTAATATTGAGTCTAATAGCAAGAGGTTTCTTGATGCGGTTCGATGTTTCTGGATGCCGACTTTGCGTCAGAAGATGGAGCAAACTTCTTCACTTAGTTTAGACCCACCTTCTTCTTCTTCTTCTCATTCTAATTACTTGACTTCTCAGATCTCTATAGCTCCTTCTCTGTCGACGTCTCCTCAAACTTGCTCGGTTCCTTCTTCTCCACCAAGCAAAGTGGTCTCACACGTATCTGATTATTCCCCAATTGGAACTTCAAGCCCAAGTCATAATAGTCTTTCCTCGGATTCTCTTATTTCACAGCTGCCTCAAATTACAGAACAACCAGCAAGTTCATCCTATGCCTTTGAAGCTCTAAATGACAATTATTATGTGGACTATGACATGGAGGGTTTTAGCCTTGACCCTGTTTCAGAAATGGCAACTTTTGACACTTCACAGTTTGATTGCCAGATGGCAGAAAGCGATTGGATACCAAGCAATTACATGACTGACACTTTATGGAACATGCAGGGGATGTGACAATTTGGGGAAAGATACAAGATCAGATGGGGCATCAACGACTAGAATTCATAATTCATATTAGGAGTCTAAGGGTGTGTTGTAATCTGAGTGACCCTTTCATCTATAGGAACCTTTAGTTATATA
>XR_007259806.1 PREDICTED: Pyrus x bretschneideri uncharacterized LOC103929507 (LOC103929507), transcript variant X5, ncRNA 
CATTCTTTTCCCTCATTGGTACCCATCCTTTTCGATCTCTATCTCGCAGAAGCCTTTCTTCCTTGTGAAAGTGTTGCTCATCGTGGAAGGAGAGAAGGATGAAAAATGGGGCTCTTCCATTTGCTTCCAGAACAGATTTCTCAAGCTCTCTCACTTAAGCCGCGAACTCCTGGCCTCCGTAAGAAGAAAAGCTTGGCTCCCGTTCTGATTTGAGGAGATTTTAAACCCATAAAAGCTTGGGTTTCCAGCTTTGAAGAAGAAGATAACTTCTTTCACTGCAAGGACTTTAGACCTCTGATCTTCTGGCCTTCACGCAATCTAGATCTTCACCGTCAATCTCACTTGGGCTCTGCATTTTGTGAAGACAACTTCGTCGCTAAGATTAAAATAGAGATTGTAGTGAGCAAAGACCGGGAACCCAGAAGAGTCCCGAATTCAGTTTCCACTCTGACTGAAGATGGAACTTGGTGCTATTAAGCTATCATCCTCAGCTTCAGAATTCAGGCCTTGTCCATGTAAGGAGTTGCAAAACACCAACCAATGATATGAACATGGTAGGGTCTTGAAGCAATTCACCATTGTAAGGAGCAAGTTTAGAAGCACATGAAGGCGATGCACATGGTTTGGAATCTAGCATGTTGGCTTTTGTTAGGAGATCCTCGACATACTTGGTTTGAACCAAGAAGAGCGTGTCTGCCGATGAGCTTGAATACCAAGAAAAAAGTGCAATGGACCAAGATTCTTCATAGCAAACTGAGTACTGAGCTTGTTGATAAAAAATTCACAATGAGAAGAAGAGTTACCTATAATCAGAATATCATCAGCATAAACAAGTATAAAAGTGAGTGAGTGATCAACCTTGATAAAGAGTGAAGGATCTGCTATAGAGGAACGGAATCTGAGAGCTACAAGACTACGATAGAGCTCCTCATACCAAGCTTGCGGGGTTGTTTGAAACCATATATAGACTTGTGAAGCTTGCACACAAAATGAGGTCTGGGAGGATCTATGAAGTGTGCCATGAAGGAAGGCATTGGAGACATCCAATCGAGTAATCTGCCAATTGAATTGGATAGCTAGAGATAAAACGAGTCTAATAGTTGTTGATTTAGCGACTGGACTGAATGTTTCATGGTAGTCAATACCATGTTGTTGAAGAAACCCTTTAGCAACAAGTCGTGCTTTATATCGA
>XM_014803901.1 Moesziomyces antarcticus ANTH-domain-containing protein partial mRNA 
ATGGCGCGCTTCGACGACCACATGCCCACGCGGCCCGTCGACCGCGACAAGGCCGAGTCCGAGCTCTCGATCCACATCAAGAAGGCCACCAGCACCGAAGAGACCGCTCCCAAGCAGAAGCACGTCCGCAAGTGCATCGTCTACACCTGGGACTACCGCACCTCCCAATCCATCTGGACCGGCCTCCGCGTCCAGCCCATCCTCAGCGATGAGGTGCAGACCTTCAAGGCGCTTATCCTCGTCCACAAGGTCCTCCAGGAGGGTCACCAAGTCGTGCTCAAGGAGGCCCAGGCTCAGATCGGATGGTTCGAGACTTGCGCCCGCACCGTCGGCGCCGACAGCATGCGCGGCTACGGAGCCCTCATCCGCGCCTACGTCAACTTCATCCTCGCCAAGCTCCGCTTCCACCGCCACCACAAGGAGTTCAACGGCCTCTTCGAATACGAAGAGTACATCTCCCTCAAGAACATCGACAACCCCGACGAAGGCTACGAGACCATCATGGACCTCATGAACCTCCAGGACCAGATCGACCAGTTCCAGAAGCTCGTCTTTGCCCACTTCCGCGGCTCCGCCAACAACGAGTGCCGCATCTCCGCTCTCGTCCCCCTCGTCAAGGAGAGCTACGGCATCTACAAATTCCTCACCTCCATGCTTCGCGCCATGCACCGTCGCACCGACGCCAGCGACGCTCTTCAACCCCTTCGCGAGCGCTACGACTCGCAGCACCATTCACTCCGCAAGTTCTACTACGAATGCGCCAACCTCAAATACCTCACCTCCCTCATCAACGTCCCCAAGCTCAACCACGAGCCCCCCAACCTCTTTGAACTCCCCGAAGAGGGTCCCTACCTCCCGCCTCGACAGACGCCCAAGGCGCCAACGCCGGACCCCGGTCCATCCCAGGCAGAGATCGACGAGCAGGCGCGCTTGCTCAAGCAGTACGAAGACAAGCAGGCCTCACTCAAGGCGCAGGAGGAAGCAGAGAGGCAACGACAAGCCGACCTCGCCGCAAAGCAGCAGCGCGACTTTGAGGAACAGCAGCGTCAGCAGGCCGAACAGCAGCGCCTCGCACAAGAGCAGCTCATGCGTGCACAGATGGACCAGATGCAGGGCGGTCGTCTCGCCGAGCTCGAGCGCGAGGTCTTAGCCATGCGCGGACAGTACGAGCGCGACCAGCTCATGCTCGAGCAGTACGACCGTCGTGTAAAGGCGCTCGAAACCGAGCTCGCCAACATCGGCCAGAACTTTGGCGCCCAGATGCAGGGCAAGGACGACCTCATCAAGCAGCTCCAGGATCAGGTCACTCTCTGGCGCAACAAGTACGAGGCGCTCGCCAAGCTCTACTCTCAGCTGCGTACCGAGCATCTCGAGATGCTCGGCAAGTACAAGCAGATGCAGATCAAGGCTGGAAGCGCGCAGGAGGCCGTCGACAAGATGGAGCGTATGGAGCGCGACGTCAAGGCCAAGAACCTCGAACTCGCCGACATGATCCGCGAGCGCGACCGCGCCCGCTTCGACCTCGACCGCATCAAGGCCAGTCAGAAGGAGGAGTTCGACCGACTCAAGCGCGACCTCATGTTTGCCAACGAGCGTGCAGAGGATGCGACGCGCGCCAAGAGCTCCGAGCTCTCGGGCATGATGTCCACGCTCAACCGCCAGATCGCCGAGCTCGAGGACTCGCTGCGCGAGAAGCGCATGGAGCTCGACGCTCGCGACGCCGAGCTGGCACGCATCCGCGACGAGAAGGATGCCGAGCTCGCCATCATGCAGGAGGGTATGGACGCCACCATCAAGCAGCTCACCGACATGCAGCTCAACCAGGGCGAGAGCGACCAGGCGGTCAATGCACAGATCGACACGCTCATCCTCGACAACTCCAAGAAGCTCAACGCCATCATCGACTCCATCCTCCAGGCGTGCGTCGACAAGGTGGACGATGCGCTCTACGAGCTCGAGTCGCCCTCGGCCTCGGGCAACACCACCGCCACGCCCGAGTACGTGCTCTCGATGATCGAAAAGGGCACCACCTCCACCAACGAGTTTGCCACCGTCTTTTCGCTCTACCTCTCCGGCGAGGTGGGCGGCGAGCACGTCGAGGTCATCAAACGCGCCAATCAGCTCGCCCAGACCATCAGCGACACGCTCACCAGCACCAAGGGCATCACAAGGTTGGCGCAGAACGACGATGCTGCCGACAAGCTCATCGGCACCGGTCGCGAGACGGGCAACGTGCTGCTGCGATTCTTCAGCAACCTGCAGTCGTACCGTCTGGCCGGCGTCGCACCTGCCCAGCGCCGCGATGTGGTGGCACGCCAGAACATGGAGGCGCGCGCCGCGTTTGGCAACCTCAACAGCGTGGTCGAGACCATGGTCAAAGCGGGCAACACCATGCTTGCCAACGCCAACGGCGACATTGGCGACATTGTGGAGCGCGAGATGATGAATGCTGCGAGCGCCATCGATGCTGCGACGGCCAAGCTGCAGGCGCTGCTGTCGAGGCCGAGGGACCACAACAAGTACTCGGCGGTGGATCTGCAGGTGCACGACGCCATCCTCGAGGCTTCGCTCGCCATCACACGCGCGATCGCCGGCCTCATCAAGGCGGCGACCGAGTCGCAGCAGGAGATCGTGGCCAAGGGACGAGGCTCGTCGACCAACCAGCAATTCTACAAGAAGAACAACCGCTGGACCGAGGGCCTCATCTCGGCGGCACGTGCGGTGGCGTTTGCGACGACCATGCTCATCGAGGCGGCCGACGGCGTCATCATGGGCACGCACTCGCTCGAGCAGCTCATTGTCGCATCCAACGAGGTGTCGGCTGCGACGGCGCAGGTGGTGGCCGCGTCGCGTGTCAAGGCCGAGTTCATGTCCAAGACGCAGGACCGGCTCGAGCGGGCGGCCAAGGCGGTCACGGACGCGTGCCGTGCGCTCGTCAAGCAGGTCAAGACCATCACCGACAGGCAGAGCAACGGTGCAGCCGACTTTGACTACTCGCAGATGGCCGTGCACGAGTTTAAGGTCAAGGAGATGGAGCAGCAGGTCGAGGTGCTCAAGCTCGAGAAGGAGCTCACCCAGGCACGCCGCGTGCTCGGTGCGATGCGCAGGGCGGGCTACCACGCGACCGAAGACGACTAG
>XR_001875487.1 PREDICTED: Lepidothrix coronata uncharacterized LOC108499283 (LOC108499283), transcript variant X2, ncRNA 
TATGGGCTTTCTGAAAAGGTAACTGTTGTAGAACTGCTCCGCTTCTATCCGGGTAAATCCGGGGCAATGATGGTCCTCGATGACGGCTGGAGAGTGAAATAAGGGCGAACATTCTGTGTTGTTACTTGAACTAAGATGGAACAAGAAAAGTTGAGCCCTGTGAAATGCTGTTTGCAGTTTGTCTTGGAACCTACAGAAAAAGGTATGTAATTCAGCATCCTGGACATAAGCAGGAAGGTAAGTCATCCAATGAAAAACACTCCTTAAAATGTATCAAAACATCAGGTAAAGGAAAAACAGTGATGTGGCTTTTGTCACATGAGGTGTGTCTGTACAGCAGTGACCACAGCTCAGCAATGCTACCTTGTTTATGTTTGACCTAGGTAGCTGGCAAGAGATCTCTACAAGCAAATATTTTAGTAGAAGTAAAAAGTTAAGAGTGTTTTTCAGCTGTTTTTGACCTGGCTCTGTCTTAAACTGTGAGGCTTCCCCCGTGATCAGCACGGTGACTGTGCTGCCTGGGCTAATGAGCCTGTTTGTGGAGGGGTAAAGCAATGCCAAGCTGCAGTCAGAGACATACATGTCATATGCTGTGTCCTGGCCAGGTGTGGACCTCAAAGCTCTGAGCTGTGCAGGCACTGGACTTATACTGCAGTTTCAATTACAAAAATCTGTGAGTGGACACTTGGTAACTGGTGAACTACCTAATAAATAATAGAAGAGTTTAAGGATCACTTTGATAAAACTGTATGAAAACCAGCATTAATCTTAGATGGGTTTCTGAACTTCAGAAAATGCAGTCTGTATCTTGCCAGTTGCTAGTAGGTGCTGGAAGTTTTTTCCTGTCTGGCTCAACAACTGTATGAACTGTTTAGCCAAAATCACCGTAGAAGTCTCTGTTATAGATAGTGGCAAGATGATGAATCTGCAAGATTTCCAAAGACATTGCCTGAAATTTTGTTTTACTGTTGTTGCCTTGGACCTGACCCAGTTAACCACGAGCATTGGGAAATGCTCATCCCATACACTCAACTATTTAGACACGAGAAAGAGGTTTATATGAATTAGAAGTATGACAGAGTTTTGATTAAGTCAGATATTTGTGGAAGTCTCAGGTTTTTTTCATAGTGTGAGTTGGTGGCCTGTAAAAGTTCAGCCTTTAAGGATTTTCCTTTTAATTACCTTTTCAGAATGAAAGATGGAAGAATTTTCACTTTTCTGGCCTTTTCCTGATGACAGTGGCTTTGACTGGGGGCCCTGATCTCCCAAACACTGATTGTCTTATGTTTCTCAATTCTGAAAACCTTCAAGCATACAGTCAGGTATCCTGCCAGCAGCTCTGCAGCAGTCAATGCTTTTGCAATACCGGGCTCTGCTCATTTCAAAACTGTGAAGCAATCCAGCTTAGCAGTCAGCAGAGTGTAAAACTGAATAGTAGGAAGCATCGGAGAGCACCTACTCCAGTTTCAAGCAGAAGAAAGCCTTAAAACTTCAAGGATCAGAATGCTGGGGCATCTCCACTGACAGGTATCTTTCAGGAGCTGCCTTATCCTGTACCTGTCATAAAGCCAAAGTAGGAGCAACTGTTCATTCTAAGATGCATAAATCAGCTTTCCGAGATGATGCTCTAAGGAGAGCGCTGAAGAGCTCTGAAGAGCTTGAAGCTGGCAGGTACTGGGTGGCACACCTGAACTGCTCCTGGCTGCCCTGGAACATCCCACTGAAGATAACATTTATGGAAATGCAAGGAAAAGAATTGCTCCACCTTGCAGGTACAAAACAAGATGCCACGTTCCTCACAGCGGCCAGAGTTGGCATGGATGAACAGCTCTCCCAGAGGGACCTGCTTCCCTGTGGGAAGATGCTGCCCAGGACAGTAACATTTCTGCTACTAGAGCTGAGGGGAAAGGTCATATTTGGGACCTGATGTTAGGTCAGAATTGGAGCTGGAACTTTGCATACATTTTTTTTTCCCCCAAAATGGTCCTGTACTCTACTCTCTCAGCCTTGTCCTCAGCTAACGTGTTGCAGTATTGCTTAGGGGTGAGCTGTGCTGATGCCACTGCTGTACTCTTGCTGGTTTGGAGCATGGGGTCTGCCTGGCCAGGTCTGGGAGGAGCTGGGAAGATGGACTGGCTTGCAGTGCTGTTTGAAAGCAGCACAGACCCCTTTCCTAGCAGAATGTTTAATGGAATCTGCTTCCTTGAAACCAAAATGAGGCAACAGCTGTGATTGCAGCAAGCTGTAACATCTCATTACTGGATGGAGGCACGTCCTGTTACAAGTGGTGGTGCTGCAAAACCTCAGCAAAAGAACCTACTGAGACCTGCCTGGCTGGGGGCTGTGAACTCCCCTGAGGCCTCAAGAAGAAGCTTGGAATGTGGTGCCAGCACAACAGCAGACAGTGAGAGAAACTGAGGCAAGCACCTCGAAGATAAGTAATAAATGATAATTGTTATTTCCTATTATTCATCTGAATCTCTACTCCTGAGAATTTGAGTTAAATCCTAAATTTTCCTTTATTTTTAAGCAGATCATCCAGCAAGTTAAAAAACAGCAACACAAGGAGGTCCTAAGATAGGGTTTGCTCCAGTTTTCCTGCTGAGCATCTGTTTAGGAATTGCTGCTAAAAAAAGTCAGAGGGGATGGTAGTTGCTGTGCTGTCACATGGGCTGATACAGAGCAGAATCTGCTTAGCATTCTTGAAGGGAAATTATCCAGTGCTGTAACTCACAATTTATAATTGGTTGCATATTAATATCTAAAAAAGGCAATAAAATCCACTGTGTGTTTAAAAAAAATAGTAAGTAGGAGTATTACAAGCTGAGCAGTGAAAATCTGGAAGACTTCTTGGCTAGAGCAAGGCTGTGTGCAGTGCTGTTTCTCCCTTAATTACAAGCAATTTTAAATCATCTCCTTCCTTCAAAGAGGGATTTTGTTCAGGGTGTGTGTTAATTTTAATCTTGCTAACGTGATACTCTCTTGGAACCTCTCCCTTGTGTCATAACAGTGAGATGTGCTGCCTCTTTTGTCCCTGCCCTTTGGGAAATGCAGTTACTGCTGCTCATTGCCTCAACCCTGCCGTCGTGACTATCAGTGTACCTCCCTTGAAAGGAGAAGAAAACAAAACCCAACAGCAGCATTGCTTTTTCCCCCCCAGAGGTTCACTTTTATTTGTACTATTTAAGCTAGACTGTGCAAGTACTTCATGAAAATCAGGGATTTAAAATGTATGGTACTGTATTATGCTGTATTATTGTGGAAAGCTTGTTATTCAGCACACTAATTATTTCTGAGTCACTATATTTATGAAATGGCATGTAATAACTACTTCACCACCACGCAAAGTAAACAGTATAAAAGCAGGCATTTTATGATTTTGACATTTTAGTGTATAAACATATTCCTGAATCTCCTGGGGGGCTACTGGAAATCAGATAATGTTTTTATGACTTTTAAAAAATGACATTGAATTTCACAGTCTGTAACGCTCCATATATATGGTTAATGTTGCATATTTTATTACAGCCTCAGTGGCTTATGTTACAAGTGTCAGCTGCAAAGAGAAAATGTACAAAGGCGGGTTTGTGGAACTGTGGGGGAAACAACATCGTAAAACCTTGCAATGCACACATCAAAGCCCTTGGACAAGCTGTAATGGCAGGTCCTGGGCCATGCTGGGACACCAGAATACACCCTCTGCTTTTTTTCGTGTCAGGATGGATTACAAAGCCCTCGCTGAAGGAGGGTTTCTGCCCACACTTGTCACTAGAGGATAACTAAGTTTGGGGTTTTGTCAAGCCCTGTGTGAATGACCCGTTAACTCCAGAGGAACTGGGACGCCTTGAGTGACACTCTGCGAGCTGGACTGCACTGAGACTTCTGCATTTCAGGAATGTGACTCCTGTCCTTGACCTCGTCTGCAGATAAATACAACATGCCCCGTAGTGCTGAGTGGTTTGGGAAGAATGTCAGCCAGACAAGAGAGGGGAGATAATGGAAAGACAGGCTAGGATAGGAACTGGGCTGTCTGATTCTGCAATGTGGGAATCGCCTTTTCTCAGCTGCCAGTGTCAAAGTCAAGCTTGCATTGCACAAATAAAATGGGGTATTCCACACACACACCTGCACCCTTTCAATTCTCACTGATATTTAGCAGAGGGAATATTCAAAACATTATTCCCTCCAATACAGAATGGCTGTTGGGTGTTACCAGATCACGTAAAAAGACATCTGAGTGGAGTTTTTCCAGCAACAAACAAGAAACAAAGGGAGGATTAAAAAAATGTTTTGCTACGTATACTGTTATGATTTTTTTTGGTGAATATATATAAAAAATTAATGTTGGGATGTGAAGAAACAAAGAAAAAGAGCAGGCAAGTGTGCTACCATAAAATGTAGCATGACTTGGTACAGAACTGAATGTTACAGGGTCAAGCATCAGGTAGGGACATGTGTTGGGGACTAGGATGGTACTTACACTTATTACTGAGGTCAGTGCATATTTTCCACTACCTTATTTATGGGATCAAAGGTTTGATGGGATCTAGAAATCCAAACACATTTAAAACGTGGCAGATGTGGGTAACCTCAAGTACACAGCCCATCGCCTCAGAAAGAGGAATGTTCTTGCAAATTTGACATAATCCAATTAGTTGATTCCCTCAGTGACATTTCTGCAGGCTCATGTACAGAGGGACAAGGAAAGGGAGATTTATGACAGCTATTCCTAGCAAAGGTCATTTCTTTATTAGTGAACAACCTGTCCTTAGTCATGCTGATGATGAGGCGTTGAAGGATAAGGGAGAGGCTGTGTAGCTTTAAAACTTGACAGGGAATAACAGCAATAGAGCATAGATCATCTCTCTACTTGGACCAGGAGGACTGAAATCTCCCACCATCAGGCCAAAGCCAGAGAGCAGGAGGCAAAATCCAGGAAAAAAATAATACATGGGGATTTCTGTGGAGATTGTGAAGGAGTTTGGATGGTTCAGTGTCAGCACAGCAGGGGGGAAAGAGGAGCCACAGAGCATGAGTATGTTTTTGGATAGGATAAGTGTCCTTGGTGGAACCAGCTGCTTATAAAGAACCTGGTCTGGTTGCTCTGGGGAATCCCTGGTCAGCACTGCCAACTTCCCAGTTTGAGCAGCTCTCAGCATCCTGTTCCATGCCATTTCCAGAACAACACAGATGAGAGCATGCTCAAATATCTACAAATACACTTCCTTGGCTGTCCTTCCATAGGCAAGGAAAGCACCAGATTTGACAGGAATATGGTTTCAGTAGATTGTGACATACACATTATGTATTTTTAAACAATAAACCAGTATCTACCTATTCAAGTGACTATTTTTCCTGCTTGCAGAAGAGAAGGTATTTGACACTGTACATA
>XM_039434265.1 PREDICTED: Nilaparvata lugens aminopeptidase N (LOC111044204), transcript variant X4, mRNA 
GTCTCTGCTATTTTTAACCGTATTCAGCTGAATTAGTCGCTAGCTTGGAATCAATTAAACATGGGTGCTCAAACTTTTGTCCCTCGTTCAAATTTCTTCAAATCCTGACTATAATTATTAGATTGTCACGTGTGACAACTTACAGTTTAAATTTTAATTTGATTTAATTTTGATAAGTTCAATTTCCAGAATTGTTGTTATTATTGGGATTCATTTTTAATCAAGTAAGCGTTCAGTCATAATAGTTCCTAAAATGGGGTATTTTATGACGTCATTGATAGTATCTCTCTTGCCCTACACAATGAATTTGGCTGATTCGAAAATGCTAACTGGATCTCCTATAGCATTTCAAAGATCGACTCATTTCAATAACCAAAGACTACCTCTTACCATCTTTCCAATACATTATAGATTAAATTTGTCAGTGCCATTGATAGATAACAATTTCACCGTAACTGGGGACGAATGGGTTTTTTTGAATTGTACAGTAACTACAAGGGAAGTTGTATTCAATGTGAAAAACATTGACATCGATAAGGCTAAGACCAGGCTTTATGATTCTTTTGGTGGATCGTTCGTTCGAATTATAGAACAAAGATATGAAAGTAGCCGAGAAATGTTTGTGATAAGAACGGCAACTCCATTGATTTCTAGACGTCAGTATGAGTTGGGACTTCAGTTCTCCTATGTTCTCAATGATGAGCTGATGGGATTCTATCGAAGCAGCTATATTGATCATGCTACTGGAGAGAAACACTGGATAGCAACCACCCAATTCTCTCCCACGGCAGCCAGGCGGGCTTTTCCTTGTTGGGACGAACCATCATTCAAAGCCTACTTTTCCATAAGTATTGCTCATCACAACAAATACCATACTTTATCCAATATGCCTATCAGCAATTCAATACCGGCCCCTGGAATGAACAATGATTGGATCCAAGATGTTTTCAAAACGACATTACCGATGTCAACATACCTTGTGGCTTTCATTGTTTCTGACTTTGTTCCTTACAAAACAGTCATCGATAACAGCTCAGGTTGGAAGTTCACACTATGGTCAAGAAAAGACATTCTATCACAGACTGAGTATGCCGCCGAAATGGGACCCAAATTGCTTAGTTTTCTGGAAGAATATTTCTCCATAAAATTCCCTCTTCCGAAACAAGATGTGGTTGCCATTCCCGATTTCGGTTTCAGCGCGATGGAGAATTGGGGACTTATCACATTCAGGGAAACATCCCTTCTATATAAGCCCGGTAAGACAAGTGAGAAGAGCAAACTGGACATAGCGTTTGTGTTCGGTCACGAGTTGGCTCACCAGTGGTTTGGCAACCTGGTCACCCCTGCCTGGTGGAACGATCTCTGGCTAAAAGAAGGATTCGCTACTTTCATTGGATACACGGCGATAAATCATATGGAGCCATCATGGAAAGTGCTGGATCAATTTCTTCTGCAACAAGTGCTGGGATCGATGAAAATCGACTCACTCAACGCAACACATGAAATTGAAGTTGAAGTGGAGGAGCCCAAAGACATTGTGCAGATCTTCGACAACATTTCATACATGAAAGGCGCCTCGATAATCAACATGATGAGCCAGTTTCTGGGTGAGCGGGTGTTCCGCGCGGGTCTCAAGCGCTACCTGACCGAGCACGCCTACTCGAATGCATGCCAGGACCAGCTATGGCGAGCGGTCACGGTCGAGGCTGCCTCGAGTCTGCCTCAGGGTGTCGACGTCAAGCAGATCATGGACACTTGGACCCTGCTGCCTGGCTTCCCTGTCGTCACGGTGCACAGGGATTATGAACAGGGAACGGCTAGTGTCACACAGGAGCGATATTTCGTGCTGAATGAATTCACCAGTGAAGATAAGTGGTGGGTACCTGTTTCATACACCACACAAAGTGAAATGGACTTCAACAACACCCAGCCAAAAATTTGGTTAGAACCATCCAAACCGACTAAGAAAATTACAAATATTGATCCTGATGACTGGCTGCTGATAAATTTAAAACACACTGGCTACTATAAGGTGAACTACGATGAAGAAAACTGGCGTAGATTGCAGGAATCGTATCTGAAAATGCCAGAAACGATTAGAGCTCAGCTGTTGTCAGATGTGTTTAGTTTGGCAGCCACCGGAAGGACCAACTACTCGACTGCCCTGGGCTTCAGTCTGCATTTGCCCCGAGATAATTCCTATTTTCCCTGGTCGATTGCTTCCGAAAAATTGTCGTTTATCGGAAAACTCATGCGGGATACGGATGCTTCTGACGATTTGAAGAAATACATGTTGCATTTGGTGGTGAATACCAACAAAGAGCTCACTTTCTTCCCAAAAACTCCAATTACTGGTTATTTGAACCTATTGCTTCAATTGAATTTAGTTGGAGTGGCGGCGGACAGTGATCACCAAAAATTGGTTCATGAAGCGAAACAATTTTTAAATGATGAGATTCTCGGTAAAAACGTCAGTATAATGGCGGATTTCAAAACCAAGGCATATTGTACGGCAATCAAACATGGTGGCTATGAAGAGTGGAATTTTCTATGGAAAAAATATCATGAGACAAATATTGCCTCAGATAGAGTGGTCATTCTCATGGCATTGGGATGTAGTAAAAATAGCACCATCCTTTCAAGGTATTTGAACAGAATCCTAGATCCAGACAGTGAGATAAGAAAACAAGACGGGGCGTTTTTATTTGAAGTTGTAGCCAATAAGAATCCAGTCCTGGCTTTCGATTTTCTCAAAAAGCGGTGGGAGAATCTCCAGTCATATTTTGGACTGGGATTCAGACAAATGGCAAAAATAATTGAGTCTCTTGGCACGCACTTGAATATGGAGCAGCAACTGATAGAGCTGGAAAAACTGCGATCAGACCACATGCAAAGCCTTGGGTCCACAAGCAACAGTTTCAAACAAACCATCGAAAGAGTGAAGTTCAACATACAATGGATGAACAACCATTACGAGTCTGTTACAACTTGGCTGAAAGAAATGCTACCAAAATTGAAAAAGACGTGATAAAGTGTTCCTTCCTCTCAGCTATGATCAATACTGGAGTATTATTAGTTTAAGGGAATAAATGTGTCGAAAACTTGAAGATTCAAATCGTTGAAGGCTTATCTAGCTTTTAACATTATCAAGACTATCTCCTATCAGACATTTTTCATGTCAAATAATAATATTTCAAATTTAGAACTTTTAAGCTAGTACACTCTTGAGGAGAATGTTAACAAGTTTTTTATTTTTTCAACAATAATCTACGTTTTCACTTATTGACGTTTCACTTATACACGAATTAATGAAAAGTTTGCATTGGAACAGCATGAGAAACTCCAATTTCTCCAGCAGTTTCAGTACAAAAATTTTATTGAACCGAGTGCTTTGAATATTTTCTGTAAAATTTAAAAGTTTAACTTGTATGTAAGAAATCTACAAAGCTCTAGTGAAGAAGTGCCATTGTTTGAAAGGTGCTATTATTATAGTCAATATTATTGCAAAGTCAGTTCTGACTTAATTGTGCTAAAGTAAGATTAAAAGTTGTGTGTTCTCATAAGTTATTGAGGAAATCTTTTTTTTCTGAATAGAGTATGCAAAAATATAGTCATTATTCGA
>XM_028248081.1 PREDICTED: Camellia sinensis pentatricopeptide repeat-containing protein At2g13600-like (LOC114302958), mRNA 
ATGGGGTGTGCTAGCAGGTCCGATGTGAAAGAAATAGCCGATTACATGACACTTCTTGAGGGATGGATTTATGAGCACTTTCGTGGATTCCAACCACACTTGAATATGAATTACACTCGAGACATGCCACATGTTTACCGTTGGACTTCTCGGAGAGAGTCTGGTGAAGAGAGACAGTTGCAGGCTTTTCGAGAGGAGCTTGATAGGTTAGGGTATTTGGAACCCATACTAGAGTTGCAGAGATGTCCATCCGTGTCACCCAGCTATGTTCTATCACGGTTGCCTAAAGTGTTTGGAAGAAATCTTGTCCCAGATGATGCAGTTGATTATATTGCTTCTGAGAATAACATTGCAGAATTTTTTAAAGTGGATAGCACTATGTTTGTGCCTCTTTTGACTGTATGCACAGAGCTCTTTTTGCTCAAAGTCGGAAGACAAGTCCATGGCTTTCTTATTGCTTTCTCTAGCTGTCATTGTAATAATTATTCATTGGATGATGGCGATGCAATTATTGGAAGCGCTTTGATCAATATGTACAGCAAGTGCGGTAGCATTGGTGAAGCTCGAAAAGTTTTTGATGCTTGGCTGCCTGCCCAACTTGTGGCTCTTTGGAATTCGATGATATCAGGTTATATGTATAATGGTTTAGTTGAAGATGCTAGGACACTGTGGGAAGAAATGTCAGAGAAAAATGTCATTTCATGGACGAGCATGTTATCTGGGTATGTACAGAACGATATGCCACGAGAAAGTTTAGATTTACTAGCTAAAATGTATTCTAACGGGGATGGATCTAGAGTAGAAGGGAACTGCTTCACTTTTGTAGCGGGTCTTGAAGCATGTAGCTATTTAACAAACTTAGAAATGGGAAAACAAATCCATGCAAAGCTCATGAGGACATTAACTAGAGCTGATACCAATAATGTGGTTGTTGGAACGGCTTTGGTGGATATGTATTCTAAAGCCGGCTATTTGTCCTATGCACAAACTGTTTTTGATTTGATGGTGGAGAGAAATGTAGTTGCATGGACATCTATCATTATGGGGTATGCAGTTCATGGGTTTGGTTTTCGAGCCCTTGATTATTTCCAGCAGATGATGGAAATGGGCGTGGAACCAAATGAGGTGACATTTGTGTCTGTCTTAACTGTTTGCAGCCATTGTGGTTTGGTGGTTGAGGGGTTACAATACTTTAAACTGATGAAGGAGAAGTATAGATTAATTCCAAGGGAAGATCATTACACATGTTTGGTTGATATGTTGGGACGCGCTGGAAGGCTTGAGGAAGCATGGAATTTGCTGGAAGAAATTGATGTTGGAGAAATGAGTTCTAGAGGTACCATTTGGGCCGCAATGCTTGGGGCATGTCAATTGCATGGGAATGTGGAAATGGGAAGGAGGGCAGCTAAGAAGATGTTAGAGACAAAGAAACAAATTTTGACGACTCATATTGCACTTTCTAATGTTTATGCCGGGGCAGGGATGTGGAATGAAGCGTATAGAGTGAGAGAAAATTGGAGCAAAGAAGGTGATGTTAATGGGGAGCCAGGTCTTAGCCACATCTGCACAAACCTTGTGGTTTCTTGA
>JX292766.1 Haloferax sp. SSIN2 16S ribosomal RNA gene, partial sequence 
CGCAAGTGCGATAAGGGGACCCCAAGTGCGAGGGCATATAGTCCTCGCTTTTCACGACTGTAAGGCGGTCGTGGAATAAGAGCTGGGCAAGACCGGTGCCAGCCGCCGCGGTAATACCGGCAGCTCAAGTGATGACCGATATTATTGGGCCTAAAGCGTCCGTAGCCGGCCACGAAGGTTCATCGGGAAATCCGCCAGCTCAACTGGCGGGCGTCCGGTGAAAACCACGTGGCTTGGGACCGGAAGGCTCGAGGGGTACGTCCGGGGTAGGAGTGAAATCCCGTAATCCTGGACGGACCACCGATGGCGAAAGCACCTCGAGAAGACGGATCCGACGGTGAGGGACGAAAGCTAGGGTCTCGAACCGGATTAGATACCCGGGTAGTCCTAGCTGTAAACAATGCTCGCTAGGTGTGACACAGGCTACGAGCCTGTGTTGTGCCGTAGGGAAGCCGAGAAGCGAGCCGCCTGGGAAGTACGCCCGC
>XR_004551154.1 PREDICTED: Pseudochaenichthys georgianus uncharacterized LOC117439437 (LOC117439437), transcript variant X1, ncRNA 
GTTTGGTGATGTTGTGTGTGAATTCCAAAAACAATGTGACAACAATAATGGAGTTTCCATGCACTAATGGATACTGATTCAACAAGCTCCGTCCATATAAACTGATGGTGAACAGAAAGTCTGCAGTCAGCTCCTTCACCACAAGAGGAGAGAGACAACAATGATTTCCATGCAGCCGGCGGAAGAGAGAGAGGGAGAGAAGAAAGCCACCAGCGGGTTCCCGGTCCAGAAGATCCAAAAGGTCCAGAAGATCCAGAAGAGCCAGAAAGCCACCAGCGGGTTCCCGGTCCAGAAGATCCAGAAGATCCAGAAGAGCCAGTGTGCTGGACCGACTTGTTTGACTGTGACAATCCCAGTGGCTCAGGGGACTGGGAGCTTTTGAAGGACCTGAGGAAAGAAAACCCAGGAAAGATCTGTGAAAACCCTCTGTACATAAAGGTTGTTATCACTGACACGATGACCCCAGCCATCTCCACAGGGCAGACCTTCTATATCTTCAATCCGACTCAGGGATTTGTTTTCCGCAACAAGGACCAGAGTGAGGGCATGTGCCGTGACTACAAAGTTCGCTTTGGGTGCCCGTGCAAGAATTAAGCTGCAACTCCACAGCAAACATCCAACAAGAATATGAAGCTTTGATTGCTTTAAAATGTTGTCCTTTTCACTTTACCTTTCTATTTTATATCTTACTTTGCCTGATGGAAGAAGTTCAATGGACCTTTTTTACGGCAGACATGTTGACTTGTAGCAGGAACAGGACCATGAAGCCTCATCAGTTGATTAAAACTGAGCTTTATATCGGAGTATGTTTTACGCCTGTACGTTTACCAACATGTCTTCCGAGTTAAGATGCATCATGTCATGTGCTTTCTCAAAAAAACCTTTTTCTAGTGATCATGAAATCATTGTCTAATGTAGGAAATA
>NR_045871.1 Mus musculus RIKEN cDNA 4930428O21 gene (4930428O21Rik), long non-coding RNA 
ACAGCAAGAGCTTCACTGCTGCAAACCAAGTATGGCTCCCACTGTCACCCAGCACTTGGGAGGCTGAGGAGAGCCCACGGATTTGGCAAGTCTGGATAGCCAGCTTGTCCCTGGGATCCTCTGCTCCTCCCGCCTGAGATCTAGCACGGCAAGTGGACTGCCACATCTGCCTGTGGACCTCCACCACATCTGCCTGTGGACCACCACCACATCTGCCTGTGGACCACCACATCTGCCTGTGGACTACTACATCTTCCTATGGACCTCCACCACATCTGCCTGTGGACCACCACATCTGCCTGTGGACCACCACCACATCTGCCTGTGGACCACTACATCTGCCTATGGACCTCCACCACATCTGCCTGTGGACCACTACATCTGTCTGGATTTTATTGCATGGTGATGCTCTCGGCTTGGGAGTGAATCACAGCAAGAAAGCCCTGCATCGTAGGTAGCTCTCCTCGGTACATTCCTGACTCTCTTTGGCCAAAGGATGGAAATCTCTGAAGATAATGACTCTTCTGTGACTTCTCTCTTCCTACTTACTTCTGTTGGGTTGAGTTCCCTTGTGGCCTGCTGATTGGCCCTGGCAATGTACCTGTTAGTGGTGGAGGGCAGTTTGGAGAGTTACTTCCACTAAGTTGATAAATGCCCTCCCCCACAACGGTTTTCTAGACTCCAGTCACAATCAACACCTTCTTTCCAAATTCCCCAACCACATTGTTCAGGAAGCAGAAGCATCTAGAAGCCACAGGGAACTGTTGGACTCAACCTGTAGAAAACTGGATGGAGGTTAGCTAGCCCTCCCTCCCGGGAGCTCCGACCTACTCCAGGGTGAAGAAAGCGAACTTGTATTGTGTAAATTGTACCCAGCACTGTCTCAGGAAGTACCGTAGCTTCCTGATTGTGAATGCAGATAATAAAGTGTAAGGCCGTAGCGGCTAAGGACGAAAGCCACCAACCCACCAAAATGTAGAAAATGACATTTCTAAGCCTCAGGTGCAGGAGAGTCACTATAATGGTTAGGAGGCCTCAGGCAAGGAATTGGTTTCCTGTCTTAAGCAAAGATCACTGGGAGCTTTGAGAATGGCAGGGAAGGGTTGGGAGACCTCTCCGCTGGTCTCACACAACCGTTGGGTTTCCAGGGAGTCAGGACTGCTACTTGCCACTTCCGCTCCCCTATTTTCTAAGAGAAATTATGAAACAGAACTTGATAAAGAAAAAGTAAATTTATTTACAGCTGGAAAAAACTGGGGAGAAAGAACCTAGTTTCTTTCCTCAGTGTCTATGGTTAGGATTTTTCAAAACCCCTAAGACACAGGCCAGAATATTGCAGATTTACCTCTGACAGTTAGGCTGGTCTTGATCTAGGGGCAGAGTGACTCAGCCCTGGGTTGCCCGTACTCCCGGCAGGCTGCCTGGTGCTGCTTCTGCCTCCTTCATACACACAAGCATACATGCACATGTATGTATTATATACACAAACACATATGAACATATATGTATTATACATATAAGCATACATGCACATGTATGTATTATACACACCAACATATATTAACATATATGTATTATACACACACGCACACATATGTATTATACACACAAACATACATGCGCATATTTGTATTACACATACATGGTTATTAGACATTTGAAATATGAAGAGTGTGAGGAGCTGGTTTTAAAATTTTAAAATGAAAATTTATCATTTTAAAATAAAAAAATTATTTTGAG
>XR_004558147.1 PREDICTED: Thalassophryne amazonica uncharacterized LOC117501971 (LOC117501971), ncRNA 
CCCTGAGCCTGGTTCTGCTGGAGGTTTCTTCCTCATAGACAGTTTTTCCTTACCACTGTCGCCTGTGTGCTTGTGCCAGGTGTTGGTAAGGTTAGACCTTTTTTGTGTAAATCGCCTTGAGGAAATTTTGTTGTGATTTGGTGCTATAAAAATGAAA
>XM_018405618.1 Kwoniella dejecticola CBS 10117 hypothetical protein partial mRNA 
ATGGCACCTGTAAAACCGGTGAATGGCAGTGACAAGCAAGTGAAGAAGAAGCGGACTTTCTTCGCGTCGAAATTAGCCATACCAATCCCTCCAGCAAGTGCGACGGAAAAGGGCAAACAAAAGGCAGTAGTGGTGTCTACAAAGACGGTACTTAGTGCTTTGGATGGATTGGAATCTGTGTCTAGATCAACACCTATCAGTAACGGTAACAGGAGGGATCAAGAGAAACGCCCCACTGCAACTCACACTCCATCTCGCGCGCAGACCGTAACATCGAAGCTAGTACAAGATCCCAAGATCTACACGAGGAGAAACAAACCGAAGGTTCAAGCCACAATCACCCGGAGCTCAGAGGTCGGTGGGAATGTCAAGAATGGCGTAGATGGTAAAATCAAAGTGAAGAGTGAGCCTTCAAGCTCGGTATCAGCTTCGTCTAGTAGGCTCGTGAACCGGAAGAAGGATGTCATCAATGACACGGGAAGGGTTGCGAGTGCTATTGAGCCGCAATCGAGTTCATCGTCCTCGTTTGTTGTGGGGAAGCATAAACACCTCAACGTGAAAACGAAAACCAAGTCGAACTCAAAAGTGGGTCCCAGTGCTAAAGCCAAGATCATTACCATCAAATCATCTTCGTCTCGCAGAATACCACATACCACCCTCAAATCCTCTTCCAAAACCAAGAGCGCAAAGACGACCACGCGTTCATCTGGCTCTGCGAAGACTTCAAATAAAGCTACACAGGTGCGGGCGATCCTGTCGAGGCGAATCATCAGAACTTATGAAGCCAAGTCTCAAACCAAAAGCGAACCCAGTCAAATAAAAGGAGGAATCTCTAGTGGGAGTCCAGAAAAGCAGGAGAAAGGGAAAGAGAAAGAGAAAGAGGGCAAACCGTTGAAAAAGGATTACATGTCAGCTGGATTCTATTGCCAAGATCCCCATCCTTCGTCTTCAAAGCAATTACACAACAAGATCTTAGCTATCCGTTCGGCGGAGAACAAAGCCTCAAAGTTGTTAGATGCAAAGGCAAAGGCAAAAGCAAAGGCTACTCCGACCATAGTGCGCCAAACGAGAAATAACGTCAAATCACATTCGAGCGAAAGTCAGAGTGCGAGTGCGAGTACGAGTACGTATACGAGTACAGCTCAATCCAGTAAGAAGTCAGTCGATCAGGAGAGACCGAGTTTCCCGCCGTTACCGTACGATCATGGCTACGACCTGTTCTTCAAGCAGGAGCACGAGTTCGTGTTGCCGTACCATATCATGAAGGAGAAAGAGGATGGAAAGCTGGTGGCGAAGAAGAAACCTACTCAATTTACGAAGATACGAGGGAACATATACCCCGAACGACCAAAAGTCATGACTGATTTCCATGCGATATGCAAATGCTCGCCGGAATCGAAATGCGCCGATCAATGTATAAATAAGTTGATGAGTTATTTATGTGGGAAAGAATGTCCTGCAGGAGATGAGTGCACGAATAAGACTTTGACTAAGAGGAAGGCGGCGGCCTATAAAGTGGCTGATACCGGGACAAGGGGTTTCGGGATCATACTGCTGGAAGACGTCAAAGAAGGGGATTTCGTAATGGATTACAGAGGAGAGGTGATATCGATAGACCTTTTCATGGACCGCATACAGGATGAGTATAAGGGCACGAAGAATTTCTATGCGCTAGCGTATGATCAAGATGAAGTGATTGATGCGGGGATGAAAGGGAATGATGCTAGATTCATCAATCACGGCTGCGCGCCCAATTTGGAAGTACGGAAATATCAGACCGCCGGGGATGGGTGGGACGAATTTGAGGTGGGCATGTGGGCTATTAAGGATATCAAAGCGGGAGAAGAGCTGTTTTACGACTACAACTTCGAGTCATTCGGAGTTGCCGCTCAGTCCGACGAACTACGCACGAAATGTCATTGTGGAGCGCCCAATTGCGTCGGGTTCTTAGGTAGAAAGGCAGGAGAGAAGTCGGCGAAAGAACTTGCAGCGGAATTAGCTAGGAATGCCAAGATCCTGCAAGGAAAGAAGGCGTCCATCAAGAAGCTTAAAAGTAAATTAGCGGAAAAAGCTCAAGCTGAATCTCGAAACGCGGCGAAGCTGGGTACGACGGTATTGGGTTTGGAAGATACCCCATCTATCATTTCTAATGCCGATACAATCACTACCACTTCTATCAAGACGCCTTCTCAAATATCGCCTTCTCGACCGCAGATTAATGCAAGGATGCCTTCGTCTTCCCCACTTTCCGAGCTGGATCCCGTCGAAGCCGAAAGCCAAACCAAAGGTTTGCCTAAGGACAAAAAGAGGAAGAACGAGATTTTAGCCACAACGGAAGCGGAGACTAAGAAGAAAAGAAGGAAATCTGAACCTTTACCAATACCCAAGAAAGCGACTAGCAAACCGCGCAAATCTGAGCCTTCCGCAACAAGTGCATCGACATTGAATTCGGCAGTGCGAATCAAGAGTGTGGGTAAAAAGGCAAGGAAGTCAGAACCGATCCCTACGTCTACCGTGAAGAGAGATGAGGATGAGAGCGAGGATGAGGCAGAGAAGAAACCATTCAATAATCCTCGAATCTGTATGGATGCCGTCCGAGAGGCTGCTCGAATCAAGAAGGCCGAAGTCGTGAAAGCTAGGAGGGGGGCGCCTAAGGGATGGACAATCGTTTTACCGGGACATGAACCGCCACCTAGGGCCGCACCGCTCGTCGTGTCGACTAGGAAACCGCCCAGAGATAGGTCGAGCTTGGGGTGA
>GU637646.1 Uncultured bacterium clone RW2302 16S ribosomal RNA gene, partial sequence 
ATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGTAACAGGCCGCAAGGTGCTGACGAGTGGCGAACGGGTGAGTAATACATCGGAACGTGCCCGATCGTGGGGGATAACGGAGCGAAAGCTGCGCTAATACCGCATACGATCTGAGGATGAAAGCGGGGGACCGTAAGGCCTCGCGCGATCGGAGCGGCCGATGTCAGATTAGGTAGTTGGTGGGGTAAAGGCTCACCAAGCCGACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGAATTTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGCAGGAAGAAGG
>XM_023804680.1 PREDICTED: Paramormyrops kingsleyae potassium voltage-gated channel subfamily H member 2-like (LOC111840147), transcript variant X3, mRNA 
AAGGCCAGAGTCGCAAGTTCATCATCGCCAATGCGCGTGTGGAAAACTGCGCCATCATCTTCTGCAGCGATGGTTTCTGTGCCCTGTGCGGCTACACGCGCTCGGAGGTCATGCAGAAGCCGTGCACCTGCGACTTCCTGTACGGCCCACACACCAAGCGGCTGGCCGTCGCACAGATGGCCCAGGCGCTGCTTGGCTCAGAGGAGCGGAAGGTGGAGATCGCCCTCTACAGGAAAGACGGCGTGTGCTTCCTCTGCACGGTGGATGTGGTCCCGGTGAAGAACGAGGATGGCATGGTGATCATGTTCATCCTGAATTTCGAGGTCATGAGCGAGGAGAAGCGCAGCGAGTCCAGCCGAGAGCTCAACCACAAGCTGTCCATCCCTTGGCTCTCCGCAGGCCGCTCTCGTGGCTTCAGGGTACGCCTCCCGCTCCTGCGCTCCCTGGCCAACAGCAGGCAGTCCCTCCAGGACGACCCCGAGGCAGCTTGTGTGCCAAGGGCCTCCCACCCCAGCCGGGACTCCCTGATGCTGGACGAGCTCATCTCCCTGCCCGAGCCGGCGGGCCGGAGGGCACTGCTGGAGAGCCAGCCCCCAACACCACCACCGCCACCGGCTGCCGACTTCCCCGTGCATCCACACCACCTCGACCCAGACGCTTCCGTGTCCAACTGCAGCCTGACTCAAAGCCGCTCGCGGGAGAGCTTCCACAGCATGCGGCGCGCCTCCTCCGTTGACGACATCGAGGCCATGAGGCCCGAGTGGGAGCGCAAGGTCCGCTCTGGTAGCACAGGCGCAGTGAACAACAAATCAAACATCCTCAACTCTACCTCGGACTCGGACCTCATGCGCTACCGGACCATCAGCAAGATTCCACAGATCACCCTCAACTTTGTGGAGTGCAAGCCGGACCCCCTTATTGCCCTACCTCCTGGGGACAAGGACATCATCGCTCCCTGCAAGCTAATCGACCGCACGCACCACGTCACAGAGAAGGTTACCCAGGTGCTATCACTGGGTGCCGATGTCCTCCCTGAGTACAAACTCCAGGCTCCCCGCATCCACAAGTGGACCGTCCTGCACTATAGCCCCTTCAAGGCGGTGTGGGACTGGTTAATCCTGCTGCTGGTGATTTACACGGCCATCCTGACTCCCTACTCTGCCGCTTTCCTGCTGAGCGACCAGGATAACGTGGCCATGGAGAGCTGCATCTACACCTGCACTCCGCTTAGCATGGTGGACCTCATCGTAGACATCATGTTCATCATCGACATCCTCATCAACTTCCGCACCACCTACGTCAACATTAATGACGAGGTGGTGAGCCACCCCGTCCGCATCGCAGTGCACTACTTCAAGGGCTGGTTCCTCATCGACATGGTGGCGGCCATTCCCTTTGACCTTCTCATATACCGCAATGGGGAGGAGACGACCACTCTGATTGGCCTGCTGAAGACTGCCCGCCTACTGCGGCTGGTGCGGGTGGCTCGCAAACTGGACCGGTACTCGGAGTATGGTGCGGCGGTGCTCTTCCTGCTCATGTGCACCTTTGCCCTTATCGCCCATTGGCTGGCCTGCATCTGGTACGCCATCGGCAGCGTGGAGCGCAACGGCTCCATTGGCTGGCTGCACTCTCTGGCCGACCAGCTGGGGAAGCCCTACAATGAGACCATCCAGGGCTCGGGCCCGTCCATCAAGGATAAGTACGTCACAGCACTCTACTTCACCTTCAGCAGTCTCACCAGCGTGGGCTTCGGCAACGTGTCGCCCAACACCAACTCGGAGAAGATCTTCTCCATCTGCGTCATGCTCATCGGCTCCCTGATGTACGCCAGCATCTTCGGCAACGTGTCGGCCATCATCCAGCGGCTGTACTCGGGCACGGCGCGCTACCACACGCAGATGCTGCGGGTTCGGGAGTTCATCCGCTTCCACCAGATCCCCAACCCCCTGCGCCAGCGCCTGGAGGAGTACTTTCAGCACGCCTGGTCCTACACCAACGGCATCGACATGAACGCGGTGCTGAAGGGCTTCCCCGAGTGCCTGCAGGCCGACATCTGCCTGCACCTGAACCGCACACTGCTGCAGAACTGCAAGGCCTTCAAGGGCTCCTCCAAGGGCTGCCTGCGCGCCCTGGCCATGCGCTTCAAGACCACGCACGCCCCGCCCGGCGACACATTGGTGCATGCCGGCGACGTGCTCACCGCCCTCTACTTCATCTCCCGCGGCTCCATCGAGATCCTGCGCGAGGACGTGGTGGTGGCCATCTTGGGTAAAAATGATATCTTTGGTGAACCCATCAACCTCTACGCACGTCCTGGGAAGTCAAAGGCAGATGTGAGGGCACTGACCTACTGCGACCTGCACAAGATCCACCGTGAGGACGTTCTGGAGGTGCTGGACATGTACCCTGAGTTCTCTGATCACTTCTGGAGTAATCTGGAGATCACCTTTGACCTGCGCGACACTAACATGATTCCCGGCTCTCCGAGCAGCGACGAGTCGGACTGCATCGGCTTCAACCGGCTGCGCAGACGGAAGCTGTCCTTCCGGCGCAGGACCGAAAAAGATGACGAGAAAGCAGGTGAGATAAAGAAGTCTCAGAGGCCAGTCCGCCGGGCAAGAAAGCAGACTGTCAGCAACCAGACAGAGGGCTGTAAGGTAGAGTGGGAGGGGCCACGCAGTTCCGTGTCTTCTCACTCCAGTGGGGAAGAGGGGGAGGAGTTACTTCTCACCTGCCCCGCCCCTCCCTCCGCCCTCCTGGAGTTGCCAAGGGAACTGGGGACACACGTCAACGTGAGCAACGCTCCGGAGGTGGACGGGGATCCTAAGACTGGCAGCACCTGCAATGCGCTCTCTGGTGCGTTTTCCGGAGTGTCAAACATCTTCAGCTTCTGGGGTGACAGTCGCGGCCGGCAGTACCAGGAACTGCCCCGGTCCGGTCCGGCCTCCTCTCCCACATCGGCCACGCCGACCCACGGCATGGCCCGCTGGCAGCGGAGCCAGGTGGAGAACCGTCTAGAGCTGCTGCAGAAACAGCTGCACAGGCTAGAGATACGCATGTCCACCGACATCAGCACCATCATGCAGCTGCTGCAAAGGCAAATGGTCCTGGTGCCCCCTGCCTACAGTACGGTGACGTCCCCCCCTCAGCCCTCGCCCTGCTCCGGCCCCGGGGAGAGGCTGGTCCAGCCGGTCCCCCCACTGGAGCCCGACACCCTGCAGTCGCTCTCACAGATCCTGGTCTCCCAGAGCTCTGAGGGACCCTCTGCCAGGTTATGCGAGTCCCAGAATAGTACGGTGGAGCCTCAACCCCCGGGTTCCCTAGGAACCAGGAACCAGGAGGCAGGGCTCTCTGGCCTGGCCGGTCCCCAGTACTGGCTGGACGGGGTGACGGGGACCTCCGCGATGGACCCCGAGGCACAGCGGAGGCTGTCGCTGCCGGGGCAGCAGGTGGTTCTGGATTCACGGACGCCGCAGAGGCACATCTCTGACCCGGGGAGCTAGGTCCTCCTTGGAGCATCTCATCCAGGTCTTCCCTGTAGTCCCTCCACGCCGAGGAGGAGACCACCAGTGCTCACCACTTCCTACTCGTATTTCCATCAGCTGTGGGAGTTTCCTAGGGTGCTTCCCACCTACCTTGCACAACACTACCCCACTTACCCCTCTTCTTGGCTGACTTGAGGAACCACTGGAGATTAGAGTTTAGACCCATCCATCTCCAGCTCATTGTCCTTCACAGCAGGTCAAGACACTGCAAAGCGTGTAGTGAAGCGAAAGGCTACACTGGATGGACTTTCCCTTTACTGCTGAGACTGGCGTTGGAACAGTGAGACAAACGTGCACAGCGTAGGCACTCAGCCCACCTCTCGTCCACGTTGCTTCCTGACATTGTTAGTGAACTTCTGCGTTAGCTGGCCTAACAGATGTGTGGCTGCTGCCCCCTGGAGTCCATTTCCCAAAGCGCATCCACCAGATGGAATGTGGTTTCTAACTGTTGCTGTAGGGGAGTGGGGTGTTCAAAGCCATTAATTACTGGTGAACATATCACATTCTTAAAATAAACCTTGTACAGATTTTGAATGACAGAATCCTCGAACCATATGCAAACTCAGCAAGAGAAATGTTAAATTATTACAGGAGTGTGTCGATTTTCAGTCCAAAGGTTTGCTGAAGTTTGCTAAGGCCTGTGGATCGCAATTCGTCCGCGTGGTGATCTGCTGGATCCTACTACAGCAATATAATATATAGAGAAAGAGTTCTTGCTCATGAAGACTGTAGTTTTCTGTTAATCACCTTCCATGTCTTCTTGATCCATTCTCTTGGGCGGGTGGTCCTTCTCCCTACCTCCTTCTGGAGATAGTCTTCAGAGTGGCATAGAAGAACTCCTCTGGTGTTCATCTTGGTGAGTGGATGGCAGGTTGTACTTTGAAAGATGGTTGATTGTAATGTACTGCGTTGCACAATGAAATGAAGGTATGTATTGTATGTTTTTTATTTCTTGGGTGTTGTATCTTCTTCAGTAATCAACACGTATTCTTCTGTCGCAAAGAAAAATATCAGAATTTCTCTTCTGATGGAAGAATATGCACTGGATTTTTGACAGTCTTGTGGATCCTTTCCCAAATCCATTTCTGTGTAGTGAAAACATGGCAAAGCAGCTTTTAATTGGACTTAATCCTCACCAGAGATTCCATTTGGTCGAGTTACACACCTCAGTTTGTAATGAACTGTAACAAGGTAAAATTTGAGCTGTCAATCTACTGTATGACCACATATTTGCCAAACCCCAAAATCTATTGGAATTATGAATATTTTTTCCTGTGTATTAGTATGTATTTTTACAAAGTTCCTTACCCAGACTGAACATGAGTCTGAAAATTCACAGCTTGTCCATTATAAAAATAAGCATTGATTTGCATTACTAGTCCTGGGCATTGATATTAACATTCAGTCCAAAGCTGGGCTGTCGAATTCCAGTCCTGACAGGCAGCAGGTTTTTGTTACAGAAGAGATTTTATTAATTAACAATTCATCGATCCTCCCCATCTATGCCAGGCAGCATAGGGCAGATGCCAGGGGTACAGCCTCGATGGATAATCACACTCTGTGGGTGATGTGAAGGTGACACAGAAGTATCAGGTGACAGGGCTGCCTAATAATTTTACAGCAACTGATTTCCTAATTTAGAAAAAATAAAATAAACACGGTTCAAAAACCAGCATCTTGGTTTACAAACTAAACACATTGCTTGTAGACCCACTGCAGTTTAATTTGAATGTGTCTGTGATTTCATTTGACCCTTTGGTCAACAGTAAAGTTGATTATAGTAAATTTACGGTAAAGTAGTTTACACAATTGAAACTGAACAGTAAACCTCTATTGGAACTTAAACCAGAGTACCCTGCAATTCCGTCCAGGACTTAAGTTTCACAGCCCCTTGCAGCAATTCCAAATGCCTTGCCAGTCCCAAAGTAGAGTTTAACTGTTTATTTTCAAATGAGCATATTTTGTGTTTTTAAAGACTTTAACCAGACCTTTACAGCCATTATTAGCATAACCTGTTAATCCCATGAAGCTGATTCAGTTATTCTTGGCAGGTATGAATTTTAGTGTTGAAAGACGATGGGGGTGAGGTATTAGTGACCCCCAGTGATATAGTATTGCACAGTGGACATGTGTAAAGTGTAAGCCAAGTGTTTCTCCCATGTCTGAGGGTCACATGGACTTCTGAGGCACTGTATAACATGATTTACCAATTAACAGAAACCTCAGTCCTCAAATTGTGTTTTAACCTGTGTATATGTACTTAATGTAAAGACATTAATACTGCTTTAGTCTGTAAGAAAAAAAAACATTTAAGCACATGACAGTAACACCACTGGAGTTTTCTATCCCTGATGCCAAACTGAGGGATGATTTCACTTTCCACTTCAACCTTCACGCAGTACTGTAAGATGTCCACTGTTATCCTGTGAATCAGATTGTCTTGTTTCCTCTGATTCAGGTCCATTTCCTTTCTGTACTGCTCTGATACTTGCCCTATTGTTGGCAAACCGCTTACAACTGTAAGTCTCAGCTTAATTTCTGTCATAACCTCGGACCTGTATCATAAAACAGGATTTCTTGGTTAGCTCGATGACTTGTCAGATTTAAGGTAGTCTGGGCTAAATGTATGTGAACAAAGATAAAGTCCATTTAAACTGGGCTACCTCAAATCTGACAGGCTATCCAGTTCAGCAAGAAATCCACCTTCATACAGGCCCCTGCTGTAAAAGTAGCTTTGTTCTGAAGTATCCTCACACGAGGATGTTTTGCTTCCTCAATTCATTCAACTGGTTCGCTCAGGCATTTGAAAACCGTACTGGCTGTCACCTTAACAAACAAAACCTAGGAGCTGTAACGCAAAAAGCAGGATTTCTTGCTTAGCTAGATGACTTGTCGGATGTACCCCGGTTTAAATCGACTTTATCTGTGTTCACTTACATTTAGCCCAGACCACCTTAAATCTGACAAGTTGTCCGGCTAAGCAAGAAATCCAGCTTCGTGATACCAGCCCGCAGTCTTCATCTTAGTACAGGTATCTGCAACAAATCACCTGTAACATAATTCTTACACTGCCTCCTACAAAGGCACACTGCACCCTTTAACGTCTGGAAGATTGTCATTTAAACCTGATGCCTCTCAGTAGACGAGACTGTTTTCATATCGACGGATGTTTCTGATATAGGTCTGGCATTTGTAGATACTCTGACAAATATTTTTCCCTAAAGTAAGTCTACACTAGATTTTTTATTGCCTCTTCCCTGTATATGAGAATCTTGTAATTGAATCAGCCTTGGCACTCTTGTAGCCAGCACTATGCAGAAACTGTCATATCCGTGGCATGCTCCAGAATGCAAACTGTAGAAGCGTTTGTCCAGTTTTTAATAATCATATTCATGATTATATTAATATTAATAATAACGGTGATGGTGCCGATCAAAATAATGAAGATGAAAAAAAATAAATAAACGTTGTGCACATTTTATTTGCATGCTGCACTGAAAATGGAGGGACGAGATTAGCTCTGGGCCACTGGTTTCTGGATCGCCTGATCGGCACGCGTTAAGATGCTGTGTCAGAAAGCAGTAAATGCATACTAACATGCCAGAAGGAGACCTGAAGAAGAACAGTGAGCCCAACACCTCAAGGAGAATTAATTCTATAGCCATGTTTATATCAAGCACCAGTGAATTGGAGGAAATAAGCTATGGGGTCTTGACTGTGTGATGGTACCATAAACGGATGAAATGTCCAACTTTTCCTTCAATAAACCTCTTTGAAAGCAA
>XM_035091360.1 PREDICTED: Chelonus insularis ras-related protein Rab6 (LOC118071888), transcript variant X2, mRNA 
CGTCACTTCCCAGTCAAACGTGGCGGCCGCGACAGGAGAACGAAGGAGTGGCTGTACGATCTGTCAAGTTGCTCAGTTTTCATTGTGTATTTAATGTTTTTTTTCGTAACTGGATTAATAATTGTGTAATTACAAGTAGATCCAGTAGTATTATTAATAAAACTCATTAGAAACATGTCGTCGTCGGGTGATTTTGGTAACCCGTTGAGAAAATTCAAGCTTGTGTTCCTAGGTGAACAAAGTGTTGGGAAGACTTCTCTTATTACACGTTTTATGTATGACAGCTTCGACAATACTTATCAGGCTACAATAGGGATAGATTTCCTGAGTAAAACCATGTATCTGGAAGATAGAACTGTTAGACTGCAGTTATGGGATACAGCTGGTCAAGAGAGATTCCGTTCTCTAATTCCAAGTTATATTAGAGATTCTACCGTTGCTGTCGTTGTTTACGATATTACTAATGCTAATTCATTTCACCAAACATCAAAATGGATTGATGATGTACGAACGGAGAGAGGCAGTGATGTTATTATTATGCTTGTTGGTAATAAGACGGATTTGAGTGATAAACGACAAGTTTCAACTGAAGATGGAGAGCGTAAAGCTAAAGAATTAAATGTGATGTTTATTGAGACTAGTGCTAAGGCAGGATACAATGTCAAACAGCTATTCAGAAGAGTTGCTGCAGCATTGCCTGGTATGGACTCCACAGAAAATAAACCTCCAGAAGACATGCAAGAAGTAGTTCTCAAGGATACACCAATTGAACTCAAAGCGTCGGAGAGCAATTGTTTATGCTAAATCAAGATAAGTCATAATAGACAGACTTACATTTCTACACTCCATAGACACGAATTAAACAAAATTATAAACAAGATTCGTCGTCAATTGGTGCGCTAACGATCTTGACAGATCACAATTGTAACAATAATTTTTACCCACATATTAAACAGTGCGATTTTTTAAGAGTGGTGCACATATCCAATATTTTGTATAAATTGCTCATTAATTTTTATTTCCGGGAATCATTCGTTTTTATCAGCATTTACAAATGATGAGATCAATTCTTTGTACTCATTTTTATCGCTTTATCCATGCTATTCATCGTGACAGCCACGGCACTAATAATTATACATTAATCATTTATACAAAAGCAACGATTAACTATTTTCAAATTATAAAATTCTTATTGATCACTTTCGTTATCAATTTATATACATTTTCATATTTACAACAAAA
>XR_006035448.1 PREDICTED: Aricia agestis torso-like protein (LOC121725853), transcript variant X2, misc_RNA 
GTCAGTTGTGCCGCGGGGCGCGTGTTGTCGCGATGTTTCTGTCGCGTCGTGCTGTCGTGTTGCTGTCGCTGTGTTGTGTTTGTTGTGACGAGGACCTGGGATACACTCTGACCATCGGCAATGCTATTGACGTGTTTGCCAACTACGGTGACCTGTCCCAGGTGACGCAGGTGGTGTCAGCAGACTACGATGACAACGAGGGCTCGGAACCCTTCAGGGAGAAGAACATCAGACTGTTTGAGAACATCAGCAGCCGCCAGACGCCGGGGGATTCCCACTTCGACATGAACATACAGCTGTGCGAGACCTTCGATGACTTATTGGCAGTGTACTTCAAGAACTTCAAAATAGAAGGTACAGACAAACCATGGAAGGCTTTCTTAGGAGATTGGATACTGGACGAGATCATGCGGACTTTCGGTATCGAGTACGACGCGCGGCCTGACAACTGCTGCTACGTGCTCGTGAAGTTGACCAAGGTCCACACTGCGGTGCAGGTAGAGTCAATGGAACGAGTCCGCGTGCGGGAGTACGTACAGCGCGCGGTGAACAGCCTCAACGTGAGCGACGGCGTCGCGATCAGACAGTTCATGAAGAGCTACGGCACGCACTACATCGAGTCCTTCGCGACCGGCAACTTTATATACCAGGTGTTTAAGTACAAGCGGTCTGGGTACAACCGTCTGAAGGCGTACATCAGGCTGCGGGAGAAACACCAGATCAACTCCGACAGTCTCAGGTTCTACTTCTCCTCGTACTTCCTCAAGCAAGTCGGAGATATCCGAATAGCAAGCGGCAACAAAGTAATAGAGGAGTGGGCGCGAGACAATCTCAGAGACAGCCAGTATCTTTTCTCACGACCGAGTCTACTCCGACTGCACTTCAACCCAATACTGGCGTTCAAACTCAACGAAATGCTGGACAACGGAGCGCTCCTATCGTTGAGTTTGAGAACACTCAAACCGCTATTCAAAGACGAATACAAAGGAAGGGTATTTGCGGAGTACGTGGAAAACGATATGAGGCTATGGGAAATCAATGCTTAGATTTGAAATTTTGTAGAAAGAATGACATGGAGTTAATTTTCAAGATGCAGGTACGGTTAAATAGTCAATACTTATGACGAGAGTATGAAAGAAATACAATGGTGAGAATTATAATAATAGATTTTAAATTTTTAATGTTGGTGAAATATTTACTTAAGTTCACCAATAGATGGCGTAACGTTCATATAGAATTAAAAAGT
>XM_009873997.1 PREDICTED: Apaloderma vittatum cytoskeleton-associated protein 4 (CKAP4), mRNA 
ATGGGGGTTGCGGTCAGTTCGGTGCGTTCCCTTCAAGCAACTTTTGGAGAATTTGAATCCATGATGAAAATTGCTCAGCAGAAGCAGGAGGTTACTGAGAGGGCTGTTAAACAAGGGGAGAGTGAAATAAACCGGATCAGTGAAGTGCTTCAGAAGCTGCAAAATGAAATTTTGAAAGACTTGTCTGATGGCATCCACATGGTGAAGGATGCAAGGGAACGAGATTTCACGTCTCTGGAAAATACAGTGGAAGAGAGACTAACAGAACTAACCAAGTCTATAAATGATAACATTGCTGTATTCACAGAAGTCCAGCAGAGGAGCCAAGATGAAATCAACAATATGAAAGCAAAGGTTGATTCACTAGAAGAAGCAGATGTGTATAAACAGGAAATTAAGGTGCTAAAAGATGCTTTTGCTGAGATGCAAGCATCCATGAAAACCAAAGAAAAGGACATAGAGACCTTGAAGAGTACAATAGACTCCATGGAGTCTGATGTGTACACTGAAGTGAAAGAGCTAGTCAACCTCAAACAAGAACACGAGAAATTCAAAGAGGCGGCGGACACTGAACACCTTTCGTTGAAAGCTTTACAAGAGAAAGTTCTGAGAGCTGAGGATTCTATCATGCAGCTCCCTGGTGACATTAAAAGACTTGATGAAGACTTACTGCAAGTTAAAGCTGACCTTAACAAATGGGAGGAAAATGAACTCTTCAGAAAAGCACTAGAAACTTTCGGAAAGAGCAGTGAAGGGCTGGAATCTCGATTGAGGCACATAGAAGACAGCTTGGAATCTCTAACATCTGTTGCTGCTCAAAACAGTGAAAAGATGCAATCCTTCCTTTCTAAGGAGGCAGAGTACGAGAATAAGCTCACTACCTTAGAACAAAGCGTTACTGCTCTTCAGGGAGTCTTCAATATGGACGTAACTTCAGTCACAGACACTTTGAAAAATCTCGGTGAATCGCAGACCTCACTGTACAATGACGTGGAAAACTTGAGGAAAAGCATCAGTGACCTGCCATCCTCTGGTGTTCTTCAGGATGTCCAGAAGCAAATTAGTACTTTGCTGGATCAAGGAAATCTTCAGACAGATCAAGCACATTCTCAAGGTTATCTTGACAAATTTTCTTCTGTGGAGGGCTCTGTAGATGAACTGAGATCTTCTGTCAGCCAGGTTGATTCCGATTTGAAAATGATAAGAACTGCAGTGGATAGTTTAGTCTCCTACTCGGTGAAAATTGAAAATAACGAGAACAACTTGGAGTCTGTGAAGAGCTCAGTAGACGACTTGAGGAATGATCTGGAAAGGTTGTTTGTGAAAGTAGAAAAAATACATGAAAAAGTTTAG
>XM_014296803.1 Sphaeroforma arctica JP610 hypothetical protein partial mRNA 
ATGGGTCAGAGAACGTCAACGCAGGTAGATAAGCTAGCTAAAGCATTCAAGAAAGGGTTAAATAGTAAGTTACCTGAAGCTCAGAATACAACCCTCGAGGCGTTATTGAAGGACATGCCAGAAGTTCACGATAGACTTATGACATTGTTTAGTGAAAGTAATGCTGTATCAGCAGCATCAGCAAAACGCACTTCGACGGGCGAACAAGAGTTCAATGATGATGAGCAAGGTCAAGAGACTGATATTGAGGGAGAAGACGAATCTCCCTTACAACGTGACATGGATACAGAAGAACTGATAAGGAGAAGTGTTAACGATGGGTCAGAGAACGTCAACGCAGCATCAGCAAAACGCACTTCGACGGGCGAACAAGAGTTCAATGATGATGAGCAAGGTCAAGAGACTGATATTGAGGGAGAAGACGAATCTCCCTTACAACGTGACATGGATACAGAAGAACTTGAAGTTCACTATTGGGTTGTACAAGATCACAATCTAAAACATGTTAGTGAACGACCTACTCTACGAGATGCCCAAGAAGAAGGGATTGATCATCCCAGACTCAGGGCGATAATACGTAAAAACTACAACTCCTGTAGGATTGCGAATATAATCAGATCAAGCGTTATGGATTCGCGCCACTAA
>XM_018329607.1 Xylona heveae TC161 zf-DHHC-domain-containing protein partial mRNA 
TCAAAAAGGCACACTTGGTCTCAAACATCACGCTTTGCATCAAAGGCCAACACTTCTTTGGGGGGTGTCACCACCGGAAGCGAGATAGGGACAGAGTCAAGGAGACCTCAAAGTTCGGCGAGTAAAACGCATGTGCCATCGCTTGCTTCACATGCTTTCTTCCGTCCACTGAGCTCGCAGAGGCTTCAAGCTCAGCGAGGGCGTCCTTCGCCAGCCACCTTCGTTCCAGCTAAAGAAAATGTGCCTTTAAAAGACGCAGACTCTGAGATAGCGCATGAATTGGATTCAAAGATTAATCAGAAAAGGAACTCCGCTGTCCTTCTTGATAGTGAAAAAGCGCAGCCACCGTCAAGGGGTACTGAGTGCACCGAGTTCCATGGGCAGGAAATGATCACAGGCGAAGTTAGCCCTGCTGCTAATCGCACAGGCACAAGCACTGCCGGCAGTGCGCATCCTTTGACCCAAGCTTCTCTGGCACCCAATGAGCCGACCGGGACGGTCTTTCGAAGAGGCTCCGCCTTTTCGTCACCTCTCGAGAAAGATCAAGGCTCGTTTCGCTCAAATTTCCTTTTACCAAGTCAGAATTTAGAGCTTCGAGATAATCAAATCATCGGTCGAGAAAAGCTAGCTTCTGCAGATTCTTCGCCACAACTTGGGCCCTACGAGACAAATAATCACGTGAGGAGAGATTCGGAGCGCAATTATCAATATTTTCCTGGAAACACTGTCTTCTGCTTTGGCGGGAGGCTTCAAAATACCAAAGATCGACCAGTTAACATCGTCACTTTCGTCTTGGTCATTCTGCCCTCGGCTCTTTTCTTTGGTTTCTCTGCTCCATGGCTCTGGCTGCATGTCTCGCCCGCGATACCAATTTTGTTTGCGTACCTCTTCCTCATATGTGTTTCCTCCTTCACTCATGCCTCTGTTACCGACCCTGGGATACTACCGCGAAAAACCCAACCATTTCCTCCTGCGAATGATGCAGACGATCCTCTTACCCTTGGGTCGCCAACGACTGACTGGACTCTGATTAAGTCAGCTGCGTCGCCCACCTCTGCCATGGAGGTTCCAACAAAATACTGCAAGACTTGCAACATTTGGAGACCTCCTCGGGGACATCATTGTCGAGTTTGCGACAACTGCGTGGAAACGCAAGATCATCATTGCGTGTGGCTCAATAACTGCATTGGTCGCCGAAACTACCGATTTTTTATATCCTTTGTGGCTTCCTGCACGTGTTTAGGTCTCTTTTTACTCGGCGCCAGCCTTGCTCATATTCTTCTATACGAATCCAGAGAGAGCATCTCATTTCGGGACTCAATCAGTCATCTGCGAGTCCCCTTTGCTATGGTTCTATACGGAGCCCTAGCGACGCCTTATCCCGCATCTCTTTGGGGTTATCACTTATTCCTGATGGCACGAGGCGAGACAACAAGAGAATATTTGAATTCTCACAAATTTTTGAAGAAGGACAGGCATCGTCCATTTACGCAGGGCAATATTCTGAGAAACTGGTTAGCGGTCGTCAATCGGCCGAGGCCCCCAACCTACATACGATTCAAGGAAAAACACGAGGCCGGTGACCAAAGGTTTAATCTTCGGAGA
>AB364225.1 Uncultured bacterium DNA, ribosomal RNA intergenic spacer, clone: Amplicon22-5 
CCGGAAGGTGCGGCTGGATCACCTCCTTTCTAAGGACGAAAAGCGGAAGCGCCGCGTTCGGCTCTCGAAGCCAAATGTTCTTCACCCGGAGGGGTGCTGGCACCCCGAGGGGGAAGGTTATTTGGCAGAAGAGAGCCAGGCGCTGGAGCTAGACAAGACGAAAAGTGGAGGCCGCAATGGCCAACTGTCGATACACAGCGCTTCTGTTTCGTTCAGTTTTGAGGGAACGAGTCATGTTCTCTCAATGACAAAAATCGTTCCTTGAAAACTAGATAACCGGAAAAGCGGAGGCGAGTGTTTCGCCGCGATGGGCAAATGTTCTTCGCCTGCAAGGGTGCTTGCACCCGGAAGGCGAAGGTTATTTGCCCCCGAGCGGCGGCGAGCCGACGCTAGACAATAAGGAAGAAGCCGAGAGCGCTGTAGGTTAAGCTAGAAAGGGCGCAC
>XR_002421788.1 PREDICTED: Columba livia uncharacterized LOC110363588 (LOC110363588), transcript variant X2, ncRNA 
CTGCTCTGGGGATGTTCTTTGTGCCCTTCGTGATGTGCTGCTGGGAGATTGTGATGTCAGTGGATGTCGAGATGATTTTCCCAGCTATCATCCCACTGCACATTGGACTTCTTCCCCAGGATCTGCAGCACCTTTCTGTGAGACATCACGCTTGATGAATATTGACATGGAAATAATGACTGCCCATTGCTACAGTGCCACTTGTGTTATCTGTTGGAACTAAAGCCTTCACTTCTTAATAAAAATAAACTTATAAAATC
>XM_031706046.1 PREDICTED: Actinia tenebrosa lysosome membrane protein 2-like (LOC116297758), mRNA 
CACCTGATTGAGTTTGAAGGCCATTCAAGGTTCGGCATCTGGTGAAGTAAAAACTGAAGGACTGGAATCTTAGCTAGCAAGCTTCATTCAGCCATATTTTAAACTTTMCACCACATAAAAGCTGCATTTCTCCATCAATAATGGAAGAGAAATCAGAAAAACAAACAAGCTGTATTTACGGGGGAAAGAAGATTGCAGTTCTTTTGACTATTGGAGTGCTGCTAATATTGGTTGCCGTCACTTGTTATCCTCTGATCGATTCTTTGATTCAGAACAAGATCGATTCAACTCTGGCGTTGAAGCCTGGCTCAGATAGCTTCAAACAGTGGAGGGCACCAAAAGTTTCGATTTAYCTTCAGTTTTTTATTTTCCATGTTGTTAATTATGAAGAAGCATCGCTTGGTTTACCTCCTTATGTTGTGCAAAAAGGACCTTACTCGTACAAGGAGTACAGACGAAAGGACAACATTACTTGGCACGATGAGAACTCTACTGTGTCTTACAATGAGAGGCAGTGGTTTGTGTTCGACCCAGATACCTCTTGTGCAAAATGTGATCCTGTTAGAGATGTTATAGTAAACGTGAATATTCCCTTAATCGCGATTGCTAATCTAGTGAAGAACTTCCCAGATTTCTTASGCTGGAAAGAGCTGTTATCTTTGATATTGGGCAATTTCAATGAAACGCTTTTCGAAAATAGAACAGTACAGGAACTTTTGTGGGGATACGATGATCCTTTTCTTGCAGAATACGCTAAGTTGAGGAAAAAGCTCMATCTCACTAGTATTCTTCCAGATGTCGATCCTCTCATAGCTTTGCAAAAGAATGATACTTATTCAGGATTCACAAMAGTCCACACTGGAGTGAAAGATATAAACTTGATAACTAAATGGACGGAATGGAAGGGAAAACCAGATGTGGGTGTATGGAACACGACCTACGCCAACATGCTAAATGGCAGCGATGGTACTCAGTTTCCTCCGCAACAGTCAACTGATAGTACACTCTATGTTTTCGTAACTCAGCTTTGCCGTTCATTATACTTGACATATAATAAACAAATAGCAATTCACGGAATTGATACTTTGCAGTTCACGACTCCAAAAGAGCTTTACTTAAATGCCTCAATGAATCCAAAAAACAAGGCATTTTGTACAAAGGAGTGTTACCCAACTGGAATATTAGACATTGGTGTGTGTCAGGATGCACCCATAACAATCCCATTGTTTGTGTCTGCACCACATTTTTATCTTGGAGATAAGTCTCTCACAAATAATGTGAAAGGTCTCTCTCCGAATGAAAAAGACCATGGAACATTCCTGGACGTTGAGCCACACCTTGGTGTACCGCTTAAAAGCAGCAAGCGACTCCAGATCAATGCTCTCATTGAACCAGTCGACGACATTAAACAAACTCAGAACCTTCACAAGTTATTCCTTCCTGTCATGTTTATTAATGAGACAGCCACCATTGATAATAGTCAGGCGCAAATGATCAAAGACAAAGTGTTGATGCCATTCACAGTTGTTCATGGTGTGGAGATAGGACTGGTTGTTCTTGGGGGCGTGCTTTGTTTGGCAGGATTGATTTTATTGGTGCTTTTGATTGACAGAAATAGGAAACTCAAACAGGTGAAAAACATACTATCAAACCCTGATGAAAACTCACCTCTTGTAGTCAGCACTTAGTAACATCATCTAGATTATGATCTTTTAGTTTAATATTATTAAAAGATCATWTCTATATTTAAAAAATGTCAAAAAGGCTAAGCTGAG
>XM_028718607.1 PREDICTED: Podarcis muralis ubiquitin specific peptidase 4 (USP4), transcript variant X3, mRNAXM_028718608.1 PREDICTED: Podarcis muralis ubiquitin specific peptidase 4 (USP4), transcript variant X4, mRNA 
AGAAGGAGGGATTCCCTGCCTCCCTGCCCTTTCACTTCAGCGGAAAGCGGCCCCTTCTTCCTCAGCGTCAAAACACCGCGCTCGGCCCGGCGCTCCCTGCCCTCCGAACGCCCGGAGGCGTCGCCGCGCCTGCGCAGTGCCGTTCTGTGCGCGCGGCGGCGGCGGCGGCTGGGCGAGGAAGGATATCCGCAGTTGGGGACGGCCGGCCGGGCGAAAGCGCTTGCAGTACTGTCATGGCGGCAGCCGAAGTAGGGTTAGACGGCGGGGGAGGCGGCGGCGCCGGCCTGAGGCCGGACGCCGGGACGCAGCGGGCGGAACTTATGCCGCTGCTGGGGACGGCGCTGCGGCCGGGAGAGTCGTGGTTCCTAATTGACAGCCGGTGGTTCAAGCAGTGGAAGAAATACGTGGGCTTTGACAGTTGGGACTTGTACAACGTTGGAGAACCTAATCTCTTCCCGGGACCCATTGATAACTCGGGGCTTTTTGCAGACTCAGAAGCTCAGACTTTGAAAGAACATCTCATTGATGAGTTGGATTATGTGTTGGTTCCTACTGAAGCCTGGAACAAATTAGTAAATTGGTATGGTTGTATAGAGGGACAGAAACCAATAGTGAGGAAGGTTGTGGAGTATGGCCTGTTTGTGAAGCACTGTAAAGTAGAAGTTTATCTTTTGGAGCTGAAGCTGTGTCAGAACAGTGATCCTGCTAATCTTACGAGCTCTTATTTCAGCAAAGCAGACACTGTTGCTACTATTGAAAATGAAATGCGAAAGCAATTTAATATTCCTGACGGAAAAGAAATTAGACTGTGGAGCAGATACATGAGTAATACTTATGAGCAGCTAAGCAAACTCGACAGTACTATACAAGATGCGGGGCTCTATCAGGGACAGGTAGTGTTAATAGAAGTGAAGAATGAAGATGGTACGTGGCCCAGGCAATCTCAGACAAAAGGTTCTAGCTTTTCCTGCAACTCCTACAACAACAGGGAGAGCCCTCCTCAGTCACAGCCTGGTCTCTGTGGGCTCAGTAACCTAGGAAATACATGCTTCATGAATTCAGCTTTACAGTGTTTGAGTAACACCCCTCCACTGACTGACTATTTCTTGGAAGATGAGTATGAACCTGAAATAAATCAGGAGAATCCTCTGGGAATGAGAGGAGAAATTGCAGAAGCATATGCAGAACTCATCAAACAGATGTGGTCTGGGAGAAATTCTCACGTGGCCCCCCGCATGTTCAAAACCCAGGTTGGCCGCTTTGCTCCTCAGTTTTCAGGGTACCAGCAACAAGATTCCCAAGAGCTCCTGGCCTTTCTTTTAGATGGTTTACATGAGGATCTAAACAGAGTAAAAAAGAAACCTTACTTGGAGTTGAAGGATGCTAATGGCAGGCCTGATTCGGTGGTAGCAAAAGAAGCTTGGGAGAATCATCGATTGCGTAATAACTCTATAATTGTAGATATTTTCCATGGTCTCTTCAAATCCACATTGGTCTGCCCCAAATGTTCTAAAGTTTCCGTGACTTTTGACCCTTTTTGCTACTTAACCCTTCCATTGCCCTTGAAGAAAGATCGAACCATGGAGGTTTTCTTGGTTTTTGCAGATCCACAGCGCAAACCTACTCAGTACAAGGTAATTGTGCCAATGATGGGGGCTGTATCTGACCTGTGTGATGCACTCTCAAAATTCTCCGGGGTTCCTGCAGAAAACATGGTGGTGACAGATGTTTATAATCACCGATTCCACAAAATTTTCCAGATGGATGAAGGCTTAAGTCAGATTATGCCAAAGGACAACATCTTTGTATACGAAGTTTGTAAGTCAACGGAAGATGGTGCTGAATGCATCACTCTTTCAGTTTACTTCAGAGAAAAGAAAGCAAGACAATCCAGTGCTGCTCCGGGGACTGTTCTCTATGGGCAACCACTACTCATAGCTATACCCAAACACAAGCTTACTCTAGATCACTTGTACAATGTTATATTGGAGCGGATTAGTCGCTATGTTAAAGTTTCCTTAAAAGAAGAATGTTCTGAAGGATGTCCAGATAGTGAGAATTGCAATGGCTCCAGTAATGTGTCTGAAGGTGATGTTGAAGAAATGGAACATCAGAATGGAGAGGAAGACAGTAAGGAGAAAATATCAGAAACAGATGCCTGCAAATCAGAGGACTGCATCCAGGATGACCTGGAAAAGGAAGGCCTGCATCACAGAAGGCATCTCTTTAGCTTCAGTCTTGTGAACTCTTATGGAACATCAGAAATAAACTCCCTTAATACAGATGGGAAAATCCTCAAGTTGAGTTCTCATGCAACTCTTGCTATTGATTGGGATTCTGACACCCGAAAGTTGCTTTTTGATGAACATGAGGCACAGGCATTTGAAAAACACAACAGTATGTTTCAGCCACAGAAGAAGAAAACTACCGTAGCTCTGAAAGACTGCATAGAACTGTTCACTACTATGGAAACACTTGGTGAACATGATCCATGGTACTGTCCCAATTGCAAGAAACATCAACAAGCCACTAAGAAATTTGATCTCTGGTCACTTCCACGTATTTTAGTAGTACATTTAAAACGCTTCTCATATAACAGATACTGGAGGGATAAGCTTGACACTGTGGTTGAATTCCCTATCAGGGATTTGAACATGTCTGAGTTCGTTTGTGACCCAGCAGCAAGCCCATATGTGTATGACCTCATTGCTGTTTCCAATCACTATGGAGGCATGGGTGTTGGCCACTATACTGCATATGCTAAGAATAAAGTGAATGGCAAATGGTACTACTTTGATGATAGCAGTGTGTCTCCAGCATCCGAAGAGCAAATAGTGACAAAAGCGGCATATGTCCTCTTCTACCAACGTAGAGATGGCATGCTCAAGGGAAACCCCGCTCCTTGCATAAGCACTGAGCTGAAATCTGAGGAATGTGATGGCATGGATACCAACTGAACCTATGTGGTGGGGTTTAAACAAGTCATATTGCTAATTTTAAAAAGCATCCAAGAACTGATTTTTGTAAGAATCAAACAGGAGTTTCAGTACAGAAGGACTCAATGAGCAGTAACTATGGATAGCATAGGGAAGCAATAAGATGTCAAGGACTTGGGTATATCATAGCCAAAGAGCTTTTAAACAAATAGTTATTCAATAAAGTGTTATCTAAATCTGACTGTGTAGTCTGGCAGAAACTGTGTGGAAGCAGGAGCTTATGCTGTATGACTGGAGCAATGCATGAAAGTGCGAAACAACATTTGACTGTAAGTAGAATTCTGGTTTGAGCTCTATGCATTGCAGAAGATGCCTGAGTGCTTGTGTTTCCAGAGTAAAAGAGAAGTGAACATTTGGCACAAGTTCCAATCTCGCACAGCACATTTTGGCACTATGTTGCTGTCAGTCCCTTGCTGACATGGCATGGTGAGCTTGTGTGTGCTTTTAAGAAAAAGAGAAAATTGCATATTTGTTCTGGCTCATTGTGTCCCATACAGGAGTCACAATCCCCACATTTTCTTGTTCCGTTCTAATAAAACAATTATTTAGGATCCGTCCCAAAGATTAACTTTCCCCCACCCCCAGCCTTTCCAGCAGCAGTATTCATGGGGCCTATTCTTCACACCAACTCACATGGAGCCTTATATGCTCCTGATCTAGTTGGTAACTTACATATTGTGCAATCACAAGGCTTCTTTATTCAAGTGTCTCATTGGGGAGCTAAAATAACTTTCCCTGGTAGTTTTTTTAAATTCCGCTGTCAACTGTCTTCTATTTCTGTGCACTTTCAGCCACACCAGGAAAAGTTCAGAGTCCATCTCTTGAAGGCTGCATAGGAATCAGTGTCCAGTGGAATATGTCCTTTTGGGTGGTCTCAGACACGACACACTATTTTTCTTTTTAGCCATTTTATTTCTCTTTTTGTAATCTTTTGCTATCCTCATACCTCCTTAGTATTTTTTCCTCATTGGCTGAGAGATGGCAAGAGTAAATGTTGTTTGACTTCTTCCTACCCACAGCCTCCTCCTCCACGGAGGATGATAGACAAGAACCTTCTAGGAAAGGAGCTTTCAGGTAACACCGTGGAATTCCCATGCACACTGCTATGACACCTTAAGACATTTCCCATTTAGTGTCATGGCTTTGAAACTATCTTGGCACCTGTGTAAAGGTGTTTCACTTTTGTGCTCTGAACACATTCCCACGGATTCCCTTCAGCAAACTAAGAAGTATTCCTCTCCCAGACTGCTTCTGTGCTGATCTTTATCGGCATGACGTCAGGCAAGTGGTAGCCAGTGGTATCGTCAGGCCACACCATTTTAGCAGAACTGATTAAAAGTGATCGTGTTCTTTTTAACTTACAGAGCAGAAGAGTCCTCATTGCTGTCAGCTGCATTTTCCTCACTATTTTCCAGTGATTACTATTGCGTTCTCCAGGATAGTCCTTTTAAACACTGAAATTTGAGCTGTTTGGTTCAGTTGCTAATGCTTCCAGGTTCTTTAATTGATTTGAGGTCTTGTCTCAACTGGATATTATTTTCCTGCACACTTGGGTTGGTGGGTGGGGTTAGGGCTGGAATTATTTAAAGGCTAAGTTCAAACTGTAGCATTGCACTGTTTTGTTTTTTCCTGTTTTTCTGGGTTATATTTTCTTTGGAATGTAACATTTGGACCGATAAGGAAACAGATATTTAAAAGCAAAGAGCAATTTAATGTAACCATATGTATTTCTGTTCCATACTGTTGCAGCAAACTTTTCACTGCTCTGTATGGTCAGATAGTGTGCACATTTGTGTTTGGGTGATTTTTGGGCTCCTGAACTAAATTTCTTCTAAATGCTGTAAAGATGGTATTAGGAACCTGGATTTGCCTCTGACCAGGCTGGATCCTAGCTGGTGTGTACATTCTGTATAGTGTCAAAATCTGTTTTTAGACTAGCACTTTGTAAGTGACTGGCTTTACTGTATAAAAGGAAAAAAAATTAAAAAGAAGTGGATTGCA
>XM_029695648.1 PREDICTED: Salmo trutta inaD-like protein (LOC115151590), transcript variant X3, mRNA 
CCTCCCTTCTCTCTCCTCTCTACGTTTGTTCTCTGTAGATTCTCACCATATTTCAGTATGCCTGCTCAGCCTTGCTCAAGGCAGCGCTGCCAACCAACACCACGAGGTTGACAACGGACAAACACACACACAAACACACACACTGGCGCATGGGGATGTTAAACTCAGGATTGCTGGGAGAGTGAAGCATGGACCATGCTGCCAGAGCGGATCAGGTTGCGTTACGGGGAGCTGCGCGGGGAGCTGCTGTGTGTGGAGCTGGACAGGGAGCGCCAGGGCCTGGGTCTGAGCCTGGCGGGGAACAAGGACCGCTCCTGCCTCAGCATCTTCGTGGTAGGCATCAGCCCTGGGGGCCCCGCCGCCAAGGACGGACGCATCCGCATAGGGGACGAGCTGCTGGAGATCAACAACCAGGTCCTGTATGGCCGCAGCCACCTGAATGCCTCGGCCATCATCAAGAGCACCTCGTCCAAGGTCAAGATCACCCTGATCAGGAATGAAGATGCTATCAACCAGATGGCCGTTCCCCCCTTTCCAAACCCTCCTGCTGTCCTCTCCTCCACTGAAACCCATCCCCCCAAACCAGCAGCAGTAGCATCCCCGGGCCCCACAGAGAAGTCTCAAACCCCAGAGAGCCTGGCCCTCAGCAGGGGACCCCTGGAGGCCTCCATCTCCATCAGCGAGGTGAAGTCCAGTGTTGGGTCCAGTGGGAGCACAGCTACAGAGCTTGTTTCCAGAGAAGCAACACTCAAGATCCTCCGAGAGACTTCCTCAAAGAAGGCCTCAGAGAACGAGGCTGAGTCTTCAGAGAGCGTGACTGTGCCGGCTGCCAAGGCCCCCCTGGAGCAGACTGCTCTCCTGTCCAAAACCTGTCGGCTGTCCTGTAAGCTGCCTGTGGTGAGCTCTGTGAAAGGGGGGCTGGTGCCCACCCCTGCCTCTTCCCTGCCTTCCTCCTGCACCAGCCCAGACTTTGAGTACTGCAACAAAGACCCAGCCACGTGCCCTATCGTTCCAGGCCAGGAGATAATCATAGAGATCGCCAAGGGTCGCTCTGGCCTGGGTCTCAGCATCGTAGGGGGAAAAGACACCCAGCTGGATGCCATAGTGATCCATGAGGTATATGAGGAGGGGGCGGCGGCACGCGATGGACGACTCTGGGCTGGAGATCAGATCCTGGAGGTAAATGGTGTGGACCTGCGTAACGTGGCCCATGAGGACGCCATCACAGCCCTAAGGCAGACCCCGGCCAAGGTGTGTCTTAAGGTTCTGCGGGACGAGGCGAGGTACCGCGACCAGGAGAACCTAGATGTGTTCAGTGTGGAACTGCAGAAAAAGGCCGGCCGTGGCCTGGGCCTCAGTATCGTCGGCAAGAGGAACGGCACAGGGGTGTTCATCTCGGACGTGGTGAAAGGAGGCGCCGCCGAGCTGGATGGCCGGCTGATGCAGGGGGACCAGATTATCTCTGTCAACGGAGATGACATGAGGTCTGCCTCGCAAGAGACGGTAGCTGCCATTCTCAAGTGTGCCAGGGGGGTGGTACTCCTAGAGCTGGGCCGACTGAAGGCTGCCTCCTGGATCTCTTCCAGACGTACCTCCCAGGAAAGCCAGCAGATGAGTCACGTGAGTGCCAACAGCACTATCGTCACGCCCCACCCCCCGCTAAACTCCACCCCTTCCACCTCTCAGCTCCTCAATAACGTCAGGAAGCCAATGACGGTGGGCATGACATCATCACAGAGCGCAGAAACAGGGATGCGCACTGTGGAGATCACAAGGGGTCCTACTGATGCGCTGGGGATCAGTATAGCTGGGGGGAAGGACAGTCCTCTGGGGGATATCCCCATCTTCCTGGCCATGATACAGGCCAACGGGGTGGCAGCCAAGACGCACCGGCTCAAGGTGGGTGATAGGATCGTGAGTATCAACTCCCAGTCTCTGGAAGGCCTGTCCCATGGGGATGTAGTCACCATGCTGAAGAATGCCTACGGCAGCATCATTCTGAAGGTGATTGCTGACACTAACATCAGTGCTATAGCCAGTCAGGTGGAGAGTATGTCGACTAGCAGCAGCCCCGAGACACAGCCAGGGGAACCAGAAGCCCCCAAGCCCAAGAGTATCTGCCTGGAGAAGGGTTCTGACGGCCTGGGCTTCAGCATCGTAGGAGGCTTCGGAAGCCCTCATGGAGACCTGCCAATCTACATCAAGACTGTCTTCAGCAAGGGGGCAGCAGCGGTGGACGGGCGTCTGAAGAGGGGTGACCAGATCTTGTCTGTGAATGGAGAGAGTCTGGAAGGGACCACACACGAGCTGGCTGTGGCCATACTGAAGAGACAGAAAGGGGCCGTCACCCTGGATGTGCTGTCCTAGCTCACACACTCTCTACCCCTTCAACTCTCTACCCCTTCAACTCTCTACCCCTTCAACTCTCTACCCCTTCAACTCTCTACCCCTTCAACTCTCTACCCCTTCAACTCTCTACCCCTTCAACTCTCTACCCCTTCAA
>XM_046072427.1 PREDICTED: Micropterus dolomieu transcription factor ETV6-like (LOC123985072), transcript variant X4, mRNA 
TAACAGCATAGGTTTCAGGTTTGCAGCCAGTGTTTTGGAGCAGGGAGGACGTGGCCCAGTGGCTGCGATGGGCCGAGAAGGAGTTTGCCCTGCGGCCAATCACCAGCGGCTCCTTCCAGATGAACGGCAAAGCTCTGCTGCTGCTCACCAAAGAGGACTTCCGCTACCGATCCCCTCACTCCGGGGACGTCTTGTATGAGCTGCTGCAGCACATCCTGAAGCAGAGGAAGCCCCATGTGTTTTACCCGTCTGCCTACTTCCCTGGGAACTCCTTCCACTCGCTGCCTGAAAGCGCTGTGCAGCACCTGAAGCTTGAAGAAACGGTACGGCGGGCACCACGTGGTACGGAGCCACTCCCCCAGCATCCACCAACCATTGAGCTGCGGCACCGCTCCCGCTCCCCCCATCATCCAACCACCAGACGATCCCCTCCGGAGCCAAACCACCCCCGCCAAGCCAATGAGGACCCCCTCCAGACCTTCTCCCAGCTGCCCGACAGCAACCACCACCTGCCCGAGGAAATGTACCCTCTGTCGGTGTCTCCGGCTGCACCCAACGGCCGCTGTGCGACGCCCCGGGAAGCCCCATGTCCGGGCAGCCCTGGGGGCCAGGAGGCGGGCCCTCCTCGCGTCATCCAGCTCATGCCCAGCGCCATCATGAACCCCCTGCTCCTCAGCCCGAGCAGGAGCGGCGGGGGTGCCGCCATGGACTTCAGGCACAGCCGTGGCGGACCCCCCTCTCAGGTGACGCTCGAGAACGGGCGCGAGGGGAAGGTCCACGCCCACCACCATCAAATATCACTCTCCCAGCAGCAGCAGCAGCAGCAGCAGCACCACCTACTGCAGCAGCAGGAGGAGGTGCTTTACCGGAACCAGGTCATCATGCCCGTGTCTCCTCCAGAGGAGCAACAAATACCCATCGGACGGATAGCAGACTGCAGGCTGCTCTGGGACTATGTCTACCAACTCCTGTCAGACAGCAGGTACGAAAACTACATCCGCTGGGAGGATCCAGAGAGCAAAGTCTTCCGCATCATGGACCCCAATGGCCTGGCCAGGTTGTGGGGAAACCACAAGAACAGGACCAATATGACCTACGAGAAGATGTCACGAGCACTGAGACACTACTACAAACTGAACATTATCCGGAAAGAGCCTGGACAAAGACTTCTATTCAGGTTTATGAAAACTCCCGATGAGATAATGAACGGGCAGACGGACCGGCTGGAGCACCTGGAGTCCGACACAGACGAACAAATCTACATCAAAGAGGAATGCTGAGGAAATCTTGGGGGAGGGGATGAGTCCATGAACTACTTACTACTTACTACTACTACAGCCGCTGATGCCTTTCAGAAGCAGCCTGAACAATCGTTGTTGAATCTGGAGCACGTGGATGTGCGCTTGTATCAGTCCCACACAGATGGATGTGAAATGTGGTCTCCCGTAAGATTGCCTTAGGATGACGTTTTCCTGAAGTAAACAGATTTTCCTGATGGAGCGAGCTGAGAGCACTTTCTAAGTGTTCCCTTTTTATTTCTGAATGAACTGCAAAAAAAAAATCACTTTGTGCTTAAGTCACTTTTATGATTTTTATTATTTTTTTGTCCCCTCACATGCATTATACAATGGAATTTTGCTGTTTGTAAAAAGAAAATCGCGTGTGTGTGTGCGTGTGTGTGACAGGAATGTTTTCACCATGGAATAAACATTTTTTGATCAAACTGTA
>MG257935.1 Paenisporosarcina sp. strain SC-Apr-C3 16S ribosomal RNA gene, partial sequence 
GCCTAATACATGCAAGTCGAGCGGAATGAAGAAGAAGCTTGCTTCTTCTGATTTTAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTACCTTGTAGATTGGGATAACTCCGGGAAACCGGGGCTAATACCGAATAATCCATTTTGCTTCATGGCGAAATGTTAAAAGGCGGCTTCGGCTGTCACTGCAAGATGGGCCCGCGGCGTATTAGCTAGTTGGTAGGGTAACGGCCTACCAAGGCGACGATACGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCACAATGGACGAAAGTCTGATGGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGTAAGGGAAGAACACGTACGAGAGTAACTGCTCGTACCTTGACGGTACCTTATTAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTCCTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGAGGACTTGAGTACAGAAGAGGAAAGCGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGG
>XR_003604399.1 PREDICTED: Vigna unguiculata uncharacterized LOC114183599 (LOC114183599), transcript variant X4, ncRNA 
GTAATACCTTTTCACACATTTTTCCAAAATTTTCCTATTCTAACTTTTTTTACTTAAAATTGAAAACCTAAACACCTTCTCCCTCATAGAAAACCTAAACACCTTCTCCCTCAATCAGTCGCATCTCTAGCTTTGTCGCTCACTCTTTCACTCATGATTCTAGCTCAGTTGCCCACTCCGTCACGTGTCACTCTATTACTCCGTCGTAGGCAGCCCTATCATTCGTCGGAGTTGTTCGCAACTTTTAGGAGCTTCCACTTCCGATTGTTTTCCTAACATTTCACTTTCGATTTGCTTGCACTCATGATCATGGCAGGAAACATGTCTGATCCAAGTGGGAGCAAGGGTGCAAATATTTTCATTGTATCTTCTTCCTTGTTTTGAAAAAATTATGGAAAACGCCCTTACATTACCATGATTTTTCTACAAAACTTCTGTTAATAAGGATAGTTCTGAGAAGTTAGAAGGGACATTCTCATTGTCAATTATGCCTGATCGGTTTGTATTTTACTTGGAAGGACATGCTCCTAGAGTTGACCTGCCCATAAGATCAGTAGAGATAAGCTGGTCCACTCCAAATAATAATGTTATAAAAGACTCCAATGGTGGCAACCTTGTTGATATGGAGCCTAGGATGCACAGTTTTGGAAATGGCTACAACTAAACCTCATTGGAGTCAGCATGAAAGGGTTAGTAATTTATGTATGTCAATATATTGGAAGTTTTAGCTAGCTTTTTTATATTTTGTTTCCC
>XM_043838092.1 PREDICTED: Telopea speciosissima uncharacterized LOC122644689 (LOC122644689), transcript variant X2, mRNA 
TCTTCTTAGCTCTTTTTGGAGTCTGTAAAGTTGAGGCATGGGAGTAAAGGTTGCCGCGACCTGTTTACAATGGTCGCAGCCAGTAGCTTCACACTCTCCTTCATCGGCTCAGACGCTAGCCTCTGCAATTTCATCTCCTTCGACGAAAAAACAGAGAGGAGGCGATCGAGTTCTTGTATGCCGATTCGTCCATAAATTGGCTTTCTTGGGAACGTCATCGACGAAGCTTTTGAGATCTCGATCTTGCGATAATCTGAAGTCTAGAGGCCAATTCCTCAGGCGAGCTTGCAGCGCCAACTTAGATGGATACCCTGACGAAGAGTTCACGGAAAATACTCGGGAATTAGCACAGAGGTTCGATCTTTTAAGCGATGGTGATGAAGAACAGAACAATAATTACGACGCGGAGGATGTAGAATTGGATAATTCTGCTGTTGATTCCGGGGAAAAACAAGGCGAGAGCAGCAGCAGGAACATCGACAATTGCAGCACAAATTCGGTACGAATATCCAGTTCTTTTCAGCCACCGAAGCTGGAGTGTGTGCAGCCTCCATGGCTTCATGTCAAGCCGGAACCACCAGACTGGCCAGGAAGGGATGAGATTGATCAGGCGAGTATAGAACGAAAGGCAAATAGCGTGGACCTTCCCTTATCTCTTAGAATGATAAAGAAGAAGATGCAATGGCAAGAAGGTTTCAGACAAGCAGGGGAATCTGCCTACTGCTCGATGAAGAAGGCCTTCTCGTCGATGGTGTTTATCATTCGTGAGCTTCAATGCTACACGTTGCATATGCGAGAGATTCTCTTCTACGAAGACCTCCAAGGTATCCTGGCACGAGTACAGATGGAGATGCACGCCTCATTTGTTTGGCTTTTCCAACAGGTCTTCTCACACACGCCCACTCTAATGGTCTACGTGATGATCCTTCTTGCCAATTTCACCGTGTATTCGATGGGAAACAACGCAGCAATCGCAGCTCCGCCACCGGCGTCGGCTGCCACGGAGATCGTATCGGTGAATGAAAACCAACCCAAGAGTTTTGATTCTTCTTCGGTAATGAACACGTTTTCAGTTTCGTCTTCGACCGGGAAAACGGCCTTCGTGGGAGGACACAATGGCGGCGGCGGTGGAAAGTTCCGGCGTGTGATGAGTGGGACTGAGGGAGATGGACCTTCCGATAGTTCGTCATCGTCATGGAACTATCAGTCTCTGTCTCATCAGGTATCGTCGTTTGGGAACCCCAACCCCACGACGACGGAGGGAGCAGAGTCGGAGTCGGCATCGGTGGTAGAGGCAAATCCGGATGGTTTTGTTGGAGGAGTAAGGAGCGAGGAAGAAATGAAACTGTGGAATTCGATGGTGGATGAAGCTATGAGAATGCAATCGGAGGTGAGGGACGAGTCTCTCGATATCCACACGATAACAAATTTCGTTTCTCCGATAAAGGCAAACATTGAAGAGGAGGACCAATCTGATTACTTGAGGACGGAGCTTCTGTATAAGACGGCCGTGTCTCAAGAGCCCAACAACCCTTTGCTACTTGCGAATTACGCGCAGTTCCTATACGTCGTCTTACACGATCATGACAGAGCGGAGGATTACTTCAAGAGGGCAATAGAGGTGGGGAAGAAAGGAGGAGGAGGAGGAGATGCAGAGGCGTGGAGTAAATATGCAACATTCCTGTGGCTGGTGAAGAAGGATATAGAGGCGGCTGAGGAGACATATTTAGAGGCGCTAGCGGCGGAGCCAGGGAACACGTACTACGCCGCTACCTACGCTCATTTCTTGTGGAACACTGGTGGAGAGGACACTTGTTATCCTCTCGACTCCCCCGACAACGACTTCGACAATATGGTTTAACAAGAAATAGG
>AY015863.1 Lepidium latifolium chloroplast tRNA-Leu (trnL) gene, intron sequence 
TTKAKCCTTGGTATGGAAACCTACTAAGTKATAACTTTYAAATTCAGAGAAACCCTGGAATTAACAATGGGCAATCCTGAGCCAAATCCTGGTTTACGCGAACAAACCGGAGTTTAAAAACGAGAAAAAAGGGATAGGTGCAGAGACTCAATGGAAGCTATTCTAACAAATGGAGTTCACTACCTTGTGTTGATATTGTGTTGATAAAGGAATCCTTCGATCGAAACTTCAAATCAAAAAGGATGAAGGAGAAAAACCTATATTTAGACAATATAGGTAACACAAAAGATCTCAAAAATGACGACCTGAATCTCGATTTCTATTTATTTATAAACAAAATAGGAATGTTGTGAATCAATTCGAAGTTTAAGAAAAAATCAACTATTCAGTGATCAAATGATTCACTTCATAGTCTGATAGATCCTTGGTGGAACTTATTAATTGGACGAGAATAAAGATAGAGTCCCATTCTACATGTCAATACTGACAACAATGAAATTTATAGTAAGATVAAAATCCG
>XM_014048373.1 Monoraphidium neglectum hypothetical protein mRNA 
ATGGAGGCAGCCTTGCGACAGCTGCTGTCATGCGTCGACAGCGGCCGCCGCGACGCCGCCAGCGCGGCGCTCGTGAGGCTGCAGCACGCGTGCCGCGCAGCCGCAGAAACTGGCTGCGCCGCGGCGGTTGAGGTGCCCGGCGAGCGCTCCTTGGACCGACTGCTGCGGCACCTGTCCTTGGCCGGCGGCAGCGCGCGGGCGACCAAAGCGGACTTCAACACATCCCTGACCGCCAACCGGGCGCTCCTGATCCTGCTGAACGTGCGAGCAGTGGCGGACGCCTTTCTGACGGAGGGTCGCGTGGCCGCCCTGGTCGACACACTCGAGGCGCTCGATGGCGGCGAGGAGGGCGGCAGCGGCGGCCGCGAGGGCATCTCGGAATTGCGGCTGTGGCTGCTGACCGCGAATCTGGCAGCCGCGGCGCTGCACTTAGGTCTTCAACGCAACGGGCCCACGGGTGGCGACGTCGACGGCGGCGGCGGCCCCATCAACCCCGCGCAGCTCGCCCTGGCTGGAGTCATTGCGCGGCCGGCTGCCGTGCGCGTGCTTGTGCGGGCGGCGCACACGCAGCTGTCATCAGAGCTGTCTGCAGGGGACCTTCTATCGCCGCTTGAGCAGGCATTCTTGGCTGCAGCTTTCTTGCGAGAGCGGGCTACGCCAGCCCCCCACGACACGCCGTCAGGGCCCTCGTCCTGCGCCGCTGACCTGTTTGCCGCAGCGCGCGCGGCGTGGCAGGGCGCCGACGCCAATTGGCTCTGCGAGGCGCTGCCGCCGCTGCTGGCGATGCGACTGGAGGAGGCCAGGCAGCGGCAAGGGACAGGGCCCGGCGGAGAGGCGCTTGAGCCGCACGCTGCTCTGTTCGTGGCCTTGCACTTGTGCGCCGTGGTCGGTCCCCTGAGCAGGGCCCTGTCTTTGCACGCGGCCGCCATGCGCGCGGTCGCAGCGTGCATTTGTCGGAGCGGAGACATCCGCCTGGCCAGGTCATCGTTGGTCATCCTGACCGGCGCGCTCGACGCCTGGCCCTGGGGCCACGAGGGCGCCGGCACAGCGCTCGCGGCTTGCTGCCAACCCGACACTCTCGGGGAGCTGCTGCGCACAGCCGCCCTTCGCGGCACCCGCGGCGGCAGCGGGGTGGCGGCCGGCACGCCGGCGAACCAGGAGATGTTTCCGACTGTAACGGATGGTGGTTGTGCAGCGCAGCTGCTGGCATCGATCGCGGCCCACGAGGCGCTGTCCACGCGGCCATCCAGCATTGCTGCAGTGCCAGCGACCGCGGCTGCGGCGGTGGCGAGCCTGCGCAATTGGCTAGAAGTGGACGGCGCGCAGATGGCTTATGGCAACATGCCGCGACTCCATCAAGTCTGTGTGATGGTGCTCAGCGTTGTTGCTGGCGGCGGCGCCGATGGCGACGCATGGGCGGCCACGTTGTTGCGCCTCGGAGCGCGGCAGCTGCTGATGCGCGCCGCGGCCGAGCTAGGGCCAAGGGCACCCGAGTGGTCGGCGGCCGCATCAGCAGCACTTTACGCCGTCACACACGCAGCGCACGCATCACATCAGCAGCAGCAGCAGCAGCCTGCACAAGGCGGCACCACCAGCGGGCTTGAGGAAGGTGAGGAGGAGCAGGGCGCTGTCGCCGCCTTGGTGGATGCTGGGGTTTACGCGGTCCCGCAACTGCTCTTGCTGGCGGCCCTGCGTCCCGGCTGGCGGTCCTGGCTGATCCAGGAGCCAGACATACTGGAGCTGCTGTCGGCCGTGGCGGCTGCCCCTGACCAGGGCGAGTACAGCCACAAGGCCCTCCGCACCCTCTGCCTGCTGGCTGCGGGCGCGGCGCCGTCGGAGCGCCTGCCAAACTTTGCGCGGGCTGTGCTGGAGGTGTGCAATGAGCGGCCGGCGGACGTGTGGGCCGGAGTCCCTGAGCTGGACAGCGATGGCGGGGCCGTGGAGGAGGTGTTGGGGTGCCTTGCGGGCTGCCATGAGGCAGGCAGCAGTGTGGGTGAGCGCGCTGCCCTGGCTCTGACCCAGCTGAGGATCGGCAAGCTTGGGTTGGTGCAGCCCCCATCGCAACAGCAGCAGCAGCAGCAGGAGGAGGAGGAGCAAGACGTGCAGCAGCAACAGCAGCAGCACCAGCCGCGGCCACAGCCGCAACAGCACCAGCAGGAGGACAAGCCAAGCATGCAGCAGGCGCCAAACACAGGACATGCAGGGGCTATGAGAACGGCGCGCCCACATAGTGCATGCGCTGTCTGCGGCAGGACGGCGCGAGAAGGCGCCAAACTGCGGCGCTGTGCCGGCTGTGGCCGTGTCACGGGGACGCGGTACTGCAGCCAGGAGTGCTGCAGGACGGACTGGGTGGTGAGGGGGCACCGCGCGGTGTGCGAGGCGGCGCGGCGGGGCCAGGAGCCGTGA
>XM_031652239.1 PREDICTED: Papio anubis mab-21 like 3 (MAB21L3), transcript variant X1, mRNA 
TGCAGATATTCTTTAGTATTTAAAAATGAGCAAATAAACAAAATGAGGCAAATAAATGAAGAAAATGAGTTTCTGAGGCACTGCTTAAGTGACCATAAATCAGACACATATTTTTATGGTGGGCAAATTGATGAAGATACTTTTAGTAGGCGATTTATATTCATAACAAATACATATTGAAATAATGTCACTACTGTATCAGAATTAAGAAACAGCCTCGCATTAGGACTTCTCCGTACAAATTCTTTATCATTGGTTCTTAAATTGGAAAAGTACCTATAAATGATTACATTTTTTAACTAAATAAAATGCAGATATTTTGGCTTCTTGTGAATTTAATAAAGAATCATAAAACATAGGCCTTTTTTTTGTTCTCCCAGAATGTCTCAAAAGCTACAGTAGTAGCTTTGACAAGTTGGGCAAATGCAGAACCTGCTAATGAGTTAAGTAATATGTGGACAGGGGTTGTAGCAAAGTTGTAGACTGATGGACACAAAAGTTAACTATCCAAATACTTCTAGAATGAGGAAAATGCAAAGACAGTGCATTGTGGAAAATCCATCAATGTAGAATATCAAAGGAGAAAGAGCTTATGATTACCTCAATAGAAAAATAAACATTATTTGACAACATTCAACATACATTCAAAATAAAAGCTATTAGTAGAGTAGGAATAAAAGGATGCTTCCTTAATAAAATAAGAGATACTATAGTAGATATGGTAAATTGGCACACAGCATCTCTTCACCTTCCTGGTACCTTGGCCTTTAGCCTTTTTTTTTTTATCATAACCCACAGTAAGAAATGTGTTTTATATATTCATCCTGTCATACTTCCCCACTTACAAATATATATGTACATATAAAATATCTATGAATCATAAAAATGTGTATATTTTATGCAATAATACTTAATCTTGCTAGGTACACTAATAACTTATGTTCTATTTCACTTTTTAAAATGCCATTTATGACTCAATAAATGGATATCATGACCCGCTAATAGGTTCCAACCCATAGTTTGAAATCCACTGTTCTACTCTATCTTCTTGTACTACAGAAGCTTTGAAGCTAAAATGTACATTTTCTGAATTTCTTGCAGATAAGTTTACCCTTTGCAGCCAGGTGAAGTTTTGTTTCCTTCAATCAGATACAAATGGAACTTGGAAGGTAGAAGCAAGGTGGAGGCCATACTTTTGATGAGTCTGCATTTTTCTTCACAGTGGTGGAGCCATTTGGTTTTTTTGAGGCAGTATCAGCCAGAGATGTTGTCAGTTGAGCAATAAGATCTTAAGATGTTTTGATAAACCTGGAGTAATACTTCTAGTATTCAAATGGAAAAGCAAAGATCCAAAAATATTCAAGACAACTCTGATAAAGAAGAGCACACAGAAGCTCTGAAGTCAGACTACGAAATGAGTCCTAAGGGGCCTGAATGAAGATGTCAGCAGAGCTGGTTTCTGGATTCCTTTTCTGCAATAAAAGAGGAATGCCTGTAATCTGCCTTCTCCTCCCACTTTTCTGAAGAATCCCTGGAGCAAAATTGGGGAGGAGGCCGTAGCCTCCTTGTGGGAGGAGTTGGAGAGACTACATGATAAAACAACTTTCTGACCCTAGACAAAAGACCTTCTCTCTTCTGTTTTTGGAATCGTTTTGGAAGGATGACAGATGGATTTTCACAATTTGGAAATAAAAACATGAGTGAAGGGTTCAGAAGGCAAGTCTCTGGTCCATTACACACTTCCAGAAAAATTTAGTACCCAGAGACTCACATTACTGGGAGTGCTGTTTACTCACAAGTGTTGCACTCCATTGAGAAAAAAAAAAAAAACCAGGAAGTTGCTGTTCTACTCAGGACTGACCAAGAAGCCATGAAATCCCTTACTGTGGGAGGCTTAGAAGATTGCCTACTGAATAAGGTGGACTTGAGGCGCCAGCAGATTTCCCAGGCTATGGAGGAGGTGCAGAAAGTCGTTCATCATTTGACCACAAACATCAGCAACCAAGACATTAGATTTCAAACTGTGCCTTACTCTGACACATACAATGAAAATATTAAGGTTTTGGCCCCCAGTCAGTTCCTTGTCACAGTCCCAATAAAAGGCCTGGCTGGCTACAGGGAGGCCAGGGAGCAGCGCTGGAGGTACTACACCCTGCAGGGCACCAGGCTGCCCTGCCCGTTGCGGGACCCTGAGGGTCTGCAGCAGTGGCTGGAGGTGGAACAGTTTATGAAGAGCCTGTGGCAGTGGCATGAGACAGACGTGAACATCGACGGAGACATTGTGCCCGCTAAGGTCCTCCTGGTGTTCCGGAAGCTGGTGGAAAACGCAATTAGAACCTGTCACCTCTCAGGTAAGGTCAGCATGCTAGGAAACCGCTCTGCAGTTTGGATTGCTGTGGAAACATCTGCATATCAGGTGGAATTGGAGCTGGCCCCCGCGGTGGAGATCCCCACCACCTGGTCCGAGAAAGCCCGGTGGCCTCGATGTCTGCAGCGCTGGCCTTCCCAAGAGAGAGTGGAGTGCATCAAGTCGTTTGGGTTTAACTTGTTGCCCTGTTCAAATTATCACTGGCAGCTGAGCTTCCTCCGTGCTGAGCAGGTGTTGCTAGAACAGCTGGATGAGGATGGGGGCTGCCGTAGGAAGTGTTTTCAGGTCATGAGGCAGCTGAAGGAGGACGTGTGGTGCCCAGGGAACAGGCCGGTCATCACGTCCCACCATCTGCAGACGGTGCTCTTTTGGACCTGCGAGAAATATCCCCACTTTAAAGACTGGAAGGTCTTCAGCAAAGCGTTTCTGCGCCTGGTGAGGAAATTGCACAAGTGTGTGAGCCAGCACTTCCTGAAACACTATTTCGTCCGGAACAGCAACCTCTTTCAGTGCACCAACCCGATCGAACTGGACGCTGTGGCCCAAAAACTGGCCACCTTCCTGAAGAAGCCCCAGATCAGCCCGCCCTGATGGCTGCCCCAGCCTGGGAGGCTCTTGGACATTTTATTCTGGCTTAACCTTGTTCTTTGGATGGTTCCTAAGTCAGGTGCCAGGATCCTGCCTAGGAGAAAGGCCATGAATGGCAGCGGAAATTACATCAAACCAGTAACACTTCAGCAGGGAGGGAGGAAACTGTGCCCCAGGCTGTCTGGCCCAGGCCTCCCTGGAGCCCAGCAAGCATTTCCACCCTAGCTACCTCTCCTGGAGACGGCTCTCATCAGGCTGCCTCAGGCACAGATTTGGAACTGGTGACAGTTCTGAACTTAGTTTCCCTTGTTCAGGCTCTGATCGCCTCACAGTGAAGATGGAGACGGAACCCCTGGAAGACATGAGCCTGCTGGCCAATACTGTGCCCAGCCCACCGATCATGGGTGCATTCTCCTGCCATTTGTAAAATGGGAATGTTAACGTGCCTACCTCTGAGCAGGGCTGTGTGTCTATGAGACTGTGCTGGCGCCTTTTCAAGGGGAAGACATTGGATCAACACAAAGTGTTCCTGGTTGGTTGAGCAGCTGGTGTTTGCATCCTGGATCGGTACCCACAGCACTGACGCAAAATTGCACCTGTTGAGTTAGCGAGCCTGTGCTTCCTTGCTGCCCTCCAGCTTCCTTAGCATGTGGGTCAGTGGCTCCTGAGGTTCTGTCTGCTTCTCTGGTATTCTCTAAGCAGGGACGGGAGTGGTTTTGATGACAAGTTTAAGTCAAAGATGAAAGCACAGCTGTTGGCCTGATCCCAACCGCAGCCCTCTCTTTGCTTCCCAGGCCATAGGCCATGGATGGAACTTCCTTATATATTTATGTAAATAACCTAGTACCATGATCTGCATGGAGTGACCTTAGGTGTCTGTCACCACTCATTGTGTTCCTTTGCTCACTTCATTCACTCACTCACTCATTGACAAATAATGCTCATTAGGCACCGGGAACACAGCAAAGAGCAAAGTGGATGAGGACCTCCCCCTGGGGATGCCGCCTAATGGTGGAGACAAGAAATGAACAACGGATAAACATGCACAGTTATTACAGATGGAAGCAAATGCTCCGAAGGAAATAAACAGAATGTTGAAGTAGAGTCCACAGAAGGGTCCCCAAAGGATGAAAATGCAAATAGCTGAAGGGGAAGGAAAAGTGACCAAAGGCAGGCCTGGCAGAGCTGGCATGAGTCAGAGCACCTGGCCTTGTAAAGCCAGGAAGGAATCAGTATTTTATTCTAAGATCAAAGGTGTGACATTTGGCCTCTGCAGAAGCGGAGGAGTATCACCATCTGACTGCATTTTAAACAATTGTTCTGGTAACTGCATGAAGAAGGTCTGGGGACTCACACGTGAGCCAGGAGCTCTTGAGCCACCCATTTGGAATTTCACAGAGGCCCACAAGGCAGCATATTCTGTGTAGCACAACTGATCAGGATTTCTAGGAGTTCTCGGTGAGATCAATGGTTTTTTTCTGGCGTTTACGTAATGCTTCTCAACTCAAGGGGCTCCTTTATTACTTTGGAATGTTTTTGCCCAAATATCTATACCAAAGATAAATTTCTAAAACATGAGCTACTGGTTTTGTTTTGATGAAAATTCACATTTGAAAATAAAAATGATTATTTTTCAAAAGTACTGTAACCAAATGGTGGGGTCCCTAGGCTATCGCATAACAAATAATGATTTTTAAAATATTGAAAACAAGTATTTCCAAACCAACAATGAGTTTACAATTTTTGAAAACATAAAGGCCTGGTGCAGTGGCTCATGCCTGTAACCCCAGCTCTGTGGGAGGCTGAGACAGGAGGGTCACTTGAGACCA
>XM_033668712.1 Dothidotthia symphoricarpi CBS 119687 RTA1-domain-containing protein (P153DRAFT_369234), mRNA 
GATATCGACCATGAACATGAGACTCCGGAAAAGGTAAGATAGACGAATGCGAATGTAGAAACAACCAATGCGAGATTGTCAGACTTTGTCTACTCCATCGTTGGAATGTATTTAAGATGCTTTCTCACCTCCTTACTTTCCATGCACAGCTTCTCTTCCTGACGACGTACTGTATCCACTACTTCTACACTTGATCTTTAGTGTTTCATACACTCTCCACCGTTCCTAGTCTTTGGTACTATTCAAGCTGCAAGATGGCCAATCCTCCCAGCAGCAAATATTTTGACTGGAAGATGTACCGTTACGTCCCGTCCCTTGTCGGCGCAATAATTGCTATGATCATCTTCCTTATAATGGCTCTATTGCATTTCTGGCAGTTCCTAAAGCTTCGGAACTATATTGTCATCTTTGTGGTCATAGGAGCTATGTGCGAGGTTGGAGGGTTTGCAGCTCGAATTGGATCCCACTACGACAACGAAGAATGGGCAGCATACATCATTCAGGGTGTTCTACTCCTCGTTGGACCCCTATTCTATGCCGCGACAACTTATATGATGCTCGGAAGAACCATCCTACTCGCTGGGGGAGAAGATGTCTCTCTCATCAAACCAAAATGGTACACTCGCATCTTTGTCGCAGCAGATGTTAGCACTCTCATCATTCAAGGCCTTGGTGCCAGCATCATGGGCACCATGAAATTGAATCTCGCAATCGCAGGCGAGAAAGTAGTCATCGCTGGTCTCGCTCTCCAAGTCTTCACCTTCGTTGTCTTCCTCGTCGCGTCCGTCGATTTCCAGATCCGCATGAATCGCAAAGTCAACAACTACACGGCCACCGAAGATCTCTCGAACAACTGGAGAAAGATGCTTTGGATTTTGTATAGCGTCAGCACGCTCATTCTCTTCCGCTGTACTCTTCGCTTGATCGAGTATGCTATGGGTAACTCCGGCTATCTGATCGCGCATGAGTGGGCGCTGTATGCATTTGATGCTGTACCGATGTTCTTGGTGTTGATGCTGCTGCTGGTTCTGCAGCCGTCAAAGTATGTCCCGCAAAGTGACAGCAAGAAAGAGCACGGGAGTGATGAGGAGGTGGGAGTCGCGCAGAGTCAGTGACAGATCTATGCATGTTATGCTTATGCAAACTTTTAATATTGCTAGGGAAAAGGGTATTCTCATATTTCCTCAGTAGGAGTT
>XR_003329731.1 PREDICTED: Papaver somniferum uncharacterized LOC113287130 (LOC113287130), transcript variant X3, ncRNA 
GCGAGAAGATAAAACCAGACATTCTCCCTCAAACCCCAAAAAGGAGGTTCCCCTACTACCAAAATCACCAGAGACTAATCTCTTCTTCTCGTCGTCTCTTGGATTGTGTATGCATTCATACTTATAAAGATGCTATTGAGGAGCATCAAACATTTATAGTAAGCAAGATTAATTTTGAAGAACACCGCCTACCTGCAGGTGGTTAAGGATCACAGTAATCATTGTTTGAGTCGTCAATTCGTGTTTGACGATGAGAGTGAAAAAGCTAATGCTGGCGCATTTACCAATTTGGAAGCGCTCAACTTTTTACGAGCTAGAGGAGCCTCAACAGATCCTACGAGTAGTTTCTCCTGTTTCTCCTTTTGAGTACCAGGTTTATGATTATTTGGTCAAAATTGCTGCTTATAGTCAAAGTACAAACACAAGAGAGTATCAATGAGTTCTTGAAGAGCTGTGAGAAATACAAACTTGCAAAAGCGGAGAAGCTCAACATCATTAAAACATTAGGCCGTCAACTCAAGAGGAAATTGACCCGGTATGTTTACTTTCAAAATCCCCTTTCAGTTCTTATTATATGTTTATTATTAATCATTGTTAGACACTCTTCTTTACGTATTAGCGTCCATAAATGACATCGTGCTTGTTTTGGTTTTCCTTTGTATTGACTAAATAAGGCATTTCAGAATTCTCTTGTGCATGCTGTAATTGTCAGGCTTAGTATAGACAGGAATAAATGAATAGAAATTCTTATGATCTGTCTACAGTTTTAACTGTTTCAAGATTCACTATCTCAGGAATTGGTGTGCAGACACTTCCACGCCTCCCAAATGTGTTTAAAATCTTGTTCCTTTATGCTTTAAAGTTAGTGTATCATCTAAATCTTTGTTAACCAATTTTAGATTTATGAACTCTTCTTGACGACCTCACCAGTCCCTGGGGTCTATATATTGTTTGAAATATGACCTAGTAGGCATGATTGTCTGAACCCTTACTTTTATCAAAATTGGCAATAAACGAGAGATCTTAAGATTCATCAATCTGGTAGCGAGACAACATAGATGATTGCCTCTCAATTGCGGAATCATAATTGTTCAGCATGTGTAGGCTAAATATGTTATACCTTCTGATTATATTAGATACCTTAAAACTTCCCACTTCCTAGATTCTTCTGCTTTTTAGCGTCTTTGAATTTATAGGCTCTGGCAAGATGTTTTCCATTGAGCAGATTATTGAAGAGTGTCAGAAATGCTTGGGAGATGAAGAAGTTGAAGAGTTGGTGGAGCTGATATCAAATTTATTTTGTCCACCACTCTGAAGGTACAGATGAGGGTAAAGGAATTCTTGATGGTTTCTGAATGGAAGGTAAAGATGATGTCAAAGGAGCTCCAGATGAGGAAGATACAGAAGGATTTTTTGACGGCTTTCTACTGAAAGATATAGATGCGGGTATAGAACTATAAATCTCTATCAACTTTATGGGAACTCTAAACGATCAACCAACTGCTATCTTTCTCAACCTTTTCATGTCATCTGTCTTGGTATTAAGAGGCAGAAATCTTTGTGAATTGAGACCTGAATTAACTGAACTTGTGCAAAAATATTCTATTCTTCATGTGAGCAGTTTCAGTCCAATTATGAGACCTGAATTAACTTGTGCAAAAATATTCTATTCTTCATAGGGAGGAATGTTTACATTCTGACGACAATGGATCAGAATGGTCAAGGACGCAAGAGCGGTGAACAGGATAAACTTTGGGAATTTGTTGATCCCATTGATAATCTTTTTCAAATCCCATCCGGAGTCATTCAGGTGTTACCTGACTTGCCCATGATTTGGGAGAATAATGTTCTTGTTCAAGGCATGTGGAGCAGCGAATGAAACCTAGAATGGATGCATGCAATTCATGATTTCCTTAAACCCTACAAACCCCTTCTCAACTCTCACGTCATCTATTTCTTCACTGATAAACTTTGGAAATGCATGTTGATCAACAACGTCTTCATCATGACCCCATTGCAAATGTTTCTTCAAATTTTGAATCTGAGCTTGGGGTATGGATGCAGTTGAATTCAATCTTGTGTAGG
>XM_053220790.1 PREDICTED: Acinonyx jubatus zona pellucida like domain containing 1 (LOC106972235), transcript variant X3, mRNA 
GAGACAGAGAGACAGAGAGAGCGTGAGCCGGGGAGGGGCAGAGAGAGAGGGAAACAGAATCCAAAGCAGGCTCCAGGGTCCCAGCTGTCAGCACAGAACCCGATGCATGGCTTGAACTCACAGACGAGATCGTGACCTGAGTGGAAGTCGGACGCTTAACAGACTGAGCCACTCAGATGCCCCTTATATTTCATTTTCTTAATGATGTCTTTTTTTTTTTTATAGTGAATGGTGTCTTTTGAAGTGCAAAGCTTTTAAGGTTTTATGAAGTCCAATTTATCAATATTTTCTTTTATGGATAGTGCTTTTGATATCATACTAAGAAATCTTTGTTTTCCTTAACCCAGGTCATAAAGATTCTCTCCTATGTTTTCTTCTACAAGTTGTATAGTTTTAATTCTTTACTATTTTGAAGGAGAGATAGAGAGACAGAGTGTGAGCAGGGGAGGGGCAGAGAGGGGGCAGAGATAGAGAGGGAGATACAGAATCCGAAGCAGGCTCCACACTCTGAGCTGTCAGCACAAAGCCTGGCCCCAGGCTCGAACTCATGGGCTGCAAGATCATGACCTGAGCCGAAGTCAGACACTTAACAGACTGAGCCACCCAAGCACCCCTTAATGCTTACATTTGGTAAGGGATTTTTGGTCTATGATTCACGTGGAGTTAATTTTTGTGTATGGTGTAAAGTAAGCGTCTAAATCCTTTTCCTTATGGGTATCTAGTTGTCTCAGCAGCATATGTTGAAAAGATGGCTCGTGTAATTGTTGACTCTGCTTTTACTACATTTGTGTCTTTAAAGAAAAGCTGAAGTAAGTAGGGCATAGAGAATTAATGTATTAATGAAGATGAAGAGATTCTTCTGTGTTGAGGTTTTAAGCACTTACATTAGATAAGGAACATCTGGTTGATGTTTTAAAGAATAACTCGAACCATAATTTCATTTCGTTTCCTTCGTCTCCCCCATTCCCTCCCCAGCTCTCCACTGAACATCTGCTTCTCTTATGTGAGGGGAAGTGAAAGATTTAGGTCAGGCATAAACACAAACTATCTTTACTGTATTGTTCCCTTTTAAGACCAAAATACCCACCCTGCCGGGCCAGTTTAGCACTACATTACCCTATATCAACAGATCTACTGCAATTTTTGGAAGCTGGCTTTCCCCAGGAAACAGAACTGCTATTGTTACTTCTCGGTGTTATGTAATAAATCTGGTGGGTCACTTTCAAGGATGTGAACAGGAATCGAGAAACACTGTCCTTCAAATATCACTTTTCTTTATGTTAGCTTTATTGATGAATTTCTCACAAGAAGTATCTTAAGAGACATCACTAGTGTTGTGAGCCCTCCGCATCCAGATCTCACATGTATCTATGGTGCTGGCTAGAGGTAACCCCAAATAAAAACAGTTTCCGTTGACTTCTGGCTTCACTGATGCAAGATAGCAAGACCTTGGGGAAGTCTATCTCCCCAAAATACCATCCATTTTGCTATCTTAAATCTTTGCAAAGAACAGGATGATTACATTTTCCTCTCTGGGAATTTACTGAGTTCCTCTGTTTTATGGCACTGACCTAGCAGCTCTAATTGGGGCACTCTTCTACCCGTGGCTTTGCTAAAAATCCCTCACAATCAGGACTGCAGTGTAATAATAATAATAATAATAATATAATGCAATAGCTCATATGTGTATAGCACTTATTATGCACCAGACCTTCTTTTCTTGCCTTACATATATTAACTCATTTAACTGTTCCCTGGAGGCGTACATTAAAGCTGGCATTGCTGGAGGGTAATGAGTATAGAAGCAATTTAGTGTTTGGAGTATGATAAACTTCCATAAAATAGAAGGAAAGCCTTGAGATGATGCCTCAGGGATAAAATTGAACAGCCTGGTCCTTTTTGGGGTCTCATAATTTTTTCAGCTGTAGAACTCATTTGAGGGAAAAGTAACAGGTAGGAAACATTGGTTTTCATCACCTCGCTTTGGTTAGACATATGCTTTGGATATTCTTCCTCAAGCACCTTCAGAATCCCCATCCACTTCCATGTCTAGGCACTCACTTCAGTAGCCTGGCTCTGGGCCACTCTAGGGCTATCCAGCCTTCTCATTGTGAGGCTGGGTCCCTGTTGGTGCTTTCCTGTCCTGTGTTTCATTGTGGGAGCCGTTTGCTGGGAAGGGGCAGTTTCACCAACAAGGAGGAGGTCTTTTAAAATTCTAGCTCACTGTTGATCAGAACCAGGAATTTCCCTTAGTTTAAGATTTAGTTAGTAGACAGGGGCTCCTGGGTGGCTCTGTTGGCTGAGTGTTCGACTCTTGATCTCAGCTCAGGTCTTAATCTCACAATTTAGTTAGTACACAAACATTCTGGCTTTCTCTAAGTTTTTAGCCAGTTTTTTACATTTTAGTAGAAGATTCAGGAACACGTTTCTTGGGAGGAAAGAAAAGAAGAGGAGAGATTCTGGGGGCATAGCAAGGGGGAACAAAGAAGGGAAGAAAAGTTGGAGAGCCTCTGTGTACCTCAAAATTTTGCCGAGGGCCTTGCCTTGACAGTGGGGTGCAGATAGGTCCTTCATTGCTGTCCCCCAAATCTCACCAGCACTGTAACAGTGGCCTTCTATGAGTTGTGCACTCACCTTTGTCATCTGACACAGGGGAATGACTCAAATGGTTGGAACGTTCAGACAGGTAAGAAAGGAGACAGGTTATTACAGATGGGGGTGGGGAACTTGTTTTGGACAGGTAGTTCCTGGTGGCATCAGGGAAAACATGCCTTAGGTGGCTCTCTCTGACTGATACATTGACTGATCCTGCTAAGTCAGGAACATGACCAAGATGGCCTTATTTTCCTCAGCTTGACTAAACTTTAGACAGGTTTCTTAGTGACAATAGGTCACTGACCTCCCTTGTCTTAGAGCATTTACTTTAGAAAACTTACAATTGTAAATTCTTTATTTGCCCATCTGAGATGTAAATCTTTTCCTAGCCTCTTGCCCCTTTTACAACTGAGAACCATCTGTTTCAGAGACCTGGGAGACATCTTTTGAAATATTATCATCAAGAAAGGTAGCATCCAGGTCTCCCAGTTTCTGTAGGAGGGTAGGAACCTAGACTGGTGTCAGCAAACACAGATGGCCTAATCACATTGACCAAACTAATGTCCTCCAGTACTTTTCAACTAGCTAACCTCGGCCCTTAGAAACCTTCCTGCTTTTTTTTGTTTCTAGGGAAGTTAAGTTCTCTCTCCCCTTGAAGAAGACTTGAATTATGTCTTCTTCTTTTTCAGCCAAACTCTGTTCTGTGAAATTTTTCTTTGACATACAGACACTTGTGCAATATTTTATCTAAACTGACTCTCAGTGTGTTTGGAAAGCCATTAACCAAGAAGACAGGATAACTTTATCATGGTGCACTGTTTTCTGGACTCATTATTGGGGGTCTGACACCCACAGCATTTCATATGCTATTAATCACCTCCTCCAATAAACCCAAAACCCAAACCAGAATGCTTCTCATATTTCTTTGCCATAAGATACCTTATATATACACACGTATGAAAAGTATACATGCACAATGTTATATAGACAGACACACACAATTAGTAATAGCTATCATTTTTTTGTAGGTCTACTGTGTACTTTGTATACATACACATAGTACTTCATACATATTTCCTCATTTGATCCTTACATCATTTCTATGAATCAGGTATCATTTATCTCAAGATGAGGAAGCCAAGGCTGAGAGAGTGAAGTGACTACTTCAAATTGCTGTCAGAAGTGGGATTTGAACCCAGTCAATCAGTCTACAAATCATGATATCAGGTTTCCAATTGTCTTTCAAAGATTCACTGAGCTACCTTGTTAGGATTCTGGTCCAGAGGGAAACCTGTATTTCCAGAAGGAATTAAGGAAGAACTTCTGTCACTGTCCCTTCATCCCTCCTCCCAGAAGCATTATAGAAGATTTTACTATTCCTTAGAGAACTTCATCTCAAAGTGTGTCCCAACTCTCACCTGTCACCTGTAATTTCTGCTTTGGGGTCTAGCCCCAAATCTTGAGGAAGACATTTTTTTTTCCAGTTAATTCATTTTTGAGAGAGAGACAGAGTGTGAGCAGGGGAGGGGCAGAGAGAGAGGAAGACACGGAATCGGAAGCAGGCTCCAGGCTCTGAGCTGTCAGCACAGAGCCCCACATGGGGCTCAAACCCAAGAACCACGAGATCATGCTCTGAGCCCAAGTCATCCGCTTAACTGACTGAGGCACCCATATGCCCCTTGAGGCAGCCATTCTGATCTTCATTTCAGGGTTGCTCTGACAAGGATAGTTGGGGATCTGCCCTGGTGCTTCCAGCACAGAGGATATATTCCTTCAGTGGACAGAGAAGATGGTAGCAACTTCCTCTCTGAGTCACGCATATTGTCTGTCATTCTGTCAACCATCTGTCCTATTAGCCACGCTTGGGTGATGAATAGAAAGAACTCAACGTACTGTGAGGTTACTAGGTTACAGCTTGTGACATCAGAATGCACAATGAACAGAGCATTAGAAAGTAGACAGCAATGGTTTCTACTTATTTCAAAATATCCATGATGCCAGAGAAATACATCCCTGTTAAAAAAACCTAGGTCTTTGTAGCTCCCTTTCCTTCTTTGACATGGAATGAAAGAGATGTTTCCAGAACTGGTCAACTTCAGTAACTTTTATATCAGAGTCTGTGCTTAAAAGTATCACAAACAAAACTTCAGAACAATCACACTACCTAGAAAAAGTATTTCTAGGACTCTGAGATGGTCCTTGCCCTGAGGAAGGTGGCAAGTCTTGTGTTTACTATGGGGCCTACCCCCTCTCCTATGGAACACAGTGAGGTTTTATTCTGTGAAAGCTGTGGGAAGCTCACCGTAGGTTGTGTACCTGAGCCACTTAGATTCAAGGCAGCAGTGGTGAGGTCACTAAAGTGACCTTCTCCTTTCTCCCAGATGGAGGGGCTCCTTCTCATGAGGACTCTAACACATACAGCTCTACACATACATAAAAACTTCACTTCCATTTATTACTGGATAGATTTTTTTCAGTGTTGATGAGATGTTTTGTAGAAATCAACATATACTGTCCACATAAGGAAAGTTTAAATGATTTAAAATATGTTTCCTAATTATAAGCACTTGTGGGAAATTTGGAAAGTACAGAAAAGAAAAAAAAATTACAATTGCATCAACCCGGAAGCAACCATCACTAACAGGTTTTTTTGTTTTCCTTTTGGTCTTTAATTTTGTAGCTCTGTTTTTGTTTGTTTTTTTCTTTTTCTTTATTATTATTTATTTTTGAGAGAGAGAGAGAGAGAGAGAGAGACAGACAGACTGTGTGTGTTTGGGGGGCGGGGGGAGAGGGAGACACAGAATCGAAGCAGGCTCCAGGATCCCAGCTGTCAGCACAGAGCCCCATGTGAGGCTCAAACTCACCAATCGCGAGACCATGACCTGAACCGCGAGATCATGATCTGAGCCGAAGTCTGCGGCGCTTAACAGACTGAGCCACTCAGGCGCCCGTTGGTTTGTTGTTTTCAAGTGAAGACGCTCCTGCCCAAAAGGAACTTACAACTTTAAGGGCAACACAAATGAGAAAAATGAAGACAAAATAAGACTGAAAACCAGAGAACATGATGATAATGATGATGGGCTCACTGATTTCTCCAAAGTGTCTCTGAGACACATACTGCCTGGAATCAGTCACTTCCTGCCTTGTCTGCCACCCATTGTGTAGCCACAAAGAATGTGTGTTCTGTCAGCAGCTATAAAAGTACAGATCTGGGTGCTGATCAAGAATGTGAAGTGAGGCCTGAGAAAATGCAGAACTGAGTTGAAAGAAATGCAGAGTCATTAGCGTCTTAAGCCAATCATCACCCTAAAATGGTTTGAAGGGAGATATGGTAAACCCAAATCACTGTTTTAACTATAATGAAAGGTCAACCCAGCAATGGAAAGCAATGGACACATTTTATTTCCAAATGGTGATGCTGATCCATTTCAGTGTCTTCCTTCTGGGACAATGCAGTGAGAGCCAGTTGTCACTCAACACAAAGGTGTCTGTATTGTAGCTGCAAAAGAGGGTTATGGGATGGAGTGCCTGATAAGTTCCTCTAGATTGAGCTGTCAGCTGTGACCTCTCTGAGGAGGTGATCTAAGCTGCAATCTGAAAGGCAAGAAGGAGTCAGTGTGTGAAAATCTGTGAAAAAGTAACATCTGGCATAGAGATCTTAAGATTACATGGAGTATTTGCTTCCTGATCCTTCTTAATCTCTCTAGCCTGCATTTCTGAAAACTTGGGGAAGGCATACAAGCTTTGAAAAGACGGAAAATTTCTTAGCATAAATATCAGTAAAACAACTCTTTCCTATGGGATTTTGATGTCTCACTGAAGTAGCAATTAAAACTGGACTCTTTTGAAGTTGTTTATTCCAAGAATGCACCTTCTTGATTTTAAGGATGAAAAGATAGGAGCTGGAAGCAAACTGGATTCTGCTTCTCCAAACCTGAGCATATGTAAAAGAAAGCCTTTGCCCAGCAGAATTAGCAGATGGTCTAAATCCCCTTGGAGTACATGGGCTCAGTTCAACACTGATTTGGGATTATTCATTCAAAGTCCTTGGTCTTCTGGAACTTTAATAAGGCTTTCCCTCATCAGGCTGACGATGGCTCACTTCACACATAACCACTCAAGACTTCTGTGCAGCATAAAATAGAAGATCAAAAGCAGGGTTGAATCTTTTTTGAAAGAGTTTGGTAACACCAGGCATTTGAACACTCAGTCACATGCAGCAGAACCAGGCACATGGAGAACAGCTGATTCCACGAAACCAAGGGCTTGGGTTTTGCAATGGAACGAATATGGTTGCTGTTGCTTCTAACAAGTAGAGTGCTTCTGGGGTCTGCTCAGTTTAATGGCTACAACTGTGACGCCAACCTCCACAGTAGATTTCCTGCTGAAAGAGACATCAATGTCTATTGTGGGGTGCAGGCCATTACAATGAAGATTAATTTTTGCACAGTACTTTTCTCGGGTTATTCTGAAACAGATCTGGCACTGAACGGAAGGCATGGGGATTCCCACTGCAGGGGGTTCATCAATAACAACACCTTTCCCGCGGTGGTCATTTTCATCATCAATCTCAGCACCTTGGAGGGCTGTGGAAACAACTTAGTGGTATCCACAATTCCTGGAGTCAGTGCTTATGGGAATTCAACTTCAGTACAAATAGGAAATATTTCGGGATACATTGATACTCCAGACCCACCAACAATCATCAGCTATCTACCTGGGCTTCTTTACAAATTTAGTTGTAGTTATCCATTGGAATACCTGGTTAATAATACCCAGCTTGCCTCATCCTCAGCTGCTATTTCTGTGAGAGAGAACAATGGTACATTTGTCAGCACTTTGAACCTGCTCCTTTATAATGATTCAACCTACAGTCAGCAGTTAATTATCCCAAGTATAGGATTACCTTTGAAAACCAAAGTGTTTGCAGCTGTACAAGCCACTAATCTGGATGGCAGATGGAATGTCTTAATGGATTATTGCTACACAACCCCATCAGGGAACCCAAATGATGACGTTAGATATGATCTCTTCCTTAGCTGCGACAAAGATCCTCAGACCACTGTCATTGAAAATGGCAGAAGCCAGCAAGGCCGGTTTTCCTTTGAAGTGTTCCGATTTGTGAAACACAAGAATCAGAAAATGTCCACCGTCTTCCTGCACTGTGTTACCAAGCTCTGCAGAGCTGATGACTGCCCCTTCCTTATGCCAATTTGCGGCCACAGAGAAAGGAGGGATGCAGGGAAGAGGACCACTTGGAGCCCCCAGAGCACGTCTGGAAATGCAGTCCTCTCTGCTGGTCCCATCATTACTCGGAGTGATGAGACTCCAACCAACAATTCACAGCTTGGTTCTCCAAGGGAACCTCCCTTCCAGCTGAATGCCATCACCAGTGCACTGATATCAGGAATGGTCATCCTGGGAGTGATGAGCTTTTCCCTTCTCCTGTGCTCACTGGCCCTTCTATACAGGAAGGCACCCACCAGTTTGGTGTTGAATGGCATAAGAAACCCAGTCTTTGACTGACTTTAACAGGTCCCTTCTCTCAGGAGGACTCACTGACTATACCCTGTGTTACTGCAGTCAGTGTTTTCATCCAAATTGAATGCCAGCCAGCATTTGATATTTGTAGGTTTGATAGATTTCACAGTGTAGTTCGTCAGCATGATGATAGTGAAAGAATTTGGGTGGTATTGTTCTCGTCGCGTAAGTATGTGGTCAGCCCTATTTGTATGGCACCAATGGGTAGAATGACAACAAGCCAACCATATTCAGGACTCAGATCTTACAAGATCAGTCATATTTCATTTTATTTCAATTTTCTTTTGATAATTGGTTGTTATAGAGATAAAAGGTGGGCATAGAAAAAATATACATTTGTTGCATTTTTCCCCCTAAGCATTTATATCCAATGTGCTGGCATTTAGATTGTTTATGTGGTCCTAAATTGAAAGTTACTTTTTTATTTGT
>XM_019449735.1 PREDICTED: Panthera pardus microtubule associated protein RP/EB family member 3 (MAPRE3), transcript variant X4, mRNA 
TTGCAGATTTTCCAGACAGCTGGGGTATGGCCGTCAATGTGTACTCCACGTCCGTGACCAGTGAAAATCTGAGTCGCCATGATATGCTGGCATGGGTCAATGACTCCCTGCACCTCAACTATACCAAGATAGAACAGCTCTGTTCAGGGGCAGCCTATTGCCAGTTCATGGACATGCTCTTCCCCGGCTGTGTGCACTTGAGGAAGGTGAAGTTCCAGGCCAAACTAGAGCACGAATACATCCACAACTTCAAGGTGCTGCAAGCAGCTTTCAAGAAGATGGGTGTTGACAAAATAATTCCCGTAGAGAAATTAGTGAAAGGAAAATTCCAAGATAATTTTGAGTTTATTCAGTGGTTTAAGAAATTCTTTGACGCAAACTATGACGGAAAGGATTACAACCCTCTGCTGGCGCGGCAGGGCCAGGACGTAGCGCCCCCTCCTAACCCAGGTGATCAGATCTTCAACAAATCCAAGAAACTCATTGGCACAGCAGTTCCACAGAGGACGTCCCCCACAGGCCCCAAAAACATGCAGACCTCTGGCCGGCTGAGCAATGTGGCCCCACCCTGCATCCTCCGGAAGAACCCCCCATCAGCCCGGAATGGCGGCCATGAGACCGATGCCCAGATTCTCGAACTCAATCAGCAGCTATTGGATTTGAAGCTGACGGTGGATGGGCTGGAGAAGGAGCGTGACTTCTACTTCAGCAAACTTCGAGACATCGAGCTCATCTGCCAGGAACACGAAAGTGAGAACAGCCCTGTTATCTCAGGCATCATAGGCATTCTCTATGCCACCGAGGAAGGATTTGCACCCCCTGAGGACGATGAGATTGAGGAACACCAACAGGAAGACCAAGACGAGTACTGAGGGCGGCCCCAGCCCTGGCTGACTGCACGGCTGCCGTGCCTCCCCGCCCTGCTCCTGCCCCACATTATAATCCTTTCCTTACAGC
>XM_044229603.1 PREDICTED: Neovison vison NOVA alternative splicing regulator 1 (NOVA1), transcript variant X2, mRNA 
GAAAAGAAAAGAAAGAAAGAAAGAAAGAAAAGAAAAAAAAAGAAAGAAAAGAAAGAAAAAAAAAAGCCAAAACAAAAGGGAGAACCTTCTCCCCGTAGCAGCGGCAGGAACTGCAAACATGATGGCGGCAGCTCCCATCCAGCAGAACGGGACCCACACTGGGGTTCCCATAGACCTGGACCCGCCGGACTCGCGGAAAAGGCCGCTGGAAGCCCCCCCTGAAGCCGGCAGCACCAAGAGGACCAATACGGGCGAAGACGGCCAGTATTTTCTAAAGGTTCTCATACCTAGTTATGCTGCTGGATCTATAATTGGGAAGGGAGGACAGACAATTGTTCAGTTGCAAAAAGAAACTGGAGCCACCATCAAGCTGTCTAAGTCCAAAGATTTTTACCCAGGTACTACTGAAAGAGTATGCTTGATCCAGGGAACAGTTGAAGCACTGAATGCAGTTCATGGATTCATTGCAGAAAAAATTCGAGAAATGCCCCAAAATGTGGCCAAGACAGAACCAGTCAGTATTCTACAACCCCAAACCACCGTTAATCCAGATCGCATCAAACAAACATTGCCATCTTCCCCAACTACCACCAAGTCCTCTCCATCTGATCCCATGACCACCTCCAGAGCTAATCAGGTTAGACTATTTCCACAGGTCAGAGTGGCAGACTGTAACTACAGTAGTGGGTCTATAATAATTTCCCCCTGAAAATTGAAGGACAGTCGCAAAGAGAAGTC
>XR_007719743.1 PREDICTED: Macaca thibetana thibetana uncharacterized LOC126937484 (LOC126937484), transcript variant X3, ncRNA 
CCCTGCTTGCAGTTCCCCCTTCTGTAGGGCCCCCATGCTCCTGTCCCACCCCCTCTACTCGGCGTCCGGGTGCTGGGTCGAGACGTGTGTGGGTGTTGGGAGGTGGATATCTCTTTTCCGAGCCGTAGGCGTCACCCCTACGCCCAGGCCCAGGCCCAGTGCTGGATCCTGCACTTTCCCAACCTCCCCCTCCCAAGTTACAAGGTTGCCCTCTGTTCCCCTCCCGAGCGCAGGTGACGAGCTGCTGAGACAGTGTCTGATTCACCGACAGCTGAACCAGCTACTGGTACTTGGGGAGACAGAGTCTTGCTATGTTTCCCAAGCAAATTTCAAACTCTGACCTGAAGTCGTCTTCCCACCTCAGCCTCCCAAAGTGTTGGGATTATAGGTGTGAGCCACTGCAACTGGCCCAGAACTGGAGTATTTATCCACCCAATCCTTGAACAAACCAGCAGACCAATTCAGAGTCCATTTCAGTGGTGCAGGTGAGAGGTATTAGAGACCTGGACAAGGTGGTGGCAGATGAAGATGGAGAGAACAGAGATAGGATCTCACTGTGTTGCCCAGGCTGACCTCCTGCCTTATACACCACCTCACCAAGCTTAACAGGGTGAAAATATAGGAGATGACGATCCATTCCTGGGTGGACGGCCAGCGTTCCATCTTCACTAACACGATATAGTTGAAGAGCATCAGGTATCCGATATACGCCAGCTGTAAGGAAATACAATACAGTGGTCTGGCTGTTCAGGCCCAGGAGCCTCAGCGTCAGCCACGGCCACTGCACAGCAGCACAAAACAAGGCCCAGTGACATGCACATTCTTCCAGAACCTCTGCATTTTAGTACCCACTTCACACCTTGAATTTGAATCCTCTCCAGCCGGATACCTGAAATAGGCTCTCAACACAAGCAGGGTCGAGGAGCCAGCTGGACCCCTGCCTGCTTTCTTCTCGGACCAGAAGAGGACCCAACCTACTCCTAGAGAAACTTGCTACAATGCAGAAGTGAGGTTACATGGAAATGAGGTGTGTCCTACCTTTCAGAAACTTGGGAGAGTAGGACACACCATTTTTGGAAATCTGGTGAGAAATACTCTTACAGAGAAAAACACAGCCCCAAGTAAAGTACATGGGACCTTCAATCTGAAACTGAATTGTATTGTTAGGCATGTCTGGTGATTCAAAAGACTGGCATACCTCATTTCCGATCACTTCCTCGAGGCCTGGGCTTTGTCGATACGTGAAGATGAATTTTGGAGAATCATGAAAACACAACTGAACGGATCTGGGGGATCCAGTCTGATGGGTTTACTGAGGCCAACTCAGCCATGCAGAAGAGTGCTGGACACACAGGCCCCACCCCCCAAAGAGGCAGCCTCCCAACAAGCTGCCAATGACATAAGCAAAGCAGCGTGTCTCAAGCATCTCTAATCACAAGTTTCGCCTGGGAAGCTAGTTAAACTAACACAGCCTCTTAGGCTCCTTCATGAAGATTTGATTCCATGGGTCTATGATGGGGCTAGAAATTCGCATTTCTAACAAAACGCCCTTGTCATCATGGAAGTTTTAGAAATGTTGATACTATTACGTCTACTGATTTCTGCTCTCAGCAGTCTGTAAACTTTTTCTGCAAATGGCCAACTGGTTAACAACTTTTAAGGCTTTGTAGACCTGATAGTCTCTCTCTGTCTCTCACTACTCATTAACTCGATGTGGTAGTACAAAAGCAGGCAGCCTACTGGTAATGTTAAATGAGGTTTAGCCTAAAGCTGCCTCCTTACATATTTTAAGTTCGGCCTAAAGTTTTCTCTGTACATTGTGAACTATAACAAATGAAGGTGTAACAAGACCAATCACTGAATTTCAGTCAATCAAATGTAGCCAACTGCTCAAAATGTGTTCAAATAAGGTAAATGCTGAGCTGTAACCAATCCAGCTGTTTGTGTACGTCACTTCCGTTTTCTGTCCATAATTCTTCCACCACGTGGCCCTGCTGGAGTCTCTGAGCCTCCTCTGGCTTGGAAGGCTGTCCCATTCACGAATTGTTCATTGCTCAGTTAAATTCCTTTAACAGAAATTAAGAGTCTGCCTGTGCTCCAATTCTTTATGGACACTACAATTTGAATATATGTCTCAAGTATTCCTTTTTAAATTTTATTTTGACCCTTTAAAAATGTAAAAACCATTCTTAGTTTGCAGGCCACAGTCATAGGCCATGGGTTGAATTTGGCCCGAGAGCTGTAGTTTGCCAAGCGTTGTTCTAAGCTAACAGTTGGGGTATCATAATATTAAAGGAAGGACAGACCTGGGTGTAAAATAGCTCCAAAAATATTATCTTAGGCTGGGTGCAGTGGCTATTGCCTATAATCCCAGTACTTTGGGAGGCTGACGCAGGCCCATAGATC
>XM_032774723.1 PREDICTED: Chelonoidis abingdonii docking protein 5 (DOK5), transcript variant X4, mRNA 
GTCAGCTGATGCAGAAGGGTCCTCTAGCCTCTTCCCCCCTCTCCTGAGTGGATTAAAACTCTGGCCGCTGAGTTTCTGGGTCAGGAGGATTATTCCAAGTGATGTGAATCATTTCAGCTACCGACTGGATTCAACTTGGGCTAGCGGCTCCTCCCCACAAAAAGGATGGCTGCCAATTTTAATGACATAGTGAAGCAAGGGTATGTAAAGATTAGGAGCAGACGTTTAGGTATTTATCAGAGATGCTGGTTAGTTTTCAAGAAAGCTTCAAGCAAAGGGCCAAAACGACTGGAGAAGTTTTCAGATGAGCGTGCTGCCTATTTTAGGTGCTATCACAAGGTCACGGAACTCAATAATGTGAAGAATATATTACGACTGCCAAAAAACACGAAGAAACATGCTGTAGGCATTTATTTTAATGATGACACATCCAAAACCTTTGCTTGTGAATCAGAACTCGAGGCGGATGAGTGGTGCAAAGTGCTGCAGATGGAATGCCTAGGAACTCAGATTAATGACATAAGCCTTGGAGAGCCTGACTTGTTGGCATCTGGTGTAGAAAGGGAGCAGAGTGAGAGATTCAATGTGTATTTAATGCCATCCCCTAATTTAGAGGTGCATGGGGAATGTACCTTGCAGATAACATTTGAGCATATCTGTCTTTGGGATATCCAGAATCCCAGAGTAAAACTCATCTCTTGGCCATTAAGTGCCCTCCGGCGATATGGACGAGACCCAGCTTGGTTTACATTTGAAGCAGGGAGGATGTGTGACACTGGGGAAGGACTATTCATCTTTCAGACAAGAGATGGGGAGGCGATCTATCAGAAGGTTCACTCAGCTGCTTTGGCCATAGCAGAACAACATGAGCGCTTATTGCAGAGTGTGAAAAATTCAGTGCTTCAAATGAAAATGAGCGAGCGAGCCGTCTCCCTCAACACCATAGTGCCCCTGCCTCGGAGTGCCTACTGGCAGCACATTACACGGCAACACAGTATGGGCCAGCTCTATGGCCTACAAGATGTTTCAAGCCCCCTGAAGCTTCATCGAACAGACACTTTCCCCACTTACAGATCAGAGCATTGATAAGACTGTAAAGGATTTGAAAACTCTCTCTGTCTTGTGACAGCTTGGCCCAGCGGATAATAATGATGACAGCAAGCAAACAAAGTTGGAAATGCAGAAAAAGTCGGCTTGGATTGAATTAAGTCCTTGAATATATATATTTTTTTTTAACCTTGGCAAGAAAGGAATGTATTCTGTAGGTATTTAAAAAAATGCCAAACCAACTATCACACAGTTATTTAATATTTTACACCGGGAGGGGACAGAAATCAGCCCCTAAATGTTACTGAATGTTTTTATATGATAGATATATGTTGCAAATATATGAATTTGTCTTATGATGTGGGGTACTGTGATACCACTTAGTCTGTTTCAGCAGTGTTTGTGTTGACGTCAGCTGTGCCAGCAATCTCATGGTTCCTGTTTGCTGTAACTCATACCCTTTAGTTGTTAACATTATTGATTAAGACTAATCTTTGACTATAGTACTGATGGCCAGTTTTAAGCAGGAATTGTATCTGTTTTTCTTGTGTGAAGTCTCCTTGAGTCCTGATAGACTTTTAAAAGG
>KF434600.1 Uncultured bacterium clone SNGUT_M7 16S ribosomal RNA gene, partial sequence 
CCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGGGGAGGAAGGCGGTGAGGTTAATAACCTCATCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTTAGATAACCCTGGTAGTCCACGCCGTAAACGGATGTCGATTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAATCGACCGCCTGGGGAGTACGGCCGCAAGGGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTTCAGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCATATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCA
>XM_052950715.1 PREDICTED: Mya arenaria nephrin-like (LOC128235928), mRNA 
ATGAGGGAACAACAGATTGTTGGTATCACCACGGTGACGTTATCTCCCGGCACCGATCCTATCAACGTGATAGAGAATACACAAACGACACTGCAGTGCCGAACATCGGGCGGGTTACCGGCAGCCTCGGTCAGATGGTTCATCCAGGGGTCAGGGCAGGTGCAAGACGTAACGTCGCTCTCCGCGAACACGTACCAAGAGGAGGACAACCTTAACGTGACGCTTAGCACACTTAACTACACCCCGTTAACAGCTGACCAGAATGGCCAGATATACTGTTCAGCAAACAATATGGGAGTGAGGAGAAATTCCACAAAGCTTTATATAAATGTATTTTACGGACCTGATAGACCGCTGTGCAAAACAAACAACTTCAACATAACTTCAGTATTGAAGGTCATTATTAGTACCACATTCACCATCTCCTGCACAGTTGACAGTAATCCAGCGCCATATTCGTGGCAGTGGTCACCTTCTGGAGGGAGCAGTCAACAGTTAGGCTTCACAAACATACAGAGGATACAGGGCGGAGAGTACACACTTCAGGTTTTGAACAGAATGGCTGTCACTGGGAGTAACAGTTTAGTCGATGGCAGTAACGCGACGTCTTTTACAGTGGATGTTTTGTTTCCCCCTGCTGTGCCAACATTACGCATGAGCGGTAAAGAGGTTATGGGTACGGTCAAGGTCATCGAAGGTAACAGCAAGACGTTCAACTGCAGCACAGAGAGTAACCCGACCAGTAGCTACAGCTGGACGTACCCACGAGGCTCAAGTTCTAACAACATCTTGCAAGTGAGCGACTTCCAGCCAGGCTCCTACGACGGCGATTACACGTGTCAAGTTCAGAACAGAATGGAGCCATCGTTTGGCAATTCAAAGGAGAATGTATCCCTGAAAACTATATCTGTCGATGTTTTGTATGGCCCGAAAACGGGGAATTTGCCGAACGCAAGTAAAGTTCGCGGGGAAAACCTTGTTTACCAGTGTTTGTACATACCTGGCAACCCTCCAACTGTTGACTTTGAGTGGACGAAATCCGGAACAGAGGTCTCCTGGGTCAAACAGAACACACAGAATTTGACCATTCTAAACCTGCAGCGCTCTGACGAGGCCAGTTACACGTGCAAGGTGTCCAGTGTTCTCCAGCCGACGTTGACATTAGCGACGACCACACAGTATGATACTGCAACATTTTTTCTAGATATTCTTTATGGGGCGGAAAATTTGCTGTTGCAACTCAACAACGTTTCCCAATCGTCTGTACAAATTGATGAACATTCATCAAACCATATGCGATGTTCGCTAGAAAGTGATCCCGGCTCGAATATGGCCCTTACAAAAGACGGTAAAACGATAATTGCACGATCTGGAGTACATCAACTCACACATGGAATACAGGCTGAATGTTCGGACGCAGGAGTGTATACGTGCTCAGGATACAACCAGTACGGAGCAGCAGATAACGCGTCAGTGCAGTTATTTGTAAAATGTTCCGCGAGGCGACCCACTGGGGTGGAGGTACAGCTTAATTTCACCGCACGCAAACATGAAAATGCAACATTAGTCTACAAAATAGTCGCCTACCCTGTGCCCAAGCCCCAAGAGTTTGTTTGGACGCGCTGTACGAATCGCACTTCTTGTGAACTTGTGCCGGATGAAATGAACAAATTTGAAATTTACACAGAGGGTCTATCAAGTAAATTAACGATTCTGGACGTTCAGATTGAAGATTACAGACTATACCAATTGTTAGTGTATAATGGAGTTGGTGATACACTAGTCGAATGGTTACACCTCAGACCCATCGGAAAATCGGATTCGCCAATGGACTTCCACGTTATTCAAGATACAATACGCGAAACAAGTGCTGTATTGACCTGGATTGCCGGATTTGACAACGGGTCTCCTCAGGAATTTCACATCTCCTATGGAAAGGTTGCTGATGACACTGGATATATTACACAAAATGTAAAACATGACAACAGAGTCGAGATGAATTACACAGTTGTAAATTTAAAACCTGGAACCGAATACTTTGTCTCACTAATTTCGGCAAACGAGGAGGGTTCTTCTGCACCGGTGAACGTTACATTTTTAACTCTAAAACGTATTAATGATCAAACTCAGACTAGTCCAAATACTGGTCCTGTTTTTGGAGGGGCAGTTGGCGGAACTGTTGGTGCAATAGTGGCAATAGTTGTCGTCGTTATCATTCTCAGGCGGAACTACGCACTAAATTGCAACGTAACCTGGACAAAGAGAGGTGAACCTTCCGAGCATTCCATATCCGGAAAAGACAACCCCGGATATAACGCAGCCGAGACGTACGAGGTCGTTTCCAGGACAACGGATACATCGGCATACAATGATCTAAAAAATGATGACAGCGGAGCCGATAACTCGCACGTGTATACGTCGTTGGAGGAGTCAAAGGCACCTGTTTACTACGAAAATGTAAAGAAAGATGATCCCATATACAACAATACTGCGCTGCAGAATCCGGTGCAAACAGTGCTTTAAATGTACACATCCATACAACAATGTGAAGATATGGCATTTTACAATGTCATTTACTTACCCAGTGAAATATCGAATACTAAACCAGCACTATATCAACGAAGTATGGATTGCATAATATTTGTTATCAAAATGTTTCATACTTCATAAAATTATATTGATT
>XR_003276401.1 PREDICTED: Carassius auratus uncharacterized LOC113048120 (LOC113048120), ncRNA 
TTTTGAACAATTCTTGAGAGAGAAAAAAAACAGTGATTCTTTTACGTCCTGACGCAATAACGTCCGTACGTCTTTGCCTTGCGTGCTTTAAAATATTCCGATAAAGCCATATTAGGTTTTTGTAAAACCATGTCATTTAGGATACGCGTTAATAAAATTATCAAACAATCGTCGTAAATACATTTATTTTGTAACATTACTGCTCTTTGGCCACTAATGTAACTTTTAGCGCGGTAAAAATAAATAAATAAATAACAATAATAATTGTAAGCACGAGCTTTTGATTCGGGAACAGCTTGGACCGATTAGTGGAGCCAGGAAATGATCAGACTGGTTTTGGGAACCGCGTTAAGTGATTCAATGAGAAGATTAACCTCAAAAGAAACCACGCTTTCAATCGCGGGAATTTCTACAAACGCTGGAATCTCCCCCTTCACACGGAGGGATTTTATATGATGTCATGACGCGGGAAGGCAAAACGCACACATCCACTGACACAGCTGTAATACATTCCCACGCAAGCGAGACCACCATCCCGCCTGAAAAGCCTGGACATCCGTAGTGAAACATGTCTGGAATCGGCTTTCTGAAGATCTACTTCATTGGAACCGCGGTTTCTTTTCTGGTGGCTCTGTTTGGACTGGTTGATTCAGTCGGGGGTCTGATGTATCCTCAAGCCCCAGACTGGGCAGACGACAGCTGGACAGAGAAGCATCCGACCGTGTCTCCATCACAGACTGCTGCTGCCAGCAACACCAAGCGCAACGGATCGACATGATCTTCTCCGCTACCGTGGCTCGAGAGTCTAGCCTCGGGAATAATAGCCTCGGTTTACTGACCTACTAAAGCCTACTGTGGAACTACAATCTTCTACAATTTTCACTACTGCGGTCTGTGTCGTGTGAAATATGAGACATGAACACAATGGCTTGTGAGGTGCCAGCTCTTCACACTCGTTACGTTTTTACTTTGTTATTCTGGTTTCTGCAAAAACTTTAAATGAAAAAAGGGAAAAATTCTTCCGGAGAGGTTGAAAGCATAAAAATACTACAAATATGCAACATGAATTTGCTGGGCTGCCTTGGAATATTGAAATCCCTCTGTGGTCGATTGTTTTTGTAATGGGTTTTAAGTAGTTTTTGTAATGTTTGTTCCTTTTTTATATGCCGTTTATATGAAGATAAATGTAACACTCAGAATGTAAACATATGTGTAAGATGCTGTTTACCATGAGCAACTGTGGCATTAGGCAGCAAAAAGTGCACTCCCAATATGGCTAAAGGGTGTCTAAAAGATATCAGCTAGATATCTTTCAAATAGATAAGTTGGGTTATGTTACTGAAATTCACTGTTTTGTATTGAACTGAATACAATGTATACAGTTGCATTGTACATCACTAAAGCAGCCTGTTTTTGTGCTCTAAAAAGTTGTCAATTTTAATTAGAAAAATTTCCATTTGCTAAACTTTCAAATTACTTATTTCTAGTCATATTTTTGCTAAACTTTGTGTGTTGTGAACTTGTGATCATAACTGTTTATTGTGAAATGTTGTTAATGGTGTGGATTTTCCATTGAAATACTCTCGTCTTTACCTTTTACATGTCTTTGAAAAGCTGTAAATTGCAAATTGGCAGCTTTGGAAAAAAAAAAAACCTGTCATAGATGATTAAACAACATTACTATA
>XM_017265421.2 PREDICTED: Drosophila elegans E3 ubiquitin-protein ligase Ufd4 (LOC108141837), mRNA 
ATAATCAATTTTCGAGCTGCTGGACTGGATATTTGTGTGAATAAAAATAGTGTGGTGTATTGAGTAATTGTAGAAAAGCTTTAAAAAAGCAGCTTTAAAAAAGCAAGCACCAGCAAAATATTCAATATAATGCAAAAAAGATTTGGTTAAGCATAAATCAAATTTCGATTTGCGATGGGCGATGTCGATCCCGAGACGCTGCTGGAATGGTTGTCCATGGGACAAGGAGATGAGCGGGATATGCAACTGATTGCGCTGGAGCAGCTTTGTATGCTGCTCCTGATGTCTGATAATGTAGATCGTTGCTTCGAAAGCTGTCCTCCTCGAACATTTTTGCCGGCGCTATGCAAGATATTCCTAGACGAACTGGCACCTGAAAATGTACTCGAGGTCACTGCGCGAGCCATCACCTATTACCTGGATGTGTCGGCGGAGTGCACCAGGCGCATCGTTTCGATTGATGGAGCCATCAAAGCCATATGCAACCATCTTGTGGTTACGGATTTGTCATCGCGAACATCTCGCGATCTGGCCGAGCAATGTATCAAAGTGCTTGAACTGATTTGCACCCGAGAAGCGGGCGCCGTCTTTGAGGGCGGTGGCCTCAACTGCGTCCTGTCCTTTATTAGGGACTGCGGATCGCAAGTTCACAAGGACACCCTACATTCGGCCATGTCCGTTGTATCCAGGCTCTGCACCAAGGTGGAGCCCAACACGCCGTGCATTCAGAACTGCGTCGAGAGTCTGAGCACTCTGCTGCAACACGAGGATGCCATGGTATCCGATGGCGCTTTGAAGTGCTTTGCCTCCGTGGCCGACCGATTCACACGAAAGTGGGTTGATCCAGCGCCGCTGGCAGAGTACGGTTTGACCACTGAGTTGCTCAAGCGCCTCAAGAGTGTCGGCGGAAACACACACTCTTCGCTGTCTGCGGCAGGAGCCCAGCCGACTAGCTCTAGCCAACCCGCTGCGGCCACAAACTCGGATGCAATCAATGAAAACGTAGCGGGCAATGCAACCATTTCCAGCAGCACCAAGGTCAAGGCATCCGATGTGGCCGCATCGCCACAGTCGATATCGACTACAATTTCCTTGCTGTCGACACTTTGCCGCGGATCTCCTTCCATCACCCATGATATTCTGCGTTCCCAGTTGGCTGACGCCCTCGAAAGAGCCTTGCAGGGCGATGAGCGATGCGTGCTGGACTGCATGCGATTCGCAGATCTCTTGCTTTTACTTTTGTTCGAGGGGCGCCAGGCCTTGAACCGAGGAAGTAACAATCCCAATCAGGGACAATTGGCGCCACGACCCAGGCGCAACAACACCAACACCGATCGCACGCATCGCCAGCTTATCGACTGCATACGATCGAAGGACTCGGAGGCGCTTCGCGAGGCCATCGAATCTGGGGGCATAGACGTCAACTGTATGGACGATGTGGGTCAAACCCTTCTCAACTGGGCTTCAGCCTTTGGCACACTGGAAATGGTGGAATATTTGTGTGAGAAGGGAGCGGATGTCAACAAGGGCCAGCGGAGTTCTTCCCTTCACTACGCCGCATGCTTTGGTCGACCGGCCATTGCGAAAATCCTGCTTAAATTCGGAGCCTATCCGGACCTGCGCGATGAGGATGGTAAAACACCATTAGATAAGGCACGCGAAAGATTGGACGATGGACATCGGGAAGTGGCAGCTATTTTGCAGTCACCGGGAGAGTGGATGTCTCCCGATCACTCGCTGCTCAACAAGGACGGAAAAAAGTATACGTTGATGGAGCCCAGGGGTGATCCTGAAATGGCGCCCATTTACCTCAAGGTACTGCTGCCCATATTCTGTCGGACCTTCTTGGGCTCCATGTTGGGCAGTGTGCGACGGGCCAGTTTGGCCCTGATAAAGAAGATTGTACAATATGCGTACCCAACGGTGCTCCAAAGTCTCAGTGAAACCAGTTTTAGCGAAGATGAGCCGTCAACATCGAGCCAAAATGGTGGTAACCTACTTATCGAAGTGGTCGCTAGTGTCCTAGACAACGAGGATGACGACGACGGGCACTTAATTGTTTTAAATATTATTGAGGAAATTATGTGTAAGACACAAGAGGAATTTCTCGACCACTTTGCAAGACTAGGAGTGTTTGCTAAAGTTCAAAACCTGATGGACAATGATGCAGAGGAATTGTATGTGCAATTATCAGGAAACCCCGATGAACCAGCTGTCGTGCAGAGATCATCGACCAGTGTTGTAGTCTCCCCAAGATCAACTTCAGATGATCCTATGGAGGACGCAAAGGAGATATTGCAAGGAAAGCCTTATCACTGGCGAGAGTGGAGCATTTGCAGGGGTCGAGATTGCTTGTACGTCTGGTCGGACTCGGTGGCTCTAGAGCTTTCCAACGGCTCTAACGGGTGGTTCCGTTTCATAATCGATGGAAAGCTAGCAACGATGTACTCCAGTGGAAGTCCAGAAAACGGAAATGACAGTTCTGAAAATCGAGGAGAGTTTCTTGAGAAGCTTATGCGTGCACGTTCCTGCGTAATTCCAGGAGTTGTATCCCAGCCCATTTTGCCCACTGCAAGTGCTCTACGATTGGTTGTTGGTAACTGGGTCCTGCAGTCGCATAAAACAAATCAACTTCAAATTCACAACACCGAAGGCCATCAGGTAACCGTGTTACAGGACGATTTGCCTGGCTTTATCTTTGAAAGCAACCGTGGAACGAAGCATACCTTCACGGCTGAAACTGTCTTGGGTCCCGATTTTGCCTCCGGTTGGTCAACGGCTAAAAAGAAACGCAACAAGTCCAAGACCGAGGGTCAAAAGTCTCAAGTTCGCAACTTATCCCGCGAAATTTACAACAAGTACTTCAAGTCTGCCCAAACGATTCCTCGCGGAGCGGTGGCAATACTTACGGACATTGTGAAGCAAATTGAATTATCCTTTGAGGAGCAGCACATGGCACCAAATGGAAACTGGGAGACAACACTCTCGGACGCCCTAATGAAGCTGTCTCAATTGATCCATGAAGATGGTGTCGTGAGCGCCTACGAAATGCACTCGTCGGGATTGGTGCAAGCGTTAGTGGCCGTTTTGTCGGTTAACCATTGGGAAAATAATTCACCTCGATGCAAACGAAATAAAATGCAAAAACAACGAGTTTCCGTATTCAAGAAATGCATACTGGAGGATAACGTTGAATCCGCAACGAATAAGCCGCGAACTAAGAGCACTGCAAGTATTTTAATACAGAAACTTGTATCGGTTCTGGAGAGCACAGAGAAGCTACCAGTGTACTTGTATGACACTCCATGCACTGGTTACAGCTTGCAAATTCTGCAGAAACGACTTCGCTTCCGTTTGGAGCGAGCAGAATGCGAGAGCACTTTATTCGACCGATCCGGTCGAACTCTAAAAATGGAACCTTTGGCCACAATTGGACAACTATCCAAGTATCTGCTGAAAATGGTGGCCAAACAATGGTACGACCTCGATCGGTCCACATATTTTTATTTGAAAAAAATACGCGAACATCGGACCGGCACTGTGTTTACGCACTTATTTGACTTTGACGAAGAGGGTTTGTTGTTCTACATTGGCTCTAATGCAAAGACTTGCGATTGGGTCAACCCAGCGCAATATGGACTTGTGCAAGTGACCAGCTCGGAGGGGAAGACCTTGCCATATGGCAAACTGGAGGATATTCTGTCTCGCGACAGCATCTCACTCAATTGTCACACCAAGGACAACAAGAAGGCCTGGTTTGCCATCGACTTGGGCGTGTATATAATACCCACTGCGTACACGCTTCGTCATGCGCGCGGTTATGGAAGGTCGGCTCTGAGGAACTGGCTTCTCCAGGGATCAAAGGATGGCCTAAGTTGGACAACCCTCAGCTCACACGTGGATGACAAGAGTCTCGTGGAGCCCGGTAGCACAGCGACTTGGCCCATAACGTGTGCAGCTGACGACTCGGTTAGATATAGGCACATCAGAATCCAGCAAAATGGACGCAATGCATCTGGCCAGACCCATTATTTGAGTTTGAGTGGATTCGAGATCTATGGTCGCGTCGTCGGAGTTGCCGACGACATTGGCAAGAGCGTCAAGGAGGCTGAGGCAAAAATTAGGCGCGAGAGGCGACAAATAAGAGCTCAGCTCAAGCATATGACTACCGGTGCTCGAGTAATTCGAGGCGTCGACTGGCGGTGGGAGGATCAGGATGGTTGTGCCGAGGGCACAATAACCGGTGAAATTCACAACGGCTGGATCGATGTGAAGTGGGACCACGGCGTACGCAACTCGTATCGCATGGGAGCCGAAGGGAAGTACGACTTAAAGATGGCCGATTGCGAATATCTTTCCGTATTCGAAGGAAACCAGTCGATGGTTACTGTGAACGCGGCTGCAAAAATAAACGATAAATCAAACACGCTCACCTCGCGCAAATCAAGTTCAACTCCATCCCTGCCCGAAGCCACTGAAAAGAATCAAAACGCTGAAGGTGCGTCCAATCAAACCGTTTCGGCTGATAACTTGGCCTGGAAACAGGCGGTGGAGACGATTGCAGAGAACGTGTTTGCTTCGGCAAAGACACAGATTATCTCAAATCAACTGGCTATGAACACGTCATCCTCTCGGGAAGTTCGAACCAAGCACAAGGAGTCGGCTGCCAACCAAATGCATAAGGATAACATAAGTGGACCGTCGCCATTGAGTCGCGAGCTGGAGCACATATCGGACTTGTCGGCCATCAACAACTCGATGCCGGCAATTAACTCAAATATTGTTTCCGATCTAGCTACCATTTCGGAGAACCTATCCCTAGCTGAATTGTCCAAAGAAAACATATGCAGTGTCCTTTCGCCTTCATATAAGCCCGCTGAGGCTGTTGCTGCGAGTCAAAGCTCAAGCCTTCCCGATGTACAGAGTTCGTCTCCGTCTCCGCGAGAGAGTGATATAAAGAACATATCCAACATTGAAGAGAACAATAAGATGAATGCAAACAACACGGTGAATAAGATATCAAAGGATCTGCTTGTGAATCTCCGAACATCGAACATTGCAGGCTGTCAACCGGTGACACAACTTTCGACCGAAGCCCTCGAAATGATCGACAAGATGCGTGATGGCGTGGATATGATACGGAATAACTCCAACAACATTCTTTCCACAGACACTTTCCCCATGCCGCCATGCACAAACATGGGAGTCGGAGTTAAAAAGACACCCAAGGCTCAGGCGCTGATAAATCCCGAAAATGCGAATCAAAAACAAATCATAGTTGCAACAGAAGAATATCCCAGCAAGAGTTCAAAGAAACCCAGTGTAACGTTGAAGCCAACACAGCAGCCAAATGCCGTGCTTTCGATCGTGGACATCAAAGATCCGCAAATTTCATCCGAAAGCGTTTCGGTGCCCAGCCAGATGAGTATAAGTGTTCCTAATCTGACAACAACTTCAGCATCTGAGGTTCCCTCCACCTCAGAGGTGGCTACCCACACGGGTCTGCTGGAGACATTTGCGGCAATCGCTCGTCGACGCACCTCGCAGGGCACCAACATACAGGATAATCAGATCATGAATGCGGAAGTGAATGTGAACGAGCACGGGGATCAGAACGCATCGGGCTCATTCCTCGGCCACTCGGTAACCAGTTTGGTTAAGCTGGCATTGTCCAGTAATTTCCATTCTGGACTGCTCAGCACCGCCCAGAGTTATCCGAGTTTATCGTCGAATAATAGTGAAAACATAGCCCCATCAAACCCGTCAAATACGTCGACGGGACAGCAATCGGCATCCACCATAAATCATACACTTACAATGAGTCTTACATCCACGTCGAGTGACAGCGAACAAGTGTCACTGGAAGACTTTTTAGAGAGTTGCCGAGCTCCGGCTTTGCTGGGCGACTTGGACGATGAGGACGACATGGATGAGGACAACGACGAGGAGGAGAACGAAGACGAGTACGAAGAGGTGGGCAACACTCTGCTCCAAGTGATGGTCTCCCGGAACTTGCTCACCTTCATGGACGATGAGGGTTTGGAGAACAGACTGGTGGGTGTTACGAAGCGCAAGTCCTGGGACGATGAGTTCGTCCTAAAGAGACAGTTCTCCGCGTTGATACCTGCATTCGATCCGCGACCGGGTCGCACGAATGTTAACCAGACTTCGGATTTGGAAATTTCCCCCATTGGCGTTGAGTTACCCAAGCCCCAACAGAGCGGCCAGGAGACTATTGAACAGCCGATGCTGGGTCTAAAACTACGTGGTCCGGGAATTGGCGGAATTCCCGAAGTTGAAATTGACCTGAACAACACAGACTGGACCATATTCAGAGCCGTGCAGGAATTGCTGCAGTGCAGTCAGTTGAACAAGCTGGACAAGTTCCGAAAGATATGGGAGCCCACATACACGATTGTGTACAGGGAGGTGCCGCCTGAAGCGCCAGAAAGCACTGGCGTGGACTCGGAGGAGTTTGCCCAAACACCGGATGTGTCGTCAAAGAGTGGCGCCTCCACTTTGTCCCCCAACTCACCCATGCACATCGGATTTAACGTAGCCGATAATAACCTGTGCTCCGTGGACGATGTGCTTGAGCTGCTCACTCAAATCAATGGTCTCAATCAATCGGAAATCGATTCGGATGGCAAGGAACTTGGTGTTTCCGTGTTGTCCGAAGATCTCTTTATCAGCAAGAAAATAACTAACAAACTGCAGCAGCAAATCCAGGATCCACTAGTGCTGTCCAGCAACGCGCTGCCCAATTGGTGCGAAAACCTAAACCAATCTTGCCCCTTCCTGTTCCCATTCGAGACCAGGCAGTTGTACTTCAACTGCACATCCTTTGGAGCCTCTCGCAGCATAGTATGTCTGCAATCGCAGAGAGATGTGACTGTGGAAAGGCAGAGGATTCCCATCATGAGTCCGCGCCGGGATGATCACGAATTCCGCATCGGTCGTCTTAAGCACGAACGCGTTAAGGTGCCTCGAAACGAGAATCTACTTCAGTGGGCAATGCAGGTTATGAAGACGCACTGCAACCGAAAGTCCGTGTTGGAGGTGGAGTTCTTGGACGAGGAGGGAACTGGTTTGGGTCCTACACTGGAGTTTTACGCCTTGGTGGCTGCCGAAATTCAACGCGCCGACCTGTGTATGTGGCTGTGTGACGACGATTTGGGCGAGGACATCGACAACTCATCGGAGAATACGCAAGGCAATTCGAAACCCGTAGGGTATTACGTAAATCGCAGAGAACACGGAATTTTCCCAGCACCTCTGCCGCAAAATACCGAAACATGTGAGAAAGTACTAAAATACTTCTGGTTTTTCGGTGTTTTTGTGGCAAAAGTATTGCAGGATATGCGTTTAGTGGACATACCCTTATCAACATCATTTCTTCAATTGCTTTGCCACAACAAGGTGCTGTCACGTAATCTCCAAAAAGTTATTTCGGATAGACGAAATGGCGATCTCTCTGTCGTGTCAGAAGAATCGGACATAGTAGAAACCTGCACTAAGCTATTGCGCACTGATTGCAATAAGACCAATGCATTTGGGGGAATTCTTTCCTTAGAAAACTTAAAAGAAATAGATCCAACTCGTTATCAATTCCTACAAGAAATGCAAAACCTCTTATTGCGAAAGCAGTCAATTGAGTTTGACGACACCATAGACGCCGAGAAGAAAGAAGAACTAATAAACGAGCTTAAGCTGCACACCCAAAACGGCTTAGAGGTATCCCTTGAAGACTTGGCCCTTACGTTCACGTATCTGCCAAGTTCCTCGGTCTATGGATACACCCAGGCCGAACTGCTGCCAAATGGGGCGTCAGTGAATGTCACCATCAACAACCTGGAAGCGTATTGTGAACTGCTTATGAACTTCATCCTGCAGGACGGAATCGCTCAACAAATGAAGGCTTTCAGTGATGGGTTCAACGAAGTGTTCCCCCTCAAAAAGTTGGCTGCCTTTACGCCCTCAGAGGCCCGAATGATGATTTGTGGCGAGCAGTTCCCCCATTGGAGCCGAGAAGACATTATTTCATATACTGAACCAAAACTTGGTTACAACAAAGACAGTCCTGGGTTCCAACGCTTTGTAAATGTTTTACTAAGCATGTCGGGCGACGAAAGGAAAGCCTTCCTTCAATTCACAACTGGTTGCAGTAGCCTGCCGCCGGGAGGACTTGCAAACTTACATCCCCGACTGACAGTTGTTCGAAAGGTAGATGCTGGCGTCGGAAGCTATCCATCCGTGAACACGTGCGTTCACTACTTAAAGCTTCCGGACTATCCAACTGAAGAGATCATGAAGGAGCGCTTGTTAACAGCAACTAAAGAAAAGGGGTTTCATTTAAATTAAACAATTTATTGTACTCGATATTCAAGTTAATAAAATTTGAACCTTTTGTTATTTAAAGCGTACTTGTTGTGTAACGTAATAAGCGATACTGTAAATATTTCAACTGTTCAAACCCAATCTTTATATATAAGTTTAGATTTATTGCTTACACCTAAAGTCTCGGCCTATTGTTTCAAATTTAATTTAACCATTAAAATGGTAGCCACTGCAAA
>XM_004521695.3 PREDICTED: Ceratitis capitata heat shock factor-binding protein 1 (LOC101452289), mRNA 
ATTGTCATTTTCTGTTAAAATTTTGTTGTGTCTGGTTTCCAAAAGCGGAAAGTGTGCAAGATATATTATTTTTATACTTTTATAAAAAAGTTAACACAAACAATTTAGAACTAATTTTAATCGAAAATAAACCACAAACATGGCGGATATAAAGAATGATATTGATAGCGATTTGGATCAGAACTATTCGCTAAGTAGTAATGCGGATCCAAAAAATATGCAGGAATTGACAATTTATGTACAAAACCTGCTACAAAATGTTCAAGATAAATTCCAGACAATGTCGGACCAAATTATCACACGTATTGATGACATGGGCAACAGAATAGATGATTTGGAAAAAAGTATTGCAGATCTGATGAATCAAGCAGGTGTTGAAGGGCCAGAGAAGTAAAACGAAGCGGTTCGCGTAAAAACCTCATATTTTCCCATGAAGCATACTTATAAATATCGCTCATAAATGCAATAATCTTAACAAAATTAAGACATTTATTTAAATTCCTAAACAAAAATACATAATATGTAAGTGCACACATACACACAGCGACATGTACGTCATGTTAAACACAAAAGCGCACGAAAATGCAACCTTAAATGCTGATAAGAAGAATAATTGGCTCAAATGTGACACAAAATGTTTAATTAAGTTACAAACAATACTTATTTTAATTAAGTGAATTTTAAATATATAATGATTAAGGAATCATTTTTGAACATATTTTAAAGTTTTTTTTTTTTTTGTTATTTATATGTAAACAATAACCAAATGTGGGAGAAAAAGAAGTTCTTTGATATATGTGAATTTCTTATTAATTATTGTAATAATTATTAAATATTAATTATTTTTCTTAGTTTCCATACACTATGCATAATTCGGTATAATAAATGAATTAGTAATTTTAAATCAAAACATGAAAAA
>XR_004389653.1 PREDICTED: Rattus rattus uncharacterized LOC116914019 (LOC116914019), transcript variant X1, ncRNA 
TTTTCTCTCCTGGGAGCGGGCCGAGGGGCGGGGGAGGGGCCACCGCTCCGCCTTCTTCTTTTCGCAATGTTGACGCAATCTATAAATAGTGGAACAAAAGGACCAACTTCCTCGGAGCTTTGCTGAAACTGCACAAAAAATCGAGCTGGGGGGTTCCCTGGTCCCCGATGTTGGGGCGGGGAGCTCGGCGCCGAAGGAGGGGGCGGCGCAGACCGGCCTAGGGGGACACCTGGCCGAGCGCAGTCGCCGCTCCGCTCGAGCCCTGCGCTCCAGTGCCCCCACTGGCTGGAGAGCTCGCCCAGACCCGGGGTCTTCCACCGTCTCTGACAGATTTTAACCTTTAGAAGAGAGCCAGTTGTGGAAAACAACCAGTTTTTTGATCGAATACCCACGTAATACATTGGAATATGATAGGAGATTAAGGTTTAACAATGATAAAATGAAGATATTACTAAAACAGCCCTCTAAGTAGCCCAACAATTATTATTTTTGCTAGAGATGAGAACCAGAACCATACAAGGTCCAAGACGAGCACTTTCTCTGTGCATATGGATGTCCTAGAAGTTGTGGCATAATGGTATTAATATGCTAGACGTACTGAATTGAA
>XR_003957782.3 PREDICTED: Taeniopygia guttata uncharacterized LOC115492501 (LOC115492501), ncRNA 
CGTGTCCGCCCCCAGCCCCGTGTCCGCCCCCAGCCCCGTGTCCGCCATCCGTCTGTCCGTGCGCTCAGACTGAGCCCGCAGCGCCCGGGGGAAAGCAGCGGCCGCCTCCCCGCTCCTCCCGCGCGTCCGCCGGCGCCCGCTCGGACTGGCCACGCACGGCAACACGAGATGGTGGGAGGAGAAGCTCCTTACTTCAAGGAAACGAGGCCATGGTCAGAGGCAAATTCTCCAGGGGCTGCAGAGCCCTGTGAGCACAGGGTGACCCCGCACTGGGAGCAGCAGCTGGGGGTTTCTGCACATGGGGAAGGGAATTCCCAGAGCACTCGAGCCTCAACACGGACAAATATTCTGCAGTCTCCAGCAACAATTGGCTTTGGGATTTACGCTGTTGCAGCTCTTCTGGCTGTGAGGATGACCTGAAAATGTGAAGCAAGTGCATCAGCTCTTTCCAATGGCTGTGGCAGCACCAGGGTTTGGGTTTTTTGGTTGGCACAGGAAAATGAGCTGTGAGCAGCATCTGTGCCAGGGAGGAAAGTGCCCCTGGAGCTGGGGCTGAGAACCCGGGGTCGATGTGAGCACCTGTGGGTGGGAAGGAAGCTGGCAGAGCGCTGAGTTTGCTTTTCCTGCAGGCTCGCGCTCTGATGCGGCACAACGGGCCCCCGCAGCTGCAGGAGCCCGGGCGCCTGTCGGCTCTGCTGCGGGACTGCCTCGAGTGCAGCCTGGAGCCGGACGAGGAGCGGCGCTGCTCTGCCCAGGAGCTGCTGCAGCACCCATTTTTATCATCAGCCAAGCCTCTCTCCAGCCTGACCCCTCTGATCACCGCAGCAAAGCAACTGAGGGAGCAGCGGAGGAGATGAAGCACTTGAAAACAGCTGTTAGTTACAGTAGTTAGTGAGGACAACTAGTTAGTGATGGTAGTTGGCAGTGCTAGTTGGTTATGTTGGTTAGGACACCCTGTTTGTTACAGTTCTTATGACAGCCTGTTTGGCATGGCAGTTTTTTGAATAAAAACTCTGTTAAACCACAACTCCCTTGGCGTGTCCCTTCCTCCTCCCTCTGTGACTCAGCTGCCCGGAGCAATGTGAGGGGAGAGCGGGCCCAGCCTCGCCCAGAGCTGAGCCCCAGCAGAGCCCTGGCAGAGCCCAGAGCAGCCGGGGCATCTGCAGAGTCAGCCTGGGAGGAGGCGCTCGGAGCCTTCTCGGCTGCACCGACTCTTGGGTACAAACTGCGTGTGCTGGAAAATGCCCCCGGCTCGGCCAGAGGGCAGAAGGGGCCCGGGGAAGGCCCCAGTGCTCCCTGCAAGGGAAACACCTGCCCTGGGTTTGTTATAAAGGACTATGTAGTTGTGGCTTTTGCTGTGATGTCTTGGCTTCTGCAACTTATTCTTAATCGCAACGATTTAGATACAGTACAGCTTGTAATCACTTTTAACTGCTTTTGCTGTAGTATAATTTGTCAGCTTTTTGTGGTCAATGCCCTGGCCCCTGTGTAGCTCATATCCTCAGAACATCATTCATGGATGATAGTTTAGTTTGTGCACAGTGTGAAAAACATACATGATAGTTTTGGCTTTTACAAAATATTGAAGTGGATGCCATGTGTTGTGCATTAGAATGTTAACTTTTGCAGAAGTAGCTGTAGTTGTGAAATAATAACTAATGCTTTTCTTTTTGTAACTAACTGACAATAATAACTCAGAGATATTTGTGAAACAGCCAATGTTGATTTAAAGTACTTGTGGAAGTAGCTAAGACCGTCTGCATGGCCAGATAACGTTTAAGGAACGGGTGTGATGAGGACCCTGCCGCTGACCCTTCGACTGTCAGTAACTGTCGCCTGCTGATGTGGAAACCCAGGGCACCGGGAATATTTCTCTGTCTGCTCTGGGGTGTCCTGACCCCCAGGGGAGCACTGACTTTGACCCTCATTCATGGAGAAAACTTCCAAAGCTTCAAAGTAAGCTAGAAACCACAAAAGTGTGAAATAGATTGTAGAGATTGCAGAGAGTAGTGGAGTATGTCATATGGGTGAAAAATTTAGGTTTTAGAATTTTTAGTATGTTATAGATGGGTTCAAGATGGAGGATATAGGGTGTTGTCTTGAGTTCCCTTCTTCTTTCTTCTTCTTCTTCTCTTTCTTTTTGGGTTTATGTGGTATCCTGTAATTGGGTAGAATAATCTGCATTGTGGGTCTTTAGGGGTCAGTTACTGGGTTAGAAAGAAAACTAATTTAGGTGTCACTTCTTAATTGGGTAGCTTAGTTTTTGATTAGACTTACAAGGCCTTGTAACAAGAGATTGTTGGCCATTTTTGTGCTGTTTTCCTGCACGCAGAGTCTGGTGCAGACAGTGTGCTGAAGTTTTGATAAGAATAAACAGAAGCTGAAGACCGAAAAAGTCCAATGCAGCTCTGGTTCCTGACACAGAACTGCTCCAGGAGGGTCCCCCTGCCAGGGGAGCCGCCAGGGAGTTGCCCAACTTGGGGCCTGCAAACTCCCAGCTGAATCGGGGATCAGGGGGCTGTTGTGAGGAAGTGACACACAACCCTCAAAACAACAATCCATGATTCCTGCACGGACTCTAGAAAGGCGGGTTGGGGGTCAAACCAAAAGAGTTCCTGGAAGAAGTAAATGAGTTCAAAGAAATGTTTGAATGTGTATAATCTTTATGAATATGTTTTTGGACAATACAATGGAAAAAGTAGATAAGAAGAGTTGCTATGGCTAACCAGTGTGCCTCTGGCCATTGCCAAGCACCCAGCGCTGTTATTGATTTGTCTCTAATTATCCCTTCTTAAAGTTTTAAAAATCGTCTTGCTCATTTTGCCCCTCTTTGGCTTCTTCTCCAGGAGCAGAGGGAGCCGGGGCAGAGACCGCTGTTCCTTCTGCCATCTGCGGCAAGAGAGAAGCATGAGGGACAGGCCGTTACCTCTCATTTATAACCTCGTTCCTCCTCGGATCCACAAATACCACTTCCAAGGAGAAATCAGCAACTCTGTTAGCGATGGGATTCTAAGTGACTCTGACCAGATTAAAGTGGGTTAACTCAACAGAACTCTATTTGATGAACTCTATGAATTTGATAGTCCTCCCTGGCTGCTATCAGCAAGCAGCGGTGCCTCTGCACAATGCAGCTTTTAGCTCTTGAAAACTCTGAAATGGAAAAGTCAGAGATAGCCAGCACGGACTTTGTTATTGCTGCAGCAGACAAGGAAAACTCAAACTGGATCAGAATCCCATGCAGTGCACGAAAAGGGCAGGAAAGGTTGCGCAGACGCCTCTTTGCTTGCTGGAAAGAGAGAAAATGAGCGGGGCTTCTCCTCCTAGCAAACCAACAAACCACAAGTCGGAAGTGTCCCCTCCTCAGGTGGCTAAAGCACTTGGATGCAGTGAGGGCATGTCTGGCAGGGAAACAGCCCTGGTGGTGAGCACTGCCATGTATGGATCCATGGATCTGAAGGTCCCTCACAAGCCTCCCGTTGTCCAGGCTAAAGCTCCCTCAGCACCTCCTCCTTGGCCTTGCGCTCCACAGCCTTCCCCAGCTCCCGTGTCCTTCTCTGCACACGCTCCAGCCCCTCGAGGACTTTCTGCTTCAGAGGGGCCCACAAGTGGACACAGCACTCCCAGCCATGGCCGCAGCGCTGCCCAGCCCAGGGGGACGGTCACTGCCCTGCTCCTGCTGCCCCACTGCTGCTGACACAGGCCAGGGCATCCTTGGCCTTCTTGGCCACCTGGCCACACACTGGCCCACCTTCAGCTGCTCTTGACCGGCACCCCTGCGTCCTTTTGGCCCACGCAGCTCCCCCACCACAAAGTTGCCCGCTTGACTTCAAATAGAGCATCCCCAGTTCCAAGATGTCCTTCCTCTTCTCAGCAACACAAGACAGCAGTCAAGGACTTGCAGCTTCCCCCCCACCCTAGGCACTAATGCCATTCCCAAAGCTGCAGGCTGTGTGCAGCTGTCCCTGCAGGATGGCCCCAGGGCAGAGCCCAGCCGGGCTCCCCCTGCAGCCCCTGAAGCTTGGGGCAGGCAGTGGTCCCAGAGCTGAGGTTCACGGGGAGCACCCGCAGCTGTGCCTCGCACTCTGTTGCCGTGTCACCGTGCAGGCTGGCTTGTACGGGGTGAATGTACCAGCCCTGGTTTGACTGACAGGGGCCTGGCCCATCACAGCTCTCCCAAGGCTGCAGGCATTCCCCAGGCCAGAATCTGAAGGGGCACAGAGATCAGACCAGTGAAATCATCCAGACTGGGTTTTTCAAAGGCCCTTTAGAAGGAAGGGCTTGAGAATAAACGTGCTCTGTTTGCCACAGGAA
>KP156844.1 Uncultured bacterium clone garden_soil_51834 16S ribosomal RNA gene, partial sequence 
AGTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCAGCGCGGGGGCAACCCTGGCGGCGAGCGGCGGACGGGTGAGGAATACATCGGAATCTACCCAGTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTGAGGGTGAAAGCAGGGGACCGCAAGGCCTTGCGCGATTGGATGAGCCGATGTCCGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGACGATCGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTTGGGTTGTAAAGCACTTTTGTTCGGGAAGAAATCTTCCGACCTAATACGTCGGGAGGATGACGGTACCGAAAGAATAAGCACCGGCTAACTTCGTGCCAGCAGCCGAC
>XM_050191817.1 PREDICTED: Dermacentor andersoni protein FAM136A-like (LOC126544480), mRNA 
AAGCTGCCGGGCGCTGGCGGCTGCATGGGCGGCTGGCGCAAACACGAGGCGATTGTTGGTCTGCTTGGTTTCCTTCCTGTAAAAGGAGGTATTATACTAGTACTGGGAATACTACTGTAAGTGTTGAGCCGAACAACGCGATACAATGGCCGAAGGAGCTGCTCTGCGTGTACAAACTGCCGTAGACAACATGGTCAAGGAACTCGACAACTCTTATCTCCGCAAAATATTGGGCAATGTGCACAGGTGTGCAGTTAAGTGTTGTGACAATTCCAGCTTGTCAATGGATGGTGCTCGCACGTGCATCATGAACTGCTCTGAACCTCTTAACAAAGCCCAGAGTAAAGTCGAAGGTGAACTTGGAAACTTTCAGGAACGCATACGAATGTGTGTTATGCAGTGCGAGAATGACGTGCGGGACCAGATGAGCTCAACGTTAACAGAAGCAGAAGCCTCCAAGTTGAAAGGCCAATATGAGTCGTGTGTTGTGACGTGTGCGGACAAACATATTGCTCTTTTGCCACAGATGCAGCGAAGAATGAAAGAGTTGTTAAGTCAACTTTAGAGGCCAGTGTACACTGTTGTGTACATAGTTCGTACCGATCCTTGTATTTCTAGGATGAGTTAACATGCCATGTAGCTCCGCTCGTTGCCTTCTACCATAAATGTTTGATGAAAGGAC
>XM_014783154.1 PREDICTED: Ceratotherium simum simum ATPase, class VI, type 11B (LOC101400597), transcript variant X4, mRNA 
GTGGGCGACATTGTTCGAGTAGCCAAAGATGAAATTTTCCCTGCAGATTTGGTGCTTCTGTCCTCAGATCGACTTGATGGTTCTTGTCACGTTACAACTGCTAGTTTGGATGGAGAAACTAACCTGAAGACACATGTGGCCGTTCCAGAAACAGCAGTATTACAAACAGTTGCCAGTTTGGACACTCTTGAAGCTGTGATAGAATGTCACCAACCAGAAGCAGATTTGTACAGATTCACAGGTCAGATGATGATAACTCAACAATTGGAAGAAATTTTAAGTTATTCCTTCTCGTTTTATATCTCCTTAATGGAGAGAAATTCAAACACCAAGAAGACCTGTGCTCCAAGAAGTGTACAATACCTCTGGGGCCAGAGAGTCTCTTGCTTCGTGGAGCCAGATTAAAAAATACAAAAGAAATTTTTGGTGTTGCTGTATACACTGGAATGGAAACTAAGATGGCATTAAATTATAAGAGCAAGTCACAGAAACGATCTGCGGTAGAAAAGTCAATGAACACATTTTTGATCATTTACCTCATAATCCTTATTGCTGAAGCCATCATCAGTACTATCTTGAAATATTCATGGCAAGCTGAAGAAAAATGGGATGAACCTTGGTATAACCAAAAAACAGAACATCAAAGAAATAGTAGTAAGATTCTGAGATTTATTTCAGACTTCCTTGCTTTTTTGGTACTCTACAATTTCATCATTCCAATTTCATTATATGTGACAGTAGAAATGCAGAAATTTCTTGGATCATTTTTTATTGGCTGGGATCTTGATCTCTATCATGAAGAATCAGATCAGAAAGCACAAGTCAATACTTCTGATCTGAATGAAGAGCTTGGACAGGTGGAGTATGTGTTTACAGATAAAACTGGTACACTGACGGAAAATGAGATGCAGTTTCGGGAATGTTCAATTAATGGCATAAAGTACCAAGAAAGCAATGGTAGACTTGTATCTGAAGGACCAACACCAGACTCTTCAGAAGGACCCTTTTATCGTAATAGTTTATCCCATCTTAACAACTTATCCCATCTTACAACCAGTTCCTCTTTTGGAACCAGTCTTGAAAATGAAATTGAACTAATTAAAAAACATGATCTCTTCTTTAAAGCAGTCAGTCTCTGTCACACTGTACAGATTAGCAATGTTCAGACTGATGGCATTGGTGATGGTCCCTGGCAATCCAGCCTTGCACCCTCCCAGTTAGAGTACTACGCATCTTCACCAGATGAAAAGGCTCTAGTGGAAGCTGCTGCAAGAATTGGCATCGTGTTTATTGGCAATTCTGAAGACACTATGGAAGTTAAAACACTTGGAAAACTGGAACGGTACAAACTGCTTCATGTTCTGGAATTTGATTCAGATCGTAGGAGAATGAGTGTTATTGTTCAGGCACCTTCAGGTGAGAAGTTTTTATTTGCTAAAGGAGCTGAATCATCAGTTCTCCCTAAATGTATAGGTGGGGAAATAGAAACAACCAGAATTCACGTAGATGAATTTGCTTTGAAAGGGCTAAGAACTCTATGTATAGCCTATAGACAATTGACATCTAAAGAGTATGAGGACATAGACAGACGCCTCTTTGAAGCCAGGACTGCCTTGCAGCAACGGGAAGAGAAATTGGCAGATGTCTTCCAGTTCATAGAGAAAGATCTGGTATTACTTGGAGCTACAGCAGTAGAAGACAGACTACAAGATAAAGTTCCAGAAACTATCGAAGCATTGAGAATGGCTGGTATCAAAGTATGGGTACTTACTGGCGATAAACACGAAACAGCTGTTAGTGTGAGTTTATCATGTGGACATTTTCACAGAACCATGAACATTCTTGAACTTACAAACCAGAAATCAGACAGCGAATGTGCTGAACAATTGAGGCAGCTTGCCAGAAGAATTGAAGAGGATCATGTGATTCAGCATGGGCTGGTGGTGGATGGAACCAGCCTGTCTCTTGCACTCAGGGAGCATGAAAAACTATTTATGGATGTTTGCAGAAATTGTTCAGCTGTATTGTGCTGTCGTATGGCACCGCTGCAGAAAGCCAAAGTAATAAGACTGATAAAAATCTCACCTGAGAAACCTATAACATTGGCTGTTGGTGATGGTGCTAATGATGTAAGCATGATACAAGAAGCACATGTTGGCATAGGAATCATGGGTAAAGAAGGAAGACAAGCTGCAAGAAACAGTGACTATGCAATAGCTAGATTTAAATTCCTCTCAAAATTGCTTTTTGTTCATGGTCATTTTTATTATATTAGAATAGCTACCCTTGTACAGTATTTTTTTTATAAGAATGTGTGCTTTATCACACCCCAATTTTTATATCAGTTCTACTGTTTGTTTTCTCAACAAACACTGTATGACAGCGTGTACCTGACTTTATACAATATTTGTTTTACTTCCCTACCTATTCTGGTATATAGTCTATTGGAACAGCATATTGACCCTCACATATTACAGAACAAGCCCACCCTTTATCGAGACATTAGTAAAAACCGTCAACTAAGCATTAAAACATTTCTTTATTGGACCATCCTGGGTTTCAGTCATGCCTTTATTTTCTTTTTTGGATCCTGTTTTCTGATGGGGAAAGATATATCTCTGCTTGGAAATGGCCAGATGTTTGGAAACTGGACATTTGGCACCTTGGTCTTCACAGTCATGGTTATTACAGTCACAGTAAAGATGGCTTTGGAAACTCATTTTTGGACTTGGATCAACCATTTTGTTACCTGGGGATCTATTATATTCTATTTTGTATTTTCTTTCTTTTATGGGGGGATTCTCTGGCCATTTTTGGGCTCCCAGAATATGTACTTTGTATTTATCCAGCTCCTATCAAGTGGTTCTGCTTGGTTTGCCATAATCCTCATGGTTGTGACATGTCTGTTTCTTGATATTGTGAAGAAAGTATTTGACCGACAACTCCATCCTACAAATACTGAAAAGGCCCAGCTTATTAAAACAAATTCAAGTGTCAAGTGCTTGGACTCCATGTGCTGTTTCTCAGAAGGAGAAGCAACGTGCGCATCTGTTGGAAGAATGCTGGAACGAGTAATAGGAAGATGTAGTCCAACCCATGTCAGCAGATTATGGAGTGCATCGGATCCTTTCTATACCAACGACAGGAGCATCTTGACTCTCTCCACAATGGAATCATCCACTTGTTAAAGTGGCAGTAGTACTTTGTGGGAGCCATTTCAACTCCTTTCCTAAAATTCAGTGTGATCATCCTGGTAATGGCCATACTGGCTCTTCAGATTTACTTTCTGAAATCTCTGGAGTAGTTCATACCCACTCAGAGTTATAATGGCAAACAAACAAAAAGCATTAACGGGAACCCCTCTCAACTCCCTTATGTTAAACTTTGTGAATAAAGAGACATTTTGCATCT
>XM_027489590.1 PREDICTED: Abrus precatorius vicilin-like seed storage protein At2g28490 (LOC113857560), mRNA 
ATGGGAAACATAGCTACCCTTTTGCTCTTGCTCTTTGTTTTTTGCCATGGAGTGGCCATAGCAGAAAGTCCTTCAAGTTCATCAACCAAATTGTTCTTGATGCAAAACTCCAAGAGAGTGGTTAAGACTGATGCAGGGGAAATGCGAGTTATGAAAAGCTATGGTGGTAGGATTTTGGATAGGCACATGCAAATTGGTTTCATCTCTATGGAACCAATGTCCTTGTTCATTCCTCAGTACCTTGACTCCAATTTGATCATCTTCATCCGAAGAGGGGAAGCAAAATTGGGATTCATATATGATGATAAACTAGCGGAAAGGAGATTGAAGACAGGAGATGTGTATATAATTCCAGCAGGTTCAGCATTCTATTTGGTGAATTTAGGGGCGGGTCAGAGACTTCACATCATTTGCAGCATTAACCCCTCTTCAAACTTAGGAGTAGATACCTTTCAGTCCTTCTATATTGGCGGAGGAGCCAATGCACCCTCAGTGCTTTATGGATTCGAGTCTGTGATCCTTGAAGCTGCATTTAATGAATCAAGAACCGTGCTAAGGAAAATCTTCACCAAGGAACTAGATGGGCCAATTGTGTACGTGACTGATACACATGCACCTAGATTATGGACTAAATTCCTTCAACTGAAAAAAGAAGACAAAGTGCAACACCTGAAGAAAATTGTGCAAGACCAAGAAGAAGAAGAAGAGGAGGAAGAGAAGGAAACAAGTTGGTCATGGAGGAAGTTCATGGAAACTATACTTGGTAATGTGAATGAGAAGATAGAGAACAAACACACTGCTGGTTCTCCTGACTCTTACAACCTCCATGACAAAAAACCTGATTTCAGAAATGCTTATGGTTGGAGCAAGACACTTGATGGAGCCGAGTATCCTCCACTCAGAAAAGCTGACATTGGCATTTTTCACGTCAACCTCACCGCGGGATCCATGATGGCACCCCATTTGAATCCAAGAGCAACAGAGTATGGCATAGTGCTGAGGGGTTATGGTAGAATTCAAATACTATTTCCAAATGGAAGCAACGCGATGAACACCGAAATCAAAGTAGGGGACGTGTTTGTTGTACCAAGATACTTCCCCTTCTGCCAAATAGCATCAAGGAATGGACCCTTAGAGTTCTTTGGGTTCTCAACCTCTGCCAGGAAGAACAAGCCACAGTTTCTAGCTGGAGCTGTGTCCCTTGTTACGACCATGATGGGGCCTGAGCTCGCAGCTGCTTTCGGGGTGAGCGAGGACACGATGCGGCGCACTGTCGACGCTCAACACGAGGCTGTAATACTGCCATCAACATGGGCTGCACCACCGGAAGATCCAGGGAAAATGGAAGAAGAGAAGGTACACATGCAGCCAAAGGCTATTAGAAGCTTTGCTAAGGATATAGTTATGGATGTTTTTTAA
>XM_036746150.1 PREDICTED: Trichosurus vulpecula N-6 adenine-specific DNA methyltransferase 1 (N6AMT1), mRNA 
ATGGCCCAGGGGGGCTGGGCCCCGCCACGTTTTGCCACTCCATTGCACCGACACGTGGGACGGGGTGCTTTCCGGGAGGTATACGAACCTGCCGAAGACACGTTCTTGTTGCTGGATGCACTGGAGGCAGGGGCCGCGGAGCTCGCGGGAGTAGAGATATGCCTTGAAATAGGATCAGGATCTGGCATCGTATCTGCATTCCTGGCTTCAGTTATTGGCCCTCGGGCTTTGTATATGTGTACTGATATCAACCCCAAAGCAGCCGACTGTACCTTGGAGACAGCACTGTGTAACAAAGTTGACATTCAGCCAGTAATTACAGATTTGGCCGAGGGCTTGCTACCGAGGTTACTCAGCAAAGTCGATCTTCTGATATTTAACCCACCCTATGTAGTAACACCTTCTGAAGAGGTAGGAAGTCATGGAATAGAGGCAGCTTGGGCTGGTGGCAGAAATGGCCGAGAAGTCATGGACAGATTCTTCCCTTTGGTTGCAGATCTACTATCACCAGGAGGATTTTTCTATTTAGTTACCATTAAAGAAAACAATCCAGATGAAATTATGGAAACAATGAAGAAATATGGTTTACAAGGCAAAATTGTACTTTCCAGACAAGCAGGACAAGAAATTCTTTCAGTCCTAAAATTCACCAAGTTCTAATATACGTAATGTGAAATGTTCAGTCACTAGTATACTTTTAAAGCCAAAGCTATTCCAAGAGCCAGGTAAAAATGTGAATTGTAATTTTTTAAGTGTTGAGAACAATTTAGGCAAACTAAGTTAAAAATCAGTGCTTTTCAAAATGTAATCTGTGGCTTTTCAAGAAAAGTCTCTCTGGGCTTTAAGCTAAGTCAGAGTGGTTTATTGAACAGTGTTCATAAACATTAATAAAAATGTTATGTCATAGCAAATGTCACTGTCACTAAGTAATGAGAGAAGGGTTTGACCTATATGTTTATTGTTCAGTCATGTTCAGCTCTTTATGTCCCCATGGACCATAGCACGCCAGACCCTTCTATCCATTATCTCCTGAAGTCTGTCCATGCTCTTTCTTTTTTTTGCTTCCATTACAATATCTATCCATCTCATCCTCTGCTATCCCCTTTACCTTTTGCTTTCAGTCTTTCTCAATATCAGCCTTTCTTCCAATGAGTCCTGTCTTCTCATTATGTAGCCAAGGTATTTCAGCTTCAGCTTCAGTATTTGACCTTCCAATGAGTAGTCTGAATTAATTTCTTTAAGTACTGACTGATTTGATCTCCTTGCTGTCCAAGGGACTCTCAGAAGTCTTCTCCAGCAGAATTTGAAAGTGTCGATTCTGCAGTGCTTAGCTTTACATATAGTACACTCTCACAGCCATATATTGCTAGTGGAAAACCTGTAGCTTTGATTATATGGACCTCTGTCAGCAAGGTCATGTTTCTTTTTTTTAGTATGCCATCCATGCTTGCCATAGCTTTCCTTCCCAGGAGCAAATCTCTTTTAATTTAATAGCTGCAATGATCTTTGAACCCAAGAATATAATCTGACATTTTCCATTTCTTCTCCTCCTATTTGCCAGGAGGTGATGAGACCAATTGCCAAGATCTTCATAGTTTGGGTTTGGTTTTTTGATGTTTTTAAGCTTCAAGCCAGTTTTTACATTCTCTTCTGTTTTCACCCTCATCAAGAGGCCTCCTTATTCCTCTTCACTTTCTGCCATCAGAGTGATATCATCTGCATGTCGAGATTGTTGGTATGTCTCCCAGAAACTTTACTCCTGGCTTTTGATTCATCCAGCCTGGCATTTCATATGCTATTCTCTGCATACGTTAAATAAATAAGATGACAATATATAGCTTTGTCATACTCATTTTCCTTTCTTAAGCCAATCAGTTGTTCCATGTTCAGTTCTAACTGTTGCTTCTTGGCCCACATTCAAGTTCCTCAGGAAACAAGGAAGGTGATCTGATGCTTCCGTCTCTTTGAAGACTTGTCCCATTTTGTTGTGATCCACACAGTGACAGACTTTAGTGTAGTCGGTGAAGCAGAAATAGATGCTTTTCTGGAACTCCCTTGCTTTCTCCATAATACAGCAAGTGTTGGTAATTTGGTCCCTGGTTCCCTGCCTCTCTGAAAACCAGCCTGCTCTTTCAGTAATTGTCAGTTTACATATTGTTGAAGCCCAGCTTGAAGAATCTTAACTTGTAACATTGCTGAAGGGTGAAATGAGCACAGTTGTTCAGTTGCTGGAACATTCTTTGATCTCGTTCTTCAGGATTTGTATGTGAACTGATCTTTTCCAATCCAGTGGCCACTATTGAGTTTTCCAAATTTGCTGCCATATTGAGTACAGCACTTTTAACATCATAATTAGGATTTTAAATAGCTCAGATAGAATTTCCTCCCCTCCACGAGCCTTCTTGTTAGTAATGCTTCCTAAGGCCCACTTGACTTTATTCTCCAGGATGTGTGACTCTAGATCAGCAACCACACCATTGTAGTTATTGGTGATATTAAGATCTTTCATATATAGTTCTTCTGAATGTTCTTGCCAGATCTTCTCAAGTCCCTACCATTTTTTGTTTTTTATCATGCCTATTTTTGAAGGAAACATTCCTTTGATATCTCTAATTTTCTTGAAGAGATCTCTTTGTCATTCTAGTGTATTCTTCTGTTTCTTTACATTGCTCATTTAAAAAAAAAACCTTTCAGGGCAGCTAGGTGGCGCAGTGAGCAGAGCACCAGCCCTGGAATCAGGAGGACCTGAATTCAAATGCAGCCTCAGACACTTGACACATGTACTAGGTGTGTGACCTTAGGCAAGTCATTTAACCCCAATTGCCCTGCCCCCCCCAAAACACCTTTCTCCCTGTTATCCTCTGGAATAATGCATTCAGTTGGATATATCTTTACCTTTCTCCTTTATACCTTTCACTTTCCCTCTTTCCTCAGCTATTTGTAAAGTCTCATCAGACATTTTGCTTTCTTGTTCTTTTTCTTTGGATTATTTTTTATTGCTCCTTCCTGTACAGTATTGCAAACCTCTATCCATAGTTCTTCAGGTACTCTATTCACCAGATCTAATCCTTTAAATTTATTCATCACTTGTATTTCATATTCATAAGGGATGTTATTTAGGGCATATACCTATACAGTCTGATGGTTTTCCCTACTTTCTTTAATTTACATGGGAATTTTTCAGTAAGAAGCTCATGATCTGAGCCACAGTCAGCTCTGGCTCATTTTAACTAACTGGATGGGACTTCTCCACCTTTGGCTGCAAAAAGTATGTAACCAGTCTGATTTTGATATTGACCATCTTATCTTGTGATGTCCATGTGCAGAATCACTTTGTGAGTTGTTGGGAGTTTTTGCTATGACCAGTGAGTTATTTTGACAACTCTATTAGTCTCTACCTTGCTTCATTTTGTACTCCAAGGCCAAACTTACCTGTTATACCAGTTATCTTTTGATTTCCTGCTTTAGCATTCCAGTCCCCTGTGATGAATGTGATATGGTTTTTTGGTGTTACTTCTAGATGTTGTAGTTCTTCATAGAACTGATAACTTTGGCCTCTTCAACATTAGTGGTTGGAGCATAGACTTCTATTGCTGTTCAGTCACACATACAAATGTACTTTCATTAGAAAAATAATTTTTAAATCTCAGCAGAAAATATTTTCTCTCTCCTGAAAGAAATCACTTCCTTTTAGAATTTTATTGTGGGTTTTCCTACATGGTTCTTTTAAGGGATGAGTGATAGGGTAGGGATAGGGATAGGGTCTAGACCTTTGATTTCAATGTAATAGAGAACTCCAGAATGAGGAAATTCTGTGAATGCAGGGTAGCACCATCTTCTTAAGTTTAGAAATCTTAAGAGAGTTGCCTAGAGCATTGAAAGGTTAAGTGATTTTTCCAGGATCACAGAGCCAGTATATCCAGCTGGATTTGAATCCAGTTCACTGTACTACACTGGCTCTCATTTGATCAATATGAATTATAAAAAAATGTTTTGTGAATGCCAAATCATGATTTCAGAGGACCAAAAAGAAAGCACATTACCACCCATATCCTGCCAGAAAGGTGATGGACTTAAAAGGGGTTTTTTGTTGTTGGTTTTTTATTATTTTTATCATTAGCAATTTGTTGGGGACTGGGGGGTGGTAGCTAATTGGAAAAAATACTAAAATTTAGTTTTAAAAAATATTTTGCAACAAGCATGTATACTTTCTAAAATGGGCAGCATAAGATTGATGGCATTTCATGCCACCGATATGACAAAAGGGGACCTAATATCCACATATCGTATTGAAAGTAATTTGTTCCCACACCAAGAACATTTGGGTTTTAGTTCTTTGGACTTTGGTTAATAGACTTTTAGTATCATGAGATTTAAATGTTCTTGTATTTATTGTTGAAACTTTTGGGTTATTTGTATAAACCCTTTAACACAATTATACAAATGTTATTCTTGACCAGAAAAATACTTTTTGTCTTTACAGAATGAGAGGATACACTATCAAATGTTGGTCTAAAAATAAAACTGCTATATTGCTATTAAAGCCTTGAAAAGTAGGTATTCCATTCATTACATAAATGAACTGTGAAAAGTGAATCCCAGAAAGTTATTTTAAAAATTCCTTTGACTTCTGAGGTCAAACACAAAATTAGTAAAGATTCTGGGAGAATTCTTCCCCTAAATATAATTTTCAAACTACTATAAAGTTGTGGTTGTAAAAGTGCTATATGTTATATATGGTTTATTACCAGTGTATGACATTTTTGATCTTGAACTTAAGTAACTATGACAAGGTGAGACTGATTTATGCCATTGTACAAAGTAGTACTTCACTAACACCTGAAGACTGCTTATGCACTTTGATTTTTTTTTTAAGTTTTAGCTAATTTATGCTGCTATAAGTTGACAAAATTATTAGGCTCTTAAATTTTATTTTTCCTACCTTGATCCCAGTTTTTGGTAGGTAAGAGAAAACTTGACAATAAAATTGGAGGTCACATTGTA
>XM_015642795.3 PREDICTED: Parus major Rho GTPase activating protein 17 (ARHGAP17), transcript variant X8, mRNA 
CGGGGGCGGCCGGGGCACAGCGGCGGGGCCCGGGCAGGCCGGGGCAGCGGCCGCCGCCATGAAGAAGCAGTTCAACCGCATGAAGCAGCTGGCCAACCAGACCGTGGGCAGGGCTGAGAGAACAGAGGTACTCAGTGAAGACCTGTTGCAGATCGAGAGGCGCCTGGACACGGTGAGGTCCGTGTGCCACCTGGCCCAGAAGAGACTGATCTCCTGTCTGCAGGGCCAGCATGGCACAGACCCTGACAAGAGACACAAAAAACTTCCTCTAACAGCTCTGGCTCAAAACATGCAGGAAGGATCCATCCAGCTGAGTGATGAAACTCTGCTGGGGAAAATGCTGGATACCTGTGGGGATGCAGAGAGTAAACTGGCAATGGAGCTCTCCCAGCATGAAGTACAGATTGAGAGAGAAGTTATAGACCCACTGTGCCTGCTGACAGAGACAGAGATCCCAAATATCCAGAAGCAGAGGAAGCAGCTTGCAAAGCTAGTGCTGGACTGGGATTCTGCAAGGGGAAGATACAACCAAGCCCACAAGACTTCAGGAACAAATTTCCAAGTGCACCCTTCAAAAATAGAATCTCTTAAGGAGGAGATGGATGAAGCTGGAAATAAAGTAGAGCAGTGCAAGGATCAGCTGGCTGCAGACATGTACAGCTTTGTGTCCAAGGAGGGGGAGTACGCCCGCTGCTTTGTCACGTTATTAGAAGCACAAGCAGATTACCATAGAAAAGCATTAGCAGTCATAGAAAAGGTCCTACCCGAAATTCAAGCCCATCAAGACAAATGGACTGAAAAACCAGCTTTTGGAACTGCCCTGGAAGAGCATCTGAAGCGCAGCGGGCGGGAAATCGCAGTTCCTATCGAAGCCTGTGTCATGATGCTCCTGGAAACGGGGATGAGAGAGGAGGGCTTGTTCAGAATTGCTGCTGGAGCCTCCAAGTTAAAAAAGCTGAAAGCTGCCCTGGACTGTTCCACCTCCCAGCTGGATGAGTTTTACTCAGATCCCCACGCTGTCGCAGGTGCCTTGAAATCCTATTTGCGGGAGCTGCCAGAGCCTCTCATGACCTACAGCCTGTATGAGGAGTGGACACAAGCTGCAAATATTCAGGACCAGGATAAGAAGCTGCAAGAGTTATGGAGGATTTGTAACAGATTACCTGAGCATTACCGTGTTAACTTCAGGTATTTAATCAAATTTTTAGCCAAGCTTGCCCAGAACAGTGACGTTAACAAAATGACACCGAGCAACATCGCCATAGTCTTGGGCCCCAACCTGTTGTGGGCAAAGAATGAAGGATCCCTGGCTGAAATGGCAGCAGCCACTTCAGTGCACGTGGTAGCAGTTATTGAGCCCATTATTCAGCATGCAGACTGGTTCTTCCCTGGAGATGAAGATTTCAACGTGTCTGGGGCGTTTGTGGCAGTTCCTGCTGTTAATTCCAATCACTTGTCACACACTGGGAATGACTATGAATGTGGGACCCTGGAGAGGAAGAGGCCTCTGAGCATGACTGTGATGGAAGGGGATTTGCTGAAGAAGGAGAGTACCTCAAAATCCAAGGACAGCACATCTTCAGCCACTCCTCCACCGGTGAGGAACGGCAGCCAGGCAGGCCCTGCCCCGGGCCAGGCAGTGCCCAGCACGTCCCAGCTCTCTGTCACCCAGCCCCAGAACGCTGCTGGTCCCAGTCCCCACGCCCTGAGGAGAGCTGTCAAGAAGCCAGCACCAGCCCCCCCCAAACCAGCCAACCCCCCTCCGGGGCAGCCAGGAAGCCAAAGCTCTTCCCCAGCTGCTCAGCCACCTTCTGTCTCTCCCAAACCACCAGCCAGAAGCTCCTCTCCTCCTGCTCAACACGCAAACCAAGGAGCAGCCCAGACCTCCTCCCCTTGCCAGGTTTCTGCACCTCGGAGATACTCCAGCAGCGTGTCCCCAATCCAAGCCCCCAGCCACCCACCCCCGCAGCCCCCAGCACAGGCAACTCCTCCCCTGCAGCCCAAGGGCAGCAGCCAGGGCTCTGTGGAGCAGGGGGCAGAGCAGAGCCCCTCGCTGTCCCAGCCGCAGACCCCCACTCCCCCGGGCAGCCCCCCGGCCGTGCCCCCCGAGCCCTGCCAGGCTCCCTGCGGACCTCAGAGCGGCTCCCTGCCCCGGCCACGGCCCGTGCCCAAGCCCAGGAACAGACCCAGTGTCCCCCCTCCTCCTCACCCTCCCTCGCAGCTGCCTGCAGACGGGACGGCTGCAAACCCTGCTCAAACGGCGTCCAAAATAGTCACAGACTCTAATTCCAGTATTCCAGAGCCACCTCCAAACCCTCCTCCAGAGCTTCCTGCAGAGCCGGCGGGCAGAGAGCTGCACAACCACGTCCTGCTGGCCATCGACAATGACACGGAGAGCACGGCGCTGTGAGCGCTCCCTCCCCGCGCTCCTCTCCTCAGACCTCACAGGGAAAAGCTTCTTCTGGCAACGTGGCACAACGGTGTGGAGCTGGGGCTGCAGCCTGCTGGGCACAGGGATCTCCAGGATGGCCGAGGTTGGAGAAGACCTCGCAGAAAATCCAGCCCAGCCTTTGGCCCAGCTCCGGTTTCGCCCTCAGAAGAAGTTTAATGATCTGGGTCTGGACAACGGTTTTCAAACTCTTGGATGGAAGGAATGAATTCCTGCAGGAACTCGCCTAGGAAGCGTGGTCAGTGCTGATACAGGTGGTATTAGCAGAGATTCCAGAAGAATAAGAAGCAGAACATTAGTTATTTAAAGTGCATGTCTGTATTAGGGGAATAATCCTTCCCATGGCACGGTTAGAGGTTATTTGTAGTTCTTAGCCCGTACCAGGAGCTGCCTCCCAAGGGCCATTCCCTCTCGGATTTGCTGCAGATTCCCCCCAAGCCATGAAGCAAACCCTGCCCCAGTGCTGGTGGTGACTGCTGGTTCTCAGTCACCCTGTGGAACTGTGGATGCATCCCGTGCCTTGAAGGACTGTCGTGCTGTAGGAGGATCTTCCTGTCTCTTTAATCATTTCATTGCTACTTAGGATCAGTACTTACCCTGATTTCATAGTTATTTGTATTAACCTGCTTTGTTCATGTGCAACTGGCAACTGTTTCACGAGGAAACCGTGGAAATGGGGTTTGTGCTTTTGTTGAAAACGGTTGAATTTTGAAAGAACTTTGAAACAGCTGTTAGGATTCAGCAGTTGAGTGAACATTTATAAAATTAAAGATTGGTTTTTGTCAACTTAA
>XM_039807938.1 PREDICTED: Perca fluviatilis tubulin, gamma complex associated protein 6 (tubgcp6), mRNA 
TTTTGTCGAAGCCCCGCGGTAGATTGTGAATCAAGCGACTAGAGAGCAATTAGCTAGCTAGCGACAACATCTAATATGCTGGAACAAGAAACCTTTCAATAATAAAAATACATTTTGAAGCAGTGTAGGGGACCCATCTACTGGGTTTCACATGCTTGGTACACACAAGCTAGTTAAGCAGGACAGCTAACGTTAGCGTTAGCTGGCTAGGTGATCCGTGGGGGCTTGCTAATAACAAACGTTAGCATGCACTGGAAGGAACCTTTTGGGGTGGATGCAAGATTGAAACTGTCTGAATCAACGAAAAATACACCATCTCGAAGGCTGAGGTAACAGTGCCACCATGTACTCGAGCCTAAACAACCCAATGAAGTCCAGCTGCAACAGCAGCAGCATCACTGAGCTGCTGGGTGCCCTGTGTGACTGCAGCCTGTCTGGGGTGTCATGGAAACGCCGTGCCCTGGGTGGAGTTTCAAGAGAAGGTTTCCGCAGAGCTCTCAAAAAACGTGCCTACGGTGCCCTGCTGTCTAAGCTATTTCAAGATGACACCAAAGGGTCTGCCTCAGGACTGAGTGCCACAGCCAATACACCGCCCAAAAACAAAGTTTTGATGATATGTTTTGACTTGCGGGTGGCAGGGTGCCGAGAGGAAGCAGAGCGTTTGGAGGAGCAGCTGGGGATGCTGTTGGATGGAGCATCCTCTGGCCTAAAGGAAGTAGACGCTGTCCTTGAGCTCTTGGTACATCTAGCTGGTTCGGCACCTCCACCCCCTACCTCTTTCATTAGGGACTATATGAGACGAGAGAGGCCTGTACTGCGGAGGCCTCAACCCTGGGGCTACCAGAGCGAGGAGCTTCAGAGGCTAGAGGCCCGGGCATGGAGTCTAGTGTGTGGGGAGGAATGGGGGACTTTAGAGAGTTTGTGTGGAACTCAGAAGTTGATGGATGCTCCTCCAGGCACAGGACTGCTGGCTCTGAGAACTAAATTAGAAGTGGAAGAAAGATTTGAGAGGGAGACCAGGATGACACTGTTTGGAGCACTGCAGCACACTCGCACCTCAGACATAGACATAAGACTGGACCTGCCTCCTGTTCCCAGTAATATTGATGTAACTGGGCTGGCTATACGGGTCCCCCCATGTATAGATCAGTCTGAGGATGAAGGTTTCCAGTCAGCTTCCAACATGACCCCAGACTCTCAGTCAGAGACCAGCCCCATACCAGACGTTGATATATGGGAGGCTCTTCGCACATTTGAGCCTGGAAGACGTCGCTGCTGGGAGTCTGTTGGCTGCCCACCAGGGAAAAGCGAGTCACTCTATCTAACAGAGGGAGGCAGGGAGGCCTTTGACCAGCTCTATCGTCTGTGGGAGGGGGAGATGAGGGTGGTCAGCACTGCTACACCTTCTCCTCTCCTCCCGCTGCCCCTGGACTCTCAGGCACTACTGGTATTTGACCTCCTCAACGTCTTGATCGGGGTGGCATCCACGACCTTCCCTCTCAACCAGAGTGTTCAGTTTGATGTCAGACCTGGTGTGTGCGTGTCCGGAGCCTCTCCAGAGAGTGTGTCTCGTCTCTTGGGGGAGCTGGCCCAGTACGGCACCCACTACTTGAGGCTTAGTCGCTTTTCTCTGCCGAGTGCTGGAAAAAAAGGCCTAGTCTTTCAGGCTTTTACAGGTGGTCTGCGGAAGTATCTGCATTACTACAGGGCTTGCGTTCTCAGCACTCCACCCACCCTCAGCCTGTTGACTATTGGCTTCCTCTTCCGCAAAGTGGGCCGCCAACTAAGGTACCTGTCAGAACTGTGCTGCGTAGATGGGCCTTTGGGTGCAGGCCAGGCTACCTTCCCTGTGGGTGTTAAACTGCTGTCCTACCTGTACAATGAAGCACAGAATAACTGCAGCAACGAGAACTGCGCGGTCCTCCTGTCGCTGCTGAAGAGCAGCTGTGAACCTTATACACGGTTTGTGTCTGACTGGGTGTATAGCGGCGTGTTTCGGGATGTTTATGGAGAATTCATGATCCAGGTTAATGAGGACTATCTCGTCTTCAGAGACAAACACTTCTGGGTCCAAGGCTACACTCTGATCTCAAAGGATGTGGAGGATTGTGTGCCCATCTTCCTGAGAGACATTGCCAACGACGTGTATGTCTGTGGAAAGACCATCAACCTCCTTAAGATCTGCTGCCCGCAGCACTACATCTGCTGGTCGGAGCTGCCGGTGCCTCGCATTGCTGTCACCTTCTCCCTCCGGGAGGTGGAGGACATCGAGAGGGACTGTGCTGTGTACCGCGGACGCATGGAGCGGGTTGCTAAGCACAGCGCCATCAGCAGGGAGGAGCAAGCCCAGCGAGCAGAGCAGGCACGCCAGGAGCTGATCAATCAGGTCAGAGAGTCAGCGGCCAAAACCCTGGAGAGCATCCGCGGGCGCCAGGTGTCACAACGTCTGGCTGAGGAGGCCAAGAAGAAGGAGCGTTTTGAGGAGCTGAAACAGCACCTGGAGCAGGAGCAAGAGTGGCGAAGCGTAGCCACAAAGAAGCAGGAGGAGGATGACTTCAGCTTTGCCAGAGAGCTGAGGGACAGAGAAAAAAGACTACAAGCCCTCGAGGAGCAACTGGAGCAGAGAGCCAGGAAGGAGCTGATAGCTCAGTACAGCCGTCTGTCAGAGGATGCAGCTCGCAGAGAGAGACGGGCCATGTGGCGGGTGCAGCGAATGAGACTTGATGAACCCCGGGCTCAGTTCTTCATGCATGACAGGCAGCAGACTCAGGCAATGCTAGAGAAATATCCTTTAGGCCAGAAGAGACCTCCCATCAAAGTGTTTCCACCTGTTACCTCAGCACAACAGACTGCACTACAACCAACACTGGAATCTCCCACTCAGCATCTGTCTGAGCAGCAGCCAGCGGAGACTCAAGAATCTGATGGTGTATCACCTGACCCATCTTCACCTACCCTCACCCACCTTACAGTTAACCTCGCACTCATCTCTGAGAACGTTGACGTCAATGATTTTCTTCCTAAGTCACCAAATCCTAACAGTCAGCAGGTAGACATCGCCCTACAGGAGATTGGCTCTGACCTACCTGAAGTGTGTCCTACAGCACAGCTAGTAGACTATGACTTCAGTGCCCCCTTTAGTCCACTTGAAGGTATCACAGGTCAAGCCTCAGTCCAGCCCCAACCTCGCTGGGGACCTGCAATCCAGCCTGACTTGATCCAAAACCATCCCTCTTTTTCTCACATCCTCATAGGAGAGAACATGTCTCAAGTCCAGGATTGTCTCCCCAAAGCTAGCCCCTTTGGCCAACCCTCCAAATCCAGCTTTACGCTAGGCCAGTACACCCCAGAGGAGCTTCAGAATACATCTAAAGCAAGCATTTATGGACATCCCTCTCAAGCCTCAGTGCAGTTAGTAGATGGGAGTGGCTCTATGACTGACAACAAGCAGGCGGAAATTGCATCTGTGATCATTGAAATGGGGAATTTAGAAAGTAAAGAGGCAAATAAAGACAATGATGTGCTTGATGCAGCTTTGTCCACCACACCAGAAGAAAGTGGCAAGGGTAATTGTCGTTACAAAGCAGTGACAAGTCTTTCTGACTGTGGTGGGATTGAGCCACCTGATGCAAATCCTAACCCAAGCACTCAAGACCGCAGCTCAGATGCTCAAGATAAAGCTGGTGATAATAATTATTTGCCAAATGTTCATCTCCCCAGTGCTCGCCTTAAAGCTGGAGAGCTGGTTTTAGATGTCGTTGCCCAGCATTCTTTACCTAGAGTCCATGGGCATTCCTCTGATGCTCGCGTAAAGGTTGGACAACTTGTATCAGAGGTAACTGCTCCTCTTCCATCCCCTAACGTCCACGGTTATGCCTCAGATTCCCATATCAAAATTGGAGAACATATTTTGGAAGTTGATGCTTCTCTACCTTCCTCCAGTCTTCACAGTCAATCTTCTGATGCTCACATTAAAGTTGGGGAAAATGTTTCAGATATAGTTGCCCCTCTGCCCTTTCCAAACGTTCATGGTCACAGTTCAGATGCCCACATTAAAGTTGGAGAAAATATCTCAGATGTTGTCGTGCCACTTCCTGCTCCCAACATCCACGGTCACTCCTCTGATGCTAATATAAAAGTGGGCGAGTTTCTGTCTAACATACCTGAAGCAAGGCCTCGTGAGAGTAAACATGGGCATGCCTCAGACTGCATGCTTCAATCAGGCTGTGTGGTGTCTGGAACTGAACCCGCCTTGTCTGTTCTACCTGGAAGCTCTTATGGTCACTCCTCAGACTCAGGGTTAGGTGGTGGATGTGTAGTTTCAGGAGAAGAACCCAAACGTTCTCCTCTACCTGGCAGTGCTTATGGTCATTCTTCAGACTCAGGGTTAGGTGGTGGATGTGTAGTTTCAGGAGATGAACCCAAACGTTGTCCTCTACCTGGCAGTGCTTATGGTCATTCTTCAGACTCAGGATTGGGAGGTGGATGTGTAGTTTCAGGAGACGGACCCAAACGTTGTCCTCTACCTGGCAGTGCCTATGGTCATTCTTCAGACTCAAATTTAGGCGTTGGATGTGTTGTGTCCAAAACTGAACCACTTCCATCACAACTACCCGGCAGCACCTACGGCCACTCCTCTGATTCAACCCTGGGGGTGGGTTGTGTGGTGTTGGGGACAGAGCCACAAGCCTCTGCACTACCAGGCAGCACCTATGGCCACTCATCAGATTCTTCACTCGCAGTTGGGTGTGTGGTGAAGGGCAAAGGCAGCTTAAATCAGCAGAAGACAGACGACAATGAAGATGGCAGAGGTTCTAAGTCGGACAGCCCTGGTGAGCAGCTGGTTGAGTTCATGGGGTCCTGGGCAGCAGGCTTCGGTTTGTCCCCTGGAGAAAAGTCTGAGCAGGAATATCTCTTGGCTTTGTGTGCTCAGTACGAGGTGGAAAAATACGAAGACTGCTACAACCTAATGGCTTCGTCCCCAGAGTGTCAGCTGCTGAAGCAGGTAACTCGGGGACCCTGGGGCCTTCCTATGGACCACACACTCCGCAGAGCCACAGACACCACTGTTGTCCAACTCAGCGAGATGGTTTCTCTGCCAGTTCTGATAAAACAGGCCGTCACTACCCCACTGATCACACATGTGTCATTGGTGAACAAGGCGGTGGTGGACTACTTCTTTGTGGAGTTGGGGGTGGAGAGACACTTTGAGGCACTGCGCCACTTCCTGCTGATGGAGGATGGCGAGTTTGCACAGTCCCTCAGCGATCTGCTCTTTGAAAAGCTGGGCAGTGGCCAGACTCCCGGTGAGCTGCTGACCCCCCTGGTCCTGAACTCCATCCTCAGTAAGGCCCTGCAGTACAGCTTGCATGGGGACACCCCCTTAGCAGGTAACTTTACCTTCGCCCTGCGCTTCCTCCCGGAGACCTTCCACCCACACGCCCCCGATTCTCTCAACTGTCTGGAGCTCCGCTACAAGCATGAGTGGCAGCTTAATCGCATCATCACGTACTGCGCCGAAAACAAGTACAACCGTCTGTTCTCGTTCCTGCTGCAGCTCAAACACATGGTGTGGAGCCTCCGTGAGGTCTGGTTCCACCTCAAGAGAACAGCGCTGGTGAAAGGTGCAGGTCGCTCGGTGCAGTTTCGGCAGCTGCAGCTATACAGACACGAAATGCAGCATTTTGTCAAGGTGATCCAGGGATACATCGCCAACCAGATCCTGCAAGTGTCCTGGAGCGAGTTCACAGCCAAGCTGGCCACTGCCAACGACCTGGACGCCATTCACCGTACACATGCAGACTACCTCAACAGAGCCATCTTCAGGGGTTTGCTGACAGAGAAGGCAGCTCCGGTCATGAACATCATCCACAGCATCTTCAGCCTGATCCTCAAGTTTCGGGCCCAGCTGATCGCACAGCCCTGGGGCAGCCAGCAGGGGGAGGCAGTGCACCCAAGCTTTATTGCCATGCAGCAGTCGTACAACACCTTCAAGTATTACTCTCACTTCCTTTTCAAAGTGGTGACCAAGCTGGTGAACCGAGGCTACCAGCCTCATCTAGAGGATTTCCTTCTTCGCATCAACTTCAACAACTACTACAAAGACTCCTGAGCTGTGTACTGGTGTGTATGTTGTACATGAGCTTAGTGTGAGTACTTGACATAATACAGGCCATTTGTTAGATACTTGCAATGCACTGTTTACATCTTAGAGTCCCCTGTATCTGTCTATAAGACAGATAATCAGAAATATATAATACAATAAATGTTAGTGTCGAAAATACATTAAGAAACCCACCTGTACTTTATATTAGGCCATGAATTTGAAATTTAAATTGTATGCAATTATGCAAAGTTTATGCAATCCATGTGCAGGATTTAATTAATGGCTAAAACTGTATGCTGCCAAAGTTTGTAATTAAGGTGAAGCTGATGCCTACTGTAATGTCTCACGATTACGTGTGCCTCCAGCTATGTAGATTTTAAGTGCATATAAATGAAGTGTCAATTGCATGTAAATACAATTGTTAAATAAATGCGCTATGTTCCTGTGT
>XM_050218304.1 PREDICTED: Anopheles maculipalpis sensory neuron membrane protein 2 (LOC126561926), transcript variant X2, mRNA 
GAGTGTGGGTGAGTGGGTGCAGTGAACGGTGTCACGGTGCTGCCAGGCGACGGCGATCCTCCAAACCACCAAGATGGTGCAATGCACTCTGATCTGGGCCGGCATCGGTGTGATGATGGCCGTATCCGGCGCACTGCTCGGTTGGGTCGTTTTTCCTCGCGCCGTGCACGAGAAAGTGATAGAGGCTACGGAACTACGTCAAGGGACGGATCAATACAAGCGATGGGAAGCATTGCCACAGCCGTTAGATTTTAAAGTGTACATATTCAACGTCACTAATCCGTACGAAGTGATGCAAGGACGACGGCCGAAGGTGGTTGAAGTTGGACCATACGTTTATTTCCAATATCGCCAGAAGGATAATATACGGTTTAGTCGAGATCGGTCCAAGGTGCATTACAGTCAGCAGCAGATGTATGTCTTCGATCCCGAATCGTCCTATCCACTGACGGAAAACGATGATCTTACAGTGTTAAACATGCACATGAATTCCATACTGCAAATAGCCGAGGATGAAACGTACGACAGTTTGCGACTGATCAATGCCGAGCTGAACCGTATCTTTGGCCGACCGGACACAATGTTCCTGCGGACGACACCGAAACAGTTTCTCTTCGACGGTGTACCGTTCTGCGTGAATGTGATCGGCATTGCGAAAGCAATCTGCAAGGAGATCGAGAAGCGTAACACCAAAACCATTCGCACCATGCCGGATGGAAGTTTACGGTTTTCGTTCTTTAGCCACAAAAACATGACAGATGATGGTATGTTTACGATCAACACGGGAATTAAGGATCCGTCGCGGACGCAAATGATTGAACAGTGGAATGGCCGAACAACGCTCGAGGTGTGGAACAATCGGAGCAGTGGATTGCCCTCTGCCTGCAACAAGATCCGGGGTACTGATGGGTCCGGCTATCCACCGTTCCGAACCGGTGTCGAACGAATGACGATCTTCAGCACCGATATCTGCCGCACGGTGGACATTAAGCTAACCGGGGCATCATCGTACGAAGGCATCCCCGCACTGCGGTACGAGATCGACGGTAACTTCCTGCATGAAATAGGACCCGAGTACGGCAACGAGTGTTACTGCGTGAACAAGATCCCGAAGTCGATCGTTAAAAGCAATGGCTGCCTGTACAAGGGCGCACTGGATCTTTCCAACTGTTTCGATGCACCGGTGGTTCTGACGCTTCCTCATATGCTGGGTGTAGCCGAGGAATATACAGCACTGATTGACGGCATGGACCCTGAGCCGGACCGGCACCAGATCTTTGTGGATGTAGAACCGTACACCGGCACACCCTTGACCGGTGGGAAAAGGGTACAGTTCAACATGTTCCTGCGACGGATCGACGCCATCAAGCTGACCGATCGGTTGCAGCCGACCCTCTTCCCGGTCATCTGGATCGACGAAGGTATCGCACTGAACGAGGACATGGTGAAACTGATCGATGACAGCCTAATGAAAGTGCTCAGCCTGCTAGACATTGTGCAGTGGGTACTGATCGGTGTAGGGCTCCTGCTAGCCATCCTGATGCCGATCGTCTTCTTCGTCAAACGCTGTCGTGGCAACGATAGCCGTACGGTTAGTCCTGCCGTAACGGCTACCACGAGTGCGGCCAGCCTATCGATGGCGACGGGCGTTACCGGCGAGCGGAACAAATGACCTTCGCTGACAATGCTAAGTCTGGACTGATGAACTGCTAGCACCAACTAGCGATCAACATTTAGAAGGTGCCAATGAG
>MK538674.1 Uncultured bacterium clone OTU_1300 16S ribosomal RNA gene, partial sequence 
GGGCCCGCACAAGCGGTGGAGCATGTGGTTCAATTCGAAGCAACGCGAAGAACCTTACCAGCCCTTGACATCCCGGTCGCGAGCACCAGAGATGGAGCTCTTCAGTTCGGCTGGACCGGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGCCCTTAGTTGCCATCATTTAGTTGGGCACTCTAAGGGGACTGCCGGTGATAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTACGGGCTGGGCTACACACGTGCTACAATGGCGGTGACAGAGGGATGCAAAGGAGCAATCCTTCGCAAATCTCAAAAAGCCGTCTCAGTTCGGATTGTGCTCTGCAACTCGAGCACATGAAGTTGGAATCGCTAGTAATCGCAGATCAGCACGCTGCGGTGAATACGTTCCCGGGCCTT
>XM_023646352.1 PREDICTED: Equus caballus chromosome 7 C19orf24 homolog (C7H19orf24), transcript variant X1, mRNA 
GCACTCGTCCCTGCCGGGCCCTGGCCGTCTCGGCGGAGTGACCGGGCAGCCTCATCGGTGTTGCGGGGCCGAGCCTGCTTCCCGGGCGGGCTGGTGGCCTCCTCGCTGGTCTTGGGGTGCAGCTGTCTTGGGGCCGAGCGGGTCCCCTCAACTCCCCCGGGGTGGGGGCGGCGCAGCGGGCGCAGGGCCCTGTCGGTGTGGTCAGCGCGGTCAGGACGGCGAGGGCCCCGCGTCTGCCGGCGGTCCGGTCTGCTGGTCCTGGCTCTGCGGGCGCCGATGCCGTGGCCTCGTGGACGGCGCGGGCCACGGCACGGCCGCCCTGCTGGCCCACCGGCCCCCGGGCTGCACGGGCTGCGGGAGGGCCCACCGGCCGAGAACAGCGAGTCGGGGCCCGGACCGGAGGGAGCCCAGGCTCGGCCCCAGCCGTCCTGCGTGGCGTGGCCTCGTCCGTGCGGGTCCTTGGGCGGCGACCCTGTGGCGCGCCCAGCTGCCGTGACCCGGTCTGGCCCAGGGCAACTGAGGCCTGGCGCGGCGGGCCCGCGGGGCCGGGGCGCGGGGAGACGCCCCGGGAGCGGCCGGGGGCGGGCGTTTCCGGAGTCGGGCCCCGCCCCCGCGGGCCATTGGCTGGCGCCGGTGAGTGACAGCGCGGCGAGGGCGGGGCAGCCTCCGCTTCCGGCGGGCCATGGGGCCGCGCGTGCTGCCGCCGCCGCTGCTGCTGCTGTTGCTGCCGGCGATTCTGCTGCCGGCGTTGCTGTGCGGGGCCCAGGGGACCACGCCCAGGTCGTCGCACCCCGCGTACGCCACGCTCTTGCCGTCGCCCGCCGTGACGAACGGGAGCCAGCCGGGCGCGCCGCACAACGGCACGCACCCGCGCTCGCCGGCCGCGCCGGGCTCGCCGCTGCTGCGCTCCTTCTACGTGCTCACGGGCCTCAGCGGCCTGGTCGCGCTCTACTTCCTCATCCGGGCGTTCAGGTTGAAGAAGCCGCAGCGGCGGAGGTATGGCCTGCTGGCCAACACCGAGGAGTCCGCGGAGATGGCCTCGCTGGACAGCGACGAGGAGACGGTGTTTGAAAGCAGGAATCTGACATGGTGGCGTTTCCAGCGGCCCTGGGGGAAGGACAAGACGCGGGGTCACCCCCAGTGCCTGGCGCAGTCGCTGATTCTTTTGTTGGCCTGGCTGCACCGCGACAGCTCGTGTGGGACCTGCCCAGCCTCCCTGAAGACGCTTCAGCCCCCGCCTGCACAGGACCACCCGAGATGGCCGGTAGAAGCCAGAGAGGCTCTGGCAGCCCCTCCCAGGACTCAGGCCGCCTGGCCGGACTGTGGCTTGTGCTGCTTGCTCTTTGCTGTGGGGACGTGGCTGGCCTGAGCCGAGGCCTGGGGGGCAGGGGGGCTGAAGGCCTGTCTGGGAGCACCTTCCCCCTGGGCTGGGGACAATAAAGGAGTGGTGGCTCTGTC
>XM_035641279.2 PREDICTED: Scophthalmus maximus zinc-binding protein A33-like (LOC118314697), mRNA 
TGGAGCTGGAATATTTTTCCTATAACCTCACTTTACAGGAACACTTCAACCTCACCATGGCAGCAATGAATTCGCCCCGGGAGGAGGACTTACTTTGTCCCCAGTGCTGCGAGATCTACCGACTCCCTGTTCTTTTGAAATGTGGCCACAATGTTTGCAGAGTTTGTTTACAGAAATTCTGGGAATTGAAAGGATGTCGAGAATGCCCAGTGTGTCGCACTGTGGCTGAGCCCGGGAGGCCTCCTATCAATCTGCCACTAAAGATAGCTGCAGATGAATATCAACTGCGACGGAGCAGCAGGAATCGAGACCTTTGTTTTCTTCACGGTGAGAAGCTGACACTTTTTTGTCAGAACGACGAAGAGCCCGTCTGTGTCGTCTGCCACACATCCAAACAGCATAAGGTGCACGAGTGCTGCCCAGTAGAGGAGGCTGCCCAACAGAAGAAGACAGAGATTTCAACCATGCTGGAGTCCCTGAGGAAAAAGCTCAGAACCCTGAACAAGACCGAGGAGCACTGGAAGGAAACAAAAACCTATTTACAGACCCAAGCTCGTCAAAATGAAGAAGGGATAAAGGAGGAGTTTCGGAAGCTGCACCTGTTCCTCCAGGAGGAGGAGAACGCGAGACTAGAGGTTCTCAAACAGGAAGAGGAAATCAAGACCCAGGTGATGTGTGAGAAGCTGGACAACATCCAGGAGCAGATCACAACCCTCTCCTCCACCGTCAGTGATACGGTGGCCACGCTCACAGCGAAGGATTTGACCTTTTTACAGGACTACAAGAAGACAAAGAAAAGGGTCAAATGCAACGTTCGAGAACCGGAGTGCATCAGAGACATCCTGATAAACCCTGCAAAGCATCTGGGATCGCTTAAGTTTGGAATTTGGAAGAGTATGGCCAAAATGGTCAAATATGTCCCCATCACTCTGGATCCAAACACAGCCCACTCCAACCTGGAGTTCTCTGAAGAGCTGACCTGCGTGCAGTACAGCAGGAAGCAGCTCCTGCCCGACAACCCCGAGCGCTGCACCAGCCGTCTGTGTGCGCTGGGAGCGACCGGCTTCACATCTGGAAAGCACAGCTGGACAGTACACGTGGGCCAAAGCAGAGACTGGTACATCGGAGCGGTCCGAGAGTCTATCAAGAGGAAGAGCGCCGTCTTCCTCAACCCTGCCGAGGGCTTCTGGGTGATCGGCCTGTGCGGCGGAGACTCGTTCTGGGCTCAGACGTCGCCTCGCACCAAGCTGGTGTTGAAGCAGAAGCCCGAGAGGATCACTGTGGAGCTGGACTGTGACAAGGGAAAGGTGGTGTTCACCAACGCTCAGGATTCGACGACAATACACACATTCAGAGACAGATTCACAGAGAGGATCTTCCCCTACGTCTCCACCGGATTGTACGGGGAGGGGAAACTCTCCAGCCCATTGACGATCTGCCCTCTGACCGTAACACTGGAAGTAAAATAGACTCACACAGCAGATGAAGAGACACCGTTTTAAATTAGATGTGCGCGTTTTAACTTTTGACTGACATAAAAAATAATGATAAAGCCATGATTCACACATGAAATTCAGCAGCCAACTGAACGATACCATACTTTATTGTATGACTTATGTACAATTTATTAAACAAGACTATAAACACTTTCAA
>XM_041090641.1 PREDICTED: Gossypium hirsutum uncharacterized protein At4g17910-like (LOC107939771), transcript variant X6, mRNA 
ATAAAAAAAAAGAGTAAAGCCCATCAAAATCCCTAAAAGCTCGTTCCCATGTCTTGCCACAACAATGGTAAAGCCTAACCCATTTATAATCGTCGAGTCCACCAGGTTTTCGGCTTTTGACCCATCCAAGGTGAAAAATATTGTTTGGCTAAAAGCTCTGATCTCCTGTAATAAATTCACAACTGCGTTTTCAAACTCTTCGTCAATGGATTCCTTCCCAAGATCTTTGAATCCCAACAAGCACCTCAGAGAACAATTCGTGAGCAATTTGCCTGGATCTTCCATGCTTGAAGTCTCTGCGCTTTTGAATAATGTAGCTCTTCTAATGCTTTTGCGGCACACTTTCTGCTCTCAAACAGTGAATGATGCTTGTAGGAGTTTAAAGTCTTACCTAGCCTCAGTAGCTTTGGATTATGTCTTCCTTGTTCTACCCACACTTTTAATTTTCACTGTTCTAGCAGAGTGGGTATACATATGCTTGATTGGGTTATTGTTATTGCTGGTCTTCTTTACTGCAGTCAAAAGAACTTACTCTTTGCCTTACATGGAAGGACCTAATGCTTCAAGGGCAAGCATATCATCTTATAGGGTTGTTACGATGTTTATCACATGCTTGTGTATCTTGGCTGTTGACTTCAGAATATATCCTAGAGAATATGCTAAGACAGAGACTTACGGGGCTAGCTTGATGGACCTTGGAGTTGGCTCCTTTGTGCTAATGAATGCTGTTACTTCACGGCAAGCACGAAACATCAAATCATCAATGAGTTGGTGGAAGGCAGCCTTTAAATCTACAACTCCGCTACTACTGTTAGGATTTGCTAGACTTGCTTCTACATTGAGTCTAGACTATCAGGTACATGTGGGGGAATATGGAGTCAACTGGAATTTCTTTTTCACACTTGCTGGTGTATCTATCCTTACATCCATTTTAAATGTTCCCGCAGAATATTCTGGAATTCTTGGTTCAGTAATTTTAGTTGGGTACCAAAGTTGGTTGACTAATGGGCTAAATGTTTATCTTCTTTCTAATGAAAGGGGTACGGATGTCATAAGCAGAAACAAGGAGGGAATTTTTAGCTTATTTGGATACTGGGGTATGTATCTTGTTGGTGTTCAGGTCAGCTACTATCTCTTCTTTGAAAATCATACTACCAAGCAGAGAAGCAAGCATGAAACACGAATCAGAATCTGCCTTCTTACTATTATGTTTTGTGCAACCTGGCTTATGTTACTTGGGTGGTGGCTCAAAATCTACAGGTATCTGAAGATTGACTATCAACCATGACACTGCTAGGAATTTTTGGGTTCGAATTACCATGTTTGTTCTCTATTAGCCTCTCAAGAAAAGTTCACTCAGAAACTTTGTTATACAAATTGAACCCTTGCCTGTGTACCTTGTTTGGTTGTCTTTGGTTATTTTGCTTGTATTTGGATATTAAGAGACGGAGCAACATAGGTTTTTGGTATACTTGATGAACATAGATGCAATTACTTACACAAGATAATCGAAATGCTTGTTGGTGTTTCAA
>XM_015948335.1 PREDICTED: Nothobranchius furzeri homeobox containing 1 (hmbox1), transcript variant X1, mRNA 
TGTAGATCCATCGGCTCCCTGTCGCTCTCGTTGCTGGGATTTGTAGTCTTTGTGTCGAAGAGCGCCGCCGCGTGTCGGGGGCTTCGGTGGGAGTGAAACTACAGTTCCCTCTGAGCTGCTCGGAGGTGTTAGTTGTCAGTATGGCTGTTGTCAGACAGACAAAGCAGAGAGGCAAATAATTCGCCTCTGATTAGAAATCCTTGGAAGAGGGTCGCGCGGGGCACCGCCATCAGATTCGCGTCGTTGCTCGGCTGCGGCAGACCGCGCAGCTGCTCTCCGCTCTAGTTTTAAAGTTAGATGGTTACGTGGACGTCTGGAGCCGAGCAGGATGTCTGACTTCAGCGAGGAGCCGCGCTTCACCATCGAGCAGATTGATCTGCTGCAGCGGCTGCGGCGCACCGGCATGACCAAGCAGGAGATCCTGCATGCGCTCGACACTCTGGACCGGCTGGACCGGGAGCACGGCGACAAGTTTGGCCGCCGCACCTCTTCTTCCTCCTCCTCCTCCTCCTACCTAGTAGGCGGGGCAAACAGCTGCACCAACAACTCTGCCTCCAACACAACCGCCACGTTCAACAATAACACCGCTGCCTCGGCAACCACCACCTCTTCTGCATCGTGTAACGGTAGCAACAGCGGCGAAGGCGGCACCGCGGATCAGTCCGTTGCCGCCGCCGCCTCTTCCACGGCCTCTAAAATCTCTACAGCCACGCAAACTCAGTTTAGTACTGGAGGGGGACTTTCTCCGTCTCCCAGCTATGACACCTCCCCCCCTCCAGGGCCGCCGCCGCCCTCCGCCATCCTGCCGTCACCGGTGTCTCTGGTGGCGCTGTCTCAGAACGGCCGTGACAGCCTGGCTGCCACGCCCAACGGGAAGCTGTCCCCTCCTCGGTATCCGGTGAACAGCGCCGCAGCGTCCCGAGCGTTCGGGTTTGAAGCTGCAGAAGAAGACCTGGACATCGACGATAAGGTGGAGGAGCTGATGAGAAGGGACAGCAGTCTGGTGAAAGAAGAGATCAAAGCTTTCTTGGGGAACAGGAGGATTTCTCAGGCTGTGGTGGCACAAGTGACTGGCATCAGTCAGAGCAGGATCTCCCACTGGCTGCTGCAGCACGGCTCCGACCTGAGCGAGCAGAAGAAGAGAGCCTTCTACCGCTGGTACATCCTGGAGAAAACCACCCCAGGTGCGACTCTGAACATGCGTCCGGCTCCGCTGCCTCTGGAGGAGATGGAGTGGAGGCAAACCCCGCCGCCCCTCAGCACGGCTCCCGGAACCTTCCGGCTGCGGCGCGGGAGCCGCTTCACGTGGAGGAAGGAGTGTCTGGCTGTGATGGAGAGCTACTTTAATGACAACCAGTACCCAGATGAGGCCAAAAGGGAGGAGATAGCAAACGCCTGCAACGCCGTTATCCAGAAACCAGGGAAGAAGCTGTCGGACCTGGAGCGGGTCACCTCTCTGAAGGTCTACAACTGGTTTGCTAACCGGCGCAAAGAGATCAAGAGACGGGCCAACATTGAAGCCACAATCCTGGAAAGTCATGGGATTGACGTCCAGAGTCCGGGGGCACACTCCAACAGCGATGACATCGACGGGAACGACTTCTCAGAGCAGGCCTGTGACCTGCCGTACTTTGACAAGAGACCTCTGAGCCGACCGTTTGGCCTTTACCGCCTGGAGCCCACCTCACCCACACAGGATGACGGCGCCGCTCACAGCGAGCACCAGGACCCCATCTCTCTGGCTGTGGAGATGGCTGCAGTCAACCACACCATCCTGGCCCTGTCCAGGACCGGGGGGGTCCCCAACGACATCAAGACCGAGTCCCTGGAGGACGAATGAACTGGAGCAGGATGCAGCCGGGGACAGAGGAGACGACGGTGGATTTAAAAAAGAGACCAAAATAATCCTACTTAGTAAAGCTGC
>XM_031476826.1 PREDICTED: Photinus pyralis uncharacterized LOC116163007 (LOC116163007), mRNA 
ATGGATGAATTTTGTTCAGCAGAGAAAATACTCACTGCAGAACAGCAATACTGTGAGGATTATTTCAATCAAACTACTAAACGTGATTCTTCTGGAAGGTTTATTGTTAAAATACCTTTCAAACCTACTTTAAACAAATTGGGCGACTCTTATGACACTGCTTTAAATAGATTTTATGCCTTGGAGAGAAGGTTAAACAACAATCTGGAATTAAAACTTTCATATTCTAACTTTCTTAATGAATACATTACCTTAAATCACATGACAAAAATTGAGAGAGATAATCAGGTAGCCTTCTACATGCCACACCATTGCGTTCTCCGAGAAACAAGTGAAACAACTCGTCTCAGAGTGGTGTTCGATGGGTCATGCAAGCTTACGAATGGACTGTCCATTAACGATGTTCAATGGGTAGGCCCAAAGTTGCAAAATGAAGTAGTTTCAATTATTGCTCGATTTAGACTTTATTCTTATGTTTTAACTGGGGACATTACAAAAATGTATCGCCAGATTCAAATACATCCTGAACACAAAAAATATCAAAGAATTTTATGGAGGGAAAATGAAAGTGACGAATTATCAGTATATCAGTTAAACACTGTTACATACGGTACGGCGGCGTCTGCGCCATATTTGGCCATTAGATGTTTGATTCAAACTGCACTAGACAATGAAAAAGAATTTGGTTTAGAAGCTCAAATAATTAAGGAAGACTTTTACGTCGATGGCCTTATAACAGGGTCCGACAATCTACAGACATTAATGAGAATGACTATTAAACGAAATATACAACAAATTCTATTTACTGCAGGGTTTTCTTTGCAAAAATTTAAAAGTAATGTCAAGGAACTTAGGGATGATACTGATAATAAATCATTAAAACTGTCTGATAATCAAAATAAAGCATTAGGGGTAGGCTGGAACCCGAAACAAGATTCATTTTTTTACTGTTTTAATTCTTCTGAAATACCAGGACAAATTACCAAACGCACAATTTTGGCAACTACTGCACAAATGTATGATCCTCTTGGTTTACTGGCTCCAATAATCATTACTGCAAAATTGATGGTCCAAGAATTATGGCAAATTAAATTAACATGGGACGAATCAGTTCCTGCTTATTTGCATACAAAATGGTTGACGTTCAAAAACAAATTACATTATATCAATGAAATAATCATTCCGAGACAAGTTCTCATATCCGATTATAAGGTAGTTGAATTACATGCATTTTCGGACGCATCTCAAAGGGCATTTGGAGCGTGTCTTTATCTAAGGTCTATCGATGGTTATGGTAGAGTAAAGGTAGCACTTTTAGCCGCAAAATGTAGGGTAGCGCCATTAATAAATGTCAAATTACCGCGACTTGAGTTGAGTGGAGCAGTTTTGGCAGCTCAATTAACCGATAAATTTAAAAATATATTACGAATAGACATAAACAAACAATATTATTGGTGTGATTCCATGATTGTACTGGCGTGGCTAAAAAATAATCCAAATAAATGGCAAACCTATGTTGCCAATCGTGTTGCTGAAATACAGAGATTTAGTAACCCGGAAAATTGA
>XR_005729805.1 PREDICTED: Ictidomys tridecemlineatus uncharacterized LOC120886716 (LOC120886716), transcript variant X8, ncRNA 
GACTGGGCTGGATAGCCTGGAGGAGGGCCAGCTGGGAAAGGCATGATTACTGTCCTCAAACACCTAGAAGAGCATCGCATGCGGCCCCGGGGGAAGGGGCTGTTAGGGGGAAGCAGACGACTGCTCCTATAAAAAAGGGACTTTGAAGAGGTGGAGCTGGCCAAAGATGGAAGAGGGGCCTAGAAGACGGCCAGCAAGGCAGGACACAAGCACAGTGGATGCTGGAAGGGGACTCAAGCCCCCACAGACAACTGCTGCCAACAAGCAGAAAAGGAGAATGTTTATGCAGCCTAGTCACAAGGGAAATGACATGAGGACATGAGGACCTCAGACGGCAAAATCAAGGCTTCAACACCTTTGGGGAATCCACAGCACAAGAGCCCCTATTTAAGTTCAACCCCAGAATGAGATCAGCTGACACTTGTTCACTCCTCCCTGCGCCCAGGAAATACTTGGTTATGTGTTACTGACTGAAGATTTGGAGTCCCTGTTTCCCATGTTCACTCAGCATCTGACTTGGGCTCCCTGGGCCTCAATTCCTCCATCTATAAAATGAAAGTGATAAAGTGATACTGGCTTACCACGAGAACTATCTAAAGCTCCTGTGAGAGTTCCTGAACAGTCAGGTCTGTGCCAGCATCACTCCTCCAAAAAGCCTTCCTACAGTCTCCCCAGGACCCTCTGTGGCTCCTCACTGGGCTAGCACCCGTGTTTAGGTGACCCACAGCTCCCTGTCCATCACTGTGTGTTTATACCTATTTAATGTTCCTGCATCTGCCTTTAGACCCTGAGCTTCCTGAAGGCAGGGACCATGTGGTTCACATTTCTAACTCCATCCCCGGACCAGAAGAGGCACCAGGTTCAACAATGCAGGAGCTTCTCAGGCAATGTTTTAAATACAATAATGATGGGAAAGCAACCTCTAAAAAGTCTACTGTTCTTTGAAAGACTGACCAGCAAGGAATACTAAACCTACTGAGGACTCCAAGCTGGATGGAAATCAATCTTATTCTCTACTCTCACTGGCTCCCGGAACAGCACCTGGTACTCTAGGAAACTGCCCACACGAGTGATGACCCTCTAGAGACAAACCCCAGCTCTCGGTGCCCAGCAGACCGGCCTTGGACGATCCTCTCCAGCTGATCTTGCTTATCTTGACTCCTGGACAGCCTGCCCCTTGTCTCCCCTTAAAATTTCTGTCTACTTGAGCCTGCTCTGCTTGGATATCCTGAAGGTCATCTCGTCCCTAAAGTCTGCCTTGACTCCCTCCATATTCCCATCACAGTCCTATCCTCTAAACAGCCCATCTAGTCCACCTACATCTTTCCAGGCACGGGATGCAGGCAGGCTTTAGCTACTTTTAAGTCTTCTCTCCCCAGGATGTCAGTAATAGCAGCAGCTGACCCTTAATGCCTCCTCCCTACCATGTACACCTTTCTTCCTGCTAAGACTATAGTCAGGATATCACCACTTCTGTTTGCAAGTGAGGAAACCGAGAGGTTAGCACCTAGTCCAGTCTCACAGCTCTAGTGGCAGCCTGGGGTCTGAACCCCAGCATTCTGACCCTGAACTATGCTCTAACTACAGGTCTGTATGACTTCTGGGGTGTGGGCTTCTCATTGTGCCTAGCTCAGCCACACCCATGTAGGCTTAATAAACGCTATTCTTTTGCATTCCAAGGAA
>XM_021191354.2 PREDICTED: Mus pahari transmembrane protein 140 (Tmem140), mRNA 
ACGCCAGTGTGGGTCATGTGTTCCCGTGAGCAACAAGAAGTTGTTTACACTCTTCATTTCTGAAAAGTCATAAGACACAGGCAAGTTAAAGAACGAAAGTGAAATCAGCTGGTAGTGACATCAGTCAGCACAAATGTACCAAAGTTCAGAGAGCTGTTTACTTGAACGCGGCTGCCTGCGAGTGCGGACAGAGCCCAGGAGCTCTGAGCTGTCTGCTTGCAGCTTCTCTCCTCTGCCCTGCTTGCTGGAGCCTGACTTTAAAAAGCAGCTCAGGAGAGGATCGACTCCCGGACAGACAGACGCTGATTTCCTGTGTCACCTTTTGATGAGTGTTCCTGGGCTCTGGCGCTGGTTTTCGCCTCCCTGCAACAGCAGAAGATATGGCTCTCTCCAGGCTGTGGCGGAACAACCACCTGCCCTTCGTGGGCATCATGATCCTCTTGGCCGCCGCCCTGTCCCTGATGTTCTACGCCCTCCTCTGGAAGGCTGGCAACCTCGCTGACCTACCTAACCTGAGAATCGGCTTCTACAACTTCTGTCTGTGGAAGGAGGACATTGGCTCCCTAGAGTGTTACAACTTCCCTGAGCTGGAGATGCTGGGCATTCCTCAGGTTGGCCTAGCCCTGGCCAGGCTTGGCGTGTATGGAGCCCTGGTCCTCACAATCTTCGTCCCTCTGCCTCTCCTCCTTGCCCAGTACAACAGAGATGAGGGAGAGTGGCGGCTGGCCATGGGCTTCCTGGCGGCATCCTCGCTTCTGTTGGCCTGCGGACTGAGCCTCTTCCTCTCCTTCGTGTGGAAGTGGCTCAGGCTCTCCTTCCTGGGGCCTGCCTTGCCAGCTCTGTGCCTAGCCCAGCTGTTACTCATCTTCTTACTTGTGGCCACGGTTAGGTTCCCGCCACGGGACAAGGAGGACAAGAACCAGTGGGAGAGGTGTTAGTCCGGTCTTACACAGGCTTATTATGGGATTGCAAGGGTTTGGTTCCAACTGTGCTCCAAGAAGGGGCCAGAGGACCTGTGGCTGGGTGGGTCCTCTCAACCACCCTGTATCATAACCAATGTTGATCTCCAGCACAGCAGCGGGAACCACCCACTGTGCAGACGGCTGTGGTGTCAAGGAAGCCAGAGGCGGCTTGGAGGGCTAGGGTACCTGCAGTTTCTTAGGGTACCACGTAGCTCATTAGCAGAGGGGTTCCTATAGCCCCAGGCAGGTGGGAGTCGTCAGAGGCCAAACTTCCAAGCTATCTTGGCAAAGTGTCAAACTAGAACTCTGTGACGGTTATGGCAACAAATGGAACAGTTAGGGAAAAAACAAAACAAAACAAAAACTGCTTTAACACCGAGTCCTGACAGCACAAAGAGAAGCCTCACTGACTTTTCAGGGTCCCCTGAATGGGTCCCTGGACCTGACAGCAAACGGTAATCAGCTGTTAAACCATTCTTGTGACCCAGGGGATGCAGACACAAAATGTGTCAAAGCCTGGAAGGTGAACAGGACTGAATAGTCGTCACAAACACACAACGCGTCCCCTCACCTTACCCAGAACTGGAAAGGCAGAAGCATGGTCTTTATTATGCATTGTGGCATCCTTATATATTTTGTTCAGTGTCTATGTATCAGAAAACCTACGTGCCAACGAGTTCTTCATTCTGTGCTCATCAGAAGCCAAAGTGAGTATAAAGA
>XM_051505439.1 Emericellopsis cladophorae uncharacterized protein (J7T54_008404), partial mRNA 
ATGCCTTCTGCCCCTGCTCTCGGCGCCCTGGGCGTGACCTTTACGGCCATGCGCGTCATGGAGGGCATTGCGCTCCTCACCATCATCGGCCTGTCTGCCAACTTTATCAGTGACGCCGTCAACGCCGGCTACGTTGCGCCTCCTCCGCTGGTCGGCACTCTTGTCGTGTCCTGTCTGGCCACCCTGTACATTGCCATCAGCTACATCCTGTACTACGACTCGATGCTGCCCATGCTCATCGCCACGGGCGCCGACGCGGCGGTCCTCATCATGGTGATTGTCGTGGCGGTGCTGCTCGGCAAGCCCGTCAGCTACCTCCAGTGCGAGTCGTACCCGTCCAAGGGCAACACGGCCAACTTTATCCACTCTGTCTACAGCAACGTCAAAAAGACCAACTCCAACGTCTTCCTCTGGGTGGACCCGGACAAGACGGCCTGCTACGAGGTCAAGGCCGTCTGGGGCCTGAGCACCGCCCTGTGCATCATGTTTGCCATGTCTGCCATTGTCTCCGGCGTGGGGGGACAGGCTTCTGGTCCGAACGTGCTGCGAAAGGGCCGGAGTCTGGGCACCACGGCGGTGACGGGGCCACAGGAGCGCAAGCTCGCATCGCAGGGATCCGTGGCGTCGTCGTCGTCGTCTTCTGGCGGGTCCAACGTCCACGAGTCCTTGCCCCTGCCTGTTCCTGTTCCCGTTCACCGGGCCTCCCCGCCTCCCACGGCTTCTGAGCGACCGTCACGGTTTGGAGAGGTGGCCCGCCCCGTGGAGAGCCTGCCTCGGCTTCAGATCCCACCGCCACCGCCCATCCCGGAGGATCCTTCTCCTTCTCCTTCTCCCCAGCCGCCGCCAAAGAGTCCGCTGAGCCCGCTGCTGGCGAGGGCTCGGTCGAAGAGAAGGACCATCATGTCTAGGGTGGAGGGCTGGTGGGATCTGGGGTTGCTGGACAGACGGCAAACACTGTTTGGCAAGAGGGGTTGA
>GQ040491.1 Uncultured bacterium clone nbw955c02c1 16S ribosomal RNA gene, partial sequence 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGTTTTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGAAAACTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGCAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTGTCTGGTCTGTAACTGACGCTGATGTGCGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAAATCTTGACATCCTCTGACCCCTCTAGAGATAGAGTTTTCCCCTTCGGGGGACAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTAAGCTTAGTTGCCATCATTAAGTTGGGCACTCTAAGTTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGATTTGGGCTACACACGTGCTACAATGGACAATACAAAGGGCAGCGAAACCGCGAGGTCAAGCAAATCCCATAAAGTTGTTCTCAGTTCGGATTGTAGTCTGCAACTCGACTATATGAAGCTGGAATCGCTAGTAATCGTAGATCAGCATGCTACGGTGAATACGTTCCCGGGTCT
>FJ241711.1 Uncultured bacterium clone E53LV6Q02JNG4U 16S ribosomal RNA gene, partial sequence 
TGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCCCTCGGCTCAACCGAGGAACTGCGCCCAAAACTACCGTGCTCGAGGAAGATAGAGGTGAGCGGAACTTAGGGTGGAGCGGTGAAATGCGTTGATATCCTAAGGAACACCGGTGGCGAAAGCGGCTCACTGGATCTTTTCTGACGCTGAGGCACGAAAGCTAGGGTAGCGAACG
>XM_033909212.1 Saccharomyces paradoxus Par32 (SPAR_D00700), partial mRNA 
ATGGCTACGTTCAACCCCCATAACGAGATGGAGAACCAGGCACGTGTACAGGAGTACAAGGTTTCCACCGGCAGAGGCGGAGCCGGCAACATCCATAAGTCTATGTCCAAGCCGTCTCCCGTACTTCTTCCTTTGAAATCCAACTCAAAGCCAGCAGCAAACAACAACAACAATGGGAGCACACAGGAAAAGGTTCCGCGTTTTGCAATTGGCAGGGGCGGTGCTGGCAATATCTTTCATGATCCGCACCTGACGAGATCCGCCCAACAACTAGACTCCAACGATAATATCAACTATAACGATGTGATTGATGACATTGACGATTATATCTCCCCTATAACTTCAGATATGGTCGATGAAGATGGGCCAAACGCGGTGACAAACACCAGGTCTCGTATCAGCGCGACAAGGAGCCACCAATCTTTGCACGCTTCCACTTCGTCTCCCAACAACAAGGCCCCAATTGTCGTTGGTAGAGGCGGGGCAGGAAACATTTTCTTTAACAAAAAGAAGGTATCCAGCAATGGTGGAAACGAAGAGGACGAGATACGAGGCGGTAATGTTGAGGATGAGGATACGATCAATGCAAACGAGGACAATTTGTTCGTGGTGACTTCGAACGGCAATGCATTGGCGGCAATAAAGTCTACATCCAAGAAACCCAAAAATAAGCACAAGGGCAAAAGCGTGCCGGAAAAATTTGCCATTGGAAGAGGCGGCGCTGGGAACATAATTTCGCCCAAGTCGAGCAGGAACACTATAAACCACAACTCAAACGATGATGATGAGGATGAAGTTAATCTGAAAGACGACAATAGTAAAGAAAAGAAGAAGAAGAAGAAGAAAAAGAAATCGGGGTTTTTCAATTCTTTGAAAACTATGTTTAATTGA
>XM_008090460.1 Glarea lozoyensis ATCC 20868 hypothetical protein mRNA 
ATGACCGGCACTCGATTGTTTGACAGTTCCTTACCCGTTGGGAACAGGTCTGTCGTGGTCAGAGAGCACTACACACTTGAACGCTGCAATGGCTGCTTTGACTCTGATGTACACCGCTGGGGTCAATTCGAGCATTCAGCCCGTGGTGGACAACTCCTTTGA
>XR_006437666.1 PREDICTED: Triticum aestivum uncharacterized LOC123078769 (LOC123078769), transcript variant X30, ncRNA 
AAGGACCAGCGATGGAAACCCTAGACTATCGTTTCCCCAGTCCCGCCGCCGCACGCTCTCCCTCTCGCGTGCTCATTCTCCCACCTCTCCACCTCCAAGCCCCTGCTTCCGCACGTCATTCTTCTCCCATCCTCGCGTCGCCGGTCTGGAGGCTAGAGCTTGTGGCCGACGCCTCCGCTCGCCATTTGCCACGCCTCCGGATCTGAACTCGCCCGCGGTGGCAGCGATTGGTGGATGAGAGCCGAGTCCTGAACGGGAAGCAGCGCCTGTCCCTGTCCCACTGCCGTTGGAGAGGCAAGGATGGTATCGGCCGTGCCGCAGCAGCTCGGCGGCTGCCACTTCTTCACATCCCCATCGAGTCGGCGAGTCGCCCTCTGTCGGGCCCACGGAATCGGCTCCCATGACTACACGTTCTTCCTCGGCCTGTTGTAAACCATGGTTCTTCTCAAGCGCGGGCTAAGGTGGCACCATGGCTCGTGCCAAGGAGGCAGCAGCGACCTGCAAACCCTGCAACCAGCAGTAACACGACATGCTGATATTTCTTCAGGGCGTGGCTGGACTCCCCTCCCAGGATCTCACTCCACCACGGGGCCTTCCTGCTGTGAGCCTCTCTGGACGGGAGCTACAACGCCCGTCCCCATCTCACCTTAGGCAAGATATGTGTAGAATTTGGAAAGGACTTGCGAGCTAGGAAAATTTGGGAAAGGACGTTGGGAAGATAACTAGGTTTTCAGTGTGGAGGAACATGACAATTTGAACCAACTAAGATGCAAGGGCATGCTTCACATGGATTCAGACACAATTTTTTTTGGGAATAGATGGTTTTACTAGCCGATGGCATCAGAGGAGCAGCTGCAAGCGCCGAGTGAGGAATTTTCCTTTTGCTCGCATGTGTCTTGTGGTCACTTGAAACAGAGCACTACCTCTGCTTGCAAGTGTCAGAACTACAGGTTTTTGGCTGAACATTCAATTGTGGCAAAATTTTATTGATCCTCATGATTTTGAGATCTAGTGTGCCTTGTTAGTTTGGAATCAGAAGATGCATGCATGCTGCAACCTTCCTGCTTATCAATTAAGTTCTCTGCATCCTAAACTCGCTGACCTGGTATGATCCGTGTGATTAAGAGATGTTTCACCTTTTCTCCATAACAATTCTACAATGCCCCACAAGAGGGATCCACCACGCCGGTGGACTTCACTTGCCACTCCGGGAAGGGTTTTCACATTCCATTTCCATCCATCAGCTTTTCAGTTCTTGTTAGTTTTCACATTTACATTTCACCATATCGGGGATTTAGAGGGCAGCACTTCTTTCTTGGTTATATTAATCAGCCGCATTGTTTTGTGATTACAGAGAAGAAATGACTTCAACCAGGGCAAATTGATAGGGAGGATAGATTACGGCGAACTGTCTATGTCCCAAACATTGATCAACATGATGCTAAATAGAAGCTTGCTCAGGTTTTCTCAACTTGTGGCCAAACCCTACTCAAGCATCTACACCCTCTTCAGCGACCGACGCCCTGTCTGATGGAAACGAGAGACGGGCGGTCGCTCTGCTTGAAAAGAGAGACAAACGGTCTCTGAGCGAGGGAGGGGCGGAGGTTCGTCTTTGCCGGCCGTATGACATTCCTGGTTGCTGGTGGAGGTGCAGGGCGCTCACCTGATTTAGGGAAGGCACCGTGGCTGTTCGGTGAAGCGGGTTGATGAAGCTGATGTGCTTTGTTCCTAAAAACAATGCATCATCAGTTCCTGGAAGAGTTCAGTACATGCACGTGTATATGTTTCTCTGATGCTCTCCTGTCGCGTTCTTACTCCGGCAGCAGAATCTCAAGCAACTATGGTTCTCGGACTAGGTGGCCCCTCTATCTTCATTTTTATTCTCCAGTACGATCACTTCTTTGACCCAACAATTCCGTTGTGCTATTTTCTTTCCAATCTCAGAATTGTACAGTTGGTTTTCATCCTAGTTCTTCAGGCAAAATTTGAAGTTTTGCTCCCATTTTTGGTTTGAGGAAATTTAACTTGCAAAGCTACCGCCAGGTGAATTAATTAGGTCCCATGGGTTTGGATACCTCATCTCTTCACTGACTGCATCTCTTCATGTTTCCAGATTGTGCATTGGTCTAGAAATACATACTTAACTCGGTAATGTGGACTTCACTACTGTGGTACACTGTAAATGGCAAGCTTTTACATGAAGCACTTTTGGTGATCCTAAGGATTTGCTACAGAAAAGTATAATATGATATTGAGTTTCATTCTCTTCCTTTCTGCATTTCCTTGAATATTGTGCGTTCAATTAGCTCAACCGGATAGCAAGAAATGTCAAGGGTTAGCTCTTCTGAACATATTCCTCATGGTAGAAATGGCTGGTATACATGCCGACACGCCCATCCGTGTGTTCAAGACTGGCTGATTCACACCATGGCTGATGTGTACACACAAGCTAACCAAAAGGAGCAGAAAAGGGGTGCACACAACATGTCTGCTCGTTAATAACAAGTCAGGAGGGGGCTATCCAAGGACGAGAAAGCTGGGAAGCTCGCATTGCAGCTTTGGCTTAAGCTGTGAGCACTTTTTCGTCAGAGAAGCTGTAGTTTGATGTTTTGGCCAAGCAATGGGCTGTTGTACCACAATGGTGTTCCTAATTGTTGGCTCTTCCATATAGAAGCTCTGAAACAAAATGAGATGGCCTCAAATTAAGGACAGTTAAACCAGCTGCTCCGAGAGGGGATGTTGAGGATAACGACAATGACGAGCAAGTCGGTGTTTGTGAAGCTTCGCCTGAGCCATTCCAGCTCTTCCAGAGGCACAAGGAGAGCCTAAAGTCAGGGTACGTTCAATCGAGGACACTTGATTCTCCAAGAATTTGTTGAGGATAACAATGGCAACGAGCAAGTCGGCATTTGCGAAGCTTCATCAGAGCCATTCCAGCTCTTCCAGAGGCACAAGGAGAGCCTAAAGTCAGGGTACGTTCAATCGAGTACACTTGCTTCTCCAAGAATTTGTATAATCATTAGAAGTCCAAAGAATGAGTCAAGCCAAAGATATGAAAATGGAACACATTTGCGCTCCTACGAGAAGAAGGTCGCGCAACTGAGGATTCAGGACGCCAACAGTGCGGAGCTGTTCGCCATTGAGAGGACCAGGGCTGCCATCAGGGACATCTGGACCAAGTTCAACATCTCCCTTGCCTCCGTCAACGCCGGCGACCGACTCTACAAGCGTCTAGCTGTGCTTTATGACATGATGAATGCTGCCATCGCTTGCTTTTGAGCACCTACAAGTTACCCTGTTGCATGTAATCTCTAAGACTGCCACTCATCAGGCTTGCATGCGCCTGTTAATACCAGGGCTATAACAACACTTTTATGTGTATATACTCAGTTCTGCTTCC
>LN810097.1 Uncultured bacterium partial 16S rRNA gene, clone HWB-4 
CGGACGGGTGAGTAATGCGTAGGAAGCTACCCGATAGAGGGGGATACCAGTTGGAAACGACTGTTAATACCGCATAATGTCTACGGACCAAAGTGTGGGACCTTCGGGCCACATGCTATCGGATGCGCCTACGTGGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCCCTAGCTGGTTTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTAGGGAGGAAGCGTTGAGTGTTAATAGTACTCAGCGTTGACGTTACCTACAGAAGAAGCACCGGCTAACTCTGTGCCA
>XM_029018326.1 Cryptosporidium ubiquitum uncharacterized protein (cubi_01314), partial mRNA 
ATGGAAAACGAAGCAGAAGAAAATTTCTCAAAAATGATTAAAGCTGTAAATCCACTTTCTAATGATCAAAAGGTATTTTTGGATTTGGGACAAGAAGGTAAGGCCATTCCAATTGATGCTACAAACACAGGTATTTATGAGTATAATATTACAAAACCAATTACAATCACCAAAAGTGGTTCTTATGTTGAGGATGACGATTCATGTTTAACAACTACTATAACTACTAACGAACTTTGTGATTCAAATAGTGTTCTCTCTGTTGCTGGAGCGAATAACTCAGAAGATATACAAACAGAAGACTCAAAAACAGATGTTCTGGCAAATAAAGATTCTAAAGAAAAACTAGAAGAGCAATCTGCTTTTGATATTCATCCTATTAATATTGACACAGGAGCTGAGGAATTGGTACAATCCGCACAAAGTACCTCTAAATCAGGTCGTCGTTCATCAGCAAATCATGAAGTTGGTTCAAGGCAACTGAAATACAATCAAATTGGAGTATATTGGAAAGATAAAGAAAGCAGAGTTTATGCTAGGTTTACATGGGCCACTAGAAAGTATTCTAAAAGCTTTTATGTGGGCCCCAATAAGCCATATGCTACTGTTAGGGATGCAGAAAAGGCTGCTATCAGATTTTTGTTGATTAATAGTCCATTACATAGAAGAAGCCACTTAAAACATTTTAGATTTTCAGAAAGTGATGAAGAAGGAGAAGAGCCTTATGTTGGTTCTCAAGCACTTAAGGAGGCAAGAAGGACCAAAGGAATCATGTTACATTTCCCTGCTCCTGAAAGTGATGATGAGGTTTGGTCTCATTATAACACTTCCAATATCAATCCTGCAACCTTGTATGGTGAGATTATTAAGAAAATGGATAATAGTGAAGGAAATGCCGCTGGAATAACTAGCCCAATTACATCTGCCAGAGAGTATGTTACAGCTAAGCATAAGCAGAATACCAATACAAACCAAAATGAATCCAAATTTTCCGCTTCCCTTCCAGTAAATTCTACAATTGGAGAAAATGTCTCTTCTGATGACTTATTTTTGGCATTAATGGCAAACCAAATTGAATCCGATAGACTAGTAGAGAGGCAGACTACGGGAACATATATGAACCCATCAGCCAGTTCAACTACTGTTTCCTCTAAGAGATTTAAACCAAATTCCAAAACAGAAACTCTTGATTCTTCTGAATTAAACTTTTTCCCCACGAATTCGAATCAACTTGGATCGGCATTTATGGATCAAAGCTCTTCAACTACCTCCACTAATCCTTTTGTTGGTATGGATTATAATACTTTGGTCGCTTTACAACATGCTCAAATGGCAAATTATTATTTGCAACAGCAAGTGGCATATGCAGCTGCTGCTAATCTTGCAATATCATCAAATACTAGTGGGAACTATGCTAATGCTGCAATACGTACAAACCCATTCATAATTCCACAATATTGCTTGGCACCTGTTACTGGATTAGAATCCAATAAATCTGAAGAATCAGAAGTTGATAAACTCCAAGGTGTTACTTTAAATGTTGGTGGTCTTAAAGGTTCTACTCAGTCTAATGCTTCTAACTCTGTTAAAAACATTGCAGAATCTACACTAGATCAGTATGGTGCAATAATGCCAGGACAAGAAACAAAGGCAATGCCTTCTTCGAATATTACTATTTGTGGTACAAACATTCCAAGTAATTACCATACGGATTATATGGCTGTTATGGCTGCTGCATATTCAGGTTGGTATTCGCCTTATGGATACACTATGCCTTTTATGGGATCATACACCCCAATGATGCCTTCGATTATTCCGAATCCAAATGTATTGGGAAGTCAATTTCATAATAATATAAGTCTATCTACAAATACAACTAATGCAGGTCAGGTTCAATCAAGCAGTGTTAATAATGCTGTTCGATTGCAAAAACAGGTAAATAATAATGTTAATTCCATTGAATCTCTGGTGAACACTCGGGTAGAAAAGGAATTACAATCACAAGGTACTTCAGAACAGGAAAATAAACAAGTACCCTAA
>XM_027495983.1 PREDICTED: Abrus precatorius uncharacterized LOC113862782 (LOC113862782), transcript variant X4, mRNA 
TGCAATTGTACCTTCCCTATGTGAACAGTGATTTCTCCACAACAACCCTTTTTCTCATTCTTCCCAGTGTTTAGCTTTCTCAATTCAGTTGGTGCTGAATGGAAGGTATATTCTTTCTAGTTTGGAATCCTTTCAACTTTGTCTGAAGAATGTTTCAGAATCCTTCTCCAGATTAACATTTTGAGATGGTGTTATATGAGCATTCAGATGTTTTTCAATGGGGTCTTAATATTCTTGACGGTGACCCTGCTTATAGTCCTGGATACTATGGCAACATAATTCAACATGATAATGGTGACATCTATAATGGACACTACTTTCATAGCCATTATGGTAATGAATGTAACCATGTAGAGAATGATGAGATCATTGCCCGCACACTTCAAGAAGAGTTTTCACAGCTGGAGATTGCTGAATCTTCAGGATATTTACAGGCAGGTGAAGAGCAGTTCCATGTTTCTGAGACTGAGCCTGCATATGATTGGCATAACTCTTCAATGGTGAACTATTGTTCAGGAGGAGTTGGTGATGAAGAACCATCTAGCTCATGTTCAAGTCCTTGTGAAAAAGAGGAATATTCATTAGAGCTAACTGACAGTTATCCACTTGATGATGAAGTAGGGAGGAGATTGAGTCAAATGATACCAATTCCTCATGTTCCAAAAATTAATGGAGAAATTCCTTCAATCGATGAAGCAACTTCAGATCATCAAAGGCTTCTGGATAGATTGCAGTTATATGACTTTGTGGAGCACAAGGTACAAGGTGATGGTAATTGTCAGTTCCGTGCTTTATCTGATCAATTGTATCATGCACCTGATCACCACAAGTTTGTGAGACGACAAATTGTCAATCAGCTCCAATCGAATCCAGACATATATGATGGATATGTTCCCATGGAATATGATGACTACTTGGAGAAGATGTCTAAGAGTGGAGAATGGGGTGATCACGTCACTCTTCAAGCAGCTGCAGATTCATATGGTGTGAGAATATTTGTGATGACTTCTTTCAAGGACACCTGTTGCATAGAGATTCTTCCTCATTTTGAGAAGCCAAAAGGAGTAATTTTCTTGAGTTTTTGGGCAGAGGTGCATTACAACTCCATTTATCCCCAAGGAGATATACCTTCAAGTGAGTCGAGAAAGAAGAAAAGGTGGTGGAACTTTGGGAGCAAACATTAACTACACCCCTTTTTAACACATTTTTCCATGTTCAGGAATGAATTTATATCCCCATGTTTTTAGCCGGTCA
>XM_035510062.1 Lasiodiplodia theobromae Gaba permease (LTHEOB_1369), partial mRNA 
ATGGCGCGCTCCTCTACCGAGCTAGATGTGCTGCCCGCCGTCTCTTCCGGGAAAGAGTATCACAACATGTCCTCACGCGAGCTGTCTGCCGGCACCGACGATGATCTCCATGAACAGAAGGGCATTACTCGCCATGACCAAGCCGATATGTCGAGAATGGGCAAGGTTCAGGAGCTGAGGAGAAATTATCGCCCGCTGTCCGCCATTGCTTTCACAGTAATTCTCCAGGGCACGTGGGAAGTGCTGATGACTGCGACAACCCAAGGTTTGGTTGATGGCGGTTTGGCTGGCCTGATCTGGAGCTATGTGTGGACCTTTGCTGGCTTTAGCTTTGTTATGGCTTCACTGGCTGAGATGGCTTCCATGGCCCCTACTTCCGGAGGTCAATACCATTGGGTCTCTGAATTTGCGCCTGCAAAGTATCAGCGCTTCCTGAGCTATTTTACGGGATGGATGTCGACCATGTCATGGCAGGCCGGAACCGCGTCCGGCCCATTCCTTGTCGGCACGCTGATTCAGGGCTGTGCTATCGTTGCTTATCCTGACTACTCTCCGACGAATTACCAAGGCACGCTCATGGTTATTGCCGTGGCCATAATCGTCTGGATATTCAACGTCTACGGTGCTCACGCCATGCCCATTCTTCAAAACCTGATGCTCATCGTCCACGTCCTTGGATTCCTCACCATCATTATCGTGCTGTGGGTTTTGTCGCCGCGCAACACTGCTGAGACAGTCTTCACCGTCTTCACCAACGATGGCGGCTGGAACTCCATGGGCCTGAGTTTGATGGTTGGCCAGATTTCAGCCATATATGCTTGTATCTGCTCCGACGCTGCCGCTCATATGTCCGAGGAGATTAAGGATGCCGGTGTCGTCGTTCCCCGTGCCATGGTTTGGTCATACGTCATCAACGGCGGCCTCGGCTTCATCTTCCTCGTGACATACTTGTTTATGATTACCGACGTGGAGGCTGCACTTGAGGACTGGTATCCCCACATCTGGGTCTTCCGCCAGGCCGTCAATGATGCTGGCGTCGTGGGTTTGAACGTGATTCCCACCGTGCTCATCTTCGCCGGCACCGTCTCCTACAACCTGTCCACCTCGCGCCAAACCTGGTCCTTCGCCCGCGACAAGGGCGTCCCGTTCTCCAACTGGATCGCTAAGGTCGACCCGAAGCTGGAAGTCCCCATCAACTCCGTCACCGTCACGACGCTGATCACCATCGCACTGTCGCTCATCAACATCGGCTCCGACGTCGCCTTCAACGCCATCATCTCCCTCAACGTCGTCTCGCTGATGATCACCTACATGACCTCCATCGGTTGCGTCTTGTGGCGCCGCATCTACCACCCGGAGACGCTGCCGACCTGCCGCTGGAGCTTGGGCAAGTGGGGCGTGCCCGTCAACATCTGCGGCTTTCTGTACTCGACTCACGCTTTCTTTTGGTGCTTCTGGCCGAATGCTACGCCCACGGATGCCGAAAACTTCAACTGGGCGTCGGTCATGTTCGTGGCTGTGTTCATTTTGAGCAGTATTTATTATGTCTTTAAGGGCAGGAAGGCGTACGAAGGCCCAGTTGTGTTGACCGAGGGCTGGAAGGGCGAGTGA
>XM_020885145.1 PREDICTED: Odocoileus virginianus texanus zinc finger protein 300 (ZNF300), transcript variant X2, mRNA 
GGTCAGGTGCAGGCCTGTTCGTATGCTGCTGCCGCCATCTTGGGTTGCAGGGCCTGTGCAGGCTTCTGCTCACCACAGGCGGAATTGGGGTTCAGCATAGCGGTTCTGCACCGGGAGCTGTAATGTGATGGGTTAGGTGCAAGGCCTCTGCAGAGTGTCCTATACAGATAAGCAAGTTGCAAGTTGGAGAGTCCTACATGGCAAGATATTGAGGGTGGCTTCCTTGCAACAATCAGCAAGGACATGAATGCCCTTAGTCCAGCAATCTTTGAGGCATTAAATTCTACCAACAATCATATAATTGAGCTTGGAAATGAATCTTACCCCATTTGAGTCTTCAGATGAGAGACCCCAGCCTGGATCAATACCTTGATTATAGATTTGTAGAACACCTCAAAGCAGAGGATTCAGATAATCCATGTCCAGATTCCTGACCCACAGAAACTGTGAAACAATAGATGTGTGTTGTTTAAAACCACTAAGTTTGGGGCCCAGACAAAAGCTCTGAGTAAACTGAATTCCTCTGCTTGTACGGAACTGACCAATCTAACAAGATGGCGGCTCCCACTGAGCCACATAGCACGGGAGTGGCCATATTGCCTCCTGAACAAAGCCGCCCAGGGTGCAGAGTGGGTAAAACTCCGCTGTACGGAACAGTGCACGCCGGGGAGCCCCGCGCTTTGCTCACCCAGACAGGAAGCGGGAGAATTCACCACTATGGATGTGACAGCTGTCTTGGATTGAGCCGTGATGGGCGTTTCTGGAACTGCAGGAAACATTTATTGAACACCTGCTGGGTGCCTGGAGACTGGTGAATATAGAAACTGCATTTTGCAGCCCATCTGTGAAAATACCCTTCTGATCACCAATTTTGCCTTTTCAAGCATCTGCCATTTTAGAGGAGAGCAGAAAAAGATGAAGTCCCAGGGATTAGTATCTTTCAAGGATGTAGCTGTGGATTTCACCCAGGAGGAGTGGCAGCAACTAGACCCTGCTCAGAAGACCCTGTACAGGGATGTGATGCTGGAGAACTATAGCCACCTGGTCTCAATGGGGCATCCAGTTTCCAAACCAGATGTCATTTCCAAGTTGGAGCAAGGAGAAGATCCATGGATCATTAAAAGAGACATACCAAATTGGATCTGTCCATATGAAGACCAGACAGATGGGCGACTAGACAGGAAGAGTAACCTTGACAACCCCCAATCATGTATTTTGGGGTCTGTTTCCTTACATAATAAGATATTGAAAGGATTCACAAAGGATGGTTCATTATACTCCATTTTAAAAGTCTGTCAAAGTGATGGCCAGTTACAGAGATGTCAGAAAAACAGACTTTCCACAAAAGTAACAGTCATCAACAACAAAACAATGACTGTAGAGTCAGACTACAAATATGAGGCACTGAGGAAAATATTTCAAGAGTGCATAGAGTCAGATGCTTCAAGACAAAGACCCTATAACTATGATGCCTTTAAAAAGAACTTGAAATCTAATATTGACCTACCTAGTTGTAATAAGAACAATTCAAGAAGAAACCTTGAGGAGAGTTCTGGATGTGGAAAATCATTCATCCACAGTGTGGCAAATTCTAACCTTGAGAAGATTCACAATGGAGTAATTCCCTGTAATGATATTGAGCATGGAAACATTTTCGGCAAGAAGCAATCCATTATTCATTATCAGAATGTTGAAACCAAGGAGAAAACCTGTGTGTGTGTTACATGTGGAAAAGCCTTTGCTAAGAAGTCACAGCTCATTGTACATCAACGGATTCATACTGGGAAAAAACCATATGATTGTGGTGCATGTGGGAAAGCCTTCAGTGAGAAGTTTCACCTCATTGTACATCAGAGAACTCATACTGGGGAGAAACCTTATGAATGCTCTGAATGTGGAAAAGCCTTCTCTCAAAAATCATCTCTTATTATACATCAGAGAGTTCATACTGGAGAAAAACCATATGAATGTAGTGAATGTGGAAAAGCCTTCTCCCAGAAATCACCGCTCATTATACATCAGAGAATTCACACTGGAGAGAAACCTTATGAATGTAGAGAGTGTGGTAAGGCCTTCTCCCAGAAGTCACAACTGATTATACATCATAGAGCTCATACTGGAGAGAAGCCCTATGAGTGTACTGAATGCGGGAAAGCCTTCTGTGAGAAGTCCCACCTCATTATACATAAAAGAATTCACACCGGGGAGAAACCCTACAAATGTGCTCAGTGTGAGGAAGCCTTCAGCAGAAAGACAGAACTCATTACACACCAGTTAATTCATACTGGGGAGAAACCTTATGAATGTACTGCTTGTGGGAAGACCTTCTCCCGAAAGTCACAGCTCATTATACATCAGAGAACACATACTGGAGAAAAACCCTATAAATGCAATGAATGTGGAAAAGCCTTCTGTCAGAAATCACATCTCATTGGACATCAGAGGATACACACAGGAGAAAAACCTTATGTTTGTACTGAATGTGGGAAAGCCTTCTCTCAAAAGTCTCACCTCCCAGGTCATCAGAGGATTCATACAGGAGAGAAACCATACATATGTGCTGAATGTGGAAAGGCGTTTTCTCAGAAGTCAGATCTTGTTTTACATCGGAGAATTCACACTGGGGAAAGACCCTATCGATGTGCTGTATGTGGGAAAGCTTTCATCCAGAAATCACAACTCACTGTACATCAGAGAATTCATAGCAGTGGTAAAAATCATAGTGAACTAAAAACACAGACAAGCTTTCAGTATTAGCTCAATGCTTAATACGTAACAGGAACTTGATTAATTTGATAACTTTGTTGAAGCATCTTTATAGAGAAAATTTTACAAGAGAATACATATCTGTAGTGTGGTGATACCTAACTCAGCAGACATGATGGAAAATAATTACATAAATGAAGGCCATTTTCACCATAGCATGTAGAGCTTTTAAAGTTATGAATTGAATGGTTAGTAGAACAAATTATGTATATAGAATGTTGTCAAAGTACATATTCCTTATTATGCCCCATAACAATAAACATTGTGAAATTGCTAATATTAACTTGGCATCATTTTGGTCATATACATTAATTGCCTATAAAGGACATGAAGAATGCTTGATTTAAAAAAATCAATTCCAAGAAACTGCATTAACAAGGAAAGGCTTGGGAGTTCCCTAATAATAGGACTCAACAATTTCACAGC
>HQ038014.1 Uncultured Syntrophus sp. clone F2M5Y2A01B2QEH 16S ribosomal RNA gene, partial sequence 
GAGGAGGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCGCAACGAGCGCAACCCTTGTCTTTAATTGCCATCATTCAGTTGGGCACTTTAAAGAGACTGCCGGTGTTAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCTTTATGCCCAGGGCTACACACGTGCTACAATGGGTGGTACAAAGAGATGCAATCTCGCAAGAGCAAGCAAACCTCAAAAAGCCATCCTCAGTTCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTT
>XM_048223246.1 PREDICTED: Ursus arctos SEC16 homolog A, endoplasmic reticulum export factor (SEC16A), transcript variant X12, mRNA 
GGCGGCCGGAGCCGGATGTGCCAAGATGGCTGCTGCGGCTGTCGTGTCTGCGCTCGTCGCCGCAGCCGGGCCGGCTTCCGCCGGCGGCTCCTGAGGGGCTGGCCCAGGGGTCGCGGAGGGGCCGGGCGGGAGTCTCGGCCGCCCTGTGGCGCGCCGTTCAACTTAAGGAACCTATATCCTGCTTCTATCCGTAAGGAGCATCTAATTGTGCAGAAGATCAATCATGCAGCCACCACCCCAGGCAGCCCCATCAGGCGTGGTTGGGCCACCTCCAGCTGGGACTCCTCAGAGCATGTTCTGGTCCAACAGACCGTATAGAAGACAGGCAAATAACAACGCACCGGTGACTCCAATAACTTGCCCACTGCAGCCAGTGACCGATCCGTTTGCTTTTAGTAGACAGGCGCTACAAAATACATCGTTAGGCGGTTCGTCCAAAAGCAGCCCGCCCATTCTGCAAGGCCCGGCCCCACCAGCGTTCCTTCAGCGCCCTGGTCTGCCTGTGCCTCACACAGATGCTGGGGATACCCCCCAAGGACCAGTGTCGCAGCCCAGAGCAGATGGCAGTCTGTTTTCCAGTGTGTTGACCCCTTCAGCACCATCGGAGCCCGAGGTGAACAGGAGTGCTGAGGTTGCTCCCAGCTCAGAACCCGAAGTTCAGACTCTGCCATATTCTCAGTACATTCCAGGAGCGGGTGCTGACAGTTCTCACGGGGGCCATCCGCACACAAATATGCTTGGGCCTGATAGGCTCCTGAGTAGCCAGAACCCGCACGACAGTGCTGCGGCGTTAGCACCATCCCCTTTCTTCCCTCAGCCTCGTCAGCAAATGCCAGGGCAGTGGGGACCCGGGCAGGGAGGCCCACAACCCTCAGGTCAACATTATTGGCCCCGCCCAGAAGGACCTGTTCAGAACGCGGTGCCTCATACCTCCATCGTTTCTCAGTTCCCTGCTCCATCCAACCCGCATCTTGGTCCTGGCCACGAGCAGCTCAGCTCACTGGTGTCTTTGCCAGGACCCTTAGCCAGTGATGGAAGCAATGAGGTGGCCTACCTGCAAAGTGGAAACCATTCAACAAATAATTTTGATCCTGAAAATGCATTCAGGCAAAATTCTAGGGCTGGGAATACTTGGGCGAGCCAGGAGCTCAGGCCAAGTCCAGGAGTGAATAAAGAGCAGTTGCCAGACCTTGCTCTCGTTAATCCCCTCGCTCAGGGAAATAGCCCAGAAAGCCATTTGCACTACCCCCCAGGGGCTGGGACCAGCCGAGCCCTGTCAGAAGTGGACTCGGGGGCTCTCTCCATGTTTTTTCAAGGTGGGGAGACAGAAAATGAGGAGAACCTCTCATCTGAAAAAACAGGCTCTGCTGGTCAGTCTGACTTCGACGGCTTCTCCCCCAGCCCCGCGCTTGGTCATCCTCCTGTACATGTGGGAGCAGGCGGCATTTACCAGGCCCTTCCCAAAGGTTCCAACAGTGAGGCCATGCAGCAGGGAGGACACCCGCAACCTTATTTTTCTCAGTCTGCAGGCCCCCAGCCTGATCGACCCACCACGGCCAGTGCTGCCATTGCTGCGTGGGGCAGTGCAGCAAGTGCGGGGGCGCACGCAGCCAGCAGCTCGCAGTCTGAGAATGTGGAAGACCTAGAATTCATTCAGAATCAAGAAGTTCTGCCAAGTGAGCCCCTGAGTTTGGACCCTTCCTCCCCAAGCGATCAGGTCAGATACGGGCCCCTTCCTGGGCCAGCCGTCCCCAGGCTCGGTGTTGTGGGCCACGCTGGAGGTGGGGGTCCAAATCTCGAGGCCCCGGATTCAACGCCACACCCTGTGCGGTCTGATAGCGTGTCATCCGGTTACAGCAGCAAGAGCCACAGGAATCTTTCGAGTGCAGCCAGGCCCCAAGACGTAGGCACTTTCATTCAGCAAGAAGTTGGAAAACCTGAAGATGAGTCTTCGGGGAGTTTTTTTAAGCAAATTGATTCTTCCCCTGTGGGAGGAGAGGCAAACGAGACCACCGTGAGCCAGAATCACCGCAGCAGCCTGTCCCAGACCTCAACCCCAAGCCCCCCAAAACCCACTGGAATATTTCAGACAAGTGCAAATAGTTCTTTTGAACCAGTGAAATCCCACTTAGTTGGAGTAAAACTCGTCGAGGCCGATCGCGCCAACGTGGTGGGTGAGGTGAGAGGGACCATTGCCCACCAGAAGCAGCGCAGACCCGCTGCTGCCCCACCCGACACTTCCCCCGGCAACCTGGAGCAGCCACCGGACAACATGGAGACCCTGTTCACACTCCAGGCCTGCTCTCCGCCCTTTTCCATACCTGTGGAGCCCGGGTACGGGCTCGTACATGCTGGGGGGCCGCCCTTGGAAACTGTGCCCCTGGCAGCTGAGAAAAGGCCTTTGGCCAGAGCCCAGGGAGCCGTGAAGTGTGAGAGCCCAGTGACAACGTTGTGGGCACAGAACGAGTTGCCAGATTTTGGAGGCAACGTCCTTCTAGCCCCAGCTGCTCCTGCGTTGCACGTGCCTGTGAAACCACAGCCATCCGAAGTGATCCAGCCGCCAGATGAGGGCGCGTCCGCTCTGCAGTCCCAGCAGCCAGGCTCTGGCCTCCCTCTGCACAGTGGGGACAGCATTGGTGCTTCTGAGAACCTCGAGAACCCTCCCAAGATGGGAGAAGAGGAGGCCCTCCCGTCACAGGTGACAAAAGACGCTCAGGAACAGCGTGGCCCAGAGAGAGCCCAGCAGGAGCCAGCACCACCTCCCCCACAAGGGCCCAAAGCAACATGTACAGATCCTTCAAACCCAGGAGGTCCACCCGTGCAGGGACAGCCCCAGAACTCGGTCCCACCACCCACAAGCCCAGCTCCAGCTGACGCAGGTCAGCCACTGCCGCCTCGGCCACCTCGGTCTTCCAGCGCGTCGGTCGTGTCTACCAGCTCGAGCCAGGCAGCCGTGCGGTCAGACCAGCACTGGCTGCAGCCGCCTCCTCCAGACCTGGCATCTTACTACTATTACAGACCCTTGTATGATGGCTACCAGTCCCATTACCCCTCGCCATACCCACCGGAGCCTGGCACGGCCCCCCTCTATTATCAGGACGTCTATGGCCTGTACGAGCCCAGGTACAGGCCCTATGACAGTGCGGCGTCTGCCTATGCTGAGAGCTACCGCTATTCCGAGCCTGAGCGACCCAGCTCCCGAGCAAGTCACTGCTCAGACCGGCCGCCTGCCAGGCAAAGGTACCCTGAAGGTTACTACAGTTCCAGAAGTGGGTGGAGCAGCCAGAGCGACCACTATGCGGATTATTACCCCGGCCAGTACGATTACGCAGACCCAGGTCACTGGGACCAGTACCACTATGGTTCCAGATTCAGGGACCCCCGCGCCTGTGACCGGAGGCATTGGTATGATGCTGAGTACGACGCGTGCAGGAAGGACAGCTGTGCGTACGGTGACAGGCCCGAGAGGTACGACGACCCCTGGAGGTACGACCCTCGCTTCACCGGCAGTTTTGACGATGACCCCGAGCCCCACAGGGACCCGTACGGGGAAGAGGCGGACAGGCGCAGCGTGCACAGCGAGCGCTCGGCCCAGAGCCTGCGCAGCAGCTTCAGCTCCCACTCACGTCAGAGTCAGATTTACAGAAATCACGGCGTGACTGCTGCTCCCTATGAGGCCCCACATCCCCCAGGCTCCTTGCCTGGAGATTACGCCTACGGGGCCTATGGCAGCAATTTTGGCAGTGCCCAGGGCTTCCCAGAGTACGGCTACCCTGCCGAAGCTGGCTGGCCCTCCACGGAGCAAGCTCCGTCAAGACCAACTTCTCCTGAGAAGTTCTCAGTGCCTCACGTCTGTGCCAGGTTCGGGCCTGGGGGTCAGCTCATTAAAGTGATTCCGAACCTGCCTTCGGAAGGACAGCCGGCGCTGGTGGAGATGCACAGCATGGAGACTTTGCTGCAGCACACGCCGGAGCAGGAGGAGCTGCGCTCGTTCCCAGGACCGCTCGGCAAAGATGACACCCATAAAGTGGATGTTATTAATTTTGCACAGAACAAAGCTACAAAATGTTTGCAGAACGAAAATTTAATTGACAAAGAGTCTGCAAGTCTCCTTTGGAATTTCATTGTTCTCTTGTGCAGACAGAATGGGACCGTGGTGGGAACAGACCTCGCAGAGCTTTTGTTACGAGACCACAAAACCGCGTGGCTTCCTGGGAAGTCACCCAACGAGGCCAACCTGATTGATTTTACTAACGAGGCTGTGGAGCAAGTGGAGGAAGAGGAGTCCGGGGAAGCCCAGCTCTCATTTCTGACTGACAGCCAAGCAGCTAGCAGCAGTGCTCTTGAAAAGGAGACGGAGAGGTTCCGGGAGCTGCTGCTGTACGGCCGCAAGAAGGATGCTTTAGAGTCTGCGATGAAAAACGCCTTATGGGGTCATGCTCTGTTACTTGCAAGTAAGATGGACAGCCGGACACACGCCCGCGTCATGACCAGGTTCGCCAACAGTCTTCCGATCAACGACCCTTTGCAGACAGTGTACCAGCTGATGTCGGGGCGGATGCCTGCTGCGTCCACGTGTTGCGGAGATGAGAAGTGGGGAGATTGGAGGCCACATCTTGCTATGGTTTTGTCCAACCTGAGCAGCAACGTGGATGTGGAGTCCAGGGCAATGGCCACCATGGGTGACACTCTGGCTTCGAAAGGTCTCCTAGATGCTGCGCACTTCTGCTACCTCATGGCCCAGGTCGGACTGGGGGTTTATACAAAGAAAACCACAAAACTTGTCTTAATTGGATCAAACCACAGTTTGCCGTTTTTAAAGTTTGCCACCAATGAAGCTATTCAGAGGACAGAAGCCTACGAGTATGCCCAGTCTCTCGGGGCACAGACCTGCTCCTTCCCCAGTTTCCAGGTGTTCAAGTTCATCTACTCCTGCCGCCTGGCCGAAATGGGGCTGGCCACGCAGGCCTTCCACTACTGCGAGGTGATTGCCAAGAGCATCCTGCTGCAGCCCCACAAGTACTCGCCCGTGCTCATCAGCCAGCTGGTGCAGATCGCGTCCCAGCTGCGCCTCTTCGACCCGCAGCTGAGAGAGAAGCCGGAGGAGGAGGCCTTTGTGGAGCCTGCCTGGTTGGTCCAGCTGCAGAGTGTGGACAAGCAGGTCAAGGAGGGCGCCGCGGTGTGGAGTCGGGGCGGGACCTTCCCCCAGCGCTGTCCCAGCACCCCGAGCTCAGAGGCGGGTCAGTATGACGGGCCAGCACTCTCCCAGCCGGGGGGCCCGGGCACCGGCAATCCGCTGCTGGCACCGCCTGTGCCCAGCGCTGAGCACTTTGGCCAGGGGGTGCGGCTGCTGCCTTCAGCTCCGCCGACGCTCCCCGACAGCCATCCGGCCCTGCCCGCCAGGGTGCCCTTGTTCCCGGTGCCCTCGCCCCCGGGCCCTGTTGAGCTGGGGCCTGGCTGTGGACCCTCGGGGGCTGCCCTCGGCTTTCCGGAGCCCTCTGGGCCTGACCCCGTGGCTCCGTACGCGGCTCCTGGCCTGCCACCTGGCGCACCATCTCCGCAAGAAAGTGAGCACGCGCCCCAGGAGGCCCGGAGCCAGGACCCAGGGGTGATGCCACCGGAGGTGCTTGGTAGAAACTCGCTTCTGGAGCTGAGAGAAGAGGGTCTTGGCGGAAAATTTGCTGATCTGGGCTCCTCCATGATGTCACAGGACTCCGAGGTCCCCCCGGGGTGGGAATGTGCTGGCTCCAGTGTTCTGCAGCCACCGACGTCCACTCCCGAAGCGAAGAGACCTGCACCAGCAGCCAGGAAAGAGGCCAAGGAGCCCAAGAAGAGTGGCGAGTCCTGGTTCTCTCGTTGGCTCCCTGGGAAGAAAAGGACGGAAGCTTATTTGCCAGACGACAAGAACAAATCGATCGTCTGGGATGAGAAGAAGAACCGATGGGTGGATGTGAACGAGCCAGAGGAGGAGAAGAAGGCTCCGCCCCCACCACCAACCTCGCTCCCCAAGGCTCCACTCACTGCACCCCCCGGTCCTGGAGGGCCCCCGAGGGCCTCTGTGAACATGTTTTCTAGGAAAGCAGCTGGAGCCAGAGCACGCTACGTGGATGTTTTCAACCCGGGGGGGCCCCAGCGGAGTGAGCCGGCTCTCGCTCCAGCAGAGTTCTTTGCTCCTCTTGCCCCGCTCCCGATTCCTGCTCACTTGTTCGGACCAAACACAGACGCAGAGGAAGCTCCGCCTGCAGAGGGGGCTGGCAGGGAAGGGCAGGCGCCCGTGGGGGGTCCGGCCAACCCAGAGCCGGCCTCGGAGCCCCAGGTGTTCAGCTCGGCGGTGGCGCTCCCTGGCCCTGAGCTCCCACCCGCCCGCGAGGACGGCTCCCAGGGCGGAGAGCTGTCGCGCTGTAGCTCAGTGAGCTCGTTATCACGCGAAGTAAGCCGGCACTTTTATCAGGTACCTGTGGCCGGCGGCTCTCACCGGACGCGAGTTGAACTGGGTCGCCTTTGTGTTCCTTCTGAGAGCGCTGTGCTGGCTGGCCGTCGTGCCCTTGTCACTCACGCGGCCCGCTGCCTCCCCGTCCCCCTCACGCCAGAGGATGCAGTGTTCCTTTCTCCCAGGGTCCTCGGGGGGTCGGGAGCCGTCCACGTGCACTGATGCGCACGTGGACCCCAAAAGGTTCCTAGTGAACGAATGCAGTTTGTAATTGTGTTCTTTCCAGATTGGTTTGTCCACACGGCAGCCGTGGGCGTAGCCTCACCGTGTGTGAGTGGGCTTCAGAAGCCCGCCAGGGGCAGGAGGGACTTGTGTTCTCTGACCGAGCGCGAGACGGCGTCGCGTAGGCCCGGCAGAGAGCGGCGGGCGGCTGTCCTTTGGCCAGTCTGGGCGGGAGAAAAAGGAATGCGTCATCTTTTATGTGTATCGTGGCACAGCGTTTCCGTTGGCTCAGTAGAAGGCTTTACGTGACCTTTTTATTTGCGTACTAAAACGCTGGATTTTGTAGCTGGATACTGGAGTCTGAAGTAATCAAAAATGTCTACTAACTGCTTCAAGCCGACGCTAACGGGCCGTCTTGGTGCCGTGCACTCCGCGTTCCTGCATGTTCTGGTTTTAAGGCATTTCTCTCTGCATGCTGCTTCATGTTTTCCCATTTTCCTGTGAACCTTGGCGTAATTAAATCCAGTGTTGCGAGAAGTGTCTGCCAGCTGCTTCCGTGGCTTACTTAGAAGCGCTGTAAACGGTTCCCGGAGACCAGTGTCTGTTCACAAGGGGAGCAAAGCGCTGGGATGGCGCTGTGTTGACGCGTGCTCTCTGTGGT
>XM_012078672.1 PREDICTED: Cercocebus atys galectin-7 (LOC105594508), transcript variant X1, mRNA 
GTTGCCCTGTCTGGCACTATCGCTGTGGTTGTAGCCGCTGTTGCTTTAGAGACATAGAAGCAGGGATTTCAGCGCAGACATTTCCAGTCCAGGCAGGAGGTTCTTAGCTGGAGAGAAGGGTCTAGAGTTCCCGCTGGGCTTGGCTTCTCAGGACCCAACATGTCTGTGTATAAAATAAGCATGAGACACTCTCCGTGCGCCAGGCAGTGGGAAGGCAGGGCTGGAGGGGCGGTGGCACGAGGAGCCTTCTCTGCTAACGTCCCCCACAAGTCCTTGCTGCCCGAGGGCATCCGCCCTGGCACGGTGCTGAGAATTCGTGGCTTGGTTCCTCCCAATGCCGGCAGGTTCCACGTAAACCTGCTTTGCGGGGAGGAGCAGGACTCCGATGCCGCCCTGCATTTCAACCCCCGGCTGGACACGTCAGAGGTGGTCTTCAACAGCAAGGAGCAAGGCTCCTGGGGCCGCGAGGAGCGCGGGCCTGGCGTTCCTTTCCAGCGCGGGCAGCCCTTCGAGGTGCTCATCATCGCGTCGGACGACGGCTTCAAGGCCGTGGTTGGGGACGCCCAGTACCACCACTTCCGCCACCGCCTGCCGCTGGCGCGCGTGCGCCTGGTGGAGGTGGGCGGGGACGTGCAGCTGGACTCCGTGAAGATCTTCTGAGCAGAAGCCCAGGCGGGCCCGGGGCCTTGGGTGGCAAATAAAGCGTTATCCCGCAGCG
>EU356148.1 Uncultured bacterium clone 053.F4 16S ribosomal RNA gene, partial sequence 
GAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCATAGGTGGTGAGTTAAGTCTGTCGTGAAAGCCCCGGGCTCAACCTGGGAATGGCGATGGATACTGGCTCGCTAGAGTGCGGTAGAGGGTGGTGGAATTCCCGGTGTAGCAGTGAAATGCGTAGAGATCGGGAGGAACATCAGTTGCGAAGGCGGCCACCTGGACCAGCACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGCGAACTGGACGTTGGGAGCAACTAGGCTCTCAGTGTCGAAGCTAACGCGTTAAGTTCGCCGCCTGGGGAGTACGGTCGCAAGACTG
>XM_036526509.1 PREDICTED: Megalops cyprinoides Janus kinase and microtubule interacting protein 3 (jakmip3), transcript variant X3, mRNA 
AATGGTAAAATGCCTGTGTGTGAGGAGACGCGCAGACGGATTCTTTTTAGGATGTGCGCTTTAGCCCACAGCAAATGGTTCTTCACCGGATGCTAGGGGAGCTACACAGCTAAAGCAAGCAGACAGCATTCAGCCTAACTGGATCATGGCTTTAAGGTGGGAGAGAAGATGTAGGTGAGGATTCGCAGGGGGGAAGAGAAGCCTGACACCTCCCATCCTCAGGTTCTTCCTGTGGGGGCGGGCCGGCCCGAGCCGGGATCAGTGCCTCACCATGTCCAAGAGGGGGTCCGGCGGCCGAGCCAAGGGGGAGCGGCCCGATGCTCTAGCCGCCCTGCAGGCGGCGAATGAGGAGCTGAGGGCCAAACTCACAGACATCCAAATCGAATTGCAGCAAGAGAAGACTAAGGTCAGCAAGTTAGAGCGGGAGAAGTCCCAGGAGGTGAGGCAGGAGCAGCACAAGTCGACGGTGGTGGTGACGGAGCTGAAGGCCAAGCTGCACGAGGAGAAGGTGAAGGCCCTGCACTGCGTGCGTGAGACGCTGCTGCGGCAGCACGAGTCCGAGCTGCTGCGGGTCATCAAGATCAAGGACAACGAGATCCAGCGGCTGCAGGCGCTGGTCAACGCCCTCCGCGACGGCTCCACCGACAAGGTCAAGACGGCGCTCTTCGCCGAGGCCAAGGAGGAGGCCAAGCGCGGGTTCGAGAGCGAGAAGAGCAAGATGCAGCAGGAGATCTCCGAGCTGAAGGGCGTCAAGCGGCAGATGGAGGAGGCGCTGACTCTGGCCGTGCAGGCCGACAAGATCAAGGCGGCCGAGATCCGCAGCGTCTACCACCTGCACCAGGAGGAGATCACCCGAATCAAGAGGGAGTGCGAGAGGGAGATCCGCAGACTGATGGATGAGATTAAGGTAAAAGACAGAGCAGTCTGCCTGCTGGAAAAGGAGCTGGGCGTCCAAGCAGGGCACACTCAGAGGCTCCAGCTCCAAAAAGAGGCTCTAGATGAGCAGCTTGTCCAGTTCAGGGAGGCTGAGCGACATCTGGCCAGCCCCAAACGAGAGGCCCCTTATGCAAGTGGTGCAGGAGACGCCTCTGATCATTCAGGAAGCCCTGAACAGCAGCTGGACGAAAAGGACGCGCGGCGCTTCCAACTTAAAATCGCTGAACTGAGCGCCATCATCCGCAAACTGGAGGACCGCAACGCGCTTCTTTCCGAGGAACGCAACGAGCTGCTGAAGCGTCTCCGTGAGGCCGAGAGTCAGTACAAACCTCTGCTGGACAAGAACAAGCGTCTGAGCCGTAAAAACGAGGAGCTGGCCCATGCCTTCAGACGCATGGAGAACAAGCTGAGATTCGTCACCCAGGAGAACATCGAAATGAGAGAGAAGGCGGGAAGCATTCGCCGGCCCAGCTCCCTGAACGACCTGGACCAAACTCAAGAGGAGAGAGAGATCGAGTTCCTCAGGCTGCAGGTGCTCGAACAGCAGAACATCATTGACGATCTGTCAAAGGCGCTTGAGACAGCTGGATATGTGAAGAGTGTAATAGAGCGGGACATGTTGCTGAGGTACCGGCGGCAGAGAAAGAGAGTCATCAAGCCCTGTAAGCCGGTTGTGGAGACGTTCTTCGGGTATGACGAAGAGGCGTCTTTGGATTCAGACGGGTCCTCCATATCCTACCACACGGACAGAACACCCTGCACGCCGGACGACGACCTAGAAGATGGCCTGATCAAAGAGGAGACGGAGCTGAGGTTTCGTCAGCTGACCATGGAATACCAGGCTCTCCAGCGCGCCTACGCACTCCTACAGGAACAAGTCGGGGGGACGTTTGATGCAGAGAGAGAAGTAAAGACAAGAGAACAACTACAGGCAGAACTCATCCGGTACCAAACAAGAATAGAAGACCTCGAGTGCGCTTTGACCCAGCAAGGCCTGGACGTGAAGTGGATCGAGGAGAAGCAGGCCTTGTATCGCCGAAACCAGGAACTTGTGGAAAAGATCAAACAGATGGAGATGGAAGAATCCCGCCTGAAACATGACATTCAGGACGTCAAAGACCAAAACGAGCTTTTAGAATTCCGTATACTAGAACTAGAAGAGCGGGAAAGGAGGTCCCCAGCCGTCAACTTCCACAACATCCAATTCACGGAGGGCATGAGCCCCCTGCAGGTATACTGTGAGGCAGAGGGCGTCACGGACATCATCATCACCGAGCTCATGAAAAAACTGGATATTCTGGGGGATAACGCCAATCTCACCAACGAGGAGCAGGTGGTTGTCATTCACGCGCGGACCGTTTTAACTTTAGCAGAAAAGTGGCTGGAGCAAATAGAGGTCACCAAATCAGCTTTACAGCAGAAAATGCTGGACATTGAGAACGAGAAGGACCTGTTCAGTAAACAGAAGGGGTATTTGGATGAAGAGCTGGACTATAGGAAACAGTCAATGGATCAAGCACATAAGAGGATCCTGGAGCTGGAGGCCATGCTGTTCGACGCGCTGCGGCAGGAGGCCGGGGCCAAGATGTCGGAGCTGCTGTCCGAGGAGGAGCGGGAGACGCTGCGGCGGGCCGTGGAGCAGTGGAAGCGGCAGGTGATGAGCGAGCTGCGAGAGAGGGACGCCCAGATCCTGCGGGAGAGGATGGAGCTGGTCCATCATGCACAGCAGGTTACATCACTGAGATGGCAATCAAGCGGACACCATTGCTTGGAGGGAAAAATGAACACATTTTTGTTACACAGTGCAGTTACACAAATGTTAATGTATTGCAACCTCCTTGTTAGGTTACAAGTTATATGCTGTTTCCCAGCTGAAATGTGTTCAAATATTTACTCACTCTGAACTGAATTCAATAAGGTAGCTGCAAATCACCACCCCCTAGACTGAGATAGAGTGTAGAGCACTCGTGATATATTTGCTGATATTTATGACTCATTTCAGTAGTA
>XM_041210960.1 PREDICTED: Carcharodon carcharias tbl1x receptor 1a (tbl1xr1a), transcript variant X1, mRNA 
GGGGGGGAAGGGAAGGAACAACAAGAGGAGGCCGCCCAGCAGCCAGGCGGAGGAGGCCAAGTGTGTGCAGATCCCGGTTCTGCAGTGTTGTTAAGTACTGACATCATTACACCCTTTGCTGGACCTGAGATTTCGCACAGTCAGTGTTTGAAGCTACTATACCACATGCCCAGTGATCTAAGGTGACGTGATACAACCATCCTTAATTGGTCCTGAGGGTTCAAAATGTGTTAATAGCCTATTCATGAAAGGCTTACCCTGTAATGACCTCATGGTTTAAGTGGGACTGAAGATGAGTATTAGCAGTGATGAGGTCAACTTTCTGGTATATAGATATTTACAGGAGTCTGGTTTTTCCCATTCAGCGTTCACATTTGGTATAGAGAGTCACATCAGTCAGTCCAATATTAATGGTGCCCTGGTGCCACCAGCAGCTCTCATCTCGATCATACAGAAAGGTTTGCAGTATGTGGAGGCTGAAGTCAGTATCAATGAGGATGGCACACTATTTGATGGGAGGCCCATTGAGTCCCTTTCTTTAATTGACGCTGTAATGCCTGACGTGGTGCAGACAAGACAACAAGCTTATAGAGACAAGTTGCAGCAACAACAAGCAGCAGCAGCTGCTGCTGCTGCTGCAGTTAGTCAACAAGGGTCTACAAAGAATGGGGAGAATACTGCAAATGGAGAGGAGAATGGCGGACACGCAGTTACGAATAATCATACAGATATGATGGAAGTTGATGTAGATGTGGATATTCCATCCAATAAAGCTATGGTATTGCGTGGCCATGAATCAGAGGTTTTCATATGTGCCTGGAATCCAGTCAGTGACCTCTTGGCATCTGGATCGGGAGACTCAACAGCACGGATATGGAATCTTAGTGAAAATAGTAGTGGTGGCCCCACCCAGCTAGTACTTAGACACTGCATAAGGGAAGGAGGACAAGATGTACCAAGCAACAAAGATGTTACATCTTTAGACTGGAATAGTGAAGGCACACTTCTAGCAACAGGTTCGTATGATGGATTTGCAAGAATATGGACAAAAGATGGTAACCTTGCTAGTACGTTGGGTCAACATAAAGGACCGATATTTGCATTAAAATGGAACAAGAAAGGAAATTTTATCCTTAGTGCAGGAGTGGACAAGACAACAATTATTTGGGACGCGCATACCGGAGAGGCCAAACAGCAGTTCCCTTTCCACTCTGCTCCAGCACTAGATGTTGACTGGCAAAGCAACAACACGTTTGCCTCTTGCAGCACAGACATGTGCATCCATGTGTGTAAACTAGGTGCAGATAGGCCCATCAAGACATTCCAGGGACATACGAACGAAGTGAATGCAATCAAGTGGGATCCAACTGGGAATCTACTCGCATCTTGTTCCGATGACATGACCCTAAAGATCTGGAGCATGAAACAAGATACATGTGTTCATGATTTACAAGCGCACAACAAAGAAATCTATACCATCAAGTGGAGTCCAACAGGACCTGGTACTAACAATCCAACCGCCAATCTTATGTTAGCAAGTGCATCATTTGATTCTACTGTACGACTATGGGATGTGGACCGAGGTATCTGTATCCACACTTTGACCAAACACCAGGAACCTGTATACAGTGTAGCGTTCAGCCCAGATGGCAGGTACCTGGCTAGCGGCTCTTTTGACAAGTGTGTTCACATCTGGAATACTCAGACAGGTGCTCTTGTCCATAGCTACAGGGGAACAGGAGGAATCTTTGAAGTGTGTTGGAATGCAGCTGGGGATAAAGTGGGTGCAAGTGCATCAGATGGTTCAGTTTGTGTGTTAGACCTCCGGAAATAGCGCTGCTAGCTGGAAGCCATGGACCGACAATGAATGTGTACATAGCCAAAACGACTGTCCCTGCCCCATGCACTGCTACAGTCTCACTTGAACCATGGCCAGTCCACTACAGCCAAAACAAGTCAGAATGCAAAACCCAGGACAACTGAGCCCTGATGTGAAGAGTACCCTGACTGCTTAATGCTGGAAGCTCCACCCACAAAGAAAAGTCAACCTTTCTTGAAGGTTTAAAACAACTTGAAATAAGACTTGACATGAGACCATATGTGTACCAAAATGGAAAGATAATATCAGAGGACAAAAATATCTTTTATTTTTTTGGTCCAGAGTCTATGTAGAATGAGTTATCTTGTCAGCAGTTCAGCAGATCTGTGTGCAGACATATCAGCTTCTTTCAATCAGCAGCAAATAGTTTGTTCCCTTGTTTTAAACATTGTTTTATCACTTTAGTTTACAGTTGCATGATGTAGGAGAGTGACTGTATCTTGTTTATCTTGTTTTTTTTCCTACTGACACTTAACACACAACTAGAAAAAAACTTTTTTATGGATACTATAAGCAAAATAACAGTGTATTTGGTATGTTTTTGGTACATTTTGTGGCTCAACAAACTAATATGTGGGGAAACATGAAACCGCTCCAAAATTCAACATAAAATTAGTTTCATTATACATCAGTCATAGGTAACAAGCTGTGGTTTACAGGTGATGTGGCTAAAATGTAGTAGTTTCTTAATGGGGACATGATTCTGCCGATTTATGAGAATTAAACAAATGGGCACAAAGAAAGAGAATCGATGCAGGGATGCATCCCATTGCTTTAAGACCATAGTTTGCATATGGTTGGATTGTGCACTATTGATAGAGCAGCTTATAGAATTTTGAAAGATAACTTTTCTGGACAGAGAATTATTACTGTTACTCTACTTATTCTTTGGTAGACCTACAGGCATAAATTTCACAGCAAGGTTCCAGTATTAAGGACTGATGTCTCGTAAGCAATGTTTTTAAAAACCTATCCAGTGCAATGAGATAAACCTCCCTCCCCCTCCCTCTGCCATTGGGCAGAAATCATGCAGGCATATGTTTTATGTTAATGCTAAGATAAGGGTTGACTTTGCTTTAATTTTCTTTCCTTGGTGCTCGTGTATTACACATGGGTTCATCTTGGCTCAGCCCTCTAAAGTACTTGCACTTGCTGTATTGTTCAGTAAAGTACAGGTAGTATAATTGCAATAGCTTTTTTTAGAATAAAAGTATATTCTATAAAGTATAGCATATCTGAGCTTTTAAACCTCAGGGGACCCTTCTTCAGATGATGAAGTGGTTAAACAAATATTTCTGCTACAAGATGCTCAATTACTTTTTCACACGAAGAAATGACGTTTGAGGTTTCAAATCCTTAGATTTAATGCATTGTAAAATGTTAGTCTAAAAAAGGTATTCTTCTATTTCCCATATCCCATGCAACAACAGATCAATGAAATGAAGTTACTGTTGCAAAGGCTTTATACCACCACTTCAAACTTGATCTGTTTTCCAACTCATTAAAAATGCAAGGTTAGTTGCTTTTTTGTTTAAATAGAAACATGAGTAAGAATAATTTCTGCACAAATGTTGGATTTTTTGTCCTTGGAGTAAAGTCTGTTGTTAATCTGAATCTAATCTAATCATTTAGAACTGATTATAGGTAACGTGGTATAATCAAATAGCTGCTATTCCAGATATTCCAGTGTCTGCATCACTGAAGTTGACCAACAAGTTCAGAACAGCTCCTAGATGTTCATTATGGGCTATTTGTCAAGTAGAGTAACAGTTATTAGGCAGCTTTATCACATTTCTAAGAAAAAAAACCATTGGTTATGTTATTTACTAGCCTTTTGTTAAATTGCGTCATATTAAGGTGATGAATGAGATTGGTTTTATCATTCTTCCAAGCTCTGCCCTTTGCAAGTTTGTTGCGAAGTCCAAGTTAAATTAAAAACCCTTGCATTCCCCTCCAATTAAAAAGGACTCATAAAGCATCTGCTACTATATGTTGACCTAAAGAACTAATGCTTGGAAAGGTGAGCCCTAGCCAGTTTTTAAATGAGCAGTTAAAACTTTTCATTTAAATCTTTTAAAAAGTATACATCGATGGCACAACATTTGAGAGCTCACAAATACAGTGGTAAATTTTTAAGAAGCAATTTTTTAAAAAATGAAAACAAGATATAAGTAGCTTTCCAACTGCTGTTTTTTGACCCTGCCAAGGGTAGAGGTGTAAGAGCAATTTTGATTACCTAATTTAATTATCTAACTTCACATTTTGGATTGGAAAATTAAAAAAAAGTTGGCAGTTACCTACACTGGACTTAAGTGACAGTCCAAAAATGGGGTAGCAGTAGAGCCTCTCACCTGAAGGTGAAGATTTATTTGAATGGGAATTTACAGCAGCCAGATATTGTATGGATGGCAACACTTACTTTTCAAAAATAGGTCTGTTCTTACCAATTGTTCTAAGGGCATCCATACTTTAATGATCTGAGGCTCTTATTCACATCTGCTAGAACTTTGGGAAACTCATAACAGCAAGATCATCACAATAAATTATACACACAACATTGTTTGAACTAACTAAAGTCAGACATTATTACACATAACACATTGAGCAAATGCATAACCATTTCCAATAATATGAATTAAAAGCTGCTTCCCTTGCTCAAGTCAATATTGATTGAAGACTCTGATAAAACTGTTGCTCATTTGTTCCATTGCAAGTGCTGTTTTAGGAAGGGCTGCAAATGAAACTAGATAGTTGAAGCAAGTGAAGTATTTAGGTTGGTGAAGACAGCATTAGGTGCATTCAGTGCTCAAGAATGAATAGCATAAAAGGATGATTTCAGGGGCTAGCATTACAGCTCTAGCACTGGATTTACATGTCTGCATCATTTCTACAGTTCTCACAAATTAAGATTTTAAAAATTGTGAACCTGTAAACCAGGCCATGAAAGTTTTTTTCTACTCTTTGAACTCTTTATTGTTCTGTTTTTATTTGTACCTGTTAAAAAGACTGATTTTTGATGTACCATACTGTCCTGGACCATGTAAATATCACCTGATAATGTATTTAGGTTCCACATTACATTAATAATTTTCCCTTTTCCACTCTCCCAACCCTCCTTCCACCACCTCACCTTACAAGTATCACCACCAAGGCACATCTTCTGTTGCAGCTTCCCTTTGCATCGTATTGATCTGACAACCATAATTTGCATCAGATCTGAAAGAGGTCCAGAATAAAATATATTTTGATATTA
>XR_005699604.1 PREDICTED: Hirundo rustica beta 3-glucosyltransferase (B3GLCT), transcript variant X7, misc_RNA 
GGGGAGGATCATGATGGAGGAGGAACCTTGGGGAGCATGAAGGAGGGTCTCATGAAGCAGGATTTCTGGGGAGAGAATCACTGCTGTGAGCTTTTGCTGTAACTGTAATTTCTGAAGGTGCAGAAGATGAGACTGAACTACCAGTGCTGCAGAAGCCTGGAAAAAGTAATACAATTAGTAAAATAGGCAGAGAATTAAAAGGAATTGTATTTGTCATCCAGAGTCAAAGTAATTCTTTTCATTCCAAGAGAGCAGAAGATCTAAAAAGAGATATTTTGAAACAGGCTGTAGATCTTGGAAAGGAATTGCCTACAGTTCTACTTATTCATCAGATCGACAGGCATGAAGGTGCATGGACAATATTGCCGTTAATGACAGACTTCTCTGTTACCTATGGTAGGAACACCTCATGGATTTTCTTCTGTGAAGAAGATACAAGAATACAAGTAGTAAAACTGCTAGAAACACTCAGAAGATTTGACAAGTCTAAGGAGTGGTTTTTAGGTAAAGCATTATATGATGAAGAATCTACAATAATTCACCATTATGCCTTTGCTGAAAATCCTACAGTCTTTAAATTTCCAGATTTTGCTGCTGGTTGGGCACTTAGCATTCCACTTGTTAACAAGCTTGCAAAGAAGCTGAAGAGTGAACCACTCAAATCAGACTTCACAATAGATTTAAAGCATGAGATTGCCCTGTACATTTGGCAGAAAGGGGAAGGACCACATCTTACTCCAGTGCCTGAGTTCTGTACAGATGATGTGAATTTGTATAAGGTTGATCACTGTGCAACAACATTCAGTAATTTTCTGCCACTTTGTGGAGAGCCAGTGAATAAGGAAGATGTTTTTGTTGCTGTAAAAACGTGTCGAAAATTTCATGGTGACAGAACTTCCAGTGTTGTGCAATAGAGGATAATCTTACTCCAGATTTTGAAAGATTAATGGATGGCAGCTTCAGAGAGCTCTTTTTACCTGTACCAGTTGTAAAGCAGACTTGGGAGAGAGAAGCCGCCCTTATTGAATACTACAGTGATTATGCAGACATCTCCATTCCTACTATAGACTTAGGCATCCCTAACACTGACAGAGGTCACTGTGGCAAAACTTTTGCCATTTTGGAAAGGTTTTTGAATCATACTTCTGCCAGAACACCTTGGTTAGTTGTAGTGGATGATGACACACTGATAAGTATATTCAGACTCCGACAATTGCTCAGCTGCTATGACCCAAACGAACCAGTTTTCCTTGGAGAGCGTTACGGCTATGGCTTGGGAACAGGAGGATACAGCTATATCACTGGTGGAGGAGGGATGGTTTTCAGCAGAACAGCTGTTCAGAAACTACTTGCTAGCAAATGCCGGTGTTACAGCACGGATGCACCCGATGATATGGTCCTTGGGATGTGTTTCAGTGGCTTGGGAATCCCTATAACACACAGTCCACTTTTTCATCAGGCGAGGCCAATGGACTACCCAAAAGACTACCTTTCTCACCAAATTCCAATATCATTTCACAAGCATTGGAATATCGATCCAGTGAAGGTGTATTTCACATGGCTGGCACCAAACACAAAAGAGTCACATAACGACAAAAAAGTTGGATACAGCAGAGAGGATTTATAAGCAGTAGAAGAATGTAAGTGTTAATTACGATTTTACAGCTGAGAGACAGACACTACTGACAATTTTGTTTTCACATTGTTCCTCTGTTCATGACATAAAAAGACAGTGTTTTGTTCCTGTTGGTGGAATCCCTTCAGAGCAACGGAAGAAGGCACTTAATGACTTTTGGATTCTTTTCCTCTGCTTGGTTTCTTTTTAGAATGCTTTTGGGTTTTGTATACCAATGAACTTGACTCACATTTAAGAGTCTTGTACAACCTCACCTGTGTTCTGCTTTGGACTTGGTTCAAAAAGCATCGCTCTCTCAAAAGCTGAATTTATGCATTTGGGAGCTTAATACTGAATAAGTGTAGAACATCTATTAAACATCATCTCTCACTGACTTACAGAAAGTAGTTCTCTAAGAGGCTCTAGAACAGGTTCTTGATAAATCAGAGGACACTTGACTTTTTTTCCGCGTCCAGGAGCTAGATTGTCGGAAGGCTGTGCTCCTTTATGCTCATTTCAGATAGAAATACTGTAGTTTCCTGGAGTAGCAGGACCAGGCATGAAACCACTGTTGTACCTTTTAAGTTTGTTGGCATTTGTGTGGAATGTCGTGTACAAAATGGAAAAAAAGGTTAAGGACGGGGATTTCTTAGGTGGCCACGGGAGGTCACTGTGGCTCCTTCAGAAACCGGAGTCGGTGTACATCAATTTGGCAAATATAAAAGTGACTCTTAAGGATTTTGGAGAACTAACATTTCAGTATTTCTGATGTGTGCATTTCAATAGCATATGAATGCCAGCTTTAAAAAGTTTTGTAGTATCCCTAATTTGTATCATCAAAATAAGTAAATTGATGCCTACAGCATGTGAAGTGTGATTCTTATTTAAAACGTTCTTGAATTTTTTTTTAGTAATTCAGTTTTGTAAAAATGTTTGTACAAAACCTGGCTTTTAGTATGTTCTAAACTAATTTTTATATTGTAAAACTACTTCTTTTAAAATGATGTTGTATGGCACTTGTATGCTGTTATTTAACTTGGCTTGCTATATTGTAACCAAATACAGGGTCTTAAAGCCATACTGCTGAATTAATTTGTGTTTTGGTTTCTTTCAGTAGGTTAAAAATTGATTCCACTCCAAAGAAAAGCAATATTTCCTCTAGAGTTGAAGTAGGGGGAGCCACTGATTCCTGTCTCTGTAATTACCAAACTTGTATAAACATTTGTTTGCAAATGTAGCTTGTGGGTTTCTAAGCATTGAATAGCAAGCACATATTCATAATAGATTCAAATTCTGATTAATCAAGAGCAATCCATGTTATGTCTCTTTTCTTCCCACTACCAGTGCCTTAAACAGTAGACATTTTACTGATACCAGGACTATGTTCTCTGACACCATTGGTGAACTGTTAATTATGTTTACTGTTTAGAACTGTGAAAGCTGAATAAAAGCCTTCTTTAACCTGT
>XM_020777834.1 PREDICTED: Pogona vitticeps XK related 6 (XKR6), mRNA 
ATCCGAACCATGTACCTGGGGATCCAGAGCCAGAGACAAAAGGAACACCAGCGGCGCTTTTACTGGGCTATGATGTACGAATATGCAGACGTCAACATGCTGCGTCTCTTGGAAACTTTCCTCGAGAGCGCCCCCCAATTGGTGCTACAGCTCTGCATAATGATCCAAAAGAACCGTGCAGAAACCTTACCTTGTGTGTCCTCTGTGGCCTCCCTGATGTCCCTGGCTTGGGTGCTAGCGTCCTATCACAAGCTCCTTCGGGACTCTAGGGATGACAAGAAGAGCATGAGCTACAGAGGGGCCCTTATCCATCTCTTCTGGCGCCTCTTCACCATCTCATCCAGAGTTATCTCTTTTGCCCTCTTTGCTTCCATCTTCCAGCTCTACTTTGGGATTTTTGTCGTGGTCCACTGGTGCGCCATGGCCTTCTGGATCATTCATGGCGGGACGGACTTCTGCATGTCCAAATGGGAGGAGATCCTCTTCAACATGGTGGTAGGGATCGTGTACATCTTCTGCTGGTTTAATGTCAAGGAAGGCAGGACCCGATACCGAATGTTTGCCTATTACACCGTAGTCTTGACAGAGAACGCGGCCTTGACTCTCCTCTGGTATTTTTACAGAGATCCCGACACCACTGACTCCTACGCTGTGCCAGCACTTTGTTGCGTCTTTCTTAGCTTCGCCGCCGGGATCGCGCTGATGCTCTTGTATTACGGCATCCTGCATCCCATGGGCCCGAGAGCTAAGATTTTTGCCAGCTCCTGTTGCGCCGAATTGCTCTGGGGCATACCTTTGCCCCCTGACGTTGAACCTATGGATCCTCAAACGCCCGGGTACAGGGCGGACCAAGTAACGCCCACCAGAGTGGTCACGGAGCAACAGGAGGAACTTACTGCTGACACTTGCTTGCCCGTTTTCCAAGTGAGGGCCATGGTGCCATCGACTCCGTTGGGGAGACCTTACCACCCAGAAGGCCCTCTCATTAAAATAGACATCCCAAGAAAGAGGTACCCGGCTTGGGATGCCCATTTTGTAGACAGGAGGTTGAGAAGGACTATAAACATTCTCCAGTACGTCACCCCCACTGCTGTAGGAATTAGATATAGAGACGGACCTCTCTTGTACGAATTGCTACAGTACGAATCTTCACTTTAAAAGCTCCTTTAAACACAAACCCACATACACAGGAAACAAACACACACACATACACACACACACACACACAAAACTCAACACACGGTCACAGGCAAACAAGCAGCAACAACAAAAAAATTAAGAGAGGGGATTTGGGGTGGGGGGTG
>XM_018564101.1 PREDICTED: Nanorana parkeri transmembrane protein 72 (TMEM72), mRNA 
CTGGAGTCATGGAATGTACTGAGGAGGTGAGAACAGCAGCATTAACTGGATGTTTGTGGACAGAGCCTGTTGCTTCACGGTCACATACACTTTGGGATTCTTGTTTTCAAAACACTCAGAAGCACAGCTTTCCACCGCGTGAAAGCTTGTGATGTCTGTGATGCTGAAGGTGGTGTCAGTACAGTGTCATTAGCCAGTAGTTACAATGCAGTGCCAGGCAAGCTGGGTGGTATTAGAAGGCATCTGTAGATTCCTGGGGGTGTGTACAGCTGCAGTGCTAATTGGTGTTGGGATTGAAACTCTGCAAAAGGGACAATTTCCAAGTCTGGCCTATTATTTACTGTTTTCATCAGCAGCCGTGTCATTCTGTGAAGGTGTTTTCTTCATACACATGTTTCTCATGCACTGTATAAGATGGCAGTCAGAACCCCGTCTGTATGTATGCTTACGGAAAACAGCACGAATGGGAGGATTTCAGAAGTTCCTTGGGTATGGCATACTGTCAGTGGCCTGCTTCCTTCACCCAGTACTGGTCTGGCATGTCACAATTCCAGGAACCATGTTAATTGTTACTGGGATTGCCTATCTTTTTTTGAGTAAACGAAAGAAGACTAAGAGCAAGGATTGCGTTTTGCAGGCTGAATATTACACAGACCCATCTACCACAGCCATTGCTATGACCAGAGCTGGAGACACAGAGCAAACTTACACTTTCAATGACTCCCTGCGCCAGAAGAGAGAATCTCTACTCACCCATATGAGAAGCATCCTCAAAGTAAAGAAGGACCGCCAACCATCTAAGAAAGACCAAGGTCGCATGGATGCTTCTATAGACTTATGTGCTAAAAAGAAACAGGTTCACTTTGAGGAAAAGGTTATTAAAATCATCCCCTTGGAGGAAGGCATTCTTGAAGACCAGGACAGTGAGTTGGAGGTGACAATTTCAGATACTATTCCCATCATACCCAGTGAGCCCAAACAGGTTTTGAACACCACACCCATGACATCTGGCATTTTTTAAAGG
>XM_025751866.1 PREDICTED: Arachis hypogaea uncharacterized LOC112701064 (LOC112701064), mRNA 
ATGGCAGATTTTCTAGTAGAAGTAACGGGGAATCCGACCGAAGAAACAAGCACACGGTGGAAGCTCCACGTGGACGGAGCCTCCAACCAGACGTCCGGGGGTGCCGGGATCATCCTGGAAAGCCCGGTTGGAGTCGTATACGAGCAGTCGATCAGGTTCAAATTCCCCATTTCAAACAACCAGGCAGAATATGAAACCCTTATAGGGGGCTTAACCATAGCAGCGGAAGTCGGAGCAACAAGGCTGAAAATATGCAGCGATTCCCAGGTCGTCACCTCCCAGGTCACGGTCCACCACGTGCCAAGAGAAAGGAACACACGGGCAGACCTTCTATCAAAATTGGCCAGCACTAAACCGGGAGAAGGCAACCGATCTCTCATCCAAGGTATGATGAAGGAGCCGGCGGTCACCTTGCATTTGTCAAGGCTGGGCTCTTCATGGCTAGACCCCATCACCAGCTTCCTAGAAAATGGCAAACTCCCTGACAATGAAAAGGACTCCGTGAAACTGAGAAGGGAAGCAGCTAAATATGCAGTCATTCAAGGACAGCTATTCAAGAAAGGGTTCAACCAGCCCCTACTGAAGTGCTTACACCCCGACCAAACGGACTACGTCCTCAGGGAAGTCCATGAAGGCTGCTGCGGACACCACATAGGAGGCAAAGCCCTAGCAAGAAAATTAATTCGAGCCGGATACTATTGGCCGTCAATGATGGCAGACTCCAAGGAGTTCGTCAAAAAATGTGTCAAGTGTCAAGAGAACGCCAATTTCCACAGGGCGCCGGCCTCCGAGTTAAGCCTGTTAACGTCCTCCCGACCATTCTCCCAATGGGGAGTCAATCTCTTGGGGCCCTTCCCAGTGATAACGCGATTCGCGATTCCAGAAGTTGTCATCTCGGACAACGGCACACAGTTTACCGACAAGAAGTTCACGGAATTCCTCACCGGCCTAGGCATAAGACAGAAGTTCTCCTCGGTAGAGCACCCCCAAACAAACGGACAAGTGGAGTCCGCGAACAAGATTATCCTGATAGGGCTCAAGAAGCGATTGGATAATAAAAAGGGTGCTTGGGCCGACGAGCTAGCCTCGGTGCTCTGGTCTTATCGAACAACTGAACAGTCCTCCACCAAGGAAATTCCTTTCCGACTAACATACGGATTAGACGCGGTAATACCCGTGGAAATTGGGGAACCGAGCCCCCGGCTACTTTTGAAAGGAGTAGAGGAAGCCGTGGAGAAGGACCTAATAGATGAAGCCAGAGAAATGGCCCATTTGACGGAGACATCGCTAAAACAAAGAATGGCCCTACGCTACAACACCAAAGTGCTCAAAATAGAATTCGAGCCGAACGATCTCGTCCTAAGGCGTAACGACATCGGCCCACCGACCCCAGGAACAGGCAAGATGGCGGCAAACTGGGAAGGCCCCTATAGAATAAAAAAAGTGATGGGCAAAGGCGCTTTTAAGTTAGAAAGGCTCGATGGCAAGGAAGTCCCAAGAACATGGAACGCGAACAACTTGAGAAGATTCTACTCCTAG
>EU583709.1 Uncultured Tulasnellaceae isolate S2.12h internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
AACGTCTTGTAATAAATAACGTACAACTATCAACAACGGATCTCTTGGCATCCCACTCGATGAAGGACGCAGCGAATTGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTTGCACCTTTTGGTATTCCGAAAGGTATGCCCGGTTGAGTATTATGAACATCTCAATCCTCTGGCTTCTGATCGCAAAGGTCGCACGTTCGGCGAAGTCGTCTGTCGGGACGACGGTAGCTGAAGTGCGACTTGGAAGCCTGTTGGACTTGGACTTGAGCGACACGTCGGTCCTCCACGATCGACCCGCTTGAAATGTATTAGCTGGCGACCCGCCTTACGGTTCCACTCGGCGTAGTAAGTTCTATTCGTCGAGGACGCCTCTTTCGAGGTGGCCGAAAAGCGCGCGATTGAAGCCGCTTCCAGTCGTCTTTGGATGCTTTGAATCTTTAATCTCCACCC
>KC809930.1 Bacillus sp. EK-CH-I9 16S ribosomal RNA gene, partial sequence 
AGCGGACAGATGGGAGCTTGCTCCCTGAAGTCAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAATTCTTTCCCTCACATGAGGGAAAGCTGAAAGATGGTTTCGGCTATCACTTACAGATGGGCCCGCGGCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGANACNCGGCCCANACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCANCGCCGCGNGAGTGATGAAGGTTTTCGGATCGTAAAACTCTGTTGTTAGGGAAGAACAAGTACCGGAGTAACTGCCGGTACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCANCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTCCTTAAGTCTGATGTGAAAGCCCCCGGCTCANCCGGGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAANAGAAGAGTGGAATTCCACG
>XM_041467909.1 PREDICTED: Pyrgilauda ruficollis lysosomal associated membrane protein 3 (LAMP3), mRNA 
CTCGGCTCGCTCCGCAGCGGCTCCCGGGGAGAAGCAGAGCCCGCAGCCCGCTGGCCATGGGGAGGAGCGCACGGCAGCTCATCTCGCTGACCCTCGCCTGTGCATTTTCCTCCTGCTTTGCTGAAGTGGCCCTGGGGGTCGAACTGTCTCCAGAAACCACATCCTTCCACCAAATGGCTACTTCTGCTCAGCCACTTTCCCTTTATCATTCTTCACCCCATCAAAGCACTGCAGTTCATTTTACCAGCACAGGCTCTCTTCAAACAACACCCATGGGCCACAGAACAGCTGAGCAGACAACGGAGCAGCTCAAGACAACATCAGCCGCAGGCCAGCACACGGCAGCCCAGGCAGGAGCAGGCACTGTACCCACAGCCCCTGCAGACAGCCCCAGCCCCGGCCGGGCCACCACCCCGGCGATGCCCTCGCTTACAGCGGTGGTCAAGAACACAACCACTGCCCCTGTGTCCTCCACCAGGCATGGCAAGGGACCACGTGTGACCACAGGAACTGTGGCAGTGGCCACCAACACCTCCCTGAAGCACGAGACAGCGAGTACCCCGGGGGCAGCTGCCACCTCCGCCTCGGCAGCCCCCAGCACGCCGAGGGCCGGGCCCAGCACGCGGTCACGGAGACAAACAGCAGCCACTGGTGCTCCAACAGCCACGGCCGTGACCAACACAACAGGCACCCATGCAGGGACACAAACAGCCCCCACATCCCCTGCCAGCACAGTGAGACCCCGTCCCACCCCACAGCCCTCTGCCATCCCCACAGGCACCTACACCGTTTCTGATGGCAACAGGACCTGCGTCAAAGCCGTCATGGGTCTGCAGCTGATGGCCCGAAATACCCAACAGGAGCAGATGGAATATGTGACTGTTAACCCAAATGCGACAAAGATATCTGGAAGCTGTGGGATGGTGCAGTCTGAGCTGAACTTAACTTTTAGTGGAGGATTTGTAAACATCAACTTTGTAAAGCAAGCTCCAAGTTACTCTGTGACTAAAATTGAGAGCAGAATACTGTTATCTTCTGAAGGTATGCTTTACTATGCAGCCCTAAATGAGAAGCTGTTCACAACAAAGCTGGGGAATTCCTTTAAGTGTGCCAGCAGGCAAACCTTCCCCTTGGAGAAGAACTTCCAGATCCTCTTTGTTCATATGCAGCTGCAGGCGTTTGACATTGTGGGTAACCAGTTTGGAAAAGAAGAAGAATGTTTTCTTGATAGAAACGGCAGAGTAGCTCCCATTGCAGTGTGCCTGTGTATCCTGGGATTGTTTGTCATTGTGTTTGCCACCTTCCTGATCTCCAGGAGGAAGCCACAGAGAGGATATGAACGCATCTGAGGTGCCCCTATGCTTCCAAGTGTGTGCAGCAAGCAGAGAAGTCACAGGAGTTTTTGCTTCTGCCTGGCAATCTCTCTGCCCTGAAGCCACATTTTTAAGTGAGATGACACTGTGTGTTTACAGCTAATGAATGTTTCTGGAAGGAGTTCTTTTAAGGTGGGAAGGAGAGAACTCACACCTTCTGCTTTAAGCTATTCTTAGCATCTAATTTAGATGTAGTCCAGAATGAGGAGCCTAAATTCTCTCTGTTGTCAACAAAGGAGGTCATTCAGATCACTTAAGCCAGATTCCTAAAAATAGCTTAAAGCAAGCAGTATCACTATCTCCCAGAAAATGCATCAGGTTTGTTAATGATGGTGTTCAGATTTATCAAAAGACATAAGTCTGACCTTCAGGTGAAAAAACCTCAGGCCCACAGCTACAGACAACCCTGCTAAGTGAGAGCTCACTGAAAGCTTTT
>XM_023176141.1 PREDICTED: Drosophila willistoni uncharacterized LOC6643128 (LOC6643128), transcript variant X4, mRNA 
TTCATTCACTATGTCCAAGGGACTTTTGGGCCTTTGGCTTCTGCTGGCAGTGCTAAATAGGCTACAGTGTTCGAATGCTTATCAATCTGGTGGCAGCTATTATGATGCTGGCCAGTCCGGGTTATCAGCATCAACGCAATCATCTTATGGCGGCAGTGCCAGAATTCAAGAGCAGCCCATCTATGAGCGCGAATCGGCTTGTCCAGCGGGTTTTACGGGTCTAAAGCCATATCCTCATGATTGCCATCGATTCGTCAATTGTTTCAATGGACGTCCAACCATTCAGACCTGTGCACCGGGCACTCTATTCGACGCCAGAAACTTGCAATGTGATTCACCCAGCAAGGTATCCTGTAACGGAGACATTGCTGAAGCAGCTGCAGCAGCAGTGAATTCCAATCAATCCAGTCGTTCGGCTCGTTTGAGACAAATCAACACTGAACCCAAGTGTCCAGCTGGTGTTAATGGATTGCATCCGCATCCTTTTGATTGCACCAAGTTCCTCAATTGTGCCAATGGTCAAACTTTTGTGCAGAGTTGCGGACCAGGCACAGCATTTAGTGCATCTCTTCTGATCTGTGACTACAAGAACAAGGTGGATTGTGGAGCTGGTATCAGTGGTGGTGTTGCTGCATCAGAGGCCTACGAGAGTCGTCAATCGAAAGCCTACAATGAAGGCAGGGGGGAAAGTGCCGGTGGTAATCGTTGGAGCTCCATGAATATGCAGCGTCCAGCTGGCATTGGCTTCACAAATTACCATCAGCAGCAGCAGCAGCAGCAGGTTGGACAAGTGAATCAGCAATATGGCGGCGAAGCAGGAGGCTGGTCTGGTCATGGCACCTCTTTTACCCATCGTATACCCACACAGAGTGTGCTCTATGTGGAAGGATCCCTACAGCCGAATCGTAATTATCCCAGTTATAAGACTCCATTGGCACCCATGGCTCCTGCCTCTACAGATCATGTGTATTACGCTAATCCAGTTGTGGAAGAGGTCGAAGAGGAGGAGGAGGATCAGCAGCAGCAGCACCATAACCACCACCACCACCAACAACCACAACCACATCAGTCACACTACTCACCCAATAGTTTGTCACGTCAAGACTTTAGTAGAGATTTGGTTGGAGCTGGCCAACAATATCCCAATCATGACTTGCCACCATTGGCTCCTTTAGGCGGACAGCAACCTCTTGATTTAGATTATACACCAGATGCTGGACAGCAATCAGTTGACCTAGACCAAAATCTCACGCCACACAGTCCATCACATGACCAGTTTCCCAGTGAAACACATCAGGAACCTGTAGATTTATATGACCCGCCCGTTAAGGGTTTCCCTACGCCATCCTCTCCGTTGCCTCACCAACCAGTTATAGACGAGTCAAATTTGTATGGAGGCTTGCAACCTCCACCACCACCAGCACCAACTCCAGCAGCACAACCTTCTACCCCATCCACAACACGTTTGCCTACAAATCTTCGTACATTTCCCATCTATCCACCCATGGCCAATGTTAGCTCACCGAAAGAGGTCAGGCCACCACATTATAGTCCTGGCTATGCAGCTGTAGCTCATTCCCATAATACATCTTGGCAAAAGATTCCGCCGCCAACTACTACACCAAAAGCTCATGATCCTTTCATTCCTTCCGAGGATATCGATGATAATTTGGATGAGTTTGGAGAGAGCACAACTAAGAGGCATGATCTTAGTCCGCCTCCTTTTGATCATAAATTTTACAATCCCACATTAAATTCTAGAGCTGCTAAAGCAGATTCCAATTCCGATCCTTCAAATGATCAACGGATTTTCGGTGAGGCTTTGCGTCTAATGCTGCGTCCCTATTTCAATCACAGTGGCAATGCCCCGGAGATTTTAGCCAAACAAACTGAATCAGCCATAGCTACGGTGATAAGCAAGCCACCTACCTCTAGAACTATTGCATCCACATCCACAACAACCACTCCCAGAAATTCCATACGACCCGACGATGATGTTGAACTCATTGTGGCCGGCGAGCAGGAAAGCCTGGACATTGAAACGAACGAATCTGACAGCGACTCTGACTCTGTTGTTCCAGATGCTGAGGAAACGACACACACTGAGCAGACCATAAATCCTACAACCTATGCTTTTGGTGATACACAAAATGATTTTCATCGTGGCACACGCAAGGTGGACATCGATTCAATGACGACCACAACCACCACATCCAGCACAACTACCGCCACAAACAACAAAAACAACAACAACAACAATTGGCATACGCCGCACAATCGTGATTTTCATAGGCGTCATCCAAATTTGCCCGATCCATTTGAGAAGCCGCATTCTCACCATCAGCATCAGCACCACAACAATCACCATTACCATAGTCCCCTCTATCATAGCCAGCATCCCGAATTGCTCAATCCCTTTCGGCAAAATCCCGAACAGAATAGTCCTGACACGACGACTCCTGACATAGTTCATCATCAGCATCATCACCCCGATCAACGTTTGCCCAAATCTTTTGACTCGCCAAAAGATCAAGATGAGGATGAGGATGAGGAATATCTACCCAATCCTAACGCTGAGGAAACAACACCTAAATCTCAATATCAGATATCCATGCGTAGTAATTTCCAGGATAATGACTGCGAATTCGATTGCGGCAATGGCAAGTGCATTAAACAAAAGGAAGTGTGCAACGGAGTGAATAACTGTGGCCCGAATCGCCGGGACGAGAGCCAGTGTCAACATTTGGGCTATCAGGTGCGGTTAACTGGCGGCGAGAACTCTCACATGGGACGCGTTGAAGTTAAGGTCAACGGTCAATGGGGTTACGTGTGTGATGACAAGTTTGGTTTACGGGATGCCGATGTTGTTTGCCGCGAATTGGGCTATAAAATGGGCGCACAAGAAGTGCGTGGCAATTCGTATTATGCCCCACCTGATCGCAACTTCAACTATATGATGGACAAAGTGGAGTGCCAGGGTAATGAGACAATGCTCAAGGATTGCCAATTCAAGGGCTGGGGCATTCACAATTGCGGTGTCGATGAAGTCGTAGGAGTAGTCTGCAAAGTTCCCGTGCTCAAGTGCCCGAACAACTATTGGCTGTGTCACACCTCTAAGGAATGCATCCCACCAGCCTTTGTATGCGATCATACAGAGGATTGTGCCGATAAATCGGACGAGAGTGAAGCAGTTTGTAAGGCTCCCATTGAGTATCGTTTGGAGGGTGGACGCAATCCAAGTGAAGGTCGCCTGGAGGTGAAGTACCATGGTGTCTGGGGTAGTGTTTGTGATGACGATTTCAGTGCAAAGTCAGCGCAAATTGCCTGCAATTCTTTGGGATACTATGGATCAGCCAAAATCGAGAAAAATATCTTTGGTCCTGCAAGTGGACCCATTTGGCTGGATGAGGTCATGTGTCATGGCAATGAAAGTAGCATCGATAAATGCAGTCACTGGAATTGGGGCGAACATAATTGCAATCATACTGAAGATGTAAGTTTACGTTGTACAGCTGGGCCACCACCAACCCGGCAGCAGCGTCAGCAGAGTGTTCGCCTTCACTCAGTGGGTGGTGGCAGCCACAACATCAAGGGAAGCCCATCCGGGCAAATTAGTCATCCCGCCTTTACTTTATCGGACATTGGACTGTGGGAACGTTCCAGCAAGGCTCTACATACGCCACGCCGTTGCGGCATCTTCAAAGATGATCTAACCGATGAGTATGCCCATCCTGAGGAGCGTGTGATTAAGGGTAATATAGCGCGTCGCGGCCGACATCCTTGGCAGGCCACCATACGTACCCGTGGTCGTGGCGGCATCTCAAGTCATTGGTGCGGCGCTGTTGTCATCTCTAAGCGTCATCTTCTGACTGCTGCCCATTGCCTGTACGGTCATCCAAAGGGATCCTACTTTGTGCGTGTCGGTGATCATTATGCCAATATTGCTGAATCCTCTGAAGTGGATTCGTTCATTGAGAACTGGTATACACATGAGAAATTCCGCGATGGTTCACACATGAACAATGACATTGCAGTGATTGTGCTTAAAACTCCGCTTAAATTTAGTGACTATGTCCAGCCAATTTGCTTACCAGAAAAGAATGTGCCTCTTGGCGAGAATCGAACCTGCACCATATCAGGTTGGGGCTCCATTAAGTCCGGTTTGTCCACTCCATCCCAGATTCTTAGATCAGCTCAGTTGCCCATTTTATCTGATGCCACTTGCAAACGCTCAAATGTCTATGGCGATGCAATGACCGATGGAATGTTCTGTGCCGGCTCCATGGATGAGAGTGTAGACGCATGTGAGGGCGATTCTGGTGGTCCACTTGTCTGCTCTGATGAAGATGGCGAAACTCTATATGGCATTATATCATGGGGACAGCATTGCGGTTATCAGAATAGACCGGGAGTTTATGTACGGGTTTGTCACTATATTGACTGGATCTATGAGAAAATCAATCACAGCTTGACGAAATTCTAAAAATCACATTTCGGATTTTTCAAAAAACATTTAGAATTTAGGACTATGAACAAGAATAAAGTCAATTTGCTTAAAATATA
>XM_044890485.1 PREDICTED: Coccinella septempunctata spastin (LOC123307970), transcript variant X2, mRNA 
CCAGAAGAGGTCCTGTTACAAGTGTTCTGTGCTTGTTACTCTTTGGTCCTACGCTGACATAACACGTCGTTTTCCATTATTTTTTTAAGGATGAATACGAGTTCAATAAACTGAACATTGACTTAAAATGTATATTTGAATTTAGCTCCTTAATGGTTCGAAAAACACAAAGTGGAAAATCCCCTAAAAAATCTAGAAAAGTTGACCCTGAATCAGATAAAGATGTTATGTATATGACTTATGGGGACTCGTCTGTTCATAAAAGGAATCTGTGTATTGTTTCGTTTCCCATTATTTTTCTTTTCAGTATATTGAGAGCATTATTGTACCAAATTTTCGTTATACTTCGATTTCTCTACTGTCGTTCGTCGAGCTATTTAATTAAGCCACGTAAATTGCAGAATGGAAATATAGAAAGTAGTTGTGCTATTGAAGAAATTCAAATGTCACATAATATACAAAAAAATTCAGGTCCTGGTCCAGGGGACCCTCTGCTAGCCAAGCAGAAACATCATCATAGAAGAGCATTTGAGTATATTTCTAGAGCCCTTAAAATAGATGAAGAAAATGAAGGTCAAAAAGAAACTGCCATCGAATTATATAAGAAAGGAATTACAGAACTCGAATTGGGTATTGCGGTACACTGCTGGGGAGGAAGAGGTGAAGTTTGGGAAAGGGCTCAAAGACTCCATGAAAAAATGAAAACTAATTTGTCCATGGCAAAAGATAGACTCCAATTTTTAGCATCTGGGAAGAAATTAACTGTAGCTACTAGAAGACCTGGTAATTCACCTTTGTCTAAAAGCCAGACATTGCCAAGATCAATGGGTTCCCGCACAACACCTGTACAGCCAGTTCGTCCTTTTAATAAGCCAACACAGACTCCACCTGCAATTAAGAAGCAGTTATCTGTTCCTGGAAGTGGATCTCCAGCCAGAAAATTCTTAGCTAGTCAAGGTACCAGTAAGCAAACTTGTCGAGGCAAGTCTCCATCTCAACTGAAAGGAGTAGATCCAAAATTGGCTCAAAGTATTTTGGATGAAATAGTGGAAGGAGGTCCAGCTGTTCAATGGGATGACATAGTGGGTCAAGAAACTGCCAAGCAAGCTCTTCAGGAAATGGTTATTTTACCCTCCCTTCGTCCAGAACTCTTTACAGGACTGAGAACACCCGCAAGGGGGTTACTTCTGTTTGGGCCCCCTGGAAATGGCAAGACTTTATTAGCAAGAGCGGTAGCAACAGAATGTCAAGCAACATTCTTCTCAATAAGTGCCGCAAGTTTAACATCAAAATATGTTGGTGATGGAGAAAAAATGGTTAGAGCGTTATTTGTTATTGCAAGGGAGTTGCAGCCTTCAATAATTTTCATTGATGAAGTTGATTCTTTGCTTTCTGAACGCACCAATAATGAACATGAAGCAAGCAGAAGGTTGAAAACAGAATTCCTTGTTGAGTTTGATGGATTACCATCTAACCAAGAAAGTGAGAAGGTTCTTGTGATGGCCGCAACTAATCGACCTCAAGAACTAGATGAAGCAGCTCTTCGTCGATTTCCCAAAAGGGTTTACGTTACACTACCTGACATGGAAACTAGAATGGAGCTATTAAGAAAATTATTGGCTAAACAAGGTTGTTCTTTTACTCAACAAGAGTTGAAAAGGTTGGCTACACTAACAGAAGGATACTCTGGAAGTGATCTCACTGCACTTGCTAAAGATGCTGCTCTGGGACCTATACGAGAATTGCAACCTGAACAAGTGAAACAGATGGATCCAAGTGCAGTCAGAAGTCTTACGATGAACGACTTCCTGGAATCTTTGAAGCGTATAAGAAAAAGTGTTTCACCTCATAGTTTAGTGGCTTATGAAAAATGGTCATTGCAGTATGGAGATGTCTCTATTTAGAAGTAATACTTTGGTACATTTCAAACTTGTCTTTTATATTATTTGGTCTTGTTTTTTATACTTTGTCTGTGATAATTGATGTAATTGTAAGTGTTTATCATTGCTGCCAAGGATGAGTTTTGAAGGTTATATGGTTTATTCGATACTAAATTATATTCATAGCGATACAACTATGCAAACTGGATATTTTATGTTTGTTAGCTTCTTTAACTATTGAAGCAATACTTGCTATTAATAATTGAATTTCATTACGCTTTTTATTGCTATTATGTAGACTTAGTATCATGGACATTAATATATTCACTTATAACTTACAAAA
>XM_040825979.1 Metarhizium album ARSEF 1941 uncharacterized protein (MAM_07181), partial mRNA 
ATGTCGCCACGGCCGGCCCGGACGGAACATCATTTAAACGTCGACAAGCCCAGCATCCGAGCTTCGCCTCTTCCGCTTCACACCAAACCCCTCTTCCAACGAGAGGTTCGAGCACAGCCCAGCATGGCACTCCCCAAAGTCCCGACCGCGACCGGCTTGCTGCGGCACAGCACACGCCCGGCGGCCTCGCGGGCCAGCCTGCCTCAGCTTCGACGCAAGGTGACACGAGGTGACGGCGATCTCGGCGGCCCGGGCGGACAGCAGCCCCCGCCGCCCAATCCAGGCGGTCCCGAAGCCGTCAAGAGAAACTGGGTGCCCATCGGCGGCGCGGCTCTCGCTGCTGTCGCAGCGTACGCGTATCTCACCACCCCCAAGGTGGATGTGGACAGGGCCAAGCAGACAGACGCCAGGAACCCGAGCCAGGCGGAATTGCGCGACCTGGCGGCCGGTAGCCAGGCGGCGGAGGAGGTTGTCCAGCAAGTTGCCGACCAGGCGACCAAGACGATGAAGGAGATGAGCGGCAGACGCAAGACGGACCAGGGCAGTTTCCGACACGATTGA
>XM_034374830.1 PREDICTED: Thrips palmi deubiquitinase DESI2 (LOC117639294), mRNA 
ACACACCGTACAGTGCAGTGCGTCTGCGCGCGCGCTCGAGGGGTGGTGTTGTGTTGAATGAATGTTGACCTGTGTCCAAAATCTTTTGTTGTCGTCAGCATTTTAACTTTTCGCTTTGTTCAAAGAACCGTTTAGGCTTTAGTTTAGGACTTTGGACATCTAAGCCTGTATCTGACTCTTCGTTTGTCGCATGTGTTATCAGCAGGGTTTTCAGCAAGAAGATGTCGTCAGAGCCAGTTATTCTCAATGTTTATGATATGTACTGGACCAATGAGTATACTACTCCTATAGGATTAGGAGTATTCCACTCTGGTATACAAATATATGGCATGGAATATGCTTACGGAGGCCATCCCTATACCTTTTCCGGTGTGTTTGCAATTGCTCCACGTGATGCAGAAGAATTAGGAGACCAATTCCAGTACAGGCAATCAGTTCATGTTGGGTACACAGACTTTACTGAAAAAGAAGTAAAAAAAATAATTCAAGAACTGGGAAAAGACTTCCGTGGGGATCGTTATCATCTTATGAATAAAAACTGTAATCATTTCTCTGGGGCATTAAGTCAGATTCTCTGTGGCCGCGACATTCCCTCATGGGTCAATAGACTGGCATACTTTAGTTCTTGTGTGCCTTTTCTTCAACGGTGCTTGCCGAGAGAATGGCTGACTCCGGCAGCCTTCCAGCAATATAGCACACCAAATGCCCTGCAGCACACACTTAGTGCACGTGATAACAGTCCTGATGGTCCTTCCTCATAACATGAGGCTGCTGGGGCGGATCATGAAACACATCCTCTCTATGAAGATGACACTCAGTCCGTCTCCCAGCTTCCCTTGCTGTACACCCATGATCAGCCAAGTTCATGGCTGGGCAACCCCAAAGAACCACTGCCGTCCAGCTCTAACGTCAGTGATGAAGATTGAATGTACTTCTGTGTTATGCTTAAGTGGGTAACAGGAATGTTCAACATATATTTCTGTGTTATATTAAGTGAAGATGTGATTGGGTTATGAAAAGAGTGCTTCCAGAGGAGTACAAGAAGCACAACATTAAAAACTTTCAAAAACTTGAATCAAAACTTTCCTGTAAGTCATTTGTATAGTATTAAGCCTGTTGTCTCACATTTTTATTCTATTTTCCTGTTTGGTTTGAATGTTTTTAAAGCTTGTGTGGGACTCCTTCGGAAAAAGTGTTTGTGCATGAAGTCTACTATGACCTGATTCCCTTTTTTCTCTGAACCCTGAAATATTATTGGTTAATGGTGAAGCAAGTATTTCCCTGCAAAAATAAAAATTACTTGTTATCTTGTTGTAAGAAATTCTGCACTCTTGTGCAGTTAAGTTTTAAGAAACGATCATTCATCTTATATGGCCCTGTTTTATCATACCTTTGTTGATAACTCCCCCTTTATTACATAACAAAACAATTTTCCTTATGGTTTCTTTCATAAAAAGTGATCAATTTTTTTTTTATAATGTTATACCATGGTGCTTTTTGAAACTGTTGGGAAGATATCTTTGGGATTTTTCCAGACTCTAGGTATCTGATGTCATCATAACTCTTGTTTGACATTCTGTAGAAATATTTCAATTGATGTATCAGCATGTTGTCACTATTTGTATTTGTCAGGAGATGTGTTAATGCTTACTACGTATGAAATTTAGTGTTGTTGAGTCTTTGCTGGCCGCTTTTTATGTGCCACTGTAAAATTATTGCCTTATCCTAGGAATTAAAATTTGCTCTTCAAATTTGACCTCAGATCTCAATTTTTCTTGCCACTTCCTTTTTTAAAAAATTCAAAGTTCACATTTACTATGTCAGTGATTCCTCCCTGTGAAGAGGAATGCTTTGGTTTGAGTCTGTAGTTCTCTCAAATATTTGTATGTATTTAAGTTATTCATGAATCATCATAGCGTGACAGGTGACATTTTGAGACAAGCATTACTGTAGACTCCTTTGAGAGAACCGACTGCTTTTTTATTATTCAATAATCTGAGTGCGAATGAAATAAACCTTGCCTCTGTCTATGAATGAACAAACAGTTATAATTCCACATTACTTGAAGTTTTTGTGATTCTGTATATTTGGTGCTTTATAATCACTAGTTACTTACTGTACAATTGGATTTGATACGGAGGTGGCTATGCCTTGCCTAACTTTGTGTTTCAACATTTTTTGTAAAAAAAATTTGCAATATCAGCACAGTACGTTTGTATTTACTTTACAGGTACAATGTACATAATGTGAATTGTTCTTGTCATGGATCCTTGTATAACTAGTGGCAACCTGAATGTAGAAGGCATAACTGAAGGCAGAGTTCAAGTTTCCAGAATTAAAGTGTTGTATTCAGAGCCAAAAA
>KC066956.1 Uncultured bacterium clone G4RKN2Y13H4BNZ 16S ribosomal RNA gene, partial sequence 
TACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGTCGTGAGGAAGGTGTTAAGGTTAATAACCTTAGCAATTGACGTTAGCGACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGGGCACGCAGGCGGTTAATTAGTTGGATGTGAAATCCCCGGGCTTAACCTGGGAATGGCATTCAAGACTGGTTAGCTAGAGTCTTGTAGAGGGGGTAGAATTCCATGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAATACCGGTGGCGAAGGCGGCCCCTGGACAAAGCTGACGCTCATGTGCGAAAGCGTGGGGAGCAAACGAGGGATTAGATA
>HQ143338.1 Uncultured bacterium clone 19-239BM 16S ribosomal RNA gene, partial sequence 
GCCGTGAAAGTCCGAGGCTCAACCTCGGATCTGCGGTGGGTACGGGCAGACTAGAGTGATGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGGTCTCTGGGCATTTACTGACGCTGAGGAGCGAAAGCATGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGTTGGGCACTAGGTGTGGGGGACATTCCACGTTTTCCGCGCCGTAGCTAACGCATTAAGTGCCCCCCCTGGGGAGTACGCCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGAAGAACCTTACCAAGGCTTGACATGTGCCAGACCGCCTCAGAGATGGGGTTTCCCTTCGGGGCTGGTTCACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTTCCATGTTGCCAGCACGTAGTGGTGGGGACTCATGGGAGACTGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCTTGGGCTTCACGCATGCTACAATGGCCGGTACAATGGGTTGCGATACTGTGAGGTGGAGCTAATCCCTAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCCCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCAAGTCACGAAAGTTGGTAACACCCAAAGCCGATGGCCTAACCACCTTGTGTGGGGGGAGTCGTCGAAGGTGGGACTGGCGATTGGGACTAAGTCGTAACAAGGTAGCCGTA
>KT815871.1 Uncultured eukaryote clone 41c_79369 18S ribosomal RNA gene, partial sequence 
CAATAGCGTATATTAAAGTTGTTGCGGTTAAAAAGCTCGTAGTTGGATTTCTGTTGAGAGCAGCCGGTCCACCTTTTGGGTGAGTATCTGGATTGGTCTCGGCATCCTCACAACGAATGTTTCTGCGCTTGATTGCGTGGTATAGGCGTTGTGACTTTTACTTTGAGGAAATTAGAGTGTTTCAAGCAGGCGCACGCCTTGAATACATTAGCATGGAATAATAAGATAGGACCTCGGTTCTATTTTGTTGGTTTCTAGAGCTGAGGTAATGATTAATAGGGATAGTTGGGGGCATTCGTATTTAACTGTCAGAGGTGAAATTCTTGGATTTGTTAAGACGGACGTACTGCGAAAGACATTTGTCCAACGGAAGTGTTTTCTATTGTATCAAGAACGAAAGTTAAGGGGTAGTCGAAGATGATTAG
>XM_033019624.1 PREDICTED: Amblyraja radiata GREB1 like retinoic acid receptor coactivator (greb1l), transcript variant X1, mRNA 
GCGGAATCTAACGCCACATGCGTGAAGGGAAAATACTGCAGGCGGGAGCTGCGACACCGTGCCTTTGATCGTGCTGGTTGCTAATGGGGTCGCTCGCTACATTTGTATTGAGCGCGGTCGATGTCATTTTCTTTCCTCCAATTTCTTTGTGCTTGGACCTTGAGTGGAAGCTAGGTTACTGCAGGACAAGCGTTGAATGTGGAGAGATTTGTGTTTCTTCCATGGCCGGAATAAACTGATTTATACCGACGCCAAATTTAATGTCCTTAATTTGAGTGTGGACCAGTTTATTTTTCATCTTTGGTTATTGCACGTCTGCGAGACAATTGAGCCATTGTTTCTATCATTGAGAGGATTGCTGACCACACAAACTCCGGCATCATTTTACCTCTTGTCAGATAAAAATGAATGCATTTCCAGAAGGGTAACTGACAGAAAGGAGACCATGGGAAATTCATATGCTGGGCAATTGAAATCTGCGCGTTTTGAAGAGGCTCTTCACAATTCAATCGAAGCATCACTTCGTTCCAACAGTATTTCTCCTCAACCAATTTTCTCTCAGCTTTACCTTGAATCCGATAAACCACCTCTGTCCCCTCAAGATGTCAAACCAAAGATAGAGGAACTTAATAAAGAAATTGAAGTGCATCGTTATACGCAGAGTAGCTCTTCTGGATTCCCAGCTATACAAGTTGGCAATGGACTGGATAATGAGGAGGAGGAGGAAGAAGAGGAAATGTCTGAGTCAAACAGCCCACCTATTGCCTACATGCAGAAACATGTTCCAGAGGGATCCTGCACTACTGATGGTTATTGCCAGGCTGGCAAGGACTTGCGCTTGGTATCACTCTCTGCAGAACAAATTGACATTCCACCAGGCTTTGTGTTGGTGGGAGCCAAATCTCCAAATCTTCCTGAGCACATTCTGATCTGTGCAGTTGATAAGCGGTTCCTGCCAGATGACAATGGAAAGAATGCACTTTTAGGTTTCTCGGGAAACTGCATAGGCTGCGGGGAGAAAGGATTTCGGTACTTCACTGAGTTTTCCAATCACATCAACTTAAAGCTGACAACCCAGCCGAAGAAGCAGAAGCACTTAAAATATTACCTCGTCAAAAACTCGCAAGGTGTTTTCTCAAAGGGACCTTTAATTTGCTGGAAAGAATGCCGGACTCGTCAATTGCCCAGCAGTTACTCGTCTGCAGTAACTTCAACCAAGACAGTTACCACAGTCGTTGGATCCACCACATCTTCTCCGAATATTGACACCGTCTCATCTAGTGTTTGCAGTACCACCATTGCCAGCTGTCAGACAGAATCAACATTCAGCCATGGTTCAGCAGCATCTTCTGCCGGCTATTCTGGATGTCAGGACCTGTCCAGGAGTGGAAATGTAGCAAAACCTGTTACAATAGCTGCACAACAACTTGTGAAGCCTCCAACTTCAGCTCCCTGTGCAAATAACCAGCCACCTGGGTCTATGCGAGTTAATGGTAATCCCAATAGTAACGGCAATAGTGGAAAATCCAATGTTTTCAATGCTGCTCGACCTCAACCTCTCTCAACATCATCAAGTCCTGGCTTGGCATCAGGAGAAAATAGCATCATGACAAGCTCTGGACCACCTAAGAAGCGTCATCGTGGCTGGTCACCTGGTTCCCCCATTGCTGCGCCTACAGTAGTCCCTGTTCCAGCTGTGAGACCAGTGATGCGACCTGATGTTATGGCACCCATGCCTGTTCTTCAGACAATGTCACCTGGAGTCTTGCAGCCTCAGGCAATACCTGCAGGGGAGACTGTTATCATCCCAGACAATTTATTAAACAATTCTGGAGTGAGACCTGTTATTCTGATGGGTTATGGTTCTTTGCCATATTTTTATGGCAACGTTGGTGATATTGTAGTGAGTCCCCTACTTGTGAATTGTTACAAATTTCCACAGCCGACATCAGCTGAGCTGGAACAACTGGGAATTTCCAACAGCCAGATACTGTCAGTGGAAAACATGATCCTCTTAACAATACAATATCTGATTCATCTTGGTCCAGACCAAATGCCGCTCAGGGAAGAATTTGAACAGATTATGCTGAAAGCTATACAGGACTCGAGCCTCAAAGACCGATACCTGCAGCTGGGAGCCCCTTGTTCCACTGTGTCTCCAGGGCAGTTACCCTGGCTGGCCCGCCTTGCCGCCAGTGTGTCGAGAGATCTGGTGCAAGTTGTTTTTTCTCAGAATTCTCTAGCAGAGGGCATCTCGGAGACGTTAAGAACATTTGGTGATGTGCATCTTCAACAGAAAGTACCAAACTATGTGGTCGTCATTTGTACGTCAAAGATCAGAGGCAATGAATTTTGTGTGGTGGTTTTAGGTCACTATCAATCCAGAGTTTTAGCCGAGAGTATGCTCACCACCACTGAGTTTCTGAAGGAAATCAGCTACGAACTAATTACAGGAAAAGTCAGTATTTTGGCATCCCATTTCAAAACCTCCCCCTTTGGAGATAACGTAGACAAATTCCTGGATAAATTTCAGCAAAACAGAAACAACAGTGTTGCCATTCCATTCAATGGAAATGTTTCGGAATACATTCCGTCAAATGAAGCGGCAGCAATGACATCAAAGCAAGGAATTGATTCACTTACGGAAGTGTTCCAGATTCATCTACCTCAGCTCACTGTCGCTCGGAATCTGTTGTCTCAGGTTTGCGCCATAGCCGACTCTGGAATGCAAAACCTAGATTTGGGCCGTTTTGCAAACGTTGACTTCATCATTTTAGTTCCTGCATCGGAGGTTCTTTTCCACCAGACTCTGCAACGTATTAGACATTCAGGAGTACTTGTAGATTTGGGGCTTGAGGAAAATAATACAGCCGACCAAAAGGCTGAGAAATATATTATCCGACTAGACCATGACATTCAGAACAAATTTGAGGCTTTCATGAAGAAGGTCAAACAGAATCCATACACACTCTTTGTTCTTATTCATGACAATTCTCATGTTGATCTCACAAGTCTTGTTCCAGGCTCTACAACTCACGGGGAAGCCAGCCAAGGTCTGTCAGATAAGTTTATTAATTCACGTGAGGCACTTGAAGCGTGCAACTTACTTATGTTGCAGGTCAGCTCCTTTCCTTTCACTCTACAGACACAGCAATCCCGTGTTAGCTCAGACAATGAAGTACATTGGCTATTATCCAGCAATCCTGAGGAACTCAGCAACGAAGAGTTGGTATATTTTGGTTTGTCCGATTACAGCAAGTCTTTGCAATGGGGCATAACAAGCCCAATACTGAGATGTGATGAGGCTTTCGAAAGAATGGTGAATACATTGATGGAAAGGTATCCTAGGTTGCACAGTATGGTGATCAGATGCTACCTGCTGATTCAGCAGTATGCTGAAGCCATGATGGCTGTCACATCGATGAACCTGTTGAGGGAGCACACCACCCCCGAGACCCTGAGCATCGTGGATGACTTGATCAGCTGCCCCGGGAAAGACGAGATTGGCCGCGGACACATGCTCCTGATACGGGTCCCATCAGTACAGCTGGCGATGCTTGCCAAGGAGCGGCTCCAGGATGTCCGAGACAAGCTCGGCCTGCAGTATCGGTTTGAAGTCCTTCTGGGCAATCCAGCCGGGGAGCTCAGCGTTGCCAAGCACTTTGTCGCACGGATGAAGGGATGGAGAGGGTGTGAGCAGGATGACTGGACACCACTCACCTATCAGGATCTGGAGGGTCTACCATGTATTGTCATTTTAACTGGTAAAGATCCACTTGGGGAATCATTTCCACGGTCCATGAAGTACTGTGATCTTAGGCTAATTGACTCCAGCTACCTTACACGAACAACCCTTGAGCAAGAGATTGGCCTTGCTTGTGGCTATGTTTCTAAAAGTGCTGTCAGAGAAACCATGGCAATTTTCGAAGGAACGGAGAAGGAGCATGAGAAGTTTCTTACCAGTGAGAATGAATCTGATGAATTACAGATCGATCTAGAGAGACCACAAAGTAACAGCAGTGCAGTCACTGGAACTTCAGGGTCCTTGGCAGAGAATGGTGTGAGCTCATCCAGTGTGCTTGACTCATCACAGAGGCCTGCTTCATCTCTTAGCTTCCAGAATATTGTGAACAGTTCAATTGATGAAGGCACGTCAACACACACTTCACACATCTCGACCACTGTGGGCAGTGAGGGCTGCAAGCAGGAAAATGACTTGGAAGGAAAGGAAACAGCAAGCAGCACAGTTTCAAAATCTTCCTCATCCTCTGGGAATTCTCGGCAATCCATACTGGTCAACAAGGACCTGAGGACTCCACGTCTCATCTTTCCAAGAACTGTAATTTTATCAAAACCAGTGTATCATCTCCTTGGTTCAGCAAGAAATGAGCACCTGTGTTCTGCCTCTTTGTTGCCCCATGCTGATGTGACTTGGACAAGCCCACTGAGATCACTTTTCCACAAGGAATTGAGCAGTGAAGAGCAGTCACTCTACTACAGACAGTGGACATTTCCCAGGCAACATCATGCGGACTATAGCAATAAAAGCGAGGGAAGTTCTGGAAATTTCCACCGACGCCGATTGTTATTGACTGGACCTCCACAGGTTGGAAAGACTGGTGCTTACTTGCAGTTCCTTAGAATTCTTTTTCGCATGCTAATAAGGCTCTTAGAGGTTGATGTATACAATGAAGAAGAAATTAACGAAGACACGAAAGATTCAAATGAGTATGCACAGGGTATTAATGCACAGTGGCCTGATATTGAACTCTTCAGTAAAATGACCTTTGATTACACGGTACATGATCCAAAGTATCGCCATATCAGTGCTGTCTACTCAGCCAAGCTGCCAAAGATTAAGCTAGAAGGTGGTAAAAAACGCAGCCTGATCGAAGGATCAACAAAACGAGAGACAGTCTCGATAATGCTAACTAAATATGCTGCATACAACACATTCCATCATTGTGAGCACTGCCACAACTACATTGACTTCAACCCAGCCACACAGGTGTCTGATTCCACACTACATGCATTTACATTTTCTTCCTCCATGCTGGGAGAGGAAGTTCAGCTTCACTTTATTATTCCAAAGTCAAAGGAGCAGTATTTTATCTTCAGCCAGCAGGGTAAACATCTGGAGAGCATGCGTCTACCTCTTGTCACAGATAAGAATCCAAAATTAGTGAAGAGTCCCATCTTTACACCAACTACAGGACGGCATGAGCATGGTCTTCTGAATCTCTACCATGCCATAGAGGGTGCAAATCACCTTCATATCCTTGTGGTTAAAGAGTTTGAAATGCCACTCTATCGAAAGTACTGGCCCAACTACATTATGTTGGTATTACCAAGCATGTTCAATGGAGCAGGGGTCGGTGCTGCCCACTTTCTAATCAAAGAACTTTCATATCACAACTTGGAGTTGGAAAGAAATCGCCAGGAAGAGATAGGGGTGAAGCGGCAGTGTGTGTGGCCATTTATACTTGTCATGGACGATTCTTGTGTCCTGTGGAATGTCCACAATGTGCAGGAATTGAGCAGTGAAACAAAAGATTCTGCAGTTTCCACAAAGAATGTTTCCTTGAAGTTCGTAATGCAGCACATTGAAGCCACACCAAAGATCACTCATTATGCACTCTGTGGGATTCGAAAGTGGAACAGCAAACTGAACACTAGCAAACTGAGGACAGCATTCTCTCATTGTCACATGCATGACTTTATATTCCTCAATGTCGACCTGACACAAAATGTACAGTATGATCTGAGCAGATATATCTGTGAAGACATTGATTTCAACTTACGGACAAATAGCAGTGGTTTGCTCCTTTGTCGATTCAATCACTTCAGTTTCATGAAGAAATGCATTCAGGTTGGAGGGCACAAAGATTTTGTTATAAAGCCTAAGATTATGGTGATTGAAAGCCTGAATATTATTTCAGCCTCGCAGTACGTCTGTGCTCCAGACAGTGAAAGCACAATGCTGGCTGCACCTGCCCAGTTTCTCCTGGAGAAGTTTCTGCAACACACTAGTTACAAACTCTTTCCTAAAGCTATACACAACAGTAAGAATCCGGTGTTGTCCATTGACTGTTACATGAACCTGGGTCCTGAGATTTCTGTATGCTACGTAAGCTCACGGCCTCACTCAGTTAACATAAAATCCGAGGAGGTATTGTTCAGTGGACTCCTTCTCTACCTCTGCGACTCGTTTGTTGTTGCTGACTTTCTCAAGAAATTCACGTTTCTTAAAGCTGCCACACTCTGTGTGATTTGCCAAGATCGAAGTTCATTACGTCAAACTATCGTACGTCTAGAATTGGAAGACGAATGGCAGTTTCGGCTACGTGACGAGTTTCAGACGGCCAACAGCAGTGACGATAAACCACTTTATTTTTTGACCGGACGACATATTTAAGTTCAGTTCACAAGACAAGAAATAGCAGGTGAGGGTTAACGGGTGCCATAAGTGAGAGCCTGACGGAGCACAATTTATAATTCCAAGCGAAAGGTGAAGTGGCACATGCGCAGAAACAAATATCGGATTTTTTGTTTGGTTACCTGACCACCGTCACTTCATCGAACATCTACATCAGAACAGAGACAGCGTGATCAGTGCATAAGAAGGGTCTATGACCTGCACTCTGTTACTTCTGTAACTCCGGGAGAGAGTTTAGTGTGCGACTTGCAGGGAAACTGGCATTGCACATGGTATGATATATCAACCCTTTCAATGTGGGGAAAAAAAGGCAGTGCGAGCTGCAGAATGTATTTTTTTTTCAGAACCGGTCAAACCTATGATTATTCCAGAATATGTCCAAAATAGACCTGGATCCAAAAAAAAAGGAACTACTGTCAACAAAAAGACTTCACTGAAGGAATGGAACCAAAGCAGTGGAGCATAAAACAATTGATTGTATGTTGAGGTTCTTCAATGTCACCATTCTGACTGTATGTAATTGCAGTTCAGCTCAGGGTTTTGCAAATAGGTGGCAATGGAGAAAGAGTTGTCTGTATTCGTACTAACTATTACCTTATTTTTTGGTGGGTTTTGTAGTGTATGGTTTCATGCTTATTTGGAGTAGTTCTTAACCTGGCATTTTTTTTAAAGCATGTTCTCATATTTTATGGACATTTAAATCTAAACATGATACATGGGGAAATGCAAAATACATGATGCTTTCAGTGGGACTATTGTTGAAATTTTTAATGGCACGCAACTTATCCAGAATCTTTTTCCTACCGTTGACAATACAGGCTTTTGTTAATTTTTAATTTCACATAATCTAATTGTTTGACTTCTCTCTTGCATTGTCTATAAAACCATTTATCACACGCAGTTACATGCTTGTACTTACACTTCTTATTTTCATACAAATGATTACCATAGTGCATTGAATCAGATTTTGAAAAGTAAAATGCGCAGCCTTGATTCTCAAAGACATCAATATCTTTTCAATGTTAACATGGTAAAGATTAATAATGGACGATGGAGACCATATGATTTTTGGTTTCCTTTTTTGTATGATATATGAAAAGAGTAAATGTGCACAAATATCACACATCCAATGGTTCCCTGCTTTGTGCCTGTAATGTTATTTTTTTATTTACTTGTTTTAAGGAGATAATCTGAGGGGGATAAACAAATGTCACATTTGTTTCAGTTATTATTCTTTATTACTGTGCCATTTCATAACATTTTTGGCCAGTTTTGTATACATCTACAGCTATCCGCTTGCAAGGGATGGATTGATATACTCTCATGGGCAACTAAATAAAAATGTAGAAAGATAGCAATTGTATAATGATGTGAAATTTCAGCTGCTCTTTTGCTACCACTCTTCCCCGGTCAACAGCAATATTAAAATCACAACGTAAATTGGTCTAGCGATCTTTCCAAAACAAAAGTGATGATTTGGCCTGCAAGTACAAGTTAGAAATTCCATATTGACAAATAGGGAAGGAACAAAATAAATCATCCAGTTTTGATGACAGTTTTCAGTTGTAATTTAAGTGTAAACGTAATGTTAAGCAGGCAGCAGCAATGTGGGGGTGCTCTGGTATCAAATGTAATCATGGGAATTGCAAATGAATGAGCAAGTGTTTGTTTGCCTTCTCACTAATAATCACTTATCAACGATAACTATTACTGTAAATATTGCTAATTAAAAATGAACAAGATTTA
>XM_053163347.1 Puccinia triticina uncharacterized protein (PtA15_15A169), partial mRNA 
ATGCCTTTTACACCGAAAATCGAAAAGGACGCTGGAAGACTTCAAGAGTGGAACTTCCACCATCGACGATCAGGTTCGATGGATTCTTCAAAAATCGCGCAAAAAACTTTCGAGCTTGAAAACCATATTCAGCCTTTGGAACAGGATAAGATATTCAAATACAACGCGGAGGAACAAAAGACGATCCAGAAAGAAGCGAAATGGAGGAAAGATCCTCACTACTTTAAGAAAGTGAAAGTCTCTGGTGTCGCTTTGATCAAGATGGTTATGCATGCTCGATCAGGAGGGCAATACGAAATCATGGGGCTCATGCAGGGCAAGATCGATGGAGACACTTTCGTCGTAATGGACTCATTTGCTTTGCCTGTTCAAGGGACAGAGACTCGAGTCAATGCGGCTAGTGAAGCCAACGAGTACATGGTCGATTTCCTCGAAAGTTCAAAAAATGTTGGCCGACTGGAGAATGTCGTGGGATGGTATCACTCTCACCCGGGTTATGGTTGTTGGCTATCGGGAATCGATGTCAGCACTCAGCTGACAAACCAAACTTACACAGACCCATTTGTCGCGATCGTCATCGACCCCAATCGCACAATTTCAGCCGGGAGAGTCGACATTGGCGCCTTCCGCACCTTCCCTGAAGGATATACCCCTCCATCACTGGGAAAGAGCAAGGACGACGAATACCAATCGATTCCATTGTCGAAGATTGAAGACTTCGGCGCCCATGCCAACTCTTATTACGCCTTGGAAATCGAACACTTCAAATCTAGTTCAGACTCGAAAATATTGGACCTCTTGTGGGAGAAGTATTGGGTCATGACTCTGAGTCAAAACACATGGCTTTCAAATCGAGTATACACGACAAGCCAAATTCAAGAAATGACCGACAAACTCACCAAATCAAGTAGCTCGCTAACAAACAGCAAGCGAAACACGCTAAAAACGTTGATACCCACTCACTTGCGAACTGCGATCGAGAATGAGAACGGTCATATCGGCAGTAACAACCATCCGGAAAACTCGACTCAAAATAACAATAACAATCAGCTGTTCCATGACGTCTTGAAAGATGTCGAGAAGTTAGAATGCGAGAACCTATGCGGCATGTTTGGTCAGATTATCAAAAATGTCTTGTTTAATAACAATTCTCATAACTGCCAACTTGAGTTCCCCATGTAA
>HQ319463.1 Uncultured bacterium clone RMAM0533 16S ribosomal RNA gene, partial sequence 
GAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAGCGGAGGTTTAAAGCGGAAGTTTTCGGATGGAAGCAATAAACCTTAGCGGCGGACGGGTGAGTAACGCGTGGGTAACCTGCCTCATACAGGGGGATAACAGTTAGAAATGACTGCTAAAACCGCATAAGCGCACATTGTCGAGTGACAGAGTGTGAAAAACTCCGGTGGTATGAGATGGACCCGCGTCTGATTAGCTAGTTGGTGAGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGGCCTGAGAGGGCGACCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAAGAAGAAAGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATC
>XM_029801181.1 PREDICTED: Octopus sinensis homeobox protein rough-like (LOC115231097), partial mRNA 
TTCAAAGACGGAAAAGGAAAGAGAACCGTCCCCGACGTCAGCGTACGACATTCACCAGTGAGCAGACACTGAAGTTAGAACTGGAGTATAACCGAACTGAATATATCACACGACCTCGGCGATTCGAATTGGCTGAGATGTTGAACTTGACAGAAACCCAGATCAAGATCTGGTTCCAGAACCGAAGAGCGAAAGACAAACGGATCGAAAAGGCACAAATGGATCAGCAGATGAGCCTATCTAATTTCCAAAGAAGACAAGTTGTTGGAGTTCGGCCCGATCTCTACAGCGCTGCTATTAATTTTGTTCTCTGTCCAGAATTGTGTTGTGGACAAGGGTTAGAATGCTTAGAATACTGGAACTGCCGCATTGCTGTGCCCGCACCTGCAATTCTAGCATTCCGTTCAGCCTTCTGCTTCCCATCACAAGAGAACGG
>XM_043204581.1 Ogataea angusta uncharacterized protein (KL928_003939), partial mRNA 
ATGGTCCAAATCCCCAGATCGTACGCGGAACTGAAGCAGAAGGTTCCAAACATTGGAATCATTTTTGCCGCAATAGCTTCGTGGTTTTCGTTTAGTTTACTTATCTCGCTTTACAACAAATGGATGTTTTCAGATCCTACTTTGAACTTCAAGTTCCCCGTGATAATTACAGCCTGTCACCAATTCGTGTTATTTTGGCTCAGCTGTTTGACGCTCACCTTTTGGCCCAAGTTCAGACTGAACTATGTCGATCCTTCCAAAGGCATTGCGTCCTCCGAAAATCTCAGCTACTTTATCAACCCTAAAGTGTACATTACCAAGATCTTGCCGTGTGCGCTGGCTTCCGCCGGTGATATTGGCTTGGGCAACTCTTCTTTGAAGTATATCACCATCTCGCTATACACCATGCTCAAGTCCTCTGCAGTGCTCATCTTCACGCTCTTCTGGGGTTTCCTTCTCAGACTGGAGAAAGTTACGTTGAAGCTTTGTCTGATTACGTTCATCATGACTGGTTCGGTCATGATGATGGTGTACGGACAGGGAGAGACCTCGGCTGAGACCAGTCCTTCCGCTGTTGAGGAGGAGGCTGGAGAAATGAAGCTCAGATTCGTCAAGCACCTCGTGAAAAGAGCAGCTTCTCTGTACCTCGGTGTCAGAGACGAGGAGCAGGAATCCGACGACTTGGTTTCCTCGTCCTCCTTCACAGGTTCTACGGCCAAAGCTTCTGCTGCCCTGGACACACTCACCGCATCCTCCATCATCATTGGCTGCATCCTGGTTCTGCTTGCATCTTGCATGTCTGGGCTTAGATGGGCTTTGACTCAAATTGTCTTGCGTGGCAACAGATACACCAAAAACCCAATTTTGACCATCTTCTATCTGAGTCCCGCCATGTGCGTCTCGCTGATTGTCATGGGCTCGCAGGTCGAAGGCTTAGGCAACTTTCTAGGATCGCAGGTCTGGGAGACGTATGGTATTTTGGGAACCTGTTTGCTGCTTTTGTTCCCAGGTTTCCTGGCCTTTTGCATGACCCTGTCTCAATTCATCATTCTGCAGTACGCTCCGTTGCTCACGCTCTCTATTGCCGGTATTGTCAGAGAGCTCATTACTATATTCCTCGGATGGCTGATCTTCGGCGACCACCTGAACGCGATCAATATGCTGGGTATATTGATCACCTTGGGAGACATTGCATGGTACAATCTCTACAGACTGGAGCAATCTTCGGCCAAGCCGGCTTCTGCTGCGTCTTCTGAGGACACAGAGAGGTTTGTCACCGAGGAGCACGAGCTTGAGTCTATCGACAGACGCAAGTGA
>XM_004287821.2 PREDICTED: Fragaria vesca subsp. vesca putative F-box protein PP2-B12 (LOC101291663), transcript variant X1, mRNA 
AAATATTTTGTGAATTTCTGAGATTCATCAGAAAAGTTAGGATGCTTTCTCACCAAGAAAGTGAAAAGAAGTATATATACACAGCTTCATGATTGATTCCTCTACAGAAGGCTGAAGCAGTGTTGTTCTTTCACAAGGACCTCTAGAATTGTGTATATTCTTGTCTGATACTTTAGGTTTTTCTCATCATTCAAGTTGTCTTGTAGAGGTGTATAACTATATATACAGTAAGATGAATGCAAGAGAAATGTTTGTCAAAATAGCAGAAGCATTTGTGGAGTTGTACAATTATGTTAGAGGGCCTATGGTGCCGCAAGCAATTCAGTTAAGGGATGCAGTAGTGAAGATTCATGAAAGCTTGGCTGGTCAAATTGCAGACTCAGAATTGATAAGTAGTGTTATCGAATGGTTTAATACGTTTCATAACATTTATGTCGCACTAGGATTGGTTGGTTTGGTGATCTCCTTTGTTCTAGGATTGCTTTGGAAAGTTTTAGCTGTGGTAGTTTCTGCTTTAGGTGTATGGATTTCCTATTTGATTTGGAGAGACCATAATTGGCACAAGCTGTTCCTGACAGACGAAAAAGGATTAGCATTTTTTGCAAGTACTTGGCTTGGGTTATTGCTACTCTACCGAGCACAAGGTCTGCTTGGCAAAGTTTGTCTTTTGGGAATAGAAACCCTAGTAATATGGGTGATGCAGTATTCCATGTCGACGACGACGAATATGGAAATCCCTTGGGATGATTCTAATATCCATGAAATTATCTCCCGAGCTGTTCCACCGGTGCCCCATTATTCTTCTCCGCATGACCTCTACCGCAGTCTCTGCGCTTCCCCCATCTTCCTTGACGATGGCTACTTGAGTTTGGCGTATGATCGGGCGACTGGTAAGAAATGCTGGATGATGGGAGCCAGGCTTTTACTTATTGATTTGGCAGAAATTCCAGACTACTGGAACTGGATATCTCTGCCTGAATCCAGGTTTTCCCAAGTGGCTGAGCTCAGATTTGTACGTCGTCTTAAGATCAAGGGATCCATTTCTACCTATATGTTGTCACCAAGAACAACCTATGTAGCTTACTTTGTATACAAGTTTTCAAATACATCTCGATCTGGTTTTCATGAAAGGCCTGTTAGCTTGCGTGTAGTTCGTGTTGTTAATACTCAACGCCAAGTTGTGGCGCATCATAATCGTGTGTTCCTGATAGGAGAGATGGCTTCACAAGCTCGAACGAGAAGTGATGGATGGATGGAGATTGAGTTCGGTGAAATCTCCTACATTGATGATAGTGCTACTATAGAGTGTATACTAGAGGGATCTGAAAGTTTTGAGGGAAAAAGAAGTCTCATTGTGGAAGGTATTGAGCTCAGGCCTAGATAGAGGAAATTTATCTCTCTGTATATATATAATGGATCTTTGATCTTTAGCAAATCTTCTTGATGGCATGGTTGATGGAGATCCAAGCTCACAGTTTACTATATATATTGGTTATGGACGTGGTTTATGGACGTGATCTTGCTAGCTTCCAGCCTTCCAGGCTGGTTTACCT
>XR_008327014.1 PREDICTED: Panonychus citri uncharacterized LOC128397849 (LOC128397849), ncRNA 
AATTACTGGATCATCTTTGATTTGTCATCTAATAGTCAATGGAATTGTAACTTTGTTAATTGTTAGTTCTTAGAATAGATTCAATTAAAATCGATGACATCAATCAGCAACAATTTATCAATCGTTGTAACAATTAACCTTAATGCGAAAAGTGAAAAACAAATCTAATCAAAGTAAATTGTTTACAATTAGAAAAAGAAATCAAATTAATTGTAAACATACCTACGTGATGAGATGCAAATCTAATTGTTAACAATTAGTCTGGGAAAATTACTTATCATTAGAAATTAAATTTGTCTGATCAACAATTAGTCAAATATGATAACAAGGATCACAATTAAACTTAATTGTTACGGAAAAACCTTCAACAGATTCTAATTATAATGTAACTATATTTACTCATTATAAAGAAAGTTAATTATAATGTCGATACATTTGCAATTAAATTTGACAAATCAATCAATTAATTACACATTTATGATGATTATGATTAATAATTAATGAGAAAATGATTAACTTTTGATTAGATTAACAAGAAGGAAATTATTTTAATTGTGTTTACCAGAAACGGTATCAATAGTAATTAGAATTACTTTGTTTACCATTTAGCTTTAACATAGAGAGAAATTGATTAGTAGTTTATCAACAATTAATTTAATCGTAATAATCAATTGATTAGTAGAAGAGAAATCAACGAAAATAGACAGAGAAATAGACAGAGAACAAGAAAAAGAGAGACGATCAAGTGAGTGAGAGAAAAATATAAAAATCATTTTCTCTTCAACGAATCAAGTGAATGTCACATTTTCCTTGGAGACTTTGAGTTTGCTAATTGATTTGATTTTTTGATTAATTGTCTTCATCTTTAAGAATTAATTACTCTTTGATTGTTGTTCTTTGAAGGTGTTGAGTTAATTTGGATTCGTTTTAATTGTGATAATCAATGACAACCATTAAAGATCAACATCAAATGCCTAATCCCAAATGGATCATCTTTTGTTGCTAATCTGTAAAGTGGTCAACACATTTTGTGACTATAAGTGTCTTAATTGTTCAAGTGATTTATTGTTAATAAGAACGTTTAAATTGACTAAAAGATGCCAGTTTACGCTGCTATCAGTCGATCAAGGAAACGAAGTCAGGAACGGAAACTGTCCCTTAGTTCCTGTTCCTCTGAGTCTTCATCTATTTCCTCAAGTGAAATTGATATAAAGGTGGATCAGAATGTGATCTTTGTGGATTATCACTTAAATCGGTCAAACAACATTACATTTGTGGACATAATTTTCACATCGATTGTATTTGGAGATACAAAAGATTAGCCCCCAGTAACCATGAGTATTGTCCAGTTTGTGGTATTCATCATCCACCAAAAACAATTAGAAATTACTAATTATCATCCTCATCACCATCATCATCGTTGGGTCATCAATATTTATCCACATCTCATACTTGCGACAATTTAAATCTAATTGTTTGCCTCTTGCTCTCTGTCTCTCATTATCCATCAAAAATCATTGTAATTATTTAATCGATCATAACAAAGTCACAGATCATGATTAATACCAATCAATACGAATATAAAATACAACTAAATCAATCAAAACAGCTCAAAACAATTAAATTGTAATCGAAACAAAAAACACGCTGATTAAACAAGTGTATCTTTGTATTATAATCATCACAATCAAAAATCAAA
>NM_001096323.1 Xenopus laevis zinc finger DHHC-type containing 1 L homeolog (zdhhc1.L), mRNABC106577.1 Xenopus laevis hypothetical protein MGC131347, mRNA (cDNA clone MGC:131347 IMAGE:7766144), complete cds 
CAGCAGATTCCGTAAGGATCATCCCTTCCCTTCCTCTCTGATTTCTACTCTGCTTCTTAGTTCAGACTGCGCCCGTTGTATATTCATAGCCTCATTCCATCAACCGCAAAGAGACATGGGCATTTGGAAAAAGCTACTTTGTATACAGGGTTGGAAGCAAACAACATGAGCTGACTTTCCTGTCAAGGTTCAAGACAAAGTCTTCCTATGCTGAACACATTTAGAAGCCATCTTAAAATACATGAATTATTAGTTCTGGTACTGTCAGATGGGCATTCAAAAAGATGTCAGTCTGCAAGAAGCAGTCTGCTATGAATGTGCCCGATAAAGAGAGAGGGGAAGTCATTTCAGATCCACCTCAACATTCAAGAAAAAATGGCTGGAGTTGGCCCCTGCACCTGCTGCAGCTTGTTGCCTGGTCCACTTTTCTCTTCTTTGCTGTTATAGGACTTGGGATCTTGGTCCCTCTTTTACCACAGCATTGGTTGGCAGCTGGTTACATTTGTACTGGAGTCATGTTTACTTTCCACTGTGTTGTCCACTTTCTGGCTGTTACCATTGATCCTGCTGATGACAATGTGCAGGCCAAAGGTTCTCTTGGGCCTCTACCAGCATTTGATCGCAACAAGCACACTCATGTAATTGAAAACATGCATTGTTATATCTGTGAGGTGGATGTGTAAGTAAAAGATGACCCTTCATGTTGTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>XM_051729581.1 Alternaria postmessia uncharacterized protein (J4E82_003292), partial mRNA 
ATGGATGAGGAAAATGTTGCCAACTTCTGCGGCATCACGTCCTGCAGCCCAGAGCAGGCTGCTCAGTACTTGCGCCTAACAGATGGCAACTTGGAGCAGGCCATACAACTCTTCTTCGACTCTCCTGGACTTGCCGATGCTCCTGCTGCGCCATCACAGCCCTCAGCAGCCGCCTCCGCACAGAATCCCATCAATATCGACTCCGATGATGACATGGACTTTGATCCCGCACCACAAGGCAACGCGCCGTCCACACGGGCACAACCAGGCGTGGAAGACGATGAAGCCATGGCACGGAGGTTACAAGAAGAGATGTATGGCGGCGGCGGCGGCGCCGCCGGTGGCGCTGGCAATGATGAGATTCGCGCGCCCATAGAACGAAGAGTGGAAACACTTGTTGGCCCAGGCTCAAACTGGGGGCCTGCCGATGACGAAGAAGATCTTGATGCTATGGTCCAGGAGCAGCTTGCTCGTCGGCGGACAGGCCGCGCCGGTATCTTCAACCAGCACACAACCCATACCAATGTCTGGGATAACACGACCGATTCGAGCACCCGGCGACGCGAGCTTGCGACCGCGACTGGCGGTGCTTCAGAGCAGTCTTCTAAGATGAACATGCTCGCAGAGCTATTCCGACCACCGTTTGAGATCATGTACCAAGGATCGTGGGAAAAGGCGCGAGATATGGGCAAGGACGAAGAAAAGTGGCTGCTTGTCAACATCCAAGACCCGGCAATCTTCGACTGCCAGCGCCTTAACAGGGATATCTGGAAGAATGACGATATCAAGGCAACTGTGCGAGAGAACTTCATCTTCATGCAGTATGCAAAGGATGATCAGCGTGGACAGCAGTACATGAACTACTACTTCCACGCCCGTGACAGTTCTGACGCCTACCCCCACATCGCCATCGTTGACCCACGAACAGGCGAGCAAGTCAAGGTCTGGTCGGGACCACCGATACCCGAACCAGTTGAGTTCCATGCTCAGCTTCATGAGTTCCTCGACCGTTACAGCCTCAATGTCAATGCGAAGAACCCTGTAGCGAAGCGGAAGTCTGAGTCTAAGAAGAAGGATGTCGGTCGCATGACAGAAGAGGAGATGCTGGAGATGGCGCTACAAAACAGCATGGATAACGGCAAGGGGCCGAAGGACGATGACCCAGATGCTCTCACCAAGTCTACAGACAACATCAAGGGCAAGGGCAAGGCCGAAGAAGTCGCTTCTGAGCCGCCAGCTGAGCCCGAGGCAGCTCCTTCGAATCCTGTCTTCGCTGCCATCTCCGCACATGCTCCTCATACCGAGCCTACCGTTACTGATCCCAAGGTCACGACTCGCATCCAGTTCCGTGGCCCGTCAGGCCGTCCGATTGTGCGCCGCTTCAACCTTACAGACCCTGTTCGCCGTGTCTACGAATGGATCAAGTCCGACGTGCCCTGGGAAGGCAAGCAAGGAGCTGAGTTCGATCTGGCGTTCATGGGCAAGAACCTCCTCGACCACGTCGACGACACGGTCGAAGCCGCCGGACTCAAGGGTGCCAGTGTTATGGTAGAGTTCTTGGATAATGAGTAG
>XM_006724281.5 PREDICTED: Homo sapiens eukaryotic translation initiation factor 4E nuclear import factor 1 (EIF4ENIF1), transcript variant X2, mRNA 
AGGGGCGCGAGGCCCGCAAGGCGGCCGGCGGGTAGCCGGCGGGCTGGCTGGCGGGGACCGAGCCGCCGGGCCGGGGAGGACGGCTGCGGGCCTGCGCTAGCTCCAGCTTGAAGCGCCCGGGCCGGGAGATTCGGCCTCCCTCCTCCCTGCGGCCGGCCGCCCCTCAGTGAGTACGGTCTCCGCCCTTCCTCCGAAGGAGGCCGCTGGGCCCGGGCCTGCGTGAGGGGCTGCGGGTTGGGGTCGCGGCCCGGGGAAGCCAAGTTTCGGAGCTGAAGCCGGTGCTCGCCCTTTCCTTGCCATCGGCGCCCCTGACATGGCCACAGGTGCGGCTGGCCTGGCGAGGGGCGCTCGGGCCCCGTCCCCAGTCCCTGATCGCCGGATAACAAGGGGCAGCTGGCGCCGTCCATTGGTGCAGAGCATTGTAGACCAAGGAGCCATGGATAGGAGAAGTATGGGTGAAACAGAAAGTGGAGATGCTTTCCTTGACCTGAAGAAGCCTCCTGCCTCCAAATGCCCCCATCGCTATACAAAAGAAGAACTCTTGGATATAAAAGAACTCCCCCATTCCAAACAGAGGCCTTCATGCCTTTCTGAAAAATATGACAGTGATGGTGTCTGGGACCCTGAGAAGTGGCATGCCTCTCTCTACCCAGCTTCAGGGCGGAGCTCACCAGTGGAAAGTCTGAAGAAAGAGTTGGATACAGACCGGCCTTCCCTGGTGCGCAGGATAGTAGATCCACGAGAGCGTGTGAAAGAAGATGACTTAGATGTTGTTCTCAGCCCTCAGAGACGGAGCTTTGGAGGGGGCTGCCACGTGACAGCCGCTGTTAGCTCCCGGCGCTCAGGAAGTCCATTAGAGAAAGATAGTGATGGGCTTCGTCTGCTTGGTGGACGTAGGATTGGCAGTGGGAGGATAATCTCTGCCCGGACCTTTGAGAAGGATCACCGTCTTAGCGATAAGGACCTGCGGGACTTGAGAGACAGAGACCGAGAGAGGGACTTCAAGGACAAGCGTTTCAGGAGAGAGTTTGGAGATAGTAAGCGTGTCTTTGGTGAGCGTAGAAGAAATGATTCTTACACAGAAGAAGAACCAGAGTGGTTCTCTGCTGGACCCACAAGTCAGTCTGAAACCATCGAACTGACTGGCTTTGATGATAAGATACTAGAAGAAGATCACAAAGGGAGAAAAAGAACAAGGCGACGGACAGCCTCTGTGAAGGAAGGTATAGTAGAGTGCAATGGAGGAGTGGCCGAAGAGGATGAAGTGGAGGTCATCCTTGCACAGGAGCCTGCGGCTGATCAGGAAGTGCCAAGGGATGCTGTCTTGCCTGAGCAGTCCCCAGGAGACTTTGACTTTAATGAGTTCTTTAACCTTGATAAGGTGCCATGCTTGGCTTCGATGATAGAAGATGTTTTGGGAGAAGGGTCAGTCTCTGCCAGTCGGTTCAGTAGGTGGTTCTCTAACCCGAGCAGATCAGGAAGCCGATCCAGCAGTCTTGGGTCAACACCACATGAAGAGCTAGAGAGACTTGCAGGTCTGGAGCAAGCCATCCTCTCTCCTGGACAGAACTCGGGGAATTACTTTGCTCCTATACCATTGGAAGACCATGCTGAAAATAAAGTGGATATTTTAGAAATGCTACAGAAAGCCAAAGTGGATTTGAAACCTCTTCTTTCCAGCCTTTCTGCAAATAAAGAAAAACTTAAAGAAAGCTCACATTCAGGGGTTGTGCTTTCAGTGGAGGAGGTAGAAGCAGGTCTGAAGGGCTTGAAGGTTGACCAGCAAGTGAAGAATTCAACTCCCTTCATGGCAGAACACCTAGAAGAGACCTTGAGTGCCGTAACCAACAATCGACAACTGAAGAAAGACGGAGACATGACTGCGTTCAACAAGCTAGTGAGCACAATGAAGGCAAGTGGGACTTTGCCTTCTCAGCCCAAAGTCAGCCGAAACCTTGAAAGCCATTTGATGTCCCCTGCTGAGATTCCAGGCCAGCCTGTCCCTAAGAACATCCTGCAGGAACTTCTGGGTCAACCAGTTCAGAGACCTGCTTCTTCCAATCTTCTGAGTGGCCTTATGGGGAGCTTGGAGCCTACAACATCTTTACTGGGCCAAAGAGCACCCTCTCCTCCCTTGTCACAGGTGTTTCAAACTCGAGCAGCCTCAGCTGACTACCTTCGCCCAAGAATACCATCACCAATTGGTTTCACACCAGGACCACAGCAGCTACTCGGAGATCCATTCCAAGGCATGCGCAAACCCATGAGCCCCATCACAGCCCAGCAGATGAGCCAGCTGGAGTTGCAACAGGCAGCTTTAGAAGGGCTGGCCTTGCCACATGACCTTGCTGTACAGGCAGCAAACTTCTACCAGCCTGGTTTTGGCAAACCACAGGTGGACAGAACCAGAGATGGATTCAGAAACAGGCAACAGCGAGTGACCAAGTCACCAGCACCCGTGCATCGAGGGAATTCCTCTTCCCCTGCCCCTGCTGCCTCCATCACAAGCATGCTTTCTCCTTCCTTTACCCCTACCTCAGTGATTCGTAAGATGTACGAGAGCAAAGAGAAAAGCAAGGAGGAGCCAGCATCTGGAAAAGCAGCTCTTGGTGACAGTAAAGAGGATACTCAGAAGGCCAGTGAAGAAAACCTCCTGTCATCCAGCTCTGTACCCAGTGCCGATCGAGACTCTTCTCCCACTACAAATTCCAAACTGTCAGCATTACAGAGGTCTTCGTGTTCCACCCCACTGTCCCAGGCCAACCGTTACACCAAAGAACAAGATTATCGACCTAAAGCAACTGGGAGAAAAACACCCACCTTGGCATCCCCAGTTCCTACAACACCTTTTCTCCGCCCTGTCCACCAAGTTCCCCTTGTCCCCCATGTCCCTATGGTTAGGCCTGCTCACCAGCTTCACCCAGGGTTGGTACAGAGGATGCTGGCCCAGGGAGTACATCCACAGCATCTTCCAAGTTTGCTCCAAACTGGTGTGCTTCCTCCTGGGATGGACTTGAGTCATTTACAGGGAATATCTGGCCCCATCCTGGGTCAGCCCTTTTACCCTTTACCTGCTGCTAGTCACCCTCTCTTAAACCCTCGTCCTGGAACACCTCTGCATCTGGCAATGGTGCAACAGCAGCTACAGCGCTCAGTTCTGCATCCTCCAGGCTCTGGTTCCCATGCAGCAGCTGTCAGCGTTCAGACAACCCCTCAGAACGTGCCCAGCCGGTCAGGCCTGCCCCACATGCACTCCCAGCTGGAGCATCGCCCCAGCCAGAGGAGCAGCTCCCCTGTGGGCCTTGCCAAATGGTTTGGCTCAGATGTGCTACAGCAACCCCTGCCCTCCATGCCCGCCAAAGTTATCAGTGTAGATGAATTGGAATACCGACAGTGAGCAGGGCAGGCAGACTCAACTAAGCCCGGACCTGTGGTGGCACACTGGGCAGGACCCTGCTTCATCTCGGGTTGGTTTATGGGCTTTTACTTTGGAGCACTCTGTGTGAAGCTGTTTGGTGGAACCCATGCATCTGGTGTGGTCCGCATTATGATGGAAGGATCTTAACCAGTCGAGTGGAGTGTACATTGTCTGAATACAGGATGCACAATGTTGTCAATCCTGGAAATGGTCTTTCTTTTTTGTAAGATATGTGAATGAAGTGTTGGTGTCCTCACCAAGAGGTGGCACCTAAGGGTTCTGAGGAAATAAATGTATAGACCCTTATGTACAGACCTGTGTATAAACAACTTTTGTATATACATATAGGATAGCTTTTTTGAACTATACAGCTGTACATAAAAGTAGCTGATATTAGTTAGGCCTGTGTCAACAGTTTGGATTTTTTTCACTTGTACATTTGGGATTTTCTTTTGGTTGATTAAAATTGCATATGCTAAGTGTGTGAATGAA
>XM_003017089.1 Trichophyton benhamiae CBS 112371 phosphotransferase enzyme family protein (ARB_04011), partial mRNA 
ATGGTTTCCGTGAGACCGCGACTATTTCTAAGGGGTCTCAAGCACAGAATCCCGGAAGAGCATAGTACAACAGACCTTTTCAACTATACCACGGGGCGATGGCTTTGGAGAGAGAAGGAGCAGCTACTTGAACGATACCGGAGATTCAATGTACGAGAGCTACAGGCCATAACTGCACATACACTGGGCTCTCAAGCATGTGTTTCAATGTCCAAAATTGGAGAAGGCAATTTCAACAAAGTCTTCCGACTTGTAATGGATGACGGAGCAGTGGCAATAGCTCGAATCCCCCATCCAAATGCTGGTCCGCCTCGGTATACGACTATGTCGGAGGTTGCTACTATGGAATTTGCAAGATCAATGCTTAAAATACCAGTTCCTAAAGTGTTAGCATGGTCTTCATCTTCTGATAACTCTATAGGTGCAGAGTATATCATTATGGAAGAGGCTAAAGGCACCCAGCTCTCTCAAACATGGGATGAAATGAAATTACATGATAGGAGTGAAATAATCAATGATATTGTTTCCATAGAGCAGAAACTTCTCTCCGTGACCTTTGGCTTGTATGGGTCACTATATTTTTCCAAAGACGCTTTCCCTGGCTGTCAGCCGGCAGATATCAGTGGTGACGTCGCACAAGGGATTGAGGATGAGGTTAGAAAGCAATTCGTCATCGGCCCTACGACTCGCCGGGAGTTTTGGGAAAAGGAGCGAGCACTGATGGATCTGGACCGAGGACCTTGGAAATCTGCTAGTGGATATGTGGAGTCCATAGCCCATCGCGAGACCGCTTGGATTTCCCAGTATGCACGGAGGGATTCCATCATATCTGGCTACCCCAGGGGCAAAGGAAGTCAAAAATCACCCCAGGACCACCTCGGCTTATTGGAGAAATACCTATCTGTTGTTTCGAGGCTCCTTCCCGATGATACCGAGCTTGTTCGCCCAGCACTCTGGCATCCTGACATCCACGATGGCAATATATTTGTCCAGGATGGGAGGATTTCCAGCATTATTGACTGGCAGTCTGTCTGGATTGCACCTTTGCTTCTCCAGGCCAGAACCCCTCGACTGATCGATTACCATGGAGAGATCCAGTTGAGACTTCCCGAAGACTTTAAAACGCTGCCCGAAGAAGAGAGGGATCGCGTCAGAGACCAGGTCCAACGGTCTATCCAGGTATACCTTTATGAGGACCGGACGGCAAGAGTCAACCCTCTTCTTGACAGGGCAATTAGGAAACCCCATGGGAAAACATTGGCTCAGCTCGTGAGCTTTGCTGGAAACTCATGGGATGACCACATCGTACCCCTGAGGGACACTCTGATTGACGTTGAAAGGTATATAGCAAATTGGTCATGA
>XR_008008321.1 PREDICTED: Arachis duranensis uncharacterized LOC127746577 (LOC127746577), ncRNA 
TCTTATACGTAATCCTTTTCGTGAGCGATTGTCTCTACTCTCTCTCTCTCTCTGGAATAAAGTAAATACGGTATGTTATACAAAAACTGTCAACACTATATATAGATTATAACTAACTTGTCTCACAAAACTTCCAATAATTTCTCTCTCTCTTTCTCTCTAAAGCTCTCTCCCTCTCTGAATGTTTGAGTTGCAGGTGCTTATTAAAAACATGGCTTGGTGTTTAAAACAACGCGTGTTGCTCCCTGTTATGGTGGTGTTATTGTTGTTGGGAACAAGTCCTTCCATAGCAGAGCTTCAGAAGCTGAAACACACTCCAACAAAAGCAGATCAACCTCTGAACATTCTGGTGGTCGGAGACTGGGGAAGAAAAGGAACCTATAACCAGTCCTTGGTCGCTTATCAGCCCAGAATAGGCTGAGCTAATAGGTCCAAGAGGCAGTTCTAATTGGGTTGGTTGGCTATCATGCTGTCCCAAGGTATGGATTTTATTTTTTGGAATAAAAAAAATTGTTGGGACACATTTCTCAAGAAACGTAAGGTTTACTA
>XR_003114846.1 PREDICTED: Melanaphis sacchari uncharacterized LOC112597600 (LOC112597600), ncRNA 
ATTTCTCGGGCTTGTTCCACGGCGTCATCTTTCTGACTCTTCGTCTGTCACAAACAAATTTGTTCCTGAATAGAGCTGAACTCTCTGTTCCGCTCCGAATTTCTCGCCTTTGATTTGTCGTTAGCCCGATTATGAGGGCTAAGTGGCGTAAGAAGCGTATGCGTAGGTTGAAGCGCAAGAGGAGGAAGATGCGTGCAAGGTCCAAGTAAACCTCGTGGCCTGCACAAGACAATATTATCATGTTTTGGTAAACATTAAACGATATTGAAACTTTTATATTAAATCATCTAAACAGTAATAAACTCTTTCTGTTCAACTTATAAAA
>JX816942.1 Uncultured bacterium clone HC1::G9RA0RH03HINL4 16S ribosomal RNA gene, partial sequence 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAGCGGTAAGGCCCTTTCGGGGGTACACGAGCGGCGAACGGGTGAGTAACACGTGGGCGACCTACCTTCAGCTCTGGGATAAGCCTGGGAAACTGGGTCTAATACCGGATAGGACCGCATGTCGCATGGTGTGTGGTGGAAAGTTTGTTCTTAATTGGACACTTCGGCTGGGGATGGGCCCGCGGCCTATCAGCTTGTCGGTGGGGTGATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGCGGAAGCCTGACGCAGCGACGCCGCGTGGGGA
>XM_053359157.1 PREDICTED: Podarcis raffonei calpain 7 (LOC128398277), transcript variant X5, mRNA 
AAGATTGCGCTCCTATCTCTCTCCAGCGAGAGGTGGAGGGGAGGGAGGAGCGTTCTCCCGTATTGCGCAGGCGCATCGCGACGGCGACGCCTCCGCCACAGGGGCTGCCGGGAAGTCCCTTCCTGAGCGGGAGGCCATAGGCGGAGACGTCGGGGGGCTGCCGTGACGTCAGCGAATAAGGAAAGGAGCGCGCTGAGGCGTCTGCTGCCCGGACCCGGCCATGGAAGCGGCGGAGCTGGAGCAGGAGGCGGTGAAGTTCGCGCAGATGGCGGTGCAGCGGGACCAGCGGGGCCACTATCACGAAGCGGCCTTTTACTACAAGGAAGCTGCACAGTCTTTGATTTATGCTGCAATGGCAGGATCAGTCTTGGAAAATATTCCAGAGAAAATAAGTGAATATTTGGAAAGAGTTCAAGCCTTGTACTCAGCAGTGCAAAGAGTCGACCCCTTGAAGTCGAAGCAGCAGCTGGACTTGGAGCGGGCCCGTTTCCTGGTTACGCAGGCTTTTGACGAAGACGAGAAAGGCAACAGCGAGGAAGCGATAGAGCTGTACACGGAAGCCGTGGAACTCTGCCTGAAAACGGCCAATGAAACTTCAGAAACAGCTCTCCAGGCAAAACTGAAGCAGCTGGCTCGGCAGGCACTGGACAGAGCTGAAGCGCTGAAGGATTCAAAGCCATCTCAGAAAGACAAGCCGGTCCCAGCGAAACCAAATCAGCAAGCCCGGACTTACTTTCCATTAGGGCCTGATTTTTCCTTGAACGATAAGCCACAGGCAGTCAGAGCTGTGCAGGCCAGTGAACCTCAAGGTCAGCGATACACCGCAGAGGAGATTGAGGTGCTCAGGAAGACGTCAAAGATCAATGGCATTGAGTACGTCCCTTTCATGAGCGTTGACCTCAGAGAGCGTTTCGCTTTTCCAGTACCTTTCTCAGATAGATGTGGCAAGCTGCCGTTGTCTCCCAAGCAGAAAGCAATGTTTTCCCGCTGGGTGCGTCCCGATGAGATAACAAACAGCCCCACCATGATCTACACAGTGTCGAGCTTCAGCATAAAACAGACAATCGTGTCAGATTGTTCCTTCGTAGCTTCTCTTGCTATCAGTGCGGCATACGAAAGACGATACAACAAGAAGCTGATTACCAGCATTATTTATCCGCAGAATAAAAAAGGAGAGCCGGAATATAATCCGTGTGGAAAATACATGGTTAAGCTGCATATCAATGGGGTTCCTCGGAAGGTGATAATCGATGACTTCCTACCAGTGGATCACAGCGGAGAACTTCTCTGCTCTTACTCCAACAATAAAAGCGAACTCTGGGTTTCCTTGATAGAGAAAGCTTACATGAAGGTCATGGGAGGTTATGATTTTCCAGGATCAAATTCTAATATTGATCTCCATGCGTTGACTGGCTGGATACCTGAAAGGATTGCCATGCACTCAGGCAACCAATCGTTCGACAAAGACAGTTCCTTCAGGATGCTTTACCAAAGATTTCGCAAAGGGGACGTGCTCATTACAACGGCGACGGGAGTGATGACTGAGGAGGAAGGAGAAAGGTGGGGTTTAGTACCAACCCATGCCTACGCTGTTTTGGATATCAGAGAATACAAGGGGCTTCGATTCCTCCAGCTGAAAAATCCCTGGAGCCACCTCCGCTGGAAGGGAAGATACAGTGAAAATGATATGAAGAACTGGACCCCGGAACTTCAGAAATACTTGAATTTTGATCCCAGAACGGCCCAGAAAATAGACAACGGGATTTTCTGGATTGCCTGGGAAGATCTGTGCAAGTATTACGATGTTATATACTTGAGCTGGAACCCAAGTCTTTTTAAAGAATCAACATGCATTCACAGTACCTGGGATGCAAAGCAGGGTCCTGTGAAAGATGCATACAGCCTAGCTAACAACCCACAGTACAAACTGGAGGTTCAGTGCCCACAAGGTGGGGCTGCCGTTTGGATCCTGCTCAGCAGACACATTACGGACAAGGATGACTTTGCTCACAACCGGGAGTTCATCACAATGGTGGTATACAAAACAGATGGGAAAAAGGTTTACTATCCTGCCGACCCTCCTCCGTATATCGACGGGATTCGAATCAACAGCCCCCACTATCTCACCAAGATCAAGCTGACCTCTCCGGGAACCCATACGTTTACTCTGGTGGTTTCTCAGTACGAAAAGCAGAACACAATTCACTACACGCTCAGGGTGTATTCAGTGTGCAAGTTTAATTTCTGCAAGATCCCGACACCGTATACCATATCCAAACGGGTAAATGGGCAGTGGAAAGGTCAAAGCGCTGGCGGGTGTGGGAATTTCAGAGAGACCGCCAAGAACAATCCTATTTACCAGTTCCAGTTGGACAAGACCGGCCCCCTCCTCATTGAGCTACGAGGACCAAGGCAATACAGTGTTGGCTTTGAAGTGGTGACCGTCTCTACAGTGGGAGAGCAAGGCTTTCAGAAGAAAAACAGCGGCGATTACAGTGAGCCTGAGGCCAGGGACTGTCTGGGAGAAATATATATTTAAATGGCTGAAATGCTTTTTAATTCTGCAACTTGGATGCTCAAGGGAAGAGTCTACGGTGCACACAATAATATTAAATCCAGAGCTTTGGGTGGTTTTCTTTTTACTATTTATCACTGTGCCACAAATGGGACAAACAATTGTACCCCTTCGCTCTGACTTCCAAGCTTGAATCTTGCCATGTATCAGAGAAAAAAAGAAAACACACACGACAACTGTTTAGTTTT
>AY736006.1 Aedes aegypti inositol-1 monophosphatase mRNA, complete cds 
GGGGAGTATTATTCAACTCGTAAAGTCATTCAGTCCAGTTTTTCTAATCATTATTTGAAACATCCGAAGCTCCCTCGATAATTGAAAGCAAATAGCCGAAATGTCGCTCGATTTGGACGAATGTTACGAGCATGTCCTCGGATTGGTAGAACAAGCTGGACAGATTATCGCATCGAGGAATTATGGGGAGAAAACGGTGGTGGAAAAGTCCAGCAACATTGATTTGTTAACCGAAACAGATCAGCAAGTCGAGCGACTTCTGATGGATGGTATAACTGAGAAATATCCCGATCACAAGTTCATTGGTGAGGAAGAAACCAGTGCCGGGAAGAAGGCAGAGCTGTCCGATAACCCTACCTGGATTATCGATCCAGTGGATGGCACCATGAATTTCGTTCACAGTTTTCCCCATTCATGCATTTCGATTGCGTTGCTGGTCAATAAGCAAGCCGAAATTGGAATCATCTACAATCCGATGCTGAACCAGAAATTTACGGCTCGCCGAGGCAAGGGCGCATTCATGAATGAGAAAGCGATTCGGGTTTCGGGAGAAACTCGACTGGAGCATGCTTTGGCAACGACCGAGTTCGGCACTAGTCGTGACGAGGAGAGGACGGCTATCGTTTTGGAGAACATTGGGAAACTGATTCGAGTTGTTCACGGGATGCGAAGCTTGGGATCTGCTGCCCTAAACATGGCCATGGTTTGCCCTGGGGTGGAGCTGATTTTCAACTATGAAGTGCGGGTATCCACGCCCTGGGGATATTGCCTGCGGGGGGAATTTGATTTGTCCCGGGAAAGCAGGCCGGGTGTCTGTCTGGATCCAGCTTGGAGGACCTCCTGGATCTGATGTTCTCCCCCCCGGGTGGCTGTGTGCCAGTTTCGCCAGAGCTTTGGCCGGAATAAAGGTGGTTCCATTTGGGTTGAACGCCAGTACTTTTCCGCCAGCCCAGAAGACTTAGGAAAAAGTTCCCCCGAATGGGTTGGGATAAAGGATTT
>BC169882.1 Xenopus laevis signal transduction regulatory protein SAP-2, mRNA (cDNA clone MGC:196609 IMAGE:9041516), complete cdsBC170158.1 Xenopus laevis signal transduction regulatory protein SAP-2, mRNA (cDNA clone MGC:196885 IMAGE:9093539), complete cds 
TCTGCGGTGTTGCCTGTTTTAGATTTCATGACTCAAATGCTTTAGATAATCATGATGGAAATTATTTCCACTTTATTTTTTCCTATTATTGTTGTAGTCCTGGCAAGAGTCATTTCACTTCAGCCTACGAGTGTCTATTCGTGTGCTTGTGGGATGGTTTAGTAATTAACACGTTTATGTCTCCACCTGTGGGATCCTGTCTCGTCTTTGCTGCATTTACTTTTGAAGAGTTTAAAGGCAGCTTCTTCCTCTCCAGCTTGTCTAGAGGTGCATCTGCCATTGCCACTCTTTCATCACACTGTTCTGCCCGCAATGGAGAAGGTATCCGTTTATCATGGGAACATAAGCCGTGAGATGGGCGAGAAGCTCCTGAGTGATGCCGGGAAAGATGGGAGTTACTTGCTACGGGATAGCGAGACCATGCCGGGAATGTATTGCCTCTGTGTTCTGCACAAAAATTTGGTCTATACATACAGAGTTCATCAGACATCAACTGGTTCCTGGACTGCTGAGGCTGCACCTGGCGTTACAAGAAGGCTGTTCCGGAAGGTGCAAAATTTGATTTCTGCATATGAAAAACCAAACCAGGGAATTGCAACACATCTGCAGCACCCAGTGGAGAGGACGGTGACAAAAATTGTTTAAGGGTGATTAATGGATGGATGCTTAAACAAATGAGTCATTTGCAGATCAATTCATTCGACGCTGCCTTGAAGAGAG
>XM_040760640.1 Sporothrix brasiliensis 5110 uncharacterized protein (SPBR_02337), partial mRNA 
ATGACTCCTCGCCAACCACAGAGCGACAGTGGTCGTGCCTGTACGTCAATTGTCACAGAGTACCACCGCAAAAAGCCGAATCAGGAAGCGCCGTTTTTGATCGAGGTCGAATACTTGAACTCTGCCGGCATAAAGGCCCACTTACAAGAGCTGCTTTGGAACTATCGCCGCATCTACCGTCCGGATATTGACCCAGAGGCATTGGGTGATGCCGAATACAAGCGACTCGAGGCTACATCCAGCACGGCGTGGTCGACTCTACAGACAGCGTTCCGCCATGAACGTGGCTTTAGTTCCTCGTTTGCCCTGAACATGGACGACGGTTCCGACGAGCGCATCCTGGAACAGCTTGTCACATGGGCGGGCCGCATTGAATGGCCACGCGGAAGTGACGAGGGCTTCTGGACAACTACGGCCCTCTCCGTGGACGAGTGTTGTGATGCTACGCGGCCATTCATGGAGGATAAGTTCTGGCCGTTTACCAATCTTATCAGGATATTTCTCAGTGCACGTGTGCTCGACTCCGGTATCATCCTAGCCGACCTCCCCGGACTCCAGGACGTCAACCTGGCTCGAGTCCGTGCGGCCCACGAATACGTTCTGCAATGTGACAGCATTCTTGTCGTGGGCCGCATTGCGCGGGCAATCTCTGATCAGTCTTTGCGGTCATCACTCTACACGTCCCTTGCAAGTCACGCCCCAAACGAGTGGCAGGAACAAGGCGCAGCCCGCCTAAACATCGCCGTTGCACTTTCGCATGCGGAAGACATTAATGTTCGATCTGCACGGCGTGAGATCCAAGACCCAGAAATCAAGGCCAAACTGGATCGCCTCGACATCGAGATAAACAATGCACAAGCCGCAGGTTCCCTTCGAACGGAACAAAATATGAAACTCATGCGAAAGCGACTGTTGGTCGAGGAGAGAAACAAGAACGTCACGAAAGGCTTGCAGGATGCTTATGCCTCCAAGATGATCAACCAAAACAGGCAGTTGCCCGTTTTCTGTATTTCCAACAAGTGGTACGAAAAGTTTACGGCCATTGGAAACACAGAGCTCGTGCGGGAAAGTCAGATTCCCGCCCTCCGACGACACTGCCAAGCCATCGCAGCGGATGCCCTACTGGGCGAAGCAAGGCACTACTTACGAACAAGTCTTCCCTCTCTCGTCACCTCGCTCGACCTCTGGGTCACAAATTCCATTGCCACGCAGGCTCTGCAGGGAGACGGCCGACACGACCGATCTGATCCCTCCGTAGATCGCGTCCGCCAAGTGGTCCGCGGAATCGACGACGAAAATTTGCTAGGCCCGGAAAGTGACTGGGTCGACAACGTCGAAAGTTGTTTCAACGAGGAAATAATGGAATTTTTCGCCAATAGGGGTGACATATGGAAGGATCAAGCTGTCAACGAAAGCAACAAGTGGACTGTAAAGTCAGGTCCTAACTACTGGCATCAAACCCATTACAATTCATGGTGTCTTCATGATGGCGATTGGAGCACACCAAAGAAGCCACATGTCAACTGGAATGCCGAGTTGATCTGGAAGATGCGGACCGAGCTCGAGCTGCAGTGGGACATTTTCGAAGAGCAAACGCATGACGAGTTCAAGGCCGTACACGAGAACCTTGGTGCAAGCCTCGTTGAGCTGAAGGACGCTATTGGGTCTGCAACTAGCGTCCCAGGGCGTGAAGGACTGGTGCGCTTGATCAACTTCAGCTTGCACGAGTTCAAGCACTCCCTGGACCAAAGAGAGCGACGCTTCCTCGTGACGCTGAGGGCTACGCGCAGCAAGACCAGTGAAGCCACATGCGCGTCGTATATTGTCGAGCACATGCTTCCGGCATACCGCGACGCGTCGCTGGAGTTTGGGACCGGACGGCGTATCAGGCAGGAGACGATCATCGGCTCAAAGGTAAGCAGAGGTGACATATTTCTCAGCATGGGCAGTGCATTGGCGCGTGATATCCAAAGTCTTCTCCGACACACAGAGGAGGAGATCGAGCGCGCCATAGAATCGATGGCTGAACACATTCTGCGGAATGTCAAAATGGCATTTGGGGCCGATGAGACTCCTCACACGTCTGTGCCATCAGCTGCCCTGCGGAATGCCGAATACAACGAGCGCCTGCAGCACTTTTCGAGTATGGTCTCTGTCTGGAGAGAACAGTACTCGCTTTTGTTTGCGAGCGAAGATGGGGCGTTGGACTCTCTGTTGTGA
>XM_027854401.1 PREDICTED: Vombatus ursinus myo-inositol oxygenase (MIOX), transcript variant X2, mRNA 
CTCAGACAGATCACACACAAGCCACGGGTGACACTCTACACACCCCCTTCCCATCCTGTTCACTGCTAGGCCTGTGGTCAAGATGAAGGTTTTAATGGGTCCAGATCCTTCTCAGATTTATCGGCCTGATGGGGGCAAAAATAAAGAGGACTTCCGAAACTACACTTCAGGACCCCTCCTGGATCGAGTCTACACCACCTACAAGCTCATGCACACGCACCAGACCGTGGACTTTGTCAGGAGGAAGCACGAGGAGTTTGGTGCATTCTCCTACAAAAAGATGAGTGTGATGGAGGCCGTGGAGCTGCTGGACGGGCTGGTGGATGAGTCTGACCCCGACGTGGACTTTCCCAATTCATTCCATGCATTTCAGACGGCTGAGGGCATCCGGAAGGCTCACCCTGACAAGGACTGGTTCCACCTCGTGGGGTTGCTGCATGATCTGGGGAAGATCCTTGTCATGGCTGGGGAGCCTCAGGATAATCCTGACACCAAGGACCCTCGATACTGCACTGATTATGGAATGTATGAGCCCCACTGTGGCCTGGAGAACGTACTGATGTCCTGGGGCCATGATGAGTACATGTATCGAATGATGAAGTTCAACAAATTCTCCCTGCCTCCGGAGGCCTTCTACATGATCCGTTTCCATTCCTTCTACCCTTGGCACACCGGTGGCGACTATCGGCACCTCTGCTGCCCCCATGACCTCAGCATGCTGCCCTGGGTGCAAGAATTCAACAAGTTTGATCTCTACACCAAGTCAGAGGACCTGCCAGATGTGTCCATGCTTCGGCCATACTACCAGGGCCTCATTGACAAGTATTGCCCCGGGGTCCTTTGCTGGTAACGGCCTCTGCTCTGGTCTGAGCCAGCTTCTTGGCCCTCATACAGCCGGTCAGACTCACTTGCCTCACCAGGGGCAGCCAGCCCCCTCCCTTGTACACACCAACCTGTCCACAGGCCCCTTTCTCCCCCTTCCTATGAGCTGGGGATTATCAGCCCAGAGACCACCCCGAGCCACTGGCCACCCCCTTAGCTGACCTCTCCATCCCACTAGCAGCAGCATCCATGTCTTCATTATCTCCATACCTCATTGCCAACTCCATCCCCGTTACATCATCATTGCCAGTCAGCAGGTGCCCATCACTTTCCTGCTTACCATTCTCACCATCATTTGCAGCCGTCTGCACCACATGCTCTGGGGGTCCCTGGGCACTGCTCATCTCTCCAACCACACCCGCAGATTCTTAACACTCCTGCCGAGAAATAAAGACCGTACAGAACCCTG
>XM_044147674.1 PREDICTED: Aphidius gifuensis vesicular integral-membrane protein VIP36 (LOC122849090), transcript variant X1, mRNA 
TAGGTTGCTTACGCAGCTCACTTTTTTATCATTATCATGTCATAAATATTAAATATCCATTATATCATTTACCTATTGTGATGTGTCGTTTTACACGAGCTAATCAGCGCTCATTTTTCCATTCGTGACTTGGCAAGATAATTATCGACCTGTGGCCCAATAAATTTGATTAAAAAAATCTTCAAAAATTCATTCAGATCTATAAACAACTAATTTGATTGCGTTTGAGTGGTTTGAAATAAAATTTTGATCACAACCGGTCAAACCATCAAGAGGTGCTTGTTAAATTGATATCAAGATGCATTCATGGTTGTTGTGTGTTGTGATTATTGGATCTGTCAATGCAGAATGGAACACCAAAGATTTTATGAAAAGAGAACACTCTCTTGGCAAGCCATATCAAGGTATGGGAATGTCAGTACCATACTGGGATTTTATGGGCACCACAGTGGTCACAAATGACTACATAAGGCTAACAAGCGATATTCAAAGTCAACAAGGATCACTCTGGAACTCTGTGCCATGTAACCTCAGAAATTGGGAAGCCCATATACATTTTAAAACTCACGGTAAAGGACGTGATTTATTTGGTGATGGTTTTGCAATATGGTATGCATCGGAAAAAATGATGCCAGGTCCTGTTTTTGGTTATAAAGATTATTTTAAAGGTCTTGCTATTATTCTTGATACATATAGTAATCACAATGGCCCACACAATCATCAACATCCATACATATCGGCCATGATTAACAACGGCACATTACATTATGATCATGACAGAGATGGTACACATACTCAGTTGGATGGTTGTGAAGCCAAATTCAGAAATCTTGATCATGATACGTATCTGTCCATCAGATACGAGGGAGACACCTTGACCGTTTCAACTGATATTGAAAATAAAAAGGCTTTCAAAGAATGCTTTTCAGTAAAAGGAATTCAACTACCAACACATTACTACTTTGGTATTACTGCCACAACTGGTGATTTATCGGATAATCATGATATTTTGTCATTTAGATTATATGAACTGGACACACCAGTCGATCCGAATGATATCCAGGATCGTTCCGCAATCGTTCCATCAGCAACATACTTTGATTCTCCACGAGAACACATCGATGATCCAAAGCCATCGTCTATGAGTGGATTTAAGATATTCTTCTTAATGCTTGTTAGTGCAATTGCACTCGTCGCCCTGGTCGTCGTAAGCATTATGGTTTATCAAAAACACCAAGAAAACAGTCGGAAACGTTTCTACTAATAGAAAAAAAATAATAATAGATATTAAGAATCTTCCAAGACGTTATTAGAATAATTCAAGAATCAAAACATTGTACACAATTACATATTTCATAATTTTTTT
>XM_025922904.1 PREDICTED: Puma concolor solute carrier family 30 member 8 (SLC30A8), transcript variant X2, mRNA 
ATGGAGTTTCTTGAAAGAACTTATCTTGTGAATGACAAAGCCACTAAGATGTATGCCTTCACCCTAGACAGCGTGGAACTCCAGCAGAAATCCTTGAATAAAAATCAATGTCCTGGAGAGAAGCCAGAGGAGCTGGACTCAGGAGCCATCTATCACTGCCACAGCAACTCCAAGGCCACAGAGAACAGAGCAAACGAGCAAGTCTATGCCAAGTGGAAACTCTGTGCTGCTTCAGGAATATGCTTCGTTTTCATGATTGCAGAGGCCGTGGGTGGGCACATTGCTGGGAGTCTTGCTGTCGTCACAGATGCTGCCCACCTCTTAATTGACCTGACCAGTTTCCTGCTCAGTCTCTTCTCCTTGTGGTTGTCATCAAAGCCCCCTTCGAAGCAGCTGACGTTTGGATGGCACCGGGCAGAGATCCTTGGTGCCCTGCTGTCCATCCTGTGCGTCTGGGTGGTGACGGCTGTGTTGGTGTACCTGGCATGTGAGCGCCTGCTGTACCCTGATTACCAGATCCAGGCGACTGTGATGATCATCATTTCAGGCTGTGCGGTGGCAGCCAATATTATACTAAGTGTGATTCTGCACCAGAGACATGCTGGACACAATCACAAGGAAGTGCAAGCCAATGCCAGTGTCAGAGCAGCCTTTGTGCATGCCCTCGGAGATCTATTTCAGAGCATCAGTGTGTTAACCAGTGCACTTATTATCTACTTTAAGCCAGACTATAAAATGGCTGACCCAATCTGCACATTCGTCTTTTCCATCCTGGTTTTGGCCAGCACCATCACTGTCTTAAAGGACTTCTCCATCTTACTCATGGAAGGTGTGCCAAAGAACCTGAACTACGATGATGTGAAAGAGCTCATCTTAGCGGTGGATGGAGTGGTGTCTGTGCACAGCTTGCACATCTGGTCTCTAGCAATGAACCAAGTGATTCTCTCGGCTCATGTTGCTGCAGCAGCCAGCCGGGACAGCCAGGTTGTTCGAAGAGATATTGTAAAAGTCCTCAACGATAGCTTTACTGTGCACTCACTCACCATTCAGATGGAATCTCCAGCTGACCAGGACCCTGACTGTTTTTTCTGTGAAGAACCCCGGGACTAG
>XM_025582792.1 Aspergillus brunneoviolaceus CBS 621.78 hypothetical protein (BO95DRAFT_367563), partial mRNA 
ATGCTCGGTCGACTATTGAATACTGCAGCGGCCACTCTCAATCCGACGGCATACTCCGCGAAGAACCCCCAGCCACTGGAATCGGTCACAGAGGAGGAACATACATCGGGCTTGCTTTATCCTGACGTTAGCCTTCTTCGCCGCTCCAACTCACACGCGTACCCCCTTCATACCGCTTTCAATTCCCCGAATACCTCGACGGCCGGTGGATATGATGATCGTGGTGGCGGCGTCGAATTGGACCACCTGAAGGATTTCCGTGTGATAATCGCCCAGAACGCGCTGGGAGACCGGGATGCCTGCGTGTTACTGGATACCCGGGCCACGCCGCAGGGACAAGGCTCACATGGTCTGGGCTTGGAGCCACAGGTGTTTGAAAATACTGGTACCCGCCATGCCCGCACGCTCTCCACGTTGACTCGCGGCCCGCGGCGGGGTTATCTGCCTCAGTCATCGGTCGTGGAATCAAGCCCGCTGTCTGCGGCCGCAGAGACACGGCGATCCCCGCCCATGTCTTCTGGCGCGTTCATGAGGGCACGGGTTCGTAGCTCTACGCTGGCGCCAGGTGGGAACTTCACCGAAGGTGGCCATTCCCGGGGCACGACGGATGCGAACGATTCCGGGTTGCTGAACTGCATCTTCGGGAGCAGTGCTTTCAGCTACAAGGGTTCCTCCACCAAGATGCATATCATTTCCGCCGATGATGAACCGAGTCAAACCTCGCCAGCCTCGCCGGCGGCACGTAGCTCTCTATCACGAGCATATACTACAGGAAGTTCTACGACGTTTGGCGGTTCTGATCGTGGTAATGAGTCTAAACCGCCTGCCAAGGTCACTATCCTGTTGACAAGGATGTTCAGTGTGCATCTGCCCGAAGGCGGAGATGATGACTCCTCTCCGGACAGGCCTGACTTGTCATCTTCAGTCTCCCACGACGCTCTCCCGAGCCCAGGGTTTCCCTTCCCGGATGTCTCGAAGCGCAAGAAGATCAAGGAGAAGAAAACTCCCATGTATGCGGTCGCTATCACAATCCAGATCCCGCTCTTATCCCGAAATGGTGGGCGGCCGGTTTCTCGGTTTGCGCAAGGTCCAGACTCTCCCAAGCCAGGGCTTTCGTGCTCATTGGACTCGGACTACCGTTGGCGTGGAGGCTTCTTCGAGGACAGTCTGTCCCATGCATCCCCTCCTGCAAGTTTGGATGAGCGTATTGATCTGCTGGTTGATCATTGGGACATCATCAACCGGACGTTGTCCCATTTGGAGAGGCTGTCTCGGAACGAGATCCTGTTCTTACTCAAGAAAGTAGACGCCTCGGCAGGGCCGCATCCGAAACCCGCCAAACCTCCAAACATGCAAAGGACGAATCAGACTTTTGTTCATCTGCCGGTCAATGTTTTGTCCATCAATTCCAAACTCCGCGACGAAGCCATCCGCAGCACTCGTCGCATTAGCACGGCTCTGCAGATGCCGTACGTTGTCACAGGCCAGAGCCGCTGGGGCGTCTGGCGTGAAGAAGGGCGGTCGATAATCCGTAGCCTCGGAGACAAAGACCACAGTTTCTTTTTCCTGGTCTTGGTTACTGCCTTCTTGGGAAACCATACGGAGTGGCTCAATGCTGTGGGCCCGGAGTGGTACCGTCGGCGGCACTACCTACAACAGAAGGCTCAGCAAGACGCCGACCCGATGCTGGCGAATCGCACCGTGATCATCTCACCGGATAAGATGACTGCCAGAAGACTGATTTTCTTGCTGGCGGCGTTTTTGCCGCCCAAACAGCGCTTCGAGCCCCTGCCGTCTCCGATTCGCCCTGGCACTGCGGCGTCGACTCGTGCTGTCTCCCAGAGCCCGCCTAATGTTCCTATCCTACGACAGGAGGCATTGCGGAGGGTGATGGAACGACGGTCTCGTGCGCAGCGCCTCAACCTCAATGAGAGAGAGCAGCACCAGCGTTCTGTGAGTGCTTCATCGAATGAGACGGCCCATCGTTCGGCGGAAGAACCCGAGCCCATGATTCCGCCTGATTTTGGTGCGAAGCGCAGGGGCTCAGATGCCCGCTCGATCCGAGCCTTAGGGGTTCCTATCCATACTAGAGACATGCGTCCGAGGAATACCAGTGCAGCCACCACCTCGACCACTACTCCGAGTAGTACCGTCCCCGTCCCGCACTTCGCCTCGCAGAGCCGGTCTGAGCGGATGGGATCGGATCCAAGTGTGGCTGAAGGACGTGACAGCCTGGCGTCGGAAACTCTTCTAAAGAATTTGCGGCGGTCCGAAACCTCGGCAACCTGTGCCAATGGCCAGATGCCTCCCGCGAGTGGCCGCTGGGGCACATTGTTCTCTGGCTTATGGAGCTCTCGTCAGGAGTCATCAGACGCTGGTGACGCCCCTGCGCCATCTGAAGCGCGCAAGCGATCGGTATCTGCTTATACGAACCCAGCCAGAAGGAACCCTCCGACACTTGCCCAGATGGTCAAAGAAGCATCAGAGGAACCCATGCCGGCGGCACCCAAAGCTACTACGAGCGGCAACATCTCTATCCCTCCGGCGACAAACAGTCATATCTCATTCGAGGAGGACGCACCGGATTTCTCGTCGACCACGGACCAGACCAGGGAGTCATCCTTGAGGATGGCCGTTCGTGGAGATGACGGCGTGGTGGATGTGGACCTGCCGCTCCCAGGGTTCCTGTCGCTTTCGTCGTCTGGGGACTCCACGCTGGCTTCTCCCAAGAAGACCCGCACCTCGGTTACTAGTATGGATGCAATGGCATCTACGCAGAGCAGTGTCTCCGGGTTCCACGGCAGTCTCAAGGACAATGATGGACCTAACACCAACGTCGCTGGCTGGCTGCGAACTTTCCATGACGATTTTCTCCTGCAGGCCGTGAGACCATACGCTTCGCTGGAAGCCGATATCAAGCGCGCCATGCAAGCCGAGCCTACACCAAGCCAAGCTCTGTGTCTCAACGCTGATGGTTCCGAACGATGGGTGGATGTTGCGACCACCGTGATTGCGGATGTCCGGAACTTCACCGTGAAGCGACTGCGACTGAGACGTAAACTTGTGGGACATGGGTCGTCGCGCAAGGCGTATACGCCGTCTTTCCCGTCGCAGCCCGGCACTCCGCGGTACGTGTCCAACGGGTCTGTCTCGGCCTCGCAGCTCACCAGCTTCTTCTCGCACGCCACTGGGTCGAGCAAGACATCGAACAATTCCTCCATGGACGATTTCTATCCTACCGAGGTTGAAGAACGGTTCGTGGAAGAGCCCGTGATGGATCTGGATGGCACTCTTGTCGATGCTCTTGAACGGGTGCTTGCACAGAGTGGACCGTCGTCCATGGTGCACTCTCGCGCGCCGTCGCCATCCCGTGGTCGTCGCGGAGAGGATAAGCAGGCATCGGATGCCCCCGTGCCCACACGGGAAGAAATCCGACCTGTCGAGGTGCCTCGGACTGAGTGTCGCAAGCTGGTCCTCGGGGCGCTGGAAGAGGTGGTGCGCAGTGTGACGGCGGAGCATTGCCGCGAGGATGTTGACGGGGAGCTCGGCCTAGCAGATCGCGAGCGCAAGCGTACGTTGGCCGGGGCGGATAATACGCTGCGCGAGGGAGTTCGCAAGTGGCTTCTCGATGTTGAGGAGGCGTGGTAG
>XM_046049963.1 PREDICTED: Micropterus dolomieu ArfGAP with GTPase domain, ankyrin repeat and PH domain 1 (agap1), transcript variant X1, mRNA 
GCGGAGGAGGGAATGGGACCGAGCCCAGCGTCGCTGTCAGGGAGGGTAAAGCTATCGGAGCAGAGGAGGGGAGGGCAGGCCCGGGTCCAGGGCTGTAAATCCAGGGACATTTGAATCACAATTGAATCCGGTCTGAGGTGAAAGAGGCTCGGCTGGCTGGCTGGCTGCGCTGCGCTGCGGGGGATGTGCGCACACAATGGGAGACGACGCGCTGGCTCCGTCCGGGACGCGGCGGCAGAATAAAATTCACCTCTCTGTTTGTTTGTAATGGAGACGCGGACACCGGAGCAGGATCCAGAGACGTCAGCGGGACACACGGCGGAGGACTCCCGGGGGTAAGGACTTGTGTGAAAGTGTTTCTTCATGCCGGGACGGAGCGCTGCTGCGAGCCCGGAGAGAGGAGCTTGGGACGCGCCTGCTGCCTGTTTGTCTCGTTTGCTGCCAGTTTAAATTCCGCTGGGATGAACACGGAATGTATTTCCTGCGTCAAAGTCCGCGCTGTTTGCACATCTGGATAAGGGGAGAGTCGGTTATTGCCCCGTAGCGTCCCCCCCCCGGTGCGGTTGAACCCGTTTGTGGAGAAACGTTTCAAGTCAATTGACCACTTCCATGTTTTAGACCCTCAGACTGCAGAGCTCAGTGTGAGCAAAACAACAGAAACCCTCTTTTTAGTTTAATAAAGACATCATAAAGGAGACGACAGGATCATTTGAGTGATTTTTCTAATGCAATAAAGCCTCGTTAGAGTTTCTGTTGGCTGCTGCAGACTTTAGATCAGAGCTGAAGAGGAGCTCTTTCATCAGGGATGTACCTTCTGGACAGTAACTGCACTGAAAGGATGGAGAGGGGCACGCCTCAGAGGAAAACTGTCTACCGCATCTCGCTCACCTTGGTGAAGAGGGAGAGTTTAGATGGTGAGGATGAAGGCTCAGGCCCCCGGCGGGCGGAGAACCCCAAGGTGGGCACCATCCGGCGGGAGAGCTCGGTGGAGATCCAGCGTGGCGGCCTGCTGGAGCAGCTGAAGGAGGTGGAGGACGAGTCGGACGACTTGTCGTCGTCCCGGGGCTACATGAGGAACTTCAGGACGTTCAGCACGGGGCAGCTGGAGCTGGGGAGGCTGAAAATCTCCAGGAAACAGCAGCTACAGAAAGAGCCGAAGCAGAAGGCCTCCAGCCCGGTGGCAGAGCACGCCGCGGAGGCCCCTGAGAAGATGTCGGCACAGAGTCAGGAGCACACTCGGGGGGAGAGCAGAGAGCAGGAAGCGGAGGACTCAGACAGACTTAAAGAGGAAATCTGCTCTGAAACTCACAAACAAACAGACGCTGCCGTGGAGACGAGCGGCGTGAAGAAGAAGAAGAGGCTGGTGAAGGCTCAGAGCATGGAGGAGAGGAGCTCCGACCCTCCTCTGAACGGTGATGGGTCTCACTCCAAGAGCAACGGCAAAGCAGCCAAAGCTCCCTCCCCTGAGACGCCCCCTCTGAAGCGGCCGCCCGGCCTGCTGCGCCGCAGCTTCAGCTTCAGACACTGGAGCGGCGGCGAGCTGCTGCGTCTGCGAGCGCTCTCCAAAGACAAACACCACAGCAGCTCCAGCTGCATCGGGCGTGACGCCGGGCCGGGCGGCGGCGAGAAGGAAGCGGAGGCTCCTGTCGCGCTCCCGGCTTCCCGCCTCGCCGACCCCACCAGAGTGAAGAGCAGGACTCTGGAGGTCGGCGCCGTCCTGAACAAGACGGACTCCATGTCTGAGCTGAGCCGCTGGGAGAGAGCGCGGGGCAACAAGAACCGGACGCTGGACAACAGCGACCTGCAGCGGCTGGCGGCTGAGAGGGACGGGTCAGGAGGGGGGTTCCTGCTGAGGGGAGGGGGAGGTCGCTCCAGCGAGAGGCGTCTGGTTCGCTTCTTCAGCGGGATCTTCTCCAGGAGGGACGGGGCAGCCACCTCGACCCCGGTGGGAAGCCCCAGCAGCCTCCCGCGGAGCAAGAGGAGGGTTCTGTCCCAGTCCAGCACCGAGAGCATGAACGGAGGAAGCTCTGAAGATGCGTTTGTGAACAGTCAGGAGTGGACGCTGAGTCGATCGGTACCAGAGCTGAAAGTGGGCATTGTGGGTAACCTGGCCAGTGGTAAGTCGGCGCTGGTCCACAGGTACCTGACAGGAACGTACGTCCAGGAAGAGTCCCCTGAAGGCGGACGCTTTAAGAAGGAGATCGTGGTCGACGGTCAGAGTCACCTGCTGCTCATCAGGGATGAAGGGGGCCCCCCGGAGGCTCAGTTTGCGTTGTGGGTCGACGCCGTGATCTTCGTCTTCAGTCTGGAGGATGAGATCAGCTTCCAGACCGTTTATCACTACTTCAGCCGCCTCGCCAACTACAGGAACACCGCCGACCTGCCGCTGGTCCTGGTCGGCACGCAAGACGCCATCAGCTCAGCCAACCCGAGGGTGATCGACGACAGCCGAGCCAGAAAGCTCTCCAACGACCTCAAACGCTGCACCTACTACGAAACCTGCGCCACCTACGGCCTCAACGTGGAGCGGGTCTTCCAGGACGTCGCCCAGAAGATCGTGGCTACCAGGAAGAAGCAGCAGTTGTCCATCGGGCCGTGCAAGTCGCTCCCCAACTCGCCGAGTCACACGTCCGTCTGCGCCACACAAGTGTCAGCCGTCCACATCAGCCAGACGAGTAACGGCGGCGGCAGTTTGAGCGACTACTCGTCGTCGGTGCCGTCCACGCCCAGCACTAGCCAGAAGGAGCTCCGCATCGACGTGCCGCAGACCACCAACACGCCAACGCCCGTCCGAAAGCAGTCCAAACGCCGCTCCAACCTCTTCACCTCGAGGAAGGCGAGCGAGTCGGACAAGGACAAGAAAGGCCTGGAGGCTCGAGCCGACAGCATCGGCAGCGGGCGAGCCATCCCCATCAAACAGGGCATGCTGCTGAAGAGAAGCGGTAAATCCCTCAACAAGGAGTGGAAGAAGAAGTACGTGACGCTGTGTGACAACGGACTGCTCACCTACCACCCCAGCCTGCATGACTACATGCAGAACGTCCACGGTAAGGAGATCGACCTGCTGAGGACCACGGTGAAGGTCCCGGGGAAGAGGCCGCCTCGCGCCGTGTCCACCTGCGCGCCCGTGCAGAGTCCCAAAACCAACGGCCTGACGAAGGACATGAGCAGCATGCAGCTCGGACAGACTCCAGGTTCGGTGAGCAGCAGCTCGTCGGTGTCTCAGATGGCGAGCGGCGTCAGCTTGGTGTCCTTTAACAGCCGAGGTCTGGAGGGGATGCACCAGCGCTCCTACTCCGTCTCCAGCGCCGACCAGTGGACCGACGCCACCGTCATCGCCAACTCCGGAGTCAGCACGGATACCGGCCTCGGAGACTCGGTCTGCTCCAGTCCCAGTATCTCCAGCACCACCAGTCCGAAGATGGAGCCGCCGCCATCGCCGCACGCCAACCGCAAGAAGCACCGGCGGAAGAAGAGCACCAGCAACTTCAAAGCCGACGGCCTCTCTGGTACTGCGGAAGAACAAGAGGAGAACTTTGAGTTCACCATCGTGTCGTTGACGGGGCAGACGTGGCATTTCGAAGCCACTTCGTACGAGGAGCGAGACGCCTGGGTGCAGGTCATCGAGAGCCAGATCCTGGCCAGCCTGCAGTCCTGTGAGAGCAGCAAGAACAAGTCTCGTCTGACCAGCCAGACGGAGGCCATGGCTCTGCAGTCCATCAGGAGTATTCGAGGAAACGGCCGCTGTGCCGACTGTGAAGCCCAGAACCCGGACTGGGCGAGTCTGAACCTCGGGGCCCTGATCTGCATCGAGTGCTCGGGCATCCACAGGAACCTGGGCACCCACCTCTCCAGGGTTCGCTCTCTGGACCTGGACGAGTGGCCGCTGGAGCTCATCAAGGTCATGTCGGCCATCGGCAACGAGCTCGCCAACAGCGTGTGGGAGGCCAACGCGCAGGGACGCCTCAAACCTGGGCCGGACGCCAGCAGGGAGGAGAGGGAGCGCTGGATCCGGGCGAAATACGAGCAGCGTCTGTTCCTGGCGTCGCTGCCCGGCACCGACCTGTCTCTGGGCCAGCAGCTGCTGAGGGCGACGGCCGAGGAGGACCTTCGCTCCGTCGTCCTGCTGCTCGCCCACGGGTCACGACAGCAGGTCAACGAGACCTGCGGAGAAGGAGACGGACGCAACTCGCTGCACCTGGCCAGCCGCAAGGGCAACGTGGTCATCACGCAGCTCCTCATCTGGTACGGCGTGGATCTGATGGCGAGGGACACCCACGGCAACAGTGCGATGGCATACGCTCGGCAGGCCAACAGTCAGGAGTGCGTGGACACGCTGACTCAGTACGGCTGCCCCGACGAGCGGTTCCCGCTCATGGCCACGCCCAACCTGTCGCGCCGCAACATCAACCGCAACAACAGCTGCAGCAGCGCCGGGAGCGCCGCGCTCATATGACGAGGGCATGTCACCGTCTGACTCTTTATGACAAACAAACAAACAAACGCCGATTTGGGAGAATCCTGACCGTTTATTTTGGGAACCACTACCTGTTGCGACTCTAAGCCCCGCCCACCTCACCTGAGAGCCACCACTGCCGCTGTCGGCTCGTTAAGACTGATTAGAGCTTATCACGGGTCAGTGGTGGCGCTGTTTGTTTGGGAGAACCCTCAACGGGTGGGGAAACCCTAAAACACGGTGGGAAATGTGGTCCACAGTCGCCGATGGCTCATCAGAGCTCTTTGGGAAATAATCACGTGACTTATGACAGCCAATGACGGCCAGTCTGAAAGCTCTAGGGAAATCATACCTCATCACACAGCTATACTTTAACGCTACGCGACCAGCTCCCGCGCAACCTCGCCACGCATCATCCGGCCAATCAAAATCTGTCTAGCCAAAACATATGGTCACAACATAAGGAAGCAAACTGTGAGACAAAAATATCAGGAGGGGGGGGGGGCGGTCTTCATAGCATGCTCACACACAGGAAGCCATCTGAACTGCACATCATCTTCATCATCTTCACCAGTCGAGGACTCCTCTCTGTTGGATCCCTGCAGCTTTTCTCCTCCTCCCACCTGTACTTTTTATTATTTTATGAATTATGTGAACCCTCCTGCCTTTACACCTTCTTTTTTTTTTAAATGTGAACAATATCTCGATGTAAAACTTTAAGAGGAAAAAAAAAGATATCAGATCTTAGAGGTGAAAAAGAAGTGTGGTAGATCGCATGTCCTAGACACTTTTTGCTATTTTAATTTAAGGATTTTTTTTTTCCTTCTCCTGGATTGTGTATATTGTATCTCGATGTGCATTGCTGGACCAATCGTTTAATAATGTCAACACGGTAAGGGGATTTATTTAGTTTGTTTCCGGGTGTATAAAGTCGTTAAGTGTACAGAAGCTCTTGCCAGGCTCAGGGACCGGAGACTCTTGATCATGAACACCCCATCGTCTTTTCCCAGAGTCCTTAACCCAGCGTTCAGAGCGTTTCATTTGTTTTCACTTCACTCAGCTCAGAATCTAACAAAATTTATACTAACGTTATAAGGGAATAATACTTTCTAGATCGTTCCTCAGCTATTCTTGAGCTGGACGATATGATTTAAGATCCATGTCATGATGTATTGTCACATTTCTTCCTTGAACAATAATAAATATAACGATTTGTATGTTTTGGGGTTACAAATAATAATGTTTTTCAGTCATCAAACAATCTGCTGATTATTTTCTTTAGTTTTCCCCATAAAATGTCGGAAGATCTTCTAGTTCGTCTTTTTGTTAGACCGCCAGCCCAAAACCCAAGACCCCAGAAACTAAATATGTACTAAACTGTTCTTGTTCTTCTTCACATGTTGGATTTTTAATACTTTTCTGAACTGAGTGAACTGTGAGCATCTTAAACCCGAGCCTGATTTTACATCCTGGTCAAATAACATTTCATTTAAAGTGTCCCTGAAGTGAATTTAATTGTTTTAACTTGTAAAAAAGAAAAAATGGAATAGACAAGGAAGCAGCTAAGAAACTAACGGAGCGAAAAGGGAATTGATCTGCTTCTCCTTGTTCAGGTGTTTTTGTTAAATCTGTGAGTTCAGTTCACAGAATCTGCTGTCAGCTCAGACACATCACGGTGGTGATGAGAGGGAGGAAACTTTTTTCTTTGTTTCATTTCAGCTGGTAGAAAACTTTTCCTTTTAACAGGCGTAAACGCTCAGTAGAATGAAAAGAGTCAGTGAACGTAACACAAGTTCAAAGTTTCATGGCCACAAAATAGTGTTTCTGTGTATAAAAATCCGTTTGTAATGCTAGAGAGCCAACGCCCTCCAGTCCTGTCCCGTCCAATCAAACAGTCTCCCCGATCTGCTCAGCGAATCACTAAGAAGGGCTTCTTCTTCTCTGGTCTTGTTGTAAATAAACTTCTCTTTCTCTGTCACTCTCTCTCTTTTAACGGTGACGCCATGTAAATTAGAGAGCACAGGAAGTACTTACTGGATGTCGGGTTGCAGAGTGGAAGTGAAATATTAGAATGTGTGTTTGTTTGGGGGGGAAAAACGATATCAGCATGGACTGAATGTTGCGTGTTTTGGCTCAGTGTTGCGCTGATCCATCCAAGGCAGGAAGTTAAACTTTTGCGGCTCACTAGGCGTCTGAACCAATGGTTCCCAACCTGGAAATGTTTGCAGAACTACGATTCCAGTCCGAAGGGTCGCAAGAAGGTTTACAGGATGAGAAATAAAAAAATTTAACATTTACATGGTACAAAGAGGGCTAGAGTCAAGGCGACTAAAGGCCAGTCCAAGACTATTCCAAGTCTGCGCAGTTTTCAGAACGAATCAAGACCGTGTCCAAATGCAAAAAGTGTTCTGTTGAGACAAAGTCCTAGTGTGGTCAAGGTTGAGTCCAGATGTCTGAAATGTGGTCAAGACAAAGAATAAATGGACTTCAGTCCAAATGCGGTCTATTGTTCTGTCGAGACCAAGTCCCAATGTGGTCAAGGTTGGGTCCAGACGGCCGACATGTGGTCAAGAATGAGTCGACCCGACACCAAATATGGTCACGGTTTGAGACGAGACCAAGTCCCAATGTAGTCAAATTTGGGTCCAGGCGGCAGACATGTCGTCAAGAAAAGATCAACTTGAGTCCAAATTAATCAAGTTTGGGTCAATACCATGAGGCCTAAGAAAGCAAACTATTGAAACCAAAACAGTGCCAACTGGGTATTCGCCATACTGTTGTCTCACTTACAGTACAGTCATTTGGAAAATAAGCTTTACCTGGACTTTATTGGCCGAAGCTGGTGGCTGTGCCTGAGACAGAAGTCCACGATGAAACTGGACTCTAGTAAAGTCCACAAACATGCCTACAGTCTTTGCTTGCTTTCCTTTTGCTTAGTCATCCTAGTCATAACTCCTGCAATGATGAGCGGGGATGAAGTCAGTGGCGTGGACTACTGATGCAAACACGGTTCTGTTTACATCGGGTGTTGGCGTACGTAGATGTGAGAACTCGCGTAGTCGGTGGATACAGTCCACATGGTCATAGCTTTTGGACTAAACCCTTGGAATTTAAGTCGTTGGACATTCAAAGCTACTTAGATGCATAAAGGATGGTAAGGTTGGGATCCACTGGTCTAAAGATGCGCTGGTAATTTTAAGCCGTCACACAAGATTGTAAAGAAACACACCTTTCTCACCCTGATGACGACGACGTAGATTTGACTGAGCGTTGATTTCTTTCGTCGACTGAACGCTAATCGATCGTCGGGATAAAAAGCTGCTTAACCTCGACATTTGTGTGTGATGATTTTCACCTTCAACACTATGCTGAGCATCACCTGCTCGTCTCTTAGTCTTTGCTCTCTCTGCTGTTTTCGTGCTCAAATTGTAACGTAAAGGTTGAGAAGCAGCTCTCAAACCGACTGTGTATCCAAGCAATATTCATAAACTCATCAGTCACCGTCACATGGTGACTTCACACGCTGACGTTGCTGCAATATTCCCGTTAAACCACAAACACACTCATGTTTGTAGACTTGTAAGAAACAGTGAAAAGATGAAGTCATCATGAACTGAAAATATTTTCTCCTTCTGCCTTTTTGTTTTAAACGTCTGCCTTTACGTTCCTAATTTCGTCCGACCTTGTAATTGTACGTGCCACGCCCGTTTGCCCTCCCAGTCATCTCAAAGATGGCATTTTATCTTGCATAAATACTAAACCAAGGGGTTTGACCGCAACTTGTGTTTTCAAACTGTTTATTTTATGTTTATATCCGACTCTGTCCTAACTCTACCCATGACAGCAGGACAGGGCAAAGACGTCCTTTTATTTATGACAGAAATGCACTAAATCTGATTCAGTCTGTCTTAAGCTCAACACTTGCCACTACAGCTTTCTTTTATTCTCATATTGGCACTAACTGACGTTTGCTTATTTCTCTAAGCGGTGGCGGCTTCTGGCGGTGTCCTCTGACCTGATTGGTGCTCTCATTTTAACGGCATCTAAATTCTGAGCAACTTGGGAATCCAGAATCCATTTATTTAAGTTCACATGAGGGGAGAAAGCTCAGTAAAATCTGCTTTTAAATGACTATAGGCACCAAAATAATCCGTTGCAGGGTCAATGATAGCGCTGACCGCTAGCGGTGAACAAGCTAGCAACAAGTGTTTTCATTCTAAGGCTAAACCAAGCATGAAAAGTTGGGAAATGTCTAGATTATAGAAACATTGTGTTGGACAAGTCCGCAAAGTCAGTTTATTTAAGTTGTATGGCGCAGGAGAAGTTCTGTAAGGTTCTAACGTTAACCCTTGTTGCAGCTAGTGGTGAGCACTTTAGCATGGCAGCATTGTTTCAGCTTGCAAGCAGTTTCTACTACTACCAGTAAAAATCAAAATCAAGCTGCAGTTATCTAAACACGGCTAATGGAGAGAAGCAGGGCTGTGTACGGCCCAAGTCTGTTTATTTAATCTCAGAATAAACTCTGTAATGGCTGCTTTTAACTGTTTGAATCATCTATCGCTGAAGCTAACTGTAGCTAGCGGTAAACAAACCAGCATGGGCAGCATTGTTTCGGCTTGCAAGCAAACTATAAATGACTTAAAATTGGAAAATGTTTAGAGAATGGAAATGTCTTGTGAATCTCCAGCCCCAGCTAATGATCAGTTAGCTAAACCCAGCTAATGAAAACTGCTTGACACCGACTCTTTTCAGAACAGTTTTGTTTGTTTGTTAATGCATTAGCTGACACTTGAATCCAAAATCTGATGATTTAATCCCATTGCAGCAAAGAAAGCTCAGTAATATCTATTTGTAGTCACAGAAACTGCTGAGTCTGATCTGAAGCTAATTGCCGCTAGCGCTGAATACGTTAGCATGGTTATTTTCAACTTTATCTAAGCGAACTTTACTACCCGTCTTTCTTATTCTTAAAACTAAACATGAACAGTTGGAACATGTTTAGAGACTAGAAACATCCTGTGAATCTCCAGTTGCAGCTAGCAATCAGCTAGTTAATCTCCGCTAACGGAGCGAGGCGAGGCGCAATATATTCTCTAGTGGCGTTAGCACAGATATAACAAGATTCACGCTGCAAACAAGTGAAGCTGCCTGCTTGTAAATGAATCACGTCTGCTTTGAAAGATCCGGTGAACGAAGAAACCGCGCTAATATTGCAGCTCTGCGCCACCTCACCTGTACATAGACTTCAAACTAAAAAACGACTCAGTATGATCAACGTTTGGTTTGTCTGGTTGTGTTATCTCTTGTAGCCTTTACCCCTAAGCTCCACCCACCAGGGCTGTCCTCCACATTATTTATAAACGAACCCCGTGAGGAAGACTCCGCCCCCTCAAACCTACGTTTTTGTATATTTTTCTCCGACTTCTCCACTTTTATTATAATTGTTATAATTTCATCCAGATGCATTATTGTTCTTATTGTCATTGTTATTCTAATTATTATTATTATTGTTATTGACTTTTTGTTGGCTGTACAGTACCGTTGTTGAAAAATTTTACTTAATACAGAGTCTTCTACTGTAATGTGTCTCTTTTCAATAAAGACAAGAATAATGCTTCTTAATATAA
>XR_002412069.1 PREDICTED: Columba livia uncharacterized LOC110358026 (LOC110358026), transcript variant X1, ncRNA 
GGAGGTGTAGGGGCTTACCATACTGTTCATGACAAGATTGAAAAGTATCTGAATGAGATCCAGAACAGCCAGCACACTGCACTGAGTTGCCAAAACTGAGTATATATATATCACAGAACCACGTTGAATTAGTCAGTGGGAACACTGAGGACTTGAGTGCTGAGAGCGACCTCCAGGCACCTTTGCCTGTGACAGATCAGGACTGTGGCCACATATTCCTCCTTGCCACGCTGGTCTGGCTGACTCAGGGAGACATTTACACCAATAGTTGATCCACTCACCTGTGATATTTTCAGCTGATTGACTCAACTGACATGCAGCATATTGTCCTCGAGGAATGACAGCTCAGGAATGCACGAGCCTTGTTCTCCTCCTGCAGCACATCTTCCCCGGTCAGCTGTGTCCCACCTCCAGCCTCACCTCTGCAGCAGCTCCTCTGGTGAGTCCAGCGTGATGGGGACTGACTGTATCATGGGCACATAATGGAAAATTAAGGCAGAAATAAGACTACGAGCACAGGATTACGAGCTCCCTAAGGTGGACACGAAGATTTACAAAGACAATATGTCATTTGGATTTTTCTGATAGAAACGTTTAACAAAAGAATATTCTTTCTAATGGCAATTTTCAATGAGATCCCACTTTCCTGTGGGGGTCTTGTGTGTAAAATTTTTACTATTTCCTTGATATTATTTAGCTTTGCAGCTAATCCATTATACAAAAGGAAATAAGAAAAGAGGGTAAGAAATGCCTTCTTCTGCAATGACATGGTTCTATGTTGATTTTTACATTCCAGGTAGGATAGCTACATAAGGACAGACAGG
>XM_006834443.1 PREDICTED: Chrysochloris asiatica PDZ and LIM domain 3 (PDLIM3), transcript variant X3, mRNA 
ATGCCCCAGAACGTGATCCTGCCGGGTCCAGCGCCCTGGGGATTTAGACTCTCAGGAGGTATAGACTTCAACCAGCCGTTGATCATCACCAGGATTACTCCAGGAAGCAAGGCTGAGGCTGCCCACCTGTGTCCTGGAGATGTCATCCTGGCAATTGACGGCTATGATACAGAATCCATGACTCATGCAGACGCGCAGGACAGGATTAAAGCAGCGGCACACCAGCTGTGTCTCAAAATTGACAGGGCGGAAACTCGCTTATGGTCACCACAGGTATCTGAAGATGGGAAAGCTCATCCTTTCAAAGTCAACTTAGAGTCAGAACCACAGGATGTGAACTACTTTGAACACAAGCACAATATTCGGCCCAAACCTTTCATAATCCCAAGCCGAAGCAGTGACCCGGTAGCCTCGGTGCCCCCACAGTCAGATGTGTACCGGATGCTCCACGACAGTCGGGATGAGCCTACTCAGCCTCGCCAATCAGGCTCCTTTCGAGTGCTCCAGGAGTTAGTTAACGATGGCCCTGATGACCGTCCTGCTGGAACTCGCAGTGTGAGGGCTCCAGTTACAAAAGTCCATGGCAGTGCTGGTGGCGCACCAAAGATGCCGTTCTGTGACAAATGTGGCAGTGGCATTGTTGGTGCTGTTGTGAAGGCACGGGATAAGTTCCGGCACCCGGAATGCTTCGTGTGTGCTGACTGCAACCTCAACCTCAAACAAAAGGGCTACTTCTTCTTAGAGGGAGAGCTGTACTGCGAAACTCACGCACGAGCCCGCACGAGGCCTCCAGAGGGCTATGACACAGTTACTCTCTATCCTAAAGCTTAA
>XM_020957015.1 PREDICTED: Drosophila serrata uncharacterized LOC110187620 (LOC110187620), transcript variant X4, mRNA 
CTATTCAAAAGTGAAATTCTAACATTTTTATTCAAACAAAATTTTAAGTTGAAAATAGCAAAAAATGCGTGGTATTCTTGGCTGCTTGCTAACTTACCGCATGGAACCGCGTCTTTTGCAGATATCACGTTGTTTCAGCTACCATGCTCCGCATTTCCGTCCGCGTAGTGTGCTCGGTGCCAACAAGCTTTTCGAGCTAGCCAGCTCCACTTCCCCCGGTTGCCAGGCGACAAAGATTACAATATCGACGAGTTCCGGTCAAATTCGGGTACAGAGGTACTCGCAGACGACCTCCAATGTCTTTAACATCACCGAAAATGTGGACATGCTGCGCAAGCGGATTAGCTTTACTGGTGCACCCAACACTACTGCTCAGATCCTGCCCATTGGATTAATCACACCAGAAGCTGGTGGCGAGAAGGACCTTAAGATCGTGATTGTTCCTTTAAACTTGGCTGGCATGGATGCCAACGCCCTGAAGGAGACGCTTGAGGCCATTAACCAACTGCGCATGTACGCGCACCATATCGAGGCCTTTTCCAGCAGTATGGTCGACGACTACAATGCCTTGAATGAGGCCTTCCAGGAGGTTGAAGCGAAGAAGGAACAAGAAGCAAAACCGGAGGTTACCGCCGAAGATAATGCAGTCTGGGAGGACTTTGCCACACCCGATGCCACAGCCGATGCCGTGGCCACTCCAGCGGTCGATCTGCCCCTTCAGACCGACACGCCATTGCAGCGCCAGGAGGCGGTTAGCTTCCTAATTGATACCTTGACTAATGCCACTCCAGCAGCTGCCCCCCCGCCGCTGAAGACCACCAAAACTATATCGGCCGTGGCTCAGCCCAATCCGGAACCACCTAGCCCAGCCTCGACCATGGAAACCGACCTTCAAGCAGCTATTCAGGGGGGCGATGCCATTGATGAGGTTCAAGTGGATGTTCCACAGGACCTAAGTGATCGCCTCAACTGTATGGCCGTCTCCTCCATGGAGCTCTCATTCGAGATGGACATGACCAACCTGCGCGAAGCCCTGTCCAACAAAGACGCCAATGCTGTTAGCAACCAAGATCCCATGATTTGCATGCATACCAAAGTGGAAATGGAGAAGCCTACAGAGGGAAAACAAACTGTTCCGCTCAGGTTCAATGGCTTGATTTCGGGACTTGTGGAGCTCGATGCCCAAAAGCTGAATTTGACGGACGAGCAGATGACCGGCTTTAACGATAGCCTCACCGCGTTGGCGGCCAACCTGTGCAGCACAGCCTTGGATAAAGGCTTCTCCAAGGACATCAATCTAACGTTAAAAGCGGATGACACCACCATGAGCCTAGCGCCTAGTGCCGAACTGAAGATTGCTGATCAGCCTCAGGCGAATTTTGCGCTTCCTTTGGAAGTGCCGGTGCCGACTGATAAAGATGGGTGCAAGCATCCACCTGTAAAGCCGAAGCGGAAGTGTCCTGGCAAGTGTCCTCTAATTGATGATCCCTGCAAGGAGAATCCCTGCAAGCGACCCGCCGAAAAGCAGAAGCCGCCTAAGAAAGCTGAGAGTACCACGGAGATCATAGCTTTTGCCAAGGACCCCTGTGAGAAAAAGGATCCATGTGCCAAGGACGACAAGGATGCCAAGAAGGACCCATGTGCCAAGGAAGGAGGCAAGGATGGCAAAGATGGCAAAGATGGCAAAGATGGCAAAGACGGCAAGGGTGGCAAAGATGGCAAAGACGGTAAGGGTGGAAAAAATGGAAAGAATGGGAAGGGTGGCAAAAATGGCAAGAACGGCAAGAAAGACCCTTGTGCCAAGTTCAAGAAGGATGGCAAAAGTGGCAGCAAGTTTTCGACTTTCGCCGCACATCATAAACCCAACAAGCGCTACCTATCCACGGCACTGAATCAGGTTTTTAAAGAGACTGGATCACATTCAAGTCCTAAGGGTCCACGTTTCCTTGTCCACTCGACACTTCTGCGTCGTCACTATCGTGGCACCGTTCCAAAGGCCCCAGAATCTGACCTCAAACAACGAATGGTGCACAAGGCTAGTCCTCCTGCCCGCTTTACCATACACTCGACCATTCTGCGTCGAACCTATTCAAAAAAAAAGAAGTCTGGTAGCGGCAAGTGCTCTAAATTGCAGACCAAGTTTCCTACAAGTAGGGGCAAGGATATCAAGGAGCGCACGGGTATTCGCGACGACTGCTTCAAAGATGACGCTGACAGCTGCCCCTTAAAGACCTGTAGCGGCAAGTGCTCCAAGGTCAAGTTCCCCAAGAAGAAGTGTGACCGCAGTAACAAGGACAAAAAAGAGTAGACAGGCTGTTGGGCCAGGGTGCTCCAGTTCAGCTGCCATCGCAGCAACGATCATTCAGCAC
>XM_019302128.1 PREDICTED: Ipomoea nil putative late blight resistance protein homolog R1C-3 (LOC109154305), transcript variant X2, mRNA 
GTTTCATTAAGCTACAAGTACTTACCTTGTGATTTGAAGGATTGCTTTCGTTATTTTGGTGTGTTTCCAGAAGACAATGACATACCTGTTAAGAAATTAATCAACTTATGGGTTGCAGAGGGATTTATAAAGCCACATGACAATATGAGTTTGGAAGAAGTGGGAGAGAGTTACTTGCATGATCTCATTAATAGAAGTCTTGTTCAAAGTAATGAGCTAAGTATTGACGGCAAAGTTAAATCATGTAGCATTCATGATCAAGTGCACAAGGTTTGTGTGAGAGAAGCAATAGAGTGGAATGATTTGTGCATTATCAATGACAATCATGCTCCAAACGCTTGTTGTTGGTTAAGCTGTCAAACAAGTCATTGGCCAATCACTCGAGCGAGTTACGAGAATTGCGGTCCTGATGAAATCCATTCTGTTCTCTGCTTTGGTAAAGATGTAAACCATTCAAAATGCAGGTTTGTATACCCATCTTTGAAATTGCTAAGAGTATTGGATTTATCATTAGTTAAATGGTCAAGAGGCATGCCTAGAGAAATAACAGACTTGGTTCATTTGAGATACTTGGCTTTAAGTACCATTGGTTCTCTTTACCAGTTTCGATTTTTCAAGCTTAAGAATTTGGTAACTCTCATAGTTACTTCATGGATGGAAAAATGTCCTTTGCAACTGCCATGTGATATTTTGGATTTGCCACAATTGAGGCATTTGCATGTTGACAAGAGATGTTCACAATATCTCCGTAGCTTAGTAAAAAAAAAACTACAAACTCTTTATTGGTTGAAGGTTGCTAACTCTGATCAAAGCCCAAACTTCGAAATGGTTCCAAACCTAAGGGAACTTGGGATTTACATTGAAGGCCAACTGGCGCCTAGATATCTAGGGAGCCTTGTGCATTTACATCTACTTGAGAAGTTGAAGTTTGAAGTAGGAAGAGTTGAGCGCTTTTATCTACCAATTGGTTTTCCGCCAAACCTAAAGAAGTTGACACTTCGTTATACTTATCTTCCATGGAAAGAGATGGACACAATTGGCAAGTTGCCACACCTTGAGGTGCTTAAACTAAAAGATTTCGCATTCTATGGCTCAAAGTGGGAACCATCAAAGCAGGGCTTTTTGGAATTAAAGGCACTTCTCATTTCACGTTCAAATCTCAAATATTGGAATGCAAATTCTAATCATTTCCCAGTTTTGGAGCGCTTGGTCTTAAGATATTGTTGGGAATTGAAACAAGTTCCAATTAATTTTGCAAATATTGGAACACTGAAGTTAATTGTGTTAGAAAGTTGTTATTCTTCTCTTGTGAGTTCTGCAATGCAGATTTCCTCTGCAAAGAAGTTATTGTTTGAGGGAACGACAAATTGTCCACTTCGTGTTCGTGAAGTTAGAACTAAGGTTGAATTGCCAAATAATGAAAGCTCTGAAGAAGAAAGTTGTGGAAAACTTTGAAGAAGAAAGTGTGAA
>EU813087.1 Uncultured bacterium clone DP1_95 16S ribosomal RNA gene, partial sequenceEU813284.1 Uncultured bacterium clone DP3_43 16S ribosomal RNA gene, partial sequence 
ATTAGATACCCTGGTAGTCCGCACGGTAAACGATGGATGCCCGCCGTCGGCATATGATGTCGGCGGCCAAGCGAAAGCGTTAAGCATCCCACCTGGGGAGTACGCCGGCAACGGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGAGGAACATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCCGGGCTTGAACTGCAGGAGAACGATTCAGAGATGATGAGGCCCTTCGGGGCTCCTGTGGAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGCTTAAGTGCCATAACGAGCGCAACCCCTCTCGCCAGTTGCCATCGGGTGATGCCGGGCACTCTGGCGACACTGCCGCCGCAAGGTGTGAGGAAGGTGGGGATGACGTCAAATCAGCACGGCCCTTACGTCCGGGGCTACACACGTGTTACAATGGGGCATACAGAGAGTTGGCCATGCGCAAGTATGGCCGGATCAAGAAAGTGCCCCTCAGTTCGGACTGGGGTCTGCAACCCGACCCCACGAAGCTGGATTCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCAAGCCATGAAAGCCGGGGGCGCCTGAAGTCCGTGACCGCGAGGGTCGGCCTAGGGTGAAACCGGTGATTGGGGCTAAGTCGTAACAAGGTAAC
>XM_043073989.1 Brugia malayi Uncharacterized protein (Bma-cdh-5), partial mRNA 
ATGATGATAACAACATTTGCGCTACAAACGATTCAAAACAATATCAAAATCTCTTCTTTACATTCGCCAACATTAAAGGCTTCATCGCATGAAGGTTATATACCGGAGTCAGCACAAATGGGTACCGCGGTTCGAGTTTCTCCTTCTGCATTTTCAGATTCACTTCAAATAGACATTTATGATGATGACCTGAAACCTGGAATGTCTCCAGTCAGTTATGAATATATATTAACAGGACTAGGCTCGTCCATATTTGCTGTTGACCAGAGAGGTTATGTCTACTTAAATGTACCATATATTGATGCTGATCCTCCGAATCCATCAACATATCAGCTTCATATAGAAGCTCGAGAAGTAAACACGACCCCAACTCGTAGTAGTGAACCAATATCAGTAATAATACACGTTATGGATATCAACGATAATCCACCCCGCTTCAGTTCCTCTATTTATACTGCCAATGTCAGTGCTAATGGTACTATTGATCGCCCTGTCATAAAGATTCATGCAACGGACAATGATACTGGCAAAAATGCACAAATAAGTTACCATTTGGTGTCAATAAGTGATGGAGCGTACAATAATTTTTGGTATGACAGTAAAGCGCATCAATTAAATGCTGTTGGAAACTTGAAAGCTGGTGAACGATATGAAGTTATACTGAGAGCAACTGATGGTGGCGGCCTCTCAAATCAAGCATTAATAATTGTTTATTCTGTACCTGATAATTTTCCAAAAGTAACAATGCTTGACCAGAAAAAGGAATCATTCGGACGGAACCAGATAGCCGGTCTATCTAATTTTTTAGTGGCCAAGTCATCGATTACATCTACATCTGAAAGTATTGATTCACCTGAAATGATCCAAACTTACGTTATTGAAATAAGCGAAGCAATTCCACCTTACTCCATTATCATTACACTTGGGGATGATTCAACGAAGGAACAAGTATATCACACGATCACCGGTGGTAACGAAGATAACAAATTTGCTGTCAGAAACGAAATTGGGGCTTTAATTACGGTGAAGTCGTTTGATAGAGAAGAAACGTCACTTTACACTTTAGAAATCGAAACACGCTCTTTAAAGCTAAATCAACACTTGCATTGGACGATTGTCCAGGTTGTTATAGCGGATATCAACGATAATGCACCAATATTCACTGATCCGCAGCCAGTGAGGTTGCGTGTTAATAAAAGTGGTGTAGTCAATTTTGCCCCAAATACGTATTTGGGGCAAGTGAACGTAGAAGATCCAGATGACGGTGATAACGGACATGTGGGACTCAGAATAGCATCTCCTATGAATAAATTGTTTTCAATAAATGACAGCGGTGCTGTTATGGTAAATGGTGATATGTTAAGTGGACATTTTGGTGAGCATCGAATGACTGTTATTGCCACTGATCACGGTGATCCACCTCTTGAAACTCGAGTCAATCTAATCATCAATATTGAAAATACCGCACAAAGTGTGCTATCAAATTCCATTCAGTTATCAAAAGAATCGAATAGTTTGGAACGTACGAATTTGATGCTGAATAGTACTGGTTCTGTGCAAAATGTACAATTCACATTCGATTCCTTTATACCAGCAACCATGCAAACAGCAGCAGAAAATCCAACACTGCGACTTGCGCCTGTGTTCGAGCTGTCTGAGATTGAAGTTATTGTAGAAGAAAATCAAGCAGACATTGAACTCGTCAAGCTTCATGCTTATTATATGGATGGTAAACCTGGAAGCATCACATATATCATGCTTGCAGGAGATTCATCTCTTTTTAATGTAAACAGTTTCACCGGATCGCTCCTTTTGCTGCGCCCGTTAGATGTGGAAAAAGAAATGTCTTATGAAATTCAAGTTGGTACTGCCGAGGCGACTGTTTTGTTCACCGAGCAAAATTTCCCATATACGGCCTTGGTTCATGTGAATGTTGTAGATGTCAATGACTGGATACCAAACTTTGAGCTTGATAGCTACCAATTTAAAGTGAATGCAGATGCCAAACTCGGCACAGCTATTGGCCAGATTGTGGCATACGATCAAGATAGAACCGCACCGAATAACGAGATTCGTTATCGGATCAAAGAAAGGGACACTAATGAATCATACGTCAATGTAGATCCCAAAAGCGGTTTACTAACTGTCGAGAAAAACCTTCGTCTACTTGCAAATAAAAAAATTTCGTTAAATATAGAAGCAGCAGATGACGGTACGCCGAAACGGTCTAACGAAACGCTTGTTTCAATTGATGTTGAACCTGTAGAAACTATCACTACCATTTTAACAAGAATGCCATCAACGTCTGATGCAATGTTTTCTAACAATAAATTGCAGTTCTCGCAACGGAATTACTTCACTTCTATATCGGAATCGATTCGTTCGCCACATCTGTTACTTGTTTTACCAGTACTGAACAAGTCAGCAAATGAGCGTTTCACAACTTGTTCAATCATTTCTGGTGATTACGGAGGAATCTTTAGCATTTCGACTAACTCCGAAGGTAACTGCGACCTTCGAATGCATGCGTTACTGGACCGAGAAACAGTGGACTCCTATCAATTAAACGTAAGCGTAAAAACAGAACAACAAGTAGACCATGCAATTGTCCATGTAACTGTTCTTGATACATACGATAATGGTCCGAAATTCATTTATAATAACGATGAATACAATGGATATTTTGCAGCTTTGTCCACTGATGCCTCTTCATTTGCATTTCTCACCACCGTGCAGACTAAGAATGTCGGTTTAAAAAACAACAGTGTTATTGTATATTCGTTGGATTCGTTTTCAATGGACTCGAAATACTTTATGGTTGATTTGAGCGGAAAAATCCAGACAAAAATGAGTGCATCACAAATGATGAAAGATAGTCAGAAAAATTATTTTAATTTCCGAGTGATCGCTTGTGACTCTTCTTATACTGTAAAGAAACTGTGTTCCAAAGCGGAGATATTCGTGAATATAATCAGTAATTCAAACCGATTCATTCTATCAGTTCTCAATACCGAACCACATCATCTCATAATTGCTAAAAGGGAGATTGCAAAAATATTGCGAGAATTCACTGGTCCTTGTAAACTACTTCTCTTGGAAAGTATAGAAGGCCGAACTAATATAAAGAAGCAGAAACACGTCGACATGCGCTGGTATGCTATAAATCCAACAACAAAAAGGAGTTGCGAATTTGATGAGTACAGCAAACTTTTCGATAATTCAACGATAAGAATGGTTGCTGAAAAACTAAAACAACGACTTATTATTGGTGAAATCCGTATTAACTTAAAAAATGTGTTTAGCGAAAATGCGTTGTTTTTAACAAATTTCAAAACGGTTTCTGCTGCAATAATTGTACTAGCAGTGGCCATAACAGTTGGAGCACTCCTTGGGATATGCGTAATATGTTTGTACTACATGCGTCATCGGGTGAAACGACATTCAAAACATGAATATCCAAACATTAATCAAATTCCAAAATTTGATGCCATATTTCTACCCAATCCACCAACCGGAAACACCCATGATATGCTTTATGAATCTCAAATGCTCGAAATGCCAATGGGAGAGGAAAACAGTATGCTCAAACCAGTAGGAAAGATAAACGGAATATCCGCTGCTGCATACGGTTCCAACAGCTACGATTTGGATCTAAAGCAGAGTTATCAGAATTATGCTCAAAACGCATTGTCTGATAAAAAAATTTTCGTTGAAGAAAAAATGTTTTCGGTCAGTGAACGAAGCGGGCTACATCCGCAAAAGAACAAGAATTGTGCATTCACAGCAACAAGATTCCCAGTGCAAAACTTTTTCTAA
>XM_040515260.1 PREDICTED: Rosa chinensis uncharacterized LOC121051827 (LOC121051827), transcript variant X7, mRNA 
GTTATGAGTCATCTAATTCTTTCTCAATCTCAGGTGCTATGCCTCCTAGACGCCGGACTCGTGGGGAGACCCCTCCCATTCCAGGAGATGAGAATACTCCTGGAGGAATAGCGGAAGCTTTGGGACGTATTGTGCAGCAGTTGACTGCAGCGCTTCCGGGCTCCAGAACCGACTTTACCATGGAGCGAGCGAAGAGGCATGGAGCTTATAGCTTCTCCCATGCTCCTGATGCTATGGATGCCCAGAATTGGTTGAACAAAATGGAGAAGGTCTTCACTCAAATCCATTGCCCAGAGGATCGAAAAGTGGGTTTAGCAGTGGATTTTCTTGATGGTGTGGCTTTTGATTGGTGGGCTTTTACTAGCAGGGATTTAGAGAATGATGGCCCAATCACTTGGGAACAGTTCAAAGAACATTTTACTGAGAGATATTATGGTACAGCTATCCGTGACAGGATGAAGTATGAGTTCTTGCATCTACAGAAAGGGGACATGACCGTGACAGAGTTTGAGCAGCGGTTCACCCAGCTAGCCCAGTTTGTGCCTGATCTGGTTGCCACTGAGAGGGAGCGGATCTATAGGTTTGTTGATGGATTGGGGGGTAAGTATTGTGAGCAGTTGACAGGAGTGCCATTTAGTGATTATGCTGAGGTAGTTAATGCTGCTCTGCGACTTGAGACTATGTATATGTCTGGTGTCCGACCTCGAGATGTGGGTGGCCCCAGTCAGGGTCCATCCAAGAAGGCTGCTTCTACCTCTAGGACAGGATCTTCAGCAGGTTTAGGGTTGTCCACTTTTAGGGGAGATTCTGACGAATTTTTCCGAAAAGTGGGCCCCGCAGGTCCATTTTGGAGTTAGGAGGGTAATTCCGGGGTGGGTCCTGACAATATGTTACTTTATGCAATGGAGATCATCTCTTCTATATATGCTGAACCTGCATCTGGAAATACCAAACTTGGCACTGTCATGGACAAAAGCATTTGCGAAGATGTGTCAACTTTAAATGTTTGGGGGCATAACTAAGTTCTTTCCTCTTTAAGTATGCTGCAGTCTGCATGCACTATACTAGGATAGACCAGGTGTACCCTCAATCCCCGGAATAGAACGATCCCTACTTACTTAT
>XM_048494676.1 PREDICTED: Sphaerodactylus townsendi CD200 receptor 1 (CD200R1), transcript variant X3, mRNA 
GGAAAGTTAGGGATGTGAACAGGAAAACTGAGATGCCAACTGGACAGAAGTAGACTGGTTGAAAAGATGTTCATCATAAGAGTGGCTAGATGTCTGCCATAATGGATGTAATGGTGAGAGAACTATGTGAGCCATGAAATCTGACGTTCATTTTGTTATGAAAGCCACAAGTGCCAGAATTCTGCTTGCTGTCATAGTAATTATGATACCAGTTGGGTCATTCCCAGCAACAGGCTCCATTCAAAACAGGTCTGCACAGTATCTTTCCAACCATTCAGCTAGCACAGTGACAGTGACCAAGACTGCAACTCAGCTGGCAGAAGAAAAATCGAGTCTATCTGCAGTGGTTGGTTCATCACTCACACTGAAGTGTCCCTGGCAATGGCAAAGAACCTTGTTAACTGTATGGAATGTGAAATTTATAAATGGGACAAATTGTCATTTATCCTACAAAAGTGACCGAAACCTGTCTGTTACAAACTGCAATGAGAACGTTAACTGGTTATCGAGACCCGATCAAGAATATGCTCTTCTTATAAAGCCTGTGCAGATTTTCAATGAAGGATTTTATAAGTGTTCTAGTTCAATTGATAAGGGCACTTTCATTCATGAATATGCTCTAACTGTGCTAGTGCCTCCTCAGGTGCACCTGACCCATGACTACAATGGAACTGCTGTGTGTACGGCAGCTGCAGGAAAACCAGCTGCCCAGATCTCATGGGGCCAGAAAGGGGATTTTATCACAGTGAATGAAACTTTGCCTAATGGCACCAAGACCGTCATAAGCAAATATAAGATCACCAGTGCTGAAGAGAACAATTTAACTTGCTACATTTCCCATCCAGCTTGGACGAACTCACAAGTCTTAAGTTTCCTGTCAGGCACAAGAAAGTCAATACATCTAAAAGTCCAGAAACAATTTCAAGAGGCAGCATTCAGGAGAATGAGATGGAACCCTATGCCACCTTTGTGCAAATGGAAAATGTGATCTACGATACAACGTTTGACACCTCAATGGGCAAACACTTCCCACCCGGGCTTTCACCTTCCACATAAGTTTCAATATGACTCTAGCTTTCTGTGCAAAGGAGACAGAGAAACACAGCATAATAGGAAGAGGAAAGACAGCTGTTGCCTTTTAAAAATGACCTACCAAAAAACGTGGTCAAATGTT
>XM_046460927.1 PREDICTED: Marmota monax MIA SH3 domain ER export factor 2 (Mia2), transcript variant X18, mRNA 
AAGGGTACAGGATGTATTAGAATCTGAAATCTTTCTCCAGGATATGAGGTGCTTAGAAGAACTTTATTTACATCTAAGGTTATCTTAACATGAGCCATTTAAGGAATGGAATTGAATGATCTGGAGGAAGAGGTTGTGGAAGCATTGCCTGAAGATATGAGACCAGGCCCTAATCCTTATGGCCTTCCGTGGGAGTTGGTGATTTGTGCAGCTATTGGATTTTTAGCTATTTTCTTGTTTTTGTGGAGAAGTTTTAAATCTGTTAGAAGCCGGCTTTACATGGGAAGAGAAAAAAAGCTTGCTCTAAAACTTTCTGGACTAATTAAAGAAAAATGTGAACTACTTGAAAAAATTAGCCTTGTTCAAAAAGAGTATGAAGGCTTAGAGTCATCTTTAAAGGATACCAGTTTTGAGAAGGAGTCAACAGAAGCACAAAGTTTGGAGGCAACATATGAAAAGCTGGATAGGTCCAAGTCTAAACTTGAGGATGAAATACTCTTTCTAGAAAAAGAGCTAAAAGAAGAGAAATCTAAACATTCTGAACAGGATGAATTGATGGCAGATATATCAAAAAGGATACAGTCCCTAGAAGATGAATCAAAATCTCTCAAATCACAAATAGCTGAAGCTAAAACAACCTTGAAAATATTTCAAATGAATGAAGAACGACTTAAGGTAGCAATGAAAGAGGCTTTGAATGAAAATTCCCAACTTCAGGAAGGTCAGAAACAGCTTTTGCAAGAAGCTGAAGTGTGGAAAGAACAAGTGAGTGACCTTAATAAACAGAAAATTACATTTGAAGAATCTAAAGTACATGCAGAACAAGTTCTAAATGATAAAGAAAATCACATTAAGTCTCTGATTGAATGCTTGCTAAAGATGGAAGACTGGGGTGCTGTGCTTGGAGAAGACCTAACAGATGATGGTAACTTGGAATTGGAAATGAACAGTGAATCAGAAGTTGGTGCTTACTTAGATAATCAGCCAAAAGGAGCTTTGAAGAAAGTGGTTTATGCTGCTAAGTTAAATGCCTCCTTAAAAACCTTAGAAGTAGAAAGAAATCAAATTTATACTCAATTATCTGAAGTAGATAAAACAAAGGAAGACCTTACAGAACATATTAAAAATCTTCAGACTGAGCAAGCATCTTTGCAGTCAGAATATACACAGTTTGAAAGTGAGAATCAGAAGCTTCAGCAGAAACTTAAAGTAATGACTGAACTATATCAAGAACATGAAATGAAACTCCACAGGAAATTAACAGTAGAGGAAAATTACCGGTTAGAGAAAGAGGAGAAGCTTTCCAAAGTGGATGAAAAGATCAGCCGTGCAGCTGAAGAACTGGAGACCTATAGAAAGCGAGCCAAAGATCTTGAGGAAGAATTGGAGAGAACCATTCATTCTTATCAGGGGCAGATTATTTCCCATGAGAAAAAAGCACATGATAATTGGTTGGCAGCTCGGGCAGCTGAAAGAAACCTTAATGATTTAAGGAAAGAAAATGCTCACAACAGACAAAAATTAACTGAAACAGAGTTTAAGTTTGAACTTTTAGAAAAAGATCCTTATGCACTTGATGTTCCAAATACAACATTTGGCAGAGGCTCAAGAGGCCCAAAGAATCCTCTGGATCATCAGATTAGCAATGAAAGGGGAGAATCAAGCCATGATAGGTTAACTGATCCTCATAGAGCACCTTCTGACACTGGGTCCTTGTCACCTCCATGGGAACAGGATCGTAGGATGATGATCCCTCCACCAGGTCAACCATATTCTGATCCACCTCTTCCTCCACAAAGGCAAGATAGATATTATTCTAATTCTGGTAGATTATCTGGACCAGCAGAACTCAGAAGTTTTAATATGCCTTCTTTGGGTAAAGTGGATGGGCCTATGTCTTTAGAAATGGAATCCAGTACAAATGATACCAAAGATGATCTTGATAATTCAAATGTGCCTGATTCATCTCTGCCTGCTGAAAACCAAGCAACTGGCTCTCGCTTTGGTTTTTCACCTCTTCCTCCAATCCGAGGTCCATTGTTTCCAGTGGACCCAAGGAGTCACTTCATGAGAAGAGGACCTTCTTTTCCTCCACCTCCTCCACCTCCAGGAAACATGTATGGAGCATCTAGAGATTATTTTCTACCTGGCCCACCACCCCCTCCATTCCCAATGAGAAATGCTTATTCACCGAGGGGTTTTCCTCATTATCTTCCCCCAAGAGCTGGATATTTCCCCTCACCCCCACATTCTGAAAGTAGAAGTGAGTTCCCTTCAGGGTTGATTCCGCCTTCAAATGAGCCTGCTACTGAACATCCAGAACCACAACAAGAAACCTGACAATATTTTTGATCTCTCTTCAAAATGGCAAAAGACAGAAGATTAAATATTCTTGAACCACAGCAGTGATGCTTTTATAATTGGAACACTTCATGCTAGCATTTCCCAGACGTTATTTGGAACCCTGGTCTTGTGAAGTATTTCTTTTCTTCTTCCATTACCATCCCCACCTTAGAGAAAAAGGGTAGAAAGAAAGATTGGGTAAATCTTGGGTAAAATAAATGCTTTGCGTAAAATATTAAGTGAAATGAGAACTGTAGAAACATGATTACATTAAAGTTTGTTTGCTGTGGTCTAAA
>XM_053649385.1 PREDICTED: Ictalurus furcatus tubulin cofactor a (LOC128622690), mRNA 
TCCATTACACGTTGGGCAGTCGGGCATTTTGGAAGTTTAGGGAAGCTTGTATTTCAGCTGCTGTGTTTGTGCGTACTTACGACTCTGCACTTACCACACTTCTCAGAAATCATCTTTATTATGGCGGATCCAAGAATACGCCAGATAAAAATAAAGACTGGAGTCGTGAAACGGCTCGCTAAGGAAGAGGTGTTATACATAAAGGAGGCAAAACAGCAAGAGGAGAAAATTGAACGCCTGAAAGCAGAGGCAGGGGACGAGTATGTCATCAGGAAACAGATGGAGGTGTTGCAGGAGTCAAGAATGATGATTCCAGACTGTCACCGCCGTTTAGCCATGGCTCATGCTGATCTGCAGCAGCTGTTGGAAATGGAGGTGGATGTTGAAGAATCGGAGGAATACAAGGAGGCCAGAAGTGTTTTAGACTCTGTCAAACTGGAGGGATGATGTAAACACACATGCGCAACAAGTGTCCATTCCATTATTCAGGACTTCTTAAAAATGTTGATTCGGAAATAAGTCTGGTCATCGTCTCATTGTTGTATTGATTTGTAACACTACGAATAGTGTGCCTCTGCGTTCTCTGTTGATTGTTCACAAAACTAAATAAACAATCTTATTATTCAA
>MT512057.1 Pythium aphanidermatum strain Sala1 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene and internal transcribed spacer 2, complete sequence; and large subunit ribosomal RNA gene, partial sequence 
ACCATAAAAACTTTCCACGTGAACCGTTGAAATCATGTTCTGTGCTCTCTTTCGGGAGGGCTGAACGAAGGTGGGCTGCTTAATTGTAGTCTGCCGATGTATTTTTCAAACCCATTTACCTAATACTGATCTATACTCCAAAAACGAAAGTTTATGGTTTTAATCTATAACAACTTTCAGCAGTGGATGTCTAGGCTCGCACATCGATGAAGAACGCTGCGAACTGCGATACGTAATGCGAATTGCAGAATTCAGTGAGTCATCGAAATTTTGAACGCACATTGCACTTTCGGGTTATGCCTGGAAGTATGCCTGTATCAGTGTCCGTACATCAAACTTGCCTTTCTTTTTCTGTGTAGTCAGGGAGAGAGATGGCAGAATGTGAGGTGTCTCGCTGGCTCCCTTTTCGGAGGAGAAGACGCGAGTCCCTTTAAATGTACGTTCGCTCTTTCTTGTGTCTAAGATGAAGTGTGATTCTCGAATCGCGGTGATCTGTTTGGATCGCTTTGCGCATTTGGGCGACTTCGGTTAGGACATTAAAGGAAGCAACCTCTATTGGCGGTATGTTAGGCTTCGGCCCGACGTTGCAGCTGACAGAGTGTGGTTTTCTGTTCTTTCCTTGAGGTGTACCTGAATTGTGTGAGGCAATGGTCTGGGCAAATGGTTGCTGTGTAGTAGGGTTTTGCTGCTCTTGGACGCCCTGTTTTCGGATAGGGTAAAGGAGGCAACACCAATTTGGGACTGTTTGCAATTTATTGTGAACAACTTTCTAATTGGACCTGATATCAGGTAAGATTACCCGCTGAACTT
>XR_007174521.1 PREDICTED: Salvia hispanica uncharacterized LOC125211483 (LOC125211483), ncRNA 
AGGCTGCACAACACACAAGTATCATCAACAGTTAGTCAGGCGGGAGAATTACATATATGTTCCATCAAGAGAGTTTGACAAAATGAAATACTGGGGGAAGAAGGAGCATTTCAAACCAGCTGTGACTATGAAGCCATACATTGTTGGACGATATACTCAAATCACAAGAACACAGAAATATCTAGGATATCTTATAGCTACCCATATCATATCATATTTTGTACAGATATCTAATAAGATTAGGATTATGTCGCACTTGTAACCCCAAATATCCATCAGCACCCAAATATCTAGGCTTAATGCGTCTGTCAATTGTTCATCATCAATATATAGTCCATGTCCCAAAAAAGGAGAAAATATACGTTAGCAGAATTGCAGAGATAGAGTTGTTTGTCACATCTATAACACACAATCACATATTCACATAAAAAATCTAAAACAAACTCAGAAAACCTACTTCAAAATGGAACTACACATACTTAACAATTCAACATAAACTTCACCAGAGAATAATCCTATACATTTTCTCACAAGTACTACTTGATAGAAAA
>XM_021335350.2 PREDICTED: Helicoverpa armigera UTP--glucose-1-phosphate uridylyltransferase (LOC110376763), transcript variant X1, mRNA 
TCATGCGAGCGTGACGTGTGCGCGGAATTTTAAAACAACATTTTTAAAAGACGTTTTTTTTAAATAATTTTAAGTGTTTTTTTTTGGTTAAATAATGGATAGTGAGGCTGAACAGTGTCGGTCATGGGTACGTGATATGTTAAGAAATAAAAATGGGAGTATCCGCAGTCACCAGAGAACTCCCTCAGGTTCAAGGGACTTCAAAGAGGCGACCAAGCGCGATGCTCTCACCCGGCTGGAGGTCGAACTGGAGAGACTCCTGGCTTCAGTCCACGAGACCAGAAGACCACTCGTTGAAAAGGAGTTCAGGGGTTTCAAGAACTTGTTCAGCAGATTTTTGGCGGAACAGGGTCCATCAGTAACATGGGAGAAAATCCAGAAACTCCCAGAGGGTGCTGTCATAGACTACTCGTCACTCACCACCCCCACCACAGACAATGTTCACCACATGCTAGACAAGCTTGTGGTGGTCAAGCTCAATGGTGGTCTGGGAACCTCTATGGGTTGTAAGGGTCCTAAGTCTGTGATACAAGTCAGAAATGATTTGACCTTCTTGGATCTTACTGTACAGCAGATTGAGCACCTAAACAAAACGTACAAATGCAACGTGCCCCTAGTTCTAATGAACTCGTTCAATACCGACGAGGACACGCAGAAGGTCATCCGCAAGTACCAGGGCCTGAAGCTGGAGATCCACACCTTCAACCAGTCCTGCCACCCGAGGGTCAATAGGGAGTCACTGCTGCCGGTGCCCAGGCATGCTGACGTACAGGCTGACATTGAGTCATGGTACCCACCCGGTCACGGAGACTTCTACGAATCATTCTACAACTCAGGTCTTCTACAGAAATTCATCAAAGAAGGCAGGACTTATTGCTTCATCAGCAACATTGACAACTTAGGAGCCACCGTTGACCTGAACATTTTGAACCTACTCCTCAATCCTGATCCCGTGAAGACCGTCTCCGAATTCGTTATGGAAGTCACTGATAAGACCAGGGCCGACGTTAAGGGAGGTACCTTAATACAATACGAGGATAAACTAAGATTGCTTGAAATTGCTCAAGTACCAAAAGAGCATGTTGATGACTTCAAATCTGTTAGCCAGTTCAAATTCTTCAACACAAATAACTTATGGGCGAAATTGGATGCTATTCAGAGGGTGGTCGAACAAGGTTCTTTAAATATGGAGATTATTGTGAACAACAAGCATTTAGCTGATGGTCTCAACGTTATACAGTTAGAGACAGCAGTCGGAGCCGCAATGAAGTGCTTTGAAGGAGGCATAGGAGTAAACGTGCCTAGATCTCGATTCTTACCTGTTAAAAAGACCTCGGATCTTTTACTAGTGATGTCCAACTTGTATAGTTTGTCCCACGGATCTCTAGTGATGTCTCCACAAAGGATGTTCCCATCGACACCTTTAGTGAAGTTAGGGGATAACCACTTTGCGAAGGTTAAGGAGTTCCTGAACAGATTTGCTACGATACCTGACCTGATTGAGTTGGATCATTTGACGGTGTCCGGAGATGTGACTTTCGGCAGAGGAGTGTCTTTGAAGGGAACAGTAATAATAATAGCCAACCACGGAGACAGGATCGACATACCTTCAGGAGCTCTGCTTGAGAACAAGATCGTCTCCGGCAACCTTCGTATCCTCGACCATTAAGCAACAACTATTTAGCTAATATACCTTTACTAAAGGTGGATTTCAATACCCTTATCCATCCGTTGATTTTATGACGGATACGTTATTGGAATTTAAAGTAAATTGTAATACTTTTAGGTCTAGATTTGTTGAAATGGAACTTCTTTGAACATGGTGAGGAGTAAATTTGTACTACGTTTTTGTTTGTATAATAACATGATATGGTTATGCTCCGAAGTGTTATAAGTTTTTTTGTTACTAAAAGTTGTTATAAATTAAAATATATTTTTTGTGGATACTATAAAAATGAAGATTGAGTGAAAAGTTAGGGTTTAAAAGAATGAAGTTGAAAACTTTGTGGTTTTTAAAGAAGTTCCATTTCATTTGCGTCTAAAGAGGTGCGCGTTCTTTTTTATACGTCTATGTATTTGTCTATTACATGTGCATTAGTTGCCCATAGACTAAGTAGTTCCATATTCAAACAAAACAAGAGTTAAACTTACGAAATTGCTTAAATTGAGGATTACCTATGTATCATGAATTATATGGTTGTTTTTTGGTTTTAATTGGTATAATTATTGAAATTGAGATTTAAAGCGTTTGAAAACTTATTATAAACATATTTATTAGGTCGATTTTTAATATAATTGTAAAGTTTTCTATTTATTCACTTTTTATATTTAAACTTTTGCTATAAAAGTAGAGATAATAGCACAATTATATAGCATTGAAATTTTAGAATTTAATATTATGTAATTGCTAATATTGTGTTGTACTAAGATATTTCTTAGTAACAATTTATTTATAAACCAGAATACTTTTTTTTACAAGAAATATGTTTTATGATCACAAAAAAATTTAAGATTTGAGTATCTAATCTTTATTTATTGATTTATATTTAATAAAACGTATTTTTCTACACTTTTAATATGGGTTTTTAAAACCTTTGATTTTTTTATGAGCCAAGTTGCCAATTGTTGTTGCTTTATTAATTATTTATTGCCAAAGTGAAAAATTAATATATTGGGTTTATTGTCTGCTAAAAATTGTTTTTAGGTATATTACTCTTTTATTACTTTTATACTACTTACCAGTTAATATCATAAATATGGTTTGAAGAATATGAAAAAGAAAAAATATTTTTCATCATATTATTATACTTAAATATGGCCGATTTATTACACTTATTTCCAAAATATGCGACTTGTATTTGTAAAATAGATTTTTATAATTACTCCTAATAGTGATTAAGTTCATTACATTCATAGATTTCAGTCAAATATGTATTTTAGAAGAGAAATCATAATTCATACAATAAAATTGTTCTTTAAAAAAAATGAGCAATTTTATTACTCTGTTAATGAGTGTAAAGTGGCACCTTACAAAAAAATACTTATCGAATCGTAAAAAATATGATTCAGTTATATCGATAAAATATCTGTCGAGAGTGACATCACTAGGAAGGTTACTCAGTGAAGAATAAATACTGTACTATTAAGTAGTTTTAATCTAAGCAAGTTAGTGCCATTAGCTAAGTAGGTAAAACTGTTGTAATAAATATTATTATGTTTTCATTTCAA
>XM_021074111.1 PREDICTED: Sus scrofa fibrosin like 1 (FBRSL1), transcript variant X15, mRNA 
TGCCGCCGCCACCGTCGCCTCACGAGCCCAGGCTCCTCAGCTCCGGTCCGCGCCGCGCCCGCCCGCTCGCTGGGCCTCTTCCCAGCCTTTGCCCGCCGCCAGTCGCCCATGGGGCGTGCCCGCGGGTCCGCGGCCGAGAGCCGCTGAGCGCTGGCCGTCACGCTGATGTGCGCGGCTGCTCGCGCCCGGGAGCCCAGGCCGCGCCGGGCCCGGGGCTGAGGCCACCCTCGCGGCATGTCCGGCCCGGCCCGCCGCCCGCCGCCGCCCAGGGCCCGAGTCCGCGCGGTCCGCACCGAGCCCGGCGGTGCCGCGTAGCACAGCGGCAGCGGAGCGGGAGCCCGACGGCACGGCCGCAAGGTCACCGCGCGCCATGGAGGCCAAGGTCCGTCAGAGCCGGCGCTCACGCGCGCAGCGGGACCGCGGCCGGCGCCGGGAGGCGGCCCGCGAAGCCCGCGACCAGAGCGCGTCGTCGGGTGACGAGCCAGAGCCCGGGCCGGGCAAGGAGAACACGGGCCTGCCCCGCGCACCCCCACCCCGCGCCGCCGCCGCGCGCCCCCCGCGCCGCCGCCGTCGTGAGTCCAGCTCGCAGGAGGAAGAGGTCATCGACGGCTTCGCCATCGCCAGCTTCAGCACGCTAGAGGCCTTGGAGAAGGACATGGCCCTGAAGCCACATGAGCGGAAGGAGAAGTGGGAACGTCGCCTCGTCAAGAAACCTCGCGAGTCAGAAAACTGCCCGACTGCAGAGCCGAGTGAGAACGGGCGGCCCCTGGAGGCAGGCAGCTCTGAGCAGGACCTGGAGCCCACCTGTGACCGAGGGAAGAAGAAGGTCCCATTGCAGCCCACCAAGCAGATGAAGGTCGCGGTGTCCAGAGGGGGCGACCACAACAGTGACGGCGACAGCTTCCGAGAAGCCAGCAGCTCCCGGAGGAGCAGTTCCCGGGACCAGCTCAGTGACAGCTCGGCGCAGGCGGTCTCAGGCAGAGGTTACTCCTGCGACAGCGAGAGCGACGGGGATGACAAGGCATCTGTGGGCTCTGAGAAGCTTTTTGCCCCAGCAGCGGATAAAGGGCCCACGTTGGGCGAGAAGTCCGAGGCCAAGGCCGGGGCAGCACCCAAGGTCTCCGGTCTGGAGCGCAGCCGCGAGCTGAGCACCGAGCCGCCCTTCCTGCCCCCTGTGCGCAGTCCTGTGCCCGCCCTGCCCTCCGGTGCCCCGGCCAGCCCACTGGTTAAGAAGGAAGCCCCGGCCCTGCCCCGCCTCGCCCCACAGCCGCCTCCTGCGCCCCCGCAGCCCCGGGCCCCGCTCCCGACGCACGTGCCTCTACCCCCGGGCGCCTTCCCCGGCCACGGCCACGGCCACGGCCCAGCAGCGCACAACGGCCTGCACAGCCTCAGCAGGAGCAGCAGCGCCAGCAGCGGCGCCAGCCTGGGGCTCGCGAAGCACGCGTCCCTGTCGCCTCACGGGCCGGGCCCCCACCTCTCTACCTCACACTTGGCGCTCCGCTCGCAGGCCCAGCACCAGCACCACGCGGCGGCCATGTTCGCCGCGCCCCCGACACTGCCCCCGCCCCCGGCGCTGCCGGCCAACAGCCTGGTCATCCCAGGACACCCCGCCGATCACGAGCTGCTCAGTTTGACAAGTTCACACCCAAGCTGGACAGCCCCTACTTCCGACATTCCAACAAACCCCCGGACTGAGGATGTGGTGGGAGGCCAGGCCTCCCGCCCAGGAGGCGGTGTGCAGGGCCCCACAGGCAGGGTGAGGCGGGCACAGGCGCCTGGGGTCTCACGCCCTGTCTCTCTCTCCCCTCAGACTTCAAACCCACTCGAGGTAACGGGCCGGGCCAGCGCTGTTCACACCCTCCTGCAGAAAGCCCCAGGGGTGTCCGACACGTACCGGACAACAGTCAGGAAGCCCGGGAAGTGGTGTGCGGTACACGTGCAAATTGCCTGGCAGATATTCCACCATCAGCAGAAGATCAAGATGCAGCTGGACCCCCACAAGCTGGACGTGGGCACCAAGCTGGACTTGTTCAGCAGACCCCCTGCCCCAGGCATATTCGCTGGCTTCCACTACCCGCAGGACCTGGCCCGGCCCCTCTTCTCCAGCTCGGGTGCCGCCCATCCCACTACCAACCCGTTTGGACCCTCAGCCCATCCTGGCAGCTTCCTGCCCACTGGTCACTTGACAGACCCCTTCAGCAGATCAAGCACCTTCGGGGGCCTGGGGAGCTTGGGCAGCAACGCCTTTGGAGGCCTGGGCAGCCATGCGCTGACTCCCACAGGCGGTATCTTTGCCCCCAAGGAGGGCCCCACGCTGCACGGCCTGACCAGCCCCCATGAGGCCTGGAACCGGCTGCACCGGGCGCCTCCCTCCTTCCCCACGCCACCCCCGTGGCCCAAGCCCATAGACACGGAGCGGGTCTCAGCCCTGACCAACCACGACCGAGAGCCGGACAAGGGCAAGGAGGAGCGGGAGCGGTGTCTTATCGCTCCCAGGGACCTCCTGGAGAAGACGCGCCTGCTGAGCCGGGCCTCGCCCGCAGCCCCCTTAGGCCACCCGGGCGGCAGCCTCCTGCTCCGCGGCCAGGGCGAACCGGGCCGGCCCGGAGTCCCCGCCGAGCGCGAGGCCGAGCCCCGCGTCAAGGAGAGCCGCTCCCCAGCCAAGGAGGAGGGCGCCAAGCTGGCCGTGCGCCCGCCATCTCCTCTCAGCAAGGCGGCCCTGGGGGACAGTCTGCGCCTGGCTGGCCTCCTGGGGAAGCCGCCCGAGGCGCCGGCCGAGCGGCCCCAGAGCGACGTGAAGGTCAAGGAGGAGCGCGGGGAGGACGGCGACGCGCCCCCACAGCTCGCTCCGGGCCCCGCGAGCCGCGAGCGCCTGGCCTTCGCGTGGGAGCCGCTGCGCGACGCATACCGCGGCCTGGAGCCGCCCCGCCGCGGCCCGCCCGGCCCCGGCGCCCTCTTCGAGCCCCCCGAGCGCCCCTACCGCGACCGCGAGCCGCACGACTACAGCCCCGAGCGCCTGCGGGAGGCGCGCCGCGACGAGCTGGAGCGCGCGCGGCCCCCGCACCTGCCCGCCGGCCCTGCCCTGGACGGCGCGGCGCTTCTGCCCGCGCTGGGCGCCCTGCACTACCCGCGCCTCGCTCCCGCCGCCGCCGCCGCGCTGCACAACGGGCTCCTGGCGAGGCCCCCGCCCGCCGCCGCCGCCGCCGCCCTTGGCGCACCGCCCCCGCTGGTGGCCGCGGGCGGGCCCCCCACGCCTCCCGGGCCGCCGCGGAGCAGGACTACGCCGCTCGGGGCCCGCGCGCCCGGGGAGGCCCGCGACTACTCCCCGTCCCGCAACCCCCAGGAGGTGGAGGCGCGGTAGTCCCCGCGGGGCCGCGCCCGCCGCATGTACAGAGGCCCCTCCACGAAAGCACTGCTGTCAACTTTTTTAACTGTACGTTGTTTCTAGAACCTAAGCACAGTTCCATCGGTCCTGGGGTGACGCCCGCTCCTCCACCTGCAGCCTGCGGAGCCAGGGATTTCAGACACGGTTTTGCCAGGAGTGATCTTTTGCTTTCCAAGCTCGACATTAGGCAATTGGAGAAAAACTTCAAGTTTGTACCTTTTTTCCCACAGGTGATAAGCGTTTTTAACAGATTTGTATTTTTTTCAATTTTGTGCTCTTTGGACGTTTAAAAGAAAGACTTTTGCTTTTTTATTTTTAGTTTGGATTTGCAATTTAATGGCCTCAGATCCCTCTCCAGAGCCCCAGGGGTTTTTTTTGTCTTATTTATGAAGAAAAAACAAAAAACAAAAAAACGGTCATTTTGTCCAACGCACTGTGAGGCCCCCACTCAGGCCCGGCCCTGGCCCTCCCTTGGTACTTGGAACAGAAGTTACAGATATATATTAAGATAATTAATAATGTACAAAACTTTTTTTGCCTTATTATGCAGAAGTGTAAAAGGGTTTCCTTTTTGGTTTGTTTTTTTTAAAAAAACAAATGAAACCGTGTACATAGTCTGTTAATATAAATATATGATGTTATTAAATTCTTAACCTAGGTAGACTTTATAAAAATCGTTTCTAGAAATTCCTCTGGTTATTTGTTTAACACGGTCACAAAAAAAAAAAATTCACTGGCTGTCAGTTGGAAACGCCCTCAGATGGTTGACTGCAGCAGCATCCTTCAACTATGCAAGCGCTCGGGACGGCCCGGGCCTGGGGGACCACGGCGCGCTCCCTGGAGTGTCTGCCCTGGTGCTTTCTGTGCAGTGTTCACAGAATCACACCAGACAAGACTGGGGAGGTGAGGAGTCCAAAGGCTGATTACAAGGGGAAGAGTAGCTGTCTCCTCCGCGGAGCCACCGGCAGACATGGTCTCATGTTCTCCCACCGGCCAAGGCCTTGGCGTTACTTCCTTTGGGTTCTGGTTTGCTTTCATGACCCCGTGAACGTCACTGTGCCCTGTCATCAGTGTTCCCTGTTTCCTGACGTCCATACCTGTGTCCTCAGCGTTTGAACCTCAGTTCACCCATCTCTAGCCATTTGCTTTGTTTGGTTCTGTATTTCCAACCCCACGTTTCCACTGTAGGCTCCGGTTATTTTAAATATTTTCACATCAACCAATGAAGATAAATACAGCCTTGATTTTGGATGAAAA
>XM_006877835.1 PREDICTED: Chrysochloris asiatica histone-lysine N-methyltransferase PRDM9-like (LOC102837583), partial mRNA 
GCACTGTGCTCTTGGGCTGGAACTGTCAGAACCTGTGGGTGATGCTGACAGCATGAAGCTCACCAAGAGCCATGGAGGAGAGTATGGGGAGGACACCCACGATTGTGAGGAGTGTCAGAACTTTTTCACCGACACCTGTGCAACTCATGGGGCCACAGCGCTTTTAAAGGGCAGTGCCATGGATACAGAGCACCCCCGTCACTCAGCTCTCACACTGAATCCCGGGCTAAGGACTGGACTTGGAGTACACAGTGAGGCATCTGAGCCGCTGCTGGGCCTAGACTTTGGCCCCTACGATGGTCAGCTGACAGAAGATGAGGAGGCAGCCAATAGTGGCTACTCTAGGCTGAAATTCCTCCATCAACAAGTGCAGCACACCCATCCCTCTCAGTCCTCTCCAAGAACTCCTGCGGAAAAACACCTTCACCTAGAGCACCGCCATCCAGGGGATGGGAAGGAGCCGCATTCTGAGCAACTCGCCAGGAATGACAGAGCAGAAGGTCTAGAGATGGGAGATGGGCCCAAAGCCATGTTTGAAAGGACAAGACAGGGGGGCATTTTAAAGACCTTCTCTAGTCTACCCAAAGACCAAATGGGGAGTTCTAGGGAGGCTAACAGAATGACGCAGACAGACCCATGCTCAGGCCAGAGAGTGAATGCTGCGGACACAGGCAAATTATTGCCGGGGAAAGGAATCCCAAGAATTGCAAAAGTTACATGTAGAGAGTGTGGGCAAGGCTTTAGTGCTAAGTCAAGCCTTATCACACACCTGAGGACTCACACAGGGGAGAAGCCCTATGTCTGCAGGGAGTGTGGGCAAGGCTTTAGCCAGAAATCAATCCTCATTAGACACCAGAGGACACACACAGGGGAGAAGCCCTATGACTGCAAGGAGTGTGGACGAAGCTTTAGCCGGAAATCACACCTAATAAAACACCAAAGGGCACACACAGGGGAGAAGCCCTATGTCTGTAGAGAGTGTGGACGAGGCTTTAGCCAGAAATCAGTGCTTATCACACATCACAGGACACACTCTGGGGAGAAGCCCTATGTCTGCAAGGAGTGTGGGCGAGGCTTTAGCCAGAAATCAAACCTTATTAAACACCAGAGGACACACTCAGGAGAAAAGCCCTATGTCTGCAGGGAGTGTGGACGAGGCTTTAGCCAGAAATCAGACCTCATTAAACACCAGAGGACACACTCAGGAGAGAAGCCCTATGTCTGCAGGGAGTGTGGGCGAGGCTTTAGTCAGAAGTCAGACCTCATTACACACCAGAGGACACACTCAGGGGAGAAGCCCTATGTCTGCAGGGAGTGTGGGCGAGGCTTTAGCCGGAAGTCACACCTTGTCACACACCAGAGGACACACTCAGGGGAGAAGCCCTATGTCTGCAAGGAGTGTGGGCGAAGCTTTAGCCGTAAGTCAGACCTCATTAAACACCAGAGGACACACTCAGGGGAGAAGCCCTATGTCTGCAGGGAGTGTGAGCGAAGCTTTATTCAGAAGTCACACCTCATTAGACACCAGAAGACACACTCAGGAGACAAACCCTATGTCTGCAAAGAGTGTGGGCGAGGCGTTAGCCAAAAGTCAGACCTCATTACACACCAGAGGACACACTCAGGGGAGAAGCCCTTTGTCTGCATAGAGTGTAAACGAGGCTTTAGCCAAAAGTCAGATCTTATGAAACACCAGAGGACACACTCAGGGGAGAAACCCTATGTCTGCAAGGAATGCGGGCGAGGCTTTAGCCAGAAGTCAGACCTCATTAGACACCAAAGGACACATTCTGGAATGAAACCCCATGTCTGCAAGGAGTGTGGGAGAGGATTTAGCCAGAAGTCAGACCTCGTTAAACACCAGAAGACACACTCAGGGGAGAAGTCCTATATCTGCAGGGAATGTGGGCGAGACTTTGGTGATAAGTCACACCTCATTGGACACAGGAGAAGAAAATACTGCCAACACACACTGCCATCTCCCCAGCTTTGA
>XR_001644210.1 PREDICTED: Nicotiana tabacum uncharacterized LOC107768680 (LOC107768680), transcript variant X6, ncRNA 
CCGGCAAAAAAAATGACTGGCCACTAAAAGCAGCTAATTCAAAAGAAATTTTAGTATTTTATCTTACCCTCACCTAATATTCCCTCCAATTTCTCAAAATAACAAAATGAAATTTGAAAAATTTGGGAATACATCACAAAGACTCAACCTATCTAACCGCTGCTGAAACCATTACCGCCACTGCAATTGATTTCTATCTCATCGCCGGCAACCAATTCCAGTTGCTAAGGTGATTTTCTTATATCTAGGGTTGGAGTAGTTCCCCTTCATTATTTTTTGAGAAAATCAAATGGCCGCTCCACCTGCTCTAGCCCATCACGACTACAGATTAGCTCATCAAGCTCCTTTTGATTAGCAATAGCAGTATACTTTTTATCCAGGACATTAGTTAACGTTGTTGGTTTAATATCGTTGTGATATTATTGACTACCTCTACTATTTGATTGAACAAGGAAGGAAGATTACAATAAAATAAGACCCTTGAGGCTTGAGCTATCATGGGCAGATGTATCTAGAATTTCAGACAGAAAGATTTCTCGCTAGCAAGCACAATTACAAAAATGTCTCCAAAAAAAGGTGATATATTGTGATGTTCAGAGATATAGCATGTGAAAGTTCATGTGATCAAGAGTTGGGAGAATCTGTCCGATGTAATTTATTATCGAGCTTATAGCTACTTGATAAAATAACTAATTAGATGCGAAATATTATTGGATTCAAATAATTTAGCATTTTTATGTTGTTTGCACTCTCAAATTATGGATTTAATGAAGTGCATTGAGCTGTTTGAAGTGAATTAATATTATTA
>XM_026966869.1 PREDICTED: Rhopalosiphum maidis uncharacterized protein PF13_0277-like (LOC113560796), transcript variant X2, mRNA 
TTAGTGTTCGTATTGCTTTTCCATCACCGATATTATACCGATCGTTTGTGCGTAAACCGGGTTTTTTATCGGTGACAAATCAGTTTCGTTGTCAATACGGCCATGTATATGCACTTTTTCCGGACAGGTCGCCTTGCAATTGTGTCGTATTAGATACGTCCGTCGTGCATATTATTATTAGTATATGAATGTGCTTAAAGTTTAAACGTGACATAATATTATATAATATGTAGTATTATTGTCAATCAGTGACCGATATGATAATGTGCTTGTGACCCGTCTTGGTTATCGGTACGGTAATATCGTCTTGGTACGGTTTTATTTTTAGTGGTTGCGACCCCCCTTCAATTCGTTTTTCAACTACTTAAGTAAATCTGAATATTATGTTTTTTTATATAATTGCCGGTGAAGTAGATTATTCTTGTATTTATATTTCTAAGAGAAATTTATTTTTCAATTATTAATAAGACATATTGAACTAATATTTGACAAAACACAACGAAAAATATATTATTAACTCGTATCGGTGTTAGCCGGATAGATGGAATTGTAAACGACAAAAAAATAACTATCGATGTGTATATATTAAATATTAAAAAATATAATAGACATTATGTAAAGGACGATCGAAAAAACATGAATAAATACCAACAACCAGCAATGAATATGGATATAAAAAAATAATATATGATATCATATTAACCATGTCAGTGAGCAATATAATTCAAATTATTCTTGCAATTAAAATGGAAAACTGTCGGGCACATTGAATACTGCTCGATGAAATGAGGACGGATAAAAATGGATATCTATTATACAGAAGAAGACAAAACTACCAAATTAATGACAACACGGCCAATCCAAGTCAGATCGATGATGAAAATAATAACCCAGATGAAGATATTCAAGGCGACCGCAATCTTATTACATCAAATGTTAATAACCCAACAGGAAATAACAGATTAATAAAAAATGATCTTATAAAAAACGTTTTTAATAGGATGAATTCGAATGGAAAAAAACCTTCTCAAATAGAATCAAGTAGAGCAGATGCTGTTGAAGATCAACAACTAGAAGAAGAAATAGAAAACGATCCAACTAAAATGTCACTCGGTTTAGATTCTGAACTAGAAATCGCTGAAGACACTGACCTAGAAGAAGCAGACGATAAAAATATTGAAAAACCAAAACCAAAACCAAAAAAAAAAAAAAAGAAGAAGAAGAAGTCGAATTCGAAGAAGAAAAGTAAGAAACAAAAACAAAAAAAAACTGAAGATGATGAAACTAAATTAATTGAAATTGATAATAATGGAAATCAATTTAATTATTTTGACCATGAAGAAAAAGATATACGTGAATCAGATAATATTAAAGATCAGCAACAAGAACTTGATAAAGAAAACGATCCAACTAAAATTCTACTCGGCTTAAGCACTGAAAGAGAAGCTGAACTAGATAAGGAAAAAACAGAAAAAAATTTACAAAAAGAAGAAACTAATTTAAAATCAGCTGAATCCAAAGTCACTGGAAGTGATAATATAGAGTCAACGATAGAACAAACATCCAAATCATCCGATCCTGAGAATATTAAAGATCAGCAACAAGAACTTGATAAAGAAAACGATCCAACTAAAATTCTACTCGGCTTAAGTACTGAAAGAGAAGCTGAACTAGATAAGGAAAAAACAGAAAAAAATTTACAAAAAGAAGAAACTAATTTAAAATCAGCTGAATCCAAAGTCACTGGAAGTGATAATATAGAGTCAACGATAGAACAAACATCCAAATCATCCGATCCTGAGAAAAATCCCATCGAAAATATTAAAGAAGATACAACAAAAAATACAATTACGGAAGTTGATCAAAAAGACTTAACAGTATCTTCACTGGAGAATGTTGAAATCGTAAAAATTAAAAAAAAGGATAATGCAACCAGCGAAGCAATAAGAAAAGAAAAGAAAAAAACGACATTTAGAGAATTCACACATTCAGAAGGAAATGCACGCATATATTGTACATTTTTGGGAGACTTGTTAAAAATGTACAACAAAGTAAAAAAACGTTTTGTTGGACACTTTTGTCATGCAATTGTTGTTGGCACTCCAATTATCTTAAAACAAAATCAAGTACACTTAAGCAGTAACATGAAAAGTCACCTGAATAAAATAGAACCACATAAACAAGAAAGTCTTCTTATCGTCATCATGAAATATTCAAGCTATAAAGATTGGAAACATGCGTTAAAAAAATCTAACATCAAACACTTAATTACAAATATAATGCATACGGTCAAAACTTATAAAATCGATGGAATACAATTTTCAAATTTACAACCAATAGCGGGGAAAGATCCAGACAATTCAGTGGATACACACACGATGAATAATCTATTAAAATTCTTTGAAAAACTACTAAATACTGCAAAACATAATCATAATTATGATTTAAAAATTGGCATAACCATTCATTTGAACAGTCAGTGGATCACATCAAGTTTTACTTCATTCGCTGAATTAAATAAACTAGTCACTTGGTATACATACGAAACAATTTCCATGGTAACATGTTCACCAGAATACAAAGATACAGGCACTTCTCCATTAGAAGGAGACGTGAGCTTGATGAATGCATATAATACATTAACGGATACCAATATTGAAATGTCAAAAGTAGTAGTTGGCATACAATTATTTCCAAATAAAGTTAATAAATTAGAACCATTTACATATGAAGAGTTATGTTCAACACCAAAGAACACTTGGAACGAATGGTGTGCTGCATACCCTGAAAAACTTCGGTTAAAGGGTATATTTTTACGGAACAATGAAATCGGAGGCGTCCAACTATTTTACATGCACTCAGACGATTACAGGTCAACATGCGGCTGTTATTCTTTCCCGTTGACTCGAGCACTTCTTCGTGGCTTGATTAACACTCAGACGGAAGAACAGTGTAATTTTATTACGGCACACAACTAAATAGAAAATACCCGCAATAAAATCAAGAACCATTATAATAATATTAGTATCGTTTTCCTCATTAGTGCATTATTAGTAATTATTTTTTAGGCACTTGGAGTATGAACATTTTAATATTTTATATATCATTACTAAATGAATGTATTCTATAACAAACGCGGGTTCGTATACGACACATTCGTTCATTTTAATTAGCTAAACATATTGTTGTATAATTATTTTTTTAACACGCATAAAATACTGAATATATTTTATTAATTTAGTTTTTTTTTTATTATTCTTGCATTTTATTTTATCTTATAACACAGAACAAGATACTTAACTCCTATAAGTTGTATGAGTATAGACTGTAAGTATTTACTATATTTATTCGTACCCATAGTAACTATGTTAATATCACGACCTCGAGAGTTTATAATCATCATATTCACTCCTTTATTTTAATAAACCAAAATTTAAATAGTATAAAGTACAGTGGACGCCGCTTATAAGACTTACTTTGGGACCAACACAAAGTGAGTCTTATAACCGAATGAATCTAAC
>XM_048102724.1 PREDICTED: Salvia hispanica GDSL esterase/lipase 6 (LOC125204156), transcript variant X2, mRNA 
AAGTTTTATTTAATAAATAGGAGTTTCAAATGAAGAAGAAAACTACAAATTGGTGTTGAACAGTTGAAGAAGAGTTGGCATAAAACAATATGGTGATCGAAGCCATGCATGCATTTAGTTAGTGTTGCTATGTCGTCTTCCTCGTTTTCCCGACATAACACCTCTCTCTCTATATATGTGCAAAATTCACAACAACTTTACTCAACTAATTGATTAATTTAATTTCTACAAAATCACTGGTAAAAATGGAGACACGGTTGCTGCTCGTCTCCGTCATTCTATTTCTTCTAGCAGCTTCCGCCATCGGATCTAAAATTCCGGCAATTTTCATATTTGGGGACTCGCTCTTGGACGCCGGAAACAACCCCTACATCCCAAATTGCACCGTTCAGGCGGATTTCCCGCCCTATGGATCCAGCTTCTTCGGCCGCCCCACCGGAAGATTCACCAACGGCAGAACCGTCGCCGACTTCATCTCTGAGTATTTAGGCATTCCACTGCAAAAGCCATACATGGAGGTGATGAACGGAACGGAAAAGAAATTTCCGGCCAACGGAATCAATTTCGCCAGCGCCGGCAGCGGAGTTCTTCCGTCCACCAATACAATTTCTGGAGTGACAGCAATCCAAGTCCAATTGCAACAATTCAAATCACTAGTCCAAAAAAATCAAATAGACAGAAAAGTCGTAAAAGATTCCTTGTTCTTGATAGAATCAGGATCGAACGACATATTCAGCTACTTTGATCCATCAACCTCAACACCCGAGGCCTATATACAAACCATGCTCGGACAAATCCACAACTTCGTCGATAACATCGTTAGCCTAGGGGCCCGCTGTGTCGCCTTGTTCGGACTAGGCCCGGTCGGCTGCGCCCCGGCTAGGTCCAATCTGCCCGGTGCCCCCCTCGGAAAATGCTACGACAAGTTGAATAAAATGGTCATGAAATACAACATGGGGTTGCAGAATTTGGTGAACGTTTTGCCTCGCACCCATCCCGGCACCATCGCTGTTTTTGGACGTGTTTATGAAACTATCCAAACCTATCGAGCACATCCTACGCGTTATGGGTTTGTGGATGTGGAGAACGCTTGTTGTGGATCTGGGAAACTAGGAGGACAGGTGCAATGCGGGAAGGTGGGCTACAAATTGTGTAAGAATCCAAATGAATACTTGTTTTGGGATTACTTTCATCCATCGGAACGGACTTGTGAGCTCATTAGCAAGGCCTTGTGGGCGGGCGGCCCGACTTCTATTATGCCCTTCAATCTCAAGCGGCTTGCCAATATGCCTGTCGCCTAATTGTTTAGGGTTCATATTTCATTGTTATCGTCATCTAAACGGTTTATGTTATACCGAAATGTTATTGGATTTTAGTTAA
>XM_042583618.1 PREDICTED: Zingiber officinale exportin-4-like (LOC122024892), transcript variant X3, mRNA 
CCTTACTCAGGTGTTCTTTTCATTTCCAGGAAGGCGCACACACAGGGGGAAGGCGGCTTGAAGGGCTACCAGGCCCTCCGATCGCTTCCCTTTTCCGCACAATTTTATCTGCCGACTTTGAGAAAGCTCGCAGCTCACTCCCGTTCCTGCATCCCCATCTCCTTTTGATCGTCTCTTCCTCGTCGCTCCTAATCCGACACACACAGTACCCTAGAGAATAGAATCGGACGAGATTGAGTTGAAAAACAAGAGGCAATGCAGGGGTTCCCAGGATCAGTTCCGGATTTGTCCCAGCTTCGGTCCACCATGATTGCAGTTGAACAGGCTTGCTCCATGATCCAGATGCACATGAATCCAACTGAAGCAGAGAAAATTATTGTTTCACTGCGGCAATCCTCAATGCCATTCCAGGCATGCCGATTCATACTTGAAAATTCTGAATTGCCAGCTGCAAAATTTCAAGCTGCTGGAGCAATTGGTGATGCTGCAATTAGAGAGTGGGGAATGCTTACAGATGAGAATAAGAAAAACTTAATAGTATTCTGTCTACACTATGTTATGGAGCATGCAAGTGCTTCTGATGCTTACGTCCGATTAAAGGTGTCTGCAGTTGCAGCTCAACTGTTAAAACGAGGATGGTTTGATTTTGTTGATGCTGAAAAGATTTGTATTCTCTTAGAGGTGAAGCAAGCCATTCTAGGACCTCATACATCAGATGTGCAATTTGCAGGGATTAATTTCCTTGAGTCCTTGGTATCTGAATTTTCACCTGCAACTTTGACTCCGATGGGCCTTCCTAAAGATTTTCACACCCAATGTCATTTGTCAATGGAATCTAATTATCTGAAGGAGTTCTATTGTTGGGTTCAATCTGCTGCGTTTAATGTGACTGAAAAGATAGTGAGCTCATATGCAAGCATATCTGATGAGAAAGCATGCTCTGCAGCACTGCGGTTTATGTTTCAGGTTTTGAACTGGAACTTCCAAAATAGTTCCATTTCATGGGATACCTCCAGAAATAAATCAAATTTAGTAACATACGGTATCAGACATGATGTGGTTCAGTTGAAAAAGTTTGAACGGTCATTGGTTGAGCCAGGACCCTCATGGCATGGTGCTATATTATCAAGCGGACAAACTCTTTGGCTTTTGAACTTGTATGCAACAGTTCGCCAGCAGCATTTATCTGATATTTTGTGGTTTGATTCTCCCTTATCAGTCTCTGCCAGGCAGCTAGTAGTGCAGTTATGCTCTTTGTCAGGGACTATATTTCCTTCCGACAATGGGGAAACACATATTAAGCACCTAGTGCAGATTCTGTCAGCTGTTATTGATTGGATTGAGCCGCCTAACATAGTCTCAGGAGCATTACGTGGGGGGCGAAGTGAAAGTGAGATGATTGATGGTTTTCATGTATTACTTTCCATGGCAACCATGACTACAACTGTGCTTTTTGATAATCTTCTTAGGTCTTTAAGACCTTTTGGTACAATTCAATTATTGTCTGCCTTGACTAGTGAAATTGTTAAAACTCATGTGAGAAGAACTGATGTTGATCAAACATGGACATCAGAGGCTCTTGATATTCTCTTGGAGATATGGACCCTCATTCTTGGGAGAAATGACAATGAAAGAAAGGTTTCACCTGAAAACATATCATCATTATCGAATTTATTCAAAGCTATTGTGGAGTCGCATCTTAATGCTGCTGCCCAATCTGCATTTGAAGATGATAGTGATGCTGAGTATTTTCATGTCTCTGTATCAAAACGAGATGAAACTTTGTATGCATATGCTCTTATTGCACGAGCTGCAGTTGAAACCAATATTTCCTTTCTTATGAAACTGTTTGCAGAACGTTGTGCTCTTCTCAGTCAGAATAATGAAAGTTGTGATCCTACACAAACCTTAGAAGAACTCTACTGGCTTCTATTGATTACTGGTCACGTGCTCACTGATTCAGATTCCAGAAGCAATACAAGACGGGTTTGCTGATGTATCAGATGAATCACAGCATCCAGTGGTTGTTTTTTCCTGGTCAATACTAAGTTTTGCTAGGCAAAG
>KM122633.1 Uncultured bacterium clone LNH_9_9_11_Pumice.146514 16S ribosomal RNA gene, partial sequence 
CCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGCGACCGCCTGGGGATACGGCCGCAAGGTTAAAACNCAAATGAAATTGACGG
>KF304776.1 Cystobacter minus strain Cbm6 small RNA Pxr-2, complete sequence 
AAGTGAGGCTGAAGGAGGTTCCCCCCCACCGCCTTCAGCACTTCCGGTGAGCTTCCTAAGAAGAACCCGAGGCCCGGTCCCTTTCTGAGGTGACCGGGCCTCCTTCTTTT
>XR_007867290.1 PREDICTED: Lolium perenne uncharacterized LOC127325588 (LOC127325588), transcript variant X4, ncRNA 
TCCGGATCCCGTCCCCTCTCCGCGTCCAGACCTCGATTAATTTCGTCATGCGCATGGTCCTGCCCCGTACGTGCAGGTAAGCGGAAGCAGATCAGGGACGGCCTGTCCCCGCTCGACGACCACGCAAAAGGGCTCGTCCACTCCGGCCTCGACCAGGAGGAGCTCTTCCGCCCACCAAATTAAAGGTCACTTTATCCTTTATATGGAGCTCATGACTACAGCCATCAAATGTCTCAGTCTGCTCCTCAAGCGGAACCTTATGGTGACAATCTTCCACACATCGATCCCTGGGGCCTACCGAAGCTGAGAAGAAAGAGATGGCGCCACGGTGGCTCTTGGCGACTTCTGGTGACATTGGCCGGCTTGGAGGCTTGATGGGAGAGCTGCAGGTCTAGCTGCTCTGTCCCAAGTTTCACCTCGGTGAGCTCGACTCATAAAGATCGATGGGTTTAAGCTGGATAGACGGTGGTGGTTATTGTTGCAAGAAATAGAAAAGAAGACCTTATCAGTGCACCCCATGCCCATGATTATTCATTGCTGCTGCTTCACCACACACCCAAGAGGAGCAGGTTCGGGAGAAAGAAAGGGACCCAAAATAGAAACAAGAAAGGGAAAAGAGAAGAGATGGGGATTCTGCGAAACTTCCTCGAGCTCGCCATCAATTCATGTCTCGTGCTGCCATGGTAACCTTATAGTTAGTCCTTTGATTACAGATTGGTGGATGTGTTGGTAGAATTTACCCGGTTGGTTTAGCTTTACGACAGTATATTGTTTACCCGATTCCGGCGAATGGTTTGGAAAGGGGAGCAAAAACAGTACAGTTGAACATGCAGTTTTCTGTATAGTGAGTTATCATCTTTTTTTATATTAAATCAAATACGTTTTCAACATAACAATCGAAGAAGTTGTCTTGTAGGTACCAAAACTTATATTGGTTTACAGATTTAGTTTTCTCTATTAATTTGTACTAAATGACTTAATAGTTTGCCCAGTGTGGACATATTTGCCATCAAAGCTGAGATTTGGTGCTTATGTGTGCTTTTTGAAACATGTGCTTTTGAAGTTCTAGGCTTCCAGCTGCAACTTTCAGAGTACACCTGGGTAAATCATTAACGATACATCACTCATTTTGCATCAGCTTTCACAAAAAATAAACTTATTTGGATTCTTAGAAACATGATACTGTTTTCTGAAGTGTAAGCCACCACCAGGTTTCTTTATGTCTCGCTTCAGAGTTCGGGCTTGAAGGTTTAGCTAGTGACTGCAATCTGGTTATATACTCTCTTATGACGAGTTAACGTCAGTTTTGAAGGTCAAACTGTGTTGATCTGAAGCTTTCTGGATGTATACATATTAGCTTGAGCACGCTGATTTTGAGGAGTAGCCTGCTTTTGCTATGTTTGTAGTCTTCTAGTGAGAATTGACTTGAGCTTCTCTCGTGTGCTTTTTTGTGTCTAGGAGTGCTATTCTGTACATCCAGAATTGTCATTGATATATAGTTTCTTTGCAAATACCTTATGTGTTGGATTTCTCTTGAGGATCTTCTCCTATGCTTTTTAAAAAAAAAATTATTTGTTGTTCATTCATCTGGGAGTTATCTTAGGTATTGATGAGGATGGGTTGGAATGTGGGATCATGGAACATTATTTTCCATTGGTTTTGACTTTTTTCTCATTGATGAAAAGGTTTATTACACAAATGCATGGTCTTGTTGCTGTCGTCTTAGAGCTTATACTCATGTTCCTGATTCTTGTATATACCCAATTTGGGTCTTTCACTGTTAATTATATGATAGTATTGATCTGGCATTTTAGTTGATAAACATGTAATTGCCACCACTTATGCTTATTAGGACAGCAGCTAGATTTAGTGGTTTTGGTTAAAATATTTACTTGCTCTGCTTTAGTGGTTATGGCTAAATATTGACTTGCTCTGTTTGAGTGACGAAAAAGTTCGGACAAACTCCGTTTTGTTTTTATAATCTGCTTGGTGTTACTTGGGAGGGAAACGGGAAGGAAGCCGTTGAGCACCTTACCAAGGCGATCCTAGTGAACCTCAACAACCATGTATGGTACAAAGAGGTCAGTCACAATAGCAGCAATGCTTGCAGAGCTTACTGACTTGAAAATGTCGCTACTCTTTGTATGTGGAGCTGTCCCCCGAGGAGCTGGATGCAGAGTGAATGAACTTCTCGATCTCGACATGTGGAAGAAGGCAGTAGTTGATAGAGGATATGTACAATGTCACCCATGATCCTCGCAGAGGATCCATCCATGGTGGCATGATCAGGATGGTGTGAGTGAAGCTTTGAAGGCCAGTTCTCTACCGATGTGCGTAGCATATGTGCTATCCCTTGTGACTTCCTTTTTTTGTAATTGCTTCACAGACCTGGAGTTGTAATAGTGTCACATCTGTCTTTGTTGCTTATTTACGTTTGGACTTGTGATCTGAGTTGGATGATGTGGGGTTTTGGATGTCAATCTGTGCTGTTGTGATACATATGAAATTTGGACTGTTGATTATTTCA
>XM_025161730.1 PREDICTED: Tetranychus urticae CXXC-type zinc finger protein 1-like (LOC107366317), mRNA 
AAAAGTAAAAAACTTTGTTAGTGAAAAGTTTTTACCATTTTTTTAATATCACTCTCAATGTGATCAATTAATAGATGTCCTATCAAGCCCTGGTGGACAAGCTAGTTTCAATGGTCAAATTTTTGGCCTTGGTTTGGACTTAGTGCTAGTATTGGTGCCCGAACTACTAGCACCGGATCATCTGGTGCCTCAGCCTCTGGTAGAGCTGCAGTTAAGGCCGTTGTCTAAGTGAAGACTCAAAGGGCTTAAAATGGTTTTCTGTGGTGAAAAATATCTGTGATCGTCAAGTTTCAAGGGAAAAGGGTAGAGGAGAATCACTGGACTGTATTAATCGTTTAAGCTGTAAAATAATGATTTGCTTGTATCAAAATTTAAATATCTCAATGTTTTTTCACTATGAAATCAGGTTCAAGCGTATGAGCAAATAGTGATGAATTATTAACAGCTAAAGTAATTTTACCATATTAATTATCGAAATATAATTACTGTCATAGGTTTAAAATTTTCTGGTTTACCTAACAGACCTACCTTTAGCTAAGAAACACCTACTTAACCGTGAAATAGACCATTGGTTACTCTCACTACGTCTAACTTACAAGAAACTAATTACTTGTTAACGAGATGTTAACTTGTTGACTGTGTTTAAAATAAACAATAAACTTTTATTAAAATGAGTGAAGACATTGCTTATTGTATTTGTCGCTCTTCAGATATAAGTCGATTTATGATTTGTTGTGATAATTGCGATGAATGGTATCATGGAGATTGTATTTCTATGACTAAGGAACGCGCTTTTACCTTTTTAAAATTTTACTGCAGTAAGTGTCGTGATCGTGATCCATCCTTGAAAAATCAACTTGTTAAAGAATCTAAAAAATATGTGGTATACACAATATCCTCTTCTGAAGTGACCAGCAAATAGGGAACAGTTCGGAAAAAGAGCCCATCACCTCAGAGGTCTAATAAAGTGGCTCGTTATGAAGATGATGCAGCACCTGAGAAGAGGAATTATGAAGATAAAGACGACGATGATAAAGATGAAACTTCAATAGATAAGAATAATTCATGTGAAAAAAATAATGAAAAAAGTGAACTCAAATCTAGATCAAGCCGAAAAGAAGCAAACACAACACCAGCTGACAACGAACGGACCAATGAAAAAACACATAAAGACAGAGAGGAAGAAATCTCCGAGATTGATGATGGTTTGGGTCAATTTTTTCAATGGATGTTTGAATATGAATTTTTATCGTGGCGTAGTCTTGTACTTTAAGTATAGAAGATCTTAATTGCCCGTGTTGGATAATCTGGTGTTTTTAAACCAGGTAAAACTGAAGGCGAATCCTAAATCTTCACCACTACTATTACAGTATTTCCTTGAATTTTTTGCTTTTTTCAAGTGCTGACATCTATGTCAACTACAGGGGGGAATAATTCAATTTTACAGTTAGTCTATTCTAACGATTCCCCCTTAAGGGAAAAGGGTAGAGGGGAATCACTGGACTGCATAAATTGTTTAAATTGTAAAATAATGATTTGCTTGAATCAAAATATAAATATCAATCAATGTTTTTTCACTATAAAATTAGGTTCAGGCGTAAGAGCAAATGTTGATGAATTATTAACAGCTAAAGTAATTTTATCATATTAATTATCGAAATATAAATACTGTCAGAGGTTTACCTAATAGACTCTTAAAATAGAATAGAATGATCTTTAGCTAAGAAACACCTTCTTGACCGTGAAATAGACCATAAGTTACTCTCACTACGTCGAACTTATAAGATACAAATTACTTGTTGACTGTGTTTAAAATAAACAATAAACTTTTATTAAAATGAGTGAAGACAATGCTTATTGTATTTGTCGCTCTTCAGATATTAGTCGATTTATGATTTGTTGTGATAATTGCGATGAATGGTATCATGGAGATTGTATTTCTATTACTGAACAACTTGCTAAGACGATGACCAAATTCTACTGCCTTATATGTCGTGATCGTAATCCATCTTTAAAAATTCAATATCACAGTGTAGTCCTAAATACTGTAGCATCTAGTCCTAAACCCACCAGCAAACATGGAACTGTTCGGAAAAAGAGCCCATCACCTCTGAGGTCCAATAAAGTGGCTCGTCATGAAGATGTCACTCCATCTGAGGAAAGGGATTGTAAAGATAAAGACGACGATCATCAAGATGAAACTTTAAGAAATAAGACTGATTCATGTGAAAAAAATAACCAAAAAAGTGAAATCAAATCTAGATCAAGCCGAAGAGAAGCAAACACAACACCAGCTGACAACGAACGGACGAATGAAAAAACACATAGAGAAAGAAAGGAAGAAATCTCCGAGATTGATGATGGTTTGGGTCAATGTTTGCGATGGATGTTTGAATATGAATTTTTATCGTGGCGCAGGCTTATACTTTAAGTATAGAAGATCTTAATTGCCCGTGTTGGATAATCTGGTGTTTTGGAACTGAAGGCGAAACCTGAATCTTCACCACTACTATAAGGACAAGTTAAAATGTTTTGTTGTACTGACTAAATCAACTATTTGCAATTCCCTAACATTAAAATAAAAAAAATTAAATTGTAAGTGAAATTTTGATATCAATAAGAATCAGCTTTAATTGTTCATTTTTGCTGTGAGATGACATGCAATTTAAGTTAAGACCTCAAGAAAAAATATCCAAAAGTAAAATTTTAACAATTTCTGAGAGTTTTATCATAAATGTTCCGAGTTAGATTATGCTCAACTTGAAAAGTGAAAAACCTTTGTCAGTAGAAAGTTTTACCATTTTTTGAATCTCCCTCTCTATGTTATCGAAAAGTAACTGAGTAACCAGTTTTTAAAGTCTGTTTGACTGGTTTCGGTAATTTTACATTTGTTTACAAACTCTGTTTATCTTCAATTTCGGCAGTTTTTATCCTTACGTCAAAGTTTTATTATTTAAATGTTTTTCTTATTAACTTAAGTGATATCAACATGGGTGAAGACACTTCTTACTGTATTTGTCGCTCTTCAGATACAAGTCGTTTTATGATTGGTTGTGATTCTTGTAATGAATGGTATCATGGAGATTGTATTTCTATTACTGAACAGCTTGCTAAGACGATAACCAAGTTCTATTGCCTCATGTGTCGTGATGCTAATCCATCCTTAAAAATTCAATATCACAAAGATTCTGGCTCTAAATCAACTAGCAAACAGGGGACTGTTCGAAAAAAGAAACAACCAACTTCTAAGTCCAATAAAACGGCTCGTTTTGAAGATGATGCCTCACCAGAGAAGATGGATTTTGAGGATGAAAACGATGAAGAGTTTGATGACGATGATGATGGAGATGAAACTTTCAGAATTGAGAATGAATTATCTGAAAAAAATAATCGAAAAAGTAAACCAAAATCTAGACCTAGCCGAAAGAAAACAAATACAACATCATCTGACAACAAACGTGGAAGTAAAAAAACACATAGACAAAGAGAAAGAGAAAGAGATGTCTACGAAGTTGATGATGGTTTAAGGCAATGTTATGGTCCTGGATGTATCAATATAGCTCGTCGAGGCTCCAAATACTGCAGTGATAATTGTGGTATCAAATTAGCAACCAACAGGATAATAGAAATTTTACCTGAACGTATAAGGTTTTGGCAAAGTACACCATCAAGTGCTGATGTTTTCAGTAATCGAGAATTAGATGCAATTCGAACAGAAGGAGAAACAGCCAAAAGGCTTCTTGAAGAACTGGACGGTAAACAAAAAGAACTAGAAGCTATGATTGCCGAGGCCAAGAAACTACCACCAATCTCAGAAGATGAAGTAGACGAAGAGACTGGAGATGAGCTGATGACTTACTGTGTAACCTGTGGACATGAAGTTGCATCGAGAACTGCTTTGAGACACATGGAAAGATGTTTT
>XM_043408227.1 PREDICTED: Colletes gigas uncharacterized LOC122404294 (LOC122404294), mRNA 
ATGCATATGATAACAAGACAAAGGCTTGGTCGCCCGAGAGGACCAAATGCTAACCGCCCTAGGGAAGTGGTTCATGATTCCGCTTCTCCGACATCAGAAGTGAGATATCCTCGGCTACAAAGCGAGTCAGATGCAAATTGCGAACATCAGCCGCATGAAAATGTGCCCATTCAAGACAGCGCGTATACGATGCCGCAGTCGGCTGCATATGCAGCGCGGCTTATGGCCATGCTCACCTTGCGATGGCAGAGTTTCTCTACAGAGCAGATTGCTGTAGCAATGGTTCTGGCGCACACGGCTCAATTTGATAGACGACTCCAGAGATTAGCCTTTACCACAGAAATCAATTCAAGGGACAAGCTACACCGTGCAACTGGTCACTATGCTTCCAAGTGTCACCAAGTAGCTGGCAAGGGTAGCGGCGGTGCTAGCAGCAGCAGAGATTTTAACAATGCAGTTACGTCAAATACGGTTCAGCGACGGGTTGATGTTTGTCAGATAGGTAACCCTAGTGGAAAACTGGTCTGCAATGATCAGATAGCTAGATTAGGAGGTGCTCGGTGGTACTCCAGTTTTGATATGTTGAGCGATTATCACCAGATCCCTGAGGAAGCCAATTCTATTGAGAAAACGGCCTTCGTTACTCCTGAAGGTCAATGGGAATATTTGACCATGCCATTTGGGTTAAAGAATGCTAGTTCGGTCTACCAGCGAGCTATTGTAAAAGCCCTCAGAGATATGGCATTTAGCTTCGTTTTATGA
>MZ269370.1 Colletotrichum fructicola isolate 25640 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene and internal transcribed spacer 2, complete sequence; and large subunit ribosomal RNA gene, partial sequence 
GAGTTTACGCTCTATAACCCTTTGTGAACATACCTATAACTGTTGCTTCGGCGGGTAGGGTCTCCGCGACCCTCCCGGCCTCCCGCCTCCGGGCGGGTCGGCGCCCGCCGGAGGATAACCAAACTCTGATTTAACGACGTTTCTTCTGAGTGGTACAAGCAAATAATCAAAACTTTTAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCGCCAGCATTCTGGCGGGCATGCCTGTTCGAGCGTCATTTCAACCCTCAAGCTCTGCTTGGTGTTGGGGCCCTACAGCTGATGTAGGCCCTCAAAGGTAGTGGCGGACCCTCCCGGAGCCTCCTTTGCGTAGTAACTTTACGTCTCGCACTGGGATCCGGAGGGACTCTTGCCGTAAAACCCCCCAATTTTCCAAAGGTTGACCTCGGATCAGGTAGGAATACCCGCTGAA
>XM_036071201.1 PREDICTED: Halichoerus grypus sequestosome 1 (SQSTM1), transcript variant X2, mRNA 
CCCGCCGCCGCCGCGGCCCGGCTCCGTCTCCTGCTCTCCGACCGGTAGCGATGGCGTCGCTCACCGTGAAGGCCTATCTTCTGGGCAAGGAGGACGCGGCCCGCGAGATCCGCCGCTTCAGCTTCTGCTTCAGCCCCGAGGCCGAGGCGGAGGCCGAGGCGGAGGCCGCGGCCGGGCCCGGGCCCTGCGAGCGGCTGCTGAGCCGGGTGGCCGCCCTGTTCCCGGTGCTGCGGCCCGGCGGCTTCCAGACGTACTACCGCGATGAGGATGGAGACTTGGTGGCCTTTTCCAGTGACGAGGAACTGACCATGGCAATGTCCTATGTGAAGGATGACCTCGTCCGTATTTACATTAAAGGTCTGGAGGGCAGGGCCAGGGGCCCGCTGACTGAAAGCCCCCCAGTCGTGACGAGCGGTTCGTGTGGGGTCCCACCTGCAGAGAAGAAGGAGTGTCGGCGGGACCACCGCCCCCCGTGTGCTCAGGAGGTGCCCCGCGGCCTGGTGCACCCCGGCGTGATCTGTGACGGGTGCAATGGGCCCGTGGTGGGGACCCGCTACAAGTGCAGCGTGTGCCCGGACTACGACCTGTGCTCCGCCTGCGAGGGGAAGGGCCTGCACCGTGAGCACAGCAAGCTCGTGTTCCCCGGCCCCTTCGGGCCCTTCTCCGAGGGCGTCGCTCACAGCCGCTGGCTCCGGAAGCTGAAACACGGGCACTTCGTGTGGCCCGGCTGGGAGATGGGCCCCCCAGGGCACTGGAGCCCGCGTCCTCCCCGGGCAGGGGACGCCCGCCCCGGCTCCGCAGCCGAATCAGCTGCTGGTCCGTCGGAGGATCCCAGTGTGAATTTCCTCAAGAACGTAGGGGAGAGTGTGGCGGCCGCCCTGAGCCCTCTGGGCATCGAGGTGGATATCGACGTGGAGCACGGCGGGAAGAGGAGCCGCCTCGCCCCTGTCTCTCCAGGCAGCTCCGGCACCGAGGAGAAGTGCGGCTCCCAGCCGAGCAGCTGCTCTTCGGACCCCGGCAAGCCGGACGCGGACCCGGAGGGCGCGGCGCGGTCCCTGGCGGAGCAGATGGACAAGGTGGCCCTGGAGTCGGTGCCACCGGAGGAGCAGATGGAGTCGGATAACTGCTCGGGGGCAGACGAAGACTGGACTCACTTGTCTTCCAAAGAAGTGGACCCGTCCACGGGGGAACTCCAGTCTCTACAGATGCCCGAATCCGAAGGGCCGGGCTCTCTCGACTCTTCTCAGGAAGGGCCCACGGGACTGAAGGAAGCTGCGTTGTACCCCCATCTGCCACCAGAAGCTGACCCCCGGCTCATCGAGTCCCTCTCCCAGATGCTGTCCATGGGCTTCTCTGACGAAGGCGGCTGGCTCACCAGGCTCCTGCAGACCAAGAACTACGACATCGGGGCGGCGCTGGACACCATCCAGTATTCGAAGCACCCGTTGTGACGGCTTCTGCCCCCTTGTCCCACCCCCTTCTTGTCTCCTAGTTGTGTTGAGCTAGTGTAGAACAGCAGGGCCTCTCTAAGGGCCAGTTTCTCTGCATTCTTCTTCCAGAATCTGGGGGGCGGGGATGCACCAAGCCATCCAGGGCAGTGGAACAAGTGACGGGGGGGGGGCCCCGTGTGTGGCTGCCCATGTCGGAGAAGCGTCTGCTGGCTTCCAGGGGCGGACGCGGGGCCCAGTGGTGTTCTCCTGCCCTCCCCCCACCAGGATCACACCAGCAGTCCAGAATGTCTTGCCTAATGGCCTTTTTTTTTTTTAATGACTAATAGTAGGCTGACA
>XM_050309850.1 PREDICTED: Myiozetetes cayanensis ring finger protein 111 (LOC126636998), transcript variant X10, mRNA 
GCAGGCTCACCCGTGTCTAGGCCTTCCTTAAATCTTTCCATGTCTGAATGGACTCCTGAATGTAATATAGTCTATACTCCAGAAGCGGATATGAAGAGTGAAGTTCCTTCTGATGCACCAAAGAGCCAGGAGAGTCTGAAGGGGATCCTCTTGAACCCTGAGCCTATTGGGGCGGCCAAAAGCTTCAGTGCAGAAGTTGAGATGATTGCCAGTAAAGTAGGGAATGAGTTCTCCCACTTATGTGGTGACTCTCAAAAGCAGAAGGACATGAATGGCAACCATACAGACCAAGAAAAAAGTATTGTGCGAAAAAAACGCAAGAGCCAGCAGGCTGGTCCTTCCTACGCTCAGAACTGTCCTGATAAGGAAAACAAAGGAATCTTGGGATTGAGGCAGCATCTAGGAACACAGAGTGAGGACAATGACTCTTCTTTTAGTGACTGTATCTCTTCACCTTCTTCTAGCTTACACTTTGGAGACTCTGACACAGTAACATCTGATGAAGAGAAGGATGCTCCTGTCAGACACCCTCAGGCAGTGCTGAATCCTGTGAGCAGAACTCACAGTGCCCGGTCACACAAGTGGCCTCGCACTGAGGCAGACTCTGTGCCCGGATTACTCATGAAAAGGCCCTGTTTTCACAACAGCTCTTTAAGAAGGCTCCCATATAGGAAAAGAGTTGTGAAAACAGGCTCATCCCAGCGGACACAGAACCAAAAAGAGCGGATTTTAATGCAGAGGAAAAAGCGGGAGGTGCTGGCTCGCAGGAAGTACGCACTGCTGCCCAGCTCCAGCAGCTCCAGCGAGAACGATCTCAGTAGTGAATCTTCCTCCAGTTCATCTACTGAAGGGGAGGAAGACTTATTTGTGTCACCTGGTGAAAACCACCAGAACACTACAGCTGTTCCTTCAGGAAGCATTGATGAAGATGTTGTGGTGATTGAAGCATCCTCCACTCCCCAGGTCACTGCTAATGAAGAAATAAATGTTACCTCAACAGACAGTGAAGTGGAGATTGTCACAGTTGGTGAAAACTACAGGTCTCGTTCTGCACTTGGACACACAAGATCCCACTGGGGCCAGAGCTCTGGCTCTCACGCTCCACGACCTCCGGAGCAGCGGAACCGCAGCAGGATCTCCACGGTCATCCAGCCCCTGAGGCAGAATGCGGCTGAAGTTGTGGACCTCACGGTGGATGAGGATGAGCCAACAGTTGTGCCAAGCACATCAGCTCGAGTGGAGCCGCAGGTCGTGAGTTCTGCTTCCAGTAACAGTTCCAGTACCTCTACCTCAGAGCAGGCCTCTGATGCAGCTCCCACCATCTCCACCAGCCAGCCCTCTGCAGCTCCAGAGACGACTCCCAGTCTTCCCAGTGGCAGCACTGCTGGTACTTCAGCTGGAGATGACATAAGAAGAACTTCATCTAATACAACACTGGAAACTGGCCCTCCGGCCATGCCAAGGTTACCGTCGTGCTGCCCTCAGCATTCTCCTTGTGGAGGACCTTCACAGACTCATCATGCCTTGGGGCACCCACATACGAGCTGCTTTCAGCAGCATGGCCACCACTTCCAGCATCACCACCACCACCACCACAACCCTCACCCGGCTGTCCCGCTCTCCCCTTCGTTCAGTGACTCCAGCTGCCCTGTGGAAAGGCCTCCCCCGGTGCCTGCCCCGTGTGGAGCAAGCAGCAGTTCTGGCACCACTTACCATGATCAGCAGGCACTGCCAGTAGACTTAAGCAGCAGTGGTATAAGAAGTCATGGAAGTGGTGCTTTTCATGGAACATCTGCCTTTGATCCTTGCTGTCCTGGTTCTTCATCCCGAGCGACGATCTATGGGCACCAGGCTGGGGCTGGGCCGAGCCAGTCCCTGACAATAGATGGATACGGATCAAGCATCGTTGCTCAGCCACAGCCCCAACCTCCTCCTCAGGCATCGCTCTCCTCCTGTCGCCATTACATGCATTCTCCTTTACCTGATGTTTTCATTGCAGATGCTTCCTTGACCAGACCACTTCACCATCAAGCTTCTGCATGCCCTCACTCTCATGGAAATCCCCCTCCACAGCCACAACCTCCACCTCAAGTAGATTATGTTATCCCTCATCCAGTGCATCCCTTCCATCCTTCAATCTCCTCTCATGCATCTTCTCATCCTGTTCCACCTCCACCACCGACTCATCCTTTAGCCAGTGCAGCTGCTCCAATCCCACAGCATCTTCCTGCAACACACCAGCCTATATCCCATCACATCCCTGCAACAGCACCTCCAGCACAGAGGCTACATCCTCATGAAGTGATCCAGAGGATGGAGGTCCAGAGAAGAAGGATGATGCAACACCCAACACGTGCTCATGAGCGACCTCCTCCACATCCTCACAGAATGCATCCCAATTATGGGCATGGGCATCACATTCATGTGCCTCAGACTATGTCTTCCCATCCTCGACAAGCTCCAGAGAGATCTGCCTGGGAACTAGGAATTGAAGCTGGTGTGACTGCAGCTACTTACCCTCCAGGGCCTTTGCATCCTCACTTGGCCCACTACCACGCACCTCCTCGACTGCATCATTTGCAAATAGGGGCACTCCCTCTAATGGAGCTGATTCACTTGGAGGAACGATTAGGCAACGTGAATCGTGGAGCAACACAGGGAACTATAGAAAGATGCACATATCCACATAAATACAAAAAGAGGAAACTGCACTGCAAACAAGATGCGGAGGAAGGAACAGAAGAAGACACAGAGGAAAAGTGTACCATCTGTTTGTCTATCTTGGAGGAAGGTGAAGATGTCAGGCGCCTTCCGTGTATGCACCTTTTCCACCAAGTCTGTGTAGATCAGTGGTTGATTACTAACAAGAAGTGCCCCATTTGCAGAGTGGACATTGAGGCTCAGCTGCCCAGTGAAAGTTGACACTGCTTTCCAGAACTCTTGTCCTCCCGCTCGCTCCCTCTCATCCCTCCTGGTACTGCAGTCAACCAAAGATGGCATGACTTACCTGCGCAGATGTGGAACATTGAACCTTAGAGTGCTGGCTCTGCTACATGGTACAACTAATGCTAGACCTACAGTTTATTGTAGAAGACAGTTGAGTTTCAGTGTATTTATAATTTTTTTAAAATTTTTTTAGGTTTTACTTTTTTTTCTTTAAATTCATTACTGTATTTTTGCATGGTTCCTTGTATTGCATTTGTTTGCACATATTATGGGCTTTGTGACCCCAAACTTGCAGGCAAGATTAGCTGCTTTAGTAAGTAGAATTGTGTGGTCTCTTTTTTTTTGGTTTGTTTTATGTAGTATCAAGCTTTGAAAGTATGATTTCACTCATTACTAACCTCGAATTCCTTAATTTAATCAATCATATTTTAGTTTAAATGTATAAAGATCATCTAGAAAAGGATAATATTATGTATTGAGACATTCCTTAATTAGGAAAAAATGGCTGCTGTATATTTACAATATCAGTTCTGAGTCAAATAACATCCTTAATACTGGGAACAGAATATGGACTATATTCAGTTTGACTGATACATATAGCATACTCATCACCAGAGTTTTTGTCTGATCAGATTTTTGTGTTTGTTTTAAAAATTTCAGCACAATGCAGATATATTTGAATGTCAATATTAAACATTTAGACTGCTGTTCAGATTGTATTTATCATTTTCTTCTATGTCTAGAAATTTGAATCCCTAACTTAAATATATGCTGCTGTGAAACAGCTCTAGTGAACACTAAATGTTGATTTCAGTTAGCTGGATTGTAGATACTTGCAGATTGAAAGACTTATTAGGGAAATGGAAAAAGAGCTTAGAATCTGTTTGGTCTTCTGCTAACTTAAGTTGAAGTATCTGCGCACATTGAGAGTTGGTTTGTTTTTTTTTTTGTTGTTTTGGTTTGGTTTTGGGTTGGGTTTTTTTGGTGGGTTTTTTTTGAGGGGAGGGGTTGTTTGTTTTTTTTTTTCTTTTTGTTGTTGTTGCTGTTTGGGTTTTGTTGTTGGTTTGTGGGTTTTTTTTTAATATAAAACCATTCAGTAAGGACTTTAAGCTACAGGGTTTTTGTTTGGGTTTATATACATGCATTCATAGAATTTCTAAGGATTCCAGGCGTGTCTTGGGATTTTTATTAGATTTAAAGTTAATAAAGTTAGCTAAATCCACTTGTCTCTTGTTTTTATTTTTCATTAGTAAATTAAAAGCCTGTAAATTTCTGTAGAAACTGAGACACAAATTATGTGGTTACCTAGTTTTTGCCTTGATCATAGGTTCCCTCTTTATAAATTACCAACAGTCCATCACTGATTGAAGTATTTTCTATAGTTAAGATTTGCTGCATAATATAGTATATAGAATTAATAATGTACTAACATTTTGCCTTTGGAGGAGGTTTTAATCCACATCAGGATTCAAGTTGCTTCAACATTCTTTCACATATAATAGATTATAGTTTATTTAAATGTGCTCAACATTGCAAAATGCAAATGTGCAAAAACATTGGGACAGTATTACTGTCACTTTGGAAAAGATGTTCCTCGGGGATCATAGATAAATATGTCAATTAGCTTGCATTAAGCCACCTGCTTTGTAAGTGAATTGAATAATAAATACCTTCAGTTTCTCTTGTCTTTGTCTTTCATAATCAGATGATATGTACAATGGTTTACAGTAAATCTAGAAGATGAACTGTTATGTTTACACTAAAAAATGATCCATTTATAAATATTACCTTATCTAATTTGATGCCTGTTTCTGTCTGGTTCAAGCAGCTTCCTTTTTATTATTTTTTTTTTTTTTTTTGTCAACAAACTTAACACCTCTGGCACTGAGGCTTTTAGTGGAGAGAATTTTTATTCCAGTATGTATGTGATAAATGGACCTTCTCAAGCTTCCTTGTGTTGCTAGAACTGAACTTAAAACCACTTTGTGCTTGTAAATGGGGGATGAGGGAGAGAGGCAGCCCAGGATCTGACTGCTCCTGTGGGTTTCTGCTAAAGCTTTTGGACATGGTGGCTGTAGGAAATTCAAAGACTGGAGTTGGAGCTTCATTGCTAAAAATGAATAAAAGTAGCTGGAAGGACTGACCAGACACTTTGCTTTCCCATGACTGAAAAGAAGGGAAGTTAGTTGACTGCTAATGTTTGAAGACTGATATTCACTGCTAAAAGGTTCCAAGAAGGTACTTGAGAGACATGGGACAAAAAAACCCAGGGCCTCTAAAATAATAGACCCTGGGGTAGAATCTCTTTTGGCTTTGTTACTGGACAAAGAAGCACAGATTTGGGGGATTTTTTTTTTTAATTTTTTATTTTGTTTTTAGGAAATATTTTATGGGTCTGATTTGAGTGCGTGGTACTAGAGGTATTTTAGTGGTCCATGATTTGATTTATTAGAGCTACTGATACTGTCTTGCTTTTAAATGTATGCATAACATTGTAATGTGATGTTGAACACTTTTGTCAGGAATCACGGTATTCTGATCTTAATGCTATTGCAGGGGCTAAAAAGCTGCAGCTTACTTCTGTTCCGGAAGGTTGTGACTTAACCGTAATTTAAGAGAAGGAGAAAGATTAGGCTTTTCATTTTGAAAATTTCCACCACTTACTGTGCTTTATATGCTTAGATGCATTGCCTTAAGTTTTCTGCAGCATCTTTGACTTTGAAGATAAGATTCTCAACAGTATGCATCAAATTACTTTTCATATGAAACTCCATTGTCAAAAGAAATCCTTTTGTATGCAATAAATAAAATGTTAGACTGGTATCATTCAAAA
>XM_033409705.2 PREDICTED: Orcinus orca olfactory receptor 2J3-like (LOC105748649), mRNA 
TTCAACATTCCCTATCCAGTTCCTCTGTTGCATGTAAGTTCATGAACCAGCATTAAGTTCTAAGCAAAGGATAATCAGGCTTCAAAATTCTGACTGTGGTGTTTCCAGCAAGTAGTGTTAAGCAATGAGAAAATTCAGTAACACTTTTCATCACTCTGATGGCTTTGTTCTGGTGGGCTTCTCTGAATGGCCCAAACTAGAAATGGTTCTTTTTCTGGCCATCTCTGTTTTCTACATAATGACCCTCCTTGGGAATTTAGCCATCATTATCTTGTCATGCCTTGATGCCAGGCTCCACACCCCCATGTATTTCTTTCTGTCTAATCTCTCTTTTTTGGACCTTTGCTGTACTACTTCCCCTGTCCCCCAAATGCTGGTCAACATCCAAAGCCACTGGAGAAATATCAGCTACCTAGGATGCATAGCTTAACTTTTCATATTCCTTAGTTTAGGATCCACTGAATGTGTACTTCTTTCAGTAATGGCCTTTGGTCGTTATGTAGCTATCTGCCAGCCTCTCCATTACACAGTTATCATGCACTCTTGGCTATGCCAACAACTGGCAGCAGTGGCTTGGGTAACAGGTTTCAGCAACTCTTTGGTGCAAATAGTGTTGACCTTCTTGTTACCTCACTGTGGTCCATATCAGGTGGAGAATTTCTTCTGTGAGGTACCTGCCATGCTTCAATTATCATGTGTTGATACATGGATCAATGAAGTGGAGATGTATGCTGCTGTAGTGGTCATAAAAGTCTCTTAAAATTTTGATTATAAGGAATTTCACTTATTCAACAAATATTTGAGTGCCTAATTGTGTGCCAGGCACTGTTCTAGGCACTTTGGATTTATCAGTGGACCAACAAAGAACTTTGCACCATGGAACTTACATTTTGGTTTGGGAGAAATCAATGATAAGCAATAGATACTAAATATCATGTTAGAAGATGGTAAGTGCTCTGGAAAGGAAAAATGTGGAGTATGGTAAGAAGATGGGGATTGTGGGGCAGGAGGCATACATTGCAAGTTTAAATAGAGTGGTAAGAGTAGGACTCACCGTAGCTGTGGCATTTGAGCGAAGACTTGAAGGTGAGAGGAGACAATGCAGATATTTGGGGTAAAAATGTTCCAGGCAGAGGGATCAGCCAGTGCAAAGGCCCAGGGATAGGAGTGTGTTTGGCTTGTCCGAGAGATAGGAAAGAGGCCAATGAGAATGGAATGGAGTGTGTGAGAAGAGAATATCAGAGAGATTACACAGGGACCTGATTGGTTAGGGCAGGGGTTGGCAATTTTTTTCTATACAGGGCCAGATAGTAAATATTTTAGGCTTTGCAGGCCATATGGTCTCTGTCACGACTACTCAATTCTGCCTTTGTAGCACAAAGGTGGCCATAGACGATACTTAAAGCTTTACTGGAATATAGCCATGCTCATTTGCTTATTTATGGACTCTAAATTTATTTTATATGTCATAAAATATTCTTTTTCTTTTGTTTTCCACCATTTAAAAAATGTAAAAACCATTTTTAGCTCCCATTCTTAGCTCATGGGCCACATAAAAACAGGTATCTGGCTGCATTTGGTCTGTGGGCCATAGTTTGCAAGCCCATGGTGAAGGGTTTCCAGGGCCCTTATAAGATCTTTTGTTTTGGGACTTCCCTGGCGGTCCAGTGGTTAAAACTCCGCGCTTCCAATGCAGAGGGCACTGGTTCGATCCCTGGTCAGAGAACTAAGATCCCAGATGCCACGTGGCGTGGCCAAAAGATTTTTTTTTTAAAAAAAGATCTTTTGTTTTTACTCAGAGTTTAAAGGGGGAGCCATTAGCAGGTTTTGAGCAGATAAGTAAAATGATTTGATTTATATTTTTAAGGGATCACTCTATGGAATGATGTCTAAGATTTGCTTCAAAATAATCTGGAGGGCAGGGTACTATGGGGGTTAAAGATGAATCAAGATGGGTCATACATTAATAATTATTGAGTCTGTATAATGGGTATATAGGGTTTAATATAGTATTCTCTATGCTATTATGTAGGGTTTTCCATACTAGAAGGTTAAAACAAAAATAGGCACTCTGGCTGCTTATTTGGAGCAGACTGTGAGGAGGGAAGGTTAGGAATGAGAAAAGCAATTAGGAGGCTATTACGGTAATCCTTGAGAGATGGCAGTGGTGGCTTTGTCTGGAGTGGTAGCCCTGGAGGTGGTGAAAAGTGGTTGGGTTCCAGGGCTTCCCTGGTGGCGCAGTGGTTGAGAGTCCGCCTGCCGATGCAGGGGACACGGGTTCGTGGCCCGGTCCGGGAAGATCCCACATGCCGCGGAGCGGCTGGGCCCGTGAGCCATGGCCGCTGAGCCTGCGCGTCCGGAGCCTGTGCTCCGCGGCGGGAGAGGCCACAGCGGTGAGAGGCCCGCGTACCGAAAAAAAAAAAAAAAAAAAAAAGTGGTTGGGTTCTGGATGAATATTGAAAGTAGAGCCAAGAGGATTAACTGTGTATCGGGTATGAGGTGTGAGAGAAAGATAGGAGTTGGGGAGGCTTCCAGGTTTTGGCCTGAACAGGGAGAAGGGTAAAGTTGCCATAAACTGAATGGAAAAATCTGCAAGTAGAAGAGATGTGGGCGGAAAGATCATCATGAGTTCAGTTTTAAACATTTAAGTTTGAGATGTCTACCAGATATCCTAGTGGAAATATTAAACCGACAGTTGTCTATGCGAGTTTGGAGTTTGGGAGGAAGTTTTGGACTGAAGACATAAATTTGGGAGTCATTGTCATGTAGGTATCTTTAGCTTGGACTGGGTAAGATCACTGAGTGAGGGAGTGTAGATAGAGAGGAGAACAGTACCAAGCACTGGGCCTTGCAGCATTCCAGTGTTAAGTAGTCAGGAGAGTAGGGAGAGATAGCAGAGGAGACTGAGAAGTCACCAGGGAGACAGGAGGAAAACCAAGAGAGCATAGTAGCCTAGAAATCAAGGAAAGAAAGCGTTTCAAGGAGAGGGGAAAGATCAGTGATGTAAAAATACTGCTTGAGTAAGACGAGGACAACAAATTGACCCCTGAATTTAGCAATGTGATTATTGGTAATCTGGATGAGCAGTTTAGGTGGAGTGATGATGGCAAAAGCTACATTGCCAAGGGTCAGGGCAAAGAAATGGAGTAAGAACAGTCCGGAAAAGTGAGGGAAAGAAGTCCGCTCTTTAAGATGGAAGAAATAACAAGTATGTACAGTCAGCCCTCTGTATCCGCAGGTTCTGCATCTGAAGATTCAACCAATTGCAGATTGAAAATATTTGGAAAAAAATTCCAGAAAGTTCCCAAAAGCAAAACTTGAATTTGCCTTGCACAGGCAACTATTACATAGCATTTGCGTTGTATTAGGTTTTATAAATAATCTAGAGATGATTTAAAGTACGGGAGGATGCACGAAGGTTACATGCAAATACTATGCCATTTTATATAAGGGATTTGAGCATCTGTGGATTTTGGTATCCACAGGAAGTCTGGAGCCAATCCCCTGAGGATACTGAGAGACTATTGTATGTATACTTGTTAACATATAGAACATAACAGTATGCATGCAAAGAGAGTGACCCATGAAGAGGAAA
>XM_042525726.1 PREDICTED: Zingiber officinale uncharacterized LOC121974587 (LOC121974587), transcript variant X1, mRNA 
TTGATCAACGTTTGACGAATTAGAGAGTTGAGGCCTCTTTTGTTTTGAATTTAAAGGAAATGGCGTCGTCTTCCAAGAGATCTGGCAGACCGGTGCTCCCTTTTCGGAGATCTGTCTCTCCGGCTGGCGGCTTCGCCTCCTCGTCAGCCAGCCTCTCTGCTCCCTTCTTGCATCACCGATCGGCCTCCCCTACCCGCGTCCACCTGGCCGGTGCTGGGTCTTCCGGATCTTCCTCCGTTCGCTTCTCCCTCAACCGATCTGCCTCCCCCGGACGCTCCATCGCTGCGTCCGACAGCCGATCATCTCCCGCCCCGGCCCGGCGCACCTGCCTCTGCTCTCCTTCCACTCACCCTGGATCCTTCCGCTGCCACCTCCACAAGGGCCTCAACGGCGGCGGATCCGCGGCCGCTTCCTCGCCGTCGAACAGGCTCAATGCGCGGAGGTCCGCGATGGCGAACTCGCTGGTCCGGATCGGGGCCGTGGAGGGCGAGTGGGTGAAGCGCGCGCTCTCGGCGCTCATCCGTCCCTCCTCCCACCAACAGCGTCGGCGGGGAGCCTTCCAACCCCGCCCTAGCCGCCTCTCTCGGATGTCCAACGCTGCCGATCCTAAATCTCCGTCGTCCGATCCACCGATCTAGAATCAGTAATGGGAGTAACGTTCCCTCGCTCCGTTACGTTCCCGTTGGGCTTCAAGTTTGGATTGCGTCGCCGTCAAGTTCTCATCGTTCGCCGGTACGTTCCGTCATCTGCGAGGGAATTGCCTCAGGAAGCTACTTGATTCAGTGACTCGGCCACTGGTGAGATGAATCGTAAGAATTATTTATTTAAATCATTTCGATAAATAGATAAAGGACATAAAATATGATGACTAGGTCTCAATTAAAACTATAATATTAAATCACTTTAGTATTAGAACCATTCACTTAACACAATAATCATGTAATGATTTTGAAATTCTATCAACGAATTTTAGAAAATAGAATAACTTCAAAGTTCAGAAGATAAAGTGAAAGTTTGGTAGAGGAAAACATTAGGTGAGGACAATGGACAAGTCCATGTGGAAGCCATAATTGTGGTGGGAAAATTGTTAGTGGAACTGAACCACCAAGAACCTAATTCACCTTCAAATTATTTCAACATCAAACGCATATTTAAAAACTACAAAAGTGAAACAAATAAAGAAACGTTGGGTGGGTTAGTTGGATTAGCTAAGCATCACCATTTAATATAGCACGCATATTTTACCATTACATTATTTTATTTATCATTTTAAATTTTAGTCTATAAAGGTGACGCAACAAAATTTAACATGTTATTTTTTTATCCTTTTAATTAAGAATAATGTACCTAAAAGTAACATATTGGATGTTATATTAATAAATATATCATTTTATTGTTTTCAAAGGGTCATCCCTTAGTGACAAGTGGGAATAATCACAATAGTTGAAATCATAAGGAGAACTTGTGATGGTGGAGATTGGATCTAGATGGTGAGGAAGAAGCTCCACCAGATTTTGTGATGACAAAAAGGACAGTTTGGATAATGTCTATCAACATAATATAAGCATTCCCTTTCAAATTAATTAATTATAGATATTGTTCTTATTAAAGAGTCACGGAACCAAGGTTATCATCTTGAAATATTGGTTAGTGGCTAGCAGGATCTTGTGTATCCCATGGGCTTTGACTGGAACAGTTGGCCACAGTTTATTATTAAAATTTGGGAAACCTAAAGATTTTTTCTTTTTTTTGTAAAATTTTACAAAAGAAGTATTAGAGGGAGATATAATTAATTACAATGATGAATTTATAAATTATTAAAACAATTAGAAAATGTATACCGGCCAAATTAATTAACACAACATTATGTGTATTCATCTGTTCCTTGTTTATCAAAGACAAAATTAATACAAAAGTGCGATTTGAAATAGTATTTTAGTTGGGTAAGTGTGTAGTGGGAATTGTCCCGCTTGCTATGGGTATTCAGATTATGGGGAGATCGTAGAGAAAAGAAAGAGAGAAAGGGAAGATGAGAAGTAAAACAATTTTAAAAGAAAGCGAAAATAATGATAATTCTTGCTTTTGTTCTCTTTGTCAACTCATTTTTCCATCCCATGGGCATTGCAGTTGGAAAATTTGCTACAAAGGAGGTTTATATTATATATTTCTGTGAAAGTCTCATTTATAGATAGTTATTGGATCAAAGTATAGTTAAAGAAAAAAAAACTTAATTACTAATTAATTAATATCCAAGATCTATTCTGCTCATATAAAAGAGTTATTCAAAAGATCGTACTGTAAAAGTTTCTTCCAGACTATTTGTTTCCCGATCCACTGATTACAATCATATCAAGTAGTAGCTGTGGGCAACTATAGCAATGGTTAGTGGTCGTTTTTTTTCCTGGTTTTTGATGGATGAATTTTAGAAAAAAGAAGAAATGTTGACCAATGTAACTGATGAACGAGCCACTCTCTAGAAGAGTGACAGATAAGAATCAAGCGAGGTTGAAAGGAAAATTTTGACCGGAACAAAAGAGGCTGCAATTGTCAAATTTACTTCTAAGAAGTCCTTTTAAAGTGGTCATTAATCCGAGCATCAAGTTTAAGACATTGTTTTTAGAGAAAGATGTTGGGCGTGGAAGCAAAGGCGACGGCACTGACATGGAAGATGATAGAAGTCAATTATGGCACAGGACTTTGTAAGAATCCATCTTCTCATTCTAGAAGAAAAAGGATATTTTTCACCGGCGCCTGTTTGATTTCCCGTACAGATAGTTAGGCGTAGGGTCGATCGTATGGGATAGTTATGACCGTTTGCAGAAAAAGAAAAAAGAACATTTTTCCTATTTATAAAGTGGTATTTCGAAATAGATGATAAACAATCGAAGATGATAAGAAGGATTTTAGGCAA
>XM_039010113.1 PREDICTED: Salvelinus namaycush gamma-aminobutyric acid receptor subunit delta-like (LOC120060710), mRNA 
ATGGACATGATAACTTTCATGTTGGCGAGCCTTGCCCTCCTGAATATCAGGGACAACATTTTCACCAGGGCCATGCTGAGTGACATTGGGGACTATATAGGTTCAGACATACAAATTTCCTGGTTGCCTAATCTGGATGAGTTAATGAAGGGCTATGCGCGAAATTTTCGCCCTGGGATAGGAGGCTCACCCGTGAATGTTGCCATGGCTATTGAAGTAGCCAGTATTGACCACATCTCTGAAGCCAACATGGAGTACACCATGACCATTTTCCTGCGTCAGAGCTGGCGGGACGACCGCCTGTCCTACAACCACACCAACAAGACCCTGGGACTTGATAGCCGCTTCGTGGATAAACTCTGGCTGCCCGACACCTTCATTGTCAACGCCAAGTCTGCCTGGTTCCATGACGTCACCGTGGAGAACAAGCTGATTCGCCTGCAGCCTGATGGGGTCATCCTTTACAGCAGCCGGATCACCTCGACTGTGGCGTGTGACATGGACCTGACCAAATACCCCATGGATGAGCAGGAGTGTATGCTGGACCTAGAAAGCTATGGCTACTCCTCAGAGGACATTGTGTACCACTGGTCTGAGAGTCAGATACATATCCACGGACTGGACAAACTGGAGCTCTCCCAGTTCACCATCATCGACTACAAATTTGTCACGGAGACGATGAACTTCAAATCCGCCGGACGTTTCCCGCGGCTCAGCCTTCGCTTCCAGCTGAGACGAAACCGAGGCGTCTACATCATCCAGTCCTACATGCCCTCCATCCTACTGGTTGCCATGTCCTGGGTGTCCTTCTGGATCAGCCAAACAGCAGTCCCGGCTCGGGTATCCCTGGGGATCACCACTGTGCTCACCATGACGACTCTGATGGTGAGCGCCCGCTCATCTCTCCCTCGAGCCTCAGCCATCAAAGCGCTGGATGTCTATTTCTGGATCTGCTACGTGTTTGTGTTCGCCGCGCTCATCGAGTATGCCTTTGCTCACTACAACGCCGACTACAGGCTCAAAGAGAAGGCCAAGAGCAAGGCCAACAAGATGAGCTCCGAGTCAGTCGTAAAGAATGGGAAACAGGCCATGGTGCTCTTCTCCCTGTCCGTGGCTGGAATGAACCAGGGCCTGATGGTGTCCAGCCGCCGTCCGCAGCGCTCCGGCGCCGAGACCGCCGAGGAGGAGGACGTGGAGCACAGGAGGGGGCGGGGGACCACAGCGTCAGAGGAGAGAGAAGAGGATAAGAAGTGCTGTAGTTGTTGTTCCAAGTGTTGTTGCGCTTGCAAGCCCCTCCAAGCTGATACCATAGATGTCTACGCCAGGGCCGTGTTCCCTGCCACCTTCGCCATCGTCAATGTGATCTACTGGGTGGCGTACACCATGTGA
>XM_010916034.2 PREDICTED: Elaeis guineensis potassium transporter 7 (LOC105039769), transcript variant X2, mRNA 
TTCTCCCTGCTTCGCCATCTATGGGCTTTCGAGAAAACTGTCCTAAAATCTCACGGTTTTTCTCAGCTTTCTCCATCAGGTCGATCTCTCCTCGATCTAAGCTTCGTCGGTTTGCGGCCGATTCCTTTCCACTTTCCATCGGAAGTTCCTTTGTTCTTCATCTATGTCGTAAAAAGTTCCAATTTTAGATCAATTCTGGTTGAGTTCTCCATGGCGGAAAGCTCGGGGAGGGCGAATGGGTGGTTGGCGAAGATGGATTCCTCCGAATCGAGGTGGGTCTCTCAAGGTGAGGAATATTCTAGCGAGGAAGAGGAAGAAGAGGAAGAGTTGGTTCGCCGGGCTGTTTTCGAGTCGGAGGAAGAGGACAGCGGGACCCGGAGGTTGATTAGGACCGCCCCCCGGCTCGATTCCTTCGATGTCGAGGCGCTCGACGTCCCCGGAGTTCAGAGGAATGAGGTCGAGGAACTTGACTTGCGCAAGAACTTCATACTTGCTCTTCAGACTCTTGGTATTGTGTTTGGGGATGTGGGAACGAGTCCATTGTATACTTTTGATGTTATGCTTCATCAATCACCAGTTCGTGTGAAGGAGGATGTCATCGGAGCGCTGTCTTTAGTTCTATATACTTTGATTCTGATACCGCTGGTGAAGTATGTGTTGGTGGTCATTTGGGGCAATGACGATGGTGAAGGTGGCACATTTGCTTTGTATTCATTGATATGTAGACATGCAAAGGTAAGTCTTCTACCAAACCAATTGCGTTCTGATACCCACATATCAAGTTTCCGCCTCAAGGTTCCATCACCGGAGCTAGAGAGGTCTCTAAAAGTTAAGGAGCATCTTGAGTCTTCATTGATGCTGAAGAAACTGCTTCTTATTTTGGTGCTTTTTGGCACTTCCATGGTCATAGCGGATGGAGTTGTCACCCCAGCAATGTCAGTATTGTCAGCTGTGGGTGGTCTGAAGGTTGGAATAGCTAGCTTTGAAAAAGATGAAGCGGTGATGATTTCAGTTGCATTTCTTGTAATCTTGTTCAGTGTACAGAAGTATGGAACCAGCAAAGTGGGGCTTGCAGTTGGCCCTGCTTTACTTGTATGGCTTTGCTCCCTAGGGGGCATTGGAGTTTACAACCTTATAAAATATGGTGTAACAGTTTTGAGGGCATTCAATCCTGTCCACATCTATTATTATTTTGAGAGGAATTTAACTCAGGCTTGGTTATCTCTTGGTGGTTGTCTTCTGTGTGCAACAGGTTCTGAGGCAATGTTTGCAGATCTTTGCTATTTCTCTGTAAGATCTGTTCAGCTAACTTTTGTGTTTTTGGTTCTGCCCTGCCTTCTGTTGGGATACCTTGGCCAAGCTGCTTTCCTCATGGAAAATGTAACTACATCTGAGCAGGTCTTCTTTTCGTCTATCCCAAGCACTGCAGAGCTTGGAATAATGATGATGACAACAATTCTAGTAACCATCATTATGCTTCTAATATGGCAGATTAACATTTTCATCGTGCTTTTCTTTGTCATATTCTTTTTGGGGGTGGAATTAGTTTTCTTCACTTCTGTTTTGGGTAGTGTGGAGGCTGGAAGCTGGGTTTTATTGATTTTTGCAGCAATATTGTTTATGATAATGTACATATGGAATTATGGGAGCAAGCTAAAGTATGAATCTGAAGTTAAACAGAAGCTTTCAATGAATCTGATGATGGAGTTGGGCTGCAACCTTGGGACCATTAGAGCCCCTGGTGTTGGCTTAGTTTACAATGAGTTAGTGAAAGGAATTCCAGCAATATTTGGACACTTTCTGACCACCCTTCCAGCAATCCACTCTATGATCATATTAGTGTGCATAAAATATGTGCCGGTTCCTGTAGTTCCTCAGAGTGAAAGGTTTCTTTTCCGGCGTGTCTGCCCAAAGAGCTATCACATGTTCCGTTGCATTGCTAGGTACGGCTACAAGGATGTAAGGAAAGAGCAGCACCAAATATTTGAACAGCTACTTCTTGAGAGTCTTGAAAAGTTCATACATCGAGAAGCCCAAGAACGCTTATTAGAGAGTGATGGAGATAGTGATTCAGATGCGGAAGAAGCGGCATCACGTTCAAGAATTCTTATAGCACCAAATGGCAGTATGTATTCCTTTGATGTCCCTCTCTTGGCTGCTTACAACAGTACTGAGAAGCCAAGCCCGGAAGCAAGCACTTCATCTCATGAGGCTCGAGATGAAGCCATGCCAGATGCTAGGCAGAGTCTTGAGCAGGAGCTTTCATTCATAAACAAGGCTAAAGAGTCAGGAGTTGTCTACCTCCTTGGCCATGGTGATATTAGGGCCCGAAAGGACTCTTGGTTTTTCAAGAAACTGGTCATAAATTACTTCTATGCTTTTTTGAAAAAGAACTGCAGGAGAGCGATAACAACATTGACTGTTCCCCACACAAATTTAATGCAAGTTGGCATGACTTACATGGTTTAG
>XM_035180460.2 PREDICTED: Hippoglossus stenolepis sperm associated antigen 9a (spag9a), transcript variant X14, mRNA 
CCAGGCGCCTGTGAACGCAGCATTTGACGAGGAAGAGGAGGAAATCCACGTAGCTCGTCTCGCGTCGCGGGGTCCGGTCGTGTTGTGTCCTCGATGTGTCGGCCCGTGTAAAGAAACGCTGCTTTTCTACTCGGCGGATAAAGGCGTCCATAGTGGCGGGGTGACGCGGGGCTGCCCACACCGGTGCTGTTTGCTGAAAGCGGGGGAGAGGACAGCGGGGAAAATGGAGCTGGAAGACGGAGTCGTGTACCAGGACGACCCGGGGACGTCCGCGATGATGTCGGAGCGGGTGTCGGGCCTGGCCAACTCCATCTACCGCGAGTTCGAGCGGCTCATCGGGAAGTACGACGAGGACGTGGTGAAGGAGCTGATGCCGCTGGTGGTGGCCGTGCTGGAGAACCTGGACTCGGTGTTCGCGGAGAACCAGGAGCACGAAGTGGAGCTGGAGCTGCTGAAGGAGGACAACGAGCAGCTCATCACCCAGTACGAGCGGGAGAAGGCGCTGAGGAAGCACGCGGAGGAGAAGTTCATTGAGTTTGAGGACACTCACGAACAGGAGAAGAAGGACCTGCAGAACCATGTGGACAGAATGGAATCGCACTCCCGACAACTGGAGCTCAAGATCAAGAACTATGCAGACCAGATCGGCAGGTTGGAAGAACGAGAGCTGGAGATCAAGAAGGAATACAACTCCCTCTATCAGAGACACTCAGAGATGATCCATAATTATATGGAGCATGTAGAGAGGATCAAAATGCAGCAGATTAACGAGACTTTGGAATCGAGCGCGGTCGGCCGAGTCAGGAGAGAACGGCCTCTTTCTTTGGGGATTTTCCCCTCGCCTGGTGGGGCATCTCTACTCATCCCAGACCCGCAGGCCAAAGCGGAGACGCCGGGCACAGACCGCTGGAGGTTCACTGACTCAACACAACCACGGTCCAACACTAGCCTCAAGCAGTTGGACTATGTCGACCCCCCAAGGGACAGGGAGGGTAAGAGTGCGCAGGACTCTACTTGGGGAAATTCACTGGCAGACGACTGCAAGGATGAGCTGTCGGACTTCACCGGCTCCAAGTCGGCCACACCAATGTCCACGACCGCCTCTGACATGGAGAGGGAAAATGGGAACAGTAAGAGCACTGAGGTGCAGGCGGCTCCAGGGACCAGATCCATATCAGTGGGTTTGCCTGAAAACAAAGACAGCTCAGACGTGCAGGACATCATTGAGTCCACCCCTGAACTGGACATGGATCTCGCTGGATACAAGCTCTGCAGTACTCCTACCAAAGGCATTGAGAACATGGCCTTCGACCGCAATACAGACTCTCTGTTTGAGGAGCTGTCATCTGCGGGCACTGGGATAATAGGGGATGTGGATGAAGGGGCAGATCTGCTGGTGGAGTACTCTGACCTTAGTTTGATTGGTATGGGCCGGGAAGTTGAAAATCTCATTCAGGAGAATTCACAACTGCTTGAGACAAAGAACGCCCTGAACGTGGTGAATAAAGACTTAATATTGAAGGTGGACGAGTTGACCTGTGAGAAGGAGATGTTGCAGGGAGAAATGGATGCTGTGATGCAGGCCAAGGCCAAGCTGGAGGACAAGAACAAAGACCTGGAGGAGGAACTCAAAAAAGTGCGAGTGGAGATGGAGGAAGTGAAACACAAAACTAAAGATGAAGAAGATAATGATGTACCTACAGCCCAGAGGAAGCGTTTCACCAGAGTGGAAATGGCCCGAGTGCTGATGGAGAGAAACCAGTACAAGGAGAGACTGATGGAGCTACAGGAAGCGGTGCGGTGGACAGAGATGATCAGGGCCTCGAGGGAAAATCCAACACTAACAGAAAAGAAGAAGTCCAGCATCTGGCAGTTCATTGGCTTCAGCAGACTGTTTAGCTCCTCCTCCAGTCCCCCCGCTGGGAAGAAGGTGGAGTCCCAGTCCAACGTGAAGTACAACGCCCCGGGCGGCATGGTGAAGAGGAGCAGCACCTTCTCCCAGTTCCCCACAGAGAAGTCCAAGACCTTTGACTTCCTCAATGAAGAAAAGGACCAGTGTAGTTCACCATCGCGTAAAGAGCAGAAACGAGCCCAGTACAGACAGGTCAAGGCCCACATGCAGAAGGAGGATGGACGAGTCACTGCGCACGGCTGGAGCCTGCCCAGCAAATACAAGGTGGCAAATGGTGGACAGGTGGAGAACAAAGTGAACTTACCTGTACCGGTGTACTTGAGACCTCTCGATCAGAAAGATGCTTCTATGAAGCTGTGGTGTGCTGCAGGGGTCAACCTGTGTGGGGGGGGGATATCAGAGCTCACGAAGCAGACGAAGGGTTCTCAGAGTAGCCTGGACCAGCTGGAGCAAGAGAATAAGGATCAGGAGAAAGTGGAGCAGGAGAAGGAGCTGATACTTCAGGATGAGACGTCCAGTCGGGTGTGGGTGTGTACCAGCACCCACTCCTCCACCAAGGTTATGGTGCTGGATGCAAGTCAGCCATCTGACCTACTTGACAGCTTCTATGCCTGCAACACCCACGTCGTCTGCATTGCCAGTGTGCCTGGGGTGTTGGAGTCAGATTTTTCGACAGGTGAGGAGGTACCACAGGACGTGGACGCTAACCAGGGTGATGTGGTGTCACTGGCCGGCAGTGTGGCCAGTGTGGGGTCTACAGGCAGCGATGGAGCCATGGCAGCAGAAGGGACCACCGCAATCCCACAGATAGCCAGCTCAGTTGAGCTGTCCAGAGAGTCGAGTCCAGCAGAAGATGGGATTCCTCCGGCGGAGGAGGCAACAGAAGCAACAGAAGCTAACGCTGGTGTGGGTGAAGAGGGAGAGGAGGACCAGGGGGCAGAACACAACCAGCCGGGAATCTACACAGAGCATGTGTTCACCGACCCGCTGGGGGTGGGACCCACTGACTCCTCGCCTACTGACGCACAGAGGGGCACCGGGCAGGATGGAGTGGATTCCTTGCCTCCAGACTCGGACCCGTCGGAGGGGGATGTCCTGAGGATGAGCAGCGCCCTCCCCACCATGTGGCTCGGAGCTCAGAATGGATGTCTGTATGTCCACTCGTCCGTGGCACGATGGAGGAAGTGTCTGCACGCCATCAAGCTCAAAGACTCCATCCTCAGCATAGTGCATGTTAAAGGGAGAGTCCTGGTAGCGTTGGCTGATGGGACATTAGCAATTTTCCACAGAAGCATTACAGACGGACAGTGGGACCTAACCAACTATCACCTGTTGGATCTGGGCCGGCCCCACCACTCTATCCGCTGTATGACCGTAGTCCATGACAAGGTGTGGTGCGGCTACAGGAACAAGATCTACATTGTCCAGCCCAAGGCCATGAGGATAGAGCAGAAGTCCTTTGACGCTCATCCTCGCAAGGAGAGCCAGGTGCGGCAGCTGGCCTGGGTTGGAGACGGTATCTGGGTGTCCATCCGACTGGATTCCACCCTTCGCTTGTTCCACGCCCACACCTACCAGCACCTCCAGGATGTGGACATCGAGCCCTACGTCAGCAAAATGCTTGGTACTGGTAAACTGGGCTTCTCCTTCGTGAGAATCACAGCTCTTGTGGTGTCCTGCAGTCGTCTGTGGGTGGGGACAGGAAACGGTGTCATCATCTCCATCCCGTTGTCTGAAGCCAACAAGACAACGGGAATAGTGCCAAATCGGCCCGGCAGCGCTGTACGGGTTTACGGTGATGACGGTTTAGACTGTGCCATGCCAGGCAGCTTTGTGCCATACTGCTCCATGGCCCACGCCCAGCTGTGTTTCCATGGACACCGAGATGCTGTCAAGTTTTTTGTCACCGTGCCAGGTCAGGCAATGCCTCCTCCATGTAGCGCAGATTCAGGCTCCGATGAGCCCCCGTCTGAATCCTCTGACACAGCGACCTCCGAGCCCAAAACACACCTGGTCATGAGTGGAGGTGAAGGCTACATCGACTTCAGAATGGGTGATGAAGGTGGCGAGTCGGACGGTTTATCAGAGCCGACAGCCGACCAGCAGTCGGCACCAACCAAGGCTGAGCAGAGCCACCTCATCGTCTGGCAGGTCACAACTTCTAATGATTGAAAAAAAAACAACTGACATACTGTTGTCAGGGCCTCCCTCCAATCCTTGCATGTCCTCCTCTAAGTTTTACATTTGATATTACTGATTGTTCTTAATGCCTGAGTAGTTGACTACTTTGTAAAAAAACAAAAACAATTATTTTTAGTCCATGTTTTGTACAGTTTATTGTTTATGAATTTGAAAAAAGTGAGGATTATGTCGGTTTAAGGAAAACGTCCACGGTCCGAGTGTTTCCTTCTGCCGGGGCGCATGTTGGAAAAGCAGGTGCACGCAGGAAAAAGTTCAAGTCAGTTCAGGAGAAGGTGCGAGATACTGTAAGTGTGATCGTTTGTTTCTAAAACGTCAAAAACGGGTTTAGATGTGAAGGACAAAAAGGAAAAAGTACTTGAAGGATTCAGGAGAAGTCGTTGAAAAGGGACCAGGGAGTTTTCATTTGAATGAAATATATTTTATGTTACACACATAAGACTTTTACATTTGTAAACCACATGTGAGAATGGAGTCATGAATTCTATCCTGTGTTAAGCATTTTTTTTTATTATCCATACTATTCGGGCTGGGTGTGTAAATGTGACACCTACAGGTCAGAATACATTCATGCAGACAGGCTGATACTGGTCGGTCTGCTAAGTAGAAAACCAGTTTTCACAAACAAGCAATCCACAAACAAACATTTCCTCTAAACTAAATGTACTTTTATTGAGTAAAAGCTGTACGATAAAACATTATCTTAGAGGTCTTATTTAATTAAAGGAAACCGAGCCGCAGGATTATGTTTAGGAATGTTAATCATATCAAAGCAGTTAGGGTACTGTAAGGTTTCCTGTGAATAGAGGACCCAGCTTACTGTACTGTAGGTTAGCATTAACCGGAATGAAGGGAATCCTGTATCCTTGTGTGTGTGTGTGTGTGTTCGCCTTCTCGGCCATTTTACGGCTCAACCCTCATCTATTTGCGCGAGAAGAATCCACCCGTGCTTCCTGTTTGCTTCCGCTCATCGGCACTTTAAGATGTTAGATGTTATTCGCGTGACATTTGGAAGAACACTCGTGGTGATGCACACTGCACTGCCATGTGCTACATTTATTTATTTATTCGGTTTAAAATAACAGGAACAATGCTCATTAATAAACATTTTTGTAAAAGGGAACATAACGGACAAATCTTTATAGGGAGGTGACACCCCAGTAACCAAAGGACGAAAGAAGATGCACCGTGAAACTATTTGTTTTTTGGTTTTTTTCCATCTTTTAAACGTCTCATGAGTAATAATTTGAAGGTTTTAAATGTATGTTTTGTTGAAAAATAGGCTTGAATAAGGGAATTGGACTAAAAGTAACATTTCCGTGTGGCACCTTCTAACGGACATGCACACAGCACTAAAGAGTGTCTCTCCTGATTGCCTCATCATTCCTTGTTTTGTTGTTAAAAATACATTTTGAGGCCTGGAAGGCAAATTTTGTCATTATTTTTCTGTTGCTTTGGGCATCGTGCGTGTTTTGTATTCATCTGTGAGACACTTTCATTAAGTGAAGACTATTTTGTTGAAATAACCGAAGGATTCCAATATTGAGCAAGTGTTTTAATTTGTTTTTATATCTGAAAACTTGGACCACTGTTGGTCTTCAGTCTATTTCAAAATATTAACTTTATATTGTGCTTTATTTTTCTGCCATTCCAGTATTTATTTCCTTTGTTATGGAGCCTATCTGGGTTCAGAATGTAACTTTCTACATAAGTATAATAGGAGGCTATTGTAAACGGAATAGTCCAATGCGTTTACACGATTGTTAATAATGGCTAAATAAAAGAAATCAATGTTA
>XM_041364600.1 Suillus fuscotomentosus uncharacterized protein (F5891DRAFT_1130999), partial mRNA 
ATGCACCCCTCAGAATTAGATGCTAGGATTAGAGTGCTCCCACCCTGCTTTGAGGTTTGCCATTTCCAGAATGGTTGGACTGTGCTCTCTCAGATCTCTGGTAGAGAGAGGAAAGAGATGGTGTGCATCTTATTGGGATGCTTAGTGGGAAAAGTTCCTCGACAGGTCATACTTGCATACCGCTCCTTACTGGACTTCATCTATTTAGCTCAGTACCCCACTCACGATGATCAAACCCTAAGCTATCTTCAAGATGCTTTGGACATGTTTCACAAGCATAAGGGGGTGCTTATTGAACTGGGCGTAAGGGACCACTTCAATATTCCAAAAATACACAGCCTCACCCACTATATCAACTCTATACGCCTATTTGGTGCCATGGACAATTACAATACAGAGGCATTTGAGCGCCTTCACATTGATTTTGCTAAGGACGCCTGGAGGGCAACTAATAAAAGGGAGGAGTGCCCTCAAATGACTTCATTGGAGATGACTCAGCTTCCATTTGACAAGCTTGACATATACCATGGTTTCAAGTTTGTTTTGGAGGAACTAGGGGAGGATGAAGTTGACAGTAGTAGACAAACTGACTGGATAAAGGCCTGTCCAAAGACTCATGGTTCCCATGGTCAGAAACACTTTGATACAGTTGTGGCCATGAGGACGGATGAGTGCCAAGCTACTGGGGTTCAAGGCAAAATCGGGCGACTTAGGTTATTGTTCAAGCTACCCCAACAATGGTATACTATGCTCAAAAATGTGCCAGAGAAAGAACACTGTATGTATGAGGTGAAGAAGATGCCACTAAGGAGCGGTAATGTAGTACCAGCAGATATCATTCCTATCAGCACCATATGTCAGACTTGTCAGCTAATTCCTTGTTTTGGTACTGCTGATGTTTCCAGAGAATGGAGATCAGAAAATGTACTGGATCTCTGTGACAGGTTCTTATTAAATAATTGGTCCACCAAGTATGCATACAAAACACTGTATTAG
>XM_041096011.1 PREDICTED: Gossypium hirsutum uncharacterized LOC107900440 (LOC107900440), transcript variant X1, mRNA 
ATCTTCAATTGTCATCAGTTCCGTCACACCCCAATTCTCACAGTCAAACACTTGGAACCTTCTTTCATACCCCACTGCCATTTTCCCTTTCATTTTTAACCGTAATTTTTCCATTTCCTCCTCACTCAACTTTCAATCCTTCTTCTTTGTACATAAAAGAATTCGCAAAATCAAAAAAAAAAAATTGAAGAAAGAAAGGAGATGGGTTTTTCAAAGGAAGAGAAATCGAGAAGAATTTGGAGGGTATTGAAAACAGTGTTTTTCTTGATAACAATGGCGATTTCGTTCCTCGTATTTTCTGCGCCGGTTTTTCTCGTTCTAGCCGATGCTCTTTTGCCTTCCGCTTTGCTCTCTGCTTCGCTTTCTCCTTCTTATTTATCACTCCAATCCCTTTCTTCCCATTTCGATAACTATGATTTTAGATCTTCTCTCATAGATATTCCCCTCATATCCATCATCAGATCAGCTGTTATAATCGTTGTTTACAGTTTTTGTGATGGGCCAAAACTTTCGAGGGGACCATACCTGGGAATCACAATGATTTGTTCGATTTCATCGTTGGTTTTTGTTTCGATAAAAGCTTCGTTTGTGTTCGGTTCGAGAATTCCTAAAGAAGGGACATATGTTACAGCCATGGAAACCGCTCTTTTCATTTCTTCATTGGCTTTGGCAATTGCACACATGACTGTGGCTTATAGGACAAGTTGCAGAGAAAGAAGAAAGCTCCTTGTCTACAAAATTGACATTGAAGCTATTTCAGCTTGCAAGAATGGGTTTCCAAGGTATCATAAGATTCTCCAACAAGAAAGGGTGAAGTAAATGCAATATTACCAACACTGAACGATTTTCCTCTCCAAGAAACCTACCCTGTTCTTGGCTCATCACATTCTTCTTTCTCACATTTCAGATTTAACCAAAACCAATCAGTCACTTGAAAATCAAAGTGTTAACAAGCAGATCACAGCCAGCAGATACAGACATACATACATACATACATACATACATACATACATATATATATTATATTTCGAGGAAATGATCGAACATGCAATGATTTTGAGTGTACAGTTTGTATTACATCTGTAAATATTAATTTAAAAACAAAGGAAGAAATGGGCCAAAGGTCTTTTCCATACCCCAATTTTTTTTTGAAATATTTGAAAAATATTTATTTTAGTTATTATTTTGGCCGAACGATTTAGGTTAATTATTTTTGGTTCGAATAAAAATATTAAGGTTAAAATATGTTTTAACTCTATATGCTCTATTTTTAAGAATTTCGTCTATCTGTCCCTTGCCGATTTCAATTTAATTAGTCTAACCAACTGATTTGATCCAGTTCAAGTTTTTATGTTTTTTTTTATAATCTTTATAAGATTATATTAATTTTAGTACTTTTTATGATTTTTATAGAATTTTAATATGTTTTTTAATTTCAAATATTTTAAATTTGTTTTATTAATTTTATAAAAATATTTTAGAATTTATTAGAATTTTATATTTTTATATTTTTTATATCAATTTTCATAATTTTTATTTTTTATATTTAATATTTTTTAATTATTTTTATTGGAAAAATATTAGATTAAACTAGAAGCTGCCATCTGTCAACATCTAATTAGTCCGCCAATTTATTTTGACAGTCAACATGGTTAATGATAAAAATTGTTAATGTAGGAGCTTAATTGATTATTTTAGTTAATGATAGAGGCTAAATTGAATATGAATTTAATACATGGGCTTAATTTATCTTTTTTGCAGCTTTTTAAATATATAAGTCACATAATTTAAAAACAACAAAGGTTGTGACATAAATCCTATATATAAACATAGTAACTTGAATTTGACTATTTTTTTTGGACTAAAATAATATAAACCTAGACTTGCTTAAGATATTAGAGTATAGGAGGAAGGGTTGTATGAAACTGTGATTCCATGTCATTCTTTATCTCTTTCCATTCTCTTATTATAAAGAGATAAAAATGATATGAAATTACAGTTTCATACAATCCCACCAAATTAAAGAAAAAAAATGAATAAATAAATAAAATTCATTTTTTTATGATTCGATAAAGGAATCAAAATTCAAAGTTTTTGTGTGTTTGTTCTTCAGCTTTGTGCAATGAGAAATTTGGTGAATTTCATTTAAATAAATAGAATTTAGATGCCAACATTTGGGGAATTTTTACAAGTTGGAAATAAGGATCAAAACAATGCCCACTGCATCTCTATTACCTGAACAACATTTTTATCCCTCACTTTCAAATCCAGGTAAAATAGTGATCGTAACCCCAACTTTGGAAATGATTACACCTCCACTCCATCTTCTTTACAATGGCTAAGATGCCCAGATTTAACGCCGACGCTGCAGATTGATCGGAAATCGCTTTTGGGTTCGGGTTGTGGGGAAGAAAACTAGCTTATCTTCTTCAGCAGGTACCCAACTGTATCAGAAATATAAACTCAGAATGCAACAAGCTTCTATTTTTTAACTCAAGTTCTAAATAAAACTCGGTTTGATTACCTGAACTGAGTTACAAGGTGGTGTAAGAAGACTGAGATTTCTACTCTAGCAAGCTCATATCCAGGGCACAATCGAGGCCCTCCTCCGAACGGCGTGTAAAAATTCCCGGAACAGCTCGTCCCCAAGTTATTATTCTGTTCAATTTCATCCAACACTTCTTTGTAACTTTCGTCGTGTACCATGAACTATAATGTTGCGTTACATCTTATACTTAAATTTACCTTCCATCTCCATGGATTGAAAGTGCGAGCATCTTTAAAGTGATCATGATCAAGATGTACAGCACGAAACGATGCAAAAACCTTCCAACCCTTTGGAATTGTGTAACCTGGTCGAGTTGAGTTACCAGTAAGCACACAAAAAATGAGTCTAACAGGTTTCGGATTCGAATTCTAACA
>XR_004848542.1 PREDICTED: Amphiprion ocellaris uncharacterized LOC111577915 (LOC111577915), ncRNA 
ATGGCTGCACAGTAAATGTGTTTGATGCTGCCAGCTGAGCTGCAGATGGATGTTCATTTTTGTTTCTGTCTTGTGTTTCAGTAACAGCTGTAGCTATTGCAGCAGGCGCTGGTGGAGCAGTGGTCTCTGCTCCGTTTGTTCTGGGAGCCATAGGTTTCACCTCAGCTGGAATAGCAGCAGGTTCCTACGCTGCAGGCATGATGTCCACTGCTGCTATTGCTAATGGAGGAGGAGTTGCAGCAGGGAGTCTGGTGGCTGTTTTGCAGTCAGCAGGAATGGCTGGTCTGTCTGGGACTGCTACTGCAGCCGTGGCCAGTGCTGGAGGAACGGTGGGATTTTTGGCTACTCTCATCTGAGATGAAGCTGGAAATCATGAAGGAATAATACATACGAGACAATGTATTTGCTTTTGTAAATTAGAAACAAATGCCAACAATATCAGTGAAGTCGAACTTTATCTGTCAGTAAAGTAAAACTTGACTGAAATCTGTGGGCAAAAAATGTTTCTGTGTTTTTACAAAGCACATTTATATTGTCAAATTGTCCAAAATAAAGAATAACAATGAAGGAA
>XM_034416225.1 PREDICTED: Pantherophis guttatus spondin 2 (SPON2), mRNA 
AAAACCAACCACTGCCCCGCTTGGACTAAAGGGACTTTTGCAGGCATAAATAGCAAGATTTCCTCTCTTCCCCTTGCAGATTTTCCAGCTGGGAGACAAAGCAAGTTCTTCTCCTAACAACCTCACAGCCACCGGAACACCCGAAATGGGAAACTCACTACCTGTGTCTGGTTCTGACAAGACAATCGCAGCACTGCTGGTTGCACTCTTGAGTTGCGTGGATTGTGTTCCCCTCGAGGGAGAGACCCTGTGTGGTGCAGAGGAACCAACCACCTACAGCATTGTCTTCACGGGGAAATGGAGCCAAACAGCTTTTCCAAAGCAGTACCCGCTCTACAGACCCCCAGCGCAGTGGTCCTCCCTCCTAGGTGTGGCCCACAACTCGGACTACGTCATGTGGAAGGCCAGCGGCTATGCCAGCAACGGCATGCGTGAGTTGGTGGAGAAGGGGGAGCCCTGGATGCTGATGAAGGAAATTGAAGCAGCTGGAGAGAAAATGCAAAGCGTTTATGGAATCTTCTCCGCTTCTCCTGTGGTTACCGGAACAGGACAGACCTCAACTCTCTTTGAAGTTGACCCGGGTCATCCCTTAGTATCCCTTGCAGTACGAATCGTGCCCAGCCCTGACTGGTTTGTGGGGATTGAGAATTTTAATTTGTGCGACAAAAATGGCTGGAAGCGCCACGTCTCCATAGATTTATTTCCATATGATGCTGGAACGGATAGCGGCTTTACGTTTTCCGCACCCAACTTCGCCACGATCCCTCGCGATACGATCACGGAAATCACCTGTTCCTCCCCAAGTCATCCTGCCAACTCATTTTATTACCCCAAGCTTAAGACTCTGCCGCCGATTGCCCGGGTGACCATGGCAAAACTCAAAAGAAAGAAATTGGGCTTTCTCATCTCTCAACCAAACGTCACAACCACCCATAACGAAGTGGAGGATTCAGTCTCGGAAACACCTTTGGATTGTGAGACCTCTCTGTGGTCTTCGTGGGGCCTTTGCCGTGGCACCTGTGGAAATTTAGGAACGAAAAGACGGACTCGGTACATACTACTTCAGCCAGCCAATCATGGGACCCCCTGTCCAGATCTGAGCGAAGAAACACACTGCGAACCAGATAATTGTGTCTGAGATAATTTCTTTGGACCATCGTTTACCTCGTGTAATTTGGGGGATATTTAAGGTATCTCTGCGTTGATATTTTTTATAGCTCATGAGCTGTCCATCTATCCATCTATCCATCCATCCATCCACCAATCCAATAGATAGATCTACTTAAGGGATCTGAGCTTTCTACACGTTTATTGTGAACTCCTACAGTGCCACCTAGCGGTCAGAAATAGTAGTAATAGTAGTAAACTCGAATAGTAAACTTAGTGTTACCAACATCTGCACGGAGAAAAGAGGCAGGCGAGAATCTTTTCATTTCTGCTACTTCTGGAATGTATTTAATGCATCTGAGGAATAATGAGCTAGTTTCTACTGACTTACGAAATGCTGGAGAATTAAATGTATAAGTTTTGAGGGAGAATCAACTTGAAGGAAAAAGAAAACCAAGTTTTTCTCAAGAGTACGAGAAAAAAGCCGAGATTTATTTGGGTGTGTGTGTGTAATTCTAAAAATTTTAAGCTGTTGTTTGAAAACTCTTGGGCTGGCTATGGTGAAAGTTGGCAAGTTTTATCTTTTATGCAGATTTCTATGAATTTTGTCCTGTTCTGTAAAGAGCTAAGAAGGCCTAAAAGGAGAACTGTAATAATAATTTGCTAAAAAGTTTGTGTACCAAGGCGTAGAGTATATACGTCCTTTACTTACAGTGTTCTATATTTCTGGATTTTTTTTTTCTAATTAAAAACAAACATTTTCCCTCCGGTTAAATAATA
>XM_047217565.1 PREDICTED: Lolium rigidum uncharacterized LOC124682972 (LOC124682972), mRNA 
CACACGCCTAAGTGCCATTGATGGCCACGAAAGCCTGGAGCGGCTCCACCCGCTTCAGATCTCCGGCCAGCGCCGTCTGGTTCCTAGCGGCCGCCATCCTCATCCTCATCTTCCTCCTTCAGCGCCGCCCGCCCATGGACCCTTACGCTACCCCAACCCCTCGGACCTCCGTGTCGTCCCGGCGCGCCGAGCTGTACGGCAGGATGGCGCGGGATCTCGACGAGCGCGGCGCCGCGTTCTTGGAGGGCGGCGAGACGTCGCAGTCGCTCACGCTCTCGGACCTCTTCGACGTCAGAGACAGCGCCGTCGTGCCCAGACTCAAGGCCGCCGACCCACCGGTGCGCGCGAACGTGCTCTACCTGGACCCAGAGTTCGCGGCCGTCATATCGAAGGCTGTGAAGGAAGTATTTCTTCCTTATTTTGACAAAGTTATCTGGTTCCAAAATTCCAGTATGTATCACTTCAGTATGTTTCATGCCTCCCATCACCTGGAGCCAATCTTAGCATCCAAGGCCGAGATTGAAGCCGAAGTCGATGCTGTAAAAAGAGTTACTAAGGCTATTTGTCCCATTCAAATTGTCTTGGATCAAGTGGTCTTGACATCAACTGGAGTTCTTCTTGGCCTGTGGCAGGTTGAATCTGGTACTGATCCTGCCGACATCCGCTCAAAATTGAGAGAGGCTCTCCCTCGAGCACCTCAAAAGCAATTGTATGACCCTGTTCTGCTTCACACCTCCTTTGCACGAATTTTGGGACCTCCTAAGCTTCCACAAGAGGAGAATACGACATCTTTTGATCACATCAAATTCTTCCATGACCTCGTTGCACAAGTTAACGGGAAGATCCGTGGGTTCCAGGCGAAGGTAGCGGAGCTGTGGTATGTAGAAGAGTACGACGTCCTCGCACTAGCGCTGAATGGAAAGATGAAAGTTCGGAGGCTCAACCTTGGCTGCAATGAAGAATAGAGCAACTGACGGAGGACAAAGAGAACACCACGGGGATATTAATCCATCGCGTCCAAGCATTATTATGCAACGCTTGGAATGCTTTCGTGATTCGAACATCACATCCATGGCAACCTTTTGTTCTGCGAAGATTGGGACCAGGCAGCGCCGAGGAAATAGCAGCTGGGTGCCCCCAATAGAGAAGTAGAGATCGAATGTAATTGCTTTCACACCACAGTATTTGAGTACTGGTGATTCGTGAATATGTGGATGAAAATCAAACCTGTATTTGTAACACCTCTCCTGTTACTCAGAAAAACTTCCAACTTA
>XM_017403287.1 PREDICTED: Daucus carota subsp. sativus GBF-interacting protein 1-like (LOC108227900), transcript variant X2, mRNA 
AATAACAGTGAATGGGCTGGTCTAGTGAGCATCAGGAGGTAATTTGGTTTTCAAAACCCTTGTTTGCGTCCCATAACTCTTTTTGAGCCGTTCTCAACTATTATATATAAACACACACAATCACTCAAAACCCATTTGAAATCGAATGCAACTCGCTCTTCTATTGGCTCTGTTAAACCCTGTTTTGATATTGGATTACTATCCCAACTGGGTTGTTTTCAAGTATCTCAAAGATGGTGTCTTCTTCCTCAACTTCAAGAATTGATGGGGGCCCTCAAATACTGTCTGCTGGCGTGAGAAAAACAATCCAATCCATAAAAGAAATCGTGGGTAATCACTCTGATGCTGAAATTTATTCCACCCTTAAAGAGACTAATATGGATCCTAATGAAACTGCCCAGAAATTGCTCAATCAAGGTCCCCTTTTTTTTCTTGATCCATTTCACGAGGTCAAAAGAAAAAGAGACAAGAGGAAAGAGGTTACAATGAACGTGGGGCATACTGCATCACAACAGAAAAAGCACAGTGAATCATTAAATCAAGGGAGCAAACACACTGCACATTCTGATCACAGTGTCAGTGGCAAAGGAATTATCCGGAATTCTTTGCCGGATGCAAAGGCTAGCAGAGAGTTCCGTGTTGTGAGGGACAATAGGACTAATCATAAGCCAAGCAGCAAGATAAAGCCTCCCTTGCAAAGCCAAATATCTTCAAATGAACTAGAAGTCCCGAAGTTTGCCAATAAGAGCTTGAACGTGACTTCTAATGAGCAGAAACAGACAGTTGTGCGTCATCTAACTAAATCTTCAAATGGAACGACTGAGACACAGCCTAGGCAGCCAAGGGTTGTTCAGATTAATAATAAGAAAGAATCATTGGAGGATAATCGATCCGCAGTTATAAAGCCTGTTACACAGATTCAAACTAAGAGCACAAATGATTCCCATCTATCTGCAACTTTATCTAACAACTCTGTGGCAGGGGTATACTCTTCATCTTCTGATCCTGTACATGTACCTTCTCCTGATTCCAGACCAGCTGCTAACATTGGAGCAATTAAGCGTGAAGTTGGGGCTGTTGGTGTACGTCGTCTGTCTACAGAAGTTTCTCCCAAAGGTTCATCACCACAATCTAATTCTTTTCCTAATACACATTTGGGACGTGATGGTCCGTCAAGAGATTCATATCGATCTTCTGCTTCCCTGTCTAAAAGCAGCCATCCTAGTCAAGCTCCTGTTAATGACTCGACTTTGAAGAATATTCCAGTCAATAGGCCATCTGTTAATAATCAGCAGGTTAACAGACAGCATCAATCTGGTGGTCATCAAAAAGTTTCTTCACATTCTAACAAGGAGTGGAAACCTAAATCAACCCAAAAACAAAGCACCGGTCCTGGAGTTATTGGAACACCATCAAAATCTGCTTCCCCTCCTGCTGATGCCTTAAAGAATTTGGAAACAGAATCAACTCAGTTGCCATCACATGTAGACATCTCGGACAATGAGAATGTAATTATAGCTCCACATATACGAGTCTCCGCAACTGACAGGTTTCGAGTGACTTTTGGCAGTGTGGGTACAGAGTTTGAACCTTCCAGAAACCCGGGGTTCGAAGCAGTAAAAGTTGCAGAGGAGCCTTTGATTGATCCTTCAGGAAGTGTATCAGTTGCTACTCCTGACTCTTCTGGTGATGAATCTTCTGGAAGTAAGCAAGAAGACTTGAGAGATGAAAATGTTCGCAATTCTGGTAGCAGTTCCCCTGCGTCTGCAGCAGTATCTGAACAGCAATTGACCAGTAGGATAGAATCATCAGGTCCTCAGGATATAGACAAGGGGGCAGAGGTTGAATTGGTGCGTAATAACAGTCAGTCTCACACTCCATCTCAGTCACAACCACACCAGGATCCTTCCCAGTTACCAATATTTTCTTCATATGATCCCCAGAGTATGTATGACATTCCGTATTTTCGATCATCAGTCGATGAAACTGCAAGGGTGCAAAGTCTGCAGTTTCCTCAGGAGGCTATAAGCTCACATACAGTAAATAACATCCCATCATCTACGGTAGCCATGGTGCAACAGCCGCAGTTGGCGCAGATGTACCCGCAAGTTCATCTTTCTCATTATGCTAATATGATGCCATATCGTCAATTCCTCTCTCCAGTTTATGTTCCACCAATGGCTGTGCCAGCAGGCTATACTAGTAACCCTTCCTATCCTCATCCATCAAGCGGCAACAGTTACTTGCTGATGCCCGGAGGTAGCTCCCATCTGCCTGGAAGTGGGGTCAAGTATGGAATCCAGCAGTTCAAACCAGTCCCCACCGGCAGTCCAACTGGGTTTGGCAACTTCACTAATCCAAATGGTTATCCTATCAATGCTCCTACTGTTAGTGCGACAGGACTTGAAGACTCGTCTAGGCTGAAGTACAAAGATGTGAATCTTTATGTTCCAAATCCACAGGCTGAGACCTCTGAGATATGGATGAATCCGAGGGACCTACCTACTATGCAATCAGGTTCATACTACAATATGACTGGACAAACACCTCATGCTGCATACTTGCCATCCCATACCAGTCACGCCTCGTTTAATGCAGCAGCACAATCTTCTCACATTCAATTTCCAGGCATGTACCATACTCCACAACCTGCTGGAATCCCCAGTCAGCATCATCCTGCTGTGGGCGGTAATGTTGGAGTTGGATTGGCTGCAGGCGGGCCAGCAGCCCAAGTTAATGCCTTTCAGCAACCTCAGCTGGGCCACATGAATTGGACAGGGAACTTCTGAAGGCCTTTCTAATCCTTGAGAATTTTATTAAAAGGGATTGGAGCTGATTATCTGTGGAAGTCCTCTCCTCTCTTTGCCCCTTTTCTCCTCAAAACAAAACTTAATCTACAAATCAATACATTGAGTTGTGTTCAGTCCTTGCTGGTTTATATCTGTGATTCAGGGGACGGTATGTCAACCTTTATATGGTTGTATGCAAGTTTATTAGGATTAGAGCAGGCTTTCGTTTATAAGTTCGGCCCTATGTTTTTATAGCCCGACTGAAAATATATCTCCAAATGGTTTAATTGTTTTGGAGGTTTATCAGGTCAGGGCAGGCTCTTGGTTTATAAGTCTGCCCTCATTTTTTCAGCAGTCTGTTTTTTCTGATAAATAATCTCAAAATATATCAGTCAGCCCAAATTGGGACATGTAGTTCTAGCATTTACATAACAATGCATTATTTTTTTTGTGTGAACCAAAGTGTCTGTGCAGGAATTCTGTAGTGTAGTATGACTTATGTTTTGAGATAAATGAATCATACTTTGTAATCCCAGTTTCTGAATTATTGGAAAAATAACACTTTTGATGACA
>XM_006679287.1 Batrachochytrium dendrobatidis JAM81 uncharacterized protein (BATDEDRAFT_11902), partial mRNA 
AGACATTTGACTGGAAAAACACATGTTGCCGGCAGTGATGGTGATAATCAGTTTGCTACTTACATCAAGGAGAGATGGGAAGCTGCTGGTCTTCCCATGACCCATATCGATTCGTACTATCCATTGCTCAACTACCCCATCTCTCGCTCGCTTACTTTATTGGAGCCATTTCGATACGATGCAGTGCTGAGAGAACCAGCTATTGCCGAGGACACTACAAGTGGGGATCCAGATGCTGTTCCTACCTTTCTAGGCTACTCTCCTTCTGGAAACGTCACTGCAGAGCTAGTGTATGCCAATTTTGGTGGTATAGAAGACTTTGCTATGCTAGCTAAAAACGGCATTGATGTCAAGGGGAAAATTGTTTTGGTCAGATATGGTGGTGCGTTTCGTGGTTTAAAGGTTCGAGCTGCTGAGCTCTCTGGAGCTGCTGCTGTTTTGATCTTTTCGGATCCTGCCCAGGATGGTTACAAAATGGGTGCTACGTATCCTGACGGACCGTGGAGACCACCTCATGGTGTACAAAGAGGTTCTATCCAGTATCCAACATTTTACCCTGGTGACCCACTTACGCCTTTTATTGCTGCGACAAAAGATGCTCCTCGTATTCCAATTGAGGAAGCACCCATTCCCAAGATTCCTGCAATTCCAATTAGCTACGCTGATGCTGCCCCTTTTTTGAAAGCTCTTGTCGGTCACGGAATTCTTGCCAGAACCTTATCTCTCAATTGGCAAGGAGGTCTTGACATGGATTATTGGACAGGACCTGCTGCAAAAGTAAATATGTATGTCAACAATGATTTCAAAATCAAACCTATTTGGAATGTTTTGTCCATCATTGAGGGTAAACACGAACCCGACCAAGCCATTATTCTTGGCGGACATAGTGATGCATGGGTATATGGCTCAGTTGATCCATCTTCATCCAATTCCGTGATTGTTGAAACTGGTGTTGCACTTGGTAAAATGTACAAGTCTGGCTGGCGACCCGATCGCACCATCATTCTTGCAAGCTGGGATGGTGAAGAATACGGTTTATTAGGCTCTACCGAATGGGTTGAGGATCATGTCGAAGTACTAAATAGAACTGCGATCGCGTACATTAATCTTGATATGGGTGCTTATGGACCACACTTTCATGCTGCTGCTAGTCCTTCTCTCGCTAATCTTATCCGTGATGTAACCAAGGGCGTAAAAGATCCCAACTCGGGAAAAATGGATACACCTCAAGGTCGTGTTCCACGTATTAGCCCACTTGGATTTGGATCTGATTATGTTGCATTTTTGCAATTTGTTGGTGTTGCTGCTATGGATATTAAATTTGAAGGCGACTATGGTGTGTATCACTCCAACTATGATAGTTTTCATTGGATGGAAAAGTTTGGAGATCCCACTTGGGAATATCACAAGACACTTGCTAGTATTGTTGGTCGCATTGTTCTTTCGCTTGCACACGATGAAATTCTTCCATTTGACTATGCCCCTTATAGTTATGAGTTGACTCGATATGCTACAGATGTAAGCACTGCGCTCCAGACTGCTGAATTTCCTATCGAATGGGCAAGTAGTTTGCACGAAGCCATCCAACTTTTTTCAAAAGCAGTAAATAAGTTGAACAAGGCTATTGACGGATTGTCTGATATTGAAACCAAGACGAATGCTGAGCAAATGGATGAGCCCAAGCTTGTTGTTCAAGGAAACGACAACAACGAAATAATGATGATTACATCTTTTGATGCAGACTTGTCAGCATCCAAGAAACACAAAAAACGACCCAATGCCAAGAAGCTTAACAAGATTCTTGGATTTGGGGAGCGCGCCTTTATCAATAAGGATGGCATTCCTGGTCGACCATGGTACAAACATGTTGTTTATGCACCAGGAGAGTGGTCTGGATATGGTGCAGAGATGTTTCCTGCAATTCATGAAGCCATTCGTGCGCATAATGAAACTCGAGTGCTAAATGCGATCGCAGTTGCTTCGCATCAAATTCAACAAGCTGCAGAGATGCTTTCTCCTTGA
>XM_023773343.1 Ramularia collo-cygni uncharacterized protein (RCC_08091), partial mRNA 
ATGGCGCAAGGTCCAGCCAAGAAGCCAAAGGCACCAGCCGTAAAAACCACGCAGCGCAAGCAGACCGGAAACCGTGTAATCAAACCGAAAAAGGCCGTCCTGATCAAGCAGAATACGATGAAGAAGGCGCATTCCAGTGGTCTGGCAGCCCTGACCGAGAAGTCTCTGGCCAATAAAGCGGGACATTTGGAGCTTTTGAAGGGCGGCAAGAGGGAGAAGCGGGTCGCGATGAAGGAGGCGGCAGAGAAACTAGCGAAGAAGAAGTGA
>XM_001417720.1 Ostreococcus lucimarinus CCE9901 predicted protein partial mRNA 
ATGCTGGACGTGTCGTGCGGACCGGGGCTGATACTCGACCTCTTGGCGCGCCATTCGGCGCGCTCGGGGAAGTGGGAGCGCGTGGTTGGTTTAGATTTTTCTCGAGAGATGGTGACACTGGCGCGCGAGGCGTGCGGCGAGCGCGCGACGGTGGTGGTGGCGGACGCGTGCGATTTGCCGTTCGCCGATGGCGCATTCGACGTCTTGCATTCGAGCGCGGGGGCGCATTGTTGGGGCGATTTGAACAGCCGTGGCGTTCCCGAGTCGGCTTTTCGCGAAATGTATCGAGTTTTAAAACCGACGGGGGAGATACTGGTATCGACTGTCGTCCTGCTGAAGCCGACGACGGTTGAGGAGGAGTACTCGCGAACGCCGAACACGCCATTTTTCGACGAACGCGCGGTGTGCCGGATGATTCAAGACGCTGGGTTTCGCGATGTTGAAGTTATAGCAAAGGATAAGTGTTTCGTGGCCGTCAAGGCTGTTAAGTGA
>XM_048826826.1 PREDICTED: Caretta caretta laminin subunit beta 3 (LAMB3), mRNA 
GCACCCACCCCACAGGAACTTCCTTCCTCAGGTGAGGCTGCATTTAAAAGCAGAGAGTGAAAGGAGACAGCCCATGAGGACTCAGGTGAGAATTCGTATCAGCTGCTCAATAACGGAGGAAGAGGAAAGAAAAGTCTAGCCCCTGAACCAGGTGAGTCCTCAGAAGTATGGAATCTCCCCCCCGGCCCATTGTATGGACATGTTTCATTCTCCTGGCTTTGCCACGACTCCTGGATGCACAGGGCTCCTGTTCCTATGGTGCCTGCTACCCACCTGCGGGAGACCTGCTGGTAGGAAGAATCCATCACTTGAAAGCCTCGTCGACATGTGGCCTTGTGAAGCCTGAGACCTACTGCACATCGTATGAGGAATGGAGGATGAAATGCTGCCGATGCGATTCCCGACTGCCTCATGCTTACAACAGTCACCGGGCGGAGAACATGCTTTCCTCCAAAGGACACATGCGCTGGTGGCAGTCCCAGAATGATGTGAACCAGGTCTCCTTGCAGCTGGATCTCGACAAAAAGTTCCAGCTCAGCAGCATCTTGCTGGACTTCAGGGCGCCTCTGCCCGTGGGGATGCTTATTGAGCGCTCCACCGACTTTGGCGAGACCTGGACGATCTATCAGTACCTGGCCTCTGACTGCGCCGCTACCTTTCCACGGATCCCCCAAGGCTCCCCCCAGAGCTGGCAGGACGTGCGCTGTCAGGAACTGCAGAGCCACCAGGGGCACCCTCTGCACGGGGGGAAGGTCAAATTCAACCCCCTTGACCTGGCATCCGGCATCACCACATCTCACAGCCAAAGCATCAGTCACCTGGGAGAATTCACCAACCTGAGAGTTAACTTTACCCAGCTACCTCGCCTCCCACAGCAGGGCTACCGCTCACCCAGTGCCTTCTATGCTGTGACCGAAATGCAAGTGCAGGGAAGCTGCTTCTGCCATGGACACGCAGACCGCTGTACTCCCTCCAGAGACCCCAATGCCGTGATGCAGGTTCACGGACACTGTGTGTGTCAGCACAACACGGCCGGCCCACACTGTGATCGCTGTGCAGCTTTCTACAATGACCAGCCTTGGAGGCCGGCAGAGGACCGCAACCCCAATGAATGCCGGAGGTGCAATTGCAACGGTCACTCGGAGACGTGCCATTTTGACCCAGCTGCGTACCAAGCCAGCGGTGGGGTGAGTGGAGGTGTGTGCGACGACTGTCAGCACAACACAGCGGGGAGGAACTGCGAAAGCTGCCAGGCCTACTTTTTCCGCAACCAGCGGCAAGATGTCACCCATCCGGAAGCCTGTCTGCCTTGTGAGTGTGACCCGGACGGCACGGTGCCTGGGTCCAGCTGTGACCCTCTGACCGGACGCTGCGTTTGCAAGGAGAACGTGCAAGGGGACCGCTGCCATCTCTGCAAGCCTGGGTTCACCCAGCTCACCAATGCCAACCCTCTGGGATGCCACAAATGTGCCTGCAGCATCCTGGGGACCCGCCAGGACGCACCCTGCGACGACGAAACAGGGAGGTGCTTCTGCCTGCCCAACGTGATGGGAGCCAATTGCGATCAGTGCTCTGCCAATCACTGGAAGATTGCCAGCGGCCAAGGCTGTCAGCCGTGCAACTGCGACCCTCGCAACTCCTTCAGCCCACAGTGTAACCAGTTCACAGGGCAGTGTCAGTGCCGGGAAGGCTTCGTGGGGCGTACCTGCTCCGCTGCCCAGCTGCGGGTTTGTCCAGATGGGTCCTATGGTGACGTCAGGACAGGATGCAGAGAGTGTGACTGCAATTTCCAGGGCACGGAGGGGATGGGGTGTGACAAGACCACAGGCAGCTGTCTCTGCCGCCCTGGCTTTACCGGGCCTCGCTGCGACCAGTGCCAGCGGGGTTTCTGCAGCAACTACCCCCATTGCGAGACGTGCCACCCCTGCTTCCAGGCCTACGACAGCGACATTCGCCGGTTCGGCCTGCGCCAAGTCAGCCTGAGAAACTCCACCTCACGACTGCAGCTGGGAACAGGGGGCGCTGGCTTCAGCACTCGTGTCTTGGAAGCAGAAGGCAATGTTCAGCAGATTCAGGGGATCCTCGGCAACCCCCTAGTGACGCAGCAGGGCCTGGGTCAGGTGTCCAGCATGCTCACTGCAATCAGACAGCAGGTCCAGGGCATAAATCCTGACCTACCCTTTGTGAATGACACCTTCTCTCTAGCCAATGATCTTGAAGCCCTGGACAAGAGCCTGCTTTTCGTTAATGGGCAGTACCAGATTAAGAAGACCCAGTTTGAAGCCAGCCGCCACACAGACCTTTCAGGAGCCTTCAAGACTGTCAGCTCTGCGTACCAGAGCTCCACCAACGCCAGCTACCGCATAACGGGCACTTCCAGCCTGCTGGCTCAATCCAGAGAGAACCGGAGAATGACTGAGGGGCTGGAAAGCAGCTTTACAGACCACCCCTCCAGGCTGGAGGCCCTCCAGGGCGAGATGGCCTCCTCCCCCAACTTGACACCAACTATAAATAAGATTTGCAGTGGCGTCAGATCCAAGGCCTGCACCCCTGGGCACTGTGACGGGGAGCTGTGTCCACAGGACAGCACAACGGGGTGCGGAACGGGCCTCAGCTGCAGAGGGATCATTCCACTGTCAAGTGGCGCAGTCAGAACTGCTGAGAAGACCACCAGAGAGCTCGATGGCATAAAGACTCAGCTCCAGCGGACCATGCAGATGATCAGGGCAGCAGAAACGGCTGCAAACCAAATCCAAAGCAATGCACGACGTCTCGGGGACCAAGTGAGTGTAACCAGGACCCAGATAGAAGGAGACGTCCGACGCATCCAGCAATTCATCCAGCAAGTCCGCAACTTCCTGTCAGACCCAGCCACCGACCCTGCCACCATCCAGGAGGTCAGCGACTATGTGCTCTCGCTCCGCCTCCCAACGGACACTGCTGCCGTCCTGAGGAAAATGACTGAGATCCGAAACCTGGCTGCTAAGCTGCAGTGTCCTGAGAGCATCCTCACCCAAACAGCTGGTGATATCGCTAAGGCCAAGAGGCTTCAGCAAGAGGCTGAACAGGCAAGGAACCGAGCAAATGCTGTAGAGGGCAACGTGGAAGAAGTGGTGGAGAATTTGAGACAAGCAAACACAGTGCTCCAGGAAGCCCAGGATGCTATTAGTGGCTCCAGCTATTCCCTTCGGCTCATCCAACTCCGCATTGATGAGATCCAGGCTGTCCTTGGTCCAACGGAGAAGAGTATGAGAGACATTACTGATCAGCTGGACAACTTCACCGAGAGAATCAGCCAACTGCGGCACAGGGCGGAGCAGAATCAGTTGCAGGCCACCGATGCTCAGCAGAGAGCAAAAGAAGCCATTGAGCAAGCAAGGAGCACTCAGCAGGGATTTGAACGGGTAAAACAAAAATACGATGAGCTAAAGAGGCGGATGGGACAGAGTTCGACACTGGGAGTGCAGGGCAGCAGGATCCAAAGTATCGACAGGGAGGCAAAAGCGCTCTTTGAAGAAACCTGGGCTATGATGCTCAGGATGGAAAGTATAGAAATGGAAATTCAGAAAAGCAACAATGCATTAATCATCAAGTCAGCCAGCCTTGCAGGCCTGGAGGAGCAAGTGGAAAAGATCAGCAGTCATATCCATGAAAGAATCGCCTACTACACCGGTTGCTAATCAATCAATGAGCTGCTGGGACTCCATCTTGCCCTGTAATTGCAGAGTCTGCCTTCTGTTCAAACACTGACTGGGGTAGTTAGCCCCCTCTCATAGAATTTTCTTGTTCTCACACTTAGTGTCTTTGGTAACAGAACTGCTGTAGCTTTAGAAAATGCTAGCATGGAGCCCAAAAGGACAAAAATGCCTCTGGAGAGAATGAATGTTATATGGCCTGGCTGAAGCAACCCTGGGAGGCTCTAGGAAAGGGGGAAGATATAACTAATGAAAAAAGCCTTTTGGAAGGAGTTATTTCTGTATGAGGTTTGTTAATGTGACCGGGGATGTTTGTTTTAGCACCTGGATTTTACCTTTTGAATGACAAAGACCAGAGTTGAGGTTTAACTTTTCTGGTACAGTGCATTTAGTTCTTCTAAGGGAGTCATAAGAGGAGTAGAACTAAGGCTACAGATAAATATAGGACCAGATAACTGAATAAGCCCTATTTATACAAACGTAAGAGCAGTTGTGCTCTCAGGTGGAGTTAGATACTATCCAGTTGGACTTAGACAATATGTTGCAAACTGAAGCCTGTAGGGAAC
>XM_019557682.1 PREDICTED: Lupinus angustifolius nucleolin 1-like (LOC109325361), transcript variant X10, mRNA 
GTCGCATATAAAATCATTGTTATCAGCCGTAGCCTCATTCTCTTCCTAGCTTCTCAAAACCCTAAACCCCTTTCTTTCGTTGATTCATTCCTCTCTATTCGATGGCCAAGTCCAGCAAGAAATCCGCTTCCAAAGCTGATGCTGCTCCAGCTGCAGCAGTTCCACCTTCCAAGTCTGCCAAAAAGAGCAAGAGGCAGCCAGAAGATGAAATTGAGAAGCAGGTGAGTGCTAAGAAGCAGAAGGTAGAGGTGGTTGCCCAGAAGCAAAAGAAGGAAGCAAAGCTGCAAAAGGTTAAGAAGGAAAGTAGTTCAGATGATTCATCATCAGAATCTGAAGATGAGAAACCTGCTGCAAAGGTTGTTGTTCCTTCAAAAAAGCAACCAGCTGCTGAGAAACCAAAGGTGCAGAAGAAGGAAAGTAGTTCTGATGATTCCTCTTCAGAGTCAGAAGATGAGAAACCTGCAGCAAAGAAAAGCAAGCCAGCACCCCCTTCTAGCTCTTCTGATGAATCATCTGATGAGGATGAAGCTCCAAAATCCAAGGTGGCTGCTGTTAAGAAGGGCTCTGCTCCCGCAAAGAAGAATGTGCAGCCTAGTGAGAGCTCTGAGTCATCTGAGTCTGACTCCGACGACAGTTCTGATGAGGACAATGCAACTAAACCTTCCAAGAAATTGCCTGCCGCTGCTGCTAAGAAATTGCCTGCCGCTGCTGATAAGAAATTGCCTGCTAAGAAGGCTGAATCAGACTCATCCTCTGACAGTAGTTCAGATGAAGATGATAAAAATGCTGGCAAGTCGGTGCCTGTTTCTAAGCAGCCCACAAAGAAGTCAAAAAGTAGTTCTGATGAGAGTGATTCAGATGATGAAGAGAAGAATGCTAAAGCTTCTAATGGTAACAAGAAACCCACACCTGTTGTGAAGGTGGTGAAAACTGAGTCCAGTGATAGCTCATCAGACGATGAGGTAAAGATGGATGTTGATGAGGATGATAGTAGCTCTGATGAAAGTGATGAGAAGCCTCGAAAGAAAAAGCCTGTAAAAGACTCAAAAGAAAGCTCTGATGATAGTTCAGAGAGTTCAGATGATTCAGAGGATGAAGATGACAAGAACAATTCCAAAACTCCCCAGAAAAGTGTTAAGGATGTGGAGATGGTTGATGCCTCATCTGGAAAGAAAACTCCTAATACCCCGGTAACACCGAAAGGAGAATATGGTGGATCAAAGACACTATATGTAGGCAACCTGTCATATAGTGTGCAGCGGTCTGATGTGGAAAATTTCTTCCAAGATTGTGGAGAAGTTGTCGATGTTCGCCTTGCAATAGATGATGATGGGAGATTTAAGGGCTTTGGACATGTTGAATTTGCAACATCAGAGGCAGCCCAAAAGGCGCTTGAGTTGCGTGACCAAGAACTGTTGAACCGTCCTGTCCGGCTTGATTTAGCTCGTGAAAGGGGTGCATATACTCCCAACAGTGGGCCTAACAGCGGTAACTGGAACAACTCATCCCAGACTGGTGGAAGAGGCCAGTCTCAGACATTATTTGTGAGGGGTTTTGATAGATCCCTTGGAGAAGATGAGTTAAGGTCTAGCCTGGAGGAGCATTTTGGTACATGCGGGCAGGTTACAAGGATATCTGTGCCAAAAGATTATGATTCTGGTGAAATTAAGGGGTTTGCTTACTTGGACTTCAAAGATGGTGAAGGCTTTAGCAAAGCTCTAGAACTCCATGAATCTGAACTCGGAGGTTATACATTATCAGTTGATGAAGCCAAACCTAGAGACAGTCAAAGCTCTGGTGGTAGAGGTGCAGGTAGGAGTGGTGGTGGCCGCTTTGGTGGTGGAAGAGGTGGTCGATTTGATGGAAGAGGCAGTGGTGGACGATTCGGCAGCGGTGGTGGTGGTCGATTTGGTGGTGGTGGCCGATTTGGTGGTGGGCGTGGTCGTGGAGGACCAAGCAGACCAAGCTTTGCCCCAGAAGGGAAGAAGACCACTTTTGCTGATGAGGATTAGAGTGTCTGGAATCTGAAGTTTACTATTTTATTATGTGCTTTTAATTTCAGTTTTTTGCTCCAGTTTTGGTATTTGTTTGTATGAATTGGTAGAAATCAAGTGTATTTGGGATTTTCAGACAATGTCTTATGGATTTGTAGTTCTGCTACCTATCCAAACCATGTATGCAGTTTGTTAGGTAAAGACATATTCAGAAATATATATTTATTATATATTTAA
>XM_039356821.1 PREDICTED: Crotalus tigris PTPRF interacting protein alpha 1 (PPFIA1), transcript variant X7, mRNA 
GAGTTTGCAGCACTTACTAAAGAGCTCAATGTATGCAGAGAGCAACTCCTTGAAAGGGAAGAGGAAATTGCAGAATTGAAAGCAGAAAGAAACAATACAAGAGTCAGTTCATCTTCTGTTACTACTAGAACATTTGGAATGCCTTGTCTCCCGGCATGAAAGATCTTTAAGAATGACCGTAGTAAAAAGACAAGCTCAATCGCCAGCTGGTGTTTCTAGTGAAGTTGAAGTTCTCAAAGCACTAAAGTCTCTATTTGAACATCACAAAGCCCTTGATGAAAAGGTAAGAGAAAGGTTACGAGTAGCACTTGAACGATGTAGTTTGTTGGAGGAAGAACTAGGTACTACACATAAAGAGTTAATGATTTTAAAAGAACAAAACAATCAGAAAAGAACACAAGCTGATGGAATGCCTGATATTAATCATGATCAGGAGAATATACCTAGCACTAATGGGAAGAGATCTTCCATTGGCTCTTTGAATCATGATGAAGATCTTGCTAAAGTAATAGAACTTCAAGATATCATAGAAAAGCAAACTAAAGAACAGTCACAAATGAAAGAAAGAATTACTGCCCTTTCTAATAGAGTAGCAGAACTGGAAGAAGATCTTGATACTGCTAGAAAAGATCTAATCAAATCTGAGGAAATGAACACCAAGTTGCAAAGAGACGTACGAGAGGCAATGGCTCAGAAGGAAGATATGGAAGAAAGAATTACAACTCTTGAAAAACGCTACCTCGCTGCACAACGTGAAGCTACATCTGTGCATGATCTTAATGATAAACTTGAAAATGAAATTGCTAACAAAGATTCATTGCATCGACAGAGTGAAGACAAGAATAGGCAGTTACAAGAACGATTGGAACTGGCTGAACAAAAATTGCAGCAAACTCTGAGAAAAGCTGAAACTCTGCCAGAAGTAGAGGCTGAATTGGCTCAGAGAGTTGCTGCACTTAGTAAGGCTGAAGAAAGACACGGAAACATTGAAGAACGATTGAGACAAATGGAAACACAGCTAGAAGAAAAAAATCAAGAACTATTAAGGGCCCGTCAAAGAGAAAAGATGAATGAAGAACATAATAAACGTTTATCTGATACAGTTGATAAACTTTTATCTGAATCTAATGAAAGACTTCAGCTTCACCTTAAAGAAAGAATGGCAGCTCTGGAAGATAAAAATTCCCTTCTCCGTGAAATTGAAAGTACCAAGAAACAAGTGGAGGAGCTTCAAAATGAAAAGGATCAGTTGGTAGTAAACGTTGAAGCAATAAGGGCTGAAAATGACCAGTTGAGGATCAGAGGCCCTGCTCTTCATCATAGTAGGCCACATTTAGGTAGTGTACCAGATTTTAGATATCCACTGGCACCTTCAGTTATAGCAGACAATCAGACAGATTCCTACAGCACCTCAGTTCTACGACGTCCACAGAAAGGACGCTTAGCAGCTCTGCGAGATGAGCCTTCAAGGGTTCAGACTCTTAATGAGCAAGATTGGGAACGTGCACAACAAGCAAGTGTATTGGCAAATGTTGCACAAGCCTTTGAGAGTGATGCTGATATCTCAGATGGTGAAGAGGACAGAGAAACTATATTCAGCTCAGTTGATCTCTTGTCACCTAGTGGTCAGGCAGATGCCCAGACCTTAGCCATGATGCTTCAGGAGCAATTGGATGCCATCAATAAAGAAATTAGATTGATCCAAGAAGAAAAGGAAAACACTGAGCAAAGAGCAGAGGAGATAGAAAGTCGTGTTGATAGTGGGAATTTAGACAATCCTGGTCGATTCCGATCAATGAACTCTATCCCACCTCCCTTTCCTAGTGGAAACCTTTCTGGTTCCTCTCCACCAGGAAGTGGGCTTTCTACTCCTCGAAGAATGCCACACAGTCCTGCTCGAGAAGTGGACAGACTAGGAATTATGACATTACCTAGTGATTTAAGGAAACACCATAGAAAGTCTCCAGTTTCTAGAGAAGAAGTTAGAGATGACAAGGCTACAATAAAATGTGAGACCTCACCACCTTCTTCACCTCGATCACTGCATTTGGATAAATCTTATAAAGGAGCTTTGCATACAATGAGCCAGGAAGATATAAGAGATCTTCGAAATTCTACAGGCTCTCAAGATGGACAGATAAGCAATCCCAGTAGCAGTAATAGCAGTCAAGATTCTCTCCACAAAGCTCCTAAAAAGAAGGGGATCAAATCCTCAATTGGCCGCCTATTTGGTAAGAAAGAAAAAGGTCGATCTGGACAGATGAATAAAGAGATCCTGGGACAAGTTAGTGTATTAGAAGCAGAAAGTTCAACTCAAGATGGTTTGGGGCTTGGAAAACTTGGAGGACAAGCAGAAAAGAATAGAAAACTGCAAAAAAAGCATGAACTTCTTGAAGAAGCTCGGAGGCAGGGTCTGCCTTTTGCTCAATGGGATGGCCCCACAGTGGTTGTCTGGCTAGAGTTATGGGTTGGGATGCCAGCTTGGTATGTGGCTGCTTGCCGTGCAAATGTGAAAAGTGGTGCTATAATGTCAGCCTTATCGGATACTGAAATACAGCGTGAAATTGGAATCAGTAATCCTTTACATAGGTTAAAACTGAGACTTGCCATACAAGAAATTATGTCACTAACGAGTCCATCGGCTCCTCCTACATCAAGAACGACTACAGGAAATGTCTGGGTAACGCACGAAGAAATGGAAAATCTTACATCTACACCACAAACGGAAGATGAGGAAGGAAGCTGGGCTCAGACTTTAGCCTATGGTGATATGAACCACGAATGGATTGGCAATGAATGGCTTCCTAGTTTGGGGCTTCCTCAGTATCGCAGTTATTTTATGGAATGTTTAGTTGATGCTAGAATGTTGGACCATTTAACTAAAAAAGATCTTCGTGGTCAACTTAAAATGGTAGACAGTTTTCACAGAAATAGCTTCCAGTGTGGCATTATGTCTCTCCGAAGATTAAATTATGACCGAAAAGAACTTGAAAGAAGAAGAGAAGGAAGCCTGAATGAAATTAAAGATGTCCTTGTTTGGAGCAATGACAGGATGATTCACTGGGTGGTATCAATTGGCCTTAAAGAATATGCAAATAATCTTATAGAAAGTGGAGTTCATGGTGCACTTCTGGCCTTAGATGAAACTTTTGATCACAATGCATTAGCTCTGTCTTTACAAATACCCACTCAGAATACACAGGCTCGTGCTGTCTTGGAAAGGGAATTTAATAATCTTCTTGTGATGGGTACAGACAGAAAGTTTGAAGAGGATGATGATAAAAGCTTTAGACGTGCACCGTCATGGAGGAAGAAGTTCAGACCAAAGGACATAAGGGGTTTAGCTGCTGGATCAGCAGAGACCCTCCCTGCAAATTTTAGAGTTACCACTTCAATGTCTTCACCTTCTATGCAACCAAAGAAGATGCAGATTGATGGCAATGTATCAGCAACACAAAGATTGGATTCTGCTACAGTAAGAACTTATTCATGTTAAAGACTTTCGTTGTTTATCCCCACTATTTCTACAGATGAACTGAACCATTTTGAACCCAATGACCACATTTTGGAAACAGCTGAAATCTTTAATCTGTTAATACTTGTTAAATCAACACTTTGAAATATTTTATTACAGAGTTTTTAATTAGCAGGTGAATTTGTGAGTACTATAAAAAGTATTTTAGATTAAATGTTTCTTATGTGGGTGTATGTGTGTCCCATTACTTAATTTTCTATTAAAATTGTCAATCAAGTTATTACTTTATGTTAATTTTAGTATTTTCATCTGAATGTACTGTAATGCTTGTATGTATCTGTCCCTGTAAGCAATATAGGGCTTTATTGTAAATTATGCAGTTATTGTAATTACCAATAATGAATTTAATAAAGTGAAGGTGAATTTTTTTTTACAATCTTTGTAAAGACATCATGACACCAAGCAATATCAATATATATATATTGCTGTTTGAAAAATGCTAGCTAGCTCTAAAAATTGAAATAATTCCTTTTTTTCAGAGAGGCATATGTTTATTAACAAAACAGGCATGGTACCTGATTCCATTTCCGTTAGAAACTGTACCTTTTAAACTTTTAACATTTGATTATTTAGTGTGTATTCTTATTTAAGGCTTTTGTTTAGTATAATTTGCTTTATATTCATAAATGTGGGAATTTGTAGAACATTATGAAACATATGAGACCTAATGAGGTCATTTATAACTACTTTTTGTGGCTGTATTTGTACAGTCTATGTTCATTGATTGAGCATAAGCAAGCCATAAGCGGAAATATTTTCTGTTAAGCAAGAATAGTTACTACATATTTTCTGTTAAGCAAGAATAGTTACTACATAAGAGTACTTGACAGGCAACATGGAGTGCTCCCTTTCTGGGTTTTGATGTGAAAATGTTTGTGAAAAGATATCAATGCAGTTCTTTTAATGGACCAATCATGATGCACTGCTGCCTCATGACAAAGATGTTAAGAGCATAACATATGGAGGCATGTGGTAGTGCAACTATTAAAAAGGCCTTACTTTTCTTATGTCATCTTTTAGATATATTTATAAGCTTGTTTTTAAATCCAGGCAGATTTTTTAGTTGTTAATAGTTTGAGTCATTGCAAACAGTATAAGTAGAAAATGCATCATTCATTTTTAAATAGCATCTTATGAAGCCAGCAAGGAGGAGATTCAGATCATGGTGCATTATTTATTATACAATAATATACATGGCATGTCTTTTTTCTGTATTTGGTTTTGGCTCTTTTTAAATTGTACAACTTGAATTCATTGTTACTATTTTTTCTATTAACCTTATGTGTACTTTGAATAATGTAACAAATTATGTACAGTCTAAGTACTTTGAACTATTTTTATCACAGTATTATTTATTGCTTTCAATAAATTTCTGAAGCATTTTTCCACTGCCAATAAAATGTTACTATCTTGTGATGAGGCTTGAGATGTTTTAAAATGGTAATTCAGATATTAATGCAAATGAAATATCTTGTGACGTATTAATGCTTCCTTTGGCAAAGACAGTTTTATAAGATCCTTTTCACTTTAGAAATCACACTCTGTATATTATATGTAAGATATACTATTACTATATAAACTTATCAAAATGATTTGTGCAAAAAATTTAAATTCTGAATGTTAATACATTCAAAGAAGATATATTCCAAGGAATGATTGTATGCATTAAATCTACCAGATCTCAGGTCCATAAATCCAGATAAGACTATCAGATAGCAGCAAAGAAATGTGGAAGACTCAATTTTTTTTACTGCTCAGTATTGATTATATGCATGCATATCTTAATCTGAATTTTAGATACTAAGACTAAGGAATTTAATCTTCATTGTGATTATACTGAAGCTATATATAAAATGATCAAACAGA
>XR_002477788.1 PREDICTED: Aotus nancymaae transcription initiation factor TFIID subunit 9-like (LOC110567331), misc_RNA 
ATTACGGTTCTTCTTTTTCCAAGTGAATATCTTTTTCCTTCTGTTCTTTAAATTATAATGTAATACATGATCACAAGAGACAAATCAGAAAATACAAGGAAGCAGAAATAAAGAAATCAACTTCATTTGCACTCAAGGAAAAGAAACTGTCATCTCTCAATGCAGGTCCTTCAGTATCCCTTTATTCTGTTCATTCATTGATGTAAAAAGGATTTGTGAGTTACCGATGTGCCAGGTGCTATGCAGGTGTTACACATAAACTCATCAAAATACAGTTCCTTCCCTAAAACAGATCAACCAAGTGGAGGCAGAGAACTGAATAAACAATTATACCTAAAGTTTTCCTACATATACAGCTATCTATATATGTAGATACAGTCTTTGCAAAAATTAGAATATATCATGAATGCTATTAACCTAATTTTGGGCCTAATACATCAGAAAAAAATTTTCCTGTCAATAGATTCAATCCTTGCTCATAGCCATTACTGGAGGTAATAAAGAGAAAAAAAAAATAGATTCAATCCAGAACAACAAAACAAACTCTAGAGCTAAACCTAATAAGAATCATAGTCGGGGGAGCAGTTGCAGCGAGGACCATGTTGCTTCCGGACATCCTGCTCACCGGTACACCAGGGGGTTGTAAAAACCACACTAGGCAAAGAACTTGCGTCAAAATCAGGACTGAAATACATTAATGTGGGTGATTTAGCTCGAGAAGTCTGATCATAGGATATCATGGAGTCTGGCAAGATGGCTTCTCCCAAGAGCATGCCGAAAGATGCACAGATGATGGCACAAATCCTGAAGGATATGGGGATTACAGAGTATGAGCCAAGAGTTATAAATCAGATGTTGGAGTTTGCCTTCCGATATGTGACCACAATTCTAGATGATGCAAAAATTTATTCAAGCCATGCTAAGAAAGCTACCGTTGATGCAGATGATGTGCGATTGGCAATCCAGTGCCGCGCTGACCAGTCTTTTACCTCTCCTCCCCCAAAGAGATTTTTTTATTAGATATCGCAAGGCAAAGAAATCAAACGCCTTTGCCATTAATCAAGCCATATTCAGGTCCTAGGTTGCCACCTGATAGGTATTGCTTAACAGCTCCAAACTATAGGCTGAAATCTTTACAGAAAAAGGCATCAACTTCTGCGGGAAGAATAACAGTCCCGGGGTTAAGTGTTGGTTCAGTTACTAGCAGACCAAGTACTCCCACACTAGGCTCACCAACCCCACAGACCATGTCTGTTTCAACTAAAGGTGGGGACTCCCATGTCCCTCACGGGACAAAAGGTTTACAGTACAGATGCCCACTTCGCAGTCTCCGCTGTAAAAGCTTCAATTCCTGCAACTTCAGCAGTTCAGAATGTTCTCATTAAATCCATCATTAATTGGGTCCAAAAACAATTCTTATTACCACTAATATGGTGTCATCACAAAGTACTGCCAATGAATCATCAAATGCATTGAAAAGAAAACATGAAGAAGATGATGATGACGACGACTATGATAATTTGTAATCTAGCTTTGCTGCATGTAACGTGTACTTGATCTTGAATTTATTATACTGATATTAAACATGCATGCTGGATGTTTTCAAGTTGTGTTTTAGAAAACTTTAATAATATTTAATGAGTAAATACAATTACCATACTTTTCAATTTAAATGAAGGTTCAGCCTTAAAAGTGTAAGAAAAATAAAGTTGTCATTCATTAAAAAAAAAAAAAAAAAA
>XM_035574191.2 PREDICTED: Spodoptera frugiperda proline-rich protein 36-like (LOC118262654), mRNA 
GTTGGACAGGCAGCGGCGCGCCACCAACATCCGCGCCGTGTCGAGGCGAGAGAGCAGCCACAGTCAGTCCGGCGCCGACAACCGCCACGCGAACACGTATTCTCCAAATAATGGCCGCCGCCCACACGCACCCGGCCCCCGCGCCCTCAGACCGTCGCTCAGAGGGCCGTGCCGGTTCCCGCCGTATATTCCCACCACAATTTAAGCTGCAAGTTCTCGAAGCGTACAGGCGTGACGCTCAATGTCGCGGAAATCAACGAGCTACAGCAAGAAAATTCGGAATACATCGTCGTCAAATCCAAAAGTGGCTTCAAGCGGAACCTGCACTTCGAGCAGCACTTCTGAGGCGAGCGCCGCAACCAGCGCCGTCGCCACCGCCTTACGCAGCTGGATCTCCAGAGAGCGCACGGCTGCCTTCGCCGCCACCAGTGACAGTAGCCACACCGGTGCAAGTGCCCACACCTTTACCAGTACCAGTGCCCGTTCCTGTGCCTATGCAAATTTCTGAGCCCATCGACCTGTCAGTACGTCGACCTACACCACCACCTGCGCCTCAACCGGCCTATGTGCCACCTACGGCACCTTGTCCGACACGCAAGCCTTTCAAACTATTCCGGCCGTATCTACTTGAAGACGAAGAAGAAAAGCGACCATCGCTGGCATCGCTGCCTGTGTCTAGCGGCGTTCATGTGTCAGCGTTTGTACCGGTGCAAAGCGCGGCGGGTTGCGCGCTCGCTGCGTGCTCCGCCCCGCGATGGTGCTCACCTATTCCCTCCTTCCCGGCTCCACTCAGATGAGAGTGTGCCGTCGGAGCCCTGCTCCGTAACTCCTGTGATCTAGTCGCTGACGCCCGCCTGGCGCCGCCTGGGGCGTAGCCCTTTATCATCGTGCCTTAATGTTCACGCCGCCATAGTGCATTATGCCGTCATCACCCGATGACAGATATTTTGTGTATAAAGTTTAAGATTGTATTTTTATATGTGGGGTTTATGAAGCTTACCTACATTTATAAAGAATATAAATATTATAACGTCTATTATTATTATTATTGAATAAATAAAGAGGATTGTTTACTAAAA
>HQ100547.1 Uncultured Brachymonas sp. clone F5OHPNU07HZVCK 16S ribosomal RNA gene, partial sequence 
TGGATGATGTGGTTAATTCGATGCAACGCGAAAACTTACCACCTTGACATGGCAGGAATCCCGAGGAGATTTGGGAGTGCTCGAAAGAGAACCTGCACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGCCATTAGTTGCTACGAAAGGGCACTCTAATGGGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTACATCCCGGGCTACACACGTGCTACAATGGCAGGTACAGAGGGCTGCGAAGCCGCGAGGTGGAGCGAATCCCAGAAAACCTGTCTCAGTCCGGATTGAAGTCTGCAACTCGACTTCATGAAGGCGGAATCGCTAGTAACCGCGAATCAGCAGGTCGCGGTGAATACGTTCCCGGGCCTT
>XM_030296100.1 PREDICTED: Lynx canadensis ADP-ribosylation factor 2 (LOC115501167), transcript variant X3, mRNA 
GCCCCCGCGCCAGTCGCCATTTTGCAGAGGGGAGCCGAAATCCGAAAGGCAGTGGTGTGGGTAACGGTGCCCTGTGCGGCGGCAGGTAACAGAATTCAGTCACAATGGGGAACGTTTTTGAAAAACTGTTTAAAAGTCTATTTGGGAAAAAAGAGATGCGGATTCTTATGGTGGGTTTGGATGCGGCTGGAAAAACCACCATCTTGTATAAATTGAAACTGGGAGAGATTGTGACTACCATCCCTACAATAGGTTTCAATGTGGAAACGGTAGAATATAAAAATATCAGCTTCACAGTCTGGGATGTTGGTGGCCAGGACAAAATCAGACCTTTGTGGCGACATTATTTCCAGAACACCCAAGGTCTGATTTTCGTGGTTGACAGTAATGACAGAGAGCGGGTCAATGAGGCCCGAGAAGAACTAACCAGAATGTTGGCAGAAGATGAGCTCAGAGATGCAGTTTTATTGGTGTTTGTAAATAAACAGGATCTTCCGAATGCTATGAACGCAGCGGAGATAACAGACAAGCTCGGCTTACATTCCCTCCGCCAGAGAAACTGGTACATTCAGGCCACTTGTGCCACCAGTGGAGATGGGCTTTACGAAGGCCTGGACTGGCTCTCCAACCAGCTCAAAAACCAGAAGTGATCGGAAGCGATCCCTTCCCCGTGTGATGGAGGTCGTCAGATAGTACACACAAACTGATGATACGCCGTGGAGATGAATTTTTTTTTCCCTTTGAAAGTTTCGATATTCTTCTCACCTTTTTTGGTAGCAGCTTTATTGAGACAT
>XM_052553176.1 PREDICTED: Carassius gibelio lipopolysaccharide-induced TNF factor (LOC127953842), transcript variant X2, mRNA 
TCAGATTGTCTCAGATAAAAGCACCCATCAAGGCCATGGCAAGCGCACCCCCGCTGGAGTCATCCACTCTTGTGGGACACCCTCCTCCTCCCTCGTATGAGGAGGCACTGGGATCAAACCCGCAGTACCCACCAATGCCCTACGCTCCTGCTCCTGCTCCAGACATGAAGACATCTGTGCCTCCGTATCCAGCACAACCCTACTGTCCCATGTATCCACCACCACCAGCTCAACAAGGTCAACCCATCACCAGTCCTGTTGTATCTGTGCAGACCGTGTATGTTCAGCCTGGGCTGGTGTTTGGGAGTGTCCCGGTGCAGGCACATTGCCCAGTGTGCTCACTGAATGTGATAACTCGCCTGGAGTATACATCAGGAGCATTAGCTTGGCTCTCTTGTGCAGGCCTGGCCATCTTCGGTTGTATCTACGGCTGCTGCCTGATTCCCTTCTGCGTGGACAGCCTGAAGGATGTGATACACCACTGTCCGAACTGCAGCAGCGTTTTAGGAGTCCACAAGAGAATCTGAAGCAGCTGCAGAACATATGAATGAGTTGTGTAACATACCACTCTGTGTTTATAATGGGGAAACGTTACAGTCAATTCATCTTTTTAGCAAGAGTTAATTCAATATCTGTTGCACCGACACACACATATTCAAATGTATGCGCGCACGCGCGCACACGCACACACACACACACACATATCTTAACATACTTGTCTATTCAATTTAAAAACTGTTATTTGACCAAAAACGAACTCTTTTTTTTTTTTATAATTGTATCACAATTGTGAAGGAATCTTTATAACATTAGATTTACGTATAAACAGTGCAATTATTCTCAATTATATTTTCTGTAATCAAACTGATGTAGGGAAATATTATACAAATAAATATGTATATGCTTTTCACACTTAAA
>XM_030451652.1 PREDICTED: Calypte anna neurexin 3 (NRXN3), transcript variant X4, mRNA 
ATGGGCTTCACTCTGCACTCCATTTACTTCACCTTGAAGGTGAGTTTGCTGCTGGGCTCATTGCTGGGTCTCTGTTTGGGTCTGGAGTTCATGGGAATTCCCAATCAGTGGGCCCGCTACCTCCGCTGGGATGCCAGCAGTAGGAGTGAACTCAGCTTCCAATTCAAGACCAACGTCTCTGCTGGGCTGCTCCTCTACTTTGATGATGGTGGTGTCTGTGACTTCCTCTGTCTGTCCCTTGTTGATGGGCGCATCCAGCTCCAGTTCAGCGTGGACTGTGCAGAGACTACAGTTATCACAGACAAGCAGGTCAACGACAGCAACTGGCACTTCCTGATGGTCAGCCGCAATCACCTTCGGACAGTGCTGGTACTGGATGGTGAAGCCAAGCCAGGTGAGGTGCGTCCACAACGCCAGTATATGAACATTGTCAGTGACCTTTTTGTTGGTGGAGTCCCACTGGACATCCGTCCTGCTGCCTTGACTCTTGATGGTGTTCTGAGTGAGCCTCCATTTCAAGGATTTATCCTGGATCTGAAATATGGCAACTCTGAGCCGCAGCTCCTGGGCAGTCAAGGGGTGCGACTGGAAATGGAAGGGCGATGCTCAGAAAACCCCTGTGAAAATGGTGGCACATGCTTCCTCCTGGATGGTGAGCCACACTGCGACTGCTCAGCCACTGGATATGCTGGCAAACTGTGTTCTGAAGATGTCAATCTTATTCCAGGACTCTCACACCTGATGATGGGTGAACAAGGTAGAAGTAAAGCACGAGATGAGAACATGGCCACTTTCCGTGGTTCCGAATACCTTTGCTACGACTTGTCACAAAACCCCATCCAGAGCAGCAGCGATGAGATCACTCTCTCCTTCAAGACCTGGCAGCGCAACGGGCTCATTCTGCACACCGGCAAGTCGGCCGATTATGTCAACCTGGCCCTGAAGGATGGCGCCGTCTCGTTGGTCATTAACCTGGGATCTGGGGCCTTCGAGGCCATCGTGGAGCCAGTCAATGGCAAGTTCAATGACAACGCATGGCATGACGTTAAGGTGACACGCAACCTGCGGCAGGTGACAATCTCTGTGGATGGCATCCTTACCACCACGGGCTACACGCAAGAGGACTACACCATGCTGGGCTCAGATGACTTCTTTTACGTGGGAGGGAGCCCCAGTACAGCTGATTTACCTGGCTCTCCAGTAAGCAACAACTTCATGGGCTGCCTCAAAGAGGTTGTTTATAAGAATAATGACATTCGTCTGGAGCTGTCTCGCTTGGCACGGATTGGCGATACTAAGATGAAGATCTACGGGGAAGTGAAGTTTGTATGTGAGAATGTGGCTACACTGGATCCCATCAGCTTTGAGACACCTGAGGCATATATTAGTCTTCCTAAATGGAATACCAAACGGATGGGTTCCATCTCATTTGATTTCCGAACCACTGAACCCAATGGACTGATCCTTTTCACCCATGGCAAGCCTCAGGAGAGGAAAGATGCCAGGAGCCAGAAAAATACCAAGGTAGACTTCTTTGCAGTTGAGCTTCTAGATGGGAACCTCTACTTGCTGCTGGACATGGGCTCAGGGACGATTAAGGTTAAGGCCACTCAGAAGAAAGCCAATGATGGGGAGTGGTATCATGTGGATATTCAACGAGATGGAAGATCAGGTACTATATCTGTGAACAGCAGGCGCACCCCGTTCACCGCTAGTGGGGAGAGCGAGATCCTTGATCTGGAAGGTGATATGTACCTTGGGGGGCTGCCTGAGAACCGGGCAGGACTCATCCTTCCCACCGAGCTCTGGACAGCAATGCTGAACTATGGCTACGTCGGCTGTATCCGAGACTTGTTCATTGATGGCCGAAGCAAGAACATCCGCCAGCTGGCAGAGGCACAGAACGCTGCAGGAGTCAAATCCTCCTGCTCCCGCCTGAGCACCAAGCAGTGCGACAGCTACCCCTGTAAGAACAACGCCGTCTGCAAGGACGGGTGGAACCGCTTCATCTGTGACTGCACGGGCACCGGCTATTGGGGCAGGACATGTGAGCGAGAGGCTTCTATCTTGAGCTATGATGGCAGCATGTACATGAAGATCATCATGCCTATGGTCATGCATACAGAAGCAGAAGATGTGTCCTTTCGTTTCATGTCCCAGCGTGCTTATGGTCTGTTGATGGCAACCACCTCGCGAGACTCTGCTGACACCCTGCGCCTGGAGCTGGATGGAGGCCGTGTCAAACTTATGGTCAATTTAGACTGTATCAGGATAAACTGTAACGCCAGCAAGGGACCTGAAACACTTTATGCTGGGCAGAAACTCAACGACAACGAGTGGCACACTGTGCGGGTGGTACGGCGAGGAAAGAGCCTCAAGCTTATGGTGGATGATGATGTTGCTGAGGGTACGATGGTTGGTGATCACACTCGCTTGGAGTTCCACAACATCGAGACAGGGATAATGACAGAGAAACGATACATCTCTGTCATCCCCTCCAGCTTCATTGGCCACCTCCAGAGCCTCATGTTCAATGGGATGCTCTACATTGACCTCTGCAAGAATGGTGACATTGACTATTGTGAGCTGAAGGCACGCTTCGGTCTCCGCAACATCATAGCTGATCCTGTGACGTTCAAGACCAAGAGCAGCTACCTGAGCTTGGCCACTTTGCAGGCTTATACATCCATGCATCTCTTCTTTCAGTTCAAGACCACCTCAGCTGATGGTTTCATCCTCTTTAACAGTGGTGATGGCAATGACTTTATTGCAGTTGAACTAGTCAAGGGGTATATACACTATGTGTTTGACCTTGGAAATGGACCTAATGTTATCAAAGGCAACAGTGATCGTCCTCTTCATGACAACCAATGGCACAATGTTGTCATCACCAGAGACAACAGTAACACCCACAGTCTAAAAGTGGACACTAAGGTGGTCACTCAGGTTATCAATGGTGCCAAAAATCTGGATCTTAAAGGTGATCTCTACATTGCTGGTCTAGCTCAAGGCATGTATACCAACCTCCCAAAGCTAGTGGCCTCACGTGATGGATTTCAGGGCTGTTTAGCATCTGTGGACTTGAATGGGCGTCTTCCTGATCTGATCAACGACGCTCTGCACCGCAGTGGGCAGATTGAACGTGGATGTGAAGGACCAAGCACTACCTGCCAAGAAGATTCCTGTGCAAATCAGGGCATCTGTAATCAGCAATGGGAAGGCTTCACCTGTGACTGCTCCATGACTTCATATTCTGGGAGCCAGTGTAATGACCCTGGTGCCACATATATATTTGGGAAGAGTGGAGGTCTCATCCTGTACACCTGGCCAGCTAATGACAGACCGAGCACAAGGACAGACCGGCTTGCTGTGGGCTTCAGCACTACAGTGAAGGATGGCATCCTGGTTCGGATTGACAGTGCCCCTGGGCTTGGTGATTTTCTGCAGCTGCACATAGAGCAAGGCAAGATTGGTGTAGTCTTCAATATTGGCACAGTGGACATCTCTATTAAAGAGGAAAGCACACCTGTAAATGATGGCAAATACCACGTGGTACGTTTTACCAGGAATGGTGGCAATGCCACACTGCAGGTTGACAGCTGGCCAGTGAATGAACATTACCCAACAGGCAACACTGATAGTGAACGGTTCCAAATGGTTAAACAGAAAATCCCCTTCAAATATAACCGGCCCGTAGAGGAGTGGCTGCAGGAAAAAGGACGACAGCTAACGATCTTCAACACCCAGGCCCAAATTGCCATAGGAGGAAAGGACAGAGGGCGTCTCTTCCAAGGCCAACTCTCCGGTCTCTATTACAATGGCTTGAAAGTGCTGAACATGGCAGCGGAGAACAACCCCAACATTAAAATCAACGGCAGCGTCCGACTCGTTGGGGAAGTCCCTTCCATCTTGGGAACAACACCCACGACCTCTGTACCACCAGAAATGTCTACTACGGTCATGGAAACCACAACTACGATGGCCACGACTACAACCCGAAAAAATCGTTCACCACCCAGCATCCAGCCTACAACAGATGACATAGTTTCATCAGCTGAATGTTCCAGTGATGATGAAGATTTCATTGACTGTGAGCCCAGTACAGCAAACCCCACAGAGCCGGGAATCAGACGGGTTCCGGGGGCCTCAGAGGTGGTCCGCGAGTCGAGCAGCACAACGGGGATGGTCGTCGGCATTGTGGCTGCTGCCGCCCTCTGCATCCTCATCCTCCTGTATGCCATGTACAAGTACAGGAACAGGGACGAGGGGTCCTATCAGGTGGACGAGACACGGAACTACATCAGCAACTCAGCCCAGAGCAACGGCACACTCGTGAAGGAGAAGCAGCAGAGCTCAAAGAGCGGCCACAAGAAGCAGAAAAACAAGGACAAAGAGTATTATGTGTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGAATATTTATATATAAATATATAAATACTTAATGAGATTTAACTGAAATAGCAGAAACATTGCAGCGAACAAGATTGGGAGATCTATCGTTTGTGGGAAAAAGTATTGGGAAAAAAAAATTCAGCAGTGACTGTTAATGTCTCAGTCATCGCTTGGAGTCAGCAAACTGCCCTAATGTATTATAAAGCACACTTAGAGTTCTGGAGATGGCGCGCACAGCTCTGCCCTGATAGTGAACTTGGACGTCTCCAAATCTCCTCCTCCGCTGAACTTTCTGCAAAGGTAGAAGACATCATGGCTTACTTGTTTCATACCTCCAAGTGAGTCTTTAACAATGTTCGTGATCCCTGACTGTATCAATAATTTTTCGGTTTACTTATTTAAAAAAAAAAAAAAA
>LR784286.1 Phallusia mammillata mRNA for cytochrome P450 10-like (Cyp11b1-001 gene) 
GAGCAGATGAAATACCCACCATCAAGAAAGTGGCACCACAACCATTTAATTCAATTCCCACCCCAAGCACCTCTGCTCAAGTGAAGACCCTCCTAAAACTGTTAAGAAAAGATTTTAACATGGTAGAGCACATGTCCAAAAGACACCAGGAACTTGGACCAGTATACAAGGAGAACATTTTACCTGGAATTGCCGATGTAACTGTGTCTTGTTGTTCACCTGCTGACACAGAGGCTATGTTACGCTGTGATGGTAAATATCCTGTCCGTCCCCAACTTGGGCCACTGGAAAGTATTAGAAAAGAATTAAAATTGTACAAAGGCATTTCTGAGGCCAGTGGTGAAGAGTGGTACAAAGTGAGAAGTGTAGTGAACAACCATTTTCTACGAAATCGATCAGTGTGGTCATATGGAGAAAAGCATTTAAAGGTTTCTCGGGACTTTATGGAGTACATTGCCAAAAATTTGGATTCCAATAATGAGGTGCCTGATTTTGAAAATGCCCTAAAATATTGGTCTTTGGAAGCAGCAGGTGTATTCAGCCTAGACACAAGACTTGGTTTGTTTGACGATGAAGTGAATGAGACATCACTGGAATTAATTAAGGCAATGGATTTGTTTTTTGAAAACCTTTGCAAGCTAGTGTTTGGTGTTCAATTTTGGAAAACTTTTGAAACATTTACATACAAGGATTTAAAGAATTGTCAAAAGGAAATTTACAATGCGGTTTCTCTTCATCGGCAAGCAGTACAGCACAGCAGTAATGGAAAGGAAACAAATCAGCTCCAATCCTTTCTCAACAGCAGCCTGCTCACTGACAAATATGGTGATGGTAGACTTTCTATCTGGTGGAATAGAAACCACAGCAATGAGTTCAATTTTTCCTTTGTATCTCCTTGCAATACACCCTGAAAAACAGGATATTTTACGTCAAGAAATCAAAAAATACATTGGTGATTTTAGTATTGACAGTGGAAAGGTGCTTGCTGAAATGCCATACCTAAATGCTGTACTCAGGGAAACTCAACGTATTTTTCCTTTTGCACCTTTCTACAGTCGAAAATTCAAGAATGGCATTGTTCTTTCAAACTATCAAGTTCCCCCAGACCAACTGGTTATTAGCTCAGCAAATGTTGTCAACAACAAAGACCCTGCATACTTTCACGAACCAGATTTATTTAAACCTGAACGATGGCTTGATCCTGCACAAAGAAAAAAGGCAGCATTTGCTACTGTAGGGTCGTTCGGGGCCGGTGCCAGAAAATGTCCTGGTAGGAAGTTTGCACTCCAAGAAATCCATTCTCTTATTCCACTCATATTAAGTCAGTACCGTATTGAATACCACTATAAACCAATTAGAGCCAAATTGCGACTTTTGAGCTATCCATCTGAGAAGCCAAGATTTACTTTTATACCCTTGGATGAGTAAGATCGA
>XM_047789995.1 PREDICTED: Phacochoerus africanus uncharacterized LOC125132573 (LOC125132573), transcript variant X1, mRNA 
GGGATTGAACCCGGGCCATACCAGTGACCCAGGCCGCTGTGGTGACAGTGCCGGATCCTTAACCCACACGCCACAAGGGAACTCCCCGACTCTTCTCTACCACCTCCTTTTCTGTCTCCATTCCCATCTTCCCATCATCTCTGGGTCAGTAGCTCTCTTTCTGTCCCTGTCTCTCACTCACTGTCTCTCACCCCTTCTTTTATCTATTTCTTTCTCATTCATCAACGTTCTTTCCACACCCCTGTCCTTTTTGCTAAGTATTTCCCTGTGGGTCCCTCCTCCGCCCACCCCCATACCCAGGTGGAAGTTTTCAGCCAAATCAAAGGCAGGCAGGCCAGAAGAAGCCGAAAGGGACTCCTTCAGCACATACCGGGAGGGAGGCCGAGCGGGGGGATGTCTGGAAATCGTTACCCACCCCCTCACCACCCCCATCCGCCGCCGCCGAGGTGGGCTGAACTGGCAGAGGGAGGAGGTGGCCCAGAGCACTGGGACCCTATAGAAAAGGGGGATGTTTCTGGTGGATTCCCTGATGTTCTGGGTGACTCCGCCCTTCCTCACACTCTCTTCCTTTATTTCTGGGTCTCTGTCTCCCCTATCCTTGGGGGGGGGGGGTTCTCTGTATCTCAAACTCTCTATACTCTGAGTTTCTATTTTTCCCTGCCCTCCCCCCTTCCTGCTGTCCTCTTCCTCTAGCCACCCCCCCCCACCCCGTCTCGCTTTTTCTCTGAGTTTTTGTGCCTCTTTTGAGGTCTCTACTCATTCGTCTCTCAAAGTCCCAGTCCCTCAGTGCCTGGATCTCTTTCTCACTAGAGTGAGATCTAGCCATCCACATGCCTGCAGGCCCTGCAATTGGCTAGGCTCCGTGTGGGCGGGTTCTGTCACCCCGGGCAACGGCAACAACAAGCCGGCTTGTCCTAGGCTCTGGGGCGGGGCTGGGACCATGGCGGGTCGGACCCTAGCTCTGCGCTATGGTCCTCCGCAGTCCCCCGTCTCCGAGACCGAGGTGTCTGGATCCTGGCCCAACTGGCATCTCACCAGCAGTGGCGTCGCCCACCACTTCATCCCGCCTGTGCCCTTTCCCCCGCCCACTGTGCAGTGCACGGTCACAGAGCCCCTGCCCCCGGCCCCAAAACAGGATTTGCATATCTGGGCTTTCGACGAGGTCATCAGCAGATGGGAGACAACCTCGGGCTCAGCTTACACGCCCAAGACCCTCGGCGGGCCATACGCGCAGCCGAAGGCCCCAGAACCTGCGGACCCCACGCGGGCTGTGGGGATCAAGGATTTGGGGGAAAAACTCAGACACCAGGGCTGGCGCCTCCCTCGGATCACAAAGCACCAGTGCAGTGAGGCCAGGGCGCAGTACACCGGCTGGCCCGGCCTGGACGGGCCTACAACCTTCCATATCGGGCCCCAGCCCCCAGAGCTTGCGGACCACCACCGCGGGGGCCCTTCCCAGGCTCTCATCCCCTGGACGAAGAACCCCGAGCTGAGCGGCCGGCCTTTCGCAGCATCTGATCAGGGCATCCTGGACTGCCATCAGCTCTATATGACCACTTCCGCTCGGGACTTCCGAACCTACTCGAAGAAGGAGTTGTCAGGATACCCTCGCAAGGACTCGCTGACCTACTGGAGCTTCAAGGAGACGCCCCAGGCCTGGGGCCACGGCCCAAAGCAGCCGTCCTATCCGTATTCCTCTTGGCCACCCGGGCCGCCGAAAACCCGCGTGCCCCGCGCCCGCCCAGTGATGCCCGCCGTGCCGCACCGCGGGGCGCAGTCTCTGGCTCAGGAATCCTACGGCCCCCCGCTGCACCCACTCCGCCGGCTCGACCGTTTCTGCCCGCTGAAGCTCCCTTGGGGAGGCCCCCACTGCAAGCCCGTGTCAGGCATTTACACCGTGCCGCAAGCCTACGGCACCGAGAACTCCAACTACGGCAGCTTGAAGCCGGCGCTCGTCTGAGCGGGCGGGGCCGGC
>XM_035987257.1 PREDICTED: Helianthus annuus cysteine protease RD19A-like (LOC110876098), mRNA 
TTTCTCACCACGTTAATGGCAGTTTGCAGATTACGAGTCTCTCATACGCTCCGACTTTCCTCTCACACAATCGTTGCAGCGGTTGTGTCTTTCTCTCTCATACGCTCCCCTAACTTCTCCCACTATAAAACTATCACCAATAACATCCTCTCCATTATACACCTTCATCTTCTCGAATTTTCTCTGATCTTCTCTCCCCTAATAAACCCAAATCAATAAACGGGTTTGTGTTTTCATGGTTCGCATTGCTGAAATTGGGATTCTAGGATTGAGATCTCGTCTCCGGTTTCCGGACGATGCTAGAAAAGCTCCGATTCTTCCAACGACTGATCTGCCGGAGGATTTTGATTGGAGAGATCATGGTGCAGTTACTGATGTCAAGGATCAGGGTTCGTATGGGTCGTGTTGGTCATTTAGTACGACTGCGGCGTTAGAAGGTGCAAATTTCATTGCTACAGGGAAGCTTCAAAGCCTTAGTGAACAACAACTTGATGATTGTGTCCATGAGGATTTCGGTGAAGGGTATAGGGGGAAACAGGTGGTGTTGGAGAATTTGAGGCAGCTTTGTGTTCACAGATTTGCTAATGAGACCAACAGGTGGTGTTAAAACACTACTACCCCAACTTGGGGATCGGAGTTGTTGTTACCTTTGTGGGATTTGTTTTTAAAGGGCATGATGGTCTTTTCAGCATTTATGTTCATAGTTCCGGTTTGTCTTCCAATTGGACAGAGCCAGAAGAGTCGGTTTTTTTTATGGCCGGAGAATTCCCAGCAAGGATGTCGAATGGGGGAAAGTAACCATGGTTGAAGCGGAGCGTCGGCTACTAGCTAACGCGCTACTCGATTTTTGAAACCAACGATTCGTTCTCCTCTCGGAGTCATGCATTCCGCTATTTAATTTCTCGACGATATACTCTTATTTAATCAACTCTAAACATAGTTATTTCGAGTCCTATGATTTGGCAGGACCAGTTGGCCGAGGGCGGTACAACTGGAAAATGCACCCGACGGTTAAATTTCATGAATGGCGAAAAGGGTCACAATGGTTTGAAATGAGCCGTGAGCTAGCAATTGAGGTGATATCTGACAAGACTTATTTTCCGGTCTTTATAGACTATTACAATGGTTCATGTTATGCAGACGAGCACTACTTGCCTACGTTTGGTACACTTAAATATGGGGAAATGAATTCAAACCAGACTTTGACTGACGATGTTCTCCTACAAACATGCAAAGTTCAACTTGGTGATTCATAAATAACCCCCCCCCCCCCCCCCGCCCAATAAATATAATCTACGTTTGGTTGTCATTGATAGTTTTTTTTAAATACTTTTGTAAACATGTAACATTGATAGATCTCATTTATCTTCATTTAATGGTTTTAGCAATT
>XM_040865634.1 Pseudomassariella vexata uncharacterized protein (BCR38DRAFT_77744), mRNA 
CTGGGGCCCTTGGCAAGGGCTGGAGTGCCACTCGGAGATTTCCATGAGGCTGGGAGAGACCCTGAAAAACGCGAACGCGCTCGAGAACCTGGCCAATCATGGCAGACTGTCCCACCAAAAAAGCTATTCCCTTTTCGATTTGCCATCTGAATCGCACTTTTACATGCTCAACTATCTCCCACATCACGCCCCGGTGAGCTGAACAGCATGGCAACCCAAGACGCTGCGGGTATTCCTCTCACGCATGCCGCGGATGGAGTGGGCTACAAGCTGTTGGAGCTACCCTCGGAACTGCTGGCTCTTCTCGAATCCGAAAACCCCCCTGTGTTGACCTTAGAGTCGTCCACAACCTCAGCTGTCCTCAAACACGGTAGCCAGACTTGGTCTCTTCGGCAGAAGAACACATCCAATGCCCTCATGCTCCTGTCCCCTTGTGAGACTGCGGCGTCGTCTTCAGATATTCCTCAAGCCGGACTCAAGATTATATCCACAGTCCATGACATGGTGGAGCTTACCACCGAAGGCGCGTCCGGCGCTGCTCCTGTTGCCAGGGGAAAGTGGCATGAGATGTTTGCTCGAGGCAGGTGACAGACAAGAGAGAATATGGGCAAGTCAAGTACCGGTTTTTTCTTCAAATGGTAATTTGAATAAGTCTTGGTGCTGGTGTGCTTAATGGCAATGATCTTTTGCTGCTCAAGATTGTTCATGGATGAGCATGGATGG
>XM_013015936.1 PREDICTED: Dipodomys ordii single-stranded DNA binding protein 2 (Ssbp2), transcript variant X1, mRNA 
TGTTCCCGGGGAGGCTGTGATGGGTTGACAGGTGCGTGACAGTGGGAGCTGCTCTCGGCACAAGCATGTACGGCAAAGGCAAGAGTAACAGCAGCGCCGTCCCGTCCGACAGCCAGGCCCGGGAGAAGTTAGCACTCTATGTATATGAATATCTGCTCCATGTAGGAGCTCAGAAATCGGCCCAAACATTTTTGTCAGAGATAAGATGGGAAAAAAACATCACATTGGGGGAACCACCGGGATTCTTACATTCTTGGTGGTGTGTATTTTGGGATCTCTACTGTGCAGCTCCAGAGAGACGGGAAACATGTGAACACTCAAGCGAAGCAAAAGCCTTCCATGATTATAGTGCTGCAGCAGCTCCCAGTCCAGTGCTAGGAAACATTCCCCCAGGAGATGGCATGCCAGTAGGTCCTGTACCACCAGGGTTCTTTCAGCCTTTTATGTCACCTCGTTACCCTGGAGGTCCACGGCCCCCACTGAGGATACCTAATCAGGCACTTGGAGGTGTCCCAGGAAGTCAGCCATTACTCCCCAGTGGAATGGACCCAACACGACAACAAGGACATCCAAATATGGGTGGCCCAATGCAGAGAATGACTCCTCCAAGAGGAATGGTGCCCTTAGGACCACAGAACTATGGAGGTGCAATGAGACCCCCACTGAATGCTTTAGGTGGCCCTGGAATGCCTGGAATGAACATGGGTCCAGGTGGCGGTAGACCCTGGCCAAACCCAACAAATGCCAATTCAATACCATACTCTTCAGCATCTCCTGGGAATTATGTAGGTCCTCCAGGAGGTGGAGGGCCACCAGGAACACCTATCATGCCTAGTCCAGCAGATTCAACCAACTCTGGAGACAACATGTATACTTTAATGAATGCAGTACCTCCTGGACCGAACAGACCTAATTTTCCAATGGGTCCTGGGTCAGATGGCCCCATGGGTGGCTTAGGAGGAATGGAGTCACATCACATGAATGGCTCTTTAGGCTCAGGAGATATGGACAGTATTTCCAAGAATTCTCCCAATAATATGAGCCTGAGTAATCAACCTGGCACTCCAAGGGATGATGGCGAAATGGGGGGAAATTTCTTAAATCCTTTTCAGAGTGAGAGTTACTCCCCTAGCATGACAATGAGTGTGTGATCCTTTACGCGTCTCCTCATGAAAACCACAGTGAGTCAGCCCTTCACAGAACTACTACGGAAGAAAATTATTCATCACAGTGTACAGTAAAGGAATCTCAGTCACACCAAACCAACCTTTTTATTTCCTGCTCTCTCCCCTATTTTGTGAAGAAAGCGGGTCCAAACGTGATTCAAACAACTGTACGGAGTGGCACATTAGAATTGCCCTAATCTGAACTGCAAATAATTATCTGTGTATGTATATGTGTGGGAAGGAGATTGTATCGTATATGTGGATGTTATATGGACATATACGCATACATGCATTGACCCACAGGACATTGTAAAATATTATCACATGACATCTTAAGTAGAAATAGGTAGGGACTTTTATTCCATCCTTTTTTTCACGTTTACATTTTAATTATTAAAAGTTGCTCCTGTCCCCTCCCTGAACTATTTTGTGCTGTGTATATCACTGCTTTATATAAGTTATTTTTTAAGGTGAACTCAGATGTTATGGTTTTGTAAATGTCTGCAATCATGGATAGGAATAAAATCGCTTATTTGAGAGCTTTCATTAAATTGTGTCTGATGCAAGTTATCCTGTGAATCCTAAAGTGTACTGTCTCAAGTAATGGAAGAAAGTATGCCTTTATCCTTATGTCAAATCAAACAATTTCTTGGTTACCTTGAGTGAAAAGTATTTTTGTATTTTTTTTTGTTTGAGAAAAACACTTCAGATCAACAAAAGCTTAACTGGGGCTTCAACAGTATATTTCTGCAATAACTACTTTAAATGGAATTCTTGATTTGTTTGTCTTAGATGATACAAAAATCATTAATTAGCTCAAATTACCTAGATCACAGCAATAAAGTGACAGGGGTTGTCAT
>XR_006051903.1 PREDICTED: Salvia splendens uncharacterized LOC121807657 (LOC121807657), transcript variant X48, ncRNA 
AATTAAAATTGCCTAGAAACCCTAAATTAAATTAAAAATATCCCTCTCCATCTCCCTTCCCAACGGCATCTCCATCTCCATATCTCAATTGGCAGAAATGACTCGTGTTTTCCCCACACCAAGAGTCATAGCCCTCGCAGATTTCACGCCGCCGGCCTGCTTGCCCGGAGAAGAAAGCCGAGGACTTGGCTGTCTCGGAGTTTGGTCCCCGCCGCGGCTGCTACTCGCCATCATCAGACGCCGTCGTCTCCTGCAGCAGGTCGCTGGTCCGGATTCGTGGGCAGCGTCACGTGGCTGCTGACTCGCGGCCTTGCCGCCGCTGCCAACTGCGCGAACCCATCGCCGTCCGCCCTCCCATCGTTTGATCCAGCTGAGCAAAGTGGTGACTTATCAAGATCCATGGGCATCCCAACTTTCAATCGAACTATGGCCTTCCTGAAATCCACACATATAGACTACAATGCCACGGGCTTATACTGGTGTTGGGAAATGAAGCTTTGGAAATCATAGAATATGCTTTTTCAAAAGATAGGTTGTGAAGACTTTTGACTTCAGCCTCACTGGTGCCTCTTCAAGATCTTGTAAATATGTCATGGATACTATGATGCAGACTTTTAAGAACAAGAGGCTTGCTTATGCAGTTAAAGAGAGTACTCTTGATAGTCTCATCATGGAACTATTGCTCCGGCTTTTGGATGATAGTAATCCCCAATGGATGATGGAAGTCAACTTTTAAGAGCTTTGAATGTTCTGATGTTAAAGATTCTGGATAACGTAGAATGTATTTCATCATTTCCTGTGCTTATATATCTGTCAAGACCTGGATCCATCAAGATGGCCATCTCCATCAAATGATCTCTTGAAATCAGGAACCAGAAGTTCTCTGATTTGGTTGTTAAATGTTTGATCATGCTCACAAAGGTTAAGGAGCCAAAACCAGAAGCTGTTCCTTAGGCTGTGGGTTCAGTACCCACTTAAGAGTGTAGCTGATGCACCTCAGGACCTTATCGATCCAGTTGATATATTAAAGCCTTTGGAGAAGTCTGGATTTTAGGAAGCGGTTAAAGCTTCAAAATGGTGGGAGAGGAAAGAGGCTGTTGCTGAACTAGCCGAACTTGCTTCAACCAAAAAGATTTCTCTTGGAGATTTTTCAGAAAGTTTGTCATACATTAAAGAAGGTTATCACGAATGTAAAGGTTACTGAAGGAAGGAAAAAAAGGAAAAAAAAAAGAAAACACATTGTTGTTGCAGCTGAAGCTATTCAAGCTCTGGGCAACCTTGGCATGAGAACCCTTCCTAAAAAAAGAAAAAAAAAAGAAAAAAAAGGAAAAAAAATGAAAAAAATAATTGCTGATGTATTTAAAGCTATTCAAGCACTGGGCAACTGTGCTAGAGATCCGAGAGCCCATTTTTCGGCCAATTGTTGCTTCTTATTTGCCTGTAAACCGCACCTCAGGACCTTATCGATCCAGTTGATATATTAAAGCCTCCTTTTTATAAGTTTGGATTTTGGGAAGCGGTGAAAGCTTCAAAATGGCATGAGAGGAAAGAAGCTGTTGCTGAACTAACCGAACTTGCTTCCACCAAAAAGATTTCTCTTGGAGATTTTTTCAGAAAGTTTGTAATACATTAAAGAAGGTTATCACGAATGTAAAGGTTACTGAAGGAAGGAAAAAAAGGAAAAAAAAAAGAAAAAAACATTGTTGTTGCAGCTGAAGCTATTCCAGCGCTCGGCAACCTTCCTAAGGGCATGAGAACCCTTCCTAAAAAAAGAAAAAAAAAGAAAAAAAGGAAAGTAAATGAAAAAAAGCAAAAAAAGGAAAAAAAGGAAAAAATAATTGCTGATGCATTTAAAGCTATTCAAGCACTGGGCAACTTTGCTGGGGATCCGAGAGCCCATTTTTCGGCCAGTTGTCGCTTCTTATTTGCCTGTAAACCGCACCTCAGGACCTTGTCGATCCAGTTGATATATTAAAGCCTCCTTAGGAGAAGTCTGGATTTTGGGAAGCGGTGATAGCTTCAAAATTGCGTGAGAGGAAAGAAGCTGTTGCTGAACTAACCGAACTTGCTTCCACCAAAAAGATTTCTCTTGGAGATTTTTTCAGAAAGTTTGTCATACATTAAAGAAGGTTATCAGGAATGTAAATGTTACTGAAGGAAGGAAAAAAAGGAAAAAACATTGTTGTCGCAGCTGAAGCTATTCAAGCGCTGGGCAACCTTCCTAAGGGACTGAGAACCCTTCTAAAAAAAAGAGAAAAAAGGAAAAAAAGGAAAAAAAGAAAAAAAGTAAAAAAAGGGAAAAAGAGAAAAAAAATAATTGCTACTGCGTATAAAGCTATTCAAGCATTGGGCAACGTTGCTAGACTTTTCAGAACAAGAGCCTTGCTTATGCAGTTAAGGAGTGTACTCTGATAGTCTCATCAATGAACTGTTTCTCTGGCTTTTGCATGATAGGCTTCCGGAGATGGATGATAGACGTCAAATTTTAACTGCTTTGAATGTTCTGATGTTAAAGATTCTGGATAACGCATAATATACGTCATCATTTCCTGTGCCTATAAATCTGTTAAGTCCTCTGGATCAATCAAGATGTCCATCTTCAGATCAGAAACTTAAAACCTAAAGTTCTCTGATTTGGTTTTTAACTGTTTGATCATGCTCTAAAGGAATCTGCAACTCCAAAGAAGGTTGTTAAAGTAACTTAACTGGTGGCATAGATGGACTTCCACGTGAAGATATAAGTGAAAAGGTCACCCCCACTTTGTTAAAAGGCTTATAGAGTTCTGATTGGAAGGTCCACTTGGAATCTATTGAAAATGTAACCAAAATTCTGGAAGAGGAGAACTGGAATTGGAAATCTATTTGGAGCTCTATAAGGGCGTCTACACGACAGTTCTAAAATTTGATAATTGCTACTTTGTCCACAGTTGGTGCTCTTCGGACTACAATGGGACATCCGGTTGAGAAGTCAAGCTAGCTCCTGTGAAGGCTTGATCATTTACACGAATGTAGCTCGTGCAAGGGATTCTTTCAGATTTTTCTGATGTCTTGAAATGCCTTGGTGACAACAAAAAGCATATGCATGAGTGTACATCTAGTACCTTAGATACTTGGCTTGAGTGTATATCTGGCCAATGTTGTCAAGTCACCACGTAGCCAAAGGTCGAGGTTCTAGGTTTTGTGGGAACCCAATTTATGTGCATCACTGATTCTGACCAACCATCTTAAGCTTTAATGAATTGAAGCTGCCTTTGTAAATGCTCCTCAGGACCTTATCGATCCAGTTTATATATTAAAGCCTTTGGAGAAGGCTGGATATTGGGAAGCGGTGAAAGCTTCAAAATGGTGGGAGAGGAAAGAGGCTGAACTAGCCGAACTTGCTTCAACCAAAAAGATTTCTCTTGGAGATTTTTTCAGAAAGTTTGTCATACATTAAAGAAGGTAATCACGAATGTAAATGTTACAGATGGAAAAAAAAGAAAAAAAACATTGTTGTTGCAGCTGAAGCTATTCAAGCGCTGGGCAACCTTGGCATGAGAACCCTTCCTTAAAAAAGAAAAAAAAAAGAAAAAAATGAAAAAAATAATTGCTGACGTATTTAAACCTATTCAAGCACTGGGCAACTGTGCTAGGGATCCGAGAGCCCATTTTTCGGCCAGTTGCTGCTTCTTATTTGCCTGTAAACCGCACCTCAAGACCTTATCGATCCAGTTGATATATTAAAGCCTCCTTAGGATAAGTCTGTATTTTGGGAAGCGGTGAAAGCTTCAAAATGGCATGAGAGGAAAGAAGCTGTTGCTGAACTAACCGAACTTGCTTCCACCAAAAAGATTTCTCTTGGAGATTTTTTCAGAAAGTTTGTCATACATTAAAGAAGGTTATCACGAATGTAAAGGTTGCTGAAGGAAGGAAAAAAAGGAAAAAAAAAGAAAAATACATTGTTGTTGCAGCTGTAGCTATTCAAGCGCAGGGCAACCTTCCTAAGGGTTGAGAACCCTTCCTAAAAAAAGAAAAAAAAAAGAAAAAAGGAAAGAAAATGAAAAAAACAAAAAAGGAAAAAAAGGAAAAAATAATTGCTGATGCATTTAAAGCTATTCAAGCACTGGGCAACTTTGCTGGGGATCCGAGAGCCCATTTTTCGGCCAGTTGTCGCTTCTTATTTGCCTGTAAACCGATGTCTTCCCTATCAGCACCTCAGGACCTTGTCGATCCAGTTGATATATTAAAGCCTCCTTAGGAGAAGTCTGGATTTTGGTAAGCGGTGATAGCTTCAAAATGGCGTGAGAGAAAAGAAGCTGTTGCTGAACTAACCGAACTTGCTTCCACCAAAAAGATTTCTCTTGGAGATTTTTTCAGAAAGTTTGTCATACATTAAAGAAGGTTATCACCAATGTAAAGGTTACTGAAGGAAGGAAAAAAAGGAAAAAAAAAAGAAAAATACATTGTTGTTGCAGCTGAAGCTATTCAAGCGCAGGGCAACCTTCCTAAGGGTTGAGAACCCTTCCTAAAAAAAGAAAAAAAAAAAAAAAAAGGAAAGAAAATGAAAAAAACAAAAAAGGAAAAAAAGGAAAAAATAATTGCTGATGCATTTAAAGCTATTCAAGCACTGGGCAACTTTGCTGGGGATCCGAGAGCCCATTTTTCGGCCAGTTGTCGCTTCTTATTTGCCTGTAAACCGATGTCTTCCCTATCAGCACCTCAGGACCTTGTCGATCCAGTTGATATATTAAAGCCTCCTTGGGAGAAGTCTGGATTTTGGGAAGCGGTGATAGCTTCAAAATGGCGTGAGAGAAAAGAAGCTGTTGCTGAACTAACCGAACTTGCTTCCACCAAAAAGATTTCTCTTGGAGATTTTTTCAGAAAGTTTGTCATACATTAAAGAAGGTTATCAGGAATGTAAATGTTACTGAAAGAAGGAAAAAAAAGGAAAAAAAACATTGTTGTCGCAGCTGAAGCTATTCAAGCGCTGGGAAACCTTCCTAAGGGCCTGAGAAACCTTCTAAAAAAAGAGAAAAAAGGAATAAAAGGATAAAAAGAAAAAAAGTAAAAAAAGGGAAAAAGAGAAAAAAAATAATTGCTACAGCGTATAAAGCTATTCAAGCATTGGGCAACGTTGCTAGACTTTTCAGAACAAGAGCCTTGCTTATGCAGTTAAGGAGTGTACTCTGATAGTCTCATCAATGAACTATTTCTCTGGCTTTTGGATGATAGGCTTCCGGAGATGGATGATGGACGTCAAATTTTAACTGCTTTGAATGTTCTGATGTTAAAGATTCTGGATAACGCATAATATACGTCATCATTTCCTGTGTCTATAAATATGTTAAGACCTCTGGATCCATCAAGATGTCCATCTTCAGATCAGAAACCTAAAACCTAAAGTTCTCTGATTTGGTTTTTAACTGTTTGATCATGCTCTAAAGGAATCTGCAACTCCAAAGAAGGTTGTTAAAGTAACTTAACTGGTGGCATAGATGGACTTCCACGTGAAGATATAAGTGAAAAGGTCACCCCCACTTTGTTAAAAGGCTTATAGAGTTCTGATTGGAAGGTCCACTTGGAATCTATTGAAAATGTAACCAAAATTCTGGAAGAGGAGAACTGGAATTGGAAATCTATTTGGAGCTCTATAAGGGCGTCTACACGACAGTTCTAAAATTTGATAATTGCTACTTTGTCCACAGTTGGTGCTCTTCGGACTACAATGGGACATCCGGTTGAGAAGTCAAGCTAGGGGATTTTTTCAGATTTTTCAAATGTCTTGAAAAGCCTTGGTGACAACAAAAAGCATATGCATGAGTGTACATTGAGTACCTTAGATAATTGGCTTGAGTGTACATCTGGCCAATG
>XM_013088457.2 PREDICTED: Aplysia californica ubiquitin carboxyl-terminal hydrolase 5 (LOC101848919), mRNA 
GAAGTAATTCTGTTGTACCGCTTCTCTCAGTTTCAACATGGAGTCCGGTCTGTCCGAACTAGCTAAGCGATTGCCCGGTATCAAAGCCCCTATAGGGGGTGAGAAAGTCTACAAGGATGAGTGTGCATACTCATTTGACAATCCGGAGAGCCCTGATGGTTTGTATGTTTGCATGAATTCCTTTCTTGGAATTGGAAAACGTCACCTACAGCAATACTATGAGAAAACTGGGAATGGGGTATTCTTGCACATCAGACGTTTAAGAAAAGAGGTGCCCAAAGATGAGACGGCTGAGGAGGAAAAGCCAACCAAGATGGCCATCGGAGTGGAAGGTGGCTTCCAAACAGATGAGAAAAGATTTGAGTTTGAGGAGAAAACGTCCATCACCATCTTGCCCCAGTGGCACGAGATCGCCTTCCCCAACCCACAGATCCCTGATCAGGCCCAGCTGTCAGCCACCATGATTATGATGGCAGAGGATGCAGCCAAACAGGAGGAGGCCGCGGCCATGGCGGGAACGTGGGAGGGGGAAAAACTGAGGGTGTCGAAACACGCGGAGAACCTGCTTCAGCTGCCAGTGGAGAAGAAGATCCCCCCGTCGGGCTGGAAGTGTGAAAAGTGTGATCTGACCTGTAACCTCTGGCTCAACCTGACGGACGGCTCCATCCTATGTGGCCGGAAGTTCTTCGATGGTTCGGGGGGCAACAACCACGCGCTGGAACATTACCGGGAGGTGGGCTACCCTCTGGCCGTCAAACTGGGCACCATCACGGGCACAACTGCAGATGTGTTCTCCTATGAAGAGGACGATATGGTGGAGGACCCATACCTGGCCAAACACTTGGCGCACTTCGGTATCAACATGGCCGCGCTGGAGAAGACAGACAAGACCATGACGGAACTGGAGATTGACATCAACCAGAAGATCGGGGAGTGGGATGTGATTCAGGAGGCCGGCAGCGTGCTCACCCCAGTCTACGGGCCTGGCTACACGGGCATGCGTAACCTAGGCAACAGCTGTTACATGAACTCGGTCATGCAGGTCCTCTTTACGCTGCCAGACTTTCAGAAACGGTACTTCAGTAACTGTGGACAGATTGTGTCCAACGCCCCCCAGAATCCTGTCTCTGACTTCAACACACAGATGACCAAGCTGGCAGATGGTCTCCTCTCTGGTGTATATTCCCAATCAGTAGATACCAAAGAGGCTTCAGAAGGGGATGCCAAGTACATTCCACCCCCCAGCGGAATCCGCCCTCAGATGTTCAAGACGTTGGTGGGCAAAGGTCACCCGGAGTTCTCCACCAAGAGACAGCAAGACGCGCAAGAGTACTTCCTACACATGGTCTCCGTTATACAGAAAAACAGCCGGGGCGGCGCGAATCCTTGTGAGTCGTTCCGGTTTGAGGTGGAAGAACGCGTTGCTTGTTCCTCCTCCCAGAGGGTTCGCTACACTCGCAGAGAGGACTTCTGTCTATCCCTGCCCGTGCCCATGGAGGCTGTGTCCAATAAAGAGGAAGTAAGGAAATACAACGAGTCCAAAGCTGCTGGGGCAACCATTGTTGACCCAAAGAGCATTGTGCGTCCAGTGATCGCGTTCTCCGAGTGTGTTCGAGCGTTCACAGAGGCAGAGACGGTGGAAGATTTCTACAGTTCTGCCATACAGGGCAAGACCACAGCTCTCAAAACGACGCGTCTTTCATCGTTTCCTGATTACCTGATGGTGCAGTTGAGGAAGTACACCGTCGGCGATGATTGGGTGCCGCGGAAACTGGATGTGTCGATCCAGGCTCCAGATGTACTTGACCTTTCCTCCCTGAGAGGTCGCGGTCTGCAGGCTGGGGAGGAAGAGCTGCCCCCAGGGGATTCCCCGCCAGAAGCCCCGGTGGAGATCCAGGAAGGCACGGTGACCCAGCTGGTGGACATGGGGTTCCCACGCGAGGCGTGTCGCAAAGCCGTGTACTTCACCAACAACACAGGCGTGGAGGCAGCCATGAACTGGGTCATGGAACATATGGACGACCCAGATTTTGCTGCTCCCTTTAACCCTGCCCCTGCGGGCGGAGGTGTGAAGGGAGGCGCGTTCGAGCCCAATCCAGAGGGACTGGCCATCCTCGTGTCCATGGGCTTCTCCTCAGAGCAGGCAACAGTGGCCCTCAAAGCAACCAGCAACAATGCGGAGCGAGCCGTAGACTGGATCTTCAGCCACCCGGACGAGCTGAGTCAGCCCATGGAGACGGAGGAGGCCAGCGCCCCGGTCACTGCCGCTAACTTTAAAGATGGGTCAGAGAAGTACCGACTGGTGGCCTTCATCAGCCACATGGGCACGTGCACCAGCGTGGGTCACTACGTGTGTCACATCCTGAAGGAAGGTCGCTGGGTCATCTACAACGACGAGAAGGTGGCACTGTCGGAGCAGCCGCCCAAGGACCTGGCCTATCTCTACCTGTACCAGCGCATGTAGGACATTGAGGGGGGGAGGTGAGAGTGTGTGAGGGAGGAGGACATTGAGGGGGAGAGGTGAGAGTGTGAGGGAG
>EF220307.1 Uncultured alpha proteobacterium clone FB-2_C04 16S ribosomal RNA gene, partial sequence 
AGGGTACGGGAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGTTACCGACGCTCAGGCGCGACAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGATGCTAGCCGCTGGTAAGCATGCTTATCAGTGGCGCAGCTAACGCATTAAGCGTCCCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGACGCAACGCGCAGAACCTTACCAGGGTTTGACATCCCGCGCTAAACTCAGAGATGGGTGGTCCCCGCAAGGGGCGCGGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCTCCTTTAGTTGCCATCATTTAGTTGGGCACTCTAAAGGGACCGCCGGCGACAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTACACCCTGGGCTACACACGTGCTACAATGGCGGTGACAGTGGGCAGCGACCACGCGAGTGGATGCGAATCCCAAAAAACCGTCCCAGTTCAGATTGCACTCTGCAACTCGAGTGCATGAAGGTGGAATCGCTAGTAATCGCAGAACAGCAGGCTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGTTCTACCTGAAGACGGTGCGCTAACCGCAAGGAGGCAGCCGGCCACGGTAGGGTCAGCGACTGGGGTGAAGTCGTAACAAGGTACCAATCCCGCGG
>KU308505.1 Uncultured Alphaproteobacteria bacterium clone 0107 16S ribosomal RNA gene, partial sequence 
AATGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGATCTTCGGATCTAGTGGCGCACGGGTGAGTAACGCGTGGGAACCTACCTTTTAGTACGGGACAACGTTTGGAAACGAACGCTAATACCGTATACGCCCTCCGGGGAAAGGCTTGCCGCTAAAAGAGGGGCCCGCGTCTGATTAGCTTGTTGGTAAGGTAATGGCTTACCAAGG
>FQ227369.1 Rattus norvegicus TL0AEA13YJ12 mRNA sequence 
CAAAATAGTTAAGATGTAGATCTCCTCTTTTACTGAAGTAATTTATAATTTCTGGCTTTTGGACTGACTGTCAGCCATCAAAGGTTTGAAATTAGACTTAGTTAAATGGTTCTTACCGTTGGAGCTCCCTGGCCTCCTAACCCAATTAATGAGCTCCGTGTTCACATAGATGATAGAGGACCAGTTGCTGAGGACACTGCTGTAGCGCATGCAGCAGCACCACATTAAGAGTCACATGGAGACAACATCACTAAATAGATACGAATCTTACGTAGAAATAAAGGGCAAGTGAGTCGAGCCCAGTGTCTGTTTTAACAGAAATGATCTGCTCTGCAGTAGTGGTATAGGTCTTTAATCTTAGCACTTGAGAGGCGGATTCAGGTGGACAGCCATGGCTACACAGAGAAACCCTGTCTCAGGAATGGAAAAAGTCAAACATCAAGGATGTTTCATGTGATTTTGGTATGTATTCAATTTTGGAACTCTCTTCTGGTGGTGTAACATACAGAGTTGACTTGGTTTTTTATTTTTGTTTTCTTGAAGAAAACAGGGTTTATCTGTGTAGCTCTGGCTGGCTTCTATCTATTGGATTAAAGGTGTTTCCACCTCTGTTCGACATCAGTTTGGTTTTAGGATGAGGCATATTAACATAATGTTTCACTGGGCTTTTTCGTTCCAATGGGAAATTAATAAAAACCTGTGGATAAGGGTTGGGGATTTAGCTCAGTGGTAGAGCGCTTGCCTAGGAAGTGCAAGGCCCTGGGTTCGGTCCCCAGCTTTGAAAAAAAAAAAAAAAACCTGTGGATAAGCAGCACAAGTCAGATTTGAGTAGTTTAAATATGACAAAAAGGACGCAAGACGGGTTGGACATAGTTAGGAATGAGAGATGGATATTTTAAAATGTTAGGAAATTCTCAAGGAATAAAATTACTTTAAAATTACTGATAACAATCAGACATTCTTTAGTATGATTCTCCTTTGATACTGTAAGCAAGCACAGAAGTTTAAGAAATAACATAAGGGGCTGGAGAGATGGCTCAGCAGTTAAGAGCACCCGACTGCTCTTCCAGAGGTCCTGAGTTCAAGTCCCAGCAACCGCATGGTGGCTCAACAACCATCTGTAAAGAGATCCAATGTCCTCTTCTGGTGTATCTGAAGATAGCTACAGTGTACTTATATATAATAAATGAATAAATCTTTTAAAAAAAAAAAAAAAAAAA
>JX483172.1 Uncultured prokaryote clone Cluster11712 16S ribosomal RNA gene, partial sequence 
CGTCAAATCATCATGCCCTTTATGACCTGGGCTACACACGTAATACAATGGCGCTTAACAACGGGAGGCAAAATCGCGAGATGGAGCAAAACCCCAAAAAGCGTCTCAGTTCGGATCGCAGGCTGCAACCCGCCTGCGTGAAGTCGGAATTGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTT
>XM_030995465.1 PREDICTED: Strongylocentrotus purpuratus uncharacterized LOC105441690 (LOC105441690), transcript variant X2, mRNA 
ATAGCAATGGCTGTCGACGGCCTGGCGATTCAAACTATTTGGATGAACGTAGCTGCATTTTGTTCCCTGAGTGATCTTGGAAGATTACAGTCAACATGCAAATATCTCAACGCGATTCTTTCATGCAATTCAGTTTGCTGTGGCGCAGGGCCGAGTCCTCGCGGCACATCCGTTTGCGCTCGGCGTTGTCTACAGTAGTTCCTCTTCGCAGACTGAAGGCGTGTGATGCAAGGTTCCTGGATGCTGCAACAGATCACATGCTGCTTGGTGGCATAGCTCAGAAAGATAACAGTTTTGCTGAACTCTGGCCTTTCCTGGAGTCTGAGAAGAAGGCCTTCTACAACCATCGAATCGCGATGCTACTGAGGAAGGGGCGGAAGGGGAGAGAGAAATGCTTCTCACAGGTCTCAGGGTTGGAGTGTGGCATGCCGCTGCAGTTCTGCTCTCTGAACCTGCTGGGAAGCGGATGGAAAGTGCGGAAGAGGGTTCTGCAAGCCCTTGAGGACACCACCAATGCTGCCATCAAGATCGGTGGAATCAAGAACTCTGAGCTGAGGTGTAGCCTGCAGGAGTTATTCCGTCCAGGATTGATCAGAGACTTCTCTCAAGAAGCGGAGCCGATCTGTCTCCGAACCCCCATCAATATGATTCCAAAAGACCTGGAAATAGTCAAGGACCTCTTCTTTCGTGTCCTGGGATACACTTGCATCTTACCGTTCAACGTAGCATCCCATGTCAGCGACAACGCCAGAGCAGAGACATGCCTCATTATAGAGAGCTACGTCCATCACACTGTCATCACACCCATCATCGATGGCATTCTGTGCTCAGACCTGGTGAGATGCAAACCCATCGGCTTTGCTCATGTCCTGGATTATCTGGTTCTAAGTTTGGTAGTGAAGAACCCAAACCTCAGTAAGATCAGAGCGCCATCCCTCATGCTGAACACGAATCCTGAACGCATGACCCTTGCCCTTTCACCTGCTCGTGACCTAATGGCTGCCGTCCGTCCAGAAAACCCTTCAGAGTATGCCTACAATTCACAGCTTGGTGTTTTGCAGTCAGGTACTGCACTTCAGCTCAAAGAGAGCATCCTATGCGTCTTCCAAGGAATCGACTCGTGTAAGCGCTCAGAGTTCCTAGTCCTTCTGGCAACCGAGTACATGTACAAGTGCCTTGACCTTGTCTCCATGGTAACCGAACTCCTCGGCCAGTTTGACCTTCTCAACGTGCGGCGATTGGTGAGTCGCATCTTCTTCGTCGGGGAGAACACGCGGATCGGTAGCTTCCGGGAGAGGTTCGAGAGGGACCTGCGGGTGAGTCTCAACCGGTTGGGGGCGGTGTTCGGAGGAGAGTTTGCCAGGCAGCAGCGATGGCCGATACACTGCGTACACGCAGAGGTGGAGGACAGACCAAACTGTCTGTTTTCTGATACCTTCACCACCATGGACTATATCCTTCAAGGCCCTGATTTCTTCTGAATCTCCCTTTATTTCTTTTTTAATTATTTATTTGGTACTTTCAAGAAATATAACAATAAAACAATATAATCATGGTGTTTACAAAATTAGAATGACAACAATTATACAAATACAACTGTTTGTAGCAATATTCTAAGTGCAAAAGATGGCAGCCAGGGAAAAACAGAGCAAACTTAATTACTGTAACCGTAATGGTCTCTTTGCCAAACCAACTGATGCACTCAGATGGTGCCTCCTCCCCAATGAACACCCTATACAAAGGGTAGTTAATATGAGGATATGCAATTGACAACCATGAACAATACTTTCCAAATCACAATTTCTGCAGGATCTTCCTTTCAATGCACCCATTTGAGGCTTGCCTCTAAGGAACATGCATGTCTACATCCTATATAAAGAAAAGTCAGCAGAATCTGCAGTTTTACAAAATAGCACATATCTTTCAGGACCCTAATTTCTTTTAGGTCTCAAGGAACATGGATGTTTTGTCCTATCCAGCTGATAGAAGGGCTAATGTGCAATTTACCGTCATCAATATATTCAAGGCCCAAATTTCTTTTGAATCTCTCTTTCAGTTCATTCATTTGAGCCTTGTTCCATAGGAACATGGAACATTTTTTTTATTATCTAAAATCCAAAGGATAGTTGAATAATTCAATTTACCTTCATGGGCTATATCTTTTAAGGTCCTAAACCTTTCCCAGCATTCATTCACCTATTCATCCACCCTTCCTTCCATCCATCTGTTAGTATCATATCCTTAATACCGGAGTTACATACTAGTTATATTTAAGAGGCCTAAATAACAAGATGTTACACAAAGGTTCTTCATTTACTGCATGTATTTCACTTTTACAAGTCTGCCACAAGGTAGCGCCATTTCACTATCAATATTGGGATATATTAATAATCTCATTACACCTTTCCTTCTTTAAAGAAGCATGTCATTATATAAACTAAAATAATACCAACAATGTTGCTCAGAATTAAGCAGTACTGAAACATTTGAGTATCTTATATAAACTTTCAAAACCTGTTCTTTGTATTGTAAATATGTACATGTATGTGTGTATTCCTAAAAAACCAGCTCACACATTTTGGATATAATAACAAGTGATTCAATTATCACTGAGGTATAAAGCTACTGAAGCGACTTCAACAAACTTATATTTAAAACTTAATATACACAGCAACTCCACAGATGAACTTCCTTAATTCTTACTTACTATTAAGCTGTTCTTTGTTCAGTTGAGTTTCTAATCTTTTAGATATGCTGGCTGTTTTGTCTGCCACTGACTTCTGCAGAATTGATCCGAGTTCTGCCCGGAGTTGTCACTACTCGATGTCGTGTTTGTTGGTGATGTGGTTGGAGATGTGTTTTGAGGATAGTCCGTTACGGAAGATTGTTGATCCACAACCAAGTCACTATTATCGTTGAACTGTTCATTTGATTTTCGATGTTCAGTTCTGATGGAGTACGACCGAATACCGACTTTCTTGAGTACAATGGCACTTTCCCAGGCCCTGGCATCCTTTTTCGGCTTGACTATTACGGTATCTCCAACTTTGAGTTCAAGCAGATCTTTGGCACTGCGGTTATAGTATTGTGCCTGCTTTTCGCGATTCTTCTCTTTTCGTTCATCAATGTCTGTTTGCAGCTATACGAGGGTCCATTGTCAGCTAGGACCGTTTCCGGGATTCGTCAAATTCCTCTGCAATCTAGTTATCACAGCTGGCGCATCCTTCTTCCCGGTCCCAGTAATCCGAAAAATAGTCCACTGTACATAGATAGTCATGGCCATCTAGCGCGAAAATGTCACATCCATTTTCTGCCATGGACGCGTTGGTAATTCATGGTGTATGAGGGTTTCCTTCCTTTGTGATGAAGCATATATGTTGCATGCTTCACACCACGATAAGTAGTCTTTCATGTCGGATGTCATATTCGGCCAATAGACACATTCCCTCGCTCTTTGTAGTGTGTTCTCGAGGCCTGTGTGACTGGCATGTAGTTTCTTGCGAATTTCACCTCTCATGTCCGTGAGGATGACACATCTCAGTACTTTGAACATGATACCGTTCGCGCTTGTTCGTGACGAATGCTGAAGAACGGTTTTGCCTCTGACGTACAAGCCTGGCTAGTGCTCGGCCATCCTGAAGCAATATAGTCCATCACTGCTTTCAGGGCTGTATCGCGTGCGGTAGATTGGCAGATCTCTTGTTGCGATATCTGAGATACGGGAATTGCATCAATAAGGTGAATACACTCGACCTCTTCTTCAATGCCTGATCTTTGAGGTCACTAGTTTTATTTCTGAAAAACTTGTTTTAATCGATTTAAAGATATTGGGTATTGTCGTAGTACGTGATGAGACAGTAAAGGAAGCCCAAGAGACATTTGTTAGTGTAACTGGTGCTTTATTTAAAAAACGTTAATTCTCGGTGTCCACACACAGAAATGAAATGTCTACAGCAAATAACCCACTGAAGCCCCCAACTACAGTCCGGCATCCTCAAGGAAAGAAGGAAGACACCATGCAGCCATCAATCTACTCAGCAACACAAACTGCAAGTCCTCTTGCCCTCATAAAGACTGCCAAACAGTTGAACTAAAACGTTCACCAAAAGTAACTGCAAGTTTCTCTAGCACAGGCACAGCCAAAACATGCACTCTACCCTTGAACGTGACAAAATGTGCTTCAATACAAACATGTGTGTTAAGACATTAACGTGGGCGGTGTATTACAAAATCAATTACCCATCCGCGAAACCATGTGTAACATGTGTAGTGAACTAATTTGCATAATCCACCTGATCTTGATAGCAACTTCCACACAATCCTCAATTGGTACTTCAATGTCACGAACACCTCTTGGTACGCTCGAAAAAGGAAGACCGGGCTAGATTTCCGCTTTGTTGTATAAACCCAACAATATGCCAGTTGAGTAAATTTATTCAACCTGTAAGTAGAATAAAGATAAACATCTTCAGTATACATCACGCAAAATATATATGTATGCATTTACTCTGTTCATGCATAATTAAAAGCGTTAAATTGCAATCATTGGCGGATGCTGATCTGGGCCCCTGAATCTAGGAGCACATTTCCTTCTCTCTTTAGCTGGTCTGTTCAAGTAAACCTAGCATGGCTTCCATCCCTCTTACATGGGCTACTCCCACTGCATTGTTGTCCATACTGGGGTGTAAAAGCGGATGATGGAAGAACTTGCACGGTTGCCCTTTTTATGTCTCTGGACACTGTCTCCTTTTCTTACAAGTAGCCATCCGATGCTCTGTACCGGCTTGCCTTAAACAGCTATAACAAGCTCGGCTGCTCTTCACCAACTCCAATCTCTCTGCTGTAGACTTATCAAGGAAAGTTTTGCATTGATCAGTCCAGTGCCATCCTTACTCTTGCAGATCCAGCAGCGATAATCTTGCTGTCTTTCCTCAACTGTTGTGACCTGATTAACAGCGGATCTGGACTTGGAGGTTGAATCATTCCTCACTGGAGCAGATGATCCTTGAGGATTCTCTCCTCCCTGCATAAGACTTTCTCCTTGGCCACTCCTCCCAAATGATCGACTAAGGACGGGCCTTTGCAGCATCTTTCAGCTGGTAGTGCCGACAATAACTATCGAAGTTGTCCAGCCACCCCTGCAGAGACAGATCACCAGCAACCTGTGGAGAACCCTTAAACTTGCCCACCTTAACTGGTGGTGGCGCCTTCTGTACATTAAGTCCTTGCAGAACACTGATTAGTGTCTCTAATATCTGCACCACTGATACGGCCATCGTTACAAAGGCTGTAAAGGTACTAGTGGGACAAAACAGATAAGTTACAAGTTACTATACTAAAAGTACATAATAATAATACAAAACAAACAAAATACAATGATAAACAATTACATATCAGACATAACAAAAATTACAAATAAACCTACAAATTA
>AK346643.1 Sus scrofa mRNA, clone:MLN010029B10, expressed in mesenteric lymph nodes 
TAGCTGAGACACTGCCATGTTTCTCATGTACTTAGAGAAAATTCACAAGGTTTTATTTTATTTCTTAGGTTTTGCAAATATACATATAGGGAAAAATGAAAATATAGAAAAATGTGAAACGTAACCAATTCTGTCTATATGGTGGGATGGGTTTTTTTTTTTTTTTTCAGAAACTAAGTTTACTGACAGGATTTTACTTTAATTTTAGTAAATATGACTAATTTAGAGGCGTTAATCCCTTATGAGGTCTTGGGATTCCTAAGTCATTGTGTTGGAAACTGTCTGGGAAAGACAAATAGTTAAGATACGTAACTAGGATCTCATGTTTTGGATTTGTACTGAATGACGTCAGAAGGAATGTGGTAACTGTAGTCTCTCCATATTTGAAGCCTGTCAGAAAAAGGAGAAATTATAGAATTTTGTTCATTCGTTTTAAATTTCAGGAGGCAGTGTCGGTCACTGGAACGGAGGACAGTGGTGAAGGCAGGTGTAAGTGAGGGAAGGAGGATGAGGAATGCCGTGAGTGGAAGGAGGCAGCCTGGCGTGGAGGTAGATTTTAGCTCATGTGAAGCGAGATTGCTTGCTGACCGGTACAGAATTATCCAAGGATTAAACTACTTGATGAAGTCATGAGCCTTTCCATCTCTACAATGGTTTTCTCTTTAAAATATAGGTTGCCGAAGGATCTAAAAATGTACGGCTAGGTTCCCTCATTGGGTTGCTAGTTGAAGAAGGAGAAGATTGGAAACATGTTGAAATTCCCAAAGACGTAGGTCCTCCGTCACCAGTTTCAAAACCATCAGTGCCTCCTCCCCCCTCACCACAACCACAGATTTCTACCCCTGTCAAAAAGGAACACACACCGGGAAAACTGCAGTGAGTATACTTACTTGAATGATGTTAAAAAAAAAAAAAAAAAAA
>XM_010884186.4 PREDICTED: Esox lucius IQ motif and ubiquitin domain containing (iqub), transcript variant X3, mRNA 
GGGTGGGGGCGTATGAAAACGTTACGCCAGTGCTTCTTAGATCACATGGATGTTACCATGGGAGCGCCCAAACACTTGCAGCATTGAATCAAGTGAATGGTACTGTATGCATGCGGCACCAAAGACACGAGCTAACGTTAACGTTAGCCAGTTACCCATGTCCGAACATGATGCAGAAACTTCGGGGATCAAAACTGATGAGCAAAATGAAAAAGAAGACCCTTTGTACCACAGATTAACCGAAATAAGTGAGTCTCAGTTAGAAAGCAACGCGACAGAAGAACCACCTACAGATGTAAGTCTTACGTTACATTTACAAGATAGCGATGCTGGGGGAAAGATTGAAACACAAAATGTGATGATGGAGGAAGAGGTATGCAAGTCAACCTTTTTGACTGAGAATGGGAACTCGGTGGAGGCTACAGCTCCAGCAGACCCTCTGGAGGATAACAGGCAACAAGGAGCATTACCAAAGAAAGAGTCCTTCCCAAATGCTGTTGGGAACTCAACAGCCACTGTGAAGATCATGCTGATGCCAGAGGGACACATGATGACAATGGCCTTTGCCATTGGGCTCTCCATCAAAGAGTTGAAGTGTAACTTCTCAAATGAGCTAAAAGTACCAACAGAAGTCATACAAATATCTCTGAGTGGCAGAGTGATAGAGGACCACAGAAACCTGATAGAGCTGGGAGTGCAGCCTCATAGCACCGTCCAGTTGGAGATGACCTCCTCTGACCCTGACAACCACCCCATCCGTCCTATGAAGCCCCGGCAGGACTACAACATGCCTGACGTCCTCACTGTCCGAGTCCAGACAGACTCGGAGACAGACACATTCCAGGACGTTGTGGTCGAGGTTGAGAGGGTCACCCACAGGAAGGCTTTTCTGGGGGGCTACAGGCACAAGGCCACAGGGACGGAGTACCACCACGCTGCTGTACAGACTATAGCCAAGAAAAAACCAGACGGGGGGGTGGAGACTTTCAGCCGCGACACACAGACTGTGACGGTGAAGAGCCAGTCCCAGCAGTGCACCAACAGCACATCCACCCAGATGACCAGGATCGGCTGCTACGTATCCAACATGGAGGACAAGCTCATCTCCCCTGGGGCCTACGTCACCGCCGCCCAGTACCACGCCAAGAGACTGAGAGCTGTGATCACTCTGCAGACGCACACGCGGCGCTGGCAGGCAAAGCGGATGACTGACCAGCTGAGGGCCGACAGGGATCTGCGTCTGGCCTGGATGGAGCGAGATGGGTGTAGGAAGAGGAGGGAGAAAGAGGAGCAGATCAAGGCTGAGTACAACAGGAGGATGAACCCAGAGAGCAGGGATGACTTTGCACTGCTCTACAGCGCCCTGGAAAAGTGGAAGAAAGAGGAGTTGGAGCGAATCAATGCCACACTGGAAGGTGCTGAGAGGAAGGCTGCTCTGTGTGCGCTACTGGAACAGGAAACGCAGCTAATTGCATCCATTGGACGCCACCGAATAGCTGCTGGGGAGAGGAATTACCACAAGGCCGTTCAGGCCTTCCTTGAAAAGTGTGCTGCCCCTAAGAGGTGGTGTGCATTTGATGGGAAGATGACCCAAATGGAAACCCAGTACACCATCAGAGCCAAGAAGCTGAAAGAGCTGTACACCAGCATCAACCTGCACTACTTCAACCACGAGGAGAGGCTGGACGTGCTGCTAACACTTAAACACACCGTCAAGGAGCATGACTGCAAACTTACCCAGGACATTGTGGAGTTGATTGACAGAGAAGCAGACCTGCTGTTGAGGGGGGTGAAGAAGTCCAATCTGGAGGGGCTAAGGAAGAGAATTTCCACCCTCTTCCTCCAGTACATCAAAAGCCCTACCTTTAACCCTGAGGCGGCCAAACTACTGAAGGTCCCCCAGGACCCAGCTCAGCTGAGGAAAAACATCTACTTCTGCCGTAGCTGTTGCCGCCATTTGCAGTCCACTGACTTTACCCTGACGGTCAATGCCCGCCTAGTGGGCCAGTGCCAAAGCTGTTCGGAGCTGGACAGCGAGGCCCGCGGCCGCGAGAACCTCTCCCACTACAAAACCATCCTCAGCAGGCTCCGCAAGTCAGAGGCCCAGAGGGACAAGGAGGCCAAGATTACCTTCCTGCTTCAGGAGCAGGATCTGAAGTACCTGGTAGATGTAGTGTGGGGGGCCCAGTCAGCACTCAGTGCGTGGAACGACATGCACGACCTGGTGATGGTGAGATGGGAGCGCATGTGGGAGTGGAGTCCCTGGAACTGCATTCTGCTCACCAAGGAAGAAGCTCCTGTTCATGACAAAGTGGAGGACAATGAGAAGGCCTACGGAGTGGTGTTTATTCAGAATGTCAAACAAAAACACACGCTGGCAAAGAAGTACTTCTCCCAGATTCCAGTCATGGCCAAATACCTCCAGGACGTGCACTCACAACAGGCCGCCCACGGAAACTTCTTGGTCGCCAAGCCCATCAACACGTTGACAGCCAAGGCCCTGCCTACAATTCCACAAGCCACTGGTGGAGAGGCTACCCAGTGAAGGCCTCCTTATCCACCTGCCTGCCTAACTGTCTGTCTCCCTCTTTCTCTATTCCTCATACTCTGTTGAATGTCAAATAAAAATAGTATTCTTGAGAGGTATTGAACTGGGTAGAAATGCAATTTTGAAATGGATGTGTAATAATTTTGTGATAAACGTGAAGATATTAAATGTAAAATA
>XM_003665021.1 Thermothelomyces thermophilus ATCC 42464 uncharacterized protein (MYCTH_54167), partial mRNA 
ATGGCCTCATCAGCTGCCGCTCATGGCTCCCGGCGTCCACCCACGAGACCAATAATCTCCGCAGACCGGAACCACCACCGCATCATCCAACTCGACGACTTCTCCTCTCACATCGCAAGTGCAGAACAACAACCACCGCCAGCAGGACCAGTATCGGCAGCAGCCAAATCCTCCTTCAAACACCTCTTCACATTCACCCCCGCACGGCACATACCCTTGGTCGCCCTCTCGTTCACCACCGCCGCCCTCGTCGCCGCCGGCCGCACTGCCTACGCCGTCCTCCTCGGCCGCATCTTCGACGTCGTCACCCGCTTCGGCACCGGCCTGCTCTCGCCCGCCGACTTCCTCGCCCAGATCTCCCAGTGGGCCGTCTGGTTGTGCGTCCTAGGCGCCGGCATGTGGGTCGTTTCGACCGTCGACGCCGCCGCCTGGGTCGTCGGCGGGGAGCTCAGGGCGCGGACGGCGAGGCGGGAGGTGTTTTGGCGGTTCCTGATGGGCAAGGAGGTGGGTTGGTTCGAGGCGCGGGAGGAAGGGGTTGGCGGGTTGACGGCCAGTGTTGCGACGCAAACGAGGGAACTGCAGACGGCCACATCCCAGACGCTTGGCTACATTGTCTGCGACGTGTTTGTGTTCGCCGCCTGCCTCGTCGTCGCGTTCGTCTACTCGTACAAGCTGACGCTTGTCATGCTGGCGACTGGTGTCCCCTCGGCCCTGATACTCTGGCGCATCAGCAGGTTCCTCGACCCGGCGATCGAGGCGCAGAAGAGAGAGCTCGCGCAGGCCGCTAAGTACGTCACCGCCGCCTCCACCGCCATAGACCTCGTCAAGGTGTACAACGCGGCCGACCACGAGGCGTTCAACTTCACTTCGGCAATCCGGAGGTCGGCGAGGTATTACTCGCGCCAAGCGATGTGCAACTGCGGGCAGATGGGCTACGTCAAGTTATGGATGATCACGTTGTTCGTGCTGGGCTTTTCATTTGCCGTCGTTCAAGTCAAAAATGGCGAGCTTAGTCCGGGCGATGCGTTGACCACCTTCTATGCCGCCCTTATCGCGTTCCAGTCGATCGAGATGCTCGGACCGCACTGGCTCGTATTGGCGAAGGGCATGGCCGCAGGACAGCTGCTTCGAGGACTGGTGGATGAGAGCGGCAGTGGTCAACTCGAGAGAACTGCTGGCTGTCTAAAGCCCTCTGGGTGTCGGGGAATCATCGAGATGAACAATGTTAGCTTTGCGTATCCGTCAAACTTTGCCAGGGCAGTCATACGGCCATCGAATCTTCGTTTCGAGCCTGGACGGCTCACCTTTGTCATTGGCAGAAGCGGCTCTGGTAAGAGCACCCTCGGCAGTCTCCTCGTGCGGTTCTACGAACCCCTCACCGGACAGATCATGCTGGATGACAACCCCATCACGGCATTCGATCTCAACTGGCTTCGACAAAACGTTACGCTTATCCAGCAATCCAGTTCGATCTTTGGTGACAGCTTCTTCAAAAACGTCGCCCTTGGCGCCATGGAACCAGACAATGTCCCCCTCGACGCCGTGCAAAGCGCTTGCTCCATGGCCCTCCTCCAGTCCACCATTTCCAGCCTACCCAACGGACTCGACACCACGATCGGTCCAGGCGGCTACGGCTTGAGTGGTGGACAGAGGCAGCGTCTAGCTCTTGCCCGAGCCAAATTACGCGATCCACCCGTTTTGATTCTTGACGAGATCACCAGCGGACTCGACCCCGTGAGCCGAAATCTGATCATGGAAGGCATTCGCGCGTGGAGAAAGGACAAGACAACAATCATCGTCACTCACGAGGTCGGCGACATTAAGGACGATGAGTATGTCTATGTCCTTGCAGATGGATCGGTGGCTCAAGAGGGTCTCAAGCGTGAGGTTGCCAAGGATGAGAGCGGCCTCTTTGCCTCGTTCGTTGCCTCTGCCGAGACTGCCTGTTCCGGCACTGACAGCGAGACTGAGAGCGAGACTGAGAGTGAATCCGATTCCTCTGACGACGGTCCTCTCCAGGAGTCCCAATATGCTAGGTCGCCCCGAGGTGCGCTCATCAGCAACCAAAGAATGCCTGTGGGCCTGTTCCAGCGCATCTCGCTAGGACCCCGAGCAACCATCGCACAGGAGTCCATCTGCCGATCCATCACTCACAAGATGGCCACGGATGATGAGCCTGTGACTGTCAACATCAGCCGCCCCTCTAGTATCCGGATCATAGCGCAGCAAGGATTAGCAGCTCAAAGAAGTAGGACTCTGAATGCACGCCAGGCTTTGCGGACCGATCTGGACCCGGAGCTCCAAGTGTCTCTCGACTCACTAGACCGTTTCTTTCTCGAGCACCTTGCCAAGCCCAGGGGCCGCGAGAGCCCATCTAAGGGGACCCAACTACCTTCACTCGCGGCCATTTTGAAGACTGTCTGGCCGACGCTGGACAGGACGGGCAAGGCTCAACTGATCGCTGGTATTGCTCTGTGTCTGGTTGTCGCAGGCAGCAACCCCGTCTTCTCCTTCTTCTTTGCCAATCTTATCGGACAATTCTGGAACATGGAGGGCCAAGAGAGCTCAGTCCCCAAGTGGGCTGGCCTCCTTGCCGCCATTGCTGCTATCGATGCGAGCGCTACCTTCTTTGGCTACTTCCTCATGGAACAAGTGGCCCAGAAATGGGTCAATAATCTGCGCGCAGAGGCGATCAAGCGCATCCTTAGACAGCCCAAATCGTGGTTCGACAGGGCAAACCATTCCCCGGCTCGCATCACCCAGTGCCTCGACCGCAACGCCGAGGAGATGCGCAAGCTTGCCGGCATGTTCGTGCCCCTCCTTTTGACCATCTCCACCATGATGCTCTCCTCGCTCATTTGGGCGCTGGTTGTCCGGTGGGACTTGACATTGGTGACGCTCGCCGGCGTGCCCGTGGTCATCGCAGCGGCGCGCGCCAACTCGCTGACGAGCGACAAGTGGGAGGCCGCCTGCGATCAAGCTGCTGCCGCGACCAACGCCATCTTCAGTGAGGCCTTGGCCAACATCAGAGTCGTGCGCGCCCTGACACTGGAGCGCTACTTTAGCAACAAATTCAGCCGCTCCGCAGCTGCCACCTACCATCTCGGGGTGAAGCGTGCAGGCTTCATCGGGTTCTTCTACGGCTTGCACCAGTCCATCGTCTTCTTCCTGACCGCTCTCGTCTTCTTCTACGGTGCCAAGATACTCGGCGAAGAGGGTACCACCGTGACCGACGTCGTCAGGGTCATCAACCTCTTGCTCTTCTCGCTCGGCACCGCGGTTGCCATGCTGGGCAACGTCCCGCAGATCGCCGCCGCCAAGGCCACGGCGGTGCAGATGCTCTACTACGCCAACCTATCGCACGCCGCGAGCCACGAGTCTCGAGGCGAAAGGCGGCTCTTCACCCCGCTCCCCGTCCGCATGACGAACCTGCGATTCGCCTACCCCAGCGCGCCCCAGACCCAGGTCCTGCGCAACATCAACCTGCAGTTCGACGCCGGTACGTGCACAGCCATCGTGGGCGCCTCGGGCTGCGGCAAATCCACCATCGTGAGTCTACTCTTGCGGCTATACGACCCGCTGCAAGAAGAGACGGACCCGGCACGCGCAGCGCACCGAAGCGAATCCGGAGCCCCCATCTCCCCGACCCCGGAATCCCCTAGCACTCCCCGATGCCAACGCTCCTCCCCCTTCCCCTCTGCCACCGCCACCACCAACACCACCACCAACACCCCACCCCTGACCTACGCCTCTGTCCCCTCCTCCCACGTCCACACCCCTTCTCTGCGCGCCCGCATCGCCTACGTGCCGCAGACCCCGGTCCTCTTCCCAGGCACGGTGCGCGCCAACCTGACCTACGGGCTGCACGAGGGGTCGCCGCTGCGGGCGGAGGCCAACGTCGTCCTCGCCGCGCAGCAGGCCGGCATCCACCCGTTCGTCGCCTCGCTGCCGCAGGGGTACGACACGCCCCTCGGCGGCGACGGCGGCGGCGGCATTGGCGGCGGCATTGGCGGCGGGGGGCCGGCCGCCGTGTCGGGCGGGCAGGCGCAGCGGCTGTGCATCGCGCGCGCCCTCGCCCGCCGCCCGCGCCTGCTCGTGCTCGACGAGCCCACCAGCGCGCTGGACGCCGAGGCGGCCGCCGAGGTGAGGCGGCTCCTGCGCCGCCTGGTGGAGGGCGGGGGCATGGCGGTCGTCGTGGTGACGCACAGCAAGGAGATGATGCGGATGGCGGACCGGGTGGTGATGATTGAGGGAGGGGTCGTGGCGGAGCAGGGCGGGTACGACGAGCTGATGACGGCCCCGGGAGGCAAGTTCCGGGCGCTGGTCGAGGGCGGGGTCTGGACTGCCGGCGAGGGCGGTTATGCTGAGGAGATGGAAGGGAAGGGGAAGGGGAAGGGGAAGAGAAAGAAGAAGAAGGAGAAGAAGGAGAAGAGGGGTGCTGCCGGGTGGAGGGACGTGGAGAGGTCGAGGGAGGAAGCGCTTAGGCGACTGGAGGGTAAGTCGGACTAA
>HM739632.1 Uncultured bacterium clone GB7N87002DK33B small subunit ribosomal RNA gene, partial sequence 
AGAATCAACGCTGGCGGCGTGCCTAACACATGCAAGTCGCACGAGAAAGGGGCTTCGGCCCTGAGTAAAGTGGCGCACGGGTGAGTAACACGTGACTAACCTACCCTCGAGTGGGGAATAACCTAGAGAAATCTGGGCTAATACCGCATAACACTTACGAGTCAAAGCAGCAATGCGCTTGAGGAGGGGGTCGCGGCAGATTAGTTAGTTGGCAGGGTAATGGCCTACCAAGACAATGATCTGTATCCGGCCTGAGAGGGCGCACGGACACACTGGAACTGAAACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGCGCAATGGGGGAAACCCTGACGCAGCAACGCCGCGTGGAGGATGAAGTCCCTTGGGACGTAAACTCCTTTCGATCGGGACGATAATGACGGTACCGGAAGAAGAAGTCCCGGCTAACTTCGACGCCAGCAGCCGC
>XM_026799137.1 PREDICTED: Zonotrichia albicollis erythroblast NAD(P)(+)--arginine ADP-ribosyltransferase-like (LOC106630292), mRNA 
ATGGCCATCAAGGTGGTGCCCCTGGACGTGGCCTGGGACTCCTTTGATGACCAGTACCAGGGCTGTGGCCCTGCCCTGAATGCAAAGTGGTCATCCCTCTACAACTCCAAGTCCCAGAAGAATCGTCCCTTTGCCTGGGGCCGTGGCTCTCATGGCCTACACATCCTGTACATGTACGGGGACTTCAATGCAGTCGTGTGCGCTGCCGGGCGCTCCCGCCAGGAATACCAGAACAACTTGTGCTTCAAAACGCTGCATTTCCTACTGACCCAGGCCCTGGTGACGCTGAGGCAGGGTCAGAACAGGCAGTGTCACCATGTGTTCTGGGGCATGCGTGATGTTCATTTCCAGGCATGGCAAGGCCAGAGCATCCGGTTTGGTCAATTCACATCGATGTGGCTGCGTAAAGAGATTGCTCTGCACTTTGGGACAGACACAATTTTCGAGGTGCACACGTGCCATGGCGTGGACATCCAGTGGTTCTCCATGTATCCAGGGGAGGAGGAGGTGCTGATCCCACCATATGAGACCTTTGAGGTCACCAAAGTCACCCAGAATGGGAAGAGGACATGGATCAGTCTCCGTTCTGCTGGGACTTTCAGCAAATATAACTGCGAGTGGCACTGA
>XM_047886733.1 Psilocybe cubensis uncharacterized protein (JR316_0000919), partial mRNA 
ATGTCGCTCGCTCGTCTCATTCCAAGGGCTACCACCGTCTCTCGCATTGTCCGAACTGCCCCAACTCTCCAAACCAGATGGGTGCCCCGCGCCATGTACTCTGCTGGCGGTCCCTTGTCCAAGGACGTCATCACATCCCGCGTTCTCGAGACATTGAAGGGATACGAGAAAATTGACCCGGCCAAGTTGACCACGTCCGCATCTTTCCACAAAGACTTGGGGCTCGACAGCTTGGATGCAGTGGAAGTGATGATGGCAGTTGAAGAGGAGTTCTCAATCGAGATCCCTGACGCTGAGGCTGACGAAATTACAACGGTCCAACAAGCCATCGACTATATCGCAAAATCTCCTGACGCTATTCTGGAGTCTCTTGACTTGAGAGATGATCGATGTGACGCGAGTTCCGTCAAATCATCTGCTTTAGCGGTCGCATGA
>XM_023773741.1 Ramularia collo-cygni uncharacterized protein (RCC_08491), partial mRNA 
ATGGCGGCCCCCGAAAAGACTCCCACATCCCCAGATGCCCACCGCGCGCTTCCAGACAAGAAAGCCGTGGAAGCGGCTGGCGAGCTTCTAATCAAAGACGAAAAGGGCAACGAGATTGCCTTTAAATCGCTCTACTCCGACAAGCCTGCCGATGAGAGACAACTCATTGTTTTCGTTCGACACTTTTTCTGCGGCTCCTGTGAACTCTACGCCCAAGCACTCGCACGGGATCTCCCCGTAGAGGCACTGGCAGCCAACAAAATCACACTCACAATCATCGGATGCGGAGAGCCCATTTGCATCGCTGATTGGCGAAAGCGAACGGGATGTCCTTATCCCCCCCACACGGAGCCCAAGCACCGACTACAAGACACATTGGGCCCCCCCAACCCCCCCAGAGCCATGCCCGATAAATTCCCCGAGTACCACTCCAAAAGCCTGTTCCAAGTAATCAAAGATTCCACATGGCATGCACTCTCCTCCGGACCTAAAAAGGCCTTGTCAGGCGGTCCCGCATCGCAGCAAGGAGGCGAGTGGCTTTTCCAGAATGGAGAGGTTAAATTCGTGCACCGTATGAGGAACTCGGCCGATCACGTCGACACCAAAGAGCTGAAAATGGTTCTTGAAATCAACGAGTAA
>XM_048709217.1 PREDICTED: Triticum urartu serine/threonine-protein kinase Nek3-like (LOC125545316), mRNA 
TTACGAAAAAAGACCTACAACAAAAAATCACACGACTCGCACGCACGAGCGAGTGCCCTCCAGAGTGCGCTCGAGCGAGGCCTCCAGATCGCTTCGCCGCCGCCCTCGCACTCCCATCAGGCGACTCGCAATCCAGTCCTTCGTTACAACCCTCGCGCTCGCATCAAGGATCGAGGCCTCCAATGGCCGCCGCCGATCCCTTCGACGGCGCCGAACCACTTGAGGAGCCGCCGCCGATCCCCTTGAGGAGCCGTTCACCGATCCCCTTCAGGAGCTGGCGCTGATCCACGCCGCTGCCACCTATGCAGAACCCCAGGGCAGGGCGCTAGGAACCACCGACAAGAGCATACTCGCCCTCGTGGCCAGGGTCTCCGCGGTCGGCATCGGCGTCGGCGTCGTCTACGGCTCCATCAGGCTCGACATCCTCAAGGCTTGCTCAGAGGATAGTGCAAGGAGATGTCCCACAAGCACTGACAAATTGTCGACTAATTACCAATTGACATGGGTGCTTTGATTGCCGGTGCAAAATATCGAGGAGAATTTGAGGATAGGCTTAAAGAAGACGCAGATTCTGATGGACAGCTTGTCAGAGATGGCAAAGCTGTTCTATGCAGGGTACGCCTCTGAGCTAGCCGATGCGTACTGTATCCAGTGTTCTGTTGCATCCGGTGCGACCTCAAAGAATACCTTCTTCTACCTGGGCGTTGAGCGCCTCAGGGACGACGAGGTGCAGCGCCTGGGGCGGAAGCAGTTCAACTACACGATGATGAATTTTTGCAGAGAAGTTCAGTTGCTTTGCGTATGGATTTACCAACAGTTCTTTTGTGCAGTTGACACAATGGGCCATATGATTCTTGGCAGGGAAGAAGCTATTTGGGCTGAATCAGACGAGGTGCTGGAGCAGATTGGGAAGGGCTCCTTTGGCTCTGCGCTCCTAGTGAGGCACAAGGTTGAGAGGAAGAGGTATGTCTTGAAGAAGATCCGGCTCGCCTGTCAGACCGTCAGGTGCCGGCGATCTGCGCACCAAGAGATGGAGCTCATCGTCGCAAAAGTAAGGAGCCCTTACATCGTGGAATACAAAGATTCTTGGGTGGAGAAGGTGGGGTGCTATGTGTGCATCATGATTGGTTACTGCGGGGGAGGGGACATGCTAGAGGCCATTAAGAAGGCTAACGGCAACCATTTCTCGGAGGAGAAACTCTGTGTGTGGCTTGTGCAGCTCCTGATGGCGCTTGATTACTTGCATGCCAATCATATCCTTCATCGAGATGTCAAGTGTTCAAATATATTTCTTCCAAAGGACCAAAATATACGGATCGGCGATTTTGGGCTGGCTAAAGTGTTTACTTCTGATGATTTAGCTTTGTCGGTTGTAGGAACTCCCAGTTACATGTGCCCTGAACTTCTTCCTGACATTCCATATGGCTCCAAGTCCGACGTATGGTCGTTAGGATGCTGCATCTATGAGATGACTGCGCTGAAGCATGCATTCAAAGCATTTGATATGCAGACACTGATAAACAAGATTAACAAGTCTGTTGTCGCCCCTCTACCGACTATATATTCTGGCGCATTGTAA
>XM_027425389.2 PREDICTED: Cricetulus griseus phosphate cytidylyltransferase 2, ethanolamine (Pcyt2), transcript variant X10, mRNA 
GCGTCGGGGGCGGGGCCGAGGCAGTGCGAGTCGCGGGAGCAGCCCCGGGCTTGCGGGGCCTGTGGTGCCATGATCCGGAACGGGCACGGGGAGGCCGGCGCGGCTGGGCGCAGGGGCCCGGTGGGCCAGCGCGCCGTGCGGGTGTGGTGCGATGGCTGCTATGACATGGTGCATTATGGTCACTCCAATCAGCTTCGCCAGGCACGTGCCATGGGGGACTACCTCATCGTGGGTGTGCACACTGATGATGACATCACGTTGACAGTAGATGGCCGAGATACCTACGAGGAAGTGAAGCAGGCTGGGAGGTACAGAGAGTGCAAACGCACCCAGGGTGTGTCCACCACAGACCTCGTGGGTCGAATGCTGCTAGTGACCAAGGCCCACCATAGCAGCCAGGAGATGTCCTCGGAGTATCGGGAATATGCTGACAGTTTTGGCAAGTGCCCCGGGGGGCAGAACCCCTGGACAGGGGTGTCCCAGTTTCTACAGACATCCCAGAAGATCATCCAGTTTGCTTCTGGGAAGGAGCCCCAGCCTGGGGAGACAGTCATCTACGTGGCCGGTGCCTTTGACCTGTTCCACATTGGGCACGTGGACTTCCTAGAGGAGGTGTACAAGCTGGCCAAGAGGCCCTACATCATCGCCGGCCTACACTTTGACCAGGAAGTAAACCGATACAAGGGCAAGAACTACCCCATCATGAACCTGCATGAGCGGACTCTGAGCGTGCTGGCTTGCCGGTATGTTTCAGAAGTGGTGATTGGGGCGCCATACTCGGTCACAGCAGAGCTCCTGGGTCACTTCAAGGTGGACCTCGTATGTCATGGGAAGACAGAAATTGTACCTGACAGGGATGGCTCTGACCCTTACCAGGAGCCCAAGAGGAGAGGAATCTTCCGGCAGATCGACAGTGGCAGCAACCTCACTACAGACCTGATCGTGCAAAGGATCATCAAGAACAGGTTGGAGTATGAAGCTCGGAATCAGAAGAAAGAAGCCAAGGAATTGGCCTTTCTGGAGGCCATGAGGCAGCAGGAGGCACAGCCTGCAGGGGACACTGCCTAGCTTCTGACCTGGAGGATGTTACTCAAGCCCTCGCCCTGTGCCCACCTCTTCTCGCCCCGCCCTGCCCTGCTGCTGTGTCTTGGTGTCAGCTCACACAATTCCAGAGGAAGCTGCCTTGCTGGAGGGTGAGCTGCCCAGAGAGGGTGGCTCACACAGTGAAGCAGCCCAGTGGACAGGATAAGCAGAGGGCACCTGTGACTGGAGGAGTATTGCTATGTGTCCTTGGCATCCACAGTTCCAACTGCCACTGCCCTAGTCTTGTCTGGGACACACCCCTCCCGCCTGACTGGAAGCTGCCCACCCAGCTTTGGTGAAAAGGTTCAGAGGTTCAGAGGGATGACTTTGGGGACCTCTTGTCCTGGGTCACCCTGCAAGTGGGTACCCTCTACTTTGGGGCACGTTCTAGCACCCCATTCCTGATTCCTAGAAGACGCACTTGCCCCGGTGGCTGGGCCAGCTTGACTGTTCTCTGCACAGACTTCTGGTCCTCATTTTGTACCTCAGTGGCTGCTGTAAATCTTTTTGGCACAACTGAATAAATCCTGGTGGGAAGTGCTCTGTGGGCTCCAAGCCCCCGAAGAAGCAGGAAA
>XR_002678113.1 PREDICTED: Setaria italica uncharacterized LOC111257591 (LOC111257591), transcript variant X4, ncRNA 
CCGCACGCCCCCCGCCGTCTGGACGCCTCCCGTCGCTCTCGCTTGGGCCACCGCCGCCGCCAGCTCTTTCATGTCCGCCGCCGCCTCGTCCTAGTCCTCGTCCTCCTCCCTCCTTTCCAGTTCGCTGCCACCACCGCCGCCGCCGCTAGCCCTTTCCAGTCCGCCACCTCCTCCTCCTTGTCCTCCTCCTCCTCCCTCCTTTCCAGTTTGTGCCGAGCGGACTCTGCACCGCGGTGAGCTGTGCCGGATCCTCGCGGAGCTCTTCCCAAAGTACCCGATTCAGACGAGCGCAGACGGTGAGGACCAGGAGGAAATAGGTGCTGTTCTAGACCTGTAGGGCAGTTGGTGTGTCCTGACAAAAGTTAAACTACCTTGAGGTATATGATATGTTCCTATTAACATCTAAACTAGGGATCTGCACATAGAAATGAAAATAACTTGATTGGTTTGGAATACTCGATCATCATAGATAATGAAGTGAAACACGGAAATAATGGAATGTAATCTATTTTTCATTGTCTTGCTTCGTGTATGTCTCCTCGGCATCGGTAGCTTTGTATCCTGGACTTCCCTTCACTTTGTTCCAGGCATAGTTAACCAATGTGACAGCTAGCTTGAGCCTGAAATTAGTCATATCCTTCTGCACATAACAAATACAAATGCCTGTTAGCCTTAATGTAAGATGGGCATAGATTGGGTTGCTGAATTTATGTTGTTCAACTTACCTGTGTGAATAAGGAAGATAATTTGTTTCCGGTCCAAAGCTCCATGAATTTAACCGTGAATAGTCCACACGATGCACTGCGAGTTTATTTGTATTTACACAAGTTAGGAAGAACTAATTATGGGAACCCGAGTATATTGACAGGTGTTGATGTGCTTGTACTTGTCAGTCTGGATTGTCTTTTTGATGCATTCAATGACTGGCCATTCTTTGACTTGGGTGTCCTTCCACCTATGTTCTTTGATCAATTGCAGGTCTACAAGGCGTGTCATACGGTTCTGCAACCCTTGCAACTGAGTTCAATAGAATCATCAGTGGTTGAGGCTTGCCTATATGTGTCTCCATCGCCTGAAGCACGACATTTCTAGGTTCTACCACTGCCCTTGATTCCTGCAAGTTAGCAACGGCTGCAAATTATGGTAGTCGAGCTCGGAACTGAATGAAGGCAAGTGGTGGTATATGGAGCATTTCTCTTATTGATCCAAACAATGAGAATATCCAATAACACTTGGAACAATTCTCAGCTTGCAGAATACAATTGATCGCTACCTGAACCACACCAAAGGCACACCTACAAATGAAAAAGTTCACGAACCAGGTGTAGAGATGAGATTGAACTTACTGGATTGAATGGGAGAGATGTAATTGGATCAATTAGCGCAGGTGGTGCATGCTCCTTCTGTTGCGCAGGTGGTGTATGGTCCTGCTCTTGTGTGTCAGGATTGATGGGTGGCACCGAAGAAGTAGCTCCGTCCACATCCATGGTGGCTGAGTTGTCTGATGTGAAGCAAGATGGTAAACTGCCGCTGCCTGCTGCCTTCCTGCCGCTGCAGCTGCCAAGTTTGTTGTTCATGTGAGTCCGTGTGAAGCAAGATTGTTTTTATTATCTAACGTCAAGTGTTAGTTTAAATTAGGTGCTATGATATCCAAACGTGTAGAGTTTGTTTAAATTAGGCCTCACGTGAAGAGTTTGTTTAAATTAGGCCTCACGTGAAGAGTTTGTAAGCTAATACATGCCTCCAACGACGGGATAGCACAGTTTCCAACTAACGTTTTTCTGTCAATGCTTTCCAAGCAAATTACTGATACCTTGTCAATGCGACGGGATACTCTAA
>XM_050703260.1 PREDICTED: Spodoptera frugiperda RNA binding protein fox-1 homolog 3 (LOC118266813), transcript variant X21, mRNA 
TCTAACCAATGCCCAGCATTGACTACTATTCTTAAATAAAAAATGTTGTTATTATGGCTTGGTTAGGTTGTGACCGAAAAGTTAAAATCATCTGTAATTTTGTGTAAAAGCAACGGCAACATTGTTTGTCACGTTTCGTCCGCCGAATCATGCCGACTGTATCTCCTATCCTTGTCTTTCTCACGGTGATCCGCACGGGCGAGGCGACTCGGTGAGTAGCCACGCGTGCTCGTACCCGTCCGTTGTTGCACATCGACATTAACCGCTTTCAGTGCTAGAGCGCGTTCCTCCGCGCTATACTCACATAACCTAAAAGTTAAACAATCCTGATAATTTTAGTACTATTCATTGTAAAACCATTAAATACTCATGATTACCTCGAATTTATAAGTTAGTGTTGTGGAAGTTTACGCCCAGCGAAAGGGCGTACGTGGAGTGTATTTTTGTGCAACACAAAGTAAATACAAACGGCAAGCTGTGGGGTTCAGGGGCCTTTTTTTTGCCGCCGCAGGGGATGTACTATCCTGTGAGTAACGGCAATGTCATCGATACAGGAACACCAACCTTGCTGCATATGGTGGGGACGGGTATGGCGACCCCGTTCCCGGCGGCGGCGGCGGCTGCGGCAGCCGCGGCACAGTTCGCAGCTAACGGCGACGCACTCGCCGGCGTGAAGGCTGAGGCTGCCGGTCCGACAGCTCCACCTCAACCCCCGCTCGTTAAGAGCGAAGGCCCGCCACCGCCCGCGCCTCTACCGCCCGCCAATTTCTCCCCTCAACCGCCTCCTCAACAAACACACACACAAAATTCAGTAGAAAATCAAAACAACAATAACAATACGCAAAGCGAAGGCGAAGCAAATGAAGAGAGCACACCAGTAAGTGTGGCGGCGGCGGTGGTGGCGCAGCAAGCCGCGGCCGTAGTGGCGCAGCAAGCGGCGGCGGCGCACGCGGCGGCCGCGGCCGTCAGCGCTGCCGTCGCTGCCGGCAATGTTAACGCTACCGGCACTCCTGAAAAACCGACACTCGTACCCGTCTCACAAGCGTCACAACCTAAACGATTACACGTCTCCAATATACCCTTCAGATTTAGGGACCCAGATCTTAGAAATATGTTTGGGCAATATGGCACGATTCTCGATGTAGAAATTATCTTCAACGAACGTGGTTCCAAGGGATTCGGTTTTGTAACATTCGCAAATAGTGGTGATGCGGAGCGAGCACGAGAGCGTCTTCACGGCACCGTGGTTGAGGGCAGAAAGATAGAGGTTAATAATGCGACAGCGAGAGTGCAGACAAAGAAACCTCCGACAGTTCCCAACGTGTGTGTCCAGTGGCCGGAAGGTGAGAACCTTCATTACGATTTTGCGCTGCGCCGCGAGCCGCGCGCCGCGCCGCACGCCGCCGCCGCCCCCGCCCCGCACGCCCCGCCCCAGCACGCGCTGTCGCACGCCGTGCTCAACCGCGCCGCCGCCTACGCCTCGCAGATGCACGCCTACGCGCCTGTATATTACGACCCGTTCTTAGCAGCCGCGGCGACGGCTGACTCCAACTACAGACTCCAGGCGGCAGCTGCAGCAGCAGCGGCAGCGGCGCCCCTGCTGAAGTCTCCGCTTACTTCGCCGCCGTCAGCGCCGCGCCCGCGCCCGCGCTCGCGCCGCTCGCTGCCACGTACGGCAGAGAATATGCAGATCCATATTTAGGCCATGGAATCGGACCAGTATCAGGATATGGGACTGCAGTGTACAGAAGTGGCTACAACAGATTTGCGCCATACTAGAAAGCCAGTGGATGGATACGATTGAACTCGAATACCTTCGTCACCTTCACCTTAACATGACAATGAACTCTCTTTGTAAACGTACAAACATAAATCATAAATTTAAGGATCAATAATAAACGCTAGCAGACTACCGTGTAAGTATCTAAGCTTGGGTAGCAAACTAACGAAGTAACGAGCGAGCGTGGAGTCGTGCAGTCGTCGAGTCGTCGAGTCGTCGGCGTCCACAACTTATGAAATACCAAAGTCATTAAAATTTCTAACAGAATACTTTATAAGTTGAACTTAATGTAAATTATTGTGTACCTAATGCTATACAAGTGCGAGCAGCTAAAGTGATTGCTTTCGTTCTATTTAGATATTCTAGGAGTTACTATAATTTTAACAGAAGTGAATTCATCTTACGATCATACGTACCGTACTGTCTAGTGTAGATGTTACACTTTGTTCATCGTGGACAATAGAAGAAATATTTACTATATTGTAATGATATATTTAGTGAGCTTTGCACTTGCATATCATAAAATTGTAAATACTTGTTTGGAAACATTTAATTCGGTCTTGATATTTTATTTTTAAATTCAAAATTGCCAAATGGTGTTTCCTGAATACATTTTCAGCGATCTTATTCTAAATAATAATATACTCGTTAACGTTAAATGGTCTCCATTTTTAATTATTAAATAGAATAAATTCGATTTGTAAACGCGAATTAGTTGGCGTTGCGGTTTATACCTAATATATCAATTTTAGTAAAATCGCCGTTATTATCTTGTAGACATGTATGTACGCAGAGACAATAGAAATCTCAAATCAACTATTTTGGAGTAAATACGTTATTTGGTGCGATATCAATGTGGTGCCATTTATTTGGTTGTTATTTTTACATCGTATTATATATTTTCTAAAGTTACCTTGTACTCTATACAGTTTATGTGACCTAGTTGTAGGCTGTCCCTCGGAGAACGCGACCAACGTCTCGGGTGTGCAATGCTCTGCCTCGCGTCGCTCCGCTTGAAGCGTGTCTCTTGAACTTTTGGCAGTGAACGCGAGGAGAGCACTTGTATACGTGTGTTGTTAGTCGGTAGAACTAATATGGCGTCGTTTCGGTTTGTACATTTCGCTTGAAGCTTACGTTGTCGACAGTCCCCGTTCCTTCCGTCAGCGCTGTGTCGCAGTCTGAGCCAGGCGTTTTCTCGTGTTCCTGGTTACTTGTAAATCGGTTGCTAGTTTATAAATAAGCTAATGTTTTACAGAGTGTAGGCGAAACGCTTTAGCTGTAGTCTATAAGGAAGAAGGGAACTCCGTCGAGTTCTTACATATCATTGAGATTTTCTCCTTGTATGTAGTTACGTTTATTCAATAATTATTCTATTGTCTTTTAACGATGTCTTATTTTTACAATGCTATTTAATATTTTTGTCTGGCGTACGGACTTTCATTTTTATAGAACAAACACGCATACGGGTCCAACCCTTTTAGAAGTTGTAAATTTTAGATCTAACATTTGCATTAGGATTTTAAAGTATTGTAACATCTATGAATTCGCTCAACGTTTATACCAAAGCACAAAAACCCATCGATTCATACGTATTCGGAGAAGTGTTTCATGACATTAACCCCTTTTCGATAGATTTAATAGTCTTTCAATGAGAAAAACTTGGGAAATCTATAAGTCGTGGTGTAGATAGATGATAACTAGAACAAAACTACAGACTTTATTTTTTACTTCATTTGTTGAAAGTTTTCATTAATCCTAAGTAATTTTTTTCTAAGGACATATCTACATGTTTGCCATCTAGAGTAGTTTAATCTTAACGTAGTTCAATGACTATATACATACATAAAATATAGATCTGAATTAAATCATAGTTGATTGTCAATCTTCTCATGTTATTGTAAATTCCTAAGGAATATAGTACACATTGTGTTACAGATGTGTCTGTATGAGAGGTTGCGTCGACGTCGACGTATTAGAGCTTTGTCAGTTTATTTTTCAAACCTTTACGTAGCAAGTAGAGATAGAGTACCGAATACGTTGGGCTGGTGCAGGGGCGCATGGCTCTCGTCACTGCTCGGTGTCGTCTGATGATGATAGCTTTAATTAATTAAAGGTGTTAAGGTGATGTTCTCACCCAGTTGTGTCATCTTGTAACCACAATTAGAATAACTAACTCAAGTAGCATTTCCATGACATTATTATTATTATTTGTCTTGCAGAATTCTAGTCTTCGCGCACAATCTTTTATTAAAATAATAAATAAATAGTAAAGGTGCTTACTCGTAAAGGTTTCATGTGATATTTACGGAATTAGTTGTCGAATCTTTGTCTCGATTTTTATTCTATTATTTCCGTACGATATGTAATAAGCAGTTCGTGTCATATTTTCCTTTTACTGATTATTTTTATAATTATTACTCTCGCCTTTTAGTGCCACTGGCTTTTATATAATAAGTTATATTTACTTTATCGTACGTTATTGTAGTCTCGTTGCAGCTTCGAACAATATTTTGTGCTTTACTGCTGAATACTCATGCGTGGATGCGTTATTTTAAGTAATTCTTAGGTTTGTAGGAATTGTCTGATTAATGCAAGATTTTGTATCTGAGTACAGAAACAAGTACATGTGATTCTATTTGATGATTTTATTGTTTAGTTTTAGTATTTTGTATCAATTAAAGTCACAAATATTTGTGAGTGTTATATTTTTAAATCATCATATTTTATAACAAGTTAACAGGACTTTATTTGGAAATACAATAATTACTTACGAACTTTGATATTAAAAATTCGATCAAATTCTGACCAAATCTCGTCTTGTTTACTTGGAATTTTAAAATGTACCTACATAATTTTTGATTATGTTATCTTTATAGTCTTTATGTATGATTTTAATGATAATTAAATAAATCACAAAAGCAAAATACCTAAGTTTTGTATAAAGTTACATAATATAAGCCAAATTGTTGTTACTTGGAGAATAATCAGAATTTAAATTACATATCTGACAAAATGGTTAGTGTGCTACAATAAGATTGAAAAAAAAATAACATCAAGAACAATGTATTATAAATATTATAATCATTAAATTAAGGATATGTATTTTGTAACGCAGTTTGTTTCTCAGTTTTTATGAGATGTTAAATTAAAGTTTCATACTACTCTTGTTTCATGCTGTGCACAACTTATACGATCGTCGGCTTCGATATTGTATTCATTAGATAAAGCGAATTGTTATATTGTGCATAATAAATCATATCAGTAGTGGTGTTAGCTAGTTGCGAGCCGGCGGCAGCGTCCACTGTACATAGGTATACTTAGTGTTACCGGCGGCCGTATTACTGTGCCCTCGGGTCATATTGTTAAAGTAGCCAGAGTTGATAAGTATCACTTGTTCGTCAATTGCACTCGTCAAAGCTGTTCAGTTGGTGTTGTAGGTTATTCAGATATTAGCGGGGTTATTGTTAGCTCCTGCGTGGCAAACTCGCAACTTGTGGCCGTGCATGACACTCATTTTATTGCACGACATCGCCACACGGCACGTCTACAAATTGCTGGTTTGTTTGCGATTAACCCCAAAACATTTAGATGGTGTAACGCATACTGACTATGGGATCGATTAGTTGCTGGTCTACTATCCGGAACGTAAATAAGTTTAACGTTCTAAGATCCATATTATCACTGTTAACTTAATTATAGCTATCGTTTGTAATTACTATTTGTTATGCATTACTTTTGAAGTTGCTTGTAGTGATCAAAGCAGTCAGTATGCGTTGCAGCTGCATTGTGGGCTAGTATGCGCGTGCGCATAGTTTCCGAGCTAGTCTCGAGCACACTTGCAGCCGGCCAGTATTTGAAATACTATTACAATACCGTGCTCAATTCCTGTATCTGTACATTGTAAGTATAATGTTGACAAAATGTTTTTGAAGTTTAATGTAAACTACATACAATAGGTTTGTTACATAATGAATGTCTTCCGTTTGGCACATTTTATAGATATACCTACTTTGCACATTTTATTAAAGCACGGATCTACATAGGAATACTAGTTCAATATTATTTAACAGAGATATTTTCAAGCCAAGTGCACAGCGAGCCCCTCATATACAATTTGTGATACCTAAAGTGAAATACGATTTTCCTTTTTTTTTGTGTGGCAATTTTTAATGGATTGCAAAGCTGATTTTCTCTTTTGAATTGTAAATATTTTTTTCTAATGAAAAATATTAAATGAAGTGAATCATTTTAAAGCCTTTGGCATTGTGTACTCATTTACGTTATAAATAAATTATAGTATAAAA
>XM_050906876.1 PREDICTED: Gymnogyps californianus immunoglobulin lambda-1 light chain-like (LOC127022987), mRNA 
ATCGCGCCATGGCCTGGGCCCCTCTCCTCCTCGCGGTGCTCGCCCACAGCTCAGGTTCCCTGGTCCAGGCAGCGGTGACTCAGCCGGCCTCGGTGTCAGCGAACCCGGGACAAACCGTCCAGATCACCTGCTCCGGAAGCAGCTATGGTGTTGGCTGGTACCAGCAGAAGGTTCCTGGCAGTGCCCCTGTCACTGTGATCTACAACAACGACAAGAGACCCTCGGGCATCCCTTCACGATTCTCCGGGTCCAAGTCCGGCTCCACTGGCACATTAACCATCACTGGAGTCCAAGCCGAGGACGAGGCTGTCTATTTCTGTGGTGGCTACGACAGCAGCATGTGTGGTGTATTCGGGGCCGGGACCATGTTGACCGTCCTAGATCAGCCCAAGGTCTCCCCCACCGTCCACCTCTTCCCACCATCCTCCGATGAGCTCTCGGCACAGGGCAAAGCCACCCTGGTGTGTCTGCTGGGAGACTTCTACCCCGGCGCCGTGCAGGTGGCCTGGACGGCCGATGGCCGTACCCTCAGCAGTGGCATCGAGACTGGCCAGCCCCAGCGGCAGACCAACAGCAAGTACATGGCCAGCAGCTACCTGACGCTGAGTGCCGCCGAATGGAAGAGCCACGAGACCTACACCTGCAAGGTCACGCACGAGGCCGGCAACGTGGATAAGAGCCTGAATAGATCCCAGTGTTCCTAACCCTGCTGGGACCTCCCCGCACCCGGCAGCCCCTTGCCGGCCCCTTGCCGGCGCCCTCCCTCTTCCCCGCTGCTGGGGGCAGCGGCTCCCCCCCCACCGCAGATGTCTCTCCCCATGTCCCCCTGTCCCCTGCTCCTGTCCCCCCGCCCTGAGTGTCACACGAATAAACACCGACACTGAACTAG
>JF646645.1 Uncultured bacterium clone GDIC2IK01BM6IP 16S ribosomal RNA gene, partial sequence 
GATCCTGGCTCAGGATGAACGCTAGCTACAGGCTAACACATGCAAGTCGAGGGGCATCATGTTGGTGCTGCAACCAATGATGGCGACCGGCGCACGGGTGAGTAACGCGTATCCAACCTTCCCCTTAGTAGGGGATAGCCCGGCGAAAGTCGGATTAATACTCTATGTTCTTCAATGCGGACATCTAAGTTGAAGCAAAGATTTATCGCTAAGGGATGGGGATGCGTCTGATTAGGTTGCAGGCGGGGTAACGGCCCACCTGGCCTACGATCAGTAGGGGTTCTGAGAGGAAGGTCCCCCACACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGCGAGCCTGAACCAGCCAAGTAGCGTGCAAGGACGACTGCCCTATGGGTTGTAAACTGCTTTTATCAGGGAATAAAGTGAGGCACGCGTGCCTTTTTGTATGTACCTGATGAATAAGGACCGGCTAATTCCGTGCCAGCAGCGGC
>GU634984.1 Uncultured bacterium clone HF9475 16S ribosomal RNA gene, partial sequence 
ATTGAACGCTGGCGGCATGCTTTACACATGCAAGTCGAACGGCAGCACAGGGAGCTTGCTCCCGGGTGGCGAGTGGCGCACGGGGTGAGTAATACATCGGAACGTGTCCTGTTGTGGGGGATAACTGCTCGAAAGGGTGGCTAATACCGCATGAGACCTGAGGGTGAAAGCGGGGGATCGCAAGACCTCGCGCAATTGGAGCGGCCGATGCCCGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGACGATCGGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGGACAATGGGGGCAACCCTGATCCAGCCATGCCGCGTCGCAGGGATGAAGGCC
>MG192940.1 Homo sapiens isolate HD19_NN14_F4 T cell receptor beta mRNA, partial cds 
GTTGTCTCCAGATCCAAGACAGAGAATTTCCCCCTCACTCTGGAGTCAGCTACCCGCTCCCAGACATCTGTGTATTTCTGCGCCAGTGGGAGAGGACAGGGGATCTACGAGCAGTACTTCGGGCCGGGCACCAGGCTCACGGTCACAG
>NM_001252006.1 Homo sapiens poly(A) polymerase alpha (PAPOLA), transcript variant 2, mRNA 
AGTTCTAGAACGTTGCTGTGGTAGCGCTCGGGCGCCATGTTAGGACGAAGGGGAAGGAGGAGAAGCGCTTAAAGCGGCGGGAGCGGTGCGGGAGAGGGGTTGGACCCAGGGCTGAGGCAGGCCCCCCCCTCCCTCCCGCCTCAGTGGATCATGCCCAGGGCGGCAGCGGCGGCGGTTGCGGGGGGGAAGTGACTGGGCGGTGCCGGCGCCGGAGACGATGCCGTTTCCAGTTACAACACAGGGATCACAACAAACACAACCGCCACAGAAGCACTATGGCATTACTTCTCCTATCAGCTTAGCAGCCCCCAAGGAGACTGACTGCGTACTTACACAGAAACTAATTGAGACATTGAAACCCTTTGGGGTTTTTGAAGAGGAAGAGGAACTGCAGCGCAGGATTTTAATTTTGGGAAAACTAAATAACCTGGTAAAAGAGTGGATACGAGAAATCAGTGAAAGCAAGAATCTTCCACAATCTGTAATTGAAAATGTTGGAGGAAAAATTTTTACATTTGGATCTTACAGATTAGGAGTGCATACAAAAGGTGCTGATATTGATGCGTTGTGTGTTGCACCAAGACATGTTGATCGAAGTGACTTTTTCACCTCATTCTATGATAAGTTGAAATTACAGGAAGAAGTAAAAGATTTAAGAGCTGTTGAAGAGGCATTCGTACCAGTTATTAAACTCTGTTTTGATGGGATAGAGATTGATATTTTGTTTGCAAGATTAGCACTGCAGACAATTCCTGAAGATTTGGATCTACGAGATGACAGTCTGCTAAAAAATTTAGATATAAGATGTATAAGAAGTCTTAACGGTTGCAGGGTAACCGATGAAATTTTACATCTAGTACCAAACATTGACAACTTCAGGTTAACTCTGAGAGCTATCAAACTATGGGCCAAACGCCACAACATCTATTCCAATATATTAGGTTTCCTCGGTGGTGTTTCCTGGGCTATGCTAGTAGCAAGAACTTGCCAGCTTTATCCAAATGCAATAGCATCAACTCTTGTACATAAATTTTTCTTGGTATTTTCTAAATGGTATGTGTTTAGATTATATTAAAATAAAATTGATTGTAGACACTGAAGTTTAGTCTTATTTCTATGACATTTCTCAGCTTGGTTTCAGATTCAAATTTTAGTTCATGATGTAGTCATGTAGGCAGCCTTGGAGATCACATTGTGTATAAAATGGCAAACTGAAACTATTTTTTTTCCCTAGTTTGGCCAGGATAGTAAGGCAGATTCTATTTGTACTTCCTTGCATAAACTTACCCTCTGAATAAACTCTGAATTTTAGCAGCTAAGATCCAATTTATTGATAGGTTGGGAAATCAGTTACTATACTTTTGGATAAAACTTGTACACACTACCTCTTTCACTCTTTTAATTCTCTATCTATAGGCCATTAGTTTCTTGTGATTGTTTTTTTTTTCTTTTTGCTTTCAGCATTTATTTGGCCTAATATTAAAGATACGAATTTTCATAAGAAGCTTTTAAAGAATAAATTAACATTAAGTGCTTCGGGACAAAAAAGGAATTTGAGATTAGTCATTAACCCAGATTTTTTTAAGTTTCTTCGTTTCATTTCCACATATGTCAACTATGATTTAAGAAAAAGTAGAATAAAAGATTACTGCCATTTTATATTAATTGCCTTGGCCCAAAAGGTGAGGGTTCTTGGTTTTTAATCAAATTAAGATAAATCGTCCATTCCTGTTCTTATGAACTCCTGCTCCTCCCTCTGCAAAAGAGATGTTCTTTTCTAGTAATTTTATAAAAATTAGTTATTTGAGACAATTTAGAGCTGTGTTCAACTGGAGGAAAAATAAAAAAAATTTAGAACCATGCCACACTTTTCAGTACACATTCTGGCTGTTTTGGGATTTAGTAGCACTTATAATCAGGTGTGATAAGATTAAAGAATGTCAGAATTTCTTTTTTTTTTTTTTTTTTTTTTGTTTGAGACGGAGTCTCACTCTGTCACCCAGGCTGGAGTGCAGTGGCACGATCTTGGCTCACTGCAAGCTCTGCCTCCTGGATTCATGCTATTCTCCTGCCTTAGTCTCCTGAGTAGCTGGGACTACAAGCGCCTGCCACCACGCCTGGCTAATTTTTGTATTTTTAGTAGAGACGAGGTTTCACTGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCATAATCCGCCCGCCTCGGCCTCCCATAGTGCTGGGATTACAGGCGTGAGCCACCGCGTCCGGCTGTCAGAATTTCTTTTAATGCTACACATATATAAGCAAATAATGTTTTTAAGAAGCTAACCTTGATGTTAAGAGTGGCAGGTGTTCTCCAGTTTTTACCTCTTTCATATGGGACCAAAGTAGCTAGTTTATGGAACACATATGAAAATGTGGTTATGCCACCAAGTTTTACTACTACACTTGTCTTACCACTTTTAAGTCATGAATTCTATAATTATTCATACCCCTTTGCCTGTGATCAGAAGTAACTTTTAAAATTATCACTTGACTTTGGATGGAACTAGTATAAAGGCAGGAATTTTGTCTTTCAGTGGAGATTTATTCTGTTCAAGGTTGAAGTGGACACATCATTATCTTGGGATGGTACTTCTTTATTTAAATAGTCCTTTAAAGTTCTTTGAGTGGCAGAGAACGTTTTTGGTTTCAGTCTGAGAAGGCTACCAAATGGTTTAAGTTCATTTCATAGTTAGGAGAAAAAGATTTTGAGTAGTCTAATGTCGTCAGAAAGGATTAAAACGTTGTATGTACCAAGAAGGCAGAATGAAGAAGGATCACGTTCACAAATGCTGTATGTTTAACAAAATACGTTTAGATGGTAATATCCAATAGTCTTATCAAGTGCTACAATCTTTTTAAACAGGGAATGGCCAAATCCAGTGCTATTGAAACAGCCTGAAGAATGCAATCTTAATTTGCCTGTATGGGACCCAAGGGTTAGTGTATTATTTTTTCCCCTACCAATTCACACTGTGCAATAACAAGTAAAAATCATCTGCATAAACTCCAGGGAGACTTCCAGCCTTTTACTTATGAATGGTCATGTCCGTATTACACTTTCTTTTAGATAACCTCAACTATAATTGTCCTCAACTATAATTGATGTGAGAAGCATAATTATGTACCCTGTAAACCACATTTAATTGTACATAGTTTTTAATACAGATTTTACTAACATTTTAATTTATTCTATATAGAACTACCTTGTAAGTCAAAGTTGTGTGGGCATTTGTGCTTTAAAAAAAATAAAAGGATACTAAAAATCCCTGTATTTTTTATTTTATCTAAGTATTATGCTAAAGTTGGGTTGTTATAGGAAAGCTGTTACTTAATGTTTACATGTGGCATATAACTTCTAAGCATTTTCACTTTAATTACCATGATGTAATTGTAAAAAAAATTGGTTTAGATATTTTAGAGATTATAAAAACATGGTTGGGCTAAAGAAGACCTTCCATTCTGTTTCTTGGGAAGTTACAACATTTACCGCTTACTCATTTTAAATGTTAACAACATGCACTTTATAAACTGATAAAAGAAATTTAGGTTTGAATAAGATTTCCTAAGTTTATGAAATCCTTTTTTTCTAAATTATTACAATATCAAAAATTTTAAATTCTGTTGAATTACATCAAGCTATGCATTTTCAGGTTTTCCGAACCTCAAGGCATTTACTTTTAGAGGATGTGAATTTACAACTTACTTTGTGGAAATGTGCCACTTACTGATATACAGATTTAAAATTAACAGTATATCATTTCATTATCTCCTAACATATCAACATGGATAATGTAGTTTCACCGCGTGTTAATAAGCTTGAACTCCTTAATAGTTTCAGGGTATATTAAGAACTTAAGTTTCTATCTTGTTGAAAATTAGCTTACAAAACATTGTAGCATGACATGTCTCTAAAGGTAATTGTATGTGCATCCCCATTTCTGTTGTTGAATAAAGAAAAACTAAACATCAAAAAAAAAAAAAA
>XM_018797717.1 Schistosoma mansoni hypothetical protein partial mRNA 
ATGGGTTGTGGTGCAAGTGGATTGAAAGATTGTAAATCAGAAGTAGCTCAATCGACAGATGACAGTCATTCCAATAATGCAGAAATAGAAGTTGAAGAACATAAAGAAACAGACACAAATCATACAGTTCCTGAATTATCAAGTGAACAATTGGATCCTGTATCGAACGATAGACTACATGATGAATCTAAAGAAGAAATTCCACAAAATCAAGAAATTCCAGAAGTTTCAGTGATTACTGAAGAAAAACCAGATGTAGATTTGGCAAATGATGCGGGACAACCTGAAGAATCCAATACAAATGAAGGAAATACATCAGAAAGCTAA
>XM_040902855.1 Laetiporus sulphureus 93-53 uncharacterized protein (LAESUDRAFT_536661), mRNA 
GCAATCGGAAGATCACGCCTCACGAATGACCCGACCGTCTCATCGACGGTACTTGACTGACCTCTCCGCGCTGAGTGCGTCAATGCCGAATCATCGAACGCGCCGCCTCGTACCGAAACCAGACCGCGCGTCGGGGCCACGCCGCTGCGATAGAAGACGAAGACGTGCCTTGCGCTCACCGCTGATGCAAACGGACCGCGGCGTGGACCGTGATTTGACGCGATGCACAGCAGATGCTGGGAAACGGTTGACACGGTGAGCATTGCACTTCCCTACACACCTGCTACTAGATTCTTCGCGCGTACATGTCGACTAGGGCGGTCTCTACGCTCAATCGCCCTGTTCGCGTTGAGAATGCTGTCGACCTCGTTAGATGTGTGGATGACCAGAGCGTACCGAGACGCAGGCGAGATGTTGACTACGCGGATACTACAAATGACGAGGCGCACGACGAGAGACGGCCAAGACCGATTGCAACCGTCATTCGCGCTCACCCGCATCGCACTCGGGCTGGACATGCCCTCGTGCGCTCGTCGCCGTCCTGCTGTCCGTGGCTTTGGACTGCGAAGCAAGACAGCATGATCAAACAAGTGCGCAAGAGAAACGGGGGGATGGCCTACCGCATGCCAAAGCCATCATTTCACGCAGTCTCCTTCGCCAGAACACGCGCAGGACTGGCGCTTTCACGACAGGGCTTGAGGCTCGTGCCACTATCCAGCGACCGGTCGGAGATCACACCTGACGTCTCAGAAATACCCGCATCCGATGCTGTCTGATGCAACTGGGCTATTCCGGCGCACTTCAAGCGATATTCGAGCAACAGAAGCTGCGACGGTTGACTCGCAGGCCGCAGAGGCCGACCATGACCTGCCGCAGACGGTAGACCGACCTAGGAGAGCATCTCGCGTTTCGCGTGTGGTATAGAGG
>XR_002312254.1 PREDICTED: Odocoileus virginianus texanus uncharacterized LOC110131716 (LOC110131716), transcript variant X2, ncRNA 
GGACGGCCCACCGCGGCCCTGCCCAGCTTCCAGCCACAAGGTCTCTGGCTGATGAGTAGGCGGTGGTGACACCCTGATGGCCCAGAGGCCGGAGCCCACTCAGTCACCCGGTCTGTGCACGGGCCTGTGTGTGTCCCTCCCCACAGGAGGGCTCGCAAATTAAGGGACTCCGGCTGGAGGAGGGCTGAAGGGGAGCCCTGTGCTTCTGTTTGTCGAGACTTTGCCCATACCATCGCAGCTCCAGCCCAGCTCTGTGGGAACAGCCTGTAATAAAAATAGAAATTATTGCTAATCAGGAAAATCCTCCCAGCCCAGCCATGCTCTTCAGCTACAAAACACCTCTGTTTTCTGGTATTAACCTTCTCTACTGCTACCCTCCAGTGTTTGCAGCCTCTATTCTGTAAGCAGGGAAACTGAGGTCCAGAGAGGCGAAGCAACGAGCTGAAAGCTACTGTGAGGGGCAGAGATGAAGCCAAGGTAAGGTCATTGCCAGATCTGTTCTAGTGGGAGGTTGCAGAGAAGTCACTGAGGGCTTCCTGGAGGAGGTGGCAAGAAATCTAAAGGAAGGAGGACTCAGATCAGGAGATAAAAAAGGTGAGGACAATTCTGGCAGAGAGAAACATGTGAAGCTTGAAGTTGGGGATATTTCAGCCACATTCGTTCGTTCCACAAACGCATTGACATCTGCTGTGTGCCATGTCCTCTGCAGGAGGCTGGGGACACACAGAGGACAAGCCAGATCGGGCTCCTCCCTAGTGGGGAGCCCACCTACATAATCGTCCCAAGGGACCGGCAGCAGTGGGAGCTCCAAGAGGGTGCCTGACTCAGCTTGGGGCATCAGGGGGAGTCTGGGGAGGGTTCTTAGAAGAGGAGGGAACACAGAGCTATGACCAGGAAGGTGAAGAGACCACAGTCAGATAAAGGCATTCTAGCTAGAGAAACAGGATGTGCAAAGGCCCTGAGACAAAAGTGTGTCTGGTCTGCTGGACAGATTGATCTCAGGGTAGAGAGATCTTGGGGCTCAGGAGAACGGGTACCAGGTGGTCCAGGGCTTGGGCTGTCTCCTGAGGGCAATGGGGAACCGCAGAGCATGCGTGAGGAGTGGTGGGTCTAGAGGGGGCGCTGAACAGAAGGAGCCAATCCCAACCTGGGCACTTCTAGTGAAGCCTGTCCCCTGATGCCTGTGGCAGGGCCGTGAGCTCACCTCCTGTTTCCCTTGGCATTCGGCACCCCTGGGGGCCGCTCCTGGCTGGTGCTGGGGTTCTTGGGAAAACCACGGCTCCAGGAGGGCCTCTGGGCTTGCGTGTGCCTCATGCAGCTAGGACAAGGGCACATGGAAGCCAAGCCCCTGCCACAGGCTTGGCATGGGGCTAGAAGTGTGGACACACATGGCCTTGTTCATGGCTGGGCCATGAGGAGTTGTGAAGAAGAACATTCTAGGCAGAGGGAATGGCGAAGGCGGCAGTCCTGAGGATGTCCCAGTCTGCGGATCAGACAACAGAGGCCTGGAGCCAGGCACTCTGGTTTCATGTTCCTGCTTTCTGGATCCCATTAGCTCTGAAATCCCACTTCTAGGCAGCAGCCCCCTCCACCCTTGCACACCTTGGCAGCCTCTCATTACACACTTACTCACTCTGGGTGAACTTCCAGCCCTTGTACCTGCTGTTCCCCACCATCCCAAATACCTTCCTCCTTCCTCCAAGATCTGGCTCTGATGCCCCCTCCTTCAGGAAGCCCTCCCTGCTCTTCTTGGGCAGGGCTTAGGGGCTGTGCGACATTCCCCTAAGATGCCAGAATATTTCTGGCAGAGACAGGATGACCTCACCCGGGGGACTGGGGATGTCTGTGTTTTGTTCTGTTCCCCTTTCCCGGGTCCCCCCTGGGCCTGCAGAGAGCCCTGCCCCGATGAGTGTCACATGGTTCTTAGTTCTTATAATTCATGTACCATCGTTACTATTAATAATAGTAACCCCTGCTACCGCTGTGCTTTATGACAGACTCAGGAGCCGCATGGCCTGGGTTCAAGTGTCAGCTGGGCATAGCCTCACTGTGTGACCTAAGGCAAGTTGCTTGACCTCTCTGTGTCTCAATCGCCTCACCTAGAAAGTGGGAGTGATCACTGCTGAGAGGACTGGATGAGCTCAGCGTCTACCTCCAGTGTTAGCCTCATTATACAATATGGAACTTATACACGATGTCGGTTATACCTCAGGCCGTTTTTACTCACATTTTCCTCAGAGAGGGAATGAGACAGCTCAAGGTCACACAGCCAGGATTAGACCTGGAGAAGGCAGGACCCCTGAGGCCTTCACACCACCCCTCTCTGCCCTTGGCCACAGATTGCAGGGGAGAAACGCTAACCCAGGCCCCTCATTAGCTGTGAAGACTGCTGCCTGGGACCTCCTGGCCTGAGCCCTTGGCTGGCGCCCCAGCCAGCCCCCCTTCCCACCACGCTAGACCCAGCGGTTCCAGGAGCCTGGCCAGACTCGGGCAGAGGGGCTGGTGCCTGTGTGATGAGGCCTCGGAGCCCTCCCTGGCAGAGTTCTGCTGGGCCAGGAGACATGTGGGCGCCCCCCGCTTGCCCAGCCGCCTCTCCTGTGAATCCAGAGGGAAAGTATGTCGGGAAGGCAGCCGCCCTGCCCTGGGCGGGCCCAGCCACAGGCTCAGGGTCTGGGGAATTCATTAGAGCAGCGAGGGAGGCCACTTAGCCACTGCTGGATCTGCGGCTGAGGAGCCTGACCCAGCCTGCCTTGGACGGCCCGGCTGGACCCTGCTCTCCAGAAGGACCAAGCAGTGGGGTGAGGGGCAGTGGGGCAGAAAGGGTGCCATCCGGGCACTGGAATCTGGCAGAACCCCCCGACTTGCTCTGTGAGTTCTGGCAAGCCCTGACTCTTTCCCCATCCTTCATTTGCTCTGACTGTGTCGTCATTTGCCTCAGGCTCTCCAAAAGGTATGATAAAGAAGAAAATAACAATAAATATAATGGCTACAATTTTATTGAGCAAGTGCCAAATGCTCGAAAACTTGCCACATCACTTTTGTGGGTTTTCCCTTTTTGTCCCCTCTCCTCACGGCGCCACGGGGCAGGAACTGACCATCATGGGAGACAGCAGGAGACTGCCAGGAAGTCTTGGTCTCTGGCACCAGGAGCCTGAGTTTCATATCCCACCTCTGCTGTGCAGCTTCAGACAAGTTGCTTAACATCTCTGTGCCTCTTTTCTTTTTTTCTTTTTTATGGGGTAGGGGAGGGTACCTTCAAAGGTAGATTTACTTTTAATAATAATGTAGATTTTTGCTTCTCCAGTTTAGAGAATGGACTGCAGAGTTGCCTCAGGGGAGAAAGGACTTCACTAGGAACCAGCTGGAATTTAATGATGTGGCATTCAATGGGCATTGACTTCTGAGAATGGTTTTACATCACTATTATCTTCAGAATTTTCCAGGGATAACTGTGGCTGGACAAATGACCACTTTACTTTTTCCTCCTCTCCTCTCACATTTAATGAGAGTTTTGTAGGTAACAGTAAAACAAACCAGTGTCTGTGTTGCAATAAGAGAGACTGCCTACGGGCTCACTATAGAAGTTTTCTTCTCTCCCTCAGTCTGTCTGTGTTTCTCTCTGTCTAATGAAGTGAAACATGAAAACGTCTAAAGTTGTTTGCAGTTTATCAGCAGCACTAAAAACCCAAGTGAAACGAGGACGATGAGAGCCCCAACCTCTGAGGCTCATCATAAAGCCCGAATACATTAATTCGTGAAAACTACACTCGGCACTTTTTTTTTAGAGATGGGACGATGGTGGTCTGAGCCTCTGCGCCTGGCGGTAGGTGACCTTGGAGGTGGACAAGTGCATACCAGCTGCGGCAGGAGCCCCGGAGTCAGGGAGACCACTCTGCCAGGGAATGTTAGTGTTGAGACCTGAACAGACAGGAAGTTCCCGTGAATCCAGGCATCCCAGGACCACAGAACAGGACGTACAGAACAGGGGGTCACAGAACCAAGGTCACAGCGCTGCGTCACGGCACTGTGAGTTAATGGAACCGTGGAACCGCAGCATGCTCCAGCCGTGGCACTGTGGGATCCTAGGGCCACGGGACCACAGTGCCAGAAGCCCACAGACTCAGGGGATGTGGCCACTATCAACAGGAGCTCAGAACCGTGGGATGGCAGAAGCCACAGAATCCTAGGGGGCCTGAGACACAGCACCCAGAAATCCCACTTGGGAGGTGCCATAAGATGGAGTCTCAGAACTGAGCCCATCAGAAACACCGTCTCAGCTCCACCTTCACCTGTTGGCTGGCCAGCGAGTCTCTCAGAGGCCACGGGAGCTCGGAGGCACTCTCTCTCCATCCCTGGGGCAGCCACCGGAGAGAAGGACCATGCTGTCATCAAGGCCTGGAGCCAGCCAGCCGCCAAACACTCAGCGAGTCCCCTGTTGCCAGGGCCAAGTGAGGCTGTCCGGGTGCCGAGAAACAGTGCCAGCCTCCGGCCAGGCGCGCCGGGACGCCGAGTGCTCAGCAGCAAGTGGAAAAAGAATCAACGGGTTCCTTCTACATCCACATCCTCTTAAAAGCCAACAGAAACATGACTCGGAGGGGAGGTTGTACCCTGGCTGCATTGCCTCCGGATGGCGGCAACGGGAAGCAGCCCCCCAGCACTGCCTCCGCCCACGCCAGGAGTCACAGCCCGGCTCAGGTTGCACCAGACACATCCGCGTACTAATGAACTCTCCAGGGACTGTTCACCCAGCAGACCTGACACCTGATGCTCAGAATAACCAATCTGTTTTGGAGAGGGGAGACTGAGGCCCAGAAGTGAAGACTCCTGGCCCAGATCACGAGGGTGAGAGCTGAGACCCAAACCCAAGCATGATGGATGCTAAGAGTGAGCTTGCCACCACCCAAACGGGCTTGCTCTCGGGCTTCCCCAGCCCCATCCTGTTTCTAAATGTGATCCAGCATGGAAGGTGGGAGGCTGGGCTTCGGCAATTCCTTCCCTTTGCCGAACCCAGATCCTCTTGTTCACGGGGCTGCCATGGGGACGAAACATGATCGTGGTGAGTGCTCACTGGAACCTGGTATTGCTGTCATGAAAGGACTT
>XR_005956344.1 PREDICTED: Pyrgilauda ruficollis uncharacterized LOC121361499 (LOC121361499), ncRNA 
CGCCTCAGGCCGGGATATGCCTGGATGGGGCAGTCCTGGGATGTTGGGGGCTTATCCTGGAGATCGTCTGGTCACAGCGCCCGCTGCCAGGGGAGTAGTTCTGCTGGTTGCTGCCATGCTCCACAGGAGGAACTCAAAGCTCTGGCTAGGATTTTTTTGCAGAATTCTACAGTCATTGCATCCTGGTGGAGAACGCAGGGATTCCTGTTACACTGCTAGCACATAGAAAAATTCCTGGAGGAATGCCACAGGTTGCTGCTCTGCATCTGCTCAGAGAATCAACTGTGCCCAAAGCCATCAATTTCCCCCAGCAGTTCAATGCACAGGAAAACTACCTGGAACTTGTATGTTGCAGTAAGTCATTGAGAACTTGGGGGTTTGTGTTCATCCTAACACAGACATGTGATGGCAGCTGTGAAAATAAGTGCAGTTCCCCGGAGGCAAAGCAGTGCTATGTTTGTGCTGCAGCAGCCTGGGCCAGAGGAAGGTGAGAGAAACCACAGTGGGACAGGTGAGGCACCAAAAATGCCTTTATCTTACCTGTGGCCTTTTGGACAAACTCCAGTTGTATCAACCCACAGCATCAGACAAAGCTGCTTTTAAGAACACTGATGCAAAAATGAGATCTTGGGTGATCATTTCTGGTTCAAGTAGCGGTTTATATATTTATTATAATTATACACAACCTTGACAATCTGTATTGCCATTCAAAAATAAATCCAAGTCTTGTCAA
>XM_003890613.1 Puccinia graminis f. sp. tritici CRL 75-36-700-3 hypothetical protein (PGTG_20695), mRNA 
ATGGCGCAGCCATCAAGTCCGTTGCTCCACATGCGGCCTCCAAACAGCATATCTCTGCCCACATCTTTCTTAAACATTTTTCTTTCTTTAAGCAGTGACGCCACCTCCCTCAACAACACAAGCAAACTTGCTCTTGGAGCAAGCTCCCACTCTAGTCACCATGATGATTCTGGCGAAACCGTCCTACCTCAGCCCGTGATTTATATCATCATCGCAGGGATCGCTTTAGCAGTGATATTGGCGGGATTTGCGATGTGGTCATGTGTTCAAAAGCGCAACAGACGTCGTAGCCGAAAGGCATCATTCTCGATGTCCCAAGCTTCTGAAAAAGAATGGGGCACCACTCGCGAGATGGCTGGCGGCATGGAGAGCGTTTACCGGCACTCCGTCATCACCTATGACGCCAAGGCTCAACCCAAGCTGCTCTATGAAGACTTGGATTTCGGTCCAATGGTCACCTCGCAACTTCCAAGTCAAAAAGAACTGAATCAATACAAGAAAGATACCATCGTGTGTCTAACCGACGTCTATGGAAGTACCAAAGGATGGGACGGCTCAGAATTTGACTATATGTTAAACTCGCCAAATCAATTCCCACCTGCGAGAAGCAGTCCCGATCTCTTATCCTCGCTTCCCAAAGCACTTTTAACTGGGAACCATACGGGTCGACAACCGGCTGTCCCGGGGTTTCGCCCATACCGGTCACCATCCGGCCAATTGATGGTCAAGCCGTTCTCTTCGACCAAAATGAGCCCCGCTGAAGCCTCTAACGAGCTGCAAAAGATCATCAACGCGCATGCCAACCTTGAGAACTTCGATGACTTGTTCGACCACGGCGAAAGCTTCGATTCTTCCAACCTCACAAACTCCTTTGATGGCACTCCAATCCATTCAAACCCTGAACATTTCCCTATCCTCTTAGGTAGCTTCCCTGCTGCCCGTAAACTCTCCTCTTCCTTCTTACCCGGCGCTGATAAAAGCTTGCCCAAAGAAATCGTCCAACTTCCCCTTCCCCGGTATAACTTCAAGCAAACCACTGCTTGA
>XM_051686607.1 PREDICTED: Myxocyprinus asiaticus autophagy related 9B (LOC127434116), transcript variant X2, mRNA 
CGTCGAGCGATGTTTGTTGTGATTTCTGTTATTGTTGTGAAGCGCAAAGGCGAAGATCATCGTTAGTCGGATGGATCTATGGTGAACATCATAGAGAGGTAGAATGTAAAACACGATGGCTGATTTTGAAACGTATCAGGAGTATCAGCGTATAGAAGACTATGATGAAGACTCACCCCAAGGAGAGGAAGACTTACTTATTCATGTGCCAGAGGGTAGAGGAGACCCATGGCATCATATCAAGAACCTCGACAATTTCTTCACAAGAATCTATCATTTCCATCAGAAGAATGGATTTGCCTGCATGGTGTTGTCAGAGTTTTTTGAACTTGTGCAATTCCTGTTTGTGGTCACGTTTACAACTTTCCTCTTCAACTGTGTGGAATATGATGTTCTCTTTGCCAACCGAGCGGTCAACCACACGGGCCAGAGTCTCGGTCCCCTTGACAGAAACAAGGTCACCCTTCCTGATGCTATTTTACCCAGGGAGCAGTGTACTGAGAGGATTGAAGGCAACAGCTGGATCATATTTCTCTTGATAATGGCAGCCATTTTTTGGGTCTATCGGCTCGTGAAGGTGATCTGCAATGTCCTCAGCTACTGGGAGATCCGGCAGTTTTATATTAAAGCACTCAAAATACAGATGGACGAGTTGTGTAACTTCTCATGGCAAGAAGTTCAAGGCCGTTTGATTCACCTGCAGCGTGAGCAGCCCATGTGCGTCCAAAAAAGGGAACTCTCCGAACTGGACATCTACCACCGCATCCTACGCTTTAAAAACTACACCGTCGCCATGATCAACAAGTCTCTGCTGCCCGTCAGACTGCGCGTGCCCTTTTTCGGAGACATGATTTTCCTCACGCAGGGCCTAAAGTACAACTTTGAACTTATTCTTTTTTGGGGCCCCCTCTCGCTTTTTCAGAACAAATGGAGTTTACATCCCAAGTACAAACGAGCTGCGAACCGCCAAGAGCTTTCGAAACAGCTCAGCCGTGTTATATTGCTAACTGGCATGGTCAATCTTCTGCTTTGCCCATTCGTGGTGGTGTGGCAGGTGTTGTATGCGTTTTTTAGCTATGCCGAAGTCATCAAACGGGAGCCAGGCAGTTTGGGTGCGCGCCGCTGGTCGCTGTACGGCCGTCTTTACCTGCGACACTTTAATGAGCTGGATCATGAGTTGCAAGGCAGGCTGGGTCGCGGATACAAGCCGGCCGCTAAGTACATGAACGCCTTTGTTTCTCCCCTGTTGACGGTGCTGGCGAAGAATGTGGCTTTCTTCTCCGGCTCAGTGCTGGCTGTGCTGATTTTGTTGACAGTGTATGACGAGGACGTATTGACGGTGCAACACATCCTGACGGCCATCACTGTGCTGGGCGTGGTCATCACGGTCTCCAGGTCATTTATTCCAGATGAACATATGGTGTGGTATCCTGAACAGCTGCTGCAGTGTGTCCTGGCCCATATTCACTACATGCCGGATCACTGGAAGGGCAATGGCAACAAGAGCGAGACTCGCGACGAGATGGCACAGCTTTTCCAGTACAAAGCGGTCTTTATCTTGGAGGAGCTCCTCAGCCCCATAATTACCCCGTTCATCCTCATCTTCTCCCTAAGGAACAAGTCTCTAGAAATCATCGACTTCTTCCGTAACTTCACAGTAGACGTTGCAGGAGTAGGTGACATATGCTCATTCGCTCAGATGGACATCAGACGGCATGGCAACCCACAGTGGATGTCCGAGGGTCAGACGGAAGCTTCGGTGTACCAACAGGCTGAAAACGGCAAGACAGAGCTGTCTCTGATGCATTTCACCATCAAAAACCCTCACTGGCAGCCGCCGCAGGAGAGCTCTGTGTTCATCAGTCACCTGAAGGAGAAGGTTCAACAGGATGCACAGACAGGACCATCTCCTCAGCTGCTGCTGTCTGAAGCACCTCTTTGTACCTCACTACTGTCTAATGAGTCTGCCACTGGTCCTGATAACCTGTTAGCCAGCGTGTTGGCTCACCCCGTACTGACTGCATCCGGACTGCCTGGATGGAATCATCGTTTTATCCCACAGAACAGCGCAGCCTCAGCAGCCGCCAGCGTTCTGGCGTCCCTGTCTTCATCCCAGCAGCCCCATGCTGGGCGTTCACGTTCACACACTCTCCTACCCTCCAGACAGCATCAAGATGGCCCTATGTACTACAGTGAGCACACTGTGGGCGACAGGCCTGCACCCCTGAGTCTTCTCTTTACTGTTGCACATGAAACTGGTGTTGAGCGGGTAGAATTCAATGAAGCTGTCAGCTGAGGACATCATGTCCGCAAGTGACTCCAAGATGCTCAGCCAGTCCAAATCAGCCCTTGCATCAGAGTTTGCATCTGCTGAGATGAGCCTGCATGCTATATACATGCACGAG
>XM_028933362.1 PREDICTED: Prosopis alba uncharacterized LOC114745209 (LOC114745209), transcript variant X1, mRNA 
ATCAACGGCCAAGTTCAGGACCTCAATTTCAATTCTCCTCCCACCAATTCCCACTAATTGAAGCCCAACTAAGGCCAATATGGGCGCGGCGGCCGGCGTCGGAGGCTACCCTGTCGGACTGGACGAGTCGTACCGGCCACTTCCGGGGCTTTACTTCGCCTTCTTGTCCATCTGGCTTCTCTCTGCTTGCTCTTGGACTCTTAATACCTACAAAAAGCGCCAGTTTCAGTCAAATAATTTGCAGTGGGCACTAACCTCAGTTCCCTTTATAAAAGTATTGCAGCTCCTGCTGTCCTTTCTCTTCTGGTATTCATGCTTCTATTTTCAGGCATGTTCCTTGTGGATGTCATTTGGGGTGTATGTAACTGGGGTGCTCTTTCAGACTGCTGCCTTTGTCTCCTTCTTGCTCATTGCTCATGGCTACTGTATCATGTGTGAGCATCTTTCTTTAAGTGAACGCCGTACAACTGCTGCACTTGGATGTGTCTTTTACTTAACGCTAGTGGGTTACAAAGCTTGCGTACCATACTTCACGGTTCTTCTGCTACTGAATTATTTCATTTCATTCTATGTTATTTTCCGGCATATATCACAAAACCTATTGTTGTTGCGGGAACAACTGAGTATTGTTGAAAATGAAGATGTTCGGACAATGCATGATGCTCTGTATACGAAGTACATGATGTTCAAGAAATTCCAGGTTGCAATGCAGATAGTAGCTATGGCAGAAACTATGATATACATGAACATGGATGACTCTTCAGAGAATTACTGCCTTCGGTTACTAGTCAGAGAATGGGCACAATTCTGCATTTTTTCATACATTGGGTGGACTTTCAGGTCACAGGACTTGGCGCCACGCTTCTCTGTTATGCCTGCCACCAAGTGTAAAGGCGATACTTTGGTGCCTCCCATCTACAGTATTGAAATGGATGCCGCTACTTTTAAAGATTTCAGTAGTCATGAATGGCACATTGGGGTGCCAACTTCTGCTTGCCGTGATGAAAACTCAGAAGGTGCAGTTCTAGTGATCATTGAACATCCCCACTCACAGAGGCTAAGAACGCCTGATACTTCCTCTTCTCCTATTGTGTCAAATCTCATTTCACAGACATCTTCATACCGAATATAATCAATCAACATTAGCTCTACCATCTAGTCATCTATTGGTTGCCCATGCCTTTTCTCCTGCAATCTGGCATGGGCATGCCAGTACACTCACTGCTTCCGGGTTTAGAAGGTAATTTGAACGTTTCAAGCTGAGAGGAAACAAGAAGAGTAGAAGTATATATTGGGTATAGTCTCCCCTCTTTTTCTTTTTCTTACCAACTCTTTCTTTCTTTGTTTCTTTCCTTTTTTTTTTGCCCTCTTCTTTTTTAAATACTTTACAAACTTTTGCTTTAGAAAATGCCATGAGTTAGTCATGAGCTGAGGGTAGAATAATGAGTGTTATCTTGTTTAGAGGCAACCACAAATATGTATTCTGTACACCATCGAAGCAAATGGTAACTGTATATTGTTCTTCCTTGTACTGTTGTTCTCTCATTGATTATTTCCGACTT
>XM_003035727.3 Schizophyllum commune H4-8 uncharacterized protein (SCHCODRAFT_02607625), mRNA 
ACCACCATGAGCTCCAGCGACACCCAAGAGCGACGCTGCTGTGCGATCTGCTCCTATCCTGCGCCCAGCCAATGCTCTGGCTGCGGACAGGCGTTTTACTGCTCGAAAGAGCATCAGACACTGGCGTGGTCTAAACACAAGCGTCTATGCAAGATCTATCAGCGCCAGGCTCGAGGGGAGCCCGTCCCTTCCCCAGATTCCTACTGCGGTCTGTGCGGGAAGGAGAACGGGCCGCTCCGTCGGACAGAATGCTGCAACAGAACTATCTGCGACGACTACGGGAACTACACGATGTTCTCGTTCAGCGCCAACAGCTGCTCCCGAAACCATGATCGATATACGCGCTGCTGCTACCATTTCAACGAAGGTCACCCCGGCAGCGACCCTCTGCAGTGCACTAAGTGCTCTACTAGCCACGACGCGGAGAAGGAAGCGTGGTACATGACGAACAATTACAACTTCCAGGAGGACATACTACGGGCCAATCCGGCATCCTTCGCACCAAAGCACTGCACCGGGTGCGGCAGGCAGGTCAAGCAGAATGCCGAAGCCGTTTCGTATGGGCCAAGTGGTCTGCAGTGTGGCCGATGCACGGAGAGGATGGCTCCTTCTGTGCTGCCTCAAGATACTTACCAGTTTGACTCTTGAAAGGTAGCGACGTACGCGCCAATGTAATACCCTGATCTATGTTTGTGACCAAGAGGTTCATATCATCAGAGTCGACGCAACGAAGTGCGCTCGTTGTAAGTAATCATTTCAAGAATGTTGCAGCGCATACTGTATATTCGCGAGCGCGGGAACAGGTAGAGTTCATGAAAATCCTATCTCAAGTACTGGAAACATGTACTACGGCGCTGGATCTCCTTGTCGTCATCACAGTCCGATGTACTTATGTGTGTAATGGGCCCTTTCCCTTCAC
>XM_019346602.2 PREDICTED: Oreochromis niloticus filamin-C (LOC100698591), transcript variant X4, mRNA 
CTTTTTAATCGACTCAACCCACTAGAATCATCACTGTGGACATTTTTTGTGTATAAAGACTATTTATATGTGTTTCTGTACAGCCAGGCTGATGTTCAACACAGCTGGGATAAAACCAGCAGCTCTTATAAAGCTCTAACTGCACACATCTGTATGTGATTATTGCAGAGCTGATCTTGGGCTTCACTCTGGGTCAAGTTCAGCTTGTTTCACGTAGAAGCAGACCGTGCTCAGCAGGGGGCGCTGCTGTTTACGTCAGTAAATCTCTTCAGTTTGTTTTATTCTTCAAAAAACTTGTATTAAACGCAGCATGAAATTTTTCTTCCTCTCTCGCTTGCTCCAGTTTGCCGCGCCTCCATTTGCCTCCATTTGGCAGCCAATGGAATTGCAGGAAGCAGCAGCACCTCATTCAGTTAACTGTAAACACCCAACCTCCATTGTAGTTACCATTAATTGTCATTAATCATTATCACAGAGTCTATTGTATTTTCAGATCTGATATGTATTTCCAAACTGAAGTAAACTTCGATGTTGTTTATTTCTGCTTTGTTATTTAAATGTCACGCAGTGATTTGATTGGCTGCCTGATGGTGATGTCATGTCCCTCCTCAGGGTGTCTCTCCAGGTTTGAGGACTAAAAATACCCGGAGGTGTCAGAGCGGCTGTGGAGCCCCGGGTCCGGCTGTCGGGGTGGGGTAGGTGGGGGTGTCCTGGTTGGGGTATCCAGCGTGTCTCCACCCCCTGCTCCGCGCCCGACCAATGATCTGCGGTCTCGGTGTCCTGCGGCTCGGAGGATGCCCGGGTCGCAGTAGTATATGGTCATGGCAGGGGCATTCCTGGAAGTCCTGCGCAGTGACGCCGAGCCTTTAAACCTCGCTTCACGCTCCCGCAGCTGCACAGCCCCACTCTGTCCACGCCGCCGCCCGTGCGTGACCACAGCCAAGCCAGCCGGAGGACAAAAGCAGACTATTCTTCACTCTTCCTCCTGAGCCTCCTCTTTCTCTGAGAGTGTGAGTCCGCAGGAGTGCCCGCGGGTCTGCATGCGCGCCTCTTTACGCACAGCTCCGTGAAGCTCCCTCCCCGCGCGCTGGGCACTGCCCCTCCGCTTCCACTGCCCCGTTTCTCTTTTTTTTCTGCCTTTCCTTCTCTTCCCACTGCGCTCGGTGCTATAAAAGGCATGTCCATGATGAGCAACAACAGCTACTTGGAGCCCCAGCAGTTCTACCAGAGCACCGCGGACATCGGCGAGGAGGAGGAGGAGGAGGAGATGCCGGCCACCGAGAAGGACCTGGCCGAGGACGCCCCGTGGAAGAAGATCCAGCAGAACACCTTCACCAGGTGGTGCAACGAGCACCTGAAGGTGATCAACAAACGCATCAACGACCTGCAGAAGGACCTGAGCGATGGGCTAAAGTTAATAGGGCTGCTGGAGGTGCTGAGCCAGAAAAAGATGTACCGGAAGTACCACAGCAGACCCAACTTCAGGCAGATGAAGCTGGAGAACGTTTCCGTGGCGCTGGAGTTCCTGGAAAGGGAGCACATCAAGCTGGTCTCCATCGACTCCAAAGCCATCGTGGATGGGAATCTGAAGCTGATCCTGGGTCTGATCTGGACCCTGATCCTCCACTACTCCATCTCCATGCCCATGTGGGAGGATGAGGATGACGAAGACGCCAAGAAACTGACTCCTAAACAGCGTCTGCTGGGCTGGATCCAGAACAAGGTGCCCCAGCTCCCCATCACTAACTTTCACCGAGACTGGAGGGACGGCAAGGCGCTGGGAGCTCTGGTGGACAACTGTGCCCCCGGTCTGTGTCCCGACTGGGAAACATGGGATCCCAGCCAGCCGGTGGAGAACGCCCGGGAAGCCATGCAACAGGCTGACGATTGGCTGGGAGTGCCACAGGTGATTGCTCCTGAGGAGATCGTCGATCCTAACGTGGATGAGCACTCTGTCATGACCTACCTGTCTCAGTTCCCTAAAGCCAAACTGAAGCCCGGTGCCCCCTTGAGGGCCAAATCGCTACACCCCAAGAGGGCTAAGGCCTACGGACCAGGTATCGAGCCTCGAGGTAACATGGTTCTGAAACCAGCAGAGTTCCTGGTGGAGACAGTGGAGGCTGGACTGGGAGAAGTTCTAGTTTATGTGGAGGATCCAGAGGGACACACAGAAGAGGCCCGAGTCATCCCCAACAATGACAAGAACCGAACCTACTCTGTGGTCTACCTGCCCAAAGTGGAGGGGCTTCATAAAGTAAAGGTGTTGTTTGCTGGTCAGGACATCGACAGAAGTCCCTTCATTGTAAATGTTTCAAAAGCCATGGGCGACCCAACCAGAGTCCAGGCCCGCGGGCTGGGACTGCAGCCAATGGGAAATGTGGCCAACAAACCTACATACTTTGATATTTACACTGCAGGAGCGGGTGCTGGAGATGTGGGCGTCATCATTGTGGACTCAAATGGCCGCAGGGATACAGTGGAGATTGTCCTGGAGAACAGAGGCGACAGTGTATTTCGGTGCACCTATGTCCCTGTCCTGGAGGGGCCTCACGTCGTCTGTGTGACTTTTGCTGGGCAGCAGATTCCCAGGAGTCCTTTCACTGTCCACATCTCCGAAGCCTGTAACCCAAACGCCTGCAGAGCATCTGGCAGAGGTTTGCAGCCGAAGGGTCTGAGAGTGAAAGAAGTGGCAGATTTCAGAGTTTACACCAAAGGAGCCGGCAGCGGGGAGCTCAAAGTCACCGTTAAAGGACCAAAGGGCCTGGAGGAGCCGGTGAAGGTGCTTGAGATGGAAAATGGCCTGTATGAGTGTAATTATTACCCCATCATGGCAGGAAAGTACATCGTAACCGTCACTTGGGGCGGACACAGCATCCCTCGCAGCCCATTTGAGGTTTATGTCAGTGAGGAGGCAGGGCTTCAGAAAGTGAGAGCCTGGGGTCCAGGTCTGGAGACCGGTATGGTCGGGAAGAGTGCTGACTTTGTGGTGGAGGCCATTGGAACTGAAGTGGGAACTCTCGGTTTCTCTATCGAGGGGCCCTCCCAGGCTAAGATTGAGTGTGATGATAAAGGCGATGGATCATGTGATGTTCGATACTGGCCGACTGAACCAGGCGACTACGCCGTCCATGTTGTTTGTGATGACGAGGACATCAAGGACAGTCCCTTCATGGCCCACATTCTCCCTGCTGCCAGTGACGTCTTCCCTGAGAAGGTGAAATGTTACGGTCCAGGTCTGGAGCCTTTGGGCTGCATTGTTAACAAACCTGCTGATTTCACCATTGATACCCGTGGAGCTGGCATCGGAGAGCTGAAGCTCTATGCTCAGGATTCAGATGGTTTCCCCATCGACATCCAGATCACAGATAATGGAGACAGCACCTACTTCTGTGTTTACATTCCCACAAAACCCATCAAACACACCATTATCATCACCTGGGGTGAAGTCAACGTCCCTAACAGCCCGTTCAGGGTGACTATTGGAGAGGGCAGCCATCCAGAGAATGTGAAAGTTTATGGTCCAGGTGTGGAGAAGACAGGACTGAAGGCCAACGAGCCGACTTACTTCACTGTGGACTGCAGTGAAGCCGGACAGGGTGATGTCAGCATTGGCATCAAGTGCGCTCCAGGTGTAGTTGGACCTGCCGAGGCCGACATCGACTTTGACATCATCAAGAACGACAATGACACATTCACAGTGAAGTACATGCCTCCAGGTCCCGGACAGTACACCATCATGGTGCTGTTCGCTGATCAGGAAATCCCTATTAGCCCCTTCAGAATAAAGGTGGATCCTTCCCATGATGCAGCCAAAGTCAGGGCAGAGGGACCTGGACTCAACAGGACAGGGGTGGAGGTGGGTAAGCCCACCCACTTCACCATTTATACAAAGGGAGCTGGTAAAGCCAAACCCGAGGTCCACTTCACCGGAGCAGCTAAAGGTGATGCCGTCCGAGACTTTGAGATCATCGACAACCATGACTACTCATACACTGTCCGCTACACGGCGGTGCAGCAGGGGAGCATGTCCATCATTGTGTGTCACGGAGGAGACCCCATCCCAAAAAGCCCATTCACCATCGTTGTGGCCCCCCCACTGGACCTCAACAAGGTCAAAGTTCAGGGACTGAACAACAAAGTAGACGTTGGGAAGGATCAGGAGTTCTCCGTCTGTACTCGAGGTGCTGGAGGTCAGGGCAAACTAGACGTGAAGATCACCTCCCCTTCGCGTCGACCAATCCCCTGCAAGGTGGAGTCGGGGACAGCCAATGAGGTTCATACAGTGAAGTACATTCCTCCCGAGGAAGGACCATACAGAGTGGACATCAGCTACGACGGGAATCCTGTCCCAGGGAGTCCATTCACTATGGAGGGTATCATGCCCCCTGACCCTTCAAAGGTGCGAGCCTATGGTCCAGGCCTTCAGGGTGGTGTGGTAGGCAAACCAGCCCCCTTTGCCATTGACACAAAGGGTGCTGGTACTGGTGGTCTGGGTCTGACAGTGGAGGGGCCGTGTGAGGCCAAGATTGAATGCCAGGACAATGGTGATGGATCCTGCTCTGTGTCCTACCTGCCGACTGAGCCTGGTGAATACGCCATCAACATCCTGTTTGCAGACCAGCACATCCCCGGTTCTCCCTTCAAGGCTGTGGTCCAGTCAGTGTTTGACCCCAGCAAGGTGACAGCCAGCGGCCCCGGGCTGGAGCGAGGCAAGGTCAACGAGGCTGGAACCTTCACGGTGGACTGCTCCAAAGCCGGGGAGGATGAGCTCACCATCGAGATCATCTCTGACTCTGGGGCCAAAGCTGAAGTTCACATTCAGAACAACAGTGATGGGACCTACTCCATCACATATATCCCCCAGTGCCACGGGATGTACACCATCACCATTAAATATGGAGAACACATGGTGCCAAAGTTCCCCATTCGCTTGCAGGTGGACCCAGCTGTTGACACCAGCGGGGTAAAGATCTATGGACCGGGAGTGGAACCCAGAGGCGTCCTGAGGGAAGTAACCACTCATTTCATCGTGGACGCTCGAGCTCACTACAAGAGCGGTGGCAGCCATATCAAAACCTCGATCTCAAATCCGTCGGGCACCAACACAGACGCCTACATCACCGACAAGGGAGATGGGACATACAAAGTCGAGTACACACCCTACGAGGACGGTTTGCATCTGATTGAAGTTCTTTTGGATGACGTCTCGGTGCCGAAGAGTCCGTTCAGGGTGTCCGTGAGCGAGGGTTGTGATCCCAGTCGAGTCCGAGCCTACGGTCCAGGTCTGGAGGAAGGACTGGTGAACAAACCAAACCGATTCACTGTTGAGACCAGAGGTGCTGGCACTGGGGGACTTGGCCTGGCCATTGAGGGTCCATCAGAGGCAAAAATGTCATGTAAGGACAACAAAGATGGCAGCTGCAGTGTGGAGTATATCCCCTTCACGCCTGGAGAATATGATGTCAATATCACCTTTGGAGGCTTACCGATCCCAGGGAGCCCGTTCCGGGTCCCAGTGCGAGAGCTGGTTGATCCCAGTATGGTGAGGTGTTCAGGTCCTGGCCTTGGAAGTGGAGTCCGGGCTCATGTTCCTCAGACTTTTACTGTAGACAGCAGCAAGGCAGGGGTGGCTCCCCTGGCAGTTCAGCTATATGGACCAACAGGTGTAGCTGAGCCCCTCAACATCACAGATAATGGTGATGGCACTCACACGGTCAACTATACTCCTGCAAACGATGGCCCATATACAGTGTGCGTGAAGTATGCCGACCAGGAAGTGCCCCGGAGTCCTTTTAAAATCAAGACATTACCGGCTCATGATGCTAGCAAAGTTCGAGCCAGCGGTCCCGGACTGAATGCATCCGGGGTTCCAGCCAGCCTGCCAGTGGAGTTCACCATTGATGCCAGAGATGCTGGAGAAGGACTGCTCACCGTCCAGATTCTGGGTCCGGACGGCTGCAGTCGCGAGGCTTCATTGTTTGTGGAAGACTGGGGCAGGAGGGTGTGGGAGACTCACATAGTAAAGAAAACCATCCCCTTCAGTATTCTTAGGAGAGGCTCTGATCCAGAGGGAAAACCCAAGAAGGCGACCATTCGAGACAACAGAGATGGGACGTACACAGTGTCCTACGTGCCGGACATGACGGGGCGCTACACCATCACCATCAAATACGGAGGAGATGAGATCCCGTACTCACCTTACCGGATCCACGCCCTGCCCACCGGAGACGCCAGCAAGTGTCTGGTCACAGTGTCAATCGGAGGACACGGACTCGGTTCAGGAATTGGACCAACCATCCAGATCGGAGAGGAAACTGTCATCACCGTGGATGCAAAGGCTGCAGGGAAAGGTAAAGTCACCTGTAAGGTGTCAACGCCGGACGGAGCGGAGCTGGATGTGGATGTAGTGGAGAACGCAGATGGGACGTTCGATATTTATTACACGGCTCCAGAGCCAGGGAAGTACGTCATCACCATCCGCTTCGGAGGGGAACACATTCCCAACAGCCCCTTCCATGTCGTGGCAAGTGATACCATCCCAATAATAGAGGAACCATGTGACAAGCTTCAGTTACAGCAGCCCTACTCTCCCTATGCGGCCTTCTCCCCTCAATGGGCCACCGATGATCCCATCAGCCCTGTGGACGGGCTGGAGCCGATGCTGCGTCCCTTCAGTCTGGTCATTCCCTTTACGGTGCAGAAAGGAGAGATCACAGGTGAAGTCCGCATGCCTTCCGGCCGAACAGCCCAACCTAACATCACCGACAACAAGGACGGGACAGTTACTGTGAAGTACTCGCCAACTGAACGAGGCCTCCATGAGATGGACATCAAATACGATGGCAACCACATCCCAGGAAGTCCACTCCAGTTCTATGTTGATGCTATTAACAGTGGTCATGTGACAGCATACGGTCCCGGCCTGAGCCACGGCACCATGAACCGACCAGCCACTTTCACTATAGTTACAAAAGATGCTGGAGAAGGAGGTTTGTCTCTGGCGGTTGAAGGTCCATCCAAAGCTGAGATCAGCTGTAAAGACAACAAGGACGGGACGTGCACAGTGTCCTACCTGCCCACGGCACCTGGAGACTACAACATCATCGTCAAGTTTGATGACAAACACATCCCTGGCAGCCCCTTTACCGCCAAGATTACCGGTGACGACTCTATGAGAACATCCCAGCTTAACGTTGGCACGGCAACAGATGTTTCCTTAAAGATTATGGAGACAGACCTGAGCAGCCTGACCGCGACGATCAGAGCTCCGTCAGGAAACGAGGAGCCCTGCCTGCTGAAGAGGCTGCCCAACAGACATATCGGAATATCCTTCACACCAAAGGAAGTTGGTGAACACGTGGTCAGCGTGAAGAAGAACGGGAAGCATGTGACCAATAGTCCGTTTAAGATCATGGTGGGTCAGTCGGAGATTGGAGATGCCAGCAAGGTGAAGGTTTACGGTCAGGGGCTGGTGGAGGGACACACGTTCGAGGTGGCCGAGTTCATTGTGGACACGAGGAATGCAGGTTATGGAGGTCTGGGTCTGTCCATCGAGGGTCCCAGTAAGGTGGACATCAACTGTGAGGACGTGGAGGACGGGACATGTAAAGTCACCTACTGTCCCACAGAACCAGGAAACTACATCATCAACATCAAGTTCGCCGACCAGCATGTGCCAGGAAGTCCGTTCACGGTGAAGGTGTTTGGTGAAGGTCGGATGAAAGAGAGCATCACCCGGAAACGTCAGGCACCCTCCATTGCCACCGTGGGCAGCACGTGTGACCTCAACCTCAAAATACCAGGAAACTGGTTTCAGATGGTTTCAGCTCAGGAGCGTTTGACCCGGACATTCACCCGCAGCAGCCACACCTACACCCGGACCGAGCGGACAGAGATCAGCAAAACCCGAGCCGGAGAGACCAAGAGGGAGGTGCGGGTGGAGGAGAGCACGCAGGTCGGAGGAGATCCCTTTAGAGACGTATTCGGAGATTTTCTAGGGCGAGAGAGTCTTAGCGGCTTCGGCGGGATGCCGACTGGCAGCCGACAGCCGCTGCAGAACGGTGAGGCAGCTAACCAGGAGATGACGGCTCAAGTGACGAGTCCTGGAGGAAAGACAGAGGACGCAGAGATCATTAAAGGAGAGGACAGCACCTACAGCGTCCGCTTCATCCCTCAGGAGATGGGACCTCACACTGTCAACGTCAAATACCGGGGCCAGCACGTCCCTGGGAGCCCCTTCCAGTTCACTGTGGGGCCCCTGGGAGAGGGAGGGGCCCACAAGGTCAGAGCAGGAGGCACTGGACTGGACCGCGGAGTGGCAGGAATCCCAGCGGAGTTCAGTATCTGGACCAGAGAGGCTGGTGCTGGAGGTCTCTCAATTGCTGTAGAAGGACCCAGCAAGGCTGAGATAACATTTGAAGACAGGAAAGACGGATCCTGTGGAGTCACCTACGTAGTGCAGGAACCTGGTGATTATGAGGTCTCCATTAAATTCAATGATGAACATATCCCAGACTCCCCCTTTACCGTCCCCATCGCCTCACTGTCAGACGACGCTCGCCGCCTCACCATCACCAGCCTGCAGGAGATGGGTCTGAAGGTGGGTCAGGAGGCCTCCTTTGCAGTGCAGCTCAATGGAGCAAGAGGGCTGATTGATGCCAAGATCCACACGCCATCAGGAGCCACAGAAGAGTGTTACATCACTGAGCTGGACAGTGATCAGCATGCTATCAGGTTCATCCCAAAGGAGAATGGAGTTCATTCTATAGATGTTCGTTTTAACGGCAGCCATGTGCCCGGCAGTCCCTTCAAGATCCGAGTAGGAGAACCGGGTCAGGTCGGAGATCCAGGAATGGTGTCTGCATTTGGACCAGGTCTCGAGGGAGGAACCACAGGCGTGGCATCAGAGTTTATTGTCAATACTTGTAACGCCGGCTCAGGAGCACTGTCCGTGACAATTGATGGCCCATCAAAGGTTAAGATGGACTGTCAGGAGTCTCCTGAGGGGTATAAGGTCTCCTACACACCTATGGCTCCTGGAAGCTACCTGATCTCCATCAAGTATGGAGGACCCCAGCACATTGTAGGCAGCCCCTTCAAGGCCAAAGTATCAGGACCTCGTCTGTCAGGTGGCCACAGTTTGCATGAGACGTCGTCTGTTCTCGTGGAGACCGTCAGCAAGTCGGTAGCAATGGGCAGCCCCTTTGCCTCTTTGCCTAAATTTTCCTCAGATGCCAGTAAAGTCATCTCCAGAGGCGCTGGCCTTTCGAAGGCCTTCATTGGTCAGAAGAACACCTTCACAGTCGACTGCAGTAAAGCAGGCACAAACATGTTGATGGTCGGTGTCCACGGGCCGAAGACACCCTGCGAGGAAGTGTACGTCAAACACATGGGCAACAGGATGTACAATGTCACGTATACTGTTAAAGAGCAGGGCAGCTACATCCTCATTGTGAAGTGGGGAGATGAGAACGTCCCTGGCAGTCCGTTCCATGTCACCGTCCCTTAAAACTGAACTCTTCACTGTCTCCAGCCTCTTCAACATCTGCAATGCACTGACGATTTTTCACTTACTGTTTTCTGCTAAATACGAACATCAGAGCACAGCTTCAGTAACCACAGGTTGTTCGTCGAGGCTTTTCTTCTGTCAGTTGCTCTTTTAAACATCGTCCCATTTAACTTCAAGAAAAGAGAATTTAAAGAGTTCAAACTGACAACAGCCCACACGCCTCAGAATTTGACCTGTTTTCATGCGTCCTTTATTTGAGAAGATTTGTTTCCTGCCAACATGTGGATAACTATGCAGGTGTAAACATCTGGTTCATAGCAGCTAAAAACAAACGTGCAGGATGCAAACATTAAGACTGGATTTAAATGTGATCTGCAATATCTGGACTAGTTTATTTTCTTGATGACAGGTTTTCTGTTAGTATTTCTGAAGATATGCAGCACTCAAAGAGGTCCAGAGGTGTCTGAGAAGGTCACCATGAAGGGGAGACTGCATACATTTCCATCTTTTTTGTGTGTGTCCAGTTCCCTGAAATTTTTCATCACATCTCATATTGTGTACAGTATGTGCATTAATTCACAAACACAATCTCATATTTAGTGAAAAATTCAAGCCGCAAGTTGCTCTTTTGCTCCCACAAACCAAACAATTCAGACAACTTAGCTTAAACAGAAGAAACAGTTTTATCTTCAGTGAGGAAAAAAGTGCTTCAGAGTCCCTTGTTTCTTATCTCCATCTGTAAAAACCGGAAACGATAAACTTTCTCTAAGAATCCTTATTTCTTACTGATGCTCATCCAATAAACACTAACACTTCTGACCCTCGGACTGTCTGCACTCCAGCCGTGGTGACTATCATCCAAAAATCTGATTGGTCAGTAGATGGTGATCTCTTATCTGCAACATAACCTGGAGCAGCTTTGATCTGTAGCATCAGTTACCATGGTGACATACCACCTTCATAACCCTGAAAAGACAGAGTTAAACCCGAAGTTAGCTTGATAACTACAGATCCCTAAAAGCATTCATGTTTTCTCATGGATGAGTTAAATGTCTTTCAAAGATATTAGTGTCACATAGTTGGAATAAATCTCTGAGTGAAAGATGGTGTTTAGTTAGCCTCAGCAGGTCTCCCTTTCCTCAGGATTCAGTTTCAGGTGAGCGAGAGACTATCTTCCCTCCAGGTTGAATCAGATGCACTCGGCAGGTCTCTGTATGTCAGGGTTTGTCCCAATTGCTCATGTGGTGTGGGCCCAGCTGTGGGATGTGGAATGATCAAGATGAGCTGTGCTGTGAGATTAACAAACTTTTCTGTTTTTATTTATTCTGCAGCATTTTTCTCTCCTTTGATTTTCTTTGACAGAAAATGGTCTTACTGTTGAGAGAAGCAGGTGATAATGGATTTTTTTTTTTTTACCACAGGAAGGAAGTGCAGTGGAGTTTCCTTTGTGAATGTTGGAAAAACAGCAGCAGATATTAGAGTGACATTTTATAGTGATTTTATATGTATGAGTGAAGCAAAGTTTAAGTGTTTGATATGTTAACCTTCTGTATTGCAACACTGTGCAGGCATAATAAAAGTTTATCTGTGAAATCTCCA
>XM_002992450.2 PREDICTED: Selaginella moellendorffii UV-stimulated scaffold protein A homolog (LOC9662154), mRNA 
ATGGCGGGGCGATTGAGCGATCTCATCCTCGCGGCCACGAATTCCCCGGGCAAGGAGCTGGAGGAGCCGCTGCTCAAGGCGATCAAGGCGCTGGTGCGCGCCTCAGATGACAATGTCAAGGCGGCGGCAGACCTTCTCATGGACCGGCTAGGGAAGAATCACTCCCAGGTCAGGCTTCTCGCTCTGCTGCTCATCGATCAGCTCTTTACGCGATCGAAGCTGTTTCGCGGCCAGATCGTGGCGGTGCTCGAGAAATTTATGGTTCTCTGCCTAGGGCACCGCACCGACCAGCCGCTCCCAGCTCCCGCGGATCGAGCGGCGCTGCTCAAGGCTAAGGCGCTGGAAATCGTGGAGAGATGGAACGAGACGTTTGGGCCTCACTACAAGGAGCTCCAGCTTGGCTACGAATACTTGAAGTTCACGCTACGTCTCGACTTTCCGGGTGTTCGAGAGGCCGCGAATCGAGCCGAGGAAGAAAAGAATGCCAGGGACAGGCGCACGCAAGATCTTCTCCGGTGCCGGCTGCTCCAACTCACGGAGAATTTCCCTGGCTTGAGGAGAGATCTCGAGTCGACGATGAGTCAGCTGGAAGAATGCTTTGCCATCTTGAGCGAGGAGGAGGAGGTGGTCCAGGACGAGGATGGATTTTTGGAGGTGGACAAAGATGAAGAGGACAGTAATGAGGTGTTTGGGATCCAAAGCTTGCGGTCCATGCGTGATCAAGAGGAATTGATGGTCACGGAATCTCGCGACAACGGGGCCATTTTCGACATGGCCCGGGATTTGCTCAAGTTGGTGACAACAAGACATCTTCCAGCAGCGCAGGAATGGCTGTCGGTTTTGATGCGAGTCGACCCGGAAGATCGACAAAGCCGGGATGCTCTCATGAAGGAGGTGATCGACTTGAGGAACCGCCTGGTGGTCTTAAAGGATAAGTGTCAGGAGCTCGGGATTGTCGAGGTGGCCAAATCCAAAACCACCACTGACGACGATGTGGAATGGGAAGAAGAAGAGATATTTGACAGGAGCAAGCTGGATGGTCCACGACACAAACTAGAGCAAGAACGAGAACGAGAACGAGAACGGGAACAAGGTGGCGAAATAAAAAAGAGTTCCTCACCTCAGGCTACAGCAACAGGAACGGCTTCGTCATCTAACGCAACCATGTCCGAGCTTAAGCAGAAGCTGTTTGAGGAGGCTCCCGTGCTGCCGTGGGGATCGTTTCTCGACGCCTGGGGCTCCGACGCTGCGGTTCCTGCAAACAACAGGGGACTGGTTCTCGACAACCACTGGGGAAGAGTGGATCCGGACGCTCTCATCTCTACCGAGAAGATGGCGGAGATGCAAGTGAGAGCATCGTACTACCAGCCTTTAAAGTCGGAGTTACGTCCTTGCTCGGCACCGCTGAGGAATGGAGGCCTTTGCCAGAGACGAGATCTCCGAAAGTGCCCGCTTCATGGCACAATAATTCCGCGGGACGATAGAGGCAATCCTCTCGAGGAGAAAAGGGCTGTCGAAGCCAAGGGGAAGGAGAAGGCGGCGGTCAGTCCGGCAGCTTTGGCTGCTCAAGCCGTAAGGAACGTGAGAGGCAGGGATGAAGCCAAAAGGAAACAGAATAAACGTTTGCGACAGTCTCAAGCCAGGACAGACAGACAACACAACGAGGCCGTGCTGAGAACTGCCGCGCTTGCTCACGACACGCAGACGATTGAAGCAGGCCTAGAGAGGAAAAGCCTGGATGAAGAAACGCCAAAGAAACGAAAAGGTGGTCTCAGCGCTATGCTCCGTAAGAAGGAGACTCCAAAAGACAGAATTGCCAGGAGACTGCTGCGCGGCCGGGCAGTGGACGCTATGGTCGGCAGCATAGCTCGAGACGAGGATGCCAAGTACAGGGAGTCTTTCCCAAATCAGTGGTGATTCCACTCGGAAGCTGGCGCCGCTGATTCCCGCTTTAAGCAGTCCTTTTGCTGGCAGTCTGGGACGAGCTTTACAACTGGACATCATCAAAGCAAAGCCGAGCCGAGGAAAAGAAAAGAACGAGTCATCCGCAGCTCGAAAAGAGAGTTAAATTGTTCGAAGGAAGAAGACGAAAATCGAAGCAGCCTGTCTTTATAGA
>MF497935.1 Uncultured bacterium clone Ant5 16S ribosomal RNA gene, partial sequence 
AGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAG
>XM_053485329.1 PREDICTED: Clarias gariepinus hook microtubule-tethering protein 3 (LOC128512176), transcript variant X3, mRNA 
GCTGTAGCTGTGGCTTCGCCGGTGGAGCGGGTTGCGTGTGTCTCCACGTATTTGTTCATCAGAAGACGGATTTTATTGTTTTATATTGAAAGGTGCGATAAGGGAACATAACCGGAACGTGTTAAAACGTGTTTAAATTACTCGGGGATATATTGTGATATTTGTTTCGTTTGATCAAATCGTTCCTAGTGATTTTTTAGAGGTGCTCTCTCTGTTTGTTTGTGTGTGTGTGTGTGTGTGTGTGTGTGTCTGGGTAAAGTCACGGGCGGATTAAAAGCGAGCTGCGATGAGCACTTTGGACGCAGTGGATCGGGTCGAGCTGTGTGAGAGTCTCCTAACATGGATCCAGACGTTTGGCGTGGAGGCGCCGTGCAAAACCGTGGAGGACCTGACGAGTGGCGTGGTCATGGCGCAGGTTCTGCAGAAAATAGACGTGGTGTACTTCAGCGACAGCTGGCTGAGCCGTATCAAGCCCGAAGTGGGGGATAACTGGAGGTTAAAGATCAGTAACCTGAAGAAAATATTAAAAGGCATCCTGGATTACAACCATGAGATCCTGGGGCAGCAGATTAACGACTTCACTCTGCCCGATGTGAATCTGATCGGGGAGCACGCAGACGCAGCAGAGCTCGGCCGCATGCTGCAGCTCATCCTCGGCTGCGCGGTCAACTGCGAACAGAAACAAGAGTACATCCAGACCATCATGATGATGGAGGAGTCCGTGCAGCACGTCGTCATGACGGCCATTCAGGAGCTCATGAGCAAAGAGACGCCAGTTTCAGCCGGGAGCGACTCCTACGCCGACCTGGACAGACAGCTGAAGAAGACGGCGGAGGACCTGAACGATGCTCTGGCTTCCAAAGAGGAGATCGCTCAGCGCTGCCACGAGCTGGACATGCAGGTGGCGGCCCTGCAGGAGGAGAAGAGCAGCCTGCTTGCCGAGAACCAGGTCCTGATGGAGCGCCTTAACCAGTCCGACTCCATCGAGGACCTGAACAGCCCGGCAGGAAGGAGGCACCTCCAGCTCCAGGCACAGCTGGAGCAGCTGCAGGAGGAGACGTTCAGGCTCGAAGCGGCCAAAGACGACTACCGCATCCGCTGTGAGGAGCTGGAGAAGGAGCTCCTAGAGGTCAAAGGTCAGAACGAGGAGCTAACGTCTCTGGCTGACGAAGCCCAGTCACTCAAAGACGAAATGGACGTCCTGAGACACTCGTCTGATAAGGTGGCGAAATTGGAGGCGCAGGTGGAGTCGTATAAGAAGAAGCTGGAGGATCTGGGGGATCTGCGGCGGCAGGTGAAGCTGCTGGAGGAGAAGAACACCAGCTACATGCAGAACACCGTCAGCCTGGAGGAGGAGCTACGCAAAGCTAACACGGCCCGCGCACAGCTGGAGACCTACAAGAGACAGGTGGTCGAGCTCCAGAACCGTTTGTCCGAGGAATCCAAGAAGGCCGACAAGCTGGAGTTTGAGAGCAAGCGACTGAAGGAGAAGGTGGATTCACTCCAGAAGGAGAAAGACCGGATGAGGACGGAGCGCGACTCTCTGAAGGAGACGATCGAGGAGCTGCGGTGTGTTCAGGCCCAGGAGGGTCAGCTCACCTCAGGTCTGGTTCCACTGGGCAGCAGCGAGGCTGGTTCACTAGCGGCACAAATTGTGACCCCAGAGATCAGGGAGAGGTTTATTCGACTGCAGCACGAGAACAAGATGCTGAAGCTGAATCAGGAAGGATCTGACAACGAGCAGATCGCACTCCTGAAGAGTCTGCTGGAGGACGCAAACGCCAGGAAGAACGAGCTGGAGTCGGAGAACAGGTTGGCGAATCAGAGGCTCATGGCCGGTCAGAGTCAGGTGGAGGAGCTGCAGAAGAGTTTACAGGAGCAGGACTCGAAAGCAGACGACTCGGTTCTGCTGAAGAGGAAGTGCGAGGAACACTTAGAGAAATTGAGAGACGCGTCCAACGAGCTGCAGAAGAAGAGCGCCATCATCGAGGAACTGGAGCCCAAATATCACGCTGGTACTCAGAGGATTGAGGAACTGGAGGAGGCTCTGAAGAAGAAAGACGACGAGATGAAGCAGATGGAGGAGAGATATAAGAAATATCTGGAGAAAGCAAAGAGTGTCATTCGGACTTTGGACCCGAAACAGAACCAGGGTTCAGCTCCTGAGGTTCAGGCCCTGAAAAACCAGCTACAGGAGAAGGAGAGAATGCTGCACTCTTTAGAGAAAGAGTACGACAAGGCGAAGTCTCAGCGAGACCACGAGGAGAAGCTGATTGTATCCGCCTGGTACAACATGGGCATGGCTCTCCAGAAGAAAGCAGCGGAGGAGCGTTTAGCCAGCACGGGTTCGGGTCAGTCGTTTCTGGCGCGTCAGAGGCAGGCCACCAGCACACGGCGCTCGTATCCGGGCCACGTGCAGCCCGCCACAGCCAGTGATGTAAAGGCATGAGGTCGAGGCGGCGCGGCTGCATGACGGCGCTCCTTGCATGACCGATTTTGCTCTTGAATAACACCTCAACCAACACTAACACCTCTCGCTTTCTTCCGTCCCCCGGTCCCGCCGTTCCGTCTGCATGCATACGCTGCGTGTGTGAACGTCCGCTGTGTCCCAGCATGCAGCAGTCTGTGGGCGGGGCTTGAAGGTTACCGGAGAGTGACGTAATAATGATGATAATAATAAGTGTTGCGCTGTATTAATACGACAGTCTCTTAGGTCAGCATTTTGTTATTAACTCTTGTCTTCTTTTTCATATTTATTATCACTTTTTTGTTTCCTTTTTTATTTGAATGCAGTGTTATTTTAATTTCATGACCCGCGTGAGCAAACGGTGAGCCTCTGCACGGCACGGCTTCACTTTATTTATTAAATGTTTATTTTCCCAGAGCTCACAGCGCCACCGCTTGGCGGAAACCACGCACGAGAATTACGTTACATTACGTTTCTGTTTTTTCTTTCTGACAGGGAACAGTATTAGGAGGTCGAAAAGAACAGAAAAAAAAGAAACAAGGTCAATAAGGAGCTTAGAAGTAAAATATAAAGTATTTAAGTCCTGGGTGTGCGTATCAGAGACCTGGCAACAGGACAGAAACCACACCTCGTACCAGGGCTCTTTGTTTTTGTTTTTTTTCATAAATGATTCTATAATATTCGTTTATTAAACATTTATTAACCATCAGATCTGATTGAACAAAATGTTTTGTTAAAAAAGTTAACTATGCCAGGGTTTAGGCTGCTTTCACAGGGTTTTATTTCCCTCCCAAAGAATTATGGTTTAAAATAAGGTGATTTTTTTTTTTTTTTTATCATTATTTTTTTTTTTTTTATAAAAAGAAAAAAAAAGTCCTTTCAAAAGTATGTTTAAATTAAAATAAATGAATGAATGAATAAATAAATAAATACATATATATTGTTTTTTTGACCAATCTGATTGCAGTTGAGCAACTAAATCACGCACAAATTGTTGGTTTCAAATGAGCTTTATTAATAAAATATAGTGTAGTAATATTTAGAGATTTGTCACATTTTAAATGTATTTTTATTATTATTATTATTATTATTATTTATTTTGAGTAATTAGATGCAAATCAGAGGTCCAGACAAGAAAGAAAAATTACACGAGTGTGGGAAAAAATGCATAAGTGAAAATAATGTGAACTATATGAAGCTTTATGATGCTAAAAATAATGAAAATATATAACTCTTTTTTTTTTTATAATTATTATTATTATTGAGCCAATTAGCGGAAATCTGGGACGTCCCACTTCTTTCTCCCACCAAAAAAAAAAAATACTACAAAAGCAAATAACTTGTTTGTTTTTTTTACAAATAATTACTGCTTATCATGTTCAATCTAAATGAATCTTTCGTCGATTACTAGTTACCATGCGTTTATATAAATTAGCTAGCTGATACTAGCAGAGGTTTATAAAATCGTTGTTATGGTTAACGTAATATGACCAGCCTGAAAAAACAAAACAAAAATGAAAGCAGCCTAAAATATCTAGGCATAAAAACCAGTAAGCTGAACCACAGTTGGCTCGATCACAAACCATCGAGTGCTTTTGCGTTGTTACATTTTACACAAGGACACAGAGAGACGACCGAATGACATCATCAGGTCTCTAGGTCTCTAACATGTGCGTCTGCGATACTAAAATATCGTTTCCGCATCCGCTAAGAGGCGTGTCCTGTTTTATTATTATCTATTTACTTTTTTTTTTTACCTCGGATTGATTGATTGATTGATTGATGACTCTGTGGACTAACACACTAAACCGTGTGCTGTTTATTAGCCCTTAAACTTCAAAGTCTTCTGCTGCTTCTTTTCTTCATCACGTCATGACGTCCATTCTTACGCGCCATTTTGTACTGTTTAACGACTTTTTGTTTGAATCTATATTTAGCTTAAGTACATTTGTAAGGGTGTTTGTAAGTCGAGGAACGCACAACGCGTGGACTAGACAACAGTGTTAGCCTATTTAATATGAAATTTACAAAGAAACGTTCACGATAAGAACCGTCCATTAGGAGAGGACCTGCTCTGATCGGACACCTCAAAAGAAAAAAGAAAAAAAAAGAAAAATGACAATGACATTTTGGTTTTTCGAGTATTATTATGGTTGATGTGTTTTTTATGCATAGAAAGATGTTACGTTTAAGTCAAAGTAGCAAATAATCTTTCCATTTGCCAAGTTTTATATTGCTTGTGTACAGTATGTACAGACGCTCTGTGTAAGGAAGAGAAGGAAATTCCTGCTCATTAGTTTGTATAATTATATATATTACCAAAAAAAGAAATTCATCAAGAAGGTGATTGATTTTAGTTTAATTATGTGTTGCGACTCGACGGGAAAATGTGCTTCCTTTGCTGCAAAACTGTACAGTTGGTAATCAAGTTGTAAATAAAGCTTGTATAAAATTCTGA
>XM_052168617.1 PREDICTED: Apodemus sylvaticus canopy FGF signaling regulator 4 (LOC127673070), mRNA 
TTTTAAAGCTTGCTGCCCGCTGCACCTAAATTTAAAGGGCCCGCTGACTTCCAGAAGTTGGTCTGAAGGCAAACGGTGGTTGTATGGGTGGACTGCGTTTTGTCATGGGACCTGTGCGGCTGGAAATACTGCTTTTCATCCTGGCAGCGTACGGTGCTTGGACTGGGGCGACGAAAGAGGAGGAAGATGACACAGAACGTTTGCCCAGCAAATGTGAAGTGTGTAAGCTGCTGAGCATGGAGCTACAGGAAGAGTTGAGTCGAACTGGTCGATCCCGGGAGGTGCTGGAGCTGGGTCAGGTGCTAGACACGGGCAAGAGGAAGAGACACGTGCCTTACAGCCTCTCTGAGACAAGGCTGGAGGAGGCTTTGGAGAATTTGTGTGAGCGGATCCTGGATTACAATGTTCATGCTGAACGCAAGGGCTCACTGAGATACGCCAAGGGTCAAAGTCAGACTATGGCCACCCTGAAAGGCCTGGTACAGAAGGGAGTGAAAGTGGATCTGGGAATCCCTTTGGAGCTCTGGGACGAACCCAGTGTGGAGGTCACGTTCCTCAAGAAGCAGTGTGAGACGATGCTGGAGGAGTTTGAAGATGTTGTAGGAGACTGGTACTTCCACCATCAGGAGCAGCCGCTCCAGCATTTTCTCTGCGAACGTCACGTGCTTCCAGCCTCTGAAACTGCTTGTCTACAGGAAACTTGGACTGGAAAGGAGAAGATCAGTGATGAGCAGGAGGAAGCAGATGAAGAGGAGGAGGAGGAGGAAGAAGAAGAGATAACCAAGACTCCAGGCAGTCCCAAGCATGACCCAGAAGATCTTTGACCCTTACTTTTGAACCCCAAGGATGGGTCATGGAGAGTTGTCTAAAGTCTTCAGCTCTCCCTTCCCCATCCGTAGGCTGTAACTGTCCTTCTCGTATGATCCTGGGGACCCAGAATGGCCACAGGAAAGGAGGAGAAGGGGGGAGAAGCGGAAGCAAGTTTTGCCTTCAGAGATGAGTCACGTGCGGCCACTCAGTGGACCAAGTGTGTGGTGACAGCACTGAAACCTTTCTCTCCCTTTTACTGGCCCTCGCCTGCACCAATTGGTCAGTGGTGTTATGACCTGTGGGAAGGTCACTTTGCTTTTTAAAGGCTCTATTTTAAACCCTTTCAAGAGGTCAGAGAAGAGCTAGAGCTCAGTTGGTAGAGTGCTTGCCTCTTCCGGGCAACGATGGGAGTTGGACCTGATGTGGTGGCACACCCCTGTAATCTGCAGCGCTTGAGAAGTGAAGGCTGGAATATCAGAATACCATCCAGCTACATGGCAGGCAGCTCAGGACCAACCAGAGCTACGTGAGACCCTGTCTCAAAGTAAGAAGCCAAGAAGGGACCCTCAACCAATACGCACTGCGAACACGAGGCTGTGTACCATTAATCTGTCAACAAGAGCAGGACTCTGGGAGCGAGTGCAGTAATACTGGGGTTAGGTGGGGTAGACATGTGGCCTATTTCCTATTTCACAGGTGCCATATTTTCTATATTGCTATTAAACCTTTTATATGTACATCA
>XM_024925133.1 Trichoderma harzianum CBS 226.95 glycoside hydrolase family 78 protein (M431DRAFT_99295), partial mRNA 
ATGGGTCATTCGGTGTCTCCAGTCTTGGTTCTTCCACCGACTTTTGAGCAGCATCACAATGGGTTTGGAGTTCAATGTGTGCACCCAAGGCTTTCATGGAGGTTTTCATGCTCGAAAGAGCAAATACGCAATTGGAAACAGACTGCATACGATATCGCAATTTCCTCCAATAGCACAGAGCCTGGCCAAGTCTTTCACGTAGAGAGCGAAGACAACGTTCTAGTACCGTGGCCGAACTCAGAGCCACTCAACTCACGAGCGCGCCGGTTTGTGCGCGTCAGGTGCTATGGCAAATACTCTCTATTCGATGGGCGCGATAATGATTCCGACCATGAGTCCGTGACCGAATGGTCTGCATCGTCTCTTTTGGAAATTGCATTGCTGAGAAACAGCGATTGGAAGGGGAGTATGATCACAGTGTCGGAGCCGTGGCCTCTGGGTCCGGACCTTTCAGCCCGCCCCCTGTGCTTTCACAAGCGGTTTCATCTTTCCCTAAAAGACGGGATGATTGACAGGGGCCGGCTATATGCCACGAGCTATGGCGTGTACAGCGTGCGGATCAATGGCAGAAAAGTCGGCGACCACTGTTTGGCCCCGGGTTTCCAAAGCTACCATAAGAGACTGCATTACCAGATTTACGATATTAAAGATCTTTTGGTAACGCCTGGGTGGAACAAGATCGAGATAGACGTGGCCGCCGGCTGGTTTGCCTCTGCCACCAGTTGGGCCAGGAAACGATTCACCTACGGCCAGAAACTCGGTGTCCTACTTCAGCTAGAGATTTGGGCTGCAGACTCTTCCTTGCCGATTTTGGTGAACACCGACGCGAGCTGGAGCGTCTCCAACACGCCTTTGGTTAGCAGTGAAATACTGGATGGTGAAATCTTTGACCAAAGTCTGAGTGTGGGCTCAAAGCTGGACGACGCTTTCTCGGTCCGAGAGTCGCCTCTTGCAGTGAGCCGGCTCATCTCTCCGGAAGCCCCGCCAGTAAGGGTGGTGGAGAGGCTGGAAGCAAAAGACATATTCAAGTCGCGGTCCGGAAGCGCTGTCATTGTGGACTTTGGACAAAATATCGCCGGTCGTATTTGCGTTAAACAAGTGCAGAAACCTGCTGGCTCTAGAATCACGTTTCGCCATGCCGAAGTCATCCAAGACGGGGAGATTATGTGTCGTCCCTTGCGAACAGCAAAAGCCAGGGACATTATAATATGCGATGGCCGAGAACTCCTTGACTGGCATCCGCAACACACGTTCCACGGCTTTAGATATGTCGAGATTGCGGGATGGAGCCCTGATGACAAGAACTGCCCTCTCACCAAAGCATGCATTGTCGCCGAGGTGATGCATACTGACATGCTGCGTACGGGTTGGTTTTCATGCTCCAACGATGATGTCAATCGACTACATGAGAATGCTCTCTGTAGCATCAAGAGCAACTTTTTGAGTGTGCCCACAGAGTGCCCATCAAGAGATGAGCGCTTTGGTTGGACGGGAGACCTGAACATCATTGCACCTACTGCCAACTTCTTGTATGACACGGCTGGCATGTTGGGAAACTGGTTGCAGGATCTGTACCTCGATCAGATGGAGGGGACCGAATACTGGCGCCAAGGCGTGGTGCCCTTGTTCATTCCCAATTTTTTACTAAGAAATGGCGACGGGGGCCACGGGTGGGATCCGATGCCAAATGGCGTTTGGGGTGACGCTGCAGTTATGGTTCCCTGGGGCCTGTATCGTATGTCTTGTGATGTTAGTTTCCTCTCGAGGCAGTATGATAGCATGGTTAAGTACCTGGAAAATGGCGTGACTCGAGGTCAGGATGGACTCTGGGATCCTGAGCAGTGGCAGTTTGGCGACTGGTTAGACCCAAGAGCGCCCCAGAACGATTCCGGCAGAGGGACCACGGATGGCACATTTGTCGCCGATTGTTTCCTCATTGCTTCCACTCAGATCGCTGGGAAGGTAGCCGCGAAGCTAGCCAAACCGGTTGACTCCTCTCGCTTCAGAGACGCTGCACTGCGCCTAGTTCATGCGTGGCGGGACAAGTATTTGACCGCGGCTGGTCTCGTGGTTCCAGATACTGCAACGGCTCTTTCGCTCGCCTTGTCGTTTGATCTTTTGCCAGAATGTGGAGACAACTCAATAAAGGCACAGGCGGCCGCTCGTCTGTTCCGACTGGTACGTCTTAATGACTTTAAGCTTACCACAGGATTTGTGGGCAGTGCATTTCTTTCTCGGGCACTCACCCAGTCCGGTGGCGTCGAACTAGCCTACGCTATGCTGTTCCAGAAGAAATGTCCTTCGTATCTGTATCCCATTACGATGGGAGCCACCACGACGTGGGAGCGCTGGGACAGCATGCTCCCTGATGGGACTGTTAATCCCGGTTCAATGACAAGCTTCAATCATCATGCTCTCGGGAGCATCGCAAATTGGATGCACGCTGATGTAGGCGGACTCGAGGCGATTGAGCCCGGCTGGAAAGTATTCAGAGTGAAGCCGCAGCCCAATAAGGAGCTGAGCTGGGCGGATACCGCATTCGAATCAAGGTACGGCCGGATTGAGCTGAGATGGACCTTAAAGGGAGACCTTTTCCGCATGAGATTACGGGTGCCTCCAAACTCTACCGCCGTCGTCAGCCTTCCCAGTGACGGCCGAGAATCTGAGGTGGGGAAGCGGGAAGCTAAAGAGCAAAGATTTGGGTCGGGAGAATACGACTTAAGGTGTCAATTTGTACAAACACAGTGGCCACCAAAGGCACTGCTTCCACCATGGGGAAGAGCAGAGTTCTAG
>XM_036290224.1 PREDICTED: Monomorium pharaonis uncharacterized LOC118646716 (LOC118646716), transcript variant X3, mRNA 
TGGACATTTTCATATAAGAAGTAATCTCGCAGTTGCGCTGCGTCCGACTACAGCTATCGAACGTATCGGATACGTTCCGTGTAATCGTGTAACAGAGTGAAGATAACGAAAGGGAAAGCGGAGAAAACAAAGAGGATTTTGCACGATATCGCCGCGCCGTTTTTATCCGACCAGTAAAGTGAGCGGATCGAATTGTTCACAAGACCGTTTAAGATCATTTGGGATCTAGCGTGATATATGCGCCGATAACTAGGATTCGATAACGAGCATTTTACGCTCGTGTATAAAGAAAGAAAGAAAAAATAATCGTTCTTTTATCATCGAGGTGTGGCAAAGAGTCGCGTGCTGGGCAGAATTATACCCGTTCGATTCCCTGTGCCGGCGATTTGAAACAAAGTTTAGATCTGTTACTGCCTCTGTTGTAAGGAACAAAATAAGCAACATCCGCTCGATCTCCCGGAGATAAAAGGCATCGGGCGAACAGGAAAGGCAAGGGGAGAAAAAAATGGCAGAAAACGAGAAAATCGTGTCGGACGAACGATTGTATGATTATTTGCGTACGTATGCGAAAAGCATCCAATTGAGATCCCCGAAATTTCACGTAATCGAAAGCAATAAAGGCGATAGTTACATTAGTGTCGTTTATCGCGTCACGATCGAGGGAATCGAGGAATGGAACGAGGCCAAGAAACTCGAGCTCGTTCTCAAAACCACGCGGAACTACGGCATCGACAATATTTTGACCAGCGGCAGGGTCACAGAGCTATTCCAACGCGAGGCATCTTTCTATCAGGACGTGTTGCCTATTTTCAAAGAGACTATGAAGGACCACGGCGGAATGCACGACCGCTTCCCCATTTTATACGACGTCAACGATGAATCCGGAAAAGAGATACTGCTGTTAGAAAATCTAACGCCCCAAGGTTTCGTGATGTCAAAGTCAAAAATTATGGATTACCCGCATCTCAAGTTAGTGATGCGATGTCTAGGTGAATTTCATGCGTATAGCTTCATTACGAAAGCGGCAAATCCGACGGCTTTTGAGAAAATGAGGCAAATGAAAGAACACATATTTCTAGAAGTAGTAAATAGTGGCGAACAATTAGAGGCTAACGAGAGAATGAAAAAATTGGGAAAAATGCTTTTTTACATCGTGCTTAAAGCTTTAGCAAACGAAGACAAACATTATTCCGAAAGGTACCAACGATTCATGGAGAATATGCCGCAAAATATGTTTGCCGCAACTAATGGAAAAGAAGCTGAACCATACGCCGTTGTAAACCACGGTGATTGTTGGACTAACAACATGCTCTTCAAATACGACCAAGAGAAAAATCCGTGCGACTTGCGTTTCTTAGATTTTCAGTTATGCCGTTATGCATCTCCCGTTTTAGATCTAGTTCATATACTCTTCTGCTGCTGCACGCAAGAAACAAGGAGTAAATGTTTTGATCAGATAATTAAAGACGTATATTACAAAACACTATCTGACACTATAAAGAAGGCCGGTTACGATCCTAATGTACTCTTTTCTTACGAGATATTATTACAACATTTTACCAAATTCGGGAAACACGCAGCGGGAATTGCTACTTTCACTGTACATTATTATACTACTAATGACGTAGACTTCACAAGTGTATATGACACTAATAGGCTCGAAGAAAGAATAGAAAAAGATAGCTTTTACAGAAATATGTTAATAGAGACCTTTAAAGATATTATTGATAGAAATTATATTTAAATTACTACTTTCACAATAACATCGACATATTGTGATACCAAAAGAAAAAAAAGGACTCTTGTAGTTAAAACAAAATGCTTTATATTAAACTTAGACACCAATGTAGCTAATTACATATATTCATACAAGCCTACCGCATCAGGTTAAGAGAATTTCGTTATGACTTATCGTGAATGACTTATTCACATAAATATAATTTATAAAAATTGTATATTTTATGTTTCTGAACAGTTAGAAATATCGGACATTTTATTGTCACTTTTATCAAATAAAAATTTATTAAAATTACTAAATTTTTCTTTATAAATACTTCATTTTGGTCACTAAAAACAATAAGGTGCAATAATTCTTTACACTAAAGTGCCTAAAAATTAACGATGAACAATTTCATTCGGAGAAAGACAAAAATTGTATAAGAGATATATTTTTAAAAAAATGTACAGTCTCAAATATACAAAATAAAGGTAATCTATTACATTGTTTGATAATGAAAGGAATACTAGTTTAATAGTAATGTATCTTAGCTCTTAGTAATAAAGTCTTCTTGGATTATTTTGAAAGAAATTTGTAATAATAAACCAGATAATATTTTCTACTTAA
>XM_017386452.1 PREDICTED: Daucus carota subsp. sativus histone acetyltransferase MCC1-like (LOC108214453), transcript variant X4, mRNA 
GAAGGTTTGTTGGTTATTTTTTAATTTTCTTAAAAATTCTTTATAGTACTCCCGAGAAGAAAAAGAAGCCCGGTTGCTTTGTTTTGGCGAGGGAAGATTGAAGAACCAAAAAACAAGAGCTGCATCGAATTCTGCATATACACAACAGATTCATCTACTCGACATCTTTCAAGTTGTTAGATCAAACATCAATCGGATTCATGAGCAATCCTTACATTTCCCCCAAATTCAGGTTACTAATTAGTACAAATTCACTTCATCTCTGAATTTCAATCGCATCGATGGTGAACCTGTATAAACCGCCTTGTGCTAGTATCTTTTATAGGCCTATTAGGCCCTCTGATTTGCAGCTTCTCGAGAAACTCCATGCCGATCTTTTTCCTATCAGATATGAGTCGGAATTCTACTTGAATGTTGTTCATGGTCGTGATATTGTCTCCTGGGGCGCTGTTGATCGGAATCGCTCGGATGGTCTAAGTGATCAGCTTATTGGATTTGTCACTGCCAGACTTGTTATGGCAAAAGGAAGTGATGTGGAAGATATACTCAGATTCGAAACGTCAGAAGCAAACCAGACTCTAGTTTATATTTTGACACTTGGAGTGGTGGAATCTTATAGAAATTTTGGCATTGCCACTTCATTAATCAAAGAGGTTATCAAGTATGCTTCAAACATTACAATGTGCCAAGCAGTTTACCTACATGTGATTTCCTACAATAATTCTGCCATCCATCTTTACGAGAAAATGTCCTTTCAGTGTGTACGGAGATTGCACGCTTTCTATTTCATCAACGGGCAGCATTATGATTCATACCTGTTCATATATTATGTAAATGGTGGTCGATCTCCTTGCTCGCCATTAGAACTTGCGACGATTTTCATTGCTTACATAAGGTGTGGATTTAAAGCAGCTGCATCAAAGTTATGGAGGAAGAAAGATAAGAAGGTACCTGTGTGGATGAAGTGTAAAGAAAGCAGTGGCCTACTACCAACAACGCAAAACAAGAGAATCCTCACAAGTCACAACTGAGGTTATTGTGTCAGATTGTTTTAACTTATAATGATCTTTTCACTGCTGTAACACAAGATCAAATCCCGATAGTCAATTGTATCTTGTTCTTGGAAGTTTGTTTCTTTTATTTATTTGATCAACTTCATAGTAGCCTTGACCATGCTCTTATGTTGCAAGTGTATGTAGTTGTTCCTCCTTTTCCCAGAGTTGGACACTTAAATTTCTATCTAGACAGCAAAGCTCAACAGTAGATTTTTATTCTTCAGTTCCATTGTCTCCGCCACCCTCTTTGCAATCCCTAGTGAGTGAACTAAGAAAATGGTATTTAGTGTTGCCCCCCCTTCTTTCTGTGCTCCACTTTCTTTAATAATCACAGCAAGGTAGATAAATATATCAGATCGGTAAAATAATTTCATATATTTGGCCCTATGGTACAATAGTGAAGCATTTTTTCTTGACTCGTTCCATAAGCATGACTATACCATTGTGCATTATGTTTGTATTAGTAAAGATATCTTTATCTGACTGATTCTGCATAGATTTCTGTATATAGAATATAGAATGCGAGAGGTTGATTCCATATGAAGTACGCTTGTTTTCATATTTCCTGGAATGTTAAATTGAATAAATCAATTTTGGATACTTTATGCCCACAACTAAACAGGAACACCCGTGAAAAAAAAAAGGATTTTGTGAAATTCATTTATGAAAGAAAATTGAAAAAATGGACAGATTTAGTTCTTTTCAGTTGGTACTTGTTCTCTCCCTTAAACCGAGCCTTGATCGTTTGTCTTTGAGCGCATTTGTTGGTAATATTGAAAAGCCTGTCCTACCACAATTGTCCTATACTTGCTGGTAAAATTAATTTGTCAATCCTATGGTTTGGAAATATGAATGAGCAGCAAAAGTCTTGCCTGAAGTTCTTTATTAGGGTATTCTGTTAGAGCCATGAGTGGCTGATTGGTGGCTTATGTAGAGACTAGAGAGAGATACTAGCTCGTGGTGACCAAGAAGTTAAAGAGCATTCCAATTTTCAATGGATGAAAGTGACCGTGCTCAAGGAAACAAAAGAGGCCGCTCAAACAACTCTTTGGAATATTCATTTTGAAAGATACGGCAAGGCAAAGCTGCCTGTGCTGAAAGCAAAAGTGTGGCTGTAATTGCTATGGACGAAGGAACAGAATGGAAGAAAGCATGAAATGCTTTGTGCATAATTTTGATGGTGAGCAGCTGGTAATTGTGGAGGTTGACTTATTGGATGAGTTTTAAAGGGACTGTGCACGCCTTTTTCTTCAGGAGGAGTAGGTAATGTCCGGATTATTAGTACCTTTACCACCAAAGAAGATAGTTGAGAACTTGAGATTATATGGTGATTCATTTTGTGGCAGCATTAGCCGAGACTGTAACAGATCCACAACGTTTAGGATTTTCTTTTAGACTGATGATCAATGCGGGGAAGTTCTGACTTGAAACTCGGGCACAGGCTTCCATGCTCGTGATATTTATGAATGATATCATTATTCATTTTTGATTTACAACTGTTGTTATTATA
>XM_052334290.1 PREDICTED: Diospyros lotus succinate dehydrogenase assembly factor 1, mitochondrial (LOC127799971), transcript variant X1, mRNA 
ATGCCCACGGAGAGAACACACGAGAGTGAAGATTTGGAGGGAAGAAGAGTCCTGCACCGCCCGGTGAGCCCCTCCGTCGCTGCCGCTCACCTCCGTCGCCGGTCTCATCTCCATCGCCGGCGAACAGTTTAGTACCGCCACTGCCGACTGCCACCGCCACCGCCCCTGCAAACAGCCAAACACAGGATTGCTTTATTTTGTGGAGTTGCGGAGAAATTATCTTCAGTATTTGTGCTGTGTTAGGGTTCACAGAAGAAGCAAAATAGATACGCAGTATTCCCCAAGCTGCATACAAGCAGAACCGTTCATCTACAACAATACAATACACTGTGCACCATCATATGGTTAAGCAAACATCAGGGGCATTATTTGAAGGGAATTCAGGCTGCGGAACACCAGGGGACAAATCAACTTCTGCCCTAATTTCCAGATCCCCGTTTCCTTCTTTTGGCTGAGCAAACAGCAGGGGAAAAATCGAGAATGGCTCGAAGGGAATTCAGGCCGCTGAATACCATCTCTGAATTCCAATGGTTTGTGTCGTTCTTCGCATTCTGCAGTGGCATTGATTTATTCTGGTTGGTGGCTCCTTGATCTCCTGTGAACTCCAGAGCTTTCAGTGGAAGGCAAAGAAATACAAGAGAGATTGCAATCAGGAGTCAAGAAGTGAACAAGATGCAATGGGAGGTTCTAGTGGGCCAAAGCTTTCTGGAATGCAGAAGCAAGTGCTTGGTCTATACAGAGGGTTTTTGCGAGCAGCGCGTGCCAAATCCCCTGAAGATCGATCCCGAATTGAATCAATCGTGTCAGCTGAGTTCCGTCGCAATTCGAAAATAGTAGACCGCAAGAATTTCACCTACATCGAGTACTTGCTTCGGCTTGGTAAGAAACAGCTTGAGCAGCTTCAGAGCCCGGATACCATTGGATTGTCACACTTGAATGTAGAACTCTCCCACACTAAGAAGTCCTAATCCCACACTAAGAACTCTTGTACCTTACCTTAGGATGTATCCTAAAGTTTTGTCATCCTCTGGTCTCTGACCGAATGTTTTTTTGATTACTCAAAACTCATGCTTCTCCAACTCCAAAATTCAAAATAAATGTTTTATATGAGAGCTGCAA
>XM_028897914.1 PREDICTED: Prosopis alba SWR1-complex protein 4 (LOC114713302), transcript variant X2, mRNA 
CCAAAAAAAAAAAAAATCCCCACCCGGTGTTTTGTTTCACCATTTCCGACGTTCTTCGTCGTCTCTTCCTCCCTCCTCTTCCTCTTCGTCGGCAGCTGTCCCACGTCGGCCGTCTTCGTTGAACTTCGCTGGCTTTCATTACTCTCCTCTCTTCCGCTGCTCCGTCTAAGTGCCTCCCGTTGATATACTCCAAGTTCACCAGCTAGGAAAAATATTGAGAAGACCTCAGTTCCTGAAACTGAAGACTGAATTCTTGAATCGAAGTATTGGAAAAAGCCAAAATTTTGACAAGATTTAGAAACCCTGTTTTACATTTATGAGATGTGCTTTTTTAATTTATGTTTTTTTGGTTGTACATAAATAAGGTGGATTAGCTTGGCCCTAGATTTCCTCTGAAACTCCCATGGATGCCAAGGACATCCTTGGTTTGCCCAAAACCTCCTTGCCAATTCAAGAGAAAAAGTCTAGGCCCCAAAAAGATTCACAGAGAAAACCAGATGGCATTTCACGGGAGGTATATGCACTCACTGGTGGTTTGGCGCCTCTTATGCCTGCAATTGATTCGTCTCAATTAAAGAAAAGGCCTCCATCTGACGAGAAGATCACTTGGCAGTGGCTTCCTTTCGCCAATTCTGCTCGTAAAGATAATCTTCAACTATACCATTGGGTCCGAGTTGTGAATGGTCTTCCACCCACTGGGGACTATTCTTTTGCCAAGTATAACAAGTCTGTAGACATTATCAAATACACAGATGAGGAGTATGAGAAGTATCTGACGAATCCAATGTGGACCAAGGAGGAGACGGATCAACTCTTTGACTTGTGCGAGAGGTTTGATCTTCGGTTCATTGTGATAGCTGACAGGTTCCCATCATCACGAACTGTAGAGGAATTGAAAGACCGATACTACAGTGTATCTCGGACTCTGTTAATTGCTAGGGCTCAATCTTCCGGGGATGTTGCAATGCATCCTTTAGTTAAGGAACCATACAATGTTTCACAAGAGGTTGAGCGGAAACGAGCACTGTCTATGTACCTCTCTCAAACAAAGCAACAAGAGCGAAAAGATCAAGAGGTTCTTGCTGAGGCAAAAAGAATAACTGAATCACGCATGCCTGCTAAGGTTGCTGAAGAGTCTGAGGCTGCTGCTGCATCAAATGCTGGTGCGGAAGAGAGAGCTGTCTCCGGTGATCCTCCATCAAGTGTTCAGCTTCCATCAACGGTTGTTCCATCCACAACAGCAGATAATGCAGCCACTCTTGCTTCCCTTCGCATGCTTCGTGTGTATCTAAGAACATATGCACTTGAGCAAATGGTCCAAGCTGCAAGCTCATCTGCTGGACTACGGACCATCAAACGGGTGGAACAAACACTACAAGAACTTGGGGTTAATTTAAAACCAAGGGTTCCAACCAAAGCTGTTTGTGCAGAACATCTTGAATTAAGAAAAGAAATACTAACTCTGCTCAATCTTCAGAAGCAGCTGCAGTATAAGGAGGCAGAAGGTCGTGATGGTTCATACACTGAAACACCTGGCACACCGAAGGATAGGACATTTATTCCAGATTCTATGAGTTTTGGAGGTGAGAGGATTGGTAAGAGGGACCAGAAACGCAAGGCGCCTGGGAGGATATCAGAAGCTCCATCATCACCGGCTCAGTCTAAAAGGCCTAGAAAACTGAAGGCATCTGATCTATAGTCCGGTGGTGTAATGGGAGAATATAGAGTTACAGAATTCTGCTAACGAGGATGAGGAATGCAGGGTAAAGTAGGTGTAAGCTCATGGCCCAGAAATTCAGAATTTCCAACTGAAGTACTTTGTTTCCTTTTGGGCTGTTGCCGGTCACAGTATCTAGCGTAAGATGGAGCACAAATAGTGATGGAAATTCTGGGTTCTTCTAACTTTTAGGTACCTCGTGAGCTTAACTTTATTTTTATGCTGGCAAAGCTTTGTACGGTTGTTAGGTTTTTCTGACCAAATTGTCATTGAGAATTTTTATGTAAATAAGCATTCAGGTGAGGATTGTTCGAACAAATATAGGGCCTCTAAAAAACATGTATTTGTGCCTCGTGAATGGATTCATATCCTAAACTTCTTCAACTAATCGAAGGCTGATATTTGAATGAAA
>XM_012572725.4 PREDICTED: Taeniopygia guttata EPH receptor A7 (EPHA7), transcript variant X1, mRNA 
CGGGCTGCAGTCGGGGCTGGCGGGCGGCCGGCCCGGTGCGGGAGCCGGGCAGCGGCGCGGAGGCGGAGGAGAAGGAGGCGAAAGAGAAAGGCAGCCTGGAGGGAGGGAGCGCCGAGCCACAGACTAGCACAGCAAATTCTCCACCGTCCTCTAGCACCCACCAAGCGGCGGCAGTGGCAGTATCTAGGAATAGAGAGCTAGAAATATAAAATCACCCCGCTCCTGCACCATGGCTTTCCAAAGTAGGCTCCCTTCTTGGATTATTTTGTGCTCCGTCTGGCTGTTCCGCTTTGCACACACGGGGGAGGCACAGGCTGCAAAAGAAGTAATACTGCTGGACTCTAAAGCACAACAGACAGAGTTGGAATGGATTTCCTCTCCTCCCAATGGGTGGGAAGAAATTAGTGGACTGGATGAAAACTACACTCCTATACGAACATACCAGGTATGCCAGGTGATGGAATCAAACCAAAACAACTGGCTTCGGACTAACTGGATTGCAAAAAGCAATGCACAAAGGATTTTTGTAGAACTGAAATTCACTCTGAGGGATTGTAACAGTCTTCCTGGAGTTCTGGGGACTTGTAAAGAAACCTTTAACTTGTATTATTATGAAACAGACTACGACACTGGCAGGAATATCCGAGAAAACCAATATGTAAAAATAGACACTATTGCAGCAGATGAAAGCTTTACCCAGGGTGATCTTGGGGAGAGAAAAATGAAACTTAACACAGAGGTGAGAGAAATTGGACCTTTGTCCAAAAAAGGATTCTATCTTGCGTTTCAGGACGTAGGGGCCTGCATTGCTTTGGTCTCTGTCAAAGTCTACTACAAGAAGTGCTGGTCCATCATTGAGAACTTAGCTATTTTTCCTGACACAGTGACTGGCTCAGAGTTTTCCTCTTTAGTTGAAGTGCGAGGAACTTGTGTCAGCAGCGCGGAGGAGGAGGCGGAGAACTCGCCAAAGATGCACTGTAGCGCGGAGGGAGAATGGTTAGTGCCTATTGGAAAATGTATCTGCAAAGCAGGATACCAGCAGAAAGGAGACACGTGTGAACCTTGTGGCCGTGGGTTCTACAAATCCTCCTCACAAGATCTGCAGTGCTCCCGCTGCCCTACTCACAGCTTCTCTGACAAGGAAGGATCTTCCAGATGCGACTGTGAAGATAGCTATTATAGAGCACCTTCTGATCCACCATATGTCGCGTGCACAAGACCTCCATCTGCACCACAGAACCTAATTTTCAATATCAACCAGACTACCGTGAGTTTGGAGTGGAGTCCTCCTGCTGACAATGGGGGAAGAAGTGATGTGACCTACCGCATTTTGTGCAAGAGGTGCAGCTGGGAGCAGGGCGAGTGTGTTCCCTGTGGGAGTAACATTGGATATATGCCCCAGCAAACTGGATTAGTAGATAACTATGTCACTGTCATGGACCTGCTAGCTCACGCTAACTACACGTTTGAAGTTGAAGCTGTGAATGGGGTTTCTGACTTGAGTCGTTCCCAGAGGCTTTTTGCAGCTGTCAGTATTACCACTGGCCAAGCAGCTCCCTCGCAAGTTAGTGGCGTAATGAAAGAAAGAGTGCTGCAGAGGAGCGTGGAGCTTTCCTGGCAGGAACCAGAACATCCCAATGGAGTCATTACTGAATATGAAATCAAATATTATGAGAAAGATCAAAGGGAGAGGACCTATTCAACAGTGAAAACCAAGTCCACTTCAGCTTCTATTAATAACCTAAAGCCGGGAACAGTGTATGTTTTCCAGATTCGTGCTTTTACTGCTGCTGGTTATGGAAATTACAGCCCCAGACTGGATGTTGCCACACTGGAAGAAGCCACAGCCACAGCTGTTTCCAGTGAACAGAATCCTGTTATTATCATAGCTGTGGTTGCTGTGGCAGGAACTATCATCCTGGTCTTCATGGTGTTTGGATTCATCATCGGACGAAGGCATTGTGGCTATAGCAAGGCAGATCAAGAAGGGGATGAAGAACTTTACTTTCATTTTAAATTTCCAGGCACCAAAACCTACATTGACCCTGAAACCTACGAGGACCCAAATAGAGCTGTCCATCAATTCGCCAAGGAGCTAGATGCCTCTTGTATTAAAATTGAGCGTGTGATTGGCGCAGGAGAGTTTGGTGAAGTGTGCAGTGGGCGTCTAAAGCTTCCTGGCAAGAGAGATGTTGCAGTAGCCATAAAAACTCTGAAAGTTGGCTACACTGAAAAGCAGAGGAGAGATTTTCTGTGTGAAGCAAGCATCATGGGGCAGTTTGACCATCCCAATGTGGTTCACCTAGAAGGAGTTGTTACCAGAGGGAAACCAGTCATGATCGTAATAGAATACATGGAGAATGGGGCCTTAGATGCATTTCTTAGGAAACATGATGGGCAATTTACTGTCATTCAGCTAGTGGGGATGTTGAGAGGAATTGCTGCTGGAATGAGATATTTGGCCGATATGGGATATGTACACAGGGATCTTGCAGCACGCAATATTCTTGTCAACAGCAACCTTGTTTGTAAAGTATCAGACTTTGGCCTTTCCAGAGTTATAGAAGATGATCCAGAGGCTGTCTACACTACAACCGGTGGAAAAATTCCAGTGAGATGGACAGCTCCAGAGGCCATTCAGTACCGCAAATTTACCTCAGCCAGTGATGTGTGGAGTTACGGAATAGTTATGTGGGAAGTAATGTCTTATGGAGAACGGCCTTACTGGGACATGTCAAATCAAGATGTTATAAAAGCAATTGAAGAAGGCTATCGTTTGCCAGCGCCCATGGATTGCCCAGCAGGACTGCACCAGCTGATGCTGGATTGTTGGCAGAAGGAACGCGGTGAAAGGCCAAAGTTTGAACAGATAGTTGGCATTCTGGACAAAATGATTAGAAATCCAAACAGCTTGAAAACCCCACTGGGAACCTGTAGCAGACCAATTAGCCCTCTTCTGGACCAGAACACTCCCGATTTTACCACTTTCTGCTCCGTAGGCGAATGGTTACAAGCTATTAAGATGGAAAGATATAAGGATAATTTCACAGCAGCAGGCTACAACTCTCTTGAATCAGTTGCCAGGATGACTATTGAAATCAAAAACATGCCAGGTGCTTTGCAAAACAGAGAACAAGAAAAATCCCTTTCCAGAAGAGATGACAGCCTGAATAGAAATGGCATAATGGCAGGAGACAAAGGAAGCAGAAAGGGGAAGCAAAACAAGAGTTATAACCATAAGATCATGAGATTGGTTTGGAGGCACAGTGAACGCTATGAGGCATTTTTTTAAAGCCCATAAGGACTGTAGTTGGGATTAGAGAATGGAAATATAGAAAAGAAGCATGGAAAGGAATGGAGAAGAAGGGAGGAACAGACTGGCAACAGGAGGAAGAGTAAACAGAGGTGTATGGGAGAGGCCAGAACACACATCTGACAAACTGAGGATTATGACTAATGACAAGAATGAAAGACCACATCTGAAGAGCATGATGATTTCAGGAGGATGGCGAAGCAGGACATGGCGATGCTGCTAGGGAGAGAAGAGCCAGCAAAGCTGCCCTGGAAGCCTGCCCTGGAAGCTCCTCACACTAACATAACCCTGCTTCCCCATCTTCTTTCTCGCTCCCCTCTTATACATAAAATATGTATATAGAAGAGCAAAGGAGAAGGAGAAGCAGCTAAATAAACTTTTCCAAAGATCGTGCTGGGGAAGAAGTTTAAGCTGGGATGATACAGATTTGCTCCTCCTGATTATGCTCATGGTAGCGAGAGGAAGAGAGCATTCTGTTAGTCATATTCCTGCAGATGAATCTATATGAGTCTTTGCCTCTGGTTACAAATAGGCCTTGTTGAGAAATAGTCAACAAAATTATAATACTCCAGCCAATCTGGGACATTTTAAAATGTCCTTTCATTCTAGAACAGAAATAAATTACACCACTGACAGTGAAATGGAAAGAGGAAAGAAGAATATTTTAACAGTTTTGGTTTTTTTTTTAATGCTGAAAATAATCATTTTAGTATTATGGAAAAAAAATATAAGGGGGATTTTTCTCATTGTGAAAAAAATAAAGCTTTTAATGAAATTTCTGATAAAATTGGGAATTATTTTAATTATGTAGGACTGGTTTTTCTGTTGGGTTTTTTTTTTTTAGAAAATTGGTATTTTTAGAAGGAAACAGGAAAATTGCTGTGTTCATTCTGTCAGACATTTTAAAATACCCTGATTTCCAAGGTAAGAATTCTTCAGGAGTAAGAAAGCTGAAAAGTGGCCAGTCTAATCTCTTCCTCACTTCCTTCTCCTCTGCTTCTGTGATCAGACGTGTCTAATGATAGTCTGCAGATAGCAAAACCAGTTTCTATGTCTCCCTGAGAAAAGGCATTTTGCCAACTTTAAGAATCTTTAACTGGATCTACTTACAGGAAGTCACTGTTTTGCTGCAGACTATGTGTCCACTTAAATCCCCCTCAAAGCTCTTCCATTTTGCCTGGAAAGGTTTATCAGAAAGCATGCTGGAAAGGCTCAGATCTTTCCATCTCCAGTGAAACTGTTTCTGAACATACTTATAGCTTAGCAGATGTACTGGTATGACAGTTGAGAGACTACTGCTGTTAATGAAGTATTCTATTACCTTGGCATATATAGACACTTTTCACTTGGTACTTCTAACTGCAAAGTATTGATGTTTAGGCTATTATAAGTACTTGTGCGTTATATTTTTTTGGTAAGTTTTAGAGGACAGAACTGCGTAAATATTTCTTCTCTTCAGGGTAAAACAGTTTTCATGAGTCTTGAAATGTTTACATTCATCTTGAATGTACACCAGAGTGATATCAAGTTTGTTGTTGTGACACCTTATCAATATGATGCCCATTTTTAGTTTCTTCTAGCAGTGGAATGATTTAAGTATTGTCTCATGGAGACAACGGCCTTGTTTAAGAATGGTGACTCTGGATAAGATTCAAATAATTTGTCTGAGTGAAGAGGAGGCAACTGAAAGTCATCGCTGAAATATTACCAAAAATCCTTAACTGGTTGGATTTGTCCATCACTTGCTTGAAGATTTTGGTAAATGGTGGTTTACTAGGTTCCCAAATGCCAGCAATGGCCAAGCACTTTCTTTTAATTTTCTTCAATTTGGACTTTGCTTAAGTTAATTAAGCTTTTGTCATCTCAGGGTTCCATTTTAGCAATGAGGTTTACAAGACCTTCTCTGTCAATGTAAAATCTTCCTATACTTAAGAACATATGACATACGGAGAGTAAACTCAATGCTCAGCAGTGCTTGAAGAATGATTCCCACCTCAGTAATTTCTCTCCATTTTTATCAAAATAATACTGGATTTAAATCCTATAGCCATGGTATCAATTTACCAAAATCTTCTCTGCCTAAATTATTCTTCAATTAAATGTAGCTCAAAGTTTTATTACAATCCACCTATCATTTAAAAAATGGGATTGCAAAGTAGTTTCATAGTATCACCCCATAATACAGATTTTTTGCATATTATTTTTACATATTTGAAAGAACTCCATTACTCAGTTGCATATAACTTTTTGCAATAAGAGGCACAACGTAAAGCAATATCAAAACACAGGTAGTATTTCTACTAATTTTATTTAGCCAAGCTCCAGATTTTGCATAATTTTGCCACTGCTTCTGGCATGATAGCAGATATGGAGGTTATCCATGCCTGCCTACCTTTTGGTGCTGAGATAGGATTCATCTGTGTGGCACCTTACCACCCTCCGCTACCAAAAAAAAAAAAAAAAAAACCAACCAAAAAAACCAACAAAAAACAAAAATTCCACTGGGAAATTTGGCATAACCTCTGGGAAATTCAGTTTGACCTACCTTCTGGGTTCAGCAACTGAACCGGATGCATGATTTGGGAAGGGATTTAATACCAGCTACCTCAGTAGCCACAAGGTGTTACGGGAAAACGACTGAAAAAATCCAAACTATTATAATGTATCCTGAGACGGAAGGACAGCATGGTCATTTGCCTATATATTTATTTCTAACCTTGCCTACACTTTTCCTCAGAATCCTTCCCTGATATTGTCTGTCAGCTCTTTCAAGAAGACACTTGGTTGTGCATAAAGTAGGAATGGCTGCACTGACTCAAGCCACGAGCCCACATAGTTGTGTGTACCTGACTGTGTGCCTTGGTAGGGGTACAGTCTTGTTATAAGGCCTCCACTGATCCCTACAGATTAGGGAAACCTTCAGCTGTTGACTTCCAGACATCTTCAGGGCTCTATATCCAATATGTACAGTTCAAATGCTTCCCAAATCAGGGTGGTGCACTATGATGAGTAGTCTGAATTTGTCCTATATTCTGTGAATTTACTTCTTTCTTCTGTCAATCTTCTCTCTCTGTCTTGCCCTTCTTTCTCCTGAAGTAGAATGACCAGGGTTGCATGAATTATTCAAAATAAGAGTGTATGATGTATTTATACAGTGATATAGCGATACAGTGTATTTATACTGTGATATATATATATATATATATATATGTTTTCTATTTTGTTTACCGTTTCTTTCTTAATCATCCAAATATCCTGTTTCACATTTTTACTTGATACTGGGTGCTTGACTTGATGTTTTCAGAGAGATGTCTGATGTTATTCCTTATTTTTCCTTCTCAAGCAATAGTTACTTTGTAGTCCCTGCCTGTGTGTGTATAGTTAGACTTATTTACCCCTTGTTCAGTTCTTTCTGTTTTATCAGATTTCATCACTCCTTCATGGCCAAGGGCATTGAAAATTGTGAAATCATTTTGCAGTCCTTTCCAGACAGTTCCTTACTGATTTAACTTACAAAAAACATTTTGTATCAAACTTTCTCATCTGACAGTTCTTAGATATCACGTTTCCCTTTACTACTAATAAAAGTACTTTTGCTTAAA
>XM_033125297.1 PREDICTED: Rhinolophus ferrumequinum 5'-nucleotidase, cytosolic IB (LOC117033240), transcript variant X2, mRNA 
ATGAGTCAAACATCTCTGAAACAGAAGAAGAAGAATGAATCTGGAACAAAATACCCAAGAGACAGTCTAGAAGCAGAGAAAAAAAGGGAGTCTGAGAAATCAGGAGTTCGTCTGAACACTCAGATGACGCATGCAGTCACACCGAATCACTCGCTGAGACGTTGCCCCATGCATGGTCACCCGCCGTGTAGAAACTGCCTTAGTGCAGCTGAGGGAACAGTCCTTCTTGGTCCCTGCCGCATAATACACATTTATATTCACATGTGCCTGTTGTGGGAGCAGGGCCGGCAGAACAGCATGATCAGGGGATCACAAGAATTATCATTGCCAAAGACAGATTCTCGTGGGTACATCGTGCGAAGTGAGTGGTCCCGAACTTCACGGAGCCCATCCAACAAAGCCCCATCAGTAGACGAGAACAGAAGCAAGTCTGCCAATCTTAAGGTCCCCAGTAGCTCCACCACGTCCCGCACTTCATCTGCCTCCCCCAGCCAGCAGGACTCTCAGCAGGAACTGTCCACGCAGCCCTTCCCGCCCACCCCACCCGTGCCACCCACACCACCAGCGCCTACAGACTCCTTCCCTCCCACACCCCCGGAGCCCCAGCCCCAGTCCGTGTCCCAGCACAGCAGCAAGATGCATGAGAACACTGACACCTGGCCACATGGCATTCCGCGGGAGATGCGGGACCCCCGGGACCCCAGGGACCCCCGGGATCCCCGGGAGATGCAGCAGCGAGAATATCCCCGTACACCCCCCACTGAATGGAAGCCCTATGCCCAGCGCAAGGCGCACTACTCCTCCCAGCTGGACCGCGACTGTATGTCTGACCTGCCCCGGCAGCGGGAGGAAGAGGACGACAATGAAGAAGCCTATTGGTCATCCGTGAGGACACTGTATGAGAAGACCCCAAGCTGCTCGCGACCCCGGCCGCCCAAACCCAAGCACGCCATCACCATCTCTGTGTCATCCCGAATTCTCTTCAACATGATGGACGGCAGGAAAATCTACGAGGAAGAGGGTCTGGAAAAGTACATGGAGTATCAGCTCACCAACGAGAACGTTATCCTGACTCCAGGACCCGCATTCCGCTTTGTCAAGGCTCTGCAGCATGTCAATGCTAGACTCCGAGATCTGTATCCTGAAGAACAGGACTTATTTGATATTGTACTGATGACTAATAACCATGCCCAAGTGGGAGTGCGGCTTATAAACAGCGTCAATCACTATGGCTTACTAATTGACCGCTTCTGTATGACTGGTGGAAAAAGCCCTGTTGGCTATTTGAAGACCTATCTTACCAACTTGTATCTTTCGGCGGATTCTGAAAAAGTCCACGAAGCAATTCAAGAAGGGATCGCCTCTGCAACAATGTTTGATGGAGGCAAAGACATGGCTTACTGTGACACACAGCTCCGTTTGGCTTTTGATGGAGACGCTGCCATCTTCTCAGAAGACTGCGAACATCCTACCAAAGACCACGGGATGGACAAATTCTTTCAACAGGAAACACAACATGAGAATAAATGCACGGCTCAGGGTGCCTTGAAAGGCTTTCTGGAAGAATTAGGCAGACTGCAAAAGAAGTTCTATGCCAAAGACCAACGGTTATGTTGCCCCATCAGAACTTACCTGGTTACAGCCAGGAGTGCAGCCAGTTCAGGTGCCCGAGTGCTGAAAACCCTTCGCTGCTGGGGTCTAGAGATAGACGAAGCTCTTTTCCTTGCTGGAGCCCCCAAAGGGCCCATCTTAGTGAAAATACGGCCCCACATCTTCTTTGATGACCGCATGTTCCAAAGTGAAGGCGCACAGAAATTTGGCACAGTCGCAGCTTATGTACCTTATGGCGTTAATCAAAAAATGAACAATTAG
>XM_037725972.2 PREDICTED: Dermacentor silvarum acetylcholinesterase (LOC119465175), mRNA 
TGCTGGTGAAACACGCAGTGTCGCAGGAATCCCGGCTACCACTAGCGCATTGTCGGTTGTACTGGCCCAGAGCGTTTTTTATCTGGATAGCCGCTCGGGTCCCGGAATCGATATTAGAGGACGAGGCTAAATCCTCAACGACCATAGAAATGGCGACCAGAGCAGCCCTCCTGGCGGCCATTTTTCTCGCCGTCATGCTCATTGCCATGGCCGACGATGCATTCGTCAAGAAGCAGACCACGGAAGGCATGGTTCGCGGCAACGTGATCCGCGCCCTGGGCAAGACTGTCGAAGAGTACCGCGGCATTCCGTTCGCCGAGCCACCTGTAGGAAAGCTCCGGTTTCGGCCTCCAGTTCCAAAAAGACCTTGGGAGGGCACCATGGATGCAACCGCTGGAAACACAGCCTGTCCTCAGGTGCTGGTGGAAGGAATCCCGCTAGGCAACCTGAGCTTCACAGAGGACTGCCTCCAGCTGAACGTATGGGTCCCAGAGGTCGCGATTACCCCAGGTTCGCGTCGGCCTGTACTTGTGTGGATCCACGGAGGAGCCTTCACCTTAGGCAGCGCGAATATGGCGAACAGTAGCGGCGTCTTCCTCGCCGCGCTGGGCGATGTAGTCGTCGTGTCCGTGAATTACCGTCTTGGCATCCTGGGCTTCATGAACGCGAACTCTCCTGAGGCGCCAGGCAATGTTGGCCTCCTGGATCAGAACATGGCTCTGAAGTGGGTGCAGCGGAACATCGGACATTTCGGAGGTGACCCCGAGCGAGTGACGTTGCTCGGGGAGAGCGCAGGCTCAATGAGCGTGCACGCGCAAATTATGTCGCCATTAAGCGAAGGCCTCTTCAAGAGGGCAGTTTTGATGAGCGGTACCATGTATAGCTTAGACACGTGGGACACAGTTCCGGAAAGCATGGTCAAGGCAGACAAGGTCGCTAACGCTGTTGGCTGCTCCAACGGTAGAACCATCGAGCTGTCATCTAATGCGGAAGAAATCGTGGACTGCATGAGAAACAAATCCGCTGATGAGCTCGTCATGGCTTCTAAGGAGGTGACGGTACCAAAGCTGGCCCCATTTGCGCCTACTTATCACAACGAGTTCCTTCCCCGAAATCCATTCTTGGCCCTGAAGCGTGGTTTCTTCTCATCTGTGGACGTCTTAGCTGGCGTAACTTCAGACGAAGGAGCTGCGTTTCTCCTGTTCCCGTTGGTTCACGAGCTTTTGGTGGAAGACATTCGAGGTTCGCCACCAGAGGAGCTTATTAGGTCTCTTCGCAGCGCATTATGGCGAGTGCTTAAAGATGACATACCGAATACATTAGAAATGTACACCGAGGAAGCACCAAAGGACGATAACAACGCACTGAGACGCCAATACATCGACTACGTGTCCGACAGATTGTTCAACTGCCCTCTGCAGTTCTTCGCGGAAAATCACAGCCGAAGGGGCAACAAGGTTTTCACGTATGTGTTCGCCGACAAGCCGGAGATGTTTCCACTGCCTGGGTGGATGGGAATGCCCCACGGCATCGACGTAGCCTTCATGTTTGGTCACCTCTACGCAGCAAATCCTGATTCGCCAGATGGTCGCATCTCTGAGGTCTTTATTAGACTGCTGGCCAGCTTCAGCGAAAACGGGATTCCCGAACTTCCCAACAATGAGACGTGGCCACAATACAGCAAGGACTTGCCAAGCACAATCGTTATGAAGAACGGCCTATTTAACGAGACACAGGGATTCCGCTCAAGCTACTGTGAACGCTGGAGGCCTTTGTATTAAATGTGTCACTCCACAA
>HQ089085.1 Uncultured Arthrobacter sp. clone F5OHPNU07H9DXX 16S ribosomal RNA gene, partial sequence 
GCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTCCTATGTTGCCAGCGGGTCATGCCGGGGACTCATGGGAGACTGCCGGGGTCAACTCGGAGGAAGGTGGGATGACGTCAAATCATCATGCCCCTTATGTCTTGGGCTTCACGCATGCTACAATGGTCGGTACAGAGGGTTGCCAACCCGCGAGGGGAAGCTAATCCCACAAAGCCGATCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGTGGATCAGCATGTCACGGTGAATACGTTCCCGGGTCTT
>XM_026579881.1 PREDICTED: Papaver somniferum tRNA-specific adenosine deaminase TAD3-like (LOC113333371), transcript variant X2, mRNA 
CCAAAATATTGCGATGAAGAAGTGGGAAATCCTTCACATCCCAGACAAGATTCCGTTTAAACTTGATGAACAACCCACGATCGACGTCTTTGCTTCAGTTATAGAGCCAAAGCTTACCGATACTCTTGAAGTTAAATAAAGTTGCACCAATGGAGATTTATCGACATATTAAGAGGGTGTGGAAGAAGAAATCCGCGGAAGGAGGGGATTTTCAGTTAATACTGATTTTATGTCTTGTTGGTGAGAATAGGAATGAGTTGGAGAGTATACCTGATGATGTACTTGAGTTGATAAATGCCCACCAGTTGAATCCATATATTACAAAGGTCCATAGGTATGCCGCGATATCAAAAGAAGAATGGAGAGAACAATGCAGACTTTGGCCAACATCTTATCATCCGCCAACCTACAATATTGAGGGCATTACAGGATTTAATGAGGAGGATTCAGAATCAATATTCCACTTCATGAAGATGGCTCTTGAACTAGCGAAAGTGGGCCATTGCACCGATGAGGTAGTCAATGCAGCAGTTATAGTAGATCCTTCAACTAGGCAGGTGATTGTTAGGGGCAATGATCAAACATGTCAGCCAAGTACATCCACAGTGAGTAATACCAGCTTCGAATGTGGTTCCGTTGAACAAAAGGGTTTTGCTACTTCCCATCAATCCGATGCAGATGCTGTAGCAATCAAGGAGACTCTGTTTTCCATCTCCAGTTTTGCAGTTGCTGAAAATAAAGAATCATATACTGGCGTTTCTTGTCTATATCCTTGGAATTGGACTGAGCAAAACTCTATTGCTGGAAACACATATTCCTGGCATCCTCTGCAGCATGCAGCTCTTGTTGCCATTGAACATGCTTCCTCTAGGGATAGGCGCCTATTTCCTGGGCCGGTGGATCCTGAAGATCAATCTATCAATCAAGTGGATCACACAATCTCTTCTCCCAATAGCTCACCAGCCAAAAGACAGAAATTTGATTTGACAAAAGATGTCAAGGTTCTGAAAGCTTGCTCTAATGGTGATTCTCATTCTGAAAGGGGTGAAAGGCCTTACTTGTGCACTGGTTGTGACATTTTTGTCGCTTGGGAGCCCTGTACGATGTGTGCAATGGCACTTGTTCATCAAAGAATTCGGCGAATATTTTATGCTTTTCCGAACCCTAACTGTGGTGCACTAGGCAGTGTTTACAGACTACAAGGAGAGAAAAGCTTGAATCATCACTATGCTGTTTTTAGGGTTCTATTACCGGAGGAATCCTTGGAAACATGACATGGAAACCACATCTCGATGATGTCCAACAAATGTTAATCTAATGTTGTTCTACCATACAGTTTTTCCAAACGAAGGATGGTAAAGCTGAAGTTTATTGGAACACCCTTATGTCTGCAAGTGAAGGTTTTGATAGAGAGGTGCTTGGAACTTGCCATTATTTATTTTTCTTTGTTTTGATGTAAACTTATGTTGTGTTGTGCTATTATATAAACATCAATGTTCATAGTTTTTCAGAATACACCGTTGTAACTGTGACCGTTAATGCTTA
>XM_020573339.1 Polysphondylium pallidum PN500 hypothetical protein partial mRNA 
ATGAATAAATCTATAATATTGTTTTTATCTTTTCTAATAAATATAATTGTTGTTGTTAATGGCCAATGGCATATTGAATTCGAATATTCAGCTGCTGGATGTGGTGGAGTTCTGAATAGAGCCTCATCATTTTTGAATAATATGTGTTATAATTACGATAATGGTGGTCCATATTCACATAGATACATTGTATCTGGATCTACAACACTCCGTCAAATATTCAGTAGTACTGACTGTTCAGGAGCTCCAACTACACAAGCTACTTTCGCTGGAAATACATGTTATGATAATTTAATGAAATATGCAATAGTAAATGAACCTGCTATTTCGCCAGGTGGTTGGATTTCATTAGAACGTACTCCTGGAAATGCTTTATCTGGTTGTGGAGTTTATGAAAGTGAAAGACATATTTTTAGATTGGCTACTTGTGTCAAGACCTATGATCTTCCTAATTTTCCTTTCAATACTTATTTTAGTAGTGGTTCGGTTGGCCATGTTTACAATTTAGTGTGTCCCAATACTCTTTTCAACTTCCAACCGTGTAGTAGTGATCCCCAAAGAATTACATCAATATTAACACCAACCATTTCCTATTCAATAACCAATCCAACTCTTATCAATTCCAATACAATTCTTTTAAATCCTTTTACCAGCAACTTTAAATATACATACAAATTCCTTACTGAATATTTTAACCCCAACACCGGAAGTTTTGTCGTTGCATGCAATCAATATTCATCACTGGCATGTCAATTCTCTGTTCCAGCTGGAATTCCTTACACCTATGTTAGAGTTAGAGCTAACGGTGATGAATCATTAACTGCTGCTCCTATTTATACATCACCTAATTTTAATTTACCAATGCCACCTGTTATGAATGCAATTAATTCAATCATTACCACTACAAAATCTGTACAATTTTCATATTCTGCTACCAATTCCCCAACTTCCTATACTGTCAATGTGAATAGTGTTCCTCGTCCTGAATGTTCTGGTTTAACTACTTGTAAAATAAGTGGATTGACACCAGGTTCTCCCTATTCTATTTCTGTCTCTGCTACAAATGGTTATGGAACATCAACTCCTGTTTCTGCACCCGCTGGTAATCTTTATGCCAGTATCAAAATTCAAACGATAACTGCAACTCCATCTGCTGGTCAAATAGTGGTAGACTATACTTCTTTAAATGGTATCCCAGGTCAAACCACTTACACAACCACATTAAATAATTATCCAGGTGGTTGCACAGGTATTTACACACTCCGATGTATAATTAGTAATCTACCAGCACAATTTTCTACAACTGTAACTGTAGTTGCTACTAACGATGGTGATTCAAATAGCGATGTAAGAAGTATTGACTTTTTGGCACCAGCCATGAATCCAATTGTAATGTCCTCAGTCAAAACAAAATCTATTACTTTCACATACTCAGCATCGAGAACACCTACTTCTTATACTGTTTTGGTTAATAATATTGCACACCCAGAATGCTCGGCAACCACTACTTGTATAGTCAGTGGCTTAACATCTGGTTCCCTCTTTTCAATTTCCATAACTGCTACCAATGTAGCCGGTACCTCTCCTGCCACACAAACTAGTGGAACTTTATATCCAGATGTTGTTGCTCCAACTGTAACATTAACTCCATCAACTAGTACCATAGTTGTTGACTATGAGTCTTTGGGTGGTATAACTGGTCAAACTCTATACACTACAAAACTTGATAATACACCAGTATCTACTTGTACCAATATTGCTGCTTTAAGATGTACTATTACCGGACTTCCAGGTCAATTTGCAAATGACGTGACTGTTGTAGCAATTAATGATGGTCTTTCACAACAAACCACTCAAAGAGTTGAGTTCTTAGCACCTGTTGTTAATCCAATTACAATAGTTGAAAAGAAAACCAAGTCTATTACCTTCTCCTATTCTGCTTCTCGTTCACCAACTTCATATGATGTCAGTGTAAATGGACTTTCCAATCCACAATGCTCTTCGAAAACCACCTGCACATTTACTGGTTTAACAGCAGGTTCATCATATACTATTCAAGTAACTGCTACTAATGGTGCTGGTATTTCTCTACCAATTACATCAACAGGAATTCTTTATCCATCAGTTGATAATTTATTCTTGATGTCTACACCAACTTGGAATAGAATGTTAGTGGAATACAATTCAACAGGTGGTTTCCCAAATAACACTGTTTATACTACACAAATCGATGGAGTCAATGTACCTGGTTGTATTCAAATTGCTTCATTGGAATGCCAAATCAATGGTTTAAAGGCACAATATTCACATAATATTACCGTTTTGGCTTTCAATGATGGTGATACCATTCAATCATCTTTAAATGTTACTTTTAATGATATGGTTCCTATTACATCATCTCAATTTATTCATGTTGAATCAACTCAAAATACAATCAATGTCAAATGGAGTGCTTCAACTGGAGGTGTACCTGGTTTAACTGTCTATGATTTGTCTTTATCAATTGATAATTCATCATGGATAGTAGAGTTTAAAAATATTACCATCACTGAAGCTACCATTTCAGACTTAATTCCATCGGTCAACTATTACTTAAGAGTATCAGTGAAGAATTCAGATAATCCACCAATTCATACCTATACTAATACTCAAACCTTGGGACTTGGAGCAGAGGATTGTAAATGTACCAATGGTATCTGTGATGCCAGTTTTAAATTCTGTTTATGCAATGCTGGCTGGACAGGTTCACGATGCGAATTTAAGCACGATGTCGTTGAAGGTGAGATGAAACCACCAACTATAACACCAAACCCCACTAGACCTGAGGTAATTATCGACAATGGTGATTCCCAATACACTTTCAAAATAAGTACAATCATTGAAAGAAGTGAACTATTAGAAGAGATCTCTAGAATGGACCTTTCAAGCTTGAACTGGGATCTCCAATCAAATCTTAGTACTATTATTAAACATCCCAATAGTTTAATGAATGTTTCAATGAACCAATGGATTTACTCGGCTAAAATCCAGAAAGCCGAAGATTTAATTATCAAGTTCACTCAAATCAACCCGATATCCAATGAATCAACTCCTACCTTCCCAATGGAATTTGCTGGTGAATCGTTCAATTTGACAATTGGTTCACTTAAATATCAAATTGAAGTTAAGAAATGGGATTTTACAACCAAACTTAACCACTTGGAAATTCAATCGACTGTTGAATCTAAACTTGATGACTGTGTTAACCCAGAATCTCAATTTTCAGATGGTACCGGAATTTCAGATATTGCAATTCGTCAACCTTCTGGTTATTTCTTATTTGGCAGAGTCTCCAAGAGAATTCTTCTTGATAAAATCCCTAGAATGTCTACCATTAAATATAATCAAGTAAATGTTTCAACTGCCACTATTTCAACATTGGTTAGCCATTTCCAAGATAGTTTGGTTGTAGATCCAGATTTCTCTGTACTTTTAGATCTAGATAGAAAATCAGATGTTAAGTGTGGTGGAGAAAAGAAAACCAATGCTGCTGTTATTGCAGGATCCGTCGTTGGTGCAGTTGTTGGAGTAAGTTTAATCACAGCCAGTGTAATCTTAATCAAGAAAAAGAAGATTGCACAGAGATACAATAATTATTTGACTCAAAAGTTGAAACCAAAGATGATGGCAGACAAAAACAACAATTTGATGTACCTCTTAACCGATCTAGGTGTCTCTAATTCACTATAG
>XM_030616062.1 PREDICTED: Syzygium oleosum uncharacterized protein At1g24485-like (LOC115689878), mRNA 
ATGGCAGTCCAGATGTTCTTGTTGATGCTTCTCTTCATTGAAGTATCTCTTTCTCAAGCATCACTGTTGAGAATTGATTGTGGGTCTCAAACTGGGTATGAGGCCAAAGATGGCAGCTACTGGAGCACCGACGATGAATTTGTCAAGGTCGGCAACGACATGCCGATCTCAGCCGGTAGTTTCTCCAAGTGGACCCAACTCAACACTCTTCGAGTCTTCACAAAAGAGAAAAAAGTTTGCTACAAATTGCCTGCGCAACCGTCGGTCCGATACATGAGCAGAGCGACATTTTATTACGGCAACTACGACGGCCTTTCGAAACCACCAACTTTTGACTTGGAGTTTGACGAGAATAATAGGAAAACTGTTGTCACCTCAAATACAGATCCGCAAATTTATGAATTGATTTACACATCGGGTGCGGACGACATTAAGGTGTGCTTGATTCGAACATCGGATGCTCAGTTCCCATTCATCAATGCGCTGGAATTGTGGCCATTAGATGATAATATGTACGATGGTATGACCCGAGACATGGCTTGGCTCAGCAATTACCGCTACGACTATGGTGCAGTGGCGGACACTGTCGATGATTGGATTTTAGGGTACCCTACTGATTCGGCCAACAGAATATGGGTGCCAACAACTCCATCCGACCTGAATCAGACGAAAGCCTCCGCAACTTACTTCTACGACAACGGCGATAACAACGTGCCCAACGTTGTCATGTCCCAAATGGTCGAGGCGCCAAATTTAACGTACCCAATCAGCTTAAGCTTCAGCATCAACGACGGGATCAATCTAGTTCACTACGTGACCGCGTATTTCACCGAGACCCATTCACTAAACGAGAACGAAAGCAGGTCGTTCGAATTCAACGCGAACAACAAGTTCGTCTCGACCATGAACCCGAGGTACGAGTACTGCACGTCGGTGTGGGCATTCGTGCAGTCGAACGGTACTCTAAATGTTCAGCTGCGCGCAAGCGGGAATTCGACGCTGCCTCCTTTGATCAGCGCCATTGAAGTGTACACGGGCCAAGCCGTACATTATCCTAAGACAAGTAAGTGGAAGGAAGTCGGCGGCGGCGGCGGCGGCGTGCTCTTTCTCATTTTGATTGGCTGTGGGTACTATTTGTGCTCTAAATCGAGGAACGACGGTAGACCAAACGGCGGTGGACCAAACAACGGTGTTATAGAAGAAGCCCCACCTCGGCGCCGTTTTTGGTGGAGAAGAACTCGCTACGTTGAGGAGGAGGTTGTTGAAGCTCACGCGTAG
>XM_031145784.1 Lachnellula hyalina Eukaryotic translation initiation factor (SPBC4B4.04), partial mRNA 
ATGGCAGAGCCTACGCAGTTTGCATACAGGACACAGAAGACGGTGGGCATCGTGGATGCAGCGCCCGTCTATGAGCCCTTGAGCGGGTTCCAGAGACCGGATGTTGCCTCTCGCTGCTGCACGTACTCGCCGTGCGGGCGGTACTTTGCCTGGGTCAGTAACGAGGCAGTCACTGTAGTCGATGCCTCCGTCGGACACGTCATCACCACTCTCTCCATACCCAACGTGTACGAATTGGGTTTCTCGCCGCGGGGCTCATATCTCATCACATGGGAGCGGCCGTCCAAGGATGAGAATGGGGATGCCGTGAAGAATCTAAAGGTCTGGCGCACGGTGGAGGACATTGCAGAGGGCGCGGAGAAGCAGGTTGTAGGGCGGTTCGTGCAGAAGTCGCAAACGGGGTGGAACTTGCAGTACACTTTCGATGAGAAGTACTGCGCCCGCGCTGTCACCAATGAGGTGCAGTTCTACGAGAGTGACAACTTGGGGTCGGTCTGGAACAAGCTGCGCGCCGAGGGCGTTACAGATTTTGCTATTTCACCTGGCAACAACCAAGCTGTTGCCGTCTTCATCCCAGAGCGCAAAGGTCAACCTGCTACCGTCAAGGTTTTCAACGTCCCTCAATTCGCCAGCCCGGTTTCACAAAAGAATTTCTTTAAGGGCGACAAGGTCACGTTGAAGTGGAACCAGCTGGGTACAACCCTTATTGTTCTTGCACAAACCGAAGTCGACAAGACGGGCAAGAGTTATTACGGAGAAACTACACTATATGTGCTGAGTGCAAATGGTGGATTTGATTCGAGAATTACTCTGGACAAGGAAGGCCCAATTCATGATGTATCGTGGTCCCCTAATTCGAAAGAGTTTGGAGTGGTCTACGGATACATGCCAGCCAAGACAACCATCTTCAACCAAAGAGCTGTTGCAACGCATACGTTCGATCTCAGGCCCAGAAACACAATCTTGTTTTCCCCCACCGGTCGATTTGTTTTGGTTGCTGGTTTTGGTAACCTTGCAGGGCAGATGGATATCTATGATCTCGAAAAGGATTACAAGAAGATCTGCACTATCGAGGGTGGCAATCCAAGTGTCTGCGAGTGGAGTCCAGACAGCAAATTCATCCTGACTGCCACTACTAGTCCCCGTCTTCGTGTTGAAAATGGAGTTCGGTTGTGGCATGTTGGAGGAGGTATTATGTACAATGAAGATATGGTGGAGTTGTATCACGTTACCTGGAGACCTCAATCACTGGACAAGCTTACGGCTGGGGATCCTTTGCATCCAGTCCCGACTCCTCATGCATCGGCTCTAGCGTATCTAGGTACTGTCAAGACGCCTTCCAAGCCTGCGGGCGCTTACCGGCCACCTGGAGCTCGCGGAACCTTAACACCATCGCATTACAAGCGTGAAGACGAAGGAGGGGCCGCACATGTTGTTAGTAACGGCACTCAGCTGGTAGGATCCAACGGATTTGGCAGAGGTAAACGACAAATCCCGGGAGCGGAAGCAGTGGAAAATCTGCCACCTGGAGCGGATCCTAGCAAACCAGTCCCAGGAGGTGCCGAGGGAGATGAGAATCTCTCCAAAGCAGCTTTAAAGAATAAGAAGAAGCGAGAAGCAAAGAAAGCCAAGGAGGCAGAAGCCAAGGCCCAGGGCCTAGTCCCTTCGCCCGATGGAGGAAATGCCGCTCCCCCCGATGTCCGCAGCCCTGAACGCAGAGATAGGCGCGACCATCAACGTAGCCGATCCAAGGGAAACCAAGACATACGCACCCCATCTCAGCAACGATTCCGCAGCAATACCCAGCAAGGCAAACAGCCACAGTATCGTCAGCAGAACGGCGGAGCTCCCACGGGAAATATGAACAACCTCTCTATCAATTCCACCCCACAGCCGCCAAAGCCGGTGCCTGCGCCTGAGCTCTCTGTCACATCACCTAATGGTGGCAGCCCAGATGCGAAGAAATTACGAGGACTGCAGAAGAAGATCCGCGCGATTGAGGATTTGGAAATGAGGCTCGCAGGAGGTGAGAAGTTGGAAGATACTCAGCTTAAAAAGATTGGCACGAAGTCTCAGGTGCAGGGAGAGCTTTTTGCTTTGGACCGTGAAAGTTAG
>XR_007275131.1 PREDICTED: Beta vulgaris subsp. vulgaris uncharacterized LOC125498264 (LOC125498264), ncRNA 
AAGATGATCTCGGGGGTCGTCCTGGGAGCATTGTGCAGAATTATGCAACAAAGGGTGGTTCCGAATTTTTTTTCATAGTGAACATACAGGTCCCTGGATAAAAAACGTACAATTTAGCACTGTACTATATGACGAGTAATCTGGAAGATGCACCTCTGCTGCAGAATTTCGTTGACAGAGACGATGCTTACAGAAATTCAAGGTTCAAACTTATTCTATACATATCTAAGGTCGGTAACATTCTGGTCTGAGGCTTGGGAATTATGCTATCTTGTCCCTCTTATGAAATCGATAGCTCGTATTGAGCATGCATTGGAATGCTTTAAAGGATTATTTCCTGGACATACAATATGTTTTCCAACTGCCTTCTCATATTTGAAGTTGCAATCACACAAATTTATTGGCCAACATTAAA
>XM_022542561.1 Aspergillus glaucus CBS 516.65 hypothetical protein (ASPGLDRAFT_163897), mRNA 
CCGAGCTACATGCTGGGAAGTTTGGAGCAACTCCCTCTGGAACTCATTAACATGGTGCTTATACAGCTCGAAATACAGTCACTGACAGACTTCCAACGCGTCAATAAACGAGCTATGCAAGTAGTAGACTCGATTCCACAATACAAAAAGATCATCCTCCATGCCCCTGCCTCAATCCGGGGGAGCCTCAGCATCAGCACTGGCAGTTTGTTTTCTTGTCAGGAACTGTACGAGAAGCTCTGTACGGCGGAGTGCGACAGCTGCGGTGACTTGGGTGGATACCTGTACTTGGTTACATGCCGCCGCATTTGTTTTCTCTGCTTCACCAAGAAGACCGAGTACCTCCCACTACTACAGGCGGACACGATACGGAAGTTTAGACTTCGCCGTGAGGATATAGCAACTTTACCTTCTATGAATAGTGTCCCCGGCCGCTATTCACCACGAGAGATCAAATGCCGTACTCAGCTTACCTTAATCGATCATGACGCTGCGCGACAAGCTGGAATTACTGTGCACGGGAACATCAATGCAATGGAGCAATATGCCTTGGAAATGACATCTAAAAAACTGGAGCAATACCAGTCTCGAAAATCAATACACATAGCAGATTGCCCGAATCTGCGTCGACCCAGATCTGAAGACATTTTTGATGGGCATTCACCTAATCTCAAACGCTTCTTGGGAATTATCCGTGCGCCATTTCTTAATGCTCGTACAGGGTCTCTGGAATGGGTCTTCCATTGTGCCGCATGCAAACCCCATCATTATAACAGACCGCTCCATTGGCGCCGAAGGTATACAAGGAAGAGTTTCGAAGATCATATTAGGGAGTGTGGAGAGATTATACATGGGAAGCACAACCAACGCGTGAGATGAAAAGAATAAGCAATGAGGATACGAAATATAATGGAAGGCAATTGCCCTGTGTCAGGTGATAGAAGATAACCGTCGGTAGAAATAAAAGAAACCAAC
>XM_031654791.1 PREDICTED: Papio anubis FA complementation group C (FANCC), transcript variant X2, mRNA 
GCACCGCTCACACGTGTGCGCGCGCAGCCCCGCCGCCGAGCCACCGCGGGAAAATTCCAAAACCCTCAAAACAAAAAGCCAATCCGAGGCAAAGCCAAATTTTCAAGCCACAGGTCCCGGGCGGTGGCTTCCTTTCCGCCGCTGCCCAAACTGCTGAAGCAGCTCCCGCGAGGACCACCCGATTTAATGTGTGCCCAGCATTTCCTTCAGTGCTGGACAGGCTGCTGTGAAGGGACATCACCTTTTCCCTTTTTCCAAGATGGCTCAAGAGTCAGTAGATCTTTCTTGTGATTATCAGTTTTGGATGCAGAAGCTTTCTGTGTGGGATCAGGCTTCCACTTTGGGAACCCAGCAAGACACCTGTGTTCACCTGGCTCGGTTCCAGGAGTTCCTGAGGAAGATGTATGAAGCCTTGAAAGAGATGGATTCTAATACAATTTTTGAAAGATTCCCCACAATTGATCAACTGTTGGCAAAAGCTTGTTGGAATCCTTTTATTTTAGCATACGATGAAAGCCAAAAAATTCTAATATGGTGCTTATGTTGTCTAATTAACAAAGAACCACAGAATTCTAGACAATCAAAACTTAACTCCTGGGTACAGGGTGTATTATCTCATATACTTTCAGCACTCAGATTTGATAAAGAAGTTGCTCTTTTCACTCAGGGTCTTGGATATGCCCCTATAGATTACTATCCCGGTCTGCTTAAAAATATGGTTTTATCATTAGCGTCTGAACTCAGAGAGAATCATCTTAATGGATTTAACACTCAAAGGCGTGCTTTATCATCATTCTCTTACCACCAAGATGGTTTTAGATCTAAAATTCATGTGTTTTTGAGTCCATCATCTAAGTTGTTAACAAAAAGACACATTTACCGTGAGTTAATGACTCCCGAGCGATTGGCGTCCCTGTCACGAGTCTGTGTCCCACTTATTACCCTGCCAGATGTTGACCCCCTGGTGGAGGCTTTGCTCGTCTGTCACGGACATGAACCTCAGGAAATCCTCCAGCCAGAGTTCTTTGAGGCTGTAAACGAGGCCATTTTGCTGAAGAAGATTTCTCTCCCCATGTCGGCTGTAGTCTGCCTCTGGCTTCGGCACCTTCCCAGCCTTGAAAAAGCAATGCTGCATCTTTTTGAAAAGCTAATCTCCAGTGAGAGAAATTGTCTGCGAAGGATCGAATGCTTTATAAAAGATTCATCGCTGCCTCAAGCAGCCTGCCACCCTGCCATATTCCGGGTTGTTGATGAGATGTTCAGGTGTGCACTCCTGGAAACCGATGGGGCCCCGGAAATCATAGCCACTATTCAAGTGTTTATGCAGTGCTTCCTAGAAGCTCTGGAGAAAGAAAACAAGCAGCTGCGGTTTGCACTCAAGACCTACTTTCCTTATACTTCTCCATCTCTTGCCATGGTGCTGCTGCAAGACCCTCAAGATGTCCCTCGGGGATGCTGGCTGCAGACACTGAAGCACATTTCCGAACTGCTCAGAGAAGCGGTTGAAGACCAGACTCATGGGTCCCGCGGAGGTCCCTTGGAGAGCTGGTTCCTGTTCATTCACTTCGGAGGATGGGCTGAGATGGTGGCTGAGCAGCTCCTGAGGTCCGCAGCCGAACCCCCCGCAGCCCTGCTGTGGCTCTTGGCCTTTTACTACAGCCCCCATGATGGGAGGCAGCAGAGAGCACAGACCATGGTCCAGGTGAAGGCTGTGCTGGGCCACCTCCTGGCGATGTCCAGAAGCAGCAGCCTCTCAGCCCGGGACCTGCAGACAGCAGCAGGACAGGACACAGAAACAGACCCCAGAGCTCCTGCACAACAGCTCATCAGGCACCTTCTCCTCAACTTCGTGCTCTGGGCTCCTGGAGGCCACACGATCGCCCGGGATGTCATCACCCTGATGGCTCACACTGCCGAGATAACTCACGAGATCATTGGCTTTCTTGACCAGACCTTGTACAGATGGGATCGTCTCGGCATTGAAAGCCCTAGATCAGGAAAACTGGCCCGAGAGCTCCTTAAAGAGCTGCGAACTCAAGTCTAGAAGGCACGCAGGCCGTGTGGGTGCCCAGCATGAGGGATCAGGCTCGCCAGGGTCACAGGACAGATGATGACCTATGGCCACGCATTTGTGGAGTAAGTAAGTGCCCTCTTTGGGCTGTGAGAATGAGCCATACACGTCTTGGGAAGATCTGCTAGTATCTATTTTAAAAAATGCAGAGCCAGGTCCCTCAGCCCAGACTCAGTTGGACATGTTCACCAATGACTTGAGTGAGCCTTCAGCGCTCCTGGTGCCCGCCCGGCCAGACTGTCAGCTAGAGAATTACTAAAGCAAAGGCTTGGGTGGGAGAACAGGTTTCTAGTTTTTACCCAAGTCTAGATGCACATCTATTATTTAAAGATTCAAAGCCTTAGAACCAAGAATTTGGTGATGAACCATTGAAGAATTTAGAGAGAACTCAGCTCTTTTTAGACTCTCTTCAGGAGTCAGGGATCTGGGATACAGCCACGCTGTCGTGCTGTACGGAGAAATCTCCACGGGGAGTCAGCGTCCCTCAGGCTTCCCTTGCGTCTCCCTGGACCTGCCCGATAGACCACAGGAGCAGACAGAGCACACCCAAGCCTGCGTCTCCTGCACACGCTTTCCACTCTATTTGCTAAACGCTGACTGCCACCAAAGAGCTCCTGGGACATGAGAGGGGCCGGCAGGTGAAGGTGGAGGACGTGTTGCAGAAACATTCAAAGGCAGGATTCGTATCAGTTAGTTCTCTTGTTAAACGGAGATGGGAATTGGAAATTCCTGATAAAGAACTGACGTGGCTGGGCGCGGTGGCTCACACCTGTGATCCCAGCACTTTGGGAGGCCGAGGCAGGGGGATCCCTCCAGCCCAGGAGCTCCAGACTGGCCTGGACAACATGGCGAAACTCCATCTCTACTAAAAATACAAAAATTATTGGGGTGCCGTGGTGGGCACCTATAATCCCAGCTATTGGGGAGGCTGAGGCATGAGGATCCCTTGAACCCGGGAGGCAGGAGTTGTAGTGAGCCGAGATCATGCCATTGCACTCCAGCCTGGGCAACAGAGTGAGACCTGTCTTTAAAAAAAAAAAAGGCATTGTTGGTGTAATCTCAAAGTTAACGTTTATTTCACGTCAGCAGAGGATGCTTTTTCCTGTCAGAGACATTCTGGAATTGTACCGATTGTACATTCTTTTGTGCCTATTCTGTTTGTCAAGTGAGTCAAGACTTGCTTTTGTCCATTTTGATGTACGTGTGTTAGTCGGAGTCTTGGCTCCGTTTTGAGGCATGAGCAAAGTTTCACTGGATTAGAGGTTAACCTTTAGGGAAATTCCTTTTCTTGGTATGTGGCAATGCTAATAAAGCCACCTGAAGATCTGGAAAATTCCAGGAACTTTTCACCTGAGCTTTTCTTCTGAGAAATGCTGCAGTCAGAAGGGTGTGCTGGTAAAATATTTTGGTGGCAGCTGCCATCGTGATCATTGCTTTCATATAAGACGCTCTGTGCCATCATGATCCTTACCCTCATAAAACAAACACACTTCGTCAGAGGCGTCGGGGTTGAAAAAGGAGCTGCTTCACTGGAGTTGAGGGCCTCTCTCCTGTTCTGACTTTGAGCCAGAACTTGTGGCTGGCCCTGGAAGCTGACTCCACTGTGGACACGGTGGCAGCAGGGAGCCCCTAGAGGGAGGGTCACTGGGACCAGGCCTTCTGTCATCAAGGGGATTCTGGGACAGTCCCTCACCCTGTCCTGTGGTCCTGTTCACGGGGCTGGCCTTTCCCTCCTCCCCGGCCAGGCCTCTGACCATGCCCCTTCCGTCTTCTCCACTGGGGACTGGTGAAGCTGGGCGTCTGGAAGACTTCCTGGCCTGGAAGCCCTGAGCTCGGCCTGTCTGTAGAATCTCCCAGTTCCTTCACAGCTGCCGAGTCCTCTTGTGGGCGCGGTGGAAGCGGCTTTCCGGGCAGCCAGGGGTTCCCGGATAGGACTGTCCCTCTGGGGATGTGGCACCGAAGTGCCTGCTGGCTTCATGTGGCCCTTTGCCCTTTCCCGGCCTGAGAGACGCTCAAAGGTGGAGAGCCAGGGGAGCCACCCCTCGGCTGGTCCCTCCACCTCTGGGACAGGTGGCAGCCGGGCAGGTGAGGGCATGTGAGGGCCGCGGCTTCGCTCCTAAGCCCACGTCCTCCTCCTGTTGCCATCGATTTTTGGCAAAGTCTGGGCAGGTGCCACCGGGAAGGAATGGCGTCCGAGATGCTGGGCACGGCATGGTGCGGCCGAGGGGGCCTTGACATCGCTGGCGGGGCCTGGGCACAGGGGCAGCCACAGGGAGGCAGGGATGCCAAGGCCTGGAGCCACCGTGGAAGGAACTGCTCGAGGTCTGCAGAGGTGCCACAGGGCCCAGAATCTGACCTTACCTGACCTCTTCTAGACTCTCCCTGATAGTTTTTGATGAAGCATGTTGGTAAAACCACTACCCTCAGAGAAAGCCAAAAATACAGATGAGGCGGAGCTCGCCCCTCCAACCTGGCTGTTACTCACCTGGACTCCACGACATCTGTGGAATTCGTAAGCTCTTTAAAATCTGTAACTTGTTGTCTATTTTTTCATTCTAAATAAAACTTCAATTTGCACCTAA
>XM_047252959.1 PREDICTED: Schistocerca piceifrons cuticle protein 79-like (LOC124777512), mRNA 
CGTTTCGCTTGGTGAGAATCTGGATGGTATATAAGGAAACGGCTGCGCTAAGAACTCTGTCAGTCATTCGTTGCCCATCTACCACCATCGCAAGAGCAACAATGAGGATCACGGTGTGCGCAGTTTTGCTGGCGGTGTGCTGCCTTTCTGCCGCGGAAGAGAAAGCGCGTGCCAAGACGGAGAAGCGAGGCCTGCTGGGGCTCGGCTATGGTGGCTTCGGCGGCGGCTACGGGGGCGGGTACGGCTACGGAGGCGGCTACGGGGGCGGGTACGGCTACGGTGGCGGGTACGGCTTTGGGGGCGGCTATGGGGAGGTCAAGGCCGTCACCATCACCAAGGAGGTGCCGGTGCCGGTACCGCAGCCGTACCCGGTGCCGGTGGAGAGGAGCGTGCCGTACCCGGTCAGCGTGCCCGTGAAGGTGCCCGTGGACAGGCCGTACCCCGTGCACGTGCCGCAGCCGTACCCCGTGCCCGTGGAGAAGCCGGTGCCGTTCCCCGTGAGCGTGCCCGAGGCCGTGCCCGTGGCCGTACCTCACCCCGTGCTCGTCAAGCAGCCCGTGCCCGTCGTCGTCAAGGACGTCGGCTTCGGCGGAGGCTACGGGGGATTCGGAGGCGGGTACTCCAGCTTCGGTGGCTTCGGGGGTTACCACCACTAAACGTCATCCGTGCCGTCGCAGCCACTCATCTGACAGCCATCTTCACAGCAGGACTGCCCAACCACCTATTTCCATTCGTATGTTTCCATTTTGTTAGATCGAGATCTCTATGTACCAAAAATTTGCAGATTACTGTTGATTTCAATAAAATATTGCAATAAAATT
>XM_046236555.1 Lentinula edodes uncharacterized protein (C8R40DRAFT_884233), mRNA 
GGAACTTTCAAGTTATCAGACCTTCGATCTCGGTCCGTGATTACAGACAGATACATTCCAACCCCAATTTTCACTGCTTTTGTCTTATCACAACATTCATGAGTGGTGTTCAAAAGACTGCCATCGTCACTGGTGCCTCTTCAGGCATTGGACGATACACTGCTATTGCCCTCCTGAATGAGGGATGGAACGTTGTTGTCACTGCTCGGAGATTAGAGGCCCTTCAAGAAACACAGGAAATGTCTTCAAATGCTGAAAGCTGTCTTTGCGTGGCTGGTGATATTACCGATGAAACCTTTGCGATAAATCTCTTCGAGCAGGCAATTGCTAAATTTGGGCGACTGGATCTTTTGTTCAATAATGCTGGAATATCGTCCGCCCAGGTTCCAATTGAAGATGTCTCCTTCGACACGTTCCAAAATGTTCTGAACATCAACTTGGTAGCGCCTTTTATCTGCACTCGGGAAGCAGTCAAAAAATTTAAAGCTCAAACTCCCCCTGGAGGTCGCATCATCAATAATGGTTCCTTGTCAGCCCATGTACCGCGTCCGCACTCTTATGCATATACGATGTCAAAGCATGCGATGAACGGTCTCACCAAGTGTACTTCTCTCGACGGACGCGCATTTAACATTGCCTGTACCCAAATCGATATAGGAAATGCGGCTACAGATATGGGAGGACGGCATGGATTAGGTGCATTACAGCCAGACGGACGCATAATTCAAGAAGGCGTGCTTAATGTCCAACATGTCGCCAGCACGATCGTGCATATAGCCAGTCTTCCGCCTGATGTTACTGTTCTCCACGTCAACATCATGCCCACCAACGTCCCATATGTTGGACGAGGTTAATAGAGTCGAAGCGTAGGATTCAATATCATTCCGACTTATACAGAGTTTTCCTTCTATTTCCCCTTACAAGGTTCATATAAGTACATAGGCCTCGTGAAATAATTTGTCCGTATCCGACAAGCCTCTGATTA
>XM_053458426.1 PREDICTED: Spea bombifrons corin, serine peptidase (LOC128482252), mRNA 
TGTTCATCTTCAGCACGTGGAAGCTGAGTGGAGCCGCGATCCCTGCGAGGGGAGAATGTGAGCGAGGAATCGCGCAGGGAAAGTGTTTGGGAGAGAGCCGGGCATGTCAGCCCACTGAGCATGCTATCAATGCAACAGTTTGCTTCCCTGCCTCCGGAAGACAGCTACCGGCCGGTCATCTGCGCTGACAGGGTCTTTGGAGCAGATGAAGATAATATGGGGGATGGCTGTTCTCAGAAGCCGGCATCTGCCAAGTACCTCCGTCTCTTGCTGCTAATACTCATCCCATGCATCTGCGCTTTCATTCTTTTGCTGGTTGTTCTGCTCACATTTGTTGGTGTGATAGACAGACACTGTTTTGACTTTAATAGGAGTGATCCGCTAACCAGCAGTATTGGAATCGGATCTCCTGACATTCCATTCATAAAGATGGATGACAATGCATCAGAAGGGACATTAATGAAAGGCTGGGAACCCCATCCCGCACTCTGGAATACTTCTGCTGTTGTAGCTGACCAAAGCTCTACCAACTTTAGTGAAATAAAAGACACTCCCCAGCAGGATCCCTTATACCCCTTTCCTTATACCACAGTAGATTATAAACGCTCAAGAAATAACGTGACACTGACCAAAGAGCATGACGCCAACCTATTGGAAAGCACGGGCGTTTGGACCACGCCATTGCTGAGTGACGCCACCATGTCTCCGACTGTGGAACCAATTGGGCCTCAATTTGTAGTCAGGGAAGATGCCTGTGTGAACATCTCATACAGCCAATGCCAAATGCTGCCATACAATAACACCGTCTCAAAATCAGTGTATTCGTTCGTCAAGAGCATTGAAATGGAAATGTTTCTCAAGTTCTTCAGCTATCTCAACCGCCTCAGCTGCTATCAGCACATCATGCTTTTTGGCTGCAGCCTGGCTCTCCCGGAATGCATCAGTCATGGCGATGACAGTTATACTCTCCTGCCGTGCAGATCATTCTGTGAGGCTGCGCAAGAAGGTTGTGAACCAGTGCTTGAGATGGTGAATTCTTCCTGGCCAGAGTTCCTGAGATGCTCCCAGTTTCGGAACAAAACAGACAATAACAACACAAGCCGAGTGTGTTATTCTCCGCAGCAAGAGAAAGGAAAGCAATCGCTTTGTGGAGAACATGACAGCTTTCTGTGTAACAATGGAATCTGCATACCTAGACAGTTGATGTGCAATGGATACAATGACTGTGATGACTGGAGCGACGAGGTACATTGCAACTGCAGTGATCATCAGTTCCGGTGCAATACAGGGAAATGCCTTAACCACAGCCTTGTATGTGATGGGTACGATGACTGTGGAGATCTAAGTGACGAGCAGAGTTGTGATTGTAATCCATTACATAGCTACCAGTGTGGAGATGGACGATGCATAACTTTAAGATGGGTCTGTGATGGTGACCATGACTGTGTAGACAAGTCTGATGAAGTCAACTGCTCATGTCATAGTCAGGGTCTCACCGAGTGCAGGAATGGGCAGTGCATTCCTAGTGCCTTCCGCTGTGATGGAGACAGTGATTGTAAAGATGGCAGCGATGAGGAGAACTGCACTGTAAGTAAGGGACAGGTATGCCAAGAAGGAGATCCAAAGTGTATTTCTCAAGCCTGTTCAGGAGCATGTGCCAATGATCCCAACTGTGGAACGCCTCACAACAAGACAAACTGCAGTCAGTGTGAACCAATAACCTTAGAGCTGTGTATGAACCTACCCTACAACTATACCCATTTCCCAAACTATCTTGGTCACAGAACTCAGAAAGAGGCTTCCATAAGCTGGGAATCATCTCTGTTCCCAGCCCTTGTTCAAACAAATTGTTACAAATATCTCATGTATTTTGCATGTACCATTCTAGTACCAAAGTGCGAACCGGAGACCAGTCAGCGGATACCACCATGCAGGTCACTTTGTAAACATGCCAAAGAGCGATGTGAATCTGTGCTTGGTATTGTGGGATTACAGTGGCCAGAGGATACAGACTGTACCCAGTTCCCAGATGAAAAATTAGACAACCAAACATGCCTTATGCCTGATGAGGATGTAGAAGAATGCTCCCCTAGCCATTTCAAGTGCCGTTCTGGACGCTGCATCTTGGCTTCCAGAAGATGTGATGGAGAAGCAGATTGTGAAGATGATAGTGATGAGGAAAATTGTGGATGTACTGAGAGAGGTCTTTGGGAATGCCCAGTGAACAAGATGTGCATCAAACATTCAATGATATGTGATGGATTCCCAGATTGTCCTGATGAACTGGAAGAGAAGAATTGCTCATCCTGCACAAACGATGAGTTAGAATGTGCCAACCATGAGTGTGTATCTCGTGATCGCTGGTGTGATGGCGTGGTGGATTGCAAAGACAGCTCAGATGAATGGAACTGCGTTACTCTGTCTAAAGGTGTGAGGTCCCTCCTAACCATTCACAGGTCTGCATCTGACCATCACGTATGTGCCGATGCTTGGGATGATGAGCTTACTCACTGGGTCTGCAAGCAGATGGGTTTAGGCGGCCCATCAGTGGCAGAATTTGCCCAAGAAGCTGATCATTTGGAACATAATAAAATGCTGCATCTAATTAAAGACTGGAAAAAGAAAAATGGATCTACATTTCACGAGCTGCTCATGAAAGGGCAGACTTGTGAAAGCAGAGCTAAAGTATCTCTGACATGTACCAGAGAAGATTGTGGACATCGTCCAGCCGCCCGAATGAGCAAGAGAATTCTTGGTGGCAGGACGAGCCGACCAGGACGTTGGCCTTGGCAGTGTTCTCTCCAGAGTGATCCCAGTGGACACATCTGCGGCTGTGTTCTCATTGGGAAAAAATGGGTGTTAACGGTAGCTCACTGCTTCGAAGGAAGAGAAAATGCTGCCGTATGGAAGGTTGTATTTGGTATAAACAACTTGGATCACCCATCTGATTTCATGCAGACTCGCCTTGTGAAGACTATTATTCTCCATCCACGGTATAACAGAGCAGTGGTGGACTACGACATTAGTATTGTGGAACTGGATGAGGACATTGTGGAGACTAGCTATGTGAGGCCAGTTTGCCTCCCAACTAAGGGCCAGTTGGTCGAACCAGATACGTATTGTTACATCACTGGATGGGGACATATGGGCAACAAAATGCCATTTAAGTTGCAAGAGGGAGAAGTTCGGATTATTTCCTTGGAACGCTGTCAGTCTTATTTTGACTTGAAAACCATAACATCCAGGATGCTGTGTGCTGGGTATGAGTCCGGGACAATAGATTCCTGCATGGGAGATAGTGGCGGTCCCCTTGTCTGTGAACAAGAAGGAGGACAGTGGACGTTATATGGACTGACTTCTTGGGGATCTGTATGTTTTTCCAAAGTTATGGGACCTGGAGTTTATAGCAATGTTTCCCACTTTATTGACTGGATTGAAAGACAGATATACATTCACAGCTTCTTAATCAACTAAAGACGTATATATATATGAATAAAATACACATATTTAAAGGCAAACAGCAAAAATTGCCTTAACCACCAAGGAGGTTTTAATGAGTGGAAATCCTTGCCCTGGGTATTAATGAAAATGATATCTATATATTTTTGTTCTAAACGTTAGGTGTTTTAGTCTAAAGCTTTTTGACTTTTTGTACATATCTGTTCACGGTTATGTTTTGCTGTGTAATCATTTCTTAATGAACACAGACTTTCAAAAAAATGTAACATTTGTTGTTTGTTTTATATGCGGGCATTGAGTGGGTGATACCGGGCTTGGGTTTGCCAGGAGTCATTTACAGGGACTGACAATTGTAAATTACCACACATGGGACAGGTTACATTTGTAGCATAATACACTAAATTCTGATTTCAGCTACCGAGACAGGTAGGTAAAGCTCACGTTAGCTTTGAGATGTCTTAAATACCAATAGAGATGCCAGTTCATTAACTTTACTGGATATTAAGCTTACGGACTACAATGGTCCCTGTAATGTTTCCATAGACTTCAAAACATCACAGTCTGACCGCCTAGTTTATTCACCCATGTTTGATTGCTCAGGTTTAGAGGGGTTACACATGCATTTACTATAATGAACATGTAATTTGGTAACAACAGACCCCACAATGCAGTCTACAGATCAACTGTTACTACTACATGATGATTGTTTCTTTAATAAAA
>XM_051514774.1 Durotheca rogersii uncharacterized protein (GGS23DRAFT_536457), mRNA 
CAGCTAGGCACGTGAAGTCTGCCTCTCTTTTAAACCCACGACGAAACGCCAATTCTCCCTTCGCACCCGCCGTCTTGGCTCCTCGGGCCCCGCAGTGCAGCGTCAACGAACACTCAGCCAAATCGTTCCTCCCACCCCGCCATCGCCATGGGTGAGCCAGTCAAGACCCCCGTGGTCGCGGAGGCCCATCTGGTCGACACCTACCATCCCCCCCACAAGATGCTTGAGAAGCATCCAAGCAAACCTCATCTGAATGGCCTCGAAGATTACCAGCGGCTGTACAAGGAGTCCATCACCGAGCCGGAGAAGTTCTTTGCGAGAAATGCTAGGGAGCTGTTAACTTGGCAGCGGGACTTCCAGACCGTCCGAACCGGGACTCTGACCGACGGGAATGTTGCATGGTTCGTTGAGGGCCAGCTCAATGCCTCCTACAATCTCGTCGACCGGCACGCCTTCAAGGACCCGAACAAGGTCGCCGTTATCTACGAGGGCGACGAGCCTAACCAAGGCCGAAATCTGACCTACGGCGAGCTCCTTCGCGAGGTAAGCCGGGTCGCCTATGTCTTGAAGAAGATGGGCGTCCGAAAGGGCGATACCGTCGCGATTTACCTACCCATGATTCCGGAGGCCATTGTCGCTCTCCTGGCCATTAGCCGTATCGGCGCTATCCACTCCGTCGTCTTCGCCGGCTTCTCCGCCGATTCCCTGCGCGACCGTGTCATCGATGCTCAATCCAAGGTCGTCATCACCACGGACGAGGGGAAGCGAGGTGGCAAGTTGATCGGCACCAAGAAGATCGTGGACGACGCGCTCAAGCAATGCCCCGATGTCACCGGCGTGCTCGTCTTCAAGCGCACTGGCGCCGACATCCCCTGGACGCCGGGTCGCGACCTGTGGTGGCACGAGGAGGTCGAGAAGTGGCCGACATACATTGCGCCCGAAGTCATGAACTCCGAGGATCCCCTCTTCCTGCTGTATACCTCGGGCTCGACCGGGAAACCCAAGGGCGTTATGCACACTACCGGCGGATACCTGCTCGGCGCCGCGCTAACCGGTAAATACGTGTTCGACATTCACGACGGAGATCGGTACTTCTGCGGCGGCGATGTCGGCTGGATTACCGGCCACACGTACGTCGTCTACGCGCCCCTTCTCCTAGGCATATCCACGGTGGTCTTTGAGGGCACTCCGGCCTACCCGAACTTTTCACGTTACTGGGAGATCATTGCGAAGCACGAGGTCACGCAGTTCTACGTGGCGCCGACGGCGTTACGGTTGTTGAAACGCGCCGGCGACGACTTCGTCAATGCCGACATGCCGAAGCTGAGGGTTTTGGGATCGGTGGGTGAGCCTATCGCCGCCGAGGTTTGGAAGTGGTATTTTGAAGTTGTTGGCAAGGAGGAATCGCAGATTGTCGACACGTACTGGCAAACCGAGACTGGCTCGAACGTAATAACGCCCCTGGCCGGCGTAACCCCCACGAAGCCGGGCAGTGCCTCGCTGCCTTTCTTCGGAATAGAACCAGCCATCATCGACCCCATTTCCGGCGAGGAAATCTACGGAAATGACGTTGAAGGTGTGCTGGCGTTTAAGCAGCCGTGGCCTAGCATGGCTCGGACTGTCTGGGGTGCCCACAGGAGATATTTAGATACATACCTGAATGTGTATCCGGGCTACTACTTTACCGGCGACGGAGCTGGCCGTGATCACGAAGGATTCTATTGGATCCGAGGGCGAGTCGATGATGTCGTCAACGTTAGCGGGCATCGTCTGTCGACTGCCGAGATTGAGGCGGCCCTCATCGAGCACCATTCGGTAGCCGAAGCCGCCGTCGTCGGCGTCACCGACGAGTTGACCGGCCAAGCCGTCAACGCGTTCGTGGCCATCAAGAACGGGAACGAAGCCTCGGACGCCTTGAGGAAGGAATTCATTCTGCAAGTGCGGAAGAGCATCGGACCGTTTGCCGCCCCCAAGGCGGTGTACATCGTACCCGACTTGCCAAAGACCCGGAGCGGAAAGATTATGCGCCGTATCTTGAGGAAGATTCTGGCCGGCGAGGAGGACCAGCTCGGTGACGTATCAACGTTATCGGACCCGTCGGTGGTTGAGAAGATTATTGCTACCGTTCACGAAGCTCGGAAGAAGTAATGGTTGGATACGGATATAAGTGGGTAGGTAGGCGGCTCGATTGGAGAACACCTGACAGGGCCTTGGATCGCAAATGCGGGGAAGGGTCCCAAGACATCGGATAAGTTGGAGAATTATGAGTATAGTATGCTATTTGACGGCAACATTGTGGTTTGGCACAGCCACAGAGCGGAGGAAGACGGTACGCCACCGGCTCAGCAGCTAGTGGCGCGCGCCCTTTGGTGTGGAGGCTTTGAGGAATCGCTCGGCCAAGGGTGGGATAGTTGCGCTGATATGGACGGCGTGTTTTTTATTGATTTGTCAGCTTTAGAGCCACCTTATATCAGCTTGATTGTACATTCCTATAACGCGGCGGCTTTAACGCCGAGGGTGATCAAACAGGTCGTGGTTTGCCGTTGGT
>XM_037547025.1 PREDICTED: Pygocentrus nattereri leucine rich repeat transmembrane neuronal 4 like 1 (lrrtm4l1), transcript variant X2, mRNA 
AAAGGAGCCAGTGCATCCTGGTGGTGCATGGTGCAATCATTGCATTGCTGTCCCAAACCCTTGGAGGAGAACGACAGGCTCTCTGAAGCTCAGGTGTGGGTGGCAGGAAATTTAAGGTGCTATGGTTTGTGCTACGAGATTAGCATGCCTCCTCCCTCTCCTTGTCTCCACTCTTCTGTTGCTCTGCTCTGGGGAGAAAACATGTCCCTACAACTGCCGCTGTGAGGGTAAAATCGTCCATTGCGATTCAGCGTCTTTCATGGATGTGCCAGAGAACATTTCAGTAACTTGCCAAGGTTTGTCCCTGCGCAACAATGACCTGCACACAATGCTCCCATACCAGTTTGCCCACCTTAACCAGCTCCTCTGGCTGTATCTGGATCACAATCAGATCTCATTTGTAGACAGTCGTGCTTTCCAGGGCATACGACGGCTTAAGGAGTTGATCCTGAGCACCAACAGGATTTCACAACTCCATAATTCCACCTTTCATGGAGTGCCTAATCTCCGCAGCCTGGACCTCTCCTACAACAAACTTCAGGAACTGCAACCGGGTCAGTTCCATGGTCTTCGCAAACTCCAGAATCTGCACCTACGCTCCAACGGGCTCACAACAATTCCTGTCCGGGCATTTATTGAGTGCAGAAGCTTGGAGTTTCTTGACCTAGGGTATAACCGACTACGTGTCCTCACACGCACTGCATTTCTGGGTTTGTCTAGGCTGATGGAGCTGCATCTGGAACACAATCAGTTCTCTCGGATCAACTTCTTTCTCTTTCCACGCCTCGCAAACCTGCGTGGTCTGTATCTCCAGTGGAATCGTATTCGGGCAGTGAACCAAGGCCTCCCATGGATTTGGTATACCCTGCAGAAGCTTGACCTGTCTGGCAATGAGATCCAGACTCTGGATCCTGTTGTATTTCAATGCCTACCAAACCTACAGGTTCTTAACTTGGAGTCTAACAAGTTAGCCAATGTATCTCATGAGACTGTAGCAGCCTGGATTTCCCTGACTACAATCAGCCTTGCAGGAAACATGTGGGACTGTGGGCCAGGCATTTGCCCTCTTGTTGCCTGGCTAAGGAATTTCCGAGGAACTAAAGATACAAGCATCATTTGCAGCAGCCCCAAAAATCTTCAAGGGGAAAAGGTTATGGAGGCAACAAGAAATTACATAGACTGTGAAGATTTCGAAATCATTCCACAAACACCATTTCCTCACCACACTCTGGAACCAACTATGGAAACTACTTCTGCACCACCCTTACCTCCCACTACTCCCCCACCACCCCTGCCTCCACCTGCCTCTGAGGCACCCATCCCACCACCCCTAGCTCAACCCCTTCCTCATCCTACTATCTACAACCTTGCTGAGACTCATCCTAGAAACAGCCCTCCACAGACACCTCCACCTTCCAACAGCCTGCTCGTCACTCCATCCCCAGAACAAGAGAACTTGGCATTCCATAAAGTTGTGGTGGGGGCTGTGGTGCTTTTCTTCTCAACATCACTCGTCTTGACAGTGATCTATGTGTCCTGCAGACGGTACCCTGGTGCCACCAGGTTGTTGCAACAGCGTTCAGTCATGGGACGAAAGCGCCGGAAAAAGAGTCCCGAGCCAGAGCAGAACCTGAGCTCCCAACTGCAGGAATATTACATGAGCTACAATCCTGCCGCCACACCAGAAGCCATGGATGTGCTGGCCAATGGGACTGGTACTTGCACCTGTACCATTTCCGGCTCCAGGGAATGCGAGAATGAATACACGTGTCCCAGGCCACTCCCTGGAGCCTGGATCGGCGACATCCCCACCATTCACTAGGAATGTTTTCTCCACCAATGAGATTTCAATAGGCAACAGGGTTCCAGCCTACAGCCTCTGCATCCATCACTCTACGGCCTACGCTGCCATTTTTTTTCTTTTCCCTGTCATTTATGGAACGTTATCCACCATGGACATGTGAAGGGACATCTAAAAAGACAGCAGGAACGCCTCCATCACGCATTTTACTAACACGCACGTCACACTTCTTCAAGACGCCTCACTTTATCCACTCTCTTTTTTGCCTAGACAGCTCTTTCTCTAGATCTAAGCCTGACTAGGCCTTTGGTCGAGTTGAACATACAGGAACAGGATGAACTATTCTATTCTACGAACAAAGCCACTGTAACAGCAATGAGAGTGCATGGGAAGATATCTCCTGGACTTTAAGGAATATCCTCAGCATCAGAGCGTATGGATTTTCCATATGACAAAACATCATCCATCAGACAACCATTGACTGCCAGTCAACTGATACATTAAGCCTATTGCTGGACTTAACTTATTTGGTCACACTTTATGTGAGGGCTACCTACATATGGACCTTATAACACACTGATAAGCATTGAATAACATGTTTATAAAGTAATGTTTGAGTATTTATAAACAGCTGATATGAGTAATCACAGAATGTGTAGGCACTGTGTTGACATAAGAGGTCTTAAACCAATATAATGGATGTTTTTTTTTCATTTGTATCATTCCCACATAATGGATCTTAAATGCCAAGACCACTGTTTATGAGTTTTAAATATTTCTTCTTGAAGTCCAATTGTACAATTTCTATAAAGGAAAACCAGTATGGCTGCAGATACTAACTCCTTAAAGTAGAATTTTTCATTCAAATAAAATAGCATAATAAATCAAAGTGCTTTTACTCATAGTAAACTGCATTTAAGCAAGCAAGCAAAGTTTATTTATATAAAGCTTTTTACAACAGATGTTGTCACAAAGCAGCTTTACAGAGCAATCAGTATTATAGAAAGAAAAGAAAAGAAAATCCGGGACCAAGCCCCCATGAG
>XM_023033177.1 PREDICTED: Olea europaea var. sylvestris ferredoxin, root R-B2 (LOC111404360), mRNA 
ATGAACATAGGATTTGAGAGAGATTTGTGTTTGCTGTTTGAGATTTGGATCAACGATGGTGGTGGTTCGCGGTGGCGGCGAGTGGTGATGGAAAGGAACGGATCCTACATCCATGCTTACAAGGTACTAATTGAATATGAAGGTAAAACAACTGAACTAGAGGTTGAGCCAGACGAGACAATTCTGTCGAAGACACTGGAAAGTGATTTGCCAGTGCCATATGACTGTNAATGCATGACATGCCCGGCTCAANGAATGGACGACCAAAGTGATGGGATGCTTAGTGAGGATGTTGAGGAGAGAGGTTATGCTTTATTGTGTNATTGTCACATTAGAATCATACCCGAGGAAGAATTGCTCTCTCTGCAGCTAGTTACTTCCAATGACTAATAAATCTGTTGGTTGTTAAAATTTTCAGTTTTGAGGCACTGCTAATTGTTACTGTTTTTCTGCATTAAATCTATAAGAGGAATGTGCAAAGTGAGATTCTGAAGGCAAAGGTTAACGATACCTTGTATTTACTTGCTGGAATTTCTATTGTTTGAAGAATATTTAGGCTTCCACGTTTAGATTTCTCTAAAAGCGTTCTCTCTGACAACCAAGAATGATAAAATCATTCGCATTCAGTCTAAAATTTAAGCACAAGAAGATTTAGTTGGAAACACCTGCTACCATTAAACAAAGTTCTTCATAGATAAAAGTAGCAAAATAGGACATGTATTGAATAAATGCATTGTGCGTGGCTGGTATCTATCTATTATTACGGGTTCAATACTACTTCTCAGAGTTGAATGTAGACATATAAGGTCATATAACAAATTTTGGAAGTATGGTCAAATGTTAATGAACAGTAATTCATCCATGCGTGTATAACAGTAATTGGACACAATGTGAGTTCAGAGGTGACTAACAATTAAAAAGTAGACACTTCTCCATATCCATGTGGAAGTATGCTAACAAAGCATTCAACACTTATGTTCAGTGAATAAATATGATCGTATCAAAAATGTACTCACTGACTCCATTTGATGTTGATGCAGACAGCAAGCACTTCAGAGTAGCTCCCGCAAGTGATAAATAAACTCGGTCTTCTTCAAAATTTAGATCCTAGGACATTATCAGAGCCCATAAATCCAGTATAGCATATGGCTAACCACATTTTGTATCTCAATGAAGGCCATAACACGCAGTATTACTGCTGAGTTCTCAGGGCAAGGCTCTGGATTTTCTCTGCTCAAGTTTCAACTTCACATCAATTCCATTTATCAATTATGGACTTGAGTACAATCTGAAGCTTCCCTTCCAATTTCTCCCCTTTCCTTGGAGTATAAACCACATTATGGATATCATCAGCCAAGGCCCTCTGAGCCAACAATTCCCCAACCGCAGCACAAGCATTTCTATTCTTAGTCGAACCCATGGCCTTGGAAATAGAATGCACCACAACCAGAGGTTTGCTAGAATTTCAGATCAAAAGAATGCTCTTTCATTCAATATTCATTGAGACTCGTTTGTTGACAGCCTATTGCACAGCATTGTGTTTGAACCTTGTGAAAAGCGAGGAAACTCATCTAATCCTTACTTCCCCATCTGTTTCTCTGGATCTTGAACAGGTTTCCTAGGTAATCCCCAGCTCCGTAGATTGTTCTTTTGCACAGGGCCAATTCTTGGTATTCCTTCACTTTCCCCTTCATATAAAAAATTACAGTATCCGAAACCAAAAGTTCATGATGCATATTTCTCTTAACTGGTGGTTTTCTGGTCACGACGGTTACAGTTAAAGTTCCATTAAAGAGCATTTCCACATGGTAGAACCTTCTCAAGGAATATAAGGTTTTCAATAGGCTGATCTTGAAGCTGCCCAGTCAACACAATTAAAAGCAGAGTACACAGCACGTGCAACAAACCCAGCCGTTCTTTGCTTACAATGGTAAGTACCTCATTATAGATTCTTTGGTCGACTATAAATGCTTCACAGCCTTGTTAAATATTTGGATTTTTATACTTGGTTCTAGCTACCAGAAAAAGGACTTCGAAACGAAGACTTTAATATTATTGGTCGCATCATAATACGCATAATATGAGTTTACAATCTCCACCTGAATGTAAATGATTGAAAGGAGAATGCTACCAATCAGGACAAATTTGACCTTAAAGAGGATAAACAAAACTTCTACTTCAGATTCTTTCATA
>XM_017942333.1 PREDICTED: Habropoda laboriosa cyclin-T (LOC108578915), transcript variant X2, mRNA 
ACAAGTATGAGTTTGGAGTGGAGTTTCCGGTTAGCGTAGTGACGTGAAGTTTTCAACGTGTTGCTGTTGTGCGTTGTGCGCCCGCCGCCACTATCGCGACCGCCGTGAAGTGCGCATCGTTAGTACCGAGTTGTGTGTACATATAAATGGCGGCTGACGAAAAATGGTACTTTACGAAAGAACAGCTTATAAACACGCCGAGCAGAAGATGCGGCATCGACGCGGATAAGGAACTGAGCTACCGACAGCAGGCAGCGAATTTCATTCAGGATATGGGACAGCGGCTCGTGGTGACACAATTATGTATCAACACAGCAATAGTGTACATGCACAGGTTCTATGTATTCCACTCGCTGTCACATTTCCACAGGAACGCAATTGCAGCAGCAGCACTATTTTTAGCAGCAAAAGTAGAAGAACAACCGCGCAAGTTAGAACATGTTATCAAAATGGCACATATGTGTCTCCACAGAGATCAGCCCCCACCTGATGTCAGGTCTGAGCAATACCTTGAACAAGCTCAGGATCTGGTTTTCAATGAAAATGTCCTACTACAAACTTTGGGGTTTGATGTCGCCATTGATCATCCCCACACACATGTTGTTAGGTGTTGTCAACTGGTTAAAGCGAGCAAGGACTTAGCCCAGACTTCATACTTCATGGCATCTAACAGTTTGCATTTGACAACCATGTGTCTGCAGTACAAGCCAACCGTAGTTGCCTGTTTTTGCATACATCTTGCGTGCAAATGGTCCAACTGGGAGATACCACAAAGTACTGAAGGGAAGCACTGGTTCTGGTACGTCGATAAAAGCGTAACGTCTGAACTTTTACAAGAGCTTACAGCAGAATTCCTCCATATATTTGATAAGTGCCCGTCAAGATTGAAACGAAAAATAATGAGCATATCCGCCAATCAAAGTCCAAGCATTAATCATCCTAGTTTACCGAATTCACCCTTTGATGCGGAACCTCGCAAGGTACAATCTCCTGCGACGACGGCCGACGGTGGACCTACATTCCATTCGAATCGACCTCATCAGATGGAGAAGCAAGAAGAGAAGAAGCAAATTGCACCAGCATCCTCAAGACCCCCTGTCGATTATCGGGAGTATAGAGAGAAGAAGGAACGCGAGCGTTTGGAAAGGGAAAAGGCGTCGGTTACAACGACAGTTGCCCAGAGTCATGTGTCAGATATTAATAAGCATCATTCGCATCACCACAAACTCGTATCTAGTACAAATGTGCTAAACAAACATCCACTGCCCCCTGGACAGAAGGCGCTTCACCACAATCATCACCACAGACCAGATATAAAGGTTGGACAACCAGTACCTCAGAGGCACTCAAGTAGCGCTCAAGCTAGGGAACCAAATCGCGATCCCAATAGGCAGAGGTTACAAAGAGAGTACAATTCGAATACTGGTACAAGTAGCAGTAGTAGTAGTAGTGCTCTTCATTCTCATAGTCACGCGGTATCGAAGGAGTCAAGTTTGGATAATTCATTGACGGATTCCGCCACTCACAGATCGGATGTCGGAGCATTGCAAGAGCCAACGTCCCATGGAAGTATACAGGAGAAACTTAGTAATAATAACCATAGTGTGCACAGATTAAGTGCAGTAGAAAGCAAATACCAGGGTCATGACAAACGAATGTATGATCCGAGGCATAAACCTGTTGAACATAGGAAAGATAGTGAACAAAAGCCATACAAATATCCCGATCCAACAAGAGAATATCGACAAAAAAAGTCTGATACGTTAGAGCAGAGGTGTGAAGAGGTGAGGAAGCTTATCGAGAAGCCATTACCTCCGCCCAAGCCTCCACTCGACGTACCGTACGCTTCGAATACACAGAAGCCACCACATCATACGAAATACAATCAATCGGAGAAACTACAGGCTAGCAGTGGCGCAGTTTCTACCGACGTGAAACTTCCCACTGGCCAGAGTTCGTTTTCACAGGAAAAATCACCAACCAGTTCCAGTTCGACCTCGTTGCTTACACAGAAGTCGTTAACCTCGAAGACGGTGTCCAGTCAGCACACAGCTCACGGTGTGTCCCAAATAATAAAGGATACGATTAAAAATGGTAGTTCTCAGTCGTCGAGTTTGTCATCTTTGAACAATCTCGACGATCAAAAAACTGAAAAGCGACCACGGCACGATGACATAGAGAAAAATTCGTCTGACATGCAGCAAAGTGTGTTACAGACACCTCCTAACAAGCCGAAATCGCTATTCAGTCCAGAGAAAGTACCAACGCCTCGCGAATCTCATTCGCAGAGGCCTAAGACTAAGCAAAAGACGCCGCCTTCGGCTGCAAAAGTTCCTAAACAAGAACGCGTACCAGATACGTCGATAGGCTTTAATTTAGTATCGCCGTTCGCGAGCCCGCCAGGCTTGCAACAGCAAGAAACACAAACAGTTAAACGATTGGCCAGTGATGTTTCCACAACATCCTCTCACAAAAGGCATCGTACAGGCAGCACCACCACCGAAGTAGGACAACAGGTTCAAAAAGTGAAAATAGACGATACTTCGAGTTTCGAGGCTGCTAAGATGCTCGGTAGGGTACCAGAACTGATACAACCTATCAGAGATAATCCATCGGCAAATGGTAGAGCCACTCAGATCGCGAACGACATGAAACCACCGGAACTCATCAGACCGTTCGACTCTGAGCCAACGATATCACGCTTCGGTACAGTGTCTACACAGCAACAAGTTTCGTCGAATCAACAAGGTCTGACCAATGGTCTGGACAACAATTTAGTGAAGCAAGATTCTCAGGAGTTTCTAATTAAGAAGGAGCCTACGTACAAGACGGACTTGTCAATGAAAGTAGAACACTCCCAAGCTAAAGGCGAATATTTGTCGCCAATGAAATCCGCTCAAAGTATAAGTGCTCTGCTTCAAGAGCCTTTAGCACCAATGCCATCGTTGTTGCAGAACATGCAGCAATTTAGTCAAATACCGTCGCAGCAAGTTCACCAGGATCAATTCCAGCAACAGCAGTTACAACAGCTTCAGCAACAGCAATCATCGCAACAACAACACCAGCCATCTATATCACACTCGATGCTACTCACACATCAAGAACCCGTTCAAACTCAATGCATGTCTTTGTCATCGGTCAGCGAGCCTGTTATAGCGTCGACCGTTGACATAAGCGCTCTCTCTATTCCCATACAGACCAGTACAGAATCCATACTATCTGTACCAACGTCGACAACCATAACCGTTCCACCTCCCGCAGAAGAAAAGAGATCGGAGCATCACAAGAGCGAGAAGAAGAAGAAGAAAGAGAAGCATAAACACAAGGACAAGGATAAGAGCAAAGAGAAGCACAAGCACAAGCATAAAGACAAGGACAAGGAGAAGCACCGGGAAAAGGACAAAGAGAAGGGCGATGAGACTGTACCTGCGGTACCTATTAAAATCACTATTCCTAAGGACAAATTGAATCTGAGCACAGAATCGACAAGTAGCACCGGCGGAAGTACAATTCCACCGGATAAGAACAAATCACCCCAGAATACAAGCATCAAGATCATTATCCCGAAGGAACGGTTAAAAGGTACCGACAGTGTGTCAAGTTCACCGGCTCAGTCGATGGTCCAGGCACCGTTGAAGATCAAAATCCGTACGGATGGAATCTCAAGGAGTTCAGGTGCTCCGTCGACGACGAGCAGTACGAGCAGTAGCATCGTGCCGGAGTTCACGAACGAGAGTCGTAAACGTGACCGTTCGGAGATAAAGGAGAGCCCAACTACCAGTGTTCCACCAACGAAGAAGCAATCGCAGGTCTCGTCGGCGGGTTACGGACAGCATCGGCCTGGAGAACGGCAGAACGGCAGACACTATAGTTCAGGCAGCAATAACAAGGAGAAACACACGTCTAGCCACCACAAAAGTTCCAGCAAGCTATCGCAGTCACAGCAGTCTCACACGTCGTAG
>XR_004353595.1 PREDICTED: Danaus plexippus plexippus uncharacterized LOC116771400 (LOC116771400), transcript variant X1, ncRNA 
TCCTCAATACCCTCACCGGGTAATGCACGGCTCTCAATTAAACTCTAATTTGTTAATAATTAATACATAATGTTTATTGGGCATACTAAAATCTGCTCTAGACATGCAATATAGACAATTATAGGGGAGCGGTAGACTGGCCACATCTCAAATTCTGAACGTACTCCGCTCACATGGACTGCATCGTAATATTGACCCGCGTTACACGCACTGGAATTCGTCCTCATTTACCGCCCACTTGGAATTATTGAGGCGAGAAATGGATGATGTCTCTAACTTGAAAATATCAAAGTTAGAAGAGTCAAAAGACGGGTTGCCGAAACCAGAAACGATTGAAGATTTTGAAAGAACGAGCAATTGGAGTCCTGAAATAATTAATTTATAAAAGAAAAATTTTGCTTCCTTCGAATATTTTTGATTACTTTTAAGAACTTGATGAAATACACACAGAGATGGAATTCATAACGAATTTCCTTATTATAAGAGCTTTTATTTAGTTTCCAAAGCAAAATACACTTTTCAACATACTATGCAGATAACTGGCTATTGAAATAAACATTCAGTTCGCGAGCATACATTGTAGTTCAAACAAGCGACATATGG
>XM_004253934.1 Entamoeba invadens IP1 hypothetical protein (EIN_093680) mRNA, complete cds 
ATGATGAGAATCAAAGATGCATTGATCAATACTGGAGGAAACACATCAAATATAAATAAAATGATTGAAGATGTTAATATTGCTCTTCAAGCAATATCCATTGAATTAACAATTCAACAACCTGCAATAAATGAGCCACACTTTGTTTCACAACAAATCTGTGAACAAAATCCAAACATCATGATAAACACTTACAACGATAATGGTATCAATGATGAGCACAACGATTCATCTTATCCAGATAGAACAGCACAACCCAACACTGCTACGCCCCCTATGATAGACACAACACAAACACCAATAGGTGTTGTTGATCAAACACCATTTGATCTTGAAACAAACTTAGATAAGAAACAGACCACTTTTGGTGATATCATGGGTCATTATGACCTTGTTTATGGAAACGATCCAATTGATGGCAGCCTGGAAACTGAGCACAGTGGAGGCGAAGATGAAGCTCATGAAAATGAAGAATATGAAGGAAGTGAATGCAATGAATGTAACGAAATAGAAGACACACGAGTCCATGAAATAATGAGTCAAGCATCCGGGATATGGCAACAGTTGTCTTCTTCGCTTATTAAGTCACACGCATCAAAAAAACCTCCCGGAAAATATCGAGGTTGCAGATGA
>XM_004439747.2 PREDICTED: Ceratotherium simum simum succinate dehydrogenase complex assembly factor 1 (LOC101397205), mRNA 
CGGATAGCCGGAGGCGGGAGGCGGGAGGCGGGAGGCGGAGGCGGGGGCGCGCGGGGCGGAAGTGCCTGCTGCCTGGCTGCTGGCGTCTGGCGCCGGGCGGCCGCGCCGCGGTTGGTGGGGCCTGCGCTGCGTGCGACCGCGGCCCCGCCGGCACCATGAGCCGGCCCAGCCGGCTGCAGAGGCAGGTCCTGAGCCTGTACCGCGAGCTGCTGCGCGCCGGGCGCGGGAAGCCGGGCGCCGAGGCGCGGGTGCGGGCCGAGTTCCGGCAGCACGCCTGCCTGCCGCGCTCCGACGTCCTGCGCATCGAGTACCTGTACCGCCGCGGGCGGCGCCAGCTCCAGCTGCTGCGCTCCGGCCACGCCACGGCCCTGGGTGCCTTCGTGCGCCCGCGGGGCCCGACCGAGGAGCCCCGCGGCGCGGGGGCCCCGGGGACCCCGCCTGAAGATGGTGACGGCCCGAGAAGCCCGCCCGACGGCATGGGGTCACCAGAGACCTCGCGCGATGGACGGTGACAGGCAGAAGAGCTCACTCGATGGTGCAGGGAAGACGGGGGGCCAGCCTAACTGCGTGGGGGGACCAGGGAGCCCGCCTGATGAAAGGCGAGAGGTCTTGAGAGACTAGCTCGATGG
>XM_013238176.1 PREDICTED: Biomphalaria glabrata uncharacterized LOC106077421 (LOC106077421), partial mRNA 
AGAAATTCTATATTTGGTCAACATGCTTCTAATTAATTCTTCAATATGCTTATTATTGATACTTCTTCTGCTTATGTTTTTGTACAATTCCTAAGGAAGAAAGAAACTGATACAAGGCTTCAGAATGGATACGCTTCATTTGACAACAGTGGGAAGACAACTGACAGTGTCAAACTATCAACTGGAGAAAAAACACCCTTACTGAACAGAAGATCCAATGTAAGGACATCATTAGCCGACGAAACTGCCAGAACTAGTGCTAGTGAGAAAGAAAAGGATAATGAGGACCATCTAGTTCAAGCTTCATTATTTAAGGTGTTGGTGAAGACTTATGGGATAGAATTACTTAATGCTCAAGTCTGCAAGTTTGTTTATGACTTGCTTCAATTTGTTAGCCCTCTGTTACTTAG
>XM_016498712.1 PREDICTED: Sinocyclocheilus anshuiensis protein FAM150B-like (LOC107697862), transcript variant X1, mRNA 
GTCTGAGAGCCCCAATAAATTGACGAGAATCGACGGCGAATGTCTCGAGGCGTTGAAGACGCGCGCGCACAGCGTCCTCAGGAGCTTTGACTGGAGTTTTCTCAAGTCTCGGAAACATCAGAAGGAAGTCTGACCACTATAACTTCCCACGCTTGAGCACATTAAAGAACGATTCGCTTTAAAGGGTAGCGCTCTCTCTCTTTCCCAGCGCGTTCTGCGAGCCTCGCGTGGGGTTAAATAGGCACCGGACGCTCAGTCGCCTCAGGCTGTGTCGACTGAGGGAAAGAAACGCGGCGACACAAGCGCCCTCAGACTGCGTGATCCAGGACTTGGGCAGTTCGGGAGCGATGCGCGCGCTGCGGGCTCCGGTTCTAGTAATGGGGCTCGTCATGTTAATCTGCACTACTGCACAAAGCGACGCCAGCGCGAACAAGGTCGAGAAAACGTTCAGACGGATAACGGACATCATGAGACTGGCGGAAAACAGCGTTGACGACGCGAGCGTGCCAAAGGACACTCATCGTCTCAAAACGGAAACCGGGGAAACAATTTTAAAAATCTTTCCCAGAGACCTCAGAAAGAAAGAGAAGGTTATCAAAGTCTTAACAGGTCCTCTTTATTTCAGTCCAAAATGCAGGAAGGACGTCTACAGGCTTTATCATAACACCAGAGACTGCACCATCCCTGCATACTACAAAAGGTGCGCACGACTCTTGACGCGACTGGCAGGGAGTCCGAGATGTCAAGAGGGTTAACTGTACCAGATTCAGAGAGGACACATGCACTTAAAGCTTTTATGACTGAGAACACATTCTAGGATTAGATAACTTATCCAAGCTATTACAGATAAACCTGCGTGTCTTAGCAAATAGGATGTGATTTAAGCATGTAAACAAACTTAAGTCAGTGCTTTACATTTCATGGTGGGTTTTTCCCCCCCCAAAGACCACTTCAGAGGAAGCACATGTAACAAAACCTGTTTCCCAATTTTTCACAGATGCATCCAAGTGCACACATGTATGCGAACACAGCCAAGTCTGAAACAGCACTAAACTTCACTTCCTTTATCAAGCAGGTTGAAGCCAAACCAGAGTGACCCAAGGAAAAAAAAAAACAGCAGTCAAAGTGCCTTTGGACAAGAGAAGAGAATTTAAACCAACACACAACAATCCACATAATCAGCACATCTCGTCCAGAACACTGCTCTGCCTCTCTGGAGAATAGATGTGGGAAAGTATTGACAGAGAAGTAAACGGACACGGAATAATGGGATGCACTTGCCCAAGGACAGTCTGATGGACTCAACATGGAGCCAATGTTAAAACACAGGACGACAGAGAAAGAAAACAGAAAACGTATCTGGCATAGTGCGTTCTGAACCTGTCTGCCAAAAAAGAAAACCATTTTTCCATCGTTTCATCATGAAAAAGGGATAGCCATGGTTTTGCGTTTCGATATCAGATTATCGAGACTCGTCATTGCTGATGTTTCGCACGACATGCCTCGATGGGGTTACAATTCAGAGCCACGATGACAAATTGAGTTAGTTCGCGGCAACGAGAGAGCTTTGCTTTTCTCGGTGCTAGAACTGAAAATCATTAATTGCATGAACGTTTCCTTTTGCTTCTGTTTGCCAGCAGACAGGTAGATTTTTGCAGTAAATCTGTGACCAAAAGCTTTTAGTTTTTGTGTGAGACTATGAGTGTATGACTGTGGAATATATTCAATATATTTTGATATGTAAATGTTGTACAAATGAGACTTAAAAATCCCTATAACAAAACATATAAGCA
>XM_010619662.2 PREDICTED: Fukomys damarensis sorting nexin 31 (Snx31), partial mRNA 
GCGCTGGGGGGTCGCTACGTGCTGTACTCCGTGTACTTGGACGGGCTCCTCTTCTGCAGGGTGCGCTACAGCCAGCTGCACCGTTGGAACCAGCAGCTCAGGCGGGTCTTTGGAAGCTGCCTGCCGCCCTTCCCACCGAAGTACTATCTGGCAATGACCACATCTATGGCAGAGGAGAGGAGGGCCCAGTTGGAACAGTATTTGCAAAACGTAACTGCAGACCCAAATGCCTTGAGGAGTGATGTCTTCATTGAGTTTCTACAGCTGGCACAGCTGAACACGTTTAACATCTCTGCTGAAAAAGCTTCTCTAGATATATTTCTGCCCAATGGAAGAAGTGTTAATATAGAAATTCTGACATCAGATACTGCTGAAAGAGTCCTAGAGGTGGTGTCACGCAAACTCGGACTGAGTTGGGAGCTCTTGGGCTACTTCGGCCTCTTTCTCATTCGGTTTTACAAGGAGGGCAGCCTGTCTGTTGTGAAAAAGTTGGCAGATTTTGAACTCCCTTATGTTAGCCTTCGAAGTTCTGAAGAGGAAAACTGTAAGGTTGGACTCCGGAAGTGGTACATGGACCCAGCCCTCGACTCTGTGCTGATGGGCTGCAGAGCGGCCGTGGAATTGCTCTACATGCAGGCAATGCAGGACATTGAGAAAGAATGGATCAAGCCCACACAGGGACAGAGGCAGGAATTAGAGGCTCTTCAGAAAGAAAACAATCAAACCAAGTTCCTGGAGCTGTGCCGGGAGGTGCAGTGCTATGGATACATGCAGCTGGATCCTTGCCGCTGTGATTCCCCAGAGCCAGGCTGTGGGGCTGTGCTCTCTGTTGGCAAAGATGAGATCTGCTGCTGCGTGACCCTGCCTGACAGCCGGACACAGGATGTCATCCTCCAGATGAGCAGCGTGAAGTGCTGGCAGGTCACTTTCCTTGGGACTCTGCTGGATATGGATGGGCCCCAGCGAACTCTCAACCAGAACTTAGAACTCAGATTTCAATACAGTGAAGATAATCACTGGCAGTGGTTTATCATTTACACCAAACAGGCATTTTTGCTGAGTAGCTGCTTGAAAAAGATGATCTCAGAAAAGATGGCAAAGCAAGCTGCTGAGAATACAGAAATGCAGATGGAAGTTCCGGGAACAAGAAAAAGTAAAACATGGCACATTCAGCAAAGCAAGCAAAAGAAGCATTCTAGTTTTCTATCAAGAAAACACAAGATCAAGAGAGCTGAAGGTGTCTGTGTGTTTGGAACCATAAAGGAAGAAGATCTTTGAAGAAAAGTCTCACCTTTGAAATGTCCCCTAAGACATCTCAAGATGGTGAAAGAGCTCGGTGGTGGGGGGTGGGCTTCCTGCTGTCAGGAAATAATTGACTTCTTCCTGTGTCTTCTAATGTTAAGATAGACTCTAGTCGTCAGGACTACCACAGCATTCTATGTACATTTCAAGAGTAAAAAATGTAAGAACTAAAGTTATAGAATTTGTTTTTACCAGCTCATCAATCACAAATTGCTGAATCAATTAAACAAATACGAACTTCACTCTCTTCCCCCCAAGAATCCATTCTTCTCTGGCTTCATGAAGTCCTCTGAATGGTCCCGTATTACGTAATGAAAGTCTTGCTCCAAAATGTTACCAGCGTTTTGGGCTCAAGTTCTAAAGACATGATTCATTAGCTAAGGAAAGCTGGGCTCTATCTAGGAAGTGGAATCACTGGGGAAGAAACCCAGACTTCTCCGACCTGTCCGCAGAGCTGCGTCAAGGAGGCGTGCAGTGCCGACTTGTTTCCTTACCTAGGTCGGAGGTACCATATGGGCAACCTCAGGGTCATATGCTGTTTTGAACATTTCTATTTGGGAAAGCAACACTGCCTTGTACTTGACATAAAATGCCTTTTAGGTCC
>XM_017738153.1 PREDICTED: Corvus brachyrhynchos solute carrier family 23 member 1 (SLC23A1), partial mRNA 
GCCACCGCCCGGCCGGTGACTAAAGTCCTTCCCACGGCCATAAAACCCCCCCGAGCAGGGCCATCGCCGCCGGGGACGCGTCGCCGGAACATGGGGACCCGCTCAGGAGACCTGGCTCAGCCCCAGAATGGGAACGTGGCTCTGGCCCCCGCTGGCTCCCCGCAGACCCCTGGGAAGGAGCTGCCTGCGGCGGGCAGGCAGGACCACGGGGCGGGCACCAGGCCCCCCCGGCCGGAGATGGACATGCTCTACAGGATCGAGGATGTGCCCCCCTGGTACCTCTGCATCCTGCTCGGCTTCCAGCACTACCTGACCTGCTTCAGCGGCACCATCGCCGTCCCCTTCCTGCTGGCCGAGAGCCTGTGCGTGGGCAAGGACCAGCTCACCGTCAGCTACCTCATCGGCACCATCTTCACCTGCGTGGGCATCACCACCCTCATCCACACCACCGTGGGCATCAGGCTGCCCCTCTTCCAGGCGAGCGCGCTGGCTTTCCTTGTCCCCGCCAAGTCCATCCTGGCCCTGGAGAAGTGGCGATGCCCATCTGAAGAGCAGATCTACGGCAACTGGTCACTGCCCCTCAACACGTCCCACATCTGGCAGCCCCGCATGCGAGAGATCCAGGGGGCCATCATAGTGTCCAGCCTGGTGGAAGTGGTCATCGGGCTGCTGGGGCTCCCCGGGGCACTGCTCAGCTACATCGGGCCGCTGACCGTCACCCCCACCGTGTCCCTCATCGGACTCTCCGTCTTCCAGGCGGCTGGAGACCGGGCTGGCTCCCACTGGGGCATCTCTGTGCTAACCATCTTCCTGATTGTCCTGTTTGCCCAGTACCTGCGGCAGGTCGCCATCTGCCTGCCCGGCTACCGGCGGGGCCACGGCTTTGTCCTGCTCCGCATTCAGATCTTCAAGATGTTCCCGATCATCCTGGCCATCATGGTGGTGTGGCTCATCTGCTACGTGCTGACCCGCACCGGAGTCTTCCCCAGCCAGCCCGGGGAGTACGGGTACAAGGCCAGGACGGACGCCCGGGGCGAGATCCTGTCCGTGGCGCCCTGGTTCCGCGTCCCCTACCCCTGCCAGTGGGGGTTGCCCACGGTGACCTCAGCAGCCGTGCTGGGCATGTTCAGTGCCACACTGGCGGGCATCATCGAGTCCATCGGGGACTATTACTCCTGTGCCCGGCTGGCAGGAGCGCCCCCGCCCCCTGTGCACGCCATCAACAGGGGCATTTTCACCGAGGGCATCTCCTGCATCATCGCGGGGCTGTTGGGAACCGGCAACGGCTCCACGTCCTCCAGCCCCAACATCGGCGTCCTGGGCATCACCAAGGTACCGGGGCCGGGGAGGGTCCCGGCTCGGCCG
>XM_007330897.1 Agaricus bisporus var. burnettii JB137-S8 hypothetical protein (AGABI1DRAFT_85928), mRNA 
CAACGATCGATTTGCTCATCGACACTGACATCCTCAAGACATGGCCCCCGCGAACACCAAGAAAAAGACTGGCGGCAAGACTCGCTCTGCGCTGCAAGACGTCGTCACCCGCGAATACACTGTCCACCTCCATAAACGCGTGCATGGCCGTTCCTTCAAAAAGCGTGCTCCTTGGGCCGTCAAATCCGTTGTCGACTTTGCTCAAAAAGCTATGGGCACGGCCGACGTTCGTCTCGACCCGAAGCTCAACCAGGCTGTTTGGGCCCAGGGAATCAAGTCTGTTCCTCACCGGATACGTGTAAAGCTCGAGCGAAAACGTAATGATGATGAAAACGCAAAGGAGAAACTCTACACCTACGTCTCCCATGTTCCCGTGGAATCTTTCAAGGGTCTTCAAACGACGGTCGTCGATGCAGAGTAAAAGCTTAGTTATATAGGTTCTGCCGGTCTTCTATTCGTGTTGTCGCCTTGCACCTCATGCCAGTCACATATGCATGTTCTACGTCCCCCATATGCCATGCCACCCAGGTTTTTAAAATCAAGGAACAAAAACAAAACAAACCTTTTCACATGGGTGCTTCGTGTCAATGTCATAATTCTGCGTGCAACACGCTGCCTACTTCTTTCCGGCCGTAATTCAGAAAAA
>XM_027301384.1 PREDICTED: Coffea eugenioides uncharacterized LOC113758607 (LOC113758607), mRNA 
ATGGCCATCAGGCAGAGGCCCGACGAGTCCCTAAGGAATTTCATGACCCGTTTCAATACGGAGAGCTTGCAGATCAGAGACAAGGACGAAAAAGTGGTCATGGCTGCCTTCATGAATGGGCTCAGGGTGGAAGACCTCTTCTACAAGTTGGCCGAGCAGCCTCCTGAAAATCTGGAGGAGCTCCTGAAGAGGGCGCACGCGGCCGCCAATGCTGAGGAGGCGGCCTGCCTGAAGAAGGAATCAGATCGGGAGCTCGGCGATCGGAGAGGACGGACAAACCCCCCCGAGAACAAAAAGGGTCTGGCCAAGACGAACGTATTTGACCGGCTCTCAAAGGAAAAGGCCCCTGCTCCGACACCGCTCCCAGAGAAAAGCTACACCCCCCTGACTCGGCCCAGGGCCCAGATCCTGGCCGTCATGGAGGCAGAGGGCCTGGGAGGTCGGCCACCTAAGATGGGAACACCTCGGAACAAAAGAAATCAGGACCGGTACTGTGCCTTCCACCGTGATGTCGGGTATAATACGGAGGGGTGCTGGGCCCTGCAAAGGGAGATTGAGGATTTGATCCAGCGCGGCTTCCTGGGACGTTTCGTTCAGCAAGGTCGGCTAGGTCGGGAGCTAGGTCGGACCTACCGTGGAGACAGGGACGAGGGCTAG
>XM_036118028.1 PREDICTED: Halichoerus grypus purine nucleoside phosphorylase (LOC118551879), mRNA 
GATTAAGTTGTTAGCCCAGCCTTGGGCAGTTGAATCTGGGTGTGTCACCATGGAGATAGGGGCCGGCTTGCGTGTTCGGCTGCCATTGGCTGGGGACGCCGGGCTGGGATAGAAGCCAGCCGCGAGTAACTGTGCAGACACTGTGCACAGCGCTCCCGGCGAGTACAGCTCAGCGCGGCGCTGCTCAGCGGACCGGATCCCAGAGGCCAAGGGCGGGCTCCTCGAGAGGGCGGAGGCGGCACCATGGAGAAGAGATTTGCGTATGATGATTATCAGAAAACGAGTGAATGGCTTCTGTGCCACACCAAGCACCGACCTCAAGTGGCAATCATCTGTGGCTCTGGGTTAGGAAATCTGGCCGATAAATTAACTGACAGCCAGAGCTTTGACTACAGCGAGATTCCAAACTTTCCCCGAAGTACAGTGCCTGGTCATGCTGGTCGACTGGTGTTTGGGTTCCTGAATGGCAGGGCCTGTGTGATGATGCAGGGCAGGTTCCACATGTATGAAGGCTACTCGATCTGGAAGGTGACATTCCCGGTGAGGGTTTTCTTCCTTATGGGCGTGGACACCCTAGTGGTCACCAATGCTGCTGGAGGACTCAACCCTGAGTTTGAGGTCGGAGATATCATGCTCATCCGTGATCACATCAACTTACCTGGCTTCAGTGGTGTGAACCCTCTCATAGGGCTCAATGACGAAAGGTTTGGACTTCGTTTTCCTGCCATGTCCGATGCCTATGACCGGGATATGCGGCAGAAGGCTCACAGGGCCTGGAAAGAGATGGGGGAGCAGAGGGAGCTGAAGGAAGGCACCTATGTGATGGTGGCAGGCCCGTCTTTTGAGACTGTGGCTGAATCTTGGCTGCTTCAGAAGCTGGGGGCAGATGCTGTTGGCATGAGCACAGTACCAGAAGTTATAGTTGCGAGGCACTGTGGCCTTCGAGTCTTTGGCTTCTCCCTCATCACTAACAAGGTCGTCTTGGATTATGAAGCCCAGGAGAAGGCCAATCATGAGGAAGTACTAGAGGCTGGGAGACAAGCAGCAAAAAAACTGGAACGCTTTGTCTCTATTCTTATGACCAGTATTCCACCCCCTGCCAAAGCCAGCTAACCAGCCCTGGAGCGGTCTGGCCTCTCCATAATGGGATCCAAGTAGCTAGCTACTACATACTTCGGCCCCTTGCTGGTGTCACGTGCCTCTGCCCTTCAGTAGGAGGAGAAGAGAGAGGAAGATCCCTATCCTTCACCTCCCCCATTTCTCCCACCAGACCCTTCTGCACTGGCTCTTTTGCTCAGTTATCTCAAAGCAGTTATCATCTCCTTCCCCCTCTCCCCGCCCCCTCCCCCGGCCAAGAGCTGGAACCCAAGCCCTGCTGTGTCTATGCCCTGGGTGTGACTTGGCTGTTGAACTTGGCACGGTAGCTACTGCTGTCCTTTTGCTGTAACGCTTTCACATTCCTGGGGACTCGGTTCTGCCTCCTCCAAAGCACTAGAGCCCACACGGGGGCTGGCCCAGTCCAATACCCCTTGGAGTTTTGTATTACCCTATTTTAAGAATAAAAAGAAAGATGAAATAATATATTTTTTGTGCAGTTTGGGATGAGGGTAGGGGCACAGGCCGAGTTTGGCATGAAAGACTGAGATCCCATGTCTTGTGTGACTATCTGCTTCTGAGACAAGCAGCTAAGAACTGATGAGGTGGTGTGTGAATGCACGGAAGGAGGAAAGATACAGATGTTAGAAGATAAAGAAAGAAGGGCTAACGACTGGCACAAGAGGGCCCCTTTCCTCAGACCAGTCTTGCCTCGGTCCTTTGCCTTCCGATTGTTTCACGCCCTGTCTGTACTCTCATGAGTATCTGAACTGCTTCGCTGGTCTCGGCTGTCCCACAGTTGCTATTTTCTTCCTAAGGCCTGATGATATTTCCTGTTGGTTTCTTTCTTCTCCCCTACTCTAACTTCTGCCGTAATTAACGGCACCCCTACATTCCTTCTCTGCATTCTGGCAATGCAGTGGCGAATACCTCTTTCTCTACTACAGTCACCCCGCTGCAGATTAGAGTCCTGCCAGGCCCAGGCAGACCTGTGAAGTTGGCTCATGCTTCGCTTCTCTTTGAGCCCCTCCTTCCGTCCTATTGCTTCATTTCTGGGTTCTAATCTTTCTCTTCACTTTTGCTTGATCAGAACCCGTCTGTGACACAGCATCCAGGCATTGCCCTTTGCTGGCTTGCTGCACTGTTCTATGCACTTATCAATTTGCATGCAGCTGGCCCGTGTGTCGCAAAACCACGCTACTCTCCCAGACCCCTTTGCCTTTTGAGAAAAGATCAAGTTGGATGAGCCACTAATAGTAGTGATATGTCAGTTGTCCATTGAAAACTTTTAAAAACCTCTGAAATCATCTTTTGTTTGATAACTGACCTACCTACCTGAGTCCAGCACAAAGAAAAAGCGTTCTGGAGTGGCCCTGTCCCCACTCTCTATCTCGTCAGTTCTTTGTACCTCCAGCAGCTCTAAAACCCTCCCTGGATCTTTAGGCGCTCTGCTAGCATTTGCCATGTGTCCATGAGAGCTGGTTTAGAGGGAAGTACTGTGTGTCCTTCAGATTATATGGACTCCAACTTGTTCGTTTAA
>XR_007407767.1 PREDICTED: Canis lupus dingo uncharacterized LOC112644623 (LOC112644623), transcript variant X13, ncRNA 
ATTATGACACACTGTTACCATGGAGACCAGAAGCTACTCAGCTCCTGCGTGGGTTGATTTTCCCCCTTTCTAACCAGCTGTTATTCCATCAGAGTAAAAGATTTTTACCAGGGTTTTTATGTTCATTGACCAATTTGGTCCTGTAAGACAAGCAGTCTTGGCCTTACTATTCCAGCAGCAAAAAGAGCACTGAGGCACAGAGGGATTTGTTCAAGGTCATACAAATAATGTTCTAAAAATGATATACTGAGAAGCACTTCCAGAAAGATGCAGTAAGGATCTCAAAAAATGCATTCCTCCAGAAAAACAAGAACACTGGCAAAAATTATAGAAATCAACTTTTTCAGAACTCTGAAAATCAACTAACAGCTTGTCACAATTTAAAGAGCATTTATTCAATAGAAACTTGTTGCAAGATAGCTGGAGGTTGCTCACTATCTGGGCTCCATGAAGGAAAGATGTGGGGAGAAGAGACCTTGATCCTAACACTTGGAACTGCCAGCAATCACTCACTTATACATCTCTTGCTGTTTGTGAAAGGTCACGATCTCGGGGTCATGAAATTAAGGATTAGTAACCTTAATTCCATTTGCAACTTTAATTCACATTTGCCATGTTACATAATATATTCACAGATTCTGGGACTTAGAACTTGGACATCTTAGAGTGGCGGACACAGAGTGGCCAGAGCTAGAGTAGCCATCTTGGACAATCAGGTGAATTTGACAATGGAAATCATGCCAAGTGAGCCACAAAAAAGAAGAATCTTATTGTATTTTCCTTGAGAGAGAAATAAACTTCTATTTATTTTTAAAGATGAAGAAAATGCCTTTCTGGGATACATTTCGGCAATCTTCTGAAGAAATAAAAACTAGATGACATAATGATCAAAACAAGGAAACAAACATGGCCCAGATGCTGTGATAAATGTGTGGGATTCATCCTATATTCTTGTAGGAACATTTGTCATGGCCAACTCTAATTTAAGACCAAGAAATGCTTTCAGCTGCTTTTATCCAGTTGCTAAATCAAATAACAGTATCAGAAAGAAATTCGAGGAATTTTGAGATGACTGCAGAGCTGTTATGTAATAAAAATCCCAGTAACGA
>XM_029005051.1 Plasmodium malariae 40S ribosomal protein S18, putative (PmUG01_09035500), partial mRNA 
ATGTCTTTACAAATAATCGATAACAACGATTTTCAGCATATTTTAAGAATTTTGAATACGAATGTTGATGGTAAAGAAAAAGTAACCATTGCCTTAACTGCTATTAAAGGTATTGGAAAGAGAATGGCTAGCGTAATATGCAGGCAGGCAAATGTTAACCCAACAAAAAGAGCAGGGGAATTAACAGCAGAAGAAATTAACAACATTGTTCACATTATGAATGCCCCCTCTCAATTCAAAATTCCAGACTGGTTTTTGAATAGAAGGAAAGATGTAAAAGACGGAAAGAATTTACATGTTATAGCAAATCAGCTAGATTCCTATTTACGTGAAGATTTAGAAAGAATGAAAAAAATTAGATTACACAGAGGTTTACGTCACCACTGGGGATTAAGAGTGCGCGGTCAGCACACCAAAACAACGGGAAGAAGGGGAAGAACTGTTGGTGTATCCAAAAAGAAAGGAGCGTAA
>XM_007952246.2 PREDICTED: Orycteropus afer afer chromodomain helicase DNA binding protein 3 (CHD3), mRNA 
ATGGAGTGGGGGGACATCAAGGAAGAACCAAACCCAGGCCTTCTGACAGAGACATCTGAGGAGAAAGCCAGGGACCTAACCCTGCTGAAAGCAGGTCAGAGTGTGCTGAAGGAGCCACACACTATGATCTTGCAGGCAAGAAGTGAAAATGACCAGCTCAGGCTTTCTTTTCCTCTAAGGCTATGTTGCGATGACAGGAGGCTTGATAAGGATGACATTCGGCTGCTGCCTTCAGCTTTGGGTGTGAAGAAGAGAAAACGAGGACCCAAGAAACAGAAGGAGAATAAGCCAGGAAAACCCAGAAAACGCAAGAAGCTTGATAGTGAGGAAGAATTTGGCTCTGAGCGGGATGAGTATCGGGAGAAGTCAGAGAGTGGTGGCAGTGAGTATGGAACTGGACCAGGTCGGAAACGGAGACGGAAGCACCGAGAAAAAAAGGAGAAGAAGACAAAGCGGCGGAAAAAAGGGGAGGGAGATGGGGGACAAAAGCAGGTAGAACAGAAGTCATCAGCAACTCTACTTCTGACCTGGGGCCTTGAGGACGTGGAGCATGTATTCTCTGAGGAGGATTACCACACACTCACCAACTACAAAGCCTTTAGCCAGTTCATGAGGCCCCTAATTGCTAAGAAAAATCCTAAGATCCCAATGTCTAAGATGATGACCATCCTTGGGGCCAAGTGGAGAGAGTTCAGCGCCAACAACCCCTTCAAGGGGTCAGCAGCTGCTGTGGCAGCGGCCGCAGCAGCGGCAGCAGCAGCTGTAGCTGAGCAGGTGTCAGCTGCCGTCTCATCAGCCACCCCCATGGCACCTTCCGGACCCCCCACCCTTCCACCACCCCCTACTGCTGATATCCAGCCCCCACCTATCCGAAGAGCCAAAACCAAAGAGGGCAAAGGTCCAGGCCATAAGAGGCGGAGTAAGAGCCCCCGCGTGCCTGATGGACGTAAGAAGCTCCGGGGAAAGAAGATGGCACCTCTCAAAATTAAACTAGGGCTGCTGGGTGGCAAGAGGAAGAAGGGAGGCTCGTATGTCTTACAGAGTGATGAGGGCCCCGAGCCAGAGGCTGAGGAATCAGACCTGGACAGTGGCAGTGTCCATAGTGCCTCAGGTCGACCTGATGGGCCTGTCCGCACCAAGAAACTAAAGAGAGGGCGGCCAGGAAGGAAGAAGAAGAAGGTCCTGGGCTGCCCCGCAGTGGCCGGGGAGGAGGAGGTTGATGGCTACGAGACGGATCATCAGGATTACTGTGAGGTGTGCCAGCAGGGTGGGGAAATTATTCTGTGCGACACCTGCCCTCGTGCCTACCACCTCGTCTGCCTTGATCCTGAGCTTGACCGGGCTCCTGAGGGCAAATGGAGCTGCCCTCACTGTGAGAAGGAGGGGGTACAGTGGGAGGCCAAGGAGGAGGAAGAAGAATATGAAGAGGAAGGAGAGGAAGAAGGGGAAAAGGAGGAGGAAGATGATCACATGGAGTACTGCCGTGTTTGCAAAGATGGGGGGGAGCTCCTCTGCTGTGACGCTTGCATCTCTTCTTATCATATACATTGTCTAAACCCTCCCCTGCCTGACATCCCCAATGGGGAATGGCTGTGTCCCCGTTGCACATGCCCTGTGCTGAAGGGCCGTGTGCAGAAGATCCTGCATTGGCGGTGGGGGGAGCCACCTGTGACAGTGCTAGCCCCCCAGCAGGCAGATGGAAATCCAGATGTCCCAGCCCCTCGCCCTCTTCAGGGCAGATCGGAGCGAGAATTCTTTGTCAAGTGGGTAGGCCTGTCCTACTGGCACTGCTCCTGGGCCAAGGAGCTTCAGCTGGAAATCTTCCACTTGGTAATGTATCGAAACTACCAACGGAAGAATGACATGGATGAGCCCCCACCCCTGGATTATGGCTCTGGTGAGGATGATGGGAAGAGTGACAAGCGCAAGGTGAAAGATCCCCACTATGCTGAGATGGAGGAGAAGTACTATCGCTTTGGTATCAAGCCAGAGTGGATGACAGTCCACCGCATCATCAACCACAGTGTGGACAAAAAGGGGAATTACCACTATTTAGTGAAATGGAGGGACTTACCATATGACCAGTCCACATGGGAGGAAGATGAAATGAACATCCCTGAATATGAAGACCATAAGCAGAGCTACTGGAGACATCGAGAACTAATTATGGGGGAGGATCCCGCCCAGCCCCGCAAGTATAAGAAGAAGAAGAAGGAACTACAGACCGATGGGCCTCCCAGTTCTCCTACTAATGATCCTACAGTGAAATATGAGACTCAGCCACGGTTTATCACAGCCACTGGTGGTACACTGCATATGTATCAGCTGGAAGGATTGAACTGGCTACGCTTCTCATGGGCCCAGGGCACGGACACCATTCTGGCTGATGAGATGGGGCTGGGCAAGACCATACAAACCATCGTCTTCCTCTACTCACTCTATAAGGAGGGCCACACGAAAGGTCCCTTCCTGGTGAGTGCCCCACTCTCCACCATCATTAACTGGGAGCGGGAGTTCCAAATGTGGGCACCCAAATTCTATGTGGTGACATACACGGGTGACAAGGACAGCCGGGCCATCATTCGTGAGAATGAGTTTTCCTTTGAGGATAATGCCATTAAAGGTGGCAAGAAAGCTTTTAAGATGAAGAGGGAGGCACAGGTGAAGTTCCATGTTCTCCTGACTTCATATGAGCTGATCACCATTGATCAGGCAGCGCTGGGCTCCATCCGCTGGGCCTGCCTTGTGGTGGATGAGGCCCATCGGCTCAAGAACAACCAATCCAAGTTTTTCAGGGTCCTCAATGGCTATAAGATAGATCATAAGTTACTGCTCACAGGAACCCCATTGCAGAATAATCTGGAGGAGCTCTTCCATCTGCTGAACTTCCTCACCCCTGAAAGGTTTAACAACCTGGAGGGCTTCTTGGAGGAGTTTGCTGACATATCCAAAGAAGACCAAATTAAGAAGCTGCATGATTTGCTGGGGCCACACATGCTGCGGAGGCTTAAGGCTGATGTCTTTAAGAACATGCCAGCCAAGACGGAGCTCATTGTTCGAGTCGAGCTGAGTCCCATGCAGAAGAAATACTACAAGTACATCCTGACTCGAAATTTTGAGGCCTTGAATTCACGAGGTGGTGGGAACCAAGTGTCGCTGCTTAACATCATGATGGATCTCAAGAAGTGCTGCAACCATCCATACCTCTTTCCTGTGGCTGCTATGGAGTCTCCAAAACTCCCTAGTGGGGCTTATGAGGGTGGAGCACTTATTAAGGCATCTGGGAAGCTTATGCTACTGCAGAAGATGTTGCGGAAACTGAAGGAGCAAGGACACAGAGTGCTTATCTTCTCACAGATGACCAAAATGTTAGACTTGCTAGAGGACTTCTTAGACTATGAAGGCTACAAGTATGAGCGCATTGATGGTGGCATCACTGGTGCATTGAGACAGGAGGCCATTGATCGGTTCAATGCTCCTGGAGCCCAACAATTCTGCTTCCTCCTGTCCACCCGCGCTGGGGGCCTGGGCATCAATCTGGCCACTGCTGACACTGTCATCATCTTTGATTCTGACTGGAATCCTCATAATGACATCCAGGCCTTCAGCCGGGCCCATCGGATTGGCCAAGCCAACAAAGTGATGATTTACCGGTTTGTGACTCGTGCATCAGTGGAAGAGCGAATCACACAAGTGGCCAAGAGGAAGATGATGCTGACACATCTGGTGGTGCGGCCTGGACTAGGCTCCAAGGCAGGCTCCATGTCCAAGCAGGAGCTGGATGACATCCTTAAATTTGGCACTGAGGAACTGTTCAAGGATGAAAATGAGGGAGAGAACAAGGAGGAGGACAGCAGTGTGATCCACTATGACAATGAGGCAATTGCTCGGCTCTTGGACCGGAACCAAGATGCAACTGAGGACACTGATGTGCAGAACATGAATGAGTATCTCAGCTCCTTTAAGGTGGCACAGTATGTTGTGCGGGAAGAAGACAAGATTGAGGAAATCGAGCGGGAGATCATCAAGCAGGAGGAGAATGTGGATCCTGACTACTGGGAGAAGTTGCTGAGGCATCACTATGAACAGCAGCAAGAGGACCTGGCCAGGAACCTCGGCAAGGGCAAGCGTGTTCGGAAGCAAGTTAATTACAATGATGCTGCTCAGGAGGATCAAGATAACCAGTCAGAATACTCAGTAGGATCAGAGGAAGAAGATGAAGACTTTGATGAACGTCCTGAAGGGCGTCGTCAGTCAAAGAGGCAACTCCGGAATGAAAAGGATAAGCCACTGCCTCCACTGCTGGCTCGAGTTGGGGGCAATATTGAGGTGTTGGGGTTCAATACTCGTCAGCGGAAGGCTTTCCTGAATGCTGTGATGCGCTGGGGGATGCCACCTCAGGATGCCTTCACCACTCAGTGGCTGGTGCGGGACCTGAGGGGCAAGACTGAAAAAGAGTTTAAGGCCTATGTGTCTTTGTTCATGCGCCATCTCTGTGAACCTGGGGCTGATGGCTCTGAAACTTTTGCCGATGGGGTCCCTCGAGAGGGACTGAGTCGCCAGCAAGTGTTGACCCGCATTGGAGTCATGTCTCTTGTGAAGAAAAAGGTACAGGAATTTGAGCACATCAATGGGCGCTGGTCAATGCCTGAGCTGATGCCTGATCCCAGTGCCGACTCGAAACGCTCATCTAGAGCCTCCTCTCCTACCAAAACATCTCCCACCACTCCTGAGGCTTCCACTACAAACAGTCCTTGCACCTCTAAACCTGCTACTCCAGCTCCAAGTGAGAAAGGAGATGGAATAAGGACACCTCTTGAGAAGGATGAAGCTGAAAACCAGGAGGAGAAGCCAGAAAAGGATAGCAAAATTGGAGAAAAGATGGAGACAGAGCCCGACGCCCCCAGCCCAGTCCCTTCACTTGGGGAGCGGCTGGAGCCAAGGAAAATTGCTCTAGAGGATGAGGTGCCAGGGGTACCTGGAGAGATGGAGACTGAACCTGGGTACCGGGGGGACAGAGAGAAGTCAGCCACAGAGTCGACGCCAGGAGAGAGGGGGGAGGAGAAGCCATTGGATGGACAGGAGCACAGGGAGAGGCCGGAGGGGGAAACGGGGGATTTGGGCAAGAGAGAAGATATAAAGGGGGACCGGGAGCTTCGACCAGGGCCACCTCGAGATGAGCCACGATCCAATGGGCGACGTGAGGAGAAAGCAGAGAAGCCACGGTTCATGTTTAATATTGCAGATGGTGGTTTCACAGAGCTTCACACACTGTGGCAGAATGAGGAACGAGCAGCTATCTCCTCTGGGAAACTCAATGAGATCTGGCATAGAAGACATGACTATTGGCTTCTGGCTGGGATTGTCCTCCATGGTTATGCACGGTGGCAGGACATCCAGAATGATGCTCAGTTTGCCATTATCAATGAGCCATTTAAAACTGAAGCCAATAAAGGAAACTTTCTGGAGATGAAAAATAAATTTCTAGCCCGAAGGTTCAAGCTCCTGGAGCAGGCGCTGGTGATCGAGGAGCAGCTGCGGCGGGCGGCCTACCTGAACCTGTCACAGGAGCCGGCGCACCCCGCCATGGCCCTCCACGCCCGCTTCGCCGAGGCCGAGTGCCTGGCCGAGAGCCACCAGCACCTCTCCAAGGAGTCGCTGGCGGGGAACAAGCCGGCCAACGCCGTCCTGCACAAGGTTCTGAACCAGCTGGAGGAGTTGCTGAGCGACATGAAGGCAGACGTGACCCGCCTGCCAGCCACGCTGTCCCGAATACCTCCCATCGCAGCCCGCCTTCAGATGTCCGAGCGCAGCATCCTCAGCCGGCTGGCCAGCAAGGGCACAGAGCCTCACCCCACACCGGCCTTCCCTCCGGGTCCGTATGCCACACCTCCGGGGTACGGGGCAGCCTTCAGCGCCGCACCCGTAGGGGCCCTGGCCGTCGCAGGCGCCAATTACAGTCAGATGCCAGCAGGGTCCTTCATCACAGCCACCACCAACGGCCCTCCAGTGCTGGTGAAGAAGGAGAAGGAAATGGTGGGGGCAGTGGTGTCAGACGGGCTGGATCGGAAGGAGCCCCGAGCCGGGGAGGTGATCTGTATAGACGACTGA
>XM_031808598.1 PREDICTED: Oncorhynchus kisutch rap1 GTPase-activating protein 1-like (LOC109896808), transcript variant X3, mRNA 
ATGAGGATCTTTACAGTCAGGCACATGCTCACACAGATATAGTACATACAGACCTATACAAACCCATGCATTCTAATGGGCATGCAGACCTGTTAAGAGACCTGAGACGCAGCAGTTCTTGTCTTGTATTTAGGGGCAGTAGAATACAGAGTGTAAAGTGACAGTAGTAGTTAGACCTCTGACACTCCTCTGGTCAATATACACACAGAAACAAATATACCCATACTCTGTTTTTGGAGTCGGAGTTTTGGAGTTATGAGTGACTTCAGGATGACTAAGAGTGGCCATGTGTTCCTCAGTCCTTCGGTTATTACATGGGGCCAGAGGAGACGACACAGTGATACATCAGACCTATTTGCAAAGATCGAGAGGATGCAGGGCAGCAGAATGGACGAGCAGAGATGCACCTTCCCTCCACCCCTCAAAACAGAGGAGGACTATATCCCTTACCCCAGCGTTCACGAGGTCCTGGGTCGTAGGAGCCCCTTCCCCCTAATCCTGCTGCCTCAGTTCGGAGGCTACTGGATCGAGGGGACCAATCACAAACCCAGTGCCACACCTGAGCCTGAGCAGAGGCCCTGTGCGTCCTCCCACATCAAGCTGGAGACCAACAGCATGGCCAAGATCTACAGGAAACAGTTCATGGGCAAGGAACACTTTAATTACTACTCCATGGACATCGGCCTGGGCCACCTGGTCTTCTCCATGAAGTATGATGTCATCGGGGACCAGGAGCATCTCTGCTTGCTGCTAAGGACCAAATTAAAAACTCACCATGATGTGATTCCTATCTCCTGCCTGACTGAGTTCCCCAACGTGGTCCAGATGGCCAAGCTGGTGTTTGAAGAGGTAAATGTGGACAGATTTTACCCAGTCCTCTACCCAAAGGCTTCAAGGCTCATTGTCACCTTTGATGAGCATGTCATCAGCAACAATTTCAAGTTTGGAGTCATTTATCAGAAGTTTGGCCAGACCACCGAGGAGGAGCTATTTGGGAACAGCGACGAGAGTCCTGCTTTTGTAGAGTTCTTGGAGTTTCTGGGGGACAAGATTGAGCTCCATGACTTTAAAGGGTTCAGAGGAGGACTGGACGTCACCCACGGCCAGACAGGAACAGAGTCTGTCTACACGAACTTTCACAACAAGGAGATCATGTTCCACGTGTCCACCAAGCTGCCATATACAGAGGGAGACTCTCAGCAGTTGCAGAGGAAGAGGCACATAGGCAACGACATCGTGGCCATCTTGTTTCAGGAGGAAAACACACCCTTTGTGCCAGACATGATAGCCTCCAACTTCCTGCATGCCTATGTGGTGGTGCAAGTGGAGAATGCCTGCTCAGACAATGTCACATACAAGGTGTCTGTGACAGCGAGAGATGATGTGCCTTTCTTTGGACCCGCTCTACCGGACCCGGCCATCTTTAAAAAGGGGCATGAGTTCCATGAGTTCCTGTTCACTAAGCTGATCAATGCGGAATATGCCTGTTACAAGGCTGAGAAGTTTGCAAAACTGGAGGAGCGCACGCGGTCGGCCCTGTTGGAGACCCTGTATGAGGAGCTACACATTAACAGCCAGTCCATGATGGGCCTGGGAGGGGACGAGGACAAACTGGAGAATGGGGCTGGGGGGGGAGGGGGCTTCTTTGAGTCCTTTAAGCGGGTGATCCGCAGCAGAAGCCAGTCTATGGATGCCATGGGCCTCAGTAACAAGAAGCCACACACTGTCTCCACTAGTCTCAGTAGCAGCTTTACCGAGACCCCCAAAACCCCAGGGATATCTCTGATCATTCCTGGGAAGAGCCCCACCAGGAAGAAGTCTGGGCCCTTCAGTGCCAGACGGAGCAGCGCCATCGGGATCGAGAACATCCAGGAGGTGCAGGAGAGGAGTCGGGAAGTGTCCCCCAGCACACAGAGGACTCCAGACAGTGGACACATCTCCCAGGACCCCAAATCAGAGAACTCATCTAATCAGAGCTCACCAGAGATGCCCACAACAAAGAACAGTTTGGCCATGTGTTGCAGGGCCCCTTCTATCCCTGAGGCCCAGGATCTGTCCCGCTCCTCGTCCAATGCCAGCAGCTTCGCCAGCGTGGTGGAGGAACACGATAACGAGGGCATCGAAGAGTACGACACGGGACTGGAGAGCCTGTCCTTTTCTGGAACACCACACAAGAGAGACTCATTTGCGTACGTGTCCTGGGTAGAGGATAGTTTGAGCAGTACTAGTGCCACCAGCCAGGGCAGCTCTCCAGCACCTGCACGGTCCCGGCAGCCTGAGGGGGGCAAAGGGGAAGAGCTCAAAAAGGCGGAGAGCCGAGACAAGACAGAGCGGTCACAGGATAAGTCATCATCGAACTGTTAGCCTCACCTCATTGATCAGTACATGGATGTCCATTAGCAGCATTCCCATAAGAGGCACCCCCTGCAGGAGATGAAGCAAGCGCACGTGTGTTCCACCACAGATGCAGAGGAGGAGCAGAGCTAGTCGCTGGGACAGACAGCTAGACCTGGTGTAAACTAGTCCAGTCTGAACAGCCAGGTCCATGGACATGCACTTACAGCCTTCCCTCATCCCAACTCTTTGTGGCTGACTCCCAGCATGCTTAGAGGGGTGAAGGAGAGGATCAGCCCACACCCATTCCCAAAATGAGTGCCACTCACACAGTATCGCTTCTGGCTGTTGTCTGTTGGCTCGCTTAGCCTGCATATATTTCTGCTCCATGAGCTCTGTGAAGCCTAAATCTGTTCATGTGGTAACTCATAGTATACTCTCCCTTGTCCTCTCTATGGCATTGTTTTTGTTTTGGTTCGAAGGTGGAGGGAGGGGAGGATCTTAAGCATTAGACAGATTGGTGTTGCAGGAGATCCGTTGATCATGCATTAGGGGAAGTTTTCTGTTAGGCTAAAGAGGAATGCATGAGGAGGATAAGAGGGTGTTGTCCTGTTGTCATTGTTGGAAGAACTGACATTATTGCTCCCATCAACCTCACGTCCCACCATGATACTGTACATTTGTTATTCTTGGTGTCCCGGATCCTTTGATGTCACACCAAGCCTTGTGTTTTATTAATGGTCAATTAAGAGTGTAATGGTGGATGTTGACTAGAAACTTTTAGTAAAATGTTACATGTTTTTGGTAGAAGGTACTTTTATCATCATGCTGCTGCTGGTTTTGATTCCATTATTCATTTCCCCTGACAAACTGTACAATTACAGTTCACAGTTTATGAATGGACAATACTTTACTGACTCCATAATTATAGTCAACGTATTTCAGGCCATTTAAAGGGGTAATTTGCAGTTCAAACAACAACAAAGTCTTTACCCCGCCACTTTTTCGATAACCAGCTGAGTGATGGGGTTGGCGAAAAGTAACCACTCTCAAATTCCTAGACAGAGCTATGGATGCAAGGACTGACCATCCAGGATAGCAAAATTATACTTTTAACCATGTTGAGGCTATATAGTGTTTGTTTACAGTTACCTTGTTTACTAACTAATGAGTAAAACACATTTTGGGTTTTGATGGGGTACGACAGTTGAACTAAGCGCATGAAGCATTTATAAGTAATATTCTTCAAGAATCAATGGGTATATATAATTAATTTAAATGTAAAAAAAAGCTATGTAGCAATCGTAGATTGCCCCTATAAACTGAGGAAAAAAACATGAAGTATTGAATTACCGATAAGGTCTAGTGTTCAAACTAAATTACTCATCAGTCTTCACTGTCCCATACTGTAGATAGTACCACACAGTCAGACATTCCTCCAAGGTGACCTAACCAAAGCACACAGCCTCCAAAGCCAAGCTATTGTCCAGTGACTACTGTCTTCAGTTTATTTTTTAAAACCTCTAGTTTGTTTTAAAGTATGTGTTTGGATGTGTATGCATGGTGAATGGTGTAAATCTGCTTGCAAAACCATGTCAACTGTACAGTACCATACTGGAAAAAGATTGTTTCTTCAAACCAGTCCAACTTCTCTAGAAAAGCAGACAGTCATTATTTCTATAAATCAGTTTCGATAGAGAAATATGGCGATACAAGTGTAGATGTGGAAACTGGCACTACATTTTCAATTAATTGTTTTTTTTATTTTTATTTTTTTTAATCTGACTTGGTTTTTAAAAATAATTACACTGTGACAAGTTTTGAAGTGGCCTTTTTAATGATTGTGTTAATTAAGCTGCTTTGTAGGAGGGTATCCCCCTTCATATAAGGAATCTATCCCATGGTGGATATCGCCACTGGATTGAATGTAAAACTAAACAGATATATGTATTCATTTGTAGACATCTGCTCTCAATGAATGGAACCTTTGTATCTTGTTGTAATGTTTTACATTTTCCCTCATCTCAGATTTATATAATGAAAAGACCTGATATGAAGGCATAGTTTCCATTACTTTTTATTTAAATTAAATGAACAAAAGCTAACATGGAATTTAGTTGCACTTTGTCAGTTGTGGCATTAATGCATAAACCTTTTACACTCCTTTGGAAATCTTTCAGTTGAATCTAAAGGATCTCTGTAAGTAAGGAACACTACATCAAAATACAGTAAGTTTGACAAGTATTTATTATTAAACACCATTCTAAAGATTATGATTCAACAAAAAACTATTAATTGAAATTGTGATTGGAAAGATGAGAAAGTAACCTTTCATCAGCTTAAGAGAGCCTTTGGAGTCCGTGTGTATTCCAGGCACTGAAACTCTAAATATATCAAACACAATTTTCATCTCAAAGCTTAAAATAAATGTATTAAAACTCACGAGTCTTCAGAAATGCTTGAATAGTTGGATCACACCCTCTGGTGGCTCTAGATTATACTTACACATTTCTCTGTGGTCCTGTTCATCTGTACCTGTGTTTGTACATGTAAATGCAAGACACTTGGATTGAGCACCCAGCCAATCCAAACAACAGATTCTGCCTACAATGTGCTTAATTCAGATGATTGTATTTCTGTTCTCGTTGATATTCCGCTCAAGCCCTTGTTTAAGTTGGAAAGTCTTGTATATAAATATAGCTTTTCATCCTTTTGTAAAAAAAAAAAAAGGCAAATACATGTTTAATAAAGACAAAGGGGTAA
>DQ727116.1 Mus musculus piRNA piR-142438, complete sequence 
TGGCAACAGTATTGCTCTGGCTCCA
>XR_005158834.1 PREDICTED: Triticum dicoccoides uncharacterized LOC119328068 (LOC119328068), transcript variant X2, ncRNA 
CTGCGTTCAGCGCTGCCATCCTGTCTAGTGCGCTCCCCTGACCGGCGCCATGAGAGCGGCTGCGCCGGTGGCTCTCGTGGACAGCGCGTGCATCAGTAACGTCGCAAAGTTCTTCCTCGCGAACAGCATCGCAGCACCGGTCGGAGCGGCGGCCATCCGTCGTCCCCCTCTGCGTTGTGCTACGCCGTCTCCGCTGAAGCTGCAATCTCCTCGGACGACCGCGTTATTGAGCGGATTTTCCTCATCCAGCAGCGCTGGCGACTCGTATCCATCTACCAAAGAAATGAGCAGCATCTTATCCATTCACTATGCTTCTTTTTTTCCTTTTACCCAGCGTTTGTACGAACAGGGAAACCCTCAAACGACAAAGACCAGCAGGATAGGAAGGGTGACAATGAGATGGCAGGCGCTGGAAATGTTTCTGATGTGGATCTTGCTAGGAAAATGTTAGATACTGCAAGAGGTAATAATGGAAAAGAGCAAAGGCAACACTGCGGAGATATCAAGAATCCTTTCCGCGGAAAAGAGAAAGAGTGGAATTAATTTGACAAGTCACTCAGTGAAATGTTTAACCATCTTGGAGCATTTACCTAGCTGTGCTTGACACCAGGGGCAAAGGCTGCCCCTTTTTCTTGTTCAAGGGTGGCGCGGCGAACACAGATGCAACATCGGCGAGAGTCGTTGGGGACACTGATATTTACCCAGGTTTGGGCCGCATGGTAACGGCTTGGATGTTCGCGACTTGTTCATGGGAGCCCACGACTTGGGCGTTCCTGGGAAGAATGCGGATGTCTTGATATCTCCTTATACCTTATTGTTGGTGCGGAAGCCGAGGGTCACGAAGGTAGCACCTCTCGATGACCTGCCTGGATGTCTGTGCTTCACTTGTATCTCCAGGGAGGAGCCTTGGATGATTCTTGGATATGCTGATGCCTAGGTGATCTCCCGGCAAGGAGCCACTGTGTGCCGCACGCATGAGGGTTTGTGGGTACCCGATACCCGCGACACCGACAACCTAACTGCATTCTGTTTTGGGTATGAAACTGTCAATCGTCTGTCATATAGCAGTAGTATTTGCATCCTTCTGAGGTGGGTCTCTGTGGTTTTAGGAGTACTAAATTTTTAGTTAGATACGTGCTGGTATCTTGTAGATTTGGCTGGTCTTCCTGTTGCTTAATTATCCCCCTTAATTCAGTCCCGGGACTCCCTGCACCGGCTTGGTCTTGGAGCTGCCTCCATTATGTAAATTGTGTATACAGAACCATGAAAGTGCCAAGGAGACTCGGAAATTCCACTTGAGAAGATGAGATAA
>XM_024744316.1 PREDICTED: Neophocaena asiaeorientalis asiaeorientalis ataxin 2 like (ATXN2L), transcript variant X4, mRNA 
ATGTTGAAGCCTCAGCCGCCACAACAGACCTCCCAGCCCCAGCAGCCGCCCCCCACGCAACAGGCCGTGGCCCGCCGGCCTCCCGGGGGCACCAGCCCTCCCAACGGCGGCCTCCCGGGGCCCCTGGCCTCCACCTCGGCTCCCCCAGGGCCTCCCGCCGCTGCCTCCCCCTGCTTGGGGCCTGCAGCCGCTGCCGGGAGCGGGCTCCGCCGGGGAGCTGAGAGCATCTTGGCGCCGCCGCCGCAGCAGCAACATCAGGAGAGGCCAGGGGCAGCGGCCATCGGCAGCGCCAGGGGACAAAGCACAGGAAAGGGACCCCCACAGTCACCGGTGTTTGAGGGTGTCTACAACAATTCCAGAATGCTGCATTTCCTTACAGCTGTTGTGGGCTCCACTTGTGATGTAAAGGTAAAGAATGGTACCACCTATGAAGGTATCTTCAAGACACTGAGCTCAAAGTTTGAACTGGCAGTAGACGCTGTGCACCGGAAAGCATCGGAGCCAGCAGGTGGTCCTCGTCGGGAAGACATTGTGGACACCATGGTGTTTAAGCCAAGTGATGTCATGCTTGTCCACTTCCGAAATGTTGACTTCAATTATGCTACTAAAGACAAGTTCACTGATTCAGCCATTGCCATGAACTCGAAAGTGAATGGGGAGCACAAGGAGAAGGTGCTTCAGCGCTGGGAGGGGGGCGACAGCAACAGCGATGACTACGACCTGGAGTCTGACATGTCCAATGGATGGGACCCCAATGAAATGTTCAAGTTCAATGAGGAGAACTACGGCATAAAGACCACCTATGACAGCAGTCTCTCTTCTTACACGGTGCCCTTAGAGAAGGACAACTCAGAAGAATTTCGTCAGCGGGAGCTGCGTGCAGCCCAGTTGGCTCGAGAGATTGAATCGAGCCCCCAGTACCGCCTGCGGATCGCCATGGAGAACGATGACGGGCGCACCGAGGAGGAGAAGCACAGTGCAGTTCAGCGACAGGGTTCAGGGCGAGAGAGCCCCAGCTTGGCATCTAGGGAGGGAAAGTATATCCCTCTACCCCAACGAGTTCGGGAAGGTCCCCGGGGAGGAGTTCGATGCAGTAGTTCTCGGGGTGGCCGGCCTGGCCTTAGCTCTTTGCCACCTCGTGGCCCTCACCATCTTGACAATAGCAGCCCTGGCCCAGGTTCTGAGACACGCGGTATCAATGGAGGCCCTTCCCGCATGTCCCCTAAGGCACAGCGGCCTCTGAGAGGTGCCAAGACTCTGTCTTCCCCCAGCAGCAGGCCTTCTGGAGAAGCTTCTGTTCCACCTCCTCCTGCAGTAGGCCGGATGTACCCCCCGCGCTCTCCCAAGTCAGCTGCCCCTGCCCCAATCTCAGCTTCCTGTCCTGAGCCTCCCATCGGCTCAGCAGTACCGACCTCTTCAGCTTCCATCCCCGTGACATCATCAGTTGGGGATCCTGGAGTAGGCTCCATTTCCCCAGCTTCTCCAAAGATCTCACTGGCACCCACAGATGTAAAAGAACTCCCAGCCAAGGAACCTGGGAGAACGCTGGAGTCCCAGGAGCTGTCCCGGATAGCAGGGAAAGTCCCTGGCCTTCAGAATGAGCAGAAACGCTTTCAACTGGAAGAACTGAGAAAATTTGGGGCCCAGTTTAAGCTTCAGCCCAGTAGCTCCCCTGAGACCAGCCTGGATCCTTTTCCTCCCCGGATCCTAAAGGAGGAGGCCAAAGGGAAGGAGAAGGAGGTTGATGGTCTTTTGGCTTCAGAGCCCATGGGGTCCCCTGTTTCCTCCAAGACAGAATCCATATCGGATAAGGAGGACAAACCACCCCTGCCACCAGCAGGAGGCGCCGAAGGGCCGGATCAGCCCCCACCACCTTGCCCAAGCCAAACCAGTAGCCCCCCAGTGGGCCTCATCAAGGGAGATGACAAGGATGAGGGCCCTGTTGCTGAACAAGTGAAGAAGTCAACATTGAACCCTAATGCCAAGGAGTTCAATCCCACTAAGCCGCTGCTGTCTGTGAATAAATCCACCAGTACTCCAACTTCTCCTGGGCCCCGGACTCATTCAACTCCCTCCATCCCGGTGCTGACAGCAGGCCAGAGTGGGCTATATAGCCCCCAGTACATTTCCTACATACCTCAGATCCACATGGGACCAGCTGTTCAGGCACCTCAGATGTATCCATATCCTGTGTCCAACTCAGTGCCTGGACAGCAGGGCAAGTACCGGGGAGCAAAAGGCTCCCTGCCCCCCCAGCGCTCGGACCAACACCAGCCAGCCTCAGCCCCTCCGATGATGCAGGCCGCCGCCGCCGCTGGCCCCCCTCTGGTGGCTGCCACACCTTATTCTTCCTACATCCCCTACAATCCACAGCAGTTCCCAGGCCAGCCCGCCATGATGCAGCCCATGGCCCACTACCCCTCGCAGCCGGTGTTTGCCCCCATGCTTCAAAGCAACCCACGCATGCTGACGTCGGGGAGCCATCCCCAGGCCATTGTGTCATCCTCCACCCCTCAGTACCCTTCTGCAGAGCAGCCCACCCCCCAAGCCCTTTATGCCACTGTTCACCAGTCCTATCCACACCATGCCACGCAGCTCCATGCCCACCAGCCGCAGCCGGCCACCACGCCTACTGGGAGCCAGCCGCAGTCCCAGCATGCAGCCCCCAGTCCCGTCCAGCACCAGGCGGGGCAGGCCCCACACCTGGGCAGTGGACAGCCACAGCAGAACCTGTACCACCCAGGGGCCCTGACAGGCACGCCGCCTTCTCTGCCGCCGGGACCTTCTGCGCAGTCCCCTCAGAGCAGCTTCCCCCAGCCAGCCGCTGTGTATGCTATCCATGCCCACCAGCAGCTGCCCCACGGCTTCACCAACATGGCCCATGTTACCCAGGCCCATGTCCAAACTGGAATCACAGCAGCCCCGCCCCCTCACCCTGGGGCTCCCCACCCGCCCCAGGTGATGCTGCTGCACCCACCCCAGAGCCATGGGGGCCCCCCCCAAGGCGCGGTGCCCCAGAGTGGGGTGCCTGCACTCTCAGCTTCCACACCCTCACCCTATCCCTACATCGGACACCCCCAAGGTGAGCAGCCTGGCCAGGCGCCTGGATTTCCAGGAGGAGCCGATGACAGGATTCCTCCCCTTCCACCCCCCGGGGAACTGAAGATTGTCCTGGCCGCGACCTGAGACCTCCATGAGTGGAGGGAAGAGTGACCTATGTCTCTTCCCCCAGCAGCTCGGACCAGTCCCAGCCCCCCAATCCCCCTTTCCCCCCGGGGGCGGGGGGAGCTGGGGAATTCCTGCCAAGCACCTTGAATGGGAAGGGGGGCCTCAAAGTGGGCAGGGCCGGGGTCCAGC
>XM_034818856.1 PREDICTED: Vitis riparia uncharacterized LOC117905960 (LOC117905960), mRNA 
GAGGGGAGAGGGAGAAGAGGTTAAATAATGAATGGGTTCTGAGGAATTGCTACCTTCTTCACCACTTTACTGTTTCTTTCAACCACGCTCTCCTGCCTTTCTTGAACCAGTCTTTGGTCCACGCATGCCTCTCTCTGCAGCCGTCTCTCTTCTCCTTATTTAGCTTTCCTTCTTAATTCCTTCTTTCCTTATATTGGATTTTTTTTTTTGTTGACATAGAGAAATCCAAAAGGAAAAACAGAAAAGCATCGGGTCATTTGGGGAGAAGGGATGTTGGGATGGAAGCATATCACGGTGGCTGCGGTGGCGGCCGGAATACTGACTGTGCTTCTGATCGTGTTATTTTGGCGATGGTGTTGTAGTAAAGGACATAAGGATTTTGTTGATGCTTCCAGGAATAAACATCAGAGCTTGCAAGCTGGGATTGCGAAACTCCACCATGTTAGCCTTCCTCCATATCACCATGATCTAGACAGCAAGAGAAAGGCGAATTACTATGTTTTTCGACGTGGGGTTTCATCCAGACCTTTGTTTAATTGGGCGCATCATCCATCGCTCGTCACGGATGCGGTTGAAAATGGGTGGTCTCGATTCGGTTTCACGAGCTACATGTCGTCTCCCTCGATGAGATCATCGCTGTTGGGATTATGCGCAGTGGGGGAACATGGGAAAGAAACGGGGGCGGAGATTAGCTGGGAAGTGTCTCAGGGATCGGCTGATTTCATGCAGAAGATCAGATTGAATTCTGGGTTAAAGAAGATGAATATGAGCAGTCCTTCCATGGCTGCTGCATCTGTAATTAGAACAGCTTTGCCACTGCCAGGCCCTCCCTTGGGGAATTCCTCGTTCCCGCAAGAAGCCTACTTCGAAATCACAATATTGTTTTCCGGTGAAGGTGATCCTGAGTCTGTTGGCCGGGTTAAGGAAGGTGAGAGAACGAAGCTCATCCATGAGAATTCCAATGCTAAAGCCAATTCAGAATCTATAATCCATCTTGAAGAAATGAAACTCGGCTCTAAGGACGACGGCAAAGGTGAAGTCGTAATGCTATCGGTGGGGCTCACCGCCGGAGGCTCTCTTCCTTTGAAACTTCCTGGCAGCTACCCGGGATCAATTGGATTTAACTCCAATGGCTCTGTCTATCTTGACGGAATTAAACTTGTATTCGAATCGGAGAAGGAAGAATGGGAAAGGGCAGACAAGGTTATTGGTTGCGGATTTGATCCTAGCCAGAAGAAGGTGTTCTTCACAATAGATTCAGAACTAGTTCATGTAGTCCATTGCAAGTCAGAGGAATTTGGGAGTCCCCTTTATCCAACCCTCGGGGCAAACACAGACGTGGAAGTTCTGGTTAATTTTGGACAAAGTATGTTCAGCTACGCACCCGCCAATGCACAAAGAACTCCGAACCCTTGCTTTATCGGCCCCCTTGTGAATTCCCCCGCTGCTGCTCTGGGGTATGAAGACAGCAGGGAGCTTTTCTCAATGGGGAGAATAGACTCCCAGTGGCTCAACAGATGCACAACCAAAAGCAGCCACAACAATGGCAGTAAAGCATTAGATTTCGATGAGGATTCTGAAGCTGATTTATTTGAAATAGTCTTGGACAGAAGTGGCCGATCACCACACGCAGTATTGTAGAAACAAACTATAAATATCACTAGGATTTGTTGCATATATGCCGCCCACATGCATTTGCTGAATGCAAAATTTTCATACATTCACAAGCCTCTTTTAGGGTTTCACCTTCGCTTCTCCTATTACATATACCAACAGGTTCTTCAGGAACTGCTGATACATTTTTTTCATCACCCCTGTAACTAGAATTTTCATTTATTTTCCCTCTGTATATATCATGACTAATGTTCCTCCTCCTGGTTGAGTGATACCAATGTTCTTTCAGTTC
>MF368550.1 Uncultured bacterium clone New.OTU5316_1 16S ribosomal RNA gene, partial sequence 
TACAGAGGTGGCGAGCGTTGTTCGGATTTACTGGGCGTAAAGGGCGCGTAGGCGGCGAAGTGTGTGAGGTGTGAAATCCATGGGCTCAACCCATGAAGTGCGCCTCAAACTGCTTCGCTCGAGTTCGGGAGGGGAGATCGGAATTCAGGGTGTAGCGGTGAAATGCGTTGATATCCTGTGGAACACCGGTGGCGAAGGCGGATCTCTGGACCGATCCCGACGCTGAGGCGCGAAAGTGGGGGGAGCAAACAGG
>XM_050853872.1 PREDICTED: Eriocheir sinensis uncharacterized LOC126994540 (LOC126994540), transcript variant X10, mRNA 
ACACACACACACACACACACACACACACACACACACACACACACACACACACACAACACAGATGCTATGAAGTTCGTACCAAAATACAGACCGAGGGAGAGGGCTAAAAAGGACTGGTTTAATACAAGATGTACAGAGGCAAAAGAAAAGATACAAAGCTTGGTCAAGATTGAAAAGAAACAGAAATCAATGAAACAAAGAAGAGGAGAAACGATACGAAAAGGATATCGTGGAAAAGTATAAAGAACAACCTAAATTATTTCATAGATTTATAAGTGGAAGAATTAAACCAAGAGAAACAATTGAAAGACTGACTGAAGAGAATGAAGAGATTGACGCTCCCAAAGGCAGGGCGGAAGTACTTAACAAAAAACTCCAGGAAGTGTTTACCAAAGAATCAATATTTAATGAACCACAAGAAAACAACTTAGATGTATATATGGAAGAGCTCAAAATAGATAGAGAGGAGATAATAAAACTATTTGGGGAATTGGGAGAAGGGAAGGCCATGGGACCAAATGGAGTTTCAGGTTTTATGCTTAAAGAATGCAGAAATGAGCTAGTTAGCCTGATATATGACATAATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTAGGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATCATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTAGGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATCATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTAGGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATCATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTACGTGCTCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATAATTACGTGCCCAATTAAAAGAAATGAGCTAGTTAGCCTGATATATGACATCATTACGTGCCCAATTAAAACGGGCACAGTGCCTAGGGAGTGGAAGAGGCCAGGAGTGGAACTTATATACAAAAGTGGAAGAGAGGATGAACCCCTTAATTTACAGACCAGTGTCTCTGACCAGTGCGCAAAATATGTGAGAAATTAATAAAAGAACAATGTGTGAGATTTCTAGAAGAACATAATCTAATCACAAACAATCACTATGGGCTTAGGAGAGGCCGCTCATGTGTGACAAACTTGCCGAGCCTTTACTCAAGAGTGACGGACAAATTACAGGAAAGAGACGGATGGGTGGATTGCATTTACCTAGACTTAATGAAGGCATTTGACGAAGTTCTGTGGAAACTAGAAAATAGAGGAGGATTGAGAGGGAAGATGACGTGCTGGATGGAAAGCTACTTAAGAGGATGAGAGATGAGACCCGTGGTTAAGGGCGCTAGATCGGAATGGAGGGCTGTGGACAGTGGAGTGCCCCAGGGGTCGGTTTTGGCCTAGTCCTAGTCTATATTACTGACATGCCGGAGGGAATAAACAGCTACATGAGCCTGTTTGCAGATGAAGCCAAACTGCAAAGACAGACAAGAAACAGTGAAGCCTGCAAGAAGACCTAGACAAGATTTGGAAATGCAGTCAGAAATGGGAGATGAAATTCAACGTGAGGAAATGTCATGTTATGGAAATGGACATGGACTTATAAAATGGGAGATGGGGAGATATTAAAGAAAGTATATGAAGAGAGAGAGAGACCTGGGGGTAACAGTGAAAGATTATATGCAACCAGAAAGTCATATAAATCAGATCTTTGGTGATACGTTTAACATGGTGAGGAATATAGGCATAGCATTCCACTACATGGACAAAGAACACGGGAGCTTAGGGTCAAAGGAGCTGCCTCGTATAGGCCTACCGACCTCTTGCAGACTCCTGCGTTCGTATGTTCTTAAGAAATGATGGAAAACTTAATAACTACTATGATCAGACCTAAGCTAGAATGCGCGGAAACAGTGTTGTCTCCACATACGAAGAAACACAAATATATATGCTATTGAGTAGAATGGAAGTAGATAACGAGAAATTCCCACTAAGAGACGAACCTTCCAGCAGGAATAGTAGAGGACACAGTAAAAGGTTGAGGAAGGGAAGATGCTTGAGAGACATAAAGAAATATAGCTTCCCACAAAGAAATATAGAGGCTTGGAACAGACTAAGTGAGGATGTAGTATCAGCGAACTACTACTACTACTACTACTACTACTACTA
>XR_005515939.1 PREDICTED: Hibiscus syriacus uncharacterized LOC120120851 (LOC120120851), ncRNA 
GATCTAATAGGTAAGAGAGAGCTTTCTTCAGTCCACCCATGGGTAGCGATGGGATTTAATTAGCTGCCGACTCATTCACCCAAATACTGAGTTAAAATGGACCGGCCTGCAAATAGTTACTCAGTAAATGAGTGAATGATGCGGGAGACAAATTGAATCCTAATCTTCCTGTGCTTGGACTGAAGGGAGCTCCTTCTGCTGTTATTTTATCAACACCTAAACTACTTTCATCCATGTTTTTCACGACGACCACTACCTTTATATATAGTAATAATTTGTGGCTGAGATATCAATGTAGGAATAATGATCGCTTTATTAGCTTGTTTGTTTGTTCTTCATTGACATTTATATAGATTATCTCAACTTCTTAATGGCGGTGCGTTCTCATTGTTTGACTACTACGAAAGGAAAGTTTCGTTTTTCGCTCCAGGAGGAAAATTTTGCAGCTGTTTCTGGAGTCTAGGGCTGAGGGTTTTACTGTGAAGCTGCTGTTGCAGTTTCTTGTTTAAAGCTCCACC
>XM_049955181.1 PREDICTED: Schistocerca nitens uncharacterized LOC126253663 (LOC126253663), mRNA 
GTTTTGTTGAAGTATAATAATGAGTAAAAGTAAAGTTATTAGAAACCCTCTGAAGGCTTTTAAGAAAAGGAGAAATGTTGGAAAGCCAAAGGTATGTGTTATTACTGTAAACAATAAAGACGATGAAAATGCCCAACATAGCTTGTGTCCCAAAGAAGAAGACAGTTGGTGTAAATATAACAAAGGATTGCTAACTGGTGAAGTGTACACTCATAAGCATAGTCTGCCTCATGCAATAATGGAGGTGATAAAACCTATTTTCAGAGACTTAGCAGCACCTGAACTGTTGAAAAAGTGTATTCACGGAAAAACTCAAAACCCCAATGAAAGTGTAAATAGTGTTATATGGTCGAGAATCCCCAAGACTGTATTTGTTGGAATAGAAACACTTCACTTTGGTGTGTATGATGCTGTTGCGACTTTCAATGATGGCAACATTGTAAGGTGCAAGGTATTTAGAAATATGGGAATGAAGATAGGTTCTAACATGGTACGAGCAATGCTTGCTTTAGACAAGGAACGCCTTCGGGCTGCAGACAGGGCTGTAAAGAGTCTAGAAATACAAGCAAGAGTAAACAGGAGGAGGAACAAGAGGAAGCTGGAGGAGGAGTTTGCAGAGGATGAAGATAATCCATCCTATGGACCTGGAATGCACTAAAAAGTTAATCCAATCTTTGTCGCTCGATTCCCAAAACTTTTATTTTCTCATACTAATTACATGTTTTCTAAGGATCTTCCAAACATATT
>XM_028358397.1 PREDICTED: Glycine soja membrane-anchored ubiquitin-fold protein 2-like (LOC114396422), transcript variant X3, mRNA 
ATTATTATTGCTTTGCAAAACACTAACCAACCAAAACAAAGGGAAAAAAAAAGTATCCACTTTCCCTTCTTCTTCTTCCATTTGGGTTTTCTCAAAAGTGAAAAGCAAATTCCGTGACTTCCACAATCACCACTCGGATCAAACTCTTGAGTGATAGACTTTGAATGAAATCTTGTTTTTCATTAACGAGATTCAATTGAAGTGAAGTGATTATTCACTGGAAAACTTATTTTTCATAGTATTGGAGGTACAACTGAAGCTGTTAGATTTGTTTTAACTACACGAGTTCGTTGGATATTTGAGCATGGCTGGGAATCAAGATCAGTTTGAGATCAAGTTTCGGTTGACTGATGGTTCTGATATTGGCCCCAAAAGTTTTCCTGCAGCTACTAGTATTGCAACATTAAAAGAGAGTGTTCTCGCTCAGTGGCCAAAAGACAAGGAGAATGGCCCAAAGACCATAAAAGATGTGAAGTTAATTAACGCAGGAAAAATTTTGGAGAACAACAGAACAGTTGGGGAATGCCAGAGTCCGTTATGTGATACCCCTGATACTGTTACAACAATGCATGTGGTTGTGCAACATCCTGCTACGGAGAAAGAGAAGAAAGCGGCAAACAAAGCAACACAGAACAAATGCATGTGCGTTATTTTATAGCATCCAGATTGAATAGCAGATGTCATCTGTCTTAGTTGATTAGGGACAGTTCATTTTACATAACCTGCGTCGTCAAATATTTCAACATACACAAATTATTTGGTTGCATGCCCCATTCATACTACAGTCAAGGAGTACTGGACTATTTTCTTTATAAAAATGGAGTACTTGACTTGGTGAAGATTGTGAAGCTTGTAGTTCCCTGATTCCTCTGCGGCACTAAATTTCTTGCACAATTTCATAGGAGATGTTCTTCTTCTGGTTTCAACATGTATTAGGTGTTGCCTCATCAGACACTTGGTATAATTGTTGATTGAAATGAACTCTACTAGTTTGCCATCTTACCCCCTCATATATTTTACAATTCTTCTCTTTCGTGTATCTGATTCAACATACTTAATCCAGACATGTATGCGTTGAGTATTTGAATGTGTTTCAATTTTCTGGTTGTTTATATGGTACCATTGCTACCCACTCTTGTATAGCAGCTATGGCAATAGTGATTTAACAACATCTCTCACAAAATGGAGATTTGATGCTTGAA
>XM_017886251.1 PREDICTED: Rhinopithecus bieti MAS related GPR family member E (MRGPRE), mRNA 
AAGGCTGCAGGGAGGGTCGGGGTTTCTCTTGCTGTCCACACCTGGGCAAGAGCTGAGCGGAAGAGAAGGGGTCCTCAGAGAGACGCCTTCCTCACCAGCCCCATTCCAGCCGGACACCATGTGACTCGGAGGAGCTGGTGGACACTGAACAGGAGCGGCCCAGAGGCTCTGGGGACTGGAGCCCGCGGCTGCAGCCAGGACAGATCCAAGGCCCAGGGTCAGAGCAGGCAGGGCTCGGTCGCGCCTCTGCCCCAAACGGGGCATCAGCAGAAAGAGCGAGCAGCAGCAGCACCCTCTGGCCCCCCACCCTACGATGGAGTCCAGAGAAGCTGGAGAGCAGGCAGGGGCTGCCGACGGCGCCCGGGAGGATGTGGCCTTCAACCTCATCATCCTGTCCCTCACTGAGGGGCTCGGCCTCGGTGGGCTGCTGGGGAACGGGGCGGTCCTCTGGCTGCTCAGCTCCAATGTCTACAGAAACCCCTTCGCCATCTACCTCCTGGACGTGGCCTGCGCAGACCTCATCTTCCTTGGCTGCCACATGGTGGCCATCATCCCCGACTTGCTGCAAGGCCGGCTGGACTTCCCGGGCTTCGTGCAGACCAGCCTGGCAACTCTGCGCTTCTTCTGCTACATCGTGGGCCTGAGTCTCCTGGTGGCCGTCAGCGTGGAGCAGTGCCTGGCCGCCCTCTTCCCGGCCTGGTACTCGTGCCGCCGCCCACGCCACCTGACCACCTGCGTGTGTGCCCTCACCTGGGCCTGTTGCCTGCTGCTGCACCTGCTGCTCAGCGGTGCCTGCACCCAGTTCTTCGGGGAGCCCAGCCGCCACCTGTGCCGGACACTGTGGCTGGTAGCAGCGGTGCTGCTGGCTGTGCTGTGTTGCACCATGTGTGGGGCCAGCCTTATGCTGCTGCTGCAAGTGGAGCGAGGCCCCCAGCGGCCCCCACCCCGGGGCTTCCCCACGCTCATCCTCCTGGCCGTCCTCCTCTTCCTCTTCTGCGGCCTGCCCTTCGGCATCTACTGGCTGTCCCGGAACCTGCTCTGGCACATCCCCCACTACTTCTACCACTTCAGCTTCCTCATGGCCGCCGTGTACTGCGCAGCTAAGCCCGTCGTCTATTTCTGCCTGGGCAGTGCCCAGGGCCGCAGGCTGCCCCTCCAGCTGGTCCTCCAGCGAGCACTGGGAGACGAGGCTGAGCTGGGGGCCGTCAGGGAGACCTCCCGCCGGGGCCTGGTGGACATAGCAGCCTGAGACCTGGGGGCCTCGACCCCAGCTGCAGCCCCCATGAGGCAGGAGGGTGACTTGGGGAAGGTGGTGGGGTCAGAGGCTGGGGCCAGCTGGACCTGGAGGAGGCCTTGATGGGTGGCCCAGTCATGTGCTGCCAAATCTGTGACCATCAGTCCGGAGCACGAGGCTCCCCTGGGAGGCAGCTGGAAAGGCGAGGTCTCCACATGCCCAGTCAGGTGGGCTGGGTCTCTGGGGAGAAGGCCCAGGAATGTGCATTTTTGGGAAACCTCCCCAATGGTTCATGCACTGGCACCCAAGCGCTGCTGCTGCTACCCATTCCGTGCTCAGCTGCAGTGAGGAGACCCCGGAAAGGAAGGAAGCAAGGCCAGACGCCAGGTGAGGGGCAGGTCCAGGCCCTCCCGCAGCCCACCTCCCCTCCCACTCCAGCTTCCCCAGTGCTGCAGGGGCACCCACAGAGAACACAGCCATTCCCTCAGCTCGCCATGTCCGCTCTGTGGAAGCTAAATTGACCCTAAAATTGAAGACTGCCCAAAACTTGACCCCCTCCCCCGACGAACTGTGTCCAAAGCAGCCAGCAGCCTTTTTGTCCTGGGTCCGTTACGTTGTCGTGAGTTTTCAGCAGGAAAATGTGGTGATACCGCAAAGCCACTCATTCTATCGGCATAAGGGTGTGCATTGATCAAAAGCTGTACCCCCAACCCCAGCACAGATGCTGTGAGGAAAAGCAGGGGCTGAGGCTTCTAGAAGGCTGTGGAGCTGTCCTTGGTCATCAGGCCGTTGCTCAAGGCCATGCCACCCAGACCTGGACGATGCAACCCTCACTCGGAGCTTCAGAAAAGCCGGCCCCGTGGGTGACCCTGGATATTACAGGATGCTCCCTGGGCAGGTGGAGAGGCTCCTTACAGCCCTACCCAGCAGCCTGTGGCCCTGTCTCCCCACAGGACCCAGGCCTTCAGCAACCGGAAAGCTTCTTCCCACCGGCCCTATCTAAGGCAGTTCACCCGCCTCTGTCCTGAGCAGTCCCGCTCCAGAGGATCCCTCTAAGGAAGGAACCCAGGCTTCACCCCTCAACAGGTTTCGCGCTTCCCCTGAGTGCCGGGCCTGGCTGCCATCCAGGAGCATGTGCCAGGGGGTGCCAGAGCGGGGGCTTTGGAGCCCACAGCCTGGGCTGAGCCCTGCTAGCCACCCCACTGTGCTGCCAAGGCCATCTCTGAACATCCCTGTGCCTCTGCTTGCTCGTCTGTAAAATATGAGAACCCAGTTCTTTGAGTCTTTGAGGCCTGTCCAGCCTGTTGTGAGCCCGAGAGAAATGTCTGTCGATTCTACTGCCACCAATGCCGCCATCCAAGTCCACAGTACAATTCTTAGCCACAGACTAAGG
>XM_051693489.1 PREDICTED: Myxocyprinus asiaticus WW domain-containing transcription regulator protein 1-like (LOC127438147), transcript variant X3, mRNA 
AAAGTCCGTCAGTGGACGCAGGAAAGTTGGGGAGCGGAGGAGGAATATTTCTGGAGAAATTCATATGAGGAACATTATGACATCAACTTTTTAAGCTTTATGACAACTTTTTAAAGACTTTAAAAAAAACTTTTTAGAAGGCCAAAACAACTTTTACCAAAGAAAGAAAAAACAGGCCTAACCAAAGAGGTTCAGGATTTTCATCGCCTATTTTTAATCGAATCTTTTTATTAGTAGGATTTGTTTTATTTGTTTGTATATCTAACAATATGAGCGGTAACCCTCTCCAGCCGTTGCCGGGCCAGCAGGTGATCCATGTCGCCAAAGACCTTGACACGGATCTGGAGGCTCTTTTTAACTCGGTCATGAACCCAAAGCCTAGCTCCTGGAGGAACAAACATCTGCCCGAGTCGTTCTTTAAGGAGCCGGACTCGGGCTCTCACTCCCGGCAGTCTAGCACGGACTCGGGCAGCCACCCGCCGCGGCTCCAGGCGCAGCACGTCCGTTCGCACTCGTCTCCGGCGTCCCTGCAGCTGTCGTCGGGCGCGCTGAGCGCTGCGACCCCCGGGCGTCATCACACTCATATCCGACACCAGTCGTTCGATGTGGCCGAAGAGCTGCCGCTGCCGCCGGGCTGGGAGATGGCCTGCACTCCCAACGGACAGAAGTACTTTCTCAACCACCTTGAGAAGATCACCACATGGCATGACCCCAGGAAGAGCATGACCCCGTCGGTGACCCAAATGAGTCTGCACAATCAAGCGTCTAACAGTGCTAACATACAGCAGCGCTCCATGGCCCTGTCTCAACCCAATCTCGTGTTAAATCAGCAGGCGCATCCACAGCACCTGCAGCAGCAGCATCAACAGCAGCAGGTGCAGGCGCAGACGCTTGGCTCGCAGCAGCAGCAGAACTCTCAGGCCAGCATGTTGAACATGAGCGCACAGCAGCACCAGCAGAAGATGCGACTGCAGCGCATACAGATGGAACGAGAGCGCATTCAGAGGAGACAGGAAGAGCTCATAAGACAGGAGGTGGCGCTCCGGCAGCTGCCCATGGACTCTGATAATATGGCATCTGTGGCACCAGCCATCAGCTCTCCGGCCATGACACAGGGCAACATGCCCAACAACAGCACAGATCCCTTCCTCAACAGTGGGCCATACCACTCTCGAGAGCAGAGCACAGACAGTGGACTCGGACTGGGCTGCTACAGCATCCCCACCACCCCTGAAGACTTCCTTAACAACATGGAGGAGATGGACACAGGTGAGAACATGGTGCCGGTCAGTGTGAATGTACCGCAACAGAGTCGTTTCCCAGACTTTCTGGATTCCATGCCCGGCACCAATGTGGACCTGGGCACCCTGGAGGGCGCTGACCTCATGCCCATCCTGAACGACGTGGAGTCAGTCCTGAACAAGAGCGAACCCTTCCTCACCTGGCTCTAGACTCAAACAGGACACTATAGACTTTTATATATACGTACATATATATATTATATATACACAATCAGCCTCCTCCTGTAGTTTCACTTTGTAGACATCAGTTTTGTTTCCACACACTACTCTGAATTTCCTTTTCTTTTGCTGAGTCAAAGAACAATATTTACCAAAGTGTTTAGCCTGCGAACAAATATGCGAGTACGCGTCAGTAATAGCCGTAGTGTAGAAAGACTAATGTGTTTGTTTTGTAACTGAAATTGGATAGATTTGATTATGTTCAAAATTATCACATGAACACATCCTTTCCACAGCAGACATGCCTGGATAGTGTCCTAACAGTGGCTGTCAATCAATCTGCCCAATCATGTTTAACAGTGAAACATTCAAGAAAATGTTCAGGTAACATTTTACTCCAAAATCAAAAGAAACAAATAAGAAATGTTATTTTGCATAAAGAAAATGAAGGACATTTTAGGACCATCAAGTTTTTTTTTTTGTTTTTTTTTGCATTGTGACATTTTCATGACAATTAAGCATATTTCCCCCCCCCCCAAATTATTTTTAACCGCAATGCGAAAAATCTCATTCTAATTACCGTAATGTGAAAACATAATGAGGTATTAAACTTGTAAAGTATTTTTGTACATTATGGTAGCATTTGGTCTACTGCCTTTATGCTGATTTTTTTTTTTTGTTTGTTTAAATAATTTTATTTAGGGCTTTCAATTTAATGCACTAATTCAGTGCGATTAATTATATAAATAATAATGTGTTAAAGTAATATGGACACTGGCTACCACCAGTTCGCTAGTTCGAATCCAGGGCATGCTGAGTGACTCCAGCCAGGTCTCCTGAGCAACCAAACTGGCCCGGTTGCTAGGGAGGGTAGAGTCACATGGGGTAACCTCCTCGTGGTCACTATATTGTGGTTCGCTCTCGGTGAGGCGCGTGGTGAGTTGAGCGTGGATGCCGCGGTGGATGGCGTGAAGCCTCCACACACGCTATGTCTCCGTGGCAACGCACTCAACAAGCCACGTGATAAGATGTGTGGGTTGATGGTCTCAGACGCAGAGGCAGCTGGGATTCATTCTCCGCCACCAGATTGAGGCCACTACGCGACCATGAGGACTTAAGGCACATTGGGAATTGGGCATTCCAAATTGGGAGAAAAAAAAAAGAAAAAAGTAATGCAATTAATCATGTCTTGAGAAATTCAAGCTTGAAGTACCACCTGTTTTCTCCAGAGGGCAGTAAACGAAACTTCAGCTGTATAGGTAACACGAAGCTTATACAGACAACAAACCAACCCTTCAGCAGACAGCACAACACGAGGACACATTCTTGCATTCAAAACACAACTTGATGGAGTGCAAATCTGAACTTGGGGATCTCAAGAAGTGTTTTTCTAAGTATTAAACTACTTTTAACTTGACACAGTGACCTAAAAACGGTATGATTATGATGCGACGGAACCAAAGTGAGACGCTCCAAAAGCGTCCATCTGACGCAGGTGAACATTGATGCGTTCTTAGACAAGCCCTCATAATAAATCTCGGACTAATTGAAAAATTCAATTACAAAATGAATTGCTGTGAACTGTAGGACAATGATAGGCTTATATTCAATAATATGCAAATAAACAATACACACATTCTAAAGCCATATATATATATA
>KU122020.1 Uncultured bacterium clone 26372 16S ribosomal RNA gene, partial sequence 
TACAGAGGGTGCAAGCGTCAATCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGATACCTAAGTCGAATGTGAAATCCCCGGGCTTAACCTGGGATCTGCATCCGATACTGGGTATCTGGAGTATGGTAGAGGAAAGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGGGAGGAACATCAGTGGCGAAGGCGACTTTCTGGACCAATACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGG
>XM_050382592.1 PREDICTED: Mercurialis annua probable xyloglucan galactosyltransferase GT14 (LOC126688031), mRNA 
GGAAAGTTGACAAGATTCCTTGAAATGTCACAAAACCTTCCATTTTTATTTTTTCTCTCAGATTTATTTCCACCATTCACTAACTTAATTATACACTCTCTTTCACCAACTACTTAACCCTATTACTTCTCTCAAATACTACTCCATTAGCAGCCACCATTTTTGTTCATTATTTCCACTAAACTAAGCTACTATACACAATGCTAGAGAAACAATCCACAAAACGGCAGATGGAAAAATCTGGTTTAGAGCATAATAGATCAGTCTGGTTTGTCGTTTTGATCATTCTGATACCTTTCTTCTTCTTCTTTCTTTATGCTTTTGATTATTTATCTTTATTTGCTAACATATCCAATCAAAAATACGAGAAAAATTCTGATGAATCTTGTTCGGGTCGTTATATATATGTTCACGATCTTCCTCCACGGTTCAACGATGATATTCTTGAAAATTGCAGTACCATTAACAGATTTGTTAACATGTGTCCTTTTCTGAAAAACTCAGGTTTTGGTGTTCAGGTTGTTGGAGACTATCCTGACGGGGTCGATTTAGGACAGAACTGGTTTGCAACTAATCAATTTTCTTTAGAGGTTATATTCCGTACTAGAATGAATTATTATGATTGTCTGACGAATGATTCTTCTTTAGCTTCTGCCATTTTTGTACCGTATTATGGCGGACTCGACGTGGTTCGATACCTGTGGGATTATAATGCTACAAGAGATTATTTAGGTGTTGATCTTGTCAATTGGCTAACTCAAAAGCCTGAATGGAATAAAATGTTTGGTAGAGACCATTTTTTTGTTGCCGGAAGAATTTCTTGGGATTTTCGACGCCTGAACGATCAGAATGACGGTTGGGGAAGTAAACTCATGTCGTTACCTGAATCTATGAATATGACAATGTTGTCAATAGAATCAACTGCGTGGAGTAACGAGTTTTCAATACCATATCCGACTCATTTCCACCCGTCAAGCGACGCTGAAGTGATCGAATGGCAAAACCGAATGAGAAAGCAGAAGCGGAACTATTTGTTTAGTTTTGCAGGCGCTCCAAGGCCTGATCAGAAAGATTCTATCCGTGGACAGATAATCGAGCAATGTTTAGCTTCAACAGGGTTATGCAAGTTGCTCAATTGCAGTTCGGGGAACACATGTGATAATCCTGTCGAGGTGATTAAGGTATTTCAGGATTCTGTTTTCTGTCTGCAGCCTCCAGGGGATTCATACACAAGACGATCAACTTTCGACTCGATTGTTGCAGGATGTATTCCAGTTTTCTCCCATCCGGGATCCGCTTACGCACAATACGAATGGTATTTACCGAATAACTATTCTAAATATTCCGTGTTCATACCGGTGGATTTAGTAATAAATGGAAGTGTCAGCATTAACGAGACTCTGATCAAGGTTTCTGATGATGAAATTGTGCAAATGAGAGAAGAGGTCATAAAGCTGATACCAAAGATTATATATGCAAATCCTAAGTCAAAATTAGAGAGTACTGAAGATGCATTTGACATTGCAATTAAAGGAGTTCTTGAAAGAGTTGAAAAAGTGAGAAGCAAGATTGATGAGGGAAAGGATCCAGCCGTTGGATTTGCAGAACCAAATTGGAAGCTCAGATTTTCAAGAATGGGTCTACAACAAAATTGGACTCATTTCTTCACGTAAATGAAAATGTTGAAACAGAAAATGGTAAAATTAGTACAGTTTTATAAATATAAATTTTGGAAAGTTATTTTGAAATCATAAATGCAAAAATGTAGGACTTAATAAATTTTTGTGAAATTATAGCTTCTGAAAAGTAATGTATATTAGTGTGGTTAATTAGAGGTTCTAGCATTTGCATAATAGCATTTCTTCTGTTCACAATTCTCTATGTGATTAGATGATATAAGTTTTGGTGGAAATTTTGCAGTCCACCAATTTATA
>XM_022914722.1 PREDICTED: Durio zibethinus uncharacterized LOC111313871 (LOC111313871), transcript variant X2, mRNA 
TCCATTTAAGATGCAGATAGTATGTTTTCCAATTTTCAGAGTGATACCTTACTGTATTGATGATTCGAAGCCAAAAATTTGCAGTCCAAGAATCTCAACTCACCATTTCACATTTCACTGTAATGAATTTTTACAGGCAGACTCCAAGCTTGGTCTCTTCAGCATCAAGATTCCCTTTCAACCAACTTTGTTAGAAGACTAATTCCTCAAATGGTCACTATCCATTCATGAATTTTAAATTCCAAGGTGACGTTTGCTCTATAATTGAATTCATTTCCTGGGTTGTTTTCATTTCGGAAAATCATATGAGATTTCAACTACATTTCAGTCCATCCTTGGGCCGGTTGATTAAGGTAAAAAACTTGAGCCAGAGTCCCAAACTCGACTAATCATAGCACAACACGTGTTAGTATTGAAGAATTTTTAATAAAAAAATAACAATTGAATTAAGTTTCAGGTTCATTATTGCGGTTCTGCAGATAAAAATTTTGGCAACTCTTCTACCTCTGGAGTTTCCCTGTTATCCAGCATTGCTGTTGTCATAGTCGGCATATCTTTATTAATTACAAGTGCTTTTAATTTCTTATCAGCCAAGATTTGGACTTGCAACTGCAACAAGAAATATTCTAGTTTGGCTTGACAAATCTTTGAATGCGGAAGAGTGGAGATGAGACAAGTTACTATGGGTTGTAGCAACAAAGACCAGGTGGTTTCACATGCAGGATTTAAGGACATGATGGAAAGTGAAATCAATGAATCCCCTTTTGCATCCATACCGAAACCACCTATACAAAGTAGCAGACCAAGTAGCATGGTTGTTAAGAAAGCACATACTGTGATTCCAGCTCATATTGTTGCTGAGGCTATATCAACACTCCTTGGTCTTGATCTCAGATGGTCAGGACCCATCACACAAACAGAAAGAGAATATGTTGAACAGTATGTATTGGCAAAATACCCAGAGTATGCAGGGCAAGTTGAAATAGAACATATTGACCTCTCTAGTCTTTGTATCAATGAAGAGTCGTGTGAGCCTGCAATTGATGATAAAAAGAAATCACCTAGAAGAGAGTCCTCCACACCTTCCTTTGGAAGCAATCTTCCCGACCTGGACAGGATTCAATTGGAGGCATCGAGACTGCTCGACATCCTCACCAAGAAATCTTCCTTTCCTGGAAGTTTCATTTCAATTCCTGAAATTCAAGCTCGAAACAAAGTTTTGAAGCATTGCGGATTACCAGATAATGACTATCTTGTTCTGTTCACTCCAAACTACAAGGATGCGATGATGCTAGTTGGAGAAAGCTACCCTTTTTTCCGAGGGAACTTCTACATGACCATCATTGGTGAAGAAATGGATTACGTACGAGAGTTTGCCAGTTACAAGGAAGCAAAAGTGATCTTGGCCCGTGAATCTTGGTTGGATTTGAGAATCAAGGGATCACAACTTAGCCAGTACTTCAGGAGGAAGTGTAAGCACAGTCCAAAGGGTTTGTTCTCTTATCCAGCTGATGTAAAGGGGATGCGTTATTCCATGCATTGGATTTCAGAAGCTCACAGGAATTCATGGCACGTTCTGCTTGATGCAACTGCCTTGGTTGTTGGACAGGATCGATTGAACCTTGCACTTCATCGACCCGACTTTGTTCTTTGTAGTCTGGAGAATACGCACGCTGATCAACCATCAAGGATAACTTGCCTTCTGGTCAGGAAGAAATCCTTTGAAACTACAACATCTTCATCTCATGTCACCGAGTGAAAAGTGGGATTAGCTTTTGTGAATACGCTATATGTTTAAATTATTGAACCCAAATTTATGCCAATATATTTTGGAAGTAGGAAACTTCGAACAAATATAATTAGTTACATTTATACAATTGTGGCAAGTTTCTAAAGTTGTTTACAAGGATTCTTAAATCTTAACCTCAGCTGGTTCCTTTAAAGCTGGGGTTTCGTTGCTTCAAGCTACCAATTCGAAAAAAGAAAGCCTTTCAAGCCAACAGAAAAGGAAAAATTACATAAAGAGTTGAGTTTCTTTTTAACTTGGAAATTTGGTATACTTGAAAATTCTATTACTTGGAGAAGGCATGTTTCCACTTTATCAGGTCAAGGTGTATTTTCATACATTAATCAAGTTATTTAGGTGAAAAACTAGAAAAATTCAATGTCCAACGCATTAAAAGCATGGAGTCCAAGTGTCAGAACTAAGGACAATCATCTTTAGGGTAATGAAAAATTCATGGTTTTTTCAAAGTGGACCATGACATTTTTCATGCAAGTCTGGTAGGGTGGAGATGGTTTAAGGTTTAGGCCCATCACTGTTTCAAAAAGCCATGTCAAAAGTCTTCGCTCCCATCCTCCATGTTTTTCAAGTTTACTTGTTTCTGGATTTGCAAGTCACAATCTTCAAGCGATCAATTCAATCAAACAATTCCTCCATTGTTACTCGGTTTCTGGCTTAGCAATTTGTCACCTTTACCTTCATGTTAAATAGTCATAGTGAGCTCCAGCCTTTGGTGAAACTTACTATGGATATTTGGTTTGTGATTTTGGGTTCTGGGCTGGCAAGGCAAAATGATTTTCCATTTGGTTCCTTCAAAGAAA
>XM_005089107.3 PREDICTED: Aplysia californica serine/threonine-protein phosphatase 6 regulatory ankyrin repeat subunit A (LOC101861246), mRNA 
GCGCAAGTTCACCGTCAAAGTGATAATTTTTTTTATTGGATCTGCCATTTTCTCCATTATAGATTTTTTTCTTCAGGGTAAGTTATGTGTGTAGATTATTGCTATATCCATAAGTGGCGACCTCTTACAGCCTGGCTGGTGTATTAAAATGGAGCCCAAACATTGGGCCCGGTAACCCGGCCTGGCACCCGCCACGACTGGACGCACAATAAGGCACACAATATACCCTCTAGATTGTAAGGCGAGCCGGGCGATCACGGGAGTTGGGGGTGTCAATACTGCCACAGAGGCGGCGTGCACACACCGCTACACCACAACGACCCCAGAACGAAACCCTGACCAGGTGAACAAAGGCGGACATAAAAAGATCGCCCGGTTTGCTTCTCAACTCGATCGATTTCAGGCTGACTGAAAAAAAAATTCCGATACGTTCAGTTGTAATTCTACATGCAAATCTTTGTGTGGTGGGATCAAATCAGAGCGGAGAGGCTCTTCGGATACTCGGCTTTGTTGTGTATTTGCTGGTTGACTGAATTCTGATAGCCATTAGCTTTGAGCGATCGAGTCGCCCCACTCCTGGTAGCTGTGTGTAGTGCAGTCTAAGCAACACAGTGCTCGCCTGGACGTACGTAAGCCTACAGTGAGAACACCGGTCCAAAGACAGGATTATTTGATCTGTGCAGACGGATAGTGCCGGATTAGTGAGATTGCACTCCTGCAGGATTGCTCCAGCCAGCGACTGTGCCCTCTTGTGGCTATGGAGATCTAAAGAGGACAAGCCTTACAGTGCCGGACCGTACAATACAATAGTGAGACAAACCCTTGCTGAGTTGGATACTTTTGGATTCTGTGTTGGTTGAATTTAGGTGGTCTCACATTCTTTTGATATACTACAAAACCCAGGAATCTTGAACTTACCAAAGATGTTGGTCTCATCTTTGATTTGCGACACCACACGACGATGAAAGACAGAGTCGCTGGTCAGACCTGTGTCCACATCATCTAGGCAGCCCCACAAGACGACTTTGCGCTGGCCACCACAGCCCGTGGGTTTGTAAGAAAACTTTAGGATAACATAATGGAGAAAATAGCCCTGCCACCCCCGCCGTCCAAGAGACTGGTGAAGACAGCGCTACATCAAGCAGTGTTAGATGAGCGCTTACATCAGGTTCGGCTTCTTGTGGACAAACATGGAGTTGGCATTGACACCAAGGACGTCCATGGCAGAACGCCTTTGATGCTTTCCTGTATCATAGACAACCATGAGTTAGGATACAGAATGGCGTACATATTACTAAAAGCAGGAGCGTACTTGAACCTTCGGGACGGAATGGGTCGGACAGCGCTCAGTTATGCCTGCATGAACGGCAGGGAAAGCTGTGTGGCTGTGTTGCTGAAGGAAGACGTGCTGGACATTAATGAACCAGATAATGACGGCAACACGCCACTACACCACGCCTCTACCTGCGGCAATCCTCGCATTGTGGACATGTTGGCCAAGGCATTTCATAAGTTCGGCCTGAACGCTGACAAGAGAAATAACTTGGGCTACACAGCTCTACTGCTGGCCTGTAAGAGCGGCCACTACGTGAGCGCACATCTGCTGTTGACCGTGGCCAAGGCATCCCCCGCTCTGAGAGATGGAGAATTTCACCTCAACGCCACTGAATGGGCACAGAGAAGTCATCAGATCCAGGCAAGGTTAACAGATCGGTCATTCTTAGCCTCAGCCCCTGCCGCCACTCCGCGGCCCCTCGCTGCGCTGTCGTTTGAGCGTGAAGACAGCATGTACCAGAGACCCTGGGTGCCCATCTGTCGCCTGTACCGAGTGCCCAACCCTCACTTCTCGGCGGACAACTTCAAGCTGCCAGACATCCTTCTTCCTCCACCGGGCATCAGGAGTGAGCTCTTCTTGGATGGGCTGGATGCCCGCCAGATATTGCTGAACGAGATCGAGCTGTCAGAAAGTAAGACCCGACCTGTCTCCACGAAGGCGACATTGTCGAAGTGGAGCCATCCTCCAACAGCCAAGCTAAGGAACATCTCTCAGAGGAATGCCCCGTCCTCTGCTTCCGTGCCCGACATGGTGACGATGTTCAAGATGTACTGCGAGCAGTACCAGCCAGACTGGCGCACGATGAACAAACAGAGGCGGAAGACGATGGCCGTGGGTGGGCAAGGCATGACGTCCAACAACAGCAACCACTCCTTCTCCGACATAGCCGGGGCCGCCCATGGAGAGGGCGTGGAGATGCCTAGTTGATTACGTGTTGACTGATTTATTGAGGGCTGTGTCGTTGTGAACTGTGACATCTTTTTTTTTTTCAATCTTAGTCTCTGATGAGACGATTGATTATAACTATCGGACAAAACGTTGGTCAGCTGTTCAGAAATACTAAGCTCAAATTTCGTTTGCTTTTGTATAAAAATTTTATTTTTTTTAAAGTAAAGTACAGCAGCTTTACTGGAACTGATTGCATGAGCTCAAGAAGCACAATTTTGTCGAAATTCAAATTCTGTATGTCAGAAAGCAAAATTTAAAAAAAAGAAATGAAAAA
>XR_006395823.1 PREDICTED: Acropora millepora uncharacterized LOC114972299 (LOC114972299), ncRNA 
TCTAAGAAGTGCATATTCTTTATAAAAAAATCAATGAAAGGAATATAACATAGTTCAAGTGCGCTTTCCGTTTCCGTACGTAAATTGTCAAGATTGCAAAGGACCGAGAGTAACTTGAAAACTGTACACGGCAAAGTCTCTGTATAGAAGTCTTAACCAAGTTGAACTCATGATTAAATTGGAACCAGCGCCTCTGAGAATACCCGATTGTTTGGATCTGCGAAGTCGATTCATCCGCAAATTGTCCTCTGTTTCAGGGGAGAGGAAGCCTAGCCAATGAGTAATTGATAACATTGCCGACTACACGATCGTACAAACGCTTCTCTTATGGCCAGACCAGCTTTATGGAAGTCGCCCGCTCTATGGAATGTTTGTTCGACATATAGCGTTCAGTCGAACAATTTCATCATTGACTCGGTTTTCCTTACCGATCGAGTTTAATTTGCAGCATATCAACGATGAGTCACGTTCACATGACGTAGTAGACATTGCATAATACGGCCTCATATGGACTCACGAGTTGGCAGGCGTCCACTCACCCACCCATAATCCTATTCTTGAGGTTTGTTTGTATTTTGACACAACTTTAGTCCTCTCTGACAAGCATGAAATCAAGACACAAGATACTGAAATAGATATTGAACTCATTTCAAGCTGACATCTTTTATTTGCTTAGGCTGTTATATAAATTAAAAGTTTACTGGTTTTATTCTTATAACATTATATAAAGATCAGCATAGTAGATCATGA
>XM_002951530.1 Volvox carteri f. nagariensis hypothetical protein, mRNA 
ATGCCCGCAACTGACGATCGCGCGGCGGACACCTCCTGGCTCCACGTCAGCAACACCATCGTGTACTTCCTCGCGTTCTGTATCAACGTCCTTGTCAACTCGGGTGCCGTATTTCGTACTGTACGTTCAGTTGACCGGCAGTTCGGACCCGTACTCACACCTGCCGGATGGTCGTACTACATCCGAGATCTGACGCTTTTCTTATGGGGTCTAGGAGTGACGTGTCAGAGCTTGGTGGAGCACAAGGGCTGGAAAGACGGACTCGTGGCGTGCATTGGCTACTCCTGTTTTCCCCCCCCCCCAACTCCCCGCCCGCGCCACCCCCGCCGCCTACTGACCCGGGTGGCAGTGCTGGTTCCGGAGCTGCAGAGGGAACTGCTGGCGGCGGGGTTTCGGGGTGTGCCCCCCCTGGCCTACCTAATCTACGTGTACCCAACTTCCCTGGCGTGTGGCTGGCTGCTGGTGCACCAATGCCATGTCACCGCGCTGGCAACTGGCCTGGTGACGAGCTCGCATCAGGCGGCGCTCAACGTTGGTTGTGTGACGTTGGTGCTGGCGACTGCATTGGCGCTCCTGCTGCTGGTTCGCCTCCGCGACGTGGTGTTTGGACTTGCCTTTACCTGGGGCTGCGTGGCGGTGTGGGTGGCTGGGTTCACCACCCAGGAGGATTACCGCCCGGACCAGCTGGTGGCCTTCTTCTGCGGCCTGGTCATGGGAATGTTGACGTACTGCGTAGCGGCAGGGCCGCAGGTCAGGATGGCGTGGGGGGGATGGACGGCGGCGGTGACGGCGCCGGCAGCGGCTCTGCCGCCGCCACCGCCGCCGCCGGCACCGGCAGCGGCTCCGCCGTCGCCTTTGGCTGCTACTGGTGGTATGACATCCGGAGCAATACCAGCAACGAACAACTAA
>XM_041800643.1 PREDICTED: Cheilinus undulatus beta,beta-carotene 9',10'-oxygenase-like (LOC121518372), mRNA 
TTGCTGGTTAAATTATGGTCCATCTGGAAGCAGATGCAGACAGAAGAAGCTGTGTCCATCCATTACGACGTCGTCCATGGCTCCGGTGAAGTTCGACAGCTCAGATGCCGCCGTTCCTATTGAAAATGGGCCAGCCAAGGCATGTATCACCTCTGTACTGAAGGGTCTGGAAATGATCGCCCCTCTGGTCCGCTCTATGGAGGAGACCCCTGTGCCCATCCCCACTGAAGTACATGGGACCATCCCCTCCTGGATCAATGGAAACCTTCTCCGCAACGGCCCTGGGAAGTTTGAGTTTGGGAACACACACTACAACCACTGGTTTGATGGCATGGCCATGCTGCACAAGTTCAAGATCGAAGAAGGCCAGGTGACGTACATGAGTCGATTTTTACAAAGTGATGCCTATAAGAAGAACAGTGAGAGGGACCGCATTGTGATGTCAGAGTTTGGCACCCTCGCCATGCCAGACCCCTGCAAGAACTTCTTCCAGCGCTTTCTATCTCGTTTTGAGATGATTGAGGCCACTGACAATGCAAGTGTGAGCTTTGTGAAATACAAAGGTGACTACTATGTCAGCACAGAGACCAATTTCATGCACAGAGTGAATCCTGAGAACCTGGAAACATTGGAAAAGGTAGACTGGAGCAAGTTCATTGCGGTAAATGGAGCCACTGCCCACCCACATGTTGATCCTGACGGTACCACCTACAACATGGGAAACTCGTACGGAAGCAAAGGGGCCTTATACAACATCATCAGAGTACCCCCAGAGAAGAAAGAGTCCACAGACACCCTGCAGGGAGCCAAAGTACTCTGCTCTATTGTGCCTGCAGACAAGGCGCACCCCTCCTATTACCACAGCTTTGCCATGTCTGAGAACTATGTGGTGTTCATCGAGCAGCCGATAAAGATGGACCTGCTGAAAATAGTCACATGCAAGCTGAGAGGGAAGGCCTTGAGTGAGGGCATCTACTGGGATCCAAAGCTGCAGACTGTCTTCCATCTTGTTGACAAGCGCACTGGCGAGGTCAGCTCAGTGAAGTACCACACCAAAGCCATCTCAGTCTTCCACCAAATCAACGCCCACGAGGAAGGTGGGTTCTTGTTGCTCGATATGTGCTGCTCTGACGATGGTCAAGCAATCAACAACTACCTGATCCAGAACCTACGCAAGTCAGGAGATGCTTTGGATGAGGTGTACAACACTCTGTGCCGGGCTTTCCCTCGCCGTTTCGTTCTTCCTCTTAATGTGACCAATGAAACCCCATTAGACCAAAACCTGAACACTCGACCCATGAGCATGGCAACCTGTGTCAAAATCGGCAAAGACAAGGTGTTCTGTCAACATGAGGATCTACATGGAGAGGACCTGCAGGAGTATGGTGGACTTGAGTTCCCACAGATCAACTACAGCAACTACAACACAAAGCCATACCGCTATTTCTACGGTTGTGGCTTCAGACACCTGGTGGGCGATTCTCTGCTCAAGATGGACCTGAAGGACAAGTCGCTCAAGGTGTGGTATCAGAAGGGTTTCTACCCATCAGAGCCGGTGTTTGTCCCATCACCAGATGCTGTGGAGGAGGACGAGGGTGTTATCCTGTCTGTGGTTCTCACCCCCTCACAGGATAAAGGAACATTCCTCCTGGTTTTGGATGCTAAAACATTTGAAGAGCTGGGCAGAGCCAATGTGCCGGTGAACATGGCTTATGGCTTCCACGGCACATTTAACGCCTGTGAATGAATGATGTGATGTGTTACTGATGTTGACTATAACATGAAGAATACCAGTGCAGTGTCAACCATTATAACCACTATAATCCAGATGGTACTGACTCACAGCTCTACATGTTAAAGACAGATCTTCTGTTACTGAACAAATGCTCTTTTTCATTGGTTTCTGGTTTGAAATCAGACCCAAATGTGATGGTATTGATCAGTCCAATCATATTCAGGCAAACTGAAGATGAGTATTATAAATACATTCCTTTGGCATTAATTGTGCTGTCGTTATTCGCAACAGAGTGTTATGACCTCTTATTCTGCTGCCTTAATCCTGGTCATTGCAGGTTGTAGCATGTTTCAACCTTTAGGTCACTGAAGTGCCAAATGCTTTTCTTTTGTACTTCTTTTTTAATTGAGCAATACATTTTTGAGCTTGCATGAAATTTTGAACTTTTGTAAACTCTTCTTGGCATTAAATTTACTATTATATGAA
>XM_003028818.1 Schizophyllum commune H4-8 Mg2+ transporter protein (SCHCODRAFT_01102597), partial mRNA 
ATGCCAGGAAACGTCGAGACCGTGTCCGGTCATTTCAAGAAGTCCGATCTAAGCGCCGAGCATGGCCTCAATATACGAGATCTCCGCAAGATTGATTCTCGAATACCCAACCTCGTCCCCACTATCCTGGTCCGCAAAGAGTCCATTCTAGTCAACATCCTCCACCTCCGTGCCCTCATCAAAGCCGATGCCGTCGTCCTCTTCGATACGTATGGCTCTGTCGACTCCAGGCTACACTCCACTTTCCTCTACCACTTGCAGCACAACCTCCGCAGCAAGGCCACCGGCCTCCCCTACGAATTCCGCGCCCTTGAGTCCATCCTGCTCTCCTGTCTGAGCGCCCTCGAAGTCGAGATGGTCTTCATTCGCAACCTCGTCGGCACCCTACTCGCCGAGCTCGAGGACGACATCGATCACGACCGGTTCAAGCGCTTGCTGTACTACTCGCGTCGGCTGGACAGCTTCCAGAATCGGGCGAAGTTGGTGCAAGACTGTTTAGACGAGCTGCTCGACACGGACGAGGACCTGGCGGCCATGTACCTGACGGACAAGAAAAACAATGCGGAGCGGCCGGATGAGGACCACGAGGAGATCGAGTTCATCCTGGAGTCCTTCTCGAAGCAGGTGGAGGAGATCGTGAATGAGGCGCAGAGTATGCAGAGCAACGTCCAATCCACCCAAGAGATTGTCGAGCTCATCCTGGATTCCAATCGGAACGCGCTCTTGACGCTTGACCTCAAGGTCTCCATCGCCACCCTCGGCATCGGCATCGGCACGCTCATTGCAGGCCTCTTCGGCATGAACCTGCGCACAGGCTGGGAAGACGACGCGCACGCCTTCTGGGTCATGTCGGGCGTCTCGGGCGTTGTCGCGATCATGGTGGCGTGGAGGGGATTCAGAATACTTCGCAAGATCAGGAAAGTCGGCCTGTCGAGCACGCATAGCCCACGGCAAAGGAGGCGACCCTTTTTGCCTCTGCCTTTAGGGCGCGAGCGAATCGGCGACGGCTGGCCATAG
>XR_007359457.1 PREDICTED: Ostrea edulis uncharacterized LOC125645827 (LOC125645827), ncRNA 
ACACCCGCTGTGAGTCCTGTATCTTGATCATTTAAACAGAGTTAAATGGTTAAGTAATATAGATAGTGGCAAAATAACAGGTGTTCTTTTCATTGATCTTAGTAAAGCCTTTGACACTGTAAACCACCAGGTATTGTTACACAAGCTTTTATCATTTAGTATTTGTCAAAATTCTTTTAAATGGTTTCAGTCTTATCTTAGCGGAAGATCACAATGTGTTAGATGGAAAGGTGTTTTGTCAGATGAAAAAGATGTTACAATAGGAGTGTCTCAGGGGTCCATATTAAGTCCATTGTTCTTCATTTTATTTGTTAACGATTATCCTAAATGCCTAAAGCACTCAAATGTCTCTATATATGCAGATGATACATCTCAGGATGTTTCACATCAATCTATTGATGTTATTGAGCAAAGGTTACATGATGATCTTTTAAACTCTATGAAATGGGTGAAAAGTAATAAACTTACGATGAATTTAGAGAAAACACAATGTATGTTGATTGGCACTGCACAAAAACGCTCAAAGTGTAGAAAAATGTGTATTAAATTAGGAAATATTGTTTTAGATACTGTTAAAAGGGCCAAACTTCTTGGTGTACAAATAGATGAATGTCTAACCTGAAAAGGGCAGCCAGAATTATATTGAAGGTGAAAGTAACTCAGACTTCTACAGCTGATATTTTTAGTGTTCTTGAATGGATGCCTGTTCATGATTATGTTGTATATAGAAAACTAGTGCTTGATTTTAAGGTTCTTAATGACATGACACCAGAATATATGAGAGTTTTTAGTTTTGTCAGCCAAGTTAGTTTCAGAACAACAAGAAGTAGCGATAGTGGCATTTTATATTTACCAAAAGTTTGAACTGAATATTATAAATGGTCTTTTAAGGTATCCTCCACAATTTTATGGAATGAGTTGCCCGAGTCTGTCAGAAGCTGTGGTTCTATTACATCTTTTAAATCAGCATATTTGCAGCATTATTACTCAAATAAGTGATATATAGATATGATGTATATGTTTATTTTTCCCCAGTGATATGGTGTGTATATTGTATGTATATATTTCATATTATGTTATCTATTTTTCTATTCTTTCATTTATCTGTCTGTCAATATGTCTTATACAGGACCACAATGCAAACTAGTCATTTGTACTAATTGTGCTATCCTGTCTAAATAAAAGAATTTATTTAT
>XM_011701982.1 PREDICTED: Wasmannia auropunctata histone demethylase UTY-like (LOC105457365), transcript variant X2, mRNA 
AGACAATAAGAAAAATTACTATTATCTTCTTTACTTTTCTTACTGAGGAAATAATCCTCCTCATTTATCCGATTTTTTGGGGTGTTCCGCGCTAAAAATAGTTTCAAATCTTGTCATACGTGAAATCTGCATAAAATTTTGTAAGAATTTTATTTCATATCTCCGTTTCGTATTTGCATAGTCATGTCTTAGATAGGGAATTATTTCGAGCATTTATGGCATAATAATAATATAAAAATATTGCCGGGCAAGTGATATGATTATTTGGGGAATAAGGAACGACGCTATGTCCGATGATTATTGTTTATCTGTAGTAGCAAAAAATTTCTAACAGGATATTTAAACCAAATAGCTTTAGTGTGTGTGGGGGGGGGGAGGCCGTTTATATTATTGAACCTATGTCCTTTGTATCCGCATCACTTTACCTTCAAATCCAATATCAAATGTGTTAGCAAGAACAGTCGCAGTTCGTTAGTGGTTGTGAGAACAATAGAGAATTTTAACTAGTATACACGTATTTCTTATCTTGCAAAGAGTCTGTATTTCCTGCTTTTTATAATTTTAATTTAATTATCCATCCAGACGGCAGTTGAAAGAGAAAATAAATCTCAATGAACGCCTCAGAGATTATCAAGCTGTGCAAAGAGCCGATCAACCAACGATTAACGGAAGAGCAATTGTCGCCGCCGGTACCGAGCTATCACGTGAACAGCAGAACGGATGCATTCCATCCGAAGCTGCAGAGAACCTGCCTGGATTGTCCCGTTGCCGTGATACGCAATCTCACGGCAACGCTCGAGATCAATCTGGACCTTTATTCGACTAAGACTCTGGTTGAGACACGGCCAAATACGAAAATCGACATACGCGAGCAGAGAAGATACGCTTTTGATGAGAATTGGGACGAGGAGAGGAGAAAGAAGAACTGGGCGTGCACCAGTAAAATGAGTTACATGACGATCAGCAAGTACGCGAAATATCAAACCGACAGGCTTCTCGAGGAAGATCAAACTCTACTCGAGGAAAATCGAAATCCCAACTTGTCTACTTTCGACGGGCCCGACAAAGTGACCGAACGCAACAAGACGGTGAAATTCGCTACGAATGTGGACCTATCGAAGCCATGCTGGAAACCGCAGTTGAACGAATTAACGAAGTTACCATCCTTGTTCAAGGTGGAATGTGCCGACAATATGCTTAGCTACATGTGCCGCGATCTCCTAGGGATGAATACCGTACAGTTATACATGAAGGTACCCGGCTGCAGAACGACCGGTCATCAAGAGAATAACAATTTCTGCTCCGTCAACATTAACATCGGACCGGGTGACTGCGAATGGTTCGCGGCGCCGCACGAGTACTGGGGCGTGATAAATTCACTCTGCGAGCGAAACGGCGTCGATTATCTGCGTGATCCCTGGTGGCCGCCGAACCTGGATGTTCTGCGCGAGAATAACGTCCCGGTGTACCGATTCGTTCAGAAACCGGGCGATATCGTGTGGGTGAACGTCGGCTGCGTGCATTGGGTGCACGCGATCGGCTGCTGCAATAACATCGCGTGGAACGTCGGCCCGTTCACCGTCAAACAATATCAGACAGCGATAGAACGTTACGAGTGGAACAAGCTGCGGCAGTACCTGTCGATCGTGCCGATGGTGGAGCTTTCGTGGAACCTGGCGCGCAAAGCTAAAGTGTCGAATCAGCTGTTGTATCAGCTGATCAAAAACTGCCTGTCGAACACGATGAAACAAAATTATTTGACGCTGGAGTTAATAGAGAGCAAGGGTCTGACAGTGAAAAAATACGCTGACGAGTGCGAAAACGATGAGACGGCTTATTGTGAAGACTGCGCTGCTGAGATATTCAATATAATAATCTGCAAGCGCAAGAGCAAGAAGACGAAGACACATCTGGTATATTGCCTGGACTGCGCGCTGAAGCAGTCTACTTCGCTGGAAAATTTTGTCTTTTTGGAGAAATGTTGTATGGAAAATTTGATGAACATTTACGATAAATTCGTATGCTACTAATTATCGGTGCTATCATCACCATTTCCTTATTATCAGCGTTGATACTTTGATGTCGCAGGTCGCAGACACAAACAGCTAATCTTATTGGTATAGCGATATTAGATATATGAGCATCTCCTTCCTACGAATATTCTTGTCGAAACATATTACAGTAGCGAGAATAAGCATCTTTTTTTGTGGAATTATCGAATTTCATTCTTCTTTTATACACTTAATTTTAAGACTGAAAAACTCATCGAACGTCTGTATTGTGAATTTAGAGTCAAACAAGGTTCCTAATCATGAACATTAAAATTATGTGCACTCTAT
>XR_007367990.1 PREDICTED: Ostrea edulis endochitinase-like (LOC125669718), transcript variant X4, misc_RNA 
TACGTGTGTTTAAGTAGCACAGTCGAGCAGCACAAAGCGGAGTCCCGAGTAATGTGTGGCGTGCTCCTCTGCTTAGAAGAAGGAACTGTTATATTCACATTTGATGTCAATACACTAATCTGTCGAACTTACAAAGAGGAAGATTTTATCGGATGCCTCTTTCAAGCTTGTTCGACCTGTAAAACATACGGATATAATGAGTTGGAAACCACCACCGCCGCCAATGCTGGTACCACAACAGTACAAACAACCCAAGATACAGGACAACAAGGTTCTATAACAACAGTACAGACGACCCAAGACCCAGGACAAGAAGAGTGTCTCAGTCATTGTGAATTTCGTTGAAAAACAAAATATTTTATCTTTTATTCGAATCAACTGTATCCTGCACAGGTCTTCATGGAGCACTCCTTCCTCATCCTACCGACTGTTCTAAATTCTTCGAATGTGTGTACACGAATGCCGTACCACGTGTTTGTGCCGTCAGCCTTCATTTCGATGTCAACCGCAATTTGTGTGACTACCCAGCTAATGTTGACTGTCAGTCGTAAAGCAGATTTCAAAATTAATTCTCCACGCAGGACAATATCATTGTTATGCTATTAGCACATGTAGAGTTATAAGTGAATCTTCGCATTTCAAGATAATTAATATCATGGTGTTTGGCGTGTAACAAATAATTAATGATTAATTAAAACGGAGAGGATTTATATAGGCAGTGCCTGCTGCCCAATCCTATTATGAATTATCATAATAAAACAATATTTAAATCAAATTAATTATTTGTT
>XM_024808092.1 [Candida] sorbophila hypothetical protein (B9G98_01534), partial mRNA 
ATGAAGCTTTCACTCTGGACTTTGGCCGTCGCACTCCCCCTTGCTTGTGCCCAAAACAACAACAACAATGAAGATCACAATAATCACCATTCGGAAGTGAATGGTAATAACAACGACCAAAGCCAAGACCATAACCGCACCCGTGACTATAACAACTCACATGATCACAGTCACACTAACGATAACGACCAGGGTCATAACCGTACTCGTGATTACAACAACTCACATGACAATAACCACACCGACAATGACCAGGATCACGACCAGGACCATAATCGTACCCGTGACTACAACAACTCGCACCATAACGAGCACACCCGAACCAATAGTGCAGTATCTACAGGCACTTCGGCCAACGGAGGTAAGCCCTCTCCTATCGGTGCTGGTGTTGGTAGTGCTGCTGAGAGTACCAAAACTGATATCAAAACATCTACCGTGACTACAAGTTCTACTAAGATCGCTTCCACCACTGCCTCTGCCAGTCACAGTAGTACTACCAGTTCCGCTAGCTCTTCCAGTGTGTTATCCACTTCCAGCTCGACCAGCTCCACCTCTTCGTCTTCTAATGCTGGAATGGCCGTGGTCGTAGGCGGGTCTACTATTTTCGGTGCCGCCCTTTGTGCTATAGCTATTTTGTAG
>XM_028677370.1 Plasmodium relictum conserved Plasmodium protein, unknown function (PRELSG_1111000), partial mRNA 
ATGGATAACAGATATAAAGATGGAGAAAGTAATACTAATAATTTGGAAGAAAATGATGTGAATAATTTTGTTTTAAAAAATAAAAATGACATAGAAAGCAAATCAGAAAAGCAATTAAATGTGAATGAAAATTTAAGTATGTATAATTCTTATTATCAAAATGTACTGAATATTAATTATAAAACAATAAATAATGAAAAAAGGGATATAAAAAACGAGCAGAATGTGCAAATTAAAAAGTTAAATGATATTAATATAGAAAGTAACTATAATATGAATTCTGCTACTATTGGTAGTAAAAATACATTAAGTAAAAATAATAATAACATTAATGGTTTGTTTAATGATTTTAGAAAGAATAAAAATAATTTTTTCAATTCAGAATCTAATTATCTTGAGGAAAAAACAGATACAAATAATTTTGATGAAGAAATTAAAACTAATTCAAAGGATAATATGGAATGTATGTTATTTAATAAACTTAATCATAACACAAATAATAAAATTAGTTCTGATGAAAATAAAAATTTAAATAATATTTATTCAAATACGAACTTCTTAAGTGATACTTATAATAATGATTCTAATAATGATGTAAATAATTGTAACTATAATTATATTAATAACGATAACAGCAATAATATGAGTTGTAACATAAATAATATGAATAAAAATAGAAATAATATATATGATAACTTAAATAAATCAATTAATGTTAATGTTTCAAATAAAAACATTAATAAGTTTTGTAGCACAAATAATAACAATAACAATTATAATAATAATAATAATAGTATTTATAATAATGCAAATATTGTAAGTAATTCAAATAATAACTCTTTTAAAACTTATAATCCAAAAAAAAAGACGAAAAATATAAATAATTTTTTAAATATTGATGTAAATGCAAATTCAGAAAAAAATTCTTCCATTATTAAAAAAAATTGCTATATAAAAAATTATCTAAATCTAGAAGGTAATATAAAAGGTAGAACTGATATTGAGAATTTTAATTATATTAAAGAAAATAAGAAAAGTGTAACAAATAGCATAAGATATAATGATAAAGAAAATAATAATTCTATTTTAGAAAATAAGAATAGTACGAATGTAATTTTAAACACATGTATGAACAAAGTTAATAATTATAATGAAGAAAATATATTACAACTGAATATTAGCAATGAAGATTGCTTTAAATCATCGAAAAATTCAAAAAATAATGATTTAAATAATGATGTAGGTAAAACTTATATTACTATAAAAGAAAATTGCAATAAATCAGAAAAAAAAGAAAATTGTTTTAGTAAGGTAAATAGCAATAACTTTCATAATAATGATATATATGGAAATGACTATTATAATAATTGTAATAGTAACATTTTTACTTCTCCACATGAAAAAAATGAAAAACTACATAATAATTTAAGTTATGAAAAAAAGTATATGAATAATAATTTTTTGAACGATAGATATTTAAATTATATGGAAAGCGATTATAATGATAATTCATTTGATATATGTGAAATGAAGAATATAAAAAAGAATGACGAAACTAAAATTGAAAATAAGGAAGAATTAAAAGATTTTTCAAATGACTATTTATTATTTAAAAATAATGAAAATTCTTTTAATTATGATATCAACGATTATGTTTTACTGAATAAAAATTTTAAAAATTATAATGCATCAGGTGAAAGTAATGCAAAAGAAATGAAGACAGATTGTATGACAACTGATAGTACTATATATACGAATAATATTCTTAATCTACATAAAAATATAGAAGAAGAGAATGATGAAATCTATCAGAATTATAATTATTATGAAAATGATAATATTAATATAATGCAAAAAGAAATTGATGAGGAAAGTTTAAATAAAAAAATAAATATAGGTAGTAGGGAGAGTATTTTAAATGTAAATAGTTTTGAGAAAAATTATGATTTTGAAGAAAATTCACATATGTACAAGCATTTAAATTTTTCTGATAATTTAAATATGAACAAAAATTTATCATTTTTAAATTTTGATGATACACTTAATGAATGGAGGCGTAAGCAAAATAATGATAATTTTTTGAAAAAGGAAAATAATAACATGAACACATGTTCATTTTTTGAGAAATTAACTTTAAATGAAAATGAAAGCTTGGAAAATGGAAGAGAAAATAATGTTTCTATTTCAATGTATGATATGCAAGAAAATATAAATGAAAAAAATTGTTTTAAATGCACTATTGAAAACAGTGATCAATGCGATGATCGTATGAAGAAAAACATGCATAATATTATTATGCATAAGAATAACCTCAATAGGAATATAAATTTTGATGTTAGTGATTTTTGTAGAAATGCTAATAATATAAGCAATGATAATATAAATGCCAGCAATAATGATAATAGTTTATGTGATAAAAATATAAATAAATATGTTGATAATAATTATTTGAATAACCATGAATATAATAATAATAACAATAATTATAATCATGATAACGATGTAAATATCTCAAATAACGAAAATTCAATTAAAAATAATTCAAGTAATGCTAACAGTAATAATAATTTAAATAATAATACAGATAACATAAATTCAAATGGAAATGATCGTAATTCCTTTTTTATGAAAGAAAATGATTTTCCATATTTAAAATATAAAAATGAATATACCAAAAAATATATAGATGAAAATAATTTAATGTTTCACAATGAATTTGACACTTTCGATATAAAAGATAAGAAAAAGGGTTGTGAAAAAATGAAAAAGAATAATTATGATATGAAATGGATTAATAGTAATTTATCACCTAATAATAAAAATGAAATAAACAATGAAGTTATTTCCAATGTTAATAGTGGAGATTGTAATAATTATTATTTGATTTTAAATAATAAAGGGATATGTTATGATACTAATAGAAGTGATTTTCCAAATGATTGTGAGGAAAAGTTTGATGATAAAAAGAAGAAAAATAAACATAATTTAAATTATTGTAATATGAATAATAATAGTAGTAACAATAACATCAATGATAATAATAAGAATATTAATAATAACAATAACAACCAAAATAATAATAATATTAACAATAACAATAATAATAATAATAGCAATAATAATAATAATAGTAATAATAACGATAATAACAATAATAGTAATGATAATAATAATAATAAAAATGTTAATAATAACAATAACAACAATAATAATAGCAGTAATAATGATAATAGTAATAATAACGATAATAACAATAATAATAATGATAACGTTAATATGAGTAATAATAATAATATTAATATGAGTAATAGTAATAACAATGATAATAGTAACAATAACATTAATATAAATAATAATAATAATAATGATAATAGCATTAATAATAATAGTAGAAAAAAAAATGTAGAAATTGAAAATAATTTATATATGAATGACTTTAATATTGATCTACTGAGTTATAAAAATATTAAATTTGACAATTTTTCATATAAGGGTGATCTTATAAGTAATGAAAAATCTCCAAACAACTATTTAAAATTTTCTTCTAGTAATTTATTTAACAATGATTATAATGATTGTGAGAAAAATGCTTTTGGAAATGATGTATTTAATATTAAGGATAAGGAAAATAACAATTATGTTAATTATTCGAAACTAATGAATAAAGATAATAATTCAATTAGTAGATACTGTGATAACTCAAAGGAAGAAAATAATTTAAATATATGTTCTAGTGTGCTTAATGGAAATAATAATGATAAAATTAATTTGAAGTCTTCTAGATTTTTAAAAAGTAGCATTAATAATAATTCTTATTATTCAAATAACGAAAAAAAGGAAACTTATTGTTTGCCAATAACAAATAATATATTAGAACTTAATAAAAACATAAATTTAATAACAAATGAAAAAGAAAAAGAAATCATTGATCCAGTTTTTTGTTTAAGTAAAAAAAGTTTTAAAAATAATTATTCTATGAATACAGAAAAATGTAGCAGCATTCATAATAATTTGAATGATATAAAGAATGATGAAATAATGTTTAATATTAATAACAAATACAATATGTATAACATAAATAATGAAAATAATATATACCATATAGATAATGAAGATAATATGTATAACTTGAATGATGAAAATGATATATATGATATGGATAATGAACAAAACATGTATGACAATATAGAAAATATGCACCCTACAGAAAATAACTGTGCGTATAATAAACTTAATAACTTAGAAAAAAATAATAAGAATTTATATCTTATGGAAAATGATTATATGTATAATAACATAGATAATGATATATACAATGATATGAATAACTTACAAAGTAATGAAAATATATGTGATAATAGAAATAACATAGAAAATAATTCAGATGTGTGTGGTAATATCGGAGAACATGGCAATGCATGTAACATGAATAGTATTGAAAACAATATGGATTTTATATTAGGTGAAAATGAGGAAGTGGAAAAAGAATCAAAAGGAAACGTGAATAATGATAAAATAAATGAACTTCAAAACATTATAAATAGTTTAAAATTTAAAAATAGACAATTGGAAAAGGAATTAACTGATATAAAGAATATGTATTTAAAAAAGAAGCAGTGTTTAATATTAAATAGTCTAAGTAATAAAAATGATGATATTAACAGTTATTCAACTTTTAAGGACGATACCAATAATTCTGACTGTGAAAGTGCAGTTCAATCAAGTAAATATATACAGAATTTTTTAAATGATAAAGAGAAGTATAATTATGATACAAAAATATCTATTCAAAAATTTCATTTAGCTTATACTAATAATTCAATTGGAAAATTAAAAATAGCAGCGCAAAGAGATATTAGTGGATCTTTTATGGGACCTAAAGGAATACATGTAAAAACAATAAAATCTTCTTTACATATTTCTGTTTATAAAAGTGCAAAAGATGTATGGTTTCCTGGATTTGCTGATAGTCATGTTTTTTTATTAAAAGGAAATATATTTGGAATTTTAAGAGCATGCCAGTTATTATATCATTATGTAAAATCGAAAATGTCTTCTTCGAAATGCTGCATTTACCTAGTTGCTCCATTTGAATGCGTGCAAAAATTATTAGCTGATGGTTGTAAGAGAATGGCTATTATAAAAGAAGAATGTGGAGCTGATGTAAGATTAGGAAATTTATATGTACAAGTTCATGAAGGTTTTACTGAAAGATTAATGGAAATAAGAGGAAACGAAGTTAGTGTTGATTGTGCTTTGGAAAAACTAGTTATTTTTATGCAATCATGTTTTTCTGTACAGTCATATGATTATGAACTGTTAAAATATCCATGTCGCTCAGTATTAAATTTACAATAA
>HM928366.1 Uncultured Pseudomonas sp. clone GG5QJA201B0DXG 16S ribosomal RNA gene, partial sequence 
AGAGATGGATTGGTGCCTTCCGGGGACGTCTGACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCGTAACGAGCGCAACCCTTGTCCTTAGTTACCAGCACGTTATGGTGGGCACTCTAAGGAGACTGCCGGTGCAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGGCCTGGGCTACACACGTGCTACAATGGTCGGTACAAAGGGTTGCCAAGCCGCGAGGTGGAGCTAATCCCATAAAACCGATCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGTGAATCAGAATGTCACGGTGAATACGTTCCCGGGCCTT
>XM_012845165.1 PREDICTED: Setaria italica wall-associated receptor kinase 5 (LOC105914170), mRNA 
ATGGGAAGCTACAAATGCACGAACCAGCAGCACCAGCATCAAGCCATAGAAAGTATCATAACAAATTATACGCTTTCAGGTTTAAGCATCATTATAGGAGTTGGTAGCGCAGCAGGCTTTATACTTTTGGTTGTCATTATTGTCTTTATCACTCAAAGGTTTAAGCAGATGAGGGCAATGAAGCTAAAACAAAGAAACTTTGAGCAAAATCGTGGACAACTGTTACAACAGTTGATATCCCAAAGGACAGACATTGCGGAAAGGATGATCATAACATTGGATGAGCTTGCAAAGGCAACAAATAACTTTGACCCAGCCCGTGAGCTTGGTGGTGGAGGGCATGGTACTGTCTGCAAAGGGATTTTGTCGGACCTACATGTCGTAGCTATCAAGAAGTCAAATATAACAGTCCAAAAAGAAATAGATGAGTTCATAAATGAGGTCGCCATCCTCTCACAAATAAACCATAGGAATGTGGTAAAACTGTTTGGATGTTGCCTAGAAACTGAGGTGCCATTGTTGGTTTACGAGTTTATTTCCAATGGAACCCTTTATCACCATCTTCATATTTCAAGATCACTAGCATGGAACAACAGGTTAAGAATCGCAACTGAAACTGCTAATGCAATTGCCTATCTTCACTCATCAGTTTCAATCCCAATCATCCATAGAGATATCAAATCCAGTAACGTGCTCCTTGATGATACGTTGACATCAAAGGTGTCGGACTTTGGAGCTTCAAGGTACATTCCACTTGATAGAAGAGGGTTAACCACAGTTGTTCAGGGGATTATAGGATACTTGGATCCTATGTACTTTTACACAGGCCGCCTTACAGATAAAAGTGATGTTTATAGCTTTGGTGTTCTTCTTGTGGAATTGCTCGCTATAAAGAAACCATCATATTTGTCCTCTAACGGTGATGGTCTTATTGCCCATTTTTCTCGCATTAACTTACATGATGATGGCAACCTGGACCAAATACTAGATCCTCAAGTTATGGATGAGGGAGGCAAAGAAGTCGAAGAAGTGATTAAACTTGCAGTGTCATGCGTACGATTAAGGGCTGAGGACCGGCCAACCATGAGACAAGTGGACCTTACACTAGAAGGCCTTTTGTCATCTGAGAATCATGAGGAGAATAATACATTGGCAGAGGGATTTGAGGATATTGGTAATATGCAGATGGATTTTCCGTCGATTGATGAGGGGCAAAGCACGGGGGAGTCTAGTAAATGGCACAGTTTGGGACAGGATCCCTTGATGTTTTCTGGTTCTCGGTAG
>XM_031547130.1 PREDICTED: Punica granatum sister chromatid cohesion protein SCC4 (LOC116212494), transcript variant X1, mRNA 
TTCCCCGAGTCCCCCATACACAAGAAGGAAGGGGGAAAAGAAGACGAGAGAAGAGAAGAGAAAAGAAAAGAAACTCTGGTCCTTGTTGCTGTTCTCAGTCTTCGCTCCTCAGGGTTGAGGGAGACGGTCGGTAAGGGACAACAAATCCGGTAAAGGACCTCCCCAGCAGTTGCAGAAAAGAGGTGAGACTTGCGGCAAGATAGTCCGGAGCACGAGGGCGTTGATCTGATTTAGAGTAGTCAGTGCAGCAGTTGGAGTAGGCTTGGTGCGGTGGGAGAGAGAGAGAGGAGAAATGAGAAGCTAAGCAGAAAATGGAAGAGGTGGCGGAGGGACTTTGGTCACTGGCGGATCACGAAGAGAAGAAGGGGGAAATCGGCAGGGCCATTAAGTGTTTGGAGGCGATATGCCAGAGCACGGTGTCGTTCCTGCCCATCATAGAGGTGAAGACGCGACTCCGCATCGCAACCCTGCTCCTCAAGCACACCCACAACGTGAATCAGGCCAAGTCTCACCTGGAGCGCTCCCACCTCCTCCTCAAGTCCATCCCTTCCTGCTTCGACCTCAAGTGTAGGGCCTTCAGCCTCCTCAGCCAGTGTTACCATCTCGTGGGCGCCATTTCTTCGCAGAAGCACATCCTGACCCGCGCACTCGACCTCATTGCTTCTGCTGCTGCCGCTGCCGCCGACCAGCTGGAAGTGAAGCTATGGGCTTGCAACTTCTACTCGCAGCTTGCCAATGCTCTCATAATTGAGGGCGACTATCAGAGCTCGATATCTGCGCTAGAGCATGGACGACTCTCTGCCACTGAGCTGCGCTATCCGGAGCTGGAGATGTTCTTCGTGACATCCACTCTTCATGTGCACCTGATGCAATGGGAGGACGAGAATGTGATTGCAAGTGCTGTCAGTAAATGCGATGAGGCCTGGGCCTCCATTCATCCTGAGAGAAGACCACAATGCCTTGGTTTGTTTTTCTACAATGAGCTGCTGCACATCTTCTATCGCCTGCGCATCTGTGACTACAAGAATGCTGCCCAGCATATCGACAGATTGGATGCGTCAATGAAGAATGAGTTGCAGCAGAGGCAGGAGCTTATGGAGGAACTCCAAGCTTTGAACCAGAGTCTCTCTAGCTCTGATCTGAGCCCCAGAGATAAATTGGCTCTGTCTGGAAAACAATCTCAGCTTCTAGAGCAGTTGAGAACAATGGCTGGTCAAGATTCTTTTGCACCAGGTAATAGTGGAACTGTCAAACAAGCATGGGGTGAGGGGCTTGAGTTGGCGCCATCCCCTATAAATGGAGAGTGGCTCCCTAGGAATGCTGTGTATGCACTTGTTGATCTTATGGTTGCCACTTTGGGACGTCCAAAAGGACTTTTTAAAGAATGCAGCAAAAGGATTCAATCTGGAATGCTTATCGTCCAAGAGGAGCTGATGAAGCTCGGTATAACAGACAATCTCAAAGAGGTGGATTTGCAACACTCTGCTATCTGGATGGCTGGTGTTTATCTAATGCTTCTTATGCAGTTCCTAGAAAACAAAGTGGCGGTGGAGCTTACACGATCTGAATTTGTTGGAGCACAAGAGGCTTTGGTGGAAATGAGAAAATGGTTCACTCGCTTTCCAACTATATTGCAGGCTTGTGAGAGCATTATTGAGATGCTTAGAGGTCAATATGCGCATTCTGTTGGCTGTTATAGTGAAGCTGCCTTTCATTACATTGAAGCAGCAAAGCTAACAGAGAGCAAATCTACGCGAGCAATCAGCCAGGTTTATGCAGCCATCTCTTACATTTGTATTGGTGATGCTGACTCATCTTCACTGGCACTTGATTTAATTGGGCCTATCTATAGAACAATAGATTCCTTTGTTGGAGTTCGCGAGAAGACTTGCATCCTTTTTGCTTATGGACTTTTGTTGATGAAACAACATGATCTACAGGAAGCAAGGAATCGGTTGGCCAGGGGCCTGCAGATGACACATGCACATCTGGGGAATCTTCAACTTGTTGCACAATATTTGACTATTCTGGGAAGTTTAGCACTTGCCTTGCATGATACAGTGCAAGCCAGAGAAATCTTAAGATCTGCCCTTACCTTAGCAAAGAAGTTGTATGATATTCCAACACAGATTTGGGTATTGTCTGTCCTAACAGCCCTGTATCAAGAAGTAGGGGAAAAAGGAAATGAAATGGAGAATGCTGAATACCATAGGAAAAAGGCGGGTGATCTGCAGAAGAGACTTGCTGATGCTCATTCATCTATCCACCATATTGAACTGGTCGACAAAGTGAAAGTTGAAGCTATGCAATTCCAAGACCTTGATATGAAGCGTCTTCTTGGTGGTCCATCCATGAGGGCAAATCTTGACATTCCTGAATCTGTTGGTCTATCGGCTCCAGCCCCTAATACATATACTTCGAGGCTGGTGGACTTGGACTTGGATACAGGAAGACGCACAAAAAGAAAATATTAGTTGGAACTCTACTTTCTTTTCCTTCCACCTATATGGTGGAATGTTCATGGTCAAACTACATACGATATCAGCACTATCAACAACAATTTACCATGTTGTAATTCATGTAGGTATAGATAGATGTAATATCTAATTTGTGTATATGTAAATCTGCGAAACATGTTACTGGAATAGGCATTACAAGGTTCTTGGTTTCCGGTGCTAGGCTCTGCTAGCCGTATTGTTTTCAGTAACCTGACACGATTAGCGATCACAGTAAGTAGTTCAGTTTGA
>XM_051656078.1 PREDICTED: Myxocyprinus asiaticus protein unc-13 homolog C-like (LOC127416634), mRNA 
TCCTCCAAGGGCTTCTCGTACTCTCTCTCAGCACACACACTTCCTGTGCATCCAGACAAGGAGCTTTCACCCGTTCCAGACACACTGTCTGCTGCCCAGCGTAGTGCTACGAATTTTGTCTGGAAGAGACAGGCAAAGAGGAGGGATATTACCCAGGATCTCTCCATGATTTGCAACAGCATGTGCCTGCCGAACAAGACTTCAGCCCAAGGTTGATCCGAGCACAACCGCTGCAGCACGAAACTAGGGAGAGATGGATCATATAGAGGGGAGGACATGGAACTGAGTCTGACATCTAGAGGCTTGTGAAAGGATGCTCGGTGCTCCACAACAGGACATTTAAGAGTTTAGTTGACTGTTCTGGAGCTCCGGTGCTGTAGTAAATGGATTTGGTGTGCTGTAGGAGTAGGCTGTGATTGAGAGATATGAAATTTCTTCAGAAGTGCGCATAGCATGTGCAATGATTTTTGCTTGGCACAATTGTCTCTGAGGACATCAACTCTTCTCTAGACCCTCTTATACCACAGAGTTAACTTTCAAAACTAGTAAGCTTTTGCGTGCTTCCTGTTAAGCACCTCTGGATCAAAGACCAGTTTTGCTTTGCCGCATCTAGAGTGCAAAACTGCTGAAATATCGCCATCCATGGTTTCTGCTCATTTCAAGAAGCTATCGTCTTACATTGTAAAGATTTGCAAAGGAATGTTTACAAAGAAACTGGCAAATACCTCAAAGAAGAAAGAAAGCAGCGACAACAAAAAAGAGCCGAAAACCTTCCCAGAACTGCATGCACGGAACCCAACGTTCTCAACTACATTGAAAAGCACAGTCAAAAAAATATCCAAATGCTCATCAACACGCAATATATCTCTTGAAGAGGAGGATGGAAAAAACGACTGTTCCTCTCTCTCTCCGACATTTAGTTATCGTGTAGCAATTGCCAATGGACTACTCAAAAATGACCTCTTACTAAACAATAATGAATTTCATGAGGTCTTGTCAGTTGACAGCGATTACTCAGACTGTCTAAACGAGACCAAACTTGTCCATAGATTCGATGAACAAAAAGCTTATACAATGCCAGTAAGAAGGAATAGGAAGAGCTTGATTAGTCTAGCACCCTCAGACGGCAGCTCAGAGGGAGAGCGGGGAGAGCGCAGCAGTCTCCACACCCTTCGATTAGGTGCTCTGAAAAAGTTGAGGAAATGGAAGAAGAGCCAAGAATGTGTGTCCTCAGATTCAGAGGCAAGCAACTGGAGAAAGACTCTTGGCATCAGGAGCAAATCTCTGGACAGGGCTGGACGGCAACAGAAAACCACTACCCTGGAGCCAGGGTCCAGCTCAACAGGGTGTATCAGTCAGACTCAGGATGTGATGGAGATGATCTTCAAAGAACTTCAGGGAATCAGTCAGATTGAGTCTGAGCTCTCAGAACTGCGAGGGCATGTTAACGCCCTCAAAAGCTCCATCGACGAGATCTCCAGCAGTGTAGAGGTGGTACAGAGTGAAATCGAGCAGCTGCGTTCGGGATTCGTACAGTCCAGACGTGAGACTCGAGACATCCACGATTACATCAGACAGATTAGCCAACATACCAACAAAGCTACTCTAAGATTTCTAAATGTGCCTGAGGAGAAGTTTGAAAAAACCGAAGAGCTTATTTATCAGATTCTGAAAGAGAAAATGGGTTTCACTGATGCACGCAAGACATTTAAAATTGAACTTGCCCATCGACTAGGGCAACAAAGAGAATGTTACAATGCTAAACCTCGACCAATTGTAGTTATATTTTCAAGCCCACAAGATAGAAATTTAGTTTTGAAAAAATGTTATAAGCTAAAAGGGACTGGCATATCAATATCAACTGATAGTCTAGCACATGATTCAAAAGAAAGGAAGGACAAGGCAATGGCCTCCTCGCAGACATATGAAAGCATGGATATCAAGGTTTCAGCCAAAGATAAGGCTGAAAGTGATGAATGGGACTCCATGGAAAGTGACAAAGAGCTAGATGAATTAAATAAGAACAAATATGCAATTGTGTCCAAACCACCTCAAAAAAGTAAATCGGACAAGAAAAAGTCTCACAATCACCGACGGTTGGCTGATGACACTGCATATTCTGTGCACTATGCAGATAATATAGCCTACGATGACCCTGACAAGCAAAGCAAGTCTTACTACTCTGACCTAACACCTGGGTGGCAGTCTCAGAGTGATTATTCTACTCCCAAACTCAGTCGGTCTGAATCGGACTGTTCTAAACTTTGCCAGTCTTATTCAGAGGACTTCTCAGAGAGTCAGTACTTCAACAGAGTCAACGGCTGCTCCCTGCTCTCCTCCTCGGATCAGGAGCTTTGGCAAAGGAAGCAAGAAGACATGGCATCCTCCTGGTATGCTAGTCCTCCCAGTCAAACTCTGAGCCAAGAACGACCTTATGTGGAACATAATGAAGTTGACACCACAGAGACTATTGACAGTGGTGTAAGTAATGGTATTGTTTGCATATCAGGGGACAGGAGCCATTACAGTGGCTCTCAGCTGTCTCTACAGGGTGACCTCTCACCATGGAAAGATTGGCATCACCTCGAACAAGGTGCTGATTCAGGTTTGGATGCTTCAATTGAACAGAACATAATCTCAGAGATCACTAGCCCCTTCGACCCTGCAGCTAACCCAGGTTTCCCTGAGAAAATTACAAAATGCCTTGAGGTTGATTTACAGTTTGAAGGTGAGACCTTCTTGACACTAGATAGCACTCCTGAGACAGGCCAAGACCAAGATATAGATACAGAACCTGAACTTGTTCTAGAACCCGATCCAGAGCCAGAGCTAGAGCCAGAACAAGTACCCAGGCCAGGACCTGAACCAGAGCCAGAGGTTGTAATTGAACCCATATCAAAACCAGTACCAACACCTGTGGCCGAACCACAACCAGAAAAGAAGCCGAAAACCAAGAAAGCCCGTACTAAGCCTGAATCAGCTCCTCAAACTCTGCAACGACAAGATGTCAATGTGAACCACCTCCAACAGAACCAGAAATCTTCATCCATGTACCGCAGTCAGAGTGAGATCGGTAATGAGAAAGTGGAGGAAGTCCCTAAATCCTGGAGTAGTAGGCTCAGCATAGACCTCAGCGAGAAAACCTTCAGCTTTGGATTCGGATCCACCCTGCAAAGAGCCAAGTCAGCTTTGGATTTTGTCTGGAATAAAGGTTCCCAGAGCACTAGTGCTCCAGTCGAAGAAACAAGCAACACCTCATTCATGGGCAGGCTCAGAACCTCGTCCCAGTCCACTGAAAATAGTTCCAGCACAACCATTGACTCTGATGTTTACACAGAACCTTTCTATTACAAGGCAGAGGAGGAAGAACAAGCCAGTGAACAACCTGTGGACAATGAGACACATTATGTTGAGGTAATGGAACAAGTGCTGGCGAATCTCGAGAACCGAACGAATACCAACGAGGCTGAGGAACAGTACCAAGAAGAGGAATATGATGTCTCGCAAGAATACGACATCTCACAAGAGGGTAATCCTGTCCTAGAATACGACTGCAGCCTTGATGAGCAAGATGATGAGGAATACAGTGAGGCGTATGACGACAATCCCATGACTGAAGACACGGCGGAGTATGAAGGGAGTTTGGTGGAGTATGTTGAAGTAACTGAGGAACAGGAAGAAGAATCTGAGGAACAGGAAGAGGAAATAGAGCAGACAAAGGAAGGTCAAGATACAACGGGAACAAAGGTAGCAGCTGAGGTAAAAAAGACAGTAGAACAAGAGGATGAGAATAAAAATGTTACAGAGGTTCCTGTGGAGCCAGCACCACCCAAAAAAAGGATACGGCCCACCTTCAAAGAGGCAGCTCTGAGAGCTTACAGGAAGCAGATGGCAGAGCTAGAACAGCAAATCCTGGCGGGAGACAGCACAGCTCTGGATACAGAGGGTTGTGCAAATATTCTGGATCAAGCCAAACTGGGGCTGAACGGTGGTGGAGTTGGCAGTATACTTTATGGCATTGACAGCATGCCAGATTTACGCCGCAAGAGGACCATGCCTATTGTCCGAGACCTGGCTTTGACCTTGGCTGCTCGAAAGGCAGGCATTGCGTTTGGCCTCGTGAACAGATCAACTCTAAACAATGAGGAGCTGAAACTGCATGTGCTGAGAAAGACCCTGCAGGCCTTGATCTATCCCATCTCCTCCACGACACCCCATAATTTTGAGGTGTGGACGGCAACTGCGCCCACCTACTGTCACGAGTGTGAAGGGCTGCTGTGGGGCATCGCCCGGCAGGGCATGCGCTGCACGGAATGTGGGGTGAAATGCCACGAGAAATGCCAAGACCTTCTGAATGCAGACTGTCTTCAACGTGCGGTGGAGAAGAGCTCAAAACACGGAGCAGAGGACAAAACCCAAAACATCATTATGGCAATGAAGGAACGGATGAAGATCAGAGAAAAGAACCGACCTGAGGTGTTCGAGTTGATCCAGGAGATGTTTCAGCTCTCAAAGGAAGATTTGACCACCCATCTGAAAACAGCCAAACAGGCAGTGTTGGAGGGGACATCCAAATGGTCTGCCAAGATTACCATCACAGTGTTGTGCGCTCAAGGTTTACAAGCCAAGGACAAGACAGGCTCCAGTGACCCTTATGTCACAGTACAAGTTGGAAAGACTAAACGCAGGACCAAAACTGTTTTTGGCAATCTCAACCCCATCTGGGATGAAAAGTTCTTCTTCGAGTGCCATAATGCCACAGATCGTATAAAGGTCCGCGTATGGGATGAAGATGATGACATAAAATCTAGAGTGAAGCAGCACTTTAAGAAGGAATCTGATGACTTCCTGGGTCAAACCATCATCGAGGTGCGGATGCTAAGTGGAGAGATGGACGTTTGGTACAATCTTGAGAAAAGAACAGATAAGTCGATGGTGTCGGGGGCCATCCGACTAAAGATCAGCGTTGAGATGAAAGGAGAGGAGAAGGTGGCTCCACCACACGGGCAGTACACATGTTTACACGAGAATCTCTTCCATTATCTGACGGAGGTGAAAAACAATGGAGTGGTTAAGATTCCAGAGGTCAAAGGTGACGATGCGTGGAAGGTTTATTTTGATGACGTGTCTCAGGAGATCGTAGATGAGTTTGCGATGCGTTTTGGTGTGGAGTCCATCTACCAGGCCATGACTCATTTCTCATGTCTCTCATCGAAGTACATGTGTCCCGGTGTTCCCGCAGTGATGAGTAACCTGCTTGCCAACATAAATGCTTATTTCGCTCACACTACCACGGCAACCACCAACATCTCCGCCTCCGATCGATTCGCTGCATCCAACTTTGGGAGAGAGAAGTTTGTTAAACTCTTGGATCAGCTGCACAACTCTTTGAGGATCGATCTCTCCAAGTATCGAGATAACTTCCCAGCAGGAAATCCAGAGAGACTCCAAGACCTGAAATCAACCGTCGACCTGCTAACGAGCATCACCTTTTTCAGGATGAAGGTGCAGGAGCTGCAGAATCCTCCCAGAGCCAGTATGGTTGTAAAAGACTGCGTGAAAGCATGTCTGGACTCCACTTACAAGTACATCTTTGACAACTGCCATGAGCTTTACAACCAACTTCTGGACCAGGCTAAGAAGCAGGATTTACCACGAGAGGAACAGGGCCCGTCCATCAAGAACCTGGATTTCTGGCCCAAACTGATCACGCTGATGGTGTCTGTTATAGATGAGGACAGAACAGCTTACACACCCATTATTAACCAGTTCCCTCAAGAATTGAACATGGGTAAAATTAGTGCTGAAATCATGTGGAACCTCTTCGCTATGGATATGAAGTACGCAATGGAGGAACACAACAAGCATTGTCTATGCAAGAGCACAGAATATATGAATTTGCACTTCAAAGTCAAATGGTTCCACAACGAGTATGTTCGAGACCTGCCAGCCTTTAAAGGAATTCCTCCGGAATATTCCCTGTGGTTTGAGCCGTTTGTTATTCAGTGGTTGGATGAAAATGAAGATGTAGCCATGGATTTCCTTAATGGAGCTCTGGAGAGAGATAAAAAAGATGGGTTCCAGCAAACATCAGAACATGCTCTCTTCTCCTGCTCGGTGGTGGATGTTTTCACACAGTTGAATCAAAGCTTTGAGATCATAAAGAAGCTAGAATGTCCAAATCCACAAGCCCTCGCTCACTTCATGCACAGATTCGCAAAGACCATAAATAAAGTCCTTCTCCAGTATGCGGCGATCATCTCGAAAGACTTCACCAACCATCTGAGCAAGGAGAAAGTGGCCTGTATCCTCCTGAACAACATTCAACAGCTCAGAGTCCAACTGGAGAAGATGTTTGAGTCTATGGGCGGAAAACAGCTGGACGCTGAAGCCAGTGATCTACTGAAAGAACTGCAGAATAAACTGAACACAGTGCTGGACGAGCTCAGCGGGGTCTTCGGCTCCAGTTTTAAGCCGGTCATTGAGGACTGCATCAAACAAATGAACCAGGAGCTTGTGCAGATAAAAGGAAATGCTGGAAACAAGAGCAACGCAGCCATGGACGCAGAAATTGCCCTGCGACCACTCATGGACCTCCTGGACAAGAACTTGATTCTGTTTGCTAAGATCTGCGAGAAGACGGTTCTCAAACGTGTTCTGAAGGAGCTGTGGAAAATCGTCCTCAACACCATTGAGCGACAGATCGTTCTGCCTCCGCTGTCAGATCAGACACAAGGAGCTCAGATGATCTTCAGTGCTGCCAAGGACTTGGGTCAACTCTCCAAGCTTAAGGAGCATGTGATTAGGGAGGAAGCTCGGAGTCTGAGCCCTCGGCAGTGTGCTGCCATGGATTTAGTGCTGCCAACCATCAAGCAATATTTCCATGCGGGGGGAAACGGTTTGAAGAAGAATTTCCTGGAAAAGAGTCCTGATCTGAAGTCCCTGAAATACGCCCTCAGCCTTTACACTCAACCCACAGATGCCTTGATCAAGAAATATATATGCACCCAGACCTCTCAAGGTCTGTCAACGTCTGGATCCATTGGTGAGGTCACTGTCCAGGTGGACCTGATCTCACACCCTGGTACTGGAGAACACAAAGTCAGTGTGAAAGTTGTAGGTGTGAACAACATAAACTGGCAGACGAATGTCATGTTCCGGCCATTTGTGGAGATCAACGCCATCGGACCACACCTAGCTGACAAGAAACGCAAGTTTAGCACCAAAACCAGGAATAACAACTGGTCTCCAAAATACAACGAATCATTCCAGTACGTGCTGAGTAACGAGCATGGCCCAGAGGCCTACGAGCTTCACATCTCCGTGAAGGACTACTGCTTCGCCCGAGAGGACCGTATCATCGGAATGACGGTTCTGCAGCTCAGAGAACTGGCTGAAAAAGGCAGTTTGAATGCAAGCTATCCACTCGTCAAGAACATAACCATGGACGAAACCGGTCTGACCATCATGAGAATACTCTCACAAAGGACCAACGACGAAGTGGCCAAAGAGTTTGTACGTCTTAAATCGGACACACGGTCAGCCGAGGAGGTGTCGTAAAAATAATCGCAGGGGGAAAAGAGCGGGGAAAAAAGCGGCAAGAAACAGAGTGAAATCCCAACAGCGCAAGATGGTTGTGTTTGTTTTTGTGCATGTGTGTGTAAAACATCTGTTGGAATGTTCATTTTAAACTACAAGTACGTACAAAAGTGTTTACCTACCGTATGCTCTATCAAATATTATATGCTACGAAGTTATGTTCAAGAGACGTTGAATACAGTTTTGTATGACGATTAGTCTTTTTGAACAGATAGTTAATTTGTTCAGATAAAGTGCCAAAACAGATGACAGAAAACAGAGGGAAAAAAAAACAATAGACACATAAACCCATATGAATTCTCGACGAAGTCTTTCTAAATTTGCTCGATCTTTTGTCCAGTGTTTATCATCCTCTCTTTAAGTGTGTAGCGGTTTTGTTTGTCTTTTCATTCTCACCCTACTTTTTCCGTTTTTGTTGCCTCGCCCTTTCCATCTTTCACAAAGGCACTTGGTGGTGCATGTGTTGTTTCCTTGGTGACGTCTCTCCCATGTGTTCACAGTGACTGTGGGCGTCAGGTCGAACCCTTTCCCCTCTAATGTTTTGTATTTTGAGCCGACTTTAAAAAGAGACCATTTTTTTAAATGGCGATGACTGCTACGAATCTCTTCATAAGTGTTTGTAATTTTATAGCTGTTGACAACGATGAAACCCACCTTCCGTCTTGCCGGTATAGGCAGAATGGGTGGAATTTTTTTTTTTTTTTTTTTTTCATATTTCTTGTTCATTTACATACTTTTTTTTTTTTTTTTTTTTTTTTTAAACATAGGCTTCCAGCCTTTCTGAATAATCACTGTGAACATGGGCTCTGGAAGGCAAGCGTACATCAGTTTTGCTGACTGTTTGATATCATCTTTTAATTTTTTCAAACAACTTTGATTCAAAAAATAAATAAATAAAAAAATGGCAGTTATATATAAAAAAAACTTTCATACAAAAGCAATCCATGATCTGTATGAAAATCAGTATATACTATGTACACGTGTTACATATGTACATGAATTATGTTTTTAGTTTTGCTAAATCATATCTGATTGTTTATGGGCCGGTTCTGAATTTAATTTGGGATGATCTTTGTGAAGTTGTTTTATCTGATATGAAATTTGTAAATGTTGCTTTACAAAAAAAGGTAAATCAATCGCCGTCATTTCATTTATTTTTGTTTACAGAGGAAAAAGTTTAACATTTGGTATTTATGCAACATTCCTATGTATTGCACTGATGGCAAATTGTATGTCATGTAAATATATTTAGTGAGATATTGTAATGAAAGTCTCGTTGTATTGCATTTTAATCAAGGAAAGCAACCTTTTCACACATTACACTTTTATAGTATGTATTAGTGTTGGATGTAATGCAATTACAAAATAATTAGTTACTATAATCTAATTACATTTTTAGTCAAAAAAGTTATGTAACATTACATTTAAAATTGTTTTAATCATATTACAGTTGCTAAATTTCAATTAAGTTCTAAAGACATTACTTAGGTAACACATATTGCTAAAAACATTTACACGGAATGAATTTAAAGGAATATTCTGGGTTCACTACAAGTGAAAGGTGCACTTAGTAACCTTTGTCTTTGTGTCTTTGTCTTGGACTTACACTGACACCTAGTGGTGTGGATGCAGCATCGTTTAAAATCAGTAGTTTTCAGTTTCAGATGCCATTGTAGAAATTTAGTATTCACAGTCAGCCATGATTACTTTAATCAATGAGTGAAAGTGTCATATTACAGGATGGTTACTGAGATTAAGCGAGTAGCATTCGGCTGGTCATGTGATACTAACATGGCAGCCCCCATGTGCGGACCCTCTCCATGTAGAATAAAACAGCTTTTATAAGCTTACTGATATAACTTGAGTCTCCATTTTAATGTGAGTGGTCATGATTTCCTACATATATTGCACAATTACAATTCATGTCTTTAGGAATTAAACTTTTTAATGAGGAAAAAATTACTGAGTGCACCTTTAAGCTCAATCAACAGCATTTGTAGCATA
>XR_003260173.1 PREDICTED: Dromaius novaehollandiae ADAM metallopeptidase with thrombospondin type 1 motif 6 (ADAMTS6), transcript variant X8, misc_RNA 
CGAGGCTGCCAAGGCTCCCTGCTGCCGCCGCGCTCGGCTTGGCCGGGGGCCGGCAGCGAGAGGAGGTCTGGGGCTACTTCAACCAAACTTTCCTGAGTCCTTCCTGCTCTGCCTGCCTGTCTTCCCTTTCCCCCTTTCTCTCGCTCGCTCGCTCTCTCTCTCGCTCCCCCCCCTTCCTCCCCCCCAACTCAGATGATATTCACATGGTATTTTGCACAGAGGAGGCTGTTCAAGAGGAGGGCACCCACCCCCACCCCAATATAAGCCTGTTTTTCCTTCCTTCCTTCCCCCCCTTTTTTGTTGGAAAGACAAAATGTGCAGGGTGATAGGTTGGGTGAATTGATGGCATCCCTCCTCCTGCCAAGTCAGTCCGTTTTCTAAAACCCCCTTTTAGGAAGGCTAGAGAATTTTATTCTGTTGGAGAATATAACCCTGATGGTTGCTTGCACAGAGGGGAAAAGCAGAGAGGAATACGGGAATCGTCCTGTGCAATCTCTATTGTTTGAAACTTACTTTATATCAGAAATTGAAGATGAAAACGGGAAAGAAATGGAGAAAATTCACTAACTGCCAAGTCTAACGTCTTACAGATAACTTAAGGAATTTTACAAATGCTTATTTTTGCGTTGAGAAAATGACTGCTGATATAGAAGAAAGTATAGGTTGTTGGAAAAGAATACCTGTCAAAAAGTGGAACGTCCAATAGTTAATTTGGGAGTAATATAAATGTACTTGTTATGGTGCGATTCTGGAGTGGAGTTAACTCTATAGCACACAGGTAGCCCTCCAAGGAGAAGAAAAAAAAGCTTTCAGTTTTTCTAAATTATGGAAGTTTTTTGGAAGACGTGGACATGGATTTTGAGCCTAGTCGTTGTTTCATCGGAATTTCACAGTGACAGCAGGCTTTTGTATAGTTCTCAAGAGGAATTCCTGTCTTACCTTGAACACTACCAGCTAACAATCCCAATAAGGGTTGATCAGAATGGAGCCTTCCTCAGCTTTACTGTGAAAAATGCTAAACCCTCAAGGAGGAGGAGGAGCACAGACCCTTATGATCAAGAACTGGCAGCATCTAAATTATTTTTTAAACTTTCTGCCTATGGCAAGCACTTTCATTTAAACCTGACTCTCAACACAGATTTGGTATCCAGACATTTTACAGTAGAATACTGGGGGAAAGATGGACCTCAATGGAAGCACGATTTTTTAGACCACTGTCATTACACAGGATATTTGCAAGACCAACATAGTACAACTAAAGTGGCCTTAAGCAACTGCAATGGTCTGCATGGAGTTATTGCTACAGAAGATGAAGATTATTTTATAGAGCCTTTGAGGAATGTAACAAAAAATTCCAGTAACTTCAGTTATGAAAATGGTCATCCTCACGTTATTTACAAAAAGTCTACCATGCGCCAGCAGCATCTCTATGATCATGGTCGCTGTGGAGTCTCAGAAGACCTCACAAGAAGCAGTAAGCCTTGGTGGATGAGTGATGCATCTGCTTTTCCAACTTCACTTCCAGTCAATGACACATTAAGTAGTCACAGTCGGCAGAAGAGATCAGTAAGCCTTGAACGGTTTGTGGAGACGCTGGTAGTAGCAGACAAAATGATGGTGGGATACCACGGTCGCAAAGACATTGAGCATTACATTTTGAGTGTAATGAATATTGTTGCCAAACTTTATCGTGATTCCAGTCTAGGAAACGTTGTGAATATTATAGTGACTCGTTTAATTGTCCTCACTGAAGATCAGCCAAACTTGGAGATAAACCACCATGCAGACAAGTCCCTCGATAGCTTCTGTAAGTGGCAGAAATCCATTCTCTCCCACCAAAGTGATGGAAACACCATTCCAGAAAATGGGATTGCCCACCATGATAATGCGGTTCTTATTACTAGGTACGATATCTGCACTTACAAAAACAAGCCTTGCGGAACACTGGGCTTGGCCTCTGTGGCTGGAATGTGTGAGCCTGAAAGGAGCTGCAGCATTAATGAAGACATTGGCCTAGGTTCAGCTTTTACCATTGCACATGAGATTGGTCACAATTTTGGTATGAATCATGATGGAATTGGAAATTCCTGTGGGACCAAAGGTCATGAAGCAGCAAAGCTAATGGCAGCTCATATTACAGCAAACACCAACCCTTTCTCTTGGTCAGCCTGCAGTCGGGATTACATCACCAGTTTTTTGGATTCAGGCCGTGGTACTTGCCTTGATAATGAGCCTCCCAAGCGTGACTTTCTTTATCCAGCTGTGGCCCCAGGTCAGGTGTATGATGCTGATGAACAGTGTCGCTTCCAGTATGGAGCAACATCCCGCCAATGTAAATATGGGGAAGTGTGTAGAGAGCTCTGGTGCCTCAGCAAAAGTAACCGCTGTGTTACCAACAGCATTCCAGCAGCTGAAGGTACTCTTTGCCAAACAGGGAGCATAGAAAAGGGGTGGTGTTATCAGGGAGAGTGCGTACCTTTTGGCACTTGGCCCCAGAGCATAGATGGGGGTTGGGGTCCATGGTCAATATGGGGAGAGTGCAGCAGGACCTGCGGGGGAGGAGTCTCCTCGTCTATAAGACACTGTGACAGTCCAGCGCCTTCAGGAGGAGGAAAATATTGCCTTGGAGAAAGGAAACGGTATCGCTCCTGTAATACTGATCCGTGTCCTTCAGGGGCCCGCGATTTTCGAGAAAAACAATGTGCAGACTTTGATAATATGCCTTTCCGAGGAAAGTACTATAACTGGAAACCCTACACTGGAGGTGGGGTTAAACCATGTGCATTAAACTGCTTGGCTGAAGGTTATAATTTTTACACTGAACGTGCTCCTGCAGTAATAGATGGGACTCAGTGCAATGCTGATTCACTGGATATCTGTATAAATGGAGAATGCAAGCATGTAGGTTGTGATAACATTTTGGGGTCTGATGCAAAGGAAGATAGATGTCGTGTTTGTGGAGGAGATGGGAGTACATGTGAAGCCATTGAAGGTTTCTTCAATGATTCATTGCCCAGAGGAGGCTATATGGAAGTGATTCAAATTCCAAGAGGTTCTGTGCACATTGAAATAAAAGAAGTGGCAATGTCGAAGAACTACATTGCTTTAAAATCTGAAGAGGATGACTACTATATTAATGGTGCCTGGACTATTGACTGGCCAAGAAAGTTTGATGTTGCTGGAACAGCTTTCCATTACAAGAGACCAACAGATGAACCTGAGTCTTTGGAAGCCCTAGGCCCTACATCAGAAAATCTCATAGTCATGATTCTGCTACAGGAACAAAATTTGGGTATAAGGTATAAATTCAATGTTCCCATCTCTCGCACTGGCAGTGGAGACAATGAAGTTGGCTTTGCATGGAATCATCTGCCTTGGTCAGAATGTTCTGCCACTTGTGCTGGAGTGGCCACCAATGCAATTCTTTACCTCTGGCTGGGAGAGCAGGACAGTTGGCTTCCTTCAAAGCCAACACCATTGCTGCTGCATGGACTGGTGTGCAGAAACAAGAGGTGGTGTGTAAAAGGCTGGATGACAACTCCATTGTGCAGAACAATTACTGTGATCCAGACAGTAAGCCTCCAGAAAACCAAAGAGCCTGCAACACTGAGCCTTGTCCACCTGAATGGTTTATAGGAGATTGGTCAGAATGCAGTAAGACCTGTGATGGAGGAGTGCGTTCACGAACAGTTCTCTGTATCAGAAAGATTGGACCTTCTGAGGAAGAGACACTGGAAAATACCAACTGTCTAACGCACCGGCCTATTGAAAAGGAGCCCTGTAACAATCAGTCCTGTCCCCCCCAGTGGGTTGCTTTGGACTGGTCAGAATGCACGCCAAAGTGTGGTCCAGGATTTAAGCACCGAATTGTTCTGTGCAAAAGCAGCGATCTTCTAAAAACTTTTCCAGCTGCTCAATGCCAAGAAGAAAGCAAACCTCCAGTCCGCATCCGCTGTAGTTTAGGTCGATGTCCTCCTCCTCGCTGGGTTACTGGAGACTGGGGACAGTGTTCTGCACAGTGTGGTCTTGGGCAACAGATGCGAACAGTACAGTGCCTCTCATATACCGGACAAGCATCCAGTGAGTGTCCAGAAACACTTAGACCTCCATCAATGCAACAGTGTGAAAGCAAATGTGACAGTACTCCCATTTCCAACACAGAAG
>XM_009065832.1 Lottia gigantea hypothetical protein partial mRNA 
TTTCACCAATGGTTTTCTAATTTCCATGGTTATGCCAGTATTATAGTGTGTATATTTGGCATCAGCACCAATATATTCAATATATCTGTTTTAACACGAAAAGATATGAGAACTCCTACCAACATCTTGCTGACGTGGTTAGCTGTGGCTGACATTTTAACGATGGTGCCATACATTCCGTTTGCCATTCACTTTTATTGTCCGAATACATCACCATTCGAGACTCCTGAGAAATACACGTATAATTGGATACTTTATATGATCTTCGTAGTCAATAGTGCCGCTACAACTCACACTATTTCTAATTGGTTGGGTGTTTCATTATCAGTGTTCCGCTTTATGCAGATGAGATCAACGAGTCGAGGCGTTCTAGCCAAACAACGTCGCTTAAAACATGTGAAGGTAATAACCGTGGTTGTGTACATTTTCTCAATCATTGTTCTAATTCCCAACTATCTGACTAACAAAATCCAATCAGTTCAAGGCCCGCGTAATACGACCATATATGGATTAAAAGACATGACACCGAAAGATCCCAGCACCGACAAAATGGCTTTGATAAATACTTTACTTTATGCAGTGGTGGCTAAAATTGTACCGTGCCTTTTAATGTCTATATTTAGTGTGTCTTTAGTATATACAATACATTACAAAAATCGACATCGCATGCGCAGGCTTGTGGCTGCTGGGAAAAAATCGAGGGCCATCTCTAAACAAACAACTACAACCCGAATGTTACTAGTTGTTATAGTCTTGTTTCTTATTACCGAACTTCCACAAGGCATTCTTATTCTCGTTACAGCTGCCATCCCTCAGTTTCATAACAACGTATATAACCTTCTGGGTGATCTAATGGATTTTATTGCCTTATTAAATAACGCAATCAATTTTGTGCTTTATTGTAGTATGAGCCAGCAATTTCGCTCCCGGTTCATTGAAATGTAC
>KU027247.1 Uncultured microorganism clone SZY.L801.1_Tag26405 16S ribosomal RNA gene, partial sequence 
CAGCCGCCGCGGTAATACGTAGGGGGCGAGCGTTACCCGGATTCACTGGGCGTAAAGCGGGTGTAGGCGGCTCGGTAAGTCGGGTGTGAAATCCCACAGCTCAACTGTGGAATTGCGCCCGAAACTGCTGAGCTTGGGGCCGGTAGAGGGAGACGGAACTGCCGGTGTAGGGGTGAAATCCGGAGATATCGGCAGGAACGCCGGTGGGGAAGCCGGTCTCCTGGGCCGCGCCCGACGCTGAGACCCGAAAGCTAGGGGAGCAAACCGGATTAGATACCCGGGTAGTCCTAGCCGTAAACGATGCCCACTAGGTGTGGGGGATTAATTCCTCCGTGCTGGAGCTAACGCGTTAAGTGGGCCGCCTGGGGAGTACGCCCGCAAGGGTGAAACTTAAAGGAATTGGCGGG
>XM_042244958.1 PREDICTED: Ovis aries caspase 8 (CASP8), transcript variant X4, mRNA 
AAAAGTAAACTTCTTCCTGGAGGCGTTTCCAACCCCACCTCCTGTCTCCCCCTCCCGCTTGCCTCATTTCCAGGGATTTATCTCCAGCTGGGTTTTAAGAACGAGCCTCAGTAATACGAAGTGTGAAGTTAGGCAGTGTGGGGTCTTGTCGTCGAGAGTTTGGTGGCTGGGATGTTGCCAGGACTGTGTGGAGCAGGTCCCAGTCCATGGTGAGGGCCCTGGGATTTTATTTTTCCTTTGATGTACTGAGAGAAGAGGCCCGTGAAGTGGCTGCTGCTGTGAAGGTTCCAGGATTCGCCTCTGGTAACAACTACATTCTCCTAACACTTGAAAAGCATGGATCTCACCCAATGTCTCTATAAAATTGGAGAGCAGCTGGGCAGTGACGACCTGGCTGCCCTCAAGTTCCTAAGCCGGGACCACATCCCATATAGGAAGCAGGAACCCATTAAGGATGCCTTGATGCTATTCCAGAGGCTCCAAGAAAAGAGAATGTTGGAGGAAAGCAATCTGTCCTTCTTGAAGGAGCTGCTTTTCCAAGTGAATAGACTGGATCTGCTGCTTAACTACTTGGACACCAGCGAGGAAGAGATGAAGAGGGAGCTTCAGATACCTGGCAGGGCCCAGATCTCTGCCTACAGGATCCTGCTTTTCCAGATTTCAGAAGATGTGAACAAAGTGGAATTGAAGGACTTTAAGTTTTTTTTGAGCCAGGAGATTGCCAAATGTAAGCTGGATGATGACATGACTTTGCTTGATATTTTCGTGGAGATGGAGAAGAGGACCATCCTAGGGGAAAATAACTTGGACACCCTGAAAAGAATCTGTGAGCAGGTCAACAAGAGCTTGCTGAAGAAAATCTATGATTATGAAGAATTAAGAAAAGATATGTCACAATCGCTTCCAGAGGAGGGCTCCTCTGAGATGCTGGCCATGTCAGACTCTCCAGGAGAACAGGGCAGTGAGTTGCAGACATCCGACACAGTTTACCGAATGACAAGCAAACCTCGGGGATACTGTTTGATCTTTAACAATTATGATTTTAGCATAGCACGGGAGCAGGTGCCCGAACTTCACAGCCTTAAGGATAGGAATGGAACACACTTGGATGCAGAGGCTTTGGACAAGACCTTTCGTGAACTTCATTTTGAGATAGTGCACTACAGAGACCAAACAGCAAAGGGAATCTGTGAGGTTCTGAAATCCTACCAGAAGAAGGACCACAAAACCAAAGACTGCTTCATCTGCTGCATCCTTACCCATGGAAACAAGGGCACCATCTATGGCTCCGATGGGCAAGAAGCCCCCATCTATGAGCTGACCTCCTACTTCACTGGATCAAAATGCCCTTCCCTTGTCGGCAAACCCAAAATCTTTTTTATTCAGGCTTGTCAAGGGGATAAGTACCAGAGAGGAATAGCTGTTGAGACCGACTCAGAACAGAGGGAAGCCTATTTAGAAGCGGATTCGTCACCTCAGAAGAGATATATCCCAGATGAGGCTGACTTTCTGCTGGGGATGGCCACTGTGAACAACTGTGTTTCCTACCGAAGCATCGTGAAGGGGACCTGGTATATCCAATCGCTTTGTCAGAACCTGAGAGAAAGATGTCCTAGGGGTGAAGACATTCTGACCATCCTAACCAAGGTGAACTTCGAAGTAAGCAAAAAGGATGACAAGCAAAACATGGGCAAACAGATGCCGCAACCTACTTTCACACTGCGAAAAAAACTCTTCTTTCCTCTTAATTGATGCTATTGTTTAGTTGTATAACTAGACAATAGTTATGCAACTGAACAATAGTTAAAATGCTGCTACTTTATTCTCTTTCTTCTTCTTTTTATTTTCAAATAGCTGGCATATCATGAGAGTCAGGACAACATAATTTTTATGCAAATTCAAGCCTAAATCTCTGGCTTTGTAGACAATAACAGTCATAGCTGTGGTCTTGATTTCAATTGTATTTTTAATTTGATGAAAAGGTTTAAAAATGAACTAAAATAAACACAAAAAACACAGTAAGTTTAAAAGAAATATCAAAGATCATGGAGGGAGATTTTTGTGATCTGACCTAGCTGAAAAATCCCCTCGACTATTGAGGTTCAGGGTATAAAGTTCCCACATCCAGCCTGATTGCTACTGATGTGTATGATAAGCTGTCCTGGAAACATGTGACCCTCCTCTCCTTAGCCATGAGCAGACTCTGATTTTCAGTGGTGAAAACCACCACTCTTTAGACTTCAGTTTCAAAAGCTTAGAGATTATTTTCCTTTTTTAAAAGAATTATTCATAAATGCGGCATTCAACATACTTTTAAGAGAAATGATGTTAATATTAACTCGTTTTATACTTCCAGTAGATCTTTTCCCAAGCTGTCCTTTATACTAATTTGCAATATTTTGTAAAATAAAAAAATTTTAAAATTCATATATTAAAGATTTTAAAAATACCAAATGATTTTGTTTTTTAAAGACTCTTTCCAAACTGAAAAGTTTTTATATACATGCTTCTGCAGTGCTGAACATGATTTGCTTTTTTACTAAAAATGCAGTATGCCTTTTATATGTTTGCTCTTTCTTTATATGTTCAATTCACTTTAAATCTTTAGTAATTAATAATTAGTAATGTAATAAATATTTTTAACAGAATAAAATATAATTTTATCATA
>XM_012896071.1 Acytostelium subglobosum LB1 hypothetical protein partial mRNA 
ATGGACCCTCAACAACCTACACAACAACAACAACAACAGAATGGTGGTGGCGGTGGTGATACATTGTCAGCAGCAGTGGCAGAGTTGGATAAGCTAGAGTCATTGTTGGCCAGTGGTTATCTGTCACGTCCATTCTCTGTGGATGTGTCAAAACAACAGCAACAGACGAACAAGTCGACGACGAACGAACCAGCAGCAAAGCAGACACCTGCACCTACACAAGCAGCTCCTTCAAAGCAACAACAGCAGACTTCATTGCAGACTGCACAGCTTACACAATTGCTTCAATCACAAGTGCAGGCACATCAACATCAACAAGCAGCAGCAGCAGCAGCAGCAACAGCACAGGTACCACCTGCAGCAGCAGTAGCAGCAGCAGCACAAGCTCCACCTGCTGCTGTGACTCAGCCACAACCTCAAGCGCCACAGCCACAGGCTACAATTCAGATTGCAACTCAGGCTCAGGTGGCCCCAACACAATCGCAACAACCTCAGACGCCACAGCCACAGGCAGCCAAGCCACAGGCCACTCAGGTTCAGGTGGCCCCAACACAAGAGTCACAGCCACAGGCAGCCAAGCCACATCCCACCCAGACACCAGCACCCCAGACACAGGCTCCTAAGCCACAGGCCATCCAACCTCAGGCTTCACAAACACAAGCACCTCAGCCTCAGGTGCCACAACCACAGGCTGCACCGGCACAGGTGACTCAGTCGTCTGTGACACCTAAGCCTCAGGCTGCTCCTGCTACACAACCCCAGCCACAACAAACTAAACAGGCAGCTCAGCAACAGAAGAAACAGGCGCAACCAAAACAGAATGATGTCAAGGACACATCACAGGTTCCGAAGACACAGCCTCAACCTCAACCTCAGGCGCAAGCTACTCCACAGGTAGCACAGCCTCAGACACAACCTCAGTCACAGCCCCAAACAAAGCCTCAGACTAAGCCTCAGAATAAGACTCAGACCAAGCCTCAAGCACAAACAAAGCCACAATCTCAAACTCAGCCACAGACGACACAGCCTCAGCCACAGGCTCAGGCTCAGCCACAGACAACACAACCCCAACCTCAGGCTCAGCAACAGACGACACCACCTCAAACACCACCTCAGGACAATTTGGAAGAAGATGTACAACGATATGATGATGACGATAACAACAACAACAACAACAATAGCAAGGAGTTGGAACTTTTGCAAGAGTTGGAAGAGATGGAAGCAGAAGTAATGATGCTGAGGCGAAAGGAATATCTCTCAATGTCAGGCGACATGAAACGCAACGAATCACTGCTGTTCCTCGAGCGCAAGGGTTTGGTCAAGGAGATCAGTGCCAAGTTCCAGACACCCGACACAGCCTCCTTCACCAAGTTCAATCCCAACACACATCTCTCCATCAAGGAGAGAATCCTGCACTTGAAGCGAGAGAATGAGCGCAGGAGCAAAGAGGTCGAGGCCATCAGACGAGAGACTGTCATCCAGCTCGCAGACGAGGACGAGACATCGACGATGGACTCGCCAACAAGCAGTCTTAGGGAGAGAATATACAAGTCTGTGTCCGAGCCACTCGCGCCACAGGACCCAAAGAAGACATCGCCAGCCGATGGCCACAAGTCGACACAGGTGGCCACCTCAAAGTCCCGCGCTGCTGACCCCGTGTCACCATTGCTGTTGTCAACAACATCAACACCAGTCACCAAGCCCAGCGGCAAGGGTAGCAAGATCATCATTCGTAGACGAAGGAATGCTGCGGCAGCAGCGTCCCATGATCAGATGAGCATGATGGCGCTCACACATTATCTCAACATCCCGCCCAACCCTGCCAAGCCACCAATCACATCCAACACAGCCAGCCTAACACAGCCGACCAAGGACTTTATCAAGACGCTAGTGTCGCTGTCCGACACTGGCAATGATATCATCCTGGACACTTCGCTGCCCACGCCCAACAGCTCACCGGACGCAGGCACCGCTCCCGATATTCAGTACACGCAACTGCGTACCCGCGCCATGAAGGCAGCTTTCAACGTGCTCTTCACACTGCCCAATCAAACATCGGTGATCATGCCATGTCAGAACACTGACACTATCGAGGCCATCAAGGAAAGGCTTGTGCAGTACATGTTGAAGGCATTTTGTACTACTACTACTACCACCCCGGCCACATCAGATGCGGCCAATGGCGAATCATCAGAGACAGACGAGTCGGCCTCCAATCCCGCCACACCACCCTCCCCTCCCATCAAGATCATGCCCGAGAACTATGTAATTGTTGACTACTTCAACAAGCCTCTCGAGAAGTCAATGACCTTGACCAAGAGCGAATATATAATGCACAGGAGATCACGTGGATTGCAGCCAAAGCTGAAGTTGGTTGAGAAGGTCAACTTCTACGACGCCGATCCTTCAACGGAACTCAGTGAACAGTCATACGAGATCATCAAACAGATTATACCCAATGTCAAGAGTTGGCATGGAGAAGAAGTGGACTACTTCAGACGCATCGCTGCACGTCTGCGTTACGAACTGTTGCCACACATCAAGGGAACTGTTCACTCATCGCTCACTGAACGTCTGTCCCCACTGCCACTTCCAACGCCTCCCAACAACAACAAGTTCCTCGTCTCCATCTTCCTTCCCATCCTCCAAGTCACCAGAACTGTTGAGATTGAGATTAACGAGATAGCAGATGATGTAATCGCAAGGATATTCAATAGGAACTATGCCAAGCATTTGCCACCACAGGTTAGTGCAGGAGACTTCATTCTCAAGGTGATGGGACGATCAGAGTACATTCATGGCACACACAAGATAACTGTCTACGAGTACATCCGATCATGTCTGGTACAGAGCAAGAAGATACAACTCGTCTACGTTCAAAGACCAACCATTGAGATGGACATTGCACCATTCAAGCCAAGATTCAATCTATCCAAAGAGTTGCCAATCAAACATGAGGTTGGAGCACTGTCTCATCGCGCACTGCCTTGGGATCATATGAATCACATCTCTGTTCGAGACATCAAGCGACCATTTAGGATCAAGGTGGGCGGCGCCTACAACATCCCAACGAGCTATCTGAGCAAGGAGGACGAGAGCATATCGGTGATCGTGTCAATCTCTTTGTATCATGGTGTCGAGTGCATATCGACCTCGTCCACCAAGCTTCAGAACATACTCCCGCCATCATTCTATGCCACGCCACCCGCATCGCTCAACGCCACGTGGAATGAGAACGTGACCTTCTCCAACTTGGACTATGCCAACCTGCCAATGGAAACACGTCTCTGCATTAGTCTTTACGCGAGCACTTCGTTCAAGACTCCCACATCGCCCACTGCCGCCTCATCCAACACCGAGCTCGACCAACAGCGCAAGGAGTCCTTCCCGATCGGATGGGTCAACGTCATGCTCTGTGACTACAAGTCGCAACTGCGCACGGGCCCAATGACCCTGCATCTGTGGCCGGATGATGTGGCCAATCCCCTGGCGCCCTGCTCCAGCAATCGCCAGAGCGGTGTCGCGCTGTTCATCGAGTTTGAGCAGTTTGCGCTGCCGGTGGTGTTCCCCTCGTGCAACAACCGCGTTACAAGCACCCGTCCCCACACCATCAACCCCAAGGACATGGTTGAGTTCTTTGAATCGATCATCAAGCTCGACCCGCTCAGCGACCTACCCAAGGAGAAGTACCAGCATCTGTGGGCGTTGCGACACTACGCCACCCAGTATCCTCAGCTACTACCGCGTCTCATGCTCAGTGTACCCTGGACACAGCCATCGGCTGTGGACGAGATCCACGCACTGATCGACAAGTGGGCCATCCTGAATCCCTACGATGCACTGGAACTCCTGGATGCCAAACACGTCGATCGCAAGGTGCGCGAGTACGCCGTGCGCTGTCTCGAGTCGCTCTCTGAGGAGGGCCTGCAAGATATCCTGTTGCAGTTGGTCCAGGTGCTCAAATGCGAACCCTACCACGACTCCCCATTGGCACGCTTCCTCCTTCGTCGCTCTATACTCAACCGCACGACAGGACATCACTTCTTCTGGTATCTCAAGTCCGACTTGCACGTCACCAACATTGCCGAGCGCTTTGGACTCTTGCTAGAGTCCTACCTCCTCGCTTGTGGCACGCACCGCAATGAGATACAGCGACAGATACAGGTCATCGACAGCCTGACCGAGGTGGCCAGGAAGATCAAGTCGCTGAAGGATCAAGATCGTCGCGAGACACTAATGCGCGACCTCGAGCGCATCGAGTGGCCCAAGCGCTTCCAGATCACACTGAATCCTAAGTTCGAGTCGAATGGTCTCATCATCCAAAAGTCCAAGTACATGGACTCCAAGAAGCTGCCGCTGCGGCTCTCATTCACAAACATCGACATGGATGCCGAGCCAATCGATGTGATATTCAAGGTGGGCGATGATCTGCGCCAGGACATGCTCACACTCCAGATGATCCGTCTGATGGACAAGCTCTGGCAGAAGGAGGGTCTGGATCTCAAGCTGTCGCCATACGGTTGCATTGCCACGGGTGATATGATTGGAATGATCGAGGTGGTGCTCAACTCTGAGACCACGGCCAAGATCCAAAAGAGTGCTGGTGGTGCCACTGCCGCCTTCAAGCTGGATCCACTCGCCAACTGGCTACTCAATCACAACAAGACCGAACAAGAGTATCAAAAGGCTGTGGACACATTCATTCTCTCCTGCGCTGGCTACTGTGTTGCCACCTATGTATTGGGCATTGGAGATCGTCACAATGACAATCTGATGTGCACAAAGCTTGGTAGACTATTCCACATTGACTTTGGACACTTCTTGGGCAACTACAAGAAGAAGTTTGGATTCAAACGAGAGAGAGCACCATTTGTATTCACGCCAGACTTTTGTTATGTGATGGGAGGCAAGGAGAGCCCCAAGTTTGCCCAGTTTGTAAACTACTGCTGCACGGCCTACAACATATTGCGTCGTCACGCCAAGTTGTTCATGAACCTCTTTGCAATGATGGTGTCCACTGGCATACCAGAGTTGCAATCGATGGAGGATCTCAACTACCTTCGCGAATCATTCTCACTGGAGCTCACAGACGACAAGGCCAGGGAGAAGTTCACATCACTCATACATGAGTCATTGACAACAAAGACCACACAGCTAAACAACGCAATACACATTCTGGCGCATTAA
>XM_013042216.1 Blastocystis hominis mRNA 
GGAGAACACCGCTCCTCAGACACGCGAAGAAATGTTGGCCGCTCTGAAGAAACAGATTGAATATTACTTCTCTAAAGAAAATCTATCGAAAGACTCTTATCTCCTTTCCCTCATGGATGATTCTGGCTATGTTCCTTTAAAGACAATTTCGCGTTTTCACAAGGTCCTTTCTCTTAGCAGCAATATTGACGATATTATGGAAGCCCTAAAGAGCTCTGAGAACGTCGTGGTGGACGAAGTTAGCAAACAAATCAAGCCTGCGATTACTTTTGAACGTAAAACAGTCATTCTGCGTGACGTCCCGGCCGAGGTTACCGAGGAAGAGGTCCGCGCCTTGTTCGACGGAATGGGCGTTGTCGAAAGTGCCACTAAAGAGTTTGAAGGCACGTGGTTCGTCGTGATGGAGTCGGAGGCGGCCGCCGTCGCGGCGCTGGAGCTGCTTCGCCAGCGTTCTCTCCACGACCAGCCCGTGAAAGCTCGTCTGAAGAACGAGTCGTACCTGAAGAACCTCGTGAAGATGCTGACGACCTCCGAGGACGGCATTCCCGCCGAATATCTCCCGGTGGACCAGTCGTACTTCATGAACTTCGGCGGCCAGCCCCTTCTGGACTTCCAGCAGAGCCAAATGTTCGGCCAGAACTTCGCCGTCCAGGCGCCGGCGACCGGCGTGCCCGCCGAGAAGCGCGGCCGGAAGGGCCGGAAGGAGTTCAAGCATCGCGAGCGTCGTCCGCGAGCCGTTTCGAAGCCGAAAGTGGTGCCTGCGCTGCAGAGCGCGGAGATTTTCCCGCCGCTGGTGCCGACGACCGCTCCGGTGGTGGGGTCGATCGACGTGAAGTACTCGTACAAGGAGATCTGCGACATCGTGAAGGGCGTGAAGGATCTGTCGTGCCCGCCGATCGCGTCGGCAGGCGTGGAGTCGGCGCTGGTGGAGACGGCCAACCAGGAGTTGGTGCAGAAGGGACGAACGTTCAGTATCGACCAGGCGCTGCAGCGAGGATGTCCGCGAACGATGTCGGTGGACAGCATCGACTACACGTCCATGCTGCAGGGAGAGATGGACGAGGCGGTCGCGGAGTCGGCTCGCAAGGCGCGGCGCGAGAAGAAGCGCGCGATGAAGATGGGCGAGCGAGGCGAGGCGCATGCTCGCAGCTACCGCAACATTCTCAAGAATTCCCCGCCCGTGGGTGAGGCGGTCGCTCCTTCGACGAAGCCTGCCGCTGTGCAGACAGTGAGTGGAGCCAATGCGGCTAATGCGGCTAATGCGGCTAATGTGGCTAATGCGACTAATGCTGCCAGCACTACCACTGGTGCCAATGCTGTGAGTCCTGTAAGTGGCACGAACGGAGCGGAGGGAAAGAAGGAAGGGAAGCAGCATACAAAGAAGTCGCAGAAAAAGGCGGCAGAAAAGAAGGCAGCGGAGAAGAAAGCAGCGGAGAAGGTGAAGAATGAGGAGGACGGATGGAAGACGATTACGGAGAAGAAGCATTAGAGACACTCATTGTTTATTCTTTTAATGTGTGGAAGAGTT
>XM_001589778.1 Sclerotinia sclerotiorum 1980 UF-70 hypothetical protein partial mRNA 
ATGAGTAATCTCCTCTGGAAATATTACCTCGAAGATGACGTCGATAAATTTCGACGCCTACTGGCAAATACTGCCTATTCATCGCAGCATACACTGAAAAGTCATGGTGGAGGAGGGCCGGCATTCTCCAGCAGCTTTGGGAACAAAATAGGGAGTTCAGGCGGATTTGGAACATCACCAAAGACTTTCGGCAAGAACCGCAAAACACCCGGTCCAGCTGGAAACTCAAATGGGAATAAAGGACAGGGAAATGCGATCAGCAAGGCAGAATTGAATAGCAGAGATTATGCTGGGTTAACTGTCTTACACCGAGCTGCATCTTCGACATCTACGAATGCAATAATCTTTGCGACCTCTCTTATCGAACATCCTTCCATCGACCTCTATATACAAGATACGGAAAGTGGGTGGACAGCGTTGCATAGGGCTTTATATTTCGGCAACGTCACAATTGCTCGAGCAATTATCGAGCGAGACTCGAAGGATCGCGCCGCTGGAAATACAGGAGCTAAGCCGGACTCTTCGGTTATCAAGGTCAAGGATAGGGAGGGAAACACCCCATTTGATGTATACAATGCAACTATCGCAAGGCGATCTCTGCTAGACCGAGGAGAGCAGGGAGTACCTCACCGTTCAGATGATGATTCTGATGAGGAGTTATTCGATTCACCGTCGAGCGAATCGTCAAAGTTCAAAAGTATCGATGGTGACGAACTTTATGCATTTGGTAGTAACAAGAACTTTTCATTGGGTTTCGGTGATCAGGATGATCGTCAGTATCCGGAGAAGATAACGCTTAAACGTCCTGACCATTTACTCTTTCGATTTTATCAAGAATACTTGGACTCTGTCTATGATCATAACCCTATTGGAAACCCAAAAATGCCCAAGACAGTATCTGAACTTCCTTCCATGATTCAAAATAAGCCCATCATCATACAAGATGTTGCTCTGTCCAAACTTAGTAGCGCTGTATTAACTACGGATCCGGAATCAAACCTTTACATGTGTGGCTTTGGCCCTGGAGGTAGATTAGGCATGGGGGATGAAACCACTCGTTTCAATTACGTGCCAGTAGATCAAGGCGGTTTGGCAGGAAAGAAGGTCGTAACTGTTGCTTTAGGTCAAAATCATACGCTTGCAGTCTCGTCGGAAGGAGAGATTTTCAGTTGGGGTACAAATACTTGGGGTCAATTAGGCTACAATCTACCTCGACCTGCGCTGAAGGATGAAGAACCACTTTGTACAACCCCGCGCCAGATATTTGGACCTCTGAAAAGAGAAATCATTATTGGCATAGCTGCATCTGCTATTCATTCAGTGGCCCACACGTCTACCTCATTGTTTTGCTGGGGAAAGAATGAGGGACAATTGGGTCTTATGGACTCTGACTCACGATCTTTGGAAGCTCAACCAATACCTCGCAGAGTTGCCGCATCTTTATTCAAGTCATCAATTGTAAAAGTTTCGGCCATTAGTGGTGCAACTATATGCCTCTTGGCAAACCATACAGTCTGTGTTTTCACGAATTATGGTTACAACATGGTCAAGTTTCCGTTGTATGAGGGCTTCACAAACTATCATTTACAAAGTACCTCGCTCACGACTCGATATGACTCAGAGTCAAATAATATCACTACTATTGAGTCTGGCGGAGATACAATTGCGGCTATATCTGGTAGAGGTGACTTGTTTACCTTCAATGTAAGGAAAATTGATACAAAAGTTGCGGCGGCTTCTACAACGAATCCCTCCAAAATTAAAGATGCTTTATCACAGCCGCAGCGAGTCTGGTCACTTCGCAAGGGTAATTGGGATGGAATAAAATCTGTTGGTGTCGCCGAGAATGGGTCCGTGATAGTTTGTACTCAGGCTGGAGCGGTTTGGCGACGCATCAAAAGAGCTAAGAATAAGGATGCTTTCACTGGGATCAGTGGTTACGACCGGAAGGATTTCAAATTTCAGCGGATCCCGGGACTTACTAAAGTAGCTGCTGTCAGAAGCAATCCTTTTGGTGTGTTTGCGGCCATCCGTAAGGACTGTGATGTGACCAGGACTCAAGTTGCAGTTGAAGATAAGACATTGTGGGATGATATTGCACCTTTGCTAAGTATCCGAGATCTTGTAGCTTCGGAGCATCCAGTAGAACAGGCGGGAAGTCTAGTAAACCCTCGCCTGGCAAATTTGGACATCGAATATGGCCCTGTCCTCGCGGCACTGATCATGTCTCCGGACATCGAGGAAGATGTCCAAGGCTTGCTCATGGGAGTGGATTCTGAGAGTGGTGGTTATGATGTTGAGATATGTTCCAGTACATCTGACATCGCAATACCTGTCCATGGCTTTATGCTGGCAGCTAGATCATCTGTCTTGAGATCACTTCTTGCCGACTCTCATGCCAACGGAACCACTTCACTGTCTAATATCCTCAACATTGAAAATAGTACGGGTGGTAAAAAGAGAATTATCTTTAACGGCATAGATTTTATCACCCTTGTCAATTTCGCTATCTTTCTCTACATTGACAAAATTGCTGATGTTTGGGCCTTCGCGAATTATCTCCCGAATATGGCCTTCAGACTGAGGCAGGTTAGGATTGAAATCATGAAGCTTGGTTCTCATTTAAATATTCCCTACCTAACTCAACCTGGACTTGTCAGAAGGCCCTCAGACAAATTGAACTCTGACATGGACAACGCTATTACAGACGAGAAATTCTTCGATAATTGTGATGCTATTGTTGAGTTGGATGGAGGAGAGATGCCTATTCACAGTGTGCTTGCATGTCAAAGATGTCCTTTCTTCGATGGTCTATTTAATGGTCGATCGGGAGGTCAATGGCTTGCTGGTAGACGCGCAAAAATCACAGATCCGATCAGCATCGATTTGAAGCATATTTCGCCTGATACCTTCGAACTGGTATTGCGTTATATATATGCGGATGTTGGACCTGAGCTTTTTGATGATATCGTCTCCACTAATATTGATGAGTTCTCGGAAATAGTTATGGACGTCATGAGTGTTGCGAATGAGTTGATGATTGATAGATTGTCTCAGATCTGTCAACAAGTGTTGGGTCGTTTTGTCAATACTCGAAACGTATGCAATATCATCAATGCCGTGGCACCTTGCTCAATCACCGAACTTAAAGACGCCGGCCTTGAGTATATGTGCTTGCAGCTGGAGTCAATGCTTGAGAATCGTTTACTTGATGATCTTGATGAGGACCTTCTCCTTGAATTAGATGAAGTCGTGCGTGACAATCAATTGAATTGTCTTCCATTCGCCAAAAGTGGACGAGCTGATCTAGATTTGCACGAGAAATATCCTGAATTGGCGGGGGACATTGATGAGGAAAGACGTCGCAGACTTGGAGATATGATCTTCCGTGCTCATCTAAGAGATGATGATAATCGAATATCTTCATCTTTCAAGGCACGTATGGGGAGTCTTGATGATTATTTACCCTCTCCAAGTAATGATAAAGCTAGGAGGAAATCAAGGGTGGTCAAGAACGAACCATTTAGCCCAAGTGTACGTCCTAAGGATGCAGCGGCTGATTTCATGTTTGATATGGATGACGATGAAGAGCCTGGTAGTCCACCTGAACTGAACTTGACTAACGACCTAACTTCTGCTTCCCCTGGTGGTCCAGTAACTCCAAGGTTCCCTACAACTGGTTCGACGCCTAAGGTTTTCGAGTCAGGATCTCCTACGGACTTTCGAAATTCTGTCGGATTAGGAATCAATCACAATCCAGACACCCCTCAAACTGGAAATAAAACTTGGTCTTCTCCTAATCTTTTAGTCAAGCTGGACATGAAAGATATTATGGCCCAAGCATCAACGAACCGTACTTCGAATTTATCAATGAGTCTCTCAGCTCAAAAGGCCAAGGATGAAGCGAATGCCAAATCATCTACCCCAAAACTTTCACAGAAAGAACGTAAGAAGCAACAGGCAGCTCTTCAACAAGCAATTGCACAAACTCCTGTGAACAAGGGTAAAGACAAGGCATCTTCTCCTTGGCAAATTGCAGGTGTGGGTTCAAAAACGAACCTCAAGGATATTCTTGATAAGGATAACAAATCTTCACCATCATCCTTAGCACCAAACCCAACAACCTCACCAGCTATCTCACCTTCAAGTACTACTTCAACTATACGTCGAGTCACGGCGCCAGATACTCGATTTGCTGGTCAAAAAAGGAATGATAATAACAGCATCACGAAAGCACAAAGATCTTCACCTGGTCCATCAAGGCCAAGCTTGTTAACACCAAGCAAATCGTCTCCACTTATTCCTCATTCGAAATCATATACAGCGCCAGCAGCGAAAGCCGAACCGTCACTACAGTTATCCATGGCTGATATCATAGGAATGCAACAAAGAGAGCAAGAAGTGATTAAAGAAGCAGTTGCAAAGCGAAGTCTTCAAGAAATTCAAGAAGAACAAGCATTCCAAGAATGGTGGGATCAAGAGAGTAAAAGGGCTCAAGAGGAAGAAGCTTTGAGGGCAAAGGCTTCTACTGGAGTTAGTAGAGGTGGTGGTAAGTCTGGTGGTGGTAGAGGAAAGGGTGGACCGAGAGGGAGAGGTGGAAGGGGAAGAGGTGGTGGGGAATCTGTTAGGGGTGGTGGTGGCGGAGGAAGGGGAAGAGGAAAATCTCAGGAAAAAAGTACTGGCGCGAATTAA
>XM_051905607.1 PREDICTED: Ctenopharyngodon idella intraflagellar transport 88 homolog (LOC127518647), transcript variant X2, mRNA 
ATAATTCGTTGGATTTTATCCCAGACGTTTATACGTATATTTAGAAATGTAATGTTAAAAGACAATATATAAAGACACGAACATAATCAATGTAATATCGAAACATTGTAAAATCTCTCTTGTGTGCCTAATGGCAACCCCTCTTTGTATCCTAGCAACCGATGTGTTGCTCAGCTTAGTTAGCGAGCTGTAGGTGCTGCTAGGCTACAGACACTATTTTTCGGAATATTTCAGCTTAATACGGCCATTAATTTGCATTTTTCTTAGATGGAGAACGTGCATCTTGTTCCAGAGGAAGAGGAGGATGATTTGTATACAGGCTACAATGATTACAATCCGACTTTTGACTCAGAGGACCTTCACAACGATGTGGGCTTTCAGCAGGCTGTCAGGACAAGTCATGGCAGAAGACCACCAATGACTGCAAAATATCCTGGCACTGCTATTGGAGGGCGACCGATTGGAACAGCTTATGGGTCTCGGATTCCTGTTGGCACTGCAATGGGAAGGCCTATGACTGGAGCTGTTCAGGACGGTGCGGCTCGTCCCATGACTGCAGTGCGGGCAGCAGGATACTCTTCATCTATAGCTAGAGGCTCGGTGTTTGATCCACTGGGACAAGCAAAAGGACCAGCCCCTCCATTAGAGAGACAGAACGAAGACACGCCAGAGGAAAAGATAAAGATCCTGGAAAAGAAGGTGAATGATTTGATAGAGGAGAGCTGTCTCGCTCATGCTCGTGGGGATCTTCAGCTGTCTCTAGAGAAAGCCAAAGAGGCGGGCAGGAAGGAAAGGGCTCTGGTGAGACAGAGAGAACAAACAGGCACTGCAGACCACATCAATCTGGATCTGACCTACTCTGTGTTGTTTAATTTAGCAAACCAATATGCCAATAATGACATGTACACTGAGGCCTTGAACACATACCAAGTCATTGTGAAGAACAAAATGTTCAATAATGCTGGACGATTGAAAGTTAACATGGCAAATATCTATTTCAAGCAAAAGAATTACACAAAAGCAATCAAATTTTACCGCATGGCTTTGGATCAGATCTCAAATGCCCACAATGCAATGAGGATCAAGATCATGCAGAACATTGGTGTTGTGTTCATACATATGGGCCAGTACTCAGATGCCATCACATCCTTTGAGTACATCATGAGTGAGAGTCCCAACATAAAGACAGGCTTCAACCTCATCCTGTGCTACTATGCCATCGGAGACCGTGAAAGGATGAAGAAAGCTTTTCAGAAGCTCATTTGTGTGCCCCTCGATATTGATGATGAAGACAAGTATATCCCTGCAAATGATGACTCTCATGCAAACATGGTGATTGAGGCTATAAAGAATGATAAGCTTCACCAAATGGAAAGGGAGAGGAAAGCATTAGCAGAAAAATACATTATGACCTCAGCCAAGCTTATTGCTCCAGCCATTGAGTCGTCATTTGCAGCTGGGTTTGACTGGTGTGTGGACATGGTGAAGGGTTCACAATATGTGGAGCTTGCAAATGACTTGGAGATCAATAAAGCTATTACATACTTAAGACAGAGGGACTTCAAACAGGCAGTGGAGACGCTAAAGATGTTTGAGAAGAAGGACAGTCGGGTAAAAAGTGCCGCTGCCACTAATCTATCTTTTCTCTACTTTTTGGAAAAAGATTATGACCAGGCTGACCGCTATGCTGAGCTGGCCATGAGCGCTGACCGCTATAACCCTGCTGCCCTCATTAACAAAGGCAACACAGTGTTTGTGAAAGAGGACTATGAGAAAGCAGCAGAGTTTTACAAGGAGGCTCTTCGTAATGACTCGTCCTGTACTGAAGCCCTCTATAACTTAGGTTTGACCTATAAGAGGCTGGGTAGGCTGGAGGAAGCCCTGGACTGCTTCCTCAAACTGCACGCTATCCTCAGAAACAGTGCTCAGGTCATGTACCAGCTGGCTAATCTATATGAGATGTTGGAAGACCCTCATCAGGCCATTGAGTGGCTGATGCAGCTCACCAGTGTGACCCCCACAGATGCCCAGGTGCTGGCCAAACTGGGAGACCTCTATGACAATGAAGGAGACAAATCTCAGGCCTTCCAGTACTATTATGAGTCGTACAGGTATTTTCCCTCAAACATTAGTGTGATTGAATGGTTGGGAGCATATTACATTGACACCCAGTTCTGTGAGAAAGCTATTCAGTACTTTGAGAGAGCTACCCTCATTCAACCAACACAGGTCAAGTGGCAGCTGATGGTGGCTAGCTGTTACAGGAGAAGTGGGAATTATCAGAAGGCACTTGAGACCTATAAGGACATTCATCGGAAATTTCCTGAAAATGTTGAATGTCTACGCTTCCTGGTCAGGCTGTGCACTGATATGGGACTAAAAGAGGTGCAGGATTATGCCACCAAACTGAAGAAAGTTGAAAAAATGAAGGAGATCAGAGAGCAGAGGGTGAGATCTGGGAGAGAGAGCAGTGCTCGAGGTCGCAGGGAAGGCAGCGCTGGCAGTGACAGTGGACAAAGCAACCATGGCACCAGCGCCAAGGGTGAGAGGCTTAGCGTTAAACTGAAAACTCTTCCCGGGTCCAATGAACCGTATGAGGCCAGCACTCAGCAGGAAATAGATGCTTCTTATGTCGATCCATTGGGGCCTCAAATGCAGAGACCAAAAACAGCAGCGAGGAAACGCACAGAGGAAGATGAGTTTGCTGATGAAGAGCTGGGAGATGACTTACTGCCTGAGTGACGTGTGCAACAGAGATCAGTTCAGAGGAAAGTCTGATATATGTCCAGACACTACATTTCTTTGAATTTCAAGCTCAACCAATAGCACTGTAGATTAAAAATACTTCATTGTTACTTCATTAAATTCTTCATTATGCTTTACTATATTTTATAATAGCAATGTATTGTACTTGCATTTAGGGAAAAATGAATTCTGTGCAATAATTTTTTCTTTCTTTCTGTATGACAGCATAAGACCTAGATAACATAAAGCTGAAATATAGTTGTTTTGTGTGAAATATTAAAGCCCAGTTTTATAGA
>XM_045586159.1 PREDICTED: Pipistrellus kuhlii protein SLFN14 (LOC118726237), transcript variant X2, mRNA 
AAAAATAGAGCTTTGAAATGAAATTGACCAGGATAGGAGGTGCTTGTATGATGTATGGAAATGACACGCAATCCCTTAGAGGTGAGCAGTGTAACTGGCTCTCATTTGAAAACGCCTGAATCTTCCCTTACTACCTAATTCACTCCAGAAGCCAAACTGCAGCCTTCGAATCTGCCCTGTCATAGGCTTTTCTTGAGTCCTTATCAGTCTTCCTCAGTGGGTCAATGTTATGAAGTCTGGGAGAGTCTGGCAGGGCTCCTGCTCCTCCCAGGCTGATATCAAAGAGCCACAGGACTGTGACAGAAAGCAAACATTCAGACCAAAGCCAGATGTGGAACTGAAACAACAAGAAGAGAAGCAAACGTATCAGCACACAGGGGCTGCTGAGATGGAAAGTCTCCAGACCAGTACGGAAATGCTCTATCCTGAGATAATTGTGGACGTGGGCACAGTGACTTTTGGAGAAGAGAACAGGAAGAACATGACCAATAATCAGTTGAAAAGGAATGAGAATTCTAAAATCATCCAAGCCGCCTGTGCACTGCTAAATTCTGGAGGGGGTGTGATCAAAGCGAAGATTGATGATAAAACCTACAGCTACCGGTGCCACGGGCTGGGTCAGGATCTGGAGACTTCTTTTCAAAAGCTCCTTCCTTCAGGTTCACAGAAATACCTTGACTACATGCAGCAGGGGCACAATCTCTTGATTTTCGTGAAGTCATGGAGCCCAGATGTTTTCAGCCTCCCCTTAAGGATCTGTAGCTTGCGTTCCAATTTATATCAGAGAGATGTGACTTCTGCTATAAACCTGAGTGCTAGCAGTGCCCTAGAACTTCTCAGACAGAAGCAGTATAGAGCCCAGAGAGGAAGACCCAGGGTGAAGGAGCGGCATCCTCAGAAGGTTCTTGACAGACACATTCAGGAAGAGGAAGATATGAGGCTGTCTGCTTCGGAATTTCTTAAAAAGGACAAACTCATGTATAAAGAGAAACTCAACTTTACTGAGTCGACACATGTTGAGTTGAAAAGGTTCACCACCAAAAAGATTGTCCCTAGGATTAAAGAAATGTTGCCCCATTACATTTCTGCGTTTGCCAACACTCAGGGGGGATACTTAATTATCGGGGTAGATGATAAGAGCAAAGAAGTGTTTGGATGTAAGAGAGAAAAAGTGAACCCCGACTTATTAAAAAAGGAAATAGAAAACTGCATAGAAAAACTGCCTACATTCCACTTCTGCCATGAAAAGCCGAAGGTGAATTTCACTACCAAAATCTTGGATGTATACCAAAAGGATGTCCTGTATGGTTATGTCTGTATTGTTCAGGTGGAGCCTTTCTGCTGTGTGGTATTCACAGAGGCCCCAGATTCGTGGATCATGAGGGACAATTTGGTCACAAGGCTGACAGCAGAGGACTGGGTGGCTATGATGCTGGATATTCCATCAGTGACACAGGAAGAGATACTATTTAAACCAGAATCCCTCTGTAAGACATTGTTCTCAGATCATAAAGAACTGGAGGAATTCATGAAGATGCAGATACGTCCTATCTCGCAGGGGATTGTGGTATTTTCTCGAAGCTGGGCTAATGATATTGGCTTAAGGAAAGAACAGAACGTCTTGTGTGATGCTCTCCTGATAGCGGTGAACAGCCCCCTGGTACTTTATACAATCTTGATACACCCCGGTGGGACCGAAGGGCCTGAATATGCCCGGAACACTGCTCGTCAGTTAAAGCAGAAACTGGGAACTGTTGGTGGTTACACAGGGAGAGTGTGTGTCATTCCGAGACTGCTGCACCTGCCCGGCACACAGTCTAGACCCTGTGGGACCCCTGTGCACTACCCTCAATCCTACCTGCTTGCTAACGAGGAGGAAATGGAAGACTTGTTGCAGGCCCTTGTCGTGGTGGTCTTGCTGTGCTCTCGTTCCCTTCTGAGTGACCGGCTGGGCTGTGAATTTTTCAACTTGCTCATAGAGGAGCAATGTGAGTTGCTGTCAGAGAGCCTTCAGGAGACGCGAGAATTGTTCATCCACTGCTTCCCAGGAAGCAGGAAGACAGCCCTAGCCATAAAGATCATGGAGAAAATCAAGGACCTATTCCACTGCAAACCAAGAGAGATCCTCTACGTTTGCGAACATGACTCCTTAAAGGATTATGTGGCCCAACAAACCACCTGCCAGGCCGTGACCCGGAAAACCTTCATGCAAGGGGAGTTCCTAAAGATTAAACACATAGTGATGGATGAGACCGAGAATTTCTGCAGTGTGTATGGTGATTGGTACAAGAAGGCTAAGGGTATCACCCATCCAGAGGGGAGGGGAGCTGGAAGGAAAAACCTTCACCATGGGGTTCTCTGGCTCTTTCTGGACCCCTTCCAAGTCCGTCATGCTGATGTCAACGGCCTCCCCCCTCCATCTGCTCAGTTTCCTCGGAAAACAATCACTAAAGGGATCCACTGTTCTCTGGAAATAGCAATGGTCATGAAACAAGAAATGAGGAAGATCAAAGAAAATCCTCCCTCCAACATGTTTCTGGACACACTGGCACTCTTCAGGGAAGCTGCCTACGAGGCAGCAATGTGTGCCCAGGCTCTTCCTGGGGTGTGTGAAACGGAGACCAACCTGACAATAGAACAAATCGCAAAGTACGTGGCAGAAAGATGTCACCACCTGTTCCAGTGTGGCTATCTGCCCAAAGATATAGCAATTCTGTGCAGGAGAGGGGAGGACAGAGGACGCTACGAGCTTGCACTGCTAAAAGCAATGGAATTAATTGAGACCCGCAGAGCCGCAGAAGTTGTGTTCAGCCAGGCCTCTGGTGTTTTGGGCAGTCACATCATTTTAGACAGCATTCAGCAGTTTTCAGGCCTAGAGAGGAATATTGTGTTTGGGCTTAGTCCAGAATGCACTCCTTCAGAGGAAACGCATAAGCTCTCCTTCGCCTCAAGAGCCATTAAACACCTCTACCTGCTTTATGAAAAGAGAACAGCCTTCTGAAAACCATTTCAAACAAAACAGGAAGCCAAAGGAGCAGAGTCCCTTCTCCTAGGCAGGCTGCAGGTACTCCTTTTCACATATTACAAATGGGAAGATCAAGGCACAATCAGTATGGCA
>XM_047948956.1 Puccinia striiformis f. sp. tritici uncharacterized protein (Pst134EA_017638), partial mRNA 
ATGTACCCTACAGCCGAAGATGCGGTGCCGTCAGCGATCAGCCGCGGGTCTATTAATTGTGTGTCGACTGACATGCGAGTATCAGAAGATGTTCGCCCGGGTCGGCTAGCCGAAGCTCAACGGGAGATCAGCGGCTTTCCCGAATCAGTTCCACTGCCACGGCCAGCCAACCAAGATGCGATTGATTGGTCCAGGAACATTGACCCAAGGATCACAGGGCTCAAGGAACTCAGGAGAGAAGAGCTGAACAGTGTTACTGCACATTTAGAACAGCTCGATCAATATGTCCAGGCTCAAGCTGAAGCCACGACGGATGCTATCACCAGAGACCCTCAAACTCTGGTTGGCCCTTGGTTTCAAGTCACGCCTGCTCGTCCAGGTCCACAAAGATCGAGTAGACTTGCAGAATTATTCACCAGAAGATCCAGTAAAAAAGCTGAACTAGATGATGGGTTAAGAGAGATCATCATGACCGACGTGATCCCGGTTTGA
>XM_046909055.1 PREDICTED: Gallus gallus pleckstrin homology like domain family B member 2 (PHLDB2), transcript variant X26, mRNA 
AGAGAGACTGACTTCTCTGGCTACTCATTCACAGAAAAGTTGTGCAGCTCAACAGCAATGGGCTTGAATTAAAAGCCTCAGGGAAATTCATAATGCACAGCCTGATAGTTTTCCCCCTCGCATGCATTTCAGAATGGTGCTTGCTTCTAATCTGGAGAATGCCCTTTCAGTACCTGCTGGCAAGTCACGCCACTTTAATTTCAGATTCCAGTAAGATTATGGCAGAGTATAACCACACACAAAACCAGATGGAATTACAAAATGCTAGTTTGGGAAAGGGTTCTGTGGTGAATTCCCTTGAAAACGGTCTCCAGGATATTATGGAAAACCTCAACACGAAGAAATATTCATCAAGTCTCAAATTTAAAACAAACGGGGACTGCGCCGGTTCTTACTTAACCCTTTCACAGCCTATGATGGCTAAACCCAGTCCTTCCACTAGTGTTAAAAATATACACTCTGTTACCAAAATTCAAGGAGGCAAGCTTTTCCCTTGTGAAAGTCCGTATCTTCCAGATAAAAGCTTCTCTGTAAAGCATTTGAGTTCCCTGTCGGGCACATCTCCATCCCTCAGTGGGTACAACTTAGGAAGGACAGACTTTGATATTCATGCCAACAGAGAAAATGAAAAAGCTCTTGGACACGCAGATAAGTTTTACTACTCTAAGTATAGCCAGAAAAACAAATCGTATGACAATGTCTACTTGCCAGGAATGCTGGACACAAAGAAGATCTCAGGCTCTCTTCTTACAATGTGGAACGGCAGCTCAGGGAGCGAGCTGATGCTTTCCCCTGTTAGCAATTCAGGGGCAGCCAGCATGCCTTCTAGTCCAAAGCAAGGTCGGAGGATGAATATTGAAGATGGCCTGGCCCTTCATGCAAAGCCAGTTAAACACAAGGATGTGATGATGGAGACTCTGGCCTCACGCCCTAGGAAATACTCTGGTGGATCTCTGAGTCATATGGGAATGTACAGTCGTTCCCTACCCAGGCTTCATAAATCAACAGAAAGCCAGTTGATGCCATTAAGTTTGCCCCCAAGAAACTCCTTGGGTAATACTAAAAGGAAAAAACTTGGAGAAAAGGATCTACCTCAGAATGCTTTAGATGCTGATAATTACCTGAATTTTTCTTCGTGCAGCTCAGGGGTTTTACCACATGCAAATTCGTTCTCTGGGAATAATCCCTATGTTAGTTCAACTCTTAGCGTTCCTGCAAGCCCTCGAATTGCTAAAAAAATGCTTCTAGCATCTTCTTCCTCGTATATTCCTGATGATTTTGATAGACTTGGACTCTCAGGAACGAGTCCCAGTAGTTCGTTCTCCCCTGTGGATTTTGACAGATCATTCTCTATCAGAAGAAACCTCTCCACCAGTTCCATGGAATTCGATGATACAGACTTGGAAAGTTACAGGCAGACACCAAACTCACTGCAGACCTCTGTGAGAGAGCGTAAGAACAGCATCAGCTCCATTTCAGGGAGAGAAGACCTCATGGACTATCACAGGAGGCAGAGGGAAGAGCGGCTGCGGGAGCAGGAGATGGAACGCTTGGAGCGACAGCGGCTGGAGACGATCCTCAATCTGTGTGCAGAATACTCCAAGTCTGACAGTGACCCTGCCGCAACTACAACAGTTGCTGATGTTCAAAAGATTAACAAAGAACTTGAAAAACTTCAGCTATCAGATGAGGACTCAGTGTTTGAAGACTCGCAGATGAATCTAGAAACGAGGTTTAGGAACCACCTGAAATCGTCTGCGAGTGATTCGGATTTCTCAGAGCCAAGTAACCACAGTCGGAGCACTGCTTCTTTCCTTTCCTCCCGGGGGCTGAGAGCCGACGAGCACTTCACTGACAACATGAAGCCTGCACCTTTAGCTGCCCCTGGCTTCCTGAAGGATTCCACTGAGTCTTCGTATCTAAGCATCACGCCAAAGATACCAGAATGCACAAGTGATGATCAAAGAGGACAGGAGCTCACTCGGCTAGAAGAGGAACGCATAGTAATATTAAATAACTTGGAAGAGCTTGAACAGAAGATCAAAGATTTAAATGACCAGATGGATGAATCCTCAAGAGAGCTGGATATGGAATGTGCCCTTTTGGATGGGGAACAGAAATCTGAAACAACAGAGCTGCTGAAAGAGAAGGAAATACTGGATCATCTAAACAGAAAAATAGCTGAGCTGGAGAGGAATGTTATTGGTGAAAAGGCAAAGGATGCTGATCTACTGGACATAGAAAGCAAACACTTTGAAGACTTGGAGTTTCAGCAGCTTGAACATGAAAGCAGGTTAGATGAAGAGAAAGAAAATCTGACACAACAGCTCCTGCGTGAAGTAGCTGAATATCAGCGCAGCATTGTCAGTAGAAAGGAAAAGATTTCTGCTCTGAAAAAGCAAGCTAATCATATTGTCCAACAAGCACAAAGAGAACAAGATCATTTTGTAAAAGAGAAAAATAACCTAATAATGATGCTGCAGAGGGAAAAAGAGAATCTCTGTAATCTGGAGAAGAAATATTCCTCACTCTCTGGAGGAAAGGGATTTCCTGTCAGTCCCAATAGTCTAAAAGAGGGCTATATCAGTGTAAGTGAAATTAGTGAGCTGTATGGCAATTCCACGAATATATCCCCTTCCACTCAGCCCCCCACAGATGCTGACGCAGGTACCACTGAGCCTTCCACGGCTGTGCTGACGAGCCAGCCACAAAATAAAGAGCATTTCAGAAATCTGGAAGAGCGAAAGAAACAGCACAGGGAATGCATGTACATGAGTGATACTTTGCCTCGCAAGAAAACAACTCCAACTGTGTCACCACACTTCAATAGTTCTACTCTTGGACGAAGCATTACATCTAAAGGGCATTTACCATTAGGACAGAGCAACAGCTGTGGCAGTGTACTTCCTCACTGCCTGGCAACCATGACCAAAGAGTCAGAATCAAGAAGGATGCACAAAGGGTATAACCATCAACGTATATGTGAAAACCAAAGGCAGAAATCTCCTGAATTCTACAGCAGAACAGCATCCGAATCCAACGTGTATTTGAATAGCTTCCATTACCCAGATCGTAGCTACAAGGACCATGCCTTTGATACATTAAGCTTAGACAGTTCTGACAGTATGGAGACAAGCATATCAGCATGCTCACCAGATAACATTTCCAGCGCTAGCACATCAAATGTCGCAAGAATAGAAGAGATGGAGAGACTTCTGAAACAAGCACATGCTGAAAAGACTAGGCTGCTTGAGTCCAGGGAACGGGAGATGGAAGCTAAAAAGCGAGCTCTGGAAGAAGAGAAACGCCGTAGAGAACAACTGGAAAAAAGACTGGAAGAAGAAACTAGCCAAAGGCAAAAACTAATTGAAAAGGAAGTGAAGATACGAGAGAAACAAAGAGCACAGGCTCGTCCATTGACTCGCTATTTGCCCATTAGAAAGGAAGACTTTGATCTACGAAGTCATATTGAAACAGCTGGTCACAACATAGAGACCTGTTACCACGTCTCCCTCACAGAGAAGACCTGCCGAGGCTTTCTGATTAAGATGGGAGGAAAAATTAAAACATGGAAAAAACGATGGTTTGTTTTTGACAGAAACAAGAGAACTTTTACGTATTACGCAGACAAACACGAAACTAAATTAAAAGGTGTAATTTATTTTCAAGCTATTGAGGAAGTCTATTACGATCATCTGAAGAATGCATACAAGAGTCCCAACCCACTACTTACTTTCAGTGTTAAGACACACGACCGAATATACTATATGGTCGCTCCTACACCGGAAGCCATGAGGATATGGATGGATGTTATTGTTACAGGCGCGGAAGGCTACACCCACTTCATGTTATAACAAAATGGGCCAATAGGGCATACTGCAATAATGTTAACATATGAAGTTAGCCATATATAGTAAAATCTGAAAAGCCACATAAAATACCAGTGAACACTCTGAAATATCCTCCTTATGATGTGCAGCCAAAGCCTCAGAACGGAAGGGTTTTCTAAATGCATTGAAAAGGGGGACTTGCTACTTATTTTAGTTGATCTTTGTAGAGACAAAAGAGCTAAAGCTGTTGAGAAAGTCATAGTGCTCCAAAACAAATCAACTGGCCACTTATGTGACAACATCTGGATTCAACAATAATTTTGTACCAGTTCTCTTAAACAGAGAATGTCTTCATCACCAGTTTATGAATGCGTGTGCTCTCATCAGTATGCAAAAATTCTAGTAGAGGAACAAAAAGGTGTAATAGCATATATTTTAATATGCAGCATTTGACATTTATAGACGATTAGGTGACTTTTAAAAACTTTTAGTCGAGTATTTTATAAAACTATGAATTAAAAAGCTGCCCTAAGGTACACACAGTTCTTGCCTTAGTAAAGTATTACAACAGAGCCAAAGAGTTATGTGACTCCCTTATTGTAATATTTCAGATTGTTAGCTGTATTTAACTTCCTGTAAGGGGACAGTGCCAAAACTCTTCATGACTTGTAAAGTAATTAAGTTTTTACAAAACTATGTTAAACCACCCAGTGATACTGACTGTCAGTTTAAAGTCTGTATCTATGAAGCTCAACAAGAAAAGGACAGCTTTATAAAGACGGATTTATCCACAAGGATATGAAATGGAAGCGTGGGTTAACTTTGTCATTAGGAGGGCTTTTGCAGTCTTCCATGCTGAATGGATTGAGCTGATTCTGGACCCTGCAGCGATTTTATGTAGTCAGGTCCCACCTGATGTGGTTCTGATCTTTCTCTGTGCCAAACGAACACTTTGCTGAAACCTCAGATGTTGGTCTCCATGAAGCAAGCACTGAAGTATCTACCTATCTAAATTCTTTGAAGCAATGTTTTTAGCCAAGGAGACTTTTTAAAAGTGTATCTACTCAGAATAATGCTATCAGAATAAAAATAGAAAAGCAAGCGCTAAGGGTTTACACTGAGCAGTGTATGGATAAAAAGCGTGAAAACTTTAAGTATCAGGGATTGAGATTCCTAAAACAACAAAAATAAGGAGGATACAGTGGTCTCCTATTTAAAAATCACTTACAAATTCCAAATCCTTGAGAAATATTGCAAAGCTTAAGTGAATTGAACTTCAAGAAAGTCTCTTATTCTTTGACTTTAATGAGGTTCTATTTCAGTCATCAATACTTGTGCTATGTAATTTGTTTGTGTAATAAGAGAAAGCACATTAGACATTTTTCTCGATGAAAAGCTAATGGCTTTTGATGAAGCAAGTGAAAAACTGAAAGCAAAACAAGTTTGCTGGCAAAATAATTTTGTTGTACTGTTTCAACCCTGTATCTGTTAAGAAGGGGATGCGTTCTTCCTTGTGTGGTATACACAGGCGATATGGTTGCTCTAGCATGACATTTGTCAGTTTTGACTTGAATCATGAAAGAAGGGACAGTTATCACAAGGTAACTGTTATCATCATGTGCAGATCACAGCTTATAATCCAACGATTTAAAAACACTATCAGAATAAATTGCTTTGGTATATGTAATTATTATTTTTTCCCTGACGTATCTTGATTTTACTTCTTAGCATAGTTATAAAGGTTTTCTAATCATGATTTTTGTATCCTGCATGATGCAATGAAGGCATTTCAATAAACGTTTTTAAAAACA
>XM_010693631.3 PREDICTED: Beta vulgaris subsp. vulgaris 110 kDa U5 small nuclear ribonucleoprotein component CLO (LOC104905180), transcript variant X2, mRNA 
AAATAATTAAATAAAACAATATTGAAGAGAAAAGGCAAAAAAAAAAAAAAAAAAACTCTCCACCAAAAACAAATATTTGTACCACCTTAACCTTAACAGCTTAACTTGAGTGTTGAGTCCATCTAAAACCCCAAATAACCCCATTTCACTTTACTCCCAAAATTCTCTCTCCTCCATTTCATCTTTCTCTCCTCTTTCCGCCATGGATGATAGCTTATATGACGAGTTCGGCAACTACATAGGTCCCGAGATCGACTCCGACCAAGACAATAATTCAGACACCGACATTCCTTCCGACGATGACGCCGACAAACGTCCTTCCGACGACGACAACACTCCTTCCGCCGCCGCCGGTCCCACCAACGGTTGGATGACAACCTTAAACGACAACAACGATGACGACATCGAAATGTTCGACAACCAGGTTGTTCTCGCCGAAGACAAGAAGTACTATCCTACTGCTGATGAAGTGTACGGTGAAGATGTTGAAACCCTAGTTGAAGATGAAGATGAACTTCATCTTGAACAAGCTATTATTAAGCCTGTTAAAACCCTAAAATTTGAAGTTGGTGTTAAAGATTCGTCTACTTATGTTTCTACTCAGTTTATGCTTGGTCTTATGTCTAACCCTAATTTAGTAAGGAATGTTGCACTTGTTGGGAATCTTCATCATGGGAAGACGCTTTTTATGGATATGCTTGTTGAACAGACTCATCATATTTCTACTTTTGATCCTAAGAACGAGAGGCATATGAGGTACACGGATACAAGAGTTGATGAGCAGGAGAGGAGAATTTCTATCAAATCAGTGCCAATGTCACTTGTTCTTGAGGACAGTAACTCCAAATCATATTTGATTAATATTATGGATTCACCGGGTCACGTAAATTTCTCGGATGAGATGAGTGCTGCTCTTCGGCTTGCTGATGGGGCTGTCCTGGTTGTTGATGCGGCTGAAGGTGTCATGGTTAACACTGAAAGGGCCATTCGACATGCAATTCAAGAACGCCTTCCTATTGTTGTTGTTATTAATAAGGTGGATAGACTGATTACAGAACTAAAACTGCCTCCTAAAGATGCTTATCATAAGTTGCGCCACACCTTAGAAATCATCAACAACCTTGTAAGTGCTGCCTCTTCAACTGCTGGCAATGTTCAGAGTATTGATCCGGCAGCTGGTAACGTTTGTTTTGCCAGTGCAACAGCTGGATGGTCATTCACTTTGCAATCATTTGCAAAACTCTATGTTAAACTGCATGGGGTAGCATTTGATGCAAATAAGTTTGCTTCTCGTCTTTGGGGGGACATGTATTACCATCCAGACAGCAGAACTTTTAAGAGGAAACCTCCTGTGTCTGGTGGGGAAAGATCTTTTGTTCAATTTATCTTAGAACCTCTGTATAAGATATACAGTCAAGTCATTGGTGAGCACAGAAAGAGTGTCGAGGGCACACTGGCAGAACTTGGGGTTACACTTCCGAATGCAGCTTACAGGTTAAATGTTCGGCCCCTGTTAAGACTTGCTTGCAGCTCAGTTTTTGGTACAGCAACAGGCTTCACTGATATGCTAGTTCATCACGTTCCTTGTGGCAAAGAAGCTGCATCAAGGAAGGTTGATCACATATATACTGGTCCAAAAGACTCGGAGATCTACAAGTCCATGGAAATTTGTGATTCATCGGGGCCAGTTATGGTTAATATCACCAAACTCTATCCAAAAGCAGATTGCAGTGTTTTTGATGCTTTTGGTAGAGTTTACAGTGGTGTGCTCCAAACGGGACAAACTGTTCGTGTGTTGGGAGAAGGATACTCACCTGAAGACGAGGAAGATATGACAGTGAAAGAGGTCACGAAGTTGTGGGTCTATCAAGCTCGTTATAGGATACCTATAAGCAAAGCTCCACCAGGTTCATGGGTTCTCATTGAAGGTGTCGATGCCTCTATCATGAAGACTGCTACACTTTGTAATGCTGATTTTGATGAGGATGTCTATATATTGCGTCCTCTCCAGTTCAATACACTTTCAGTGGTGAAAACTGCTACTGAGCCTCTTAATCCTAGTGAATTACCAAAAATGGTTGAGGGGCTTAGAAAAATCAGCAAGAGCTATCCTCTTGCTATCACCAAAGTTGAAGAATCTGGGGAGCACACAATCTTGGGCACTGGGGAATTATACCTTGATTCTATCATGAAGGACCTGAGAGAGCTTTATTCCGAAGTAGAAGTGAAGGTAGCAGATCCAGTTGTCTCATTTTGTGAAACGGTGGTAGAATCTTCATCAATGAAGTGTTTCGCTGAAACTCCAAACAAGAAGAATAAGATAACTATGATTGCAGAGCCATTGGAGAGAGGTCTTGCAGAGGACATCGAGAATGGTGTTGTGAGCATTGATTGGCCTCGAAAGAAACTGGGAGATTTCTTCCAAACAAAGTATGATTGGGATTTGCTTGCTGCACGTTCTATATGGGCTTTTGGTCCTGATAAGCAGGGACCTAATATACTGTTAGATGACACACTTCCCAGTGAAGTTGACAAGAACTTACTGAATGCTGTGAAAGATTCTATTGTTCAAGGCTTTCAATGGGGTGCTCGGGAAGGTCCCCTCTGTGATGAACCAATCAGAAACGTGAAGTTTAAGATAGTTGATGCTAGGATTGCTCCTGAGCCACTACATCGGGGAACTGGACAAATCATCCCCACTGCCCGACGTGTGGCTTATTCAGCTTTCCTTATGGCTACCCCTCGTCTTATGGAGCCAGTCTATTATGTGGAGATACAAACACCAATTGATTGTGTTTCCGCCATCTACACGGTTTTATCTCGGAGACGTGGCCATGTGACTGCTGATGTTCCACAACCAGGGACCCCGGCGTATATAGTGAAGGCATTTTTACCTGTGATAGAGTCGTTTGGATTTGAGACAGATTTAAGGTATCACACTCAAGGGCAGGCCTTCTGCCTCTCTGTATTTGATCATTGGGCTATCGTCCCAGGAGATCCACTGGACAAGAGCATAGTCCTACGGCCTCTTGAACCTGCCCCAATACAGCACCTGGCACGGGAGTTTATGGTGAAAACAAGGCGTAGAAAGGGTATGAGTGAGGACGTGAGCATCAATAAATTCTTTGATGAGGCCATGGTTGTCGAGTTGGCTCAACAGGCCGCAGATCTTCATCTACAAATGATATGAAGGATGTAGATAGATACTTTTGGGGGTTTTGAGATATACACCTGACCGTTCTGAATGTAGTTTCAATCAGTTACCCCAAATTCTTTATCACTTCATTGAAGCTGAGATGCTGCCATCAATTATATCATTCTTTCGCGAGTTTCAAAATTCA
>XM_037769526.1 PREDICTED: Sebastes umbrosus plectin-like (LOC119488165), transcript variant X1, mRNA 
GTCTGGGAGGAACCGGGACCGAGAGGTGGACGGAGAGAGACTGCCTGCTTGCTGTAGTCTCAGAGTCGCTTTGGCTGCAGCCGAGTCGGTGTCACAATGAGTATGTACGGGTCTCAGAAGGCCCTGAACATGGGCCGCAGGAACGGGTCCAAAGGAGACTTGAGCGGGATGCAGCAGTACGCACGGAGCGAGGTGGTGCACATGGGAGGCGGTAACGGATACGAACCTTACCTGGACGGATACAACACCTACAACTTCTCAAAGTCCTCTGGAGGCGGCATGGGAGAAATGTCGAGCAGCATGATGAGACAAATGTCGAGCGGTATGGGAGGCGGCATGATGAGACAAATGTCGAGCGGCGGCATGATGAGAGAAATGTCGAGCGGCATGGGAGGCGGCGGAACGATGACCAGGATGTCGAGCGGTGGAGGAGGCGGCGGAATGGGAGAAATGTCCAGCAGCATGATGAGAGAAGTGTCGAGCGGCATGGGAGGCGGCATGATGACCAGTGTGGATGGCGGCATGATGAGCGGCATGGGAGGCGGCATGAGTGGCTCCAGCACCATCCACCAGAGGGCTATGATCCTGCAGGCCCAGTGCCAGGAGTACCTGAAGAAAGCCGAATACGCCCTTCAGTCTGGCGGCGCCTCCGGTGACGCGGAGCGCTACATGTCAATGGCTAAAGAGACCATTGAGCAGCTGAAGGGCTACGCGATGGACCTGAGACAAATGGGACAGCCCAATGACAACGTAGTCAGGACTTTGGAGATATGTAAAGACCAGCTGAAGGGGGTCCACATGGTCATGACCGGCAGCCTGAACAGGAGGAGGAGCACCAGAGGGAGCTCCGGAGGCTGGGAGGAGCCTCCGAGGAGCTTCCAAGACGCTATGGGCTGGATTGCACAGCAAAAGCGTCTGATTGAAACTGCTTCATGGGGAGACGATCCTGCTGCCATCGAGCAGCAGCTCATCAACCACTCGAACTTTCACAGCTCCATCCAGAGGAGCGTCGAGGTGGAGCGAGCCAGAGATGAGCTGATGAAGAAAGGAGACAAGGGAAATCTTCACGCTCTGGATCAGGAGTGGGACAGTCTGCAGCAAATGTCATTTGGTCGGACCGAGCAGCTGCAGAACCTCAAGCGGATCATTCAGGATATGTCCAAAGAGATCATGTGGGTGAACGACAGGGAGGAGGAGGAGCTGATGTTTGACTGGGGAGACAAGAACATTGACCAGTACATCCCACGGAAACAGGAGAGCTACTCGAAACTGATGAGTGCCCTGGAGGAAAAAGAGAAGGACCTGAATAAACTGAAAGCCAGAGTGGACGGCCTCCTGAAGCTCAACCACCCAGCTTCAGACAAGATCGAGGCTTACAGGGACACTCTGCAGACTCAGTGGAGTTGGCTCCTTCAAATCACCAAGTGCATTGATGTTCATCTGAAGGAGAATGCAGCTTACAACCAGTTCTTCAAAGAGGCCAATGAGACGTACAGCGGCCTGCAGAAGGAACATGAGACGGTCCGGATGAAATTCGCTTGTGACAAGAACACTTCACTGGAGGACCTGATGGAGCTCCTTCAGGGACTAGAGAGGGAGAAGGAGAATATAATGGAAAACAAGAGGCAGGTTCATCATCTGGTCAACAAGTCCAGGACCATTGTGAGACTGAAACCCAGAAACCCTGAAGAGAAGAGCAGCACCCCCGTCATCGTCAAAGCTCTGTGTGACTACAAACAAGACCAGAAGGTGATCTGTAAGGAGAATGAGGCGATCCTAAAGGACAACAGTCAACGCAGTAAGTGGGACGTTACCGGCCCGGGAGGACTGGATATGTTGGTGCCCTCCGTGTGCCTGATCGTACCACCTCCCAACCCACTCGGCATCAGTATGGCCAACAAGAACGAGCAGTACTATGAGGCCATCCTGTCAATCTGGAGTCAGTTGTACATCAATGTTAAGAGTCTCATCGCCTGGCAGTACTGCCTCATTGATATCAGGAAAATCAACTCCCTCACCGTGACCATGCTGTCCCGCATGCGTCCCGAGGAATACCGCCAACTCATCAAGAGCCTGGAGTCTCGCTACGAGGAGTTCAAAATGACCAGCCACGGCTCCCAGATGTTTGCTGACGAGGACAAGAAGATGATTGAGAACCAGGTCACCGGAGCCCAGACCCACTATGACCAGATCGTGGTGGAGCTGCCTACTTACATTGCTCAACAGGAACACATAGAAGTACAGCAAGCGTCCGGCCAGCAATACCAACAGCAGCTGATCCTAGTACAGCAAGCGTCCAACCAGCAACACCAACAGCAGCTGATTCTATTACAGCAGCAGCAGCAACAACAAGCTGCCGCCGAAGCCGAGGCCAGGAGGCTCGAAGAGGAGGCCAGGTGGCGCGAAGAGGAGGCCAGGAGGCTCGAAGAGGAGACCAGGAGGCGCGAAGCGGAGGCCAGGAGGCTCGAAGAAGAGACCAGGAGGCGCGAAGCGGAGACCAGGAGGCTCGAAGAAGAAAGACGAAGAGCGGAGCTGAAAAGAGCAAAGAAAACGGAAGTGAAGTTGGTGAAGAAGGTGAAGGTGGTCACTTCTTCTGCTGCCCCTCCTGTCTCCTCCCACTCCTTCTCCTCCTCCTCCACCTCCACCTCCTCATCCTCATCCTCCCGCAGCTTAACTGAGCTGCATGCGCTCAGACTCAGGCTGGAGGCCTCCGAGGGCACGCTGAGTCAGCACGTTCACATCTGCCTCGGAGACGACTGGATGCACGACTGTGGCCTCAAGATATCTGAGCTAGAGATGCTTCTGCGTAATGTCGACTCGATGCGTGAGGAGCACTTGCGTCTGAGGGAGCATATCTTGAAGGAGCTGGAGGGCATGAATGATTCAGATAAAGCCCAGTTCCTCCGCAACGAGGTTGAAGTCATCAACCAGAGGCTGGGTAGTCTGGAGAGCAGCTCATCAGCTTACCTGGACCGGCTGAAGGCTCTAAGGGACATGCTGGAGAGTGTGGAACAAGCCGAAGACATAGTGAAAGTCCACGAGGCGAGACTGGTGGAGAAAGAGACCACCTCTCTGTCGCCCAACGAAGTGGAGGAATACATGTTGACCCTGAAGAATGTTAAAGCGGAGCTGGATCTGAAGAGGGGTATTCTGGCCACCATGGAGACGGAGCTAGCCAAGGCCAACCACTGGAGCGGCCAGCTGGGCGGGCCCTTCCAGAGGTGTGACATGATGCTGTCCAAATACTCTGAGCAGGTGGTTCTGCTGTCAGACCGCTGGAGACGACTCCTAGGGCAGATTGACACCAGAGTCCAGGATTTGCAGTCGTACCAGCCTCAGCTGGAGCACTACAAGCAAACCAGCACCTCCCTTATTGACTGGATTGATGCCACACGGACAAAACAAGACACCCTGCAGGCCACCAAGATAGAGAGCATCCAAACACTGATGGACCAAATTAACAACCAGAAGGCCCTGAACTCTGAAATCAAATCGAGGAGGGAGACAGTAGAGAGCGTGCTGAGGGACAATGAGGCCTGTGTGATTTCTATCAAGGATTATGAAACGGACCTGGCCTCTTACACCTCTGGTTTAGAGACGTTGCTCAACATCCCCATCAAAAGGACAATGCTGAAGTCGCCGTCGATGGACCTAAATTTGGAAGCTACACAACTGCAAACCCGTTACATGGAGTTGCTCACACATTCTGGTGACTACTACAAATTCCTGGGAGAGCTGCTAAAAAACATGGAGGAGCTCAAGATTCGTAACACCAGGATTGACCTGTTAGAGGAAGAACTTCGCCTGCTGAGGGAGGGCATGCGAGACCGCGACTCCAAGAATAAATCTCTAGAAGAGTCTGTTTCCCGTTATGAGCTGGAGTTGTCCGACTCGCGGGACAAGCTGCTGTCGATTGAGGAGGTGAAGCAAACCGCTACGCTGCAGTGCAGTGCCACTATGGACAGCCTGGACAGCACTCAGAGCCAGCTGGCAGACCTCAACGATGAGGTGACACGTCTCAACTACTTGCTTGAGGAAGAGAAGAGGAAGAGGAGGCTGGCAGAGGAGCGCTACACTACGCAGCAGGAGGAGTACGAGCTGGTGCTGAGGAAGAGGCAGAAGGAGCTGGACACGGTCAGCTGGTCCAAGGTGGAGATTGAGAAGAGTGTGACAAACAAGGATCACGAGATTGAACAGCTGCGGCGGCAGCTGGCTGAGGAGGCGGCGAGGATCAGGGAGCTACAGAAGGAGATGTCAAAGGTAAGGAGCCAATGCAGTATGGAGATCAATAACTTAAAGCTCAGCTACGAATCCCAGATCCACGTCAGCTGCACAGACATGCAGAGGCTGGCAGCCCAGAGGGAGGAGGATACCGTTGATGTCCAGCTGCGGTATGACAGGATGGAGGCAGAGAGGAGGAATCTGGAGGAGGAGCTCAGGAAGCTCAGGATGTCTCTGAGCCAGGCTGAGGAACAAAGGAACAGGGCAGAAGAAGAAGCTCACAGTCAGCGTGCTGTCATCACAGAGGAAGGGCGCAGGAGGAGAGAACTGGAGAGTCAGGTGGAGGTGCTGATTAGGCAGAGAGACGAGGAACGCAGCCAGTATGCAGAGGAGCTGGCTGAAGTCATGAAGAGGCTGCAGGAGAAGAGTGACGAGCTGGCCTACATTACACACAGCCTGGAGGAAGAGACCCGCAGGAGGAGAACTATAGAGGAAGGGCAGGATGTGTTCGAACAGACTCTGGCCCAGCTGCAGGTGAAGCTAACCAGTTCATCAGTGGCTGCAACCCAGCTGGGGGAGTGCGAGGAAGAGCTCCAGAAGATACGTATGGAGCTTGAGAGGGAGAGCAGGGAGCGAAGCAGAGTAGAGCAGAACATGAGCAGGCTACAGAGTCGCATGAAGGACCTTCAGGATGTGAGAGGTGGGCTGGAGAGCCAAGTGGAGAATCTGAGGAGGGCCAACCAAGAGGAAGTGTCCAGAAGAAGGCAGGTAGAAACAGAGCTGGAAAACACCACCAAGGCCATGACTGAGTACATCAGCACCGTTACCACTCTAAGCCAGAGCCAAGAGCACGCCAGCATGTCAGAAAAGAGAGGTGAAGAAGAGCGCCTTAGGTTGCAGGAGGAGCTGGAGAGAAGCTCGAGACAAAACAAGACCTCTGCAGAGCGCATGACTCAGCTGAGCGCCGAGCTGAAGGCCCTGCAGCAACAGCTCCTCCAGGAGCAGGCAGGAGGCAAAGAGGCAAACCTCAGGAATGAGGGCCTTTACAGAACTATAGAGGAGAAGAGTAAGGCCCTGAATGAGCGCTCTGGTGAGCTTCAAAGGCTGAAGGAGATGGCAGAAAGCCAGACCAAAGAAAGGCTGAGGCTGGAGGAGGAACTAAGCGCAGCACGACATGATAAAGCGGAACTCCTGAGATCCAAACAGGGAAGTGATGATGAGCTCTCCTCCCAGATTACAGCCCTGCAACTGCAGCTTCAAGCCAGTGAGCGCAGCAATGTAGATTACCGCAACCTGGCCTCAGAGCTCTCCTCGGAGAGGGAGAAACTCAAGCTGGAGACTGAGAAAATACAAAAGCAGGCCACCGAGACAACCACCATGATGCAATCCATTCAGTCCCAGTACAATGAGATTGTGAATGAGAGAGATGCTCTTTTGCTGAGACTGCAATTGTCAGATAAGGACAAAGATCGCTACCAAAGGCTAGAGGACGAACTCAGTCGCATTAAATTGTCCCAAGACTCTGAGCTTCGCAGTAAGCAACGTATACAGGATGAGAACGAGAGGGCGAAGAGGGATTCAGATTACTGGAAGGACCAGTTTGATAGTAAGCAGGTCCTGATCAGGCAATATGAAACAGACAAGGAACGTCTGGAGAGGGAAAAGAACTCTCTGAAAAGTGAGCTAGAGAGGCTGATGAGGGATCTGAGGGAGCTTGATGAGACATATAAAATCAGGCTGTCAGATATGCAGAAAGAACTGCGAGAGGTGGCTGTTGTCAGAAAAACCATGGAAACTGAGCTGATGAGAGTTAGAGAGCCCCCAACCTTGGATCCTTCCACTTTGGTCTTTGATGGAGTCCGTAAGCCAGTCACAGCAAACCAGTTGGTTGACTGTGGTGTTTTGGACAAACCAACACTTAGCCAGCTTGTGAAGGGGCATAAGACTGTGCCTGATGTCTCTGTCGACAAAAAAGTCAGTCTCAAAGGGACAGGCCCAATAGCCGGGGTGGTAATTCAAGGTCCGAAAGGTCCAGGGTCTTTTACAGGCCCCTTATGCAAAATGACTTTCACCGAAGCAAAGAAAGAGAATCTGCTACCACCAGATAGCGTAGACCTACTACTGGATGCTCAGGCTGCCACAGGCCACATAATTGACCCAAGAACTAATAGGAAGTTGACAGTTGAAGAGGCATGTGATCAAGGTGTGGTTGATGAAGAGGACAGAGAGAGGTTGTTGGCAGCAGAAGCTGCAGCTGTAGGATATTGTGGTCCTGGCACAAACAAACCCCTTTCAGTATTTCAGGCTATGACGAAAGGACTGATTGACAAGAACACAACACTGCGTCTGCTACAAGCCCAGGAGTCTGTGGGGGGCATCCTAGATCCCATACTCAGTGTGTTCCTTCCTAAAGACACAGCCATTGAGCGTAACCTAATTAATGATGACATATATCATGCTCTGAGTCGGAGGCCTGAGCTCTACCTGGACCCCGAAAGTGAAGATGGTGTAACCTATATGTCAATGAAGAGGAAATGTAAGGTAGAGCCACACACAGGCCTTCTGCTTCTTCCGATCCCTGAGAAGGTAGACCCCTCCAAAATTGTCTTTGATGGTGTTCGGAAACCTGTCACAGCCAAGCAGCTCCTTGATTGTGGTGTCCTGGACAAGCCAACATTTAAAGATCTAGAAAAGGGGAAGAAAAATGTCCCAGAGGTGTCTGTAGACAAACATGTTAATCTGAAGGGGACTGGACCCATTGCTGGGGTGGTAGTCGGACGTGAAGGAAAAATGTCTTTCTCAGAAGCCAAGAAACGGATGCTCTTGCCCCCAGATAGTGCAGATTTGCTACTGGAAGCCCAGGCTGCCACAGGTCACATCATTGACCCCAGAAACAATCAGAAGCTGACAGTAGATGAGGCATGTGACAGAGGAGTGGTGGATATTAAGGATCGAGACAGATTATTGGAAGCTGAAGCTGCTGCTGTGGGATACAAGGATTTTAGTGCAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAGAAGGAACTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCCCAGGAGTCTGTGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTTCCCAAAAATACAGCTATTAAGCGCAACCTTTTGGATGAAAACCTCCGTCAAGCTCTAAACCAGAGTCCTGAGTGTTACTGTGACCCAGAAACTGAGCGTGATGCCAGCTATGGAGCATTGAAGAAAAGATGCAAGACAGAGCCTCACACAGGTCTGCTACTTTTGCCAATCACTGAGAAGCTAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGCTTGATTGTGGGGTCCTGGACAAACCAACATTTAACCAACTAATGAAGGGAGAGAAAACTGTCCCACAGGTGTCTGTGGATAAGAAGGTCTTTCTAAAGGGGACAGGATCGATTTCTGGCGTGGCAGCTGGACCTTTAGGGAAAATGTCTTTCTCAGAGGCCAAAAAACAGATGCTCATGCCTGCGGAAAGTGCCGATTTGCTACTGGATGCTCAGGCTGCCACAGGACACATCATTGACCCCACAACCAATCAGAAGCTAACAGTAGAGGAGGCATGTGCCAGAAGAGTGGTGGAAAATAGGGATCGAGATAGACTCCTGGCAGCAGAAGCCGCTGCTGTGGGTTACCGGGACCCAAGCACAGCTAAGCCTCTTTCAGTGTTTGAGGCAATGAAAAAGGGATTAATTGACAGGAAGACTGGGCTACGGCTGCTGCAGGCCCAGGAGTCTGCCGGGGGCATTCTAGATCCCAATCTCAGTGTTTTCCTCCCCAAAGACACAGCTATAAAGCGCAACCTTTTGGATGAGGACCTCCGTCAAGCTCTAAACCAGAGTCCTGGGTGCTACATTGACCCAGACACTGAACGTGATACCAGCTATGGGGCTTTAAAGAAGAGAAGCAAAACAGAGTCTCACACAGGCCTGATACTTCTGCCAATCAATGAGAGGAAAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGTTTGAATGTGGAGTCCTTGACAAGCCAACATTTGACCAATTAGTGAAAGGCGAGAAAACTGTCCCAGCAGTGTCTACGGAAAAGACAGTCTATCTAAAGGGGACTGGACCCATTGCTGGGGTAGTAGTCGGACGTGAAGGAAAAATGTCTTTCTCAGAAGCCAAGAAACGGATGCTCTTGCCCCCAGATAGTGCAGATTTGCTACTAGAAGCCCAGGCTGCCACAGGCCACATCCTTGACCCTGAAGCTAATCAGAAGCTGACAGTAGAGGACGCATGTGCCAAAGGAGTAGTGGACATTAGGGATCGAGACAGATTATTGGCAGCAGAGGCTGCTGCTGTTGGCTTCAAGGATCCTAGCGGAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAGAAGGGACTCATTGAAAGGAAGACTGGGCTACGCCTGCTGCAGGCTCAGGAGTCTGTGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTCCCCAAAGACACAGCTGTAAAGCGCAACCTTTTGGATGAGGAACTTTGTCATGCTCTAAACCAGAGTCCTGAGTGTTACGTTGATCCAGACACCGAGCGTGATACCAGCTATGTGACTTTAAAGAGGAGAAGTAAAACTGAGTCTCACACAGGCCTCATACTTCTTCCAATCCCTGAGAAGGTAGACCCCTCCAAACTTGTCTTTGATGGTGTTCGGAAACCTGTCACAGCCAAGCAGCTCCTTGATTGTGGTGTCCTGGACAAGCCAACATTTAAAGATCTAGAAAAGGGGAAGAAAAATGTCCCAGAGGTGTCTGTAGACAAAAATGTTAATCTGAAGGGAACTGGGCCTATTGCTGGGGTTGTAGCTGGGAGTCAAGGCAAGATGTCTTTGTCAGAAGCCAAGAAAAAGGCACTCCTACCTGAAGATATTGCAGATTTGCTACTGGAAGCCCAGGCTGCCACAGGTCACATCATCGACCCCAAAAACAATCAGAAGCTGACAGTAGATGAGGCATGTGCCAGAGGAGTGGTGGATATTAAGGATCGAGACAGATTATTGGAAGCTGAAGCTGCTGCTGTGGGATACAAGGATTTTAGTGCAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAGAAGGAACTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCCCAGGAGTCTGTGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTTCCCAAAGATACAGCTATTAAGCGCAACCTTTTGGATGAAAACCTCCGTCAAGCTCTAAACCAGAGTCCTGAGTGTTATCGTGACCCAGAAACTGAGCGTGATGCCAGCTATGGGGCATTGAAGAAAAGATGCAAGACAGAGCCTCACACAGGTCTGCTACTTTTGCCAATCACTGAGAAGCTAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGCTTGATTGTGGGGTCCTGGACAAACCAACATTTAACCAACTAATGAAGGGAGAGAAAACTGTCCCACAGGTGTCTGTGGATAAGAAGGTCTTTCTAAAGGGGACAGGATCGATTTCTGGCGTGGCAGCTGGACCTTTAGGGAAAATGTCTTTATCAGAGGCCAAGAAACAGATGCTCATGCCTGCGGAAAGTGCCGATTTGCTACTGGATGCTCAGGCTGCCACAGGACACATCATTGACCCCACAACCAATCAGAAGCTAACAGTAGAGGAGGCATGTGCCAAAAGAGTGGTGGAAAATAGGGATCGAGATAGACTACTGGCAGCAGAAGCCGCTGCTGTGGGTTACCGGGACCCAAGCACAGCTAAGCCTCTTTCAGTGTTTGAGGCAATGAAAAAGGGATTAATTGACAGGAAGACTGGGCTACGGCTGCTGCAGGCCCAGGAGTCTGCCGGGGGCATTCTAGATCCCAATCTCAGTGTTTTCCTCCCCAAAGACACAGCTATAAAGCGCAACCTTTTGGATGAGGACCTCCGTCAAGCTCTAAACCAGAGTCCTGGGTGCTACATTGACCCAGACACTGAACGTGATACCAGCTATGGGGCTTTAAAGAAGAGAAGCAAAACAGAGTCTCACACAGGCCTGATACTTCTGCCAATCAATGAGAGGAAAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGTTTGAATGTGGAGTCCTTGACAAGCCAACATTTGACCAATTAGTGAAAGGCGAGAAAACTGTCCCAGCAGTGTCTACGGAAAAGACAGTCTATCTAAAGGGGACTGGACCCATTGCTGGGGTAGTAGTCGGACGTGAAGGAAAAATGTCTTTCTCAGAAGCCAAGAAACGGATGCTCTTGCCCCCGGATAGTGTAGATTTGCTACTAGAAGCCCAGGCTGCCACAGGCCACATCGTTGACCCTGAAGCTAATCAGAAGCTGACAGTAGAGGACGCATGTGCCAGAGGAGTAGTGGACATTAGGGATCGAGACAGATTATTGGCAGCAGAGGCTGCTGCTGTTGGCTTCAAGGATCCTAGCGGAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAGAAGGGACTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCTCAGGAGTCTATGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTCCCCAAAGACACAGCTGTAAAGCGCAACCTTTTGGATGAGGAACTTTGTCATGCTCTAAACCAGAGTCCTGAGTGTTACATTGACCCAGACACCGAGCGTGATACCAGCTATGGGACTTTAAAGAGGAGAAGTAAAACTGAATCTCACACAGGCCTCATACTTCTGCCAATCACTGAGAAGAAAGACCCCTCCAAACTGATGTTTGATGGAATCCGCAAGCCAGTCTCAGCACAGCAGTTGTTTGAATGTGGAGTCCTTGACAAGCCAACATTTGAAGATCTAGAAAAGGGGAAGAAAAATGTCCCAGAGGTGTCTGTAGACAAAAATGTTAATCTGAAGGGAACTGGGCCTATTGCTGGGGTCGTAGCTGGGAGTCAAGGCAAAATGTCTTTGTCAGAAGCCAAGAAAAAGGCACTCCTGCCTGAAGATATTGCAGATTTGCTACTGGAAGCCCAGGCTGCCACAGGTCACATCATTGACCCCAGAAACAATCAGAAGCTGACAGTAGATGAGGCATGTGCCAGAGGAGTGGTGGATATTAAGGATCGAGACAGATTATTGGAAGCTGAAGCTGCTGCTGTGGGATACAAGGATCCTAGCGGAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAGAAGGAACTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCCCAGGAGTCTGTGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTTCCCAAAGATACAGCTATTAAGCGCAACCTTTTGGATGAAAACCTCCGTCAAGCTCTAAACCAGAGTCCTGAGTGTTACCGTGACCCAGAAACTGAGCGTGATGCCAGCTATGGGGCATTGAAGAAAAGATGCAAGACAGAGCCTCACACAGGTCTGCTACTTTTGCCAATCACTGAGAAGCTAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGCTTGATTGTGGGGTCCTGGACAAACCAACATTTAACCAACTAATGAAGGGAGAGAAAACTGTCCCACAGGTGTCTGTGGATAAGAAGGTCTTTCTAAAGGGGACAGGATTGATTTCTGGCGTGGCAGCTGGACCTTTAGGGAAAATGTCTTTATCAGAGGCCAAGAAACAGATGCTCATGCCTGCGGAAAGTGCCGATTTGCTACTGGATGCTCAGGCTGCCACAGGACACATCATTGACCCTACAACCAATCAGAAGCTAACAGTAGAGGAGGCATGTGCCAGAAGAGTGGTGGAAAATAGGGATCGAGATAGACTCCTGGCAGCAGAAGCCGCTGCTGTGGGTTACCGGGACCCAAGCACAGCTAAGCCTCTTTCAGTGTTTGAGGCAATGAAAAAGGGATTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCCCAGGAGTCTGCCGGGGGCATTCTAGATCCCAATCTCAGTGTTTTCCTCCCCAAAGACACGGCTATAAAGCGTAACCTTTTGGATGAGGACCTCCGTCAAGCTCTAAACCAGAGTCCTGGGTGCTACATTGACCCAGACACTGAGCGTGATACCAGCTATGGGGCTTTAAAGAAGAGAAGCAAAACAGAGTCTCACACAGGCCTGATACTTCTGCCAATCACTGAGAAGGAAGACCCTTCCAATCTGATGTTTGATGGAATCCGTAAGCCAGTCTCAGCACAGCAGCTGTTTGAATGTGGAGTCCTTGACAAGCCAACATTTAAAGATCTAGAAAAGGGGAAGAAAAATGTCCCAGAGGTGTCTGTAGACAAAAATGTTAATCTGAAGGGAACTGGGCCTATTGCTGGGATCGTAGCTGGGAGTCAAGGCAAAATGTCTTTGTCAGAAGCCAAGAAAAAGGCACTCCTGCCTGAAGATATTGCAGATTTGCTACTGGAAGCCCAGGCTGCCACAGGTCACATCATTGACCCCAGAAACAATCAGAAGCTGACAGTAGATGAGGCATGTGCCAGAGGAGTGGTGGATATTAAGGATCGAGACAGATTATTGGAAGCTGAAGCTGCTGCTGTGGGATACAAGGATCCTAGCGGAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAGAAGGAACTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCCCAGGAGTCTGTGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTTCCCAAAGATACAGCTATTAAGCGCAACCTTTTGGATGAAAACCTCCGTCAAGCTCTAAACCAGAGTCCTGAGTGTTATCGTGACCCAGAAACTGAGCGTGATGCCAGCTATGGGGCATTGAAGAAAAGATGCAAGACAGAGCCTCACACAGGTCTGCTACTTTTGCCAATCACTGAGAAGCTAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGCTTGATTGTGGGGTCCTGGACAAACCAACATTTAACCAACTAATGAAGGGAGAGAAAACTGTCCCACAGGTGTCTGTGGATAAGAAGGTCTTTCTAAAGGGGACAGGATTGATTTCTGGCGTGGCAGCTGGACCTTTAGGGAAAATGTCTTTATCAGAGGCCAAGAAACAGATGCTCATGCCTGCGGAAAGTGCCGATTTGCTACTGGATGCTCAGGCTGCCACAGGACACATCATTGATCCCACAACCAATCAGAAGCTAACAGTAGAGGAGGCATGTGCCAGAAGAATGGTGGAAAATAGGGATCGAGATAGACTCCTGGCAGCAGAAGCCGCTGCTGTGGGTTACCGGGACCCAAGCACAGCTAAGCCTCTTTCAGTGTTTGAGGCAATGAAAAAGGGATTAATTGACAGGAAGACTGGGCTACGCCTGCTGCAGGCCCAGGAGTCTGCCGGGGGCATTCTAGATCCCAATCTCAGTGTTTTCCTCCCCAAAGACACGGCTATAAAGCGCAACCTTTTGGATGAGGACCTCCGTCAAGCTCTAAACCAGAGTCCTGGGTGCTACATTGACCCAGACACTGAACGTGATACCAGCTATGGGGCTTTAAAGAAGAGAAGCAAAACAGAGTCTCACACAGGCCTGATACTTCTGCCAATCAATGAGAGGAAAGACCCTTCCAAACTGATCTTTGATGGTGTTCGTAAGCCAGTAACAGCACAGCAGTTGTTTGAATGTGGAGTCCTTGACAAGCCAACATTTGACCAACTAATGAAGGGAGAGAAAACTGTCCCACAGGTGTCTGTGGATAAGAAGGTCTTTCTAAAGGGGACAGGATCAATTTCTGGCGTGGCAGCTGGACCTTTAGGGAAAATGTCTTTATCAGAGGCCAAGAAACAGATGCTCATGCCTGCGGAAAGTGCCGATTTGCTACTGGATGCTCAGGCTGCCACAGGACACATCATTGACCCCACAACCAATCAGAAGCTAACAATAGAGGAGGCATGTGCCAGAGGAGTAGTGGACATTAGGGATCGAGACAGATTATTGGCAGCAGAGGCTGCTGCTGTTGGCTTTAAGGATCCTAGCGGAGCCAAGCCTCTCTCAGTGTTTGAGGCCATGAAAAAGGGACTAATTGACAGGAAGACTGGGCTACGCTTGCTGCAGGCCCAGGAGTCTGTGGGAGGTATTCTAGATCCCAATCTCAGTGTGTTCCTCCCCAAAGACACAGCTGTAAAGCGCAACCTTTTGGATGAGGAACTTTGTCATGCTCTAAACCAGAGTCCTGAGTGTTACATTGACCCAGACACCGAGCGTGATACCAGCTATGTGACTTTAAAGAAAAGAGGTAAAACTGAGTCTCAAACAGGCCTGATACTTCTGCCAATCACTGAGAAGAAAGACCCTTCCAGACTGATGTTTGATGGAATCCGCAAGCCAGTCTCAGCACTGCAGTTGTTTGAATGCGGAGTGCTTGATAAGCCAACACTTAATCAGCTAGTGAAAGGGGAGAAAACTGTCCCAGCCGTGTCTATGGAAAAGATGGTATATCTACAGGGGACTGGACCCATTGCTGGGGTGGTAGCTGGACGTGAAGGAAAAATGTCTTTCTCAGAAGCCAAGAAACAGATGCTCCTGCCCTCAAATAGCGCATATTTGCTACTAGAAGCCCAGGCTGCCACAGGCTACATCATTGACCCTAAAACTAATCAGAAGCTGACCGTAGAGGAGGCATGTGCCAGAGGAGTGGTGGACATTAGGGATCGAGACAGATTGTTGGTAGCAGAGGCTGCTGCTGTTGGCTTTAAGGATCCTCGCGGAGCCAAGCCTCTGTCAGTGTTTGAGGCCATGAAAAAGGGACTAATCGACAGGAAGACTGTGCTACGCCTGCTGCAGGCCCAGGAGTCTGTGGGAGGTATTGTAGATCCCAATCTTAGCGTGTTCCTCCCCAAAGATACAGCTATAAAGCGCAACCTTTTGGATGAGGACCTCCGTCAAGCTCTTAACCAGGGTCCTGAGTGTTACGTTGACCCAGAAACTGAAAATGATGCCAGCTATGGGGCTTTGCAGGAAAGATGCAAGACAGAGCCTCAAGCAAGCCTGAAACTTTTGCCAGTCTCTGAGAAGAAAGACCCTTCCAAACTACTCTTTGATGGTGTCCGTAAGACTGTCACAGCACAACAGTTGCTTGATTGTGGGGTCCTGGACAAACCAACATTTAACAAACTAATGAAGGGAGAGAAAACGGTCCCAGATGTGTCCGTGGATAAAAAGGTCTTTCTGAAGGGGACAGGGTCAATTGCTGGTGTTGCAGCTGGACCTTTAGGGAAAATGTCTTTTACAGAAGCCAAGAAACAGAAAATTATGTCCTCGGACAGCGCTGACATGCTACTGGAAGCTCAGGCAGCCACTGGCAACATCATTGACCCCAGAACTAATGAGAGATTGACTGTAAAGGCAGCATGTGCCAAAGGAGTAGTGGATAAGGAGGATGAATCAAAGTTGTTCGCAGCTGAAGCTGCTGCTATAGGTTACAGAGACCCAAATACAGGCAAGCTCCTGTCGGCAGGCCAGGCCATGAAGAAGGGATTGATTGACAAGGACACAGCTCTACGTATACTTCAGGCTCAAGAGTCTGTAGGGGGTATTTTAGACCCTGCCCTCAGTGTATTCCTACCCAAAGACATTGCAAAGGATAGGGATCTCATAGATGAGGACCTATACCGGGGCCTGAATCAATATCCTGAGTGTTATTTGGACCCAGACACCCAACAAGCAACTACCTATGTATCTCTGAAGAAAAAATGCAAAGCAGATCCAAAAACAGGTCTTTTGCTTCTCCCTGAACCTAAAAAGCCAATAACTGTACAGGGGCTCAGGGGTCAGGTGCCAGTCAGAGATCTAGTGGATGCAAACCTATTAGACCGGTCAGATATGGACCAACTGAGAGAGGGCAGATTGACGAGCCAGGACATTGAAGACCGCCTGCACTCCTACCTGAGAGGTTCCACCTGCATAGCAGGAGTTTATGATGAGGCCAGTGATAAGGTGATGCCCATCTATCAGGCCATGAAAGATGGACTGCTGCAATCTGGGACCACACTGGAACTGCTTGAGGCCCAGGCTGCCTCAGGTTTTATAGTTGATCCTGTCAACAACCATTACCTGACAGTTAGTGATGCTTACAATAAAAGACTGTTTGGGCCAGAGTTTAAGGACCATCTGCTATCAGCAGAGAGGGCTGTGACTGGTTACAAACTGCCTGGTACAGACAAGATTATTTCCCTCTTTCAGGCCATAGAGAGAGGTCTAGTGGAGAAAGGTCATGGCATCCGTCTACTCGAGGCTCAGATTGCCAGCGGTGGTATCATTGATCCTGAACACAGCCATCGGATTGACGTGAACGTAGCCTACAAGAGAGGTTACTTTGATGAAGAAATGAACAAGGCCCTGACTGATCAGAATGTTGATACCAAGGGTTTCTTTGACCCCAACACAGAGGAAACCCTAGCTTATCTGGAGCTTAAGAATCGCTGTATCACAGATAAGAAGACTGGCCTCATCCTGTTGCCTATCACTGACAAGAAAAGTCAAGAATCGACTTCGAAGAACACTCTGAGAAAGAGGAGAGTGGTAATTGTAGACCCGGAGACTAATAAAGAGATGACAGTACGTGTAGCATATGACAAGGGGTATATTGACTACGACACCTTTGTGGAGCTGTCCGAGCAGGAGTGTGAGTGGGAAGAGATCACTATCACTGCTCCAGATGGTTCCATCCGCTTTGTTATCATTGACAGGAAGACTGGAAGACAGTATGACATTAGCGAGCTGCTTGAAATGCGAGTAATCAACCAATCAGATGTAGATAATTACCGATCACGTACCATCACCCTTACTCAATTTGCAGATATCATCAGCAACAAGACCAAATATGGGTCATCCTCATTATCATCATCATCATCAGCTTCAAGATCATCAGCAGCCGGAGGTACATCTTCAGTGACATCATCATCAACTTCAAGAACATCAGCATCCCCGGGTACATCTTCAGTGATATCATCATCAACTTCAAGAACATCAGCATCACCGGGTACATCTTCAGTGACATCTTCATCAACTTTAAGAACATCAGCAGCCTCAGTTCCATCGTCAGTGACATCATCATTGTCATCATCAGTCCTGTCAAGACCCTTATCATCTTCTCTCTCAAAGATGACCACAACAAGAACTTCCACTGTCACAGAGCGAAGCACCTCAACCTGCAGTGTACCTCGAGACTCAACTGACTCCCGTAGGAATATATCCAGCATATCTGTCACTCTGTCCTCTCCTATTGAAGTAATAGATGAACAGGAACCTGTGGGTGCCGTCTTTGACACAGACTGTATCGAGAAGATATCCATCACAGAGGCTCTAGATCGTGGTCTGGTGGATTCCATCACTGCCCAGAGACTGCTGGAGGCTCAGGCTTGCACTGGAGGAATAATCAATCCCACAAATGGCCATAGGCTCAGCATCCATGAGGCCACCCGCCTGGGCATAATAAGTGACAACATGGGCCCAAAGCTCAAGCCTGCCCAGAAAGCCTTCTTTGGCTTTGAGGATGTAAAAAACAAGAAGAAGTTATCTGTTCCTCAGGCCATGAAGGAGAGGTGGCTGCCATATGAGGCAGGGCAGAGGTTCCTAGAGTTCCAGTATGTAACAGGAGGGATTTATGACCCAGAAATGTGCTGTAGAAGAACCATAGATGAGGCTGTGGAAATGAAGTGGCTGGATTCGAGAGACGCCGAGAGGCTCCAAAACGTCAGAGACCACACAAAGAACCTGACGTGCCCCAAGAGCAAACTTAGGATCTCTTACAAGCAGGCTCTGGATAATTGTCTGGTGGAGGAAAGCAATGGGTTGAAAATGCTCCAGGCATCATCTGTGTCTTCCAGAGGGATCAGCAGTCCTTACAATGTCTCCTCTGCCCCAGGGTCCACCACCGGCTCCAGGAGTGGCTCACGACGAAGCTCCCGCAGGAGCAGTGTGGACCTTGGATCCCCCTCCTCCTCAGGAACTTATCACCACAGTGTTTCTAGCTTCACCACCTACTCTGCATCCTCCAAATAAATCAAGAAAATGATCTGCACATTCATGCTCTTTTCTTGCAAATGATTCCTTTTGTTAAAAATATACCGATTGTTCAGAAAATAACTTGTGTGTGTCGTATATGAGGAGAAAAAAAAAATTAAGATAATGTTCTTAAACTTTTTGCATAGTTTTAGATTTCTGCTTTGGTGTTGCTATGCTTTTAAAATGCTATAGTTCAAATGTTCGAGAAAATTAACACTTCCAAGATATTTTTTGTGGAAATGAACTAAAGTATTAATGGCAGCCATCTTATGGTATTTGGAATGAAAATAATGAGGATGTTAATATAATTTTTGGTGCCCCTAAAATAGGCTTAGAAATGATTACCATATTTTTGCATACAAAAAATAAGTTTTTCAAAATCTTCATGAAATGTAATTTCTTTTTAAGCTTTGCATTGGTCACATAAGGGTGCTATGTTTACATTTATTTGTCATCTGAAATACATGTTTTGTGAGGGGAGGGATACAAGGTTTGGTTACATATATTGGTTTAACTATTTGTTTTCTACTGAATCAGTTGTTAACTGTTGTTCTTTTGCTCTTTAGTGCTTCCGGTTTTGTAACAGTTTCTCAATATCTCCAAATAAAAGCGGTTGAGTCTTTAGCTCA
>KJ343209.1 Uncultured bacterium clone Evans.12.9_01824 16S ribosomal RNA gene, partial sequence 
TACGTAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTAAAGAGAACGCAGGCGGTCTTTTAAGTCTGATGTGAAAGCCTTCGGCTTAACCGGAGTAGTGCATTGGAAACTGGGAGACTTGAGTGCAGAAGAGGAGAGTGGAACTCCATGTGTAGCGGTGAAATGCGTAGATATAAGGAAGAACACCAGTGGCGAAAGCGGCTCTCTGGTCTGTAACTGACGCTGAGGTTCGAAAGCGTGGGTAGCAAACAGG
>XM_018460662.1 PREDICTED: Trachymyrmex zeteki zinc finger protein 830 (LOC108730757), mRNA 
GTTGCGTTCAGAATCATCATCCGAGTGTGCACCAAGATGTTGTTTTATCCTTATGTAAGGTAGATAACAAGGGTAAAACGACATCTGAGTGCATCTGGACGACAATTCTGAACACTGCCCAGCACTGCACTGTAGCCAATAGCTTCGATGGTACGAAGCACGGAGCATAGAAGCGCGATCAAAACATAAGTAACTGAACATAACCTACAAATCATTCGTTGTACGTAGTGATTTAACGAGTGAAAATTGGTGAAAATGTCCTTAAAAAGGAAACTGACGCAGGACGATCTGCGTAAAGCAATGAGTGAACACAAGAAGAAGTTCGGAACCATTAAAAAGATCGACTCACCGTTGGCAAAATATACAGATTCAGGACAGCTTATGTGCATTTTATGTAAGTCAGTGGTACGGAGTGAAACAATTTGGCCTGTTCATTTAAATTCCAAGGTGCACAAGGATAATGTTGCGTTAGCGAAAAAGACTAAACTAGAAACAGAAAGTACTATAAATGTATCTAATGTTCAAACATTCAAAAGGCCTCCGTCTCCATCAAACAATTCCCCAAATAAAAAGATAAAAGGAATATTGAAAAACTCTAGCCAGCCAGTGGTACAGGTCAAGTCAAATTTACCAGCAGATTTTTTTGATGATAATTCAGAGCAAGTTAACAATCCGTCTGTTCTAACGCAAAAATTAGAGAGCAAAGAGAAAGATCCCATAGTCAATACTACAGATGTACAACATGCCAAAGAAGAAGAAAAAGAGAAAGAAAAAGAAAAAGTAAAGGATATGAATCAAGCTGTTCTTCCAGAAGGATTTTTTGATGACCCAGTGATGGATGCTAAGGTTCGTAATGTTGAATACAAAGATCCTATTGAAGAAGAATGGGAGAAATTTCAAAAAGAAATTAAGGAAGAAACTGCGCAATCTGCACAAATTATAGCTGACGATCAGGAGGAAGCAACAACGGAAAGACAATTAGATGAAATTGAGGAACAAATTAGGCATTGGTCTAGGGTAATGGATCTCGCAAAACGTATGGAACAAGTGCAGGGTACCGATAGAAAACAGGAAAATATCGATAATGATGTATCAAGTGGTGACGAAGCCGAGTTCGACGAGTTTCTTGACTGGCGAGCAAAGAATTCGTATAAATGAAAGATTTTATATATCTAACAATTTTGTAA
>XM_003538860.4 PREDICTED: Glycine max probable serine/threonine-protein kinase PIX13 (LOC100777578), mRNA 
CGAAAACGACCCATGTTATGTAGCTAGCACTTGTGTTGTGTCTTTTCTCATTCCTCATCCTCAACCTTACGCAGCAGCCATTCTTGTAGAATTCATTTTCTCGAAATTGGTTAATTAAGTTAATTAACACTAAACACTAAACATGGGTCTTTGCTTTGCTTCCCTCGCTACCCACCAAACACCCTCCAATAATTCCCCTCACTATTCAGGTTCAGCGCGTGAGATGGGAATTACTGAAAGCACTAGTGTTAATGGAGGAAGCAGTAGCATTAATAGCAATAACATGGTGTTTCCGAGTGTGGAAACGCGGAACTTGAAGCAGTTCAATTTCGCGGATCTGAAAGCAGCAACCAAGAGTTTCAAGTCGGATGCATTGCTTGGTGAAGGAGGTTTTGGCAAAGTTTACAAAGGATGGTTGCATGAGAAGACACTGACACCCACCAAAGCTGGATCTGGAATGGTGGTTGCTGTTAAGAAGTTGAACTCAGAAAGTTTGCAGGGCTTTCGTGAGTGGCAGTCAGAAATCAATTTCTTAGGAAGGATTTCTCACCCAAACCTGGTCAAGCTATTGGGTTACTGTTGTGACGATATCGAATTTCTCCTTGTGTACGAGTTCATGCCAAAGGGAAGCTTGGAGAATCATCTCTTTAGAAGAAATACTAACAGTGAACCACTCTCTTGGGACACCCGAATCAAAATAGCTATTGGTGCTGCACGGGGCTTGGCTTTCTTACACACCTCAGAAAAGCAAATCATATACAGAGATTTCAAAGCCTCCAATATACTACTTGATGAGGATTATAATGCAAAAATTTCAGATTTTGGCTTGGCAAAATTAGGCCCTTCTGGGGAAGATTCACACGTGAGTACCAGGATCATGGGAACATATGGCTATGCTGCTCCAGAATACATTGCAACAGGTCACCTTTATGTAAAGAGTGATGTTTATGGTTTTGGTGTAGTGCTGCTTGAAATGCTGACAGGGTTAAGGGCACTTGACAAAAACCGCCCCATAGAGCAGCAGAATCTGATTGAATGGGCTAAGCCTTCTCTCTCTGATAAAAGAAAGTTGAAAAGCATCATGGATGAGAGGATAGAGGGTCAGTATTCAACCAAGGCAGCATTAAAATCAGCACATCTTATTCTAAAATGCCTTCAATGTGACCGTAAGAAACGTCCTCACATGAAAGATGTTCTTGACACATTGGAACACATCGAAGCTATCAAGGACAGAACGAAGTAATCCAAGAAACATTGTACTAAGTTTGCAACTATGTGCAATTTCCAATAGCCAATTTATCATCCTTATGTGTTGAATATGACAAGGAGCTCCAACATGTGTAGGCTGTAGCTAGCATACTAGTCACAGTTCAAGTTCAGTGTAACTACTAACTAACTTGGCTTACAGTTATTATAGGTAGTTAGACCTGTTACTGCATGAGTGTGTTTGTGGCTGTATTTGAGTAGTCGTACCTCTCTCATTCTAGCTTTGTTCCCTTGTCAATAAAAATGTGTAGCTCCTACTTGTATCATCATCTTTTCATTTAATTCAATAAAATGAGTTACTTGAA
>XM_039254146.1 PREDICTED: Hyaena hyaena mitogen-activated protein kinase 15 (MAPK15), transcript variant X3, mRNA 
GTGCTGCGGGCGTCTGGAGGCCCCCGGGCGCCCACTCGCCGGCATGTGCGCTGCAGACGTGGACCATCACGTAGCCCAGCGATACTTGCTCAAGCGGCGGCTGGGGAAGGGGGCCTACGGCATTGTGTGGAAGGCAGTGGATAGGAGGACCGGCGAGGTCGTGGCCATCAAGAAAATCTTCGATGCCTTTAGGGATAAGACGGACGCCCAGAGAACCTTCCGGGAGATCATGTTGCTCCAGGAACTTGGGGACCATCCCAACATCATCCGCCTCCTGGAGGTGATCCGGGCGGAGAACGACAGGGACATTTACCTGGTGTTTGAGTCTATGGACACTGACCTGAACGCCGTCATCCGTAAGGGCAGGCTGCTGAAGGACATCCACAAGCGCTTCATCATCTACCAGCTCCTGCGGGCCACCAAGTTCATCCACTCGGGAGGCGTCATCCATCGGGACCAGAAGCCGTCCAACATTCTCCTGGATGCCAGCTGCTTGGTGAAGCTCTGTGACTTTGGTCTCGCCCGCTCCCTCGGCGGCATCCCTGAGGGGCCTGAGGGCCCGGCCCTGACAGATTACGTGGCCACACGCTGGTACCGGGCTCCAGAGGTGCTGCTGTCCTCGAGCTGGTACACCCCTGGGGTGGACATGTGGAGTCTGGGCTGCGTCCTGGGGGAAATGCTTCGGGGGAGGCCCCTGTTCCCGGGCACATCCACACTGCACCAGCTGGAGCTGATCCTGGACACCATCCCGCCTCCATCCAAGGAGGACCTCCTGGCTCTTGGCTCAAGCTACAGCGCCTCAGTCCTGCCCCGCCCGGGGCCCCGGCCACGGCAGACGCTGGACGCCCTCCTGCCGCCAGACACCCCCCCGGAGGCCCTGGATCTCCTCAAGGGACTCCTGGTATTTGCCCCGGACAAGCGGCTTAGCGCCGCGCAGGCGCTGCAGCACCCCTACGTGCAGAGGTTCCACTGCCCCGCCCGCGAGTGGACAATGGATTCGGCCGTGCGGATCCCGGTGCTGGAAGGAGCTCAGCTCTCAGCCCCTGAGTACCGCAGCCGCGTCTATCAGGTGAAGTCCAGCGTGAAGGGGGCGGCGCCCTCCCTGGCCTCGCAGGCTGCCGCCCTGGGGGCCGTCCAGGCCCTGATCCGGAGCGACTGGAACCCGGGCCGTGGGGCGACGGCGGCCGGAACGCGACAGGTCCCTCGCGGGCTTCCGGCGGATGCCCGGCCCGAGCCCCGGCCCGGCCGGCGGATGTTCGGCGCCCCGGCCTGGCAGGGGGCCCAGGGCGCCGCGAGGGCCGCGCTGGGGGGCTATTCTCAAGCTTACGGAACCATCTGCCATTCGGCGCTCGGCCGCCTGCCCCTGCTCCCCGGGCCCCGCGCGTGAGCCGCCCGCCAGCCTCCAGTCCGGCTCCTGTACTCAGCCCGCGCCCCTCGCCCAGCTCTGGATTC
>XM_016250992.1 PREDICTED: Sinocyclocheilus grahami solute carrier family 7 member 2 (slc7a2), transcript variant X3, mRNA 
GGTTGAATAGGAAAATTAGCATTGCCTCCCTCTGTGTGAAGTGTCTCTCCTCCTCTTTGGCCAGACCAGCCCTCCTCGTGGGGGGCAGGGCAAGTTAAAGCAAACCAGAACAGAGTAAAGTAGGCAGTAAAACTAATGCGGTTGTGGGCTGACATGTCATTTGAGCTTGAGGAAGGAAGGGGCAAACTTTGGAAGGACTGAGCCTGTGAGCTTTTTAAAGAAATCAGTGGAGATCCCTGAGAGGTGTGTGTGTGTGTGTGTGTGTGTTTGCATGAAACCGTAAGACATTACGTCCATAAGGCAATTCTACAGCTGCCAGTCTCTCATCAGGTGTTTGTGGTAACAGGAAGAATGCTGGAACATTGCCTCGCATTTGGTCGCTCCCTTGTGAGGAGGAAGAATGTGGACCAGGACTGTCTGGAAGAGTCCAAGCTGTGCCGCTGCCTCTCCACTGTTGATCTGATTGCCCTCGGGGTGGGAAGTACACTTGGGGCTGGTGTCTATGTGCTCGCTGGGGAGGTGGCCAAAGGCAGTTCTGGCCCCAGCATTGTGGTGTCCTTCCTCATCGCTGCTCTGGCATCTGTGATGGCTGGCCTGTGTTATGCCGAGTTTGGTGCACGGGTACCCAAGACGGGCTCAGCCTATCTGTACAGCTATGTGACCGTGGGGGAGCTCTGGGCCTTCATCACAGGGTGGAACCTAATTCTGTCATACGTCATAGGGACGTCTAGTGTGGCGCGTGCCTGGAGTGGGACGTTTGATGAGCTTATAGGGGGCCACATTGAAAAGTTCTGCAAAATGTACTTCAAAATGAGTTTGCCTGGCCTAGCAGAGTACCCTGATTTTTTTGCTGTCTGCCTGATCTTACTACTGGCAGGCCTTCTCTCCTTTGGGGTGAAAGAATCAGCTTGGGTCAACAAAATCTTCACAGCTGTAAACGTGCTTGTGCTGATGTTTGTTATCATCTCTGGGTTCGTCAAAGGAGACTCGCTCAATTGGAATATATCTGAGGAATCTCTCATAAACGTTACCATTTGCAAAAGGAATCTCTCACACACTGCTAATGTCACTAGTGATTACGGAGCAGGGGGATTTTTGCCTTATGGCTTTAGTGGGACACTGGCTGGTGCCGCCACCTGCTTTTATGCCTTTGTGGGATTTGACTGCATTGCAACCACAGGTGAGGAGGTGAAAAATCCCCAGAGGGCCATTCCCATTGGGATAGTTATTTCCCTGCTGGTCTGCTTTCTCGCCTACTTTGGTGTTTCAGCGGCCCTCACCCTCATGATGCCCTACTACCTGCTGGATGAGAGGAGTCCCCTGCCTTTGGCTTTTGAATATGTGGGCTGGGGGCCTGCGAAATATGTTGTAGCAGCAGGATCGCTCTGTGCTTTATCAACCAGCCTGTTGGGTTCTATGTTCCCTCTTCCACGCATTCTGTTTGCCATGGCACGAGATGGCGTGCTATTCAGATTTCTTTCCAAAGTGAGTAAGCGTCAGTCGCCAGTGGCTGCCACTATGGCAGCGGGCACTACTGCGGCTATCATGGCTTTCCTGTTTGACTTGAAAGCGCTGGTGGACATGATGTCTATTGGAACCTTGCTGGCATACTCTTTGGTGGCTGCTTGTGTTCTAATCCTTAGGTATCAGCCGGATGCTGCGTTTGAGAGGTCTAGGATCAATGAAGGCAAGGAAGAGGTTGGTGAGTCTGAACTGACGGAGTCTGAGTCTCACCTGAACATGCTGAAGGATGGAAGAGTAACCCTGCGCTCTCTGCTCAACCCTCCACTGCTGCCCACTGAACAGACCTCCACTGCCGTCAACATGTCTGTTATAATCATGGTGTTTGCTGTGTGTGTTATTGGCGCACTCAACACATATTACGGACAGGCCATTATTGCTATGGAGCCTTGGGCCCTGGGGGTCTTAGGTGCATCTTTGTTCATCTTCATCATGTGCATCCTTCTGGTTTGCAGACAACCTCAGACGAGGAAGAAAGTTTCCTTCATGGTTCCTCTGTTGCCCTTTCTACCCATCTTGAGTATATTTGTCAACGTGTATCTCATGGTTCAGCTCAGCGGCGACACGTGGATCCGTTTCTCCATCTGGATGGCTATAGGATTCTTCATCTATTTTGGATATGGAATGTGGCATAGTGATGAACGTAAGAGACATCTACAGAACTGTGGTGTTGCGATGGAGAAAAAGACACTGACAGGAAATGAAGGCACTGTGGAATATGTGACGCACATAGAGAAGACTAGCCCATGTTAAAGAACAGCAGATAAAACTA
>CU677742.1 Synthetic construct Homo sapiens gateway clone IMAGE:100017471 3' read PBXIP1 mRNA 
GTACAAGAAAGTTGGGCAGCCCCGGTGGTGGTGGTGGTGGCTATGGCTGTGCCCCTCCCTGGGCCCCGCAGCTCTTGGGCTCTGTGAGTGCTTGTCCTTCTTCCCTGACCTCTTCTTCAGTGCTTTGTCTCCAAAGAAGTGGCTGAAGATGAAGTCCTCAAAGTCATCTACTTCATCATCATCACCTGTCTGTTGCACAGCCACCTCCTCCAAGCTGTCCTCCAGGGCATCCACAAAATCCCGGAAGCGGAGGCGGTCATGACGGAAGATGCCATCCTCACCAAAGAAAGCAGGTGAGAGGGGTAGCTCCTTGGTCAGCTGCCCAGCCCAGGGCAGCCGTGCCAAGTATGTTCTTAGCAGAGAGGCCAGCTCCTGTTGCCGCACTGGGGCTAGCTCTGTGCCAAAGAAAGTCAGGCCCTCCTGCCGGGCACACTCGTCCACACCTGAGCAGCCCTGGGGTGCCCGGTACTTGGGCCTCAACAGCTCTGCCCAGGATGGCAGGGGGTCATGGCTGTCCTTAGTCCCTTCCCTCCACCGAGGTTGCTTCTGCTTTTCTCCAGAGGAGTGGAAGCTACCACTTTTTCCTTGGGGGGTCCCTTCGGGCCCTGTCGCTTGCCCTCTTTCTTGCTCCCCCGACTCCTCCACCCTTGGCCTGCCCCTCCTTCCACCTTCCTGCTGGCCTCCTGTCCTTCTGGACCTCCCCCAGTCTTCTTTCTTTTCCCGGCCAAATTCTTCTTTTTTATGTTTCCGGTTTTAACCTTTCGGGTTTTTTGGCCCTCCCCCCATTTTTCTTTCCCCTCCCTCCCTAAAATTCGGAAGGGGAATTTTGGGGCCAGCCTTTAGGGTTTTGGAAAAAACCCGGGGTCTCGGCCCCGTTTCCCCGAGCCTGAATTATTGGGGCAAATTTGGGGCCCACTCTACACACCCAAAAAAAATGGGGCCCCCGGGGGGGATCTCGAAATCCCTTCCAAAATCTGGTGAAAACCCACGGCGGCTGCGGCCCTTTAATATTTGCATAAAGCGGGGCCCACCCACCAGGGTTCTTCTCTTTAGAAAGGAATG
>XR_001314002.1 PREDICTED: Thamnophis sirtalis uncharacterized LOC106555578 (LOC106555578), ncRNA 
GGACCTGCTGGGGGAGAAGGAGAATCTGGACAAAGAGGCGACCTTGGTGAAGCAGGTTTGCCAGGCCCTAAAGGATCTGATGGCAATCTTGGTGAACCTGGCTCACGTGGGCCCGAGGGAATCCGTGGCATGCCTGGCATAGAAGGATTCCGTGGGCCTCCTGGCCCCCGTGGTTTGCAAGGGGAAC
>XM_050835981.1 PREDICTED: Eriocheir sinensis PEST proteolytic signal-containing nuclear protein-like (LOC126983306), transcript variant X5, mRNA 
GCCCCCTGGGTCCCCATGGAGACGTCACTGGAGGACCAGAGGCTGCCTGCCCCCAAGCGGCCAGTGGAGGAGGAGGGGGAAGGGGAGGGGGAGGAGGAGCCTAAGAAAAAGATTAGTTTTGGGCTGAGCAGCAAACCTCAGGGCAAAAGTGGCCTCCCTGTCAAGAAGCCAATTGGTGGCATCTCCATCAAGCTGGGCCAGTCACAGGCAGCTGCACAGGCAGCTGGTGGTGCCTCCATCCTGAAGCCCAAGGTGGGTGCAGCAGCAGCAGTGTTCAGCACTGGAGATGAGGACGATGAAGATGAAGAAGAGGAGATGCCACCTGAGGCAAAGATGAGGATGAAGAACATTGGGAGGGACACCCCAACCTCAGCTGGCCCTAACAGTTTTGGCAAGACTAGGATGGGCTTCTGTGACTCAAAAAAGATCTACGAAAAGCAACTTAAGGAGGTGCAGGACAAAACTAACAAAGTAGTGCCAGACAGCGTGTAGGCAAGGTGACAGCCACTGCTGGCTGAAGCCCTGCACCTCACTTGGCCTGTAGCAGGGCAGGAGTGTGCCTGGCCTAGGCTGGCCTGTGCTAGGCTGGAGACTTGTTGGTTATTTGGACATCCCTCCTTTAGGCCTTAAGGTGTAGTAGTGCAGCCTGTCATCATCAGTTGTGTGTATAAATTGTAGCATAAAGCTCCAGGCTCGGGGTTGTAGCTGACTCACAGCACTGGTTGACATCTCGGGGGTTTGAGTGTGTGTGTGTGTGTGTAAACATTTGCTTGTATGTGTGTGTGGTGCATGCATGGTGGTTTTGGCTCTGCACCGGGAGAGTTTGGTTGTGTTAGAATGGGCTGTGTTTGCCAAGCAAGGAGTAGTGCTTTCCTCAGACAGGGACACACTGGTGTGGCCAGCAGTGTAGTGCTCCCCTCACTACTATGTACTGAGGCAGGACACACGGGAAACACCGGTGTTTATTTCAGCTTCTCGCAAGTACTGTGGTGTGCATAGAGTATTTCAGTTTCAACTGTTTCAGGCATGTACTTCATATTTCTTTGAGCGAACTTGTGGATGTTACTGACAGGGATTAACTCTATTAAACTCGACCATAGGCAGTGGTATGTGTCTAGAAGGAGTGAGGGATTGCCGACTTTTATAATTTGCCTGTGTACTTCAGGACATATACCAGTGATTAGGATTCAGGTTTTAGATTTTATCATGCATGCAAGCCAAGGAAAACTTGAGACTACATCTTCAACATCTTATAAAGGAGTATTGTGTCGACCTGTATGGATACTTTAGAAGCAGAGCAACGAGTAAGTGAAGATTTCAGCAGTTTATGTGATGAATGACTTTTATCATTATTACTATTCTGTGTGATAGTGCAGTTTGTGTATCTAACAACCTCATCCTACTGAGGGTCTCTGCGTACCCTCAGCAGCTGCATCACTGCAGAATTTATTGCCTGTCAGTCATTCCCTTGCCGTAGCGAAGGATGATGGCTGACTGGCTTGCCATCCATCTGGGGGCAGCATGGCTGAGTAATACATAGCATTTGTCTGCTTCATTTAGAAATTCTGTATAATGTTCTACATAGATGCATTTTCTGCTATCACCCAGAATGAGCCATTGTGACATTGATATCGAAACTGTAATATGTGTATAAAATATGTAGGGTGTTCTTAAGACTTTTGCACTCACAATGCATTTGGCTATGTTTATAACTACACATTTTGAGGATGTCCAGCTATAGACACAAACATGAGGCATCCACAGGAATCCTTGTAGGTGTGAATGATGTCTTGATTAAGGGAAGGCCAGAAAGGTAAGGTTCAAAAGTTATATTACAATTCATTACAGTAACATCAAAAAATATAAATACAGATTAGTCCTTGACTATACATCTGTCTAGTTTGGCAGTAAAGAAAAAGGCATTGGAAGCAGAGGACATCAACAACCCTCATACGGTATCAATCTTCAGTATTGTTTAAAATTGTAATACAAACATTAATTCCTCTTGCCTACTTTGTGGGTGCCTCATTGCTGGTTACAAGTAATCCTTCAGAGGTCTCATTTAATCCCTCAAAGGTGCCCTCCCAGCCAGTGTTTGCCGGCAGCACACAGAGCAGGGTGGCGGACACTTGGCCCCTCTTGGTGTTGCTGGCACTTGTAAATGTCCCAGCAGCAGTATTTCTAAATTGTTTGGGTTTGTTGTGTTGTAGCTGAAGTGTCCTCTGTTGGATGATACCACATATTCTTGCCATTCAGTTTTGTTTGTCTCTGCTATATGTGGCTGTTATTCATTTTATTTAGTCTGTCTGTGTAATTTAATTTGAAGTATGTGTGGTTGAGAGGTCATTCTACAATGTATCCATTTGTAATTTGTCATTCATCTCTACGGTCTGATGGATGGTTTTACGACTGTACAGAACCATGCAGTATTTCAAGGTTTCTTTCTGTTCAGTATTTGCCATTACTGTTGATTGTTTCTATTTGACCAAATCTGAAGTGGAAGTGGTGTACAAGATTTTAATTGACATACAGGTTGTCCACTTTCTTGAGCAAGTTGCATTTGTTCAGGACACCACCTGAGCTTTTTGTGTATTTTTACCTGAATGTTATTTAAGGGAAGTTACTCTCTGTATTCCTGGTGTTTCGGCTTCTTTGCCAACATCCACAGTCCATTCCTCTCAAGGTGACTTTGAATGTTTATCCTTATTGTTCTCATTAAGATTCACTAAACTGCCAGATGTAGGCTATCTGAGGCATCTGCTAAGTCCATGTATCATTATTACAAACTAACAGGGAGCATACGCCAGGGGGTGCATTTGCTTCACCCCGGCGGTCCCTCTGAGTGAACCCTCATGCAGTTACCTTTCCCATTCTAAGCCACTCCTGGCAGGATTGATCAAATTGCCCCACCCATGAGTTATGAGGATATAGGTTTTTTTTTATATAAAAGTTTGGTGTTCATTCAGAACAACATTGTTGTTCAGTTTTCTTCTGTCATAGCACTAGTGTTAATAATTGTGCCCATATTTTCTGTATTTTCTTATGGCTGTTCTGCTGTACCATTCCATGAAAGACAGCAGCTGCCAAGGAACAAGAGACTACCAAACAAATGAGCTGCACTAGATCACAGTAACAGCAGCACAGAGTAGCTGGCCAATGCAGGGTGCACCATCGCAGCTTCGCCAGGACCCCTTGGGGTCTTCATGACTCAGGTGACGGAAGCAGTGCATCCTGCCTGTGCTGCCCTGCGTCTTGTGTCCTGTGGTCTATACTCCAAACAACAACGTTCAGTCACTTGCGATGCCATACCAAACCTCTTCTTTCAACAAATAAAATTTCCCAAGATTTGTTAAAA
>KP395388.1 Uncultured bacterium clone MISEQ01_89_000000000-A647M_1_1111_13864_15148 16S ribosomal RNA gene, partial sequence 
AAGGAATATTGGTCAATGGACGCAAGTCTGAACCAGCCATGCCGCGTGAAGGATGAAGGTCCTCTGGATTGTAAACTTCTTTTATCTTGGACGAAAACGGGATTTTTATCTCAATTGACGGTACCAGAGGAATAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAAGACAGAGGGTGCAAACGTTGTTCGGAATTACTGGGCGTAAAGCGCGTGTAGGCGGTCGTGCAAGTCGGGTGTGAAAGCCCAGGGCTCAACCCTGGAAGTGCATTCGATACTGCATGGCTAGAGTCCCGGAGAGGATGGTGGAACTCTAGGTGTAGAGGTGAAATTCGTAGATATCGAGAAGAACACCGGTGGCGAAGGCGGCCATCTGGACGGTGACTGACGCTGAGACGCGAAAGCGTGGGGAGCAAACA
>XM_013051197.2 PREDICTED: Mustela putorius furo actin binding LIM protein family member 3 (ABLIM3), transcript variant X7, mRNA 
GTGGCGGCAGCGAGCGGCCGCGCCCCCCGCGCTGCCACCCCGCGAGCCCGCATCATGGATGTCGAGCTCTCCTATTTCGCTTTGCTCGCCTTGGAATTCGAGACTCCAGACGAGGACCAGGATTCATGAGCCGGTCGCAGGGGCCCAGGCAGGGGCCTCTGGCTCCCGACGCCGGCCGAAAGGTGATGAGTGAGGTCGGAAGATCGCAAGATTTAAAAAGCAACCGGGTCCTCCGTATCGAATGAAAGACCCAGTGCAAAGGCATCACCATGAACACGAGCATTCCTTATCAACAGAATCCTTACAATCCCCGAGGCAGCTCCAATGTCATCCAGTGCTACCGCTGTGGAGACACCTGCAAAGGAGAAGTGGTCCGTGTCCACAACAACCACTTTCACATCAGATGCTTCACCTGCCAAGTATGTGGCTGCGGCCTGGCCCAGTCGGGCTTCTTCTTCAAGAACCAGGAGTACATCTGCACCCAGGACTACCAGCAGCTCTACGGCACCCGCTGCGACAGCTGTAGGGACTTCATCACCGGCGAGGTCATCTCCGCCCTGGGCCGCACCTACCATCCCAAGTGCTTCGTGTGCAGCTTGTGCAGGAAGCCTTTCCCCATTGGAGACAAGGTGACCTTCAGCGGGAAGGAATGCGTGTGTCAAACATGCTCCCAGTCCATGACCAGCAGTAAGCCCATCAAGATCCGTGGACCAAGCCACTGCGCTGGGTGCAAAGAGGAGATCAAGCATGGCCAGTCACTCCTGGCGCTGGACAAGCAATGGCACGTCAGCTGCTTCAAGTGCCAGACCTGCGGCGTGATCCTTACCGGGGAGTACATCAGCAAGGATGGCGTTCCGTACTGCGAGTCCGACTACCATTCCCAGTTTGGCATCAAATGCGAGACTTGTGACCGGTACATCAGCGGCAGGGTCTTGGAGGCAGGAGGGAAGCACTACCACCCTACGTGTGCCCGGTGTGTCCGCTGCCACCAGATGTTCACGGAAGGCGAGGAGATGTACCTCACAGGTTCTGAGGTTTGGCACCCCATCTGCAAACAGGCAGCCCGGGCAGAGAAGAAGTTAAAGCATAGGCGGACGTCCGAAACTTCCATCTCACCCCCCGGATCCAGCATTGGGTCACCCAACCGAGTCATCTGCGACATCTACGAGAACCTGGACCTCCGACAGAGAAGGGCCTCCAGCCCAGGATACATCGACTCTCCCACCTACAGCCGGCAGGGCATGTCCCCCACCTTTTCCCGCTCGCCTCACCACTACTACCGCTCCGGTGATCTGTCAATAGCAACCAAGAGCAAAACGAGTGAAGACGTCAGCCAGGCCTCCAAGTACAGTCCAGCCTACTCCCCGGACCCCTACTATGCTGCAGAGTCCGAGTACTGGACCTACCATGGGTCCCCCAAAGCGGCCCGAGCCAGAAGGTTCTCATCTGGAGGAGAGGAGGAGGACTTTGACCGCAGCATGCACAAGCTCCAGAGCGGAATCGGCCGCCTCATTCTGAAGGAGGAAATGAAGGCCCGGTCCAGCTCCTACGCGGATCCCTGGACCCCACCCCGGAGCTCCACCAGCAGCCGGGAGGCCCTGCACACGGCTGGCTATGAGATGTCCCTCAATGGCTCCCCTCGATCCCACTACCTTGCTGACAGCGACCCCCTCATCTCCAAATCCGCCTCCCTGCCTGCCTACCGAAGGAACGGGCTGCACAGGACACCCAGCGCAGACCTCTTCCATTATGACAGCATGAACGCCGTCAACTGGGGCATGCGAGAGTACAAGATCTACCCTTATGAACTGCTGCTGGTGACCACGAGAGGAAGAAATCGGCTGCCCAAGGATGTGGACCGGACGCGTTTAGAGCGCCACCTGTCGCAGGAGGAGTTCTACCAGGTCTTCGGCATGACCATCTCGGAGTTTGACCGGCTGGCCCTCTGGAAGAGGAATGAACTGAAGAAGCAAGCCCGGCTGTTCTAGGCAGAGGCTCTATAAATATATATGCATTTATATAAAGATACATGTAAAATCTCTATACTGAAGCTCGGTATAATCCTCTCTTGTGTAATGGGACACACTGCCAGCCATGAGACTTGCTTTTCTGTACTGTCAGGCAAGCCCACGTCATCGAGATATTTTTATGCTCCTTACTTTCTCTTTTCTAAGTGCTCTGGGGTTCGGGAAGGGATTTGAGGAGACTCCCATCCTTTTACTGGGGATCCTTTTTATACTGAAACATCTGTCCTAACCTGAGTCCCCCAAGGTCCAACTCTCTTTCCTAAAGGAGGTGCCTGAAGAAGTCTCTCTTCTCTCTGCTTCTCGGCTCTCTCCCCAGTCTCCAGGGTGGATGCTGACCAGGCAGTTTCCACACCTTACTGGCCCCAGAGGGGCCCTCCCACGGGAAGATCCACAGTGATCTCCCAAAGTCACCGAGCACCATGGAGAGCCCGTGAAGAATTCTCCCATCTCCCCCATTTAGGAGTTCGGTGCCCTCTGGGGGTGATGCCCTTAGCTGTGTGGGCCTTGGATCTACTCACTACAGCAGCAAATGAAGTGGTTCGGGCCTGGGCCTCTCTGCAGCTTCTCAGTCCTCCTCCTCCTGCCCTTGGCCCTAACTTCAACCCAAGTCACATGGTAGGAGGAGAAAAGTCATTTCCCTTCCCTCCAACACCTCCAACTGGTCCCTTTGCCTGGCCCCGATGTGGAGATGAGAGGGAAAGCGTGGGAGCCGGCCACAGGAGCCGGAGCAGGGCACCTGTTGGAACTGGAGCTGCAGGACCTTTTGCAACCCTCCTCTCACCCTCACTGCCCCCAGCACCTCCTAACCCTTCCCCCCTTCAGAGGAGAGGCCCATTATTACGCCTTACTACGATCTATGTGCCTGACAACTCAACACACCACAGGGCTAACTTTCCCATCACAGTTCCAACAGAACAGCTAGACAACCTCTAACTCCCCTCCAAACATAATACAGGCCATGTCCCAAAGAAAGCCGCCTGGTCTACATCTGCAGGCCCCTGGGCTAGAAGGGCAACCGAAGCTGTCCCTCACCAGTCAGTCATTGGCTCCCACTGCAAAGTTGGCCATGTTTCCTAGGGGAAGCCTTTGGAAGAATGGCTGCTTATGGAATTCCAAAATGAAGCATTTGCCAACAGTGCGCATGACCACCCTGGATTTCCCCAGCGGCTGCCTTTCCTGCCCTCTGGCCTTCTTGAACAGCGATGAAAGCTTGACTTTAACTTCTCTCCTCCCTTCCCCCAAACCTTTGAACCCCGGCCCCCAGTTGGCTATGTGTGGTGGGGTCTGTTCCTCCCTGGAGATGCCTTGATGTAGATCATGTTGAGGTCACGGAGGGAAGACGAAGAAGTGGAAATAACCATTATGACTCTCAAGAGGCTGGTGTCGTGACCTGGCAAATAGAGAACTGACTCCAATCCAGCGAACCCTCACTGAGCCCCTGCTAACGCTGAGCACCTGCTGTATCCTGAGCACCGAGGGGGGAGGGAGGTGGGGACACTGAGATGATCAGCACGGGATCTGGACTGGGGGGCACGCCTGCTAGCACTGGGTGTCGTCGGACATGGACTCGCATGTGATGGACGTAAGGCAGGAAGTGATGGAGATGGCATGAGAACGTGTTTGTGGGATTACCGAGAGGGCAGATGCAAGTTGGTGCAGACCAAGGAACTTTCTGGAAGAGATTGCATTTGAGCGACATTCAGGAAGGATCTCTGTAAACTGAGAGGAGACTGTAACTTGAAAGGGTGACAGGGTGAGGGGTCAGAAGGGGGTCTAATATTCTCTCACTTAAAACATCAACCCTCTCTGCAACTCTCCTTTTGGCCAGTGTCTTTCAACTGTCCTGACCCTTTAGAAATGTCCCCAGCCAGACGCAATCATTGAAACTGCCTCATTATCACCGGTTGAGAACTTGGCAAGATGAAGGGCTTTTGTTATTGTTGTTGGGTATTTTTGTTTCCCATAAAAGCACATAATTCCAACCCA
>XM_039549112.1 PREDICTED: Corvus cornix cornix chromosome 2 C8orf34 homolog (C2H8orf34), transcript variant X3, mRNA 
TCAACGGGCGCCGGCGGCCGTGGAGCTGACAGGAGCCCGCGGCTATCGGCCTCGGCAGCGGCGCTGTGGCGAGCACGGCAGCGCCCGTCACCACGGCGCTGCTTGGCACAGAAACACAGACAGAGACGGACTGACAGACACACGCAGCGCGGAGCGGCGCGGGCTCGGGGGCCGCCTTTGCAGCTCCTCTCCTCCCTGCACCATGCTCCGCTCTAGGCAGCGCCCGCCCGCTGCTCCCTAAGGGCAGCCAGCCCCGCGCCCAGCTAAGCGGGCGACTGGCACCCGGCTCTCTCCCCCCCGCCCCCAGTTACCTGAGTTAGCTCCGTCCCGGGGACTTTCGCAGCGCCTCCGCCCTCTCCCGCTGTGGCAGCCCTTGTGCGGCGGGGGAGTGAGCCGCCCGCAGCCGGAGGGACTGCAGCCGCCGCCGGGGGAGACGAGCTCAAGCCCCCGCCCCCGGAGCTCTTCATGGCGTCTCATCAGCAGACAAGGATCCAAGCCTACCTGGAGAAGAATAAGATCGGTCCCCTCTTCGAGGAGTTGATGACCAAGCTGATAACAGAGACACCTGACCAGCCAATCCCATTTCTAATTGATCATCTTCAGTCCAAGCAGGGGAACCGCAGTCAGCTTCAGAGAACATTGTCTGGCTCTGCTGCCCTGTGGGCAGAGAGTGAAACATCAGAAAATAAAGGAACAAGAAGAGATTTTAGAAGTTATGATAAGCCTTGGCAGGTAAATGCAAAAAAGCCTAAAAAGTCAAAGAGCGACCTTGCTGTGTCCAACATTTCTCCACCATCACCGGAGTCCAAGTCATTGCCAAGGTCAATAGAGCATCCTAAATGGGATTGGAAGACAAAACCGGAGAACCATGATTTTGATGAACTAAATCATATTCTTCAAGAGAGCAAAAAGCTTGGAAAAGCCCTTGAGAATCTGTCTCGCAGCATTGCTATTTCTGATGAACTTGATAAGGACACAGCAGGTTTCAACACCCCCCTTCTCAGACCTCGTGTGATTGGAGAATGGATTGGCCGTGAAGAGAATGATGCAGATCCTCTGGCTGCTGAGATGTTGCAGCCACCAATACCAAGAAATAAAAATGAGCAGTGGGACAGTGAGGATAGCAGCAGTCCTGGAGGAAGCTTAAAAATGGAGCCAAAGACCAAAGGATTAAAACATCAACAGCAGCAACATAAGAAACTGCTGGCTGCCATGCTTTCTCAGGACTCCTTTGATTCTGCTCAAAGCACAGCTCCATCTGTAACCGAAGAAGACATTGACAATGAAGATGATGCAATGGAACTACTGGAGGATCTTGATGATCTCAGAATGGAAGGAGTAACAAGTGTGGTATCCTCTGGGAGCAAATTCAATCAAACTCGAAGTGCTCATATGGCTGAGCCTCAAGCAAAGGTCACATTGAATATATGTGCAAGATGTGCCAGATTGCAAGGGGATAATTTGGCAGAAAGGCCAGAAGATGTCTCCATGGTATCTCAGACATCTGAGCCAGCAGTGTCAGACTCTGATGCTCAAGTACCTGGGGTTGAAACACTCACAGAAGATATTGATGAATTTCAGAGTGCCTCTCAAGTGGCAGCATCTTCTCAGACAGTTTGGACCTTGGATGCCATGACTGTCAGACCTGGAGGTTCCCCAAGGCAGAAACTCCTAAAGGACTCCTTAGCAGCAAAAGAACTTCAGACCATGGAAAAACACCTAGCTGACATTGAGAAGGACCTCGCACTGTGGGAAGAAGCAAGGCTTTCAAGAAGCCCTGGTGTCCAGCATCCCAGTGTGGTTACCTCTGACCATCCAGGCACTCTTCAGGCTGCGCAGGGCCAAACCCCCAGGCCTCAGGTGCCAACTCCGATGGGGAAGAACATTCAGCTCCAAGGAAGCAAATCACCACCGCTGCCCACTAACAGCAGAACACAGGTCTCCAGTGTCACAAGCAGTAGACCTTCAACGCCTGCTGCACAAACCAACAGGCCATCAACTCCAGGGAGCAGACCTATGACCCCAAATAGCTTGTTGTCACGGCCTCTTACCCCTAGCAACCAAGGAAATAGGGAAGGCATTATTAGTATTCAAAGAAGCAGATCTTTGTCATCTAAGAGCCAAATGGGGAGGACCCTCAGTGCCGCTTCAGGGCTTTCTGTGCAAGATGAATTCTTACAACAGTTTCAACTTGCTCATCAACCTTGGATATTGCCAAGTGACACAGAAAGTGAAGGAGTGGAAGCTGACCAAGACAAATGTAAGTATATATGTAAGGACCAGATAATACATCAAAAACCGTCAACTTAACTTCTATTTTCCATATATTCAAATACTGTGGAGATGTCATGCCTGCTCACAGGAGCTTTTCTCACAAGTACCAATTACTTATTTGTCTGAGGGCTAGACCTTACAGGATTGATTTGCAGAAGCTTTCCTGCAGTCACTGAGCAATGACAAAATGATCACAGACCACACTTTACTTAATCTAAGTGAAACAATTTGTCCTGATGTGTTAAAGTAGCTATTCCAGAGAAGTAACCTGAACTTGAAATAGGCAGTCTGTTTAATAAATCTGTATTCACCAGCAAAAAAAAAAACAAACCCTAAAAAACTTCAGATCTGAAAAGCAGAGCCTCCCTTCTTAGGCCTGTCACTCTATTGTCTCTGTTTTGCTTGCATTCTTTTTAATTCATCTGTATTAATAAAAAAGTTCTTAATCATACAAGTAATCCTTAATATCCTACACTCTTTGAAGTATTTTTGTAATCATGGAAGTGAAGGTCAGCAGGATCAGAGCCTAAATGACAGAACAAGTAACTACAAGTAACAGGCTATAAATTGCAGTTCTTTCAAACTGTAGCAAGTTCCCCCTGCCTACAACATACCTGTAAATGATCTTACTGTTTCACATTTTCTTTAATTCACAGTAATTTTGTGATCTGCAAGGGTGAATATGCAAACTGTTTCCTAACAGATTTTAGGTGATACACTTGAAAAGAACAGATTATTTAATCAGCATGTTTAGAAAATTCAGTACTGGTTTAAACATGAAGAGTTAACATATGAAAAACACATTTTCTTTACAGAAGGGAACAATTCTATAAGGGATTAAGGATTCATAATAAACATGCCAGATAAACAGAATGTATTTTTACATTATGCTAGTTAAAAGAATTGTTTTCTACTCATACATCAGTTTCACAAATTCATACATAGCCCAGAGTTTGACTGAAATTTAAATTTATGCAGTGAGGTTCTGAAGAGCATGTGCCAGGTCTTTTTGAGCACTAGTAAAATGTTAAAATGAGATTGTGTGCATCCAGCTGATTTTAGTCCAAAGCCAGTAATATGACTTCCACCAGAGCCTTTCAGTTATCTTTGGACTGAAGCTCCCCTTAGGAGGCTCAAGAGATACCCTGTCACCTGCCTTTTATGTGCATGCAATTTTTCCTCTGTATTTTCTGTAATGAATTTACAGTCCTACAAACATTGGTTGGATTGGCTGTGCACACACAGACTGATGCCAATTATGTGACCAGGGAGACTGATGCTCCGGGACATATCAGGTACACAGCATGGTTTCTTATAGCTGCTGTACTTGAATTGTGTGGGTGTGAGGACTTGTGAGCACCTAAAATCCTGTACTGTAGTATTCCAAGAATCCTGGTAGGTCACTGTCACTGCCCAGAAAACAAAGTGTTAAGTTAAAAAAGTATGTTGTTAAGGTCAATGTCCAAATCCCTCTTGAACAGTGACAGACTTGAGGTAGTGACCATCTCCCTCAGATGCCTGTTCCAGTCTTTCATCCTCTCAGTAAAGGAATGCTCCCTAATGTCTAGTCTGAATCTCCCCTGGCACAGCTTTGAGCCATTGCCATATGTTCTGTCACTGAATACCAGGGAGAAGATATCAGTGCCTCTCTCTCCACATGCCCTCCTCTGGAAGCTGTGGACAGCAAGGTTGCTCCTCAGCTTCATTTTCTGCAAACTAGACAAGCCCAAAGTCCTTAGCTGCCCCTCACAGGTCATTCCTTCCAGCCCTCTCACCAGCTTTGTTGCCCTTATCTGGACACATTCAAGGACCTTCACATCCTTTTTAAATTATGGTGCCCAGAAGTGCACACAGTGCTCCAGGTGAGGCTGCACCAATGCTGAATACAGTGGGATAATCACCTTCTTGAGGAGCTGGTGGTGCTGCGTTTGATGTACCCCAGCATGGGGTTTGCCCTGTTGGCTTCCAGGACACGCTGCTGACTCTTGCTGTGCCTGCTGCCAGCCAGCACCCCCAGATCCCTTTCTGCAGAGAGGCTCTCCAGCCACT
>XR_008192058.1 PREDICTED: Gossypium raimondii uncharacterized LOC128035582 (LOC128035582), ncRNA 
TACATAATAGATATATATACAGTTTTTCCCTACCCTACCCGTCATCCTCTTTTCTCTTTATCCTCTCCCTCAATTTTCCTTCTTTTCCCTTCACCGTGTCTCCCATCTACCCTTTCTTCTTGCCACCCTATTGTTTAAGCTTTGATTTTTGTTTTTCCACCTACCTTGCTGATCGTTTTACCCTCCTTAATTAGCCTTATTTGCTACCCTAAGTCACCTTAAAGCCGCCCCTATCAGTCTCTTTTATTGCTCAATTGTCGCCCCTCTCCATTGTTGAAGTAGTGCCACTCTAAGAATTCATCTTTATGGCTGACAAAGATTCCCTCTTGTCTCGCCCTGTTCTGCATTTTTCTGTCGCCGTTTGTGGTGTTGCCGCCCTTTAAGACACCACCAGTTTGGACAGTCGTTCCCTTTTCAGTTACCACCCTTATATCAGTGTGCTTTTCGAGTTATTCTTTATTTATATCTGGTCTAAACGTTCTAAGTTGGCAAAGTAACCTAGGTGATCAATGGCTAACTCAGATCTCGGTAACGAGTAGTGCAAAATGTAGATTTGTGTGAGATCTCGCACTGTTTCGTTTTGTTGTTAAGTGATGCTATGGTCGAATACCCTAAGGCTTGGATATGGAATTTCGTTGCGGATTTTTGGGTATTTAATGTGATTTAGGTGCTGATTTGAACATCCCGGATCAACAATAAAACCAGATTTCATCCATGCCCTCGTTTCGTAGCAAATCAGTGCAAGTTGTTCAATCGAATTGAACCTAAAATTTTTGGCATGTAGCACTGATTTGGCCGATCCATTAAAGGGTGTTTCAAGGCTGGTTTTAATGGTAGTTAATGTGGTAGTTATTGTTATTTGGTGTTAGGTTCGATTAAGGAGTTAAATTTGGAACACAAACTTTTTCAGCTTAGTGCTGCGGATTTTTGATAATAAGGTGGGTTCTAACTTGTTAAAAAGTGCTAAAATTATGCTTTTAATGATTAAA
>XR_004466254.1 PREDICTED: Bombus vancouverensis nearcticus uncharacterized LOC117166512 (LOC117166512), ncRNA 
CCGTTTTTCATTATAATTACGATTATAATATATTCGTTTTAATTATAATTATGCTGTATTGTTGCGATATCAACGTACTACGTTGCGCTTTAAATTAAAACTTCTTTCTGTTAAAAAAAAGCATCGTTCCAAGTCGACTTCTTTTGTTCTTTCGCGGGATTCTTAGGCAAGCCGTCGCAGCCACGCTGCAGTTTACTAACCGAGCGTATATGCATGGATTTACCGACATAATCCAATAATATCGTAGGTTGCAGACACAAGATCGCGCTGCGTAATAAGTCTGGAAATTCTCATGGTACTCCGTATGAAAGCCCAGCGACTGTGGCCGTAATCTGCAACATTGCAGAATGCACAACTGCAGTGGAATAGCCTACAATTATAGAAAATCAAGCCGTAGGATTTATCAACACAGCCTTCACCAAATTATATCTGATTTATGCAGATTCGCAGAACATTTTACAGAGTCTAAAAATCTACTCCCTTAAAGCCGCGATAAATCAACACAATTTAAACAT
>XM_049312721.1 Wardomyces moseri uncharacterized protein (JN550_001527), partial mRNA 
ATGTCTAAAAATGGAGACATCAGAGGGTTCTTCGCCAAGGGAGCGCCGTCCAGGGCTCCTCCCCCGAAGGCATCGTCTGCTAGCAGCGTATTGCCTGCCTCCCCGCCGGCGGCCGAGCGGGCCCATCAGCCAACACCTACACCTTCGTCACAGCTGTCGATAGATCTCCCGTCGTCGCCTTTCACACCACAGAAGCAGCCCGTCAAGACACCTCTGACAAGGGATGACGAGATCAGGGGCTCAGACGACGAAGACGATGACTCGGATAGTTCTCTCGAGTCGCTCGGGGAGCTCCTGGGACGTAGATCTGGCCCGGCCACATACCAGAGGCCTACGGCGTTGACGACTACTCCCAAGGCCAAGAGGATTGCACCCAACAGCTTTCACCGGTCTCCTCTGACGCTGCAGCAGCAGCCTACTCACAAGTTCGACCTCAAGTCTCTCATCAAGCATGCGAGACAGGACGATGCTACCGAGCAGAGTGCTCGACGAGCTGACGAGCTCAGGGTGAAGGCGGACCAAGAGGAGCTCGAAGCTGGGCGTGATATGGCCGACAAAGCCAGGGACGTTTTTGGCGGCGAGGATGGGGAGAAGGGCGACAAGCTGGCCAGGGCTATTGACCGCACAGTAGGCGACGAGTCTAGACCGCGCTGCTATTTCTTCGCTCTGGAGGATGAAGCAGCCGCCGCAGGCGCTGGTCCCAGGCGGCCGTTCCCCAAAAAGGCAGCCAAGGTCAAACCGTGGACCTTGTTGCAGGATAGCAAGACCCGAGACCAGATGTTCATACGCGGGATGGTCAGCGCTGTGGCTGCAAAAGGGAAGGAGCTGCCAGACGAAATCTACCGGTGGATCCTCGACGAGATATGTATCGAGGAGAACCTTCAGCTGCGGAACCAGTATATCAGGTCGGCCGCGCTGTGTTGTGATGACACACGGCGTCTGGTTGACGAGAGGCAGCTCTATAAGATGCTGGAGAAGATAGGGGGCCAGAAGCATGAAACCTCGAAGCAGAAGTTCGAGCTATCGCCTGGGCTGCAGGACCCCTATTCGAGGAGAGACTGGTCTCCTCTTCGTCATTTCTTGCAACTACTGGCGGAGATGGCGCCCAATCTGACATCAAAAAATGCAACGAGCGCAGTGCAACTGCTTTTACGCTTAAGCCTCGACCCTGTGGTCGACAGGGCGCCGGGCGTTCGTGCCGAATACGCCAAAGCCATGGTCGCTCTAGAGTCGGCTCTACCTGCTCCAGAGGACCAGTGGGATACATGTTGCAAGAAGATATGCAATTATCTCCATCAAGGTGTAGACCAAGTGACGCAACGCCACATTGCCACCGTGATGCTGCCGACCTCTACGCCTCGACTGGCTGACTTGCAGCGTAGGCTGGCGACAGTAGCCCTCTTCGACGACCCGGGCCTGGGCGCCATACATCCCGACGAGTCCGTCACCATGCAGGACCTCTTCGCCCGCCTCGGGGCCAAGAATTTCCGCGTAAGACACTCGACCGACTTTGACGAGCTCAACGCGCTCCTCTCGCTGTTCGACATGGTGCTGGACCGCGGCTCGCAGTTCGGCCGGGCCTACCTGTCGACGACGCCTCTGCCGGCCCCCACGCCTCAGCCCAGGCTCGCACCGGCGCTGCCAACCCCGGCCTCGTCCACGTCAACCACGACGGCGGCGAGCACGGCCACGACGCCGTCGCCGCGGTCGGAGGCCGAGGCGGCGGCCCTGTTCGACGCCGACGTCGACCGGCTGCGCGCCCACCTCAAGGCGCTGCACGACAAGATCGCCGACAACAGCCTCGTGTCCAGCAAGGTGGCCAAGGCGTCGCTCGACGGCATGATGAAGCGGCTGGCGTTCACGGTGCGCAGCCGGCCGCCGCCCAAGAGCAGCATCTTCGACGAGGCCATCTACGGGAGGGAGAAGGAGGACGCGCATCTGCCGCGGCAGCGGGATTTCATGAAGAAGTGGAGCGCGGCGTCGAAGGGTGGCGGCGTAAAGAAGGATGAAGCTGACGATAACGAGGGCGCCGCCTGA
>KY685464.1 Uncultured Glomus clone M01338:4:000000000-A3V74:1:1101:10809:13957 18S ribosomal RNA gene, partial sequence 
CTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGGGATCAATACGTCGGTCGTGCTTCGGTACGTACTGGCGTCATTGATTTCTCCCTTCTGACGAACCATGATGTCATTAACTTGGTGTCATGGGAAATCAGGACTGTTACTTTGAAAAAATTAGAGTGTTTAAAGCAGGCTCGCGCTTGAATACATTAGCATGGAATAATGAAATAGGACGTTCGATCCTATTTTGTTGGTTTCTAGGATTGACGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACC
>XM_032084393.1 Aspergillus pseudonomiae uncharacterized protein (BDV37DRAFT_269601), partial mRNA 
ATGTCAAGCCTTGTCATCGGGACTGCGCCGGAGGGTCTGGACTTGTCCGAGGATAGAATCGCTCAGAATGACGCCACTGTTGGTGTTGTCATGGGAATTGCCACAATTTTTGTGGGTTTGCGATTCTGGGCGCGAACGACTAATAAGAGTGCCAATTTAGCATATGATGACTGGTTTGTCTTGGTAGCATTGATCATCTTCGCTTATGTTATTCTGTATGCCACGACAGTGCCTATGGTCAAATTGTCCGTGCTTCTTCTCTATCGCCGGATTTTCCGCCTCACCTGGACGTTGTATTTCTGTGCATTTCTCTCCATCGGATATACTATCTCAGTTGTTACTACCATCTCGCTGGCTTGCGTCCCCTCATCTTTCTTCTGGACTCAATGGGTATATCCTTTGAGTGGAGGCCACTGTCGGATCAACCTCTATCAATTCTATTTGTGGAACGGTGTGGCCAACTTGTTCACCGATGTCATCATTTTATGCCTGCCCATGCCGATCGTCTGGGGCCTGCAGATGCCCAAGGCGCAGAAATGGGCCATTAGCGGTATCTTCCTGCTCGGTGGATTTGTCTGCGTGGCCACGATTGTCCGCATCTCCGCCATCACGAAAATGAAAGATTCCGTCGACATCACCTGGGTAATCGGCGACGCCATGATCTGGTCCAACGTCGAGCCCTGCATCGGTATTGTCAGCGCGTGCCTACCGACTCTGCGGCCCCTCCTGCGCCAAATTCCCCAGCTAAGAGTCTGGGGGCTTTTCGGCAGCAGTGGACTCTCGGGCAATTACAAGATGACCGGCGACGGCACTTCCGGCACGGGACAGCAGGATACCGGCAACCGATCGGCATATCGGTCCTCGACTGGTAAGAAGCAGCGATTCTGGCCAGAAGATGACGAAATCTACCTGACTACCGACGTAGGACGTGCTGCCAGAGAGGAAGGCGTCATCCCGTCCAACGGCTCCGCTGCCTCCAGCCAGGAACCCATCGCTATGCAGATCAGGGTGAAGCAGAACTTCGATTGGAGGGAGGACCACCCATGA
>XM_048215029.1 PREDICTED: Ursus arctos zinc finger and BTB domain containing 20 (ZBTB20), transcript variant X11, mRNA 
GCACCCAATGTGGGCCTTCTGCCGAAGAAGTAGGGGCGGGGGGAAGTTTAGGAGTTGAGGAAAGAAGATTAAAGAGCGCGAGGAGGAATCTTTTGGAGGATGTGCTACATCCAAATGAGGAGAAACTGAGAAGGAAAGAGGAAGACAGAGGATTCAGGAAATAGATGATGATAATGAGTCACACAAAAAGAAGTATTAAGGATTGCCTTTTAAGACTCTGAAGACTGAAGAGTGCCTGATAAATTGCACGTCTGTCTGTGCCCCCTAGCTGCACAGACTGCCTGAAGTTACATTTAGAGACTGAAATCACTGCACCTTAAAAACAAAAGATTGAGCTGCACTGCATTCCTAATGTATCGCCATCACTAACTGGATATTCCTCACAACTTTGCTGTCCGAGGTAAGGAAAAAGAGTCCAGAGAGCCCATGCCCCCTGGGTCTCATCCTGTGAGGCACTGTCGAAACCAGAGTAGAACTCAGGCCTCAGCTGCCGTTCCAGAGCTCTTTCTATAAGTTCCGTGACCATCAGTCTGTGGCCTGACCCTTCTCTTTATATGCAGCCGCTCTCTGTCCCCTGCCCCAATGAACATCTGCACTGCGCCCAAGCCTTGGAGTGATTTACCTGAAGAGTGACACCATTTCTTTGGAAACTACTATGAGGAAACTGAAGCCCAGAGAGGTGAAGTGAGGTGCCCAAGGCCACACAGCAAGTTAGAGGCACAGCTAGTACCATAGCTCAAGTCTCCTGACTCCCAGTCCAGTGCTCCTCCCATTACTCCACGGGTCCTGTGTCTAAGCTTCCTGACAAATGCTAGAACGGAAGAAACCCAAGACAGCTGAAAACCAGAAGGCATCTGAGGAGAATGAGATTACTCAGCCGGGTGGATCCAGCGCCAAGCCGGGCCTTCCCTGCCTGAACTTTGAAGCTGTTTTGTCTCCAGACCCAGCCCTCATCCACTCAACACATTCACTGACAAACTCTCACGCTCACACCGGGTCATCTGATTGTGACATCAGTTGCAAGGGGATGACCGAGCGCATTCACAGCATCAACCTTCACAACTTCAGCAATTCCGTGCTCGAGACCCTCAACGAGCAGCGCAACCGTGGCCACTTCTGTGACGTGACGGTGCGCATCCACGGGAGCATGCTGCGCGCACACCGCTGCGTGCTGGCGGCCGGCAGCCCCTTCTTCCAGGACAAGCTGCTGCTGGGCTACAGCGACATCGAGATCCCGTCCGTGGTGTCGGTGCAGTCGGTGCAAAAGCTCATTGACTTCATGTACAGCGGCGTGCTGCGCGTCTCGCAGTCGGAAGCCCTGCAGATCCTCACGGCCGCCAGCATCCTGCAGATCAAAACAGTCATCGATGAGTGCACGCGCATTGTGTCGCAGAACGTGGGCGATGTGTTCCCGGGGATCCAGGACTCGGGCCAGGACACGCCACGGGGCACTCCCGAGTCAGGCACATCGGGCCAGAGCAGCGACACCGAGTCGGGCTACCTGCAGAGCCACCCGCAGCACAGCGTGGACAGGATCTACTCGGCGCTCTACGCATGCTCCATGCAGAACGGCAGCGGGGAGCGCTCCTTCTACAGCGGTGCGGTGGTCAGCCACCACGAGACTGCACTCGGCCTGCCCCGTGACCACCACATGGAAGACCCCAGCTGGATCACGCGCATCCACGAGCGCTCGCAGCAGATGGAGCGCTACCTGTCCACCACCCCCGAGACCACGCACTGCCGCAAGCAGCCCCGGCCTGTGCGCATCCAGACCCTGGTGGGCAACATCCACATTAAGCAGGAGATGGAGGACGATTACGACTACTATGGGCAGCAAAGGGTGCAGATCCTGGAGCGCAACGAATCCGAGGAGTGCACGGAAGACACCGACCAGGCGGAGGGCACTGAGAGTGAGCCCAAGGGCGAAAGCTTCGACTCGGGCGTCAGTTCCTCCATAGGCACCGAGCCTGACTCGGTGGAGCAGCAGTTCGGGCCCGGGGCGGCGCGGGATGGCCAGGCCGAACCTGCCCAAGCCGAGCAGACCGCAGAAGCGCCTGCCGAGGGCGGCCCACAGCCGCACCAGCTAGAGACAGGTGCCTCCTCCCCGGAAAGAAGCAACGAGGTGGAGATGGACAACACGGTCATCACTGTCAGCAACAGCTCCGACAAGAGCGTCCTGCAGCAGCCTTCGGTGAACACGTCCATCGGGCAGCCATTGCCAAGTACCCAGCTCTACTTACGCCAGACAGAAACCCTCACCAGCAACTTGAGGATGCCTCTGACCTTGACCAGCAACACACAGGTCATTGGCACAGCCGGCAACACCTACCTGCCGGCCCTCTTCACCACCCAGCCCGCGGGCAGTGGCCCCAAGCCTTTCCTCTTCAGCCTGCCACAGCCCCTGGCAGGCCAGCAGACCCAGTTTGTGACAGTGTCCCAGCCTGGCCTGTCAACCTTTACTGCACAGCTGCCAGCGCCACAGCCCCTGGCCCCATCCGCAGGCCACAGCACAGCCAGTGGGCAGGGCGAAAAAAAGCCTTACGAGTGCACTCTCTGCAACAAGACTTTCACCGCCAAACAGAACTACGTCAAGCACATGTTCGTACACACAGGTGAGAAGCCCCACCAATGCAGCATCTGTTGGCGCTCCTTCTCCTTGAAAGATTACCTTATCAAGCACATGGTGACGCACACGGGAGTGAGGGCGTACCAGTGCAGCATCTGCAACAAGCGCTTCACCCAGAAGAGCTCGCTCAACGTGCACATGCGCCTCCACCGCGGGGAGAAGTCCTACGAGTGCTACATCTGCAAAAAGAAGTTCTCCCACAAGACCCTCCTGGAGCGGCACGTGGCCCTGCACAGTGCCAGCAACGGGACCCCTCCCGCGGGTACACCCCCAGGTGCCCGCGCTGGCCCCCCAGGGGTGGTGGCCTGCACGGAGGGGACCACTTACGTCTGCTCCGTCTGTCCAGCAAAGTTTGACCAAATCGAGCAGTTCAACGACCACATGAGGATGCATGTGTCTGACGGATAAGTAGTACCTTTCTCTCTTTCTTATGAACAAAAACGACAGAAAAGAAACAAACAAACAAAAGCTATGGCACTAGAATTTAAGAAATGTTTTGGTTTCGTTTTTACTTTGTTTTTGTTTTTGTTTCGTTTCATTTTGTACTACATGAAGAACTGTTTTTGCCTGCTGGTACATTACATTTCCGGAGGCTCGGGTGAATGATAGTTTTCCCAGCCTCCCTCGGATGGTGGCCTTAAGGCCTGGTAGTGCTTCAAGAGGTCCACTGGTTGGATCTCTAGCTACTGGCCTCTAAATACAACCCTTCTTTACAAAAAACAAAAAACAAAAAAAAACAAAAAAAAAAATCTTAAAAAAAAGTAAAAAAAAAAATTTTTTTTTCACTTGTGAAGAGCACTACAAAAATATATAACAAAATCTAAAAGGCCTACTGTCTTTAAGTACACCGCTTGCAGTGTTTCAGTGGACATTTTCACAATTCTGGCCGCTTGGACTTCACAGTAACCAGTTAAAACTGTGGAATATCACTTCTGGTTGAAAACCCAGAGGAAAGGCCCTGCTGTTTTCCACCTACCACATTTTCTGATTTCATAAAAGGGCTGGGGGGGTTGGGAAGGGGCAGTGGGTCCGGTGGTGTGGGGAAGGCGAATGGCAGGCTTCTCCCCCAGATTTCTGCTCGCGTCCACACACCCTGGCCCACCTCCTCCGTGTCTCCCCCTTTCAGCAGAAGCCAGGAAGACTTGGACAAGCATCAAGCAACAGTGGCTATCGTATTTATTCAGTGTCTTCGCTGAGCCACAGCCTCAGCACAATCAAGAGGGACTTTCATGAAGGGCAGGAATGCAGATAAAACAAAGATATCAGAGGTTTGCACCTACGTTTCTAGGTACAAGAGAAGGATTATTTCCCACAATCTTTGCAAAAAACAAAAACAAAAAAAAAGTGTCAGGATATATTCTTGTGGAAGAGAAAAAGAAAGAGAAATGGAGGGTGGGGGGTATAATAAAAAGTTCTTGAGGCTTTTTTAATTCAAAATTTTATAGAGGGGCAAAAGTGACGTTTACCAGATAGAATGCTGATTTTTTTAATATATTTACAACAGTATTTGTGTAAAAAAAAAACAAAAAAAAGTGAGATTGTTAAAAGTAATTTTCTTTCGTTTTGATTTTGCGTACACTGCCACCAATCCCTTCTCTTATTTTATTTCACACACATATATATATTTTTTGGTAAGTCAAGACTGTTAAGGTTAGCGATACTGCTTCCAGATAGAAAGAATAAAAGGCAATTAAAGTTATATTTGAAAGAGAGGAAGGATATTTTCTTCATATTTTTTTTATTTTTTCTTAATTTTTATTATTTTAAGTATTGCCTGGGTTGATGAGGGCCTCTGTGGCCAGCCCATCCCTGCTGTAATTTGAACTGCTGCTTTGTATTTTGATATGTAGTTCTTTGACTTTTAGCAAGCTTAAGTTGCTCCACTGACTTTTTTTTTTCTTCCAACTGATCCATCTAGAATTCTGTTCTTTTTCATGGGAGGACTTTATCTTTCAGAAACAGATTTCCTGCTTCTCTAAAAGTTCACTGAGGTCTTATGATTCTAGAATGTCTCTTGACTTGACTTCTTTTCTTGAATGAAACACTAGTAGTCTAGAGGTCGTGACAAATGGGTTTTCCTTCTGTGGTCAGCCAGGAGGAGGAGTTCATGCCTCCTCACCCTTCACAGCTGCAGAGAGCAGAAGCCTGGTACAGATCAGGATGCTTGATGCCAAAATTACTCTCCTCCTTTCAGATATCACCTTCTGACTATTTCCACCGTGGTTGAGAGGGCTAATGAGATGATCCTCCTTCAGAGGATGTAGTAACCCTTGCTTTTTGGAAAGATTTTAAGGAAATTAACAAAAATTTCTCAGATACCAACATCCATCATTCAAAAGGCCACCAGTTCATTGCATCATCCTGGATGCCACTCTCTCTTCCTAGTTGGGATTTCTCTCCTCGGTCCTGATCAAAGTATTGTAATAGGGATTTTTCCATTATAGACAGTGTCCTGAAGGGATTCCGACTCAATTATGAGAATTCTTACACTTAACAAAAACTCCAAAGGTGATTTTATTGCTGGGCATATTTTAACACTCTTAAAGGGGAAGAGTAAATCTTTAAACAAAGCAGAAACACCAAACTGTAATTTTAAAAAAGAAGCAAAGACAGAATTTTAGTTTCAAAATTACTTTGCATTTTAATTTTCCTGTCAGCAACTTATTTGCAAAAACTGTGCATCAAATGAGGAGACATCTTCCAAGGGAAGAAACTCTATAATGACTAAATTGGTTTTACTCATATATTTTAGATATTGGTTAACTTGGATCTTTTCCATACGTTCTTGGTGATGTTTAGTAGGGTTAGTGCAACTGGAGTACATGTGGGTTTTATTTGGTCCTCCGGTCCTCAATTCGGTAAATATTTTACTAGAAGTTTAATGTAGACTTGGATGGTTAACTGATTATTGGGTGTCACTCATCGTGATTTCTAAAAGGAGTCATATCAAGAACGGTGTGTCCAAAATTGACCTGTTTTAGAAGTTAGTGGGAAACAGCTTCAAAACTAAGAAAAAGTCCATTTTTCTCTTGCTGATTTTGCTTTTTAAAATAGCAGTGTGGAAGACTTTAATATTTCCACTTACTACCAACAGAGGGAGCGTTACTTAATTAACCACGTCCTGGGATTGTTTTGATATCTTGAAAAACAAGTCATTCAACCCAATATATAAAAAAGAAAAAATTAACATTAAGGAAAAAAGTTGTTCAATCTAGAGGGATAAATGACATAAACTCTCTCAGCATACTATACAAATGAGCTAAAAGACACTTAAAAATATTTTCAATTATTTGACAGTAGCTGATTTAAGATAGTGTCCTTATTCCAACCTTCGCAAAGTAAGCAGAATTTATAGTACCTCTAAAAAAATTGATCTTGGGTGCCATTTTGGGCCCCATTTAGCTATCTGCTTCTCAAATCAGAGGGAAACCCGTTTGCCTTAATGTTGATTTGCCATGTGAAAAGTGAAGCAGTTGGGTTAAAACGAAATCCATATTTTGTTATAGAACATACAGAGGGAAAAAATTCCAGTTGGGTTTGAAGCACTAATATTCATCCTTTCCCTTCAAATGAAGTATCTCTTTTTAAAAAATGTTGGAGAACTCCCAGAGAATTCGTGGTGAGGTGATGCAGTCATTATAACCACATGGACTCTCCAGGTTTGCATAGCAGTAGACTTTTTCCTACCGTATGTCTATTCCTCTCAAACACTCATAGTCTAAAATAGTTGACAGACTTGTACTCTGGAGAGAGGGAGAAGCTAGACTGCAGTGGAAGGTCTAATCTGGGGAGCAGTGAACTTGCTGTGGGGTTATTACAATATGTTCTGACCTCCTTAAAGGGCAACTTTCCCCACGGATCTAAACCAGACTGGACCGATTTCTAAAGGATAGAGATGCTTTTAGATTGCCAATCCTTACTTTTAAATTAAATAATTACCAACATCTTAGGAAATGGGGAAACATATTTTGCTTCAGGAATAGAGGATGAACATGAATCCTTTTATTTTTTAGTTTCAAATCCAACAATCTTCTTACATTTAGAACTTCATGCTAGGATGCTATGAGTGCTAAAAAAAATTTTTTTTTCAGTAGTCAGAGGAAAAAATAGATAAAATGGAAGCAAATGTTCCAGATTTAAGACCTCTTAGGATGAATACAGGGAACAAGAACTAGTTTGGAAAAGAACTTTTTTTTAGTAATTTATGATTTAAAAGTGGATTAGCTGAACAAGGGAAAGGAAAAAAGTCAAAGGGGAATATTTATGTCCAGACATTTAGATACAGTGTAAGAAAAATGAAATTTCCCAGCTCTGAAAACATTGGTAGCATCTCAGCATGGAAGGTAACTTTCCCCCTATTACTATAATAAATGCAAATATTTATACTAAAAAAACAAAAAAACAGAACCCAAGTGGTAAAATATGGCCCTCAAAAAGAAAGGAATTGGAACAGATGGATCTGATACAAATCTACACATGGGAAAAGATTAAGAAACAAGCCAGGCAAAGATAATTTGAAATGAAAGTCTTGATAGCAAAACGGTTTTTACTATATATTTTAATTGAGTTGTAAACTTCAGCTCCTGACAATAGTTTATAGACTTTTTCCTGCCCAAACTCCTAACTCTCTGAAACTGTTTGTGCCATGAGTAAGTGTGGTGGATAACTTCCTTCTCGTGTTCCAGCTTTAGTCCGTTCCTTCTTCATAGGCATTTTGGAGGTCACGGTAGCTCCCAGCCTTAGAAGAAAAGACTTGGATTTGCTTTGTTGAAAAGTCATGGGTTTTATTTTGTATCATCCCAATATTCTTTAAGGACCAAGAAAACCCTTTAACCCATGAATAGTTAGAATTTGTGCATTCTGATAGGAGAAGAACAAGATTTCCTCTGGGCGTGTGTGTTGCAAGTAAGTCCTAATGCCTTGACCTACGTGTACCTCCATCATATAAGCACGCCAACAGTGTGTGGCCAGCCCATACGTACCCCAAATCTGTTTTCCCTCAGCAGTTCCATCAAATGAATCGTGCCCCTTATAAAATCCCTCAGGTCCCTGACAGAACATAATAAAGGTTCATGTCGCTTCCTCCATGTGCTTCCTCCATAATGCTCCCAACACCTGTTGCCCCTAGGAAAGGGGGCAGTGAGCTAGATCTGGCTGGGATTCACACCCAACATGCCCATTCAGGAGCCCTCCTCTGCTGTTATGGAAGATGTTATTTAATTAGCTGAGGCTGGGAGCAGAGGGTACGTGATTCTGCAGCAAAGTTATCAGATAACCAAATCAGATCTGCCTCTGCTATGCAGAAAGAAACAAAATGAAGGTACAATGTAAGAGCAGACACAACCTGAGATGCCCTTGGGATTTGGGAGAAGGGAGGGTGCCCTTTCTGTTGTGACCTGACTCTTAAAAGAAATCTCCTGAAAGAATTCTTTAATTTAGTAATGAGTTGAAGTCCAGGGTAATGGAAGCCCTGGGGAAGAGAACAAAAGGACTGCAAAGTGTATTCAGCACCCAATAATGCGAAACCAAAAAACATCCAATCACAACACTAGGAAGTTTGGCAAAAAGTATTTAGAGAAATCTCTGGGCTTTCCATGGGTAGTAGGGTCGACAGACTTTCTTTTGAGTGATTTCTGGCTCTGAGAAACCTCTTTACTCACTAGAAAAGAACTTTCTTTAAATGGCCAATTTTATCCCCCAGAAAAAGAAATTTAAAAAAAATAAAATAAAAATAGGACACTAAAGACAGAACCATGTGACCCGGTAACAAACAAAAGGAAGGGTGCACTAGAATTTCAATAGAGTCCCTAATTCCATAGAAAAAGCAAGGCAACCCAACGCCTCTCCATCTGCAGTGCTTGAAGAGAGTGCTTGCGCCGACCCCGCCCCCCGGGGCTTTCTGGGGCTCCACATAACTTCCCCATTGGGTTGGCGGCAGCCCCTTTCTCTTCTTGTTGACATGAAGGAAAGGACTGTTCTCTTAGGTGCCCAGGAAATAGATTGCATGGGGCAAACTTTCAAAAGCTATCTCTACCCTGGTGCTCCGGCAGCATATGGTGAGAAGAAAAGGGACACAGAAGAGCCCTTGCTCTTGAGTGAGAATATTCTCGTATCCCCAAGGGCTCTCCGTGTGGAGTTGCCATTTCTAAGACCGTTTAAACCTCCACAAGAGGAAAAGTTGTGGTGACTCAGTGTTCATATAAACACAAAACGTGGAAATTGCTAACCCAAAGCATCGTTTCTAGCGCTAGGGATTAAGCTGATTAACCTAACCAAAATTCCCCCAAAGATTTGTCTAAGTCTCCGAATACATTTTTTCCCCTTGAACCCCGAATCCACAGTGGTCAGCGGTGTACATTGACAGATCCCAGACAATGGTTTGGAACACCAGGGTTTATTTCCAGTTCTTTTCAGGATGAAGACGTAGAGGATGAGGGTTGTACCACACGGGTTCTTTTTCAGAACTGTGTATTTCACTGAAAAAGCGGTACAAATGCCCCGGGTTGAAGCAAGTGACTGCAACCCCTGGATTCTGGTGGTTCCTCAGGCCCAGCCTAGTGCTCCATAAACTGAAACCCTTCGGACTAAAATCTGATCTGAAGTGACCTCAGTTGAGGGATTTTCACCAGACACCACTTACAGTGTAGAATTATTGCCTTAAATCAGAAAGCCCAGGGAAGAGAACAGAGGACAGAGGGGTCGGAAGGGTGTGAAGACATAGACATTTCTTGTTTTTAATGGTTGCATCGTCATCAGAATGAGCGCTCTTCATGATTGAAGATGATGGAAACAGTGGCTTTGCAGGGACGCATCACACTTGTCCGGAACTGATGGTTCTTGGGAAGTGGTTGCTCTTTTTTCATATCCTATTTCAGTGACAGAGGTCTGGGCTGGGTGTAAAATAGGCATCATCTTAGTCAAAGAGCAAATCCCATAAGACATGGTCACAGGTGCCTGGGATGTCAGTTTTCTTCATTTCCTTCATAGGGAGAACAGTCTCTACAAAAGCTTTCTTTCTCTGTACGGTATATATTTCTAAACTCGGTTTTCCTCACTTTTCATAAGCATCTGCTTTATCTGGTGGTTCTTTGTTTAAGTGCAAACTCACGACTTTCAAATCTTCAAGGAAGGAGCATAATCTGCAGATCATAGAGGAAATCTAGCCACGTTTGCAGGAGTCCTGGCTTTTGAGATACTTAATTAGGGTAGAAAAAGTTGCTACTAGCCCTCTTTCAAATTCAGGGCTTTCCTTGGTTCAGATGCCTCCATGAGATTCTGATACACCTAGAATAGAAAAAAAAAAAAAATTAACCCCATCAGAGACATCTGTTTCTACTCCTGTTACAACAGAAGTTTGTTATTGCCCAGCAAAATCATTGTAATTTATATGTAGATTCCAGCAATGAAAAGGACCTAACCCAGCTACTATGTCACAGCTGCTGTGCAGAATGTCCGTAAATGAGCACACGTTCTGCACGTACACACGCAGGGTGAGGTGCTCTCAGTACAGAGCTGTTCCACGCTCGTATTGCCCAGGGACAAGATAGATTCTGGAACTTGAAATAGTCCGGGCTCTCACAGATCTCCTCTCTGCTTCTGCTCTGCCTTCTTTGGGTGCACCGGTGCCGTCCGTTCTCTGTGATGAGGTTCTGGGGCATTCTGAAGGAGCTCAACCAGCAGTAATTTCTATGTACCTGTTTCATGAGAAACTTGACTATGCCATGTGGAGGAGGGCGCTCTTAATGAACTCCGCACTTGCACTGGATTGACTGGCGTGCGTGGACGTGTGGTTTGCGTGTGTACGTGTAGTCTGGGAGTGTGTGTGCCTGTCAGAGGAAGCACACACAGGCCCAGGTCCTGGTGCGTAGATGCAGTTGCCTCTGCCTACCGTTGTGCTCCAGACTTGTGGCTCCCTTCCCGGGAAGCAGTCACCTGCCCACTCTGTTGCTTTTCAGAGTGTTTCAGAGTTGGGAGAAACAAAGGCAGCTTGTTGGATCCACAGCAATCCTACGGTGACAGGCTGTTTTCCTCCAGAAGAAGGTAGAACAGAAGTACTCAAGTGGCGAGCAGACACAGAGAGCAGCAGTCTGGGGCACCTCTCCGGGTCTTCTGGGAGGGAGGAACACCGAGGCCAGGGAGGCAAGACCCGCACAAACTGTGATCTGAGCCGTCCATGGCTGAAAGGCCTCCATTGCTCTCCTCTGTGCAGCCCAGCGTGTGCCCACAAACACTGCTCGGCTGTTAAGTCTCACTCCCAAACGGAAGCTTCCTGACCCTGCCTGTATCTGCAGGACGTCATCCTAATTCCAAACTGTGTCTCCGGAAACCAACGTGGCCTTTGCCCAAGTCTTTCCAGGAGTGGGTTGTTTACCATGTCTAGCAAACCAGTAGACTCTCGGGGGAATCATTTTTGGTAATCTCTAAGAGTTGATGGCTCTGGCCCATCTCACACATTAAAGTAGAACGCCATTCTTGCACACTATTCTGAACAAATGGACCTGGCTCTCGTAGCTGACCTTAGAGAACGGCCTGGAAACAGTCGGATTCAGTTTGCTCCCTCCCATGCCCTTCTTTTAGTAGGTGGCTTATTATTTTTTTTGTGACATGTAGATGATTTCTGCTAATTTACAGAATTCAGAGGACGTTTTCTTTCCTCTTCTACTTTGGTGACTTTTCCCCTACCCCATTAAGTAAGGCTACTTACAGTTAGAATCTTTTCATTGTTATTATTTTTTAAAATGTATATTGTCTTTCTATATCCAAAAGAAGTCTGTGACTGTAACCATAGGTATTTCTTTTTACTGGAAAAAAAAAATGAGGTTTTTTTTGTTGTTTTTAATTCACAGTACTAGTGACTCTGTGAAAGAACGTGAGTTACATTTAGGTATGCTTACTTAAGTACAGTACACTACGTTGCAGTATTTCTGAAAGCTAGAACATACACATTATATATAACAACTCTATATTGAAATATATATTACATTATATTCATTTTAACTTTTGAATCCGCCTATGATCATGAGTTGATTGACATATTATTTCTTCGCATTTATCACCCATCACCAACCTGCTGCAGTTAATCTGGTGCATTTAATAATAATCACGACTGCTCTAGTTTGCTTTTTATATTATCAGCTTCAGTATTGTCTTTACAGGATTTTAGAATTTTTTTAAGCTCAGACTTAGCAAATGTAGGAAAGTGAAAACATTTTTTTAAGAAAACTTTGTTTTTTTCAGTGTGGCCGATACAAAGAGGTTCATATTCGAAGTGGTCTTGTTTAGCTGACCCTCTCAATATCTGAAGAACAAAAGAAGTGCATATGAATGTATCTGTGATTTTCCCTTTGAGGACTGTCACTGTCTATATTTGCTTTAGAAAATATGACCAAGGGGCTGCTTAACCTCCGTATGATCTGACCAACAGTTACAGGCTGCCGTTCAAAGGGCTGCTCATAAGGGAATGAAATGCCTAGCGTCCCAACTGGATTTCCAAACCTTGATTTCCATACTGCTTCTTTACGGACTACTGTTTGTTTTCAGTGTGCTTTACGATTATTTTACCTAGTCTTCAATGCTCCCCTGGAGGCAGCTTGACAATATAACATTCATTTTCCTAGGAGATTTTCTTTCTTAAATAAAACCAGAATTTGAGGAACGTTTTCATGACAGAGGCCGATAGAAATAGAACCGAGAAATAGCTCATTTTTTAGCCCACAGAATCCATAAAATGGTGGCTCTTGGGTGTCTGGCCCTCCGTATCGCCATTCGTCTGTGAAAGTGGGGATTTGGTGCCTTTCTTCTCCAGCCAGGTCATCATGGAAACTTCAGGAATGAGGCATCCTGTCTTCCTAGCAAGAAATATTTTCTAAGTAGTATTTTCAGATAAAGAGCTTCTTCGGCTTCTCTTAGCTACTCAACCCAGTGCCTGGAAAACTCCACTGTTGGGTAAACTTTACATCCATCCTGGAGACCTAGAGCCGGATTCATTCTCTCAGTTCTCCATTCAGGACAAAATGACAGCAGTTTTTGATACTCAGTATGAAAGCCCTTCCCATACTGGACCAATAGTAAAGCCTCTCAGTATGACTATAACACCAATTCCTTCCTTTCGTCTCTCCTAATAGATTTTTATTTCCAAATCCCATCCCATTCTGCTGTGCTCCCCCAACCGCAGCCCTGAAACAAGTCTTTCCCAACCTCCCCTTATTCAAGCTCCCAGCAGTGCCCCCCACTTGTGAAGCCTGGCAGACCTACTTCAGCCTACTTCAAAAGGGCAACATTGAGTCTAGTAGCAAAATTATGAATCTGTTTCTCCATGGTTTTCAACTAAATATATTTCTACAGGACGGACATAATTGTGATTTGGGAGTCAGTGAGGCTGCTCCTTTTCCGGTGATCACATAATACCCAAACTGTATCAGTTTCATTATTTTCCTCTTTCCTTTTCCTAACCACGTTCTTTTATTTCTTGTTTCTCTTTAGGACTACTTTAAATTACCTTTTCTTCTCCTCATCACCTGAGGAACTCGAGTAATTATGACCCCTGAGTGCTCATTTCCCTCCTTTCCCCCCACCCCCTTCCCGAATGTCCTTCTCTAAGTTTTATGCAGTTAAAGAGCATTGACAGGAGTCAGCTCATCAACTTGAGACTCGTAGGCAGAGTGAAGAAGAAGAATGTCTTCACTGTACCTTCAAATTTTAGAAGTTATCAATATTCTTTTGAGAGTGGGAGGACCTGAGTCACAGTTTTAAATGTCAGCTGTACTAGTGAGGTCATTAATTCCTTTCACCTTCACATTTGGCCAAAGGTAAAGAAAAAAAATATACTTTCTGGGTTTTTTTTCTTTAAATATCACAGCGTTCAAATTTCTGATATGAGTAGACCATTTCTGAGAGGAAAAAAAAATCATCAATGTTGGCTGTTTCAAGTCCTGCTAATATTTAGCCAGATGACATATTTACCCCATACTAGATTTACAGAAATCTGAAGAAAGAGGTAACATTGTAAGATAATTTTGATAACTGCTCAAGCCTTAGTAAACTCTTTCAAAACAAGTAAAGCCACTTCCACTGAAGTAGGAGGAAACAATTAGGAAGAATTTTTTCATTTGTTATCTTTTTGAAAAACAAATAATTGTTGATTGATTTGGAACTTCAAGCAGTAATTTACTGAGGGATGAAAAGATCCGTAAAGTGTCTAAAGTGTCTATTTTACAAACAGTTTTTTTTAGATATATATATATATATATATATACATATATATATGTATATATATATATATATCTGACTGGATACTTGAAGGGCCATGTAATGTACTCCCCAGTACCTAAACACTCAGCATATAATTTAGTCATCATGCTAGATCTCCTTTCAGTGAGTCATAATTGTCTGGTTGGCAAAATGTTGCCCAAAAGACTGATACTGTTCTGGATCTGTCCGTTACAGAATGTTCATAATGTAATACCCGCTTTCCTCACTTCCAGTCCATGACTCTTGCCATGCTCCTACAGTGCCTCTTGGCTCTCAGGAAGACAAATTCTGCGGCATTTAGAGTACTACCTGGTTCTGAGTGCACAGACATGCGCTGTTTTATTTCTTGCTTTACCCACTGACAAACAGAATCAACATGTAGTATCAGAAATGTATTCCTAACGTGACGAGAGGCTTGACCCATCTCTCCTGCCTTAATTAAACCAATTTATAACATCAACTCACACCACAGAAAGCAATGAAATAAAGAGAGAGTTCAGAACCTTCCTGAGTTACACATCTAGTAGGACCCCAGCGTTTCTTCAAGCCAGTATTTATGTTGCCTACGGTGGCGATCTTCACTTGGCACGTTTTCCCCGTCAATCCCATCTTCCTCTCCTCCTTTGTCCGTTCTCCCTCTATCTCTTCTGTAGAAGGACTCTTCATCTAAAGTACTCTTCTCCCCAGGCTTTGGCTTCTGAAACAGTAGAAGACTCTCTTTTAAATCCTAATGACTAATGTTTAAGGTGTAATGTGGCGTAGGAGAGGATTCAGTTCTGCCACGTCCCGTTTGGTCCAGTTAATCGCAAGGATTTCTCCAGGATGCCTCTTTGACATTGTTCCTTCTGGTTCCCCGAGAAGAGCTCTAACCCTGAGACCAGGATTTCTCCCCACAACCTCTGCATTAGTCTAGGTTAATGTGCAAATCCTGCTAGCATTCTAGAGACTCCAGGATGTGACTCTCTTATTGCTTAGGAGCCCCCTGCTTTTCGAAACTGACATCTGTCAGGAGCAGCAAGAGCCCTACCAGTCACTAATGCAGCAACACGATGGTCAGAAACATTATAGTACATAATAGGGAGGATAGGAAGAGATTTCATTCTTCTTTTCCCCCATAAAAAACTTGCTTCCCCGCCCCACCACCACCATGCATTTCAGAAAGCCTGCATCTCATTTTACAGATATGTAGTTTTAGGATTCGCAAATATAGCTTAGGAAATGTTCTGAGATTGAAGCTGGTAGCGAACCAGTTTATTTTCTGCACTGGACTTTAGGACAAGTGTGCACAGATACAATTCCTTCAAAGAAAGTGAAACTGATATAGTAAAGCAAAGGGATAATACTTTGACACATTAAAACAGTTGTTTGCTCTCTGTAAACCTTGACTTAGGCATAATTATTATTTTTAGAAACCTGAAACTGGAGGAATGTGTATTTTAGTAAAGTTTGTTGTCAGTTTATTTGTTTCCCTTTATCTCTTTCTTCTCGAGATAGTGAAAGATTTTGATTCTTTAATTTGATACTGTCCCTGGCCATAGGTATCAGTCAAATAATGCCCACCCTTACCATACGCTTTTCCTTTTAGAATGAGAGCCTTCCTTCCTGCCATTAAAGAGTCTTTTCTCCTTGAAAACCTTATCTTCCTTTACAGTTAGCATGAGAGAGCTTTGAGGAGAGGGATTCTCTCTGCACTTTGAGGGTAGAATCGTTAAAATAAAAACTATTTCTTGAGATAAACCCCATTTACCCAAACTAACAGGTCTGAGGCCAAAGAATGGGAATTGATTGCAGATGAAGGTCTTGTATTTTACACTACAAATCTTTATTGCCTCCTCCAGTTTTTGGAGTAAGGCTGGGAATAACTGAATGAAAATCTGCTTTGGATGTTTCTTACTAATATCTAATGCAGAATACCCAGAAAAGACAAAGAAAGGGTGCTGCTTAAATGCACAATCAGTCCATAGATTTCTATAATTATTCAGATTTCTCTTCTACTCATTTCAAAAATATGTGTCCATGAGGTCTTCACTAGAGAAACATCCGCTTCTCCATTGTTCCTCATCTCCCCCACCTGGCACTGGAGGGGAGAGTCACAAGGGAGACCGGTGCCGCATCGCCAGCCCTCCACCCATCTGTACCCCACCACCACCACAAGATAAGGAAAAACCAAATTAGAAACTTTTTTTGAAAAAAAAAAAAAGGGAAATTGTAGTGCTTCATTTGAAAGAATACTGTTTTTAACTCAATTTACAGATAGCCTGACAACCTTTTTATAACCTGTCTTTTGTGCTATAATTTGCATTTTTAGCTCAATCTTTAAAATAATTGCAATTTCAATTAAGTGAACAGAGGAAAAGCAAAGAGGGGAGACAGGGCAATGTGATGGGGCTAAATCTGATACAGTTCTGGATTCATAAGGCCAGTTCTCAGGGTTACCAGGGAAAGCTAACACCACTCACCCTTACCATTCTTGCCCATCCTTACTATTAGAGTCTTAAAAGTTGGTCAGAAAACCTCACTTCCTTATGATTGAAGACTTTTCTTATTACTGTCAAACCCACATTGAGAGAAATGGTACAAACCCCTGACGGCACCTCTGCCTGAGCTTCCTCCAGGGCGCGTGCGGAGAGATGCCGGGAACCGAAGTGTGGGCTCAAATTTGATACAAGACTCAGACATGGTCTCAAGTGCTTTGTGTATGTTCACTGCCAAGGGGTTCGTTGAAAAATAAGGCCAGTTTCTCTGCTCCTGCTGTCCTTGGGACAAACTTTGACTTGGAACCCTCTCTACAATAGATTCGTAGGAGAAAATTCTCAAAAGCATCGTCAGCAGTTCAGCTCCTTCCTTAATCCCATTGAGTTGAACCTCAGTTTTCCTGAGGAGCCCTACTGAGGTAGAAATCAAAGGTAACTTCCGTATATTGAATGAAAATTGGCTTTTTGCCCTATTTGTTGAAAGGATTGTGGTTTTCAGGAAAAATGAAAGCAGAATTTCTTAGTAATCCTCATCATGGCACACAAAGGCAAGAAGCTGATAGGCTAGAGAAAAACCTATGATGAACTTTTATGTTTTTAAGCAATCTGACTGTGCTGACCCCACTATGCCAAACGCCTTTGTTTCTACAATCTGTTCTCAACTATGGATTGATTCTCCTGAGACTTCCAGCACGCGTGTGTCGTTTGAGCAGACACACAGGTTTCCATTTGGAGAATGGAGACCCAGACAAGCCAAAAGCATCAACTCTCACGAGTATCAAATACAAATCATTTCTCCAGAATCACTCAGTTCTGCCGTATCCCAAACCAATTCCAGACTAATCTTAAGTGAGAAGTAAGCTCCATAAGATATCCTACTATGAATGTTTTTTCTTACAGAATAATACAAGAAGAGGTACAAAGCAGATTCTTAATTTGGGTGTAATTATAATTCACTTTTATATTTAATAGTTGTACTGTTTGTGTGAGTGTGTCGTTGAGCTATTAGTACCAATTTTCAATCTGTCATCCTGAGAGGGGCCTTGAGAATTTCTGCAATTTCTGCATATGTGTGTGTAGATCTGTATTTATGTGTTGTCAGAAAAACAAAATGAACGGGGGAAGAACGAGGGGAGGGAGAAGGTGGTCAATGTGAAGAAGGGACTGCTCCTAGTGTCCCTATTTCTGTTAGGTCAGGTGGCTGCTGCCAGAAGCCCTCCAGGAAGAGTTGATTGCACTATTCTAAAATAAGAGCCCAGCACTGTTAAATTTAGAACCATGTTTTGGGAAACAGGAAAGTTTTATCTTTTTCTGTACCCATTCTCTTTAGCATCAGAGCCGTTTGACATGATGAAAACCATTCAGTAAAAACCACTACTGACCTTTGCATTAAATAGCTGTTTTCCTCTTCTAAATACTAGCCCTGGTTTCAACTCATCTACTTCCCTTTATTTTCTGCCTATTGATTTTAACATTTTACAGAAGAATACAGAGGCGCATGCTAGTTGTTCCTCTCCTTTGAGCTGAAACAAACAGGGGCAACAAGAAATGACTCACTGAAGAGTGAGGTCAAGACTGAATTTCCCACTTGTGTGGCACTGGTAACCTTTAGCAAGAACTGTTTAGGGTTGACCTTGGGTCTATATTAGGGCTTTTTTTGGGGGGGGGTTGTTTTGTTTTTTTGTTTTGGGTTTTGTTTTGGTTTTTTTTTTTTGCACTAAATATGACTGCACTGCATTGCACTACTGAAATGTATTTACTTGTGCTGGGAGAGAGTGTGTGAGGTATGGGGGAGAAAGAGGCAGTTATGAAACAGGAAGCATCACAAAAACGGAGAATTCTTTCCGCCGTGCTTGGTCTTAGCAGGGTTGGTGAGAATCTGTGGAATCTGCTAACTCTTGATCAGGCCCAGAAACTGCCATGCTGATAGGATCTGTTGTCTTATGGTCAAAAAGCTGGGCTGGTACAGTAAATTGGAGATGTTTAAGGAAAAGTTTGCCCAGTGTTGTCTCCAACTATGCTTCTGGTAAGAGTTGCAATGGGTGAGGGAGCCAGCCGAGGTGAGGTTGAAGCCTTCACCTTGGCCTCCACCACAAAACCCCTTGCTGACCCACATTCCAGTGTGGCAGAGGGCGGTGGCGTGTCCTGCTTTCAAAACAAAACAAAACAAAAAACAAAAAGACAGCCTTGTCTGTATTGGAGACATCCTTTCAGCCTGCGCATGCTTTTCTATCCCTGGGTGAGACCTAGATGAGCCTAACCAAAGAGGAAGGCCGTGCACGGGGTTAAATCCTTTAAGATGGCAGTAAGGGAACAGTGCAATAAACACTGAAAACCAGTGAGGTGAAGGGTTTATTTTGAAACAAGGTAGGCCAACTTTGAAACTGAAGGAAGGGTTGGAGAATTGATCAGAACCTACTTACTAGCTGCTCCATCGTAGACTATCCTTTATTAAGCAGAAGACCTTAACAGTGCCTAAAAGTTTAGTTTGGAAGTTGCTGAACTTTTTCAATTTTTTATTGGATTTCTTTTTATTGCCTTTTCAAACCTGAGAAGTAATTAGCGTGTGACAGCTCTTCAGTGACTATTAATAAAAGAATCTTGCACCACAGGAAAAACAATCAATTGTGTAGGGCACAATAACACCAGAGTGGAGATGCTGAAGAGCTCTCCCAGAATCCAAGGCGACAGCTTGGAAGATTCTGGTTCTGTGAGAAAGGGTCACAACACATATACATGGGTAATGTTGAATTTCTCTGAACACTATCACATGTGGGGACATCAATTTGGAAAACTGTCAGTTGAGGTCTCTTTCCTAAGATTACAATATTGATACTTCTCTCTCTCTCCTTCTCTCTCTCTCTCTCCTCCTTAGCATCCATCCAAGTCTACTATTACAAGGTAAAAAATTTGTAAGGGAACTGTCAGCCTTGTGAGTCAGAAAAAAACACCACTTAGGGCTTTCAGAACTAACGTAAGCAATCCCTTAAGCACTCAAAGCATTATCTCAGTTTTAAATAGGAAACTCTAAATTCAGAGCTATTAACAGGTACTTAGAGATGTGTATTGCGTAAGCACTAAGACGGTATTGACTGCACCAAACCAAAGGTATAGAAAGAAATAATTGACCTTTTAAGATACATTCACATTAACTGTCCTAGGATACTTCTCTTGAGGCTTTGGGGAAACAACTTCTTTTGTGAAACTTGCATACCCATTCCAGTTTTGTCACCAAAGATTTTAATCACCAGAGCCTAATCTCCTCTCTCCCAGATAAAAATAATATGACAGGCTCAAGGGGTATGCTTTGGTGGTCAAGGGATGACACTTTGGTTTTCACTGTATTCACGGTGATATTTACAGGACACTCGTTATTAGAGGAGCTACCGAACTGTCTTCATGACTTAGGGTTTGGCCAGAGGTTTAAAGAGATAGGTGAAAAATAAACAATAGTACCTTGACACTGTAAACTAGTCTTTAATAGAGTCATGACCTGAAGACTGATGGAGAGAAAGAAACTTCCAGGGAAGAGAGTGAGCTAAATCACATAGAACTAAACAAGGATCGTTGGTGAAATGTGGGGCAGTGTAAACAACAGAGCGGATCGCTGCTCTTTGTGGCCAGACCCACAGCAACGGCCGGGGGCGAGTCAGACAACTGGCAAGTGAATTCAAGTATTGAAACAGCCGCGCTCTGGGTTTCGCTGTGGTTGGCGGAGCCCATGGCAAGGACAGTGCTGAGGCTGCCCTGTTGTGATAGTGCCTTTCTTGTAGCAAGTACTCGGTGAATAATTTGTTCAGTTAGGCTTTTCTGGACCATTACCCCCAGTCTTCTGAGGAGGTCTGAAGGGATAGTGTTCACTTAGGATGAAGGGACAGGATATTGCTCCTGGGATGATGTGATTTGATGATATTTGCACTAGATTCTAAACTCTACTTTAAACTGGAGCAACTGAATAGAGAAAAACCAAGGATGGTTCAATGTTAAAAGAAACCAAAAGCAGTATTTTCTAACTGATGCCTCTTCTTTTTCTTCTCCTTACTCTTGTTCTTCTCCTTCTTCTTCTTTTCCCTGGAAGGGAACTTCATACCTGCTGATTACCAAGCTCAACTCGAACCAATTCTTTTCCTTCCTATTTTTTCCCCACACTGAACCTTCAGTGTGAATTCGCCATCAGGTAGGCATGGTTAGTGTAAAGGGCGTCTGTCATTACAACTTTGCACCCGTCCTCTGCGTCATCAAGGGCATGAGGCAGTGGGGGGGGGGGGGGACGGCGAGGCTCCTCCAGAGCCACCAGCCCTTAGGACGGGTGAAAAGCAGAGATTTCCTATGGAGAGCTGAGCTGACACATATTTGTCCAGAGGACATTGGAGCCTGTAATTAATCCCAACGAATGCTTAGAAAGAGAAGGAAACCCACGTGTTGAAGAAAAACAAGGAAGGTGGTGCCCACAGTTTGCCTGTTTCCCCTCTCTCTCCTCTTTCCCACCTCACCCCCCTGTCCTCTCTCAGAATTGTATTTCATCTTTGTATTTATGTTACCAGAAGAATTATTTGGTTCCTTGGTTTTTCTCTTTATCAGTGGTCTGGGAACTCTTCCAAAATCAGAAACAGGTACCATCAGTGGCTCCCCTGTAGCCTACCAGTTTCTCAAATGCTGTCCACCTGGTCTTGACCCAGTCAACTAAGATAACTCGGAAGCTTTGGCTGGCTCAACCACCTGTCACTTTATTTTCATTTTGTTTTCATTTCCATTTGAATTCTGAGTGATCTTATGGGAAGGTGGAAATCACAGAAAAGGTTTAGAGGCTGCAATTCTAGGGCATAGCTTGTCAAGAGTTTGTATTATCCAAAATATAGCTTTCTACGCCTGTTTTTCTGTTGAATCTGTTGCCCTGATTATAATTTCTATTATATTTGCGGTTATTTTTATAAGAATAGAGTCCATTTGCTATGTCTATTTGAGTACTTTTTTTCTATTTTCCCCACATGGATGCAGTACCAACCTGTTAATGAAATATCTTTTTATTATATTATTAATATGTAATTCTACTGTAGACCAAAAATATAAAAACAAATTTGCTCATTTTAAAGATATAAAGAACTAGTGAGTTAAAGATGAAGAGTTGAAGGAAAGACAGAAGAGCAGTGGTTAACTATGTTGAGTTAGAAATCTAAGAGTAGCCTTACCTATTTTTAACCAGTGCTTGCCAGTCATACCATAGTTGGGATTATATAGTCTTGGCTCCTTCATGCTTATGTTCTATAATTTTTGTTTGTCTGTTTTTCTTTGATGTAATTGAGGTTGCACATCATGCTATTTTTGGCGATGCCTGATTTTATTATATTGTACTTTTATCAGTCATTTCCTTTAGAAGGATGGGGGGAAAAGTTTTATTTCTTTTTTTTTTTAATTTAAAATTTGTTTAATGCACTGGAAATAAAATTGGACACATTTCACTGTTCAAAAATTCAAAACCAAAACAGAACAAAAACCACAAAGAAAAAACCAGCAACCAAATAAGCAACAGAAAAAAAAAAAAGCTATGAAAAAACCACCTATTCCTACCGAATACACATATAAAATCTATCTCACACAAAAGAGAAATATCATCAAACAAGAAATATAAGTCCTAGAAGTTACAATGCTGGAAAGAAGACAGCTGGGCTCAGTGGGGATGGGAGACATGGGGCATTCCTTTGAGATCTGAGATCTCGCCCTGGTTCCAGTGACTGCCAAAGGGGTTAAATGTGGGAGAGGCAACTATGGAGGAAATAAACCCAGCATTTCTGGAACTATCACCGTTTTATCCTATGCTTGGGCTCCATTGGGGGTGCGGGGGGAAGATGTGCTATGGTTGAGAAGGTGGCTTGTATGGAGGTATGGGTACAGTCCACAGCCGCACGCAGTTCAGGTCTCTGTCCACCAACTACCTCACGTGTTTCTTTTCTCCGTGAGGATTTCAGCGGACGGGCCCGAAACATGGGAGAGACCGTTCATGACTCGTTAGAACATCAGCCAATGCTAAAGAACCTCTTGACTGCAAGCTCACCCCCTTCTTCAGCATTCCCGGTACCAGCAGAGCCAGTCAACCCGTACAAACGCACAGTGAGAGGGAGACAGAATTTGCGTAGCGGAGCGGCTGTATCATTTGTTTAACGTTTGCTGGGTTTTTCTGGTTTGGTTCTGTTTTGGAGTCGGGGTGGGAGTGGATGTAAGTACACAATCCTAATACAGTAATTGTTTTGCATCTTCCATGTTTTATGCAAAAACAGACATTTAAATCAATAACTAATTGTGCCCTAGACTGAAAGTTAATGTTTAGGAGAGGAAAAAAATTGTTGGAATTTTTTCTACATTTTTTTGTGAAGAATCTTTTTTGGAAAGGAAGGATACATATTTTTGTTGTGTAATATTTTCTATTTTTGAATGCATTTTATTGGTACAAGACTGTTTTTTTGGTGAAGACATTATTTAAAAAAAAAAAGAAAAAAACTAATCGAAAAGTTTGCCCTTAAGGATATGCTGCAGTTTTGAGGTTAAAAAAAAAAAAATAACTGATTCAAGATGCGTGTTAAAAGTTGGGATTATATTGTTGTTTTTTGTAATTGTTACAAGAAGAAGTTTGTACCCACTGCTGTTTATTTTGTTTCAGATGAGTAAGTAAAGGGATTGTTCTTGTTTTATTCTTTTTTTAGAGAAAAAAAGCTATTTATGAAATGTCAAAAACACTGGACTGTGAGTTTAAGTGTGGAAGCATTTTACCACCCTGTGTCTTCGACCAATTATGGGAAACCCCTTTTCTCTTCCCCCCCGCCTTAGCCTTGCCAAATGAGAAAAAAATAGAACAGCTCTCAGATGATGCACACCACTGAAGCCCTGCTTTAATTTTTACGGTTCAAAAAGTCAGAAAACCAAAGTTCAATTTGTTTCTGAAACCCCACTGTCCGTGGCCCTTTTTTGTAGGACACAGCCAGTCGGCTCTGCCTCTCCGTCTTGGATCATTGCCTTCTTCAGGACAGGGGGCCAGCTGTGACACAAAGAGAAGCAGAAAGGTGGTGAGCCTGAGGGTTGAGGTCTCCTGGAGCAGATGTGAGTGGGACTTCAGCCTCTCAGCGGGCAACCAGGCTTCCCCGGCCTGTGGCCAGGCTGCCCCACTGCCGGAGGAGGAGAGAGGCTGCCCACGCCTCCACCCTCCGCTTCTAAGGCCCTTCTGTTACCGTCGCTCTCCAGAATGGCTTTGCCTTTCTCAGCAGCCCGCATTCCACGGACGGGCTGGGGGGAGGAAGGATCCAGTTGAAAGAAATGGGGAAGGTAGGACAAGGGACCCTCTAGCATGAGGGATCTTGTCCGCCTCAGCTTTGATTCTGTGGATCGTCCACCCATCTGCTCACTGTGAAGACGGAGAGGCAGAGTGCCCTACGGCTGTTCAATAGCTTTCTGTATTTTTTCAACATTGAAAAAATAATTTTTAAAAACTGTGATTTTTTTTTTAAATCATTTGGCTGGAGGGAAGGGAAAAGGGAAACACCAAAAGCTGTAACATGATTAACTGGAGATATTTAACTGGGGGCACTTTCTAGACCAAGACAAACGAATTCCGTTCTGGACCCTAAAGCAGCCAAATCTTGAGACTGTCAATGACAGAAAGCTGAAGAGAGGCCTCCATTTCCTCCTTTCTCCTTTCTTCTCTCTGTCTCAAAATTCTCTCTCGTTCTCCTTTTCCAACTTCCCTTGGACTACTGACCCAATGGCCCTTGGACTCCCATTTCATGCGTGTGTGCACACGTGCGCGCACACACACACACTTGCAAAATACCATTTTTCTTAAGGATTGTGGGACCGAATAAAATCATGTGCCTTCATTTTTTCCTTTTATAGTTAGATGAACCTCTTCCTTTTTACAGTGCTTAAAAAAAATAGGGGAGGTTGAAGTGTTAGTGGGACTTGGGCATCGCTTGCGAAGTAATTTTCATTTAACACATTCCCCCTAAATATGAACACAGACACGTCAGCCCCTTCAGGATGCTCTTTGGCCATTTAGAGCATTACCTAACCAGATATGTGACAGCCTGAACCCATTTGACTTTAGAGCAATTCCTGACAATTCTCTTTCATACACTTCTTTCATTTTTACCACAAATGAGGTGAGCAATGGCAAGCAGCCTTGTTCTCCGGATCTGGTGCTTTTGCGTGTGGCATGGGGTGGGCCTGGGGGTGGGGGAGTGGGTGTGTTTCGATAAAGGGTGCATTCCTATAGATCTCTGGTGCTGAAGGGCCTCGAGTTCCTTCCAGAGACTGCATTTGACACACTTTAAGTACACACAAGTGAATGGTATCACATGCAATATTTTAATGGAGCAATGGGAGAGGCTCTTTGAAACGGGGTTTTGCATCTTTTTGTAACATTTTGATTTCTCTGGTGCCTTATTCCTACTTGATGCTGGCACTCACATACCCACAGGGAACGGACACAGAAGTCAGCCTGGGGAGTGGGGACCCTCGAGCAGAGCGATGCTCGAGTGTGTGGGCGCGGGGGGCGTTGGGAGGTTGGTGTCAGTTGGCTGGGAAGGGACTAGATGGCATCTCTTAGCCGAAGCCAAGCAGGAACTGCACAAACCCACACAAAGTGAACAATTCCGACCTGCAAACACACCGCAAACCCACCCTTCCTCATCTGAGCTTTCCTTCCTTCTTCCTCTTTGATCTCCGCCTTCTCGCAAAGGTGCTGCTGCTGCTGCTGCTAGGTGCCCGGAGTCCAGAATGCCCAGTAATCACTCAGGCACAAGCCTGGCACTGCCACGTCAGCCCCCGGCACGACCAAACCCAGGTTTCTCTTGCTCGGGGCTGAGAACTGTCAGATTTTTCTCATCAAAAATGTTTTCCAAGGAATCAGTGGATTACAGTCATTCTGCATTGAAAATGCACTTTAAAAAATAAATAAAAGCTCCAGACTGTTTAAAATGTACAGAGGGAGCAGGGGAAAGATAAACATGTGCTAGTGTCTGAACCCAGTTCAGTTTATCTCCAGTTGAAACAATATACACTATATTATGTATAAATGTATACACACTTCCTATATATATCCACATATATATAGTGTATATATTATACATGTATAGGTGTGTATATGTGCATATATACACACATGCACATAACAAATCCAGATGCTCATTACAGATGCTACACAAACAGCAGCAGAGGAAACAAGGTTGGACTCTTGCAACAGATCACAAAAAATAAAAACAGCCACTTGCAGTGATTTTGGTTACTTCTGTATGTTCACAA
>XM_008328421.3 PREDICTED: Cynoglossus semilaevis SLAIN motif family member 1 (slain1), mRNA 
AGTGTTTTTTCCGTGTTTTCACCCAGAATATTCTTTTTAAATTGTCTCAGTACCATATAAATGTTCTTTTGTAAGGTTTTTACAAATACTTTATCACTGTATATATTATGGTTCAACGAGTGGTCGCTCAAATCTTAAAGTAGTCTTTTTTTTGTCTATCTCAAAGACAAATCTCATTTTAACGTCACTTTTACGAACATTATATTCATAATAATATTAATGTTGTGGCTGAATACAAAGACCAGCCTTTAAATGGTCGACCAGTACACTGGATTATTTTTGGTGTTTTTCTCCAAAAGAGGAGGTGCACACAGTCTTCTTTGTCACTTCGGTACGCGTGTGCATTTGGAGCGTAAACACTTCCTCAGCAGAGGAATGATGGGAAGTTCGGCTGACCAATCAGAGAGAGGCTGAGCAGTCACACCAGCAGCAGCAGCGGCGGCAGCATCAGTGTGTGAGTGTGTGTTAGGGTGAGTGTGTGTCGGTGAGGGGGGGGTAAAATCTGGACAGCCGCTCTGTTGTTGTGAATAGTTCCCTCTGCAGGCGGACACACACAGGGCCGCCGTGCGTCCTCCTCTGTTTGTGAGCCTCCCGTCGTCTCCATGTGCTTGTTACCTGATGGAAGCGGAGGTGCTGAGTCCCAGGCCGATGATGGCAGATGTCAACGGCAACAATAAGATGACCAACGCGGAGTTGGAGGTGCTGAAGCTGCAGGAGCTGGTGCGAAAATTGGAGAAGCAAAATGAACAATTGCGCACCAGGGCCAACGCTGTAAACAATTGCTCTTCCGGCGGCCCTCACCCTCACCCTCTCCCTCACCATCTCCACAATCAGCAGCAGCAGCATCTCCATCACATACATCCAGATGATGACTGTCTGAGTGGCACTTTCCCCAGTAAATATAACATATCCAGTCCTATTCGGTCCCTTTCGTCTGCGCTCGAAACCCGGAGTCCGTCAGAGGAGCCGTTCTCTTATTTCCAGCCGAGCTCCGCGTCTCCTGATGCCGCTGAGGAGCAGAGAGGAGCTGCTGCTGTAGGAGCTGCGGACACCACTGTTCTGGATGAGGTTGATATTCTGGACCTGAACGTCGTGCTCCCAGTTGGAGAACCTGATAGCTGGTTGTACGTGAGTAACAAATCCAAACAGCGCTGTGAGAGCATCCTCACTCCTCTGCAGTGGTGCAGGAAGGTTCTGGACCACCCAGGACCAGAGGTGGAGCTGGCCAGGATGACCCTCGGTCACAGACTGGACCAAGCTAAGCGTAGGCGAGGACTCTCCTCCATCCGTCCCTTCAGCTGTATTGAAGGTCTCTCCACCCTCAGCTGTCCTGTCCTGCCTTACACTAAATCTGCTTCACTAACAGAGTCTCCAGCTCCGGTGGCATCACCAGATCAGCCCAGTGCTCCAATCAGAACCAGCAACAGTCTGAGTGAGAGAGCTTCAACCTTCCTATCCAACACCGCCCTCCACAGCTCTGCTCGCAGACATGCAGCCCTCAGCCCTCAGTCTTCCCTGGACAGTGACGCTGGTGTGTCAGACCTGGACAACGAAACCATCTCTATGGGCTACAAACTGCAGGACATGACAGATGTGGAGGTCATGGCTCGACTTCAGGAGGAGAGTCTCAGGCAGGAGTACAATGCCTCTACCTCAAACACAGCCAGCCGTCGCAGCTCCACTCATCTCCAGGCTTTCNNCCGACATTCCCTGAGACGCAGTGCATTAGATCTGGAGGAAGAAGAGGAGGAGGATGAGGGGTACGACCAGCTCCCCCCTCCTCAGCCTGAACTCTTTCCAGCGGGCTCCATGCAGAGGACAGGACTGTCCCACTCTCACACCTTCTCCAGTATCAGAGACTGTAGACGCAGCTTGACCACCTCTCAGTTTTCACTCAGTGGACTCTCCCAGTTCTCTGGTCTCCTCACAGAATCACAGGCTTCTTACAGAAACAGCACAGACAAGCTACGGAAGAGCATGCCCAACCTGCTCCGAACTCCCAGCATGCCCAGTGTTCCCAGTATGCCCTGCCTGGTTTCCCCTGTCAACCCACCCTCCCACGGCCCCTCCTCCCTGCCAACAATACCCTCCCTCCGCAGCAGCCAGAGCTTTGACTCCTCCAGTGGACTTGCACGACTCCAGTCCTCCTCCATTCCTTCTCCAGGAAGCCTCAGCCAGCGAGTCCACAGCGTGACCAACTTCTCTACCGCACCTCGTCACCCTCTGAAAGCAACAGCCTATGTGAGCCCCACGGTGCAGCAGGGTCCCACCAACACTTCTCTGTCCACTTCCACCAGCCTACACTCCATCCCCAGCAGCACTGCACTGCCTCAGCCCCTGAAACCCAGCAGCATTTTGGCTCCGCAGACATTAAAGTCCAACTCTAACCAGCAGCCCTGTGTCCCTCGCAGCTCCCTCCCTCGTCCTGCCTCCTTCGTGGGAACAGGTGGAGCTCTACGTCCAAGCAAACTCACTCCACCAACACGCAGTTTGCTGACCCCTCCAAAGAGCCTGTCTACACTGAGTGCCCTGAGGGACGGCAGCTGGAAAGATGGCTGCTACTAAGTCTTCAGGTTACATATGTAGCCCTGGTTCACTAAGTGGCACGAGTGAGAAATAAATGCTATGAGAGAACCAAATTTAAAGAAGTTCCAGTGGTGCACAGGGTAATGCTGCACAGCAGGAGAGAGAGAGAGTGACTGGTACTGTTTCTTCAAAGCACTTCTTGTTGATTAAGGACTAAGCAAAGACTGTGAAGAGTATGGTTCCAGCAGGCTGGATCTGTACCGACTATCTGCTGAAGAGACCTGGCAATACGTATTCTGTTAATAAGTTGTTTGATGTGAACTGAATCTTATTTGATGTGTATTTTTATTCATTTATAAAAGTTTAATTTGAAATTAAAACTTTTTTCCAGTTGAAATCTTACCATTAATAATCCACAGCTTTTGCACGCGCCTCAATCAGTTTCAATGCAATTTAATTTGACAACATTTATTTTCCCGCCATTTCAGAGCATCTTGTCAGATTTTAAGTCATTTCCTGTGCCTGTGAATTTGCAGTAAACTCCTGTCACTTTGGTTGCTGGACCTCATAGCACTTTTGTTGGAGGATTATAAACAATGTATTAAGAGGAAAAATTATCAGCTTGACTTTAAATTTAGGTAAGATATGACTTAAGTTCAAGTAAGTGTGATTTATAAGTGTGTGGCTTATTTTTCTTTTTCTTTTTATTAATGTTTACAAAAAAATGCTGTGATTTTCAATGTTCTTTATTAATAACATAATCGCTGCAATCATATTGCACACTGAGCCCAGAGGCTCTTGGTGGATGATAAGAAAATAAAGAGGAGGTGAATTTTTAACCAAATAAACACCTTTAAAAA
>XM_048024951.1 Epithele typhae kinase-like protein (BXZ73DRAFT_88453), partial mRNA 
ATGTTTGACGACAGCGGACCCCCGTCCCCCTCAAACAACCCCCTAGCTCTCGCCCCCGTCGATCACGAATGGCAGCCCATCCTCCATGTCTCTAACCAAACCGTAGCTCGCAACGCTCGATGTCCCTATTGTCACCGTGCTTTTTCTCCCACGCATTCGCGAGGTTTCCACCCCCACGACCAAGACCTGGACGCGGAATACGAGGGGGATGACATAGAGAGGGCAAGTAACCGGGCAGCCAACTACTTCCAGCTCCTCGAGATTGCGAACGAATCCTCGAGACCACCTAGTCCCACGCAAGATTCCTCGCGTAGATCGTCGCCACAGCCGAATGCATTCCGTGCAGAGAACATGGCCGAGGGATACTTTAAGGCCTTCTTCCAGGAGGTGTGTAGGCTCGGCATGGGCGCAAACGGCAGCGTCTACTTGTGTCAGCATGTCCTGGATGAGAACCCTCTGGGGTTGTTTGCCGTCAAGAAGGTTGCTGTTGGACAGTCACATTCTTACCTCTTGAACACACTCAAAGAGGTCCGACTTCTTGAGAAACTTCACCATCCAAACATCGTCACGTATCATCACGCTTGGCTCGAGTCGTCACAGTTCTCGTCCTTTGGACCACGGATTCCAACCTTGCACATCCTTATGCAGTGGGCTGAGGGCGGAAGTCTCGACGACCTCATCGACACGCGCCTTGGACGCCGTGCCCCGAACCTTCCTCACATTAGGACCACCGCTGATGGATCCACTGAACAATATACCAGTCCCCAGCCGACTTCTCCGATAGAGCAAGAAGCCAGCCAACCATACTCACGGAATGCCCGTATACGGGCCTTCAGAGCATTACAGCGAGCCCCTCCTGAAGAACGGGAACGATTACGTCACGAAATGGGTCTCAATGATAGCGGGCAAGCCAAGTCGACGGTAAACCTGAAGCCGGTGCATCTGCTCAGCGCAGAAGAGATACATGAACTATTTAAGGATGTTGTGGGAGGACTCGCGTTCTTACATGAACGATCTATTCTGCACTTAGACCTTAAACCAGGAAACGTTCTGTTGACTTGGGACGAGGGAAAGCTTGTGCCACGAGCGATGTTGTCCGACTTCGGCACTCACAAGACATGCAATACCGGAACCTTGGAGTATTCTGCACCTGAGTCTCTGCCCGAGCCCTCGACAGGGCGGCTTCTCCAGGTGGACTCGAAGGCAGACATGTGGTCTCTCGGCATGATCTTGCACAAGTTGCTATTCTTCCGTCTTCCCTTCCGGCACACCTCCGACAATGATGATCCTAGTCGGCCAAAGGACGGCCAAGAGTATTCGGATGAGCTCGAGGCTGAGATCCTCGCATACAAGGGGTTCAAGTCTTCCGCTTCGCATATGAACACATTCGAGCCCAGACGAATACCCAAAGCTTACCTCCTGTTGCTGGAGACTCTTCTGAACGTCAAACCTTCCGGACGACCTACTTCAGACCGCGTGCTCAGCGTTATCCAAGAGGGTGGGCTTCGCCCGACGAGCCGTCCTCCGCGTAGAAATGGGCAGGCCCCTCCGGGTACACTTGCGCTAGCACGTCCAAGCGCGGCTCTCAACCCAAACCGCCTTCGAGTCAGCCCCGACCGGACCCGTCGGTCGCGCTCGCCGTCGCGCGTCCCTTCCGCCGACAGTCGCTTTGAAGCCAGCTCCGCCAATGTCGAAGAAATCCAAGAACACGACGGCGATTCGGAAGCTCCGACGGACGAGAAGGACAGGCTCCTGCCCATCCCGAAGGGCTACGCATGGACTCTGCCTTGCATCGGCAGCCTGCGCATTCCCCCCGCACTCGCCGCTCAGGCGCAAGCCATCCACCGCTGGCAGCGGCGTGCACGAATACCTGCGCTCGGATGGCGCACGCTGAAGTCCTCTATTCTTGTTGCCAAGGTCGTTTCCCTCACAGGGCCGCACCTGCATCCTAGCACGAGCGTCCATCCCATTCTAGCGGGAGCAGCGCTAATGCTTGCGGTGGTGGATACGTGGTTCGAGAGTATGGAGGCAACACTGGCGTTTGGTGCAGCGCATTTGGCGGTGCTTGCCCTTGGACAATTCACGTCGTGA
>XM_020597508.1 PREDICTED: Monopterus albus apolipoprotein Eb-like (LOC109958668), mRNA 
ATTTTATCTATGATATTCCAGGTGTGTGATTTCTGGTTATGATGAGAGTGTTTGCAGTAATCCTTGCACTGGCAGTCCTCTCAGGCTGCCATGCAAGAAGTGTGCCTCAGGATGATGGGAGTGACTTTGAAGATACCGTCCAGAAGTTCAAGGATTATTTAACATATCTGAACTCCAAGGTCGATGAGGTGGTGAAAGACATCCAGAGCTCCGAGACCGTCAGAGAACTGGACACCCTGGTCCAGGACAGCATGTCTGAGCTGGCCATGTACAGGGACGACCTGCAGAACAAGCTGGCTCCCTATGCCCAGGAAACTGCAGAGCGCCTGGGCAAAGACCTGCAACTGCTGGCTGGCAGACTCCACAACCAGATGGCTGAGACCCGGGAGCAGCTGGTGCAGTACACCCAGGAGGCGCAGACCATGATGGAGCAGGATGCTGATGACAGCAAGCTCCGGGTCTCCACCTACAGCCAAAAGCTAAACAAACGCCTCAACAAGGACATGGAGGAGATAAAGAAGCATGTTTCTGAGTACCTTGAGGAGCTTCAATCCCGGACCTCAGACAACATGGAGGACGCGAAGTCTCGTTTGCAACCTTATTTTGCTCAGGTGCAAGACAACGCCCAGGCGAAGGTCACCACCCTGAGTGATCTGCTGACGAAGCAGGTAGAGAACATGAAGGAGGAGATTCAGGGGGTGGCTGCGGGCATCAAGGACCAAATTCAGAAAACTGCTGAGGACATGAAGGAACAATTTCTTGAAACTGCTCAGAATATGCAATTCAGCCTGGGGGAGAAGGTGGAGGAGATGCGCATCTGGTTTCAGCCTCTGGTCTCCACGATCAGGGACAACATGTGA
>XM_009083577.1 PREDICTED: Acanthisitta chloris achaete-scute family bHLH transcription factor 3 (ASCL3), mRNA 
ATGCAGAACCTGATGGATGACAAAAGCTACTGTAACCTCATCTGTGCTGAGACTCAGCGTGTGCAGGTGGCCAGGCCTTTCTGTGCTGACCCACTGGTCACCTTTCACGTGTACCCAGAAACCCCAAACCAGGCCACTTGCTCTGAAGATTTCTCATTCCTTCCTTTCATGTCTGAGCACCTCCTCGCAAAGAACTTCTACAGTGAGCCCTGCAGCTTTCCTTACCAAATGCCCCATGCCAGTTTCCACAGAAATGACTACTCCTATGGGCCAGCTTTCATCAGAAAGAGGAATGAGAGGGAGAGGCAGAGAGTTAAGTGTGTCAATGAAGGCTATGCTAAGCTGAGGCATCACCTGCCGAAGGAATACTTAGAGAAACGGCTCAGCAAAGTAGAGACACTCCGTGCTGCAATAAAATACATTAGGTACCTACAGTCTGTTCTGTACAGTGATTCTGTGATGGCAGGAAAAAGTGTTGTGGAGCCAAGCCAAGCACCCAAAGCAATTAACAAACAAAACCAGTTTTTGAAGACCATCTAA
>XM_017239098.2 PREDICTED: Drosophila bipectinata uncharacterized LOC108123788 (LOC108123788), mRNA 
CGCCAAAACCAAAACAAAAGCAAAAAACAAATAGAAATACAGCCAAAAAATAAAATATAAGAAAAAAATTAAATAAATGGCTACCGAAGTGGAGCCCGCAAATACGGCGGACAAGTTTTCGGCCAATGCCGAGGAGCTGGAGAGCTATTATCTGATGCTGGAAAACGGCAGCATTCCGGAATTGCAGTGGCAGTTTCCCGGACGGAGACCGCCATCTCCGGACGTTGGCGGCGGCGTCGGATCTGGCGCCACCAACAAGGAACTGGAGCAGACTGTTGGCGAACCTATAGAACAGGAGCCCCAAAAGGCTCAGAACGACTTTGATTTCAGCGACGATGTGGCGCCCACACAGATGCGAGTCAGAAGCCAGACATCTACGCCCAAGTCGGCCAAGAAGAAGACGGCCAACTTTGCTGGCGTTATGGAAACGCTGAAGAAGAAGAATGCCGAGAGCTCCTAGCATATGCTGAAGTTCTGATGTAATCCTAGCAAGGGTACATGGGAGTATATACGATTCTAGGCGAAGTTTCACCTTAAATAGGAAGGGGAATTTTCAAATTTTTAAAGAAATATTTAAAGAAAGATTTAAATATTATTCTATAAAATCAAAGGTCCGATTTTTGAGGGCTTTTTGATGAAGATTATGTTTTAAAGTTTTAAAGTAGATGTTAGTTGTCAAGTTAGGACTATTAACAAATTCTATAATCATTACATTTACAATTTTAAATTTTAAACAAAATAATAGCTAAGTTGTGCAATTTATAATTCTTTTATAAGATTTTGATTGAAATTATAAAACCAAAAATTTAA
>XM_021934158.2 PREDICTED: Papio anubis ZXD family zinc finger C (ZXDC), transcript variant X4, mRNA 
TCCGAGCCGGACTCTGCGACGGGTCTTGGCGCGGATCGCGTCCCGGGGCAGTGCACGCACACTTGGGCGGGGCGCGGGCCGCGCTGCGTCCGAAGCGGGTCCGACGCCGTCGCTGGGCCCAAGATGGACCTCCCGGCGCTGCTCCCCGCCCCGACCGCGCGCGGAGGGCAACATGGCGGCGGCCCCGGCCCGCTCCGCCGAGCCCCAGCGCCGCCCGGCCCGAGCCCCGCGCGCCGCCGCCTGCTATTGGTGCGGGGCCCCGAAGATGGCGGGCCCGGGGCGCGGCCCGAGGAGGCCTCCGGGCCGAGCCCGCCGCCCGCCGAGGACGACAGCGACGGCGACTCGTTCTTGGTGCTGCTGGAAGTGCCCCACGGCGGCGCCGCCGCCGAGGCTGCCGGATCACAGGAGGCCGAGCCTGGCTCCCGTGCCAACCCGGCGAGCCGCCCGGAGCAGGGCCCCAGCGGCCCGGCAGTCGCCGCCGGCCCTGGCGTAGCCCCGGCGGGCGCCGTCACCATCAGCAGCCAGGATCTGCTGGTGCGCCTCGACCGCGGCGTCCTCGCGCTGTCTGCGCCGCCCGGCCCCGCAGGCGCGGGCACCGCCGCGCCCCGTCGCGCGCCCCAGGCCTCCGGCCCCAGCACGCCCAGCTACCGCTGCCCCGAGCCGCAGTGCGCGCTGGCCTTCGCCAAGAAGCACCAGCTCAAGGTGCACCTGCTCACGCACGGCGGCGGTCAAGGCCGGCGGCCCTTCAAGTGCCCGCTGGAGGGCTGCGGCTGGGCCTTCACAACGTCCTACAAGCTTAAGCGGCACCTGCAGTCGCACGACAAGCTGCGGCCCTTCGGCTGTCCGGTGGGCGGCTGTGGCAAGAAGTTCACTACGGTCTATAACCTCAAGGCGCACATGAAGGGCCACGAGCAGGAGAGCCTGTTCAAGTGCGAGGTGTGCGCCGAGCGCTTCCCCACGCACGCCAAGCTCAGCTCCCACCAGCGCAGCCACTTCGAGCCCGAGCGCCCTTACAAGTGTGACTTTCCCGGCTGTGAGAAGACATTTATCACGGTGAGTGCCCTGTTTTCCCATAACCGAGCCCACTTCAGGGAACAAGAGCTCTTTTCCTGCTCCTTTCCTGGGTGCAGCAAGCAGTATGATAAAGCCTGTCGGCTGAAAATTCACCTGCGGAGCCATACAGGTGAAAGACCATTTATTTGTGACTCTGACAGTTGTGGCTGGACCTTCACCAGCATGTCCAAACTTCTAAGGCACAGAAGGAAACATGATGATGACCGGAGGTTTACCTGCCCTGTCGAAGGCTGTGGGAAATCGTTCACGAGAGCAGAGCATCTGAAAGGCCACAGCATAACCCACCTAGGCACAAAGCCATTCGAGTGTCCTGTGGAAGGATGTTGCGCAAGGTTCTCCGCTCGTAGCAGTCTGTACATTCACTCTAAGAAACACGTGCAGGATGTGGGTGCTCCGAAAAGCCGTTGCCCGGTCTCTACCTGCAACAGACTCTTCACCTCCAAGCACAGCATGAAGGCACACATGGTCAGACAGCACAGCCGGCGCCAAGATCTCTTACCTCAGCTAGAAGCTCCGAGTTCTCTTACTCCTAGCAGTGAACTCAGCAGCCCAGGCCAAAGCGAGCTCACTAACATGGATCTTGCTGCGCTCTTCTCTGACACACCTGCCAATGCTAGTGGTTCTGCAGGTGGGTCGGACGAGGCTCTGAACTCCGGAATCCTGACTATTGACGTCACTTCTGTGAGCTCCTCTCTGGGAGGGAACCTCCCTGCTAGTAATAGCTCCCTAGGGCCAATGGAACCCCTGGTACTGGTGGCCCACAGTGATATTCCCCCGAGCCTGGACAGCCCTCTGGTTCTCGGGACAGCAGCCACGGTTCTGCAGCAGAGCAGCTTCAGTGTGGATGACGTGCAGACTGTGAGTGCAGGAGCATTAGGCTGTCTGGTGGCTCTGCCCATGAAGAACTTGAGTGACGACCCACTGGCTTTGACCTCCAATAGTAACTTAGCAGCACACATCACCACACCGACCTCTTCAAGCACCCCCCAAGAAAATGCCAGTGTCCCGGAACTGCTGGCTCCAATCAAGGTGGAGCCGGACTCGCCTTCTCGCCCAGGAGCAGTTGGGCAGCAGGAAGGAAGCCATGGGCTGCCCCAGTCCACGTTGTCCAGCCCAGCAGAGCAGCACGGTGCCCAGGACACAGAGCTCAGTGCAGGCACTGGCAACTTCTATTTGCTGTGTGGCGTTGGGCTACCTCGCTTCTCTGAGTACAAATGGTGTGTGGTGAATGGGTCCCAGGAAAGTGGGGGCTCAGCAAGAACTGATTACCGAGCCATTCAACTAGCCAAGGAAAAAAAGCAGAGAGGAGCGGGGAGCAATGCAGGATGACCCCTCCGGCGAAGGTGTCCTGCCCTCAACCCGCGGCCCAGCCGCCTTCCTCCCCTTCCTCACTGTGGACCTGCCCGTCTACGTCCTCCAG
>HE815016.2 Uncultured endophytic bacterium partial 16S rRNA gene, clone Dkk4A12.M13-F 
AACCGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGGCACTAGGTGTGGGAGGTGTCGACTCCTCCCGTGCCGTCGCTAACGCACTAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCATGTGGTTTAATTCGACGCAACGCGAAGGACCTTACCTGGGCTTGACATGTAGGTGACCGCCATAGAAATATGGCCTTCCTTCGGGACACCTTCACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCCGTTCCATGTTGCCATCATTCAGTTGGGGACTCATGGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTACACACGTGCTACATTGGCGCATACAAAGGGCAGCAATACCGTGAGGTGGAGCGAATCCCAGAAAGTGCGCCTCGGTTCGGATTGGAGGCTGAAACTCGCCTCCATGAAGGTGGAGTTGCTAGTAATCGCGGATCAGCAATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAAAGCAGGCAACACCCGAAGCCGGTGGCCTAACCTTTTGGAGGGAGCCGTCGAAGGTGGGGCTCGTGATTGGGGTGAAGTCGTAACAAGGTAACCGTA
>JQ912969.1 Uncultured archaeon clone B22pf 16S ribosomal RNA gene, partial sequence 
TTCCGGTTGATCCTGCCAGAGGTCACTGCTATCGGGGTTCGATTAAGCCATGCGAGTCGAGGGGGTTCAGACCCTCGGCGGACTGCTCAGTAACACGTGGATAATCTGCCCTATGGTGGAGGATAACCCCGGGAAACTGGGGATAATACTCCACAAGTCAGGAGTACTGGAATGTCTCCTAACTGAAAGTTGCGGCGCCATAGGATGAATCTGCGGCCGATTAGGTAGTTGTTGGGGTAACGGCCCAACAAGCCCGTAATCGGTACGGGTTGTGGGAGCAAGAGCCCGGAGATGGAATCTGAGACACGATTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAAACTTTACAATGCAGGAAACTGTGATAAGGGAACCCCGAGTGCCCGTAAACGCGGGCTGTCCCGGTGTTTAAAACACATCGGAAGAAAGGGCCGGGCAAGACCGGTGCCAGCCGCCGCGGTAATACCGGCGGCTCGAGTGGTGACCACTTTTATTGGGCTTAAAGCGTTCGTAGCTTGATTTTTAAGTCTCTTGGGAAATCTCACGGCTTAACTGTGAGGCGTCTAAGAGATACTGGGAATCTAGGGACCGGGAGAGGTAAGAGGTACTTCAGGGGTAGAAGTGAAATTCTGTAATCCTTGA
>XM_036570612.1 PREDICTED: Colossoma macropomum myosin-10 (LOC118808147), transcript variant X1, mRNA 
TCCGCTGGGTTCGGTTGAGTAGAAGCGGCTGCAGCAGCGCGGAGGGAGACGAGACTGAGTTTAATATATTTGAAGAACAAAAACTGGATTCTTGTAAAACTGGAAGGCCTGGATTAGAGGTTTATTTCAGCTGCTCACAGTCAAAGGTTTTGCCCTTCGTGGCCTGTCTGTAGTTCCTAATGCCGGAGATGGCTCAGCGGAGCGGTCAGGAGGACCCCGAGCGGTACCTCTTTGTGGACCGGGCGGTGGTCTACAACCCAGCCACCCAGGCTGACTGGACCGCCAAGAGGCTGGTGTGGGTTCCCTCGGAACGACACGGGTTTGAGGCGGCCAGCGTCCGCGAGGAGAGAGGAGAGGAGGTGGTGGTGGAGCTGGCGGAGAATGGCAAAAAGGCTCTGGTCAACAAAGACGACATCCAGAAGATGAACCCACCAAAGTTCAGCAAAGTGGAGGACATGGCGGAGCTGACCTGCCTGAACGAAGCCTCTGTACTGCACAACCTTAAGGACCGATACTACTCCGGCCTCATCTACACTTATTCCGGACTCTTCTGTGTGGTGATAAACCCATACAAAAACCTTCCCATTTACTCGGAGAACATCATTGAGATGTACAGAGGGAAGAAGAGGCACGAAATGCCGCCACACATCTACGCCATTTCCGAATCCGCCTACAGATGCATGCTTCAGGATCGTGAGGACCAGTCTATTCTGTGCACAGGTGAATCCGGAGCTGGAAAAACAGAAAACACCAAAAAAGTGATCCAGTACCTGGCACACGTTGCTTCCTCTCACAAAGGAAGGAAAGATCACAACATTCCACCAGAATCTCCTAAAGCAGTGAAGCTCCAGAGTGGACTCCTGGTCTATGGGGAGCTGGAGAGGCAGCTGCTGCAGGCTAACCCCATTCTGGAGTCCTTCGGAAACGCCAAGACGGTGAAAAATGACAACTCGTCTCGCTTCGGCAAGTTCATCCGCATCAACTTTGATGTCACGGGTTACATTGTGGGGGCCAACATCGAGACCTATCTGCTGGAGAAGTCCAGAGCGATCCGACAGGCCAAAGACGAGAGAACCTTCCACGTCTTCTACCAGCTGCTGGCTGGAGCAGGAGAACATCTGCGCTCCGATCTCCTCCTGGAGGGCTTCAATAACTACCGTTTCCTCTCCAACGGCAACATTCCTATTCCCGGCCAACAGGACAAGGACAACTTCCAGGAGACCATGGAGGCAATGCACATCATGAGCTTCTCACACGATGAGATTTTGTCGATGCTGAAGGTGGTATCAGCTGTGTTGCAGTTTGGAAACATTGTGTTCAAGAAGGAGAGAAATACAGACCAGGCCTCCATGCCTGAGAACACAGCTGCGCAAAAGCTCTGCCATCTGCTGGGGATGAGTGTGATGGAGTTCACCCGCGCCATTCTGACCCCCAGGATCAAAGTGGGCAGAGATTATGTCCAGAAAGCCCAGACGAAAGAGCAGGCTGATTTTGCAGTGGAAGCTCTGGCCAAAGCCACGTACGAGCGGCTCTTCCGCTGGCTCGTCCACCGCATCAACAAAGCTCTGGACCGGACCAAACGGCAGGGAGCGTCCTTCATCGGCATCCTTGACATCGCTGGCTTCGAGATCTTCCAGCTGAACTCGTTCGAGCAGCTATGCATCAACTACACCAACGAGAAGCTCCAGCAGCTCTTCAACCACACCATGTTCATCCTGGAGCAGGAGGAGTACCAGCGCGAGGGCATCGAGTGGAGCTTCATCGATTTCGGCCTCGACCTGCAGCCCTGCATCGACCTCATCGAGAGGCCGGCAAACCCTCCAGGTGTGCTGGCCCTGCTGGACGAGGAGTGCTGGTTCCCCAAAGCTACAGACAAAACGTTTGTGGATAAGCTGGTGCAGGAGCAGGGCTCGCACGCCAAGTTCCAGAAACCGCGGCAACTAAAGGACAAGGCTGACTTCTGCATCATCCACTACGCAGGCAGGGTGGATTATAAAGCGGATGAATGGCTGATGAAGAACATGGATCCTCTGAACGATAACGTGGCCACTCTGCTCCATCAGTCCACTGACAAGTTTGTGGCCGAGCTGTGGAAGGATGTGGACCGCATCGTGGGTTTGGACCAGGTGGCCGGTATGAACGAAACGGCGTTTGGAGCGACGTACAAGACCAAGAAGGGTATGTTCCGGACGGTGGGACAGCTCTACAAGGAATCTCTGACCAAACTGATGGCCACTCTCCGGAACACCAACCCCAACTTTGTCCGCTGCATCATCCCCAACCACGAGAAGAGGGCTGGTAAACTGGAGCCCCATTTGGTTCTGGACCAGCTGAGGTGTAACGGGGTTCTGGAGGGAATCCGTATTTGCAGGCAGGGCTTCCCCAACCGCATCGTCTTCCAGGAGTTCAGACAGAGATATGAGATCCTCACCCCTAACGCCATCCCAAAGGGCTTCATGGATGGGAAGCAGGCCTGTGAGAGGATGATCCAGGCCCTGGAGCTGGACGCTAACCTGTACCGGATTGGTCAGAGTAAGATATTTTTCCGTACCGGAGTTTTGGCACATCTGGAAGAGGAGCGGGACCTGAAGATTACTGACATCATTATCTACTTCCAGGCCGTATGCCGAGGATACCTGGCACGCAAGGCGTTTGCTAAGAAGCAGCAGCAGCTGAGTGCTCTGAAGGTTCTCCAGAGGAACTGTGCGGCGTACCTGAAGCTGCGGCACTGGCAGTGGTGGAGACTTTTCACCAAGGTGAAGCCTCTGCTACAGGTGACCCGTCAAGAGGAGGAGATGCAGGCTAAAGATGAGGAGCTGGTGAAAGTGAAGGAGAGGCAGGTGAAGGTGGAGAACGAACTGGTGGAGATGGAGAGGAAACACCAGCAGCTCCTGGAGGAGAAAAACATCCTGGCGGAGCAGCTTCAGGCTGAGACAGAGCTGTTTGCAGAAGCTGAGGAGATGAGAGCTCGTCTCGTGGCTAAAAAGCAGGAGCTGGAGGAGATTCTGCATGACCTGGAGTCCCGAGTGGAGGAGGAGGAGGAGCGGAACCAGACGCTGCAGAACGAGAAGAAGAAGATGCAGTCACACATACAGGACCTCGAGGAGCAGCTGGATGAGGAAGAAGCCGCGAGGCAAAAGCTCCAGCTGGAGAAAGTGACCGCAGAGGCCAAAATAAAGAAAATGGAGGAAGATCTGCTGCTGCTGGAGGACCAAAACTCCAAATTCCTGAAGGAGAAGAAGCTGCTGGATGAGAGGATCGGCGAGATGACCTCTATGCTGGCCGAAGAAGAGGAGAAGGCCAAGAACCTCGGCAAAGTGAAAAACAAGCAAGAGATGATGATGGTGGACCTTGAAGAGCGTCTGAAGAAGGAGGAGAAGACCAGGCAGGAGTTGGAGAAAGCCAAGCGTAAACTGGACGCCGAAACCACAGACCTGCAAGAGCAGATCGCTGAGCTTCAGGCTCAGATCGACGAGCTGAAAATCCAACTGGCTAAAAAAGAGGAGGAGCTTCAGGCTGTTCTGGCCAGGGGCGATGAGGAAGTGGCCCAGAAGAACAATGCTCTGAAGCAGGTCCGGGAGCTGCAGGCCCAGCTGGCCGAGCTGCAGGAGGATCTGGAGTCGGAGAAGGCTGCTCGGAACAAAGCGGAGAAGCTCAAACGGGACCTCAGCGAGGAGCTGGAGGCGCTGAAGACTGAGCTGGAGGACACACTGGACACCACGGCCGCTCAGCAGGAGCTCAGGACGAAGAGAGAGCAGGAAGTGGCTGAACTGAAGAAGGCGATCGACGAAGAGGCTCGAAACCACGAGTCCCAGATTCAGGAGATGAGGCAGAGACACGGGATGGCGCTGGAGGAGATCTCAGAACAGCTGGAGCAGGCCAAACGGTTTAAGTCTAATCTGGAGAAGAGTAAACAGACTCTGGAGGGCGATAATAAGGAGCTGGCGAGTGAGGTGAAGGTTCTGCAGCAGGCAAAACTGGACTCTGAGCACAAGAGGAAGAAGCTGGAGGCTCAGCTGCAGGAGGTTCTGGCCCGCGTTACTGAAGGAGAGCGGACCAAGGGCGAGCTCGCTGACCGCACTCACAAACTACAGACGGAGCTGGAGAATGTATCTACTCTGCTGGAGGATGCGGAGAAGAAGGGAATAAAGCTGGCTAAGGACGCCTCCAGCCTGGAGAGCCAGCTGCAGGACACACAGGAGCTCCTGCAGGAGGAAACGCGTCAGAAGCTGAACCTGAGCAGCCGAATCCGTCAGCTGGAGGAAGAGAAGAGCGCCCTGCAGGAGCAGCAGGAGGAGGAAGAGGAGGCACGTAGAAACCTGGAGAAACAACTGGCAACCTTGCAGTCTCAGCTGTGCGAGACGAAGAAGAAGCTAGAGGATGACGTCGGAGTTGTGGACGCTCTGGAGGAGGTGAAGCGGAAGCTGCAGAAGGACATGGAGGCCACCAACCAGAGACTGGAGGAAAAGGCCATGGCCTACGATAAGCTGGAGAAGACCAAAACCCGGCTTCAGCAGGAACTGGACGACCTCATGGTGGATCTGGACCACCAGAGACAGATAGTCTCCAACCTGGAGAAGAAGCAGAAGAAATTTGACCAGATGCTGGCGGAGGAGAAGAGCGTATCGGCGCGTTACGCTGAGGAGCGAGACCGAGCAGAGGCCGAAGCGCGGGAGAAAGAGACGAAGGCACTATCGATGGCCCGAGCGCTGGACGAAGCACTGGAGGCTAAAGAGGAGTTCGAGAGGCTGAATAAGCAGCTGAGGGCCGAGATGGAGGATCTGATGAGCTCCAAGGACGACGTGGGAAAAAACGTTCATGAGCTGGAGAAGTCCAAACGTACGCTGGAGCAGCAGGTGGAGGAGATGCGCACTCAGTTGGAGGAACTGGAGGATGAGCTGCAGGCCACAGAGGACGCCAAACTGCGCCTGGAGGTTAACATGCAGGCCATGAAGGCCCAGTTTGAGCGTGACCTGCAGGCCAGAGATGAACAGAATGATGAGAAGAAAAGAATGCTGGTCAAACAGGTGCGTGAGATGGAGGCGGAGCTAGAGGATGAGAGGAAGCAGCGTGCGCTGGCTGTGGCGGCTAAGAAAAAGCTGGAAATGGACCTGAAGGATGTTGAGGCTCAGATTGAGGCAGCTAACAAGGCTCGGGATGAGGCCATCAAACAGCTGCGCAAACTCCAGGCTCAGATGAAGGACTATCAGAGGGAACTGGAGGAGGCTCGAGCCTCTCGAGATGAAATCTTTGCCCAGTCAAAAGAAAACGAGAAGAAGCTCAAGAGTCTTGAGGCAGAGATATTACAGCTGCAGGAGGACCTGGCTGCATCTGAGAGAGCACGGCGTCATGCAGAGCAGGAGAGGGACGAGCTGGCAGACGAAATCTCAAACAGTGCCTCTGGGAAGTCTGCTCTGCTGGATGAGAAGCGCAGGCTGGAGGCTCGAATTGCTCAGCTGGAGGAGGAACTGGAGGAGGAACAGAGCAACATGGAGCTCCTCAATGACCGCTTCCGCAAGACTGCCATGCAGGTGGATACTCTGACCACAGAGCTGACCGGAGAGCGCAGCGCAGCCCAGAAGAGCGAGAACGCCCGGCAGCAGCTGGAGAGACAGAACAAGGAGCTGAAGGCCAAACTGCAGGAGCTAGAGGGATCCATCAAATCTAAATTTAAAGCCAATATCACCGCCCTGGAGGCCAAAATCCTGCAGCTGGAGGAGCAGCTGGAGCAGGAGGCCAAGGAGCGGGCAGCGGCCAATAAGATTGTCCGGCGCACAGAGAAGAAGCTGAAAGAAGTGTTCATGCAGGTGGAGGATGAGCGTCGCCATGCTGACCAGTACAAGGAGCAGATGGAGAAGGCGAACTCTCGCATGAAGCAGCTGAAGCGTCAGCTGGAGGAGGCGGAGGAGGAAGCTCAGCGCGCTAACGCCTCCCGCAGGAAGCTGCAGAGAGAGCTGGATGACGCTACAGAGGCGAGCGAGGGGCTGAGCAGAGAGGTTAACACCCTCAAAAACCGTCTCAGACGCGGAGGCCCGGTCAGTTTCCCCTCGGGTCGCTCTGGCCGCAGGCAGCTGCAGATGGAGGGCGAGTGTTCCGATGACGACGCCGAAAGCAAAGCCAGCGATGTGAACGAGACCCAGCCTGCCCAGCCTGAGTAGTTATAGTGTCCCCCTGTGGTCCTGCAGTGCTATTACACCTTCTACCCCAAAACAGTCAGCACGCCAGAAACCGTAACATGTAACCCAGTTCGTTCTGCTGCTCGCGTGGTGGAGAGCAGGACTGAGGGTCCACACACACACCTCTCTAAACACATTTATACACACATGACTCCTCCACACACCTGCGTTCTGTCTACAAGCCTAAGCTGCAACGAGCATGAGAACGATTCAGTACATACGGTCATTCCCTTCATATTCAGGGAACCTCAACTCTGCCTTACTCAATGCAGCAAAGCTTCAAGGTTGAGTGGAGTTTTGTTCTAATTAGCAATCTGTTGTAATGTTAGCCTTCAGAATAATTGCTTAAGGTGAAAACACTATAGGTACAAGTGCATTTTATATGTTCAGTTTTTTTGTGCACACAGTCATACATGAGCAGCAACTCGAGTCTAGTATAAATAAATAACGATAAAGCCACTGCTTAGCTAAAGCAAGACAGGTCTGGCGTTAGAGTACGATGTGAAATTCCAACGAAGCACAGGTTCTGAGTGTTTTTGGCTGGCGGAAGTATGTGTTAGAGATGCATGGACTTCTGTTTTCTACAAGTAATAGAGAAAAAACACAAAAATGTACATGTAACCGGCCGAACCTGTGGCTGCTTCGAATTGGATTGAAAAGTGAAGAAAAAAACTGTGAAAAAGCTACTGCTTAAGCTTCTGCCCACATTAGACAAACAAAAACACTAAGATGAAAGTACCTTCAGTCATTTCCGTTCATCCTCATTCTATTTGGGACACTTGATTGTTGAAGTATTGGGAGAGATTCCGATAAGTGATGGTATTAGACGTTGACGAAACTGGATGTAAATGCAAGATGCGAAATGCTTTGTAACTGCACATTTACTACAAGCCATACGAGGCAAAACTGGAAAGAAATCCGTACATTTTGGGAGAATGTGCACATCCACAAAAAAAAGAATAATTTTTTTGTGAAGGTTTCTTCGGAAAATATCTCATCAAATGTGTGAACTATTAGCTGCTTTATTAGACACTCCGAGAAGTGCTTTAGTACATGAAGGGAAACCGACAGAAGTGAAGGAATCATTTCGTTCAGTGGGATCATCTCGTTCACTGCTGATTTTGACTGGAACACTAACATCAAAACACATTGATGATTCACAGGCACTTAGTTCGATTTGAATCATAAACCTGAGCCCTTGAGCTTCAGCCCAAAATGTATAGAAGAGCCACTACAGTTCTCAAACACACTATTATTTCTCAGTATCAGTATTATAAAGATGATGGATTAGAAACGATACTCACCTGCTCCAATATTAGTATTTAATAATGTTTCTTTAAAAAGTGCCTTAGTCACTAATTAAGAAAATATCCATGAGTTAAATGCATTGTACATCTATAATGGTGTGTATACAAGTGCAACACTAACATGAAGGCAAAACTGGCAAAACAATATAAGAATAATAAAAAAAACACTACGTAACCCTTTCTGTTTTGTATTTTACTGTGCTTTGAATCATATCCGTTATCTAAGTCTCTCTTCCCTAGTCTTCTAGGTAAGCCATGGGCCAGCTTCAGTGTTATCTGTAGGAGTTGGAACCCTCTGCCTTGGCTGCAGAGGGAGTTGCAGGATTTTATTTGGTTAAAAGCTTTACCCCTCCACGATCTAGTTACTATTATTACAATTATCATTATTATTGCTATTGTTATCACTCTTATTATTGGGCTGGCTGTTGACAACCAGACATTCAACTGCAAATATATCTCTCCTTTTTTTCTTGTATACTGTTACTGTATTTCTAGACAACAGTGATTTTTGTAAAGGAAAAAAAAATAAAACCTTCATTATAG
>XM_017906153.1 PREDICTED: Eufriesea mexicana enoyl-CoA hydratase, mitochondrial (LOC108551834), transcript variant X1, mRNA 
CATATTGAAAAGAAAATAGCTTTCTCCACTTCATAAACATGCATTGTACTGCTCTGCTAACCTTCACAGCTTTCTTCTCTCTCTCTCTCCCTATATACATTCACCTCTCCCCGCTCTTTTTTAATCGTGTAGTCTGCTAGAATCCAGTCTGGATGATATGAGTCGGAACGAACTCGTTTTATCGTCACTCATCTCATCATTCGTTCTGTTGATTCCATAAGAAAAGTGTTTTTATTGCTATTAAAATCATAAGTTTAAACAGCATTATGGTAACTACACGTATTGGACATATTCTCCTAAACAAGAGTTTACAGATCGATCGAAAATTACCATATTGTGCGTCCAACGTAAAACATTATTGTTGCCAAGTTCAAAATTATGAATTCATCAAAGTCGAATATACTGGCGAAAACAAAAATGTGGCTTTAGTAACACTAAACAGGCCGAAAGCTTTAAATGCTCTATGTGATAAATTAATGATTGAATTGAATGATGCTATATCAAAATTTGATAGAAATGATTCTATCGGTGCCATAGTCGTTACTGGTAGCGAAAAAGCATTTGCAGCCGGAGCTGATATTAAAGAAATGCAGAATAATACTTATGCACAGAATGTGAGAGGAAACTTCCTTGCCGACTGGGACGGTGTTTCCCGAGCATCGAAACCAGTAATTGCTGCTGTAAATGGATATGCTTTAGGTGGAGGTTGCGAATTAGCAATGATGTGTGACATCATCTATGCTGGGGATAAAGCGAAATTTGGTCAACCGGAAATCGCCCTTGGTACCATACCTGGTGCGGGTGGCACACAAAGATTAACGAGGGTAGTTGGTAAGAGCAAAGCGATGGAAATGGTACTAACAGGAAATCAGATCACTGCTGAGGAGGCGGAAAAAAGCGGTCTTGTTAGTAAAGTCTTCCCAGCAGATAGACTTATTGCTGAGGCAATTAAGTCAGCTGAAAAAATTGCCTCCCATTCTCAATTAATCGTTGCCATGGCAAAAGAATCTGTTAATACTGCTTATGAAACTACTTTGAAGGAAGGACTTCACTTTGAAAAAAAGATGTTCCATGGCACATTTGCAACGGATGATAGGAAAGAAGGAATGACAGCGTTTGTTGAAAAAAGACCACCTAAATTCAACAACCACTGAGACCATTAATTCCATTATAGGAGAAGAATAAAAATGATGTAACATTTGTAAAGAAATTTTATTTAATTTTATTTAATTATTTCTTTACGTCTAATATCATAATCCATGATTATGATACATTTACAATTAACGGCTCATACCAGGTAAATATTTCTTAATAATAGCAATTCTAATGCTCTCGTAGAAGCATAGAAATGCCGTTGACATCGTAAAAGGTATCCAAGAATGGTAGGAACAATGGAATTTCACACCGACATCGTTATATAATAAATATCAAACTTTATAATAATGTGTATCTTGCTTGCTATTTGGAAATTTTTTTAATCCTGTTTTCAGATATTCTCGGAGAA
>MH775349.1 Uncultured bacterium clone 2932 16S ribosomal RNA gene, partial sequence 
TGGGGAATTTTGGACAATGGACGCAAGTCTGATCCAGCCATGCCGCGTGCGGGAAGAAGGCCTTCGGGTTGTAAACCGCTTTTGTCAGGGAAGAAACGAGTTTCTCTAATACAGAGACTTAATGACGGTACCTGAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTGATGTAAGACAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCGTTTGTGACTGCATAGCTAGAGTACGGTAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGACCTGTACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACA
>XR_003646050.1 PREDICTED: Camellia sinensis protein TPR1-like (LOC114310240), transcript variant X10, misc_RNA 
TAATCTCTCTGAATCGATCGAATCAACCTTCTTCAGCCCCATTTGATCTAATCTCAGAGCGATTGGTGATTCATCTCCGATCCAATCTCAGAGCGATTGGCAATTTCGATTTTGAGATTTTGAAGCTCCACCGCCTCCACCATCTGCACTGGCGAGGGGAGCGAGCACCATCATCTACTAAGAGCCATGTGCGGCAATTCTGTTTGGCGTTCACTTCAATGTAATTGTAATTTAAAGCTTCAATTTGTTGCTCTCTCTTTCTCTCTCTATCTGTACCCATTTGGCGTTGTCTGTTGCGTCCAAGTCACAGCAACCTCTTGATTTGCCTTTTGGTCTGAAGTTTATTTTGGACGCATTCTTGTGATTTCAACATTTCATTTTATCAAATTTGTCACAATTTCATCCAAAATTATAATCAATATCCTTAAAACAAATATGATCATATAATTGTGGTGATGATCTGACAGAGGTGCGAGTGGATTATGCTCTTCTATGGTCTGTGGATTCGGCTGCATTCAAGGTTCCAAATGCATAAGAACCACGCACTGTGACAAAGGTACTAAGGTAAACCATCCAATCATGCTCCGTAGAACTACTTTTGTGGCTCTGATCTTTGGGACCATAGCCATCTTCTTCATCAGCTCGAGTCTTGTCTTCTAGTATAAGTGGCTCCCTTATCTCTTCTTGCAAGCTGTTCTCACCTTGCTCCAAAAATTAGAGAATTCAAATTTATGGTCAAGAATTTAATGGAGAATGCTAACAAAAGGATTTTGTTCTGTGATGAAAGCCAGGATGCACCACACTATGAAGTCCTTGCCAAGAATATTGTAGATGCTATGCTGGTGGACTGTTTGTTGTGTACTTTGCTCTGCTGCAACAGGTAGCAGCATAAGAGATATTCAGTTGATTGCATGACCTTTCATCCTCTATATTTGATCCTCGCTGTCAACTTTTGCTTATGCATATCTCAGTGACTATTTTTTTGAAGTGATTCACTTATTCTTTTGAACAGGTTCCTCTTACTAATGAATTCATTACTAATGGTGCTCCTCTTGCCAGGTTACATATCCAACATCTCGTCAACATGCCACTTGGTCCTTGGATGACTTGCCAAGAACAGTAGCTTGTACCATGCATCAAGGATCTGCTGTTAACAGCATGGATTTTCATCCTTCTCATCACACATTGCTTCTTGTTGGTTTTGCTACTGGTGAAATAACGCTCTGGGAAGTGGGGATGCGATATAAATTGGTTTCAAAGCCATTCAAGATATGGGACATGGCAAATTGTTATATGCTGCTTCAGGTTCCTTTTCTTCCTTTTCTTTCCTTGTTGCTTGTTATCTTAGCATTCTATGATGTGATATATACCTATGATATGAGATATCTATGGAGGTTGTAAACAGCATGTACAAATTAATTGTGACCAGATTATTTCTTGTTTGATTTGGGGACATTTATAATACTAATCTTCAACTA
>XM_016745472.1 Penicillium expansum Zinc finger, DPH-type (PEX2_082020), partial mRNA 
ATGGCCGACGACGGACTGAACATCTACGACGAGATCGAGATCGAGGATATGACCTTCGACCCGAATATCCAGATCTATACATACCCTTGCCCATGTGGCGACCGATTCGAGATCGCAATCGACGATCTGCGCGACGGAGAAGAGATCGCCGTGTGTCCGAGTTGCAGTCTGATGATCCGGGTTATCTTCGACTTGGTATGTTTCCCTATCGTCCAACCAGACGCCGATCTTCCTAAAGCCGATGCGCAGAGTACGAGTGGCGTGGCTGTTCAGGCTTGA
>XM_047872644.1 PREDICTED: Prionailurus viverrinus adenylate kinase 4 (LOC125173463), transcript variant X6, mRNA 
TGGTGCGGCTTAACCGCGCCCCAGGAGGGTGCCGAGGCTCGCCGGGAGGAGGGTGGGAGGTGCATGCTTCTCCTCTCCTCGCCTGGACTCCTCTTGCCTTGGGGAAAAGCCTGTAACCACCCAGCTGAGGGAGAACCAGACAGCTGAAAACCCCGAGCTTCCCTCTCGCCCTGCTTCCTTAAGGATAAGCCCTCCCAGCCCACGCGTCCCCGGGGAACTGGGGCGTCCCCCCGCTCTCGCCGCCCACCTGTGGGAGTCCGGTCCCGCTGCGCTCTGGGGAACCTGTGGCGCCGCGGGGCCCCCAGCCGCGCACTGTTCCTGCCCCTCTGCGTCACCCTGGGCCTCCGGGCAGAGCCCTGGTGGCTTTGAAAGGCCTGTCTGTCCGCTGCCGCCTTCTAAGAAGTTGGTGATATGGCAAAGCAGTACATAGAGAAAGGTCTTTTGGTTCCAGATCATGTGATCACACGCCTAATGATGTCGGAGTTGGAGAATAGGCGCGGCCAGCACTGGCTACTAGATGGTTTTCCTAGGACATTAGTACAGGCTGAAGCCCTGGACAGAATCTGCGAGCTGGATCTAGTGATCACTTTGAACATTCCATTTGAAACACTCAAAGACCGTCTCAGCCGACGTTGGATTCACCCTCCCAGTGGAAGGGTGTATAACCTGGACTTCAATCCACCTCATGTGCATGGGATTGATGACATTACTGGTGAACCATTAGTCCAGCAGGAGGATGATAAACCTGAAGCAGTTGCTGCCCGGCTAAGACAGTACAAGGATGTGGCAAAGCCAGTCATTGAATTATACAAGAGCCGAGGAGTGCTTCACCAATTTTCTGGGACGGAGACTAACAAAATCTGGCCCTATGTTTACACGCTTTTCTCAAACAAGATCACACCTATTCAGTCCAAAGAAGCATACTGAGCCCGCCCAATGAAGAACCAGGAAGATGTCATTCATTCAGTTGTATGTGTAGTATTGGTGCCGTGTCCAAATTAGAAGCTAGCGGGGATAGCTTGCAGCGTCTTTTCTAGTCTAAATGGTGAACTGAAATGAAAACAAATGAGGAGAAAGAGTTAATGAAGAGGCTCTTCTCTGCCTTTCTGATGAAGGGTCACCCACACATGTCTAGGATGTCTCTGCATGTCTCAAGCCCTTCACAAGAAAGCAAGTACAGGCTGGATTTCAAAGGGTGTATAACCCAAACTCTAGCTGATTTCTGACCATCACATTGTTGCCATAGTAGCCTTTTAACATGTGATGGTGTTGGCCTCTGGTTCTCCCTGCCCCCCAAAGGCTATTGAACCACAGCACCAGGTGGCCTGAGAATGCCAAGGGCAGTAGCCCCGGCCTTGTCCCAAGTTCTCTGGTATGTGCCCTTCCTGGTGACCGTGCGATTGAAGCCAGTTGCTCTGTGGTCACTTCTCTGGCCTTGAGTGACTGTCCACAATTAGCTTTTCTGTTCAGAGTGATACCTTTTTCTGCCTCCATGCTCTGTAGAGTCTCTCCTTTTTCAGACATCCTGGAATGAAAGGATTTCGCTTCTAGTATTTTTATTAGACTGTATTTTGGTACATCTGTTTTCTCTCTTCCTAGACTATGAAGTAATAGATAGTTACTGCTTTTATCTCTCTCAGATTCCTTTCTAAGAGCCGAGAGTGAGGGGAGGGTGTCCAGATGCTTCTTGCAGCAGGAACTGAGCTCTGCAGAGGGTCTACTTATGCTGCTGGGCTGACCCTCATGGGTTGACACTGCTCTTTTCTTTTATCATGAAAAAATAAAATCCTCAAAGTCTTTGGGAGTCTTCAGAAAAATGGGAGATACTACATACATGTTAAAGAATCATATCTTGTGTATAGAAGTAATAAGACCATATGGAATTACTGCACTAAAAGAATAGTTTAGCTTTTTATTCAAGACAAAAAAAATGTATTTTGAAATGCTGCTAAATATTGATGCTGACAGTGTTTTTCTCCTGGGAGTGACCCAAACATATTATAAATAGTTGGTAAAGGGAATGGAGCCTGTGTGTTGAGGAAAATGTTGCACTAGCTGTGCCCAGACTGAGTATGACAGCTTTGTGATTATGGGAAAACAAATTCTTAATTTTTTTTTCTTTCTATTCCAAAGATGCTTTCTGTGGGGTGGCCATTAAGTCTAGAAATATAGATGATACAATTTTGTCATTCTTTGTAATGTAATATCAATAAACCATTTATTAAAGATTTGCCTGGTTTCCAGACTTGGTGGCCACCTAATGTAATTCTGGCTCTCCTCTGGGAAGGACAATGAAATTTATTCCTGTTGCCTTAAAAATAAATACCCCTCTTCATGCATCGTGATTGTCCCCAAGGAGGGTTCTTTGCTATTCCTGAGAGTGACTTCTAACTCCTCATACTGAAGAGAAGGGGGGGGGGGGGGGCGGGGAGCCTATTTCAGCACGCCTCTGGTGTTGCAATGCATTGTTTATTTTCTGAAGATGTCCTGGAGAATCTCCAGTCAATTCCCTGGCAGATGTGTTCTGTATGGTAATCGTTGCATCTTCCTTACAAATACTGCCCCACTCTTGACAGTTCCTCTCCTCTATACCTTCGTGAGAATGTTCTTTGACTACCTTAGTGGAAACATAGACTGGTCTCCTCCTCATTCTCTGAATCACCATGTTACTTTTTGGGTGTATGCAATGGAGGTGCCCAGTTCAGGTCTGTGAAACATCAGTGCATGATATGGACTTCTAGTGCTTTAGAAGAGCCGTGTTTGAATGCCGGTTGGTGGGGACAGGGTGAAAATCAGACCTGTAGGTAAAGCTCAGGTTTCCTGGGGAACCAGGTACGGAGAAAACAAACCTGATATGAAGAAAGTTGCACAATTTAGACTAGTACTGCCATGGAGACAATTTCTAAAAACTAGGAAAAGTAGAGAGTTAAGGTTGTTTTATGGGTAATTCAAGAGAGGAATGTGTGTGTCCTTTTGTAAGTGGAAAAATCTACATGACTCTTCCTTTACTTCTCTTTTTGTTTAACAGACTCCCTTTGGAGTTTTTGAGAGAGTTATGGGAAATGGCTGGTCCCTGGTGCCATACTCTAGTTCTCAATCCTTCCCTCCTCTCCTCCAGCAGAATAGATAGTTATAGTCAGTGTGGGAGCCTCTCAGTGTCTCAACAGCATTTGCTGTTTCTGTGCTTGGTGAGGGCCCTGTGCTTGGTGAGACCAATAAAAAAGACAAACACCTTTTCCATGCGTCTTTGAAAGATGATACTTATTTCATGTTCAGTGGCCTAAAAAGTCTATTTCAGATTTTCTTCAACAAGCTCTCTAGCATTTTCTCCAGTAATTTTGTAAAAAATTAAAATTCTCTTGAAAATATTTTGATAAAAGCTAAAGGGACATCTTTTCTTGGTTTTTCTTCTACTGCCACAGATACGGTTCCTTCACAGTTCTGCAAAGAGAGTAATTTGGGTGTCTATAAGATTCCTACCGGTCCACATATTCTGTGATTTAGCCAGTTGTGAATTAATTTTGCTTTTCATTGTCTGAACAGGCTTCCCACTTACTTAGAACTTGGAGACATTGCTGTGTTTAATATCCTTTAACACTAAGGCAGACATAAAATAAGTATCATTTACTGAAGGCCTTTGGGCGATAGGTAAAGTTCTAGGACCTTAGCAAACACTCATTTAATCTTTCAAGCATCCTTTGAGATAGGCATGAAGCCATGTTTATGAACAAGGAAGACAAGGGTCAGAGATGTGAAGCATCTTGCCCAGGCTCTTGCTGCCAACAGACAGTCCAGCCAGGACTCACACCCAGGTTTTCCTGATTCTGCAGCCTGAGTTTGCTCCTGGATGTTAACTATCTGTGTCCTGTCCCAACCAACCTAGGGTGCTGAGCCTGCTTGATTTTGCTCGTATTTCCAAGTGGCCTCATCAAAAGTAGCAGAAGTGACATTCAGCTCTATATGGGACTGTTCTCCCCCTCCCCGCTTTGCTTAAGCAAAGGGAGCTGCTAGAGGAAGATCTGAGCCTTTGATCTTCTTTCCTAACTTCTCACTTATAAAATGAAAGGCTGTTGAAATAGGCTGGGCTTGGGTCCAGGCTAATCTGTGGAGGGGTCAGGTTCCTTCATGTTCCTCACCTACCTAGGCTTTTGGTATCCATGGTATTGTACCCCTAAGAGACCTTAACACTTCAGCCGCCTTCAACTATAGGGCTCCCTGTAGATCTGGGCTTCTGGGAGTTAGATGCTACTCACTTTTCTTCCCTGATACCAGGAGAAATTACTCCCTTACTCCCACCCCCAAATAAGGCCCTGATGATAAACATCCTTCCTGAAGTGCTGGCAGGTGATGGAGCCCCCAGCATACCATCTTGCCTATGTCACATTGCGTATTAACATGATCCTGAATGCTACATTCACACCTTTGCGTGCCATCTGATGTGGCACTGCTTGTCATGCACAATTCTGGTGGAAACCAGGGGAGATTGGTTTCCTGTGTTATCCGCCCTGCCCAGGGTCACTCCCCACCACCCTCCAGCAGCCAAGCTCAGATGAGCTCCAGCTTTACCCAGGGTGTGCCCCTCCCTTTGGTAGGGAAGGAAAAAGGTAATAACAGCCAATGGATAAAAGGGATTCTTGGAAAGAGCTACTGCTGTGGCTTCGCCCACCTACCACTTAAAAATGTTGAGACAGGATGGTTTTAGATAGATGGGTGCCTGTGCAAAACCATAAATAGGACTGTTAGAAAATTTAGTTCACTAAACTGATTTCAGTATTTGACTTTAGCTGTTTAGCAGTTTAAACAGCTTACCAGCCTGCTGGGGGTCCTGCTTAGGTCATAAAGACCACAAATTTCAAATATGTTAAGACATATGCATTCCTAGTAGTTCCTGTTTATTGGTACTTAATGCTAAGTGCATTATGTGCATTGTCTAATTAAATCTGCAGTAGTTACCCTAACGTAATAGATGTTTTAGTTATCTAGCCTCTGTGTAAAAACTGCAATCATTCTGTTCACTTAAGTTTGTATTTTCATGTATCTATAGGGATTAATCAAGAAATCCAAAAGGGCCTTTTTTTGTACCTTTTCCTCCTTTGAGTTCCCCATTCTAATTAATAGGTAAAGCAGTGTTATTTGATTGTACTTGGAATCTTTGCTTTTGGCACTCTGGTGCTGAGGCAAGAAGTGGGCACTCAGTGGGTCTTGGTGGTAGTTGCACACTGTATATACAGAGAGCATATATCTCATCTGCACTCTGCTGAGTTACAGGATCTCGGGAGACATTCATATCTACCTGATGAATTTCATTTATTACCTTTCATTTAAAACACAGTATCTTTTTTTGCTGCATTTAATTTTGCCAGAGAGGCAATTCATAAGGCCAAGTTGTGTTCTTAGTATGAATTGCTTTCTATTTCCCTTGCATTTTTAGTAACTCCCTGGTCTATTTGGTGTCTCAAAAGGAGAACCTAGCAATGCAGCCTGTTTTTTTTGTTTGTTTGTTTCGTTTTGTTTTGTTTTTTTTTTTTAATACGGGAGTGTGGTCTAGTCATAAGTTATCATCCCTTTCCACATATAACTGATCCAGTCTGGTTTCTAGATGAAGAGTGTGCAAGAGCCAGATGTTGGGAAACCCATGAAGCCGTATTTCAACTATGAAGAAAAATATACTTCCTGCATCTGTTGAGATATACTATAATTACAGTTGTTCATAAATGCCATACCTTATCTTTCTTTTAACAAATTGCACAATTCTTGCCAAAATAAATGCCATTATTCTGTATGCTTCAGGGAAATTCCCCCAATTTGATCAGTGAGCATATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTAGGGAGAGGGAGGGAGAGATGGTGAAACATTTCCAAGGGGACAAGAGCCCTTGGATGGCATGGATGTGCATTCCTTCCGGGTAATAATTACGCTATTCCAGGAAACAGCATGTGTCTTCCTGGAAATAAAGATTTCCTGTCTGTAACTTTTGTAAGTTACACCAAGTGCACCTTGTGATTCTCCCTGGGGTTGGTGTGTGTCTAATTCCATTTCATAAAACCTTTCTTCATTTTAAAGCTTTGGCTGTGAAGTCAGAAATGTGCTAAATAAAAACAAACTGTTTTGTATTTAATTTAGAGAAGGGTAAAGGGAAGAAAAAAAAAAAAACTCAGTCTTTATGTAAGCTCCAAGGTGTTAGGGCTTAGAGGGTTTTTCTAGTTTTATGAGAATTTGTACTACTGATTTTTATATATTCCTGTTTTTGAGATGAACAGATCTCTGGGGAAATTGTTGCATTACAATGGCGTTTCACTGTGACCCCTCTCAAGCTCAAATCTGTTCTCTTAAGCCAATGACAACTTGTCACTTCGGTTTACTGTCCTGTGAAAAGTCAGCTCCAGTTTCCCAGAAGTTGTGTGTTTATGATGAGTCAGTGCTTTTCTTCAGTGAAAGTTGTCAGCCTTCTTGATTTGGGTGTATGTGCTTAATTCAGAGTATCTAAACCTGTAGTCTAATCTGTACATGCTCTCCTAACTGTTAATTGTTATTGACTATTTTGATTATCTTGCTTGAAGATTGATTCCTACTTTTTAATTTGATAGAAATAAAGTTTTTTTTTCCTGCTTATAACTA
>XM_032280742.1 PREDICTED: Sapajus apella ubiquitin specific peptidase 32 (USP32), transcript variant X1, mRNA 
GGCTGGCGGGAGGGGGCGGGGGAGGGAAGAGGGCGTGAGGAGGGAGGAGAGAGAAGGGCGGAGTAGGAGGGAGGGAAAGGGGGGCGGGGTGGAAGCGGGTCACGTGATCCACCATGGAGGCGGTGGCGGCGACCGGGAGGAGCCGCCGGGGCAGAAGCCGCACTTGTTAGTGTGGGGGGAGGTGGGGGTGGGGGACGCCGACACCGTCACCCAGGGACGCCGAGGAGAAGGCGGGAGGGGGGTGGGGGCGAGATCAGGCTCCGACCCCCGGCCGAGGGGATGTGGGGAGCATGGGCGCCAAGGAGTCACGGATCGGATTCCTCAGCTACGAGGAGGCGCTGAGGAGAGTTACAGATGTAGAGCTAAAACGACTGAAGGATGCCTTCAAGAGGACCTGTGGACTCTCATATTACATGGGCCAGCACTGCTTCATCCGAGAAGTGCTTGGGGATGGAGTGCCTCCAAAAGTCGCTGAGGTGATTTACTGTTCTTTTGGTGGAACATCCAAAGGGCTGCACTTCAATAATTTAATAGTTGGACTTGTCCTCCTTACAAGAGGCAAAGATGAAGAGAAAGCAAAATACATTTTTAGTCTTTTTTCAAGTGAATCTGGGAACTATGTTATACGGGAAGAAATGGAAAGAATGCTCCATGTGGTGGATGGTAAAGTCCCAGATACGCTCAGGAAGTGTTTCTCAGAGGGTGAAAAGGTAAACTATGAAAAGTTTAGAAATTGGCTTTTTCTAAACAAAGATGCTTTTACCTTCTCTCGATGGCTTCTATCTGGAGGTGTGTATGTTACCCTCACTGATGATAGTGATACTCCTACTTTCTACCAAACTCTGGCTGGAGTCACACATTTGGAGGAATCAGACATCATTGATCTGGAGAAACGCTATTGGTTATTGAAGGCTCAATCCCGGACTGGACGATTTGATTTAGAGACATTTGGCCCATTGGTTTCACCACCTATTCGTCCATCTCTAAGTGAAGGTTTGTTTAATGCTTTTGATGAAAATCGTGACAATCACATAGATTTTAAGGAGATATCCTGTGGCTTATCAGCCTGTTGCAGGGGACCCCTGGCTGAAAGACAAAAATTTTGCTTCAAGGTATTTGATGTTGACCGTGATGGAGTTCTCTCCAGGGCTGAACTGAGAGACATGGTGGTTGCACTTTTAGAAGTCTGGAAGGACAACCGTACTGATGATATTCCTGAATTGCATATGGATCTCTCTGAAATTGTAGAAGGCATATTGAATACGCATGACACCACAAAGATGGGCCATCTTACTCTGGAAGACTATCAGATCTGGAGTGTGAAAAATGTTCTTGCCAATGAATTTTTGAACCTCCTTTTCCAGGTGTGTCACATAGTTTTGGGGCTAAGACCAGCTACTCCAGAAGAAGAAGGACAAATTATTAGAGGATGGTTAGAACGAGAGAGCAGGTATGGTCTGCAACCAGGACACAACTGGTTTATCATCTCTATGCAGTGGTGGCAACAGTGGAAAGAATATGTCAAATACGATGCCAACCCTGTGGTAATTGAGCCATCATCTGTTTTGAACGGAGGAAAATATTCATTTGGAACAGCAGTACATCCTATGGAGCAGGTTGAAGATAGAATTGGAGGCAACCTCAGTTATGTGAATTCTACAGAAGAGAAGTTTTCAGACAACATTTCTACTGCATCTGAAGCCTCAGAAACTGCTGGCAGCGGCTTTCTGTATTCTGCCACACCAGGGGCAGATGTTTGCTTTGCTCGACAACATAACACTTCTGACAATAACAACCAGTGTTTACTGGGAGCCAATGGAAATATTTTGTTGCACCTTAACCCTCAGAAACCAGGGGCTATTGATAACCAGCCATTAGTAACTCAAGAACCAGTAAAGGCTACATCATTAACACTAGAAGGAGGACGCTTAAAACGAACTCCACAGCTGATTCATGGAAGAGATTATGAAATGGTTCCAGAACCTGTGTGGAGAGCACTTTATCATTGGTACGGAGCAAACCTGGCTCTACCTAGACCAGTAATCAAGAACAGCAAGACAGACATCCCAGAGCTGGAATTATTTCCCCGCTATCTTCTCTTCCTGAGACAGCAGCCTGCCACTCGGACACAGCAGTCTAACATCTGGGTGAATATGGGTATGATGAGCCTGAGAATGTTTCCTCAGCATTTACCGAGAGGAAATGTACCTTCTCCGAATGCACCTTTAAAGCGAGTATTAGCCTATACAGGCTGTTTTAGTCGAATGCAGACCATCAAGGAAATTCACGAATATCTGTCTCAAAGACTGCGCATTAAAGAGGAAGATATGCGCCTGTGGCTGTACAACAGTGAGAACTACCTTACTCTTCTGGATGATGAGGATCATAGATTGGAATATTTGAAAATCCAGGATGAACAACACTTGGTAATTGAAGTTCGCAACAAAGATATGAGTTGGCCTGAGGAGATGTCTTTTATAGCAAATAGTAGTAAAATAGATAGACACAAGGTTCCCACAGAAAAGGGAGCCACAGGTCTAAGCAACCTGGGAAACACATGCTTCATGAACTCAAGCATCCAGTGTGTTAGTAACACACAGCCACTGACACAGTATTTTATCTCAGGGAGACATCTTTATGAACTCAACAGGACAAATCCCATTGGTATGAAGGGGCATATGGCTAAATGCTATGGTGATTTAGTACAGGAACTTTGGAGTGGAACTCAGAAGAATGTTGCCCCATTAAAGCTTCGGTGGACCATAGCAAAATATGCACCCAGGTTTAATGGGTTCCAGCAACAAGACTCCCAAGAACTTCTGGCTTTTCTCTTGGATGGTCTTCATGAAGATCTCAACCGAGTCCATGAAAAGCCATATGTGGAACTAAAGGACAGTGATGGCCGACCAGACTGGGAAGTAGCTGCAGAGGCCTGGGACAACCATCTAAGAAGAAATAGATCAATTGTTGTGGATTTGTTCCATGGGCAGCTAAGATCTCAAGTCAAATGCAAGACGTGTGGGCACATAAGTGTCCGATTTGACCCTTTCAATTTTTTGTCTTTGCCACTACCAATGGACAGTTATATGCACTTAGAAATAACAGTAATTAAGTTAGATGGTACTACTCCTGTACGGTATGGACTAAGACTGAATATGGATGAAAAGTACACAGGTTTAAAAAAACAGCTGAGCGATCTCTGTGGACTTAATTCAGAGCAAATCCTTCTAGCAGAAGTACATGGTTCCAACATAAAGAACTTTCCTCAGGACAACCAAAAAGTGCGACTCTCAGTGAGTGGATTTTTGTGTGCATTTGAAATTCCTGTCCCTGCATCTCCAATTTCAGCTTCTAGTCCAACACAGACAGATTTCTCCTCTTCGCCATCTACAAATGGAATGTTCACCCTAACTACCAACGGGGACCTGCCCCGACCACTATTCATCCCCAATGGAATGCCAAACACTGTTGTGCCATGTGGAACTGAGAAGAACTTTACAAACGGGATGGTTAATGGTCATATGCCATCTCTTCCTGACAGCCCCTTTGCAGGATACATCATTGCAGTCCACCGAAAAATGATGAGGACAGAACTGTATTTCCTGTCGTCTCAGAAGAACCGCCCCAGCCTCTTTGGAATGCCATTGATTGTTCCATGTACTGTGCATACCCGGAAGAAAGACCTATATGATGCGGTTTGGATTCAAGTATCCCGGTTAGCCAGCCCACTCCCACCTCAGGAAGCTAGTAATCATGCCCAGGATTGTGATGACAGTATGGGCTATCAGTATCCATTTACTCTACGAGTCGTGCAGAAAGATGGGAACTCCTGTGCTTGGTGCCCATGGTATAGATTTTGCAGAGGCTGTAAAATTGATTGTGGGGAAGACAGAGCTTTCATTGGAAATGCCTATATTGCTGTGGATTGGGACCCCACAGCCCTTCACCTTCGCTATCAAACGTCCCAGGAAAGGGTTGTAGATGAGCATGAGAGTGTGGAGCAGAGTCGGAGAGCACAAGCCGAGCCCATCAATCTGGACAGCTGTCTCCGTGCTTTCACCAATGAGGAAGAGCTAGGGGAAAATGAAATGTACTACTGTTCCAAGTGTAAGACCCACTGTTTGGCAACCAAGAAGCTGGATCTCTGGAGGCTTCCACCCATCCTGATAATTCATCTTAAGCGATTTCAATTTGTAAATGGTCGATGGATAAAATCACAGAAAATTGTCAAATTTCCTCGGGAAAGTTTTGACCCGAGTGCTTTTTTGGTACCAAGAGATCCAGCGCTCTGCCAGCGTAAACCACTCACACCCCAGGGAGACGAGCTCTCCGAGACCAGGGTTCTGGCAAGAGAGGTGAAGAAAGTGGAAGCGCAGAGTTCGGCCGGGGAAGAGGATGTGCTCCTGAGCAAAAGCCCATCCTCACTTAGCGCCAACATTATCAGCAGCCCAAAAGGTTCTCCTTCTTCAACAAGAAAAAGTGGAACCAGCTGTCCCTCCAGCAAAAACAGCAGCCCTAATAGCAGCCCACGGACTCTGGGGAGGAGCAAAGGGAGGCTCCGGCTGCCCCAGATTGGCAGCAAAAATAAACTGTCAAGTAGTAAGGAGAACTTGGATGCCAGCAAAGAGAATGGGGCTGGGCAGATCTGTGAGCTGGCTGACGCCTTGAGCCGAGGGCATATGCTGGGGGGCAGCCAACCAGAGCTGGTCACTCCTCAGGACCATGAGGTAGCTTTGGCCAATGGATTCCTTTATGAGCATGAAGCATGTGGCAACGGCTACAGCAATGGTCAGCTTGGAAACCACAGTGAAGAAGACAGCACTGATGACCAAAGAGAAGACACTCGTATTAAACCTATTTATAATCTATATGCAATTTCGTGCCATTCAGGAATTCTGGGTGGGGGCCATTATGTCACTTATGCCAAAAACCCAAACTGCAAGTGGTACTGTTACAATGACAGCAGCTGTAAGGAACTTCACCCTGATGAAATTGACACCGACTCTGCCTACATTCTTTTCTATGAGCAGCAGGGGATAGACTATGCACAATTTCTGCCAAAGATTGATGGCAAAAAGATGGCAGACACAAGCAGTATGGATGAAGACTTTGAGTCTGATTATAAAAAGTACTGTGTGTTACAGTAAAGCTACCACTCTGGCTGCTAGACAGCTTGGTGGTGAGGGAGATGACTCCTTGTAGCTGACATTTGGCAGAAGCGTCACTGAAAGGCAAGCTAAATGTAGTTATTTTATCCTGTGACCCTGAAGCACAAAATAAAAATTCTAATTAAAATAGTTAACTTTAAGAGTAGTAATAATTTTATTTTGAAGTCTCATACAAGCTCTCCGACAGAGAACTTTCAGGCAGATCCCACCATTAGCCTGTAAACAAAGGGTTTGGCACCAGCCACCTGGGACCAAATAAGAATTCAACTGTGCTTGTCCAGATGTGAACAAATATGTAGTGAGTATAGAGTTTACCAGTAATCATAACAAATATTAAAGATTTCCTTGGAGTCAAAGTAAAAAACAAAAAATTATAATGTTGTCTAGGGACGACATGATATGCTACCTCCTTTTTCCTGAAGTTTTATTCCATTATATTGACAAGATGGAGAAAGCAAGATCATGAAGGTGTGCAAATGATTCTTATGGCATGGATGATGATTTTTTGATTTATTTTTTAAATTGTTTCCCTACTCTGTCTTTCTTGTTTTTTGTTTTTGTCATTGTGTTTGAGTTTGAGACACAACCAGTCATTGGTGGCAGGGGCATATAGTGGTTAGTCTGAAAGGGAGGCTTTCTTAAGAGCTATGTGCCTTCCACCCAGAGCCTTGTGGGAGACCCAGTAAAAAGGAAAAGCATCCTGGGAAATCCAGCTACCATGGCCCTCCCAATGGAGGCATCTTACATTTAGGATACTTCAAGTATCCTCAGAAATGTATTCTGCACCCCCGGCCCCACCCATGCTGAGGGAGGGGATGTTTGCCAATATTTGCATCATCTTCACATGCACATGTTGCAACAAGAGCTTCTGGGAAGGTAAGCAGCATTGGAGCTAGATCAAGTTTCACAATTAGTGGTTCTTTTCCGTGTTTGTTTTGCACTTTAAAAAGGAGAGAACACATGCAAATGAATCTGCTTGTGTGTATTTGATGGCTCTAAGGGCTATAAATTAAAACAAAACACATCCCAGACATTGGGATTTCATAGATTTATTTAAGGAAGTTGGTAGTTTTAGGAAGTCAACTTTAGTTTTGCTTTATTTGCATGTCCACTAATTTTTTTATTTTGATATTTGTCTTTTTAAAAAAATTTGCAGTAGTTATTAAAAGTTATGTTTCTTTGCTTACTTCATTTTTTTCTCCAATTATTCAAGACTGGAACAAACATAAATATTATTTATTTCAGGTAGCATTTTTTTTCTGTGTAGTTTTTTAATATATATTTGAAGGAAATGTTTCATCTTGTTTTTGGTCTTTGTTTATTCATTTAGACCCTGCAAGTTGATTCTCATTAATTGTCAGATTCCACTACCCTTTCTTCCTCAGAGGTAGTAATTACCAATGTAACTAAGCATTTGTATTCTGATATCTGAGGCCAGTAACTATTAATATCTAGTTCTTTTCAGAGCATTTGGAATGGTTACCTTAAATGACTACCTAAATTGAAATCCTTTTCAGAAAAAATATAATTACAAGTAGAAAGGAGTGGCCTAAATTGTATAATGTAATAAAGTCAGACAAAATGCATACTTTATAGTTTCAGATTTTCAGTATATAAAATGTGTCCATTCCTACCTGGACATGTCCCATTAAAAAGTGGAAGATTTTAAATAATTTCTTTACAGATGTTTTATTTAAGCAGGTAGCACAATCTACTAATGTTGTTTGATCTGTGTTTGTTATACTGGTTGTAATTAATTTTTTTAATTCACGAACTAGCAGAAAGTTTATTAAATTAACTATTAACTACATTCACCTTGTAAATTACTGTATAAAACTTGTTGACAATGCACTGACTTTAGAAAGATGTTAATGTACATAAATAGAGTGTAAATAAAATAGTGTTGATGTACTGAAATATGAACTGTATAAAAAGTATTGGTAATTGTATATGGGGTGTACCTGTTTATCTGTAACTATTATCCAAACAAATTAAATACTGTGGATGCCTCTATGTGCTGTTTTGCCTCATACAAGTAAACACAGAAAGTCAAATTCTTCAA
>HQ846933.1 Monilinia fructicola isolate HAG7 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
CCTCCCACCCTTGGGTATTATTACTTTGTTGCTTTGGCGAGCTGCCTTCGGGCCTTGTATGCTCGCCAGAGGATAATTAAACTCTTTTTATTAATGTCGTCTGAGTACTATATAATAGTTAAAACTTTCAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCGGGGGGCATGCCTGTTCGAGCGTCATTTCAACCCTCAAGCACAGCTTGGTATTGAGTCTATGTCAGTAATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGAACGTAGTAATATCTCTCGTTACAGGTTCTCAGTGTGCTTCTGCCAAAACCCAAATTTTCT
>XM_035415524.1 PREDICTED: Anguilla anguilla abl interactor 1-like (LOC118226150), transcript variant X7, mRNA 
TCAGTTTTTTTGTATGTAGCTGGTGAAAGGTCGCTGTGGTGAAATCGAGGCCAGGAATCCCACAATACTAGGCGAAGGAGCTCCTTTTCGGGGCTGAGCTTGTGGTTTTAATCAAAGGGAAGGCGAAGAAGCGATGCAGAGACATGTAAGATGGCAGAGTTACAAATGTTGTTAGAAGAGGAAATTCCAGCCGGCAAAAGAGCCCTGGTAGAGAGCTACCAGAACCTCACGAGGGTTGCGGACTATTGTGAAAGCAATTATGTTCAGGCCCAGGACAAGCGGAAAGCTCTGGAAGAGACCAAAGCCTACACCACCCAGTCTCTGGCTAGCGTGGCCTACCAGATCAATGCCTTAGCCAACAACGTGCTACAGCTGCTGGACATCCAGGCATCCCAGCTGAGGAGAATGGAGTCCTCCATCAACCACATCTCCCAGACTGTGGACATCCACAAGGAGAAGGTTGCCAGGCGAGAGATTGGAATTCTGACCACAAACAAGAACACCTCGAGGACCCATAAAATCATCGCCCCCGCCAACATGGAGAGGCCGGTGAGGTACATCCGGAAGCCCGTAGACTACACGGTGCTGGACGACGTGGGCCACGGAGTCAAGTGGCTGAAAGCTAAGCAGGGGAACAACCAGCCGGCCAGAGGAGGGACGCTATCGAGGACCAATCCGCCGACGCAGAAGCCCCCCAGCCCGCCCATGTCCGGGCGTGGCACTCTCGGACGCAACACACCATACAAAACCCTGGAACCCGTTAAGCCTCCTGTCCTGCCCAACGACTACATGACCAGCCCCGCCCGCCTGGGCAGCCAGCACAGCCCTGGGCGCACAGCCTCCCTCAGCCAGAGGCCCAGAACTCACAGTGGAAGCAGCGGGGGCAGCGGCAGTCGTGAGAACAGCGGCAGCAGCAGCGGCGTTGGCATTCCACTAGCGGTGCCTACGCCTTCTCCACCCACTATGGCACCAGCAGTGGCCCCAGGGCCCGGTCCAGGCCCGATTCCCATGTCCCAGTTTGGCACGCTGTCTCGGCAGATCTCCAGGCACAATTCCACCACCTCCTCAGTCTCCACGGTTTCGGCCACGGGGACGTACAGGCGGGCCCCCTCCGTCACGTCCCAGTTCTCAGTCCAGCAGCCGCACATTAACGGCGGCCCCCAGGTGTACCCCCAGAACTCAATCGCCGACACCCCCAGCCTCCCGCCCCCTCCTCCCCCGGACGATGTCCCGATGTTCGACGAATCCCCGCCGCCACCCCCTCCACCGCCGGTGGACTACGAGGACGAGGATGCGGCCGTCGTGCACTACAACGACCCCTATGCGGACGGCGACCCTCAATGGGCCCCCAAGACGTACACTGAAAAAGTGGTGGCCATATACGACTACAGCAAGGACAAGGACGATGAGCTGTCTTTTATGGAGGGGGCAATCATCTACATCATCAAGAAGAACGACGACGGCTGGTTCGAGGGGGTCTGCAACGGCGTTACTGGCCTCTTCCCTGGAAACTACGTGGAGTCCATCATGCACTATGCTGACTAAAGACACCCCTTTTTTCTTCAGTCATCCCAAGACCATTATAAAAAAAGCATAACACTGGTCTACAAAAGCATATGTATAAGTGCATTAGAAAATGACCGAATGTTTGTTCCTTATTGAATTGCAAATAAAATAAATTCTATTTAGTTTTTTTGGTGGGAAGATTGTGGGATATAATGTATTACTTTGATGAGGTCCAATGGCTTGGTTGATCACATGCTCATGTCTGTCAGTTGTCCTGTCAGTTAATTGTATATAATGTTGAGGGCTGCAATTGGGTTGTTGGTAGTGTTACTGTTAATATTGATAAATGTCCTGAGCAGTGGATGCCACAAGTGAACATGTTAAAGTAGGGATTATGTTTTATAATGAGTCCGGTTATAAATTGTGCCATTTTCCCCCCTACCTTATCTTCCTCAGAAGACACAAGACCAATTTAATGCATTTTGGATCCTGAATGCAAACTTAACTGCTTGCCAGAATTGCAGACTTTTTTTTAGAACAGTGTTTCCTGGCTACTCGTAATTCCTGAAATGTACTTATCTTGCCGTGAAGCATGCACACAAAAGAACTGTAACATATACTTTATTTCCATTATGCTTCCAGTATGGTGTAATATTTACAGTGAGCACTCAAAATTAGTTTTTTTAAATGAAATGTCTGAAGCGGTTGTTTAAAGTCGTATTCTTTTTTCTGAAATGCTCTAATTTGTATTTAAAACATTTGATATGATTACATTTACATTAATAATTTCTACATTGAGTTATATATGTAAAACAAGGCTGTTTTGTTGGTAAGGTGTCTCAGAAGTCTGGAACCCTTGCCATTTGCTTGATACAGGTGTTGAAATGGTTTAAATTTCCAATCATTTATAGTTACAAAAGCAAAACCTCAAGTCATTAAAATTTCTGTGGAGAAAATACATGGTTCTAAAAACTTCAGTTAATTGGATGTTCTGTGTTTTAGTGTTAATGAGCTCTATCAAACATGGATATTTTAGATGTGGCCAAAATGTGCTCAGTTGGGTTATAACTGTTTCTCATCTGTCACCTAAAAAGCCATATGAATATTCCATTTTTAAAAATTGTAATGAAAACCAATACAACATATTCCTCTTCCTGAGAGGAAAAACAAGGGAGTTGCCATCCTGTCAAAGTATTGGTTTACTATTTTTAAAAATTTAATTACTCCATTAATTGTCTAGGTTCATAACTCAGGTCTAGTAATCTCCTTTGTTATTAAACAATCACTACAACAGAGCAAGGCAATGCCATCTTTTCATCTCTTAGTTTTGTACATTTTCTGTATTTTATAATGTATGAACATAAGTTTGAACCTTACCACTAAACCTGCTTTAAAAGGAAGTCACTCCTTCAAGTTTCACCTCTTCTTGAAAAATCCATTAGGTTGAAACTGACTGCTTACAGTATATTAATCACCAATGTGTGTTTCAGGATATTATCGCCAATTCCTTGATTCTTCAGTGTACGCTTTGGTATATTAAATGTGGAAAATTGCTAAATTCTTGCTTTCCTTTGGGAAGAACCCAAAACTTCTCTTCCAACCATAATTTGTATATATAAAAATGTTAATGAAATTTATGTACAGCTTTTTTATATAATAAATCATTCTCCTATATA
>XM_017904422.1 PREDICTED: Eufriesea mexicana facilitated trehalose transporter Tret1 (LOC108550645), transcript variant X4, mRNA 
ATTAAAAATCGAAGCAAGAAAAAATGGCGACATCCAAAACTCAGATAAATCATCTTTAGTGGAGTCAACATTACTTCCAAAAACCCAGTCAGTTAACCAGTTGGAAGATGGAAGACCTGAGCTTGCAACCAACAGTGGATACAGCGATGATGGAAATGGTCGAAATGTTAGTGGAAGTGTCATCAAACAAGTTCTGGCAGCAATAGTAGCGCAACTTGGGACCATTAACACTGGTATGACTTTTGGTTTTTCTGCCATTGCACTACCACAACTTCAGGAACAAAATAGCACCATTCCTATCGTCGAGGGATCATCCGAAGAATCATGGATCGCGAGTATGTCTTCCATTGGAACTCCCATTGGTTGTTTAGTGTCTGGATATATGATGGACGTACTTGGAAGAAAACGATCTCTCATTATTACTGAGATTCCAGCATTACTTGGATGGATATTAATTGCATTAGCAACTGATATTCGTATGATATATGCTGGAAGATTCTTCGTTGGACTTGGATCGGGTATGGTAGGCGCTCCAGCACGCGTCTATACTGGAGAAGTAACACAACCCCATCTACGAGGAATGTTGACTGCTTTTGCAAGTATTGGAGTCAGCACTGGTGTTCTGATCGAGTATGCATTAGGAAGCGCACTTACATGGAACGTCTGCGCAGCTATTAGTGGAATTATACCTCTTGCCGCTCTGCTGTTAATGTTTCTCTTTCCTGAGACACCTTCATACCTCATATCTCGTAGTAGACCTGAAAAGGCACGAAAAGCGTTACGACAATTTCGCGGTAGTACATATAATATTAATCAGGAAATGGAAACACTTATTAATTTTTCAAATAAGAATAATATTAAGCGTTTAACAGGATTCCGTGAGATAATTAGCGCCCTTTTAAAGCCTAATGCTGTCAAACCTTTTACTGTCCTATTCTTGTACTTCTTAATATACCAATGGTCAGGTACAAATGTCATAACTTTTTATGCTGTTGAAATTTTTAAAGATTCAGGAGCAACGTTAAATAAGTACTTAGCTGCAGTAATTCTCGGAATAGTAAGATTAATATCAACGGTTGCCGCTTGTATCTTGTGTAGAAAGTGTGGCCGAAGGCCCCTTACAATGATTTCTTCCATCGGTTGTGGACTTTCCATGGTAGGATTAGGTGGATATATGTGGCTGAAAAATAACTGGGATGCAAATAATTTTACACCTGTTGCTACTTGGTTCCCTGTCTTTTGTATATTTGCATATACTGTAACTTGCACACTTGGTTTTCTTGTTATTCCTTGGGTAATGATAGGCGAGGTATATCCAATACAAGTACGCGGTATTATTGGAGGTTTAACTACAATGGCAGCCCACTCTTTTATTTTTACAGTAGTTAAAACGTATCCGTTCCTAGCTAACGCACTTACTCGGCACGGTACTTTCATCCTTTATGGTTGTATATCTTTATTCGGCACGATATATTTTTATCTATGTCTTCCCGAAACTAAGGGTAAAACTCTTCAAGAAATAGAAGATTACTTTTCTGGTAGAAACAATAACTTAAGAACCGGAAGTATAGGTAAACATAAGCCAAAGGTATTAGAAGTAAAAAAGGGTCACATATTGCCTTGAATAACTCATACAGTGAACATCTTAATAAAATTAAATTAATAAATCTGTCTTCCATTGAACAAAT
>XM_001378120.4 PREDICTED: Monodelphis domestica inhibin beta C (INHBC), mRNA 
ACCCTGCTTTGTACTTTAGCTACTTATCAGTTGGCAGAGTCTGCCAAGTTCTAGTGTTGGTCTTGTCCTTCTCAAGCCAGATGTGCGGCCACCATCTCTCCCAAGGTAAAGAATCATGCCAGCTGGACACACACCTTTGGTGTGGACTCTAGCATTTAAAACTCAAGTGGCATAGTGGCTGAAGCCCTGAGCCCCAGATTTAAGGTGTTTCTTCTTCCAGAGGAAGACCCAGCTGAAAATGGTCTCTACTCTGCTCCTGAGTCTCCTGCTCTTGATTCCAGCTGCAGCAGGGACCGAATGGATTGATGGTCAATGTCCAGCATGTGGGGTGCCTGGTTCAGATCCTGAGAGACAGAGGGAAATACTGCTCAATCTGGCAAAGCAAAATATCCTGGATAAACTGCACTTAACTCAACGCCCGACACTGATCCAGCCTGTGTCCAAAGCCACCCTGAGAACTGCACTTCGACGCCTCCACGGTCTCCAAGGAGGAAGGATTGTGCCTGGTAGCACTTTAGGGGGTTCTGGGACTGGAGTTGAGGAACAGGAGTATGAGATCATCAGTTTTGCTGAGACAGGCTACTCTACCACCAACAGGACGGTGCTGGATTTCCAACTCTCCCCAGATCAAAGCAGTGGTAGCTTGGAGGTCCTCCAAGCCAGGCTGGGTTTTTTCTTGAAGATTCCTCCCAATGGCACATGGACTATGCACGTGAGGGTCCTGGGGCCTGGGCCCCGGGACACCAACCTCACTTTGACCACCCAACACCAGCTAGAGGTAGATGCCAGTGGCTGGCACCAGTTCCTCCTGGGGCCAGAGGCCCAGGCTGCTTATGGTCAAGGGCATCTGACCCTAGAATTGGAGGCCAAAGGCTGGGGAGCCCAGGGCCCAGTTTTCTTGGAAAAGGATGCCCATCAGCCCTTTATAGTAGCTCAGGTGAGAATAGGAGAAAAGCACCGGATTCATCGTCGAGGCATCGAGTGCCAAGGTGGGTCTCAGATGTGTTGTCGACAAGAGTTCTTTGTAGATTTCCGGGAGATTGGCTGGAATGACTGGATCATTCAACCTGAAGGTTATGCTATGAACTTCTGTACAGGGCAGTGCCCACTACATGTGGCAGGCATGCCAGGAATCGCTGCCTCTTTCCACACTGCTGTGCTTAACTTGCTCAAGGCTAATGGGGCCCCAGGAACAACTGGAGGAGGCTCCTGCTGTGTGCCTACTGCCCGCCGCCCTTTGTCCCTTCTCTACTATGACCGCGACAGCAACATTGTCAAGACTGACATCCCAGATATGGTGGTGGAGGCCTGTGGCTGCAGTTAATGTGTATAAAAGGGAAGGAGGACACGCAGAAGAGGACATTCACTTAGAGATTCCCTTCTCATCTCAGGCAGGTTGTTCACAAATTCTTCCACAACCCATAATGGGGAACCAAGGCATTTCTGGAAATCCTTCCACTCTCCCTCTGGACATTCTATTGAAGCATCTGGTAGCAGGGTAGACAGAGAGCACTGGACCTCAGCAAGACCGAGTTCAAAGTTGGCTTCAGTATGACCTGGAGCAAATCACTTGTCTTTATAGTCTCCTCAGCTATAAAATGGGAACAATAATAGTACCTATCTCACAGGATGGTTGCATGAATGAAATGAGATGTTTGTAAAAAAGTACCATAGTACTTGGTGCATAGCA
>XM_017900195.1 PREDICTED: Eufriesea mexicana UPF0769 protein C21orf59 homolog (LOC108547609), mRNA 
ATGGTCCGGATGCACGTGAAGAGAGGCGAGGAGAGCCAGTTTCTGTACGACACACACGTGGAGGCTCGGGTTGAAGACATTATATACGGCATTACTATTATTTACAACGGCCGGCTGAAGATCTCGAGAATATGTTATGAAATCGAGGAGCTGGCCAAGCACGGCACCATGCTGCCCCATAACATCATGGGCCTCACCGACGAGCAGGTAGAGGAGCTGAAGCTCAAGGACGAGTGGGGCGAGAAGTGCGTACCGATGGGCGGATGGACCTTTAACAAGGACGTTATCGGCCGCAGAAACGGCAGACAGCCTAACGCGAAGATGCAGGAGGTCTTGAACAAAACGATCGGGGAGGCACGAGCTATGGTTTCAAAGAAATTGATACAAGAGGAAAAACTGGTGACGCAGAAAACTGTGCAAGATGCACTGGATATACTGAGGGGGGCCGTAACGATTGTGTATCCGATGGGACTTCCGCCTCACGATACGATCCGACAGGAATTCGAAAACACCGAGGATCTGAGTGGCACTCAGGCATCTCTCGAAGTTATCGACGTACAACTGGCGCAACTTTGGTTCTCGGGAAAGGAAATGTTACCGGGAAGAAAATTAAAAGATTATTTGGGGATGAACGAGAAAACCAAGATTATCGTGAAGCTGCAGAAAAGAGGAGCCGGAAGACCTGCTCGTGAACCTCTGATGTCAGAGGACGAAAGGAAAGAACTAATGCTGCATGCATATAAACGACAAGAACAACTCAAGATTTCTATCGTGGATAGTGATATTATGTTAACACAAGCGGGTAAAATCAGTTTTCTGATAATTCTCTCAATTTTTCTTCGGTTATGCAGTGCCATGTGGAGAATATTGTGGTGCCTGGGTAAACCATATAAAGCTTAG
>XM_007934287.1 Pseudocercospora fijiensis CIRAD86 uncharacterized protein (MYCFIDRAFT_46883), partial mRNA 
ATGGCCGCGCCTGCACAAAATGGCCCTGTGCCCGCGGGCGCCCCTGCAAAAGCGACAGAAGCGCAACTCATCACTGCCTTTGACAACTCAATATGGTATCTACTTGACCTATGGCAACCGCTATCCATCGCAGTGGATAATGGCTGGGGCGGAGGGAATTCTTCAGACAAGCGCGACTGGTTCGCCGGCGCAGTTTCCGATTTCTTGAATCAACCGCAGTATATCAATCCTGCTCCGGGTGCTGTGCTCACCTTCGCCGACATGCAAGAAGATCTCGAAGTTTTCCTCCTACAAATCATGCAGGACGAGTTTGACTGCAACATCGAAGACGAATCGGAAGTGGAGCTTGCGAACGGCATCCTCAGAGTGCGAAAAGCCATGACTGAGACCTTAAGCACGGCTGCGGCGGACGAGGTGAAACAGAGATGGGAGAATCGAGGAAGCAAAAAGCATGAAAAGATTGTGGTTCAGGAAACGAACCAGGAAGTTGGCGACGACGAAGAGTGGGATGGTTTTGATGAGGACGAGGATATGGACGAGGCGCCACAGCTCCTGCAAGCGCCTGCACAGCCGCGAGAAAAGCCTATACCTGAGGTTGACGAGGACGGATTCACAAAAGTCCCGAGCAAGAAAAAGAGATGA
>XM_007491848.2 PREDICTED: Monodelphis domestica cytochrome c oxidase subunit 6B1 (LOC100013297), transcript variant X1, mRNA 
CGTTCCAGGCCTACGCTTCCGCTTCCGGTCTCGGACCCTTAGTGCTGAGGGTCACATTGAATCTGCGGTGCCCGCGGGATTAGCAGCGGAGACAACTACAGTGACAGCGGTAGGAGCGGCCTCAGTCCAGGAGCCACCATGTCTGATGATATCAAGGCCAAGATCCGAAACTACCGCACTGCGCCCTTTGACAGCCGCTTCCCCAATCAGAACCAGACCCGCAACTGCTGGCAGAACTACCTGGACTTTCACCGTTGTGAGAAGGCCATGACTGAGAGAGGCGGTGATGTGTCTGTCTGCCAGTGGTACAAACGTGTCTACAAGTCCCTCTGTCCCTTGTCCTGGGTCAGTAATTGGGATGATCGCAGAGCAGAAGAAACCTTCCCTGGAAAGATCTGAGCGACTTCCTTTTCCTCCCTTCTCCCCGACCCCAATGTCTGGGGCTGGATCCCTTCTTCCCTCAGCGTGGGGGGAATGTGATCTGTGGCTACCCCTGCCCTGAGGGGCCTGAATCATGTTAAAATAAACTGTTGGAATC
>XM_024666474.1 PREDICTED: Selaginella moellendorffii aquaporin NIP1-1-like (LOC112343293), mRNA 
CCCTGCGCCGCGCGCCTCTATACTCTCCCAAAGTCTCCACAATTTATGGCCGCTTATAAAAGCTTGCACGACTTCTCTGCCTCCTCGCGCACAACCATCTCTCCTCTCCCCAATTCCTCGCCTGATCGAATGTGATCGCTTCTTGGGCTGTGCTGCGACGACCTTCCTGACCCGATCCATGGCAGCAGCGGCGGCAGGGATGAGCGATTTCCAGCTCAACGAGATCCGGGTCACGCCAGCGCCCTCCATCGCTCTCCCCGCGAATGGCCACCAGATTCATCACCAGGCCTCGCCTCCCGCGGCCTCTAGGGGATGCATTCCAGTCGCCATCGTGCCCAAATCCACGCTCTTCCAGAAGATTGGCGCGGAAGTGATCAGCACATTCATCCTCGTCTTCGCGGGATGTGGCGCCGCGATGGTGGACGCCAAGTACAAGGATTCGATCACCCACTTGGGCGTCTCGGCGGCGTTTGGGCTCGTGGTGATGATCATGGTCTACGCCGTCGGCCACATCTCTGGAGCTCACATGAATCCGGCCGTGACTCTGGCGTTTGCGACCGTGCGCCATTTCCCCTGGAAGCAAGTTCCTGCCTACATCGGCGCACAGGTCACTGCCGCGATCACTGCCGCGTTTGCGCTGCGGCTGATCATCAGCCCCGTGGCTAACATCGGTGCCACAATTCCCGCTGGAAGCGATCTCCAGTCCTTCTATCTGGAAGCGATCATCACCTACATTCTCATGTTCGTCGTCTCCGCCGTCGCCACCGACACTCGAGCGATTGGAGAATTGGCAGGCCTCGCAATCGGTGCTACAGTGGGCTTGAATGCCATCTTCGCCGGGCCGATTTCGGGCGCGTCAATGAATCCAGCACGAAGCTTGGGCCCCGCGATCGCCGCGAACAACTACAGTGGATTGTGGGTTTACATTGTCGGCCCGACAGTCGGCGCGCTGGCGGGTGCGTGTTCTTACAACATGATCCGGTTGCCCGTGAAGCCGGACGAGCTCCCCAGGGCCGCTAGCTTCAAGAGATAGAACAAGGCTGTAAAAAGAATAGCAGCTTTTAGGTGACCACCTAAGTGATAACTCAAGTAAAAAAATAACTAGTTAGCCGTGTCTCGGTTA
>FQ756522.1 16S rRNA amplicon fragment from a soil sample (ferralsol, Madagascar) resulting from a 16 days laboratory incubation experiment in the presence of 13C-enriched wheat-straw and a tropical peregrine endogeic earthworm, Pontoscolex corethrurus: Light-DNA fraction (DNA-SIP technique) 
TAGCCTTGCGGCCGTACTCCCCAGGCGGGGCACTTAATGCGTTAGCTACGGCACGGAACCCGTCGATAAGGCCCCACACCTAGTGCCCAACGTTTACGGCGTGGACTACCAGGGTATCTAATCCTGTTCGCTCCCCACGCTTTCGCTCATCAGCGTCAGTACCGGCCCAGACCACCGCCTTCGCCACCGGTGTTCCTCCTGATATCTGCGCATTTCACCGCTACACCAGGAATTCCGTGGTCCCCTACCGGACTCCAGCCATAGAAGTATCGAGTGGCCGCTCCAGGTTGAGCCTGGAGGTTTCACACCCGACTTTCCAAGCCGCCTACGAGCTCTTTACGCCCAATGAATCCGGACAACGCTC
>XM_047971315.1 Xylaria bambusicola Gar1/Naf1 RNA binding region-domain-containing protein (F5B22DRAFT_384725), mRNA 
TCTTTTTGCGATACTCGAAGAGACAACTTGACATTGAAATACTACAAAGCTATATATACACCCCATGATCTTCTCAATTGTTCTCACCAGGTTTCTATGGTAGCTGCATCTCGCCCTGTCTACTTACTTAGGTTGGTATTCGGTGAGTTTGCTGTCTGGTATCAGTACCAGATCTACAAGAATCCATCGCCACAAGCAGCCTATCCGTGAAAGCAATAATCCCAGAATCAACACCTACATCACCAACACCGTCATGTCTGACGTCAAAATTCCTGGACTTGGCAACTTGCAACCCGCCGCGGATACAGAGAGTGGCAATGTCCAGCCTACTGCGGTGCCTGCGGTGCCGGCAGACGAAATGGCGGTTGATAATCCACCAAGTCCACCATCACTCACGTCGGGACTCGAAGCCCTCCTTGGTGGCCTAGACCCTCTACCAGAGCCAGTGCCCGCTTCATCAGAACAAAGTAAAGATACCACTGGTGCTCTACCGGAAACAAACAACACAGCTGTATCAGAGACTGAAAATCCAGCGCAAGCCAGCGCCTCCCAAGAAGCTGGTAATGATAACGTGCAAGAAGAGCATCCAGAGTGGGAAGTGGACTCATCTCCCTACGAGTCATCTTCCGACTCTAGCAGCTCGGATGACTCTGATGAGGACTCTGACGATGAGAAAGACTATAAGATTCTTGGGCCCGAGGAGACCGCCCGTATACTCATGGAAATGGATGGTGGGTCTGACGACGAAGGTGATGGCAAGGGAAAAGGTAGCAGTTCTGGTATGGTACGAACCAAAAATGAGCTCCCTGAAGCCATCGTCCCGCGACCCGAAGTTGAGATCAAACCTGAGATGGAGATAGTTGAGCTGGGTTCGATTGAGCATTTCGTTGGCAACACCGCTGTCATCAAAGCAAATACCGACGGAGAGTACCAAGTCCTCGACACAGGATCTGTGCTTTGTCTTGCAGACCGAACCGTGATAGCTGCCGTGGCGGATGTCATCGCGGCGGTGCGGGAGCCTCGGTATACCGCTGGCTTCCAAAACGAAGAAGAGATCAAGTCTTTCGGATTAGAGACTGGAACCAAGATCTTCTACCCACCTGCACTAGCAAGTCTTGGGTTCACAGAGATGCTCAAAGCCAACAAGGGCACAGATGCAAGTAACTGGCACGACGAGGAGGTCGCTGAAGACGAAATCGAATTCTCGGATGATGAGAAGGAGGCAGAGCACAAGCGCCAATTGAAAGCCAAAAAGCGAGGGGCACGTGGTGGTCGAGAGGGTGCGGCGAGTCGAGGAGGACGTAACGATGCTATTCCTGCGGGTGCCTCCATGGCCTCGGCTGAATTGAAGTACGATGATAATGACGATGATGACGGCCCTTACCGACCGCTAGCTCGTCCAGTAGGATTTGGGCAAAACCAAGCCTCCCATGGAAGCAGTGAGCCTCCGAGTGGCTTCTCTGGCCATTCCGGTGGTCATTGGGGAAATCGAGGCGACTTTAGAGGCAGAGGGAGCCGTGGCCGGGGCGGACGTGGCAATCGTGGTGGCAATGTGCGTGGCGGATATTCACTACCACCAAGACCACAAGGTCAAGACGGCCAGGGAGCGCAAAGTTACCACCAACAACAACCACCTGCGCAACAGTACAGTCTACCTCCTATGGTGATGGGTGGTCAACCCTTTACAAGCTTAAGTCCTCCTCAACCCAACGCTCAGCAACCACATGGACCTGCCAACCAGCAGTTTCCCTTCCCCTGGCCACAAAATGCTCAACCAGGCTTTTATCCTCCTCCACCACCTCAATTCACAGGCCAGTCTGGTGCAAATGGGATGTATTTACCGCCCAATTTCTTGACAGCTCTACAAAATCAGATGCAAGCCCAACAAAATCAACAAAACAACCAGTGGCCCGGTCCACATGGCCAACACAACACTAACTCATGGCCTGGACAAGGAGGCCACGGGTAAAAATTTAGCATGTCGTTTGCTTGTGCTGGGGAAATCGGCACGTGGATTATAGGCAATAGGTTGTGGCATGGATCTAACATTTTAGGCGCATATACTCTGGCCAGCTGTGATGGCGAAAGTAAGGACAGGGCTGCCCAGCATGGACCTTGTTCAAAATAACGATGATGACTACCGTACTCTTGGTAGCACGTACGGCTCATTTGCTCGCTAACTGGCTATTGGCCTGAACTGACAGAGAAGAGAACGTCCCTCGGCTGAACTGTCGATCGCGCCTTATCTACATACTTTGTACGTGTGGTTGTGACTAAAAGTCGAGTCGCCCCGTTTCCGTACGATAATATATATTATATGCTCCCTAAAATATGATTATATTTGATGCCACTCTTGTTCTCAGGGAGGCTGACATGCTGTTATTTTGCTGCGTCTTGATGCGACTGGTG
>XM_014964001.1 PREDICTED: Calidris pugnax family with sequence similarity 19 (chemokine (C-C motif)-like), member A2 (FAM19A2), transcript variant X1, mRNA 
TTTTTTTTTTTTTTTTTCCCCCACTCAAATACTCTGAGACCGTGCACGAGAAACACTTCAAGTGGTCCCTCCCTTCCTACTTCCTTCACCCTTCCTCCAGCGTCTCTTTACCGGATTCCTGGTGTATTCCAAGGGAGAGGCGGGGGGAGAGGCGGCGGAGGGCTGCCTGCCCCAGCCCGGCCCAGCCGAGGGGAGCCGAGCCGAGGCGGGCGCGGTGCCGCTCCATGCCCCCGGGCGCTGGCGGGGCGCGGGCCGTCTGCCGGCGATGCCCGGGCGGTGAGGCTGGAGCTGGAGCCGGAGCTCCCTCCCGACGGGAGGCGGCCGATCCCTAGGTGTTTCCAGGAGGAAGCGGGGCTGCAGGATGAATAAGAGATACTTACAGAAAGCAACAAAAGGAAAACTGCTAATAATAATATTTGTTGTAACTTTGTGGGGGAAATTAGCATCTGGGGCAAATCATCATAAAGCTCACCATGTTAAAACTGGGACCTGTGAAGTGGTGGCACTCCACAGATGTTGCAATAAGAACAAGATAGAAGAAAGATCACAAACAGTGAAGTGCTCCTGTTTCCCTGGGCAGGTGGCGGGTACCACCCGGGCAGCTCCTTCTTGTGTTGATGCTTCAATAGTGGAGCAGAAATGGTGGTGCCACATGCAACCATGTCTTGAAGGAGAGGAATGTAAAGTTCTTCCAGATCGTAAGGGATGGAGCTGTTCCTCTGGGAATAAAGTAAAAACAACGAGGGTAGGTATAATACCAACTTTACATGTTACCAACAGGTAA
>XM_012986102.1 PREDICTED: Erythranthe guttatus probable polyamine oxidase 4 (LOC105961838), mRNA 
AAAAATCCCGAATTTACCCCTAGCCGAACAGAAAAATATCATGCACAAACAACAAACCGCGTACCCCTACGTCTCCTCTTTAAGTTAATCCGGACAACCAGCCTTTTTTCTTCTGCCTAACAAACAAATTTCTAGAGAGAGAGAGAGAGACAGACGGTGGTAGAGAGAGAGAGAGAGAGAAAGTAGGGGGAGAGCCAATCTATGCAACCGAGGACGAAGAATTCATCGGTTGGTGTAATTGAATCTTCTGGTTGTTGCCGTGAATGCAGCTCCTGCAATTGTTGCTATTATGATTATTATGAGCTTGTTTGACGATAACCTCCGCTGCGCTTCCAGTCTCAGCCGCCTCATTGCCGGACTTTTGCTTTTCCTCCTCTTTCATTCTTCCCAATTGATTTCTAATTTTCCGATTCCTATACACCCGTAATTTTTCGTTTTTTTTTTTTTGAAAAATTGTTGTTGGTAAGATCAGATTTGGTTCTCCATCAATTTTCATTCCCAGTTAGGGTTCTCTGAATTTGTTTGTGAGAGAGAGAGGTAGAGATAGAGAGAGAGATAGGTATTTTCAGTTGTCGATTAATGGAAGTCAAATATGGCGACGATTCGATCTCCGGCGAGTTTTTTGATGGCATTTACGGCTCCCTTGTAGAGAGGCCACACAATGCACTGCCTTCTGTCATCGTCATCGGTGGAGGAATATCAGGGATTGCAGCTGCACGCATGCTGCGTAATGCATCTTTTAAGGTGATCGTGATGGAGTCGCAAGATAGAATTGGTGGGCGCATTCACACCGATTACTCATTTGGTTGCCCAGTTGACATGGGAGCTTCCTGGTTGCATGGTGTCTGCAATGAGAATCCTTTGTCTCACGTGATACGTCGTTTGGGGCTCACGTTGTATCGTACAAGTGGTGATGACTCCATTCTGTATGACCACGACTTGGAAAGTTATGCACTCTTTGACATAAATGGACATCAAGTTCCCAAGAAAATGGTTATTGAAGTTGGAGTTGCATTTCAGAAAATCCTTGACGAGACGGATAAAGTGAGGGATGAACAAACCGACGACATATCTGTGAAGGAAGCAATATCAATCGTGCTGGATAGATATCCAGATTTAAGACAAGAAGGCGTCGCATGTGAAGTGTTGCAGTGGTACATTTGTAGAATGGAGGCTTGGTTTGCTGCTGATGCAGACATGATATCTCTGAAAGCGTGGGACCAGGAGAGAGTTCTTTCTGGTGGTCATGGGCTTATGGTGCAAGGGTACGATCCAGTCATAAAGGCCCTCTCAAGAGATATTGATATTCGCTTAAATCACCGAGTTGTAAAAATTGTGAACGGGTATAAGAAGGTGGTAGTAACACTTGAAGATGGGAGAAACTTCGTTGCAGATGCTGCTATTGTCACAGTGCCATTGGGAATTCTAAAATCCAACTTGATTGAGTTCGAGCCTAAGTTGCCAGAGTGGAAGCAGTCTGCAATATCAGATCTTGGTGTGGGAAATGAGAATAAAATTGCCTTAAAATTTGATAATGTTTTTTGGCCAAATGTGGAATATTTGGGCGTGGTTGCGAAAACGTCTTATTCGTGTGGCTATTTTCTTAATCTCCACAAGGCTACAGGCAATCCCGTCCTTGTCTATATGGCAGCTGGAGCACTTGCGGATGACCTTGAGAAGCTATCAGATGAAGCTGCTGTCGGTTTTGTAATGTCACAGCTTAAGCAAATGTTTCCTGATGCAACTAACCCTGTGCAGTACCTTGTATCACATTGGGGAACAGATCCAAACATTTTGGGATGCTATTCGTACGATGCTGTGGGGAATACAGAGGATATATACGACAGGCTTCGTGCACCAGTGGGGAATCTTTTCTTTGGAGGTGAAGCTGTAAGCGTTGATCATCAAGGATCGGTACACGGCGCGTATTCTGCTGGAATAATGGCTGCTGAAAACTGTCAAATGCATCTTATGCAGAGGCTCGGGGGTCTGGAAAGAGTTTCTGTCGTTGCCTGTCGGGAGGATCTTGTCGAGGCTAACGTTCCTCTTCAGATATCGAGATTATAAGTTATTTGTAATGCCAAGGAAATAAAGATAGTGCAACTTGGTTTTAGGACCGGCAAATGTGTGAACAAAGTTTTCCTTTTTTTTTTTTTTTTTGCCTTTTCTTCAAGCAGTGTGGAAACTACATTGTTCCTTTTAACTTTTGTTAGAAGTGATGCTTTGGTAGTTGATGAGTGGTAGCGCCTTTTTAAGAACTCAATTACTACAAGCAGAACAATGTTATTGGTACTTTGTTTTCAGACCA
>XM_030648245.1 PREDICTED: Cannabis sativa haloacid dehalogenase-like hydrolase domain-containing protein 3 (LOC115719273), mRNA 
GCATGAAAAAGGGGTTAAAAAAAAGAATCAAAAGGGTACGTTAGAGCGGTTTTAGGCCATAGTTTTTCTCCGCCTTTGTTTTGGTGTTCTTTAAAGACTTAGGTTCAGCTGCCCTCTACAATCTACATCTACTTCCTTCCTCCGAAGCCAAACTCGGTTAATGTGGGGAATAACACCATTGCTCTTACCCATATACCAAAGCTATTCAACCACCACACACACACACAAAGAGAGATATCATTGGAGCTGTTGAAGGAGGTTGTTAGAATTAAAGTGTGTCACTTTATGATTTGACCATTTCTTCATAACAAGAGTTAGATAGTCTCATCAATTATCATACTTATAGAAAACTTATTACAGTAATTCTATAATGTCAATTTTGTCAAAATTACGATGTATTACGGTGGATGTAACTGGTACATTGATGGCTTACAAGGGAGAGTTAGGAGACTACTATTGCATGGCAGCCAAATCTGTTGGTCTGCCTTGCCCTGACTATAAACGGGTACATGAGGGCTTCAAACATGCATATAAAGACATGGCTCAAAAGTATCCATGTTTTGGATATGCTGCCAAAATGCCCAACATTGTGTGGTGGAAAACTTGTGTAAGAGACTCATTTATCAGGGCCGGTTATGACTACGATGAAGAGACATTTGAAAAGGTGTTTAGACGCATATATGCTTCATTTGGTTCTTCCGCCCCTTACACCATCTTTCCAGACTCCCAACCATTTTTAAGATGGGTCCGTGAGCAGGGTCTTCAGGTTGGCATTATTAGCAATGCAGAATACCGGTATAAAGAAGTGATTCTTCCAGCATTGGGCCTGAACGAGGGATCTGACTGGGACTTTGGTGTATTTTCTGGTCTCGAAGGCGTTGAGAAACCGGATCCAAGGATTTACGAAATTGCCCTTGAGAGGGCTGGAAATCTTCCTCCAGAACAAGTACTGCATATCGGTGACAGTATGCGGAAAGATTATGTGCCAGCAAAGAGTGTAGGAATGCATGCATTATTGTTGGATCGATTTAAGACAACTGATGCCGAAGAATGGAGGAAATCTGGCGCAATTGTGCTCCCTGATTTGATGGGAGCAAAAGAATGGCTTCTTTCAGACAAGTCATGAAGAAGAAGCATGATTGGATTTTTCTCTCCCCCTTGAAAGGAAAGATTGGTTAGTGGCTAGCAGAGATTGTTTTCTCACAAAGTGAGGCTTCACTCTAATCTATATGTACACAAGTTAGAAAAGTTTGATGAATGAGAAAATGAAACCTGCTAGATTATGAAAATGACTCTAATAATTAAATAGAAATAAAATACAGGATAGGGGAAGAGTTGCACCATTTGCGTTTTTATTTTATTGAGTAATTTTTAAATATAAATATAGTTGAACAATGATGGGTCAAATTATAAACAAAAGTGTGAAGCAGACACTTTTATTAA
>XM_012066938.1 PREDICTED: Cercocebus atys POU class 3 homeobox 2 (POU3F2), mRNA 
GGGGGGAGCGCCGAGCTAGTCAGAGAGTGAGCGAGAGCGAGAAGGAGGGAGAGGAGGAGAAAGAGAGCGAGGGCGGGCAGGCGGGAGGCGGCGGCGGCGGCAGCAGCAGCAGTAATAGCAGGAGCAGCAACAGAAGGCGTCGGAGCGGGCGTCGGAGCTGCCCGCTGTGGGAGAGAGAGGAGAAAGAGCTAGCGAGGAGAGGGAGCCCGAGGCGAAAAAGTAACTGTCAAATGCGCGGCTCCTTTAACCGGAGCGCTCAGTCCGGCTCCGAGAGTCATGGCGACCGCAGCGTCTAACCACTACAGCCTGCTCACCTCCAGCGCCTCCATCGTGCACGCCGAGCCGCCCGGCGGCATGCAGCAGGGCGCGGGGGGCTACCGCGAAGCGCAGAGCCTGGTGCAGGGCGACTACGGCGCGCTGCAGAGCAACGGACACCCGCTCAGCCACGCTCACCAGTGGATCACCGCGCTGTCCCACGGCGGCGGCGGCGGGGGCGGCGGCGGCGGCGGGGGGGGCGGGGGCGGCGGCGGGGGCGGTGGCGACGGCTCCCCGTGGTCCACCAGCCCCCTGGGCCAGCCGGACATCAAGCCCTCGGTGGTGGTGCAGCAGGGCGGCCGCGGCGACGAGCTGCACGGGCCAGGCGCCCTGCAGCAGCAGCACCAGCAGCAGCAACAGCAACAGCAGCAGCAACAGCAGCAACAGCAGCAGCAGCAGCAGCAACAGCGGCCGCCGCATCTGGTGCACCACGCCGCTAACCACCACCCGGGGCCCGGGGCATGGCGGAGCGCGGCGGCTACAGCGCACCTCCCACCCTCCATGGGAGCGTCCAACGGCGGCTTGCTCTACTCGCAGCCCAGCTTCACGGTGAACGGCATGCTGGGTGCCGGCGGGCAGCCGGCTGGGCTGCACCACCACGGCCTGCGGGACGCGCACGATGAGCCACACCATGCCGACCACCACCCCCACCCGCACTCGCACCCGCACCAGCAGCCGCCGCCCCCGCCGCCCCCGCAGGGTCCGCCTGGCCACCCAGGCGCGCACCACGACCCGCACTCGGACGAGGACACGCCGACCTCGGACGACCTGGAGCAGTTCGCCAAGCAGTTCAAGCAGCGGCGGATCAAACTGGGATTTACCCAAGCGGACGTGGGGCTGGCTCTGGGCACTCTGTATGGCAACGTGTTCTCGCAGACCACCATCTGTAGGTTTGAGGCCCTGCAGCTGAGCTTCAAGAATATGTGCAAGCTGAAGCCTTTGTTGAACAAGTGGTTGGAGGAGGCGGACTCGTCCTCGGGCAGCCCCACGAGCATAGACAAGATCGCAGCGCAAGGGCGCAAGCGGAAAAAGCGGACCTCCATCGAGGTGAGCGTCAAGGGGGCTCTGGAGAGCCATTTCCTCAAATGCCCCAAGCCCTCGGCCCAGGAGATCACCTCCCTCGCGGACAGCTTACAGCTGGAGAAGGAGGTGGTGAGAGTTTGGTTTTGTAACAGGAGACAGAAAGAGAAAAGGATGACCCCTCCCGGAGGGACTCTGCCGGGCGCCGAGGATGTGTACGGGGGGAGTAGGGACACGCCACCACACCACGGGGTGCAGACGCCCGTCCAGTGAACTCGAGCGGGGGGAGGGGCAGAGCGCGGGGCTCCCCCTCCCCTTCGGTCCTTGGCCCTTTCCCGGCCCTCTTGTTCCCTCTCTAACTTCTGATTGTTCTTTTATTTTTAATTATTATTTCCCCGTCCCTTAAAAAGAAAAAAAAAATAAGGAAAAAGGAAAGCAACTAAGACACTGGACTATCCTTTAAAGGTAGCAGGTGTAATGATGTGTTTTGACCTTTGCAGACGAGTAACCAGGCAATGGAGTGGAGTGTCTCCTGGAGAGAGTGAGGAGAGTGTGTGATAGATAGAAAGAGAGAGAGAGATAGAGAGATGGCAAGCACTGAGATAAATACCTGGCAAAACTAAATAAATTACCAAAAAGGAAAAAAATATCCACCAAACCATGATAAACACAAGACGCAGCTTCCTGATGCTTGGAGTTGGCACATGCTGCTGTGTTTATTTGATGTGGATTCCCATCAGGAAAGAGGAAAAAATACACACGTTCTTTGATATAGGCAAAATTTAACCACATAAATTTGCACTGCAAGAAAATTGAAGTTTACATGAACAAATTCATGAACATATTTTCTCTTTCTCCCCACCGTTAATTTGGGAATTGCCGTTTTGGGGGATTTTGTTTTGCTTTGCTTTATTCATCGGAGAGAGTTGAAGCCAGCTCTTGGCCTCTCTCCATTTCTAATGTTCTTGTGTTGCCCCTTATTCGTACTGTTTGTGAACTTTGGTTACCTTCAGATTCCCCTTACAAGGGTGTAACATCTATTTGTTCCTCTTACCAAAGCAAAACGATTGGCTTCATACAAAATAGACAATTCTCTGCTTTCAGGAAATGTGCGTGGTCTACCCGCTTTATCCAAGGCAAGAATCCAGTTTGCAATATAAAAATAAGCATTGGTTGTTGTTACGAGCCACAAAGTAAACTTCATTTTCAGGCAGTGTTTCTGGGGGAGGTTATGGAGGGAAGAAAAAGAAAAATCGATAGTGAGTGACTGATTGCTTCATTTTATCAGGCGGGCCCATTGTGAAAGAGCTCAGAGGAAATGTGGAGGTTAAATATATTTCCAGAGTTGTCCAGCAGAAAGAAAGTGGCACTTTGAAGAGAACTAGGGAAGTATATATCTTCAGATATCCCTATATAGTTCTCTACCTTCAGTTTTAGTAACAATTATGAAGAATTCTTTATGCTGACAGCAGCAGTTAAACTTTGTTTCTCTAATAAGCTTTTTTTTTTTTTAACATAAAAAAGGACCCACGAACTTAATAGTGTATGCATAAGGCTGTGTTTTTTAGCACATAAATACCCACAGCATACACAGACGATCTCCACGCAGTAGACAGGTTTTGTCTTCACTAGCTCATTTGTTTATCAAGTCATATTTAGGGTCCCACGCCCTCTTTTCCTGTAATTTATTGCAGAATATACCACTTTGACTTGGACAGCTTTCTCCCCCCTCTTTCACTAAGGAAGGCAAATGAAGGGGGAAAAAAATGCCATTTTCAATCCTTCCTTTCTCCCCTTTGTTAATAGTTTTAAGTGCATTTTTGACCTTATCTTGATGGAAAACGGTTAACTCCAAACACAAAAGACTCTACTGGAAAGTGTAGGTGAAAAAACTTGTAACTGTATTGAAAATAAATACCATTAAACTGTGATCAGTTAAAATTTAAAAGAAAAATCAGCACAAAAGGGCGCTAAAAGGGAAAACACTTTTTATTAATCTTAAAAGTTTGGGGTTTTTTTTTCCAGTTAGGTATTAGATAAATTTTTATTTTAAAAAATGAAAGTCTCACTACCATAAAATTATGGTTCAGCATCAGATTAGCATTGCACTCATTAGTCTTTAAGGTTTTAGGAAATATGCTTTATATTGTCTTTTCAAACACCTGTGATTGTTTCATTTTCAATGTTTTTGCAAGATAAATGGTGACTTATAATGGGCATATTTATTTGCCTGTATTTCATTTCCCCCAATGAATGTCACAAGGAGATGGGCACGGAGCTGCTTCGGGTACATCACGCTGCTCGTTCCTGAGGTATGGGGACTGGCCTTTAGTGAAGCTATCCAGAGCAGGGCAAATAGCCACTGGTGAAGGGAGGAAATGAATTTTCAGATACTTATTACCAAGTAGGTAAGGTCAGAAGCTGGAGTTCAGAGGATGTATCTACAGCTTCTCTGACTCTTATAGGTTTACTAAGATGAAAGTTACCACTGAACCTTACCACTATGTATATATGTTTAATATCTGTCTTTTGAAATGCAGAAATAGTTTAAATGTTTCTTTGTCTATTTTTCTTTTTTTTAATGCTACCCAGGGAAATATTTTCATATCATTTTTAAGTGGCCTGCCTCAATGTATATTTATTTCTTTTGAAGCAAAAAGGTTCTGGAAACTGTTTTTCTGTAGCTTTAAATGAATAGGTGAGCAAAATCTATATGGGATGTAATTTTTTTGTTCAGTCTCTTAAAAAATACTTTGTTTTTGGTACATTTGGTTGTGCTTGTGGGGAAAATAAAAACGCAGAGATCCTTATATATTTATGTTAAAGTAATATTTTATTATCTACATAAAACAGAAATGCACAATACCTTCATAGTTTGTTCTAATTATTGAAATATCTTTATTTTATTTTTAAAGATAGTGCCATCAAGTTTTAAGGGGGGAAAACCCTAGACCTTAAATTGACTGAGTTGAGTTGTGTGTAAAACACTTCCCTTCCTTTATACTTCATAAAGTTTTGGAATAAATTTTATGCATATACCGCCAGATTTCATGTTCATAACTTTCAGAGGCTTTTTTTTTTTAAATGGAGACTACTGGTCTAATTCACTTTTCTTTGCAAAAACTATTAGTCCCAAATCTTTCAGCCACTATGCCTGTAGCATTAAATAGAAATGGTCATTGGGTTTGAGCTTCAATTTGTTGAGATGTTTGTCCCCTTTAAATATGTGCAGATATGCCTGCATCTTCTTTCCAGGTTAACTGTACTTTATTCAATTGTGCAGTTTTGGAGAACATCAGTGGAACTAGGTGGACTTTAATCTCTACCCACAGGTCCTCATATAATTTGGGATCTACAGAAAGGCAGGATTTAGGAGATTATTATTTTTAATAATTTACAAGTATCTCTTAACAAAGAATAACCCTGATAGTATGCTATTGTATGTTTACTAAATAATTAGAAGTAGATCCTATACATTATTCCTGTTTGGTTTGCATAAAAAGATGAATTTTACAATGGTTT
>XM_053552187.1 PREDICTED: Mercenaria mercenaria high affinity cGMP-specific 3',5'-cyclic phosphodiesterase 9A-like (LOC123560979), transcript variant X1, mRNA 
GACAGAACGCCAGAAGAGTGTTTCCTAATGCGCATGCGTGTGGTTGCGTGAGAAACGTATGTGTTGTGGAAACGCCACTTTCTCTTAGATTCGCCAGCGCGCTTTAAAGTGGACGACATTAACTTGTGATTTTTTGTGTGTCTGAGATTGACAGTGTTTGGGTTTCAGCTAAGTGCGTCTACATTTATATGAATCCAAACAGATATCAGACATTTTATCGATCAAGCTTTTGTAGCCATCGCTGTTGTCTGACTATTTATATCTTCTCGAGCGCTGATAAAACTGAGGATGCAAAAGTTTTGTTTGCTTATTAATATATCGTAATTTCATTCAGTCATTGTACAATGTGGACTTCATAGTGCTTTCTTTGGAGTGGTTAGACGAGAACTAAGATGGGAAACGCTTCGTCAATAGATTCGTCTGTGGTCGTTTATCTAGAAGTTAGTGGAAAACAAGAAAAGATTGTATTCAGCAAACACTGTAGTTCCAGGGATATACATGACCTCGTGGCACAAGCAGCCGGATGTAGCAAGTATTGTATATTGACCCTTAAAGATCCAAATGGTGCCCATATTTCCATGTCTCCCACGATGCCAAGCAACACGCCCAGTGCGCCTTACAAGGTTCAAGTATCACAACCTACGTCAAATCAAGGCGATAGTGAGGTGCTTACACAACTTATGACGCATGTGGCAGATCAGTTCAACAAAGCTTTCAAAGTGGAGGAAATGAGATCGGAAATTTCAACCAGACTTACAGCACTGGAAAGGAAACTGGAAATGGAGGGACTGAAAGCTGTTGAAATTGAAAAGTGCAAAAAGGACATTTCGGAAATCAAGGATCAGATCTGGACAGCACAAAAGAAGTTTGTGGACTTCAACAGAATGAGACCCTTATTGTACGGTAGTAACACTCACGATCATTTTTATAGTTCGCTGAGTGATGAACGGAAGATCTGCCTTAAAAGGGATATTCCCTCATATCCGAAGTATACTTTGTCTCAGGAAACGATAGATTACTTAAAGCAGCCAACATTTGATATTTGGCATTGGGAACCAAATGAGATGTTGAGTCTACTAGAACATATGTACCACGAGCTTGGCCTTGTGAAGGAATTCAGTATCAATCCGATTACACTGAAAAGATGGCTGCTATGTGTCCAAGAAAATTACCGGAACAATCCGTTTCATAACTTCCGTCATTGCTTCTGTGTCACACAAATGATGTATGGGATGATTCATTTATGCAAACTCTGGGATTACATGACGAGGGAGGAAATCGGGATACTCCTGACAGCAAGCGTTTGTCATGATTTAGACCATCCTGGATACAATAATACCTACCAGATAAACGCACGGACGGAGCTTGCTATTCGGTATAATGACATATCACCCCTAGAAAATCACCACTGTGCTGTGTCTTTTCAAATTCTGTGTAATCCGGAGACAAACATTTTTGCTAACTTAGACAAGGACGGCTTCAAACGTGTGCGAGCAGGTATAACACAACTTATATTAGCAACAGATATGGCAAGACATAGTGAAATCATAGAGTCGTTCAAATCTAAACTGGAAGGCAAATTTGACTTCAAGAGCAAAGAACAGCTAGACACTTTGAAGATGGTTTTAATCAAATGTTGTGATATATCAAATGAGGTCCGTCCTATGGAAGTTTCTGAGCCTTGGGTAGACTGCCTGTTAGAGGAATACTTTAATCAGTCTGATCGTGAAAAAATGGAAGGATTACCAGTGGCGCCTTTTATGGACAGAGATAAAGTAACTAAACCAACAGCACAGATAGGTTTCATCAAATTTGTTCTCATACCAATGTTTGAAACAGTCTCAAAGCTGTTTCCGCAGATAGATGAGACAATGGTACAGCCATTAAGATTAGCACGTGATAGATATGAAGGAATGAAGGAGCAGACAACTCCTCCTAATCCAAAATCTCAAAAAGATCAGGCTGCGAAGAAAGACGGAGAGTGATGCCGTGTTGTATATATATACTGGCACCTGTTGCTAAGTTAACATATCATCTCTGTGTTAAAATGTTACGAAGACCTGTAAAATAGACTCTAGTAGAATAATATCTTAACATTGTGGAAAACTATGTTTGTAGGATTTGAAAGCTTTGATAACATTATAACGGTTGCATATATTCAGGTCAAGTTTACAGGCAACAACAAAAATGTTGGGCCTTTCTCATGAAAAAAAATCTGGTGAAAAAGAAAATACTGGGTGAGTTTTGAAAAAAAAAGACTTACTCTTAAAGTGATATTGTTTTACATAAACAAACATCGAATTAAGGGTAACTTATCGTGTTGATGTATTTAATTCCTGTACATGTATGTGATTACATTGTTCAGTGTCTTGGTAAGGACTTTTAATGTTCAAATTTAAACAGCAAATTGCGTTATGTAGCAATGAGCTTGAAAGTATTTGTTCATACAGTTCAGACAGATACGGAGCTAGTGCTTGGTGACAATAGCTTTAATATAATGTTATTATTTGTGCATACAGTTTAGATAGACAAGGTGGCAATAGTTTGAACAGCATGTATGTACAGTTATAACTCGCTGTCTCGAATTCCAAGGGATCGAGCGTTTTAGCTCGAGATAACCGAAATACGACTTAAAATGATATTTTATACACGCGTTTTACCTCGAGATAACCGAAATACGATTTAAAAGGATATTTGATACACGCGTTTTACCTCGAGATAACCGAAATACAACTTAAAATGATATTTGAAACATGCGTTTTACCTCGAGATAACAGAAATACGACTTAAAATGATATTTTGTACACGCGTTTTACCTCGAGATAACCGGAATACGACTTAAAATGATATTTTGTACACGCGTTTTACCTCGAGATAACCGAAATACGACTCAAAATGATATTTTGCACACGCGTTTTACCTCGAGATAACCGGGATACGACTCAAAATGATATTTTGTACACGCGTTTTACCTCGAGATAACCGAAATACGACTCAAAATGATATTTTATACGGTGACAATAGGTTAAATGTTGTGGACCCGTAATGACATTCGGCAATTTCCGTACGATTACGAAACTTGTATGCTAGTTCGGCACCTTACGGCTGTAACATCAAATTGCTTTTTTCATAATCAAATCCTTGAGACGTCTGGTGGTGGTTGATTTTTAGCAGATTTACTTTCTGTTTTCTTGCAACTATTATGCACCTCAACAGCTAAAATAAAACGGAGAATACCTGAATTTACATTTTCTGTATTACAAATATCATGTCACCTGTACACAAACTAATTTTATACAACAAAAACAGGAAACAAAGAACATTTTTATGCAAATCATTTTCATTACATTTACTTATAAATATCTCACTTATTAGTAATATACTTTTGATCTATTTCTGACACTCTATTTTGTAACAAAACAAATATCCAACTATTAAAATACTTGTATAGGAAACGAACATAAACGTGCTTCGAATCTAAGATGAATTCTACGTGACCTCACATGAATCCAGAATTAACCCGCTTGAATTCAGTGATGTAACCATAGGCTTGAAAACCTTATCATCAATAGATCTTGTATAATCTAGCCGGTCAATGTGAATGGAGACAGGTTAAATTAGACTGCTTGATCATTGATAGTTCATCCGCAATATTCATGAATGGAACTATTTGGTGTAGCGCACGAACATCTTTTTGATGTGATTAGGAATGAAATAAAGATCCTGTGATTGTCAGAAATACACTTATAACTTTGATAGCGGGTAAACCCGCCCCACCCCACAAAAAACGGAGAAAGTCGAAAGTGCTTACGGAAAATACGTAAACGAACTGAAAATGCGATTGTCGTTACGGGTCCACGAAAAAGTAAGAACAGAATCGCTTGCAGCAATGAGTGCAGCAAACGCAACACACGCGGATTACATAAGAATGGACACTGTAGTAAAATTGCAACAGAAGTTTATGTATTTGTATTTACAGTATACAAGGTTCTTAGAGTTTGTTATTGCGTTTGAGTATAATGTAAGTTTTATATCTGCAGTTTAGAAAAAATGAAGTTTTACATTAGAAATCAAGGAAATGTTGTAGATCTATACTAGAAAATATTCACTGAGTATAGCGATAAGCATTTTACTAACATTTGCCTATAAATCGTTTGGTTATACCAAACTTCTCAATGAAACAATACATTACAGTTTCTTCAATCTCTCTCTTTAGTTATTATACAATATGTATTAATAGCGGAAACGTGATATTTTTATATTATTTTTTTTTTACATTTGAGACGCTTTTTAAAAAAAAAATATGTCACAGAGATAATGGTATACGAGCTTTTCTGTTCAAAAAAGCATGTGTTGCAATTACAAAAATTGTGTCACTGTTCACTATACATATTTAATTTCATTAAGGTGTCGGCTATATCAAAAATATTTTTACAGCGTAGGGAGTTCTTAAAATGTTTTATGTGACATTTTTACGAACACACATTATTGATCAATAGCGAGATTTATTTCAAGATTTCATAATAAAAAAACATAATGATAATAAAAAAATATATTTGGGGAAATGTTTTATGATAAATGGCACTGTATATGTTGAACTTACTTGTGTAACAGTTGTTTGATCTGTCGGTTATTTGTTCTGAAATATTGTCTTGCGTCGAAATGTGAATAAACAACGGTTTCTTCATA
>XM_050728021.1 PREDICTED: Bombus affinis sodium-dependent transporter bedraggled (LOC126919204), transcript variant X1, mRNA 
TTTTATTGTTTAATAAATAATTGATTAAATAACAAAAATTTACAAGAAGAAGTGAAATCGTTTATCAACGTTTGCAATGTTATATCTTTTGAGAACAGCTATACTGAAAATACTAAGATCTTAATTTTGTGATCCTTTGTGAAAATTTACATAAAATTTACAAGATATGAAAAATATTCAATATTTTACTTTACAAGACTTCAATCATAATTATTTTTAAACTTGATTTATTAAATTATATGTATTTAGTATTTAGTAAATAAAAAAATAGAAAAACAACAAATATGATAAAAAAAACGTTACGTGCTAAATCTTAAAATCATGTAGCTGTTTTTATGAATATGTAGTTGGCCTTCAAACATTGATAGCTATTACACGTTGTTTGTATGTAATAGAGGATATCATTAGTGTACTAGCTTAACCATATTTATAAGAAAAATGAAACTACTCTTACACAAACGACAAAACGAGTAGATCATTTGTCATCATTTTGTCAGTTTATTTATTTTTTATTATTAACTATTGATTGTACACTTTATTATTGATATTTTATCGAGGAGAATCAAATAAATATTGTACAACAAGTATTACAGGCTATATAGATGTATCTATATATAAAAGCAAGTATCACACAAACACACACATAGAAGAACATATTAATTATATGTTTCATGTAAAATAAAATTTCTTCATAGAAAAATAATATTGTGCAAGTACGTGAATAAGGAAAATGAATTAGATTATTTGGCTATAGTATTGTTTTTAGGATATTGATTAGTTTGAAACTCTATAAAAGCATTCTGAAGTTGTTGTCCTGGTTCATGATTCACGAATGAGTTATATAGAGCCGTAGCCAGCTGAGAAGGTCCGGTTACTGGTTACCTGTTACCTGGACAAGTGTGCTGGCAACGGGCTTGTCCTAAAGTATCGACCGTGACAGTCGTTCCAGTCGATTCCAGTCACAGCTTTTAGATCGATAGTTTTCCGACAATATCGATCGATAGCTTCCTTTTGACTTTTCCAATCATGCATCCATTATTAAAATATATAGAAGTGTAAAAATTGTTAAAAACGTTAAAAAGTACAAAAATTGTTACAATTTATTCTTTCTGTTACTAGTATTTCTCTACGAGTTTTGTAAAGGGACATTCGTCGTTCGGAAGAGTAATATTGCAGAAATGTTTCTGTGTTCTTCCCTTCCCGAGTACTAAAGGACATGAATCAATTAATGAATGAATCATATTTTTTACCAACTCTGATATGATGTACGTAATCAAATTTTTAATTTATATCGGTTATCAATTCTTACTTACTTCTTCACCTACTAGGTAATATCAGATAATAATTTGAACTATTATCAGTTGACAATAGATGCTAATGGATGATAATTGATACGACAATCGAATCGTTTTAGATGAAATGTTACTAAATAATAATAAAACTTAATGAATTTGTGTCAATAATACTTTTGATTGATATTGTATGCGTATTTTGGTAGGTATGAGGAATGATTCATATGTTTATTTCTCCATTTTTATCACAATCACGTTAGTATTGTGGTAGTAGGATTAGTTTATAAATAATCGGAGTTCGCAAATTGTCTTTAGCATTACATCGTTAATGATTCCTAATAATATAACACCGTGGTTGAAGCTGCAACTTATTTTCCTTAACGACCCGGCATTCATACGTGTTTCTTTATACCGTAAGGTTAAACATCCATTTCAATCAGTTATTGTTTTAAATCATGTCAGCTATATGGATATTTCATAACGTTGTTCAATATTTCCAAAATAGTGAGTCTGTCGTAGCATGTTCTACGGTTTACACAAAGAACTAAAGAAAGTAATTTGTGTGATAAATTTCTACGTGAAAGAGCGGTTTTAGAATCAGTTTTCACCGCATCGAGATAAGATGACGATATATATGTACTTAGTTTCCAAGTGAAGCGAACGTAGGAGAGGTTTAGACATTTCAAACGAAAAAGTATCGGTCTACTTTGTTCAAGGGATTAAGTTAGCCTGATCGTAGAAATTTAAACATTTAAAACAATGCATAGGATTGTTACCCTACTACAGATAAACGTTCATTTTCTCGTTGCAGTAGTTAACCATTACAGAATGACTTCGAGCGAAGATGGTGATTTGATCGATCTTGGAAACGATAGTTGTGTACCACGAGTATCGATTCAAGAATCATCGCCTGACGAGCAAGAACATCTTCTCGATGTGTGCCTACCGAAGTTAGAACAAGCATTGTCATTAACCAGGAAGCAAGAACAAGTACAATGCATAAATGACAACGGTGATGTATTAGTCACGTTAGGTCACGATCAAGTGGTACCGATTCGTAAAAGAATCGATGTCGTTTCATCCGATACGATAAAAAGGGTTCGTGACATTACCAGGAACTTAGAACCAGTTATAAGAAAGACTTGTTCCGACATTAATGAGGAGCATCAAGACACGGTTGATTATGGAAGTTCATCGGATAACAAAGACGGACATTATTCTAGTGAAAAGCTCGAAGACGATACGTTCGAGGCACAGGAGATCAATGATGCTTTCAATTTTCTCACAGAACACGATGACAACGATGATCCAGCCGAAGCGAAATGTAACCGTTATGACCAAGTTATAAATTCACATGGACTGATCCTATTAACCTCTCGTACCATAAAAAACGAAGATTTATTGAATTACCATGGTAAAAGTGCTTCACAAGCGCTAAACTGCTGGAAAGCAGACACAGATTTAAATGATTCAGGTTTTGAATTATGTTCGGGCAACCCGTCTGAAAGTATTTCGAGGAAACCTAGATCTGATCCTGTTGATTATGAACTTGGAGCGAGTAGCATTAATGTGGTTGAAAATCATTCCGAAGAACAAACGTTTGTACGAACAGCTAAAAGAAGATCATTTCAGCATATACATCGTAAATCTTGGACGGAAGGAACTACACTCAAAAATGCAACACAGGATACATTCTCTCGGTTCGATAGGTCAACTAGTTTAAGAGGATATAATTACGCGTCATCAACTTCCAATGGCATTCATCGGCAATCCAGTTTTATTTCGAGTTGTTCAACGGAGGAAGGATTGGAAACGAATGGAGAGGATCAAGAGGACGGATGTTCAGAATGTTCGGAAGTAGATTGGTCGTGGTTAGAGGAAGTAGAATGTCCGCGGGCTACGGAGTCGTTAGCACCCGGTGTGGTTGACGCGGTTCAGGAGAACCCCGAAGGAGGGAATGTATCCCCCACCAGTGAAAACGCAAGACGCAGGCGCGGTCGCGAGCATCGTGCTACCGAGGCGGGCTGCAGTGCCGCGATGTCTGTCTCCGGGACAGTAAAGTCCCTAGTGGTCGGTGGTTCGCGATGGTTAACTTCCGATCCGCCGTCCGACTGTAACGGCAATAATCAAGATGAAAATATACGTTGCAACGCGAGCAACGAAACCATCGATCGCGAAACACGTGACAATCCTACGCTTGTCAATTCTTGGGTACGGGCTTCGATGAGACGTTTGCGTCACCTGAGATTACCGGAAGAAACTGAACGACAACGAAACATTGATTTGAATAGTTGCCACGGAACTGTCGTATCCGCGCCAAATTCTTTGCCAGATATCGCTTTAATCGCTCCAGAGATATTAGCTGCCCAAACAAACGGTACTTCCGGCACCCTCCTTAGGCCATCCAGCGCTCCTGTAAGAAACTCGAATAATTCAAATGTAGTGCCATCGCGGAGAGGCGGAAGACAATTTAGAGCAAGTCGATCGCAAAGAACGCGAAGTCGCGACATTACTTCCAGGCAAAGCAGCGTTTTATCGTCGACTACGGGCAGTGATACAACTGCTTCAGGAATCACGACATGCTCCAGCTCTTTTGGCGGTGTTTCTACGAGTCCACCTTCTAGCACGGCGACAAGTCCGCAACGCATCGCTTCCAGACGAATATGTGACAGACAGAGAGACGTTGATAGAGATGAGGATAGAGGAGAGGATGAGGATGAGGATGCTAATCCATTGGGAAAATGGCCACATGCTCTTAGTCCAGCCTTGGCGTGTCTTAGTTGCACCCTTGGTCTTTTTAATATAAGTAGATTTTCTATTCTTAGTGTACAATTCGGAGCAAATTTCATTGTACAGTTCCTGATTTTATCTTTGGTATTGGGTATTCCACTTTTGACGTTGCACGTGTGTCTCGGTCAAAGATTGGCGGCTGGATCCGTGGATATGTGGAAGATTTCACCCCTCTTTCAGGGCGTTGGTATAGCTCTCCTAATTGCACAAGCATTCATCGGTATCTACAGTATCGTTGGTGTATCCTGGATGTTCGTCTACTTTAGAGATTCGTTTATAACGAAGCAGGATAAGTACCGATGGGCAGAACCGTTTTCCTTGTACAGAGAAGATAAACCTACACAGAATAATAGTAATTTGCATAAATTATATGAGACAGTACCAGATTATTTTAGCGGAGTTGTCTTGCAAAGAAATCATTTAAATGAATCAGATCCCGGTATCGTAACGTTAAAGTTTCAAGTGGCTTTCAATTTAGCTGTTGTATGGATGATCGTGTTCGTATCATTAAGCAAAGGTTTGAGATCTTATGGCAAAGTAGTATATGTTTTTACGTTGGTGCCTGTATTTGGTACACTAGTTCTTTGTACGAAATTACTTGGCCTCACGCCACCAGGCTCTGTACATCAACTTTTTCCTGCCACTGTGTGGACTGAGTTTTTCATTAATGGCAAATCGTGGGTAGCAGCATCCATCGAGGTTTTCCTCACTTGGGGATTACTTGGTGCAGCTGCTATGCAGATAGCTGCTCATAATAAGCACAAACATCTATTACAACGAGACACGAGTCTAGTAATCGTGTTAACCCTCGCAGTTCTACTTCTCGCAGCTTTTCTGGCAAATACTTGCGTGCAAGTTTTGCGACATCATGGATATATTTACATACCTAGCTCATTTGAAAGAATATCATCGTATATGTTTATGCGACCTGTGAACCAGCCGGCACCACCGGGATATAGCAGTACACCAGAAAGATTTATGGCACATGCGTCGTTTATTGTTGGAGAACGTGTAACTCGACCCGGTGCAGACTTTAGTGTTGAATCTGGTTATCAAGCCTTGAGATTTTCGACTGAATTGGTTCCTGCAACGTTAGCGTTACTAGGCACTGAACAAGTGTCACCATTCTGGGCAGTTCTTTTCTATTTTATTCTTATCCTATTTGGAATAGCTCAACAGCTAGCAATATGGCATTGTGTAATAACTGGTATTATGGCAATTAATGCAAAAATGATGAAGTTATGGGAAACTACTATTACATTCTTCAGTTGTGCTTGTGCTTATATACTAGGCTTACCCATGGCTACCGAGTTGGGCATACACGTCGTATATTATCTAGACTACACAATTGGTGGTACGTGGTGGATAATGATCTTATACTTGGTGCAAGTTGGTGCTGTATTCGCAGTGCGCGGACGTCCACATAGTGGTGAAGCGGTAGTAGCCGAATTGTTTCCTCCAACTGGTCGATGTCTCAGACACTGGGCTGGTCCTCTTCTTTCATTCACGTGGAACGTTATACTGCCTGTTATTCTTATGGTACTTAGCATTACGGTATTTAAAAATGCTGGATTTCGAGAACTTTATTCTTACCGACGTACCGCTAGAGAGTACTGGACAGTTTGGGCAAAACAACTCGGAGCTACGATTCAATTAGTACCAATATTGACGATACCGGCAGTGGCGATTATACAAACATGTCGATACTTGAACAACGGTCCACCCGATATTTTTGATAACAATCAAGTGGAAGTTAATATAAATCACTGCGAACAATGTAATGGTAGAATTCAATTATTGTATCGACCATCTTTGGAGCCTGATGACCCACGAGATGCACAAACACATACTGGAAACGATATGAGTACCAGCATTCACGGCAATGGTATCGTACATACAACGACAGAAGTACCATTTGAAGATCCACCACCAAAATATACACCTCCTCCGAGTTACACTACAGCAACGGGAGCGAGAATAGCAAAGATGTTGCGGCAAAGTTTTCGAAGAAGTGTTCGTCGAATAGCGAATGTGCTCGGTGAGAGCAGTACTCCGAGACAGAGACCGGCGCTACAACCTCCACCTCCTGATTACGCCACTGTACTTGTAGAAATGAATCAAAGTAGGCAAACCCCAGATGTAACAATTCATATAACTGAAGCAAGAAACGAAAACATCAATTCAAACACTCAAAGTAATGCTACCGAAAGACATAGACCTAATACGATAGATAGATCAACAAGAATTGGTGTGGTAGAACGCTCGATAGAAAGAACGCATTCGACGCTCGAAAGACCTCGTCGACCTTGTATGACTTCATCGAGCAGTTCGAATTTAACTGCAGCCGATGTGGCTAATTTACTTCGTAGTAGCATTAGGAGAGGGACTTCGCGAACTCAACAGTCCCTGCGTAGGAGTTTCTGCCACGACGAATCAACGGTAGCAGCGTCCGTTGAAAATCTAGTCGAGGCTGCAGCGCCGATAGGTGAAGAATCCTTGGTCCTTCCAAAGGACGTGTCTCTAGTCTCTAATGAACAGGCTAACAATAATAGCGACGATAAAAAGACTGCCGAAGAAACGGATGATTCCGTTTCTGTGATATAGACTATATCTTTCTTTTGAGCATATAAGAAGAATAATCTGATGGTTATTTAATTTCTGCTGCATAGTGTTACGGTGATTTATTCCTTGTTTAACTTGTATTCAATATTCATTTTCACAAGCTATTCTACGAAAGATAAACAAGTTGCTGATGATTTCATCGATCAATGATCGAAAAAATAATTTTATCTCTCAGACTGAATTCAGTATTTTCTAATCTTGTCACACTTGACAAATAAGTGCATAATCTCATCACTTTAATTACCGTGACAATTGTATAACGCGCAAATGAAAATTGGATAGCTATAAGCAGTGAAACATATAATAAACTCCTTTTCTTACTTACTACGATAGACATCGATTTTATATTGTATATGTTGAACTTTATTGAGGTTCAATTTGCTTTCAATCAGTCTATTTTAGCATTTTGGCATTTTCAATCGAGACTGTGTAACTAAAATATTTATGTAATATATACTACTGTAACATTTTAGTAGTTTTATGATATTAGTGTACATACTATTTTAACGAATCATAAATTCGCTTATTAAGCATTTTCTTCATTAA
>XM_027781123.1 PREDICTED: Falco peregrinus polycystin 1, transient receptor potential channel interacting (PKD1), mRNA 
ATGAATATTTTTGTCAAAGGATACATCAAACTTAGTAATACATTTGTCATGTCTGTAATTACTCTAGATACACTGCAGAATGTTGAACGAAAACTGAAAATTGTGTTTTCTTTCTCTAGGGATCTTTCCAATAACAAGATCAGTGGTTTAGATGTTCAGATATTCAAAAGCCTGACTTCTCTGGCAAAACTAGATATAAGCCACAACAAGATTTCTACATTAGAAGATGGAATATTTGATAATTTATTTAATTTAAGTGAAATAAACTTAAGTTGGAATCCATTTGTTTGTGACTGCAAACTTTCCTGGTTGCCCCATTGGGTGGAAGACAGACAAGTGAAAGTTATTCAGGCATCAGATACGAGATGCGCCCACCCCCCTGAGGTGGCAAACCTTTCCCTCTTTGATGTCTTGTTCGTCAATGCTACTTGCGGAGCTCAATACATAACGTGTCTGACAAGCAACCACACAGAAGGGACTGAATTTGTCATCCTCTTCACATCTGTTCACCCTGGGAACCTCACTGAGGAGACTTGCAGTGCCCTCTGTTATGCTGAAGATCAGGAATATGGAGGTTTCAGCACCCAGGAGCAGTGTTTGTGTGGTACTGCCCATGAAACAAACTCTTCCTACGGTTGTTTGCCATTTTGCACTGAGCATTTGTCCGGGCAGGCCTGTGGTGGCCCATCACTCGTCCCCTCTCCCTTCCAGGCACAGCTATCTGTGTCTTTCACAGGACTCCAGCCCCGGTACAGCCTACGCCAGGCCGTGCTCTTCAATGTCAGTATTCCCATTGCTGTCAGCACTTTACTGTGGGAATTTGGGGACCAGACAGAGGTTCTCAACACCACTGGAAATACAGCTGTCCACATGTATGCCTTACCTGGCCAGTACAATGTCACTGCCACCATCTCTGTGGGCACCAAGGTCTTATACGTGCAGGCAGAAATTGAGGTGGTGGCTTCACCCCAACAGTTAGAACTGCAGTGTCCTTCCTTGGTCAAGACTAATGAGAGCCTGGACATACGGATCCGCAACAGAGGTGGCACAGGCCTTGCAGTGTCGTACAGTATCACCGCAGAGGCTGGGGAGCTGGGCAGAGCCGTTCACCCCCTGTGTCCCCCTGATGGCTTGGTTTTCCCGGGCAATAACCACTGCTATCAGCTGGTGGTGGAGAAGGCTGAGTGGCTGGAGGCCCAGCAGCACTGCCAGGAGCATGGCAATGGAGAGCTGGCTTTTGTGAGCAGCCCTGAGATCCAGAGCTTCTTGGTTGCTCATGTCATCAGGAGCCTCGATGTCTGGATTGGGTTCAATGATTTTGCAAGCACTGGAGCACAGCAAAGAGGTGAAGGATTTAACCTGGAGAGCTGTCAGAACTGGCTGCCAGGAGAACCACATCCATCAAATGCTGACCACTGTGTCCGGATGGGCCCAACAGGCCAGTGTAACACAGACCTGTGCATGGCCAAGCATAGCTACGTCTGCGAGTACAAGCCAAAAGGAGTTCTCTTAAATGCCAAAAACTTCTTTGTGGGAGACCCTGTGTCAGACACACATGAGGCTGTGAAAAATGTGACAGAAGATGCGCTGTCAGCTCCATGGCAAGCTGTGGAGGTGATGGTGTTCCCTGAGCTGGCATTCAGGCACGAGGGATATTTGACTGCCCTGGAGTTTGTAACACAGGAACTGCATCAGCCCGTTCAAGTGAGGTTCCAGGTGCATAGACCGATAGATGGAGAAGACTACCAGGAGGAAAAAAATGCTACAGAACCATTCTACACTTCTCAGGATGATGGGAACTGGACACTATTTGAATGTCCTCCTGGTTTCCAGTGGTGTCATTTGACTAATTTGTGCTCATCGCTAAACAACTGCTGCAACGCAACTGAGTGTGCCAACAGTTCTCTTGCCAGCAGCTCTACCCCCGTTTCCCTTCAGCACAGTGAAAGCCAGCTCAGCTATGAACTCATCGAGGAGTTTCTCTTTACAATACCAGCTGGCCCTTCTTCCCGGTATCTGGTCACGTTCAGAAAAGAAAATATATTTGTCAGGTCTGAGGATGTCTTCAGTATCCAGCACAATGCAGGCTTGGGCTTACTCCTCCAGTGCCAACCAAGTACCACATCCCCTTACAGAACCAACGTCTTAAGCATAAACTCTTCGGAGTCGGCACTTGGCTTGTCTGACGGCTTCATCGGTGCCACCTGGATGAACAACACTGTTTGTTCTCTCCGAGTTTGGTACGCTGAGGAGCAGCTGGTCCCGGTGATCAGCTCCCACAACACGGGGCTGGAGCATCCAGGTCGCTACACGGTCAGAGCCAGCGTGGACAACGGGGTCTTCAGCACCAATCTGTCCTGCAGTTTCTGGGTGGCTTCCCAGGTGTCAGGCCTGCGTGTCATCCACCCCGCTCCTCAGGGCGGCAGGGTCTACCTACCATCCAACCACACTACCCTGGTCATCAAACTCTCCTCAGGGGTGAATGCAACAGCTAGCTGGCTGGGAGACAACCGCACCTTCCCCTTCGAGGGGTCCTGCCCAGCGGCTGTGGCCCTGCTGACAGCAGACTGTGCCAGGGAGACCAATGACACCTGGTTTGCAGTGGTCAGCCTGAGCGGCCTCAGGGAGGGGATGAGCACCCACACGCTGGTTGCAGAGAACACTGTGAGCTCGCAGAACATCACTGTCACAGTGAAAGTGGAGGAGCCTATCCGTGGGCTGCGGGCCACCCCTGACCCTGAGAGCAGAGTCCTGCTAAATACACGAGTGAGCTACATCCCTGTGATGGAAGCTGGGTCAGATGTGACTTTCCGATGGACAGTAGATGATAAGCCATCTTTCACTTTTTACAATGTTGTCTTCAATGTTATCTACCAAAGCCCAGCTGTGTACAAGCTTTCGCTCACCGCCTCCAACCACGTCAGTAACTTTACGGTCAATTACAATGTCACGGTGGAGATGATGAATAAGATGAAGAACCTGACTGTGTTGGGTGTCCTGCCGGTCCTCCCGCAGAACAGCACCGTGGAGCTTACAGCAAGAGTTCAGGTTGATTCAGCTGTGGATGCTCTTTTCCTGTGGGATTTTGGAGATGGTGTCCAGAAGACATACCTGTTCCAACCTCCCTACAACAAGTCTTTCCTTGTTCCTGATCCCAGTGTGCATGAGGTTGTAATTGAGCACAATGTTTCACACGTCTATCAAGACCCAGGAGAGTATGCCTTGGTGGTTGTCGTGTCAAACCAGTTTGAGAACCTCACCCACTTGACCCCAGTTCACATCCACAGTTACCTGACTGATGTGAAGATGGAAGCAGAGGAGGATGTTTTAGTTGTGAACTGTCCGGTCACCTTCAGAGCTGATCCATTGCCATCTCCTTATGGCGTCGTGTACACCTGGGACTTCGGGGATGGGTCCTTGCTGTTCACAGAGAGCCAGTCTACAGTGACATACAGCTACCCCAGAAGAGGGGTGTACAACATCACTGTGACTGCCAACAATACCATAAGCAGCGTGGAGACAGTTGAGCACTACCAAGTGTTTGAAGAGATAACTGGGCTTCATGTTTCTGCAGATGAGGCAGCAGAGCTGGGAGCATCTGTGACCCTTAATGCTTCCGTGCAGACGGGGGACAGCATCACCTGGATATTCGATATGGGGGACGGGACGGTGCTGAGGACTCAAGTGCCAGTGGTAGAACACGTGTATGTAAAGGACATCAACTGCACTGTGAATGTGACAGCTGTGAATCCTGTGAACTCTGTCTCCCAAACTGTGCCCGTTAGGATATTTGTCCTGGAAGTACTCAAAATAGAGCCTACTTCTTGCATCCTTGAGCACCCGGACGTGCAGCTGACTGCATATGTGACAGGAAATCCTGATGAATACATCTTTGATTGGACTTTTGGAGATGGCTCGTCCAATGTCACAATCAGTGGGGACCCTGTGGTGATGCACAACTTCACCCGCAGTGGGACATTCCCCCTCTCCCTGACTCTCTCAAGCAGGTTTAACAAGGCTCACTATTTCACCAGCGTCTGTGTGGAGCCAGAGATTGTCAATGTCACACTTCTCCCTTCCAAGCAGTTTGTGAGGCTTGGTGAAGAGAGCAGCTTCCAGGTCAGTGCCGTGCCTCTCTACCAGTACCGCTACCGCTGGGATTTCGGGACCAATGAGTCCACTAGATCGAGTGGGACTGAAGTGACCTACACCTACAAGAACACAGGGGTCTTCCTGGTCACAGTGACTGTCTCCAACAATGTCTCTTTCAACAACGACACAGCGTTTGTGGAAGTCCAGGAACCGGTTGGGGTAGCAAAGATTGAATATAACGGGACAAGTGTTTTGGAGCTGAACCAGATCTACCTGTTCTCTGCCAGCATGAATGGAACCAAAGTGAGTTACTGTTGGGACTTTGGAGATGGCACTACCCAGCCCGGGCAAATCGCTGCCCACTCCTACAACAACACGGGCCATTACACTATTAGTGTGGTGGGCCGGAATGATGTGAGCTTTAATGAGACCGTCATTGATGTCACAGTGAAACGGCGGCTCCAGGGGCTGACCATCAATGCCAGCAGGACAGTGGTGCCGTTAAATGGTTCAGTGAGTTTTGTAGCCACACTTGTAGCTGGCAGTGCCATCCGCTACTCGTGGATCCTCTGTGATCGGTGCACTCCTATCCAAGGCTCGTCCACAATTTCCTACACTTTCCGGTCCGTGGGCACATTCAATGTCATTGTGACAGCAGAGAACAAGATCAGTTCGTTGCAGGACAGCATCTATGTCTACGTCCTGGAACAGATTGAGGGCCTGCAGGTGGCTAGCAGTGACCTGGTAGAGGACATCTATTTCCCAACGAACAAAACACTCCATTTGCAGGCAGTGGTGAGAGAGGGAACAAACATCTCTTACAGCTGGGTAGCCCAAAGGGATGGCAATGCTGTGCAGACCTTCACTGGGAAAACCTTCTCCTTGGTTGTCCTAGAAGCTGGAAACTACACTGTCTATCTGAAAGCCACTAATATGCTGGGATGTGCAACTGCTAACAGGACACTGGAGTTCATTGAAAGCATTGGTCTTTTAAAGCCTTGTGCCTTCCCCAACCCAGTTGCTATTAATGCCTCTGTTAACATAAGTACCACCATAACCAGTGGCACTGGCATCACATACATTTGGTACCTAGAGGATGGCTTCTCTCCTGTTACTTCTGAACCCTTTATTATACACTCCTTCCAAAGCCCTGGAGTGATAGAGGTCATCGTTGAAGCAGAAAACAAGCTGAATTCAACCAATGCAACAATTCCTATCTGTGTAGAGGAGGTCATAGAGGGGCTGAGTATAGGGACTGCAGAACTGGACTGTAGATACGTCTCATCCGGCTCCACAGTGGTCTTTGAGGGGGAGCTGCAGAAAGGGACTGAAGTGACATGGCTTTGGGAGGTGCCAAATGGAACGCTGACTGGCCAGTCTGTGGCAGTCATGTTCCCCACAGCAGGGTTTTATACAGTCTATCTGAATGCATCAAATGACATCAGCTGGGCTCTGGCCAGCAGGAANNNNNNNNNNNNNNNNNNNNNNATCTCAGTGCTGGACAGGATTCAAGGACTGGAAGTTCTTGCTAGCAAGAAGGTGGTGGAGCCAGGGGAACAGGTCACCTTTGTGATCAGGATGTTGTCAGGTACCTCTGTGAGTTACTTGGTGAGCATAAGTGGGGACTACTCTGTGGTGCTCAATGGGTCCAGGTACACGCATGAGTTCACCAAGAGTGGTGATTACTTGGTAACTGTGACAGTGCAGAACCAAATCAGCATCGCACATGCCCAAGTGCTCATCTCTGTCCTGGAGGCCATCCGTGATGTCAGGCTCCTGAACTGCTGTGAGGAAGGCATACCCACAGGCACGGAGAAGAGCTTCCATGCCCAGGTGGGGAGTGGCTCCCGTGTGGCATTCTCATGGCAGTTCTCCCTGTGGAAAGAGAAAGGACGATCTGTGGTCACTGTGGCAGGAGAGAGTGTTTCCTACACTCCAGAAGCTGCAGGGCTGCTTGAGATTCACCTCAATGCCTTCAATGACTTGGGAGGTATCAATATCACCAGAACCATCCAAGTCCAAGACCCAATAGTCCAAGTCTCCCTCACTGCCTCCAATGCCTTTGTCAACAGGACAGCACTGTTTGAAGCAGCACTGGTGCCCAGCAGCAGGAGTGTTGAGTTCTTGTGGACCTTTGGGGATGGCTCTTCCACTCAAATGACCAGGGTTGCAGTGGCCAACTATTCTTACGTGAGCCCTGGGGATTACCTGGTGGAGGTGAATGCCACCAATCTCATCAGCTTCTTCATAGCCCACCTCACTGTCACTGTCAAAGTCCTGGAGTGTGAGGAGCCAGAGGTGGAGTTAGCCTTGCCCCCTCAAGTAGTCATGAAGCGGTCCCAGAGGAACTACCTAGAGGCACAGATTGACCTCCGAGGATGCATCAAGTACCAGACAGAGCACCTGTGGGAGATCTACCAAGCACCCAGCTGCATGAACTTGGATGACTCCAGCAGGATCCGTCTGCCAAATGTTGATGTGAACAGGCCCCAGCTAGTTATACCAAAGCTTGCCCTGGAAGTTGGGAATTACTGCTTCATTTTTATTGTCTCCTTTGGAGACACCCCACTGTCCAAAAGCATCTTTGCCAATGTGACTGTGATACCGAGTAAGCTGGTCCCAATCATTGATGGGGGGTCATACCGTGTATGGTCCAACACTCAGGACTTAATCTTGGATGGGGAGAAGTCCTATGACCCAAACTTGGATGACGGTGAACAGACTCCGTTGTTATACGATTGGTCTTGTACATTCTCCTCCAAGAGCTCGGCTGCAGGGTGCTCTCTGAATTTCAGTGCCAAGGAAGGAATTGTCACAATTTCCAAAGCTCTGTTAGAAGCAGATGTGGAGTATACGTTCGACCTCACCGTCAGGAAGGAGGGTATGAGTCCTGAGGCAACAAATCAAACCGTATTCATCAAGAGGGGAGGAGTCCCTATCGTTTCCCTGGAGTGCGTTTCCTGCAAGGCTCAGTCTGTCTATGAAGTTAGCAAGAGCTCCTACGTCTACCTGGAGGGGACCTGCCAGAACTGTCACAATGACTCCAAGCTTGGGAGATGGGCAGCACACAGCTTTAAAAACAAGTCTCTCATCCTGGACAAAAAAACTACCTCCACTGGCGACACAGGCATGAACCTGGTCTTGAGGCAAGGGGCACTGAAGGATGGGGAGGGATATACTTTTACCCTTCACATCACAGACCTCACAACCGGGGAGGAAGGATTCGCCTCAATCGATCTGCTCCCCAACCAGCCACCTGTTGGAGGGTCCTGCCAGCTGTCTCCGGAAGGACCCCTCAGGGCACTGATGGCAAAGGTGCACTTTGAGTGTGCAGGCTGGCGAGACACAGAGGACGCGGAGGGCCCGCTGGTGTACATCCTGCTGGCGTCTCGCCACAGGGCTGGGCACTACCACGAGTTCTGCGTGTACAAGGGCAGCCGTGCAGAGCACAGCGCCTTCCTGCCCCCGGGCTTCCATGAGAGCGGCTTTATGGTGTCTGTGGCGGTCCTTGTTCAGGACCAGCTGGGAGCCACCGTGGTAGCCGTTAACAGCTCCATGGAAATCGGCTTACCTGAGGGGTTCCCCAGCCTCTCCCACTGGCTGTACAATCAAACTGACACGGTGCTCCAGGGCTTAGTGAAACAAGGGGATCCTCAGCAGGTCATTGAGTACTCTCTGGCCCTCATCACCATCTTAAATGAGTACGAGAGGTCCATGCTTCTGGAATCTGAGGCTGGAAATGAATTTGAACTCCGGACCTGGACTCGCAATAACATCACAGAAACCCTGAACTCGTTGAATGTGAACACAGTTGATGACATCCAGCAGATCTCAGCTGCCTTGGCGCAGTGCACGGTGGTGAGCAAGGAACTGGTTTGCAAGTCATGCCTGACAAGGACCTTGAACAAGCTGGAGACCATGATGACCATTCTACAGGGAGAAACGACCCAGGGCACTGTGACACCAACTGGCATCGCTGACAACATCCTCAATATCACAGGTGACCTAATTCACCTTGTCAATACAGTTTCACAAGAGTCCAAGCCCCAGGAGCTGCTTGCTGATTCCCACAATTTGCTGCTAGCTCCCAAAGCCTACAACCTGTCTTCCAGCCTGATGCGCATCCTCATGAAGTCTCGGGTGCTGAATGAAGAGCCTCTTGAGCTGGTGGGAGGAGAAATTAAGGCCACAGGCAAGCGGTCTGATCCCTTTAACTTGCTTTGCTACGAAAACACACCAAACTGCCAGTTCTCCATCCCCCAGGCATTCAACACCACCCTTTCCAACCTGACGGATGTCATTCAAGTCATGTTCCAAGTGGACTCCAATCCTTTCCCTTTTGGTTACATCAGCAACTACACTGTGTCCACAAAGGTCGCCTCCATGGAGTTTCAGACACACAACGGGGTGCAGATCCCCATTGGGAGCCTGGACTCAGAGAAAGCCATCACTGTTATGGTGTCAAACAACACAGATGCTGACAATCTCTCTGCTGGCACTGAAGTCATCGAGGCAAGAACATCTGTGAACTTAATTGTGATTATGGAAAGCAACAACAGAGAAGCAGGGCTGCACTTCCAGCTCACTTACAGAGTCCTGAACGATCGCTACATCGCAAGCGAGCCTGAGCCATTCATTATGGCTTATCTCCATCACGAACCAGAGCCCAACGAGCACAACTGTAGTGCCTCTAAGAAAATCGGCCTGGATGCCCTGGCTGGAAGGGACCACAAGCTCTATACCTTCTTCACTTCACCCAGAACGGATGACACCATCCAGAAATACTACTTCAACATCACGAACCATTTCAGCTGGTCCCCAGTGGAGGTGACTCTGGGGCTGTACACCTCCCTCTGCCAGTACTTCAGTGAGCAGGAGAAACGGTGGAAGACAGAAGGGATCATCCCACTGGAAGAGACCAGGCCAGACCAGGCTGTGTGCTTAACCCAGCACCTCACTGCCTTTGGAGCCAGTCTATTTGTCCCCCCAAACTCTGTCCAGTTCATCTTTCCTGCTCCAGGTCCAGGTCTCAACTACATCGTTCTGCTGACATGTGCCGTCTGCTTTGTGACCTACTCGGTGGCTGCACTGATAGTGCACAAGTTGGACATGATTGACATTAACCGAGTAGGGGTGATACCCTTCTGTGGGAAGAACGGGCTGTACAAATACGAGATCCTGGTGAAAACTGGCTGGGGCAGAGGATCAGGTACCACGGCCCATGTGGGGATCGCCCTGTACGGTGTAGACAGTAAAAGTGGTCACAGACACCTGGATGGAGAAAACGCCTTCCACCGCAACAGCCTCGATGTGTTTCAGATCGCAACAGAACGAAGTCTGGGGAGCATCTGGCGCATCCGCATTTGGCACGACAATAAAGGACTCAGCCCCTCTTGGTACCTGCAGCACGTCATAGTCCGGGACCTGCAGAGCAGCAAGAGCTACTTCTTCCTGGTGAATGACTGGCTGTCGGTGGAGAGTGAAGAGAACGATGGCATGGTGGAGAAGGAGGTTTATGCTGCCAGTGAGACAGAGCTGAGGAGCTTCTCCCGGATCTTCATAGCAGAGCTGCAGCGAGGTTTCTTTGAGAAGCATGTCTGGCTCTCCATGTGGGACCGCCCGCCCCGCAGCCGCTTCACCCGTGTCCAGAGAGCCACCTGCTGCTCCCTCCTCATCTTCCTCTTCCTCTGTGCCAATGCTGTGTGGTACGGCGTGGTGGGGAACGTACACCTCAGCAATGGGGCAGTTTCTAACCTGATCCCTGTTAACGTGGACACAGTGGCTGTTGGTCTGGTGTCCAGCGTGGTGGTCTACCCTCTCTACCTGGTCATTTTATTTCTCTTCCGGATGGCTCGTGGCAAGGTCTCCATCAACCACACCCTGACTCACTCAGACCAGCAGTCCTTGGAGATCGACAACTACCTGGACTCCTCAATCCTTGACAGCTCCTTCCCCACCTTCCCTGGGCTCCAGGCAGAGGCCTTCTCTGAGCAAACCAAAACAGATCTCTTCTTGGAGGACTCCAAAAGCCTCGTGCGGTGGCCCTCTAGCGAGGCCCTGCTCAGCTGGCCAGACCTCCTCAGCGACCCCTCCATCATGGGCAACACCATCCAGAAGCTGAAGAGGGGCCGGGCCAGCCGCCACCTTGGACTCGAGGCCCCATTGGCAACTGAGGAGGACAGCTTGTCGCTTGGTGTTCACCAGGGACAACCTCGATATTTCTCTGCCTCAGATGAGGATCTGATCCGGCAGATCCTGGCAGATGGAGCTAGTGGCATCTCCCACTCCCAGGACCTAGGGCCGTACATGAGGGCTGAAACAGATCTGATCTCAGGCCTGTCCAGCATGTTCGGGGAGAAGGTGGAGACTGTCATGATGCAGAAGCTGAACGACAAAGGCCAGGGCATGGCAGCTCCTCCCAGGGAAGTGAACAGATCCGCCAAGTCGACGTGGACAGTTGCAGATCAAACATTCAGAAAGCGCCTGCTGCCACCCTGGTGCTCCTACCTGGCTCATGGTATCAGTCTCCTCCTCTTTGCCACCTCCACGGGGGTCTCTGTGTGGATCGGGGTGGGCTTTTCCTCCAGCGTAGCCCTCATGTGGCTCATCTCAGGGATATTCAGCTTTCTGGCATCCTTCTTGGTCTGGGAGCCCCTGAAGGTTCTGCTGGAAGCCCTCTATTTCTCACTGGTTGCCAAGCGCTTGCACCCAGAGGAAGATGATACCTTGGTGGAGCATCCGTTTGTTGAGCATGTTTCCGAGAAGATCAGCAAAGTCCGACCACCACAGGGGTTTGCCCTTTTCCAGGCCAAGGAGGAGGCCAGGAAGGTCAAACTGCTACACAGGATGCTGAAGAATTTCCTCATCTACATGATGTTCTTGCTGGTGATCCTGCTCACCAACTACGGAGACGCCTCCCGCAACAGCAGGGCCTACCTTCTGCAGAGCTCCATCAAGCAGCAGTTGGGCAGCAACGAATTCCTCCTCATCAAGAGGTCAGATCAGTTCTGGGTCTGGATGTCGCAGGTCTTCCTCCCTTACCTCTACAACAACCAGTCAGGCCAGGAGAGCTACAGCACCACACTGGGAGCAGCCCGGCTGCGCCAGCTCCGGCTGCAGGAAGCTGAGTGCCAGCACAGTGCCCGGGACATCCTCCATAGCATGGGCCCAGCTGCCAGGAGCAACTGCACCAACTCGCACAGCTTTTCTACTGCTGACTATGCAGCTGGCTGGGAAAGGGCGGCCGTGAATGTGTCAGCTGCGTGGTCCTACTCACCACCTGACCTGACGGGGGTCTGGTACTGGGGTTACATCTCTTTCTACGATAGCAGCGGTTACGTCCAGGAGCTGGGGGCTTCGCTAGAGGAAAGCAGGGCTCAGCTGAATTTCCTTCAGCAGCACACTTGGATCGACAACATGAGTCGGGCAGTCTTTGTGGAGCTGATGCAGTATAACCCTAGCGTGGACCTGCATGCTGCCATCACCCTCCAGCTGGAGTTCCTGGGGGCCGGCCAGGCCATCGCCACGGTCACCATCAGCCCCTTCCCACTGCTGCGGCTCAGCAGGGGTGTCACGCTGCAGCTTCTCATGATGGTCTTCCTCATGATGTTTGTGGTCTACTTTGTGGTGTCTGAGTCGCTGTCCATCAAGAAGGAAGGCAGAGCCTACTTCACCCTGTGGGGCAACTATGGCCAGTGGGTCTTCATCCTCCTCACCACGTGCACCGTGGTGGTGCACCTCAGCCAAGCCACCCTTGCCGACCAGCAGTGGCTCAAGTACCTCAACAACCGCAAGGGTTTCACCAACTTCTACCAGGTGGCCTTTCTCAACACCATCTTCAGCACTTTGGCTGCATCCCTCCTCTTCCTTCTGACTGTGCAGGCTGCCCAGCAGCTGCGTTTTGTCAGGCAGTGGTCTGTGTTTGGGAAAACCCTGCGGAAGTCGGCGAAGGAGCTGGCTGCTGCAGGGCTGGCCTTCGCCGTCCTCATCCTGGCCTACGCTCAGCTCGGCTTCCTGCTCTTCTCCTCCTCCTCGGAGTCCTTCCGCAGCGTTGGCAGCAGCCTCCTGCTGCTGTTTGCCATGCTGCGGGGCAGCGGGACCCTCCGCCCCTGCCTGCCCGAGTCCTCGGGCCTCTACTGCCTGTTCTGCACCAGCTACATCGTCCTGGAGGCGTGGATTGTGCTGAGGCTGTTCACCGTGGTGCTTATCTACAGCTACCGGGAAATGCACTTTGAGCTGTACCGCCCCGCCTTCGAGCCCCAGGACTACGAGATGGTGGAGCTCTTCATGCGCAGGCTGAAAATGTGGATGGGCTTCAGCAAAGCCAAGGAGTTTCGGCACAAGGTGAGGTTCGAAGGGATGGAGCCGCTGCCTTCCCGAGACTCCAGTGACTCCAAATCCTTTCGGGGCCCCACTCCCAGCGCTGCATCTGACAGCTCCTGGGCTTCCACCTCCTCCAGCCAGCTGGACGGGCTGAGCCTCGTGCTGAGCACCCGGGACAGCCTGGAAGTGGACGCTGACATCCAGCGCCTCCTTTCCCTCTTTGAGATGCTGCTTGCCCAATTTGACCGGGTCAACCAGGTGACAGAGGACGTGTACCGCATCGAGCACCAGCTGGAGGGCTCTCAGAGCCGCCGCTCCAGGAGGAGGGGTACCCAGGTGTCCGAGGATGTCCCGAGCAGGTACTGTGCGGGCAGCACAGAGCAGGGGCCCTCGCCTGAGACCCCCTCCAACACGGACCTGCAGCCCCTGCGGGACGCCCCATTGTCCCCCCACTCTGCTGCCGCCCCACCAGGCACCAGGGGCTCTGTGCCCAGCCGGCTCCTTCGAGCTAGCAGAGGCATCGGCATGGCGGCTTCTGTGCTGCCCCCGCACAAACCCTACGCCGCCGTGGCTCCGGCGGTGAAGAAGAAACGGCCTCTCCGGGCCAAGAACAGGGTGCACCCCACTGTCAAGTAACAGGTGGCCTGCTGGGTATCGCGGGGAGCAGTGCCTCGGAGAGCCGGCAGCGCCTGGAAGTGGTTTGCATAGGGCGGGCTGTGCCTGCCCTGCAGACCTGGAGCCTCAGGAGCTGCCGCTTCTGATGGCTCCCGCCGCGGCGGCTGTGCCTGCCGGGGCGCACGGGGCTGCTGCCTGCACCGGGGTGGCACCGCTGCCATCCTCCACGGGCCTGACGTCCCCATCGGGTGTGCTGACCTCTCCGCTGGTGGTGCCCAGCACTGTGGGGGAGGCTGTGCAGGGCACGGTCAGTGTGCAGGAAATGCGTTAGCGTAGGGCAGTATTAAAAAGTTGTCTCTGAAATGGCTCCATCTGCAGACAGCCTGCACATGGTGACTGTCACAAGGACACTTTACTGGGGACTGGCACAGGGTGACCGGTACAAAGCTCACCTCCCTTCCCCACTGGCTGTGCCGGAGGGAAAGGGGGAGAGGAGAGCCCCAGGCCTTGAAGGTTTGAATTGAGTCTTGGATTTTTGTCGACCAGGCACACTGTGGAGGAAAGCTACAGCTTTCGAGAAGATATTTAACCCTTTTTTTTTTTTTTTAAAGCATAAATATATATAGATATAGATAAATGATATCTACACCCAGATCAGTTAATTTCCAGTATTGGCTACTTTTATCCTCCAGAAATTGGTACTATTATTTGTATTTAAAGAAATCCAATATTTAAGACCAATGACATTGGAAGCTGCAGCGAGCTGCCAGCCCTGCTGCCCGGCCAGGTCGGAGGGGATAACAAGCA
>XM_024348560.1 PREDICTED: Pan troglodytes SGT1 homolog, MIS12 kinetochore complex assembly cochaperone (SUGT1), transcript variant X4, mRNA 
AAAAAGTAATGTATTTCTGTATTTTGTACCTTCTGAATAGGGAAAAACTGAATACCTTGAGTAAAATTACATAGAAAATGTTAATGAGACAAGGAGGTGAATTTTGTGACACAGCTGTATTCATTGAAGAGCTTTAAGAAGGAAGCTAAATGTTAAGCCAAAAGGAAGTTGCTGTTGCTGATGCAAAGAAGTCTCTAGAACTCAATCCAAATAATTCCACTGCTATGCTGAGAAAAGGAATATGTGAATACCATGAAAAAAACTATGCTGCTGCCCTAGAAACTTTTACAGAAGGACAAAAATTAGATAGTGCAGATGCTAATTTCAGTGTCTGGATTAAAAGGTGTCAAGAAGCTCAGAATGGCTCAGAATCTGAGGTGTGGACTCATCAGTCAAAAATCAAGTATGACTGGTATCAAACAGAATCTCAAGTAGTCATTACACTTATGATCAAGAATGTTCAGAAGAATGATGTAAATGTGGAATTTTCAGAAAAAGAGTTGTCTGCTTTGGTTAAACTTCCTTCTGGAGAGGATTACAATTTGAAACTGGAACTTCTTCATCCTATAATACCAGAACAGAGCACGTTTAAAGTACTTTCAACAAAGATTGAAATTAAACTGAAAAAGCCAGAGGCTGTGAGATGGGAAAAGCTAGAGGGGCAAGGAGATGTGCCTACGCCAAAACAATTCGTAGCAGATGTAAAGAACCTATATCCATCATCATCTCCTTATACAAGAAATTGGGATAAATTGGTTGGTGAGATCAAAGAAGAAGAAAAGAATGAGAAGTTGGAGGGAGATGCAGCTTTAAACAGATTATTTCAGCAGATCTATTCAGATGGTTCTGATGAAGTGAAACGTGCCATGAACAAATCCTTTATGGAGTCGGGTGGTACAGTTTTGAGTACCAACTGGTCTGATGTAGGTAAAAGGAAAGTTGAAATCAATCCTCCTGATGATATGGAATGGAAAAAGTACTAAATAAATTAATTTGCTCTCATTGTATTGTGTATATTCACCTAATGCCCATTGTGTATTGATATTGCATTCTTGAATTTTGAACACTGAATATCTTTTTGAAAGATTATACTTCTTTACCTCTTTGTGCTTTAGAAATTATTTTCCTTCAAGTGTTCAAGTCTAATGAAGAATGAAGATAACATTTTATCACTTCTGTCCTTAAAGATTTCAGACATGGTGAAACTGAATAAAGCGTGTCATTTGCTCCTAGATAGATTCATTCTATCTAGTTGTGGGGATGGAGAAATCTTTAATGGTATATTTTTGGTTATTGCCTTATTTTTGATGCAGTATTCTGTCAGTAATTTATTAGACCTGGCAGCTTTGGGTGAGCTTAGATTTTTCACCTTCAGTGTTACATTGTGTTTGCTTTTAAAAACTGCTTTTGAATGGAGTTGTAAATACAATTTTTCTATGAA
>XM_028429604.1 PREDICTED: Parambassis ranga ventral anterior homeobox 2 (vax2), mRNA 
ATGTTTGATCAGGCCACGACTATGGGCGATGGGAGCCACCGCTGTGGACCCAACCCGCTGTGCCCGGACAGGATGGAGACAAAGTGTCGCGCCGAGATAGGGAGCCGGTCCCCGGTGCAGAGCTCCACCGACACCCCGGGGACATCAGCGTCCACGCCGACGTCCTCCAGCGAAGACGGGCATGACAAACTTTTGGGAGTGGACCCAGACTACTGTCGGAGGATATTAGTAAGAGACGCCAAAGGCACCATCCGAGAGATTGTCCTGCCGAAGGGCCTCGACCTGGACCGGCCCAAGCGCACCCGGACCTCCTTCACGGCGGAGCAGCTGTACCGGCTGGAGCTGGAGTTCCAGCGGTGCCAGTATGTGGTGGGGCGGGAGCGGACGGAGCTGGCCCGGCAGCTGAACCTGTCCGAAACACAGGTCAAGGTGTGGTTCCAAAACCGCCGGACCAAGCAGAAGAAAGACACCACCAAGGACTCAGACAAGCGCTCCTCTTCCACGTCCGAGTCTTTGGCCACCTGCAACATCCTGCGCCTCCTGGAGCAGGGCCGCCTCCTCTCGGGCTCCGCTCCACCTCCCAACCCCCTTCTAGGGCCCCCAGCTCACCCAGCAAATGGTTCGCTTTTGAGTAGCCCGGGCGGGGGCTCCTCCACCTCCCCTGGGATGAGCAGCAGCACTCCTCCCAGCTCTCTACCTGGAGGGACATTCGGGCTGTCGCTGCCCTCACTGGGCGGCACCCCGCCTTCGCCGCGGCTGGGCGTCCCGCCGCCGCACTCCCTCTGCTTCTCCATGCCACTGCTAGGTGGCGCTCATCACGAACTGACATCCGCCTACGGCTGCGGGTCCTCAGCTTTTGAGCCGTACATGCGGCTGGACAGGAAGGACGCAGATCTGGGAGGGAAGAAGACAGTTTCTTAA
>XM_039793275.1 PREDICTED: Perca fluviatilis Rho GTPase activating protein 1 (arhgap1), transcript variant X5, mRNA 
GGTGTCGACGCAGATTGTTGCTGTTGCTGTCAACCGCACGTCTTGCTAATCAAGTCTACGGCGACTTCAGACGCCACAAAGCCCACTGGGTGACTACAAAGCAACTTTGCAATTACGGACTCTGGCTGCTACTCTGTGAAAGTCCCAGCTTTAAGAGTGTGTGGTAAACATCACTGTGCAGTGTGTCAGTGGGTGTGTGTAGCACCGTTTTGCAGAGTGAGTGATGTCTTCAGAGCTGCTGGTAGATTTGGGTGAAGACCCTGCGACTGCACAGTTAGGACAGCTGAAGCTGACCACGGTAGATGACCAGCAGTGGCCCGCTGATGAGTCTACTCTCAGCAAGTCAGAGACAGATATCTCCCAGTGCTTTGACGCTGGCTCTCCACACCTGCCCTGGGACCATCCGTTCTATGACATCGCCAGGCATCAGATCATTGAAGTGGCGGGTGATGATAACTTTGGAAGGAAGGTGATAGTGTTTAATGCATGCAGGATGCCTCCACAGCACCAACTGGACCATCACAAGCTGCTGATGTATCTTAAAGGAACACTGGATCAGTATGTTGAAAGTGACTACACTCTGATCTATTTCCATCATGGGCTGACCAGTGAAAACAAACCCTCTCTCAGCTGGCTACGAGATGCATACAGAGAGTTTGACAGAAAGTATAAGAAGAACATCAAGGCTCTGTATATCGTCCATCCAACCATGTTCATCAAGACTCTGCTGATCCTCTTCAAACCAATCATCAGTTTTAAGTTTGGCAGGAAGATTAACTATGTGAGTTATCTGAGTGAGCTGGAAGATGTGGTGAAGTGTGAGCAGTTGCTAATTCCTGCCCGTGTCAAAGAGTATGACAACAAGTTAAGAGCTTCCGTTAAACCAACCGTCCAGCCTCCCATGTCTCCTCCTCACAGCCCCCCCCTCCACAGCCAGGTGTTTGGGGTGCCACTTGCATTGCTCAGGCAGAGGAATCCAGATGGTGATCCTGTTCCCGTGGTGATGAGAGATACCATTAGCTTCCTTTGCGAGCAAGGTTTGGAGATTGAAGGGATCTTCAGACGGTCTGCCAATGTGACTCTGGTGAAGGAGGTCCAGCTCAGATACAACTCAGGTGCAACGGTGAATTTCAGGGAGATGGAAGACGTCCACTTGGCTGCTGTGATTCTGAAGACATTCCTGAGGGAACTTCCAGAGCCTCTGCTGACCTACCAGCTCTACAACGACATTGTCAACTTCACTTTATCCAGTGAAAGGCAGGTGGCACTTATGAAGACACTGATAGAGTCGCTGCCAGAAGAAAACTATGCACCACTGCGACACCTCATCACATTCCTGGCAAAGGTATCAGCCAACAATGAAGTGAATAAGATGACCAACAGTAACCTGGCTGTGGTGTTTGGTCCTAACCTGCTCTGGGGACGGGACAACGCCATGTCACTCAGCGCCATTGGGCCAATCAACAACTTCACTAGAATCCTGCTGGACCACCAGCATCTGGTCTTTACCTAAACCCTGCCCCTTTACCCTGCAGTCTCTCTTCCAGTCGGAAACACCCTTTTCCATTAAAACACCATACACTTTAAAAGGATCCCGTGGACCAATTGCATTTAATTTTGTCTCCCACCAGTCTTTACATTCTGATTGGCACATATTGTTGATGACAACAGCAGTGTGGACTGCTACTAGCTTCTGGCCAGCATTTCCATTTGCATGTGACTCTAGTAAAATGGCACATACATTAGACTGCAGACAAATAACCCTCAATAAACAATGTAGGCAGAGAGATTTAACTTTAAAGTGCCAGTTATTCTTGAAAGTCGTGTATTTTTGCAGCTTTGCTTTTTGTCATTTTGATAAGTCAACAGAGCTGCCTCAGTATCCAGTTTTGCAACCAGTGAGTTGGAGGAAATCACAGAATTTGGGGACAGTTTTGTGAAATCAAAATCAGGGAGTGGATCTTCACAATTACTACTACATAACAAAAAACTAGATGATATGAGGTGAAGATCTGTGCCTGTGCAGGTTATTCCAACTTGCAGAAATAGTTAACTCCAGTGATTGTCCTTAAAAAAGTCTGCCGACTCACAGAAGTGAGAATGTAAAAAAAATATACAGAATCGAAGAAGGTGGAGATAACCTGAAATTCAGTCTAGCTCCAAAAACACTGGAACCTTCATTTCCCATAATGCAGCTTATTAGAGTATTTCATCAGACCCTAGCTGCCTGGTTAACTAAGTCTTGTAACGTAAGGCTTTCTGTTATAGATTTGTAGTCCAAACATTACTTTCTCACATTTGACACAGCTCCCCCAGACACAACTGTCAGACTGAATAATGAAGTGAAAGGAAATGGTAGATCAATGTCCTATAATAATAATGCTATAATAAACATAATCAGGGAGTGTATATTTAAGGACATAATTGCACTCAAGTACAATTGATTATGTTGGTTCCAGTGTGAATGCCACTGGCTGAAGTGCAGGCAACCTACAGTTATTTCACATAGTACATTTCATCACCCTATTACACCCAACAACCCTTCAAAAAATCCTGTCCTAATTGCATATATATATATATATATATACACACATACATGTGCTGTGCTGTTGTCAGACTGTCTCTCTGCTGTTTTTTTATGTAGTGACAAAAAAAATAATAAAACTGGCCTCCAGCATTCACATGAATTATCACCCTGCTCTGCATGGTAATACATGATCAGTAATAAGTACAGATAATGAAGCAGTGCAGTTACTGTACAAAACGTATAGGATTCTGATCCCAAACTTAAAGAGGAGCGATAGTGGCCCTGTTCAGACCTGGCATTATAAGTGAACAGCTCTGAGGTTGTTAACTTAGATCATGCGGCAAAAACTGCAGTTCATTTTGAATGGTGATAGTGTGATCACCCGATACGCAACTTAATGCCAGTTCAGAACAGGGCATAAGAGAATGAAGGTCGGATTTTCCATGTCCTTGAAAGTCTCAGGATCATTTACAGTAGTAGTAAACTTGGTACCAAATGTTGTTGACAATCTTTTAAATGCTGTAATTATAGTAACCAGTAGAAAAGGAGCTGTGTGATTCTACCAGCAGATGAGTAAGTGTTTAGAACCCAAAAACAGCTGTGCATGTAGATGAAATAAGTGCTGGTCTAATATACTCTGTAATATCA
>XM_035125527.1 PREDICTED: Zootoca vivipara cadherin 20 (CDH20), mRNA 
TCTACCTGTAACCTCAGCTGCAGCAGTAAGTGACAGGAGCTCAGAGGAAAGGCCAACATAGTGACATCAGTAAAAGAAAAAGGAAGGAAACTACTGTCCTTAATCTGGCTGGCTTCATATCACTGAAAGACTGCCCTTGGGAGTTTCAGAGGCCTTTCTGTTGGGTGTTTTAAAGGACCCGGCTACAACTTTTGGAAACAATCCTGGTATGGCAACGCGAACTTCGTGTGAAATGGATAGAGCCAGGAAGTGGCTCGGACTCAGTATATCTTTAAGTTGTTGCTTAATGATGAACCTCGTTACGGCTGTGTTATCTGGGAGCAGCAGACCACCCAGCAAAGGCCAAGAAGGCAGCCTCTCGGACAACTTGCTTCTGCATCTGCGAATGAAGAGGAGCTGGGTGTGGAACCAATTCTTCGTTTTGGAAGAATACACTGGAACGGATCCTTTGTATGTGGGAAAGTTGCATTCTGATATGGACAGAGGAGATGGATCCATCAGATATATACTGTCGGGAGAAGGAGCAGGCATTGTTTTTACCATTGATGATGCAACTGGAGATATCCATGCCATTCAGAGGCTGGACCGAGAAGAGAGATCCCAGTATACTCTAAGGGCTCAAGCTTTGGATAGACTGACTGGCAGGCCGATGGAGCCGGAATCTGAATTTATAATCAAAATCCAAGATATCAATGACAATGAGCCCAAGTTCCTGGATGGGCCATATGTTGCTTCGGTACCAGAAATGTCACCAATAGGTACCTCCGTTATCCAAGTGACAGCAACAGATGCTGATGATCCTACCTATGGGAACAGTGCCAGGGTAGTCTACAGCATTCTCCAAGGACAGCCATATTTCTCTGTGGACTCCAGAACAGGCTTGATTAGGACAGCGCTAATGAACATGGATAGAGAAGCAAAAGAATATTATGAAGTGATTATCCAGGCCAAAGATATGGGCGGACAGTTGGGAGGATTAGCTGGGACGACCACAGTCAATATCTCCCTGTCTGATGTCAATGACAACCCACCCAGATTTCCACAGAAACATTATCAGATGAGCGTTCTGGAGTCTGCTCCAGTTAGCTCTACTGTGGGCCGTGTCCTTGCTAAAGATTTGGATGAAGGCATTAATGCTGAAATGAAATACAGTTTTGTGGATGGGGATGGACTGGATGTTTTTGATATTGCCACCGAGTCTAATCGCCAAGTTGGTGTCATTACAGTGAGAAAGCCCTTGAACTTTGAGAGTAAGAAGAGCTACACTTTGAAGGTAGAGGGTGCCAATCCCCACTTAGAAATGCGCTTCCTGAACCTGGGCCCCTTCCGTGACACTGCTACTGTACACATCACCGTTGAGGATGTAGAAGAGCCCCCACTCTTTGAGCCTAGCTTTTATTTTGTGGAAGTCCCTGAAGATGTGGACATTGGGACCACCATACAAATGATTCATGCCAAGGACCCGGATGTGACCAACAACTCCATCAGGTATTCCATTGATCGAAGCAGTGATCCCGGACGCTTCTTTTATGTCGACATTGCAACAGGTGCTCTGATGACTGCAAGACCTCTGGATCGGGAGGACATTCCATGGCACAATATCACCATCCTGGCCGTGGAGCTGAACAACCCCTCGCAGGTTGGCAGTGTTTCTGTCACGATAAGAGTGCTGGATGTGAATGACAACGCTCCAGAATTCTCCAGATTCTACGAGGCTTTTGTATGTGAAAATGCCAAAGCTGGACAGCTGATTCAGACAGTGAGCGCGATTGACCAGGACGACCCACAAGAGGGACAGCACTTCTACTATAGCTTGGCTCCTGAGGCAGCTAACAACCCCAACTTTACTCTAAGGGACAATCAAGACAACACAGCTTGGATTTTAACCAGGAGATCAGGCTTCCGGCAGCATGAGCAGAATATATTTTACCTTCCTATCCTGATAGTTGATAATGGACGTCCCATGCTGAGTAGCACCGGGACAGTAACCATTCACGTTTGCAGCTGCGACGACAAGGGTCTTGTGATGTCCTGCAATGCAGAGGCCTATGTGCTCCCTGTCAGCCTGAGTAGAGGAGCTCTTATTGCCATTCTAGCCTGCATCTTTGTCTTGCTAGTGCTGGTACTGCTGATCTTGTCCATGAGAAGGCACAGGAAGCAGCCGTATATCATTGACGAAGACGAGAACATCCATGAGAACATCGTGCGGTACGACGACGAGGGAGGTGGGGAGGAAGACACAGAGGCCTTTGACATCGCAGCCCTGTGGAACCCGAGGGAGGCTCAAGTGGTGCTGAAGAGCAGGCAGGACATGATGCCGGAAATCGAAAGCCTCTCCAGATACGTTCCTCAAGCCTGCACGATGGACAGCAGTGTTCATAGTTATGTGTTGGCCAAGCTCTACGAAGCCGACATGGACCTCTGGGCACCTCCCTTTGACTCTCTCCAGACGTACATGTTTGAGGGCAACGGCTCCGTGGCAGAGTCGCTCAGTTCCTTGCAGTCTGCGTCTACGGACTCAGAGCAGAGCTACGACTATCTGACGGACTGGGGGCCTCGCTTCAAAAAGCTGGCCGAAATGTACGGTGCCACAGAAGGGAACGGGGCCCTTTGGTAACAAAGAGGCGAAGGCAGAGTACTACTCGGGTACTCGGCACAGCCATCCGAATTTGTACTCAATCAGATATTGAGGACACAGGCGAGGTGGCCTCCTACAAATAGCAATATGGTGCTTGAGGGAGAATGCAGAAGAGGAGTGGAAATAAATAAGAGCTCTCTCTGGATCAGCTTTACTCAGTTACATTAAGCTACATTTGTAAACG
>XR_003975245.1 PREDICTED: Gadus morhua 5S ribosomal RNA (LOC115538338), rRNA 
GCTTACGGCCATACCACCTTAGGCACGCCCGATCTCGTCTGATCTCGGAAGCTAAGCAGGGTTGGGGCTGGTTAGTACTTGGATGGGTGACCGCCTGGGAATACCAGGTGCTGTAAGCA
>XR_008382064.1 PREDICTED: Nycticebus coucang U6 spliceosomal RNA (LOC128592852), ncRNA 
GTGCTTGCTTCGGCAGCACATATACTAAAATTGGAATGATACAGAGAAGATTAGCATGGACCCTGTGCAAGGATGACACGCAAATTTGTGAAGCGTTCAGTATTTTT
>XM_035287433.1 PREDICTED: Callithrix jacchus URI1 prefoldin like chaperone (URI1), transcript variant X4, mRNA 
TCTTTATCAATGTGTCTGTCTCTTTACTGATGCCACTCTGTTTTGATTATGTAGCATTATAGTGTTCCTTAAACTTGGTGGTACAAATGCTCTAATTTGTTCTTTCCAAATTGTTTTGGCTGTTCTACCCCCTTTGCCTTTCCATTTTAGAAACCACTTGTTTATGTTTACAAAAACTCCTGGTGGGATTTTGATTGGAATTACGCTAAATCAATACATCAATTTGGGGAGAATTGACGTCTTAACTAATGTAAGAAAAACAATAGAGGATTTAAGAAAAGTGGTGAAAAATTTTGAATCAAGAGTTGAATTCACAGAAGATTTGCAGAAAATGAGTGATGCTGCAGGTGATATTGTTGATATAAGAGAAGAAATTAAATGTGACTTTGAATTTAAAGCAAAACACCGAGTTGCTCATAAACCACATTCCAAACCAAAAACTTCAGATATTTTTGAAGCAGGTATTGCAAATGATATGAAATCTAAGGATTTGCTTGCTGATAAAGAACTGTGGGCTCGTCTTGAAGAACTAGAGAGACAAGAAGAATTGCTGGGTGAACTTGATAGTAAACCTGATACTGTGACTGTAAATGGAGAAGATACGACATCTTCTGAAGAAGAAAAGGAAGATCACAACACAAATGTGAATGTGATGCATCAAGTAACAGACTCTCATACTCCGGACAGTTGTCATAAGCATGTGGCAAGTTCAGAACCATTTAGTGATCAGTTGAATAGTCAGTTGAACTGTTCAGTGAATGGTTCCAGTTCTTACCACAGTGATGATGATAATGATGACAATGATGACGATGATGATGACGACGACGATGGTGATGATGAGCATGAGGCTTTAGGAGTTGGATATAATTCTATACCAACAATATATTTTTCTCATACTGTTGAACCTAAGAGGGTCCGAATAAATACTGGAAAGAATACCACTTTAAAATTCAGTGAAAAGAAAGAAGAAGCCAAACGTAAACGAAAGAACAGCACTGGCAGCGGCCACTCTGCCCAGGAGCTGCCCACCATCCGGACACCTGCTGACATTTACAGAGCCTTTGTTGATGTTGTGAATGGAGAATACATCCCTCGCAAATCCATCCTGAAGTCTCGAAGTAGAGAGAACAGTGTGTGTAGTGACACCAGTGAAAGCAGCGCTGCTGAATTTGACGATAGGCGGGGCGTTCTGAGGAGTATCAGCTGCGAAGAAGCCACTTGCAGTGACACCAGTGAGAGCATTTTGGAAGAGGAACCACAGGAAAATCATCAAAAGAAACTTTTGCCCTTATCGGGAACACCTGAGGCTTTTTCTGGAACTGTTATAGAAAAAGAATTTGTATCACCTTCCTTAACACCACACCCAGCCATTGCTCATCCTGCGCTACCCACTATTCCAGAACGAAAGGAAGTTCTGTCGGAAGCCTCAGAAGAAACTGGAAAGAGGGTTTCAAAGTTTAAAGCTTCCAGATTGCAGCAGAGAAACTAGGCCCTGTGTAGGAAATGGGAATTTACATCTTAAAACCTAGTTGTTCATTTGTTTAGAATATCGATAGCAAAATAGGTTACGTGTAGTTTGACATAAGGTATCCCGAGTTACTTTGGCAACAAGTTCTTTTACCCTTACCAGCGGTATTTGAAAAAAATCACAGTAACTGTCTGAATACTTTAATATTCGCCTTGTTTTGTTAGTTCTCTGAATACTGTCAACACTTGTCTGAGTTTGCCTTTATGATGCAGTGGCAGCATTTTGAATTACTTTTCGAAGAATACTGTTCATACGCATTGTTTTTGTGTTTCAGACGAAATACAGGCAGTTTTGTGCCAGCTGTGATATTGTGCATACCATATGGACCCTTTTAAAGAAAATTTTTAAATTTCAAAGAGATTCAACAATTATATTACTTGCTTTTACATTTTAAAGGCACTTTAAAAAAGATCTACTTCGCCTGTAGGTTTTGCAGCTAGTGGGCTATTTAAGAAACCTCTCCCCTCTAAATGTCATACTGTAATCTATCAGAAAACTACATGAGTTAATTGTACTCTATGGAAAATTTCTTTGGAAAGATATTTTGTAAAACTTTTTTTTTTTTCCAAGTAAAAATTTTATGAAACTTGGTCTCAAAAATGTTGTGAACTTTATGATTCAAAATTAAGTCTAGATATGTCCTCGATTCATGATATATGCTACATGTATCACACAACAGATCTGCAATTCTTTCACTTCCCTGGACGCTTCTCCCTTAGTTTCTGCAGTTTCATTGGGGTTATGTTTTGGGAGACGAGGAAACGTCTAGATGCTTAAAAACGATTTTAAATAAAAATTCCTTACAGTTGAAA
>XM_003139612.1 Loa loa hypothetical protein partial mRNA 
ATGCGGTCTTCGACTGTTCCGTTATCAATAGTATTGGTGTGGTGCATCTACTACAAACTGAGTTGTGCAAAACAGTCAGAACTTGCGAATAATATGCAAATTTCTAATGTATTGAGTGAAAACGACGCTCAAAGCACCGAATTTGTTCGCACAGCTTGGAGCGCTGCAACTTATTCGAAACTCAGAATTTACAGAGAGTTTTTAATTATCTTCCTTGATAAAAAATCCATGAGGGTTCTGAGAACGAGTTGCTTCTTGCTGGAATTTTTCAAATTACATGTATGGAAACGTGCTTTCGGTAAAATCGCACTAGACATTACTTTTGGTCGAAATGCACAAATATCTATTTGGTTTGAAATGAAAATTTCTAAGCTTTCCAGTCTGCAATTAATTCTTAGAAAATTGCAAGAAGAATAA
>LC592336.1 Uncultured archaeon gene for 16S rRNA, partial sequence, clone: m5-3 
GCGAGAAACCTCCGCAATACACGAAAGTGTGACGGGGTTACCCAAAGTGTTCATTAGAACTGTGGTAGGTGAGTAATGTTCCCCACTAGAAAGGAGAGGGCAAGGCTGGTGCCAGCCGCCGCGGTAAAACCAGCTCTTCAAGTGGTCGGGATAATTATTGGGCTTAAAGTGTCCGTAGCCGGTTTAGTAAGTTCCTGGTAAAATCGGGTAGCTTAACTATCTATATGCTAGGAATACTACTATACTAGAGGGCGGGAGAGGTCTGAGGTACTACAGGGGTAGGG
>XR_004309533.1 PREDICTED: Coturnix japonica uncharacterized LOC116654348 (LOC116654348), ncRNA 
CTTGCTTTTTGCCTTTAGCCTTTCTATGAGTCAGGAGACAGCAGGCTGCTTGCAAGTATAGGCTGGGGCTGGTTTTTTCCCATTTATTTATTTATTTTCCTAGGAAGAATGAAGAGCAAATAATGAGGAGGAAGAATAGATGATGAACCCAAAGATGAGCACGAGTTCCTGGGCTGGTTCTGACCCATCTAAGGGGTCCTGACTCTTAGGATCCTTTGGGGTTGGAGCTCACACATCCTGCTGCTTGTTGATGGAGGAACGATGACCCCATGTGAGTACTGCAGTGCCATACAGCCCTATTTGGGTGCATGGAGAGGCCAATTCGGCTGCAGCAGCAGTGAGAAAGCTGCAAGGTGCTGAGCTCTCTCCTGCCCTGGAGCAGCCCAGGGGATGTGGGGGCAGTCAGTGGCTGTTTTGGGGCTGTGCTGGGTGTGTTTTGGGGCTGTGCTGGCTACAAGCCTCGCTTCTATCTGCAGGCCAGCAGGCAGCATGTGATGCTGTGATGCTCACCAGCTCCAGCCAAGGGGAAAAGCCCCTTCAGCACAGGAGCTGCTGGCAGGGTGCCTGGCTGCACCGTGCCTGGCACCAGCAGTTCGGTGCCCCTCAGTGCAAAGCCTCCATCTGCTCCCCATCCTTCCCCCCCACCATGGGATGGGACTGAAGGTGGCACAGCCCCTGAGCGCTGTGCCTGCCCAGTCCCAAAACGCAATGTCACCAGGGCTCTGGGACAACCCTGCCGTGTTTAAATCCTCTTCCTAGGGGCAGCCGGGGCTGCAGACCCCTCAGGACGGCTACAGAGGCAGCAGCGTATCGCACCTTCAGCCCTCGGGGCTGCGAGCAGTCGGGTTGGAGCTGGAGCTGGCGAGCTCTCAGCACCCTCTGCCGGCTCTGCTGCCCGGCCCCGGCCCCTCCTGCTTGGGATGGAGCCTCTGTGAGCTCTAAGCTGCTGCTCTGCTTTGCTCTGCTCCCATTCTACAGCCCTGAGCCCAATAGGGGCCGTCACCCTCTGCCCTCGCACTGAGTGCTTTGCGCCCTGGGTTGAGCTGATGACTGCAGTGCTTGTGCTGAGGGTACGGGAAGGGGCCCAGCAGCCTCTCGATGTGGCTTTTCTCTGCTGTGAATGATCCCAAATAGCATCTCTGTGCTGTAAGGCAGCCCTGGGCTGACAGCAGTCTGTGCTGATGTACACGTATGGGGTATTCATGGGGCGGAAAAAGGCTGCTGCTCAAACAAGCAAACATTGACTGTCTGGTTTCCCAGCGCTGCCCCCAGCAGCAGCTTTCACATACCCTGCAGACATTCCTGCTGCTGGGCTCCCATCACCGGGCAGGGAGGAACCCCCACACTGCCTGCAGCAGCCCCTCTGACCCAGGAAAGCAAAGGGAAACCAGTTGACGTCGGGATTCTTTTAATGCAACAGCTCTTAAAATGCAACCTTCAAATGATTTTTATAATGGTCAACAATGAGAAACATCTGAGCTTTTCTACCTATGCACCCCAAACCCTTTGGGTGGAGGACTCCCTTGGGCAAAAAGGGTGAGGACAGTGTTCACATGGAGGCCCCCAACAAATGGCAGCACAACCTGGACCTTCCTCTCTCACACTTTACACTCAGGCACAAACCTACAAAGGCATCCAGCCCATCAGCTCCCCTCTTGTAGCACTTCAGACAACAGCTTCAGGCTCCTGGTTCTCTCTGCAGGTTTGTGCCTTCATGCTACGTAAAGCGATTTGAGAATGAATATCTGACTGTTTTCTGCCTTGATAGGATGGTGGTGGAGGAAGCTGATTTCCCATCACCTTGCTTTGTATGATATAATGCTACTTTATGCCTTTGTTCTGCAGAGCAGCAGGTGTTACAGGCTGCCACAGCTCGCCAATTCAAGTAACGTGGGAAATTCTGCTCCAGCCTAAACATCTGTGTAAGAATATCCCCCCACCGCCCCCTCCGCATCGTGCAGTGTTTATATGCTGTAACAGGAGAGCAGGCAATACTTGCTGAAACACATTTAATACCTTCCAGTTGTTAGTCTCAGTTTCTGGTTCTGTGCAGTCAGCACACAGCCCTCGGGCTGCGCGTGCTGCAGAATAGCAATGCTGTTAGAGCTGTGAGTGCCTTTCTCCCATCTAAAATGCTCAGTGGTTTTCTTGTACCATTTACTGGCTCTGCCCTTCCAAGAGGGGAATGGTGAGACTACACACAACGTCCTGTTGGAGGAAGGTGATGCTGTGTCTGCTTTCATCAATGCTGTGAAGAGAAACAGCAGAAAGAACCACGAGGGTCTCCTGAATCTCAGTGCTGTGTGATGCTTTCCTCCCCTTCGTGTCAAGCCTGTATTTTACTACTACCAACTACAGAAAGCTACTTTGGTCTACAGAAATGCTATGCACTTATCTCCAAGTGAATTCTAACCAACCCTTCTTAAGGACAGCAGTTAACAGTAAGTCAGTGGGTTCTTTTGCCTTAGTCTCCAATACGAGTTATAAAACCTGGATTCAGGTTTGGACAGACTGGAGCTCTTTTAGAGTCTGAGCAGCAGCTCTTGCACAACCAAAGGTCACAATTAGAAACTGAGTGTAGAAAGAGTTCCCAGGGGG
>XM_006448447.2 PREDICTED: Citrus clementina protease Do-like 10, mitochondrial (LOC18050602), transcript variant X1, mRNA 
TCATCAAAAGATTCAAAACCTAACAAAAGCGTTTTCCTTCTGATATTTTTGCCTGCAGCTTTGGATTAAGGCAAAAACCCAAAGCCGAAGGCAAAAAGAAGAAATGCAAATGCTGCTGGGTCCGTCACTGCGTAGTCTACGAAGGCAGCTATGGTCCTCTTCATCCTCTATTTTCTCCAATTACAGTAGTATTAATAGCAGTGGCTTATTAGAAACCTTCTCCAATACATTAAGATTAATTATTTTGCCTTCTACCTCTTCACTCTCCACTATTAGTACTAAAAATTGTAATTTTCACTATTTTTCAACATCAGCAGCAGTAGCTGCTAATTTGAGTACCAAGGAAATTGTTTCTAAAGTTACGCGACGGCGACAACGACGTCGTTTAGCTAAAACCTGCGGAAAGACTACTAATGCTTACGCAGCAATAGAGCTTGCTTTGGATTCTGTTGTGAAAATATTCACAGTTTCAAGCAGCCCTAACTATGGACTTCCCTGGCAGAACAAGTCCCAACGAGAAACCACCGGTTCAGGATTCATTATCCCTGGAAAAAAGATTCTTACAAATGCTCATGTGGTGGCTGATAGTACATTTGTGCTTGTAAGAAAGCATGGTTCTCCAACCAAATACAGAGCCCAAGTTGAAGCTGTGGGTCATGAATGTGACTTGGCTATTCTGATTGTCGAGAGTGATGAATTTTGGGAGGGAATGCATTTCTTAGAGTTAGGAGACATTCCGTTTCTTCAACAAGCTGTCGCTGTTGTTGGATATCCTCAAGGTGGAGACAACATTTCCGTTACGAAAGGTGTTGTTTCGAGGGTTGAACCTACACAATACGTACACGGTGCTACTCAGCTCATGGCAATACAGATTGATGCTGCTATTAATCCTGGCAACAGTGGTGGTCCAGCCATCATGGGCAATAAGGTTGCAGGTGTAGCTTTTCAGAATCTTTCCGGTGCTGAAAATATAGGTTACATTATCCCTGTTCCTGTAATAAAGCATTTTATAACTGGTGTGGTGGAACATGGAAAATATGTTGGATTTTGCTCGCTGGGACTATCATGCCAGACCACTGAGAATGTTCAACTTCGTAACAACTTTGGAATGCGGTCTGAAGTGACTGGGGTACTTGTGAACAAAATTAATCCTCTGTCAGATGCTCACGAAATATTGAAAAAGGATGATATTATTCTTGCATTTGATGGTGTGCCTATAGCAAATGATGGAACAGTTGCTTTTCGTAACAGAGAACGTATAACATTTGATCACTTGGTGTCTATGAAGAAACCCAACGAGAAGTCTTTGGTTAGAGTTTTGAGGGATGGCAAGGAGCATGAATTCAGTATTACACTACGACCTCTGCAATCACTAGTTCCCGTACATCAATTCGATAAGCTTCCTAGCTATTACATATTTGCTGGCCTGGTGTTTACTCCACTTACACAGCCATATCTTCATGAATATGGAGAAGACTGGTATAATACTTCGCCACGTCGTTTGTGCGAACGTGCATTAAGGGAGCTGCCTAAAAAGGCTGGTGAACAACTCGTTATCCTTTCGCAGGTGCTGATGGATGATATAAATGCCGGGTACGAGCGTTTTGCAGACCTACAGGTTAAGAAGGTCAATGGGGTGGAAATTGAAAATTTGAAGCATTTATGTCAGCTAGTGGAAAACTGTAGCACTGAGAACTTGAGGTTTGATTTAGATGATGATAGGGTTGTTGTATTGAACTATGATGTGGCAAAAATTGCCACATCTAAAATTTTGAAGCGTCACAGAATACCTTCTGCTCTGTCCGGTGATCTTAACGGTGAACAGATCTCCGAAATTGAGTTAGCTTCCAGACATAAAGAATGGTCACAAAGTTGAGGGCCCTGAGCCGGCTAATATTAAAATTTTGGTTTCCTAATCCACTTAGCTGCTTTTATTATTTGTCATTTATAATCGGATGTTGAGGTGCAAACACATTTTTGGCCTTTGTGTATTGTAAGCGATTCAGAGTATTAAAACCAAAAAGCGTTCTGTTGTTTGGTAAA
>XM_037730203.1 PREDICTED: Cebus imitator glycosylphosphatidylinositol specific phospholipase D1 (GPLD1), transcript variant X3, mRNA 
GAGACTTGGTTTCCTGGGTCAGTGACCTGCTTAGAGGGAAGCAGCGGGTCTGCGCCTGGATTTCGGAGTCACGGTGCTGCTGCAGCTCTGAGCATTCCCACGTCGCCAGAGAGCCCGTGGGGAAGGAGAGCATGTCTGCTTTCAGGTTGTGGCCGGGCCTGCTGATCGTGCTGGGTTCTCTCTGCCGTAGAGGTTCATCCTGTGGCATTTCAACGCACGTAGAAATAGGACACAGAGCGCTGGAGTTTCTTCAGCTTCATAAAGGGCGTGTTAACTACAAAGAGCTGTTGCTAGAACACCAGGATGCATATCAGGCTGGAACCGTGTTTCCTGACTGCTTTTACCCTGGCATCTGCAAAGGAGGAAAATTCCATGATGTGTCTGAGAGTACTCACTGGACTCCGTTTCTTAATGCAAGCATTCATTACATCCGAGAGAACTATCCTCTTCCCTGGGAGAAGGACACAGAGAAATTGGTAGCTTTCTTGTTTGGAATTACCTCTCACATGGTGGCAGATGTCAGCTGGCATAGCCTGGGCATTGAACAAGGATTCCTTAGGACCATGGGAGCTATTGATTTTCACGGCTCCTATTCTGAGGCTCACTCGGCTGGTGATTTTGGAGGAGATGTGTTGAGCCAGTTTGAATTTAATTTTAATTACCTTGCACGACGCTGGTATGTGCCAGTCAAAGACTTACTGGGAATTTATGAGAAACTCTATGGTCAGAAAGTCATCACCGAACGTGTAATTGTTGACTGTTCACATATCCAGTTCTTAGAAATGTACGGTGAGATGCTAGCTGTTTCCAAGCTGTATCCCAGTTACTCTACAAAGTCCCCGTTTTTGGTGGAACAATTCCAAGAGTATTTTCTTGGAGGACTGGATGATATGGCGTTTTGGTCCACGAATATTTACAATCTAACAAGCTTCATGTTGGAGAATGGGACCAGTGACTGCAGTCTACCTGAGAACCCTCTATTCATTGCATGTGGCGGCCAGCAAAACCACACCCAAGGCTCGAAAATGCAGAAAAATGATTTTCACAGGAATTTCACTACATCCCTAACTAAGAATACTGAGAGGAATATAAACTATACTGAAAGAGGAGTGTTCTTTAGTGTAGATTCCTGGACCCCGGATTCTGTGTCCTTTATGTACAAGGCGTTGGAAAGGAACATCAGGACCATGTTCGCAGGTGACTCTGAGCTGTCACAGAAGCACGTCTCCAGCCCCTTGGCCTCTTACTACTTGTCGCTTCCTTATGCAAGGCTTGGCTGGGCAATGACCTCAGCTGACCTCAACCAGGATGGGCATGGCGACCTCGTGGTGGGCGCACCAGGGTACAGCCGCCCCGGCCACGTCCATGTCGGGCGCGTGTACCTCCTCTACGGCAGTGGCCTGGGCCTGCCCCCCATCGACCTGGACCTGGACCAGGAGGCGCACGGGATCCTTGAAGGCTTCCAGCCCTCAGGTCGGTTTGGCTCGGCCTTGGCGGTGTTGGACTTTAACCAAGATGGCGTGCCTGACCTGGCTGTGGGCGCTCCCTCCGTGGGCTCCAACCAGCTCACCTACAAAGGTGCCGTGTATGTCTACTTTGGTTCCAAGCAAGGAAGAATGTCTTCTGCCCCTAACATCACCATCTCTTGCCAGGACGTCTACTGTAACTTGGGCTGGACTCTGCTGGCTGCAGATGTGAATGGAGACAGTGAGCCTGATCTGGTGATTGGCTCCCCCTTTGCCCCAGGCAGAGGGAAGCAGAAGGGAATGGTGGCTGCGTTTTATTCCGGCCCCAGCCACAGCGACACAGAAAAACTGAACGTGGAGGCGGCCAACTGGACGGTAAGAGGCGAGGAAGACTTTGCCTGGTTGGGATACTCCCTTCACAGCGTCACCGTGGACAACAGAACCTTGCTGCTGGTGGGGAGCCCCACCTGGAGGAATGCCAGCAGGCTGGGCCATTTGTTACGCATCCGAGATGAGAAAAAGAGCCTTGGGAGGGTGTATGGCTACTTCCCACCAAACAGCGAGAGCTCGTTTACCATTTCTGGAGACAAGGCAATGGGGAAACTGGGTACTTCCCTGTCCAGTGGCCGTGTGCTGATGAACGGGACTCTGACGCAGGTGCTGCTGGTTGGGGCCCCAACACACGATGACGTGTCTAAGATGGCATTCCTGACCATGACCCTGCACCAGGGCGGAGCCACTCGGATGTATGCGCTCACACCCGCTGCACAGCCCCCGCTGCTCAGCACCTTCAGTGGAGACCGCCGCTTCTCTCGATTTGGTGGCGTTCTGCACTTGAGCGACCTGGATAACGATGGCTTAGATGAAATCATCATGGCAGCCCCCCTGAGGATAGCAGATGTAACCTCTGGACTGCTTGGGGGAGAAGATGGCCGAGTTTATGTATATAATGGCAAAGAGACCACCCTTGGTGACGTGACAGGCAAATGCAAATCATGGATAACTCCATGTCCAGAAGAAAAGGCCCAATATGTATTGATTTCTCCCGAAAACCAAGTCGTCATTGCTGCTGGAAGGAGTTCTTTGGGAGCCCGACTCTCTGGGGCACTTCATGTCTACAGCCTTGGCTCAGATTGAAGATTTCCCTGCACCTCTCCACTCTGCCCCCTTCTCTCAAGCTGAATCACATCCATGGTGAGCATTTTGGTGGACAGAGTGGCATATCCAGTGGAGCTATGGTAGATCCT
>XM_003291721.1 Dictyostelium purpureum hypothetical protein, mRNA 
ATGAATGAGCTATTATCATCTCTAATTAACTTTAGTGTAAAAGAAGAATTAAAAAACAGTAGTAATATTAGTGATAGATTATTATATATAGTTTGGAATAATATATTTTTAAGAAATGAAATTCATAAACATATTTTAAAGTTTATTGAATATAGTGTTGTAGATTTTGAAATATCACAATATGACCAGTTTAAAGATAAATCATATATAACAACACTTAATTGGTTTGGTGATACACTACCTGATAAAAATGAATTTCCACCATTTTTGACAAGTTTATATTTGCCCCATTTTTCTGAAAAGTTAACTCCAACAACTTTACCAAATACAATAACTACACTCACGCTCGGTCATTATTTTAACCAAGTAGTTCTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTGATGATTTTAACCAAGTAATTCTACCTGACACATTACCAAATAGTCTCACAACACTCACATTCGGTTATAATTTTAACCAAGTAATTCTACCTGACACATTACCAAATAGTCTCACAACACTCACATTTGGTTATAATTTTAACCAAGTAGTTCCACCTGGTACATTACCAAATAGTCTCACAACAATCACATTCGGTCATTTTTTTAACCATATAGTTCCACCTGGCACATTACCAAATAGTCTCACAACACTCACATTCCGTAGTAAATTTAACCAAGTAGTTTTACCCGGCACATTACCAAATAGTCTCACACAACTCACATTCGGTTATTATTTTGACCAAGTAGTTCTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTCATCGTTTTGACCAAGTAGTTCTACCCGGCACATTACCAAATAATCTCACAACACTCACATTCGATAAAGCTTTTAACCAAGTAGTTCCACCTGGCACATTACCAAATAGTCTCACAACACTCACATTCAGTTATTTTTTTAGACAAGTAGTTTTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTCATCATTTTAACCAAGTAGTTCTTCCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTAATTGTTTTGACCAAGTAGTTCTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGATCATCATTTTAACCAAGTAGTTCCACCTGGCGCATTACCAAATAGTCTCACAACACTCACATTCGGTTTTTTTTTTAACCAAGTAGTTTTACCCGGCACATTACCAAATCGTCTCACAACACTCACATTCGGTGGTAAATTTAACCAAGTAGTTCTACCCGACACATTACCAAATAGTCTCACAACACTCAGATTCGGTTATGAATTTAACCAAGTAGTTCCACCCGACACATTTCCAAATAGTCTCACAACACTCACATTCGGTCATCGTTTTAACCAAGTAGTTCTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTTATGATTTTAACCAAGTAGTTCTACCCGGCACATTTCCAAATAGTCTCACAACACTCACATTCGGTAATGATTTTAACCAAGTAGTTTTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTTATGATTTTAACCAAGTAGTTCCACCTGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTCATCGTTTTAACCAAGTAGTTCTACCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTGATGATTTTAACCAAGTAATTCTACCTGACACATTACCAAATAGTCTCACAACACTCACATTCGATAATGAATTTAACCAAGTAGTTCTTCCCGGCACATTACCAAATAGTCTCACAACACTCACATTCGGTTATTGTTTTAACCAAGTAGTTTTACCCGGCACATTACCAAATAATCTCACAACACTCACATTCGGAACTAAATTTAACCAAGTAGTTCCACCGGGCTCATTACCAAATAGTCTCACAACACTCACATTCGGTCGTGATTTTAACCAAGTAATTCTACCTGGTACATTACCAAATAATCTCACATCAAAACTCTCAAAGATTGTTTAA
>HQ115669.1 Trichoderma koningiopsis isolate NG_05 18S ribosomal RNA gene, partial sequence; internal transcribed spacer 1, 5.8S ribosomal RNA gene, and internal transcribed spacer 2, complete sequence; and 28S ribosomal RNA gene, partial sequence 
AGGGATCATTACCGAGTTTACAACTCCCAAACCCAATGTGAACCATACCAAACTGTTGCCTCGGCGGGGTCACGCCCCGGGTGCGTCGCAGCCCCGGAACCAGGCGCCCGCCGGAGGGACCAACCAAACTCTTTCTGTAGTCCCCTCGCGGACGTTATTTCTTACAGCTCTGAGCAAAAATTCAAAATGAATCAAAACTTTCAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTCTGAACGCACATTGCGCCCGCCAGTATTCTGGCGGGCATGCCTGTCCGAGCGTCATTTCAACCCTCGAACCCCTCCGGGGGGTCGGCGTTGGGGATCGGGAACCCCTAAGACGGGATCCCGGCCCCGAAATACAGTGGCGGTCTCGCCGCAGCCTCTCCTGCGCAGTAGTTTGCACAACTCGCACCGGGAGCGCGGCGCGTCCACGTCCGTAAAACACCCAACTTCTGAAATGTTGACCTCGGATCAGGTAGGAATACCCGCTGAACTTAA
>XM_026575105.1 PREDICTED: Papaver somniferum aspartic proteinase CDR1-like (LOC113328005), mRNA 
ATGAGTCGGAAAAATGTTGTTTCTTCTTCCATCAATTTTGTAACAGCAGTTGTTTATGTTTCATTTCTACTAAACTTGGCCACTGCAGTTAAACCAAGAGGGTTTAGCATGAAGATGATTCGCAGCGACTCTAAAAAATCACCTATGCATCTAAGGTATGCTAATTTAACTCAAGAAGAAAGATTTCAAAGACTCGTCGAACAATCCAAAGCTCGAGCGCGTTACTTTGCATCCGCAAGAGCTGCTGCTTATAATAGAAGCATCTCCATGAATCCCGATATTGCACGTATACGTCTAAAATACATGGAGAACAGACACTATTACATCGGTGAGGTAGGTATAGACGGGCTCTGTACGTACAAAGAAGGATACATTTCCGGACCAAAAATATCTGGTCATCTTGCTTATGAAACACTCACTATGAAGTCAAACACCGGTGCCCTTGGAAGTGTTGAAAAAATAGTCATGGGCTGCGGTATTGATCAAAGGAATTTCGGACCATTATTTGGTGTTCCTGAGATTCGTGAAGGCATTGCGGATTCACACACGTATTTAAGATTTGGTTTCGACACAATAATTGAAGAAGGACCTCCTAATGAAATACTTACAACTCCAATAATTCAAGACCCGAACTTCGGGACGCCTTACCATTTGATTCTTAAGGATATCAGTATAGGTAACAGAAGCGTAGGGTTTCAACAAAGTGATTTCGAGCTAAAGCCGGATGGAACTGGTGGGACTATCATAGATTCAGGGGCTCCATTTACCACCATGAGGATGCGCCATTTTGAAAGAGTTGAGCAAGTGCTGGTAGAATATTTTACAGATTCTGGTATTCGTCCTGCTGATCCTGAACCTGGCAGAGATTTCGATACTTGTTTTGATATACCGGTCGATTTCACTGCGTTTCCGGTGATGACATTTCATTTTCAGGATGCGGATTTTGTTATTCAACACTGGTCTGCCTATTACATACAAGAGCGCTTGCTATGTTTTGGTATCATTGGCTTGAATGACGACGATCCAAATGATGTTACTCTTGGAGCTATGCAACAAGCTAATAAAAGGATTTTACACGATCTTCATGCCAAGGTACTCAAGTTTACTGATGAGAGATGCGATGATGATGGTTCGTGA
>XM_050131643.1 PREDICTED: Microtus fortis GEM interacting protein (LOC126494357), transcript variant X3, mRNA 
ACCGCTCCTTAGCTCTTAACCCAGGGAAGTCCCACTTACTCCTGAGCTACCTGACAGCCGGGGAAGAAATCCTGGCAAGGGAAGGACAGGAAAGGTCTGTGCACCTTGGAGACTCCTGAAGCGCACAGGGCGCACGACTCCTGCCCCAACCCTCCGATTGCCCTGCAGAGCCGGCACCCCGGATGCCTGGGGGGAAGGGGCCCAGGAACGGGAAGTGGCCGCTTCTGCTTATTATACTATGGATGGGGGCAGGGTGTCAGGGCCAGGATCCCTGCAGGGCACCCCGGGCGGGGGTGGGGGCATAAAGCTAGAAAGTGGCGGCAGCAGAATTGTGACTAGGTCTAGGTTATGTTTCCAGCTGTCTTTGTGTGTGTGTGTGTCATTCAGTCCGGTTCCTCATGGTTTCAGCTGTACTCGCGTGTGTTTATGCCGCAGGCTAAGTGCCTGTGCGTCCCACGTGCGGTCCCATCTGTCTGCCCTGGGGTCCATGTGGCTCCATTGTCAAGCCAGGCCTCTACTCCATCACTCATGTGGCAGCTGCATCTGTATTCTTGCTTTGCCTATGGGTCCCTGCCTGTGTGGGTGTCTCTGTGACTGTGAGCAACCGCTTCTCTGATTTTGCCGGGGCCCATCTGTCTGGTCTGAAACAACCCCTCTGAAGCTCACTGTCCCGTCCCACACTAGTCTTAGATCAAAACTCACTTAGGTCTCTGTTTCTATCTCGCTTTCTCCCTCTTCCTTCCATCTCTGCTTGAGAGTGGTTGAGGTGCTTTGCTGCCTCCAAGGGTAGAGGGAGGGAGACAGTGAGTGGTTGGTTCATGTTTTCTTGCACTTCTCTCCCCCCAGAGCTGACCCCAGCTCCTGAGGGCAGGAAGAGGTACAGTGACATCTTCCAGAGCCTGGACAACCTGGAGATATCGTTGGGGAACGTGGCTTTCGACCCCTTGGCTGGAGACCTTGTACTCAGACAGGACCTGGAGCCTGACAAGACTGCCACAGCCGCGGTGAGCAGTGAAGCCAGATGGAGTGATCCCTCCCCAGAGGGTCCCGTACCCCTCACAGAGGAAGAACTAGATTTGCGACTCACTCGGACGAACGGTGGTGTGGATGCTGCCCTGGAGTATGCCAAGGCATGGAGCCGCTATGCCAAGGAGTTGCTGGCCTGGACAGACAAGAGGGCCAACTACGAGCTGGAGTTTGCTAAGAGTGTCATGAAGATCGCTGAGGCCGGCAAGGTGTCCATTCTCCAGCAGAGCCAAATGCCACTCCAGTACATCTACACCTTGTTTCTGGAGCATGACCTCAGCCTGGGAGCCCTGGCCGTGGAAACGCTGGCCCAGCAGAAGAGAGACTACTACCAGCCTTTAGCAGCCAAAAGGATGGAGATTGAGAAGTGGAGAAAGGAATTCAAGGAGCAGTGGCTGAAGGAGCAGAAACGCATGAATGAGGCGGTGCAGGCACTACGGCGCACCCGGCTCCAGTACATTCAACGCAGAGAGGACCTTTGGGCACGTTCCCAGGGGTCCCCTGAGGATCCTCCTCCCCAGGCATCTCCCGGATCCAGCAAGCAGCAGGAGCGCAGACGACGCTCCCGAGAGGAGGCACAGGCCAAGGCACAGGAGGCAGAGGCTTTGTACCAGGCCTGCATCCGAGAGGCCAATACGCGTCAGCAGGATCTGGAAACCACCAAGCGGCGGATAGTGTCACATGTACGCAAACTGGTGTTGCAAGGAGACGAAGTACTTAGGCGGGTGACGCTGGGCCTGTTTGAGCTGCGAGGGGCACAGGCAGAGAGAGGACCTCGAGCCTTCTCAGCTCTGGCTGAGTGCTGTGCGCCCTTTGAGCCTGGCCAGCGCTACCAGGAGTTTGTGCGGGCACTGCAGCCTGAGGCCCCGCCACCGCCGTCTCCCGCCTTCTGCTTCCAGGAGTTCACGCCTGTGCTACACAGTTCCCCTCAGGACACAAAAAAGAAGTTTTTGGGGCCTCCACATGCCAGGCTGGAGGAGGGTTACTCTGAGCCTGGCCCTTGGGAGGATACCAGCTCAGGCAGCCAGGGCCCCACTCCAGTCAGTGATGTGGACAGTGTAGGTGGTGGCAATGAATCCCAGTCCCTGGATTCCCCTACTTCCAGCCCAGGTGCTGCTACTCGGCGGCTTGTGAAGGTGTCGTCTATAAGCACTGAGTCCTCTGATGACTTTGAGGAACGAGACCCTGATCTGGGGGATGGGATGGAGAATGGACTAGGCAGCCCCTTCAGGAAGTGGACACTGTCCACAGCTGCTCAGACCCACCGGCTACGGCGGCTGCGTGGTCCAGCCAAGTGCAGAGAATGTGAAGCCTTCATGGTCAGCGGGACAGAGTGTGAAGAGTGCTTTTTGACCTGTCACAAGCGCTGTCTGGAGACCCTCCTCATCCTTTGTGGACACCGACGGCTTCCAGCCCGGATGCCTCTCTTTGGAGTTGACTTCCTACAACTCCCCAGAGACTTCCCTGAGGAGGTGCCCTTTGTGGTTACCCGGTGCACAGCTGAGATAGAACATCGCGCCCTGGGCCTGCAGGGTATCTATCGGGTCAGTGGGTCTCGAGTGCGTGTGGAACGACTGTGCCAGGCCTTTGAGAATGGCCGAGTGCTGGTTGAACTGTCGGGAAACTCTCCTCATGATATCACCAGTGTCCTCAAGCGATTTCTTCAAGAGCTCACTGATCCCGTGGTCCCCTTCCACCTCTACGACGCCTTCATCTCTCTGGCAAAGACCCTGCATGCAGACCCCGGGGACGACCCTGGAACCCCCAGCCCCAGCCCTGAGATTATCCGCTCGCTGAGGACCCTCTTGGTGCAGCTGCCTCCCTCTAACTACAGCACTGTGCGGCACCTGGTAGCCCATCTGTTCAGGGTGGCTGCTCGTTTTGAAGAAAACAAGATGTCTGCCAACAACTTGGGAATTGTATTTGGGCCTACGCTGCTGCGGCCACCAGATGGACCCAGGGCCCCCGGAGTCAGCCCTGTGGCCTGTCTGCTGGACTCTAGTCACCAGGCTCAGCTTGTTGAATTCCTCATTGTGCACTATGAGCAGATCTTTGGAATGGATGAGCTCCCTCTGGCCTCTGAGCCCCTGACCCAAGATCCTGGCCTGGCTCCCACACTCCTCGAATCCAGTCCTCAGCACCCAGCCCCACTTCTTGCCCAAGACATACAACCCCTGACCATAGCCTCAGACTGCAGCCCAGATCCCAAACTCCACAGTGCCCCGGAGAAGTGTCTGGAGGTCACACCTTCTGAGGTAATTGCAACTCTGCAGAGGGACCAAAGGGAGGAGAAGGAGGTGGAAAACACCAGAGATGGGGCAGGGGAAGGGTCCGGCCACAACCCTGAGGACTTGCTCCTGGGAACACAATCCCGGGGCCACTTCAGTCGCCAGCCAGTGAAGTATTCACGGGGAGGTGTACGGCCAGTCACTCATCAACTGTCCAGCTTGGCTCTGGTAGCTTCCAAACTGTGTGAGGAGACTCCTGTTACTGTTTCAACAGTGCACCGAGGTAGTTTGAGGGGACGAAGCCTGGGCCCTGCTGCTGCCTCCCCTGAAGGCAGTCCCCTGCGCCGAAACCCTCTGCCCAAGCACTTTGAGATCACCCAGGAGACAGCCCGGCTACTCTCCAAGCTGGACACTGAGGCTATGTCCAGTGCTACCTGCTGTGCTGACACTGAGCCTGAGGGGTCTGAGGAACATCTCTGACCACCCACCATCCCAGGAGACTCAGGACTGAGCTGATGACCCCATATGTCTCTCTTCTTGCCCCACCTGGTAACCAGACCAATTTAGTGGGGTGTGGGGAGAGACAGGTTACCAGAGAGTTGGGTAAGGAAGACCACCCATCTTGGGAAGTCCTCACCATCTCCCTGCCAGAGGAGGTTAAAACGGCCAGACAACACAGGTGCACAGGCAAATCAGGATCAATGACTCAGTTGAATCAGTATTCAATGGTCAGTACAGGTCCGAAGATCCTTGGGTTACCCCAGTCACAGCTGTCTGACTACTCTGATCATAAGAGCTCCTGGTTCTACCTGAGTAGGTGGGTGTGGTTTAGCCCTCACCTGCTTTTATATCTTCCTGGGTTTGGTTTGTTTGTTTGTTTGTTTTGAGATGGGCTCTATTGTAGCTCTGGCTGATCTGGAACTCCCTATGTAAACCAGGTTGTCATAGAACTCACAGAAATTCCCTCCTTTTAAGTGCTGGCCAAATCTGGATTCTTATAACCTCTGAATAAAGCCATGTCCTGATTGAATACAA
>MH278833.1 Uncultured bacterium clone DEN-OTU-710745 16S ribosomal RNA gene, partial sequence 
ACGGAGGATCCAAGCGTTATCCGGAATCATTGGGTTTAAAGGGTCCGTAGGCGGTCTTATAAGTCAGTGGTGAAATCTCCCCGCTCAACGGGGAAACGGCCATTGATACTGTAGGACTTGAATTATTAGGAAGTAACTAGAATATGTAGTGTAGCGGTGAAATGCTTAGAGATTACATGGAATACCAATTGCGAAGGCAGGTTACTACTAATGGATTGACGCTGATGGACGAAAGCGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGATACTAGCTGTTGGGCGCAAGTTCAGTGGCTAAGCGAAAGTGATAAGTATCCCACCTGGGGAGTACGTTCGCAAGAATG
>XM_020557668.1 PREDICTED: Prunus persica putative disease resistance protein RGA3 (LOC18785927), transcript variant X4, mRNA 
TCTCTTCAATTATTATATCTTTTTACGCCAGCCATATGCGCACCTTCTTGTCTACAAATCCCTCACAACCTTCTCAAAGATACATTGCGTCCTCAATTTTGCTCTACTTTTCTAACCCAAACTAAGCATTCTGCTCTCTGTCTTGAGCAACACTGAAAGAAAATATGGCTGCAGAGTTTCTTACTTTTGGTGCTGAGGGAATTCTGACGAGGGTGGCTTCACTTGCAGAGCAAGAACTCAGTCTTCTCTGGGGATTCAAAGGAGAGCTAACAACTCTACGAGACTCATTATTCAAGTTGGAAGCTATGCTCAGAGATGCACAACATTTACAAGTTCGGGGTGAGAGGGTGGAGATGTGGGTGAAGGATCTGGAAGGCATAGCTCATGAAGCAGATGATGTGTTGGATGAATATGAATATGAACTTCTCCGGCGGAAAGTGGAGATCCAAAATCAGATCAAGAACAAGGTGCTCAACTTCTTTTCACGCCACAATCCCATTGCATTTCGTCGCAAAATGGCACATAAAATTAAAAACATCAATGCATCTTTGGCAAACCTGAAGAATGAGGCAGCTAGTATTGGACTGGTTGATAGGTCAACACTGGTCAATGCAACATCTCATGATATTGGAGGACTTGACAGGGAAACCGTCTCAAACTTTGATCAAGATGAAAAGTACATTGTTGGAAGGAAGGAGGTTGCGTCGGACATAGTTACAACCCTGATCAACTCTGGCAAGAACCAAGACAATTGTCTTTCTGTTATGGCCATTGTGGCGATGGGAGGCTTGGGCAAGACAACTTTGGCTAAATCTGTATATAATGATCCTGAGATAGGTAGACACTTCGATCAAAAAATATGGGTATGTGTATCTACTCCTTTTGAAGTCAAAAAGATTTTAAGCGAGATCTTGGAATGTCTTAAACCAGAGAAAGCTGGGATAAAGGGTAAAGCAACAATATGTGAAAACCTGCAAGAAGATTTGAAAGGGAAGACATATCTTCTCGTGCTTGACGATGTTTGGAACGACGATCGTAGCAAATGGGACGATTTGATGAGTTGCTTGTTGAATGCTACAAGCACTAAAGCAAGCAAAATCCTTGTCACTACTCGCAATGTGAGTGTTTCATCAATTGTACAAACACTTCCTACATGTGTTCTGGGAAAATTATCGGAGGATCAATGCTGGTGCATATTGAAGTATAAAGCGTTTCTAGATGCGAGTGTTGTTTTGACTGAAGATCAAGAGAGAATCGGAAGGGAGATTGCCAAAAAGTGTGCAGGTGTACCATTAGTGGCAAAGGTTTTGGGAAATATGATGCGTTCTCAAGATATTGATGGATGTCGGTCAATTCTAGAAAGTAGAATATGGGATTTACCAGAAGGAGAAGAAAGAATCTTGTCGGTTTTGAAGTTGAGTTTTGATAAATTGAAATCACCATATTTGAAACAATGTTTTGCATATTGCTCAATGTTTGTCAAAGATTTCGAAATTGAAAAGGATGACTTGATCCAACTTTGGATGGCTCAAGGATTGCTTTACCCTTCTCCTCCCAACAGACGTAATCTAGAGATGGAGGATATAGGAAATGAATATTTTAATATTCTATTGAACAACTCTTTCTTTCAAGACGTTGAAAAGGATTGGTATGGTAATATTACAAGTTGCAAAATGCACGACCTTGTGCATGATCTCGCAGAACTTGTGTCAAAAACGAAGAGTAATGACTCCAATGAGACTCGACATATGGCACATATTCCTACCTCAGTGCTACATGGAGTTCCAGAAAGAGGTGCTCATAAATTGCGCTCACTTTTCTTGAATGTTGAAGTTCTTGGTGATATCTTACCAAACTTTAGAGGTTTGCGTGTCTTAAATTTATATCAAACTTATATGAAGGAGTTGCCAATTGCAATTGGAAAGTTGAAACACTTGAGGTATCTGGATGTTTCCTATACAAAGATCAAAGCACTCCCCAAATCCATTGGAAAGCTTTATAATCTACAAACATTAAGAATGAAAGAGGTCGAGCTTGAAGAGTTTCCAAAAGAACTGCAAAATTTGATAAACTTGAGACATATTTATTTTTATCCGTATGGTATGAAATTTCCAGCAAGGATAGGGCGATTGACTAATCTCCGAACATTAAAATATTTCATCGTGGGTAAGGAGACAGGTCGTGGAATAGAGGAGCTGGCTGGCTTAAACTTGTTAAAAGGCAGATTAACTATCTATAATCTAGAGCACGTGAGAGATGGAGAAGAAGCCAAGAAAGCAAAATTAGTGAAGAAGACAAACATAAGCAAGTTAAAGTTTCAGTGGGCAGAGGATAGGTCAAGCATCACCAATGATGAAGAGGTACTAGAAGGCCTTCAACCACACCCTAGTAAACTGGAATTTTTACAATTTTTCAACTTCATGGGTGATAAATGTCCATCATGGATCATGAGTAGTTCGTTTCCTGTATTGAAAAGGTTAAAGATTTACAATGCTAGGAACCTAACTGAATGGCCAGAAAGTGGGATCGTGGTCTTTCCTTGTCTCGAGGAGCTGGTTTTGAGGAATTGTGATAAATTGAGAAGTGCTCCTAGCCATTTCCCATCTCTCAAGACGTTGGAGATAGATTCCATGGGTAGCGGCATGCCAATAGCAAACATAAGCAATAAGCTGACCACTCTTACTTCGCTCGCAATAAGGAACATAAGCGGACTTGTTTCTCTGCCAGAAGGGATGCTTAAAAACAACAAGAATCTTGCATACTTGGAGATAAAAGATTGTCAGGAGCTAACTTGTATTGCTCTTGATGTAGTTGGCTCTTGCGCACTTCTTGAGTCAGTGCGTATTTCCAAGTGTCCTATTCTTGCTTATTTTCCTGATGGGCTACTCACAACATCTCTTAAGAACCTGATTGTGGAAGATTGCGGTAGTCTAGAGTTGATTCCAGTTACACAGCCCCTCTCATCCCTCTGTGAATTAAAGATTACAGGCTGTCAGGAGTTGTCAAGTCTACCGAGTGGGTTAGATTATTATACCTCTCTTCAGGAGTTGGCAATATCAAATTGTGATATGCTAACATCCGCTTTGATTCACAGCCTCCCATCCCTCCGGAAGTTGTCTATATTTCGTTGCAACAGGAGACCAAAGTTTGTTCCAAGTTTACTCGGCTTCACATGCCTTCGTGAATTGAGAATTAAAGATTCCCATGGATTGACAAGTCTGCCAATAGGGCTAGAATCATGTTCTTCTCTTGAGGTGTTGATAATAAGCAAGTTGCCGAATGTAGAATCTATTACAAGTTTAGACAACCTCACAAACCTCCATGAATTGGGGATATTTTCTTGCGATGGATTGAAAAGTCTACCCAATGGGTTAGCAATAACATCCTGCCTCACCCACTTGAAGACATTGGAAATCGGTGGCTTTTGGAAGGAGCTTGATTCATTCCCTGCTTTTCAGGTTACATCACAACTTGAAACATTGAAGTTATGGGGTTGGCCTAAGCTCAAGTCTCTGCCCGAGCAAATTCAACACTTGACTTCTCTAACATGTCTTGAAGTGCAATGCTTTGACGGAATGGAGGCTCTTCCAGAGTGGTTGAGAAACCTTACATCTCTTGAGTACCTGTATATACATCTTTGCAAGAATATGATGTATCTACCTACACTAGAAGCTATGCAATGTCTCACCAAATTAAAACGCATATTCATTTTGGATTGTCCCCTTCTAAAAGAGAGATGCAACAAGGAGAGCGGCTCAGAGTGGCCCAAGATTTCTCATATTCCACAAATATATGTTGACTGGGTACGGTGGCAGCTGCCAAATTCAATATAGTCTGAGAAAGTATCATCTTGAAATGAGAAATAGTTGAAAGTGGGCGAATTGTGGTCGAGAAAATGATTAAACTCAATTGCGTTTTTCCTTGAGACTGGTGTTGGTGTGGAGAGTTGATTGAAGCTATATATGCTACACATCATCACCATTGAAGAAAAGGTGTCCATTCCCTACAGCCTACAGCCTACAGCCTACAGCCTACAGGGTCTGTTGTTATTTGGGCATAATTTGGAGGTGGGTGGCTTTGCCTTACCTGAAGGAACATTTTTTGTAATGGGAGCAAACAGAGTCCAGGTATTCAAAAGCACTCCAATTTCTACAGTGACTGATGGGGGTAAATCCAACACAAGCCACCAACTCAAATGATCACAAAATCAAGACAGAAGTCACAGGCTGCTCAAATTTTGTGTGCCGATCCGAAGCGATTGTAGTTGGAATATTTTGGTAATATCCTTCTATTGATGTCCAGAGAAAACTATAAATTTATTCAAATTTTAGCATGGGTGTCCAAAGATGGATTTTGGGTGCAAGCGTGAGCTCACCAACATTTGAAGCACGAAGCCCAACAGCCCAAGAACCAGCAACTAAGTCCAACTTAGCCTATTGCTCCACTCTACCCCAACACCCCACTTTCTCTTTCCTTTTTTTTTTTTTATAATTTTTTTTAACTGTTGTAAAAGTGGAGTCCCCAAAATGCCCCCAAAATGCCTATAAATAAGGCTCCCTCCCATACTTGTAAATACACAATGAGATTGAGAAAACACACAGAAATAATGTGAAGAACAAACTCTCAATGAATGAGAAATCAGTTTTCTCCAATTTCTCTCTATCCCAATTCTCTCTCCATTTTCTTACTAGATTTATAACACATTATCAGCATGATTTCTCTATCTCTAAATTCAGAGACCCAACCCATCTCACCTTCCTCTGCTCTCTCATCCACACCGCAGCAGAGCTTTTCTTGAAAACCCAGAAACAACATAAATCCTGTCCGTACAGCAACCGAGCCATCTATGGGACACGGTGCTCCAGCTCACCAAGTCCGCTTAGGACAAGAACAGCGACCCGCTCCTCTGGGCGGTTCAGCACAGCAACAGCCTCAACTCGGCCGGCGTGGCCTTGCCCTCCGTCGAGCTCGCGCACCTCCTCGTCTCTCACATCTGCTGGGCCAATCACGTGCCCATCACATGGAAGTTCCTCGAGAAGGCCTTGACCGTCAAGATCGTATTGTGAACCAGCAAAAGAAAATCTTGAGAACCCAGTAAAGTGCGATGGGGGAGCTGGCAAGTCAGAAACATGTTCAGTTCATTGTATTAGTCGAAAAGAAGAAGGATTCTTTTGAGTCCGTGGTGATGGAGCATATAAGAATGAATGGGGCATATTGGGGTTTGACTGCTCTTGATCTTCTTGGGAAGCTGCACGTCAAGATGACTCAGGTGGGTTTGGTGGTAACATTGGGCATGACCCACATGTACTATATACCTTAAGTGCTGTGCAGGTTTTGGCCTTGTTCGACAAGCTTGATGTTCTGGATATTGAAAAGGTTGCGAGTTATACCACACACCAGCCTTCACATGTTTTGGATCAGCGGATGATGATGAGGTTTTCTCCAGTCGGCAAGGACAGAGAATAAAACAGTGTAAATGCAGAGGCAACTTTGACAGACCCCTGATGACGGCCACAATGATGAGCAGCACCCACCGATAAAGAAAAGCAAACCCACCGAAAAAAAAAAAAAATGCTAAAGTGCTGAAGCATCTTTCAATAAGAAAAGCAAACCCACCGAAAGAAAGAATAATAAATAAATATATTTTTAAAATTAAAAAAAAAAAAAAAAAAAAGATCACTCAGCCAAGGGCACTGACCCTAAAGTAAGCGATAAGGTCTCTGCTCCCTTATCTTCTC
>AY964845.1 Eptatretus stoutii clone Es2VLRA.33 variable lymphocyte receptor A (VLRA) mRNA, complete cds 
TGGTGATAACCTCAAGGTGCTCTTTCAGAGATGATGGGTCCGGTCTTGGCCGCGTGTCTGCTCATCATTTTGTCCACTGCATGGATTTCCCAAGCGAACGGGGCAACCTGCAAAAAAGATGGTGGTGTTTGTACCTGCAACGACCAAACGAAGAACGTTGACTGCTCCAGCAAAGGGCTCACAGCCATTCCCAGCAATATCCCCTTGGAAACTACGCAACTGCATCTAAACCTCAACTCCCTGAGCAAGCTCTCACCCAAGGCGTTTCACAGCCTGAGCAGTTTAACATTCCTCGATTTGAGTTATAATCAACTGCAAGCTCTCCCTGCTGGGGTGTTTGACCAATTGAAGAATCTTGAAACACTATACCTGCTTCAAAACCAGCTCAAGTCTCTCCCACAAGGGATATTTGATAAACTCACCAAGATCACCTACTTGGACCTGGAAGGCAACAAGCTGCAGAGCCTATCACATGGAGTGTTTGACCACCTCACCAAACTCACAATTTTATGGCTGAATACCAACCAGCTGAAGAGTGTTCCTGAAGGAGCTTTTAACTTTCTGGAGAAACTGACACGGCTACAGCTGCAAAGCAACCCCTGGGACTGCACGTGCAACGACATTCTCTACATGGCCAAATGGCTAAAGAAAAAGCAAGACGGGGGTCTTGGGGGTGTCGACACGGCAGGCTGTGAGGAAGGAGGCAAAGCCGTCTTAGAAATCACGGAAGAGGAAGCGGCAGAAGATTGCGTCTATCCAAATACCACAACAGCGATACCGACAACAATTATTACGACACTGGCATCAAGTAATGACGATGATATACCCGAGCTGCCAGTGCCGCAAGAAAACTTTCAGAAATTCTTGGGATACCAAGAGCCAGACCATCTGCCCACCCAACCACAGTGCTTGATGTCCATTTCTGGATACCTCGGCCTCATGATGTTTTTCGTGCTCATTTCTGCTGCCATTTTGTACGTCATCCACTTTCTCAAGAAGGCCTGAACCAGTGTCTCACTTGCC
>XM_028621987.1 Apiotrichum porosum hypothetical protein (EHS24_006566), partial mRNA 
ATGGCGACCGCTGCCCCGCTTGTCAAGCATGCAGCCTCGCTGCTTCGCCCTGGCCACTCAAACTGTGTGGCCTTTCCTGACATTCACCAACCGGGACTGTCTTTCAGCCTTGTGCCGAGGGCCGCGACTCAGTGGCACGACGAGGACTGGTTCATGGGCGGGCTGAACTACCACCTTGCTGTCACTTTTGATGATGGGGTTTGCTGGCTCGCTCGAATTCGCCAGAAGAATGGCAACCCGCGCAAGCTCCAGTCCCTCGTCTCAGAGTTTGTCACCCTCAAAGCCTTGAACCGCGCCTGCCCCGAGTTTGTTCCCAATGTCTGGATGCCACAGGCGTCACCCTTGGGTCCCCCATTCTTCTTCATGGAGCACTTCAAGGGGTCCAACAGTCGCCACCTGTTCCCCCGATCCGGTGCTCGCCCTGTCGAGTCCCAGACCATCGTTTCCGACATGGCCACCTTTCTCATCCAGCTGAGCTCGCTGGAAATCCGCGGCGACATTGGATCTCTTACTGCCAGCAGCGCGGTCGTCGACGCCGCAACCGACCTCGAGCCAGAGCCAGTTGTTGGGCCCTTTGAACATTGGGACTATTGCATTTCGAACGGACTGACGACGTTGGGGCCGTTCCGCACCAGCCGTGATGCGTGGGTGGCAAAGATCGACGCCGTCGTGCTTGCACTCGAAAGGGGGCTGTTTGCGATCAATGGCGGGCACCTACTGCATGTGTATCTCGTCCATCTGGAAATGCGTGCTCTGGTCAACGCGTGCGAGGAGATGGCTGTGCCGTGCGGTCCCGGCGACGGCGAGCAGCCGACGTTCATCACACATGCCGATTCCAAAAACCACCTGCTTGTCACAGACGACGGCCATCTGCGCGCAGTCATTGATTGGGAAGGTGCGTACACCGCTCCATTTGCCGAGGCGTTCGCTGCTCCGATGGGGTTTTACGATCAGCGCGGCTTCGTTCGGGGCAGTAACGAGCTCTCCACCGAAGAAGTCCTCCTCGCCGACATATTCCAGTCTCGCGGACGCAAAGACATGGCGCAGGCGGTACGCGGTGGGCGCAAGTACCACCGACTTGCGTTTCACCTCGGAACCCTTCAGCCGACTCTGGAGATGGTCAACGCACTCTATGACGCCTTTCTGGGTGAAGAATCGGCAAGTTGTATCAGGTTTGACTCGCTCTTCGAGTGGGAGGCCGCGGCGTTGCACAAGTTCTCACATGTCCCGGGCCTTGAACAGTTGGCAATTCCGCCGGGAGAGGGGGATGTCGCCTACTTGCGCTTCGCAGAGGTCGAGCCAGACGCAAATTGGTGCAAGGTCGTCACTGTGAAGGACGCCTCGTAG
>XM_035908051.1 PREDICTED: Neolamprologus brichardi nuclear GTPase SLIP-GC-like (LOC102787354), mRNA 
TCTGTGCTAGAGTCCGCTCGTTCACCTCGACAGGATCAGCAATTAAAATTTATCTTTCAGTTTCTATTCTTGGTCATGGATGATTTTGTGCGAAACAAACTGACTGAATGGAAACTAAGTGACTGGATTGATGCATTTGAAGCTCAAGAAATTGATGAGGAAAGTCTGTATCATCTCAATGATCAGGAAATTGATCAATTGATCACAAAAGCTGGACCTAGAGTAAAATTCAAGGAAAAACTAAAGATGTTAAAGGAAGAGCAAAATACAACCCAACCACAAAAAGAAGCAGTCAATACTTCTGGTCAAGATTTTCCATCCATAAGTGAAAGAGGAAAGAGAAAGTCAGATCATCTTCAGAGTGAGACCAGAAAATGGCAACCACCTCTTAAAAAACAATACAACTGTGCAGCAAGATCACAGTCAGAAACAGAAATACTGTCTGATGTCAAAAACATAATGAGATGTGTCAGTGAAGGACTACATGGCCGTGACAAGCTCAGTGCTTTCCTAAAAGATAAAATCAAGAATTTAGAGACAGAAAGGAGACACCTGGTTGGTGTCTTTGGTAAAACTGGGGCTGGAAAGAGCTCTTTAATCAATGCCATCATAAATAAGGAGGGCCTGTTGCCTTCTGGAAGTGTCAGTGCATGTACCTCAGTGATGATAAAGGTGGAGGCTACCAATGGATCAAAGTATGAGGCACACATCGAGTTCATTACAAAAGAGGATTGGGAAGATGAGGTGCAGTCACTAAAACAGGCTCTTGAAGACAATGACGACAACGATGATGATGATGGTGGTAATGATGATTTACTTGATCCTGACGGAAAGTTATCAGCGCTGTATGGAGAAGAGTGGAAAGAAAGATCCACTCACAGCCTCATGGACAACAAATATTTCATAGATATTCCAGAGTTTCGAACATCCAAGATAAAAATTTTGAAAAGTGACTCAGTGGGAGAGGTAGAGGTGAAGTGCAGTGAAAAGAGCATCCTTGGTCGTTCTGTTCGGCCAGTATGCAAACTGCAGTGGGTCCAAAAGAAAATCAAGAATGCAGTGAAGAATGAATTCAAAAAGCGGAAAACGATTACGAATCACTTCAGTGAGCATTGTTTCAAAGTCTTCACAGTGAGCTCCAAAGAGTTCCTCAAAGGGGAGAATGTAAATTCAGATGTCAATGAAATACTGAAACTCAAGGAAATTTTGAAAAATCTGAATGATGCTCATTCAGAGACATTAAACTATGTGTCTGGAGCTCACGGGATTCTGTCTTTGATTCAAGGGGCCAGAAGTGGAGAAGTGGTTGAACAAAAAAATGATGTGTTTGCAATCCTTGAGGGAAACTTGAGCATCCAACTTAATCAAGTCAAAAAAGCAATTGAAGACATTATAAAAGCTTTTGAACAATGCCTAAGTGAGGGAGTTGAAAAATCCAAAAAAGCATGTGAAAAAAAACTGAAGTCCTTCTTATACCCTAGTAAAAAAACAAACAGAGCTTTTCACATGACACTAAAGTCTGCAGTTAGGAATGATGGCATCCAGAAACCAAAAAAAGGAAAACCTAAAAACCTCAACATGATATTAGCGTCTTATTTGACTGAAAGCATTGATGAAAAATTCAGAGATACCTTCCCAAACAACATAAAATGTGGACATTTCAATGGAGCCATCGATGCGTTTTCACTCAGCACTGATTCACTGATTGAAAAGTACAAAGATGTCAAACTGCAACTGACATTTCTCCAGACAGAGGGGGAAAAAATGAAGACAAAGCTCAACAAAACCATCCTCACACAAAAGAAATTAATCTACAACAGTTTGACAGAGACAATCAAGGACAACATGAAAGAATGCTATAAAGAAGCAGCAGCATTTACAGGAAAAGGCACCCTGAAGAACATGAGGGACACTATTGAGAGACATGTGCACTCAAAGATGGACATGTTTGAGGAAGCAAAAAATGTCATGTTGGAGCTCTTGAACGATTTGAAGGAAACTGTCCTGAGGACACTGGAGAAAACCATGAAGGATTCCATTGAACACTCACTTAAGTCGGAGGCCTGCTCACTGCCAGGTAAACAGAATATATAA
>XR_005829514.1 PREDICTED: Falco naumanni ATP binding cassette subfamily B member 11 (ABCB11), transcript variant X13, misc_RNA 
ATGAAAACATGATGGGAGATGGTTGGGTACTTCACTGCCTAATTGAATAGATCCTTACAATTTGTTCTATAATACATAATTTTTCGCAGCGCAGCCACGGGACTTCCGATTTAAGTAACTAAACATCATGTCTGACCCTGTTGTTCTGCGTAGCATCAAGAGATTGGGAGAGGATAACAATGCTTTTGACTTGGATGGCAAATGTAACAGCTTCAAGAAATCAGAGAATTTCTATACGTATGAAGAACCTTTTGTAGAGAAGAAAACTGAAAAGTCACCAGAAAAGAAAGAAAATACTATTCGTATTGGCTTCTTTCAGCTGTTTCGATTTTCTTCATCTATGGAAATTTTAATGATGGCTGTTGGCAGTTTCTGTGCTATTGTTCATGGAGCAGCCCAGCCAGCTGTGCTACTTGTGTTTGGTGCAATGGCAGACACATTCATTGAATATGACATTGAAATGCAAGAGCTTAAAGACCCACTCAAGATATGTGTAAATAACACCATAGTGTGGATTAATGGTACTATTCATCAGAATGAAAAGAATGCCACAATAAGATGTGGGCTGCTGGACATTGAGCAAGAAATGACCAAGTTTGCAGGTTACTATGCAGGAATTGGTTGTGCTGTACTGGTGTTAGGATACATCCAAATCTGCTTTTGGGTTATGGCTGCAGCTCGTCAGATACAGAAAATGAGGAAAGCTTATTTCAGGAAAGTAATGCGAATGGATATAGGCTGGTTTGACTGTACATCTGTAGGAGAACTGAACACCCGCATTTCTGATGATGTTAACAAAATTAATGAGGCTATTGCTGACCAAGTAGCAATCTTTATCCAGCGCTTAACCACTTTTGTGTGTGGATTCTTACTGGGATTTGTCAGTGGCTGGAAATTGACCTTGGTTATCATTGCAGTCAGCCCTCTGCTTGGGGTTGGAGCAGCTGTCTATGGCTTGGCTGTGGCAAAACTAACAGGCCGAGAACTAAAGGCTTATGCAAAAGCTGGAGCTGTGGCTGATGAAGTGCTCTCATCCATCAGAACAGTGGCTGCTTTTGGTGGGGAGAAGAAAGAAGCTGAAAGATACGATAAGAATCTGGTGTTTGCTCAGCACTGGGGAATTCGAAAAGGAATAATAATGGGATTGTTCACAGGTTATATGTGGCTTATAATTTTCCTGTGTTATGCATTAGCCTTTTGGTATGGTTCTAAACTTGTCCTTGAAGAAGAAGAGTATTCACCTGGAACTCTTCTGCAGGTTTTCTTTGGTGTTTTAGTAGGAGCTTTAAATCTTGGCCAGGCATCTCCCTGTCTGGAAGCCTTTGCCACTGGCCGTGGGGCTGCAGCAAACATATTTGAGACAATAGATAAAAAACCCGCCATTGATTGCATGTCAGAAGATGGCTACAAACTGGATAAAGTACGAGGTGAAATTCAATTTCATAATGTAACATTTCATTACCCCTCCAGACCAGACGTAAAGATTTTGGATAACCTTAATATGGTTATTAAAGCAGGGGAAACAACAGCTTTTGTTGGAGCTAGCGGAGCTGGAAAAAGTACAACAATGCAGCTCATCCAGCGTTTCTATGACCCCACTGATGGCATGATTACCCTGGATGGCCATGACATTCGTTCCCTTAATATCCAGTGGCTACGCTCACAGATTGGTATTGTTGAACAAGAGCCAGTCCTGTTTGCCACCACGATTGCAGAGAACATTCGCTATGGTCGGGATGAGGCTACCATGGAAGACATAATCAAAGCAGCCAAACAGGCCAATGCTTACAATTTCATCATGGACTTGCCACAGCAATTTGACACTCACGTTGGAGAGGGTGGAAGCCAGATGAGTGGAGGTCAAAAACAGAGGATAGCTATTGCTCGAGCTCTTGTACGAAACCCGAAAATCCTGCTGCTGGATATGGCTACATCAGCACTTGATAATGAAAGTGAAGCTACTGTCCAGGAAGCACTTCATAAGGCTCGCCTTGACCGCACCGTAATCTCAATAGCTCACCGCCTGTCAGCCATCAAAGCTGCTGATGTCATCATTGGGTTTGAGCATGGAAGGGCTGTGGAGAGAGGAACTCATGAGGAACTCTTGCAGAGGAAAGGGGTTTATTTCATGTTGGTGACCTTGCAAAGCAAAGGAGACAAAGCACTTAACAGGGAAGACACAGAAACAGCAGAAAATAACATCGTTGAGCCAAATCTTGAGAAAGTCCAGTCATTCGTCAGAGGAAGCTATCGGGCCAGTTTGCGAGCTTCACTTCGACAGCGCTCCAGATCTCAGCTCTCTAACATGGTCCCTGACCCTCCATTATCCATTGCAAGAGATCATGCAGAGTCTATGTATGTTGTGCCTTCTTATGGAGAAGATGATGGACAAGCAAAAAAGGAATCTGTTGCAGTGGAGGAAGATGTCAAACCTGTACCATTTACCAGAATTTTGAAATACAATGCCTCGGAATGGCCGTACATGGTGCTGGGATCTCTGGCGGCAGCTGTGAATGGAGCAGTCAGTCCACTCTATGCTTTGTTATTCAGTCAGATTCTTGGGGAGCTGTTGGGTGTGGGTTTCTGTATTCGCATACAGTGTATTTTAGATGAGACAAGAGGTACCTCACGTGCAGACCTTCTCCATTCTTGACGAGGAAGAACGAAGAACCCAGATCAATGGTGTCTGCCTGCTCTTTGTCTTTGTCGGAATTCTTTCATTTTTCACACAGTTCCTACAGGGATACACCTTTGCCAAGTCTGGAGAGCTGCTTACAAGACGGTTAAGGAAAATTGGTTTCCAGGCTATGCTAGGGCAAGACATTGGTTGGTT
>XM_001628387.3 PREDICTED: Nematostella vectensis peptidyl-prolyl cis-trans isomerase NIMA-interacting 4 (LOC5507809), mRNA 
GGGGAGTGGAGATTGCCAGCCGTTGCCTGTTGTGTGTGGAACAAGTAAAAGGGTCGTGTGAGGGAAAAGAAACGATGCCCAAAGGCAAGAAATCTGGCGGAGCTGATGGCGGAGGAGGAGGGAAGCAGGATAACAAAGGGAAAGGTGCCAAGGGAGGCAAAGATGATGATGGTGCTAGTAAGGCAAAAAAAGGAGGAACTTCAGTCAAGGTGCGCCATATCCTTTGTGAGAAGCACTCAAAGGCAATGGAAGCCATGGAAAAACTGAAAGCAGGGCAGAAATTCAATGAAGTGGCCACAGCTTATAGTGAAGATAAAGCTCGACAAGGGGGTGACCTCGGTTGGATGACACGCGGTTCCATGGTAGGTCCATTTCAAGAGGCTGCATTTGAGCTACAGACCAGCACTGTTGACAGGCCTGTCTACACAGATCCCCCAGTCAAAACTAAGTTTGGCTATCATATTATTATGGTAGAGGGGAAAAAGTGACCCATGTTGATGGTAATCCCTTTTTTCAAGAAAAGCCAGTTTAACAGAATGCATTGCATTTTTTTATGAAAGTGGTATAGGATGATACTGTTTCTGCGTGCAAGCAATTAATAGCTGTGTCATTTATGCAAATGCAATACACTATGGGGTAGGTCAATGCCTTATGGGGAAGGTTGAGATAGACCAAGTTACCTTACACATTTTCCATTCATTTTGCATTTAGTCTGTGATTGTTTGGAATGAGGACTGTGGGGTTTTTCTTGAACAAAACACAGCTCTTAAAAAGCACTATAATACGCACTGGGAATCAACATAATTCAACACACAGTTTTGGCAACTAACATAAGATTTTAAATCTCATGTTTTCAAATTGATTTTTGATTATTGTTGACAAATGATTTCCATCATCGCATATCTTCCCTATTCTTTAAACACTTTTAGTTGTGCTGAAATATTTTGTGTATATTTAGAACTACGAAACAAAAGAAGGAAATGTAGCACAAACAGCAATGTGTATTTGAATTGCATTATGATTTAATAATAATTTATTGTTAGATAATAATTAATAATAATTTTTTTGTGTAGAAATTCCTTCGTTATAACATTTCTGGAAGTCTGTGCCCTCTGGTGCTTGCACTTCCTACAAAAAACAGGAGGGCAACTGTGATTATTAACTTTCTCTAAAATAGTGTCTGAGTATTTACAGACTCAAAAAAGGGTCCAAGTTCACCATAGTTCTCGCAAAAAACGGGGCATTTTCCCTCTCCCCCCCGGGTTCCTCCCCCTCCGCTTCCCCTACTGCTATCTCAGCTATATCTACAGTTTGCCAACGATTCGCCGCAGGATTTTCCAGCACCTGCGGGTTGTTCAGATGATGTTTGCACGGGCTTGTTAGCCGCAAATGTCACCAGTTCACTTCCGGAGGTACGACGGAAACCTCAACCGTTAAGACAAAAGAATCTACTAGAATCCGATATATTTGACAGGCCATCCGCTCTAAATTACCAATCACACCCTCAAAGAAACTTCCAATAGACACACTGCTTCCAATATTTTGAAATAATTTTCGAGTGTTCCGTTAAAAATCATCGGATATTGTTAGGTAATCGACCGGAAGTAAACTGGTGACAATGCGGCTTTAATACGCACCCTCGCGCGCCAGGGTCCAACTCTCATAACCCGAGGCCAAGGAGGGTCTTATGGTATCAGAGGGGTAGAGCATGGTGCGCAAAATGGTGAATAAGTTCGCCAATAGTTCCTTTATCTTGTTGTCAACCGAAAGATGCCAGCTAAAGTCTGATGTTGGCGCTTTGTGCAAGGGGCTTGGTATAGCAATGATTGTCGTAATAATAGATTAACAAAAGACTTAAATAAAAAAAGAAGAACATCCCAA
>XM_031545768.1 PREDICTED: Punica granatum exocyst complex component EXO84C (LOC116211402), mRNA 
GCCCTGTCTCCGCCCTTCTTCGCCGGCTCCTGCTCTTCTCGGCCTCCTGGCCGTCGCCGCCTCCTGGCTGAGACCGGCTCCTGCCCCTCTCCTACTCCTCTGCCCATTTGGGTACGGGTCCTCTTTCTTCTTCCCTCTGTGGTTTCGTGATAATTCCCGCCGAGCAAGAAAATTGAGTGAAAAAAAGGCCATCTACTGGGTTTTGAGCTATTAGATGTTCTGCGAGTTGAGCTTTCGCAATCTGGGCTGAGCTGAAATCCATAAATGGGTCCTCTGATCTGAGCAATCAGTAATTGTTGAGTTGAGATTCAGTAGAAACTGACTATACTGAGATCAACTCAGGTTCCCTTCCTCAATGTAGAAGTCAGTCTGTGAAGAAGAAGAAGAAGAAGAAGAAGAAGAAGGAGATTTGAATTGGGAAGTAAAGAAGGGGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAAGATGGAGAGCAGTGAAGAAGACGAGGAGTTCCCTTCAATTGAAACCATCACTCCCCAGCCGAAAGTCAATTCCCTGTTCCAATCTCACACCGAAAAGGGGATTAGGCAGCTTTGTTGTGAGCTATTGGATCTGAAAGATGCAGTGGAAAATTTATGTGGCAACACACAAACTAAGTACTTAGCTTTTTTAAGAATATCAGAAGAAGTGGCGGAGACGAAGCACGAGCTAAGCGAGCTGCAGAAACATATTTCCTCCCAAGGGATACTCGTGCAGGATCTGATGATTGGTGTGTGCTCCCAATTGGACGAATGGAACAAATGCAATCGCAGGGAGCATGAAGGTGAGAAAAAACAGGAGAGCTCTGAAGATAGAGATTCTGTACCTAATGAAACTGAAGACAGCAAGATGATGGTATTAGAGACCATCGATATTCTTTTAGCGGAGCACAGAGTTGAGGAAGCCGTGGAGGCTATAATTGCTGAAGAGAAAAACTCATCAGAACTAAAAGGTTCTTCTGAAGCTTTATCTGCTGAAGCAAATTCATACAGATCGATGTTTCTGGAGAGGAAAGCCATGGTTGAGGAGCAGTTGGTAGAGATTGCAAAGCAACCTCTGATTAGCATGGTGGAACTGAAGAAGGCATTATTGGGTTTGATTAAGATTGGGAAAGGCTCTCCTGCTCATCAATACTTGCTTAAGTGGTATGGGTCCCGCCTCCAGAAGAGCATTGAGGTTTTCCTTCCTTCGTGCTCTCTTTGGCCGAGGACATTTGCCGCCACACTAGCTAAACTCATGTTTTCTGCTATCTTAACGACAACCAGAGAATCTGGTTTGATTTTCGGGGATAATCCGGTTTATACAAACAGAGTTGTTCAGTGGGCAGAGTGGGAGATTGAGTATTTTGTTAGATTGGTTAAGGAAAATGCTCCATCTTCTGAGACTATAAGTGCTTTACATGCAGCAGGCATCTGTGTCCAGGCGAGTCTTAGTTACTGTTCAATGTTGGAATCACAAGGGCTAAAATTGTCCAAGTTGCTTCTTGTGCTCTTAAGGCCTTATATTGAGGAAGTTTTGGAATTGAACTTTAGAAGGGCTCGAAGAACAGTTCTTGATTTGGAAGAAGGCGATGATAACTTGTCTGTGGCACCCCGATTTGTCTCCCCATTGTCTGCTTTTGCTACATCTGACAATGCTCTTATTGACAGTGGACTGAAATTCATGTACATTATCGATGAGATATTGGAACAGCTAACTCCTCTTGCCATTTTTCATTTTGGAGGGAATGTATTGAGTAGAATCTCACAGCTGTTTGATAAGTATGTGGATGCTCTTATCAAGGCCCTTCCGGGTCCCTCTGACGATGACAATCTCACAGAGCTTAAAGAAGTTTTACCCTTCAGAGCTGAAACAGACTCTGAGCAACTTGCATTGTTGGGAATGGCTTATACCATTGCCGATGAACTCTTGCCTGATGCCATTTGGAGCCTGTGGAATACGCACAATGAAACCCAAGAACCAAGAAGTGAACCCAGTGAGAGTACTCCTACTCAAGCTAAGCCGGCAGAGCTAAAAGAGTGGAAGCGCCATCTTCATCACTCATTTGATAAGCTCCGAGATCACTTTTGCCGGCAGTATGTCTTGAGTTTCATCTACTCGAGAGAAGGCAAGACACGACTGAATGCACAGATTTATTTAAGCGGAAACAGGGAGGATTGGGATCCTGATCCCTTGCCATCGCTTCCATTCCAGGCATTGTTTGCAAAGCTACAGCAATTCATGACTGTAGCTGGAGATGTCTTACTAGGCAAAGAAAAAATACAGAAAAATCTGCTTGCAAGGCTGACAGAAACAGTCGTGATGTGGTTGTCTGATGAACAAGAGTTTTGGGGTGTCTTCGAGGATGAATCTTCGGCTATTCAAGCGATGGGTTTGCAGCAGTTGATTCTTGACATGCACTTCACTGTTGAAATAGCCCGGTATGCAGGCTATCCATCCCGGCATGTGCACCAGATTGCATCTGCTATTATTGCTCGTGCTATTAGGACCTTCTCTGCCCGAGGGATAGACCCTCAGAGTTCGCTTCCTGCGGACGAGTGGTTTGTTGAAACTGCAAAATCGGCGATACACATCCTTCTGGGGCCTGGGTCAGATACATCTGAGATAGATGAAGGGCATATCATGCACGATGAGATTCTATCTGATTCAGAAGACTCTGCTTCGTCCCTCTCAACTGAAGAATCCGTCGAATCTTTTGCTTCTGCTAGCATGGGAGAACTTGAGAGTCCAATGTTCACCGATCCCGAGAACTGAGGTACTAATTCGAGTCTTCTGTTATGGTGAGGCCCTTTGGCTGCGGATTGCATTGGGTTCTCTTTTCGGAACGTCGGATGGGCATTTTGTTGGTAGGGAATCTTATTAGCTTCGGCAGAACAGATGATGGATAGCTTAGGTTTTAATGTGCGATGATGGATATGGAAATCAAGAAAGTGTATTTGATTATGAAAACTAGTGTAATTTATGATGTTAAATAAATTAGATAATACTTTCTAACAGGCAGTACACAATTTTTTA
>XM_006508279.3 PREDICTED: Mus musculus anaphase promoting complex C subunit 15 (Anapc15), transcript variant X2, mRNA 
AGTATATAAAATCTGTCAGTGCTTTCGGGATCGTGGTGGACGCGCCTTTTTTTTTTTCCCCCATCACACGGACCTGGGGGGGCTTTGGTCTAGGGAATGACAGCGTCTAGTTCTGCTGCTGGGCCAGGATCCCTGCCTTGCGTAGGATTTAAGCCCCCATCGAGTGTGTGGCCAAAGTCAAGCTCTACATGTCACTGGGTTTGTGAGCCAGGGCGTTTTAGTTCAGCTTCTTGGTGACCTTCCTGGTCAGCAGCTTCAGCCCACAGAGTTGATTTTGTTCTCTTCCATATGAGGAAACTGAGGCCCAGAGAGGTTAAGTGTATTGGCCAAAATCAAAGAGCTAGTAAGTGATGGAGCCAGGACTCAAACTCAGCTTAGGAGCCATGTCCACCTTGTTCCCGTCACTCTTCCCTCGTGTGACTGAGACACTGTGGTTTAATCTGGACCGACCCTGTGTGGAGGAGACAGAGCTGCAGCAGCAGGAGCAGCAGCATCAGGCCTGGCTCCAAAGCATCGCAGAGAAAGACAACAACCTGGTACCAATTGGCAAGCCGGCCTCAGAGCACTACGATGATGAGGAAGAAGAGGATGATGAAGATGATGAGGACAGTGAAGAGGATTCCGAAGATGATGAGGACATGCAAGACATGGATGAGATGAATGACTATAATGAGTCACCTGATGATGGAGAGGTCAATGAGGAAGTAAGTGCAAAAGACTCGGGATTGTGGGTAGGAGCAGCATGCCCTCCAGGATGCCAGCTGCCTGAGTGGAGCTGCTTCCTTGAATGGGAGTCCCTCATGAAAGAGGCCTGGTCTGAGCAATTCCTGGGATAGCTGAAGAGATCAGCGTTGGGGCGATAGGGGCTGACCATTTGCTCATCGAAGCCTGCCAGCCGGATGACTTTTTCAGCCACTGCTGCTGTACGTGAGTCCCGCTCCACAGTGAGAAGGCGACTTCCAGGGGGCAAGGCTCGCGCAATAAGCAGTGTAGAGTATCCACAGTATGTGCCCAGCTCCAGCACACAAGCAGGGGCCTTCTCTTCCACCAGCCGCATCAGAATCTGACCTATGGGTCAAGATGGCTATTTTAGAAGACATTGAAAACAGGTGTGCCCAGAATCAAACCTGCTGTGCTTTTCTGAATGTGGTGTTTATGTGTGAGGCTGACAGGCTGCTTTCCCCTTTCCCACACCTGTCTCCATCCACCTGGCCAACTTGAAGAGAAGCCTTCCAGTCTCAGTTTAGATGTTTCTTCCTCCAGGAGGACCCAGGCGAAATATCCACCCTACCTTCCAGGTTCCCGAGACATTTTCAGTTTCATGCTCAAATGCACTTCCCCATTGCTGATTGTCTTTGATTTTGGAATTGAATAAATCTCTTAATACTTAGAAGTACTTGTGCTATCTCAGCAGACAGCTATCCTGAGTTGGTTGTGGAAGCCTCTTTGGTAGGGAAGAAAGTCTAGAACAGATAATTACAAACCTCTGAGTTATGGCTATTCCCCTATGTTATGATCTCTTTGAGGCCAGCATTTGTGGCTGGTTACCCTCTGTGATCTCTGCCTCCCTCAGCACCTGGCACAAAAGAGTGGCAATAAATGTCTGCTGGATAACTGAA
>XR_006907879.1 PREDICTED: Neodiprion virginiana uncharacterized LOC124303282 (LOC124303282), transcript variant X1, ncRNA 
CGATGATTGATAGGAAAATAACCGGAGTGGCCAACCAGCGCAGTAATATTATGTAGATCAGACTTATGGCGGCACTGATACCAAGGATCGATGCAATGGTCCATCTATAAATGACAAAGTCAGCTACAGTCATTGTATAATTGACAAACAGTTCCGGAATTCCGTTTGGAATACAACGACCAGTTACAGAAGTACTGGTCAGATACCACTGAGCACACACGTCGTTTGAAACGTAGGTAGCAAGCTGGTCTGCCGTCGCTGTATCCACTTCAATTCCAGTCTTGCATATCATTGCGGTTCTTAATGCGGTCAAGTTATTTGCCAAAATTGACGAATTCAACTGCCACACAAAATTATCTGTCGGACACTCCGGCACGCATACCTGCGGCGTATCGCATCCTTGGGTCACAGACGTGACCGCTACACATTTTGTCAGATCAAAAAATACCAAATATGGTCTGTCCTCGACATCTTTATGCCTACCGCATATCCTTCCTTCACTATCAGTTGGGTATACTAACGTATCTATATCTCCATAAGTATAAGCTGAAATTATAAAGAATTTTATCAGTGTGTTTCAAAGCTGTCTTTAAACATATATGATCAGGGTGATGTAAAAAAGATGTACTGGTTCCTTGTAGTATACTCGTATTCAAAATTGCGTACCGTAATATCCAATTACCGCCCATCCTACCACAAATGCTGAGAAGATAATCAAGCAAAAGCAATCTGTACATGATCTGCCCTTTAGAGGTCCTCGATATTTTGGATCGAACTGCATCCTATCACCTAAAATTGGTAATTTACATACTTAAATCAATAATAGGCCTTTTATAGTTTAAACATTTATCCAGTTCACAAATTCATTTCAATAGTTTTGGCACTAAGCCATTTTGACAATGTGTTGTGACATTCAAATAATCTTATCAACCACTTATCTCAATAACGAAGTATACATATTATATTGGTAGTGATCTATATTGATCTCTTACCTGGAATGGGAAAGTATCGATAGAGACGGTACTGCTTACATTTTACAATAGAAATTAAAGAAGTTTTTGAGTTACAAGCATAGTGCTCAAAACTATCGCAGAAGTTGCTTGTTGAAAAATTTGAAAACAGTTGTGGATCGTTCGGTTTGGCATAATCCTTTTTTGGTAACTCACACAAAACTCTCTACAGGTACAAGACATTTTTGACACGAGAATTCAAAGCAGTCTGTGACGTGACTCACGTTTCTATACAATGAGACAATAAGCATACGTACCATGTTTGTCGACCATTGTTTGCACTTTGGTTCTTTAAATAGACGTTATCACTCTGACTTTAAGTACTTATATAAAGCCAGTCAACGTTCTAAGAATTTTTTTTACTTGTCCAGTGTTACTTATTAACTTGTTAGGTCTGCATATTATTTTGCCCACTCCGGTTTCATGCTCTTGGTTCAAATTATTAACGAATACTTGGATAGCATATGCTTTCAGTAACACTTCTACTGATAACACATTAATCTGATAAGATGAGATTTGGCAGCGAAGTATGAATCACCGGAAGTAAACAATCTTATCAATTTTTAATTGAGTCTGATAAATTGCAAATTCTTTACAGGATATGCTAACCATATATTGATTGAAAATATGCACAGCAGTAACTTGAATCATACGAAATCTCAGAATTATGTGAGTCGTCGAAATTCTCATTATTTGCACGTTATCGGTTCTAGCTATCCCGAGTTTATAGTTTCCAACTCTGGTCAAGAAACATTTATTTACTGAAAAAGTAGCGCTCGGTGATTTGGAATAGAGTATAAAATAACAAAATAATGGAATCGTTGTTAAGACTATTGAACAGTTCGTTGCGAAATCCAAACATATCAACATCTACACTATCTAGAAGAGTTAATTCATATTTCATGAAACAGGGAATGGGTCGTTTTTTGTTAGACTTATGTACACCTTCAGTGCCGACAGATTTGTTAATTGATTAAAGAAAGATACGCAAACAAAAACAATATGATTGATAGCACTATATGACTTGATAAGAATCAATTTATGTGTACAAGATATGAAGCATAAAAAAAATTCTCCCAAGAGAACATTTCGTGTAATGGCTGTGCCGGAATATCGGTAAGGTCGTCTTAAACTACCGGGTTATTGAATTGATGCAATGACAATATTGCTCTTGCCTGGTATTCATCCCAGATCAAAAACCATTGTGTTTCTAGGATAAAATAAGAATTTACTTGATATCATAACATAGAAACTAAAATCACTAAATATCGAATGATTGGATTTGTAGGGTGGTTCATGGTGTGTTGGCATTCATAAAATAAGGTAAAAACCTGTCCAGAACTCCATGGCTTTTTCCTGGCAATAGCTTATTTGCTGTGCACCTAACTGCTCGATCTTCGTGCATCGTCTTGATTGTCTCCTAAGGGGAAGGAGAGTGAGTAAATTATTAATGAAGTTTCTTCTTTGCTTCGAACTGGTCTCTCATAGTAGGAAGATCAACCTCAGCAACTGCGGATGGCTCAAGGGTGATCAATTCAGGTTGAATTTTGTCCAGAAGTGCTTTCACTTCAGCCTCGCGGCGTTGGCTCTTTGTCTGGAATGGATTACTCTCAAGAGCATCAAAATTGGCTTCGGCACTCCCAGGAACAAGTAGAGATTGAAATCCTTTGGCTGTTGCGATGCCCAACACATCTT
>XM_023859745.2 PREDICTED: Cryptotermes secundus sodium/potassium/calcium exchanger 4 (LOC111868780), transcript variant X2, mRNA 
TCATCCCTTCCAAAAGTGAAGACACTAAACGGGTTTGACATTGAAGTTGAATTACGAGTTGTCACACCAACAATTTTAATTGTTTGGTTTTGTAATTACTACTGGTTTATGTTGAACGGTTAGATAGACTGCCTGCGCTCTATTATTTAAATTACATGTTGTTTATATATATATATTGTAAGCAATACACGATTACTCCATAAAGTACTTAAAATATCAGCTGATGTGTAAGTTTTAGATAAGGGCTGACTGTATTTACTTCGATTTTCTGATAGCACGTGTGAGTAGTTCTCATGTAGCATCAGGCCGAATAGGATCCCTGAAGGCCTTTCCTCTTGCTAGGCTGCCTATACCAGTTGCCACGATAACCTGCTTGTGTATATAAATAATTATTTCTTCCAGTCAGAGTATGTAGTGGCAAAGTACGTTTAGAGAAGTTGAACGCAGCAAATATAACTATCATTAAAGTTAAAGGAACGAGCTCTAAAGCAAGAAATCGTAACTACTACGTGAAACAGTTTTGTTACTTCTTCGTAAGTGTGATACTAATTTATTCATTTAGGATACGTCACTTTTTAAGTCTGAGTTTTTTTTTTTGTGAATGTTTTAATTTTCTAAAATAGTGACAGTCAGTTCAGTTCCATAAACAGTTTGACAGAATTGTAAGTTCAGAAACAGCATACAGTGTCCTGATGCCAACAAGAATGACAGAACTGAGGTTGATTATAATAGTTGTGTCCATAATTTTGACTGTACAATTTGTGTCAGTGAAATGTACGAATAATACAACCGCTGAAGATGACAGGTCCCATGTGCAAGATTGCATGAACAGTTCTGTCTCAGATTTCCCTGATGATTTGTTTGATTTCAAAGAGAGGAAAAATGGAGCAATCATCGTTCATTTCTTCTTAGCACTCTACTGTTTCACAATAATTGCAGTAGTTTGCAATGACTATTTTCTGCCATCTGTGGACTGCATCTGTACAGAGCTGAACCTTACACAGGATGTGGCTGGAGCAACTTTCATGGCAGTTGCTACATCATCACCAGAACTTTTTGTCAATATCATTGGAACTTTCATTACGGAATCAGATCTTGGAGTGGGGACAGTGGTGGGTTCAGCAGTGTTTAATACACTGGGGGTTGCAGCATGTATTGGTCTTGCAGCTTCTAAGACTATTATTCTTGAATGGTGGCCACTGACACGTGACTGTAGCCTCTACATTGTTACCATTGGAGTTCTGACTGCAGTGACTCTTGATGAGAAAGTAGAGTGGTATGAAGCTCTCATACTATTCCTTATGTATATTACATACTTCCTCATAATGTGGGGAAATGGACACCTTATGAAGTTGGCTAAGAAAATTGAAGTCAAAATTATTGGCAGTAAAACTGTTCTAAATGATCCAGAGAGCTCTACATCAGAGGTTTATTCAAATGTTGGCCCTGGAATATACCGCTGGTATCTTCATGGTGATTTTACTGTCAGTAACAAGATGACTTCAGATGATACAGAAAAATCTCCCAAAAAAGGAAGTCGTCTGATGTGCCCACCAGTAGGGGGCCTACTGGACAAAGTGTGGAATATATTCTTATGGCCAATTTCACTCTTGGTCTTCATCAGTATACCAGACTGTCGAAAAAATCACTTTCGCCATTTATATCCTCTCACATTCATTATGTGCATCGTATGGATAGCTACAGCATCATACTTGAATGCTTGGATGATGACAATTATAGGTAATACATTGGGAGTTCCTGATTCTGTCATGGGCCTTACTATGCTTGCAGCAGGTGGAAGTTTACCTGAAGCATTTTCATCTATCATCATGGCACGGAAGGGTGTGGGAGCCATGGGGATCAGTTCCTCTGTTGGAGCCAATACTCTCAACATTCTTCTCTGTCTTGGTACGCCTTGGTTTATCAAATGCATTGTACAAATCATCCAAACTGGTAATACAAACAGTAGTGCAGTCAACATCATTTCAGAAGGTGTCACCTACAATTGTTTTGCTCTCCTCTCCAGTGTCCTGCTACTTTATGTTGTCATAGCTGTTTTCAAATTCCATCTTGGAAAGCTTCTTGGATTCACATGTCTCGTCACATATTTCATTTTCATCACAGTTTCTGTTCTCATTGAAATGAATGTATTCTTTTATGTTAATAGGCCTTTATGTGCTGAAATATGAAAATAATTACTTTCACA
>XM_002627964.2 Blastomyces gilchristii SLH14081 U3 small nucleolar ribonucleoprotein IMP4 (BDBG_00918), partial mRNA 
ATGGTCCTTCAGTCAGCAGCCTTGCGTCCTTCAGCAACTAAACCACGGGTCAAAATGATTCGCCGTCAAGCTCGTGAACGGAGAGACTATCTCTACCGAAAAGCTCTCCTCCTCCGCGATGCTTCTATAGCAGAGAAGCGCGCGAAGCTGAAAGCTGCCCTTGCGTCAGGGAAACCGTTAGATCCCTCTGTGGCCAATGATAAAATATTGCGAGAAGATTTCAAATACGATGAATCCTTACCCACATCCTCGAAACCGGGAGACCCTAACTCCAAAGATTCTGACATGCTTGACCTCGATGACGAGTATGCTCTCACATCCGGCATCGTTGACCCTCGACCCCTCATTACAACGTCCCGTTCTCCCTCTGCGCGCCTTAGTACTTTCGCCAAAGAGATGCGTTTACTCATCCCAACTTCGATTCGGATAAATCGGGGAAATCTAGTCATTCCTGATCTTCTAGCAAGCGCCAAGGCGTCCGCACTCTCTGATATGATCCTGCTACACGAGCATCGCGGTACACCCACTGCGATAACCGTGTCTCACCTCCCCTATGGCCCAACGGCCAGTTTCTCGCTACATAATGTCATGCTACGAGCAGATATTCCGAACTCTGCACGAGGAACCGTCTCGGAAAGCTATCCTCACCTAATATTTGAAGGGTTTACCACCAAGCTGGGTGCTCGTGTCGTCCAAATCCTAAAACATATTTTCCCGCCGCGGGAAGCAAATGGGAAGCTCGGGAGTAGGGTTGTCACCTTTAAAAATATAGAAGACAGTATAGAAGTGCGACATCATGTATTCGTTAAGACTGGATACCAATCAGTTGAACTAGCTGAAGTCGGGCCGCGGATGACGATGAGACTATTCCAAATCCGAGGAGGAACGTTGGAGAAGGACTCCGGAGGCGAGGTTGAATGGGCACTCAGTCAATATACCAGGACGAGTAGGAAGAAGGACTATTTGTGA
>XM_031798635.1 PREDICTED: Oncorhynchus kisutch protein FAM180A-like (LOC109879465), transcript variant X1, mRNA 
CAGACAGAGAGAGAGGGGGGAGGCAGAGATAGGGAAGGGGAGGAGAGAGAAACAGACAGACAGAGTGGTGGAGAGGAAAGGATGAAGCAGTTGCATGTGAAGTGGTTTAGCAGTGCTCCAGTCAGCGTTCTTACCTCATTCTCCTGAGGGTTGTTTGTACACAGCTCTCTCCAGCTGGGGCCTGGCCGGTGACTGATCCACATTCAGATCCCATTGAGACAGACAGACGACAGGGCAGTGTCAGTGTGTGTGCGCTGGGCCGAGAGTCAGCATGATGCATCGGTGGGGTCTACTCATCACTGTGTTCTACTGCCAGCTGTTCCTGGCTGCTGCTCAACACTGGAGGAAAGCCCTTTACCCATCAGCCTTTAGAGTGAAGCGTGGCACACACTCATTGGTCAACCCCACCTTCCAGAACTCTGTGGAAGATGTTAACCTGCTGTTTGAGATCCTGCTGGCAGGCCTGCAGATCGAGGGTGAGGACAAGCCCTTCGTGATCCCAGACAAGGAGCTGGCGTCTCTGAGGAGGGTCCAAAAGCTGGAGGTTATCTGTGAGGACGTCCTGCCCAAGAGACTATCCGAGATCAGACGTCTGACCTCCCACCTGTCCCAGCGCAGAGGTGCCCTAAGCAGGGAGGAATTTGAGCGCACAGTGCTCACTATGGTGTACACTGCCCAGACTCTGGCTCATACCACCTCCCAACACCAGAAGGCGCTGTGGGGAGACGCCCTACTGCAGCTGTTCAGGGCCATTCAAGAAGATCTGACGCCCCTACCCAGAACACCTCAGCACAACTAGTGTTATGGACACGTGGACACATTTTTTTAGATACTGTAATATACTGAACATTTTATACTGTAACACAAGTCACTTTTTGGCAGAAAATTTAAAGGATGTTTTCTATTGAGTTGTATTGTATAATCAAAATGACTGTTCTAATAATGTAATGTGTTTGGTTATGATCAAATGATGATATGATCTAATCATATTGAAAGGAGGATGTGGGAAAAGGAGGGATGTGAACAATATCCTGTTCATGTTCTATCTATCGGATTCCGCCTTGTTCCAAGACTTCAGATGTAAACAAACAAATATTTTATCAGTCACTCTGTCATGATTCATTACAGGTCTTTATCAAATCTTCTGTCATAATCTTCTCAGCTGTTTATCACAATTACATAATCTTTTCCCAGCACAGTCCTGTTGCGAAAAGGTGCTTCATGAAAAAAAGAGTCCCATGAGGTGCAGAAATATTGTATTGAACTGTAACATTGAAGACAGGGGTATCAATTTGCTCAGCTTATTTCTCTGCAATTGATATTATAATAAAATAATGATCAATATATATATATATATATATATAGGTTATGGCCATGTTATGAACCAAGCTAAACACTGAAGAAGATGGTTCAGCTGAAAAGTATGTGTATGCTATCCTGATGCAGTAAAAACATGATTTATATATAATGAAGTAAGCTTTATGCAGCATCTTTTAGACTGCAGACCCATTACAATTTTTTGAGGGCTTATCTGGATTCACAGGTTTTACGCACCAACAATACTTTTTGGAGAGCACTATGGTCCTCTTTTGATATGGCCTTGTTATGATTATGTGCAAATGATTGATATGACTTGAGGATGTTCATTCACATTTGCAAAAACGTGGGTAGGGTTTTGCCTCAGTCCCAAACTGTTTTCATTTTGGAATTAGAGGATTTTAGCTGCTCTAGCCTGCAGGGAGGATGTCAGACTAGATGTGAGACATGGGGCCTCAGGCTTTCTACACATCCCCCAGGTCTACACATTCCCCAGCTCTTCAATGGCTACAAAGAAAGACGAGTGCCTAATGTGTGTCCTGTTGGCGACATAGTCCACCGCTGCTAGAACAGACTTTCCATTGACATACTGTTGCCTACAATGTTTCTCCCTCATCTACAGATGACAGGTTCAGGGTGGCGGCCATTTTGCATGGAAAACTCCTCTCCTTCTCTGTGTCCAGTTGCTATTGTTTCCGGATGGTGATAGAACTGGTCTAGCTCTCCTGGTGGTCACACATCAAGGCACGGGTGAGTCCATGCCCCATGCTCCCGGTAGAGCCCACTAGAGCCCTCATTGATGAGGAACTGCAGATTGTGGTGAAGAACGTTTTTCCCCAAAAAAGAAGATCACCCTTCGTTCACCCTTCGTTCCTGGGAGGCGTTCGGCCATTATGCCAGTGATAAAACGGGGATGGTCAAAGAGTCCAATGGGCTTACTGTGGATCATGAGGCCTGTGTATGGCAGTGAAACATGACCCAGGTTGAGGAAGAAGGATATCCGTACTCCACTGCTGGTTCAGATCTCTGTGTACAGTGGCCACATCAGCCAGGACTACAGTGAGCAGGCTGCTGTAGCCTGTACAGTCGTAGAGCGCTGGTGTTTGGCCCCCGTAGTCCAAAAGATAGACATCTACAAGAACGGAATCCAGGGAACCCTTTTTATACCAGCAGGTCCTGGACCTTTCCCTGCTGAGCTGGAGCTATCTGGGGGAGGAGGGGGTCTGTTTGAGCATCGCTCCTACCTGTTAGCATCCCAAAGCTACGTCTCCTTAGTGCTGCAGTACCCCACGGACGTCTCTACAATGGTTGCCATAGGATGCAAGTACTTTGAGGAATTTGCACAGTTCATTGTGGAAACAGATGCAAGAGGCCTGAAGTGTGTGTGCTCTGGAGTTTGTTGTGAACCTGCCGCCCCTACTTCAGACAGCCTTCACTATGCTGAGACCATCCTCAGGTGGCCAGTGATAGAGGCTATGTTTGGCTTCTCACTGGGATTCCTTATCCCTGACCGTTTACACTGATGTCATTAACATGATTATTCCACACCTTCCTCTTTGAAATTGACTTGTTTGATTGATAACCAGTTAATTAGTGAACGCAAATACTGTAAACAATTATTTTACAGGTGCTCTGTAGGCACACCTCTCTCCTATTTCCCAACATATTTGTTGATAATCCCCCTCTCTTCCAGCCCAGATGTATGGTGAGTATACGTGGCAGCCATGTTTTCCCTTTCAGATTGTCGCTTGTGTCAATAGCTGACAGGTACAACACGTGAGTGTGTTTTAACCTATTCTAAAGCAATGGGAAATGACCTCATTTGGAATGCACTGAAATTATAGTTGTATTTTGCTCAAATTTCTAGAAATATGCACTTTGATGAGAACAATCATTTGATCTGGAGAGACACAATCCAGCCCATCACTGAGAGTGGCCCTAAAGTAGAGGTGATGGTATCTTTCAGACTGCATTGTATGCACACTATACTGTATGTATTTGTACAGTGAGGAACTGACATGTGTGTGAACCTATTTTTTGGCACCATAGGTCAGGAGGTTAAAGTGTCCATTACTGATGGTCATTGGAGAAGCTTACCAGAACTGTGCCACTACAGAATCTGTCCAGGATATGCGCAGTACAGTATGTTGGAGAGGGCAGGGAACCTGTGTCTTACCCTGGGGCTGGTCACCTAATCAAACCTTTCTACACTCCTCACTTCCGCTCCAGCACCTCCAGGGGCAAAGTGATCATGTTGTGGGGAGGGGAGTCCAAATGGAGGAGGATCCTGGAGTTCCTTCAGAAGAACCTGTACCAAAGACAGGACCCCTCTGTCCCCTCAGAGCTGTCAGATCCTCCTGGACTATCTCCATTATTATAGTCATCGCTTCTCCAGCTTCATTATCTGTCAGGGCCCTATTCTTGAAATTAAGTAGAGACAATATTGGTTGGATTTTTTTTTACTCACCAGGTGGCAGCATTGCACAGTCTCTTAAATGACTGGTCTGCTGCTTGTAGTTGTCATAGTAGTCAATGTCCTGACAATTACAAGGAGGAAGAAGAGGAGATGGTCGACATCGGCCTTTCATCAAAGTCCTTATAGGGAAGCCTTTCTGTTTAAAGACCATGGATCAGACCTTGGCTGCTCGGTCACGGTTGAGTTGCGGTCTTCTAGCCAACCTGGTTTGGATTCCAAACTCCTGTGAGGTGACATGAAGTGTTATTGATCTCAGAGTTGAAGAGAATGAACACCGCTGCCTTTAACTCTCATCAACTGCATACTTTTTTCTTTTTTACATGTCACCCATATATTCTCACTCCAGATTCCATTCTGGCAAAGGGGACCGATGGCCTAAACATCTCCATGTGTTGCACATATATTAAACCAATAGCCTGGTCTGGA
>XM_017410869.3 PREDICTED: Kryptolebias marmoratus Yip1 domain family, member 1 (yipf1), mRNA 
GAAAATATACAGAAACAGGAACGTGGCTTGTTTACATGCTGTCACTTCCTGCTCAAAGCTAACGTAGCTAACTGCAATTATTATAGGTTTTCTCGAAGAATTTGAGCTTGAACTGTTCCCTTTATTTGGCATTAAATTGCCTGCAAGTTTCCTAAAGATCAGTAACATTGTCGTGAGAGTGAATGGCGTCAAACAATGATCCATTTCAGTTTCAAGAATTTGAAGAAGCTGAAAATCTTTTGGAGACCAACAGAGATGCAGTCACCGTAAGCATTGAGGAAGAAGATCAGAAGTCCAAGAGCCAAAGATCTGCTGGTGGCTTTTCTCCAGATTTCACTGATGAGGATCCACTCCGCACCGATGACAAGGCAGAGCTTCTTGGTGGCCAAAAGAAAAGTGCCCCTTTCTGGACGTTTGAATACTACCAAACATTCTTTGATGTTGAGACACACCATGTAAAAGAGAGGATCATCGGGTCGATGCTGCCATGGCCTGGAAAGAACTTCATTCAAGTTTACCTTCGTAAAAATCCTGATCTTTATGGACCATTTTGGATTTGCACCACTCTTGTGTTTGCCATTGCCATCAGTGGAAACTTATCCAGATTCCTCCAGTACTCTGGCAGTTCAAACTACAAATATACCCCAGAGTTTGGAAAAGTGACCATAGCTGCTACAGTAATCTTCAGCTATGCCTGGCTCGTGCCTCTTGGCCTTTGGGGGTTCCTGCTGTGGAGAAACAATAAGATTTTGAACCTGGTCTCATATTCCTTCATGGAAATCGTCTGTGTGTACGGATATTCTCTGTCAATTTACATACCAGCTGTGGTCCTGTGTATTATCTCATACGAGTGGCTCAGGTGGTGCTCCATCGTGGTGGCCCTCTGCCTCTCTGGCTCAGTCTTGGTGATGACTTTCTGGCCCGCGCTCAGAGACGACCACCCCAGAGTCGTCATGGCTGTCGTTTCAGCCATCGTGTTGCTCAATGTGCTGCTGGCTGTTGGTTGCAAGACCTACTTCTTCAGCAGTCCAGAGATTGACTCACAAGTAAAAAGTTCTCCTAAAACAGAGGTTGTCAAACCAACGTCATCGACATGAACGCCTCCTGTTTGAAGCTTCTCCTGTTGCCTTATTGGAGAGAATCGGGTTCCTGTACCAATGAAGTCATGGGCTGACTGGATTTCACCGCACTTGGACATTCCAGCTCGATGCCTCTGAAAAGCCAAGACTGTAAACTTGGTGCGGCAGCATGACGATGAAAATGAAAACTGGTTGCAAGTATGTTACTTCTAACGGGATGGGTTCTAAACAAACTTAAAGTTAATTGGGGTATAGTATTACACAACGCACAATATCTGTTGTGGTGTTGTAGTTTTCAGCTTTCTGTCGCTCATGTAAAATGTTTGGAAAAAAACAACTTTGTGCAATAATAATAGCAGCACCAATGCTTTTTATATGCACATTTGTTTTGCAGTATATTTCTTTAATAGGTAATGGTAAGTCGATTTTATTTACAAACTTAATGTATGATCAATTATAGGCATTGGTAAGAATTTCCAGGATTATTTATCAAGCACCCTGTAAAGGTGATGTGGTGGTATTTTCTTATAGTTAAGTTGCCTCAACTAATGCCAAGAGCTGGTTTAAATAATTTTTCGAATGACTTTGTAAATATTTCATAAATAATTTGTTGTCATTATAACAAACATCTTTAAATAAAGTCTACTGAATTTCATCTCTA
>XM_007381610.1 Punctularia strigosozonata HHB-11173 SS5 hypothetical protein (PUNSTDRAFT_132265), partial mRNA 
ATGGCTGACGACTCGAAATCGGAGCCTTGCCACTGCATCGAAAAACCCAGACAACGTGGACCTGATGGACGTAAGCTCGGCTTGGATCAGATGATCTTGCTGATGGATCCATGCTTGGGGGCGCACTGGCAAGCAATCAAGGACCGCATTCGCAAGCTGGCGTTCGAAAGGTTGGCTATCGGCCGCGTTTACAATGACCAGCCGTCATTTGCCCATTCGTTATTGGTCTGCCAGGTTGCCGACCAATGGCAATTCCTGTGGGACTACGTGGACCTCTGGCCGCTTCGTCTATACCTTCGGTTTCTTCTCTCTGCGTACGCGGATCCTGATACGCCTACCGGCATCGCCTTGAGGCTCAGGAAAAGTCTTGACGATCATTCTGTGAAGCATGAGACTGCCTCTGCATCTACTGCCTCCACACAAAGTATCAACGATGATGATACTCTTGAGTGGGATGACCCGGAAGAACAACTTAACGATACAACTACACGAACCTCTTCGTAA
>XM_032672596.1 PREDICTED: Danaus plexippus plexippus SAP30-binding protein (LOC116778559), mRNA 
GTGCAGCGATACATAGTTTCACAGTTGTTGTATTTACACCAAAAACATTAAACAAGAATAACCTTAAATAAGTTATTCTTGTGAGTGAAACATTACAAAAACTGTGCTAGAAAAGTGTAATTTATTCTTATAGTGCGTAAAATAAGCAACATGACTTCGCAAGCGTTAGCCACATTGACCGCGACGTACACAGACTCCGAAGGTGAGGAGGAAATGGAAGATGGAGATCCTACACCTGAGAAATCGGTCACTCATCACACACAGTCAGCTCCAACCAGTCCCAAGAACATCGACGACACCAAACAATCTGCTTCCGCACCAGTTTCTCCAAAACGAAGTTTGGTCTCGTACGTAGACGACACTATCGTATCCGATGACGAACAATTGTCTCCTAACGCGGAAACTCAGGACGATATGAGAAGATTATCGATGGAAACCGACACAGATGAAGCTGTCCCACGATCAGATCCCGACGACTCAGAGGATAGTGTCCTTATACCTCCGGAACCAACAGCCAAATGTCCCAAGGAATTACAAGACAAAATAACAAAATTCTACACAAGAATGGTCAACGAAGGTTACGACATGAACAAAATAATTCAGGATAAAAAGAATTTCAGAAATCCAAGCATATACGAGAAGTTGATACAATTCTGCGACATCAACGAGCTAGACACGAACTACCCACCAGAAATATACGATCCTCTAAAATGGGGCAAGGAATCCTACTACGATGAGCTCGCTAAAGTCCAAAAACTAGAGATGGAGAAACGGGAAAAGGATCGCAAAGAGAAGTCCAAAATAGATTTCATCACCGGAGTGGCAAAGAAGTCGGACAGCGACGATGACAAGAAACGGAAGTCCAAGTGGGACCAAGCGGCGCCCAACGTAGCCAACAAACCCAGCATCAAACAACCGGGGCTCCTCCAGCAACCGCTGACGAGCAACGTCACCGGCACCAAGGGCACTGTGATATCAGCATTCGGTTCCATTGCCAAGAAGCCAAAACTATGAGTTACAGCACAGACGGACATGTTAGTGATGCAAAGAACGACAACAATATAAAGTGTACAATATTAGTTGCAGACATTTTAATACAAAGTTTTGGCTTTTTATAAGTTGTTAAGACTGGTAGATAGTGTATGACAAAGTTAGACTAAAGCATCCATATCATCCTCAACGTGCTCCTCTCCGAACTCTCCCACACTTATGTATATATTAAAACCGTTAAATAATTCTTGTAAAATAAATTATTTGC
>XM_030796770.1 PREDICTED: Nomascus leucogenys intraflagellar transport 22 (IFT22), transcript variant X3, mRNA 
CAGGCCAACCCTGCAGAACCGCGTCTGCAGCCCGGGCTTTGTGGCTTCTCTCCGACCCCCTCCCAGTAGCAAACGCGCCCGCTTTCCGCCCTGCGCGCCGGAAGTGGCCGAGTCCCGTCGGCCCCTGCGGGCCGCTCGCCGTCGCCATGGAAACGAAAGTGGCCAAGTAGCGCTCCGCCCTGACACGCTGGCTCTGGTGGGCTGCGGCCGGCTACGCCGCGGCGGACAACGATGCTGAAGGCCAAGATCCTCTTCGTGGGGCCTTGCGAGGATCCTAGAATTTGAGAACCCGCACGTTACCAGCAACAACAAAGGCACGAGCTGTGAATTCGAGCTGTGGGACTGTGGTGGCGATGCTAAGTTCGAGTCCTGCTGGCCGGCCCTGATGAAGGATGCTCATGGAGTGGTGATCGTCTTCAATGCTGACATCCCAAGCCACCAGAAGGAAATGGAGATGTGGTATTCCTGCTTTGTCCAACAGCAGTCCTTACAGGACACACAGTGTATGCTAATTGCACACCACAAACCAGGCTCTGGAGATGACAAAGGAAGCCTGTCTTTGTTGCCACCCTTGAACAAGCTGAAGCTGGTGCACTCGAACCTGGAAGATGACCCTGAGGAGATCCGGATGGAATTCATAAAGTATTTAAAAAGCATAATCAACTCCATGTCTGAGAGCAGAGACAGGGAGGAGATGTCAATTATGACCTAGACAGCCTTCACGTGGGACTGCCACAGCCCCAGTGAAATCAGCATGTTTCTCAGTGCAGATCTGAAATCACATCCAGCTCCTGATGTTTTCTTCTCCCTGTGACTGCAGAGGAAGTGTTCCTACGTGCAGGAAGGCACCTGTCACACAGGGCGTTCACTCAGACCATCTGTGCTCTGTCCTGAGTTCAGCTGAGAAAATCCGATTATCGAATTTGGATTTCCTGGCCCCAGAACTTCCCAAAGACCTGTAAAATGGAGGGATTTACCACCTCACATATGTCCAGTTATACAATTTGTGGAGTTGTAACTGTTGCAGCCCAATGATACAACAGTAGTTTAATCCTGTGTATTGGCTTGAATGTGATTTTCATTCCTTGATTCACCCAACGAATACCGACTGGCTGAGCACCTGCTGTGTGTGCACTGCTGTTCTAGCTGCTGACCGTAGACAGCATAAATGAAAAAGACAGAA
>XM_046808004.1 PREDICTED: Homalodisca vitripennis neuropeptide F receptor-like (LOC124356796), mRNA 
CTACAAGTTGCGCGTCCCGCTCCACCTTCCCGCAGTCGTCCCGCACCCACATCGCGCGTGAACTTTATACTGCTGGAGTATGTGATGTTGTGTATGTGCTGACGTGTCGATCAAACATACTGTGTCCTGAATTGAATGCCTCAAGTTGGTAAAGTATATTCTGAACGCACTAAACCTTCTCGACTCCAGAGTGACGGTGAAACTCCTACGTGGCCGTACAATCTGATGACGCCCTCTGTACATGAGCTGTCCCATGTTCGAATCATGTCTGATGATGGAACTGAACGCCTCAGGCACATTTAACTTCAGCATCCACGAGGCGTTCCAGATCCTGCAAGAACACAAGAGTCGTGACCGCAATGTTGACGGACTTACGGAGGTGATCCTGATCTGCATCTACGGGTTCCTGATGGTATCCGGACTGTCAGCCAACCTGATTGTCAGTTTCGTGGTGGCGCGTCGACCGCAGATGCACACACCGAGGAATCTCTACATCGTGAATTTGACTGTCTCGGATATGACTTTGTGCCTCATCTGCATGCCTTTCACCTTGGTCTCCATCTTGAGCCGCCAGTGGACTCTTGGACTCGCATTGTGCAAGCTGGTGCCGGTCATTCAGGGCACCAACATCATGGTCTCCGTTGGCACCATTACCGTCATAGCCTTGGACAGGTACTTGACGATAGTGCGTGGACAAGAAGGTACCAACAGTAGACGACGGGTAATCACATCCATAGTGATGGTTTGGTTGGTGTCAGCACTAGCCACCCTCCCTGTTGCCTTTTATCAGGTGGTGGAGCCTCTGATGTTCCACCGGGTGGTGCTGTACGAGACGTGTCTGGAGCGATGGCCCTCTCAGCAACTAAAGATATCGTACGCTGCAGCTGTGCTGCTCGTACAGGCCGTCATCCCAGCCCTCGTAGTGTGCGTGGTGCACGCGCGGATTGCATCCTACCTGCACGCACACGCACGCACACAGAAGGATAGGCGGAGAGCCCTGCGGGAAATAAAGAGGAACCGAAGAACTACGCTTCTCCTCTCAGGTGTTGCGATCTTGTTCGCCCTGAGCTGGCTGCCTCTAGGTATCTTCTCTCTGACGGCCGACGTCCTCTACTCAGAGGAGTCCTTCAGCCGTGTGTCCTCACAGGACCTGTACGTGACCTTGGCCGTATGTCACGTGACCGCCATGACCTCCGCTGTGTCCAACCCCGTGGTGTACGGCTGGCTGAACTCCAACATACGCCAGGAGTTGCTGCAGCTGCTGCCCTCGAAGTGTGCCACTGTGTCCGGGATAGAGGAAGCCACCACCAAGACCGCTCTGCCAACCACCACCCACCGGCGGGAAAGTTTCACCATCCTGCTGCAGAACGGGGACCGGCCAGTGCTCACTCAATCGCCCCACACATTGGTCACTGTCTTATAACGGTCCGTGAGGTCCTCATCGCGACTCTGAGATACATCTTCTAAACACCATTCTCTAGATAAACACTATTTTATGTGACAAGGTATGAATGCAATGGGTAGAAAATTGTAAAACAATTACATATCACATAGTAAGACGGATAAATTCCTGGTTTAAATAATATAAGTTTCTTGACCCGTTCCTTACTTCCTAAAATTGTTTACCAGGATTACGATTGTAGATTGTCAATACAATAAATATCCAATTTTTTATACTAAACTCTCGAACACATAGCCTCTAATCGCCCTCAGTATATAAAGCTTCTGGCTTTGGAGATGAGGTCAGTCTTTCTGTCAATAAAAATAAAATTCATAAAACATGGTTTACTAATATTATTATATTCAATTTTATAATGAAAGGAATTTTTCATCGCAACATATATAACTTTTCAAATAAGCTAGATCTAAGTAGAGATACTTTCACACTTTCTGTTTATGGTGGTGTTGACAAACACATGATGAGCGAGTGCCAAGAGAAGATAGGTAACTACTGTCTGTGTTATGTTTGCTTTGCTTAGTGTCAACCTTGACGTATGCTGCATAAATATCTCTTGTGACAGATACCATATAACTAGTTTTAGAAAAGTCTATTTAAACGATTTAATTTTGTAGTAAGAAATGAATTGTTGAAATTATTTGTTGTTTTGATTGGTTTTAAAAATACAAATTGACAAAAATTATTCAAAACCTTGAAGATTTATAATGCTTGTAATATTTATGATCCGGTTTTATTTAATTTGAAAAGTAAGACACCTGTATTGTTTGGTTTTTCGAGAACATACTTAAAGTCCGTTCCTAACGATAAATATTTAAATTCTTGCTCAAACACATTTACAACAGAATTTTGAAGTTCAACTGACTCACATTCAAATGTTATTCCACCCCAAGTACTACGTTATCATAGACATGATACGCGCTTCTTTCCTTATAGAAGTATTGAAAAAAGAGTTTGTTTGGAAGAGTAACATAAACTTTCAAATATAAGTAAGAGTAAAGAGTAGCATGGACATAACTTGATGCTAGATTTACTTGGCGTATTTATAATAAATACGTATAAAGACATAACATCATGATCAGTATCAGTAAGTTCAGCTCTTTGTTTACTTTACTATAATTTTACAAGTATGGGTATGCCACAACACGTGTTGCATAACAAGCTTGACTGAGGTTGTGTGCAAAACTAAGTTTATAACACATGTTCTTCTGGTAGTTATAAAATACGTTAAAATTTATTATGATTTGATCCATTTTGTTTACAAGTTGATTTAGTCTTTGATTTTCTCGTTACTATCACGGTGAGACATAAAACCAATGTATAAGTAATTTTAGTAAGTACCGCTGTGGATTGAAATGCAGCCTCCTTAAAATCGATGTTGCATTTATAAAAATGAAGCTGCTTGCAAAATTCCAAGTTTATAGATTAATTCGTTTTTGAGGCATCGTGCGGACAGAAGGGCCTACATAGATGAAATTTTTCCAGTCCCTCGAGGGATGGTCTTCTCTAACGCTCAGCCATCAACGGACGATTGAAAATATGTATAGACAAACTTGTACGTACGAAAGGACAAAATACTTAAACACACACAAAATCTGTGATTGGATCTACGAGTTAAGAGTATCGAGAGTTATCGAGAACGATGAAACATATCAACACGAATGAGAGAGAACGATGAAATGTATCGATTTGTGGCACATCACGAACATCTCTCTGTATGCTGCAGTACCAAAGTGGGCGTCGAGTTTACTTATCGGTTTGGCAAAATCGTTTAGTTTAGTCAACAACGATGTATTTTCGTAGACTCTGATCACCCACCAAACCGTTCATAGGTTACAAACTGGATGTGATATTTAAAACCTTTTTAAATCTCTTAATATAAACCACTACCGAATTGGGTCACATTATTGGTGCTCAAATATGATTCCTTTGAACTGTGACTATAAAGTAAATGTGGGCGTAGTAGGTGGTTACATATTAGGGCGGTTCTATAGTATTTGTTTTATAAAGCCAGCATTAATACAATTATTTTTTTAGTCTCAGAGATAAAAACTGTAATACATTTTAAAAGTTTTTTCTTATTCCATATATTCCGAAAGTAGCATAAAAATTATATTTAACTACATACCATTGTATAACTATTTAAAGTTCTACTTTCATTACCATTGAGATTTGAAGATGCAACTATATGATCTTACTTAAAATGTGGCAAAATGTGTTATATGACAAGTAAGTATTATTTCATTATTTGTTTATCATTTCAAAAAACGAATGGTCGTTATCTTGTATCGTTTTCTTCAATCGCCTATCGAGCTGGAATCGCCTATCTTACCAGAATTACTATACAGCCGCTTTTATACCTTGAGGGGCATAAATGTTTAGTGCTGTGAGACAAGGGTCAATAAAAGATAATAGCGATATCGTGTTCCTTTTAAGTTCAGTATCATTAAGTAGTTCTTTCGCTAAAAATATCACAATCTGCTCTATCTAGCTTAAATTAAGGAATTAAAAAAATAATTCAGGATAATGCAATAGTATAGTTTTCTTTGTAATAGAATCAAATAATTCGTATAATGACGTCAAAAATAAACAGTTTGGATTCCTGTGATTAAAATTAAATTCTAGTTTTTTCGGTTAAATAATTTCAAAATGTTATTTTTATTTACAGTGGCATTATTTAAAAAAGTATAATTGGTAAAATTCATAATGTAATTTAATAAACAAATTGTATAATGTGTTAATTACTAGTATTAACAATTCGGAGTTTAATAAAGAAAGACTGTTTTAAAGAATAATTGTAAACTTTTTCAAGAAATATTCGTAATACATTTTATTTACATAGTTTCTCGTAGTTCTAGAGTAATATAAATTTTATCCGATGACATCTTAGAGTGGAATTCAGGACTTGGTACGCTACATAAGTTAACAGAGATTGTTACGGATAACTCCTACAGGTGAAATGTAAATGTCACTACCCACTTCTCAAGCAACACCTCTTTGCATCTCATTACTTCTCCGTACACATCTATTTTCGTATGGAATATTAGTATTTTCTGAATAATATTTTCCTGTTCTAATATTCGCTCTTGTTGTTGGCGTGACAGTGCACCCAACCACATTTAAAATTTGATATTTTTATATGTACATTTTATGACTGTACCACTACTTGAGTGTATTGTTAATATGATAAATTAATATAACAATTATAACTTAATATAATGTGCGTATTTATCTTGTAATTTGTTGTAAATACTAAACAACATAAGTGTAATTTAGTTTTAGTGTTGTTCTATGGTTCCTATACAGATTGATTACAAATTGTAACTAACATAATTGTCAAAGGTAAATTATTTCACAGGATAAATGTTTTTTTTACAATGGGTTCGCCAATATAATACTTGTAACGTGAAGCTCTTTTTTACTAATGCTAGCTGTAATCTCATATATTTACATCACAAATTGTATATATATTTAAATATATATATATATATATATATATATATATATATATATATATATAATATATTTTAAATATATGAACATTAATGTAAAATTAGATACAATATAAGTAATACAAAAGATACTTTAACGTATATTTTACAACACATTTTTTAAATAATAACAAACAAAATGAATAAGTCTAGATAGGTTTCCTAAAGGATTTTAACTGGTATCTCATGAATACTGGAACTATTACTACAGACAAAAATTGAAAAACTGTCATATATATACAATTTCACTTATTTGTTAATTTGAAATTATTGCTTGCAAATGTCAGAAATTGTATCTAAAACCATTTATATAAATTGCCAAAATAACAAAACGTTTCTATCATTATAACATAATTTTCTCTTTAAATTGGCAATTATTGAACAGCAACGCCACCTGCTTTTTTGTGATGAATACCAATTGGAATTTACAATTTTAAATTATTGATACAATTTCCCAGTATCTTGTAAATCTTAAAATTCCTTAAGGAAAACTCAATGTTTTCTTTTAATGTTGATTGTAGTATAAGATGATTTTATAATTTATAAACTTTTATTTACTCACTCGCTTAAGAGCTATAGCATATTAATGCTTTAAAAATTGCATATTTTTCCAGATGTAAGCACTATTGTGTAATTAATTTCAAATGAAGCAATAAGGAACACTGCTTTTAGTGAATTAGTAGTGTTGAACGAAAAAAATACACAGCATGACATGCGTATGGTGGATATGAGTATAAATATTAAAAATACAATAAAAATGTGCAATTGTTCGTCGTCTATGACGATAATCAATTATCCTTGGTGTTCCACTAATTTTGGCGATGTATTGATTACACTAAAGTTTTATAACTGATCTTGGCATCATACAGTGATTTAAATTAAGGTGTTAAAATTAGTGAATTTAATTAATAGTTTCTTCCATCGCATATATGCAAAATGTTTTACTCATAATACCAATAAAAAGTGTATTTATTTTTTTAAACTAGTATTGAAGGATCTAATTTAAATAATATATCAATTGAAAATAATTTTATTACGTATGGGGGGCTTCACGCTTTACATGTGTACGTTACCTATGTTTCTTGTGTTGTTTATGGTGATCTATGAATAACCACAACTATTGAGTTATAGCAATCCAAATGTTTGTACACGTGCTGTTGTGAGTAGTGAGCCCAACTCCAACACATGATTACAAACATGATCATGTATACATCAACATTATGCAGCCTCTGTGATTTGTTTGTACGCTTATTGATTAAACTATACCTTTGACACAA
>XM_021555190.2 PREDICTED: Lonchura striata domestica interferon regulatory factor 7 (IRF7), mRNA 
ATAAAGGATCGGGAAGGAGACGGCCGCCCCCGCGCCAAGGGACGGCACGGCACGGCACGGCACGGCACGGCACGGCACGGCACGGCACGGCACGGCGCGGCGGCTCTGCGGACCGGCACCATGGCAGCACCGGAGAAGGAGGGGGAAGCGCAGAGGCTGCGGTTCGGACAGTGGCTGCTGGACGCCATCAACAGCGGGAGCTACCGGGGGCTGCGCTGGATGGACGCTGCCCACACCACCTTCCGCGTCCCCTGGAAGCACAACGCCAGGAAGGACATCACCAGCACTGACCTGGAGGTCTTCAAGGCCTGGGCAAAGGTCAGTGGGCGGTACGAGGAAGGCTCCGAGGATCCAGCCAAGTGGAAGACCAACTTCCGCTGTGCCCTGAGCAGCACCCACTTGTTCAAGCTGGAACAGGACCATTCCAAGCGTGGTGATGACCCCCACAAGGTTTTCTCCATTGTCTCAGCCACCCTCCAGGACAGCAAGGAGGGACATTCCTGCATCCCCAACCCTGTGGTGGACCAGCAGGCAGCACAACAGCAGCTGCAGCCGGAGATCCACCCCCAAGACATGGCCTCAGCCATTGCTGTCCCAGGAAACACCGACCCCACAGAGCTTCTGGAGCAGCTGCTGCAGCAGTGTGACATCTCTCCCAGCGACCTTGACTCGCTGGCCCCATCCTGGGTGCCTGCAGGTGGTTTCCCTGCCAGAGACACTCCCCACCAGGACATCGTACAACAGCCTCACCAGGACACCCTGCTCCAGCCTCACCAGGACACCCTGCTCCAGCCTTACTCAGACACCAGCCAAAACAGCTGCTTCCCTCCCACATTTCCACAATGGGTGCCCTCGGTGGAGCAGCCCACCTTGGGCACCTACCAACCAATCGGCCTCATGCCACCAGAGGAGACAGGGGCCATGCCACCGCCGTGCCAGCTGACGGAGGGCACGGTCCCCATGCAGTATGTGCCGGGTCGGACGTTGTTCGTGCCCGCCGCCAGCCCCGTGCCACAGCCACGGCTGCTGCTGGATCACACAGATGGCATTGTCTCCATCCTGGATGTCACCATCTACTACCGGGGGAAGGAGTTCCACCACGAGGTGGTTGGGGGCAGCCACTGCCTGCTGACGTACCAGCGCCCCAGCCTGCCGGGGGCCCCGTGCCCCGGGCACGTGGTGAGCTTCCCCAGCCCCGCCAGCCTGGCCGACGGCAAGCAGCGGCGCATCACCGAGGATCTGCTGGGCATCGCGAGGCTGCGGCTGGAGCAACGCGCCTACAAGGTCTTTGCCACCCGCCAGGAGAAGTGCAAGGTGTTCTGGGCCTTGTCCCAGCAGCTCGAGGGGGTTGAGGAGCCCCCATCCAACCTGCTCTGCCGAGACCAGGAAACACCCATCTTTGACTTCCATGAGTTTTGCACAGAGCTGAGGGACTTCCGCAACGGCCAAAGGCGGCGATCTCCCGACTTCACCATCTATCTCTGCTTTGGGCAGGCCTTCTCCAAGGCCAAGCCTAAGGAGTCCAAGCTCATCTTGGTGAAGCTGGTGCCCAAGTTCTGTGAGTACTACTACGAGCAGGTGCTGCAGGAGGGAGCCTCCTCCCTGGACAGCCGCACCATCAGCCTGCAGCTCTCCAACTCCTTCGACCTCATGGAGCTCATTGAGCAGTACAACATGCAGCTGGGCTGAGCCCACCTGCCCCGCTCCCCATGGCCCTGGCACAGGCAGCAGCACCAGTGGGCATCCAGGCTCTGCAAACCAGCACCCCCCAACCCAAGGACAACTTCAGTGACCAGTCCTGGAGCTCACACATTGCTTTTCCTCTCTGTCAGCTTCTAGTGTTGTGTTTTTGTGGAGGGTGGTAATTTACAGATTTATTTTCTTAACTTTTTCAAGCTAAAATACATATATATATGGGATCGTAGTTCTCTCTTGCCTGGAGATGTGCCTCTTCTATCAGTCTGAAATCTTCACCACCCCTTTCTACCCCCAAAACCACGGGGGTCCATGCCCAGCCTTGTCTCAGCAAAGTCCCTGCTGGCAGGGGTGGGCTGGTATCAGAGAGCTTTATTAGCACCTTCTTCTCCTTAAATTTGAGTGGATGAGGTGACTTCCCAGTGTGAAGGGATACATTTATCCATGCATTTATTTCCATGCATTAAGGCTGCAAACATGACTCGCAAGCAGAATGTGTTGAGGACAGCTTGGCTTGGGCTAAACAAAAGTAATTCTTCATTGAGCACTGCCCAGAGTTACTCACTGGAGATGTTCTGGAAAAATAAGGCAGTAAGTACAACACGAAACACCCAGACCACCAGCTCAGAGGTGCAGAGGGGGGTGGTATCTCAGGGAGGAGTGTGGAGACCAGAGGGCTGACTGAAGATGGGGTGTGCCCTCCCCAGGCTGCAAGCAACTGCACCCCCTCCTTTCAGGAGCCTGACCATCACTGTTGGTCCCTGGGCAAGGGGAGGAAGCAGTGTCCTTACCTGCCGAGTGACCTGGATGCTGCTGGGCCCAAAGGTGGTGGTCCCGTAGCTTGTCACGTAATAGTGAGCAGAGGGCTGTGCTGGGGGCTCCTCCAGTGGCCTGGGTACTGTGGGAATGGGACACCCTTAACCCCTCTGCTCCATGAAACCCTCAGCCCTCCTTCCTCTGAGCACAGCTGTGGCACAGACTCGGGACACCGGGCTCACCTTTGGGCAGGAGCAGCTCTGCACCAAAACAATGCCCACACGTCCCGCAAGTTTTAACGTCTTCCTTTGTCCTGTGGAGGAAAAAGCCCAGGAAAGAAGGAGCAGGAGCTGCTCTCAGCGCTCCCCATGGAATATGATGCCGAGGCCATGGAAGAGGCTTGCTCTTCCCACCCTGACCTGAGGGGCAGCTGTTGGTGGACAGCCGCTGCCCTCCCAGGTGCCTGAGCACCTTCAGCTCTTCATGAAACAGGGACATGTGGGCACATGTCCAGAGTGAACATTCTGTGCCTGAGCCCCAGAGTCTCAGCTTCTTCACTTTTCCCTCCATGCTCCAGTTTCCCACACCAGTAAGTGTTAACACCACTTGGGACAAGAGCTGCTATGGTTGGGAGAAGGGCACCGTAGTGCCTGGTGAGTTTCACAACTGATTTCACATGGCTTTTAAAAGCTAACCAGCTGCACCAGCATTGCAGTAGTGGCCACCCAGGTCCCACCCTCACTTGGAGGGCACAGTGTACGTACGTGGCACCTGTGCCATCCATGTCTGGCCAGAGGAACTCTGCGGGACAGCCGGACGTTCGGCAGGGAGCCTTCACACACACATGCAGCCCCGGCCACTCCTCAGCGAGCTTCTGGATGATGAGCACAACTGCCACAAGGAAGTCCCAGGCAAACTGGAACCCTTCCAGGCAAAAGGAGAATGTCTCTTTCTTACAGCCTCCAGCCACAGCAGCCCAGGAGATTCTGTTGTGACCCACACATAATTTCCAGCCCACAGCCTCAGCTGTCAGACCAGCTCCATCCCCAGTTAACCAAACTTCCATACGGAATTTAATGGTATGTTGGAAGAGCTCCCCAATTTGGGTGGCCCTTTTACTTATCAGTGGAAGACCCAGCCTTAGACTGTTCTCTGCTGGAGCCTTCTGGGGAAGGACGACCCATTTGCTTCATGACGAGAATGAAAACTTGGCTTTCCACTTTCATGTGATACCTCTAGAGGAGTCCTGACCAGAATTCGATGGAGAAAGGGAAAACCTTTAAGTGGACTGCTGGTGGACCCAGGCCAGACTAGGACATGTGGCAAAGGCTTCCTGGGACACTTCCCATAGGGCTGGAAGTGGCAGGAGCAGAGCTAAGGCAAGACATGGGGTTGGGAGTAATGAAATATGGATCAGGGATCTTACCTGTCCTTTCTGATGGCTTTCTGCTGCGGAGCTCCAGGTAGCTGTAGGCCCTCTGGTTATTCTCTTTGATCAGCAGGGGTTTGCCATTGCATACAAGCAGGCAGGTCACCTTGGCCACCCAGTGCGTGGAATAGAAGGAGCAAGCTTTCACCAGCAACCTGCAAGGAGATTGTCCATGGCTTTCATCACTTTTCTCCTAGCTTATCCCTAATGCTGGAGAAACTGGATGGACTTGAAAATATGAACCAAGTTGCAGTAAGAACAGACACAAAATGAGGACCTTCCCCTGCTGAAAGCTCAAGTAGCAGGAGCAGCCTCTTAAACCAAGAGATCTTTCCAGAGTTGGCCATTTTGTCCTGGTTTTGTCTGGGATGGAGTTAATTTTCTTCCTAGTAGCTGGTACAATGCTGTGCTTTGGATTTAGGATGCGAATGATGTGGATAACACATCACTGATGTGTTAATTGCTGCTGAGCAGGGCTTACCTCAAGTCAAGGATTTTTCAGGTTCTTAGGCTGCCCTGCCAGTGAGGGGAATGGGAAGGGACAGCTGACCCCAAATGACCAAAGTGTTATCCCATACACAGTAGCATCATGCTCAGCACATAAACCTTGGGGACCATTGCTTGGGAACAGGCTGGGCATGAGTTGGTTAGTGCTGAGCAATTGGTTTTTATTTGTATCACCTGTTCTTCGGTTGTATTTCTCTCTTTGCTGATTTCCTTTTCATTACAATATTATTATTGCTATTACTGTTATTATTATAATTTATTTCAACTATTAAACTGTCCTTATCTCAACCCA
>XM_037981260.1 PREDICTED: Kryptolebias marmoratus origin recognition complex, subunit 1 (orc1), transcript variant X4, mRNA 
CCCCCACACACACACACACACTGTCTGGTTTTGTTATTTCCTGCTTTGTTGGCGTTCCTGTTTGGTTCTCGATACGTAACACGTCAGAAAGAGCACAGGAACTGATGAAGAGACCCTGGTAGATTTTTCAATCTTTTATTATTAATTTTAAATTAGTGCAAATTCTTTACTCTGACTTTGAAAACAAGCTCCTTTTGTGACTTTATTTTGATTCCTGTTGACTTCAAAACACTTTTTGTTTCACCTTTAATCACTTGCACCATGTTCCCTGAAAGTTTAATAAAGACAGACAGACGGATAAAGAACTACTAACCTGGTTAAAAACCTGTTTTGCTGTGACGCTGTTGCGCTTCACCTTCCGGCCTGCAGGTGGCGCCAGACGCACCAATTAGCAAACCGGAAGTAATCAGCACAAGCAGAAGAAGAAATTTTCCCGCGAAACGCCGTCCCTCTGCCGTCTTCAAACGGCTCCAGTTAGTTTTCTGCGGGTTCTGGTTTGGAAATAAACGCGGATTTTCGATCAGAAGAAGACATTTTTTTTTTAATTTTCCGGGTCAGGTTAGCGAGGACCGGGATGAAATCTTTCGGCAGATTGAGAGTCAGGAGGTTTTATACATGGAGAGGAAATCCTCTGAGTTCCAACAGGAAGCTGCGGACACACGAATATGAGTCTTTGGCCATCAGGGTGGACGGGCTCCCGAGGACCACGGTCATCAGAACGGGTCAGCACATCCTCATTGAGGGCGACGACGACGACAACCCGTTCGCGGCCAAAGTCGTCCGGCTGTTTGGAGACGAGAGCGGGCAGCAGAAGAAGGCCGTGGTTCAGTGGTACGTTCGAGTTTCTGAAGTTCCTCCGAGCAAACTGAAGCTGCTGGGCAGAGACCCTCACCCCCGGGAGATCTTCTTCTACCAGGGAGGCAACTGCGACGACGAGGTCAACGCCGAGTCCATCATCAGACCCGTGCAGGTGAAACACCTGGATGCTGACGCTTCATTCCCCCCCTCTGATGATGGTGATGATGATGAGACGCTCTATGTGAAACTCGCCTGGGACTCGAAGGTCTTCAGGATCCTGGACTCGGCTCTGGTGGCGTCTCCTCCTCGCCATCCCAACCCCTCCCTCCCCCCGTCCCCCCCACGCTCCCCGCCTGCTGCCACCCCGGCCTCCAGGACCTCGAGTCGATGCACCCTGCCCACGCCAGACCCCACTGTGCTGCGCCGAGCCGCGCTGGGGGAAGTGAGACGCAGCCGAGCCGCAGCAAGCGCCGGTAAAAACCCCGCCGCCATGGAGGCGCTTCACTCAGAGACCAAACTGTCTGCGTCAAAATGCCTCAGCGCCAAGAGGAGGCATGGCACGGAGAGGACGCCAGGCGTCCGCAAGAAGCTGCAGCTCTGCAGTCCTGAGAAGACGGTGATGGTCAGAGAGGACGCCCTGACCCAGCTGCTGGACGAGGAGCTGGAGAAGGAGAGGACACTGGCTAAAAGGGTGCCATCCTCCCCCGCTCGGTCCCCCACCCTCACCCACAGACTCACCCCCCTCAGGAGGACCAACAAGAGCCTTGCCGCTCAGGACGCCGTGTCCCTGAAACCGTTCGTCATCACCTGCCGCAAAGTGCCCCTGAGTGAGGTGGAGTCTCCAACACCGACCAGAGACAACTCGAGCAGAGCTGCGACAACTCCTTGCACGAAAGAACCAAAACCTGTCAGAGAACCAGCTCTGGGTGATCTAGCTGAGGAAGAGGCCAAGAACTCCTCGCCGCCCAGGAGCTCCAAGAGGAAGTCGGCTCTGAAGGTGTCGTATCGCATCAGGAAGCAGCTGAACCTCATGGACGGCCAGCAGGACCTGAACTCTGACGAAGATGATGAAGACGAGTTTGTTCCGTCAAAGGAGCTGCAGAGCAGCAGCGAGGAAGAGGAGGCAGAGGTGGTGGTGAAGAAGAGCCGGGTGTCCTCAGCGGGGTCCCGCACGCCTCGTTCCTCGACCCGAACGCCGAGGAAGACTCCGAGGAAGAACGCACCAGGAACGCCGCGGACCCCCCGGAATGCCACGCCCAGCATCCCCAGCAGGTCCCTGCCGGCCAGACGGCCTGCCAACGTTCTGGAAGAGGCCAGAACCAGGCTCCACGTGTCCTCGGTGCCCGAGTCTCTGCCCTGCAGGGAGCAGGAGTTCCAGGACATCTACAGCTTCGTGGAGAGCAAGATCACCGACGGCACCGGGGGGTGCATGTACATCTCAGGTGTGCCGGGAACAGGTAAGACGGCCACGGTGCACGAGGTGATGCGCTGCCTGCAGCACGCCGCCGACACGGACGAGATCCCGCCGTTCCACTTCATAGAGATCAACGGGATGAAGATGACGGATCCTCATCAGGCCTACGTTCAGATCCTGCAGAAACTGACGGGTCAGAAAGCGACGGCCGATCACGCCGCGGCGCTGCTGGAGAAACGATTCAGTAACCCGGCACCAAGGAAGGAAACCACCGTGCTGCTGGTGGACGAACTGGACCTGCTGTGGACGAGGAAGCAGAACGTGATGTACAACCTGTTCAACTGGCCCACATGCCGCCACGCCCGCCTGGTGGTTCTGACCATCGCCAACACCATGGACCTGCCCGAGAGGGTCATGATCAACAGGGTGGCCAGCAGGCTGGGTCTGACCCGGATGTCCTTCCAGCCCTACACCTTCAGGCAGCTGCAGCAGATCATCACGTCACGGCTGAACAAGGTGAAGGCCTTCGAGGAGGACGCGCTACAGCTAGTGTCCAGAAAGGTGAAGCCCGCCCCCTCACCCGTCCCACAGCTCTTGCCCTGTGTCGGATCGCTCAGTTCTCTCCTCCGACAGGTGGCGGCTCTGTCGGGCGACGCTCGGCGGTGTTTGGACATCTGTCGGCGAGCGACAGAGATCTGCGAGCTGTCTGCTGCAGGGCTGGTGGGGATGAGTCACGTGATGGAGGCGCTGGATGAGATGTTCTCCTCAGCTTACATCACTGCCATCAAGTGTGCGTCGACGCAGGAGCAGCTCTTCCTGCGAGCCGTCATCGCTGAGTTTAGACGGCTGGGGTTGGAGGAGGCCACCTTCCAGCAGGTGTTTGTGCAGCACCAGGCTCTGTGTCGGGTGGAGGGTCTGCAGCCCGTCGGCGTGTCGGAGGGCCTGGCCATGTGTCAGCGTCTGGGAGGCTGCAGGCTGCTGCTGCTGGAGTCCAGCCGCCTGGGAGTCCTGCAGAGAGTCCGGCTCAACGTCAGCCAGGACGACGTCCTGTACGCCCTGAAGGCCGACTGACGAAGGAGAGTCAGCTCGGGTCCTGACGGAGGCAGAACACTTTACATACTGAGACCTAATGTGTTTACTGCAGATTTTCTTTTTTTGTTTTGTTTTGTGGGAGACTCTGTGACGTCCCCGGTTTTACCTGGACTGTCAGGTTTTACTGCTCTCATGGTTCTTTTATTGTTGACTTTTATATTTTTATGTTTCACTATTTGAATATAGAATAAAACAGTTTTAATATAAAGAAAATTCCTTTTCCCTCATCCATAAGCTGTGAAGCATTCACACGTTCCTAAGA
>XM_018492714.1 PREDICTED: Trachymyrmex septentrionalis FAD synthase-like (LOC108752090), transcript variant X3, mRNA 
TGATATTGTCACGAAATTTGAAGATATTACTGAGGATGATAGAAAACTACTAGTAGATCAATATGAATATTTTAGTACAATGGACATTACACTAAAGTATGATAATTGGCGTCGTGATGTGATATTAAAATCAATTCTCCCAGAAGATATTGAAGTTCCTACAGCGTACAGTTTAGTAGGACATATTGTACAGTTGAATTTACGTGATGTACATTTGCCATACAAATCTATTATTGGTCAGATATTTCTCGATAAGACTGCGAATGCACGAACAGTAGTAAATAAAATAGATACAATTAATACATCGTTTCGATATTTTGCTATGGAAATCCTAGCAGGTGAAAGAAATACAATAACATCTGCAAAAGAACATGGTTGTACATATCAGTTTGACTTTGCGCAAGTGTACTGGAATCCACGTTTATCTACTGAACATTCACGAATTATAACATTTATGACCGAAGGTGATATTCTATATGATGTATTTGCAGGAGTAGGACCCTTTGCAATTCCTGCCGCACGTAAAAAAGTCCAAGTATTTGCTAATGACTTAAATCCTGAATCTTACAAATGGCTTCAAAAAAACGCTCTTATTAACAAGAACAATATGTCGCAACAAATACGTCATTTTTATACAGCAAGTTTGATAGTTGTAGGAGATGAAATTTTACGTGGACAAATAATTGATACCAATACATCATATCTGGCACAAAATTTAACTGCTGCTGGAATAAAACTACAGAAAGTTATAATGGTCTCTGATATCGTGGATGATATTGCTAAAGAAATACGCAATACATCAAAGGAGTATTCTGTTGTATTTACATCTGGTGGTGTTGGACCTACTCATGATGATGTAACTTATGAGGCTGTAGCAAAGGCTTTTGAACTAAAACTTGAATTAAATCAGAAATTATTTGATATATACACTCGAATGATTCCTAATCAGGCCGAAATAAAACGACTTGCTATTGTTCCCAATGCATGCAAGATTATCAACATTGATTCAGAGGCTTTTCCAATAATAAATATAAAAAATGTTTACGTGTTACCTGGTTCCCCAAAGTACTTTAAGCCTGCTGCAGATACAATAATTTCTCGTTTGAAAGGAAGCACGCCATTTCACTTTGAACATATAGATATTGCATTGAATGAACTATCAATAGTAAACATTTTAGATAAACAAGCAAAACGATGGGATGGTAAAATAAAAATTGGTAGTTATCCTCAATATGAATTGCAAACATCTTTTACGAGAATCACTTTAGAAGGACCTGAAGAAACAATTGCAGAACGATTGCTAGGATGGAACGTCCCTACTGAGGAACTGATTCATATACCAGAACATTGGCTGATCTATCCTGAACCCAATCCTTCTCTTCACTATTTACTAGCCATTCTATACATAATTTTCACCTTTGTAGCGTTACTCGGAAATGGACTTGTTATCTGGATATTTTGCTCAGCCAAATCGTTAAGAACATCTTCAAATTTGTTTGTGGTGAATTTGGCATTTTGCGATTTCTTCATGATGCTCAAGGCACCGATATTTATATATAATTCCTTTAATACCGGATTTGCTACTGGTCATTTAGGATGTCAAATCTTTGCCTTTATGGGTTCGCTTAGTGGAATTGGAGCTGGTATGACAAATGCTGCTATAGCGTATGACAGATACAGTGTTATAGCTCGACCACTTGATGGGAAACTATCTCGCGGTCAAGTGATACTCTTTATTGTACTTATCTGGGCGTACACAATTCCATGGGCCTTGATGCCAATAATGCATGTCTGGGGTCGATTTGTGCCTGAAGGTTTCTTGACAAGCTGCACTTTCGATTATTTGACAGATAGTCCAGAAATAAAATATTTTGTGGCCACGATATTTACCTTCTCTTATTGTATACCAATGTTACTCATCATATATTATTATAGTCACATTGTCAGCCACGTTATTGATCACGAGAAAGCTCTTCGTGAACAAGCAAAGAAGATGAATGTCGAAAGTTTGAGAAGCAATGTCGGTGCAAATACTCAAACTATGGAAATACGTATAGCTAAGGCTGCAATAACAGTATGCTTCCTCTTTGTTCTCTCGTGGACTCCATACGGAGTTCTCGCGATGATCGGTGCTTTTGGAGATAAGACATTATTAACTCCTGGTATCACAATGATACCGGCATGCACATGTAAATTTGTGGCCTGTTTGGATCCATATGTATATGCCATAAGTCACCCAAGATACAGACTAGAACTGCAAAAACGATTACCATGGTTAGAATTGCAAGAAAAATCTGTGGACACGCAGGGTTCTACATCCGAAGTAGTGAATATGCCATCATCTTAAATCTTGTTTAATTTTATCTTAAACAGTAACTATTTAATTATGAATGATCAATTGCTATAGTCATCATTAAGATTATGTTCTTTATTACTGCAGTAATAAAATGATTGCGTAGTCTATATCAATGTAGTTACAAGTAATTGTAAATATATAAATGTGAATAATGTAAGCTCTTAATAAATACAATATTGTTCAATCTTCCTATTCTTTGTTACGATCATGTTTATTGCTAATGTGTGATACTTCTTATCTGTTACATAAAAGACAATATTGACATCAGGCGTGTAATTGTA
>XR_002250031.1 PREDICTED: Pseudomyrmex gracilis uncharacterized LOC109852741 (LOC109852741), ncRNA 
CAAAAACATTTTGAACTATTTCGATTTATCCGCGTCGAAAAGTTCGTTCCACGTCGCGACACGACGTATCTCGTGATAAACTTTCGATCGTAAAGTGTATTTTCGCGAAATCGTGCCTCGGATTGTGTAAATTGTATATTTTGTGCTAGTGATATCGTAGTGACAATTCAGAAATATTGGGCAAAATTTTTATCTTTATCACACAGGTCCTCGTTAGAAAACGGTCAACCGTCGATGCAAGAATATAGAACGAGAATGCCCGCATGGAATTCCCTGAATCTCGCAACTATGCACGCGCAATACTGTGAGTGTCACCTATATGCCGGAGAATGCGATTACATTTGTGAAAAAGGAAAACCTCTATTTTCGAGGCCAATACACGCGAGGGGCGTGTAATTCGTCGTGTAAGCACGTC
>XM_050446992.1 PREDICTED: Anthonomus grandis grandis uncharacterized LOC126740808 (LOC126740808), mRNA 
ACTATTGTTGCTATAAGGGGATTCTACAAAGAATTGTTTATTGTTATAAGATTTAAAAAAAAGCGCACTCTTGCGGCGCGAACTTGTAGTACATTAAAACTGTTGACAGCTGTCAATTAATATTGACAGTTTGTTTTTTCAGTAAAATTTAAAAGCAGTTTCACAATTTCTGTGATTAAAAGTGACGTGTTTTGATCAATTATAAGCCGGGACAATGAGTAAGAGCCACAAAACGAAGCATCACGAAGATCCCAGTCTGATCCCCACTTTTATGAGCGATGAAATGCACGCGGGGGCCAGGAAAATGAAAGCGGGTCCTTCGGCTGTAGCTTCGATGTTATATCCACATGCCGCGACTTCTATTACTACCACAACCGGTGTAAGGAAGAAAGAAGAAGATTTAGCGAATAACGACGAGTTGACCGATGACGACATGGAACGTAAAATGGATGGTACATTACGCAAGGGACCCCCGAAAGAAAACATTCAGGTGGATGGGAAAATTAGCATCCTTACAAAAATTGAAGGTAGGAGAGAAGCCCTCTGTTGCAAATACAACGAGGAGTACGACTATATCGCAGTGGGTTACGCTGACGGGGTGATCGTCATGTACCAAAGTTCCACGGGCGAACCAGTTTTCACTTTAACAGACGCGGACGTGAGGGAGAACAGGGCGCCAGTTACCTCGATCAAGCATCGACCTGTATCGAAAATTTACCCCATTACCAACTGTTACACCGGGACCTATGCGAACGGTTGCGTTAAATGCTGGTCCTACAATTTCAACCAGTGCCTCTATACCATCAGGGAGAAGCGACAAACTTTCGGGATCGCGTATCATCCGCGATTCCCGAAATTCGTTACGTTTGGGGACGATATGAAGGTTTATTTTTATGACGAGGAAACGAAGACGCAGGAGAGGGTGCTATCGTCCAGTGATAATCCTGATACGCACGACGGTCACATGTCCAGGGTATTCGCCGCGTGTTTCCACCCGAAAAACAATTACGAACTTTTAACGGGTGGTTGGGACGATGTCGTTCAGTTTTGGGATCTGAGACAACCGCATGCGGCCAGGCACATTTCGGGGGTTCACATGTGCGGAGAGGGCCTCGATATTAGTCAGAAAGGGACTGAGGTGTTGACTTGCTCCTGGCAAAAAGAGGATCCTTTGCAAGTGTTTGATTATAATACGACCAAAAGGATGTACTGTTTAGAACCGGACATTTATAACACTAAGCTGTATTGCGGTAAATATGCCACCAAAGATTTTGTGGTGTGTGCAGGATCCGATCCGAACCTTATACGTGTGGTGGACTTGCAAACGACTGCAACTTCGGCATTTATAAACCAATTACCGGGAGCCATTTACAGTTTGGATATCGGTCCGACGAAAGCGAAAAAAGAAGCAAAGTTGGAAAAGTACAGCGTTAAAAACGACATAACGAACGTACCGAAAATGGTCTTCGTATCTGGTAAGAGACTTTACCAGATCGATTTTTGTTAATTTAACAACGAATAAAACGCATGTGTTGAAACAAGAAAA
>XM_028067949.1 PREDICTED: Vigna unguiculata protein IQ-DOMAIN 14-like (LOC114181480), transcript variant X1, mRNA 
CTTATTTATTCATTAAATTTCTTGAAGTTTCGTTGTTCCCTCCTTGCATGTTCCATGGACAAGGTTTTTGTCATATATAGCAGATTTTCACGAGCTTTTGACAGAGTATTTTCTTTTGTTTTGTCTCCTTTCAGATAAAATCATCACATAGTAACATAGTTGAACTGTTTCTTGCAGTGAGGGCAGCAATGGGGAGAGCCACAAGGTGGATGAAGAGTTTGTTTGGGATTTCAAGAGAGAGAGAGAAGAAACAAAACATCATAGAATCTGGTTTTTCTGAGAGTACTAATAATTCAAGAGTTTTGTGTCACAACCCAGGAACTATACCTCCCAACATTTCTCAAGCTGAGGCAGCTTGGTTACAGTCATTCTACACAGAGAAGGACAAAAACAAGCACGCCATTGCGGTTGCTGCGGCCACCGCAGCTGCGGCTGATGCTGCCGTGGCGGCAGCACAGGCCGCCGTGGCAGTTGTTAGACTCACAAGCCAAGGAAGGGGTGGCACCATGTTTGGCGTTGGACCTGAGATATGGGCTGCTATCAAGATTCAAGCAGTGTTCAGAGGATACCTGGCAAGGAAGGCACTGAGGGCATTAAAAGGATTGGTGAAGTTGCAGGCACTTGTCAGAGGGTATTTAGTGAGGAAGCAAGCAACAGCAACACTGCATAGTATGCAGGCTCTTATTAGAGCTCAAGCTAGAGTACGGTCCCACCAATCTCGCAGGCTCATGAGTACGAAGAATGAAGCATTTAGATCTCAAAATAGAGCAAGAAGATCCATGGAGAGGTTTGATGATACTAGGAGTGAGTATGCAGTTCCAATCCACAGTAGACGAGCATCATCGTCTTTTGATGCTACACTTAACATCAACAACAGTGTTGATGGGAGCCCCAAAATAGTGGAAGTAGACACTTTCAGGCCTAAGTCAAGATCAAGAAGGACAATATCAGATTTTGGTGACGAGCCATCACTTCAGGCACTTTCATCTCCCTTCTTTGCAATTTCATATAGAGGTACCCCTACCCCTACCCCTACCCCTACACGTTGGTCCATACCAGATCAAAGGAATTTTCAGGACTCTGAATGGGGGTTAACAGGGGAAGAATGTCGGTTCTCTACAGCACAAAGCACTCCACGCTTCACAAATCCTTGTAGTTGTGACTCAGTTGCACCTATGACACCACAAAGTGGGTGTCCTGATGATAACTTGTTTCTAAGGCAATATGGGAAATTTCCAAACTACATGGCTAGTACTCAGTCTTTTAAGGCCAAGTTGAGGTCTCATAGTGCTCCAAAGCAACGACCTGAACCTAGTCCAAGGAAAAGGCTCTCCCTCAATGAAATGATGGAGTCTAGGAGCAGCTTGAGTGGTGTTAGAATGCAGAGGTCTTGCTCAAAGGCTCAAGAAGTCATTAGTTTCAAGAATGCTGTGATGGGAAAGCTTCAGAAATCCACAGAATCTGTTAGGGAAACAGACAGAAACTATTTCCATCAGAGAGGGTGGTGACATGCTGAACTTGTTAGGACAGATATCTAGCTATCTTTGTTCTTTAAACTGTTAAAGTGTTAATAAAATATATTTCTCCCCCAGTTTGGTAATTTGCAGATACATATAGGTGGTGAGTGTGGGAATGTGAAGACAAAATAGAAGGCAAAGATAGAGAGAGAGAGAGATGCCTCTCATTGTTTTGTGAAAAGTTTGGCTTTGGAATTTTGATATATCATCTCTCTGTAGTCTATTCAAATGCAAGGATTTTAACTT
>XM_043209237.1 PREDICTED: Drosophila ficusphila oxysterol-binding protein-related protein 8 (LOC108093331), transcript variant X2, mRNA 
AAAAACAGAAAATAACACGAAAGCTTGTTTCGCCTTTTCACTTCCAGCGTCTTCGGCCGCGTCATGAAAATAATACTCGCCGCCTGTTCGATGGGTGGACGGTCGGTTGGGGGAGGGTGGTGACGTCGCCAGCGCTGGTGGATGAGCTCATACGAAAGCGAAAAGAAACAAGTTTAGCTTTTTGGAATACGGACGACTGCAGCCTCAGTTCATTCGAACGCCGAACGCCAGCGACGCCGGACCGTTAAAACGAGAGAGCAAGAGAGCCGCGAAACAAAAAACGAAAACCGAAAAAAGCTATCTATAAAGTCTTTGCAAAAAGCCCAAAATTGTTGTGCAAAAAAGCGAGGAAGGCTGAGACTCTTGAGCGGCTAAAACAAAATCAATAATTGGCCCTGCGTCCAGCGCTATATGTGTGTGTGTGTGCGTGTGAGAGGGGGAGTGTGTACGTGTATTTGTGAGAACGACAATTGGAGCAATGCCTGCTGATTGATACGAAAAAAAGGGGGAAACCAATTACAAAAGAACCACAGAAGCGAAGGATTATAATAACTATTTTGTGCAATAATTAAGTGATCAAAACCATGCAACCCGCAACGCCCGGAACGCCTGTTAATAATGCTCCCTCGACGACTAATTCATCGGCCACCCCTGCCGCTCCCGCCGCCCCTGCTGGCGGGGGGGTTAGCAGCACTCCAATACGCATAAACAGTGCCAAGCAGCACGGGGCGGGGGGCGGTGACTCGCTGGCCCCCTCCACCCCGCACTCCCATTCGATGCCTGGAACGCCGCAACAACAATCGAGCAGTGTGCCCACGGGAAGTCAACTGCTGCATCTCCAGGCGCCGCTGCCCTCGGCTGGGGGAGGCGGGGGAGGATCAGTGACCCCCTCTGGCCTGTCCATGGGCGCCTCGAATCAATCGCTGGGCGTTAGTGTTGGCGCCGCCAGCAGCGTCAGTGGTATCAGCATAACGCCGCCGAATAGCGCCGGATTGCGTCAGTCGACAGTATTCGATTTCAAATTCAAACGGCGACCTTCGCTAAAAGTGCTCATGACCAAACTTCCGTCCACGGACAGTTTGAGTAACAGTCCGGCGCCGTCATCGCCAGGAATCGCCAATTGGGCCTCAGACAATCGGGATGGCAATCTGGCAGATAAGTCTGCTGCTGATGCCGCCAAACTTAATAGGAAGGAGTCCTACAAGGCGCAAAGGAAAAACTACAGGCGGGAGAAAAAGCGAGTGGCCAGTGAGCTGATGAACTCGCTGCAGGATCCTGCGGTTATTGTGCTGGCCGATTGGCTGAAGGTTCGAGGAACCCTAAAATCCTGGACAAAACTCTGGTGTGTTTTGAAACCGGGCCTGTTGCTTATTTACAAGAGCCAAAAGACAAAGAGCAGTCACTGGGTGGGCACGGTGATGCTCACCTCCTGCCAGGTGATCGAGCGTCCCAGTAAAAAGGATGGCTTCTGCTTCAAGCTTTTCCATCCCCTGGAGCAGTCCATTTGGGCACCGAGGGGTCCAGACAAGGAAACCATTGGTGCCGTTGTCCAACCGCTACCAACCGCCTACCTGATCTTCCGAGCTCCCAGCCAGGCGGCCGGCAAGTGCTGGATGGACGCCTTGGAGCTGTCCCTGAGATGTTCGGCCCTCCTGTTGCGTTCCAATAGCAGCACGGGAGCTGCTCCTTCGTCCAGCTACGTGGGTGAACCGCTGCCCGTCTCCCACGAGACGCAATGGTCGGAGGCGGACTACGAGAAGCACTTCAACGATCACGATCTAGACGCAGACAGCCAGAATGAAGCACCCAATGCCGTCATGTCTGGTCTGGAATCAGAATCGGAATCGGATCCGGCTGAGCCGGCGCAGGAAGATGGCGTCGAGCAGCCTTGTGAGGAGACGTCGTATGTGCCCTTCACCGAGGAGGAGTTTGGCGAGCAAGGGGAGCAGGTAGAGGAGTTGGCAGAGGAGAACAAGAGCCTAATTTGGTGCATTGTCAAGCAGGTGCGACCGGGAATGGATCTGAGCAAGGTAGTGCTGCCCACTTTCATCCTGGAGCCGCGTTCATTCCTGGACAAGCTATCAGACTCGTACTACCACGCGGACTTGCTCTCCAAGGCCGTGCAAGAGGATGATGCTTTTACGCGCATGAAGCTTGTCGTGCAATGGTACCTGTCCAGTTTTTACAAGAAGCCCAAGGGCCTGAAGAAGCCCTACAATCCGATTCTGGGCGAGCGATTCCGCTGCTATTGGCAGCACCCCAGCGGCAGCCGGACCTTCTACATCGCGGAACAGGTCTCGCACCATCCGCCCGTCTCGGCGTTCTACGTGACGAACCGCGAGGACGGCTTCAGTATCACCTGCTCCATCCTGGCGAAATCGAAGTTCTACGGCAACAGCACTTCGGCGGTGCTCGAGGGCGCTGCCACGATGACGTTGCTGCCGCGCGGTGAGTGCTATACGGCGACCACGCCTTATGCCCACTGCAAGGGCATACTGATGGGCACGCTCTCCATGGAGCTGGGCGGCAAGATAAACATCGAGTGCGAGAACACCGGTTACAGGACGGAGCTGGAATTCAAGCTGAAGCCGTTCCTCGGCGGCGCCGATGCCACCAATGTGGTCGTGGGCAAGATCAAGCTGGGCAAGGAGACCCTGGCCACCATCAACGGGCACTGGGACAAGGAGTGCCGCGTGAAGGACTCGAAGACGGGGGAGGAGACGTTGCTATTCAAGGTGGACGCCGAGACGCGTTCCAAGCGGCTCACCAGATACCTGGTGCCGCTGGAAGCGCAGGAGCCCAACGAATCGCAACGTATGTGGCAGCACGTCTCCGAGGCGATTGCGCGCGAGGATCAGGTGGCCGCCACCGAGGAGAAGACCGTGCTGGAGGAGCGACAGCGGGCGGAGGCCAAGACGCGGGCCAGCACCGATTCCATTCACATGCCGGAACTCTTCGAGCTGGACAGCTACGGCCAGTGGCTGTACAAGTACGCCGATCTGCGGCCCTGGGACTCGCGCAACGATGTCCGCCAGTACGAGTGCCAGTTCAAGGTGCTCACCCAGACGCGACACAAGTCGGTGCCCATTGTCCACGGCGCCGAGATGATCCATCCCCTGCGCAGCTCCTTGGAGACGCTCTCCCGCACCCAAAGACAAGCAGGACAGGCCATATCGCCGGGCGGCTCCGCGGTGCCCAAGGCCAAGAACAAGAGCCTGGTGTTGGCACCGCGCGATACCAACTCAGACTCCAGCCAGTCGCCGCAGGGAGCGGTCAAGCGCAGCTCCTCCAGCATTAAGCAACTCGCCTTGGCAGTGGACCAGGTGAACCGCGTGCTGGAGGTCCACACCCGGCAGCTGAACGAGATCAGCCAGCGCCTGGAGCGCATGCAGTATTCGCCTCCGGCTAGCAACATGAGCGTGCAATCGCATCATTTGCTGGGCGGCGGCGTTTCGCAATCGACGGTGATCAAGTCGCTGATCTACGCTCTGATCGGGCTGACCTTTAGCCTGATCCTGCGATGGCTGTTCAAGTAGACAGGCGGAGTCCGTCGTTGTTGATGTCATTTCTTTTAGGCCTAAGAAAACTTTTGGTCAACCTATAGATAACAAACATATATATAAACACCCTAGAGTACAGACAACGTATATGCTTTACTGAATTGTACATTTGGTCCTACTCAAATGCCTTCGCACGCTGCCAGAGATTCAAACCCGACCGAGGCGCGTGACCAGAACATCCGTTGTGAGAAAGTCTAATCACGAACTATGTATAAGATTAAGTGTTTGTCGTATGTAAGTCCCAACAATCCAAGTCTCTCCCGCAGACAACGTCCATGTGCAAGTCTCTTCACCATTGTATCCCTCTAAATTCTTTACTCAAGCTAGACCCGTTGGGTAGGTTAGGATGTCGGATATATATATTTAAATATACACATACGTACGAGTAGATGCACCAGATTTCGTAAAAATTCCAATTAAACCGATTATAGTTCGCTTTTCCGTTTCCTTCTATATACTGTTATTGTTAATGACACGACTTAGGGTGGAAAATGAGGATAATATGCTCGAGAGGCTTCCTGCCCTTTAAATCACCACTTATAGACATACCTTAGAGATTTAACGCGAAAAGTGCTTATAATAACTAATTTTAGTATCTCTTATACACAAATTGTTTTTCCTTTTTTTCCCAATACCTGCAAACCTTAAAACTTAATAAACTTCCCTTTTTCAAATCTA
>XM_007369094.1 Dichomitus squalens LYAD-421 SS1 uncharacterized protein (DICSQDRAFT_149347), partial mRNA 
ATGTCGCTCCAGGTCAACCTCTCAGGCAGGGAGCTCGCCCAGGCGTACCAAGATGTCATCAATGCCCGCGGCATAGATTGGGCGATCTTCACCTACGACAAAGGATCCAACGATCTCAAGGTGCAAGCAACCGGAGATGGAGGTCTCGAGGAGCTTCAGGAGGAGTTCTCGGACGGCCGGATGCAGTACGCCTTTGCTCGCGTCAAAGATCCAAACAGTGAACTCCCTAAGTTCGTGCAGATCAACTGGTGCGGTGACGGTGTGCCCGTCGCGAGGAAGGGTCTCTTCCATACCCATTCAAGTGCTGTCGCCAACTTCCTCCGCGGTACCCATGTTGTTATCAGCGCTCGCAATGAGGCCGACGTAGAGCCATCCTTCATCATGTCCCGTGTCAAGGCTGCGTCCGGAGTCAACTATACGGCTCAGAAAGAAGCACCGCGCAAGTTCGAGCCTATCACCCCCGTTGGTACGAACTATGTCCCTGTAGGCAGACCTGACATGGCCGCCATTCGTCAAGGCCCTGCCAAACCACCACCGGCACCCGCCGCAGCGAAGCCAGCTATCCCAACTGCCGCACGTCCTGTCCCAATGGCTCCCTCGCCTGCTGCAGGATTAGGGAAAGCTCCCGTGGCTAGCAAGGCCCCTGCGGACGCATGGCCGGACGAGTCCAATAGCTTCGCGCCGCCCCCACCTCCGCCTGCTGCTTCACGCCCGACTCCTGCGGCGAGCTTCGCCAAACCTGCCCCTGCAGCTTCTCCAGCAGCAGCGCGGTTCTCTCCCACCGTTACAACTCCAGTTGCCGCTTCAAACGTCCCCACGAAGCCTGCTGAAGAGGACAAGATCGGTCCAGTGGGTACCGCGTATACCCCAATCAAGCTTCAGCCCAAGAAGCTCGTCAATCCGTTCGCCGCGATGGAGGCGAAGAACCAAACTGAAACTACTGCGCCAAGGTCTTCGCCTGCTGGTAGTGCCAAGAAGTTGACTTGGAGCGAGCGCCAGGCCCTCGCGAAAAAGCAACAGGAAGAGGAGGAAGCTCGCGCGAAATCTGCATTCGGCTCTCAGCCTACTCCTCCGCCTACCTCCGCGTTCCGTACTGGTGGGAGTATTCCAGAGCCAGAGGAGGAATTCGAGGCGCCTCCTCCGCCCCCGCCACCTCCCGCGATTGCCAGTGCGAGCCGTCCTATTCCTGTTCCGGAGCCCGAATCTCAAGCAGAGGCTCCTCCGCCACCTCCCCCGCCCCTGCCCCCGCCACCGCCACCGCCCCCTGCTCCTACGGTATATCACGAGCCAGAACCTGCGAGGGAGGCCCCTCCACCCCCACCGCCTCCGCCACCACCTCCACCGCCGCCCGGGCCTGCAGCACCAGTCGCTCCGCCGGCTCCCCCTACACCCGAGCCCCAGCCCCAGCCCCAGTCCGAACACGCTCCAGACGCAACTGCGCATTCGGGTCAAGGCATCTGCGCTATTGTGCAGTATTCATATGAGGCTCTCGAGGATAACGAGATGGACCTCGTCGAGGGCGAGCTCATCGAGCAGATCGAGCAGCTAGATGAAGGATGGTGGTCCGGCGTTGGTGCGAACGGGACGAAGCAGGGCCTCTTTCCGGCGAACTATGTCGAGATCATCGAAGCTCAGGAAGCTCAGGCTGCTACCCCCCCTCCGCCGTCGCCTCCCCCTCCCCCGCCCGCTCCTCCTGCCCCGCCTCCACCTCCCGTTGCTGCCCAGCCGGAGCCGGAGCCCGCGCCCGAGGAAGATCTTGGGTCGTGGGCAATCGCGCTCTACGATTACGAAGCGGGCGAGGATAACGAGATTTCGTTCAAGGAGGGTGATAGAATCACGCATATTGAGGCTGTGTCGGATGACTGGTGGCAAGGTACCGAGCCTAACGGCAATGTCGGCTTGTTCCCCGCGAACTACGTCGAACTTCAAGCTTGA
>XM_039761524.1 PREDICTED: Polypterus senegalus RAB, member of RAS oncogene family-like 2 (rabl2), mRNA 
TAGAGTGATCTGAATTACGTGCATACATTTTTATACCGCTGAAGATGTGCAATGCTTTTACTGGACATTTTTATATAATTATTTTTTCTTCCCGATTGCTAACATTGGCATATGTGAATGATAAAACAAAAAACGCCGGCTTTTGGTATGGCTATTGCCGGAAGTAGACAGCACAGTGGCGCAGGCAGACGAATAGACAACCTACATTTTCCTGTTGAGGGTCCTTTTTTAGCGTCGGTTGCGTAGAAACTGCTGTTGTAAATTTTTGAAGCACTTTCTCAATAACGAAGTATCGCTCAGGCTACATCGATAATTAACCGAGTCGTGGTTAATAGGAGTCCAGTCAAACGGCGCTGCTTTGTATTTTTGTTCAACTGAACAACTTCTAACTGATAATCTTGTATAAAGAGTCGCGACGGTGGAGCAATTTGGCGAATGATGAATGGAAGGGATTTGGTTATCTCTGATGATTAATTAAAACGGAGCAAAAAGAAAAGCCTAACCGGAGAAGTCGAAGGCGGTAGTGGATGAAGGGGCTGTGTGCCCGTATTTAGTTTACCGTAGATGTTCGCTGCTTGCTCCTAAGGTCGGGATCGCGTTTTTACCTCCGCAAAGCCAAAAGATGGCCGAGAATGCTGCTGGTTTTTCCGATCTGAATCAAGATAAGTATGACAAAGATGAGCTTAAAATCATCTGTTTGGGCGACAGCGCTGTTGGAAAATCAAAGTTGATGGAGAGATTCCTCATGCAAGTGTATCATTCCAAAGACCTGTCTACCTACGCACTCACACTTTACAAATATCCAACAACTGTGGATGGAAAAACTATCTTAGTAGATTTTTGGGATACTGCTGGACAGGAGAAATTTCAGAGTATGCATCCTTCTTACTACCACAAAGCTCATGCCTGCATTATGGTTTTTGACATTCAGAGAAAAATAACCTATAAAAATCTTGGCAACTGGTACAAGGAATTAAGGGAGTATCGCCCAGAAATCCCATGCATATTAGTTGCAAATAAAATCGATGCTGACATGAAGGTAACCCAGAAAAACTTCAGTTTTGCTAAAAAGCACGGACTTCCCTTCTATTTTGTTTCTGCTGCAGATGGCACAAATGTAGTTAAGCTGTTCAGAGATGCAATCAAACTGGCATTATCTTATAAGCTAAATTCCTGTGATTTCATGGATGAAGTCATGCGCGAATTAGAGAACTTTGACATGGACAAGAAAGATGACTACTCAGATAAAGAAGATGACAGTTTAAAGGAAGACAACATCAAAAAGACATGACCTACCCTGGTCTTCATAAAATGATTTGGGTTTTAAGCGGAATAGTATCTTATTTTATTTTCCTGACCGTCTTTGAAAGGAGAATCTGTTTGACTGCTGAAAACACACCAGTGAGAAATATACATTACCTAAAATATCTGACCATGATAAACTCTATTCAAATTCAGATTTGTCCCACCAGAAAAAAAACATTGTACTGTGCAGACTCCTATTGTTCCACTTTATGAATTTGAGTCCTGTCAATTGATTTTGTTGCTTTATTTAAAACTGTGAATATTACTGCCACAGCCAAAAGGT
>XM_051965029.1 PREDICTED: Antechinus flavipes proline rich and Gla domain 4 (LOC127540371), mRNA 
TGAGCCCGCCGCCAGCACCCCGCAGCCAGCGCTCGCGTCCGGTGCCGGGGCAGCCGTCGCAGCAGCAGGTTTCTCCCGGGAGCGCGGCTGAGCGGTGCCGGCTGGCTGACCCGGAATCAGGAGCCCAGGCGCTCAGCCTCCGCCGACCCCGCTGACTTAGAAAGAAGTCGGGGCAAAATCCGGGATCCACCCCGGGCCTGGGAGAGACCGGACGGCCGCTCCGGAGCATGTGCCAGCTGCTCCAGATGCCAGACTATGTTTAAACTTTTGGTTCTGCTCAGCACTTTGCCTGCTATTACTGTTGCGTTTCCTCCCTGCCTAAGAAGTCCCCAGGAGTCTACACATGCTGGAAAAGACGTCTTTACATCAAAAAAAGAAGCCAGCATCTTCATCCATAGACGTCTCCTCCACAATAGATTTGACTTGGAACTCTTCACTCCTGGAGATCTAGAAAGAGAGTGTCATGAGGAACTGTGCAACTATGAGGAAGCCAGGGAGATCTTTGGGGATGACGACAAAACGATGGCATTTTGGAAGGATTATTCAGTTCGAGGACCAAGCACAAGATCAGATGGTGAGAGAGAGAAGATCGATGTTATGGGACTTCTGACTGGATTAATTGCAGCTGGAGTGTTCTTGGTTATCACTGGATTACTTGGTTATTATTTCTGCATCACCAAGTGCACAAGAAGAAGACAGCCATGTTCCTCAGCTGTCTATGTAAGAACGGGTCGACACCATCCAACTATTATTTTTAGAAGACATGAGGAATCTGCCTTAACCCCGTCACCTCTTCCCCCAGAGGATTCAGGACTGCCTTCTTACGAACAAGCTGTGGCACTGACTGGAAAATATGATGTTCCGCCTCCTCCATATCCTGGGCCAGCAAGAGGGTTTAAGGTGTTTAAAAAGTCTATGTCACTACCTTCTCACTAAATCCAATGTCAATATGAGAAATGGATGTTTATTCAAAGAAGGAGCCATGATTCAGTTCTCCAGTAGCTTAAAAGGCTGGCCATTCCATTCCTGTAAAGGTATTAAGATGCCTGGTCTTTTGCTCCAGATAGTTGGACTTTTACTCTGACATCAGAATAATGAGGGAATCGGTTTCATTTTGTGTGGGTATGTGTATGTAGGTAGGAGGCGAGCCCTGATTTAAATTTAGGAGTATCCAGATCATTAGCCCTAATCAGCTAAATTAGGCAAAAGATTACTAATTACTGAAGGAAAAGCCACATATCCACTATAGCAGAAAGGGTTCTAGATTGATTATGTTGAGAACTGAATTAATGTTAATACAAGACTTTTTTTGTTTCGAGTCATCTTGAGTCAAGATACTATATTTTATCCCTGTTTATTTTAATTCTCCAGCAAAAGAAACCTTGTGAAAAAATTTTAAATCGCATGATGAATCAGTGGTCTTTAAAACATAAAAGGAATCCTAATGCTTATTGTATATAAAATAGCATATGATATTCCGTACAGGTATTTGTACTTAAAAGATTATGTCCAGTTGTACAATGGTGGGAAAATACCTTCATTTTTCTTTTGATTCAATGGCTGCTGCCATTAGAACTTGGGGGTCAGAGGTACAGTGAGACAAAGTTGCAGATTATAGTTCTAATTCTTTCCTATCACCAAAAGTGTTTCTAGAACCTAGAATCTCTAGATTCTGTATGAATCTGCCCGTCCCATGAGGAAATAGATGAATTCCGTCTGTATAATTATATGTTTGGTTCATATGAGATTACTCAGGTTGGAAGTTTTATTCTAGCTTATAACTAATAGTTTAATCAGGAAAGGATAATTTATTTATTCTCTTATTATCTATGTATAGTGGTTAAAGATGTATATGACCCTTTGCATCTCTGGGATATGTTTTCTCAGACATTAAAGCACACTTAAAATGATCACTCAA
>XM_019516974.1 PREDICTED: Gavialis gangeticus B double prime 1, subunit of RNA polymerase III transcription initiation factor IIIB (BDP1), transcript variant X7, mRNA 
ACAAGTTTGTTCTACATGGTATTTCATGACACTTTTTTAATTGTTTGTAGAAATGAAAGGGTGGGTAGTGCAAGTGATGCTGGAGAAGCCATTAAACCTGCAGATGGACCCTTGCAGAGGAGAAAAAGAATATCCACTCTGCCTAACTTGGCAAAACCCAGAGTTACGGCTCTAACTGCACAACGGTTGGTATCAAAGCCTGCTCAAAAACAAGTACCTCAATCTGTCAGTGGCAACACTTCACGGAAGGAATCCTCTGCATCAGATAAGACCAATAGTGAAAGCTCTCCAAAGTCTCCCAATCTGCCTGAAAAGAAAACACCTGTCCCACAAGTGCCACAGTTTTCCCCACTTAAAAAATCAAGAAGCAAAGAGCCAAATGCCAGTATAATTGCTCATAAAAATGATGAAACTCTGCAGAAGAGCACGCTCTCCCCTCTCAAGGAGAGACCTACCCAAGGAAGATCAAAAGAAGATGAAATGTCGCATGCAAAATCTACTCCAGCAAAAGAAAAAAAAAGGTGCTCAGATCGTGAAAGGATCCTTAAAGCCCAGAAGCTGAGAGAGATGCTCAAAGAAGAGCTGAGGAAAGAAAAACTGAAACATGGGAAATCCAGACAGAAGGTGGCTGAAGGTTTCACTGCAGCAGATCGTTCCAAAATGACCATGAGAGACTTGATATACTTCCTGCCACAAAACAATCCCATGAAGTCTTCACTAATAGACGAAAAAACTTCTGCATCAAGCCAAATGAAAGAATCAGAAGAGAAGAGTGCTCCTGTTCATGAAGATGAAGAGGAAGTTGCTCAGGCAGAGGATGAGGAGGAGAATCACGATGATAAGCTTCTAGTTCCTCGAGTGAAAGTGGCAGAAGATGGCTCAATTATTCTGGATGAAGAAAGTTTAACAGTGGAAGTTTTAAGGACTAAAGGGCCAAGTGTTGTAGAAGACAATGATCCTATTTTTGAGCGTGGCTCTACAACTACCTATTCTAGTTTTAGGAAAAGCTTTTACACCAAGCCATGGTCAAATAAAGAAACTGATATGTTCTTCCTGGCCATCAGCATGGTAGGAACAGACTTCTCCCTGATTGGTCAGCTGTTTCCTCACAGAGCAAGATCAGAAATTAAGAACAAGTTTAAACGTGAGGAAAAAACAAATGGATGGAGGATAGACAAAGCCTTCAAGGAAAAGCGGCCATTTGACTTTGAATTCTTTGCACAGCTGCTTGGGAAAGTTCTAGCAGATGAGGAAAAGAGGAAACAAAAGGTGATTAGAAGTCAAAGATCAAAAGAAAAGAAGCCACAAAAAGCTCGGAAAAAGCAAAAAGTAGCTCACGCTGAGAATGAAAAAGCTGCTAATGAACAAGATCAAGAGGATGTCGGAATTTCTGATGCAGAAACTGAAGTGGATGCTGTGACAGCTGAGAAGGAGAATGAAGAATCTTTGAATGTTTCTGAACCAGCAGAAGGGCAGCTCCTGTCAGAGCCAGGGGTAACCAAAAAGAAAAGAAAACAGAAGAAAAGAAATTCTGAAAAGGAACTTCAGAAACTTGCTGATGCAGAAACAGGAGTTGATGCTGTGACAGCTGAGAGAGACAATGAAGAAACTGTAAATATTTCTGAACCAGTGGACGAACAGATTGCATCTGAGCTAGTGGTACCAAAAAAGAAAAGAAAGCAGAAGAAGAAAAATCTTGAAAAGGAACTTGAAAATCTTTCTGATGTGGAAACAGGAGTTAATACTTTGATAGCTGAAAAAGAGAACGAGGATTCTTTGAATCCTTCTGAGCTGACAGAAGAACAGATCACATCGGAGCCTATGGTAAAAAGGAAAAGAAAAGAAAAGAAGAAGAATTCTGATCAGGGCATGGAGACTCTTGCGAAAGAGACAGCAGTTATTTTGAAACCAGCTAAGGGAGAAAAATCCAGCAGGAAACAAAAAAATACATCTGGCACAAACAGTGATGATTCTACTGAATGCAGGGAGGAACTGGGTATTCATAATGAAGAAATGTTTTGTGAGACTCCTGTTCAAGTGGAGCAAGTCTTCGATTCCTCCTTACAACTGAATGATGAAAATGAGGAAGATAGTGATTTTGATTTACACAGCTTTCAAGATAGTAATAATGTAACAGAAGCAGAACCTGTTGAACCAGAAATCACCAGTGAGTCTCAGGAATGGCAGCTTTCAAAATCTCAAGTTTTGGTTAACAGAAACCAAGGAAGTAGTGATCAAACCACTGAATCAAAGAACAATGAAGTATTTGACTTATGTGAGCCAGGTGACAAGGAGAGTGCAGCAGGAAGAGGCTGTGATACAAAGTCCGAAACAATGGAATCTGAAAAAGCTGTTGCTGGGAAATCAGGAGTGAGAGGACGTTTGCAGAGACCTAAGCCCAACTTAGCAAGAGGATCTGGAAAGAGAGAAGGAGCAGTGCAAGAAAAATCAGAGGTCAGGGCTCCCCCTCCAGAGCTTATGGAAGGAGCAGAAAAGGATTCTGTGGACGATAGTGAAGGCAAGATGTTGGAAGTTGCCAGAGATGAAACCACAGGAAGAGAGAACAAAGACTCGGAGACTGAAGCTCAAGAGACTGAGAAAGTTGTTACTGGAAGGACAGCAGTGAGAGGGCGTCAGCAGAGATTTAAACCTAACCTGGTAGGAGCTTCTGGAAAGAAGAATGAGCCTCTTCAGGCAGAAAGAGAAGATAAAACTCTTCATTCAGAGACTGATGGAAAAACAGAAGAAAAGAATAGTAACCAAGGTAACAAATCTGATGTTCCCAGAGTGGAAACAACAAAAAAAGATGGTAGAGTCTCAGGGACTGAATCTCAGTCTGAAGAAACTGCTCAGTCACAAGAAGATGGCAAACAGAGTGTACTCAAACCAGCACCACTAATGAGGAGTCGAATGCAGAGGCCAAAACCAAATGTGGAGAGGGCAGCTGTGAGACAGGGAACACTGATACTGCAGACAGATCTTGGAAAGGCAAAAACTGATTGTGGTGAAGCAGTGGAGAAAGATTTGATACACTGTGAAGACAAAACAGGCGGTTCACTTCTCACTGCATCTGATGCCATCCAGGCACACTTGGAAGTATTAGAGAAGGAAGCTGCTGCAAATCCTGAGAAGTTGGCTTCCACACATGAAAACCCGCATTCCCTGAAAGAGTCCTTAGAATCTGAGAGCTGTGAACAAGTAAAAACAATTCCTGGAGGTGATTTGAAAACTGGTTCCGATTCTGATACAGGAGATTCAGGTTCTCAAAAACAAGAAAGAAAAGATAAGCCAGCACAACTATTAAGGGGTCAATTTCAAAGGCCAAAGCCTAATTTAGGAAGGTCAGCTGGAAAAAGGGAAGTGTCAGGAGCAGATAAAGATGTATCTGATGACAACACTGATAAAGAAGAAAAAAGTTTGCAGTCTGACTGTGAATGCAGCTTGCTTCCTGACCTAGACAAAACAGCGAAATGTGATGTCCTGCCTTTAGGAAAGAACGACCTTGCTGACTCTCGGGAGGTATCTGTAATACCATTAGTTAATCAGTCCCCAAAGAAGCTGTCAGGATCTGAGAGTGATGAACCCAGCAGATCTTCTCCACCTGCAGATAACGAGGAAATTGCTGCACCTGTTGCTGTAGGGCTTTACAATAAAAATATCCCTCAAGAACAAAGTAAACCAAGCTCTCTTCAACCAGCCCAGTTAGTGAGAGGCAGATTCCAGAGGCCCAGGCCAAATATAGGAAGAGGAGTTGGGAGGAAAGAAACACGACCAATGGAAAAAAATGAATCTGAAGTTGAGCAATCAATACAGCATAAACATGAATCTTCCAGTAGCTCATTGACCACAGTAAAGGGTGAAAATGAAGTCATATGTTCTGAACCTTCAGAAAAATTGTTGGATTGTGAAAAACAGACAGAACAAGAAGAATCTCAAGTGCCCAGTATTTTACAAAATGTGTCAAATGAACAAAGCAGCATTAAAAAATCCAGTTCTCTAGAAAATAAACCAGGTGCCATCAGACCAGCACAGCTTATGAGGCATCGGTTCCGGGGGACTAGACCAAGCATAAGAAGGCTGTCTAGCAAGACAGGAGAACTATCAGCAGAAAAGAATACTGCTCCAGTTGAGAGAGAAGCAGGACAAATGGAAGCGAGTCTTCTGGAACATGAAGATTGTAGTGTTAGTTTTTCTACCAAAGCTGAAGTGGAGACACTGACTGTCCTGGAGGATTTGTCCAGAAAAGATGATCCGGATTTCAGTGCTGTCACGTCTTCTCCGAAAAAAATCATTCGATCAGAAGAAGTTTCTTCCTCTGAGAAATCATTGAAATGCAATAGTCAGAGAAATGAAGTGGGCTGTGTGTCAACAGAAGTTGTGGAAAGCCTTCCAGATAATTCTGAAGGGTCGAGTGATAAATTTACTTCTGAAGAAGAAAGCAAGCCAAGTAAGAGAGAACCTTCACAGTTACGGAAAGGCCATCTACAGAGGCCTAAGCCAAATCTAGTGAAAGCAACTAGAAGGAGAGAAGTGCCAGATGAGGGAGAAAGCACAACTGAGGATAAGTGTGATGCCGGAAATGCAGATGAGGATCTCATTCTGTGTGGGAGTAGCAAATCAGAAAAATTAAATGTTTTAGTGCATGGCTCTGCTAAGTTAGCAGATGCAGCGTCACCTTCAGAGGTTTCAAGAAAAAATATTTCTGAGGAATTGACCCATAAAAGAAGCAGGCAATTCAGAAAATTCCAATCTCTGGAGAGATCGTCAGAGAGTGAAAGTCAAATAGAACAAGATGATTCTCAGCCCTCTGCTGCTGAAGAGAAGACTTCAGACAAGCTGACAAGAAGGCGGCGGAGAAGATCATCCAAACAAATAGCCCTGCCGAAACGAATCTCTGAGCTAAGAGCAGCTACTTCATTTTCATCTGAATTTGAGGCGGATCATTCTGAAAAGGGGAAATGGTGTCGGAAGTTCAAACCAAATGTCACCAGAGGCAGAGGCTCAAAACCTGCTCGCAGCAAGAAATCTGGGAAAGACCATAGGAGTTCCAAGGTAACCTTGGTGACTCTCAGGGCTTCACAGGAAGAGGATGAAGATGAGGCAGATGACTTTGAACCGGATGATGAAGATGAGTGTTTTGCTCCAGAAGAAGTAAATAAAGCTCCAGTGTTTGTTCCTGTAGGTCTTCGATCTCCAAAACCTGTTCCTGTCCAGATTGAGGAAACCATGGAAGAGCTTGAAATTTCTGTGAATGTTCCAGATGTGCCATGTGTCACAACTGCTGAATCTGTGTCTCCTGATTTAAATGTACCTGTCCAAGCTGGGATACAAAGTAGTGAAAATTCGAATATCATACAAATTGTGGGAGTGACTACATATGAAAATCCAGAGACAGACACAGGGGCTAATGATGGAAGTACAGAAGCTGCCATGACCTTACTTGCAATGGGAGATCCAATGTTCCAGTTAAAAATAAGCGCTCAAGGACGGACACAAGTATTGCCTGAGCAAGATGAGCGGGATGTGGCTGATAGCTTTGTAAATCAACCTTATGCAGAGCACAGTGCAGTTCTTAGCGAGCATTCACTTCCTTCACCTGCTGCTAATAACAAACTGGTTCCACTGGAGGATGGAAATAAAATCATTCTAGAGGACCAAAGCACTGGAACGGGAATAGGTGGAGAAGACTATGCCAATGAAAATGCTGGACACAGCAGTGATCATTCTGTCCCTAAAGCTTGTAACACAAGATTGACAAGATGCCTTTTGCCAAGGCCTAAACCAAATGTTGGAATATTGGAAAGAAATGGGGATGCTTGTCAGAAATCTTACAGTCCAGAAATAGTTGTGGAACAATTGGTGCAAGTTGAAAGTGAGGACAAAACTCTAAGTGACAGTGCAGAAGAGGAGGTGGTGGAACAGAAGATCCGATCAAGTGAGAATAGTCCTTCCAGTCCAGATGATACTGCAGCCAGAAGCACAGACCTTGTCAAACAAGGAGACAAAGACGAGAGAACAGAAAAAGAGATGAGAGAAACTTGGGAAGCTCTGGGAGAGGTAAAAGCTCTCATCACATCTCCAGAGACAGAGTCTTGTCAACCTGGGCTGGGGAATGATCCTGGTCAAAGTTTTACATTTGGGTTTCGTGAAGGAACTTCCTGTGATGCTGAGAACAACTTATATGCAGTTGAATTACTTCAGACTGAGGCAAGTGCTCACAAACTTGATCATCAGTCCTTAACCAGCTCAAAGGAGACTTCAGCAGTAAGTGGTTGCGACAATGAATATCAACCAGACCTGGAAGAACAAACATTTATTTTAACTCTGGTGGAAATCCCAACTGACTCTAAAGAATACAGTGATGGGTCTGTTTCACTTGGACATACCTCAGAACCATTGCTGCCAGCCCCAATAATACTCAGTCCAGTCAATACAGATGGGGCAAAAACGGTGGGAAAGCAGAGCATTGGATCCCTGACACCCATAGTTGGTGAAGTTCTTGCTCCATCCTTAGACAACTGTACAGAAATTGAAGGACCACAAAGAACTTTAACAGAGCCATTTCTTAATTTGGAGTCAACGCCTCGGAAAAGGCGTGCTACTGATACTGAAGATAGCAATGTTCCTCCTGCCAAGAGGAGTCCAGCAACTTCAACAGAAGATAAGCTGGAATCTTCAGTTAAATCGATACACGCTCCAACAGAAGTTGCTGGAAAACTTTTGGAAAACTTGAGGTCTTTGAAGAAGAAAAATGTATCTACCTCAGCGTCTTTGTCTACATCTGCAGATTGGCAACTAGAACAAGGAGGCCAACATAAATCTTTGCAGAATGTAGAAACTTTACCACTTGAAGATAAATCAGCATGCAAATATTTAAATGAAGGGGGATCTGGAATATGCCCTGAGATAAAAATAGGAGCCAGTGAGCAAGGACTATCTGTGGAGGTTCATGAACCTGAACAGTCAGGACATGCTGGAACTATAGCAGCCCCATCAAAAACCCTATTAGTCAGGCCTGGGCGAAAACCTCTGGGATTTTTATCCTTAATTTGCAAAAAGAGTAGCCCTGATGTTGGAGAAGACAGTAAAGGGAACAAAGAGAAATTCCAAAAACCTCAAATACCTGCCTCAAAGCGAAGCCTGAAAAGGTCTGCTCCATCCACAGAGGACAAGAGGCAGACTCTAGAGCCATGTTCCCTTCCTTCTACAAGCACATCATTTGCTGAAGGAGAGAATACAGCAGCTACTGTAGTAAAGTTCAGTGCATCTTCAAGGGTTTTAGACTTCAGATCCTAGGTTTGATATCTGGGCTGTGGTTTGGCAGTTGTCTGCAAAGATGTGGACCTGATAGACCCTCTGTCTTGCTGCACAGAAGCAGAGAACTACATCCATGCATCACACCCTCAGAATCTCAGC
>XM_006020837.2 PREDICTED: Alligator sinensis neuronal differentiation 6 (NEUROD6), transcript variant X5, mRNA 
AGGTTGACAACCCTTAGGACCTTTCATAATATAAATCTTAATACATAAATTCCTATGGAGAGTAATGGGGTTTTAACCTTTGTTCTATTATACGGATTATACTATTCCATATAGAATGTAATAAATGTAATGAATAGTGCAGAACTTGCTCTCTCTAGCATTAGCCTCTTAACTTTTAAAATCTTGGCCACTTCAAAAACGTTTATCTTTAAAAAGAGGCCCAACCTAGATAAAGTACTAATGACCTTCAGCTTCTCATTGCAATAAGAAAATAAAGGTTGTGTGTTAATTGAGCTAAAGTGTCTAAAGTTCATGTACACCTAGACACACACCTGCCCACATGCACACACATGTGCACACACACATGCAATTTTGCTGTCTCCTCCTCTACAAAAAAAAGCCCAACCCGGATTTAAACAAAACTTTGAGAAAACAAAAATAATTGGATTGGGGACGAGAATATTAATGCCAAGCTTGGGCCCAATGTGAATTAAAGCAGATGAGTTATAAACCCTTCAAAAACAGGATTTATAATGGAAATGCTGACAAAGACCCATAACAATAGCAGCTCTGCCAGGGATTACTTTAATACTAAAACCGTATTCAATCTCACTTTTTAAAACAGAGATTACGGAGTCACTAAAAAGCTACAATACGTGACAATAGTAAAAGAAAACTTTAAATATTTTTCTATCTTTGACACTGCATTCTCACTTTAACTCTTGCTAATATATTGCTTGCGCCTGACATTTCACTCCTAAATAAAATAAAAAAGCACAAGGTGGAGTTTACCACAGGCTCCAAAGCAAGGCTTAGCTGAAAGGCTTTGTCAGCTTCATTTAACAGTTTCTTGTCTTGTTGATGAGAGAGACAAAAGGGTTAAGGCAGAAAGAACAGATAGTGCAAGAGAGACAGCTGACCGGGGAAGAGAAAATGACACTAGAAAAACAGAATGAAGAAAGGAGAAGAAAAAGAAGCAGTTGGAAAATGGATATGCAGCTAAATATTTCAAATCTCATCTACATTTTTAAAACAGAAAAGACCTTTTAATTTTTAAGGAAAAGGTTTAAGAGAAGGCAAGACACCTAGAAAGAAAAGTAAGGGGAAATTTTTCCGATTCTCACAAGTTATTAAGAAGGGCTGCACAGGAAGCAATGGGTGAAAAGTGAGTGTATACATCTATCTTGCAAAGCACTCGTTTCTAATGTCAGAACACGTTTATATTCTTGAAGCCTTCTAGTTTTCATCTAATGTCTTTTCTTTTTTTTTCCAGGGATATTACAAAAAGTCACTGATGAAAAGAATTTGAGTTTTTCTTCTATAGACTCCAGCAGGATGCTTTCTTCTATTATTTTGAGATCTGGAATAGCACACAACCCTTTAAACACATGCACACACAAAGATTGCTCACGAAAGTATCACCCAAGTATTATGCCCTCTTACACATAAAGCTAACCCTGTGTAGGTGTGCCCTAGTGCCTTCATTACTTTCTGATTTCTGGTTTCCTTTCACGGCTTTTTTTCTGGGTACCCAGATGCACAGATTGGGACCCTGTTCAATGCAACACAACACTTTAAATAAAGACTGCAATATTAACAACTACGGAGCAGTTGTACCTGCAGGTAGGGATAAAACTGAATGTTGGCATGTCTGACAATATAGACTGACTGCTAAACAGAAGCAGCTCCAGTAGAAATGTACCTACTGTATGTGAAATGCTGGTGCAGATTTTTTTTCTCTCTATCACTCTAACCTTCTGTGTTGATACATGAATGCTGGTACCCACTTACAGGGATGCCAGATGATCAGTGCAGAATGTAGGTCCCAGGAGAAAGGATCACATGGTTTTCTCTGCCTTGTGACGTCACTAGCAGATGGCATGGGTACCAGCTCTGGCAGTTGGCATCAATGTCACTTTTTAGAGATCAATGAGATAGTGCAGATATACACAGATCTAGACTCCAGGAGACGATGCGACATTCAGACTGAAAAGATTTGGAAGGCAAAAAATGAAAACTGATTGTTGAATGAAATAAAAAGCTAAGGTAACGTAAGATTATAGAACCATGTTAACACTACCGTTTGATGAGTCTGTTGTAATGCCAGAATCCCAGATGTGCAGAAAGTTTTCCAGAGAAAGTGAGGACCAAAAGCAAATTAAAAATCCAGAAAGCTTTTCAAAGCAGATTGTACTCCGAGGAAAGAATATCAAAAGGGCCGCTGGTGAAGACACAGAAAAAGAAGAGGAGGAAGAAGACAGAGAGGAGGAGGATGAGAATGGTTTACCTAGAAGGAGGGGCCTTAGGAAAAAAAAGACAAGCAAGATAAGAATGGAGAGGATCAAATTCAGGCGACAAGAAGCCAATGCTAGAGAAAGGAACAGGATGCATGGCCTTAATGATGCTCTGGACAATTTAAGGAAAGTGGTCCCTTGTTATTCTAAAACACAAAAACTGTCTAAAATAGAAACATTGAGATTAGCCAAAAACTATATTTGGGCTCTTTCTGAAATCCTGCGAATTGGCAAGAGACCTGACTTACTCACATTCGTCCAAAACCTGTGCAAAGGTCTGTCCCAGCCAACTACAAACTTGGTGGCGGGGTGCCTGCAGCTGAATGCTAGAAGTTTCTTGATGGGTCAAACCGGTGAAACTGCCCATCACACAAGGTCACCATATTCCAGCTTCTATCCTCCCTACCACAGCCCTGAGCTCAGCACTCCCCCAGGGCATGGAACTCTGGACAACTCCAAGTCTATGAAACCCTACAATTACTGCAGTGCTTATGAGTCCTTCTATGAAAGCACTTCCCCTGAGTGTGCCAGCCCACAGTTTGAAGGTCCCTTAAGTCCTCCCCCAATTAACTATAATGGGATATTTTCCCTGAAGCAAGAAGAAGGCTTGGACTATGGCAAAAATTACAATTATGGCATGCATTACTGTGCAGTGCCACCCAGGGGTCCCCTTGGGCAGAGCTCCATGTTCAGGTTGCCTACAGAGAGTCACTTCCCTTACGACTTACATCTGCGCAGCCAGTCTCTCACCATGCAAGATGAATTAAATGCAGTTTTTCATAATTAATGAGGAAAATGAAAATAAACAGTGGTCATTCACCTCCCCATCTAATTAAGATAAAGCAGATGCTTGTGCACTACGTAATTGGCACAACTCTAGTTAGCGTGTTTACTAGTTTCTAAAGTGTGATTCAACTATTGTGGGAATTTTCTATGTACTAATAAATCTTTTTTCCTATAAGTATTTTTCCTTTTTTTTTTTTGTCTGTAAACACTGTGAGATTCTGTTTCTTACCAGAGAATTTCCCCCACCCCCTGCCTTTTTTTCCCTATTCGCTTGATTTGTTGAACAGTGTGTCTAAACAATATCATTGAAATAAAGGCATACACACTGTATAAAGTCAATGTCTATTTTGATTGTACAATTTGTAATTATACAAATGCATGTTATTACATTCAGATGAATAAAAATAATGTATTTATAATGAGTAGAAATTATATATTATGTATTTAAGAAATGGATTTTAAAAATTCTGAAGAATTTTAAAAATCTATCCCTGAATTGAGATGGGCTTGTGGGTGTAGGGGTTGGGGGACAGCAATATTTAAAGCTATGCAAAAATAAAAAAAATTTTGGAGGATGGGAGGCCTGTAAGATTAAAAAAGAGGTGATCACCACTGACTGTTTGCTGACAGGGGCTAAATAATGTTAGACAATGTTGTCAAAATTTCACATCAGTTATTCTAAACCTAATCATACAACAGTATCAGCACCTTTTTGTATTATTCTGATTTCAGATGTAAAGGTTTGTTATAACAATGTATAACTGTGGTTTCGCACTACATATTTTAAATGCAATTAAACAGAGATGTTTCCACTTTTAAAGTATATCTCTTAGCTGTGA
>KM473888.1 Uncultured bacterium clone 2010ECS-StA#2600 16S ribosomal RNA gene, partial sequence 
GGACCCGCACAAGTAGTGGAGCATGTGGTTTAATTCGAAGATACGCGCAGAACCTTACCAACACTTGACATGTTCGTCGCGACTTTAAGAGATTAAAGTTTTCGGTTCGGCCGGACGAAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGTTAAGTCCCGCAACGAGCGCAACCCCTATTACTAGTTGCCAGCACGTTATGGTGGGGACTCTAGTGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTATGTGTAGGGCTACACACGTGCTACAATGGACGGTACAGAGGGTCGCCAACCCGCGAGGGGGAG
>XR_005569779.1 PREDICTED: Styela clava uncharacterized LOC120344705 (LOC120344705), ncRNA 
GCAAAAGCACTCTTAAAATAGCCCCGAAAATTTTGTAATGGTAAAGTATAGGAAGAATTTTCTGGGGGTTAAAGGCGGGGAAAGGTCCATAGAGAAATTCTCATTCGGCAAGATAGGCAGGAGCCCAAGGGACCCAAGCCTTATGGGACACGGTAATGGACATAACGATCATTTCAATATTATTTTGTTGAACACGGAGTGGACAAAGCGATGGTTTTGGCGTTATTGGACACGTAGTGGACATAACAATCGTTTTGTTGTTCTTTGACACGTTTTGAAGAAATCGCTTTTCTTTTTGATTACTGGATCAATTGCTTCGGTTGCCAATTTTCAGTGGTTAAAGATAGAATTTTTCTCCAGAAGGCTATTATTTTTATTCATTTCAAAATTTTCTGTGGACTTCAAGAGATTCGTTTTTTTTAAGTAATGGCATACTGCCCCTTGCAGTGCCGATACATGGATGCGCCAGCGAGGTGGATCTTCGTCTTTGGGCTTCTACACTTCATCCGAATTCTGAATCTGATAACGGACAAGACAACAACGACTGGAAGGTTAGATTTATAACAACAACTAACTTCACTGGAAGAATCTTGGAGGAGGTGAAGTGGAGGCTTCGTCCGAGCGCTGAGCATCGGCGGGAGTGAAGGAAGATCCTACTTCGTCTACATGTCACAACCAGATCTGCCTAGTTTCACAGCGATCTATGCTTGGACACCGGACCTCGCGGCTCGTGCGAATTGGTGATCACAAGAAAAATAGCGGCACACGTTTTTTATTTCGAACATTTCAGGAAGGCTTTGCTACGCTTGAGCGCCGAAGGATTCGTCATGGTTTTGCTATTGAAGCAAGGGAACAAGCTTCATTCTTGTGTTTTGGTATAATTTGTGAAGGATTTTATTATCATGAACAATTAAAAAGTCCGTTGAGTTAGGAATTTACCACTTTTAAATTCATTTTGGAATTCAAATATGGAGAATTTGAAGAGCTTTATTTCTACGTAGGAAACATCAAGCAAACAGCAAGAATTGGATTGGATTACTTCGTCATTGCAAAACGTTCCACAACATCACAATAAAACATCTTACATCATTCAATTGTTTTACTTGGGCATAACACAAGTGCATCCTGTAGAATTCATCACCGTCTCTCTAATCCAGCGTCTCTTTTTCCGAAAATATACTTGAACCGGGGCCTTAACTTGGACACTTGCTAGACTTAAATTTTCTTGGCGAGTTGCCGGATCTATGCATCCCTTGCAGAGACATTTTGCGCTTAAAATTACCCTCGGGCGTCTGTAAAATGTAATTTGTTTTAAATAAAATAACATTTGATTGTGACTCCTGTATTTGCTATCGGTGATGTTTCACTAATTTAATAAA
>XM_047271736.1 PREDICTED: Hydra vulgaris uncharacterized LOC124808573 (LOC124808573), mRNA 
ATGTTAAAGTTCCAAACTGAAGATGAAGATGATGACCTACCTATAGTTTCGCAAAAGATTGAAGTTAAAGAAAAAGAGATAGTTCCTAGTTTAACACTGAAGTTAAGCAGAGTAAAAAAACCATTTGAATATGATGATGAGGATGACATACCAAAGTTATGCAAATCCTCAAGTAAACTAAAAAGTTTAAACTTAGATTCTGTGGCATTAAATTCAAGTAAAGTAGTTGATGATGACAATAGGGAAAAGTGTAAATGCATTGATAAGTTAAGGAAAATTGGTGATGATGGAGTTTCGTTTCGAGAGATGACAAATAAACAATTTCAATATGCTTTGTTTATGGACTTGCAGAAAAATTTTCGGCAAATCCAAGAATCACAAGCACAAATCCTTGATAAGCTTAAAATAATTAAACAAAGTGGAGATATTGATTTTGATGTGAATGTTGATGATATTGGTAGAGACCCTATTAATTCGATTGAGCAATTTGATGTAATGGAAAATATTTTAAATACAAGTTCTAATGCAAGAAAACGCAAGGTAAACCATAAAATATAGTAACAAGGTCAGTAATCTTTGCAAACCT
>XR_769696.1 PREDICTED: Tarenaya hassleriana uncharacterized LOC104800274 (LOC104800274), ncRNA 
GCGGGCGGCGCCTCCTTCTCCTCGCCTTTGCGTCGCCTCGTGGATACCGGAGAATTCAAAGTCCCAGAGAATTTCCGTGTTCCTGGAAAGCCATTGTTGTTTCTCGAGCTTGCGAATCTGATGAATAGAAAAAAGTTCATGTGGATTCGGAATTTCACGGCTCATTCCGAATGTGTTGCACCGAGTGATGGAGGATGTCCCTTGTCCAATTCACCAACTATAATCTACTTGAACTGGACATGTTCATGAAGTGGACTTCGCTGCTGGAGATAGCACGATACCAAGCCCTCTGTTATTGTAATGGATGCTTTAAAATGAATCAAGCACTGAGTGTTTGTGTTTCTGCTCTTTCATCAGATATCCATCTGGTATTGTTGATTTGTTGTTCTTGCAGATTCTTATTTGGACCAGTGTTGTCAAATGGCGGCCATGGCCCCGCCATGGCGGGATGGCCTGGCGGATTTCAAGGTAGACGCCATGGTATTTGTATAGCGTGGCGTGTATGGCGTTTTCGCCATTGCGTGCGCCACATGGGGTTTTCCATTGTGGGTTATGGCGGCCATAGCCCCGCCATGGCGGAATTGCGTATTAAAAGGGAAAGTAAAGTCCAGAAAAAAAAAAAGGAAAACACAAAAATGGGAGATATCGAAGCGTCGGTCGAATAGTTTAAGATTTTGGAAATAGAAAAA
>XM_033481735.1 PREDICTED: Megalopta genalis pericentrin-like (LOC117226934), transcript variant X11, mRNA 
GGCCTATAGATACAATACCACACTGTACATAGCTATTCGTATTTTTATAAATCGACAACGGTCAAACGTTTATCGAATCGGTGGACGGTTTGAGACACATGCTTTGAAATGTAATGGATGACGATTCTGCCACTGGATGTTATACAATTAATTATTAACATCGTCTATTGTTGGTCGATTATTAAACGATCGTCGATTTGATTTTATTAATGAAATGAGCAAAGTAACGGACGATGATGAACGTAGAAGACGCTCTTTGGAAGCAGGCAGAGAAATGCTGGAGAAATACAAGGCGGAAAGAATTAATAAAGCCAAAGGCCCGGGTCATAGTCAAACAGACGATGCATCGGACGAGGAATCTTTTCGTATCGACAAATCCATTGGACGCAGAGAATCTTACATGCACGAGGGTGTATCGTCGAGGGATGTCACCCAAAGCAGCGTCAGTATGAGCGAAGGAGAAGCCGACGGCGATTTGGAAGGACTCGCCGGGAGGGTAGCTCAATTGGAAGAGATGCTACAAGGAAAAGAAGCCATAGTCGAAGCTTTGCACGCCGAGATAGACCACTTAAGAGCAGAGGCTTCGTCCCCTAATTCTTCGCAGAGTCAAAACAGTAGCATTCATGGCAAAGATATTATATCGTTGTATCATACGAAGTTGCAGGAATTTGAGAAAGCTATAAATAAACGTGATAATTTGATAGAGGAGTTGACATGGTCCCTGCAACAAGCACTATCTGCCAGAGATAATCTTGTTACTCAGTTAAGTTCTTTAAATGCTGTACAAATTCCGGATAAAGGTCGGGCTGGTACTGTAAATAGCGCAAACATGCAGGACAAGATCGACGCCTTGGAAGCTACTCTAAGCAATCAGAGATCGATAATAGAAAAATTGAACGGTCAGCTGATACAGTCTCAAGAACGTGAACGTACATTGGAAATGGAGAGAGAGACTCGAAATGCCGAGATCAGCGACTACAAACTGCAAATAAACAATCTGAATGAACAGATTCGTTTGGGTGCAACTGACAAGAATTTGAATATCGCTGAGACTTTGGAACAGCAAAAGAAATACGAGGCGCGCGTCGATAAAATCAAGCAGGACATGCAACATATTTTAGAAAAATTCACGACCGAGACAAACATAAATACCGCACGACATCAACAGGAATTAAAAGAGGTGGCTGCGAAACACGAAACGGAAATCATGAATATTCAAGAGATGTACGAGGAACGATTGAAACAGTTTAAAGATGAAAATAAAGTACTAGCCGATCGTTTGAACAAAGACTTGCCCGATCTCGAAACCAGGCACGCCAAAGAACTTTCCATATTCCAAGCACAAATGGGCCATTATAAAAAGACCGTTGAGGCTTTGAAGCTCGAATTAGTAAACAGATCGGAGTCACAGCAAACCGCGCAAACCGAACTGAGCCAGTGCAAAGCAAAAGTGAACGAGCTGAAGGTTCAATATGAGAACGCGCATCAAATACAAGAGTTGGAGCATCAAAAAGAAAGAGAAATGCTAGGTGAACAGATCAAGCTGCACAAGTTACAATTGGAAGATATCACGTCGAAATATGTTGCCGCGACCGCGATTCTGGAATCGAAAGAGAGCATCGAACGTTCGTTGGAACAGGCTCTAACGAATGCCGCGACACTAAAAGATGAGAACGATAGTTTGAAGTTCAAATTGGACGACTTGTCGTCGAGATACACCGCGGCTCAGTCGTTGATTGAAAATACTCAAGTGCACGAGCGAACTTTGAGCAATCGAATTTTCGACCTAGAGAAATCGTTGTCCAGACTCAGCGGTATCAACCTTAGCACGTTCAGTGGCCTAAATGAAACAGCTTATCAAAGTTTGGACGAAGTTGCGATTCAATTTCACCTGACGAAACAGAAACTCGAAGAGAAAGCGGAACTAGAAAAGCTTCTGATCGATAAAATTGAGAATCTCGAGGGCGAGGTTCGGAAAACGACGGAGGAGCTCGAGCAAGCAAATCTGGCTAGAAAATCGTACGAGAAGCAACTGAAGGACACAAGGAACATGTGCGACAAGTACAAGTCCGAGCTTAACTCGTTGAAAACTCTTGATACCGATGGCCAGAGTTGCTCGAGAGATTTGTTCGAAAAGACCGAGAAAGACCAACAGGAGATTAAGCAACTGAAAATAAATTTGGAGCAAAAGGAAGCAGAACTCGCGGATTCTCTGAGGCAGGTACAAGACTTGTCGCAGAAATTTCAAAAATCCGATGAGGAATGTCAGCAGCTGAAAAACGGATTGGCCACTGCGTGGGCCCAATGCGCGGAGGTAGAAGAGAAGTTGAATCAAACGTTGGCGTTGAACGAAAGCAAACTCGACTCGTCTGTCCCGATGTCTAGTCACGATAATACTTCGACGATGCGAATAAAATTCAATAGAACCGTAAACGATACTACGACGTTGTCCATCGATGATACGCACGATCAAAGCAGAGACGACAACAGGCTTTTCTACGGCAGGGACGACGACTCGTCGGACACGACCGGTGTCGTGGCATCGTTGCAGGCAAAGCTGGCATCGACTTTGCAGGAAAACGAAAGATTGGCCAAAGAACTGGAACGCTCGCTAGAGGCACAGCTCGATTACAATCGAGTTAAAGAAAAACCGGAACACTACTCGACATCGATGGACAACTCGATCATGGAGAAACATCGTGTCGAGGAGGAGGAGGAGGAGGAGGAGGATGAGGCTCCGTGGCAAGAGCTAAGGACCGCGCATTCGCTGAAAGAATCTGTGAATCAACTCCGAGCGGAGAAAGAATTGTTGAGAAAGGAGATCGATGCGTTGATTTGTGTTCACGATAAGCAAATAAACGCGATAAAAGTCGAAACTGCCTCGGAAATTAGGAAAGTTCAATCGTTGGTATCGGGCGTGAAAGATGGCACAGCGGAGCTACGTGATCTAAAAACGGAATTGGAGATGCGACACGCCAAGGAGATGGAGGAATTGCGGACCTATTTCGAACAGAAATGTCTGCTGATGGAAAAGCAATATTCGGAGGAAATCTTTAGTCAGCAGTCGAAAAAGATGTCCGACAACGACAGCGAGATAGCAGACTTGACGGAAAGCTTGTATTTCGGCGGTGCCGGGGATTGCATGAACGTTTCGAACAATCTCTCCGAACGTAGCTCCAGGGTTGCTTCGCCGTTGGCGTTGGCGTTGGCGGACGAACAATCGAAACACAATACCAACGGTTTGAATAAGTACGAGCTCGAGACAACCGTTAAAGCGTTGCAACAGGAACTGCAAAATAAAATAATAGAAGTGCAGGAAGTAAAACTGCATTATGAAAAGAAGTTGGAGGAACAAAAGATGACATACGAAGGAGAATTGTATGGCAACAGAAGGGAACCAGAGAAACTGGAATTCTTGCGGAACATGGTGACTCGTCATTGTCAAACAGAGTGGGATGCGGGTGCGTTGGAAAACGGTGAATTAACTCAACTGCGAGCGGCCTACCACCATCAGTTGGAAGAACAGATTGCGCTAGCTAAATTGGACATTGTCAATGCGCTTCAAGAACAAATTCAGGCCCTCCTGTCGGTCGAATCGGAGGTCGATGATATTTGGTCGCCAGAGTTGCTAGAGTTACGCGACAAACTGACCGGCAATGCGAAACGCGAGATGCAGTTGCTGAAAGATGCTCATGCAGCGGAAGTGCAACGGCTCAAGGAGGAATACTCGCGCAACGTAGCCAGAATGATAGACCGTCATCAAGAGGAGCTGAATAAGATTCGAGATGGCGTGCCCGTCACCGATTCGAAGAAAGTCTTGGCCCAGCTTGGAAATTCAAATGTTCTTGAAGAGAGGAATAGTTTGTACAAAATCTGTGCTACCCTGAGAACCTTGGTCGAAGAGCTACTAAAATATTTTCTCGTGTGCGAAGAGGAAGTCAACGATACTCTGATCGGCGAAATTTTCAAGAGACAACCGCGCGACGGTGTCGGTAACGAGAGAACGTTGGAGAACACCGAGGACGTTAAAAAGTTGAAGAACGAAGAACATGCTAGTCCAAGTTCGTCGAGATTAAATTCATCCGGTTCGAGGATTCGACGAGTTCACTTTGCACCGCAAACGACAGAAATAATATCCATAATGAACAGCGATAGCGAGACTTGGCAAACAATATTGGGAGAGAAGAACGACATCGTCGAAAAATTGAAAGAGGAATTGAACAGCTGCGTGCAACGTTTGAAGTCCGAAAACGCCGAGATTCTCGCGATTACGAACAGAAAGGACGGGGATTGTGGTCAAGGTGGTCCTTTCCCGAAAGAGGTCGCCTGGATGAATCAAATGAACGAACAGCTCGCTTCCAAGCTGCAGGAAACGGAATCCATGATTTTGAACTACGAACAGGAAACGGAGCAGCTGAAACTTACTGTTCTTGATCTCCAAAGGAAATTGATCAACGTAGAAAACAAGAAAGAGATCATTACCGAAGGTTACGGAGAGAACGACGACGTCGGCGTAGAAATTACCTTGCAAGATTTCACGCATCTACAGGAGAAAGCGAGGCACGTATTGTCGAACGGAGGAGAAGACTGTACGGTCCTGTTGCAACTGATAGAGGAATTGTGTAGACAGAGCGACAAATTGATGGAGGATGCCAGGAGAGAGAAAGAAGACTTGCAGCAACAGGTGGAGGCTCTCGAGTCACAAATGAGGGAAATGTCATCCCTTATGTCCGACACAGAAGCCAGGAAGATCGAGACCGAGAGCGAACTGAAAGCAGCCATCGACAAGATCTGGGTGTTACGAGACATTATTACAGACTTGGAGCAACAGCTACAATCCAAATCGGAAAAAGAGGAGTCTTTGCAGCTTCAAATCGGTCAACTGGAAACTGTGATCGCCGCACAAACCAAGAACCAGCAAGAGTTGGTACAGGAGCTGGACACGGTTAAAATGGGTAGCGAAAGTAAGCAGCTTAACGAGCACATCAATCACTTACAGGAGGAGTTGAGGAAACACAAACTAAGTTCCGAACAGTTTAACGCGAATTCTACCGCTCTGAAACAAATGAAGTCGGAGCTTCGCGAAATGCAGATTCAGTTGGACAAGAGGATCAAAGAATTGGAATCGATACATATGTGTAGCTCCAATTTAAGTCTGAGTCAACCTAGCGAGGACGTGTCGATCAGAGAGCAAATCGACGCGGCACGTTGCCCTACTCCGGACGATCCCAATTCACCGCCAATGTTGCCGTTGGACCAGTTACTCAAGCTCAAGGAGAAGATGTCGAAACACGCGAGAGCCGAGGAGGTTGCGTTCAAGAGAATCAAGGATCTAGAGATGCAGGTGGCTGCATTGAAGAACCAGAACGAAGAGTTGCAAGCGGAGCAGGAGATCTTGCAACAGACCACCTCCGAACAATTGTATCAAATCGAAGCGATGCGCGGCCGTCTGGAACAGCACAAGCAGAATGCGCCCTTCGCGCAGAGGCAAGCGACGTCGCGGCTCGAGTTGCAGCTTCACGAAGCAAATACCAAATTCCAATCGTTGGAGTCCGCCGTAGCGGAGAAGGACTTGGAATTGAGGGACACGCTGAATCAGTTGGACAGAGTCAGCCAACTGTTGCAGGAGAAAGAATCGGAGATCGCGAATGTCGTGCAGGTGGAAAGGTCTACCATCCAGAAGCTGCGCGAACACTTGGAGATCGTCGAGGAGGAGAATAGAATTTTACAAGCGAAAGTCGGCGTTCAAGAACACTCTCAACTCGAACTGCCGCGGCTGATCGACAGCATGCTGGCCGACAAAAACGAGGAAATCGACCACATGAAGGACCAGTTGTCGAAAAAGGACAAACAACTGCAACTCTATTCCTCGTTGAACCTGGACGAGACGCAACTGAGAGAACTGATTCGACAGACCGAACCAAAGAACAGTGCCCGTACGTTGAGCGACATTCTGTCGATTCACTCGGAATGCGAGGAAACGTCGGAGGCCGTTCGTGGAACGAATTTCACTCAAACGTTGCCAAGCGTATCCACTTTGAGAATTCCCACAGCATTCGTTTCGGCCAAAATCATGGACGACACCGCGGCGCTTTCACCTTTGGACAGCACCGCCACCAGTAACACCGGCAAGATCGGACTGCGTGTACCACCGTTGGACCTGGGCTCTCGTTCTCAGAGTTTATCGGCCGCGTCGAACCAACAGTCCTCGGAAATGGATTTGTTGCAGCCCGCTGAACCGACCTCTAGGAACTCGGAGGAGAACGACGGCACACCGATGAACGACAGCGAGAAGAAGAACGAGTATGTAATCGTCGACGATAAAGTCGACGGCAAAGTCGACGACGAGTCGCTTGTTCGTTCGGTGTGCGTCACTCCGCACGTGAAACATGTGGAAACTTCGATCAACGAGTACATCGAGGAAATGGAAAAGTTGGAACATCAGTTGGAGATCGTTCGAGAAGAGTTGCGAACGAAATCCGAAATTTTGGCGAAACGCGAGGCAGATTTGCTGTCGCTGCAAAAACTGTACAACGAGTTGCAGACGGAAGTTAAAGAAGTCGTGGAGACGCTTACCACGGACAAGTGTTTCTATCAGAATCAGTACGAGTTGTCGAAAACGTCCGAAAATAAAATCAAAAAGGATCTTCTGGAGGTGGAGAACGTTTTGAAATTGAAAACCGCAGAGGTCCAAGAGCAAAAATGTAAAATTCAGGTCAACGAGAAGATCATCATGGAGTTGAGTTCGGAGAATGGTAAGCTGAAGGCGGATATCAAGGAGAAGGAGCAACAACACGCGAACAAGTGTGCCTCGTTGTTGCGAGAGAACGCCCACGAGTTGGAGACTATGAGGGGCAGGGTTCTCCGGCAGGACAAACAATTGAACGAACTCAAGACCAAGAACGAGTTGCTCAAACAAGAAATCGTCGAGTGTCAACGAGAGATGACCGAAGGTTTGAACAACAGAGATCAGACTATCAGGCGACTCGAGGAAATGGTACGACGCGTTAGCTTTTCGGAAGCATCCTCGCCTTCGAACGAAAAGGACGAGGAGATCCATCATCTACAGGAATATTTGAAGGAGAAGGACAAAGTTATACGGCAAATGAACGACGACAGCAAGAGTTTGCACAGAGCTTTGGAGACTATACAGAATAAGATGAAGGAGTCCGGTAACGTGGTCGAGCTCAGAAGGAAGCTGAGAGAAGAGCAAAAACTGAATGCCGAGCTGAGGAACGCGATGGATAAGCTGAACAAGGAATTGTCGGATTTAAAGTTGGCCACGCAGCGGTCACAGGAGGACACCGACATCGAGGACATGGTGCAGAGGGAGCTGAATTTGTCGGCGCATCTCGACAGACGGCTGATGAATGCGATCGAAACCGACCAGGAAGATGGTATCTGTAAAGTGGAGAATCAAGTTCAAACCAGAGGGCCTCGTCGGGAGGGCGTTCAAAGGAGCAGCGAATTAAAGCTACAACTGAGTCAGGCGAATAGGATCAACGACGAATTGAAAAAGTTGAAAGACGACTTGGAAATCGAAAGGGGAATGTTAAAGTGTCAGATCGCTGAGTACGAGGGCCGGATCTTCCAACTTAAGTCTGATCTAGCGATGGAGCGCGAACAGGTTGCGAAGCTCAACGAAGAATTATTCGCCGAGAAAAGCTTGATTCGGAGCTTGAAGATCCAAATCGAGAAGGAGCATAGATCGATGGAGTCCGGTCACGTGCAGGACTCGGAGTTGATCGAGTTTCTTCAGAATAAGCTGAAGACATCTCTGGACAACGAGGCGAGGCTGCGCAACGATCTTTCCTTGTTACGACAAGAACACAAAAGCCTAGAGATACAGCTGAGTTTGATGAAGGAACACGTACAGTCCCAACAGTCCCAGAAGTCCGACGAATTGCCGAAACTAGCGGACCTTTTGGAAACTGAGAGGAAAAAGTATTTGTCGGTGATGGAAAGCTTGGAAAAGGAAGAACGTAATAGCGCGGAACTAAAGGATACTTTGAGGAAGCTACAATCGGAGAAGAATCGATTCGAGAAACAGCTGGAGGTGGAAGTGGAGGAGAAAGAGAAATTGATAAGCAGCCTTGCTCTGGTCGAGGGAATCAGGGACCATTTGCAAACAGATCTCGGTCGCACCAAAGAGGAGTTGAAAGCGCGGGAGGAGGAGTGCGAATGGCTCCAGAAGAGAATCAAGACAACGTCCGACGCGGAAATCAAAAGGCAAGAGCAAAGGACCAGTGAACAGAATCAGCTGAAGGGATTGAGGAGGGAGATCAACAATGCCAGAGAGGTGATGGTGGACTTGGAAGCCGACATGAAACAGTTGCGTGAACGCGAGATGAAACTGACCGAAACGGTGGAGAGTCTTCGGGAGAAAGAAACGTATCTGCTTAAGGAATTGTCCGCTGCCAAAGACGAAGAGACAAAGTTGAGGGACACGATCGCCGAGTTGCAACAGGAATTGAGATCGTTCGCAGAAAGGGAACTGGAGTTAGCTAGAGAATTGAAAAACAGGTACGGTGGCGACAAGACCGCCACGCCTACCAAATTGCTGCAGAAGATCAAGGAACTCGGCGACATCAACAAAAAGTATCTAAACGAGAAAAGCATGCTTCAAGAGAAGCTTGTGAAAGCGCTGGAGGATAAGGAGCAACTCGGTCAACGAGTCAAATCGCTCGAATCTCGTTTGAAGAGAGGCATCGAGTCTCGCGATGCGAACGCGGCGATCGGTGGAGATTGCGCGGACAAGTTGCAACACTTCTATGGGAAATATATACGAGCCGATAGCAGACGCAAGGCTTTGACTTACCAGAAACGTTACCTGCTAACCATCGTAAGTGGTTATCAGATCTCCGAGGAGAACACATTGTCCATTCTGGCGCAATTGACTAGCGAACAACGATCCTATACCACAGCAGGCCGTCATAAAAAGTCTCCGCGAGTACGCTTCAAGAGCGCTGCTCTGGTACTCATCAGTATCCATAGAATGAAGTGGCTGATCGTTAGGTGGAGCATCGGCAGAAGAATAGGTGCCCAGACGTTGCTGTGGAACGTGGACCAGTCGTACGTGCCGGTACAGAAACTTGCCATGGATCATTCTCCCCCTGTTCGAGAAAGACCTGTCGCAAACGAGGATGGTAATTTCGACGGATTCGCGCTTGCACAGTATTATCAACGGTTAAAAAACATTCAACAGACATTAGGTTTAGCGATGGCTGAATCTGTAAATTGTCAGATTCATCCCGAATAGTATTATATATTATAAGAGCGTTCGAGTCTTCGACACGCGGGGTAAGGCAAGCATGATAAACGTACCACGAAATCAAGTTGTGTATAATCGCGCGTGGAATTGATTGTCAAACGGGTATTTCAATCTAGGAATATTTTGTTCGGATTTCATCGTTCGCGGGCATGTATTTTTCTTATGGCATGTAAATAGGATTGCAGCATAGTAACTGCAATTGTTGGACACGCGTCAAGCCTTCTCACCGATTACCGCGTTGTGTGCTTTTTAAAGAGTTGCCACTGCAACATTCGACAACCCGAAAAAGAGACTAGAACGTTTAGTGCTAAATAATTGTGCTCATATACCAAGTTTTACCAAAGGTACGATAGACTTTAGTTATAATTGTACTTTGTTAATCCTTTCAAGAGGATGTGAACCAGTGCCTTGTCAACTATGCTACAATATAATAAGTGTCTAGTATTTATTTATTATCGATTATCGAACTGTAAGTTTTTATAATGTGAATAAACTCTATGCAATGGCTTTTTATGAAA
>XR_006348224.1 PREDICTED: Manihot esculenta vacuolar sorting protein 18 (LOC110629926), transcript variant X10, misc_RNA 
AATGAATATAAGATAGGTTTTTATGGTTTGTATAGAGAAGTTCTAGAATCTCCTAAAATAATAGAAAAATACAAAGAAATAGAAGCCATATGAAATATGAGACAACTCTGGAAAGCTGTGGTCCCCACCAAACTTCTCCTCCAGAAGCTGCTTTCGCACCTCCAGCTTTGGCGCTAGACTCCCCCAACAGCTTCTAGATAATCCTCGCAAAGTCCAGCTTTTACTCGGGCTAGCCGCGCGCTGATTTGCTTTCCTCTCGTGCGCTCCGCAGACCAGCCCGACCAAAATACTCATCCAACGCTTGGCTAAGTTTGCTCTCAAAGACTCGGGCGACAGTACCATCCTGGAGGGTTTCCGAGTGTTTCTAGCCTTCCGAGTTTAGGGGCGTTCACCAGCCCTTCCAAGTGTCTGGGTGTTCACCGGCCCTTCCGAGCTCCTGGGCATTCACCAGCCCTCCCGAGCATCTGGGCTTTTACTAGCCTTGCGACCATCCGGGCATCCTCTGGCCCCACCTAGCTCTGCCGAAGTTCCGAGTGTTTCCTCGCAGACTTCGCTCGCTTGCTCAGCAGGTTGCCTCACCAGCGTCAATTGCTAAAAGTCTCAGTCATCCTACCATCTCTCAAATTCACCCGTAGGCCTGTTGGCTCCCGTTAATACTCCGTAGGCCTATCAAAATATCACTCGATAGCTAGTTTCTCCGAGATGACTTAGCCCATCCTTATGCCGCCTACTCGGCACCAAGATTAGCGCCAACTCCTTCCAAAAGAATATGGATATTTCCGGGGAAAACTGTGGGGGTTTGTAAGTGCAAAATCTTAATTGTGGGTATGGACTACCACATCTCATGCCTGTACTTAAGAGGACCAATGGGCTCCCTTCTATGTATTTCCATGTGGCATGCCTTCCATGAACAATGCTTGATTGCCCATTTGACAAGTCATACCAACAAAACTCAGAGAGATTTTTCTGACAAACTGCCAGTATGGTGAAGTTCAATAACATTGCTTTTCTGTGAAGATGGATGAAAAACAAAAACAGTATGCCTATGATAGTTCGGGGCCCAAACATCTAAGACAAATTTCTTCAGCTCTACGGGATTCGAATATGTAATTGGGCAATAATTGTTGAGCAAAACTAAATACAGTTTATTGGCCCAACCAAGTACAGTTCATATTTGAACTGACTAATTTCTGCAATTCTTTATGAGAAAAAAACAGCATGAAATATGCAGCAGCCTGCTGCAGTCAACATTGTACTTCAATTATTGTACGACTATGCTCTCATGTTCTGCAATCTTCTGGTATATGCACCATAAGAAATCCCATGAAGGGCATAACTAAATAATGAAACAATAAATTGAACTGCAAGCTTAGTACAAGCACATTTGCGTGGCCTAAGATTTACGATGACTTTTGTTTAAGTTTTTTTTATTGTCATCTCTAACTGAGTTGGGTTTTGTATTTAGCTTATCATAAAACTATCCTGCACAGCTTCTTACTCTGCTTTATATCAATGAAACATATCTCTGCGCCATCTTTTAGAATGAACTCCAATTCTGGAAACTCTTACCACCAATCAAATTTTCTTCCTTCGGGTATTTGAATGGATGATGCAGGCTGATTATATACTGGATCTGCAGAAGCAACTTACTTTACTGGGTGAGGGAACTAGGAAAGACTTGAATGGTGGAATAACGTAAGATTCCATTGCTAGCAAAACCCCTGTAGATAAGGTCAGTTCTATGTTCTTCTGAAGCAAAATCTATTATGGTAATATGGAGTAGTTTGTTATAACTCGAGGAAAAAATTTCCTGCATTGCTGTACATTAACTACAGTGGCAGTTTATTACGTCTTTTGTAGTTTGTCTGAGCCTCATCTCTTCTCTGGTGTGTATTTTAAATCCCGTTGGAATTTGCAGCTCGGCTCACAGTTGATGATGCAAATAGCCAGCAATTGCCCATTTCACGGTGAGTTGATGATCAAAATGTTCTCCTTGCCACTACTCTCCCTGGGGAAGCACGGTTGGTAGGTTCATGGGATAAAACCACATAACCTGGGAAACCAGAGGACGCCCTATTTATAGGTGTAATAATATTACCTGTGTGTGATTTCAAAAGCCAGTGTGCGTGTGGGGAGCTTCGATGCCTGTAATGTGGCTCTCTCACCGTCTCGTTTTGAATTGGGTTATGAAGGAGAGCATCCCCATTTCCTTGTAAACCTTTTAAGTTCTTCTTAGGCAGCACCATTAGTTCTCAATAATCATGATTTATCCCTTCTGATTGTTCAAGATTTCTGAAAGCACAAGCAAATATATGAACTTTTATCACT
>XM_029702302.1 PREDICTED: Salmo trutta DNA-binding protein SATB2-like (LOC115155576), transcript variant X3, mRNA 
TACTCGCTTAGCCTAAGTTGTTTATTTTGCCTAACGTTCTGATCTCCCTCCCCCAGGTCTGATGATCCCAGTATTCTGTGTGGTGGAGCAGGCAGGGCCGGATGGGGGGATGCAGCGTGAGGAGGTGGAGAGGAGCGAGGGCCACAGAGAGGAGCATGCTGAGTTTGTCCTGGTCAGGAAAGACATCCTCTTCAACCAGCTGGTAGAGACGGCCCTGCAGGCCCTGGGGTACTCCCACAACTCTGCTGCTCAGGCCCAGGGCATCATCAAGGTGGGTCATTGGAACCCTCTGCCCATCCACTTCCTATCAGACGCTCCTGAAGCCACGGTGGCTGACATGCTGCTGGACGTCTATCACATGGTCACTCTCCACATACAGCTACAGAGCTTTGCCAAGCTGGAGGATCTTCCGTCAGAGCAGTGGAACCACGCCACGGTGAGGAACGCTCTTAAGGAGCTTCTCAAGGAGATGAACCAAAGCACACTGGCTAAGGAGTGTCCTCTGTCACAGAGTATGATTTCCTCGATAGTAAACAGCTCCTACTATGCCAATGTCTCCACTGCCAAATGCCAGGAGTTTGGACGCTGGTACAAGAAGTATAAGAAAATCAAAGGAGACTATCAGGAGAAGATGTGGCCAGGAAGAGAACATTCTGAAATCAAAGTGGAGAGAGACAGCCTGGCAGACTTCTATGTCCTGGGCCAGCGTCCCCCTCCCCACCTGGCCAGCCTGGTCCAGCTCAGCCACCTCGGAGGGGGTGGAGGTGCTCTCCTCAAGGGTGGGTCCGGGGACCCCCAAAACCCCTCCCAACCCCCCCAACAACAACAACAATCCCAACAACAACACCCCCCCTCGCCCCATGGCCAGCACCACAACAGCCCCCCTCTACGTGGCCAGGTCCCCCCTCCCGGCCCTCCAACCTCCCTCCAACCTCTCCTCGGCCCAGGCGGGCTTCTCTCCCCCCAGCTCAGCCCTCAGCTGGTCCGACAGCAGCTAGCCATGGCTCACCTCATCAACCAGCAGCTAGCTGTTAGCCGCCTGCTAGCCCACCAGCACCCACAGGCCCTCAACCAGCACTTCCTCAACCACCCTCCCATCCCTCGCCCCTCCAAGGCAGGGGCCCCTGGGGACCCTGGGAGCAACCCGTCTGCTGCGGAGGTCTCCATTGATATCTACCAGCACGTCAGGGACGAACTGAAGAGGGCCAGCGTCTCACAGGCTGTGTTCGCCCGCGTGGCCTTCAACAGAACACAGGGCCTGCTGTCGGAGATTCTGCGGAAGGAGGAGGACCCTCGCTCTGCCTCTCAGTCCCTACTGGTCAACCTCAAAGCCATGCAGAACTTCCTCATCCTCCCTGAGGGGGAGAGAGACCGTATTTACCAGGAGGAGCGTGAGCGCAGCATCAACCCCTCTGTCGGCCTGCCCCCTACCCCTACCTCCAGCCCCGGGGGCCCGCGCCTCTCACAGAAGGTGTGGGAGAGAGGTATGGACGAGCAGCTCACTCCTGACGCCTGGGCTGCTATCTGGAAGAACAAGACCAAAGCCACCTCTGTGCCCAAGCCACCAGGCCCCAACCCAGACCTGCCCCTGAAGCTGGAGTCTCTGGTCAACATCACGTCAGGTATCTATGATGAGATCCAGCAGGAGATGAAGAGGGCCAAAGTGTCTCAGGCGCTGTTCGCCAAGGTGGCTGCCAACAAGAGCCAGGGCTGGTTGTGTGAGTTGCTGCGGTGGAAGGAGAACCCTAGCCCAGAGAACCGTACTCTGTGGGAGAACCTGTGTACCATCCGGAGGTTCCTGACCCTGTCCCAGACAGAGAGGGACATGGTGTATGAAGAGGAGTCAAGGCACCACCACAGTGACAGGGTCCACACTGTACTACACCTGCCCCAAGACCCACAGATGTACTGTTTTTCTCACCAGGCGCTGCACAGGCAACCCCCACAGCCCCTGAAGCACCACTCCCCCATGCGCGAGGACCCCGTGCCCGCTCAGGGTAACGACGAAGGGTCACAGAACGTTGAAAGAGGTGGTGGTGGCGGTGGCTGCACGGGCGGTCCAGGAGTCGGTGGTTGCACGGTCGTTAAGAAGCCTCGGTCGCGCACTAAGATCTCTCTAGAAGCCCTGGGCATCCTACAGAGCTTCATCCAGGACGTGGGTCTGTACCCGGACCAGGAAGCCATCCATACCCTGTCAGCCCAGCTGGACCTGCCCAAACACACCATCATCAAGTTCTTCCAGAACCAGCGCTACCATGTCAAGCACCACGGCCGGCTGAAGGAGCTGGGGGAGGGGGCTGGCGGCGTGGACGTCAGCGAATACAGAGACGAGGAGCTCCTCTCCAGCTCAGAGGACCCTGAGTCCAGTGAGGATGGTCACGAGGAGATGTACCCCACTACTGAGAGGGAAGGAGGGGAGAGAGAGGGCAGCACAGCAGGGTCAGCCCCTTCCCTGGCCCTAGCCCCAGGCCAGTCTTCAGGGACCAGCATGGGAGCCATGGAGGAGAGCAAGGACAAGGGGCATTCTCATGGTCTGGGTGAGGGCCGAGCCAGCTCCCTGCCCCCTAGTAGCTCCTCATCCAGTCCCAGAGAACAAGCTGACTTCCAGAGATAGAGACCCAGAGACTAGATGAGACACTGGAAGAGACGGGCGGAGATAGAGAGACACGAGAGACAAAGAGACACGAGAGAGAGAGAGAGAGAGAGACGAGGGGAAGCGAATGGGAACAAGACACTGGGAGAGGGGAAGAGAGGCATAGATGAGACTCACTGACACACAAATATACAGACAGAAGGGATCTTAAGGAGGGCTCGTCAAAGAGGGATTTCAGTGAAAATACAATTTGTTACCTCAGCAACAGGGATATGCCATGAAACAGCAGCCATGTGGAACAGTTAGTATAGTATGTTCACTGAACCAATAGACAGAGAGATAACCAAACATACACATCTCACCCCTGTCCACAAGAAGAACTCGCCACATCAACACCACTCTTGAATTGAGCCAATCCCAAAATTCAGCTTCACTCTGTCCAATGACTACTCTCCCTAATGTCTCAACCGCACCCACATGCTGAGCACTTGTCCTTATTTCGATGCTGGGTCTTGAGTCAGGAACCTAACTGACAGTCATAGACTGAATACTGGGGGCCTGCTCAGACCTCCACCATCCTGTGGTCCCTCAGCTCCAGATCTACAGAACTGGCTGCTGTAGCTGTCCTCCAACTCGTCCCCCTCTCCGCCCCTCCATGACAGGACCATTCTAGTCTTTGGTCTTTGACAGTGTTGGCAGTTTGAGTGGGAGGTTGGATAGTGGATGGGTGTTGGTTGGAGGTAGGAACAGTGGTATGGGGGGAATTCACCAATGATAAACAAATATGGTGTAAGTCCAGAATGGAAGCTTATGGTATTTTTTTGAAGTTGGAATCGCCCCTCCCATCCAGCTCCCGTTGCCAACCCTCAATGGTGCAACAACATCCCTATGCGATGGACCAGACCATCCCTCTAACGCCCTGCCCCCTAACCCCCACTCTAAAGATGGTTCATTCTCTCTGTCACTGTACAGCAGTTATTACACACTAACCTAGTGTGTATGGCCACTGTGGTTTATGAGGACACTGCTAGCTGAACGTATCGTGGTTTAGGACATAAGAGAGGACAGCCTTGTGAGGACAATGAGGACCCAGTGGTGTACAAGGACCCTCAGGATAACAGTTACTCTGGTCTGTCCTCTGTCCCCCCTGCATACCCAACCTCTCCCTGTGTGGAAAGAAACAGGGAGGGGCACAACAGAACGGAGATTCAGCAACCAATCGGGTATCTGCAATCAATCAGTCACTTTATGTGCACTAGCCCACCCCTTCACTCTTCCTCTCTCTGTCCCCATCCCTCGTTCTCTCTCTCTATAATTGGTGCCCACAGTGTCCCCTTCCACCACACCTACCCACATGTAACTTCACCATATTTATTGCTATCTTTATCCATGATTATCATTATCATTATTGTTATGGTTGTTATTGTTGTTATTGCTGTCATAGCTGTTTATTTTTTACTTCTATTTTCATGCTTGTAATATTGGCTTTCCGAGCACCATGGTTGTTTTGGTAACGAGAGACGTTTTTGAGACATGAGGAACACACATTGCCGAACAAAGAGCAGAAGAAAACCAGAAAAGAAGCAGTTACTGTAACGTTTAGCGAGTAGAAATCCTGTCATGCTGTGCTAAGCAACTCACGTGTTCTTCCAAAGAGAGACGGACATTGGCTGAAACGGGAGTGGAATCCAAAAAGTAATGGAAACACAACGAATAAACTGAGCTTTTGCTACAGCTGTTAACAATCTGACATGTTTGGAGCCTTTGGAAAACACAGCAGGCTTGACCTCTGTGTGTTATGTACAAGTGTGTGTACAGTTCAGTACAAATCCTTATCTGAGAGCGGGTACTTATGTCGAAGGATGCATCCCAAAGAGAGCCCTATGAGCCCTGGTCAAAAGAAGTGGACTGTATAAGGTATAGGGTGGCATTTGGGACACAGACAAAGTAACAGAGTAACCATTATTTACCCGTCTGACTCTAGGCAGCTGCTACGTGAATGACCTGTCTTGTACTGTAATTCATGAATTAATCAATCATACAATACATTGTGTTATATCGCTC
>XM_009901592.1 PREDICTED: Picoides pubescens prodynorphin (PDYN), mRNA 
ATGGCTCGGCAGGCGCTGGCACTGGCACTTTGCCTCTCTCTGGCCGTGATGGCATCCACTGACTGCGTGACCCAGTGCTCCCTCTGCGTGGCACAGACACCCACCCCCGAGACCAGCAGCTGGCCCCTGATGTGCCTGCGGGAATGCCAGGGCTCCTCACCGCCCGGGCCCGAGTGGGAGACCTGCAGGAAGGCACTGGCGCTGCTGGCCCCGCTGGTGGCCCTGGCCGAAGGGACAGAGCCGGCCCCTCGGGAGGCGGAGGAGGAGAAGGCAGAGCCGGAGCTGGGCGCCGGAGGGCGGGGGGAGGCGGCAGCCCCCGAGGACTCCCCGGGGCCGGAGCCGGCAGGAGATGGAGCCGAGGAGCCCACGGGTGGCGGGGCCGGGGGGCAGGAGCTGGCCGAGCTGCACAAGCGCTACGGGGGCTTCATGCGCCGCATCCGGCCCAAGCTCAAGTGGGACAATCAGAAGCGCTACGGAGGCTTCCTGCGGCGCCAGTTCAAGGTGACCACACGCTCGGACGAGGACCCCAGCGCCTACTCAGGGGAGGTCTTGGACCTATAG
>XR_007834401.1 PREDICTED: Phodopus roborovskii U6 spliceosomal RNA (LOC127220836), ncRNA 
GTGCTTACTTCAGTAGCACATATACTAAAATTAGAATTATACAAAGAAGATTAACTTGGTACATTATCAAGGATTACAGGCAAGTTTGAGAATTGTTCCATATTTTT
>XM_029382818.1 Trypanosoma rangeli nuclear RNA export factor 1/2 (TraAM80_05959), partial mRNA 
ATGTCGGCACCCTACAAGAAGACGAACACCCACAATGTGCCCTGCTTCTACTTCAAGAGGGGCGCTTGCACGAATCAGCGCTGCCCGTACCTGCATGTGCGTGGGAAGGAGTCAGGCGGTAACGCAGGCGCGGTGAAATTGTCAAGCGTTACCTTGGGCTTACCGGATGCAGCGACAAATTTGCTCTCAACAATGCTGAAGCTGGTCTTTGAGAAACAGCAGCAACGGGTGTATGACGCGTCGTCTGGGATGTTGGACCTGAGCGAGTTGAGGAAGTTTCCAGACCTAAAGGACGTCTCAAACTCCATTAACTTTAATACGCAGAACTTCTGCCGCGCTCTCTGTTCGACGATAAAGTCACTTATTGTCCCACCACCCTCTGCTATGCAGTTAAAGGGAAATGATATCACTTCCCTTTTTCACCTGGCAGGCCAGATGGAAAAGGCGGATTTGCACATGTCGCTTCGGGCTCTTTCGCTAGAGGCAAATAATATTAGGACGATGGATGCACTACAGGAACTTAAAAAGTTCATGAATTTACAGGAGTTGGTGCTTGTGGGTAACCCTGTGGCAAAGCGTGATGACTACCGCATGGAAGTGAAGAAGGCATTGCCGTTTCTCCTTGGACTGGATGGGGAAGGCATCGCGGTTCCGCCACTGTTATTGCCATGGCCACGATTTGCGACTTCCGAGTACACCGACGCGCAGCGGCATGTGCTTCAGTTTGTCCAATGCTCATTGCTGAATCCACTTGAGGCGGGTGAGGTGGAGCGGGTTTCACAGGGCGTGGATGCAGTATCAGATATTTATGCGCAGAAGGCCATTCTCACCATTTCCCTTTCGTCACCGGAGGCTGCAGTAAGTTCGCCGGCGCGAAGCGTAAATGGCTTTTCATTGGCGTCTACGCAGCGCAACGTCATTCGCGAAATTGTTGGTCTCCGGCTAAAACAGACAGAGAGCAATCACAACTTGTTGCATGGCGTGAAGTCAAGTGTTGTGGCGTGCGGGCGTACAAAGGTCTGCTCACAGCTGGAACACTGGTTGTATCCCAAAAATTTTGCGGTTCAACACTTCGTGCACAGCAGTGCAAGCGCCTCGTTTCTGGATAACACGTACCTGTCTGGCCCCGCACCTGTGGCGATGAAGGTGCCGGTGACTGTGGTGACGTTGCATGGCGTGATGACGTGGACCCACCTCAGTCCGCAAAGTCAGAATAACTCTGATCGTGTGGTCATTTATCGCAACTTCACACGAGTACTTACTGTTCAGCAAAACGAGGCGGGCCGTTGGTTGGTGACGAACGATATGGTGTCACTGTACCTATTTTCGGGGAAGACAGCGGGTCTATCCAAGAAGGGAGAAGCTAACGCCGATATTTCAGCTGACGTGAGTGAGTGCCGTATCCTGTTTAGTCCCAGAACCGATCGCAGTCGCGCTGAGTTGCTTGGCAGGAAAAAAGATGTACCAGTGGAAGTGGTTTTAGCACTAAGCCAACATGTGAGCAATGATGCAGAGCTGATGGCGGTGCTCGGCGACATTGGAGGGGTGCCACTGAGCATGTATGAGCACTGCGCTGCACTAACAGGTGAGAATATACTAGAAAGTATTCAAGTTTGCCGCATAGGTAACCGGTTTGGATTGGCCCCACAGGAAGGTTTGGAACTGCTGCGCAGGGTGGGTGGTAATTGGTGTGCTGTAGAGGAGGCAATGGGCACCGCCGTAGGAGTAACAACATCACAGGTAGCATAG
>XM_017771362.2 PREDICTED: Gossypium arboreum uncharacterized LOC108470132 (LOC108470132), transcript variant X1, mRNA 
CGTTTTCTTCATCGAGACTATTCGTGTATTAACATCAATCAAAGATTTAAAATCATTTCTAGAGTCTTATCTTGGCGCTCTCTCTCACATCACTTTTGCCTTGCTCCGCAGCACGTAGGAAAACTAGAAATTAAGAGAAATTAATACTAAAAACTAATGAAAAAAAATAGCAAATAGCTCTCAATTCAAACCAACAATTTGGACTTTAGATTAATAGAATCAAGATGGAGGATTCTGGAGCAATTCTTTACCAAATTTCATGCCTCAAGGAAATGCTTGATCAGGTTAATGAAGAAATCGAATCCAATATTGAAGTATCGCGGGAGATTGAATCAGAGATGGTCAAGTGTACGGAGTTCGAAGCTGCTCTTACTACTAGAGAATCCCTGCTTACCAAATCGCTATACATTTCTCACTTCGAAATCGATGGCTTGCTCTCCGTCATCGCCGATTCAAGAAATTCGCTTAAATTTTTGGAGGAGGAGTTGAGTTGTCTAACCACGAAACGAGATGAGATGTTAAAGAGGATTGACGATAAACGAGACGGATTTACCAAACAGTGCTTAGAATTTCAAAGGGAGATTGACAAGGGGGATAACAACGAGCTGGTGAATTTGCTGTCAGAGAAAGAGCTTCTTGAGAATGAAATTCATCTCTTGCATAAGAAAAACAATGCTTTGAGAAATTCAATGTCCGCTTTTGTGGAAGAAATTCTTGAAGACCTTTATTCTTCAAATGCAGATTTTGGGTTCACATTACAAGCTCGGGGATCGTCAGCAAAGTTCTTCACACTATCTACGATTTCGGCATTTAAATATTTGAACTCGAACTATGGCATGTATAGGCTAGAAAGTGTTTTTGAAATGTTTGATTTTGGTTTGTATAATAGCCATGGGAAAATGGCTTGATGTTAAATTCAGTCTTGTTAAATTTGGTTGGTGTTCACCTTGGTTATGTAGTTATGAGCCTGGTATGTGTGATGTTGTGCTAGGTACCATGTGATACACAATTGGTTTGCTTATTATGGTAAAATTTAGTTTTATATGATCTTGATTAAAA
>XM_003676498.1 Naumovozyma castellii CBS 4309 hypothetical protein (NCAS0E01160), partial mRNA 
ATGCCATCTTTTGAAAGTGGTTCAGGTGCTGAAGAAGAAGAAGAAGAAGATTATTTTAATGACTTAGAGGTTGATCTTGGAAGTGAATTAGAGGAGAATGAAGAGGAGTACGAAGCTCTGGACATAACTCCTCAAAGTGGATATGACGATGCCTTCAATGATCTAACTAACGACACAGCTTTTCTAAATGAATTAGTTAAAACTTTTAAACCTTCTACTATGCTAAGTTCTGTCGATATGAACATGGAACCAAAGAAACTTTCGATAGTATATAGAGCGATCGAAAAACTTAAGGCAATGTTTCATTCCCAGTCAACATCATTCATTGAAGTTTTGCCTCATCTGAACGAACTTAGCCATCAGATAAGAAGAGAAATAGACATCCTTTATCAATATTCGAAAAACATATATTCGACAAGATTTACTGAACTTGATACCATAGCAGCTACCCCATATCAGTATGCAAAAGTTACATCATTGATAGAGGGAACTTCTGATGATAAGGCCGGCCAACTTCCGATCAACATCGAAATTGAAGCTAAACTTTCAAAAGAACAAGTCTTGGTGCTACGAATGTCCATGCAAACTTCATTCCTTAAGAATAAACCTTTAGAGAAGAAGGTAAAACATTTGCTTTTAGAGGCGTGTTCTATGATCATACAACTTACGGACTTGCAAAATGTTATCCTGCAATACATTTCTTCTAACGTATCTGATATTGCCCCAAATTTGTGCGTCCTAGTGGGTCCAGAGGTTGCATCACTTTTAATCGCACACACAGGAGGAATACTTCAATTAGCAGAAATACCTAGCTGTAATCTAGCGTCTATTGGGAAAAATAGACATTTATCACACGAACTTCATACCACTCTAAGTGGGGTAAGACAAGAAGGTTACATTTATAGTAGCGAACTAGTTCAAAATCAACCGATTCAAAATCACAAACAAATGTTAAGGATGGTCTGCGCCAAAGTGGCCTTAGCAGCCAGGGTTGATGCGGGTCAAAGGGGTGCTGCTAAAAACGATTTATTGGGACAACGGTGGCGAGAAGAATTAGAGACTAAGATTCAAAAAGTTACAGAGTCGCCCAATATTTCCAATGTGAAACCATTACCTATCCCAGAAGATAAGCCAAAGAAGAAAAGGGCTGGGAGAAAATTTAGAAAGTATAAGCAACAGTTCCAATTATCTCACCTCAGACAATTACAAAATCGAATGGAATTTGGGAAACAGGAACAATCTACAATGGATGCTTTTGGTGAAGAAATTGGCATGGGTATGACGAGTTCATCCATTCAACAATCGATAGGAGGTATCAGAGCTAGCTCACAACGTGTAGATAATTCGGCCAAGATTACCAAAGTGATGAAACGTAGACTTAAAGAGGCAGATTCACAATCAAAAGAATTTGCATCGTCTCTGAATTCAAGAGAATTTTAA
>XM_026930086.3 PREDICTED: Pangasianodon hypophthalmus carbohydrate (chondroitin 4) sulfotransferase 12a (chst12a), mRNA 
GTGTGTGTGTTGCAGCTTAGATTTTGACGTGTAACTACTATTTAGGACAGCAGACAGGGTTATATATGAATTTAGGACAGTACTTAAACTTCATGGTTATCTGAAGCCGTGTAATGATTACAGCAGTTGCTGAAATCTCGCGAGGTTTCGGAGATCTCGCCTGATCGTGCGAAGAGCGGTCGCACATCATTCCGGAGGAGACGACGACGACGTCTGGGTGGAGGGTCTCGAGATGACTGATGGTGATATGGAGCTTCGGTGAGAATGGAACTCTCCCTGTCCAAACCAGACAAAATGGGCAAGACGAGGCTGTTTCGCATCTTTCTCATTTTAGGCTCTGTCTTCATGATCCTGCTGATCATCATCTACTGGGATGATGTTGGAGCCACCCATTTTTACCTGCACACAACCATATCCGGACCTCATTCTTCCCGCCTCCCACCCGAGAGTCATGCAGCTTCCAAAAACAAAGTTGAGGAGGACAAGGATGGCTCGTTCCTGGCCGACATTGACGCTTTTGTCAACCAGTTCCTGGAAGGCACCTCCGACCCTACGGAGCAAGTGAGAGCTGAAACGCCGCCCGGTGAGACTCACAACCAGTCCTCAGAAAAACCCGAGGAAAGATTCGTCCCCAGGCGCGAGTGGAAGATCCACCTGACCCCGATCGCCACAGAGAAGAAGCAAAGGCAGGACAGCAGGAAGCAGCTGATCCACGATCTTTGCAGCAGCAACAGCAGCTTCGACTTCCCAGGCAAGAACAGGACGTTCGATGACATCCCCAACAAGGAGCTGGACCACTTGATTGTGGACGACCGACACGGGATCATCTACTGCTACGTTCCCAAGGTGGCGTGCACCAACTGGAAGCGCATCATGATCGTGCTGAGCGAGAGCCTGCTGGTGAACGGCGCACCCTACCAGGATCCTCTGGACATCCCCGTCGAGCTCATCCACAACAGCAGCGTGCACTTCACCTTCAACAAGTTCTGGAAGCGCTACGGCAAGTTTTCTCGTCACTTGATGAAAATCAAACTCAAGAAGTATACCAAGTTCCTGTTCATCCGAGACCCTTTCGTGCGGCTCATCTCGGCTTACCGCAACAAGTTTGAGCTGGAGAACGAGGACTTCTACAAAAGATTCGCTGTGATAATGCTGAAAAGATACAGCAACTATGTCGACCCGCCGGCGTCGGTGGTGGACGCTTTCGCTGCTGGAATCCGACCGACTTTTTCAAACTTTATTCAGTATCTGTTAGATCCGAACACCGAGAAAGAAATGCCATTCAACGAGCACTGGAGGCAGATGTACCGCTTGTGCCACCCTTGCCAGATAAATTACGACTTTGTGGGAAAACTGGAGACCTTGGACGAGGACGCTGAGCATTTGTTGCGCATCCTGCGCGTGGACAATGTCGTCCAGTTCCCACCGAGTCGTCACAACAGGACGGTCAGCAGTTGGGAGCAGGACTGGTTCGCCGACATACCTTACGAATCACGCAGACAGTTGTACAAGCTCTACGAGGCTGACTTCAGACTGTTTGGGTATCCTAAACCTGAGAAGCTTTTAAACGAGTGAAATGGGTTTCTGAGTATTTTCTTGCTGTGGGTTATTTAACTGTAGTTCATTTGGTTAATGAGTAAATTTTTTTTTTTTTTGTGGGTCCCCTTTTCTCTGTGAGCATCGCTCCCGTTTGCTTATCACACAAGCATTAGAAAGGGTTGATTAGAGTGAAAACCGATATTACATTCAAATTTTTAAAAGTTTCCTGTATACAGATTTATACTTTTTATCTTCTTTTGAGAACACATCCGTCTGGCACGCAGTACTGTACTGTAAAGTCGGGCGAAGATGTAGGTTTTAATTATTATAGAATATCACAACAACAGTAATAATAATAATAATAATAATAATAATGGCTTATGCCTTTAGTTTTTCATAAAGTATTCTTTTTACTGTCCTCAATTAACCATCATTCATAGTTTCTTTCAATTTGATTTTAAAGAAGTATGCAGCTTGAACATACAACTGCTATGTTCTGCACATTTAGGGCAGTGCACATAGAATATGTAGAATATTTTTGTATATTTGCTATTTTGGAAGAGCGAACTTTTAGCTTTATAAAGGAAAGGATTCACTGCACTCCTGTAGCATTGCAAGATCAAACCATTTTGCTGGCACTCATTAAGCGTAGCTTGTGTGTAGACATCACCTCATTTTTTATTTTTTTTTTCCATAGCATTTGCATTTTTATCACCCACCTCAGGATGCAAACACTTTTTTCAGACCTCATTTAAAATGTATTGAGTGCAAATGGATTTTCAGACGTTTACTTAGGAAAAAAAAGAAGAAAAAACCCGAGCAGTATTGGCTCTAATATGCACTCCACACAAGGTATTTCTGTTATTGCTGTGTGATGAAACAGTGTTTCTGAACATCTTCTGTTTTTTATGAATGTTTAATGTTTAACAGGCGTCAAAAAGACATTTCTTTAAAGCAGGGCAGTGCGGTTGACAGATTGGAGCTCCTGTTAGTTTTCATGGCATCTTTCCTTTCATCATTTGCATTCGTTTCTGCTTTGATTTGAACATCGGTTCCCCTGGCAGCAAGCCGCTCTCGCTTCATTGCTACATCTCTCTTATTGTCAGTGTGCCATGTGTGCCCTTTTTTAAATTTTTATTTATTTTTTTTTTATAAATGTCCATCTCTCAAGAGCTGGTCATGGATTGTGGACAAGTTTTACTTGTTCTGGTAGACTTAGCATTTAGCAAATGATGCCTGGTTTGAGTATTGTTTTGTCTAAATGCAGACTCAGCAGACGTGGAGCGGTCTTAAAGCACAAATATTTGTCCAAGGCCCTTAAACAGTAAACAGTTCACTTTAGGCGCCTGATTTGCTCTCCAGCGTTTCCCAGAATTCTCCATACGTAGTGGACTGTGTTTGCCAGCATCACGTCAGTTGTGCCTTCGTCAGCGGATGTTCGTGGACGTCCGCTTCTCCGTTGGTCCACAACACTTCCAGTCTTTTTGAATTTGTTAATAATGTGCTCGCCGTGTTTCCTTTTAAAGTCCATCTCAACCTTGCGACAGCTTCTGATCCAGCCATGAGAATGATTTCAATACGAGAATGATTTCTCAAGAAGACAATAGTTCTTCTTTTGTCAAAGGCATCTGTAAAGGATATCTGAAAAAAAAAATAATAATATAAACTAAGTATGAAACATTTTGGAAGATATTTTGCAAAAAAAAAACAAAAAAACCTTAATGTACATCCTATGTATGGAGACTTTTGGGATACCATGCAGAGTAAAGTAAGCGTGTCACAAGGACTTGCGAGGGATTTTACGTGGGAAGTTTTCGGTTTTCGGTTGCCGTCACGGTGTTTTTGCGTGTTGCATTTTGCACATGGAACAGTTCTTGTCCTGGATGAGAACGCCGTTTCTGAGAAACAGGAATGTGTTACGGTGAAATGGTGTACAGAGAGCAGGAGCGTTATGAAGCACAGTGTGACTGTAGTAGGTCAGAGGAGGAAGGTTTTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGGAAGCCTAAACCACCATCAGCAGCTGTACTAGAGGAGGCACTGCACCGGGTGCTAGCAGTGCCTTTCTTAAGATAAGATTTAAAAAGTTTACACAAACAAAAATAAATATGTATAATGTACAGGTATTTTTGTAAATGGGTCAAATTTGAGATTTTCTTTCTCACTTGCTAGTTAGATGATGGGAAAACATTTAAAAGTATTAAATTCTGTGTCGTGTAATTTTAATCCTAGGGGTTTTGTTTTAGTTCTGGCTGTATTGGCGAGATCTGTTTAGTTATTTTTCCATCATTTTCACTGTTGTTTATTTTTTTGTCACTCGATTCCCATAGTTTACAAAAAAAAACCAACGTCAATGCAGTTAAATGTCCGCACAGTATTTCCTGATGTTCTTGTGCCACAGTATTCACTGAAACGTTGACATAAATGACAGACACATGCTCGTTCGCTGGCTGATGTGAGATTTATATTAAAAAAAAAATATTCTGAGATGATTCTCCAACATGAAGGTTTTGTGTTTGCATGGAATATGTTCATTTCAAGGGAAATTGCTGTGTTTGCGATTCAAAAGGCGATGTGTATTTCTTAATGTTGCATCAACTGAAAAACATTCTCCAGTGTGCTGATCTGGAATACAGTTTTGTATTTGGCTGGTGTTTTTTGTTTGTTTTTGTTTTTTTAATTTATTACACTTTAAGGACCTTTGTTATGCAACGTCAAAAGAACAAATAAAGCTTAATGCATGGTGCAAAA
>MF557355.1 Uncultured bacterium clone 1686 16S ribosomal RNA gene, partial sequence 
GTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTCTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGGGACTTGAGTACTGGAGAGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCAGTGGCGAAGGCGGCTCTCTGGCCAGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCC
>XM_012605072.2 PREDICTED: Gossypium raimondii heat stress transcription factor A-4b (LOC105780637), mRNA 
TGTTGTTACTAAGTCATAAGACTCGTATAATTAATAAACCCACTGTTTCCTATCTCTCTCATCTTCTTCTTCCTCTTGCTTTTTCCCCAAGTTTTTATTTTGGATTGGATTAGAAACTTCCACCCACGTGTTTGGTTTTTTTATTTAACTTCATATTTTTTCCTCAATACCCTTTCTAGATTATTTTCCTGGAAAATTTCCCTTTTTTCTTTTCATAATCCAACCCTGTTTGACAATTTTACATGGGATAAAGGAATATCTACTTTCCTCTGGATTGTTCTTCAAAGGTTTTTAGGGTTTAAAGGTTTACGTGCTTTCAGTGGAAGTGATCCTGGTTTCGATTTAGCTTCTGAAAATATCAATTGTTTTGACTTTTTTGATTTAAAAAGAAAAAGGAAAACGCAGGCATATGCTTGAGTTTGAATGAAATGGAAGGATCGCAGGGAAGTTGTAATGGGCCGCCGCCTTTTCTTACAAAGACATACGAGATGGTGGACGATCCAGTGACTGATTCGTTGGTGTCTTGGAGTGAAACTGGTTATAGTTTCGTTGTATGGAACCCCCCAGATTTCTCAAGAGATTTGCTCCCTAGATATTTCAAGCACAACAACTTCTCAAGCTTTGTCCGTCAGCTCAACACCTATGGGTTCAGAAAGATAGATCCTGATCAATGGGAGTTTGCAAACGAGGAGTTCATAAGAGGGCAGAAACATCTTTTAAAGAACATTTATCGACGCAAGCCAATCCATAGCCATTCCTTGAACCGGCAAGGAAGCTCTAGTGTGCCATTGACTGAGAAAGAGAAGAAGGAATTTGAGCAAGTGATCAAGATGTTGAGTGACGATAAGAACCGGCTTCAGTTACAGTTGCAGGGTCATCAAAAAGAGAACGAGGAATATCGGTGTCAAGTAAGGCTGTTATCGGAGCGTTTTCGGAACATGGAAGATCGACAACGACGAGTGATGGTCTCATTGGCTAGGATTATAGACAAACCCCATGTTCTGTCCCAATTTCATGGCAAAAAGAGAAAGTTATTGAACTGTAACGACTTCAATGATGAATGCAACATACAAGATCTTCACAGTTTGGCTTCTCTGAATGCAAACATGGGATTGGACTTGAAACAGATTGAAGAATTGGAATCATCTATAAGATGTTGGGAAACATTGTTTCTCGAAATCGGAGAAACTATAGGTGAAGAAGTGCGCGATTTCGGGACATCCTTACGGCCTTCTCCGGTTGTTGTTACCGAAATACAGACATCTTCAGGGGACTATGACATGGATGGTGAACTTTACTCACCTTCATCACACCATTGCTCCCCTTATTCAACCGATATTAACTCATCACCTGAGCTGGTAGCCCCTGCTTATCGTCCTATCCATACACCATCATTTCACCATGTCGTAAATCTCAACCCAAAGCCTCCTGGAATTGGCCTAAACTCCCAACATGCTAGTCCACTGGAGACCGATCAGGCCTCAAAGAACCAGGCAGAAGCAGTGGCGACCGGTTATACCGTGCCAGGTAGTGTAAACGATGGCTTCTGGGAAAGGTTTCTAACCGAAGTTCCGGATACATCATCGTATGCACAAGAGATCCAGTCAGTTTAGATTACCTGGCATAGCAGCTTTCTCCAGATTAAAGAATTTAGAGTAGGTTAAGTGATAGAAGTGAGCTATGCTATTAACCATGTATTACTTCTGCCACATACTATGATGTAAGGATATTAGGTTAGAGGACTCTGTATTTTTTGGTTTACGTTTATCTATCTTCTTTCTCTTAGTTATTTTAGCAACAATTTTCACTTTGAATTGAAGGTTATTTTTTTA
>XR_002390227.1 PREDICTED: Heterocephalus glaber uncharacterized LOC110346290 (LOC110346290), ncRNA 
TTTCAGCTTTCTCCTGCCAGTTACCTCTATCTCAGGCAATATGTTTACACTATTTCTTGGTTTTTTCCATGACTGTTACACTAGGAAATTAGAATTTTCCTCTCTTATGCCCTCTGTACACTCAGCCCCCCCAGGCAGATGTATGATAAGTTGTGGTAAGATCAATATTCAACAGTCACTGTTTCATCTGTGTAAATGTTACTCCATGAGCTGTATTTATCTTCTTGTGCAACTGGGTTGCTGTATGTTAATAATTTTCCTGTGTTTGTTTTGTTTTGAGACAGGGTCTCACTATGTAGTCCTGGCTGGCCTTGAACTCATTATGCTGCTTAGGCTGGCCTTGAACCCTCCGAGATCCTCGTGCCTCGGCCTCCTGAGTGTTGGGATTGCAGGTGTGCACCACCATGTCCGGCCGTCTTGGTTTTCTAAGCATCTCTCTGCTTCATCACTGAGCGCCCATGAGTTGCTTCTCTACTGCTCCAACCCATGCGGGTGTTTCTAAGTCATAAGCCTGAGCTGGAACTTGGGATCCTCCTGCCTCAGCCTCCTAGAGCTGGGATTATAGACCTGCACTACCATGCTAAGCTTTTGGTGCCCTCCCCACCACCACCACCATGGGTCCAACTCAGGACCTTGCACTTGTGAGGTATATCCTGGAAGACTGAAATCACAGAAAATGGGCTGACATTTGCTCTAGGAGCCACGAGTCAGTCTTTCCTGGCGAACAGTTCAGGTGCATTCCACAGCTGGCTGAGTGCAATGTCCGTGTCCACGAGGCTAAGGCAGTTGGCAGTCACTGACACCATCTCATCTCCAAGTCTACTCCATCCTTAGTACAGTTAGTGTTTGCTGTCTCCTCCTGTCCTTTCACTTTGTTTTTAATGTGAATTTAGTATTTCTTTGCTGTTCTTCCTTGAACTGGGGTGTGTGGTGCACTTACCATTAAGTTAATTCAGTGAATATCTTTGGTTTATTCCTGGGAGGGAAAGTGGCTTTTGTTTATATTTGCTCTTGCCATTTGTTCCTACTTCACTTGAGTTTATTAGTTATTCCTTTCTGCCTTCCTTGAGTTAATCAAATATTTTTCACAGTTCCATTTTGATTTTTCTAGCAGCTTGAGCTATACCTCTGCATTATTGCTTCTGGTTACTCTGGGGCATTGGTGGCAACCCTGTGGTATGAGTGCAACAGCGGGCTGTATCATTGAAAGCTCTAAAAGGTTTGTCATCGCTGTTCTAGGGATTACAATATGTATCTTTTTCAAAATCTAATTAGTATTATGCTACTTTACACCAAAATTAGTAACTTTTAACAGTGTAATCCCATTTTCCCAGTCCATATAAAACACAACCCTGGATAGCATGTAGAGTCTCACAGCTAATTAAAAACTAGTTAGTATGCAGATATGGCTGTTTTTAAGTCAGTATGAAACAGTCTGGGACCTCGAGCAAACCCCACCAGTTAGCAATGAAAGAGATTTGGCCAAAGCACCCAGCAGTATTCATTTAAAAGCTTCATTTGGAGACATTCTACATGCAGTCATTCGGTGATGCATCCAGCACAGGGAGGCTGCTAACAGTGCATCCTGCAAACCTTTCAATCCTTTCAGAGTAAGAAAAGCCCAAAGGATGGATGGAACATCTGAATGGTCCCTGAGGTCTGTTTTGTTTCCCTGCTGGCTTAGCAGTCAGTCATCATGGAGACCTCAGTGTTAAATGTCACCCAAACGCCCTCACCCCAGAGACAGGAGGAGGCATACCACATGTCCTCAGGCAGTCACAGCATCCTCCTCCAGTCCATTCTTTAGGACAGCTGAGCTCCCTGACAAGGTGAAAGGAACAAAGTACTAAGATGATGAAAGCTGTATCACCAAGTCCTCCTGAGTGTGAGCATCATGCCCTGGTTCCCGTGCACTTGGTGAGGCTGCAACCAGGAGGCTAGGTACGATGCCCACTTCTGAGCTGAGCAGACAGGAAGGGTGAATTCCCAGAACCTGCTGTCAGGAACAAGCATCAGAGCAAAGACTCTAGCTCCTGGGAGAAACTCTCCAACCTAGTTGTGTGGCTGAAATTAGTAGGGAAAGGTGAGGAAGTTACGTCTATCTAAGAGCAGGAGGATTAAAAGCTGCCAACTAGGAAGGAAACTGAAATGCTTAAAAAGTTAAAAAAAAATTTTCATTGTAGTCTGATGAATATTTCGAAGTATATAGTAAGGTATTTAACAAGGACTGGTTACCTGTGTGTAGGTTAGAGATACTAAAGTGATATGGTGCGCTGTCAGCCATATGGGGTGCAGACTTCCTCCAAAGCAGATCAATAGACTTATTGTTAAAGACAACATGTGTATTGAAAGTAGCAATTTTATTTGAGTTAAAATTATTTACAAAAACCCAAAGACATACTTCATGAAACTGGTACAAACTATTTTTTTCCTGCCGTTGGCTTTTGCTCCAAAGATCACAGCTGAGAAATACTGTATAAAATAAAAATAGGATTGGATTCAGAAAAGTACTCTACTGTTCTAATTTCCAATTGGTAGTATTTACAGAAATATTTACAGTGG
>XM_028898326.1 PREDICTED: Prosopis alba vestitone reductase-like (LOC114713661), transcript variant X1, mRNA 
ATGGAAGACAGCAAAGGAAGAGTATGTGTTACTGGTGGTACTGGCTTCATAGGTTCTTGGATCATTAAGAGACTTCTTGAAGATGGCTACTCAGTTAATACTACCGTTAGATCCAACCCAGAACACAAGAAAGATGTGAGCTTCCTCACAGATTTGCCAGGAGCATCTCGGAGGCTACGAATTCTGAAGGCAGACCTAAGCGAGCCAGAAAGTTTCAAGGAAGCCATTGAAGGGTGCATTGGAGTATTCCATGTGGCTACTCCAGTGGATTTTGAGGAAGGGGAACCTGAAGAGATTGTGACCCAAAGATCCATTGATGGGGCATTGGGAATTCTGACGGCATGCCTCACTTCAAAAACTGTGAAGAGAGTCATTTACACTTCCAGTGCCTTTGCTGTTAATTATAGTGCCAAAGAAGAGGAAGTGAAGGATGAGAGCTCATGGACTGACGTGGATTCTCTTAGAACTTCAAAACCATTTGGATGGTCTTATGCAGTTTCTAAGACATTGACAGAGAAAGCAGTGCTTGAATATGGACAACAAAATGGATTAGATGTTGTCACTGTGCTTCCCAGTATTGTTGTTGGATCCTTCATTTGTCCTAAGCTTCCTGGTTCTGTTGGTTCGGCACTCTATTTTTTATTAAGTAAGAACGACCCATTTGCTTATCTGCAGCTACCTATGGTGCATGTGGATGACGTGGCAAGAGCACATGTATTTCTGCTTGAACATCCTAAGCCAAGGGGAAGATATAATTGTTCTTCATGTCTGGCTACTGTTGAAAAACCACTTGAAATTGTGTCTGCTAAATTTCCAGAACTTCAAATTCCAACCATAGAAGAAAGAGCTAGCCTGAAAGTTTCAGATCTGCCATCTAAGAAGCTTATAGATGCTGGATTTGAGTTCAAGTATGGACTTGAGGAAATGTTGGTGGATGCTATTGGATGCTGCAAAGAAAAGGGTTTTTTATAG
>XM_044451096.1 PREDICTED: Varanus komodoensis leucine rich single-pass membrane protein 2 (LSMEM2), mRNA 
CCTGAGCAGCTGATGTGACAGGCAGAAGCCTGTGTTTACTTCCCCAACCGCTCCCAAGGGATCTGCATAGGCCCCTCATAACTTCTTCCAGACAGATTTTTTTCCCCTTGAGTTGCCTCCGGAACAGCCCAAGGAAGCGGAGTCTGGCTATTGGGATGTCCAGCGAGATTGCAGAAGGCGCTATGGTGAAGGAGGCCACTTCCTCGGATAGGGAGCTTGTTGAGCCCTGCGACACTGACAGGGCAGAAATCAACCTGCATGCAGTGGAATCCATTAGCGACTTGCACTACGCATCCGGCAGACCGGAGGGCTTCAAGGCTTCGGAAGGGAGCAGCCAATCTCAGCCTAACACCCCCTGGACTCCGCACAGTGCTTCCTCCAAGCATTTCTTCTTCCCGAATGAAGAGGACCCCTCCTTCCTGCCAGTCCAGAATTTGCACATTGCCCCCGATTTCTTCTGCTGCCCCTGCTTCAGCCCCACGTGCTGCCCCACAGGCTTCTTCGCTCTCCTCGGCGTGCTGGTAGTGGCCAGCCTTGGCCTGGCCACGCTGGCGGTCTATCTGAGCGTCCTGCAGCGCGAGTCACTCCGTGTCCTCAGCCAGTGGCTGGAGTCCCAAGAAGAGGCCATCCGGCAGATGAGAGCTGTGAGCGTACAGCTCTGGAGGCAGCTCAACGCCAGCGAGCCCGGGGCTCAAACCTGAGTTGCACTGCTCACCCACAGCCTCCTTTTGGGGGCGCTCAATTCCAGTGCGACAGAAGAGGGGACACCAACTCACTGCTTGGCACCTTTTGGACACTGACCTGTGCTGGTTTGGACTGTGTGATCCCAGAAGCTTAAAAAAAAAGCTCTTTTGAATCACGGGTGGGTCTTGTGAGGTTCGTGTGTCTTATTGGAAGCAAAAGCTGGAGACCTTGAGGCTGCCTCAGGCGGAGAGGGGGCAGGCAGGCAGGCAGATGTCCTACCGAGGAGTAAAGCAATTGGGGGTGGGGGGGGGTCTGCTCAGCAGCCTCCCACCAAGGGCAGCATCTCAGCCACTCTTCCTTTCCTTCCTCCACAGCATTTTAAAAGACATCACCTCCATCTTCTCTGTTTTTTCGCTCTGCTTCACTCTATGATTATTTAATGGTTTGCCAATGGAGCACCTATGCAGAAGTGCCTGACAGCACAAAATAAAACCCTCAAGTTTCTGCTGCCA
>XM_004069731.4 PREDICTED: Oryzias latipes pyruvate dehydrogenase complex component X (pdhx), mRNA 
CAAAGCCAGAATTTACGGACTGGACGAGGGAGGACAGCAACATGGCGGTCTCCTTGCGCCTGGGTCGTCAGGGAGCTCTGCTTGGGCTCAGATTCAACCAATTTAAAAAATCAATATGTCCCACACATTATTTCCAGGACCGAGTTCGACAGTTTTTTCATTCACCATGGGCGCTTGGTGTCACTCCACTCAAAGTGCAAATGCCAGCTCTCTCCCCCACCATGGAGGAAGGGAACATTGTTAAATGGCTTAAAAAAGAAGGTGAGACCGTGGAAGCAGGTGATGCTCTCTGTGAGATCGAGACTGATAAGGCTGTGGTTACCATGGAATCCAGCGACGATGGGATCCTGGCAAAGATACTGATGGAAGAGGGCAGTCGCAATGTGCCCCTTGGCACTCTCATTGCCCTTCTGGTGGAGGAAGGACAAGACTGGAAGCAGGTTGAGGTCCCCTCACCAGATTCTCCATCTGCAGCTCCCACGATTCCCCATGAACCCACTGGCTCCTCTGTGACCCCCGCATCTCCTCCTCTTTTACCCAAACCTGCGACGTCAGGGCCGTTACGTTTAAGTCCAGCAGCACGACACATTCTCAACACCCATGGTATTAACCCAAAACTGGCCACACCCTCTGGACCAAGAGGACTCATTACAAAAGAAGATGCATTGAATCTTTTAAAGGCGTCCCCTCCACCCAAAGCAACACCAGTTGTTGCCACGGCAACTGTCCCAACTCCTGTTCAGAGACCCACCCACACCCCCACAGGTCCCCCACCACCTCCAGGCAGCAGACCGAACATCCCCCCTCTGTCTGTACCAGGGAAGCCCGGAGCACCAGGAACCTTCACAGAAGTCCCAGCCACAAACGTGCGGCGTGTGATCGCTCAAAGACTGACCCAATCAAAGACCACCATCCCACATGCATACGCCTCCATAGACTGTGACATGGCTGCCGTCATTAAGCTCCGTAAAGATCTGGCCAAAGAGCAAATCAAAGTGTCTGTCAATGATTTTATTATCAAAGCAGCCGCTGTTACTCTAAAACAAATGCCAGAGGTGAATGTGACTTGGTCTGGTGATGGACCCCATGCGCTCGATTCAGTCCACATCTCGATTGCTGTGGCGACGGACCGAGGCCTCATCACTCCTATTATCAGGGATGCAGCTAACAAAGGGGTGCAGGAGATCTCAGCTCAAGCTAAGGCACTGGCTCAAAAAGCTCGAGATGGCAAACTTCTTCCTGAGGAATACCAAGGAGGCTCGTTCAGCATATCTAACCTGGGCATGTTTGGAATCAGCGGCTTCAGTGCCGTCATCAACCCTCCTCAGGCTTGCATCCTGGCTGTCGGGACCTCCCGGGCTGAGCTGCAGCTGAAGGAAGAGGATCAGACCGTGCACACGCGGCAGCTCATGACAGTAACCATGTCCAGCGACGGACGACTTGTGGATGACGAGTTAGCGTCTCGGTTTCTTGATCAATTTCGTGCCAATCTAGAACAACCACAGCGTATGGCCCTCGCTTAAAAAAAAAACAAAAAAAAACAAAGATGAGGGGAAAGATAAGAGAAAATTTGAAAAGGTCTCAAGCTATGTCTTTTGACAAGCAAGGAGCTGAAACAGTTTGTGTCTGTCCTTTCTTTAAGGCTTTAAATAAGGTTGTGTACATACTGTGAACTTAAGTTTGTGGCCTCTCTGCTTATTGTCCGCAAGTTTTTGGAGTGGAAATGGATTTCTCCCTAAATTTAAAGGGCTTGTGCAGTGGTTCCACATTCTACCATGAAAGATAAGACGGCAAATGTGATCCATCACACGGGTGTTGTGTATATAAAGAAGTAATTCTTCAATTTCCAGGTCAGACTTCATGAAAGTTGTTTCACTAAACGTAAACGTGAAATTGGTGAAGTCTCCTCATGTAAATTTGTGAGATATTTATTATTTAACATAAGTGACACTGCAGGTAAAATCCATGTAAAGCAGCATTTATTGTTGCTCATTATAAAAGTAAACTTAGTATGTGAACAAATTTATAAATTTATTCAGAATCACACATAAAGAAACATCTCCTTCTGGTCCACATGTATACATCAGGTTTGGTTTTGTTGTCTTAAACTCTGTCCAAGCAATAAAAGTCCTGTTCAACCATCTGA
>XR_004159256.1 PREDICTED: Meleagris gallopavo uncharacterized LOC116216471 (LOC116216471), ncRNA 
ACCACTGAACAGAGCCTGGCTCTGTCCTCTTTGCATCTCCCATTTTATATATGTTAATGGGACCTCCTTGGGCATTCTCTTTTCTAGCTGATCAGTCTCAGCTCCCTCAGCCTCTCCTCATGGAAGTGCTTGGTATACCCAGGCTAATTTGGAATGACTACCTATTGCTGTCAAAATAGATACCCTACTAACAATTCATTCAATAGGAGCTTACTGCTGTGGAGAAGCTGCCTGCTGCAGTAACAGCATGACATGTTCAGACTTGTTATGTTGCCTGACAGCCTTGACATATTTGCTCTGTTTCCTCTATTTGTATAATGGTCTCTGGCTACAACACACATCCCTGGACATGAATTTTCATTTTAAAGTTCCCAAATGGCCTTCATGAAACTTGTGTGCATATAACCCCAGTATTGCAGAAATAAGTACATCAATCGCAAACTTCAGAAGGGGAGCATGTTTTACACCTGACTGCTCTTCCTAACCCAGAATCCATTTGTTTATTGTATTTTAGTTTGGATTTACACACTAGCGATATGTCTTCTTACTTTATGCAACATTGCAATATTACTGCTTTACATAGAAAAAACATTGGCTGCACTGAGTCTCTGTTTAAAAACTGTTTGGATGTGGTGCTCAGGGACGTGATTTAGCAGAGGGTTGTTGGAGTTAGGGTAGTATGGCTAGGTTGTGGTTGGAATTGATGATCTTTAAGGTTTTTGCAATCTGTAATTCAATGATTTTTGTGATTCTGCAGTGAAAATGCTAAGTCTCGGCTTGGAACAGTGATTGAGCAGCTGGTGGGAAGGCAGGGCCAGCCCAGGAGAACTCAGGTGGATGCACTGTGCTCATTTAAGGGCTGGCAGTGGAGGAAGGTGCATATAAAATGAGAGTTTTCCCTTAAATGAAATATAAGAAATTTCCTAGACTTCTGCTGTGTAACCTACGCTGCTTCCAGCTTCTCCTGATGAGCAACTTGGTAACTGTGCTTTTTGCTCTTTCCTGATGAAGAACTGCTGCCTTCACTGCTCCATTTCCTGCATTGCTCACTCCACCATCCGACACCTTCAGAAAATATTGCCACCTGTTGAGAAATTTTACAATCTTCCTGCCTCTTGATGATGTGTGGGATTTGGAGGAGAGTGGATAAATAGAAGAAGACCTGTAGCCTCTTCATTTGCATCCTTGACCTGCTCAAGGCTTGGGCAGTACCTTGGTGAAGGACTGTTGGTGGTGGTCTCAGAGGAACAACCAGTTAAGAAGTATACTGGAGTTTTGAAAGAACTACATGGACTGAAGTGAAGATCATGTTCCCAAACTTCTGATTCAATGGAAAGCATCCTTTAGCTTGATACAGAGCTATACACTGTCAAAAGGCTTTTTCACATCTCTTTGGGAGACAGATTCAGCCACATGCTCTCGTCATTCACAGTGGAACTTCATGGGTAGGCAGAGGACCTCTCCCTCCGGGCTGATCTGGATGGGGAATGCCCACGGTACCTGGCACCTG
>XM_041282614.1 Brettanomyces bruxellensis uncharacterized protein (BRETT_004118), partial mRNA 
ATGCCACCGAGAAAAAGAAGAGGCAGAAAGAAAGCCACTTCTGTATCGAAGAAAGCAACCAGAACTAATTCTTCACATGGTACAAGTGATGCCACGCAAGATACCTTGAAAGATGGTGAGAAGAAGATTGAAGAAGCAGCTAAAACTCCCAAAATCACAAAAGATCTCAAAGAGTTGGAGGAAGAACGGAAAGACGCGAAAAGTGAAAAGCATGGCCAAAGTTTACCTGTTACGACTGATGCAACAATTGAAAGCAATGTTAAATCAATAGATTTGAAAAAAGCAGAGCCCAGTAATGTGCTGTCTAAAGAGAAAGAAAAGGATGCATTTGCAGAAACAGAAGCTGATGACATAATGAAGATAGTGAATGAGACGAACGATAAGAAAAGGAGTATAATGAGTCCAATTAAGAGTTTGCAAATAAGCCCTTTAAAGAATATAATAAAAGGCGATACAAAAGATCTAAAACCTGATGCAGGAAGTCCGATCAAACGCAGAAAACTTGATCCTTCTCCAGAACGAAATGTTGATAGAGACACAAGATCTATGGAAATGCACGTTGGTTTATTGTTTCAGAAGAAAGACTTAAAGGGTCTCACTGCCATTTCTCAGAAGACTTCCAGGAGGTCTGCCCAGACATTTGAAAATTACAAAAAGCTAGTTGATCGACGCGCAAAAACTGCAGAGATTATTATTGCGAACCTTACAAAAGAGAATAAGACTTTAAAGAACACAATCAAGGGACTCAGAACTGAGAATCGACATTCAACGAATGCAGTGGATAGCAAAGAGATAAACAAATGGAAAACAAAGGAAGTAGAAACTAGAAAGAAACTAGACAAGTTGGAAGAAGCCAAGAATAGCATAGAATCAAAACTTTCCGATGCGAACAACGAATTAGTGCTATCAGATTCAAAACAGGAAATGATCGAACTGCTATGTGGAACAGCATGTCTTGATTACGAGGAAAATGAAAAAAGCATTATATTTGCGCTTAGACAAAGTGGTACACTGTGTACATTATACTATCAACTCATCATAAATAAGTCCGAGCCATCAGATTTAATATACTCCCCAGTTCAAAAGAAACCGCAGGAATGGCCTACGGATAGTGCAATTTCATGGAAGGTGAATATGGATCGGTTGCACTCACTTCTTCCAGAATACTTGTTGGACAATCTTACTTTCCCTTCAAGCAACTTGAGAAACTTTTATCGAAAAATATCAAAAGCCGTGAATGGAATGGGAAAGCAGAAAGAGGCAGCATGA
>XM_013019345.1 PREDICTED: Dipodomys ordii tumor protein p63 (Tp63), transcript variant X7, mRNA 
AAAACTTTTTTTTATCCCCAGAAGAGTGGACAGATACCATCAAATCAACTCAGTATCCAAACCCAAGGAAATGTAATTTAGCTGGAGGGAGATGGCCATTCCTCAGACTTGTTATAAAAGTCCAGGCTGCTGAAATTAAACTCTGATGCCATTCAAGCCAACATCCAATCAGGAGAGAGATCAGAAGTTCAGAGATGCCTCCAAGTTGCCAGCAAGTGTGGCCACTGTATGTCAAGGACTCTAAAGCCGTGGAAGAAAGGGAAGAACAACTTTAGTGAGGATGCCCAGCTGGTAAGAATCAACTGTTTGTGATGTTTTAGTCACTTGAGGAATCTCATTGGCTAACTTGAAGAAAGGCTCCACCTCTTTGCAAATATGTGGAATGGGAGAGAGGGGGTGAGGAAGGGGAAGTGTCTGAACTTCTATATCTGATGGCATCTGACCCTAATGCTTTAAGCCTCCTGGCCATATATCTACATATACACAGGTATATGTGTATGTTTTATATAATTGCTCTCCATTTGTTGATATCAAAGAGAGTTGAAGGAAATGAATTTTGAAACGTCACGGTGTGCTCCCCTACAGTACTGCCCCGACCCTTACATCCAGCGTTTCATAGAAACCCCAGCGCATTTCTCTTGGAAAGAAAGTTATTACCGATCCACCATGTCCCAGAGCACACAAACAAGTGAATTCCTCAGTCCAGAGGTTTTCCAGCATATCTGGGATTTTCTGGAACAGCCTATATGTTCAGTTCAACCCATTGACTTGAACTTTGTGGATGAGCCATCAGAAAATGGAGCAACAAACAAGATTGAAATTAGCATGGACTGTATCCGCATGCAAGACTCAGACCTCAGTGACCCCATGTGGCCACAGTACACGAACCTGGGGCTCCTGAACAGCATGGACCAGCAGATCCAGAATGGCTCCTCGTCCACCAGCCCCTACAACACAGACCATGCACAGAACAGCGTCACGGCGCCCTCGCCCTATGCGCAGCCCAGCTCCACCTTTGACGCCCTCTCTCCATCACCTGCCATTCCCTCCAACACAGACTACCCAGGCCCGCACAGCTTCGATGTGTCTTTCCAGCAGTCGAGTACCGCCAAGTCGGCCACCTGGACGTATTCCACAGAGCTGAAGAAGCTATACTGCCAAATCGCAAAGACATGCCCCATCCAGATCAAGGTGATGACCCCTCCACCCCAGGGTGCTGTTATCCGTGCCATGCCTGTCTACAAGAAAGCTGAGCATGTCACTGAGGTGGTGAAGCGGTGCCCCAACCATGAGCTGAGCCGAGAATTCAATGAGGGACAGATGGCTCCTCCTAGTCATTTGATCCGAGTAGAAGGGAACAGCCACGCCCAATATGTAGAAGACCCTATCACAGGAAGGCAGAGTGTACTGGTACCTTATGAGCCACCTCAGGTTGGCACGGAATTTACCACTGTCCTGTATAATTTCATGTGCAACAGCAGCTGTGTCGGAGGGATGAACCGTCGTCCAATTTTAATCATCGTTACTCTGGAAACCAGAGATGGGCAAGTCCTGGGCCGCCGTTGCTTTGAGGCCCGGATCTGCGCTTGTCCTGGAAGAGACAGGAAGGCGGATGAAGACAGCATCCGCAAGCAGCAAGTTTCAGACAGTACAAAGAATGGTGATGCTTTTCGTCAGAACACACATGGCATCCAGATGACATCTATCAAGAAACGAAGATCCCCAGATGATGAGCTTCTATACTTACCAGTGAGAGGCCGTGAGACTTATGAGATGCTGTTGAAGATCAAAGAATCCCTGGAGCTCATGCAGTATCTTCCTCAGCACACAATTGAAACCTACAGGCAGCAGCAACAGCAGCAGCACCAGCACTTACTTCAGAAACATCTCCTTTCAGCCTGCTTCAGGAATGAGCTTGTGGAGCCCCGGAGAGAAACTCCGAAACAATCTGACATCTTCTTTAGACATTCCAACCCCCCAAACCAGTCAGTGTACCCATAGAACCCCATTTCTGTATTTGAGTGTGTGAGGTCATTATGTTTCCGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGAGTGTGTTTATACCCAGCTCTCATAAATAGAACTTGAAGACATTTTGGCTCAGAGACCCAACTGCTCAAAGGCACACAGCCACTAGTGAGAAAGAATCTTTTGAAGGGACTCAAAACTTTACAAGAAAGTATGCTTGCTGCAGATTTTGTACCCTTAGATCCAGCATTGGTTGGACAGGAACCACTGTTGTGTATGTTTGTGAGCTTTTTGTTGTTTCCTGGGAGGGAGGGGATCAGGTGGGGAAAGGGTATTACAATGTTTATAAGACTCCTCTTCTGTTGCTTTCTGTTGTATTTCTAAAACTCATAATGAAGCTTTTGAGCAGGTCTCAAA
>XM_044435426.1 PREDICTED: Varanus komodoensis meiosis initiator (MEIOSIN), mRNA 
ATGTGGGACCAAATTGGCCGTGTTTGCCCTGAGGAATTACAGCTGAACAGCAAAAAAATCAAACAGAATTCTGATCGAAGAAAACACAGTAACTATACCAGCACTCTTAAAGAACTGGCTCAGATGTTGCCCATCCCTTTGCGGACAAGCTGCAAAAGGTTAACAAAGAAAGAAATGCTTCTCCGAGTCCTCCGTTACATCGAACACCTGCAGGCAAGCATTGATACAGCAAGATCTCTGCTCCAGGTCCACTCTGGGGAGCAAAAAGCAGGAGAATCTGAGCAGATGGTGACAACTGCCCTAAAGAGCGGGCGAAGAGAAACTACACCACGAGTAAAGAAAACGAAGCCACTGGCTGTCTGCAAGAAACCCAGGAAGAGGAGACGCACCCATAAATCAGAGCAACAAGGGGTGAACAAGAAAGTGTGCAAGAGCCTTGCTCTGGAGACCGGAAAGAGCCCTTCCCAAGCCGACGAACAACAGGAGGAGAACCCATCTGCATTGGGAGTTTGGAACTTGAGTGGCAACCATGAAGAAAGCAAGGATTATGCCAATGTGTTTTCTGCGTGTGAAGCTTATGAAGAGCCGCATCGATACACCGAAGTGCCTACGCATTCATTGATGGGGCAGGAGCTGGTGTACTACTATTCCTCTTGTGAGGAAGATGAGGAGGAAGGACCTGAAGCCAGCCCTTGGCTCTCAACCTGGTCCCCTGTGGGCATTTCACATGGTGACCTGCAGCTCTGTTCGCCTGCGATCATCACCCAAAGCAACCGTTGCACAGATCTGGGGTTGAGCCCTTCGCTTTTTTCCTCTCCAGCTCGGTTGCTGCCTACACACATCCTGCAAGGTGGCCAGGAGGAGTTTTCCCCAGTGCTGTTCGAAGATGTATGCCTGTCCCCACAGCCTGGTAGTTTTTCTCAGTCCCTCTCAGGCACCCTGTTAAGAAAGTCAGCATTCACGCTGGATCACTGCTACCTTTCCAACAGCGAAACAGGTAAAAGCAGTTCCAGTCCTGTGTCAAGAGAAAATGAGATCAAGTCATCATGGAACAAGCAGTTCCTTCAAGAGGAAGTTCACACTGCCAGGCCCGAATGCCCTCTGTCCTCCAGTGATGAGAACAGTGACAGCACTTGGACCCCATGCAAGAGGACGAAGCCATCCAGGGCGGCCCGTCGGAAGAAGAAGAAGAAGAAGAAGAGGAAGAAGAAGAAGCGAGCAGGCAGAAGGCAGAGGTGCCGGCCAGTAGCCCGCGAGAAGGGCAGCAACGCCTCCCCTTTGCAGCTGAAGAAGAAGTGTGTGAATGGCTTTATCATGTTTTGCCGCCTGAACCGCAAGCACTTCATCCGCGCTTGTCCAGGCATGGCCTCCACAGCTGCCACAAGAGAGCTGGCCCAGCTGTGGCGTGTGATGACGAAGCAGGAGCGCCACCCATATTGCTTGAAAGCACGGAGATTCAGCCGTCTGAACAATCGCATTGTGAGAGATGACTTCTCTAGCGGGGAAGAGGAACCAGAGCCACCCAAACCTTTCCATCTGCTACTCGCTGAGAAATCCCTCCCTGGCACTGAGAATTTTGGTGACTTCTCTTTACTATAG
>XM_031628525.2 PREDICTED: Nymphaea colorata UPF0548 protein At2g17695 (LOC116253610), transcript variant X2, mRNA 
ATCTTATTTTTAAGAAGAATTGAAGATGAGAGAGGGAGAGAGATCTGGCAGCAGGTCTGTCTCCCACAAAATGGTGTTCCTGTTCTGGAATCGACCGTCGCCTCATCAACAGTCCGCCTGCCTCAAGCAGGCGGGAGACTTTAACTACGACTCAAAATATCGTTGCTTGACTTCTTCCCCTTCGGATTGCAACCCAAATTCAGCGTCATCTTCGCCGCCACTACCGTCTTCATCTTTGTCTGAGCTCCGACATGGCTCCAACCGCGATGGTTTCGTCGTTAACCGCGCCCGCGTCCTTCTTGGCTCCGGACTCCAGACATACCAACAAGGAAAGCGAGCTCTTCAAGCTTGGAAGCACTTCGGCTTGGATTGGGCGTTTGTGGATCCCAGCAGTCCCGTCGAGGTTGGGGAGAGGTTCTGCGTGTGCGTGAAAGAGCTTGTCCCTTGGGCTGTTCTGCCTCTTCAGATCGTCTACGTTAACGACCATGATGCTGTCAAAGATGGTTCCCTTAAAAGGGGTTTGACGGCCTCCTTCGCTTTCGGGAGCGGAACCCTTCGAGGCCATTTATTGGCTGGAGAAGAGCGGTTCTCGGTTGAGCTGGACGAGGACAACAAAGTGTGGTACGAAATATTCTCAATTTCCAAGCCCGCCCACCTACTTTCCTTTGTCGGTTATCCTTATGTCCGTTTTCGGCAGAAGTACTTCGCCCAACAATCAATGGATGCACTTGTACGACATGTCCACTCTCAAGAGCGTGCTTAATGCAAAGTTCATATCGAAGTCCTCTTGCTCCTGTTATGGCACCAAGAAATTGTTATGGCACCAAGAAATATTGCACACTTCAAAATACATGAGTACTTAGTATTTTCACTCA
>JN440548.1 Uncultured organism clone SBYB_3744 16S ribosomal RNA gene, partial sequence 
AAAGCAGCTAACTACGATAAACTGGACGGTAAGGGACGAAAGCTTGGGTAGCGAACGGGATTTAGATACCCCGGTAGTCCAAGCCGTAAATGATGCTTGCTAGATGTTTTGGACCCTTGTGGTCTGGAGTGTCGTAATCTAACGAGTTAAGCAAGCCGCCTGGGTAGTATATTCGCAAGAATGATACTCAAAGGGATAGGCGGGGGTACACACAAGCAGTGGATTGTCTAGATTAATTGGACAATAAGCCAAGAATCTTACCTAGATTTGACATGTACTATGTCCTATGTGAAAGCATAGTAGTCCGAGCAATCGGACATGGTATACAGGTGGTGCATGGTCGTCGTCAGCTCGTGCCGTAAGGTGTCTAGTTAAGTCTGGAAACGAGCGCAACCCTCATCTTTAGTTAGAATGTCTAAAGAGACTGCTCTGGTAACGGAGAGGAAGGAGAGGATGACCGTCAGATCCTCATGCCCCTTACATCTAGGGCTTCATAGACAATACAATGGGTGATACAACGAGAAGCTAACACGTGAGGTGGAGCAAACCTCTAAAGTTATCCCAAGTTCGGATGCTAGTCTGGNACTCGACTACATGAAGTTGGNATTGCTAGTAATGNCGGGTCAGCTACACCGCCGTGNATATGTNCCTGTCCATGCACTCACCGCCCGTCANACCATGGGAGCTG
>XM_036157752.1 PREDICTED: Mus musculus predicted gene, 38699 (Gm38699), transcript variant X8, mRNA 
CGATTGGTGGTCAGGCCTGCGCCCGGCACCGCCGGGCGGTCCTCCGCGCCATCCCCAGCCGGGCCCTCCCCTTTCCGCGGGAGGCTTCCGGGACAGCGGGTTGGTGGCGCGCAGTTCCCCTTGACTGTGCGCGCCCGCGTCTGGGCTCCTTTGCAGAGGACTCGGTAGCTGCAGCTCCCGGAGCACAGCAGACAGAGCTGCAGGCTGCGTGCGCCCCTGCTGCCACCGGACCTGCCGCGGTGGCTCCCGCGCCCCGCGGCGACTTCCGCACCCGCGCTTATCTTTGCTTAAGTCCCCGAGCGGCGGCGGGGTCGGAGCCCGCGCCTTGGGCGACTGAGGCGGCCGCAGTTCGCGGCCCGGCGCCCTGGCGATGCCAGACCAGATCTCCGTGTCGGAATTCGTGGCCGAGACCCTTGAGGACTACAAGGCGCCCACGGCCTCTAGCTTCACCATGCGCACGGCCCAGTGCCGGGACACCGTGGCGGCCATCGAGGAGGCTACACTTGGGAAACCCATCATATTGAAGGACATTGTCAAAGTTCGAGAAGAAATGAAAGCTGCGGGTGGTGTTGGTGTTGGGCTGTGTGTGTGCCTTCCCTTCTTTTGTAGACAGTAAGAGATTATTTACTACCTGTGTTTTCATGTGTATCCTTAACTTCCTCGGTTAGATTCTACCTCTATCTCTTTGTGTTGGTCAGTATGTTTAGAGAGAGGTTGTTTAAATTTGAGTTTATCGTGGACTATCTTAATTTTTTCCATTAACGGTGTAGTCCTTTTTTTACATATTAAAATCCAGGCATCTGTTGTTTTTGCAGCACATGTGTGCAAACCCTTCTGGCGTCTACAAACTCCAAGAAGACATCTGTGATCTTTTTTTTTTTGTTTGGTTTGGTTTGGTTTTTTTTTTTTGTTGTTTGTTTGTTTGTTTGTTTGTTTGTTTTTGAGACAGGGTTTCTCTGTATAGCTCTGGCTATCCTGGAATTCACTTTATAGACCAGGCTGGCCTCGAACTCAGAAATCCGCCTGCCTCTGCCTCCTGAGTGCTGGGATTAAAGGTGTGCGCCACCACGCCCGGCCTGAAGACATCTGTGATCTTAATAGATCTTCCTTTATGTTTTTCCTGGCTTTTTACCTTTGCAGCTTTTAGTATTCTTTCCTTGAACTGTATGTTTTGATTATTACACAGGAAAGAGACTTTATTTTATAGTCCCTTCTGTTTGGTGTTTTGATGATTCTTGTGTTTTCTTTATGTTAGGAAGTTTTTCTTCTAGGATTTGGTTGTCAATACTTTCTGAGACTTTGAGGGAGGATTCTCCTTCCTCTCTTCCTAAGTATTCTTATGTTTAGTCCTTTTACAGTGTCCTGGATTTCCGTGATATTTTATATCAGGAAGATTTAGACTTACCATTTTTTTTTGTTTTTTTTTTTTTTGTCTGATTTACCCATTCCTTCTATTGCTTATTCAATGATTGAGATTTTTCTCCGTATCTCTGTTCTCTGGGTGAACTTTGCCTCTGTAGTTCCTTTTTGCAGTCCTAAATTTTTATTTCCACTATTTCCTAAGATTTAGTTTTCTTTTTTTGCTTCTATTTCCACTTTTATGTATTGAATAGTTTTGTTTACTTCACCCATTGGTGTGTTCTTTCTACGCTTTGTTTATAGGAATTTTGGCTTCCTCTACTTTTTGGTTTGTGTGTTCCTGGCCTTCTTTATGGAATTTATTGATTTCCTCTAATTTTGTTCTGTTTTCCTGGATTTCTCTAAGTGATTTGATCATTTCCTCTTTAAGGAACTCTGTCATCTCCATACATTTGGGGTTAGAGTGTTTTTCTTGTAATTTAGCTTTGTTGGAATATTTAAGACCTTCTTTGACAATATAAATGAGATCAGAGTCATTAGCCAGAGAGTGATAAATGCTGGTCCTTATTACATTATCGAGTACCAATGTCATGGAATGGAATGGCGCTATCTAACCTAAGTATTCAGCTTAGATTTAACCCAATGTTTGATTAATCCCAAGGCTGTCCTTTCCCTTTACACTGGACAGGTAGCCAAGTGAGGCACTTTTTGAAACAGTTACTTTTTGTGAGACACCTGTTTTTAATCACTAACCTTGGGTTAACCATTTAAAAAAAAAAAGACCTGATGTTTACAGGGTGAGTGACTTTGTAATTTTCCAAAATGTATTTATTCATGTCTTGTGAATGAAGACAGACCAGATTGATAGATATGTAAATTGGGGACTTTAGCTTGATTCAAGCAATATTGAATTTCTGACTTTGGAAATATGTCCAATGCACTTTCAGGCTTTATTCAGCTCAGATGATTGTGACACAGGCCATTGGCTGTAGTTATGTGTCATGTTACAGATCACAGCAACTGATATTGCACACAGGAGCCAGGTCAAAGAGTATTGTATTAATGCCATTGTTTTCTGCCAGATAACTTCTCTCTCTCTCTCTCTGTATATATATATATGTATATGCATATATATGTATATATATATAATTATGTTTCATTTTTCCTTTTTTAATTAATTAATTAATTTATGTACATCCTGTTCCTGTTCCACTGTGGATAGAGAGACAAGGCAGTCCTCTGGTACATATGTGCCTGAGGCAATGAGCCAATCCCTGGATGCTCCTTGGTTTTTGCTTGGAGGTCTGAAGTGTCCAGGTCAGCTCAAAGTTTTGTTCTTATCGGGTTGCCATCTTCTTCACCCCCTTAAGTCAGTACAGTGACCTGCCCTTATGTAACATTTCAACCTACAACAATATATCGATATATCGATCTACATATTTCTATATCTATCTATCTATTCATCTATATATCTATATAGCTTTAATCTATACATCTATATATCTATATATCACCTATTAATCTATATATCTACATATCTATATGTATATATCTATACACCTATACATCTATATATCTATCCATATATCAATAAATATATATAATCTCTATATATTATCTATAAATCTACATATCTATAAATCTATATATAAAATCTATATATCTAAAATATATATATACACATATATGTATATTTTTAAATCTATCTATCTATCCATCCATCTATGTATCTATAAGTCTATCCATATGTTTAGCTTGATGTAGCTTTTTTCTTTTTCTGCCAGATAACATATACATATATATTCAATTATGTTTCAATTTTTATTTTTTTAATTAATTTTTTTATTTATTTAAGTACATCCTGTTCCTGTCCCATTGTGGACAGAGAGACAAGGCAGTCCTCTGCTACACATGTGCCTGGGGCAATGAGCCAGCCCCTGGATGCTCCTTGGTTTTTGGCTGGGAGGTCTGAAGTGTTCAGATTGGCTCACGGTTTTGTTTTTCCTATCAGGTTGCCATCCTCTTCACCCCCTGAAGTCAGTACACTGACCTGTCCTTATATAACATTTCAACCTACAACAATATATCAGTATATTGACCTACATATTTCTATATCTACTATCTATTCTTCTATATATCTATTTATCATCTATATATCTTCAATCTATACATATATATATCACCTATAAATCTATATATCTACATATCTATACATATATATTTATATATCTATACATCTATATATCTGTCCATATATCAGTAAATCTAGATAGATAGATATCATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATATAAATCTATATAAAATCTATATATCTATAAATTCTATCTCTATCCATCTGTCTATCTATATGTTTAGCTTGATGTAGCCTTGTCTTAAAGGACTGTTATGTTCTAGGTTTCAGACGTTCAGGCTGAGAGGAAACAGTATGAGTAACATTTGATCTAATACCAGATCCTCGACTCTGGACCCATATTTTATGATAATTTTGGGATTATGATTACATCATTCCTACCTCCTGTGATCAATCAGTAAACACATCTAATGCCAGCAGCTGGCAAGAAGAAAGGTTGATGGCATTTCAGTTCTCGGCCTCGGTGTCTTTGGAAGAGACCATGACGGAGAGGGAAGAAGAAGCAGGAAAAAGGTCCCATGGGTGGATGGATTGGGAGAGCATGTCCAGGAGGGCGAGCCTGAGAGTATGAGCAGCCTGGGCAGAATATGGCAAGTGAGCCGGGCATGGTGGCACTCGCCTTTAATCCCAGCACTTGGGAGGCAGAGGCAGGCAGATTTCTGAGTTCTAAACCAGCTTGGTCTACAAAGTGAGTTCCAGGACAGCCAGGACTATACAGAGAAACCCTGTCTCGAAAAAAATTTTAAAAAAAAGAATATGGCGAGTGATATCTCACAGTTCTTAGTAAAGAAGTAAAGAAATTAGCATAGGGGAATGGTATCTGCCCCATGCTGGTGCTTTAATGCTTATAATTATAATTATTATTATTATTTCTTATTTTATTTTTTCACATTATCATTTACTGCATTATTATATCATATTATTTAATATTATTTCTTTTTATTATTTCATATTATTTATTATTTTATTATTTGATAGCATTGTTTCTTATTCTTATTATTTCTTATTAGTTTATTATCATTTCTTTTTCTCTTCTTCGTATTATTATTATTTCATACCTCTATAATTTATGTGGTGGTAAGAGATCCACAAGTAATATTTACCACAACAAGTTGGATGCAAAAACAGCTTGTACCCAATGAGAAATATGGCCAAAAGTTATTTTCTTGGGATACAGGAAGAAAGTCCTCTGGGGTCTCTGCTAATAAGGTCACACACACACATACCCCATACACATACCCCCACACAAACATGCACACACACACATACTACATACATACA
>XM_012367441.1 PREDICTED: Linepithema humile MAP kinase-activating death domain protein (LOC105672481), transcript variant X6, mRNA 
ATTTTTAATTTTCTCGGATAATTATACTTACTACGAATATAAAAATCATGTAACGTTAAAGATTGCATCATGCCAGTATTAGGATTAAAATAATAAATTGTATATTCGAGGCTCTTTGGTCTTCAATATAAATTAGTATAGATTTTTATATATTCAATCTAAACTAAACCTTAGATTTTGCGTCAGTTTTGTATCAGAATCTAAAGAAGTAACTGTAGATTTTTTTAAAGGTATTTTAAAGGTATTAAAGGTATAGATATTTAAAGATACGATATAAAGATTATATGATCGATCTAATCAAATCTATAAATATATAGAATAATATTTACAATATAGTTTACGTTTTACGCACTCTTTAAAGCAAACGTTGTATATTTTATATCCTGCGTAAAAAATCAATATCATCTAATACGGTCTAAAATCATATTTTATTACAAAGAAGCGCAATGTTGAAAACTCTTTGGAACTACAGCGTTCGGTTGTTTTCCACTCATTATTCAACCGCGCTTCAACGAGCGAGAAAACGGAAGGATATCGAGCCGACGACAGGGTGTCCCAATAACGGGAGCGGAAATTCACTTTCGGAAGCGGAATCGGGATTCTAGCGCCGGTACTGGAGGCGCGTCCGTCCAGACGTGCGCCTGCCTGGTTCCGGCGAACGATCAGCGGCGCGACGGCGTCGCGACGACCGCGAAGCTCCGGGGCGCGTCGGCGGATCGCCAGTGTGATATCGCCACTTGGCTGATACGGAATACGGCCTGGCCGTCATTCGTATGGCAGTCGGACGAGAACGCGCGGCAGTCACTCGCGTTAACGCGCATTGCAAAACGTGGAATTAATAAGCGAGATAATGGTACAATCATGATTCAAGCTGGAAACGATCTTGAGGAGAGTTCAGAGGCTTGGCTGTCCTGTATATACTGCATACAACGGTGACACAGCTGTATATACATAAATCACAATTATGGATATACAGAAGAAATTCCTGTGCCCCCGATTGGTGGACTACCTCGCCATCGTTGGAGCCAGGATGCCCGCTGTCTCTCGTCAGCCCGTACAGGTCCCAGAGTTGCTACGCAGATATCCGGTAGAGGATCACAAGGATTTTCCTCTGCCTTTGGATATGGTGTACTTCTGCCAACCAGAAGGTTGCAGTAGCGTGGGACCAAAGCGCACGGCCTTACGAGAGGCAACATCCTTCACTTTTACACTCACCGATAAAGATTCAGGAAGAACGCGTTATGGGATTTGCGTGAATTTTTACCGATCTATGGAAAGGGCGGGGCTTGTGGCTGGCGGGGGAATTGCGCTCAAGAGGGAAAAATACAACACCACGTTTCGAAGGGAAAGCTGGAGGAAGAGTATGGAGAGAAGCACGGATTCCGCTTTTTCTAGCGACTATAGGAGCAGTGCAGTAGGTCCTAGTGATTCTGAGAAAGATTGCTCCAGCAGCAGGCGGGATTCGGACACCCCGCAGGTCAGCTCGGTCACCCCGAGATTGGAATTCATCGCAGCGAGCGGAGACAGCGAGAGCGGCGGCAGTCATTCCCCATCGCCACGCGCTTCTCGAAGACGCCAGAGGGTTCGCAATCATTCCTTGACTTCCCTATGCATCATTTCGCACCATCCGTTCTTCTCAATGTTCCGGGAATGTCTTTTCGTCCTGAAGAAAATCATCGACGCGTGCAACGAGAGTTTCTCGCCGCAGAAGGTGGGAGCCTCTCGGCAGACCAACAGAGACACGGTGTGGAGCGTATTAACGGGTCAGGCTCTAGGGGACACGCCGTCCATCGTGCTTCACGACGTTCGCGAGATCGAGACATGGATACTTCGTTTGCTCAGCAGCCCCGTGCCCGTCCCGACAAAGACGCGCGTCGAAGTCGAGATAATATCGCCCAGTATGCAACCACCGCTATGCTTCGCCCTACCGGATCACACTAGATTCTCCCTGGTCGACTTTCCATTGCATTTACCGTTGGAGCTCCTCGGCGTCGACATATGTCTGAAGGTTCTCACGCTGATTCTCTTGGAGAATAAGATTGTACTTCAATCCCGTGATTACAACGCCTTGTCTATGTCGGTCATGGCGTTTGTCACGATGATCTATCCATTGGAGTACATGTTCCCCGCGATACCCTTGCTGCCCACCTGCATGAGTTGCGCGGAGCAACTGCTGCTCGCGCCGACGCCCTTCGTGATCGGGATCCCCGCGTCCTTCCTTATGTACAAGAAGAACTTCAGAATGCCCGACGATATCTGGCTGGTGGACTTGGATAGCAATAAAATAACTGCGCCGAGCGCTCTGAACGATGACGGTTTGCCGCCGCTACCGGAACCGGAGGGCACCATCCTGAAGAATCACCTGAGGCAGGCAATGCAACTGATGGATCAAGTTGGCTCTAGTGCGATGGCTAGCATGACGGGACCGCCATTGCCGTCGCAAGAAATCTCGCAACGTCTCTCTTTTCAAACACCGAGTAGGAGAGAAAGCATGGCGTCGCATCATTCCACCTTAAGCGTAGCTTCAACGAAGCACAGGCCGAGCATCGACCAGTGCGCGCACATTCAGCACTCCCCGCTTAATTCGCCAAGCGTGAGCTCGTCAGCGAGTCCACCTCGTCGGCCGTCGATGCCACAAACGGTTGGAGGAGCCGGGCTGACCGGTCCGCCAAGAGCGCCCGGACAGAGCCCGGCGCCTTTCAATCCCTTCATCTACGGAAATGACGTGGACTCGGTAGACATAGCCACGCGGGTCGCCATGGTGCGCTTCTTCAACTCGCAGAATCTGCTGGCCAACTTCACCGAGCACACGCGCACCCTGCGGCTGTATCCCCGGCCGGTGGTGGCTTTCCAGATCAATTCGTTCCTCCGTTCGCGGCCACGGAAGAGCAGCTTCCTCAACAGATTCGCGCGCACGCAGGCGGTCGAGTTCCTGGCCGAGTGGTCGCTCACGCCGAGCAACGTGGCCTTTCTCCGGGTGCAGACGGGAGTCTTCGATCCTGCACAGATCGGCGACAAGTCGCGCTGGTACGCGACCAACCTCGAGCCGATCTACTTTCCCGTCTGGGACTCCGGTAGTTCGTTGGCGAACGCCCTGAAGGCGATGAAGGAGCACGAGAGTCAGCCCACGGATGAGAGTGGATCGGATTCCGAGGGTGCCGAGAGCACCAGCTCTTCATATTCCTCTCTGAGCGACTTCGTCTCCGAAATGGCGTCGTCCGATTTGTCACCGGGTTACAATCCTCAAGTGAGCCAGCCCCAACAAACGCTCTCAGTGGATCCGAAGAACGTCTACAATCCGCCGAGCTCCTTGCAATATCCGGGAGTGGAAGAGGATTTACCAGCACGACCCGAGAGCCCACCAAGTACTTCTTCCAGTCACAGCGATCTCAGTAGCCCAAGCTTTAACAGGGACTCCGAGCTCGAATTGAACCCAAGAGTTCAAGAGGGTTCGCAGTCCGCTAACGATAAAGAGGAGGGTGGTAGCTTTGAGTCAGACTCCGCGTCGACAATAACACCGCGCACAATCCTGAGCGCACAAAGTTCGGTAGGACAGTTCACAGGGATAAGCATGGGCGCTTTAGGCACTCAATCTTCGCTCAACGACACTGAACGTCCTACCACCCCTCACAGGATCTCGCGCGTCAGTAGATATGTCACTCCTGTGCCACCCACCGGACCAGGTCTGCAACGTCAGCCGAGCGTAGGCAACGTTCTAGCGAGGGCCTCCAGCTTCAGCACCACCGGCGGGCCTCTTCTGCCGCGGCAGATAAGCGCGGTCACCGCTGCTGATCATCATCACGAAGCGACGCAGCTTCAGCGTCAAGCATCCGCGGGAGCGACGGTCGCGCAAAAGCAGAACGACGGCACGGTGCAACGACAGAACAGCGGCGGTTCCACCGGCGCCGCCACCGGGAACGGCGTTCTTCGACAAGGCTCTCAGGGTTCTCTGTTCGAGCAGATCGCCAGCCAGGCGAAGGATTTGGTGCGCGAAACGACCAGACAGAGCAGTCAGGACGGGCTGCTCGCGCACATGGACAAGCTCAAGCATCAGGCGAAGGAAAGAATTACGGAGGCAGGCGAGGATAGTCTGTTCGCGCCGCTGGAACAATTTACGCAACAAACTAAGAAAGCGGTAGGTGAGGCCACCAAGTCGGTGCAAGAGGTATCAAAGAACGCGTTGGAGGCGAGCAAAACGGCGGCGGGTGTAAGCAAGAATACGCTGGACGATTTGACGTACGTCGGCAAAAGCACATTTGGAGATCTGACAAAAAGTGCCAAAGAAGCTGCTGCGAAAAAAGGCTTCATCAAGAGTCTAGAATCACAATCGCCGGTACACTCTCCCTCCTCTTCTAATATGATGCAGCAGCGAAAGGATTCGATTAGCAATCAGTTAGTCGCATCGGACACACGAAGTGGTGTTGGCCGGGATTTCTTCAGCAATATTAGCAGCGATTTGAATGGCTTCGCTGCGCAAACCAGCAGTATGTTCAGCGATTTATTCGGTGGTAAAAATAATTCTAAAGGCAGTAGCTTCTTCCCGCAGAATCAGAAGTCGAAAGAAAAGACCAATCCGATTCTTCCACCATTTCCCAAAGTTGCAGGCAAAACAGGATTAGTAGAGCGTTCCTCGTTGATAAAACATTCCTCGCACAAAATTAATCAGGAAGATGCGCAGAGAATGCAAAACGCGGAACGTTCTAGTACAAATAGCGACAATCAAGCCTTTTTGAACGACGTGATAACGCAAGTGTTGGCCGGTGAAGGTGTTGGTTGGCTGAAATTGAATAGATTGAAAAAATTAATGGAAGATGAGAATTATCGTGATTTGGTCGTGAGAAAATTGAATAAAGGTCTCAATAGGAAGATTAGTCCTGATGATCACATTGACGATGTGGCCATATCAAAACCCGTGTATAAGGGAATGTTAAAGTGCCTTCAAGCAGTAACGCATGGTCTCGCACACACGTATAATAATTTCGGACTAGGCGGGATGGCTTCTGTCTTCCAACTGATGGAAATCGCTCACACGCATTATTGGAGCAAAGATCTGTCGGCGGAGGGTGGTTTCGACAGCTCTTTGATGTCGCAGGCGTCTAGCCCGTTCGGTAGTAGAGAAAACTTGAAGTCCCCACAATCTCCGAATCAGTCTGAATTTACAGAAAGCGCGCAGAAATCAGAACTGCCGCAAGTGCATTTGGAAATGCCGCAAGCACCGTCAGCGGCGGAAACGACCCAGTCAACAACGGACATGTTCCTGGACATGTTTACGAAGAAAGGAAAATTTCTGAGCAAGCTTACCTCATTCGATTCGGAGAGTGGGCGGGGTGGTGGAACGGGGAGCAGCGAAGCTTTATCCACAGACGGAGGTAGCATTATCACTAATCCTGCTTTTCGGCAAGCGCACCAAGCTTCCTTCCGAAGCACCGTATCTGATAGCGAGGTCGAGCAAGGCAATTTTCCACGGCAAGGCAAGCAGCGCTCCGGCAGCGTTTGGTCCAGCAAGTCGTCCTTGAGTACGGGATTCCGTTATCACGGCGGAAGTTTGATACCCACCACGACGCTACCGAGTCCGGACGCTGCGAGAACATATCTCTTCGAAGGTTTACTGGGGAAGGAGAGATCGGGACTGTGGGACGAAATGCAATTCTGGGAGGACGCTTTCTTGGACGCTGTTTCGCAGGAACGCGATATGATGGGCATGGATCAGGGACCTGGCGAAATGGTGGAGAGATACAAAAGTTTAAGCGACAGCGAAAGGCGGCGGTTGGAGCACGAGGAGGACAGACTGCTGTGCACTTTGCTGCACAATCTCACCGCCATCCTGGTAATGTTGAACGTCGACAAGAACGAATTGAAGCGGAAGGTGCGCAGGTTGCTCGGCAAGAGTCACATCGGCCTCATCTACAGCCAAGAATTGAATCTACTTCTCGACCAGATAAACAATCTCCACGGAAACGACATCGATCTGAAGCCGCTGACGTCACGGCAAATGCACCGGCAGTCGTTCACTGTGCATTCGGGGGTCGACGCTGAGGGTGATCTACGATTTCTCGAAGTTCGCCACGACGGTCTCGTCCTGAGGTCGGTGAACGGCGTGATAGTCGAACGTTGGTGGTACGAGCGCGTAGTCAATATGACGTATAGCCCGAAGAATAAGGTTCTGTGCCTGTGGAGGAGGAGCGGCAGCGATACCGAGTTACATAAATATTACACCAAGAAGTGTAAAGATGTGTATTACTGCATAAAGGAAGCGATGGAGAAGGCGGCGGCTCGCGGGCGAGGCGCCAACGTGGGCTACGAGCTCGGCGGCGAGTTTCCGGTGCAGGACATGCGAACGGGCGAGGGCGGGCTCCTGCAGGTTTGCATGGAGGGCGTCGGTCTTCTCTTCGCGAATAGCAAGATCCTAAAACTAGACAAGTAATTCAACGTAAATATAAGTCACAAATGGCTGAAGAGGCGGTTCGTTGCTTGCATAGAATATTTTCCGTCGCATTTACTCTTCATAAGCTTCCATCGGAGACACAGAATAAACATAAGTGC
>XM_001504059.5 PREDICTED: Equus caballus ALG2, alpha-1,3/1,6-mannosyltransferase (ALG2), mRNA 
TGCGCAGAATCCCCTGAGGGGATGGGGCGCAGGCGTGGCTTCCGGGCCATGGCGGAGAAGCAGGATCGGGACGAGGAGCCGGGTCCCAGCCCGTCGGTGCTGTTCCTGCACCCAGACCTGGGCGTGGGCGGCGCCGAGCGGCTGGTGCTCGACGCGGCGCTGGCGCTGCAGGCGCGCGGATGTAGCGTGAGGATCTGGACCGCGCACTACGACCCAGGCCACTGCTTCGCCGAGAGCCGCGAGCTGCCGGTGCGCTGCGCCGGGGACTGGCTGCCGCGCAGCCTGGGCTGGGGCGGCCGCGGCGCCGCCGTCTGTGCCTACGTGCGCATGATCTTCCTGGCGCTCTACGTGCTGTTCCTCGCCGACGAGGAGTTCGACGTGGTCGTGTGCGACCAGGTTTCTGCCTGTATCCCAGTGTTCAAACTGGCCAGACGGCGTAAGAAGATCCTCTTCTACTGTCACTTCCCGGATCTGCTTCTCACCAGAAGAGACTCTTTTCTTAAACGCCTGTACAGGGCCCCGATTGACTGGGTGGAGGAATACACCACAGGTATGGCAGACTGCGTCTTGGTCAATAGCCAGTTCACAGCTGCCGTTTTTAAGCAAACGTTCAAGTCCCTGTCTCACATAAAGCCCGATATCCTCTACCCATCTCTGAATGTCACCAGCTTTGACTCAGCTGTTCCTGAAAAACTTGATGACCTAGTGCCCGAGGGGAAAAAATTCCTGTTCCTCTCCATCAACAGATACGAAAGGAAGAAAAATCTGACTTTGGCACTGGAAGCCCTGGTAAAGCTGCGTGCGAGATTGACGTCCCGAGACTGGGACAAGGTCCATCTGATCGTGGCAGGTGGCTACGACGAGAGAGTCCTGGAGAACGTGGAACACTACCAGGAATTGAAGAAAATGGTCCAGCAGTCTGACCTTGGCCAGTCTGTGACCTTCCTGCGGTCTTTCTCAGACAAACAGAAGATCTCCCTCCTCCACGGCTGCACGTGTGTGCTTTACACACCAAGCAACGAGCACTTTGGCATCGTCCCTTTGGAGGCCATGTACATGCGGTGCCCGGTCATTGCTGTTAATTCCGGCGGGCCCTTGGAGTCCGTTGTCCACAGCGTCACAGGGTTTCTGTGTGAGCCCGACCCAGTGTGCTTCTCGGAAGCAATAGAAAGGTTCATCCGGGAACCTTCCTTAAAAGCCACCATGGGACTGGCTGGGAGAGCCAGGGTGAAGGAGAAATTCTCCTCTGAAGCGTTTACGGAACAGCTCTACCAATGTGTCACCAGGCTGCTGGTGTAATGGGATGTTTTTTAAGGTCTTTATGCTACATTCATTAATACCATCTTTGTAGATCGTGACTCAGTTTTGAAACCAAAAAGAGAAAAAACCTAGAATCTAATGCAGAAGGGATTAAAAAATATGCACTTGAATCTTGAACCTGAGCCACCTTCCTATATACCACAACTCCCTGTCTGCTTTTTCAGAAAAATAGTATCTTTTATGCTGTAATAATCCTGAGTCTCACCAGTGTTGATTAAGATATAAATATGGTACAGTTCCACGTTCAGCAGAATATTTTAATTATATTTTCTCTAGATTATTGTTGCTCTGCCTATGAATTTTGAGTCATATTGTGCCTTAATTGTTTTAATAATTTAAGTATATCATCATCAAAGTTGATTGTTTGGCTTCGTAATGAGAATAGGGTCCCTGTAGTTCCCAGAATCAATCCACCTGGGTGTTGACTGTCCTCTGTTAGGAATTTTGCTTAGTCATACCTTTGCCTGGATCCGTGGCAAGAGTGATCTTTATTTTTTTACAAATGTGATTTATTGTGTTTTCCCACACTAAGACAATAAAAGATGTTTATCATAGGAAGAGACAAAATTTTA
>XM_004371625.3 PREDICTED: Trichechus manatus latirostris chromosome unknown C19orf12 homolog (LOC101348405), mRNA 
GTGAGCACAGACTCTGCCAGGCCCGTGTGTCCGGGGATTGCCCAAGCCAGCCAGCAGGCCACGGATGCCAGAGAGGCTAGACTTGCCTCATTTGTGAGGAAGTGTGGACATGTAGCCGGCTCCTCCTTAATCTGGTCAGAAATCAGAAGTGAATCTGAGAGCAAAGAAGACCTTGAATCTCTCTGCTGTTTCTGTTTGCTTGTTAACTAAATGCTGCCCCGGTTTCTCGGTGATAAAGGACTTTCCATAGGATGGAGGCTTTCTGACGTGGCCGTGGCAGGGCTGCTGCTCTCTGCAGAAAATGGGACCCCTCAGAACTTGAGGATGAGTCACATTTGGGTGGAAGGTCTTAAATCCATTAACACTTGCTCTTTGAACTTCTTCCTTTGAGGCCAGCCAAGATGCCTGTCGTGGTAGAGGACATCATGAAGCTGCTCTGCTCCATCTCCGGGGAGAGGAAGATGAGGGCAGCCGTGAAGCACTCTGGGAGGGGCGCCCTGGTCACAGGGGCTGTGGCCTTCGTTGGTGGTTTGGTTGGCGGCCCACCGGGACTAGCCGTCGGAGGGGCCGTCGGGGGCCTGTTAGGTGCCTGGATGACGAGTGGACAGTTTAAGCCAGTTCCTCAGATCATAATGGAGCTGCCCCCTGCCGAGCAGCAGAAGCTCTTCAACGAGGCGGCTGCCATCCTCAGGCACCTGGAGTGGACGGACGCCGTGCAGCTGACCGCGCTGGTCATGGGCAGTGAGGCCCTGCAGCGGCAGCTGCTGGCGATGCTGGTGAGCTACATCAGCAAGGAGCTGCGGGCAGAGATTCAGTACGACGACTAGGCCGCTCCTCCCAGGAAGCGGGGTTCACTCAGAGGATGCGGTAACTCGTCTAGAAGGAGGCCGGCGGCTTGGGGGCAGCTGAGCAGACCCCCCTGAGAATCCTCCACGTCGTCAGTGTATTCCCTTCACCTGGAGCTCAGTTTTCTGTTGGGGGGACTACGGTTGTGCCGTCTCCTGTTCTGGAAGTTACTCCGGAAGAAGATGTGTTCTGTGCTGTCCTGCACGGCATGCACTGATTATCCTGGGACTGGGAGGCTGGCGAGCGGCGGCGGTCAGCAGTGGGCATTGGGGCAGTTTTCCGAATGCTCTGCTGTCGGC
>EU641276.1 Uncultured Burkholderiales bacterium clone GC1m-1-48 16S ribosomal RNA gene, partial sequence 
TGCAAGTCGAACGGTAGAGGGGGCAACCCCTTGAGAGTGGCGAACGGGTGAGTAATATATCGGAACGTGCCCAGTCGTGGGGGATAACGTAGTGAAAATTACGCTAATACCGCTTACGATCTAAGGATGAAAGCGGGGGATCGCAAGACCTCGCGCGACTGGAGCGGCCGATATCAGATTAGGTAGTTGGTAGGGTAAAGGCCTACCAAGCCAACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAAGCCTGATCCAGCCATTCCGCGTGCAGGATGAAGGCCCTCGGGTTGTAAACTGCTTTTGTACAGAACGAAAAGGTTTCTATTAATACTAGGAGCTCATGACGGTACTGTAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTATATAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTTGAGACTGTATAGCTAGAGTACGGTAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGACCTGTACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCAACTGGTTGTTGGGTCTTAACTGACTCAGTAACGAAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCG
>XM_029869421.1 PREDICTED: Aedes albopictus transcription factor BYE1-like (LOC115265160), mRNA 
CGGCATCACTGGTTCACGAACAGGTAGTGAACTCGCCGATACAAAGAAACTAGCTGTCAACGCATAACGACAGAAGGTGTAGGTAGCAAACGTGAAACGTGGTGAAATGACGATTGATCTAATGTTTTGAGATGCTGCAAATGATTATATAATTTGTTATTGGGTGAAGGGAAATTCTTAAAAGTAAGTTTCGTATGTAATACCACAATTGTGAAACCAATTTAGTGTATTTTTCCTCAGAACTTGTAAATTACGCCGTACATATTCCTGCAAGTGAACTGTAGCAGTCTGAATTGTCAGAGTTCGATAGGTAACCTCAACTTAACCCTTATTGGAATACCCATTTGCTAATTCTATATTTATCTAAAAGGACGATAAATCCTCATAAGGGTTTGCTCAGGATAGACCGCGAATTTGAAGATTGTGAGAAGACTATCTTTTGAGCTTCGTTAGACAAAAAAGCTGCAAGGTGCTTCTACAATCCGAACACTCTCAAAAGATACCACTCGAATCGACTCTGATGGCTACAGTGAATCCACCTCACGGAGGCGCCGGTGACCACGACTGCGGGGCGTGCAACCTGCCTAACGATGCCGATCCGCAGATGGTACAGTGTGACGCCTGTCAAGTCTGGTACCATCTGAAGTGCGTCGGAGAGACTCCTGGTGTTGAAAACAGATCGTTCAACTGTCGTGCGTGTCAACCGCCTTCCAATGTCGGTAAGTCGAAGCCTAAGAAGACCAGATCGCAGAAGGGCGTAAGTGAAGGTCAACTGAAGGTTCCCGTCGCGTCTACATCTGGAGTGACACCGATAAAACACCCGGAAGTTCCCAAATGTGTTACGAACAAAGCGACAACAATCAAAACCACTTCGTCGACTTCGCGTTCTCGAGCTCTGACTCTGCAGAGGAGGATTGAAGCGGAGCAGCTTCTGGCGGAAATGAAGCTGGCTGAAGCAGAAAAGCAGCTTGAAGAAGATCGTCTAATGCAGGAAAGACAGCGAGCTCTGCGCGAAGAAAAGATTAGGCTGCAGGAAGATCTATTGCGGAAAATGCAGGAACTAGACGAGGTCGCCGACGCTGAGAGAGCTTCCGAATACACCAGCACCAGTGGAATGCGGAAAGCACGGGAATGGTTAGCGAAGCAACGACAGGAGAACCAACAGCAAGACGACAATGGTTCACACCGGTCAATACCACCGTTTCTACCTTCTAAGAAGTCGGAACGTAGCTCTCAAAAGTCGGTGGGACGCGAAGGATTCAATGCGCAAGGTGGGTCAGATCCCGATACATCCGATGATCCGGAAGGCCCTTCAGAAGAGCCGAATCCGCCGAATATGGACAGAAGAATGTCGTTGGAGAGGTCACCAGCGATGCAGATTACTGGAGAAATGCCGGTCAAGAATACGCTGCAACATCGGAAATTGCCGGGAACGTCATAA
>XM_002072634.3 PREDICTED: Drosophila willistoni nuclear pore complex protein Nup88 (LOC6651485), mRNA 
GCAAATATTTGCACTGAGAAATATAAGGTAAATAATTTAAACTAAATTGTGTAAAACAATTTGCTACATATTCAGGTGGCAAGCCAGGTTTTCAGTCATTTTATCACATATATAAAAGGAAAAAGTTCTGAAAATAAACAAAGCTACCCGGTCTGCTTGAATATATTATCAGGCAAAATGGCAACTACTGATGTTTTGGGTCTAAATAAAACTGAGATATTTGCAAAAATCCGGGATGGCTTGCCCATTGTGCAAGAATCACAGAATCTCCTGGACTGCAAGGACGATCTTCTTTTCGCGTGGAACTCCAATGACTGCTCATTGCTGGTGAAAAATTGGCGCGCATCTTTGATGGAAGCAGACACAGTACCTGAATCAACTGCAACAAAGCAGAAGAAAATTACTTACCAGACGTTGATACCTTCTAGTACGCTTAGTCTGGACGTGGATCGTGTAGTGGCTTCCAATGAGTGCTCACTGGTGGCTTTGAGTGCGCCACGTGGTGTTTGTATCCTGGACTTGCCTCGTCGCTGGGGACCAGAAGGTTACTTTGATGGTGGAAAGGCGATTATCACCTGTCGCACATATAATCTGGACGGTCAGCTGTTTCAGAGTAATCCTCACTTGGAGGTGCGTCAGATTCGCTGGCATCCTAACTCCGTCTCCGACTCCATGCTGCTGATTCTGTTTAACAACAACACCATCCGGCTCTACAATCATTACAAGCTGATGCATGTGTGGCAAGTTGGTCCCACCATCGTGAGATCCGGGCTGAGAACCTCCGCCTTGGATTTTGGTGAGGCAGCAGTTGACTTTGATATAGCACCGCCTGTGAAATCCAAAAGAGATTTGACAGAAGAACTAGAAGAAAGTGTAAATTTAACAGATAATTCTCTTAAGCAGGACAAGATTGAGTGGCCTCTTGTACTTTTGCGGGAAAATGGAAACATTTATATACTCATGACTGAAATGAGTTCGGACAGAACCCGCCTCCAGGGACCCATTACGATAACCCCTCAGAAAAGGGACAACTATGGACTGGAGTCGTCGTCAATTATGGTCATCCCCTCTTTGCCACCCACTTTGGTTATTGGCGAGTCGAGTGGCAAACTGCATCATGCTCTTTTGCTAGAAGCAGCCACTCCCGAGCATTCGCTCAATGAAGTTGATGATTTTATCGTCATTGAGCCCTCCGAATATGTGATCCATGTGAGAGAGACTGTGGAATTAGAGTTGGGAATAAAATCCGGTACTTCGAAATCGAATTACAAGTCCCCTGTCTACTTAAAACGAGATGTTATCAATGAACTGCGGTACTTTGCATATCACAATGCTGGTCTTCATGTTGTCACCGTGAACTTCATATCCGAATTGCAGCGTTATCTGGAGAGTGAGGCAGAGGAGGACCAGCTGAATTTTACAACGCCCTCACGAGCTGAGTACATACTGTGCACTAAATTTGATTCTAGCGACCACATCAATGCAGTTTTTGGTATTGCTCTACTCCAAACTCCGGCTGGAGTTGTTGTTTTGCTGGGGAGTGGACAGGTAATTAGCCTCAAGCTGGTCGTCGATGCCCAACTGTTAGTTTCACCAAGTGAGCAAACTCTAACGACATCTTCTGTCGAGCAAGGAGAGGCTGGACAAACATTTCAGGACAAGATTAAAAGTATTTTGCAGCGTAGCGTCAATCAGCCCATATTAGCTGATAAGCCCTCCTCCAACGCCAACGAGGGTTACGAGTTGCTTAGCCAAGCCATTGTCGTGCTGCGTTCACAGTACCTCAAACGTCATGAACTGGTGCTTGTCGAGTTTGCTAAGCACATTAATCAAATTCGCATAAAAAGAGATCAACAATTGCAAGAGATTCAGGACCTAGAGGACGAGCGGGAGGTGATTAGTGAGCGTGCTCACAAACTTGCTGAACGTTTTGAGGAAATAAGCGATAATCAGGATTGGCTTGTCCGCAAATGCCATAGACTCCTACAAAATGCCAATACTGCTCTGCCAAACAGCGTTGTGGCTGAACGTGAATTCGCTCAACAGGTGGCAAACATTAATAAGGCTAACAAAAAAATTGCTGCTGCCTTGGAAGATGCCAAGAAGACCATGAACAAACAGCGTTATTTCATAGCCAAAAACCAAGACGAGGTCCGTCAAAATGCATTCGAGTTGCCGGAGAAACAAAATCGGACCATAACCGAGATTCTAATGCAATTGGCCAGTGAAATAGATCGACAGGTCACTGATGTGAAGCGTATAAATAAGATTATTGGTATTTAAATAAATGGCTCTTGCTCATCTTAATTAGAA
>HQ071684.1 Uncultured Leptolinea sp. clone F5OHPNU07IB2R6 16S ribosomal RNA gene, partial sequence 
GCACAAGCAGCGGAGCGTGTGGTTTAATTCGATGCTACACGAAGAACCTTACCAGGGTTTGACATGCAAGTGGTAGGAACCGAAAGGCGACGACCTTCGGGGAGCTTGCACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCGCTAACGAGCGCAACCCTCGCTGTGTGTTACAAGTGTCACACGGTACTGCCGGTCTTAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCAGCATGGCCTTTATGTCCTGGGCTACACACACGCTACAATGGCCAACACAATAGGTTGCTAAGCCGCGAGGTGGAGCCAATCCTCAAAGTTGGTCCCAGTTCAGATTGCAGGCTGCAACCCGCCTGCATGAAGTCGGAATCGCTAGTAATCGCAGGTCAGCATACTGCGGTGAATACGTTCCCGGGCCTT
>XM_022591717.2 PREDICTED: Delphinapterus leucas TATA-box binding protein associated factor 6 like (TAF6L), transcript variant X3, mRNA 
GTAGAGGGCGGAGTCTGAGCGCCGAGAGAGGGAATTAGTGCGAGCTGAGTGAGAGGGCGCCAGCGCCGCCGCCACCACCGTCGCCGTCACAGATACCGCCGTCCCGGTAACCGCCTTCGCCGTGCCGGAGCCCTCAGGTGGAGAAAGAAGCTTGACAATTATCCGTTGGCGGCTTTCCAACGCCTCGTTTCCTGGCTGGGAATCCAGGCCTTGTTCCCCACACAGCCCGTCGCTCCTCATGATTAGAACGATAGTTGAGTTCTTGCTCCCTACCCAGCAAGTGTTTATTGAGGGCGTGTTATGTGCAGACGCAGTGCCTGACGCGGGGGATGCAAAGTTCCATCGGGGCCATGTCGGAGCGAGAAGAGCGGCGGTTCGTGGAGATCCCTCGGGAGTCTGTCCGGCTCATGGCAGAGAGCACAGGCCTGGAGCTGAGTGATGAGGTGGCGGCCCTGCTCGCAGAGGACGTGTGCTACCGTCTCAGAGAGGCCACCCAGAATAGCTCTCAATTCATGAAACATACCAAACGGCGGAAGCTGACTGTCGAGGATTTCAACCGGGCCCTCAGATGGAGCAGTGTGGAGGCTGTGTGTGGTTATGGGTCCCAGGAGGTGCTGCCCCTGCGCCCTGCCAGGGAGGGTGAGCTCTACTTCCCCGAGGACCGAGAGGTGAACCTGGTGGAGCTGGCCCTGGCCACCAACATCCCCAAAGGCTGCGCCGAGACAGCTGTGAGAGTTCATGTCTCCTACCTAGATGGCAAAGGGAACCTGGCCCCTCAAGGATCGGTGCCCAGTGCTGTGTCTTCACTGACTGATGACCTTCTCAAGTACTACCAGCAAGTGACTCGGGCTGTGCTGGGGGATGATCCACAGCTGATGAAGGTCGCCCTCCAGGACTTGCAGACCAACTCGAAGATTGCAGCGCTCCTGCCGTACTTTGTTTATGTGGTCAGTGGGGTGAAATCTGTAAGCCACGACCTGGAGCAGCTACACCGGCTCTTGCAAGTGGCACGGAGCCTAGTTCGGAACCCACACCTCTGCCTGGGGCCCTATGTCCGCTCCCTGGTAGGCAGTGTCCTCTACTGTGTCCTGGAGCCACTGGCTGCCTCCATCAACCCGCTGAATGACCACTGGACTCTGCGGGATGGAGCTGCCCTCCTGCTCAGTCACATCTTCTGGACTCATGGGGACCTTGTAAGTGGCCTCTATCAGCAGATCCTGCTCTCCCTGCAGAAGGTCTTGGCAGATCCTGTGAGGCCTCTCTGCTCTCACTACGGGGCTGTGGTGGGGCTGCACGCCCTTGGCTGGAAGGCAGTAGAGCGAGTCCTGTACCCACACCTGTCCACTTACTGGACAAATTTGCAGGCTGTGCTAGATGATTATTCAGTATCGAATGCCCAGGTTAAAGCAGATGGGCACAAAGTCTATGGAGCCATTCTGGTGGCCGTAGAACGACTGCTGAAGAGGAAGGCCCAGGCAGCAGAGCCCAACAAGGGTGGGCCAGGCAGCAGGGGCTGCCGCCGCTCAGACGACCTGCCCTGGGACAGCCTTCTCCTGCAGGAGTCTCCCTCCGGGGGCAGCGCAGAGCCCGGCTTTGGGTCTGGTCTCCCGCTGCCGCCAGGAGGCGCGGGGCCGGAGGCTCCTTCCCCTTCGGTGACCCTGGCGGACATCTACCGGGAGCTCTACGCCTTCTTCGGTGACAGCTTGGCCACCCGCTTTGGCACGGGTCAGCCCGCGCCCACGGCCCCGCGGCCGCCTGGGGACAAGAAGGAGCCGGCGGCCGCCCCGGACTCGGTGCGGAAGATGCCGCAGCTGACCGCCAACGCCATGGTCAGCCCGCAGGGCGACGAGAGCCCCCGGGGCGGAGGCCCCCCGTCGGCCTCTGCCCCCACCGCCTCTGAGAGCAGGCCGCTGCCGCGCGTGCACCGGGCGCGGGGGGCGCCCCGGCAGCAGGGCCCGGGCGCCGGCACCCGCGACGTCTTCCAGAAGAGCCGTTTCGCCCCGCGCGGTGCCCCTCACTTCCGTTTCATCATCGCCGGGCGGCAAGCAGGGAGGCGATGCCGCGGGCGCCTCTTCCAGACTGCCTTCCCCGCGCCGTACGGGCCCAGCCCGGCCTCCCGTTACGTGCAGAAGCTGCCCATGATCGGCCGCACCGGCCGCCCGGCCCGCCGCTGGGCGCTCTCGGACTACTCGCTGTACCTGCCGCTGTGAGGCGGCACTGGCCTCTGTGAATAAATCCCGCGCCCGGAAGTGA
>HQ278360.1 Uncultured bacterium clone CB6AA43 16S ribosomal RNA gene, partial sequenceHQ278363.1 Uncultured bacterium clone CB6AA69 16S ribosomal RNA gene, partial sequence 
AAGACCTCACGTTATTGGAGTGGCCTACGGCTGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGGGCAACCCTGATCCAGCCATTCCGCGTGAGTGAAGAAGGCCTTCGGGTTGTAAAGCTCTTTCAGCAGGGAAGAAACGGTTACGGCTAATACCTGTGACTAATGACGGTACCTGCAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTGTAAGTCAGATGTGAAAGCCCCGGGCTCAACCTGGGAATT
>XM_798046.1 Trypanosoma cruzi uncharacterized protein (Tc00.1047053503983.29), partial mRNA 
ATGTACGCAGGTCTCTTTAAGAAGCGGCCACGTGAAGCCGATGCAGCTTCCCACGGGAACGCACCGGAAGACAGTGGGGATGCATCGAGCAGGGCCGCCGGCATCTCGTCACCCACGCTGTCTCCCCGCACTGTGTACCACTATCCCTCGATGCTGCCATTCCCAACGGTGATAGATTCTGAATTTCCCGCTGAGTCGTATCGTTCCCGCAGCAAAGACGTAAAGGCGGCTATTCATTGGGGCCAGCGGAAACTCTTACTTTCTGAGATTCAGCTCCTCTCCATATATGCTCGGCCGAATGTGTCTTATCACATTGTCTACGCAGGGTCAGCCCCCGGAACTCATCTTGCATTTCTTGACGAACTGTTTCAGAGTCGACACACCTGGGAACTTGTGGATCCGGGAAGATTTGATCGGCCCGTGCTGGAGTCACGACCGAATTTTTCTCTTCGTAACGAATTTTTTACAAACGTGACAGCCTATGGCATTAATGCGCGCCGTCTTTTGGAGGTGCTTCCTGGGCTGGGAACCGTTTACCGTTGTGTTGCCCTGGACGGTGCGTGGTCAACAAAGAAGGAAATCCACCAAAAGCTTCAGAGCATCGTTGGAACGATTGATGTGGCCCGTGGCACGGAAGATATCCCATCCATGTACGAACCGCGGTTGGATCTTCCCTTTGGCTTTGAGCTTCTTTGCTACGTTGGTATGGAGCGAAGCAAGCC
>XM_038047407.1 PREDICTED: Hermetia illucens small conductance calcium-activated potassium channel protein (LOC119646808), transcript variant X7, mRNA 
GTTGTTGTTCCTGCTTTTGGAAGGGTATTGTACGTATAGATACTATCAATGCGGCGTCGTCGTCGTAGTTGCCGAAATATCTAAAAGAATGCTTACGGACAACAGTCGGACGTCGGACTCGGATATCGTGTGTGAGTTTCGCTTAGGATAGGACTTCAGAGGAGTGTTGCTTTGGGTCCTTTCACTACTTTCTAGTGTGTTTTCGACCAGAAAGGAACGTATGTGTCGTGTGCGTGGTGATTGCTGTGGCCCTGCTGTTGACTATATATACTTCCTGTCGATTTGCAAGTTCTTACGCCTTTAGTCTATGTCGGGATACCCACCTTGGAGGAAACGTTGTGCTTATTTTTCCTCTCGGTTTCTATAAAAATATATTATTATGTTCACACACGCTACACATGCCAGATCATTATAGCGCACGCAATTTTCTTGATTCAAGTTTCGATTTTGTTTGTCGTTTCGTTTATACCGATGCTCCGACTTTTCATTCTCAAACTGTAACAGAGCTTATCGCGACGTCGTGACATCCATAGGGAACAGCTATTTTCTGAATAGTTTCTTCTTTGATTTTGCCATCATTCCGGTAGAGGCAGAATCGCAATTTAAATAGCTTTCGTTTGGATCCCTTCTATCTTTCAGTGTATTATGCGCGAAACTAAAATTTTCGGTTCGCTTTCTTGATACAGATCCATTCAATTGGGGAGCAGAATTTGAGAGCATCTCCTCGGAGGAGATAGTGATTGAATTATTCGATTCGATTTCGAGACTCGTGTGAGAGGGATAATAAATAGAAAATCTTTAGATATTGTCGTTGCTAAGAAATTGGTATCTGTCGTCGTTACTGTGAATGTGTCGTCGATTTTGGTCTCTTCAAAAGACACAAACTTTGGGGATGTTGTCCGGCAAGTGAATATAAACGAATAACATGCAGTGTGTGGTTTTTCGAAAGATTTTCGAAGTCGTATCCGAAACGTCGGATTCGTAGTCAGCAAATCTTGAGAATACGAAGCAATCAAATCCTTGCCCAAGTCGGTGCCGGATTTTCAGATGGATTTTCGTGCGGTTTGATTTTTCGGGGTGGTTGCTTGGGACTTTTAACCTTTTTATTCCGTACCCAAGTGTCGAGTGTCTTATCAGTGTCCAAACAAAATCTCTTAGTCCTCATTTATTGTGATTTCCCATTCATTTTGTTACATATATATTATATAGGAAGAAAAAGTAATTTTAGGGTGTGTGCGATTACGACGTGTAAAATTTTCAGAAATATACAGTGTTCGTATAATAGCTAGAAATAAAGAAGTCAAAGCAGCGCAGACGGATAAAAACTAAAGTTGAAAATTAAAAATATACCCCCAAAAAGTGTCACGTATCTGTGCCGTATCAGATCGCTACTGTAGTGCGCTTTTAGCAGCCGATTTCTAAAATTATTCGGCAAGAATAAATGCAAAGCAGATTGAATCCTAATCCATCCTTTCATTCCCTTTCCGTGCCGCTTTCAATTCCACTCCGATTCGCACGTATTTGCCGCTCCTAACGCCTTGCTCTTTCCCTGTATCCAACCCTCATCAGTGGTTTGGAATGTGGAGAAGTGCTCTTTTGATTAATTAGCAAGCAAAACTACTCTACGCGCCGTATTCATGACATCCATGATATCCCGCCGTCGACGAGTCAAAAGCCCATGTCCTCTTCATCGTTACCAGGACAAGAAACTATTAGACGAGGGTGTGTTCCATAGAATCACGACACGGCAAGCAAAGGGCATACCCTCAGGATTTCATAGTTGTGAATAAACAAATCGACGTCATAGAAATCACAGATGCGAAAAATATCAAGCCAAATGATAGATTTTGTGCAAAGACGCGAAAGCGTAGCCACAGCAGAAGTACTTCCAAAAAGGAATTCTAGATGAACGGGCGTGCCGAGAAAACAAGGAAAAGTCAGAATGACAGCGGAAGAAAAATCAGCAGCTGCGTCTTTCTAAATGCTTCTTTTGTGTTGTGTGTCCTACACCATAATTTTTCGGTCGTGCATCATTAAAACCCAAGAATACAAATGCCATCTTCGTCAATAAGACTTGGCTTAAATAATTGAGCAGCGTTTACTCAATGAATGACGGCAAAAATGCATTTAGCTTAGCGACTTTCCGTTCACTTTTCCAACTCAGTTCGATTGTACATACTTACGAGTATGAACAGATGGATACAGATAGATACGCAAACTGACAGCCACATAGACTGATTGAAAACATCATGTGAGAGCTTTGTGCCTTCTCTGTGCGAGTCCTGTTCACCCGTATCCGTATATGTACGTATACACGCAATTCAAGCGGACAAATAACGTGGATCAATCGATTTTCTATTCCTTCCGAACAGATATCCTTTTGTCTTTGGCAAAATAAAAATATCAAGGAAAGGAAACCGAAGGGCAGTCAAGGAAAAAATAAGAAGAAAACAGTACCTCGCTTTTCCTTCAACGACAGAAAACCCAACACGCGGTTATAACGGAACTAAGCATACATTGCGTATGTACTATCTTGCTGATAACCCTTCTCAATGCCACAAAAAAATTCTACTTAAAGTTAATCGCCAGCGGGCCTGCATAATACTCAACTTCTATATACATAGTCTGTTCAATTAGTGATAAATCCCGCGATTTGTATTTCTGAATTTCGGTGTTGATACCAAGTAGTATGTGAGTATGAAATCCTCAGAATGAACGCTTAACGACTGACTGGCTTCAACCAGCGTGACTAAGGACATGAAGACGAAGGTCGTCTGCCTTTTTTGTGATATCAGCTAATCCCCCGCAATTCAAACCCAACAAAAACCATTAAAAACGACAACGCGACCAAATCTTAATTTGATTTAATAAAATTGCTTTAATTTCGAGTATTAAATAAAGACCTAATTCGTAAAATTATGGAGTTGACGTCAATAACGAACTATTCAAAATATGACGGGAAAAATGAAATGCGGCAATATCTCAATATAAATACCAAGCAAAGGTTTGGATTTGCTGCCGTGTCTGCTGCTAGTTGTTCCGGACTACGATTCAAAATTCAAATCTCAACGGTCAATGAGCTGACGTAGAGATTGTGAGCGTGAGTGTTTCAATCGCCATCAATCTGTATGTGCAGCTCCGAAAACCGGTGTCCACGTTGTCGATTCCTGGCTCGATGAAAACACCCTGCGCTGGAAATCGAGAACAAATTTCGTCTGCATGCAACGAAGAAGCTGGCGTTGCACTCGTGGGTGTTCACTCAGAATATCCCAGGTACATGGAGGAGCGAGGATTGACCGGCGTCAAAGCACCTGGAGCTGGTTCAACACCGGGAACTCAGAAACATAAGCCGAATGTTGGCTATCGATTAGGTCGAAGAAAAGCTTTATTTGAGAAAAGAAAACGAATAAGTGATTACGCTCTTGTAATGGGTATGTTTGGAATTATCGTAATGGTTATAGAAAACGAATTAAGTAGCGCTGGAGTTTATTTAAAGTCTTCGTTTCATTCGACAGCCTTGAAAACATTAATATCCGTGTCGACTGTGATCCTTTTAGGTCTTATTGTTGCTTACCATGCTCTGGAAGTTCAGTTATTTATGATCGACAATTGTGCAGATGATTGGCGAATCGCTATGACGTGGCAACGAATTAGTCAAATAGGTCTAGAACTTTTAATATGTGCTGTGCATCCAATACCAGGCGAATATTACTTCCTCTGGACAACAAAACTTGCTAATAAAAATAAATCAATGGGCACGGAGTTGGTGCCGTATGATGTTGCATTATCATTGCCAATGTTCCTTCGATTATATCTAATATGTCGTGTTATGTTGCTACATTCAAAATTATTCACAGACGCCTCATCACGTAGCATAGGTGCACTAAATCGTATAAATTTTAATACCAGATTTGTCCTTAAAACACTAATGACAATATGTCCGGGAACAGTTTTATTAGTTTTTATGGTATCTCTATGGATTATCGCCTCATGGACGCTGCGACAGTGTGAAAGGTTTCACGATGAAGAACATGCAAACCTTTTGAATGCCATGTGGCTTATAGCCATAACATTTTTAAGTGTTGGGTTTGGTGATATTGTACCAAATACTTATTGTGGTCGTGGTATTGCGGTCAGCACAGGAATTATGGGAGCTGGATGCACTGCTTTGCTGGTAGCTGTTGTGTCTCGGAAGTTAGAGCTATCCCGGGCTGAAAAACATGTTCATAACTTTATGATGGATACCCAGCTAACAAAAAGGCTAAAAAATGCGGCAGCGAATGTGTTGCGAGAAACATGGCTGATATATAAACACACAAGGCTGGTGAAAAGAGTTAACCCTGGACGAGTGCGGACGCATCAGAGGAAATTCCTTCTAGCAATTTATGCATTACGAAAAGTAAAAATGGATCAACGAAAACTTATGGATAATGCAAATACAATAACCGATATGGCCAAAACACAAAATACGGTGTACGAGATTATCTCGGATATGTCAACAAGGCAGGATGCGATTGAGGAAAGACTATCAAGTTTAGAGGACAAAATGCAGGCGTTGCAGGATCATATGGAGTCATTACCGGAGATAGTCACACGGTGTCTCACTCAACATCAAGAACGGTTGGAACAGCGGAGAAATTTTCTGCATCCGGATGCTGCAGTAACAGCGTCTGCACAACCGTCGCAGCCGCCACCTCTAGTTTCACCTTTACTCTTTCCACATTCCAGGAGTGTACCATCTACAAACAATGCAATTTTCCAATGGCCAACAAGTCCAATTCTGCCACCGGTATCGAGTAGAACGCCTCATTTGGTGCCTGACACATATATTCCATCGACTTTAGCTGCGACGGCGACACCAGCTGCAGCCACAAGTTCAACCTCTCTAACAAATAATAATAACGTTAACACATCTTCCAGTAAATTAAACAGCTGAATCGAACCTGCACAAACTCAACAAACGCATTCTATGGTGTGTCCGGCGTCAACCTCAATCACGACGGCCAGCAACAAATACACGAGACGGAGGGAACGACAACGAAAAGCCCAGTTCAGAGCAATGGCAACAACATCAACAGAAGCAACAGCAACATCAACAGAAACATCAAAATCACATAGTAACTCATTAGAAGACATTTTTACGCAACAAGGCAACTCGTGAGAAAATAATGATAGTAGAAAAATTGAATAGTGACGATTTTACTATGTAATGGGAATAAATTATTATTACTATTATATAAAGACTAGGAAATGAAGCAACTAAGAAATAAGTAAGCAAAAAGACATAGGCCAATTTCTAAGGTTCTAGAAAAGTAATAATCAATTGAGACGGGGGAGAAAATATGAATAAAATTCGTGAATTTAGGGTGTAAATCATTGGAATAAATTTTGATAAGAAGGAACTCGTTTTGTTGTTTGAGTATTACGGTTATTTAGTTTTTAATTATGTCACATTTTCCAGTCCCTTAGAAACTACAGAAAAATTCTCATCTGATATACCAAGTGAAAGAAAATATTGAGTCAAATTCTCCCTTAGAGAACTGACCCGTTGATCAGGGCTGCATGTGCACTTCTTGGCAAACACATTTGACCAAATAAAAGTTTTTCCTCTAGCAAATTGTTTAGTATCCAAGTCACACATCAATAGGAAAAAAGTGATATTTTGCCGTTTTAGTGATTTTAAAATTCAGCCCTTATAATGCGGAGGACCCAACGGAATTTACTTAGTATTTTCTGTTACTGGTCATTCAGTAATATTACTCAAAGTAGAAACGAACCACAAAAGTACGCAAATTAGTAACATAGAGACTAGATTTTAAAAAAACGTACTTTTAATTTTCTTTAAAAATATTCGAAACTATGGGGCCCACTTTAATAGTCATTCGAGCGAATAACGGAAGACAAATAATCGAAATTAAAAACAACCTGATTGCTTGGATTTAGATCTTAACCGGTTTCAATATCATCAAAAAAACAACCACTCAAGAAATCCTCTTCAACCTCCGGATGAAATGAGCAACTGAACATTATGTTGAACAATAAAAGAAAGCTTTACGACAAAATAGAAACATCAATAACTTCATAGACTTCATACCTAAGACGAAACAAGCTTACGATATTAAAGCCACAAATTATAAATGATAAGAAAATCTCGAAACGAAAAAGTGAACCACTACCAAAGTGAAGTTATGTAACGAAGATAGGAAATGACAAAACCCTATAGAAATGTAGAAACAATTATTTCATCTTTAGTATCTCTTAGACCATTCATTTTCTACGAAGTCAAGGACGAAATTGTTTTAAGTGAATTAAGAACCCTTTTAGTGTATTCATTTCGTTCTATGTAATTACTAAAAAGCGTGTTTCGCGAAAAAGCTTTAAGATTTAGGGTGCCTGCATTTGCTAAGAAAAAACTTAGATTTAAAGAGAATATTACTTATTATTATTAAAATTATTATTATCACATGATGGTAGTAAGAACAAGTAACATTAGTAGAAAAATAAACCCTTGCGGAAGTAGGTCATGCATATTATGTAACATATGTTTTGTTTATGTTTGAATCGGTACATTCAAACTCAATTTGTCCAAAAATATAAAAGTTTCGACAGATCGTTTTTACTTTTGTTAGAAAAGGTTTTACGTGTGTTGCTGAATAAAATTGAATAGAATATACGGAAAAGTCTATTGTACAAATTTAGTTTATATAAAGTTGTTGCAATTATACATAAAAGAGCAAGAAAGATAAAAGTCTAAACCAAAATTGATTTTCAAAGTTAAGGACAATTTAAAAGTATTCGCATATTTACCTATATACAAAACATATTACAACAACTATTAAGAAATTATACAAAAACAACAAAAACCTAAAAAACCATCCCTCAAAGAAATTAAAAGGAATTTAAAAAGGATCAAAACGGTATCTAAGCGTAAAATAATTGAAGAAAATCCATACTAGTCTGTTTTATTATGAATTACATAAAATACGGATGAATAATTATGAACATTCTTTGAAATGTATAAATTTCGATCTTAAAAGTAACAAACGAACACACCAATTTGAACGTATCTTGCAATAGTCGTCCATTTCATTCAGCCATTGTATTATATATTTAAAGATATATATATATGTCTAAAACAAATTTATAGATAAAAAAGTGAATTGATAAAACTCAACTAAAATTAAATTTAAACCTGTGAATCATAGAAAACCCGAAAGTATGTGGATTAAATTATGGTCTTATAAAAAATATTTAAAGCAAATATATAAAAATTAAACTTTAAAGAAAATCTGCTCACATGCGCTAAGTACTAATATGATAAAGTTTAAATCTAAAAAATTAATAAATTTTAAATTATCTCAACATTCAATACAGTAAATTTATGGGTACGACATAAGGCTGAAGTGTAGGAATAAATAAAATCGAGAATGGAAGACTATTGCAACTGTATTGTCACCTTGTTATATTTTGGCTCTCCTGATAAAGAAAATAAAAAAGAAATTACGAAATCACTAAAAAGAGAAAGATAAAAACCCTAATCTAGTTATTATTATTATATAGAGAGAGAATCGTTATTTCGCAACATTAATATAAAAATATTTATTGTAAATTGTTCTGTTTTGTATGATATAATCATGTATATTTAGTTTACAATTAAATACGTTTTCTGCA
>XR_007117108.1 PREDICTED: Pieris napi uncharacterized LOC125050190 (LOC125050190), ncRNA 
CCCAACCAACATTTTGGCGCTAATTTTCACCACTCTAATCGTTTGTATTGTTTTAACGGGTATATAAAAGTGTCTAGTAAAACTTTTGTTGGTTTAATGGTCATGAATATAACTAAATAACTCATTAAGATGAGTAACAGTAACAATAATTCATAATATAACTTAAGAAGTTATAAAAGAGTTAAGCTGAACCACAGTAACGCTAGGTGTTGTAACCTCAAGTAACAATAAGTACCTCAAGTAGTAATAAGGTTTCTAGTAAGTCTTACTATTCCCAAGTGTTGTTTAAGAGTGCTAAGTAAATGTTTTTTACCACTTAGCTTGCCTAAAAACGTAATATTACTTAAGAAGGTATGAAGGTTATAGTCACAACCATCATAGAACTTACTCTTATATAAATTCAAGTAACGCGAAACACTTAAAGTAATATTATAGTTTCTAATAACTCTTTCTACCGACAAAAGCTCTTGAAAATAGTTGACAAAATATTTTTATCACCTAAATTGCTACAAAAGAAGTAATTGGAACTTATTTACAGCAATTTAATTTAGAAATTAGAAACCACTATATATGATATTAGTTGGTATTATGGAGTTATTTTTAGAGCCCTGTTCTTTACAACGGTGTTCGAATTTACCTTTATGTTATTCTAAGAAATATGAAAATACAATTTAAACGTTGTAACTTTTATTTTCACTTGAAGTTATAAAATATTACCTACTTTATAGCTGTATAATGTCTCTAACCTCAAAATTGTGTATAGTCTGATTTGCTCTGAAGTCTGTTTGCTCTTGCTTGCTTAATTTTTGCTATGAGTTCGTGGAAAAAACGAAAAAGATGTGGAGGAGTCAAAAGAAAAATATCAAACGAATACAAATTAATAATCAGATCAAATCAATCAGTGTCATCCTGCGATAAAACCACCAAACTGCAAACAGTGACCAGTATCAGTGATGCAGTTCAGCATCATAGTTCTTCGTTGAAGAGAAGTATTGATGACGCTAGTCTGGGTTGTAGTAGTTTTTGCAACGAATATTTTCATCCAGCGCAGCTTAAATGTCAACGAAAATGTTCGTACTGTCGTAGAAACTCCATCGAAAATGTCGGTCAAGTGCGGGAATTTCAACAAGGACTAGAAAATCATAATATGTATGTGAGCAGTAAACATGGTGAAACGCAAGATATTGAACAGGGTTCTGTAAGTGAGCATTTTATAATTTCTTGTAAAGAGAGGAATAAATATTTTCTATCATCAACTGATGATATTATTGAAGTCCTAAATATATCAATTATATCGACAATGACAAATAGAGAAACTATTATGATACAAATAGGAGGAGATGCTATCGAATATGTAGATCACTACGTATATTTAGGGCAAATAATATAATTTCATGACCAAAGGGATCTTGAGATAGAAAGAAGAGTGTCTAGCGCCTGGAAGAGATTTTGGTCACTCAAGGAAGTACTTAAAAGTAAAGACTTCCCAATAGTAGCTAAGAAAAAGGTGTTCAATCTATGTATACTACCATGTGTTACATACGGCTGCGAGACTTGGGCTTTATCTCAGAAACATCTTCTAAAGTTGAGAACATGCCAAAGAGGAATGGAAAGAAGCATGGTGGGTGTAACACTGAGACATCGAAAAAGAGCAGAAGAGATCAGATCAACGACCAAAGTAGAAGACATTATAAAGAAAATAAGGCAGTTGAAATGGCGCTGGACTGGGTACATGACGAGAGATAGCAGGTTGAAATGGACAAAAATAATTACAGAATGGCAACCACGTGATG
>XM_017443506.2 PREDICTED: Diaphorina citri phospholipase A2-like (LOC103507865), mRNA 
TTTTACTCGTCACCATGAAGTCTATCCGGGCTCTCCCTGTGAGTGTTTTACTCATCTTTGTATTCATCTCCTCTGTTCGTAGCTTTGATCAGTCCTACTATAAAAACGCGTATAATCACAACAAGTACAATTACTTGAAGGGAAATAACAATAACAAGTATAGTAACTTCAATTCCAACCAGGACAGTTACCGATCCGACAAGAGTGACTTGATCTTCCCTGGAACCAAATGGTGCGGTGCAGGAGACATTGCCACCGACTACAATGACCTAGGAACCAATGTAGAGACAGACAAGTGCTGTCGAGACCATGACCATTGCTCGGAATACATCTTGGCGAAGAGTTCTCTCCATGGACTGCGAAACAACGCACCCTTTACCCGAGTTCACTGCAGATGTGACAAGAAGTTCTACGACTGTTTAAAGACGGCGGCTGACACGGGAGATCAACCTTCCCAGATGGTGGGATACATGTATTTCAATTTACTAGAGACCCAGTGCTTCCAGGAAGTGTCACTGCTGTTATTTTAA
>XM_002502056.1 Micromonas commoda predicted protein partial mRNA 
ATCCCGGGCCAGGCGGACACCGAGGCCATCACCGCCGTCGCCTTCAGCCAGTGCAAGAGCTACGTGGCCGTCGCGGAACGCGCGGAGAGGGGTGTCATCACCGTTTACGATCTCACCACGACGACGGGCTCGCCCAGGAAGCGCGTGCTCGCGTCCACCGACGTCGGGTCCAAGGAGTACGTGAGCGTCGCCTTCTCCCCCGACGGCAAGTGGGTCATCGCGCAGGGCGGCGCCCCCGAATGGAACGTGACGCTGTGGAACTGGGAGCGGTGCAAGCAGCTCGCGTGCGTGCCTGCCAAGCCGCTCGGATCGGACGCGGGCGCCGTTCGCCAGGTGAGATTCGCCGCGCACGACCCCGGTCTGGCGTCGTGCGCGGGCGAGGGCCTCTTCCGCACGTTCAAGTGCGCGGAATCCGGGGTCAGGGCGCTTCCGGATGTTAAGCTCCCGCCCGCCAAGTCGGGCGCGATTAAGAATTACACGGCGCACTGTTGGCTTCCCGACGACGCCGAGGTGACGGACGGCGGGGAGGAGGGAGCCGAGCGCCGCGAGCGGTGCATCCTGGCGACGGACGGCGGGGAGTTGCTGGTCGTCGAGCTCAACGAGGTCAAGGCGACGATACCGGCTTTGAGCGACTGGAAGGGTGTCGACTGCGTGATTCCCTACGGCGCCGGCGGGTTTGTGTGCGGCGGCGCGGACGGGACCGTGAGCGTCTACGAAAAGACGGACGAGAAGGAGCTCTACAAGCGCGTGAAGCACTTCGTGATCAAGCAGTCGCCCGGCGCGAGGGTGACGGCGCTCGCGCTATCCCCGACGGACGAGACTTTGCTGTGCTCCACCGACGATAACCAGATGTACGAGGTTGACATGTCCAACGTCGACGTCGTGAAGAGCGAGGACATCGAGTGCCAACTGTTCACGCAGGGGCACCACACGCAGGGCGTGACGGGCGTGGATCTGTGCGTGCGTAAGCCGCTGGCGGTGACGTGCTCGAGCGATAAGTCCGTGCGCGTGTGGAATTACTTGGACAAGGCTGACGAGATTTGCAAGTACTTCGCGGAGGAGGCGCACAGCGTCGCGTTCCACCCCAGCGGGCTGCACGTTCTGGTGGGGTTCAGCGACAAGCTCCGGCTGTGTAACCTGCTCATGGACGACATCAGGCCGTACCGCGAGTTCAGCATCAAGGGCTGCCGCGAGTGCTCCTTCAGCAACGGCGGCAAGTATTTCGCCGCCGTGAACGGGCCCGTGATCCAGGTGTATAACATGTACACGTGCGAGAACGTGGGCAACTGCCGCGGCCACGGCGGCAAGGTGACCGGCATCGCCTTCTCCGCCGACGATAAGCGCCTGTTATCTACCGGCCTGGACGGCGCCGTGTACGAGTGGTCCCTGTCCACGTTCCAGCGCGAGAAGGAGAACGTCATCAAGTCCAACGAGTACGCCTCCGTCGCGATCGCTCCCGACGATACTTACGTCTTCGCCGTCGGCTCGGACGCGACGCTCAAGCAGCTCGACGGCGAGGACCTCATGCTCAACGAGGAGTTCGCCCTCACGGGGACCGGCGGTGATGGCGGCCAAACCCAAACCCAAACCTTCACGCGCGTCCGGCTCACCAACGGCGGCAGACGGCTCTTCGCCGCGACGTCCACGGGGGCTGTGAGGGCGTACGAGTTGGACGGCGGCCGGATCGCTGGCGAGGGCAAGGAGTTCAAGGAGCTTCGGTGCCACACGGGTCCAGTGACGGGGATGCGGGTCAACTTCGACGATACCCTGCTCTTCTGCGTCGGCGAGGACGGGGTGTTGTCCGTCTTTGACGTCAAGGAGCGCGCGATGGAGGGCGCGACGAAGGCTGGCGAGGGGATGGTGTTTGCTCAGGAGGTGCTCATGACGAAGGCTGACCTCGAGGATATTCGCAGCAGGATGCACGAGCTCGAGGTTCAGGTCAACGAGCTCACCCTTCAGGGCGAGTACCAGCTTCGCCTTAAGGACCTAAACATGAACGAGAAGATCAAGGATCTCACCGACAAGTTCCAGGGCGAACTCGAAGGCGAGCGGTCCAAGTACGACGCGCTGCTCCAGGAGAAGAACGAGCTCGAGATGGATTTCGCGGACCAGATGAAAACCACCGAGAACAAGCACGCGCAGGCCACGGCCGCAACCGAGTCTTCGTTCCAGAACAAGATCCTGAACGAGATCGAGCGGTACCAAGCGCTCGTGGAGGAGAAGGAGGAGCTCAACCGCGGATGGGACGAGCAGAACACCGCACTCGCCGAGTCGCATGATCGCCTCGTGGCGGATCTCACCGAGGAGTTTGCCGGTAAACTTCAGGAAGAGCAGATGCACTCGGAGACTCTTCGGCTGCAGCTGGAGGAGGCCCGCGCGGCTGCGAATGAGCGCGAGAACCAGCTCGAGGAGGACGCCGACCTCGAGATTGACGAGCTCAAGGAAAAGTACGAATTAAGGCTCAAGGAACAGCGCGACGTGTCGCTGAGGTTGAAGGGCGAGAACGGCATCATGAAGAAGAAGTTCACCACCATGCAGAAGAGCATCGCGGAGCAGAAGGACGAGATTGCCGGTCTCTTCACCGATAAGAAGAACCTGTACGCCACGATCGCAGATCTGGAGAAGGACGTCGCGGGCCTTAAGCGCGAGATCCGGGACAGGGACGAGACGATCGGGGACAAGGAGAAGCGAATCTACGACTTGAAGAAGAAGAACCAGGAGCTGGAGAAGTTCAAGTTTGTCCTCGACTTCAAGATCAAGGAGCTCAAGCGGACTATCGAACCCCGCGAGCAGGACATCTCGGATATGAAGAATCAGATCACTGAGATGGACAAGGAGCTGGAGAGGTACAACAAGAGCAACACCCACCTCGACCTCACCATCAAGGACCTTCGCAACAAGCTCCTCGGGATGGGCCAGGACGTCAAGCGCAAGCAGAAGGCGATTGAGGACCGGGACTCTGCAATTCATTCGTTCCAGAAGGATCTCCACGAGGCCACGAAACACGTCCAGACGCCCAAGCGACTCGCCGAGGAGGTCAAGTCCCTGTACGCGAAGCACATGACGCAGAAGATCGACGACAAGCCCCCCGACAAGGACATCCAGCGCGAGTACAATCGCCAGCGAGAGTACCTGGAGAAGACCATCGATCAGTTCAAGCGCAAGCTCGCGAAGGACGTCGAGACGCACAAGAAGGACAACATGGCGCTGATGA
>EF225152.1 Uncultured bacterium clone Br_008751_0450_0145 16S ribosomal RNA gene, partial sequence 
CACCGCCCGTCACATCACGAAAGACCACGTTGTACTAGAAGCCGGCAATTCAACCGCAAGGAGATAGCCGTCCAAGGTATGACTGGTGATTGGGGTG
>XR_004539126.1 PREDICTED: Geotrypetes seraphini TIA1 cytotoxic granule associated RNA binding protein like 1 (TIAL1), transcript variant X6, misc_RNA 
CCTCTCCTCTCGCGTAGGGTCCGAGGAGAGCGGAGGTCGGCGCCTGCGCGTTGCGGGGATTCCTGCCTGACTGACTGGCGGCCGCCATTTTGTTATCCCGGATCTGCAGCGGATGAGCCGTGCTGTAGGAGACGTAGTTGTCTGCTCGCTCCCTCCCCGCCCGTCCATCTCTCCCTCGCCCCGGCAGCCATGATGATGATGATGATGGAAGACGACGGGCAGCCACGGACCCTCTATGTCGGTAACCTTTCCAGAGATGTCACAGAAGTTCTTATTCTCCAGTTATTCAGTCAGATTGGCCCCTGCAAAAGCTGTAAAATGATAACTGAGCAACCTGATAGCAGAAGGGTCGGCTCTTCTGTTGGATTTTCTGTTTTGCAGCATCCAAGCAATGACCCGTATTGCTTTGTGGAATTCTATGAACACAGAGATGCAGCTGCTGCATTAGCTGCCATGAATGGGCGAAAAATATTGGGAAAGGAAGTCAAAGTAAACTGGGCAACTACCCCAAGTAGCCAGAAAAAAGACACTTCCAATCATTTCCATGTGTTCGTTGGAGATTTAAGTCCAGAAATCACAACAGAAGACATAAAGTCAGCATTTGCTCCTTTTGGTAAAATCTCGGATGCACGTGTGGTCAAAGACATGGCAACAGGCAAATCAAAAGGCTATGGTTTTGTTTCATTTTATAACAAATTGGATGCAGAAAATGCAATTGTGCACATGGGAGGCCAGTGGTTAGGAGGTCGTCAGATCAGAACCAATTGGGCGACACGCAAACCACCTGCTCCAAAAAGTACACAAGAAAATAACACAAAACAGCTAAGGTTTGACGATGTAGTGAACCAGTCAAGTCCCAAAAATTGTACTGTGTATTGTGGAGGAATTGCTTCCGGACTTACAGATCAACTTATGCGACAAACGTTTTCTCTGTTTGGGCAGATCATGGAAATACGAGTTTTTCCAGAAAAGGGCTATTCCTTTGTCAGGTTTTCAACTCATGAAAGTGCTGCTCATGCTATTGTTTCAGTGAATGGAACTACGATTGAGGGGCATGTTGTTAAATGCTATTGGGGTAAAGAATCCCCTGACATGTCTAAAAACGTACAGCAGGTCTGTGAGATGCCTCTTATGTGTGTATTTCATTGATTGCCATACACACTATCTCTTCAATTTTAATTTTTGGACTTGTGGCATTTGTATATAGACACCTAAAGATGGAGTATGGGCAGTGGGGACAGTGGAGTCAGGTGTATGGAAATCCACAGCAGTATGGACAGTATGTGACCAATGGATGGCAAGTACCTTCATACGGGATGTATGGTCAAGCATGGAATCAGCAAGGATT
>XM_013369717.2 PREDICTED: Columba livia parathyroid hormone like hormone (PTHLH), transcript variant X6, mRNA 
GAATCGTTTCACCCGGTTAGAAGATTACACCAGGTCAGACGTGGCTAAGGATTTTCTTATTCCTGACAGCAGCAGGAAGGAGAGGAAGGCAACCTTGATGGGAGCTGGGAACAGAGTGCAACAGGGAGGAAGATTTCGCTTCTGAGCAACTTTTGGGGAGCCTGGTCGCCCACCCATCTGCAGCCCCTGGCTCTATTCACCGCTCAGGAATTACGTGCCAAACCTGGAACAGGGACTTACCTTCCTAGCCAAGCTCTCAGGATAAAATATAGTTTTGGAAGCAATTGCTGAGAAGATCAACCACTGTTGGCCAGGGTGATCTCTGAGAAGCACAGAGGGCTGTAACTCAAGGAAAAGGTTTTAAGACCCGGAGGATACAATGTTCACTAAACTCTTCCAGCAGTGGAGTTTCGCAGTGTTTCTGCTGAGTTATTCCGTGCCTTCTTACGGGAGATCAGTAGAGGGGATCAGCCGCAGACTCAAACGAGCTGTATCAGAGCACCAGCTATTGCATGACAAGGGCAAGTCAATCCAAGACTTACGAAGAAGAATATTCCTTCAAAATTTAATTGAAGGTGTCAACACTGCAGAAATTCGTGCAACTTCAGAGGTTTCACCTAACCCTAAGCCTGCTACCAACACGAAGAACTACCCTGTCCGATTTGGTAGCGAAGATGAGGGCAGATACCTAACTCAGGAGACAAACAAATCACAGACCTACAAGGAGCAACCCCTGAAGGCATCAGGGAAGAAAAAGAAAGCAAAGCCTGGAAAACGTAAGGAACAGGAGAAGAAAAAGAGGCGAGCTCGCTCAGCTTGGCTAAATTCTGACATGTATGGAAGCAGTGTGACCGTGAGCCCACTCTTGGACAACTCCGTTACTACACATAATCACAATTTAAGGAGGCGCTGACATTTTCAGCAAGAAATTTTTGGAAGACATATTGCAGTATTCTGTAATAGTGAACATATGGGAAGTATTAAAATATTTATTACCTGTAAATATTGTAAATGCTCAGAATAAAACTTTTTCCCCCATTGCTCTCTGAAACTGCACATTTGGTTATTGTGAATTTTCTTTGTTTCTTTTTTTTTTTTCCCCTAAGGCTAAGACAATTATTATTATCACATTTAACATAATTTATTTTGTTGACTGGTGTATTTATTTTGTGAACGTATCTTGGTGCTGCTGACTTTCTATATTTTTTGTAACATAATGCACTTTAGATATACATATCGAGTACATTGATAAGTGACATAAAATGTTCCCATTTCGTGGTTGACTTCAATGAATGCCTACATACAATTGTTCAAACTGATTTTCCTTTGTGCATGTATAATAGCAGTATTTTAAAATTTGTAAAGAATGTCTAATAAAATATAATCTAATTAAATCA
>XM_027670495.1 PREDICTED: Neopelma chrysocephalum smoothelin (SMTN), transcript variant X3, mRNA 
GGGAGCGCAGCCGAGCCAAGCGCGGGGCCGCGCTGCCCCGGACGCCCTTTGTTGTCTCGGTCGCCGCTGAGCCCCGGCCGCAGCAGCGCGGGCCCGGCGGGCGGGATGTCCCAGGAGAGCCTCCTCGGGATGGACGAGGGAGCGCTGCGGAAGCTGCTCGAGGCCACGCTGGACCTGGCTGAGCGGCGCCGCATCCGTTCGGCCATCCGGGAGCTGCAGCGGCAGGAGCTGGAGCGGGACGAGGAGGCGCTGGCATCCAAGCGCTTCCGCCCAGAGCGCGGCAGCCACAGACAGGACGACAAGGAGAACTGGCCACGGTCTCAGCACCTGGAGGAGGAGCAGCAGGCAGCCCTGGCCGCCTTGTCCCAGGAGCTCGAAACAATCACCAGCGTGGAGGAGCTGACAAAACTGCTGCGGGCAGCGGGTGAGTATGAGGAGCGCAAGGTGATCCGAGCTGCCATCCGTAAGCTGCGGGCTGAGGAGATCAAAGCTGCGACACTGGCTGGGAATGTGCAGAGCAGCCGGAGGGATGGCAACGAGCCCCGCACTGTGCCTGGGGATGCGAAAAGTATCCAGAGGGACAATGCTGAAACACCAGCCCTTACTGGGAGTGGGGAAAGCCTTGGTGAGGGCAGCACCAAGCCCCTGGGCACAGCCAGGAGAGGGGAGAGCAGCCGTCAGGACGATGCAGAACTGCCGGCACTGGCTGAGCTAGAGGAGAGTGGGCACAGGGGGGCTGCGGAGCAGCCCCCTGCCCAGGAGCCTGAAGTTTCGGCGGACCATGAGCGAGAGGACATGGTGGAGCAGGAGCATGTCCCAGCCAGGATGCAGGAGCTGTGCAGCCAGCAGGCGGGAGACCCCCAGAAACCCAGTGTCCAGGAAGTGGTGTCGGGGACCCTTGTGCTTCTGGAGCTGCAGCCGGCCCCAGAGCCCAATCCGGAGCCTGAGGATGGTGTTGAGGAGCTGGAGCAGGGCCAGCCCCAGGGGCAGCAACAGGCAGCCTGGAAGGCAGGGAGCCTGGACAGCCCAGCCACTGCTGCGGAGCCCAGCAGGAGGCAAAGCCCTAGAGGGGAGCAGCCACCCCTGGGCCAGCCTGGTGCTGCCAGCCAGCTCCATGTTGGGGTGCGCTGCCAGGCACTGGGGCCAGATGGGAGACACGGGAGGCCACCAGTGGCGCCAGTGTCCACCCAAGATCTCGTAGGGACCCCAGCTCGCCTGAACACTCACCAGTGGGAGCAGGTGCCCTCCTCTTCGTGCCCAGCTGGCCCCACGGAGGTGACCCTGGGGCTGCGGAGCACCCCCATCCGCATCACCACCATTCCCAGCAGTGTCAGCAGTATCTGCAACATCAGCAGTGTCAGCAGCAATGTCACCAAGATGGAGCCGGAGGTGGTGGAGCAGCCCCAGGTTCTGAGGCTGGAGCCAGAGCTGCCCAACGGCATGGAGAAGGTGCAAGTGAGGGAGGTAGAGAGAAGGAGCAAGCTGAATGTCGAGGAGCTGAGCAGGATTGAGGATGAGGATGTTCTGGATAAGATGCTGGATCGGACAACAGACTTTGAGGAGCGACGGCTGATCCGAAATGCCATGCGGGAGCTGCGCCAGCGCAAGCGAGACCAGCGGGAGAAGGAGCGAGACCAGCGGCTGCAGGAGGCTAGGAGCCAGGCTATGGCAGGAAGGGCTGGCCACGCCACCGAGACCACCACCACGCAGAGCACTCAGTCAGCTGACGGCTCAGCTCGCAGCACCGTCACCAAGACTGAGCGTCTCGTCCAGTCTAGTGATGGCACCAAGACCTCCCGTACCACAACCATGGAGTCAAGTTATGTGAAGAGATCAGACAGTGGCAACAGCACGTTTGTTCAAACCAAATCATCCTACAGCTCCTCGTCCAAGAAGACCGGCAGCGTCTTTGACCGTGAAGATGAGAGTGCCTCCAGGCAGAGCAGCCTGGCTGCACTGGAGCGACGTCAGGCAGAGAAGAAGAAGGAGCTAATGAAGGCTCAGAGCCTGCCCAAGACCTCAACCTCACAGGCACGCAAGGCCATGATGGAGAAGCTGCAGAAGGAAGGCGGGAGCTCACCAAACCCCGCAGCATCACAGACCACTGTGCAGCGCTCCTCCAGCTTCGGCGTGCCCAATGCCAACAGTATCAAGCAGATGTTGCTGGACTGGTGCAGAGCCAAGACCCGGGGCTACGAGCATGTGGACATCCAGAACTTCTCGTCCAGCTGGAGTGACGGCATGGCCTTCTGTGCCTTGGTCCACAACTTCTTCCCTGATGCGTTTGACTACAGTAAGCTGACACCCCAGAACCGCCGCCACAACTTTGAGGTGGCCTTCTCTTCTGCAGAGACGCTGGTGGACTGCGTGCCGCTGGTGGAGGTCGAAGACATGATGATCATGGGGAAGAAGCCAGACGCCAAGTGCGTCTTCACCTACGTGCAGTCCCTCTACAACCACCTGCGTCGCCACGAGTTGCGCATGCGGCAGAAAGAGTGCTAGAGCCTGCCCTGCCCACCCCCCCACTGTCCTTGCTGCCAGGGCTGCCAGTGGGCAGGGGAGCTGTCTGCCCCAGGAGGGTCTGGCAGGGCCACAGGTCTGGCACTGAGGACAGGGGGAACTCTGACACCCAGGCAGTCCCCTGCCTCTGCCTTGCCAGAGCTGCCTCTGCCCCGGCCAGCTGCGGGCTGACCCCATGAGCAGGGCCAGGCAGGCACTGCTGGGGATGCTCCTGGCTTGGCTTGCCCCCTGCGCTCCAGCCTGTTAAGTTATTTGTTCTCCAGGAATTGTGTACCCTGCGGGCAGCACTCCTGTGTCCCTGGGTGGCACAGCTGCGCCCTCAGGCCTGGGGCACAGTGTGGGTCAGTGGCTGAGCAGGACCGTGTAGCCCAGCCAGGCATCCCACAGGCAGCATCTGTCAGTGGTTCCCATGGCTCCCTGTGAGGAAGCCCCTCTGCCCACCGCAGGCCCTGCTTGGTGTCACCTCCCTGGGGACAGCTCCACAGCTGTGCCGACACCCTGCTTCCCACCTTCACGTGCACCTGGGGCACTTCCGCACTAGGGGCTGCAGCACCTGTGGGCTGGGGAGCGGGCAGGGGTGAGAGGTCCCAGGGGAGCACGAGGCTGAAGGAGCCAGCCAGGATGGCAGCCCCTTCTCCCCTCTCCTGCTCAGGGCACCACGCGCTCAGCGCCGCTCGCCCCTCCGTCACGTCTCTACACCTGTAACGACACGTGTACCAACACCAGCCAGATAATAAAGGTTTACCTAGGGTGA
>XM_032185005.1 PREDICTED: Aythya fuligula latent transforming growth factor beta binding protein 1 (LTBP1), transcript variant X5, mRNA 
AGGAAATCAATGGATACCAAAGTGTTCTGTTTATTTTTCTTTTTTTCTTTGCCTCCGCTGACAGTGGGAAATCACACTGGTCGCATCAAGGTGGTCTTTACACCCAGCATCTGCAAAGTGACTTGCACCAAGGGCAACTGTCAGAACAACTGTGAGAAGGGAAATACCACCACCCTCATCAGTGAGAATGGCCATGCTGCTGACACTCTGACAGCCACTAACTTCCGAGTAGTTATTTGCCACCTTCCATGCATGAATGGAGGCCAGTGCAGTTCTAGAGATAAATGCCAGTGCCCTCCTAATTACACTGGTAAACTTTGTCAGATCCCTGTGCAGACTGCCAATACTCCAAAACTGTATCATCACCCACAACAGGTGAACAAAGCTGTAGGATCTCAAATTATCCACTCGACTCATACTTTACCACTGACAATGTCTGGACAACAAGGTGTAAAAGTGAAGTTCCCTCCTAACATAGTGAATATCCATGTGAAACATCCCCCTGAAGCCTCAGTTCAGATACATCAAGTTTCAAGAATTGACAGCGCATCAACAGGACAAAAACCGAAAGTACCTCAGCCAGGACATCCACAGGTCTCTTACCAAGGTCTTCCATATCAGAAGACCCAGAAAGGACATACTGCTTACACAAATCAACAACCCATTCCTCATGTGTTTCCTGTTTCAGTTAAAACTCAGCTTGGACGTTGCTTCCAGGAGACTATTGGAACACAGTGTGGCAAAGCACTTCCTGGCCTTTCCAAGCAAGAAGACTGCTGTGGAACCGTGGGTACTTCCTGGGGTTTTAACAAATGCCAGAAATGTCCTAAGAAGCCATCATACCATGGATACAGTCCTATGATGGAATGCCCCCAAGGCTACAAGAGAATCAATGCTACATTTTGTCAAGATATTAATGAATGTCAGTTACAAGGAGTATGCCCTAATGGTGAGTGTTTGAATACCATGGGCAGCTACAGATGTACCTGCAAAATGGGATTTGTGCCAGATCCTACCCTCTCAAGATGCATAGCTGATAGTCCTATGGTTGCTGAAGAGAAAGGACCCTGCTACCGGTTTGTTAGTGCAGGAAAACAATGCATGCATCCTCTTTCTGTTCAGCTCAGCAAGCAGCTTTGCTGTTGCAGTGTTGGCAAAGCCTGGGGCCCACACTGTGAGAAGTGTCCCCTCCCAGGAACAGCAAAGGAAGAGCCAGTGGAGGCACTGACCTTCTCACAGAAAAGTGAGCCTGAGATGGCTGTGCAAGAAGTGGCAACTGCAGCCCCTGATCAGGAATTAGTTTCACTCGATCAAGAAAAGCAAATCGTAGAGCCTGGACAGCCCCAGCTCTCTCCTGGAATTTCAACAATTAACCTGCATCCACAGTTTCCAGTAGTGATTGAGAAAACATCTCCTCCTCTGCCTGTTGAAGTTGCTCCTGAAGTCTCTACTTCAAGTGCAAGTCAAGTAATTGCACCTACTCAAGTTACAGAAATCAACGAGTGCACAGTTAATCCTGATATCTGTGGAGCAGGACACTGCGTTAATTTGCCTGTGGGATACACATGCATCTGCTACGAGGGATACAAACTTAATGATCAGCAGACAAAATGCTCTGATATTAATGAGTGTAATCAGACACCTCATCTCTGTTCCCTTGGACGCTGTGAAAATACAGAAGGAAGTTTCCTATGTATTTGCCAAGCTGGATTCATGGCCAGTGAAGATGGAACTGACTGCGTTGATTTTGATGAATGTTCAAGACCTCATACTTGTGGGGAAGGCTTCTGTATAAATACTGTTGGCTCGTATAGGTGTGAATATTGTGATAATGGCTACCAAATGAACAGGAGAGGGGAATGTGAAGACATTGATGAATGCATGACCCCAACGACTTGTCCAGATGCACAGTGTGTTAATGCTCCTGGCTCTTACCAGTGCATTCCTTGCAGAGTGGGATTCAGAGGCTGGAATGGACAGTGCCATGATATAAATGAATGTCAGTATGGCAATCTCTGTACACATGGACGTTGTGAAAATACTGAGGGGTCTTTCAGATGTATTTGTGGCCAAGGTTTCAAACTCTCTGCATCAGAGGATCAGTGTGAAGATATAGATGAATGCCAGCACAGATCACTTTGTGTGAATGGGCACTGCAGGAACACAGAAGGGTCTTTTAGATGTGTTTGTAACCAAGGTTACACATTATCTTCTACTGGAGATCAGTGTGAAGATATTGATGAATGCCTTCAAGACAGTGATGTATGCCTTCGAGGAAACTGCATGAATACTGATGGGTCTTACAAATGCACTTGTCCAGATGGCTTCCAGCAGATAGCAAATAGGGGATGTCAAGATATCAATGAATGTGAGAGATCTGACCTCTGTTCACCTCACGGGGAGTGTCTGAACACAGATGGGTCCTACCAGTGCATATGTGAGCAGGGCTTTTCTGTGTCTGCAGATGGCCGAACATGTGAAGATGTTGATGAATGTGTGAACGGCACACTGTGCGGCAGTCATGGGTTCTGTGAAAATATGGATGGCTCCTATCGCTGTCTCTGTTACCAAGGGTATCAGGATGCACAAGATGGGCAAGGTTGTACAGATGTGAATGAATGTGAAATGCTGAGTGGGGTATGTGGTGAAGCCCTCTGTGAAAACGTCGATGGTTCTTTCCTCTGCCTGTGTTCTGATGAAAACCAGGAGTATGATCCGATGACCGGACAGTGTCGCTTCCGTACCTCACCAGAATTGCCAATAGAGGCCGATCAACATGAAGATGGAAAGAAGGAGTGCTACTACAATCTGAATGATGCTAATTTCTGTGACAACGTGCTTACATCTAATGTAACCAAACAGGAATGCTGCTGTACTTTGGGTGCTGGCTGGGGTGACAACTGTGAAATCTTCCCATGCCCTGTCTTTGGAACTGCTGAATTTACTGATTTGTGTCCTGAAGGGAAAGGTTTCATTCCCTCTGGAGAATCATCTTACGGGCTTCTTGCTGAGAATTACAAAGATGCTGATGAATGCCAGCTCTTTGGAGAAGAAATCTGTAAAAATGGCTTCTGTTTGAATACGCAGCCAGGTTATGAGTGCTACTGCAAACAGGGCACGTACTATGACCCTGTTAAGCTCCAGTGCTTTGACACGGATGAATGTCAGGACCCAAACAGCTGTATTGATGGCCAGTGCATTAACACAGAAGGATCTTACAACTGTTTCTGTACACACCCAATGATTTTGGACGCAACAGAAAAGCGGTGCATCAGACCAGCAGATTCAAGTGAACAAACTGAAGAAACTGAGGTCTACCAGGATCTTTGCTGGCAGCATCTAAGCGATGATTTTGTTTGTAGTCGACCTCTGGTTGGAAAGCAGACTACGTACACTGAGTGCTGTTGCTTGTATGGTGAAGCCTGGGGCATGCAGTGCGCCTTGTGTCCTATGAAGGAGTCAGAGGATTATGCCCAGCTGTGCAACATTCCTGTTCCAGGATCTCGACGTCCATATGGACAAGATGCTTTGGTTGACTTCGAGGAGCACTACACTCCAGAAACTAATCCATACTTTGTTGAAGACCGTTTCCTGAACAGCTTTGAGGAGTTACAAGCAGAGGAATGTGGTATTCTGAATGGATGTGAAAATGGCCGATGTGTAAGAGTCCAGGAAGGCTACACCTGTGACTGCTTTGATGGTTATCACCTGGACATGGCCAAAATGACTTGTGTTGATGTGAATGAGTGCAATGAGCTGAACAACAGGATGTCTCTCTGCAAGAATGCCAAATGCATTAACACAGAAGGTTCGTACAAGTGTTTGTGTCTCCCCGGGTACGTACCTTCAGACAAGCCAAACTACTGCACACCACTGAACTCAGAACTAGACAGTGAACTGGAGTAGAGGAAAATCTCCATATCCTAAGCCCATATACTCTGCACTGTATAAAGAAAAGGAAGAAAAGTATTTAACTTGAGAAGAGAAGGCACCAGAGTAGTGAACATAAGGGGAAAAACACATTAAAATGTGTCAAAGGTGAGACATGATGGGCTGATTGTATGTCAGCTTCACTGAAGTGACAGACCAAATGGACACATTACTCTGTATGAAAGAAACAATCAAGTATATAGTGTGTTCATAAGAAAAAAAAAAAAA
>XM_038354470.1 Zerene cesonia endocuticle structural glycoprotein SgAbd-5-like (LOC119831184), mRNA 
AACACATTGCAAGTGAAGACGATACGGTCACAAAGCTGCGAAGCAAATCCAATCATGAAATTTTTGGTGGTAATTGGTTTCTTGGCATTAGTGTCGGCTGCTCCCGCACCGCAACGTCAGCCAGGTGCCCCAAATCCACAAGAAGTTCAAATTCTTCGCCTCGAAACTGAAAACGACGGCCTCGGCTCGTACAGATATGCTTTGGAACAAAGCGATGGCACGAAGAAGGAAGAGCAAGGGGAACTGAAGAACGCTGGTAAAGATGACGAGGCGATCTCGGTCAGGGGATCTTACGCCTGGGTTGGACCTGACGGTGTGACATACATTGTTACTTATCTTGCTGATGAAAACGGTTTTCAACCAACGATAGAACAGGGCCCAGGTGGTGCTGTGCCTTCTGCTGTCATCGCGTCCCTCGTCGGCTGATCAACAAATAACCCAAAACCTAGTCGCCAAATAAATTACCATATTTTTTTAA
>XM_035478915.1 Colletotrichum scovillei oxidoreductase (HER10_EVM0009428), partial mRNA 
ATGGCTTCCGTACCCACGCTTCGAGAGCTTGCAAAGCAAGTCTCTGAATCCATCTCAGACGAACATCTCGCCGGTAGTACGTTTGCTATTGGCGGTGAGATCCCAATTGAGCAGCCCAAAGACGAATCTAGCCCTACGACTCAGGTTGTGTCTTCTTCGGTCGTTCTTCGGTGGGACAATCCGGGGGAACATCCTGGCCCCCAGCGAGTCTCCTTCCCAGTCGCTTCAGATGACGACGCTGTCGCCTTCAATCACCTCCTCAAAGCCTCTGAAAAGGCTACATTCGGTCTCAACGGACGGCACGAATTCGATGAAACGTACCGCAAGGCTCAGAAGCTCGGTGCGGGTGATTTCTGCACCACCTTCTGCCCATATGAAACAGGCATCATCGACGCTGTTTGCCAGGTTCTTCTCCCTAGCTACGATACGGACGAAGACACGCGGGCAATCCGGGCGGAGCTGTACAATATGAATATCTACTCTGGTCCTTCGGGCAAGTTCAAGGCGCACGTCGATACTCCTCGTTCGCCCTACCAGATTGGCTCTTTGGTTGTCTGTCTTCCGATGAAGCATGAGGGTGGCGAGCTGGCAGTGAGACATTTTGGACAGACTCACACCTTTGACTGGGCCAAGAACTCCAACAACTCCGTCATTCAGTGGGCGGCCTTCTACAGCGACTGCGAACATGAAGTGCTCGAGGTCAAGTCCGGTCACAGAGTTACACTCACATACAACTTATATGCCACAGCAGGAAACGGAGAACTCGCAGGTGAAACGTCTGCTTTCAGCCCTACTTCGCTGCCACTCTATAGCCAGATCGTAGACTTGCTCGGCTCCAAGAAATTCCAGTCCAAGGACAGACTTCTGGGAGTCTACAGCACGCACGCGTATCCTCACACCGAAAAGGAACACGGCCTTCCGTTCTGCCTCAAGGGTCTTGACATGGTGCTCTACAACACCTTCAAGAGCCTAGGCTTGAAAGTCAACTTGTGTGCCATTCTCGAAAACCCGAAAGGCTTTTGCAGACGTAAGCTTTACAATGGAGAGTTTTCCGATGAGGATTCAGATACCGAGCCAACGCAGAAGGTGACATTGGCGAAGAACGATAGCGGGGACAAATTTGACTCGGACGGCGACGATAGCGGGGACCAATCTGACTCGGACGACGACGATAGTAATAAGTACTACACCAGAACCGTCGGATACATCAATCAAGCATTCTCCACTGACGAGCTGGTTGAGGACGACGATGATCTGAAAAGCATCATCAGCCGGGCCATGAGAACCAACAAGGTCAAGTTCGACGCCAGCAAGATCATCTGGCTGAACAAGAACAATGGCGAGTCGAATATGCAGGTGTCATATATGGCATACGGCAATGAGCCATCCTCCGAGGAAATCTACTCATACTTTGCGATGGTCATTGAGATCCCTGGTGTTGGAGTGAATGCAAGCGATAACGCGGAAGCGTAG
>XM_041571208.1 PREDICTED: Xenopus laevis lysine-specific demethylase 2A (LOC108697539), transcript variant X12, mRNA 
ATGTATAAGTCCATATGGGCAGCACTCCACTCTTGATGTTTAAACTCGGGTGCAAGGTAAAAGAATCAGTTATGTAGACAAATGACCAGCAACACCGAGATATTTCGTGAATAGTTCAAGTGTATTCAGTAAAAGACACCTGGTTACAGAGACCACTAAAAGATGGTTGCTATAAATGCACCAATTGCCTAACGTGCAGGGGAATGTTACAGGGCACACATTTCACCCATCCTAGGACTGGAACTAAATTTCGGATCAACCATAGGGTCACTTGTACCACAGATCACGTCGTATATATGGCCTGGTGTCCGTGTGGATTACACTACATTGGGAAGGCATCCACCACATACCGCGAACGGATGAACAACCATCGTTGTGCCATCAGAAGTGCCCTGACTACTGGGAAAGCAGATCAACCCATTACGAAACATTGGCTGAATAGCAAGCACACCCTCCCACAGTTCCGGCACATGATCATAGACTATGTGCCTGTTCCTAGGAGAGGTGGCAACAGAGGCCTCCTACTACTACAGAAGGAATCCATGTGGATTTACAAACTAGATACCTTGTCACGAGACACTTCCTATGTCCCCCTTTTATTGAGATCGGAACACTGGGTCATAAACTATCCACAGTATAATTACCTCAAATGAAGACTTTGACAGTTGGGTTTGACTAATCTTTATTTTGTTGGTTTTTATTACCGTTTGCATTTTTTGACTCTTTGGCTTCTGGATGTGAATGTCACAACAGTAATAGTATAGAATTGCAAATATGGGCTCTGGCGGCTGAGAGTTGGACTCATCGAGTGTATGAGTCGATATCTCTTTTGCTTTTGGGGTTGATCGTTTCCTCGCATTCCAAGGTGCTGGTGCCGTTCTGATCCAGCTATATAACAATATGTATAAGATTATTCTTGATTGTTGACAGGTGACTTATCAGAGTTTATCACAGGCAACTAATGACATATGTATTGCATATATGATATTTTTACAACAGGCTAGCTTCCATGAGGACGAGGGGGACAACAACAGAACATTTCGGTCGGCCTTTTGGCAGGATGATGGACCAACCAGTCATATGTGACCGTGGACCTCGCTTAGGTTAGCAGTGAGGCGCTGTGCTAAGGAGTCCTACGAGAACATGCTCCCAAACAAACACATCACACTGCACCAGGACTGATAAGAAATGTGGTTTGGCCGTCAGGTACACACAGCCTAAATATGCCCTGAGGGGAGTGAGCGTGGGGCAGGCCTTTCACTTACGTCTAGCTGACACTCCAGGGCATCGCTGTCTGGACGGTGTAACGAATCCACAAACACTTCGGTTCGATCAAGGGACTGCAATATCCCTCTTAGGGATTCCCTTACTGGGCGGTGCGCTAAGAGGTGTGGCTGACAAATACTAACTGTGATAGGAAGGAGCCTCTCGAGACGGACTGAAGGACAGCACGCGCCTCCAGCTTTTGTACGCTGGCGGCGCTTTTACAATACCTGAGAAGGGATTGACCACGTACTCACTTGTGACACAGATGGTTGGCCCGCTGTCTGCAGTATGGGCGAAATCGCTATGATACTTCTCTGTGGAATTGATCCCTCTCGTCGGGCTAGCTGGGTCCTGCTGGTATTGTCTCATGAGTGTTCGTGGATGTTATACAGATTTTCATGTGGACTTTGGTGGCACATCTGTGTGGTACCACATACTAAGGGGAGGCAAGGTGTTTTGGCTAATACCTCCTACAGATCAAAATCTGGAACTCTATGAGAATTGGCTGCTCTCGGGCAAACAAGGTGACGTTTTTCTTGGGGACAGAGCAACAGAGTGTCAGCGAATTGAACTAAAACAAGGCTACACATTTGTTATTCCCTCAGGATGGATTCATGCTGTGTACACACCTCAGGACACACTGGTGTTTGGGGGAAATTTTCTGCACAGCTTCAACATTCCAATGCAACTTCGTATATATAGCATCGAGGACAGGACGAGGGTACCTACAAAATTCCGATATCCTTTTTACTATGAAATGTGTTGGTATGTGCTTGAAAGATATGTCTATTGCATGACTCAACGCTCTCATCTCACAAAGGAGTTCCAAAGGGAGTCTCTGAGTATTGATTTAGAGCTTAACGGTCGCCAGAGACCAGACACTCCATCCTTATCCTCATCCGCTTCATCTGAATTATCGTCTTCCTCTGATAATGATGATTCCTCTGATCAAGATTGGGAGGAAGAAGGAAGTCTTAAGAAGAGGGAAAGAGATAGACTTAGAGTGGAGCATGAACTTCAGAGGAGAAGGAACAGGGATAGGCAACAAAGAGACCAAGAAAGAGATCATCAACATGCTGAGAGAATAATTATCCATACTCTACCTGCGTCACTACGTCCTTTAACTCCACCACCTTCCCTTCCTCTGCCAACACCAGATTCACCTCCCAGCACTTCTCCTTACTTGACATGGTTTGAGATTGAAGGATTACACTGTCTTGTGCTGAAACTTGAATCCTTGCCACCTCATAAAAAGTGCCTACCAGATGGTATCCATGACCCAGAAGCTCTTATCTCTGATATCAAGAGTCTTCTTGAGGACCACTCTCATGATCCACCTGAGCTTGCACTCACTGGCGTTCCAATAGTTCAGTGGCCCAAGAGAAATCAGTATAAGGTCCACCTTCGGCCCAAGATTCAGTTTACAAAACCTCACACTATGCGTCCAGCTTCCCGTCACTCCACAGCTCCTCCTAGGACATTAGGCACTCCATCTGGTACTACAGCTTCTTCGGGTGCTCGAAGGCGTCGTGTCAGGTGTCGCAAATGTCAAGCTTGTGTCCAGCGAGAGTGTGGGACTTGCCACTACTGTAAGGATATGAAGAAGTTTGGAGGGCCAGGCCGTATGAAACAATCTTGTGTACTAAGGCAGTGCCTTGCTCCCAGACTGCCCCATTCTGTAACCTGTGCTTTGTGTGGGGAGGTGGATCAAACAAATGACACACAGGATTTTGAAAGAAAACTCATGGAGTGTTCAGTTTGCAATGAAATTGTTCACCCAGGATGTCTAGAGATGGATGGTGAAGGACTTCTAAGTGATGAACTTCCAAACTACTGGGAGTGCCCCAAATGTTATGAGGGGCAGAAGCACACGATGCAACCAAATCATGATCACATCGAACTGCACAGTAAACGTAAAGCTGCTGACTATGAGAGCAGCCATTTCTACCCTGCCAAAGTTCTGCGGCCTCCACTGGGGCAGAGCCCCCCATCCCCACCTCTTTTGCTCCCACCTTCTCCTTCATCTGCTCCACCTACACCACCCTCTTCGCAGACACAAGTCCCACCTGCAAGCCGAGAAGAGCGAGCAAAGAGGCGCCAACTTACTAGAGAGAAAGAGAACCACCCGACTGGATGTGATCAGTCTGAGGGAGATCGCTTGCGGCTTAGGGGGCCCTACCTCGCGGTCACTCTTCAGCGTTCACCAAAAGAATTAAGCTTCACTTCCATTGTCCCCAAGTTACAAGCCATCACACCAAATCCCCGTCAGCCTATGCATGCAGCTCCACCACAGCATCCTGATGAGGAAGAAGAGGAGGAAGAGACAGAGAACAGTCTCATACTGGGTCAAAGAAAAAACAACATATCAATGCAGAAAGTTGTTTGGCTCTCTGTTTTCCATTACCTCACACATGAAGAGCTTTGCATCTGTATGACAGTGTGCAAATCCTGGTACAAATGGGGCTGTGACAAACGTCTCTGGTCCAAGATTGATGTTAGCCGCTGCAAGTCTCTAGTACCACAGGCTCTCAGTGGCATTAATAAACGTCAACCTGTATATCTTGACTTGAGCTGGACAAATGCATCAAAGAAGCAACTTATATGGCTTATCAACCGGTTGCCAGGTCTGAAGGATTTAATCCTTGCTGGGTGCACTTGGTCTGCTGTCTCTGCCCTTGCTAGCTGCAGATGTCCCCTCCTGCGTACTCTGGACCTGCGCTGGACTGTTGGAATCAAAGATACTCAGATTAGAGAGTTGCTTACACCAGCCTCAGACAAAACAGGACATGACTCTCGCAGCAAGCTACGTCTGCTAACAGATCTGCGCCTTTCTGGCCTTGATATTTCTGATGTTACTTTAAGGTTAATCATGCGCCATTGCCCACTTCTGTCTAAGCTTGACCTCAGCCACTGTCCCCTGCTTTCCGATCAGTCTGTAAACCTCCTTACAGCTGTGGGCTCTTCTACAAGAGGAATACTCACTCACATACACTTAGCAGGTTGTAAAGGGGTGACAGATGAGTCTCTTCTATATCTACGACGTGCCACCAACCTGTCCCTTATTGACTTGCGTGGTTGCAAGCAGGTTACTCGGGGAGCTTGTGAGGGATTTATTTCAGACCTCTCTGTAAGCATCTTGTATTGTCTATCAGATGATAACCTTATCCAGAGGATCACCTAGAGTGGAAGGACCTGTTAATTGTACTGGAAGAGGTTAGAGGAGGAATGTGGAAGAACATAATCTCCCCTGCCTCTCATCTGCTCTCTCCTGCCACTCCATAAGATACAAAGAAGGAGCAATAATTGGAATCTCTGCCTACATCCTCCAGTGAAACCATTGTTTGATCCAAGGAAATGTGCCATTAAAACGTGTATATAACCAACTGTGGTTGGCATAGTGCCCTAATGGTTTATGGGGCCCCTCAACTCATTAGGGCACCCTGCCAACTCTTACTCATTTTTTTGCTTAACTCACTCTATTCTTCAGGCTGGTCAGTGTGCATAGCAAGGGTGAAGGAAGGTTTTGTTTTAAGGGTTTTTTTCTGTTGTTGTTTTGCCTTTTAGGGATTTGAGAGATATGAGAGAGAATGCTCCGCTAAAGTTATATAGGTGTCTGATGAGTTGTGTGTTTAATTATATGTTTGAGAGGGAACAGGCAGGTTTTGTGATAAATAGTTTTTTTTTTTTTTTAATTGGATTGTAGCTGTTTGCCCATTACCTCTCATACAGAGTACAGACATTCATTTACACTTAATAGTACATTTATTTTATGCACCAGTGCAGCCATTTGTGGATATATACATATATAGATATATATTAAATGCCGGTAGGTACACAGAGTGTTATGTATGTCAGTGCCAGTGGCACAATCGGCTGTCCTCGCCTTTGACCTGGCATTAGATTGTATAAAAAAAAGAGCCTGGATAATATTTTTCTCTGTGGAGCGATCTTGCTTTCCCTTTATTTCTTTTGCAATAAAAAAAAGTTTATGATACAA
>KF978784.1 Uncultured bacterium clone 16SOTU48 16S ribosomal RNA gene, partial sequence 
TCCTACGGGGGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCAACGCCGCGTGCGGGATGAAGGCCTTCGGGTTGTAAACCGCTTTCAGCAGGGAAGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGTTAGTCACGTCGGATGTGAAAACCCGGAGCTTAACTCCGGGCCTGCATTCGATACGGGCTGACTCGAGTGTTGTAGGGGAGACTGGAACTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCGGTGGCGAAGGCGGGTCTCTGGGCAACTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGCGCTAGGTGTGGGGAACATTCCACGTTCTCCGTGCCGCAGCTAACGCATTAAGCGCCCCGCCTGGGGAG
>XR_005054034.1 PREDICTED: Manis javanica uncharacterized LOC118967152 (LOC118967152), ncRNA 
GGGTTGAAAAAAAATATGAGTGCTCTCTTTTGTGTGCGGACAAACAGCCGAGCGCGGGGAGGTCGGGGCCGGGGTCAGGCGCTCCGGGCTGCAGCTGCCGCCGTGGGGAGGGGGGCCCCGGGCGGCCCCCCGGAGTCGCGGCCACGGCGGCATCAGCCTTCCGGCGGCGCGGGCGGCCACTGTCCTCGCGCGACCCCGGCCTGTCGGGAGCGAGACCCGCTCCGCCCCTGGGGCGCCCAGCCCCGAGCAAGGAAGTCACAGTAAAAGAATCAAAGCTCATGACGCCCATCCAGAGTACTCCTGGTGACACTTCCTGACATAAAGTCATAAATGCAGCTGGAAAGAAAATGTGGAGGACACAGAAAAGTGGAAATGAAAACTGAAAGGCCCCAGCGGGCCCGCCGGCCCCTCTCCAGGGGAGCCCGAGTCCCTGCCAGCAGCAGTGGCCCAGGAGCCTTCAGATTCTGTGCCCTGTCCCTTCGCTGTTACCCACATGTGGACACCAGGAAGTTAGATTCCTAGAAGCATCAATTCCAACCCAACCCATGTATGCATTTTCAGTCTGGCTGGATTTACACTTCCTTCCACAAGGATGAGGTTCGTCTCCACAGCCCCTGCCAGCCCTGGGCATCACCACGTCTGGGTAGTTTCCATGCGAGGCACGTGCTCAGGGACAGCCTTGTGAGGCCCCACAGGCCACAGTGATGAGGCAGAGAGGCAGAGATGAGAAGTGGGCTCAGGGACTCTCTGGGACCTGGGAGGATGGGCCAGAGCCACAGCCCATGGCCACACCCTCAGGGCCTGGCAGGCCCACCCTGCATTCACCTCCCATGACATCTTACAGAGTGAAGGGCCTGCCTTTGGGCCAAAAAAGGTGACTGGGATGTTACGGGCCAGCTTGCTCCAGGCCGTTTGTGAGACAGCCCTCTGCAGGGGCTGCGGCTGAGACACCTGCCCCGGGGCACTTAACCATCCACCTGCCTCTGCTGTGGTCTCCTTGGCAGATTCAGCTCTGCCCTCAGAGAGCTGGCGACTTGTGGAAACAGTCAGATGCCATTCTGAGCCAAGCCCAGCGGGGCTGCTGCCGGGAGAGACCCAGGCCACTCGGGCAAGAGACCTCCAAACAGTGAAGCCCATGTGCCCCAAACCACCACTGCTTGGATAAAGTTCTGAGAGAGAGGGTGCAAACTTGTTTCCATGGGTGGTGGTGTCGCCAGGTCAGGAGGCAGCCTCCAAGGTGACAAGGGAACTCACAGGGAGAGAGTGAGTTCAGCACGTCAGTTAAAATCTCCATTTGCTGGGCCCATCACCTGCCTCCACGGGGGTCGGGCACCGTCTGCTGAGCTTGGCCACACAGTGCTCTTCCCCCGGCCGCCGCCTCGCCCCCCAGGCCCCCCGGAGCCCCTTGCTCCTCCCACAGCCTACTGAGCTTCCATCTCATTGTGCAGCCACTTCTTGTCACCTTGACCACCCTCCCCATCCCAACACCCAGTCCCTGGAGGCCAAAGATCATGTCTTTCCCCAGCTGTGTCTCCACAGCTCAAAACAGCACATGCTGCATGGTAGGGATGTGGTACATCAGGGGTGGAAGAAGAGAGGCCCTGGGGCAGGGCATCCAGAGACCTGGGACTGGGTCCTGGGCTGGCCGCTGGCACCGGGATCTTGTTCCTCAGTTTCTTCATCTGGGCGAAGGGTAGTTGGGATAACAGGTGCCAGAGGCCTTTCCAATTCCATTGTGTGAGGGCTCTTCAGGCCAGGGCTTGATGGGAGAGGCCAGGGCAAGCTGAGGCGGCCCCACCTCTGCCCCGTGCGTGATGAGGGGCAGCCTCCTCCACGGCCTCCCTCTGTGTGCTCAGTGCCTCCAGGCCAGCTCCAGGCCCGTCGGCATCCCAGGAAGGCAGCAGAGGTGGACGGAGGGCACGAAAGGACACGCTTTCACTGACCACCCAGCCCAGCAAAGCTAGAATCTGTCAAAAAGTAAAAATTCCATTTGTAAACAAGATCAAATTATTTGATTGTGAAACCAGGGTCCATGGAATTTAAAACAATTTAATGTGAAACAATATAATTTGAAATGCTGACCAGCCAAGACCTGGGGGTGGAGGGGCTCAGCCTCCTGTGGCCAGACACATGGAACCCAGCCTCAAGGAATAATAAGTCACTGTTCGACAAGGGTGAATGGGCATCAGCTGCGTGGCAACCCCAGGCCAGACCTGGGGCAGCAGGCCCGGCTCCCGTCCTCCTGGGGCTGGCAGTCCTGATGGGCAAGCAGGACTCTCACAATCAGAAAAGCAGTGCCAGAGAGCGGGAAGGGCTCCGTGGAGTGGCATATGATCCAAGTGACAAGGGAGGCTCAGAGAGAGCCCCGAGGGGCACCCGGTGGGCAGGACAGCAGAGAAGCATATTCAGGGTGGAAAGGGCGGTCAGGTCCCTCCCAGCTGCGGGTGTGCTGCCCTGCGTGATTCTGGGCCAGCAAATCACTCGTTAGCCTCAGTGTTGTTATCCACAGAATGGGAAACATCTCAGTCCCGCTCCCCACCTGCAGTGAGGATGAGAAATCGTTTCCGGGCATCCCACCCCACCAAGCTGACGTCACCAGTGGACAAACAAGCAAGCATGAGTGATGCAGTGGCCTGGTGAGCAGCTGCTGCGGGCATGTGGCAGGCAGGTGCCCGGAGGCGCTGCAGTGCGTTCTGTGTCCAGCACCTGCGGGTGCTTTCCAGAGGGACGGCGGAGGCAGGGCCCGGCAGGTCCTGGTGCAGCAGAGCTCTGCTTCCACGTACCCTGCCTCAACGTAAACACAGCTGGTAATGTTTCAGTACTGTAGGAGCAGGAATAACAGACCCAGAGAAGCCAGACCAAGAGCTCGCGAATGCTGACTTTCATGTCGCACCCAGGCATCGCATGTGCATCTTGGCGCCTGCGGGCCTGTTGCTCGGTGGGGAGGTGGGGGGCTAGTGTGTTTAGGAAACCGAACTACGGGCACAGCAGCGGGAGGATGTCAGGCCTCACCTCCCTTCATCCTCCCAAACGCAGCTCCCACCACAGCAAACCTGGAGGCTACCTGGGATGTGGGGGGGCACCAGGGCCTCTAGGTTTTAAGTGACCTAGGAGACAGTGGGGCAGGGTGGGGACTTCTCATCAGTGAGGTGCCACCTTAGGCACATCCCCTAACCTCTGCATGCAAACAGGCCCTGGAATACACCCAAGGTCAACTGGCCAGTGAGAAGCTGACCTAGAACTCAAGCCAGGCCCCAGTCTCCCCATGTCCCTGCTGCCCGCTGCGGAACCTGACCCACTGCCAGACCCGAACCTGCAAACCAACCACCTGTGGGTTCTGGGTAGCACAGAGCCCTTGGAGACCGTGATGCTGAGAAGCAGTGTTTTTGTTCGCCCCTGAGTCTTGCCAGGTCACATTGTCAAGGCCAGCACTTTGGAGA
>XM_053291376.1 PREDICTED: Hemicordylus capensis complement C4-like (LOC128343033), transcript variant X1, mRNA 
GAGAAGGCATCTGCCCTGCACAGACGCAGCCCAGAGATGTTCTCTCAAAAGCTGCTGCTGCTCTGGCTAGCATGGATGGGGACTCTGGTAGCCCTGAGCCACCAAACTCCAAGGTTGCTAATGGTTGCCCCAAGTGTGATACCAGTGGGGGCCGAGGTGGGGATCGTGCTTCAGGTCGAGGGGGCCACATCCAGGTTCTCAGGCACAATCTATTTCCAGAATGAGAATAACATGAAAAAATGTTCCAATGAGGAGTCATTCAACTTTTTGCCCAACACCTTTGTGCAAAAGGTTACTCTGAAGGTGACCCACGAACTCTTTACCGAATGTGTTCTGGCTCGCCAGCGACGGAACCGCTACATCCAACTTGTTGCCCGCAACTCCCTGCTCCCCAATGGCGGCGTTCAAACCCTCAACCTGCGCTGGAGTGCCCGGCAAGGGTACCTGCTGGTGCAGACGGACAAGCCAATTTACACCCCACAGCAAAAGGTGAATTTCCGAGTCTTTGCCCTGGATCACAAATTGCGGCCAAGCACTGAGCCAGTTGTCATCACTGTGCAGAACTCACGAGGTCTTCAGATCCGGAAAGTTGAGCGTGTGCCAGTGAATTTTGTGATAAACGATCACCTGTCTATCCCTGATATCTCTGAGCCAGGCATTTGGCGTATCACAGCCCAGTTTGTCAACACACTGAATTTCAACACAACAACAGAGTTCGAGGTGAAAAAATATGTGCTCCCTCATTTTGATGTGACAATTGTTCCAGAACGTAAATACATCCTCCTTTCAGGACAGCAGGACTCTGAATTGCGAATTGACCTCCAGGCTAAATTTTTCTATGGGAAGGGGGTCAATGGCACAGCCTACGTGCGGTTTGGTGTGAGTGATGACAATAAGGAGAAAGTTTATATCCCAGGACTCGAGCAACAAGTCTCCATAACCGATGGCCGTGGCTCACTAATGCTGAAACGCAGCCTCCTCGCAGAGAAACTGGGGCGCCCTCTGGAGAACCTAATTGGAACAGCACTCTACATTGCAGCCACTGTCATAGAGGCAGCAAGTGGCGAGCTGGAGGAGCAGGAGCTTGCTTCAGTGAAATTTTTGGCATCTCCATATTCAGTTGATCTGTCCAAAACCAAGCGCCATTTTGTCCCTGGTGCACCCTTTGAAGTGCTGGCTACTGTTTCACTCTCAGATGGCACTCCTGCCTCCAACCTCCCAGTCCGTTTCTCAACCCAGATAAGAGGGGGCTCATCCCCCAATGATGAGCGAGTGGACAGCAGTGAGCAAGGGGCTGTGATATACAGGATGAATGTTCCCTCTGGAGCTACCTCCATCACTTTCACGATAACAGCAGGGACAGAGTCTCCAACAGAAGTCACTCTGACTGCCAAAGCAATGAACTCTCCAAGAGGCAACTACTTGATCATTGAAAGCCCAAAATACCAAGGCTTGAACCCCGGAGAAACTCTCTCGCTGGGGCTGAAACACGTTGGATCGGCTGCCTTCTCCCACTTCTACTACCTGGTTTTGAACAAAGGCGACATTGTCTCTGCCAACAGTATCAACCGTGGAACCTTTACGGTCATCTCTATCCCCATCACACCCAGCCTGATGCCAACGTTCCGCTTTGTGGCCTTCTACCGTGTTGGGGATGAAGTTGTGGCAAACTCCATCTGGGTTGACGTCGTGGACCGCTGTGACGGAAGACTGGAGCTCCGCACATTAGGAAACCCTGACCAGCTGCAACCTCAGGACCTCCTGAAACTCGCCATAACCACTGATGTGAAATCCTTTGTGTCGCTTGCTGCTGTTGATACTGCGGTTTACGCCCTCAACCGGAAGAATCGCCTCACACAGGGCAAGGTTTTCCAGGCTATGGGAAGCTATGACCTTGGCTGCACAGCTGGCAGTGGGGAAGATACCCTTGGCGTTTTCACTGATGCTGGACTCTCTCTGCGTACTGGTTCTCTACAGAGTGAGCTCCGGAAAGCACATGGGTGCAGTGAGAGTGTTTCCCGGAAGAAGCGTTCGCCGCAGTTCCAGTTCCAACTCCAAAGCATGCGTTCCAAGTACTCAACCCCTGAATCGCGGAAATGCTGCCAGGATGGCATGGTGCTCCTTCGAAGAGCCATAACATGTGAGGACCGTGCCAGGCGGATATCAACGCGAGAGTCTGAGGAATGTCATCGTGCCTTCCTTGAATGCTGCAAATATGCTGCCCGTCTACGACGCAAATCCTGGGGATCCCACAATCTTGGGCGAACTCTAGATGAGGAAGATGAGGATTTCATTGATGACGATTCCATTCAACTCCGGAGCGTCTTCCCTGAGAGCTGGCTCTGGAAAACTTTCTCCGTAGAAGGAACCCGCACGGAAAACTTGATTCTCCCCGATTCCATCACCACCTGGGAGATCCAGGCTGTTAGCATGTCCTCTGCAAAAGGGATCTGCGTCTCAGAACCTCTTCGAGTTAGAGTCTTCCAAGATTTCCACATCTCTCTCAGGCTGCCGTACTCAGTGAAACGGTTCGAACAGATAGAGCTTCGCCCTGTTCTGTACAACTACCATTCACAACCAGTCAGTGCCTTGGTGTATCTGGAGCCTGCTGAGGGCATCTGCTCTCCAGCAACCGTCGGCCCGGCTCGGAAGCAGAGGGTTGTTGTGCCTGGGAATTCAGCGGTGCCCCTGCCCTTTGTTTTGGTTCCCATGGGAGCAAACGACATTCCCATCACCGTTGTTGCCATTGGCGGCTGGGGGGTGGGCGACAAAGTTTCCAAGAACCTACGGATTGAGAGAGAGGGTGCTGTTCGGGTGGAAGAATACACCATCCCCATATCAAGTGAAGCTGGACAATCCAGATCTGTGGAGATTTTAGGAGATATACCCTCCAACTCCATTCCTGATGGCGACTTCAAGATGAGTGTCCGGTTGACAGGATCGCTGCCAGCTGACACTCTGGAGAGTTCTCTGACACCAGAAGGTCTGTCAACTCTCTTGCGGGTTCCACATGGATGTGGGGAGCAAACCATGTTATTGATGGCCCCTGGGGTCTATGCCATGCGCTACCTGGACAGCACTGAGCAGTGGCTACACCTGAAACCGGAGAGCAAGGAGAAGGCACTGGATAACCTCCGTACAGGCTATGAGCGAATCCTCACTTTTCGGAAGCGTGATGGGTCGTATGGAGCTTGGCTCACCCACCCTAGCAGTACTTGGCTGACGGCTTTTGTGGTGAAAGTTTTATCTCTGGCCCGTGAGTACCAGGGTGTGGATGAGACTAAGGTCCGTGAGTCAGTGCAGTGGCTTCTGGCAAAGCAACAGTCAGATGGTTCCTTCCAAGACCCAGCCCCTGTCTATCACCGGGAAATGCAGGGTGGTGTTGGCGGCCTTCACGCAGGAGTCTCACTCACAGCGTTTGTCACCATCGCACTTCAAGAGGCCTTGGTCATGTATGAAGGAGAGAACCTTGAACCAGAGAAGCAGCAACAGCTGAGCCAAGTGAAACACCGCCTGGCTCAGGCTACCTCCTTCCTTGCCCTCTCCTTGGAAGAGCGATCTCTGGGTGCCTATCCTGTCGCCATTGCTGCTTACGCCCTCTCGATTGCTTCTGCCAACCTGTCGGCCATCACTACTGCTGATTCTCACCTGAGGAGGCTGGCTACAGAGGACAAAAACAACACGATGTTTTGGGCGGTGGAAGAGCGGGACCGACTGAGAGGGGAGAAGAGATCTGGGCAGGTTCCCTCTGCCTCAGCCATCTCGGTGGAGGCCACAAGCTACGCTCTCCTCTACTTGGTGAAAAAAAAGGACATCACAATGGCCCACAAGGTTTATAAGTGGCTGACAGAACAGAGGAACTATGGAGGAGGCTTCAAATCCACCCAGGACACAGTGGTGGCCCTGGAAGCTCTGTCGCAGTACTGGATCAGCACCTACCAGGAGGAAGACAATGAACTGAAAGTGACCCTCAGCGTTGCTGGGAAAAGCTGGCCGATCTCCCTCTCACCTGGGAGATCAAACCATCCAGTCCAGGAAGAACTGCAGTTTTCTTTGGGGAGTAACATCAATGTAAAGGTGGAGGGGAAAGGAAAAGGGACTTTGACAGTCCTGAAGCAATATCTGGTCTTGGCTATGCAAAACACTACCTGCCAAACCCTTGGGTTAGAGGTGAAGGTGAGCGGCTCCATTCAGCGTTCACGTGAAATGCTTGACTACTACTACGAATATGAAGATGAGGATGAGGTTGAGGTTGCCGGTGAAAGAAAGGCACGGTCTCTACCTGCTGACCAGCCATTGTCTCCTATCCACTTGTTTGATGCCCGGCAACGCCGCAGGAGGGAAGTCAAAGCCCCCGGCCAGCCGCAACGGGTTGTCACCTATGAAGTCTGTTTTTGGAGGCAACCTGGAGCACATGTCTCAGGCATGGTCATCGTTGACATCACTATGCTTAGCGGCTTCCAACCCGACAAGGACGACCTTGACAAGCTCAAAGATCTTGCTGATAAGTACATCAGCCACTGGGAGCTCCAAGGACCACGGCTGTTGCTGTACATTGACTCGGTTCCAGCAACAGAACGTGAATGTATAGAATTTGCAGCAAAGCAGTTAGTAGCTGTGGGGAAACTCCAGCCAGCAAGTGCCACTCTGTATGACTTCTATGAACCAGACAAGCGCTGCAGCATCTTCTACGGTGCCCCCAACAAGGACCAGTATGTGTCAGCCTTGTGCTCGGATGATGTCTGCCAATGCGCTGAAGGGGCCTGCCCACGGTTGAAGCGTACCCTGGATGAGGCCATTACAGAAGAAGACCGCATGCAGTTTGCGTGTTACGAACCTCGTGTGCACTATGCATTCCAGGTTCGAGTGGAACGTGAGAGCAAAGAAAGTGCCTTTCGTGTCTACGAAGCTACGATCTTGGAACCCTTGCAATTTACTGCAGACATTGGCATCTCCCAGAACCAGACCCGGCGCTTTGTGGTCCGTGCAGCGTGCCGGACCCGCTTGGCCGCAGGCAGCAAATATCTGCTGATGGGACGTGATGGAGAAACCCGTGACTCTGAAGACCGCCCCCAGTATCTGCTGGATAGGAACTCTTGGGTGGAGGAAATACCAAAGGCCCAGCGCTGCCGAGCCACCCAGCACCGTAACACCTGCCTCCAGTTCAAGTCTTTCACCACTGCTTTTGCTGAGAATGGCTGCCGTGTCTGAGCCAGAGAACTGGACCAGAATGATCACCTGCACTTTCTCCCATCTTCCTGCACCAGAAGGTTCTCTCGGAATGGAATGGAAGATGCCAAAAGGCCTATTCTCTGATCACTGTCTTTTCCCCTTGATGCTTTGTATTTGGACAATTTAAGAATGTAAGAAGAGCCCTGCTTGCTCAAGCCAAAGGCCCATCTGGTCCAGTATTCAGATTCCAACAGGGGCTACCCAGAAGCCTCTTCCACAAGCCCTTCCCTGTTTTTTGTCCCCAGTCCATGGTACTCAGGCTTATTTTAAGCCAAATTTTGGGTTACAGCCCATTTGACCCACGAGTATACCCCCTAGGTTCTGGCATCACTTGGTGATCGTCATTGATGGACCTATCTTCCATGGACAGGTCTAGAAAGTCTACAAGCCTGGTCTTTCAGCCATCTCTCTGGGCACACTAACCAGAGGGAAATTGTGATTCAGAGGTTCTTAAACTCGAGTCCCCAGCTGTTGTTGGACTACAACTTCCATTATCCCCCTCTTATAAGGACAATATTGGACAATATTGTCCCCTTGTTAAGTCTCTTTTTTGTAATTCCTGCACATTGGCTACTATGTTGCAACTACCATTTTTTAGTGCCACTTGGGTTCTCTGATACTTTTTCTTTGTACTGGTCCCCAAAAATGCACATCTTTAAAACTGCATATGATCATAGCAACAGACAAATGCATGACCACAGCCATATTCACACTTTAAACAACAACTTTGGTCTATGAATAAGGACTGTTTGGCTGTGATAATGATCACACTTCAGTGAGCAGCTTTAGCATAATTCTGTAAAGATTTTTTTTTAATGAGGTGTTTGTTTTGTGCCTCTGTCACTAGCTAACATGCCTCACAAAGCTATTTTGTTGAATAAAGAGTATCATTCTATA
>XM_022636737.1 Penicillium arizonense hypothetical protein (PENARI_c034G09255), partial mRNA 
ATGAACCCAACCCCCATCAGCATGTCAGTCCGTACAGCGATAACCTTCAGCCGACTGAACCCCGCGGCGCCCTCGCTCGCCGGCGCCCTCCGTCCGCTCAACCAACGCACCTCCGGAACAGTCTCCAAGCAGCTCACACGCCTCAGCTCGACAACAGCTCGCCCAGCCATGGCGGCACCCGTGACCCTGGACACCCGCCCACAGACCCAGACCATCTCCACCCGCCCCATTGGCCTGCGCGCACAGTCGACTGCTTCTGGTAACGGTACCGGCAACGAGGAAGTCAAGCTCGACTGGGACTCCTTCTTCAAGCTCCGCGCTTCCCGTCGCCGTTATTCTCTTGCTTCATCCATTACCACTGCGGCTCTTTCGACTACGGCTGGTGTGCAGATTCTGTCCGCTCAGGATTTGGAGTCCCTTGGCGCGCAGGTTATGGGCCTGGACCCATTCGTTGTTCTCGGATTGGCGACCGCTGCGTGTGGTGCTATTGGATGGTTGCTTGGGCCGATGGTTGGAAACGGTCTCTGGGGATTGGTATACAGGAAATATAAGCCTTCCGTTGCGACGAAAGAGAAAGAGTTCTTCGATCGCATTCGTCGCTTCCGTGTTGACCCATCGACCAACTCGATTGCCAACCCCGTTCCCGATTACTACGGCGAGAAGATTGGTAGTGTGCAGGGATACCGACAGTGGCTGAAGGACCAACGGGCTTACAACCGCAAGCGCCGCAACTTCATTGCTTGA
>XM_039112273.1 PREDICTED: Rattus norvegicus zinc finger and BTB domain containing 1 (Zbtb1), transcript variant X5, mRNA 
TCTGGGGTATAGGGTATTTGTATTTGTGTTCGATCATGTTCCTAAATCGAGTGTCGCTGTGACGGTACACGTAGATTCTCCACTGGTTAGAATGTATTTCCGTACAGTATCTATCGCTGCGGCAACATTTTCCCCTTTGACACTGGAATCCACGAAGCGTTCCAAGCATTTTTTTTCCCCTTTTTTGAGACAAGGTCTGACTAGATAGCCCAAGATCGTTTGGATAGAATTCTCCTGCCTCAGGAAATCCTAAATTCTGGGGTGATAGGCATGTTCTGAGACTTTCCAAGACCACTTAGAATTAATTTCTTGAGCCAAAGTTTGAGGCACCACCAAGTCAATTGGTGAGAACGATGTAGTTCTTATGAGAACTTTAAAGCAACCACGGTTTTTTAAAAGGTATAAACTAGATTTTCTGGAATTTTGTCACTTTAAATGGGGAGAATGAAGGTACAAGAGACTGAAGTCCCAGTGATGGATGGCTGGTCATTTGCCCAGAACTGTAAAACTTCCCTTTTGAATCACTGGCTGTTGTTATCTCCCTAAGTCTCAGTAATATTGAGTGGCAGCCACATGGGCTTTCTTCCTCTTAAAGAAATAGACAGACTTAAAGTAGACACGAAGTGAAATGCCTTTCCAAAGGTTAATACTTAGAGTTTTGTAGTGTAATGTTGTGTTATAGCCACTTGCACTCATTTTAACGCCAGGATTTCTTCTCGGACAGCAGAGTTTTACAGGGTGTGGTTGTGCACGCCTGTGATCCCAGCACTTCAAGAGGTTGGATCAGAAGCCTGAGGCCAGCCTGGATCTGGCATACAGAGCAAGACCCTTTACAAAGCTCAGGGCTGGAGAGATGGCTCAATGGTTAAGGGCACTTGCCTTTCTTCCAGAGGGACTAAGTTTGACTCCCAGCACCCCCACACCAGGCAGCTCACAACTACCTGTAACTTCATTTCCAGGGAACTCCACACTCTTCTTCTGGACTCTAGGACATCTGTATTCATGTGCGCACCCCTCCCCCCCCCACTACACATAATCAGAAATTAACATGAAAAACCCCAAAGCCTCATTTTCATGATTCGGAGTAAACCCTGGTTGAGCAGTCCTTCCAGCTGGCTGTGTTCTTCCAGTTCCTAACGTTATGCCTGCTGGTTTCACCACTGTGGCTGCATCCTTGTGAGGAAAGAGAAGCCACTTTTGACCAGGGCATGAGCACAGCTTCCTCACCTTGTTATGTTGGTTTTTGGTGTTTTGAGACAAGTGTTTCTCAGTGTATCCCTGGCTGTCCTGGAACTCACTCAAGACCAGGCTGACCTCAAAGGCTGAAGAAATCCACCTGCCTCTGCCTCCTGGGTGTCAGGATTGAAAGTGTGGACCACTGAAACTGCTGTTTTATGTTTTGTTTTGTTTTGTTTTTTAAAGCTAGGTTCTCACTGTTTGGTCCATGGCCAGCCATAGCTTTCCGTCCTCTGGCTTCGACCTCTCACCTAGTGGTGGGATAACAGGTCTGCACCGCCATACAGGATTCTGACATGGGTTTTTTGTCTTTGTGAAGCAGGGTCTCACTGTGCAGCCCTGGATGACCTCAGACTCTAAGAGATAGGCCTGCCTCTGCACCCACAGTGCTAGCATCAAAGACTCGTGCTGCTACGCCTGCTCATGACCTTGTGTTTTTATTTCATGATAGCTGCCAACTGTTTGTACCTTCTGCTTCCTCATTCCTCCACATTCCCCCACTTTTGTCAGTTTCTGGTACAGTTAGGGCCTTTTCAAAGTGCCCAGTGTCCCTTGCAACACCATTCAGGAGAAAATGTTGCTGCTTTTTTTTTTTTTTAAAGGCCTATTTTTCTCTATACAGGACACAGACTGTCTAGAGAAAAGAGGGGAAAAAAAAACCTTTGTGTTAGAATACAGAAAAAAATAGAGGCTGCAGTCTGATGTCTCGGAGGAGGGTTAAATGTGTAAAACATCTGCTTGACGTTCACTTAGGTCTCTGTAATATTTTTCATAGTTTCTTGTGTTATAAAATAATGAAAATGCTTTGCTATTCATGTTTTTATGTTAGCCTAATTAAGTTATTTATGCCTATTTTTTCTCAAAGTGGAATACCTTTTCAATGATAAAAGCAGATGCCCTTTATAAAAGTTCCAACTATACTAAAGTACATAAAATACAAAACTGAAAGTCGCTCTGACTCCCACTCCCCAGAGATAATCACTGTGAACAATCAATCCCTTGTTTAAAAACATGAAGGCAGCATCAGAGCGTCTTGCTGTGTGTGCCTCACCCCAGCCTGTTCCTGTTCACAGGCTGGTGCTTTCTGCTCCTACCTCAGATTGTTGAGAATTCCCAGGTTGAGGCGGGTGGGGGGTTGCATTGAGCTGATGTCAAATTCTATAACCTAGTGACGTGTGAAAGTTTTCATGTTTAATAGGGCTGCTGTTTTAGGTTAGTCCTCGTTCATTCTCCTTGGTGGGCTTCTTCTCACCCTTAGCAAATGTTGCAATCTGTTATCTGATTGATTTGTGCAGACTACACTCGTTAAAACAAACCCTTCGAGTGGAGAGAGCTTCTTAGCTTATCATTGGGAATGAGTAGGGACACTTGCCACAAAGACCACCGCCAAGATATCCCTGTGCCTTTTGTGATGGTGTGGGTTCCTCATGGTCAGCATCCAAGAAAATCGTGATAGAAAGGAAATTAGAGTAACGGTGGGCATTAATTACTGTTGTTTTAAGTTATGGGAAGGAATGGGAGGGGGTGTGTGCAAAGACTAGCCTGAATTCTACCCACATTAGACATCTTACATATTTAAGGTAATTTCTAAGTATACTGATATTTTGTCCTGCATAGTCATTACAAAGCTACTTAGGCCGGTGTGTTCAAGAAGGATGAGCTGTGGGGTTGATTTCCTAGTAAAGCTCCAAAATAGCAGGCTCAGATTTAATCACAGTAATTCCTGGAAGGTGTTGAGGACATGCTGCTTTTTTGAGAAGGGGGTCTCTGTAGCATTGGCTGTCCTGGAACTCACAGAGATCCATCTGTCACCAACTGCTTTTTTTGGGGGGGGAGTGGGGTGGTAAAAACACTACTATGTGAATATACATTGTTTTCAGAATCACATCTGAAGGCATGGAGGTGTATAACCTAGTATAAGAGTGCTTGCCTATCACACCTGAGGCCCTAGGTTCAGTCCCCAGCACTACAAAATAATGAGTATTAAAACATAAAGAATAGCAGTGTGTAGGGTGCATGACTTTAATCCCAGCATTTGGAAGGTAGAGGCAAGTAGATTTCTGTGGGTTCAAGGCCAGCTTAGTATACATAGTTCCAGCCAGCTACATAGTGAGACCCTGTCACCAAAAATAAATAAATAAATAAATAAATAAATAAATAAAATAAAAAATAAAAAATAATAAATTGCTAATTATATTTTCTATTAGTTTGTTCTGTGAGGTGCATGTTGTCTTTTTAAAAGCTAACTCCTTCCCACTTGAAATTGACAGCAGTGGGGGTGGCCATGGTGGTCAGCAGATGGAAAAGGAGGTGGGGAGAGGGGTGCGTTCTGCTTGCCTATTAGATAAGACAGCAAGAATGATAGGAGCTTTTACAGCGATGGAAAATGTGACTGTGGGAGGCTTAGAATGTTCCAGAGGGGCACTTCACTTAATAATCATACCCAGAAAGTGTTGTCTGGATTACAGAAACTGAAACTGTGCATCTTGAATCAAGAGTTAGGGTTTCAGCCCCAGCTTCTGTTTACAAGATGGGTAGTTAACTACTGCACGTGTTTTCTTCATTCACAAAAAACATAGATAATTAAAGGCCTGTCTCAGTGCACTGATGTGTGAAAGAGGCCCTATAAATCGACAACAGTGTTTCAGTGACGGCCATAAGTAAGAACTGATGAGCAAAACAAGACTTGCCCAGTTCAGCATTTGTTCCTGGAAAAACTCGTTATCATTTAAATGCCAAGCAACTACTAGAATCCAGGGTTGTAATGATGCCTGACACAACACCTTCGTCTTGAGGTACATACAGCCTCCAGTTTAGATGGCCCATCTCCTGTCTCCCTGCGGCTCCCACCATAAAGAGGTGCCTGCCTCATGCTAAGTCAGGAAAGGGTCCCCAAAGATGGCTCTAAGCAAAGGAATGGTGTTTATGAAGTAAGGAAGACTTCCACTTTTCCCGTGTTTGGGGATGGGGGAAGTCTTAAGAGATGTAAGGCTTAGGGATGGAATTGTGTTTAGAATGGATCTTTTTTACTGGTACTTTTAATTGGTTTTATTTCATTTATTTTAATTAGATAAAATTTTGGAGTTTGAATAGCTGTGATAGCTTCCAGCACTCAAGGCAGAGGCAGGCTGACCTCTAGAGGCCAGCCTAATATAGGGAGAGACCCTTTCTCCAAAAAGAAAAGAAGTTTTCTCAGCCTTGGTTAGAACTGACAGGAAGCCCTGGAGCTGCAGAGCTGGAAACGGATACTTCATTCAGCTTACAGGCTCTGCGAGCAGAGGAAGCAAATAATCACGGGGGGAGCTCCCTGGCAGGCCACACAGCAGATTTTACTGAACACTTAAGTTCTAAAACGGCCTGCCTTCAAGTTGTTAACAGTTGTAGCAGACAGTGTGAGCTCACAGAGCCAATACTTTGGAATAAGTAAAAATACTACAAAATAGGGTGGAGGGATGGCTCAGCGGTTAAGAGCACCCGACTGCTCTTCCAGAGGTCATGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAAAGAGATCCAATGCCCTCTTCTGGTGTATCAGAAGACAGCTACAGTGTACTTAAATATAATAAATAAATCTTTAAAAAAAAATACTACAAAATAAACTCCAGCAATACAGATGCCATGTGCTGGGAACCAACTTGGTGTAGCTGCTTTTAAAGGTCACAGGTGCACACACCGCCCTCTGGTGTTCAGAACATGGCTGTACAGCCTCTAGTTTAGAGGGTTAAAAATGGATGTGTAAAATACCTTTCCTCTTATACCAGAGAGAAAGCAGAGGCCAGCACTCCATTCTCTTCCCTCTGCCTTCTGTGTGGATGGACTCCATGTGGAGTCCAGTTGAACTACAGAAATGGCTCGTTCCTGTTACTTGGTAACATTTATTATCCGCTGACCTGCCATGAAGCCAAAAGATAATTTGGTTACCTTCTACATAGTACAAAACAAAGGACCTCAAAGAAGTAAATTATGTACTTGTTTCACGGCCTATAGGAGATTAAAATGGTGGACAGCAGATCAGCGTGCCTTTTAGAAGTGACAACTGTTGGCTTGACGAGGGGAAGAACAGAAACAGACAGGCCAAAGAGCAGCAGTCTCGTTTTGAATAGGTGCAAACAGGCTCACCGGCAGGAGATGGCCAAGCCCAGCCACAGCAGCTACGTCCTGCAGCAGCTAAACAACCAGAGAGAGTGGGGCTTTCTGTGCGACTGCTGCATCGCCATTGACGACACTTACTTCCAAGCACACAAGGCCGTGCTAGCTGCCTGTAGCTCCTACTTCAGGATGTTCTTCATGAACCATCAGCATAGCACTGCCCAGCTGAACCTCAGCAACATGAAGATCAGCGCCGAGTGCTTCGATCTCATTTTGCAGTTCATGTATTTAGGGAAGATTCTGACCGCTCCTTCCAGTTTTGAGCAGTTCAAAGTGGCTATGAACTACCTCCAGCTCTACAATGTTCCTGACTGCTTAGAAGATATACAGGACTCAGACTGTTCCAGCTCGAAGTGCTCGTCTTCCGCCTCCAGCAAACACAACAGCAAGATGATCTTTGGGGTGAGGATGTATGAAGACACAGTGGCTAGAAACGGCAGTGAAGCCAACCGGTGGAGTGCGGAGCCCAGTTCAACGGTGAATACGCCACATAACAGAGAGCCTGAGGAGGAGTCTTTACCGTTGGCCAACTTTCCTGAGCCACTGTTTGACGTGTGTAAAAAAAGTTCCGTGTCCAAGTTATCTACTCCAAAAGAACGTGTGTCGCGACGCTTTGGACGGAGTTTTACCTGTGACAGTTGTGGGTTTGGCTTTAGCTGTGAAAAGCTGCTGGACGAACACGTGCTGACCTGCACCAACAGGCACTCCTACCAGAGCACGGCGAGAGCCTACCACCGAGTGGTGGATGCTAGAGATGGGAAAGACAGTGCCATCAAAGCTGAACTCGGTGACAAGGGCTCTCCTACAGCGTTTTCTGCACACACAGACAAATACAGAGAAGACGCCAGCCAGGCGCCCGATGACTCAGCCTCGCCCACTGGGAGCAGAAAAAGCACTGTGGAGTCCGGCACAGCTGGTGAAGAGAAGAGCAGAGCTGCGGAGACAAAAAGAGTTGTCATCAAGATGGAGCCAGAGGACGTCCCTGCAGACGACATGAAGGACTTCACCATCGTCAAGGTCACCGAGAAAGACTGCAACGAGTCCACCGACAACGATGAGCTAGAGGACGAGCCCGAGGAGCCGTTCTACAGATACTACGTCGAGGAAGATGTTGGCATTAAAAAAAGTGGTAGGAAAACCCTAAAACCTCGGATGTCCGTCGGCGTGGATGAAAGGGGTGGTTTGGAGAACATGAGACCCCCAAACAACAGCAGCCCCAGACAGGAGGACGCCGAGAATGCGTCTTGTGAGTTGTGTGGGCTCACGATAACGGAGGAGGACCTGTCCTCTCATTACTTAGCCAAGCACATTGAAAATATCTGCGCATGTGGTAAATGTGGGCAGATACTTGTCAAGGGCAGACAGCTTCAGGAACACGCTCAGAGGTGTGGCGAACCTCAGGACCTGACGATGAACGGGCTGGGGAACACTGACGAGAAGATGGACATGGAAGAGAACCCAGATGAGCAGTCTGAGATAAGAGACATGTTTGTTGAGATGCTGGATGATTTCAGAGACAATCATTACCAAATAAACAGTATCCAGAAAAAACAGTTATTTAAACATTCTGCCTGTCCTTTTCGATGTCCTAATTGTGGCCAGCGTTTTGAAACTGAAAATCTAGTGGTGGAGCATATGTCTAGCTGCCTAGACCAAGACATGTTTAAGGGCGCCGTCATGGAGGAGAATGAACGAGATCACAGACGGAAACATTTCTGTAACCTGTGTGGAAAAGGCTTCTATCAGCGCTGTCATTTGAGAGAGCACTATACTGTTCATACTAAAGAAAAGCAGTTTGTTTGTCAGACATGTGGGAAGCAGTTTTTAAGAGAGCGCCAGTTGCGTCTGCACAATGATATGCACAAAGGCATGGCCAGTCTCTGGCTCATACTGGCCTGGAACTCACTATGCAGTGATCATCCCGCCTCTTGGTCCCGACTGTGGAGATTAGGTATGTGCCACCACTCCCACCTGGGCTGAGCTTTTAATGTGTTCTGAATTATAATTATCAAAAGAAAAAGAGCCTGTTTTAAAACATAATACACAGGAAACATAAAAGGTATTGACACAATGAGTATGTGTTTTTTTGTGTGTGTGTGTGTGTGTGTTTTTTTTTTTTTTTTTTGTTCTTTTTTT
>OL802220.1 Portunus trituberculatus vitellogenin receptor mRNA, partial cds 
ATGACCTTCTGCGACTTCCTTCAGCGTCTATTTTTGCTGACGCTTGTGCTAGCGGCCGTAGTTTCTGTTGGCTGCGGTTATCGTGATGGCAATAATATTAAAGATGCTTTGAAACATCTGGAACAGCATCGCAACAAGTCCACTGATGCTGACGCAGTGAATCGTCGGGAAGTGAGGGGACAGGACGTAACTCCCACCACTACCACATCTAGTACCACTAGACGCTCCTTTACTTATAAAGGTATATGCAATACGATGTTCCTGTTCCGCTGTGACAACGGTGAATGTATATCGAGGAATTTCCTTTGTGACGGAGGCAATGATTGCTCAGATGGATCTGATGAGAAAAACTGCCAGAAATCTACAGAAGGAAAATGCAATTCAAACCAATTTACGTGCAAGAACGGGAGGTGCATTCGTCCTGAGGAACGGTGCGACGGATTGGATGACTGCAAGGATAATTCCGATGAAGTTGACTGTAAGAATTGTCACGGAGACGAGTTCCTATGCAAAAGTGGGAAGTGTATAGCCAATGACACTTTATGTGATGGTGACAAGAACTGCGAAGACGGCGACGACGAAGCAAACTGTGAAAAGGCACACTGCCTCTCTATACCAGGCCACTACCAGTGCCAATCAGGGGAGTGCGTGCCGCCCATTAAGGTGTGTGACAATAGGACGGATTGCTTGGACGAATCGGATGAAGGGCAGGCTTGTGCTACAACATGTGCAGCCAGTAACTGCACGCAGGGATGCTTCCGAACGCCAAAAGGTCCTCATTGTTTATGTAGACGAGGGTATTACCTAGAACGTGATCAAGTAACCTGCTCTGATATAAACGAGTGTGCTTGGAGCGACAAATTAGTGTGCGACCATTACTGTGAGAACACCAAGGGCGGGTTTCAGTGCTCCTGTCACCACAAGTATATACTGCAGAGTGATAACGTTACCTGCAAGCACCAGCAGTCCGGAAGTGCATTTCTTTTAATAGCACAGGACGATGGAATCAGGCAGCTGTTCCTGGATGGCTCTCGCAACGTGCAAATTGTTCACTCGGGGAATGCATCGGTCATAGGATTGGGTTATGACCCTGTAACTCGCACGATGTTCTGGAGTACCTTTGGTAATGTGTTAAAAGCGGAAGTGGTACCTAATGCAGTGACTCACAAACTGTTGCGTGATGGCTTCATTGTGGCTGAGGGTTTGGCCGTGGACTGGACTGGTAGGAACCTGTACCTCACAGATCCCAAAATGAAACATATCATGGTGTGTAAAATGGACGGCTCCTCCTGCTACTCGCTATTGAGTGGTCTTGGTCATCCAAGAGCCATCCAGTTGGATATGGTTAATAGGTATATGTATTGGACTGACGTGAAGGACGGCACAATTCGCAAGGCTGGAATGGATGGTACTAATCATGATGTGGTGGCAATGAATGGAGTACTGTGGCCCAACGCCATGGCACTTGACCTGCCTGCTGGTCGTCTCTACTGGCTGGATGCTAACAAGGACCATGCCTTCAGCATCAAGTTGGATGGTACAGACCAGAAGTCGCTCCAACATGCTGTGATCCACCATCCCTTCGCCATGGCACAGTGGGAGGACCGTCTGTATTGGACTGACTGGAGCAAAAAAGTAATCTTCTCCTGCATCAAAAGGGATGGCAGACATGGGAGGACGGTGCTGAAAGGAGGCTACACGATGTACTTTGGCCTCATTCTTTATCACCCAGCCATGATGGAAGACATATCCAACCCATGCCGATATTCAAACTGCAGCCATATGTGTCTTCTGTCTCCTCACTCCCCTGGGTATACCTGTGCCTGTCCCAGTGGCATCATGGAGCTCAGCCGTGACAGTCATACATGTGTTGATACATCGGCTAGAGTTTACTTGATAGTCAGCAGCCTCAAGAAATTGTACATGCTGTCACCACACAAGTTTGGCCGTGCCGACCAGCATGTCTTGGAGCCACAACCAGATATCAAAGGCATAGGTGATATGGAGTATTCCCCAGAGCAAGGC
>XM_036181832.1 PREDICTED: Onychomys torridus olfactory receptor 13-like (LOC118579991), mRNA 
ATGGGAAATCAGACCTGGGTTACACAGTTCATTCTCTTGGGATTTCCACTCAGCCCAAGGATGCAGATGTTCCTCTTTGCTCTCTTCTCCCTGTGCTATGCCTTCACCCTGCTGGGGAATGGGATCATCGTGGGGCTTATCTGCCTGGACTCCAGACTCCACACTCCCATGTACTTCTTCCTATCCCACCTGGCCATTGTTGACATTGCCTATGCCTGCAACACAGTGCCTCAGATGCTGGTGAACCTTCTAGATTCAACCAAGCCCATCTCCTTTGCTGGATGCATGATGCAGACCTTTCTCTTTTTGACATTTGCACACACAGAATGTCTGCTCCTAGTGGTGATGTCCTATGATAGGTATGTGGCCATCTGCCACCCTCTCCGATACACTGCCATCATGAGCTGGAGAGTTTGTATTACCCTAGTGGCGACTTCCTGGATTTTAGGAGTCCTCTTGGCCCTGGTCCATCTAGTATTACTATTACCATTGCCCTTCTGTGGATCTCAAAAAGTAAATCACTTTTTCTGTGAAATTATAGCTGTTCTCAAACTTGCCTGTTCAGACACCCATGTCAATGAGATTATGGTTTTGGCTGGGGCTGTGTCTGTGCTTGTGGGACCATTTTCTTCGATTGTGGTCTCTTATGCTCATATTCTGTGTGCCATCCTGAAGATCCAGTCACGCCAGGGGCGCCAGAAAGCCTTCTCCACCTGTTCCTCCCATCTCTGTGTTGTTGGACTCTTTTATGGTACAGCCATTGCCATGTACATTGGGCCTCAACAGGAGAATTCCAATGAGCAGAAGAAATACCTCTTGCTATTCCATAGCCTTTTCAATCCTATGCTCAACCCACTGATCTATAGCTTGAGAAACAAAGATGTCAAAAGTGCTCTGAAGAGGATGCTCATAAAGAAGGATACCTCTCAGGAGCATTAA
>KC494783.1 Ornebius sp. 10 BHW-2013 isolate REU1901 12S ribosomal RNA gene, partial sequence; mitochondrialKC494784.1 Ornebius sp. 10 BHW-2013 isolate REU1902 12S ribosomal RNA gene, partial sequence; mitochondrial 
AATAAGTGTAAATATAAAAGGTTTAGGTAGTAGGAGTTAAGATCTTGAAACTTAAAGAATTTGGCGGTGTTTTATTCTGTTCAGAGGAATCTGTTTTGTAATCGATAGAACACGATTGAATAAACTTGAATTTATAATTTGTATATCGCCGTCATCAGATTATTTTGAATGGAGGAATTTAAATATTAAAATATTTATTAGGATAAAATGTCAGGTCAAGGTGCAGTTTATATTTAAGTATATAATGGATTACAATAAATGAAAATTTATTTGGATTATAAATATGATTATTTATACGAAATTGGATTTGAAAGTAAATTGGTTGAAATTAATAAATTGAATAAGCGCTGAAGCATGC
>XM_015123435.2 PREDICTED: Macaca mulatta zinc finger protein 493 (LOC693611), transcript variant X2, mRNA 
TGTCCTCAGCGTGTGTGGCTTCATGACCCGAAGGTATTGGGAGATCCATAGCTAAGATGCCAGGACCCCCTGAAAGCCTAGAAATGGGAACTGATTTTCTGCTGTATTTTTCACCTGTGTCCCAAGCAGCGTCTTGGAACCCATCCCCCATTTCTCCAGCCTCACTCTGGCTTGCAGGGCCGTTGACATTTAGGGATGTGGCCATAGAATTCTCTCTGGAGGAGTGGCAATGCCTGGACACTGCTCAGCAAGATTTGTATAGGAAAGTGATGTTAGAGAACTACAGAAACCTGGTCTTGGGTATTGATGTCTCTAAGCCAAATCTGATCACCTGTCTGGAGCAAGGAAAATATCCCTGGAATATGAAGAGACACAGTATGGTAGTGAAACCCCCAGTTATATGTTCTCATTTTGCTGAAGACCTTTGCCCAGGGCCAGGCATTAAAGATTCTTTTCAAAAAGTGATACTGAGAGAATATGTAAAATGTGGACACAAGGATTTACAGTTAAGAAAAGGCTGTAAAAGTGTGAATGAGTGTAATGTGCACAAAGAAGGTTATAATGAACTAAACCTGTGTTTGACAACTACCCAGAGAAAAATACTTCAATGTGATAAATATGTGAAAGTCTTCCACAAATTTTTAAATTCAAATAGACATAACACAAAACATACTAGAAAGAAACCTTTCAAATGTAAAAAATGTGGCAAATCATTTTGCCTGCTTTTACACCTACATCAGCATAAAAGAATTCATATTAGAGAGAATTCTTACCAATGTGAAGAATGTGGCAAAGCGTTTATCTGGTTCTCAACCCTTACTAGACACAGGCGGGTTCATACTGGAAAGAAATCCTACAAATACGAAGAATGTGGCAAAGCTTTTAACCAGGACTCAAACCTTTCTACACATAAGAGAATTCATACTGGACAGAAATCCTACAAATGTGAAGAATGTGGCACAGCTTTCTACCAATTCTCACACCTTACTAGGCATAAGTTAATTCATACTGGAGAGAAACCCTACAAATGTGAAGAATGTGGCAAAGCTTTTAACCGATCTTCAACCCTTACTAGACATAAGATAATTCATACTGGAGAAAAACCCTATAAATGTGAAGAATGTGGCAAAGCCTTTAGTGTTTTCTCAACCCTTACTAAACATAAGATAATTCACACTGGAGAGAAACCCCACAGATGTGAAGAATATGGCAAAGCTTATAAGGAGTCCTCACACCTTACTACACATAAAAGAATTAATACTGGAGAGAAACCATACAAATGTGAAGAATGTGGCAAAACCTTTAGTATATTCTCAATCCTTACTAAACATAAGATAATTCATACAGAAGAGAAACCCTACAAATGTGAAGAATGTGGCAAAGCTTTTAAACGATCTTCAACCCTTACTAACCATAAGATAATTCATACTGAAGAGAAACCCTACAAATGTGAAGAATGTGGTAAAGCTTTTAAACAATCTTCAACCCTTACTATACATAAAATAATTCATACTGGAGAAAAACCCTACAAATGTGAAGAATGTGGCAAAGCTTTTAAGCGATCTTCAACCTTTACTATACATAAAATAATTCATACTGGAGAAAAACCCTACAAATGTGAAGAATGTGGCAAAGCTTTTAATCGGTCCTCACACCTTACTACACATAAGAGAATTCATACTGGACAGAAACCCTACAAATGTAAAGAATGTGGCAAATCCTTTAGTGAATTCTCAACACTTACTAAACATAAGATAATTCATACTGAAGAGAAACCCTACAAATGTGAAGAATGTGGCAAAGCTTTTAACCGATCTTCAATCCTTAGTATACATAAGAAAACTCATACTGGAGAAAAACCCTACAAATGTGAAGAATGTGGCAAAGCTTTTAAGCAGTCCTCACACCTCGCTGGGCATAAGCATGTTCATGGTGGACAGAAACCCTACAAATGTGAATTATGTGGCAAAGCCTTTAGTATATTCTCAACCCTTACTAAACATAAGATAATTCATACTGAAGAGAAACCCTACAAATGTGAAGAATGTGGCAAAACTTTCTACCGATTCTCAAACCTTAATACGCATAAGATAATTCATACTGGAAAGAAACCCTGCAAATGTGAAGAATGTGGCAAAGCTTTCAACCATTCCTCAAACCTTACTAAACATAAGCTAATTCATACTGGAGACAAACCCTACAAATGTGAACAATGTGGCAAAGCTTTTAGGCGGTCTTCACATCTTAGTAGACATAAGATAATTCATATTGGAATTCATACTGAAGAGATTCTACAAATGTGAAGAATGTGGCAAAAGCCTCTTCCCTTACTAAAGAATGTGGCAAAGCTTTTAATCAGAACTTCACCCTTACTACACATAAGATAATTCATGCTGGAGAGAAACCCTACAAATGTGAAGAATGTGGCAAAGATTTCTATT
>XM_036871986.1 PREDICTED: Balaenoptera musculus vestigial like family member 2 (VGLL2), transcript variant X3, mRNA 
CTTCTATCTCGGAGCGCGGTGGCAGCTGGAATTGCAGGGGTGGGAAGGGAGCGTGCGAGCGGGATCCCGAGCCGCGGAGCACGCTGCCCCTCGCTCCGCCGCGGATGACTTGGGAGCTCGGGTCCAAGTGCCGCCCATGCAGCATCCCTGCCCTCCGCCGCCCGAGAGTTGATGATAAAACACTTAACCGTCTCCGCTGCGGGAAGCCATGAGCTGTCTGGATGTTATGTACCAAGTCTACGGTCCTCCCCAGCCTTACTTCGCAGCCGCCTACACCCCTTACCACCAGGGTCTGTCGGACTCCAGATTTCTTCCGAGCCCGGTGCTGGCGCGGGAAGATGCGAGCAAAGCTCACGCAGGGAAAACCAAAATTTGGTCCCAAAGAAACTAGCCTATTACTCCAAAATGCAGGAAGCCCAGGAGTGCAACGCCAGCCCCAGCAACAGCAGCGGCAGTGGCAGCTCCTTCTCCAGCCAAACTCCGGCTAGTATAAAAGAAGAAGAAGGCAGCCCGGAGAAAGAGCGCCCACCAGAGGCGGAGTACATCAACTCCCGCTGCGTCCTTTTCACCTATTTCCAGGGAGACATCAGCTCTGTGGTGGACGAGCACTTCAGCCGGGCCCTGAGCCAGCCTAGCAGCTATTCCCCAAGCTGTACAAGCAGCAAAGCCCCGCGGAGCTCTGGGCCCTGGCGGGACGGCTCCTTCCCGATGAGCCAGCGCAGCTTCCCCGCCTCCTTCTGGAACAGCGCTTACCAGACGCCGGTGCCCGCGCCACTGGGCAGCCCTCTGGCCGCCGCTCACTCGGAGCTGCCCTTCGCCGCTGCCGACCCCTACTCGCCGGCCGCGCTGCACGGCCACCTGCACCAGGGCGCGGCAGAGCCCTGGCACCACGCGCATCCCCACCACGCGCATCCGCACCACCCCTACGCGCTGGGCGGCGCCCTCGGCGCCCAGGCCGCCGCCTACCCGCGGCCCGCCGCCGTGCACGAGGTCTACGCGCCGCACTTCGACCCGCGCTACGGGCCGCTGCTGATGCCCGCCGCCTCGGGGCGCCCGGCCCGCCTCGCTCCCGCGCCGGCCCCCGCGCCAGGCAGCCCGCCCTGTGAGCTCTCGGCCAAGGGCGAGCCGGCCGGCGCCACGTGGGCCGCGCCCGGGGGACCTTTCGCGAGCCCCACGGGGGACGTGGCCGGGGGTCTGGGCCTCAGCGTGGACTCAGCTCGTCGTTATTCCCTCTGTGGTGCATCCCTCCTGAGCTGATCTGCTGACCCAGGGTTTCCCCTTCCCTTTCCCTTCTGACCAGCCATGGAGGCTGGCATCTGTGCCTCTCACTTCATGGATGAGGACATGGGGGAATGCAGAGACTTCAAACTTCTCCGTGTATTGGGAAAACCAGAACACACATCGACAGAATTTTCATCTAAAAATAATTCCTTCTGCCAAAAGAGGAAATCCAAAGACTCTGAATGATGCTTAATGACTTTTGGGCAAATCACTGGAAATATCCATGGTGATCACTTAGGTGACATGATTCATAGTTTTCTCGGAAAGAGGGAAAGAAAAAGAGATGTTTTGGTGTGAATATTTTTTATGCTGATGTGAATTATTTCATTAAGTAGTGTGATCATAGCACTGCAATGTCAATATCCTCAGACTGAAATGTATTTGTATTTGCATCAAAGACTGTGGTAGAGAAGTCAAAAGAAGCCAATTCCTTCTTCCTCACCTGTAGCCTCCAGCTCCTTTCCTGCCCACTCCCTCCCTACAACACCCACTCCAGACACAAAGACACACTTTCTTCTTCGGACTGTGAACGTGGAAGCCTCAGCCCGAATGTGAGCGGCAAGTGGCGAATCTGGAGCCACCTGCCCGAGTCTTACTGAAATGCAGCTGTTGTAGGACAACTGTTTAAAACTCCAGAAATACATCGACCAAAGGGGGCACTTCCCAGTGTTTGGCACAGCAATTGCAGTTGCACTGGATATGTTTTATACGTGTGTGTGTGTGTATATATCATATTTTTTACAAAGAACATTTTATGATGAAAGAAGAAGCTCTCTCTGCCTTCTCTCCCACGAATTCTGTCCCTCCCTCTATCCTTCTTTGGGTGAAAAAAAGTAAGCATCAAGAGGCCCCAGTTGTCTCCAAGAAGAAGAACTAGGAGTCACCACAAGGGGAAGAGATGCCCATGGAGTCTCTGGTACCTCGAATATTCTTCTCAGTCTCTGTGGTCATGATTTGGTCACTTTAGTGTTGGGACAGGGGAAGGGGTACACATGTGGGCAAAACTGAAGGGGATGAGGAAGAAGAAACGAACATTAAAGATGTTTGTTTACCACTA
>OV289143.1 uncultured Bacterium partial 16S rRNA gene 
GGACTACTGGGGTATCTAATCCTGTTTGCTCCCCACGCTTTCGCGCCTCAGCGTCAGTATCGATCCAGAAAGCCGCCTTCGCCTCTGGTGTTCTTCCTAATATCTACGAATTTCACCTCTACACTAGGAATTCCGCTTTCCTCTATCGATCTCTAGCCACCCAGTATTAAACGCAATTCCTAGGTTGAGCCTAGGGCTTTCACGTCTAACTTAAGTGGCCGCCTACGCGCCCTTTACGCCCAGTAATTCCGAACAACGCTAGCTCCATCCGTCTTACCGCGGCTGCTGGCAC
>KT295441.1 Uncultured Klebsiella sp. clone M01598_122_000000000-ADV8A_1_1102_4097_6649 16S ribosomal RNA gene, partial sequence 
CCTACGGGCGGCTGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGGGGAGGAAGGCGTTAAGGTTAATAACCTTGTCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAAAGTCTTGTAGAGGGGGGTAGAATTCCGGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTAGTAGTC
>XM_053381890.1 PREDICTED: Podarcis raffonei L3MBTL histone methyl-lysine binding protein 3 (LOC128410530), transcript variant X3, mRNA 
GCACAGCCTCTCGCCCAGGGGATGGGACCCGAGGTGGTGGGGGAAAGTGGCCCGGCGCCTGCGAAGTGGCTGGGGAGTGTGGGTCGGCCACGGGGGGTTCCTTCCCTAAAAAAGCCCCTAAGTGCGTGAGAGTGAAAGAGGAACAAAAGAGTGGGCGAGGGAGAGCCAGAGAGAGGTGCCTTCGGCGTCCGCGCCCCCCACCCCGCTCGCTTCTTCCCCAACATATGACGGTATATGCACCATGAATGAACCAACTTCTAGTGGAAGTGGGCAAGACTTTGATGTATTTAGTGTAATGGACTGGAAGGACGGAATTGGTACCTTGCCTGGAAGTGATCTGAAGTTTCGTGTGAATGAGTTTGGTGCCCTAGAAGTAATCACCGATGAAACAGAGATGGAAAGTGTTAAGAAGGCTACAGCTACCACAACCTGGATGGTGCCTACTGCTCAAGAAGCCTTCTCAGAAAATACAGAAGTACCACAAAAACTGAAGGAAGCTAGCAAGGTTGACGGGCCTCATTTCTGTGAACGTTGTTTTCATTCTGGAACCACAGTGGACTTTGTAGCTGGAGAAAGATCTTGCAGCCAAAAATGTGCACATCAGATTAAAAACAAAGAGCAAAGGGAGGACAACGATGTCTCGGAAGTCAATGATGAGGACTGTTCCAAGGGCACTCAAAAAAGAAAAACCAAATCGCCCTCAAAAGGAGAATGTATGGAAGACAATGTCAAGAAGTATGAGGCAATGGAGGAGAAACCTGAAGGGAGGATACTAAGAGTCTCTCAGAGAGCCACACGGAAAAGGAAAAGAGAGATGGCAGTTCTAAAACAGACTTTGATGTCAAAGGCAAAGAAAACATGGAGTTGGTCTTCGTATTTGGAAGAAGAAAAGGCTATAGCAGCACCACCTAAGATTTTTAAAGAGTATCAATCCTTCCCGTACAACAAAAATGGATTCAAAGTTGGAATGAAACTAGAAGGGGTGGACCCTGAGCACCAGTCAATGTATTGTGTGCTTACAGTAGCTGAGACTTGTGGTTACAGAATTAGACTTCACTTTGATGAATACCCAGAGTGTTACGATTTTTGGCGGAATGCTGATTCTTCTGATATTCACCCAGTTGGTTGGTGCGAGAAAACAGGACACAAACTTCATCCACCAAAAGGATATAAAGAAGATGAATTTAATTGGTCCTCGTATCTGAAGAAATGTAAGGCTCAAGCTGCTCCTAAATCCTTGTTTGAAAACCAAAACTCAACGGTGATTCCATCAGGGTTTCGAGTGGGGATGAAGCTTGAAGCAGTAGACAAAAAGAACCCTGCATTCATATGTGTTGCTACAGTAACTGACATTGTGGACAGTCGTTTTCTGGTTCATTTTGACAACTGGGATGAGAGTTATGACTACTGGTGTGAAGCGGCTAGTCCACATATTCATCCAGTTGGCTGGTGTAAAGAGCACAGAAAGACCCTTGTAACCCCTCGAGACTATCCACATGCCAAGCATTTTTCTTGGGAGAAATATTTGGAAGAAACTAGTTCTTTACCAGCACCTGCCAGGGCTTTTAAAGTGAAGTCTCAGCTGGACCAAAGAGCTTTTCAGCAGTGGAAGGACACAATTGCATACAACACAAAGTCATTAACAAAGAAACCTTCTCATGGATTCCAGAAGAATATGAAACTTGAAGTAGTTGACAAGAGAAATCCTGTACTAATCAGGGTCGCAACCGTGGTAGATACTGATGACCACAGAATTAAAGTCCACTTCGATGGCTGGGATAGTATTTATGATTATTGGATCGATGCAGATAGCCCTGATATCCATCCTGCTGGCTGGTGTGGGAAAACTGGACATCCTCTTCAGCCCCCACTTAGTCCTTTGGAATTGGTAGAAGCTTTAGAACAAGGAGGATGTCCTACAGTGGGCTGCAAAGGAGTTGGACACATAAAAAGAGCCAGACATACGGGCCACCACAGTGCTCTCAGCTGCCCATATTCTGAGATAAATCTGAGCAAAGAACATATCCTTTCAGACCGCTTAAGTGGAGAGATGCCTCAGAGTATTCCGCCTCTGCATTGGAACCGGAAGCCAGAAGCAAATGAAAGATCTGCATCTCCTGTAATCAGTAATAGAAAATGTCCCAGTCCCATTGTCCTAAAATCTTCAGCTCATCTCCATTCATCAAAGCAGGAAGACACAGAGGTGAAACCTCTTTGCAAAAAGCCTCTAATGTTTGATGTCAAAGAAAAGAACTACAGGGGATGCCAGGCAACTAAGGATTTTGCAAAGAAAGATGGCTGTGCAGGCAGGAAGATGGAAAATGAAGAGTCATCTCTAAATGAATCCAAAGACACCAAGGAATCCAGTAACAGGAGTTCCCATCCTCAGCCAGTTATTTTGACCTCGAAGTTGACAATCCCAGCCTTTCCATTGCGATGGGAACAGCAGAGTAAACTCCTTCCTACTGTGGCTGGAATCCCTGCCAGTAAAGTTTCCAAGTGGAGCACAGATGAGGTGTCAGAATTCATACGGAGTTTGCCAGGCTGTGAGGAACATGGCAAGGTGTTCAAAGACGAACAAATTGATGGAGAAGCTTTCCTTCTAATGACCCAAACAGATATAGTAAAAATAATGAGCATTAAGCTAGGACCAGCCCTAAAGATCTTCAACTCAATCCTGATGTTCAAGGCTGCCGATAAGAACTCGCACAATGAACTCTGATGGAAAAGTGACTACAGGGCAGCTCTCTCCATTGCAGCTCATGTTTTATTCAAAGCACAAAGACTCCAAAGGATCATCAAGGAGGAACTCTATAAGGCGAAAAATCAGAGTGGATGGAGTGTTGATTTTCTCCAAGAGCCTGAGCAAACTAACACTTCTGGGAAGTGCTTAAGCTTTTTAGTAAGATGCTCTTACAAAAGAGTGGGTACTTGATGTTTACTGGCTGATGGCTCTAATTTTCCCACAACTAGCCATCCTTAATTTTATCGGGGATCCATTAACTAAGTTAACATACTAAAATTATGGAAATAATATCCTTTTCTAAGGATACACAAAATACACACTTCATGAATTTACTTCTTCACCAATGAATTCCTTTGTATCGTTTCATCATTTTCATTAAAAAAAAAATTGTTCGCAGTTTAAAATAAGTGGACTACAGTTAATGAAGACTGTTAACAAGTCGTCTTAGTTTCACACAGCAGCTCAAATTTAACACTTTGCTGTGTACAATGAAGCTGATCGATTTATTCTGTTGTATGAAAACATTGCTGGAGACCAATGCTATGTTTTTTTGTTTTTGTTTTTTTGCATGATTAAAGAAGTTTAATGAATATTTCCACCAGCATA
>XM_027574246.1 PREDICTED: Zalophus californianus family with sequence similarity 71 member F1 (FAM71F1), transcript variant X2, mRNA 
GGCAAACTTGCAGCAGGCCCCTGAGCATGTGCGGAAATGTTGTCATCAGTTCCACAGAGAAAGACTCGGTGGAAATCAAAGAAGACAGTAAAAGTCACAAGATCTTTTCCAACCTTCCCTTCCCTGAATGCCTGGGAAGAAGTCAGGGGCCTCTTGCCTGTGGATGGGGAGCCAAACCCTGGAGTGGGCCTGGGTGTGGAGGAGGGACTGCTCTGCCAGATTCTTCATTCTCCAGAATTCAACCTATTTCCTGACTCAGTGGTGTTTGAAAGCAACTTTGTCCAGGTCAGAAAGGGCAGGGACTGGATAGACATCTACAAGGCCTCCAACACCATGGCCCTTGGGGTAACCTCCTCCGTGCCCTGCCTGCCCCTTCCCAATATCCTCCTCATGGCTAATGTCAAATGGCACCAGGGACAGAGCCAGACATGGAACAGACCATCTATGGCCCCAAACATCAAGCTGAAGAGGATCCTCCCATTGAAGTTTGTGGAGTTCCAGGTCTGTGACCGGCTTCAACGCATCCTGCGTTTGAGGACAGTCACTGAGAAGATCTACTACCTAAGGCTCCACCCTGACCATCCTAGGACTGTCTTCCACTTCTGGATCCGACTGGTTCAAATTCTGCATAAGGGCCTGTCCATCACCACCAAGGACCCTAGGATTCTTGTCACTCACTGTCTGGTACCCAAGAACAGCTGCAGCCCCTCGGGAGACTCTAACTCGGTAGAGAAGAAACCCCAAGCCTCCCAGCCCAGCGAGAGCCTCATGCAGCTGATGGCCAAGGGGGAGAGTGAGGCGCTCTCTCAGATTTTTGCCGACCTGCACCAGCACAATGAGTTCAGGAGCAGCAAAAAGACACAGACCAAAAGGGACAGCTCAGAGAAAGATACTCACAGTGAAGACGGCATCCCTTGCACCCGCGACCTCAGTTGGAGAGATTCGCTCACTTATGGAGAGTGGGAAAGAGAGAACCCCTCTGGGCCACAGCCCCTTTCACTCCTCAGCACCCTGGCAGCCTCCACGGGGCCACAGCTGGCCCCACTCATATAGGAAATTCTATTTAAACTACCTTTTCGCACTGGGGAGAATCTATGCAGCCCTCGCCAACGCCACTCTGCAGCATGCAGCTTTCTGAGGGACTCTGTCTGGATGTAGGGGAGAAGAAAGCTACAACTAAGGAAAAACTAGACTCATCTCATGCTGATAGCATAGCCTTTCCTTGGAGAACCACCTGGGAGCATGGCTCCGGGTAAGAGCATTATTCCAGCATCATGCCAGTACGTAACTCCGGATCCGTGCCACTACCCATCACACCTTGCCTCCGTTAACCACCACCAGGGCAGGCACAAGAAGATGTGCTCTCAGAAGGGCCACGGACAAGAGATGGAGAGAAGGAAGGAAAGGGAAGCAGGACCGGAGGAGAGGGGGACGAGAACAAAATGGCGGTGAAGAGCAGGTGGAGGGAGAAAGTCAGAGAAGAAGGGGGATCTTACAGAGAGGTGGTAAGAAAACAGAAGGGACCTGAATGAGAAGCTGAAAAGGACAAGAGAAGAAATACACCACTGAGAGATGCCTCACGAAGCTTCTATTTATCTAATTTAAAACTTGAAAGTAAGGCCATATACCCAAACAAATGTGTTTTCTTCTCTGTGCCAATTATTCTGGATAACTATGAGGGGCTAAAAACTAATTCCAGCCAAGGGCCTCTCCTGAAGT
>KM481143.1 Uncultured bacterium clone 2010ECS-StD#1958 16S ribosomal RNA gene, partial sequence 
GGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCAGGGCTTAAATGTAAGTTGCATGGATCAGAGATGGTCCTTTCTTCGGACTACTTACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCAGGTTAAGTCCTATAACGAGCGCAACCCCTATTGTTAGTTGCCAGCGGGTCAAGCCGGGTACTCTAGCGAGACTGCCGGTGCAAACCGAGAGGAAGGTGGGGACGACGTCAAATCATCACGGCCCTTACGTCCTGGCTACACACGTGCTACAATGGCCGGTACAGAGAGCAGCCACCCCGCGAGGGGGCGCG
>KP968504.1 Sarocladium sp. strain LA-MB10 18S ribosomal RNA gene, partial sequence 
TCTTTGTTTGTGTGTGTCTGTCCTACTCCAGGTTTCCTCTCTAATTGGGACCACGTGTGTGTCTCCGGGTTATATCTGGGCAAAACCCCCCCCTCCACCAGGGGTTGGGAGGTGGTTATCTATCCAACCCAATCCGGGGCCGTTCGGGGTTGTTTGTGATTCATGAAACTAATAGAATCGCCCGCCCTGGCCCTGCGGTGGATCATTCCACTTACTACCTTATCAACTTTCGATGTTGGCTATTGCCAATCATGGTGCAACGGGTAACGGAGGGTTAGGGCTCGACCCCGGAGAAGGAGCCTGAGAAACGGCTACTACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCCGACTCGGGGAGGTAGTGACAATAAATACTGATACAGGGCCCTTTCGGGCCTTGTAATTGGAATGAGTACAATTTAAATCCCTTAACGAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGTGGTTAAAAAGCTCGTAGTTGAACCTTGGGCCTGGCTGGCCGGTCCGCCTCACCGCGTGCACTGGTCCGGCCGGGCCTTTCCCTCTGTGGAACCCCATACCCTTCACTGGGCGTGGCGGGGAAACAGGACATTTACTTTGAAAAAATTAGAGTGCTCCAGGCAGGCCTATGCTCGAATACATTAGCATGGAATAATAAAATAGGACGCGCGGTTCTATTTTGTTGGTTTATAGGACCGCCGTAATGATTAATAGGGACAGTCGGGGGCATCAGTATTCAACTGTCAGAGGTGAAATTCTTGGATCAGTTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAGGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGACGGTGTTATTCATGACCCGTTCGGCACCTTACGAGAAATCAAAGTGCTTGGGCTCCAGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGAAATTGAC
>JF420835.1 Centroptilum triangulifer heat shock protein 70 mRNA, partial cds 
TCGAGGCAGACAGATCCTCTTGAGCACATTTCCTCTTTTTCATCTGCAATCATCCGCTAAAGAAATGGCAAAGCCGGGCCCCGCAGTCGGTATCGATCTTGGAACCACCTACTCCTGCGTTGGAGTTTTCCAGCACGGAAAGGTGGAAATTATTGCCAATGACCAGGGCAACAGAACAACCCCTAGCTACGTGGCTTTCACTGACACCGAGCGTCTCATTGGAGATGCCGCCAAGAACCAAGTGGCCATGAATCCTAGCAACACCATCTTTGATGCTAAGCGTTTGATCGGGCGCAAGTTTGAAGATGCTACAGTGCAAGCCGACATGAAGCACTGGCCATTCACAGTCATTAGCGAGGATGGCAAGCCCAAACTGCAGGTGGAATATAAGGGAGAGACCAAGGCCTTTTTCCCTGAGGAAGTCAGTTCGATGGTGCTCATCAAGATGAAAGAGACCGCCGAGGCCTACCTGGGCAAGACTGTCAACAATGCCGTCATCACCGTGCCGGCTTACTTCAACGATAGCCAGCGCCAGGCCACCAAGGACTCGGGCACCATCGCTGGACTGAACGTGCTCAGGATCATCAACGAGCCCACTGCGGCTGCCATCGCCTATGGTCTAGACAAGAAAGGCCAGGGTGAGAGGCATGTCCTCATCTTTGACTTGGGTGGCGGCACCTTTGATGTGTCCATCCTGACCATTGAGGATGGAATCTTCGAGGTCAAGTCCACTGCTGGAGACACCCATCTTGGAGGTGAGGACTTTGACAACCGCATGGTCAACCACTTTGTGCAGGAGTTCAAGCGCAAGTACAAGAAGGACCTGACCACCAACAAGCGTGCCTTGAGGCGTCTCAGGACGGCGTGCGAGAGGGCAAAGAGGACCCTCTCTTCGTCCACTCAGGCCTCCATAGAGATTGACTCTCTCTTTGAGGGCATCGATTTCTACACTTCCATCACCAGGGCTCGTTTTGAGGAGCTCTGCGCTGATCTCTTCAGGTCCACCCTTGAGCCCGTTGAGAAGTCCCTGAGGGATGCTAAGATGGACAAGGCCCAGATCAATGATATTGTTCTTGTCGGAGGTTCTACCCGTATTCCCAAGATCCAGAAGCTCCTGCAGGACTTCTTCAATGGCAAGGAGCTCAACAAGTCCATCAACCCTGATGAGGCTGTTGCCTATGGAGCAGCTGTCCAGGCTGCTATCTTGGCTGGAGACAAGTCTGAGGCTGTCCAGGACCTTCTCCTGTTGGACGTCACTCCCCTTAGCTTGGGTATCGAGACTGCTGGTGGTGTGATGACCACCCTTATCAAGAGAAACACCACCATTCCCACCAAGCAGACCCAGACCTTCACCACCTACTCAGACAATCAACCTGGAGTGCTCATTCAGGTCTATGAGGGCGAGCGTGCCATGACCAAGGACAACAACATTTTGGGCAAGTTCGAGCTTGCGGGCATCCCTCCTGCTCCCCGTGGTGTGCCCCAGATTGAGGTCACCTTTGACATTGACGCCAACGGCATCTTGAACGTCTCTGCAATTGAAAAGTCTACCAACAAAGAAAACAAGATCACCATCACCAATGACAAGGGTCGCTTGTCTAAGGAGGAGATTGAGCGTATGGTCAACGACGCAGAGAAGTACAAGGCCGAGGATGAGAAGCAGCGCACCGTCATTGCTTCCAAGAACAGCCTCGAGTCCTATTGCTTCAACATGAAGTCAACCATGGAAGGTGAGAAGCTGAAGGACAAGATCCCCGAGGAAGACAAGAAAATTATCATGGACAAGTGTAACGAGGTGATCCGTTGGATGGACTCGAACCAGCTGGCTGACAAGGAGGAGTTCGAACATAAGCAAAAGGAGCTTGAAGGCGTCTGCAACCCCATCATCACCAAGCTGTACCAGAGCGGT
>MF207496.1 Uncultured bacterium clone denovo1205_590_10496 16S ribosomal RNA gene, partial sequence 
GTTCCTACGGGGCGCAGCAGTGGGGGATATTGGACAATGGGGGGAACCCTGATCCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTGTCAGCAGGGAAGAAAGCAATGACGGTACCTGACCAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGACAGTCAAGTCAGCGGTAAAAATGCGGTGCTCAACGCCGTACAGCCGTTGAAACTGGCAGTCTTGGGTGGGCGAGA
>XM_015122060.2 PREDICTED: Macaca mulatta SMG7 nonsense mediated mRNA decay factor (SMG7), transcript variant X2, mRNA 
AACTTGGAGGTCTGCCTTTAATAATCAAGCAGGATCCCCACTGCGGGTGCCTATCAGAGTTATGGCGATAGTCAGCCTTCCGGTTAGTCCCCGACTTAAATGATAGAAAACACGTGTTACCCTTCTAGGATGCATTCCTACCCTCACCCTGGCCTCGCAGCAGGATCGCGACAGCTAGGTCAGGAGGGAGTACGCGGGTGGGGTGGATTTGGGGGAGGGGTTGACTCGCCAAAAGTCGGCTATCCCCGTCGGCAGGGGAGGCATCACGGCTGTCGTGTGCCGCTCTCCTCCCTCAGGGACCCCGTTCAGGCGGGATCCCGCCTCCCAGAGCCCAAGGCAGTTGTGGGGAAACCCCTTGCCCTTCCTCGCCGCTTGGCACTGCCGCCTCGCTCTCCCGACTCCAGCCCGCCGCCCGCCAGCCTCCAGGCCATGCATCTTCTTCGCAGGCCCAGCCCTCTCCACGCCCGGCTCTGAGAGGAAACTATGGAGGTGGTTCCCGCCTGCAGGCGGGTGGAAAAGCCCATGGTGAATGTCTCGGGGTGTCCCCCCAGTTGCTGTGAGAAGTGGGAAGGGAGGAGGAAGTGGACTTCACCACCGGGGAGAACTACCTCTATTCCTAACTTGGGGGAGGCCTTTAGATGGAAGGGATGCCAACGGGGAACCCTGGGCGGTTTCCAGGGAATCCATTGGCCAAGGGGAGGGTCACCCTGTCTGCACACACTGGTTACTATGACAATACAACCACAGCCTCCAGTTGCCATGGCAGCTGTCTATCCAATCCGATTCTTTTCTTTTCTCTTCCTCTCCGGGCCCCACCTTATCCCCTCCAAGAGTCTCCCAGCGTGCATGGGGAGGGGCTGCAGAGAAGAGGAAAGGGGGTCCTTCGAGTCACTCTCTACGCGCGAGAGAAGACAAGAGTCGAGGGACTGCTGGGAGGAACTGTAGGAGGAAGGGGCGGCGTTTCCGGTGGGGAAGAGTGGAGGCGTGCAAAAAGGAAGAGAGAAATCCGCTGGAGTGATAAGAAGGGGGAAGACTTTGAGTGTAACTCCCGGTTCTTTGGGCCTCGGTGTTCTTGGTGGGGTTGGGATTGCCCCCTTGCGCGGGAGGAGAAGGGTGGATTGGCAGGAAGCCTCCAAGCGCCACCAGCCGGTAGCTCAGAAGCCGCACACGCGCCACACAGCTTGTTGATCCCAAAAGGGAGCGCTACAGAGAAGCGGAAATCACCGGGAGAGACAGGCGCTGCTGAAATCTCGCGAGAGGGAGCCCCCCTCGTAGCCGACTTCCTTCCTCTGCTTCTCCTCTTTCCCCCGCCCCTCCTCCCTCCTCCTCCCCCCCTGGGTCGGAGTGTCCCTGCGCCCCACGGGCCGGAGCAGCAGCGAAAGCAGCTTTCCCCGCTCCCTCCCCCTCGCCTCATTCACCCCCACCCCCTTGCCGAGCGAGGAGGAGCCGGAGGAGAGGAAGATGGCGGCGGCCGCCAGCACCCGCGGTGCCGCGGGGCCGCTCCGAGGAGCCTGAGAGACCCACGGAGGCTTCGCGGGAAGACGCGGCGGCGGAGGATGAGCCTGCAGAGCGCGCAGTACCTCCGGCAGGCAGAAGTCCTGAAGGCTGACATGACAGATTCTAAGCTGGGTCCAGCTGAAGTCTGGACATCCAGGCAGGCTCTGCAGGACCTGTACCAGAAAATGCTAGTTACTGATTTGGAATACGCTTTAGACAAGAAAGTAGAACAGGATCTCTGGAATCACGCCTTTAAGAATCAGATCACAACACTACAAGGCCAGGCAAAGAATCGAGCAAATCCGAATCGAAGTGAAGTTCAGGCAAACCTTTCTCTGTTCCTAGAGGCAGCTAGTGGCTTCTATACCCAGTTATTACAAGAACTGTGTACAGTATTTAATGTAGATTTACCATGCCGTGTGAAGTCTTCCCAGTTGGGAATTATCAGCAATAAACAGACGCATACCAGCGCCATAGTGAAGCCACAGTCTAGCTCCTGTTCCTATATCTGCCAGCACTGCCTCGTCCACCTTGGAGACATTGCTCGATACAGAAACCAGACCAGCCAGGCAGAGTCCTACTATAGGCATGCAGCTCAGCTTGTCCCCTCCAATGGTCAGCCTTATAATCAGTTGGCTATCTTAGCTTCTTCCAAAGGAGACCATCTGACCACAATTTTCTACTACTGCAGAAGCATTGCTGTGAAGTTCCCTTTCCCAGCTGCCTCCACTAATCTGCAAAAAGCACTTTCTAAAGCACTGGAAAGCCGAGATGAGGTGAAAACCAAGTGGGGTGTTTCTGACTTCATCAAGGCCTTTATTAAATTCCACGGTCATGTGTACCTGAGTAAGAGCTTGGAAAAGTTGAGCCCTCTTCGAGAAAAATTGGAAGAACAGTTTAAGAGGCTGCTATTCCAAAAAGCTTTCAACTCTCAGCAGTTAGTTCATGTCACTGTCATTAACCTGTTTCAACTTCATCACCTTCGTGACTTTAGCAATGAAACTGAGCAGCACAGTTATAGCCAAGATGAGCAGCTATGTTGGACACAGTTGCTGGCCCTCTTTATGTCTTTTCTTGGCATCCTGTGCAAGTGTCCTCTACAGAATGAGTCTCAGGAGGAGTCCTACAATGCCTATCCTCTTCCAGCAGTCAAGGTCTCCATGGACTGGCTAAGACTCAGACCCAGGGTCTTTCAGGAGGCAGTGGTGGATGAAAGACAGTACATTTGGCCCTGGTTGATTTCTCTTCTGAATAGTTTCCATCCCCATGAAGAGGACCTCTCAAGTACTAGTGCAACACCACTTCCAGAGGAGTTTGAATTACAAGGATTCTTGGCATTGAGACCTTCTTTCAGGAACTTGGATTTTTCCAAAGGTCACCAGGGTATTACAGGAGACAAAGAAGGCCAGCAACGACGATTACGACAGCAGCGCTTGATTGCTATAGGCAAATGGATTGCTGATAATCAGCCAAGGCTGATTCAGTGTGAAAATGAGGTAGGGAAATTGTTGTTTATCACAGAAATCCCAGAATTAATACTGGAAGACCCCAGTGAAGCCAAAGAGAACCTCATTCTGCAAGAAACATCTGTAATAGAGTCGCTGGCTGCAGATGGGAGCCCAGGGCTAAAATCAGTGCTATCTACAAGCCGAAATTTAAGCAACAACTGTGACACAGGAGAGAAGCCAGTGGTTACCTTCAAAGAAAACATTAAGCCACGAGAAGTGAACAGAGACCAAGGAAGAAGTTTTCCTCCCAAAGAGGTAAAATCCCAGACAGAACTAAGAAAGACTCCAGTGTCTGAAGCCAGAAAAACACCTGTAACTCAAACCCCAACTCAAGCAAGTAACTCCCAGTTCATCCCCATTCATCACCCTGGAGCCTTCCCTCCTCTTCCCAGCAGGCCAGGGTTTCCACCACCAACATATGTTATCCCCCCTCCTGTGGCATTTTCTATGGGCTCAGGTTACACCTTCCCAGCTGGTGTTTCTGTCCCAGGAACCTTTCTTCAGCCTACAGCTCACTCTCCAGCAGGAAACCAGGTGCAAGCTGGGAAACAGTCCCACATTCCTTACAGCCAGCAACGGCCCTCTGGACCAGGGCCAATGAACCAGGGACCTCAACAATCACAGCCACCTTCCCAGCAACCCCTTACATCTTTACCAGCTCAGCCAACAGCACAGTCTACAAGCCAGTTGCAGGTTCAAGCTCTAACTCAGCAACAACAGTCCCCTACAAAAGCTGTGCCGGCTTTGGGGAAAAGCCCGCCTCACCACTCTGGATTCCAGCAGTATCAACAGGCAGATGCCTCCAAACAGCTGTGGAATCCCCCTCAGGTTCAAGGCCCATTAGGGAAAATTATGCCTGTGAAACAGCCCTACTACCTTCAGACCCAAGACCCCATAAAACTGTTTGAGCCGTCATTGCAACCTCCTGTAATGCAGCAGCAGCCTCTAGAAAAAAAAATGAAGCCTTTTCCCATGGAGCCATATAACCATAATCCCTCAGAAGTCAAGGTCCCAGAATTCTACTGGGATTCTTCCTACAGCATGGCTGATAACAGATCTGTAATGGCACAGCAAGCAAATATAGACCGCAGGGGCAAACGGTCACCAGGAGTCTTCCGTCCAGAGCAGGATCCTGTACCCAGGATGCCATTTGAGGACCCCAAGAGCTCCCCTCTGCTTCCTCCGGACCTGTTAAAGAGTCTGGCTGCCTTGGAGGAAGAGGAAGAGCTGATTTTTTCTAACCCTCCTGATCTTTACCCGGCTCTGCTGGGGCCTCTCGCCTCTCTTCCTGGACGAAGCCTTTTTAAATCCTTATTGGAGAAGCCCTCAGAGCTCATGTCACATTCATCCTCTTTCCTGTCCCTCACCGGATTCTCTCTCAATCAGGAAAGATACCCAAATAATAGTATGTTCAATGAGGTATATGGGAAAAACCTGACATCCAGCTCCAAAGCAGAACTCAATCCCTCAATGGCCCCCCAGGAAACATCTCTGTATTCCCTTTTTGAAGGGACTCCGTGGTCTCCATCACTTCCTGCCAGTTCAGATCATTCAACACCAGCCAGCCAGTCTCCTCATTCCTCTAACCCAAGCAGCCTGCCCAGTTCTCCTCCAACACACAACCATAATTCTGTTCCATTCTCCAATTTTGGACCCATTGGGACTCCAGATAACAGGGATAGAAGGACTGCAGATCGGTGGAAAACTGATAAGCCAGCCATGGGTGGGTTTGGCATTGATTACCTCTCAGCGACGTCATCCTCTGAGAGCAGTTGGCATCAGGCCAGCACTCCGAGTGGCACCTGGACAGGCCATGGCCCCTCCATGGAGGATTCCTCTGCTGTCCTCATGGAAAGCCTAAAGTCTATCTGGTCCAGTTCCATGATGCATCCTGGACCTTCCGCTCTGGAGCAGCTGTTAATGCAGCAGAAGCAGAAACAGCAACGGGGACAAGGCACCATGAACCCTCCACACTGAGGCCAAAGTGACAACCTGGGAATGAAGGCTCCATAAACCATGGCATGTTGGGTTTGCAGGACTGGCCCACACAGTCCCCTGCAGGTGGCAGCCCTCTTTTCTGTTTCTTGCTGTCAAGAGGGTGTAAGTATTCCACCAGCCCGCTGAGTGTGCACGAAATGTTCGCAGTGCAACAAAAAGAAAAATCCATCAGGAACTCTCCATCCCCCCGGGGCCTTCCGGAGGGAGAGAGAGAGGAACTGCTGTTTATCTCACTCAGTTACTTGGTATCACCGCCTCTCACCTTCTCCATCGTGCATGTCCCCAGCCACATGGGAAGTGAAAGCTGAGAAGGGAAGGCAGATGGGAGAAGCCAATGGGAACTTCTCAGTCCTTTTTCCCTCTTTGGGGAATAAAATAGGAATCCATTAATGGTTGCTTTGCTGACTGA
>XM_048567351.1 PREDICTED: Pyrus x bretschneideri alcohol dehydrogenase 1-like (LOC125469685), mRNA 
ATACGATTCACTTTCAAGATGCCTTAATTCATCAAAGTGTTCTAGAGAGAGAGAGAGAGACTCATCTTCTCTCTCCTAAGAATAAGTTAACAGAGAGTCCCGTGGAGTAGTTATTGGAGGCCATTTTTTCTCAACATCCTCCCAAAAATAGGCAAAGAATTGCTCTTGACCTTTGATATTATATTTCACCATCTGTGTTTGCCAATTGGCATTTTCATCTTTCTTTTTTCTTTCTAAGTAGAACACTGTGAATTACACACCATGCACAAAATGCATAAGAGTTTTAGAACATTGGTGCACAATGACCATTTCTTGAAGCTCCTAAATAACCAAAAATCTAGGTTCCTCAGACCGGAACTTTACAGCACTTCGGCTCATGCTGGCCGTGCGATCACCAGCAAAGCGGCTGTTGCTTGGGAAGCAGGGAAGCCCTTGGTGATAGAGAAGGTGGATGTTGCTCCACCGCAAGCCAATGAAGTTAGGGTCCAAATCAAATACACCTCTCTTTGTCACACTGATATCTACTTCTGGGAAGCTAAGGGCCAGACACCATTGTTCCCTAGGATTTTCGGACACGAAGCAGCTGGCGTCGTTGAGAGTGTTGGTGAAGGCGTTAAGAACCTCAAGCCGGGGGATCATGTGCTTCCAGTTTTCACTGGGGAATGTGGGGATTGTCCACATTGCAAGTCTGAGGAAAGCAACATGTGTGAGCTGCTGAGAATCAATTGCGATAGAGGAGTCATGATTGGTGACGGGAAAGCAAGGTTTTCGCAGAATGGGACTCCGATTAATCACTTTCTCGGCACATCCACGTTTAGCGAGTACACAGTTATCCACGAAGGCTGCCTTGCCAAGATCGACCCAAAGGCACCATTGGATAAAGTCTGCATCCTCAGTTGTGGTGTGTCGACTGGCTTAGGTGCCACTCTGAAAGTAGCAAAACCAAAGAAGGGTTCTTCAGTTGCTATCTTTGGACTTGGAGCTGTTGGCCTCGCTGCTGCAGAAGGTGCAAGGATTTCTGGGGCATCAAGGATTATTGGGGTAGACTTGAATCCCCATAGATTTGAGCAAGCCAAGAACTTCGGAGTAAACGAGTTTGTGAACCCGAAAGACCATAACAAGCCAGTGCAGGAGGTTATCGCTGAGATGACGGATGGTGGAGTTGACAGAAGCTTAGAGTGCACCGGGAACATTAATTCGATGATCTCCGCTTTCGAATGTGTTCATGATGGGTGGGGTGTAGCGGTGCTTGTAGGAGTGCCAACCAAAGATGCAATCTTCAAGACAAACCCCATGAAAGTACTTGATGAAAGAACCCTCAAAGGAACATTTTTCGGCAACTACAAGCCTCGGAGCGACCTTCCCTCTCTCGTGGACATGTACATGAACAAGAAACTGGAAGTAGAGAAGTTTATAACGCATCGACTTCCTTTCTCGGAGATCAACAGAGCTTTTGACCTAATGTTGAAGGGGGAAGGCTTGCGGTGCGTCATTAGCATGGAAGAGTAGGATTAATGTCCAAATTCATATACGA
>XM_039052777.1 Cantharellus anzutake uncharacterized protein (EI90DRAFT_2259046), mRNA 
GAAGTGGGTATAATGTACTTGACCCATGGTTTGAGAGAACCATGAACTGTCGGAAGTGATGTCCAACAGTGTTCAGTACCCCATAACTGCGTGCAGAGAGACCGAAAACGACTCGGGAGAAGCGCTTAAGCAACAAAGCGGTAATCGAAGTGTTGCAGGCACCAAGAAGGGCATGTAACTTAGGTATTTCAGGGCCTAGAGTCCACATATTCGTAACCGGAATGACACCGCTAAGGTATGATATCCCCATCACATTCGCGTCTGCTGGAGTGCTCCATTGACGAGATAGACAACGTGTCTCCAGTATCGCTCAGGTCCGTCTATCCATGCCGTCGCCCCAACACCCCACCAGGAAGGGGAAGAGGAAACACAACGGTTTGGAGGCCGTGGAAATTACCAACGGGCCTGCATGAAGCACGAAGTAGCCCAATGTGCGATTCCAAGCATTTCTCAGTTGGTGTATTCCCAGATCCATGTGATCTTGCCGAACAGGCTGACGAAAAGAGCGCAGTTAGAGCGCACTACCACCGCGGTCCCTCGCCTCTTGAGCCCAAGGAGGAGGCGATTTGTAAAGTCCGTGCACGGCATATGATCTCACCCCGGATGCTCGCAGGCATTGTAACATCCCAAGGTAAAGAAGACTCCCGACCCCGGACATCCGGCACTGACCAGGGAAGCCTGCAAGATGTAGCCCTGATCGCCAGCAGGGGGGTTTTATAACCTCCAGAGTTCGGTCCCACCCCCAATCGACGC
>XM_046171703.1 Alternaria rosae uncharacterized protein (BKA58DRAFT_402161), partial mRNA 
ATGAATCAGAAACACGTTCCAGTCACTTCAACGCAACTACACACTTTCAACTGCGAGGTCTCAGGTGCGGCTCAGAAAGACATTTACCAAAACGACAGCAAACATCCCATCGGCTTCAACACTCAACATTCAAAACGCCATGGCAGCCTTCCATGGACCCTCAACCACTCCATTAAGCGAGCTGAACTCCTCAGAGTCTGGCAAAGTCGTTTCATCGAGCGATTCGAGAGCGTGAAGCAGCTGACCGTGGGGAACCTCGCTGCACTGCAGGCTGGTTACAATGACGTACAATCTCAGCCTACATCACCTCTAGACGGCGAGTTGCACCTCAGACCGTCTCCCGGTGCAACGGCATCTCTCATCAAACGTAAGCCGCTGCCAGATACAGCGCAAAAAGCAATCATAGAGATGAGAAATGAGACCGATGTAGAGTCGTTTGGAAACAGCGGAGATGAAGCTTCCCATCAAAACCACACACTTGCGCATCCAACGCACGGCCGCAGGCCGTCTTTCCATCGCACGAATACCGTGTTCACGGATTTCTTGCCTTACAACCAGGTGCGAACCTGGCAACAGGTTGATAATGAGGAATATCAAGACCGTTGTAGGCATTCCTTATCAGCTATTGCGTTGGATAGAATGAAAAAGCTCAATCTAGACCGCGATACACTATCGGCTCAAAGGAAGAAGACTGCAAATCAGTTGAAGAAAGTGATCGAACAGCACATACTTGACAAGGAGAAGTCAATTTCATAG
>XM_004366041.1 Dictyostelium fasciculatum hypothetical protein (DFA_12355) mRNA, complete cds 
ATGGAGGATCAGAGCAGTCCATTTCTTGTCGATACAAAAGATACAACAACGACAGATACAACTCAACAACAACAACAACAACAAGAACATGTTCAACAACAAACAGCAGGTCAACTTGACGATAGAGTTGATCAAGAAGAATCGATAACTATGGGTGATGATCAAAATATATCAAGACAACAACGACAAAGAAGACTACTGTTGGTGAGCAAACCAAGTGCATTCTCGGTTGGTTATGAAAGAATAATGAAAAGATACTTTAAAGATTATGAATCATTGATGAAAGAGCATTTCAAACAACTAGAAGATCCATTAAAAAAGGTTAACTTGATTGATAGAAGAATAGAGAAACAAAAAGCTTGTATACCTAGAAATGTGGCATTGTTACAATGGATTATTCAAGGTCAAACAAATCAAGATCAAAGATTAAAGGTGATATCACCACCAAATTCATTAGAGTCATCACCATCTGCGTCACCTTCATCAAAAGATGGTGCTCTTTCATATCAAGAACAACAACAACAACAATTGTATGATGAAGAGAATGATGATATTGATAGAGATGATCAATTCCCAAATGAATTCACATCAGAGGATATAAAACAAAAATTGGAAACTTGTTTAACAAATATTGTTAGAGATTGGAGTTTTGATGGTAAAAGAGAAAGAGATCAAACCTATTTACCAATTTTAAATGATTTACAATCAATTTATCCATTGGAAAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATAATGGAAATAATAATAGAAATTCAATTAAAGTTTTATGTCCTGGATGTGGTCTTGGTAGATTAGCATATGAAATAGCATCACTTGGTTTTGATACAGAATTAAATGAACAATCTATATTTTTTATTATACCTCTAAAGAAAATATTAACAACAGAATTTGAAAATATTGAATCAAAGACTGTATATCCATACATTTCAATTTTAAAGAATACTAAAAGTATAGATTCAATTACTAAACAAATCAAGATACCGGATATCATTCCAGACAGAACGGTGATTGATAGAATGACATTGGCAGAAGGTGATATTTTCGAGTTTTATGAAAGCACTACGCAGTGCTACCAATACTTTGATGTTGTTACAACTTGTTTCTTTATCGATGTAGTTTTGGATATTTTACAACTTTTCAAAACCATTTCATCGGTCATCAAACCCGGAGGCTATTGGATCAACAATGGTCCATTATTTTATCATTTCAATGAAACTTTAAATCTTTCATACGATGAAATTATTATATTGGTTGAATCGTATGGTTTTACAATTCTTAAAAAAGATATTTTACTAGGTTTATCATATACCAATAACAAAGATTCATTATATCATCCAAATTTTGATAGTGTATACTTTGTTGCAAAGAAAAATACAATCAACAACAACTAA
>XM_023231809.3 PREDICTED: Piliocolobus tephrosceles aminomethyltransferase (AMT), transcript variant X2, mRNA 
GAACCTGGGAGGCGGAGTTTGCAGTGAGCTGAGATCCGGCCACTGCACTCCAGCCTGGGTGACAGAGCCAGACTCCGTCTCAAAAAAAAAAAAAAAAGAACTGGGACCCTTCTGCCATCTGACATAGTCCAAAGCACATCCCTATCCTTTCTCCCAGTTGTCTCGCTCCTTTTTTTTTTTTTTTTTTTTTTGTTGGAGTTCTGCTTTTGTTGCCCAGGCTGGAGTGCAATGGTGCAATCTCGGCTCACTGCAACCTCCACTTCCCAGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCATGTGCTGCCACACCCGGCCTGCCCCTTTCCAAGAGAGATGCTCAGCATGATGAGAGATCAGCCAGGGTAGGGAATGGGTCCGAGTAAGGGTTTGCATTGTTGCCTTTTAAGAGGCCTAGGTCCTCCATTAACTCAGGCCAACCATTAAGTGATGCAGGCTGCTCTTCCTTCATGTGAGAAAAACCTGTTTCCCTCTGGTTCTTCCTGACTTTGCACCTGGTGGCTATTATGAAGCAGTACTGCAGTATGTCTTGGACCTGGAAAGTTGGACATGCGTGCGGCTCAACAGTTTTCTCGGAAGAGTTCAGTGACCTTTTGGTGGCCACCCTCTGCTCTTACCTATGAGTTCTTCCAGGTGGCGACTTTACCTGCAAGGTCACTTACATAGCCCCACTCAGCTGCTTTGGAAAGCATGATGGAGCAGTAGTCCTCAATGTGTGTGTGAGTGAAGAGGACCTTGTGGTAGCAGGGACCATGCTTCATTTGTGGCTGCATCCCCGTCCGAGGGCCTGGTATGCAGTAAGATCAATACATACTTGTGGAATGCATGACTCTGTTGGCTGCCTGTGTCTGCCTGGTGGGAGAGCTGTGGACCTAGGGGTCCACATGAGGCCAGACTACTGTGGTGCTGCCTACCTGCAAGGCTGGCTCCACCCTGCTGTGACCTCTCCACCTTCCCCACCCCTACTTGACCTTACTCCCTTGAGGTCCTAAAGGTACGATTCAGACCTTTCCGCCCTTTCTGGAACTTTGACTGTTTGGAGACAGGGCGGTTCGGAGACAGGGCAGTTCGGAGACAGGGCGGTTCTGCAGGGGGCAGTCTAGCCCCTAGCTCGCTTCTGGGCAGCCCAATCAGCTCTGGATTGCCCAAGCTGCCCTGAAAAGCCAGCCGAAAGAGCCGGAGGCTGCTTCCCTATGGTTGGGAGTTCCTGCATTCTCTGCTCTAAATCCCAGCCTGCCCTCGGGGCTGCCCACGCCCCCTTCAGATCCTTTGCTCCGGAGAGAGACCTGTCCGAGCAGAGGCCTGGACTACATCTCCCGGCGTGCCTGGCAGTGTGGTGTCCTCTGTGCGCCATCTGTACTTGTTGCAGGCGACGATGCAGAGGGTTGTAAGTGTGGTGGCCCATCTGGGCTTTCGCTTGCAGGCATTGCCCCCGGCCTTGTGTCGTCCACTCAGTTGCGCACAGGACGTGCTCCGCAGGACACCGCTCTATGACTTCCACCTGGCCCACGGCGGGAAAATGGTGGCGTTTGCGGGTTGGAGTCTGCCAGTGCAGTACCGGGACAGTCACACTGACTCGCACCTGCACACACGCCAGCACTGCTCGCTCTTTGACGTGTCTCATATGCTGCAGACCAAGATATTTGGTAGTGACCGGGTGAAGCTGATGGAGAGTCTAGTGGTTGGAGACATTGCAGAGCTAAGACCAAACCAGGGGACACTGTCGTTGTTTACCAACGAGGCTGGAGGCATCTTAGATGACTTGATTGTAACTAATACTTCTGAGGGGCACCTGTATGTGGTGTCCAACGCTGGCTGCTGGGAGAAAGATTTGGCCCTCATGCAGGACAAGGTCAGGGAGCTTCAGAACCAGGGCAGAGATGTGGGCCTGGAGGTGCTGGATAATGCCCTGCTAGCTCTGCAAGGCCCCACTGCAGCCCAGGTACTACAGGCCAGCGTGGCAGATGATCTGAAGAAACTGCCCTTCATGACTAGTGCTGTGATGGAGGTGTTTGGCGTGTCTGGCTGCCGTGTGACCCGCTGTGGCTACACAGGAGAAGACGGTGTGGAGATCTCGGTGCCAGCAGCGGGGGCAGTTCACCTGGCAACAGCTCTTCTGAAAAACCCAGAGGTGAGGCTGGCAGGGCTGGCAGCCAGGGACAGTCTGCGCCTGGAGGCAGGCCTCTGCCTGTATGGGAATGACATTGATGAACACACTACACCTGTGGAGGGCAGCCTCAGCTGGACACTGGGGAAGCGCCGCCGAGCTGCTATGGATTTCCCTGGAGCCAAGGTCATTGTTCCCCAACTGAAGGGCAAGGTGCAGCGGAGGCGTGTGGGGTTGATGTGTGAGGGGGCCCCAATGCGGGCACACAGTCCCATCCTGAACATGGAGGGTACCAAGATTGGTGCTGTGACTAGTGGCTGCCCCTCGCCCTCTCTGAAGAAGAATGTGGCAATGGGTTATGTGCCCTGCGAGTACAGTCGTCCAGGGACAATGCTGCTGGTAGAGGGTTCCTGAAATGCCGACCCAGTGCCTGCCTTCCTGGCCTCCAAGACAAGCTTGGAATAGGTTCTCCTTGAAAGGGGCCAGTCTATAAGAATGGAGATATTGCCCATTGGGCACCCCATCCCTGCTCCTCCAGGGAGCTGGCATCACCTCTCCCCTCCCTGCAAGTTGTTGCATCTGGGTCCCAAGGGGCAACAGCTTCCAGGATGTTCTCTCTCTCACTGCCCTTGTGCATGCATACCCTTGTTCTGTCTGAATAACCACAACAACTGATGCACTTCCGTGTTTAATAAGCCACATCCTCAGTTGAGCCTGAGGTGAAATGTGA
>XM_035095448.1 PREDICTED: Chelonus insularis structural maintenance of chromosomes protein 5 (LOC118074325), mRNA 
AAAAATAGAAGACAATAGCGGTATGACAAAGAAAGATCGGAAAGGAAATGCGCAGTTATTCAGTTTCCCTCTAAAAAAGTAACGTAGAGGGTTAAAACAATTCGTTCGTGAACTTTACTTGTTTATTCGTGATGTAATTAAACTTTTCAAAATGACAAATACGGACATCATAAGCCAAGGAATCATTAAAAAAATTTTCCTGAAAGATTTTATTACATATGATGAGATAGTTTTCTTGCCTGGAAGATACTTCAATGTTGTCATAGGACCAAATGGTACCGGTAAGTCTACACTCGTAGCAGGAATAGCCTTAGGGCTAGGAGGATGTCCTAAAGATCTTGGTAGAATTGGTGAAATTTCTCAATACATAAAAGGTCAATGTGAAAAAGCATTGATTGAAATTGAACTTGAAAATGGACCGAACGAAACTGTCAAAATCAGTCGCATGTTCAATACAAGGAACAGGTCTACATGGATGATTAATGGAAAAACTGTTACTGAAGCTGAAGCTCAAGATTTGATTGCAAAATTCAATATTCAGGTGAACAATCTTTGTCAATTTATACCGCAAGAAAAAATTAATGATTTCGCAAAAATGAGCCCACAGGAGCTGCTATTAAATACAGAAAAGTCTGTAGGAGATCCAAAAGTATATGATTACCACATGCAATTAATAAGAAATAAGCAAAAACAAGAAGAAATATCTAACGAAATTGGTCAGAAAAAAACTGTGCTTGAATCTGATACTCAAAAATATCAACAATTAGATGAAATTGCTTCACAATATAGAGAAAGAAAAGCAATTATGAAAAAAATAAAAAATTTGGGACAAAAAAAAGCTTGGGTACTGTATGATATGACAAGAACAGAACTGATTAATTTGAAACATCAAAGCAATGGTCTTAAGAGTCAAATATCTGATCTAAAATCGACTTTGGATCCCATTTTAAGTCAAATGAATGAAAAAGGCAAAAAAATAAAAGAATTAGAAACTTCTGTTCAATCTTACAATCTACAAATTAAAAATTGTGAAACTAAATTATTAAAAAATATTGAAACTATTGAGAGTCTTCATCTTAATGTAATAAATATAAAGAAAAATTGCAAAGAAGAACTAAAAATGGAAGAAAGTCGAGATAAATCTATTAAACTTGAAGAAACACATAAAAGTAAATTAGAAAATGACATGCAGCTATTGATGGAAGAAATCGGTACTGAAGAATCAGTTCATAAAAAATTACAAGTAATCAATGATAAAATAAACAACGAAAGAAAAAAAATGGATGAAATTAATAACGAAGCTGTATTTTATAGAGAAAAGTTGAATCTTGTAGCACGTAAAATACATCAACTAGAAGGAGAATTAAAGCAGCTTAGCGATGTTCAGTCGAAACGTTTAGATTTACTTCGTTCTATGAATTCACATGCTTATGAAGCAGTTATGTGGCTTCGAAATAATAGAGATAAATTTCGAAGTGTCATTTATGAACCTATGATTTTACATATCGATATTAAAGAACTTAAATATGGTAAATTTTTTGAAAAGATAATTCCTAGACGAGATTTGGAAGCTTTCGTTTGTGAAGATAAACAAGATATGAATCTTTTATTAAGATATTTACGCGATCAGCAAAATCTAGTAGTCAATGTAGTCCATTCTGATTCAACTGAATCATTAAGTACTGTACCCAGGATACCACTCAATAATCTTACACGATACGGATTCTATTCTTATGCAATTTCTTTTATTTCTGCTCCTGACTTAATTATGAAGTATCTAATAAAAACATACCATATTCACAATATTCCATTTGGTACAGCTGCTGTAGACGATAACATTGATGCAGTGCCTACTGAGTTATTCTCTTTTTTCAGTCCTAATTATCATTATAATGTTCGAGTATCTAGGTATACTAAAGACAAATCCACACAAATTAATCCTTTGCCAAATCATGTACGAATGTTTTCTATTGTTGTGGATCATAACAAAATTGCGGAAAATACTCAATTATTAGAACAAAGACGAAATGAGCATGCACAACATGAATCGAAATTAAGAGAGACTGAAACAAAGTTGATGGAATATAACGATAAAATGGAATCGCTTCGTAAGTCAAGAAAAGATTTAGATACTAAGAGTAAACAAATTCAGATGCTTAATAGTCAAATCAAAAGGAAAACTAATGAAATTATACAGCTTCAAAATCAACGAAGGAGTTTTGAAGATATTAAAAATGCTGCAAATAATGCAATACTAAGTGTTTTGAAAAAACAAACAGAACTGTATAAAGAATGTGCTGGAGAGCATAAAAAAGCGATTGACATTATTAAACAATCGAAAACTAACAATTTTTTATTGAAATTAGCAGAACGTGAGTTAAAAAAAATTTCTGATAGTTCGAGACAATATAAAGACCAACTACAGGAAGTGGAGAATGAATTCAGAACATTGGCCAGGCAAATAGAACCAATGCAAGTTGAGATTAAAAGATTGCTTGGTGAAGCTATACGTTCCACAGACAATGTCAGTTCTAGCGATAGAGCAGCATTTGCTAAATATGAAAGAATCTTTGCTAAATTACCTCCGACAATTGAGGAGATAGACGAAGCTATTCAGTCAGCTAAAGCTCGACTTTTCTGTGCAGGTGACACTCATCACGGCGAAGAAATCCTTGAAGAATGTGAATTAGTTAAACGAAAAATTGAATCACTTAAAGTAGAGATAGAAAAATTAGAAGAAACATTAGCGAAAAATAAAAGAGATACAGAGGAGTTACGTGATCAGTGGTTACCACTAATTGAAAAGCTTACTCGTACGATTAATGGCAAGTTTTCAAATGGTTTCCAATCAATTGGATGTGTCGGTGAAATACAACTCAAACATAATGGAAATCCGATGGATTTTGATCAATATGAATATAAAATTTACGTTAAATTTCGAGATGTTGATGATTTACAAGAGTTCAATATAAACCGTCAAAGTGGTGGTGAACGAGCTTTTACAACTGCTGTTTACATGCTGTCTCTTCAAGAGATGTGTCGAGTGCCATTTAGAGTTGCTGATGAAATAAATCAGGGTATGGATGCTATTTATGAAAGGAAAATATTTGATAAACTTGTTGAGCTTACGTCAACAGCACATGGATCACAATATTTTTTGATTACTCCCAAGTTACTTCCTAATTTACAATACAACGAAAATGTAAGAGTTCATGTTGTTCACAATGGGCCATATATTATTCCATATGATAGATTCAATCTACAAGATTATTGTGCGAAATTGGAAAGGAATTAATTATCTTTAACTATATATTGTATTATATTTTTGTTCTTTATCATTTTTATTTGATTGTTTTTAATTATGATCTCGTTAAAACTGACAAAGTCAGTGTACGCATTTCCAATACATGCAATATAATTTATCTTTGAGTATTGCATTGACTATTATCTTACTTTCGATTTATTATTATTAAAAAAAATTTCTCAAGTATTATTCTATGAAAATAGCTTTGCTTGATTCTGTTTATTTTATGAGCCAGACAAAAATATTGTAGAAAAAATAAGCAAAATAATTACTATCAAGAGTTTTAATCA
>XM_013003374.1 PREDICTED: Erythranthe guttatus uncharacterized LOC105977970 (LOC105977970), mRNA 
CAAAAACCTCACCAAATTTCCCCAAAATTGATTCTTTCGTTCTTCACTCAAATCAATGGCGTTGTCGATAATCCAATGCCCTAAACACTCAAAGTTTCCGCCCAGCAATTATTTTCTGAAAGCAAATTCACTCCCACTTCACCCCACATTTGTCAGGTTTTCCAGATTACAGCCAATCAGCAGCAATCGGGTGGTTTGCGCCGCATTTTCTGCCGCCGGTGGTTCCGGTGCAAACGGCGATGTAAACCCTTACGAGGTTCTTGGTGTAAATCCTCTAGAGGGATTCGACATGGTGAAGGCGGCTTACACGAAAAGGCGCAAGGATGCTGAGAGGAGAGGCGATGAAGCTGCTGCAGCACAATTGGAAAAAGCATACGACACTATAATGATGTCTCAATTGAAGAAACGGAAGAAGGGCGAAACTTTCGGTCCGTTTCGGGTTTCGAAAGATATAAAATATGCCGATAAGCAGCCAATTGTTCCGTGGGGCCCAAGGTTTGCCAAATCGGAGGTCAAAGATATTCGAATCAACATGGCAATATCAGCTGTATTTACGGCTTGGATTCTTATCAAGGGCAGTGCCGAATACAAACCTTTGCAATTCTTGGCCTTTGTTTTCGTTTATCGGATATTTGAGAAGTTAAAGTCGTTCGAATCACCTGCACCTACCACATTTACAGAAGAAGGTGGTGAGGATGAAGGGAGAATGTTGAAAATGGGCAAAAGACTGCTTCGATCACTTGCATTGGGTTTTGGATGCGTCGCTTTTGCCTCTTTGGGGTACACTGCAGTGTTGAATTGTATTGAATTTGCAGCTGGCTATATACCTATTTTCTTGTACAACAACCAGGAGTTGTTTGTAACTGCGTCAACGGCACTAATGCTTTATGTTCTAGCTTCGTACTACAAATGAAAATTCTGCATCTATCAAGGGAGGATTGAAGATCGATTTATTTTATTTGGAATTAATTAGACGAATAATTCCGTGTTTCAAGATTTAAATTTTGTATATGAGTTCAAATTTTGGGACTTGATTGTAATGTGTTTAACTTGTTAGTGATATTGTTTGCGACTCCGAGTCGAAATCGAGAAAGTAAGGAACAAAATAGTTGCGGGTTGTGTGCTAAAAAAATTGCATTTTATA
>MW016101.1 Clionaida sp. 1 JV-2020 voucher UF 3823 large subunit ribosomal RNA gene, partial sequence 
GAGCATGAAATCCCTGGCAGGTGCTGTCAGAGAATTGTGGCCGGGAGAGGCGGTGGAGCTCCGACTGTTGCTGTCGAAGTTGACCTGGAAAGGCACGTCAGAGAGGGTGAGAGCCCCGTGGTCGACACCGACGGGAAGGGCCGTAGCCGTCTTCGGAGAGTCGGGTTGTTTGGGAATGCAGCCCAAAGTGGGTGGTAAACTCCATCTAAAGCTAAATACTGGCACGAGACCGATAGCGAACAAGTACCATGAGGGAAAGGTGAAAAGTACTTTGAAAAGAGAGTCAAAAAGACCGCGAAACCGTTAGGAGGGAAACGAATGCAGCTGAAGTGGCTCCGTATCAGGTTCAGGGGATGTCGGTGGACGTTCCGGCTGCGGACAGCTAACGCGTCCTCGGTCGGAGAGGCTGCCGACTTCCTTGCACTCCTGTTGGGAGCCGGCCAACAGCGGTTGTTCCTGGCCCAGAAGGCCGGTCGGGAGGTACCTCCGCACTCGTGCAGAGAACGTATAGCCGTCCGGTTCGGCGGTCTGGGAGCGACCKAGGAGAGTCGTGAACTTTCACGCTTGCAGCGCAGGCCCCTCGGGGCCGGGTCGCCTCTGTTCGTTTGGGCCCCGCGGTTGGGACTGCTTGCAGTGTCTGCCGACGGTCAGCCTGCTCGGTCGGGGGATTGGCCACGCCTTGCGCTCTAGTTGTTGGTGCTCGAATGGCTGCATCCGACCCGTCTTGAAACACGGACCAAGGAGTGCAACATGCGTGCGAGTCTTTGGGTGGCAAACCCGTCGGCGCAATGAAGGTGAAGGCAGGCGTTGGTCTGCTTAGGCGAGAGCTTCCTCGGGAGCGCATCGTCGACCGATCCCAGGCTACGCTGTGGCGGGATTTGAGTAAGAGCGTGCCTGTTGCGACCCGAAAGATGGTGAACTATGCCTGAATAGGGTGAAGCCAGAGGAAACTCTGGTGGAAGCTCGTAGCGATTCTGACGTGCAAATCGATCGTCAAATTTGGGTATAGGGGCGAAAGACTAATCGAACC
>JQ151355.1 Uncultured bacterium clone J2_5_82 16S ribosomal RNA gene, partial sequence 
AGTGAACGCTGGCGGCATGCTTAACACATGCAAGTCGCGCGGTCAGCAATGGCAGCGGCGGACGGGTGAGTAACGCGTAGGAATGTATCCAGAGGTGGGGGACAACCCCGGGAAACTGGGGCTAATACCGCATATGTCCTGAGGGACAAAGCAGTAATGCGCCTTTGGAGCAGCCTGCGTCCGATTAGGTAGTTGGTGGGGTAATGGCCTACCAAGCCTGCGATCGGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGTCTTCGGATCGTAAAGCACTTTCGACAGGGACGATGATGACGGTACCTGTAGAAGAAGCCCCGGTAACTTCGTGCCAGCAGCCGCGGTAAGCATACTCGTA
>AY190253.1 Dothideomycete sp. G11-R40 18S ribosomal RNA gene, partial sequence 
GATTAAGCCATGCATGTCTAAGTATAAGCAACTATACGGTGAAACTGCGAATGGCTCATTAAATCAGTTATCGTTTATTTGATAGTACCTTACTACTTGGATAACCGTGGTAATTCTAGAGCTAATACATGCTAAAAACCTCGACTTCGGAAGGGGTGTATTTATTAGATAAAAAACCAGCGCCCTTCGGGGCTCCTTGGTGATTCATAATAACTAAACGAATCGCATGGCCTTGCGCCGGCGATGGTTCATTCAAATTTCTGCCCTATCAACTTTCGATGGTAGGATAGTGGCCTACCATGGTATCAACGGGTAACGGGGAATTAGGGTTCTATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCCGACACGGGGAGGTAGTGACAATAAATACTGATACAGGGCTCTTTTGGGTCTTGTAATTGGAATGAGTACAATTTAAATCCCTTAACGAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAACCTTGGGCCTGGCTGGCCGGTCCGCCTCACCGCGTGTACTGGTCCGGCCGGGCCTTTCCTTCTGGGGAGCCGCATGCCCTTCACTGGGCGTGTCGGGGAACCAGGACTTTTACTTTGAAAAAATTAGAGTGTTCAAAGCAGGCCTTTGCTCGAATACATTAGCATGGAATAATAGAATAGGACGTGCGGTTCTATTTTGTTGGTTTCTAGGACCGCCGTAATGATTAATAGGGATAGTCGGGGGCATCAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAGTGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGGCGATGTTATCATTTTGACTCGCTCGGCACCTTACGAGAAATCAAAGTCTTTGGGTTCTGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGAAATTGACGGAAGGGCACCACCAGGCGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTCCAGACACAATAAGGATTGACAGATTGAGAGCTCTTTCTTGATTTTGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGCTTAATTGCGATAACGAACGAGACCTTAACCTGCTAAATAGCCCGGCCCGCTTTGGCGGGTCGCCGGCTTCTTAGAGGGACTATCGGCTCAAGCCGATGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGACAGAGCCAACGAGTTCATCACCTTGGCCGAAAGGTCTGGGTAATCTTGTTAAACTCTGTCGTGCTGGGGATAGAGCATTGCAATTATTGCTCTTCAACGAGGAATGCCTAGTAAGCGTACGTCATCAGCGTGCGTTGATTACGTCCCTG
>XM_019758284.1 PREDICTED: Branchiostoma belcheri mitochondrial dicarboxylate carrier-like (LOC109461823), mRNA 
TCGCGCGGGAAACGCCCCTCGTGGGGTCACCAGAGTTCATCCGCCATCTTGTTTACGAAGTTGTTTGTCTCTCACAACCTGCACGTCAGCTGGGTACGTCACGTAGGTCACGTGCGGCTTCGCTCAAAGGTCGTTTTTGTTGCAGACATTGCATGTTCAGCTTTTCGGCGTCTGCAGGCGCGCCTGGCTGCTCAGTGCTGCCCAGTTTGTACCCGATGGTAGGACGCTTGCTTTTGGCCACGCCACGTCACAGGTCACCGCCCCCCTCCCCACCATTCAAATCATCAGCCAGCTTCCTGCCAGGATTTGTACGTAATGATGGCCATGTGACATGTGATCGTGCGTGAACAGATGATTATACCCTCGGGACGTCTTTGTTTAGCTGTACTGAAGTCGATCGGATCCATGGAAACGTAGCAGCCCGGTGTACCTTATTGTTTGCTGACTCACAATGATTGCAGCTTTTTTGTCAAAAATCACAAGTTGAACGGAGCTCTTACACGTACGTCACCACGCCACGCCAGGGAGGTCGTGACTTTTCCAGCGCCCGCTTGCTTGAACTGGACTGGATGTGCTGTCAGCCTGACTTGTAAGACTATTTATTCAAACGTTGAAACAAACAAGAGACTTGTGTACAGTTTGCTCATCTGTTTACCTTAGTCTCCACCATGACGTTCCTGGGATTTGCGGACAGTGAAGAACTGAAAGCTAAGAAGATCGGAAGATGGTATTTTGGGGGCGTGGCATCAGCCATGGCCGCCTGCTGTACCCACCCACTAGACCTGCTCAAAGTCCACCTGCAAACTCAACAGAAGAAAGAGTTTGGGTTGTTGCAAATGGGTGTGAAGGTTGTGAAGGCGGATGGCATTGTAGGGTTGTACAACGGGATCACAGCGTCGGTCATGCGACAGCTGACCTACTCCATGACCAGGTTTGCCATCTACGAGACGGCGAAGAAGAAGCTAGCAGAACATTCGGGTGGCGCGAATCTGCCCTTCCACCAGAAGGTGATGCTGGCCTCGCTGGGAGGGTTCTGTGGCGGGATTGTGGGTACGCCGGCGGACATGGTGAACGTGAGGATGCAGAACGATATGAAGCTGCCGGCGGAGTTGAGGCGGAACTACCGGCACGTGTTCCACGGGTGGAGGTGCGTGGTGGCGGAGGAGGGCGTGAAGGGTTTGTTCTCGGGCGTGACGATGGCGTCGTCCAGGGCGATTCTGGTGACGGTGGGACAGATCGCGTTCTACGACCAGTTCAAACAGACGCTCCTGTCCACGAGCTTTTTTAACGACAACATCGTCACCCACTTCACCGCAAGCTTCCTCGCTGGTGGCGTAGCGACGGCCATGACACAACCGGCGGACGTGATGAAGACACGATTGATGAACGCAGCACCGGGGCAGTACTCGAGTATTTTGTCCTGCGCAATAGACATCGGAAAAGTTGGTCCATTTGGGTTCTTCAAGGGGTTTGTTCCAGCGTTCGTGCGTCTCGGCCCTCACACCATCCTCACCTTTATCTTCTTTGAGCAGCTCAGGAAGAACATGGGTGTGCTGCCTGCCTACACGGTATAAGCGCCATCTAGCCAACTGTACTGGCACTGCAGGACTTCTAATTCATGGCAATGAAAATCTCAAGGATCAAGTGGAAAAATGGACTCTGTTGCAAAACCATAGCAGTGATGGGTTGATGGTTTCAGTGTAGGGAGATAGTAGGGTATACATCAGTCTTTTGAAGAGGTAAATAGCAAAAGAGCATAACTGGCCTGCATGAAGGTTGTTTGCATCCCCATATGCTATGCATTCCCGTAGGCCTGCTTAATTGTGTTAACTGTGGCAGTATTAATTTTGGATATGTCAGACAAACAAATGTAATTTCCATGTCAGTGTTGCTATGTAATTGAACAAACATATAAATGGATGGTTTTCAAATATTCTAGCTCATCTCGGAACATATCAGCACCTTCAAGATCGGGACAATTACTAGTATACCTCCTCAATGTTGCATGATTTACCGGTAACCATAAAGAGCCAATTATTTCATGGACTTGTAGTAAAGAAAAATACAGCTGCCTTCATCCAGATGAGTTATATTGACCAACATGTCTATTCATATGAAGAAATAACTTGTAAACTAAATGTGATACAGCTCTAAAGGATACAAATGTGAATCAATATGCTTTTAGCAATTGAATATACAAACCAGTAGTTACTGTTAGTAAACACACCTATGGAACAACAAGATACCTTCTGAAAACTAGCTGTACATATAGATTTACTGAACAATCAGGAGATCAAAGAGGTGTGAGTGAGTTAAGCTTTGTTTTGTTTTGTTTTGTTTCTTCTCTTTATTTAATGCTTAGTAAAGATATCTGATCATAGATATTATTATAGCAAGGTGTATATTTGTGACCAAACTAGTTTGTACCAAATAACTACTAAAGTAATAATGTAGATCTTTTTTCATTTTTAGGTGATCAGTCATTTTAAGTAGAGTCTAAGCAAATTTGTTTTAACTTTGCTGTTAGATGTTTTCTTTTTATGGTTGTCAGATGTTCAATGTGTAATAAAATGCATCTGGGACCCAG
>XR_004573716.1 PREDICTED: Drosophila guanche uncharacterized LOC117582427 (LOC117582427), transcript variant X2, ncRNA 
GTACACTCTCACTCACTCTCGCGCTGTCGCCCACGATACATGCAGCTTGCAAGCTCGGCGTCTAATCATTAGTAATGTGCCTATAACCGAAAGCAACTGCAGTGCAAATTACAAATATACAGTGTCAGGCCCGATGCCTCTGCAGCCCTCTGTCCTTTGCCCCAGAATGAAAAACGGAGGCAATCGGCATGGGATCGCCTCCTCATCGCCTCTACTGAAAATATGGGATCGAAGATCACTTGAGATGAAGAATTTCATCTAGCTTTCACTCACCATCAAACGCGGAAGACCAGCAGTCT
>XM_043480802.1 PREDICTED: Cervus canadensis olfactory receptor 56A4-like (LOC122449258), mRNA 
ATGCTGCCTTATAGGAACACCTCCCTCTCTACTGAAGTCTCTGAGTTCCTCCTGAACTGTTTTGTCAGGTCACCCACCTGGCAGCTCTGGCTGTCCCTGCCCCTCAGTCTCCTCTTCCTCCTGGCCATGGGGGCCAACGCCACCCTCCTGCTCACCATCCGGCTGGAGGCCTCTCTGCACGAGCCCATGTACTACCTGCTCAGCCTGCTCTCCCTGCTGGACATGGCGCTCTGCCTCACTGTCATCCCCAAGGTCCTGGCCATCTCTGCACAGCTCCATTATTGTGGAAAAAATATAATTGAAAACTGTATCTGTGCCAACCTCTCCGTGTCCAAGCTCTCTTGTGGTAACATCACCCTTAACAAAATCTACCAATTAATTTTAGCCTGGACTCTGCTGGGCTCTGACCTCATCCTCATCTTCCTCTCCTACATCTTCATCCTCCGAGCTGTCCTTCGACTCCATACAAAAGGAGCAGCTGCTAAAGCTCTGAGCACCTGTGGCTCTCACTTCATCCTTATCCTCTTCTTCAGCACCATCCTGCTGGTTTTTGTTTTTACCCATTTGGCCAAGAAAAAGCTTTCACCTGATATTCCTGTCTTACTTAATGTCCTCCACCATGTCATTCCTGCAGCTCTCAACCCAATTGTCTATGGTGTTCGAACTCAGGAAATTAAGCAGGGGATTTGGAAATTATTGAGGAAGGGTAGTGACAGCAGAAAGTAA
>XM_014024072.1 PREDICTED: Austrofundulus limnaeus gelsolin-like (LOC106528817), mRNA 
CCCAGGGCAGCACCAACAGGATGTGCAGAAAACAGGAAGGGCTGTGGCACGGCTTCTTCTTCTTCTCCTTCTTCACACTCAACATCTGACTTCTGTCTTCAGCAGACCCGGAGCAACATGGCCCACAAAGAGTTCGAGAACGCAGGGAAGAAGCCCGGCCTGCAGGTGTGGCGGGTGGAGAAAATGGATTTAAAACCCGTTCCAACTCAGCTCTACGGAGACTTCTTCACCGGAGATGCCTACATTGTGCTCTTCACCACCCCGGCACCTTCTTACGCTCTGCATTCGTGGACCGGAAATGAAGCTTCCCAAGATGAAGCCGGAGCCGTTGCCATTTTCCTGACTCAGATGGATGACTACATGAAGGGACTCCCGGTGCAGTTCAACGAGTTTCAAGGTGAAGAGTCGACCTGTTTTCAAGGCTACTTCAAGTCTGGAATGAAGTACAAGAAGGGTGGCGTGGCCTCAGGCTTCCATCATGTGGTGACCAACGACATGAACGTGAAGCGTCTGCTGCACGTTAAAGGTCGTCGTCTGATCAAAGGCACTGAGGTGGACCTGAGCTGGTCCAGCTTCAACAAGGGAGACTGCTTCATCATTGACCTGGGAAAGGACATCTACCACTGGTCCGGCAGTGAAAGCAATCGCTACGAACGCCTCAAAACCACTCAGATGGCCAACGACATCCGCGACAACGAGCGAAAAGGCCGCGCTAAAGTGCACATGATTGAAGAAGGTTCTGAGCCAGAGGCTGTCATTCAAGAACTTGGACCAAAGCCGGAGCTCCCTCCTGGGGAATGTGATACGGCAGAAGAAAAAACCCAGAAGACCAAGACATCTCTGTATCAGATTTCTGACGCCACTGGTAAAATGACCACAACGTTTGTGTCCAACGGTCCCTTCAAACAAAGCATGCTCTCCCAGAAGGAATGCTACATCCTGGACGATGGAGGAAACAACATATTTGTCTGGAAGGGAAAAGATGCAAATCCAGATGAGCGCAAAGCTGCAATGACTGCTGCAAAGACGTATATTACAGAAAAAAAATACCCCACAAAAACAAAGGTGCAGGTAATTCCTGCAGGAAGTGAGACCACGATGTTCAAACAGTTCTTCTTTAAATGGCTGGAGGGCGAGGCCACAGGAAAGACCTACACTGTGGGTCGCATCGCGAAGGTGGAGCAGATTCCCTTCGACTCCTCCAAACTCCACAGCAACAAGGCAATGGCTGCCCAGCACGGCATGGTGGACGACGGCTCCGGGAAAGTCCAGATCTGGCGTGTGGAGGGAAAGGATAAAGCAGCCGTGGACCCCTCCAGTTATGGACACTTCTTTGGTGGTGACTGTTACCTGGTGCTTTACTCCTACAATGATGGTGGCAGAACGAAGCATATCATCTACACCTGGCAAGGTCAGAAGTGTACTCAGGATGAGCTGGCTGCTTCAGCTTTCCTCACCGTCAAACTGGATGACTCCATGGGCGGAGTGGCCACACAGGTCAGGGTCAGTCAGGGCCAGGAGCCCCCTCATCTCGTCAGCTTGTTTAAAAACAAGCCTTTGGTCATCCACCTGGGTGGGACGTCCCGTAAGGGTGGTGACAGCACCCCTGGCAGCACGCGGCTCTTCCACATCCGTCAGAGCTCCACCAAAGCTACACGAGCTGTTGAGGTGGAACCCAAAGCCTCCTCTCTGAACACCAACGACGCGTTTGTGCTAAAGACACCATCTTCCCTGTTTGTGTGGAAGGGAAAAGGAGCGAGTTCAGATGAGACGTCGGCAGCTGAGTATGTCGCCAAGTTTCTGGGAGGAGCTGTCACCAAGCTGGATGAGACAAAAGAGCCAGATGGTTTCTGGTCAGCGCTGGGTGGGAAGGGCAACTATCAGACCTCCAAGGCCCTGCAGAACGTGATCAGACCTCCTCGACTCTTCGGTTGTTCAAACAAGACTGGCAGGCTCATTGCAGAAGAGGTTCCTGGTGACTTTACTCAGATCGATCTGGCCACAGATGATGTCATGATCCTGGACAGCTGGGATCAGATCTTTGTTTGGATCGGAAATGAAGCCAATGAAACTGAGAAATTAGGAGCTCCAAAAATTGCCCAAGAATATGTGGATTCTGACCCCGCCGGACGTCGTGGTGTCCCCATCACCACCATCAAGCAGGGCCAGGAGCCACCGTCATTCACGGGCTGGTTTCAAGCTTGGGACCCCCACATGTGGGACTAAGCTCATCATTAGAGCAGAAAGCATCGACTTACTAAACATCAGTAGTTGGATAAAATGCATAATCTTCACACAATGAGCTTAAGATTTTTATAGATGTAGATCAGATTTTAGACAAAATCTTATATGTCTGTGCTTTCAGTGTAACAGAAATACTCACCAAAGCTGAAAACTTACATATTTTGTGGCAATAAGCTGTTTTTCTTTTAATGAGGAACTGGCAAATAAAAATAATATGTGCTAATTTAAATGTCATATCCGTATTCTGGTTTAAATTTTAAAGAAAAATTAAGTTGACTCTAAAACAAATCATTAAAAGTTCTGAACCCCA
>KM104095.1 Uncultured fungus clone rcw_159 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
CGGAAGGATCATTATCGTGCTTTGGGGCATGGCTCCGGCCGTGCTCCTCCAGCCCCACCCGTGTTTACCACACCTGTTGCTTCGGCGGGCCCGGCGGCCCTGGCCGCTGCCCCGGGGGGGGATGTTTTCTCCCTCCGGGTGTCCGCGCCCGCCGAAGACCCTCTGAACTCTAGTGACCTGTGTCGTCTGAGCTTCATGATCAAATCATTAAAAAACTTTCAACAACGGATCTCTTGGTTCCGACATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAGTTCCGTGAATCATCGAATCTTTGAACGCATATTGCGCCCCCTGGTATTCCGGGGGGCATGTCTGTTCGAGCGTCATTGCAACCCTCAAGCACGGCTTGTGTGTTGGGCCCGGATGTCCCGGTGTGGACAGGCCCGAAAAGCAGTGGCTGGGATGTGTCTCGGCGCCCAAGCGTATGGGGACTCTTGTCACCCGCTTGCATGGCCCGGGCGGTCCCCGTCGACCTCTTTCTCTCCGGAAGGGCGCCCCCCTTTCGTCGGTTGACCTC
>XM_019782364.1 PREDICTED: Branchiostoma belcheri tryptophan 5-hydroxylase 2-like (LOC109480215), mRNA 
ATCCATGTTCGTCAGAAGTTGTCTGAGAATCAGTTCCAAGATGTCGTCGGGAAGAAAACTGTTAGGGCGGCGGTTTTCTGACGTCTTCCCTTTAAACAACGGCAGCCGAGGCCCCCTTCTTACCAAGGACGGGACTGCAGGGGCAAGAACCCGTAGGCGCATCTCGTCTTTCCCTTGTGAGGAGACGTTTGCACCTGTTCGCACTCCGGTCATCCTGTCTATGAGGAAGGACGTTGGGGGCCTTGCTGCCGTGCTACAGTTATTTCAGGAAGAACAGGTCAGCGTTCTGCATATCGAGTCCCGACGCTCTCTTCGGCGGAAATCGGTGGTTGAAATCTACATGGACTGTGAGGCCGACAAGACCCGAATGAACGAACTGATCTCCCGGATTCAGAGGGAGACCAAGATGGTCAAGGTGGACACACCAGACAGCATCGGCAAGGGCAATGCACAAGATGAGGAGGGGTTTGAGGTTCCCTGGTTCCCGCGCAAAATCAGCGAGCTGGACAAGACGGCGTGCCGAGTCCTGATGTACGGAAACGACCTGGATGCCGACCACCCGGGTTTTAAGGACAATGTCTACCGGGAGAGAAGAAAGCTGTTCGCTGAAATCGCTCTGAACTACAAATACGGTCAACCTATACCCAGAATAAAGTATACCGAAGAAGAAGTGAACACATGGGGTGCAGTGTACCGTGAGCTGACGTCACTCTACCCGACACACGCCTGTCAACAGCACCTCAACAACCTGCCGCTACTGCGCATGTACTGCGGATATAGAGAAGACAACATCCCTCAGTTGGAAGATGTGTCCGCATTTCTTAAAGAACGAACAGGTTTCCAGTTGCGGCCGGTGGCGGGGTACCTGACACCACGTGACTTCCTGGCAGGACTTGCCTTCCGCGTGTTCCACTGTACCCAGTACATCCGCCACAGCACCGACCCCTTCTACACACCGGAACCGGACTGTTGTCACGAGTTGCTGGGTCACGTGCCCATGCTGGCCGACCCGAGTTTTGCCGAGTTCTCCCACGAGATCGGACTGGCTTCGCTCGGCGCCTCGGATGAGGAGGTACAAAAGTTAGCCACGTGCTACTTCTTCTCGGTAGAGTTCGGCCTGTGTAAAGAGGACGGGAAGATCAGGGCATACGGAGCAGGACTGCTGTCATCTGCCGGCGAGCTAAAGCATGCACTGACACAAGAGGATAAAGTTCTGCCCTTTGACCCGGAAGCTGTTGTACAACAGGAGTGTCTCATCACCACCTATCAGGACGTCTATTTCATGTCCGACAGTTTTGAGGAGGCTAAACAGCAGATGAGGTAATTTTCTCATTATTGTGCTTAG
>XR_008187289.1 PREDICTED: Carassius gibelio uncharacterized LOC128029018 (LOC128029018), ncRNA 
CCATTACAGCAACAAACATTTTTAATGCAATTTTCTTTTTCAAAATTCACATCTGAGGTATGACAGTGTGTAATTTATATTGTAGGTTTAATAGGGAACATCTCTTGAATTCATGTTAATCACGTATCTTACTTTGCTTAAAGCTGAGCTAAACAGAACTAATTTGATTATTTTACCTTTTCAGCTGAATTGTGCCCAACCAGGGTAACAGTTGTCTGATTTCACAAGTGATTTTGCTCTTCCTGAAGTCCAGCTTTAAATTCAGAGCTTGATGTTGCAGCAGGTAATGAATCACTTCCCAGGTCAGTGAACAGGAAGTCAGATCTTTAGGCACCTTCTTCAGGAAAAAGCATGTCAGTTCATCATCCTGTGCTTCATACACCACTGAAACCAGCTGCTGAAGAGTTTCTTTAGAGAACCTGA
>XM_005997745.2 PREDICTED: Latimeria chalumnae BTB/POZ domain-containing protein KCTD6 (LOC102358416), transcript variant X1, mRNA 
TCTCTATGGTTGGTCCTGTAGATATGATGCTGATTCCATGTTTTGGGTTGGCACGGCGCTGTTTTGAAACGAGCTTCGGGGTTTCGGGTTCAGTACGAGGGTTAAAAAAAAAAAAATGTTTGCTTATTTTTAAAGTGAAATCATTTCGAATGAGTGAATTTTGAGACAGTCAGAAGTCCTAGTTGGAATAAACTTTAGGTTTATGACGGAGAACCTTTCCAGATTATCATTGGAACACACAATTGAAAAATAAGAGCCACACTGGAGAACGGGAGGTGATTATTGCTTCTACCCTGCAATCTTTCATTGTTGAATCCTAAGAGAATTACTCGAGCATTGAAGCAGATGGATAATGGAGACTGGGGACATATGATGACTGATCCAGTCACGTTAAATGTAGGTGGCCACCTCTATGCAACCTCAATCTCCACTCTGACCCGTTACCCTGATTCCATGCTGGGAGCCATGTTTAGGGGAGGTTTTCCCACTGCCAGAGACTCCCAGGGTAACTACTTTATTGACAGAGATGGACCTCTATTCAGGTACATCTTGAATTTCTTAAGAACTTCTGAACTGACTCTTCCTCAAGACTTCAAAGAAATTGATTTGCTTCGAAAAGAGGCAGACTTTTACCAAATTGAGCCCCTGATCCAAAGTCTTAATGACCCCAAACCACTCTACCCCTTGGACACGTTTGAGGAAGTGGTGGAACTGTCAAGCACACGTAAACTTTCCAAATATTCTAATCCTGTAGCGGTCATTATAACTCAACTTACTATAACAACAAAGGTTCATTCTTTACTTGAAGGCATTTCCAACCATTTTACCAAGTGGAATAAGCATATGATGGACACGAGGGACTGCCAGGCTTCTTTTACGTTTGGGCCATGTGACCACCACCAAGAGGTCTCCCTTCGAGTTCACCTGATGGAGTATATTACAAAGCAAGGATTCACTATCCGAAATACAAGAATGCACCATATGAGTGAGAGGGCCAATGAGAATACAGTAGAGCATAACTGGACATTTTGCAGATTGGCACGAAAAATAGAAGACTGAAGCTGAATAGATCTTTTTTTGCTGTTGTTTTTTTTCAGTTGAAGACAGCATTAGTATCTCTTTGGAGCTGCATGAAGACCACTGTAAATACAGAGAAGAAAACAAAAATGATATGGGCTGTTCTTACAGCTACTTTTTGTTAATCGCCCTTAACAATGATTCTTTTGAAGATTGTATAGAAATTCCTCATAACTATGCATGTGCCTATTAAAGCTGCTATAGAACTAGAAAGTGACTTTCTCATTAACTTTTGAACAGATATCCTCTGTTTCTTTGAGAATATTAAAAACCACTTTAAGCTA
>XR_002182326.1 PREDICTED: Bos indicus uncharacterized LOC109569253 (LOC109569253), ncRNA 
TTTTAGGACTGAAGCCCCCCCAGCTACCTCTGGCTCCTTGGGTGACCTAAAGATAATAGRCTACTCTGTGCACATGGGTCAGTGCCCCARAAAGGAGCAGCAGCCAGGACTGGTGTGGACCAGGCTGAGACATTTTAACCATACCCCTGCGTCCATTCCCAAAGCGCAAAGGTCAAAAGTACTCTGAGAACGTCCAAGGGGTCACATGCCACTGTCTGGTGGCTGGCATGGCTCTGATTGGTGAGAAAAGAGCACAACAGGGGAAAGGTGGGKGGGGCTCTCTCCTCTTGAAACCACAGGGCGTAGCTGCTGTTGAGGGCTGGCTGGGCTGRTCAAAAGCAGCTCCCACATRRGGACACATTGTCCTCCAGGCATCATCATRGGACATGCTGTGCTCTGGGAGGAGGGACACAGACRGTGACAGATTCTGCGGACAGAAACAACAAGCGTGGGGTKATCTGGGAACTTTTGTATCTGGGAGCCCAAGGGTGGGACCCTGGTTATCTTGCTGTGTAGTGACAAGCARCTAATAATGGAGACCTCAGAGCTGCCCATGTCAGAGGCATGAGGACATGGACTGCTGGTTCTGAGAYGGTTGCCTAGTGATACAGTGAGGAAAGGAYTAAGACCTAGAAGAACAAARTCACAGGATGTTAAGATTGAAGGAATCCACCTCTCAGTCTAGTTCCTTTGACATCATCTAYAACAAGTATCCTAACTCTACACTAACAGTCTCTTGAGGTTAGGCACCCCACTTGTTCATTCGTTATTGTGTCTACAGTGTGGTAGCCAGCCTCTGAGATTGATCCTCATCTCTGRYACTCATAACCTCATGTGGTCCCTCTCATATTAAAGAGGGCTGACCAACGTGATCAACAGGTTATTGYGAAAGTCATGGTACGTAACTCCCAAATGTGGAGCATAAAGGCCACAGCRGCTTCCATCCTGCTTTCTCTTGGACTCTGAGGGGAGGCAGTCACCACGTTGTAATGTTGTGATGAGGGACATCATAGGAAGCCCCATGGAGGGTCCRCATAGGAAGGTACTACCGCCYCTCCTCAACAGCCAGCACCGACTTGCCAGCTGTGTGGGTGAGCCTCCTTGGAAGAGATCCTCCAGCCTTGGTGGAGCCTTCAGATGACCACAGACCCAGRCAACGTCCTGCCTGCAACYTCATGACGCATCCTGAGTCAGAACCACACAGTCAAGCCACTGGCTTGCAGAAATCGCAGACTCCCAACCATTGGACCACCAGGGAAGTCCCTGCTGCTTAGCACCAAACACCTCCACTGATAGCCARCTTACCACCTCGYGAAACAATTGATTCTATCTTYGGACAACTCTGTTCAAGACTACCAAAATTAAATTGGTTCTTCCTAAA
>XM_001444626.1 Paramecium tetraurelia uncharacterized protein (GSPATT00012774001), partial mRNA 
ATGTTAAAAAGTAATTCTTATCATCTAAAAACCAATAAGAAACATAAATCATCTCCATTAGCTTCCATAGAGCTACTACAAAAGTTATTGGATTTTAAATAAACGTAAACTTCCATGAATTGTTCCTAAGAAAACAAAACTCTAGTCATGAATGGGAATTTAGCAAAACAAATCTCGAAATCAATTTCAATTGGCAGTCAAAGTTGGAAGGATATAGCACCTCCAATTCATGAATCTGATAATTTGCTTAGAAAAAAGGAGGAAATCCTCAATACATTGAAGAAATCAAAGCATGTCAGACATATAAGTTAGATTTGGTCAATGAGAAATAGAACTGATAGTAATGTCCATACTCCAAGAAAAGAAGGGGTAAACGATTTTATTTAAAATGCAAGAATCTTTTTGAAAGAGAAACTATTAGAAAATAAGTTAGATAAGCTCTGCTATTAGGTTTAATAATTAAAAAATAAATCCGATATTTTGGAAATCTAAAATAAATTGCTTTTCGAGAACCTTAAGCAACATCATAATGACCATAATAACGTGCACGAAAGAAAGGTTTTGATGGGAAAGCTCGATTAAATGATAACGATGCAAAAGAAATAAGAATAAAGCTTAAATTATTTTAAGCAATTATTCCAAGAGAATGACGAAGGAAGGAGAGTGAAAACCTAAACCTCCTATCCCAAGCTGAGACCTGCCCTATACTCTGGCTACGTCGGATTAAAAATGTGA
>XM_047096667.1 PREDICTED: Lynx rufus CUGBP Elav-like family member 5 (LOC124524401), transcript variant X11, mRNA 
ATGAAGGACCTGGACGCCATCAAGCTCTTCGTGGGCCAGATCCCGCGCAACCTGGACGAGAAGGACCTCAAGCCGCTCTTCGAGCAGTTCGGCCGCATCTACGAGCTCACGGTGCTCAAAGACCCCTACACGGGCATGCACAAAGGCTGTGCCTTTCTCACCTACTGTGCCAGGGACTCCGCCATCAAAGCTCAGACTGCCCTGCACGAACAGAAGACCTTGCCCGGGATGGCGCGGCCGATCCAGGTGAAGCCTGCGGACAGTGAAAGCCGCGGAGGGGACCGGAAGCTGTTTGTGGGGATGCTGAACAAGCAGCAGTCGGAAGAGGACGTGCTGCGGCTGTTCCAGCCCTTTGGGGTCATCGACGAATGCACCGTGCTCCGCGGGCCTGACGGCAGCAGCAAAGGCTGTGCCTTTGTGAAGTTCTCCTCCCACACGGAGGCCCAAGCGGCCATCCACGCGCTGCACGGCAGCCAAACCATGCCGGGTGCCTCCTCCAGCCTGGTGGTCAAGTTTGCCGACACGGACAAGGAGCGGACGCTCCGGCGCATGCAGCAGATGGTGGGCCAGCTGGGCATCCTGACGCCATCCCTCACCCTGCCCTTCAGCCCCTACAGTGCCTACGCCCAGGCCCTCATGCAGCAGCAGACAACGGTCCTGTCCACGTCGGGCAGCTACCTGAGCCCTGGCGTGGCCTTCTCACCCTGCCACATCCAGCAGATCGGCGCCGTCAGCCTTAACGGGCTGCCTGCCACACCCATCGCCCCTGCCTCTGGACTGCACTCGCCCCCGCTGCTTGGTTCCACTGCCGTGCCCGGGCTCGTGGCTCCCATCACCAATGGCTTCGCAGGTGTCGTGCCCTTCCCTGGGGGGCACCCTGCCCTAGAGACCGTGTATGCCAATGGCCTCGTGCCCTACCCAGCTCAGAGCCCGACCGTGGCCGAGACCCTCCATCCTGCCTTCTCCGGAGTCCAGCAGTACACAGGTACGGACGGCACCATGTACCCCACCGCGGCCATCACGCCCATCGCGCACAGCGTCCCCCAGCCGCCGCCCCTCCTGCAGCAGCAGCAGCGAGAAGGCTTCGTGAGCTTTGACAACCCGGCCAGCGCGCAGACCGCCATCCAGGCCATGAACGGCTTTCAGATCGGCATGAAGAGACTCAAAGTGCAGCTGAAGCGGCCCAAAGACCCGGGACACCCCTACTGACCGCGCCCACAGCCGCCCGGAGGCTGCGGGCCTGGCCCAGGTGAGCCGCCAGGCGGCCCCACCCGCCCCCACCCCCGCCCCCCACCCCCCCGTCTTGGCCAAACACCCCCTCGTTCTCCATGCCCTCCCCACCCCCCAGGGGGGATGCCGCTGGAGACCACAAGGAGCCCCCAGGTTGGGATGGTGGGGACAGAGCTAGAGAGTCACCCTCCAATCCCCCCTTTGATCAGGGCTGGGACAGAGGGTGGAACCGGGGTAGAAGGGGGTTGGGGAATCCTTCCAGAAGGTTTTGAAGGATGAATAGAAGTTCACTTGAGAGGCCAGGTTTGGTCTGGGGTGGGGCATGCTGCGAGGGAGGGGCTTCTGTCCTGTCCTGTGACTCTCCCAGCTGGGCCCCTGTCCAAGTTCCTCATTTGGTGTCACCCGCGTTCAGTGAACTGGCGAAAAAGTGGAATGTTTGCCCTGCTCACCAGCATGCCCCCCCCAAAGAGACCCCCCCCCCAACAAATCCCCAAGAGTGTATTTTGCCACCAGAGAGAACAACTTTATCAACAACTAAGCACCTTCTTTGGGGGAATGAACAGTGAGCCTAAGGGGCCAGTAGGGAAACATAACTGACCACAGCCTTGATGAGCCTCATCTGTGAAATGGGTTCACGAAAGTCGCCTCCCCAGAAGCAGCAGGGAGGATCCGCTCGGGGACGCGGTGTTTTCCCAGCTGAGCCCAGGACCCGCCACCTGGAAAGCTCTTGATCATTTGTTTTGATTTTGTTTTTGTTTTGTTTTTAATCATGAGCGCCGTCGTCATCAAAGCGCCGCGCCTGGGGTCTGGCGCGAAGTAGATGCTCAGTTAGGGGCTGCGCATGCTTTTCAGACCCTGCCAAATCAGCACCCGCAGAGTCGAAGGTCACGGGATCAGACAACTAACAGGCGACCCATGCACTTTAACACCCTGGGACAGCAAATCCTTTCTGAGCACCTACTATGCGCTAGGCACTGTTTGGGGACAGCGCTCGGGGACACAGCTGTGAATGACGAGAAACGGGGCGGGGGTTGGGAGAGAACTGCCTTCGTGGCAGGGAGCAGGGGAGACAAGATGAGACAAGAATAAACGCAACTGTTTGCCCCCGGGGGTTGCCAGATGAGGAAACAGCCTCGGTGGCCAGTCCTTTTCCAAGGCGGACCGCTGGCCTCTGAACCTGGAAATGGACTCTCTCTGAGCAGACAGGGGCCCTTGGGTTCCTGGAACCCAGCCTGGCCAGGGCAAGGGGGCGGGCGGGGGGCGATGTCGTCGGCCTGCATGCCCCCCATCACCGCACCCTAACGCCCCTCCCTTCTCCGCCAGGTGAGGGGCCTTCCCACCCCAGGAGGGCCTCCCGCTTCCAACCGACCCCGGACTTTTCCGTAAATTACAACCAAGTTTGGACACCAGCCCCACCCCCTCCCGTCTCCCCTTGCCCCCCCGCCCGCTTCCTAATGTGAAACACTACTGCGGGCCACACGGAGTGGGAAGGGGGCTTCGTGGTCCGCCCCAGCTGGGGAGGGGGGCTCCTGAGTTGGGGGCCGAGGGCTTCACTGCCCCCACCCTTGGTGGCTTCCCCAAATTAAATCACAACTTTTCCTATATATATATATATGCATATATATATAGAGCTATAGACAGTATATATATTTTTTGAGTATAGATCATGGGACCAAACTTTTCCGACTTCCTTCCATCCAAGAGAAGGTGACCCTGGCCCGGTCACTCAGCAGGGACATAAGAAGGGCTGAGGATGACCGGGCAGCCCAGTGTGTCCCCACCTCCCGCTGTCATGTCAGACCAGGGCACGGAGAAGCACTGGGAATCATCAGCCAACGCGATATACCTCCAGGACATTGGGCCCCTGCCACCGACGTTCTCGCAGGCCCTTGGGCTCGGCCAGCTCGAGTGTCCCTGGTCTTAGCTGCAGCTTCTGGAACCCCTACCCCCTCCCTCACCCCAGGGCCCTGCCTTCCCCGACATAGGCAAAGAAGAGACCCCCCCCCTGGCCTCCCACCCCCACCCCCGTCATAGCCTTACTCATGTGACCAATAGCCCTTAGCTTTCCGTCAGGGGCAGACAGGGTCGGGGGAGCCCCCCTGCCCCTCGCGCCCCCTCCCAAGGGCAGGCAGCCGCCCTCCCTGCCTTCGGATCACCAGCCTGGAGTTCACGATCTCATGACCAAGATCGCCACGCGCGTTGGACAAACCCAACCCGCTCTGGCCCAGCACCCCTTTACCAGAGATACCTCTACAAATAATTTTTTTTTTTGAATTTTGGTCTTTCTGAGAAGATACAAAGAAGAAAAGAGAAAAAAAAATGGGGAAAAAAAATCAGACAACAGTGGATTTTTGTTTCCTAGTTGGGGCGGGGAGGGAGGTCTTGTGGGGCGCCTCTGTATAGCTACTCAAACCGCGAAAACCCATCTTGAAGCACAGAGTCAAGTTCGTTGGACGTCCAGTGGGGCCTCTTGCCAAATGAGGCACCAGAGAACTTCATAAGCTCAAGAAAAAAAAAAAAAATTTGTAAAGAAAAAACAGCCTTCCCTTTTGTTTCTACCAAAATGTGTTGACCCAGAAAAAAAAAAAAAAAAAAAAGAAAAAAAAAACCACATAGCAAAAAAAAAAAAAAAAAAGGAAAAGAAAAAAAAAATCTTATGACCAACTTGTTTCGATATTCCAGAGTTTGATAATTGTTCCGAGACACTCTAGCGTGCCTGTGTCCTGTGCGTCTGCGTGTGCAAGCGTGTGCTCAGGGGCCACGAGGGGGCCTCGTCCGCGTCCCCGGCACCTGCCCAGCCCCGGCCAGGCCTGCTTGGGAGAGCGTGCTGGCGTGCAGTGGCGTTGTGTCCTTCTGGTCCATGTTTACTGGCTGTAAATACCATTTTTATACTCCACATCGAAGACCTACGTGATTTGTACGATGTACTTTATTTCTGCTACGAGTAATTTCATGAAGTTTCAACTTGCAAACCGACTTTTGGAGACAAATCGCCACACACACACACACACACACACACACACACAGAAAAGGAAGACAAGAAAGGAACTTACAGGGAACTTTGGGTGGACTGGGTTTGCATTTCTGGCTGGAGAGGTCCTTGGCACTGTGGTGTGTTTCAGGTGAGAAGCTGCAACCATCATCTTAATGTCCAAACGCCTCTCTTTGGTCTGGAGAAACTGAAAGTTTATTTAATAAAAGTTTTACTTGCTAAA
>XM_016552280.1 PREDICTED: Sinocyclocheilus rhinocerous general transcription factor IIH subunit 3-like (LOC107740007), mRNA 
AAACCCTTCAGTGAATCCACAGAAGAAGAGCTCATTATGAGTCGGAACACAACTTTTAACAATATTGGAGGAAATACTAACTGAAATACCTTTACATAGCGATTTAGAGATAAAAGAATCGCAATAATGGCCTCTGACGACGAAATTAATATTCTGGTCATTGTGTTAGATGTCAACCCTATTTGGTGGGGCCAGCAAGCTCAGCGGGAACCTCAGTTCACTCTTTCAACATGCCTGGATTCTTTGATGGTCATGGCAAATGCCCATTTAGTGATGTCAAGAACCAACAAACTAGCCGTCATTGCAAACCTGTATCAAAAGAGCCACTTTCTATATCCAAGTAAGCAGTGGAAATCAGGGGATGAAATATCTGTAAGTAGCGATGGCAAATATGAACTTCTGTCAGTTACCAATGAACTCTTTGCGGAAGAGATCAGGAATCTCATGGACAGAACAGAGGTCAATGGCAGTCAAACAGACAGCCTGTTGGCCGTATCACTCGCCAAAGCTCTGTGCTATATTCATCGAGTCTCAAAGGATGTGCAAGCTGGACAGGACATGAAATCAAGGATTTTGGTAATAAAAGCTGCTGAGGATTCTACATTACAGTATATGAACTTCATGAATGTGATCTTTGCAGCACAGAAGAAGAATATCCTGATTGATGCCTGTGTGTTGGACGCTGACTCAGGACTGCTGCAGCAGGCTTGTGACATAACTGGAGGCTTGTATCTCAGAATTCCCCAGAAGATCGCACTCACACAGTATTTGTTGTGGGTATTTTTCCCAGACACAGACCAGAGATCCCAGCTGTTATTGCCTCCTCCGACATTCCTGCTTGTGACATAA
>XM_045728814.1 PREDICTED: Procambarus clarkii trans-1,2-dihydrobenzene-1,2-diol dehydrogenase-like (LOC123746912), mRNA 
AATTTGTATCTGGCAACCCTGAGTCGCCCCGGCCGCTCGAGATTTGACTTGACATTTCAGCAGCAACATGGCAACACGGTGGGGCATAGTAAGTGCCGGTCTGATCTCCAATGACTTTGTAAATGCATTGAAGGCCTTACCCCCAGGGGAGCACCGCCTGGTGGCTGTAGCTGCACGCTCACTTGACAGTGCAAAAAGCTTTGCATCAAGAAATGGAGTGGAAAAGGCATATGGGTCATATGCAGAGCTTGCTCAGGATCCTGATGTAGAGGTGGTGTATATTGGCACAATCCAGACACAGCACCTCGCTGCTGCTTCCCTCATGATCCAGTCTGGGAAACATGTCCTTTGTGAGAAACCCCTTTGTTTAAATGTGAAGGAGACTAAGCAGCTTATTCAACTTGCTGAGGAAAAGAAGGTTTTCCTGATGGAGGCAGTATGGTCAAGGTTCTTCCCTGTGTACCAGGAGATGACAAGAAGAATCAAGTCAGGAGAGATTGGAGACGTGGTGCAAGTTATCTGTTCCTTTGGCAAATCAGTGGAGAATGTAGAGAGGCTGCTGAAGAAAGAAACTGGCGGAGGAGTCACCCTGGAAATAGGAATTTACCCAGTGCAGTTTACCACACTAGTAATGGGAGGAAAGAAGCCACAGAAAGTGCTTGCTGGTGGACACCTGAATGCCAATGGTGTAGAAGAATCAACAAGTGTCTCGCTTGTCTACTCTGGACGACGCTTGGCTTCTCTGAGTGCCACCATCAGGGCATGTTTGCCTTCAGAGGCCTTTGTTATTGGCACTAAGGGCACTATCAAGGTGAACTATCCCATGTGGTGTCCTGAAAGCCTGGAGTCACCATCAGGAAAATTTGAGTCACCACTTCCCAAAACAGGTCACACTTTCAACTTTGATAATAGCCAAGGATTAATGTATGAGGCAATTGAAGTGAGACGCTGTCTTAAAGAAGGTTTGCTGGAGAGTCCAGGGATGAGCCACAAAGAGAGTCTCACTATTGCTGAAGTCATGGAGCAAATAAGACGACAGGTTGGAGTAGAATTTGACTAGAACATCAAGGCAATCTAACAGTGTTAAGCTTTCATATAAAGTCGTAAACTAATTGCTGTTATTGAAGACTGGAGCCCAACTATATACTGTATAGTGATAGCAATAAGATAATCAGTGGTATAGTATTAGAGTTCTTTTAGAATATTGTATTAATCTTTACTTTCATGACATCAGTAGTTTGCAGTATGGAACTGTACTTGTGTTTTCTAACATTTATACTCAATGATACAATCAAAGTTAGAAGATTCTTAATTCATTAATTAAGTTTTATTACCATCTCGGTTATTACAGAACAAAATTGTAATTTTGTCGTGGAAGTCAAAATCCTCATTAGTATGTAATTCATGTAATTATGGTTATTCACTTGTTTATGGAATACACGAAGTTTCAATTTGTTATGTAGCTTAATTCTGTTAATTTGTATTTCAACAAGTCCTTCATTATATCTTGAGATATATCTTGAGATGATTTCGGGGCTTTAGTGTCCCCGCGGCCCGGTCCTTGACCAGGCCTCCAGTAAGTCCAGTATAGCAGCTTTATAGTAAGAACTAACTGGTAGCATATTCAACTGTACCATGGAAATATGTACAGGAATTTGAGAAATGCAGACCATAATAAAATTATAAAATAATTGTAAGTTAATGGTCTGAAATGCTCAATTACTATGCAGTACATTTTTTTTCTCAACAATAGTAATGTTTTTATATTAAAAGGATTTTCTATTTCAGAATTCAGTTTTCTTAGTAGTACAAAAGATGGTGATATTGTTGACAGCAGCTTAAATTTTACTTGGCTTTACCTGTTGCAACATTTGTTTAAATTAATGGTTGTTAGAAAACTTCAGTTTGGTTAATTTTTCTATAAGTGAATGCCTGTTTTGCTCATTTAAAATTATTTAATAAAAATCAAATGTTCACACAATAACATAAATAGCCTTAGAAAATTTTAAGTAAATAACTTAACAAATGCTAATCTGCAGTAGCAACTAGACTGAACCAGAAATGAGTTACTTTACAAACTGCTCATAGAGCACATAATTCTTCTAGAAAATTTAATGAAACATTTTAGCTAATTAATAAGGCATGTGAAGTATCAAGAAAATTGTACTTTAACAAATATTAATGCAAAATCACTAGAACTCCTAGCCTGACCCTATGACTAAATGTATGTCAAATTACTTTCTTACAGTACAGTACTCTTACTTTGTCCATCATGCATAAATATATATAACTAGCACAATAA
>XM_028373142.1 PREDICTED: Glycine soja putative GPI-anchor transamidase (LOC114409625), transcript variant X2, mRNA 
AAAAATACTCGAAGAAAGAGTTGGTTGTGAAAAACTAGAACTAGAAGAACTGCCACCAGAAGACGCCGATCTCGTTCGCCCGAAGAACTACCTAATTTATTTACACTCCCGCTGACGCCGACACCAAACTCATTTAATTCAGTGTTTGATTTGACCTACATGATCCTTAAACTACCCGAATCATCAGCTGTTTTGCGATTGCGGGATTGATTTGTGGTTGCAGTGAATGTGATGGAACACTTATTTGGTACCGGAAGAAAAGAAGGACAAGTTAGCATACTCCTCATCTGCGTTTGAGTCTACAATGCACACTAATAATTGGGCTGTTTTGGTCTGCACGTCTCGCTTCTGGTTTAATTATCGGCATATGGCCAATACCCTGTCATTGTATAGGACAGTTAAACGGCTAGGAATACCGGATGAGAGGATTATACTCATGCTAGCAGATGACATGGCATGTAATGCTAGAAACAAGTACCCTGCCCAAGTTTTTAATAATGAAAACCATATACTTAATCTGTATGGGGATAATGTTGAGGTAGACTATCGTGGCTATGAAGTGACAGTGGAAAACTTTTTACGGGTACTTACTGGACGTCATGAGACATCTGTTCCAAGGTCCAAACGACTTCTTAGTGATGAGGGAAGTCATATTCTTCTGTATATGACAGGGCATGGAGGTGATGAGTTTTTGAAGTTTCAGGATTCGGAAGAGCTTCAAAGTCACGATTTAGCTGATGCTGTGAAGCAAATGAAAGAGAAGCGCAGGTTTAAGGAGCTTCTGATAATGGTGGACACCTGCCAAGCCTCTACTCTTTTTTCCCAGCTTCATTCACCAGGTGTTTTGGCAATTGGAAGTAGTATGAAAGGAGAAAATTCATATTCACATCATTTGGATTCAGATGTTGGCGTTTCAGTTGTTGATCGTTTTACATTTTACACTCTTGCTTTCTTTGAGAGGCTGAATATGTATGACAATGCTTCGTTGAGCAGCCTTTTCAATTCATATAATCCAAATTTGTTGATGTCGACTGCATATTACAGAATGGATATATACCAACGCTATTTAAAGGAGGTACCTGTGACAAACTTCTTTGGTTCTGTAATGAAAACGATACATACTGATTCAGCCTACAGATCCCGGTCAAATAAAAAAATTGAGGAAGCTAAAAGCAATATGTCTTTGGATGAATCAATCTCTGACAGTGACTCGGATGACGAGGATCAATTTAATAATTTAACTGCTGAGAAATATCTCTGGTATAGTGTTGGACCACTATGGAGTGCTATTCTCAGCAATGCCAATACTTCTGAAAGCATCGATACTTTGGTGTGCTATGGACTGCTTTTAATGCTTCCTTTGCTGATATTTTCCACATGGCTGTCAAAGTAAAGATTGGGGAAATATTCCGTAAGTTTGTTAGCAGAGCAGACACATTTCTTTGATGCTGCTAGATGGCACCGTTGCTTGAAATGCAATTTCACCCGAAAAAGCAGATTATTTGGCTGCATAATATGTGGGACGCAAACTACTGGTAGAGCAGCTTCATAGTTGTTGCCTATCAGCTGTATTCTGTTAGCTATTGCTTTTGCCTTGGTGCAGTTTATTCTGGTAGCCATTGGTGATGTTGGCTTGCTGCTGCTGTCATGTTTCGCCTTGTATTTTGATGATGATTATGATTATGATTGCAAACTGTAAAATTTTTGTAAAACCTCGCTCTATTTTTAGATATTATGTTGATGTCCAACATTAGAACACTGCTCTTTTAAGAACTCGGAAATGAAAATGCTTGATCATTTTATCTACTTGTA
>JF971034.1 Uncultured archaeon clone E09_A-C5_0239GSNP001F_P1 16S ribosomal RNA gene, partial sequence 
AGGGCCCCCCCTGGGCAAAGGGGTAACCCCAGGGGCCGCCGGAAAAAGGCGGCTTTTCCTTGGTCTAAAACCCCTAGGGAATAAGAGGGGGGCAAGACTGGTGTCAGCCGCCCCGGTAACACCAGCCCCTCGAGTGGTGGGGATGATTATTTGGCCTAAAGCGTCCGTAGCCGGGCCGGGTAAGTCTCCCGTTAAATCCAGCGTCTCAAGCGTTGACTGCGGGAGATACTGTCTGGCTAGAGAGTGGGGAGAGGTGTACGGTATTCTGGGGGTAGGGGCGAAATCACACTAGAACACGTCTGACGGTCAGGGACGAAAGCTGGGGTAGCGAACCGGATTAGATACCCGGGTAGTCCCAGCCGTAAACGATGCACGCTAGGTGTTGGGGCGGGGCTCCGAGCCCCGATTAGTGTCGGAGAGAAGTTGTTAAGCAAGCTGCCTGGGAAGTACGATCGCAAGATTGAAACTTAAAGGAATTGGCGGGGGGAGCACAGCAACGGGTGGAGCGTGCGGTTTAATT
>XM_046691669.1 PREDICTED: Haliotis rubra tolloid-like protein 1 (LOC124257572), mRNA 
AAAACCATACTCACTTACCCTGACCATACCGGTATATGCGACCAGTGAACTAACGCAGTAAGGACAGCCACACGCTTGACATTGTGCACCTGGCAACTGGCTCAATTTACCGAGTCATTCATATGCCTCCGCACCTGCACCGCTTCAGTGAGCACAAGTGTGGTTCACAACATGCAATAGTGTTTCGTTACCTGGGACATGCTGTTACTCTTTACTGGACATTTGACATGGAAACAGCTACAAGCGTGTTCAAAATGTCCAAACGGCGACCACAACAGCTGGCTATTTTGATAACAGTAACGTCGTTGTGGACGCGGATACTAGGTCAACCTTGGGCAGATGATGAATGCAACAACGTCATCGTGCCAGACCTATCGAGACAAGAAGTGAGGTCAGAAGGCTACCCGTCCGGATATGAACTGAATCAAGAGTGCAGATGGGAGTTTGATGCAACGAAGTGGTTTAACCAGAACAAAACACTTAGTGTGCAATTTGTCGTGGACATTGAAAAGACTACAGATTGTTCAAGAGAATCTGTTTCAGTGTATGCTTTCACATCGTCCAGCAATACACAGCTAGCGGTTATGTGTGGTCAGACTGTAAGACAGTATACGTTCTTCATCAAGTCCCTCCTGGTTGTACTGAAGACTGGATCTAGTCCTACACAGGGCCGGCGTGGTCTTAAGATGACACACCAGATGATTGATGACGAATCCTGCCGTGAGTGGTTGTATTCAGATACACACAAGACAGGTGCCATTCATTCACCCAGATATCCTGATCCGTATCCGAGCTTTCAGAGATGCACGTACCACATACGGAGTCGGACTCCCAACCGTAACGCCGAACTTAAAGTCATCCTTTCCGAGCTGAGCAGTGACTGTCACAAGGAATATGTCCTGGTCTATGACGGGAATTCAGAAAAAGGGTCCTTACTTGGAAAATGGTGCGGTTCAGAACGACCGACGTTCAACAGCCTGAGACAACAACTCTATGTAGTGTTTGTGAGCCATGACAACATCAGCGGACGAAGGGGGTTCAGGGCAGATTTCAAAGACGTCATATGTGGAGGCGCGGCATCAGCTGGACAGTACTATGGAAACGACATCGTATTTCCTGGGCAAGAGAGAGCATTTCACCATTACATCACGTGTCGCTGGTACATCAGACCTTCCCGCGGATTTACAGGCTTGATGGTGGAGTTCAGAAACCTTCAGGTCGACTGTGACAAAAGCAGGATTTCAGTGTATGACGGGCCAAGCGCTACAGACTACACAAGGACCTGGAAGATCTGCGGTAAAATGGATTATTCCTACCTGATTTCCGGGGCGGGCGTGTTCATCGAGTTCAGTAGCCAAGGCAACACAGCAGAGCCGGTCTCCTTCAAAATCAAATACAGGGGGAGCCGCGTTACAGGTTGCAGACTGAAAGGAAAGGAGGGCGACAAGGCTTACCTTGTGGCTTACTCTTACGAACAGATACTCCTGTCCCCGGGATATCCCGATCTATATCCAGATCGGATACAGTGTATGTGGCAAGTGAAGACTGGCCTTCTCGTGGACATTGTCATGATTGATGTTGTACGGCTGAATCTCCACTCACAGCCTGCATGTGACGACAGCATCAGTTTATATCATGGTCCAATATCTGATATCAGCAAGACACCGGCCATGGTGTTGTGTGGCACCACGACCGATGTTTTCTACAGCACTGGTCGGTACGCTACCATTGTGTTTTCAACCAATGACGTTGGAGTAGGAAGCGGCTTCACCATCAGTTACAAGTCTGTACCAAAGAAGAGCGCCGATACTGGAACCGCAGCTTCAGTTTCATCCAGTGCGTCAACGATAGTGATTGTTTGTTGTGTAATCTTCATCATCATCACCATAGTGGTTATCGTAACTTGTTTCGTTTGGAGAAAAAGACGCAGTGATCGCAATCGACAGCCACCGATTGTCCAAACATCTCCGGATCCAAACCCCCAGACTAGCGGCCAGGCAACCCCATTTTTGCCGCCCAATACCACCGGTACCACCAATCCTACCAATACCCCCGCTACCACCAACACCAGTGCGTCGCCCCCTGAATACCAGGATGTAAACTTCCTGCCCGTCACAGAACCATCAGCGCCAGAGATGCCGCCTCCCAGTTATGAAGATGCTGTGTCGAAGGGAATGATAGACACGGAAACTAGGTTTTGAGGCGTTTTGACAAGGTGTCTTCAAATTATAAACAGACGCTTTGACATGCATCACAAGGCAGTGGTCAGAATGTGAGTGAGTGAGTTGTTTTTAAGCCGCTTTGAACAGTACTCGATCGTAGAGTGTCTGCATAGCGTGGACGTAAGGTCATCAGAAAGTAGTTTCCTGATATCTAGTGTAGCTGTCTCATTGTCAGAAATATTATCCACGCATTTAGTACATGGTATTTGTCAGGAAGATACTCTAGGACATGGTATTGGTCAGAAAGAGACACTGGAACATGGTATTGATCAGGAAGATACTCTAGGACAAGGTATTGGTCAGAAAGAGACACTGAAACATGGTATTGATCAGGAAGAGACACTAGGACATGGTATTGGTCAGAACGAGACCAGTGGTGATTCCAGGTTAGATGAAGTCACAAGCAGCCTTTGCTGGTCGTAAGGGGTGACTAAATGAATCAGATGGTCAGACTTGGATGACGTCACGTAAACGTCGCTCATAATGTCAATCACTGAAATGTCTGGCGCAGTTATTTGAAGACCCCGTTACAGAGCTAGAAAGTCGCTACGTTATAACAAACAACAAAGACGCCCATCTACAAAAAGTTGATTCCGAAAAGACAAATCTGCAGAAGCCTACGATGACTTGTGGAGTATTTGTGTGGAGTAATGATGCTCAGTTTAAAAAACCTCTCAGTGGTATTTCCCAAAAGGAATCTGTTAACACCCAGGACTATCTCAGACACAAGTGGAGGCGTTGCACTCATATATTGTAGGAGTGGGTTCTTTCTCATCTGATTGGATGAATGGGTAGGGCAGATGGCCGAATCGTTTTAACGGGTGCGGCCAGGTTTCCCCGCTCATAAAACTGCTCCCCGGAAGACAATTCCCCACTGGTTGCAGAAATGTCAAGAACGTCTGGGGGTGGGGCGGAGAACATGACCTGGGGAGAATTTTCTTAGTAGGGGCAGTTGATCTGACGCCATATTAACACATCTTAGGTGTGGCGTGCAAAAGCTTTAGAAACTAAGCGGCCGGAGTGAGGGTTCAGATGCTACGAGCTTGGTGAAGCATCTCAGCATCTTTGATTATAGGTTCTTGAATATGTAACAATATGTGAGCCTGCTTTTAGCATTACCAGCATCTCCACCGAAACATCCCACTGAAGGTGAAATTGAACAGAAGTTGAACTTTATACTTGTATTCCGACTCTGTGTTCTGTTATGAATTCCTTTAAAAGAACATTCCAGTTTTAATGACATCATATATTGACGGGTTTCAGAGGGCAAAGGAAACGATTTCTGCTCAGGAACACTCAGCCCTGAAAATACCTTTGTATTTTGAATACAACAGAAATAGGGGGTCAACCGACAGTGTTGGATCCAAGTGGATTAAATATGTATTTGAATATATGCAAGTGCATTATTGTTTATATTATATATGTTTTATATAACATTTTGTATGATTTTATTGCGAGATACACGAGTCATAACACCATCGTGAGCGTGTTTGTTTTATTTGTTTATACACGTTTTATACATGATGACAGAACATTACACAGTAACATCTCACTTGTAGGACATGTTACTGAAGTAC
>XM_048419471.1 PREDICTED: Myodes glareolus docking protein 6 (Dok6), mRNA 
GAGGGGGGCACAGCTGGGGGCGGCGCTAGCCGCGGTGCTCCCCTCGTGGTCGGGGGCGAAGGTGAAGACCGCTCTCAAGGTGCTGGTGCTGCTGAGCAGATTCGGGCCCGGTTCCCTGGTCCGGGTGCTTGGCGGCCCTGCTATCGACTCAGCGTCCGCGCCGGCAGGAGCCTGGGGAAGAACTGGCGGTGGCGCGACTGCCGGCGACGGCCGGCTGGATGCGAGACCTGCGTGGACCGGGCGGTGGACAGCGGTTGACGACTCCAAGAAGCGGATCACCTAGCAGAGGAGCCCGACCGCGCTGGCCATGGCCTCCAACTTTAACGACATAGTCAAGCAGGGCTACGTGAAAATCCGCAGCAGGAAGCTAGGGATTTTCAGACGATGTTGGTTGGTTTTTAAGAAGGCTTCTAGCAAGGGACCCAGAAGGCTAGAAAAATTTCCAGATGAAAAGGCAGCTTATTTCAGAAACTTTCACAAGGTAACTGAACTGCACAACATCAAAAATATTACCAGACTGCCTCGAGAGACCAAGAAGCATGCCGTGGCCATTATCTTTCATGACGAAACGTCAAAGACATTTGCTTGTGAGTCAGAGCTGGAGGCTGAGGAGTGGTGCAAACACCTTTGCATGGAATGCCTGGGGACAAGGCTGAATGACATCAGCCTTGGGGAGCCTGACCTACTGGCAGCTGGGGTGCAGCGGGAACAGAATGAACGATTCAATGTTTATCTTATGCCTACACCCAACCTGGATATTTATGGTGAATGCACAATGCAGATCACTCATGAGAATATCTATCTCTGGGATATCCACAATGCCAAGGTCAAGCTGGTGATGTGGCCTCTTAGCTCACTAAGAAGATATGGTCGGGATTCAACGTGGTTCACCTTTGAGTCAGGAAGAATGTGTGACACGGGAGAAGGACTATTCACTTTTCAAACAAGGGAAGGAGAAATGATCTATCAGAAGGTCCACTCTGCAACACTGGCCATAGCTGAGCAACATGAAAGATTAATGCTAGAAATGGAGCAGAAGGCCCGGCTTCAGACAAGCTTGACTGAACCAATGACATTATCGAAATCCATCTCTCTTCCTCGTAGTGCATACTGGCATCACATTACGCGTCAGAACAGCGTTGGAGAAATCTACAGCTTGCAAGGTCATGGGTTTGGCTCATCAAAGATGTCCAGGGCACAGACATTTCCAAGTTATGCTGCAGAACAGAGTGAAGAGGCTCAGCCACCATTGTCTCGGTCCAGCAGTTATGGATTCAGCTATAGCTCCAGCCTCATTCAGTGACATACAGAGGCCACCACTGACCAGCAAAACAGTCTGCCCTGGACCTGCCATGGGGTCATTTCGCCCTGTGTATCCTGGAAGATCAATTGCTGTACAAATTAACATTGGTAGGGCGTAGTCCCAACTGAAAGGTTAAAAACTGAAGTTCTGCTTCCTTGATTCAGTGGTTAAGTCCTTTATTTATTGAATTTCTATGGGGGAAATCTATGTTTTACAAAAAAATCCAATAATATGAACACTCATTTCAATACAACAAATTCTTTGTGTCTGACAGTAGCAGAAGCCTTGGCACTGGGAAATTTGCCCACTCTAGTTTGTGCCTGGTTGGGGTCACCAAAATTTGTCTTTCAGACTGTTTGCTCCTGTTTCGACACAGGGCCTGTCTTTAAACATAATAATGACCCACTCTAAGCTCTGTGGCTTTTTCAATTTTGACAGAAACAAATCATGTAATCTTTACTCATGGTATCATAACTCTCCATGTAAAGAAGTCCAGTGACAATTAAGGGGGTGTTAAATTAGAATATTCTATTCAGAAGGACCCTGTAGCTCGAGTGTGTGTGGATGTGGGGGGTTGTATGTCTGTGTCTCTATGTATGTAGGAAATTACTATAACCATCTACAGATTAGGGTATATCAAATGTGCTAAATGTGACAGGATATGCTCACTTAAATTATTTAAAACTAATTTGTCACATTAAAATTAAAACTATGTTGAATAACTATTTTTAAATTAGTGCTGTTAGAATATGAAAAAGGTCCCCTGTTAGAAAATGAAAAAGGTTCCCTACTAACAACAGTATCTCTGAAGCCCACTCTGGTCTTATGAGGATTATGATCAGAAACACAAGAAGGAAGCACTTTGGAAACAAGATTACCATCCCAGCTGCCCTGCATGTCCATTACACTGTCTGTCTGGTTGATGTTGCCTTGTTGTTGACTGTTTCTTCCATCTGAGCTACTTGAGAAATTGGTGTAATCTCCAACTCTAAAATGTTTGAGAAAGACACAAAGCTACACTGAAAATGAACTCAGCTGTTTGTAGTTAAAAGAAGAACAAATGATACATGAAAGTAGATGTTTTAAGTTTCACAGAGGAATTTTTGCATGGGTCGTTGGGGTCTTGGCATCTGCTATGGAAACAGAACTTACATGACTTGAATTTTTTTTGCCCTGAACTTGATTGGTTGGGATGAAAAGAGAAAATGTTTGGCTTGCAAATTTTTTTCAGTTCTACCACCTGACAATGTCCAAGTTTAAAGGGAAATGGAAAATTCCTCTCTAAAAGAGAAAGTTTGGCTTGTTCAGGTCAACATAGACATATTTTGAGCATAATTTAGTGAGTGAAAATATAAATTACTCTGTGAGACTCACCTGGTGTCACTTGCCTAAACCAGATATCAATTAAGGAATCCAGATCATATTCCTGAACACAAGGTCAAGGTCAAGCAAGAGGAAAACCTGTTTTTTTCTTTGATAGCAAAATGTTCTACCAAACTTAGTCTACTGAAAGGGTACCTTTTTGCTGATCCTTGTTAAGATTTCATTCATCCTGAGTCAGGCAGTAGTGGTTCATGCCTTTAATCCCTGTACTTGGGAGGCAAAGGCAGGAGAATACAAGAGCTAA
>XM_045791904.1 PREDICTED: Ursus americanus glycerol kinase 5 (GK5), transcript variant X2, mRNA 
CCGGATCTCGCGGAGGGGCGGGCCGGGGGCGGCGGCCCCGCGGGGCGCGCTCGGCTCCTGAGGTGCGGGCCTTTATAGACGCGCCCTCTCGGCAGGCGGTTGTTGCGGAGAGGCTTGCGGGCTCGGAATGTCGGGGGTGCGCGCGGTCCAGGAGCAGAGCACGGCGGGCGCGTCTCCCGCGGGCTTCGTGTTGGGGCTGGACGTGGGCAGCTCAGTGATCCGCTGCCACGTCTATGACCACGCGACGCGGATCTGCGGCTCCAGCGCGCAGAAGCTGGAAAGTCTTTATCCTCAAGCTGGCCGGGTTGAAATTGATCCCGATGTTCTCTGGCTTCAGTTTGTGACTGTAATAAAAGAATCTGTTAAAGCTGCAGGAATAGAGATGAATCAAGTTGTTGGTCTTGGCATTTCAACACAGAGAGCAACTTTTATTACGTGGAACAAGAAAACAGGAAATCATTTTCACAACTTCATTAGTTGGCAAGACCTAAGAGCTGTTGAACTTGTAAAATCTTGGAATAATTCTCTCACAATGAAGGTGCAAAAGGCAGTTGAAGAAGATAATTGCTGCTTTGGGACTATTGACACCTGGTTGTTACATAAGCTCACAAAAGGTTCTGAATTTGCCACGGATTTTTCAAATGCTAGTACAACTGGACTATTTGACCCTTTTAAGATGCGTTGGAGCAGGCTCCTTACTTCCCTGCTTTCGATACCACTGTCTATCCTGCCTCCTGTGAGGGATACGAGCCACAATTTTGGATCAGCGGATGAAGAGATATTTGGGGTGCCTATACCAATAGTGGCCTTGGTCGCTGATCAGCAATCAGCCATGTTTGGAGAATGCTGCTTCCACACAGGAGATGTGAAACTAACCATGGGAACTGGGACATTTTTGGATATAAATACTGGAAATGATCTTCAACACACCGTTAGAGGCTTTTATCCACTAATTGGGTGGAAGATTGGCCAAGAAGTTGTATGCTTAGCTGAAAGCAATGCAGGAGACACTGGTACTATCATAAGATGGGCTCAAGAATTAGATCTTTTCACAGATGCTGCTGAGACTGAAAAAATGGCCAAAAGTTTAGAAGATTCTGAAGGAGTCTGTTTTGTTCCATCTTTTAGTGGATTGCAGGCTCCATTAAATGACCCCTGTGCATGTGCCTCTTTTATGGGTTTGAAGCCTTCCACCAATAAATACCATCTCGTACGAGCAATATTGGAGTCAATAGCTTTCAGAAACAAACAGTTATATGAGTTGATGCAGAAAGAGATCCATATCCCTGTGACAAAAGTCCGGGCAGATGGAGGAGTTTGTAGGAACAATTTTGTTATGCAGATGACTTCAGACCTGATTAATGCAAATATAGAGAGACCTGTCAACATAGACGTGTCCTGCCTGGGTGCTGCTTCTCTAGCTGGCCTTGCTGTTGGGTTTTGGACTGATAAGGAGGAACTAAAGAAACTGAGGCAAAGTGAAGTGGTTTTCAAGCCACAGAAGAAATGGCAAGAATATGAAATGAGTATGGAAAACTGGGTCAAAGCAGTGAAACGCTCCATGAATTGGTATAACAAGATGTAGCGCTAACTGGAACGACTGCAACCATATACGGCTGGCTGATACGACATGCAGATGAGACACAGCTCAGGGATAAAAACCCAATACGACGATGACTGAGAGCATTTCAGATGAGCTTTGCAACCTGAGAGAAAAAACATTGCTTTTTTGAATACAAAACAAAATCCCTCATTTTTAAATCTAAACCTTGGTAAGATTGTAAGGCAACAGTACCTCAAAACTTTATATCTTCTGTTTTGTAGCAAATTCCAAAGGACGTTAGCCATTTCTAGCCATATTTTGACAGCTGTGGGTCCTCCCCGTTTTTATACTGGGTCAGCGATACATACAAACATAATGGTTTACTATCTGAGTTAGTAGTTCTGGGTCAAGCACCATTCATGTTTTGTTCCAAAATTAAGTGACAAGTGTTCCTTTAATTATTTAAGATTAAGTAGGCTATATGAAGTTCACATAGCTATAAAGAAAGAATAACTGAGGAAATGTGGAGTTTTGCAACATTAATATTTTATATTTAAAACCATAATTGTTCAATACTCTATCCAAATATGAGCTCGATACGCCCCTCTCGGATACGCTTATTGTTAGTCAATTCTTTCTTTTATTGGGCTTAAAGACACTCACTGCCTTAATTTTTCCTTGGTTAACCAAAATCTGAGCATTCTTTTTGTATTGAAAAAATAACTTTAGTGAATGAAACTACAAAGGATAATGATTCATAAAGAACAAGAAAATATTTTCTTTCTCAAATGGGATTTCTTTCGAAAACTTCTGGCTAAAGTGTAACATCCCATTTTTTACAAAATGCAGGTAGTGGATAGAAATCTTGCTTTTCTCTTCCCGTTCTTCATCTTTGTTGTTGAGATGCTTGCATAAATGTCTTTTGTTTTAAATTAAGTGCCTAACTGACAACTTAATTTGAAGACAGTGCCCTAATTCATTGGTGACGTGGGAATTGCCTTCATTGGGGTACTTTACTTCCGCAGGTATCTTTTACTTCAGTTCAATCTACTCATCTCTGTGAGACAGGAGCAGTAGGTAGCTGCCAGAGGTAATGGGGGCGTGTTCATGCAAACGATTGCCTTGCAGTTACGGGGCGGAGCTCCGCAGAGAGGGACAGGGACAGTTCCACATTTTCAAACTTTTGTGATAGAAACAAACGTAAAGGAATCAGAGTTGTGAGTAGCTCTGGGCTGGTGTAAAACTGTCCTATGGCACCAGACTGCCCTCCAACTTGTTCTCATGTAATTTGCCCCTCCCTCCACTTGGGCTAGGTTCCATTTCGATTTGTATTAATAATGAATTTATTTCCCTCTTGGTCAGGCTTTGTGACATAAAGATCTACTGTTATAGAGCTAGTTGTTAAATACTAATGTACTTTAAAAAGTGACTGTTAGAGGGATTTTTGTTGTTGCCATCATATATGTCCATTTCAGGGACAGATAGCTAGAACTAGGGGTCACACTGCATTTCTGCAAATTCCATTTCAGTGAAGTTTGTCTTCTTGAAGTATTAACATTTTTGATAGAATCATAATAGCCAATATATAGTATCATTAACTCCATTAATTAAGATTTGGAATTTTTTTTGTGAAGTGGAGGTATTTTGTTTACGGTAACAAGTCAGATTACATTATGTAGATAATATTCTTCTTTTTAATTCTTTTCATTTTTCTTACGTCCCTTTTACAAAGCTTAGTGACCAATTGTAGGCCCTTTTATCAAAATCAGATCACGTGCAAGCTGCTCTGTTGTTTTACTGTTTCTTATAGATTCTGCTTCTCAGAGGGTATGATTTCATAGGAAAGAATTGTCTCTTTGTGTTAGGATATACTGAATTGTAATATTATTAATACTTAAAATTTGTTGGCTCATTTCTTTTTCACATTCTTCTTTCTCATCATCAAACACAAAATAAAGGATAAATACCTTTTAGATAATGTGAAAAAGTAACTGTGAACATGTTTTCATCGGAATTGAGCATCTCCTCAAAAATCAGTGGCTAGTTTTTTCTTCTGTTAGTCTAGAATTAATCTTTTATTTTTACTACTTCTGGCTTTTTTAGTGACACAGTTTAGTAAATCTTTTGCCAGATTTGACCTAAATCAGAAACGTGACCACATTTGCTTTTGTGGTTGTAGAAACAGTTGATATTCAAAATCAGTTGAGCAAAAAAATTGTGCTACGATTTCTCAGCATGTTCTATTTTCCCATTATGGATCAACCAGATATTTTTAGCAGGTCTGTAGCTATCTTATCAAGGAGGAGAATGTTTCTGTACAATCCTTCTTGAAGTGGTACTAATTTCTTTCATACCTAGACTTACCGATTTTAAATTTTTTTATATCCTACCATAATACGGTTTCTCAGTCTCAGCATTATTGACATTTGGGACAGGTAGTTCTTTGTTTTGGGACGTTGTGCTATGCAAGATAGGGTATTTGGCAGCTCAACCTGCTAGCTACCAGCAGCATCCCCTAGTTGTTGTGGTCAAAAATGTCTCGTAACACTGCCAAATGGCCCCCAGGAGGCAGTATCACCTCCAGTTGAGAACCACTAATTTGGACTATTAGAAGAAAGTTAAAGGCTCAGCAAATGTAGTGTGTCTATCATGCTCCTTTTCTCTCTGCCTCATTTTACCTTAGGAAATCGTTGTTAGCAAAAAGAGGTGGTTGTATCTTAAAACAAATAGGGTTTCTACTTTCCCAGTTAATGAGGGAAAAAAAAAATCTGATTTTACCCACTCAC
>XM_020802708.1 PREDICTED: Pogona vitticeps SH2B adaptor protein 3 (SH2B3), transcript variant X4, mRNA 
AAGCTGTTCTATTTTAGAGCGCGCGCAGGGCGGCCTTTGGCGTACGACGTCAAAACCATCCGGTCCCCCTGTTTTGGCAGGAAATCGCAAGGCGCTGCCGGTGGGCATGTCGTTCTGTCTGGAGGTGGGCTTCCCTCATGGACTGGCCTCCCTTTTTTGGCCTGCGTGCAGTCAGTGGCCGGTCTAGCTTCTGCAAAGGACATCTGAGTGTTTCAAGTTCCTACCATGAATGGACACGCTGGGCCACCCATAGATCCTGCGCACGCCGGGGGCTGGAGCGAGTTCTGCGAACAGCATGCCGTCACCACCGCTCGAGAGCTGGCCCGGAAGTACCTCCTGTTTGTCAGCGAAAACCCCGAGCACGAAATCTTGGCGGCCGACAACTTCTCCCTCCAGTTTGCTGACCTCTTCCAGCAGTATTTCCGCAATGAGGTGAAGGACCATTCCGCCATGAACCAGTTCCGCGTTCTGCCCTTTAGCAAGGTGCGGGACTACAGGGAGACTGGCCGAACTCATGCCGGCGCCTCCCCCACTGGGACGTTAGGGGCCAAGAGTGAAATGGAACTGGGTGGACCAGTTGACCGGGGACCACCTGAGGCCCGTCCCGCCGGCCTCCCCAAATCGTGGAGTTCTGAGGAACTTACTGGAACGCCTCCTTCCTTGGCCGTCAGGAGACACTTTTCCCTCACCCGCCTGAGGAGGAGTTGGCGTAACTTTTTCCGCAGGAGGTCCTCAGAGCCGCCCCCTCCCGATGGGGAAATGTCGGATTCTGTGCTGAAGTCTAACCTGGCGCGGAAGATCTTCCCGTGGGCCCTTTCGCGAGACCCACCGCCTCAGGTCCGGAAAGAAGGCGGTCTCAAATACTGGATGGTGACCGAGGCCAACGTGGACAACGGGACGCGCTGGCAGAGGTGCCGGCTCGTTTTACGGAAAGAAGGGCCTTCAGAGAGTGAAAATTACGTCCTGGCGCTGTTTGACCCCCCCAAGAGCTCAAAGCCCAGACTCCAAGCCGCCTGTTCATCAATCCAAGAAATCAGACGGTGCACCAGCCTGGAGATGCCAGACAACGCGCACACCTTTGTGCTGAAGGTAAATGCCTCCACCGACATTATATTCGAGGCTGGGGATGACCAGCAGCTGTCTTCCTGGATGTCTGAAATTAAAGAATGCCTCCCTCAAGGGTCCACAGGAGCCGACCCGGACCTGGCCCCCGACTCCCTCTCGGAGGTCACGACGGCCAGCCCCACCACCACCACCAGCAGCAGCAGCGTGGATTCCCGGAACCAAGGCGCGACGCCCCCGAACGCCCCCGACCAGCCCTGCCAAAAGACGGACCGCTACCTTTCCGCTTTCCCCTGGTTCCACGGACCCATTTCTCGCTTCAAGGCCGCCCAGCTGGTCCAGTTCCAGGGCCCCGAAGGGCACGGAGTCTTCCTCATCCGACAGAGCGAGACCCGGAGGGGAGAATATGTCCTCACGTTCAATTTCCAAGGAGTAGCTAAGCACCTGCGGCTTTCGCTGACCGAGAGGGGCCAGTGTCGGATCCAGCATTTGCACTTCTCCTCGATCCTGGATATGCTACACCATTTCCAGCGCTGCCCGATTCCCCTGGAGTGTGGCGCTGCCTGCAACGTGCAGCTGTCCAGCTACGTGGTGGTTGTCCCAAACGCCCAAGGCTCGACCAACACGGCACCTTTCCCCCCCGCCATCCACCGCTACAACCCGGAGTTCGGCCTCCTCCAGCTCACGCCCTCCAGCTTCGCCCGGATCCGCCTCCCGGACCATCCTCACCGCCACCACAACTCCTCCGTGGAGCAGATCTTCCACTTGGTGCCCCCTCCGGAAGAGCTGGCCGGCAGCCTGTGGCCCCACAGAGGCCGGCCCGCCTCCCACCACCCCTTGCCGGCCCCCCGGCCCTGGGACGGCGATTACGAGACGGACTCCCACGGGAGGGGGCACCTGCGGGCGGTCAACAACCAGTACCTGTCCCTTTGACCCAGTGCGGCGGGGGCCCCCCCACCCTGCTTTTGCCCGAGACTCTTCCTCAAAGGACATCTTCCTCTCTCTTGGCAACGTTGAATATTTGGTTTGTAAGATAAGACGGATCGCTCCCGTCGCTGCGGCTGCAGCTCTTGATTTAGGCCTGTTGAAGGGCCCGTTTGTTCCTTTTTATTATTATTTTTTTCTCAGTCAAAACATTCTTTTCTCTCTTATCGGTTTTGCACACGACCTTCCTTTTGTGTTGAGGGTTTTACGAGTACATGCAGTACTTTGCAGCGGGTTAGCGCTGGTCCCCCTTTCTCTAGCCCCGTCCTCCTTGGAGAAGACGGGCTGGGTGGGGGAATAAGAGGACAGGTCAGCCAAGCAGCGTTCGTGGCCCGTCCAGAGTTATACGGGGGCTTCCTTAGGGTTGTGTTCTACGAAATCCCTGTCGTGAAGGCTAAGGCAAACAGGCATCAGGCAGCGGCTGAAAGGGCGCCCAACAGACGCGAGCAGGAGAAAAACATCTCCAGACACTCCCGTGGGAGTTGCAGTGTGACGGCACCCGCAGGGCGCTGTGCTGGTAGCGTGGCACAGTCTGAGACGCTACGCTCGATGGACGGCCACTCTCTGGCAGGGACAGCCCTCTTCCCCCCCATCCCCAGTAGCCAGTTCCCTTGCGCCGGAAAGTGCGGGAAGCGTTCATGGAGGGCCCAAATGGGTGCAAACACCGTAGCCTGCTTTTGGTGTAAGTCCCCCTCTTACAGCCAGCTGCCTGAGGGCCACCAGCCACGCAAGGAGCAGGTCCCTGATGAACTGTTTTCTGCTTCCAGTCTTGGCAGCCTAAGTCTGGATCACTCCCGTTTACACATTTGCACCACTTATGTGCCTTAGCTGGAAAAAGGGTGGGCGAGTCCCCAAACCCTAAGCTGTTGGCTTCTCTTTTCACTCTGAAGGTAGTCGCTTGGTTTAAAATAAAGAAGGCGCCCGTT
>XM_030133558.1 PREDICTED: Sphaeramia orbicularis signal peptidase complex subunit 3 (spcs3), mRNA 
GTATAGTCGACATTTCCGGTTTGAACATTAGCTAAACTAGCTAGTACAACATAGCATTGTAGTCGAACGGTTATTTGTTCTCATTGTTTTTCGGTTTTGGCAGTTTTTCACGATGAATACGGTTTTATCAAGGGCCAACTCTTTGTTTGCCTTTTCTCTGAGTGTCATGGCGGCGTTAACTTTCGGCTGTTTCATCACTACGGCTTTTAAAGACAGAAGAGTTCCTGTGGACATCCACGTCTCTAAAGTCATGCTGAAGAATGTGGATGACTTCACAGGACCCAGAGAGCGCAGTGATCTGGGTTTCATCACATTTGACCTCTCAGCTGATTTGCAGCCAATTTTTGACTGGAATGTCAAACAGCTGTTCCTCTATCTGTCTGCAGAATATGCCACAAAGAGCAATGCTCTGAACCAGGTGGTCCTGTGGGATAAGATTGTCCTACGAGGGGAAAACACCAAACTGAACCTCAGAGACATGAAATCTAAATACTTCTTTTTCGATGATGGGAATGGACTCAGGGCCAATAAGAACATCACGTTGATGCTGTCGTGGAATGTGGTCCCTAACGCTGGAATCCTGCCCCTTGTGGCTGGAAGTGGACAAATCAGCCTGCCTTTCCCTGACACATACGAGAGCACCAAGAGCTACTAGACCCAACCAGATGTCCATGCTTTCATTACACACTGTACACGCCAGAAAAACAGAAACAAGCACAGACGCCAACAGATGACTCACACATTCTGTATATTATTGTTTCTTCATAGATGTACATCAATTTTTGGTTTATAAAAAAAAAAAAATTCGGA
>KP159845.1 Uncultured fungus clone OTU_86F_4_49 5.8S ribosomal RNA gene and internal transcribed spacer 2, partial sequence 
CGCACATTGTGCCCTCTGGTATTCCGGGGGGGCATGCCTGTTCGAGCGTCATTATAACCACTCAAGCTCTCGCTTGGTATTGGGGTTCGCGGTTTCGCGGCCCCTAAAATCAGTGGCGGTGCCTGTCGGCTCTACGCGTAGTAATACTCCTCGCGATTGAGTCCGGCAGGTCTACTTGCCAGCAACCCCTTAATTTTTTT
>XM_014413384.2 PREDICTED: Maylandia zebra KN motif and ankyrin repeat domains 4 (kank4), transcript variant X2, mRNA 
TATTAAGAGAGACAGGGTCAGTAGCATTCACAGAAACAGGAAGGACAGGAGGTAAGAAGAGCTATATGGCAGGCTGTTAGCTCCTACTCTAGCAAACACAAGTAGATGACTGAGAACTCGGCCTCCCATGATGGACAAGAAAAGTGCCAATGGCTTTCAGTCCAAGGCCAGTGAGGGTGGTGTTCAAAGGAAGCAGCTGCCCTACTCAGTGGAGACTCCCTATGGCTTCCACCTGGATCTTGATTTCCTCAAGTATGTTGATGATATTGAAAAAGGCAACACAATCAAAAGGGTCCACATTCAGCGCAGGGTAAAGGGCCCACCTAAATTCAGCACTCTGCCCAGAAATTTTAGTCTTCCTGGGCATGGAGTAAGGCCTCCCCCAAAGGAAAAGGACAGTACTTGGTCTGGGACGTCTACCCTGGGTCCCAAGCCTAAATCACGAGTGACAGAGGTTCAACAGATCTTTGACTTTCGAGCAAATGAAGGCGTGATTTCCAGCCAGAGCTGCAGGGGGACCACAAGTCAAGGAACTGGCTATGTTTCAACTAAACCCAAAGATGAAGTAGGCGCGGGGGCTCGCGGTGCTGAAGACAAAACTGGGGGGATTCAGATTCAGAGTCGTCCAAATCTGCTCAGAGCATCGAGCATGCCCATCACGCTACAGCAGCGTAAGAGTTCAGATTCAAGCAGTCCTGACCGTACCGTGGGAACACCAGAAAACGGCTCAACAGAGAACATGTTCCGGGCTTCACCAGACGTAACAGAAAGACGCTGTGTTCCCCAAGATCGAGCAGGTCTTCACCAGCAGATTACTGTTGCACTGAAGCGGGTCAGAGAGCTCGAGGAACAGGTCAAAACCATCCCAGAACTGAAAGCTCAGATCTGCTCTTTGAGGGAGGAGCGGGAGCAGCTGCTTCTTCAGCTACAAGCACAAGCCAAGGCCCAGGCTTCCAAATTATCTGCTACAGTACCAACAGGTTACGATTCTAGGACAAATAATCAATCGCAAGGACAGAGACCTTCACAGGAGATGAAGTTAGTCCTAAAGACTCAACCCACTGGACGTTTAGAAGACACAAGTCTTGGGCCATCAAACCAAGCTGCAGGGAAGGAGAAACAAGGTGAGACAGAGAAAACTAACGTGTTACTATCTGAAGTGGAGAGCTCGGCACAAGGAAAAAGTAGCATGTCCTCAGCACAAGAAGTGGAGAGACAATCACTGCAGCTGGACATACTTGAAAAACAAAAAGAAACAGAGAGTCCACTGGGACAGACAGTGCAAAAACTGCCACGAGACATTTCAGGGGAGGAATTACTATCTATCACAGTGGCTTTAAAAGAAACAGAGACTGCAGCAAAAGAAGGAAAACCAAAGGATCCAGATGATATGCAGAAGTTGCAGGAGAAGCTAACAGTACTAGAGACTAAACTTATTCAGGCTAGCCAGGAGCTAGAGAGCACTAATGCTCTTTTGAAACAGCAAATAGAGGAGAACAAGCTAAAAGAGGAGAGAATACTACAACTGAGTGAGGGAACGAGAGTGGAGGTTTGCACCGCACATGAACGTCCAAGAAGAGAGAGCATTGACACAGGGACAGTGACAGAAAGGATAGATTTTACCCACCAAGAAACAGAGACAGAATCGCCTGGTACTGTAGATCAGGGGACAGACACTGAAAAAATCTGCATTGAAGTGTGCATACCAAAACAAGAGACTAAAAGTACAGATCAAGGACCAGTGACGGGAAAAGCTGACACGCATGACCAGGAGACAGAGATGGAGGCGGCGATAACAGCGACAAGTCCACCGAGGCCCAGAGCCAACAGCATGGAACGAGGCACACTAACCGAGAGCATCATCACCCTGGATCAGATGACCGAGACCCCCGTGGCCGAAAGGGTAAACCAAGTCACAGAAACAGAAGGCGAGATGGTGACGGACCATCCTCACAGACCGAGGGCCAGCAGTGTTGACAGAGGGACAGAGACAGAAAGGGTGGGCACTGTGGACAGAGTGACAGAGACAGAGGTAGCCCAGAGAGCAGACCAGCAGACTGAGACAGAGATGGAGAGACGTCATGACAACAACCCAGCCAGAGGTGTAGAAGCAGAGAGTCAAGTGAGTGAGAACACAGGCAGCCAAAGAGACGAAGTCGTGGTGAGTGAAAGAACAGAAGACAGGGAAACATACGAAAGAATTCAAAGAGAGAGTGAACGTTTAGTTGCTGAGGTTTTATCAGAAAGCTCAGCGGCAGCTGTAGAAAGCATAAAAACTTTAGATGTTGTTAGGAAGAATGAAGAGTGCGCCAGTTCGGCTGCTAAAGCAGAAGAAAATAAGATTAAAGTGAGTTCCGAACAAGATGACTCAGAAACAAAAGAAATTACAGAAGTGGTTGAAACAAGACCAGCTGCCCTACAGAGAAGAGACCAGCTGCCCTACAGAGAAGAGACTACAGAGAAGAAAGAAACAGGAGCCGGGGAGGTTATGTCTGCAGCAGTCAAAGAAACTGTAGCCGCTGACACTGTTGCAGTAACTGAGGGGAATTCAGCTGTGAAGACAGCAGCTCCTGTAAGACCACAAAGAGGCAGGAAACCCTCAGTGGAGCAAACTCAGCCGTCACCTCCTCAACTTCAGGTGGTGCCTGTGCGTCCTCGTAGGGGATCCAGTGAAACTCAGACCCAGCCGCAGACGAAAACCCAGCCCCAGGTGCAGGAACAGAGTGCAGCTCAGCTTGAAGCTCGGTCCCCAGAACAGCTCTCTGAAACACAGGTAAAACATCAAACACCGTCTGTGCCTCAGGTTGAGGACCACACTATAGCAAAGAAACCTCCTGGAGGGTCTGGAGAGAAGCAGTCTGAATCTCGACTTCAGTCTGAGACTCAGGCCTTGTCTCCGGGCTCTAGTGAAGTCCAAGTCAGGCCTAAATCAATACAAGCGCAATCTCAAACTTCTGTACCTCGGCGGGACTCAAAAGAGCTGAAAGCACCGCAGAGGGTGTCTGGTGCATCACACACTCCTAGACGGGGATCGGGAGAAGCCCAGACCCAACCACCTCGCCAAGCGTCAAGCGATGCTCAAACTCAACCTCAGGGTTCACGTAGAAGCTCCAGTGAGGCTCAGGCCTCTCCGAAAGATGCCAGTGAGACACAGTCACTGCGCAGAGGCTCCAGTGAAGCAGCTCAGCGCCGTGGCTCCAGTGAAGCAGCTCAGCGCCGTGGCTCAAGCGAAGCCCAGGGTTCACGTCGCGACACCGGGGAGGCCCAGCCTCCTCGAAGAGGCTCCAGCGAATCACCAACATCGCCTGCAGCTTTGGGTCAAGTTGTAACTCGGATAACGGGGCTGCTAGGAGAGCAGTGGGCACATCTCGGAAGCAGCTCTGGCACTCAGCAAACAGCCAGCCAGCAGGAGAGCGCGAGCACACAGAAAAAGACGACAGGGAAAAGAGCAGAGGCTGGAAAGGCAACGTCAGCCAAGCCAGCGGGGAAAGCAGCCCCATCAGCAGCAGCGACAGGGAAACCAGCGGGGAAACCTGGTACTTCCAAAATGAGCTCCATTCAGAGCCAACTGGTCAGCTCCCTCAGTGTCCTCTCTGCCTTCTACTCCCCAAGCCAGAAAGCGGCTGCTGCCAGCAAACAGCAAGAACAAGGTCTCAAATCCATCATGAAGAAAAATGGTGGAGCAGGCAAGCAGGGGAACAAGGGAGCCAAGAAAAACCTGAAGTTTGTGGGGGTGAATGGAGGATATGAGACGACATCCAGTGAAGAGTCCAGTGGAGATGAGAAGTCAAAGGTGGAGGTAGAAGAGGAAGATAGCTCAGAACCAGAAGTGGAGAAGGAGCCTGAGAAGGAGCCTGAGAAGGAGCCTGAGAAGCAGCCAGAGGAGGGAGCAGAAGCCCAGAGAAAAGATGCAGAGGTCCCAACTGAGGGAGGAGGTGCTGTGGCTAAAGAGAAGGAGACTGAAAGAGGTCTGCTGGATCCAGAAAGTAGCCAGGAGCTCCTGGAAGAGCAGGCTGGAGGGGGAAGAGTCGACAAGGGGTTTATAGATGCATGCCTTTATGTAAAGGACCGCATGGAGGAGGTTTCATCCCCAGATAAAGAAATGCGCCAGGTTTTAGTGGTGCTCTACCAGGAGTGGTTCAGAGTCTCCAGTCAAAAGGACTCGCAGGCAGATACTGTCAGATTATACCTGCGACAAGTGGGGATGACCACACCCACTCTCCTGCCATATGTTGTTAACTTGACAGACGGCAATGGGAATATGGCTCTTCACTACAGCGTGTCACACTCCAACTTCCCTGTGGTCAAACTGCTGCTGGATACCGGCCTGTGCGAAACAGACAATCTCAATAAGGCAGGCTATACTCCAGTGATGCTGGCTGCTCTGACGGCTGCTGAGAGCCCCGATGATCTTGAAGTGGCACAGCAACTGTTGAAAGTGGGAGATGTCAACGCACGCTCCAGACAGGCGGGCCAGACAGCACTCATGCTTGCGGTGAGCCATGGCCGCGTTGCCATGGTGAAGCTGCTCCTGAGCTGCGGCGCGGATGTAAATGCCCAGGACCGCGAGGGCTCGACGGCCCTGATGTGTGCCAGCGAGCACGGGCACACGCACATCGCTCGCCTGCTGCTGGAGACAGGTCGCTGTGATACCAGCCTCAAAGATAAGAACAGTTCTCCACAGTCGCTGTCCACATGGGTCAGTGGGACCAAGAAGCACTCTGCTAATGTGTGGACTCTGACCAGCAACATCCAGCAGGACCCAGACAGCGTTTTCTATCTCCCAGCTGGAGTTTTTGTTTGTCTGTGACTGGAGAGTCAGATTTTTGTTGAGCTTCACACTTGCAGACCTAAGTCAGTTTGCAGAG
>XM_013897292.1 Thecamonas trahens ATCC 50062 hypothetical protein partial mRNA 
ATGGCCGACGAACCTTCACCAAATCAGCCCGTGCCGCCCTGGGCCGATGCCGATCTCTCGCGATGCCTGCCGACGCTCGCCGCCGGCGGTGAGCGTCAGGATATGGAGTTCAAGGAACGCTTTCCCGGCCAGGCACGCGATCTCGCCAAGGAGATTGCGGCCTTCGCCACCTCCAATTTCGGCACGATCCTGCTCGGCGTCTCCAAGGCGGGCGGGGTGATCGGCCTCGCGGATTGCGAAAGCGCGTCCGAGCGGGAACGCCTGCTCGACCGCGTCGCGGGCATCTGTGCGAACAGCATCAAACCGTCGGTGACGCCGGCGCTCGCGTTCGCCGTGGTCGAAGACCGCACCGTGCTCGCCATCGCCGTGCCGAAGGGCGATGCGCCGCTCTACTACGTCGCCGGAGTGCCGTACCTCCGCCAGATGGCTACCTCGCGGCCGGCTGAGCCGCACGAGGTGATCGACCGGGTTCTCGATTGGGACCGGGCGAGAAACGGCAGCGGCCGGCCGAGCCCGGAATCCGAGTTCTTGAGCCAGACCGCGTCGCTCGTCGTCGATGTCGTCGTATACGCCGACGAACTCGAAGAACGTCGCGTCAAGCCGTGGCTCAACGAGACACGCCACGGACTCGCATGGGCGGCCGAAACGGCGCGCGACCTCGCGGCCCGGACGCCGGGAGACTTCGCGGAGATGGTCGAGCCGTTGGAGGAGATGGCGAGCAATCTCGACCGTGCTGCACACGAACGTCTCTCCATGGGCGGCGGCTGGGACGAGATGGACGCGGCGGCGCGGGCGGCAAGGGAGACGGCACGGAGCATCTGGACACGCTGGATCGAGCCGCACGGCTTCCATGCTGACTCGGTCGCCGGCGTGCGGGAGACGGTCTCGGAAAACGCGCGAAAGCTCGCGAGCCTCGCGGCGCGGCTCCAGGAAATGGACGATCAGGGACGGCTCGACGGCATCCAGTCGTCGGCCGGAGAGATCGGACTGGTGCTGCTCAAGGCCGCAACCTTCGGCGTCGGGCTCGGGGACGATCAGCGGATCGAGGAGTTGACAGCGATCGGCCGCGCCTTGCGCGACGTGGAGACCCGGACGATCTACGCCGACGGCGGCCAGTCAGCCCGGAGAATACTCGACGACGTCCGTGACGCGAGCGCGAGGCTGAACGCTTGGCTCGCCGGCCTTCCGTCTGAAGCGGAAGCGGGAGCATGA
>LN881636.1 Terribacillus sp. 1011TES3C6,21 partial 16S rRNA gene, isolate 1011TES3C6,21 
GGGAAATGGCGCGTGTCTATACATGCAAGTCGAGCGCAGGAAACAGATGACCCCTTCGGGGTGATTCTGGTGGAATGAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTGCCTGTAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAGTATTTCCTTTCTCCTGATTGGAAATGGAAAGACGGTTTCGGCTGTCACTTACAGATGGGCCCGCGGTGCATTAGCTAGTTGGTGGGGTAATGGCCCACCAAGGCGACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGCGATGAAGGCCTTCGGGTCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTACGAGAGTAACTGCTCGTACCTTGACGGTACCTAACCAGAAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCACAGCTCAACTGTGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGATATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGAAGTTAACGCATTAAGCACTCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTCAAAAGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCGCTGACAATCTTGGAGACAAGACGTTCCCTTCGGGGACAGCGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATTCTAGTTGCCAGCATTAAGTTGGGCACTCTAAAGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGGATGACGTCAAATCATCATGGCCCCTTAT
>XM_022540745.1 Aspergillus glaucus CBS 516.65 hypothetical protein (ASPGLDRAFT_127844), partial mRNA 
ATGATTCCAACTCTGCTGTTCTCAGGTTTCTTTTTCGCCAATGCCTTTGCCATTCCCCTTGCAGGCCACGAGCAGCAGCAGCAGCAGCAGCAGCCATTGGGTAATGGGGTCTCTTCCTCCACGGCGCATAGCGCTGGAGGGGCGCAGAGGCTGACTGGGCGATTCCTGCATATCACTGATCCTCATCCTGATTCGCACTATAAACAAGGAGCGTCGGCCGACAATAATTGCCATCGAGGCCATGGATCTGCTGGATACTTTGGAGCGGACGGAACCGATTGCGATGCCCCGATCACCCTGATGAATGCGACTTTCCGATGGATCGAGCGAAATTTAAAGGGGAATATCGACTTCGTGCTCTGGACCGGCGACTCCGCCCGCCACGACAGGGATGAAAAGATGCCGCGGAAAATGGAAGAAATCATCCACCTGAATGAAATCTTGTCCCAGCAATTCATCGATGTTTTCCAGGACTCCATCCCCGTCGTTCCGACATTTGGCAACAACGATATCATGCCGCATAACACCATGAAAGAGGGACCGAACCGCTGGACGAAGACTTTTGTGGATGTTTGGGGCAAATTTATCCCGGAGGCTGAGCGCCATAGTTTTGTGGAGGGTGGCTGGTTCACGAGCGAAGTGATTCCTGGCAAATTATCAGCCATCAGTCTCAACACCATGTACTTCTACAGCTCCAACTCCGCCGTGGATGGATGCGACGACAAGGATGAGCCGGGATACGAGCATATGGAGTGGCTCAGAGTTCAACTGAAACTGCTTCGCCAGCGCAATATGAAGGCCATCCTGATTGGACATGTACCTCCGGCCCGGGCAGGCCCGAAACAAGGATGGGATGAAACGTGCTGGCAGAAATACACCCTGTGGTTGCATCAATATCGAGATGTCATCGTTGGGAGCGTCTATGGACATATGAATATCGACCACTTTATGTTCCAGGACAGCCACGATATCGACATCGTCGATTTGGAAGGTGACAACACGGGATCTAATGATTTCTCTGTCCAATCCATGGAAGACTATCTCGAGGCCCTTCGGGGCCAATGGTCCGATATGCCATCCCCGCCATCTGGTCTTTCAATTGAGGAATGCTTGGATGAAGACTTTGCGGAGACTGATGGCAATGCGCCTTGGACGGACATATCCAAGAAGAGAAAGAAGAAGAAGTTCCTGAGAAAGATCGGTGGCCCTCTGGCCGAAAGATATAGTGTCTCTTTGGTGTCGCCCAGTTTGGTGCCAGAATACTTTCCTACGCTCCGGGTGATTGAGTACAACATTACTGGCTTGGAAGATATGCCAACTTGGTCTGATATTCAAGAAAACACACAGATCTCATATCCCAACGACGATGACACACCGTCCGTTTTGGAATCCGAAGACTCTCCGATGATGAACAATGACAAGAAAAACAAGAAGAAGCCAAAATTCAAAGTACCAGAACCCCCACCGTCTTCTGCTCTTCCGGGCCCTGGCTACTCGAACCAGCAGTTGTCCTGGCTCGGATATACGCAGTACTACGCCAACCTAACGAGGATCAACGAGGAAGTGGCTTTGCACGAATCGACGCACCAAGACGGAACCGGGAATAACGTCAATGCTACCAGCGTTGATGATGTATTTGGCTTTGAGGTCGAGTACGATACTCGTAACGACCATATCTACAAAATGAAGGATCTTACAGTCCGCAGCTACTTCGATCTAGCCAGTCGGATTGCGAACAACATTCCGAATACCCTGGAATCACCTGATGACACGAACGACGACGGTTATGATAGCCAGAAGAAGAAGAAAAAGAAGAAGGGGAAAAAGAAGAAGGGGAAAAAGAAGAAGAATAAGAACAGGACATGGAAGACCTTTTTTGATCGGGCGTTCGTCGGGTACCTGGACATCAATGATCTTGAAGAGACAGAATCATGA
>KX654414.1 Uncultured bacterium clone OTU 2009 16S ribosomal RNA gene, partial sequence 
GGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGAATGATGAAGGCCTTAGGGTTGTAAAGTTCTTTTGTCAGGGAAGATGATGACGGTACCTGAAGAATAAGCACCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGTGCTAGCGTTGTTCGGAATCACTGGGCGTAAAGCGCGCGTAGGCGGCTTTCCAAGTCAGAGGTGAAATCCCTGGGCTCAACCCAGGAACTGCCTTTGAAACTGTAAAGCTGGAGTGTCGGAGGGGATGGCGGAATTGCTAATGTAGAGGTGAAATTCGTAGATATTAGCAGGAACACCGGTGGCGAAGGCGGCCATCCGGACGACAACTGACGCTGAGGCGCGAAAGCGTGGGGATCAAAC
>XR_002806955.1 PREDICTED: Equus caballus NK6 homeobox 1 (NKX6-1), transcript variant X2, misc_RNA 
ACAAAGGCTTTGGGGTCTCCCGGGCCTGCAAACTGTTGATGAACAAAAGGAATCAAGCCCCCGCCTTTGAAATTAGGTTAATCTAGATAGTAGAATGTGCTGGGGGAACTCGCCATTATTAGAGAATAAAAGCCTTACCAAAATATCAGCCCTGAGGATAGATCAGGCCAGTTAGATAGCTTCCATTTATTCTATTTGTAAAGATATTCAAGCTTTTGTTTATCAATTCAGGCCCCACTAGTTATATAAGTTCCTAATGTGTATCAGCATTATAGTGCTACTATATTAACTTGCAGGGTAAAAAAAAAAAAAAAAAAATCCAAGGATCTAAACACTTAGCACGGACGAATCTATCTGCTTTTAGCTTAGCAGAAAGCAGTCACTTTGGAATAGTAATTTTCCAAATGAATTGACAAGATTATTACTATATTATGAAATTGAATTCTGTTTAAAATAAGTTTATCCACAGATGTAAGATATTTTACTGTTTGTGACAATTTATAATTAAAATGTCACTTAGCTTATAATTGACTTGTACAGTGTATTTCCAGGGAATCAAATTTGAGAAATCTTTCCTTGGAAAATAAAGGGATTGAGCCAGCTAGGCAAATTAAATCCACAGTTTCCTGTATTTCCAGTATTCCCTTTTGTTCCTCTTCTTCAGTTTATTATATTTGGGGGTTTTTTTGGGGGGAGGCAAGTGTATTTTCATTAGTTATATTGTTGCTCTTTAAATTAAGTAGGAATAACATTAGCCATGTCTGCTGGTTAGAGTGTATTTCTCCCTGGACAAGCATCATAAAATGCATTTCAGGAGTGATTTTGTATGTGACCATTAGAATACCATCACAGTTAAAATTATTTTTGCAGTGGTTGGTACAGAGCCTACCACAGTAATCTAGAGGTCTTCATTTGTCACCATAAATATGTCTGCATGGCTAGAAGTGAATTATTATAGCTGTATAAAGAAAATAAAAATCACTTTCTTAATTCCGATTCTCTAGGTAAAATACATAACGGATGAGAAAATGGATGAGAAGCATAAAGACAAGATAATTCAATATATTTGGGAAATTGCTTGCTTATTCCTGATGCTTTAGGTTGCAATATGTGTATCAAACACAGTGTCAAACATCGTGAATAGGCCTAAAGTATTTGTATATAAAAAGATTGTCTTGGGGAGAAACAATATTAAAATAATATTTGAAAGACCTGGCATGTTAATAGTGGGAAATAATGTAATGGTAATAATGGGGAAAAATGTAATTGGCAAAATTACGCTTTTAAAAAATAACTGATGAAAATTTTAGCCTTGACTTTGATTTTATGAAAATCATTAAACCCGAGAGACAGAGATTGAGAGAGAGAAAGAGAAACCACTGTGATGATTTTGACTGAGCTATTAAATATTTTCATGCGTTTATGTTGGTTAGCATTAGTGATTTGAGGTTTCTGTTCAGCAGATTTTTTTAACTTTACATCATACACTGCAAGTGTAAATAGGGTGGGGAGTGTTTTCCTACCATGTTTGTGTGTATTCAGACCGGGAGAAGTGTAACAGGCAAATATCCAAAAGCGAAAAGGAGAGCAGAGGTAATTGGGGGAAATGCTGTGCCTTCTCCCACAAATCACACAAAACAGCAAGTACGCTTCAGGTTGTTTGAAATATCTTAATCTGAGAAAGAAAATAACGAATACAGTCACAGTCATCATGGGGCAACTTTACGAAGGGGAAAAGTTTTCTACTTCAAACTGGAAAGTAGGAAAGCGGACTCATTTTTAGGGAGACTCATTTTAAGTTTCCAAGTTTTTTCTCTTCTGAGAAATCGCTCTCTGACAACCTCAATACTCTTGTGTTACCATCGCTATGGCAACGGCAGTTTGTTGGTGCCTGTTACTCGGAGGAACCTGGGGCGACGGAGACTGACTTTGACGGCCCAGACAAGGAGGTCTGGTTCCAGAACCGCCGGACCAAGTGGAGGAAGAAGCACGCGGCCGAGATGGCCACCGCCAAGAAGAAGCAGGACTCGGAGACCGAGCGGCTCAAGGGGGCCTCGGAGAACGAGGAGGAGGACGACGACTACAACAAGC
>XM_006965968.1 Trichoderma reesei QM6a uncharacterized protein (TRIREDRAFT_108278), partial mRNA 
ATGGACGAGCAAGAACAAGACAACCTCATCCAAACCCTCACAACCCAAAACGCCTCCCAAAACAAATCCACAGCACGCACCCTCCTCCTCCTCCCCCTTCTCTCAACAATAGCCTACATCCGCCCGCTCTTCGACCCCGCGACCGCTTCCTTTGCGATATTCTGTCTCACGTCCCTCCTCGCTACCGCGTTCCTCTTGTACCGCCTTCCGCCGACCGAGACGGGTATAATCATCGTCGATGACTGGGCGCACAGACGAACTGCTTCTTCTTCTTCTTCTTCGTCGTCGTCTGTCAATGCTTCTCTACGACAGCATAATCAGTCGCTGAGGGGCCTTTTGGGAAGGGCGCAGGTGGAATGGCGGTCTCCCTTGGAGAGGACGCTGCCGTATCTGAATCTCGGTTTGGTTGTGCTCTTGAGTCTCATGGGGCTGGTAAGGGGCGACCATCGAGCAGGTGGCTTTGGGTGGGTGAGCATGGGCAACGTACCAGGCCTGGTTTACTCTGTCGCCATCACGGCAAAAGTCGTCATGGCGGGCGTTGACCCCGAAAGGGAGCTGTCGGGCCTCAAGTACGGCTACAAAGGCGCTTGA
>XM_008866548.1 Aphanomyces invadans hypothetical protein mRNA 
CGTCCATTCCGCGTGAAGTCGGTTGCCGCCCGCGCGAAGGAACAACTGGCGACGCATCCCCCAAACAGGAACAGGTGATGAGGAAGCAGCAACGTGGAGGTGGAGACGGTGACTACGGATCCAGTCGCGGCCTGGAGCGTCAGAAGCAGCTCTGCGATGAAGGCATGGCGCTGGTGAACGAAAGCGTCGGCATTCAAAACTCGGGGGGAGACACGGACCTGGCTGAGCGCAATTTGAACCGCGCTGTCGAGATATTTGAGACGGCTCTGGCAATTCAATACAGCACACAAGAAGAACAGGAAGCGGCCACTCGTCTGAACAACAAGATGCTTCGCTATGTCAAAATGATCAAGACTCAAAAAGCCAAGAACCCCGCGATCGGCGGCAACAAGCGCACCGCGTCCAAGTATAACATTCTCGAACTCGACAATCTCCCGCAGATTTATCATTCCATTGCGGGCAAACTGTTCAACTCGCAAGTTGGTGACGTGTTTGAATCGCTCAAAACGACTTTTGGTTTCCAGGACAACAACGTGCTCAACCAAAAAGAGCATGTCCTCTTGCTCTTGACAAACTACAAAGAGCAGCTGGACGTTCCAGACCCCAAGGCACCGGCGAACCAGCCCGTCCCCGCTCGCGACCAGCAAAGGGAGATGCAGTTGGCAGACAAAGCTGTCACCAAGTTCCATGCCAAATTGTTTGACAATTACAAAAAGTGGTGCAAGTATATTGGCCAAAAGCCCAAATTTACTCGGGACAACTTGACTGATATCGTGCTCTTCTTCCTCATTTGGGGGGAAGCTGGCAACTTTCGACAGACACCGGAATTGCTTTGCTTTTTGTTTCACAATCTCGCTCCGGCGTCGCAATCGGGCGGTTCGAAGGAGTCAGGAGACTTTTTGGCATCGGTGATCCGCCCCATGTACAACGAACTGAAAAAGGACAACGACAAGAAGACTTCCAAGGGCCAGCGCGCCCCGCACAATGAAATTCGCAACTACGACGACTTTAATGAGTTCTTTTGGACGAAAAAGTGCCTCAAGTACAACGCGTACACGATCGGGGAAGCGTTTGCAAGCGCCGACAAGAAGGGCAATCCGAAGGTCGTGAAGAAGACGTTCATCGAGAAGCGAACTTGGTTCCGTGCCCTAACGTCATTCCGCCGTATTTTCCTCTTCAACTTTGCACTGTTTTTGGCCACGGTTGGGTTTGCTATCAACATGATCACGCTGTGCCCGGACAGTCCGATCATGTATGGCCCTGACCTGGGCAAGATTGAAGTGTTCGGGAAAAAGTACTACGACAGCGTCACCTACACCACGCCGTTGACGGACACCGAAACTACCGCCCTGACGGCAGTCGAAGTTGACAGCACTCAAAAACTTTGCAACCCCGCGAAGTTGGCGACTTGCTTGGGAGTTGGAACCTATGTCCGAGGCGAGACGTTTGCGCACTATCCCCGCGACTTCAAGGAATTGATGAGTCAAATTCCTTTTCAGGACTGCATTGAAAGGCAAAGCGGCCGTTGCACGTGCTACATTGATCTGATCGAGAAGTGCTTTTCTCAAACTGGAAATGCAACCGTATACCCTGATGGCGGTTTGAAGAGCATTCCGGTCCAGTACGATCAAAAGTTGTGCGATCTGGTGTACAAGAAGACTGCCTTGGCCATCTTGAACAACAACACAGACGGAAGACTCAACTGCGACATGTGTCGTTTGGAGCCGCAGAGTTTGTTAAAGTCGTTGCCCAAACTGATCGGTTCATTTATCGATTTCAACCGATTCACCAAGAAACGCGACTTTGGTCCGCTGTTTTTCTTGGGTGGGGTGGGGTGTTTGGTCCTGGTGTTTGCGTGCGAGCTCCTCGGTCGAATGATATCGGGTGTCGGCGTCGGATATGTCGGTCGGTCGCTGCCAGTCCCATTTGGCGCGTATTGCCGGTACACGTGCTTTTGGCTCTTTTTGTTTGCTTGCAAACTCACGTTTGACTACCAATTCATGGTCAAGAACTTGGTGGAAACGACCGTGTTCATTTGGTCGACGGACGCAAAGTTGCACCACCCGACGACCCAGTTCCTCATCAGCTTCAGCTTCCACAACATTTTGTACATTGCTTTCTTGTGGATTCCGGCCATCACGGTGTTCCTGTACGACGCCCAGATCTTTTACGCACTCTTGTCGGTCATCTTTGGGTCGGTCCGCGGGTTCAACTTGCGCATTGGCGAGCTCCGATCGTTTCGCATTCTTCGGTTGACGTTTAAGTCGATCCCAAAAGTCTTCAACAAGAAGCTCGTGTCCAACTTGATTGAACGTGGCGGCAAGAAGAAAGGCAAGAAGGACAAATCGAAGAAGGGGTCCAAGGACGATCCTGCTCCGGAACGTCGATTCCAGCGCGTCTCGTACTCGGAAGGGAGCAAGCCATTGACCGGCACGGCCAAAGGTTTCAGTTCACTGTTGGAAAACGACGGATACAACGAGCTGCGAACCCCCGGTGGTGTCGATGCGGACTCGAGTACTGGACGCAATTCCAACATCACGTCCATCACCGGTGTTTCTGGGGCTGAATTTGAGCGCACGATTCCATTCGCCATGGCTTGGAACCGCTGTCTCGCTAGTATGCGCGAAGCGGATGTGTTGAGCGACCGCGAACTGAACGTACTAAGCTACTTGATCGACTCGAAAGACGTGGCGGAGCGACGTCTGTACCCGCCAGCTTTTTTGACGGCTGGCAAGTTAGACGAGTCCATCGACATCATTATTGAAAGCTACACGTTGCACGACAAGCTCAAGTCGGACAAAAAGAAGGACAAGACTCTGCAAAAGGTTGAAGTGTCGATGCGCGAACGATTGACCAAGGACGATCTGCGCGTGGAAGCCATTTTGGGCTCGTACAAGTTTTCGTCACAAGTGATTAAGTTATTGCTTGGCGACGAACACAAAGAGTTGGAAGCGTGTTTCAGCTTCATGGAGGAGATGGCAACCAACAAGACGACGTTGAAAGGTCTCAACTTCAGCAACTTGTACCAGGCTCGTTCGTCGTGTGCGGATTTGATGAAGTCGATTTTGGAAGTGCCCAAAGGCGCCCAGGAAGGCAGCATCAAGTTTTTGCGCTCGTTGTACCACGTTATCGACAACGTCGAAGCTGTCATGGGGTGCCTGAAGAAGGTCCTCTCGAAGCAAGAACACTTGGTCAAAATTTTGAACGACACGCCATTGAAGCCCAACTCATTCTTTTTCCCTGGCGACGCACAACACTATGCGAGTTCGCAACTCCAGCGCATCGTGAACGATCAAACGGCGATTGACATTGTGTCTCGGGCGTACCAGCTCCTTACGGTGGACAACTTCGATGCCGAGCCTCGATCTGAGGAAGGGCAGCGCCGTCTACGCTTTTTCACCAACTCGCTGTTCATGGAAATGCCTGAAGCCAAACCTGTGAGTCAGATGCACTCGTTTTCGATTTCGACGCCGTATTTCAACGAAATCGTGTTGTACTCGGTGAAAGAGCTGACTGCTGAAAATGACGACTCGATCAAGCTGCTGTACTACTTGCAAACAATCGATCCGTTCGAGTGGGAGAACTTTTTGGAACGCATCAACGTCAAGGATATGAACGAAGCCTTGAAAAAGTACCCGGAAGAAGTGCAGCTATGGGCGTCCTACCGCGGCCAAACGCTAGCCCGTACAGTTCGGGGAATGATGTACAACGAAGAAGCCATTCGGTTCTTGTACTGGTTGGAAATCGGCGAAAACGAACCCATGCATTTGCACGGATGCTCATGCAATCGGTGTATCAAGTTGGACGAAATGGTCGCGCTCAAGTTCAACTATATCTGCTCGTGCCAGATCTATGGCAAACACAAGGACGAACAGCGCCAACAAGCGCAAGACATTGACTACCTGCTCATGAAGCATCCTGGTCTTCGTGTTGCATACGTTGATGGCCCCAAGAAGGTCAAGGATGGGCCACCCAAGTACTTTTCCGTGCTCATTCGCGGAATCGGCGACAAGATCGTCGAGGTATACCGCGTCGAGTTACCGGGGGATCCCATCATCGGTGAAGGGAAGCCCGAGAACCAGAATCACGCGATCATTTTCACACGGGGGGAAATGCTCCAGTGTATTGATATGAACCAAGACGGGTACCTAGAAGAGTGTTTGAAGATGCCCAACTTGCTCGCTACGGTGGACCGCAAGGAGCACTCGAAGAACCCGTTGACGATTATTGGTTTTCGGGAATACGTGTTCACTGGTGCCGTGTCCAACTTGGCGAGTTTCATGCAAATCCAAGAACTGTCGTTTGTGTCGCTGGGTCAACGCATGCTCGCCCTGTTCCACGTCCGACAACACTATGGCCATCCAGACGTGTTTGACAAGATGTTTGCCATGACAACGGGGGGAACTGCCAAGCCTTCGAAAGGCATCAACTTGTCGGAAGATATTTTCGCCGGGTTCAACACGACGCTGCGCGGTGGTCGTGTGTCCCACGAAGAGTTCATTCAAGTGGGCAAAGGTCGTGATGTCGGCATGCAACAATTGGCGTTGTTTGAGGCCAAGTTGTCGTCTGGTGCCGGGGAGTGTGTCATTTCTCGCGATGCGTCCCGAATGGGCAGCCGCCTCGACTTTTGGCGCCTCAACTCTTGGTTTTATGGCAACCTGGGGTGGTACTTCACGCAAACGATGACCGTGTTCGGCATTTACGCGTTTATCTACGGCAAGATCTACTTTGCGTTGAGTGGCCTTGACTCATTTTTCCTCAAATCCGGTCGTCTTGGGATCAGTGGAGTCCTCAACACGTCATGGGCATTGCAGTTTGGTTTCCTCCTCGTCGTGCCTGTCATTGCCGTCGTGGGTGTCGAGCGCGGTTTCCGTCACGGGTTCTCGTACTTGGTGTGGAACGTGTTGACGCTTGGCCCGCTCTTCTTTACGTTCCAAATGGGCAACCGCATGAACTATTTTGATCGGACGTTGATCCATGGCGGCGCCAAGTACCGCGCAACCGGGCGTGGGTTTACCATCAAGCACGAAAAGTTTGCCGAACTGTTTCGATTTTACGCGTTCAGCCACTTTTACCGCGGCGTCGAGTTGGTGTTTTTGCTCATCCTGTTTTCAGCATACGGGACGTTTTCATGGTGCAACTGCTCTTGGCGTGTCGACCAGCTCTTTTACAACAACATTGAGCCACTGCAGTATGAATGGGACAAGCGATGTTATGCCAACTTTTACCAGATCTGCGTGTTGCCAACGAACCAAAACTACGGCATTATGAGTTTCTCGCTGTGGATTATTGCTGGCACTTGGCTGTGGGCGCCGTTCTTCTTCAACCCGAGCGGCCTGGATTGGGACAAGTGCATTGACGACTATAACGACTGGCAAAACTGGCTGCAGACCAAGAACGACTCGTCGGAGAGTTGGTTTGGGTGGTGGTCGAACGAACTCGAATACTTGGAGCACTCTAGCGTGAGTGCGCGCGTCGTCCAGTTTTTGCGCAAGTGCCGTTTCTTGTTTGTTGCGGTTGGCATTTATCTGCAGCTCATGTATCGCTTGTTTTACAAGGACCAGAACAAGGTGATCGTGTTCGACTTCCAAAGGAACTTCATTGAGTCCCTCAAGCCATTCATCATTGTCGGTGCATTGGTGGTGGTCATGCTGCTCTTGATTTGCTGTGGGTACTGCGCGAGTCGGTTTTCGAAGCGCAGTCAAATGAAGCAGAAGAAGTTGCGCAAGATCAAGTTCAACGTGAGCTTCTTCATCATGGTGCTCGTGCTGTTCTCGCTGCTGTACTTGACCATTTTGCAGCTCGTCGAGGTGTTTTTGATTGTTGTGCTGGCCGTGTACTGGTTTGTCCAGTTTGCCATCGTGCGCCTCAAGTCGAACCATGTCGTGATCCTTGCAATGGCCAAGAGCTTTGACCGGGCCGTGGGCTGGATCGTGTTTGGTCCAATTTTGTTTATCGCCATGTTTATGCCGTTCATTTCGTCGTTCCAGCAACGCGTGATGTTCAACAGCGCATTTACGTCGGGACTGGAGGTGTCCAAGCTCTTTTCCCACGACGTCATGCCGTCGCACACGGTCAAGACCAAACGCTCCAAGAAGAAGAAGCGCGACGAGTAATTGCGATTTTTGTATACCAAAGAATACATTTATAAATTCGTCGCCATTTTGGCCATTGTTGCCACAGTGGTCATTCGTTTCCAGTGACGAAATTCGGGTTTCATTCGAATTAAAAAAAAAACAAATTCGATTTTTCC
>XM_050630547.1 PREDICTED: Bombus huntii uncharacterized LOC126871580 (LOC126871580), mRNA 
TGAAGATCTTATTATATTGTACATAGAGAATGAAGTGGATAGTTTTTGGTATCACATTAGTAATACGCAATTATATAATATCCTGTCAGGATATTGTATTTCCAAATAATGAAGAGATATCTCACGTGAGCGGCAATGCGGCGATAACAGAACGTATTCCAGTGGCTGCACCAAATATATGTCCCAAAGGCATGCTTCTTTATCCTGGAGCTGGAAGTAAAAGTACATGGGTATGCGATTGTAGACCTAGATTTCTATATTTTCCATTGAATGATAGTTGTCATGAAGCATATAGACAAGGACCTTGTGCACCACAGAATTATGTTGTACTTCCTAAGGATGAAGTTATACCAAAGTGTGTGAAAAATCCTTGCCTGGAAGACGGCTTAGTACAATATAATAATACATGTTATCCTCTAAGAACTACAGGTGGTCCTTGTGCCCCTAATGGAGTAATAGGAGTGAATGAAACTACATTTGACTTAGAATGTATGTCAACAGATATTGCACCATTCATAATTATTGATCCACCTTTAAGAAAGTGTCCCGTGGGAAGCCGTAGGAATGTACTTGGAATATGTAGAGTAATTTTAACCTAATATGTTTCTATTTAACAAATTTCTGTTTTTTTAATAACCTGGTATTTATTTGTTTGGCCTCTTTCATATAATAAATATCAATATATTATTATAATTCTGATATATTACGAGAATATATATAACATTTATATTTACAAAATATAGTTCTTATTACATTTA
>XM_020521000.2 PREDICTED: Rhincodon typus raftlin family member 2 (rftn2), transcript variant X1, mRNA 
GTCTACAACCATTTTGGAACTTTCTACTTCAGAGTTTCCATCTGCTGTTTGGACAGCCATCTGACTGCGCCCAGAGCACTTCTTCACATCGCAGATTCTGCCATGGGTTGTGGGCTACGAAAGCTGGAAGAGCCTGATGATAGTAGCCCTGGCAAAATATTTTCTACTCTGAAGAGACCACAAGTGGAAACAAAGATTGATATTTCATATGAATACCTTTTGCTGGATTTTACTTTAGATATTGGTTCAGCAAACCCAGATGTTATTAAGATCTCCTCTCTTCTGGATCTTAATTCCAAATTGGAAGCATACTACAAGAGAGGATATGTTGTTGTCACTATCCACCCTACAGTTCTTTCTATGGGGCAAAGAAAACGATCTCCACTGAGTTACATTTATAGAGTTATATTAACTAAAGTAAGATCAGGTATAAAGACGTCAGAACAAGGAGAACCAAGACACTTAAAGCTAGTTGTTGAAGAATGGTCTGTGAGCAATCAAACACTTACCATTGATGTTGTAAAAGGACTGTTAGAAAAGGTGAATGACTTAACTAAGAAAGGAATGAGGTTTGTCGGATTTTTAAATCCACTCAGTACCCATTCAAAGGCCTGCAATGGTACAAAATCATCAAGAGAACTAGATGCAGATTTGGGACAGGATGTTGACCTTAAATTGCCAGATCAACAAAAGCAAAACCCCGATAACCATATAAAGTGCAGTGAGGAGACTTTTACCAAAAAGCCAATGGAATTTGCAACAGAAAGAGAACACTGTTGCAGTAAAGTCACTGATGTTTTAGAGAATAGACCAGCTCCAGAGGAGGATCTTTTGCATGGAAGAGAGAAAAGGATTGGAAACGAAACCTGTCCTTGCAGTGAACCAAAGGAAGATTTCAAACTGTTTGCTGTGTTCAATGTGTCGGATGAAGACTTCAGTGAACGGTCCTACCATGAAGGCAATATATCACTCAGAGTAACAAGGAAGGGCCAAACCATTTGTACCCTGGAGGCAGATTGGTTGGAAATCACAACATCTTATTATAAAAGTGGGATGTCGTTGGTTGATTCATTCATAGTTTGGGAAACAATGAAAGGAGACTACTTGTCCAAGTCTGTGGATGGAATATTTATTTATGAGGAACATCATTTGGGGGCTTTTGAGTCAAGCAAGATACCAAATGATGCAATTGTTGTTGAACAGTGGACTGTCATTGAGGGTTGTGAAGTAAAGACTGATTATGGTCCTTTGCTGCATACACTGGCAGAGTTTGGATGGCTGGTTACTTGTGTGCTGGCCACACCTATCATTCGCCATGACAGTGAAGGAAATTTAGCAACAAAACAAGTGATATTCTTGCAGAGACCTGCCATAACCAACAATGATCTAAGTCTAAAACCATTAGAGAAAAGATCTACTCGGCAAGCAAGTGAAAGAACCAAAAATTGGAACAGAAATGTGGGTGTGACCACCGGTAAAAACAAGCATTCAGAAACAAAGTCTCCTGAAGATTCTTGCACCACTTCAGAAATCAATTCACATCAATATGGAGGCATTTCAGGCATGAGTCATATTGATAGTGTTTCCAAAGACTTGGATGATGGGCAGCTGGATCAAGAGGAAGAAACAACTCAGGTTACCTGCATATAACATTGCAGAATTCAGATCTGTATTGAAGACAACAGTTTAAAGAAAGCAGACTTTCCAGAGTATAATATGATTGATAATAGCTAATGGCTTTGCAAGATGTGATTTTTGTTTTTGTTCTGTATGAAAGTGTGCTCTTTTTTAAACATTTTCTATAATCCTACAGGGAATAAAAGTATTAACAAATATTTCAGTTCTCGGGATTTATGCAAACAGATCCAGGCTTCTTTAGCAAAGTAGAACTGTTGATTACAATTTGCTATCAGAAAGAGCTTCACCTGATGATTTAAAATTACGTTCAACAAATTTAGGAAAGCCATAGCAAAGCATATTTACAGATGTTTATATTTACTTTTAAATTCTCAAGTAATATTTTTGTTACTTTTTCTATTTGTATGTGCTAATTTTTAAAAATCATTTGTTACTTTTTTCCTGTCATTTTTCTTTGCATATTCTTGGGATCATGTTTTGCAATCAACTTGTTCAAGAATATGCTCATGCAAAACAGTGCTGTCTCTGCAAGATCGAAAGGAGTCATTTTTGAGGATTGTTCAGTCAAGGTAACGTTAGTTGTCCTGCTAAGTAATATATGTATGGCAATGAACTG
>XM_047696666.1 PREDICTED: Lutra lutra methyl-CpG binding domain protein 1 (LOC125081859), transcript variant X5, mRNA 
CCAGCGGGTTTCCGGTTCCGGGAGCAACGAACGGCCGCGGCAGCGACAGCTACCGCTTCAGAGGAAGCGTCTGCGGAGGAGGAAGAAGAGCAGGGCAAGGCGGGAGTCACAGGCGGGACCCTCGCCATGGGTCCGCGGACCTAGAGCGGCGGAAGCTACCGGCCTGGTGCCGAGCTGGCCGCTGCTCCTTCCCGTGGCTTCCATGGCTGAGGACTGGCTGGAGTGCCCAGCCTTGGGCCCTGGCTGGAAACGCCGTGAGGTCTTTCGAAAGTCAGGTGCCACCTGTGGACGCTCAGACACCTATTACCAGAGCCCCACAGGAGACAGGATCCGAAGCAAAGTTGAGCTGACCCGATACCTGGGCCCTGCGTGCGACCTCACCCTCTTCGACTTCAAACAAGGCATTCTGTGTTATCCAGCCCCCAAGCCCCAGTCCTTACCTGTCCCTAGCAGGAAGCGGAAGAAACCTTCACGGCCAGCCAAGACTCGGAAACGTCAGGTTGGACCCCAGAAGGGTGAGGTCAGGAAGGAGGCCCCAGGGGATGAGACCAAGGCTGATGCTGACACAGCCCCAGCTTCACTGCCTGCTCCTGGGTGCTGTGAGAACTGTGGAATCAGCTTCTCAGGGGATGGTACCCGAAGACAGCGGCTCAAGACATTATGCAAGGACTGCAGAGCACAGAGAATTGCTTTCAACCGGGAGCAAAGGATGTTTAAGCGTGTGGGCTGCGGGGAGTGCGCAGCCTGCCGGGTAACCGAGGACTGCGGGGCCTGCTCCACATGCCTTCTGCAGTTGCCCCATGATGTGGCCTCGGGGCTGTTCTGCAAATGTGAGCGGAGACGGTGCCTCCGGATTGTGGAAAGGAGCCGAGGGTGTGGAGTGTGCAGGGGCTGTCAGACCCGCGAGGACTGTGGCCGTTGTCGAGTTTGCCTTCGCCCTCCCCGCCCTGGTCTCAGGCGCCAATGGAGGTGTGTCCAGCGGCGCTGCTTACGGCACCTTGCCCACCGTCTCCGTCGCCACCATCAGCGATGTCAACGACGCCCTCCCCTAGCTGTGGCTCCCCCTGCTGGTAAACGTAGCCGCCGCAGAGGAGGCTGTGACTCCAAGATGGCTGCCCGGCGGCGCCCCCCCCGGACCCAGCCACTGCCTCCAGTTCCCCCATCACAGCCTCCAGCGTCTCCAGAGCTGCAGCCTTACACGAACCGTCGGCAGAACCGTAAGTGTGGGGCCTGTGCAGCTTGCCTGCGCCGGATGGACTGTGGTCGCTGTGACTTCTGCTGTGACAAGCCGAAATTTGGGGGCAGCAATCAGAAGCGCCAGAAGTGTCGTTGGCGCCAGTGCCTGCAGTTTGCCATGAAGCGGCTGCTGCCTAGTGTCTGGGCAGGATCTGAGGATGGAGCAGGGCCGCCCCCACCGTACTCTCGTCGAAAGAGACCTGGCTCTACTCGACGGCCCCGTCTGGGCCAGATACTGAAGACCTTGACCACACCCACAGTCAGATCAGGCCGTGCCCAAACTCCAATGAAACAGGAAACGGGCAGTGGCTTTGTGCTACCCCCACCTGGCACTGACCTTGTGTTCTTACGGGAAGGTGCAAGCAGTCCTGTGCAGGTGCCTGGCCCTGCTACAGCTTCCACAGAAGCCCTCTTGCAGGAGGCCCAGTGCCCAGGCCTGAGTTGGGTTGTGGCCTTACCCCAGGTGAAGCAAGAGAAGGTGGATGCCCAGGAAGAATGGACACCGGGCACAGCCATCCTGACTTCTCCTGTATTGCTGTCTGGCTGCCCCAGCAAGGCAGTAGATGCAGGCCTGCCACCTGTGAAGCAAGAGCCATTGGACCCTGAGGAGGACAAGGAGGAAGAGAGCAAGGATGACTCCGCCTCCGACTTGGCCCCAGAGGAGGAGGCAGGAGGGGCTGGCACACCCGTGATCACGGAGATTTTCAGCCTGGGTGGAACCCGCCTCCGGGACACAGCGGTCTGGTTGCCAAGTCTGCAGGGCAGGCAATCGGGAAGGGAAGATGGATGTAAAGTGTGGGAGACGGAGGACACTTTGGCGTGCACGAGCAAGAGCTGGAACCGGCGAGGATGGCCTAGAACCCATGTCAGTGTCTCACCATCTCCAACTGCGATAATGTGGGTGTCCTGCAGAAGAAGCTGGTGCCCTTCATCACAGAGTTAAATACTCATCTGGCCCAGGAGTTAGAGAAGCAGAAGGAAGATCCAGGGGAAGTGGAGCAGCTGCAGGCCTGACTGCAGGCCTGACTGCTGCCCCACACCAACGAGGTGAGCCAGCAGATAAGTGACAACATGTGTGAACTGCAACAGTGCCTGGTGCGCCTGCACCAACCTTCCGAGTGTAAAAACAGTATGCTGCTGCTTCACTTCTGTCCTCCAGTTACCATGCAAACTGTCTCTTGTGGCCCATCCTAACCGGAAGCATACAGGGAAGGGAGTTCTGGGAAACGTAGCCTAGTCAAGGTGACACATTACAAAGCCACCCTGCCATGAATCAGCTCCCAAGGGTCTCACTGCTCACCTGAGGATAACTTGATAAAGCTGCGTTGCTGGAAATGCAAAGCTGAAGACCATGGATTTCATGGTGACCCCAGCAAGTACAGAAATACTGTCAAGCCTACCCAGAAAAAAACTGGCTGGTCTCGGCTATTTTTGTGTCATTCATTCAAGTAATGAGAACCTGGCCCATGGTAGGCACTGTACTTGATACTGGGATACAGGAATGAAAAAGATACAGTCCATGCAATTTTATTAAATAACATAAGTATGTATTACAAATGGTGAATGGATATCCAACTTTATCATGGAATTTAATGGTGAAAATAGAGAATTCAGGAAACTGTCGGGAGGAAAGCTCTTGCGTGAACCTTGGGGCACAATAGGAATTGGAAATAATATAAATAGTTTCTATCTCTGAGCTGTTCTATTTTAAAATTATTTTAAAATGATTTTGATTGTCCCGTTTACTGTTTTATATATTTAGTGTTTCTTTGGGGAGTGTCTTGATGGTGTAACAGTGTTGACTCTGAGAAAGTGGGATGGTGGGTGGCAAGATCAAGGTCAGGTTCTGTCGAAGGACCTTGGGCCAACCACTTCTCTAGGCCTTGGGGCTTGGCTGAAGGTGGAGGCTCACCGCTGGTCCCGGTCCCGCCCCTCCACCGTTTTAATAGGCCCCCGCCAGGGGGCGCCGGGGCCGCGGTCATCCCACCACTGCTCTGGGAAGACGCAGCCCCTCACCCCTGGCCAGGGCGGCCCGGGGGCGTGGCCTCCACCCCGGCCGAGACA
>XM_019948349.2 PREDICTED: Tursiops truncatus tripartite motif containing 44 (TRIM44), transcript variant X5, mRNA 
CCTGACGGGGACAGGGAAAGTGGAACCGGGGCGGCGCGGGGGCCGGCGGCACCGCGCTCGCCGGGGCAGCGGGGGGGCCGAGCGGGCGGCGCGGCGCAGGGGCCGACGGGGGCGCTGGGCGGCTGCGCCGGAAGTGCCCAGAACGCCGGAGGAAGCACAGCGGCCGCCAGGCTGCCGAGCCGGCGGCGAGGCCCTGTGCTCCTGGGCTGGGTGCAGACTGCTGGGAACAGGCGGCAGCGGCGCCGAGGCTGCGGGACACGGCGCGGCCAGTCTGCGGGACGGGCCCCAGGTGGGGAGGAGGACGCGAGGAGGCCGCGCCGAGGCCAGGCAGCGAGCTCTGAAGCCCGGAGACCCGGGCCGCGGCACAGCTCCCACATGGCCTCCGGAGGGGGCGCGGCCTTCGAGGAGCTGCCGCCCGACGGCACGTGTGATGAGTGCGAGCCAGACGAGGCTCCGGGAGCCGAGGAAGTGTGCCAGGAATGCGGCTTCTGCTACTGCCGCCGCCACGCGGAGGCGCACGGGCAGAAGTTCCCCAGGCACCACCTGGCCGAGTACGTCCACGAAGCCGCCCAGGCCTGGACCCCGGGAGCCCGGGGGGATGGGGCGGGAGAGGAAGAAGTCGAGGCCCAGGTAGAGAACGAGAAGGCCCTAGAAAGCGAGGCGGGGGAAGAGAGCGAGTCCGAGGAAGACTGTGAGTCCGAAGAAGAGAGTCAGACGGAGGAGGAGAGCGAAGACGAGAGTGAGGAAGACAGTGAGGAAGACAGTGAGGAAGAAATGGAGGATGAGCAAGAGAGTGAAGCAGAGGAAGACAACCAGGAGGAAGGAGAATCGGAAGCGGAGGGAGAAACTGAGGCAGAAAGCGAATTTGACCCAGAAATAGAAATGGAAGCGGAGAGAGTGGCCAAGAGGAAGTGTCCGGACCATGGGCTCGATTTGAGTACCTATTGCCAGGAAGATAAGCAGCTCATCTGTGTCCTGTGCCCAGTCATTGGGGCACATCAGGGCCACCAGCTCTCCACCCTAGACGAAGCCTTCGAAGAACTAAGAAGCAAAGATTCAGGCGGACTGAAGGCGGCTATGATAGAGTTGGTGGAAAGGTTAAAGTTCAAGAGCTCAGACCCTAAAGTAACCCGGGACCAGATGAAGGTGTTTATACAGCAGGAATTTAAGAAAGTTCAAAAAGTGATTGCTGATGAGGAGCAGAAGGCCCTTCATTTAGTGGACATCCAGGAAGCAATGGCCACAGCTCATGTGACTGAGATACTGGCAGACATCCAGTCCCATATGGATAGATTGATGACTCAGATGGCCCAAGCCAAGGAACAACTTGATACCTCTAATGAATCAGCTGAGCCAAAGGCAGAGGGCGACGAGGAAGGACCCAGTGGTGCCAGTGAAGAAGAAGACACATGAAGGCCTGCCATCCCCAGTGGAAAATCATCCCTTCCCCTTGTGTGTATGTGACGGCGTATATGTAATGGCTTCTGATTCCTGTGAAAGCTGCCCAGCAACAAACGTGCTTCCACCAGATGCCTCCCCAGATCCACAGCAGGCACATAGCTCTCCAAGGAATGACCAGTTTTACTCTTGCTGACTGTGCTTCTCATTCTCTTGTCGTGATAGGTCAAGGAAAATGCCCCTTTGATCAACCAGGAGCAATTAAAGGGTCCTTCAGGTAAATCCCTCGATGGCTGCTTTGAACTTGCTCGGGAAAGCCAGCCCCTGTCATAGTGTATACCCAAACAGTATCACTTCATTAAGAAGGATCTGGAATAATCTTGAAGGGCAGTCAGAATTTGTTTCCCTACCTGCTAATAAAACCACACTTTATTCATATTGAAGCATGGAATAAATGAGGGAAAAGTAGGGGCGAATCAACCCACATAGTTCGTCTCTAAAAGTCCATTTAATACATCTGTGAAAATGTGGTTTCATGAAATAATATGGACGGCTTGAAAACAGATAAAGAGTTAAAAGTTAGAAATATATAGAGATATTTTTAGTACATGAGGTTATCCAGGATTTCAGATTCATAATTCAGTGCTGTGGAAATGAAAA
>JF973483.1 Nocardia cyriacigeorgica strain DSSHB7 16S ribosomal RNA gene, partial sequence 
CTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCGACAGGGACGAAGCGCAAGTGACGGTACCTGTAGAAGAAGCACCGGCCAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTGTCCGGAATTACTGGGCGTAAAGAGCTTGTAGGCGGCTTGTCGCGTCGATCGTGAAAACTTGGGGCTCAACCCCAAGCTTGCGGTCGATACGGGCAGGCTTGAGTACTTCAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGAAGTAACTGACGCTGAGAAGCGAAAGCGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGTACTAGGTGTGGGTTTCCTTCCACGGGATCCGTGCCGTAGCTAACGCATTAAGTACCCCGCCTGG
>XM_004257108.1 Entamoeba invadens IP1 hypothetical protein (EIN_015440) mRNA, complete cds 
ATGAGTCAATTGGATGGCTATAACATGATGATTGTTTCAAAATATTTTAAAGATATTAAAGACTTTGCCACCCTCATTTTTGTGTGCAAGAAATTTTCAGACACCGCTGTTAAGTTTCATTTCAACCCAATACCTTTAACTCGAGAAACACTCAAATTCTTCCCACATATTGAAACACTCTTTTTGTACTCAATAAAAGACCCGATACTCCGTGACGGGAATATTCAAAGATATTTTGCGAATTTCACATGTAGTGTATGGGGATACAAATTCTATTTGTCTCATGGTGTCGAGTGTCGAGACGTCGGGTTTTTTTATAAAGACTGTCTGTCAGAAGAACCGCCAGCAATTCCAAAAGTAGTGTCATCCTTCAATCCATATTGTTTTAGTCGTCACGCGATGCCAACGATTATCGTCACCAAGAACATTCGAAGAGTTGCTGAGCTGTCGTTTGCAACAGCAAATGTTCGGAATGTTGTTTTTGAAAATTTGATAACAGACCTTCCATTTGGGACATTTTTGAATTGTAATCACCTCACAAACATCACTTTACCACAGACAATCACTTCTATACAAAACTTGTGTTTTTGTGGGTGCATGTTTTCCAGTATAAAAATCCCCGATGGCGTGGTTTATATGGGAGAGCAGTGCTTTTCACATTGTATAAAATTAAGGGAAATCCATTTCCCTCCAAAAGTAACAAAAATTGAAAATTATTCTTTTATAGGAAATGACGCACTTTATTTTATTGATTTTAAAAACATTAGCGAGATCGGGGAGAGTGCCTTTTATAAGTGTAAAAGTCTTCATAATATTGAATTTGGTAAAAGTGTCAAAAAACTCGGGGAAAGTTGTTTTTCGAATTGCACAAATTTAGTTTCTGTAAGATTCCCTATAACACTCACTTCGATCGGTTCGCTTGCGTTTTCTAAATGTAAACTACAACTTGTGGATATCGATTATACACTCGAAGATAACAGGGAAGTGCGTTTTGTTCAAGAAAACGTCGTGTTTCAGCACAACAAAACGCTTTTATCATTTTATTGTAATAATCCTGATATTAAAGTGAATGGAATTAATGTCATACAAAATACGCATTTTGTAATTTCAAATGCTATTTTGTGTTTGTCCAATTATTGTTTTTCAAATTGTTTTGACATCACAGAAATGGTCATTCCAAGTTCAGTTTCAAAGATTAAAAATGATTGTTTTTACCGCTGTGCAAAATTACACAAAGTGATTTTTATGGAAAACAGACAAAGTGATCTTATTCTTGGCCAAAACGCATTTTATTCTTGTGCTCAATTAAGTGTTATAAATGTGCCAAAAGAACTGACACGTGTTGGACAAAAGTGCTTTTCACAGTGCAATTTTTCCATTTTTGATTTTCAGAAGAGCACAAAAATAAAATCAATTAAAGCTTTTACTTTTGAAAATGATAAAATGCTCACCTCAATCCAAATTCCGTCCACAATCACTAAAATTGGACAATACGCTTTTTGTGGGTGTGAAAAGTTACAAATTTTTTTATTTCCTACGCAATTACACAAAATAGAAAATAACTGTTTTTCTCACTGTAATTTAACAGCTCTTGACTTTGCACCACTTCACAATTTGACATCAATTGGAGCGTCTTCTTTTTCGTTTTGTTCATCTCTTCGTCAAATTTCAATGGGTTCAGTGTTAACAAAACTCCCTGACAATTGCTTTGAAAATTGCGTTTTGTTGTCCGCAATTGAAATTCCACAAAATGTGACATATTTAGGAAATAGATGTTTTTCATATTGTTACAGTTTGAAAAGTGTTGTTCTTCCAGACAACTTGCGTTTTGTTGGCCATCACTGCTTTTCGTGTTGCGCAGTTCAAAATGTGATTTGGCCATCAATTGCTTCCGTCCCAAATTTCTGTTATTACAATTGCAGAAATTTGGAATCTTTCACTTTTGCTGAACAACAAAATGCGTCAATCACAATTGGTATTGCCTCTTTCTACAATTGTATCGCGTTAAAAAGAGTTTTGTTATCAAAAAATGTCACAGAAATTTGTGATTTTGCATTTTCAAATTGTAAAAAGATTTTAACTTTTTCAATCCCACAAAGTGTGACTTACCTTTCTTCTTTCTGCTTTGAAGAGCCCAACGACATGTCCGCGCTTTTCATTGGTTTTTGA
>XR_005782624.1 PREDICTED: Puma yagouaroundi uncharacterized LOC121013303 (LOC121013303), ncRNA 
TCCTGGAACTCATTTGTTTCTGACTCTTCGAAGACCTCCCAAGTGTAAGGTCTTTTCCTTGTAAGACTACTCCAAACAAATGCAGTGACCTGAAGACTCCCAGAATAGGCACCACAAATTCTCTAAGAGGAAGGCTTATTTCTCTCATGCCCAGCCTTCCCTCTGCCCACCTGTCAACATGTAAACCTCGTGGTGTTTAGCCAAATTCCGTGCTTTATATGTTAGTGTCCTTTATCACATGCTATATTTCAAGGCAAATGAGCTAAAACATGATAATAACTAGCAAAAGATGCCACTCCTTTCAAGAAGGGTACCGTTTAGGCAGAGAATTATAGGGGGATAAAATGGAACAAAAACCAATAAGGCAAATCTTAAGAATATGGCCAGAAGACCATCCTCTTAGAGTTATTCTGAAAAATGGAGCTAAACACCATGTTGTCTGACTCAGAGAAGGATTAGATTTCAAGGGGAAATGGATTTGGGTCCATTTCCTTGAGAAGAGTTGCTATGAGACTGAGAGCCAGCATTCTCTTCACTGAGTGTTTGAGGGATAAATGCACAGAGCAATTTAGCAGCATTTCAGAAATGTAAAGTTCTCAGAAGCCACATTCCAAGTGAAGCAGATCTTGCTGAAGAAGTTGGGATGTGTGAGTCTAAAAAGAACGCTTTGAGCCCTCTGCTTCTCTTAGCTTAAATCCATATATGGCTTTGTTGCTGTTGCTGTTTTCATTTTAAACATAACCAAACAACACTGGTGCCCAGGAAATGGACTTCCAAAGAGAGGAGGGAAAAGCCCAAAAAATTCTTTCAGCATAAAGAAGACCAGTCTTGTTTAAATCAAAGAAAGGGCGCTGCCATCCCTTCAACAGCCAAGACCACAGATCTTGAAATCTTCTTCATCTCAGTGCTCCATGCTATACCCACACTGGAGTAACGAGGGTTTGCTCAGGCTCTGCTCTCTTCAGAGGCTGAGGTGGATTCAGCCGTGGCCTCAACTGCTTATCCTGACCAAACCCAGAGGATGTAGGAAAAGCCCTTCTCCACTCAGGAGTATGGATATCATGCAGACCCCTGGAGACACGGTGGTACTCAATAAGTATCTATGAGTTGACTTACACTGAATCCGAACTAACACAGACTTGAAG
>XM_053456309.1 PREDICTED: Spea bombifrons ADP ribosylation factor like GTPase 11 (LOC128474053), mRNA 
CTTCCTGAGCTGGACTGCATTACTTTATCCTGTAGTCACCAAACTTCTGCTTTCTGGGAAACTCTTCTTAAAGACAGGATGAAAGACAGAGCACAGAAACACTGGTCTTTCAAGGCAAAGGAGTATAGGAATTAATCAAGACGTCATCATGGGAGGTCAAAATTCAACACACAAGAAGCAAGCAAGAGTTGTGATGATGGGTCTGGACCTTTCTGGAAAATCAACTATTTTATATAAACTTAAAATGAATCGTACGATGGAGACTTTTCCTACTGTGGGGTTTAACGTGGAATCCTTAGAAATGGCTAAAAATATGTCAGTAACCATTTGGGACGTTGGTGGCCAAGACAAACTTAGATCGAATTGGAAAGAATATCTCGAAGACACAGATGCCCTGATCTTTGTGGTTGACAGTTCAGATACAAGCAGACTACCAGATGCTAGAGCAGAGCTACAGACTGTCCTGAAGGATGAGAATATGTCTGGAGTTCCATTCTTAATTCTGGCCAACAAACAGGATGTGCCTGGTGCTTTGTCTACAAATGAACTGTTACAAGGTCTCAAGCTGGGAAGCTATGAAGACAGAAGTTGGGAGATTCAAGGCTGTAGCGCATACACGGGAGAAGGTCTTGCTGAAGCCATGAGTGCAGTGTCACGTCTACTAAAAAGGGCATAAAACTCCAAATGGCTGTTTAATTTTATTTGTGGCTCTTTCATATATGTAAAATATCCATCAAAATACCGTATTCAATCATGGTTTACAAGCCGGTAGATGTTACAGGTTTGAGACTCTGGGAGTTTTACACATTTCATCGTATAATTATCTACATGGATTTTACTTGAATAAGCCATGTGTTATAAAATGATACAGAAAAAAGACGATCTAAACTCCAGTGAGTTTGTTTACACTTCTGCTATATGATGTCAACATTATGTGTCATACTGTGGTATACATAATTTTTGTTAATGAGTTAATAATGAGTAATTAAAATTGCATTTAGTTATGTTTA
>XM_023958536.1 PREDICTED: Oryzias latipes uncharacterized LOC101166636 (LOC101166636), transcript variant X1, mRNA 
TGTCAAGAGTCAGCTAACATCCTTAAATCATGTTAGCGTGTTTTTATTTCCGCTCCCAAATGCTTTGTTGCACATCAAAACACTTAAAGAGAGTAATGCTCTTCCAGCTCATCTTAGGGTGTGTGTAATGTCTGTGTGGGAAACATTGTTTCCTCCCACTCGTTGCTAAATTGATGTAACTAGGCGGTTGAAACCACAATTATCTGAGTGTGCCATCGCCATGGGACGAAGGAGCCTGCTGCAAGTTTGTTTGCTTCTTCTCGCCTTTTTCAAAGATATGTCCTCCCTAAAGATTCGTAATAAATTGCTGGGTAAATGCCTACAGGTGTCAGAGGAACGTGCAGGAGGAGGAGTTTCTCTAGAGGGTTGCGATCCATTTTCACCCCTGCAGGAGTGGCTCTGGCTGCCTGAGGGCCATGCTCTGCGCAGTCACCACACCGGGGACTGCCTGACTGCACCGAATGCGGAGTACGAAGGCGTCCGCCTACAGCCCTGCATTTTTACAAGTGGAGTGGTCATAGTGGATGTGGGAGGAGAAGCTAGCAGCCAGGCATGGAGCTGCTCCAAGAAAGGACACCTGACTTTGAAGGGCAGTGAGCGACACCTGACTGCTTCTCATGAATCCAGTTTAGTCTTCTTGTCAGGGGAACATAAGAGGCCAGGTAGTAGGTGGCGATCTCTGGATAACCAGACGCTTTGCAGTGGCAAAGGCATCAAACAGGACATAAGCCAACCCCAACAGCAGCTGGGAAAGACAAAGCCAGTCATCTCTCCAAGTGATGGTTCAGACACAAAGAGACTCGCCGACACATTTTCAGAAAATATGTCTTGGGGACTTGAATTTTTTCCTTTAACAGAAATTCTAGATGCGGCTACAGTGGGTACTGCTGGGACAGATTCTTATCAAGCAGGAAATATGACTCATTTCTTCCTCAGTACCAAATCCCCTCAAGATCCAACCATGATCTTTTTCACTATAGACTACGGGATGGGCTGGAAGATCACAATGCTGGTGTTGACCTCCCTGGCTCTGGTCTTAGGAGCCGTCATCCTCATCCTCAGTGTTTACTCTAACAGAAAGAAGAAGATGGTTTGTGTCGTGAAGTCGTTCAATCCCAGACCAGACATGAGTGCTCCGGGATCCCCGCTGCTCAGTGAAAGAGCCCCACTGACGGAGCACGCCATGCATCTCTCCCACTCTTCCCCCTACTTACAGCGAGGAGATATTCTAATAGAATGGAAAGATGGCACTGTTACTCCCCTGTATGAGGCTTAAATGTCGATGAAGGCAGTGCAGATGTGATTGTTTTCTGTAAAAGCACGCCGGCAGCTTGTGTGTGATTTGGCATGTTGCCCCACCACAACCAGCATCTCTCCCAGTGTCTCCTGGAAGCAAAAAAAAACAAAATTGAGAAAGTGAGGTGAAAAGAAAACTCAGCCTCAGCATTATTAGAACTAACTTTGTGAAGCTTTCAGAGTAGAATGTTAGTTTTCAAAGAAAAGTTCTTAACTGAGTTGTGATTTGACAGACTCCAAGGAAGACAAACTTTACCACTTTAGAAGCACTTAAATAGTTCAGCAAAGCCACTACATCTGTCATCTGGTATCAACCTTTGCACCAGTAAATAGAAAATTAATATTTACTTGAACCATTATGACCAGCTGACCTAGTCTCTGTTTCATGACAAACACTGCTGTGCTAACTGTTTGGCAGTGCTATGTGTGCTTTATTTTGTGAACTTAATTTTGTTTAAAAAAAAATTAAGATCCCCTGTTACTACTAAGAATCCAGATTTCTTGTCTGATTTGTAGATTTTTTTTTTTTGCAGTCTGGTGGTGTTGAAAACTGTTTCCAATGTTTTAAAGGTAGAAAGCTAACTAAATTCATTTATTAAGTGCAAACTTTTGTAATTGTGTTGAGTCCTGCATGTACACTGACTTGTTTGTCCATTCATGAGGGCTCTTCTTTAGTTGTGACAAATTCTCAGTTGGCTTAAAAGTATTTTCGGTAGTGCCTCAACTGCCTTTAAAGATCATCAGATTTCAGAGTGAAGAACATCACAGGCCAAATTCAGAGATCAACTGAAAGATAAACTGAACCTTTGGATTTAGTTGCTGGTGGTAAAAGTGTGAGCAAAACTCAAATTAAAGAAAGGATCAGCTGAATTTGATTTGACCACAAGGAGATTAATGGATTATTGAATTGAGAGCATTGTGACATTGCTGGTAAATATCTTAACCCTTGTGCTATCCATGGCCCGTTAACATTTGGAGTGGGGTCATCTGGACCCCACAAGACAGTGCGCTAAACTTTTATTCTTCAATAATTTGTGAGATTCACTTGTGTCCATGGAGTATATGAAATCCTCTTCACTTTTATCCACCTTTGTCCTGGTAGGGAGTCAATGTAAGGGTGGGGTCATCTGGACCCCATAAGATAACACAAAATCAGAATAGGTGGGAAACTGTGTACTTTGGACTGTTACCTAATAAGGCAGGGCCATTTCAGGATCAAACCAGAAAAGCAGGTTTTGTCATGACGTAATCTAGGAAATTGCAGAATAACATCTTAATTATCTGTAACTGTGAAAGTACTCTGGAGCTTGTTTTTGGGTAACAATAACTGGGTAACAACTGGCATCTTGTGAAAGGGGACACGCCCTCTCCTTTTATCAGTCGGGAAGCTTCTGTTATCCGCATTGCTTCACAAGTTATCCCAGGAAAAAGAGAAATAATAGTTTGTTTAAAAACAAGAAAACTAACAACAAATCACAGGAAAAGTTTTTGTTTTAATGTTTTCTAGCCTGTAAACAAGCAATAAAATGAGTTTTATACCTAA
>XM_018291179.1 Pochonia chlamydosporia 170 vacuolar ATP synthase (VFPPC_13402), partial mRNA 
ATGGTCTCCGAGCTTTGCCCCGTTTACGCGCCCTTTTTCGGCGCCATGGGTTGCACCTGTGCCATTGTCTTCACCTGCCTGGGTGCTTCTTACGGTACCGCCAAGTCTGGTGTTGGTATCGCCGCCATGGGTGTCCTCCGCCCTGACCTTATCGTGAAGAACATTGTTCCCGTCATTATGGCTGGTATCATTGGTATTTACGGTCTGGTCGTGTCCGTCCTTATTTCCGACGGTCTGAAGCAGGAGCTCCCTCTGTACACTGGTTTCATCCAGTTCGGTGCTGGTCTGGCTGTCGGCCTTGCCGGTCTTGCTGCCGGTTTCGCCATCGGTATCGTTGGTGACGCTGGTGTCCGAGGAACTGCCCAGCAACCCCGTCTCTTTGTCGGCATGATTTTGATTCTCATTTTCGCCGAAGTCCTGGGTCTGTATGGTCTCATTGTTGCTCTTCTCATGAACTCTAAGGCTACCCAAGATACTGTCTGCCAGTAG
>MN512539.1 Penicillium crustosum strain MMS small subunit ribosomal RNA gene, partial sequence; internal transcribed spacer 1 and 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
TTTCCTGAACTTGCGGAAGGATCATTATCGAGTGAGGGCCCTCTGGGTCCAACCTCCCACCCGTGTTTATTTTACCTTGTTGCTTCGGCGGGCCCGCCTTAACTGGCCGCCGGGGGGCTTACGCCCCCGGGCCCGCGCCCGCCGAAGACACCCTCGAACTCTGTCTGAAGATTGAAGTCTGAGTGAAAATATAAATTATTTAAAACTTTCAACAACGGATCTCTTGGTTCCGGCATCGATGAAGAACGCAGCGAAATGCGATACGTAATGTGAATTGCAAATTCAGTGAATCATCGAGTCTTTGAACGCACATTGCGCCCCCTGGTATTCCGGGGGGCATGCCTGTCCGAGCGTCATTGCTGCCCTCAAGCCCGGCTTGGGG
>XM_002370192.2 Toxoplasma gondii ME49 ribonucleoside-diphosphate reductase large chain mRNA 
CCGTTTCTGGGTCGTTTTTTGTCTTGGCGGTTCTCTTCGTGTGACGCGTGGCGCAGAGTTTGTCCGTTTCCGTTTGTCAAAATTTCCGTTTCCGCGTCCGCGGTGTGGGTTCGAGCACCGCTGACCAGCTTGCGTTTTCCACCGACGAAACTGACACATGCGGTGAGCCTTGTTTCGTTCTTTGCGCGCCGAAGCGCTCGCTGCTGGTTTCCCGCGCCTGTCTGGAAGAAGACGCCGTTCTCTCTCTGTGGATACCAGACGCCGTTAACGCTGCTGCCAGACAACTTGAAAGTGTTTTTCCGAGAGGGCTTTTCCGCAGTTCCAAAACATTCCACCGTGTTTCTACCGTTTTGTCGGGCTTTTTCGCGTGCACGCATTTCCGTGGGACAACCATCGTGGCCCCTGCTCGTCTTCCACTCGCCACCGTAAAAGCTAGGTTTCCATCGCACCGTCAGCCACCGTCGACCGTCCACCCGCCCTCCCCCCCTGGCGTGGCCCGTCTCGCGACTCACTTTCCTCGGAACCGAGTCGCGATTGTGTGCAACGAAGAGCGAATTTTCTCCATTTCCAACAAAAAGTGTCTCAACGAAGCGGAGAAACATCGCCACACTACTGTTCTCCGCCCCATTCTTCCGCATTTCCAACCTGTATAAAGGTATCCCCTTTTCTCTGTCGCGGATGTGTGTGTGTTCTAGCCTCTGTGTATCGGTATGCGATGTCCAAAAAGTAGCTGAGTGCGTTGGCGTCTGTGTGTGCGTTTCCTGTTGTCTCCTTTGTCCTCGGAGTCCCTCCTTTTGATCGTTTCCAGATTGTTTCCTCTTGGCGCTCGCCAGCCTCCGTTCTGTCGCAGACTCAAAACCGCCGTGTCCACCCGCTGTTGGCGGCTACACACCCGCCACCTTTGTCTTCTATCGGTGTACACACCCCCCTCCCACACTTGCGTGCGTTGCAGAGAACGCATTTTTTTCTTTTTCCCCGCTTCCCCGCGTTTCTCTCCTCAGTCCCCCTTTTCCCAGTGCCCCCGGAAGTCGCTCGTGTGCCCGTCTCAACTCTGGTGTGCCTGTCGCCTTCCCGCCGAGCAAAAAAATGGAAATCCCGGCGCCCTCGAGTCCGACCGCTCTCAAGGCGGCCGTACCCGTCTCGTCTCCGACCATGGCTCTGCACACACACGGGTCTCTCAGCAGTTCTTTTTCAGAGGCCGTTTCGCCGTCCAAAAAGACAGGATCTGCTGGCGCCTCTCCCGTCCACGGCGCAGGTCGTGGCATGTACGTCGTCAACCGCCGCGGCGAAGAGGAGCCTGTTTCCTTCGACCAGATTCTGAAGAGAATAGAGAAGCTCTCTTTCGGCCTCCACCCTCTCGTCGACCCCGCTCGCGTTGCACAGGCCGTTATCAACGGCATGTACGCGGGGATTCGAACAAGCGAGTTGGATGACCTGGCTGCACAGACCAGCGCTTACATGGCCGCTTCTCACCCTGACTTCTCCAGACTGGCTGCTCGGATCGCCATCGACAACCTCCACAAAAACACAACAGACAACTTCTTGACTGTCATCGATCAGCTGCATGGCTACGTCGACAAACTGGGGCGCGAGGCGAAGCTCGTCAGCACTGAGGTGTACGAATTCGTGAGGGAAAATGAGCAGGCGCTGAACGAGGCTCTGAACTACTCCAGAGATTTCGACTACGACTATTTTGGATTCAAGACACTGGAACGGTCGTACCTCCTGAAGATCCACGACCGGATTGTCGAGCGTCCCCAGCACATGCTCATGAGAGTCGCATGCGGCATTCATTGTGGGGATGTGGAGAAAGCAATCGAAACCTACGAACTGATGAGTCAGAAGTTCTTCACGCATGCAACGCCGACCCTGTTCAACGCCGGCACCCCCCGCCCACAGATGAGCAGCTGTTTTCTGCTGACGATGCAAGAGGACTCGATCGATGGAATTTTCAGCACACTGAAGCAATGCGCGTTGATTTCCAAGACAGCTGGGGGCCTCGGTCTCGCCGTGACAGACATTCGAGCCACAAACAGCTACATCCGAGGAACGAATGGCTACTCGAATGGCCTTCTGCCGATGCTCAGAGTCTTCAACGACGCCGCGCGCTACGTCGACCAGGGCGGCGGCAAACGCAAAGGCAGCCTCGCCATTTACTTGGAACCTTGGCACTTTGATGTTTTTGATTTCCTCGACATCAAGAAGAACCATGGCAAGGAAGAGCGACGGGCGCGCGACCTCTTCTGCGCCCTCTGGATCCCAGATCTCTTCATGGAACGTGTGAACGACAACGCGGGGTGGACGCTGATGTGCCCTAACGAATGCCCCGGTTTGACGGAGGTGTGGGGCGACGAATTCAAAGAGTTGTACGAGCGCTACGAACGCGAAGGTCGAGGCCGGAAGACGATTCCAGCTCAGCATCTTTGGTTTGCGATTCTCCAGGCGCAGATCGAGACGGGGACGCCGTACATGCTGTACAAAGACGCATGCAATCGGAAGAGCAACCAGAAGAACTTGGGAACGATCAAGTGCAGCAACTTGTGCACAGAAGTCGTCGAATATACGAGCAAAGACGAGGTGGCTGTCTGCAACTTGGCCTCCGTCTCGCTGCCCAAGTTCGTGGACCGCGAGAGCCGAACTTTCGACTACGAACACTTGAAGCGAATCGTCAAAGTCATGACGAGAAACTTGAACCGCGTGATCGATCGAAACTACTACCCAGTCCCAGAAGCGAAGAAGAGCAACTTGCGGCACCGACCTGTCGGTTTGGGAGTCCAAGGTCTCGCAGACGCCTTCATGCTTCTTCGCTATCCGTTCGACAGCCCCGAAGCTCGCGTCTTGAACAGAAACATCTTCGAGTGTATCTACTTTGCCGCTCTCGAGGCCAGCTGCGAACTCGCCGCCGAAGAAGGCCCCTACGCGACTTACGAGGGATCGCCGGTGTCTCAGGGCATTCTCCAGTTCGACATGTGGGGTGTGACTCCGTCGAGCGGTTTGTGTGACTGGGATGGTCTGAGAGAGAAGATCAAGGCACACGGAGTGAGAAACTCGCTCCTCGTGTCTCCGATGCCTACGGCCAGTACCTCTCAGATTCTGGGGAACAACGAGGCGTTTGAGCCGTACACTTCCAACATTTACTACCGCCGAGTGTTGAGCGGAGAGTTTTTCGTAGTGAATCCACACCTGCTGCGAGACTTGCTCGAGCGGGACCTGTGGTCTGAGGACGTCAAGCAGCAGCTGATTGCGCACAACGGCAGTGTCCAGAACATGGACGTCATCCCAGACGACTTGAAGGCACTGTACAAGACCGTTTGGGAGATCAAGCAGCGCGTCGTCCTCGACCTGGCGATCGACCGGGCACCGTTCATCGACCAGTCTCACTCGCTGAACATCCACATGGTCAATCCAACCTACGCGAAGCTCTCCACTATGCACTTTTACGGCTGGAGAGGCGGCCTGAAAACTGGGCTGTACTACCTCCGGACGCAGGCGGCAGCGGACGCGATCAAGTTCACTGTCGACTCGCAACTCGCCATGAGTGCGAAAGCGAAACTCAGCGGCGCCACTGTGGGAGCTCTCACGACGACCAGTTCCGGCGCCGACGAAGACAAGCGACAAGACGTCGCAGAGACGGAGAAAATCGAGCCTGTAGCTCCCGTCTGCAGGTGGAGACGTACAGGCGCTTCTCCAGATGAACCCTGTGAAATGTGCTCAGGCTAATCGCGTGCGTCAGCATGCAACGTACATATACACATATATATACATATATACATATATATATATATATATATTTATTTATTTATATATTTATTTATTTATATTTACATATAAAAATTTGATATAAACGAAAATGCATATGCATACACTTGTACACAGCCAAATGTGTTTCCATATGTATAAGTGTGTGAAGAGTGTACAGTTGTCTCGTAGAGGCGGACGGATGGGGATTCGATCTTTTGGGCTGCTCAAGGTTGCATGCGTCGCTTCTGAAAGCAGAGGGGGAAAAGAAGCACGGTGAGGAGAGTCCGAAACATTCTGCGCGGGCGTTTCTACAACTTGGCACTCGCGAGAAAACAGTGTTTGTCAAAAACAGAATTCTTGGGTCTTGTCTGAGTCGCGGAACCTTTTGTATTTACTCGAACGTTTGTACGAGAGAGCCCTGAGTCCTCAAATGTCGCTCCGGTGTGCCATTTTCGTGGTTTTCGAGTTTCCACAAATGCACATGCGATCGCATTTTATACATGTCGCTCTGTGCATTCACCTATATGGCTGTACAGAGAGAGGGATGATTTCCTTGCGCAGGACTCTGGGATTTGTCGACTTGTTCGTTTCTTCACCTTTGGCAAGTTTTACGCCTTCCAAGATCCGATTCACTGTTTAAAATGCGTTTTTTGTGTAAGGTGCACTTGTATGCAAAGAATCTTTCGCACTTGAGAATGGGTCTTTTCTGGCCTTCGTTTGTATCACAGTGACGCGACTCTTCTTCGCTGCAGCACTTTGTGGGGAGTCTTGCTTGTGCAGTTCTGTTTTGACAGGGAAAAGACCTTTGAACGTTTCGAGAAAGAGCGGAGAATCTGGGGACTTGGCCGTCTCTCTAGCTCCGTTTGCTTGACTTTGTGTAACTGTCTGATGCTCTCTTCGCGGCACCGTATGCGCGCCTGTGCATGCGAAGCGACTCTCACGGGCAGAACCGACAACGAAAAGGAACATCCATTGAGAAGAAAAA
>XM_037917243.1 PREDICTED: Penaeus monodon D-dopachrome decarboxylase-A-like (LOC119568800), mRNA 
CTTGGGTCTCCCCTTTTAGTCAGCTGATAAATCCCGTCCTAGCAACGTTAGTTGGAATAGCTTCCAGTGACAGCATTTTTTTTTTCTCTCTTTCTAAAGGGATATTTCAGATATGCCTTTCGTGACGCTGACTACTAATCTGTCTTCTGAAAAAGTGGACAAGGCTTTTTCTGAGAGCTTTTCGGAAAAGTTGGCAGAAACTTTGGGGAAGCCCATAGAACGTATTTCAGTGACTGTAGTGGCTGGGCAGCAGATGTGCCGAGGAGGAAGCTGGGACCCGTTGTGTGAGGTTCACGTGTTGGCCATTGGACTCGATTCCGCCGAGAAAACCCAGAAGCCAGCTGAAGAAATAACCAAATTCTTGTCTGACCGTACTGGGATTCAGCCTGCAAGAATCTGCTTAACTTTCCGACCAGTGCTGCCTCATCAGGTTTCCGTCAATGGCGCTTTAATGGGATGATTTCAACAGCCAGTGAATGGGACTGCAACCATGAGAGAGTATGTGGAATGATCTAGCAATAAACTATTCTACAGTT
>XM_040043500.1 PREDICTED: Simochromis diagramma methyltransferase like 3 (mettl3), mRNA 
ACTGGTTTAGTTACCAACATGCCACTTTCGTAGACTGAGATATATATGTATTATATTTTACATCATATACCCTCAATCCTAAAACCACGACAAATCACTACGAAAGCGGAACGTTCAATCCCAATCAACCCGTGTGCTACCCGACACACGTTTTCGTGTTGCACCGTACCCGCTTCCCTCCAAGAGTGGACTGGATTCAACTTTTGTTTAGTTTCCCGGACACTCGGTGCTCGGTGAGGCCAGTATTGGTGTTTTTCCTTCAGCTGAGTCCATTTCGTCATGTCGGACACATGGAGCAACATCCAGGCGCACAAGAAGCAGCTGGACTCTCTGCGGGAGAGGCTGCAGCGACGACGGAAAGACCCGGCTCAGCTGTCCGCCGATGGTGGTGGCAGCACAGACGGCACCACAGTCAGGAGTGACAGCCCTGCCCCAGCAGCTCCGTCCACCTCGCAGGAGGAAACAGAAAAACCACCAGACCCTGAACTGGAGAAGAGGCTGCTGGGATATCTGTCTGATCTGAGTCTCACACTGCCAACAGACTCCCTTTCCATCACAAATGAACTCAACAGTTCAGAAACAGCCGTTAGTCACGGCTGCATCCAGAGCCTGCTGCTTAAATTCTCTGCTCAGGAGCTCATCGAGGTCCGAGAGCCCACCTCGGCTCCTTCTTCTTCTACAACTTCCTCCTCCACGTCAACCCCCACGGTGGTCGTAGCTGTGGACCACACAAAACTTTGGGCTATGATTGGATCTGTAGCTGGAGCCCAGAGAACTGGAGTCAAGAGAAAAGCAGAAGACCAAATGCACAGCAAAAGGGCTGCAGGCTTCTCGCCCTCGCTTCAGAGCTCTGCTTCTCCTCCTCACTCGTCAACCACATCGCTGACGCCGGCCTCCTCCTCAGAGCCGGGGCCTTCGGCGTCAGGGAGCGGGACGGAGAAGAAGGGCAGGAGCAGTAAAAGCCAGTCGTCTCATTTGGACATGGAGATCGAAAGCCTCCTGAACCAACAGTCCACCAAGGAGCAGCAGAGCAAGAAGTTAAGCCGAGAGATTCTGGAGCTGCTGAACGCCAGCACAGCCAAGGAGCAGTCCATCGTGGAAAAGTTCAGATCCCGCGGCCGAGCTCAGGTCCAAGAGTTCTGCGATCATGGGACCAAAGAAGAATGTGTTCGCGCTGGAGACACGCCTCAGCCATGCACCAAGTTACACTTTCGTCGCATCATCAACAAGCACACAGACGAGAGCCTCGGCGACTGCTCCTTCCTCAACACCTGTTTCCACATGGACACCTGTAAGTACGTCCACTATGAGATCGACAGCCCCCCGGAGACCGAGGGGAACCTGCTGGGGCCCCAGGCGGGGACCACAGAGCTTGGTCTCCACGCAGGGGACGCCGACAGCAATGTGGGCAAACTCTTCCCTTCACAGTGGATCTGCTGTGATATCCGCTACCTGGACGTGTCCATCCTGGGTAAGTTCGCCGTAGTGATGGCTGACCCTCCCTGGGACATCCACATGGAGCTGCCCTACGGTACTCTGACCGATGACGAGATGAGAAAACTGAACATCCCCATCCTGCAGGATGACGGCTTCCTCTTCCTTTGGGTCACTGGCAGGGCTATGGAGCTGGGCAGAGAGTGTCTCAGCCTTTGGGGCTATGAGCGTGTGGATGAAATCATTTGGGTGAAAACCAACCAGCTCCAGAGAATCATCCGCACCGGCAGGACGGGTCATTGGCTGAACCACGGGAAGGAGCACTGCCTGGTTGGTGTAAAAGGAAACCCGCAGGGGTTCAACAGGGGTTTGGACTGTGATGTCATCGTGGCAGAGGTCCGCTCCACGAGTCACAAGCCAGACGAGATCTACGGCATGATAGAGAGACTCTCACCCGGCACCAGGAAGATTGAGCTCTTTGGTCGACCCCACAATGTCCAGCCTAACTGGATAACTCTCGGGAACCAGCTGGACGGCATTCATCTGTTGGATCCCGAGGTCGTGGCTCGGTTTAAGAAACGTTATCCAGACGGCGTCATCTCCAAACCCAAAAACATCCAGTCATCATAACTGCTCACAACTCTGAAGAAGTTTGTTTTCAAACTGTTTTATTTTTTTTATACCTGTAAACATTTTTTTAATAAATATTGTCCACTAGATGCCCCGTCTCCATCTTGCCTGTGTACTTTTCACGGCTTCTCTGCACATTATCCATAATGATCGCATCGCCGGGCCTCCACACGATACCATATTATTGCTATTTTTAGTATTTTGCGATAAAACATGCAACTTATCACATTTTTTCAACAACAAATTGTGTCCTCAAAGCTAAAAGTTTGTCATCTGTTTCATCCAGTAACATAAAGTTATCTCACTTTATTTTTTTCCTGCAAAATGAGACTGTCAAGCAGACCGTCACTAAAACCTGCCATAAATGTTGCTATAAGAGCGAGCACGTCTGATATCAGTCCACAAGTTGGAAGTTATTTGCAATTTGTTTCTGATAACACTCCAATTAACTGCGATAAATCATCAAAACTCACATCTGCTGTTGTCTACACAAACAGAAATTCACATTTAACTATTAGATTTGCACTCAGTAAACTTCCTGTTCCATAGTAATATAACCAGAAAACAAACAGTAGGCAGCCAGTCGAGTTGGGCTCATGTGCCTGAGCTTATTCTGAGTTAGGAAGCAGCTTCGTTAAGGTCAGTGTCCAGTGTTGAACCGCGAGTTTGCTTAGGTGATGTTTTTTGCAGATGGTCGTGCACGAGAGGAGCCCTCTTGTTTGTAGCATTCCTGGAGTATTTGAATTTAGTTTTTAGAAAATGCCAATATTTGGTATCCTTGTGTCTTTACAACATTGTCAAGCAATATATCCCCCAGCCCAAAAAAAACACACCGGAGACATTTTGTTACAACTTATTTTATATTTGCTTAGTTTAGAATGAAGATATTTTTGACGTACTCTGGATTTGAACAAGTGATCATTAGTCTTTTTTTTTTTTTTTGATCAGCATTTAACAGTCATAGCTTTTCAATTTGGGCAAATACAGAAAGGTTTTCTTACAAAAAAAAAAAAACGTGCATTTTAAAAACACAGCCAGAGCGTCTTTTTTTCTAATTAAAAATATTGATCAGAATCAAGCAAGACTAAGAAAATACCTATCAGAAATAAGCTGCTGTGTAGCTCGGCTTATTTCATACGGTTGCCCTGTGGTGCACAACACAACTGGATTTCAGCAAGCCTTTCTGAAAGTATCAGGGCCACCGTAGATCTCACAGATGAACTATTAACTATTAACAACACTGCTGTTAAACAGGCTCAGACCTGGTCAGCAGTTAATGTCTTTTATAAAACAGCAAACCATTTTCTGTTTTATTACCTCACTTTAAACTAGCAGGGTTCTGTGTCACAGAGCAGGATTAGAAAGTTAATTCACGATGATGACTTAATGATGAGGTTTAGATAGTCACACACTTCATCACACTCAATGCTATCTTCCTCCTCTCGCTTTGTGAAACAGCCTTAATTAACTCCAGCCATGATCTAATAAGCAAATTGATCTTTTTCTACAAAGGTAGTCAAAAAAAAAAGAAATATAAAAGAAACACAGTAAAAAAAAAA
>AY653294.1 Chlamys farreri ferritin CFB mRNA, partial cds 
ATCAACCGGCAGATTAACATGGAGTTGTATGCCAGCTACTGTTACCAGTCCATGTCCTTTTACTTCGACCGTGATGATGTCGCTCTCCCTGGCTTTTCAAAATACTTCAAGAAAGCCTCAGATGAGGAACGTGAACATGCCGAGAAGTTCATGAAGTATCAGAACAAGAGGGGAGGCAGGATTGTCCTTCAGGACATCAAGAAGCCGGACAAGGATGAGTGGGGAAGTGCCCTGGAGGCCATGCAGGTTGCTCTGGCTCTGGAGAAGAATGTAAACCAGTCTCTCCTGGACCTCCACTGTGTTGGGGACAAACATGGCGATTCTCAGTTCATGGACTTCCTTGGGGGCGAATACCTGGAGGAACAGGTGAACGCGATCAAGGAGATCTCTGACCATATCACCAACCTGAAACGCGTGGGACCTGGACTCGGGGAGTACATGTACGACAAAGAGTCCATCAATGGATCCTAGACCAGAGGCACCCCCTGTGGAAGCTTCTAGCAGTGTTGAACATTTTGCCCAGAATGTGTTGTCTACTAAAATACTATATAACCACTCAGTAACATGTGAATTATAATATTCCTGGAAGAACTTTCTAGAAAAATCAATGCATAATACACAAAAAGAAAAAGAAATAATGGGCACAAAAGAAAAGTTGAAAAAAAAAAAAAAAAAAAA
>XM_025196037.1 PREDICTED: Alligator sinensis chromosome unknown C5orf24 homolog (CUNH5orf24), transcript variant X2, mRNA 
TTATACATGTTTGTCTCCTTTATTTTGGTAGAAAATGATGCATCCTGTTGCCAGCAGTAATACAGCTTTCTGTGGGACTGGCAAGAGTTCTTGCCTTAATGAAGACAACGTGAGAGCCACTGACCAGTTTGATTTATATTCCACACAGCAAAGCAAATACAGCCACGCAGTCAGCCACAAACCAATTGCATGCCAGAGACAAGACACGTTAAATGAATCGCACTTGCAGACCACAAGTGGCAGGAATATAGAGACAAAAGATGAACTAAAGAAAAAGAAAAACCTCAACCGGTCTGGCAAACGTGGAAGGCCTTCGGGGACCACAAAATCAGCAGGGTACCGAACCAGCACAGGTCGACCCCTTGGGACCACCAAAGCAGCTGGATTTAAGACAAGTCCAGGCAGACCCTTGGGTACAACTAAAGCTGCAGGATACAAAGTCAGCCCAGGGAGACCTCCAGGAAAAAAGCAGCAAGCCTTCAGGTGTTCCAGTGATGCCTAACACATAATGAGCTGGACTTTATGCTGTACTTTACAATAGAATACTAGCAGCACGGTTTGGCAGGAAAAAGAAAGATGGCTGCCATCAGAAGGTACCTAACTTTTAATCCTATGGTGGTATTTTTCAATATCAGCAGTTGGCTTGGTCATTTAAGCAACAGTCTTTACATGTTACATTTACTTCAAATTAATCAAAGAAAACGTCAAAACCCATTGAACAGCTCTTTTCTGAAGTGTGCTTTTGTTTTGCCAGAAAGATTTTTCTTAAGCGTTCAGTCAAGACCCTACCAAACCAAGTCATTAAGAAGTGGTGTGTCTGAGAAAAGAATCACTTTGCTCTAAAATACATAAAGTAATTCTGATCAGAACTTCACTTTTTTTCCATTTCGAAGAGCTTTAAAAGGCAGAGCAGTTTAAGGTTATTTGTCTATTGGTTTCATTAGTTATGACTCTGCTTTTTTGTTACTATATGTACAGTAATGTTTCATACTATCCCTATAGACGATTACAAATAAAACAATCGCAATTGTAAAGACTTTGAACTGCAAACATTGTTTCTGACCACAAGATAAGTTTGTTCCTCTTTTTTATTATAATGCATATATTTTAACATTGCTTAAATATATTTATGAACTCTAGTTAGAGACTAGAGCTTTTTCTTTGCAATTTTTTCCAAGTAGGTAAATCTTTTTTATGAAAAATATGATGATGGTATGATCATTTTTTAGGAATGTTATGCTCATTGCTTGGTAATTTGGACCACTTTATGATTCTTTATCTTTTACAATTTGCTTTTCCACAGGTTCATTTTGGAGGAAACAATTATCCATTAAGTAACTAATATCAGCACCCTGCCCTCTGCTGTAAAAAGCCTGATTAGATACTGTGTATGTTTTTATGTCCATGAACTTGAGCTACTCGTGTGCAATTATGTGTATGGGAATGGAGTAGTGTTCATGATCTGTATTTACATCATCATATGGATGTATATTTATTAATAAAGTCAGTACTTTAAAACCAAA
>XM_009169100.1 Opisthorchis viverrini hypothetical protein partial mRNA 
ACTTCCGGCCGTGTGAGAGTATACAGCGTGCTCTCCAAAAGCTTCCGTACACCTAGTGGTGTCCGTCAGGGATGCTCACTCTCTCCACTCATATTCAAATTTGTTATCGATGAAATAATGCAACTAACGCTGGAATGTCTTCGGAACCCCGGTGTTCAAATAGCCTGTGACGAAAACCTTGTCGATCTGGAATATGCAGACGACATCGTTCTCATCTTCAGAGAAGAGGTGAAGGCGCATGTGTTTTTGGATGAACTCACGAAAGTCATTCCGTCCTTTGAAATGCACTTTGCACACACAAAGTGTAAAGTCATGTTCATGGACATGCAGCTACTGAACACGCCACTTACCATCCAAACCCTGCGTTTCAATATCGTTTCGGATTCTGCAATAAAACAGATGGAATTCGTGCCAATAGCAGAAAGTGCGATTGTAGGCGCACCAGATTGGTTTCTTTCCGGGGCAATTACAACGAGCAACTCACATTTGCGCGGGGATGTTCGATCTGCTCTCGTGGCCTTCTCCTCCAAACCCTACGTTCATATATTTTTGGTCAAAGTCAGGTCCGCAGAACAGCATGACGTCAGCTCAGTAGTCTACGTAGGTCAGATTCAAGCACACCACGAACGTATTTCAGGCTTGTCCTTTTGCGAATCCGTGAATTTTTCATCTTCATCGGATATTCAGATGTTCTCTTGTGGACAGGACGGACTTGTTCGACATTGGAGCTATCACAGTCATGAGTGGTTGCTCACCAAAGAATTGAATATTCGTTCATTCAATGAATCGCTGCTTCCCACATGCCTGGATACAATTGTGATCGCTGACCAAATTCTCGCTTTAGTTGGGACAAACAAAGGAACATTGCTTGTTTGGGCTGTGTTTGCACTATCCACTGAACCCGTCTGCTTGACAAAGAAATTCGAAAATGATTCAGCGACAACTTGTGCTTGGGAACCGTGCAACTTGTCGGGTTGCATACGCCTGGCGATTGGATACAAAAAGGGGATCATAGGAGTTTACCTCTATCAACATTCCTCTGTGACCGCAGCGTCTTCCTTGACTCAACTATCTCGTTTCTATGCCCACGAACGGGACATATGTCACGTTGTGTGGAATCCATCTGCACACGGATACTCAGAAGTGGCAGCGTCGGAACCAGAGTTATTATCTACTGGACGGGACCAGATGGTTAAAATATGGAACATTGCCAGTTCGTGGTGTTGTGGTTCGGTCAGAGTTCCTGGGAGTGCACGTTCAATGCCAAAAGAATCGGATTCATCCAACCTGACAAAAAACCAGTCTACAGGTGCTCCTTGGATATCTGCTTGTTGGTTCCCAGAAAAAACGGACAATCCGGGCAGAAATATAGTTGTATCCGGTCTTCGAGGTGAATTGTATAGCTGGTCCGATTCGTCACAGCTGGTTCGTTTACACACCGAGAACCATGGTCACTCAATGCTTGTTTTCGCTATTCGTTCTATCCCTGATATGGACGGATTGTTCTTCACAATTGGCCAGGATCGTCAAGTTATTCTCTGGACATATCGTTGTCCGACTGACTTGACATTCATGCTTCGTGTGCCTACTATAGCTGCTGGTATCTCTGCTTTGGCACAGTCGGACCACGGACATGGACCAATTGCAGCAGGCGTGGCAGATGGATCAATTTTATTGTGGCGGCACTGCAGCTCTTTACAAGAAGAATCTTCTTCAACGAACCCGGTGACTTCTTACTGGCCACGTGGTGTGCACGGCAGCTGTGTGACTGCCTTAGCTTGGCATCCTTCAGTTCGCCATGAAAGTCTACTTGCCTACGGAACCGAGTCAGGATGTGTGGAACTCATTGACACATCCAAAATTCCCAAAAGTGCTACTCAGAGGTCGAAAACGCAGCCATATATTTTTGGATCAACCGTCTATCGAGTTGCTTGGGGACCTCCACTTTTCACAGATTCAGGGAAGGATCAGGTTGTTGAAACAGCTGTCTCAGAACACGATGCGAATGGTTCGACAGATAGCACAGATACGGTGGAACAAAAAGACTCAACAAACAAATCCTCGAGTACTCCCAAGTTCTCATCTTATATATACAGCGTATGCAAAGGGAAGATTTTTTGCCACGTTGGCTTCCAGCGACCACCTTTGGATGTAACTTTGAAGTTTCCCTCTGTTCCCGGAATCTCTACAGAGGACTGGGTAAATGACAAACGAACCGACATCGCGTTTTTATACCTGGAGAATTCCACCCGTTCCGTTGACAGTCCTTCTGAAGAGAATGAGATCCGCGAGTGTTTCAGCTGTTTGATCACCGTCGGCTACCGATCTGGGTCGGTGGATGTATACGGACTCGTGAAATCGAAGGAGCATGTATCGGTCGACCTTATTCGACCATTGTGTCGTATTTCTTGTCATACGAAGGGTGTCAATTGCTTGGCTTGGTCCTTTGACCGCTACTGGCTTGCAGTTGGCACTAATGAGTCCTTCATCACTGTAACTGATGTTGGGCACATTCTGAAACAAGCCACGAAACCCAATAATCCCTCTTTCCGACAAATTTCAACTTATTTGGCACATCTGGAGGGCCACGGCAACAGGATCACATGCTTGGACTGGTCTCCGCATGAAAATGGTCTCCTGCTTTCCGCTTCATTTGATGGCACTGCAAATGTCTGGAAAGTAACTCATAGTGACACCGAGTCAGGTTCCACATCTGTAGCGAATTTTCGAGCTCATCGTCTTCGCCTATTTGCCTGTCTGTGGAGTCGTCAGGAGGCGGACCTGGCTTTTAGCGGTGGTGAACTCTGTCACCTATTTAGCTGGCGTCCATCCAAACTCGCACATAAAGAGCCACCTAATTCCCGTCGTTATAGGCCTCCTTCAGTTAAACGTGTGCCCACCGATTCAAAGGATCCCTTAATGCCGTCGGGCATTCTCGAGCCTTCGGCCATTGTTGTCACCTCACAAGAAGTAAATCATACGGAATGTGTACCAGAGCCCATACATCACACTGATACGTCCGTTGGGACAAGTGTCCCACTTGAACTACCGGTGAAATCTGTGACTACGAAAAAACCTGGTTCAGGGGACAAACGCAAGCGACCGTCTTTGTGTCCACATTTTTTGCATCGCGGTTCACTTGAACCAAGTACGACGGATCTGGGATTTTGCCCTCCTTTTCGCCTAGGCTCAAGGTTTCTGCAAGTATCGCACGTACTAAATCTGTTGAAAAACGATGTTGATCTACCTGAATCGGACTGCGATCTTCTGTTCCTATTGCCAGAAACAAACAAAACACGATCAGCCTTGGTGCGATTTTTGACCAGTGAAGCAACTCATCATCTGTCAGCATATCGTGCAACTCAGCGATCTAATGGGCTTATGCATTTGGATGCTTATTGTATCATTCTTCTATGGCTTGGACGTACTCCGTTGGTTGCGCAGACAATGTGTTCTGAGAAACACATGCCCTTTTGGTTGCTTTGGGCAGTTCAATTGGCTCAAACAACCGTACCGGCCTTCTCCGCTCCCCGAAACTCATCAGGTGATCACGCGGATATAGATCTAGCTGGAGAAAAGGTCAAGGATATGACAAGCAACAGCCCTGATGTTTTGGTGTCTTCCACGTTACTTGTTTGTGCGGGTCGACATCAGGAGGCCGTTGATTACCTATTTGCACAAGATCGAGTGAAAGAAGCCTTGTTGCTTGCACGGCTCAGACTCAGTCCCATGGACGCGAACTCAGCAATGCAGAAGTGTATTGCTCGCATCATCGAACGGCGGTTGTGTCCGGAGGTTCCGTTCGTCAGAGTTTTACATGAACTTGGAGCTGGCGAGTGGGAGCGGGCACAGACAGTTCTACGTCAGGCAGCCGTAGTTTCCCTTTCACGCCAGGACATGGAAGTTGAGCAAGTTGCAAGTAGCTGGGTAGAACTTAATATTCTCCTCAGCTGTCCGGATGACAGTTTACCGACGAATGCGTTTGTTCGATTTGCTTTAAGCTGTCTGGCCGTTGGCTTCCAGTTGCCAGAAGCACAATCCATAGTTTACTTTCAGCGGTGTCAAGAAGCTGTGACTCTGTCAGCTGTCTTGGCTACTGGGACGGATTGCTTTCGACTGTTGTTAAATACTGGCCTTCGGTTTGCTGCTATTCTTACTGGCTCTTCTCAAACAGAACTCGAATTGGATATGGAACTACATGCAGATGTGAGAGATATTGTACACTGTCTTCGCTACGCAACGCTTGATCGTCAGCCAGCGAATCAGTGGTCTGCATGTGCTTCCCAGTTGGCACTTGATTTCACCATTTGCCTTCTTTCATCTAAAAAATTGACGTCTCAAGACCAATCCACTGAGGACCTTAATCGGCTGGAAGCGAGTTTGCGTTTGTGTTCAAAAGTCAATCCCACAAACACACAACAACTCAGTGACCTCCTGTTCCACTCCCAGACTTCTTCGGACCTTGACTCACGTTTGAAGCGGTTACAATCGACTGCGCTCCGCCCCTCAGACAATACAGATGAGCAAATCGGAAACACTTGTCCAGTGTTCTGTTCTCCTTTTAGCCAAACAACAATGCCTTCCGTCCGATCGCGGCGTAGCACATTATCTTACTCCGCCGAACTGGAGCGAGCCGGGATGGCCCCCATTGAAACCCCGATTGAACGCGTCACGGGTTCAACCGTGGTAGACGCTCGAATGTCTAGCGCTTCTAGATTTTGGAATCAGGATAATACACTTGTTAACATAAGAATGACCCCTTTCGGACACGAAAGAACCGACTACACATACGGAGATAGTGGAAGTTATCGGTCAGAGCGGGTTAAGACCAAATGGAACACACCGAATATGTCGCGCCTACCCGTTCATGGGAACCACGTTGCTGGACAACACATCGCCACTTTGGGTTCCCGTACTTTGAATGACTCAGATTTTGAAATGGATTCCGTTCTGACCGATGAAAGGTTGTCAGCGGTCATTCCGGGCCTAGGAGGCAATCGCGAGGAAGAGTTAGAAGATGATGAGCTTAGTAGTAGGGCTTCAGTTGCCTCATCTCGATCCAGCACCCGTATGTCGCGTGTCCGCTGCATACGCGTGCAAGGTGAATGGTGCGTTCATTCTGAGTGTATCGCTTCTACTCCTGGGAACCGACGTATGAACTTGGTTGCTCGTCAGCGCAATACAAACAATACTGCTGACGTCACTCACATCGTCGATGGGACTGATACAGAAACTCCCACTGGAAGATCTCGACATAAACACGAACAGCAGCAGTTGGTTTCTCGAAGATCCACTCGCGCCGGTGTGAGACCCTCGATTACGGCAACGAAAACCACTACATCTCAAAATCGCATTGAGTCGAATCCTCACACGGATCGTTCGAATCAGTTGGCTTCTGCTAGTTCCACGTATGTCTACACCTATGTAGCACCAGATGCTGACCATATGCGACCAGGAGAAGGCGGAGACAAAAGCTCGTTCGAGAGAGGAGACATTCCTGATTCGAATGGCAGAATGTGGGGTGCACAACCTCCACACGTTTCATCAAATGATCCCACTACTGAGCGATCATTCTTAGCCAATAGGTTTGTTTGCTCCAGTGGAACGTCTTCCGCTGGAAACAAAGCCCAGAAATGGCTTGCTCGACACATTTTTGGCCTTGAGTCATCTGCCCCGGTGAGTACTTCGAACCATTTTGTACCCAGTGATACTGAAGAGTCAGATACAATCACAACTGGTCGCTCCGTTGCTCGTGGGAAATACGTACACAAACCAAGCGTCACACGAAGCCATCGACTGCACCATATAGATTCATCATCAACAACCTGGTTCTTCCGACCGTTGATGCAAGGAGCAGAGAAGCTGAAAGGAGTGATTTTCTCGAGTATAGCTTTTGTATTGGCTGGCATCTTCATCGCCTACGATGCTTTCAGTTCTTGCGTCCGTAATTTGTCATCCGCCGTTTGGACCTTTTGGTTCCGTTATTCCAGTCCTTTGCCCCACCGTTCTCGTGATAAACTGACCGTTCATCCACGGCTAACTCAATTCGACAACCACGTCACTCTTCAAATCTCATCGGTCGAGGAATCTGACTTCTTCTCTCGATCGTTCCGGGCAAGCTACGTCTGGTTTACCAGAGCTGGGACGATCTGTGTTCGTCTGGTGGGCTGTCTTTGTTTCCTAATCCCGCTCCTCTTACTTTTGGCTTTCTTATTCGCACCAGTTGCTGTCAATGACGACGAACCACCTCCAGTGTGGCCTTCTTTTCTTTCGGATACCGACTGTAAAAAGGCCCTACTCGAATCTCGCCCCAGCGATGCAACAGCTTGGCAGCTCGCCCTTTGGAGATTCCGCTGTCTGTACAATCTATACTTCCTAACTCCCGACTTTCCGTCAAATGCTACCACTTCGGAAAGCTCTTCATTGTGGCAGAAGTTTAAAAGTTGGTTGTGGCCTTCTACATCCGTTGTACCCTCCCCGGTCATCGTACCAACTGATCTACCGTCATACGTCGACAGTAAGTTGCTCGCTCAGCTGGAAGCATTCCGGGATTTTGTGAACGATCGATTGGATGGTTTGTCAAACACTATACGTCATACGGAAGAACGTGTGTCCGAGATGGAACAACGATCTGAGACACAGTTCAATGACCTCAGTATACATATTAACAATTTGAAACAACACTTTAACGAGCACACCACTGCATTGGATTCCTGGCATGTCCAGCTACAAGCACTGCAGGCTCTTGCAGGCCGCTTGGACAGTTCGGAGCCATCAAAGGTGACTCTAAACGAATACGATCGACTCTTCAATGCGGTTATCAGTGCCGCAAATCAAACCGTTTCCAAGGAGTTGAATTTACTTCGGATCGAACTGGATGAGAAGTCAAGTTCAATGTGGAACCGACACAACTCCAGTTTCACACAACTGTCCCTGTTAATTTCTCGTCTGCGTGAAGAACTGAACGACCGCTTGCTTCAAACGGAACACAGGCTTGGTGAACTACGTTCACAACTAAACTCGGGAATTCATGCACAAGTAGTCAACCATACGTCGCTCGTTATCCAAATGGACGAAATCCGCCTAACATTAGGCAATCTATCGGAGCGTGTGGCACAAGTCCGGAGCGCTAATGAGGGGCTGGATGGACTGTTCAAGAAACTACAAGAAGCCACACGAGACTGTAGTGAACGACAATTGCATCAAGTAGAAGACTGTAAGCAAGCGGCCATCGAACGAGCGGAAATTGCCGTGAATGCTTTTTCCGAACGTTTCACCGATCAAATTTCCGTTCTTGTCAAGGAGGCTTTGCTGCATTGGCTGAATGATGTGTCGGTTGAGGAAGCCCTGGATTTGAAACTATCAGAACTGGTTAAACAGTCCACACGAGAAGCCGTAGATCGAGCCATCCGTGAATCCGCGATCTCAGGGTACGCTCCGAGCGTGGACACCAGCGCAGAACAAACCGACGAATTAAAATCCCGAGTATTCATTCAGAAGCTTATTGACGCTGCCCTAGAGCGTTTTGCCGCCGATCGAGTGGGGATGGCCGACTTCGCTTTGGAATCCGCTGGTGGGTCTATCGTAGGCACACGCTGTACGCGGACTTACACAGAACGGGCAGCACTCTTCACCATATTCGGCATACCTTTGGCTCGTTTAAGCAACTCAGCAAGAACCATTTTGCAACCAAGCAACAATCCCGGTGATTGTTGGGCATTCCATGGAAGTACGGGACAGGCGGTAATTCGCCTCTCAGCACCTATTGTCATAACGTCCGTCACCCTGGAGCACCTACCTCGTGTTCTTTCACCAAACCAAAGGGTGGATTCGGCGCCGAAGGATTTTGTCATCAAGGGTCTATCATCGGAAACTGATGAAGGGGTCGTAATTGGAACATTTGTCTACGATATCAATGGTCCTGCCATACAAACATTTCCGATAGAAGGTCAGTCATCTACGTGGCATTTAATCGAGTTGGGAATCCTCAGCAATCACGGACATCCACTATACACATGCGTGTATCGCTTGCGTGTACATGGAAGAATACCAGACTCCTAGGCAACTTGACGACTGACTGACTGTGAATTGCCAGCATGTTTCTGTCTGCCCACATGTACATATCGACCCCGGCTGTATTTTCAGACTCGTTAACACGTCTGTTGTCCCCGGTGTTTTATAGTATTCCAACTTCCCATACAAAGTGTATACTCTCTGAAACACCTCTAACCGATGAATGTGATTTTCCTCTACTGCAGGCGACCGGTAGGCAGCCTAATCTCCTAATACCCGCTCATGTCTTAATGATTCATGTGTAACTTTGAATATCTTTTCTGCCGCCGCCGTCGCTGATCCACCACTCATTCACCTCGCTTATCTAATTACAAACGTTCTTC
>XM_021551582.2 PREDICTED: Lonchura striata domestica carbohydrate sulfotransferase 9 (CHST9), transcript variant X2, mRNA 
ATGTAGTGCTTCTTGAGGTTGGTGTCTCTGGGGAAGACACCGAAGAAGATGCAGGCATGCTGAAGACTTCAGAGAAGTGAGCAATGAGTCCTTCTGAAAGCTGAAGAAAAGCCCCCTTGTAGGGTCATGAACCTAAGACAAGTCTTCGTGTCTGTACTGCTGTTTGGAGTAGCTGGTCTACTCCTCTTCATGTATCTGCAAGCTTGGATTGAAGAACAGCATACAGAGTCTGGAAAAAAGCTGCAACAAGAGACAATTAATCAGGATTTCACACTCCAGCCTCTGGGGATGCCAAGGAAAGCAGCATGGAGAAGAATTGTTCCTGTGGGCCTCAGTAACCCTGAGATGGCTGTCTCAAGCAGCAGGCACTGGCAGGGCAGGGCTGACCCTTTTGGTGTGGTGGCTGCCTCCTCGAGGAGCTGGCTGCCTGAGCAGAAGATGAGTGAGTCCCCTCTCAGCTGGTTCAGAGGGGCGTATTTACCTCCTGCTCTGCACCCATTAAACAAGACATTTGTCAAGGGTGGTGAGTGGCAGGACATAGACAGCACCCAGGAAAAGCGCAGGGCCTTCCTGCAGGGCATCTGTAGGAAACACAATAGCAGAAGGAAGCTGCAAACCCATCTGGTGCACCTGGTGTCAAGAATTTACGTAGAGGACAGGCACAAGGTTTTGTACTGTGAAGTGCCAAAAGCAGGCTGCTCCAACTGGAAAAGGGTCCTCATGGTGCTCAGTGGACTCGCTGCTTCAGCAAACAACATCTCCCATGATGATGTGCACTATGGAAAGCATCTAAGGAAATTGGACAGTTATGACCTAAAAGGGATCTACACACGCTTGAACATGTACACCAAGTTTATATTTGTACGTGATCCTATGGAAAGATTGGTATCTGCCTTCAGGGATAAGTTTGAACATCCAAACAGCTATTACCATCCCGTATTTGGGAAGGCAATAATAAAAAAGTATAGACATAATGCAGATGAAGAAGCACTGAAAACAGGATCGGGAGTTAAGTTCAAGGAGTTTATCCAGTATTTGTTGGATTCCCACCGACCAGTAGGAATGGACATTCACTGGGAGCAAGTCAGTAAGCTCTGCTATCCCTGCCTCATCAACTATGATTTTATAGGAAAATTTGAAACCCTGGAAGAAGATGCCAATTACTTTCTGCAGCTGGTAGGTGCTCCAGCCAATCTGAAGTTCCCTAAATTCAAAGACAGACATTCCTCTGATGAGCGAACAAGTACAGAAGTAGTGAGGCAATATTTAAAGGAATTGTCTAAGGAGGAGAGACAGCTGACCTATGACTTCTATTACTTGGATTACTTAATGTTCAATTATACATCACCACTTGTATAGCACTAGAATAGCTTCAGGCTTCTACTAGATACTTATCATGTTGGGATTCAAAACAACTACTTTGATATTAGCCCTGAAAGGAAACAAAGTTACTGCTAAGTAGAGTTGTCTTGAATTAGTGGGGATTTTATAAGCTAGAGTGGTATCAATTGATACTAAATTATGGAGAATGCAAAGAAAAAAGACCTGCAAACAGCATAGATTGCACTAAAATGCCTGGAAAAGCTGTTTTTACCATTATGGATTATATTATGGAAGCAGTAGCTCAGACAGCTGTTGCATTAGCTTACCTAATGTTCTTTTAATGGTTTAAGAAAAAAAAATTGGAGTGGCATGATTCTTTTTTGGTATGTTTTCTTTAGAAATGGATTTTGAAAAAATTTTGAATGTATTTTTACTTTCTGTCACTTATTAATAAATGATCATAGGCTAA
>XM_027345943.1 PREDICTED: Dermatophagoides pteronyssinus SOSS complex subunit B1-like (LOC113795734), mRNA 
TTGAATTATTTATTTACTTATATTTTTTTATTTAATTTTTTTTTGTAATTAAAATATATTTTTTTCCTATAAAAAATATTATGGGCTATTCGATTAATCAGATAAATATGACCGATAAAATTGATTCAATAAAAGATATTAAAGCACCATCGAACAAATTAAATGTTATTGCAATTGCAGTTGAAATTGTTTCACGTTTAATAACCAAAGATAATCATGAAATACGTGTAATGAGATTTGCCGATCGTACTGGTTGTATAAATATGTGTCTTTATGATGAATTAGGCGCAACGGTTCAACCAGGTGATATATGTCATATAACACGTTGCTATGCAACATTTCATAAAGGTGCATTAACATTATATATGGGTCGTCATGGTAAATTGACAAAAATTGGTGAATTTTGTATGACGTTTACTGAAACACCAAATATGAGTGATGGTGATCCATCTACATTATCATCACCATCAACTTCATCAACATCAACGTCGTCGTCGTCGTCGTCGTCATCAACGTCATCAGGTCCACCAACAAATTCATAAATATTTTTCATTTTTTTTTCTTTTCAAAAATTGTG
>EU801997.1 Uncultured bacterium clone 3C003382 16S ribosomal RNA gene, partial sequence 
AGGGTTTGATCATGGCTCAGATTGAACGCTGGCGGAATGCTTTACACATGCAAGTCGAACGGCAGCACGGACTTCGGTCTGGTGGCGAGTGGCGAACGGGTGAGTAATATATCGGAACGTGCCCAGTCGTGGGGGATAACGTAGTGAAAATTACGCTAATACCGCATACGATCTAAGGATGAAAGCGGGGGATCGCAAGACCTCGCGCGATTGGAGCGGCCGATATCAGATTAGGTAGTTGGTGAGGTAAAGGCTCACCAAGCCAACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGACGCAAGTCTGATCCAGCCATTCCGCGTGCAGGACGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACAGAACGAAAAGGTCTCTATTAATACTAGGGGCTCATGACGGTACTGTAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTATATAAGACAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTTGTGACTGTATAGCTGGAGTGCGGCAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGGCCTGCACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCAACTGGTTGTTGGGTCTTCACTGACTCAGTAACGAAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGTTTAATTCGATGCAACGCGAAAAACCTTACCCACCTTTGACATGTACGGAATTCGCCAGAGATGGCTTAGTGCTCGAAAGAGAACCGTAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGCCATTAATTGCCATCATTTAGTTGGGCACTTTAATGGGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTATGGCCAGGGCTTCACACGTAATACAATGGTCGGTACAGAGGGTTGCCAAGCCGCGAGGTGGAGCCAATCCCAGAAAGCCGATCGTAGTCCGGATTGTAGTCTGCAACTCGACTACATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCATGTCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTTTACCAGAAGTAGGTAGTCTAACCTTCGGGAGGACGCTTACCACGGTAGTATTCATGACTGGGGTGAAGTCATAACAAGGTAACCGTA
>XM_007934102.1 Pseudocercospora fijiensis CIRAD86 uncharacterized protein (MYCFIDRAFT_212712), mRNA 
CTTTCATGTTGTATGCTGGAGTCTGCATGTCCGCGGACACTTGCGCACGAGAGCATCAGCGCCCAGCGAGCTTGCGGAATGCGGAGCTGTCATGGTCGTACATCTGCCGAGTGTCCGTAACTGATATCGGTAGCCTCCTCAATTCTGGAAGCCTCTCAGATCCCAGCGTCCTTGTTCGCGCTGACGTTCTCTATGTCGCTTCTTTCCGCGGTGTTTCGCTTCAAATTCTCTCCCACAATCTCTTATGCAGTCTCTTCCACGCCCTCTTGCACGCCCACATCACCAGCAATGATTTCCTTCGGGTTGGCGGCTCGAGAGCTTATTGCAGCCTTGGTGAGAGGTGTAGGTCCCACGTCGTGACTTGTCCCGACGACAGGTCTCGCAGTGCATGCATCTTCGTCTTCTGGGGGTGTGAGATCGCTATCTCAACTGCCCTCGAGCTACGACTTCCATATCCCGCCTTCCTACTCCACCTTCTCCAAAGCCGGCCACATGTCGCAGACGTAGCGCTTCATGCACTGGACGGCTCTCTTGGCGGCGATTCCGAGGATAGCGACTTCACAGATGGTGCAAATTTGAACGACGTGACGGAGGAGAAGCTCTGAACCGGATCCACTGTGGTGAGAAGGTTGATTCCACAGCTCATCTCTGCATCCCTGTGGCCTTCCATCCCAGATGCGATTGAGTGAGGATCGGGTCATTTGCTGTGAGTTGAACTTGTCTTGGATGAAGCATACGATAAGTGTGATGTTGTAATAATCTCAACAGTCATGAACAATGACGG
>XM_026366555.1 PREDICTED: Anabas testudineus cytochrome c oxidase subunit 5A, mitochondrial-like (LOC113166428), mRNA 
TCGAGTACGTGACCGGCTAAGTTAGCATTAGCTTCCTCCTGCCAGACCTCACCGGTTCGAGGAGCTAGCTGCCGCTCATCATGTTCAGAGCCGCCGTCCGACTTTCTGTCTCCGGTGTCCGGGGTTTAACCCGTACGCAACCACGGTGCCAAGCTGTTTTGGCCTCAAGATGGTACTCACATGGGAAACAAGAGACGGATGAGGAGTTTGATGCCCGTTGGGTCACTTATTTCAACAAGCCAGACATTGATGCATGGGAGCTGAGAAAAGGGATGAACACGTTGATTGGTTACGATCTGGTACCTGAGCCAAAGATTCTTGAGGCAGCACTGAGAGCCTGTCGAAGGTTAAACGACTTGGCCAGCGCTATCCGAATTTTGGAAGCTGTAAAGGAGAAAGCCGGTCCTCATAAAGACATCTACCCGTACGTGATCCAGGAGCTACGGCCAACATTAGATGAACTTGGCATCTCCACACCTGAAGATCTTGGCATTGACAAAGTGTAAATAAGTATCTGATAGTGAATAACCCCAGGACGCAGAATCATTGTACTTACATGTTTGCCTCACCTGATATGTGTGATATTTAATTTGCCCTTTATTAAGTTCTTTTGTTGTAAAATATTGATGAACCTAATAAAGGAAAACGAATCTTTATTGAGTGTCACATATTTTGAGAGATTTTAAACAGCCTGGTTACATATTGAAGCAATATTTTTGAAGTTGCTTTAACAGCAGAGCAGAGCGTCACTTGATGGTGCAAGTTGTCTCATTCTTCTGAGAGTCGCGTTTTGCCACCAGGGAGCAGCGTTTTCACATGAATGTAAAAATCATTCTTCTGTATTCAATCTATATTTCATCTGTTCAGGGAAGATATACATGCTGGTGAAATAAACTTGTTCAAATGTCAAA
>XM_008046871.1 Trametes versicolor FP-101664 SS1 uncharacterized protein (TRAVEDRAFT_136475), partial mRNA 
ATGAACGAGCTGCAGACTCTCACAACTTTGCAGCCTTCAGCGGTCGTCTCAACTCGCGTCTCGCACTCCCTCGACAGATGTTCCACGCGGTCCTCCATTCTTTCCCATCCGAAGCTGTCACACAAAGTCAAGGGCATCTGCAAGGTCGCGCGTAAGGCCGGCTTCCGCCTCGTCTGGAACGACGCATGCTGCATCGACAAGTCGAGCAGTGCCGAACTCTCTGAGGCGATCAACTCGATGTACGACTGGTTCCGACTCTCGGACATGTGCTACGTCTACCTCCAAGATGTTGCGGACGGCGATAGACCCCAGGAAGCCCAGTCCGATTTCCGGAAGAGCCGATGGCACACCCGCGGTTGGACGCTGCAGGAGCTCATCGCGCCCGAGTGCGTCGAGTTTCTAACGCAGACTTGGCAATTTCTGGGCACGAAGCTGGGGCTTGCCTCGACTTTGGAGGAGATAACCGGAGTCGACGTCAATATTCTCACAGGCCGAGCCACCTTGAACTCTGCTAGCGTTGCGCGGAGGATGTCATGGGCGGCGAAGCGAGAGACGACGCGCATCGAGGACCAGGCGTACTCGCTCATGGGTATTTTCGGCGTCCACATGCCGCCTATATACGGCGAGGGCAACAACGCCTTCCTGCGTCTCCAGGAGGAGATAATCCGGACTATCCCCGATCAGACCATATTTGCCTGG
>FJ010171.1 Homo sapiens TCF7L2 isoform pFC8A_TCF7L2_B4_ex1-no4-11-14 mRNA, complete cds, alternatively spliced 
TTTTCTTCCAAAATTGCTGCTGGTGGGTGAAAAAAAAATGCCGCAGCTGAACGGCGGTGGAGGGGATGACCTAGGCGCCAACGACGAACTGATTTCCTTCAAAGACGAGGGCGAACAGGAGGAGAAGAGCTCCGAAAACTCCTCGGCAGAGAGGGATTTAGCTGATGTCAAATCGTCTCTAGTCAATGAATCAGAAACGAATCAAAACAGCTCCTCCGATTCCGAGGCGGAAAGACGGCCTCCGCCTCGCTCCGAAAGTTTCCGAGACAAATCCCGGGAAAGTTTGGAAGAAGCGGCCAAGAGGCAAGATGGAGGGCTCTTTAAGGGGCCACCGTATCCCGGCTACCCCTTCATCATGATCCCCGACCTGACGAGCCCCTACCTCCCCAACGGATCGCTCTCGCCCACCGCCCGAACCTCTAACAAAGTGCCAGTGGTGCAGCACCCTCACCATGTCCACCCCCTCACGCCTCTTATCACGTACAGCAATGAACACTTCACGCCGGGAAACCCACCTCCACACTTACCAGCCGACGTAGACCCCAAAACAGGAATCCCACGGCCTCCGCACCCTCCAGATATATCCCCGTATTACCCACTATCGCCTGGCACCGTAGGACAAATCCCCCATCCGCTAGGATGGTTAGTACCACAGCAAGGTCAACCAGTGTACCCAATCACGACAGGAGGATTCAGACACCCCTACCCCACAGCTCTGACCGTCAATGCTTCCATGTCCAGGTTCCCTCCCCATATGGTCCCACCACATCATACGCTACACACGACGGGCATTCCGCATCCGGCCATAGTCACACCAACAGTCAAACAGGAATCGTCCCAGAGTGATGTCGGCTCACTCCATAGTTCAAAGCATCAGGACTCCAAAAAGGAAGAAGAAAAGAAGAAGCCCCACATAAAGAAACCTCTTAATGCATTCATGTTGTATATGAAGGAAATGAGAGCAAAGGTCGTAGCTGAGTGCACGTTGAAAGAAAGCGCGGCCATCAACCAGATCCTTGGGCGGAGGTGGCATGCACTGTCCAGAGAAGAGCAAGCGAAATACTACGAGCTGGCCCGGAAGGAGCGACAGCTTCATATGCAACTGTACCCCGGCTGGTCCGCGCGGGATAACTATGGAAAGAAGAAGAAGAGGAAAAGGGACAAGCGGCCGGGAGAGACCAATGGAGAAAAAAAAAGTGCGTTCGCTACATACAAGGTGAAGGCAGCTGCCTCAGCCCACCCTCTTCAGATGGAAGCTTACTAGATTCGCCTCCCCCCTCCCCGAACCTGCTAGGCTCCCCTCCCCGAGACGCCAAGTCACAGACTGAGCAGACCCAGCCTCTGTCGCTGTCCCTGAAGCCCGACCCCCTGGCCCACCTGTCCATGATGCCTCCGCCACCCGCCCTCCTGCTCGCTGAGGCCACCCACAAGGCCTCCGCC
>KX179358.1 Uncultured bacterium clone MA_1774 16S ribosomal RNA gene, partial sequence 
ACGGGGGGCGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGGGCAGGCGGTCCGCTAAGTCTTTTGTGAAACTCCAGAGCTCAACTCTGGACATGCATAAGATACTGGCGGACTAGAGACCGGTAGAGGCTAGTGGAATTCCTGGTGTAGCGGTGGAATGTGTAGATATCAGGAAGAACACCAGTGGCGAAGGCGACTAGCTGGGCCGGGTCTGACGCTCATCCGCGAAAGCGTGGGGAGCAAACAGG
>XM_004415061.2 PREDICTED: Odobenus rosmarus divergens fidgetin-like 1 (FIGNL1), mRNA 
AGCATGCAGGCCTCCAGCTCCAGGTCTGTGCACCTGAGTGAATGGCAGAAGAATTACTTTGCAATTACATCTGGCACATGTACCCCAGGACAGAAGGCAGATGCGTACCGAGCACAGATATTACGCATTCAGTATGCATGGGCAAATGCTGAGCTCTCCCAAGTCTGCGCCACCAAACTGTTCAGAAAATATGCAGAGAAATACTCTGCAGTTATTGATTCTGACAGTGTCGAGACTGGCTTGAATAACTACGCAGAATGCATTTCAACTTTAGCAAGATCTCAGCAGACTGACAGTGACAAGTGGCAGTCTGGATTGTCAATAAATAATGTTTTCAAAATGAGTAATGTACAGGAGATGATGCAAGCTGGCAAAAAATCCAGAGACTCTCTGTTGGCACCTGCCAGTGCATCGGTAGTAATCCATAAAGAGGCGCTTGTCCTCGATCCTCCTAAACTTAGTGTTTGTGGGGGTTCTGGGGAGAGTGGCCCATTAACTAACGCAGCTCCTGATACAAACAGGACCCAAGATATCCCAGAGAGCAGTCCTTCGAAGTGTCCTCAGGATGCTCAGCCACCTGTGCCGACTAACACCAGAAAGACCTGTCCTTCATCCTTAACACCGTTTGGTGACTTTGCCACTGCAAAAATCCATGCCACACCATTATTTGGAAATGCCAAGAAGGAAAATAACAGCTCTCCAAAGGCCAACGTAGGACTAAATATGTTCTCATCTAATCAGTCTTGTTTGCCTTCTGGCTTTGAAAATCCACGGGAGAGAAAAACTTTTTATGGTTCTGGCACCACTGATGCCCTTTCTGCCCCAGGAGTGAATAAGGCTTTTAGTAAAACAGAGGATAATGGCCAAAGGGAAGAGAGTAGCCTGCCTACTTTTAAAACTGCAAAAGAACAGTTATGGATAGATCAGCAAAAAAAGTACCACCAACCCCAGCGTGCATCCGGGTCTTCGTACGGTGGTGTAAAGAAGTCTCTGGGAGCTAGTAGGTCCCGAGGAATATTTGGGAAGTTCATTCCTCCTATACCTAAGCCAGATGGGGGAGATCAGAATGGGGGAATGCAGTATAAGGCTTACGGCGCAGGACCTGCAGAGCCAACACATCCAATTGATGAGCGGCTGAAGAACTTGGAGCCAAAGATGATTGAACTTATCATGAATGAGATTATGGATCATGGACCGCCCATAAGCTGGGATGATATTGCAGGAGTAGAATTTGCCAAAGCCACAATAAAGGAGATAGTCGTGTGGCCCATGATGAGGCCAGACATCTTTACGGGTTTACGAGGACCCCCTAAAGGAATTCTGCTCTTCGGGCCCCCCGGGACTGGTAAAACTCTAATTGGCAAGTGCATTGCTAGTCAGTCTGGGGCAACGTTCTTCAGTATCTCTGCTTCCTCTTTGACGTCTAAGTGGGTAGGTGAGGGGGAGAAAATGGTCCGTGCATTGTTTGCCGTGGCAAGGTGTCAGCAGCCGGCTGTGATATTCATTGATGAAATTGATTCCCTGTTATCTCAACGAGGAGATGGTGAGCATGAATCTTCTAGAAGGATAAAAACGGAATTTCTAGTGCAGTTAGATGGAGCAACCACATCTTCTGAAGATCGGATTCTAGTGGTGGGAGCAACCAATCGGCCCCAAGAAATTGATGAGGCTGCCCGGAGAAGGTTGGTCAAAAGGCTTTATATTCCACTCCCAGAAGCTGCGGCTAGGAAACAGATCGTGATTAATCTGATGTCCAAGGAGCAGTGCTGCCTCAGTGAGGAGGAAATTGCCCTGGTTGTAAGGCAGACCGATGGGTTCTCGGGAGCTGACATGACACAGCTTTGCAGAGAGGCGTCTCTCGGGCCTATTCGCAGTTTACAAACTGTTGACATCGCCACAGTAACACCCGATCAAGTTCGGCCAATAGCTTATATTGATTTTGAGAACGCCTTCAGAACCGTGCGACCTAGCGTGTCTCCTAAAGATTTAGAGGTCTATGAGAACTGGAACAGAACTTTTGGTTGTGGGAAGTGAAGGGGACACACGGGACACTTGAAATCTAAAGATGGCATCTTTGTAATGCAGCCTTCCCCACTTTTTAGCATGGGAAACTGGGAATTTATTAATTGTACTTTATAGTGTATATTTTGAATTCTATACCTCAAATAAAATAGTAACAGCTTAAAT
>XM_018530727.1 Alternaria alternata hypothetical protein mRNA 
CCATCATGCAGTCTCAGCAAACTCCTCGGTATGTAAGCTAGAAGAGATGGCCTGTTGTTTAGGCACTTGCTGGACAGACCGATGGCTAGACCTCTATGCGATAGATGTAGAACAACACAAACAACAACTTGGACTAAACTTGCACGACGGTAGTCGGCAGTACGCCTTAAAATCAGAGAAATGTCTCGACACGTTTGGCCTTCCAATACGCTATCTACGTAGCACTTCACTCACCCTGATCATCTTAGCACATGAATACAGGCATATATGTCAGATACACGCAAAGTACAATAACTTGGCTTCACAGCGATCTTGGTGGAATCAATCACGTCTTCACGCAGAACTAGTGCTTGGAGAGTCAATTCAATACGAGTCGGAAACTCCCGAGGTCATCTTTACCGGCCGATGTGGTCTTACTGGAGAGAAGTTCGGAATTTTTCTAGTCAATATGATTATTATATTTCTCTTGCACAAGCACATACGACCACAGGATCTTGAGACCACGGCTTCCCGTTCGCTCAGCCCTAGTTAAGCAAGATACCGGCGGATTAGTAGTCAGGTGGGTGACCACTGGCGAATCCCCGCTGTTGTATGTTTTTTTGTTTCTTTCGAAAGAAGATCATTAGGCCGAAAATAGGCGTACTTGTTATTTTTTTGTCTTCCCGCAGATGCTGTTTCGCATGGTCGAACTTCTTTGACGTCGAGATAGGTAGTAAAGAGTAGGCAATAATTGTGGTTTCATCGTG
>DQ227595.1 Uncultured bacterium clone ZFos29a01 16S ribosomal RNA gene, partial sequence 
GAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGATGACTTCTGTGCTTGCACAGAATGATTAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTCGGGATAAGCCTGGGAAACCGGGTCTAATACCGGATACGACCTCCTGGCGCATGCCATGGGGGTGGAAAGCTTTATTGCGGTTTTGGATGGACTCGCGGCCTATCAGCTTGTTGGTTGGGGTAATGGCCCACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACACTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGNCTTCGGGTTGTAACCCTCTTCAGCANGNAAGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAAGGGCGCAGCGTTATCCGGAATTATTGGCCGTAAAGAGCTCGTAGGCGGTTTGTCCCGTTCTGCTGTAAAACCCGGGGGCTCACCCCCGGGTTCTGANTGGGTT
>XM_001452590.1 Paramecium tetraurelia uncharacterized protein (GSPATT00002630001), partial mRNA 
ATGAAAGTGCGTAAGTAAGCACCCCAATTTACAGCATCAGCCTACTTTAATAAATAGTTTAAGAGAATATCTCTAAGTGATTATAAAAATAGATATGTTGTTCTATTCTTCTATCCATTGGATTTTACATTTGTATGTCCAACAGAAATAATCCAGTTTTCTGATCGAGTTGAGGAATTCAAAGCAAATGGTTGTGATATTTTGGGTGTCTCTGTAGACTCCTAATTTTCTCATATGAAATATTGTAAATAAACACGTAATAATGGAGGATTGGGTGAGATGCAATTTCCTCTGATTTCAGATTTAAGTTAGGAAATCTCTAAAAAATATGGAGTCATTATAGATGATTCTGAAGATCCAGATTTTGGTGTTGCTTTCAGAGGGACATTCATAATCGACGGAAAAGGAATCCTCAGACATTATTCCATTAATGATTTACCTGTGGGTAGAAATGTAGACGAAGTCTTAAGATTAGTGTAAGCATTTAAATTTACAGATGAACATGGAGAAGTTTGTCCTGCACAATGGAAACCAGGATAGCCAACTTTGGTTACGAATCATTCTGACCCAAAGACTTAGAAATATTGGAATGAAGAACATATAAAATAAGCTAAATGA
>XM_007882153.1 Pseudozyma flocculosa PF-1 uncharacterized protein (PFL1_04627), partial mRNA 
ATGGGCTTCTTCGACGTCGGCTCCATGCGGAGCAAAAAGTCCAACGCGGAGCTTACACAGGAAGCACGCATGCAGAGGCGCAAGAACGACGAGATCCTCGCAGCCAACCTCGGCCTCGACTACTCGCATGGCGGCAGCAGCAATCGCAGCAACGGCAAGTCGAGTCGTGACCGGCTCCACGACGACTTTGCAACGGGGCACGGCGCCGCCGCATCGACTGCGGCCAGGGACGCGACAAGACGGAGCAAGCTGGAGAGGATGATGGGTGCCGACGTGCCACTGCCCGACTCGCTCTCGGCGCCCAATGCTGACCATCGGCGAGGGCAGCATCAGGCCGACGCGGCATCCCAGATCTACGGCTCAAACGGAGGCTCGGCGCTCCACCTGCCCATGTCCAAGGGATCCTTTGACGCCATGAGCCAGCATTCGTCACACTCCTCCGGCCGCGAGCGTCAGTCGAGCGGAAGATCGTTTGATCCGCTCCCCGGCGCTTCAACGACCTTCACCGAGATGGCCGAGGTTGACTGCCCTGTCTGTCTGGAGCCGCTTTCGTACCGGCTCGCCGGCGAAAAGCCTCACGTTGTGCCCAATTGCGGCCACGCGCTGCACAACGCTTGCTTCACCGCCGTCTACGGCCCGCCGGAAGCCATCATTGCGCAGCAGAATGCGGCCTTGGGGGCAGGCAACGGTCGCACAAAGGGCGCCGGTCTGGTCCAGCGGACCCCGGCCGCAAACCCGCCAGGCATGTGCGGTGTATGCCGTCGAGCCATCGTGCTCGGCGGTGACGAGGCCACCGCCAAGTCTCAGAAGCTGGCGGGGCTGGGTCCGCACGGGTCGCAGGCCGATCGGATGACTCTGAGCTCGGACTCGGCCTCGGTTCGAGCCCTCTCTGAAGCCCACGAGGACGACCCTCTCGAGAGCCAGGCAAAAGGCCGGTCTGCCAACATCTCGGGACCCATCACGACCCCGACGATCCGGGCTAGGCCAGAGTACTCGACCATCTACAAGAAGGCCGATCGCAAGGACAACAGCAAGGTCAATGTGGTCTGCGTGCTCTCGGTCGAGGTGCCATCGAGAAGGCCGAGCTCTGACGATGCGGTCGAGTCCGGCCTTGACACGATCGAGGATCGCGGCTACGCTGAGGAAGAGTTTGACGAGGAGGACGAGCGCGACTACGAGGGCGAGGACTCGTACTCGGACGACCTCAAGCGCAGCGGCTCCGAGTACGTCCCCAACGACCGCAGGTCGAGCGGTCAGCGCAGCCCGCTGCCGACGTCGTACGCCAACGGCGCCGACGGAAAGCAGGCCGCCAGCCCGGAGCGCTGCATCTCTCCCGAAAGTCAGGCCGGGTTCTCGTACAGTGCGACGCCGGCAGCGCAGCAGCGGCTCAACGATCCCAACCTCGCTGTGGTCGAGGACCTCCGCAGTCGCGTGGCCGATTGGAAGGGTCACTCGCTCGAGCATTTCGGCGAGCTCGTGCTGCACGACCTTCTCAACGTCCGCCAGGACAGTGTCGTACGCGAGTTCCACGTCTACCTGTTCGAGGGCGCGCTGCTCTGCGTCACCGAGGAGAAGCGAAAGGGTCTCAGCCGGTTCATTCCTGCGGCACCTCCGGCCGCTCCGGGTGCCACCCCCGACGTTCCTGCCATGCCCAAACCCGCGCTCAAGCTCAAGGGCCGCATCTACCTCAAGCACATCCGCCGCGTCATCGACTCGTCGGTCGCTGGCGAGCTCAGCATCAGCATCACGATGGACGAGAGCCTGGATCAGTTTGTCCTCTGCTTCCGCGATCGCGAGACTCTGTCGGTGTGGAAAGAGCGTCTCAGCCAGAAGGTCGCCGCACAGTCCAAGTCGGCGGCGGCGGCAACTACGGCCAAGGAGGCGGCCAAGCCCGAGGAACCGGCATCAGCCTTCGACGCCGCCTCGGCCGCTCACTCGGCCGCGAGCCATGGCATGCACCCCCTCGACGACCACCAGCGCCTCCGCGGCCTTCCCGCGGCACCCAGCCACGGAGTTTCGATCTCGCGGGCGAATAGCGGCGCCGCATCAATCATCAGCGGCAAGACGGGCTCTCACCAAGGCGCCCTCTCTCCGGCCGACTACAGGAACATGCGACGCTTGTCGAACGTCTCGAGCGTCCAGAGCCACGGCAGCCACCGCAGCCGCACCTCGACAGCTTCGGACACGGTGCCTCGCCACCAGCAGTGGTCCGCCTCGGGCGGGCTCGACCCGAGGATCCCACCGCCTCCGATGCTGCCACACACGCCGCTCGACTTGGTGCTCATGTTCGCCGTGCCTCCGGTCCTGCCCAACAACGCACAGGGCTCGATCAACTCGTCGGCCGCGCTCAAGCTTCGCCTGGTCCGATCGACGCTTGACTTTGTTGTCAGCCACATGGGACCCAAGGACCGCGTCTCGCTCGTGGCCTACTCGGTCGGCTATGAGGGCGAGGTGAAGCGCACGGCGCTCCTCAACCCGAGGCGCTCGTCGAGCCGACAGATGCTGGGCGAGTTCATCCAGTGCATCGGCAGGCCTTGGGACGGCCACGCCGAGGACCCGTTCCGCGTCGACCTGGACCGGCTGGGCGGAACGAGCGAGCGGACCGATTCGGTGACGGCGGTCAATGTCGGGCTGGACATCGTGCTGCAGCGCAAGCAGAAGAACCCGATCACGGGCATGATTCTCGTCAACGACACGGCCGACGGACCCAAGCGGCACCAGATGGACCTGGTCATGGCGCGGGCCGAGGCGGCCAACGTGCCCATCCACTGCTTCGGCTACGGCAAGACGCACGACCCGTCTTCGCTGTGGCTGATCTCGAACCACACAAAGGGCTCGTACACGTTTGTGCGCGAGTGGTACCAGCTGCGCGAGTGCCTGGCCGGCTGCATTGGATCGATGATGTCGATCGCGCTGACCGACGTCAAGCTGCACGTCAGTGTGCCCCACGACAACCAGTTCCGCGTCCGCAAGATTGCCGGCATGCCCGGAGCCATCATCTCGTCGTCTGGCAAGGACGTCGACATCGACATGGGCGACATTCGCTTTGGCGACGCGCGCGAGCTGCTGGTGGAGCTCGAGCTCGATCTCGAGAGCCTGCTGCCGCGCCTCAACGCCAGCAGCAGCAGCAGCCGCAAGCTCTCTGCGCCTCCCATCGAGCAGGGCAGCGCTACCGACGACTTCATGCAGCGACTCGGCATCCAGGGGCTGAGCCTTGCCGACTCGGACGGCGCCGAGGGGTCATTTGAGCACCTGATCGACGAGGTCCCTGTCTTTGAGGCCGATGCCGGTTTCCGCGACCCGACCAACGGCACCAGCACGTCGAGGCTGGCCAACCCGACGATCCTGACGCTCGAGATCGACTGCCAGTCGCCGGACCCCGTGTCCTCCGGGCCGCCGGGCCTGGCCGCTGCGATGGCCGATCCAACCGTGACGCGGCGGCGGCTCGAGGTGTTGGTGTCGGAGATGATTACGCGCTCGCTGCTGCTCATCTCTCGCTCCAACTACGCCCAGGCGCAGAAGGTGTTCAACGAGACGCGGAGGATCATTGAGACGGTGGTGCGGGCAATCCCGCTGCCCGCCGGCGGCAGCGGCAGCGGCTCGCGGCGGCGGGCGCCGATGGGCAACTCGCGCTCCGCGGCCAAGCGGCAGCGCGACGCGCTCAACCGCAAGACGATCGACAGCCTGATGGCCATGATGAATGACCTCGACACGCTGCTGGAAGGGCTCGAGGCGCAGAACCGGACGACGTTCGAGCGCGACGGGCGCAACTTTGGCGCGCAGCAGGCCATGATCCTGCGCGATCAAAAGGCGTGGACGACGCGGACCGACACCGAGTATCAAAACTTCCGCGACGACAACGCCGCCGCTTTCGCTGCCTACGGTGCTTCGTACGCCAGCTCGCGGTGA
>XM_033386580.1 PREDICTED: Drosophila miranda mucin-5AC (LOC108151008), transcript variant X9, mRNA 
AATGTTTGTCTTTAACTCATACGCGAATTCGTTACGCTCCCCAACTGTTAAAAGACCAACGATGTCTTCGAAGGCTTCTTCACGAGATTTATTAAGATTTATAATATCACTAGTAGTGCTCAGCCAAATCATACTCAAAAAAGCAGAGAGTGCCTCGGTTGAAAAAGTGCATTTAAAAAGTGCGCAAGTGAAAAACAATCTAATTGAATATGACTCACAGTTTGGCCGAGATACAAAATTTAATCATAAAAAAACAACTATAGCAAACGATATTACATCTGCACCTGAAGAGAGAACATCAGCCGCACATTCGACTTTTGCACCTGCGGAGAGCACCACAGCTGGGGGCAATACGACTTCTGCTCCGGAAGAAAACAACACATCTGAGGACGATACTACTCGTTCTACTTCTGAAAAAAGCACAAAAGCTAATGATTCGACATCTGCAGCACCCGATATAAGCACCACAGTTCAAGATTCGACATCTGAACCTGAAGAAAGCACTACAGCTAAGGACAACTCTACTTCTGCTCCTGAAAAAAGCACCACAGCTGAAGGGGATTCTCCTGCTGCTCCTGAAGAAAGCACCACAGCTGAAGAGGATTCTTCTTCTTCTCCTGAAGAAAGCACAACAGTTGAAGATTCGACCTCCGAACCTAAAGAAAGCACGACAACTGAAGGCGATTCTACTGCTGCTCCTGAAGAAAGCACCACAGCTGAAAATTCGACATCCAAACCTGTAGAAAGCACTACAGCTGAGGAGGATACTACTTCTACTTCTGAAAAAAGCACAACAGATAAAAATTCGACGTCTGAACCTGAAGAAAGCACCGCAGCTGGGGTCGATTCTACTTCAGCTCCTGAAGAAAGCACCACAGCTGAAGAGGATTCTTCTTCTGCTCCTGAAGAAAACACAACTGTTGAAGATTCGACCTCCGAACCTGAAGAAAGCACTACAGCTGAAGACGATTCTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCTGCACCTGAGATAAGCACCACAGCTGAAGATTCAACGTCAGAACCTGAAGAAAGCACTACAGCTGAAGGCGATTCTACTTCTGCCCCTGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCGGCAACTGAGATAGGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGAAAGCACTTCAGCTGAAGGCGATTCTACTTCTGCTCCTGAAGAAAGCACCACTGGTGAAGATTCGACGTCTAAACCTAATGAAAGTACCACAACTGAGGTCGAAACTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGAAATCAGAGCCTGAAGAAAGCACCACAGCTGAAGAGGATTCTACTTCTGCTCCTGAAGTCACCACTACAGCTGATGACTATACTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGTTTCGACATCTGAACCTGAAGAAAACTCCACGGCAGAGGACGATTCTACTTCTACTCCTGAAGAAAGCACCACAGCTGAGCACGATTCTTCTTCTGCTCCTGAAGAAAGCACGACAGCTGAAGATTCGACTTCCGCGGCACCTGATATAAGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGAAAGCACTACAGCTGAAGGAGATTCTACTTCTGATATTGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCGGCAACTGAGATAAGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGAAAGCACTTCAGCTGAAGGCGATTCTACTTCTGCTCCTGAAGAAAGCACCACAGATGAAGATTCGACATCTGAGCCTGAAGAAAGCACCACAGCTGAAGATTCGACATCAGAGCCTGAAGAAAGCACTACAACTAAAGGCGATTCTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGACGATACTACTTCTGCTCCCGAAGAAAGCACCACAGCTGAAGATTCAACATCAGAGCCTGAAGAAAGCACTACAACTGAAGGCGATTCTACTTCTGCTCCAGAAAAAAGCACCACAGCTGAAGATTCGACTTCCGCGGCAACTGAGATAAGCACCACAGCTGAAGATTCGACGTCTGAACCTGAGGAAAGCACTTCAGCTGAAGGCGATTCTACTCCTGCTTCTGAAGAAAGCACCACAGCTGAAGACGATACTACTTTTGCTCCTGAAAAAAGCACCACAGCTGAAGATTCAACATCAGAGCCTGAAGAAAGCACTACAACTGAAGGCGATTCTACCTCTGCACCTGATGAAAGCACCACAGCTGAAGAGGATTCTTCTTCTGCTTCTGAAGAAAGCACAACAGTTGAAGATTCGACCCCCGAACCTGAAGAAAGCACGACAACTGAAGGCGATTCTACTTCTGCTCCTGAAGAAAGCACCACAACTGAAGATTCGACGTCTGACCCTAATGAAAGTACCACCACTGAGGTCGAAACTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGACATCTGAGCCTGAAGAAAGCACCACTGCTGAAGATTCGACATCAGATTCTGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCGGCAACTGAGATATGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGAAAGCACTTCAGCTGATGACGATACTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGTTTCGACATCTGAACCTGAAGAAAACTCCACTGCAGAGGACGATTCTACTTCTACTCCTGAAGAAAGCACCACAGCTGAGGACGATTCTTCTTCTGCTCCTGAAGAAAGCACCACAGCTGAAAATTCGACATCAGAGCCTGAAGAAAGCACTACAACTGAAAGTGATTCTACCTCTACCCATGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCGGCAACTGAGATAAGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGACAGTTCTACAGCTGATGACGATACTACTTCTGCTCCTGGAGAAAGCACCACAGCTGAAGTTTCGACATCTGAACCTGAAGATAACTCCACGGCAGAGGACGATTCTACTTCTACTCCTGAAGAAAGCACCACAGCTGAGGACGATTCTTCTTCTGCTCCTGAAGAAAGCACCCCAGCTGAAGATGTGACTTCCGAGGCACCTGATATAAGCACCACAGCTAAAGATTCGACGTCTGAACCTGAAGAAAGCACTACAACTGAAGGAGATTCTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGAGTTCCGCGGCAACTGAGATAGGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAAAAAGCACTTCAGCTGAAGGCGATTCCACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGACGATACTACTTTTGCTCCTGAAGAAAGCACCACAGCTAAAGATTCGACATCTGAGCCTGAAGAAAGCACCACAGCTGAAGGTTCGACATCAGAGCCTGAAGAAAGCACTACAACTGAAGGTGATTCTACTTCTGCCCCTGAAGAAAGCACCACAGCTGACGATTCGACTTCCGCGGCAACTGAGATAAGCACCACAGCTCAAGATTCGACGTCTGAACCTGAAGAAAGCACTACAGCTGATGACGATACTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGTTTCGACATCTGAACCTGAAGAAAACTCCACGGCAGAGGACGATTCTACTTCTACTCCTGAAGAAAGCACCACAGCTGAGGACGATTCTTCTTCTGCTCCTGAAGAAAGCACGACAGCTGAAGATTCGACTTCCGCGGCACCTGATATAGGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGAAAGCACTACAGCTGAAGGAGATTCTTCTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCGGAAACTGAGATAAGCACCACAGCTGAAGATTCGACGTCTGAACCTGAAGAAAGCACTTCAGCTGAAGGCGATTCTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGACATCTGAGCCTGAAGAAAGCACCACAGCTAAAGATTCGACATCAGAGCCTGAAGAAAGCACTACAACTGAAGGTGATTCTACTTCTGCCCCTGAAGAAAGCACCACAGCTGACGATTCGACTTCCGCGGCAACTGAGATAAGCACCACAGCTCAAGATTCGACGTCTGAACCTGAAGAAAGCACTACAGCTGATGACGATACGACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGTTTCGACATCTGAACCTGAAGAAAACTCCACGGCAGAGGACGATTCTACTTCTGCTCCTGAAGAAAGCACCACAGCTGAAGATTCGACATCTGAACCTGAAGAAAGCACCACAGCTGAAGATTCGACTTCCGCTGCACCTGAGATAAGCACTACGGCTAAAAATTCGACATCCGAACCTGACGAAAGCACTACATCTGAGGACGATTCTACATCTGCTCCTAAAGAAAGCACCACAGCTGAGGCCGATACAACATCTGATCCTGAAGACAGCACAGTTCAGGACGATACTACTTCTGCTTCTGAGGAAAGCACCACAGAAATCACCACAGCTGAGGATGGTGCTACTTCTGCTCCTATAGAGAGCACTACTGCTAAAGTAGATTCTACCACTGGATCGACGTCTAGCCCGGCGACATCACCTTCTCCTATACCGCCTATGTCATGTGCAAGTGGCGCTCCATACTTACCGCATCCATCGGATTGCCATAAATTTATTCAGTGCAGCAACGGACATGAGTACATCATGCATTGTCCAGATGATCTCTTCTGGGACTATCAGAATTTATACTGTGGGTATGATGACAGCGGTTGCTATAACAAAGTGGATCCCGAGGAAACGGTTTGCAAGCACGGCATGGATTTTCTACCAGACCCAACTGATTGTACGAAATATATCCAGTGCAGTAATGGTCAACCAATCGTCCAGAAGTGTCCTGAGCCTTTGTATTGGAACCAAAATCTTAAAGTATGTGATTGGTTCAGTAGCTCCTGCAAAACTCTACAAAAGAATGAAATAATATCTTGTAAAATGGGTATGAGTTTTGACGTTTTTCCAACCGACTGTTCGAAATATATTAAGTGTTTTGGTGAGCGCGGTGTAATAATGAGCTGTAATTCTGGACTTTTCTGGAACTCTTTGCAGGAAGTATGCGAAAAATCCCAGCGGTTCTGCAAATAATATGTAAGCATAAACAGTTACTCGTATAATATTATTCACTCTTGGTAGATTTTCTTGTTAAATGAATTGAAGAATATTACAGAAAATATAAAGGCATTACCCATTCTTTAATC
>XM_029689086.1 PREDICTED: Oncorhynchus nerka SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1-A-like (LOC115147092), mRNA 
ATGGTGTCAGGTGTGCGGGATAATCAGCAGCCTGATGACCTAGAGGCCGGAGAAAGGGAGTATAGGGAGCAGAAGGCAAAGAGGAACAGCCAGTGGGTCCCCACGCTGCCCAACAGCTCCCACCACCTGGATGCTGTGCCCTGCTCCACCACCATCAATCGCAACCGAATGGGCCGCGACAAGAAGAGGACCTTCCCCCTGTGCTTTGGCGACCACGACCCGGCGGTGATCCACGAGAATGCGTCTCAGGCCGAGGTGTTGGTTTGTCTGGACATGGAGATTGACGGGCAGAAGCTCCGAGATGCCTTCACCTGGAACATGAATGAGAAGCTGATGACCCCAGAGATGTTTGCTGAGATCCTGTGTGACGACCTGGACCTGAACCCCCTGGCCTTTGTCCCGGCCATCGCCTCAGCTATCCGCCAGCAGATAGAGTCCTACCCCACAGACAGCATCCTGGATGAACAGACCGACCAGAGGGTCATCATCAAGCTGAACATCCACGTGGGGAACATCTCCCTGGTGGACATGTCGGAGAGGGAGAACTCTCCGGAGACGTTTGGCCTGATGCTGTGCTCCGAGCTGGGCCTGGGAGGAGAGTTTGTTACTACCATTGCCTACAGCATCCGCGGCCAGCTCAGCTGGCACCAGAGGACGTACGCCTTCAGGGCTGATTTCAGTGAGAACCCCCTGCCAAAGGTGGAGATTGCCATCCGCAACACAGGTGACGCATGGTGCCCTCTGCTGGAGACCCTGACAGATGCAGAGATGGAGAAGAAGATCAGGGACCAGGACAGGAACACCAGGCGCATGAGACGACTTGCCAACACTGCCCCCGCCTGGTAGAGAGAAGCACCAATAAGCTACTACAGAGCCTCTAGTCCAGTGGTTCCCAACCTCTTTTTGAACCGTGGCACACCTTGATGGGATATACAATTATGCCCTGCACACCAAATTCATTCATTTAGTGGTGATGACATCCATCTGATCTATATTGCATATCATCTATTTTCTGTGACAAATGTTTACTAAATAGGGTTTGTTTGAAGTATTTTCATAGTTCCTTACTCATGAAGGTTCATTTCTGTATACCCCTTTAAGAGTATCCCGCAAATAGGTATTTAGTTTTGAACAGTCTGTGTTAGAGGTACAACCACGTACACATAGCCAAGCTCCATTTGTTTTTATGGCAAGAGGCTGTGGTATAGCTAATAAATTACTCTCGCTAAGCCTAATCAAACTTACAAGTGATAATGGTTATCACAGACTAAGTAAAATAATAAAAATGACTTTGCTCGTGATGCGAGCCCCTCAAATGATACAAATGGAACAGCCTGAGTGCACTGGACTTGGAACAACGATACAGATGTAACAATGTACCATTTAATCTATTATCTGACTGGCACAGGTGCTCCCAAATCAAAATTACAGAGTGTACAAACATTTTTATCAAGATTAGGAAAGGTTTTGTGGCACACCACTGCTTCTAGTCAGCTAACAGTCAACTCCTATGGGCCCTCTGTGGAGACACACACACAAACAAACGTGACAAAAGACAGTCAACTGGTCCCTTCTTACAGCCCCCGTAATATTAAACTAGCTTTATGCTTGATTGTCATACTAATCCAGTACCAATGCCACATCTCTACTCCCATTAATAAAAATAATTACATCTGATCCCAGATCAGAGACTGTTCAAGGAGCCTTCTCCATTTCTAGCCCCTCTATTGGTTCAACCGCTACTCATTTCTGATGAGATGAGGCGACGTGGTATATAAAAGGTGCCATGGGTAGAGTGTATTTGTCCGTATGAAATGTAGCCATTGTCGATTGTACGGACTCACCATCTAAGTGAGCTCTACCTGTAATACTGCTTTGATGCACTTATATCTCTCATGATAGACAATGCTGACGGACTTGATCTGTCTGTTAATAGAAACACTCAGACTCAACTCTTGGGAATAATGTAAAGTTCTGTATTTATGCTGATACTTTTAGTATATTTTTTAGTTTCCTTTTTTAATAAAATAACATAAACCAGA
>XM_028986422.1 PREDICTED: Denticeps clupeoides disintegrin and metalloproteinase domain-containing protein 11-like (LOC114794095), transcript variant X1, mRNA 
GGAGCTCCCGGTCCCACGTGTCCTGCCTTCCTCCGCTGGCTCGGCGCTTCTTCCTTCCTTTCTTTTAATCGACAGCTCCCTCCTTTCGCAGGCTGGCCGCGTTTTTCATTTGATTTCATTTTTTCATTTTTTTTTTCCTTTGGAACCGCAGCGCCGCCCAGTCTCACATTCGCCCGCGACGGGGCGCGCATCTCCCCGCATCGCCGCCCGCCCGCCCCGCTCCCCCGGTTCATATTTATCGACCGCCTCGTCGTCGTGAGCACGTTCCCGTCCGGTTTTTCCTGCTCCATGTGAGCCCGCGGGGCGACGTGAACAGGATGCTGGTCCTGCGGTGCCTCGTGTTCGCTGCTGCGGGCGCCGGGCTGTCCGCGACAGGCGTGAGCGGCGGGTCTCCAGCTCAGGATGCAGGCTTGTGGGACCGGGTCCTCCCAGTCCTCCCAGAAGAGGAAGAGGAGCTGTCCCGGCCACACCGGCTGCTGCCGTGGAGGGACTCGGACAGGGAGAGCCCACACAGTCACCTGGACACCCGGTTGAGGGACAGCAGCGGGAGCGTCACGCCTGTCCATTTGGCCCAGAGCAGCTTCCAGGTGGAGGCCTTTGGGAGCGTCTTCACTCTGGACCTGGAGCTGAATCATAATCTGCTCTCGTTGGATTATGTGGAACGGCACTTTGACCGGAGCGGAAATCCTTCAGAGTCGCTGGGAGGCGAGCACTGCTATTACCATGGTAAACTGAGGGGAGTACCAGGCTCCTGGGCAGCTCTGTCAACATGCCATGGCCTATGTGGCATGTTTTCAGATGGCCTCCACTCCTATGCCATTGAGCCCATCTTCAACGGGACCAATCAGGCTGATGGCACTCATAAAATCCGTAAAATGCCTGATGTCAGACTTCCAGCCTCCTGTTCAGGTTGTGAACAAGACGGAGAAAATGACACTGGTGACAATGACAGTAGTGAAAATCTGGACCCTCAGAGAAGGCCGAAACATACGGAGGGACTGAAACGTTCCAAAAGAGCGCTCTCGCGGCCCAGGGTGCAGACCGAAACCAAGTACATTGAGCTCATGGTGATTAATGACTTTGAAATGTTCGTTCTTCTCCGGCGCTCCACTGCTCAGACCAGGAACTTTGCCAAAGCGGTGGTGAACATGGCCGATGCGATCTACAAGGAGCAGCTAAACACCCGAATTGTGCTGGTTGCCATGGAGACCTGGACATCTGGGAACCCCATTACAGTGGAGTCGGACCCCCTGATAACTCTTCAGAACTTCATGAAGTACCGCACGGAGAATGTGAAAGAACAGAGCGATGTGGTGCACCTTTTCTCGGGCAGCACGTACCAGAGCAGCCGCAGTGGGACGGCATACTCAGGCGGAGTGTGTTCCCTTGCCAGGGGAGGAGGCATCAATGAGTATGGGAATGTAGGTCCCATGGCCATCACGCTTTGCCAGAGTCTGGGTCAGAATATTGGCATGAAATGGAACAACATCCGCAACTCAGCAGGTGACTGTAAGTGTCCTGACACTTGGCTGGGATGCATCATGGAGGATACTGGCTACTACCTTCCACGGAAATTCTCCCGCTGCAGTGTGGATGAGTACACACAGTTCCTGCTCCAGGGAGGTGGGAGCTGCCTCTTCAACAAGCCCAACAAGCTGCTGGACCCACCTGAATGTGGGAATGGTTTTGTGGAGACTGGAGAGGAATGTGACTGTGGCTCGCAAGTGGAGTGTGCCCGCAGTGGAGGGGCGTGCTGTAAAAAGTGCACACTTACTCATGATGCCATGTGCAGCAATGGACTGTGCTGCCGGGAATGCAGGTATGAGCAGAGGGGAGTGGTGTGCAGAGAGCCGGTGAATGACTGTGACATAGCTGAGACCTGCACAGGAGACTCCAGTCAGTGTCCACATAATGTACATAAGCTGGATGGGTACATGTGTGACAACAGCCAGGGTCGTTGTTATAATGGTCGTTGTCGGACACTAGATGGACAGTGCAGACGTCTCTGGGGCTTCAACGCTGCTGATCGGTTCTGTTATGAGAAGCTGAATTCTGAGGGAACAGAGAAAGGGAACTGTGGCCGCAACCCTGGTGGACAGGGCTGGATGCAGTGCAATAAACCGGACGTATTGTGTGGCTTTCTGTTCTGCTCTAACATGACTGCTAAGCCTAAATTTGGGGACCTTCAGGGTGAGGTGACCAGTCTGACCATCTACCACCAGAACAAGTATCTGGACTGCAGAGGAGGGCATGCAGTTCTAGAGGATGGTTCAGATTTGGGTTATGTGGAGGACGGGACGCCTTGTGGACCCAACATGATGTGCCTGGAGCGCCGCTGTCTTCCCATGTCTTCATTCAACCTCAGCACTTGCCCTGGGTCCAGCTATGGACGCACCTGTTTTGACCACGGAACTTGCAGTAATGAGGTCAAGTGTATATGTGACAGTGACTACACAGGGAAGGACTGCAGCGTGTATGACCCCATCCCTGACCCCACAAATCCTCCTGGCCCAGATAAAAAAGGAACATACGAAGAGGAAGATCTGGAGGGGGATAAAATCGATCTTCCTGTCTGTGTCCATGTTGCTGTGTGTCTGTGCTGTCTTCCTTACACTGTGTCCTTTCCACATCGGAGAAGAACAAGTCTTCCAACCACACCATTCCCTACAAAATATCCTCTGAATAGCTTCCAACCGAGATTCATCTCAATGTCCCTCTGTGCCGTCTAACGGCCTGCAACAGTGGAGCGTCTCCTGTCATATTCCAGCCTGCCATGTGTCTTCAGGCGAACCTCATTGACAGTATGGTCATTTCCAGATATAGGGGAGAGTGGTCCTTTGAAGATGACAGACAGCAAGGACTTGTATGTGTTTTTATGTGTGCGTTTATATATCTGTTCCCTCAATTCCATTGTTGAGTGTCCAGGAAGGGAACATGAAATGGATGGAAGGAGCACCATGTAATGATCTCACAAAGACACAGAGCAGTTTTTTTTATGACCTTTGTTCTTGGCTCTCCTGGTCACTGCTTGTCTGTTGCAGAACCTGGAGACCTTGCTCAGACCGGGTTTTTTGAACATACTTTTGAAAAACGTGACTTGAAACAAGAGAGACAATTTTCATGAGAAAACAGGCTGATTAGGAGCTGTTATATCAAAGAAGTTGGATTTCAGTCGAAGAAAGACTGGTTAGTTCTTCTCTTCCCAAAGAAAAAGGCCAGAAGAAGGAACAGATCAACATTGCAGGAGTGGAACTCCATGGACTAAGCCTGGAACTACAGCGGCGGGTCTTACATCTGCCAGTCTGAGCTCAACAGCTATAACTGTGTGCGCTTGCGTGTGTGTGTGTGTGCGCGTGTGTGTGTGTGTGTGTGAGACAGACTGTGTTTTTGGTTTTGGGATCATTGTTACTCCTGCCAGTCTTAGTGACAACCTTGTACAGGGCAGGGACCAGGTCAGTACTATAGAAAAGCAACATTCCACGTGGTTTTGTGTAGACCTTTTTCTTCCACAATATTTGTCTAAAAAACATTTTGAGAAGACCAAAAGTCCTAGAAAGTATGCCTCAAGGATAACTGTGAGCACATGCATGTGTCTGAGGATGTGAGAAATGATGCACAGGTTGACAGCTCTTAAATGTAGATATGAATGTCATCACTATGTTGTGCTGCAGATTAATGTCAGCGTTAGACCAGCAGCACACTACACGGAAAAAAAGGTTTTCATATGATGCAAACATAAGGAACACTAAAATGTGTTCACTCATATGCACTTGTACATTATGGCATTTGCAAGAGACATGTTAATACATGTGAATACATACGTTAATAATATTCTATGAATTCCATAATGCAAATTGTTTATTTGATAAAAATAAGTAAATATCATCTATCTATCTTATCTATCTATCTATCTAACTAACTATGGGCTTGGTAGCATTTAAGTCTTCTGAATATACAGAACGCACAAGAGGTCCTACCACTCCCACTGATTCTTAATCTGTTTACCACAGTGAGATATTCCGTGTTTTTCGCTTCAGCCTGCGCCCATGCATCATCAGTTCGTAATGTTTGTGGACCTGTCCAGATATCCACCCCATTAGCTGTACTTCACTGCCCTCGTTTTCTACTGTAAATGTGTTGATAGGCCCGTAGCCATGAGTTTAACCCGTAGGCTGCATAGACTTTGTTTAGTCTTTCATCGTAAATGAGATTACTTGGTCATATGGTTCCAGTAAGTGTAGCTTCCAAATAAACATTCATGAGCACCTACCAAGTAGCGGTGTTCCTGCACAGCACCCTACGCAATGCTCACAAGTTCCTCTGTAGTGCCTCGCAGGAAAACGGTCTAATACAGCGTTCTGAAATCTGTATGCAAGTCTCGATACCGGTGCCGAATGTCTGTTAATCCAAGCTACACTTAGAAGTCCAATGTGACCAAATGAAAGGAATAAATGTGAACGCTTGTGGGGATAAAAGCATTATTGGGTTGGGTGCTTGTAAAGAAGAGCTTTTTGCACTAAGGTAGATACACATTAGTCATGTACAGTAGGGACTGGGGATTGGGGCTGGTGAATGCTGGTTTCAAATTAAGAGGACAGAGGCTTTATGAGGAAAAGACCCCCGTCCATGACTTTTTAATGTGACCTTTTTAAACAATGTTGCAGTCATTATGACTGAGTGAATGGACGTGACTGTACGAAACACCCATAAAATAAAAATTTAGACATGAAAAATAA
>XM_008008285.2 PREDICTED: Chlorocebus sabaeus four and a half LIM domains 2 (FHL2), transcript variant X2, mRNA 
TAAAGAAACATCTGCAGGGTAAGAAGGAAAAAAATCCACCGTGCAAATACATCCCAGGCACATGCCTCCTGAGAAGTGGCCCCCTCCTCCCTCCGCCGCCCCCGGCACCTCCTCGGGCTTCGCCAGCTTCCTGCTCCTGGGAGCAGGCAGAGATCCCGGCGTGGGCAGACCCCTGCCACTGGCGTCCAGGCCCCGTCCGAAACTCACGCCCACGTCGGAGGAGACTCTCGGGATAACCTCGGTGCTCCCAAGACCCGGAGGGCAAGAAGAAAGAGCCCTGGCAAACAAAGGGCACGGGCCGGCAGCGCTGCAGCCCGGGGTGGGGGCACGGTGACCGCTAGGCCTGGGGGCGCCCGCCCCCAGCGCCCCACGCCCGGTGCCTGCGAGCCGAGGCGTGCATCTCCTTATATGGTCAAATGACACGGAGGGGGTTCTCGAGGGCGGGAGCCGCGCAGCGCTCCACTCGGCCGGCAGCGGAGCCGCAGCCACCAGCCGCCCGCGCCCGCCCGCCCCGTCCGGCAGTCTCCGGGCCGCTGCGGCGCGGTGAGTACCTCCAACTCCCTGCGCCCCGGAGGGAGGCCGAGGGGCTTAGCCACCAGGACTCGGAAGAGGGGGCCGAATCCGGTGCGAGACCCGGGGAGAGGGGAGCAGATCCGGAGTTGGGGAGACCGGTTGCTGAAAAGGCAGGTGTCAAAATGACCGAGCGCTTTGACTGCCACCATTGCAACGAATCTCTCTTTGGCAAGAAGTACATCCTGCGAGAGGAGAGCCCATACTGCGTGGCGTGCTTCGAGACCCTCTTTGCCAACACCTGCGAGGAGTGTGGGAAGCCCATCGGCTGTGACTGCAAGGACTTATCCTACAAGGACCGGCACTGGCATGAAGCCTGTTTCCACTGCTCGCAGTGCAGAAACTCACTGGTGGACAAGCCCTTTGCTGCCAAGGAGGACCAGCTGCTCTGTACAGACTGCTATTCCAACGAGTACTCATCCAAGTGCCAGGAATGCAAGAAGACCATCATGCCAGGTACCCGCAAGATGGAGTACAAGGGCAGCAGCTGGCATGAGACCTGCTTCATCTGCCACCGCTGCCAGCAGCCAATTGGAACCAAGAGTTTCATCCCCAAAGACAATCAGAATTTCTGTGTGCCCTGCTATGAGAAACAACATGCCATGCAGTGCGTTCAGTGCAAAAAGCCCATCACCACGGGAGGGGTCACTTACCGGGAGCAGCCCTGGCACAAGGAGTGCTTTGTGTGCACCGCCTGCAGGAAGCAGCTGTCTGGGCAGCGCTTCACGGCTCGCGATGACTTTGCCTACTGCCTGAACTGCTTCTGTGACTTGTATGCCAAGAAGTGTGCTGGGTGTACCAACCCCATCAGCGGACTTGGCGGCACAAAATACATCTCCTTTGAGGAACGGCAGTGGCATAACGACTGCTTTAACTGTAAGAAGTGCTCCCTCTCACTGGTGGGGCGTGGCTTCCTCACAGAGAGGGACGACATCCTGTGCCCCGACTGTGGGAAAGACATCTGAAGTCAACACGGAGAAGTTGCTGCTTGTGATCTCACACACAGATTTTTATGTTTTCTTTCTCACCCAGGCAATCTTGCCTTCTGGTTTCTTCCAGCCACATCGAGACTTTCTTCTAGTGCTTTTCAGTGATACTCACGTTTGCTTCAACCCTTTAGTGCTTTGTGCTAGTTCAGTCCCAGGGAAAGAGAAAACTTGCCCTAGGCCCTAGGTGGGAAGCTGGTTTGAAATTTTTGTAATCAAGTAAGGCACAACCAAATGTAAAAATCCTTTTGAATGATGTCTTTATAAATCTTTCTCTCACTGCCTATTTAAGTGCAATTAATGTATGCCACAAACTTGAAAGTTTTCTAAACTCAGTAAGGTAATGACCAATTGGTATTTACAGCTCTGTAACTTCCTGTTGTGTCAAGTCTAAACCAAGATTATGTGACTTGCAATAAAGTTATTCAGAACTAAA
>XR_006147264.1 PREDICTED: Dipodomys spectabilis small nucleolar RNA SNORA40 (LOC122106945), ncRNA 
AGCAATTGTATGTGTGCCTTTGTTTCATTTGTAACAAAGCCATATAGACAGGTGCAAACAGCAAATCCTCTACAACCCAGAACTCATTGTTGAATATGAGTTTGGCACATGTAAAAAGAATATG
>XM_034342832.1 PREDICTED: Prunus dulcis ATP-dependent 6-phosphofructokinase 6 (LOC117614132), transcript variant X3, mRNA 
CCAATTTACTAACAGCCCCTCCTCCCCTGTCCGAGGACCATACACTCCGATTTCGTTTCTGCTTCAATTACTTTCAATCGCAGATTATTCTTCTGGTTTTGTTATGAGTGATCAGAAATCCGCAAAAGCAATGGGGCCTACTGGAAACTTGCAGATGAAGGTCGTGAAAGGCGATTTTGGTTATGTGCTCGAAGACGTGCCTCATCTCTGCGACTACTTGTCCGATCTTCCTACTTATCCCAATCCGTTGCAATTCAATCCGGCTTATTCAGTTGTAAAGCAGTATTTTGTTAATGTGGACGATACTGTTGCTCAAAAGATTGTTGTCCACACGGATAGTCCAAGAGGGACGCATTTTCGGCGAGCAGGACCACGCCAAAAGGTGTATTTTGACTCGGATGAAGTTCATGCTTGTATTGTAACATGTGGTGGTTTGTGCCCTGGACTCAACACGGTGATCAGGGAAATTGTGTGTGGACTTTATCACATGTATGGCGTCAACAAAGTTCTTGGGATAGATGGAGGATACAAGGGTTTCTATGCCCGAAATACCATTGACTTAACACCCAAGGTTGTCAATGACATCCACAAACGTGGTGGTACTATCCTTGGTACATCACGAGGAGGACATGATACCTCAAAGATTGTTGACAGCATTCAGGATCGTGGAATTAATCAGGTTTACATAATTGGAGGTGATGGAACTCAAAAAGGAGCAGCTGTCATCTATGAGGAAATTAGACGGCGCGGCCTCAAAGTTTCCGTTGCAGGAATTCCTAAAACCATAGACAATGACATTCCGGTTATAGACAGATCCTTTGGCTTTGATACTGCAGTTGAGGAGGCTCAACGTGCCATTAATGCAGCTCATGTTGAAGCTGAAAGTATTGAGAATGGTATTGGTGTTGTGAAGCTAATGGGACGCTACAGCGGTTTCATAGCTATGTATGCTACACTTGCCAGCCGAGATGTGGACTGCTGTTTGATTCCGGAGTCCCCCTTCTATCTTGAAGGAAGAGGTGGACTTTTCGAGTACATAGAAAAACGACTCAAAGAAAATGGGCATATGGTTATTGTGATAGCTGAGGGTGCGGGACAGGATCTTCTGTCAGAGAGCTTGCAATCCATGAACCAGCAGGATGCTTCAGGAAACAAGCTACTTAAAGATGTTGGCCTATGGATTTCTCAGAGGATAAAGAATCATTTTGGGAGACAACAAAAGATTTCCATCAATCTCAAGTATATAGCATATCACTGAGAAGCAAAACAAGGTTGTGATTACCGACAGGATGTGGGCACGACTTCTTTCTTCAACTAACCAGCCGAGCTTCTTGAACCCCAAAGACGTCATTGAAGTCCAAG
>KU329545.1 Uncultured bacterium clone OTU_22088 16S ribosomal RNA gene, partial sequence 
TACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTGTAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCGTTCGAAACTGCAAGGCTAGAGTATGGTAGAGGGGGGTAGAATTCCACGTGTAGCAGTGAAATGCGTAGAGATGTGGAGGAATACCAATGGCGAAGGCAGCCCCCTGGACTAATACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>XM_012378055.1 PREDICTED: Linepithema humile serine/threonine-protein phosphatase 4 regulatory subunit 2 (LOC105678582), mRNA 
TCCCTCCTGTCATATCTCTCATTGTTGCTGTTTTGTGGCCGATAATCAAGACAGTCGAGAGGAAGCAGGGAAGACTTGTCAGAGGAGGTTGTCGGCGGCGGCGGGGAAGATGGAAAATTTAGAGGAGGTGTTGCAAGCGCTCGATGAGTTCCAGAAAATGCGGCCGACGGTAATCCCGCAGGAGTTGGAGGATTATCTGTGCTGGGTCGCAAAGACGGGCGATCCCGTCTACCAGTGGCCGTTGATCAAAACGCTCTTCAGGGAGAAGCTCACGCGCGTAATGACAGATTTTTACGAGAGTTGTCCCTCTCTGGAGCTGGCGACCTGTCCCAACGTGGAGCACTTCAACTACGACACGATGAAGAGCAGCCTTCTGGAGAGATTAGAGTCATTTGCGAATGCGCCCTTCACAGTCCAGCGGATATGTGAATTACTGACGGCGCCGCGCAAAGAGTACAATCGCGTGGATAAATTTATGCGCGCCATCGAGAAAAACATTCTGGTGGTTTCGACACGTGAACCCGGGCCTATCGCCAGACGCGGCGAGACCGGCGACGGTATGGTGAACGGGTCCGTCGAGGAGGACACAGCCTCGATCATGCAGCAGCAACCACCGCCACCGCCTCTCTCATTGTCACCGTCGCCGTCATCGTCGCTATCACCGTCATCGTCGCCGTCGCCATCGTCATCGCCATCGGCATCACCGTCGCCATCACCTTCGCTCTCACCCTCGTCCTCACCTTTGCCCTCACCCTCATCGTCGTCATTACCTTCACTGTCACAGCCACCGTTGCAGTCGTCACCGCAATCACCGTCGCAACTACCACAGACAACGCAACCGGCGCAGACAGGTCAGCCAAACTCTCAGGATGTGGAGATGGAATACTGGGAAAAGGACTGCACCTCAACCGTCACCATCAGTGTGCACACCGTTGTGGAAAACGAAACGCCTCCTCTCTTGCACAGCGGCGTCATACCGGCCGCTGGCTCACCACTGGCTAAAAGCATATTCACCGCGAGTGAGGCGACGCGGGAGAAGCTGGAGCAGGTCGCCTCTAGAACGGAAATCGCGACGTCCAATTATGTCCCCGCTACTTCAGACTTTTCTACTATATCGAATTTAACCTCGCAGGAGTCGGCGCCGACCGCCGTTCCAGTTGTGCAAAGTCTACCGGCTGCTGAAACGGTCTCCGACGATTCGCCTGTCGGCAGCGCCGACGTGGCGGAGGCGATCATGAACGAGGACACGACTTCTCAACCTAATCTAGATTTGGAGAGCGAAGAGATCGAACCGGCCGCAACGGCGACCACCACGACGACAACGATGACGACAACGGCGACAACAACAGCGACATCGTCGACGACGTCGACGTCGGCGGCAACGACGACGGTGACCGTTGTAGCGACGGTGATACCGTTGACGACGGACACCACGCAGAAGCTGCAGGCCGCTTTCCAAGCGAAGCACTTTGAGCCCGACGATAATAAGTGTCTGGAAAAATCCAACGAGAAGACACCGGTCTCGTCAACGGTGGAAGAAGGAATTGAACATTCCATGAAGAATGAAGAAACGACATTGGCAAAATCGAAGCCCGAGTGTGCGGATTCCAACGAGATGTCTCACAATGAAAGTAGGTTAACTGAAAATTTGCTAGAAACGGATATCGAGATGAGATCCGACGCTCTGGCGAATGACGCGGAAAGTGTCAGCGAGGAGAGAACTGCGAATAAACCGGAAGAGGAGGGAACATCGGTCCTCGAAGATGTGGATGAAGAACATTTACGGGTGGAGGAAGATGCGAAAGGAGAAACGGCGGTATTCGTCGAGTCGCAATCCACGGAGAAGGACAGTGCAGTCACGCCTGACGAATGCGCGGTTATTGTATCCAGCGGCGAGGCATTGTACAAAGCGGAGAAGGCCGAGACGCATCCCACGGAAACGTCGACGACAATTTCCTTGAAGGAGAGTTTTACACATGACCAATCTATAAGCCAAAAAGCTGAAATTATAGAAGTAATGGATAAGGTTCTAGAGGCCGTTCCTAAGATAGCGTCTTCTAACGGCAACGACGACGGACAGGAAATACAGGACACTGAATTCAACACGGATAATTTGAAAATGATGGAAATCATCAACGAGAAGGTGAGTCTTACCGAGTCCGCGATGTCGGATCCGATAAGCGTTATAGAGAAACCGAAAGAAGTGACATCCGTGATTGAGAAACTCGAGCTCGTCTCGCCTACTGTCGAAATGACAGAGAGCTCTGATAACGTTGGCTATCAGTCGCCAAAGGACGATAATTCAGCAGGCATCCAGGACGACGGTTTAGCGAATGCGCAAGGTAATAAAATGGCGTGCGTCATTAAAGAGAATCAGTCTTCTGTAATAGAGAGTGTGGCGTGTAGAAGAGAATCGATGGAGTTGATGGAAGTTGACGACGAGGAATCACCGTCGACATTTCAGCAAGACGAACCGATGGAGCAGGAAACAATGGACGATTTGTCGAAGAGTTAATCCCGGCTCATTTAATCGGTTGCATGTCTCTTTCCCTCTGTTTGATATCTATTTTTAAGGGTAGATGTCGCGAAATAAGAGCTAATACGTAAGATATCTTCTTGCGCGTAAGATGCTTGGTAACTGACGAACACAATTAAGCATATAATTTTTAATAGCCGTTAATTATGAATTGGAATTCAAATTATGAGCAAAAATTCTCGATATTGTTTGCTGCTTTATTTATTTCGGATACTTCGCCGTTTAGACTGAGCTCCGGTATTTACTTACAAAGAGATTTATCGAAGTGAATTTTCTAACTCTTGGAAGAAGAAAAAAAGAACACTGCCTATTCCCAAACGATTGTAATACTGAAACTGCTTGTATAGAAATCAGATTTGGTAAACATTTCAATATCGATTTATACAAATACCATAGATATCTGCTTAGAATAAGGTTGTGCCTACAACTATTGTGTATATTGCGTATTGGACAAGTATACCTGATGCATAAATTTTTAAATGATGACGTATAAGCACTACAGATTCGAGTATCTCGCGGTCGAGGTAAACGAAACAGCGTTCGTTCACGATCACAGCCTTATACTAAGTTGCGGTTGAATCTCGAAACGCTTCACGGCTACTTCTGAGAGAACGTTCGAGATTGATCGAAGATATTATTCCTTGCTAAAACTTTCTACAGTACGTAACGGCATTTGGAAATGTGTTAGAACGATGTTACTTCGAGCAGCTGTCTACTAAAACTCCGCTACAGCTAATTCAAAATTGATATTCCAGACGTATCGCTTGAAATCAGTATGTCAATTTCATTTCGTTTCTGTTATTATATCAGTGGGCAAAAATAGTTTCCTTCTTTTTTTACCGAGTGTTTACTGCATATGAAATGTAAAGAAAAAAAGAGACTAGTAACAAACTATATTTTATGAATTACACTAGCTCTTTGTATTTTCGTTCCTCCTATTTTGATATTGTATTTTCAGTAAATGAAGAATGTAGTTAAGTCGCAGATGCGTGCGAATCGGAACAGAAATCTTCAAGTGGCCCAAAACTGATAAAATCGATTCACCGCGGGGGCGCCCAGGATCCCGTTAAGATCGTTTCGAACCGCTTACAGTTTATGTATCGGCACAAGATGTTTTCGAGCGGATTCGGATTCGATGCGGATCCACCGAACCGTTATTAGAAGAATATCGTAGGAATGGGATATTAATTTAAGAATTAATATAGATTAATGATACATGATACACGCGAATGTGGATATCTGAAAAAAAATAGCTGTACATTATTTTATAAGAAAATATATAAAAATGATTGTCAA
>AB050083.1 Mus musculus VH2C mRNA for anti-A/dT antibody, partial cds 
GGAATTCATGAAGTTCGGGCTAAGCTTGATTTTCCTTGTCCTTATTTTAAAAGGTGTCCAGTGTGATGTGCAGCTGGTGGAGTCTGGGGGAGGCTTAGTGCAGCCTGGAGGGTCCCGGAAACTCTCCTGTGCAGCCTCTGGATTCACTTTCAGTAGCTTTGGAATGCACTGGGTTCGTCAGGCTCCAGAGAAGGGGCTGGAGTGGGTCGCATACATTAGTAGTGGCAGTAGTACCATCTACTATGCAGACACAGTGAAGGGCCGATTCACCATCTCCAGAGACAATCCCAAGAACACCCTGTTCCTGCAAATGACCAGTCTAAGGTCCGAGGACACGGCCATGTATTACTGTGCAAGAAGGGGTACTACGGCCCTTTACTATGCTATGGACTACTGGGGTCAAGGAACCTCAGTCACCGTCTCCTCAGAGAGTCAGTCCTTCCCAAATGTCTTCCCCCTCGTAAGCTTGGG
>XM_010007313.1 PREDICTED: Chaetura pelagica leucine-rich repeat-containing protein 4B-like (LOC104397361), partial mRNA 
AGCATCCCCTCCTACGCCTTCAACCGCGTCCCCTCCCTGCGCCGCCTGGACCTGGGCGAGCTGAAGCGCCTGGAGTACATCTCGGAGGCGGCTTTCGAGGGCCTGGTCAACCTCAGGTACCTCAACCTGGGCATGTGCAACCTGAAGGAGATCCCCAACCTGACGGCCTTGGTGAGGCTGGAGGAGCTGGAGCTGTCGGGGAACCGCTTGGGCAGGGTCAGGCCCGGCTCCTTCCAGGGCCTGGGCAGCCTGAGGAAGCTGTGGCTGATGCACGCGCGGGTGGCGGCCGTGGAGAGAAACGCCTTCGACGACCTGAAGGCCCTGGAGGAGCTCAACTTGGCCCACAACGAGTTGGCCTCTTTGCCCCACGACCTCTTCGCCCCTTTGCACCGCCTGGAGCGGGTCCACCTGCACCACAACCCCTGGCGCTGCGACTGCGACGTCCTGTGGCTCAGCTGGTGGCTCCGGGAGACCGTGCCCAGTAACACCAGTTGCTGCGCCCGTTGCCACGCGCCCCCGGCTCTGCGGGGTCGGTACCTGGGGGAGCTGGAACCCGGGCACTTCACCTGCTACGCCCCGGTCATCGTGGAACCTCCCGCCGACCTGACCGTCACCGAGGGGCTGGCGGCAGACC
>XM_053147013.1 Fusarium falciforme Sm domain-containing protein (NCS54_00138400), partial mRNA 
CCAACTCTACCACGCCCTCTATTGATTTCGCCGCCTGCGGAAATGGACTCGGAGCAGGCTCGAGAATACCTATCGGGTATTCTAAACAAGAACCTGCGTGTATACACCACAGATGGTCGCCTATTCTGGGGTGCTCTAAAATGCACCGACCCTGATAGGAACATTGTTCTTGCTCATACATACGAGTACCGGCAACCGTCATCTAGGCAGCGTGCAGAAGCAGCCGAAAAGGCCGGTGGCGAAACAATCAAGCTTGACATGAGCTCCCGCTATCTGGGACTAGTAGTGGTGCCTGGACATCACATCGTCAAGATGGAGGTTGAGGAATTTGCGAGCCAAATGCGGAACCAGATTTGA
>XM_010271001.2 PREDICTED: Nelumbo nucifera uncharacterized hydrolase YugF (LOC104606003), mRNA 
CACCCATCCAAATACTAATTGCAAACTGCAGCATTTATAATCGTATTCTCTCGTTTGAGCTTGAGGTCTCTCTTTCACTCTCCCCTCTTATTGGATGCCGAAATCTGCGGTTCCTTCTGTTCGTTGGTATGGTTGGGGTCGCCACTCGCCACCTGAGACCTCACCTCTAATAGGTAGGTATTGTTTGGCTACAGCTCCACCGCACCCCTTTCTCATTTCTCCTCTTCTGCTTTGGGAATCCTATAGTTCAATCGGTTCTGCATCGCCCCAGATTGATCATACTTCGGACTCGGAGGCGTATTTCGCTCAGATCTGTATAATTATCGTACCCATTTCATAGCTGGATTGAAATCGAACAACCTCCCAGTTTGTAGTGGTTCCGGTCCCTCTATTCCCTCCCAAACCTTCCATGGTGAAATCCCCAATTATCTGGTCTCCAACCGGAGAGACACCCTCCATTCGCGAGTCCCTTCCAATTTCATCAAGAAATCCGCACAAACAATAATAGTAAGGATAGAAGAACTTGGACCCCTCATCCCTCTCTCTCTCTGTAATTGATCCCTTACTCTCTCTCATGGCTAATAAATGTTTCAGCTTCACCGCATCAAGGGACTGGTGCTACCGTTACGCCTTCGCTAGCACTGGGCTTCGATCGGCCACGACCGACCTCGGCGATGGCACTGTCGTACATTGTTGGGTCCCCAAGACGCACAAACAGAACAAACCAACTCTGCTCCTACTCCATGGATTTGGAGCCAACGCAATGTGGCAATGGGGCGATATCCTCCGCAGCTTCGTCTCCCGCTTCAATATTTACGTCCCCGACCTCCTCTTCTTCGGTGACTCGTTCACCACTCGCCCCGAGCGGTCCGAGTCGTTCCAGGCCCAGTGCATGATGAGAATGATGGCGGCCCACGGGGTGCAAAAGATGATCTTGATTGGGCTAAGCTACGGCGGGTTCGTCGGGTACGGCATGGCGGCGCAGTTCCCGGAGGCGGTGGAGAAGGTGGTGATATGTTGCTCCGGGGTGTGCCTGGAGGAGAAGGATATGTCGGAGGGCTTGTTCATCGTCTCCAACTTGGACGATGTCTTCAGCGTTTTGCTGCCGCAGACGCCGGAGAAGCTTAGAGAGCTCATGCGGTTATCGTTCGTCAAGCCGGCCAAGATCGTTCCTTCTTGCTTCCTTCGCGATTTCATCGACGTTATGTGTACAGAATATGTTGAAGAGAAAAAGGAGTTGATCCATGCTTTACTCAAAGACAGGAAGCTTTCTGATCTTCCCAAAATCTCTCAGCCAACGTTAATAATCTGGGGAGAGCAAGATCAGGTATTCCCATTGGTGTTGGGACACAGATTGAAAAGTTATCTTGGGGAGAATGCTCAGCTAGTAGTGATAAAGAATGCGGGGCATGCTGTCAACTTTGAGAAGCCCAAGGAGATATACAAGCACTTGAAACCCTTCCTTTTTGATTCTCCTCCTCCTTCTCCTCCATCACAGCATCCTCCTTCAAAGTTTCTTGAAAACAAAGTAGATTGATGAACTGGTTTAATCTGATACGTACTACATTGTTAAACTAATATCATGGCTATATGGAAGCTGCTGGTGGCCTGGTGGGACTCTTAGAAAAGGCAGGCAGAGGAAGGTTTAGTCCAAATGTGCAACAAATTAATTAAGGATCCATATTGGTGATGATGAGTATGTATAATTGATTGATAACATAAATGCATATTGTACAATAGATCGATTGATTCATTGATTGA
>KP859945.1 Uncultured bacterium clone OTU_340 16S ribosomal RNA gene, partial sequence 
CACGTAGGGGGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGTGTAGGCGGCTAAGTAAGTCAGGTGTGAAATCCCTCGGCTCAACCGAGGAATAGCACATGAAACTATCTAGCTTGAGTGCAGGAGAGGGGAGCGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGGGAAGAACACCGGTGGCGAAGGCGGCTCTCTGGACTGTAACTGACGCTGAGGCGCGAAAGCTGGGGTAGCGAACGGGATTAGATACCCCGGTAGTCCCAGCCGTAAACTATGGGTACTAGGTGTTGGCAGTTAACCTGTCAGTGCCGCAGCAAACGCATTAAGTATCCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCGGGGATTGACATCTTGTCGAACTTGGTAGAGATACCGAGGTGCCTTCGGGAACGTCAAGACAGGTGGTGCATGGTT
>XM_014748744.1 PREDICTED: Polistes canadensis E3 SUMO-protein ligase NSE2-like (LOC106786730), transcript variant X4, mRNA 
TTTAATAACAAAAAACAAATAAAAATGACTCAATCAAAAGAAGTAGCCGAAGAATTGTTCGAATGTTATACAAAAACTGCTGAGAATATAGTTATATACTTTCAAGATAAAGAAAAGATAATAGCTGATTTGAAAGATGTTGTACAAAAGAACTGTGAAATAGATACTAAATTAAGTATGATTCAAGAGATAAAGGATGAAATATTAGAGAAATATGGTGATAAGAAAATAACGGAAAAAAATATACCTAAAATTATTAAGGATTATGAGAAATCTATATCTACAATGAATGTTGATGTATCTACAAATAAAAGATTACTGGAATTTAATAGACAATTGGAAGCATTATTGAACGATGCGAACAAAAATCAGAATATTGAGGAAAGTAACAGTGACGAAGAATTACAATTACAAACAGATTCTATGAATGTGATAGATCCTATTTCAAAAATGAGGATAAAAGATCCGATTAAAAATATTGCATGTGGACATACTTATGATCGTCAAAATATTATGGCATTGTTAAAAGTAAATAAAAAAACAAGGTGTCCCATGGTTGGATGCAAGAATACAAAATACATAGAAATCACAAATCTTCAAACGGATGTTGCAATGAAAGTATTTCTTCAAAGAAATCCTGTTTAATATTGTGACATTAAATGATTTTGTTCAGACATGCTAAAAATGTGATTATTTACTAATGTAAACAAATCACAAAATATTTCTATATATATTTAGATTTATATATATTATATAAATACAATTAGTATACCTACACAGAGATAAAG
>XM_023661946.1 PREDICTED: Cucurbita pepo subsp. pepo vacuolar protein sorting-associated protein 54, chloroplastic-like (LOC111781387), mRNA 
GAGGCGGAGGTGGAGGTGGATTCCACTTCATAGAGGCGAGAGGCTTGAGGCTTGAGGCGAGAGGCTTGAGGCTTGAGGCGAGGCGCGCACGGAATTCTTGAACGAGATCTACCGCGGCACCGGACTTGCATTGCCAACTCTTATTTTCTCTCTCTTTCCTTCACCCAGCGGCGTCCACAACCTCTGTTTTCTTCATCATTCCTTTTCCATCTGGTGATTGAGATCCATCCGAAGCACTTCTTCATCTCGATCTCTCTCGCGATTGGAATTCATCTACTGAATGCCATCTTTGGAACCCGCCATTAGTTCATGATTCTAAGACTTTGAGCATGGACTCCCAGCCTTCCCAATCGGGAAGGTCCCCGACCGAGTATTCCAGCCTTCTCAGTAGAGAAACGACTCTTGGTCGAACTACTTCATCCTCCTCGCCTAAATCCAACCCCGATGCCAGCAGCCAGAGCTTGTCTTCAATTCTCAACAACCCTCACGCTGGCAAGTCCGATGCGTCCTGGGTTGGCTGGTGGTCCTCTTCCTCCACCGTCACCCCACCTGAGTTTATTCCCCTCACATCCTCCACAGCCTCATCGGAAGTTACTCGATTCGATTTTAACAACTACACGGCCTTGATCTCCGATTCTTATAACCGATTCGAGGACATACGAAACCATTCCAGCAAAGAGAACGGTGGCTTGGATAGCATTGGGGGCCAGGGGGAAGCCCTTGTGGCATGTTTGAGAGAGGTTCCGGCGCTTTACTTTAAGGAAGATTTCGCATTGGAGGACGGGGCGACATTCCGTGCAGCGTGCCCCTTCTTGAATGTATCGCAGAATTTAGTGCTGCAAGAGAAGCTTTCGCATTATTTAGATGTCGTGGAGTTGCATTTGGTCAAGGAAATTTCACTGCGTTCCAATTCTTTCTTCGAGGCTCAGGGGCAGCTACAAGACTTAAATGTGAAGATTGTGGAGGGATGTAGCCGGCTACGGCAATTAAAGGAGACCATACGGCTCTTGGATGTTGATTTAGTGGACTCTGCCAGGCAAATTCAGGAGCAGAATGCGACCAGGAACAATTTGTTGGCTCTTCAGCAGAAATTGAAGCTTATTTTATACGTTAATCAGGCCATTTCAGCTCTTAAATTGCTTGTAGCATCGGCAGATTGTGCTGGAGCCTTGGATGTGACCGATGATTTATTACATCTTCTGGAGGGTGATGAACTTGCCGGTCTACATTGCTTTCGCCACCTCCGTGATCATGTGGCAGCATCACTCGAATCCATAACCAGCATTCTTTCAGCAGAATTTATGCGTGCCTCAATTCATGATGCTGGAGATGTTGATCTCGTAATTATATCTGAAACAAAAGCAAGCATTTCAAATTTAATGAATGGAAAGGATGAAGTCAAGTTAACATGTATCTTGGATGAGGAAGAAACCTCCAACTTCCGTGATCGTCTTCTTCCTATTATCATTGGATTGCTTAGGACCGCCAAGCTTCCCTCTGTGTTGAGGTTATATCGTGATGCAGTTACAGTTGATATGAAAACTGCTATTAAGAATGCAGTGGCAGAATTACTTCCCGTTCTTCTAGTCAGACCTCTAGACTCAGATTTTGCACCGGGAGAGAGAACGAAGGATACAGATGGTGGAGCATCACTCGCAAGCAAGCTGAGGGGCCTGTCATCTGAAGGTTTTGTTCAACTTTTAAATGCCATTTTCAAGATTGTACAGGTACATTTGGTGCGTGCTGCAGAAGTGAAAAAGTCTATCGAATGGATTATGTGCAACCTTGATGGCCATTATGCTGCGGATTCAGTTGCTGCTGCAATTGCTACAGGTGCTGCAGCTTCTGGTACAGCTCAAGATAGTGATAACCAAGGTGGTTTGCCTCTTCCTCATGTACCTCAGGGTGCTGCCAAGGTTACTTCCTTACAGGGAAAAGCAAATGATGCGGCAAACCCTTCAAACATGTCTAGAAATTTCAGGGCTGATGTACTGCGAGAAAATACGGAAGCTGTTTTTGCAGCTTGTGATGCTGCTCATGGAAGATGGGCTAAACTCCTTGGTGTTCGCATTCTAGTTCACCCAAAGCTGAGGTTGCAGGAGTTTTTAAGCATATACAACATTACACAAGATTTTATAATGGCCACTGAAAAGATTGGTGGAAGGTTGGGATATAGCATTCGTGGAACTTTGCAGTCCCAGGCCAAAGCTTTCGTTGATTTTCAGCATGAATTTCGTATGACAAAAATAAAAGCAGTGCTTGATGTTGAAACATGGGTTGAAGTGGATGTTCCCGATGAATTTCAAACCATAGCTGAATCACTATGTTTTCATGAGCTGCTTTCTGCAAAACTTGATGATTCTCAGGGTAATATGGATCAAAGCTACAGTGATGTAGCTACAAATAATGAAGATGCACGCATTATAGGTGGTGTCAATGCTCAACAGCACTCTGAACAGGTTGATTCAAGTGACATTTCTGGGAGGAATACTGAACATGTGAAGCCTACTCCTGCAGATACAATTGAAAACAGTAAAGCTGATGTTGCAATTCCTGCGACACAAAATAACAATACTAATGTGAAGGAACGTGGAAAATCAAGTTCTCTGACTTTGCAATACAAAGGCGTTGGTTATCACATGGTTAACTGTGGGTTGATCTTGCTCAAGATGTTGTCTGAGTACGTTGACATGAATGATTCTTTGCCAGCACTATCTTCTGAAATCGTTCATCGTGTTGTGGAAATTCTCAAGTTTTTCAATACAAGGACTTGTCAACTTGTTCTTGGAGCTGGTGCTATGCAGGTGTCTGGTTTGAAGTCCATCACATCCAAACACTTGGCTCTTGCCAGTCAAGTTATCAGTTTCACCTTCGCCATTATTCCTGAAATGAGAAGAATCCTTTTTCTCAAGGTACCTGAGGCACGAAAGACACTATTGCTCTCAGAGATTGATCGAGTGGCTCAAGATTACAAAGTTCACCGAGATGAAATTCATACTAAGCTGGTCCAGATAATGAGGGAAAGGTTGTTAGTACATCTACGTGGCCTGCCGCAAATTGTTGAAAGTTGGAATAGACTAGAGGATGCTGACCCTCAGCCCAGTCAGTTTGCTCGATCCCTTACCAAGGAAGTTGGGTACCTTCAGCGTGTTTTATCTCGAACCTTACATGAGGCTGATGTTAAGGCAATATTTAGGCAAGTGGTCAAAATCTTCCATTTACAAATTTCTGAGGCATTTTCACGGTTAGACATAAGCACCCCTCAAGCAAAGGACAGGTTGCTTCGGGATGTTAAGCACATTCTTGGCTGCATAAGATCTTTGCCTTGTGATGATTCGAGTAAACCTGACATCCCAAACTGGGGGCAACTTGATGAATTCTTGGACCAGAGACTCGGATCTGAAGCTGGATAATGATGTGAATGTGTATTTTCCATTGTTTGCTTTTTTGATGAAGGGGGTCATATTTGAGGAGTAAATAACAGGATATCAGAAGTCAATTTTCAACCTATGTCATCTCCCTTGTACACCTAAAAATCAAGGTTTTGCGATTCTCATGGACAGGCGTGAAGTACAGTTTGGGATTCAGATATTTCAACGAAGTTGGGCCTTGCCCTTTTTGCTGAAACACATAACATATTATATGTTGTATTGGCTAGGCCAACACTTTTTGCTGCCCTAATTGTAGTTATGTTTAGAGAAAGAACAGATCAATTTGTTTACTCGAATAGATTTTAGTTCCTTGCTTTCTTTTCTTTCCCCCCCTTCAATTTTTATGGGCTTTCGTACAGTTACGCATGTTTGTACTTTGTAGAGCTAAATTTGTCATTATTGCCTATAAATAATTTTGCTTA
>XR_005523613.1 PREDICTED: Hibiscus syriacus uncharacterized LOC120200931 (LOC120200931), ncRNA 
AAGTAAAATCAAAAGATTCAAACATTGGAATATACACTTGATCAAAAACACACTAACCCTTTTTTACAAATCTTTCTTCTTTTCATCATCTGACCCTTACCTCTTTGTCCCAGTGTCTCCTACGGTGAAACTTCGGTATCTGGGTTTTACCTTTTTTCTTTTACCAGAGATAAAATTTCACTGCTTTGGATCCGCCCCATACCCCTACTTTTTACCCTACCTTCCTTTCACCCTTTAAATTGCTAGACGATCCAAGCTCGCCTAAAGAAAGAAACAAGTGAAAGAAGAAACAAAATTTTCTAACTCTTTGAAAAGTTGGGTCAATCGCCAGTACATTCCAACACTTGTTTCTCTCTGGCAGTATGGATGATTATTACAGAAGGAACCATGTTCCAGCTTTTGGTAGCTGGGATTGGAACAATGACCTTCCTTTTACTCAGTGTTTGAATCGGCTCGGCAAACCGGATTCCTTCGTTATAGCTACGCCGAGGATCGTGATTTATACGTCGCTGGCGATCTTTATGAGAACGATGTCGTCACTCCCGCCGTGATTGTCGTTCCTCGTAAAAGGACAAAAGTAAGACAGTCGCATGTTAAAGACGGCAAAAAGCAAGAATGGGAGGTCAGTGACGTGAAACAACCGGCATCGGCAGCAAGCCCCATTCCCGTGTCCAAGCCAACTCCAAAACCCGTTGATGAAGACCTTTACAAAATCTCGCCTGACCTACTTTACACTAAAACCAAAAAGAAAAAAAGGTTGAGCTTGTTCTCATGCTGTTTGGTGCCAAGTTGATCATCTTGGAGGATTACGTAAATATAGTTCTTTTGATCCGTCCCTTCCCCTTGGTGTACTCAAGGGT
>XM_003231613.2 Trichophyton rubrum CBS 118892 uncharacterized protein (TERG_07960), partial mRNA 
ATGGCACCATACACCAAGGTACAGGAGGCGAAAAACAGCAACGGTCAGGCAACAGGGCCTCCTGGCCCTCCACCAGCCGCAGTCCCTCCTCCGCCTGCTGATCTACCACCAGGGGCCGTTCAGCAAAAGCCTGAAGCCGCTGTCGTCCCGGCTATTGTGGTCCGGGACTGGACGAACGAGGACAACGCCCAGTTGAAGAAGTTGAAGGAGGACAACATCAGCTGGCGGAAAATCGCAGAGACGATGAACTGGCCGGTCCACGAGCTAAGGGAACGATGGCGGGCCATCAAGCCTGAGCTGCCTAAGAAGTCGCAGCAAGAGCCAGAAAAGGTCAAGCAAGACGGCGTTCAGGAGAAGCAAGTCGTGTTTATGGAGTCAGTCAAGGAGAAAAAGAGTAAAGAAATCCCAAAGGTGGTATATGCAGACGAGAGTCTGAGTACAGAGGAGGCCGTCCTGCTCAGCAAGCTTGCGGACAAGTACGACAAGGAGATGTGGTTACGCATCTGCTCCAAGTTCTTTGACAAGACCGGCAAGCGACTTGATCCAGACGAGGCCAGACGGCACATCCGTCCGTCATAA
>X84340.1 H.sapiens mRNA for Ig light chain, variable region (ID:CLL001VL) 
CAGTCTGTGCTGACGCAGCCGCCCTCAGTGTCTGGGGCCGCAGGGCAGGGGGTCACCATCTCCTGCACTGGGAGCAACTCCAACGTCGGGGCAGGTTATGATGTGCACTGGTACCAGCAGCTTCCAGGAAAAGCCCCCAAACTCGTCATCCATGGTAATAGCAATCGGCCCTCAGGGGTCCCTGGCCGATTCTCTGGCTCCAAGTCTGGCGCCTCAGCCTCCCTGGCCATCACTGGACTCCAGTCTGAGGATGAGGCTGATTATTACTGCCAGACCTATGACAGCAGGCTGAATATTTGCGTGTTCGGCGGGGGGACCAGGCTGACCGTCGTAG
>XM_033723222.1 Mytilinidion resinicola uncharacterized protein (BDZ99DRAFT_493278), mRNA 
CGCGTTAGTCTGTCCACGTCGTCACTCGAAATCTCTTGCTAGGCTTGCTTGTTCGCACACTTAAGCTGCTCCTCTTCAGCGCTCTCGCAGCACCCCGAAACGCGTCAAGATGCAGCCCCTGGAACGAAGTGACATAGACCCGCATGCCGAAAGGACGCTTCATGCTCAGGGTAGAGGAGAGAAAAGAAAGCTTCTAGTGCTATCCGAAGACACCCTTGAAAGACATAACAAGTGCTATCGAAAGACGAATGAAGCCTTCGGAAAGTCCGCCATTCGCCAGGAGGGGGCGCTGGCTTACGAAGAGGAAATGTATCATCTGCACTACGGCAAAAAAGTCGTAGCATTGCACGACGGATTCGTGCCTGGGCCCGACAAGAGAAGCATGCCGCCGCCGTCGCCGCCATCCGCCAATAACATGAACATATACAGCGCAACGCCCTCGTCCGAGACTCCGATGCGTCGCTTCATGTTTCCAAGCACGGCTCATGACGCCCAGCCATGGCTGGCACGAGGGATGCTTGAAGACAGCGGAATAGGCTGCGGCGACCTAGACAGCCTCGAGTTGAGAAGGCTGGCAGGGCAGGTCATAGTTCCTGACGAGAATGGAGATGAGACAGAGGGCAGCCTGTGTCCTTCATCGCCCACTCTGTCGAATGCGCAAGCGATGCGGGTGGTGAAAGAGAAGCAGGAAAGGGGATCTAAAGAGAACCCGCGAGTCCGAAAATTGATAAAGAGACATCGGGCGCATACTTCTAGAGATGCGCAGGATTCAGGGAATACCCCCGAGTAGAACAGGCTAGAGGCGGTACACCACACCACCTGCAGGCGGCTCTATGGGCTCAAGCTGCCGGCAAATGGTGTCGAGACGAGGAAAGATGTATGTACCTACAGATGCGGTGGATATCAGAAGTTTCGGGTTTTCTAGTTCGTCTTGCTAGTATGGATAGGCAGCACAGGCAGTCAGGCATGGTATACGATTAAATGAGAGACTCCAAAACTGGTGGGAGCACGACGCTTTTGAAGACTTCTAAAGCCACAACAAAGACTGCAC
>XM_042379977.1 PREDICTED: Homarus americanus putative transcription factor capicua (LOC121875420), transcript variant X2, mRNA 
CTGGCTGCCATAACTCTTCCCATGCAGCAGTTGTCTCCATCTCAACAGCTTCAACAACAACAGCAACAACAAGTACAACAACAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAGCAACAGAAAGTTAAAGCCCAGGTTGCTAGTATACCTGTAGCAGTGCCAGGAGGAAGACCTTTAGACGACGAAGAATTAGACGACAAACCAAAGTTTATTTTGGCTCCTACGCCGGCACAGCTCGGCAAGGCCCCTAGACAAAAGCGACTCAACTCTTCAGGGCAAATATCATCTATAGGAGACACTGCACCACAGTTATCTCCGGACGTAAAGATGGCTCCTCCGCACCACCCCAGCGGAGACAGTAAGGTATCTCCGGTGTTGAGTAATGCTTCAGAGGGCGACTCATCAGTACAGACGACCACCCAGCAGATGGTCTCTGTTCCACCATCACCTAGTGAGAAGAAGAGTTTCTTTAAGAAAAATATTGAGGATGGCATGGACAAGGTCCTTGAAGAGGTGAATTTCGAGCAGAAGTTCGGAGCGCTGCCCGAGTTTAACCCTGACGAGGTCCAGTCCCCCAGTGTCAACGCTAGCACTGGGCCCTCCGTACCTTCCTCCCCGCGGACCTTTATTACGTCTTACAGGAAAAAACGTAAACATTCCAGTGGTGAAGAGTCAGGCTCAGATACTCCCATGAGTGTCACCCCTCACCAGACACCCTCACTGACACCCTCCTCCACACTGCAAGGATCCAAGTTCTTTCCTCCTGATTTCAACCCAGAGACTTTCAAGGTTGGTGAGTCTCGGGCGGACAAGTGCGAGATAGAGTCACCTGCTGCAGGAGGCCGTTCACCCAAGACTCCCAGAGATGCGGACAAGAGCCATTCATCCTTGAGGCACATCCTGGATCAGAGGCGCACCCTTGTGATGCAGCTCTTTACTGAATATGGCTGGTTCCCATCTGCCCAAGCCGTCGCAGCATTCCAGTCTCGATACTCGGACATCTTCCCTACCAAGAACTGTCTGATACTCAAGATAAGAGAAGTACGTCAGAAGGTCCACCAGAACACACCCAACACACCTGGTGTACCGAGCAGTCCTAACCCGGCCACACACACTGGGTCCTCCTTACAACACCCCCACAACAACCACCACAAATTTCTGGTTAACCAAAAAGAATGTCGTGGCCGAACCATCGTACACGATCATCTCTCACTGCCGCTGTGTCAACGTCAAATCAAGCCACCACTTCCCTCCCAGTCGGCACATAATGCCACATCTCGGCTAGATTATTAATTTTACTGTGTTGTTTTTTTATTTTTATTTATATTTTAACCAATGGCTACCCAGCATTACTACATAATAATAACATTGGCATTTTACTACTGTTAAGAGTTGAATGTGTACTTTGTATAAATTAGCGACAGTTA
>XM_004341098.1 Acanthamoeba castellanii str. Neff uncharacterized protein (ACA1_236710), partial mRNA 
ATGCCGCTGCCGCCGCCGGCCGTGGTTGCTGGGATTGAGGGCGCCGACGCGGCTCGCGGGACGCCGCCGTGGGGACCGCGCTCGATAACCGTTCCAGCCTTGACCGTCTCGCGCGGGTGCGGCTCCGACGTCGTCGTCGACCCCGGGGCGTCGCCGCCGCTCTCCTTCCTGCGCTTGCGCTCCTCCTCGATGAGGCGCATCTCCTCTTCCTTCTTGCGCGCCGCCTCGCTGTCGGCCCGCTCCTTCTCGCGCTCCTCCTCCTCGATCTTCTTCTTCCAGTCCTCCTCAGTGATCTTCACGCTGCGACGGTTGGCCAGCTTCTGCTGCTTCTCGCGCTCCTCCTTCTCGCGCTTCTCCTTCTCCTCCTGCTCGACCTTCTTGCGCCACTCCTCCTCGACGTTCTTGCGTGGCGTCTTGGCCAGCGCCTCCTCGCGCTCGATCTCCTTCTGGATCTTGTCGTCCTTGGGCTCCTCGCCGCTCAGGAACGCGCTCTCCTGCTTGCGCTCCTTGACGGCCTCGGCGATGCGGCGCATCTCCTCTTCCTTCTCGCGCGCCTTGTCGCTCTCCCTCTTCTCGCGCTCCTCCTCCTCGATCTTCTTCTTCCAGTCCTCCTCAGTGATCTTCACGCTGCGACGGTTGGCCAGCTTCTGCTGCTTCTCGCGCTCCTCCTTTTCGCGCTTCTCCTTTTCCTCCTGCTCGACCTTCTTCTTCCACTCCTCTTCAACGTTCTTGCGTGGCGTCTTGGGGAGGGCCTCCTCGCGCTCGACCTCCTTCTGGTGCCTGTCGTCCTTGGGCTCCTCGCCGCTCAGGAACGCGCTCTCCTGCTTGCGCTCCTTGACTGCTTCGGCGATGCGGCGCATCTCCTCTTCCTTCTCGCGCGCCTTGTCGCTCTCCTTCTTCTCGCGCTCCTCCTCCTCGATCTTCTTCTTCCAGTCCTCCTCAGTGATCTTCACGCTGCGACGGTTGGCCAGCTTCTGCTGCTTCTCGCGCTCCTCCTTCTCGCGCTTCTCCTTCTCCTCCTGCTCGACCTTCTTCTTCCACTCCTCTTCAACGTTCTTGCGCGGCGTCTTGGGGAGAGCCTCCTCGCGCTCGACCTCCTTCTGGTGCCTGTCGGCGCTGTCGTCGTCGGGACCCTTGAGGAACGCGCTCTCCTGCTTGCGCTCCTTGACGGCCTCGGCGATGCGGCGCATCTCCTCCTCCTTCTCGCGCGCCTCCTCGGCCCTGTCGCGCTCCTTGACCTCGCCCGTGAACATGGAGGCGATGCGACCCACCTTGGCGTTGCGCGCCAGCTGCTGTCGCTCCTCCTCCTTCTTGCGGCGGATCTCCTCCTCCTTGGCCTTCGATCCGCCCTCGTCGTCGCCCGACCCGATCTTGTTGCGCCACGCCTCCTCCTTCTCCTTCTGCGTCTTGGGCTT
>NM_001302118.2 Gallus gallus CDC28 protein kinase regulatory subunit 2 (CKS2), mRNA 
AGTCGTTAGGGGGTTTGCGGGCAGATAGTATTGTGCCTAGAGTTCCGCCACTTTTTGCCATGGCTCACAAGGATATCTACTACTCCGATAAGTACTTTGATGAGCAATACGAGTACCGGCATGTAATGCTACCAAGAGAACTCTTGAAACGAATGCCAAAAGCTCATCTTCTGTCTGAAGAGGAATGGAGAAGCCTTGGTGTTCAGCAAAGTCTTGGATGGGTTCATTATATGATCCATGAACCAGAGCCACACATTCTTCTCTTTAGAAGACCTCTTCCAAAAGATGATCAGAAATGAACTACTGTCTAGAAATATTCTTAATCTTCTGGAACTTTGTGTATGCATGTATATATGTTGGTAGTATTCAGTGAATACTTTATGTACAAAACATACAACTGTACCTGTGCATGAGCTGTATTATTCACAGCAACAAAGCTCAGTCAAATGCAATTTCTAGTAGGCTGCTATTCTTTCAAAGAGAAGTGGAACTTCTAATAGTTCCTCTTAGTCTGAAATGAGTTCTCTAATAAAGTTTACTATTGTG
>XM_032261620.1 PREDICTED: Sapajus apella otolin 1 (OTOL1), transcript variant X1, mRNA 
GGTCTTTTCATCTATTCTGGGTATACTGATGATCTCTTAGGAGTTAGACAGAAGTAAGAGAAGTGTATTGTTTTATAATCTAGTAATAGCCTCTGGTTGCAGATCTTTCCTAGGAAATTTGAAAATGTTTTTACTCCTTTATGAAATAAAAATTTTAGTTTTATTATATAAGGCTTTGTAGTTTGGGTTTATCTGAAGTAAGCCACCCATTCACTGGCATTGAGAAAGACTGTGGAATGGTTTTTGTGGTCACATGTCTTTTGAATCCAGGTTCGCTGGGCATATATCCTGGCTCTGCTAAACTGTATACATGACCTTGGGAACTTCCTTTACATTTCTTGGTCAGTTTCTTCATTTGTAAAATCAGTCTGGCAATAATGACTACTTCTTAGCTGTTTAAAGCATTTAGTGAGTTATTGAATGTTAAGTGCCTGACTCTTGCTTAGGACTCAATAAATGTTAGATATTACTATTAGTGACTACTGTACAATGAAATAAGATTACCTACAACTGTGAAGATAACTAATTAAAACAATAATCAAGACTGGAAAACATATATTTATTGTGTACTATATAAAAACATTCCATCAAGATAGAATAAAGCTATGAAGTCAGACAGATACAGGCTTGAAAATTTGGTATGTGTCATACTGCAGGTAACTTAGCTGTTCCTGAGCCTTGGTTTTATCTTCAAAATGGAGACAATTCTGCTTTGGAGGACTGTTGTGAGCAGAAACAAGAACATTTGGAAGAGGCTGGTGTACTCAATACAAATGGCTATTATACTTTTTATTGCTACTTGCTTTTCTTGAACTAAATTTTAAATAGCAACTCCTCTTTTTTATGGAAATCTAGGGAGTCTGATTTAGAGGAAGTGAGTACATGCTGTAGAATGGCCCATATGCCATTTTGCTATTAGAATATGAGTCATTATTTCTAAACTTAGTATTGCTTTATTTGTATGTTCCTTGCTTTTCTCAGAATCCCTAAGTCAGATCCAACCATAAACTTTGGATCATAAAAGAAAGCAACTTCAATTAAGTGGATTTTTGGAGTCACTGCAAGTCACTCATATGAGGCTGTCTGACCAAGCAGTGATGTAAAGAGGGCTAATAGTATTTCAGTGAGCAGCTCTGGCATTTTATGTTTGTACAGAGTGCTTCTACTTAACGAAAGTTTTAAATTTGTATTATCTTTTGTATTGAGGTACAATTTACATATGTTGAAATGTGTAGATCTTAATTGTGCATTCCCTCAGTCCTGACAGATACATACACTTCTATTAAGATACAGAATATTTCCAGAAAGTGTCCTCGTGTCCCTTCTCAGTCAATCCTTTCTCTTTTCCCATGCAACCACTATTCTGATTCCTATTGCCTTTGGTCAGCTTTTCTTGCTGTGGAACTTCACATAAATGGAATCCTGCAGCCTTTTGTGTCTGTACTTTTTTCCTTACCATAATGCTTTTGAGATTCAGCTGTATTATTATATGCATCAGTATAGTTTATTGTTGTTGGTGAGTAGTATTCCATTGTATGGATATACCAAAGTTTGTTTATCCATTTTCCGATTAAGAGACATTTGGGAAATTTCTGTTACTTCTTTTGATCATTATTGTAATGTTGTTGGAAGGTCAGAAGATTCTACTATCTTATTCTCTAGATTAGGAAGCTGGGATTCAGAGAAGTGAGACAACTCAAGGTAAATGGGGAACTCGAGAAGAGAACCTGATTATCTGGGCCCAGATCCTCTGCTTCCTTTACTTTCTATTTTCTGAGCCCAGGTTATTTTTGGCCCTGACTAGGAGTTCTGCCCTGTCTGACACCAGGATTTGACCTGACCTGTCTTATCTTTGATGGAGAAAGACCTAGAATATCAAAATTTAGGAATGTAGCCCTAATCTGGGCTAACCCTTGCCTAAGCCTTAGTTTCTTTCAGGTGCAGTGAATAGACTTCTTAGGCTGGCTCAAAAGTTGAGCAAGTAGAGGATCTGGATTACACCGGTTTAGATTACAGAATGCCTGAAGATATTCTAGGAGAGCTTTGTCTTTCATAGTGGCAAAGGGGAAATAGGATGAACATGGAATAAGATAAGCGTCTCTTAAATCCTAGCTCTGCCACCTATTAGTTGTGTGAGGTTGGGTAACTCAACTCTCTGGGTCTCTTTCTCCGTCTGTAGAAGAGGTAGTACAATGCTTCCCTCTCAAGTCTCGGCAAGGAAGTTCCTGACACAACCTGTCCTTTCTGTGCTCGATCAAGGTTGGAATTAAGAGAGCATTATAATATGATATTGATATTGCTGTGGGATTTTCATTGTATGGAAGAATGAATTCTTCCCTTTATCTCAGAAGACAATTCATTATTTATAGAATCTGAATAAAAATAGAAAAGTTAATTTGTCAGTAAAGTCCTCATAAAAATAAAGCAAGAGAGGGGCAAAGAGGAATGTGTTTACTTTAAGACAGCTGGAAAAATGAATATAGGTAAATAGGTCCTTTGAAGACACTCTCTTCCTTCTCAGGAAAAAGGCAAACATATTTAGAAGGTTAATCCTTGTTCAGGATGCTGATTAGGCTGTGTGGTTAAATAAGGTCTGTAGGAGAACCAAAAGGAAAAAGGATCTTAAGGGAACCCCATTCCTGCCCTATTATGGATTTAATGAGGTCTCTGGGTCACAGTTTCTCCATCTGTAATCCCTAAATAGCACTTTTTAATCACATATCTCAGGATTTGATGTGAAATTTGATGTGTTCAATTTTCTCATAATTTATATAGTTGCAAAAATTTTGCATAAAAAGAATAGTATTTATGTGTATTTTATGTAATTTAAGGCAAAGTATGCTGTCCAAGAAAATCTTACAGTTTATGAGAAGATTGACATGTGAATGACTTAACAGCAGAATACATTAAATGCTTGTCATAACAAAAATTGGCAGGAGTCTTAGAAGAACCTAGAGTTAGATGATTAGCTTGGTTCATAAAAGCTTCTAAAGGAAATTTCAAAGACTTAATGACATCACTGAACTTTTCCAACCAATATTGAGAGAAGCTGGTATGAAATGATTCAAGGAGTATTTACTGCTCTGCAAAACAGCTTTGCCTTTAATGTTTCCCAAGAAAAGGACATACTTGTAAAGACTTAATGCTTGTCCTAGAGAGGAAAAACAATTTCAACAGTCAGGACATCAGAGTGGTGGAAAGTATTCATGCAGGAAACTGAATGATGTACTTTATTTGTGAATTTTCATAATTAGCATTGAAACACCGCTACTTTGCTGGCTCAGCTTTTTAATGTATCAGATCCTTTGTGTGTAGGAAGAAAGAAGAATAAATGTGTCTCTGAATGTGGGGTGCTCTCTTTTAATAAAGAAACTTGAGAGAAAAGAGACGACAATAGGCAAATATGAAATAAGTTAAAAGAAGTAGGCAGAAAATAGAGAAAACTGCATCTCATGCAGTTGACGTTTATGTGGCAATTGCTTGGTTTGGACTTTTTGTCGGAGAACTTTTTTTTCAGAATTTATTTTGTGTATCACTAGTAAGTGTTGCATAATTTCCATATTTATTTATACTATGGGTCTGTCTCTCCTTCCAGACATAAAGGACACTTTGAATTTCAGGTGATAATGGAGCATACAATCACAGCAATCATATGATGAAAGTATGATTATTATTTTTATTGTCCCTGTGTTACAGGTGAGGAAACCGAAGGCAAGAAGTTGCCAAGTTTAGACAATTACTACTCACTCTGTCTCATGACAGCTGGATCAGAAGTGGGCAACTGATGGAGTCTGGATCCATGAGGAGTTCACGTTGCTAGAAAGGGTGGTGACCATGACTCCCTATTCTTAGGGGTGGCAGTGATTGCAATGCTTCAAAATTCAAAGGAGGTGTCAAAATGGAGGGTAGGGAAAAGGCGTGAGCTCTGCCTTCCCCTTGGCAGTGGCGAAGTGATATGGAGTGTGGGCAGGGAGGTGGCGCATTATAGGACTCAACACCACGCTCGTTTATACATAAGATTCCTACCCATTGGATCACTTGAGGAAAGGAGTTCAAGACCAGCCTGGCCAATATGAGTTCAGGCAGAGGACAATATGCAAAGATTGGGAACTAGAAAGAAAACAACATGCCTGTTTATTAAATGATTATAATTACCAATGTACCAGTTATTGTCTGGGAGTACTCAGGCCTATACCTGTCTTGTACCAATGGGGTAGAACTCCTGAGAACTACCTTCCCAAGATCCCCTTGACAGCTGGTTTCCAGCCTGGTTCTTCTAATGGGCTGGACTCCTATGTAATGAGAGGGAGATGGCAGAAGTAACTTGAAGGTCCTAGACTTCTGGTCCCAGCTGCAGAGCTGACATGCACCTGTGAATGCTTGCAAGGTTCCAGTGGCAGCAGCAGTGAATGTGTGCTCTGTGATGGATGCCCATTGTTTAGGGCAGACCAGTGTGGCCTCCTGCAGGTCCTGGTCCCTGAGAGACATTACTTTCCCCTCATGTCTCCTCTAGGCCTTCCCCTCGTGTCTCCAACAGTGTTGTAGGTTAACTCTCTGGATTAGATTCTTTTCTGTTTTGAATAATTAGAGTGCTTTCTATTTTGCTGATTGAATTCTTGACTGTTATCCCCCTATAATATGGCTGTTCTGGCAAGCTAAATTAGAGGACAGGAGAGCTATAAGGCCAGAGGCTTGAATAGGCTTTTTCAAAACTAAGATGACTGGAACTGAAGAGAAGATTTTGAGCAGACTTACCTTCCCTGTCTAGGGAGGAGCTGCTGGAATGCAGAAAATGTTATGAACTTGCTCCAAAGAACCAGAACCACATATACGTGCTAATTAGACTGAAAAACAGAATAGGAGAGAAACACCAGAACATGGCTGCAAGCCCTTAAGAAAAAGCAGTCTTATCTGTTCATAAAATGCAGGATAATGACCAATCCATTGATCATCATCTCCTTCTTACAGGAGGAAGAGTAAGGGGAATGGGTGGAAGTACCCAACATGCATGGGGAGAGCTGGAAACGTCTGCCTCTGAGCTGTGTTGGAAACCTGAGAAGCCTCAATTATGTGGATGTTTACTTGGCTTTGTGCTATTTTAATTATTTTGGCTATTGCTGGTATGAACACAATAGCAAAGACCACACCGTATACCAAATTTACGAAGAAATCTGAGGAAAGAGAGATGCCAAAGGGTCTAAAGCCATCCAGTGGCCCACCTCCACAAGAAGAAGAAACCCTCTTCACAGAAATGGCTGAAATGGCAGAACCAATCACCAAACCCTCAGCCTTGGATTCTGTGTTTGGCACTGCCACTCTCTTTCCCTTTGAAAACTTCACTCTTGACACAGCTGATTTCTTTTTGAATTGTTGTGATTGTTGTTCACCTGTACCTGGGCAGAAAGGAGAACGTGGAGAGACTGGAAAGCCAGGCCCTAAAGGAGAGACTGGGAATTTGGGGATCCCAGGGCCACCAGGAGTTGTTGGGCCCCAAGGCCCTAAAGGCTACAAAGGAGAGAAAGGGCTCAAAGGAGAACGTGGGGACCAAGGAATTCCAGGATACCCAGGAAAACCTGGAGCACAAGGTGAACTTGGCCCTAAGGGAGATAAAGGAAACACTGGTTTGGCAGGAGTGAAAGGACAAAAAGGCTCCAAGGGAGACACATGTGGGAATTGTACCAAAGGCGAAAAAGGAGACCAAGGGGCTATGGGCTCACCGGGCCTGCACGGAGGGCCTGGCACCAAGGGAGAGAAGGGGGAGATGGGGGAGAAAGGCTACTGCAGAGATTCTGGGGAGAAAGGAGGAAAAGGACAGAAAGGTGAGGCAGGTATAAAAGGAGAAAAAGGTTACAAAGGGGATAGTGGAATGGAAGGCAAAAGTGGTCACAGTGGTCTGCCTGGGGCCAAAGGTGATCCAGGGGTTAAAGGAGAAAAGGGAGAGTTAGGTCCTCCTGGTCTCCTGGGACCTACTGGGCCAAAGGGTGACATTGGCAGTAAAGGGGTCCGAGGCCCCATTGGGAAGAAGGGCTCTCGGGGCTTTAAAGGCTCCAAGGGTGAGGTGGCTAGAGTGCCACAGTCAGCTTTCAGTGCTGCTTTGTCAAAGCCTTTCCCTCCTCCAAACATCCCCATCAAATTTGACAAGGTTCTCTATAATGACCAAGGGAGTTATAGTCCTGTCACTGGGAAGTTTAACTGCTCTATTCCTGGGACATATGTTTTTTCCTACCATGTAACTGTGAGGGGCCGACCTGCTCGAATCAGTCTGGTGGCCCAGAATAAGAGGCAGTTCAAGTCCAGAGAAACTCTGTATGGTCAGGAAATAGACCAGGCATCTCTCCTCATTATCTTGAAATTAAGTGCAGGAGACCAAGTCTGGCTTGAAGTGTCAAAAGATTGGAATGGGGTGTATGTCAGTGCTGAGGATGACAGCATTTTTACTGGGTTTCTTTTGTACCCAAAGGAAACTTCTGGAATTTCACCATAAGTTTATGTCTTCAATCTCGTAGTTTAGATTTAGTGGAATAGGTCAATTAACATAGACTAGTGCTATTAAAAAAAAACTTCAATTTTTTCAAGACTATAAAAATAATGCAGAAATTTTTTTAAAAAATGTCTCTTGGAGTCAATTGTTATTTCTATTTTAAGGCACCTCCTTTAAAAATACTTATATATATTTCAGAACATATGTCAGTAACTTTGTAGCTAGGCTTTAAAATTTAGCATTATAATATCAGCATTATTCATGCCATTTAAGTATAATAATAATATCTGTATACAAAATATGAATGAGATTTATAGTTAATAAATATGTTCTTACTAAATATCTTCTATATCTCAGATAAATGTATGTCACTTCTTTTTGTGTAAATTGCATAGTATGACAGCAAGGTTTTGACTCTCTTGGATGGGTTGCCTTCTGACAAAATGGAACTCCTCTCATGTTGGTTTAATTCATGGAGATGACAGAAAGAGTGGCAAAGACTAGCTAAAGGATATTTAACATTTATCAGTGTCTAAAGGTTTGCTCACAAAACTTGTATTATATGGACTTGTGTGTTGGGTAAAATGTAAGAAAAAGTTGATAATCATAGTGAAGATGAAATCATTAATCAAATTATTGTGCTTAGAAGAACTGAATGTCCCCAAAAGAATAAAATGAAATCATTATTGATTTG
>XM_007480608.2 PREDICTED: Monodelphis domestica spermatogenesis associated 1 (SPATA1), transcript variant X3, mRNA 
GGCGGACGGTGGAGGACGGGCGCGCCTCGGGGGCGCGCGCACGTGCGCGCGCGGCTGGCTCGACGCCCCAACCCCCCTCCTCTTCCTCCTCTACGCCTTCCTTGAGAGAGCGAGCGAGCGAGCGACCGGGAGGGAGGGGAGCGCTGGCATTTACATGACTTGAAGACAAAAGATGAATGGAATGCTATCATTAAGTCACCTAGAGGATTTAGTGACCCTTATCATTAAGTAATGCTTAAATGAAAAAGAAGACCACCAAGAAGCAATTAAAAGCAATTGTTACTTACTCAGGCATCAATGACTACGTCATTCAATAGAAGTCGACCTTCTTCATCAGAGTTGGTGGAACTTCATGTTTTTTATGTCCCTGAAGGATCATGGAACTATAAGCTAAATACTATTTCAGTAGAAGTTGTCAGTAAATTTATTTCAGCTGGATTTATAAGGGTGTCACCTCATCTTACTTTGCAAGCCCTGAGAGAGCAGCTGGGTGAGTTCCTTGGTGAAGAGGCTGTTGCAGAAAAATTCTTGTTTTTGAAATGCATAGGGAACAATTTAGCTGTGGTGAAGACAAAGCAAGAAAAAGAACTAAAGCTTAAGTCATTTGCTCCACCATATGCTCTTCAACCAGAATTATATTTGCTTCCCATAGTGGACCACTTAGGAAATATTTATTCATCATCATCATCCTCTGCTATGGGAGATACACAGCAGAATAATACTGATGTTTTTGAGAATGATAAAACTACTCAGAAACCAGATAGTTGTGCAGCATCTTCAAACAAGGAACATGAAAAAGATCCAAGCCCTATAGAAAATACTGATAAAGTTCCTCCCCTCAAGAATCAGGAAGAAGTCAGCCTAAAAGACAACAAGATTAAAAAATATCCAGCAAGAAAGTATGGATTTCTAGAAGCAATTGATGATAAGCGTCTTTTTCTTGCACAAAACAAAAAAAGCCAATTCCAATGGGAAAACGGAGACAAGATAACTGATACCAGTAGAAGAAAAGAAGATGGGTTAGGTGATGAAGATTTTGACAAGCCACCAGGTCCTTCTGCTCCTCCTTCATTACCACTCCTTGCTTTTGCTCCAGGAATGCTTGAAAATTCTGGTTTACAAAATGAGAAACCTGAGATGGAACCTTTGCCATGGAGGCAAATACTGTACAGCCACAAAGAAAGTAACAGTCAAGGACTCAAGATTATGCAACAAATGAAGCAAGTAAAGGAAGAAAGATGTCAGTTGGAAGAGACTAGAGAAGAACTGTTAAAAAGAGTTAAAAGTTTATTTGAACAAAGCAAAATGAAAAGATATCGTGTCCAGGAAGCTTGGAAGAAAAAATATTTTGAAACCAAGAAAATCACAGCTTCTTTGGAGGAAGTTTTAACCAAACTTCAAGAAGATTTAGAACTTTATTATAAAAAATTGCTCATGCAGCTAGAAGCTAGGGAGATCAAGATGCGGCCCAAAAATCTGGCAAATATGGAAGATTCAAAGAATAATCTAATAATCCAAATCACGGAGGTACAGCATGCAATTGACCAACTAAAGAGAAAACTGGACACTGACAAAATGAAACTCATGATAGAAATTAAGATGAGAAAACAAGCAATTTCAGACATACGAACATTAAAAATGGAACTGGAACAGAAGAAAATGAAGACACCTTTAAGCTCCTAGTCAAATGTATTTACTTAGAAGTGTCTTAGTTTTCAAAATGTTTAGACTTATTGGAAGACTGTCCATCCATTGTTCTTGCTGATGTTTCTTTATAAGCCTTGTATTTCTATTCCTTTATTTTTCATGCTGAGTTTATGAAGTGACTCACAAAATGTTAAGCACAGTATACTTCTCCAGTACCTGGAGGATCTGTGATTTTATCAGAGTGGGTGGTACCTCCACTGAAACAGATCATACCTCCTCCACAAGTTGGGAGATGGATTTTGAGAATAGCTTTAGTTTAAAAAAAAAAGGTAGGAAGGAAGGAAAAAAGAAAGAGAGAAAGAAAGAGCAAAGTGGAAAGCTAAGTAATTTGTTCAGGGCATTATTTAGTTATTTTTGAGTACTTCAAGAAAACTGGATTTCATTTTACAGTAAAGTATTGCATTATTAAATTGCTGGGTTTAAAGATAATTCATCTAAGAATTAAGAATAAAGGCCTATTATTAGTCTTAGCAAACCACCATGTCTTGGTACAAAAGGCTACATTGATTTTTTTTCAATGTAACCTTGATAATTAAAAGAATAATCCTTTTATTTCATTTTAACTAAACAGACTAAGAATCTAAGACTCAGGAAATTGAGATTACCATTTGGAGCACTCAGAGGAAACTCCTGGGATTAGTATCCAAGAACTGACTTATTAACATATTTTAGAAGCATAGAATCCATCAGTAATTCAAAATAAGTTATGAAACATCATCCTTTTGAATGGATGTTCCAGGGCCTCTGCCATAAGCAACCTTGTAAATTGGGAGCAGAGATCTTAAATATGAACTAGACCCAGCAAGGATGGTCAAATTTTTACTTGCTTTTATTCTGATTTATGGGAAAAACCACTAAGGAAGCCTAGATTTCTATTAGCCCAGGGTTCACAGGAATAGGTTTGTGATGCCCCTAGACAGTTATACAGCCAGTGCCATCAAAATGGAAATAATAAATTTGACATTTTCCCGATGCCTATAATGTACCATATGAAAAAGCAGATAGTTCTGAAGTGAAACCTGGCTAAAGGTTTAGAAAAGTTATAAACATTAAACTACTGTGTTTTAGAAATAGAAACATCAGTTCATAAACTAATGTCATGAGGTTAAAATTAGATTCCAATGTGGGAAAATATTGTAAAATTTTTTTTAAAAAAACTAAGCAATAAGGTTGCCAATGAATAAATTACAGATGCACAGAAAAGGATCTTAGGAGAATTGTTTCATCAAGAATAGCATAAGAATAATATCAGATTATCCGCTAAGTTATCCCTATAGTAAATTTAATAATAATAAAATTCTTCTTGAAAATATCTGTCTCAAAAGCATAATTTAGCTAAAAATGTAGGCAACACCACCATACTAGTTTAAAAGATTATCTTTTAAATTCTCTAGGCCAACTCTGTATCTTTTATCTTAGAGTTACTTGTCTGAAGGTTTGGGATGAAGCAAAAAGCAAGTATCACAGGGCACTGAGGTGCTACTTGGAAATAAGAATCATTGACCCAACAGCCCATCCTTCTTTTAACAATACATTGGTCCTAAGGAGAAGACACTATATATCAACCAACTTTAATATTAGGCTTATTGGACAAATAAAATTACAGAGTGAATTGCTTCTCAGAGAATGGGTATTTAAAAAAAAAATCTGTCCTAAGCAAACTAGGCTTTCCTTTACAAGTCTTAGAGCATTTTGCATAGTTTATAAATATGTAAGCATACATGTTAATATCATGTACAAAAGACATGAACATAATAAAATTATGAAAATACCGGTTTATTAAGTGACAGATAAAACATCTTATAAAATAAAGAAGATTATTTCATACT
>JN080695.1 Uncultured bacterium clone HI04_FZZ71GH04EJVXU 16S ribosomal RNA gene, partial sequence 
GATCCTGGCTCAGGACGAGCGCTGGCGGCGTGCTTAACGCATGCAAGTCGAACGAGAATCTGTGGAAAGAGGATTCGTCCAATTGAAGCAGAGGACAGTGGCGGACGGGTGAGTAACGCGTGAGGAACCTGCCTTTCAGAGGGGGACGAACAGTTGGAAACGACTGCTAATACCGCATAACACATTGAGGTCGCATGGCCTTAATGTCAAAGATTTATCG
>XR_008021246.1 PREDICTED: Diospyros lotus uncharacterized LOC127792942 (LOC127792942), transcript variant X2, ncRNA 
ATGGATTGGAGGGAGTGCTCCGAAATCAAAATATCTAAAAACAATTATATGAAACGAACGAGAATTTCGATACGATTATTATGACATCGAAAAAAATCTGATCAGAAACAGTTTTTTGGGCAGCTAAAAATCAGGCAGAAAATCGAATCGTCGTAATTCGTTCACAAAAAGTCAATTGAACACAAAATACAGTTTAATTTAGTTATTGGAACAACCTTTTGGTTGTTTAATGTTGAAACAAAAGTACTAGCGATCTTATCGAACAATAGGACGTAAGCGTAATTTCTTCATTTTTCCCGACTTTGCTCGAAAAAAGAAATTTCCTTTTTTTTTTTTTTGTCAATTTTCAATGGTGGAATGAAGATAATTTCATATGGTTTTAAGTGTAGTTTTATTTGGAAGTGTAATTGAAATATTCAAAAGATTAGGGGTTTAACTTGATTTTCGGTACAATTATGAGTAACCGAATGGATTGGAGGGAGTGCTCCGAAATCAAGATATCTAAAAACAATTATATGAAACGAACCAGAATTTCGATACGATTATTATGACATCGAAAAAAATCTGATCGGAAACAGTTTTTTGTGCAGCTAAAAATCAGGCCGAAAAGACGAATCGTCGTAATTCGTTCACAAAAAGTCAATTGAACTCAAAATACACTTTAATTTAGTTATTAGAACAACCTTTTGATTGTTTAATGTTGAAACAAAAGTACTAGCGATCAAATCGAACAATAGGACGTAAGCGTAATTTCTTCATTTTTCCCGACTTTGGTCGAAAAAAGAAATTTCTTTTTTTTTTTGTCAATTTTCAATGGTGGAATGAAGATAATT
>XM_038964517.1 PREDICTED: Salvelinus namaycush extensin-1-like (LOC120020894), mRNA 
ATGTCCAAACCCTTCCCCAGAGGCCTGCCCAACCCCTTTCTCAGAAGCCTGACCAACCCCTTCCTCAGAAGCCTGCCCAACCCCTTCCTCAGTGGCATGTCCAACCCCTTCCCCAGAGGCCTGCCCAACCCCTTCCTCAGAAGCCTGACCAACCCCTTCTTCAGAGGCCCGCCCAACCCCTTCTTCAGAGGCCCGCCCAACCCCTTCCCCAGAGGCCTGCCCAACCCCTTTCTCAGAAGCCTGACCAACCCCTTCCTCAGAAGCCTGCCCAACCCCTTCCTCAGTGGCATGTCCAACCCCTTCCCCAGAGGCCTGCCCAACCCCTTCCTCAGAAGCCTGCCCAACCCCTTCTTCAGAGGCCCGCCCAACCCCTTCTTCAGAGGCCCGCCCAACCCCTTCTTCAGAGGCCCGCCCAACCCCTTCCTCAGATGCCTACCCAACCCCTTCCTCGGTGGACTACCCAACCCCTTCCTCGGTGGACTACCCAACCCCTTCCTCAGACGCCTGCCCAACCCCTTCCTCAGACGCCTGCCCAACCCCTTCCTCAGATGCCTGCCCAACCCCTTCCTCAGTGGACTGCCCAACCCCTTCCTCAGCGGACTGCCCAACCCCTTCCTCAGATGCCTGCCCAACCCATTCCTCAGCGGACTGGCCAACCCCTTACTCAGATGCCTGGCCAACCCCTTACTCAGTGGCCTGCCCAACCCCTTTCTCAGTGGCCTGCCCAACCCCTTCCCCAGAGGCCAGCCCAACCCCTGA
>XM_033401886.2 PREDICTED: Orcinus orca KAT8 regulatory NSL complex subunit 3 (LOC101288842), transcript variant X6, mRNA 
TATATTTTTAAAACTCCAGAACATTATGAAGTCGTTGCAAAACTTTTGTTTAACACAAACGAGACGTCAAGGGCTTCCGTGAGGCCCACGTTAAGCAGCTGTTCCTGGGATGCTCACGCTACTGCTGGAGACGGCTCTGGGAAGCTTTCGAGAATGGTGACTAGCATGCAGGTACCCGTTCTCTGACTTGCTGCCCCTCTTCTGACATGGCCCACCGCGGTGGGGAGAGGGACTTCCAGACGTCAGCGCGGCGCATGGGCACCTCGCTGCTCTTCCAGCTTTCGGTGCATGAGCGGGAGCTGGACCTGGTGTTTCTGGATCATAGCTATGCCAAGCCGTGGAGCGCCCACCCAGATGCCAGTAGTGCCCGCCCCACCCGCATGCTCTTTGTTACTCCCCGGAGGCAGCACGAAAGTACCATCGAGTCAGATGTCCCACTAGATGTGGAGACAGTCACGTCAACCCCTGTGCCACTTTATGACAATCAGAAGGCACGCAGCGTGATGAATGAGTGTGAACGGCATGTCATCTTCGCCAGGACCGATGCGGATGCACCTCCCCCTCCAGAGGACTGGGAGGAGCACGTCAACAGGACTGGCTGGACAATGGCCCAGAACAAGCTATTCAACAAGATCCTCAAAGCCCTGCAGTCTGATCGGCTTGCCCGCTTGGCCAACGAAGGGGCTTGTAACGAGCCAGTGCTGCGCCGTGTTGCCGTGGACAAGTGTGCGAGGAGAGTGCGGCAAGCTCTGGCGAGTGTGAGCTGGGACACCAAGCTGGTCCAGTGGCTGCACACCACGCTGGTGGAGACCTTGAGTCTGCCCATGCTGGCCGCCTACCTGGATGCTTTGCAGACACTGAAAGGGAAGATCCCTACCTTGATTGACCGGATGCTCGTGTCGTCCAACACGAAGACCGGGGCTGCTGGAGCTGAGGCCTTGTCCCTCCTACTGAAGAGGCCCTGGGACCCCGCTGTGGGAGTGCTCTCTCATAACAAACCAAGCAAACTCCCCGGCTCTCCTCTCATTCTCATTGCCTCCTCCGGGCCCTCCAGCTCCGTGTTCCCCACCTCGCGCCGCCACCGCTTCTGGCAGTCTCAGCTGTCCTGCTTAGGCAAGGTCATCCCTGTTGCCACGCATCTGCTGAACAATGGTAGTGGAGTAGGAGTTCTGCAGTGTCTGGAGCACATGATTGGGGCAGTGCGAAGCAAAGTGCTAGAGATTCACAGCCATTTCCCGCACAAACCCATTATCTTGATTGGCTGGAATACAGGAGCCTTGGTGGCCTGTCACGTGTCGGTGATGGAATACGTCACTGCAGTTGTCTGCCTTGGGTTTCCTCTGCTTACCGTGGATGGCCCCAGAGGGGATGTGGATGATCCCCTCTTGGATATGAAGACTCCAGTCCTCTTTGTCATTGGTCAGAATTCCCTGCAGTGTCACCCTGAAGCCATGGAAGACTTCCGGGAGAAGATTCGGGCTGAGAACAGCTTGGTGGTGGTTGGGGGAGCTGATGATAATCTCAGAATAAGCAAAGCAAAGAAGAAATCGGAAGGGTTGACTCAGAGCATGGTGGACAGATGTATTCAGGATGAGATTGTGGACTTCCTGACTGGAGTGCTCACTCACGCGGAGGGGCACGTGGGCTCTGAGCCTCGGGATCAAGATGCTGAGAAGAAGAAGAAGCCCCGGGACGTGGCCCGCAGAGACCTGGCCTTTGAGGTCTCTGAGCGGGGCAGTCGACCTGCGTCACCAGCTGCCAAGCTACCTGCCTCACCCTCAGGCTCGGAGGATCTCTCCAGTGTGTCCAGTAGCCCCACCTCCAGTCCCAAGACCAAGGTGACCACAGTGGCCTCTGCCCAGAAGTCCAGTCAGATCGGAAGCACTCAGCTGCTGAAGAGACACGTGCAGCGGACAGAGGCTGTGCTGACCCACAAACAGGCTCAAGTTCCTGTTTCATCAGAACAAACGGAGGAAGCCGAGAAAGAGGATCTCAGGGTCCAGCTGAAGCGGCACCATCCCTCCAGTCCTCTTCCTGGCAGTAAGACCTCCAAGCGACCGAAGATCAAGGTGTCCCTTATCTCCCAAGGGGACACAGCTGGAGGGCCTTGTACTCCTTCCCAAGGAGGAGCTCCAGAAGCCGCAGGAGGGAAGCCCATCACCATGACACTGGGGCAAGCTTCCACAGGGGCCAAGGAGCTCACAGGACTCCTCACCACAACCAAGTCAAGTGCTGCTGAAGGGGGAGTCTCAGCCAGCCCAGCGTCCTCAGTGGTCTCTAGCAGCACTGCTCCCAGTGCCTTGCACACACTCCAGAGCCGCCTGGTGGCCACCTCTCCTGGCAGCTCCCTCCCAGGGGCCGCATCAGCCAGCAGCCTCCTCCAAGGCCTCAGCTTCAGCTTGCAGGATATCAGCAGCAAGACCTCTGGCCTCCCAGCAAACCCCTCTCCCGGGCCAGCCCCACAGGCCACCAGTGTGAAGTTGCCCACCCCCATGCAGAGCCTGGGTGCCATCACCACGGGCACCAGCACCATTGTCCGTACCATTCCTGTGGCCACCACTCTCTCCTCCTTGGGTGCCACTCCTGGTGGGAAGCCCACAGCCATCCACCAGCTGCTGACCAATGGGGGCCTCGCCAAGTTGGCAAGCAGCCTCCCTGGCCTGGCTCAGATCTCTAACCAAGCTTCAGGCTTGAAGGTCCCCACCACCATCACTCTGACACTACGTGGCCAGCCCAGCCGAATCACCACACTGAGCCCCATGGGCTCAGGAGCAGCCCAGTCAGAAGAGCCCACCTCCCAGGCGCTGCCCTCCAGCTCACAGCGCCTGCCTCCAGCGCCCTGAAGATGCCATGCGATATGTCCTCCTTTACCAGGTTGGTGACGGCTGCTGCACGGTGAGGCCTGGCACATGTGCTGTCCTGCTGAGCTGTACACTTGTCTGAAGACCTCTTTAAGACAGTCATTTTTGCCTCTCTGCCAACTGTCTTCAGGGCTGGGCCTCTGGGTCTTACGTAACCATTAGACAAGGTGATATGGCGCCAGCAGGGGGGGCCTTGTCCTTTAGCATCTGCAGGTCTGGTTCCCAGAATCTCCAGGTCCTCAGCAGATCTGGCCGTGTATGGATTGGAGGCACTTCTTCCCCAGCATTAGCTGTAACTTGACCCAAGTAGCAGTGTGGGACTGCTCACTGCATTTTAATAAAGGAGCTCCCCTTCGAAGTCTGTACTGCCCCGTGCCAAGTTGGGAGGAGACGTCCGTGTGGTCTGGGACTGAGAGCCCTGTGCTGAGGACCGGGATCATCCTGGCCCACTGGCCAGTGGTTCAGTGCCAGAAGGGCTTGTTTTGCACATCACTGTTGCCTTCACCAAGCAGCCATGGGAGAGTGCTCCCCGTGCAGCTCCCTCCTTACGAGCCACACTGGATACTGAGTACCTGCTGAGACCTGGGAACTCTTCATTTCAAACCCACGATAGGGCACAGAGAACTGGGCTGTCATCTTTCAGTCCCTTTGGTCACCTGTAGATGTTGGGACCAGCAGTCGCCAGGAGGTGAAAGCTGGCTTCTTTCTTTTTTCCATCATGCTTTGGGCAGTTCTTGTATCCAGAAAGCCTGCAGGTCCAGAAAGGCTGAAGAAGAGGAAGGGAACAGCAGATGAAGTGGCTTGAAGGACACGTCAGTGGTGAAAACGATTTGGGCTTGAGGCTTAGCATCTGGTACCTAAGGAGCCGTTGATTCAACTGGAGATGAGAAGAATTTGCCAAGCCAGAGGAGAGAAACTTCAGCCCCTGAAATTTCTGTCTCCAGTGCTTGGAAGTGGAACAGGGGTAACTGCTAAGTTAACGTCTTGGCCGTCCCATGAAGCTCAGGCATCAGGATGATGAAGGCCATGCTTCAGTGTTTCTGTTTCAGCTCTGTGCAACTTTTTGTCTTCTTGCTTAGAAGTGGGAAAATTATTGGTATTGACTCTGCTGTGCAGGGCTCTTGGTACCAGCCTGAGCCCTGGAGGTGGAGGTCTCTGGAGAAGTGATCACTGAAGATGGAGCTCTGAGCCCCTCCTTACCTCCTCACAATACTTGTGTGCAAAAAGTATTTTAGATTTGGCTGACAACCTATCCTCCAGAGCAGGCTCCTTTCCCTTCCATACTCTAGAATGTTTCCAGCCAAGGCGATGAATAAGGCAACCCAGATATAACTCTTCAGTATCTGTACTGAAGGCAGGGAGGGCCCACAGCGTGCCGTGGCTGGACTTGTGGTCCAGGGTCCTGACCCGTATAGTGCATCCATCGTATATCCAAACCAGGCCACCTGCATTCAATCCAGGAGCCTCACCTCCAGTATGAGTGGCAGCCAGGAGGGAGTACACAGTGTGCAGGATTCTCAGACAAGGCCATTTGGGGTGGTACAGGCAGGGCCAGGGACTGTGTATGATAGGAGTGGAGTGGGCAGATTATACACCATACGCTTCCTCCCCGACCTCCTGCAGAGCTGGTCTCAGCAGTGACTCACACAGAATTAGGCTGCATCCCTGTACTAGCTGGCAGGTAGCTGCTTTCTGAAATTCAGGAGGCGTTTAGTAAGTTGGAGGAAGATACGAAATCTGAAAGAGACATCCAGTGTCAGGGGTTTAATAACTTTACAGGTAGGATAGTAACACACCAATAGGAATTGAGGATGGTGAAACTGAGACTATGTGAAGTTTTAGGAATCATTCAGGACAGAGGTTCCTGAACAACCCATTCATGACTTAAGAGTGCAGTCTAGACAGCACTGGAGGGGCTGCTCCTGAAAGATGCTGGCCCTGTGTGTGCTGGGGCCAAAGGAGAAACTAACGCATCGTCCTGCATTTGCGTAAATCCTAGTATGCTTCTCATGGATGATTTCCTGAGGCTTGTGTTGTACACCTTAAAGAATGCCAAAAGGAGAAGGGAAGTTGTAAGGACATTGATTCTTCTGCACCCTGGAGGGACAGGCCTAAGGAGGAAGTGGTTGAAGTCTATACAGTCATGTTCCCCAATTCCATACTTCTCCAGCCCTTGAAGTGTAAAAGGAAGCTTTCCTCCGCCTATCATGTAGCAAACCTGGAGTCCATAACCTCAGAAGGTGATAACTACTGGCCGAAAGTGTAGAAGGATCAAGAGGGCTTTAGCTGATTTCTTGGATGACAGATACATGTTGATGCTCTATGGAAGATGTCCTTGTTTTGAGAAGAGGTCACTGATGGAGGAAGACCTGTCTGCCCTTGGCTCTACCACTAGAACAGTCTTGGGCTGGATGGGTTATAGAGCTGAGCTGCTGTGACGGTTCTGTTCTTCCATTAGCCAAAACAATTAAAAATAAAAACAAATTTGGATTGCTTCAATG
>XR_003982306.1 PREDICTED: Sparus aurata uncharacterized LOC115573581 (LOC115573581), ncRNA 
CACCACTTTGTACCTCAAGAGGCGATAGTACAGAAGTGGGCTGCTGCAGAAACATGGCGGTGTAACATGGCAGACTCCGCGACAGAGGACCTGCTTCTTTTAAGGTAATCCCAGGAAAGTCTGGCTGGAGGCTGGAGACACGTTTGTCAGGAAAGTACGTGCCTGATCTGATGTGACCCCTCCAATCATCAAACTGTCAGATATGATTGAGAGGGTAGAGTCCACTGCTCTGACTGTATGGTATATCACTACGTTGGTGATATGAACTGTGAAGGTATTAA
>XM_040635235.1 PREDICTED: Ursus maritimus RNA polymerase III subunit E (POLR3E), transcript variant X3, mRNA 
CACGTGTCCGCTGGAGTTTCTCCACCAGCAACATGGCCGCTGCCTAACAGAAGAGCCGGGCCGCCGCCACCTCTGCAGCCCGCGGGTACCTGGGCCGTTGCCGCCGCCCGCGCGCGGCCCCCGCGGAGAGATTGAGTCCAACGATCGTGCGGCTGGCTCCCCCCTAGTATGGCCAATGAAGAGGATGATCCAGTCGTACAGGAGATCGACGTGTACTTGGCCAAAAGTCTGGCAGAGAAGCTGTATTTGTTTCAGTACCCTGTGCGCCCAGCCTCGATGACCTACGATGACATTCCACACCTCTCAGCCAAGATCAAGCCCAAGCAGCAGAAGGTAGAGCTTGAGATGGCCATCGACACCCTGAACCCCAACTATTGCCACAGCAAAGGGGAGCAGATTGCACTCAACGTGGACGGCGCCTGCGCGGATGAGAGCAGCACTTACTCCTCGAAGCTGATGGACAAGCAGACATTCTGTTCCTCCCAGAGCACCAGTAACACAGCCCGTTACGCTGCCGCACTCTACAGGCAAGGTGAGCTGCACCTGACGCCTCTCCACGGCATCCTGCAGCTGCGGCCCAGCTTCTCCTACCTGGATAAGGCGGACGCCAAGCACCGGGAGAGGGAGGCGGCCAACGAAGCAGGAGACTCTTCACAGGATGAGGCGGAAGAAGACGTGAAGCAGATCACGGTGCGGTTCTCCCGTCCTGAGTCAGAGCAGGCCCGCCAGCGCCGCGTGCAGTCCTACGAGTTCCTGCAGAAGAAGCACGCCGAGGAGCCCTGGGTGCACCTGCACTACTACGGCCTGAGGGATAGCCGCTCTGAGCATGAGCGCCAGTACCTGCTGTGCCAGGGTTCCAGCGGGGTTGAGAACACAGAGCTCGTCAAGTCACCCAGTGAGTACCTCATGATGCTGATGCCGCCCAGCCCGGAGGAGGAGAAAGACAAACCCGTGGCCCCCAGCAACGTCCTGTCTATGGCCCAGCTGCGCACGTTGCCCCTGGCCGATCAGATCAAGATCCTGATGAAGAATGTGAAGGTCATGCCTTTTGCCAACCTGATGAGCCTCCTCGGCCCCTCCATCGACTCTGTGGCTGTTCTGCGTGGCATCCAGAAGGTGGCGATGTTGGTCCAAGGAAACTGGGTTGTGAAGAGCGACATCCTGTACCCCAAGGACTCCTCCAGCCCTCACAGCGGCGTCCCTGCCGAGGTGCTCTGCCGGGGTCGTGACTTCGTTATGTGGAAGTTCACGCAGAGCCGGTGGGTGGTGAGGAAAGAGGTGGCGGCAGTGACTAAACTGTGCACGGAGGATGTGAAGGACTTCCTAGAGCACATGGCCGTGGTGCGGATCAATAAGGGCTGGGAGTTCATACTGCCTTACGATGGGGAGTTCATCAGGAAGCATCCAGATGTGGTCCAGCGGCAGCATATGCTGTGGACGGGCATCCAGGCCAAATTAGAAAAAGTGTATAATCTTGTGAAGGAAAGCTTGCCAAAGAAGCCAGATGGACAATCAGGGCCTGCTGCTCTGCTCTCTGGGGACCAGCGGGTCCAAGTGGCCAAAAGCAAGGCCCAGCAGAACCACGCACTGCTGGAACGGGAGCTGCAGCGGAGGAAAGAGCAGATGCAGGCGTCCTCGGTCCTGCCTGGCGTGCGGATCAAGGAGGAGCCCATGAGTGAGGAGGGAGAGGAAGAAGAAGATCGAGATGCAGAGGAAGACGAGGAGCCCATGGACACCTCTCTTGGTGGCAGCCTCCACAACAGGCTGGCCAATGGGTTGCCTAGCGGGCGGGCGACAGGCGGGGACAGCTTCAATGGGCACCCGCCCCCAGGCTGTGCCAGCACCCCCGTGGCCCGGGAACTGAGGGCCTTCGTGGAGGCCACCTTTCAGAGACAGTTTGTGCTCACGCTGAGTGAACTCAAGCGCCTCTTCAACCTGCATCTGGCCAGCCTGCCACCTGGCCACACACTGTTCAGTGGCATCTCGGACCGCATGCTGCAGGACACGGTGCTGGCCGCCGGTTGCAAGCAGATATTGGTGCCTTTTCCCCCCCAGACTGCTGCGTCCCCAGATGAGCAGAAGGTGTTCGCCCTCTGGGAGTCTGGAGACATGAGCGATCAGTTATCATGAAACACCAAGTCTAAACTGCTTGTCCTCGGCTGGCGCGTCCCTGGCTTTGTTGTCTTCTTCCTGGGGTCTCGGG
>XR_001152071.1 PREDICTED: Microcebus murinus uncharacterized LOC105866893 (LOC105866893), ncRNA 
TGCTAGCTCCTCGTTAAGGAAGTGACAAGGTTGTAGACACTGGAGGTGGCTCAGTTACAACTGCCTTTACCGTGTGGCTGAGAATTCACTCCCTTCCAGGTCTGGACCTCATGGTTCTGTCACCAAATCGGCTGCCCCTGGATAGAACAAAAAGGCAGAGGCCCTTCTCTTCTGAGCTGGGACACCCATCGTCTCCTGCCCTTGGACATGAGAACTGCACATTCTCCGGCTTTCAGACTCTGAGACTTACATCACTGGCTCCCAGGTTTTGACAACTTTGGACTTGAACTGAGCTATGCAACTGGCTTCCCGGGTGCTCCAACTTGCAGTGGGACTTCTTCCTCAGCCTCCATAATTGATGAACAGAGCAAACCTTATCACCAGAGATGGAGAATCAGAACCAAGATGAGTCTGCACAAATGAAGCTTACTAAAATTATACTTATCTTCCATTCATTTCCCCCACATCCA
>XM_037676314.1 PREDICTED: Nematolebias whitei ALG2 alpha-1,3/1,6-mannosyltransferase (alg2), mRNA 
TCTCACTAAAATCGTGTGCTTTAAAGTGAGAAGGAAATAGGCGCCATTGTGGTCCAAACACGAAGCTCGTGTAGCTTAACTCTAACGGGCAATTAGAGCCAAAATGGCGTTTAACTGTTAGAGATTCTTGAAATCGGCTGACAAGTAGGCGAGTTTAATCAATGGTTTCTAAACCTTGACTGGATAGAGGAGAGATTCAAAGGATGGCCCGGGTGGTGTTTCTCCATCCGGATCTTGGTATCGGAGGAGCAGAGAGGCTAGTGGTTGATGCCGCTGTTGCCCTGAAGTCCCAGGGGTGTAGTGTTCAGATATGGACGGCCCATTATGATCCAACTCACTGCTTCTCAGAGACCCTGGACCCAGACCTGCCTGTGGTTTGTGTGGGTGACTGGTTACCTACCAGTGTGTATGGCTACCTTCATGCTCTCTGTGCATATATAAGAATGATCTATGTGGCTCTGTACCTGGTCTTCCTCAGTGGTGTTGAGTATGACGTCATCTTCTGTGATCAGGTGTCTGTGTGTATACCTGCACTGCGGTTGTCCCGTCACAGAAAGAAAGTTCTGTTTTACTGCCACTTCCCAGACCAACTGCTGACCCAGAGAACGTCGGCCCTAAAGAAATTTTACAGAGCTCCCATTGACTGGTTGGAGGAACGCACCACTGGCATGGCTGATATGATTCTGGTAAACAGCCAGTTCACCGCAGGCATCTTCAGGGAGACATTTCAGAGTCTGAGCAGGGTCCAGATAGACGTCCTGTATCCCTCCCTGAACACACAGACCTTTGACCAGGGGTCCACTGAGGCTCAGGGCCTGCAAGGTCTGCTTCCTGAGGGAACTTCTCACATGTTTCTGTCTCTGAACCGATACGAGAGAAAGAAGAACCTGGGTCTGGCTCTGGAGGCTCTGGCAGTCCTGAGGTGCAGCCTTACACCTGCTCAGAACGCAGGTGTTCACCTGGTGGTCGCGGGAGGCTACGATGATCGCGTTACTGAGAACGTTCAGCACTACAGTGAGCTGAAAGAATTAGCCGAGCAGCTCTACCTGATGGACTGTGTCACGTTTCTGCGCTCCCCCTCCGATTCCCTGAAGGTGGCGCTGCTGCGGGGCAGCACCGCAGTTCTTTACACCCCCAGCAGGGAACATTTTGGGATAGTTCCTGTGGAGGCCATGTATTGCTGCTGTCCTGTTATCGCTGTGAACTCTGGGGGGCCCCTGGAAAGCATAGCAGACGGGGAGACAGGCTTCCTGTGCGAGCCCACCGCTGACGCCTTCTCCAAGGCCATGGAGAGGCTTATCAAGGAGCAGCAGCTCTGCAGGGACATGGGGCAGGCTGGGAGGAGGAGGGTGCAGGAGAAGTTCTCTCTTCAGGCCTTCTCAGACCAGCTCTATGGGTACATTGTCCGGCTGAACCAGTGATGGGAAGGCAGGTGAAACCTATGACTGCACAGAGGATTTAAGTGTAAATGTGAAGGGAGGTGGGGGTGTATTAAGAAGACAATTAATCAGCATTCCACTGGAGGGGTTGCTGA
>XM_034454558.1 PREDICTED: Crassostrea gigas ankyrin and armadillo repeat-containing protein-like (LOC105340499), transcript variant X6, mRNA 
TCGAGAATTAACGAAAGTGACCAATCAAACTTTCGCTTCTATTTGTACATCGTCGTCGACACCAACAGGTTGTGGAAACGACTGCAGTAGGGCAAAATACAAAATGCACACAGGATCTATAAATAGCTGACATGGCCACTATGAATGCTGGGACCCCCCAGCCGGGGGAACCCACGGACGAGGCCCAGCTCCAGGCCAAACTGGAACGCTTGGCCAGTACGTACTTCGAGAAGTTCTCCACCCCTGTGTTCAGAATGCAGGAGCTGATTGGCTTCCACAAAAACCACTGGCTGCTCTCTGACGATTTCAAGATGGCGTACGATCAACCGGACGGCCTCATTAAAGGTTTGAACCCGCTTAACTCCAACAGCTGTGTTCTGATGGTGCCGGAGGACCCAGTCCTAGCAGAGAATAAGCTTGGCCTGGACTACCGCGAGGTTCACCAGGTGATCCGGGAGCTGACCTACGGGATCTACGTCCTGAATCAGACCCCCAGCATCTCCCTGGAGGCACTGTATGATCAGGGCACATGGTGTAACCTACCCCCGGGCTTCAACGACACTCACATCGGTCAGCTGTTGATCAGCGTTGACTACATGATGAAGTCCCTGTGGCATGGAGCTTACTTTCCCAAAGAGAAGAGGACCAAATTCAACGACAAATGGAGGGAGCACTTCCAAGTGTCCAAACAGAATGGAAAACCAGAGAAAGAGAAATCCTTCCTCTCCGATTTCCTCAGTCATGGCATGGTAGATATGGGAAAAGATCCGGATTACTGTGACGCGTACAATGACCTTCAGTTCGATAACGAGGACGACCCAGACATGATAAAAGAGCGAATTCACTTTATGAAGCACATAGAGGACATTTGTATGCAGATGACGCTGTACCAGAAAAAAGTGATGCATGAAAAAGACATCTACATGATGGAGGCCGATATGACCATATCCAGTATCGTTCGACTGCTGGACGATCGGATAAATCACGACGACTACGAGCGTGTGAATACGAGACTTCAAATGCATGAAAACATGCTGAGGGAAAACCTTATGAAGAAGATGGACATCAGGCGACAGTTGTTCATTCTGAAGTTTGTGAGTTTTCTGACGCCGTTTTTGATCGGAATGAGGAAGAGAATGAAGATTCCCGACACTACACGATTTCTGCCAGATCTCTCAGAATCAGAAACAGAGGACCAATGTAAGACAGAAGAAGAGCTGCCACCATTAATGCTGGGAGACGACTTTAAGTGTAAAAACTTCTACCCCGACAAAAACAAGTACTTTCACCTACACGGGGGAATAAACATCGACTTTGAGACAGACGATCTAGAAGCGACTCCAAAGGAAGTGACCAACAGATACTCGGATATCCTAGCAATGGCTGAGCAAGGTTTTATAAAAGCCATTTCCATGGAAACTATCAAAGAGCATTATGAGGTGCCAAAAATTACAGTGGACGGAAAAGAGTATTACCTGATCTTCCTGGAGTTTGAGACGTTCTTTAACCCCCAACAGCCCGCCTGGATAAAGGCCTTCAACACAAAGCTGACCATTGACCTAGAAAGAAAGTACCTCCCCCTACAGGACACGCCCATGTGGGACATCTTTGTCAAACATTTTGGCAAGAAAAAGACAGGAAAGTTAAAGGCTCAGATGACGGGACCGCGAGCGGCGGCCATTAGAGGACTGGTCATCATATTTGTCCATATGTGTCGCAAAACTCTGGGACAGCAGATGTCAAGGTTGACAAAGCAAGACGAACACGGTCTATCGCTTTTGCATCATGCTGCGATGAACAATCGGCCGCAGATAATTGTCAGTCTGCTGCGACAAACTGTGGATATCAACTCTAGACGCAACAACATCTTGTCCACAGGTCCGACCGGGCTCCATATAGCTGCCCGTTGTGGGGCCTTGGATGCTGCTGCCTGTCTGTTGGCCTGTTGTGCGGGACAGACATTGTACGATCAGGACGGATGGGCCCCGATCCACCACGCTGCTTTTTTCGACCACGAGTCTATCATCAAGTTGATGGCCAGGAGGAACAATCCAGTCATAGAGCTGCTGACTAGGAATGATGTTCGGTCGACACCTCTGTTGCTAGCCGCGAGTTCTGGAGGACTCTCTGCCGTGAAATGTTTGATCAAACTCGGAGCGGACATTTCCCGGCTGGACGGGGAAGGGAACGGAATGGTCAATCTCGCTGCCATGAGATTCCACACTAACGTCTTGGAGTATCTCATTGAGTGGGGCCACCAAAAAGCCCCTGTGTGGAAGATTCTTGTCAAAATGCTGACTGATCCAGAAGTGGAAAAGAAAGACAGTGCTGTCAAATGTCTGGAGGTCTTGTCTACGTCAAAACCGGAGCACTGGAAATCCATTCTGGAAGCAGGGGGTATCCCAGCCTTGGTGACCTTGCTGAGTTCAGACAATGAAGTCCTCCAATCAGTGGCCGCCTCCGTCATCGTCAACATCTCGGAACACGCGGAGGTTCGTCACGCTCTGACGGCTGCCAAAGCCGCCCCAATTCTGATCCAGCTGCTCAACTCTCCAGACGATAACATTCAGTCTCGTGTGGCCATAATCCTGTCGGACATTGCCAGTGTCCAAGGAAACCAGTCGCTTATTGCGGACGAAGGCGGGATTCCCCCGCTGATTCATCTCATGGACTCTGAGCTGGAGGAAGTCCTGATAAACACTGTCAATGCCGTCCGTGTTCTCTGTGCAGGAAATCCCCCCAATCAGGACGCGGTGGCGGAAAACGGAGGAATCGCATTTCTTCGCGAGTTTCTGACATTGGATTCAGAGAAATTAAAAGCGGCAACAGCAGCATGTATTGCGGCGATCTCTTCAGGAAATAAAAAGAACCAGGACGCTCTGTTAGAGGCGGGAGCTTTAGAGCCCTTGGTGGATATAATTAATGGAACAGCTAATGAGACGGTGCGGGTGAAGTGTGCTAATGCCATCGAGGCGCTGGCCCAGGATAACCTTGCCTGCCAACAGACCTTTCTCCGAATTAAGGCCCCCACTGCCCTCAAAAAACTCCTCAAGAACTTTAATGTGTCGGTGAAGGAACATGGGGCCAAGGCACTCTGGGCGCTGGCGGGCAGCACCACGTCCCAGCAGAAGTACATCGCAGAGAAAACCAGCATCCCCGACATCTGTAGCATGCTACTGGAGGACACTGAGAAACTGCTGCAAGTCGGCTGCATGATGTCGATAGCCTTGGGGAGAGAGAATATCGAGAACCAGATCAAACTAGCTCAGACAGAGGCTTTCAATCAACTCGTCCGTCTGCTGCGGACTCACAAAGACTCGCCTCAAGTCATACTCATGGTCATCCAGGTGCTTGGAATTCTGTGTGTGGGTGTTGCATATTGTAACAACAAAGTAACACAGAGAAAAATAGCGGAAGAAGGGGCTATTCCGACCCTGGTGACCTACTTAAATCAGCCTCCTTCAGAAGAGGTCCAGGTGGAAGTTGCCATAGCGCTGGGGTGCATCGTCCTTAGCAACACTCGTAACCAGGAACTACTTCAAGAAGAACCAGGATTTAACTTTGATGTGCTACTGGATTTGTTGAAGTCAAAGAGTGAAGCTATTCGACTCCGAGCAGGCATGGCCCTGACCATCTTCGCATTTAACAATACTCCGCAACAGTACGCCATCCGAGAGGCAGGCGGCATAAAATACTCTGTCTTCGAACCTTTCCTCAACTCCAGCATAGAATATGATGTCTGTTACGCTGCGTTTCAGATCGTGGTGCTTGCGCGGGTGATTGTCGACCAAGACCAGGTGATGTTGACGGCTCGCGGTGTCACGCTGCTCGTAGAGAAGCTCCACTCCACAGAGGACAATGTGATCGTACTCGCCGCGAGTCTCCTATCGAGTCTCGCTCACACGCGGGCAGGAATCCCTGATGCCATGGTAACCACAGGCGCCATCGATGTGCTAGTGGAAAAACTCTCCTCACGGAATGACCAAGTTCGGAGTGCATGTGCGGTTGCCCTCGGTTACTTGACTTTCAACAGGACTGCTGCGAGGATTTTGTTCAGTGCTTGTCGAAACACTCCTGGATTGTACAAAAAGCTCGACGAAAACATTGGGAAAAATGCCAAAATTAGTCAGGAGTTTGTGCAGGATTTCAAACGAGCAAAGATTGTTGGATTGCCGTCTCAATGCCTTGAGATTAATGGTGGACCTCCAGTAATTCCTCCCAGCAGAAACAGTATGAGACCGATGACTGGTACGACAAGTCGAGCTACCACCGCCCAAGCTACAAGCCGAGCGAAATCAGCTCCGGGGAAGAGACCGCCGCCGAGATCATCCCCTAACCCCAGCGTGGTTGTTGTAAGTACCCCCGACAACAGTCGCCCCTCAACGGCCTCACCCCTCAGGATCCACCCCAGCTCTCTGTTCCGACCTGCCTCCTCCCCCCACACCAGAAAAGGGGCGCGGTCACCCCCAGATGCAACCTTCAAAACGCGGTTATCTTCGTGGAAAGAAGAAATCTGATGAAAATGTTTCTCTCTGAGTTTTTTGTATCAAATGAAATGTAATTCACTTCTGTGTGTTAAATACCCCCAAATTGTATAAGTCTATAAAATTATTATTTT
>HM490822.1 Uncultured Thermovirga sp. clone GE7GXPU01D8TM1 16S ribosomal RNA gene, partial sequence 
GTACGTGTTACTGATCTGAGAGGACGAGGGACCCATGCTTCGGTATGGGAGCGTACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTGCATCCAGTTGCCATCGGGCGAGCCGGGCACTCTGGAGGGACTGCCGGCGACAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTATGTCCAGGGCGACACACGTGCTACAATGGCCGGCACAGCGGGAAGCGGAGGGGCGACCCTGAAGCGGATCCCTTGAAAGCCGGTCCCAGTTCGGATTGCAGTCTGCAACTCGACTGCATGAAGTTGGAATCGCTAGTAATCGCGGATCAGCCAAGCCGCGGTGAATACGTTCCCGGGCCTT
>XR_005682382.1 PREDICTED: Panicum virgatum uncharacterized LOC120691804 (LOC120691804), transcript variant X1, ncRNA 
TCCCTCTTGCCGGCGGCCTCGCCGACGTTTGCCGGCACGCTCGAGGTCGATCCGCTCATGGTTGCGGGCTCCTCTGTTGCCGCTAGGCGTACTCGTTCCTACCTTCGTTGCTGCAACCACGCCCTCCCAGTTGGACCTACGGAACCTTTGTTGCGGCATCCATCCCCTCCTAGATACAGTCCTCGGATTCTGATGCTCCCGCTAGCAAGGTTGCTCTTGCTTCTGTTGGTCAATCGTGCAACTGGTGGAAGGAGGACCACGGTTCTCCATGCTGTGGTGTAGATTAGGCGCTAGGTGCTTGATGTCACTGAAGAGAAAGAAGTAGAGGAGCTTATGTTCTTATGTTCGCTTTGGTGGCCAGTTGCTTATAATTTATTTGATACGGCGGCTTAGGATTATAGTCTTATGTAACCGTGAAAATTGTCTTTGGCAAATTTACTAAGTAGTTCAGAAGACTCACTTTGTATTGTATTGTATTTTAATAATTTATTGTTGTTGTGATCAATCAATATAAATTTGCAATGATATATATA
>JN143486.1 Uncultured eukaryote clone KYD009 18S ribosomal RNA gene, partial sequence 
AGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGAAAACTCACCCGGCCCGGACACTGTAAGGATTGACAGACTGAGAGCTCTTTCTTAATTCGGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCGATAACGAACGAGACTCTGGCCTATTAAATAGACGGTGTATCTTGAAGTATACCGCGCTTCTTAGAGGGACAAGCGGCGTCTAGCCGCATGAAATAGAGCAATAACAGGTCTGTGATGCCCTTAGATGTCCGGGGCTGCACGCGCGCTACACTGAAAGAATCAGCGTGCGATTAGCCTGGTTCGGAAGAATCGGGTAACCCAAGTAAATTCTTTCGTGCTTGGGATAGGGAATTGCAATTATTTCCCTTAAACGAGGAATTCCCAGTAAATGCGGGTCATAAGCTCGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGGATGACTCAGTGT
>XM_052629031.1 PREDICTED: Gossypium raimondii plasmodesmata-located protein 6 (LOC105780626), transcript variant X2, mRNA 
TCTCTCATTTACACTCTTCTTTTCTATATATTCTCTTTTAAACCTTTTTTTGTTTTCTCAATATCTTCACTTATGGCTTTAGCGGCGAAACAATTATCGTCACCTTTTGTTATTTTTCTCATATTATCAATTTTCTTAGTTGGGCCATCGTTTTCCGGCACCGATACTTTCGTTTTCGGCGGCTGTTCGCAGCTGAAATTCACTTCAGGCTCACAGTACGAGTACAACGTCAACTCGATACTCACTTCCCTAGTCAACTCAGCCATGTTCACTTCTTACGACAACTTCACCATGTCAGCTTCCGGTGGTTGCAGTGCCGTTTACGGGCTGTTCCAATGCCGTGGTGACCTAAACAACCGTGACTGTAACCGTTGTGTAGCTAAAGCGGTGAGTCAAATTGGAACTCTTTGCTTTTACTCAACGGGTGGTGTGTTGCAACTCGAAGGGTGTTTAGTTAAATACGATAATGTAACTTTTTTGGGTGTGGAAGATAAGACCGTGGTAGTGAAGAAATGTGGACCGTCGTTCTCGTCTTACTCGGACGCTTTGACTCGGCGTGACTCGGTGCTGAGTTACTTGGAAGCGAGTGATGGGACGTATAAGCCGTTTCGGATCAGCGAGTCGGGGAATTTACAGGGTGTGGCTCAGTGTGTTGGTGATTTGAGTCCGAGTGAGTGCCAAGATTGCCTATCGGAGGCAATCGGACAGCTGAAAACTGAGTGTGGGGCAGCAAAATGGGGTGATTTGTATTTGGCTAAGTGCTACGTGCGGTTCTCGGAAGGTGGATACCACTCGCATGCCGGAAAGAGTAGCTAAATAAACAAAGGAAACTGACAATTGTTGTGAGGAATCCAAAAGAAAACCCTTTGCATTTGGTCTTCATTTCTTTTATCTGTTTATATTTAGACAACTATTGTACTGTCCGGGCGAGAAAATTTA
>HQ761033.1 Uncultured organism clone ELU0047-T268-S-NIPCRAMgANa_000215 small subunit ribosomal RNA gene, partial sequence 
AGNGAAAGGCGCTTTCGGGTGTCGCTGATGGATGGACCCGCGGTGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCCACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGTTAGAGAAGAACAAGGACGTTAGTAACTGAACGTCCCCTGACGGTATCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGAGACTTGAGTGCAGAAGAGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCAGTGGCGAAGGCGGCTCTCTGGTCTGTAACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTGGAGGGTTTCCGCCCTTCAGTGCTGCAGCAAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTTTGACCACTCTAGAGATAGAGCTTTCCCTTCGGGGACAAAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATTGTTAGTTGCCATCATTTAGTTGGGCACTCTAGCGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGGAAGTACAACGAGTCGCTAGACCGCGAGGTCATGCAAATCTCTTAAAGCTTCTCTCAGTTCGGATTGCAGGCTGCAACTCGCCTGCATGAAGCCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGAGGTAACCTTTTTGGAGCCAGCCGCCTAAGGTGGGATAGATGATTGG
>XM_033535937.1 Aplosporella prunicola CBS 121167 uncharacterized protein (K452DRAFT_19523), mRNA 
CTGGGGCGGCGGAAGAGGGCAGAACTCCGAAACACTCACTACACCCACGTCGGGTAGCTCGTCGCCAAGGTGGTACTCTACTCTAGCTGTGTTCCGCCATCCGGAGGCCTACACGTAAGGTCCATGTCGTGCAATTGGACTAGAGACGCACTCGTCTCCCACGCAATTCTGTCGTGCAGATGTACGGTTACTTCGTACTTTTGACAGATGCCTCGTCCGTCGTCCATCGTCCATCTGCATTTATGGTCGACGTTTCTCTCCAACCATGAATGCATGCTCGTATCTACTTCCCTAAGTAACATCGAGCGCATACAACCAAGACAACAAGGCCGACTGTGGGCTGCAATCCTCAGGGGACCAAAAAATTTCTGGTGCCACTACTGCACATACACGCGTTCTACGGTTAGCGTCAAGTATGCAAGCCACGAGAGTACAACAAGGGATGGGCTACAGCTTGGAACGGCCAGCCATTGGTCGCACACGCTAGCATACACTTTTATCTGGCTCCTCTGCTGGATAATCGCATTCCGCCGCCGTTTCGTGCTTCGCAGGCATGCCCATGCTCTGTCTCCATGCTGCATCTCAAATCCAGCGTATCGTGCATGTTTTGGTGCTTTGATGCAGGTCCATGACGTCACCGGCAAGGCATCGACAACGCATTGTCTGCACCGGGCAGATCAGAGTCCCTCTCATGCCCCATAATCCGTAGCGGTGCATTTATCCATGGATTCCTTGTCTTATACCGACCCGGCGTTAGCAGACGTTAACTCGTTCTGACTCGATCTC
>XM_008727620.1 Cladophialophora carrionii CBS 160.54 hypothetical protein partial mRNA 
ATGTCTGAACAGTCCAGCGAACCGCGAATAAAGTCGCACAAGAGGAACGTCGCCCACCGTCGACGCCGGGATGACGACGATTTCGAGGACCGGTGGGGCGATGAAGAGGTTGCCGAGGACGACGACGCAGATGGACACGCGCAGGCTGAATTCCCAGAGTCGTCGTCCAAACGGGTGAAATTGTCTGATGGCTCGGCATCGCATCGGGCGAAGAATTCCACACCCACCCCTCCACCAGAAACGGAAGAGGAGAAAGCACAAAGGGACCGAAAGGAGCGAGACGAATTCGCGAAGCGGTTGGCAAAGAAGGACGAAGAGCGGGCGAAGAAGATCGTGGAAGACAGGTCCGCTGCAAAGGACAGTGCGACGGCGCAGCGGCGGGCATTGGCAGACGATGCGTCCGCGAGAGACGCTGCGATGCCGGATTTGAGGCTTCGGTCCCGTCAGGACTACCTTAAGAAGCGGGAAGCCGAGAGGTTGGCTCTGCTGCGCAAACAGGTCGCTGAGGAGCAGCAGGAGTTGAGGGACAACCCGGACCTGACGCGGCGGGAGAAGGAGGAATTCGCGCGCAACAAGGAGATCCTGCGCATCGCGGAGGAGAGGCTGGCCATTGACGATCACTTGGACGGCTATGCCTTGCCGGAAGACTACATTACCGAGAAAGGGAAAATCGACAAGCGGAAGAAGGAACAAGCACTCTACCAACGTTATGTCGATCGCGACGAGGCCGGCCGAGAACGCTATGTCACCGAGCACGAAGAGTGGGAGAGAGAGCAAACCAAGCGAGCCGAGGCCCAGATCAAGAAGTCCGAATTCGTAGACGAAGGCGACTACGGCTACGTGTTCGACGAAAGCCAGCAAATGAAGTTCATCCTGGCGGACAAGCTGGAGGGGGACAAGGGGATGACCAAGGAGCGCAGAGAAATGGAACAGCGGCTCAACGCGGCAGAAGCAAAAGCCAAGAGCATCGAGGAGACGAGGAAGAGTCTACCCATTTACCAATTCCGAGACGAGATCATCCAAGCCGTGAAAGACCATCAGGTCTTGATCATCGTAGGCGAAACTGGCAGCGGGAAGACCACTCAATTGCCACAGTACTTGCACGAAGCGGGTTTCACAAAAGGTGGCATGAAGATCGGATGTACTCAACCGCGAAGGGTTGCTGCCATGTCCGTTGCAGCCAGAGTAGCAGAAGAGATGGGCAAGCGGCTAGGGAACGAAGTGGGCTACGCCATCCGCTTCGAAGACAACACCAGCGAGAAGACGGTCCTCAAGTACATGACCGACGGCATGCTGCTGCGAGAACTGCTCACCGACCCGGAACTCTCTCAATATTCGGCCCTCATGATCGATGAGGCTCACGAACGCACCGTCTCCACCGACATCGCGTGCGGCCTGCTCAAGGACATCGCCCGCGCCAGACCAGACCTCAAGCTCCTGATATCCTCTGCAACCATGGATGCCCGCAAATTCCAGAAGTACTTTGACGACGCACCCATCTTCAACATCCCGGGAAGAAGATACGCGGTCGACGTGCATTACACGGCCCAACCGGAGGCGAATTACCTGGCCGCGGCGATCACGACGGTGTTCCAGATCCACATCACGCAAGGACCAGGCGACATCCTCGTGTTCCTGACGGGCCAAGAGGAGATCGAAGCCATGGAAGCAAGCCTGCAAGAGACGGCGCGCAAACTAGGCAGCAAGGTCAAAGAGATGATCATCTGTCCCATTTACGCCAACCTCCCAACCGACCTGCAGGCCAAGATCTTCGAGCCGACGCCCGCCGGCGCCAGGAAGGTCGTCCTCGCCACCAACATTGCAGAGACGTCCCTGACCATCGACGGCATCGTCTACGTCATCGACCCCGGCTTTGTCAAGGAGAACCAGTACAACCCACGCACAGGGATGGAATCCCTCGTCGTGGTGCCGTGCTCACGCGCCTCGGCGGGCCAACGAGCGGGGCGCGCGGGTCGCGTCGGCCCAGGCAAGTGCTTCCGCCTGTACACGTCGCAGGCGTACAAGAACGAACTGGACGAGAACACGACGCCGGAGATCCAGCGGACCAACCTGTCGGGGGTGATCCTACTGCTCAAGTCGCTGGGCATCAACGACCTGCTCGACTTTGACTTTATGGACCCGCCGTCGACGGACACGATCGTGCGCGCCGTGGAACAGCTGTACGCGCTCGGCGCGCTCAACAACGCCGGGGAACTGACCAAGATCGGGCGGCAGATGGCCGAGTTCCCGACGGACCCGATGCTGGCGCGCGCCATCCTCGCGGCGGACAAGTACGGGTGCGTGGACGAGGTGCTGTCCATCATCGCCATGCTGGGCGAGGCGTCGGCGCTGTTCTTCCGGCCCAAGGACAAGAAGATCCACGCCGACAGCGCGCGCGCGCGCTTCACCAACAAGGACGGCGGCGACCACCTGTCGCTGCTGAACATCTTCCACGAGTGGGTCGACAGCGACTACAGCTTCGTGTGGGCCAAGGAGAACTTCCTGCAGCAGCGCAGCCTGACGCGCGCGCGCGACGTGCGCGACCAACTCGCCCGGCTGTGCGACCGCGTCGAGGTCGACGCTGCCAAGTCGTGCGGCGGGGCCAGCAACATCGAGCCCATCCAGAAGGCCATCACGGCCGGGTTCTTCCCTCACTCGGCGCGGCTCCAGCGCGACGGGCAGAGCTATCGCACCGTCAAGAACGGGCAGGTCGTCTACATCCACCCGTCGGGCGTGCTGATCGAGACGCGGCCGAAATGGGTCATCTACCACGAATTGGTGCTCACGAGCAAAGAGTACATGCGCAGTTGCATGCCGTTGAAGCCCGAGTGGCTCATCGAGGTGGCACCGCATTACTACAAAAAGAAGGATCTGGAGAGCCTGGGCGTGGAGCGGAAGGTGCCGAGAGGAGAGGGTAAAGGGCAGAGTAAGATTTGA
>HF913007.1 Uncultured Anaerolineaceae bacterium partial 16S rRNA gene, clone 4_45 
GATGAACGCTGGCGGCGTGCTTAATACATGCAAGTCGAACGAAGATGTTCTTGAGTTTACTCGAGAGCTCTTAGTGGCGGACGGGTGAGTAACGCGTTGGTGACCTGCCCTAAAGAAGGGAACAACCTCGGGAAACTGAGGCTAATACCCTATGTGCTTATTTAGATTAGATGCTTTATAAGTAAAGGTTCTGTGGACGAAAGGCCACGGTGCCACTTTAGGAGGGGCCTGCGTACCATCAGCTAGTTGGTAGGGTAATGGCCTACCAAGGCAAAGACGGGTAGGGGACCTGAGAGGGTGGCCCCCCACAATGGAACTGAAACACGGTCCATACACCTACGGGTGGCAGCAGTAGGGAATATTGCACCATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGTGATGAAGGCCTTCGGGTCGTAAAACTCTTTTCAAGGGGAAGAGGAAGGACG
>XM_035019610.1 PREDICTED: Mirounga leonina family with sequence similarity 43 member B (FAM43B), mRNA 
CCTACTCCTTAACTGCCCCTCCATCCCCACCCCTCCAATAAGAATGATTAATCCCGTTCCACCGCGCCTGTGCCGGGTCCCGGGCGAAGAGCAGCGCTAGCCGGCGCGGGGGAGGAGAGAGAGGAGAGCGAGGGGAGGGGACAAGAGAGCTAGCGGTCCCGCCCGGTGATGTAGGCAGCCCGGGGAGGTGGAGCCGCGACGCCTGAAGGAGTCCCCACCGCAGTCTCGCGCTCTCGGTCTACCCCTCCGAGCGGCCAGCCGCCAACCCCAGCTCCGGCGACCTCCCTGCCGCCGCAATTTGGGCGGCGGGGACTGCGGGATCCCCCCCCCCAGTTCGGGCCCGGGGGGCCCCTCCACCACGCCCAGCCCCCCTCCCCTCCTCGCTTCCCGGACGGCTGGAGCTACTCCCGGGGGAAGCTGTTCCCGGACGCTCGGCCGCCGCCCCGGCATCTCGGCTGCCAGCCCGGCCGGGCACCGGGCATCTCCGGGCACCGACTGGCTCCGGCGCCGCCCAGCTGCTCGCGACCCCGGGGCCGCGGGCTTCTGCTCGCCCTCCCCTCCCCCGGCCGCCGGCCAGGACGCCCGTGAGCTCCCGGTGCCCCCAGCCCCTCTGGCCGCCGCCGCCGCGATGCTGCCCTGGAGACGCAACAAATTCGTGCTGGTGGAGGACGAGGCCAAGTGCAAGGCGAAGAGCCTGAGTCCGGGACTCGCCTACACGTCGCTACTCTCCAGCTTCCTGCGCTCCTGTCCGGACCTGCTGCCCGACTGGCCGCTGGAGCGCCTGGGCCGCGTGTTTCGCAGCCGGCGCCAGAAAGTGGAGCTCAACAAGGAGGACCCGACCTACACCGTGTGGTACCTGGGCAACGCCGTCACCCTGCACGCCAAGGGCGACGGCTGCACCGACGACGCCGTGGGCAAGATCTGGGCGCGCTGCGGGCCGGGCGGGGGCACCAAGATGAAGCTGACGCTGGGGCCGCACGGCATCCGCATGCAGCCGTGCGAGCGCGGCGCCTCGGGGGGCTCGGGGGGCTCGGGGGGCCGCCGGCCGGCGCACGCCTACCTGCTGCCGCGCATCACCTACTGCACCGCGGACGGGCGCCACCCGCGCGTCTTCGCCTGGGTCTACCGCCACCAGGCGCGCCACAAGGCCGTGGTGCTGCGCTGCCACGCCGTGCTGCTGGCGCGGGCGCACAAGGCGCGCGCCCTGGCCCGCCTGCTCCGCCAGACCGCGCTGGCGGCCTTCAGCGACTTCAAGCGCCTGCAGCGCCAGAGCGACGCTCGCCACGTGCGCCAGCAGCACCTCCGCGCCGGGGGCGCCGCCGCCTCGGTGCCCCGCGCCCCGCTGCGCCGGCTGCTCAACGCCAAGTGCGCCTACCGGCCGCCGGCCGCCGAGCGCGGCCGTGGGGCGCCGCGCCTCAGCAGCATCCAGGAGGAGGACGAGGAGGAGGACGCGGACGCGGAGGAGCGCGAGCGGCCCGAGGTGCTCAGCCTGGCCCGGGAGCTGAGGACGTGCAGCCTGCGGGGCGCCCCGGCGCCGCCGCCGCCCGCGCAGCCCCGCCGCTGGAAGGCCGGCCCCAGGGAGCGGGCGGGCCAGGCGCGCTGAGAGCGCGGCGGGGGGGGGGTGCGGGGGGAGGGGCGCGGGCCTCGCGGCCCCAGCCCCCCGCCGGCCTGACTTCCAGCCTCCAACCCTGGCCCTGCCCGCTTCGGCTCCCCTCTGGTCCCCCGGCCCTTGCCTCCCTCGTGGTCTCTGTTGTTGTCTGCCCCGCGTCTCATCCTGGCTCAGGGTGACGCCTGATACGCCCTTGATTATTGGGGGACAAAGGGGAGGAGAGCAGCAGAAGTACTCGATGTTCGCCTCTCCCCCACATCCGGAGTTGCTGAGCGCCCTCCATCGTGGAATTGCTCGTAAGCTTTACAACAGGTCTTTGCCCATAGACCACCCTCTCCCTCCCAGAACAACCCCTCCAAAGAAGGGGGAAGAAGTTTCCAGAAATCCAGGAGGGTGGCCCTGGACGTTGGCCAGGTGGAAGCCGTGGTCCTGCCCTTGGCCAGTCAAGCCTTCCTCCCTGGGATGGGACCAGTTCTGGGCAGGCATGCTTGCAGAGAAAGAATAGTGGCCCGGGAGACCGGAGGCCAGGTCCAAGGTGGGAAGTGAGTCGGCTGCCATATACACAAGGAAGGATTCTCAGGCCCTGTGCCTGGCCTCTCTACCCCTTGGAGGATTTCTGGACTTCACTGCTCCATCTCCGGAGAAGACTGGGCTGGTCCTACCAACCCAAACAACAGGTTAGAGCAGGTAACAGCCCTCTGCTCTGGGCAGCTGCCCAAGAGTATGCCCTGGCACCTGGCACCCCCACAAGACTCCACCCACCCCACATCTCTGCAGACAGATGTGTGGGGTTCCCCACTAGGTGCCTCCAACTAGGACCAAGATGGGGTCTCCAAAGGAGGTAAGGAGAACCTTTGGCAGGTGCTTGAGGACACTGACCACCCAGAAAGTGGACACAGGAGGGATGCCCTCCCGTCCCCTCCCGCCCCCTGAGTCGGGGCTTGTCAGAGCAGGAGGGTCCTGACAGCAGTTGGGTTCTCATAGCCGGCTGAGGAAGGAGAGTGTGTTCACCCAGCAGAGGGAGTGGGCCCCCTGCCCAGGTGTCCCAACAAGGCCACAAAAAGCCCAAAGATCTATGTGTCACCAACTGATCGTTGTAAATAAAGTGGACCTGCTTTTTCA
>MN887529.1 Glyphodes pyloalis putative family 31 glucosidase KIAA1161 protein mRNA, complete cds 
GGGGGGGGGGGCAGTAGGTGTGTGAGACAAGATGAAGCTGATACTTCTGTTGGCAGGCGTGTCGGTCGCGCTGGGCGGTATTGCGCGCGCGCCGACCAAGCGTGACTTCTTCGTCGACCAGCGGGAAGATGGCGGCCTCGACTTCATCGTGGTGTCCAGCGAGAAGGGTACACTGACCCTCGGGCACATCGGCCGCAAGGTGGCCGCAGACGACCCTGAGGTGACCTTCGACATGGATGCGCAGCTCGATGAGGCCAGCGGCGGCTGGAAGGTCACCATCAGCTGGGAAGGGCCCAGCGACAGAGTCTTCGAGGACTGCTTTGGCTTCAGAGGCAAAGAATGGTACGGAGGTCCCGAGCAGAAGGAGCAGTACTGGCCGATTCAGCACGGGAAGCTGGAGAAGTACTCCATCATCTCTAAGGAGGACGACAACGCCGCCGTCTCCGAGAGATACTGGCTCAACTCCGCCGGCTACTACTTCTACGTACACCCAGAGGCTCCCCTCTTCGTCGACTACCACAACACCAAGAACGATAACATCTGCTTCATCGCTGAAGTCGCCGCACCTTACTCCACCAAGCGTACACACAACGTTCTCAAATACGACATCTGGTTCTTTGACAACGCCAAGGTCGCCCACCAGCACGCCGTTGACACTTACCTGGGAAAGCCATCTGGCATTCCAGACTACAGAATGATCCAATACCCAATCTGGAACACTTGGGCGAGGTACTCCCGCGGAATCGACGAGGATCTTCTATGGGAATTCGCGAATGAAATCGCGGACAGTGGATTCCCTAACTCTCACTTTGAAATCGATGACCAATGGGAGGTGTGCTATGGATCTCTGACCGTCGATGAGGGCAAGCTCCCCAACTTGAAGCAGTTGGTTCAGAAAATCAAAGGACTTGGATTTAGAGTCGGCATGTGGGTGCATCCCTTCATTAACCAGGATTGTGAGCCTTGGTATTCTGAAGCTTTAGAAAATGGTTACTTGGTACTGAATGAAGAAGGAAATCCAGAAACCAGCTGGTGGAACAACAATGGCTCCATCCCTGCCTACGTTGACTTTACCAACCCTGAAGCCAAGAACTGGTACACCTCGCGAATCCAGAACCTCATTGACACTTACGCTTTGGACACTCTCAAGTTTGACGCTGGAGAATCGAGCTGGTCTCCTCAGATCCCAGTCCAGAATGGTGACATCGACCTTCATCCGGGACACATCGTGCAGGAATACGTGCGCGCAGTTGTCCAGTTTGGAGACATGATCGAAATTAGGTCTGGAATAAGAACCCAGGATCTGCCTGTGTTCATCCGTATGGTCGACAAAGACACCTACTGGGGCTTCAACAACGGCCTGGCGACATTGGTCACTACTCTGCTCGCAATGAACCTGAACGGCTACACGCTGGTCCTGCCCGACATGATCGGCGGCAACGGGTACAACGACAAACCAGAAAAGGAGCTGTTCATCCGCTGGCTTCAGGCCAACGTGTTCATGCCTAGCCTGCAGTACTCCTTCGTGCCGTGGGATCATGATGATGAGACCGTTGAGATCAGTCGCAAATACACGACTTTGCACGCGGAGTACGCCGACACCATCGTGGCTGCCATGGAAGCCTCCGTGAGGGACGGCACTCCTGTCAACCCTCCCATCTGGTGGTTGGACCCAACCGACGAAGACGCTCTAGCAGTTTGGGATGAATTCCTCCTCGGTGAGAAGATCCTAGCAGCGCCGGTGCTCGAAGAAGGCGCGGTGTCCAGGGACATCTACCTACCCACAGGCTCTTGGCGCGACGGCGTGACAGGCGAGTTGGTGCAGGGCCCAGTCTGGCTCATCGACTACTCCGCCCCCCTCGACACGCTGCCCTACTTCACCCTGGAAGATTAAGTCGAGACCTTCAGAAGGGTCTTGGGAGTTCCTAATTGATAAGTTTTAAAATAAAGTTGTTGTTTTCAAAAAAAAAAAAAAAAAAAA
>JX367473.1 Uncultured fungus clone 035A13021 18S ribosomal RNA gene, partial sequence; internal transcribed spacer 1, complete sequence; and 5.8S ribosomal RNA gene, partial sequence 
AAAAAACGCTTGGTCATTTAGAGGAAGTAAGAGTCGTAACAAGGTCTCCGTAGGTGAACCTGCGGAGGGATCATTACACAATAAAATATGAAGGCCTGGCTTCGCGGCCGGCTGAAATATTTTTTCACCCATGTCTTTTGCGCACTTGTTGTTTCCTGGGCGGGTTCGCCCGCCACCAGGACCAAACCATAAACCTTTTTCTTATGCAGTTTCCATCAGCGTCAGTAAAAACAATGTAATAATTACAACTTTCAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATACGTAGTGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACNCACATTGCGCCCTTTGGTATTCCAAAGGGCATGCCTGTTCGAGCGTCATTTGTACCTTCAAGTCTTTTGCTTTGGTGTTTGGGTCGTTTTTTGT
>XR_006640209.1 PREDICTED: Bubalus bubalis uncharacterized LOC123465122 (LOC123465122), ncRNA 
GCCGAGAGAGTAGGTCGTCAGGCGGCCCTTGAGTTTTTTTCTCTTAGTGTAAACGTGTGCTGCGCGCTTAGCCGTCCAACCGGCTCTCGCCACGCCCATCTTCAGGGTCCCGCTGGTTCGGTCGACAGCCCGGTTTCCGGAGAAGCCGCGTCCTCTCCCCGGTCCTGGGATTCTGGAGAGCCCGGCCGGCCCCCGAGACCCCCTTTCTCCCACCCTCTGCCCTCGCGTCTCCTCAGGCCAATCGTTCTGTCCCGCAGGCCTCCCTTCCTGGGATGGTTAACCTTCAAGGATGTGGTGATCGAATTCTCTCAGGAGAAGTGGGAATGCCTGGACCCTGTTCAGAGGGCCTTGTACAGGGACATGATGCTGGAGACCTAGAAGAACCTGCTCTCCCTGGATCTATCTATCTGATACATGTGGTCAACCAATTACAACCCAAAGCAGACAGTGATACAGGAGAAGTATTCCAAACAGCAATCTTGGGAAGACCTAAAAGTCATGAAATCAAACATTTTTACCTCAGAGAACTCCAGGAAGACATGTATGACTTTGAGTATCATTGGAGAAGTGGTGGAAGAAATAACAAAGGAACGCGTATAACTCATGACAGAAATCTCACTGATGGCAGAGGTCAACAATGTAGAAAGGATGTGGAAATCAAGCCCTTTGTAAATAGGCTTGGATTTAACATGCAGGATAAACTTCAGATATTTCAAACTGACGGGATAATTTCTGAATGTAATAAAGTTACAAGGTAGTCAACAGTAGTTT
>XM_023049778.1 PREDICTED: Onthophagus taurus uncharacterized LOC111417487 (LOC111417487), mRNA 
TTTAAGTTTTTTAATAAATAATTTTTAATAACAACTTTTTAGCAACAAAAATTAAAAAATGTGTACACCCGAACCGCTTCAACTAAATACAACAAAAGGAAAATGTTCAATCTCACCTTTCACATGCATTTTAAAGTTTTTGATACGTTCGTTGGAATGTCCGGAAAGTGAAAAGTTTATTTCACGTTTTGAGGATCAATTAAATCAATTGATTGCTGTTGGAGGTGTTAATGTTTCCGTTCGCGAATTAGCTGATTTAATAAAACTAATTTCTTTAACGTTTCAAAGAATCGATGAAAAACCTGCTTATTTAGAAGCTTTTTATAAATTATTAAATTTTAGTTCGCAAAATTTGGTATTTTTGATAACCAGCGACATGATAAGTTATGCTGAAATTATACAAGATTTTTTCAACATGCTGGGTTATTTACTGGGTAGTACAGAAAATCTGGATTGCATTCAACACATTTTAAACAGCATATTAAAAATGATTGCAATGGCAAAGAAAAAACCTTATTTACAATCAAAAGTACTTTTAGACGCTTTTGCAAATAGTCAAATACCACCGATTTTTAGCGAATTACTATACATATCTGAATTCGACGTTTACATCAAGTATTTAACAGTTTTAGAAAAATTCTTTGTATCGGAAAGCATCTGTCAAGCCTTTTTAAAATGTAAAGTTTTCGACACTGTCGTTCAAAGGGTTTGTTTAAAATGGAGAGATGAAATTAATTACCCAGATGAAGTTCTTCCAACTTTAGATTTACCACCACATTTAAATGTAACCCAAAGGATTCTTTGGACATTAACAATGATTTATAACGATAGCTCGACAACTTTTAAAAATAGTATTGGGTATTTAGTTGAAGGATCTTCTTTGAGAGGTCCTCGCAATGTTTTAATAACATTAATAACATCAAATAAAGATAAACACATGAGAAATATGTTTTATCTGCTTTTAAGAGCGATTGCTGGTACTGTGCCTTTTCGTCATTATAGAAGTTTAAATAATGAATTGCATATTTTAACGTTTACAACTGAAGTGGAACAATCTCATCCTTGGGCAAAAAGAATGGTGTTACGTGCAGATGATCTTGATTTTGAGTTTAAAATGATGCTGGTTTCAATGTTATGCATTAATAGAGTTTACCCACAAAGCTTAGATCTTTTTAGAAAAATGAATGCCGTTCAAGGAATTTTTACGTTAATCGATACAGATATACAATTAATTTGGTCGACTTATCAACGGTTAGAATTAATGAAAGGGGCATTAATTGGAATGGAAAATATGATTTTTCATGTCATCGATGATTATATTCACTACGGGGGACCTGGTAAATTATTAAAAGTTCTTACAAAAGTTGTTGAAGGTGAACTACATTCAACCCTTTTATTACCAATATTAAGATGTATTAATACATCCTTAAACGTTCCGAGTAATGTGCAAGAAAAGGTCGCTAAACTTTACAGAATGAAACATATCATTGAAATTTTAACAACTACAATTGAAAATGTAATTAATGCTGAATTCATAACAAAATTAAACTTAAGCTGTTTAGCTGTAAGTTATTGTATTTTGGAGAAAGTTGCGAAACCCAACGAACCAAAATTAACAGACGTAACAAAAACGGGAATTGCAATTTTAAAAAAATACTTAAATCCAGATCCTAGTATTTCTTTCTTAGCACCGAAAGTTCTCATTGCTGTGATGAGTTTTATATGGGAAAATGTAGTTTATTGTGAAAACGGGATACACGAATTCAGTTCTACAGGTGGCGTTTACGTCATCTTAGACATAATTGAGAAATTTCCTCTTGCCATTAAAGTTTTAGGTTTAAGCATGATAGCTGATTTTTGTCAAATTCAAGAATTTCTTTCATGCATTTTAACTTGGAAAGGTAAATCTGAACAAACGATTGTTCCATTTTTATTGGATATTTATAAAGATCAAGCTCGTTTTGATAAAGATCACACTGATATAAAATCAACACTTCAAGATTTAGAAAATCCAATTTTTGGTGATAAATACAACGAAATGAAAAAGAACTACATCAACAACGAATATGCAAGTTTCGCAACTTTGGATTTTTTAGGAAATTGTAAACCATCAATCTACGCAATTTTAACACTTTTAAGATGCGACGAAGACAAAGAGTTAATTAATAACACGTATAAAATATCAAAAGAAAATTTAACAAACAAAGAAAAAATTGTTGCTGCGTTAGCTGAAAATTATCTTCCATTATCGATAGGTGAATCTTGGATAGAAGTTAATCAACATTTTCAAACGAAAGGAGTACGCCCGTTAGTTTTCGATCAAATACTAATCGCTGCAAAGCTACAAGAACATCGTGAAAGAGCCAAATTAATTCAAATTGATCAATTGACATGTGAAATTTCTGAAAATAATCGCGAAATTTGTGTTGAACGGCAATTTTACGAACGTCTCCGAGAAGAAGTTCTCAACGAGTCTTTAGATGCATTAAACGAACTTCGATATTATACAAGATGCGTTGATACAATGGCTCGTTTAGAACAATGTACTCAACTTACTTTTGAAACTGAAAATGTGACCGCTGGTCGGCTTGATAAATCGATGTTGGTCGACTATCATAAAACTTTACCCGAATATATTAATATTACACCACATTTTAATCAACATGTCAGCATTCAAAGTAACGTCATTATTGATCCTAACAAAGAAAAAACTCCAGATGCAGTTTCTTTAGATAGCACCGAGCAAGGAATTATAGCTGCAAAAAAATTTGCTGATTTAATGCGTAAACGTGCTCCTAATCCTAATCCAACTTCTTATGATGTTACACGTTCGAAATATGCACGTTATTACAGTGTTGATTTTCATTAAT
>XM_020844603.2 PREDICTED: Dendrobium catenatum transcription termination factor MTEF1, chloroplastic (LOC110112391), mRNA 
TATGCGGACAATGCTCAATGCCACTCACACTCACTATGCTCAGTTTCCACTCCCCTCTCGGTTCTCTCACTCACCCCAAACCTCTCCAAACGCTAAACCCTAATCCAGCCCTCCGATTTTTACCTCCGGTCGCTGGCACCACTTACATCTCCGGCAACGACGCGGGCTTGCGCTTCCGCGAAAAGCTTCTCTTCCTCGAACACGACCTTGGCGTCAATTCACTCCGCGCCCTTTCCCTCAACCCTAGCCTCCGCTCCGCTCCTCTCTCCTCTCTCAAATCGCTATCGTCCCTCCTCTCCTCCTTCGGCCTACTTCAATCCGATTCCTCTCGGGTCCTCTCCCTCCACCCCTCCCTCCTCACCGCCGATCCATCCGCCTCAATCCTCCCCGCCATCCACTTCCTTCTCGACACCGTATCCATCCCCTTCTTGGACCTTCGCCTCTCCATCAACCGCTGCCCTAGACTTCTCCTCTCCAGTGTCCCCGATCGCCTCCTGCCTTCCTTTAATTTCCTCCGTGGCCTCGGCTTTGTCGGTCGCCACCGCATCACCGCTCGTACTACTGTCCTTCTCATATCTGATGTTGAGGAGACGCTCATTCCCAAGCTTGATTTTGTCCAGAGCCTTGGGTTTTCTTATACGGATACTGTGAAATTGGTTTTGAGGATGCCTAGTCTGCTCACTTTTAGCGTTGAGAAGAATTTTCGGCCTAAGGTGGAGTTTTTAGTGGGGGAAATGGGGAGGGAAATTGTGGACTTGAAGGAGTTTCCGCAGTACTTTGCTTATAGTCTTGAGGGAAGGATTAAACCGCGACATACAATGATGGTAGAGAGAGGCTTTGGCTCCTCATCTATTTCACTTGGGGAGATGCTCAAGGCCAGTGATGGAGAGTTTCGAGAACGGCTACTAGAGATGCGGCTTAGTTCCGTGGGTGAGAAATTGTAGCTTGGTATGATGTGGGTTTCTTTTCCCCTTTCCAATTTTTTGAAGAAGTTGCATGCCTCCTAGATGCATACTTAGATTTGTAAATGTAAAATATTTGATGGGCCTGCCACATTAGTATTGTTGTAATAAGTACAATTCCCTGTATGTTATTATATTTTTAATTTTTGCTTATTTGGCTACCCAATA
>XM_026866306.1 PREDICTED: Athene cunicularia multiple EGF like domains 10 (MEGF10), transcript variant X1, mRNA 
CAGGACTCTTTTGGGGCCTTTGGTGAATTTAAAGGATTTACACAGCAAGTAATAACATTATCACCTGCCATCTTTTTTTTGGAAAGATGTTTCTTCATTTGAATTTCTTTTTTGGCTTCCCTGTCATATTCCTGTACAACTGGATGGGGACAACTTTATCTTTGAATCTGGAAGATCCCAATGTGTGTAGCCATTGGGAAAGTTACTCAGTTACAGTGCAAGAGTCATATCCTCATCCTTTTGATCAAATTTACTACACCAGTTGTACTGACATCCTGAACTGGTTTAAGTGCACACGACACAGGATCAGTTACCGTACTGCCTACAGACATGGTGAAAAAACAATGTACAGACGTAAATCCCAGTGCTGCCCTGGTTTTTATGAAAGCAGGGAAATGTGTATCCCTCATTGTGCTGATAAATGTGTCCACGGTCGGTGTATTGCTCCAAACACCTGTCAGTGTGAGCCTGGCTGGGGAGGACCCAACTGCTCCAGTGCTTGTGACAGTGACCACTGGGGACCTCACTGCAGCAGCCGCTGCCAGTGCAAAAATGGAGCCTTGTGCAACCCCATCACTGGAGCCTGCCACTGTGCATCAGGTTTCAAAGGTTGGCGCTGTGAGGAGCACTGCGGTCAGGGGACGTATGGAAACGATTGCCATCAAAAATGCCAGTGTCAAAATGGAGCCACCTGCGACCATGTGACTGGAGAGTGTACATGTCCTCCTGGATACACTGGTGCCTTCTGCGAGGACCTTTGTCCCCCTGGGAAGCATGGGCCGCAGTGCGAGGAGAGATGCCCGTGCCAGAATGGAGGCGTCTGTCACCATGTCACCGGGGAGTGTGCCTGCCCACCAGGATGGATGGGCATGGTCTGTGGTCAGCCTTGTCCTGAGGGTCGTTATGGAAAAAACTGTTCCCAGGAGTGCCAGTGCCACAATGGAGGGACCTGTGACTCAGCGACAGGTCAATGCTATTGCAGCCCAGGTTACACAGGAGAACGATGCCAAGATGAATGTCCAGTGGGAACTTATGGAGTGCAGTGTGCTGAGACCTGCAAGTGTATGAATAGGGGGAAATGTTACCATATTAGTGGTGCCTGTCTCTGTGAACCAGGATACACTGGAGAGCACTGTGAAACAAGGCTTTGCCCTGAGGGAATTTATGGTCTCAAGTGTGATAAAAAGTGTCCCTGCCACATGCCCAATACCTGGAGCTGTCACCCTATGTCTGGGGAATGCTCCTGCAAGCCCGGCTGGTCTGGACTCTACTGCAATGAGACATGTTCTCCGGGATTCTACGGCAAGTCATGTCAGCAGATCTGCAGCTGCCAAAATGGTGCTGACTGTGATAGTGTGACTGGAAAATGCACCTGTGCCCCTGGATTTAAGGGTGCTGCTTGTGGTACCCCTTGTCTTCCGGGGACATACGGAGTAAACTGTTCGTCTGTGTGCAATTGCAAAAATGAAGCTATCTGTTCACCAGTAGATGGTTCTTGTGCCTGCAAAGCAGGTTGGCATGGTGTAGATTGCTCAGTAAATTGTCCCAGTGGTACCTGGGGACTTGGCTGTAACTTAACTTGCCAGTGTCTTAACGGAGGGGCTTGCAGTGCTCTGGATGGAACCTGTACCTGTGCCCCGGGCTGGAGAGGAGAAAAATGTGAACTCCCTTGCCAGGACGGCACTTATGGTATGGATTGTGCTGAGCGCTGTGACTGCAGCCATGCAGATGGTTGTCATCCCACCACAGGTTACTGTCGCTGTCTACCGGGATGGTCAGGCATTCACTGTGACAGTGTGTGTGCTGAGGGACAGTGGGGTCCAAATTGCTCATTGTCCTGTTACTGCAAAAATGGAGCATCCTGCTCTCCAGATGATGGAATCTGTGAGTGTGCACCAGGATACAGAGGCACCACTTGTCAGAGAATTTGTTCTCCTGGGTTTTATGGACACCGCTGCAGCCAGACATGCCCCCAGTGTGTACACAGTAGTGGTCCCTGCCACCATATTACTGGCTTATGTGACTGCTTACCTGGATTTACAGGAGCCCTCTGTAATGAAGTATGTCCCAGTGGCAGATTCGGCAAGAACTGCATTGGAATATGCACCTGCACCAATAATGGAACATGTAATCCTATTGATAGATCCTGTCAGTGTTACCCTGGCTGGATTGGTAGTGACTGCTCTCAGCCTTGCCCACCTTCCCACTGGGGACCAAACTGCATCCACACGTGCAACTGCCATAATGGAGCTTACTGCAGTGCCTATGATGGGGAGTGCAAATGTACCCCAGGATGGACTGGCCTGTATTGTACACAAAGATGTCCTCTAGGGTTTTATGGGAAGGACTGTGCATTGGTATGCCAATGTCAGAACGGAGCTGACTGCGACCACATCAGTGGGCAGTGCACGTGCCGCACAGGGTTCATGGGGAAGCACTGCCAGCAGAAGTGTCCTCAAGGTACGTATGGGTATGGATGTCGGCAGATATGTGACTGTCTGAACAACTCAACCTGTGACCACATCACGGGAACATGTTACTGCAGCCCAGGCTGGAAAGGTGCCAGGTGTGATCAAGCTGGTGTAATTATAGTGGGAAACTTGAACAGTTTAAGTCGTACCAGTACTGTCATCCCTGCTGACTCTTACCAGATAGGAGCTATAGCAGGCATCATCATTCTTGTCCTGGTTGTCCTTTTCCTGCTAGTGCTGTTCATCATTTACAGACATAAGCAGAAAGGAAAAGAAACAAATATGCCCTCAGTGACCTATACCCCCGCTATGAGGGTCATCAATGCAGATTATACCATTTCAGAAACCATCCCTCACAGTAATGGTGGAAATGCTAACAGTCACTATTTCTCTAACCCTAGTTATCATACTCTAACTCAATGTACTACCCCACCTCACGTCAACAACATCGACAGACTGACCCTAGCAAAGGCAAAAAACAATCAGCTGTTTGTGAACCTTAAAAATGTGCAATCTGGAAAACGAGGAACTGTCATGGACTACACAGGAACACTGCCTGCAGACTGGAAACATGGTGGCTACCTCAATGAGCTTGGTGCTTTTGGACTTGACAGGGGATATTTGGGAAAGTCCCTGAAAGATCTAGTGAAGAACTCTGAATACAATTTAAGTAATTGCTCATTAAGTAGTTCTGAGAACCCATACGCTACTATAAAAGACCCACCAACTCTTGTACCAAAAAGTTCTGAATGTGGATATGTTGAAATGAAGTCACCAGCACGCAGGGACTCTCCATATGCTGAGATTGCCAGCTCTTCTTCAGCCAGTAAAAATGTTTATGAAGTTGAACCTACAGTCAGCATTGTGCAGGGAGCATTCAGCAGCAGCGGACGTTTCAGCCAGGATCCTTATGATCTTCCAAAAAACAGCCATATTCCATGTCATTATGACTTGCTACCGGTTCGAGATAGCCCCACATCCTCTACAAAGGAGTTCAGCAGCGAATGACCCCAAAAGCTGATGTGTAGGACTCTGAAGGGGCAGAGTGGCATGGTTGTGCTCCTTCTTCTAATTCAGCATAATTTTTGGCTCTTAATCTGTCCAGCAAACAATTGCTGTACATTAAATAGAATCTCAACATGAGGTTTGTATTGTGTATACAAGTGACAGATGGGCAAATGCCACACTCTGGGGATCCTGATCATTCTTTTTTTCATGGCAGTAAATGTTACAGAAACAGGTATGCAACTCATTTATTCTATAATATACTGGCTTAAAAATACATTTGCAGATTAGTTTTGATAACATCCCATTTCATCTACTTTAAATATAGACTTCATATTTGTCATGTTTCAGCGTAGAAATACTCCCAGGACAGTGCAGTTTACCAAATACCACTTTGTACAGGTGATCTGATTCACTAGTTACGTAGAAGAAAAACTGCTTTGCCAAATTTTACCTTCCATTGTGATCTTTAGTCAAGACATACTAAGAAACAAGATTGGATGGGGATAAGTAAGCACAATACTGCAGTTGTTTGGGAAATCCATCAGGCTTTTTCGTCTACTACTGGCAGTGGGGTATCTTGCTTGAGTAGTTTTGGAGATAAAAGCATTGCATACATCAATATTATATGATGCCTCAAGATCTATTAGTACTCCAGACCCAGCACCAGTCTTCAGCAAATCTTTTGCTATGATTCAGCTCCATATGTTGCAGTTCTGACCACTATGTCTGCCATACGCAAGTAAAAATACATATCAGTAATTCAGAAATTATGTAAATGAAATCAGTCTTACTTTTATCACCATGGACTGATTATGTAAGGAGTGGACAAAGGTGATGACTGCTGTAAATCTTAACTGCAAGGAAAGGTTTACGTTTTATAAACAGATAGTAATAATGACTGTAATATAGAATAAAAATAGTAAAGTGTTCTGTTTTTTTTTCTTAGAAATAACTAATCAATCTCTGTGCATACTTGCTAAAAAGGCACCTTTTTTTATAATTGATGTCATGCTTAAGCTGGTCTTTTGCATTGCTAATAATGTGACACGTACTCCCCATTCTTCATTAACTTGTGTCTCCTTGTTGTGTCTGTGTTTCTAGTGATCTAGCTTGTAATTGCAAAAGTGTTCTACTTTGTGTCCATTTATTTTGCATTTTTGTCAGCTGGACTTTATTTATCTGGTTAAAGGGACCTCTGGGCAGAGGGAGAGGATTAAGATGTTTATCCAGAGGTAGTTAGCTAATCCATAATAGTTTAACTTAATGAATTGGTGAAAAAAATCAAGGTGTTTTTCTCAAGGATAATTAAAAGAATGCTGAAGGAAAGTGAAAAGCAGTCCCTCTTGAAAGTTTAGCTTATTCTGATGACTATATGGATGGACATCATCTTTCCAAAAGGCTCCCTTCTCTCCCTCCAAAAGAATCTGTTATGAACTGCATAATTCAGAGAAAATTAAATTTGCCAAGGTATCCATCTGTTGAAGCAAAATTGTCCCCCAAACACATCATCCTAA
>XM_053267654.1 PREDICTED: Hemicordylus capensis uncharacterized LOC128332879 (LOC128332879), mRNA 
AAGGCTGGCTCTCACGTAGGCGCAAACAGCGGGGAAGGCCGAGCGGCGGGAAGGAGGAAGCGAGGCAAAGCATAAGCCCCAGGATGGGGAGAGAGGGGCAGCATCTGAGCCGCACCTGGGGACTTCCAGTAGGGAAGAACAAGAGGCGCCCCTGGCAGGCAGCAGCCCTCGCAGCCTCAATCCTGAGTTCTTGCTTTCTCCTGACTCAAGCCAAGAAGAGAGTGATCTCCAACATTCCTATCACATTGAGCCCATTAAATCCAGTTAGTGGGCAGAGGGTTGTCTTTGCACTTGGAGAGCTTGTGAGACGGAAGTCCATTTGCGAGTGGTACCGAGGGTCCAGTGACAAGGAGAACAAGATATTGGAATATGACTTTGGGTTGACCCAGTCCTCCTTTTCTGCCATACACAACACCCTCAAAGGCATTGACAGTTACATCAAGGGTGATGCTCATACTGGGCGGGAGAAGGTGTCCTCAAACTGCTCCCTTTATTTGGATCAATTACTGTTAAGTGACACTGGAACATACACAGTAGAAATGAAAAGATCTGGACAAGTTAAACAAAGAGGGCGTGTTTTCCTAGAAGTCTCAGATGTTCCTCCTGATTTGGGAGCGATTCTCCCCGATTCTCCCAAGGATGATGGTGACTATGATTATTTGCCGACTCCATCTTCCATGCTAGTTCCTGCTCTTGATATACAAGATCCTTCTCATTTAAAGCTACCTCTGGAGATCATTTGGAGGATCATTATTGGGTCTTTGGCTGTGACCACAGTCCTGGAGTTCCTACTTTACTTCCTTCTTCGTTCCTGTTATTGGAGGAACAGAAATTCTAACCGAATTATCTCAGCTACTCCAGGGTGTGGGATGATTCCCTCTTCTGCAAAGATGCTGAATCAACATGGAGACCCCGCTGTGCAGAGCAAGCTGTGA
>XM_046173440.1 Alternaria rosae uncharacterized protein (BKA58DRAFT_436843), partial mRNA 
ATGCACGCTACTGCAGGCTCAATCTTAGGACCCACTAGCGCACACGGCCTGCCAATCACGCCAGCACTTGGCGGCCTCTCATCAGCGCACAAGCTCCAGCCCCGGGCGCCCCTTCCCTTCGACGCGATTGACGGCTCTTCTGACAACTCTCCCAAAAAGCAGTGCCACAACGGGAAGCCGGCTCCCAGACACCTCCAAGCACGCGCAACCCTCACCTCAGTCATTCGTTTCAGACAACAAACCAGCAAAGACAGCACACAGCAGCAACCTGCACCTAATACACCCCCCCGTACCATCACCGTCACATTCACCGTGCGCCAAGCAACGCTTCTCCCGGCACTTCCTCATCCGCAAACGCCTGCATCGCAAGAGCGACCGACTCTCGCCCACCTCGTTTCTGCCGTCCGTAATCGATTCCGGAGACCATTGCGCGCCCTTGCGAGGCTAATTGGCAGCTTCACTGGAACCAGCCTACCGGATCCAGCGATCGCGACGACGCTGAGCAAACCGCACCTGCCTCCCCGCCCACCGACATCCGCTCTCATGCCTATCGTGGCCACCCCTTCTTCATAA
>XM_010558636.1 PREDICTED: Tarenaya hassleriana carboxyl-terminal-processing peptidase 2, chloroplastic (LOC104826103), transcript variant X2, mRNA 
AGAAAAACACAGCTGGAAATTTCTGGGGACGCGCTTTCATGGATGTCTCAGCGAGCTCCTCACTATCCCCAATTTTCACCAAGCATAATGACAATAGCAGGAGCCCTAATTTCTCTTCGAAGAACCCGGCATTCCAGGTGAAATCGTTTATTACATGCCAACCTCCAAAGTTTTTGGAAGTTGGCTTTACAAAACATGCAAGAAATGTCAGTATCAAGCCCAGGAGCCATGGAATCCTGAGAATCGTGGTCTTGCCCGAGTTTGCTCCAACCACAAGAAGCGAAAATCTGCGGAACAAATTTCTGCGTCTCGTCAAATGCAATTACCATAAGAACAGGCCTGGGGAAGTGGTCATGAATTGTTCCAACAAGTTCAGACAGAATGTCTCCCTTGCATTAGTTCGGCTTGTTTCTGTTCTGCTTGTCTCTTCCATCTCCGTTGTTCTCACTGAATCTCCATCCTGGGCTCTTACCGAAGAAAACCTTCTCTTCCTCGAGGCATGGAGAACGATTGATCGCGCTTATATCGACAAAACCTTCAACGGGCAGAGCTGGTTTCGTTACAGAGAGAATGCTCTGCGAAATGAACCAATGAACACGAGACAAGAGACATACATGGCTATTAAGAAGATGCTTGCCACATTGAACGATCCTTTCACCCGGTTTCTGGAGCCTGAAAAGTTCAAGAGTTTGCGGTCTGGAACACAAGGGGCGCTCACCGGTGTAGGGCTGTCGATAGGGTACCCTCCTGGATCGGGTGGATCACCAGCTGGCATTGTCGTTATATCAGCTGCTCCAGGAGGTCCTGCAAACAGAGCAGGGATTTCTCCCGGGGATGTTATCCTATCAATAGATAAGACTACAACAGAAAGCCTAACTATATACGACGCTGCAGGGATGTTGCAGGGACCTGACGGGAGCACGGTGGAGTTAACGATTCAGAGTGGACCCGAAACAAAAGTCTTGTCTTTGACGCGAGAGAAAGTATCAATGAATCCAGTGAAGTCAAGATTATGTGAAATTCCTGGTTCTGAGAAGAATGCCCCCAAGATCGGGTATATCAAACTAACATCATTCAACCAGAACGCTTCTGGTGCCATCAAGGAAGCAATTGAGACTCTAAGAAGCAACCACGTTAACGCATTCATATTGGATCTCCGAGACAATAGCGGTGGGCTTTTCCCAGAAGGAATCGAGATCGCCAAGATTTGGTTAGATAAGGGAGTGATCGTATACATTTGCGACAGTAGAGGCGTACGAGATATATACGACACAGATGGAAGCAATGCCTTAGCGGCTTCCGAGCCTTTAGCCGTCCTCGTTAACAAGGGAACGGCTAGTGCCAGCGAGATATTAGCCGGCGCCTTGAAGGATAACAAACGTGCCGTCGTGTTTGGGGAGCCGACCTACGGGAAAGGTAAGATACAGTCAGTGTTTCAGCTGTCAGATGGTTCTGGCCTGGCTGTGACTGTTGCTCGTTACGAAACCCCGGCCCACACTGATATCGACAAGGTCGGCGTAATTCCCGACCATCCGCTTCCTCGGTCTTTCCCGAAGGACGAGGATGCTTTCTGTGGCTGCCTCAAGGATCCCGGAGCTGAGTGTTATCTCAACCAAGGCCAGCTGTTTTCTAGATGATCATTCTTACTTCTCAAGGATGAGCATTCTTTGTTGAAGATTTTTCCTTACCTGTAATCCTTCAAAGATGTAGAGTTTAAGATACATGTATAAATATAAGAACCCATGACAATGGGAACCAGTTCAAGTCATTAAGACAGAACAGACCATGGATGGATTTCTAACTTCCTCTGTACTGTCTTGTTGTTTCAAGAAACAATTTCTCAAGTCTCAAA
>EF527335.1 Lepiotaceae sp. PA501 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
GTAGGTGAACCTGCGGAAGGATCATTATTGAATACCACTCGATGGGTTGTAGCTGGCTCTTTGGAGTATGTGCACACCTGTCTTGATTCTATTCATCCACCTGTGCATTTTTTGTAGTCTTCTGAGGGTTGGATCAGTCGAAAGACTGGATAAGAAGAGGATTGCAAGCACGCAAGTGCAAGCTCTCTTCAGTAAACCAGCCTTTAGAGTCTATGTCTTTTTCATAAACGATGTATAAGAATGTGATCAAATGGGTCTTTGTACCTATATAAAATGTCATACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCAGTAATTTCTCAAACCCTTCTGGCTTTTTGTAGTCGGCTTGGGCTTGGATAGTGGAGGTTTTGCAGGCCCCCCCCCCCTGTGTCTGCTCCTCTGAAATGCATTAGCGGAACCTTGTTTGCGATCCGTCACTGGTGTGATAATTATCTACACCAAGTGGGTTGCTCTCTAGATGTTCAGCTTCCAATGGTCCCTCTGTGTGGGACAACTTTCTGACTTCTTGACCTCAAATCAGGTAGGACTACCCGCTGAACT
>XM_002141234.1 Cryptosporidium muris RN66 flavodoxin-like fold family protein, mRNA 
ATGACTAGGAATGGGGTAACTGGTCCAGATGGTGCACATATATTGGTAATCTTGTCACATCCAGGGAAATCAATAGCAAATCAAGCAATAATTGATACTCTAGTTGAGAAGTTTGGCCAAAATATTCAGGTCAGACACTTGAATCAACTTTATCCAGACCAGAAGATAGATATAGAAGCTGAACAAAGAGCCTTAATTAGTGCAGAGCTTGTTATCTTGCAATTCCCAATGTATTGGTATAATATGCCTCCCTCATTAAAGAACTGGCTAGATTTGGTTCTCTCCTATGGATTTGCATATGGAACCTCGTATAAACTTGAGGATAAACTTCTCCTTGTATCTATTACCACAGGGGGTGAGGATAAAAAGTATGAAAAAAATACAGTAAATGACTATCTAATGTCTTTAGAATCAACATCAGAATTTATTAAGATGAAGTTTGCCGGTATACTAGCAGTTCATTCAATGCTATTAGTGCCAGGATTAGTGGGAGAGGAATCTGATATTAGGAAGAGAGCAAGTAACCATGCAAAACAAGTCGTCATCCCGAAAATTGAGAGTTTATTATCTAGATAG
>JN440197.1 Uncultured organism clone SBYB_3348 16S ribosomal RNA gene, partial sequence 
AACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCAGGCGTTATCCGGATTTATTAGGTTTAAAGGGTGTTCAGGCTGTCTGGTAAGTCAGAGGTGAAAGTCGGTTGCTTAACGATCGAATTGCGCTTTGAAACTGTCAGACTTGAGTATGGATGTGGTAGNCGGAATGTGTAGTGTANCGGTGAAATGCATAGATATTACACAGAACTCCAATTGCGAAAGCAGCTTACCAAACCAGCACTGACGCTGAAGCACGAAAGCGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCACGCAGTAAACGATGCTCACTCGCTGTTGGCAATACACCGTCAGCGGCTAAGGGAAACCGATAAGTGAGCCACCTGGGGAGTACGATCGCAAGATTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAACATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCTGGGCTTAAATGTGAAGTGCATTGTTTGGAAACAGACATTTCCTTCGGGACTCTTTACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGGTTAAGTCCCATAACGAGCGCAACCCCTATTGTTAGTTACCAGCGCGTCAAGGCGGGGACTCTAACGAGACTGCCGGTGTAAACCGCGAGGAAGGTGGGGATGACGTCAAATCAGCACGGCCCTTATGTCCAGGGCTACACACGTGTTACAATGGTCGGTACAGAGGGCAGCTAGGCAGCGATGTCAAGCGAATCTCGAAAGCCGATCCCAGTTCGGATTGGAGTCTGCAACCCGACTCCATGAAGGTGGAATCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCATTGTACACACCGCCCGTCAAGCCATGGAAGTCTGGGGTGCATGAAGGCCGTAACCGCAAGGAGCGGTCTAGGGTAAACAGATGACTG
>HQ302012.1 Uncultured bacterium clone E416QYJ01EWDEE 16S ribosomal RNA gene, partial sequence 
ACGCTCGACACCTACGGGAGGAAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGGAGGAAGAAGGTCTTCGGATTGTAAACTCCTGTTGTTGGGGAAAAAGAGGATGGTACCCAACAAGGAAGTGACGGCTAACTACGTGCCAGTAGCCGCGGTAATCTGAGCGGGCTGGCAAGGC
>XR_004686820.1 PREDICTED: Populus alba membrane-anchored ubiquitin-fold protein 3 (LOC118044643), transcript variant X2, misc_RNA 
TGTGTTTCAGTTCACCAACAAAATAACAAACAAAACACCTACTCCCCCTCCTCCTCCACCTTCTTCACTACCAATCCAAGCCCGTCTCCTTTTTATCTTTTTCCCAAAAAAAAAAGGCAGACTGTTAATTATTTTGTCATCAAAATTTAAAGAAAAGAAAAAGGTGTCTTTTTTGATTGGGGAAACCGAGAGTGGAATATTAAACACGTTGTGGTAATTGGTTGGAGGAGGAGAAGGAAACAGGTCAAAAGTCAAATAGAAATGCCGGAGGAGGATTTGGTGGATATAAAGTTCAGGCTTTATGACGGGTCGGATATCGGACCGTTCCGGTACTCATCAACGTCTACTGTTGATATGCTTAAGCAGCGGATTGTTTCTGATTGGCCCAGAGGCAAAACAATAACTCCCAAGGCAGTGAATGAAATCAAGCTGATAAGCTCTGGTAAAGTCTTGGATAACAACAAGACTGTGGGTCAATGTAGAACACCTTTCGGAGAAGCGGCCGGGGGAGTTATCATAATGCATGTTGTTGTACAGCCATCTCTAGCAAAAACCAAAACAGAAAAGAAGATTGATAAATCTCCGAAGAAAATCGTGTGTTCGTGTTCCATAATGTGAAGGCAAAGTACGTAGAAATCTCGGGAATTGCACCCATGGTACCAACACTTTAGGTTACAGAAATACGGATTC
>XR_004968528.1 PREDICTED: Myotis myotis U6 spliceosomal RNA (LOC118659394), ncRNA 
GTGCCCGCTTCGGCAGCACATAGACTAAAATTGGAACGATACAGAGATTAGCGTGGCCCCTGCGCAAGGATGACATGAAAATTCCTGAAGTGTTCCATATTTTT
>XM_034024519.2 PREDICTED: Acipenser ruthenus methionine aminopeptidase 2-like (LOC117414742), mRNA 
GCGCTTCCTCTCTCGTTGTGTTTCCATCATGGCGGACATGGTGCGGCAACAGGAGCAAGAGAAAAAATCTGAGCAAGAGAAACACTTGAACGGGGAGATGGAACCCGAAGACAAGGAAGAGGCGGATACGACAGAGGAAGCAGCAAAGAAGAAGAAGAAAAAGAAGAAGAAAAACAAGTCTGCAGGAAATAATGAAAATGAGAGTAATGCCAATGCTGCTGGTGTTGACAAAGTGACAGATCAACTGGAGAAACAAGCCCTGGAAGACAAAGAGAAGGATGAGGAAGGAGAGGAAGATGGAGAGGAAGGAGAAAATTCAGCTGGGAAGAAAAAGAAGAAGAAAAAAAAGAAAAAGGGATCAAAGGTTCAAACTGATCCACCTTCAGTTCCAATCTGTGACCTCTACCCAAGTGGAGTCTTCACAAAGGGACAAGAATGCGAATATCCATCTACGCAAGACGGACGAAGTGCTGCCTGGCGCATGACCAATGAGGAAAAGAAAGTATTGGATAAAGCCAATGAAGAGGTTTGGAGTGATTTCAGACAAGCAGCTGAGGCTCATAGACAAGTCAGGAAGTACGTCTCAAGCTGGATCAAACCTGGAATGACCATGATTGAGATCTGTGAAAAGCTGGAAGACTGTTCCAGAAAACTGATCAAAGAGAATGGTTTACATGCAGGCCTGGCATTTCCAACTGGCTGTTCTCTGAATAACTGTGCTGCTCACTATACGCCCAATGCTGGAGACCCGACAGTTTTGCAGTATGATGATGTCTGTAAAATAGACTTCGGAACGCACATCAATGGTCGCATCATTGATTGTGCTTTTACTGTAACGTTCAATCCAAAGTATGATAAGCTTCTTGAAGCTGTGAAAGATGCCACCAATACTGGAATCAAGTGCGCTGGGATAGATGTCCGCCTTTGTGATGTTGGTGAAGCTATACAGGAAGTCATGGAATCCTATGAGGTTGAACTTGATGGCAAAACATATCAAGTGAAGCCAATACGTAACTTAAATGGGCACTCCATTGGACAGTACAGGATACATGCTGGCAAAACTGTTCCCATTGTCAAAGGAGGAGAAGCAACACGAATGGAGGAAGGAGAAGTGTATGCCATAGAGACTTTTGGCAGCACAGGAAAGGGGGTCGTTCATGATGACATGGAGTGTTCGCATTATATGAAGAATTTTGATGTTGGACATGTGCCAATCAGGCTACCCAGGGCTAAACACATGCTGAATGTAGTCAATGAACATTTTGGCACGCTGGCTTTTTGCCGCAGGTGGTTGGATCGCCTGGGTGAGACAAAATATTTAATGGCTCTGAAGAACCTTTGTGACTTGGGTATAGTGGATCCCTACCCTCCACTCTGTGATACTAAAGGCTCCTATACAGCACAGTTTGAGCACACCATTCTGTTACGCCCCACTTGCAAAGAAGTTGTGAGCCGTGGAGATGATTATTAAGCTCTGCAATTTATTTTCTTTCTTACATTATTTTTCCTGACAAGCTTTATCCTTTCTCACTTTGCTTTGGCAGAAATCAGCATGAACTAATTAATCTGAAGCTCGGTGTCTGTCTAAGCAGGGGACTTGTATATCTGCCATGTTTTGACAGGGATGGGAAATAGGTGACAAACTAATGTTTTCAGTTTTTTGTATATTTCTTTCTTGATCTAGAAATGATGAATGTATGCACATCCTATTGCTGATTTATAACACCTATGCCCAGTGTAGGATTGCCTTTTGAATTTTCCTGAAAGTTTTTTTTTTTTGTAAAAATAAAGATTAAACTCAAATCTGATTATTGGTTTCAATATTAATTCAATGTGTTAATTCTTCTGATTTGTCTATTCATCTTCTTTCCCCTGCCTCACTTACTTTTAGAACAGAGCATTGTAATTTATGGTCTTTCTGATTTTAATTGGGCAAGCTACACTTTTTAAATGATTTAATTGTGATTTTATTTATCAGTAATTCCACAATCCTTGCCACAACTTCCATCCATGATTCAGTACACACTGGGAAAGCATCCACAAACACCAGAAAGTAAGGATATTTATGTAGGTAGTATGTTCTGAACTGTACTTGCCTTCATACACGCTTGATTATTTTTTTATTTGTTTAGTGTTTTTACTCCCAATATAATTAATTTGGTACTGAAACTACTTTTGGGAGCAGCAGCCAGAATTACATGAAGTCTTTTTACTAATTTCCTCTTAAGTGTGAAGATAAACAGACGTGATTCTGGCCCAGGTGATCTCTCGTGCAAGTTTTAACTTAGTGTGAAAACAGTATTAGGTTTCTAGGTAGCCTCACTACTGCATAACTGATTTGAGTTTGAAAACTAAAGATGGTAATGAAC
>XM_046102345.1 Truncatella angustata uncharacterized protein (BKA67DRAFT_558781), mRNA 
GCCGCCGCAGCCCTTTCCACGCCCGGCGCCGCCTACTCATCCTACGACCAGGTCATTACATCCGATGACTCGGACCGCATTTTCCACTACTACCCCGACGTGATGAATGCCTTCGGCGTTTCACGTCTCCGTCTGAGCAGCATTGACGAGATTCCTAAGGGCGCCGATATCATCACCTTGTTGCCCGTGAACTATGATGAATCGGACTCTACCCCTGGAATATACATGGCAGTCGATACCAAGGGCAACTACTTCTACATCATGGCCTGTGACATCGAGGGTGACGCTGCCAAGATCTTCATTGCGTCTGATCCGGATGCTGGTGCTGCCAAACTTGCCGAGGCGGATCTGCGCTACATCGTTACTGGTGGTGTTGTTCAGGATTGTTCCTTCATGCCATTTGTCTCGACTGGTGCCGGTTTGTCTTAAATGAATTTGGTGGCGTAGTGCTGTGAGTCGTACATTTGGCAAAAGGCACCTTGGTTTCTTATTACCTTAATTTGGGGCTTTCTTTGAGTACTACCGTACAACCCAATTTTTCATTGTCACAGCCATGTACCAACCATCATATGAGTAATACTTAACTGGCCCACAGAAAGTATGCACTGGAAAGAGGCCTTCTATTTCCAGTGCAACAACAATATAAGCAGTTACCTCAAA
>XM_052329315.1 PREDICTED: Diospyros lotus uncharacterized LOC127796910 (LOC127796910), mRNA 
ATGGTCGCCGACGAAGCTTCGTCGTCGGCGACCATGGAGATCGACCGGGCTTCGTCGCGAACGAAGCCCCACGGTCGGGCTTCGTTCGCGACGAAGCCCGCTGGGGAGAGGAAGCGCCCGATCGGGCTTCAATTACAGACGAAGCCCGATCGGGCTTCGATTGAAGACCCAAGGAAGCCCGATCGGGCTTCGATTGCAGACAAAGCCCGATCGGGCGCGACTAAGCCCCACACCCAATTGGGCTCCCCCGACTGTTGGGCTATGACACAGCCCGATTATCGTTGCCCAACAAAGCCCAATCAAATGGCTGAACAACAAACTACAAAATTTGCTTATGTTCATGCTCACCGAATATTACCCCCCGGAATGCGAGTTACTACTCATTGTGGGATTAAACACCTTGAGGCGATGCGTCGTGCTCTAGACCGATACAAGTTATTGGATAGATTCCTACAGGGCCCATTAGGACATTTCTTGAAGATGCCTTTGTCCCTCCATTTGACTGCACCACAGTTGATATATCATGTTCTACTTAGGGAGGTGACATTTTCGAGTGCCCGCCACGATGAGATGTGGTTCGAGATTGGCGGCACACCATACAGATACGGGAGGCAGGAGTTCATACTTATTAGTGGACTCCGATTTGGGGCTATTGATAGGGAAAGCCTTGAACCGAAACCTATTGAGCCGGAGAGTTTACGTGCTCGACTATTTCCACAACATAAGAAAGGGGTGACTGGAGACGACCTTGAATTACTTATTAGTACCAAAGAGGATATGGTTTCAGAGGATGCCCTGAAACTGATTTACATTGCTGTGGTCGACATGTTTTTGTTGGGCCAGGATGAGCGTGGGCATGTGGATGATTTCTTGTGGACTATGGCCGAGGATTTACAAGCATTTGAGATGTTCCCTTGGGGTACATATGTCTACAGTAAGAGTCAACATTACATCCGGTTGGCCACGAAAGAAAGAAAATTGACTGGTGAAGGTGGGAAGAAAATCAACCTTTATGGTTTTGTATGGGCGTTTCAGTGGTGGTTGATCGAAACGTTCCCATGGATTCAGAATAAATGGGCCGTCAGACCGTCCGAAGCAGACATTCCAAGATGCAGAAAATGA
>XM_019061330.1 PREDICTED: Bemisia tabaci neutral ceramidase (LOC109043949), mRNA 
ATCATTGAAACCCCGTTTAGGTCAAGCTCGCAGTTAAAAATGGATTTCGTCCAGTGCGCTTGAGTACAGCAGGAGCTGAAGCTTTGTATTACTATAATGCGAGAACACTTTTTACTCTGAAAGGCTGGATAACTGAGAAGACCAAAGTCGTAGTTCGAAATGCCGGGTGTATCGCGACAAGTCTGTTTGATATTGGCCAGCTTTGTAGCTTTCTGCGAATCGGCTTACAAGATTGGAGTGGGGATAGGGGATGTGACTGGTCCAGCGGTTGGAATCCCATTCATGGGCTACGCAAACCTCAGGCAGAGGGGTGAGGGATTGCATTTGCGACAATTTGCAAGAGCTTTCATCATAGGTGACTCCTACGAGAAACTCGTTTTCGTGAGTGTAGACGTGGGAATGGGCGCACACGGAGTCCGAATGAAGGTGCTGAAGCGGCTGAGGGAAAAATTCGGCGAGGAGTTCTCGGAGAGGAACTTGATGATAAGCGGGACGCATACCCACTCGGCGCCAGGCGGGTTCCTCATGCATTTCATGTTCGACATTAGCACCATGGGCTTCGTCCCTGAGACTTATGACGCCCTTGTTTCCGGCATTGTTACGAGCATAACCCGGGCGAGGAGTAACATGCGGAAAGGAAGTATATTTTTCTCGACAGGAGAAGTTTTGGACGCCAATACGAACAGGAGTCCATCCGCTTATGACAACAATCCAGAGAGCGAAAAAGCCAGATTCGAGTACAACGTGGATAAAAGGCTGATTCAGATGAAATTCGTGGCGGAAACGGGTCAACCGATGGGCGTGCTTAACTGGTTCCCGGTGCACCCAACCAGCATGAACAACACCAACACCCTCATCTCCAGCGACAACGTCGGTCTCGCCTCTGTCCTCTTCGAACAGCAGATGAATCCGGGACGTTCTATCGGCAAAGGCCCTTTTGTTGCAGCGTTCGCCTCGAGCAACTTGGGGGACGTGTCGCCGAACCTACGATCGCCGGTCTGCCTGAAAACCGGGGAGCCCTGCGACATGCTAACGAGCTCCTGCCCGGACGAACATGACATGTGCGTCGCCCTCGGACCCGGCGAGGACATGTTCCAGAGCACAAAAATCATCGCTCAACGGATCCTCGCCACCGCTATATCTCTTTGGAATGATCCTAACTCATGGGAGATCAAAGGACCCGTCCGGATGGTTCATCAATTTGTGAACATGGCTAAGCGGGAGGCAACATATCAAGATCCAAATACTGGCCAGATCCGACAGGTGCACGGTTGCAAGCCAGCTATGGGCCATAGTTTTGCTGCAGGGACAACCGATGGGCCTGGTCTTTTTGCGTTCAAGCAAGGAACCAAAAGTCCGGACAATCCACTCTGGAACTCTGTTTCCAGGATACTGCCCAACGCTTCAGCAGAGAGTGTTTCCTGCCATGGAGGAAAACCAATCTTGTTATCCACAGGCGAGATGAACTTCCCTTTCCAATGGCAACCGGAGATCGTGCCGACGCACCTGGCGACGATTGGGCAGCTGGCGGTGGCCTGCGTGCCGGGGGAGTTCACGACGATGGCCGGCCGCCGACTCAGAACCGCCCTCCGCAATCGCCTCGGCCTCGCCGACGACACCCACGTTATCATCGCCGGCCTTTGCAACGAGTACAGCGACTACATCACCACGCCCGAGGAATACGAGGTGCAGCGTTATGAAGGTGCGTCAACAATTTATGGCCCAGAAACACTACCACTCTACATCAGGCAGTACGAGGACCTGGCTGATCATATTCTTCGGAAAATGGACCCAGAGCGGGGCCCAGTTCCTCCTGAGTTTCTAAACAAATTAATTGTTCTCACACCACCTGTTTTATACGATGCTCCACCCTACGACCAAGACTTCGGAGCTTGTTTACAACATCCACCACTGAACGTCACCAGAGGCGAAACTGTCAACACTACGTTCGTCTCGGGGCACTTGCGCAACAACATGATGCGCGGCTCCAGCTTCCTCCTCGTCGAGCACCTTCCGATTAACGGGAACAAGTGGGAGGTCGTCGCCACCGACGCCAACTGGGAGACCATCATCACGTGGAAGCGGCAATCACTGCTACTGGGTACTAGTGCGGTGGTGATCAAGTGGACGGTGCCTGAGGACGCGCCGTTTGGGAAGTACAGGATCAAACACCAAGGCTACAGCAAACCCGTCATCGGGGCCCTGCACCAGTATCAAGGGCTCAGCAGAGTCTTCCAAGTTGTACCCAAAGATCTACCCTATTCATACGATGTCCCGCAAATACACGAGTGATCCTCTCAA
>XM_034027490.2 PREDICTED: Acipenser ruthenus phospholipid scramblase family member 5 (LOC117416435), mRNA 
GAGGGATCGGAGACAGAGAGAGCAGCGACTTGAGAACAGAAGGCAAGCTTCATCCTCTGTGATCTACCGTACAGGACACAGTTCACTTGTGGCTGGGTGGAAGGATTTAAAGAGGATGCCGGTGATCACGGCCCAGCCGCCCCCCTTCGGCAGGCTGCAGAGGGAGAAGCACATCGAACAGCTCTTCAGGTCCTTACGCCAAGGGAGTAGGGGGTCCCAGGAGCCACGGCACAGTCTGGGAGAGGAGGCAGGACAGGGGGACTCTGAGACACTGGAGCTGCGTTGCACGACGGAGCCGGAGGCCCAGTCCAGCATCCCCAGAGTCCTCAAGCCAGCGGGCGCCACGGAGAGCAGCGAGCAGAGCCTGGCTCTCTTAGCGGACGTGGAGCAGCTGTGCATCATAGCCAGGCCGGGGCTCCAAGGACTGGCCTGTGAGCCTGGGAGGACCTACAGCATCTCCACAGCTTCCGGGAGTCAGCTCTACGTGGTGGTCGAAGACACGTCATGCCTGTGTCTGCTCTCCTGCGGTCCCGCTCGCTCCTGCTCTCTCCGAGGGTATGACAGAATGGCGCAGGAGGTCTTCCTGTTTGAGAGGCCCCTGAGGGCTGATGCGTGCTGTCTGGGCTGCTGCCTGATGGAAATGCAAGTGTTCACACCTGACCACCAGCTCATCGGGACTGTGCGTCAGAAGTGGAGCATGTTTACCCCCCTCATGGAGCTCAGCGACTCGGACGGGACGTCCTATATCAGGATTCAGGGCCCCTGCTGCCCCTGTCGTTGCTACTCCAGCCAGGAGTTTCAGGTGGTGTCCAAGATTGGAGACAAATTGGGAAAGATTTGGAAAAAATGGCCTGGCTTCAATGAAGAGTACAACATGGACCACGAATACTTCGGGCTGGATGTCCCAGCTGAAATGAGCCCGGAAACCAAAGTGCTGTTACTGGCTGCTGCGTTCTTACTGAACTACATGTTCTTTGAGATGAGCTGAACATACTGGAAGAGTACAGAGCGCCAGCCCTGACCAATGGGAGCACAGAGAGATCATGATGTCACAATGAAAGGTGTCACAGTGGCTGCACAAGGAGTAACGTTAAGAATCACATGTTTGTATCGGAAAACATTATTGCAGCAGTTTGAATGCCAGGGCATGGATAGGATTATTAACAGAGGCATTCACAGTGCAAGAGCCCCATTCAGACAATGCGCAGAAGGGTTAGATCACCCACAGCATATTCAACTAATGTAAAGCACTCAACTTTAATCCAATACCAGACACATACCTGCTCACCCTGAGATCGAAATCCTATGGATCATTCCAGCTGAAATCTGTGTCATAAAAAGTGCCCTGAAAAAATCTACCTTTAAAGAGCAAAGGAGCCCCCTTCAGGACATCATAAGCATGTAATGGCACCGGACTTTATACAATGACAGCATGTTGATGTAAGCAGGTACAGTATGTTAACATGAGCAGCACACTGTGCTCCTCAATGTGGTGAGGCTCACATTACTAATCTTGTGTTGTACTACAGTATATCCTGATCTGTGCTCCTCAATGTGGTGAGGCTCACATTACTAATCTTGTGTTGTACTACAGTATATCCTGATCTGTGCTCCTCAATGTGGTGAGGCTCACATTACTAATCATGTGTTGTACTACAGTATATCCTGATCTGTGCTCCTCAATGTGGTGAGGCTCACATTACTAATCTTGTGTTGTACTACAGTATATCCTGATCTGTGCTCCTCAATGTGGTGAGGCTCACATTACTAATCATGTGTTGTACTACAGTATATACTGATCTGCAACATGTACCTGCATGTGACTGACTGATTGCAGGAGCTACATGTTTACAGCCACCTCTGAATCAAGACTCAGAATAGCCTTCTTTTCATGCTTTTTCTTTTTTAATTTGATAAATAAAAACGATTTTGTAAAATA
>XM_048518335.1 PREDICTED: Sphaerodactylus townsendi coiled-coil domain containing 88A (CCDC88A), transcript variant X5, mRNA 
GAAGGGAGAGGCTGAAGCAGCTGTTTTTTTTGGGGGGGGGGGATGAAGGAATAGGCAACGGGTGGGGTCCTGCTAGCAGTAGTTGACCTACCATTTTTGAAAAGGCAAGTCGGGGAGGCACCTCCAGATATCTGGTGGTGGTGGCAGAGAGAGAGCGCGCCCCTGTTTCCTGGGAAAGTGGGCGAGGTTGCCCGGGCGCCTCTTGTCTGCAGAAAAGGAAGATCAGTGCTAGTTCGGTGGAAAGAGGAGTGGTTTTTCTCTCTGAGCTGGCCTTGGGTGAATGGTTGTTCCTGCAAGGAAGAGAGACTTGTTGGGGGCTGATGAGGGAGGAGGTCGCTGCTGCCCTCCCCGCGGCTGGCACGCTCTTGGTGGGTCAGGGGTAATTAGCTGAGAGGAGTTTCACTGGCGTGTCTCCCCCTGGAGCACGCCGGCTGCTGGCTCGCTGGTGCTGCAGCCCGAGGCGGAGTGGGGGGGAATGCATGCTTGCTTGCGCGGCTGATGTAGGATCTTAGTAAGGTCCTTCCTTTCTTTCTCTTCTTGCTTCCTCTTCGGCACGGAGAGAGGAGGAAGAAGGAGTCATTTGGTGGAAATAAAGAAAAACAACCAGAAATGAACGTGGACTGCCTCTTGATTGTTCCCTTTCTGGACGAGGAAGAGAAAGCTCTTTTGACCGATAGCCTGACTACTTTTTAAATTGTATTGGGGGAACTGCCTTGGATATATATTTTTTCTTGAAATCGTGGAGCATTTCACGGAATTACTGCAACGAAAGGCACCGAATCTCTCCGTTTTTTTAGTCCTGGTTTAATAAAAACCCTCTTAATTATAAAGCATGGAAAACGAAATATTCACGCCTCTGTTGGAGCTCTTCATGACCAGCCCTCTTGTTACCTGGGTTAAGACATTTGGACCGTTAGCTGGAGGAAATGGAACCAACTTGGAGGAATATGTTGCGCTTGTGGACGGAGTTTTCCTGAATGAAGTCATGCTGCAAATCAACCCCAAAGCTACCAGTCAGAGAGTAAATAAGAAAGTCAACAATGATGCATCCCTGAGAATTCAAAATTTGTCTGTTTTGGTGAGGCAGGTTAAATCGTACTATCAGGAGACTTTACAGCAGTTGATTATGATGCCTTTGCCAAATGTCTTAATAATTGGCAAAAACCCCTTTTCAGAACAAGGTACTGAAGAAGTAAAAAAGCTACTTCTACTCCTGCTTGGCTGTGCAGTTCAGTGTCAGAAGAAAGAAGAATTCATTGAAAGAATCCAGAGTTTAGACTTTGATATAAGAGCAGCTGTTGCAGCCCACATACAAGAGGTGACACACAACCAGGAAAATGTTTTTGATCTGCAGTGGATGGAAGATGGTGCTCTCTCACAAGAGTATATTGAACCCCTCCTAAAAAATATGGCATTGCATTTAAAAAAACTTATAGATGAACGAGATGAGCATTCTGAGACTATTATAGAGCTCTCTGAAGAACGAGACTCTCTCCATTTTCTACCTCATGCTTCAGTGGCACAATCGCCTTGTGGATCTCCAGGCATGAAACGTACTGAAAGCAGACAGCATTTATCAGTAGAGCTAGCAGATGCCAAAGCAAAGATCAGAAGACTTAGACAAGAGCTTGAGGAAAAGACAGAACAGTTGCTGGATTGTAAACAAGAACTGGAGCAGATGGAAGTTGAGTTGAAGAGACTACAGCAAGAGAATATGAATTTGCTTTCGGATGCACGCTCTGCTAGAGTGTACCGTGATGAACTAGATGCTCTCAGGGAGAAGGCAATCCGTGTCGACAAGCTTGAAAGTGAAGTCAGCAGATATAAAGAGAGGCTACATGACATTGAATTCTACAGAGCTAGAGTGGAGGAACTCAAAGAAGATAATCAAGTATTGCTGGAAACAAAAACAATGTTGGAAGATCAACTGGAGGGGACCCGGGCTCGTTCAGATAAATTACATGAATTGGAGAAGGAGAATCTACAGTTAAAAGCTAAACTGCATGATATGGAGATGGAACGTGACATGGATCGGAAGAAAATTGAGGAACTTATGGAAGAAAACATGACTCTAGAAATGGCTCAGAAGCAAAGTATGGATGAGTCACTGCATCTTGGATGGGAACTTGAACAAATAAACAGATCCACTGAACTATCTGAAGTGCCACGAAAATCACTGGGGCATGAAGTGAATGAACTGGCATCGAGTAGGTTACTGAAACTGGAAATGGAAAACCAAAGTTTGATAAAGACTGTGGAAAAGCTACAAAGTACAATGGGATCTGCAGAAGGCAGTAATTCAAAACTTCTGAAAATGGAAAAGGAAAACCTGAGACTTAGTAAAAAGCTGCAAGGACTTGAGAATGAATTTAGCGAAGAGAAGCAAAGTCTTCAGAATAGTCAAAATCTAAGCAAAGATCTGATGAAAGAGAAAGCACAGCTTGAAAAGACAATTGAAACTCTGCGAGAAAACTCAGAGAGACAGATTAAAACATTGGAACAGGAGAATGAGCATTTGAATCAAACAGTGGCTTCCCTCAGACAGCGCTCTCAAATCAGTGCTGAAGCAAGAGTCAAAGATATTGAAAAGGAGAATAAAATTCTTCATGAATCTATCAAAGAAACAAGCAGTAAATTAAATAAGTTAGAATTTGAAAAGAAGCAAATTAAAAAAGAATTGGAACACTATAAAGAGAAGGGAGAGAGGGCAGATGAGCTGGAAAAAGAAGTACAACATCTTGAAAAAGAAAACGAGCTGCTACAGAAAAAGGTTACTAACTTAAAGATCACTTGTGAAAAAATAGATACTTTAGAGCAAGAAAACTCCAATCTGGATATGGAAAACAGAAAGCTGAAAAAGACCTTAGATAGCCGGAAAAACCTCAGCTTTCAGCTAGAATCTTTAGAGAAAGAGAATACACAACTTGATGAAGAAAATTTAGAACTCAGAAGAACAGTTGAATCTTTGAAGAGCATAAACATCAAAATGGCTCAGTTACAATTAGAAAACAAAGAATTGGAAAGTGAGAAAGAGCAGCTTCAGAAGAGCTTGGAGCTTATGAAAACATCTTTTAAGAAGACTGAACGTTTAGAAGTCAGTTACCAAGGTCTGGATACGGAAAACCAAAGGCTGCAGAAAGCCCTAGAAAACAGCAACAAAAAGATTCAGCATTTAGAAAGCGAACTACAAGATCTAGAGACAGAAAATCAAACCTTGCAAAAAAATTTAGAAGAACTCAAAATTTCTAGTAAACGCTTGGAACAGTTGGAGAAAGAAAACAAACTTTTGGAGCAAGAAACCTCTCAATTGGAGAAAGATAAAAAGCAACTGGAGAAAGAGAACAAGAGACTGCGGCAACAAGCAGATATTAAAGACAGCACTTTAGAAGAAAACAACGCAAAAATCTGTAACTTGGAAAAAGAGAACAAGTCTCTCATTAAGGAAATTGGTCTATGTAAAGAAGCTTCTATTCGACTAAAAGAAGCTGAAAAAGAGAATAAAGAACTTGTAAAGCGAGCCACCATTGACAAGAAAACGCTTGTCACATTGCGAGAGGATTTGGTGAATGAAAAGCTGAAGACGCAGCAGATGAATAATGATTTAGAGAAGCTTACACACGAACTTGAAAAGATTGGTTTGAATAAGGAGCGCCTTTTGCATGATGAGCAGAGTAGTGATGACAGTAAATACAAACTGTTAGAGTCAAGGTTGGAATCCACATTGAAGAAATCGCTTGAAATAAAAGAAGAAAAAATTGCTGCTTTGGAAGCTCGACTAGAAGAATCAACAAATTTAAACCAACAGCTGCGCCAGGAACTTAAAACAGTTAAAAAGAACTATGAAGCACTCAAACAGAGACAAGAGGAGGAGAAAATGGTACAGAACTGTTCCCCAAGAACTGGAGAAGAATCTCAGTCGGTTAATAAGTGGGAGAGAGAAAGTCAGGAAACTACTAGAGAACTTTTGAAGATTAAAGATAGATTAATTGAAATTGAGAGAAATAATGCAACACTGCAGGCAGAGAAGCAAGCTCTGAAAACACAACTAAAGCAACTTGAGACACAGAACAATAATCTGCAGGCTCAGATTTTGGCTCTTCAGAGACAAACAGTTTCCTTACAAGAACAAAATACAACTTTACAAACTCAGAATGCCAAGCTTCAGGTAGAAAATTCAGCTATTAATTCACAAAGTACATCTCTTATGAATCAAAATGCACAGCTGCTGATCCAACAGTCTGCCTTAGAAAATGAAAATGAATCTATAATCAAAGAACGGGAGGAACTGAAATCACTGTATGATTCACTAGTCAGAGATCATGAAAAACTGGAACAGCTTCATGAACGGCAGGCTGCAGAATATGAATTATTAATTTCCAAGCATGGAAACCTTAAGTCAATGCACAAAAATCTTGAAATGGAACATAAGGACTTAGAAGACAGATATAATCAGCTGCTGAAACAAAAAGTGCAATTAGAAGAATTTGAGAAAGTTCTCAAAGCAGAACAAGAGAAGATGGTACAGCAGAACAAAATGCATGAAACTGTAGCTGCAGAATACAAAAAGCTTTGTGAGGAAAATGGCAGGTTAAATCATACATATACCCAACTTTTGAGAGAGAATGAAGGTCTCCAAGTGGATCATAAGAATTTGAAAACACTTCTGAACAGTTCTAAACTGGAACAAACAAGATTAGAAGCTGACTTTTCCAAGCTCAAAGAACAGTACCAACAACTGGACATTAAGCATACAAAATTGAATAATCAGTGTGAGTTGCTTAGCCAATTAAAAGGAAACTTGGAGGAAGAAAACAGGCATTTGTTGGATCAAATCCAAACATTAATGCTGCAAAATAGAACACTATTGGAGCAGAATATGGAAAGTAAAGATCTCTTCCATGTTGAACAGAGACAGTATATAGACAAGCTAAATGAATTAAGAAGACAAAAAGAGAAACTGGAAGAAAAGATTATGGATCAGTATAAGTTTTATGAACCGTCACCACCAAGAAGGAGGGGTAATTGGATTACTCTGAAAATGAGGAAGTTGATAAAATCTAAGAAGGATGTTAACCGAGAACGACTCAAGTCTCTTACTCTGACACCCACCCGCTCCGAGTCAAGTGAAGGATTTCTTCAGCTGCCCCATCAGGACAGTCAAGATAGCTCTTCGGTGGGCTCAAACTCACTTGAGGATGGTCAGACTGTGGGGGCCAAAAAAAGCAGCACCATGAATGACCTGGTGCAGTCCATGGTCCTAGCAGGAGGACAATGGCCAGGTAGTTCTGAGCACCTGGAGGGTCCTGATGATATATCTACGGGTAAAAGGAGAAAAGAATTGGGATCTATGGCCTTCTCTACTACATCCATCAACTTTGCAACTGCCAACTCTGCTGCAGGCTTGAGATCCAAGCAGTTGCTTAATAATAAAGATGCTACATCTTTTGAAGATGTAAGTCCACAAGGAATTAGTGATGATTCTAGTACTGGATCAAGAATTCATGCTTCCAGACCAGCCAGCCTTGATAGTGGCAGAACATCCACTAGCAATAGCAATAATAATGCCTCACTCCATGAAATCAAAGCAGGTGCAGTTAATAATCAAAGCAGGCCACAAAGCCACAGCAGTGGAGAATTTAGCCTTCTTCATGATCACGAAGCATGGTCCAGCAGCAGCAGCAGTCCTGTCCAGTATCTGAAAAGCCACACCAAGTCTAGTCCGATACTCCATCATAGACTGTCAGAAACCCTGGACAGACAAGGAACGTGGAAAATTAAGACCGACTCTCCTGGCAGTGAAGTGGTTTCCCTGCAGCAGTTTTTAGAAGAAAGTAATAAGGTTATTTCAACTGAGATCAAATCCTCAAGCCAAGAGAATCTTCTGGATGAAGTAATGAAAATTTTCTCTGAAAATGCTGAATTAGCTGGAAGAGATAAACCAAGAAAACACTCAACAGTCAGCAGTGGTATCGCCAGATCACAGAGTGTAAAAAACACATATGAATTCTCTGATGGAAAATTAGCTAGCCAAGATCACCTTGCAAGGTCCAGTACATATAGAGTGGAAGAGCCCAACTTCTTGAACTCTTCAAAAACACTTACAACAGGGACTAGAGGCAAGACCAAGTCTGTTAAGGAAAATATACAAATGAGCCAATCACGACAATCAAAAGATTGTAATCCTTATGCTACTTTACCTCGTGCAAGCAGTGTGATTTCTACAGCTGAAGGAACTACTCGGAGAACAAGCATCCATGACTTTTTATCTAAAGACCCTAGACAGCCAGTATCCATTGATCCATCTCCACCTACAGTTGACAGAAGCGTCCCATCAGCTTCTAGTGAGTACGGTCCTCCAGAACAGTCCTCTTGTGTTTTTCATTATAAACCTTTTACTGCAGTTACCCTGTCAGAAAATGATTTAGGCAGTATAGCTATGTTAGGTTATTCTGCTCATAAATCAGAAGAGCAGAATGTAAAGACTAGTGAGACAAATTTTAATGCTAAAACACTTTCTTATAGTGACATGTACAGTGAAAAGGTAGGCCCATCAATAAGCAGTGTAGGGAAATTCTCTCTCGCCTGTTTATCCATGCCATTTTTGACACTTAATACTGAATTAGTCAGTAGTGTAAGTGGATTGCCTCAAAGGCCTGTATCAAAAGCAACCAGCACAACTTCTGGATCATCAGTGAAAGCTGCACAGAAGGATCATAAGCTACCTTCTGAGAATCAGAGATCTGATGACAGAAATTTAGAAGTGACTCAGAACAGGAGTGAATATACTGTTGTTGCACATGTAAACATTAATGAGAGTAAATCCCCATTACCAGTTTCTGACGATACCCAAACTATTTGGTATGAATATGGCTGTGTGTGACTAAATAAAGATTAAATATATTCTCCCA
>XM_002842962.1 Microsporum canis CBS 113480 conserved hypothetical protein (MCYG_08091), partial mRNA 
ATGTCGGCGCCAAATCGACGTGGTGATGGGCAGACACCGCTAAACTCAGCTGGACCCAGCTCCAGTCCAGCCAAAACACCCTACAATGCGCTATTCAGATTATCGAGACTAGTGGCAGCGCCTTCGACTCCGGCACAGCAGAATGCTACCTCGTTCAACTCAAACAGACCGTCAGCGTCTCGGGCTGGCCGCCGGAAATCAGGGATGACGCCGTCACGGACAAGAGGCGGAGGTGAACATATACCAGTGACTCCGCATACGATAAGGGCATTCCAGAGACGTGCAGCAACATATACTCCGGGGCGGGATAGACGGAAGAGTCAGCGCTTCAAGCGGGAGACGCCAATGGATATTTTGAAAAACCTGGGGAAAGCTCTTGCGCCAATATCAAAACCGGTATCGTCTTCTCCGCAGACCGAACTAGAGGACGAGCCGGAGCCCCCAGTGGACGAAATTGAAGAATTAGACAGGGAGCCTCCCATTCCACCACCGAGACTTTCACTCCCGCTTAATGAGATGACTGTGGTCCAGGAGGACGATAACAGTCCCGAGATACCCCCTCCAAAACTGTCTCTCCTCCCAGAGGATGAGGACATTACGAGAGGGTCGATTGAATTGCCCCGGAGAGAGCGGTCAGGTCGAGATCTGGCCAGGCTGTCGAGAGTAAGCTTCGCCAGTAATCGTTTCAGTGATCATTTTGGGGACACCACGAACCTTGAAGATCCGGCAGAGGCATTGGACTTTCGTGTTGGACCAGAAGAGGACTTTGATGAGGATGTTGACAATACGACCGGACAACCGATGTTGGATGCAGGGGGAGAAACCGAGGATTTGGGCCGATTTAACCTCGATTTTGCCTTCCCAACGCCTGAAGCGCCTCATACTATGCCAATAGAGAATGATAATGAGCAGGACACCTTCGAGTTAGATGCAGTGCCACCCGAATTCGGTGGACCAGACAGTCCTTCATCAGGAAGCGATTTCGGGACAGCAGGATTCGAACCAGCCATGACCGATAGGTCGTCTAATCGGGGAGTCGTAGAGGAAGAAGAGGAGGAGGAGCAGGAGCAGCAACAGGAAGACCAGCCTGAGCCACCGCAGAAGAAACAAAAGCTGTCTAAACATGGGATACCGGTCCCAAGTCTGCCTTCTGGAGTCGTAAAGAAGCTGGCCATGCGGTTTGCAAGGTCCGGGAATAAAAAGACGAGAATCAACAAGGATACGATGGCGGCCATCCAGCAGGCAACGGATTGGTTCTTCGAACAAGCGAGCGGGGATTTGTCGACATATTCCAAACACTCTGGCCGAAAAACAATTGATGAAACAGATGTCATCGCACTGATGAGAAGGTAG
>JX319470.1 Uncultured fungus clone 034A1751 18S ribosomal RNA gene, partial sequence; internal transcribed spacer 1, complete sequence; and 5.8S ribosomal RNA gene, partial sequence 
AAAAAAAGCTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGTTCATGCCCTTACGGGTAGACCTCCCACCCTTGAATACTATACCTCTTGTTGCTTTGGCGGGCCGCTCCGGCTACCGGCTCCGGCTGGTGAGTGCCCGCCAAGGGACCTAAACTCTTGAATTATTGTGTCGTCTGAGTACTATATAATAGTTAAAACTTTCAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTTAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCGAGGGGCATGCCTGTTCGAGCGTCATTAT
>XM_040766144.1 Sporothrix brasiliensis 5110 uncharacterized protein (SPBR_07890), partial mRNA 
ATGGTCATTGAGACCAGCGGCAAGCTGCTGAAGGGGTATGATGACAAAGGGTACAGCCGAGCCTTCAACCGATTGTTTACAAAGGCCCCGGCAAACGCCGGGTACAACGACGGCTTGTCGGCCCCGCAGCCCGACTTCGTAGAGGGCCTCGAGAAACAAGAGTTCCGCCCGTTCCAGGCCGCCGACTATATCCCTGGAGCCACTCTTTATAAGGACGACCCCCGTTCCATAACCCTACCGATGATTGCTGGAGAATGGAAGGGCCCTGCTGGGGACATGAGAGAAACGAGAGTGCAGAGTGCCTACGACGGAGCAGCTCTTGTCCACGCAAGAAACCAAGCACTCGCCTACATGGGAGGGTCTGATCCCCCAGGCCACGCAGAAGTCACAACATTCACCGCAGACGGCACCAATCTCAACCTGACGGACGGAGACGTCTCAGGAACGCCCAAGACTATGCGAAGACTCAGTCCGAAGAACTAA
>L38765.1 Pisolithus tinctorius (F00031) mRNA, EST0038 
CGGCTAGCTGCTTTTAACTGAAGTATTGCAGCATGTAAGTTGTGGTTTATAAAGTCTTTCGCCATGCGAGGAACAAGTCGACAAATTTGATGAGCTTATTCATCTTATTTGTGTATGTTACCACACAATGATTCCCTTCTTTAATTGAAGTATTTGAG
>XM_018671993.2 PREDICTED: Lates calcarifer inhibitor of growth family, member 1 (LOC108880464), transcript variant X1, mRNA 
TCAATACACAGTCAGTGAGATGAAGGAACAAACCCGTCAGTGCCAAAGCAATGGGGACTCTGTAAATGGTGCAAGTGACTGGGTGTCCTGTGATAAAGACGAATTCGCAATGTTGAACCCCACCAATGGTGATCCAGGACATGTTGTCGTCAATTATGTGGAGGAGTATTTGGACCTCGTGGAATCACTACCTTTTGACCTACAGAGGAGTGTGTCTCTCATGAAGGAAATTGATGCCAAGTATCAAGATATTCTGAAGGAGCTTGATGACGCTTATGAACGTTATCGGCGGGAATCTGACTCACTTCAGAGGCGCAAGCTTCAGTCATCGATTCAGAGGGCGCTGATCCGCAGTCAAGAGCTTGGTGATGAAAAGATCCAGATAGCTGGTCAAATGGTGGAGTTGGTTGAGAACCGAACACGACAGTTAGACTGGCATTCTGAACTTCTCCTCTCCTCTCAAGAAGTCCCTGAGAGCCACGTTCCTACAGCAGCATCCATGACCACCACTGCAGCATCCTTGATGTCCTCATCATCAGCCACAATCACTCCAGGGAAACCTGGCCACCATGACAAGAAGCGTGATGAGGTAACCCCAGGCTCAGGTGGTGCAGACAAGGCTGGAGGGAAACGCTCAAGACGTCAGAAAAATGGAGAAAATCGGGAAAGTTATGGGGGTCTGGATCACACAGAGGAAGTGGGAGTGGGGGCGTCGCGGGAAAAACGTGCCAAAACATCTTCCAAGAAGAAGAAACGGTCAAAAGGAAAGTCTGAGAGAGAAGTGTCACCTCCAGACCTGCCCATTGATCCAGATGAGCCAACGTACTGCCTGTGTGAGCAGGTGTCCTATGGCGAAATGATAGGCTGTGATAACGATGAGTGTCCCATTGAGTGGTTTCATTTCTCCTGTGTTGGCCTCCATCATAAGCCAAAGGGAAAATGGTACTGCCCTAAGTGCAGAGGTGAGAATGAGAAGACCATGGACAAGGCCTTAGAAAGGGCCAAGAAGGAGAGGGCATACAACAGGTAGCTCGCGCTGCCTGGCCAAACGAACACTACTGCAGAGAAATTTAATTTTCTGTCTTGTCTTTGTTTCCATTTACTATTAACAGTGTTCAAAAAGAGTAATGAGTTGATGAGAGGGATCTTGTACATAGTTATTTTTGTAACTGCTGCATAGCCGAGAAACAAGATCACTCCCTCCCCCATTGGGATTATTTGTAATTGACACAGTACAGCACAGTACAACCTGCATGTTTGTAACCAGCTGTCCTCCACTCACATCCCCCATGTTTTCATCATGCATGCAACATCACCCACTCCACTATATATGCTCAATTAACAAATAAAATATTTCTAAACAAGGAAGAA
>XM_046503406.2 PREDICTED: Haliotis rufescens thymidine kinase, cytosolic-like (LOC124137211), transcript variant X3, mRNA 
GTCTAGTCCCTGAAGTGGTGTGAAAACCCGTAAACCATTTATGTGTACCTTATTTAATTAACCTCGGGCGACAAGCGAACTCGTGCACATTTCTGTGTTCCGTGTTGCTGCCAGTCGCATGTTCGCCTAATTTAGAACCTCAGTGGGCGTGATCCGGGGCGGAGCATAGCGATGTCAGTGGATCACACTTGTTAGAGCTTTAGACTAACTGTGATTATTATGGAACAAGCACGTTTCGCTACATCTATAACATATATCAATATGATGTCTACAAATCACCTGATCCCTTCACCAACGGCAGTTACCAGCCACAGAGGGCATATTCAGATAATCTTTGGACCCATGTTCTCCGGCAAAACCACAGAATTAATGAGATTAATGAAGAGATACCAGGTAGCTAACCACTCCTGTCTCATAGTGAAGTACGCCAAAGACACCCGCTACGACAATCATGGCATCGCTACACACGACAGAACAGTGTTGTCTGCCACTGCTGCCCATGAGCTGATGTCTCTCATACCTGAGGCGCTGAAGTATGACGTCATAGGCATTGACGAGGGACAGTTCTTTCCTGACGTGGTGGTTTTTGCTGATACAATGGCAGAGAAGGGGAAAGTTGTCATAGTAGCAGCACTAGACGCGACATTCCAGAAGAAGGTGGAGGTGATCGGGGGCAAAGACAAATATCTAGCGGTGTGTCGTGCATGCTTCCGAGGGAACAGTTTTCACCAACAAACCAACACCACGACTGAGTAGTCCACGCCTCTATCGATCAGCCGTGTCTGTGTGGTGGAAGAAAAGGTGTCTGTGATTTTTGTCTGAGACAAAACAGTTATTTTAATGTCTTCCTTTTAGTATTCATCATACAGCTCAGCAGACATATATTTCACAAAGAACATTGTCCGGGCAAGCATGCCACTGTGATGTAGTCAAAGGGCATATTATGTATTACACAGAATAATATTCATATTTTTTAATATTTAAACAAGACTTGTATACATACAGACCTAGAAACTATTTGTTATTAAAGTATGTCAGTAAATTGCATTGACCATTTCTTCTCAAACTTTGCAACAACAGATATTAAGTAGTTTAGGAACGGCCATAATATATTCTAGGTTAGGCTGTTGTTTTAGTTTAAGTTATTTTATAGCGCTTCAAAACGTTATCCGAGCATTCAGAAGTCATGCTGGATTCTACACACTAAAAACCCCACTGTACTCAGTGATCTGTGATCTGTTTGAAGCTCGCGTACAACCAAAATATTTTTCTTCTCAAGATGTTGTTATGTTTGCTGCTATGTTACACTGCACGAACTTGTTCCTTTGACATTAATCGACTTGGGTGCCATTTAGCTGTTATTGCTATGGTTATATGCTAGGAATCTTCATCATGAGATAACAGGTTTATTATATACTTCAGTGTGAAAGACTGAGTTTTCTGAAGTTGAAAAAAGTGATATTTTCATTGCAGTGAACATAACACTTGATATTTCACTGCGGTGAACATAACACCTGATATTTCACTGCAGTGAACATAACATGTTGACGGAACTATGTTGGCCTACACGAGACAGCTCGTACACAAACTGTTGATTTACGTCAGTTCAACGTTGACAAGTCATATAATGACAGATGGTCATTTATGTAGTTAATACCGATTCTTATCGTTTGTTTATTTTGTTGAAAATGAATTGTATTAAACTGTGAATTTCTCTTCTGA
>XM_040439057.1 PREDICTED: Bufo bufo zinc finger MYND-type containing 8 (ZMYND8), transcript variant X7, mRNA 
TCAAAAGATCTGACAGCCCCCGTGCTCCTCCTGTGTCCCGGGAAGGCCCTCTCTGGTTCCTAGTGTCACCGTTCTCATTGCTCCTTGCACTTTACCTGGATTCTCTGCTCCACAGCTCAGGGACAGGTCTCACAGGATGGCTCCTGCCTGCAAGAGCTGTACAAAGATAATCACTCAGGAAGTGGCTCAGCCAATGGCCTGAAGCATTACATGTGGATTCCCGAAAGCCTCCAATCCTGCCCCAGCTTGCAACAGGGGAGTCTGATCATCAGGCTGAAGTGCCAAGCCCTTTCTGTCTGAGAACTGAGAGTCTGTCCTCCATGTTTTATAAGTATTGACATATAACACTGTAACAATGCATCCACACAGGTAAGCCAGAGCTTGTCTTTTTTTGTAGTTTATTCCCATCTCTTGGACACTGTGCTTTTGCAGGTTGCATTTCCGCGACTTCTCGGGCCAAATTCGCTAAACCAGCAAGTGTTTTGAATTTTGACTTTCTGGAGAGATCACATGGTTGGGTGCCATTAGCCAGTGACTGCTGCTGGGGGTTCCAGGGGTACACTGCACAATTAACTTTTTTGTTTTGTAAAGAGTGGTGGGTTTCTGCACAGCCCCCTTCACTCCCCTGTTCACCAAGGAAGATCTCTGCATTATTGTGTATTCCTGTGTCACATGCTGCTCAGAGGAACATGGAGGCTGCCTCAGCACAAGGCTTCAGCTGACGTACAGGCCACCAAGCAAAGCACACTTTATTCACCCTCTATCTAAAGGACAAGAGCCAGACTAACCCAGGACTGTTACTTTTGATACCGACCACAGAGACTCTCAGCATTTATGCCTGACATACGTCTGGGGCCTAGCTTTGGATTTTTCAAATACCACCATATCTGAAGCCTTTCTCCGGTTTACTTGGTGCCCTGTGGACCCGGCACAGTGTGCGTGTACATGATTTTTCTTGCTTTTTACCCATATATTGTTTTTTGAGATTTTTTTATTTTTTATGTTCTGGATATATGATTTCCTGAGGCTGGGAGCTAACCAATATGGATGTCAAACATTTGGCAGAGGAGGAAGTGAAGATTGAGCCGGAGCTGGTGGAGGGGATGGATGTCACCACTCGATCCAAAGGTCCTGCTGTTGCATATCCAGAGGGATTATCGCAAGAACATGGAGACAGTCAGCAGTCCAACCCAGGCTCAGGGCAGAAAAGGAAGATTTCCAGCCCTCAGCACTCATCCAATGGGCACTCTCCTCAAGATGTATCCGGCAGCCCAAGTAAAAAGAAGAAGAAACCAGGAATGTTGAACAGTCACAACAAAGACCAGTCAGAGCTAAGACATGGTCCGTTTTACTATATGAAGCAGCCACTCACCACAGACCCTGTTGATGTTGTACCGCAGGACGGCCGCAATGACTTCTACTGCTGGGTTTGTCACCGGGAAGGTCAAGTCCTATGCTGTGAGCTCTGCCCCAGAGTTTATCATGCTAAGTGTCTGAAACTGACTGCTGAGCCTGAGGGTGACTGGTTTTGTCCTGAGTGTGAGAAAATCACAGTTGCAGAATGCATAGAGACACAGAGTAAAGCAATGACTATGTTGACCATAGAGCAGCTTTCGTACCTGCTGAAATTTGCTCTCCAGAAGATGAAACAGCCGGGGACAGAACCCTTCCAGAAGCCGGTGTCATTGGAGCAGCATCCTGATTATGCAGAATATATATTTAATCCTATGGATCTCAGTACGCTAGAAAAGAATGTTAAAAAGAAAATGTATGGTTGCACAGAAGCCTTCTTGGCAGATGCCAAATGGATATTGCATAACTGCATTATATACAATGGGGGAAATCACAAATTAACACAAACTGCAAAAGTAATAATCAAGATATGTGAACATGAGATGAATGAAATTGAAGTCTGCCCTGAATGTTATTTAGCTGCTTGCCAAAAAAGAGATAATTGGTTTTGTGAACCGTGTAGCAATCCGCACCCTCTGGTCTGGGCTAAATTAAAAGGATTTCCCTTCTGGCCTGCTAAAGCTCTGAGAGATAAAGATGGACAGGTGGACGCCCGCTTCTTTGGACAGCATGACAGGGCATGGGTTCCAATGAACAATTGCTACCTCATGTCAAAAGAAATCCCTTTTTCTGTAAAGAAGACGAAGAGCATCTTCAACAGTGCCATGCAGGAGATGGAGGTGTATGTGGAAAACATTCGCAAAAGGTTTGGTGTATTTAATTACGCTCCCTTTCGGACACCTTACACACCCAACAACCAGTACCAAATGCTGCTTGACACTACCAATCCAAGTGCTGGTACTGCCAAGACAGACAAACAGGAAAAGATCAAGCTGAACTTTGACATGACTGCATCTCCGAAGATCCTGATGAGCAAACCCATATTAAGCAGCAGTGGAGGCCGACGGATTTCATTAACAGACATGCCACGGTCCCCAATGAGCACAAACTCCTCTGTGCACACAGGCTCAGATGTAGAACCAGACGCTGAGAAGAAAGCAGTGTCCAGCCACTACAGTGCAAGTGAAGAGTCCATGGACTTTATAGATAAGAGTACAGCTTCTCCTGTATCCATAAAGACCGGACATGGTGGCAGTATATCAGGCAGCCCCAAACCTTTCTCACCACAATCCTCTACACCAGTAAAATGTAAGACGGAGAGGAACACAAGCACAGGCAGCATCCTCAACCTCAATCTTGACCGCAGTAAAGCGGAAATGGACTTGAAGGAGCTGAGTGAGTCTGTGCTTCAGCAGTCCACGGCAACCCCACTCATCTCTCCCAAAAGGCAGATCCGCAGCCGATTCCAGCTCAATCTGGACAAAACCATTGAGAGCTGCAAAGCCCAATTAGGAATTAACGAGATTCCGGATGATCCTGATGCCACAGTGGAACACAGTGATTCTGAGGAGTCAGAGAAGACAGATTCTAGTGACAGTGAGTATGGGAGCGACGATGAGCCGAAGTCAAAAAATGATGAGGAAGAAAAGGAAAGTGTGAAGGAAAAGGAACTCCCTCCATCTTCAGTAAAGAAAAAATCCAAGCCCTCAATCCAAATAGAGGCAAAGGATGAATCCAAGAGTGCAACAGCGACAACAGATAAAGCGGATGCAGGGGGTAAGGATAAGCTGGCATCCACTGTAGAGAAGGATGTTCCTGACAAAGGTAAACCCCTGACGCACTCTGCAAAGGAAAAAGTGAAGGGAAAGGATGATACAGACTCTCCTACTGTACACCTTGGACTGGACTCTGACTCTGAGAGCGAACTGGTCATTGACTTGGGTGAAGATCATTCGGGGCGAGAAGGACGTAAAGCCAAAAAGGATGCTAAAATAACAGCAACAAAACACCCAGAAATAAAATCCCCAACCACAGCCAGTGTCAGCAGTCTGCCAGCAGTTGACACCCCTATCATGACCCGCTCTGCATCCCAGGCTGCCCCTGCTGTAGGGGTAACAGTGACTACAAGTTCAGCATCAGCTGCAAGCACTCCGACGGCAGCTACTGGCAGCCCAGTGAAGAAGCAGAGACCTCTGCTCCCCAAGGAGACAGTTCCCACCGTGCAGAGAGTGGTGTGGAATTCTTCCAGTAAGTTTCAGACCTCATCCCAGAAATGGCACATGCAGAAAGTTCAAAGGCAACAGCAGCAGCAACAACAGCAGCAGCAACAGCCGAGCACGCCTGCGCCGTCACAGTCTCCACAAGGGACGAGATACCAGACACGGCAGGCTGTGAAAGCGGTGCAGCAAAAAGAAGTCACACAAGCCACATCCACCTCCACCATAACCCTTGTGACCACCGCCCCACCACTAGCCATGGTGACCAGCCCAGGACAGCCACTGACCACATCAATCACCAGTGACCTGCCCATCGCTACCGCCTCAGCTGATGTTGCTGCTGACATTGCCAAATACACCAGCAAGATGATGGAGGCAATTAAAGGCACAATGACTGAGATATACAACGACTTGTCTAAGAATACCACGGGGAATACCATAGCGGAGATTCGACGCTTACGAATAGAGATTGAAAAACTGCAGTGGCTTCATCAGCAGGAGCTGTCTGAAATGAAGCATAATTTAGAACTAACCATGGCAGAGATGAGGCAGAGTCTGGAGCAGGAGAGGGACCGGCTGATTGCAGAGGTGAAGAAACAAACTGAGCTGGAAAAGCAGCAAGCAGTGGATGAGACCAAGAAGAAGCAGTGGTGTGCCAATTGCAAGAAGGAGGCCATTTTCTACTGTTGCTGGAACACCAGCTACTGTGATTACCCGTGCCAGCAGGCGCACTGGCCCGAGCACATGAAGTCCTGCACGCAGTCAGCCTCTGCTACACAGCAGGAAGCTGACCCTGACCTCAGCACGGATAAAACGGCACAAGCAACAACAGGTACCCAGCCACAGCCTGCTGAAACCACCACAACGCCGAAAGAGAAGGATGGCACAGCTGATAAGAGCAAAGAGAGTGTCACTACCATCCCTGTGGTTGTAAGCCCCAGTGCCGGAGCGGTGGCGATGAGAGCCGGTGTTCAGTATGTGCAGACCACCATGCCGGTCCAGGTGAGAAGAGTGTGACCTGTAAGCATTAAAAACAGCAAGACAATACAGAAACACTACATTGTGCGTGTCCGGAGCCAGCGCCTCGTCCTGTATGTAAATAATGTACAATCTGTGGATGTGATTAAGAGTAGAACCATCTTTTTATATTTGTATTCACTTTAACTTATGAACGTTTATCCGGAGCCACGACATTAAAACACCGATTATGACAGATACTGCTGAAATCCTGCTATCTCGCAGAACGGATGGATGCCAAGGTGTAGATAAAGCAGATTACTCTTGTATCAGTATAATCAGTGTACAAAGGAGCAGTGAATGATACAAGCGTCTATGTGAATAATCACAGCTAATGCCGCATTCATGGCAAGAGGCAGCGGCATTCAATCAAACATTAACCCTAGTGTGGGATCGTCCCGCAGGAACAACCCTAATAACCGGAGAGGAAAACGAAGCACCATATTTATCTGTGGACAACGTTGCAAAAAATATATGGTGGCGCCTTCAGTCTGTTACATTGCCACCACAGATTCACTTTGTATCTTATGTAAAATCACTGCTGATGTCTGTATATGAGGACCCTCTGTATAAAATCATTCCAGTGCCACGCGTTGTACATTTATCACACTGTTGATTTTTCACCATTGTTAATAACGGAGATAGTGTGTACAGTAACCAATGGCGAATACAAGATGGAAGCAAGGCGCCATCAACCCTGAGCGAGAGGCAATATCAGTGGCAAGCGGTTTGAAATGCGGGACTGGCCAGCTTTCCCTTGTGAAACATAATTGCTTTTAGCATATGGAAGTATTTTTTCACATTTTCTTTGTATAAAATTTGTATTAAATTCAAACATTTCTTTTT
>XM_027968038.2 PREDICTED: Ovis aries RAD52 homolog, DNA repair protein (RAD52), transcript variant X6, mRNA 
AGCGAGTTTCTGCGCGTTCAGTCTGAACAGAGCCCTGTCCGCTCTGCGCGGCTGAGGCGCTACCAGTACACAGTGGAAGAACACCAGGCCATCCAGAACGCCCTGAGGCAGAGGCTGGGCCCAGAGTACATCAGTAGCCGCATGGCTGGAGGAGGCCAGAAGGTGTGTTACATCGAGGGTCACAGGGTCATTAATCTGGCCAATGAGATGTTTGGCTACAATGGCTGGGCGCACTCCATCACTCAGCAGAACGTGGATTTTGTTGACCTTAACAATGGCAAGTTCTACGTGGGCGTCTGTGCGTTTGTGCGAGTCCAGCTGAAGGATGGCTCGTATCATGAAGATGTGGGCTATGGTGTCAGCGAAGGCCTTAAGTCAAAAGCCTTGTCCTTGGAAAAGGCCAGGAAGGAGGCAGTAACAGATGGGCTGAAGCGGGCGCTGAGAAGTTTTGGGAACGCACTCGGAAACTGTATTCTGGACAAAGACTATCTGAGGTCACTGAACAAGCTTCCACACCAGCCGCCTCTTGAAGTGGATTTAACTAACGCAAAGAGACAAGATTTTGAACCATCTGTTGAACAAGCCAGATACAGCAGCTGCCAGCAGAATGCGACCCTGGAGCCCCCTAAAACCCAGGAGGCGACCTCTCCATGCAGACGGAGCCACTTGGCTGGACCCCACACCGTGACGCAGGGGGCCACGGAGAGCAGCTCCCGAAGCCTGGCCCCCGGCACCGCGGAGAGTGAAGCCACGCTCCAGCGGAAGCTCCGGCAGCAGCAGCTGCAGCAGCAGTTCCGGAAACAGATGGAGAGACAGCAGCAGGCTGCCACCTCTGCTCTGTCCTCTGGAAGGACGGACCAGGCACAGCCGCCACCGGTGCCTCCTACCAAGCCCAGCCTCCCCAGGACCCGCTCACCTTCAGAGCCACTCACCCAGACAGACCTGCTCCCAGACAGTCTTGAAATGTGGGACATGGCTATGGATGCAGAGGACAGCGTGCTCAAGACCTTTTCGAAACCAGAACCACCGGAGACCCCTGCCATCTCGGTCCTGAAGAACCACATGGAGACCCAGAACAGGATCCCACCAAGCCTTTGCCACCAGAATCCACAGGCACAATCTGGACCCTGGCACCTCCAAACTTCCAGCCTTAACCAAGACACCACAGGGAATTGTGACTCCTCTAGGAAGAATCAGGACATGAAGAAAAGGAAACTGGACCCACCTTAACCACGGCTCAGGGCACCTCCTGAACTGTCCTGATGGGACTTCATTTTGGTCATGAAATGACTGGTCCTGCCTGAGGAGTGCACTCTGCCTCAGGGCTCTACCTGCTTCATCCTGAACTCTGCTGGGGGACTCAGCACCTGCTCACATCAAGTCGGGCATTTGGGAAGCTCTGTAGAGACTCGGTGCCTTTTCTTGGGCTCCTCACTCTTTATTCCTAAGCTATTGTGTTAATGAAGACAGAAATCACCTCAGCCTGTGGTGCGTTCCTGAGTGACCGCTGACCTCTTGCTGTGGGGGCCCCCCGTTATCTAACGCTGCCATGCAAGATTGCAGTCTTCATCACTATTGTTCATCGGCTCATGAAACTACTTCCCTTTTCTCCTAAGACCAAAGAAAAGGTATTTTTAAGAAAGCAAAATTAAATCCTACCCTGTAACAATGTAA
>XM_028824534.2 PREDICTED: Erpetoichthys calabaricus F-box and WD repeat domain containing 8 (LOC114668659), mRNA 
CGCTTTTGGTGACGGAAAAGGCGGTGCATCACTTCTTGACTCCCCATCTGTTATGGATGTGCTGTAAATAAATATTTGCGGCGCCGTGCGCAATGGAGTTGGAACAATTCAGAGAGCAGTGGAAGAAAGAACTAGCGGTGCAGCGGAGTGCTATCGGTATCGGCCGGAAAGAGGCACGACGGTTTCAAGAAAGTACTCGTCCTGAGGTGTTGAAAACAAACAGAAAATTTAAACATGAGTCGGAGCTCGTTAATGAACAAACTACAGACGCAAAGACGGGAACGGTCTCGTTGCCCGACAGACCCCCGAAAAAGAGGTGGTACCCACACGGAGATCGACCGCAACATCTGCGGAAAGCGCCGCGGGAAGAGCGTTTGCTGGATCGGTTAATCCAAGACTTGAATGAAATTAATGAGATACCATTTTTTGACATGGATTTGCCATATGAATTAGCCCTGAAAATATTTCAGCATTTGAACACAACTGAGCTTGGAAGGTGTGCCCAGGTGAGTAAGGCTTGGAAGATACTTGCTGAAGATGAGCTGCTTTGGTACAGACACTGCCTGAAGGAAGGACATTTGATTGGGTCAAGTATATCAGACTCGCCCTGCTGGAAAAGTACCTTGCGTGATTGTCGGCAGATGGAACACACGATGCGGACTAATTGGAAGAACCGTGTCGGGGCCATCAGCCAGCTGCAGTATGAACTGGGAAAGGTGCTGTGTGATGTCAACTCATGTGCTGGACATGTTATAGCTGGGTACACTTCCGGAGATGTGAGGCTGTGGGACACTCAGAATTTGGATATTGGTTCGCCTTACCTGAGACCTAGCCATGTGTCCAGAGAAAGTGCCTTACGGCCACATGTCAGTCATGTCTGTGTGAATGAAAATGTGGCTGTGGCTGCCTATGAAGATGGCATCATAGATGTCTGGAGCATTGAAGCTGGCCGGGAACCCATCCACCATTATCAGCACCTGCAGCGGGTGCAGGCTTTGGCTTTGGGGGCTGAGGGGACCACTGTAGCCTCTGCCTCTGGTAAGCAGGTGCGAGTGGAACAGCCAGATGAGCAGGGCTACTGGCAGACAACAGCCCAGTTTGAGCTGGAGAAGTTGGTGGACTTTGCTCAAATCATTCCAGGAGTGCGTCCTCGGACACTGGCTGTTGTTGCTGCCTCTGACACAGTCTATCTCCTAGAGCCTGGCAAAGACCCCAGCATCCTTCACTGTGTGTACAGTCACCCAATAACCTGCCTTGACACCTCCTCCTCACAGGCTGCTGTGGGTGTGAAGAGCTTTGGGTGGGCAATGAATATGGGAAACAAGATTGATGTGTACAGCTGGGAGACTGGCCAGGCAGTTGTATCCTTGGGGTCATCCAGTGGAGATTTTACTTGTGTCAACTTGAAGGACAGTCCTCCAAATCTGCTGGTGTCTGGCAACAAAGACCGAAGAGTGCGGGTGTTTGATCTGAGGACAGCAAAGTCTGTCACATCTCTGTACGGCCATCACATGGGGGTTTCTGCGGTGCAGGCAGATGACTGGAAGATTGTAAGCGGTGGGGAGGAGGGTCTGCTCTGCGTCTGGGAAATGAGGATGGCAGCCAAGCTCTGGGAAATGCACAACAGGCACCCTGTTCGACATATCCACTTCCACACCCAGACCTTAGTAACAGCTAATATTCCAGACGAGAAGACTCCCAGGGGAGCATGCATCACCGATGATGACCTCACTGCACATCGACGGCACAGAGGGACCATCTACCTGTACGACTTTTCTGTGGACATGTCCAGCACCGATCACATCCTTCCTATCTGCCGCTCAAGTTACGCCGAGTCCCATGGTTATAACTACAACATTGGGCTGGCCGTTCCATATGATAACATCCTCGCCGCTTCTGTGGCGACCAGGCCACACGTGTCTTGAGCAAGACTAAAGACTGTCATGGAGGAGGAGGACGACATTTCTAATGGATCTGAGCACACATTTGAACACCTCTTGTCATTTTCCAGAAGTGTTCCTTTTAATATTTATTTTTCAATATGTTAGTATGTTAACATTTTTAAAATCTTAAAAGACAGTTCACTGCACAGTGCAGATGTGTCATACACAGGGGACTTGGCACAGTTCAGGTTAAAGTGAAAGCTTCAGTGTGGAGTTGTGCAAGCAGGACGACGGGCTCTGTGATTCATTGATGGCTCTTGTCTTGCACGTCGATCATTTTCTCTTTAATTATTCCTGCAAGTTGAGGAGCTGAGAATCAGTTCTCACGTTAACTTACCCGTCAGCCTTGCTCTTGCACAGAGATTTGTGTATATTGTATATAAATTGTATCATACTCCAGTATTTTGCAATGTCCCTAATGATTTATTTATTTCTTGTAAACACGTAGTTCTGATGT
>XM_045577126.1 PREDICTED: Pipistrellus kuhlii transient receptor potential cation channel subfamily M member 4 (TRPM4), transcript variant X6, mRNA 
TCCGGGCCGGCGGCCAGCCGGGAAGCGGCAGATCCGGTTTGTCCGGGGCGGACCTGAGGTCGGGGTGGCGGAGGGAATGCGGGGAGCCGGATAGGCGGCGGCGGCATGGCGGGCCCGAAAGAGCAGAGCTGGATCCCCAAAATCTTCAAGAAGAAGACATGCACCGCCTTCATCGTGGACCCCGCAGACCCGGGAGGGACCCTGTGCCAGTGCGGGCGCCCCCGGAGCGCACACCTGGCTGTGGCCGTGGAGGACGCGTTCGGGGCGGCCGTGGTGACCGAGTGGGACCGGGACCTGCACACCACGGAGAAGCCCACCGACGCCTTCGGGGACCTGGACTTCCTGGGCGCCGGCCGCAAGGCCAGCAACTTCCTCCGGCTCTCGGACCGCACGGACCCGGCCACGGTGTATAACCTGGTCACACGCACCTGGGGCTTCCGGGCCCCGAACCTGGTGGTGTCGGTGCTGGGGGGCTCGGGGGGCCCCGTGCTCCAGACCTGGCTGCAGGACCTGCTGCGCAGCGGGCTGGTGCGGGCCGCGCAGAGCACAGGGGCCTGGATCGTCACCGGGGGGCTGCACACGGGCATCGGCCGGCACGTCGGCGTCGCCGTGCGGGACCACCAGACGGCCAGCACCGGCGGCACCAAGGTGGTGGCCATGGGCGTGGCCCCCTGGGGCGTGGTCCGCAACCGGGAGGCCCTCACCAACCCCAAGGGCTCCTTCCCCGCCAGCTACCGGTGGCGCGGGGACCCCCAGGACGGGGTGCAGTTCCCCCTGGACTACAACTACTCGGCCTTCCTGCTGGTGGACGACGGCACGCACGGCCGCGTGGGCGGCGAGAACCGCTTCCGCCTGCGCTTCGAGTCCTACATCGCGCAGCAGAAGACGGGCCTGGGGGGGACTGGCATCGACATCCCGGTCCTCCTCCTCCTGATTGATGGGAACCAGGAGATGTTGAAGCGGATAGAGAATGCCACTCAGGCTCAGCTCCCCTGCCTCCTGGTGGCGGGTTCGGGGGGCGCCGCGGACTGCCTGGCGGAGATCCTGGAGGACTCTCTGGCTCCGGGGAGCGGAGGGGGCCGGCGAGGGGATGCCCGAGACCGGATCAGGCGTTTCTTCCCCAAAGGGGACCCCGACGTCCTGCAGGCCCAGGTGGAGCGGATCATGACCCGGAAGGAGTTGCTGACAGTCTACTCTTCGGAGGACGGCCCCGAGGAGTTCGAGACCATCGTTCTGAGGGCTCTCGTCAAGGCCTGCGGGAGCTCCGAGGCCTCAGCCTACCTGGACGAGCTGCGCCTGGCTGTGGCTTGGAACCGCGTGGACATCGCCCAGAGCGAGCTCTTCCGGGGTGACATCCAGTGGCGGTCCGTCCACCTGGAGGCCTCCCTCATGGACGCCCTCCTGAACGACCGGCCGGAGTTCGTGCGCCTGCTCATCTCGCACGGCCTCAGCCTGGGCCACTTCCTGACGCCGGCGCGCCTGGCCCAGCTCTACAGCGCGGCGCCCCCCAGCTCGCTCATCCGCAGCCTGCTGGACCAGGCGTCCCCCGGCGCCGGCGCCAAAGGCCCGGCCCTGAAGCCCTCCGCCGAGCCCCGGCTCCCCGACGTGGGGCGGGTGCTGCGGCTGCTGCTGGGCGAGATGTGCGCGCCCAGGTATCGCGCCTGGGCCGCGGGGGACCCCCACCGCGACCACGGCTGCAGGGACGGCGGCGGCGGCGGCCTGGAGAGCGCCCAGCTGCTGTGCGTCAGGACCCCCTCGGAGCTCATGCTGGACGCGGTGCTGGGGCAGACCCCGTGGAGCGACCTGTTTCTCTGGGCGCTGCTGCTGAACAGGGCGCAGATGGCCCTGTACTTCTGGGAGATAGGCTCCAACGCCGTGGCCTCGGCTCTGGGCGCCTGCCTGCTGCTCCGGGTGCTGGCGCGCATGGAGTCTGAGGCCGAGGAGGCAGCTCGGAGGAAGGAGCTGGCAGCCAAGTTCGAGGGGCTCGGTGTTGACCTCTTCGGCGAGTGCCACCGCAGCAGCGAGGAGCGTGCCGCCCACCTGCTGCTCCGGCGCTGCCCGTTCTGGGGGGACGCCACCTGCCTGCAGCTCGCCATGCAGGCCGACGCCCGCGCCTTCTTTGCCCAGGATGGGGTGCAGTCTCTGCTGACCCAGAAGTGGTGGGGGGAGATGGACAGCTCCATGCCCATCTGGGCCCTGGTTCTCGCCTTCTTTTGCCCCCCACTCATCTACACCAACCTCATCACCTTCAGGAAGTCAGCGGAGGAGTCCACACAGAAGGACCTGGGGTTTGACATGGACGGGAGCCTCAATGGGGAAGGGCCTGTCAGGCTGACCCCGGGCCTGTATGACCTGGGCCGCACAGTCCTCTGCCTGGACTTCATGGTCTTCACGCTGCGCCTGCTGCACATCTTCACGGTCAATAAACAGCTGGGGCCCAAGATCGTCATCGTGAACAAGATGATGAAGGACGTGTTCTTCTTCCTCTTCTTCCTCGGAGTGTGGCTGGTGGCCTACGGGGTGGCCACGGAGGGTCTCCTCAGGCCCAAGGACCAGGACCTCCCACAAATCCTGCGCCGCGTCTTCTACCGGCCCTACCTGCAGATCTTCGGGCAGGTCCCGCAGGAGGAGATGGACGTGGCCCTCATGGAGCTCGCCAACTGCTCCTCGGAGGCGGGCCAGTGGGCGCGCCCGGTGGGGGCCCAGGCCGGCTCCTGCGTCTCCCTCTACGCCAACTGGCTGGTGGTGCTGCTCCTCGTCATCTTCCTGCTCGTGGCCAACATCCTGCTGGTCAACCTCCTCATCGCCATGTTCAGCTACACCTTTGGCAAAGTACAGGGCAACAGCGACCTCTATTGGAAGGCGCAGCGCTATAGCCTCATCCGGGAATTTCACTCTCGGCCCGCGCTGGCCCCGCCCTTCATCATCATCTCGCACGTGCGCCTCCTCTTCCGTCGATTGCGCAGGCACAGGGCCAGACTGCCGGCCTCCCCCAACCTCCAGCATTTCCGGGTCCACCTCCCTAAGGAAGCCGAGAGGAAGCTGCTGACCTGGGAATCGGTGCGGAAGGAGAATTTCCTGTTGGCGCGCGCTAGGGACAAGCGGGAGAGTGACTCAGAGCGTCTCAAGCGCACGTCTCAGAAGGTGGACATGGCCTTGAAGCAGCTGAGACAGATCCGCGAGTACGAGCAGCGCCTGAAAGGGGTGGAACAGGAGGTCCAGCACTGCAGCCGCGTCCTGGGCTGGGTGGCCGAGGCCCTGAGCCGCTCTACGTTGCTTCCCCCAGGGGGGCCTCCACCCCCGACCCCGCCTGGGCCCAAAGACTGAGCCCTGACGGCGGACTTCAAGGAGTAGCACCATGGGCGGTTTTTGCCCCCTGGACCCCAGTAGGTGGTGGCCCTGTCTTGAGGTGGGCCCTGTGCCATGGACTGGATCGCCGTGGGGACCACTGCAGGAGTCTCACCCGTTCGGACCACAGCAGGCCGGGCCCCGCCCAGAGCCAGCCCCACTGTGGGAGGTGCCGCCTCTGGAGGCCAGGCTGGCCCCTCCGCAGGCCCTGCCCCGGCCCGCGGGGCTGGAGAAGGCGTCAGGTCCTGGGGGCACAGGGACCACAGACCGCACTCAGCTCCCCACACTGGGGAAATAAAGCCACGTGAGCGTC
>MT775861.1 Lolium arundinaceum CDF1 (CDF1) mRNA, complete cds 
ATGGGGCAGTACAGGTCGGCGGCCGGAGGAGGAGGAGACTGCCAGATCAAGCTGTTCGGGAAGACCATCCCCGTGCCGGACGCCAGCGCCGGTGCCGACGACAAGCAGAACCTTCAGCACAGCAGCAGCAGCATGATAGAACCAAGAGTAAAAGAAATCGTCCCTCAGGACTCCACGGATTCGCCTCCACAGCCCGAGGTTGTGGACATGGAGGACCCATCTGCTGTCAAGAACTCGTCAGAAGATCAGCAGGAGGAACAGGGTGACACGGCCAATCAGAAGGAGAAGCTCAAGAAGCCTGACAAGATCCTGCCCTGCCCCCGGTGTAGCAGCATGGACACCAAGTTCTGCTACTACAACAACTACAATATCAACCAGCCGCGGCACTTCTGCAAGAATTGCCAGAGGTACTGGACGGCAGGTGGTGCCATGCGCAACGTGCCCGTGGGTGCAGGCCGTCGCAAGAGCAAGAGTATAACGGCCGCTTCCCACTTCCTTCAGAGGATCAGGGCCGCTATGCCCGGTGATCCTCTCTGCACCCCAGTCAAGACCAACGGCACGGTGCTCAGCTTCGGGTCCAGCACATCCACCTTAGACCACACAGAACAAATGAAGCACATCAAGGAGCTCATCCCAATAACCCGGATCGAGAACACCGATGACCCATCGGTTGGGTCTTGTGCTGATGGATGGGCCAAGGCAGAAGAGTCAAACCAAATGAATTCAAGGGAGAGAGTTGCAGCAGATGAACCCGCAAACGTTGTGCAGCATCCATGCATGAACGGGGGAACCATGTGGCCATTCGGTTACGCACCATCACCTGCCTATTTCACCTCAAACGTAGCAATTCCATTCTATCCAGCACCTGCTGCTTACTGGGGCTGCATGGTTCCGGGAGCCTGGAACACTCCATGGCAGCCACAGTCTCAATCTCAATCTGGCTCATCACCTAGTGCTGCTTCTCCAGTATCAACAGTGTCGAGCTGCTTCCAGTCACGAAAGCACCCTAGAGATGGAGATGAGGAAAGAAATGCCAACGGTAATGGCAAGGTGTGGGTGCCGAAGACGATCCGGATTGATGACGTAGACGAGGTGGCCAGGAGTTCTATCTGGTCGCTTATTGGGATCAAGGGCGACAAGGTGGGGACAGATGATTCCAGAGGGTGTAAGCTTGCAAGGGTTTTTGATCCAAAGGATGCGGCAAAGACGACAACTCACAGAGTTATCAATAGCTCGCCGTTCTTGAAGGGGAACCCAGCTGCACTATCGCGATCAGTGACCTTTCAAGAGAGATCTTGA
>XM_033534398.1 Aaosphaeria arxii CBS 175.79 glycoside hydrolase family 5 protein (BU24DRAFT_56693), mRNA 
ATATACACTACGCTATTACACTACGAGCCGCCGCCGCCGTTATGGTTTGTTCGCTCGCCACAGCTCCCTCCGTGTCGAAAAGGGTAATGGTTTGATTTACTTCGAGATGGAATTGAATTTCGAGGACTTTATATTCGAGGCTTTTGCCTGCAATTTTCGAGTTTGATTTCTGTAGCAATCTCAATTGTCAATTACTGAGGTCGAAGAATCATGCTGTTTGATCTGCCAACTTTCATCTCTTTGGCCCTTGTGGCAAGCCAGGGTACGTCGGCTGCTGCTGTCATCGGCAAGAGACAGCAATCGTCAAGTGGATTCGTCACTACGGATGGAAACAAGTTCTTGCTTGATGGGAAGGACTTCTACTTCGCCGGTAGCAATGCCTACTATTTCCCTTTCAACGACAAGGCAGAAGACGTTGAAGCCGGCCTCACTGCCGCAAAGGAAGCAGGTCTGAGTGTATTCAGAACTTGGGGATTCAACGATAAGAACAAGACTTATGTCCCAGGTGGTTTGCCCCAGTATGGAGGCGAAGGTGCGGGAGATACCTCGAATGTGTTGCAGCTGTGGGAGAATGGCACTTCGACTATCAACCTCAAGCCATTTGACAAAGTTGTTGCTGCAGCCGAGAAGACTGGCATCAAGCTTGTCGTTGCTCTGACCAACAACTGGGCGGACTACGGTGGTATGGATGTTTACACCGTACAACTAGGTGGCAGATATCACGATGATTTCTACCGCCTACCGGCGATCAAGACCGCATTCAAGAGATACGTCAAGGAGATCGTAACCCGCTACTCCAACTCCAGCGCGATCATGGCCTGGGAACTCGGCAACGAGCCCCGCTGCGGCGCCGACGGCACGCGCAACCTCCCGCGCTCCGACGACTGCAAGCCCGAGCTCCTGACCGCCTGGACGGACGAAATGAGCACGTACATCAAGAGCCTCGACAAGAACCACCTCGTGACCTGGGGCGGCGAGGGCGGCTTCAACATCCAAGGCCACGAGGACGGGTTCTACAACGGCTGGGACGGCGGCGACTTCGACGTCGAGCTCGCGCTCGAGAACATCGACTTCGGCACTTTCCATTCGTATCCGGATTGGTGGTCGAAGACGGTGGAGTGGACGGATCAGTGGATCAAGGACCACGCTGCGTCGGGTCGAAAGGTCGGAAAGCCTGTCGTTCACGAAGAATACGGATGGCTCACCGACGACAAGCGCCAGGAATACCTCGGCAAGACGTCCAACATCACTCGCATCGAGGCGCTCGGCCTCTGGCAAGCAACCTCCATCGCCGAGAAGATGCCAGACATGTACTGGCAGTTCGGCTTCTCCAACTACTCGTACGGAAGGAATCACGACGATGGGTTCACCATCTTCCTTGACGACGCGGAGGCTCAGACTTTGATCTACGACCATGCTAAGAAGGTTAATGCTTTGAATGGGAACTCGACGCTGCGTAGGTAGGACGTT
>XM_050200589.1 PREDICTED: Aphis gossypii uncharacterized LOC114125601 (LOC114125601), transcript variant X2, mRNA 
TACATTTTAGTGTTATTATCTATATCATTTTACATAATACTTATAACAATTATATTTATATAATAGGTATGATTATATTATACATATTATTTTATGTTAATCTATGATTCATCAGCAGAATAGTTAAAATAAACACTAAATGGCCACGATAAGACAACAAATCAAACGGAACACGAGAATACACAAGAACGTCAAGAGCCTAAACTCGAAGGCTAACAGTTTGGTTCTTATTATGTAATGATTTATAGGTAGTTGTTCATATTATAATTCGCATCATTTGCCATTTGTATAAAAAACGATTCGTTGTAACCCTTACATTATGGATTTCGAAAGTGAATTTTTGAAGACTTATAGAATTTTGAAATGGGATGAGTTCACTGTGCTGAATAATGACCGTATATCAATCAACGAGAAAATCACTAACAAGGTGATAACTAAACATGAGTTGTTACTGCAGTTTAAAGCAGAGCTGAGTTTGCTTAATGCGTGTAAACACAAAATCAAAGACGAGTTGGAACAAGGTTTAGATGTTATTGATACTCAAGTACTTGTCCTCCTAAGCAAACGTGTTATTGAATTGTTTGATCATATGCATGTTCTGTTTTCTATTGATGAGAAGCTGTTATTTTATTTTATCAACTTTTGTCAAGACAATGTAAGCTACATACATGTAGACCAGCTAGATATTTTATTAGATGCTGTTTTGTGTACAGAAAATAATCAAAAGATTTGGATACGATTATTAAAGCTTTATTTGGAATTAAATAGTTTTGATAAATTGATGACTGTTTTTCAAGAAGGTGTTCGTTCATTAAAAAAAAATTCACTACCTTTATGGAAGATTATAATTCGATTTATGCAAATTAGGCGTCCTGATATGTACAAAGACATAGATGCAACTCGTAACCTGTTCAATGAACTAAAAAAGTTAAAGCCACCATGTTATAAATTGTATTTAATAATGATGGCTATTGAATCAGAGACATCAGATTTTGAATTACTGACTGTTAGAAAATTGTATGATGAAGCTTGCATTTTATTTGGCACAGATAACATTGAAGTATGGCTTGATTATATTCGTTTTGAACAGACTGATGGCTCCCCAAAATTAATGGAAAGTATTTATACTAGAGGTTTATGGAAACTGGAACCGAATTTAAAAAATACTTTCATAGAAGAGTATAATAATATTAAACGTGAATTTATGAATAGTTTAGGAAAAGAAGTTATAGTCATTGATGATTGAAATATATATTATATATTATAAACAAAAAATGGCGAATTTATTTAGAGATCTCCTTATTTATTTAATTTTTAAATTAATATTATAAGTGGGTCACTTAATAATATTAATACATTTGTATACTTTGGTTTTATTTGGTCATATAAAACAGTTTATTGTATTAGGCAAACAGTGTAGTACAGTGAAACTTCTGTTAATAGTTTACTTTGAAAGACTTCTAAATAAATAAATATGTATAATATGTATGTACAACATCACTTCTGCAAAGTTGCATTTTTTTCTGTTTTCTATAGTTGAACAGTACAAAAGTCTCACTGTACCATTTAGACGTCACAGTTAATGACACAATCTTAAATTTAACAATAGAAGGTTAATGGTATTTTTTTCTTTTATAATGTGTGTAATTGAATAATGTTTTATGTTACTTAATATTTTAAGCACTATTATATTTATAAATATATCATTTTATTTTATTTACATTGTCATAATTGTAATTTGTGCAATACCTATTAAAATAGACGGTTTGATGATAATAAATTATAATTTTTTACCTAA
>XM_026522476.1 PREDICTED: Papaver somniferum putative F-box protein At1g52490 (LOC113272669), mRNA 
ATGGAGAAGAAGTTTCCTAGTGACATAATGCTAGATATAGTATCTCCCTTACGGCACGAAACCATAATACATTGCAAACTAGTTTGCAAACCCTGGCGAGATATACTAAACAATATCAAGGTAGGTGTCCTTTTTAGGTTTGGGAAACCTGCTTTCAATTTCTGTTATAGAGGAGAGCAATACGATGATATTGATATGCATGAGAATTACTCTTACACGACACTGGTGGAAATCGATAAGCATCGGCCTGTCGAGCTAGAACCCTTGTCTGACATGGTTGGTTCATGTAATGGTTTGGTTTGTTTTTCTGTAAGGCGCAAGTTCACTGTTGCGTATGATCCCATCTACATCTGTAATCCCGTCACAGAGGAATATGTATATCTTCCAACATTCAACTATGATGAACCATATGATGATCTCCGGGTAGCTGGTTCTTTTGATTGTGGTTTTGGTTATCATCGTTTCATGGATGAGTACAAAGTCGTTAGAATCCACGGGGCTCTGAGAGATTTTAGTAAACGCTCGCAGAGCCGGAAAGTTGAAGTATACACTTTGGGTAGTGGTCATGGGTGGAGAGATAAAGGAAGCATCGATCACTTATTAGTTTGGGACCATGGAGTTTGTGCAAATGGAGCCATTCATTGGGTAGAGTATCGGAAAAATAAAATTGTGGCTTTCGATTGTAGCAAATGA
>XR_001996655.2 PREDICTED: Juglans regia pentatricopeptide repeat-containing protein At5g61990, mitochondrial (LOC108994206), transcript variant X3, misc_RNA 
ACCATCTCTGCTCTGCCTCTCGAGTCCGAGTCCCCGCAGCCGTCTCTCACGCCGAGCCCCTCTCTCACGCCGTCAACAGCCCCTCGCCGTCGACACTGTTATTCCGTTCTGTTCTCCTCCGCTTCCAGTTGTTCCCGAGGCTACAGAATCACAGATATTGTTTTCCCCTCTCTCGGCGAGCTAATCGGTCAGGAATAAAATGGGTCTACTTTCTCAGAGAAACCTCCTTGCATTTGCACTCCGAAATCGAAATGTTGTCGCAGAAGCACAACCATCAAGACTTCTTTTTGTTTATGCCAAATCCTTCAGCTTTTGCACCTCGCAGACTTCAAAACAGAATGAAGAGCTCACAATCGAAGAAATCTCCGCCTTTCTCAAGCAAAGCAACTGGCAGTACCTCATGGAATCGTCAAATATACCCAAGAAGCTGAACCCAGAGGTGGTTCGGTCTGTTCTTCAACATAACTGGGTGAGTGACCCCAAACGCCTCCTTCATTTTTTTGATTGGTCCGCTTCTTTGATGGGCGTTCCTCAAAATCAGTATTCTTTCTCGATTCTTGCAATTGCTCTATGTAATTCGAGGCTTTTCGCCCATGCTAATGGCGTCTTAGAGCGAATGGTGGGAACCCGGAAGCCGCCGTTGGAAATTCTTGATTCCATTGTTACTTTCTTTGTAGAATGTGGTGGGTCTAATGTGGTAGTTTTTGAGATTTTGGTGAATGCTTATAGGAAAGTGGGGATGTTGAATGAGGCTGCTAGCGTGTTTTTGGGAATTAAAAATGATGGGTTTTTGCCTACTTTGGTGTTTTGTAATTCTTTGTTGAAGGACTTGGCAAAGTGTAATAGGATGGAGTTGTTTTGGAAGGTTTATGATCGGATGTTAGAGGCTAAGATGAGTCCGGATGTTTATACTTATTCTACTGTGATAAATGCGCATTGTAAGGTTGGGAATGTTGAAGAGGGTAGGAGGGTGCTATTTGGTATGGAGGAGAAGGGCTGTAGTCCTAATTTGGTTACCTACAATGTGGTGATTGGCGGATTGTGCAAACATGGGGCTGTTGATGAGGCTCTTGAGTTGAAGAAGTTCATGGCTGGGAAGGGGTTGATCCCAGATGCCTATACTTACTCTATGCTTGTTGATGGGTTTTGCAAACAGAAAAGGTCAGAAGAAGCAAAGTCGATATTGGAAGAGATGTTTGGTATGGGTTTACGTCCTGATCACATTACCTACACTGCTTTGGTTGATGGGTTCATGAAACAAGGTAAGGTAGAAGATGCCTTGAGAATCAAAGATGAGATGGTTGCCCGTGGAGTAAGCTTAACTTTGGTAACATATAATGTACTTGTCGGTGGGTTTTGTAAGGTTGGTGAGATGACGAAGGCCAAAGCTCTCATCAATGAGATGAGTGTGATGGGAATAAAACCAGATAGTTATACTTTTAACTCTTTAATTAGTGGTTATTACAAAAAGAAAAATATGGTTGAGGCTTATCAACTTCTTCTTGAGATGAAGAAGTGGAACTTGGCACCCACAATATTCACTTATGGTGTGATAATAAATGGCCTATGCCATTGTGGAGATCTGCAAGCAGCTAATGGTGTTTTGGAGCAGATGATTGCAGGGGGTTTGAAACCAAATGCTGTTCTATTCTCAACTCTAATCAAAGGTCATGTACAACAAAGTAGATTTGACGAGGCAATAACGATATTAAAAGGAATGGAGGAAAAGGGCGTTCTGCCTGACATGTTTTGTTATAATTCTCTTATAATTGGCCTCTGCAAGGCCAAAAAAATGAAAGATGCTGAGAATTTCTTGGTTGAAATGATCGAGAGGGGTCTTAAACCTAATGAATATACATATGGGACTTTCATCGATGGATATGCTAAGGCGGGGAATATGCAATTAGCATACGGTTATTTCATAGAAATGCTAGGTTGGGGTATAGCGCCCAATGGTTTGATCTGCACGGCCTTGATTGATGGGCACTTTAAAGATGGTAACGTAACTGGAGCTCTTTCTGCATTTCAATTATTACTTGGACAAAGGGTCATCCCAGATATCCAGACTTATAGTGTTCTCATCCATGGTCTTTCTATGAATGGAAAAATTGAGGAAGCAATGGAGGTTTTATCTGAAGTCCTTGACAAGGGTCTGGTGCCAGATGTTTTTACCTACACCTCTCTCATTTCTGGATCCTGTAAGCAAGGTGATTTAGACAGAGCTTTTCAACTCTATGATGAGATGTGCCAGAAAGGCATCACTCCAAACATTGTTACTTATAACTCCTTGATCAATGGACTTTGCAAGTCGGGTGACATTGAGAGAGCTAGGGAACTGTTTGATGGAATCTCAAGAAAGGGTTTGGCTAAGAATGGTGTGACCTATGCTACGATTATAGATGGATACTGCAAATCTGGAAATTTAGTTGAGGCATTTCAATTAATGGATGAGATGCCATCTATGGGGGTTCCACCTGATTGTTTCATCTATTGTGCCCTTGTTGATGGGTGCTGCAAAGCAGGAAACATGGAGAAGGCCCTTTCCTTATTTCATGAGATGGTGCAGAAGGGCTTTGCTTCCACACCTTCTTTTAATGCTTTGATTGATGGCTTCTCCAAGTCCGGGAAATTGGATGAAGCTAACCAATTGTTTGAAGACATTGTTGATAAGCATGTGACCCCAGATGATGTGACCTACACAATTCTGATCAATTCGCACTGCAAGGCTGGATTAATGAAGGAAGCTGAGAAGCTCTTTCTGGAGATCAAAAAAAGAAATCTCAAGCCAAATATTTTAACTTACACTGCACTCCTGCATGGGTACAACAACATAGGGAGCAGAGATAAGATGTGTGCTCTTTTCGATGAAATGGTGGCAGCGGGGATTGACCCTGATGAAGAAACATATGGCATGCTCGAGAGAATTCCGTTGATATCTGAGGCTGCAAATACAGAGAGGCCATCTTCAATCACAACTAGCCTTTTCATTGGTGGGGCGCTGGCTGCAAGATCTGATATCTGACAATGAAGATACAAATATTAGTAGTATCTTTGAAGAAGCTTCTGATTCTATTGATCATGTTGAACAAATAGGTAGAAGTGCCACCTTGGTGATGGCGTACTTAATGCTCAGGAAGAACCTAACTCTACTAAAACGAGTTCACCACTGAGCCCAGCGCAATGATGGCTTTGCTAGGATCCTTTTGGATCTGGATAGGAAATTACATGGGACACAGCATCCATGGAATGGCGACAACGAAAGCCAATGATGAAAGTTTGCCCCATTTGTGGGAAGAAGGCCGGTCTGAGCAGCAGTTCACTTAAGCTTCATTCGCAGAAATCACACAAGAATCTTTAATCAGGAAGTGTGGACAGTGGCATGACCATGGAAATACAAAAGTCTTTGACAGCACTCAAACGGGGTCTGCCCGAGTCGAAACTGCTCCCTCGCCTGCGTCGATTGTGCTCTGCCCACCGCCTCCAGCGACACCATCTCTTTCCAGCGACACCGAGGCCGTCTGCACAGCTTCGCCACACCCCTTGTCGCCCAGCTTTCCTCCCTCCCCATTGCCAGCCCATCTCCTTTTCTTCCTCTCCCCACCCCTCGCATCTCCCCCCACCCGCGCCAGTGTACCGGATTCACTAAACGCCCAGCCCTCGTCCCACAGCTCTCCTCCCTCCCTGTTGCCCTCATCGTCCCAGAATTGATATCAACGATCCCTAGAGTCCCTGCTTCAGAATCGACATCAATGAATCTACATCTTGGCAGCCAGGTCCGCTTTATCTGAAACTCCTCACAAAGCATCACCAGCAACTCCAAGAGTTGCTAGACCAAGCAGGGGAGTAGCTAAATCATAATCTGATTCACCCTCTCCTTTGCAAAGTTCACGCCTTTCAGTTGATCGGTCTCCACGATCAGTTCCCTTGAAGCCCACCATAAGATCACCAAAACTTGCTACCCCACCTGAAGTCACTGCAATTGAAATTAATAACCTTTTTCGCGAAGACCTCTTCCTTGCCAAGGTTGGGATGGAGTGCGGCATCGGGATTTTGCAACGTCATTTTCAAGATTGTAAGGGAATCACAACATGAAGCTTTTGCAGCTCTTCATCACAGCATCAATTCCAGTCTTGAAACTGCTCTTGATTTCTGGACTTAGGGTTTATGCCAATCAGAAGAAGATAAACTAATAGAAAGAGAGAATGATCTTCACAAGCTTGAGGACGAACTTTGAAAGCGGATAGTAGAGAATAAATGTGCACATATATTATTGTGTTTGTACTAAGTTTTATTTATTGTAATGGTTTCTAGTTGGTTCAGACTATTTCTGGTTGGTTTTATCATCAATGTGTACTTTATCTATTGCTGAAGATGAATTTAGTTCCTTTTTTTCTCTC
>HQ320065.1 Uncultured bacterium clone RMAM1139 16S ribosomal RNA gene, partial sequence 
CAGTCGAGGGGCAGCGGGGGTAGCAATACCCGCCGGCGACCGGCGCACGGGTGAGTAACGCGTATGCAACTTACCTATCAGAGGGGGATAACCCGGCGAAAGTCGGACTAATACCGCATGAAGCAGGGGCCCCGCATGGGGATATTTGCTAAAGATTCATCGCTGATAGATAGGCATGCGTTCCATTAGGCAGTTGGCGGGGTAACGGCCCACCAAACCGACGATGGATAGGGGTTCTGAGAGGAAGGTCCCCCACATTGGTACTGAGACACGGACCAAACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGCGAGCCTGAACCAGCCAAGTCGCGTGAGGGATGAAGGTTCTATGGATCGTAAACCTCTTTTATAAGGGAATAAAGTGCGGGACGTGTCCTGTTTTGTATGTACCTTATGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCTGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGCCTTTTAAGTCAGCGGTGAAAGTCTGTGGCTCAACCATAGAATTGCCGTTGAAACTGGGGGGCTTGAGTATGTTTGAGGCAGGCGGAATGCGTGGTGTAGCGGTGAAATGCTTAGATATCACGCAGAACCCCGATTGCGAAGGCAGCCTGCCAAGCCATGACTGACGCTGATGCACGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCCACGCAGTAAACGATGATCACTAGCTGTTTGCGATACACTGTAAGCGGCACAGCGAAAGCGTTAAGTGA
>XM_048817709.1 PREDICTED: Caretta caretta kinesin family member 19 (KIF19), transcript variant X2, mRNA 
GTGCTACTGTGTCAACAGGAGCCTGCTGCGCTGCGGTTGTTGTGTACAGTTTAAAGATCTCCAGGGGAGCCGGCGAGATCCCGCAGGCAGCAAAAGCAGCTGGGCAGAGCTGGGCTGGCCCTCCTGAGTACAGCCCGGTCAGCTGGCGTGAGAGGCAGCCGGGGCTAGAGCTCCCCGAAGGGAGCAGGAATGCTGCACCCCAGCCCTTTGTGGCTCTGTAGCCTCCTGGGGGGCCGAGAGGACAAAAGGCCCTGAGCCCGTGGATGGGAAAGGAGCAGGCAGGGCTGGCGTCGTCCCTGCAGCCCGCCTCCCCCTTTTGTCTCTGGGAGGATTAGCCTAAGTCTCAGGTTGTTTAGGAAACAGCGGATGCAAGTGACAGGTCTGTGGAGGGGGGAGTGGCGGTTGCAGGGTCCTGAGAGCCATGCCTGTGGCAGCTGCTGCTGGCCCTCCCCTCTAGACCCTCTGTGCACCTGCCAGGATCATGAAGGAGGTGAAGGAGTCCAGAGACCAGCAACTCACGGTGGCCCTTCGGATCCGGCCGATCAGCATGGTGGAGCTGGAGGAAGGAGCTACTCTCATAGCTCATAAAGTGGATGAACAGGTAGCGGTGCTCATGGACCCCATGGAGGACCCCGAGGACATCCTGCGAGCCAACCGCTCCCGCGAGAAATCCTATGTCTTCGACGTGGCCTTTGACTTCACGGCAACTCAGGAGATGGTCTATCGCGCCACCACCAAGGGCCTGATCGAAGGTGTCATCTCTGGGTACAACGCAACCGTCTTCGCCTACGGCCCCACCGGCTGCGGGAAGACGTACACCATGCTGGGCACAGACCGTGAGCCCGGCATCTACGCACGCACCCTCCATGACCTCTTCAGAGCCATTGAGGAGACCAGCGATGACATGGAGTATGAGGTGTCGATGTCCTACCTCGAGATCTACAACGAGATGATCCGGGACCTGCTCAACCCGTCGCTGGGCTTCCTGGAGCTGCGGGAGGACGCCAAGGGAGTGATCCAGGTGGCGGGGATCACGGAAGTCTCCACCATCAACGCCAAGGAGGTCATGCAGCTGCTGCTGAAGGGGAACAAGCAGAGGATGCAGGAGCCCACGGCCGCCAACCAGACGTCGTCGCGGTCCCACGCTGTGCTGCAGGTCACCGTCCGCCAGAAGCCCCGCATCAGGAACATCATGCAGGAGGTGCGGGTGGGGCGGCTCTTCATGATCGACCTGGCTGGCTCCGAGAGGGCATCTCAGACCCAGAACCGTGGGCAGAGGATGAAGGAGGGAGCCCACATCAACCGCTCGCTGCTGGCCCTGGGGAACTGCATCAATGCCCTGAGCGACAAGGGGGCCCCCAAGTACGTCAACTACCGTGACAGCAAGCTCACCCGCCTCCTGAAGGACTCCCTCGGGGGCAACAGCCGCACAGTCATGATCGCCCACATCAGCCCTGCCAGCAGCGCCTTCGAGGAGTCCCGCAGCACCCTCACCTACGCCGACCGCGCCAAGAGCATCAAAACCACGGTGAAGCGGAACCTGCTCAATGTCTCATACCACATTGCCCAGTACACCAGCATCATCTCGGACCTGCGCAGCGAGATCCAACGCCTCAAGTGCAAGATCGACGCGCCGGGGCCGCGCCCGGCCCGGGGCGAGCGGGGTGACATCCGCCACATCCAAGCCGAGGTGCAGCTCCTCAGCTCCCTCTGCGACCGGCAGGAGATGGACCAGCTGCGGGAACAGCTGATCGGTGCCTTCCAGGAGCAGATGGACCTGCGGCGCCAGCTGATGGAGCTGGAGAACAGCTACATGGAGATCCAGATCGAGAGCACCCGGCACCTGCTGACCATTGCGGACTGGGACCAGGAGAAGAGGCACCGGGCGCAGAAGTGCAGGGAGGAGCTGAGGAAGGAAGAGAGCGAGAAGGATTCGGACACCGGGGATGAGCAGCCGGACGCGCCGGAGCCACAGGAAGTGAGCTCGGCCAGGGAGAACATCGCCGCCCTCATGGGGGAGCAGAAGAAGCTGCGCAAGCAAAAGGCGGAGCTGGAGAAGCGGTTCAAGGAGATCCGCCAGCGGGGGCGGCGGCTGGAGGAGGTCCTGCCTCGGCGCATCAGCTCGGAGGAGCAGCGCGAGGTGCTGAGCCTGCTCTGCAAGGTGCACGAGCTGGAGCTGGAGAACACAGAGATGCAGTCCAGCGCCCTGCTGAAGGACGGCGTCATCCGCCACAAGAACTACGTGGTCCGGCGCTTCGAGCAGCACCGCAGCCTCTGTGGCCGCATCATCCAGCAGCAGAGGCAGATCATCCACGAATATCACCTCTCAGTCCCGCACCACCTGGAGGAGCTGTATGAGATCTACCTGCGGGAGCTGGAGGAGGGCAGCCTGGACCGGGTTGCCAGCCTGGACCGCGTGGCCGCCAAAGCCCTGAAGGATACGTCTCTGCCCAAGATCCCCCACCTCCCGGCTGCTGAGAGCGCCCTGGACTCCGACCAGGAGAGCGTGAGGACGCTGGGCTCAGAGCACCAGCCACTGCTGCGGCGTGACTCCCGCAGGCAGGCCCTGCCGCCCCTCGTGCTGGATGCAGAGAGCGACCCGGCCCAGGTGTTCAGGACCAGCCCTCGGGTGCGGCAGATCAAGAGTTCGGCTGTGCTGACCCCGCCCCCCATCCACATGAACGGCATGGTGACCCAAGAGTACCTGCACCGGGGGAGCCTGGCCAGCCTGGAGAGCCCCCCCAACTCCTCCCCGGACAGCAGCGAGAACTGCTCGGACGTCGCTCTGACGCGCAGAGAGCGCAGGGAGATCCTGAGCAGCACCAAGAACATCGCGGTGAAGGCTGCCCGGCGCCGCTCCAGGGTGCTGGAGTCCGACCGGCTGCAGCTGCTGGAGCCCATGAAGGAGCGGAGCAGCCTGTCGCTGCACTCCCTGAGCGAGAGCGAAGACCCCCTCTCCCCAGAGACCCCCGCCTCCCGGGGCCCGCCGTGCCCCGGCCTGCAGCATGCCGCCAGCGAGGACAACCTGTCCAGCAGCACCGGGGAGACGGCCTCGCGGGCCGAGGGCCCCTGCCCCAGCCACTCCCCCGGGCCCTGGCTCCGGGGGCACAAGGAGGCTGGCAAGAAGCTGGAGAAGAGGGAGGAGTCGCTGGACGGCAGAAGGCGGAAACGACGGTCCAGGTCCTTCGAAGTCACCGGCCACGGGGTCTGGGGGACCCGGCATCTCTCCCGCTCCCCCTCCCTCCTCCCGGCAACTTGAAGAAAGGCCCCCAGCCCAGCCAGCACCCCCGCCTGAGCTACATCACGCTGAACGGCACCAACGCTTACGCCAAGGACGGCAGGAGCCGGC
>BC147860.1 Bos taurus hypothetical protein LOC785621, mRNA (cDNA clone IMAGE:8182959), partial cds 
GAGTGAGAGGTAAAGCATCTCAGACACCAGAGTTAGGCATTTTGTTAAGACAGCTTCTCTTCCTAACAACCTCCATCAGAAGAAATATAAGTCCTTTGTCATTCTTATTCAGAGAAACCTGGGTTCAAGTCAGCCAGTCTTCAGACTTACTTGTGGGGAACCTGTTAGAAAGGAGCTCACTGCCGCTTCACTGCTCTACTATGTCCTTGGTGTTCACCTTGATGCTTGAGATGCTCCTGTTTCTGACAGGAGCTGGAGCCCAGTCAGTGACCCAGCCTGATGACCACATTGCTGTCTCTGAAGGAGCCCGTCTGGAGCTGAAGTGCAACTACTCATCTTCTGTTTCACCGTATCTCTTCTGGTACATACAGTACCCCAACCAAGGACTCCAGCTTCTCCTGAAGTACGTGTCTGGAGACAATCTTGTTTCAGGCATCAAAGGTTTTGAGGCTGAATTTAGGAACAGTGAGACGTCTTTCCACCTGAGGAAAATACCAGCTCATTGGAAAGACTCGGCCAAGTACTTCTGTGCTCTGAGCCCGATGGATGGCAACTATCAGTGGATCTGGGGCTCTGGGACCAAACTAATTATAAAGCCAGAAGTCAAGGACCCCAACCCCACTGTGTACCAGCTGAGAAGCCCCCAATCCAGTGACACTTCTGTCTGCCTATTCACCGATTTTGATTCAAATCAAGTCAACATGGAAAAAATCATGGGGTCCGAGGGGAGCACGGTGCACAAAACAAACAGCACCGTGCTCAACATGGAGATCCTGGGATCCAAGAGCAACGGGATAGTGACTTGGGGAAACACCAGCGATGCTGGATGCGAATACACCTTCAACGAGACCATTCCCTTCGCCTCCAGCTTGGAAATCTCCTGTAATGCCAAGCTGGTAGAGAAAAGCTTTGAAACAGATATAAACCTAAACTCCCAAAACCTGTCAGTGATAGTGTTCCGCATCCTCCTCCTGAAGGTGGTCGGGTTTAATCTGCTCATGACGCTGCGGCTCTGGTCCAGTTGAGGTCACCGACAACCTGAGAGCCCCGTGCTCCCTCGCCCCTTGCTCCTCGTCGCCCTTCCTCTCCCTCTTCAAGCAGAGAGGCGCACTCTCTGCCCCCATGGATGAGAAGGCTCCCTCCTCCTCTCTGGCCTGGCTGGCCATAACACCAACTGGATCCTCCAGATACTGGTGATCAAGATGCTGACAAGCTGCCCAGCACGGCTGCCACCCACTCTCTTCCTCACTGCTGCTTGTCACTGCCTGGCATTCTTGGCAAAGTCGGGGGGCTGCTGCAGCCTCTCCTGGCTGTGGGGACACTCCCTCCCCACCCCCACCCCCCAGAGACTGCCTCTGATGTCCCACTGGATGGTGGATCCCCAGTGGGTTCTCCTGGGCTCTAGCTCCTGGAGAATGTTGTGTGTTGTTTATATTTTTTACATAGTGTTCATAAAAAAATATATATCACCCTTTTCCCCAACATGTGGGGAAAAATTATCTTTTCACGATCTAGGCCCTGCTCTTCTGTGTATCCGAGCCACATTGTATATTCTGCTGCCACGGCTTCAATAAAAGCGATTTGGAAGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>XR_006744459.1 PREDICTED: Melitaea cinxia uncharacterized LOC123662241 (LOC123662241), ncRNA 
TTTTTGTATGACGCGAACTATAACGGTCGACTTTTACCTATACACAAGTATTAAGTTGCTTACCGTAGGAAGAGACGACCGAGTGTGTAT
>XM_022921984.1 PREDICTED: Stylophora pistillata protein ZINC INDUCED FACILITATOR-LIKE 1-like (LOC111319159), mRNA 
TGTACCTAGTTGTTTTTATTTTGCATCGGCAGCAGTTGTGATTAATCTTAGGAAGGAAGTTGTTGTTGTACCCACAATGAATTTCTTAATGTCTTTCTTGCGTGGAATATTTTATCCTCCGGGAACAAATTCTTTGAATTGGAAGCTCTTCTTCATCGTTTTCCTCTCTACATTGTGTTCTGCAATGTCCATCACGATATTGTTTCCATTTTTACCAGCTATGGTGAAGAGTTTTGGGATCTCAGATGAAGACACAGGATATTTTGCGGGTCTTATAGCATCTTCAATGTTTATTGGACGCACAGCAGCTTGGTAAGTGTGGAGTGAATCTCTATTTCAATCAA
>XR_008133656.1 PREDICTED: Oncorhynchus keta uncharacterized LOC118373694 (LOC118373694), ncRNA 
TGCCCCTGAACTAGACAGACTGGAACAACCTCCGTGATTTACAAGAAATCACCCGACTGTCTAGAAATGGAAAACCTTCAAACTAAGGCTGACCTATCACTTCATGAAGTACAACTTGGCCCCACATCACTTTAAAACATCAGCTGTCAATCCTCCCGCAGACATACAACTCCAGATACCCAACTCAACAGGCAGTATACATCAATGATGTCGCTCTTGCTGCTGGTGATTCTCTGATCCACCTCTACGCAGACGACACCATTCTGTATACTTCTGGCCTGATGCTGAATGAAGAGCTCTTCACTAGATACCAACACACTCAAAGGCGATTTTCTGAAAACCGCCGGAAAACGTGTGGCGAGACCCCATTTGCTCCAGTACTTTTTGATCTGCTGCAGCGCTGCTACACCACTTTCAGAGCAGCAGCACCAACCAAGACACTTCTCAGCACATTTTTGCATTCCAGTTCAACATTTACCTGCTCTGTTGCAGTCTATCGTTCTACTTCTGTGGGTTTTATGGCGGACTACAACCCCAAAATGTGTGTTCCCGCCACCAACTTGATGGGGTTGAAAAAACAAGTACATGTTCAAAGGTGGAAGAGACCCTCCAGAGTTGCTGCAGTGTGTGTTCTACTGGCTGTGATCATAGGCCTGTGGGATTCCTATGCAACTGCAGAGAGAGACCAGCTACAAAAAAGTCTAAATACCTCAACCAGAGAGAGAGACCAGCTACAGAATAGTCTGAATACCATGACCACAGAGAGAGACCAGCTACAGAATAGTCTGAATACCATGACCACAGAGAGAGACCAGCTACAGAATAGGCTAAATACCATGACCACAGAGAGAGACCAGCTACGTAATAGTCTATTTTCCACGAACACAAAGAAAGACCAGCCACAAAATAGTCTAATTTCCACAACCACAGAGAGAGACCAGCTACAGAATAGTCTGAAAACCATG
>HM666087.1 Uncultured bacterium clone GB7N87003F9F57 small subunit ribosomal RNA gene, partial sequence 
AGAGCGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCCCGTAGCAATACGGGAGCGGCAGACGGGATAGTAACACGTGGGAACGCGCCCTTCGGTTCGGAATAACTCAGGGAAACTTGAGCTAATACCGGATACGCCCTTACGGGGAAAGATTTATTGCCGAAGGAACGGCCCGCGTCCGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCGGTAGCTGGTCTGAGAGGATGACCAGCATCACTGGGACTGAGGCACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGGATGATGAAGGCCTTAGGGTTGTAAAGTCCTTTTAACGGGGAAGATAAGTGACGGTACCCGTAGAATAAGCCCCGGCTAACTTCGCGCCAGCAGCCGC
>XM_042080615.1 PREDICTED: Alosa sapidissima tensin 1a (tns1a), transcript variant X8, mRNA 
TTCTTTCTTTCTTTCTGTCTGTCTCTCTCTCTCTCTCTCGCTCTCCCTCCCTCCTCTCCCTCTCCCCCTGTGAGTCGTGTCATGGATTTGCCTTGCCTGGAGAGGCAGCCTTTCGAAATACCAGGCGTTTTTGGGAATACTGCATCCGATGCGGAGATCCGCTGACTCCCTGGAGATGCCCTCCGTGTCCCTCGGACTTCCGGCAGCTTTGGCCGGCCGGGCCAGGACCTGGGTCTGTCTCTCCTGCATGTTCTGGCCAGATGAGTTTGAAGGGGTCCACTCCCATACCTTCCGTGTGAAGGCATTCAAGAAAGCCAAGTGCTGTGCAGTATGCAAGCAGGCTGTCACCAAGGAAGGCCTGGTCTGCAAAGCTTGCCGGTTATCATGTCATAAGAAGTGTGAAGTGAAGGTCTCCACTGCCTGCACGACTGCTGCCAACTATGAGCTGCCTCCCACTGCTGAACTTCCCCTGAAACATGTAGAGACTCCGGGATCCACCAAATCCACCAGAAGTATGGACTCTCGTCAGAGACCCTCACGGAGCCTGAGTATGATCCAGAACCTGGATGACACGGAGGTGGACCTGGTCTACATCACAGAGCGGATCATCTCACTGTCCTTCCCCACGGGCTCCGACGAGCACAGCTACACCTCCCACCTCAAGGACGTGGCCGCCATGATGAGGTCCAAGCACGGAGAGCACTACCTGGTTCTTAACTTGAGTGAACACCGAAATGACATCGTCAAGCTGAACCCAAAGGTCATGGACTTTGGCTGGCCCGATCAACATGCACCTGCCCTGGACAAGATCTGTAGCATCTGCAAGGCCATGGACACCTGGCTCAATGCAGACATACACAATGTAGTTGTCCTACACAACAAGGGCAATCGGGGTCGGACAGGGGTTGTGATCGCGGCCTACATGCACTACAGCAACATCTCTGCCAGTGCTGACCAGGCCCTGGACAGGTTCGCCATGAAGCGCTTTTATGAAGACAAAGCCCTGCCAGTGGGCCAGCCGTCCCAGAGGAGATATGTACAGTATTTCAGCGGACTTCTCTCTGGTCATATCAAGATCAACAACAAGCCTCTGTTCCTGCACCACGTCATCATGCACGGCATCCCCAACTTCGAGTCCAAAGGAGGTTGCAGGCCGTTTCTAAAGATCTATCAGGGGATGCAGCCAATTTATATGTCTGGGATATACAATGTTCAAGGTGACAGCTCCACAAGTATCTGCATAACCATAGAGCCTGGCCTTCTCTTGAAGGGAGACATCCTGCTGAAGTGCTACCACAAGCGCTTCAGGAGCCCGAGCAGGGACGTGATCTTCAGGGTGCAGTTCCACACGTGTGCTGTCCACGACCTCGCCGTGGTCTTCACCAAGAATGAGCTCGACGAGACATTCAAAGATGACAGATTTCCTGAGTATGGGAAGGTTGAGTTTATCTTCTCATTTGGACCAGAAAAGATAAAAGGGCTTGATCATCTGGAGAACGGTCCGAGTGTGTCAGTAGACTACAATACCCAGGACCCCCTGATCCGTTGGGACTCCTATGACAACTTCCACAAGCGCTGTGAAGATGCACCAGACGACGTAGTGCACACGCAGGGTCCAGTCGACGGCAGTCTCTACGCTAAGATCCGAAAGAAGGACTCCAACGAGGGCATTGTTTCCGTTAACGGCCTTCCGCCCTCCGAGCGTGCTCATCCTCCCCTCCAGCAGGCAGTCGGAGTAGCCAACCACGCGCTTCCTCTCCCTGTCGCCAACCACGCCCTCCCGGTCGCTGACCACGCGCTCTCTGTGAGCAGCGACTCGGGCAACTCCACCGCCTCCGTCAAGACCGACCGCACCGATGACCCGCAGTCCCAGCAGGGCGGCGCCGCCGGCGGAGGAAGTGGCAGCGGGGGGGCCTGCGTGAGCCAGCCGCCCGGCGCCGAACCGTCCCTGAGTCCGCGGGAGAAGCGCGAGCTCGAGCAGCTGCTCAGCGGTCTCGAGGGAGGAGGAGGAGCCCAGGGGGGCCGACAGGGGAGCCCAGCGGCCGTCGGGGGTATCCTCCACCTGGTGCCCGCGCAGGTGCACGTGAACGGGCGTGGCTTGATCCGCGCCAACACCGTCCCGGCAGCAGCATCCGCGCGCGCCGCAGACAGCCGGAGCGAAACCGAACGCGAGACTGATATCCTTGACGACGAGCTCCCAGAGGCTCCCAACAGCGCCGACAGCCTCGGGACGATCTCGTCTCTGGACGGACACGAGACGCCAGCCGCCGACAGCCAGGGACACAGCGACTACCAGACTCCCCAGCAGCAGCAGCAGCAGCAGCAGCAGCAACCGCCGTCTGACTCGACCACCGTGGACATCGAGGGACCGTCGGCTCTCCCAGATCTCCGGTCCAGCAGGAGAGACATGCCGGTGCACCAGGTGCACGGCTCGGCCTCCGCGCAGGAGCGTCTGATCGACTACAGCGACCAGAACGGGGCCATGTACCGCTCACAGTCCTACGGGGCTGCCCCAGCCATGGACCCAGGGGCAGCTGCCAGGCTTCTGCCCCAAGCGCCCGAAAGGAGCACGAGCAGCCGCGAGGCCGTCCAGCGCGGCCTCAACGCCTGGCACCAGTACGGCCTGGTGGACGACCCGTTCTTCGGGCCCATGTCGGGCCTGTCGCGCTTCCCCACGTCGCCGAGCGGCGCCTCGCAGAACGACGTGGAGCAGTCCATCGAGGCCCTCAACATGCTCATGATGGACCTTGAGCCCACGCAGACGCCTGTACCCAAGTCCCAGAGCGCCCCCCCGGGCGACAACCCGGCTACCTACCAGACGCCCTTCGCCCAGAACTACCCGAGGCCCTCGTACCAGGCGGACCAGGCCATCCACAGCTACTCGACGGGCTACCCGCCCTCCACCTCGGCCAGCTACGGCCAGTCCTCTCAGAGGTCCTCCCCGGCCTACCCGCCCATGTCGCCCTCCATGGAGCCCCACAGGGGGGCTTTCCACTCCCCCACCCACCCACAGGAGGCGTACATCCACCGGGGAGGTCCCGGGTCCCCGTCCCCCACCCTGCACCACCCGCAACCCCTGAAGCCCCAGAGCGCCTTCACCCCAGGGGGAGGCAGCTCGGTGTGCTACACCCCGGAGCTCCAGGGCATCTCCCCGTACCCCACCACCCAGATGAGCTACAGTGCCTCCTCCTCTCCCCTCCCGTCGGTTACCCCCGCCAGGGAGGCTGACCCCGAGGAGGAGAGCCTGAACCTGGAGGGGCTGGTGGCCCACCGCATAGCTGAGTACAACGCTCGCATCCGGGGCATCTCGGCGAGTATGAGCCCCCAGCCCCAGCCCCGCGAACGCCATCGCTCCTATTCTTTTTCTGGGTCAAGGTCACACACAGCAACCCCAGATGAGTCCGGTTCATCCATGCGTCGCCGCACGACCAGCGAGGGTCAGTACCACAACGGTCACGAGGATCGTCCAGCTCACGGGAATGCCTCCCGCACCCCTGTCTCGCCAGAGTTTGTTACTGTTATCGCCTCGAATCCAGGAGGCCGACCAAGGGAGGTTCACATGCACAGCTATCGGGAGGCGTTTGACGACACCCCAGACGGCAGCGGTGGCGCCCCCACCAGCCCAACCCCCAGCGCCGGTGGTCGCTCCCCGCCAGGCTTGGCCAAGACGCCTCTGTCAGCCCTGGGGCTGAAGGCGCAGAGCCCCAACGATGTTCACATGCAGCAGAGCAGCTCCGAGCCGCGAGGCTACATTGGGCCCGTGGCACACGTTGGAGGGAGGGGTCTCGGCATGTCCCCTAGCCACCAGCACCCCCTGTACCCGTCTGAAGCTATGGAGAGGGCGGCACCCCCTGCCCACGGCATCAACCCCCCGCTCTCACCCCTTGGCACCAGCCACCACCCTGAGGGACACTTCTCACATCCTGACGGCTCCATGCGAGTGGCCAGTCCCCCTGTCCCTGTGTCCAACGTGGGCTACCCGCCCAACACCACCGAGCTCACGCACCCCCACTTTTACCCCGACCCGCTGGGCTACCTGGATCCTGAAACGGCCACGGTCAACATCATGGGCGTCCATCGTGTGCCGGGCAGCCCCAACACGCTCCACCGCACCGTTGCCACCAACACCGCCCCCAGCCCCGTCCTCCAGCGCCGGCTAGCCAATCAGAGCCCAGTCACCGGGCACCGGGTCCCCCCAGCCAATGGCGGCGACCCCAACAGCCCTGTGCCCGCGCGCCACATGGGTGCCACCAAAGCGGTGCCCCAGAGCCCCACGATGGGCCGCCACACTCAGAGCCCGGGCAGCGCCGGAAGCCTGAGTCCGGAGAGGAGGCCCAGCAGGCAGGCCAGCCCCGACGAGAGGCCCGGCGGGCGCCAGTCCGGCGCCTCTGGAGGTCACCTGTATGGCGCGGAGCCAGGCTCCCAGCCCCTGCTGCCCGATAAGAGGCCCAGTGCCACCCCAACTGAGGGCTCCATGAACAGGAAGATGTCCTCGCCAGGGCCCAGCGGTGCCAGCACGCCCGTCATGCCCCCGCACGCAACGTCTGAACCTGCCATTGTCTCCATCTATGCTGATGGACCACCAGACATCAAGCTCAACGTAAAGTTTGTGCAGGACACATCCAAGTTCTGGTACAAGCCAGAGATCTCCCGGGAGCAAGCTATCTGCGTGCTGAAGGACAGAGAGCCTGGGGCGTTTGTTATCCGAGACAGCCACTCCTTCAAGGGGGCCTACGGCCTGGCCATGAAGGTGGCCTCACCTCCACCCACTGTGCAACAGAACAAGAAAGTGGGAGACATCACTAACGAGCTGGTTCGTCACTTCCTGATTGAGACTAGTGCTAAGGGTGTGAGGCTGAAGGGCTGTCCCAACGAGCCCTACTTTGGCTGTCTCTCTGCATTGGTGTACCAGCACTCCATGACACCCCTGGCTCTCCCATGCAAGCTAATGATCCCAACCCGAGACCCGAATGAGGAAGCCATTGAGTTAGCCACCCCAACAAGCTCCACCATTGACCTACTGAAGCAGGGTGCAGCCCCTGTCGGTCCCCTGACAGTTTGTCCCTCTTATGTCACCGTAGGGCCGAAGGTTCCTGATGAGTCACAGGCATGCAATGTTCTGTATATTAACTCGGTGGAGATGGAGTCCCTGACAGGCCCCCAGGCCATTGCCAAAGCCATCAGCGAGACGCTGGCGGCCCAGCCACTGCCCAGTGCCACTGTCGTCCACTTCAAGGTGTCCACCCAGGGCATCACCCTCACCGACAATCAGAGGAAAATCTTCTTCCGGCGCCACTATCCCATCAACACCGTCACCTACTGTAACCTTGACCCGCAGGACAGAAAGTGGAACAAGACAGAGGGTGGAGCGGCTAAGTTGTTTGGATTTGTGGCCCGGAAACAAGGAAGCACAACAGACAACGTCAGTCACCTGTTTGCCGAATTGGAGCCAGACCAGCCGGCCAGTGCCATTGTCAGTTTTGTCTCCAAGGTCATGCTCGGCAACCCCAAACAGTGAAGACTGCCCTGGCAGACATTTTGTTTTTTCTCTAAACTGCGTGTGTTCTTTTTTTCCTCCCACAAAGACACGTTTTTTCATGCCCTTTTTGTGTGGATATATTTTTTCATAAAGGTCTCCCCGCCCCCGTCCTTCTTTCGAAGAGATGGGAAGGAGGAGTTGAGTAAAACTGTTGACTTTATTTTATTTTTTTTTTCTTTAAGTTTTCAAGGTGTTGATTTTTCCTTCAGTGAAGTAGGAGAACATTCAGGATGGAGTCTATGCACGTGCAGGAGAGCTCAGAGGTTTTTCTGGAAGAGGAAGGGGAGAATACTTCTCCCAGTGGTTCATCCAGACTTGAAGAGAATTTAGGAATTAATGAGTTTTAAAAGAAAGACAAGTGAAGAAACAAAAAAGCAACAAAGAATCATTTTTCAGATAGAACAACCAAAGGTAGTGTTCAGAACAAGTATGCCATTATTGGACAATGTATTCCATTTTGTTTTGTAAAGGAATTTTACTTTTAACCAGACTGTCAAAAAAGTACAAAATCCCTCTGGACAAAAAAAAAAGATTTTTTTGTCTGTCTCTGTGACTTCTTCTTTCAAAAAGAACATTGAAAAAAAAAGAAAAAGTATTCAGTGACGATATGCATGTTCGCTTGCAAATGGTCCTTAGCTGCTTCTCTAACCCTTCGTTGTTGGTCAAGACTGCTCTCTTTGTAGACACTGGTGGACTCGAGATTGTAGGATGCTACCAGGTCTACCGATCACAACACCTACACACACAGACACCAGTTCAGTTGACCAAACTGCATATCAGGAAAAAAATTGAAAAACACTGTGGTCCAACATCAGCAATAATGTCACCCAGGCCCCAGGCTCAACTAGTCAAACTCAGAAAGAGGGGGAACTGTTGGGGTGGAGAGGATTGTGGATCGGCTGCTCTGGCCTGTAGATGCAAAATGTGTGTGACTGCACTGTATCAGGATGCAGGTGAGGATACAAGTCTCAGCTCATGCACAGAGCCTGTAAAGCAGGAGAGAGATGTTCTACAGGTCACCTCATACACACACAGACACACACACAGACACACACACACACACACACACACACACACACACTCACACACATACACACAATTACTGTACACACACAGAAATGTGCACATCTCCCTATAATGACCCACACTGGACACTGGAGGGGTGAACAATTCATCGCCTGGATGGACCAACAGCGATGCCCCCGCATGCCGTAGTGCAAAAGTAGCTCCTTTAACCTTTAACCTTTACCCTTCAACCTGACTCAATGAACTTTACCCCCCAGCCCCCCACTATCCTCTGAACGCAGATCACCCCTTTCCCCTGCTGTAGGAAAGAAACAAAAAAAGAAGAAAAATTGCTATGGCGACACTGATCGCTAGAGACTTCAACTGCATGTGATGCTACCTTCAGGTTTTTCTTTTCTTTTCTTTTTTACTTCAAAAAAAGGGTCTTACATCTTGTTGAAGTTCGCTATGCTCTGTCTTTATCTTTGTCACACACACACACACATACTAACACACACACACACACACACACACACACATACTAACACACACACACATCATTTCCTCTCCCGAGTGGAGTTTTATTTCAGCCAAATACACATTAGGCAATGTCTACCTTTTCTTTCAAGAAAAAACAGAGTTGCTTTCTGTTCACACTGCCCATTACCACACTTCTTTTATTCACTGTGTGAGAGCGTGGCTTAAAAAAAGAAGACAACATAAAGAAAAAACAATACACAAAGCCCAATCTTCATAAGCTATTGAAAAAAGATAAACATGACTATAAATAATGATGACTACATATGTATTACTATAAAAAGGTGACTTTAATGAAAATATTTATTTTTGTTGCTCTCTCTTGCTTTTGGGTTATTCATGCAGTATATTGAAATGACAAGATATTGTATAGTCAACATTCAAAACATCTGAGACTACATGGGGGGGAAATTATTTTGGTTAAGAGTTAAAAGTCATGAGTGAAAAAAGACATCTTGTGTGTCCAGCTGAGAGTCACTTTGTTTTGCGTGTGGCCACTGCTCCATTTTGTCTCATGTTGAGGTGTTTGAGGTGTGTGAGGGGAAGACATTCATGTATAAAAAAAAACACAATGTTTTTATTTTTGTTTTTATGCATTTTTTTATTTGTAATCCATCAGTTTGTGCCGTTGCAGGATGATAACGCTGTCTGTCAGTTGTGTGTGTGATGGAGATGGAACTAGAAGTCTGCCAGCTACAGACACTAATTTGCCCATCAAGAATGTCAAGAGGAAGGCACACAAATGTGTTTGCCAAAGAGGCAAACTCAGAAGATCCACAGCGTAGGCTACCCCATCTTTATAATTGTATAGCACTTACAGACTGCCAGTGCCACCCTAGTTAAGTTAAACCAGAATCTAAACATGTCCTCATGACTTTTCTAAGGACAAGCTACAACAGATGTCGGTGCAGTTCTTACATAGCTTCTGTTGTTGGGATTCAGTATTGGAAACGGTTGAATAATATCTCGTTATTATTAGGGGAAGAGCAGGTGTCATGGCTGCCAAGAACCTTTGTTGTAGATCATGCCGCTATTAAGCACCATACTCCATTCAAAACCACTATAGCTGTACACATATATGCAGTTTCTTCGCCTTTTTCATGTAACAAGACCTCAAAGCGAACACAAGATAACAAATGATACTGACTGTCCTTTGTGTAACATAAAAGTATGTATTTATTTCTGTTTTTAAATTATGTTTTGTTTGTGTTTTTTTCACTCACCGGTTGGTCTTCCCCATAGTCAGGCCCAGTGCTTTGGTGTCATCAGTGTTACCCAGAATGCTCTAGACTCGCAGGCGACCCGGCGGACATTTTCCTCGGATGTTTGCCTGAAGTCAGTGAGTTGGCTTTGCGAAGATGAAGTCTGGGGTTTGAATGTGTGAATGTACTACTAAGGCTGTACAGAGCTTCTGTGGGATTTATGTGTTTTTATTTTATTTTATGTTTATTTGTGTTATAATGCAATGGCTTTGTTCCTGAGGAGAAAAAAAAAAAAACATTAAAGCAATACAAACCAGTTA
>XM_031525737.1 PREDICTED: Punica granatum senescence/dehydration-associated protein At4g35985, chloroplastic-like (LOC116196154), mRNA 
CTTTCGAATCAAACACAGCACAACTTCCTCTGTAAGCCATTCCTATTCCCTTGCCAGCCAATCACAATGTTCTTCTATTCCATGTCCTGACAAAACCAAACACAGCTCTCTCCAAGAACAGGTCCACTTCATCTGCGGGAGAGACAGAGAGGAAGAGGAAGATGGGCTGTTTCAGCTGTGGAAGCAGCAGAAGCAACAGCAGCAGCAGAGGAGGTTCAAATTCTACGTACTTTGATCCTTATGAGACAACCCAGCAAAACTCGGAACCCAGAACGACCAAGCAGCAAGTTCTGCTCCAAATCCCGTCATGCACCGTCCACTTAATGGACCAAGGAGAAGCTTTGGAGCTCTCCAGTGGCAGAGAGTTCACCCTTCTCACCATCTCGGACGAGAACATCTCCCTGGCAACCATCATAAAGGTCGGTGATGACCTCCAGTGGCCGCTCACCAAGGACGAGCCGGTCGTGAAGTTAGACTCCCTTCACTACCTCTTCTCCCTGCCCGTGAAAGATGGTGACCCGCTCAGCTATGGAGTCACTTTCATGGAACAGTATGTAAGCTATTTGGGGTACTTGGACAAGTTCCTTGAAGAACATTCGTGCTTCTCTTCTTCGGCTCCTGCTTCTTCATCTTCATATTCTGCACCGAACCGGAACCTTAACTGGAAGGAGTTTGCCCCGAAAATCAATGACTATAACAATGTCTTGGCTAAGGCCATTGCCGGAGGGACTGGTCAGATTGTTAAAGGCATCTTTATGTGTAGCAATGGCTACACCAATCAGGTCCACAAGGGAGGAGAAATGATCATGACTAGTGTTGTGGAGCAGAGGAATGGTTCGAGTTACCATGAAAGCTATGGAGGCAGCAATGGGGGTGCCCAGAAGAAGAGCGCAGTCAATATAAGCCTGAAACGTGTAAGAAAGGTGTCTAAAATGACTGACAAGATCAGCAAGAAACTGCTAGATGGAGTTCAATTTGCCACTGGATCGGTAATGGCGCCGATGGTGAAGTCCCAAGCAGGGAAGTCCTTCCTAGCAATGGTTCCAGGAGAGGTTCTGCTGGCTTCACTTGATGCTGTCGATAAGGTGTTAGATGCAGCTGAAGCGGCTGAGAAGCAAGCTTACTCGGCTACCTCAAAAGCTGCTACGAGAATGGTCAGCAGAAGGTTTGGAGAGAGTGCAGGGGAGGCAACAGAAGATGCGCTTGCAACAGCAGGTCACTGTGCAAGCACTGCTTGGAACGTCTTCAAGATCAGGAAGGCCGTCAATCCGGCATCTTCCGTCTCCACTGGGGTGCTAAAAAATGCGGGCAAGGCCAAGAATTCATACTCTTGAATTCAGTCCGATTCAACTCTATTAGTTAAAGTCTAGATGGACTAGAAACAGCATGCTCGGGTTTGTAATGGAGTCTGGAATATCTGTCTAGAACTAACTGAGAATGATTTGGTATATCATTTGCATATTGCCATTGCTGCTTCTTTCCTCAGATAGATCTTCCAATGTATGTCTGCACAATTTGTACGTAAGACATTTTTAATGCGTTTGAATTCAGAGTTAAAAAGTAACTTTAATTTTGATTTA
>LC139547.1 Uncultured bacterium gene for 16S rRNA, partial sequence, clone: SdRy21_50 
GTGCCAGCAGCCGCGGTAATACGGAGGGGGCAAGCGTTGCTCGGATTTACTGGGCGTAAAGGGTCCGCAGGCGGTTAAGTAAGTTAGATGTGAAAGCTCAAGGCTTAACCTTGAAACTGCATCTAAAACTGCTCGACTAGAGTCCAAGAGGGGTCGGCGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGGCCGACTGGCTTGGAACTGACGCTCAGGGACGAAAGCGTGGGTAGCGAACCGGATTAGATACCCGGGTAGTCCACGCCCTAAACGATGGATGCTAGGTGTGGGGATTTTATCTCCTTGCCGAAGCTAACGCATTAAGCATCCCGCCTGGGGAGTACGGTCGCAAGGCTGAAACTCAAAGGAATTGGCGGGGGCCCGCACAAGCGGTGGAGCACGTGGTTTAATTCGATGATAAGCGAAGAACCTTACCAGGACTTGACATGTTTACCTAAGCCGATGCGAAAGCATTTGGTGGTTTTGAGCTTGCTTAGAACGGTATTCACAGGTGCTGCATGGCTGTCGTCAGCTCGTGCCGTGAGGTGTCCGGTTAAGTCCGGTAACGAGCGCAACCCCTATTTTTAGTTGCCAGCATTTCGGATGGGCACTCTAAAGGGACTGCCGGTGACAAACCGGAGGAAGGTGGGGACGACGTCAAGTCAGCATGGCCCTTATGTCCTGGGCTACACACATGCTACAATGGCTAGTACAATGGGTTGCCAAATCGCAAGATGGAGCTAATCCCATCAAAGCTAGTCTCAGTTCGGATTGCAGGCTGCAACTCGCCTGCATGAAGCTGGAATCGCTAGTAATCGTGGATCAGCATTGCCACGGTGAATACGTTCCCGGGCCTTGCACACACCGCCCGTC
>XM_007532958.2 PREDICTED: Erinaceus europaeus C1q and tumor necrosis factor related protein 1 (C1QTNF1), transcript variant X1, mRNA 
CCCCCCCCCCCAGGACTTTTCATTTGTCCCACTGGTTCTCCTTCCACAAGTCTGTTTGGACCTAGAAAAAGCTCAGCTGCTGGGAGATGATCTAACCAGTGTCCCAAGAGCCCGTGGCAGTGGGCGCTCCCACTCAGGAGTCAGAGGCTTGGAGGGAAAATGGGCTGCCAGGCACTGGGATTCTCTCTGACCAGCTGCCTGCTCCTGGCCTTTACCTGCAGCCTGGTGCTGAGCCGTGTGCCACATGGACAGCCAGACCCTCAGGAGCAAGAGGGAACTGGGGAGCCACCATTGGATCACACTGAAAGGATTGAAGAAAATCATGAAAAATACAGCCCCAAGCAAGATGAGGAGCCCTCAGCAACCCAGTGTTTGCGCTGCTGTGACCCCAGCACCCCCATGTACCAAGCCATCCCAGTGCCCCAGATCAACATCACCATTCTGAAAGGTGAGAAGGGAGACCGAGGGGACAGGGGCTTGCAGGGCAAATATGGCAAGACAGGCTCTGCAGGTGCCCGGGGCCACATGGGCCCCAAGGGACAGAAGGGGTCCATCGGAGCCCCTGGGGACCGCTGCAAGAATCACTATGCAGCCTTCTCAGTGGGCCGCAAGAAGCCACTGCACAGCAATGACTACTACCAGACTGTCATCTTCGACACGGAGTTTGTGAACCTCTACGGCCACTTCAACATGTTCACAGGCCGGTTCTACTGCTATGTACCTGGCATCTACTTCTTCAACCTCAACGTGCACACTTGGAACCAGAAGGAGACCTACCTGCATATCATGAGGAATGAGGAGGTGGCAGTGATCCTGTACGCCCAGGTGAGCGACCGCAGCATCATGCAGAGCCAGAGCCTGCTGCTGGAGCTGCAGGAGCAGGACGAGGTTTGGGTGAGGCTCTTCCGGGGGGAGCGCGAGAACGCCATCTTCAGCGATGAGTTTGACACCTACATCACCTTCAGTGGCTACCTGGTCAAGCACTCCACAGAGCCCTAACCCATGGCACCTCCTCATCTCCAGCTTGCCTGTTCTCCCACCCCACTGGGTTCCAATGGTCCAGCATCAAAAGGCCCCCTGGCCCTTCACCTCCCCCACTACCCTGCTCCCTGCTCCCCAGCTCTGGCGTTCTACCCCACATTTTTCTTTAGCAGGGACAGGAAGTGAATGTTGCTGTGTGTTCTGGCCCTCTGTGGATGAAATCACAGGGGCAAATGCCCCCTCTGGAATCACATCCTTAAGTGGCCCATGGCCCAGGCAAAACATGTCTGGATATGGCAAAGAGTCTTCTTTCCTTTTCTTTTTAAA
>XM_032266396.1 PREDICTED: Sapajus apella transmembrane protein 108 (TMEM108), transcript variant X7, mRNA 
TGTGTTTATGTAAATATTATGTCAGATTGTCTTTATTTTAGCTGTTAAAGGTACTAATTAAATATTTGTTAATGAATTATAGTGCTGTATTTATCAAGTTCTGATTTACAGGGTAAAAGCACAGTTGACCAAATTGTGTGAAACCTTGAACCTCAGACCCTCTGACGTGGGCTTACTGCTGCATTAACACCCTGTGCATCTGGTGGTAGCTTCCAAAATGATAGCTGAGGGTCTGAGTCGAAATAAATGGCTTTTAGCAAGTGTTGAACTTTGAATGTGCTATTTAACCTCTGATTAATTGATTACTCAGCTCTGAATATGAGAGGTGTATAGCTATCCCTTATCTCACTTAAGTGATTTGAGCATGGATGCTCCTCTCATTTGAATACAGTTTTTGGGGTGGGTGGGGGTGATATCAGATCCCAGGGTACATGCTATGATAATGACAGGCTTAATTATCACTCAGTATGGTTTAGGACAAAGGTTTTCTTTTGATCACAATATTAAGAAACCTTTCTTTAACAGATAGTTTTACTTGTACGTATGAAGTATATATATAAATTTATCATTTCCTATATATTTGATTCACATTCAGAGGGTATTTAAAATAGTATCTTCTTCAGAATGTATATGTTGGGATTATATATTACTGTTTCTTTCCTTTTTATGTAGTTTCTTTTTGTGGTCAGGTAAAAGAAGACTAAAGGGATGTGATATTTAGTCTCAAATATTTGAAGTATAGTCACTGTTCTGTTTCAGGGCTGTTTCCCTCTATCAATTCCTTTGATATGGAACTCCAATGTCATTTTTACTTTACAATTGATCACATGCTGGCTCACTGACATCAATTAACTAATTTGAGGCAAATTTTTAAACCAAATGCCAAATTTTAATTTACTGAGAGAATATAATCTAATAAGAAAGACTACCCTTGGGCTCTTCACATGGTGAACCCTAGTGTGGTTTTGATAAAGAAGCCCAAGTATATACTAACTATAATCTTTTCTTAAAAAAAAGTGGTGTTCTTATCTAGACCCTCCAGAATCTAGAGTAGCATCGTCCAATAAAAATGTAATATAAACCTCAAGTATGAGCTTTATATGTAATTTTAAATGTTCTAATAGCCACTTTAAAAATGAAATGTGAAATTAATTTTAGCTCTATATTTTATGTTGCTTAATATATGCAGCATATTATTTCAACATGTACAGTTGACCCTTGGTATCCATGGAGAATTGGTTCCAGGACTGCCCACAGATACCGAAATCTGTGGATGCCCAAGTCCCTTGTATAAAATGATGAGGTATTTGCATATAACATGTGCATATCCTCCCATATATTTTAAATCATCTTTAGATAACTTAAAATACCTAATACAATGTAAATGCTATGTAAATAATTGTTGTACTATATTATCTATATTGTTTTTTGTTTTTTATTAATTTACTTTTTAAAAATATTTTTACTGGGCAGTTGGTTGCATATGCAGAACCCATGGATATCGAGGGTTGACTGTAACTAATATAATGAATTATTAATGAGATATTTTGTATTTTTAAAATACAAAGTCTTGAAAGTCCAATTGAGATGTGCTGTAAGCATATTTTACACTTATAGCACATCTCAACTGGGACACTGAGGTTTCATGTACAGTACTTGATCTGTACTTAAATTAAAACTTACAGTAGAAAAAATAGATTCACATACCCAAGTCATTCCAAACATGCAAATCAGTTGTCCAGTAACTGAATCGGTGTCCATTTCTAAATTTAAATTTAACTTTAATTAAAATTAAATAAAATTTAAAGTAAAATTCAATTCCTGATTGACACTAGCAATGTTTAAAGCACTCAGTAACCACCTGTGGAGTGGCTGCCATGTTGTGTTGGACAGCACAGAAAGGACTGCTTTCTCTAGCCTTTTCCTTCACTCCTGCATGTCTCAGATGGGAAGACTTGTGTGAGACCTCTGATGGGAAGAGAATCTCATTTTGAAAGTGTGGAACCACAGACAAAGAGTTGACTTTCTTAAAAAGAAGTTTCCATTCAGGCTATATTAGAACCTGCCTGGCAAGGAGTTATCTGTCTAATATACCACATTATCTCCACCCTTGTTCCTAAATACACCCCTCATTGTCTCCCCAACAGATAAAAATATGCCAACCTTGTGTCAAGGTTGCCTCCCTGATCCCCTTGTCCTCCACTGCAGGCTGGCTCATTTCCATTACGTCAGTGTATTTCCTGGTTATAGTCCTCCTTTCTCATTGTTTCAGTTTCCACATTTGGCCTTAATTTCTATGATACCTCAGTGAAGCATTCAAATGTTTAAATTCCAATTTAGTTCTTAATTAAGGTCATGTATATCAAGGTCAATGTTATGTTAATTTGGATAACAGACATTTCCTTTGTCCCTTGCTCCAGATTTCTAGAGTGGCTGGGCTGAGAAACTTTACTTCCTGTTCACCTAGACAGAATCATGAATAAACTGGAGGATAAGCAGGACCAGATGATACCATGAAGAGAAGTTTACAGGCCCTCTATTGCCAACTGTTAAGTTTCCTGCTGATCTTGGCACTGACCGAAGCGCTGGCATTTGCCATCCAGGAACCATCTCCCAGGGAATCTCTTCAGGTCCTCCCTTCAGGCAGTCCCCCAGGAACCATGATGACAGCACCCCACAGCTCTACCAGACACGCTTCTGTGGTGACACTGACCCCCAATCCCAATGGACCCCCCTCACAGGCTTCAGCTCCCATGGCAACACCGACACCCCATACAGAGGGGCACCCTCCTACGCACACCATCTCCACCATCGCTGCGACAGTAACCACCCCCCATTCTAAAAGCTCCCTACCCACAGGGCCCTCTCCAGTGGCCACAGCAACCACATCCTCCCACCCAGAGGGCCGCCCCCCGGGGCAGGCTACTCCCACCATCCTGCTGACAAAGCCACCGAGGGCCACCGGTCGCCCCACTGCAGCGCCCCCACGCGCTACCACACGCAGGCCCCCCAGGCCCCCAGGCTCCTCCCGAAAAGGGGCTGGCAATTCATCACGCCCTGTCCCACCTGCACCTGGTGGCCACTCCAGGAGTAAGGAAGGACAGCGGGGACGAAACCCAAGCTCCACACCTCTAGGGCAGAAGCGGCCCCTGGGGAAAATCTTCCAGATCTACAAGGGCAACTTCACTGGGTCTGTGGAGCTGGACCCTTCTGCCCTCACCCCCAGGACCCGGCTCTGGGGCTACTCCTCTTCACCACAGCCCCAGACAATGGCTGTCACTACAGCGCCCAGCAATACCTCGTGGGCACCTCCCACCACCTCCCTGGGGCCTGCAGAGGACAAGCCAGGCCTTCGCAGAGTGGCCCAGGGAGGTGGTTCGACCTTCACCAGCCAAGGAGGGACGCCAGATGCCACAGCAGCCTCAGGTGCCCCTGCCAGTCCACAACCTGCCCCAGTGCCTTCTCAGCGCCCCCACCGCGGTGACCCACAGGACGGCCCCAGCCATAGTGACTCTTGGCTTACTGTCACCCCTGGCACCAACAGACCTCCATCTGCCAGCTCTGGGGTCTTCACGGCCGCCACGGGGCCCACCCCAACTGCCTTCGATGCCAGTGTCTCAGCCCCTTCCCAGGGGATTCCTCAGGGAGCATCCACAACCACGCAGGCTCCAACCCATCTCCCCAGGGTCTCAGAAAGCACTATTTCTGGAGCCAAGGAAGAGACTGCAGCCACCTACACCATGACCGACAGGGTGCCCAGTCCTTTCTCCACAGTGGTATCCACAGCCACAGGCAACTTCCTCAACCGCCTGGTTCCTGCCGGGACCTGGAAGCCTGGGACAGCAGGGAACATATCCCACGTGGCCGAAGGGGACAAACCCCAGCACAGAGCCACCATCTGCCTGAGCAAGATGGATATCGCCTGGGTGATCCTGGCCATCAGCGTGCCCATCTCCTCCTGCTCTGTCCTGCTGACAGTGTGCTGCATGAAGAGGAAGAAGAAGACTGCCAACCCAGAGAACAACCTGAGCTACTGGAACAATGCCATCACCATGGACTACTTCAACAGGCATGCTGTGGAGCTGCCCAGGGAGATCCAGTCCCTGGAAACCTCTGAGGACCAGCTTTCAGAGCCCCGTTCCCCAGCCAATGGCGACTACAGAGACACTGGGATGGTCCTTGTTAACCCCTTCTGTCAAGAAACACTGTTTGTGGGAAACGATCAAGTATCTGAGATCTAACTGCAGCAGGCTTCGCTTTGCTATTCCCTATTTTTCGTCTCTAAATTATAAATATACAAATATATATATTATAAATATAACCTTTGTGTAACCCTGACTTAATGAGAAACATTTTCAGCTTTCTTTTCCTATGAATTGTCAACATCTTTTTTACAAGTGTGGTTTAAAAAAAAATTTACAGAATGATCTGTGGCTTTATAAAATAAAGGTATTTCTAAGCAAAGCAGTTGCATTGATTGCTTCTCTTAATAACTATTTTTGAGCACCTGGGGATCCCAGGAACCCTAGTCAGGTGAGGTAAGAGACTGACCTCCTGTAGAAGCTCAGTGTTACAGTGGTCAAGTGCACAGTTCTTTGAGTGATTCTTAAAGCTCTGGTTCCTCTTGATTTGGCGTGGCCCATTTCCTCCCTCTCATACGCACACCTGTAAAGGGAACTGGGCCACCTGGGGGAAGATGGCAGACTCATGCACAGGGCAGGAAAAGGGAACACCTCATCACCCCCAAGGATGGGGGCCCTGGAGCCTCACGACACCACCATTGGATGTCATGTTTAAAAGTTGTAGACAGCAGACAGAAGCATGGAGTCCTTGGGAATCCATGGAGGACATCAAGGCATCCCAAGGCCACATCCCCCTAACATTGCTTCCACTGCTAACAACAAGACTGCCTTTCCCTGGTGGGAAAATGCTCCCTTCATGCCCGTTCCTGCATCCCCTCCAACGCTCAATCTGCATTAAACACCCGTGCCTTTCTCTTGGAGAGGGTTTAGATGCAGATCCCAGCCTTGGAGCTTTAAAATGCTTGCCCTTCTTCAAGGATCAAATGTTTATTGGGGTTTAGCTTTGTTTTCTCAAAAGGCCACGGTATTGTGCCCCTAAGGAACACGTTTATCTAAGAAGCTTTGAGGTAGCAGAGCTATGATTTTTGAAACCTTCCTCCTGCAATCTTTAAAAAAAAAAAAAAAAAAGATTGCCAAGCAAGTCATTTCCGAGAAGACATCATTACACTCCTACTTGCCCCTGCAAACCTGCTCGAAGCACCAGCCGGTGGACTTGCCACGCAGCTCGCAGCTTCCACTGCTCGCCTCGTTCCCCACTGGCTGGCTGCCTCACCGTGCCGTGTCCAGCGTGGCCAACAGGGTCAGACCCTCAGAGATGCCCAAGAGGCTGCCAGAGGTGGCTGCTTCTCTATTTTTTCCTGATCGTGGCTGAGAGAGATGATTACTGCTTTGACACTTTCTTTCTCTAAAATAAAGCTAGTTTGATAGTATATTTTGAATATAGATGCTCTTATAGTTGGATTGGGAATTGAACTCGAATGTTGATTCATATGTTTGTGTTGTTGCTGTGGTCTTTTTATCATGACTTTTTTCTTTCTGCGTTTTCCTTAAAAAAAAAGATGGCCTTCAAAAGTGTGTTCTTAGTGTTGTATAAACCTACTTCATATGAGTTCAGTTGTTGTCTCTCTTCAAAGACTCTTCAACCCACAAAGAAGCAGGTTAAATGTTTCTCTAAGTTTAATTTTCTAGCGTGTTGTTGTCTGACCTTTTTAACCTTACCATAATATTTCTGTTAACTGTTACATTTAATATACCAATGTGTGTGAGTATACATAGAGAAAAATCTGTAAAGTAAAATTTATATATAATATATGTAATCCAAGATACATATGTTATATATACACGTACGTGGATGTATGACTTATTTTTCCGTATCCACAGATTTCGGCTACCATGGATATATAAATAAACTTATTTTGTTAGCCAGAGGA
>XR_006349495.1 PREDICTED: Manihot esculenta small nucleolar RNA SNORD34 (LOC122722555), ncRNA 
GGAGGCCTAGGATGATCTTAAATTTGCCTACATTGTCAGAGTGTTTAAATCATGACAGATTATTGAATGATTCTGAGGCCACT
>XM_008548960.2 PREDICTED: Microplitis demolitor basic salivary proline-rich protein 2 (LOC103571010), mRNA 
TATTGTTATGATTATTGGCGGCCATATTTGAAATTTATTCGAGTTTCCAATGTAAAAAACGCCCGAGCTTTAGTTTGGTTTTCATACCCAAGCAAATGTTTGGTCACTAAAAAAAAAGGACTCAACTACGTAATTGTCAGATTATTGTCATAAATCTCATTGTAATAAATTACTTGAAACGTGTGGGTGTGCGGTATTGTATTGGTGATAAAAGAGTAAGAAAAAAAGTAAAACGTGGTATTGTTTTATTAAAATATATCACCAGCCACTAAATTGTGGTATATATATTTAGTTTAGCTTTAAGTAACTAAAAATGTCAGCTACTTTTGCACAACGCGGTCGTGTACCGCCAACTCCAGCTCAAATTCAGAAGATGCTGGACGAGAATAGTCATTTGATACAGACGATACAGGAGTACCAGAATAAAGGAAAACCTCAGGAATGTTTACAATATCAACAGATATTACATCGGAATTTAGTTTATCTCGCTTCTATTGCTGATGCGAATCAAAATATCCAGGCACTGCTACCGCCGCCACAGGGTTTGCCGCCGATGACAAATGGTCCGCAGCATGGAATGATGGGTCCGCAAGGGCCACCGAATGTCGCTCCGGGAACTCCAGGGCCTGGAGGTGAAATGCCACCGAATCCTCCGCAGCCTATGCCAATGCAGGGATTTAATCAGGGACAGCCGATGCCTCAGGGTGGCTACCGTGGTCCAGTGATGGCTGGACAGGGTCCTCCGATGAATAGAGCGAACCCTGGACCTGGGCCTCAGCAGTATCGAGGTGGGCCACAGGCTTATCCGCAGCAACCTGGACAGCAGGGGTATCCTGCTGGTTATGGGGGACAGAATCCTGGTGGGAATTATCCACAAGGTCCTCAGGGAAGTGGTTATGGAGCTGGACAGCCTAATCAGTACCCGCCTAATGCACCGCAGCAAGGCTACCCGGCGTCAGGACAGCAGAATTATGGGCCTCCGGGTTCTGTTAATAGTTATGGAGGTCAACCGGGTGCTTATCCGCCACCGGGAGGTAATCAGCCCTCTGGTGGCTACGGTCCTCCGCCGCCGAATCAGCAAGGATATCCCCCGCCTACTACGCAGCAAAACTTCTCGCCTAATCCTCAGCAGCAGCAGCAACAACAGCAGCAACAACAACAACAGCAACAGCAGCAGCAACAACAACCTGGACAGTATGGTAGTCCTAGTCCTCAGCCAAACTATCAGCCTCCTTCCCAAGCTCCTAATCAGAATGCTTATGGTCCAGGTCAGACTCCCGGTAATTATCCTCCTCAATCCTCTCAAGCTTATCCTAATAATGTTCCTCCACAGAATTATCCTCCTCCACCTCCGACGTCTAATAATGTTGCCCAGCCTAGCCAAGGACCACCACAGCAGAGTCAAGGTGGGCCGCCGCAGAATTACTCAAGTCAGCCAAGTCCTGGTGGTGGACCACCAACTCCATATGGACCTTCATCTACATCACCGCCATTTAGCACCAGTAATGTGAGTGGAGTTAATACGTATGCTCCTAGTAATCAACCTACGAGTACACCTTCTGCTTCGACTCAGACTTACCCACCATCCAGTGGACCTCCACCAGCAACTTCGCAAGCTGGTAGTTATGTTCCTGGGCCTACTCCTTCCGGGTATCCGGTGCATCAGCCGTCGCATCAAGCTCATGGTCCACATGGGCCTCATCCTGGCTCTCATCAGATTCCTCATCCTCCGCCATCACAGTCGCAACCTGGACCGCCACCTCAGTCGCAGCCACCTGGTCAATCGCAGCAACCTTCTCAACAACCGTCTCAGCAGCAGCAGTCTCAGCAACAACCACCAGCCCAATCACCACAGCAGCAACAACAACAAGGACCTCCACCTCAAGGACCCCCTCAGCAGCAACAATCTCAGCAGGGAGCGCCACAGTCTCAACATCAACAATCCCCGAGTCCAGTTCCGAGTAATTTCCCACCAACTTCCGGACCAATATCACAGGGTCCACCCTCTGGGCCTCCAGGTCCACCGGGTCCACCTCAACAACCTCCTGGTGGATATGGACCTCCACAATCTCACCCAGCGACGACGCAGACTTACGTACCCCCGGGTTCTGGTCAACCACCACAAGGCTATCCGACTCACCCCCCATCTCAAGGAGGCCAACCGCATTATGGTCATCCACAGTATCCTCCTCAAAATTATCCGCCTCATCCTCCACCGCCTTCTGCTGGTCAAGGTTATCCTCAGTATCCTCCTCGAGGTCCCCCTGGTGGTCATATGCCACCACCACCGGGTCCTCAAGGTCCTCCGCCACCGAATCAGTATGCAGGGTATGGTTACCAACAACCTCCGCAGTAAATAAAAAAATAACGAGACTTTTTTTAAATAATTCGACTATAGGATTTGTGCTATTTAATGATGTGTAATGTAATGGTTTTTTGCATTGTAATTTTTATATTTTATATATGTAATAATTTGATGATATTGATAATTAAATAAACTGATTTTTTTGTTGTACTTGTGGGATCGTTTGTGGAATAAAAAATGATTTTTGAAATCTTATTAATTATTTTATTATTTTAATTTTAATGCTCACACTTCAGCTGCCCAATTTCAAAACACAGTAAGGGACAAATTTTTCAAAGTTGATTTTTTAGAATTTATAGTTCCAGTGGAGTCTTATGGACATAATTTATTTCATATTTCAAAAATTTTCTTTTTGTCAGTTACTGTGTTTTGAAATTGAGCAGCCGATTTACTCGTACATATTTCCTTTGATATTATTAAGGTAAGAGACCTAGTACCCGATCAGGGAACTAGGATTCGATCGTTTTATAAATTTGTATGTCTATATTTAGTAAATATAGATATACAAATATATGAGTGATCAAGTACTGGGTCTTTTACCTTATATTTATTATTTAATACTTGGTAA
>JN883616.1 Uncultured bacterium clone 254_InIs3-B9 16S ribosomal RNA gene, partial sequence 
AGAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAAGCACTTTATCACGATTTCTTCGGAATGACGATTTGGTGACTGAGTGGCGGACGGGTGAGTAACGCGTGGGTAACCTGCCTTATACAGGGGGATAACAGTTGGAAACGGCTGCTAATACCGCATAAGCGCACAGGGTCGCATGACCTGGTGTGAAAAACTCCGGTGGTATGAGATGGACCCGCGTTGGATTAGCTGGTTGGTGAGGTAACGGCCCACCAAGGCGACGATCCATAGCCGACCTGAGAGGGTGACCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGCGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAAGATAATGACGGTACCTGACTAAGAAGCACCGGCTAAATACGTGCCAGCAGCCGCGGTAATACGTATGGTGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGCAGGCGGTACGGCAAGTCTGATGTGAAAGCCCGGGGCTCAACCCCGGTACTGCATTGGAAACTGTCGAACTAGAGTGTCGGAGGGGTAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACGATAACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATACTAGGTGTCGGGGAGCAAAGCTCTTCGGTGCCGTCGC
>MZ592923.1 Lysinibacillus sp. strain KEI8 16S ribosomal RNA gene, partial sequence 
CTTGCTCCTTTTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTACCCTATAGTTTGGGATAACTCCGGGAAACCGGGGCTAATACCGAATAATCTCTTTTGCTTCATGGTGAAAAATTGAAAGACGGTTTCGGCTGTCGCTTTAGGATGGGCCCGCGGCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCACAATGGGCGAAAGCCTGATGGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGTAAGGGAAGAACAAGT
>XR_004099807.1 PREDICTED: Ipomoea triloba uncharacterized LOC116026275 (LOC116026275), ncRNA 
TTTTTCCCATTAATCTGCAAAAATGAAGGCATTTTGATTAATAATTCAGGAGTGCTATGAAGGTTAGAGCCATACTTCGGTTGTGGAAAGGGAAGGCTCTTCCGAAAAAAAAGAGCAAAGAAATCATCTTCCACGACGAACAGGAATCGAGCTACATAACAGAGTAGTATGTACCAGTTGATATGTTGAAGGTTATCTCTATATTCCACAATAAAAAAGAGTATCCAGTAAAGGTCCATTGTATGTATCAGTTTCTTTGTTGAATTAAGTTCATTGTTCATATTAAATGAACTATTGAAAATATGAATATGTTCGTGATTTTTTTCTTTATGTTTTTTTTTTCTTTATGTTATGTCCATTGTTCATATAACAAAGTAGCATGTACCAGGTTTTGTTTCTTTAACTGTGTAGTTTAAGAAAAAGTTGTGGTTCTTCTCCTTTT
>XM_029121761.2 PREDICTED: Esox lucius contactin 5 (cntn5), mRNA 
CCCCGCGCACCAGCACGCCGCAGAACAGAAGCTGCTGAGACCAACCGCCAGTCTGACGTGCAGAGTCAACCACCGAATTGTCATCTCCGCGGCTTTTATCCATTTCAAACGGCGTTCGGTAACTGGAAGGTTCCCGAAGTGTTGGCCAAGGAAGTCCAGAAAGCAACCGTCGGTGGAGAAATCGACACAAGATTACAGCGAAAGGAGGGAGGGATGTAGCTACTATTCACGTCGTCGTCTTATTCAGTAAAGACAGAGGAAAGGACCGGTTTGGAATCAGGCTGCTTTGGCATTCTGTGGTTCGGGGCGACGGAGACTGGTTGGTTACCGTTAGATTATCTGGGACTGGCAGTTGAAACAACTTGACGTTACGAAGGGAAAACCTGCATGTTCCCAGCTTTTGGCGGCACAGCTTTAATGAAGGATCACACCTGTTAACAACACTTGTGAAGGGGGCACCCACCTGAACGAGCATGGGGTCGCCGTGGAAACCACTTCTCCTGCTGTCCATCATCAGTGGCCTTTCAGACTTCGCCAAAGCTGTAGGAGGGAGGCAAGTGTCCTACGCAGCTGTTCTGAGAATGAAAGGGGACAGCTCATCATCACTGCTCAGTTCACGGAGCCGACATGCCTACAGCAGAGGACTGGTGACTCCTGATTGGCCGACGTCCTTTTCCAGCCAGCACCCGTCGCCTCTCAATCTGCTCAGCTATCAGGAGGAATACAGGAGTCAAGAGAGTGAGGAGTTCGGGCCAACATTTTCCCAGGAGCCAGATGACTCTATCTTTGCACTGGACTCTGAGGAGAAGAAAGTGATGATGAGCTGTGAAGCCAGAGGCAACCCAACACCTGCCTACAGTTGGTTCATTAATGGGACTAAGCTGGATGTAGAGGCAGATTACCGATACAGCTTGATGGACGGCAACTTGATAATAACCAACGCCAGCGAGACGGCAGATTACGGCAGATACCAGTGCATGGCGGAGAACAGCTACGGGATGATTCTGAGCAGGGATGCGCTCCTACAATTCGCCTATCTCAGGGCCTTCAGCGGCAGGACGCGAGGAGCCGTGTCTGTAAGGGAAGGACAAGGAGTGGTGCTCATGTGCAGCCCTCCACCTCATTCACCAGAGATTATCTACAGCTGGGTCTTCAATGAGTTCCCGTCATTCGTTGCCGAGGACAGCCGGCGGTTTATCTCCCAGGTAACGGGCAACCTGTATGTCTCCAAGGTGCAGCCTAGCGATGTGGGCAGCTACATCTGTCTGGTGAAGAACACTGTGACCAACGCCAAGGTCCTCAGCCCGCCCACGCCCCTTACACTCAGAACAGATGGTGTAATGGGAGAATATGAACCTAAAATCGAGGTGCATTTTTCCCCGTCTGTATTAGCAGCTAATGGAGTCACCGTGAGACTGGAGTGTTTTGCCCTGGGGAATCCTGTTCCAACCATCACATGGAGAAAGATGAACGGTAACATTCCTAAGAAGGCTCGTCTGAGGAAGTCCCAGGCAGTGCTGGAGATCCCAAATGTTCAGCTAGAGGACTCAGGCACCTACGAGTGTAAAGCAGAGAATCCCAGGGGAGGAACGGCCTTCAAGGGACACCTCCAAGTTTACACCCTGCCCCAGTGGAGCAGCAGGATAAATGACACCCAGCTGGACAGTGGGGAGCAGCTCCAGTGGGAGTGCAGAGCCACCGGGAGGCCTAGACCCTCCTATCGCTGGCTCCGTAATGGACAGCCAATTACACAACAGAGCAGGTTGGAGATGGTGAGTGGGGAGCTTATCATTCACAAGGTCCAGCAAGATGACTCAGGGATGTACCAGTGTGTGGCTGAAAACAAGTATGGAGCAATCTACTCCAGTGCAGAACTCAAGATCTTAGCTTCAGCCCCGGTCTTCAACCCCAACCCTATACGCCTGATCGCTACTTTGGGGAAGGACGTGTCGCTGGAGTGTAAACCTAAAGCATCTCCCAAGCCCAGAGTAACATGGAGGAGAGGGGACCGTAGAATACAGCCCAACAGAAGAATAATGCTGTTACGAAACAACACGCTGAGGCTCGTCAACGCCAGCCGCTCTGATGAGGGAAACTACGTCTGTCGGGCTGAGAATCAGTTTGGCTCAGCCGAGATGACGGCCACACTGTGGGTAAAAGAGGCCATGCGTGTGGACCTGAGCCCCAGCAGGGTGGAGGTGACGGTGGGGGAGAGTGTGGTGCTCAGCTGCAAAGCATCACATGACCCTTCTCTGGACGTGTCCTTCCAGTGGCTCCTCAACCAGCAACCCCTCGACTTCCAACAGGAGGGTGGCCATTTTGAATACATCCAAACACAGTCCTCCACGGTGGACCTGATGATCAGAAGCATCTTGCTGAAGCATGCTGGGAAATACGGCTGCCGAGCTCAGACCAGCGCAGACACAGTGTTTGCTGAGGCTGAACTTCTGGTCAGAGGCCCCCCAGGACCTCCTGGGGTGGTGATTGTGGAAGAGATCACAGACACCACAGCCACCCTGTCATGGAGTGCAGGTCTGGACAACCACAGCCCCATCAGCACCTACCACCTCCAGGCCCGGAGCCCTTTCTCCCTGGGCTGGCAGACTGTACGCACAGACCCCGATCCAGTGACAGGGGTTATGGAGTCGGCCATGGCTGTTGAGCTGAACCCCTGGGTGGAGTATGAGTTCAGGGTGGTGGCCAGCAACGCCATTGGGACGGGAGACCCCAGCGTTCCATCCAGAGGAGTGAGGACGAAAGAAGCAGTACCTTCAGTGGCTCCGGCTAACGTCAGTGGAGGGAACGGTCGAAGGCATGAACTGGTCATCTCTTGGGAGCCTGTGTCAGAAGAGTTCCAGAATGGGGAGGGTTTTGGCTACATCGTGGCATTCCGAGCCAATGGGACGAGAGGCTGGAAGGAGAAGATGGTGACATCAGCAGATTCCACTACATACAAGTACAGGGATGAGACATTCCCTCCCCTCACCCCCTTTGAAGTGAAGGTGGGCGTGTACAACAACAAAGGAGATGGGCCCTTCAGTGGAGTGGTCACGGTGTACTCTGCAGAGGGTGAGCCCAGAGAGGCCCCATCTGAGGTAAAAACTTCCAGCACTTCCTCTTCGGAAATTAAGATCACATGGCGACCGCCGAACCCTGGCCCAGGAAGGCCTGCAGGATACGAGGTGAGCTACTGGAGGGAGGGAGAACAGGAGGAATCTGGGAAGAAGAAGAAGACGATAGGGAACGAGACGTCTATGATGCTGACCGGCCTGGGCGGGAATAGTGTGTACCTCATTACAGTCCGAGGCTTCAACAGCATTGGCCAGGGCCCTGCAAGCATACCAAGCGCTGCCAAGACCAGGAAGGACCCTCCTGTCCAGCCTCCAGCCAACCTCATGTGGATTCAGGAAGGGAACAATGTGTCATTAAACTGGGACCCGGTCAAGTCTCAACCAAATGAGTCAGATGTCATTGGATACAAGGTCTTGTTGAGTCAGGAGGGGCGTGTCCACCACCAGGTGATGAGAACCATCAATCCCTCTGCCATCCTAACCCTACCAGAGGGGGGCACCTACATCATTGAAGTGCGGGCAGTTAGTGAGGGAGGAGAGGGAGCAGCCAGCTCCCTGGTCCGTGTACTCACCTCTTCAGGAGTGCGGGCAAAGAGCAGCCAGTGTTCAGTCCACTGTGTTCGACCCTGGGCTCTGCCATGGACATGGACTGCTCTGCTCCTTACTGTTCCTCTGGTGCCTTCAGCTTCCTGGTGAGGCCTACAGAGACCTCCTGCTCCTCTTTTACATGGAGGGACTGGGCCTCTCCTTTGTCCCCTCGCCCTCCTTCCATTCATCTCCTCCTGAAACTGTTTGCTTGCTCTGGCCTTGCCCATCAGCCAGACAGATCTGGGGCCTGCTGAGCGGATCCACTTCTAAAACCAACAAACAGATGGTCAAAAAATAACTCATTTCTGTCTTTTTTTTTCTTCACCTATCAACTTCCTGAGAGCTAAACAAAACTCTTCCTTTTTTTCTTTGGCGGGGGGGGGG
>XM_016506093.1 PREDICTED: Sinocyclocheilus anshuiensis guanylyl cyclase-activating protein 1-like (LOC107703476), mRNA 
TGTCATTATCCCATTAGCAGTAGTTATTTTAAGGTGCCACCTCTTTTTATTGGTACTTGGATCTAATAGTTTCAGACATTCAGTATCCTGTGCTGTCACTGTGTGCGGAGGCCAGTCTGCACCTCGTTGTCAGAGCTCACAGGCCTGCAACCGTCTGGTCCAGCCATGGGGAACACACACGCAAGTCTGGACGACATACTCGCTGAGGACATGCACCACTGGTATAACAAGTTCATGAGGGAGTCTCCATCAGGCCTGATCACACTTTTTGAACTCAAATCCATCCTGGGACTGCAGGGCATGAATGAGGATGCTAACAGTTATGTGAACCAGGTGTTCTTCACTTTCGACATGGATGGGGATGGATACATAGATTTTGTGGAATATATCGCTGCTATTAGCTTAATGCTGAAGGGGGAAATCAATCAGAAACTGAAATGGTACTTCAAACTTTTTGACCAGGATGGCAATGGAAAAATTGACAAGGATGAATTGGAAACAATATTTACTGCTATACAACACATTACAAGAAATCATGACATTGTGCCAGAGGAAGTAGTGGCTCTTATATTTGAAAAGATTGATGTTAACGGAGAAGGTGAACTGACGCTGGAGGAGTTCATTGAAGGAGCCAAAGATCATCCTGACATTATGGATATGCTGAAGAAACTGATGGACCTCACTCCAGTCCTGGTCATTATTGTGGAAGGGCGACAGAAACCAATCAATACAAGTTAGGCTGACTAAACTCCAACTTAAGGACAGAGAAAACAGAAAATTCTCCGCCTGAAAGCAAAATGAAAGTGGAGTTTGGTAGTCCCACTCTTGAGGAACAGATGTAGCTTCCCACAGCACCTGTGAGAAAATTCTCGGGGGAACTTTTGCCCAAGCATGGTCCTGTCTGACCCCAGTGGAGATACCAAGCCTTGCATCTGAGCTGTCCTCAGCTAAACATTGATCTTCTAATGCTATAAGGGGGATTCAGGAAACTAAGGAACTGCTGGCAAGGCTTAGGAGTGAGCAGTGTGGTGCTTTTTAAGGAAAGGCTCAGTAGAGAACACTGTGCACACATCTAGTGACTTTCATTGGATGAGCACATCATATAATCCATGTACTTGTGCTTGAACTATTTATGGCATGACTATATTGCTCTGAGAGTGAACTCTGAGACAGTACATTGCCGATGTGGCCTGAATTGCCCTAAGAACTGGGAAATGTAGAGCAATGGTTCTCAGCTGGTTTTTGCCTACATTTTAAATTGGACATCAAATGGCAACCCAACACAGAACAAAAATAGTTTATTGTACAAAATGTACCTGTAAATCAAACATTTCTATAGAATGTTGTAATCAACATAATATTACAATGAACTGCATAGACCCAACAATTTACTACATTAGCAACCTGACCAGGCTGAGTGAGAAATATAACAATTTGATAAATTCATAAATGCAATAGTTGGCCACAATATGTTGACATCAATATCTTTGGCGTTATTAACAATGGGAAGTTGTGCCTGTTTATTTTGTTGTCCGTGACCCAGAACAGACCTAAAACCAATTTCTTGTCTGTGGCCCACCAGTTGTGACCACTGATATAATATCACAAATATTATAGCACTTTATCAAAGGAAAGCATCAAATTTTCCTGATACAGTTACCTTATGCAGTAGGTGCAAAAGAAATTCATTAAATGCATTTCCACCTGTCTTTTAGCTGATCTAAACTTGTCAAAACATTAAAACTAAAAGTTTTCAAAATTAGTACCTGCATTTTTTAGACTTATATCCTTTACCATTCAAAGGTTTGGGTT
>XR_004899828.1 PREDICTED: Phyllostomus discolor uncharacterized LOC118497304 (LOC118497304), ncRNA 
CTGAACACACCTGCTTCATAGCATAACTGTGGGGCTGGCCAAAGTCTGTTTGTTTTTTTCTGTAAAATAAAAGACCCATTTTTCATTTTCACCAATGACATTATTGACTTGGACATTTGGACTATGGCCGCTCTCTCCCGTATGGTAGAACATTGACCGTTCTCCTTCAAAGTCTCAGTGTGATCGCTGTCGATTTCATCTGGTCTGCCCGACTGTGGGGCATCGTCCAGAGAGGAGTCTCCAGCACAGAACTTCGCAAACCACTCCTGACACGTTCCACCAGTCACGGCACCTTCTCCACACACTGCACACATCTTTTTTTGCATTTCAGTTGCATATTTACCTTTCTTGAAATAATAAAGCACAATACACAAAAATGTCTATATACCAGCCCTGG
>MG876669.1 Uncultured bacterium clone 7H_2119_4993_17823 16S ribosomal RNA gene, partial sequence 
TGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCAACGCCGCGTGAGGGATGAAGGATTTTGGTTCGTAAACCTCTGTCAAGTGGGAAGAATAATGACGGTACCACTAAAGGAAGCCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGGGCAAGCGTTGTTCGGAATTATTGGGCGTAAAGAGTATGTAGGCGGCTAGATAAGTCAGACGTGTAAGCCCATGGCTCAACCATGGAATTGCGTTTGAAACTATTTAGCTTGAGTGCAGGAGAGGAAAGCGGAATTCCCAGTGTAGCGGTGAAATGCATTGATATTGGGAAGAACACCGGTGGCGAAGGCGGCTTTCTGGTCTGTTACTGACGCTGAGATACGAAAGCCAGGGGAGCAAAGGGG
>JF603243.1 Uncultured bacterium clone GDIC2IK01C8G26 16S ribosomal RNA gene, partial sequence 
TCAGGATGAACGCTAGCGACAGGCCTAACACATGCAAGTCAGGGGCAGCACAAGGAGCAATCTGAGGTGGCGACCGGCGCACGGGTGAGTAACACGTATGCAACCTGCCTGTAAGCGGGGAATAACCCGTTGAAAGACGGACTAATACCGCATAATACTAAATTACTGCATGGTAATTTATTTAAACATTTATGGCTTACAGATGGGCATGCGCATGATTAGCTAGTTGGAGAGGTAACGGCTCCCCAAGGCAACGATCATTAGGGGTTCTGAGAGGAGGGTCCCCCCACACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGACGAGAGTCTGAACCAGCCAAGTCGCGTGCAGGAAGAATTGTCCTATGGATTGTAAACTGCTTTTGCAGGGGAATAAAGTGCATCACGTGTGATGTTTTGTATGTACTCTGCGAATAAGGATCGGCTAACTCCGTGCCAGCCGCGGC
>XM_029711062.1 PREDICTED: Salmo trutta sodium channel protein type 2 subunit alpha-like (LOC115160726), transcript variant X3, mRNA 
ACCCTGCATCTCTGCAGTCATTTGTACCCGGTAACAACCGGAAGCGCAACAGAATGCTCTGAACAAGGCGACTGTGGTGGCAGCAATTTCATAACGCTCTCCTGTGTGATTTTTTTGGGGGGGGTCCATCTCTGGGAAATACTACATTACAGAGAGGAGAACCTTTTGACTTAATCAAGTATCCACATGTGTCCTCGAATCACCTTTTTACTCGGGAGAAAGCAACATCAAGGCGTGCCTGGCGATTTTTGGCGGATTCTTCCCCTTCTTGGATGAAAAACTAATGCCCTTTCTAATGCAGGAGGCTAGCCGTTCACTCTGAAAGTGCAGGATGAAAAGATGGCACAGCTGCTTGTACCGCCAGGACCAGACAGCTTCCGCCCGTTTTGTCGTGAGTCCCTCGATGCCATCGAGAGGCGGATCGCTGACGAGAACGCCAAAAAGTCCAAGGCGAAGCCCAACAACAATGACGACGACGGGCCTAAGCCCAGCAGTGACCTGGAGGCGGGAAAATCACTGCCACTCATATATGGGGACATTCCCAAAGGATTGGTGTCCACACCACTGGAGGATTTGGACACCTTCTACAGCAACCAGAAAACCTTTATAGTGTTGAACCGAGGGAAGGCCATCTTCCGCTTCAACGCCACTCCTGCCTTGTATGTCTTAAACCCCTTCAACCCTCTTAGAAGAATATCAATTAAGGTTTTGGTACACTCATTGTTCAGCATGGTAATCATGTTGACTATCCTTACCAACTGTGCGTTTATGACCCTGAGTCAGCCCCCGGACTGGGCAAAGAATGTAGAGTACACATTCACTGGAATCTACACATTTGAATCTCTTATAAAAATTCTGGCAAGGGGCTTCTGTGTAGGGAAGTTTACCTTTCTCCGAGACCCATGGAACTGGTTGGATTTCTGTGTTATTGTCATGGCATATGTCACAGAGTTTGTGGACCTGGGCAATGTCTCAGCACTGAGAACTTTCAGGGTTCTCCGAGCTTTGAAAACTATATCGGTCATCCCAGGCCTCAAGACCATTGTGGGAGCGCTGATCCAGTCAGTGAAGAAACTATCAGATGTGATGATCCTCACTGTATTCTGCCTAAGTGTCTTTGCCCTGGTAGGGCTGCAGTTGTTCATGGGGAATTTAAGAAACAAATGTTTAAGGATCCCTCTTAACTCAACCGACCTCTTCGATGATTCATTCGACTTTAATGGGACGGACCTCAACAAGACCAAGTCGTTCAACTGGACCTATTACATGAACGATCCCAAAAATTATTACTACCTCCCAGGTAAAAAAGATGCTTTGCTTTGTGGAAATGGCAGTGGTGCTGGGCTGTGCCCAGAGGGATTCTGGTGCATCAAAGCGGGCCGGAACCCAGATTACGGCTACACCAGCTTTGACACGTTCAGCTGGGCCTTCCTGTCTCTGTTCAGACTGATGACTCAGGACTACTGGGAGAACCTCTACCAGCAGACCCTGAGGGCTGCTGGGAAGCCATACATGATCTTCTTTGTGTTGGTCATCTTCCTGGGCTCCTTCTACCTTATCAACCTAATCCTGGCTGTGGTTGCCATGGCCTACGACGAGCAGAACCAGGCCACCATTGAGGAGGCTCAGCAGAAGGAGGAGGAGTTTCAGAAGCTGAAGAAACAGCAGGAGGACGCACAGGCAGCGGCAGCGGTGACAGCGGCTGAGAGCGGGGAGTTCAGTGAGAGAGGGGAGCTCACTGACACCTCCTCAGAGGCCTCCAAACTCAGTTCCAAGAGCGCCAAAGAGAGACGCAACAGGCGCAAGAAGAAAAAGCAGAGAGAGGAGGAGGAGAGAGGGGACAATGACAAGTTTCACAGGTCTGAGTCTGAGGGCAGTGTGCAAAAGAGTCGTTTCCGCTTCTCCATAGATGCCTCCAACCTGCTCAACTACGACATGAGATGTTCCACACCACACCAGTCCTTCCTGAGTATCCGTGGACCCCTGTTCTCATCCAGACGAAACAGCCAGGCAAGCCTCTTCAGCTTCCGGGAACGAGCGCAAGATATGGGCTCGGAGAACGACTTTGCCGACGACGAGAACAGTACTTTCGAGGACAACGACAGTCGCCGGGGATCTCTGTTTGTTCCCCGGCGGAGCGACCGGCGCTCCAGCAACCTCAGCCAGAACAGCATGTCGTCACATGTCCTGTTGCCGGCCAATGGGAAGAAGCACAGCTCCGTGGACTGCAATGGGGTGGTGTCCCTGGTGGGCGGGGCTTCACTTCCCACATCACCTGAGGGACTCCTTCTGCCAGAGGGCAACACTACGGAGACAGAGTACAGAAAGGCCCAATGTGAATCGTACCAGGCCTCTATGAACTTCCTGGAGGACCCAGGGGCCAGGCAGAGGGCCTTCAGTGTAGCTAGTGTTATAACTAATACTATGGAAGAACTTGAAGAGTCGAGACAGGAGTGCCCTCCTTGCTGGTACAAGTTCTCCAACACTTTCCTCATCTGGGACTGTTGTCCGGCATGGCTGAGGATCAAGAAGACAGTCAAGATGATCGTGATGGACCCTTTTGTAGACCTGACTATTACCATATGTATTGTTCTGAACACAGTGTTCATGGCTATGGAGCACCACCCAATGTCTGGGGATTTCAAAAAAATGCTTTCTGTGGGAAACCTGGTGTTTACAGGTATCTTCACAGCTGAGATGTGTTTCAAGATTATTGCTTTGGATCCGTACTGTTATTTTAAGGAAGGCTGGAATATATTTGATGGTATCATTGTCAGTTTGAGCTTGATGGAGATTGGCTTGGCCAACGTGTCTGGAATGTCTGTCCTCAGATCATTCCGATTGCTGAGAGTATTCAAACTGGCCAAGTCTTGGCCCACACTGAACATGCTGATCAAGATCATTGGTAACTCAGTGGGGGCTCTGGGTAACCTCACCCTGGTCCTGGCCATCATTGTCTTCATCTTCGCGGTGGTGGGCATGCAGCTGTTTGGGAAGAACTACAGAGACTGTGTGTGTAAGATCTCTACAGACTGCACACTGCCCCGCTGGCACATGCATGACTTCTTCCACTCCTTCCTGATTGTGTTCCGGGTGCTGTGTGGGGAGTGGATCGAGACCATGTGGGACTGTATGGAGGTGGCTGGCCAGAGCATGTGTCTCATCGTCTTCATGATGGTCATGGTCATCGGGAACCTGGTGGTCCTGAATCTGTTCCTGGCCCTGCTGCTGAGCTCGTTCAGTGCTGATAACCTGGCGGCCACGGATGATGACAGCGAGATGAACAATCTGACGGTGGCCATAGGCCGCATCCACCAGGGCATCGCCTTTGTCAAGGCCTTGGTGTGCCGCTCCTTCCACAGCATCTGTCTGAGGAAAAAGAAGGGGAGCCTGGATGACCTCCACAGAACCAACTACAACTCCAACCACACCACTGTGGAGATCATGAAAGACCCTGAATACGTGAAGGATGACAATGGCACCACCGGTGGGGTAGGCATGGGAGTGGGTAGCAATGCAGCAGGGAAATACATAGTCAACGACAACACTGACTACATGCAGTTCATCCACAACCCCAGTCTGACCGTCACGGTGCCCATCGCTGTGGGGGAGTCGGACTTTGAAAATCTCAACACTGAGGACTTCAGCAGCGATTCCTCGGACATAGAGGGAAGCAAAGAGCAGCTAGCTAAAGACCGTCCACTGAGCTCATCAGAGGGCAGTACAGTGGACATCAGGGCCCCAGGAGAGAGAGAGGGCTCGGTGGACATGGAGCCTGAGGAGTCCATGGAAGCTGAAGGATGCTTCACTGATGGCTGTGTCCGTAGATTCCAATGCTGCCAAGTGAACGTTGAGGAGGGCAAGTGGAAGATGTGGTGGACATTGAGGAAGACCTGCTTCAGGATAGTGGAGCACAACTGGTTTGAGAGCTTTATCATCTTCATGATCCTGCTCAGCAGTGGAGCACTGGCATTTGAGGACATCTACATCGAACAGAGGAAGACCATTAAGACATTGTTGGAGTTTGCGGACAAAATCTTCACCTACATCTTCATCCTGGAGATGTTGCTGAAATGGGTGGCCTATGGATTCGCCAAATACTTCACCAACGCCTGGTGCTGGTTGGACTTTCTTATTGTTGACGTCTCTTTGGTCAGCCTTGTGGCCAACGCCCTGGGCTACGCTGAGCTGAGTGCCATCAAGTCCCTGAGGACGCTGCGAGCGCTGAGGCCCCTGAGAGCGCTGTCCCGCTTCGAGGGCATGAGGGTGGTCATAAACGCTCTGCTTGGAGCCATCCCCTCCATCTTCAATGTGCTGCTGGTCTGCCTCATCTTCTGGCTCATCTTCAGCATCATGGGTGTCAACCTGTTTGCAGGGAAATACTACCATTGTATCAACATGACCACGAGTGATCGCTTCGAAGTCAGAGACGTGGCTAACAAGACAGAATGTTTGGCTTTGACAGGTACCCACTGGAAGAATGTCAAGATCAACTTTGATAACGTGGGAGCAGGCTATCTGGCACTGTTACAAGTGGCTACATTCAAAGGCTGGATGGACATCATGTATGCAGCTGTGGACTCTCGCAATTTGGATGATCAACCCGACTACGAAGTGAATCTGTACATGTATCTGTACTTTGTGGTATTCATCATATTTGGATCCTTCTTCACACTCAATCTCTTCATTGGTGTCATTATAGACAACTTCAATCAGCAAAAGAAAAAGTTTGGAGGTCAAGACATCTTCATGACAGAGGAACAGAAGAAATACTACAATGCTATGAAGAAGCTTGGCTCAAAGAAACCCCAAAAGCCTATCCCTAGGCCAGTGAACAAGTTTCAAGGGTTTGTCTTTGATTTCATTACAAAGCAAGCCTTCGACATTGTCATCATGATTCTTATATGCCTTAATATGGTCACCATGATGGTGGAGACGGAAGACCAGACAGACGACATTCGTAAAATTCTCTACAAGATCAACCTGGTGTTTATTGTCATGTTCACCGGGGAGTGTATTCTGAAGATGATCTCACTCCGACAATACTATTTTACCATTGGTTGGAATGTATTTGACTTTATCGTTGTTATCCTGTCGATAATTGGTATGTTTCTCTCGGAACTGATAGAGAAGTACTTGGTTTCACCAACCTTATTCCGAGTCATTCGACTGGCCCGAATTGGTCGCATCCTTCGCCTCATCAAGAGTGCCAAGGGAATCCGTACACTCTTGTTTGCGTTGATGATGTCACTTCCTGCATTGTTCAACATTGGTCTTCTGCTCTTCTTAGTGATGTTTATCTATGCAATCTTTGGCATGTCAAACTTTGCATACGTCAAGAAGGAGTCTGGGATTGACGACATGTTCAACTTTGAGACGTTCGGCAACAGCATGATCTGCCTGTTCCAGATCACCACGTCTGGGGGCTGGGATCTCCTGCTGGCCCCCATCCTCAACAAGGGAGAGCCAGACTGCGACAGCCGGAAAGAGCACCCAGGAAGCACGTACAAGGGGGGAGACTGTGGAAACCCCCCTGTGGCCATTATCTTCTTTGTGAGCTACATAATCATCTGTTTCCTTGTTGTGGTCAACATGTACATTGCTGTCATTCTAGAGAACTTCAGTGTGGCCACTGAGGAGAGCGCTGAGCCCCTGAGCGAGGATGACTTTGAGATGTTCTATGAGGTCTGGGAGAAGTTTGATGCGCGAGCCACCCAGTTCATGGAGTATGACAAGCTGTCAGACTTTGCTGATGCCCTAGACCCCCCGCTACGCATCTCTAAGCCCAACAAGATCCAGTTGATCTCAATGGATTTACCCATGGTGAGTGGGGAGCGCATCCACTGCCTGGACATCCTGTTTGCCTTCACCAAACGTGTCCTTGGCGAGGGGGAAGGCTTGGACATCCTCAGGGGTCAAATGGAGGAGCGATTTATGGCCTCCAACCCCTCCAAGGTGTCCTACGAACCAATCACCACCACACTGCGCCGCAAGCTAGAGGACATGTCTGCCCTGGTCATCCAGAGAGCTTTCAGACGATATCTTCTCAAGCGTATTGTTAAGCGGGCCTCTGCCATGTACAAGGAGAAAATGCAAAGTGGAGGCACGCTCCTTGATAAAGAGCTTCTCGTCATAGACAAATTTAACGAGATCTCTACTTCAGACAGAACTGACATGACACCCTCCACAGCTTCTCCCCCATCATATGACAGTGTCACAAAACCTGAAAAAAACAAATATGAAAAAGACAAGAGAAAGAAGGAGGTGAAGGAGAAAAAAAAGTACATGGATGTTGGGAAGATTTAGCATAGAATTCATTCTGCTACAAATTGTTTACAGCCTTTGAAGGTGACCAATGCGTCAAGTGAAGTGTCTTTGGTGTGAATATCTATGCCAAACTGACAATGCTTACTTGAGTCTAAATGTAAGGTTGGTGCCTAACATGAGGCAGTGACTCACATTCTTAGGCTGTAAGAATTGTTTGGATGTTAATGGGGACTAAAACAAATGTTTGCCAGCTTTATAGGGACAGGTAAAACATTTTGTTGTGTGTTGTTACAATCAGAAACGTTTAGTTATACTGTAACTTCTCTTGCAGCTAGTACTTCCAGGGTTGCATCCAGTGTCTTGCATTATAACTGCCATATGATTTACTAACTTATTTTTCTTACAGAATCTTGTTTTTAAAACTCATAGGTTGATTGTGTGACTATTTTTGTAAACATATGTTTTACTGTAAAAAGAGGGGTTTCATGTATTGCTTTAAAGGTAGTCTTGTTCACTTTAAATGTTCATACAACTTGACTTGTCAAGTGTGATCAAACACACATCCTTGTGGGGTGCAGGGCCCAAAAAAAAGTTGGTATAAAAGAAATTGTGCCCGCACACTCATAAACCGTTTTTAAATGAAGGTACATGGTGGAGCTTATGCATGTGCGGGCTCTGTTTCGAGCATAAGACATGACTACTCATGACAACCATTATTGCTGCAGTGCAGTTAGGGGGATTGCTGCAGTTCAATCGACGTGTAGACTTGCATGAATGCTTACCCATGATTACAGTGTCGCATTACGCACCATCACCAAAATGAGCTTGATTTCTCCGTGATGTCTGAGGGACTCATACTTTGATGAATCTGTAACATTATGTTACTCTCACTATTACAAATCAACAGAAAAGATTTCTCCTGAGCATACAGTCCAAATACCATTACCAACAACTGTTGTCTATAATCAGTTTCCGAACAATAACACGCTCTAGAAAAACATAGTTTTCCTCCTTTCATTCATCAGAAACTACAGTACAATGCAGAATACATTCATCTTTAGTGCTGGTTGACAGAGTTGATACACATAGTATTCGTAGTCCAGCTCTTCTCTCCAGCTTGAACCTAAATGGCCTCAAAGACATGTCTATACTGTATTTTCTCTTCATAGTGGTGAATGATAAAATGAGGCAATTTCCTCTGCACAGTATAGTTGTGACCATCAGGTGTAAATCGCCTGAAATAATCTCCAAGCCTAGTCTGACAGGTGAAACACTGTATTCTGTGTCATATATGCTCACTTAAGAGGCATTCCGACAGCATGTATCTTGTGTACTCTGTGGTTTTGGTACTGCAACATCATTAGTAAGTGCTATAAAACTTGTCATTTACCAAATCTAAATTGCTTTGAGTTTACCTTTCCTACCCACTTCCCAAATATTTTTCCATTGTTGTTGATGTATCTGTATGTACATATTCTATAATATATGAAATATACAAATATATTTGATATATTATGTGATGTTTCATGTATAATGGAATATATGAAGTTGTTAATGTTATTTAATACATATATCTATTATATTCTGCATTCTCTGCTCTATATGGCAGACAGACCAGAGTATGAAGCATCCAGTTGAGGCTGTGGGAAGATTTTGTAGTTAGATTACACTCAATGTCTATATAAATATTGTAATATAATCATTTTTCTTTGTACTGTACAACTGTTTTGTAAATAGTTTGCTATACAATATAGCCACACTGTCTGCGCTATAGCCACTTTAGTTATTTTAAGTTTCACTGCACCCTTTCATTTGGAAATGCCTCATGTGATCTAGTGAAGGGGATGTGGACATCTCATTTTGATTCTTACATCTTTTATTTTGTGTCATTTGTAAACTGTTGTCACATTTTACCTCACATGCTTTATCATAATAAATATCTAAGATGGAACATCAGGTTCAGAGAATTCTGAATATGATTGTCTCAAGGCTAGTGTGACAGCACAAGTCTTCGATTGTTTCCTACATTTGTTTACATAGTAATCCAATTCCTCAGGATGTTACTTTTGTCAGCTGTTCCCTTTGTATAAAGTGTCACAAGTATCTGTAATTAAAATGTTATAAAGTATGTTATAAAGAGCATATGTTGCATGTAATAAAAACGTTCAGAATATGTATATACTATATATGTATACACAATGAATGTTTTGATTACATAACATTTAATAGATCACATCTTTATATGCATTATGCTTGTAGTGTATGAGTAAACTGCATGCAAGATATTGCTATAACCCATCTCATTGAAAAGCCAAAAGAATAAAGAATACATGTACCTCA
>XR_989699.2 PREDICTED: Macaca nemestrina uncharacterized LOC105485591 (LOC105485591), transcript variant X1, ncRNA 
TGGTTTGCTGCAGGTCCGCTCCAGACCTTATTCCACTGAATCTTTCCTGCTCTTGGAGATAACACCAGTGGAGTCTGCAGAACGGCAAAGGCGGCTTTCTGCTTCTTCCTCTGAAACCTTTGTGGCAAAGGAGCACTGACATGATGGCAGCCGGAACTCTCCTGTGAAATAGGAAGATGAAGGCTGGAGTTGCATAATGATCCTTCTATTATGAGCTTTGGTAACGTCATTTTCCAGAGGGATAGTCATAAATCTTATTAGTAAAACTCAATTGCACATTTTCATCAAAAATGAGGCAGTTCCTCTAATTCAAATGAACATACACGTTTAAATACAGTCGCTGCTCTTGAGAACGTGTGTCAGTGCGCTCAGTAATTCACCATTGGTGAAGACTGACCTCTACTAAAAAAAAAAAAAAAAGAAAAAGAAAAACTGAGCATCCAAATTCAGAGAGCCTATCAAGAAATTCAGAAAGCCTATCAACAAGAATAATGCACATACCATTCCAACACTGTGTGAAGTGAGAGGACATGAGACAAGGTCATTCTTAAGCAACAAATTCTGAAGACAGACCAAAGTGTTCTGCATATCAAGCAGGTTGTGAGGTCAACGTGCAGAAAATATCACAACATAAGTTAATGCCTGCGAATGACACCCTAAAAACAACTTTTAAAAGCAGTCCTGACAGCTAGAGCATCTGCAGAAATTACCTCCACATGAAACGTTGCTTGGTGCTGCAGAAGGGGCCTCCTGTTAAGGAATACATTTGACAGTGATATCAAGAAGTGCTAGGGCGATTTAGTGGCAAGATGGCCGAATAGGAACAGCTCCAGTTTCCA
>XR_003517074.1 PREDICTED: Zalophus californianus uncharacterized LOC113913036 (LOC113913036), transcript variant X2, ncRNA 
CCCCGACGTGCACACCCGAGGACCTAAGACACGGCTCCTACACCTGCCGCGTGCGACACCCCCGCACGGAAATCCCGCTCCTCGGCTGACCTGGTGACACAGGCCGTCACCCCTACCCCCACTTCCCCCCCTCCACCCCACTCTCTGCGTTGCTTCCGTGAGGTCAGCACTCACCTTCCCTGCAGGGATGAAAAGGGCAATTCGCGCCTCCCGCCAGCCAAGGAGTCTGCCCTTTCTTCCCCCACGCCGGGCGCTTAGAGAAGAGGAAGGACAGCAAGCTTGCTTTTGCTTTACCCTTACCTTATAAAGCACCGCTCTCGTGGTTCTGACTCAGAAGACCCCGGGGGCCCAATAAGCCAGGCCTGAGCAGCAAGCAAGCGAGGCCCGAGCAACAAGCGAGTGAACGACCAACTTGGAGTGGGAAGAGACCAGACTTAAAGCACTGAACAGGAATTCTGAAACCTAAGAAGTCAATGTTAAGGCTAGTTTCCCTAACTTACAAGGCTGGACAATACTCTTCACCATTTCATGTGGCCCAGATAGCTGGAACAGCTCCAGTCACCAGACCTCACACCAATGTCGCAAGCAAGAAGGAAAAGCAGAGACCAAGAAACTACTTGTAATTCTCAAATCGGTACCAGCAGCTGCCATGGGCCCGCTTCACTTTCACACAAAACAAAACAAACGAGAAAGCACGTATCTTTCCTTTGGCTTTGTGTAAGCTCCTTGACAAAAGATAATGACAAGATGGCCGAGAATTCGGCATCTGACCAGCACCGCATGT
>XM_028148513.1 PREDICTED: Eptesicus fuscus transcription factor 7 (TCF7), transcript variant X4, mRNA 
CAGCTTTTCCCGCGCCCCTCACGGCCCCTCTGGATTTCCCCGCAGGCTCTCGGGCGGGAACACACTTCGCAGAGACTTTTCCCCGACAAACTTCCAGAATCTCTGGAGGACGGCCTGAAGGCCCCGGAGTGCGCCAGCAGCATGTACAAAGACACCGTCTACTCCGCCTTCAATCTGCTCATGCACTACCCGCCCCCCTCGGGAGCAGGGCAGCACCCCCAGCCGCAGCCCCCACTGCACAACAAGGCCAGTCAGCCTGCCCATGGCGTCACCCAACTCTCTCCTCTCTATGAACATTTCAGCAGCCCACACCCCACACCTGCACCGGCCGAAATCAACCAGAAGCAAGTTCACAGGCCTCTGCAGACCTCTGACATCTCTGGCTTCTACTCTCTGACCTCAGGCAGCATGGGACAGCTCCCCCACACTGTGAGCTGGCCCAGCCCTCCTCTCTATCCCCTGTCCCCTTCCTGCGGATATAGACAGCACTTCCCTGCCCCCACTGCAGCCCCTGGCGCCCCCTATCCCAGGTTCACCCACCCATCCCTGATGCTAGGTTCCAGCGTACCTGGTCACCCAGCAGCCATTCCCCACCCGGCCATTGTGCCCCCCTCAGGGAAGCAGGAACTACAGCCTTATGATCGAAGCCTGAAGACGCAGGCAGAATCCAAGGCAGAGAAGGAGGCCAAGAAACCAACCATCAAGAAGCCACTCAATGCTTTCATGCTGTACATGAAGGAGATGAGAGCCAAGGTTATTGCAGAATGCACACTCAAGGAGAGTGCTGCCATCAACCAGATCCTGGGCCGCAGGTGGCACGCACTGTCACGGGAGGAACAGGCCAAGTATTACGAGCTGGCCCGCAAGGAGAGGCAGCTGCACATGCAGCTATACCCAGGCTGGTCAGCGCGGGACAATTACGGGAAGAAGAAGAGGCGGTCCAGAGAAAAGCACCAAGAATCCAACACAGGAGGAAAAAGAAATGCATTCGGTACTTACCCGGAGAAGGCCGCTGCCCCAGCCCCTTTCCTTCCGATGACAGTTCTCTAGGTTGCTCCGGGTCCCCAGTCCCCCAGGACTCACCCTCATACCTCCTGCTGCCTCACTTCCCTACTGCACTACTTGCTAGCCCTGCAGAACCGGCGCCTACATCACCAGGTCTCTCTGCGGCACTCAGCCTCCCAGC
>XM_032234808.1 PREDICTED: Thamnophis elegans microtubule affinity regulating kinase 3 (MARK3), transcript variant X2, mRNA 
AGGAAGCCGGGCGGCCATCTTGGATCATCCGGGAGCGGCGGCGTTGTTGCCGCCGCCGCTGCTGCTGCTAGTACTGTGGCTACTGGTTGAGAGAGCCGAGGGAGCTGGTTTGACGGCGGCAGCAGCAGCGCCAGAGGGGTTGTCTTCCTTCAGTGTTTCCAACCCAGGCTGTGACGGAAGCGTCTTTCTCCTTGGGTCTGAGCCTTCCCCCTTTGGGATAGGGGGTTGGTAGGCAGCGAAGGACTTGGGAGTTCTGGAGAAGAAGGAAGAGGAGGGGGCGCAATTAAGTCATGAGAGCCCGAGGCCCGGCGAAGCAATCCGTGTAGAGTTAGAAAACGGCTGAGGGCTTGGCCCGCTTCCCTTTGACCAGCTCTGGGGGGTTGGGGGGGTTGGTTGTTCTTTCGCAGCCGACAGTGGTTGCGCGGAAAGCGGCGGCTGCTTCCCCACTTTTCCTTCCTCAGCAGCCTGCTAGTTGGGCTGTACCGTAATTGCTGCAGCGCCTGCCCTCTCCCGGCTCCCCGCTTTTTTCTTTCGTCTTTTAACGGCACCGGACCATTTTTTGCCCCGTTTTTCTTTTGGTGCTCCATGAGAATCTCCTCTAATCTGTCCGTCCCCACCTTCTAAAGACCCTAATCTGTCTATAAGATGATTCCTGAAGATTCCCAGAGGAATCTAATGCTGCATTATCAGACTGGAAGATAGATGAGAAAAAGGGTGGTGGAGAAAATAATCACCCCAAATTTCTCTTCCCCCGTACTACCTTTTCCTTTGATGGTGGCACTTGATAACTGCTATCATGCTGTAAAATCACATTTTTTTGTAAATATATATATGTATATGTGCTCGGAGGGAGGGAGGTGTTAGGATTTTTTTATTTTTATATAATAAATAGTTGGATTTTGCCATTGCAAACGGTGCTTCAGCTAAGTGAATGAAAATGTCTACTAGAACTCCATTGCCCACGGTGAATGAACGGGACACTGAAAACCATATCTCTCACAGTGAAGGACGACAGGAAATTTCCTCCCGAACTGGTCGGTCTGGGGCTCGCTGTAGGAATTCTATAGCTTCCTGTGCAGATGAGCAGCCTCATATTGGGAATTACAGACTCCTTAAGACAATTGGAAAGGGAAATTTTGCAAAAGTGAAACTGGCCAGACATATCCTTACTGGCAGAGAGGTTGCAATAAAAATAATTGACAAAACTCAATTGAATCCAACTAGTCTACAAAAGCTGTTTAGGGAAGTAAGAATAATGAAGATTTTAAATCATCCTAACATAGTTAAATTATTTGAAGTAATTGAGACTGAAAAAACACTCTACTTAATCATGGAATATGCAAGTGGAGGGGAGGTATTTGATTATTTAGTTGCACATGGAAGAATGAAGGAAAAAGAAGCAAGAGCGAAATTTAGACAGATAGTATCTGCAGTGCAGTATTGTCACCAAAAGCATATTGTTCACAGAGATCTCAAGGCTGAAAATCTATTACTTGATGCAGACATGAACATTAAAATAGCCGATTTTGGTTTTAGTAACGAGTTTACAGTTGGTAATAAACTGGACACATTTTGTGGCAGCCCTCCCTATGCTGCTCCAGAACTCTTCCAAGGCAAGAAATATGATGGACCAGAAGTAGACGTTTGGAGCTTAGGTGTCATTCTTTATACCCTTGTGAGTGGATCTCTGCCTTTTGATGGGCAGAATCTAAAGGAACTCAGAGAGAGAGTGTTAAGAGGAAAATACAGGATTCCTTTCTACATGTCAACAGATTGTGAAAACCTGCTAAAACGTTTCCTGGTGCTAAACCCAACTAAAAGAGGCACTCTTGAGCAAATAATGAAGGACAGATGGATCAATGCAGGACATGAGGATGATGAACTTAAACCATTTGTGGAACCAGAATTAGACATCGCAGACCAAAAGAGAATAGATATTATGATTGGAATGGGATATTCTCAAGAAGAAATTCAGGAATCTCTCAGTAAAATGAAATATGATGAAATCACTGCTACATACTTACTACTCGGGAGGAAATCATCAGAGTTGGATGCTAGTGACTCAAGCTCTAGCAGCAACCTTTCTCTTGCTAAAGTCAGGCCAAGTAGTGATCTCAATAATAGCACTGGACAGTCTCCACATCACAAAGTTCAAAGAAGTATATCTTCTAGCCAGAAGCAGCGAAGGTACAGCGACCATGCTGGTCCATCTATTCCTCCAGTAGCAGCATATCCTAAAAGGAGCCAGACGAGTACTACTGACAATGACCTCAAGGAAGAAGGGATTCCATCAAGGAAATCCAACAGCAATGCAGCTGGAGGAAAAGGAATTGCTCCTGCTAGTCCTATGCTTGGGAATGCAAACAATCCAAATAAAGCTGACATACCTGAGCGTAAAAGAAGTTCTGTTACACCCAATAGCAACACTACACCTGGAGCAGCCATGACACGGCGAAACACTTATGTTTGTAGTGAACGAACTGCTGCAGACAGACACTCGGTAATTCAAAATGGCAAGGAAAGCAGTACCATTCCTGACCAGAGAACACCAGTTGCTTCAACTCACAGTATCAGCAGTGCAACAACACCCGATCGTATCCGATTCCCAAGAGGAACTGCCAGTCGTAGTACTTTCCATGGTCAGCTTAGAGAAAGGCGCACTGCCACCTATAATGGACCTCCTGCGTCACCTAGTTTATCCCATGAGGCAACACCACTTTCACAGACACGAAGTAGGGGCTCCACTAATTTGTTCAGTAAATTGACTTCAAAGCTGACTAGAAGAAACATGTCATTCAGGTTTATCAAAAGTCGTAACGTAGCCGTTGATCAGAAGGATGACAGCAAGGAAGCCAAACCCCGTTCACTACGATTTACTTGGAGCATGAAAACTACCAGTTCAATGGATCCTAATGATATGATGAGGGAAATTCGCAAGGTCCTGGATGCCAATAATTGTGACTATGAACAGAGGGAACGTTTCTTGCTTTTCTGTGTCCATGGGGATGGCCATGCAGAAAACCTCGTGCAATGGGAGATGGAAGTGTGTAAGCTTCCCAGACTGTCTCTGAACGGAGTTCGCTTTAAACGGATATCGGGAACATCCATAGCTTTTAAAAACATTGCTTCCAAAATTGCCAATGAATTAAAGCTGTAATGAGAAGAGCAATCGAGTTTGTAAATTAAGTAGCAAATTCAAGTGTTTTTGTTTTGTTTTTGAGGACACCAATGGTCATGTATAGAATACTTAGGGCAATAACTTCTGCATCTTCTGGATCGTGATATTAAAACAAAACAGTTCAGACAAGCTGCTGAGCTGGGAGGGAAGTTGGACTTTTTTTTATAAGTGCACTACAGCATTAAAGTTGCCTATGTAAAATATTCCCTTCTGCTTTATTTCCATTGCTTTGAGTCTTGACAAACAATCTAAAACACACCATGTATACATTTGGATATTCCTCCTGTTGTGTGGATGTGTGAATGTACAGTATGTGTGTATAATTATAATATAAAAGTATTATATGTAAACAATTCATTTATAGCATCAGAACTGTACCAGTACCTCTTCCGGGTTAATTTTGGTGCTAAAATGGAAATGGCCAAGGTGAAAGCCCTTAAGAATACTAAATAATCGGTAAACACAAGCTTCACAGTTCACTGTTGTGTTTAAGATTATGGAGGTTTGGGTTTATGGGTGTGAACATTATTCCTGTATTTTTTAAAATTAATTTTCATAACATGATTTAAATCCCCCCAAATAATTCTTTCTTTTCTTTTGCCTATTTATTATTATTTAAGTCTGAAATCAATTTAAATTACTTAATTATGATAATGAAAATTGTGGGGGAAATGCTTCAAGGTTACATGTTTTTTTCCTTTGCTAAGCTGATTGAGCATTTTATCCTCACCTTTTTTTGCTAGTACATATTATAATTTTAAAAATTTTACTTGAAAAGTTTGTTCTCAACTCCCATTCATTTCAGTGGAGCTGGTGCAGAGAAAACTTGTTACTAATGAAATACTGTAGAAACAGCCTGAACAATTGATATAAATTTTACATTTAGGCTACCTTATAATAATGTATTTTGAAGTTTAAAAAAACCATATTCAGACATTTCTAGTGTGAAAGAAATTCCTATGGCAAAATAATTGTGCCAGATCAGCAAAAAATGATCAGGAGAGAGAACTTTTGAATTCTAGTAATTTAATATTCTTGTACGTACTATACAATGACTGATAATGTTAATCATAATCAAAACACTATCAGCAAAGTTTATAAAAGTGAGAAAGTATGACCTGTCCAGCCAGGATTTGTGTTTTATTTGGTCTTTCCCAATTGTTTGCTGCCCAGATTTTAAAATTGGTTATGCAGGCTGGGAATTATGGGAATGGTAAAAATAAATATATTAAGGGAGATTAGAGGATTGAGAAAAGCTATTCTAAGTCTATGTCATGTGTTTCAATTTTGTCAGAGGCTTAAACTTCTTAAAAGCCTTGTTGCTGGCCAAGTCTTCCTTCATCATCAATTGCATCTCTCTAGCAAATTCTGCCCTTAGAGACAAAAAGCTATTGAAAACAGGGTGGGTAGGTAGGTGGAGAGGATTGCCTGCCAGTGACATGATAGCTCATAATTTCCATTTGGAAATGCTTCTGTAAATCTGAACAGGTTTATATGCTTTCTTGCACAGCTTCATATTTAAAAATATTTTAGTCACAATGCACTGGAGTTTAGAAGGGGGTTGTAAATGACTTAAATCTTTGTTTTTATGCTGGGTAAACAAATCCAATCCCTGGACCTTTATCTAAACTTCTATTTTCTAAGCTTGTGACAAAGCTTCAGACATTCAACATAATTATGATGACTAAAACACTTTTTAAGAAGGCTTGCTGGTCCTGCATTGCAGGTGATACGAAGCAATTTTAGGGTGTACTCTACATGAATTGGCTGTAACTATCTGCCTTTTTCAAACTGCTATCTCCTCTGCTGGTCCTTACTAAATTGGGTATGATTTGTCTAAATCAAGTCATAGGATGATATAATCTTTTCTGCTGCCTTAATCAATGCCTTTTGATTCAAACTTGTTAGGAGCTTAAAGTATCATGTATTAGATATATGGTCTGGCAGAAAAAACCTTCATTTAAAATGTAGTGAATTGAATTATAATATTTCATTTGGAGGCACCCAACTAAAATTCAATCCAGAGTGGTAATACAGAATACTGAATGTTCTAGACATTTTTCATTTATGTGTAATTCTCCCTTGAAACTTTGTAAAGATGTTATATTAATCCTGCATTGCGGTACTATAGCACAAAGTGACTGACTTCTGGTTTGTTTTTGATTTTTCTTAATGAAAAGAACAGTATTCTGTATAGAGATTTAATTATAACAATTGTTCAACAGTGGCTGTAGCAAGTACTGATTCTCCATTTT
>XM_019789640.1 PREDICTED: Branchiostoma belcheri mucin-5AC-like (LOC109485937), mRNA 
AGGTGTGTACATGTGAAGTCTATTGATCCCCAACCGCCGTCCTGTGAGACACTTGCCTTCACCATGGAGCCGGGGAAACACATCTGCGCCGCGGTAGTCCTGTTGGGGTACGTTATTTCAATAATATCGACTTCAACAAGCCCGATATATCATGTAAGCTACCAACGTCTTGCCGATGCAACACAAGTGCCACCAACGTCTCAGCAGGAACATACCATTTCGACTGACAAAGAAGCCCCCACAGACAATGTGCAGACCACGGTAGAACAGGATACAGCAACTTCATCCGGTGGGAATGGAGTGACAGCCTTGGGAACAGCAATATCTACAATAACAAGGTTGGTAACAACGTCATTAGTTGACTCTAGTACTGAGTCTGACACTGTTCAGAACACAAACACGACAGCAACAGACGCGTTTACAATTGTGGATGCCCAAAGTACTGCAAACAGTGCCACGGGCGTTGTAACGGCAGCTGTTACAACTGAAAAGTCTTTCGTTACTACCGATACTGTTACAACAACTGATACAGTAACCCCGGTCATTACTACTGATGTTGGCATAAATGACGCAACTGGGTCCACCACCACTGACACCTTCATCACTCCAGTTACAACTGATCCTGTCATTACAACGAAAGCTGGTACAGCATCTGTAAAAACCGAGTCTGGCCTTTCCACACATGCTATCACGCCGTCTATCACAACGGAACCTGTTCAAACAACATATGTTTCTACACCTGCAACAACAGAGAATGTCATTACCGACAATGGCATAACAACACCCGTTACCACAGATTCTGCCCTTACCACTGATGCAATTGCAACATCTAGTAGAACAGAAGATGTCATTACAACTGATGCTGGTACAACGTACGTCAATACACAACCTGCGATAACCACGTATGTTGTAGCAACAGCAGCCACTTCACAGCCAACCGTCATCACTAATGCAGCCACAGCACCTGTTACACCACAACCTGGCCTTATAATAATTACCACTAACGCGGTTACAGCATCAGTTATAACACAGTATGACCTTCCCAGTGGCGCGGTTACAACGCCGGTTACAACACATCCTGGCATTACCACTGGTGCTAACACAATATCGATTACAACAGATCCTATTTCTACCACCAACGCGAATACAACATCACTTACACCACAGCCTACCCCCACCACCATCGCTGATACAACATCTGTCACAACAGATCCTATTTCTACCACGAACGCCGTTACAACATCAGTAACAATAGAACCTATCTCTATCACTAACGTCGATACAACATCTGTTACAGCAGAAACTATTTCTACCACCAACGCTGATACAACACCAGTCACAACAAATCCTATTTCCACCACCAACGCTGTTACATCAGTTACAACAGAACCTATTCCCACTACCAACGCTGAAACAACATCAGTCACAACACAACTCATTCCCACGACGAACGCCGAAACAACATCAGTTAAAACAGATCCTATTCTCACCACCAACGCCAATACAACGGTATTTACAACACAACCTATCCCAACCACCATTGGCTTTACAACATCAGATGTCACATATCCTATTTCTACTACCAACGCTGTCACATCAGTGACACACTGCCTACCCCCACCATCAACTCTGATACAACATCGGTCACAGCAGATTCAATCTCTACCACCAACACTGGTACAACATCAGTCACAACAGATCCCATTTCTACAACCAACGCTGTTACATCAGTCACAACACAGCCTACCCCCGCCACCAACGCTGTAACAACATCTGTCACAA
>XM_034695841.1 PREDICTED: Notolabrus celidotus SPO11 initiator of meiotic double stranded breaks (spo11), transcript variant X5, mRNA 
GAAGTAAACAACGGCCAAGCTGATAGCGAACCTGCTTCTTTTGCATCACTTAAGAAGTAGTTTGTATGGAATTCAACAACATTCACAGCACCTAAAAACTGAGATCCCTGTCAAACGCGAAGAAAAAAGGAAAGCGGATACGAGCGCTGTGCATTATGGGAAACAGTACGCGAGGTAGACTGGTCCTATGAAAACTTCCCAGATCAGTACGACATCGAGCTGTATTCTGAAATTGACAAGCTCCGTGCTCAGCTGCTGCACAATGTCGAATTAATGTCGGACCGCCAGTGGATGATAGAAGAAATCAGCGACAGAGAAATTCTGACCCGCATCGAAAATGTAATCCTTGGAATAGTGACAAGTCTGTCCAAAGATGAGGCCCCTGTCCTGGCACTGCCCAACAGATCCAGCTGGGCCAACATCAGTTTTGACAGTGCTGTTGGGCTTCAAATGAGTTCAGGAAGTTCTGTCACAACCATAAGGAGCGACTGTAGCTCATCCATCACGAAATTTGCTCAAATTCTCAAGATCCTGGCGGCCATCTACAGACTGGTGCAGAGCAACTCTTATTCTACCAAGAGAGACATCTACTACAACAACCCACAGCTGTTTGTTTCACAAAGGACTGTTGATAGTATAGTAGATGACATCTCCTGTATGCTAAAGGTTCCTCGCAGATCTCTACATGTGTTGGCCTCGTCCAAAGGATTGATCTCAGGTGATCTGTCTTATCTTGAAGAGGACGGCACAAGAGTTGACTGCCGCTCAAGCTCTGCTGCTGTTGCTGTATCGTCAAACATTGGTGGGATTAAGAATATTGTATCATCTGCAAAGTTTGTCATGATAGTGGAGAAGGATGCGACGTTTCAGCGACTGCTCGACAACGACTTCTGCACAAAGCTCGCTCCCTGCATCATCATCACAGGAAAAGGCATGCCAGATGTGAACAGCAGGTTGATGGTGAGAAAGCTTTGGGACACGCTACACATCCCCATCTTCGCTCTGGTGGACGCCGACCCTCACGGGATGGAGATCATGTGTGTCTACAAGTATGGATCAGTGGCCATGTCGTTTGAGGCCCACAGCCTGACCGTCCCCAGCGTTATGTGGCTGGGCCTCCTCCCCTCTGACCTCCAGAGGTTGCGGGTTCCTGAGGATGCCCTGATCCCTCTTACAAAGAGAGACCAAAGCAAACTCAACAGCCTCCTGGAGAGACCGTACTTAAGCAGCCAGTCAGACTGGCAGAAAGAGATGGAGCTGATGCAGCAGAGTAAAGTCAAGGCTGAAATACAGTCCCTGGATGCTATTGCACCTGATTTCCTGACCAGCATCTACCTGCCCAATAAGCTGCGTTATGGTGGCTGGGTATGAGTGCAATGCTGCCACCTAGTGGGGATCTAAGACTACTGAGATCCCTCACCCTTTTATTAAAACCCTGTGAATATGGTGAAAACTCGCACCATGTTTTTTGTGTTTATGTTCCCAAGATGTTTGGACATGCTGTTGAAGTCTCATCAAACACACTATGTTAGTTTAAGTAAAGTCCAGCCTGTTTTACAACCACTCAACACCCCTAAGTATGCTCATTAAAAGACTTCAAGTCAACAGA
>XR_007695918.1 PREDICTED: Diabrotica virgifera virgifera uncharacterized LOC126878978 (LOC126878978), ncRNA 
TCGGAAAGGAGGTGTTCTCTTCACCAGTTGGTGGTTTTAAAGGCCGTAGCATACCTAGAAGGGCGGTGAATGTGGTTGGACCAAACCCTTTTTCAATTATTTGGACCAAAAGAGACCAATTATAGAAAAAACTCGAGATAATCTGAATTGCGGCATTATTTTGAGTTAGTGTTTTCTATTACGTTTCGCCATGGTTTGACCATGTGATCGTGGTACCTTTTTGTAACATCGGCTATTTATTTTAGGGTTTTTATTTTGGGGGAAAACAGATTTCCTGTATACTTTTATCTTTGATGGGAGATGTTTGCATTTTGATTAAACATATTGCATATTTTGCTGTAGTACTGTACTGGAGTTTTGGTGAATGGTAGTTTCCTGGATTCGCTTGCACGTGGTTTCATTGAGGTTCTGGGGGAACCATGCGGCGTAGCTGAACCTTTTCAGTGGAACGGGTGGATTGGTAACCTATTCAGTTATTTCTATAGGATTTATAGGAGTCCCGTGGGGACGTGATGACCTTAGTTGGGGACAATTGGAGAAGTGTAAATAACTATTTTTATTTATATTGTTTATTGACCTGGGAGGTGCTGCTTGTAAAGAGAAATGGCGAAATTTGCGTGTTGTGTTTATGAGACACTTGAAACCTTTGCCAAGTGGTTCTAAAAAAAAAGACCGTACTATTTACTTGATTATATCCAATTTTTGTCGCCATATGTAAAACCAATTAATCTGCCCGAAGTAGGGGACCTCCCGTCCACTTCAACAGAGGATACCGAAATACATGCTACCATTGATGTGTCAAACGATGTTCCAGAAGATTTGGCTACAGAGTCCGAGCAATCTAAAAAGCCTACCTCTCCCAGTATACATAATAGTACAATAATTCAACATTCTTCCAACTCAAAGCAAATGAAGTTTTCATTTCACGAGACAGATAAGTTTTTCCTCAATTATTTAAAAGAAAAAGCTACTAAATCTTCTACGGAGACTTCCACGGACTCTGTTATGTCATTTTTAAACACTCTTGCACCCGAATTAAGAGAAATGAATATGCACTAGGTCAAAATATTCAAAAGACGTGCACTAAGCCTAGTTGATGATATATTGAATCCATCTTCTACTGCGCCTGAAAGTCAAACAATGAGTGCATTAACTAAATTAAGTAGTGAAACGTCCCGGGACACAATATATTCTCCGCAGCCGTATGGTAGTCCTTCATTTGTGCAGCCACTGCAGTAAGTACCAACAACTAATCCTCTGGACTTCAGCGGGGTACGAACACAAAACTTTATGCAGGCAGTATCAACAACTAATCCTTTGGACTTAAGCGGAGTATCGACAGAAATCTCATTAAATTGTACAGAATACCCTTCTGTCAGCCAGAACATGTCGTTATAACTCATTTTATGTTTAAATATAAGTAATAATAATTAGATACCTACTGATAAAAATTAGATTTCGTCATTTCAATATTATTTTAATCATTGATTTAAATAAATATTTTAAAATACTTA
>AB291824.1 Bradyrhizobium sp. Pd-E-(r)-e-D-6(2) gene for 16S rRNA, partial sequence 
TTTATCGCCGAAAAGATCGGCCCCGCGTTCTGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCCTAGGGTTGTAAAGCTCTTTTGTGCGGGAAGATAATGACGGTACCGCAAGAATAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGGGTGCGTAGGCGGGTCTTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGAAGATCTTGAGTTCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGATACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATGCCAGCCGTTGG
>XM_037164408.2 PREDICTED: Artibeus jamaicensis staufen double-stranded RNA binding protein 1 (LOC119063191), transcript variant X6, mRNA 
GTTTCTTCCTTCTTTCCTTCTTCCTTCCTTCCTTCTCGCCGCCGCCGCCCAGGACCGCCGGTCAGGAGACGAGCTCCGGGCAGCAGCCAGGAGTTTTCTAACCACATAACCACTCAGATCTGAACCAAAACAACATTGTTCCCGGAGCACCTCTTTTTAAGGTAGAACTTTAGACTTCATAGCACTGAATTAACCTGCACTGAAAGCTGTTTACCTGCAGTTATTCACTTTTGTTGAAAGTGACCATGTCTCAAGTTCAAGTGCAAGTTCAGAACCCATCTGCTGCTCTCTCAGGGAGCCAAATACTGAACAAGAACCAGTCTCTTCTCTCACAGCCTTTGATGAGTATTCCTTCTACTACTAGCTCTCTACCCTCTGAAAATGCAGGTAGACCTATTCAAAACTCTGCTTTACCCTCTGCATCTATTACATCCACCAGTGCAGCTGCAGTTCCTTCTAGCATGGCACACCCCAAAGAGAAAACCCCAATGTGTCTTGTGAATGAGTTAGCCCGTTTCAACAAGATTCAGCCTGAGTATAAGCTTTTGCGTGAGCAAGGTCCGGCTCACTGTAAGGTGTTTACAGTACAGCTAACACTTGGAGATCAGCACTGGGAAGCTGAAGGAAGTAGTATTAAAAAAGCCCAACACACAGCTGCTGCCAAAGCTTTGGAAGGAACAAAATTTCCTAGACCCATAGTCCGCCCTTTTCGTAGCGAAGGAAGGAATCCAGAAAGCATAACCCCTACTGTAGAGCTAAATGCACTGTGCATGAAACTTGGAAAAAAACCAATGTACAAACCCGTTGACCCTTACTCTCGGATGCAGTCCACCTATAACTACAATATGAGAGGAGGTGCTTATCCCCCAAGGTACTTTTACCCATTTCCAGTACCACCCTTACTTTATCAAGTTGAACTTTCTGTGGGAGGACAGCAATTTAACGGGAAAGGAAAAACGAGACAGGCTGCGAAACACGATGCTGCTGCGAAAGCTTTGAGGATCCTGCAGAACGAGCCCCCGCCCGAGAGGCTGGAGGTGAACGGAAGAGAATCAGAAGAAGAAAATCTCAATAAATCTGAAATAAGTCAAGTGTTCGAGATTGCACTTAGACGGAACTTGCCTGTGAATTTTGAGGTCGCCCGGGAAAGTGGCCCACCTCACATGAAGAGCTTTGTGACCAAGGTGTCGGTTGGGGAGTTTGTGGGGGAAGGTGAAGGGAAGAGCAAGAAGATTTCAAAGAAAAATGCTGCTATAGCTGTTCTTGAGGAGCTGAAGAAGTTACCACCCCTGCCTGCAGTCGAGCGGGTGAAGCCCCGAATCAAAAAGAAAACAAAGCCCATAGTCAGGGTACAGAGTGGCCCAGAGCATGGCCAGGCGATGAACCCCATCAGCAGACTCGCCCAGATCCAGCAGGCGAAGAAGGACAAGGAGCCGGAGTACATGCTCCTCACAGAGCGAGGCCTCCCACGTCGCAGAGAGTTTGTGATGCAGGTGAAAGTGGGAAAGCACACTGCAGAGGGAACGGGCACCAACAAGAAGGTAGCCAAGCGCAATGCGGCCGAGAACATGCTGGAGATTCTTGGTTTCAAAGTCCCACAAGCTCAGCCCACCAAACCAGCCCTCAAGTCAGAGGATAAGACACCCATAAAGAAACCAGGGGATGGAAGAAAAGTAACCTTTTTTGAACCTGGCTCTGGGGATGAAAATGGGACTAGCAATAAGGAGGATGAATTTAGGATGCCTTATCTTAGTCATCAGCAACTGCCTGCTGGAATTCTTCCCATGGTGCCCGAGGTTGCCCAAGCCGTAGGAGTCAGTCAAGGACATCACACCAAAGATTTTACCAGGGCAGCTCCGAATCCCGCGAAGGCCACGGTAACTGCCATGATAGCCCGTGAATTGTTGTATGGGGGCACGTCGCCCACAGCCGAGACCATTTTAAAGAATAACATCTCTTCAGGCCACGCACCCCATGGACCTCTCACGAGACCCTCTGAGCAGTTGGACTATCTTTCCAGAGTCCAGGGATTCCAGGTCGAATACAAAGACTTCCCCAAAAACAACAAGAACGAATTTGTATCTCTTATCAATTGCTCCTCTCAGCCACCTCTGATCAGCCACGGTATTGGAAAGGATTTGGAGTCCTGCCATGACATGGCTGCACTGAACATTTTAAAGTTGCTGTCTGAGCTGGACCAACAAAGCACAGAGATGCCAAGACCAGGAAATGGACCAATGTCTGTGTGTGGGAGGTGCTGAACCTCTTCTGGTCATGAACCGTTATATAAACTTCCCAACAGATACTGAAAATCCTGAGACTGCTTTTGAAAATTTGGAATTTCTGATACCTCGAGTGGGCCGAGAGACGCGATGGGTAAAGAACTGGAGACAGCAGTGGTGACAGAGGCTGAGGCTGCTCGCATGTGCTGTGGTTTGTCCCCACACGGCAGCAGCTGCTGTGGGGGAGGTTGGGACCTGCCAAGCAGCCCTTAATTGCAAAACCAGCAGGTCCCTGCCCCTGGCACTTCAGTGCTTGGGTTTTTTTTTTTTTTTTTTTTTTT
>XM_035643150.2 PREDICTED: Scophthalmus maximus uncharacterized LOC118315681 (LOC118315681), transcript variant X2, mRNA 
GCTCCGGGTCCACGTTCAGTTCATCTGGTTTCCTTGTTGCACCCAGCCAGAGGACAGGACTTTAGAAACCTCACACTTTACTTTCAAAGAAGACAATTTGTTGCCTCTGCAGAACTAGAGCCGACTTAAAACATGGTTGATAGAAGGATTGCACTGGAGGCGTTGGGTGTGCTCTGCAATGCCAATGTGACGTCTGTTCAGCAACAGAGATCACAACCTGGTGTGTGCATCCTTCAAGGACGACAGGAGCAGCTGTTCATCAAGCAGCTCATCCCCTCTGTCTTGGATGCAGATGAAACCTGCCAGGTGTCCAGATCCAGCTTCTACCGCATCCAAGCCATCTTGGAGAGCAGTGAACCGGCAGATGGCTTCCCCAGGCTGGCCGTGGTGGCTGTTCCAAAGAAGGACCACATCATCGATGAGGAAGAATTCTTTGCGCCGCAGTTTGACTATGATTTCACCAAGCTGACCGACAGCGAGACTTATTGGAGGGGCGGAGAGAAGTACGAGCGCCCGTGTGGTTGGTACCGCTTTGGCCTCAAGGTCCTGGACAAGTACTGTGGAAACACCTGGCTGGGAACCACATACCGGAGCACCCAGTCCTGTCCAGGGGAGTGGCCCGTGTCCTACCACGGGACATCAAAGAAAGGTGCTGAGGGCATCATCGGAGACCACTACAAGCCAGGCTGTTTTAAAGGAATTTGGTATCAACGTCTCTGCCACACCAAGGGGACACAGAAGGCTGAACAGTATATCACAACTGTGCCCGTATCATTTTCTATTTCGCAAAACTGGGCTTGTATTTGCAATGCAGAGTTGGAGAAAAGAGTCCCAGGAGAGGTTTGGCTGCCGTGATTATTTGAAATCAGATTTTGAGACGACTTCTAGTAAAGAATGTGTGTCTGGGCCGACCGATGAAGTTTTTCCACTTTCATTGGAACTCACTAGCCACAACAGGGAGTCGTGACCTTGAGGTTATATAGAATAAATAAGTGAAACTGCCTAA
>XM_038305068.1 Cyprinodon tularosa uncharacterized protein LOC119796484 transcript variant X1 (LOC119796484), mRNA 
TTCAATCCTCCAGCTGCACTTGATCAAGCAGTTTGACTAGAAGAGAATCAAGCAGAGCTCTGACAGCACAGAGACCATCATGAGACAGAAACCTCTAGAGATGGAGTTTAAAGACTCCCATGTTCCAGTTCTCAGTGTGTCTCACTGCTCCTCTCTTTCCCTCTCTGTCTCCTCAGCAGCAACATTTGTAGTGAATGTGACACAGAGCTCCTATCAGGCAGAGGAGAACCACAACATCACTCTGGAGTGGACCTTCACCACAAGACCCAACAGAACCTGGATCATCTACTGTTGCGTGTTGACTCTTCCCAGAGAAATAGTCCTCTATTCAGTCTATGAAGATGTTGAAGAGACAGAGTTTACAGATGAACACTTTAAAGGACGAGTCCAGATGGACAAAGACGTCCTCAGAGAAGGACGGATCAGATTCCATCTGTCCAGACTGAGGACTGAAGACTCTGGACTGTATGTGTGTAACATCAGGACTGACTATGGGGAAGGTTCTGCAGACTGCAACGTTACAATCACTGAGACGGTTCCTGAGAGAAACCTCATCACTCCGACTCTACAGGATAAAACCATCAGTAACGGAGGTCGGTCCAGGCTCTTCCTTTTATTTCCTTTTATTTTCTTCATCATTTCTCCGTGTTTGGTTTTACTCTTCATTTCTAAAAATAAGAACTCTAGGAAGAGTCCTTCTAGGTCAACCATCTACATTACAGAATGGAAACCTTGCATAAGGGCAAACTTGTGTTAATGTAGCTGAGATCAGAGCAAAGTCTTCTCTCCTTCATCTTTCTGAGGTCTCCAACTGTTCAATAAATTGCAGGAGACCCTGGAGATAGAAGGAGTCTTAATGATACCTTAGAAGCTGTTGATGAAACCAGGAGTCTTTTCAATGTTTAAAGTCAGTCTCTGCAGGAACCCAACAAACTTCACATCAAAACACAATCAGATGCTGTGGATTTATCTCCAGGAAGAGGAAAATCAGACATTTCGGAAATTGTGCATTGTTTTCTCACAGCAGTGATTTTTTTTTTCTCCCTCAATGCATTTTATCAAAGTACAGATAAAAAAAATGCTAACCCTCGGTTGGGGGGAATCTTCAAATTTCATGTATATATGTTATTTATTATTATTATTTTTTTATTATTGTTTTTTACTCTGTTGTAATTAAAGAAAGGCTACATATGTAAAGTGTTTCATAAATATTGATTTTTGTAATTATTCATTATTAAATAATAGTTATCATTATTACCTCCAACTACATGGCTAAGAACCTCATCTTTTCCTTTTCTACAACTCTCAACTGCCTGTAGGACACATT
>HQ018492.1 Uncultured Candidatus Microthrix sp. clone R4CP1R1E11 16S ribosomal RNA gene, partial sequence 
TCGCGTAACACGTAGGCAACCTGCCTCGAAGTGGGGGACAACAGCCCGAAAGGGTTGCTAATACCGCATGTGGATGTTTGGTGGCATCACCGATCATCTAAAGCCTTGTGCGCTTCGAGATGGGCTTGCGGCCTATCAGGTAGTTGGTGGGGTAATGGCCTACCAAGCCGACGACGGGTAGCTGGTCTGAGAGGACGATCAGCCGGATTGGGACTGAGATACGGCCCAGACTCCTACGGGGGGCAGCAATTAGGAATCTTGCGCAATGGGGGAAACCCTGACGCAGCGACAGCCGCGTGCGGGATGACG
>XM_013285616.1 PREDICTED: Papilio polytes antichymotrypsin-2-like (LOC106105325), mRNA 
ATGTTTAAATCAGCTAAACCAAGGTACGATACTGCCGTTGAATCATTATGGCAAGGAAATACGGAGTTCACACTAAACTTTTTAAATTTAAAACTAAATGAAAGTCCTTATAACAGTTTTATAGTATCTCCGTTTTCTGTTCTAATACCCCTGGCAGAACTTGCACTGTACGCCAATGGAACAACACACGATCAACTAACAAATATCCTTCATGTCGACAATAGAATAGAGGTTGGGGGTGGTTTCCGTGAAATTTTGAAGTCTTTTTCATCTTCTGATGATGTACAGATTTCATTAGCTCAAAGAATCTACTCCAATGTAAATACAGAATTATCTGAAGACTTTAAAAATGACACTAAGGATTATTTTAATGCCGAAGCTCAAAATGTAGACTTTGAAAAGAATCAAGAAGTAGCGAAAATGATCAACGAGTGGGTGCAAGAACAAACCCATGGTCTCATTTCACGAATTGTTGAACCCAATATGTTGGACCAATCAACAAATATGGTTTTAGTTAATGCCATTTATTTCAAGGGTGATTGGGACTATGCTTTCAATCCAAATGACACAAAACATAAAGACTTTTACTTATCGATAGGCGAGCAGGTTGAAGTAAAAATGATGTATCAAAAGAATACGTTTAAATACATGGAAAATCCAGCTCTTCAAATAAAGGCATTGCAACTACCATACACGAAGCAGCATTATAGCCTTTTAGTTATACTACCCACGTCACGAGTTGATTATGGTTTGCAAAAAGTGGCTAAGAGGATTAGAAATCCCCAAGTGTTTACAGAAATTATCGATGATTTGAGAAACGCAGAAGTTGAAGTATCATTACCGTCTATAGAAACTTCCAGTACAACAGATTTACAGGGAATCCTAAAAGGCGTAAATGTCACTGAAATGTTCGTGTCTGGCAATTCGGATCTTAATGGGTTACTGAAAAATAATCAATCAATACATATCTCTGTTGCTGTTCAAAAAGCCGTTGTGGTTATCAATGAGTTGGGTACAAAAGCAGCTGCATCAAATAATATAGAATTTTTACCATCGGCGCCACTGGTCAAACCGCCCCCAATAACTTTCAACGCTAACCGGCCTTTCCTTTATTTCATTCTATATAAGAAGAACGTTTTGTTCTGTGGATCATACTATGGAGAATACTTAAAAACCAGAGAAAATCCTGGACAAGGTTTCATAGCATCGCCATTCTCTGTGTTGCTGCCTTTAGCGGAACTTACGCTATATGCCACTAGAATAGCGTACGAACAACTTTCTAATGTTTTGAATATTGATGAAAGAGATGAGGTTCGACTGGGATTCAGAAAACTTTTGGATAACTTTGCGTTGCCACAAAAAGTATCAATTACTTTTGCTCAAAAAGTATACGGCAGTCTCGATTTCGATTTCATTGACGACTTTAAATATGATACCAAAGAATATTTTGATGCAGAAGCACAAAATTTAGATTTCAGTCAAAACCAACAAGCTGCAGAAATAATCAACGATTGGGCTAAATGGAAAGATCCATTTGACCCAGATGATACTAAACCAGAAGACTTTTATATAACAAAAGATGAAAAAATAACCGTTAACATGATGTTTCAAGAAGGATATTTCTTATACGCTGAAAACCCTGAACTACAAATACAGGCATTGGAACTAAAGTATGAAGACGAAGATTATAGTCTCTTGATTATTTTGCCAACGTCTGAAGATGATTACAGCGTAGAAGGTGTAGTACAAAAAATTCAAGAACCACATGTTTTTGAAGGAATAATTAACGATTTATCAATTGATGAAGTTGAAGTACATTTACCTTCAATATTAACTACTACAACAACAGATCTAAAACCAATTCTAGAAGGAGTTAATGTTACTGAAATATTTAACCCAGATACAACTGACATAAGTGGGATGCTAGAATACATTCAGCCAATGCACGTTTCCGTAGCTATCCAAAAAGCAGTCTGTAATAACCAGCCTGAGAATGGCAATTATAAAGTCAGCAATTTTTAA
>FQ672044.1 16S rRNA amplicon fragment from a soil sample (ferralsol, Madagascar) resulting from a 16 days laboratory incubation experiment 
TGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGGGTGATGAAGGCCCTAGGGTTGTAAAGCCCTTTCGGCGGGGAAGATAATGACGGTACCCGCAGAAGAAGCCCCGGCTAATTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGCGCACGTAGGCGGATTGTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGGCGATCTTGAGTCCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTG
>XM_030518924.1 PREDICTED: Scaptodrosophila lebanonensis dynein beta chain, ciliary (LOC115624302), transcript variant X1, mRNA 
ATGGAGCCATCCACGAGCGCCGAAGCAGCTGCAGCCGCTGCCGGCGGTGGGCCGGATCCACGTTTGGAGCTGATGGGTTCCTTTGTCATCAAGTCCCTCAAACTGAAGCCGGAGAAATGGACGCGTGTCATCACCGTGGAGGAGCACAAGGGCATTATTAAGGAGTTCTTGGATCGAAATACACCGGTAGTGCTCATCATTATATTGACAACCGCTGCCCAATTGGTGCCCTCCACCACCTTTCCGCTGTCGCAGCTCAAGAGCAAGGGGGTGTACTTCATAAAGAAGTACGCCAAGCCGATACCACGCGAGCTCTGTGAGAATTTCATTATTTTCGGCGACTTGGCAACGCGCACCATCGACCAACTGTCCGCCCTGGTGGAGGAGGTGGTTGTGCCTCTGCTCTCCAACGAGGACAATTACAGGGCCTGGCCCACTATGGTGGCGCAGGATGTGCAGAAGCATGTGCATAGCCTAAAGAGTACGGTGCACCAGGTGAAGGGTCAGGTGAGCGGTGAAACTATTCTGGCCATGCCTGTGGGCGTCGAGAAAATTGTCAAGGCCGCCAAGGAGTTGGTCGAAACCGAACAATGCCAGTTCGATCTGTATCTGAAGAGCGCCATCGAGGGTGTGGTCATCAAGTGGGCGACACAGATCCATGAGGTCATCAAGGAGAGTCCGTCGAATGCCTTCGCCAATGGCCAGAATCCCACGCCCCACACAGAATTTACATTTTGGAATAATCGCCTTAAGAACCTATCTTTTATCTACGACCAATTGCGCAACGAACGTATCCGTGCCATGGCAATAATACTTGAATACTCGCTAAGTGCCTACCATCCGTGCTTTCAAACGCTCTTCAAGAACGTCGTTACGGCACTCGCCGAAGCAAAGGACATAACACTCTATTTAAATCCATTGAAACGTCCATTGCAACAGCTGGAGGAAATAGATTTTGCGGAAAGCAAGCCACTGCTCATCCCCTTCATGAATATCGTCTGTATTCTGTGGGGAAACTCGCGCTATTATTGTCAGTCATCGAAAATAACGATTCTGTTGCAAGAGATATGCAATCTGATTATCCATCAGGCCAAACGCTATTTGGATCCCTCGTCAATTTTTCACAGCGACATCGATGAGGCCATGCAACGCCTCACTCTCTCCATACAGATACTGAAGTTCTTTCGGGAGCTTTTCGATTATTATAAGGAACGTTTGGCCGATTTCTTTACAGAGCCCGAGGAGCGGCCACCGATTTTCTGGACTTTTCATCCAAATTCAGTTTTCAAGCGCTTTAATGCATTCCTAGAGCGTTTAACAACCATACAATGGTTCTTCTTTACTGTGATTGAATTCCTGAAATTAGAGAAAGTCGAAATCGGTGGCTTGCGTGGTCGTCAGCTCAGCACACGCATTACAGATGTCTATGTCGAGTTCAATCAATATTTTACAGCCTTTGCGTCCAAAAGCTACGATGTGCTGGACCCAGACGATCATGACTTTGACGATGACTTTAAGGGCTTTCAAACCCGTATACTTGAACTAGATATGAAGTTGGCCGCCATATTGTGCCAGGCCTTTGATGATTGCCACAATTTGGAGAGCATTTTTAAGCTCATTAGCATTGTGGGTAGCGTTTTAGATAGACCCAAAATTAGAGAAGAATTCACACAACGCTATGCCGAAATTCTTGAGATGCTGAACGATGAGATGACGATGTGTGAGGCCATCTACGAGAAGCAAATGGAACTGAGAAAGATTGGCGAGAATCTCTATCCGGACTATAACTGTCCACCTGTGGCTGCCTTCATACGTTGGTGCAATCAGCTGGAGACTCGTATTACAGGGCCTGTGAAGAACTTCAAGGCGCTTCAGCATGAAATATCAAAGTGTGAGAAGGCTCTAGAGATAATGGAACGCTACGATCGCTTGATCGAAAAGTTGGGTGCCTGTAAGACACAGTGTTTTGAGGAATGGAGCTCCCAGCTAGCCGAACAAATCGAGGAGAATCTAAAGAAGTCGCTTATTGCGCGCGGTCCCCAAGGCAACTCGTTAATTTTAAACTTTAGCGCTGCCCTATTCTCAATACTGCGTGAGGTTCATTATATGCAGCAAATGAAAATCGAAGGCATACCCGATATAGCTATAGAGTTCGCTGAGAAGAGCGATGTCTTTCGTGGATATACGTTGAATTTGGAGAAGACTATCGATTGGTATAACAGCATACAGGAGGCTAGCTCGCCGGTTGAGTTGCAATTGATTGGACCCGAAATAAAAATGATTGATGACCTTGTGGAGATCGGTGTGGATAACTTAGTCTGGAATTCAGAAGACATCTTGACGTATTTGGAAAAGTTACGTAAGCCCGTTGCTGCTCTCCAATATCGCATGGATCATACGCAGGGAAATTTGCGGCAAATACGCAAAATTATGAGTGTGTGGGCCAAGCAGCCGTTGTTTGAGCGTCGGGACTGCAAAAAGGATTCGGTGTTGTCTATTGACGAGCGACCTGATCGCACCTCCAAGCGTTATGCTGAGATACAAGCGGCCTCCGTTGAGATACACAAACTACTGCACGACAATATGCTGCAGTTCGACATGGAGGATAAACAGCAGGATGAGGTCTGGCTCAGCTATGTGAACTTTGTCGATAACATCGTCTACGAGAACCTGCTGCGCACTGTGGGCGTAAGTGTTGGGTATTTAGCCGAGAACATGGATCCGGAGAACAATTATGCACCACTTTTTGAGTCCCGTCTGGAGCTAGTCGAACCCGATCTTGTGTTTGTGCCCTCCCTTGAGCCGGAAGACCCGATGGGCTTTAACAACATGCTGATTGAATTAATGCGCGATATTATGAAAATGGGTTCGCTAATCAAGCGTCTGACTCACGAGAAGCGCAGCTATGCTGAGATTATTAAAGAGAACCAGGACATAATTGATATGCGACGTGAAATTCTGAACGGTGTGGACTTGGTAATGGAGGAGGCATCCCGTTTTTGTCGCCAGTTTGAACGCTACTCGTACCTATGGCTGGATGATCGCGAGGAATGCATGGAATACTTTTTGGAATATGGTCATATTTTGGATCCCGACGAAATCGAATTAGTTTTGATGAACGATCCGAATGCACCGAAGCCCTGTTTGCCAACCATTGAGGCATTCCGAGAGCAGATCGATAACTATGAGTCGCTATTCAATGAGATTGAGGATATATCGCCATTTCAAGTGTTTAGCTCGTGGTTTCAAGTGGATGTGCGACCCTTTCGTCAAGCGCTGCTCAATACAGTGTGCAAATGGGGAAATATGTTCAAGGAGCATTTGGTTACAACCGTCACAACCAATCTAATGGACTTAAGTCACTTCATACACAAGGCCGACGAGGGTTTGCTGCAAACAGTGAAGGAGGGCGACTACGAGGGCTTGGTTAATCTAATGGCCTATCTTATGCAGGTTAAGGAGCGGGCCATCAAGACAGATGATATGTTCGAGCCGATGCAGGAAACCATACAGCTGCTAAAATACTATGACATGGATATACCTGAGGAGGTGAATGTGTTGCTTCAAGAATTGCCCGAACAATGGGCCAACACCAAGAAGATTGCTTCAACGGTTAAGCAACAGGTATCGCCACTCCAAGCCACTGAGGTGGTCAGCATACGGAACAAGATAGCGTTATTTGAGGCCCACATACAGCTCTTCCGGGAGGTCTTCAAGAATTACGACTTCTTTCGCTTTGATTGTCATAAGCCATACCAACTTATGGATCGCATTAACGATGACATGTTTCTGTGCGAGAGCGAAATGCGCGACATACAAGAGTCGGGCAGTCTCTTCGAGGTCAATATACCAGAGTTCAAAGTGCTGAGGCAATGTCGCAAGGAATTACGCATGCTTAAGCAACTCTGGGATTATGTTAATATTGTGCAGACCAGCATCGAAGATTGGAAGACTACGCCATGGCGTAAAGTCGATGTGGAGAATATGGATATAGAGTGCAAGAAGTTTGCCAAGGATATACGCTTGTTGGATAAGGAAATGCGTGCCTGGGACACTTTCATAAATCTCGAGTCGACGGTGAAAAATATGTTAACCTCATTGCGCGCTGTGGGAGAGCTACAGAATCCTGCCATACGTGAGAGACACTGGAATCAGCTGATGAACTCGACAAAGAGCCTTGCCGCCTTGCCCAAGGAAGTGACCGTGAAATTTATAATGGATCATGAGACAACGTTGGCAGAGCTTCTGGGCTTGAACCTGCACGAGTGCGAGGAGGAGGTGAAAAACATTGTTGATAAGGCTGTTAAGGAAATGTCTATGGAGAAAATATTGCGTGATTTAAACACAACATGGTCTGCGATGGAATTCGATCATGAACTCCATCCACGCACTGGCTGTAATCTCCTTAAAGCATCGGAAGAACTCATAGAGACGCTCGAAGATAATCAGGTTTGCCTACAAAATTTAATAACATCCAAGTACATCGCCCATTTTCTCGAAGAAGTTTCAACTTGGCAAAATAAATTAATGATCGCCGATCAAGTGATAACCGTTTGGTTCGAGGTGCAACGCACTTGGACCCATCTTGAGAGTATCTTCATGAGTTCGGAAGACATACGCAAACAGCTGCCCGTCGACTCGGATCGTTTCGATAATATCGACGCCGAATTTCGTATACTCATGGATGAGATGTGCGTCTCATCGAATGTTGTGGCCTCGACTAATCGATCTGGGCTAATCGAACGTTTGGAGCATTTGCAGAAGGAGCTTACACTTTGCGAAAAGGCACTGGCAGAGTACTTGGAAACGAAGCGTTTGGCTTTTCCTCGTTTCTACTTTGTATCATCGGCCGATCTTCTCGATGTCCTAAGCAATGGCATCCAACCGGAAATGGTGACCAAACATCTAACAAAATTATTCGATTCGATCGCACGCTTAAAATTCAATCGCGATACGGCCAATGAGATAGAGACAGCTTCGGGCATGTATGCCAAAGATGGCGAATACGTTGAGTTCAACGAGCTGGCCAGCATACGCGGGCCGGTTGAGGTGTGGCTGAATCGTATACAAGCGGCCATGCGAGCCACCCTGCGACACTATGTCACAGAAGCTGTGGTCGCTTATGAGGAAAAGCAACGCGAACAGTGGTTATTCGATTATCCTGCACAGGTGTCGCTCTGTGGATCACAAATCTGGTGGTCGACAGAGGTGAACATTGCCTTCAGCCGTTTAGAGGAAGGTTACGATAATGCCATCAAGGACTACTATAAGAAACAGATCTCACAACTCAGTTTACTCATAACACTGCTGCTGGGCGAGCTGACCAAGGGTGATCGTCAAAAAATAATGACGATTTGCACAATTGATGTGCACTCACGAGACGTGGTCGCTAAGATGATTCAGGCCAAATTGGATTCAGGTTCGGCTTTTATGTGGCAATCGCAGCTAAGGCATCGCTTCGACGATGTAGAGAAGGATTGCTTTGCCAATATTTGCGACGCTGAGTTCCAGTATTGTCACGAATACTTAGGCAATACGCCACGACTGGTCATCACGCCTCTGACAGATCGCTGCTACATTACACTAACACAGAGTCTACACTTAATTTTGGGCGGTGCGCCTGCAGGTCCAGCTGGAACAGGGAAAACAGAGACTACAAAGGATCTGGGACGTGCCATTGGAATAATGGTGTACGTGTTCAATTGCTCAGAGCAAATGGACTATCAGTCGTGTGGTAATATTTACAAGGGTCTAGCCCAGACAGGGGCCTGGGGCTGCTTCGATGAGTTCAACCGCATTACTGTCGAGGTGTTGTCTGTGGTGGCAGTGCAGGTGAAGTCTGTGCAGGATGCGATACGTGACAAAAAGGACAAGTTTAATTTTATGGGCGAGATTATAACCTGTGTGCCCACAGTTGGCATATTTATAACCATGAATCCCGGCTACGCGGGTCGCACAGAGCTGCCGGAGAATTTGAAGGCACTTTTTAGGCCGTGCGCCATGGTGGTGCCAGACTTTGAGCTGATCTGCGAGATTATGTTGGTCGCCGAGGGCTTTCAAGATGCACGAATATTGGCGCGTAAGTTCATCACACTCTATACACTCTGCAAGGAGCTGCTTTCCAAACAGGATCACTATGATTGGGGATTGCGCGCAATTAAATCTGTATTGGTCGTTGCTGGATCGCTGAAGCGTGGTGATCCTGGCCGTCCTGAGGAGGAGGTCCTTATGCGTGCCTTGCGCGATTTCAATATACCAAAAATAGTTACCGATGATATGCCCGTGTTCATGGGGCTCATCAGCGATTTATTTCCCGCTTTGGATGTGCCGCGCAAACGTGATCAGGACTTTGAACGCACCGTAAAACAAGCTGCCTCCGATTTGCTACTACAACCCGAAGATAATTTTATATTGAAAGTGGTGCAACTGGAGGAACTGTTGGAGGTACGTCACTCTGTGTTCATCGTTGGCAATGCTGGCACTGGAAAGACACAAGTGTGGAAAACGCTGCTGCGCACCTATCAGAACATCAAGCGCAAGCCCATTTTCAATGACTTGAACCCGAAAGCCGTGACCAATGACGAACTTTTCGGCATTATAAACCCAGCTACGCGTGAATGGAAAGACGGCCTCTTCTCGGTACTGATGCGGGATCAGGCAAATATCGCGGGTGATCAACCAAAATGGATAGTCCTAGATGGTGATATTGATCCCATGTGGATCGAGAGCTTAAATACCGTCATGGATGATAATAAGGTCTTGACTTTGGCGAGCAATGAACGTATTGCTTTGACGCCTTCAATGCGCTTGCTTTTCGAAATCTCCAATCTGAGAACAGCAACACCGGCAACTGTATCCAGAGCCGGCATATTGTATATCAATCCGCAGGACTTGGGTTGGAATCCCTATGTAACCAGTTGGGTTGAGACGCGCAAAATTCCAGCCGAAAAGTCCAATTTGGTCATGTTATTCGATAAGTACATACCATCATCATTGGAGACGATACGCGTGCGTTTTAAAAAGATCACGCCTATCGCCGAAATGGCCCACATACAAATGTTGTGCCATCTATTGGACTGTTTTCTAATACCAGCGAACACACCGGCCGATTGTCCAAAGGAATGGCATGAGCTCTACTTCGTGTTTGCCTGCATTTGGGCCTTCGGATCGGCTATGTTCCAGGATCAAGCCATTGATTATCGTGTGGAGTTCAGCAAATGGTGGGTAAATGAGTTCAAAACAGTTAAGTTCCCAGCAGGTGGCACTGTTTTCGATTATTTTTTGGATAGCGAGACTAAGACATTTCTGCCCTGGATCGAGAAGACACCCAAATTCGAGCTGGACTCTGATCTGCCATTGCAAGCTGTACTCGTGCACACCTCCGAGTCCATTCGCTTGCGTTTCTTTTTGGACTTACTTATGGATAAGAAGCACCCGGTGATGCTAGTCGGCAATGCCGGTTGCGGCAAAAGTGTTTTGGTCAACGAGAAGCTTCAATCGCTTTCTGAGAATTTCGCTGTCACCACAATACCATTCAATTACTACACAACGTCCGAAATGTTGCAAAAGATATTGGAGAAGCCGCTGGAGAAGAAAGCGGGACGCAACTTTGGACCGCCCGGCAATAAAACCTTGATATACTTCATCGACGACATCAATATGTCGGAGGTAGACTGCTACGGCACCGTACAACCCCACACTCTAATGCGCCAGCATCTTGATTATGGCCATTGGTACGATAGGAACAAACTAACTCTCAAGGATATACACAATTGTCAGTATGTGGCGTGCATGAACCCAACTTCGGGCAGCTTTACCATCAATCCGCGACTCCAACGCCACTTCTGCGTATTAGCTGTCAGTTTTCCGGGACCCGATTCGATAACCGTCATGTACTCGGCCATCTTGTCTCAACATTTTGCGAATGCCGAGCAGAAATTCATTCCGATCGTAACACGCATGACGCCAAATATTGTGGCCGCAACCATAGCGTTGCACAACAAATGCCTCCAGATATTCCTGCCCACGGCCATAAAGTCACACTATATATTCAATTTGCGCGACATCAGCAATGTATTTCAAGGTTTACTCTTCAGTTCAACAGAATGCCTAACGGGCTCTACAGATCTTATACGTTTGTGGCAACATGAGACACAGCGTGTCTACGCCGATAAGCTAACCGATGATAAGGATATTGATAGCTTTACTAAAATGCAGCATGACATTGTTAAGAAATCGTTCGAGGAAATTGACGAATCCGTAATATTCGACAAACCGAATATCTATTGTCATTTCGCTGGAGGAATTGGTGATCCTAAGTACATGCCCATCAAGGGCTGGCCTGAGCTTCACAAACTCCTTCAGGAAGCAATGTCATCGTATAATGATCTGGTCGCTGCCATGAATCTGGTGTTATTCGAAGATGCGATGATGCATGTGTGCAGAATCAATCGCATATTAGAATCACCGCGTGGCAGCGCTTTATTGGTTGGTGTTGGTGGCAGTGGTAAACAATCTCTAGCGCGCTTGGCAGCATTCATATCCAGCTTGGAGGTCGTGCAGATACAGCTTAAGAAGGGCTATGGTGTCAACGACTTGAAGATTGAGTTTTCCGGTTTGTATCTGAAAGCGGGACTTAAAAACGTCAGCATCATGTTCCTAATGACGGATGCGCAAATTCCCAGTGAGGATTTTCTTGTCTTAATCAACGATATGTTAGCCACTGGCGAGATTCCAGATCTATTTCCGGACGACGAAATCGAGAACATAATCGCTGGCGTGCGTAATGAGGTCAAAGGTGCGGGGCTGGTTGATACGCGAGAAAACTGCTGGAAATTCTTCATCGATCGTGTACGCAAGCAACTGAAGATAGTTCTGTGTTTTTCACCAGTGGGCTCAACATTGCGTGTTCGGTCGAGAAAATTCCCTGCCATCATCAATGCAACGTCCATCAATTGGTTCCACGAATGGCCTCAAGAGGCACTCATATCGGTTGCCATGAACTTTTTGGCACAGAACAAAGTACTGCCTGACAATCATCGGGACTCTGTTGCTAAATTCATGGCATATGTCCACACAGCTGTAAATTCCACATCCAAAGTTTATTTGCAGAACGAGCGCCGTTACAACTACACAACTCCCAAGAGCTATCTCGAGCAAATAAATCTCTATTTAAAGCTACTGAATCACAAAAACCAGGATTTGCAGAGCAAAATCGAGCGTCTGGAAAATGGATTGGAGAAGCTTCGTTCCACGGCCGTCCAGGTGGCCGATTTAAAAGTTAAGCTAGCCGTTCAGGAGGTCGAGCTTAAAGAGAAGAACGAGGCGGCCGATGCTTTAATTGAAATTGTGGGTATTGAAACGGAGAAAGTGCAGACGGAGAAAGCGGTGGCGGATGAGGAGGAAATGAAGGTTGCTTTGATAGCGGACGAAGTCAGCAAGAAACAACGTGATTGTGAAGAGGATCTATTAAAGGCCGAACCGGCGCTTCTCGCAGCCCAGGAAGCCTTGAACACGTTGAACAAAGCGAATCTAACGGAATTAAAGAGTTTTGGTTCGCCCCCGGGTGCGGTCACAAACGTAACAGCCGCCGTTATGGTATTGCTGGCTCCAGGTGGAAAACTGCCCAAGGACCGCTCCTGGAAAGCTGCAAAAATTTCGATGGCAAAAGTCGACGCCTTTCTAGACGCATTGATCAATTATGACAAAGAAAACATACATCCTGAAATCATTAAGGCTATACAACCATATCTAAAGGATCCAGAATTTGAGCCCGAATTCGTGCGCTCCAAGTCAGGTGCAGCGGCCGGTTTGTGTGCTTGGGTTATCAACATTATCAAGTTTTATGAAGTCTATTGCGACGTGGAGCCCAAACGTAAGGCGTTAGCAGCCGCCAATGCAGAGTTGGCTGCTGCTCAGGATAAGCTTGCGGGCATTAAACGCAAAGTGGCGAGTCTGGAGGAACAACTAGCTAAGCTAACAGCCGATTTTGAGAAGGCCACGGCGGACAAATTGCGTTGCCAGCAGGAAGCTGATGCCACGCAAGCAACCATAGCATTGGCTAATCGTCTTGTAGGTGGTCTAGCCAGCGAGAATGTGCGCTGGGCAGAGGCTGTCAATAACTTTGTCAAGCAGGGCATTACGCTTCCCGGCGACATTCTACTGATTACCGCCTTCATTTCCTATGTTGGCTGTTTCACGAAAGGATTTCGCATCGATTTGCTGCAAAAGATGTGGACACCCTTCCTGAAGGGCATCGATCCTCCCATACCCACAACCGAAAATCTCGATCCACTCTCGCTGCTGACAGATGACACAACCATCGCCGTTTGGACAAACGAGGGCCTGCCGAGTGATCGCATGTCCATTGAGAATGCAACCATTCTTTCCAACTCTGATCGCTGGCCACTGATGATAGATCCCCAGCTGCAGGGTGTGAAATGGATTAAACAGAAATATGGCGATGAACTTAAGGTTATCCGTTTGGGTCAGCGCAGCTATTTGGACATCATAGAGAAGGCCATAAACACGGGTAGCACTGTCTTGATTGAGAACATAGATGAGAACTTGGATCCTGTTTTGGATTCATTGCTTGGTCGTAATCTCATCAAAAAGGGAAAAGCTATTAAAATCGGCGACAAAGAGGTCGAGTATAACTCCAACTTCCGTTTGATCCTGCACACGAAACTAGCAAATCCACATTATAAGCCCGAGATGCAAGCACAAACCACACTTATTAATTTCACTGTTACCCGCGATGGGTTAGAAGATCAATTGCTGGCGGAAGTTGTGAAGGCCGAACGTCCCGATCTGGAGGATCTCAAGGCCGAATTAACCAAACAACAGAATGACTTCAAAATCATGCTAAAGAAACTGGAGGACGATTTGCTGTCGCGCTTATCGTCTGCTGGTGAGAATATTTTAGGTGACACCGCTTTGGTGGAAAATCTAGAGACCACAAAGAGTACAGCATCGGAGATTGAGGAGAAAGTGGCTGAGGCCAAGATCACATCGAAGGAGATTGACAAGGCGCGTGAATACTACAGACCAGCGGCGACCAGAGCCAGCTTGCTTTACTTCATCTTAAATGAACTAAACACTATAAATCCGATCTATCAGTTTTCCCTGAAGGCTTTTAGTGTAGTTTTCCAAAAGGCCATAGCTAAGGCTGAACCAGGCGAATCCTTGGATTTGCGTGTCTCCAATCTGATCGATTGCATAACGTACTCGGTCTTTCAGTATACTTCGCGTGGTCTTTTTGAATGCGACAAACTGATATTCGCATCTCAAATGACTTTTCAGATACTGCTTATGAACGAGGAAGTAACATCTGTGGAACTGGACTTCCTACTCCGCTTCCCGATCAAACCGCATGTGACAAGTCCTGTTGACTTTTTGTCAAACCAATCGTGGGGCGGAATATGCAGTCTAGCGTCCAAGGATGAGTTTAGGAATTTGGACCGTGACATAGAGACCTCATCGAAGCGTTGGAAGAAACTGGTGGAATCGGAACTGCCGGAGAAGGAGAAGTTCCCACAGGAGTGGAAGAATAAAACGGCTCTGCAACGTCTTTGCATGATTAGAGCTTTGCGACCTGATCGCATGACTTATGCTCTAGGGGATTTTATTGAGGAGAAACTGGGCTCCAAATATGTGGAAAGTCGAGCAATGGAATTTGCAAAATCTTTCGAAGAGGCTAGTCCTTCAACACCCATCTTCTTCATATTATCGCCTGGCGTCAATCCTCTGAAGGATGTGGAAGCGTTGGGAAAACAGCTGGGCTTTTCCATGGATCTGGGCAATTTTCACAATGTATCACTGGGTCAGGGTCAGGAGGCAATTGCTGAAGCGGCCATGGATATAGCAGCAAAGAATGGACACTGGGTCATACTACAGAACATACATCTGGTACGCAAATGGCTGCCTGCCCTGGAGAAGAAGCTGGAATATTATGCTGAGGGCTCACATAAAGATTATCGCATGTTTCTGAGTGCAGAGCCCGCATCTACGCCCTCGGCGCATATTATACCACAGGGAATTTTGGAGTCATCGATTAAGATCACAAATGAACCCCCCACGGGCATGCTGGCGAATCTGCACAAGGCCCTCGATAATTTTACACAAGAAACACTGGAAATGTCCGGCAAGGAGGCCGAATTCAAGGCAATACTTTTTTCGCTTTGCTACTTCCATGCTGTGGTGGCTGAGCGCCGTAAATTTGGTCCACAAGGTTGGAATAAGATATATCCGTTTAATGTGGGTGACTTGAACATAAGCGTATCGGTTCTCTACAACTATCTGGAGGCCAACGCAAAGGTGCCGTGGGAGGACCTGCGCTATCTGTTTGGAGAAATTATGTACGGTGGACATATAACTGACGATTGGGATCGACGCTTATGCATCACCTATCTAGAGGAGTATATGCAACCTGATTTGGTGGACGGTGAACTTTTTCTGGCGCCATCATTTCCCGCCCCACCAAATACCGATTATCTCGGCTATCACACATATGTCGACGAAATGATGCCCGCCGAGTCGCCTTATCTCTATGGCTTACACCCGAATGCCGAGATAGGTTTTTTGACCACACGTGCCGAGAACATTTTCCGCACCGTCTTCGAAATGCAACCTCGGGAGGCTGGCGCTGGAGGCGGCGCCACTGTGACGCGTGAGGACAAGGTCAAACAAATCGTGGATGAAATACTGGAAAAGTTGCCCGAGGAATTTAACATGGTGGAGATAATGAACAAAGTGGAGGAGCGCACGCCATATGTAATTGTGGCTTTTCAGGAATGCGAGCGCATGAATTACCTAACAAGCGAAATGAAGCGTAGCTTGAAGGAGCTAGACCTCGGCCTTAAGGGCGAATTAACCATAACTTCGGATATGGAAGTGCTGGAAAACTCTTTATTTTTGGATCAAGTGCCGCCGATTTGGACATCGCGCGCCTATCCATCCCTCTTAGGTCTAAACAATTGGTTCATTGACTTATGTTTGCGTTTGCGGGAGTTGGAGACTTGGTCAACGGATTTTGTGCTTCCGTCTTGCGTCTGGTTAGCCGGATTCTTTAATCCCCAATCACTGCTAACGGCCATTATGCAGAGTACGGCGCGTCGCAACGAATTGCCGCTGGACAAGATGTGTTTGCAATGCGATGTCACTAAGAAGCAGAAGGAGGACTTTACAACGGCACCGCGCGAGGGCGCCTACGTTCATGGCATATTTATGGAAGGCGCCAGATGGGACATACAGCAGGGTATTATAATGGAGTCGCGTCTTAAAGAGCTCTATCCATCAATGCCAGTCATCAATATTCGGGCCATTACCCAAGATAAGCAGGATTTGCGTAATATGTACGAGTGCCCCGTCTATAAGACACGCACACGTGGACCAACCTATGTTTGGACATTTAATTTGAAGACCAAAGATAAGCCCGGCAAATGGACGTTGGCCGGCGTGGCATTATTGCTACAAACTTAGCTGGAATATACCTATATCGACATTTTTCCAATTCATTTTTCTCGAATTAAATT
>XR_002553663.2 PREDICTED: Helianthus annuus DNA-binding protein HEXBP-like (LOC110871340), transcript variant X4, misc_RNA 
TTGGGATCGATCGAACAAGGGCAGGGAGAGGGTGAATAACCCTAAACTCAAGAAATCAAGAATTGAAGCTAAAATCTCAAGGAAAATTCGATGCATGAGCCCTTCTTTGCGAAAATCTAACCCTAATTATTGAAGTGGCGTGAAAGAAGAAGGTACAAGCACTAAGCAAGCGGAAGGAGCACGAGATCGAGGTAAAGCACCTCTATAGGCGATATGGAGATATGGAACGAGCACATGTTTAAGCCTTATAATACCAAGCGCTTTCGC
>XM_033245137.1 PREDICTED: Anneissia japonica ataxin-2-like protein (LOC117104323), mRNA 
ATTGGCCTTTAGCATAATTATTTTCTGGTCTCTGTCGAAGGCCAAAGCATTGTCGATTTATCAAAAACATTGCCTTTGAAATCATCCTCTGGTGGTAGTGGGAAGCAGTTGCGAATATTAAAGACAAGCATTTTTATCGATATGCTTTGTTGATTGTTATAAAATACAAATTAATTGATTTTGCAAGGCTCGTGCTTCTGAGAAGCAGCTCACCGGCGATCCGAAGGCATGATGAGTACACAGCAAGCACCACAAAACAAACGTAAAGGGGGGAGAACCGGGAACAGTGGTCATGGAAGAAATCGAAACTCAACTCGATCAAGTAATCTTACAGCTAACTCGCAATCACACTCAACGCCGGTCATTCCACCTAGATTATACGCAAATGCTCACTTTGTACACGCTACAGCTGTTCTCAAGGGATTAAAAGTTCAAGTTGTGGTTGTATCAGGCAAAAAGTATGAGGGAATATTCAGCACAATAAGTAATAATGGTGAGATTGTAATAGAATTGGCACACATGGTAGAAGGCAATACAAATGCTGTACCAAGCAAGGAAAGGACAATTGATAAGCTGGTTGTTAAGTTCAAAGATGTAGTCTCGCTTACAGCATTAGATGTTGATCTCGAATACGCTGTTAAAAGCGATGTTCAGCCTGGATTTCAGACAGATTCAGATATCAGCGGGAAGAAATCGAATGGTCAAGCAGGAGAGAGAGAATTACAGCAGTGGACTCCAAGCAATGAGACCCCAGCAGATTTATCATTAGATGGTGATACTAATGGATGGAGTGTGGAAGATATGTTTAAAGCTAATGAAAAACAATTTGGTTATGAATCCTCATACGACACAACTCTAAAAGATTACACGACGCTCTTACGCAAAGAGGATACAGAGGAGTTCCGTCAGAAATCAGAAAGGGCGAATAGACTAGCAATGGAAATTGAAGAAAGTGCAGGCTACAAACAAAGAGCAGCTCTTGAATTAGATGATGGGCAAACAGAGGAGGATAGATTCAGTGCTGTGCAACGGCCGAAGGCCAGAATGAGCCCATCGGGATCACAGCAGGGAAGATCCGCTAGCCCAAAAGGAAACCCACAGTTTGATGGTAATGCATCAACTAATAAGTATGTACCCCCTCATTTAAGAAATAACAAGCCGGCTCAAAGGAATTATAATCAACCCTCACATAGGCCTCACACTCCAACACAGGGGGGCCAAAGAGGACCGACACACGCACAGAACATGGCTAGGCCACCTAGACATGCTGTGCCTGATGAACGTCTGACAATGCAAGATGTACGAATGTCACCAGAATCTAGGCAATCCCAAGATGTTAGGTTGTCACAGGATGCAAGGCTTGCGTATGAACCTCGACCTCAAAGGTCTGCTGCACAAGTTGTTGCAGGAAGCAATCCCCAACGTGGCATGGTTCCACAGCAACAAAATGTTATGAAGCAACGAGAAGTCAAGCCGGAGTCCATAGGAATATCGCCCAGCCCAGGCCCTCCAGCAAACATGGCCAAGCAGCCTACAAAAGATATACCTAGGGTACCAAGCCCAATGGTTGGAAGCTTACCACCAACAGGTGAAACCAATCCTCAACACCCAGTTGCATCAGAGGATAAGAAGCCACAGAAATCACAGAAATCTCAAAAAATTAGTGAATTGAATGAATTTAGCAACAACTTCAGGTTACAAGAGAATCAAACTACACCTAGCAACAACCATGTTGCTACCCAGGCCCATGAAGCCAAACCAGTTCAGTCCTTAAATCCAGCTCCAACACCACAGCAAGGAAACCAGCAACCTGTACCCCAACAGGCAGCACAACAGGTAGCTCAGCCATCTTCTCAGTCGCCTCAAACACGACCAGTACCACCACCTGCGCAGGCTCAACCGCAGGCACTTATTACACAAATTATACAACAGCAACCTTTACCGGCTCAGAAGCTAGGCCAGGCACCATCTCAAGTATCAATTCTTCAGCACCAGGCTCATTCCCAAGCTCAACCTATCTCCACAGCTCAGCCACCAAGGCCAGTGGATGAAAAGAAACCAGAATTTAAGCTGAACCCAAATGCTAAGGAATTTACCTTGAACCCATCAGCTAAGCCTTTCACACCGAACTCACTACGTAAGGGGGTGAGTGTGAGTAAAACACCGACACCTCCCCGACCGCATTCACGACAGAGTCAGAGTCCAACACTCCATCCACCATCAATGCCAATGACCCAAATAATGACTGGTGGACCCCCTCCACCGCACACCTTTATCCCTCAAATGCCCTCAGTTGTCTATGCACACCAAATTCCTCTTCAGAAAAAATATCCTAAAAGTCCGGCAACCAATCTACCACAGCCCCCAAGGCAGCAGCAACCAGGGGATATATCTGGACAAATGATGTCGGCATCAACAGCAACCGGGCAACCACTGCTAGCCCCTTCTCATTTTGTACCGCCGTATCATCAGCATCCAGGGGCACATCCTGGTCAGATGATCCCAGGTCAGCCTATAATGCAACCTCAACCCATGCCATTTGTGCAGATGCAACAACAAAAGCTGCCTTATCGTCACGCCAGTTCGATGTCCAATGTACAACAATCACAAGCTCAACTCCATCCACTGCCAGAGGTCTCTCCAAATACCCCTCTCTTTGTTACACCCCAAGGTTCCAGTCAAGTCTATCCAGGTCAGCAACAGCCATCAGTGTACCCTCATCACCCCTCATCTGCTCAACAAGGAGGCCAACAACATCCCCAGGGCCAAGCAGGTCACCATCAAATGGTCCAGTCAGCCCATCCTCACTCCCATGGAGCTCAACAAGGACAAAACCAGCACCATCAAGGCCAGCCTCAGGGTCATAGACCAACGCCTAGCCCAGTTCAACATTCTATACAGTCACCCTCACAATCTACTCAGCAAAATATACCGTTACCGATATATTACAACATGCCACAGCACAGCCAACCAATTCAAGGTCACACACCTCAATCTCAGCAGACGTTTACAACTGTTTTAATGCATCAACAACAGCAGCAGCCTCAACCCCAGCCATACTCTGCTACCTCCCACAGCATAACAAATATGACGACAGTTCACACTAGCCCTCACCCGCACCCTCATGCACAACCTGGCAATGTGATGTATGTAGGAGGGGGACAGCCAGTCCCCCAACATTCACACACAGTCATGCTACCAAGTGGAAGCATATCATATCTGCCCCCACAAGGAGGTCAAGGTCAACACCCTCCTATTCAAGCCTACCAGCAGACTAACTAGAGCAATGTGTAGTGCATAAAATTCAAAAATATATATAGAACTGATCAAGGCCTTCATAATTTATTATATTATAGAGACCTGATGTCTAAGAGCTGGAGGAATTTCTTATTGAAAAGGATATATGCTGCTTATGTGTGACAGCTGAGCCTTGTATTGAATGTACAAGATGTGTTTTACCTGATGGGAAATAATGTTGTTTCCTCCTGATGGATCGGCTCTTAGGAAAATCCTACCAAGGGCCTAGGATTTAAATTGAAGCAAGCAGAAGAATCCTACAGAATTATCTAATCGTACTCCAAGAATCATATTGTGCAAGTTACCAACATGTTTGGTTTTCTTTTAATGCACCTTATAATTAAAAACTACCGGGGGCTTGTGTCTGCTCCTGGCCCTCTATGTGGAGTACAAACAGGGTTTCTGTCTGCTCTGAATATTTATAGAGTACCACCAGCCAGGCTGCAGTAGTTTACTGTCTGATCCAGCCTTTTAAAATGGATTTGCCAATTGGCCTAGTGTGCTGTTTGCTCTTTACTCTCTAAATGGAGTGCCAACAAGGCTCCTGGTCCGCAGATATTATTGAGATTTTAACAATGAGGATATAAGTCAGAATCGTAGGCTAATTATTGCTGACTAAACTCTAGATGAATTAAATTAAGGTTTTAAGATGTTTCTGCAACAGATTTATCCTATCTAAAGATTTCAAAATTCGCCCCATAAATTGGTAAATTATTCTTATTTAAATATTGTTTAAATGACCTTGACTTCAGATTCTTTATATGCAAATGTATTTTCCCTGATATTAAATTCTAAATTCCATTTAAATGTGATAATTTACATCACAAAATTAAAGAAAACAAATACGATATATATATTATGAAATTTGAAAACCATGTCATTTAATTGAAAACTCTGGTGACTGAATAGTGCTTACATTGAATATGTAATTTCACATTCATTGCATATTCCTATGAATCTAAGTAAAAAATAATATGCATGAATGAGCACAGAAATAATTGTTAAAGTTGCTTACCTTTGCTTTATTCATCCTGATAACACTAATTGTATTCTAATATTTTATTATGTAGCTTATGTTTTCTCGGTCCCCCACATGTGGACAATGTTCACACGTTTTCTGGTCCCTATGTATAAATATTAGGGTATGCTTACTGATAGTCCCTCAGGTTAGTTATTCAAATATATTGGTAATATTTTCACCCCGTAAGGATTAACACGAAACAACTGTTTTATAAAATGATTATTGTTGATTTCATGTTTTAGTTAAAATGATTAAGTTGATCAGTGAAGTAATGCAAATTGGATGTTAAGCTATTATTTTGAAATAGTTTCTACTTAATAATTTAACAATCTGTCATCAAATGCCATTGCATAAATGAATGTCGGCTTTTTTTTTACTGATCTGTGGTGTTGACTTATGACACCTAATTATAGTTCTTTGTGACAGGAGTTCCTGCTTCACTTCAGATTTCTTTGAGTGAGCCAATTACATGGTGTGAACAGCTCCACAGTTAATTAGATATGAGTAAGGTATTCTTGAAATCACTCCATTTAAGATGCATATCACTTTACAGTATAAGGCATAGTTGTTTATTTCATTAATCATTAAGATAACACATATCATCAGTGACATCTAATGTCATAAATACATGGCTAAGCCTGGTATAGTCTGCAAATGCAAAATGGGGTGTAAATGTTTTGGTTGTTTCAGATTTAATTTCAACACAGTTATTTATTCAGGATGTGAAATGGAAATAGTTTGACTGTTTTTATCGACAATTTCTTAACCAGTGCATCAAAGTATATAAATATTTATTTTATTAATGCAGTATTATATTATTATTATTATTATTATTATTATTATTATTATTATTATTATTCATATATTGATTTTAGTGTTTATTTTTAAAATAAAATAATGCTGATGTGTAATGAACTACTGTATTAAAATGAACATTTTACATTATATACATGTACATGCATGTTGGTGACACATGCATACATACATACATACATACATACATACACACACACACGCACACAAGGATGAGCAAAGCAAAAGTTTAAACTTACAGATCTTTATGACCTGTTTGCTGCCCTCTATAGTTAAGTTATTTTGGCAGCTACTGTAGTTTAAAGAATCTGATATTTGAATTAGTTCTATCATGTCTATGTTTTTATGACAACAATATAAGGGGGTTATTTTCAAGGATATAGCAAGGGAGGGCACTGCTCAAGGGAAGTGTATGAAAACGGTGAACATCGTTCTTTGTGTTACAAACGAGTTCTATTGTTCTTCCGTTTTTTGTCTTGATGTGAAATGAAATAAAAAATGACATGATTGCATTTTATCCAAATAAGAA
>LN587638.1 Uncultured eukaryote partial 18S rRNA gene, clone SIGW489_N9D4_16S_A 
AGTCGGCTCAGCGCCTGGTCATCCGTATGGGAAACTAGCTCGACCTTCACTGGTCGGCTAGTGGATCATACACTTTACTTTGAAAAAATTAGAGTGTTTCAGGCAGGCAATTGCTTGGATACTGTAGCATGGAATATGGAATAGGACTTTGACCTTATTTGTTGGTTTCTCGAGGTCAAAGTAATGATTAATAGGGACAGTTGGGGGCATTCGTATTTAATTGTCAGAGGTGAAATTCTTGGATTTTTTAAAGACGAACTTATGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCAAAGACGATCAGATACCGTCCTAGTCTTAACCATAAACTATACCGACTAGGGATTGGTGAGGTCTTTTAAGCCTCATCAGCACCTTATGAGAAATCAAAGTCTTTGGGTTCTGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTTACCAGGTCCAGACATAGTTAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCTTAACCTGCTAACTAGTCACCTTTATGTCAATAGGGGTCTGACTTCTTAGAGGGACTTTATG
>XR_004845356.1 PREDICTED: Anopheles albimanus uncharacterized LOC118464036 (LOC118464036), transcript variant X5, ncRNA 
CTCTCTCTCTCTCTCTCTGAATTGCTCTCTCCCTGACAGTCTCTATCTCTGTTTTACTTCATGCCCATCGCCTGCTTGTCCAGGTTCCGTGTGGCACGTACAGGATACGAAATTCTTCCTATTTCTTCTGAATGGCAAACTGACATGCCTTGCATTCGAAATTTCGAGTATTGTACAGAGAACGACGGCATGTGCTGCATAACCAATGAAACCGGTGCGTTACAGCCGATGAGTCGCTGCGGAGTGTGATTTCGAAAGTGCCGACAGTCGGAAGTGGTGGCCGCTCCTAGGAGGACGTTCGCTTATCTCTGTAGCAGTGTTCTTGAAAAATATTCTAGAATTAAGCGTGAGAAACATGCGTTTAGCTAGGTGGAATACTATTTTACGAACCTGAGGAAGTTCCCCGGAACAGTGTGAGACTCACACTCACTAAACCTCACTAGCTTGGTTTTCCGTTACCACCCTGCAGCTGTGTGCCTCTTTCGAGATGACTTGCAGCGAGGGTGGCAACGCCGAACCACTTGCTGCGCGAAAACATGGGTCTGAAGCGACTATATTTTTTGGAGTAACGTTGTTAAAACCACCTTACACGCTCGTTACTGCTAAAAAACGGTCCTCGCAAATGCGCGGGTGGCCGAATGGAAGGTACTCTCTGAAGTACCCATGTCCCGATAGGAACGGGGCCAAGCAGGGGTTAATCTCGCCGTATCTACGAGACAACCATCTCTCAAGATTGGGAAGTAGACGATAAGTCCATCGGCCGTTCTGGTCATTTTCCCATTATCGTTGCCAGCGCTGCAGCGACCTCGCCCGCCTCGCCACGACCAGCGTAGCGTTCCCTGTTCTCTTCGATGAGAATGCCAACCGGGATCATGCCGGTGATCACACTGATGGCCGCTGGTGATACGGTTGGGAAGGCACCCGCAACCCCAATCCCAGTAAGCCTGTGAACGCGGTTCAGCTCGACCAGGTTCCGTCCGGTCGACAGAGCCGAATACCGAGGTGACTACGCTGGATAGTAACCTCGTCCTCGAGCAACTGAGGCCGTCTGCTCCACGCATAATGGCCGAAAGGGCGTTAAGAGCCATCAGTGCGTTAAGAGGTGGTAGCATAATCAACATGGTCTCCGAAGGCAAGCGTGCGATCTACTATCACCCCGAGGTACTTAATCGCCTCCTGGGACCGATCCACTAGATCGCCGATTTCAATCGATATCTCTTGGACAGGCTGCAGGCTGCTAACAAGCATTGCCTTGGTTTTGTGCACGCTTCCACTGATTCGATCAACCGTTCCGCGTTAACTTTCACCTCGCTCAGGCTCTGACCATTAACCGCTAGGACCATATCGACGACCAATGACATAACAGGGAGTTTCGGCCGCAGAACCCCGTCAAACATCATTTTTCAGAATGTTGGCCCTAGAACGGATCCTTGGAGAACGTCAGCCGTAAGCGGCATTACCTCTGGTCATGAGTCGGTGTCGTACAGCAGAACGCGTCGATCGAAGTGCCTACCCAGGATGCGCCCGAGGGATCGCCACCCCAATTGGCGTTGTTGAAGGCGTTCTTCGCGTCGATCCGCGTGACAACCGCGCAGAGACGGTCGGCTCCCCGCTTTTGGCGAACACCACTAGCAGTTTCGAGTACCATCTTTATCGCGTCCAAATATAATTCAGCTGGTGTAGCTAGAAATGTTGTATAATACCTAAAGGCAGTTGGGTATTGTTTAGTTAATGCTCAACATTTTTGTGCACTTAGTAGATTAGATATGGTTGGTCGTAGTGGTTAAGTGGCCCAACCGTACCCGATCAGAATGAAAATGGAATACTCCAATACTGTCCTAGTCTAACATTGCGACAAGAGACGGTTCAGATACTCTCATTTCTTCCTCCTTACACATCCGCTGAAGTTACTCTACTGGAATATTTGGGGCGATGGTTTTCCAGTTTCCAAACCAGTTTGGACTGTATCTCAGGTGAGAGAACATGGTCACAATGCATCTTCTGAGACCCAAGAGAATGGGCGCTGGGTTTTGTATCCCTTTCTCGCGAGGACAGCACTGATTATAAAACATGAAACTAAAGTTTCTATTGTAGAAGGTTTGTAGTACCAGATGAAAAGCCCGTTAACTTGCAGATTTCAGACCAGGTCATGGGTAATACTGCCTCCAATCATAATTGCAATAATTAAAATGTGTAAAATTTCGGACGATGTAACTCAGTAATTAATTTGCACCACCAAAGTGAATGAAACCCCCTATTTTATTGCTAGAAACTCGATATAACGGATATGATATGTGTGAAAAAATCGGATATCGCAGCATATAATCGGTCCATTAAGCTACTGACCTGCAAGCCACAATGGGACTCGCAAACCCGTACTGCACTTGCCACATGCGACAGGATGAAATCGCCCGTAGGTACAATGGTTCACTGTTTGATTATCGTCAGAAAACAACGGCTAATCAAATGATGCAACAAAACGGGCATCAATGGTGGTTTAGGCCATTACAGGATGTGTTGGGGTTAAGGGTGACATGACTCTTTGGAAAACCAGAAAGGTGGGGCAAACAGCCATCAATGGTAGTATGTTGGAGTGACTACCTATTAGGAAAGCGAGTAGGAAAAGGTTCACCTTTCCGGTATGGTAATTCACCGAAAAAAATGAACTGATATACATAATACAACTGATACACTAATATACCAAAGCATTAATGCTTGCGATCGAACTTCGCAAACCTCAATTGTTGCAGATCTGCTCTTTGATGTGCTTGGTTCGCCAATCGATCTGATCGAGGACTTTTAGCGGCCGCAGGCAGGTAACGCTAAATCGTGGAAGCATTGGATCAGGACAGTCGCTTACGTCTGAATCGCGCATCGCCATTGATCCAAAGGGTGTTGAAAACATACGTCAGTATGTTGTACAGCCTGCCCTAAACATAGTGCAACAATCGAATTGCTTGTGTCTTTGCACTCATCGTTTGCGAACTTGCCGAGAGAGATAAGTGGGCAAATGATGCATATTCAATGAAGTTGGCTTTGGCAGCTATTGCATATGTTGCAGCCAACATACACATTCCAAAGGCACCAAACACATATAATGTTGAATATCTTCTGATTTGGCTATTATCTATTCGAACTTTCTCATGATAAAGCATTCTGTAAATTTTTCAAGGTTTTAACGAGACATGTTGCTCTTGAAGCATGGACACGCGAATGTTCGATCGGTAATGCACCGCTTCCTCTCATGCATTGGTCACTGTTATCAGCATATCCGAACTGCCACCGATCGAATTGTCCTGTCACTAAAGGAACATGAACATTACCGCCATTAGTTGCAGAAGTGGCCACCCTAGAGCACCAATCTATCCAGGCAGTGCAATGGTTCCATATCGGACACAATTAATCATCCGTGCAAAAGAAGTATGCGGATGACGATCAACATGGTACATGTCCCTCAAAGTGCATGACCACGATCTAACGTTATGTGACTCTTACACGTGGAAAATCGCAAGCAAACGTAATGGCGCTGATCTTGGACTCAATAGTAAAAAATATGTATCGGTTTGGAATGGAAGATTTTGAGGACTGAGTACTCACGTCTGGCGAAACTGATGCGTTCGTGCTCTACGTATGGTATCAATGGCCCCTATTATGAAACAAGTCGATAACGCTATCGATCGACAAGAGTAAATTTTTGAATGAACTTTTCTTGCAAACGAACATAAAAATGAACACTTGTCGACTTTTTTGTCGATCGATAACGTTATCGACTTTTTCATAATAGGGGCCACTGTCCGTCTGCAATTGTTTCTATGCTATCCGCTGCCGATGGTCCTGTGTTTGCCACTTATAGGCTACGGTAGATCCTTGCAACAAAAGCTCTTCTAGTCAATGCAATCAATAAACTTACAGTGTTTTTTCTAAGATGTTCGCAGCGTTCAAATGGCACTCCTGGAAACAGCTGAACAAACATCAATAATCTGTTGAATGGAGAAAATAAGCCTGCCTCGGATAGAACAATCAGAATGAATAGAAAATAACAGCAATTTACACCTAGAAGAAGCCTCTCATCTTTGTAATGTATGCGTACCCTGAATTCTAGCTCCATGGATGATAAACTATTCTTAGATGATGAGCTAGACTGTTAAAGTAATGTTATTAGTTCATCAAGTGTCAGTTGCACAGCTGATTATAAAAACAAGACAAAGTGCGTTGTTAAAGGGAAAACACATCGCGATAGTCATTTGGAATACTCAGCTTTTACAGTTATTGTGGTGAGCATTTAATGTGTTTGAGTATAGAATTGAAAAAGAACCAAAATGAGTTTTGTCTAAAATACACTAATATAAAACCAGCTTATCATATAGACTATTTGTTGTATTTTGATAATTTCTGTTTTTCCAAAAAGCGTTGTATTGGCAGACAGGCGTCAGTTCCGTTCCTCTTCCTAAAAGCAGAGGATCGCCAGATGCGGCGCAATCACGATCACTATAATTGAAAGTAAAATGAAGACCCTCCACTCCCATTCCTTTCAATGGCAATTCAATGGCCCGTACGCGCCATTCTCCTACTCCCGAGACCAGCGCTTCAACGCCTTTTAACTTACCGTAAATGCCATCGAATTGCACTCTTTCTCACTCAATGGGTATTCTGATGCGGATCCTATCTCCAATTACACATACGGTCCTCAAACATCCAATGCACAAATGATAAACCCACCCTTCGGTGAGTAGAATGAATTGAGTTTTTGCAGGTGACGCTTTGGTTAGACAGTCGGTCGACCGATTCCCATATATCACAGTTAATCATCACGCCGAGATACCTGACAGCATGATTCAACGAAAAACCACGCAACTTTAGTTTTGTGATTCGCGAAGAGTAAACTTTCTCTCGTTTATTTTGCCCCTTTTCCAGGATTTGGCCACAGATTCTATAGATCACTGATACATGCGATAATCAAAACCCCTAAAGAAAGCGCTTGAGATCAGCGCCCGACATGTACGTATTTATAGATGTCAATTCCTCAAAACGCCGGTTATTTATTGGTTTTTATCATAATAACTGCGTGTTTTCATACACATAGTGTTGATAGTTGGTTGGTCGTTACTATTTCTTCCTTCATTTAACTGTCATTTTAAGATTGCCTTAGAAACTTGCCATAAGGAATTCAAAAACGAGCATTTTCAACGGACATCTGTCAGCCAGAATGAAAGTTAAAAGTCATTGAACAAAATGTAATATATATTATTAGTAAACCATTATCTTAAGTATTTGAAGAATTGAATTTAAGAATTTCTTTTGTAAAATTTAATGTATAAGTAAAATTGAAGCACTGTTGTAAAGTTTAAGTAGCTTTTAAACTATGCTATTCTGTAAAACGAGAATGCAAACCCAAGAGATTGGACACGCATTTAAAATCCTAGCAAAGCATTTTCTAGCATCGTCGAATGGTGCCAATTGTTTCATCTTTTTCGTATTGGTTAGTTTAAAAAGGAATATGAAGAATGGATTTTAATTTGATTATATAAATTCATAGAAAACACATTTCCTAGAGCATTGCCATTATCGACATCGATTGACACCATTCACGAAGCCTGATTGTTAAAATGAAGAAACACCTCCGCTCCTCTATTCAACACTACCGGGATCTACTCAATAAATATGCAAATCATGTAGCTACTACGCTCTTACTGTTAAAAGATCCTATTCATGGTATTCTCCAAAAATATTCAAGATTTATGAATATATTTACATCAATTGTGTCAAACGAAGGACTCTTCGTTTCACCTTTATTCTGTAGCTATTTATGAAGACGCGTGCCGCGTTGTGTGTTGTTGGGGCAATTTTAATGTCATCATCGTGCCGTGAGGGAATGGTAACTGAAAGGCTTTAAGATGCAAAAAGTTTAAAATTCCAGTAGCAGAATTACTTGAAGGATAATTCTTCTGAAGAAATGAAACCCATAAAATATGAATATTAGACTGTGTACCTGCATTAGTCTAACACCAAAATGTATGACCTTCCACAAATCATCCTACCACCCACGACACATGGATCAAACATCAGCTGTATATTGTAATATATTTTATCAAGATTGTTCTAATATCGATGAAATCTTAGTTTGTAAATGAAGATATCCATCTTTATTTTGCCTCGGTTCTCATCAGTGCTCAATGAAGTTGAAACTGTTTAGAATTGACTGACTCTGTTTTTTTTTTTTTTATTGAAAACATCTAGCGATTTGTGAAGAAAGAAACTTAATAAAACTGATAATATTTGATAATAAAAAATCAATAAAAAGATAGCCATTTGAAATAATCAGGCTATACAGGTGCGTAACCAACATGCCTCCAAACTCATTCCGGAACCATTCCGGAAACTTCTCTGACGTCTACCATAAAGCAAATAAACTTAATTGACCATATCTCAATTCAGTCAAACAACCGGTCAAAAAGCAATAATCTTTTGCCCAGGGATGTGGCTGCATGCAAACGTTTACCATGGGATAAGGCAGCAAGTGCCCCGGCTCGTGCCCTTGGACGCTGTGACTGGGCTAAATCATTGGGGAATTGGTCAACGGTCACCTAATGGATAGGCACAAGGAATGAAATCAATTATTACTACTCATGTGGAAAATGCCGTCAACATTGCTTACAAGGGGGTGCAAACTATTCAAATACTCTCACTATTAGAAGTAATACAGTTCGTAAGCAAACGTGTGCAGCAGGTTTTTTTTATTGAAAAAAAAAACACAAAATTGTAATAAAACTGCTACTTGCACCTTTTTCACCTTGCATATTTTTTCTGAGTGGTGAAACTTCCAACAGTATTGCGTAATCGTTTTAGAGCAATCGAATTAATTTGCGCATGGTAGCTTTTGTTTTAATAAAGTTACTTTTACTTTATTTTAAGAAGATCCCGAACCCCCCTACAAATTCTGAGCAGTGCCTTTTGAAGCGGATATCTCAAAACTATGGTTTTCAATCTCGATGGTCATTACAGTACTTCCTTTCGTTTTGAAATTTTGAACACATCATTTACCCTTTAAATGTTTACTTGTCAAGCTCGAACATTTTTTAAATTTTTCGATACTTTTTATACCCCAAAGGAAAAATCGATTATCGATTGTATTGATTGGTAGTAATCGTTCTAAATGCACAAACAATTATTTCTGCAGCTTAGGAGAATCATACCCGTATGCCTTTATCGAACAGTAATTGACGGACGTAGTGAATCGTTTAGAGCAATCGAATCGTTTTAGAGCAATCGAAT
>XM_009271859.1 Wallemia ichthyophaga EXF-994 Phenol 2-monooxygenase partial mRNA 
ATGGCGTCAGATCCGCAAATCAAAAACTCAAACGTAGACGTACTAATCATCGGAGCTGGTCCTGCTGGTGTCATTGCCGCTGACTGGCTCGCGAGATTCACCAAATACGGTGTTAAGACAAGGGTGGTGGACAAGCGCTCGCACAAAGTCTTCACCGGACAAGCAGACGGACTCAACCCGCGCTCTATTGAAATGTTCCAGTCTTTCAACATTGCAAACAAGATCGTCAGTGAAGCGAACCCGATGAATGAGGTTTGTTTCTGGGCCCCAAATGAGAGCCATGGTGGTATTGAGCGTGGTAGACGTATTCCAGATACCATCCCTGGTATATCAAGATACGTCCAGTCTGTCCTCCACCAAGGTAGAATCGAGAGACACATCCTCGACGACATGAACGAAAAGAGCAATGGTACAATGAAGATCGAGCGTGGTGTGCTTCCCGAGACGTTGGAAGTCAATGAAGAACTCTGCCAAGACGACAACGCGTACCCAGTCAAAGTCGGTATTCGCCAACTCTCAGAAGAGGAATCACGTCCAAAGCTAGGCTCAAAGAACGGTGAAGTAGAATCTGGTCTCTACAAGTCAAACCTCGTCAAGGATGAAGACGATGACGTCGAATTCAAACCAGATGTTCCGGTCGGCGACAGAGAAATTATCAACGCAAAGTATGTTATTGGTGCAGATGGTGCGCACTCGTGGGTGCGTCGTCAATTAGGATTCAAGATGCAAGGTGAAGGATCTGATTTCGTTTGGGGTGTTGTCGATGGTGTTCCAATCACAAACTTCCCTGATATCCGCTGCCGTGCTGCTATCCACTCAAACGCTGGTAGCATGATGATCATTCCACGCGAAGGTAGCCTCGTTCGTCTGTACATTCAGCTCAACTTGCAAGTGGACGAGGGTGGACATGTCGACCGTAGCTTGATCACACCAAAGATGCTGATGGACCAAGCTAAGGCTGTGTTCCATCCATACTCGATCGAGATTCCTGATATCATGTGGTACACCGGTTACCAAGTCGGACAACGTCTCACCTCGGAGTATGCAAAGAATGACCGTGTTTTCATCGCCGGTGACGCTTGCCACACGCACTCTCCTAAGGCCGGTCAGGGTATGAATGCATCCATGGCTGACACATACAACCTGTGTTGGAAAATTGGTCATGTCTTAGCTGGACACGCTCCACGCTCCATTCTCAAAACATACGAGAGCGAGAGACGTCCATTCGCGGAGCACTTGATTATGAACGATGCCCAACTCGCCAAGCTCTTTTCAGGAAAGCCATTGTCATCAGCTGAGCTTAATGAACTTGGTGTCGACATGAAGGACTTTGAAAACATTCTCGAGAGAGGAATTTCATTCTTTTTGGGTACTTCTATTGAGTACTTCAACTCCACTGCCACCGCCAACGGAAGAGACGGTAGACTTTCATCGAAGCAGGAGCTGGCGAAGAATATACCAGTCGGACAACGTTTCCCCTCTCACCAAGTCGTCTCGCAGTTCGACGGCAGACACTACCACTTAGTCGACACCATGTTTGCTGATGGACAGTTTACTATTGTGTTATTCGCAGGCAATATGGACAAACAAGTAAACCGTCAACGTTTGCAAACCATTGCTCAACGTCTCGACAGCGATGATGGCGTAGTGAGCAAGTATACACCTAAGGACAGACAAAGAGATGGCGTGATTGACGTCAAGACAGTCCACTGTGGAGGCAGAACGAACATTGAAGTGCATGAGTTCCCACAACCAACTATTTACCCACCAGGCACATACAACAAGCTCTACGTCGACGACGTTTCCTACCACGCAGGTCACGGAGAGGCTTACAAGAACTACGACATCAGCAAGGAAGATGGTGCTGTTGTTGTTGTGCGTCCAGACCACTTTGTCGGATTAGTTACCTCGCTCGACGGTGCTGGTATGGATGATGTCGACAAATACTTTAGCGGATTGCTCAAGACTGTTCCGGCAGAGCAACGCAACTCGGCAAAGGATATCAAGGTTATTCCACAACCTAAAGTTTAA
>XM_041320268.1 Suillus paluster uncharacterized protein (EDB91DRAFT_1172848), partial mRNA 
ATAACCCTCCTTGGGCACGCTATCCTTTATTGCTCTCTTTCCCCACAACTCCATTGCATGTGCTGCCACACCTCCTTCACCTCCCTCCGATGATAACAGCACACTTGTTGATCTTACAGTTCATGAGACACTGTTGGACTGCTGCATGGGAAGCATCGAGGAGAAAGCATATATAGCTCCTCCTACCAGTGACAGATATCAACCTCACACACTTCTGTGCAGCTTCGGTTATCGACGATGACAAGCTCATTGCATATTAATAAAGTGGCGTATTCATCGTGGGCGCTGGCAAGTTGGTCTGGAGCGTCGTGTGGTAGACATACAGTGCAGCAGTTCAACTCATCAGTGTCAGAAAGACAGGCGTACACGACCTGCTCAGATAGCATTATGAGTATTTTGACTTCATTCTGCGCTACATATTCAAGGCGACAGACACCCGTCCCCACACCTCAGTCTCGTTAACCGTTGACTGAGGCTCGTGCACTAGCTCTTACCTTTGATACTCTGCTACTTCTCCAGCTACCTTAAAAGCCCGCCTATCAACAATTGCTCGTTCATCCAGGTCATGCATT
>XM_025612137.1 Aspergillus sclerotioniger CBS 115572 methyltransferase (BO94DRAFT_536881), mRNA 
GAACTATGCGCATTGCACACCGAATTTCCTGTTCCTTAGTGAAGTCTAGAAATGTGACAGCCATGCATCGCCCTGATATACGAGGCATTTCAAGCGCATATAAAAGGCGAAGACGCCCCAGCTGTACGAGAGGTGATGTCGCCATCAACGTAATTTTACAGAGCAAAATGCCGACCACTATCGCTCAGACCATCCAATCTTACGCCCTTCGCTTGGTACAAGACACTCTGCGGCAGATTGCAGCCCCTGTGAAACTGATCTATGTTGTTGATGGAGTGAAGAGTGTCTTGTACAACGACCCAGCGATACAGGATGCCGATAAAGCGGTGATCTATGTCACCCATGTGAATTTCTGGAGAAAAGTCCTCCTAGACTTCGATCTGGGATTTGCAGAAGCCTTCATGCTTCAGGAAGTGGAATGCGACCAACTAAGTAAAGTCTTCGACTTATATATCAAAAACCGCGCGACCCTCGACTCCGGTGACTCACTGTTTCATCTCGCTCAGCGATTAGCCCAGTGGTGGAGACCAGCGAACAACATCGACAATGCGCGCATCAACATCGCATCCCATTATGACACCTCAAATGGATTATTTACCAACTTTCTCTCTGCAGATATGAACTATTCCTGTGCGCACTGGTCCAACGATACTGCGGAATCCCTACAGACAGCACAGCGACGCAAGGTTCACTATATGATCAGAAAGGCCCGCGTGCAACACGACCACCACTTATTAGACGTCGGTTGCGGATGGGGAGATTTGATTATCGAAGCGGCGCAACTAACCGGCTGTCGAGCGACAGGTTTGACACTCTCAGAAGAGCAAAAGAATTTGACGGATGAGCGCATCCGTGACGCGGGCCTGCAGGACCGCGTTCGTGTACTGTTGTGCGACTATCGCAACGCCCCGCGGCCAGGCAACGGATATGATTGCATTATCTCAATCGGCATGTTTGAACACGTCGGACCTGAGTATATGGATCAATATTTCGAAGTGATATCTCAATTACTAAAGTCTCAAAACGGCGTGATGGTCATTGACGGCATAACTAAAATACACCCATTTCACGAGACCAATCCTCGCGTGGGTGATTACATCAATCGCTACGTCTTCCCAGGCGGATACTTGCCCACACCAAGTATACTCTTCGAGGCACTCCATCGGGGCAGCAAAGGGACATTGGAAGTGTCCTCTGTTCTCAACACCGGTCCTCACTACGGCAAAACCTTACTAGCTTGGAGGAACAACTTCATTTCCAACTGGGAACATATCCGATCTGATTTTTCCCCCCGATATCCCGATGCGTCGGAAAAGGAAATCGAGACCTACCGGCGGCGCTGGCTATACTACTTTGAGTATTGCGAGGCTGGGTTCCGTAATCGTATCTTGGGAAATTACACCATTTGCGCGGTCCGCACCCCCGAGGTGACCATTGACTACAAGAGCCTGGACATTGATGATGCGCAGAGTATCAAATTATATGAATGAATCATTGTTCTTATTGGGGTCTGGGTCTTCAAATACGTCTTGACTTCATGATGAGCTGCAGAACAAAGATAAGTCATGCTTTATGTTCGGC
>XM_041003117.1 PREDICTED: Ochotona curzoniae negative regulator of reactive oxygen species (NRROS), transcript variant X3, mRNA 
TCCTTCCGCAAGTGCGAAAATAACCCGATGCCCTAGAGAGCAGGCAGCCCAGCCCTGCGTTTGGTTGCTCTCAGGGAGGCAGGAGCCCTGGGAGAGGATGCACCCCGCCGAGCCGCCTGGGCCTGCGGGAGGAGCCGGCTGCCCTTGAAATGGAGTTGCTGCCCCTCTGGCTCTGCCTGGGTTGTCACTTCTTAGCCGTGGGATGGACAAAGAGCAGTGGAGCGGACATTGCTGTGTCCCAAGGGAGCTGCAAGTGGGACGACGGAACCGGAACCGCTGACTGCCGTGCTCAGGGCCTGGCCTCGGTGCCCAGCAGCCTCTCTCCGCGCTCTCGGACGCTCCTCCTGGAGGCCAACCCGCTTGAGAAGCTAGAGAATCACTCCCTGCAGCGTTACCGTCTCCTGGAGAGCCTCGGCCTGCGCGGCTGCCACCTGCACCGTCTGGACCGCAACGCCTTCCGCCAGCAGCAAGGCCACCTCCGCAGCCTGGACCTGGCTGACAACCGACTGGCCGAGGACTACCACGAGGCAGCCGCCGCCCTGCACACTCTGCCGCACCTGCAGACGCTCGACCTGTCCGGGAACTCCCTGACGGAAGACATGGCGGCCGTCCTGCTGCACAACCTGTCGTCGCTGGAGGCCGTGTCTCTGGCCAGGAACACGCTCATGAGGCTGGACGAGTCGGTCTTCGAGGGCCTGGAGCGTCTCCGGGAACTGGATCTACAGAGAAACTACATCTTCGAGATCGAAGGCGCCGCCTTTGACGGCCTGCCGGGGCTCCAGCGTCTCCACCTGGCCTACAACAACCTGCCGTGCATCGTGGACTTCCGCCTCACGCAGCTGCGCTTCCTCAACGTCAGTTACAACGGCCTTGAGTGGTTCCTGGCGTCGAGGACCGAGGCCACCTTCGAGCTGGAGACGCTGGACCTGTCCCACAACCAGCTGCTCTTCTTCCCGCTGCTGCCCCAGTGCCCCAAGCTGCGCACACTGCTGCTGCGGGACAACAACATGGGCTTCTACCGGGACCTATATAACACCTCATCACCTCAGGAGATGGTGGCCCAGTTCCTCCTGGTGGACGGCAACGTGACCAACGTGACCACCGTCAGCCTCTGGGACGAGTTCTCTGCCAACAGCCTCCCGGACCTCCGTCTCCTGGACCTGAGCCAGAATCAGTTCCAGTACCTGCCCGAAGGCTTCCTGAGGCAAATGCCTGCCCTCGCCCACCTCAACCTCAACCGGAACTGCCTGACCACGCTCCACATCCAGGAGCAGGAGCCCCCCGGGGCGCTCACCGAGCTGGATCTGAGCCACAACCAGCTGTCGCAGCTGCACCTGACGCCCGGGCCCAGTGGCTGCCTGAGAAACCTCCGCTCCTTCAATTTGAGCTCCAATCAGCTCCTGGACGTGCCCTCCGGCCTTTTTGCCAATGCCAGCAGCATCACTACAATCGACATGAGCCACAATCGAATCTCACTGTGTCCCGGGGCTGGCCCATCCAGCTGTGTGGATTTCAGGAATCTCACCTCTCTGAGGAGCCTCTCTCTGGAGGACTGCGGGCTGGACACGTTGCGGGACTGCCCATTCCAAGGGACACCCCTTACGCACTTGGACCTGTCCAGCAACTGGGGTGTTCTAAACGGGGGTATCAGCCCACTGCGGGATGTTGCCCCCATGCTGCAGGTCCTGGCCCTCAGGGATGTGGGCCTCAGTTCCAGTTTGACCCAGTTGGACTTCTCCGGGTTTGGGCACTTGCAGAACCTGGATTTGGCAGGAAACGCCTTGACCAGCTTCCCGAGGCTAGGGGGCAGCCTGCCCCTGCAGACCCTGGATCTGCGCAGGAACCGACTCACAGCCCTGCCCCACAAGGCTGTGTCTGAGCAGCTCCCTCAGAGTCTGCGGATCATCTACCTCAGTCACAATCCCTATGACTGCTGCCTGGTGGAGGGCTGGGACGCCCTGCAGCACCTGGGCGTCGTGGCTGACGCAGCCTCCATCACCTGCAACCTGTCCTCCAGGGTCATTCGTGTGCTGGAGCTGCCCGGTAGTGTGTGGCATGACTGTAAGTGGGAGCAGGTGGACACGGGCCTCCTCTACCTTGTGCTCATCCTGCCCAGCTGCCTCACCCTGCTGGTGGCCTGCACTGTCATCTTCCTCACCTTTAAGAAACCTCTGTTCCTACTGATCAAGACCCGCTGCCGCTGGTCCTCTGTGTACTGACTCAGGGGCAAGCCTGGGTTTGCTACTGGGCCTGGGCAGCTGAGGACATCTCTGGGCTGGACTGGGGGCTCTCCATGCAGAGGCTAGTGTGATAAGCCAGGGTTTAAATTAAACTGGAAAATGGTTCCATCCCTTAGCCTCTGCCTCCCCCTCCACCTATAAGTTTTTATCTCATTTTGATGGTTCAGCCTCATCATTCTGGTCAAATATTTATTAAATGACACTGTATAAAAATAAAAGACAATGGTCTCATATA
>XM_043331653.1 Rhizoctonia solani uncharacterized protein (RhiXN_11838), partial mRNA 
ATGTCTCGCCTCGCCGCTGTGGCCTTTATTCTTCTTTCACTCAGCTTCCTTGCTCATGCCTCGCCCATCGCCGCCCCTGCTCCAGAGCCCGAGCCTGGGAAGAAAATTGTTGCGATTGAGGAGCGCGCTGGAAGCCATTGCTACGGGGGATATTGCTACGGTGGTCTAGACCTTGTGACTCTACTCTTGCAACTCCAGGCTGCGATTGAAATCAAGCTTGGGTTGCTTGATGGATGTCTACACGGCGGAGATTACAAGGCGATTATCCTTGAGATTGAAGCGCTGTTGTATGCTGCTATTGGTGCTGTCCGAGGCTACAAAATTGGTCTTCTTGGGCTTCTCACTGGCAAGATTCTGGTCATCGCTAAAATCTGGTTTGCTATCGTGATTTCTATTGCTACTCACTGTGGAAAATGGGCAGGCCACGCAGATTTTGAGATCTTCCTGGTTCTTATCGTCAAACTTGATCTTGCCCTTAAGCTCTTGCTCCTTGCCATCATTAATCTCGGCGGTATTCTCAGTGGCTTGCTTAGCATCATTATCGGCTTGTTTGCGAAGGTTCATATTGCTCTACTAATCAAAGTCAAGTTCTTCCTGTGCCTTGGCGCTCTGAGACTCGGCGGCTACTAA
>XM_039822988.1 PREDICTED: Perca fluviatilis glucosidase 2 subunit beta-like (LOC120573318), transcript variant X6, mRNA 
TTTCAGGAAGTCAGGACATGGCCAGTTTAAATGTTGGATGTCATGAGTTTGAAACACCTTTGAGCGGGTTTTTGCGAGGCAGGAGGCAGACAATTTACAATTATGTCATCTGACATGCATTTCCATATTATTATCGCCGCTGTCTTTTGGTGTGGTTTCGTAGACTCGCGGAAAATAAGAGGGATATCTTCGTCCTGTCCTTATCTTCAACACAGACAACATGTTGCAAGTTCCTATCAAGTTGCCATCGCTGCAGATGACAAGCGGTTCTACAGGGAGAGGAAGTCTTTTCTGTGCATTGATGGGTCGAAGATCATCCCATTTGAGCAGGTGAACGATGACTACTGCGACTGTGAAGATGGCTCTGATGAACCTGGCACCTCAGCCTGTCCTCGTGGCCGATTCTACTGCACCAATCTGGGTTTCCGCCCACACTACATCCCATCATCGCGAGTCAATGATGGCATCTGTGATTGCTGCGATGCCTCCGATGAATACAACAGCCACGCTCACTGCCAGAACACTTGCTGGAATCTGGGACAGAGAGAGAGAGCATACGTGGAGGGCCAGATGAGGACCTTGGACGAGGGTTTGCAACTCAAGCAGCAACTGATTGAGGAAGGAGTACTGCTCTGGAGGGAGAAACAGGCCCAGCTCAGAGAGCTTCAGCAAGTAGCTGAGGACCTACAGATCAAATTAGAGGAACACAGAAGGAAGAAACATGAGGCCGACCGACTCAAAGAGCAAACTATAAAGGCGCTGGAAGCAGGGGGCAGCAGTCTCAGACGTCAAAACAGGACAGTATCAAGTACTTTCAAGCTACTGGACAGCAATAAAGATGGCAGTATAACAGTGGATGAAGTCCAGGCAAAAGTGGCACTCGTCCATGATGAAGAGCAGGTTCTCTCTGAGGATGAAGCAGTGGCTTTGTTGGGCGGAGGCCATCAGATGGATCTCACCAAGTTTCAGTACACTCTCTGGGACATCCTGACAAAAGGAGACCATGTCAAGATCAAAGACACCCGTGGTGCACCAGGCAGTCTTGTGGGTGAAGATCCTCACTTAAAGGCAGCTGATACAGATATCATGACCCGGTTACTCAAGATAATCCACAGACCTGGTTGTGGGCAGATTAATTTAGGAAACTATTTTCTTTCTACCGAACTCCACCCGCCAAACGTACCACGGTGCAGAAGGAAGCATACTTATGGACTAGCGGCTACTCCTCTTTGGCTGAGCTGTAACGTTGCTTACTGATAATGCTAGCTGACGTGAGCTAGCTTACGCTACAGCTCTGCAGGGAAGGACGCCATAGATGTTTACATCTCGCGCTTTCACAAGCACAAGCCTCTCGTCCATTAGTACTCTTCCTTGTCGAAAAATTAATCTAAAACATTTAGAAGATAACTTATGATGGACACTATTTTTAAACAAGTGTAAAGTTTATGTGATTATTGCATGTTTTAAAGAAGAAAATGAGACAGTCCTGTTAAAATTTTGGTGGAGGGGGTGGTGGTGGTTGCAGTCTTTTTTAATACCACCACTAGACGGTGCCAAAGTCAGAAATGTACACATCCTAAATAGTAGCTTTAACTTATTATTAAATACTTACTTATTTACACACAATTTGTTTAGCTTTTTGTATTAAGTGGATTTTGGAAATATATATATATATATAAAAAAAAGGTGCAGACCCAGAGGGGACTGAAATGTTAGTTTTCATAATAAATGGTGATGCTAGAGCAAGAGTAGAGTGTGAGATTTTTCTTTTCTTTGTTCAAGTTTGTGAT
>XM_017639444.1 PREDICTED: Rhagoletis zephyria uncharacterized LOC108383066 (LOC108383066), partial mRNA 
ATGGAGCAATTGGAGAAGGAATTTGCTGACTTCTTCGGCGAATGTAAGCAGCAAGGATTTACCTCCAAAGAAATGCGTGCCATATGTCAGCCGCTGTTGCATCGTCGCAACAACAGATGTTACGTGTTACTGGGCGTCTTGTTGGCTATGATGGCCGCCTTTTATTTACTCTATAACTGGTCCGAAGAATTTAGTTGGTTTGTTAGCGCCATTGGACGTTTGGTGTTGCTACAGCTGTTGCCCTACTGGAATTGGACGCCTCTATATAGTAGCCGGTGTCTAATTGAGCGTGCGGTAGATAAAAACGGTGCGCAGAGTGCAACTTCAACAACGAAAGCCTTGGGCCGTTATGAGACTGAAGCTGAAAATTGCGTACTTTGCGAGACGCTTG
>XM_047907316.1 Fulvia fulva Putative ariadne-like RING finger protein (CLAFUR5_08168), partial mRNA 
ATGGCCAACAGCTCGGAAAAAGAGGTTGTGGACCTCCTCATACTGGTTGACGCCACGGCGTCTATGACCAGCTATCTCCAAGCACTGAAGCAATCACTACCACAAATCATCTCTATTTCAGCCCTGACGAACTGCTTTGATCGCATCGGCATACTAGCGTATCGCGACTATGCCCACCGCGACCTCCTCGACTGGTCAGGCTGGACTTCTTGCGCTCAAATGCAGCAAGACGGCGGAGCCACCCTAATCGCCAAAGCAAACGCTCTGCACGCCGTTCGCGGGGAATCCGACGACCACCCTGAAGCCGCGAAGACTGGCCTTGCTCAGGCATATGAGTACATGCGCACCGATGCAAAGACCCTCATGCTAGTCTACGCCGATGCGCCACCTCATATCGAAGGCCTTAAGACCCGTGCTCACAACGGAGACAAGGAGTTACAAGCCCTCTCTGATCCGCAGAGTTATGGCGGATACGGGCCACTCTTCGCGGATTGGGTCTCTGCTGCGAAGACCATGCGCGAGGGAGAGAAGAGGGTACAAGTCATGTCGATTCTACACTTCCCGTACCATCCACAGGATTCTGCCTATTTCGACTACCTAGCCACCATGACGCGAGGCGCTGCTATTCACTTGAACAACTCCCAGGCACGTACCATTTCTGAGGTCACGGTTGAGGTCTTGCTAGCTTGGATGGGTGTGAAGAAGGAGGGAGCTGGATCGGTCGCACTTCCTGCGAAGCTCTCCTGGTACGTGGACACAGATATCGGAAAAGTGAAAGCAGAAGGCGAGCTCGCTGCTTTCCTCCCGTTTGGAGATGTGATTGCATCTCAACGGCTAGCTCTCACATCCGAGCTTCTCGAACAACGACTGCCAAAGAAGGCGACTCCGCTAAAGGACTTTGCACGGTCTTATAAGGAAGATGCAGCGTATCGAGACATCGTTACCACGCATCTCCGCGCTATTATTGAGAGCGATGTGGCTGCTATGAGCTTGAATCCTGTCTTTGGTTCTCTTTGGCGGACCTTCTGTAATGATAAGGAAAACCCTCATGGGCAAGACCTCCTGGATCTGTTCGGGCTGAAAGTCAACGGTCTCGCGTACGCGGATGACCGAGCGAAGATGAAGACCTGGCTGGAAGAGTCTTACGACTATACTGCAGAGGTTCTCGAGGCTATCGCTAAGGTGCCAAAGGGGTTGCAGTATCCATGCGTATGCTTGGATCCAACGCTGTCGTATGAGTTGGCGCCTCAAGCCGAGGACGAGGACAGCGAAGACAACCGCCCCATCACTTCCTTCCGGCGGGATGAGCTCCTAGAGCTGGGACGATCTTGTGATTACCGTATCCTGCGACGCTTAGGACGAGTGCTTACCCGACTGACATTTGTCGAGTCTGCTGATGCGATGCCAGGTCACATTGCTGCCGCTGGACAGGAGACTGTGACCAGGATCCCTATGGCATTGGTCCGAAAGGAGTATGGCCGCAAGTTCTGGCGGATTCTCCTACATATCGTGGTCCCGGGTACTATGCTCTCCGGTCGCGCTGCTGCATTGCTTGGAGCTCTCACTATCCGGATGGGAGTACAGCCCCTGAGACGTGCTGCTGAGGAAATTCCTGAGACGTGGAATGTCAGCTGTCTGTCCCTGATTCTTGATGCTGATAAGGCTTATACTGAGCACTATAATGACGGCTTCATGGGAAGTGAGGCTGGCTTGCTCTGGGACCAGGATCGGGAGCTGTTCAGGCGCCTCGTGGATTACAAGATGTTGGAGCTTAATCTTGATACAACGCTGCACGCTCAAGTAGCCTGGACGCCTCACAAGACGACTATGTCTCTCGGTCCTACCATCATGTGCAAGCTATGCCAGTACCATCGATCAGTGACTGGCATGGGACCAGAAAACATTTGTGGACTGTGCTGCTACAATCGTGACAATCCCAATGCCACTGATCAAGCCAATATCCATTGCCACACTGCAGACGCTGATGGCGAAGCGGAGAACATATACTGGTACGAATGCAGCGCTAAGCACTGTCGAGCCCAGTACATCGTCCACGAAGCCGACAGGCTGAACGTGCGACCAAAGTGTCATTACTGCCGCATGGGAGAAACCGCTCCGATACTAGAATGCTCCAAGTGTCTCAACGGAATGATCAGGCCGCTGGAGTATCGACACGGCCTGGACGAAGCAACCTTTACTTGTGTAGGCTGCTCACAGGGACGCCAGACAATCATCGATATTTATGAGCATATGAACGAGGCGCATGGAGGGTACTATGGTGATTTGGAGGATGATGAGGACGGGGAATAG
>LN871451.1 Bacillus licheniformis partial 16S rRNA gene, strain IRQBAS20 
TCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGGGAAGAACAAGTACCGTTCGAATAGGGCGGTACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGAGGGTTTCCGCCCTTTAGTGCTGCAGCAAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGACAACCCTAGAGATAGGGCTTCCCCTTCGGGGGCAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATCTTAGTTGCCAGCATTCAGTTGGGCACTCTAAGGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGGCAGAACAAAGGGCAGCGAAGCCGCGAGGCTAAGCCAATCCCACAAATCTGTTCTCAGTTCGGATCGCAGTCTGCAACTCGACTGCGTGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGAGGTAACCTTTGGAGCCAGCCGCCGAATGATGATATGAAATC
>OP114738.1 Raoultella ornithinolytica strain X13 16S ribosomal RNA gene, partial sequence 
TGCAAGTCGAGCGGTAGCACAGAGAGCTTGCTCTCGGGTGACGAGCGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGTGGGGGACCTTCGGGCCTCATGCCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAATGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGAAGGCGTTAAGGTTAATAACCTTAGCGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTTGAAACTGGCAGGCTTGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGTCGACTTGGAGGTTGTTCCCTTGAGGAGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAACTTAGCAGAGATGCTTTGGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGATTCGGTCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCATATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTATGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTAGATCAGAATGCTACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTACCAC
>XM_021864905.1 PREDICTED: Chenopodium quinoa outer envelope protein 61-like (LOC110688195), transcript variant X2, mRNA 
TAAGAGTCCTAGTCCTAATTCAAGTGTGGTTGGCGTCTTGGCGACCCACCTTATTTATTTCCAACAAAATTAAAATTATAAATTCTAATTCTTCACCTCTTTCCTCTATTTAACTTCACAATTATCACCGAATTTCCCTAACTGTTTAATTCTCTCTCTTCAATTTTGCATCCATCGCAATTAATCAATCCCTAGATTCTACGAATTTCTGCTTCGATTTGATCTCAATTGTAACTTATTGATTTTGAAACCCTAATCAATCGAAGGATTTTGCCAGATGTTTAACGGTATGATGGATCCTGAGTTGTTTCGGATTGCGCAAGAACAGATGAGTCGCATGTCTCCTGCTGAGATGGCTAAGATCCAACAGCAGATGATGTCTAATCCGGAATTGCTTAAGATGGCTTCGGAAGGTATGAAGAATATGAGACCTGAGGATCTAAAGATGGCTGCAGAGCAAATGAAGAATGTACGTCCTGAAGAAATGGCTCAGATTGGTGAGAAGATGGCTAATTCATCCCCGGAAGAAATTGCATCAATGCGTGCACGTGCTGATGCTCAATTAGTCTACGAGTTAGATGCAGCTGAATTACTAAAGAAACAGGGAAATGACCTTCACAAACAGGGGAAGTATCATGACGCTGCACAGAAATACTTGCGGGCAAAGAACAACCTACAAGGGGCTCCAGTTGCCAGAAGTAGAGCATTGCAGTTGGCATGCTCACTTAATCTGATGACATGTTATTTGAAAACAAGACAATTTCATGACTGTGTCAAAGAAGGCAGTGAGGTTTTGGCCTATGATGAAAAGAATGTCAAGGCCTTGTACCGTAGGGGTCAAGCATACAAAGAATTAGGTCAATTAGAGGTTGCTGCTTCTGACCTGACAAGGGCACTTGAAGTTACCCCTGGTGATGACACAATTGCTGAAGTTTTAAGGGAGGTCAAAGAAAGTCTAGGAAAAGAAGGTGTCACACGAACTTCGACAGTTGCAAATGGTAAGAGAACGTCTCAAGATTGTTCAGTTACTCAACCTGAGGAAAGCAGTGGGCATTCTAAATATCAATCAGAAACTGTTAGTAAGAGACCAACGACAGAATCAGAATGTTTGCAGGCAATGAAGGATGATCCAGACACAATCAGATCTTTCCAGAATTTCATTTCCGAAACTGATCCTGAGGTTCTAGCCAGAATGAATATTGGAAACAACAGAGAGGTTCCTGCTGACATGCTGAAGACAGCATCAAATATGATTGGACGAATGTCTCCTGAGGAGCTCCAAAATATGGTGAAAATGGCCTCCTCATTTAAGGGTGATAATTCACCCTTTAATGGTAACTTTGGACCGGGCTCAGTTCCTCCAAATTTGTCACCTGAAATGCTGAAAACAGCTAGTGATATGATGGGTAAAATGTCACCTGAGGAAGTTCAAAGGATGTTTGAGATGGCTTCCTCTTTGAAGCAGGACTCAGTTCCTAGCTCATCAGGTTCGTCAAGTGGCAGATCGAGTTTGGAGTCTGGTTCAAAGTTCACTGCAACTCGGGGTGTACCTGTTGATAGAAATAATGTTATTGGTGAGAGGAGCAGTATTTCTGGCTCATATTCTAATCCTGGAAGTACTTCCCAATCAAGTTTTCCTACATCAATGGGTGATATGCAAGAACAGATGAGAAATCAAATGAAGGATCCTGCCATGCGACAAATGTTTTCGTCGATGATGAAAAATATGAGCCCCGATATGATGGCCAGCATGAGTGAGCAATTTGGACTCAAGCTTTCTAAAGAAGACGCTGCAAAAGCTCAAGAAGCCATGTCGTCATTGTCACCTGAAGACCTAGATAAAATGATGCGTTGGGCAGATAGAATTCAAAGAGGAGTAGAAGGTGCGAAGAAGACAAAGAACTGGCTACTGGGAAGACCGGGGATGATTATAGCCGTATGCATGCTTCTTCTGGCTGTTATCCTTCACTTTTTCGGCTTCATTGGTAGGTGATTTTTCAGGACAGTAAGATAAATCTCCTGTTATAACAGCTTGTACTTGCTGATATCAGCAAATCCAGGGCCGAACTTATGGTGTTCAAGGGGTGTGTAAATC
>XM_028853279.1 PREDICTED: Macaca mulatta estrogen related receptor gamma (ESRRG), transcript variant X13, mRNA 
GGAAGCTTGTACTGAAATATATACAAATAATTAAGAATACTTTTAGTGCACTGTTTAGTAATGCTCTCCCTACAAAAAAAAAAAAAAAATGCTCTCTTTATTTTGTCAAAATGCATTGAGAGAGATTTAATTCGCTATTTACCCCCACAACCCTCAGTCTCCCCACCCCTAAAACTGAAGAAGCCAATTTGTCCTGCGGTTGTTTACCTTTGTTTTGAAAAGCTATGCGTTGTATCTACACGTAAAGAGACAGTCGCAGGTATAGAAAGGTTTACACATATAATTTACTTAGGCATTCTCTCAAATTGTATTGTCACTGTTTCCTCTTCTGTAGTTGTGTAAAACTGCATTCCACCTCAGAGATGACGATCCCAGTTCACATGCTCAAACAATTTAGAAGAATGTCTTTATTATTATTATTTTTAATGCCCAGCATACATCAGGAAAACAGGAAAAGACATGATTAGGAATACATGAGAAAGTACAGCACCAAATAAACAGCAGCCCCCGGTGTAATCAAAACACAGACAACGGCAGGACAAACTTAATTCTCTACCTTCCGCAGAATCCTTTCCCAAATTAACTGAGAGTCTGCGTGAGTTCTCCTTTTCAAGGCAAAAGAGATCTTAGGTTAGAAATCAAAGGCAAATCCCTCCAGTGCTTAGAGAGTTAAGTTAGTTATGTTTCTTTTGTAGCTTCCCAGAAGAAAAAAAAAAAGAGAGAGAGAGAGAGAAGGGAGGAAAAAAAAAAAATCAAACCCGAGAGTGTGTATTGGGAGCGTTTCAACCGCTCCCTTCTCCGCTCCCTTTTTCTCTGCCCACTCTCAGTTTCCAGCCCCCTTCGGCTCTCTGCACCCTGCCTACCTGCCTGGCTCCTCTCGCTCCGTGCAGCCTCCCGTCGCCTCCCTCCTGATTGGGCAGAGGCCCCCCAATCGGCTGCGCGGCTGGGCCGGTGGGACTGCATATGTAAAGCCCTACTTCATATTAATAAGCTCCAATCGGGGCTTTAAGTCCTTGATTAGGAGAGTGTGAGAGCTTTGGTCCCAACTGGCTGTGCCTATAGGCTTGTCACTAGGAGAACATTTGTGTTAATTGCACTGTGCTCTGTCAAGGAAACTTTGATTTATAGCTGGGGTGCACAAATAATGGTTGCCGGTCGCACATGGATTCGGTAGAACTTTGCCTTCCTGAATCTTTTCCCCTGCACTACGAGGAAGAGCTTCTCTGCAGAATGTCAAACAAAGATCGACACATTGATTCCAGCTGTTCGTCCTTCATCAAGACGGAACCTTCCAGCCCGGCCTCCCTGACGGACAGCGTCAACCACCACAGCCCTGGTGGCTCATCAGACGCCAGTGGGAGCTACAGTTCAACCATGAATGGCCATCAGAACGGACTTGACTCGCCACCTCTCTACCCTTCTGCTCCTATCCTGGGAGGTAGTGGTCCTGTCAGGAAACTGTATGATGACTGCTCCAGCACTATCGTTGAAGATCCCCAGACCAAGTGTGAATACATGCTCAACTCGATGCCCAAGAGACTGTGTTTAGTGTGTGGTGACATCGCTTCTGGGTACCACTATGGGGTAGCGTCATGTGAAGCCTGCAAGGCGTTCTTCAAGAGGACAATTCAAGGGGTGCGTCTTGACAGAGTACGTGGAGGTCGGCAGAAGTACAAGCGCAGAATAGATGCGGAGAACAGCCCATACCTGAACCCTCAGCTGGTTCAGCCAGCCAAAAAGCCATTGCTCTGGTCTGATCCTGCAGATAACAAGATTGTCTCACATTTGTTGGTGGCTGAACCGGAGAAGATCTATGCCATGCCTGACCCTACTGTCCCCGACAGTGACATCAAAGCCCTCACTACACTGTGTGACTTGGCCGACCGAGAGTTGGTGGTTATCATTGGATGGGCGAAGCATATTCCAGGCTTCTCCACGCTGTCCCTGGCAGACCAGATGAGCCTTCTGCAGAGTGCTTGGATGGAAATTTTGATCCTTGGTGTCGTATACCGGTCTCTTTCGTTTGAGGATGAACTTGTCTATGCAGACGATTATATAATGGACGAAGACCAGTCCAAATTAGCAGGCCTTCTTGATCTAAATAATGCTATCCTGCAGCTGGTAAAGAAATACAAGAGCATGAAGCTGGAGAAAGAAGAATTTGTCACCCTCAAAGCTATAGCTCTTGCTAATTCAGACTCCATGCACATAGAAGATGTTGAAGCCGTTCAGAAGCTTCAGGATGTCTTACATGAGGCGCTGCAGGATTATGAAGCTGGCCAGCACATGGAAGACCCTCGTCGAGCTGGCAAGATGCTGATGACACTGCCACTGCTGAGGCAGACCTCTACCAAGGCCGTGCAGCATTTCTACAACATCAAACTAGAAGGCAAAGTCCCCATGCACAAACTTTTTTTGGAAATGCTGGAGGCCAAGGTCTGACTAAAAGCTCCCTGGGCCTTCCCATCCTTCATGCTGAAAAAGGGAAAATAAACCCAAGAGTGACGTCAAAGAAACTTAGAGTTTAGTTAACAACATCAAAAATCAACAGACTGCACTGACAATTTAGCAGCAAGACTATGAAGCAGCTTTCAGATTCCTCCATAGCTTCCTGATGAGTTTCTTTCTACTTTCTCCATCATCTTCTTTCCTCTTCCTTCCCACATTTCTCTTCCTGTTTATTTTTTCTCCCTTTCTTCTTTCCCCCTCCCTTATTTCTTTGCTTCTTTCATTCCTAGTTCCCATTCTCCTTTATTTTCTTCCCATCTGCCTGCCTGCCTTCTTTCTTTTCTTTGCTGCTCTCGTTCCTCTCTTTACTCATCTTCCTCCTGTTTTCTAAATTTTAAATAGCTTTAGTTGTAAAAAAAAAAAAAAAATCCTTCCTTCCCCCTTTCCTTTCTCTTTCTTCCCTTTTTTCCTTTTTCCCTTTCCCCTTTGCCCTTTCCCCTTTCCTTTCCTTCTGATCTTCTTTCCATCTTTCTTTTTCTTCCTTCTGCTGCTGAACTTTTAAAAGAGGTCTCTAACTGAAAAGAGATGGAAGCCAGCCCTGCCAAAGGATGGAGATCCATAATATGGATGCCAGTGAACTTATTGTGAACCATACCGTCCCCAGTGACTAAGGAATCAAAGAGAGAGAACCAACGTACCTAAAAGTACAGTGCAACATATACGAATTGACTGAGTGCAGTATTAGATTTCATGGGAGCAGCCTCTAATTAGACAACTTAAGCAACGTTGCATCGGCTGCTTCTTATCATTGCTTTTCCATCTAGATCAGTTACAGCCATTTGATTCCTTAATTGTTTTTTCAAGTCTTCCAGGTATTTGTTAGTTTAGCTACTATGTAACTTTTTCAGGGAATAGTTTAAGCTTTATTCATTCATGCAATACTAAAGAGAAATAAGAATACTGCAATTTTGTGCTGGCTTTGAACAATTATGAACAATAATGAAGGACAAATGAATCCTGAAGGAAGATTTTTAAAAATGTTTTGTTTCTTCTTACAAATGGAGATTTTTTTGTACCAGCTTTACCACTTTTCAGCCATTTATTAATATGGGAATTTAACTTACTCAAGCAATAGTTGAAGGGAAGGTGCATATTATCACGGATGCAATTTATGTTGTGTGCCAGTCTGGTCCCAAACATCAGTTTCTTAACATGAGCTCCAGTTTACCTAAATGTTCACTGACACAAAGGATTAGATTACACCTACAGTGACTCTGAGTAGTCACACATATAAGCACTGCACATGAGATATAGATCCGTAGAATTATCAGGAGTGCACCTCTCTACTTGGGAGGTACAGTTGCCATATGATTTCTAGCTGCCACGGTGGTTAGGAATGTGATACTGCCTGTTTGCAAAGTTACAGACCTTGTCTCAGAAGGAGCTGTGAGCCAGTATTCATTTAAGAGGCAATAAGGCAAATGCCAGAATTTAAAAAAAAAAAAAAAATCATCAAAGACAGAAAACGCCTGACCAAATTCTAAAACCTAATCCATATAAGTTTATTCATTTAGGAATGTTTGTTTAAATTAATCTGCAGTTTTTACCAAGAGCTAAGCCAATATATGTGCTTTTCAACCAGTATTGTCACAGCATGAAAGTCAGTCAGGTTCCAGACTGTTAAGAGGTGTAATCTAATGAAGAAATCAATTAGATGCCCCAAAATCTACAGTCGCTGAATAACCAATAAACAGTAACCTCCATCAAATGCTATACCAATGGACCAGTGTTAGTAGCTGCTCCCTGTACTATGTGAACAGTCTTATTCTATGTACACAGATGTAATTAAAATTGTAATCCTAACAAACAAAAGAAATGTAGTTCAGCTTTTCAATGTTTCATGTTTGCTGTGCTTTTCTGAATTTTATGTTGCATTCAAAGACTGTTGTCTTGTTCTTGTGGTGTTTGGATTCTTGTGGTGTGTGCTTTTAGACACAGGGTAGAATTAGAGACAATATTGGATGTACAATTCCTCAGGAGACTACAGTAGTATATTCTATTCCTTACCAGTAATAAGGTTCTTCCTAATAATTAATTAAGAGATTGAAACTCCAAACAAGTATTCATTATGAACAGATACACATCAAAATCATAATAATATTTTCAAAACAAGGAATAATTTCTCTAATGGTTTATTATAGAATACCAATGTATAGCTTAGAAATAAAACTTTGAATATTTCAAGAATATAGATAAGTCTAATTTTTAAATGCTGTATATATGGCTTTTGCTCAATCATCTCTCAGATGTTGTTATTAACTCGCTCTGTGTTGTTGCAAAACTTTTTGGTGCAGATTCGTTTCCAAAACTATTGCTACTTTGTGTGCTTTAAACAAAATACCTTGGGTTGATGAAACATCAACCCAGTGCTAGGAATACTGTGTATCTATCATTAGCTATATGGGACTATATTGTAGATTGTGGTTTCTCAGTAGAGAAGTGACTGTAGTGTGATTCTAGATAAATCATCATTAGCAATTCATTCAGATGGTCAATAACTTGAAATTTATAGCTGTGATAGGAGTTCAGAAATTGGCACATCCCTTTAAAAATAACAACAGAAAATACAACTCCTGGGAAAAAAGGTGCTGATTCTATAAGATTATTTATATATGTAAGTGTTTAAAAAGATTATTTTCCAGAAAGTTTGTGCAGGGTTTAAGTTGCTACTATTCAACTACACTATATATAAATAAAATATATACAATATATACATTGTTTTCACTGTATCACATTGAAGTACTTGGGCTTCAGAAGTAAGAGCCAACCAACTGAAAACCTGAGATGGAGATATGTTCAAAGAATGAGATACAATTTTGTAGTTTTCAGTGTAACTCTCGGCATTTCAAAAGAGTAAGTATCTCACAAATAGGAAATACAACTAAAACGTAGATTTAAAAAGAACTGCACGGGCTTTAGGGTAATTGCTCATCTTAAACCTCACTAGAGGGAAGTCTTTTCAAGTTTCAAGCAAGACCATTTACTTAATGTGAAGTTTTGGAAAGTTATAAAGGTGTATGTTTTAGCCATATGATTTTAATTTTAATTTTGCTTCTTTTAGGTTCGTTCTTATTTAAAGCAATATGATTGTGTGACTCCTTGTAGTTGCACTTGTGTTTCAATCAGATCAGATTGTTGTATTTATTCCACTATTTTGCATTTAAATGATAACATAAAAGATATAAAAAATTTAAAACTGCTATTTTTCTTATAGAAGAGAAAATGGGTGTTGGTGATTGTATTTTAATTATTTAAGCGTCTCTGTTTACCTGCCTAGGAAAACATTTTATGGCAGTCTTATGTGCAAAGATCGTAAAAGGACAAAAAATTTAAACTGCTTCTAATAATCCAGGAGTTGCATTATAGCCAGTAGTAAAAATAATAATAATAATAATAATAATAATAAAACCATGTCTATAGCTGTAGATGGGCTCCACATCTGTAAAGCAATCAATTGTATATTTTTGTGATGTGTACCATACTGTGTGCTCCAGCAAATGTCCATTTGTGTAAATGTATTTATTTTATATTGTATATATTGTTAAATGCAAAAAGGAGATATGATTCTGTAACTCCAATCAGTTCAGATGTGTAACTCAAATTATTATGCCTTTCAGGATGATGGTAGAGCAATATTAAACAAGCTTCCACTTTTGACTGCT
>AF377161.1 Rhizopogon sp. AHF133 internal transcribed spacer 1, partial sequence; 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
TCCGTAGGTGAACCTGCGGAAGGATCATTAACGAATATAATTCGAGGGGTTGTCGCTGGCCTCGCTCGCGCGAGGCATGTGCACGCTTCTCGTTTTTCTCTCAACTCACCTGTGCACCTAATGTAGGATGCCTCTCCTCCGGGAGGGGGGACCTATGTCTTCGTAACATCTTCGTGTAGAAAGTCTTTGAATGTTTACTATCATCGAGTCGCGACTTCTAGGAGACGCGATTCTTTGAGATAAAAGTTATTACAACTTTCAGCAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGCGAAAAGCGATATGTAATGTGAATTGCAGATCTACAGTGAATCATCGAATCTTTGAACGCACCTTGCGCTCCTCGGTGTTCCGAGGAGCATGCCTGTTTGAGTGTCAGTAAATTCTCAACCCCTCTCGATTAGCTTCGAGAGGGAGCTTGGATAGTGGAGGTTGCCGGAGACTTGGATTCGTCCGAGACTCGGGCTCTTCTGAAATGCATCGGCTTGCGGTCGACTTTTGACTATGTGCGACAAGGCTTTCGGCGTGATAATGATCGCCGTTCGCTGAAGCGCATGACTGAACGTCCCGTGCCTCTAATACGTCGACCGCTTATTATCTCTCCGGAGAGAACAGGGTCTTCCTTATTGACTTTGACCTCAAATCAGGTAGGACTACCC
>XM_023987877.2 PREDICTED: Salvelinus alpinus transmembrane protein 88-like (LOC111964137), mRNA 
AGACAGACAGGAGACAGACAGGAGACAGAGGGGAGACAGACAGGAGACAGACAGGAGACAGAGGGGAGACTCAGTGACTAACCAAACTGGAATGAAAGTGAGGAAACAGCACGGCAGGAAAGGAAGAGTCAGAGCCAAACAGAAAAGCAATATTTGCCTTAACTGTGCAGAGCGTAGAATTTAACACAAAGCAAAGGGGAAAGAGAGTGACACCGACTGAGACCTTTGCAGACACAAAGCATCTGCTGAATACCTGGAGTTTCAGAAACACCAGGATATATCAGAGAATGACAAAGGTCTAAACTCTCATCATCAGGGTATAAACCTCCACCTGGTCAATGTCATCAGTCTGACCTCAGGATCTGGATGTTCATGTCGTGGAGACCTACCTCTTCTTCTCTCGACGCGCATTCTCAGAGAAGGAAGACAGGTTAAAGAATAGAGTGTATTCACATCTTCTCTTACTGCTACTGTGAGAGGCGAGAGACAGAGAGACAAATCCTCAGAACTGCTCCACCAATCACAAAGCCTAGGGAGGATGAGTCTGCCGAGGAACCAGACCCTGGAGAACGGCATCACCAAGCTGCATCACATTAACAATGGGGAACCTCTGTCTTCACTGCAGTTCCACCTCCAGCACACAGGCTCTGTGACCTCTGTGCCWGGGTCGCCCACGGGGGGGTCAGGGGTGGTGGTGCCACCCCCGTACTCAGTAGCGGGCAGCGTGGCGGGGGCTACGGACGCCACTCTGGAGCTAAGAGGCTCTCTGGACTGCTGGGCGTGCTCAGTACTGGTGACGGCTCAGAACCTGATCATTGCCCTGGTCAACAGTACGCTGGTCAGTATTGTGTTCGGCACCATCATGACCCCAGCGCTGGTCATGGTCGTGTTTGGCTTCCTATGTCACTCTACGGTGCAACCCAATGGCACGTCCCTGTACTGTTCAGACCTGCTGGATGACGGTGGCTGTGTGGCCCTGCTGGTGGTGGGCTTCATCCTGGTCACCCCTCTCCTGGTCCTGGCTCTGGCTGCTTACTGCCGCCTGGCCCGCCACCTCCAACTGGGCCTCTGTTTCATCCCCTACAGCAGGGCCGTCTACAAGAACCTGCCTGCCTCGCGCCAACGTGGAGGAGGCTGCTGTGGCCAGCAGGGGGCCTCAGAGGGGGAGGGCAAAGGCAGTGTGTGGGTGTGAGGGGAGGGATATGTTGACCCTAACCACTGATGCAGGGTCAGATAACATTTTCTTGCCTCTTAAGGTTAAGGTTAGGATTGGGGATCAAGTAATCTGATCCTAGATCTGTAGATAGAGGCAACTTCTACCTTGAGCAGGGAGGGAAGGAATGTGAAGGAAGGGAGAAAACAGGGCATGAGGGTAGTAGGGAAAGTTGAGGTGTGGACACGTGGAGATGATGTTTATGGACACAGTTATAATATGCCTATGAGTCTTTTGGTGGGGGTGGTGTGGAGGTGGATCTTACAATACACTGGTTTGTAGATTGCAGAGAGCAAAGGTGAAGCTGTAAAAACACAAGTATGCTACATGAAGTACTATCAAATACCACTGTAACTACACTGCAATTATTTGTTATTATGTTTGTTTTTTATGTTGAATTATCCTGTACTATTATTAAATTATGTTTGTTTAGAATAAAATATTTCCATTA
>XR_003517021.2 PREDICTED: Zalophus californianus uncharacterized LOC113912871 (LOC113912871), transcript variant X2, ncRNA 
TAATGCTCCCCTCCTCCTCCCCTCTCCTCCTGGGCTCCTAGCCCGCCCGCTTGCCAGCCCGGGCGGCGGCGGGACCGCAGGGCCCCGTGCCTCGGCCTCTCCCCCGACGCCTGGCCCCCCCTCGCCGCCCAGTGGGACCGGGCGGGGGCGGGGTGGGGGGAGAGGGAGAAGGGTGCAGTTACGGAGGGGACCCGGGCAGACGCCGCGGCCACGCCTGGCACCCTGTGCCGGGCGGGTGGGGGTGGCGAGGGTGGCGGGGCCGGGGTCACCCGGAGGGGACGCGTCGGAGAGGGCCAGGCGGAACCAGCGCCCTGCCTAACCTGAGGGGGTGGCCCGGGGGTGTGCACCGCTGGACCTGATGTGGTCCTGAAGGCGTCCTTAAATTGTTAAAAATAGTCTCGCTGTATAGAGAAGAACACTGGAACCTTTTAAGTCCCCATCCCCTCGCCTGAGTCCGGAGTGAAACTCCAAACATACTTATTAAGAAACTGTTGCTTTATTTTGACTCGTTTACATAAATTTTCCACTTTGGGGGGATGGTGGTGGGCTTGTGGAATTCCTAAAATAACTTTTAATGGAGCGAAGCCTTCCATTATGGGAAGCGCCTAGACGCGAGAGGCGTCTGGAGGCCTAGGTTCCCGTCACAGCCCTGCCACCAACTGGCTGAGCGACTGAGGCACATCGCCGCCCCTCTCGGCCGGGGTTAGGAGAGTGGACGCCCCCTCCACCCCGAAAGGGGAGACCGGAGAGCTGTCTCAACCATTAATAATGAGACTGGGTTTTCCTTCCTTAAAATGTTCTGATAGTATGGAGAGGCAACTTGGAGATGAGAATAAAAATAAAAGAGGGAGCCATAACAGGTTTATGGCCCTGACCCGGGGAGGCCCTGCCCACCTTACCACCGAGGATCCGAGAAGCTGAGTACTGTGGACACCTGGGTGAAACAGCCATGAAGCTTTACTAACTGCTCTGCAGCCTGACTCACTTGGGGCGGGTCTACACCACAGTCTAAGTACAGCGAAGGAGGAAAGTGACTTCAAGCAAACTGAAAACCATTTGGAAGAAGAGACAGTAGGCACACAGTGTGACGAAGTCTGCGCTGGAGCTAGAAGGACGAGTATGCCCGCAGCTCTGTCCCGAACTGACCTCAAAGGGCCATCAGAGGACTGCCGTGAGGTGCAGCGAAGGGGACGCGGAGCCGCACGGGGATAAAACCACTCGCCCAGGGTCACCAGGCTAATGCTCCTTAAAGGTTCTTGTCTCAGTCATGTCCTCTAACCGGCTGGCTCACCAAGCTGCCGCTGTGACCAGGAGTTGTATTGTTTCCTTAA
>AJ288639.1 Centruroides exilicauda mitochondrial partial 16S rRNA gene, haplotype CexTE 
CCCCTCCTCTTGCGGAGTGGAGGAAATCTAATCCAACATCGAGGTCGCAAACATGTTTGTCAATTTGAGCTTTCAAAACACATTACGCTGTTATCCCTAAAGTAACTTATTTAACTTTCAAAAATTTTGGGTATTAAAATAATGTCATTTATATATTTTAAAAGTGTTTTTCTTCTTACCGCCCCAGTAAAACATATTTTTAATTTATTAAATTATTTTATGTAAAGCTTTATAGGGTCTTCTTGTCTAAAAGAAACATTTTAGCCTTTTTACTAAAAAGTAAATTTCAAAAGAAAAAGTCAAGAAAGAAACTTTCTAGTTTATCCTTTCATTCCAGTCTTAAATTACAAGACTA
>XM_012291159.1 PREDICTED: Megachile rotundata mucin-17-like (LOC100879044), transcript variant X1, mRNA 
GACCAGTGCACGCGACAAGAAGGAAGAAGCCGCGTGGCCCCAGGTGTTTTGAAATGAAACATTGGATCGGACTCTAAGAAGCTGCAAGAATGGCGCGGAGATTTTCGTGGTGCACGGCGGTGGCATTGGTGGTGCTGCTTTTCGTCACGACCGAAGGTCTTCGTGAACGTGGCACTCAGGTCGACGATCAGAAAACCGCAGGTCGAGGTACTCTGAGGTTCAACTCAAGATCGCTAGAGGAATCCACAACCGCTTCGCTCTCAAGATCCAGATCTCAAGACAGATCGCAGTCAAGAAAATCGAACTTCGAACGAAACGACAGAACAACCTCATCGAACTTCGAACGAAACGACAGAACAACCTCTCCGACCGACTCGGAGTCCACAACCAAACGTCCAAGCCCCACAGCGAGCGATGTGACCGAAATCCCCGCAAGAAGGACCACGGACCCGAACAGAAGAAACGGTAAAAGGTTCTCTCCAGAGAGGACGAGGTCGAAGGATGAAAACGCGATAGATTCCAAGGTCATATCTCGAAGGGTGTCGAACGGGAGATCCGACGGAGTCACGGAGAGGCTGGACAACACAGGGCCGTCGGTCTTCGCGTTGACGACGGAGTCCTCGAGGTCGAGGACCGGCAGGAAGATCCAGACGACGTTCTCCACGAAGGACCTGAAGACGCAGATACCCGCGTCGAGGAGGTATAATAAAAAATCGGAGAACGTAGAGGCGACTACAGTTTCCTTCAAAAGAGGCAGACCCACAACGGAGCGCAGTAGGTCCGGCAGGTCGAAGGTGAACAGGGAGAACTCTGTTGCTCGCAAAGGTCAAGAAGCCCTTTTGTACGAGTCTGAAAGCGTCAGAGTCGACATTCCTCTCGCAGTCGACGGAACAGAGAGTCCTTCCAGTGATCCAACGACCGTCGGCTTCGGTATCGTTTCCCAAAGAAGGTCGGACACCAAGGAGACTCTCAGGGGCAGGTCAGGAGCCGAGAGGAAGAGCAGAGGACGATCGAGCGACTCCGAAGCTGCCGGCTCCTCCAGAAACGGCTCCCGAAGAGGATCGTCCAGGTTCAACGACTTCTCCACCACGGAAGCTAACGAGGTTGGTTCGAGGAAAAGCTCTTCCAGGGATCGTTTGAAGGAAACTAGGAAGAGCGCTAGTGAATCGAGATCGAGATCTAGAGGTAGAGAACAGACGAAGAGTGCAGATGTGGATGTCAAACGAAAATCGGGAGACAGGAATTCTTTGGATAGGAGGTCCAGACTTTCCGAGGGAACTACGAGGTCGGTGGAAAGTCGCGGACAGGATCAGGATGCCAGGAGATCCAGGAGCAGAGCGAGGACGGAAACGACGCCTCTGGCTACGGATGTCACCACAACCGTCGCGCCAGAGACAACAGTCTTCACCGACTCGACGAGCACCGAGCCCGAAGTCTCCAGCACCACCCTTAAACCAACGACAACTTCAACCACAACCCGAAGCACGTCGCGATCATCTTCTACAACCGAAAGAAACCGAGGAAGAGGCAGAGGCAATCAAGGAAGAAAACTAAAGGAAGATTTCTTCAACCACGGACTCGGATTTCGAGGACGAAAGCCATCTCTGGATGCATCAAGCACCGGGGAGTCCAGAAGACCCACCCCCAAAAACGATTCCTACATAAACCCCGGTTGGACCCTCAGAAGACGACCACCTAACTTGAACTACTCCGACAACCTTCCACAAACGATCCCTTCGTCGAGAGACCAAACGAACGAAGTGATTCCTCAGAACGAGGTATCGACGAGCACCGAAATCGTAACTACGGTGGAAACCTCTACATCCACCGCGAGAAGAGGTTCTAAAAAGCTGCAGTCCACGGAGGAGAGCACTACGGAGATGGATGTTACTACGAAGAGTTTCAGAAGGGGTAATAAAACGTTCGAGAAGAATAGGAACGTTGCACCTGGGAAGCAGGAGCATGAAGAGAGCGACAACTATCCGCCGGAGTTTAAGGCCAGGTTGTCTCTGTTGAAGAGTACGAACACGAAAATACCAGCCCCGAAAACTACCTCTAGAACGCCATTGGAGGTGAAGAGATCGTCGGCCGCTCTGTTCGCCGAACGATCGAGGATGAAGCTGGAGCTGGCTAGGAGGTTAGTGAAGCCAGAGTTGAACATCGAGGAGAATGATCTCGACGCAACCACGGCCTCCTCTTTCAGCAAACCGAGGCCGACCGTGGCGTCGACGGTCGATGAGACGGCCAAGGTCGCCAAGTTCGTTAAACCGTCTGCGGGTCGCAGAACGTCCACGGAAAAGAGGTCTCGAGAAGACGAGAAGTCGAAAGTTTCCGCGAGGACAGGCGACGACTCCTCTAGGTTCGCTAGACCGAATTCGAAGAAAGGACGAATCATCTCCGAGAGAATGGTCACCTCGATCTCGGTGGAGGAAAGGGCTGCCGAACAAACCACCAAGCCATACTCGTCGAGTCAGTCGGTGGTCACCTTGTCCTCCGCTGAAGAGGGATCGGCGACCACCATAGACACCACGCGGATTCGCCTGTCCAGCGCTCGGAACGGAAAGAAATCCAAGGAGGAGACCTCGAAGAGACGCGAACACGACGACACCATTACCACTTTCAAACCGAAGAAGCCCTACGCGTATCAATCGCGCGTCACCAAATCGCAGGAACAATCTACGACCCCCGAAGAGAATCTAGTAACGTCCAAAAAGACCTACGCCTCGTCCAAACAGAACGGAGGGCAACGGAAGTTCCAAAGCTCCCGCGAAGAGGATGCGAGAAGAACCAAGTCCACGACAGTTACCAAACCCACCTTCAGACCCCGATACAGCAAACGAACGAAACCGAAATCGATCGACGACAAGTTGACAGACTACGAAGCGACGATCACCACGAAGGTACCTGTTGCTACCAGCAGGTACTCCAGGAAGAAGTCCGTGGTAAAGGCTACAGAGGGTAAATCGAAGACCACCACGGAAGGAGTAGCAACGCAGACGAAGAAGCTGGAGTTTCGTCCTAGAACCGCGACCTACAGAAGACACTCCGAGGTGCCGACGACCTTGGTGGAATCGAGTACCAAGGTTGAGGGTGCAGGAGTCGCCATCACTCCCAGATCGACCAAGTATTCCGCGACTCTGAAGACCTCGACAGAAAGCGCTCGATCGGTAGCGCAGGAACCGCAGGTTAACCTGAGGATCAGCAACGACACCGCGCAGGAAGCGGCTGGCATTACCGGCAGCAGTAACGGAGACACCGGCAGCAATATCTTCAATCCGACCAGAAGCACCATTCTCGCTGGAAATGGAACCCTGTTGGAACAACTGCGAAGCACCGTCGCGCCGCTGCTCAACTCGCTCGGTAACAAGACTCCGGTGTTCTCTGGATCCTACAGCAACGTTAATGTGAATTCAGCTCCCAGAATCACACCAAACGGATCACCGCCCCGATTTAGCGCGAGATACAAAGGTGCAGAATTATTTGTCAGAAAACAAAATAACATTTATCAACCCACTGTGCCATCGATCACTAGCTCGTCTACAACACCAGCTACAACCGTAGAGAACTCTGGTTCGGCACCACCGATCGATGTCTCGAGTCCTGGCGAGCCAAGGTTCTTGACCCTTTATCACGCGTTGGAGTCGGCAGACATCAGGAACGAATTAGAAGCGAACACGAGCGTACAGGCCGACAGGGTTCTCCAGGTAGACTCTAACGCCACTGTCGCTAACGACAACAGCAGTAATTCTAACAATGACACCACAAGCCCCTCCGTAGCGACCACCGGCCCACAGACCCCAGACACCACCGCGAACACTACTCTGACCTCGAGATTATCCGAGGATACGGAGAACACCACCCCCGCGGTTACCACGGGAGTCCCTGAAACCCCTGCGACCACCGAACAACCCTCTAACGCCGAACAACAAGCCTCCAGCACGGAATCACCCTCTACCGAGCAACCTTCCACCAACGCAGTTTCCATGTCGCCACCTGAACAAAGTAGCACGGATGCGCCGACTACGACCGTCGGAAACTCAGAAAGTAGTCAGATACTCTCGACGACTACCACGGAAGTTCCTACCACGACAGGGTCCAGTACCGAAGCAAATGTGCCTAGTACGACCGAGGCCGCGTCGACCACTCAAGGTGCGCAAGGTCTGACGGAGAGTACCACGATGGCTGCCGTCAGCGACGCCGCGAGTATGTCCGAAAGTCCGGAGAGCAATACTATACCGTTCTCCGAGACGCCAGCCACTCAGTCGACCGATTCGAGTTCGACCGATGCCCCCACGACCGAGGCCATATCGAGCAATATGGTGGATGCGGAGACAACTACCGTGATACCTACCACCACGTCGCGACCTAGACTGATCGATTTAGCGCAGGATATTCTGTCCCGTTTGCAAGCGTCTCTGAACGTTACCACGCAGCCGAGTGTAGACTCCACGACTATACCTCCAACGACCGAGATATCGAACGCGATATTAGATATTAGATTCGACGCGAACAATACCCTGCAGAGTCTGTCGCAGTTGAACGAAACGGGAACAGCTGAACCGGCAACCACCGATGAAACCACTACCCAGAGCGCAGTAGGCTCAGTCCCTACTACGACACCTGCGACCACGAATGACCCGTCCAGCTCAATGGTATCTACCCAAGAAGCCAACACGCTGGACGAATCGAGTCCAGTTACAACCACCACACCAGTAACACCACAAGACTCTCAAACAGTTCCGAACACAGAATCGACCACCGTAGGCGACCCCAACAGTTCCTCCAGCCCTCCGTTAGACGTTGATGCGACCACTGCGTCGACGGTTACCACCACGAACGATACTTTACTGACAGAATTAATGTCCATCGCCAAGACCCTCTTTTCGGAAGAGATGAACGACACCGAAACATCGGTACCTGTTCAAACGACGACCGATGTTTCTGGCGTGTCAGGCACGATTCAAGCCACGGAATCGTCGTCGATTTCGCCGGATGTCACGACAGAAACCGTAGAAGCAACTCCGACCACTGTAACTATGTCTGACGTTACCACATTTTCGGTCGATCCCTCGCAGAACGAGGTGGACTCCACAGACCCCACCGTGACCGTTTCGTCTACGGAGAGTTCGACAGACACGCCCAGTACAACTCTAGTGAATAACATGCTCGACAACCTGGTGGATGTCGCGCGAACGAACGACACCGCAACGTTAGGAACACCCCTCGCCGAGAACGTAGAGTCGACCACCCCCTCGTTAACGACCGAAAACGAACAAACGACCCTCTCGATTAACGTATTGTCCAGGCTCGAAAGTGGCCCGGACACCACGACTCAGTTGTCGACAACCACACAAAACACGGAAACGACAGTCGCATCCACCGCCATTAATTTTGAACTAACCACTAACACGTTCGATTTGATATCGACCGACTCGACGACGACGACGACGGGGCCGCAAGCGGCTCCCGAACTTACAGAAACCACCACACCATTAACCGATCTCACGACCGTAACACCAGAGCTTTCGCCAAACACTAGCACTAATCAACCCGAAGTAACCACGATTCCTGAAACAACTCAGTCCACTGTAAATACGATGAGCACGCCGTTGCCCGAAATGATAGTCGAGCAAACCACGGTGGTGTCCACTACAGAGTCGATCCAAAGCGTAACAACCGACGTGACAACCACGTCGCCGATCACGAGCACTCCGCGATTGGACGTTAACCCGATGGACGACGCTGAGGTCACCACCAGCCAGACCCCGCTAACGTCCAGCCTAGAGTCCATTGTGGAAACCACTACTAATACGCCCAGCGAAACAACAAACCTCCCCCAAACAACCCCGACCCTCGAGAACGAAACTCCAACTGTTGTTGCCCGTTTCCAGGATACGACATCAGCAACCGCCCAAGGGACGGCAGGTTCAGGAATCGGCCAAACGACCGAGAACACCACTCCCATGACCATGATACCTTCCACACCTTCTCCCATGCAATCCACCACCCAGTCTCTCGTTTCAACCACTTCATCTTCGGTCGAGACTACGACTACGACGCCGACGATGACTACGACGACGCAGACAACGACGAAAATCGGACGCGTTCCCGAGCTCGCAACGACACAGTCGAGCATGGGTGTCGTCACCGTCACGCCGATGCCCGACACGACGGTTCCTACGACGGTCACGGGTGCCGTAGAGGACAATCTCGTTTCCACCGAAGCTGGGACAACGATGCAACCTATGGGACCCATGAACGCAACGATGATGACCATGAACGCAACCGCCGCGAACACAACCGCCGAAACGACGACCCCGTCGATGCAAACCACTCCTGCGACTTCGACGATGGCTCCGTCTTCTCAGGCTCCCACGACGGCGTACATGGGTCGATTCGGGGGCTCCAGGTTGACGCCTGCCCCCAGGTTCAGCCTCAGCTCCACCACCAGAGCTCCTCTGCGGGACTATCTGGTCTACGGGATATATCCTAACAAAACGATCGTTAGGAAACGACCGGAGGACAACCTGATCGACGCTAGGAACGTGGACAGCCCGTACGTGATATTCGGTATCTTCCCGGATGGCAGGCTGGTCCGGAAATTCCCGAACGGAACGATAATACCGGACCCACCTAGGAGCCCCGTCGAGGTTGTGTTCTCACTTAGCACTACCACTACCACTAACAGGCCACCACCCAGACCGTATTATAACCAGGCTAACCAAGGCGTTTACAATCAGTATCAAGGCCCGGTGTACAGTAATATTCGTAGACCTGAGCCGATGAGAATCGTCCAAAGTCCCGGCACCGTTGACCTCGGCCTTACTGGTAACGCGATCGTCGGCCCCAATGGAGGTGGACCCGGTTTCACGGGGCCACTTGGTACCCCTGCTAGCCTCCCGAGCACCAACGAAATGAGCAATGCCCTGGTAAATACGCAAATGGGGACAGCATCGGTGACGCCGACAGTAAGTACCGGTCGACCGCCGACCGTTTCGCAGGGCGGTCGTATCGTACAGGATCGAGAGAGGGACGAGGCCACCAGGACGAAAGAGGTCGGAGGTCAACGCAGCTCCGTGTACATCGGACAGGACAAGTTCGTCAATTATTGGACCGATGGGGCCTCCACCACCAACCCGCGTGTCCTCGGTGTCAAAATAAACTCGGTGGCTACCGGATCAAATTTGGGACCGTCGCCATCCGTGCCGTCTTTCGCAAATCTTTTGAACAATGAACCAGGAGGTCAAGTTACAGCTCCACCAGGATTCCCATGGAGGGATCCATTGGATCAAATTTTCGGTATTACTACCTCCTCGCCGATAATAACAGCTTCAGTTGCATCGAACTCGCTGGATGATTCTTCGGAATCGAGCAATCCGACTGCAGCAAGGCCGGTGAACCCATTCGTGGAAATTTTCACTCCACTTTCGAACGCGATTGGTATGCCAAGGGGAAATGGCGTGCTTAGTGTCACAGGAGCTGTTCCTAGTACGACGATGCAAACTACTCCTATTACTACTACTATGGCACCAACACCACCAGCTGCACCATCAACACCACCAGCAACACCACCACCACCTCCATCAACACCACCAACTACTACCGCAGCTCCAACTACAACTACACCACCTACAACTACACCACAGCCTACAACTCCTCAAACTAATGCTGCATCGCAAGCACCTCAGTCAACTCCTGGATCCACAGGACCTCCTTCGACAACACCGACTAATTTGCCTGCAAACTTGTTGAATAATATGCAACAGCAGAACGCATTTGGAACGTCGTTTAATGACCTGGTGTTCCTGAATTCGTTGTTGCAGGATAATTCTCGAGGATCTAAAACAAAGACGCTGACCCAAGTCGAGCAGCTGTTAGCCAACAAGATTTTGTCCCTGGCACTGAACGGCCCCGACCCAGGCCCAACCCGCGCCCCAAAGGCCATCAGCTTCGAGAACGCCTCTCCGAATTCCGTCTACCAGTCTCCAAAGTCCTACGAGCCGATAGTGATCGATTTATCCCCATCATCGACCGCCACGTCGCCAACGTGGAAACCGACCCAGCAAACTAGTCAGAAAGCGCCCATTAGTTCAACGACGGAACAAGTCACTCAGACCTCGATTTCGACCACGACCGCGAAGAGAGACATCATCACGAGCGCTCCTTCGACGACTGACAAAACCACCCTAATAAGCACCACAAAAGTCCCAGTCTCCCCTAAAACAGTGACTCGGCCCAGAACCACCACTGAGGCTCCCGTGGGTTTAGCGGGACTCTTGTGGCAAACTCTTCTGGGCGGAGGACTTTTTGGGCCATCGACTACTGAGAGACCTTTGAGGACTAAGCAGGTGAAGACTGTTACGAAGTCTGTGAACATCACTCCGAAGCCGATACCAACTACGCAAAGACCGACGACGACTAGTACCACTACCACAACTACCACCACGACTACCACAGCTCGTACTACAACAGTCAACACGATTGATATCTCGAAGATTCATGTGAGCACTCCGAATTCGATCGGAGTAGAAAAGAAGGCTGCTACGCCGGTTCCACTGTTGTCGACGACGAAGAAGTCGTTGCTGAATAATCCGAACCCCAGGTTGTCTGTTCCTACTTCCACTTTCTCTCCTGAAGAGGAGACCAGGTTCTTGCTGTCGATACTGAGAGCCGCTCAACAGGATGAGAAAGCTGGCGGTTCGAAAAATTCTCTGGACGATGAAGCCTTCTTGAGAGCAATTTTAAGCGGACAGGCTTCCCCGACAAGTACTCCTCCTCCGCAAACGGAAATCAGCAACGCTGCTCTGTTGGCAGCGTTGTTGAAGGCTCAAGGCATCGAACCCGAAACGCCTGCTACTAACATCAGGGAGCAATTGCAGTTGGCTAGCCTCGGCCAGAGCGTCACCTCTGCTCCGAGCTTATCCCCGGCTAGCAGCGGGTCTACGACAATTACAACAAGGCCGACTTCGACTGCGACTCGAGCCACGGATACGACGAAAAACACGGTGACACCGAGACCAACCTCAAGACCAAGGGTACGCACAACAACGTGGTCGCCGAGCTCCACGTATCCACCTCCTCTCTTCAGCTCCTTCTCCAATTACGCTACACCGGGACAGTCGGCTGCCGCTGGCAATTCGGATAATGGCGCGATATTTGGTGCTACCAGGGCGTTCAGTCAATTCCTCGGTGCTGCATTAAGCGGAGCGGCACAACAGTTGCAGTCGTTAGTGAGAAATGGTACTAGGATCGTGTCCGAAGTAGTGGGATAAAATTAGCAAGAAAATAATAAAAATTTTTCGCGTAATCCATAGAATAAGAGAAGCGATTCGCGAGCATGAAAATCTGGAATGAACAAGCTGGTGGTAGCGATGCTTCGAAATAAGTATTCTTTTAGATATTCATTAAAAGTCAATCTGTTTGCTCGATGTTGAAGAGAAACTTCTCGAAATTTCCTCCTCCTTTTTTTATGTATAGATCGTAGCGTTACGCGCAGATAGTTGTTGGGTGATTATGTATTTTATTTTTATTGTACGTAGCTGATAACGGGACGTGACGTGACTCGATCGTTCATTCTTAAAACATGAAGAACGTATTTTATAATAATTCATTTTCAACTTTTCCGAAATATAATTTAGTAACTTTTAATTTTCAAGTTTGTTACATTTTGAGGAAGAGAGATGTAAAAGTATTAACAGTTGAAAATTTAGAAATATTGTAATTTTAATTTTCTATATTGTTTACTTATAAGTTTTTATGAATGTAATTCAGAGCTTCAGAACTTTATAAATTTATAAATTGAGAAATGTAATAATTTAGTGAGTGATTTAGTTTTAATTGAGTGATTTAATCTTCATGTTTTAAGAGTTGAGCGATGCCCGTCGACAGCGATGACGAAACAATTCGGAAAGTGTGGAGTTTCGTTCCGATTCGCGACAGGAGTAACGACTGGACGCCTTGCAAACGTTTCTGGGGTAGGAGCGACCGATGGCTCGTACCACTTTGAAACATTTGTAACGTTGGTCGCAATTAAGGTAATTAATCGAGGGCGATGCGGCTCGTCACGACTCTCTGGACAGTGACGATCCGCGGTGTCTTCGCGTGAAAGAGGGCGTTCCGACTTCTGATGCCCACCCACAAAGATCGATTTAAGGGTCCAGTATCGTGGACCTCTTCCGGGAAAATCGAAAAGCCGACTTCATTTCTTCTGCGATAAAAGCAATTTAACTAATGTATGATTATCAAGCGAAACACCTCGTACTGTCATTCTCAAAATATTC
>OQ027676.1 Uncultured bacterium clone 703 16S ribosomal RNA gene, partial sequence 
TGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCGACGCCGCGTGCGGGATGAAGGCCTTCGGGTTGTAAACCGCTTTCAGCAGGGACGAGGCCGCAAGGTGACGGTACCTGCAGAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTATCCGGATTCATTGGGCGTAAAGCGCGCGTAGGCGGCTTGTTAGGTCGGAGGTTAAAGACCGAGGCTCAACCTCGGCACGCCTCCGATACCGGCAGGCTTGAGTGTGGTAGAGGAAGGTGGAATTCCCAGTGTAGCGGTGGAATGCGCAGATATTGGGAAGAACACCAGCGGCGAAGGCGGCCTTCTGGGCCATTACTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACAGG
>XM_035742444.2 PREDICTED: Oncorhynchus keta protein phosphatase 2, regulatory subunit B', gamma a (LOC118362247), transcript variant X2, mRNA 
CGCTTCATTTTCTCATCTGCTTTTGTGCTAAAATGGAGGCTGGCCCCTTACCTTAAGTGGATTGCCTTCCTGGTCGAGTTTAGATGTTGACATGCAATAAAGCTGGAATCAGGATGGTTGTGGATGCACCTAATTCCAATGGGCCTTTCCAGCCGGTGGCTCTTATGCACTTCAGAGACTGTGCTCCGGCAGAGCAGGAGAAGCTGTTTGTGCAGAAGCTGCGCCAGTGCTGCGTGCTCTTTGACTTCCTGTCGGACCCACTAAGTGACCTGAAATGGAAGGAGGTGAAGCGGGCGGCGCTGAGCGAGATGGTGGAGTACATCACGCACAACCGGAATGTCATCACAGAGCCCATCTACCCAGAGGTGGTGCATGTGTTTGCGGTGAACATGTTCCGAACGTTGCCTCCGTCGTCCAACCCCACAGGAGCAGAGTTCGACCCCGAGGAGGACGAGCCTACACTTGAGGCTGCATGGCCACATCTCCAGCTCGTCTACGAATTTTTCCTTCGGTTTTTAGAATCCCCTGATTTTCAACCGAACATAGCGAAGAAGTACATCGACCAGAAGTTTGTGATGCAGCTTTTAGACCTGTTTGACAGTGAAGACCCACGGGAGAGGGACTTCCTCAAAACAACTCTCCACAGGATATATGGGAAGTTCCTGGGACTACGGGCCTACATCAGAAAACACATCAATAATATATTTTATAGGTTTATCTATGAGACTGAGCACCATAATGGAATTGCAGAATTACTGGAGATACTTGGAAGTATAATCAATGGGTTTGCCTTACCACTAAAAGAGGAGCACAAGATATTCCTTTTAAAGGTCCTGTTGCCTTTGCACAAAGTCAAATCACTTAGTGTCTACCATCCGCAGTTGGCATACTGTGTGGTGCAGTTTCTAGAGAAGGACAGCACTCTCACTGAACCAGTGGTCATGGCCCTTCTGAAATACTGGCCCAAGACTCACTCCCCCAAAGAGGTGATGTTCCTTAACGAGCTGGAGGAGATTCTAGACGTCATCGAGCCATCCGAGTTCGTCAAGGTCATGGAGCCACTGTTCAGGCAGCTGGCCAAGTGTGTGTCCAGCCCACACTTCCAGGTAGCAGAGAGAGCTCTGTACTACTGGAACAACGAGTACATCATGAGTCTGATCAGTGACAACGCAGCCAAGATCCTGCCCATCATGTTCCCGGCGCTCTACCGCAACTCCAAGACCCACTGGAACAAGACCATCCATGGCCTCATCTACAACGCTCTCAAGCTCTTCATGGAGATGAACCAGAAGTTGTTTGATGACTGCACACAGCAGTTCAGAGCAGAGAAAAACAAAGAGAAGGCCAAGTCAAAAGACCGGGAAGAGGCTTGGATAAAGATTGAGAACCTTGCCAAATCCAACCCACAGGTAGTCTTCTAGGGTGGATGTTGAACAGTCCTAGCATAAGTTACGAACGAGAGACCAGAGGAAAGACCGGCCTATGAAGCGGCGTAAGTCTGATCTCCCTCAGGACATCTACACCGCAAAAGCCTTGGAGACCCGTCGCCGAGCCGACGTCATGATCACTACCCGCGATGGGCTCTAGGTCTGCCCCTCTCTCTCTCTAGTTTCCAGTCCCATCTTCTCTCTTTCCTCTAGTGTCCAGTCCCCTCTTCTCTCCACCCTCATCCACACAGCACATTCAGATTACTGGCCCAGTTTCCTCATCGTCGCCAGTACACAACCCCCTGGATTTCTGCTTTCTCAGGTGTTTCTTTTTGGGAGGGGTGGGGCCGCAACTTTCTTTTTTAGTCTTGCCGTCAATTTTTTATTTTTTTTTGCTTAATCGTGCATAACAGTATCGGCTCATCCCTCCAGGCTCTTACTGTACAAATGAAAATGGGGGAAGTTCCGTTCCACTAGCAACATGACAAGCTCCTATGTTCCCCCATTGAGCGCAGTTGGTAGAGAGCAGAAACAGAATGGGGGAGGCTCCTCTCGTTTCCTCTCATGTCAGTTTCTGTTAAGGGGAAACAAAACTAAGAACAGCCATTGTTGGATGGTGGGGGGTGATTGGATCGACTTTTCTGAAGTTTTGTTTCTTCTCTTTTTTTGTAATCCCAGGGACATTTGCCAGTGCCAAGACTGTTTGTTCTTTCTGTGTCTGTGTTTTTCTGTGTGAGAGAAACCAGGATGACTGACTATCTAGGTAGACAGCCTGTGTCGTTTGCCTTCGTTTTTTTTTTTGGAGCCTCAGATGATTCAAATGTTGTTTTTTTAATAAGCTGAAGAGCAACAGGACTTTCTGAAGTGACTGATCCATCTGTTCTGATGAAGTCACTTTATGACTAGGATGGGTGGCAGGACGGGAGGTTCTCTGTGGACACTGGACTCTTTACACCCTACACTTTGTGCCATGCACATTCTTTCGTTGGATTGATTTCCTTTCTGTTGAAGTCCATTGGCAATATGTGAGCCAGATCACAATGAAATATTGACAGTTCAAACAATGGTACTTATTTCATACGCAGAAACACATTGGGTGGTTGTTAGTCTGCACCCACTTTGTCATATTCAAAAGCCCTTCTTAGACATTTCAGTCTCCTTAATTCATACATAATGCATGTCCCCAGTTCTTACTGCTATTGGGAAGCTTCATTTAAATCTCAATGGCCAGCTAGGAAGTGTTTGGTTTGACACAGAGTCCATCAAGACACCTGTAGCCACACACACTGTAATGCTACGTTATGCAGAACATTCCACAAACGTTCCAACTGAAATTACATTATGACACTTTACCTGGGGGTGTCAGTTTGAGGAAGGCGAGGTGCAGAATTACTCATCTCGATCACATAATACGTTATGTGGGATGTAGGGTGATGTTGTAGAACTGTGATTCTGCACAGCCTGACTGTAATGAAGTCCTTCTCAAAAGCACACCTTGTCCTCAGATGCAGGCTTTTCAGAATCCCCGGCGCTGCTTGCTAGTCAAGCATGTTCCAGAAGTACACATGGTATCACATGCCCTGAAGCCCCCCCACACAGCGGTCTCACGTTTCCCCATGTTGGTTTTTACCAGTGCCCTCCTACCCAGAGGTGCTTTGCTGTGGAGCTGAAAGGACTGTTACGTGTCTTGTTGTGAAGTACTGAACAAATGGGGATCAGAGAGCCGTTTATGGAATGGCGGAATGCTACAGGATGAGAACATCAACACTGTTTGGATGACAACCGTTTCATGTGACAGTTGAATGAGCATTGGAAGAGGTGATTTCAAACCTGAATACCTCTTTGGATGATATCTGTAACCGTTGAGAATACGTCTATTGAAAAAGCACTTCCTGAAACTTGAAAGATGTGACATGTTTGTGTATCTTCATTGAAGCGCTCTTCAGTGTCCCGTTGAGTCTATATGTACAGTCTGCTCTGCTTTGTCAAGTTCAGGAAGCTGTCCATTTCCTGGACTGGACAAGGAAACGACCCATAAGTAAGCATTTCAGTGTTAGTCCACGCCTGTTGTTTACGAAGCATGTGACGAATACAATTTTATTTGATTGGGGCCCCATTGTAAATGTTAGTCTTTCTCTGGTACCATTGTTTGAACTTGCAAATCTAGTACGTGTATCCAATCTGTATTGTCTTTTCTGTTTCTAGTCTGGCAACTGGTAGCCTGGATGCTCATTTTAGCATTGTAGCTGCCAATGGAAAGGGCCAATGTTGAAAGACTGGCATCCAGGCTTGGCTTGGTAACTACATTATTAATACTTAAATGCAAAAAGGTGTTCATTTAACTACCATGTATCTTTTGTCCTGGACGAATGGCACTCGCCGAAACAATTTGACCCCCCCCAAAAAAAAAAAAAAAAATCTTCACTTTTATATAACAGTATCATTTGGAAAGATGTTTGATCAGTTTGCTTTTTATTTGTGTTCAAACTTTTTTTTTTTTTTAGACACATCAATTACTCGTATGACAAGTTAGACAACAAATGTTTTGGATTGTTTTCCAGAATTGTTTGCTTGGCCTCTGCAGGTTTTTAGTTAGAACATGTACTTTCCAGAATATAATAACTTGACAAGTGTCCTTTTGTCTGTGATCTGTACTATGTGGCTTCATTTAATATTGTACATATGATTTACTTTGTTTTATGTAGTGTTATATCTAGATTAATTTTGTATAAAATTGTCCTCTGTACAGAATAAAACATCAATAGCAATGACAAAGAAGTCAATGTGGCACATAACTTCTCTCTCCCCTGTAACTTTCTGCATTATTAGAAATAACACATCTAATATTTTCTTTAATTCCCAATTATCTGTGACCAGATTTCAGTCCGTAGCCTTTTGTGTGCTTTTATCACAATCTCAACTGGTGTTCATCTGTAATAGAATGAATAAAGAGAATATTTGAATTTTATATTTTCAACCATA
>XM_023493610.1 PREDICTED: Eurytemora affinis uncharacterized LOC111718108 (LOC111718108), mRNA 
GGCTCGTAAACTAGGGTTTAAAAAAGATTACTACCTGGAATCAGAGAACTGGTTTGGAAACACAACAAACATGACTTCAGATCAGATCCTTCAGGAGATAGTTCTGAAGAGGAATGAAGTGTTTGCTGACAACGATGCGATCAGAATCAAGACAGGGCAAGAGTATTGGAAGTTTTATATAGAGAAAGGGTATTACAGGTCACCAGGACCTGATTTTAGGTACTACTACTACGAGAGGCCGGATAGTAACATCAGTTCTCCTCTGTTTACGGAGAAGAATAAAAACTCTGGTGTCTGTTATAAGTTCCAGGTTCCAGAGTTTCTCTGGAAGAAAGGAGTTTCACAAATTTATATAAATACAAAGGTTAACACATTGATCGGATTCAGCCACTATGGCCAGAGGAGTGGAATTGACAATCAGGACAGGGTGTTCCTAAATACAGATGAGAAGATATATCTAATATTAACCCAACAGCACTTTGAGAGGATCCGGGTTCATGGAAAGCTCTGCAATTCAGAACTAAATACCGGGTTTGACAGTTGCAATGAGCAATGGCTTCATGATTACTCTGTGGCAGAGTATGGATGTATAAGTCCATGGAACAATGTTCCCTCCAACTACTCTGTGTGTAAGAATAAAACGTGTACTAGCGGAGTAAATGATATTGTTTTGAACTGGGTTAATGGATTCAATGATAGTATGTGTGGATCCCCGTGTGAGAGCTCGGAGGTGATGTTTGCCTCGCAGTTCTCCTACAAGGTGGAGGGGATGGGGTATGGATACCTAGCCATCACATTCAAACAATCTGTCAAGGTTACGAGGTCTTCTATACCCTACGGGTTTCTAGAGATGCTGGCTGAAGTAGGAGGATATGTTGGACTATTCCTAGGAGTCTCTATTCAACAACTTGTAGCCATGCCAGAGACCTTTATTGATAAAATATACAAAATACAGTTTTAAATATATCACCATCATCATACACTACACTAGTTAAACAATGATCAGTTTTTGGTAAGAAATATTTGT
>XM_035042612.1 PREDICTED: Populus alba uncharacterized LOC118036784 (LOC118036784), transcript variant X6, mRNA 
AATCAGCTCGCCCATGATTCCTCACAACCACATCTCACCAACAAACCCTCAATATGCATTCAGCAGTCCAGTTCAGATGCTATTCATCAGAAACTATGAATATTTCTGCTGGTGCTAACAACTGTTCTGGTCTTGACATTATTATGGGAAGGGGAAGAAAAGAGGAGTACAAAATATTGAGGATGTTTACATCAAGCAGCTTTATGGGAGCCGAATCAAGTTCATATATCAGAGATGGCTTGAAGCTGCATTGATGAGAGTATTGACTTTGCAAATCGCTATTTAGAATGACATGATACATGCAGCACAGTAAAGACAACGTTTGGTTTGGACGAGTGGGTGATTTTAGAAAAAGAAAACAGGATGCTCGGACAGACAAAACATGCATGCTTTTCTGTCAGATTATATGCAAATCTGAACGACACCCTGTAAGATTAAAAAAAGAAAAAGCAAAGAGAAACTCGATCGAGAGTACTGACGAGCTGCCAGCAAGAGTACTAGTTTGAAAGGTCATGGATTGAATTTTTATTTTATTTTATCTACTGACTTGGAAAATTATGCCCAAGTGTCCAAGTCCTTTTGACCAAAAGACTCGCCTTTGAGTAAGTGGGCCATTGTCAAATTCGGACACCAAAAGGGAAGGGCTGAACTGTTAGATATGATGCCTCAGCTTCATAGAAGTAAGTTGATTCCCAAGTATTAATTATGCCGACTAGGAGAAAACCAAAGGAGTACTGCATGCATGTGAACTCTGGAAGAAACACATCTACACACGATAAAACCGCCGACGGCTATGGAGTGAACCCATTTCCAATCGGGCAGTGCCTATCACCTCTACCTGGAGAGTCTCCTACTGCCCATACTAAGCCGAAAAGAAAAGCTCCTAAAACTGCCAAGGATCTTGAAAAGAAAAGAGAGTACGACAGGGCATATCGGCGACGATGCAGGGAAAATAAAAGGAAAACTGAGCAAGAATTGTTTGTGCTCACAGAAGAGAATAAGAAATTAAATAGAGAGAATGACTACTTCAAAAGGGAAGAAGTTCAGCTGCAAGAGATGGTGCAATCTCAGAAAGACGAAATGACACTGCTACAGAATAAACTTCGCCAACAGAAGGCCCAGCTTCAGGGGCAAAATGTAGTCGTGGATGTGCTTTCGAAGAAAGTAGCTAGTATCGAAGATAATATGGATCCTCAGCGCGAAAATAAACGGCTGAAATTAGAAATGGATTTGCTGATTAAGAAGATTAACAACGATGACTATTTAAACCTCATTCAACCTCGAGAAAAAAACATGAAACTAGAAAAAGAGAAGAATGATCTCCAGTTGATTATTGATGCCTTATGTGCAAAGATAAACAAGGATAATGACCTCGAACCAAAGCAAGCATCCTAATTAATGTACTGAGCTACAAAGTAAATGGACAGAGGAGGTGTTCTGACAGGAGAATTAAGAGGCTACACGAATTTAAATACCCAAGGATGTGACCTAATGTGTTCTTAGAATTGCATGACCTATTATATTGACCTAATCATCATGTATGAAGGGTGTTCTTAGATTTTAGCAGCAAAAGTATCAAGAAGTAAATAAATAAATTGGTACTTGGAGGTTTTGATTTGCCTTTTAAATTGGTAATCTCTCTTGTACTTAGTGTATGTAAATCTCACTGGTTAAGGCCATCTTATAAGCCTACTAATATCGCTCATGAGCACCGGTCTCCCCCATTTGATGGAGGAATAAAATTGACAGTGGTGGAACCAGCAAGATGAATGATCCGTATAGGGATATTTCCTTGGGGTATTTCATGGCAGGATTTGCAGCTGGATTGGCTATGGAATTTGGGAATCAGATGTTTGCATCTTGAAGTAGCTTCCAAGTGGTTAAACATGTTTTGGCAGATGATCAAGGACAGGGCAGGCCCTTATGCTATTTTTCCAAGATGGGTATAAATCTTCCACGCAGCGACTGGAGGGCAGAAACCTCTCCAGTGTAGGGGGGGTCTAGCTCATGTTCTTATAG
>XM_011946569.1 PREDICTED: Colobus angolensis palliatus RIB43A domain with coiled-coils 1 (RIBC1), transcript variant X2, mRNA 
GGAGTTGGTGCTGGGCGGAGTCAGAGCAGCTCTTGAGGGTCAAGGAGGCGGGGGAGACCTGAGTTCACGCTTGCTGAGACAGAAGTCACAGCAGGATTATGCCCCTCAGGGCAAGAGGAAGGTGGGAGCTCGGCTGTGGCTTTAGCCTGGCCAACCTTCAAGGCTAGGACAAGGACAGGGGCGGGAATTGGAAAGACCCGGGGGGAGCGGAGGGCTGGACGAGAATGAGGGGCCAACGGGAGGATTCAGTGTTAGAGTTCAGAAACTGCCGCTGTAACCCAAGAACAAGGTTGCATGCAGAGCCAACCTAAGAGCTTCAAAATCGGGATTCCTTACTGAGAAAGATGTATAACATAAACCAGTCAACAGATACCAAGGAAGCAGCAGCCATCGAGGCCAGAAGAAATCGAGAAAAAGAGCGACAAAACCGATTCTTCAATGTGCGGAACCGAGTCATGGGGGTGGATGTCCAGGCCCTGAACAACCAGGTAGGAGACCGAAAGCATCAGGAAGCAGCAGAAAGAAGCAAGGAGGCAGCTTATGGTACCAGCCAGGTGCAGTATGATGTGGTAGTCCAGATGTTAGAGAAGGAAGAGGCAGATCGAACACGTCGGCTGGCCAAGAAAGTCCAGGAGTTTCGGGAGCAGAAGCAGCAGCTCAAGAACGGGCGTGAATTTAGTCTTTGGGATCCAGACCAAGTCTGGAAGGGGCTTCCAACCTATCTTAGTTACAGTAATACCTATCCTGGTCCAGCCAGCCTGCAGTACTTCTCTGGGGAAGACCTAGACAGGGCCACACGGCTGAGAATGCAGCAGAGGCAGTTCAGGTACAACTTGGAAAGGCAGCAGCAGGAGCAACAGCAAGCCAAGGTTGATGAGAATTGTGCAGATGCGCTCAGTAACCAGCTGCGCCTCGCCATGGACGCGCAGGCCACCCATCTGGCCAGGCTGGAGGAGTCTTGTCGTGCGGCCATGATGTGTGCCATGGCCAATGCCAACAAAGCGCAGGCAGCTGTGCAGGCTGGGCGTCAGCGCTGTGAGCGTCAGCGTGAAAAGAAGGCCAACCTTGCAGAGATCCGGCACCAGAGCACAAGTGACCTACTGACTGAAAACCCCCAGGTCGCCCAACACCGTACAGCTCCCCACCGGGTCCTGCCCTATTGCTGGAAGGGCATGACTCCAGAGCAGCGAGCTGCCATCAGGAAAGAGCAGGAAGTACAACGCTCTAAGAAGGAAGCTCACCGTCAGGCTGAGAAAACACTGGATACTGAATGGAAAAGCCAGACCATGAGTTCAGCCCAGGCATTGCTGGAGCTAGAAGAGCAGGAGAGGGAATTGTGTGCTGTATTTCAAAGGGGTCTAGGCTCTTTCAACCAGCAGCTGGCTAATGAGCAAAAAGCCCAGCAGGATTACCTGAATTCAGTAATCTATACCAATCAACCTACAGCCCAGTATCACCGGCAGTTTAACACCAGCAGCCGCTAAGTTCAGGATGTTTATCTCTTCCTTCTCCTCCATCAAGCTCACAGGCAGTTAGGAGTCAAAGAGAAAAATGCTGCATACTCCCACCTTCTAACCTAGGTAATAAAGTTCTTCACTCAAAATCAA
>HM954641.1 Uncultured Sphingobacteriales bacterium clone GG5QJA201E0Q5R 16S ribosomal RNA gene, partial sequence 
TAAAGGGATACTTCTTCGGACAATATACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGGTTAAGTCCCATAACGAGCGCAACCCCTATCATTAGTGCCATCAGGTCAAGCTGGGGACTCTAATGAAACTGCCTACGCAAGTAGTGAGGAAGGTGGGGATGACGTCAAATCAGCACGGCCCTTACGTCCAGGGCTACACACGTGCTACAATGGCCGGTACAAAGGGCAGCTACCTGGTGACAGGATGCTAATCTCAAAAGCCGGTCTCAGTTCGGATCGGAGTCTGCAACCCGACTCCGTGAAGCTGGAATCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCCTT
>JN110382.1 Trichosporon asahii strain f2fp12 26S ribosomal RNA gene, partial sequence 
ACGGCGAGTGAAGCGGGAAGAGCTCAAATTTGAAATCTGGCAGTCTTCGATTGTCCGAGTTGTAATCTATAGAGGCGTTTTCCGTGCCGGACCGTGTCCAAGTCTCCTGGAAAGGAGTATCAAAGAGGGTGATAATCCCGTACTTAACACGACCACCGGTGCTCTGTGATACGTCTTCTACGAGTCGAGTTGTTTGGGAATGCAGCTCAAAATGGGTGGTGAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGCACTTTGGAAAGAGAGTTAAACAGTACGTGAAATTGTTGAAAGGGAAACGATTGAAGTCAGTCGTGTTCTTTGGATTCAGCCAGTTCTGCTGGTCTACTTCCTTGGAACGGGTCAACATCAGTTTTGTCCGGTGGATAAAGGTAGTAGGAATGTGACTTCTCCGGAAGTGTTATAGCCTATTATCACATACACTGGGTGAGACTGAGGACTGCAGCTCGCCTTTATGGCCGGCCTTCGGGCA
>XM_022629730.1 Penicillium arizonense hypothetical protein (PENARI_c005G05025), partial mRNA 
ATGGCCCCCGTGGAAACACAGCAGTATGATTACATTGTCCTTGGCGGTGGTAGCGGTGGCAGTGGAAGCGCTCGCCGTGCAGCCGGTTGGTATGGTAAAAAGACCTTGATTGTGGAAAGTGGACGGTCAGGAGGTACCTGTGTCAACGTTGGTTGTGTGCCTAAGAAAATGACCTGGAACTTCGCAACCATTAACGAGATGCTGCATGTTGGCAAGAGCTATGGCTATGACATTCCTGATAACATCGCTATGGACTACACCCACTTCAAGAACACCCGTGACGCCGTTATTAAGCGGCTCAATGGCGCATACGAGCGCAACTGGAACCGGGAAGGAATTGATCTCGTGCAGGGTCGTGCAGGCTTCGTTGAGCCTCAAACCATTGAGGTCAAGCTAGCCGACGGCTCCGGTTCTGCCCGCTACACTGCGCCGCACATCCTCTTGGCCACCGGCGGCCGGCCCAACATCCCCTCCGTGCCCGGTGCCGAGCACGGTATCACTAGCGACGGATTCTTTGAGATGGAGGATCTTCCCCCGAAGGTTGCAGTCGTGGGTGCTGGCTACATTGCTGTCGAGCTTGCTGGCGTCATGAACGCTGTCAATGTCGAGACCCACATGTTCATTCGCGGGGAAACCTTCCTCCGCAAGTTTGACCCTATGATCCAGAAGACCATGACCGATCGGTATGAGGCTTCCGGTGTCAAGCTTCACCGTAACCACTCCGGATTCAAGGAAGTGCAACTCATCCGTGACGGCAAAGGCAAGGATAAATTGCTCAAGCTCATTGGCCATGACGGCTCTGAGCTTGAGGTGAACGAGCTGCTCTGGGCCGTGGGTCGTGCCCCCGAGGTCGAGGACCTGAACCTCAATATCCCCGGAGTCAAGCTGAATGCCGGCGGTCACGTTGTGGTTGACGAGTACCAGAACACCTCGGTCGAAGGTGTCTATGCTCTTGGTGACGTGACAGGTCAAGCCGAGCTGACCCCAGTCGCCATCGCCGCCGGTCGTCAACTCGGCAGCCGTCTGTTCGGTCCCCCGGAGCTCAAGTCATCCAAGCTTTCATACGAGAACATCCCTACGGTCGTCTTCTCCCACCCCGAAGTCGGCTGTGTTGGTCTCACGGAGCCCGAGGCCCGCGAGCGCTACGGTGATGACAAGATCAAGATCTACCACACCAAGTTCACGGCCATGTTCTACGACGTCATGCCCGCCGAGGAGAAGGCTAAGAATCCGACTGAGATGAAGATAATCTGCGCCGGTCCCCAGGAGAAGGTTGTCGGTCTCCACATCTTGGGCCTCGGTGTCGGTGAGATGCTTCAGGGCTTCGGTGTCGCTGTCAAGATGGGCGCCACAAAGCAGGACTTTGATAGCTGTGTTGCTATCCACCCTACTAGCGCCGAGGAGCTGGTGACGATGCGGTGA
>AF339527.1 Harposporium helicoides strain Arsef 5354 large subunit ribosomal RNA gene, partial sequence 
AAATTTGAAATCTGGCCCCCCCCGGGGGGCCCGAGTTGTAATTTGCAGAGGATGCTTCTGGCGCGGCGCCTTCCGAGTTCCCTGGAAAGGGACGCCACAGAGGGTGAGAGCCCCGTCTGGTCGGACGCCAAGCCTGTGTGAAGCCCCTTCGACGAGTCGAGTAGTTTGGGAATGCTGCTCAAAACGGGAGGTATATGTCTTCTAAAGCTAAATACCGGCCAGAGACCGATAGCGCACAAGTAGAGTGATCGAAAGATGAAAAGCACTTTGAAAAGAGGGTTAAACAGTACGTGAAATTGTTGAAAGGGAAGCGCTTGTGACCAGACTCGGACCCGGCGAATCACCCAGCGTTCTCGCTGGTGCACTTCGCCGGGCCCGGGCCAGCATCAGTTCGCCGCGGGGGACAAAGGCGGCGGGAACGTGGCTCCCCCGGGAGTGTTATAGCCCGCCGCGCAATGCCCTGGGGCGGACTGAGGTTCGCGCTCCGCAAGGATGCTGGCGTAATGGTCACCAGCGACCCGTCTTGAAACACGGACCAAGGAGTCGTCTTCGTATGCGAGTGTTCGGGTGTGAAACCCTTGCGCGTAATGAAAGTGAACGCAGGTGAGAGCTTCGGCGCATCATCGACCGATCCTGATGTTCTCGGATGGATTTGAGTAAGAGCATACGGGGCCGGACCCGAAAGAAGGTGAACTATGCCTGTGTAGGGTGAAGCCAGAGGAAACTCTGGTGGAGGCTCGCAGCGGTTCTGACGTGCAAATCGATCGTCA
>XM_024173345.1 PREDICTED: Morus notabilis allantoinase (LOC21397670), transcript variant X1, mRNA 
GTTCATGAACCTCTCCACGACACGAGCGAGATTCTTCTCTCTCTTTCTCTCTCTTATTGGTCAGTGTAACGCATAATATTAGAAGTAGATGAAGAAGAGAGAGAATATGGAGAATAGGCTTCAATGGAGGCTCTTTCCCCTGCTTGCGATACTCGCTTCATATTTGGTCTTCTTCTACGTCCAAAACCATTCCGAGCTCTCACATAATAGATGTAGTCTGCTGCCTCACCAACACTATTGGATAGCTAGCAAGCGGATTGTGATACCACAAGGGATTATATCTGGAGCAGTTGAGGTGAAGAATGGGAAGATTGTATCGATTGTCAAAGAAGAAGAAAGGTTGTGGAGTTCCAAGTTGGGGCAAGTAATTGACTATGGAGATGCGGTTGTCATGCCTGGCTTGATTGACGTGCATGCACATCTTGATGATCCCGGAAGAACTGAATGGGAAGGATTTCCTTCAGGAACTAAAGCGGCTGCTGCTGGAGGTATAACGACATTGGTTGACATGCCTCTGAATAGTTTCCCCTCAACTGTGTCTAGGGACACATTGAAACTTAAGATTAAGTCGGCAGAGAACAGAATTCATGTCGATGTTGGTTTTTGGGGAGGTCTTGTTCCTGAAAATGCGTTCAACCATTCCGCTCTTGAAGACCTCTTAAATGCTGGTGCTCTTGGTCTAAAGTCGTTTATGTGTCCTTCAGGGATCGATGATTTTCCCATGACAAACATTAGTCATATTAAGGAGGGCCTGTCAATACTTGCAAAATTTAGAAGACCTTTACTTGTGCATTCAGAGATTCAAAAAGATCTTGAAAGCCCTTTGGGACTCGAAGAAGATGGTGCCAATGACCCTCGTTCTTATTCAACATATCTCAAGACTAGGCCGCCTTCAATGTTGCTGAAACTTTCCAACTCTGTTTTTTTAACTTTTTGGTTCAAACACAGGGAGGAAGCAGCTATTAGGGAGCTCTTGACAGTGTCAAAAGACACGAGGATTGGTGGCCCTTTAGTTGGAGCTCATCTTCACATTGTTCACTTGTCTGATTCAAGTTCTTCCTTGAATCTTATCAAGGAAGCAAAACGTGGCGGTGACAGTTTGACTGTTGAGACTTGCCCACACTACTTGGCTTTCTCAGCGGAAGAAATTAAGGACGGAGACACTCGTTTTAAGTGTGCGCCACCCATTCGCGACGCAGTCAATAGAGAAAAACTGTGGGAGGCAGTAATGGAAGGACATATCGACATGTTAAGTTCCGATCATTCGCCAACAGAGCCAAAACTCAAGCTTCTTGAGGAGGGTAACTTCTTAAAGGCATGGGGAGGAATATCATCTTTGCAGTTTGTGCTTCCTGTGACATGGTCATATGGGAGAAAATATGGTGTAACATTGGAACAATTAGCTTTATGGTGGAGTGAGAGGCCCGCAAAGCTTGCTGGACAAGAATTAAAGGGGTCCATTGCAGTTGGTAATTATGCAGATATAGTTGTATGGGAACCTGAAGTAGAGTTCAACCTCAATGATGAATATCCTGTATACCTTAAACATCCTGGTATTTCTGCCTACATGGGAAGCAAGCTATATGGAAGAGTTTCGGCAACCTTTGTGAGGGGAAACCTTGTCTACAAAGAGAAGAACCATGCCACTGCTGCTTGTGGTGTCCCAATCCTCGCAATATAGAAGTTGCTGCACCATTGAACTCCTTTTGTTTTCCTCTTCTTTTTTTTTTTTGGTTTATGTTATGTAATTAAACATCGAGTTTGTTGTTTCTTTCTTAACATCATGTGAATATTATGTACATCTGTATAGTACACCACTTTTAAGTACTTTTTCTGTTTTTTCTTTTTTTTCAATACAATACGGAATCAAACCCGCACTCTCAATTGAAGCTC
>XM_016927369.2 PREDICTED: Pan troglodytes S100 calcium binding protein A8 (S100A8), transcript variant X2, mRNA 
GAGAAACCAGAGACTGTAGCAACACTGGCAGGGAGAAGCTGTCTCTGATGGCCTGAAGCTGTGGGCAGCTGGCCAAGCCTAACCGCTATAAAAAGGAGCTGCCTCTCAGCCCTGCATGTCTCTTGTCAGCTGTCTTTCAGAAGACCTGGTTCTGTTTTTCAGGTGGGGCAAGTCCGTGGGCATCATGTTGACCGAGCTGGAGAAAGCCTTGAACTCTATCATCGATGTCTACCACAAGTACTCCCTGATAAAGGGGAATTTCCATGCCGTCTACAGGGATGACCTGAAGAAATTGCTAGAGACTGAGTGTCCTCAGTATATCAGGAAAAAGGGTGCAGACGTCTGGTTCAAAGAGTTGGATATCAACACTGATGGTGCAGTTAACTTCCAGGAGTTTCTCATTCTGGTGATAAAGATGGGCGTGGCAGCCCACAAAAAAAGCCACGAAGAAAGCCACAAAGAGTAGCTGAGTTACTGGGCCCAGAGGCTGGGCCCCTGGACATGTACCTGCAGAATAATAAAGTCATCAATACCTCA
>XM_050595833.1 PREDICTED: Cataglyphis hispanica C1GALT1-specific chaperone 1-like (LOC126851659), transcript variant X2, mRNA 
TCGCGTTGCGAGAGTGGACAAGCGGCAGCATGCATATAGCATCTCCGGATGTCCACTCAACGCAGATAGTGCGGCCACCGTGAGGCTTTAGTGGGTAAAAATCTCACATAATCCTCGACTCTCCCCGAAGTCGAGGATATCTTTGGAAGATTTCCTCACGTAAAAAAAAAAAAGAATGCATTTATATACCAATCATACACATATATGATTGGTGGTGGAAGGGGAAGAGGGTTATGTGAGTTAGGTTAAGCAAACAGATGACTTGTTTATGTCACCTGTTGAATATTGTGATCACTAGCAAACACTACCGATTGATCGTCGCAGATGTATATAGGTGTGTTTATAATGTAAAAATGTCAGATATAGAATTTTACACAATTATGTAAACGCTTCAAAATATAATCTTCATGTTAATTCGTCGAATAATATTATAAATGATTTTGCGATGATTTCATCGCATATTTTTATCGATAATACAAGCGCAAAATGCATACTACAGACTATATACATCAACTTTACAAATAAGAGGATACATATAAATTTAAAGTATGCATAAGAAAAGATCTTAATGAGATAATTGAGTTTAACGAAGGTCAAATATAATGATAGTCAAAGAAACTTGTGATTGGCATTACTTGACTACTTGGCATTAGTGTTGAGAGAACTGGATTGTTATTATGTATTTATCGAATTCAATTTTTACTGTGATGACAAGATGCGATTTCGATTTTTAAAACAGAGATCTATATTTCTGATTGGTTTGACAATTGGCTTTGTTTTTCCATTATTGTTATCTTTATTAAGGAATATATTTGTGATTGATTCGATGTGTAAACAAGATCAACCATTGTGGCAACCTGAATATTATCTGAGTAAGGAACCTCACCACGAAGAAATTATTTTACAGCATTGGGAAAAAGTGAAGAGATCTGGAAATTTTAATATCGTTACATACAACACTTGGTTGGCAGCACAAAACTTGAAACCATACAAACTTGATTTGGATAGATATCTATATCTCCAAAAAGGATACAATACAAGAAAAATTGAAAGCGAATGGAACTGGTTAAAAGAACGAGTATCTGTCACATGTATAGTTTTTGTAGAAAAACTCAAATTGGGGAAATCAATCCAGAATACATGGGGTAAACGCTGTAACAATATTTATTTCTTTGGACACCGTTTGAAAGACGATGAATTGCCTATTATAAATATAAATACAAAGATTGTGTCATCTTGGCAATTGCTGTGTGAAGCTATGAACTACATTTGGAAAAAAGAAGCAGACAAATTGGAGTGGATTATTTTCGTAAAAGATAATACTATAGTCATACCGGAAAATCTGCGCTATATGATTGCTCCGTTAGACCACAGAGATGATTACTATCTGGGTCATCCAATAGTTCTGTGGGGTCAGATTTATAACGTTGCTCAATCTGGATATGTTCTTAGTAAAGGAGCACTTGTTAAAGTATTACAAATGTTCAATACTACAGAAAAATGCATTGAAGGTGGAAAATATTGGAAGAAGGAAGATTATTATCTTGGAAAACACTTATCGTTTTTGGGTATACGTCCATCTGATACCAGAGATCAGTATTTGAGAGGTACTTTTCATGGTCATTCTTTACAAAATCTTCTATGGGGTATTATCAGACCAGATAGCTACTTTACACATGCTGTGTATCCGACGAAAGGAGAATGCTGTTCACCGATATCTGTGACTTTCAGTGTCAGTGAACCCGACAAAATGCATATGTTAAATTATTTGCTATATCACTTGCATGTATTTAACAGTGAAAGCAAATTTGGCAATATATCCATCAAAATTCAAGTACCTGAAGACAATGTATGGAAGATTGCACTGCAGGAGGAATTCAACATCACACATTTGAACGATATATCGAGTGACGCTTATTACGAAATATGGCACTCGAAATATTCGGAACCTGGACAGCTAAGAATTGCTAAAAATTATCGAATGACGTCGGATGTACTAAACTGTTTATTGACGAACTACAAAACAGGAAACACGTCTGCGTATAATTGTAGAAGTAAAACAGTCGTCGACAGTACAAAAACCTAAGCCATTAAAACAGCTATTAAAACATTATTTAACAGCTTTATATTATTATTATCAAGACAGAAGATTTACAAAAAACCAATAGACGGTGAATATCTCCAGTCTTGTAATATGCGATTTTCTATACATAAAAATCACGTTATAAACTTTAACAGATAAGTACATTAATAAAGTTAATATTATTTGACCTAA
>XM_030571406.1 PREDICTED: Gopherus evgoodei complement factor H-related protein 2-like (LOC115655701), mRNA 
ATGACGCAGCTTGGATATACTGCCATTCTGATATTATGGGCGTGCTCCACTGCATTAGCTATTTCATGTGGTAACATAGAAAATGGGAGGGTAAAGCCAAGTTTCTTCTTCCAGAGAAGAAAAAGAACATTTGAATGTAATGCCGGGTATATAGCAGAAAATGACAACAACAGAATTGAGTGTACTTCTTCAGGATGGGCTCCTGTACCCAGATGCATTCCAATACAATGTGGAAGGATAGAAAATGGGAAAATAGTGGACAAAGTTGAAGAAAAAACCACCTTTCGATGTGATCATGGATATAAATCTGAAAATGGAATTAATGAAACTACCTGTACCGCTGAAGGCTGGTCTCCAGTACCTATATGTATTGTTCAAGAGTGTTCGCATCCACCTGACATCGATTTGGCAGAAATTGTCAGTGGGGAGAAAGCAGAATATCAGGAGGGTGATGTTGTTCAGTACAGGTGCTACCCAGGATATACTTTGGCAGGATCTGAAAGGATAACATGCAATGGAGAAAAATGGACACCTCCACCAAAGTGCTTCGCTCCATGTATTATCACAAGGCAGCAATTAGAAACAAAAAAATTGCTTCTGTCTAATGGCCGAAGACGTACAGTATTGATTCAAAGTGACCAAACAATGGAATTTCTTTGTGGTGAACATTCTGACCTTAAAATCCCCTACTTCATCAAGTGTGTAGATGGGCACATGGATTTACCAACTTGTGTATCAGGAACTGGGGAAAAGTGTGGCCGGCCACCTACTATTGAGAACGGAGACATAACTACTTTATCCCTAAAAGAGTATGCATTTGGATCTTCGGTAGAATACAGATGCCAGCATTATTACATAATAGAAGGAGACCGGAAATCATACTGTTACAATGGAATCTGGACAAAAGTACCAGTTTGTTTGGAGCCATGTGTTATCACGCAAGAAGATATGAGATCACGCAACATAGATCTAAAGGGGGAGTCAGCTCAAAAACGCTATGTGTCACATGGAGATTTTGTAGAGTTTAAGTGTAGATCCAGTTGGTTTCAAAACTCTTCAAATAATTATAGAGTGCAGTGCAATGCGGGCCAAATACCTTATCCCCAATGCACTTAG
>XM_045878377.1 PREDICTED: Mirounga angustirostris ret proto-oncogene (RET), transcript variant X2, mRNA 
CCAGACCCAGGCGCGCAGCAGCGGAGGGCAGCTGGAGTCCGCGCCCCGACGCTCTGCGCCCCCCGTGTCTCCCGCGTCCGCCGCGCCCCGGGCGGGCATGGGGCGGCCAGGCTGAGCGCCGCACCCCGCCGCCGACACCCCGGGCCCCAGCCAGCAGCCCTCTTGCCGCGGCCCCGGCGCGCACGGGCCATGGCGAAGGCGACGGCGACGGCCGGCGCCGCGGGGCTGCGGCTGCTGCTGCTGCTGCCGCTGCTCAGCGAAGCTCCGCTAGGACTCTACTTCTCTAGGGATGCTTACTGGGAGAAACTGTATGTGGACCAGCCAGCTGGCATGCCCCTGCTCTATGTCCATGCCCTGCGGGACGTCCCCGAGGAGGTGCCCAGCTTCCGCCTGGGTCAGCATCTCTACGGCATCGCCTACCGTGCGAGGCTGCATGAGAACGACTGGATCCGCATCGAGGAGGACACAGGCCTTCTCTACCTTAACCGGAGCCTAGATCGCAGCGCCTGGGAGAAGCTCAGCATCCAAAATGGCGGCTTCCCTGTGCTCACCATCTACCTCCAGGTCTTCCTGTTGTCTACGTCCCTGCGTGAGGGCGAGTGCCAGTGGCCAGGCTGTGCCCGGGTGTACTTCTCCTTCATCAACACTTCCTTCCCGGCTTGTGGTTCCCTCAAACCCCGGGAGCTCTGCTTTCCCGAAACAAGCGTCTCCTTCCGCATCAGAGAGAACAGGCCTCCTGGCACCTTCCACCAATTCCGGCTGCTGCCTGTGCAGTTCCTGTGCCCCAACATCAGTGTGTCCTACAGGCTCCTAGAAGGTGAGAATCTGCCCTTCCGTTGCGCCCCGGACAGCCTGGAGGTGAGCACACGCTGGGCCCTGGACCGCGAGCTGCGGGAGAAGTATGAGCTGGTGGCCGCGTGCACGGTGCGCGTCGGCGCGCGCAAAGAGGAGGTGGTGATGGTGCCCTTCCCCGTGACCGTGTATGATGAGGACGACTCGGCGCCCACCTTCCTCGGGGGCTTCGACACCGCCAGCGCTGTGGTGGAGTTCAAGAGGAAGGAGGGCACTGTGGTGGCCACGATACGTGTCTTCGATGCAGATGTGGTGCCAGCATCTGGGGAGCTGCTGAGGCGATACACAAGCACACTACTCCCTGGGGATGCCTGGGCCCTCCAGACTTTCCGTGTCGAGCACTCACCCAACGAGACCTTGACCCAGGCCAACGGCAGCTTTGTGCGGGCAACTGTGCATGACTACAGGCTGGTTCTCAACCGGAGCCTCCCCATCTCGGAGTGCCGCTCGCTGCAGCTGGCCGTGCTGGTCAATGACTCGGACTTCCAGGGCCCGGGGGAGGGCGTCCTCCGCCTCCACTTCAACGTGAGCGTGCTGCCCGTCAGCCTGCACTTACCCAGCGCCTACTCCTTCACTGTGAGCAGGCGAGCCCGCCGCTTTGCCCAGATTGGGAAAGTCTGTGTGGACAACTGCCAGGAGTTCAGCGGCATCCACGTGCAGTACAAGCTGCAGCTGTCCAGCACCAACTGCAGTGTCCTGGGGGTGGTCACCTCAGCCGAGGACACCACGGGGACCCTGTTCGTGAATGACACGGAAGCCCTGCAGCGGCTCGATTGTTCTCAACTCCAGTACACGGTGGTGGCCACCAACCGGCCAACCCGCAGGCAGACCCAGGCCCCGCTGGTCGTCACCGTGGAGGGGACGTATGTGGCTGAGGAGCCAGGCTGCCCCCTGTCCTGTGCAGTCAGCAAGAGGCGGCCTGAGTGTGAGGAGTGCGGCGGCCTGGGCTCTCTGACGGGCAGGTGCGAGTGGAGACAGGGAGATGGCAAAGGGATCACCAGGAACTTCTCCACCTGCTCCCCCAGCATCAAGACCTGCCCCGATGGCCACTGTGATGCTGTGGAGAGCAGAAATGTCAACATCTGCCCCCAGGACTGCCTCCGGGGCGGCAGCATCATTGGTGGGCACGAGCCAGGGGACCGCTGGGGGATAAAAGCTGGCTTCGGTATCTGCAACTGTTTCCCTGAAGAGAAGAAGTGCTTCTGTGAGCCTGAAGACAGCCAGGACCCGCTGTGCGATGAGCTCTGCCGCACAGTGATCGCGGCGGCCGTGCTCTTCTCCTTCATCGTCTCCATGCTGCTCTCCACCTTCTGCATTCACCGCTACCACAAGAATGCCCACAAGCCGCCCGTCGCCTCCGCCGAGATGACTTTCCGCCGGCCGGCCCAGGCCTTCCCAGTCAGCTACTCCTCGTCGGGCGCCCGCCGGCCCTCCTTGGACTCCATGGAGAACCAGGTTTCTGTGGACGCCTTCAAGATCCCGGAGGATCCGAAGTGGGAATTCCCTCGGAAGAACTTGGTTCTTGGAAAAACTCTGGGAGAAGGCGAATTTGGAAAAGTGGTTAAGGCAACAGCCTTCCGGCTTAAAGGCAAAGCAGGATACACGACCGTGGCCGTGAAGATGCTGAAAGAGAACGCCTCCCCAAGCGAGCTGCGGGACCTGCTGTCAGAGTTCAACCTCCTGAAGCAGGTCAACCACCCGCACGTCATCAAGCTGTACGGGGCCTGCAGCCAGGATGGGCCACTCTTCCTCATTGTGGAGTATGCCAAGTACGGCTCCCTGCGGGGCTTCCTCCGAGAGAGCCGCAAGGCGGGGCCGGGCTACGTGGGCAGTGGAGGCAGCCGCAGCTCCAGCTACCTGGACAACCCCGAGGAGCGGGCCCTGACCATGGGCGACCTAATCTCCTTCGCCTGGCAGATCTCTCGGGGGATGCGGTACCTGGCGGAGATGAAGCTTGTCCATCGGGACTTGGCCGCCAGAAACGTCCTGGTAGCCGAGGGGCGGAAGATGAAGATTTCGGACTTTGGCCTATCCCGAGATGTTTATGAAGAGGATTCCTACGTGAAGAGGAGCAAGGGTCGGATTCCAGTCAAATGGATGGCAATTGAGTCTCTTTTCGATCATATCTACACCACCCAAAGTGATGTGTGGTCCTTCGGTGTCCTGCTGTGGGAGATTGTGACTCTGGGGGGCAACCCCTACCCCGGGATTCCTCCGGAGCGGCTCTTCAACCTTCTGAAGACAGGCTACCGGATGGAGAGGCCCGACAACTGCAGTGAGGAGATGTACGGTCTAATGCTGCAGTGTTGGAAGCAGGAACCAGACAAGAGGCCAGTGTTTGCTGACATCAGCAAAGACCTGGAGAAGATGATGGTTAAGAACAGAGACTACTTGGACCTGGCCGCGTCCACCCCATCTGACTCCCTGCTTTATGACGACGGCCTCTCGGAGGAGGAGACGCCCCTGGTGGACTGTAATAATGCTCCCCTCCCTCGAGCCCTCCCCTCCACGTGGATTGAAAACAAACTCTATGGTAGAATTTCACATGCATTTACTAGATTCTAGCAACATCGTTCCTCTCTGCACTATCCTTACTCTCTGTAATGCTTTTTAAGAGTGTTTCTGATCTGAATGAAACCAAAGTTCTCCCTGAACCTTTTTATTTGTAAATGTCTGACTTTGCATCCGTTTACATTCGGGCATTTTTGAAACTATGTTTTTTTAAAAGGATGTGAAAATAAGTATAATTACCACACTGCCCGGCTACTTATGATTATGGAGAAGAAAGGGAGCTGGGCAGAACTCTCAGGGGATATTGAGAAGATGATAAATAAGTCGTCTCTGGGGTGGGTATGTATCAAGTCATAGTACTTCTAATTTAACTACTGGGATAAATTTACCCAATCTGGGGAGGCAGTTAATTGAGACAGGAGGAGCCAGCACCACCCTGCCTGCACTGAGGGCACAGCCTGTGGTCACTCCCAGACCCCATCTGGGCGGGCAGGTGGCTCTCAGAGGCCACTTGGTACTAGGGAGCATTGGCCCGCCCGGCCTGAGCCCCGCCCACATGCCCACTATCAGGGAGGACACCTGCAGACTGCTGTTTTCACATCCTTTGCATTACACACTGTCATGACAGTTGTCACTCATGAAGTCAGTGCTAAAAGCTGAAGCAAATGCTTTTGAAAGAACATAGTCTGTGGTGCTGTGGTCTTGCAATGGACAGTAAATATGGTTCTTGCCAAAACTCCTTCTTTTGTCTTTGATTAAATACTTGAAAATTT
>XM_028244121.1 PREDICTED: Camellia sinensis uncharacterized LOC114299398 (LOC114299398), mRNA 
ACACCGACGACACGAGTCGTCGTCGCGAGTCGTGACTCATCTCATCTGCACTTCACAAGAAGTTAGTCACCAGACCCCCCCGTATGCACCATCATCAATCAATGTCTTTCCATGTATGAAACCCTAGCTTTGCAAAGCATTTTTCCTATTCAGGAACTAGGGTTTCTCTCTCTCTCTCTCTCTCTCTAAATTAGGGTTTCTATTTTTCTTCAGTCACTCTTGCGCGCTTTCTCTCAAACCCTCCATCGAATCAATTTTTTTTGTCTTTTCTTTTAATTTTATCGTTGTCAGGTAGTTTCCAGGAAAAAAAAATTGTAAATGCGAGAAATCGTAAGAAAGACGTTTTGACACAGCAGGTGCTTTCTTGGAAACCCCATCAAAGATTCCATCTATTTCCTTTCAATATCTTTGATGACAGTGAGGAGGAAGAGGAAAACACATGAAAGATTCGAGAATTTGTGCGAAAATTGTTGAAAAACCTAGGCACTAGTGTGAACTTCGATGGAGTCGACGCATGTGGTACTCGATATAAGCTCGGACGAAGATTATGATTATGATTGGATATCGGAGTTTTTGGACGATGCGGATGACTCTGATGAAGTGGTGGTGGTGAGTGAAGTTGTGGCGAATCACAAGCAGAGGTCGTCAAAGTCTTCTAGTGTTGCTGCTGCGAAGCCGAAAGATTTGGATGATGATTGTGTGGTATTGGAGGGTGATCCAGATAAACCGGTTGCGATCGAGATCGAGAACAATACGGAAGGTGATTCGGATGATTTGTCCATTGTTGGCGAGAAGGGGCAGATTGCTTGCAGAGATTACCCTCACGCTCGCCACCTCTGTGCTAAGTTTCCTTTCACTTCCTCTCTGCATGAGAGGCATTGTCCTCAGTGCCACTGCTATGTATGTGACTCACTTGCACCATGTGTCAATTGGGGCAATGGCACTTCCAGAAATGACCATTGTCACGCTACCGATAAAGATGAGTTCTGGAAATCTCAGAGGCAGAGTTTCAAGCAAGGGAATAAAGCCCCACTACCAGGTCCTAAATTTCCTGACACTTCTCGCTCAATTCGACCACCGCCAACAATCACACAGCTGCAACCAAAGAATCAGATCTCCAGGTCAGCCACAATCCGTGCTTGCTCTATGCCTACCAGTTTTGGCGTCCCAAATATCACAGATCAAGGCAGAAGCCAACAGTCTGTATATGTAAGAAACAAATTCCACCCAGATTTGGTCTCTCGGCAGTTGCTTAGTACCCGTAATAATATCATTCAAAGGGACAGAAGGTTTGGTAATTTAGGGCCTCCATATATCAATTCCCACACAATTTTCAAAAGGGCAGCAGGATCAACTAGAGTTGCTTTGGCAACAAATCGAACTAGATATGGCTCATCTGACAACAATTATGCAACTCAATTCTCCAGAAATCCCTCTCCTGTGGCAGCTTCAAATGATAACAATCCCACTAGGTGGCGAGACCTTTCAAGTGGAATGATTTCAGACTCAGAAGCATATCAGAACCTCTCCCAGCAAAACACTGGCAGCAGCTTGGAGAATTCAGTGCCTTCTCAACCCCTGTTATCCTCACATCCAAACATGGGCAGTGTCTTTCTGAATTCAGTGCCTTCTGGACCCCGACTGTCCTCCCAGCCAAACATAGGCTGCAGCTTTGTCGATTCAGTGCCTTCACCGCAAGTCTCTTCCCAGCCAAGCATGGGAAGCAATTTCGAAAATCCTTTGTCTTGTCAACCGCAAGTGTCCTCACGGCCAAACATGGGCAGCAGCTTTGTCTATCCTGTGCCTTCGCAACCCCAAGTGTATAGTAGTCAGCCTATTCCTGCAGCAAATGATGGCCAATATGGCTTCCAGCAAGGAAACGAGACTCAAAGTGCTGTGGATCCAAGTTTTTCAGATTTTGACTCAAGTTGGGTTGCCCCAACTGGCTGCCAGAGCAACCAACCTTTGGCAGATAATTCCCTATTTCAAATTCCAGGGCTGACTTATCATCATCCTCCTCTTGTCACAGGGTTTGATCCCCAGATTCCTGTAAACACAAATCCAGGCTTACCGGACTTCCAATTTGATTGGATGTTGGAGAATCAATCTTTTTCTGGGGCCCTAGAAGTTCCTGTTCCTTCTGGATGCAATGTATACTCTCCGGAAACTGCCCCTGTTGATGATGTTGCGTTCTTTGATTTCTAAACCTCCTGGGAGTAACCAACCCATGTAAAAAGCCCTCAACCCTGCAAAGAATGAAAATGGCATTCCATTCTTTGGATGATATAATAGGGATTATTAGTAATTGGGTTAAAACATCAACAGTAGAACAGTTGTACTGTACAGTATTTTTTTGTTTTTAATTTTAATATGAGGTACATACTCAAGTAGCCTTGTTTTTACGGTTGCTTTAGGGATGTAGGGTGCCGGTGATGTAACATTATATATGAAATTCTCAGATTGTCATTTTTCTATCCAATCATTTTAGGCTCTACTCAAA
>HM725485.1 Uncultured bacterium clone GB7N87003GN9MT small subunit ribosomal RNA gene, partial sequence 
AGGACGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAGCGGGGTCCATCCAGTGGCAACACTGGTGAAGACCTAGCGGCGAACGGGTGAGTAACACGTGAGAAACCTGCCCTGAAGTCTGGGATAACCCGAGGAAACTCGAGCTAATACCGGATGTCCCCACCGAGCCGCATGGTTTGGTGAGGAAAGATTTATCGCTTCAGGAGGGTCTCGCGGCCTATCAGCTAGTTGGCGGGGTAACGGCCCACCAAGGCATCGACGGGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCAACGCCGCGTGCGGGATGAAGGCCTTCGGGTTGTAAACCGCTTTCAGTGGGACGAAAACGAGACGGTACCCACAGAAGAACGCCCGGCCAACTACGTGCCAGCAGCCGCGGT
>EF082344.1 Picea sitchensis clone WS0277_P22 unknown mRNA 
CCCCCAAAAATGAAAGAAGCAGAGGAGAGGAGAAAGCAAGAGGAAGAAGAGAAGCAAAGAAGAGAGGAGGAAGAACGGCTCAGATTAGAAGAACTAGAAAGAGAGAAAGAGGAAGCAAAACGCCGGAAGAAAGAACGGGAAAAGGAAAAGATCCTGAAGAAGAAGCAGGAAGGCAAATTGTTGACTGGCAAAAAGAAGGAAGAAGCTCGTAGGTTGGCTATAATGAGAGAACAATTTCTTGCTCAAAGTGGGGTTTCATCCGATATCTCAAAGGAGGAAAATCATGCTATGCCCAAGAAACCAAAGTATGAAACAAAGAAGAAGAGGCATGGTCCAATTATTTCTGATGCTGTGGCAGTTGAGCCTGTTGAGATTCAGCCAGATGTGGAAATGAAAGAAGCAGAGGAGAGGAGAAAGCAAGAGGAAGAAGAGAAGCAAAGAAGAGAGGAGGAAGAACGGCTCAGATTAGAAGAACTAGAAAGAGAGAAAGAGGAAGCAAAACGCCGGAAGAAAGAACGGGAAAAGGAAAAGATCCTGAAAAAAAAAAAAAAAA
>KJ417285.1 Leucopaxillus eucalyptorum strain REH9110 voucher NYBG:01115433 18S small subunit ribosomal RNA gene, partial sequence; internal transcribed spacer 1 and 5.8S ribosomal RNA gene, complete sequence; and internal transcribed spacer 2, partial sequence 
GAAGGATCATTATTGAATAAATTGAGTTGGGTTGTTGCTGGCTCTTAGGAGTAATGTGCACACTTGACATTAATTTTATTTTACCACCTGTGCACTTTGTGTAGATTTGGGGGAAACTGTATTATTGAGTTGTCATGTGTATATTTGCATTTGGCTCTCGTTGATATATTATTTTCCAAGTCTATGTATTTTATATACCCCTATAGTATGTCAAAGAATGTAGTGAAGGGCATGAATGGCCCTATAAACTTAATACAACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGCAAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTTGCGCTCCTTGGTATTCCGAGGAGCATGCCTGTTTGAGTGTCATGAAATTCTCAACCCTACAAAGTTATTTACTTTGTCTGGCTTGGATTGTGGGATCTGCTGGCTTGTTCAGCTCTCCTTAAATGTATTAGCAGAATCTTATATGGGTCAGCTTTTAGTGTGATAATTATCTACGCTATAAAGTGACTTGTTTGTAATTCAGCTTCTAATTGTCTGATTTTTGAAGACACCCTATGA
>XR_007078499.1 PREDICTED: Homo sapiens uncharacterized LOC124906680 (LOC124906680), ncRNA 
CTCATGGCGGCCTCTGCAGGCCCAGCTGTTCCTCCTGGCTGCATCTCTCGGCCCAGCTCCTGCCTCCCAGCAGGCAAGCTCTTTTGGCTCAGCTCCCTCCAGCGTTTGTAGACCCCGAAGTTTCTGCAGCCAAGCTCTTCAGGCCCACATCCTGCCTCCCGGCGGGCGCGAAGAGCTTGGCTCGAGAAAGTTCGGGGCCTACAAAGGCGGTTTTGAGCTGGGCAGGAGTTGAGCCCAAAGAGCTTGCTTACTTGCTGGGAGGCAGGGCCGGGAGACGCTGACTTCAGGACGACTTGGGCCTGCAGAGGTCGCCAGGAGGCCCAAGCTGGGCGCGGAGGAGCCCACCGACCGGAGACCGTTTGGGGCCTGGAGACGCCATCGGAGGGCAGGAGCTGATCCTGGAGAGGCCACCGTGAGGCCTGACCTGGGCCTGGGGAGCTTGGCTTGAGGAAGCTGTGGGCCGACCAAGGCCGCCAGGAGATGGGCAGGCGCTGAGTCCAAAGAGGTTGTTGGGAGGCAGCAGTCGGGCCTGGAGACGCAGCCGGGAGGAAGAGCTGGGCCCGGAGAGGACGCCGGGAGGCCGCATGTGGGTCTGGAGAGGCCGACTTGAGGAGGCCCGGCCTCTGCCTCCCTCAGGGCGGCCTCTGCAGGCCCAGCTGTTCCTCCTGGCTGCATCTCTCGGCCCAGCTCCTGCCTCCCAGCAGGCAAGCTCTTTTGGCTCAGCTCCCTCCAGCGTTTGTAGACCCCGAAGTTTCTGCAGCCAAGCTCTTCAGGCCCACATCCTGCCTCCCGGCGGGCGCGAAGAGCTTGGCTCGAGAAAGTTCGGGGCCTACAAAGGCGGTTTTGAGCTGGGCAGGAGTTGAGCCCAAAGAGCTTGCTTACTTGCTGGGAGGCAGGGCCGGGAGACGCTGACTTCAGGACGACTTGGGCCTGCAGAGGTCGCCAGGAGGCCCAAGCTGGGCGCGGAGGAGCCCACCGACCGGAGACCGTTTGGGGCCTGGAGACGCCATCGGAGGGCAGGAGCTGATCCTGGAGAGGCCACCGTGAGGCCTGACCTGGGCCTGGGGAGCTTGGCTTGAGGAAGCTGTGGGCCGACCAAGGCCGCCAGGAGATGGGCAGGCGCTGAGTCCAAAGAGGTTGTTGGGAGGCAGCAGTCGGGCCTGGAGACGCAGCCGGGAGGAAGAGCTGGGCCCGGAGAGGACGCCGGGAGGCTGCATGTGGGTCTGGAGAGGCCGACTTGAGGAGGCCCGGCCTCTGCCTCCCTCATGGCGGCCTCTGCAGGCCCAGCTGTTCCTCCTGGCTGCATCTCTCGGCCCAGCTCCTGCCTCCCAGCAGGCAAGCTCTTTTGGCTCAGCTCCCTCCAGCGTTTGTAGACCCCGAAGTTTCTGCAGCCAAGCTCTTCAGGCCCACATCCTGCCTCCCGGTGGCCTGTACAGTCCCAGCTCTGGCAGCAGAAGAGCGTCAGCAGGCCCCGCTGTTGCCTCCCAGGGGCGTCTCCAGGCCCAGCTCTCGCCCCACCACGGCCTCCCGCGGCCAAGTCCCTGCCTGCTCCCGGCAGCCTGCGTACGGCCCTGCTCCTCCCTCACGGTGGCCTGTTGAGGCAGGGGCTCACGCTGACCTCTCTCGGCGTGGGAGGGGCCGGTGTGAGGCAAGGGCTCACGCTGACCTCTCTCGGCG
>XM_014708519.1 Ordospora colligata OC4 valyl-tRNA synthetase partial mRNA 
ATGGAATCTGAGAAAGATGAAAAGAAAAGGATTAAAGAGGAGAAGAAAAGACAGAAGCTTGAGAAGTTTCTACAGAAGAAAACACAGGAAGTGAGTGTGACAAAACCCAGAGGAGAGTACAAATCAGGAGGATACGACCCTATGGAGATTGAAAGTAAATGGTATAAGTACTGGGAGAGCAATGGTCTTTTTAAGCCAATGCGCAGTGAGAAGAAGTATGTTATTCCCATTCCACCGCCAAATGTGACTGGAAATCTGCATATTGGGCATGCTATGATGGTTTCTATACAGGATGCGATATGCAGGTATAAAAGGATGTGTGGATATGAAGTTCTGTATATTCCCGGGACCGATCATGCAGGAATAGCAACACAAAGTGTTGTTTCTAAGCAATTGGCCAAGGAAGGAGTGGTTGATGTTGATCGAGGAAGGTTTTTGAAGAGAGCATGGGAATGGAAGAATACGCATGGAAGTAAGATATATGAGCAGTTTAAGAGACTGGGTACCAGTGTTGATTTTTCAAGGGAAAGATTTACTCTTGATCCTGGGATGAGTGATGCAGTTAGTGAGGCTTTTGTGAGATTGTATGAGAAAGGACTGATATACAGGGAGCCAAAGATAGTGAATTGGTGTGGGAAGTTGTGTACGACTATAAGTGATCTTGAGGTGAATCATGAAGAGATTGAACCGAATACTGTTATTCAGGTTGATGGAGGTATGTATGAGTTTGGAGTCATTTATCATGTGAAGTATCCATTAACTACATGTGCAGAATATAAAGGATGTGTTAGTGAACTACCAAGTGTTGAGATAGCAACCACAAGACCTGAAACGATTCTTGGAGACACAGCTATATGTGCGAATGCAAATGACGAACGATTTGGCAGTGATGGGATAAGGAAGATGTTTGGAGATGTATCTCGAGATACAAAGGTGTATGGAGTGAATCCATTGACAAAGAGAGTGATTCCTGTGATATTTGATGATTATGCAGACATGAGTTTTGGAACGGGCGTACTGAAGGTGACACCTGCACATGATGCAAATGATTTTGAGTTGTCTAAGAGACATGGGCTTGAATGTATTGTTGTATTTGATGAAAATAATAAAGTGAGTGTTGAGGGAGAGTTTAAAGGGCTTGGAAGGTTTGAAGCTAGGAAGGCGGTTATATGCGATCTTAAGTCTATGGGACTGTATGTGGGTAAGAAAGGACATCCTCAAGTGATTCCAAGATGCTCTAGATCGAATGATGTTATTGAGCCTATGATCAAAAGTCAGTGGTGGATGGATTGTAAGGAGATGGCAAGAAAAGCAATTGATGTGGTTAGGAATGGTGAGATGGATATTCTACCACCAGGTGCTGAGAAGCAATGGTATAAGTGGCTTGAGAATATAAGAGATTGGTGTTTATCAAGGCAGTTGTGGTGGGGACATAGGATACCAGCGTATAGAGTATCTGATGGACAGTGGGTAGTTGGAAGAACGAAGGAAGAGGCGTATGAGAAGATGAGAAAAGAGTATCCTGAGTGCAAGTGTACAATTGATGAAATGGAGCAGGACGAGGATGTATTAGACACCTGGTTTTCATCTGGGCTATGGCCATTTGCAGTGCTTGGATGGCCTAATATAGCAGATGATTATGCGCGATATTATCCAACTACGCTTCTTGAGACTGGTAGTGATATTCTTTTTTTCTGGGTTGCCAGGATGGCAATGCTAGGGATAGAACTTACGAGAAAGATCCCGTTTGATCAGGTTCTTCTGCATGGGATAGTTAGGGATGCACATGGAAGAAAGATGAGCAAAAGTCTTGGGAACGTGATAGACCCGATATTTGTGATAGATGGATGCAGCTTGAATGAACTTATTGCAACGATGAAGAGTGGAAACCTTGATGAGAAGGAAGTGAAAGTTGCTGAAGCAGCTTTGCGTAAAGACTTTCCGAACGGAATACCTAGATGTGGTGCAGATGCACTTCGTTTTACGTTACTCTCTTACACTTCAGGAATGAAAGACATTAATTTAGATGTGCTTAGGGTTGAAGGATACAGAAGGTTCTGCAATAAGATTTGGAATGCACAAAAGTTTGTTAAGATGATGGTTGATGAAGCAAAGGATTGCCTGAGCTCTGAATGTGGATATGCAGAGTATACTTTAAATGTCTCTGACCTTACTAATGGATTTGATTCTGGGCCGATTGAATGGATCCTTATGAAAAGAAACGAAACAATAGAGTATGTCAAAGAGATGATGGAGATGTATAAGTTTATGGAGGCAACACAGGCAATTCATCAGTTTTTTATGTATGACATTTGCGATGTTTTTATTGAGATTGTGAAAGGAAACAAGGAAAAGATGTATGTCAGTGTCTTACTGACAGTGTTTATTGACTCTATGAAGATATTTCATCCGTTCATGCCTTTTATTACTGAAGAAGTGTTTTCAAGCTACTTTGATACATCAATTTCAACATCGGAATATCCAGTAAGTGATGGTAATGCTCACAACAATAATTTTGGTGCAACATTACAACTGGTGAAGCATCTGAGAGGTTTATTGGAGACGAATGGGCCTGGAGGAATGAATGTGCTTGAGATTGTCCCTGGACCTGAGATTAACCACCATGATTTGAAATTTATCCATCTGCTTTGTAGAAGGATATGCAGTGTTGAAATATTATGCGATTATGACGAGAGGTTCTTGGACTTCGGAGGCACAAAAGCATATCTTCGGAAAATTGAATAA
>XM_039636903.2 PREDICTED: Drosophila santomea uncharacterized LOC120452602 (LOC120452602), mRNA 
TCCAGTATTCTATCAGTATAGAAAACAACACACACACACTTTGTAGACACGCGTAAATAATTTTTCGAAATTTGTACTTTTATGCGTGCTATTCTTTTTCGACTTTTATCTTAAATATATTACCATTTTCAAACTATAAAGAACATATTTACAATCACCGAACCTCAAAATGCCGCCCGTTTTAAAACGGAGTCTACGGAAAAGATCAAAACCAGTTCAAGAAACTCCAGCCGAAATCAAGAAGACGAGTACGCTTTCGAAAATAATCATTCAAGGCACTGAACAGCTGTTATTGGATTCTGAAAATAATCCAAATATTCGAGTTATTGAAAAACCCAGAAAAATGCGGTATTCAAAATCATCGATTCCCACTGCGGAACCGGATTTCCAGCTGCATTCCACACCGAAAATTGGTAATCTGGCAAATAAAAGCAACGCACGCGGGATGTTTGGTCCGATCAAAAATAAACAGACATCCATAGAAGCTATTTCTGAAATTAGTGATATGTCCATTGCTTCAGTGTCGGTGAGGAATCAGCCGTTTGTGAACTTTCTCCAGGATTTCTGCATGACTCGTGGTTCCGATCCCAGAGAAAGTGTTCAAGAGGCCATCGCCAAATGGGATAAAATGACACCCAAACAAAAAGCAGAATTCAGTCCAGAAAACTACGTTCTAAAATTGTGTAATCAAGTGCAGAATCGTAATGAAATTTTAAATGCGGTTGCACTGCAGCCGGTTTATGAAACTACAAAAAAAAATCAAAATGGATTTAATAAAGCCAGCAAGGTCAAGAGATTGTCTCCAAAGCTACGTAAGTTGACAAAGCGATTAAACCCAAGACCACGAGGTGTGGTGAGTCCCAGAAAATCAATTAAAAATGCGGCCAAAAAGGAGGTGCCTCCAATGGTGTCGGTGCGTCTAACTAATAGTGCTTCGGCTTACAAAAACTTTCTGCGCAAAGTCCGTCAAGCAAATCCTGGTCTGATGTCCGTAGAAAAGACCTCCCTGTGGCGCAAAATGACTCCTGCCGAAAAGGATCTCTATCGGGTAGTCAGCAAGCGAAGCCAAGAGAAAACCAATGTCAAGAAAACCAAGTTAAGAGCTCTAGCTGCCAAACGCGTAAGGAAGCAAAGAACCTCACGATCAACCCAGATGCCTGAAAATGCTTTACATTATTTGCAAAGCAGTTTCGATATTCAGCGAGATGGCCAACTAGAAATTTGGAACGAGAGCAACACTTTGCTACGGGATAGTCAACGCTCCTGGGTCACACTTGACTACATTTCAAAAGCCTTTGAAAAAGTGAAGAATATATTTAGTTAACTACTTGTTGTCCAAATTTTATACAAAACATATGTAATTGCTATAAAAAAAACTGCGTAGAAACATA
>XM_045247888.1 PREDICTED: Portunus trituberculatus adhesive plaque matrix protein-like (LOC123499604), transcript variant X2, mRNA 
GGCAGGATGAGGGTGGTCACTTGTAGGAAGAACACGAGAGGAGGAGGAGGTCATGACGAGGTTCACAGGACGGTCGCTGGTGGTGGTGGTGGTGGTGGCGGTGGTGGTGGTGGTGGGAGTGGCAGGGGAGAAGCTGGAACACGGTCTGGAGCTCATCACACGGGGGGAGCTGACGGGGGAGACAGACTTTGCGCCCCAGGGGAGGGAAGATGAGCGGACCAGCGCCCACCGAAGCTTTCCCGCGGCGCCCATAGCCCTCACCTACCTGCCGCCCATACAGAGCCCCTTACCCATAGAGGAAACACAGGGGACCACCACAGGCACCAGCGCTACCCCGGGGGAGGTCTTCGTGGCTCCTGACCATGGGGGAGAGATACTTAGACCATTCAACCAAGCAGGGTCACACCTCGAGCAGACCAGCCAACAGCACCACCACCACCATCACCACCTTGGCCCCTTTGAGTCCTCCCAAGAGAACACGCCCTTCCATACAGAGTTCCAGCCCTCAACAAGTGACCAGGACCCAGACGCCCTCCCAGCTGTGGTCCCAGGCCTGAAGAGCGCAGTAACAGCCAAGACAGAAGCATTTGGTACCCTCACGAAAGCTGCACCGTTTGAACACACCCCCCAAACTGCACCAGCCCCCGTGGTACCGTACCCGATCTACCCGCCGTACCCCAAGCCCCAGCAGACGTACCCCCAGCCTTCCTACGTGTACCACAAAGCCTCGTATCCTCAGCCAGTGTACCATAAACCAGTGTACCATAAGCAAATGTACCCTGTAGTGGTGTACCCTGGATATCATCAGTACCACGCCAAGCCGAGCCCCCTGGAGGCGTTGAAGGCTAAGGTGGAGGGCTACGTGGAGACTAAGAGAGCGGCTGTGAGTGGAGCGCTGGCCAAGGTGGAGGAGGCTAAGGCGAAGCTGGACGCAAAAATCAAAGGTCTTTTTAAACCCACTTCCTTGAAAAAAACACCTATTCCATACCCTTCCAAGCCCCTTCCAGCCCCGTCTGCACCCTTCTACCCCTTCAGACCCTATCTCAATGTGCCCCTGACGCCTCACAAGGGGTACTCCATCAAGGCCACCCCTGCCAAGCCCCTGCCAGCCCCTGTACACCACGTCAAAGGCCCGGTACCAAAACCTTACCCTGTGAATGTATACCCAGCCATACCACAGCCTTCCCTTGCTACTACCCCTGCTCCTACCCCTGTCCCGATCCCTGCCACGCTTCCTGCCGCTTCTACAGGCCCCCAGATACCCCAGGAGACCTACCCCATGGCCACAGCACCCCAGTATCAGCCTGTGTATGCAATTTACCCCGTGGCAGCCTCGCCTGACGTGGGACTCAAGGAAAAGCTGGAGGCGAAGAAGAAGCAAGTGATGGGAGCGATTACAGGCGCGTTTGCAAAGTTGAAGGCGCCATTCCAGTACCTGCACCCTTCCTACTCCTACTACTACGCCCCCCAGCATTGGTAGAGGCGCGGCAGGGGCTGGGAAGGCGGCAGGGGGTAAAAAGCTAAGGAGGTATTGGATTAAGCACGTGGTAAGCAGACGCCTTTCAGCCGCCCTGCTCGTGACGTCATCTTAGAGACCGCGGGTGTAAACTAAAATTAAATACATTGGGTTAAAAATATTAGTAATCTGAGCCTATGTTAGTTTATAGTGTGTAATATTTTGTTTATTAGTTAATCTTCTATATAATGTTAATTTGTAGGGTTATGATTGTTATTCTTAAGAGTTTTGAGATTAAGTTTATATTTTATTTTTGGGGTTTTGTATGTAAGGAAGGTACTGGCTAATGGAAGACAAAAAAATGAAATATATAAAAAAAAATGAGTTTAAATGCCAGACCTAACATGAAAAGCACCAAAAGGATTATGAAATTTGGAGAAGTGTTCGATAATAAGGAACAAAGGTACGATGCAGCGAGGAGAGCGCGGCATTTTCAAAACACTGCTAGCGCGCTCCTTTTTAGCCAAGTAGAAGTGAAAAAAAAAGTGCTAAATATTTTTCTAACTCTTGTTATATGTTAATAAAAAAATAAAATAGTTGTTTTT
>MH123473.1 Homo sapiens isolate NUB087 cytochrome b (CYTB) gene, partial cds; tRNA-Thr and tRNA-Pro genes, complete sequence; and D-loop, partial sequence; mitochondrial 
GGGCCTGTCCTTGTAGTATAAACTAATACACCAGTCTTGTAAACCGGAGATGAAAACCTTTTTCCAAGGACAAATCAGAGAAAAAGTCTTTAACTCCACCATTAGCACCCAAAGCTAAGATTCTAATTTAAACTATTCTCTGTTCTTTCATGGGGAAGCAGATTTGGGTACCACCCAAGTATTGACTCACCCATCAACAACCGCTATGTATTTCGTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATAAATACTTGATCACCTGTAGTACATAAAAACCCAATCCACATCAAAATGCTTACAAGCAAGTACAGCAATCAACCTTCAACTATCACACATCAACTGCAACTCCAAAGCCACCCCTCACCCACTAGGATACCAACAAACCTACCCTCCCTTAACAGTACATAGCACATAAAGCCATTTACCGTACATAGCACATTACAGTCAAATCCTTTCTCGCCCCCATGGATGACCCCCCTCAGATAGGGGTCCCTTGGCCACCATCCTCCGTGAAATCAATATCCCGCACAAGAGTGCTACTCTCCTCGCTCCGGGCCCATAACACTTGGGGGTAGCTAAAGTGAACTGTATCCGACATCTGGTTCCTACTTCAGGGCCATAAAGCCTAAATAGCCCACACGTTCCCCTTAAATAAGACATCACGATGGATCACAGGTCTATCACCCTATTAACCACTCACGGGAGCTCTCCATGCATTTGGTATTTTCGTCTGGGGGGTGTGCACGCGATAGCATTGCGAGACGCTGGAGCCGGAGCACCCTATGTCGCAGTATCTGTCTTTGATTCCTGCCCCATCCTATTATTTATCGCACCTACGTTCAATATTACAGGCGAACATACTTACTAAAGTGTGTTAATTAATTAATGCTTGTAGGACATAATAATAACAATTGAATGTCTGCGCAGCCGCTTTCCACACAGACATCATAACAAAAAATTTCCACCAAAGCTTCTGGCCACAGCACTTAAACACATCTCTGCCAAACCCCAAAAACAAAGAACCCTAACACCAGCCTAACCAGATTTCAAATTTTATCTTTTGGCGGTATGCACTTTTAACAGTCACCCCCCAACTAACACATTATTTTCCCCTCCCACTCCCATACTACTAATCTCATCAATACAACCCCCGCCCATCCTACCCAGCCGCTGCTAACCCCATACCCCGAACCAACCAAACCCCAAAGACACCCCCC
>XM_026551140.1 PREDICTED: Papaver somniferum ketol-acid reductoisomerase, chloroplastic-like (LOC113302251), mRNA 
GAGTCAGTTGGCTCCCTGCAATCGTTCTGGCGGGATGGAGTTGAACAGTGAGTCGAAGTTAAAAGTTTGAATCTTTTACTACCTCGTATAGAAGAGTCCAAGGGAGGTAAAAATATAGAAGAGGAGGAGTTATGGATTAAGTAACCGCTGTATCCGCACTGAACTGCAGGAGAAACTTATCCAGATGAAATTCGTGTGATTATGGATTCGTTTGGGTTTCATTTCCGCTGATTTGAATTCCTATGATATACTTGCTGTATTTGGTTAATTCTCAAGTAGAATTTGTTACTCATGGGAACTTCCACTCCGTCCATAGCTTCTTCTTGTTCATTTAAAACCCTAAAACTACTTCACTCAACATCCTCCTCTTCTTCTTTGGGTTTTAAAGTAGGGTTTCTTTCTTCATCTTCTAAAACCTTAAAATTTCTTCTTATTCGTGTTTCTAACAACAGTGTCTCGTTCCCTATTGGATCATCTCTTCTTGCATCTCGTATGATGGTTTCAGTTCCCGATACTAAACCTTTGACTGCTCTTGATTTTGAAACCTCTGTGTTTTACAAGGAGAAGGTCACTCTTGCTGGAAATGACGAGTATGTTGTGAGAGGAGGAAGGGATTTATTCCATTTGTTGCCTGAAGCATTCAAAGGAATTAAGCAGATTGGTGTTCTTGGTTGGGGTTCTCAGGCTTGTGCACAAGCTCAGAACTTGAGGGATTCACTTGCAGAAGCCAGATCTAACATTGTTGTCAAGATCGGATTGAGGAAGGGATCCCGTTCTTTTGCTAAAGCACGTGCTGTTGGTTTTACCGAGGAGACTGGAACTCTGGGTGATATATATGAAACAGTAGCAGAGAGTGATCTTGTGCTGCTATTAATTTCTGATTCTGCACAGGCAGATAATTATGAGAAAATATGCTCCCACATGAAACCTAACAGCATTCTTGGACTCTCTCATGGATTCCTCCTTGGACACCTACAGTCCCTAGGGCTCGACTTCCCTGAAAGTGTGAGTGTGATAGCTGTGTGCCCCAAGGGCCTGGGTCCGTCTATCAGAAGACTTTATGTTCAAGGGAAAGGGATAAATGGTCCTGGAGTTAATGCAAGTTTTGCCGTCCACCAGGATGTTGATGGTAGAGCAACAGATGTCGCCTTAGCATGGTCTGTTGCTCTTGGTTCTCCTTTAACATTCTCCACTACTCTGGAACAAGAATACAAGAGAGACACTTTCGGAAACCAGGATAGCCAGGAAACTGAAAGACGGAGAAAGATAGGGTTTGCAAACAAAGGGAGAACACCATGGAACAAAGGAAAGAAACACAGTGCCGAGACTCGTAAGAAGATCAAACAAAGAACCATAGAGGCACTGAGTGATCCCAAGGTCAGAAAGAAGATGTCTGAGTGTCCCCGTGCTCATAGTGAGGAGAACAAGATAAAAATAAGCATTGCTCAGAAGAAAATGTGGAGAAAACGCTTGCAGATGAAAAGACTGAAGGATGAGTTTTATCTGAAGTGGGCAGAAAGAATTGCAGAGGCAGCTAGGTTAGGCGGCTGTGACCAACAGGAACTAAATTGGGATAGCCATGAAAAGATCACAGAGGAATTGGTTCTTAAACAGCTTCAGTTGACTGCAGATAAAGCAAGGGAAAAAGAAATTGCAAAATTAAGAAGAGCTAGAGCAGCGAAGGAAAGAGAGGAGAAAATGGCTAGAATTGCCCAGAGGAGAAAAGAGAGGATAGAAAAGGAGAGGGAAGAAAAATCAAAACCCAGAGTAGAAATAAAGAGAAAGACACGTAGAAAATCAGAAAAAGAGAAGCAACTACTGGCTCTTTCCAAGGGCTCAAAACTCAAGGAAAAATTGACGAAGATTCGCCGTAAGAAGACTGTTGATGGTCAAGGAGTAGTGGCAACCGGCAATCAACCAGCGATTGAGAAATTGGATTTAGAGTTTATAGAAAGAGAGAAACTGCGGAAGGAAGTGTCTCTTGCGGATCAGATTCGAGCTGTAAAAAAGATGAGAGAGGAGTTAAACAAGGAACCTCTTGCCAGAGCCATCTTATAGATTAAGCCAGCTAGATCATTTTCCTAGTCGAAGTGTTTAGGCTTGGGCTGCTATACATGTCAAAGTTGATAGGCTGAAAACTAAATTAGAAATAAGAACATGAGTTGATCTAGGCTTAGATTTGTTTTTGTTTTTTTTTCCCTCATTCTCCTTGTAAGAACAAATAAGAGCACCAACATCGTCTACCTTCTTTTATCAATCAGTTTTGAAATTGTTGAAGGAAAATGTTATGTCGTTGGGTAATAGATTTGTCCAAAACTTACACTTGGGCACCAACGTATGTCCAGGTGGTTATTATTGACCAATTGAATTTGAAAAAGATATT
>OK585766.1 Setaria viridis SvmiRp606 miRNA gene, partial sequence 
TCGGACCAGGCTTCAATCCC
>XM_008174878.2 PREDICTED: Chrysemys picta bellii olfactory receptor 52R1-like (LOC101936597), transcript variant X1, mRNA 
ATGTCAGATTCCAACACAACCGAATTCACCAACCCCTCCACTTTCATCCTGCTGGGCATTCCTGGCCTGGAGGCAGCCCATGTCTGGATCTCCATCCCCTTCTGCACCATGTACACCATAGCCATCTTGGGGAACTTCACCATCCTATTCATTGTGAAGATGGAGCCGAGTCTCCATGGGCCCATGTACTATTTCCTTTGCATGCTGGCCGTCACTGACCTGGTGGAATCTACGTCCATTGTGCCCAAAATGCTGAGCATCTTCTGGTTCAATTCGAGAGAGATAGATTTCAATTCTTGCCTCACCCAGTTGTACTTCATTCACTGCTTCTCAGTGATGGAGTCTGGGATCTTCTCAGGCATCTTTGTGGCTATGGCTTTGGATCGCTACGTGGCCATCTGCAATCCCCTGAGACATTTCACCATCCTGACAAACTCCATCGTGGCCAAGATTGGCCTGGCCATGATGCTGCGCAGCGGCTTGCTTGCATTGCCCTATCCCTTCCTGGTAAGACAATGGCCATATTGCAGAACCAACATCATCCCCCAGTCGTACTGCGCACACATTGCCGTGGTGAAGCTGGCCTGCACCGACATCCGCGTCAGTAGTTACTATGGCCTCTTTGTGGTATTCTGTGTGATGGGTCTGGATGCGATTTTTATTGCCCTGTCCTACTCCCAGATCCTCAGGGTCATCTTCAGCCTCCCCACAAAGGATGCCCGGATAAAGACTTTTGGGACCTGCATCTCCCACCTTTGTGCCATCTTAGCCTTTTACATCCCAAGTCTCTTCTTCTCCCTCATGTATCGGTTTGGCCAGAATGTGCCCCTGCATTTCCACGTTCTCATTGCCAACGTTTACCTCTTGATGCCCCCCATGCTAAATCCCATCATCTACGGGGTGAGGACCAAACAGATCCGGGACAGGCTGCTCCGACTCTTTACTCATAAAGGGACCTAA
>XM_013231282.1 PREDICTED: Biomphalaria glabrata lipoxygenase homology domain-containing protein 1-like (LOC106071234), partial mRNA 
GATGACATTGCCACAGATTGGAAAGTTGATAATCTTGTCATGGAAAATCCTAGCACTGGTGAGAAGCACAGCTTTGAGGTGAACAGATGGCTGTCCCATAAAGAAATTGATGGAGACATTGTATTTGAAGGTGCAGTCAAACAGCACAACCAACCAGTTGCTTCTACTTGTAAATACATTGTTAAGACCATTACTGAAAGTGAAGAAAATGCAGGAACTGAGGCTAATGTGTATATAAATCTTATAGGAAATCTAGGGGATTCTGGAAAAAGATTTCTAGTGAACAGCAGTAATGGAGGTGAAAAGTTTTCAGCAGGAAAAACAAACTATTTCACTATTGAAGCAGTGGATCTTGGTGATCTAGAAAAAATAGTCATTGGTCATGATGGAACAACACCTGAAGATGCTTGGAAACTTCTGTGCGTTATGGTTCGCAAAGCTGACTCTGCCAACAGAGATACTTCTGTGTTTCCTTGTGGAAA
>XM_017243286.2 PREDICTED: Drosophila bipectinata nuclear transcription factor Y subunit gamma (LOC108126631), mRNA 
TTTCACCCCTAACTGGAGGCTGCCACACTGTTCGCGTGTATGTGTGCATTGCGCATTTCGTTGATTTTAACAAAATTTTAGCCTTCCAGCCGGCTGTGATAGCCAAACCGTTGCCGTCACCGCACCGCAGATCACGTGAGTCAACCGGGACATGTACGCCACCAACAACGGTGGCACAAACAAGGCGCCAAACAGCAATGCCAGCACGCTGTTCGAGAACACCATAACCGTGACGCCAATTAAGGTGGAGTTGGGCACAACGTATGGCGCCGGAAAGCCACCCACACCGGCGCTACAACGAAGGACGCCCAATGCCGTGGTGGTGACCACTAGTAATCCGCAACAACAGCAGCAGCAGCAGCAGCAACAACAGCATCAAACTGGTGCCGGAACCACCACTCTGAACCTGCCCATGCAAGCCACCCTGGTCTCGAATGCCTGCACCATAATGAATCCCAGCCTGAGTGTGACTGTGAATACCACCACCACTGGAGCCCTGGCCAAGGAACCGAAGGGTAAAGCAGCGCGGGCGCAGGTGGTACGGAAACCGCCGCCTACCATCGACAACTTCTGGCCGAATATCGTGAACGAGGTGCATGCAATCGGGCAAGTGGACGCCAAGCATCAAGTCTTGCCACTGGCGCGGATCAAGAAGATAATGAAGCTGGACGAGAATGCCAAGATGATAGCGGGCGAGGCGCCGCTGCTGTTTGCCAAGGCGTGCGAATACTTCATCCAGGAGCTGACGATGCACGCGTGGGTGCACACCGAGGAGAGCAGACGTCGCACGCTCCAGAGATCGGACATTGCCCAGGCGATCGCCAATTATGATCAGTTCGACTTCCTTATTGACATTGTGCCGCGCGAGGAGATCAAGCCGTCGTCGGCGCAGAAGAGCAAGGATGCGGGTGGATCGAGTACGTCGAGCGGGAGTGCCACAGGAGTTACCTCATCCACGTCGTCCGGCACCAGTGCCGGCGGTGTCGTCAGTTCTTCCGTCAATGCATCTGCAGCTTCGGTCACGGGATCGGCTGGAGCCGCTGGGAATTTCGTGGTCGGAGCCACTGCTGTACCTGCTGCCAAGATGGATACGGGTGGAGGAGCCACCGCTACAGAGGTACTAGGCTTTAGCACGGTCACGCCGGACCTGTTCGCCACGCAACTGCAGCAGCAGCAGCAGCAGCACGTCGCCCAGCAGCAACAGCAGCAACAACAACAGCAGCAGGCGCATCCACAACAAGTGCAAATAATCCAGCAGGCCGGACACGGCGGCGCCCAGCAATTGCAGTACTTTATTGCGCTGCCGGGCCAGCAGACGGCACAGCCGGCCCAGAATCATCTGGCCAATAGTCTGGGCCTCAACATTGTGGCCGCCCAACAGCCCGCCCAGCAGCTGATCCTCACCGCGGGCCCCAACGGCCAGCTAACTGCCACCCCAGCCCCCGCGGCCACGGTGCAGCAACAACAGACGGCCCTGCTCCAGAATCTCGCCCAGCAGCAGCAACAGCAACAGCAGGCCCAGCAGCAACAGCAGCAGATCCAATTGCTCCAGCAGGTGGTCACTCCCACGGGGGAACTGACCAATGTCCCGATTGCAATCAATGCCAACCACTTGCATCTGCTCCGGTTGCAGATGCAGCAACAACAACAGCAGCAACAGCAACAACAGCAGCAGCAACAACAACAGCAGGTGATAATACCGACACAGTTGCTGACGGCACAACAGATACTCCAATTGGGCGGAGCACCCGCTACCGTTGGACAGCAGCAGGCGCAGGTTCAAGTCCAGCAGCAGCAGCCACAGGTGCAAGTTCAAGTCCAACAGCAGCATCCAAATCTCAGTCAGGGCAATGCCAGTGCCACGCCCATTTTTATAAATTCAACAGCGACACAGCAAGTGGCGCAACAGCAGGCGCAGCAACAGCAACAACAACAACAACAGGCGCAACAGCAACAACAACAACAACAACAACAGCAGCAGCAACAACAACAACAACAGAGCAACATGGCCGGGGAAAGGACACTAACCGGAGGATTTCGGTAAAAGGAGCTCGCGCTGAGCGTGCACTGGTCGTGCAATGGTAACCATATCGAGGCATGGGTGGGAAAGGTCCAGCACAATTTGTATAATATATAGTTTACGTTTGTATATCGGAAAGAAGATTATATATATAGTTAGTGCTGTAAGTGTAGAAACGA
>XM_002365330.1 Toxoplasma gondii ME49 Ctr copper transporter family protein mRNA 
AGAATTGAGTTGGTGGTTGTTTTCGATGGAAGGAAGCGAGAGTTTCGGAAGAATTCTCGGAAAAGTGGATGTCAACCTGGCAATTCTGTCCCGTTCGCGGGGGGCTCTCCTTTTCCGTGCAAGCACGCGTCCACCTTGATCTCGCGTTCTGCGCTGTGGATTGCAGGAGACGTGTAAGGCAGGCGCCTCTGTTTCCCCGCGGGAGGCACAGGCGATGCAGGAAGCGTCTCCTTTCACGACACCTTGGCAATTCACGAAGGAAATTCCCGTCTGCCTTGTCTGACTCAGGTGGCAAAACTCTTCCTGCGTTCTTGCTGCCTCTGAGTCGAGGGTTTAGGGACTTTTAGGGTTTAAGCCTTCAACTGCCGAGGGCCCCCCCGCGAGTCAAAGACACACGCCGCGTGTCTCTCCTGTGGCGACTCTCCGCGAGAGAGGAAAGAAAACTTCACAAGAATCATAGGCTGAAGCGAACCTCCGATTAACAAGTGTGTGCGCTCCGTGGGGAGAGAGAACGCGTTCGAGAAAGACCTACAGAGGGCAGACCAAGAGAGTCAAGATGGCAACGCACGCTCAGTCAGGTGCTTCCTGCTCTCTGAGCACTTCTCCGAGATCTGGACGCGAAGGAGGACAGAGAAAGACGGAAGCCTACCTTCTGTCCCTCCGCAAAATCCCCAGTTCCAGACGGCGAGGTCTTCCGACCGGTCCTCAATCAAAGGCCTCTCTTCTGCGAGTGTCCACGTTCTTCCTTGTTTGCGCGCTTCACTGCGTGTCTTCTCTCCCCGGCGCTCTGTCCTCCGCCTCGAACTCTCCCGTCTCTTCTGACAACGAGGTGCCCGACCCTCAGCGAAACCGTGACAGCTCAAAACCTTCCAGTTCCGATGCTACGCCAGATAAGACGCATGACAAGCAGCGGCCGAGAAACAGGTATGAAGATGTCGAGGACTGCTGCAAGGGACAGAAGAAGCGCGCTGCCGACGACGCTTCTGCTGCGAGAGAGGCGGACGGAAAAGAGGAGTCTTGCTGCGACAAGAAAGGCGCTGCCGGAGGGTCGGGCGGAGAGGGACCTTCCAGTGAAGGAAAACAGTCCTGCTGTAAAAAGAAGAAAGCAGTGGCTGCGGAAGGAACCGCCCACGTCGCTGCGGAGGGACATAAGTCCTCTTGCTGTGGGGTCATGCCCATGTCTTTTCAAAACTCGCTGCACACCGTGATTCTCTTCCACTCATGGGAGACACTCGAGCGGTGGCAGTACGTGCTGTCGCTGCTGACGTGCGTGGTTCTGGGGATGCTCTCCGTGGTTCTGAAAGTCCTTCGCCTGCGACTCGAGTTCTTCCTCGCCAAGCGCGACCGCGCCGCGGAGGACGCCCAACGAGTCGAGAAATTGAAGGAAAAGGAAGGACAGAGTTCGGCGGCTTCTCCGTCTTCAGCAATTGTCGAACGCCTTTGCGGGAATTTCCCTCTGAAGCAAAACTCCTGGCGGATGCTGGAGGCGTTCGTCATCTACGGGTACGACTACCTTCTCATGCTGATCGTGATGACCTACAACGTAGGGCTCTTCTTCGCTGTCACGGGAGGCCTCGCTCTGGGCTTCTTCTGCTTCGGGCACCTCCTCAGAATCCAGGCAGAAAAAGAAGAGAACTCGCTGGAAGAAGACTACCGCGGGGACCCCTGCTGCTGCGGAACATAAGAACTGGAGACAAAAAGAGAAGACGAAAGGTGTTGGAGACCGAGAATGAAGGAAGAGGAGACAGAGAAAGAAGGAAAGGGAGACAGAGAAAGAAGAAACTGAAGAGTGGAACTAGGAGAGACCACAGGAAGGCGTGGAGCTGGAAATTATTCCTTTGAAACTGGTAGCAGAGCAGGGAGGTCCCTTGAACTTTTGGATTTAAAACATCCTTTTTTTAAAAGCCTCCCTGAGGGAAGAAGCTGGAACGCAGGGTCAAGAGACTAAGGTTGCCGCGTGGAATCGGTTGATCCGCCGTTTTTGTGTAGAACTGCATTCTTTACCGACGCGTTTCAGCGCGTTTTTTGCCGTCGGGGAAGAGTCGAGAAGGGCGCACACATGCGTGTACAAGATGCACACAGACTGTGGCCCTCGTCTGTTCTCCAACAGACCGCGTTTCAGAACGAACATGTAGAATACGCACAGAGACGCGTTCAAGCCTCTGCGCCGGTG
>XM_037418793.1 PREDICTED: Rhipicephalus microplus uncharacterized LOC119167324 (LOC119167324), mRNA 
TGCAAGAAACTACGTACATCATGGTCTCGAGAACTTCCTCCGTATAAAGGTCCAATCGTAGCGCTGATATATGTTTATTTTCGCCTTTTACGACGTGCATCAACAGGAGCACCATGCAAACAGGGAATGGCGTCGTACTGCTCTTGGTTATTTTATCTTATTTGACAGGATTTGGCCAGTCAATATTCATAAAGGAAAATGATTTCAAAGTGTTCTTAAACACAACGCAACCCATATGGACCTTCAACACGACAAACAAATACAACAAGAATTACTGCATTGTGGACGTTACAAAAAAACTGCTGGGAGAAACTGTCATGTATACTCACTCCTTCTATGTCGACCCCACGAGAAAACAGAGGGTTTCTGTTCATATGGAAGGTGCCTTGAAATATAGCAATAAAATGGTTGCCACGCAAAAAGGTTCGAAAGTGACTTTTAAGCACAAGCTCGTGTATCTTGACTTCGACAACATGTGCGCTGTGGTGAAAGTTACTCCAAAGCTTCCTATCCCTGGGCAGCCTTGGCATGACCTGCGAATGTGGAATTCCTCGCTTGTGAGACATCGCCACCCTTCGATAACCTGTTTACACTATTTCAATCTTGAAGCAAAGCATGGACGCCTAACTTATAAGCCTATATGCCAAAAACTCCTTTATCAAGTGAATCCGTATCAAAAGAAAATTCTTCAAGGGCAGAAGACGCCGCAGACATACAGGAGCACGAGCGTGTGAACTGTCGAGCATACTTCGGAAGTATGTAGCACATCAAAGCTTTCTCTAGTGGTTCACGAGAACCACTGGAGGCAGAGATGAATAACTTGTCTAGCCTGTGCTATAAATTTCCATGGGTAAAATGAACAAATCGTTGTCTGATTTCATATGTGTGGTATAATGCGCGCAGCGCTTACATAGATTGCCACAGCTTTCAAGCAGCAACACAACGTGCAACATAAATATGCTGAACCTTACAGATACGCAACCAATAAGTTTTAAATAATGTAAAAATCCACAGACAATGAAA
>XM_027137582.2 PREDICTED: Tachysurus fulvidraco probable endonuclease 4 (si:ch211-141o9.10), transcript variant X3, mRNA 
GACGCAGCTAATTATGAAAACGAGTCCTCCACAGTGCTGTTTGTAACTATGCAATGGGGATAATGTAAACGAAGAAAAGACCACACTGGTTTTAAAGCGTTGAAAAGTCAGTTGGTTGACGGTCGGCCATTTTACTGCTCGGATTATACACTTAAAGTGAGCGAATCCCTTCTCACTGACAACAGTACATAAATTAAAGGCACATTGACCACGCCCCCATACCAAAGTATATGTGGAGATGGGCGGGGCTACAACACACACCTACATACCTACCTACACCTACCTCTCGATGATACAGATTGTGATCTTTTAAGGTGACTAAACTGAAAAAGAGATGGCTTCGTGCAAAAAAGGAGAGAAGAGAAGAAAAGAGAGAAATGTGAAAACGTTAGAGGAATTTGAAGACTCGGCTGAAAGGAAAGGAAGGACAAGAGAACAAAAAAAGTACATTGGTGCTCATGTGTCCATAGTAGGAGGGATATGGAAAGCAGTTGAAGCAAGTGTAGAAATGGGGGGCCACAGTTTTGGATTATTTTTGGGTTCCCAACGCTCTTGGCAAAGACCTGCTCTTGATCAGAAAGCTGCAGTGAAATTTCAGCAGGCTTGTGCTCAACACAGCTTTGACGCAAGACACATTCTGCCACATGGATCTTACCTGATGAATTGTGGCTCTCCCAAAGAAGATGTGTTTAGTAAGAGCCAGGTCATGCTGGTTGATGAACTCAGTCGCTGTAGTCTTTTGGGCCTTACTCAGTTCAACTTTCACCCCGGGGCCTCCCTTGACTCCAGCAAAGAGCAATGTATCGAGAGGATTGCCGAAGCTATAAACAATGCTCACCAGCAAATACCTGCAGTCTGTACCGTTCTTGAAAATATGAGTGGACAGGGAAGTACAGTTGGTGGAGATTTTAATGAACTGAAGTCCATAATTGACCGTGTTCGAGATAAGACACGTGTTGGAGTATGTCTAGACACGTGCCATGCATTTGCAGCAGGTTATGACATTTCTTCAGAGGGAGGAGTGAAGTCTGTGCTTGATGAATTTGACCAAGTGGTTGGACTGCACTACCTGAGAGCAGTTCATCTAAATGACTCAAAAGGTAAATTGGGCTGCCATCTGGATCGCCATGAGGACATTGGCCGTGGACAGATTGGCATCTCTGCTTTCCGAAACATTGTGAATGAACCTCGATTTGACAACATCCCTCTTATTCTCGAGACACCTGGCCGCCCAGGTTTTGAATATGCTGAACAAATACAGCTCCTGTATTCTTTATGTGAGGACTAGAATGCAAGAGGACCTCTTCATTAGACAGTTATAAAGATTTTGTGTTCTATTTTATTCTGTTCACGCATTGTATATTTCATACAGGCATACAATAAACATAAATTGGATTCATATAATCTGTTATCTGTAAAGTATAAAGTACTGTAAAGTGTAGTTGATTGCACAACTACAATTTAGTTGTTTAGTCAGCAGAGGGAGCTGGAAACAAGGAAAACATGATAGAGTAGGTTGAAATCCCATCAGTAAATCTTAAACTAGGTCTGCTAAAGCAATTCTGCTTCCATATTGTACTTTCATATGTATTAAAGAATTTACTCAATCA
>BT130104.1 Oryza sativa clone RRlibC00934 mRNA sequence 
CCCTTTCATCCATCCATCCATCCATCCATCCACATAGCAACGACCTCTCACAATTCACGAATCACCACTGCACACTACACTAGCGGCAGCAAGGATGAAGCTTATTGGCAGCGGCAGCGGCAGCGGCGGGCAGAGGAGAGGGATCGCGAGGGCACTCAAGGAGCACAAGGCGAGGCTCTACATCATCCGCCGATGCGTCGTCATGCTCCTCCGCTGCTGATGATCGAGCTGAGGATGGCGTGCACACGCCTTAATTTCTTCTCGGTGGAATATCTTTCGCAGTTTTTCTCTCACCAATTCACCATGGATCGGTGGGGGCGAATGTTTGTCCCTTGTTTGGGTAGATCTGTTTGGATCTGTCTCTCTTAAATTTGTACATACTGATGAGCTAGTGTAGACCATATCAATATAGGATGCAGATGGAAGTAGTATTAGTTAGTATGAGAGGTAAATTAGTTAGTTGGGGCTGAAGAATTGGGGGTTGTCCTCTACCCAGGACCAATTTTGCCTTGTATGATGATCAGAAGTGGGAATGCAAGAGAAATCTACATGATTTACAAAACAAAAAAAAAAAAAAA
>XM_020061516.1 Plasmodium coatneyi Cleavage and polyadenylation specifity protein partial mRNA 
ATGAACAACATTAATATTGTGTGCCTGGGTGGGGCGAGCGAAGTGGGTCGTTCGTGCGTAATTATAGAAAGTGCGAACAGGTCAATTATGTTGGATTGTGGAATTCACCCTGCCTTTATGGGGATTGGCTGTTTACCCATCTATGACGCGTACGACATTTCGAAGGTGGACTTGTGTTTAATAACACATTTCCATATGGATCACAGTGGTGCCTTACCGTACTTGGTTAACAGAACCCGTTTTAAAGGAAAGGTATACATGACCGAGGCGACGAAAAGTATCTGCTATTTATTATGGAACGACTATGCAAGAATTGAAAAATGTATGCACATGATGAATAAGATGAAAGGAGGTAGGAGTAAAAATGAAGCGGGTGAAAATGAAACAGACGAATATGGAAACAAGGTTAAAAGAGGAGGACTATACTCCAGTGATGAATACGCAAGTGAAGACAATGAAGACGATGATTATTACCAAAGTTACATTTGCGAAATGGGAGATGGAGATATAAAGCATAATGTACTGTATGACGAAAATGATATAAACGCAGCGATGAAAAGGATAGAAACTTTAAATTTTCACGAACACATAGAATTTGAGGATGTAAAATTTACAGCATATAGAGCAGGACACGTGATCGGTGCGTGTATGTTCCTAGTCGAAATAAATAATATACGTTTTTTGTACACAGGAGATTATAGCAGGGAGGTGGATAGGCACATTCCCATAGCGGAGATCCCCACTATTGATGTCCACGTGTTAATTTGCGAAGGAACCTATGGAATAAAAGTGCATGACGATAGAAAAAAAAGGGAAATTCGCTTCCTTAACATGATTACCAGTATATTAAATAATAAAGGGAAAGTGTTACTCCCTGTGTTTGCTTTAGGAAGGGCTCAAGAATTGCTGCTAATTATGGAAGAACATTGGGAAAGAAACACACAGTTGCAGAAAATCCCCATTTTTTACATATCCTCTATGGCTACAAAATCGTTATGTATATATGAGACCTTCATAAATTTGTGTGGAGATTTTGTAAGGCATGTATTAAATGAAGGAAAGAATCCTTTTAACTTTAAGTTTGTAAAGTATGCGAAATCTTTGGACTCCATTTTGAATTATTTATACCAGGATAATTATCCGTGTGTTGTTATGGCTTCGCCTGGTATGCTACAGAATGGAATTTCGAAAAATATTTTTAACATCATTGCACCTGATAAGAAGAGTGGAGTTATCCTTACTGGGTATACAGTCAAGGGAACTTTGGCCCATGAGTTAAAAACTGAACCGGAATATGTCCTCATTAACGACAAACCGGTTAAGAGGAGGTGCCGCTTCGAGGAAATTTCCTTCAGTGCTCATTCTGATTTTAATCAAACTAAAACGTTTATTGAAAAGTTGAAGTGCCCAAATGTGGTTCTTGTGCATGGCGATAGGAATGAATTGAACAGACTGAAAAATAAGCTAACGGAGGAGAAAAAATATTTGTCCGTTTTTACGCCCGAGTTGCTGCAGAGGCTGACTTTTCGCTTTGAGCACAGTGACCACGTGGTGTCCCTAGGTCGGCTTTCCCAACATATTAGAGGGAAGCACCAACCGGGGGATGAAAAACTGAGTGACAGAAATGGAGAGGAAAAAACAATTCCCAACGGGGTGGATGCCATAATAATATCGGAGCCGAAAGCCATCCCGATTATGATTTACGCCAAGGATATTTATGAGTATACAAATTTGAAGACTGCGCTGATCGACCAGACGATTAGCATAAAATTCCCCTACAAGTTCGAGCTGCTGTATCATATGTTGAAGGGTGTGTACGAGGAAACGCATATGGAGGGTGAAGGCAGCGAAAGTGGGAATAGTAACAATGGTGATAATGGTGTCAATGGTGACAACGGCGGAGCGGTCATCTTCGTGCAGGACGTAAAAATCCACCACTGCAGGAAAGAGAAGGTTATTAGTATTAATTGGCTTTCAAGCCCAGTGAACGACCTAGTAGCTGACAGCGTCAATTTTCTAATTCTAGAATTTCTCGACACCATGAAGAATAACAACAACCACCTGCCCATCTGCGACGAAGTAACAGATGATGAGATTTATGAAATGATCATTTCGTATGTGCGGGAAAATTATACCAATGTGGAGAGATTTTCCAAAGTGGAGTTGAAAAGGTTTCTTTTGCAAAATGGCTGTGACAGTCCCGAGGGGGGAAAAAACGAAAAAGCAAATGCTTCATACACAGATGGGTTGACCCATTTGAAGAATGCCCAATCGTATTCATCTGGCAGGGTGAACCAAATCGATCATAACAGAATGGAAGAAGGGGTTACTTTACACGAGGAACATGATGAACAAAGCGGGGATGGAGACAAAATGAAGAAATTCCGCGCCCTTGATAAAATCTTATTCGACTATATCGCGGCAGATGCTAGTTTAGCCATGTCCACTGATGAGGAGGAACCCGTTGTACCGGTTCTTAATGGCGGGATGCTTTATGAAATACTAAAGTTTGAGGTGAAGGATAATAACAACAACGACGTTAATGTGTACGTCGATATAGACAACCGGGAAGTCATCTGTGAGGAAGTTACAATTTTGTCAAAAATTAGAGAAATTCTAAAAAATATAGAGGAGTCGCTATTGCCCATGTGCTTCTAA
>XR_001369330.2 PREDICTED: Pelodiscus sinensis uncharacterized LOC102457183 (LOC102457183), transcript variant X2, ncRNA 
TTTCTCTAGTGCTCAGTCATTGCCTAGTGCCAAGGCTCAAGATCTTTCTCTGCCCTGAGCTGAAACCGTTGCATTTGTTACATTTGTTCTAGAGCCACTGGAGCATTTCAGGCCATTCATCTCATGAGACACGTGAACTAAAGACACTTTGCTGGCATGGAGATGGCCAGTTCCTGGCACAGGACCTTTCCAATCAGTACTGCTCTGCATTGCAAGGTGCAGAAGGAAGCAGAATTGCAGGAGTTTGGTCAAATCTCCAGGAGATCATAACAAGTCCATAAGAGTAAGTCACCACTACTTGCAGGGATCTCGTGTGGGGCTGGCATATGCTTCCATTACTTTGTCACGTCTGCTTCTAGTCGGGTGCGTGACTGCAAACATACGAGAAATCTCTCAGAGTACCTCGCCTGCATTTTCTCCTGTTCCCAGACTTCCTTCTTGTGAAGCAACTGGCCCAACAGCTACTTGGCTTCTTTGTGATCTTGAAGACACTTTACACTTAGATTTGATCATCACCTGCTGGGTTATTTCCCCAATCCTCTCGTTTATGCCTTCACAATGGTGATTGTGTTTCTAGAAGCTCTATGTGCAACATCTGGCAAGACACAGGCATCCAAGATGGCTCCGCCTGACTCTATTCTTCATGCCACGGTGCCTTTGCCTGGCTTTGCCTTAATAGTTTAAAACAGCTGGTCACAGATGATTCAGGAAAACATGAAGAGGAAGCGTTATCTGTGTGTGTAGAGTACAGGCGCTACGGTTTTTGCTTCATTCTTCTTTAAAGAACCAGTGCGAGACTCATGTTAGACATGGGGAACAATACCTCCTACGCTACAGCATAGGGAGAGAAAAACACTTTTGGGGTTCTTGCCTTTATGTTCTAGTCCATAAATTCTACTTTGCTATATATAATCCTTAGCTAGAGGTACAGGCAGTCCCTGGGTTATGTACAAGA
>XM_048564862.1 PREDICTED: Pyrus x bretschneideri LIM domain-containing protein WLIM2b (LOC103942600), transcript variant X2, mRNA 
GCTTTTTATTTATATTTTATAACGCCTTTAAAATCTCTCCCATCGGATTTGGAGGGGTCTCTCTCACGCTCTAATCTCTGTAATTTCATCGTCGTCGTCTTCCTCCACTACGCCGCATCCGCTCCCTGCAAAAAGCCTTCGCCATTCACCGTCCGCCATCTCATTCCTTCTGTACGGAAAAGGACCCATTTGCGCTCCTCACTTTTTTTCGCTCTTTCCATTTTTCAAAATCTTTTCTCTTTTATTCTACCCTTTTTATTTGTCGAGATTTTTTAGCTTCACTCAGTCAGCCTTAAAGCTTTTAAGGGTACGCTTTTCTGACTCTGAAGAATGTTTATTGACTTCAATTTATAATCTCTGCTGCCAGATCTCCATTCATTTGTTCTTGCATTTGTGTGCTTTGAAGGTGGAAGCTTAAGAGGTGGTGGTCTGGGTTGGGAGAGAAGAATCAGATCTAGAAGGAGAAAGAATTATGTCTTTCATTGGCACCCAGCAGAAATGCAAGGCTTGTGAAAAGACAGTTTACCCAGTGGAGGAGCTTTCTGCTGATGGGATTTCCTACCACAAGTCTTGCTTCAAATGCACCCACTGCAAAGGGACTTTGAAGCTGAGCAATTATTCCTCAATGGAAGGTGTCCTGTACTGTAAGCCTCACTTTGAGCAACTGTTCAAGGAGACTGGCAATTTCAACAAGAACTTTCAGTCGCCTGCAAAGTCAGCTGAGAAGTTAACTCCAGAGCTGACTAGATCACCTAGCAAAGCTGCTAGCATGTTTTCTGGAACACAAGACAAATGTGCTACTTGTGGTAAAACAGCTTACCCATTGGAGAAGGTGACAGTGGAGAGCCAGGCCTACCACAAGTCGTGTTTCAAGTGTTCTCACGGCGGCTGTCCTATTACTCCCTCAAACTACGCCGCCCTGGAGGGCATTTTATACTGCAAACACCATTTCTCCCAGCTTTTCAAGGAGAAGGGGAGCTACAACCATCTTATTAAGTCTGCATCAATCAAGCGCACAGCAGCTGCAGCAGCAGCGGCAGCAGCAACAGTAGCCTCCATTCCAGAAGCATAAATTCCATATTTAAATGTTCGATTACATGGCTTTCGTTTGTTTGAGAGTGTTGCATCCCTCTTCAACCTCACGCTTTTCCATGGCGGAGTGAGAAAACTTGGTTCTTCTCTTTTGTATTTGGCTCATCAATCTTGGGCACATTGTTGTGTTTTGCTTCATGTATGTGATTCTGGGTCCGGCAGTTAGTAAAATGACCTTCTTCGGGA
>MG270501.1 Uncultured bacterium clone OTU7751 16S ribosomal RNA gene, partial sequence 
GTGAGGAATATTGGTCAATGGGCGGGAGCCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGTCCTATGGATTGTAAACCTCTTTAGGCGGGGAGCAATGCCGGGCACGCGTGCCCGGAGGGAGAGTACCCGCAGAATAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGATTTTTAAGTCAGCGGTAAAATGTCCGGGCTCAACCCGGGCCGGCCGTTGAAACTGGGGATCTTGAGTGGGCGAGAAGTATGCGGAATGCGTGGTGTAGCGGTGAAATGCATAGATATCACGCAGAACTCCGATTGCGAAGGCAGCATACCGGCGCCCGACTGACGCTGAGGCACGAAAGCGTGGGGATCGAACAGG
>MT590786.1 Dendriscosticta praetextata isolate 16_52820 small subunit ribosomal RNA gene, partial sequence; internal transcribed spacer 1, 5.8S ribosomal RNA gene, and internal transcribed spacer 2, complete sequence; and large subunit ribosomal RNA gene, partial sequence 
AAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATCGAGAGAGGCGTCCCGCCTCGGGGGGGGCTTCCGGCCCCCCGACTCTTCACCCGATGGGTACTCAGCAGCGTTTCTTTGGCGGCGGCTCTTCCGCCGTCCGAGGACCCCCTCCACCACTCCAGTGATTGATGTCGTCGGAGCGCGAAACGAATGAACGCAAAACTTTCAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCGAGGGGCATGCCTGTTCGAGCGTCATTACACCCGTCAAGCCGTGCTTGGTGTTGGGCCGACGTCCCGTTCCGGGACGGGCTCGAATGGCAGTGGCGGCCCGGCGTGGCTTCGAGCGGAGTAGACGTATGCCGTGTCGCTCGGGAGACGCGTCCGGGTCCGGCCAGTCAACCCTTTTTTTTTCTATGTTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCA
>CR627091.1 Homo sapiens mRNA; cDNA DKFZp779E152 (from clone DKFZp779E152) 
TGTGCAAAACCCAGGAGCCACCCCTGCCAAGTGCTGGGCGTGTCTGTGGAGCAGATGAGGCCACAGGCACTGGCCACAGGACTGCGCTGTCTGGAGAGGGATTCGCACACATTTGCAGGGGTGCAGGGCTGGTGTTCTCAGGATTTTGCCTGGCTTCTCTGGATCCGGAGGTCCTGGGAAGGTGGCTTGGACCCTGGTGGGCGGAGTCTTTGAAGTGCAGTCTGGAATCTTCCATGCACAGTTGGGCGACCTGGACAGTGCCCACTGTGTTCTCTAGAGAGTTCCTCAAGGATGCAGCCCCTTTGTCCAGACACTGTTGCAGGAGGCAGGGAGGGAGGCCTGCCCCATGTCCCCTGGATGGCAGGATGGGCTCCCACCTTGTGTCTGGCTGGGCTGTAGTGTGCGGGGCAGCCAAAAGGCACCCTCCGGGTAATCAAGGCCTACCCCACATGGGGACTCTGGTGAGAACCGGGCCTCCACCGACCCCCTGTCCAGGGTGCAGGAGCCAGGCCCGTGCTGTCAGCTGTGTCTGTTTGTCTGTGGTTTCCCTGTGGCTTCATGGCACATGCAGGTCTCTCTTCATGCTTTGGGTGTGGAAGCCGTCGTCAGCTGAGAGTGTTCTGTGGGTGGGTAGCTCTCCTTCCTCCTGAATTTGGGGTGACCTTCTGTGTGGAGGCCCATGACGGTTTCCCATGCATTCTGGGGCTCTGGGATGCTGTGGGCACGAGTTCTGGAGGGGTCTGCACACCTAGGTTCATCTCACGGGCCTCGGGGTGGGCAGAGGGTCCTGGACTGCAGGGACTTGCCCTTCTTTGCAGCTTTGTGCTTTGGTGGTAAAGAAAGGGCTGTGTCCTCAGCCACACTGGGAGCTGCTGCCCTTGCGTGGAACAGGAGCAGCTGTTTGTGGGCAGTCCAGGTGTGGGCTGCAGGCGGGTCGGGGTGGGCTGCAGGCAGGCATTTAAGGAAGTCACAGCTCCAGGCACCAAGGAGGCAGTGGCTGCTGGCCCTGTCCTTTGCTGCATTTCTGTGGACTCCTAGCCCAGGGAATGGAGCCCTGGAGGGTCCCAGGGTAGTCGGTGTCACCTGAAGTGTCCCAGGGACACCTGGTCCTCTGGCTGATGGGGCCGCCCTGTGGGGTAGGCCAGGCCCTGGCTCTCTGGCCCTCAGGGCAGGGTGCGGGTTCCCCACTTCCCCGGCCCTCACACACACCCTTCCAGCCACCCGCGTGAGCATGCTCCAAACACGGCCTTCTGCCCTTGCCTTTTCTTCTCCTTTTGCGTTTTAAAAATCAAATCAGCGGTTCGGAAGGCCTGGAGCTTGGAGGACTCACGCAGAGGCGGCCTTCTGCCTGCCCTCAGGGGCTCCTGAACTTCCCAGAAGCAGCCCTCCCTCCCAGGCTGAACTTTCTGTCTCAGTCCCCGCACTTTCCCAGCTAGGCGGGCTCCTTGTTCCTGCCCATTTTACTCCAGAAGCGAAGCAGGCAGGCCCGGGTTATCCTGCAGGTGCCAGGAGCCCCCTTGGCCAAGCTCCATCTGTGCATAATGGGGGCTCCAGTGGTTTGGGGGGTTGGTCCATGGGAGAACTGGATGTTCACCAGGGGTCAGCATTGGCCTTGAAGTGTGGAGAAGGGTCATCTTGGCAGAGGTGGCAAGGTGGTGAGCCCCTGGGGCTGAGCACAGGTGCGTCTGGTGAGAGGGGCCTGGCCATGACCGCAGTGACTGCTCTTCACTGTCACCTCCTTTGCTCCTCAGGCCACCTGCGCAGAGGGTGTGATCCTTGCATGACTTTGCCATTGAGGAAATGCAAGGGTAGAAAGTGCAGTCTCGTCGGCCGCCTCGGCCTCTAGAATGCCCAAGCAGTGGTATCAACGCAGAGTCGCCATTATGGCCGGGACCACAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>JN907114.1 Uncultured microorganism clone GF13U7304JJ6AB 16S ribosomal RNA gene, partial sequence 
GAGTTTGATCATGGCTCAGAACGAACGCTGGCGGCGTGGATAAGACATGCAAGTCGAACGGGAGAATTGCTAGCTTGCTAATAATTCTCTAGCGGCGCACGGGTGAGTAACACGTGAGTAACCTGCCCCGAGAGCGGGATAGCCCTGGGAAACTGGGATTAATACCGCATAGTATCGAAAGATTAAAGCAGCAATGCGCTTGGGGATGGGCTCGCGGCCTATTAGTTAGTTGGTGAGGTAACGGCTCACCAAGGCGATGACGGGTAGCCGGTCTGAGAGGATGTCCGGCCACACTGGAACTGAGACACGGTCCAGACACCTACGGGTGGCAGCAGTCGAGAATCATTCACAATGGGGGAAACCCTGATGGTGCGACGCCGCGTGGGGGAATGAAGGTCTTCGGATTGTAAACCCCTGTCATGTGGGAGCAAATTAAAAAGATAGTACCACAAGAGGAAGAGACGGCTAACTCTGTGCCAGCCGCCGCAGT
>XM_019753900.1 PREDICTED: Rhinolophus sinicus cytochrome c oxidase assembly factor 5 (LOC109459430), mRNA 
TTCCGGTTCTTTCCTCCGGACGTTGTTCGCTCGCAGCCGGGTCGCCGCGGTTGCGGACGGAAGCGGTGGGGACGGCGGCGGCCGAGAGGCGCGGCCATGCCCCGGTATTACGAGGACAAGCCGGAGGGCGGCGCGTGCGCGGGCGTGAAGGAGGACCTGGGCTCCTGCCTGCTGCAGTCGGACTGTGTGCTCCAGGAAGGAAAATCCCCTCGGCAGTGTCTGAAGGAGGGAAACTGCAAAGCTTTGAAATATTCATTTTTTGAATGTAAAAGATCAATGTTGGATGCCAGATCAAGATTCAGAGGAAGAAAAGGATATTGACACTACTATGTTGAAACTGAGCTGAAAACAACAAGGGATTTTTTCTGGTCATTAAAACAGAGAAGCCAAAATAGGAAACATACTTTTTCTCACATCCGTTTGGTTAGACCAGTTTTTCCCTCCGTGGGACACTGGAGAAATGCATGAGTTCTAGTTTTGAATATGTATAAATGATCCTCTTGCTCTAAGTTATTTTTAGAAGAAAAATGTAATGGATGAGTTACGAGCTCGGAGTATGAGAATTGTTCTGAAGCACAAAGAATGGAAAGGTTGTTATTTTCAAACCTGACTCCTCAAATGACAATTAGTACATCCTTTGTGAATGTTATCAAGGCCACTGATGGGACTGTTAAAATGAGGAACATGGAGCCTGGGGAGAAGGTATCTATTGGGAAAGTTTAGGATACAACTTTCTGTTATTCATTCTGTCCTGTTTACTTCTAAAATAAACTGTGTTTGATTCCTGGGA
>XM_052447470.1 PREDICTED: Populus trichocarpa kinesin-like protein KIN-10C (LOC7454519), transcript variant X5, mRNA 
TTTGAAAAAAAAAAACAGAAAAGAAACAGCAGAGCCCTTCCTTCTTTCGACGTCTCTCTTTCCTTCTTTCCTTTTTTATTATCATCAAATTAATTACTACAAAATATCATCCATTTCAATCTCTCTCTCTATATCTCTATCTACGAATTCAAACACTCTCTCTCTCTCTCTCTCTCTCTCTCTCAATCAACCAGGTAAAGAAGAAGAAGAAGCAGAAGCAGAAGCAGAAGAAGAAGAAGAGTAAAGATGAGTGGCGTACCAAGAAAGCAAAACCTCAACCCCAAGGTTCGCGTCATTGCCAAAATCAGAGGTTCCTCACATCTTGACGGTCTTTCAACTTCTTGGATTTCCGTTCACAATAACATACGTGACGGCATTTTTTCTCACTCTCTCACTTTTTCTCTTGGAGACCGACCAGTTGCTACCAGTGGTGGTGGTGGTAGGAAGGAGGCTTATGTGGTGGATTATTGCTACGAACAAAACGAGAAAAATGATTTGGTTTTTGAAAGAGAAGTTAAGCCTTTTATTAATGAAGTTTTTGATGGCCGTAATGCCACGATTATTGCTTGTGGAGCAAGGGGCACTGGAAAATCCTACCTCTTTCAGGGTACGGATGATGAACCGGGTCTGACAGTGTTGGCTGTGGATGAAATGCTTCGATTGGCTGCGGATAACGGGAAGTCCATTGCCGTTTCCTTTTATGAGGTTGATCAAGATCATCATGTCAAAGACTTGTTGGATCCCAATCGACAACAAGTTTTTGTATTGAAGGATGCTCATGGAAAAACACAATTAAAAGGACTTTCTCAGGTTTCGGTGACATCCGTGTCTCAATTTCACAATTTCTATGGTGGTGGGACTAATCCACGTAAATCGATTCAGAAAGCAGTGACTGAACTTCCCAAGAGAAGTCATAAAGGGTTGATAGTATATGTATCGTCTCATGGTGGAGAAAAGTTGGACGTTTCTGTCAGCAAATTGAATTTTGTTGACTTGGCAGGTTATCAGGATGCTAGAAGGAAGAGTATTGATGGACATAATTTGGTTGAGAGTACAAGGAATATTAATAAGTCCATTCATGCCATTCATAATGTTGTTTACTCTTTGAAAGCTAATGAAACTCATGTGCCATACCGGGAAAGTAAGATCACTACCATGTTGCAAGATTCACTAGGAGGGGCTGGCAGAATTTTGATGGTCACTTGCTTAAACCCATCTTTTTGCCAAGAATCTATTTACATGGTGAAATTAGCATCTCGTTCTTGTCAAGGAAGTAGTTGGGCTATCACAGACTCCACAAAGAAAGCCAACAGCTCAGCAAGACCAATGGTGCCTTCTTCACATAATAGCCGGATGCTTGGTAGTGTTTCCACATCTGTGAAGAAACAAATTGTGTCTCGAGGGCACATTTCTGGAAAAAAAGCACACTGTTCAACTTCCACACTGAAAGCTAGGAAACTGTTTGATGAGTCAAGTGATTTGATATCTCAGAAGATTACTGTGCAGCCAAGTTCCTCAAACAATGTTCCAACAGTTGAATCTGTTATGCATGAAGCGGACCAGCTCACTTCAAATGTTGCCAAAGAAGCATCATCTTTGGAAGAAGGTGTATCATTGTTCACTCATGAGGATTCAAACTCTGTTTCTGTGGATGTTTCTCCTGTAGCAGCAATTTCTAGTACTTGTGAAACTACAATACTTGATAAGGAAGTTTCTCCTGTAGCAGCAGTTTCTGTTACTTGTGAAGCTACAATACTTGATAAGGAAGCTTCTCCACTAGCTATTTCCAGTACTTGTGAAATTACCGTACTTGATAAGGCTGACGAGGACCAAAACAAAACTGTGCTTTACACTGGAGAGTTATCTATGTTCAATGAAGGTAAAAAAATAGACAAGGAAAACAACAGTTCAATTGTCAATCAAGGTGGATCGCCACCCATTAGCGCACAATTGCAAGAACTATCAAACAGTTTGAAGTTACTATGTTCCTCAACCCCATCGTGCATGGATATAACACTAAAAAATGATGCATTTCACAATCAAACTTCAACTGATATCGGGGAACCAACAACTCCCAGTTCAAGTATGAGAGTAACAAATAGGGAAATTACAAGCTTTTGTAGTCCATGGGAAAAATTCAACGCCCGCAGCACTGGGATGAAGAACTCACTTGTTCAAGATTATCTTAGATTGTTGAACACAGCTGACAAGGAAGAATTGAGGAAATTGAAGGGTATTGGAGAAAAGAGAGCTACTTCCATCCTTGAACTTCGAGAAGATTGTCCAGAGCCATTTAAGAATCTTGATGATTTGAAAGACATCGGACTCTCAGCCAAGCAGGTAAAAGGATGGCTTAAAAAGGAAGTTGGGGGACTCTTTGATTAGCATGGCAGCTATGATTAATATGTTGGTTTGGAAGATAATTTACTTTGGGCAACCGAAAGTTGCTTTGAAACTTAATTAGAATTGATTGTAAAGTGGTTACTATATATATATAAATTTGGCATGCATTATTATTCA
>XM_013532536.1 PREDICTED: Lingula anatina FMRFamide receptor (LOC106157047), mRNA 
TACTTATGAACTCCGCTGTGACCAAAAAAAGGAGAAATAAAACACAAAGAGAAAACTGATATTTAAAAAAACTGTAGGTAGAATTGACCTCTGGAAGTGAAAAAACCAGCACCAATATAAACTTTTGTACCTGGACTACCTTATCTGAAGTACTGCTCTGAGGAAAAAGAGTCACCTGTCAAGAATGGACCACTCGGCATTGATATTGGGAACCTTGATTCCAACGGCTGCTGCTGAGCCACAGGGAAATCTCACTGCTGAACTTTACATGGCAGGAGGTGGCGAAAACCAGTTTCCATCCCATGACTTGAGCTACCAGGACAAGCAGCAATGCTTTAATTATGCCAATGGCTCTTTTAAGGATGATGAGCGACTTGAGCAGATACAGTTTGTGATGTTTGGAATAATCTTGCACATCATTTGCATATTTGGAGTTGTTGGCAACCTTGTTTCGTTCTTTGTCCTCAGCAGAAAAGAAATGCGCTCCTCTTCCTCCTGCTATCTTATGGCTTTAATGATATTCAATACAGTTGTCCTACTGACTGCATATTCCAATGATGTTATGACAGGTATTGGAGTGGGAAGCATGTATGGCGCTGTTTCCAACTATATCCTGACATTTGGTTCAGCTGTTGGTCAGTGGTGTTCCGACTGCAGCACTTGGTTGACCATTGCCCTCACTGTAGAACGCTACATATTTGTCTGTCACACTTTTCAAGCTTCAACAATGTGTACCATGCGCCGAGCCATCATAGTTATTGTGTTTTTGTCTATTGGGATGTTTCTTTATGATATCCCATGGTTTCTGCGGCAAGAAGTGAGAAGTGTCACTTGTCCATTTAACGATGAGCCTATCACATACATTGTGATGCGTTCTGAAAAGCATCGCCCTTCAGATATGTACTATAATATACAGCTTTTGTATATTATGCCTGCCTTATTTCTCATTGTGCCCATATTTGTTTTGACAGCGTTCACAGTAATCTTGTTACTTGAGGTGCGAAAGTCAAATAAGCTACGCCAACAGATGTCTACCACACAGACTGCTGAGATCAATGTCACAGTTGTTCTCATCAGTGTTGTTGTGGTTTTTCTTATTTGCACCCTACCAAATTGTATTTTTGCCATTACTCGCACTGTTAAAAAAATTGAAAAAGCAGACGACCCATATTTCGACATTTACTTCACTTTCACTGGAAGAGTCTGTTTTATTGTAGCAAATGTGTTCTTTTATTCAAATTCAGCTCTAAATTTCTTGATTTTTTGTACAGTTGGTCAAAAATTTAGAAAAACATTCAAGCGTATATTTCTTCGACGCTGCAAGTTCTTGACAACGGAAGTGGTTCGTTACAGCAGTGTGAGTGTTGGCTCGAGAACTGGTTCAACCAGGGCAAGCTTTTATCAGACTGAGACAAACATATAGTCAGGTGACAAGTTCTATAGTTATTGGAAATGCAAGAGAGACTGATTTTTTAAATGAAAGTACTATCATTTCAATATTTATAAACATGATTTATAAGTTGCATTGATACTATCATTTTGATTTTGACAACATATATGACCTGATTCTTTTAGAGTTAAAAAGGGTCATTTGCCCATGAATTGATGTGTTTTAATCAGTTTATAAAAGTACAATTAATGAGATTTGATCTATATTCAGGTAGCAGAATATCTGTGGATTTTTTGTTTCAAGGCAACAGTTTCTGAACATGAAAAGGTTAAATTAACCAAAGCAGAGCAGGAAATGTAACTTTTGATGCTATTGATTTTGCAGCTCATGCAAAAATGGACAAAAAATTCAAATTTCTTTAAAACTAACATCAGTTGTGGTAAATCGATTTCCCAGGACGTCACAGTTGGTAGAATGATCCAACAAAAACGTCATATTACAGGAAAGACAAGGTACTAGAAACTAGATTACAGAATGGAGTTCAGGTTCTATTAAGATCTATATTTGTTACTGAATATAGCAGAATTCTAAATTTAAAGGTGCTTCAGAATTTTTTGTAACATGTTGATGGTGTTATCACCCATTTACTACGTTGTGGGTAATTTTTACGGTAATCGTTATTTCGATTAGAGCAAAATGCTTAATGTACTTTGTATACATGTAACATAATTTATACCACTGCTCAAGCAAGAAACAATGGGTCACACCATGACCTGTTCCAAGCAGAGTCGTGGCACACATGGTTGAGTATTGATTCCATTTCTAATTGGTTTTAAATCTGATAAAGCTCTCGTGCTGAAGCTTAGATTTATGTAAAATGGAGGAGTATCCAATTATTTCCACTATTTTACTTAAAACTTTGCGATCTTTATCTTTCATGTTATTGTCACTGCAGAAGTGGTCAAAATATCACAGCTGTTCATTAATGACATGTTTCAAATATGTATCACGAGGCACTTGTGCTTTTTTTTAATGTGCAAGTGACGTGAAATTGAATTTTAATTTAAATATTTATTAGGTAGGTCTGTATTTTACATGATTTGCCAGTGTAACGGTTGTATTTTAAGCTACTTTGGCTGAATGTACTTTTTATGTAAGACTATAGTAAAATAATTAAGTCTGATATTGTTTGATAAGTTGGTGTGGCAGTAGATTGTAATTTTTGTCGATCTATTTAGTTTCTATGTTTGCTTGTTTGAACTTTTCACCTAAAAAATAAATAGTTATGTTTATCATGATCCTACCTGTTTATTGTGATTCTCACAATAAGTA
>XM_030059219.1 PREDICTED: Myripristis murdjan zinc finger and BTB domain containing 5 (zbtb5), transcript variant X2, mRNA 
AGGTCATGGATGCGAAGAATAGCGTCACCTTGTGAGTCTGGCTGTAAAACACAGTCTGGGAGAGGAAATTCTTAGGGAATATTATACATACATATTCATACCTGAGCGGTGGGGATTGTTAGCTAGTAGGCTCCCTCGTACAGTTTTTGGTGAACATCTGTTTTAAACACAACTTAGCGTGTAAACAGATGTGTGTGTGTGTGTGCTGAAGCTGCTCCAGCCCGTGGATGTAACGGCAGCTCCAGCCAGACAACCGTCGCGGACGCACAGCCACGGCAGTGCCCCCGCCCCTGCCCTGACCATGCACCCTACATACACCGGATAGAGGATAACGGTGGGACACGGAAAAGATTTGGATAAACTTTTGGGGTTTTATCGGAAGAAAGTAGCCTTGCGATACACAAACATTAATCCTGGTGGCCGCATGTGAGTGCTGCTTGAAAGCGACAACTCAGCGAGCTAACGGGCTAGCCTGCTAATCGCTAGCCAGCTAGCTTTGTTAGTTGGTGGTCGGGGGCCCTGTTGTACTTCGCCTTACACTTTTACCTTCACCTGTTCCGGACAATTCAAGGAACATGGATTTCCCAGGTCACTTTGAGCAGATCTTTCAGCAGCTGAATTACCAGCGTGTCCATGGCCAGCTGTGCGACTGTGTTATAGTCGTGGGCAGCCGTCACTTCAAGGCCCACCGCTCAGTGCTGGCAGCCTGCAGCACCCACTTCAGAGCCCTGTTCACTGTTGCAGAGGGAGATGCTAGCATGAACATGATCCAGCTGGACAGTGAGGTGGTGACAGCTGAGGCTTTTGCCGCCCTGGTGGACATGATGTACACCTCAACACTGATGCTGGGAGAGAGCAATGTAATGGACATCCTCCTTGCAGCCTCACACCTGCACCTCAACAATGTAGTCAAAGCCTGCAAACACTATTTGACCACCCGCACCCTGCCCATGTCCCCATCATCTGACAGACCCACCCATCGCCACCCTCAACAGGACCAGCCGAGACACAGGCAGCAGCAACAGCAGCAACAAGTAGCAGATTTAGCAGTGAATCCTAATCTAGCAGCTAATGCCAATCTTGCAGCTAATGCTGCTACATCCAGGTTGCAGCGCTCCTTCCTTCTGCAGCAGCTGGGGCTGAGTTTGGTGAGCTCTGCCCTAGGGGGGATGGAGGAAGATGGGGTGGGCAACGTAGTTGGCAATGGAGTAGTTGAACAGAGAGCTTCCTTTCCAATCAGACGCTTCCACAAGCGTAAGCCCTCTCATGCCCTGGCCATATCAGATGACAGACCTCGGCAGAGGGCGCGTCCCTCTGCCCCTCCTCGGGGTTTGCTGGGAGAGGAAGGGGTTAATGTTGAGCGGGAGGAAGGAGCACTGCTCTCTCCGGATTCCCATAAAATGGGAGATGAATCGAAATTGGATGCTGCAATTGCGGGCCTAGTGGGGGTGTCCCCAGATGATCCTCAAATGCCTAGCCAGTCAGACAGTGGTCACTGTGAAGGAGAGGACTCAGGGAGGATGCAGGGAGGAGTGGGGAAGGAGGAGTACATGGAAGACGGGGATCACCAGGACAATAGAGTTGGGACTAAGATTAAGTCTGGGACGGAGGAAGAGGAAGAGGTGGAAGCACAGGAACAGAAGGTGGTGGTAAAACGAGAACCACTGAGCTCCCCTGAGCCAACAGATGAAACCAGTGATGTAACATCACAGGCAGAAGGCAGCGACACAGCTGCGCCCGGAGGCCAGGAGGAGGAGGAGAAGGTGGAGCTGAGCCCAGAGAGCAGCGACCGCAGCTTTACCTCTGACCCCCAGTCCAGTTCTGACCCTCTGCTTAAGCCCAGCTCCCAGCTCCTCCTCAAGACCAGTATGGGTGGAGGCGCTGGGGCTGAAGGAGGTGGAGGAGGTTTTGGGTGTAGCAATGGATTGAATGGCAAATCTGGTTTCAGCATTTCCAGTTTTCTCAGCCCTAAGGGTTTCAGGGGTGGCGAGGCAGGCTTGGTTGCTGGGGACGATGACCTCCCCAACACAACAACTGGTGATGCAGCCACACATCACTTCCTGCTTGGACAGGAAGCTGCTGGGACATCTGCCTCTGCTTCTAGCTCTCTCCTGCAATCCAGTTCACTGAACTGTGAGAATCATAGCAGTTTTGGAGACAGCCTCCAGGCTGATTCTCTTTTCCTTCGACCCCTGCATGACGGGTTGGGAAGCCCCAGAGGAAGTGGAGGAAGTGGTGGAGGAGGAGGGGTAGACCCCTTTGGTTTGGACTACCAGCGCTCCAGTCTGGGGCTGCACTCCCTGGCACGAGCCACAAGAGGGGCTGGAGGAGCCGCTGCTGCTTCTCTGGGCTACCCAGGCTACCGTCGCATAGCTCCCAAAATGGCCAATGGCATGGGAGGAGAAGGAGATGTGGGTGCTGTGCTCCAGGATGCTGCCTCCTCCTCCTCAAGTCTAGGAGGGCCCCTGCTTCTCAATGAGAGCGGTGGTTATGAGATGAACAGCGGCAGGCCCACTTCCCTTCCCCCTCAGCTGACACGAGCCTCTGCCGATGTGCTGTCCAAGTGTAAGAAGGCTCTGTCAGAGCACAATGTCTTAGTTGTGGAGGGAGCCCGAAAATATGCCTGCAAAATCTGTTGCAAAACCTTCCTCACCCTGACTGATTGCAAGAAGCACATTCGGGTCCACACAGGAGAGAAACCCTATGCTTGTCTCAAGTGTGGAAAGCGCTTCAGTCAGTCCTCCCATCTATACAAGCATTCCAAGACAACCTGTCTACGCTGGCAGAACAGCAACACGCCCAATGCCCTGCTATAGAACTGAGACAGCTGCATCAAAACACCATCTATTCCCCCGCTCCTTAGAGCAAATCATGGTATGGAACTAATCAGGCAAGCTCTCAGTCACAGTGGTGCCTCCCCTGCCTGTTCATGTGGCCTGTCATTTGTTTTGTTACCCACTCCCCTCTCCCGACACACACACGCACACACATACAAGGAATTATCCAGCAGCTGTCATTACCAGCTGTGATGTATACAGTATATGGAAGCCCCGCTTCCCCAGCAAGTTTGCCATCATTACTCTTCTGCTGCCTCTGGACCTCGCATCTTGGAAACTTCTGGGCTCTTCTTTTGGATGCGGTAAACCCCAGTTGTATGTATCCTTGATTCAGATATGGATTCCAGATATATTGCTTCTAAAAAGGAAGTATTAATCCAGAAACTGTTAAGCATCTAAACTTGTGTAAGAACTGGTGGTAGTTTTGTGCGTTCTTGATGTTTCTGTGTACTGTAGAAAGAGAGAGGGTCAAGCTCTATCCTGTGTGCTTGTTGCTACCTCCATTCCCTTAAGAAAGGGTGGAAAGCCGAAGATGTTAATGAGGAGGAGTTAGACCATTCCTCTTCTCGTACTAAATCAGTTCAAATCCATGTGAGATGTTTGACATCTGAAGTTGCCTTTGCGTACAAGCACCTTTTTAATCACCAGTGGTTTTGTTTAGGTTACAGAAGGGGAGAGCTAATTTGTCCCGGCTGGCTTTCTTTACTTGTAGTATCAGTGACTCAGAGCTCTTGCATGCAAAAATAAGGTTTGCACTGACAGGGCATTGGGTCTGTAAGTGACTTAGCTGACGAGTCACTGCTGTGGCCCATCGTGGATGGTGTAAGAGACTCAGATTGTGTTTATGTAATAGTCTGCAGCTGCAAAGATTTAAACAGACAAATCAGGTTTTTGCTCCTGAAAAGTTTTAACATGTTAACATAGCTAGCTTGCAAGCGTAAACTAGGTAGCACTGAGTGAAAACATACAGAAAAAAAACTCTTGTCGACATATTAATTATCTAATGTTTATTCCGGCTGTTGACCACTGGGAAGTTTTGAATGACTGTAACCAACTTCTTAACCATTTTGCAATTGCCTGTTGGAACTATTTATAATACAATGAAGGCACATCAGTCGAGCAACAAACAAGCATGAAAATCTGAGCATCTGTTCCCCCGTCCCAATTCGGCCCTTAAACGCTGACGCCCAGGAAATATACTGTGCGGCTGTAAACTACAAAAAGAACATTCCAGTGCTGCATCCTTTACACAGACATGTTGAGAAACATGTCTTTTCTTAGTAGTATGGTATATTTATATCAGAGTCCTATGGATGGAACTGGATTAAAAAACAACATAAAAGTTAAATTAAAGAAATAATGAGAATCAGCCACACATAATTTAAATAAATGGCGAAATTGTAAAATGTGTTGTTTGAGTGTTTACTCAGATTTTCAATGTCAGCTGTGAACTTTACATGTTTTCAGGGGGAAAACATTAATTGTTTGTCCCGTGGTTTAACCATGTTTCCCCATTTGATCATTTCATATTTGTGAAACAGTCCAATGAAATTTGTACAGTTCCAAATTGTTCAGATAAAAAGTGGCACATTCATTAATTAAGGTACTTAATTTAAAGCCGTATTTGTAGGAAGTTGGCTTCTCCTTTGCCACGCTCTCCGCTGTGGGTAATTTTGGTATCCAAGTGCCTGCTGGGGGCAGCTCTTGCTTACCAGCACTTTTAATTCCTTCAGTTTCAGTGGAACGCAGGTGGCTTTAACAGCCACTACCGCTCGCTTCAGTTGGCTCACTTGGTAATGGGACCTGGTTGAACTTAGTGGTGGTGAGTGAGCAAATCTATGATTGGTACCTAGGTTTAGTGTTGAGGGGTGGAATTGGAACAAGGGTTATCAAGTGTCCTGCAGTAAGCAAACCCAAACAAAAGTAGTACTTTGTCCATTTCTGATTTAAGTTTGAACTTGCAATAGAACAGTATAAAGTGAATATATACTCCTGTAAAAGCTCGTGAAGTTGCTCTCAAATGCTGACATGGTTTGATGTCTGTTGCTGGTAACACTGAACAGTTGCATCAGCAAAGCTAGACATTTACATCACCCTAATTTCTTAATCAGTTTAAGTTTATGTATCATGTTCATGTTTTCATCTAGTCAGCGATATAGTTATCCCCTCACAGCTAAATGAACTTCAGCTCGACTTGGCTCCCAGCCAGGCACAAAGGACTAAGGGTTGCAGATTGCAGGAGGCCCCCTAGTTGCTCCTGATTGGCTCTTTACAGTCAACAACCGCCAAATGTCCAGCCATGGCCAACTTTCTTAGCTGACAAGCTTGTTGACCGTCCAAACACCAGCTGAGTGTCTCTGGTCGCTCAGCTGTGTGGTGAATGAATGAACTCCTCGTGAGCTGTTGAGTGTGTTGCTGGTAATCTGAATGCATGGTAAGATTAAAAATGTGCCGACAAAGGCATCGTTAAGAGAAGGTCTTCGAATAGGTGGCTTTGAGCTGATGTGACTTCTGTTTGTTTTCATTTGCACTTTGTGTGTCTATGCGCGCAAGATTGTGTTTGTGTTTGAAAAGGGCAGTGATGTTGAGTCCAGCATTTTGTACTGAGAGGCAGAGTCAACCGAACTTAGCTGGTTGCAGACTTTTTTTTTTTTTTTTTTTTTTTTTGGTGTACAGCACTTGTTGAACAGTGCTTTCAAAGTGTAAATATGACACATTTGTGATGTCTGTCATTTTCACTTGGAACAGAAATATAAAAAACAACACATAATGAACTAAATGTTGTGTAAAAGTTTGCTACTCTACTTGGTATCAGTGCTTTCTACATATCTCTTATATGTCAAATGTTTCATCCATAACAAAACAAAGGCACTTAGAGACAAATCTTTGTTTTTTAGGATAGTCCAAAAATGTTTACTGGAATGTTGAACTATGTGAAAATATTGCTGTTTTTCAATTATCCAACTCTACATCTCTGATGTCTATTACAATAGGTGTCCAAGCCAAAGCGAGTTTGTTGCATTGTGGTCTTCTAACTAGGTGATTTTTTTATTTATGTCATTGAAGGAAAACCCAAAAGGAAAGACTTCTAAAGAATGGAAATCTAACTGGAAGTGTGGGAGTGTTTGTTCTGTTTATTTGTTTGTTCATTTGATTTACAATTTGTGCTTGTTTCTGAATGCAGGATGGTAACACTCCCCTCAGCCCCATTTTAACTCTCATAGAAACCAAACAATATATAATTTAATAAGAAATTATATATATAAGAAATTCCCCATAGAGCAAAACACCACCATGTGGGGAAGGAATCTTAATTTGCCTTTTATAAGAATAAGCATAATTAAAGTCATCAAACAATCATCAATCTCAGTTTTAGAGTCCTGATTTCCAACTGGTTGGAAACAAGAGAGGCTCCATGGGTAGAAAGTTGGGTAATTGAGATCAGCATTCATGCAGTGCTGTAGACTTCTGCTTTAGTGAAGTGGAGGAAAAAATGAAGAAGAAAGAAAACACCTTAATTACACGTTTGCCTTTTTGTATACTTTATTTCGTGTCATATTGTGTCACCTGCACTGTCACTGAGAATTACAAGGTCCTTGCTTCCATTCCTAGTTGGCACCTTATTGTACAGTCGTTACACTGTTAGTCTGTACAAAACGATCTGACAGTTTTATTTGAGGCAAGTAAATGGATAATTCTGCCTTTTTATTTTGCTAGAAAAATAACTGCCTTGCAGGATGTTCTTACTGTAAACATAAGCTAGTATACTGTTTCTTTGAGTAAGTCTTGAATATACAGAACCAATAGTATTTCAGTCACACTGAGGATATTTTCTAGCTTGTCTTGAGTGTTTAAAACAACCACTGATGGTTAAATCTTGAATCTGACTTCTGTTCCTTAGTGTTCATATTCAAGAGAAAGGAGGCTGTGATAGACCCAATAGCATAAATATTGTTATTATTATTATTTTTTTGTTTGTTTTAAAGACATGGAGGGGAGGGGATATACAGAACCAATGAGAGATTAAGTCATCCAAAATGGCTTCCATGTCTCACACAGTGGCCTGAACAGATCTGTTATGGTGCTGTCTTCTGAAACTGTTGCATGGACAGTTTACAGTATGTGAATCTATGAAAAATGCACTGAAATATTGTTAATTTATTACCCCTGTATAAATATGCCAAAACTAAAATGTGTACAAGGCCTAAATTGACCATCAAATTCACTGCCTTATGTGCTCTAGCTTGAAAAGCTGAGCTTTTATTGATATGCCAAAATTGAAGGATTTTGTTCTTTCTGTATACCTAACATAGTGTAACCATGAGAGAACTAAATGTTTGTCTCTTTACTGTTGAAGGTTATGAAGGATGTACAGTATTTTCAGTTGTTGTATAGACTGAATTAAAAAAATGAAATTTTA
>XM_043813081.1 PREDICTED: Vespula pensylvanica cytochrome P450 9e2-like (LOC122629547), mRNA 
GTTAGTAGTATTGAACCTCTCGCTAGCATAACGTTGAGTAGTTTTCCACTCAGGATCTTTTAATTAATCGAGCACACGATGGAGACTTGGGCAATGATCTTGGCCTTGGTAGCAGTGATAGTCAGCATTTATTACTACGTCTTTAAGGACTTGAGTTACTTCAAAAAAATTGGTATACCGTATTTAGAACCATGGCCGATTGTGGGCAACATGGGCCCAGCAATTTTACGTCTGAAATCGCTGATTAATATAATTAAAGACATTTACAATCTAAATCCGGAAGCCAAATACGTAGGCTTCTTCGATATGGGTAAACCAGTTTTCTTTATTCGCGATCCAGAATTAATCAAAATGATCGCGGTTAAGAGTTTCGATAATTTCCCGGATCACAGAGGTTTCGTCGACGAGGTACAAGAGCCACTGTTCGGAAAGAATTTGTTTTCCTTGAAAGGCAATCGATGGAGAGAAACTAGAACGATGTTGAGTCCGGCGTTTACTTTGCGCAAGCTAAAGGGTATGTTCAAATTGATGAACGAATGCGGAGCAGATTTTACCGATTATCTATCGAAAATGCCGAAGGATAAGAAAACTATAGAAATGAAGGACGTCTTCGCGAGATATACCAACGACGTAATAGCCACTTGTGCATTTGGTATCAGTATTAATTCTATGAAAGATCGGAACAACGATTTCTACGTTCTCGGTAGAAAAGCAACCAATTTCGAAGGTATTCAATTTCTGAAATTCTTCCTTATTCGTTCTTTCCCAAATATTGTAAAATTTTTCAACGTCAAGCTCATATCCGGTAATATCGACAATTTCTTCACGAACGTTGTCAAGGAAGTAATCGACACTAGAGATCAAAATAAGATCGTACGATCAGACATGATACAATTGATGATGGAAGCTAGAGACAAGAGAGTCGAAATGGGACAAGAATTACCTCTGATAGACATAGTAGCTCAAGCGTTTATATTTTTCTTTGGTGGCTTTGACACCGTCTCCACGGCCATGTGCTTCACCTGTCACGAAATTGGTATCAATCTGGATATACAAAAGAGATTGCAGCAAGAGATCGACGAGGTCATTGAGAAGACCAATGGAAATCTAACTTATGATATTATCAACACCATGCAATATTTAGACGCCGTGATACAAGAATCCCTACGGAGATATCCGATCGTTGTCTTTCTTGATAGAGTATGCATCGAAGATTTCGAACTGCCACCAAGTTTACCTGGAAAGAAACCTTTGTTAATAAAAAAAGGCACGAATGTTTGGTTCCCAGTTAGTGCACTCCACTTGGACCTCAAATATTTCGAGGATCCGTACAAATTCGATCCAGAAAGATTTATAAAAAATGGAAAGGAGATCAACAATTCCGGTGTCTATTTGCCCTTCGGATTAGGACCTAGAATGTGCATTGGTAATAGATTCGCTTTGCTGGAGATAAAAGTTTTGATATTTAATTTATTGGCAAGATGTAGTCTGAAGCCATCCATCAAAACCCAAAATCCAATTCGATTATCCAAGAGTGGAATCAACTTGTCGGCTGAAAAAGGTTTTTGGATGGATTTAGAAGAAAGAAGCGATGTTCATCCTGCTCTTAAAAATATTGTCTGTAATAATAATTCTGATACTATTAAACTATGTAGCCATTAATGGAGTTACTATTGATCGTACTGTTAAAACTTAAGATATAGAAATGAAATAATGAAAATAATTTTATGAAGATAAACTTATGTAATGGATATATATATATTTTTTTTTCGTGATCGAAATGATAAAACATCGAATTTGGATTAAACGTTTACGTATCGTAGTCGGTGCTATTAGGAATTATCCTCTTTTAAATTTCACACAACTATAAAAGCATAACCTCTTGTCATTGAATTACGTATCGTTTTAGAGATTAATACAACTGAAGCTGTTATTTTATTATTATCTTACGATATAAATAACGTATAATTACTA
>XM_001591429.1 Sclerotinia sclerotiorum 1980 UF-70 predicted protein partial mRNA 
ATGGCTAAAGGGCTAAAGCTTATCACAAATGGCGACGATGCAACCACCCTAACTCAAGCACAGCAGGAACAAGCCGCTGAAGAAAGAATTACTTGGCCGGAGATTGGTTGTATTGGGACATCTTAG
>XM_006974024.3 PREDICTED: Peromyscus maniculatus bairdii hook microtubule tethering protein 1 (Hook1), transcript variant X1, mRNA 
GGTGCCGTGGCACGGGACGGACGCGGTGGGCGAGGGGGGCGGTCGCGCCGCGGCGACGTCGGCGGCGTGAGGCTTCGCGCGTGAGCGGCGCGGGCGCCAGGCCTGACGGCCGAGCTCCGGGTGGCGGGCGCGTAGGTCGTTGACGCGGGCCCGGGCCGGAGGTGCGTCCGTCGCCGAGAGCGCGGCGTCGAGGTTCCCGGACCATGGAGGACCCGCAGCCGCTGCCCCAGCCCGAGCTGCCGCTGTGTGACAGCCTCATCATCTGGCTGCAGACATTCAAGACTGCCTCACCCTGTCAAGATGTCAAACAGCTGACTAATGGAGTGACCATGGCACAAGTTCTTCATCAAATTGACGTAGCCTGGTTCAACGATTCTTGGTTAAGCCGAATTAAAGATGATGTTGGAGACAACTGGAGAATAAAGGCTAGTAACTTAAAGAAGGTCCTCCATGGAATTACAAGTTATTATCATGAGTTTTTGGGGCAGCAGATTTCTGAAGAACTTATCCCTGATTTAAACCAAATAACTGAGTGTTCAGACCCTGTGGAGCTTGGAAGGTTGCTTCAGCTTATTCTAGGCTGTGCAGTCAACTGTGAAAGGAAGCAAGAGCATATTAAAAATATAATGACCCTTGAAGAATCTGTTCAGCATGTGGTCATGACTGCAATTCAGGAGTTGATGAGTAAAGAAATCGTGAGCTCTCCTGCAAGTGACACCATTGGAGAATTAGAGCAGCAGCTTAAAAGGGCATTAGAAGAGCTTCAGGAAGCCACAGCAGAGAAGGAAGAGCTGAAGCAAAGGTGCCAGGAACTGGATATGCAGGTGACTGCACTTCAAGATGAGAAGAACTCACTGGTTTCTGAGAATGAGATGATGAATGAAAAGCTTGACCAGTTGGATGGCTCTTTTGATGATCCAAATACAATGGTTGCGAAAAAGTATTTTCATGCACAGTTACAACTAGAACAATTACAAGAAGAAAACTACAGGCTTGAAGCTGCAAAAGATGATTACCGTGTTCACTGTGAGGAACTTGAAAAGCAGCTGATTGAATTTCAGCACAGAAACGATGAGCTGACGAGCCTTGCTGAGGAAACCAGAGCCCTGAAAGATGAGATAGATGTTCTTAGGGCTACCTCAGACAAAGCAAATAAACTGGAGTCGGCAGTGGAAGTGTATCGTCAGAAGCTACAGGATCTAAATGACCTCCGTAAGCAGGTGAAATCTTTACAGGAGACAAATATGATGTATATGCACAACACCGTGAGCTTGGAAGAGGAGCTGAAGAAGGCCAACGCAGCACGTGCGCAGCTGGAGACCTATAAGCGCCAGGTTCAAGACCTTCACACTAAGCTTTCCTCTGAGTCTAAAAGGGCAGATACACTAGCATTTGAGATGAAACGGCTTGAAGAAAAACATGAAGCTTTACTCAAGGAAAAAGAGAGACTGATAGAACAGCGTGACACTCTGAAAGAGACGAATGAGGAGCTACGGTGCTCACAGGCACAGCAAGATCACCTAAATCAAGCTGATGCATCTACTACAAAAAGTTATGAGAACCTCGCTGCTGAGATCATGCCAGTGGAATACAGAGAGGTGTTCATTCGACTGCAGCATGAAAACAAAATGCTTCGCCTGCAGCAGGAAGGGACGGAGAATGAACGCATTGAGCAGCTGCAGGAGCAGCTGGAGCAGAAGCACCGCAAGATGAACGAGTTGGAAACTGAACAAAGATTGAGCAAGGAGCGCATTGGAGAATTGCAGCAGCAAATTGAGGACCTCCAGAAATCGTTACAAGAACAGGGCTCCAAGACTGAAGGCGAAAGTTCCAGCAAACTAAAGCAGAAGTTGGAAGCTCATATGGAAAAACTAACAGAAGTCCATGAAGAATTACAGAAGAAACAGGAGCTCATTGAAGACCTTCAGCCAGATATAAGTCAGAACGTCCAAAAGATCAGTGAGCTTGAAGCTGCTCTTCAGAAGAAGGATGAAGACATGAAAGCAATGGAGGAGAGATATAAAATGTACTTAGAGAAAGCCAGAAATGTAATAAAAACTTTAGATCCCAAATTAAATCCAGCATCAGCAGAAATAATGTTACTTAGAAAGCAGCTGGCGGAGAAAGAAAGAAGAATTGAGATTCTAGAGAGTGAATGTAAAGTAGCAAAATTCCGTGATTATGAGGAAAAACTCATTGTTTCTGCCTGGTATAACAAGAGCCTGGCGTTTCAGAAACTGGGCATGGAGTCTCGGCTTGTGAGCGGCACTGGTGCTTGCAAAGACGCTGGTGCGGGGGCGCCTGCACGGTCCTTCTTAGCACAGCAGCGGCACATCACCAGCACCCGGAGAAATCTCTCTGTTAAAGTCCCAGCCGCGGCATCTGACTAGTCCGCAAAGCAAACACGAACAGAAGTGCCTCAAAATGTTTTGTACCCCAAGAAACTACCAGATGGAAAACAAAGGTTAAGATGCTTGGTAGCAGCTAGTTTTGTTTGGATTTTGTTTTGAGATAGGGTCTCCCATCCCCCAAACTGGCACTGAATTGACAGCGTATTCAAGGATGACCTTGCCATCTGATCAGTCCTTCCCTCACTTCCTGCATGCTGGGATTAATAGTTGTGTACCACCATATTGGGTGGATACAGTGCTGGGGATCAAAACTTGCACTTAGGTCAAGCCAGCTACCAACTAGCTACATTCCTAACCTGGGTATCAACTATTTTTATGTCAAAATATATCAAGTTAACATTTAAGTTTACTCTGAAAACAAAATGCAAAATCAGCTCTGTCCCTGGGCAGCACTTTTGAGTAGTTGGAAGTGTGATAAAACAAATATTTGTCTTGAGATGGCATCATGTGTGGGAAAGCAACTGCATATTCCAGCTTTATGCTTTCAGTTGTAACAGCGAGTCAGTTAAGGTAGAAAAGTAATAGTTTGTCATTTAGTAATATATCTAGATTTGCTTTATGGGAAGCAGCCTCCAGTAAGGCATGTAGATAAGAACTGTGCAAAGTAATTTCTTTGACCTGGTGTGTACAAAGCTTTCCTCTACTTGCTAGTTCTGTCCTCAAGAGGATCCTTTGTCATGCTGTGGAATCGATAATGCATGGAAGACTTTACTGTTGGAGTGACTTTGTCCTATAAAAGCGACTGATTGGACATTTGCAGTTTCTCTGAGCTGTATCTCAGTTTGTACATGTACTGCTGTGAATGAAGACTTTGGAGGGCTTGACTGAAATGGTAAGGTGGGAAATAAACTGGTATTTCTAAGAGGTACCTTTCTGTTGGAAAGCAAACTAGAAGAATACATGTTGAAATATCCATATGCTTTTGAGCATGAAATTGTTGTGGCCTTTGTTTTCAAAGAAGGGTATAATTTTGCTTTATTACCTGTAAAGAAACAATGATGAAACAGCTTAGGACCAGTTTGGTTTCTGCTTACCTCTTACGGAGTTTCTGGAGCTGGATTTGTGGCATTCAGTTCATTTCTGCCCAGGGTTGTTCTTTTCAGAGATGTTACTTTCTAATTTGGGGTCACTTTTTAAAGTCACACTTTGGAATATTAGTTGTTAAATCAGTATTGATTGATGTAGCCACAAGTGGTTCATTCTTGTGTCAGACACATTTCCAACACTTAGCAGCCACGTTTCCATCATTGTTGAGAGTTCTGGTGTGATGCAGTGTCACGGTAGATCTTGGTTTTGGTAACTTGGGAAAATTCTTTGATCCTTAGACTACAGAAGTGGGAATAATTCATCTCATATCTAGAGAAGAATCAGATGGTGACAAGAATGCAGCAACACAAATGTCGCAGCATTGTGTATACACTGAACGTTAGCAGGCATTCTGTGAGGGAGTGAGCTTGTGGGCTGCATGATCCTTGATTGGTCAGCTCCTCACCACTCCCCTCAGCATGAAAGGAGGGATGCTAATATGTAAACAAAATGGGTGTGAGCCAGATTAAGCTGGCAGGCTGTAGAGCTGTGGTCTACACTTTATTCTTAGTCCTTCATAAATATGAGTATTGTTCTATTTGAAGTGTTAACTCATGTAGATAACTGCCTTTAAATCCTTGCCCAGTAATTTTTTTAACCACTTAACAACACAAGAATTTCACAGTGATTTGGGGTTTTGAGATTAGTGGCATCTGCCAGGATATTTTGTTTTATCAGGGTTCCTTCTGTTGACTACCTCTTAGATTTTTATGCTTTGTGCATTTAAACTGTTGGTTTGCATTTTGGTATGTTCTTATGGTGTCTGCTTGCCTATGTCTTTTAGTGAAATAGGACTTTGGAAAATACTTTAGCATGCTATTTAAAATTTTCTAAAAATTGTGGCATTTGGGTATATTTTTGTTAATGAAGATATTGATGTTAGTGTTTGTATTTGCTTATAATTGAGATTTTACAAGTTCTCTTTTAATGGAACTTACTGTAAAAGATGAACTTCAATAAATTAATGTTTCTAGTGTAATTGCTCATAAATTTCTAAATAACTAATGTAGCATAGATAAGGACATAAGGATAAGTTTTCTTTTCTTAAAGAAAAGGCAGATTTTCTGATTTTTCTAGTTTTAAGTAGAATTTCAAACGTTTGATACATGTTTATACAAAACTATGTAAAGTTCTATATAATTGAGACTAATCACAGAAATTGAGGCAGTGATCAGGGTGATTCTTTCCCTATGTGGTTCATGCAGTGAGATCGGTGCCTGCCACATATAAAGTATACATGTTTCATCTGGAACCATAATTCTACAAATGTGTTACAAGGGAGGACTGAATGTATAAACATGGAATTGACAAAAAAAATTTATGTCCCAGTGATTATAAAGTTAGAAACAATTTTGAATTTCAAGTGGTTGTCCTTGGATTGATATTCCTTTCTCTTTTTGGATATAATTATGACCAATTGTTTATCTTGGAAATTAACTTAATGTATTGAAAAATATTTGAAGTTTATTCTATTTTTTCCCGTGATTAAAACTAATGATTTAATGTAAGTTAAAAATACCTTGCCTAGCATCCTTTAGCAGAGTATCCCTTAGTAAGATCTGGTAGATTGTTGATGACTAGATGTTAAACACTTCAAAAACACACCTACTTTTGTGTAATGTACATCTGGCCTTTGGGAATGATGGTGATTTAGGCCAGAGTAGTGTCACTTTGTGTAAAAATAAATGTATATGGCTCGTTATACATACAGTCTTATTGTGATCTTGTTTATTGCACAGAAATTGGACACTTATAAAGCACAAATCATCAGAGGAAATAGTGTGTAGTTTATTGAATTTGAGGAAGTCTCAGTACAGTGTTTAGTTTATAAAAAGGTCCTTTCTATTTTCTATGACAAATACTGTCACACTTGAAAAATAGATGCAATACTTGATTTATTTTTGTAAGTATTTAGAATATTATTTTAAATAAATGATTGTCAATATAATTGTGAAATGTTTTGAGTAAATAAACTTCTGCTTCTGTA
>XR_008312440.1 PREDICTED: Hemicordylus capensis uncharacterized LOC128337805 (LOC128337805), ncRNA 
CGGAGGGTGGCGGACCGCCAGAAGGGTGGCAGAGGCCGAAGGAGATGCAAGAGAAATGGATTGGGAAGGGCAGGATCATCAGAGGACCAACATCTCCCCAGCATAAAGACACTATCGTGGAAATGCAGAATGCATCGGACAAGTACCTAGGCATGCTGCTGACCACCTGTTGGATGCTCACCATGTCCAGCGAAGGGCCATCACACGCCAGACCATTGCGCCAGCTCCCTGCGCTGGTTGGAGCCGCTTCTGGGAGTTCAACGGCCTCCTTCCTCCCACTTCTGGCTGGAGATTCTTCTGGCTGGCAGCAGCACCCTGAAGCCAACACGAGGCTTCTTCCCATCTTGCACTTTGTCCAGGTGGCACCAGCAGCAGCAGCAGCAGCAGCAGCAGCACCAATATTTATATACCGCTTTTCAACAAAAGAGAACAAAGCGGTTTACTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCATATTTCTATGCCGCCTAATATGTACATCTCTAGGCTGTTTACACAGAGAAATAATAAATAAATGAATGAATAATTGA
>XM_024685516.1 PREDICTED: Selaginella moellendorffii transcription factor TCP20-like (LOC112350051), mRNA 
ATGGGATCTAGTAGCGAGGTCTCGGAGGACATCGAGTGGCACTCCCCGGGAGGAGTGCCAGCGGCGGCTGCGCCATCGCCAGCCCCGCCGGAGGAGGCGAAATTGATCGCGCCCATCAAAGGCAAGCGGAGCTGCGGGATCAGGAAGAGGAATTCGAGCGTGAAAAATCGCAAGGCTGAAGTGGTGGAGGAGGAGCCGGAGGAGAAGAAGTTGAAGAAGGCGGCGCCAAAGCGGAGCTCGACCAGGGATCGCCACACCAAGGTGGAGGGGCGGGGGCGGAGAATCAGGATGCCGGCGGCGTGCGCCGCCAGGATCTTCCAGCTCACGCGGGAGCTGGGCAATAAGTCTGAGGGCGAGACCATCGAGTGGCTGCTCAAGCAGGCGGAACCTTCGATCATCAAGGCCACGGGCACAGGTACCATCCCGGCGCTCGCCTTCTCAGTGGCGGCGCCGCTGGCCCTCCGCCAGGCCGCCGCCAATTACGTCTCGCCGATCGCCGTCGCCACCCGCTCCAGCCTGCCGCTGGATTTCGCGGCGCCGCGAGTGGACAACGCTAACGCCACCACCACCACCACCACCACCACCACCACTATCACCACCGAGGGTGGCGGCGGTGGTGGCGGTGGCGGCGATGAGAACTCCAACGAGAGCCATCGAAGGTACGAGTTCCAAGAGAATGGGGACAGTGGATCCATCGGAGACGATCATGGAGAGGGGAACGCCAAGAACTTGCTCACTAGCTTGAAAGATGATCCACGATCTCTCCAATCCAAGCAACAGCAAGCTCTCGACGACCACCACCAGCATGACCAAGAAGAACTCGCGATCCATCACCAGCAGCAGCAAATCTCTTGGCCCGTGCCAAACCTGTGGATGCTGCCAGTTCCATCTATGGGTGATCACTCGTGGGCATACACCACTTCGACTTCGTGTCCCTCGAGCTTCTCATCGTCGGCGGCGATGATCCAGCAGCAGCTCCAGCGGATGAATGCGAGCAGCCTGATCGAGCTGGGGCCTCTGGGATCGATGCTGGCGATGCAGCATCACCCGGATCTTTGCGCCCCTGGCAGCGATAACTTCAACCTCTTTGCCGCGACGTACCACCACCATCTCCAACGCCAAACATATGATCCTCACGTTACTTCACGAGACGATAGCGGCTAG
>XM_053129038.1 Zychaea mexicana uncharacterized protein (BDB00DRAFT_931432), partial mRNA 
TGCCACGATGGCCCTGGTATCCTCACAGGCTGTTACCAGAAGTGTCATCGCCATGTTAGTCCAGCCATCGAGGAAACCATCCACCCAGATATCCGGACTGCACCTCATCGACTGACTCCCACGAGCACCGTGACCGCACCATCAGCAGAGCCTGCAGATGTTTTTCCGTTTGGTTATGATATTGGGAATAGCCGCCGTGCGCAACGAGAGCGCACCCAGAACGCAAGCAAACGAAACGCAAAGGCGCAACGCACACCACAGAGGAATACCAAAGATGGCGGAAGAAAAGAAAGGGGGGCCGGAACGGAAGGCAGATACGGAACATACTGAATAGATCTTGGTGAAACACCGATCAGCTATGCTCAGGAAGAAGTTGTCATTATTGGGATCACGTAATTCAC
>XM_050140454.1 PREDICTED: Microtus fortis uncharacterized LOC126500504 (LOC126500504), mRNA 
CTCGGATCCCCCGCACTCCCGGAAGAGAATGTCCACCGCTCCTGCGGGAGAGGAAGGCGAGTTTTGCAGCCATGCTCCGCAGAGTGGCCCGGACCGTGGTCCCAGGGCTCAAGGTGCCCTGGGCGCGGTGGTCTAGGAACTGGGCGGGGGTCCCAGACCAGGTGGTAGACCTGCGCAGCGACACGGTGACCCGGCCAGGGCCGGCCATGAGGCGCGCCATGGCCGAGGCGGTCGTGGGAGACGACGATTACGGCGAAGACCCTACGGTCCTCGAACTGCAGGAGAAGGCTGCAAAGCTGCTTGGGGTGGAGCAGACCCTGTTTGTGCCAACCAACACCATGGCCAACCTCATCTCTGTGATGGGTCACTGCCGGCGCCGGGGTTCCCAGGTCCTCCTTGGGCAGGAATGCCACCTCCACATCTATGAGCAGGGCGGGGTGGCTCAGATCGCCGGGGTGCATTCCCAGCCCCTCCCAGACATGCCCCATGGCACCTTGGACCTGAACGAGCTGGAGAGGGCACTCTCTCGGGGTTTCAGGAACTCCTACCATCCTGTCTGTGAGCTTGTGTGTCTGGAGAACACACACAGCAGCGCAGGGGGCCGGGTCCTTCCCATCCACTACCTCCGCCAGGTGCGCCTCCTGGCCCACGCCTACGGAGCACGGGTCCACCTGGATGGGGCGCGGCTGATGAATGCAGCTGTGGCTCTGCGTGTGCCTCCCGCCCACCTCGTGGAGCACTGTGACTCCGTATCCTTCTGCTTCTCTAAGGGTCTTGGTGCACCAGTCGGGGCGCTGGTCGGTGGAGCCAAAGGCTTCATTGAGGAAGCCTGGCGCCTCCGCAAAGCCCTGGGTGGAGGCATGCGCCAGGCTGGAGTACTGGCTGCGGCTGCCATGGTGGGACTGGCTGAGGCAGAGGAGGTGCTGCCAAGAGATCATGAGAATGCCCGGAGATTCGCTAAAGGACTCCGGGACCTGGCATCACCCATTTGCTCCGTGGATCCCGACACTGTGGAGACCAACATGGTGCTGGTGCAGGTGGCGGGGCGGCCTCCTGCAGAACTGTGCCAGCGCCTACAGGCTGTGAGCGCCGAGGAGGTGGCTCAGACTGGCCGCGCTGTGAGCGTGCTGCTCTTTCCCTGGACAGAACACTCCGTGCGGGCCGTGTGGCACCGGGATGTGTCTGCTCAGGACACGGAACTGGCGCTGAGGAAATGGGAATTTGTGCTGAGGCAGTTGAGGCCCTGAGATCAGGGGACCAGGAGCCCTGTGCCCTGGCTAGGATTGAAGTGTAGAGTAAGCTGGTCCAAGCCATTAGCCTAGTGGAGGCCCGCCCTTCTGGGGGATGACGACACCATTCCGGCCTCTGAATTCCTCCACTGACACTCATGTGATGGCCTCATTCAATCAGGAACAACCAGGCACGGGCTGGGATAAGAAGGGGCTGAATATCAAGAGAAGGGAATGAATTCAGGAAGCAGACCTGGGGCTGGGACGTGCAGCGTGACTGCCTGGTGTGTGTAAGCCCCGGGTCTAGTCCCAGCACTGTATAAACAGGTGTGTTGACTCACACCTGTAATCTTAGCAAGCTGAGAAATTAGAAGTTCAAGGTTGGGCTGGAGAGATGGCTCAGGGGTTGAGAGCACTGGCTGCTCTTCCAGAGTTCGATTCCCAGCAACCACATGGTGGCTCACCACCATTTGTAATGAGATCTGGTGCCCTCTTCTGGCCTGCAGCCATACATGCAGGCAGAGCACTGTATAGATAATAAATATTTTTTTTTAAAAAGTTCAGTCATTCTCAGATACAGAGTTTGATTCAACCCTGGGCTACATGAGACCCTATCTGCAAACAAACAGATCCTGTGTGACTGGCATAGTTATTAGAGATGGACTGTAAAATAATAATGTGGGATTTCCTTCTGTGTGCTGTGATTACCATTAATGAATAAACTGCTTTGGGCCTGTTGATAGAGCAGAACTTAGATAGGCGGGGAAAACTAAATGGAATGCTGGGAGGAAGAAGGCGGAGTCAGGGAGCCGCCATGGAGCAGCCAGAGTCAGACATGCCAAAACTGCTGATAAGCCACTGCCACGTGGTGATACACAGATTAATAGAAATGGGTTAAATGAAGAGGTAAGAGTTAGCCAGTAAGAAGCTAGAGCTAATGGGCCAAGCAGTGTTATAATTAATATAGTTTCTGTGTGGTTATTTTGGTTCTGGGCAGCCAGGATGAACAAGTGACCCTTCCCCCAATAAAGTATTGAAGGAGCTGTATTTGTACTTTTAT
>XM_025755560.1 PREDICTED: Arachis hypogaea protein LURP-one-related 10 (LOC112703951), mRNA 
TGCATGAAAAATATGAGAACCAACTACTTCATCTCCTATATATGATAGTGTTCTTACTTCTTACAACTGAAAAAGGAAACTCTTATCAATTAATTTGTGAAGTAATGGAGGCAAGTGCACCTGATTTTGCATTGGCACATGGGTTCCCCATGAATATGATAAGTGTAGTAGATGATAAGTTCTATGTTGCAAACCCAACAGAAATGATTGTGAAGAAGAAATACAATGGATTGTTGTTGAAGCAACGTTACAAAGTGAAAGATGTTAATGGGAAACTCTTGCTTCAAGTTGATGGGCCAAGCTTAAGCATCCACAAAAAGAGGGTTATGCGTGATGCTCAAGGTTCACCAATCCTCATAATGCAAGAGAAGGTTAAAATGGTATCGCTCCGGCACAGGTGGACGGTTCATAGAGGGAAAAGCTCAGATGATAAGAATGTGATATTTGGGGTGAAAAGGTCACACCCAATGGACATGAAACCACGGCTTGATGTGTTCATGCCTGGTAATACTGATGAAGATGTAAGCAACTTTCAAGTTGTTGGTAGCCACATTCAAAAATCTTGCACTATTTACAAAGGTGACACCATCATTGCTCAGGTAAGTGATGTGTTCCCAAGCAGAAACTTCAGCAAATGGAAAGAAAGCTATAAAGTGAAGATTAATGAAGGGGTGGATTATGCTTTCGTCATGGCATTACTTGTAATATTAACCGTAAATGACTACATTTGAATTTGGTTTCCCTCAACATTAAATCAATAATAATAATAAGAAGTAGGAGTGGGAATATGTACCTTACCTGCAGGTACCCAATCCGATCTTACCTGATCGGGTAGGGTTGTCAACCCAATCCGCAGCGGGTAGGGTAGAGTGCGGGTAGGATTTTCATGTAGGTCGGATAGAGTGCGGGTTGAACTTCAATCCTACCCGACCAACCCGCACCCTATATATGTATATGTTATATACTTATATAAAAATATGTTCTAAGTGGATGTTGAA
>XR_004838883.1 PREDICTED: Vespa mandarinia uncharacterized LOC118444101 (LOC118444101), transcript variant X2, misc_RNA 
GATTTATATTTAATTTAAAAAATTTTTTTTCTTCAATAGTTCCTAAATAAAAAATTATTTCTTATTTTCAAAATCAAAAATGATAGTTCCTAAATATCTATTTTAATAGTAATAAAGTACTTCAATGGCAAAAGTTCGTAAGTCCATATTCTAAATTATATCAATCTTTAAATTAATTTTATGAAGAATTAATATTAATAGTACAATATGAATATTATAACAGAGGATGATAAATTTGTCCCATTACATTTTGTATTTTGTAATTTTTATGGTGAAGATACATGTTTTTGTTGGAACGATGATAAATTTGTTATGTTTCCATACATACAAGAAAAATATACATCTTTGCTGCCAGTTTTGATTGCACCGAGGCAAATAAAAACTATACAATGTTTTTCCAATAGAGTTTTCTTTACATGTTTACCCCATGGTGTATATAAACTTTCAAGAGATAGAAGATTCAGTGTATTAAGTAAAAGTGCTATAAGTGTTGGTTCCATATTTTTTGAGATACTTAAGACAAAGGATGATCACTTATATTTGGAAAATAAACAGAACAAATCGAGTAAGATATTACTCCATTTGCCACTCATGTCAAAACAACTAGAAGAATTATGTACTTTTCCTTTGAACATGGAAAATTCAGAACATGAATTTAGAAACATATTACTAGATGAAATTGATATGGTAGATAATTTATGTTTGATTGGTAATGGTAAAAAGTTATTTACTTTAACAAAAGAAGTAATTCATTTAATTCATAGTTTTGATAATAAAATAATAAACATTGTACCTATACAAAATGACAAAAAGATTAATGGATTAGTACTTATAACAAATACAGATGCAATTATCATTGTGCATTCAAAAAATAATATATTACGCTATAAAAAACTTTATCTAGGAGTAAATGTTAAAACCCTTTGCGCAGGACTTAATCATCAATGTAGCGATAAAATATGGATTGTTTATTCCGATGAATCCAAATTGTATTACATGATAATGACACTTTCTACCGAAATATATAAGAAAGTAAAAATAGAAGAAAAAAATTTTATTTGCCTGCAATATTATGAAAAAGATAAATTTGTAGGTCTAACTAAAACAAAAGAACTTCATGAATTATCCATTAATACAATAGAAAATTGTGTAAATGAAGAAATTTCCAAAGATGATTTTATAAATCTTCATAAAGATATGTTAAAAGGTACAGATTTAATTGTTGAACAAATCTATGAAAGAGCAAAAGAATTAGAATTGTGGAATAAAATACTTCTTACTGAAGAAGATAAACTTTATAGAATAAATCTTTATGCTTGCAGAAAGAAAATACAAATGTATCCTAAAATGACAGTATATAGAATAGCAAAACAATTATTTCTTAATATAGATTTTCAAGAAAATTTACCAAAAAATGTTTATATTGTTTGTTTCTTAGTATCCAATCATGAAACAACTTTCTCTATCAAAGAAATAGTAAATAATGAAACTTCAATCGATTTACCTATAGTAACAAAAAAATTATTTAATTCTTTACAAATCAGAATGGATTTAGTAACAATCATAAACGTAGAACAACCATGGTTTCTTATAAAAGATTTTGTAACAGATCCAGTTATAGAGAAGAAAAAGAAACAAAAAGAAATGCAAATTAAGAGAGATAAAACAAATTTTATAAATGCTAAAATAAATCTTATAAGGAATTTAATGTTGACAAAAAACTTAACTATGAAGAAATTATCAGAGATGAAAAAGAAGATAAGAAAAGAAATATGTGACTTTTAATTTAATAATGTAAGCAATCATTTCATAACATAAAATGTCTTATGTTATTACTATCACAATTTTTTAAAAAAGTTTATAAAATCGTTTATGTAATTAAGAACTGGGCATTTCTATTATACTTCCAATACTGCAACTGGAACTCTTTGGTTGTTTCACAGAATTTCTAAAACTATTTTGTATTCTGGGACCACCAAGTCGATCTTGAAGTGTATCTAATGATTTAGCACTTTTCTTCGAACCATTAGCACTACGATCTTCTTGTTCATCGTTTTTATTGGAACGACGTTGTAGAATTTTGGTAACACAGACTTTAAAGTTTTCTGAGAATATACCATAAAGAATAGGATTGACCACTGTATTCAATTGAGCTGTAATAAGTGCCCAAATGAAATGATGCGATCTCATGAAAAAATCAGTTTGTTTAGGTGGTCTCTGAGCATCAATGAAAAGCAAGAGAGCGATGATCGTTATTGGCAACCACATGACTAAAACGGCAACTACGTTTAATAATAAAATCCGCATGACACGTATATGCTTGTGAAGACGGACTTCCTCGTGTTGTGACATACTACCAGTTCTACCAGTACGTTCTATAACTGATGATGTAGATAATTTTCTTCCAACCCATGGTATTAATGATCCTACCACCGATAATTCCGAATCTCTTCTGTTTCCTTTACCAGTTGTTAAGTCCTATAAGATATAAAATTTATCAAATTAAATTAAAAAGATTTAGCAA
>XM_033905725.1 PREDICTED: Pecten maximus uncharacterized LOC117343383 (LOC117343383), mRNA 
TACCGCCAGAGGGCAGTATGTCTCGCATTACTTCCGGATAGTTCAGTAAACAATGGCGGACCGTAGCAACAGTATAAACAAAGAGAATGAAGACGTGAACCTGCAGACAATTGATCGGCTTACTGTTCAAGAATTGAAGAGTTTTTTGCGCCAGCATGACCAGCCAGTTAGTGGACGATCAACTGAATTAAAGGAACGTGCGAAAGGTGTGTTGAAACTTGGTATCAGACGGAAAGATATACTACAGCGGGAAGATGAAAGACAATCCACTCTCTACCAAGCCCGTAAGTTCGTGTCCCCTCTTGGCGAAATTTTACCCCACCCATCCACATTGAAGAACTGGACCGACAATGCTAGGCAGATACCTGTGTTTCTAGAAGATGCCTTATATAATTACCTTGTTCTGAACAGACAGCGGACGTTTGATAATGCTCCAATGGGTGCTGTTAAACAACTTAAAGCAAAGGTCTTCTATGAAGATAGTCATGTTCACCATATACGATACAGCCCTATCACAGACCTCTGTTCTCACTGTTATGTATCATGTAAAGTGGTACCATCCATGCCAACGGCAGATGTGAACAAGTCTCCTGACTACAGTGTTTGGATATGTATATCGAAGCAGACTGGACAAGTGCATGCAGCTGATTGTAACTGTCCTGCAGGAAATGGAGAATCGTGCAACCATGTGGCAAGTCTTCTGTATGGCCTTGTTGACATCACAGAGAAGAAGCAGTCTGGGGAATTAGCGCCAACCGCTGAACCCTGTAAATGGAGCCAGCCAAGAAAGAGGAAATTGTCCCCCAAAAAGGCAGAACAGATGAAATTTCGAAAATACACAAATACTGGTAATGCTGATAAATCAGACTACACATTATTCCGACCATCTGGAGTTCAGCCACCATTGGATAGGAATTCGTTCCTAGCAGAGATGAAGGAAGTCTTGCCAAATGCAGGGTACATGAAGCTGTTTCCAAAACAGAAAGCTCCAGAACATGTCTTACAAGAGTGTTGTTTACCAGAACCAAAATTTAATTTTCATAATAGTGTAGACTTGTCTTCAAGTGCTTGTCAGATTGAGTTTGATAACTATGTACAGGATTTGATAGACAATAGTGCATGTACAGATACTATTGAGGGATTGACCAAAGGACAGAGTACAAATGATGTCTGGCTGAAAGCAAGAATAGGGCGGATCACAGCATCGCGTTTCGGGGTAGTGTGTCGCAGGAAACAAGATGTAAATCCAAACAGTCTGGTAAAATCTGTAATGGGTTATTACTCTGATAAAACCAACGATGGAATGGAATGGGGGATTAATCATGAAAGAACAGCCAATCTGGAATATATTCAGAAGATGAGAAGCAATGGTCATAGCTCAATAACTGTGCAAGAGAGTGGACTGTGTGTTATGGTAGATCATCCATATATAGGTGCTAGTCCTGATGGTTTTGTTTCATGTGGTGACTGTGAAGACAGTAAAGGACTGGAAATCAAATGTCCTTTCAAATATCGAGACTTTTTCTCCAAAACATGCTGCTACACATAA
>XM_034976728.1 PREDICTED: Maniola hyperantus cytochrome c oxidase assembly factor 6 homolog (LOC117989378), mRNA 
AGACATTTGTCAAATACGAAATATCCGTCCTACAATTTTCTGCGAGGTTATATTTTGCTCTCAAGATAAAAAATCGCTAATTTCATTATCTAAATCGAAAGCTTCATCAAGATTTGATCTTTGAAACAAGTACATAGGCTCAAAGATGTCATTTCCTGATAAACAACAACGAAAGATTTGTTGGGATTCTAGAGACCGTTACTGGGAATGTTTAGACGATCAAAGTATAAAAGACAATTCGCTAAAGCCTAAAGTATGCGCGGAGCTTAGGAGAATATTTGAAAAGTCGTGCCCCCCCAAATGGGTGACCCATTTCGATAGGAAGCGAGACTATGAAATATTTAAACAAAAAATGCAAAAAGAGGGTTTTGACCCTATTAAAGACAGTAAATAATTACTCTAAGTAATTTATTTAATTGTGATTGTAAATATAGTTTATTTATTTAGTGAAGTAAATTGTTTTTATTT
>XM_046179821.1 Filobasidium floriforme uncharacterized protein (HD553DRAFT_310221), mRNA 
GCGAGCTACGTATACATCAACCGGTAAACGTAGCTGTCGAACAGGCCACGTTAAGGACTTCCATTAGGACCGAGAAATGCAACTGACCGACGACCGACCTACCCGGGTCAACCGATATTCGGCTCCCCCCTTCTTCCCTGTACCGGCACTCCTGCTCGTCCTCATACCTTTCCAACTCTTCGTACACTTCTCTTCGCACTCGATAGCCGCCTACGTCAAGGATACAGTCGAGGGTCTTCTCGGGAAGGGGTTCGTTGCTGCGAGTTTCAAGTTTCTGCTCGGAGCCGTAAGCACCTCTTGCCCGTCGTCCACCGCATTTCGCCGTCTTTACAACTTACCGGACTCGACCTTGTTTATCGAAGCACGGAGCGGAAGCCTCGTACATGCTATCCCAATGCATCAAGTATCACTGCCCAGCGGATGTTGGTGCCAAGTACGTCGTGACCACCCTCTTGTTCGGGTTTGTGGGGATACAACAGTTCAATCGGCAAGCGAGGATAGCGGAGAAGGGGAAATCCAAGGGTCTTTGATGAGGGAGACGCTTCTATACCGGGCTTGTGGCCGTACAAGAGATGTCGAGATTAGGATGATCAGAGATGGACGAGATGATAGTCCAGCTGGCGATCGCGATAGCTGTTCAGCTAGCTAAAGGCGACCTGGGTAGTCTTGACCATAACCGTGCGTTTTGCGGGTATGCGAGCCGACAGTATCAGCGGGAGGGATCGGAGACCATGACAACAGATGACGGAGAAGTTGGGCATGGTCATCGGGCTTCTCTTCATGTTGTCATACTTTTACATCTACTCTAGGCGAAATACAACTCGTGACA
>XM_009314119.1 Trypanosoma grayi hypothetical protein partial mRNA 
ATGCCCTCAACGGGTTCCGGCTACACCTTTGAGGACTTCCTCAAGCGGATGGAGCGCAGCCCCACGTCACATATGTCGCCACTCTACCACGAGCATCGGGAACTATTCGTTGGCCGCCCCGACATGTTCACTCGCGCTATTAGCTCCGTTTCGTGGGAGAAGGGGTGTGCGTTGGTCGACGCCGCCTACCACTCGCAGCCCATCGCAGTCGACACGTACCGTGCCCTGCTGGCCCGCATGTTGCTGCACAATCGCCATGTACAGCGCAGCGGTGCCGGTAGCCTTGTTATGTGGAAGGCGGCCTTCCGCACATACTCGGAGGCCATCCTTTCCCACGGAAATGCTGTTCCCACACGCATGACTTTATCCACGCTGCGCTTGCTTGCTCCGCACCGCCAGTGGGAAGCCGCCGTGTCTTTACTGAAGCTCAGCCAGGCGAACGAGAAGCTGACACTTCCGATGCTTGTTGACGCCGCTCGTTGCTCAGCGACGCCAGCGACGTGGCCTATGGCATTGGACTTTCTCAGCATGGTGCATGCGCAGGCACCCAACATGCTCGCTGATAGCATACAGAGTCTGCGGCCGCTTGGTACAAGCGCCGCAACAGTATCTGCTGCTGCGAATGCGATGCTGGTGGACAACAGCAAGGGGCCGACGGCAGAACAGAGACACGTTTTGTCGGTGCTTAACGATGTGGTAGCGGCTGTGCCATGGAAAACGGCACTGTCGAACGAGATGTGTGTGTCCTACCTCACGTATCTTGCCGCGAGTACGACGTACCCATCGCAGGAAAAGACTGTTGCGCTCACAGCCGTGTTGCGGCAGTACCCGTGGGAGGCATTCAAGCAGCTGATGATGAGGCAGAGTGTTGTGCTGCCGGCGGTCTCTGGTGAGGCCACTTCGCCGCCAATCCCGGAGGACAAGAAACTGCTGCATCAGCAACAGGAGTATAAACTGGAGGCTTCACCACTGAACTACCCCGCAGTTCAAGAAAGCCTGCTGCTGCTTAAAAGTGAACCCGAGACAGCGGTGCCATTTATTGCAGCTATCGTTGAGAAACTTCCTTCCGCCGAGGTCTCCGCCTCGTTTCTTCACGAGACGGCCGACATACATCGCGACACTAGGGTTGCCGCTGCGCTGCGCCACCCCTTGGTGGTGAGTGCCCTGCTGCGAAAATGCGCGGAACATAATGAATGGCGTCTCGCGTCCTCGGTAATGCTGTCGATGTCCCCAAGCACGATTCCATGCGACGTAGCCAGCACGCTCGTGCTGCAGATGCGGGCTGCTAAACAGGCATCCCTGGTGGTGGAGATACTACAAAAGTGCATTGTGCCCTCAAGGACCATGCTGACGCAAGAAGCAATGGAGGCGGTGCTCCTGTGTGTGCTCGCACATAATCGCGCCATAACCGAAACCGCATCACTCACATTCCCCAAGACGCGAAATACGAACACCACGGCAGTGATACACTGGCGCTCTGCGTTGAGTTGGGCGGTGGACTTGCTGCAGGACGACACGGAGGGACGCATTGTGGAGACAGGCTCCGCTCCCTCCAAGGGCGCCGTGAGACACACGCATACCAAGGTGATTCCACGCCTAAAGCCCATGTCTTCTCGCATACTCAGTCTTCTTATTCACATTTGTGTGAACGCCGGTAGTCCGCAAGGAGCATTGCAGGCAATGGGATATGCTCGCACTGTCAACAAGACGGAGTTGGCCATGTCAGATGAGATCCAAGCGCTTCTGTACTGCATGCTGTACGACCG
>XM_020925385.1 PREDICTED: Boleophthalmus pectinirostris protocadherin beta-15-like (LOC110160707), mRNA 
ATGATGGAGATTAAAAGGCCATTTGCAGTGGGAATCAGCGCGTGGATCGTTTTGTGTTCGGCTCTACTGCTGCTTTTTGGACAGTCCGTTTTGGCTCAGATCAGATACTCTGTTCCGGAGGAGGTGAAGGACGGGACTGTGGTTGGAAATGTGGCAAAGGATCTTGGTCTTGATGTTGCCTCTTTGGGTGAGAGACGGTTCCGTATTTCTGAAACAAAGGACACTATATTTGCTGTAAACTCTGATAATGGCGCTTTGTACGTCCACGGGCGCATTGACAGAGAGCAGCTGTGTCAGGGCAGCGGTACGTGTCTGATGGAGCTGAAGGTTCTGGTGGAAAACCCTTTGGAAGTTCACTATGTTGTTGTAGAAATCACCGATGTAAACGACCACGCGCCCACCTTTCCCAAAAGAAATGAAACCATAGAAATAGCGGAACATACCTTATCTGGAAAACGATTTCAGCTGCACTCTGCTCATGATCCTGACGCAGGGATGAACTCAGTCCGCACGTACAGTTTGTCTGCTAATGAACATTTTGACATTAATATTCGCGAAACTAATGGTGAAAAAATACCATTTCTAGTTTTGAAAAAAATGCTGGACAGAGAAAAAAGCAGTGAACATTCTTTAGTGGTCACAGCGGTTGATGGAGGTAAACCCCAGAGGTCAGGCACACTTAATGTTACCATTATTGTTCTTGATACTAATGATAATAGACCAGTTTTTAGTCAAGAGATTTATGAAATTACAGCGAAAGAAAATCTACAAACAGGCACGTCAATTTTTAAGCTCACAGCTACAGACCCAGACGAAGGAACAAACGGAGAAATTGATTATAGTCTGGCAAAAATATTAAAGCAAAGAATCTATGATATTTTTGAATTAGACACGAAAACAGGAGACATTGTTGTAAAGGGGCACATCGATTACGAAGAAAATGATTTCTATGAATTGGAAGTGCAAGCGTCAGATAAAGGCACACCTCCATTAACAGGTGAATGTAGAGTTATTATAAAAATCATAGATGTAAATGATAATTCTCCAGAAATAGACGTGACTTCTCTGTCAAACACAGTGTCTGAAGACTCCAAACCAGGGACAGTAGTTTCTCTCATTCGCGTCAAAGACAAAGACTCTGGTGTCAATGGTAAAATCATCGCTCACATAACAAACAACGTGCCTTTTGAACTCAAACCCTCGTATAAAGAAAACACATATTCAGTTGTCACTAAGGATTTCCTGGACAGGGAGGAGGTGTCACATTATGACATAACTATAAAAGCCACTGACTGTGGGGAGCCTCCTTTATCCACCACTAAAACTCTGAGTATTCAGATATTAGATGTAAACGACAACAGTCCACAGTTTGAACAAAATCCTCTGTACTTTTATATTGTAGAAAATAACGTGGCAGGGACGTCACTGTTCTCTGTAACTGCATCAGACAAAGACAAGAATGAAAACGCAGATATTTCCTACAGCATTGCGCGTGCAGGACAGGAGAAGGACGTGACGCTCTTTTTAAACGTGAACGCGGAAAATGGTCAAATCACTGCTCTGAAAAGCTTTGACTTTGAGACATTAAAGTCTTTCCAGTTTCAAGTCGTGGCCTCAGACTCTGGGACTCCGTCACTGAGCAGCAACGCGACAGTGCACGTGTTCATCCTGGATCAGAACGACAACGCTCCAGTCATTCTGTATCCAGTCAGGTCTAATGGTTCTGCTGAAGGAGTGGAGGAGATCCCCCGCAATGTGAACGCGGGACACTTGGTGACTAAAGTCAGGGCCTATGACTCTGATATCGGATATAACGGCTGGCTGCTGTTTTCACTGCAGGAAGTGACTGACCACAGTCTGTTTGGGTTGGACCGCTACACAGGACAGATCAGGACACTTCGCTCGTTCACAGAGACAGACGAGGCCGAGCACAAACTCGTCATACTGGTCAAAGACAATGGCAACGTGTCCCTGTCAGCTACAGCTACTGTGCTCGTGAAAGTGGTGGAGCCCAGAGAGGCTTTTGCAGCTTCTGACGTTAAGAGCTCCTCTAAAGACTCTGAGGACACTAACGTGACTTTTTACCTGATGATAACTCTGGCCTCGGTCTCAGCTCTGTTCATTCTCAGTATCATTGTGCTGATTGCAATGCAGTGCTCCAAGTCCAGCACTGACTACACCTCCAAGTACTTACAGGACACAAACTATGACGGGACTCTGTGCCACAGCATCCAGTACAGATCTGGAGACAAGCGCTACATGTTAGTTGGACCCAGAATGAGCGTAGGATCCACTATAGTCCCAGGGAGCCAAGCCAACACACTGGTGCTGCCTGACAGGAGGAGGCCCTCTGAGGAGGACACAAACTATGACGGGACTCTGTGCCACAGCATCCAGTACAGATCTGGAGACAAGCGCTACATGTTAGTTGGACCCAGAATGAGCGTAGGATCCACTATAGTCCCAGGGAGCCAAGCCAACACACTGGTGCTGCCTGACAGGAGGAGGCCCTCTGAAGAGGTAAAGAGACAAGCGCTACATGTTAGTTGGACCCAGAATGAGCGTAGGATCCACTATAGTCCCAGGGAGCCAAGCCAACACACTGGTGCTGCCTGA
>XM_042877628.1 PREDICTED: Lagopus leucura von Willebrand factor D and EGF domain-containing protein-like (LOC122183568), transcript variant X25, mRNA 
TTGCTCAGTCCAAATGCCAGGAGGCAGTGCTAAGATACAAATTTTTAACTTATTTAACTGTTGGAAGAGTTGGGTATCACCTACATGGCTAATGTGATATCCCTAGCTAGGGATGGTGAAGTCCAGGTTCACTGGGAAGATAGTAGTAAGCCCTTAAGTAGCAAACTGTTGCTGGGCTTCAATACAATCACATCTGATAGGAAAATCAGAGCAAAGATACAGGCCCTCCCCATGTTTTGCTGGAGCAAGACTCTGCAGTGGCTTTCTGCCTGTATTTCTGAGGACTTCTTGATAAACTAATGATGATTTTCACCGTGTTACCACAGTGGTCAGCGTTGCATTGTGTCTGACAACAGTATGCTGATAGCTCAGCTGGCAGGAGTTTTGCAAGAGATCAAGGTGCAAGGTAACAACCAGGCACTCCACATAGGAAGCAACCCAGCTGGAAATGTAAGATAATATCCAAAATAATTAAAAGCTCCTCACACTATATTTCCTGCTCGCATTCTGTCTCCAAGACATCTTCCACGGGAGCAATTCAGCTCTATGTATACACTGGGACCAATTCTGCCCTACTGAAAATATGTGGAATTTCATGGCTGACTTCTCCAGGATCAGGATCAGTCCACAGAGAAAATATAGTGTGTTGTGTGTGTTCGGACCATCAAACCCCAAAGCTGACCCTACACCCTATGCACAGAACCTCACCCTGCCCAGCAGAGATGTGTAGGTCGAGACTCATCATGGAACTGTCTGCACTGCCTGGAGCACAAGTTCAGTGTTTAGTGCCTGAATGCAAACTTGGTTCCACCCATGAAGACTCTGGTGCCGCAGCCCCAGAAGTTTCTTCTCCCTCTCTCCTTATGCATACGTATATGGAAATGTGTCTGAGGGCTGCTGATCCAAAGGGGCTCCTTGGCAGCAGGGAGGGAGAGATGCATGGATGATTGTCCTGCACATTACAAACAACAGGGTAGCCTCCCCGTAGCCATGATTCCCACCTGGGAGGAGCTGACAGCCTGAGGGAGGACTTGTCCACATTTACACTGTGTCTCCAATGTGCTCTCCTACAGTCACCTAACAGTCAGGTGTGTGCAGCGTGGACAAATGGTAAAACCTTCTTACACTCCTTACTGGACATCCCTCTCTCCTTGTCCCATGGAAAGCAATACAGATAGCACCAGCAACGAGCAATTTCAAGCCCCAATTATTGAATTTACTGACAGCTCATGTGTTTCCATGGAATTACCATGCCAGCAGGATCAGGCAGGACATTTCTTTAGCTACACCTTTGCATTTTTGAGGGTTTGAAAAGGAGCTGAAATGCTGTTTCAGGATGACAGGGAGAAGAGAGGCAAAGTCTGAAGAGCACAGAAACACACTGCAAGCACAACATAATTTGGACAAATAGAAGTGCTTAGTTCTGTTTAATGTGAATTAGCTTTCAGAAGTGTTGCTGGTTCTCAATACACACGTGCATTGGTGTCTCAGAGGCCGGAGGGGAGGACCAGTAGTACTGCAGGATCCTTGCTCAGTGTCTGCCATCAGTGAACCATACTGCTGTGCGATGCACATCTGACCCCAAAACAATGGAAGAAGAGTGATAACAGAAATGAACACTGCTGACAAGGTAAACAGAGAGACATGGCAGCCTGCTTGTTAGAGACAGCTAATGCTTGAGGGAACTCTGCATTCAACTCCATTGCAAGAAAAAAATCTAAAGACGAGTTCCACCCATTGAAGTGAATTGGCTTCTCAATGTTTTTCAGTGAGGTATCATTCGAATTTGGCTAGGAATCTTAATATATTTTTGACTCTCCATTATTACATTAATTTGAGTTAATTGCATTTATGCGGCTTGTTCTTTTTGATAGGCTTCAGAGCAAATGCTGGGTGTAAAAATCACCAGTCATGATACAGTGGTTTCCTAACACTTAAGACAGTTTCATAACAGAAGAAAAATTCTACAAACAGATGCTCTCGCTTCTCTGTAGATGGAGAATATAAATGTGTTATTACTGTGGAACTTCATAGTGCAATTTATGTATTTGGTTTATTCATAAGTTATGTTCACATTTTAAGAATAAACATATTCAGTTTTCCACTGCAGATAAAATTATTCTCAGATTTTAAATGCTGCTTTTCATCAGATTAGTCTTGTTTGTAAGATTGTGTAAAGTAATAAAGGTACATTTTCCTGCTAAACGCATTTGGGGATGGAAAACACCTAGCAATAACAATAACAGCAATTCTTGGCATTACTGTAGCAACTTTCATCCAAAGATCTCCAAATGCTTTCCAATAAGTAATTAATTAGGCCTCACAGCACCCTGGAGAGTTAATTACAAATTATCAAGCATACTCTCAAACCATTTCCATTGAAATTATACTTGTTCCCTTTCCAGAAGAAAACAAAATACGCTGGCTATCATACCATGACCTTTCAATACCATGATTCATTTTGAAAATGTAATTAGATGAGAATTTGAACGTATCCAGTTTTAGGAAAAGCTAATATAATTATACCTGACCACAAAACTCATTAGAATTTTTGGTTTCTTCAGTGAGATGATACTTTTTAATCTAACTCTTTAATAAAACTGCAACATCTATAGGAAAAAAAAAAATGAAATGCAGCTGGATATCCCAGTAAAATTCCAGAGAGATTTTAAATTGTGGACATCCATCTGTTCTTCCGTCACAAGAGTGTTTGGTTTTGAGGATGTTTGATCCAGACTTTGCTTCTGACACAGTCAGAAGGCAGAAGGACAAATCAGTGTTGCCTCCAGACTGAGCATCCCTCCAGAAATGTAGTGAGCTCCACTAATTCAAGTGCTGCAATCTGGGCCAGAGGAGGTATTTGTTAGAGAATGTTGTTTGCCACAGAATGTAGGAGGCAGAGAAAGGCAAGAAAAGGCTGAAATCTCAAATCCATTTATAATGGAAACATCCTGCATTTCCTGAAGCACTGAGTAGATGCTACAAGATATAATTCCTTCCTACCAAAAATCTGAAGCTGTAATTTTACCTTCATCACATAGAATCATGGGAGTAATTAAAAACACTTTTACTATGTCTTTTGCTGCAACATAGTGATTGTCTTGTTTTGATGTAAGATGAAAGTAGTTTTCTTGCATAATTTTCTGAAGGCAAAGAATTTTCTTCTTTTACATCCTAGTTTTGTAGGAAAGCAAAATAATGCTTGTTTGCATGGACAGAACTTGCATATAATTTGAAAAAAAAACCTAGTATTTTATCGATGAAAATATGGTACAAATGAAAATATATCCGCATCTCATAGATTTCAAAGGCTGCATTAAATTAACAGTGAAGATCTATTTTTCCTTATTGTATGGGAACTGCTGAGTTACGGCCTGAACCTCTGATTGATCACCTGAGGGAATCCACCTCTCTTTGAGAAGAAAGAACTGTCTACGGCTTGTTCAGAGCACACAGGGTCTGGACAAGAGGAATGCAGAGGACTCTGGGCAGTCCCATTGCTGAAGAAAAACTCTAAACAGGCATTCTTCAGGATTCAGTTATAGAGTAAAGCAATATCTGGACAAGGTGACTGACAGACCCTGGTCCCCCACTGGGGCAGGACTGACCTACATGGATATTTCTCTGAGCAAGGAAGGAGACATTTCCTAAAAAACTGTGTTCAAGATCTGCTTTCATTTGAACCTATCCTGAAGTCAAAGAAGTTAATGTGGCTTCATCTGAGAGCAGAATTTTGTCTAAAATCTTCATTACATGCCAATTCCACGAGGATAATTCATAGTTAAGGCCTCTGAACACCTTTAAAATAATCCTCTTTTGCTTCATATAATGAATAGAATAGATAGGGAATTGCTTTCCCAGACTTTCTGAGGAAACTGAAGCAATGTGTTAAAGTTTTAACAGCTTTTATTTCTCTTTTCAGATCTTAACCCAGTATCAAATATTAAAGTCCTAATATATTTAAGGAAAGCAGAAGTTGCTGTTATAATTAATTTCCTATCTGAGGGGAAAAATAAATGTATTGCTAGCCCTTTTGGAAAGAATCTCAGTTGCAGACTTGTAGTGATCACCTGGAAGAGCATGCAGTGATTTCATGAAATCATACTGGAAGAGGAAAAGGATGATTTCACAGGAATTCTGTTGGGAGGATTTTAGATGCTGCAAATGAACTGGAAAAAGAGGCTGAGAAAATGCTAAAGCAGCATAATTTTTGTCTTCTTCCAGTGGAGGAAAATACCGACAGATTTATTATACCCAGACTTTTGCTGAGAAACAAGCATTTGGGATCTATTTTAAATTAATTTTGCAAGAATTTTATTTTTTTTTTTAATGAGAAATAATTTATTTTCCTTCTGGTTAAATCTTGAAATACTAGAAGCAGTATGAAAGAAACACTTGTAGATAAGCTTAAAAATTCCAGTATTTTAATTTGCTTATGCATTCACATCTTGGTTTATTATTTGCAGTCTAACAGTCTTCATGCTTAGTCTAAAACCTTTAATTTCCTCTATAATATGTATCGCCGTGAAAGTGAACATATCAGAAGACTTAGGCACTACAGACATGACAGCAGACAACCCTTTGAAAATGTTTTTAAGGTTTCACTTGAAAAGGAAATTATGCCAATGGGCATTAATCATTTTGGAGGCTTCATATTGCTTCACAGATATTTATAATGTTAATGAAAACAGTGACGCTGTTATGAGCTACTGAATCAAGAAGTTCATTTGCCCCAATAACAGCAGGGGCTTGAAATGAGAAAAAAAATCTTTCAGACAGGGATGCTGCAAAGTTCTGAGTATGGAAAATCTTAGGAGTGTTGTGACATTCAAAAATGTCTCCAAAGATGTGTTATGCCAAAAAGCCTGAAAATAGGCACATGCATATCTTACCTTTCTGCATTTCTTTGCATTGTAAACTACACAACAACATTTTTTTTTTCTGTCTACATCACTTTACTTAATAATATAGGGCAGTGATAGAGTTTTAAAAGTTCCTTGTGATTTTTTCATTACAGCATTTTGATTGGTTTTAAGGTTAACATAAACTGATCTTTTCTGCCTAATTGGCTTTTTTTTTTCTCTTTTATATAAGCAATTTAATTCCCAGTTGTGATATATCATGCAGGAGAAATATATATCAGAGAAAGAAGAAGATATGTCATGTGGAAAGGAGGAAGGAAGGAACTGCAAGAGGGATAGGCTATAACCTTAAAAAAAAAGATTGAAAGTTATCCAGAGTTTTTTTCTGTGGGGCCATACAATCTGTGTGTGATCTTGAAATGATTGGTTTTGGTCACAGCGGGCAAGATGTTGAATGTGGTCTTATTTGTGTTATTAGACATCTTCCATTTAATGCCATGGCTGTAAAGGGTGATACAAGTGTTGGCTTCATTTCAGAGTCAGTAGTACCAGCAAACATAGCCCAGCTAAAAATAATGAATTTTCAACTACTTATTTTCCTATTTTGCCTTGAGGTTAAGGCACTTTAGCATGCAAGCCTTCTGCAAGACATATTTGAGTCTACCAAATGTAGTTTAGCAGGTAATGAGATGCATTTTTTCATCAGGGTCATGCTACCTAATCAGACGCTAAATGTAATTATTCACGATCGAACCTCAAATGCAATTTTAGAAAGTGTCTGTATTACAAACTAAGAAATCAACAGGAGGACTGCTTTAAACATGTTTTCAGTATGCCAACATTGCCTTTAATTATTTTTTGATGTTTTATATGAAGTCAAAAGACAAAAAGAACAAGCTCTGAAAAAGTTGTGAAAAAGAGATAGCATGTGCGTGTCAGAAGAAACACAGGGAGAGAGAACATGAAAGAAAGTATAGAAAAAGAAAGGAAGTACTAAAAAGATGAAGAAACAGAGAAAGAAAGAAAGAGAGATAGAGAATAGAACTCACATATAGCATTTGATAGCCGTAATTGCTCTGCTCTTTTATAAAGGCTTCCTTTTTCTGATTAGAGACTTTAAGATAGTTACTACCGAAAACAGTATTTAAAATTCATTCTTTTCCTCCTTTTTCTTTGAATTCTTCATTATGTAAAACATGTACTTCAGTGCTCTTGAAATGTTTTGTTCTCTTCATTAAATTGCTCCATTTTTATTTTAATGTCCCTGTAGTCTGGATTTTTCTCTAAAAATGTCTGTATATCTGTTAAGAACACTTGTTCTTTCAGAACCTGTTTTCCCTTTTATTTTTTTAATTCTATTTCTGAGTGAAAATGTGATTTTGTTTCTTTTTTCTTTTTTTTTTTAACACCTATTTGTCTTTTTTCTTTTTCTTTCAACAATTCTTTTGCACCAGCAAAGGGCCCATCATTCCAGACCACATTCATTTTGTTTAAATCTGGCCAAAGAAGGACTGTGCACGATTAGTATATACAATAGATGAGTAATGATGATTTTTATTCCATCAGTATTAATTTTATGCCCTTGCCTAAAGATTACTTGTAAATGCTTAGATTTTAAGTATTAAAGTAAACATCACCCCTATTGATATTTTGGAAATGTCAGGTTAGTTAATTGGGGTAATATACAGGTACAAGTTTCCAAACCATTATATCAAACTTTGCCCACCATTGGGCTCATGCTCTGTCAGCTAGCAGAGGAAAGAAAGCCAGAGGAGCAGCTCAGGCCACCATAACCCATTCTTGCCTGCTCCTCTCTACTCTTTTTTTGCTCCCCAAAGTGAGTTCAGCAAATGCCTATTTAGTTGGACCAGTTCTTTTGATATAGGCTTATACGTCTTCACTTAAGGAAACGTTTTTATTGAGGGAGAAAAGCCTCATGACGGTATTTGTTTTTACTGTGGGTTTCAGCACTTCAAGAGTTATGGACACCATCTAACCTGCACTAATGTGCAGAAGCAGTATCAGGCTGATATACTGAGCATCATTACTTACCGTGGTCTTTTTAAGAAGTTGGGAATTGAAGGCTGAAATCTCAAGACAGTCCTCTCAGCAGTCCAAGGACTTGAGTTTAGAGTTATCTGTAAATTCTGTTTATGTTTATCCAATAAGAACTCAGCCAGTGAGTGCTGCAAATAATCGTTTACTTAAACATAAATGGGAATTAATTAGTCTATCAAATGAAAGGAAAGAAGATTCTGAGCCAGGAATGCACTCATAGTCACAGTAGCACATCATAACTTTGCTCGATGTACCTAAAATTTCTTTTAAGTGTGGCTGCCAAATCATCATGATTCTTTTGTTTATTAGCCAAAAATCCTACCCAAAATGGGAAAACTTCCAGTCTTTTCTATGATACTTATGACAGCCTTTTTTAGTAGCTGATTTCTTATTAGAATATATTCCTCTAAAAAAATACATTTGGCTATTTATTGATTAATGCTCATTTTTTAATGGAGCTGTTTTGCTAAGATTCAGTGTCAGGTGCATTTCTAACACCCCAGCTCCTCTGTTCTGTGCATCAATTGGCACACTCATCAGTTAGCCAGTTCTGCAATAAAATAAATTAATGGACTATCCTATTTCATTTCATGGCATCCGGCCGATGGAGTACAGAAACTGCTATAAACCCTAGGACTCAGTGGGACTGCTGGTATGAGGAAGGAGTGCAGCATTTGGCCCACATTTTGCATTGATCAAGCAGAATTAAAATTAGCACAGCAGTTTGCCTTGAATGAAGCAGAAAAGCGTGGTGCAGGCTATGCAGCCTCCCAACTACTAAATTGACCCCTTTTCCCTTTTATTTTCTCTTAGCTTAATTTTTGCCCTACTGAAATAAATGAGGCTACTTATACTGTGAAAGGAAGGACTGGATAATCTGACCAGTATAGCATATTAAAATTATATGTATTCTATGGTTCATAATCAAATATGATTCTCTTCCTGAAATAAGCACTATATGGCTGTAGTGATAATCACTAATGGGTCAGTTGGGTACCAGAGCACTGTAAATTCTGGTGATGAATACACGGGGATGCTGTAGACTTCTGCCTTGTATTATTTTAATAGAGAGCAGAGGAAAACAAGGGAAGATTTCCTCGGAGGTATACTGATAAAATCTCACTTAATTATGTTATAGATCTCACATTGCTTAATTTTTTTTCTTAAAACTTCAGCTCTTTGAATCGCATTATTTAAAAATGGATTTCCCTGGATGGGAAAAAAAAAAAAAAGAAGAGAGAATTCTTCATAGCTGGGAAGAAAATCTTTACACTGGAAGCTTAAAAAGCAGAGAGTAAACACAAACAAAGAAGAAAAATGGAGGACCAGCGGTGAAATCATAGGCTGAGTGATGTCATGGAAATAATGTCCTTAGAGGAGGACTTCATGCCAAAACCCAGGAGCAGACAGATTTCTGAGAAAGATCTTGATCATCAATAACTCCTGCTAATTCAGTGGAAATCACAGTCAGGTTGGCAAGCACTATGAATCATCTCTTCTGATCCCTGCATGCTTTTGTAGAAGAAATTGGAAAGGCAACATCCACGAGGAAATACATGAAGATCTAACCTGGCCTGTGTGAAAATATTCATGTCATAACCCAGACAAGAAACAAATGTGCCATCTCAGACGAATCCACCTTTCTCTCTTTGCATCTCATGGAAGACTTTGAAATTTCGGGACAAAATTGCATTCTCTTATTCAAAACTGAACAAAGCAGGGCGAGTCCTGCCGTTTTGCTGAAAATGCTCTGTATAGAAAGTATATGTACATTAAATTGCCTCTGTGACCATGTTTGACTCTTACTCTACAAATAAATGGGAGTAGATAGCTCCCTTCCCTCAGGAACTTCTGTCTGCGAAAACTGTGGATTGCTGGGATATGCAGATGAAACATCTCTTTCTCTCCACCAAGATATGAAAGCAAAGAGCTCCTTCCCCTTCTGAGCTTCAGGCCAAGGGGCTCCGACACACACCGAGCAAATGGGAAGATGTGTGATTAGGTAACTTCCAAACTTCAGAAACATTTCCATTTCAAATTCTGACTTCCTGCCATGCACATACTCTTCTGCAGCCAGCTCCGAGGCAATTTATTAACAACTCCAGTGGAGTGATATCTGCAGAATCTGTTTTTCAGCTTTTGACAGCTGAGCTGGGCTAATGTTCCTGTTCCAGAGTGCCGTCGTGGAAGCAGTGCATATTCTATATATTCAATGAAGAAGTGTCCTTTGAAAGTGTAAATGAAATCGCTTATCTGAAGTAAAGAGATAAAAAATCAATTTAAAACATTTTAGATTGTTTATCAGCATGTAAGAAAAAAATACAAGATTGACCAGGTTTTACAAAGAAAGTTTTAAACCACAAACTACCAGTACTTTTAGGTTGTATTTCCTGTTCACTAAATTAAACGTTTCAATGGATAGCAATGCATTTCAGAAAAATAAATTAAAAACAAATCAATAAACAATAGAATAAAACCTACTAAATGCTTTCAGTATTTTAACTTCTTAAATACAAAAGCCTATTGAAGTTGTTTCTGCAACCTTAAAATATAACAGAACCCATTGAGATCAGCACTACATCCAAGATCTGAAATGAGGGGTTTTAAAAAATACCTGAAATACTCTAAATATTAGATAAAGAAAAGTTAGAGAGGTGTTCAGGGAAAGAAAAAGGGCAATTTTTTCACATCAGGGATTTAAACGAATGTGAAATCATGAAAGTCTTAACACTGTTCTTGAACTTTCACAGAACATAGGTCTTACTTGGATGAATGTTACAAGGAGAGTGGAAGAAGGACTTAGACTAAAAACAGGATTGACATGCATGATGAATTACAGTTCATTAATCCAATTAATGAGTAATTTCAGAGGCTTTAATCCCAGATAAAGCTCCTTATTGCAGCTCTGTTGGCTAGTGATGCACAAACTAAGAGCCTGTCAGCAAATCAATTGTAAAATTCTATTAAATAAAGCCTGCCATACACTTCTGTAGCTTATGTGACAATATTTTGTCCAAAAAAACCCCAAAAACATATATATATATATGTACATATGTAAGAGAAGGAGAGGAGGGAGCAATCTCTAACCTTATTCACCCTGATTTGTAATATAAGAGTTCAAGATATATTTAAAATGATGCAAGCCAGCTGAATGCAACTTCAGATATTTATAAGCACTCTTGATTTAGAAGGTAAACATATGCCCCAGTTTCTGAAGTCATCTGTATGTATGATTTCCTCATACACATTCTGTTGACTAATGGGAGTCAATAAAGTACATCAGGCTGCTTTGGGAATAGTCTCTGTTCTGTTCTTAGTTTATTTTATTTGTGGTGCCACTGCATCCAAGTGATTCTTTCTGAGCGCTTCAGAAATAGACTCTGTCCTCCAAAAGTCTCACAAGCAGAGAGCAAAGAAAGGAGATAAAGAGAGGAAAAATTGTGAGAGTTGTCTTCATTGACTGTAGAATCATAGCACAACAGCTGACAGAGCAGTAAGTATGAAGCAAGCATTTGAAATTTCAGCTAAAAAGTCAAAACCTAAAAACCTAAAACCTAAAAACCTAAAGAGTCAAAACATGATTTAAAGCAGAAACAACAGTGTTTCACGGCTTCTCAGAAAACCAGGAGGACTCCCCTCCCAAAAAACCATTCCCCTCTGACTGAACCAGGCTTTGTATCCCTGTTATAACAACCCTCTCCCCCTGACAATCAAGCACTTCAAATATTCCCTTGCCCACCATAATGGAATGAAGAGTGGACCTTCACTAAGACGCCTCTGAAAACAGGCAGGCTGGCAACTTGCAGTGACAGCCATGTACTGACTTCTATGTAGCGACTTTGATTTGTTGAGTACTGGGCTACCCTGCACAAAAAACATAAATGCATTCCATTTTAACAATGAAGAAGGCTTGCAGTACTGTGAGAGGCTGTGCAACACACACAAATATTGATCCTGATCTCTTTGAACAGCTATGTCAATTACCTTCCGCATTCTCAGTTTGTAAAAGCTGTGTTACCAAAGAGACAAGATCCTGCTATGACGACTATTTAAGTAAAAGTGCATCCTTTCTGATATTGCCGAAGAGTATGCTGTGGGAGGATGGCAGTTCACACCCAATTACACACCATGATGGATTCATATTTCTTGATCTTTGAAGCCTTCTGAAACAACATTGCACAATGACCCTCAGTCTTAAAGACCAAATAAGATGATTAGTGACATGCAGAAAAAAGGCTCAGAATTTCATGCATGTCAGAAAAACTCTTAAGCACTTTCTGTTTGTGGCAGTGCTCCTGAACTGGAAGAAACTTCAGTCACTCCAGCACAGAGAAAGCTGTTTGATGGAAACAAACAACTGCAGAGACTATAAGATCGGTAACACCATTGTCCCTAAAAGGCTCCCATTTAACAAAAGATATATCACAATTTGAAACCAAAAGCAAAATACTTGTGTGCCTATTGCTAGAATTTTGGATTTCTGCAGTTTGAAAATACAATGGAAATCACAAATGTTAATGAAGATTCAGTGCACATCAGCGTGATGATGCATATTACTATAGCTGACAGATTTTGAAAATGAAGGTCATAAGAAATTGTGGCATTGAGAAAATCTTTTATGCTACTAGTGCTAAAAGTTTGTTCTATACCACGCAAAGCAAACGCTGTGTACTTCAGAAAATGCAGCTGTTGAAGGAAAATGAATCTGATCCACAGCTTAATCCCATTGTATGAATACAATCCTGAAAGTATGATGTCTATCCAGGAGAAACAATGCATGAATCAGTACTTAACTAATGGAAACAATAATTCCTGTAGTTGTTTCAATAACAACCATGGCTGAGAGTGTCCTAAAGGATCAACCAGGCTGAGGGTAAGACTGCTCAGCAGATTAGAAATCAAATCAAAATGAAAATGGGAGTGGAGAAAGAAAGTTCTCACCCTTGCAAAGTCCCAAGGAATATCAGAGCCACTCTGGGAGCATCTCCATGTGGGGATGTCAGATGCCATCCTTCACCTTCTCTCTGCACTGACCCACATGGGGGCACCTAGGAGGGTGGGCCAGTTCTGCCACCATCAAAATCTTTGATGACTGCAGCTTTTGGCCTCCCACCACAGCAGGCGTGTTAGCAGCCAGGTCACCAGAGGAACTGCCAAACATATGACAAGTGACAGGAATTGAAACACTTTGACCTTGAGCCATGCATAGGCTTGAAGCAGTGCATTTAGTGCCTCGAGAGGAGCAGGAGGTGTGAGACGTGCGTTTTGAAGAGAAAACTAAAACTGATAAAAGCACAAGATTAAGAAACGAATGAAAGTTACCAAAAAATGACCAGGCTGTTTAATGTGAGGAGAAAATGATCATGCTATAGTCCTCCAAATGCTTTTAAAGACAGAAAGGTATCCATATATCTTTTCTTCCGCCTTTGAAGCTTCAACTGTGAAAGTTAATCTAAAGGAAGCAAAATGCAGCCACTCTCTTCAGACCATTTGATATGCTATTGCTTGCAAACTTCCTTTAAAAATATCTTTCATAACTAAGAAAATTGCCATATGCTCACTGGCTTATAAATGGGAAATTAAAGATAAGAAAGTCTGAATAAAATAAGACTACTCGATATTAGCATTCCGAGCACTTGGCCAGTATCGGTCAATTACTTCACTGCTCTTCTTTGCCATCCCCAATCTCACTGAAAAATACAAGCCCACAACTTCCCCACGAGATGGATGTTATTAACCCATTTTTCACAGCTGAGAGCTGAGACACAGGGGAGATGGGTGACTCCCTCTGGGTCACCGTGCTGCTATTGAGAAAGCTGGAAATAGGCCTTGAATCTCGTTTATAAGACAAGACACGGGGCAGTTCATTTCAACCAGAGTGGTTTCCACATTGGGATTTTACAAGCTTACATTATATGGATGAATTAATAATTTGACGTCTCAAAAGCCTCCTGCTATTCACAGAACTCGTTTTAATTCTTACGTTACTTTTTTTTTGGCAAGACTGTGACGAGCAGTGTGAGGGCAGAGGTGTGGTCTGATGGCATTTATCAGTGTCAGTTGTCACCTTACAAAGCGTTATGGGGATGTACGTGTCCAGCTTTCACTGTTTGCACTGCTGGCAGATTGTGTGATCCCACTTTATTGCCTTTTGGCTTTTTCCCTTAAAAACAAACAAACAGTATACTGTTCCCTGGAGAAGGACAGGTAGTGCTTTTTACATCTAATAACGAGCCAAGAAGAAATCTATTCTGGAACACTCATTTTCACTCTGTTGCTGATTGTAACATCAGTACTTCTTTTCTACGAGCACTCATTCAGTCTGCTGTTCCTACTAACACATTATACATGACATTTGCTATGTATAGTTAAATCAAATTTTATTTATGATATTCTCCATAGTGATAATGCACTTTGTGTCCAGGCCAAAACATTGAGAATTCAGTTGTTTTGCATTCATTATATGCTTCTTCCTCCCCAACCATACAAGGAATAGCATCCAAGCGATGTTTGGATCCCCTGTCCCAATGCCAGGCAAGTCTCTGCCAAAGACAGTTCTGATAAGAGGTGTTAAATAGTTAAACACAATGGATTTTGATTTTTTTTTTCATTTTATTTTCAGTCATTAGGGTAATTTCTTATATATGGAACATCACTTGTTCTTGAATACTGTGATAATGCGAGTCTCCAGTTAAAGACTGAAGATGAAATAATTAAAAATGGCTTATTGACCTTGAAAGCCATGTCCTTCTGAGCATCAATATGAGATATGCACATTAATTAGTGTTTTTCAAATTCAATCCTTAACATTTACCAAAGGAGAACAGTTTTCTCAGTAAGTCAAAGACAGGCCTGGTTAGCCAGTAACTTATTACATATTTGTCCACATCACAATTTTCTTCATCCTTGATTTAATCTGCAAAAATATTTAATAAGGAAAGCTCTGTTGAAAATAACATGTTTATTAGAGCTTCATTTTTGAAAAAAAATTCTTTTGAATAGCAGACTGAATTGCTAGCATTATAGAGTAACCACTTCTTAATGAATAATAGAAATTTGAGATAAAGGACATCAAATTATTATGACTTATTAGAAGATACAAAGGACCAAATTTGCAAATGAAACTGGCTAAATTTTAACAAATATGTCCATAATAAATCTTAATTTCAGTATGACTTTCTAAAACTCCATTTCTATAGTATTTAACAAAAAGCTCTGCAAAGAAGAGCTTAAGCTTTATATTTTTTCACTTATTAGAGCGAGGAGTGGAATTTCTGACAAACACCAATAAAGAGTAAAATTTATATCTTGTCAATAGGACCTATTTTGTTGCTAAATTATCTCAGAAGTCTCACAGTCAGGAACACAGTAGTCTAAAGCAGTCAGGACATAGAAGAAACAATGGGCAGACAATCTTGTGCTAACTGAAAAGTGAGCACTGTAAGGGAACAGCTGAATTGGGGCCTGAACCTCTGATTGACCACCTGAGGTGAGTAATGAGCCAGCTGTGGGAGCACAGGTGAAGGCAATTCATGTGTGCTGCTGGAAGGGGTGGAGCCTGGCTGCACCTCTCCTGGACCCATTTAAGAGCTGACTACTGGGGTGGAAAGATCTTTTTGTGGAGATCCCTCCTTTGGAGTTTTACAGTGTGCCCAGGATAAGGTGAAGAAAGTAAGTTCAAGTGACTGGTCCAAAATTACACAACCACACTGATGCTCAGCTAGCAACGGGGACTTCCTTCATCCAGTGCGGCACACCATCGCTTTACATCACTCAGCTTGCAGAGAGAGAAGATTGAAGTTATTTGTGGGCAAATTTATGCTGATAAGAGAGAGCACAGAGAGCCCCAGAGATGGAAAGGTTTCAGAAGACACTTCTGCTGGAAAGCCAGCTCCTGAGTGCTCCCCAGCTGGACATCGCATCCTCCGCAGCCCATACCGCAGCACCAGGTTTGACTCGCTGGAGCTGCAGCGAACGTCTGCTCAGGTCCTGGTGTGTGACCACTCATTGCCACCAGCATGGTATCGGTTCATGATCAACAACACGCCTGCGGAAATGCCAACGAGATGCATTGAAATGAACAAATGTGGGACACAAGCTCCGGTGTGGCTGTCACTGAGGTCTGAATCCCTGCCTGCTCCAGGTGAAAGCAAGCACCTGATGGCCTGTGGTACCTGGCAGGTCTTTGGGGGCACCAAGGACTGCTGCTTGTTCCGGATACCCATCACTGTCAGGAACTGCATCAAGTTCTTTGTTTATCTCTTGCAGCCGACTCAAGGATGCATGGGCTACTGTGCAGAAGAAAAACTCCCAAGCCTGACTTTACAGCCAGTGATAACTTCTGAGCTCGTGCGAGGTCGCGCCCACCTGAAATGCGCCTACAGCTCACCCAGCTGGGGGCTGAGCTACACGGTGCTCTGGTCACGTCTGGTCGCCCCGGGCAAACAGGAGCAGATCCATCAGGACACCACCCTGCAGACGTGTTCCTACCTGGAGATAAGCAGCAGACATCTCCAGCTGGGAGACACAGTCTTCTGCACTGTGACTGCATTTGCAAGGGACACTTCTGAGCAGCGGTCATTGCCTGAGCAGAGCAAAGGTTTCTACGCTGGGATTAAGTTTTTACCAGAATCATTACAAATTGCAGAAGATGGCAAGGAGCACATTTTGACCATCCTGAGCACTGTGCCCATTACCTGTGCTGGGCATAACGATTCATGTAAAATCACATTACGGCTCAGTACTGAGGATCTGGACAGCCAATTACTGGGGCCCCCAAACACTGTCCTCTCAGCGTGCCAGGTGGATCTGGTGCCGGCGCCCTGCTCACAAGGCAGCTGTGCAGCAGCTGTACTAACAGTGACAGCCGTCACCGACTTCGCTCAGGATGGGAACCGCGTCAGCTACATCAGAGCCGAGCCAGTTGGACACAGAGATGTACTTTGGAGGGCTCACGCCTCGAAGGATGTAAAGGTCACAGTTCAGGACCTCCCAACAGGGAACTGCTACTCTTTCACTGATCCACACATTATCACGTTTGATGGATGGCGTTACGATAACTATAAAATCGGCACCTTCCTTTTGTGCCAGAGCACGTCACGGGCATTCGAAGTGCACGTCCGTCAGTGGGACTGTGGGGGACACCACTCTGCCACTGCCTGCAACTGTGGGGTGGCTGCATGGGAAGGGAGCGACGTCGTCCGCCTGGATGCCTGCAATGGGCACTTTCGGGACAGCAGGCCGCAGCTCAGCATCCAAAGTACTGAGGCATCACCACAGGTCAAAATCCTAACGTCCTACGGAGGGAGAAAGATAACAATCCTATTCCCTTCAGGAGCGTTCATTCGAGCCGATGTGAGTGAGTGGGGAATGGGCTTGACAGTGAGGATACCAAGCAGTGACTTCAACAGCACCAGAGGTTTGTGTGGCCTCTTTGATGGGATCAGTCACAACGACTTGAACAATGTGCCTGAGGAAGACTTCATAGAGGAGTGGAGAATACCTCCAGGGAAGAGTTTATTTGACAAAACTCCAGCATCTTCAGAGGGGAAGCAGAGGAAAAACTACTGCAGATGCCAGAAGGAGAGCACAAAGTCCATGCCCTTGCTAAAGACGCTGAATGCCTTTCAGATGCAATCTCCTGGTTGTCATTATGATAATGTGGATTACACTTTTGCAATTCCATATCTGGATGTTACATCAGAGTTTGTCACTCACTCAGGCAAAGAGTTTGCTTCAAGAGATGATGAGGAACGGTCGCCCAAGTCTTTTGATCAAAGATCTCTCCCTAAATCAGCCAAGAAGCGAGGTAGCCGTGAGGAGCGATTAAAACCCTTCTCACATCATGCTTCCATGAAAAACAACAGTTCCCTTAACTTTACCAAGCCAACAGAAGAACTACAGAGACCAAAAAGACAAGAAAACTACTTTGAATACTCAGCCCTTCACCCGTTGCATAGCCCAAGCCAGACAGACACGGAAAGCTTTGCCTATTTTTTCCCAGAGGATTATTTTGAAGGGATTCGGATAAAACTCCCACTGGGATGGCCCACTCCCAGCGGCCTAACCTCTGCCAAAGCTCAGGAGATTTGCCACCAAATTCTTGCAAATTCCACCATTGGCTTAGCGTGTAAGTCTCTGCTGGGAAAACTGATAGATGAGGCCATCAATATATGCATGTTAGATCTGCAGCTCAAGGATGATGTGGCCTGGGTAAGGGCACTGATAGCGCTTTTGGAAAATGAGTGTGAAAGACGAGTGCTGAGGCACAGAGGTGAAGTGTTTCGTGTTGGAAGCCAGCCAACTTCTAACCAGGAGGAAATCCTTACCATTCTCCGCTGTCCTGCTTTCTGTAATGGCAATGGACAATGTACAGACATGGGCTGCCAATGCTTTGAAGACCACAGCTCTTATGATTGTAGCACTGCCAGAAAGCAAACTCTGGAAATCACAAGCTTGGAGAACAGGGGCCTATGTGACATTCGCACCTCTGACTGCAGTCGTGTCCGAGTGTTTGGCGTTGGCTTCAAGGATTCTCCCCATCTGCACTGTGAAGTCACCAGATTAATTCATCTCAACGGCGAATGGATATCAAGAGAGCAAGAAACCACACAAGCAGATTTTCTCAGCTCTAAGGCTGTTGACTGCCAGATTCCTCTCCTGAACATTGCAGAGACGGAGGCTGTGCACTTTGTAGCTGGCGATGAGCCGTTCGCAAGATGGCAAGTAAAAATCACTGATGATGGCTTCCAGTACAGTAATTCCAGAGTGCTGACCCTGTACGACGCAGTCTGCCAGGCCTGCGAATCCCATCCAACTGGACTTTGTAAATTAAAGGACAATACTTGTAATATAGATGGACTTTGCTATGGGGAAGGAGAGTCAAACCCTGCCAGTCCTTGTCTTCTCTGTGAACCTGATATCTCTAAGTTCACCTGGTCTATTAATGAAAACAACCTGCCTCCTGTGTTCCAGGCCCCCTCCAGCCAGCTGCTGACATTTATTGGTGAGAATTTTGTTTACCAGTTAACAGCGGTGGATCCGGAAGGGTCAGCTGTGCTATTCATCTTAGAGGCTGGGCCACAGGATGCCAGGCTCTCTCCCGCTGGCCTTCTTATCTGGAAAGTTGATTCAGAAGAAATGCAGACCTTTGAATTCACTGTGTCGGATGAATGCAACGCGCAGAGCAGATACGCTGTTGAGGTTCGAGTGAAGCCCTGCAGCTGTCTCAATGGCGGAACGTGTGTTACCAATATTAAATTCCCCCCGGGCCTTGGTGAATATCTGTGTTTATGTCCAAATGGATTTGATGGAGGGCTTTGCCAGGAAGATATTAATGAGTGCAAATCAAACCCGTGCAAAAGCGGAACTTGTGTGGATGGTGTGGACAGCTATGCTTGTCAATGTCCCCCTGGTTTAGGAGGGCTTACTTGTCAGGAAGACAAGAATGAGTGTGAAGAAGGTCTGTGTTTTCCAGGAGTGTCCTGCATGAACACCTTTGGATCATACGTGTGTGGAATTTGTCCAAGTGGGATGGAGGGAAATGGTAAAACTTGCAAATCTGTGCTTGCTGGTGACTTTACAAAAGCTTTAATCGTTGACAACAACAATGGCAAAGGTGATTTGAACAAAACTGAAGTTGAGTGGCCACTGCACCCCTTAGAAGCAAATAATTCTCCTGTAATTAGGAATTTTAACATAAGCACTAATCATGTCCACACAGCACATCAGCCCCGTGTTACCACCTGTGCCAATAGGCCATGCTTTCCTGGAGTGCTGTGTTTCAATAGGAAACCCCCTTACGTTGGCTATGTCTGTGGCCGATGTCCAATAGGGTTTTTTGGAAATGGCCGAACCTGCAGCAAAGCCTCCAGACCAGTTTCAAGATCTTCCCAAAGCCATACAGATGTTGCTGAAAGAAATAGTGAAGATGCCAGAGGCTCTCATCAGGAAGGCAAGACATCAAGAAACATCTATTCGTTCCTATCCCAAACCCAAATTCCAAGGCAAGAAACTACATACTTTGTGGAAAGAAACCACACAGTTATTAATGCAGCATCCTTTACAACGAAAAGGAAGATTTCCCAGCCTCAGATGCTGTCAGCAAAAATACCTGATACAGAGTCCACTGTATCTGAGAAACAGACTTTTACTGAAAAAAGAAGTCATACACACACTTTCCTTCTGCATGAGGAGCCAGATCCCAAAGCAGCAGCTGTCAATGTGACTACTCCTACCCCTGTGCATTTTAAACAGTACAAGCCAGGAACAAGACAGACCATTCCTTCTCATCTCAACACAAACGCAAGCTCACTCTTCGCACGGCTGCATGCTGTACAGCAAGCTCGTTCCAGATACAGCTTATCTTCCAGGAAATGGCCCAGTCAAGTGACAGGCTCAAAGACTGAACTCTCCAAAAATCTCCCAACAAAGCAGCAGAGAGTTTCTTCTTTGGAAACATCCCTCACATCCCCTTTGCATGAAATAGGTTTTTCCCTTGACACAGCTCCACAGAGTGCCAGTGTCCTGCCTGGACCTGCTCCCCCAGCAAGGCTTCCAGCACATACCACAACCTTCAGAAGAGCATCCAGTGTAGCAATGGACCATGCAGAACTGCCAAAACCCATCAGTGGGTCCTATGAGAAAGCTCTCTGTGGTTCAACACCATGCTTTAGTGGTGTGCAGTGTGAGCTAGCCAAAGATGGAGAATTTAAATGTGGGTCTTGTCCCAGTGGATACAGCGGTAATGGAATTACATGTGAAGTGCAGTGTGACCCACCGTGTGAGCATGGAGGAACCTGTGTAGCTCAGAACACTTGTTCTTGTGCCTATGGATTTGTTGGTCCTCGATGTGAAACAATGGTGTGTAACAGGCACTGCCATAATGGCGGGGTCTGTGTGTCGCCAGACGAGTGCAAATGCAGAAGCGGATGGAGCAGCCCTTCCTGTGAAATAGCTGTGTGCAACCCTGTGTGCTTAAATGGAGGAATCTGCGTGCGACCAAACACTTGCACGTGTCCTTACGGTTTCTATGGGCCCCAGTGCCAGAGAGCTGTCTGCATTCCTCCTTGTAAGAATGGCGGCCACTGTGTTCGAACCAACGTGTGCTCCTGTACTGAGGGCTACACTGGAAGAAGATGTCAGAAGAGTGTCTGTGATCCTGCGTGCATGAATGGAGGGAAATGTGTAAGCCCAAATGTTTGTGACTGCCCATCTGGTTGGAGAGGAAAGCACTGTAATAAACCTGTTTGCCTGCAGAAATGCCTGAATGGTGGAGAATGTATAGGTCCAAACATCTGCGAGTGCCCTGAAGGATGGGTGGGAATGCTGTGCCAAACCCCAATTTGTGAGCAAAAATGTCTGTTTGGAAGCAGATGCATAAAACCAAATGTCTGTGCTTGCAGAAGTGGCTATACTGGGTCAGCATGTGAAAAGAAGGAGTACTCAAAGCTAATGACTGCTCATTTAGAAACCATATCTTTAACTACCCACAGGATGAAGATAACATAACAGCAGGACAATGAAGACAATCATTTGGGTATCGATAAGCCCAAACTGAGTTCGTTTTTCATTTGGGAAGACACGGTGTGAAAACATTACTACTTCTCTCCCTTCTACTCTCCTATAATCACAAAGAAAAACTAAAACAAAACACCAAGGCATATGTCAATAAACAGACCTCTATTTTCAAAA
>XM_038827982.1 PREDICTED: Tripterygium wilfordii uncharacterized LOC119984160 (LOC119984160), mRNA 
CCTACTTCTCACCGCCATTATTAACCTCCTAAACCTTCTCTTCTCTGCAAAAATTGTTAAAAAAATACAAATTATATATAAACCAAACAACAAATCCTGTATTATACAGAAACCTTGATAACTGATCGTCCGCAATCATTCACATCCTCTCTCTCGAGTCGCAACGAATCCAAATCTTCATCGTTGGATCAGAGGGCCAGACCAAACACCACCACTAGCAGAAAACATGGTTGAAACCAGACGCAGCTCTTCGTCTAAGCGCCCTCTCGCCTCGTCTGCTAACCCCGTGCCTTCACCATCGGCCAAGCGATCCAAGGCTGGTGAGGCATCCTCGAAGGCAAACGATGCGGCGGCGGTTGAGTTATCGACGGATACCAATGGTTCGGTCAAAGAATCTGGGTCTGGAAGTCTTGAACCGGAGCTGCAATCCCCTGATCTGCAGGCCGACGATGCTGCCAAGCCCGCCGATGGGGAGAAATCGCCAGATGCTGAGGTGGAAGAGGAGGCCTTGGCGTCTCCGCGCTCCATAGGTGAAGCTGCAGTGGATGCTGCGGGTAATCGGCAGAAGAAGCGGCCTGTGAAAGCGGCAAAACTGAATACGAAGGCTGCGTGGGGAAAGCTTCTTTCGCAGTTCTCCCAGAATCCTCACCTTAACATGTGTGGTGCTACTTTCACTGTTGGCCAAAGTCGTACTTGCAATTTGTGTCTTAATGATCCATCCGTCAGTTCTACTTTATGTAAACTGAGGCATGTTGAGCGTGGAGGTTCATCTGTTGCCCTATTGGAGATATCTGGGGGCAAAGGATTTGTCCAAGTGAATGGGAAAATTTACTACAAGAATTCCAGTAAGACATTAACTAGTGGTGATGAACTGGTTTTCAGTTCTTCTGGAAAACATGCTTACATTTTTCAGCAGCTCACTCATGATACTGTAGCTGCTACCGGTCTATCTTCATCATTAAGCATTCTGGAAGCACAAAGTGCTCCATTAAAGGAAATACATATTGAGGCAAGGGCAGGGGACTCCTCTGCTGTTGCTGGAGCGTCAATATTAGCCTCTTTGTGCCAGAAGGACATATCCCTTCTTCCTCCACCCCCCAAGACTAGTGGTGATGTGCAGCAAAGCACTGAGATGCCTCAACTTCCGTCTGGATGTGGAGAATCTGATGATCGCACTCCAGACATTGATATGAAGGATGGTCCGAGTACTAATGAGCCTGCTGATGCTTCTTTGAGGGGAAAAACTGGTTGTCCATCATCTTGTGCTGCTCATGAAAACCACAATATTGATAGCCTTGGATTGGATTCATGTCCACATGCCGCCTCCAAAAAGATTAGTGGGACAACGTACGAGTTGACGCCTCTACTGAGGATGCTTACGGGAACGTCATCATCTAATTATGATTCAAGAGGCGGCATTCCTAAAATACCTGATGAGCATAGGGAAATCAGGGACCTGCTGAAGGAGTTTGGTTCTCGTGCAAATTTGATTAAACGACAAGCACTTAAGGATAGTTTGCAGCAAGGAATCCTAAATCCTGGCAGCATTGGTATTTCATTTGCAAGTTTTCCATATTACCTCAGCGACACTACGAAGAATGTTTTGATAGCTTCTACATACATCCAGCTGAAGTGTGACAAGTTTTCAAAATTGGCCTCAGATCTTCCTACTGTGTCTCCCCGAATATTATTATCTGGTCCAGCAGGTTCTGAGATATACCAGGAGACATTGGTGAAGGCACTTGCCACACATTTTGGGGCTAGACTTCTAATTGTTGATTCCCTTCTCTTGGCCGGTGGATCAGGGGCCAAAGATTCTGATTTGGTGAAGGAAAGTTCAAGGCCTGAGAGAGTCTCTGCATTTGCAAAACGAGCTTCACATGCTGCTGCATTGCAGCATAAAAAACCGACATCTACTGTTGAGGCTGATATTACGGGTGGCTCAATGATAAATTCTCAGACGCCGACAAAGCAGGAGACGTCAACTGCTTCATCCAAAAACTATACATTTAAACAAGGTGACAGAGTGAAGTTTGTGGGCAGCTGTCATACAGTTGCTTCCATACAACCTCCTTTGAGGGGACCGACAGTTGGTTTTCGAGGCAAAGTAGTCCTTGCTTTTGAAGACAATAGTTCCTCAAAAATTGGGGTTAGATTTGATAAATCAATCCCTGAAGGAAATGACCTTGGGGGTCTCTGCGAAGAAGATCACGGTTTCTTCTGCTCTGCTAATTCCCTTCGGTTAGAGAGTTCTGCTGGGGATGATGTTGACAAATTTGCTATTAATGAACTTTTTGAGGTTGCTTCAAATGAAAGTAAAAGTGGTTCCTTGATACTGTTTATGAAAGACATAGAGAAGTCTATGGTGGGGAATCAGGATGCATATGTGGCCTTCAAGAGTAAGTTCGACAATTTACCAGGGAATGTTGTTGTAATTGGCTCCCATACACAGGCGGACAGCCGTAAAGAGAAGTCTCATCCTGGAGGTCTTCTATTTACGAAATTTGGAAGCAATCACACAGCTTTACTTGATCTTGCTTTCCCGGATAGCTTTGGTAGGCTGCATGAGCGGGGGAAAGAGACGCCCAAAACGATGAAGCAACTTTCTCGACTTTTCCCTAACAAAGTGGGAATACAGCTGCCCCAGGATGAAGCTTTACTTTTGGACTGGAAGCAGCAGTTGGAGCGTGATATTGAAACTTTAAAAGCACAGGCCAACATTGTTAGCTTTCGCTCGGTGCTCGGTCGGATTGGCCTGGAATGCCCTGATCTTGAAAGTCTTTGCATCAATGATCAGGCTCTTACAACTGAAAATGTGGAGAAAATAGTAGGCTGGGCTTTAAGTCACCACTTGATGCATTATTCAGAAGGTTTGGCCAGAGATGCTAAGCTTGCGATTTCTACTGAAAGTATAAGGTATGGTTTGAACATTTTACTAGGCGTTCAAAACGAAAGCAAGAGCTTGAAGAAATCACTCAAGGATGTCGTAACGGAGAATGAATTTGAGAAGAAACTTCTTGCGGATGTTATTCCTCCAAATGACATCGGGGTCACATTTGATGACATAGGAGCCTTAGAAAATGTCAAGGATACCTTGAAGGAGCTGGTGATGCTTCCTCTTCAGAGGCCGGAATTGTTTTTGAAAGGACAGCTGACTAAGCCATGCAAGGGAATTTTACTGTTTGGGCCTCCTGGCACTGGAAAAACAATGTTAGCCAAGGCTGTCGCGACTGAGGCGGGTGCAAATTTTATCAATATATCAATGTCAAGCATCACTTCAAAGTGGTTTGGTGAAGGCGAGAAATATGTTAAAGCAGTGTTCTCTTTAGCTAGTAAAATTGCTCCTAGTGTTGTTTTTGTTGACGAGGTTGATAGCATGTTGGGTAGACGTGAAAATCCAGGAGAACATGAAGCTATGCGCAAAATGAAGAATGAATTTATGGTGAATTGGGATGGTCTTCGTACAAAGGATAAAGAGCGGGTATTGGTACTTGCTGCCACCAATAGGCCTTTTGATCTTGACGAGGCTGTTATAAGAAGGTTACCCCGGAGGTTGATGGTTAATTTGCCTGATGCCTCCAACAGAGAGAAAATCCTTAAAGTTATCTTAGCCAAAGAAGAATTGTCACCCGATGTGGAGTTAGAGGCAATTGCAAATATGACTGATGGGTATTCTGGAAGTGACCTTAAGAATCTGTGTGTGACTGCAGCTCATTTTCCGATACGCGAAATACTTGAGAGAGAAAAGAAGGAGAGAGCTTCAGCATTGGCGGAAAACAGACCATTGCCTGGACTTCATAACAGCACTGATGTACGCTCTCTGAAGATGGATGATTTTAAGTGTGCGCATGAACAAGTATGTGCAAGCGTTTCATCGGAGTCTACAAATATGAATGAGCTCCTCCAGTGGAATGATTTATATGGAGAAGGTGGCTCCAGGAAAAAGACGTCTCTCAGCTACTTCATGTAGAGAACGTATGTTTGTGTACAGCGATCCATGTTACAGATGTTTATTCACCTCTCTCTACCTGGCAGAGTCGGGAGTCGGGACACCATTGATTATGGAATTCTATCGCAGGTACTGAGCTCGGTGTACCATATTATCATAGGTTTTGGAATCATTTACCATTTTAGGGAGGTTTTACAATATTTATCAAGCAGGTTTTGTTTGACGGAAGCCGTCTTCTTGTTAATCTATCTAGTTTTGAATTCCTTCTCTTTCCCCTTTTCTTGTCTCGTCTGTAGCATGTAAATTCTCATTTTGATCAATTGAATAAGCATTCCCCTCTTTTTCTCCC
>XR_004155863.1 PREDICTED: Punica granatum putative leucine-rich repeat receptor-like protein kinase At2g19210 (LOC116201365), transcript variant X2, misc_RNA 
GAACTAAACTTCTATAAGTGCCCATATTATTTGTATCAAATCTCTGTTGTGTATTATAATTAGCATGAAGATGTTATTCGTGATACTTGTATGTATCAGTCTCAATGCTATCGCTCAAGCACAAGAAAATCCAGGTTTCATAAGCATCGACTGTGGAGCACCTAATGGTTATCACGATGACAACCTTGACATTTACTACACGATAGACACGGGATTTGTTGAGTCAGGGAAAAACATGCAGATTTCTTCGAAGTACATCGATCGAGTTCCTATGCAACAGCTAATGAACTTGAGATGCTTTCCTAATGGAACAAGGAACTGTTACACGCTAAGGCCAACGCAAGGGAAGAGCAAGAGATATCTAATCCGGGCATCTTTCTTTTACGGAAATTATGATACTCTCTCCCAAACCCCAACATTCGACCTCTATATCGATGTAAACTACTGGATCACCGTGAAAGATCCATCAAACTACACGTACGAAGAGATTATATACACTACCTCAAGAGATTATATACAAGTGTGTCTTGTGAATCGGGGCTCGGGGGTTCCCTTCATTTCAGCACTAGAGCTACGAACCCTCGACAATTCCACTTATGATACTTCAGCTGGAGCACTACAGACCTCATGGCGATATAATATTGGGTCCAAAACCACATACAGGCATCCGCAAGATGACTATGACCGGATTTGGGAAGGCCAGAGTTTCAATTGGACTACAATCACAAACAAGACGAATGTTGACAGCTTAAGAAGCACAAACAATGCGTATAAAGTTCCACTGGAAGTCCTAATGACTGGCCAACAATCCCTGGATAATATTTCAAGCAGCCTGAAATTATTCTGGATTTCTTCTGAACCCACATATAAATGGTACTTGTTCTTTCACTTCGCCGAGTTTCAGGTATTGCGATCCGGACAGCTGAGGCGATTCAGAGTTTACGTCAATGATAACAAACTGATAACAACCGTTACACCTGAGTACCTCAAACCTGTGACCGTGTCCACGTTTCCCTTTGATGGGACCGTCCTGAACTTCTCAATCACCTCTGTGACTTCTCAATCAAGCCTCCCGCCGTTCCTCAATGCTGTCGAGTGGTTTCGTTCCATTGACCTTCCACATTCTACCACGGACTTAAATGATGTTACCGGTATTAACAGCATCAAGACGATTTACGGAGTGGCTATAGATGACTGGCAGGGCGATCCATGTGTTCCAGTGTCTTTTATTTGGAGTTTTTTGAACTGCAGCGAAGACGATATTCCGAGGATCATCTCCTTGAACTTGAGCTCTAGCAATTTGAAGGGGAGCATTGCTACCTCATTCTCCAGTCTCACGGCATTAGTCTCCCTGGATCTATCGTTCAATGAACTAAGTGGACAGATACCTGATTTTTTTGCTGACATGCCGAATTTGAGGATCTTAAACTTAAGTGGAAACAACCTCAACGGTTCAATTCCTGCAGTTCTTGAAAAGAAGATGGCGGATAAGACATTGCAATTAAGCTTGGATGGTAATCCGAATCTTTGTCGACAAGACTCTAATTGCAATCAAGACGGCCGCAAGAAGAAAAATACCGTTGTCCCAGCTGTTGCTGCTACTGTGGGCTCATTGGCTCTGGTATTCTTTCTCATTTGTGCCATCGTTGTCATTCGCAGACGTAGGAAGAAGATAGAAGAAATTAATACTGGATCAATGGAAGTCACTGCATCGAAGGAACATAGACCTAAGGAGGTATCCGAGCCTAGTACTGGTACCGGATTTAACGAGGGGCGACTAGTAGTTGGAAAGAACCGACCATTTACATCTGCTGAAGTTTTGAGTATCACCGGGAACTTCAGAACAGTTATCGGGGAAGGTGGATTCGGAAACGTGTACCTTGGAACTCTCGATGATGGTTGGAAAGTCGCAGTGAAAGTGCTCTCTCAGTCATCAAAGCAGGGCTACAAGGAATTCCAAGCAGAGGCACAGCTTCTGATGATTGTTCATCACAAAAATCTTGTTTCTCTCATCGGGTATTGCGAAGATTTCGATAACATGGCCCTGATTTATGAATTTATGCCCAATGGAAACTTAAGGCAGCATCTGGCAGGAAACACATCTAATGTCATAAGTTGGAGTCAGAGACTGCAAATTGCAATAGACGCAGCACAGGTTTTGGTCAATCTTTTGATGCAGGGCTGGAGTATTTGCATAATGGTTGCCGACCTTCGATCATTCACAGAGATCTCAAGACTTCAAATATCCTTCTAAATGAGAACATGCAAGCCAAAATAGCTGATTTTGGTCTCTCTCGGGTTTTCATGATGGAAGATGGCTGTCAAATTTCGACTCAACCTGCCGGCACACCCGGTTACCTTGACCCGGTGTTCAACACGGGTGGAAACTTGAACAAGAAAAGTGATGTGTACAGCTTCGGGATCATTCTGTTCGAGCTGATTACCGGACAGCCTGCTATTCTAAGAAGTCCGACGGGCAGTATTCACATCGTTAAATGGGTGACTCCACTC
>XM_030225762.1 PREDICTED: Drosophila hydei latent-transforming growth factor beta-binding protein 2 (LOC111599265), partial mRNA 
CAATCGCGTAACGATCAGTGCACAGCAAACGAGATCCAGCTCGATCCCCACGACTGTGCTGCCTATTTCCTATGTGTGAAGGGAGAATTTGTGAGTCAGAAATGTGTTCGTGGCTTTTACTTCGATGCCGCAATCCAGGCGTGTGTGGGCGACACCAAAGAGTCGTCTAACAAGCGGACTGCGAAAATGGCTCACAATAGAAACCTCAAATTTGTGTATCTCCTTTCCATTGCTGTGACCCTGGTCTTTGGAGCTGCAGCCGATGATGATTGCTGTCAACCCGGCGATACCAAGCCCGTCGAAGGCGATTGCACCCAGTACTACGGCTGCTGTACGGGAAAGTTCGTTCTGAAGTCGTGCCCTAGCGGACAATACTGGAATTCAAACAACCAACAATGTGAACCTGACAACGGCCAATGCGTTCCTGTTGAGCCCGGTGCGCCCGGTGCGCCCTGTGCGCCCGGTGAGCCCGGTGCGCCCGGTGCATGCACAGAAGGAGATACCAAAGTGGATGCCTCCGATTGTACCAAATATCAAGTCTGCAAGAACGGAGAGTATGTCTCGGCCTCCTGTAACTCTGGTTACTACTGGAACTCGGCTAACAGCCAGTGCGAGCAGGATAACGGCCAGTGCGTTTCAGTAACATGTAAGGACGGAGAGCTTAGTGCAGACTCATCTGACTGCGCAGGCTACTTCATATGTCTGGATAATAAGTTAGTCAAGAGGAAGTGCGCTAGTCAAACCTATTTCGATGCCAGTCTGGAGACTTGCGTTATCGACACTGAGGGTGTTTGCATACCCAAGGTTTGCGATTCCGAATGCTGCGATAAGCCCAACAATTGGATTGGACCCGTCGATAAGAACTGCTCCGCATTCATTCACTGCCTTTACGGCCAACTGATTCAACAGACCTGTCCCAACAATCTGCAGTTCAACAACATTACCAAGCAGTGCGACTTCCCCGATGTTGTCCAATGCGATGACGGCAGCCCACCGCCAAGCGGACCCACAGCCGGTCCCTCGGGCACCTACTGTGAGAGCAAGGGTCGCTGCGTCGGACAACGTGATGGCGCCATGTTCGCCGATGCCAAGTCTGCCTCCAGTGGTGGCTACATCGTATGCCAATGTGAATGTGAGATTAACTTCAACTGTGTCGCCGGCTTAGTTTTCAACGAGAAGATTCGCACCTGCGATTGGCCATAA
>XM_035486762.1 Talaromyces rugulosus uncharacterized protein (TRUGW13939_03582), partial mRNA 
ATGACACCCAAGCGAGTGAGAACTGTCGAGGGCTCATGCTGGCTATGCAAAGATCGCCGGGTTCTATGCGACTTGCAGCAGCCTCGTTGCTCCCGATGCGTGTCCAAAGGTGAACCATGTGAATACGGTGAGGTACGCTTGCGCTGGTGCAATGGCGTAGCGGCTCGAGGCCGATATGCTGGTCAGAATGTACCTGTGTCAATACCATCAGCCAGGAGGGATTCTTCTAGAGGGTCGTTAGGAAAGACACCGCCGTTGCAATCAACCGAAAACGATCAAGGTGATGGGGAAGTCCCTAAAGTCGAAACATTGTCGCCAGTAAGCTCCAATGCACTACAGATATCGGGGCTTTCATCACAAGTGACAGCAGAGCAGCTATTGCTCTATTTTTCCAACGTCGTGGTCGACCGTTTCAGCCTTTCCACGGATCGGATATCGATTAATCTCCCATCAGTATGCGAAGAGCCTGCTCTTCGTGACTCGATGAGCGCCGTTGCAAATGCACATCATGTTCTTTCCCTGTATCCTGGTCGTCCAGGTGTAGGGCTCGCCAAGAAGAGGGCACGTTGGAGCGCTATTCACAATTTCCGAGCTCGGCTGGAATGCCCGAGCATGGAGTCGAGGACACCGGGCCTCGATCTGTTCATGGCCAACGTCCTGCTCTGTATACTAGACGGAGTCATTGACCCGCATGACGAAAGCGCAGCTACTCATATGCATTATCGCGGCGGACGAGCAATCCTCAGTCAATGGAAGCTTCAGAAACAGTTATATCAGGAAAAACGCGGCTTGCCGGCTTTGATGTTGTCTGTTTTTGCAACCATGGATTTGACATACTCGATGCTTAGCGGTGAAGAACAGTATTTTCAGCATACTATCTGGAATGGCTTTGCTGAGAGTGATGGCTGGTGGGGGACTCTTCCTCAAGATGATCCCTTTTTGGAAGTTATGTGTACTCTATCGCGTCTGACTCGACTGGGGTCTCTCGTAAGCAAGGGCCTTGATTTTCCTGATGAGGCCCTCAACGAGGAAGTGAGTACTCTCCTGACGACTCTGCAGGGCCCTCCCCAGATTCCGTATGATATTTCTTGTCCCGAAAGAATGGACTTGGAAGACCAACCGGCTCCTCTATTGCTTTTTACCTCGCCAGGCCACCACGATTTAGATCACAACCAGTCATGGATTGTCTTCTGCAATGCATACCGGATTGCCGGTCTAATATACGCGTACCGCGTCTTTTATCGGCTAAATTTCGGCGATCCCTTGATACAACAGGCCGTGAACCTGGGTATACAAGCCGTCTGCAAAACACGACTAACAGGCAAACTATCACACTGCTTGCTCTTCCCAGCGCTCGTAATCGGAAGCCATTGCCAATCCAACGAAGACCAGGCAGCGATACTCGCGACGATCCAATCAACCGCGGCATTCTTGCATTTTGGGTCGCTTCGAGTTATGGAGAGCTTTTTGCATCGAGTGTGGGAGCGAGCTCCAGCGGCGGAGACTTGGTGGCAGTTTTTTGAGCCGATTTCCAAGAAGGCCTTTTTATTTTGA
>XM_012357333.1 Saprolegnia parasitica CBS 223.65 hypothetical protein partial mRNA 
ATGGGCATCAAGATCCGCAACGACACGCGCCACGACGTCCTCGTCATTGTCTTCACGTACTTCACGACGCCGTTCCCGACGCTGTACTACCGCAAGACACTGCTCATCCCGGCCGGCGAGCGCTACAACTGCCCGACGTGGCAGAGCGCTGTCAAGATCTACGCGTGGGAAGCCGACAGTAGCAACGG
>XM_021677838.1 PREDICTED: Neomonachus schauinslandi translation initiation factor IF-2-like (LOC110569879), mRNA 
ATGGCGTCGCCGCGGAGTCCGGCACACGCATCCATTTTATCAGGAGCCCGGCGCGGCGGCGCTCAGGAACGAAGGCTGCGGTGTGGAAGGCCGGGCCGGCTCCGCGCTCAGCGAGCGGAGACCCCGCGGCCGCCGCAGGTGCAAGCGCCGCAAGCCCCGCCCCGCCCGCCGCCCCAGCCAACCGCGGGCGGCGGGGGCGGGGCCTGGACCCGCCACACCTGGGGCGGCCGCCCGGCCGTGTCCCAACCACGCTGCCCACAGCCCGCGGCCCGCCGCTCAAGCCCGCCGCCCCGCCCCACCCGCGTCCCCGGCCCCTGCCTGCCCCGCGACCGGTGCGAGGCCCGCCCTGCCCACCCGGCCGGAGTCGTCCCCTCAGTCCCGCCGCCGCGCCGCCCCAGCCGTTTCCACAACGGCTCCGCCTCAACCGTCGGGAGGCTGGCCGTCCGCCCGCTCGCCCACCCGCCGCTGCTGGAGACCGGCCCGGCGTCACGGCCCCCCTCCACGCAGCCCCGCTGTCAGGGAGGCCCGGCCCGGCGCCCGGCTCTACCTGCGGCTGGAGGAAGCCTCCCCGTCCGGGCCCGGGAGCCGCCGCCACGGCCGCCGACTCGAGTCGCGTCTCTGCTCTCCGCGACCGCCGCGGCTCTTCAGGCGGCCGACGGTGGGCGGGAAGCGCCCGCCCAATCAGCGCCGCGTGCGTTCGGAATCGCGTCCAATCAGCGCAGCTCGCAGTCCAGGCTCCGCCCCTCGTGCTCGCCGGCGACGCAGGGGTCGCCAGAGGCCGAAGCCAGGGGCGCCGCGGTGGGCGCGGCTCGGGGCCGGGCCGGGTAG
>MF950468.1 Uncultured bacterium clone OTU1501_Control_T4.8037 16S ribosomal RNA gene, partial sequence 
ATACGGGAGGCAGCAGTGGGGAATCTTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGCGATGAAGCCCTTCGGGGTGTAAAGCTCTTTCGGCGGGGACGATAATGACGGTACCCGCAGAAGCAGCTGCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGCAGCGAGCGTTGTTCGGAGTTACTGGGCGTAAAGGGTGTGTAGGCGGTTCCTTAAGTTTGGTGTGAAATCTCCCGGCTCAACTGGGAGGGTGCGCCGGATACTGAGGAGCTAGAGTGCGGGAGAGGAAAGTGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCTGTGGTGTAGACGGCTTTCTGGACCGTGACTGACGCTGAGACACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGT
>XM_038920781.1 Brettanomyces nanus uncharacterized protein (FOA43_000450), partial mRNA 
ATGATGAAAGCTTTAACATATGTCAGACCAGGAGTTATCAAGTACCAGGATGTGGAGAAACCAAAATTACTTCAGCCTACAGATGTGATCGGAAAGACCGTTGTAACAACTATTTGCGGATCGGATCTTCATATCCTTTCAGGTGCTTTCCCAGAGTTCAACAAGTTGGCCGAGAAAAAGGCTGGCCGAGGATTTATCTTGGGTCATGAGGGTATCATCAAGGTGGAGCAAATAGGTTCTGAAGTAAAGAACTTTAAAGTCGGTGATGTGTGCATCGTCTCTTGCATCACTCCTTGTGGTGAATGCTTTTACTGTAAAGAAGGTTGCGAAGCTCATTGTACACAGAACGAGGGAACCTGTGGATGCATCTTGGGTAGTGAGATTGATGGAACTCAAGCTGATTATGTTAGAGTTCCTCTTGCTGACAATTCTTTAATCAAATGCCCGGATAACGTGAAGTTGGAGTCTTTATTAATGCTTAGTGACATTTTACCAACCTCCTACGAACTTGGTGTTCTGGATGGAGGTGTCAAAGAAGGAAGTACCGTTGCCATTGTCGGTATGGGACCTGTTGGGTTGGCTGCTTTGATCAGTGCTAAGGCATTGAATCCAGATTATATTGTTGCTATCGACTTGAACGAATCCAGATTGAAGACTGCCAAAAAATTGGGTGCCGACTACACCTTTAATCCAAGCAAGGATGATGTTGTTAAACTTGTTATGGGGCTTCCTGTGAAACAGGGTAAGCTACCCGGTGTCGATGTGGCCATCGAATGCTGTGGTATTCCGGCAACTTTCGAGATGTGCCAGGATATTGTTGGTATGAACGGTAGAATTGCCAATGTCGGTGTTCACTCTAAGTCATGCAAACTTGCTATGGAAAAGTTATGGGTCATGAATATCAACATAAGTACCGGATTGGTCTGCGGCCATTCTACAAAAGATTTACTCAGGAAAGTTGTATCCGGAGAATTGGATCCTTCGTCTTTGATTACTCATCGCTTCAAACTAAATGAGATCGAAAAGGCTTACGATGTCTTCAGCAATGCTTCTGAGACTGATGCCATTAAGATGCTTCTTATCAACGATTGA
>MW263500.1 Cortinarius sp. PDD 112391 isolate JAC15241 large subunit ribosomal RNA gene, partial sequence 
CATATCAATAAGCGGAGGAAAAGAAACTAACAAGGGATTCCCCCTAGTAACTGCGAGTGAAGCGGGAAAAGCTCAAATTTAAAATCTGGCGGTCTTTGGCTGTCCGAGTTGTAATCTAGAGAAGTGTTATCCGCGCCGGACCGTGTACAAGTCTCCTGGAATGGAGCGTCATAGAGGGTGAGAATCCCGTCTTTGACACGGACTACCGGGGCTTTGTGATGCGCTCTCAAAGAGTCGAGTTGTTTGGGAATGCAGCTCAAAATGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGAACTTTGGAAAGAGAGTTAAACAGTACGTGAAATTGCTGAAAGGGAAACGCTTGAAGTCAGTCGCGTTGTCCAGGGATCAACCTTGCTTTTGCTTGGTGCACTTTCTGGTTGACGGGTCAGCATCAATTTTGACTATTGGAAAAAGATTAGGGGAATGTGGCATCTTTGGATGTGTTATAGCCCTTGGTTGCATACAATGGTTGGGATTGAGGAACTCAGCACGCCGCAAGGCCGGGTTTTTAACCACGTACGTGCTTAGGATGCTGGCATAATGGCTTTAATCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGCCTGCGAGTGTTTGGGTGGAAAACTCGAGCGCGTAATGAAAGTGAAAGTTGAGATCCCTGTCGTGGGGAGCATCGACGCCCGGACCAGACCTTTTGTGACGGTTCCGCGGTAGAGCATGTATGTTGGGACCCGAAAGATGGTGAACTATGCCTGAATAGGGTGAAGCCAGAGGAAACTCTGGTGGAGGCTCGTAGCGATTCTGACGTGCAAATCGATCGTCAAATTTGGGTAT
>MN640403.1 Mycobacterium simiae strain a18 16S-23S ribosomal RNA intergenic spacer and 23S ribosomal RNA gene, partial sequence 
GAATCTTGACTGGGGTGTGAGCCGTGAGGGGTTCTCGTCTGTAGTGGACGAGGGCCGGGTGCACAACAACAGGCAATCGCCAGACACACTATTGGGCCCTGAGACAACACTCGGCCGACTTCGGTTGAAGTGGTGTCCCTCCATCTTGGTGGTGGGGTGTGGTGTTTGAGTATTGAATAGTGGTTGCGAGCATCAGGAGGTACCTCCGTTCTGTTTGAGTATTGGATAGTGGTTGCGAGCATCAGGGTGGTGGGGTGTGGGGTTTGACATCAGAATGGTGAAGGCAATTATCAGGTACCGCCTC


================================================
FILE: src/alphafold3/test_data/miniature_databases/pdb_mmcif/5y2e.cif
================================================
data_5Y2E
#
_entry.id 5Y2E
#
loop_
_chem_comp.formula
_chem_comp.formula_weight
_chem_comp.id
_chem_comp.mon_nstd_flag
_chem_comp.name
_chem_comp.pdbx_synonyms
_chem_comp.type
"C3 H7 N O2"     89.093  ALA y ALANINE         ? "L-peptide linking" 
"C6 H15 N4 O2 1" 175.209 ARG y ARGININE        ? "L-peptide linking" 
"C4 H7 N O4"     133.103 ASP y "ASPARTIC ACID" ? "L-peptide linking" 
"C5 H10 N2 O3"   146.144 GLN y GLUTAMINE       ? "L-peptide linking" 
"C5 H9 N O4"     147.129 GLU y "GLUTAMIC ACID" ? "L-peptide linking" 
"C2 H5 N O2"     75.067  GLY y GLYCINE         ? "peptide linking"   
"C6 H10 N3 O2 1" 156.162 HIS y HISTIDINE       ? "L-peptide linking" 
"H2 O"           18.015  HOH . WATER           ? non-polymer         
"C6 H13 N O2"    131.173 ILE y ISOLEUCINE      ? "L-peptide linking" 
"C6 H13 N O2"    131.173 LEU y LEUCINE         ? "L-peptide linking" 
"C6 H15 N2 O2 1" 147.195 LYS y LYSINE          ? "L-peptide linking" 
"C5 H11 N O2 S"  149.211 MET y METHIONINE      ? "L-peptide linking" 
"C4 H9 N O3"     119.119 THR y THREONINE       ? "L-peptide linking" 
"C5 H11 N O2"    117.146 VAL y VALINE          ? "L-peptide linking" 
#
_entity.id               1
_entity.pdbx_description "Non-structural glycoprotein 4"
_entity.type             polymer
#
_entity_poly.entity_id      1
_entity_poly.pdbx_strand_id A
_entity_poly.type           polypeptide(L)
#
loop_
_entity_poly_seq.entity_id
_entity_poly_seq.hetero
_entity_poly_seq.mon_id
_entity_poly_seq.num
1 n MET 1  
1 n ILE 2  
1 n GLU 3  
1 n LYS 4  
1 n GLN 5  
1 n MET 6  
1 n ASP 7  
1 n ARG 8  
1 n VAL 9  
1 n VAL 10 
1 n LYS 11 
1 n GLU 12 
1 n MET 13 
1 n ARG 14 
1 n ARG 15 
1 n GLN 16 
1 n LEU 17 
1 n GLU 18 
1 n MET 19 
1 n ILE 20 
1 n ASP 21 
1 n LYS 22 
1 n LEU 23 
1 n THR 24 
1 n THR 25 
1 n ARG 26 
1 n GLY 27 
1 n ILE 28 
1 n GLU 29 
1 n GLN 30 
1 n VAL 31 
1 n GLU 32 
1 n LEU 33 
1 n LEU 34 
1 n LYS 35 
1 n ARG 36 
1 n ILE 37 
1 n HIS 38 
1 n ASP 39 
1 n LYS 40 
1 n LEU 41 
1 n MET 42 
1 n ILE 43 
1 n ARG 44 
1 n ALA 45 
1 n VAL 46 
1 n ASP 47 
#
_exptl.method "X-RAY DIFFRACTION"
#
_pdbx_audit_revision_history.revision_date 2018-03-14
#
_pdbx_database_status.recvd_initial_deposition_date 2018-03-14
#
loop_
_pdbx_poly_seq_scheme.asym_id
_pdbx_poly_seq_scheme.auth_seq_num
_pdbx_poly_seq_scheme.entity_id
_pdbx_poly_seq_scheme.hetero
_pdbx_poly_seq_scheme.mon_id
_pdbx_poly_seq_scheme.pdb_ins_code
_pdbx_poly_seq_scheme.pdb_seq_num
_pdbx_poly_seq_scheme.pdb_strand_id
_pdbx_poly_seq_scheme.seq_id
B 94  1 n MET . 94  A 1  
B 95  1 n ILE . 95  A 2  
B 96  1 n GLU . 96  A 3  
B 97  1 n LYS . 97  A 4  
B 98  1 n GLN . 98  A 5  
B 99  1 n MET . 99  A 6  
B 100 1 n ASP . 100 A 7  
B 101 1 n ARG . 101 A 8  
B 102 1 n VAL . 102 A 9  
B 103 1 n VAL . 103 A 10 
B 104 1 n LYS . 104 A 11 
B 105 1 n GLU . 105 A 12 
B 106 1 n MET . 106 A 13 
B 107 1 n ARG . 107 A 14 
B 108 1 n ARG . 108 A 15 
B 109 1 n GLN . 109 A 16 
B 110 1 n LEU . 110 A 17 
B 111 1 n GLU . 111 A 18 
B 112 1 n MET . 112 A 19 
B 113 1 n ILE . 113 A 20 
B 114 1 n ASP . 114 A 21 
B 115 1 n LYS . 115 A 22 
B 116 1 n LEU . 116 A 23 
B 117 1 n THR . 117 A 24 
B 118 1 n THR . 118 A 25 
B 119 1 n ARG . 119 A 26 
B 120 1 n GLY . 120 A 27 
B 121 1 n ILE . 121 A 28 
B 122 1 n GLU . 122 A 29 
B 123 1 n GLN . 123 A 30 
B 124 1 n VAL . 124 A 31 
B 125 1 n GLU . 125 A 32 
B 126 1 n LEU . 126 A 33 
B 127 1 n LEU . 127 A 34 
B 128 1 n LYS . 128 A 35 
B 129 1 n ARG . 129 A 36 
B 130 1 n ILE . 130 A 37 
B 131 1 n HIS . 131 A 38 
B 132 1 n ASP . 132 A 39 
B 133 1 n LYS . 133 A 40 
B 134 1 n LEU . 134 A 41 
B 135 1 n MET . 135 A 42 
B 136 1 n ILE . 136 A 43 
B 137 1 n ARG . 137 A 44 
B 138 1 n ALA . 138 A 45 
B ?   1 n VAL . 139 A 46 
B ?   1 n ASP . 140 A 47 
#
_pdbx_struct_assembly.details            author_and_software_defined_assembly
_pdbx_struct_assembly.id                 1
_pdbx_struct_assembly.method_details     PISA
_pdbx_struct_assembly.oligomeric_count   4
_pdbx_struct_assembly.oligomeric_details tetrameric
#
_pdbx_struct_assembly_gen.assembly_id     1
_pdbx_struct_assembly_gen.asym_id_list    A,B,C,D,E,F,G
_pdbx_struct_assembly_gen.oper_expression 1
#
_pdbx_struct_oper_list.id                 1
_pdbx_struct_oper_list.matrix[1][1]       1.0000000000
_pdbx_struct_oper_list.matrix[1][2]       0.0000000000
_pdbx_struct_oper_list.matrix[1][3]       0.0000000000
_pdbx_struct_oper_list.matrix[2][1]       0.0000000000
_pdbx_struct_oper_list.matrix[2][2]       1.0000000000
_pdbx_struct_oper_list.matrix[2][3]       0.0000000000
_pdbx_struct_oper_list.matrix[3][1]       0.0000000000
_pdbx_struct_oper_list.matrix[3][2]       0.0000000000
_pdbx_struct_oper_list.matrix[3][3]       1.0000000000
_pdbx_struct_oper_list.name               1_555
_pdbx_struct_oper_list.symmetry_operation x,y,z
_pdbx_struct_oper_list.type               "identity operation"
_pdbx_struct_oper_list.vector[1]          0.0000000000
_pdbx_struct_oper_list.vector[2]          0.0000000000
_pdbx_struct_oper_list.vector[3]          0.0000000000
#
_refine.ls_d_res_high 2.70
#
_software.classification other
_software.name           "DeepMind Structure Class"
_software.pdbx_ordinal   1
_software.version        2.0.0
#
_struct_asym.entity_id 1
_struct_asym.id        B
#
loop_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.occupancy
_atom_site.B_iso_or_equiv
_atom_site.auth_seq_id
_atom_site.auth_asym_id
_atom_site.pdbx_PDB_model_num
ATOM 1   N N   . MET B 1 1  ? 2.644   6.839  -46.028 1.00 83.71  94  A 1 
ATOM 2   C CA  . MET B 1 1  ? 1.400   7.612  -45.825 1.00 86.32  94  A 1 
ATOM 3   C C   . MET B 1 1  ? 1.210   7.971  -44.344 1.00 87.15  94  A 1 
ATOM 4   O O   . MET B 1 1  ? 1.479   7.188  -43.421 1.00 80.48  94  A 1 
ATOM 5   C CB  . MET B 1 1  ? 0.170   6.890  -46.382 1.00 88.07  94  A 1 
ATOM 6   C CG  . MET B 1 1  ? -0.124  7.275  -47.840 1.00 91.84  94  A 1 
ATOM 7   S SD  . MET B 1 1  ? -1.789  6.807  -48.325 1.00 103.69 94  A 1 
ATOM 8   C CE  . MET B 1 1  ? -2.264  8.027  -49.569 1.00 97.89  94  A 1 
ATOM 9   N N   . ILE B 1 2  ? 0.696   9.166  -44.185 1.00 87.93  95  A 1 
ATOM 10  C CA  . ILE B 1 2  ? 0.364   9.779  -42.948 1.00 84.67  95  A 1 
ATOM 11  C C   . ILE B 1 2  ? -0.678  8.946  -42.258 1.00 75.98  95  A 1 
ATOM 12  O O   . ILE B 1 2  ? -0.634  8.714  -41.080 1.00 67.98  95  A 1 
ATOM 13  C CB  . ILE B 1 2  ? -0.321  11.082 -43.309 1.00 89.99  95  A 1 
ATOM 14  C CG1 . ILE B 1 2  ? 0.696   12.146 -43.577 1.00 94.59  95  A 1 
ATOM 15  C CG2 . ILE B 1 2  ? -1.197  11.546 -42.182 1.00 92.79  95  A 1 
ATOM 16  C CD1 . ILE B 1 2  ? 1.132   12.780 -42.294 1.00 93.36  95  A 1 
ATOM 17  N N   . GLU B 1 3  ? -1.625  8.499  -43.046 1.00 71.66  96  A 1 
ATOM 18  C CA  . GLU B 1 3  ? -2.745  7.716  -42.585 1.00 68.44  96  A 1 
ATOM 19  C C   . GLU B 1 3  ? -2.273  6.463  -41.883 1.00 69.98  96  A 1 
ATOM 20  O O   . GLU B 1 3  ? -2.890  6.024  -40.946 1.00 67.88  96  A 1 
ATOM 21  C CB  . GLU B 1 3  ? -3.613  7.332  -43.745 1.00 73.44  96  A 1 
ATOM 22  C CG  . GLU B 1 3  ? -4.382  8.485  -44.320 1.00 87.42  96  A 1 
ATOM 23  C CD  . GLU B 1 3  ? -3.735  9.039  -45.551 1.00 89.38  96  A 1 
ATOM 24  O OE1 . GLU B 1 3  ? -4.454  9.413  -46.477 1.00 97.81  96  A 1 
ATOM 25  O OE2 . GLU B 1 3  ? -2.511  9.105  -45.593 1.00 88.14  96  A 1 
ATOM 26  N N   . LYS B 1 4  ? -1.212  5.844  -42.364 1.00 71.45  97  A 1 
ATOM 27  C CA  . LYS B 1 4  ? -0.676  4.669  -41.671 1.00 72.76  97  A 1 
ATOM 28  C C   . LYS B 1 4  ? 0.097   5.062  -40.408 1.00 74.11  97  A 1 
ATOM 29  O O   . LYS B 1 4  ? 0.209   4.268  -39.462 1.00 77.84  97  A 1 
ATOM 30  C CB  . LYS B 1 4  ? 0.197   3.807  -42.578 1.00 66.63  97  A 1 
ATOM 31  N N   . GLN B 1 5  ? 0.624   6.270  -40.364 1.00 72.03  98  A 1 
ATOM 32  C CA  . GLN B 1 5  ? 1.295   6.749  -39.158 1.00 65.60  98  A 1 
ATOM 33  C C   . GLN B 1 5  ? 0.255   7.097  -38.099 1.00 58.64  98  A 1 
ATOM 34  O O   . GLN B 1 5  ? 0.462   6.888  -36.942 1.00 52.26  98  A 1 
ATOM 35  C CB  . GLN B 1 5  ? 2.143   7.976  -39.487 1.00 63.76  98  A 1 
ATOM 36  N N   . MET B 1 6  ? -0.861  7.648  -38.542 1.00 49.04  99  A 1 
ATOM 37  C CA  . MET B 1 6  ? -1.953  7.954  -37.679 1.00 45.66  99  A 1 
ATOM 38  C C   . MET B 1 6  ? -2.486  6.679  -37.100 1.00 50.63  99  A 1 
ATOM 39  O O   . MET B 1 6  ? -2.882  6.643  -35.948 1.00 50.11  99  A 1 
ATOM 40  C CB  . MET B 1 6  ? -3.050  8.640  -38.449 1.00 42.97  99  A 1 
ATOM 41  C CG  . MET B 1 6  ? -4.395  8.703  -37.753 1.00 42.67  99  A 1 
ATOM 42  S SD  . MET B 1 6  ? -5.430  9.916  -38.524 1.00 47.21  99  A 1 
ATOM 43  C CE  . MET B 1 6  ? -6.803  9.938  -37.397 1.00 48.85  99  A 1 
ATOM 44  N N   . ASP B 1 7  ? -2.531  5.622  -37.894 1.00 56.67  100 A 1 
ATOM 45  C CA  . ASP B 1 7  ? -3.070  4.383  -37.401 1.00 55.17  100 A 1 
ATOM 46  C C   . ASP B 1 7  ? -2.223  3.846  -36.257 1.00 53.54  100 A 1 
ATOM 47  O O   . ASP B 1 7  ? -2.785  3.365  -35.256 1.00 47.69  100 A 1 
ATOM 48  C CB  . ASP B 1 7  ? -3.067  3.354  -38.520 1.00 57.94  100 A 1 
ATOM 49  C CG  . ASP B 1 7  ? -3.936  2.164  -38.236 1.00 62.42  100 A 1 
ATOM 50  O OD1 . ASP B 1 7  ? -5.111  2.416  -37.949 1.00 67.59  100 A 1 
ATOM 51  O OD2 . ASP B 1 7  ? -3.401  1.020  -38.206 1.00 61.64  100 A 1 
ATOM 52  N N   . ARG B 1 8  ? -0.900  3.909  -36.428 1.00 54.78  101 A 1 
ATOM 53  C CA  . ARG B 1 8  ? -0.002  3.384  -35.432 1.00 61.23  101 A 1 
ATOM 54  C C   . ARG B 1 8  ? -0.168  4.177  -34.127 1.00 63.20  101 A 1 
ATOM 55  O O   . ARG B 1 8  ? -0.017  3.620  -33.077 1.00 67.94  101 A 1 
ATOM 56  C CB  . ARG B 1 8  ? 1.484   3.327  -35.943 1.00 64.73  101 A 1 
ATOM 57  C CG  . ARG B 1 8  ? 2.403   4.541  -35.635 1.00 73.16  101 A 1 
ATOM 58  N N   . VAL B 1 9  ? -0.406  5.483  -34.222 1.00 63.14  102 A 1 
ATOM 59  C CA  . VAL B 1 9  ? -0.546  6.334  -33.061 1.00 59.81  102 A 1 
ATOM 60  C C   . VAL B 1 9  ? -1.853  6.121  -32.347 1.00 55.82  102 A 1 
ATOM 61  O O   . VAL B 1 9  ? -1.880  6.066  -31.150 1.00 48.46  102 A 1 
ATOM 62  C CB  . VAL B 1 9  ? -0.421  7.813  -33.454 1.00 60.39  102 A 1 
ATOM 63  C CG1 . VAL B 1 9  ? -0.731  8.703  -32.272 1.00 60.03  102 A 1 
ATOM 64  C CG2 . VAL B 1 9  ? 0.994   8.091  -33.943 1.00 61.68  102 A 1 
ATOM 65  N N   . VAL B 1 10 ? -2.941  6.014  -33.079 1.00 56.18  103 A 1 
ATOM 66  C CA  . VAL B 1 10 ? -4.231  5.743  -32.481 1.00 53.53  103 A 1 
ATOM 67  C C   . VAL B 1 10 ? -4.236  4.419  -31.704 1.00 52.90  103 A 1 
ATOM 68  O O   . VAL B 1 10 ? -4.772  4.355  -30.607 1.00 49.99  103 A 1 
ATOM 69  C CB  . VAL B 1 10 ? -5.317  5.742  -33.553 1.00 51.75  103 A 1 
ATOM 70  C CG1 . VAL B 1 10 ? -6.606  5.137  -33.045 1.00 52.18  103 A 1 
ATOM 71  C CG2 . VAL B 1 10 ? -5.610  7.153  -33.983 1.00 52.67  103 A 1 
ATOM 72  N N   . LYS B 1 11 ? -3.601  3.402  -32.243 1.00 55.55  104 A 1 
ATOM 73  C CA  . LYS B 1 11 ? -3.521  2.104  -31.626 1.00 56.87  104 A 1 
ATOM 74  C C   . LYS B 1 11 ? -2.709  2.164  -30.350 1.00 60.76  104 A 1 
ATOM 75  O O   . LYS B 1 11 ? -2.986  1.464  -29.399 1.00 58.80  104 A 1 
ATOM 76  C CB  . LYS B 1 11 ? -2.837  1.155  -32.582 1.00 60.72  104 A 1 
ATOM 77  C CG  . LYS B 1 11 ? -3.729  0.487  -33.601 1.00 72.80  104 A 1 
ATOM 78  C CD  . LYS B 1 11 ? -2.915  -0.472 -34.451 1.00 79.85  104 A 1 
ATOM 79  C CE  . LYS B 1 11 ? -3.664  -0.963 -35.666 1.00 84.90  104 A 1 
ATOM 80  N NZ  . LYS B 1 11 ? -5.110  -0.693 -35.513 1.00 94.50  104 A 1 
ATOM 81  N N   . GLU B 1 12 ? -1.674  2.982  -30.369 1.00 56.70  105 A 1 
ATOM 82  C CA  . GLU B 1 12 ? -0.798  3.204  -29.249 1.00 54.71  105 A 1 
ATOM 83  C C   . GLU B 1 12 ? -1.507  3.946  -28.155 1.00 52.45  105 A 1 
ATOM 84  O O   . GLU B 1 12 ? -1.387  3.608  -27.007 1.00 51.88  105 A 1 
ATOM 85  C CB  . GLU B 1 12 ? 0.404   4.036  -29.667 1.00 60.63  105 A 1 
ATOM 86  C CG  . GLU B 1 12 ? 1.418   4.261  -28.569 1.00 71.75  105 A 1 
ATOM 87  C CD  . GLU B 1 12 ? 2.100   2.985  -28.105 1.00 83.66  105 A 1 
ATOM 88  O OE1 . GLU B 1 12 ? 1.973   1.951  -28.793 1.00 97.71  105 A 1 
ATOM 89  O OE2 . GLU B 1 12 ? 2.729   3.008  -27.039 1.00 91.62  105 A 1 
ATOM 90  N N   . MET B 1 13 ? -2.250  4.972  -28.495 1.00 50.99  106 A 1 
ATOM 91  C CA  . MET B 1 13 ? -2.993  5.703  -27.508 1.00 53.07  106 A 1 
ATOM 92  C C   . MET B 1 13 ? -4.045  4.874  -26.849 1.00 51.54  106 A 1 
ATOM 93  O O   . MET B 1 13 ? -4.220  4.974  -25.651 1.00 48.88  106 A 1 
ATOM 94  C CB  . MET B 1 13 ? -3.640  6.915  -28.107 1.00 61.60  106 A 1 
ATOM 95  C CG  . MET B 1 13 ? -2.651  8.032  -28.402 1.00 65.35  106 A 1 
ATOM 96  S SD  . MET B 1 13 ? -3.551  9.590  -28.498 1.00 76.88  106 A 1 
ATOM 97  C CE  . MET B 1 13 ? -3.620  9.931  -26.737 1.00 76.03  106 A 1 
ATOM 98  N N   . ARG B 1 14 ? -4.714  4.016  -27.571 1.00 53.52  107 A 1 
ATOM 99  C CA  . ARG B 1 14 ? -5.703  3.187  -26.952 1.00 50.53  107 A 1 
ATOM 100 C C   . ARG B 1 14 ? -5.040  2.268  -25.975 1.00 51.01  107 A 1 
ATOM 101 O O   . ARG B 1 14 ? -5.527  2.040  -24.903 1.00 48.89  107 A 1 
ATOM 102 C CB  . ARG B 1 14 ? -6.358  2.367  -28.011 1.00 54.79  107 A 1 
ATOM 103 C CG  . ARG B 1 14 ? -7.580  1.648  -27.566 1.00 60.71  107 A 1 
ATOM 104 C CD  . ARG B 1 14 ? -7.895  0.586  -28.570 1.00 70.83  107 A 1 
ATOM 105 N NE  . ARG B 1 14 ? -8.689  1.116  -29.658 1.00 78.79  107 A 1 
ATOM 106 C CZ  . ARG B 1 14 ? -8.278  1.182  -30.911 1.00 81.77  107 A 1 
ATOM 107 N NH1 . ARG B 1 14 ? -7.086  0.746  -31.233 1.00 91.09  107 A 1 
ATOM 108 N NH2 . ARG B 1 14 ? -9.071  1.675  -31.832 1.00 79.36  107 A 1 
ATOM 109 N N   . ARG B 1 15 ? -3.896  1.754  -26.355 1.00 46.73  108 A 1 
ATOM 110 C CA  . ARG B 1 15 ? -3.174  0.827  -25.534 1.00 45.05  108 A 1 
ATOM 111 C C   . ARG B 1 15 ? -2.681  1.503  -24.248 1.00 47.85  108 A 1 
ATOM 112 O O   . ARG B 1 15 ? -2.752  0.930  -23.189 1.00 50.40  108 A 1 
ATOM 113 C CB  . ARG B 1 15 ? -2.063  0.286  -26.404 1.00 50.23  108 A 1 
ATOM 114 C CG  . ARG B 1 15 ? -1.165  -0.750 -25.876 1.00 59.06  108 A 1 
ATOM 115 C CD  . ARG B 1 15 ? -0.358  -1.317 -27.046 1.00 59.59  108 A 1 
ATOM 116 N NE  . ARG B 1 15 ? 0.861   -1.991 -26.583 1.00 65.92  108 A 1 
ATOM 117 N N   . GLN B 1 16 ? -2.221  2.739  -24.349 1.00 49.74  109 A 1 
ATOM 118 C CA  . GLN B 1 16 ? -1.810  3.511  -23.193 1.00 47.85  109 A 1 
ATOM 119 C C   . GLN B 1 16 ? -2.993  3.774  -22.279 1.00 48.41  109 A 1 
ATOM 120 O O   . GLN B 1 16 ? -2.898  3.560  -21.091 1.00 46.33  109 A 1 
ATOM 121 C CB  . GLN B 1 16 ? -1.209  4.809  -23.611 1.00 49.18  109 A 1 
ATOM 122 C CG  . GLN B 1 16 ? 0.208   4.681  -24.112 1.00 53.75  109 A 1 
ATOM 123 C CD  . GLN B 1 16 ? 0.618   5.857  -24.974 1.00 61.24  109 A 1 
ATOM 124 O OE1 . GLN B 1 16 ? -0.145  6.791  -25.159 1.00 69.70  109 A 1 
ATOM 125 N NE2 . GLN B 1 16 ? 1.786   5.782  -25.546 1.00 63.00  109 A 1 
ATOM 126 N N   . LEU B 1 17 ? -4.098  4.266  -22.817 1.00 45.61  110 A 1 
ATOM 127 C CA  . LEU B 1 17 ? -5.278  4.506  -22.010 1.00 41.80  110 A 1 
ATOM 128 C C   . LEU B 1 17 ? -5.848  3.244  -21.329 1.00 44.01  110 A 1 
ATOM 129 O O   . LEU B 1 17 ? -6.378  3.314  -20.232 1.00 49.63  110 A 1 
ATOM 130 C CB  . LEU B 1 17 ? -6.380  5.133  -22.818 1.00 41.83  110 A 1 
ATOM 131 C CG  . LEU B 1 17 ? -6.545  6.610  -23.075 1.00 44.57  110 A 1 
ATOM 132 C CD1 . LEU B 1 17 ? -6.481  7.448  -21.815 1.00 46.53  110 A 1 
ATOM 133 C CD2 . LEU B 1 17 ? -5.534  7.076  -24.054 1.00 46.70  110 A 1 
ATOM 134 N N   . GLU B 1 18 ? -5.724  2.085  -21.974 1.00 48.92  111 A 1 
ATOM 135 C CA  . GLU B 1 18 ? -6.176  0.854  -21.354 1.00 50.45  111 A 1 
ATOM 136 C C   . GLU B 1 18 ? -5.278  0.446  -20.173 1.00 50.00  111 A 1 
ATOM 137 O O   . GLU B 1 18 ? -5.748  -0.088 -19.155 1.00 52.97  111 A 1 
ATOM 138 C CB  . GLU B 1 18 ? -6.361  -0.236 -22.405 1.00 54.05  111 A 1 
ATOM 139 C CG  . GLU B 1 18 ? -7.693  -0.095 -23.112 1.00 59.57  111 A 1 
ATOM 140 C CD  . GLU B 1 18 ? -7.804  -0.858 -24.438 1.00 68.03  111 A 1 
ATOM 141 O OE1 . GLU B 1 18 ? -6.834  -1.521 -24.893 1.00 73.96  111 A 1 
ATOM 142 O OE2 . GLU B 1 18 ? -8.896  -0.808 -25.069 1.00 73.24  111 A 1 
ATOM 143 N N   . MET B 1 19 ? -4.000  0.760  -20.284 1.00 48.79  112 A 1 
ATOM 144 C CA  . MET B 1 19 ? -3.094  0.512  -19.186 1.00 52.15  112 A 1 
ATOM 145 C C   . MET B 1 19 ? -3.371  1.430  -18.007 1.00 47.91  112 A 1 
ATOM 146 O O   . MET B 1 19 ? -3.429  0.986  -16.872 1.00 45.58  112 A 1 
ATOM 147 C CB  . MET B 1 19 ? -1.653  0.667  -19.617 1.00 54.11  112 A 1 
ATOM 148 C CG  . MET B 1 19 ? -1.053  -0.654 -20.052 1.00 58.96  112 A 1 
ATOM 149 S SD  . MET B 1 19 ? 0.471   -0.323 -20.923 1.00 65.09  112 A 1 
ATOM 150 C CE  . MET B 1 19 ? 1.501   -0.237 -19.466 1.00 67.56  112 A 1 
ATOM 151 N N   . ILE B 1 20 ? -3.541  2.711  -18.297 1.00 43.25  113 A 1 
ATOM 152 C CA  . ILE B 1 20 ? -3.900  3.677  -17.287 1.00 40.09  113 A 1 
ATOM 153 C C   . ILE B 1 20 ? -5.165  3.240  -16.596 1.00 40.28  113 A 1 
ATOM 154 O O   . ILE B 1 20 ? -5.297  3.383  -15.395 1.00 41.67  113 A 1 
ATOM 155 C CB  . ILE B 1 20 ? -4.079  5.077  -17.885 1.00 41.26  113 A 1 
ATOM 156 C CG1 . ILE B 1 20 ? -2.700  5.633  -18.275 1.00 39.56  113 A 1 
ATOM 157 C CG2 . ILE B 1 20 ? -4.715  6.029  -16.880 1.00 44.72  113 A 1 
ATOM 158 C CD1 . ILE B 1 20 ? -2.722  6.963  -19.009 1.00 37.40  113 A 1 
ATOM 159 N N   . ASP B 1 21 ? -6.096  2.680  -17.346 1.00 41.39  114 A 1 
ATOM 160 C CA  . ASP B 1 21 ? -7.302  2.201  -16.728 1.00 46.35  114 A 1 
ATOM 161 C C   . ASP B 1 21 ? -7.074  1.044  -15.762 1.00 45.76  114 A 1 
ATOM 162 O O   . ASP B 1 21 ? -7.662  1.035  -14.682 1.00 43.56  114 A 1 
ATOM 163 C CB  . ASP B 1 21 ? -8.272  1.734  -17.759 1.00 51.71  114 A 1 
ATOM 164 C CG  . ASP B 1 21 ? -9.647  1.640  -17.208 1.00 60.74  114 A 1 
ATOM 165 O OD1 . ASP B 1 21 ? -10.153 2.682  -16.742 1.00 68.50  114 A 1 
ATOM 166 O OD2 . ASP B 1 21 ? -10.199 0.528  -17.210 1.00 73.36  114 A 1 
ATOM 167 N N   . LYS B 1 22 ? -6.258  0.070  -16.178 1.00 47.51  115 A 1 
ATOM 168 C CA  . LYS B 1 22 ? -5.942  -1.062 -15.321 1.00 50.59  115 A 1 
ATOM 169 C C   . LYS B 1 22 ? -5.255  -0.563 -14.028 1.00 52.11  115 A 1 
ATOM 170 O O   . LYS B 1 22 ? -5.648  -0.941 -12.919 1.00 55.27  115 A 1 
ATOM 171 C CB  . LYS B 1 22 ? -5.085  -2.111 -16.025 1.00 52.86  115 A 1 
ATOM 172 C CG  . LYS B 1 22 ? -5.829  -3.010 -17.008 1.00 57.80  115 A 1 
ATOM 173 N N   . LEU B 1 23 ? -4.266  0.312  -14.176 1.00 48.62  116 A 1 
ATOM 174 C CA  . LEU B 1 23 ? -3.594  0.880  -13.039 1.00 44.80  116 A 1 
ATOM 175 C C   . LEU B 1 23 ? -4.511  1.665  -12.106 1.00 44.04  116 A 1 
ATOM 176 O O   . LEU B 1 23 ? -4.412  1.565  -10.897 1.00 41.22  116 A 1 
ATOM 177 C CB  . LEU B 1 23 ? -2.492  1.781  -13.511 1.00 43.26  116 A 1 
ATOM 178 C CG  . LEU B 1 23 ? -1.353  1.039  -14.177 1.00 45.18  116 A 1 
ATOM 179 C CD1 . LEU B 1 23 ? -0.449  2.064  -14.839 1.00 45.01  116 A 1 
ATOM 180 C CD2 . LEU B 1 23 ? -0.582  0.210  -13.156 1.00 45.90  116 A 1 
ATOM 181 N N   . THR B 1 24 ? -5.402  2.445  -12.674 1.00 49.17  117 A 1 
ATOM 182 C CA  . THR B 1 24 ? -6.382  3.155  -11.886 1.00 49.60  117 A 1 
ATOM 183 C C   . THR B 1 24 ? -7.250  2.198  -11.085 1.00 51.60  117 A 1 
ATOM 184 O O   . THR B 1 24 ? -7.503  2.441  -9.918  1.00 50.82  117 A 1 
ATOM 185 C CB  . THR B 1 24 ? -7.248  4.024  -12.811 1.00 54.67  117 A 1 
ATOM 186 O OG1 . THR B 1 24 ? -6.463  5.126  -13.253 1.00 58.01  117 A 1 
ATOM 187 C CG2 . THR B 1 24 ? -8.464  4.559  -12.141 1.00 57.77  117 A 1 
ATOM 188 N N   . THR B 1 25 ? -7.718  1.116  -11.704 1.00 53.09  118 A 1 
ATOM 189 C CA  . THR B 1 25 ? -8.495  0.117  -10.981 1.00 50.55  118 A 1 
ATOM 190 C C   . THR B 1 25 ? -7.709  -0.503 -9.820  1.00 49.50  118 A 1 
ATOM 191 O O   . THR B 1 25 ? -8.267  -0.695 -8.720  1.00 50.25  118 A 1 
ATOM 192 C CB  . THR B 1 25 ? -8.933  -0.983 -11.947 1.00 53.52  118 A 1 
ATOM 193 O OG1 . THR B 1 25 ? -9.796  -0.396 -12.916 1.00 60.17  118 A 1 
ATOM 194 C CG2 . THR B 1 25 ? -9.619  -2.127 -11.260 1.00 58.18  118 A 1 
ATOM 195 N N   . ARG B 1 26 ? -6.447  -0.762 -10.054 1.00 48.62  119 A 1 
ATOM 196 C CA  . ARG B 1 26 ? -5.575  -1.319 -9.076  1.00 52.29  119 A 1 
ATOM 197 C C   . ARG B 1 26 ? -5.362  -0.349 -7.936  1.00 56.15  119 A 1 
ATOM 198 O O   . ARG B 1 26 ? -5.203  -0.758 -6.818  1.00 60.08  119 A 1 
ATOM 199 C CB  . ARG B 1 26 ? -4.262  -1.609 -9.738  1.00 57.25  119 A 1 
ATOM 200 C CG  . ARG B 1 26 ? -4.341  -2.608 -10.845 1.00 67.09  119 A 1 
ATOM 201 C CD  . ARG B 1 26 ? -4.671  -3.974 -10.307 1.00 78.77  119 A 1 
ATOM 202 N NE  . ARG B 1 26 ? -4.743  -4.923 -11.390 1.00 95.96  119 A 1 
ATOM 203 C CZ  . ARG B 1 26 ? -3.703  -5.558 -11.900 1.00 111.57 119 A 1 
ATOM 204 N NH1 . ARG B 1 26 ? -3.881  -6.412 -12.892 1.00 120.54 119 A 1 
ATOM 205 N NH2 . ARG B 1 26 ? -2.494  -5.350 -11.417 1.00 114.95 119 A 1 
ATOM 206 N N   . GLY B 1 27 ? -5.312  0.940  -8.241  1.00 57.29  120 A 1 
ATOM 207 C CA  . GLY B 1 27 ? -5.176  2.005  -7.265  1.00 55.03  120 A 1 
ATOM 208 C C   . GLY B 1 27 ? -6.391  2.105  -6.381  1.00 51.16  120 A 1 
ATOM 209 O O   . GLY B 1 27 ? -6.273  2.252  -5.174  1.00 48.31  120 A 1 
ATOM 210 N N   . ILE B 1 28 ? -7.570  1.983  -6.973  1.00 48.29  121 A 1 
ATOM 211 C CA  . ILE B 1 28 ? -8.807  2.040  -6.198  1.00 51.59  121 A 1 
ATOM 212 C C   . ILE B 1 28 ? -8.893  0.889  -5.227  1.00 54.18  121 A 1 
ATOM 213 O O   . ILE B 1 28 ? -9.376  1.068  -4.118  1.00 53.53  121 A 1 
ATOM 214 C CB  . ILE B 1 28 ? -10.053 2.141  -7.095  1.00 55.27  121 A 1 
ATOM 215 C CG1 . ILE B 1 28 ? -10.187 3.601  -7.621  1.00 55.95  121 A 1 
ATOM 216 C CG2 . ILE B 1 28 ? -11.306 1.807  -6.320  1.00 61.76  121 A 1 
ATOM 217 C CD1 . ILE B 1 28 ? -11.126 3.822  -8.793  1.00 55.74  121 A 1 
ATOM 218 N N   . GLU B 1 29 ? -8.420  -0.273 -5.627  1.00 61.84  122 A 1 
ATOM 219 C CA  . GLU B 1 29 ? -8.319  -1.378 -4.700  1.00 67.68  122 A 1 
ATOM 220 C C   . GLU B 1 29 ? -7.415  -1.069 -3.537  1.00 65.03  122 A 1 
ATOM 221 O O   . GLU B 1 29 ? -7.791  -1.331 -2.393  1.00 64.70  122 A 1 
ATOM 222 C CB  . GLU B 1 29 ? -7.868  -2.634 -5.431  1.00 78.78  122 A 1 
ATOM 223 C CG  . GLU B 1 29 ? -9.069  -3.428 -5.962  1.00 86.76  122 A 1 
ATOM 224 C CD  . GLU B 1 29 ? -8.878  -4.019 -7.353  1.00 87.49  122 A 1 
ATOM 225 O OE1 . GLU B 1 29 ? -7.768  -4.558 -7.636  1.00 84.73  122 A 1 
ATOM 226 O OE2 . GLU B 1 29 ? -9.870  -3.959 -8.121  1.00 77.87  122 A 1 
ATOM 227 N N   . GLN B 1 30 ? -6.256  -0.484 -3.829  1.00 59.57  123 A 1 
ATOM 228 C CA  . GLN B 1 30 ? -5.315  -0.084 -2.773  1.00 55.23  123 A 1 
ATOM 229 C C   . GLN B 1 30 ? -5.910  0.955  -1.841  1.00 51.86  123 A 1 
ATOM 230 O O   . GLN B 1 30 ? -5.662  0.942  -0.653  1.00 44.12  123 A 1 
ATOM 231 C CB  . GLN B 1 30 ? -4.037  0.514  -3.362  1.00 55.92  123 A 1 
ATOM 232 C CG  . GLN B 1 30 ? -3.221  -0.371 -4.262  1.00 61.37  123 A 1 
ATOM 233 C CD  . GLN B 1 30 ? -2.863  -1.664 -3.614  1.00 62.35  123 A 1 
ATOM 234 O OE1 . GLN B 1 30 ? -2.326  -1.663 -2.512  1.00 63.09  123 A 1 
ATOM 235 N NE2 . GLN B 1 30 ? -3.188  -2.787 -4.276  1.00 70.63  123 A 1 
ATOM 236 N N   . VAL B 1 31 ? -6.703  1.858  -2.386  1.00 57.05  124 A 1 
ATOM 237 C CA  . VAL B 1 31 ? -7.323  2.883  -1.569  1.00 56.37  124 A 1 
ATOM 238 C C   . VAL B 1 31 ? -8.333  2.246  -0.629  1.00 61.68  124 A 1 
ATOM 239 O O   . VAL B 1 31 ? -8.461  2.699  0.470   1.00 58.51  124 A 1 
ATOM 240 C CB  . VAL B 1 31 ? -7.969  3.950  -2.456  1.00 57.06  124 A 1 
ATOM 241 C CG1 . VAL B 1 31 ? -9.007  4.756  -1.702  1.00 58.79  124 A 1 
ATOM 242 C CG2 . VAL B 1 31 ? -6.871  4.864  -2.974  1.00 58.78  124 A 1 
ATOM 243 N N   . GLU B 1 32 ? -9.044  1.205  -1.068  1.00 67.95  125 A 1 
ATOM 244 C CA  . GLU B 1 32 ? -9.940  0.481  -0.175  1.00 64.07  125 A 1 
ATOM 245 C C   . GLU B 1 32 ? -9.140  -0.246 0.887   1.00 61.43  125 A 1 
ATOM 246 O O   . GLU B 1 32 ? -9.521  -0.248 2.049   1.00 58.85  125 A 1 
ATOM 247 C CB  . GLU B 1 32 ? -10.821 -0.511 -0.911  1.00 70.57  125 A 1 
ATOM 248 C CG  . GLU B 1 32 ? -11.844 0.047  -1.875  1.00 81.60  125 A 1 
ATOM 249 C CD  . GLU B 1 32 ? -12.772 1.105  -1.306  1.00 92.01  125 A 1 
ATOM 250 O OE1 . GLU B 1 32 ? -13.833 0.773  -0.713  1.00 101.96 125 A 1 
ATOM 251 O OE2 . GLU B 1 32 ? -12.392 2.286  -1.482  1.00 95.64  125 A 1 
ATOM 252 N N   . LEU B 1 33 ? -8.042  -0.849 0.489   1.00 55.72  126 A 1 
ATOM 253 C CA  . LEU B 1 33 ? -7.201  -1.483 1.447   1.00 58.91  126 A 1 
ATOM 254 C C   . LEU B 1 33 ? -6.628  -0.487 2.476   1.00 56.58  126 A 1 
ATOM 255 O O   . LEU B 1 33 ? -6.271  -0.829 3.592   1.00 59.20  126 A 1 
ATOM 256 C CB  . LEU B 1 33 ? -6.089  -2.149 0.676   1.00 63.68  126 A 1 
ATOM 257 C CG  . LEU B 1 33 ? -5.181  -3.155 1.283   1.00 71.88  126 A 1 
ATOM 258 C CD1 . LEU B 1 33 ? -4.453  -3.972 0.195   1.00 73.91  126 A 1 
ATOM 259 C CD2 . LEU B 1 33 ? -4.179  -2.480 2.169   1.00 75.78  126 A 1 
ATOM 260 N N   . LEU B 1 34 ? -6.482  0.743  2.064   1.00 51.59  127 A 1 
ATOM 261 C CA  . LEU B 1 34 ? -6.054  1.821  2.952   1.00 47.43  127 A 1 
ATOM 262 C C   . LEU B 1 34 ? -7.162  2.293  3.867   1.00 49.18  127 A 1 
ATOM 263 O O   . LEU B 1 34 ? -6.917  2.748  4.956   1.00 48.29  127 A 1 
ATOM 264 C CB  . LEU B 1 34 ? -5.537  2.996  2.165   1.00 43.17  127 A 1 
ATOM 265 C CG  . LEU B 1 34 ? -4.031  2.968  1.890   1.00 42.73  127 A 1 
ATOM 266 C CD1 . LEU B 1 34 ? -3.630  4.313  1.305   1.00 42.46  127 A 1 
ATOM 267 C CD2 . LEU B 1 34 ? -3.088  2.610  3.005   1.00 43.31  127 A 1 
ATOM 268 N N   . LYS B 1 35 ? -8.399  2.214  3.408   1.00 52.51  128 A 1 
ATOM 269 C CA  . LYS B 1 35 ? -9.553  2.535  4.233   1.00 52.46  128 A 1 
ATOM 270 C C   . LYS B 1 35 ? -9.710  1.492  5.330   1.00 53.78  128 A 1 
ATOM 271 O O   . LYS B 1 35 ? -10.040 1.823  6.442   1.00 47.30  128 A 1 
ATOM 272 C CB  . LYS B 1 35 ? -10.830 2.641  3.381   1.00 54.62  128 A 1 
ATOM 273 C CG  . LYS B 1 35 ? -12.138 2.251  4.078   1.00 59.22  128 A 1 
ATOM 274 N N   . ARG B 1 36 ? -9.454  0.236  4.997   1.00 56.56  129 A 1 
ATOM 275 C CA  . ARG B 1 36 ? -9.471  -0.853 5.953   1.00 60.75  129 A 1 
ATOM 276 C C   . ARG B 1 36 ? -8.392  -0.650 7.014   1.00 59.48  129 A 1 
ATOM 277 O O   . ARG B 1 36 ? -8.620  -0.927 8.185   1.00 63.52  129 A 1 
ATOM 278 C CB  . ARG B 1 36 ? -9.292  -2.210 5.247   1.00 65.76  129 A 1 
ATOM 279 C CG  . ARG B 1 36 ? -10.535 -2.769 4.547   1.00 68.71  129 A 1 
ATOM 280 C CD  . ARG B 1 36 ? -10.167 -3.835 3.488   1.00 67.67  129 A 1 
ATOM 281 N N   . ILE B 1 37 ? -7.221  -0.161 6.611   1.00 54.56  130 A 1 
ATOM 282 C CA  . ILE B 1 37 ? -6.140  0.129  7.539   1.00 49.62  130 A 1 
ATOM 283 C C   . ILE B 1 37 ? -6.541  1.250  8.466   1.00 49.00  130 A 1 
ATOM 284 O O   . ILE B 1 37 ? -6.319  1.155  9.647   1.00 47.20  130 A 1 
ATOM 285 C CB  . ILE B 1 37 ? -4.839  0.472  6.806   1.00 51.01  130 A 1 
ATOM 286 C CG1 . ILE B 1 37 ? -4.243  -0.830 6.231   1.00 57.41  130 A 1 
ATOM 287 C CG2 . ILE B 1 37 ? -3.851  1.181  7.755   1.00 49.06  130 A 1 
ATOM 288 C CD1 . ILE B 1 37 ? -2.922  -0.695 5.533   1.00 59.59  130 A 1 
ATOM 289 N N   . HIS B 1 38 ? -7.179  2.276  7.957   1.00 50.21  131 A 1 
ATOM 290 C CA  . HIS B 1 38 ? -7.618  3.356  8.797   1.00 53.53  131 A 1 
ATOM 291 C C   . HIS B 1 38 ? -8.670  2.891  9.780   1.00 62.35  131 A 1 
ATOM 292 O O   . HIS B 1 38 ? -8.744  3.378  10.880  1.00 61.76  131 A 1 
ATOM 293 C CB  . HIS B 1 38 ? -8.175  4.452  7.947   1.00 51.42  131 A 1 
ATOM 294 C CG  . HIS B 1 38 ? -9.034  5.412  8.688   1.00 54.14  131 A 1 
ATOM 295 N ND1 . HIS B 1 38 ? -10.380 5.221  8.850   1.00 59.92  131 A 1 
ATOM 296 C CD2 . HIS B 1 38 ? -8.749  6.586  9.283   1.00 55.36  131 A 1 
ATOM 297 C CE1 . HIS B 1 38 ? -10.887 6.229  9.522   1.00 62.46  131 A 1 
ATOM 298 N NE2 . HIS B 1 38 ? -9.918  7.073  9.795   1.00 61.48  131 A 1 
ATOM 299 N N   . ASP B 1 39 ? -9.476  1.928  9.394   1.00 63.84  132 A 1 
ATOM 300 C CA  . ASP B 1 39 ? -10.480 1.421  10.286  1.00 65.95  132 A 1 
ATOM 301 C C   . ASP B 1 39 ? -9.837  0.648  11.420  1.00 61.61  132 A 1 
ATOM 302 O O   . ASP B 1 39 ? -10.164 0.840  12.551  1.00 56.16  132 A 1 
ATOM 303 C CB  . ASP B 1 39 ? -11.456 0.577  9.509   1.00 73.60  132 A 1 
ATOM 304 C CG  . ASP B 1 39 ? -12.373 1.404  8.658   1.00 76.60  132 A 1 
ATOM 305 O OD1 . ASP B 1 39 ? -12.277 2.631  8.703   1.00 70.60  132 A 1 
ATOM 306 O OD2 . ASP B 1 39 ? -13.195 0.833  7.937   1.00 81.44  132 A 1 
ATOM 307 N N   . LYS B 1 40 ? -8.926  -0.245 11.106  1.00 59.87  133 A 1 
ATOM 308 C CA  . LYS B 1 40 ? -8.191  -0.985 12.129  1.00 59.13  133 A 1 
ATOM 309 C C   . LYS B 1 40 ? -7.573  -0.021 13.157  1.00 58.88  133 A 1 
ATOM 310 O O   . LYS B 1 40 ? -7.579  -0.267 14.361  1.00 63.83  133 A 1 
ATOM 311 C CB  . LYS B 1 40 ? -7.093  -1.864 11.503  1.00 58.69  133 A 1 
ATOM 312 C CG  . LYS B 1 40 ? -7.577  -3.018 10.646  1.00 62.42  133 A 1 
ATOM 313 C CD  . LYS B 1 40 ? -6.463  -3.844 9.987   1.00 62.93  133 A 1 
ATOM 314 N N   . LEU B 1 41 ? -7.038  1.086  12.674  1.00 60.19  134 A 1 
ATOM 315 C CA  . LEU B 1 41 ? -6.454  2.092  13.561  1.00 62.93  134 A 1 
ATOM 316 C C   . LEU B 1 41 ? -7.487  2.707  14.452  1.00 63.64  134 A 1 
ATOM 317 O O   . LEU B 1 41 ? -7.205  2.982  15.605  1.00 73.06  134 A 1 
ATOM 318 C CB  . LEU B 1 41 ? -5.765  3.197  12.764  1.00 64.98  134 A 1 
ATOM 319 C CG  . LEU B 1 41 ? -4.531  2.611  12.036  1.00 68.88  134 A 1 
ATOM 320 C CD1 . LEU B 1 41 ? -4.332  3.201  10.638  1.00 78.49  134 A 1 
ATOM 321 C CD2 . LEU B 1 41 ? -3.301  2.685  12.900  1.00 67.40  134 A 1 
ATOM 322 N N   . MET B 1 42 ? -8.669  2.955  13.913  1.00 63.76  135 A 1 
ATOM 323 C CA  . MET B 1 42 ? -9.752  3.512  14.704  1.00 67.57  135 A 1 
ATOM 324 C C   . MET B 1 42 ? -10.186 2.561  15.817  1.00 72.44  135 A 1 
ATOM 325 O O   . MET B 1 42 ? -10.413 2.985  16.975  1.00 66.48  135 A 1 
ATOM 326 C CB  . MET B 1 42 ? -10.932 3.853  13.816  1.00 69.82  135 A 1 
ATOM 327 C CG  . MET B 1 42 ? -10.710 5.112  13.020  1.00 74.54  135 A 1 
ATOM 328 S SD  . MET B 1 42 ? -10.062 6.547  13.958  1.00 82.27  135 A 1 
ATOM 329 C CE  . MET B 1 42 ? -11.073 6.663  15.446  1.00 83.33  135 A 1 
ATOM 330 N N   . ILE B 1 43 ? -10.271 1.274  15.477  1.00 81.93  136 A 1 
ATOM 331 C CA  . ILE B 1 43 ? -10.594 0.243  16.446  1.00 79.15  136 A 1 
ATOM 332 C C   . ILE B 1 43 ? -9.526  0.183  17.546  1.00 79.65  136 A 1 
ATOM 333 O O   . ILE B 1 43 ? -9.854  0.128  18.719  1.00 82.01  136 A 1 
ATOM 334 C CB  . ILE B 1 43 ? -10.781 -1.129 15.738  1.00 80.39  136 A 1 
ATOM 335 C CG1 . ILE B 1 43 ? -12.176 -1.237 15.090  1.00 78.84  136 A 1 
ATOM 336 C CG2 . ILE B 1 43 ? -10.586 -2.294 16.708  1.00 84.53  136 A 1 
ATOM 337 C CD1 . ILE B 1 43 ? -12.480 -0.642 13.720  1.00 74.74  136 A 1 
ATOM 338 N N   . ARG B 1 44 ? -8.250  0.200  17.158  1.00 85.15  137 A 1 
ATOM 339 C CA  . ARG B 1 44 ? -7.131  0.216  18.111  1.00 90.78  137 A 1 
ATOM 340 C C   . ARG B 1 44 ? -7.103  1.498  18.957  1.00 91.00  137 A 1 
ATOM 341 O O   . ARG B 1 44 ? -6.632  1.453  20.068  1.00 96.79  137 A 1 
ATOM 342 C CB  . ARG B 1 44 ? -5.803  0.033  17.373  1.00 95.82  137 A 1 
ATOM 343 C CG  . ARG B 1 44 ? -4.883  -1.005 17.902  1.00 101.09 137 A 1 
ATOM 344 C CD  . ARG B 1 44 ? -3.772  -1.099 16.880  1.00 107.64 137 A 1 
ATOM 345 N NE  . ARG B 1 44 ? -2.978  -2.299 17.060  1.00 124.71 137 A 1 
ATOM 346 C CZ  . ARG B 1 44 ? -2.237  -2.882 16.112  1.00 137.30 137 A 1 
ATOM 347 N NH1 . ARG B 1 44 ? -2.186  -2.387 14.871  1.00 128.35 137 A 1 
ATOM 348 N NH2 . ARG B 1 44 ? -1.533  -3.990 16.400  1.00 147.87 137 A 1 
ATOM 349 N N   . ALA B 1 45 ? -7.688  2.601  18.506  1.00 92.41  138 A 1 
ATOM 350 C CA  . ALA B 1 45 ? -7.783  3.810  19.381  1.00 96.29  138 A 1 
ATOM 351 C C   . ALA B 1 45 ? -8.773  4.837  18.851  1.00 95.46  138 A 1 
ATOM 352 O O   . ALA B 1 45 ? -8.386  5.847  18.235  1.00 81.53  138 A 1 
ATOM 353 C CB  . ALA B 1 45 ? -6.408  4.475  19.603  1.00 97.91  138 A 1 
#


================================================
FILE: src/alphafold3/test_data/miniature_databases/pdb_mmcif/6s61.cif
================================================
data_6S61
#
_entry.id 6S61
#
loop_
_chem_comp.formula
_chem_comp.formula_weight
_chem_comp.id
_chem_comp.mon_nstd_flag
_chem_comp.name
_chem_comp.pdbx_synonyms
_chem_comp.type
"C3 H7 N O2"     89.093  ALA y ALANINE         ? "L-peptide linking" 
"C6 H15 N4 O2 1" 175.209 ARG y ARGININE        ? "L-peptide linking" 
"C4 H8 N2 O3"    132.118 ASN y ASPARAGINE      ? "L-peptide linking" 
"C4 H7 N O4"     133.103 ASP y "ASPARTIC ACID" ? "L-peptide linking" 
"C3 H7 N O2 S"   121.158 CYS y CYSTEINE        ? "L-peptide linking" 
"Fe 3"           55.845  FE  . "FE (III) ION"  ? non-polymer         
"C5 H10 N2 O3"   146.144 GLN y GLUTAMINE       ? "L-peptide linking" 
"C5 H9 N O4"     147.129 GLU y "GLUTAMIC ACID" ? "L-peptide linking" 
"C2 H5 N O2"     75.067  GLY y GLYCINE         ? "peptide linking"   
"C6 H10 N3 O2 1" 156.162 HIS y HISTIDINE       ? "L-peptide linking" 
"H2 O"           18.015  HOH . WATER           ? non-polymer         
"C6 H13 N O2"    131.173 ILE y ISOLEUCINE      ? "L-peptide linking" 
"C6 H13 N O2"    131.173 LEU y LEUCINE         ? "L-peptide linking" 
"C6 H15 N2 O2 1" 147.195 LYS y LYSINE          ? "L-peptide linking" 
"C5 H11 N O2 S"  149.211 MET y METHIONINE      ? "L-peptide linking" 
"C9 H11 N O2"    165.189 PHE y PHENYLALANINE   ? "L-peptide linking" 
"C5 H9 N O2"     115.130 PRO y PROLINE         ? "L-peptide linking" 
"C3 H7 N O3"     105.093 SER y SERINE          ? "L-peptide linking" 
"C4 H9 N O3"     119.119 THR y THREONINE       ? "L-peptide linking" 
"C11 H12 N2 O2"  204.225 TRP y TRYPTOPHAN      ? "L-peptide linking" 
"C9 H11 N O3"    181.189 TYR y TYROSINE        ? "L-peptide linking" 
"C5 H11 N O2"    117.146 VAL y VALINE          ? "L-peptide linking" 
"Zn 2"           65.409  ZN  . "ZINC ION"      ? non-polymer         
#
loop_
_entity.id
_entity.pdbx_description
_entity.type
1 "Ferritin heavy chain" polymer     
3 "ZINC ION"             non-polymer 
#
_entity_poly.entity_id      1
_entity_poly.pdbx_strand_id M
_entity_poly.type           polypeptide(L)
#
loop_
_entity_poly_seq.entity_id
_entity_poly_seq.hetero
_entity_poly_seq.mon_id
_entity_poly_seq.num
1 n MET 1   
1 n THR 2   
1 n THR 3   
1 n ALA 4   
1 n SER 5   
1 n PRO 6   
1 n SER 7   
1 n GLN 8   
1 n VAL 9   
1 n ARG 10  
1 n GLN 11  
1 n ASN 12  
1 n TYR 13  
1 n HIS 14  
1 n GLN 15  
1 n ASP 16  
1 n ALA 17  
1 n GLU 18  
1 n ALA 19  
1 n ALA 20  
1 n ILE 21  
1 n ASN 22  
1 n ARG 23  
1 n GLN 24  
1 n ILE 25  
1 n ASN 26  
1 n LEU 27  
1 n GLU 28  
1 n LEU 29  
1 n TYR 30  
1 n ALA 31  
1 n SER 32  
1 n TYR 33  
1 n VAL 34  
1 n TYR 35  
1 n LEU 36  
1 n SER 37  
1 n MET 38  
1 n SER 39  
1 n CYS 40  
1 n TYR 41  
1 n PHE 42  
1 n ASP 43  
1 n ARG 44  
1 n ASP 45  
1 n ASP 46  
1 n VAL 47  
1 n ALA 48  
1 n LEU 49  
1 n LYS 50  
1 n ASN 51  
1 n PHE 52  
1 n ALA 53  
1 n LYS 54  
1 n TYR 55  
1 n PHE 56  
1 n LEU 57  
1 n HIS 58  
1 n GLN 59  
1 n SER 60  
1 n HIS 61  
1 n GLU 62  
1 n GLU 63  
1 n ARG 64  
1 n GLU 65  
1 n HIS 66  
1 n ALA 67  
1 n GLU 68  
1 n LYS 69  
1 n LEU 70  
1 n MET 71  
1 n LYS 72  
1 n LEU 73  
1 n GLN 74  
1 n ASN 75  
1 n GLN 76  
1 n ARG 77  
1 n GLY 78  
1 n GLY 79  
1 n ARG 80  
1 n ILE 81  
1 n PHE 82  
1 n LEU 83  
1 n GLN 84  
1 n ASP 85  
1 n ILE 86  
1 n LYS 87  
1 n LYS 88  
1 n PRO 89  
1 n ASP 90  
1 n ARG 91  
1 n ASP 92  
1 n ASP 93  
1 n TRP 94  
1 n GLU 95  
1 n SER 96  
1 n GLY 97  
1 n LEU 98  
1 n ASN 99  
1 n ALA 100 
1 n MET 101 
1 n GLU 102 
1 n CYS 103 
1 n ALA 104 
1 n LEU 105 
1 n HIS 106 
1 n LEU 107 
1 n GLU 108 
1 n LYS 109 
1 n SER 110 
1 n VAL 111 
1 n ASN 112 
1 n GLN 113 
1 n SER 114 
1 n LEU 115 
1 n LEU 116 
1 n GLU 117 
1 n LEU 118 
1 n HIS 119 
1 n LYS 120 
1 n LEU 121 
1 n ALA 122 
1 n THR 123 
1 n ASP 124 
1 n LYS 125 
1 n ASN 126 
1 n ASP 127 
1 n PRO 128 
1 n HIS 129 
1 n LEU 130 
1 n CYS 131 
1 n ASP 132 
1 n PHE 133 
1 n ILE 134 
1 n GLU 135 
1 n THR 136 
1 n TYR 137 
1 n TYR 138 
1 n LEU 139 
1 n SER 140 
1 n GLU 141 
1 n GLN 142 
1 n VAL 143 
1 n LYS 144 
1 n SER 145 
1 n ILE 146 
1 n LYS 147 
1 n GLU 148 
1 n LEU 149 
1 n GLY 150 
1 n ASP 151 
1 n HIS 152 
1 n VAL 153 
1 n THR 154 
1 n ASN 155 
1 n LEU 156 
1 n ARG 157 
1 n LYS 158 
1 n MET 159 
1 n GLY 160 
1 n ALA 161 
1 n PRO 162 
1 n GLU 163 
1 n ALA 164 
1 n GLY 165 
1 n MET 166 
1 n ALA 167 
1 n GLU 168 
1 n TYR 169 
1 n LEU 170 
1 n PHE 171 
1 n ASP 172 
1 n LYS 173 
1 n HIS 174 
1 n THR 175 
1 n LEU 176 
1 n GLY 177 
1 n HIS 178 
1 n GLY 179 
1 n ASP 180 
1 n GLU 181 
1 n SER 182 
#
_exptl.method "ELECTRON MICROSCOPY"
#
_pdbx_audit_revision_history.revision_date 2019-07-10
#
_pdbx_database_status.recvd_initial_deposition_date 2019-07-10
#
_pdbx_nonpoly_scheme.asym_id       PA
_pdbx_nonpoly_scheme.auth_seq_num  201
_pdbx_nonpoly_scheme.entity_id     3
_pdbx_nonpoly_scheme.mon_id        ZN
_pdbx_nonpoly_scheme.pdb_ins_code  .
_pdbx_nonpoly_scheme.pdb_seq_num   201
_pdbx_nonpoly_scheme.pdb_strand_id M
#
loop_
_pdbx_poly_seq_scheme.asym_id
_pdbx_poly_seq_scheme.auth_seq_num
_pdbx_poly_seq_scheme.entity_id
_pdbx_poly_seq_scheme.hetero
_pdbx_poly_seq_scheme.mon_id
_pdbx_poly_seq_scheme.pdb_ins_code
_pdbx_poly_seq_scheme.pdb_seq_num
_pdbx_poly_seq_scheme.pdb_strand_id
_pdbx_poly_seq_scheme.seq_id
M ?   1 n MET . 0   M 1   
M ?   1 n THR . 1   M 2   
M ?   1 n THR . 2   M 3   
M ?   1 n ALA . 3   M 4   
M ?   1 n SER . 4   M 5   
M 5   1 n PRO . 5   M 6   
M 6   1 n SER . 6   M 7   
M 7   1 n GLN . 7   M 8   
M 8   1 n VAL . 8   M 9   
M 9   1 n ARG . 9   M 10  
M 10  1 n GLN . 10  M 11  
M 11  1 n ASN . 11  M 12  
M 12  1 n TYR . 12  M 13  
M 13  1 n HIS . 13  M 14  
M 14  1 n GLN . 14  M 15  
M 15  1 n ASP . 15  M 16  
M 16  1 n ALA . 16  M 17  
M 17  1 n GLU . 17  M 18  
M 18  1 n ALA . 18  M 19  
M 19  1 n ALA . 19  M 20  
M 20  1 n ILE . 20  M 21  
M 21  1 n ASN . 21  M 22  
M 22  1 n ARG . 22  M 23  
M 23  1 n GLN . 23  M 24  
M 24  1 n ILE . 24  M 25  
M 25  1 n ASN . 25  M 26  
M 26  1 n LEU . 26  M 27  
M 27  1 n GLU . 27  M 28  
M 28  1 n LEU . 28  M 29  
M 29  1 n TYR . 29  M 30  
M 30  1 n ALA . 30  M 31  
M 31  1 n SER . 31  M 32  
M 32  1 n TYR . 32  M 33  
M 33  1 n VAL . 33  M 34  
M 34  1 n TYR . 34  M 35  
M 35  1 n LEU . 35  M 36  
M 36  1 n SER . 36  M 37  
M 37  1 n MET . 37  M 38  
M 38  1 n SER . 38  M 39  
M 39  1 n CYS . 39  M 40  
M 40  1 n TYR . 40  M 41  
M 41  1 n PHE . 41  M 42  
M 42  1 n ASP . 42  M 43  
M 43  1 n ARG . 43  M 44  
M 44  1 n ASP . 44  M 45  
M 45  1 n ASP . 45  M 46  
M 46  1 n VAL . 46  M 47  
M 47  1 n ALA . 47  M 48  
M 48  1 n LEU . 48  M 49  
M 49  1 n LYS . 49  M 50  
M 50  1 n ASN . 50  M 51  
M 51  1 n PHE . 51  M 52  
M 52  1 n ALA . 52  M 53  
M 53  1 n LYS . 53  M 54  
M 54  1 n TYR . 54  M 55  
M 55  1 n PHE . 55  M 56  
M 56  1 n LEU . 56  M 57  
M 57  1 n HIS . 57  M 58  
M 58  1 n GLN . 58  M 59  
M 59  1 n SER . 59  M 60  
M 60  1 n HIS . 60  M 61  
M 61  1 n GLU . 61  M 62  
M 62  1 n GLU . 62  M 63  
M 63  1 n ARG . 63  M 64  
M 64  1 n GLU . 64  M 65  
M 65  1 n HIS . 65  M 66  
M 66  1 n ALA . 66  M 67  
M 67  1 n GLU . 67  M 68  
M 68  1 n LYS . 68  M 69  
M 69  1 n LEU . 69  M 70  
M 70  1 n MET . 70  M 71  
M 71  1 n LYS . 71  M 72  
M 72  1 n LEU . 72  M 73  
M 73  1 n GLN . 73  M 74  
M 74  1 n ASN . 74  M 75  
M 75  1 n GLN . 75  M 76  
M 76  1 n ARG . 76  M 77  
M 77  1 n GLY . 77  M 78  
M 78  1 n GLY . 78  M 79  
M 79  1 n ARG . 79  M 80  
M 80  1 n ILE . 80  M 81  
M 81  1 n PHE . 81  M 82  
M 82  1 n LEU . 82  M 83  
M 83  1 n GLN . 83  M 84  
M 84  1 n ASP . 84  M 85  
M 85  1 n ILE . 85  M 86  
M 86  1 n LYS . 86  M 87  
M 87  1 n LYS . 87  M 88  
M 88  1 n PRO . 88  M 89  
M 89  1 n ASP . 89  M 90  
M 90  1 n ARG . 90  M 91  
M 91  1 n ASP . 91  M 92  
M 92  1 n ASP . 92  M 93  
M 93  1 n TRP . 93  M 94  
M 94  1 n GLU . 94  M 95  
M 95  1 n SER . 95  M 96  
M 96  1 n GLY . 96  M 97  
M 97  1 n LEU . 97  M 98  
M 98  1 n ASN . 98  M 99  
M 99  1 n ALA . 99  M 100 
M 100 1 n MET . 100 M 101 
M 101 1 n GLU . 101 M 102 
M 102 1 n CYS . 102 M 103 
M 103 1 n ALA . 103 M 104 
M 104 1 n LEU . 104 M 105 
M 105 1 n HIS . 105 M 106 
M 106 1 n LEU . 106 M 107 
M 107 1 n GLU . 107 M 108 
M 108 1 n LYS . 108 M 109 
M 109 1 n SER . 109 M 110 
M 110 1 n VAL . 110 M 111 
M 111 1 n ASN . 111 M 112 
M 112 1 n GLN . 112 M 113 
M 113 1 n SER . 113 M 114 
M 114 1 n LEU . 114 M 115 
M 115 1 n LEU . 115 M 116 
M 116 1 n GLU . 116 M 117 
M 117 1 n LEU . 117 M 118 
M 118 1 n HIS . 118 M 119 
M 119 1 n LYS . 119 M 120 
M 120 1 n LEU . 120 M 121 
M 121 1 n ALA . 121 M 122 
M 122 1 n THR . 122 M 123 
M 123 1 n ASP . 123 M 124 
M 124 1 n LYS . 124 M 125 
M 125 1 n ASN . 125 M 126 
M 126 1 n ASP . 126 M 127 
M 127 1 n PRO . 127 M 128 
M 128 1 n HIS . 128 M 129 
M 129 1 n LEU . 129 M 130 
M 130 1 n CYS . 130 M 131 
M 131 1 n ASP . 131 M 132 
M 132 1 n PHE . 132 M 133 
M 133 1 n ILE . 133 M 134 
M 134 1 n GLU . 134 M 135 
M 135 1 n THR . 135 M 136 
M 136 1 n TYR . 136 M 137 
M 137 1 n TYR . 137 M 138 
M 138 1 n LEU . 138 M 139 
M 139 1 n SER . 139 M 140 
M 140 1 n GLU . 140 M 141 
M 141 1 n GLN . 141 M 142 
M 142 1 n VAL . 142 M 143 
M 143 1 n LYS . 143 M 144 
M 144 1 n SER . 144 M 145 
M 145 1 n ILE . 145 M 146 
M 146 1 n LYS . 146 M 147 
M 147 1 n GLU . 147 M 148 
M 148 1 n LEU . 148 M 149 
M 149 1 n GLY . 149 M 150 
M 150 1 n ASP . 150 M 151 
M 151 1 n HIS . 151 M 152 
M 152 1 n VAL . 152 M 153 
M 153 1 n THR . 153 M 154 
M 154 1 n ASN . 154 M 155 
M 155 1 n LEU . 155 M 156 
M 156 1 n ARG . 156 M 157 
M 157 1 n LYS . 157 M 158 
M 158 1 n MET . 158 M 159 
M 159 1 n GLY . 159 M 160 
M 160 1 n ALA . 160 M 161 
M 161 1 n PRO . 161 M 162 
M 162 1 n GLU . 162 M 163 
M 163 1 n ALA . 163 M 164 
M 164 1 n GLY . 164 M 165 
M 165 1 n MET . 165 M 166 
M 166 1 n ALA . 166 M 167 
M 167 1 n GLU . 167 M 168 
M 168 1 n TYR . 168 M 169 
M 169 1 n LEU . 169 M 170 
M 170 1 n PHE . 170 M 171 
M 171 1 n ASP . 171 M 172 
M 172 1 n LYS . 172 M 173 
M 173 1 n HIS . 173 M 174 
M 174 1 n THR . 174 M 175 
M 175 1 n LEU . 175 M 176 
M 176 1 n GLY . 176 M 177 
M ?   1 n HIS . 177 M 178 
M ?   1 n GLY . 178 M 179 
M ?   1 n ASP . 179 M 180 
M ?   1 n GLU . 180 M 181 
M ?   1 n SER . 181 M 182 
#
_pdbx_struct_assembly.details            author_and_software_defined_assembly
_pdbx_struct_assembly.id                 1
_pdbx_struct_assembly.method_details     PISA
_pdbx_struct_assembly.oligomeric_count   24
_pdbx_struct_assembly.oligomeric_details 24-meric
#
_pdbx_struct_assembly_gen.assembly_id     1
_pdbx_struct_assembly_gen.asym_id_list    A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z,AA,BA,CA,DA,EA,FA,GA,HA,IA,JA,KA,LA,MA,NA,OA,PA,QA,RA,SA,TA,UA,VA,WA,XA,YA,ZA,AB,BB,CB,DB,EB,FB,GB,HB,IB,JB,KB,LB,MB,NB,OB,PB,QB,RB,SB,TB,UB,VB,WB,XB,YB,ZB
_pdbx_struct_assembly_gen.oper_expression 1
#
_pdbx_struct_oper_list.id                 1
_pdbx_struct_oper_list.matrix[1][1]       1.0000000000
_pdbx_struct_oper_list.matrix[1][2]       0.0000000000
_pdbx_struct_oper_list.matrix[1][3]       0.0000000000
_pdbx_struct_oper_list.matrix[2][1]       0.0000000000
_pdbx_struct_oper_list.matrix[2][2]       1.0000000000
_pdbx_struct_oper_list.matrix[2][3]       0.0000000000
_pdbx_struct_oper_list.matrix[3][1]       0.0000000000
_pdbx_struct_oper_list.matrix[3][2]       0.0000000000
_pdbx_struct_oper_list.matrix[3][3]       1.0000000000
_pdbx_struct_oper_list.name               1_555
_pdbx_struct_oper_list.symmetry_operation ?
_pdbx_struct_oper_list.type               "identity operation"
_pdbx_struct_oper_list.vector[1]          0.0000000000
_pdbx_struct_oper_list.vector[2]          0.0000000000
_pdbx_struct_oper_list.vector[3]          0.0000000000
#
_refine.ls_d_res_high 1.84
#
_software.classification other
_software.name           "DeepMind Structure Class"
_software.pdbx_ordinal   1
_software.version        2.0.0
#
loop_
_struct_asym.entity_id
_struct_asym.id
1 M  
3 PA 
#
loop_
_struct_conn.conn_type_id
_struct_conn.id
_struct_conn.pdbx_ptnr1_PDB_ins_code
_struct_conn.pdbx_ptnr1_label_alt_id
_struct_conn.pdbx_ptnr2_PDB_ins_code
_struct_conn.pdbx_ptnr2_label_alt_id
_struct_conn.pdbx_role
_struct_conn.pdbx_value_order
_struct_conn.ptnr1_auth_asym_id
_struct_conn.ptnr1_auth_seq_id
_struct_conn.ptnr1_label_asym_id
_struct_conn.ptnr1_label_atom_id
_struct_conn.ptnr1_label_comp_id
_struct_conn.ptnr1_label_seq_id
_struct_conn.ptnr1_symmetry
_struct_conn.ptnr2_auth_asym_id
_struct_conn.ptnr2_auth_seq_id
_struct_conn.ptnr2_label_asym_id
_struct_conn.ptnr2_label_atom_id
_struct_conn.ptnr2_label_comp_id
_struct_conn.ptnr2_label_seq_id
_struct_conn.ptnr2_symmetry
metalc metalc1 ? ? ? ? ? ? M 27 M OE2 GLU 28 1_555 M 201 PA ZN ZN . 1_555 
metalc metalc2 ? ? ? ? ? ? M 62 M OE1 GLU 63 1_555 M 201 PA ZN ZN . 1_555 
metalc metalc3 ? ? ? ? ? ? M 65 M ND1 HIS 66 1_555 M 201 PA ZN ZN . 1_555 
#
_struct_conn_type.criteria  ?
_struct_conn_type.id        metalc
_struct_conn_type.reference ?
#
loop_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.occupancy
_atom_site.B_iso_or_equiv
_atom_site.auth_seq_id
_atom_site.auth_asym_id
_atom_site.pdbx_PDB_model_num
ATOM   1    N  N    . PRO M  1 6   ? 122.212 117.597 42.494 1.00 9.28  5   M 1 
ATOM   2    C  CA   . PRO M  1 6   ? 122.084 118.174 43.835 1.00 9.28  5   M 1 
ATOM   3    C  C    . PRO M  1 6   ? 120.908 117.581 44.601 1.00 9.28  5   M 1 
ATOM   4    O  O    . PRO M  1 6   ? 119.808 117.491 44.064 1.00 9.28  5   M 1 
ATOM   5    C  CB   . PRO M  1 6   ? 121.864 119.662 43.555 1.00 9.28  5   M 1 
ATOM   6    C  CG   . PRO M  1 6   ? 121.230 119.694 42.219 1.00 9.28  5   M 1 
ATOM   7    C  CD   . PRO M  1 6   ? 121.846 118.564 41.447 1.00 9.28  5   M 1 
ATOM   8    H  HA   . PRO M  1 6   ? 122.903 118.063 44.342 1.00 9.28  5   M 1 
ATOM   9    H  HB2  . PRO M  1 6   ? 121.285 120.040 44.235 1.00 9.28  5   M 1 
ATOM   10   H  HB3  . PRO M  1 6   ? 122.714 120.128 43.534 1.00 9.28  5   M 1 
ATOM   11   H  HG2  . PRO M  1 6   ? 120.274 119.558 42.308 1.00 9.28  5   M 1 
ATOM   12   H  HG3  . PRO M  1 6   ? 121.419 120.545 41.793 1.00 9.28  5   M 1 
ATOM   13   H  HD2  . PRO M  1 6   ? 121.199 118.179 40.836 1.00 9.28  5   M 1 
ATOM   14   H  HD3  . PRO M  1 6   ? 122.642 118.866 40.982 1.00 9.28  5   M 1 
ATOM   15   N  N    . SER M  1 7   ? 121.145 117.181 45.845 1.00 7.08  6   M 1 
ATOM   16   C  CA   . SER M  1 7   ? 120.080 116.612 46.653 1.00 7.08  6   M 1 
ATOM   17   C  C    . SER M  1 7   ? 119.029 117.671 46.964 1.00 7.08  6   M 1 
ATOM   18   O  O    . SER M  1 7   ? 119.342 118.844 47.176 1.00 7.08  6   M 1 
ATOM   19   C  CB   . SER M  1 7   ? 120.641 116.033 47.949 1.00 7.08  6   M 1 
ATOM   20   O  OG   . SER M  1 7   ? 119.605 115.511 48.745 1.00 7.08  6   M 1 
ATOM   21   H  H    . SER M  1 7   ? 121.906 117.238 46.241 1.00 7.08  6   M 1 
ATOM   22   H  HA   . SER M  1 7   ? 119.655 115.894 46.159 1.00 7.08  6   M 1 
ATOM   23   H  HB2  . SER M  1 7   ? 121.264 115.319 47.741 1.00 7.08  6   M 1 
ATOM   24   H  HB3  . SER M  1 7   ? 121.098 116.727 48.450 1.00 7.08  6   M 1 
ATOM   25   H  HG   . SER M  1 7   ? 119.939 115.148 49.425 1.00 7.08  6   M 1 
ATOM   26   N  N    . GLN M  1 8   ? 117.777 117.226 47.005 1.00 6.97  7   M 1 
ATOM   27   C  CA   . GLN M  1 8   ? 116.610 118.112 47.218 1.00 6.97  7   M 1 
ATOM   28   C  C    . GLN M  1 8   ? 116.732 118.800 48.583 1.00 6.97  7   M 1 
ATOM   29   O  O    . GLN M  1 8   ? 116.136 119.848 48.758 1.00 6.97  7   M 1 
ATOM   30   C  CB   . GLN M  1 8   ? 115.306 117.326 47.078 1.00 6.97  7   M 1 
ATOM   31   C  CG   . GLN M  1 8   ? 115.074 116.345 48.214 1.00 6.97  7   M 1 
ATOM   32   C  CD   . GLN M  1 8   ? 113.835 115.494 48.045 1.00 6.97  7   M 1 
ATOM   33   O  OE1  . GLN M  1 8   ? 112.862 115.903 47.422 1.00 6.97  7   M 1 
ATOM   34   N  NE2  . GLN M  1 8   ? 113.875 114.298 48.614 1.00 6.97  7   M 1 
ATOM   35   H  H    . GLN M  1 8   ? 117.574 116.339 47.027 1.00 6.97  7   M 1 
ATOM   36   H  HA   . GLN M  1 8   ? 116.628 118.808 46.520 1.00 6.97  7   M 1 
ATOM   37   H  HB2  . GLN M  1 8   ? 114.560 117.960 47.043 1.00 6.97  7   M 1 
ATOM   38   H  HB3  . GLN M  1 8   ? 115.326 116.836 46.229 1.00 6.97  7   M 1 
ATOM   39   H  HG2  . GLN M  1 8   ? 115.854 115.755 48.288 1.00 6.97  7   M 1 
ATOM   40   H  HG3  . GLN M  1 8   ? 115.001 116.846 49.054 1.00 6.97  7   M 1 
ATOM   41   H  HE21 . GLN M  1 8   ? 114.576 114.063 49.098 1.00 6.97  7   M 1 
ATOM   42   H  HE22 . GLN M  1 8   ? 113.201 113.736 48.510 1.00 6.97  7   M 1 
ATOM   43   N  N    . VAL M  1 9   ? 117.388 118.172 49.551 1.00 6.25  8   M 1 
ATOM   44   C  CA   . VAL M  1 9   ? 117.529 118.728 50.894 1.00 6.25  8   M 1 
ATOM   45   C  C    . VAL M  1 9   ? 118.772 119.591 51.047 1.00 6.25  8   M 1 
ATOM   46   O  O    . VAL M  1 9   ? 118.891 120.310 52.048 1.00 6.25  8   M 1 
ATOM   47   C  CB   . VAL M  1 9   ? 117.547 117.608 51.957 1.00 6.25  8   M 1 
ATOM   48   C  CG1  . VAL M  1 9   ? 116.257 116.809 51.898 1.00 6.25  8   M 1 
ATOM   49   C  CG2  . VAL M  1 9   ? 118.761 116.689 51.824 1.00 6.25  8   M 1 
ATOM   50   H  H    . VAL M  1 9   ? 117.757 117.402 49.445 1.00 6.25  8   M 1 
ATOM   51   H  HA   . VAL M  1 9   ? 116.763 119.289 51.092 1.00 6.25  8   M 1 
ATOM   52   H  HB   . VAL M  1 9   ? 117.602 118.020 52.833 1.00 6.25  8   M 1 
ATOM   53   H  HG11 . VAL M  1 9   ? 116.190 116.261 52.696 1.00 6.25  8   M 1 
ATOM   54   H  HG12 . VAL M  1 9   ? 115.507 117.422 51.853 1.00 6.25  8   M 1 
ATOM   55   H  HG13 . VAL M  1 9   ? 116.261 116.241 51.112 1.00 6.25  8   M 1 
ATOM   56   H  HG21 . VAL M  1 9   ? 118.720 116.025 52.530 1.00 6.25  8   M 1 
ATOM   57   H  HG22 . VAL M  1 9   ? 118.732 116.240 50.965 1.00 6.25  8   M 1 
ATOM   58   H  HG23 . VAL M  1 9   ? 119.588 117.186 51.922 1.00 6.25  8   M 1 
ATOM   59   N  N    . ARG M  1 10  ? 119.714 119.469 50.120 1.00 6.80  9   M 1 
ATOM   60   C  CA   . ARG M  1 10  ? 121.028 120.137 50.287 1.00 6.80  9   M 1 
ATOM   61   C  C    . ARG M  1 10  ? 120.873 121.657 50.283 1.00 6.80  9   M 1 
ATOM   62   O  O    . ARG M  1 10  ? 120.265 122.177 49.352 1.00 6.80  9   M 1 
ATOM   63   C  CB   . ARG M  1 10  ? 122.014 119.698 49.205 1.00 6.80  9   M 1 
ATOM   64   C  CG   . ARG M  1 10  ? 123.450 120.070 49.528 1.00 6.80  9   M 1 
ATOM   65   C  CD   . ARG M  1 10  ? 124.419 119.495 48.512 1.00 6.80  9   M 1 
ATOM   66   N  NE   . ARG M  1 10  ? 125.813 119.611 48.924 1.00 6.80  9   M 1 
ATOM   67   C  CZ   . ARG M  1 10  ? 126.705 118.641 48.816 1.00 6.80  9   M 1 
ATOM   68   N  NH1  . ARG M  1 10  ? 126.346 117.466 48.336 1.00 6.80  9   M 1 
ATOM   69   N  NH2  . ARG M  1 10  ? 127.944 118.830 49.223 1.00 6.80  9   M 1 
ATOM   70   H  H    . ARG M  1 10  ? 119.572 119.093 49.304 1.00 6.80  9   M 1 
ATOM   71   H  HA   . ARG M  1 10  ? 121.392 119.870 51.162 1.00 6.80  9   M 1 
ATOM   72   H  HB2  . ARG M  1 10  ? 121.952 118.726 49.097 1.00 6.80  9   M 1 
ATOM   73   H  HB3  . ARG M  1 10  ? 121.758 120.115 48.356 1.00 6.80  9   M 1 
ATOM   74   H  HG2  . ARG M  1 10  ? 123.539 121.047 49.539 1.00 6.80  9   M 1 
ATOM   75   H  HG3  . ARG M  1 10  ? 123.681 119.732 50.419 1.00 6.80  9   M 1 
ATOM   76   H  HD2  . ARG M  1 10  ? 124.207 118.548 48.368 1.00 6.80  9   M 1 
ATOM   77   H  HD3  . ARG M  1 10  ? 124.299 119.960 47.657 1.00 6.80  9   M 1 
ATOM   78   H  HE   . ARG M  1 10  ? 126.081 120.373 49.252 1.00 6.80  9   M 1 
ATOM   79   H  HH11 . ARG M  1 10  ? 125.518 117.337 48.069 1.00 6.80  9   M 1 
ATOM   80   H  HH12 . ARG M  1 10  ? 126.939 116.820 48.270 1.00 6.80  9   M 1 
ATOM   81   H  HH21 . ARG M  1 10  ? 128.184 119.612 49.550 1.00 6.80  9   M 1 
ATOM   82   H  HH22 . ARG M  1 10  ? 128.532 118.178 49.155 1.00 6.80  9   M 1 
ATOM   83   N  N    . GLN M  1 11  ? 121.516 122.324 51.239 1.00 6.12  10  M 1 
ATOM   84   C  CA   . GLN M  1 11  ? 121.478 123.774 51.352 1.00 6.12  10  M 1 
ATOM   85   C  C    . GLN M  1 11  ? 122.621 124.235 52.245 1.00 6.12  10  M 1 
ATOM   86   O  O    . GLN M  1 11  ? 122.708 123.833 53.406 1.00 6.12  10  M 1 
ATOM   87   C  CB   . GLN M  1 11  ? 120.137 124.237 51.920 1.00 6.12  10  M 1 
ATOM   88   C  CG   . GLN M  1 11  ? 119.911 125.721 51.902 1.00 6.12  10  M 1 
ATOM   89   C  CD   . GLN M  1 11  ? 118.537 126.076 52.435 1.00 6.12  10  M 1 
ATOM   90   O  OE1  . GLN M  1 11  ? 117.830 125.223 52.962 1.00 6.12  10  M 1 
ATOM   91   N  NE2  . GLN M  1 11  ? 118.126 127.312 52.236 1.00 6.12  10  M 1 
ATOM   92   H  H    . GLN M  1 11  ? 121.988 121.938 51.846 1.00 6.12  10  M 1 
ATOM   93   H  HA   . GLN M  1 11  ? 121.591 124.163 50.470 1.00 6.12  10  M 1 
ATOM   94   H  HB2  . GLN M  1 11  ? 119.423 123.835 51.401 1.00 6.12  10  M 1 
ATOM   95   H  HB3  . GLN M  1 11  ? 120.071 123.946 52.843 1.00 6.12  10  M 1 
ATOM   96   H  HG2  . GLN M  1 11  ? 120.572 126.146 52.470 1.00 6.12  10  M 1 
ATOM   97   H  HG3  . GLN M  1 11  ? 119.997 126.048 50.993 1.00 6.12  10  M 1 
ATOM   98   H  HE21 . GLN M  1 11  ? 118.637 127.884 51.847 1.00 6.12  10  M 1 
ATOM   99   H  HE22 . GLN M  1 11  ? 117.347 127.547 52.514 1.00 6.12  10  M 1 
ATOM   100  N  N    . ASN M  1 12  ? 123.445 125.121 51.688 1.00 6.65  11  M 1 
ATOM   101  C  CA   . ASN M  1 12  ? 124.619 125.702 52.391 1.00 6.65  11  M 1 
ATOM   102  C  C    . ASN M  1 12  ? 125.569 124.588 52.872 1.00 6.65  11  M 1 
ATOM   103  O  O    . ASN M  1 12  ? 126.059 124.697 53.982 1.00 6.65  11  M 1 
ATOM   104  C  CB   . ASN M  1 12  ? 124.137 126.571 53.556 1.00 6.65  11  M 1 
ATOM   105  C  CG   . ASN M  1 12  ? 125.258 127.385 54.163 1.00 6.65  11  M 1 
ATOM   106  O  OD1  . ASN M  1 12  ? 126.071 127.935 53.440 1.00 6.65  11  M 1 
ATOM   107  N  ND2  . ASN M  1 12  ? 125.302 127.463 55.473 1.00 6.65  11  M 1 
ATOM   108  H  H    . ASN M  1 12  ? 123.269 125.513 50.886 1.00 6.65  11  M 1 
ATOM   109  H  HA   . ASN M  1 12  ? 125.105 126.283 51.760 1.00 6.65  11  M 1 
ATOM   110  H  HB2  . ASN M  1 12  ? 123.438 127.176 53.235 1.00 6.65  11  M 1 
ATOM   111  H  HB3  . ASN M  1 12  ? 123.749 125.994 54.246 1.00 6.65  11  M 1 
ATOM   112  H  HD21 . ASN M  1 12  ? 124.657 127.104 55.959 1.00 6.65  11  M 1 
ATOM   113  H  HD22 . ASN M  1 12  ? 125.976 127.875 55.869 1.00 6.65  11  M 1 
ATOM   114  N  N    . TYR M  1 13  ? 125.844 123.567 52.055 1.00 5.90  12  M 1 
ATOM   115  C  CA   . TYR M  1 13  ? 126.657 122.414 52.440 1.00 5.90  12  M 1 
ATOM   116  C  C    . TYR M  1 13  ? 127.687 122.174 51.341 1.00 5.90  12  M 1 
ATOM   117  O  O    . TYR M  1 13  ? 127.385 121.578 50.305 1.00 5.90  12  M 1 
ATOM   118  C  CB   . TYR M  1 13  ? 125.780 121.196 52.694 1.00 5.90  12  M 1 
ATOM   119  C  CG   . TYR M  1 13  ? 126.505 120.044 53.350 1.00 5.90  12  M 1 
ATOM   120  C  CD1  . TYR M  1 13  ? 126.937 120.148 54.661 1.00 5.90  12  M 1 
ATOM   121  C  CD2  . TYR M  1 13  ? 126.681 118.836 52.705 1.00 5.90  12  M 1 
ATOM   122  C  CE1  . TYR M  1 13  ? 127.578 119.120 55.287 1.00 5.90  12  M 1 
ATOM   123  C  CE2  . TYR M  1 13  ? 127.319 117.786 53.335 1.00 5.90  12  M 1 
ATOM   124  C  CZ   . TYR M  1 13  ? 127.766 117.935 54.631 1.00 5.90  12  M 1 
ATOM   125  O  OH   . TYR M  1 13  ? 128.404 116.916 55.298 1.00 5.90  12  M 1 
ATOM   126  H  H    . TYR M  1 13  ? 125.574 123.542 51.239 1.00 5.90  12  M 1 
ATOM   127  H  HA   . TYR M  1 13  ? 127.152 122.600 53.253 1.00 5.90  12  M 1 
ATOM   128  H  HB2  . TYR M  1 13  ? 125.041 121.450 53.268 1.00 5.90  12  M 1 
ATOM   129  H  HB3  . TYR M  1 13  ? 125.430 120.884 51.845 1.00 5.90  12  M 1 
ATOM   130  H  HD1  . TYR M  1 13  ? 126.822 120.949 55.119 1.00 5.90  12  M 1 
ATOM   131  H  HD2  . TYR M  1 13  ? 126.385 118.735 51.829 1.00 5.90  12  M 1 
ATOM   132  H  HE1  . TYR M  1 13  ? 127.875 119.221 56.163 1.00 5.90  12  M 1 
ATOM   133  H  HE2  . TYR M  1 13  ? 127.445 116.981 52.887 1.00 5.90  12  M 1 
ATOM   134  H  HH   . TYR M  1 13  ? 128.383 116.208 54.846 1.00 5.90  12  M 1 
ATOM   135  N  N    . HIS M  1 14  ? 128.905 122.635 51.599 1.00 7.28  13  M 1 
ATOM   136  C  CA   . HIS M  1 14  ? 129.958 122.673 50.597 1.00 7.28  13  M 1 
ATOM   137  C  C    . HIS M  1 14  ? 130.572 121.284 50.442 1.00 7.28  13  M 1 
ATOM   138  O  O    . HIS M  1 14  ? 130.617 120.503 51.393 1.00 7.28  13  M 1 
ATOM   139  C  CB   . HIS M  1 14  ? 131.006 123.701 51.029 1.00 7.28  13  M 1 
ATOM   140  C  CG   . HIS M  1 14  ? 131.952 124.116 49.949 1.00 7.28  13  M 1 
ATOM   141  N  ND1  . HIS M  1 14  ? 133.111 123.432 49.663 1.00 7.28  13  M 1 
ATOM   142  C  CD2  . HIS M  1 14  ? 131.927 125.178 49.112 1.00 7.28  13  M 1 
ATOM   143  C  CE1  . HIS M  1 14  ? 133.748 124.039 48.678 1.00 7.28  13  M 1 
ATOM   144  N  NE2  . HIS M  1 14  ? 133.051 125.103 48.327 1.00 7.28  13  M 1 
ATOM   145  H  H    . HIS M  1 14  ? 129.149 122.936 52.367 1.00 7.28  13  M 1 
ATOM   146  H  HA   . HIS M  1 14  ? 129.593 122.954 49.743 1.00 7.28  13  M 1 
ATOM   147  H  HB2  . HIS M  1 14  ? 130.552 124.500 51.338 1.00 7.28  13  M 1 
ATOM   148  H  HB3  . HIS M  1 14  ? 131.532 123.326 51.753 1.00 7.28  13  M 1 
ATOM   149  H  HD2  . HIS M  1 14  ? 131.267 125.832 49.071 1.00 7.28  13  M 1 
ATOM   150  H  HE1  . HIS M  1 14  ? 134.552 123.767 48.298 1.00 7.28  13  M 1 
ATOM   151  H  HE2  . HIS M  1 14  ? 133.267 125.657 47.706 1.00 7.28  13  M 1 
ATOM   152  N  N    . GLN M  1 15  ? 131.037 120.970 49.229 1.00 7.51  14  M 1 
ATOM   153  C  CA   . GLN M  1 15  ? 131.561 119.634 48.946 1.00 7.51  14  M 1 
ATOM   154  C  C    . GLN M  1 15  ? 132.800 119.311 49.780 1.00 7.51  14  M 1 
ATOM   155  O  O    . GLN M  1 15  ? 133.039 118.148 50.120 1.00 7.51  14  M 1 
ATOM   156  C  CB   . GLN M  1 15  ? 131.867 119.500 47.450 1.00 7.51  14  M 1 
ATOM   157  C  CG   . GLN M  1 15  ? 132.933 120.431 46.917 1.00 7.51  14  M 1 
ATOM   158  C  CD   . GLN M  1 15  ? 133.162 120.248 45.425 1.00 7.51  14  M 1 
ATOM   159  O  OE1  . GLN M  1 15  ? 132.551 119.386 44.791 1.00 7.51  14  M 1 
ATOM   160  N  NE2  . GLN M  1 15  ? 134.052 121.052 44.861 1.00 7.51  14  M 1 
ATOM   161  H  H    . GLN M  1 15  ? 131.058 121.511 48.561 1.00 7.51  14  M 1 
ATOM   162  H  HA   . GLN M  1 15  ? 130.879 118.977 49.157 1.00 7.51  14  M 1 
ATOM   163  H  HB2  . GLN M  1 15  ? 132.164 118.595 47.269 1.00 7.51  14  M 1 
ATOM   164  H  HB3  . GLN M  1 15  ? 131.057 119.680 46.948 1.00 7.51  14  M 1 
ATOM   165  H  HG2  . GLN M  1 15  ? 132.652 121.347 47.070 1.00 7.51  14  M 1 
ATOM   166  H  HG3  . GLN M  1 15  ? 133.774 120.264 47.370 1.00 7.51  14  M 1 
ATOM   167  H  HE21 . GLN M  1 15  ? 134.462 121.642 45.333 1.00 7.51  14  M 1 
ATOM   168  H  HE22 . GLN M  1 15  ? 134.218 120.981 44.020 1.00 7.51  14  M 1 
ATOM   169  N  N    . ASP M  1 16  ? 133.599 120.324 50.111 1.00 7.21  15  M 1 
ATOM   170  C  CA   . ASP M  1 16  ? 134.771 120.116 50.956 1.00 7.21  15  M 1 
ATOM   171  C  C    . ASP M  1 16  ? 134.371 119.680 52.361 1.00 7.21  15  M 1 
ATOM   172  O  O    . ASP M  1 16  ? 135.026 118.818 52.953 1.00 7.21  15  M 1 
ATOM   173  C  CB   . ASP M  1 16  ? 135.610 121.393 51.009 1.00 7.21  15  M 1 
ATOM   174  C  CG   . ASP M  1 16  ? 136.321 121.680 49.696 1.00 7.21  15  M 1 
ATOM   175  O  OD1  . ASP M  1 16  ? 136.404 120.772 48.845 1.00 7.21  15  M 1 
ATOM   176  O  OD2  . ASP M  1 16  ? 136.805 122.815 49.519 1.00 7.21  15  M 1 
ATOM   177  H  H    . ASP M  1 16  ? 133.476 121.137 49.858 1.00 7.21  15  M 1 
ATOM   178  H  HA   . ASP M  1 16  ? 135.320 119.415 50.571 1.00 7.21  15  M 1 
ATOM   179  H  HB2  . ASP M  1 16  ? 135.034 122.148 51.207 1.00 7.21  15  M 1 
ATOM   180  H  HB3  . ASP M  1 16  ? 136.282 121.306 51.703 1.00 7.21  15  M 1 
ATOM   181  N  N    . ALA M  1 17  ? 133.297 120.259 52.899 1.00 6.09  16  M 1 
ATOM   182  C  CA   . ALA M  1 17  ? 132.760 119.819 54.182 1.00 6.09  16  M 1 
ATOM   183  C  C    . ALA M  1 17  ? 132.287 118.373 54.109 1.00 6.09  16  M 1 
ATOM   184  O  O    . ALA M  1 17  ? 132.504 117.591 55.040 1.00 6.09  16  M 1 
ATOM   185  C  CB   . ALA M  1 17  ? 131.615 120.738 54.603 1.00 6.09  16  M 1 
ATOM   186  H  H    . ALA M  1 17  ? 132.865 120.907 52.533 1.00 6.09  16  M 1 
ATOM   187  H  HA   . ALA M  1 17  ? 133.452 119.884 54.859 1.00 6.09  16  M 1 
ATOM   188  H  HB1  . ALA M  1 17  ? 131.308 120.487 55.488 1.00 6.09  16  M 1 
ATOM   189  H  HB2  . ALA M  1 17  ? 131.935 121.654 54.614 1.00 6.09  16  M 1 
ATOM   190  H  HB3  . ALA M  1 17  ? 130.887 120.656 53.967 1.00 6.09  16  M 1 
ATOM   191  N  N    . GLU M  1 18  ? 131.621 118.014 53.012 1.00 5.83  17  M 1 
ATOM   192  C  CA   . GLU M  1 18  ? 131.183 116.639 52.793 1.00 5.83  17  M 1 
ATOM   193  C  C    . GLU M  1 18  ? 132.369 115.677 52.836 1.00 5.83  17  M 1 
ATOM   194  O  O    . GLU M  1 18  ? 132.351 114.658 53.547 1.00 5.83  17  M 1 
ATOM   195  C  CB   . GLU M  1 18  ? 130.451 116.566 51.447 1.00 5.83  17  M 1 
ATOM   196  C  CG   . GLU M  1 18  ? 129.838 115.239 51.109 1.00 5.83  17  M 1 
ATOM   197  C  CD   . GLU M  1 18  ? 129.069 115.276 49.797 1.00 5.83  17  M 1 
ATOM   198  O  OE1  . GLU M  1 18  ? 129.047 116.341 49.148 1.00 5.83  17  M 1 
ATOM   199  O  OE2  . GLU M  1 18  ? 128.489 114.242 49.415 1.00 5.83  17  M 1 
ATOM   200  H  H    . GLU M  1 18  ? 131.409 118.555 52.378 1.00 5.83  17  M 1 
ATOM   201  H  HA   . GLU M  1 18  ? 130.552 116.395 53.488 1.00 5.83  17  M 1 
ATOM   202  H  HB2  . GLU M  1 18  ? 129.737 117.223 51.446 1.00 5.83  17  M 1 
ATOM   203  H  HB3  . GLU M  1 18  ? 131.070 116.780 50.732 1.00 5.83  17  M 1 
ATOM   204  H  HG2  . GLU M  1 18  ? 130.539 114.574 51.031 1.00 5.83  17  M 1 
ATOM   205  H  HG3  . GLU M  1 18  ? 129.220 114.990 51.814 1.00 5.83  17  M 1 
ATOM   206  N  N    . ALA M  1 19  ? 133.426 116.014 52.101 1.00 5.64  18  M 1 
ATOM   207  C  CA   . ALA M  1 19  ? 134.627 115.186 52.077 1.00 5.64  18  M 1 
ATOM   208  C  C    . ALA M  1 19  ? 135.261 115.089 53.461 1.00 5.64  18  M 1 
ATOM   209  O  O    . ALA M  1 19  ? 135.695 114.008 53.887 1.00 5.64  18  M 1 
ATOM   210  C  CB   . ALA M  1 19  ? 135.619 115.756 51.068 1.00 5.64  18  M 1 
ATOM   211  H  H    . ALA M  1 19  ? 133.469 116.730 51.627 1.00 5.64  18  M 1 
ATOM   212  H  HA   . ALA M  1 19  ? 134.387 114.294 51.780 1.00 5.64  18  M 1 
ATOM   213  H  HB1  . ALA M  1 19  ? 136.445 115.249 51.108 1.00 5.64  18  M 1 
ATOM   214  H  HB2  . ALA M  1 19  ? 135.231 115.688 50.181 1.00 5.64  18  M 1 
ATOM   215  H  HB3  . ALA M  1 19  ? 135.792 116.686 51.281 1.00 5.64  18  M 1 
ATOM   216  N  N    . ALA M  1 20  ? 135.309 116.209 54.182 1.00 5.19  19  M 1 
ATOM   217  C  CA   . ALA M  1 20  ? 135.912 116.226 55.509 1.00 5.19  19  M 1 
ATOM   218  C  C    . ALA M  1 20  ? 135.118 115.366 56.484 1.00 5.19  19  M 1 
ATOM   219  O  O    . ALA M  1 20  ? 135.694 114.687 57.340 1.00 5.19  19  M 1 
ATOM   220  C  CB   . ALA M  1 20  ? 136.010 117.663 56.015 1.00 5.19  19  M 1 
ATOM   221  H  H    . ALA M  1 20  ? 134.988 116.964 53.924 1.00 5.19  19  M 1 
ATOM   222  H  HA   . ALA M  1 20  ? 136.813 115.873 55.449 1.00 5.19  19  M 1 
ATOM   223  H  HB1  . ALA M  1 20  ? 136.318 117.661 56.935 1.00 5.19  19  M 1 
ATOM   224  H  HB2  . ALA M  1 20  ? 136.643 118.153 55.468 1.00 5.19  19  M 1 
ATOM   225  H  HB3  . ALA M  1 20  ? 135.136 118.080 55.963 1.00 5.19  19  M 1 
ATOM   226  N  N    . ILE M  1 21  ? 133.794 115.373 56.355 1.00 4.65  20  M 1 
ATOM   227  C  CA   . ILE M  1 21  ? 132.950 114.537 57.205 1.00 4.65  20  M 1 
ATOM   228  C  C    . ILE M  1 21  ? 133.187 113.062 56.918 1.00 4.65  20  M 1 
ATOM   229  O  O    . ILE M  1 21  ? 133.212 112.237 57.837 1.00 4.65  20  M 1 
ATOM   230  C  CB   . ILE M  1 21  ? 131.466 114.924 57.036 1.00 4.65  20  M 1 
ATOM   231  C  CG1  . ILE M  1 21  ? 131.165 116.301 57.642 1.00 4.65  20  M 1 
ATOM   232  C  CG2  . ILE M  1 21  ? 130.563 113.897 57.679 1.00 4.65  20  M 1 
ATOM   233  C  CD1  . ILE M  1 21  ? 131.182 116.337 59.164 1.00 4.65  20  M 1 
ATOM   234  H  H    . ILE M  1 21  ? 133.365 115.839 55.774 1.00 4.65  20  M 1 
ATOM   235  H  HA   . ILE M  1 21  ? 133.213 114.693 58.125 1.00 4.65  20  M 1 
ATOM   236  H  HB   . ILE M  1 21  ? 131.263 114.954 56.088 1.00 4.65  20  M 1 
ATOM   237  H  HG12 . ILE M  1 21  ? 131.845 116.927 57.348 1.00 4.65  20  M 1 
ATOM   238  H  HG13 . ILE M  1 21  ? 130.297 116.611 57.340 1.00 4.65  20  M 1 
ATOM   239  H  HG21 . ILE M  1 21  ? 129.700 114.308 57.842 1.00 4.65  20  M 1 
ATOM   240  H  HG22 . ILE M  1 21  ? 130.447 113.140 57.083 1.00 4.65  20  M 1 
ATOM   241  H  HG23 . ILE M  1 21  ? 130.944 113.601 58.521 1.00 4.65  20  M 1 
ATOM   242  H  HD11 . ILE M  1 21  ? 131.445 117.226 59.450 1.00 4.65  20  M 1 
ATOM   243  H  HD12 . ILE M  1 21  ? 130.292 116.138 59.495 1.00 4.65  20  M 1 
ATOM   244  H  HD13 . ILE M  1 21  ? 131.804 115.688 59.529 1.00 4.65  20  M 1 
ATOM   245  N  N    . ASN M  1 22  ? 133.341 112.698 55.646 1.00 4.76  21  M 1 
ATOM   246  C  CA   . ASN M  1 22  ? 133.649 111.301 55.339 1.00 4.76  21  M 1 
ATOM   247  C  C    . ASN M  1 22  ? 134.999 110.889 55.925 1.00 4.76  21  M 1 
ATOM   248  O  O    . ASN M  1 22  ? 135.141 109.784 56.475 1.00 4.76  21  M 1 
ATOM   249  C  CB   . ASN M  1 22  ? 133.598 111.055 53.832 1.00 4.76  21  M 1 
ATOM   250  C  CG   . ASN M  1 22  ? 132.178 111.044 53.293 1.00 4.76  21  M 1 
ATOM   251  O  OD1  . ASN M  1 22  ? 131.264 110.549 53.941 1.00 4.76  21  M 1 
ATOM   252  N  ND2  . ASN M  1 22  ? 132.000 111.547 52.086 1.00 4.76  21  M 1 
ATOM   253  H  H    . ASN M  1 22  ? 133.277 113.220 54.965 1.00 4.76  21  M 1 
ATOM   254  H  HA   . ASN M  1 22  ? 132.976 110.740 55.755 1.00 4.76  21  M 1 
ATOM   255  H  HB2  . ASN M  1 22  ? 134.078 111.762 53.373 1.00 4.76  21  M 1 
ATOM   256  H  HB3  . ASN M  1 22  ? 134.006 110.200 53.626 1.00 4.76  21  M 1 
ATOM   257  H  HD21 . ASN M  1 22  ? 132.665 111.877 51.652 1.00 4.76  21  M 1 
ATOM   258  H  HD22 . ASN M  1 22  ? 131.214 111.556 51.737 1.00 4.76  21  M 1 
ATOM   259  N  N    . ARG M  1 23  ? 135.968 111.799 55.858 1.00 5.20  22  M 1 
ATOM   260  C  CA   . ARG M  1 23  ? 137.304 111.552 56.459 1.00 5.20  22  M 1 
ATOM   261  C  C    . ARG M  1 23  ? 137.134 111.402 57.973 1.00 5.20  22  M 1 
ATOM   262  O  O    . ARG M  1 23  ? 137.736 110.506 58.538 1.00 5.20  22  M 1 
ATOM   263  C  CB   . ARG M  1 23  ? 138.287 112.670 56.112 1.00 5.20  22  M 1 
ATOM   264  C  CG   . ARG M  1 23  ? 138.602 112.743 54.626 1.00 5.20  22  M 1 
ATOM   265  C  CD   . ARG M  1 23  ? 139.855 113.564 54.401 1.00 5.20  22  M 1 
ATOM   266  N  NE   . ARG M  1 23  ? 139.739 114.892 54.977 1.00 5.20  22  M 1 
ATOM   267  C  CZ   . ARG M  1 23  ? 139.293 115.956 54.319 1.00 5.20  22  M 1 
ATOM   268  N  NH1  . ARG M  1 23  ? 138.919 115.844 53.060 1.00 5.20  22  M 1 
ATOM   269  N  NH2  . ARG M  1 23  ? 139.230 117.132 54.915 1.00 5.20  22  M 1 
ATOM   270  H  H    . ARG M  1 23  ? 135.834 112.649 55.562 1.00 5.20  22  M 1 
ATOM   271  H  HA   . ARG M  1 23  ? 137.651 110.704 56.097 1.00 5.20  22  M 1 
ATOM   272  H  HB2  . ARG M  1 23  ? 137.907 113.526 56.400 1.00 5.20  22  M 1 
ATOM   273  H  HB3  . ARG M  1 23  ? 139.120 112.524 56.609 1.00 5.20  22  M 1 
ATOM   274  H  HG2  . ARG M  1 23  ? 138.737 111.838 54.272 1.00 5.20  22  M 1 
ATOM   275  H  HG3  . ARG M  1 23  ? 137.852 113.155 54.148 1.00 5.20  22  M 1 
ATOM   276  H  HD2  . ARG M  1 23  ? 140.622 113.103 54.803 1.00 5.20  22  M 1 
ATOM   277  H  HD3  . ARG M  1 23  ? 140.021 113.643 53.437 1.00 5.20  22  M 1 
ATOM   278  H  HE   . ARG M  1 23  ? 139.984 115.002 55.807 1.00 5.20  22  M 1 
ATOM   279  H  HH11 . ARG M  1 23  ? 138.963 115.063 52.658 1.00 5.20  22  M 1 
ATOM   280  H  HH12 . ARG M  1 23  ? 138.624 116.549 52.626 1.00 5.20  22  M 1 
ATOM   281  H  HH21 . ARG M  1 23  ? 139.480 117.211 55.756 1.00 5.20  22  M 1 
ATOM   282  H  HH22 . ARG M  1 23  ? 138.932 117.833 54.473 1.00 5.20  22  M 1 
ATOM   283  N  N    . GLN M  1 24  ? 136.303 112.230 58.589 1.00 4.27  23  M 1 
ATOM   284  C  CA   . GLN M  1 24  ? 136.057 112.163 60.050 1.00 4.27  23  M 1 
ATOM   285  C  C    . GLN M  1 24  ? 135.381 110.826 60.366 1.00 4.27  23  M 1 
ATOM   286  O  O    . GLN M  1 24  ? 135.792 110.182 61.304 1.00 4.27  23  M 1 
ATOM   287  C  CB   . GLN M  1 24  ? 135.231 113.334 60.583 1.00 4.27  23  M 1 
ATOM   288  C  CG   . GLN M  1 24  ? 135.188 113.347 62.108 1.00 4.27  23  M 1 
ATOM   289  C  CD   . GLN M  1 24  ? 136.537 113.649 62.722 1.00 4.27  23  M 1 
ATOM   290  O  OE1  . GLN M  1 24  ? 137.398 114.230 62.085 1.00 4.27  23  M 1 
ATOM   291  N  NE2  . GLN M  1 24  ? 136.731 113.278 63.973 1.00 4.27  23  M 1 
ATOM   292  H  H    . GLN M  1 24  ? 135.752 112.801 58.143 1.00 4.27  23  M 1 
ATOM   293  H  HA   . GLN M  1 24  ? 136.933 112.175 60.501 1.00 4.27  23  M 1 
ATOM   294  H  HB2  . GLN M  1 24  ? 135.623 114.172 60.260 1.00 4.27  23  M 1 
ATOM   295  H  HB3  . GLN M  1 24  ? 134.319 113.266 60.231 1.00 4.27  23  M 1 
ATOM   296  H  HG2  . GLN M  1 24  ? 134.542 114.023 62.406 1.00 4.27  23  M 1 
ATOM   297  H  HG3  . GLN M  1 24  ? 134.878 112.473 62.429 1.00 4.27  23  M 1 
ATOM   298  H  HE21 . GLN M  1 24  ? 136.087 112.865 64.417 1.00 4.27  23  M 1 
ATOM   299  H  HE22 . GLN M  1 24  ? 137.504 113.442 64.368 1.00 4.27  23  M 1 
ATOM   300  N  N    . ILE M  1 25  ? 134.455 110.366 59.533 1.00 4.04  24  M 1 
ATOM   301  C  CA   . ILE M  1 25  ? 133.757 109.072 59.780 1.00 4.04  24  M 1 
ATOM   302  C  C    . ILE M  1 25  ? 134.814 107.969 59.775 1.00 4.04  24  M 1 
ATOM   303  O  O    . ILE M  1 25  ? 134.825 107.162 60.686 1.00 4.04  24  M 1 
ATOM   304  C  CB   . ILE M  1 25  ? 132.669 108.811 58.722 1.00 4.04  24  M 1 
ATOM   305  C  CG1  . ILE M  1 25  ? 131.463 109.726 58.927 1.00 4.04  24  M 1 
ATOM   306  C  CG2  . ILE M  1 25  ? 132.268 107.346 58.704 1.00 4.04  24  M 1 
ATOM   307  C  CD1  . ILE M  1 25  ? 130.542 109.790 57.732 1.00 4.04  24  M 1 
ATOM   308  H  H    . ILE M  1 25  ? 134.294 110.730 58.714 1.00 4.04  24  M 1 
ATOM   309  H  HA   . ILE M  1 25  ? 133.339 109.104 60.659 1.00 4.04  24  M 1 
ATOM   310  H  HB   . ILE M  1 25  ? 133.057 109.027 57.838 1.00 4.04  24  M 1 
ATOM   311  H  HG12 . ILE M  1 25  ? 130.953 109.407 59.703 1.00 4.04  24  M 1 
ATOM   312  H  HG13 . ILE M  1 25  ? 131.783 110.631 59.129 1.00 4.04  24  M 1 
ATOM   313  H  HG21 . ILE M  1 25  ? 131.520 107.219 58.094 1.00 4.04  24  M 1 
ATOM   314  H  HG22 . ILE M  1 25  ? 133.020 106.805 58.408 1.00 4.04  24  M 1 
ATOM   315  H  HG23 . ILE M  1 25  ? 132.004 107.068 59.598 1.00 4.04  24  M 1 
ATOM   316  H  HD11 . ILE M  1 25  ? 129.788 110.372 57.933 1.00 4.04  24  M 1 
ATOM   317  H  HD12 . ILE M  1 25  ? 131.027 110.141 56.966 1.00 4.04  24  M 1 
ATOM   318  H  HD13 . ILE M  1 25  ? 130.213 108.898 57.525 1.00 4.04  24  M 1 
ATOM   319  N  N    . ASN M  1 26  ? 135.739 107.997 58.831 1.00 4.23  25  M 1 
ATOM   320  C  CA   . ASN M  1 26  ? 136.770 106.935 58.766 1.00 4.23  25  M 1 
ATOM   321  C  C    . ASN M  1 26  ? 137.629 107.000 60.033 1.00 4.23  25  M 1 
ATOM   322  O  O    . ASN M  1 26  ? 137.870 105.966 60.618 1.00 4.23  25  M 1 
ATOM   323  C  CB   . ASN M  1 26  ? 137.632 107.025 57.513 1.00 4.23  25  M 1 
ATOM   324  C  CG   . ASN M  1 26  ? 138.457 105.768 57.372 1.00 4.23  25  M 1 
ATOM   325  O  OD1  . ASN M  1 26  ? 139.615 105.766 57.731 1.00 4.23  25  M 1 
ATOM   326  N  ND2  . ASN M  1 26  ? 137.836 104.688 56.940 1.00 4.23  25  M 1 
ATOM   327  H  H    . ASN M  1 26  ? 135.874 108.705 58.276 1.00 4.23  25  M 1 
ATOM   328  H  HA   . ASN M  1 26  ? 136.310 106.063 58.747 1.00 4.23  25  M 1 
ATOM   329  H  HB2  . ASN M  1 26  ? 137.058 107.133 56.728 1.00 4.23  25  M 1 
ATOM   330  H  HB3  . ASN M  1 26  ? 138.224 107.802 57.579 1.00 4.23  25  M 1 
ATOM   331  H  HD21 . ASN M  1 26  ? 136.953 104.669 56.909 1.00 4.23  25  M 1 
ATOM   332  H  HD22 . ASN M  1 26  ? 138.302 103.982 56.685 1.00 4.23  25  M 1 
ATOM   333  N  N    . LEU M  1 27  ? 137.977 108.199 60.481 1.00 4.02  26  M 1 
ATOM   334  C  CA   . LEU M  1 27  ? 138.840 108.382 61.679 1.00 4.02  26  M 1 
ATOM   335  C  C    . LEU M  1 27  ? 138.126 107.816 62.917 1.00 4.02  26  M 1 
ATOM   336  O  O    . LEU M  1 27  ? 138.760 107.121 63.684 1.00 4.02  26  M 1 
ATOM   337  C  CB   . LEU M  1 27  ? 139.149 109.873 61.835 1.00 4.02  26  M 1 
ATOM   338  C  CG   . LEU M  1 27  ? 140.085 110.228 62.989 1.00 4.02  26  M 1 
ATOM   339  C  CD1  . LEU M  1 27  ? 141.294 109.307 63.013 1.00 4.02  26  M 1 
ATOM   340  C  CD2  . LEU M  1 27  ? 140.521 111.687 62.919 1.00 4.02  26  M 1 
ATOM   341  H  H    . LEU M  1 27  ? 137.610 108.970 60.164 1.00 4.02  26  M 1 
ATOM   342  H  HA   . LEU M  1 27  ? 139.678 107.884 61.539 1.00 4.02  26  M 1 
ATOM   343  H  HB2  . LEU M  1 27  ? 139.548 110.193 61.001 1.00 4.02  26  M 1 
ATOM   344  H  HB3  . LEU M  1 27  ? 138.305 110.351 61.961 1.00 4.02  26  M 1 
ATOM   345  H  HG   . LEU M  1 27  ? 139.588 110.099 63.834 1.00 4.02  26  M 1 
ATOM   346  H  HD11 . LEU M  1 27  ? 141.901 109.586 63.720 1.00 4.02  26  M 1 
ATOM   347  H  HD12 . LEU M  1 27  ? 141.003 108.393 63.178 1.00 4.02  26  M 1 
ATOM   348  H  HD13 . LEU M  1 27  ? 141.753 109.351 62.156 1.00 4.02  26  M 1 
ATOM   349  H  HD21 . LEU M  1 27  ? 141.103 111.888 63.672 1.00 4.02  26  M 1 
ATOM   350  H  HD22 . LEU M  1 27  ? 141.001 111.843 62.087 1.00 4.02  26  M 1 
ATOM   351  H  HD23 . LEU M  1 27  ? 139.737 112.262 62.953 1.00 4.02  26  M 1 
ATOM   352  N  N    . GLU M  1 28  ? 136.831 108.071 63.062 1.00 4.01  27  M 1 
ATOM   353  C  CA   . GLU M  1 28  ? 136.023 107.567 64.213 1.00 4.01  27  M 1 
ATOM   354  C  C    . GLU M  1 28  ? 135.968 106.029 64.180 1.00 4.01  27  M 1 
ATOM   355  O  O    . GLU M  1 28  ? 136.192 105.431 65.200 1.00 4.01  27  M 1 
ATOM   356  C  CB   . GLU M  1 28  ? 134.646 108.231 64.224 1.00 4.01  27  M 1 
ATOM   357  C  CG   . GLU M  1 28  ? 134.708 109.746 64.330 1.00 4.01  27  M 1 
ATOM   358  C  CD   . GLU M  1 28  ? 135.022 110.278 65.717 1.00 4.01  27  M 1 
ATOM   359  O  OE1  . GLU M  1 28  ? 135.132 111.477 65.845 1.00 4.01  27  M 1 
ATOM   360  O  OE2  . GLU M  1 28  ? 135.180 109.480 66.654 1.00 4.01  27  M 1 
ATOM   361  H  H    . GLU M  1 28  ? 136.336 108.472 62.412 1.00 4.01  27  M 1 
ATOM   362  H  HA   . GLU M  1 28  ? 136.491 107.832 65.039 1.00 4.01  27  M 1 
ATOM   363  H  HB2  . GLU M  1 28  ? 134.174 107.988 63.400 1.00 4.01  27  M 1 
ATOM   364  H  HB3  . GLU M  1 28  ? 134.133 107.879 64.981 1.00 4.01  27  M 1 
ATOM   365  H  HG2  . GLU M  1 28  ? 135.391 110.078 63.709 1.00 4.01  27  M 1 
ATOM   366  H  HG3  . GLU M  1 28  ? 133.846 110.118 64.045 1.00 4.01  27  M 1 
ATOM   367  N  N    . LEU M  1 29  ? 135.785 105.403 63.026 1.00 3.51  28  M 1 
ATOM   368  C  CA   . LEU M  1 29  ? 135.765 103.946 62.933 1.00 3.51  28  M 1 
ATOM   369  C  C    . LEU M  1 29  ? 137.136 103.360 63.258 1.00 3.51  28  M 1 
ATOM   370  O  O    . LEU M  1 29  ? 137.245 102.337 63.952 1.00 3.51  28  M 1 
ATOM   371  C  CB   . LEU M  1 29  ? 135.301 103.527 61.538 1.00 3.51  28  M 1 
ATOM   372  C  CG   . LEU M  1 29  ? 133.853 103.850 61.150 1.00 3.51  28  M 1 
ATOM   373  C  CD1  . LEU M  1 29  ? 133.595 103.571 59.675 1.00 3.51  28  M 1 
ATOM   374  C  CD2  . LEU M  1 29  ? 132.868 103.099 62.048 1.00 3.51  28  M 1 
ATOM   375  H  H    . LEU M  1 29  ? 135.653 105.809 62.280 1.00 3.51  28  M 1 
ATOM   376  H  HA   . LEU M  1 29  ? 135.135 103.595 63.582 1.00 3.51  28  M 1 
ATOM   377  H  HB2  . LEU M  1 29  ? 135.875 103.956 60.885 1.00 3.51  28  M 1 
ATOM   378  H  HB3  . LEU M  1 29  ? 135.409 102.566 61.462 1.00 3.51  28  M 1 
ATOM   379  H  HG   . LEU M  1 29  ? 133.694 104.797 61.289 1.00 3.51  28  M 1 
ATOM   380  H  HD11 . LEU M  1 29  ? 132.643 103.636 59.502 1.00 3.51  28  M 1 
ATOM   381  H  HD12 . LEU M  1 29  ? 134.053 104.234 59.135 1.00 3.51  28  M 1 
ATOM   382  H  HD13 . LEU M  1 29  ? 133.912 102.684 59.442 1.00 3.51  28  M 1 
ATOM   383  H  HD21 . LEU M  1 29  ? 132.022 102.980 61.589 1.00 3.51  28  M 1 
ATOM   384  H  HD22 . LEU M  1 29  ? 133.233 102.231 62.281 1.00 3.51  28  M 1 
ATOM   385  H  HD23 . LEU M  1 29  ? 132.726 103.616 62.856 1.00 3.51  28  M 1 
ATOM   386  N  N    . TYR M  1 30  ? 138.197 104.018 62.789 1.00 3.71  29  M 1 
ATOM   387  C  CA   . TYR M  1 30  ? 139.553 103.601 63.125 1.00 3.71  29  M 1 
ATOM   388  C  C    . TYR M  1 30  ? 139.788 103.627 64.630 1.00 3.71  29  M 1 
ATOM   389  O  O    . TYR M  1 30  ? 140.367 102.694 65.193 1.00 3.71  29  M 1 
ATOM   390  C  CB   . TYR M  1 30  ? 140.558 104.494 62.407 1.00 3.71  29  M 1 
ATOM   391  C  CG   . TYR M  1 30  ? 141.983 104.208 62.780 1.00 3.71  29  M 1 
ATOM   392  C  CD1  . TYR M  1 30  ? 142.637 103.095 62.294 1.00 3.71  29  M 1 
ATOM   393  C  CD2  . TYR M  1 30  ? 142.674 105.050 63.634 1.00 3.71  29  M 1 
ATOM   394  C  CE1  . TYR M  1 30  ? 143.934 102.835 62.635 1.00 3.71  29  M 1 
ATOM   395  C  CE2  . TYR M  1 30  ? 143.977 104.793 63.983 1.00 3.71  29  M 1 
ATOM   396  C  CZ   . TYR M  1 30  ? 144.601 103.678 63.482 1.00 3.71  29  M 1 
ATOM   397  O  OH   . TYR M  1 30  ? 145.902 103.394 63.809 1.00 3.71  29  M 1 
ATOM   398  H  H    . TYR M  1 30  ? 138.158 104.711 62.281 1.00 3.71  29  M 1 
ATOM   399  H  HA   . TYR M  1 30  ? 139.690 102.691 62.818 1.00 3.71  29  M 1 
ATOM   400  H  HB2  . TYR M  1 30  ? 140.472 104.349 61.452 1.00 3.71  29  M 1 
ATOM   401  H  HB3  . TYR M  1 30  ? 140.372 105.424 62.613 1.00 3.71  29  M 1 
ATOM   402  H  HD1  . TYR M  1 30  ? 142.192 102.514 61.720 1.00 3.71  29  M 1 
ATOM   403  H  HD2  . TYR M  1 30  ? 142.251 105.805 63.975 1.00 3.71  29  M 1 
ATOM   404  H  HE1  . TYR M  1 30  ? 144.359 102.079 62.298 1.00 3.71  29  M 1 
ATOM   405  H  HE2  . TYR M  1 30  ? 144.429 105.369 64.556 1.00 3.71  29  M 1 
ATOM   406  H  HH   . TYR M  1 30  ? 146.373 103.345 63.115 1.00 3.71  29  M 1 
ATOM   407  N  N    . ALA M  1 31  ? 139.356 104.699 65.292 1.00 3.35  30  M 1 
ATOM   408  C  CA   . ALA M  1 31  ? 139.528 104.812 66.738 1.00 3.35  30  M 1 
ATOM   409  C  C    . ALA M  1 31  ? 138.774 103.707 67.462 1.00 3.35  30  M 1 
ATOM   410  O  O    . ALA M  1 31  ? 139.276 103.129 68.437 1.00 3.35  30  M 1 
ATOM   411  C  CB   . ALA M  1 31  ? 139.056 106.184 67.214 1.00 3.35  30  M 1 
ATOM   412  H  H    . ALA M  1 31  ? 138.946 105.361 64.927 1.00 3.35  30  M 1 
ATOM   413  H  HA   . ALA M  1 31  ? 140.472 104.735 66.949 1.00 3.35  30  M 1 
ATOM   414  H  HB1  . ALA M  1 31  ? 139.116 106.235 68.181 1.00 3.35  30  M 1 
ATOM   415  H  HB2  . ALA M  1 31  ? 139.622 106.867 66.821 1.00 3.35  30  M 1 
ATOM   416  H  HB3  . ALA M  1 31  ? 138.134 106.318 66.945 1.00 3.35  30  M 1 
ATOM   417  N  N    . SER M  1 32  ? 137.564 103.400 66.993 1.00 3.18  31  M 1 
ATOM   418  C  CA   . SER M  1 32  ? 136.811 102.293 67.567 1.00 3.18  31  M 1 
ATOM   419  C  C    . SER M  1 32  ? 137.603 100.999 67.464 1.00 3.18  31  M 1 
ATOM   420  O  O    . SER M  1 32  ? 137.641 100.201 68.404 1.00 3.18  31  M 1 
ATOM   421  C  CB   . SER M  1 32  ? 135.466 102.139 66.865 1.00 3.18  31  M 1 
ATOM   422  O  OG   . SER M  1 32  ? 134.752 101.051 67.407 1.00 3.18  31  M 1 
ATOM   423  H  H    . SER M  1 32  ? 137.174 103.793 66.335 1.00 3.18  31  M 1 
ATOM   424  H  HA   . SER M  1 32  ? 136.630 102.476 68.502 1.00 3.18  31  M 1 
ATOM   425  H  HB2  . SER M  1 32  ? 134.939 102.946 66.973 1.00 3.18  31  M 1 
ATOM   426  H  HB3  . SER M  1 32  ? 135.620 101.974 65.922 1.00 3.18  31  M 1 
ATOM   427  H  HG   . SER M  1 32  ? 135.094 100.829 68.141 1.00 3.18  31  M 1 
ATOM   428  N  N    . TYR M  1 33  ? 138.275 100.799 66.337 1.00 3.03  32  M 1 
ATOM   429  C  CA   . TYR M  1 33  ? 138.957 99.533  66.105 1.00 3.03  32  M 1 
ATOM   430  C  C    . TYR M  1 33  ? 140.246 99.446  66.928 1.00 3.03  32  M 1 
ATOM   431  O  O    . TYR M  1 33  ? 140.590 98.384  67.463 1.00 3.03  32  M 1 
ATOM   432  C  CB   . TYR M  1 33  ? 139.148 99.386  64.594 1.00 3.03  32  M 1 
ATOM   433  C  CG   . TYR M  1 33  ? 139.641 98.067  64.082 1.00 3.03  32  M 1 
ATOM   434  C  CD1  . TYR M  1 33  ? 139.026 96.900  64.464 1.00 3.03  32  M 1 
ATOM   435  C  CD2  . TYR M  1 33  ? 140.504 98.008  63.005 1.00 3.03  32  M 1 
ATOM   436  C  CE1  . TYR M  1 33  ? 139.409 95.696  63.962 1.00 3.03  32  M 1 
ATOM   437  C  CE2  . TYR M  1 33  ? 140.878 96.805  62.460 1.00 3.03  32  M 1 
ATOM   438  C  CZ   . TYR M  1 33  ? 140.315 95.642  62.942 1.00 3.03  32  M 1 
ATOM   439  O  OH   . TYR M  1 33  ? 140.653 94.414  62.435 1.00 3.03  32  M 1 
ATOM   440  H  H    . TYR M  1 33  ? 138.348 101.369 65.698 1.00 3.03  32  M 1 
ATOM   441  H  HA   . TYR M  1 33  ? 138.370 98.818  66.396 1.00 3.03  32  M 1 
ATOM   442  H  HB2  . TYR M  1 33  ? 138.302 99.563  64.154 1.00 3.03  32  M 1 
ATOM   443  H  HB3  . TYR M  1 33  ? 139.791 100.056 64.312 1.00 3.03  32  M 1 
ATOM   444  H  HD1  . TYR M  1 33  ? 138.426 96.924  65.175 1.00 3.03  32  M 1 
ATOM   445  H  HD2  . TYR M  1 33  ? 140.889 98.792  62.686 1.00 3.03  32  M 1 
ATOM   446  H  HE1  . TYR M  1 33  ? 139.016 94.918  64.286 1.00 3.03  32  M 1 
ATOM   447  H  HE2  . TYR M  1 33  ? 141.500 96.784  61.769 1.00 3.03  32  M 1 
ATOM   448  H  HH   . TYR M  1 33  ? 141.157 94.498  61.768 1.00 3.03  32  M 1 
ATOM   449  N  N    . VAL M  1 34  ? 140.915 100.585 67.121 1.00 3.46  33  M 1 
ATOM   450  C  CA   . VAL M  1 34  ? 142.055 100.663 68.039 1.00 3.46  33  M 1 
ATOM   451  C  C    . VAL M  1 34  ? 141.629 100.281 69.455 1.00 3.46  33  M 1 
ATOM   452  O  O    . VAL M  1 34  ? 142.290 99.482  70.134 1.00 3.46  33  M 1 
ATOM   453  C  CB   . VAL M  1 34  ? 142.683 102.071 68.007 1.00 3.46  33  M 1 
ATOM   454  C  CG1  . VAL M  1 34  ? 143.748 102.219 69.088 1.00 3.46  33  M 1 
ATOM   455  C  CG2  . VAL M  1 34  ? 143.311 102.347 66.654 1.00 3.46  33  M 1 
ATOM   456  H  H    . VAL M  1 34  ? 140.716 101.332 66.744 1.00 3.46  33  M 1 
ATOM   457  H  HA   . VAL M  1 34  ? 142.735 100.036 67.747 1.00 3.46  33  M 1 
ATOM   458  H  HB   . VAL M  1 34  ? 141.995 102.736 68.165 1.00 3.46  33  M 1 
ATOM   459  H  HG11 . VAL M  1 34  ? 144.305 102.986 68.882 1.00 3.46  33  M 1 
ATOM   460  H  HG12 . VAL M  1 34  ? 143.331 102.360 69.952 1.00 3.46  33  M 1 
ATOM   461  H  HG13 . VAL M  1 34  ? 144.301 101.423 69.110 1.00 3.46  33  M 1 
ATOM   462  H  HG21 . VAL M  1 34  ? 143.667 103.249 66.651 1.00 3.46  33  M 1 
ATOM   463  H  HG22 . VAL M  1 34  ? 144.029 101.713 66.500 1.00 3.46  33  M 1 
ATOM   464  H  HG23 . VAL M  1 34  ? 142.654 102.259 65.946 1.00 3.46  33  M 1 
ATOM   465  N  N    . TYR M  1 35  ? 140.530 100.866 69.919 1.00 3.20  34  M 1 
ATOM   466  C  CA   . TYR M  1 35  ? 140.001 100.604 71.283 1.00 3.20  34  M 1 
ATOM   467  C  C    . TYR M  1 35  ? 139.639 99.114  71.378 1.00 3.20  34  M 1 
ATOM   468  O  O    . TYR M  1 35  ? 139.849 98.500  72.402 1.00 3.20  34  M 1 
ATOM   469  C  CB   . TYR M  1 35  ? 138.841 101.546 71.587 1.00 3.20  34  M 1 
ATOM   470  C  CG   . TYR M  1 35  ? 139.250 102.931 72.020 1.00 3.20  34  M 1 
ATOM   471  C  CD1  . TYR M  1 35  ? 140.196 103.117 73.010 1.00 3.20  34  M 1 
ATOM   472  C  CD2  . TYR M  1 35  ? 138.646 104.058 71.485 1.00 3.20  34  M 1 
ATOM   473  C  CE1  . TYR M  1 35  ? 140.544 104.389 73.448 1.00 3.20  34  M 1 
ATOM   474  C  CE2  . TYR M  1 35  ? 138.992 105.335 71.899 1.00 3.20  34  M 1 
ATOM   475  C  CZ   . TYR M  1 35  ? 139.942 105.505 72.889 1.00 3.20  34  M 1 
ATOM   476  O  OH   . TYR M  1 35  ? 140.290 106.755 73.319 1.00 3.20  34  M 1 
ATOM   477  H  H    . TYR M  1 35  ? 139.962 101.356 69.405 1.00 3.20  34  M 1 
ATOM   478  H  HA   . TYR M  1 35  ? 140.725 100.784 71.935 1.00 3.20  34  M 1 
ATOM   479  H  HB2  . TYR M  1 35  ? 138.284 101.619 70.784 1.00 3.20  34  M 1 
ATOM   480  H  HB3  . TYR M  1 35  ? 138.294 101.144 72.294 1.00 3.20  34  M 1 
ATOM   481  H  HD1  . TYR M  1 35  ? 140.606 102.366 73.404 1.00 3.20  34  M 1 
ATOM   482  H  HD2  . TYR M  1 35  ? 137.992 103.955 70.813 1.00 3.20  34  M 1 
ATOM   483  H  HE1  . TYR M  1 35  ? 141.198 104.495 74.119 1.00 3.20  34  M 1 
ATOM   484  H  HE2  . TYR M  1 35  ? 138.571 106.086 71.515 1.00 3.20  34  M 1 
ATOM   485  H  HH   . TYR M  1 35  ? 139.593 107.177 73.589 1.00 3.20  34  M 1 
ATOM   486  N  N    . LEU M  1 36  ? 139.084 98.533  70.325 1.00 3.08  35  M 1 
ATOM   487  C  CA   . LEU M  1 36  ? 138.744 97.115  70.332 1.00 3.08  35  M 1 
ATOM   488  C  C    . LEU M  1 36  ? 139.990 96.254  70.508 1.00 3.08  35  M 1 
ATOM   489  O  O    . LEU M  1 36  ? 139.984 95.281  71.274 1.00 3.08  35  M 1 
ATOM   490  C  CB   . LEU M  1 36  ? 138.005 96.750  69.045 1.00 3.08  35  M 1 
ATOM   491  C  CG   . LEU M  1 36  ? 137.534 95.304  68.916 1.00 3.08  35  M 1 
ATOM   492  C  CD1  . LEU M  1 36  ? 136.553 94.968  70.028 1.00 3.08  35  M 1 
ATOM   493  C  CD2  . LEU M  1 36  ? 136.903 95.067  67.564 1.00 3.08  35  M 1 
ATOM   494  H  H    . LEU M  1 36  ? 138.894 98.952  69.598 1.00 3.08  35  M 1 
ATOM   495  H  HA   . LEU M  1 36  ? 138.158 96.956  71.088 1.00 3.08  35  M 1 
ATOM   496  H  HB2  . LEU M  1 36  ? 137.216 97.310  68.970 1.00 3.08  35  M 1 
ATOM   497  H  HB3  . LEU M  1 36  ? 138.587 96.937  68.292 1.00 3.08  35  M 1 
ATOM   498  H  HG   . LEU M  1 36  ? 138.295 94.706  68.982 1.00 3.08  35  M 1 
ATOM   499  H  HD11 . LEU M  1 36  ? 136.178 94.088  69.867 1.00 3.08  35  M 1 
ATOM   500  H  HD12 . LEU M  1 36  ? 137.019 94.970  70.879 1.00 3.08  35  M 1 
ATOM   501  H  HD13 . LEU M  1 36  ? 135.843 95.629  70.043 1.00 3.08  35  M 1 
ATOM   502  H  HD21 . LEU M  1 36  ? 136.535 94.170  67.543 1.00 3.08  35  M 1 
ATOM   503  H  HD22 . LEU M  1 36  ? 136.197 95.717  67.423 1.00 3.08  35  M 1 
ATOM   504  H  HD23 . LEU M  1 36  ? 137.580 95.162  66.875 1.00 3.08  35  M 1 
ATOM   505  N  N    . SER M  1 37  ? 141.069 96.611  69.816 1.00 3.69  36  M 1 
ATOM   506  C  CA   . SER M  1 37  ? 142.323 95.872  69.937 1.00 3.69  36  M 1 
ATOM   507  C  C    . SER M  1 37  ? 142.871 95.954  71.360 1.00 3.69  36  M 1 
ATOM   508  O  O    . SER M  1 37  ? 143.339 94.957  71.924 1.00 3.69  36  M 1 
ATOM   509  C  CB   . SER M  1 37  ? 143.339 96.419  68.940 1.00 3.69  36  M 1 
ATOM   510  O  OG   . SER M  1 37  ? 144.559 95.726  69.033 1.00 3.69  36  M 1 
ATOM   511  H  H    . SER M  1 37  ? 141.104 97.291  69.290 1.00 3.69  36  M 1 
ATOM   512  H  HA   . SER M  1 37  ? 142.174 94.940  69.715 1.00 3.69  36  M 1 
ATOM   513  H  HB2  . SER M  1 37  ? 142.982 96.331  68.042 1.00 3.69  36  M 1 
ATOM   514  H  HB3  . SER M  1 37  ? 143.507 97.356  69.128 1.00 3.69  36  M 1 
ATOM   515  H  HG   . SER M  1 37  ? 144.931 95.734  68.280 1.00 3.69  36  M 1 
ATOM   516  N  N    . MET M  1 38  ? 142.811 97.145  71.956 1.00 3.57  37  M 1 
ATOM   517  C  CA   . MET M  1 38  ? 143.243 97.312  73.342 1.00 3.57  37  M 1 
ATOM   518  C  C    . MET M  1 38  ? 142.431 96.421  74.277 1.00 3.57  37  M 1 
ATOM   519  O  O    . MET M  1 38  ? 142.984 95.719  75.141 1.00 3.57  37  M 1 
ATOM   520  C  CB   . MET M  1 38  ? 143.122 98.784  73.749 1.00 3.57  37  M 1 
ATOM   521  C  CG   . MET M  1 38  ? 144.133 99.719  73.108 1.00 3.57  37  M 1 
ATOM   522  S  SD   . MET M  1 38  ? 143.865 101.435 73.612 1.00 3.57  37  M 1 
ATOM   523  C  CE   . MET M  1 38  ? 145.135 102.271 72.672 1.00 3.57  37  M 1 
ATOM   524  H  H    . MET M  1 38  ? 142.498 97.857  71.588 1.00 3.57  37  M 1 
ATOM   525  H  HA   . MET M  1 38  ? 144.179 97.066  73.411 1.00 3.57  37  M 1 
ATOM   526  H  HB2  . MET M  1 38  ? 142.236 99.102  73.516 1.00 3.57  37  M 1 
ATOM   527  H  HB3  . MET M  1 38  ? 143.231 98.858  74.710 1.00 3.57  37  M 1 
ATOM   528  H  HG2  . MET M  1 38  ? 145.022 99.457  73.394 1.00 3.57  37  M 1 
ATOM   529  H  HG3  . MET M  1 38  ? 144.086 99.664  72.141 1.00 3.57  37  M 1 
ATOM   530  H  HE1  . MET M  1 38  ? 145.182 103.200 72.947 1.00 3.57  37  M 1 
ATOM   531  H  HE2  . MET M  1 38  ? 145.984 101.832 72.837 1.00 3.57  37  M 1 
ATOM   532  H  HE3  . MET M  1 38  ? 144.920 102.220 71.728 1.00 3.57  37  M 1 
ATOM   533  N  N    . SER M  1 39  ? 141.125 96.439  74.059 1.00 3.57  38  M 1 
ATOM   534  C  CA   . SER M  1 39  ? 140.177 95.667  74.882 1.00 3.57  38  M 1 
ATOM   535  C  C    . SER M  1 39  ? 140.572 94.195  74.781 1.00 3.57  38  M 1 
ATOM   536  O  O    . SER M  1 39  ? 140.725 93.591  75.818 1.00 3.57  38  M 1 
ATOM   537  C  CB   . SER M  1 39  ? 138.755 95.858  74.453 1.00 3.57  38  M 1 
ATOM   538  O  OG   . SER M  1 39  ? 137.885 95.283  75.403 1.00 3.57  38  M 1 
ATOM   539  H  H    . SER M  1 39  ? 140.739 96.797  73.317 1.00 3.57  38  M 1 
ATOM   540  H  HA   . SER M  1 39  ? 140.271 95.958  75.829 1.00 3.57  38  M 1 
ATOM   541  H  HB2  . SER M  1 39  ? 138.563 96.819  74.367 1.00 3.57  38  M 1 
ATOM   542  H  HB3  . SER M  1 39  ? 138.616 95.434  73.576 1.00 3.57  38  M 1 
ATOM   543  H  HG   . SER M  1 39  ? 138.336 95.071  76.086 1.00 3.57  38  M 1 
ATOM   544  N  N    . CYS M  1 40  ? 140.888 93.717  73.583 1.00 4.32  39  M 1 
ATOM   545  C  CA   . CYS M  1 40  ? 141.264 92.302  73.348 1.00 4.32  39  M 1 
ATOM   546  C  C    . CYS M  1 40  ? 142.555 92.007  74.115 1.00 4.32  39  M 1 
ATOM   547  O  O    . CYS M  1 40  ? 142.598 91.009  74.795 1.00 4.32  39  M 1 
ATOM   548  C  CB   . CYS M  1 40  ? 141.449 92.000  71.865 1.00 4.32  39  M 1 
ATOM   549  S  SG   . CYS M  1 40  ? 139.891 91.997  70.941 1.00 4.32  39  M 1 
ATOM   550  H  H    . CYS M  1 40  ? 141.025 94.242  72.853 1.00 4.32  39  M 1 
ATOM   551  H  HA   . CYS M  1 40  ? 140.545 91.729  73.700 1.00 4.32  39  M 1 
ATOM   552  H  HB2  . CYS M  1 40  ? 142.044 92.671  71.472 1.00 4.32  39  M 1 
ATOM   553  H  HB3  . CYS M  1 40  ? 141.874 91.124  71.765 1.00 4.32  39  M 1 
ATOM   554  H  HG   . CYS M  1 40  ? 140.354 91.741  69.861 1.00 4.32  39  M 1 
ATOM   555  N  N    . TYR M  1 41  ? 143.500 92.935  74.109 1.00 4.38  40  M 1 
ATOM   556  C  CA   . TYR M  1 41  ? 144.808 92.747  74.775 1.00 4.38  40  M 1 
ATOM   557  C  C    . TYR M  1 41  ? 144.627 92.543  76.279 1.00 4.38  40  M 1 
ATOM   558  O  O    . TYR M  1 41  ? 145.227 91.640  76.793 1.00 4.38  40  M 1 
ATOM   559  C  CB   . TYR M  1 41  ? 145.702 93.952  74.532 1.00 4.38  40  M 1 
ATOM   560  C  CG   . TYR M  1 41  ? 147.002 93.889  75.275 1.00 4.38  40  M 1 
ATOM   561  C  CD1  . TYR M  1 41  ? 148.056 93.128  74.805 1.00 4.38  40  M 1 
ATOM   562  C  CD2  . TYR M  1 41  ? 147.181 94.611  76.438 1.00 4.38  40  M 1 
ATOM   563  C  CE1  . TYR M  1 41  ? 149.266 93.079  75.479 1.00 4.38  40  M 1 
ATOM   564  C  CE2  . TYR M  1 41  ? 148.382 94.574  77.123 1.00 4.38  40  M 1 
ATOM   565  C  CZ   . TYR M  1 41  ? 149.423 93.798  76.649 1.00 4.38  40  M 1 
ATOM   566  O  OH   . TYR M  1 41  ? 150.601 93.766  77.329 1.00 4.38  40  M 1 
ATOM   567  H  H    . TYR M  1 41  ? 143.368 93.789  73.825 1.00 4.38  40  M 1 
ATOM   568  H  HA   . TYR M  1 41  ? 145.245 91.942  74.397 1.00 4.38  40  M 1 
ATOM   569  H  HB2  . TYR M  1 41  ? 145.886 94.017  73.571 1.00 4.38  40  M 1 
ATOM   570  H  HB3  . TYR M  1 41  ? 145.218 94.761  74.802 1.00 4.38  40  M 1 
ATOM   571  H  HD1  . TYR M  1 41  ? 147.951 92.633  74.009 1.00 4.38  40  M 1 
ATOM   572  H  HD2  . TYR M  1 41  ? 146.475 95.140  76.771 1.00 4.38  40  M 1 
ATOM   573  H  HE1  . TYR M  1 41  ? 149.973 92.549  75.150 1.00 4.38  40  M 1 
ATOM   574  H  HE2  . TYR M  1 41  ? 148.487 95.066  77.920 1.00 4.38  40  M 1 
ATOM   575  H  HH   . TYR M  1 41  ? 150.480 93.440  78.113 1.00 4.38  40  M 1 
ATOM   576  N  N    . PHE M  1 42  ? 143.784 93.325  76.942 1.00 3.75  41  M 1 
ATOM   577  C  CA   . PHE M  1 42  ? 143.626 93.250  78.424 1.00 3.75  41  M 1 
ATOM   578  C  C    . PHE M  1 42  ? 142.893 91.962  78.827 1.00 3.75  41  M 1 
ATOM   579  O  O    . PHE M  1 42  ? 142.921 91.650  79.995 1.00 3.75  41  M 1 
ATOM   580  C  CB   . PHE M  1 42  ? 143.056 94.559  78.978 1.00 3.75  41  M 1 
ATOM   581  C  CG   . PHE M  1 42  ? 144.075 95.668  78.885 1.00 3.75  41  M 1 
ATOM   582  C  CD1  . PHE M  1 42  ? 145.167 95.702  79.740 1.00 3.75  41  M 1 
ATOM   583  C  CD2  . PHE M  1 42  ? 144.003 96.615  77.879 1.00 3.75  41  M 1 
ATOM   584  C  CE1  . PHE M  1 42  ? 146.147 96.675  79.609 1.00 3.75  41  M 1 
ATOM   585  C  CE2  . PHE M  1 42  ? 144.963 97.613  77.774 1.00 3.75  41  M 1 
ATOM   586  C  CZ   . PHE M  1 42  ? 146.039 97.634  78.626 1.00 3.75  41  M 1 
ATOM   587  H  H    . PHE M  1 42  ? 143.184 93.883  76.545 1.00 3.75  41  M 1 
ATOM   588  H  HA   . PHE M  1 42  ? 144.541 93.169  78.795 1.00 3.75  41  M 1 
ATOM   589  H  HB2  . PHE M  1 42  ? 142.257 94.803  78.468 1.00 3.75  41  M 1 
ATOM   590  H  HB3  . PHE M  1 42  ? 142.799 94.426  79.914 1.00 3.75  41  M 1 
ATOM   591  H  HD1  . PHE M  1 42  ? 145.254 95.040  80.407 1.00 3.75  41  M 1 
ATOM   592  H  HD2  . PHE M  1 42  ? 143.271 96.606  77.284 1.00 3.75  41  M 1 
ATOM   593  H  HE1  . PHE M  1 42  ? 146.871 96.699  80.214 1.00 3.75  41  M 1 
ATOM   594  H  HE2  . PHE M  1 42  ? 144.890 98.263  77.093 1.00 3.75  41  M 1 
ATOM   595  H  HZ   . PHE M  1 42  ? 146.689 98.314  78.553 1.00 3.75  41  M 1 
ATOM   596  N  N    . ASP M  1 43  ? 142.191 91.322  77.898 1.00 4.58  42  M 1 
ATOM   597  C  CA   . ASP M  1 43  ? 141.473 90.038  78.080 1.00 4.58  42  M 1 
ATOM   598  C  C    . ASP M  1 43  ? 142.425 88.840  77.923 1.00 4.58  42  M 1 
ATOM   599  O  O    . ASP M  1 43  ? 142.006 87.752  78.194 1.00 4.58  42  M 1 
ATOM   600  C  CB   . ASP M  1 43  ? 140.329 89.942  77.072 1.00 4.58  42  M 1 
ATOM   601  C  CG   . ASP M  1 43  ? 139.568 88.639  77.147 1.00 4.58  42  M 1 
ATOM   602  O  OD1  . ASP M  1 43  ? 139.070 88.323  78.243 1.00 4.58  42  M 1 
ATOM   603  O  OD2  . ASP M  1 43  ? 139.491 87.950  76.115 1.00 4.58  42  M 1 
ATOM   604  H  H    . ASP M  1 43  ? 142.065 91.654  77.065 1.00 4.58  42  M 1 
ATOM   605  H  HA   . ASP M  1 43  ? 141.091 90.021  78.989 1.00 4.58  42  M 1 
ATOM   606  H  HB2  . ASP M  1 43  ? 139.701 90.677  77.231 1.00 4.58  42  M 1 
ATOM   607  H  HB3  . ASP M  1 43  ? 140.690 90.039  76.168 1.00 4.58  42  M 1 
ATOM   608  N  N    . ARG M  1 44  ? 143.669 89.028  77.488 1.00 4.59  43  M 1 
ATOM   609  C  CA   . ARG M  1 44  ? 144.629 87.906  77.341 1.00 4.59  43  M 1 
ATOM   610  C  C    . ARG M  1 44  ? 144.872 87.264  78.707 1.00 4.59  43  M 1 
ATOM   611  O  O    . ARG M  1 44  ? 144.960 87.979  79.676 1.00 4.59  43  M 1 
ATOM   612  C  CB   . ARG M  1 44  ? 145.945 88.407  76.749 1.00 4.59  43  M 1 
ATOM   613  C  CG   . ARG M  1 44  ? 145.842 88.780  75.285 1.00 4.59  43  M 1 
ATOM   614  C  CD   . ARG M  1 44  ? 147.064 89.496  74.784 1.00 4.59  43  M 1 
ATOM   615  N  NE   . ARG M  1 44  ? 148.304 88.846  75.136 1.00 4.59  43  M 1 
ATOM   616  C  CZ   . ARG M  1 44  ? 149.445 89.019  74.482 1.00 4.59  43  M 1 
ATOM   617  N  NH1  . ARG M  1 44  ? 149.498 89.823  73.439 1.00 4.59  43  M 1 
ATOM   618  N  NH2  . ARG M  1 44  ? 150.530 88.386  74.877 1.00 4.59  43  M 1 
ATOM   619  H  H    . ARG M  1 44  ? 144.027 89.832  77.290 1.00 4.59  43  M 1 
ATOM   620  H  HA   . ARG M  1 44  ? 144.238 87.234  76.736 1.00 4.59  43  M 1 
ATOM   621  H  HB2  . ARG M  1 44  ? 146.239 89.192  77.257 1.00 4.59  43  M 1 
ATOM   622  H  HB3  . ARG M  1 44  ? 146.623 87.708  76.852 1.00 4.59  43  M 1 
ATOM   623  H  HG2  . ARG M  1 44  ? 145.710 87.966  74.753 1.00 4.59  43  M 1 
ATOM   624  H  HG3  . ARG M  1 44  ? 145.059 89.356  75.152 1.00 4.59  43  M 1 
ATOM   625  H  HD2  . ARG M  1 44  ? 147.011 89.569  73.807 1.00 4.59  43  M 1 
ATOM   626  H  HD3  . ARG M  1 44  ? 147.069 90.407  75.149 1.00 4.59  43  M 1 
ATOM   627  H  HE   . ARG M  1 44  ? 148.305 88.305  75.821 1.00 4.59  43  M 1 
ATOM   628  H  HH11 . ARG M  1 44  ? 148.775 90.249  73.178 1.00 4.59  43  M 1 
ATOM   629  H  HH12 . ARG M  1 44  ? 150.258 89.935  73.012 1.00 4.59  43  M 1 
ATOM   630  H  HH21 . ARG M  1 44  ? 150.499 87.850  75.555 1.00 4.59  43  M 1 
ATOM   631  H  HH22 . ARG M  1 44  ? 151.285 88.501  74.438 1.00 4.59  43  M 1 
ATOM   632  N  N    . ASP M  1 45  ? 145.103 85.958  78.766 1.00 4.97  44  M 1 
ATOM   633  C  CA   . ASP M  1 45  ? 145.355 85.256  80.057 1.00 4.97  44  M 1 
ATOM   634  C  C    . ASP M  1 45  ? 146.668 85.742  80.712 1.00 4.97  44  M 1 
ATOM   635  O  O    . ASP M  1 45  ? 146.819 85.489  81.891 1.00 4.97  44  M 1 
ATOM   636  C  CB   . ASP M  1 45  ? 145.349 83.739  79.894 1.00 4.97  44  M 1 
ATOM   637  C  CG   . ASP M  1 45  ? 146.620 83.284  79.220 1.00 4.97  44  M 1 
ATOM   638  O  OD1  . ASP M  1 45  ? 147.606 83.093  79.940 1.00 4.97  44  M 1 
ATOM   639  O  OD2  . ASP M  1 45  ? 146.633 83.234  77.997 1.00 4.97  44  M 1 
ATOM   640  H  H    . ASP M  1 45  ? 145.234 85.444  78.027 1.00 4.97  44  M 1 
ATOM   641  H  HA   . ASP M  1 45  ? 144.615 85.487  80.666 1.00 4.97  44  M 1 
ATOM   642  H  HB2  . ASP M  1 45  ? 145.279 83.310  80.771 1.00 4.97  44  M 1 
ATOM   643  H  HB3  . ASP M  1 45  ? 144.582 83.466  79.350 1.00 4.97  44  M 1 
ATOM   644  N  N    . ASP M  1 46  ? 147.649 86.258  79.969 1.00 4.81  45  M 1 
ATOM   645  C  CA   . ASP M  1 46  ? 148.928 86.748  80.536 1.00 4.81  45  M 1 
ATOM   646  C  C    . ASP M  1 46  ? 148.867 88.257  80.847 1.00 4.81  45  M 1 
ATOM   647  O  O    . ASP M  1 46  ? 149.900 88.769  81.216 1.00 4.81  45  M 1 
ATOM   648  C  CB   . ASP M  1 46  ? 150.117 86.389  79.649 1.00 4.81  45  M 1 
ATOM   649  C  CG   . ASP M  1 46  ? 149.985 86.864  78.215 1.00 4.81  45  M 1 
ATOM   650  O  OD1  . ASP M  1 46  ? 148.921 87.352  77.865 1.00 4.81  45  M 1 
ATOM   651  O  OD2  . ASP M  1 46  ? 150.959 86.728  77.462 1.00 4.81  45  M 1 
ATOM   652  H  H    . ASP M  1 46  ? 147.592 86.348  79.066 1.00 4.81  45  M 1 
ATOM   653  H  HA   . ASP M  1 46  ? 149.061 86.277  81.392 1.00 4.81  45  M 1 
ATOM   654  H  HB2  . ASP M  1 46  ? 150.928 86.785  80.029 1.00 4.81  45  M 1 
ATOM   655  H  HB3  . ASP M  1 46  ? 150.227 85.417  79.642 1.00 4.81  45  M 1 
ATOM   656  N  N    . VAL M  1 47  ? 147.711 88.919  80.748 1.00 4.20  46  M 1 
ATOM   657  C  CA   . VAL M  1 47  ? 147.532 90.321  81.107 1.00 4.20  46  M 1 
ATOM   658  C  C    . VAL M  1 47  ? 146.468 90.377  82.200 1.00 4.20  46  M 1 
ATOM   659  O  O    . VAL M  1 47  ? 146.740 90.802  83.326 1.00 4.20  46  M 1 
ATOM   660  C  CB   . VAL M  1 47  ? 147.159 91.167  79.874 1.00 4.20  46  M 1 
ATOM   661  C  CG1  . VAL M  1 47  ? 146.894 92.607  80.267 1.00 4.20  46  M 1 
ATOM   662  C  CG2  . VAL M  1 47  ? 148.260 91.084  78.816 1.00 4.20  46  M 1 
ATOM   663  H  H    . VAL M  1 47  ? 146.975 88.546  80.505 1.00 4.20  46  M 1 
ATOM   664  H  HA   . VAL M  1 47  ? 148.355 90.681  81.473 1.00 4.20  46  M 1 
ATOM   665  H  HB   . VAL M  1 47  ? 146.348 90.817  79.473 1.00 4.20  46  M 1 
ATOM   666  H  HG11 . VAL M  1 47  ? 146.844 93.141  79.459 1.00 4.20  46  M 1 
ATOM   667  H  HG12 . VAL M  1 47  ? 146.053 92.662  80.747 1.00 4.20  46  M 1 
ATOM   668  H  HG13 . VAL M  1 47  ? 147.615 92.937  80.825 1.00 4.20  46  M 1 
ATOM   669  H  HG21 . VAL M  1 47  ? 148.056 91.680  78.078 1.00 4.20  46  M 1 
ATOM   670  H  HG22 . VAL M  1 47  ? 149.110 91.329  79.214 1.00 4.20  46  M 1 
ATOM   671  H  HG23 . VAL M  1 47  ? 148.314 90.176  78.480 1.00 4.20  46  M 1 
ATOM   672  N  N    . ALA M  1 48  ? 145.252 89.939  81.871 1.00 4.09  47  M 1 
ATOM   673  C  CA   . ALA M  1 48  ? 144.226 89.581  82.848 1.00 4.09  47  M 1 
ATOM   674  C  C    . ALA M  1 48  ? 143.784 90.780  83.690 1.00 4.09  47  M 1 
ATOM   675  O  O    . ALA M  1 48  ? 143.736 90.720  84.918 1.00 4.09  47  M 1 
ATOM   676  C  CB   . ALA M  1 48  ? 144.712 88.431  83.733 1.00 4.09  47  M 1 
ATOM   677  H  H    . ALA M  1 48  ? 144.982 89.848  81.060 1.00 4.09  47  M 1 
ATOM   678  H  HA   . ALA M  1 48  ? 143.445 89.262  82.369 1.00 4.09  47  M 1 
ATOM   679  H  HB1  . ALA M  1 48  ? 143.981 88.111  84.285 1.00 4.09  47  M 1 
ATOM   680  H  HB2  . ALA M  1 48  ? 145.014 87.713  83.155 1.00 4.09  47  M 1 
ATOM   681  H  HB3  . ALA M  1 48  ? 145.456 88.731  84.279 1.00 4.09  47  M 1 
ATOM   682  N  N    . LEU M  1 49  ? 143.443 91.870  83.008 1.00 3.91  48  M 1 
ATOM   683  C  CA   . LEU M  1 49  ? 142.931 93.101  83.616 1.00 3.91  48  M 1 
ATOM   684  C  C    . LEU M  1 49  ? 141.549 93.386  83.022 1.00 3.91  48  M 1 
ATOM   685  O  O    . LEU M  1 49  ? 141.416 94.075  82.011 1.00 3.91  48  M 1 
ATOM   686  C  CB   . LEU M  1 49  ? 143.918 94.244  83.389 1.00 3.91  48  M 1 
ATOM   687  C  CG   . LEU M  1 49  ? 145.258 94.024  84.111 1.00 3.91  48  M 1 
ATOM   688  C  CD1  . LEU M  1 49  ? 146.322 95.005  83.680 1.00 3.91  48  M 1 
ATOM   689  C  CD2  . LEU M  1 49  ? 145.071 94.083  85.631 1.00 3.91  48  M 1 
ATOM   690  H  H    . LEU M  1 49  ? 143.516 91.927  82.153 1.00 3.91  48  M 1 
ATOM   691  H  HA   . LEU M  1 49  ? 142.808 92.984  84.571 1.00 3.91  48  M 1 
ATOM   692  H  HB2  . LEU M  1 49  ? 144.095 94.342  82.440 1.00 3.91  48  M 1 
ATOM   693  H  HB3  . LEU M  1 49  ? 143.525 95.066  83.722 1.00 3.91  48  M 1 
ATOM   694  H  HG   . LEU M  1 49  ? 145.595 93.140  83.896 1.00 3.91  48  M 1 
ATOM   695  H  HD11 . LEU M  1 49  ? 147.187 94.570  83.732 1.00 3.91  48  M 1 
ATOM   696  H  HD12 . LEU M  1 49  ? 146.165 95.292  82.767 1.00 3.91  48  M 1 
ATOM   697  H  HD13 . LEU M  1 49  ? 146.309 95.769  84.278 1.00 3.91  48  M 1 
ATOM   698  H  HD21 . LEU M  1 49  ? 145.899 94.367  86.048 1.00 3.91  48  M 1 
ATOM   699  H  HD22 . LEU M  1 49  ? 144.367 94.712  85.853 1.00 3.91  48  M 1 
ATOM   700  H  HD23 . LEU M  1 49  ? 144.830 93.201  85.954 1.00 3.91  48  M 1 
ATOM   701  N  N    . LYS M  1 50  ? 140.522 92.794  83.640 1.00 4.48  49  M 1 
ATOM   702  C  CA   . LYS M  1 50  ? 139.116 92.801  83.147 1.00 4.48  49  M 1 
ATOM   703  C  C    . LYS M  1 50  ? 138.529 94.213  83.070 1.00 4.48  49  M 1 
ATOM   704  O  O    . LYS M  1 50  ? 137.806 94.487  82.119 1.00 4.48  49  M 1 
ATOM   705  C  CB   . LYS M  1 50  ? 138.251 91.891  84.020 1.00 4.48  49  M 1 
ATOM   706  C  CG   . LYS M  1 50  ? 138.716 90.445  84.052 1.00 4.48  49  M 1 
ATOM   707  C  CD   . LYS M  1 50  ? 137.781 89.541  84.839 1.00 4.48  49  M 1 
ATOM   708  C  CE   . LYS M  1 50  ? 138.133 88.076  84.693 1.00 4.48  49  M 1 
ATOM   709  N  NZ   . LYS M  1 50  ? 136.916 87.233  84.702 1.00 4.48  49  M 1 
ATOM   710  H  H    . LYS M  1 50  ? 140.604 92.440  84.474 1.00 4.48  49  M 1 
ATOM   711  H  HA   . LYS M  1 50  ? 139.122 92.429  82.235 1.00 4.48  49  M 1 
ATOM   712  H  HB2  . LYS M  1 50  ? 138.251 92.242  84.935 1.00 4.48  49  M 1 
ATOM   713  H  HB3  . LYS M  1 50  ? 137.331 91.918  83.686 1.00 4.48  49  M 1 
ATOM   714  H  HG2  . LYS M  1 50  ? 138.785 90.113  83.132 1.00 4.48  49  M 1 
ATOM   715  H  HG3  . LYS M  1 50  ? 139.611 90.408  84.454 1.00 4.48  49  M 1 
ATOM   716  H  HD2  . LYS M  1 50  ? 137.820 89.785  85.789 1.00 4.48  49  M 1 
ATOM   717  H  HD3  . LYS M  1 50  ? 136.861 89.680  84.528 1.00 4.48  49  M 1 
ATOM   718  H  HE2  . LYS M  1 50  ? 138.613 87.935  83.854 1.00 4.48  49  M 1 
ATOM   719  H  HE3  . LYS M  1 50  ? 138.716 87.803  85.427 1.00 4.48  49  M 1 
ATOM   720  H  HZ1  . LYS M  1 50  ? 137.138 86.370  84.536 1.00 4.48  49  M 1 
ATOM   721  H  HZ2  . LYS M  1 50  ? 136.512 87.285  85.513 1.00 4.48  49  M 1 
ATOM   722  H  HZ3  . LYS M  1 50  ? 136.338 87.519  84.064 1.00 4.48  49  M 1 
ATOM   723  N  N    . ASN M  1 51  ? 138.832 95.061  84.037 1.00 4.04  50  M 1 
ATOM   724  C  CA   . ASN M  1 51  ? 138.313 96.445  84.094 1.00 4.04  50  M 1 
ATOM   725  C  C    . ASN M  1 51  ? 138.979 97.259  82.986 1.00 4.04  50  M 1 
ATOM   726  O  O    . ASN M  1 51  ? 138.313 98.120  82.470 1.00 4.04  50  M 1 
ATOM   727  C  CB   . ASN M  1 51  ? 138.358 97.030  85.502 1.00 4.04  50  M 1 
ATOM   728  C  CG   . ASN M  1 51  ? 137.360 96.332  86.403 1.00 4.04  50  M 1 
ATOM   729  O  OD1  . ASN M  1 51  ? 136.337 95.857  85.933 1.00 4.04  50  M 1 
ATOM   730  N  ND2  . ASN M  1 51  ? 137.675 96.201  87.674 1.00 4.04  50  M 1 
ATOM   731  H  H    . ASN M  1 51  ? 139.425 94.854  84.696 1.00 4.04  50  M 1 
ATOM   732  H  HA   . ASN M  1 51  ? 137.356 96.389  83.863 1.00 4.04  50  M 1 
ATOM   733  H  HB2  . ASN M  1 51  ? 139.259 96.924  85.868 1.00 4.04  50  M 1 
ATOM   734  H  HB3  . ASN M  1 51  ? 138.149 97.986  85.462 1.00 4.04  50  M 1 
ATOM   735  H  HD21 . ASN M  1 51  ? 138.442 96.521  87.975 1.00 4.04  50  M 1 
ATOM   736  H  HD22 . ASN M  1 51  ? 137.119 95.793  88.228 1.00 4.04  50  M 1 
ATOM   737  N  N    . PHE M  1 52  ? 140.264 97.074  82.697 1.00 3.78  51  M 1 
ATOM   738  C  CA   . PHE M  1 52  ? 140.889 97.787  81.553 1.00 3.78  51  M 1 
ATOM   739  C  C    . PHE M  1 52  ? 140.179 97.325  80.269 1.00 3.78  51  M 1 
ATOM   740  O  O    . PHE M  1 52  ? 139.787 98.165  79.473 1.00 3.78  51  M 1 
ATOM   741  C  CB   . PHE M  1 52  ? 142.386 97.523  81.457 1.00 3.78  51  M 1 
ATOM   742  C  CG   . PHE M  1 52  ? 143.231 98.417  82.334 1.00 3.78  51  M 1 
ATOM   743  C  CD1  . PHE M  1 52  ? 143.460 98.114  83.666 1.00 3.78  51  M 1 
ATOM   744  C  CD2  . PHE M  1 52  ? 143.836 99.549  81.815 1.00 3.78  51  M 1 
ATOM   745  C  CE1  . PHE M  1 52  ? 144.276 98.921  84.452 1.00 3.78  51  M 1 
ATOM   746  C  CE2  . PHE M  1 52  ? 144.649 100.353 82.597 1.00 3.78  51  M 1 
ATOM   747  C  CZ   . PHE M  1 52  ? 144.872 100.031 83.914 1.00 3.78  51  M 1 
ATOM   748  H  H    . PHE M  1 52  ? 140.864 96.663  83.243 1.00 3.78  51  M 1 
ATOM   749  H  HA   . PHE M  1 52  ? 140.741 98.761  81.665 1.00 3.78  51  M 1 
ATOM   750  H  HB2  . PHE M  1 52  ? 142.552 96.589  81.703 1.00 3.78  51  M 1 
ATOM   751  H  HB3  . PHE M  1 52  ? 142.662 97.640  80.524 1.00 3.78  51  M 1 
ATOM   752  H  HD1  . PHE M  1 52  ? 143.069 97.340  84.040 1.00 3.78  51  M 1 
ATOM   753  H  HD2  . PHE M  1 52  ? 143.705 99.767  80.906 1.00 3.78  51  M 1 
ATOM   754  H  HE1  . PHE M  1 52  ? 144.419 98.703  85.359 1.00 3.78  51  M 1 
ATOM   755  H  HE2  . PHE M  1 52  ? 145.049 101.123 82.225 1.00 3.78  51  M 1 
ATOM   756  H  HZ   . PHE M  1 52  ? 145.407 100.591 84.454 1.00 3.78  51  M 1 
ATOM   757  N  N    . ALA M  1 53  ? 139.908 96.025  80.142 1.00 3.65  52  M 1 
ATOM   758  C  CA   . ALA M  1 53  ? 139.238 95.471  78.940 1.00 3.65  52  M 1 
ATOM   759  C  C    . ALA M  1 53  ? 137.855 96.116  78.772 1.00 3.65  52  M 1 
ATOM   760  O  O    . ALA M  1 53  ? 137.594 96.572  77.712 1.00 3.65  52  M 1 
ATOM   761  C  CB   . ALA M  1 53  ? 139.126 93.973  79.054 1.00 3.65  52  M 1 
ATOM   762  H  H    . ALA M  1 53  ? 139.978 95.422  80.819 1.00 3.65  52  M 1 
ATOM   763  H  HA   . ALA M  1 53  ? 139.784 95.690  78.148 1.00 3.65  52  M 1 
ATOM   764  H  HB1  . ALA M  1 53  ? 138.698 93.617  78.257 1.00 3.65  52  M 1 
ATOM   765  H  HB2  . ALA M  1 53  ? 140.013 93.587  79.145 1.00 3.65  52  M 1 
ATOM   766  H  HB3  . ALA M  1 53  ? 138.593 93.746  79.835 1.00 3.65  52  M 1 
ATOM   767  N  N    . LYS M  1 54  ? 137.059 96.217  79.827 1.00 4.07  53  M 1 
ATOM   768  C  CA   . LYS M  1 54  ? 135.720 96.798  79.806 1.00 4.07  53  M 1 
ATOM   769  C  C    . LYS M  1 54  ? 135.766 98.273  79.442 1.00 4.07  53  M 1 
ATOM   770  O  O    . LYS M  1 54  ? 134.953 98.751  78.641 1.00 4.07  53  M 1 
ATOM   771  C  CB   . LYS M  1 54  ? 135.038 96.601  81.160 1.00 4.07  53  M 1 
ATOM   772  C  CG   . LYS M  1 54  ? 134.600 95.184  81.418 1.00 4.07  53  M 1 
ATOM   773  C  CD   . LYS M  1 54  ? 133.912 95.041  82.759 1.00 4.07  53  M 1 
ATOM   774  C  CE   . LYS M  1 54  ? 133.444 93.611  82.976 1.00 4.07  53  M 1 
ATOM   775  N  NZ   . LYS M  1 54  ? 132.778 93.456  84.294 1.00 4.07  53  M 1 
ATOM   776  H  H    . LYS M  1 54  ? 137.302 95.910  80.593 1.00 4.07  53  M 1 
ATOM   777  H  HA   . LYS M  1 54  ? 135.183 96.335  79.144 1.00 4.07  53  M 1 
ATOM   778  H  HB2  . LYS M  1 54  ? 135.659 96.855  81.860 1.00 4.07  53  M 1 
ATOM   779  H  HB3  . LYS M  1 54  ? 134.249 97.163  81.211 1.00 4.07  53  M 1 
ATOM   780  H  HG2  . LYS M  1 54  ? 133.980 94.913  80.723 1.00 4.07  53  M 1 
ATOM   781  H  HG3  . LYS M  1 54  ? 135.371 94.596  81.413 1.00 4.07  53  M 1 
ATOM   782  H  HD2  . LYS M  1 54  ? 134.544 95.254  83.463 1.00 4.07  53  M 1 
ATOM   783  H  HD3  . LYS M  1 54  ? 133.151 95.641  82.799 1.00 4.07  53  M 1 
ATOM   784  H  HE2  . LYS M  1 54  ? 132.810 93.380  82.279 1.00 4.07  53  M 1 
ATOM   785  H  HE3  . LYS M  1 54  ? 134.202 93.006  82.939 1.00 4.07  53  M 1 
ATOM   786  H  HZ1  . LYS M  1 54  ? 132.343 92.681  84.331 1.00 4.07  53  M 1 
ATOM   787  H  HZ2  . LYS M  1 54  ? 133.386 93.475  84.944 1.00 4.07  53  M 1 
ATOM   788  H  HZ3  . LYS M  1 54  ? 132.201 94.122  84.421 1.00 4.07  53  M 1 
ATOM   789  N  N    . TYR M  1 55  ? 136.721 99.003  80.017 1.00 3.64  54  M 1 
ATOM   790  C  CA   . TYR M  1 55  ? 136.889 100.416 79.716 1.00 3.64  54  M 1 
ATOM   791  C  C    . TYR M  1 55  ? 137.089 100.630 78.223 1.00 3.64  54  M 1 
ATOM   792  O  O    . TYR M  1 55  ? 136.367 101.408 77.587 1.00 3.64  54  M 1 
ATOM   793  C  CB   . TYR M  1 55  ? 138.079 100.968 80.500 1.00 3.64  54  M 1 
ATOM   794  C  CG   . TYR M  1 55  ? 138.327 102.435 80.293 1.00 3.64  54  M 1 
ATOM   795  C  CD1  . TYR M  1 55  ? 137.546 103.371 80.930 1.00 3.64  54  M 1 
ATOM   796  C  CD2  . TYR M  1 55  ? 139.335 102.885 79.461 1.00 3.64  54  M 1 
ATOM   797  C  CE1  . TYR M  1 55  ? 137.758 104.712 80.757 1.00 3.64  54  M 1 
ATOM   798  C  CE2  . TYR M  1 55  ? 139.557 104.229 79.278 1.00 3.64  54  M 1 
ATOM   799  C  CZ   . TYR M  1 55  ? 138.761 105.141 79.932 1.00 3.64  54  M 1 
ATOM   800  O  OH   . TYR M  1 55  ? 138.958 106.493 79.769 1.00 3.64  54  M 1 
ATOM   801  H  H    . TYR M  1 55  ? 137.298 98.689  80.572 1.00 3.64  54  M 1 
ATOM   802  H  HA   . TYR M  1 55  ? 136.094 100.896 79.997 1.00 3.64  54  M 1 
ATOM   803  H  HB2  . TYR M  1 55  ? 137.905 100.843 81.446 1.00 3.64  54  M 1 
ATOM   804  H  HB3  . TYR M  1 55  ? 138.884 100.486 80.254 1.00 3.64  54  M 1 
ATOM   805  H  HD1  . TYR M  1 55  ? 136.866 103.082 81.495 1.00 3.64  54  M 1 
ATOM   806  H  HD2  . TYR M  1 55  ? 139.873 102.270 79.017 1.00 3.64  54  M 1 
ATOM   807  H  HE1  . TYR M  1 55  ? 137.219 105.326 81.201 1.00 3.64  54  M 1 
ATOM   808  H  HE2  . TYR M  1 55  ? 140.238 104.516 78.714 1.00 3.64  54  M 1 
ATOM   809  H  HH   . TYR M  1 55  ? 139.605 106.634 79.252 1.00 3.64  54  M 1 
ATOM   810  N  N    . PHE M  1 56  ? 138.045 99.916  77.638 1.00 3.26  55  M 1 
ATOM   811  C  CA   . PHE M  1 56  ? 138.361 100.183 76.241 1.00 3.26  55  M 1 
ATOM   812  C  C    . PHE M  1 56  ? 137.272 99.657  75.307 1.00 3.26  55  M 1 
ATOM   813  O  O    . PHE M  1 56  ? 137.034 100.239 74.247 1.00 3.26  55  M 1 
ATOM   814  C  CB   . PHE M  1 56  ? 139.732 99.626  75.871 1.00 3.26  55  M 1 
ATOM   815  C  CG   . PHE M  1 56  ? 140.876 100.339 76.545 1.00 3.26  55  M 1 
ATOM   816  C  CD1  . PHE M  1 56  ? 141.155 101.654 76.234 1.00 3.26  55  M 1 
ATOM   817  C  CD2  . PHE M  1 56  ? 141.736 99.677  77.390 1.00 3.26  55  M 1 
ATOM   818  C  CE1  . PHE M  1 56  ? 142.198 102.309 76.825 1.00 3.26  55  M 1 
ATOM   819  C  CE2  . PHE M  1 56  ? 142.796 100.338 77.966 1.00 3.26  55  M 1 
ATOM   820  C  CZ   . PHE M  1 56  ? 143.023 101.646 77.678 1.00 3.26  55  M 1 
ATOM   821  H  H    . PHE M  1 56  ? 138.498 99.287  78.010 1.00 3.26  55  M 1 
ATOM   822  H  HA   . PHE M  1 56  ? 138.401 101.145 76.120 1.00 3.26  55  M 1 
ATOM   823  H  HB2  . PHE M  1 56  ? 139.762 98.690  76.124 1.00 3.26  55  M 1 
ATOM   824  H  HB3  . PHE M  1 56  ? 139.856 99.697  74.912 1.00 3.26  55  M 1 
ATOM   825  H  HD1  . PHE M  1 56  ? 140.589 102.126 75.666 1.00 3.26  55  M 1 
ATOM   826  H  HD2  . PHE M  1 56  ? 141.590 98.782  77.595 1.00 3.26  55  M 1 
ATOM   827  H  HE1  . PHE M  1 56  ? 142.360 103.203 76.628 1.00 3.26  55  M 1 
ATOM   828  H  HE2  . PHE M  1 56  ? 143.367 99.891  78.548 1.00 3.26  55  M 1 
ATOM   829  H  HZ   . PHE M  1 56  ? 143.739 102.093 78.069 1.00 3.26  55  M 1 
ATOM   830  N  N    . LEU M  1 57  ? 136.563 98.594  75.692 1.00 3.56  56  M 1 
ATOM   831  C  CA   . LEU M  1 57  ? 135.447 98.132  74.871 1.00 3.56  56  M 1 
ATOM   832  C  C    . LEU M  1 57  ? 134.337 99.173  74.852 1.00 3.56  56  M 1 
ATOM   833  O  O    . LEU M  1 57  ? 133.737 99.449  73.801 1.00 3.56  56  M 1 
ATOM   834  C  CB   . LEU M  1 57  ? 134.908 96.802  75.395 1.00 3.56  56  M 1 
ATOM   835  C  CG   . LEU M  1 57  ? 133.841 96.119  74.535 1.00 3.56  56  M 1 
ATOM   836  C  CD1  . LEU M  1 57  ? 134.418 95.725  73.192 1.00 3.56  56  M 1 
ATOM   837  C  CD2  . LEU M  1 57  ? 133.244 94.918  75.242 1.00 3.56  56  M 1 
ATOM   838  H  H    . LEU M  1 57  ? 136.694 98.147  76.415 1.00 3.56  56  M 1 
ATOM   839  H  HA   . LEU M  1 57  ? 135.769 97.997  73.966 1.00 3.56  56  M 1 
ATOM   840  H  HB2  . LEU M  1 57  ? 135.644 96.179  75.496 1.00 3.56  56  M 1 
ATOM   841  H  HB3  . LEU M  1 57  ? 134.506 96.958  76.264 1.00 3.56  56  M 1 
ATOM   842  H  HG   . LEU M  1 57  ? 133.119 96.743  74.361 1.00 3.56  56  M 1 
ATOM   843  H  HD11 . LEU M  1 57  ? 133.810 95.111  72.751 1.00 3.56  56  M 1 
ATOM   844  H  HD12 . LEU M  1 57  ? 134.521 96.524  72.652 1.00 3.56  56  M 1 
ATOM   845  H  HD13 . LEU M  1 57  ? 135.280 95.300  73.323 1.00 3.56  56  M 1 
ATOM   846  H  HD21 . LEU M  1 57  ? 132.555 94.538  74.675 1.00 3.56  56  M 1 
ATOM   847  H  HD22 . LEU M  1 57  ? 133.937 94.258  75.403 1.00 3.56  56  M 1 
ATOM   848  H  HD23 . LEU M  1 57  ? 132.855 95.206  76.083 1.00 3.56  56  M 1 
ATOM   849  N  N    . HIS M  1 58  ? 134.052 99.759  76.015 1.00 3.86  57  M 1 
ATOM   850  C  CA   . HIS M  1 58  ? 133.085 100.842 76.095 1.00 3.86  57  M 1 
ATOM   851  C  C    . HIS M  1 58  ? 133.498 102.006 75.206 1.00 3.86  57  M 1 
ATOM   852  O  O    . HIS M  1 58  ? 132.668 102.593 74.502 1.00 3.86  57  M 1 
ATOM   853  C  CB   . HIS M  1 58  ? 132.940 101.305 77.539 1.00 3.86  57  M 1 
ATOM   854  C  CG   . HIS M  1 58  ? 131.986 102.439 77.703 1.00 3.86  57  M 1 
ATOM   855  N  ND1  . HIS M  1 58  ? 130.619 102.276 77.663 1.00 3.86  57  M 1 
ATOM   856  C  CD2  . HIS M  1 58  ? 132.202 103.764 77.863 1.00 3.86  57  M 1 
ATOM   857  C  CE1  . HIS M  1 58  ? 130.035 103.449 77.821 1.00 3.86  57  M 1 
ATOM   858  N  NE2  . HIS M  1 58  ? 130.974 104.369 77.942 1.00 3.86  57  M 1 
ATOM   859  H  H    . HIS M  1 58  ? 134.418 99.555  76.766 1.00 3.86  57  M 1 
ATOM   860  H  HA   . HIS M  1 58  ? 132.222 100.514 75.798 1.00 3.86  57  M 1 
ATOM   861  H  HB2  . HIS M  1 58  ? 132.604 100.567 78.072 1.00 3.86  57  M 1 
ATOM   862  H  HB3  . HIS M  1 58  ? 133.803 101.589 77.879 1.00 3.86  57  M 1 
ATOM   863  H  HD2  . HIS M  1 58  ? 133.029 104.185 77.920 1.00 3.86  57  M 1 
ATOM   864  H  HE1  . HIS M  1 58  ? 129.118 103.603 77.835 1.00 3.86  57  M 1 
ATOM   865  H  HE2  . HIS M  1 58  ? 130.840 105.212 78.049 1.00 3.86  57  M 1 
ATOM   866  N  N    . GLN M  1 59  ? 134.786 102.339 75.238 1.00 3.55  58  M 1 
ATOM   867  C  CA   . GLN M  1 59  ? 135.333 103.431 74.394 1.00 3.55  58  M 1 
ATOM   868  C  C    . GLN M  1 59  ? 135.113 103.056 72.914 1.00 3.55  58  M 1 
ATOM   869  O  O    . GLN M  1 59  ? 134.716 103.896 72.159 1.00 3.55  58  M 1 
ATOM   870  C  CB   . GLN M  1 59  ? 136.821 103.672 74.668 1.00 3.55  58  M 1 
ATOM   871  C  CG   . GLN M  1 59  ? 137.147 104.192 76.061 1.00 3.55  58  M 1 
ATOM   872  C  CD   . GLN M  1 59  ? 136.194 105.252 76.544 1.00 3.55  58  M 1 
ATOM   873  O  OE1  . GLN M  1 59  ? 135.612 105.142 77.613 1.00 3.55  58  M 1 
ATOM   874  N  NE2  . GLN M  1 59  ? 136.019 106.291 75.759 1.00 3.55  58  M 1 
ATOM   875  H  H    . GLN M  1 59  ? 135.416 101.843 75.668 1.00 3.55  58  M 1 
ATOM   876  H  HA   . GLN M  1 59  ? 134.834 104.257 74.591 1.00 3.55  58  M 1 
ATOM   877  H  HB2  . GLN M  1 59  ? 137.298 102.828 74.527 1.00 3.55  58  M 1 
ATOM   878  H  HB3  . GLN M  1 59  ? 137.153 104.314 74.006 1.00 3.55  58  M 1 
ATOM   879  H  HG2  . GLN M  1 59  ? 137.133 103.442 76.693 1.00 3.55  58  M 1 
ATOM   880  H  HG3  . GLN M  1 59  ? 138.056 104.561 76.058 1.00 3.55  58  M 1 
ATOM   881  H  HE21 . GLN M  1 59  ? 135.434 106.916 75.978 1.00 3.55  58  M 1 
ATOM   882  H  HE22 . GLN M  1 59  ? 136.486 106.365 75.013 1.00 3.55  58  M 1 
ATOM   883  N  N    . SER M  1 60  ? 135.331 101.813 72.512 1.00 3.24  59  M 1 
ATOM   884  C  CA   . SER M  1 60  ? 135.143 101.390 71.126 1.00 3.24  59  M 1 
ATOM   885  C  C    . SER M  1 60  ? 133.699 101.592 70.690 1.00 3.24  59  M 1 
ATOM   886  O  O    . SER M  1 60  ? 133.420 102.123 69.604 1.00 3.24  59  M 1 
ATOM   887  C  CB   . SER M  1 60  ? 135.541 99.924  70.959 1.00 3.24  59  M 1 
ATOM   888  O  OG   . SER M  1 60  ? 135.301 99.505  69.637 1.00 3.24  59  M 1 
ATOM   889  H  H    . SER M  1 60  ? 135.602 101.192 73.042 1.00 3.24  59  M 1 
ATOM   890  H  HA   . SER M  1 60  ? 135.722 101.916 70.552 1.00 3.24  59  M 1 
ATOM   891  H  HB2  . SER M  1 60  ? 136.482 99.810  71.163 1.00 3.24  59  M 1 
ATOM   892  H  HB3  . SER M  1 60  ? 135.013 99.373  71.558 1.00 3.24  59  M 1 
ATOM   893  H  HG   . SER M  1 60  ? 136.017 99.537  69.199 1.00 3.24  59  M 1 
ATOM   894  N  N    . HIS M  1 61  ? 132.766 101.182 71.545 1.00 3.61  60  M 1 
ATOM   895  C  CA   . HIS M  1 61  ? 131.351 101.333 71.224 1.00 3.61  60  M 1 
ATOM   896  C  C    . HIS M  1 61  ? 130.969 102.807 71.111 1.00 3.61  60  M 1 
ATOM   897  O  O    . HIS M  1 61  ? 130.209 103.194 70.212 1.00 3.61  60  M 1 
ATOM   898  C  CB   . HIS M  1 61  ? 130.503 100.619 72.274 1.00 3.61  60  M 1 
ATOM   899  C  CG   . HIS M  1 61  ? 130.658 99.131  72.259 1.00 3.61  60  M 1 
ATOM   900  N  ND1  . HIS M  1 61  ? 130.123 98.316  73.233 1.00 3.61  60  M 1 
ATOM   901  C  CD2  . HIS M  1 61  ? 131.295 98.310  71.392 1.00 3.61  60  M 1 
ATOM   902  C  CE1  . HIS M  1 61  ? 130.422 97.058  72.962 1.00 3.61  60  M 1 
ATOM   903  N  NE2  . HIS M  1 61  ? 131.131 97.028  71.850 1.00 3.61  60  M 1 
ATOM   904  H  H    . HIS M  1 61  ? 132.932 100.839 72.316 1.00 3.61  60  M 1 
ATOM   905  H  HA   . HIS M  1 61  ? 131.177 100.924 70.362 1.00 3.61  60  M 1 
ATOM   906  H  HB2  . HIS M  1 61  ? 130.749 100.941 73.155 1.00 3.61  60  M 1 
ATOM   907  H  HB3  . HIS M  1 61  ? 129.567 100.820 72.116 1.00 3.61  60  M 1 
ATOM   908  H  HD2  . HIS M  1 61  ? 131.758 98.559  70.625 1.00 3.61  60  M 1 
ATOM   909  H  HE1  . HIS M  1 61  ? 130.179 96.315  73.466 1.00 3.61  60  M 1 
ATOM   910  H  HE2  . HIS M  1 61  ? 131.444 96.322  71.471 1.00 3.61  60  M 1 
ATOM   911  N  N    . GLU M  1 62  ? 131.505 103.647 71.997 1.00 3.84  61  M 1 
ATOM   912  C  CA   . GLU M  1 62  ? 131.212 105.075 71.925 1.00 3.84  61  M 1 
ATOM   913  C  C    . GLU M  1 62  ? 131.729 105.689 70.628 1.00 3.84  61  M 1 
ATOM   914  O  O    . GLU M  1 62  ? 131.069 106.546 70.032 1.00 3.84  61  M 1 
ATOM   915  C  CB   . GLU M  1 62  ? 131.806 105.801 73.132 1.00 3.84  61  M 1 
ATOM   916  C  CG   . GLU M  1 62  ? 131.117 105.507 74.458 1.00 3.84  61  M 1 
ATOM   917  C  CD   . GLU M  1 62  ? 129.702 106.056 74.531 1.00 3.84  61  M 1 
ATOM   918  O  OE1  . GLU M  1 62  ? 129.434 107.105 73.910 1.00 3.84  61  M 1 
ATOM   919  O  OE2  . GLU M  1 62  ? 128.856 105.440 75.213 1.00 3.84  61  M 1 
ATOM   920  H  H    . GLU M  1 62  ? 132.043 103.424 72.630 1.00 3.84  61  M 1 
ATOM   921  H  HA   . GLU M  1 62  ? 130.249 105.187 71.946 1.00 3.84  61  M 1 
ATOM   922  H  HB2  . GLU M  1 62  ? 132.737 105.543 73.223 1.00 3.84  61  M 1 
ATOM   923  H  HB3  . GLU M  1 62  ? 131.758 106.757 72.975 1.00 3.84  61  M 1 
ATOM   924  H  HG2  . GLU M  1 62  ? 131.068 104.548 74.594 1.00 3.84  61  M 1 
ATOM   925  H  HG3  . GLU M  1 62  ? 131.631 105.913 75.173 1.00 3.84  61  M 1 
ATOM   926  N  N    . GLU M  1 63  ? 132.904 105.264 70.167 1.00 3.87  62  M 1 
ATOM   927  C  CA   . GLU M  1 63  ? 133.445 105.837 68.937 1.00 3.87  62  M 1 
ATOM   928  C  C    . GLU M  1 63  ? 132.639 105.379 67.724 1.00 3.87  62  M 1 
ATOM   929  O  O    . GLU M  1 63  ? 132.447 106.143 66.768 1.00 3.87  62  M 1 
ATOM   930  C  CB   . GLU M  1 63  ? 134.923 105.479 68.779 1.00 3.87  62  M 1 
ATOM   931  C  CG   . GLU M  1 63  ? 135.854 106.022 69.867 1.00 3.87  62  M 1 
ATOM   932  C  CD   . GLU M  1 63  ? 135.896 107.537 69.978 1.00 3.87  62  M 1 
ATOM   933  O  OE1  . GLU M  1 63  ? 135.774 108.240 68.963 1.00 3.87  62  M 1 
ATOM   934  O  OE2  . GLU M  1 63  ? 136.035 108.032 71.115 1.00 3.87  62  M 1 
ATOM   935  H  H    . GLU M  1 63  ? 133.388 104.654 70.533 1.00 3.87  62  M 1 
ATOM   936  H  HA   . GLU M  1 63  ? 133.379 106.804 68.981 1.00 3.87  62  M 1 
ATOM   937  H  HB2  . GLU M  1 63  ? 135.006 104.513 68.804 1.00 3.87  62  M 1 
ATOM   938  H  HB3  . GLU M  1 63  ? 135.238 105.797 67.919 1.00 3.87  62  M 1 
ATOM   939  H  HG2  . GLU M  1 63  ? 135.596 105.675 70.735 1.00 3.87  62  M 1 
ATOM   940  H  HG3  . GLU M  1 63  ? 136.753 105.720 69.663 1.00 3.87  62  M 1 
ATOM   941  N  N    . ARG M  1 64  ? 132.101 104.161 67.796 1.00 3.76  63  M 1 
ATOM   942  C  CA   . ARG M  1 64  ? 131.222 103.585 66.708 1.00 3.76  63  M 1 
ATOM   943  C  C    . ARG M  1 64  ? 129.982 104.548 66.721 1.00 3.76  63  M 1 
ATOM   944  O  O    . ARG M  1 64  ? 129.586 104.978 65.656 1.00 3.76  63  M 1 
ATOM   945  C  CB   . ARG M  1 64  ? 130.958 102.003 66.808 0.50 3.76  63  M 1 
ATOM   946  C  CG   . ARG M  1 64  ? 129.868 101.512 65.865 0.50 3.76  63  M 1 
ATOM   947  C  CD   . ARG M  1 64  ? 130.261 101.575 64.397 0.50 3.76  63  M 1 
ATOM   948  N  NE   . ARG M  1 64  ? 130.583 100.261 63.843 0.50 3.76  63  M 1 
ATOM   949  C  CZ   . ARG M  1 64  ? 129.698 99.402  63.345 0.50 3.76  63  M 1 
ATOM   950  N  NH1  . ARG M  1 64  ? 130.106 98.233  62.883 0.50 3.76  63  M 1 
ATOM   951  N  NH2  . ARG M  1 64  ? 128.413 99.701  63.309 0.50 3.76  63  M 1 
ATOM   952  H  H    . ARG M  1 64  ? 132.146 103.647 68.546 1.00 3.76  63  M 1 
ATOM   953  H  HA   . ARG M  1 64  ? 131.743 103.924 65.813 1.00 3.76  63  M 1 
ATOM   954  H  HB2  . ARG M  1 64  ? 131.792 101.531 66.603 0.50 3.76  63  M 1 
ATOM   955  H  HB3  . ARG M  1 64  ? 130.704 101.784 67.729 0.50 3.76  63  M 1 
ATOM   956  H  HG2  . ARG M  1 64  ? 129.643 100.585 66.092 0.50 3.76  63  M 1 
ATOM   957  H  HG3  . ARG M  1 64  ? 129.062 102.055 65.999 0.50 3.76  63  M 1 
ATOM   958  H  HD2  . ARG M  1 64  ? 129.523 101.967 63.883 0.50 3.76  63  M 1 
ATOM   959  H  HD3  . ARG M  1 64  ? 131.040 102.163 64.298 0.50 3.76  63  M 1 
ATOM   960  H  HE   . ARG M  1 64  ? 131.419 100.014 63.850 0.50 3.76  63  M 1 
ATOM   961  H  HH11 . ARG M  1 64  ? 130.961 98.028  62.902 0.50 3.76  63  M 1 
ATOM   962  H  HH12 . ARG M  1 64  ? 129.522 97.667  62.549 0.50 3.76  63  M 1 
ATOM   963  H  HH21 . ARG M  1 64  ? 128.135 100.477 63.619 0.50 3.76  63  M 1 
ATOM   964  H  HH22 . ARG M  1 64  ? 127.838 99.124  62.975 0.50 3.76  63  M 1 
ATOM   965  N  N    . GLU M  1 65  ? 129.447 104.893 67.887 1.00 4.14  64  M 1 
ATOM   966  C  CA   . GLU M  1 65  ? 128.292 105.783 67.961 1.00 4.14  64  M 1 
ATOM   967  C  C    . GLU M  1 65  ? 128.612 107.153 67.371 1.00 4.14  64  M 1 
ATOM   968  O  O    . GLU M  1 65  ? 127.777 107.746 66.678 1.00 4.14  64  M 1 
ATOM   969  C  CB   . GLU M  1 65  ? 127.806 105.917 69.404 1.00 4.14  64  M 1 
ATOM   970  C  CG   . GLU M  1 65  ? 127.215 104.648 70.011 1.00 4.14  64  M 1 
ATOM   971  C  CD   . GLU M  1 65  ? 126.815 104.819 71.470 1.00 4.14  64  M 1 
ATOM   972  O  OE1  . GLU M  1 65  ? 127.167 105.858 72.067 1.00 4.14  64  M 1 
ATOM   973  O  OE2  . GLU M  1 65  ? 126.168 103.907 72.026 1.00 4.14  64  M 1 
ATOM   974  H  H    . GLU M  1 65  ? 129.750 104.624 68.646 1.00 4.14  64  M 1 
ATOM   975  H  HA   . GLU M  1 65  ? 127.573 105.393 67.440 1.00 4.14  64  M 1 
ATOM   976  H  HB2  . GLU M  1 65  ? 128.554 106.187 69.959 1.00 4.14  64  M 1 
ATOM   977  H  HB3  . GLU M  1 65  ? 127.121 106.603 69.441 1.00 4.14  64  M 1 
ATOM   978  H  HG2  . GLU M  1 65  ? 126.423 104.393 69.514 1.00 4.14  64  M 1 
ATOM   979  H  HG3  . GLU M  1 65  ? 127.878 103.941 69.968 1.00 4.14  64  M 1 
ATOM   980  N  N    . HIS M  1 66  ? 129.829 107.640 67.616 1.00 4.22  65  M 1 
ATOM   981  C  CA   . HIS M  1 66  ? 130.308 108.938 67.079 1.00 4.22  65  M 1 
ATOM   982  C  C    . HIS M  1 66  ? 130.290 108.866 65.548 1.00 4.22  65  M 1 
ATOM   983  O  O    . HIS M  1 66  ? 129.822 109.783 64.939 1.00 4.22  65  M 1 
ATOM   984  C  CB   . HIS M  1 66  ? 131.713 109.301 67.587 1.00 4.22  65  M 1 
ATOM   985  C  CG   . HIS M  1 66  ? 131.792 109.546 69.053 1.00 4.22  65  M 1 
ATOM   986  N  ND1  . HIS M  1 66  ? 133.003 109.665 69.722 1.00 4.22  65  M 1 
ATOM   987  C  CD2  . HIS M  1 66  ? 130.831 109.635 69.993 1.00 4.22  65  M 1 
ATOM   988  C  CE1  . HIS M  1 66  ? 132.776 109.838 71.000 1.00 4.22  65  M 1 
ATOM   989  N  NE2  . HIS M  1 66  ? 131.461 109.838 71.198 1.00 4.22  65  M 1 
ATOM   990  H  H    . HIS M  1 66  ? 130.452 107.215 68.128 1.00 4.22  65  M 1 
ATOM   991  H  HA   . HIS M  1 66  ? 129.676 109.640 67.364 1.00 4.22  65  M 1 
ATOM   992  H  HB2  . HIS M  1 66  ? 132.330 108.571 67.356 1.00 4.22  65  M 1 
ATOM   993  H  HB3  . HIS M  1 66  ? 132.020 110.107 67.116 1.00 4.22  65  M 1 
ATOM   994  H  HD2  . HIS M  1 66  ? 129.904 109.592 69.854 1.00 4.22  65  M 1 
ATOM   995  H  HE1  . HIS M  1 66  ? 133.434 109.962 71.662 1.00 4.22  65  M 1 
ATOM   996  H  HE2  . HIS M  1 66  ? 131.063 109.939 71.973 1.00 4.22  65  M 1 
ATOM   997  N  N    . ALA M  1 67  ? 130.747 107.775 64.950 1.00 3.84  66  M 1 
ATOM   998  C  CA   . ALA M  1 67  ? 130.771 107.598 63.501 1.00 3.84  66  M 1 
ATOM   999  C  C    . ALA M  1 67  ? 129.362 107.575 62.928 1.00 3.84  66  M 1 
ATOM   1000 O  O    . ALA M  1 67  ? 129.078 108.216 61.908 1.00 3.84  66  M 1 
ATOM   1001 C  CB   . ALA M  1 67  ? 131.504 106.307 63.143 1.00 3.84  66  M 1 
ATOM   1002 H  H    . ALA M  1 67  ? 131.105 107.131 65.393 1.00 3.84  66  M 1 
ATOM   1003 H  HA   . ALA M  1 67  ? 131.257 108.336 63.100 1.00 3.84  66  M 1 
ATOM   1004 H  HB1  . ALA M  1 67  ? 131.443 106.159 62.186 1.00 3.84  66  M 1 
ATOM   1005 H  HB2  . ALA M  1 67  ? 132.433 106.374 63.413 1.00 3.84  66  M 1 
ATOM   1006 H  HB3  . ALA M  1 67  ? 131.087 105.565 63.608 1.00 3.84  66  M 1 
ATOM   1007 N  N    . GLU M  1 68  ? 128.465 106.843 63.583 1.00 4.02  67  M 1 
ATOM   1008 C  CA   . GLU M  1 68  ? 127.104 106.708 63.080 1.00 4.02  67  M 1 
ATOM   1009 C  C    . GLU M  1 68  ? 126.361 108.039 63.154 1.00 4.02  67  M 1 
ATOM   1010 O  O    . GLU M  1 68  ? 125.551 108.363 62.274 1.00 4.02  67  M 1 
ATOM   1011 C  CB   . GLU M  1 68  ? 126.385 105.614 63.868 1.00 4.02  67  M 1 
ATOM   1012 C  CG   . GLU M  1 68  ? 126.941 104.210 63.617 1.00 4.02  67  M 1 
ATOM   1013 C  CD   . GLU M  1 68  ? 126.280 103.138 64.473 1.00 4.02  67  M 1 
ATOM   1014 O  OE1  . GLU M  1 68  ? 125.463 103.483 65.352 1.00 4.02  67  M 1 
ATOM   1015 O  OE2  . GLU M  1 68  ? 126.596 101.946 64.273 1.00 4.02  67  M 1 
ATOM   1016 H  H    . GLU M  1 68  ? 128.615 106.433 64.324 1.00 4.02  67  M 1 
ATOM   1017 H  HA   . GLU M  1 68  ? 127.136 106.429 62.152 1.00 4.02  67  M 1 
ATOM   1018 H  HB2  . GLU M  1 68  ? 126.479 105.804 64.815 1.00 4.02  67  M 1 
ATOM   1019 H  HB3  . GLU M  1 68  ? 125.445 105.608 63.630 1.00 4.02  67  M 1 
ATOM   1020 H  HG2  . GLU M  1 68  ? 126.785 103.976 62.689 1.00 4.02  67  M 1 
ATOM   1021 H  HG3  . GLU M  1 68  ? 127.896 104.193 63.787 1.00 4.02  67  M 1 
ATOM   1022 N  N    . LYS M  1 69  ? 126.644 108.836 64.186 1.00 4.51  68  M 1 
ATOM   1023 C  CA   . LYS M  1 69  ? 126.058 110.167 64.286 1.00 4.51  68  M 1 
ATOM   1024 C  C    . LYS M  1 69  ? 126.543 111.060 63.145 1.00 4.51  68  M 1 
ATOM   1025 O  O    . LYS M  1 69  ? 125.765 111.831 62.573 1.00 4.51  68  M 1 
ATOM   1026 C  CB   . LYS M  1 69  ? 126.392 110.761 65.656 1.00 4.51  68  M 1 
ATOM   1027 C  CG   . LYS M  1 69  ? 125.744 112.081 65.984 1.00 4.51  68  M 1 
ATOM   1028 C  CD   . LYS M  1 69  ? 126.140 112.584 67.379 1.00 4.51  68  M 1 
ATOM   1029 C  CE   . LYS M  1 69  ? 125.446 111.817 68.486 1.00 4.51  68  M 1 
ATOM   1030 N  NZ   . LYS M  1 69  ? 125.760 112.374 69.836 1.00 4.51  68  M 1 
ATOM   1031 H  H    . LYS M  1 69  ? 127.178 108.638 64.831 1.00 4.51  68  M 1 
ATOM   1032 H  HA   . LYS M  1 69  ? 125.092 110.102 64.227 1.00 4.51  68  M 1 
ATOM   1033 H  HB2  . LYS M  1 69  ? 126.106 110.132 66.337 1.00 4.51  68  M 1 
ATOM   1034 H  HB3  . LYS M  1 69  ? 127.353 110.884 65.706 1.00 4.51  68  M 1 
ATOM   1035 H  HG2  . LYS M  1 69  ? 126.054 112.738 65.342 1.00 4.51  68  M 1 
ATOM   1036 H  HG3  . LYS M  1 69  ? 124.779 111.993 65.944 1.00 4.51  68  M 1 
ATOM   1037 H  HD2  . LYS M  1 69  ? 127.097 112.483 67.503 1.00 4.51  68  M 1 
ATOM   1038 H  HD3  . LYS M  1 69  ? 125.887 113.517 67.465 1.00 4.51  68  M 1 
ATOM   1039 H  HE2  . LYS M  1 69  ? 124.487 111.865 68.351 1.00 4.51  68  M 1 
ATOM   1040 H  HE3  . LYS M  1 69  ? 125.737 110.892 68.471 1.00 4.51  68  M 1 
ATOM   1041 H  HZ1  . LYS M  1 69  ? 126.614 112.223 70.038 1.00 4.51  68  M 1 
ATOM   1042 H  HZ2  . LYS M  1 69  ? 125.615 113.252 69.847 1.00 4.51  68  M 1 
ATOM   1043 H  HZ3  . LYS M  1 69  ? 125.247 111.989 70.453 1.00 4.51  68  M 1 
ATOM   1044 N  N    . LEU M  1 70  ? 127.821 110.946 62.778 1.00 4.14  69  M 1 
ATOM   1045 C  CA   . LEU M  1 70  ? 128.312 111.688 61.615 1.00 4.14  69  M 1 
ATOM   1046 C  C    . LEU M  1 70  ? 127.628 111.240 60.328 1.00 4.14  69  M 1 
ATOM   1047 O  O    . LEU M  1 70  ? 127.352 112.060 59.446 1.00 4.14  69  M 1 
ATOM   1048 C  CB   . LEU M  1 70  ? 129.824 111.540 61.473 1.00 4.14  69  M 1 
ATOM   1049 C  CG   . LEU M  1 70  ? 130.714 112.224 62.508 1.00 4.14  69  M 1 
ATOM   1050 C  CD1  . LEU M  1 70  ? 132.178 111.871 62.320 1.00 4.14  69  M 1 
ATOM   1051 C  CD2  . LEU M  1 70  ? 130.530 113.726 62.481 1.00 4.14  69  M 1 
ATOM   1052 H  H    . LEU M  1 70  ? 128.408 110.456 63.170 1.00 4.14  69  M 1 
ATOM   1053 H  HA   . LEU M  1 70  ? 128.095 112.626 61.732 1.00 4.14  69  M 1 
ATOM   1054 H  HB2  . LEU M  1 70  ? 130.029 110.592 61.501 1.00 4.14  69  M 1 
ATOM   1055 H  HB3  . LEU M  1 70  ? 130.074 111.883 60.601 1.00 4.14  69  M 1 
ATOM   1056 H  HG   . LEU M  1 70  ? 130.458 111.911 63.390 1.00 4.14  69  M 1 
ATOM   1057 H  HD11 . LEU M  1 70  ? 132.659 112.176 63.105 1.00 4.14  69  M 1 
ATOM   1058 H  HD12 . LEU M  1 70  ? 132.281 110.911 62.229 1.00 4.14  69  M 1 
ATOM   1059 H  HD13 . LEU M  1 70  ? 132.517 112.314 61.527 1.00 4.14  69  M 1 
ATOM   1060 H  HD21 . LEU M  1 70  ? 131.231 114.137 63.010 1.00 4.14  69  M 1 
ATOM   1061 H  HD22 . LEU M  1 70  ? 130.577 114.045 61.566 1.00 4.14  69  M 1 
ATOM   1062 H  HD23 . LEU M  1 70  ? 129.667 113.945 62.865 1.00 4.14  69  M 1 
ATOM   1063 N  N    . MET M  1 71  ? 127.364 109.948 60.208 1.00 4.44  70  M 1 
ATOM   1064 C  CA   . MET M  1 71  ? 126.697 109.405 59.001 1.00 4.44  70  M 1 
ATOM   1065 C  C    . MET M  1 71  ? 125.291 110.001 58.920 1.00 4.44  70  M 1 
ATOM   1066 O  O    . MET M  1 71  ? 124.905 110.440 57.849 1.00 4.44  70  M 1 
ATOM   1067 C  CB   . MET M  1 71  ? 126.674 107.880 59.051 1.00 4.44  70  M 1 
ATOM   1068 C  CG   . MET M  1 71  ? 128.068 107.310 58.992 1.00 4.44  70  M 1 
ATOM   1069 S  SD   . MET M  1 71  ? 128.013 105.515 59.092 1.00 4.44  70  M 1 
ATOM   1070 C  CE   . MET M  1 71  ? 129.764 105.161 59.006 1.00 4.44  70  M 1 
ATOM   1071 H  H    . MET M  1 71  ? 127.457 109.354 60.890 1.00 4.44  70  M 1 
ATOM   1072 H  HA   . MET M  1 71  ? 127.206 109.698 58.210 1.00 4.44  70  M 1 
ATOM   1073 H  HB2  . MET M  1 71  ? 126.238 107.593 59.878 1.00 4.44  70  M 1 
ATOM   1074 H  HB3  . MET M  1 71  ? 126.151 107.542 58.297 1.00 4.44  70  M 1 
ATOM   1075 H  HG2  . MET M  1 71  ? 128.499 107.576 58.152 1.00 4.44  70  M 1 
ATOM   1076 H  HG3  . MET M  1 71  ? 128.600 107.661 59.738 1.00 4.44  70  M 1 
ATOM   1077 H  HE1  . MET M  1 71  ? 129.900 104.207 59.039 1.00 4.44  70  M 1 
ATOM   1078 H  HE2  . MET M  1 71  ? 130.121 105.509 58.180 1.00 4.44  70  M 1 
ATOM   1079 H  HE3  . MET M  1 71  ? 130.213 105.578 59.752 1.00 4.44  70  M 1 
ATOM   1080 N  N    . LYS M  1 72  ? 124.578 110.039 60.037 1.00 5.09  71  M 1 
ATOM   1081 C  CA   . LYS M  1 72  ? 123.268 110.672 60.109 1.00 5.09  71  M 1 
ATOM   1082 C  C    . LYS M  1 72  ? 123.349 112.134 59.697 1.00 5.09  71  M 1 
ATOM   1083 O  O    . LYS M  1 72  ? 122.508 112.617 58.933 1.00 5.09  71  M 1 
ATOM   1084 C  CB   . LYS M  1 72  ? 122.703 110.527 61.522 1.00 5.09  71  M 1 
ATOM   1085 C  CG   . LYS M  1 72  ? 121.325 111.109 61.739 1.00 5.09  71  M 1 
ATOM   1086 C  CD   . LYS M  1 72  ? 120.796 110.746 63.129 1.00 5.09  71  M 1 
ATOM   1087 C  CE   . LYS M  1 72  ? 119.462 111.406 63.437 1.00 5.09  71  M 1 
ATOM   1088 N  NZ   . LYS M  1 72  ? 118.368 110.935 62.544 1.00 5.09  71  M 1 
ATOM   1089 H  H    . LYS M  1 72  ? 124.846 109.694 60.777 1.00 5.09  71  M 1 
ATOM   1090 H  HA   . LYS M  1 72  ? 122.666 110.214 59.501 1.00 5.09  71  M 1 
ATOM   1091 H  HB2  . LYS M  1 72  ? 122.640 109.582 61.732 1.00 5.09  71  M 1 
ATOM   1092 H  HB3  . LYS M  1 72  ? 123.310 110.959 62.144 1.00 5.09  71  M 1 
ATOM   1093 H  HG2  . LYS M  1 72  ? 121.371 112.076 61.677 1.00 5.09  71  M 1 
ATOM   1094 H  HG3  . LYS M  1 72  ? 120.720 110.757 61.068 1.00 5.09  71  M 1 
ATOM   1095 H  HD2  . LYS M  1 72  ? 120.682 109.785 63.191 1.00 5.09  71  M 1 
ATOM   1096 H  HD3  . LYS M  1 72  ? 121.431 111.046 63.798 1.00 5.09  71  M 1 
ATOM   1097 H  HE2  . LYS M  1 72  ? 119.208 111.187 64.347 1.00 5.09  71  M 1 
ATOM   1098 H  HE3  . LYS M  1 72  ? 119.546 112.368 63.342 1.00 5.09  71  M 1 
ATOM   1099 H  HZ1  . LYS M  1 72  ? 117.580 111.187 62.871 1.00 5.09  71  M 1 
ATOM   1100 H  HZ2  . LYS M  1 72  ? 118.464 111.284 61.731 1.00 5.09  71  M 1 
ATOM   1101 H  HZ3  . LYS M  1 72  ? 118.388 110.047 62.481 1.00 5.09  71  M 1 
ATOM   1102 N  N    . LEU M  1 73  ? 124.372 112.846 60.176 1.00 4.70  72  M 1 
ATOM   1103 C  CA   . LEU M  1 73  ? 124.575 114.232 59.765 1.00 4.70  72  M 1 
ATOM   1104 C  C    . LEU M  1 73  ? 124.735 114.343 58.257 1.00 4.70  72  M 1 
ATOM   1105 O  O    . LEU M  1 73  ? 124.121 115.210 57.626 1.00 4.70  72  M 1 
ATOM   1106 C  CB   . LEU M  1 73  ? 125.792 114.820 60.486 1.00 4.70  72  M 1 
ATOM   1107 C  CG   . LEU M  1 73  ? 126.197 116.293 60.314 1.00 4.70  72  M 1 
ATOM   1108 C  CD1  . LEU M  1 73  ? 126.895 116.563 58.993 1.00 4.70  72  M 1 
ATOM   1109 C  CD2  . LEU M  1 73  ? 125.020 117.220 60.465 1.00 4.70  72  M 1 
ATOM   1110 H  H    . LEU M  1 73  ? 124.966 112.543 60.719 1.00 4.70  72  M 1 
ATOM   1111 H  HA   . LEU M  1 73  ? 123.795 114.747 60.024 1.00 4.70  72  M 1 
ATOM   1112 H  HB2  . LEU M  1 73  ? 125.621 114.717 61.435 1.00 4.70  72  M 1 
ATOM   1113 H  HB3  . LEU M  1 73  ? 126.570 114.287 60.259 1.00 4.70  72  M 1 
ATOM   1114 H  HG   . LEU M  1 73  ? 126.833 116.516 61.011 1.00 4.70  72  M 1 
ATOM   1115 H  HD11 . LEU M  1 73  ? 127.419 117.376 59.068 1.00 4.70  72  M 1 
ATOM   1116 H  HD12 . LEU M  1 73  ? 127.480 115.818 58.782 1.00 4.70  72  M 1 
ATOM   1117 H  HD13 . LEU M  1 73  ? 126.229 116.668 58.295 1.00 4.70  72  M 1 
ATOM   1118 H  HD21 . LEU M  1 73  ? 125.345 118.132 60.408 1.00 4.70  72  M 1 
ATOM   1119 H  HD22 . LEU M  1 73  ? 124.387 117.048 59.750 1.00 4.70  72  M 1 
ATOM   1120 H  HD23 . LEU M  1 73  ? 124.600 117.070 61.327 1.00 4.70  72  M 1 
ATOM   1121 N  N    . GLN M  1 74  ? 125.569 113.483 57.671 1.00 4.76  73  M 1 
ATOM   1122 C  CA   . GLN M  1 74  ? 125.839 113.540 56.238 1.00 4.76  73  M 1 
ATOM   1123 C  C    . GLN M  1 74  ? 124.544 113.406 55.449 1.00 4.76  73  M 1 
ATOM   1124 O  O    . GLN M  1 74  ? 124.287 114.173 54.515 1.00 4.76  73  M 1 
ATOM   1125 C  CB   . GLN M  1 74  ? 126.819 112.433 55.835 1.00 4.76  73  M 1 
ATOM   1126 C  CG   . GLN M  1 74  ? 127.295 112.530 54.401 1.00 4.76  73  M 1 
ATOM   1127 C  CD   . GLN M  1 74  ? 128.249 113.676 54.194 1.00 4.76  73  M 1 
ATOM   1128 O  OE1  . GLN M  1 74  ? 127.849 114.775 53.838 1.00 4.76  73  M 1 
ATOM   1129 N  NE2  . GLN M  1 74  ? 129.532 113.391 54.310 1.00 4.76  73  M 1 
ATOM   1130 H  H    . GLN M  1 74  ? 125.987 112.851 58.078 1.00 4.76  73  M 1 
ATOM   1131 H  HA   . GLN M  1 74  ? 126.241 114.394 56.014 1.00 4.76  73  M 1 
ATOM   1132 H  HB2  . GLN M  1 74  ? 127.609 112.511 56.392 1.00 4.76  73  M 1 
ATOM   1133 H  HB3  . GLN M  1 74  ? 126.415 111.560 55.961 1.00 4.76  73  M 1 
ATOM   1134 H  HG2  . GLN M  1 74  ? 127.762 111.711 54.171 1.00 4.76  73  M 1 
ATOM   1135 H  HG3  . GLN M  1 74  ? 126.548 112.649 53.793 1.00 4.76  73  M 1 
ATOM   1136 H  HE21 . GLN M  1 74  ? 129.777 112.597 54.532 1.00 4.76  73  M 1 
ATOM   1137 H  HE22 . GLN M  1 74  ? 130.123 114.002 54.182 1.00 4.76  73  M 1 
ATOM   1138 N  N    . ASN M  1 75  ? 123.737 112.412 55.802 1.00 4.47  74  M 1 
ATOM   1139 C  CA   . ASN M  1 75  ? 122.429 112.141 55.138 1.00 4.47  74  M 1 
ATOM   1140 C  C    . ASN M  1 75  ? 121.453 113.301 55.386 1.00 4.47  74  M 1 
ATOM   1141 O  O    . ASN M  1 75  ? 120.756 113.695 54.470 1.00 4.47  74  M 1 
ATOM   1142 C  CB   . ASN M  1 75  ? 121.854 110.804 55.586 1.00 4.47  74  M 1 
ATOM   1143 C  CG   . ASN M  1 75  ? 122.406 109.660 54.764 1.00 4.47  74  M 1 
ATOM   1144 O  OD1  . ASN M  1 75  ? 122.981 109.885 53.713 1.00 4.47  74  M 1 
ATOM   1145 N  ND2  . ASN M  1 75  ? 122.233 108.443 55.235 1.00 4.47  74  M 1 
ATOM   1146 H  H    . ASN M  1 75  ? 123.885 111.904 56.543 1.00 4.47  74  M 1 
ATOM   1147 H  HA   . ASN M  1 75  ? 122.592 112.080 54.168 1.00 4.47  74  M 1 
ATOM   1148 H  HB2  . ASN M  1 75  ? 122.072 110.660 56.529 1.00 4.47  74  M 1 
ATOM   1149 H  HB3  . ASN M  1 75  ? 120.879 110.827 55.495 1.00 4.47  74  M 1 
ATOM   1150 H  HD21 . ASN M  1 75  ? 121.801 108.321 55.996 1.00 4.47  74  M 1 
ATOM   1151 H  HD22 . ASN M  1 75  ? 122.549 107.747 54.790 1.00 4.47  74  M 1 
ATOM   1152 N  N    . GLN M  1 76  ? 121.463 113.847 56.588 1.00 5.04  75  M 1 
ATOM   1153 C  CA   . GLN M  1 76  ? 120.581 114.983 56.952 1.00 5.04  75  M 1 
ATOM   1154 C  C    . GLN M  1 76  ? 120.881 116.181 56.044 1.00 5.04  75  M 1 
ATOM   1155 O  O    . GLN M  1 76  ? 119.961 116.839 55.678 1.00 5.04  75  M 1 
ATOM   1156 C  CB   . GLN M  1 76  ? 120.835 115.462 58.374 1.00 5.04  75  M 1 
ATOM   1157 C  CG   . GLN M  1 76  ? 119.945 114.854 59.435 1.00 5.04  75  M 1 
ATOM   1158 C  CD   . GLN M  1 76  ? 119.808 115.830 60.585 1.00 5.04  75  M 1 
ATOM   1159 O  OE1  . GLN M  1 76  ? 118.777 115.913 61.234 1.00 5.04  75  M 1 
ATOM   1160 N  NE2  . GLN M  1 76  ? 120.836 116.632 60.800 1.00 5.04  75  M 1 
ATOM   1161 H  H    . GLN M  1 76  ? 122.100 113.657 57.209 1.00 5.04  75  M 1 
ATOM   1162 H  HA   . GLN M  1 76  ? 119.639 114.714 56.850 1.00 5.04  75  M 1 
ATOM   1163 H  HB2  . GLN M  1 76  ? 121.769 115.267 58.599 1.00 5.04  75  M 1 
ATOM   1164 H  HB3  . GLN M  1 76  ? 120.725 116.436 58.392 1.00 5.04  75  M 1 
ATOM   1165 H  HG2  . GLN M  1 76  ? 119.060 114.661 59.057 1.00 5.04  75  M 1 
ATOM   1166 H  HG3  . GLN M  1 76  ? 120.336 114.015 59.757 1.00 5.04  75  M 1 
ATOM   1167 H  HE21 . GLN M  1 76  ? 121.177 117.105 60.136 1.00 5.04  75  M 1 
ATOM   1168 H  HE22 . GLN M  1 76  ? 121.175 116.708 61.613 1.00 5.04  75  M 1 
ATOM   1169 N  N    . ARG M  1 77  ? 122.137 116.447 55.723 1.00 5.21  76  M 1 
ATOM   1170 C  CA   . ARG M  1 77  ? 122.556 117.638 54.929 1.00 5.21  76  M 1 
ATOM   1171 C  C    . ARG M  1 77  ? 122.537 117.372 53.405 1.00 5.21  76  M 1 
ATOM   1172 O  O    . ARG M  1 77  ? 122.838 118.277 52.658 1.00 5.21  76  M 1 
ATOM   1173 C  CB   . ARG M  1 77  ? 123.908 118.130 55.452 1.00 5.21  76  M 1 
ATOM   1174 C  CG   . ARG M  1 77  ? 123.873 118.631 56.893 1.00 5.21  76  M 1 
ATOM   1175 C  CD   . ARG M  1 77  ? 122.925 119.810 57.098 1.00 5.21  76  M 1 
ATOM   1176 N  NE   . ARG M  1 77  ? 123.250 120.925 56.224 1.00 5.21  76  M 1 
ATOM   1177 C  CZ   . ARG M  1 77  ? 124.148 121.866 56.492 1.00 5.21  76  M 1 
ATOM   1178 N  NH1  . ARG M  1 77  ? 124.811 121.845 57.631 1.00 5.21  76  M 1 
ATOM   1179 N  NH2  . ARG M  1 77  ? 124.387 122.830 55.625 1.00 5.21  76  M 1 
ATOM   1180 H  H    . ARG M  1 77  ? 122.822 115.881 55.924 1.00 5.21  76  M 1 
ATOM   1181 H  HA   . ARG M  1 77  ? 121.896 118.347 55.108 1.00 5.21  76  M 1 
ATOM   1182 H  HB2  . ARG M  1 77  ? 124.554 117.395 55.388 1.00 5.21  76  M 1 
ATOM   1183 H  HB3  . ARG M  1 77  ? 124.221 118.856 54.873 1.00 5.21  76  M 1 
ATOM   1184 H  HG2  . ARG M  1 77  ? 123.594 117.896 57.481 1.00 5.21  76  M 1 
ATOM   1185 H  HG3  . ARG M  1 77  ? 124.776 118.902 57.161 1.00 5.21  76  M 1 
ATOM   1186 H  HD2  . ARG M  1 77  ? 122.005 119.519 56.922 1.00 5.21  76  M 1 
ATOM   1187 H  HD3  . ARG M  1 77  ? 122.974 120.106 58.032 1.00 5.21  76  M 1 
ATOM   1188 H  HE   . ARG M  1 77  ? 122.839 120.970 55.456 1.00 5.21  76  M 1 
ATOM   1189 H  HH11 . ARG M  1 77  ? 124.661 121.204 58.213 1.00 5.21  76  M 1 
ATOM   1190 H  HH12 . ARG M  1 77  ? 125.402 122.472 57.804 1.00 5.21  76  M 1 
ATOM   1191 H  HH21 . ARG M  1 77  ? 123.947 122.853 54.863 1.00 5.21  76  M 1 
ATOM   1192 H  HH22 . ARG M  1 77  ? 124.980 123.453 55.815 1.00 5.21  76  M 1 
ATOM   1193 N  N    . GLY M  1 78  ? 122.159 116.191 52.933 1.00 5.50  77  M 1 
ATOM   1194 C  CA   . GLY M  1 78  ? 122.140 115.887 51.522 1.00 5.50  77  M 1 
ATOM   1195 C  C    . GLY M  1 78  ? 123.459 115.443 50.939 1.00 5.50  77  M 1 
ATOM   1196 O  O    . GLY M  1 78  ? 123.541 115.249 49.723 1.00 5.50  77  M 1 
ATOM   1197 H  H    . GLY M  1 78  ? 121.916 115.531 53.428 1.00 5.50  77  M 1 
ATOM   1198 H  HA2  . GLY M  1 78  ? 121.495 115.178 51.372 1.00 5.50  77  M 1 
ATOM   1199 H  HA3  . GLY M  1 78  ? 121.836 116.659 51.020 1.00 5.50  77  M 1 
ATOM   1200 N  N    . GLY M  1 79  ? 124.495 115.290 51.756 1.00 5.18  78  M 1 
ATOM   1201 C  CA   . GLY M  1 79  ? 125.727 114.712 51.279 1.00 5.18  78  M 1 
ATOM   1202 C  C    . GLY M  1 79  ? 125.645 113.205 51.198 1.00 5.18  78  M 1 
ATOM   1203 O  O    . GLY M  1 79  ? 124.682 112.590 51.648 1.00 5.18  78  M 1 
ATOM   1204 H  H    . GLY M  1 79  ? 124.512 115.509 52.587 1.00 5.18  78  M 1 
ATOM   1205 H  HA2  . GLY M  1 79  ? 125.940 115.050 50.395 1.00 5.18  78  M 1 
ATOM   1206 H  HA3  . GLY M  1 79  ? 126.453 114.957 51.874 1.00 5.18  78  M 1 
ATOM   1207 N  N    . ARG M  1 80  ? 126.638 112.620 50.533 1.00 5.31  79  M 1 
ATOM   1208 C  CA   . ARG M  1 80  ? 126.688 111.162 50.279 1.00 5.31  79  M 1 
ATOM   1209 C  C    . ARG M  1 80  ? 127.898 110.553 51.001 1.00 5.31  79  M 1 
ATOM   1210 O  O    . ARG M  1 80  ? 129.032 110.956 50.759 1.00 5.31  79  M 1 
ATOM   1211 C  CB   . ARG M  1 80  ? 126.670 110.918 48.767 1.00 5.31  79  M 1 
ATOM   1212 C  CG   . ARG M  1 80  ? 125.405 111.442 48.090 1.00 5.31  79  M 1 
ATOM   1213 C  CD   . ARG M  1 80  ? 124.176 110.697 48.584 1.00 5.31  79  M 1 
ATOM   1214 N  NE   . ARG M  1 80  ? 122.876 111.198 48.135 1.00 5.31  79  M 1 
ATOM   1215 C  CZ   . ARG M  1 80  ? 121.961 111.743 48.932 1.00 5.31  79  M 1 
ATOM   1216 N  NH1  . ARG M  1 80  ? 122.198 111.880 50.220 1.00 5.31  79  M 1 
ATOM   1217 N  NH2  . ARG M  1 80  ? 120.804 112.149 48.440 1.00 5.31  79  M 1 
ATOM   1218 H  H    . ARG M  1 80  ? 127.344 113.082 50.191 1.00 5.31  79  M 1 
ATOM   1219 H  HA   . ARG M  1 80  ? 125.874 110.763 50.663 1.00 5.31  79  M 1 
ATOM   1220 H  HB2  . ARG M  1 80  ? 127.450 111.355 48.367 1.00 5.31  79  M 1 
ATOM   1221 H  HB3  . ARG M  1 80  ? 126.744 109.954 48.602 1.00 5.31  79  M 1 
ATOM   1222 H  HG2  . ARG M  1 80  ? 125.303 112.399 48.282 1.00 5.31  79  M 1 
ATOM   1223 H  HG3  . ARG M  1 80  ? 125.482 111.330 47.118 1.00 5.31  79  M 1 
ATOM   1224 H  HD2  . ARG M  1 80  ? 124.254 109.759 48.308 1.00 5.31  79  M 1 
ATOM   1225 H  HD3  . ARG M  1 80  ? 124.185 110.708 49.565 1.00 5.31  79  M 1 
ATOM   1226 H  HE   . ARG M  1 80  ? 122.678 111.115 47.290 1.00 5.31  79  M 1 
ATOM   1227 H  HH11 . ARG M  1 80  ? 122.964 111.608 50.556 1.00 5.31  79  M 1 
ATOM   1228 H  HH12 . ARG M  1 80  ? 121.590 112.243 50.741 1.00 5.31  79  M 1 
ATOM   1229 H  HH21 . ARG M  1 80  ? 120.638 112.062 47.579 1.00 5.31  79  M 1 
ATOM   1230 H  HH22 . ARG M  1 80  ? 120.205 112.515 48.973 1.00 5.31  79  M 1 
ATOM   1231 N  N    . ILE M  1 81  ? 127.627 109.572 51.839 1.00 4.71  80  M 1 
ATOM   1232 C  CA   . ILE M  1 81  ? 128.644 108.852 52.587 1.00 4.71  80  M 1 
ATOM   1233 C  C    . ILE M  1 81  ? 129.483 108.029 51.621 1.00 4.71  80  M 1 
ATOM   1234 O  O    . ILE M  1 81  ? 128.948 107.277 50.797 1.00 4.71  80  M 1 
ATOM   1235 C  CB   . ILE M  1 81  ? 127.982 107.961 53.650 1.00 4.71  80  M 1 
ATOM   1236 C  CG1  . ILE M  1 81  ? 127.205 108.806 54.675 1.00 4.71  80  M 1 
ATOM   1237 C  CG2  . ILE M  1 81  ? 129.034 107.088 54.347 1.00 4.71  80  M 1 
ATOM   1238 C  CD1  . ILE M  1 81  ? 126.224 108.031 55.531 1.00 4.71  80  M 1 
ATOM   1239 H  H    . ILE M  1 81  ? 126.825 109.314 52.012 1.00 4.71  80  M 1 
ATOM   1240 H  HA   . ILE M  1 81  ? 129.217 109.490 53.040 1.00 4.71  80  M 1 
ATOM   1241 H  HB   . ILE M  1 81  ? 127.353 107.381 53.193 1.00 4.71  80  M 1 
ATOM   1242 H  HG12 . ILE M  1 81  ? 127.845 109.217 55.277 1.00 4.71  80  M 1 
ATOM   1243 H  HG13 . ILE M  1 81  ? 126.688 109.497 54.232 1.00 4.71  80  M 1 
ATOM   1244 H  HG21 . ILE M  1 81  ? 128.684 106.748 55.185 1.00 4.71  80  M 1 
ATOM   1245 H  HG22 . ILE M  1 81  ? 129.264 106.336 53.780 1.00 4.71  80  M 1 
ATOM   1246 H  HG23 . ILE M  1 81  ? 129.820 107.628 54.525 1.00 4.71  80  M 1 
ATOM   1247 H  HD11 . ILE M  1 81  ? 125.755 108.653 56.109 1.00 4.71  80  M 1 
ATOM   1248 H  HD12 . ILE M  1 81  ? 125.587 107.584 54.952 1.00 4.71  80  M 1 
ATOM   1249 H  HD13 . ILE M  1 81  ? 126.695 107.375 56.068 1.00 4.71  80  M 1 
ATOM   1250 N  N    . PHE M  1 82  ? 130.802 108.170 51.715 1.00 5.36  81  M 1 
ATOM   1251 C  CA   . PHE M  1 82  ? 131.748 107.327 50.988 1.00 5.36  81  M 1 
ATOM   1252 C  C    . PHE M  1 82  ? 132.688 106.692 51.999 1.00 5.36  81  M 1 
ATOM   1253 O  O    . PHE M  1 82  ? 133.540 107.371 52.577 1.00 5.36  81  M 1 
ATOM   1254 C  CB   . PHE M  1 82  ? 132.521 108.111 49.933 1.00 5.36  81  M 1 
ATOM   1255 C  CG   . PHE M  1 82  ? 131.690 108.495 48.747 1.00 5.36  81  M 1 
ATOM   1256 C  CD1  . PHE M  1 82  ? 131.427 107.575 47.748 1.00 5.36  81  M 1 
ATOM   1257 C  CD2  . PHE M  1 82  ? 131.162 109.762 48.634 1.00 5.36  81  M 1 
ATOM   1258 C  CE1  . PHE M  1 82  ? 130.659 107.920 46.658 1.00 5.36  81  M 1 
ATOM   1259 C  CE2  . PHE M  1 82  ? 130.395 110.107 47.545 1.00 5.36  81  M 1 
ATOM   1260 C  CZ   . PHE M  1 82  ? 130.144 109.187 46.560 1.00 5.36  81  M 1 
ATOM   1261 H  H    . PHE M  1 82  ? 131.185 108.757 52.213 1.00 5.36  81  M 1 
ATOM   1262 H  HA   . PHE M  1 82  ? 131.278 106.615 50.526 1.00 5.36  81  M 1 
ATOM   1263 H  HB2  . PHE M  1 82  ? 132.867 108.921 50.338 1.00 5.36  81  M 1 
ATOM   1264 H  HB3  . PHE M  1 82  ? 133.258 107.563 49.620 1.00 5.36  81  M 1 
ATOM   1265 H  HD1  . PHE M  1 82  ? 131.775 106.715 47.806 1.00 5.36  81  M 1 
ATOM   1266 H  HD2  . PHE M  1 82  ? 131.328 110.393 49.297 1.00 5.36  81  M 1 
ATOM   1267 H  HE1  . PHE M  1 82  ? 130.491 107.296 45.990 1.00 5.36  81  M 1 
ATOM   1268 H  HE2  . PHE M  1 82  ? 130.045 110.966 47.479 1.00 5.36  81  M 1 
ATOM   1269 H  HZ   . PHE M  1 82  ? 129.627 109.423 45.824 1.00 5.36  81  M 1 
ATOM   1270 N  N    . LEU M  1 83  ? 132.516 105.396 52.207 1.00 4.68  82  M 1 
ATOM   1271 C  CA   . LEU M  1 83  ? 133.289 104.642 53.174 1.00 4.68  82  M 1 
ATOM   1272 C  C    . LEU M  1 83  ? 134.622 104.239 52.562 1.00 4.68  82  M 1 
ATOM   1273 O  O    . LEU M  1 83  ? 134.746 104.069 51.348 1.00 4.68  82  M 1 
ATOM   1274 C  CB   . LEU M  1 83  ? 132.521 103.401 53.623 1.00 4.68  82  M 1 
ATOM   1275 C  CG   . LEU M  1 83  ? 131.190 103.642 54.335 1.00 4.68  82  M 1 
ATOM   1276 C  CD1  . LEU M  1 83  ? 130.481 102.327 54.590 1.00 4.68  82  M 1 
ATOM   1277 C  CD2  . LEU M  1 83  ? 131.353 104.418 55.627 1.00 4.68  82  M 1 
ATOM   1278 H  H    . LEU M  1 83  ? 131.943 104.919 51.778 1.00 4.68  82  M 1 
ATOM   1279 H  HA   . LEU M  1 83  ? 133.461 105.184 53.960 1.00 4.68  82  M 1 
ATOM   1280 H  HB2  . LEU M  1 83  ? 132.339 102.858 52.840 1.00 4.68  82  M 1 
ATOM   1281 H  HB3  . LEU M  1 83  ? 133.082 102.899 54.235 1.00 4.68  82  M 1 
ATOM   1282 H  HG   . LEU M  1 83  ? 130.625 104.170 53.750 1.00 4.68  82  M 1 
ATOM   1283 H  HD11 . LEU M  1 83  ? 129.639 102.499 55.040 1.00 4.68  82  M 1 
ATOM   1284 H  HD12 . LEU M  1 83  ? 130.314 101.894 53.738 1.00 4.68  82  M 1 
ATOM   1285 H  HD13 . LEU M  1 83  ? 131.041 101.763 55.146 1.00 4.68  82  M 1 
ATOM   1286 H  HD21 . LEU M  1 83  ? 130.496 104.434 56.082 1.00 4.68  82  M 1 
ATOM   1287 H  HD22 . LEU M  1 83  ? 132.017 103.986 56.187 1.00 4.68  82  M 1 
ATOM   1288 H  HD23 . LEU M  1 83  ? 131.630 105.324 55.420 1.00 4.68  82  M 1 
ATOM   1289 N  N    . GLN M  1 84  ? 135.620 104.103 53.420 1.00 4.98  83  M 1 
ATOM   1290 C  CA   . GLN M  1 84  ? 136.983 103.695 53.032 1.00 4.98  83  M 1 
ATOM   1291 C  C    . GLN M  1 84  ? 137.424 102.574 53.977 1.00 4.98  83  M 1 
ATOM   1292 O  O    . GLN M  1 84  ? 136.776 102.330 54.991 1.00 4.98  83  M 1 
ATOM   1293 C  CB   . GLN M  1 84  ? 137.940 104.889 53.070 1.00 4.98  83  M 1 
ATOM   1294 C  CG   . GLN M  1 84  ? 137.481 106.057 52.206 1.00 4.98  83  M 1 
ATOM   1295 C  CD   . GLN M  1 84  ? 137.435 105.714 50.736 1.00 4.98  83  M 1 
ATOM   1296 O  OE1  . GLN M  1 84  ? 136.691 106.307 49.957 1.00 4.98  83  M 1 
ATOM   1297 N  NE2  . GLN M  1 84  ? 138.254 104.763 50.333 1.00 4.98  83  M 1 
ATOM   1298 H  H    . GLN M  1 84  ? 135.530 104.287 54.308 1.00 4.98  83  M 1 
ATOM   1299 H  HA   . GLN M  1 84  ? 136.952 103.340 52.113 1.00 4.98  83  M 1 
ATOM   1300 H  HB2  . GLN M  1 84  ? 138.027 105.190 53.998 1.00 4.98  83  M 1 
ATOM   1301 H  HB3  . GLN M  1 84  ? 138.823 104.592 52.766 1.00 4.98  83  M 1 
ATOM   1302 H  HG2  . GLN M  1 84  ? 136.587 106.339 52.496 1.00 4.98  83  M 1 
ATOM   1303 H  HG3  . GLN M  1 84  ? 138.091 106.814 52.338 1.00 4.98  83  M 1 
ATOM   1304 H  HE21 . GLN M  1 84  ? 138.896 104.475 50.869 1.00 4.98  83  M 1 
ATOM   1305 H  HE22 . GLN M  1 84  ? 138.164 104.414 49.526 1.00 4.98  83  M 1 
ATOM   1306 N  N    . ASP M  1 85  ? 138.495 101.908 53.612 1.00 4.69  84  M 1 
ATOM   1307 C  CA   . ASP M  1 85  ? 139.059 100.852 54.433 1.00 4.69  84  M 1 
ATOM   1308 C  C    . ASP M  1 85  ? 139.338 101.384 55.830 1.00 4.69  84  M 1 
ATOM   1309 O  O    . ASP M  1 85  ? 139.747 102.533 56.005 1.00 4.69  84  M 1 
ATOM   1310 C  CB   . ASP M  1 85  ? 140.360 100.325 53.827 1.00 4.69  84  M 1 
ATOM   1311 C  CG   . ASP M  1 85  ? 140.159 99.642  52.493 1.00 4.69  84  M 1 
ATOM   1312 O  OD1  . ASP M  1 85  ? 139.068 99.089  52.247 1.00 4.69  84  M 1 
ATOM   1313 O  OD2  . ASP M  1 85  ? 141.111 99.651  51.689 1.00 4.69  84  M 1 
ATOM   1314 H  H    . ASP M  1 85  ? 138.954 102.090 52.908 1.00 4.69  84  M 1 
ATOM   1315 H  HA   . ASP M  1 85  ? 138.430 100.116 54.494 1.00 4.69  84  M 1 
ATOM   1316 H  HB2  . ASP M  1 85  ? 140.983 101.059 53.707 1.00 4.69  84  M 1 
ATOM   1317 H  HB3  . ASP M  1 85  ? 140.739 99.671  54.435 1.00 4.69  84  M 1 
ATOM   1318 N  N    . ILE M  1 86  ? 139.106 100.539 56.825 1.00 3.70  85  M 1 
ATOM   1319 C  CA   . ILE M  1 86  ? 139.459 100.834 58.207 1.00 3.70  85  M 1 
ATOM   1320 C  C    . ILE M  1 86  ? 140.807 100.167 58.441 1.00 3.70  85  M 1 
ATOM   1321 O  O    . ILE M  1 86  ? 140.902 98.937  58.481 1.00 3.70  85  M 1 
ATOM   1322 C  CB   . ILE M  1 86  ? 138.405 100.331 59.202 1.00 3.70  85  M 1 
ATOM   1323 C  CG1  . ILE M  1 86  ? 137.025 100.939 58.911 1.00 3.70  85  M 1 
ATOM   1324 C  CG2  . ILE M  1 86  ? 138.841 100.699 60.622 1.00 3.70  85  M 1 
ATOM   1325 C  CD1  . ILE M  1 86  ? 135.886 100.255 59.630 1.00 3.70  85  M 1 
ATOM   1326 H  H    . ILE M  1 86  ? 138.741 99.767  56.719 1.00 3.70  85  M 1 
ATOM   1327 H  HA   . ILE M  1 86  ? 139.559 101.790 58.338 1.00 3.70  85  M 1 
ATOM   1328 H  HB   . ILE M  1 86  ? 138.343 99.365  59.135 1.00 3.70  85  M 1 
ATOM   1329 H  HG12 . ILE M  1 86  ? 137.028 101.876 59.163 1.00 3.70  85  M 1 
ATOM   1330 H  HG13 . ILE M  1 86  ? 136.822 100.870 57.965 1.00 3.70  85  M 1 
ATOM   1331 H  HG21 . ILE M  1 86  ? 138.100 100.616 61.243 1.00 3.70  85  M 1 
ATOM   1332 H  HG22 . ILE M  1 86  ? 139.559 100.111 60.906 1.00 3.70  85  M 1 
ATOM   1333 H  HG23 . ILE M  1 86  ? 139.154 101.617 60.629 1.00 3.70  85  M 1 
ATOM   1334 H  HD11 . ILE M  1 86  ? 135.049 100.509 59.210 1.00 3.70  85  M 1 
ATOM   1335 H  HD12 . ILE M  1 86  ? 136.000 99.294  59.564 1.00 3.70  85  M 1 
ATOM   1336 H  HD13 . ILE M  1 86  ? 135.882 100.509 60.566 1.00 3.70  85  M 1 
ATOM   1337 N  N    . LYS M  1 87  ? 141.853 100.969 58.576 1.00 4.77  86  M 1 
ATOM   1338 C  CA   . LYS M  1 87  ? 143.193 100.423 58.707 1.00 4.77  86  M 1 
ATOM   1339 C  C    . LYS M  1 87  ? 143.363 99.744  60.060 1.00 4.77  86  M 1 
ATOM   1340 O  O    . LYS M  1 87  ? 142.782 100.155 61.065 1.00 4.77  86  M 1 
ATOM   1341 C  CB   . LYS M  1 87  ? 144.243 101.521 58.530 1.00 30.00 86  M 1 
ATOM   1342 C  CG   . LYS M  1 87  ? 144.208 102.201 57.170 1.00 30.00 86  M 1 
ATOM   1343 C  CD   . LYS M  1 87  ? 144.545 101.226 56.055 1.00 30.00 86  M 1 
ATOM   1344 C  CE   . LYS M  1 87  ? 144.582 101.921 54.704 1.00 30.00 86  M 1 
ATOM   1345 N  NZ   . LYS M  1 87  ? 144.888 100.972 53.599 1.00 30.00 86  M 1 
ATOM   1346 H  H    . LYS M  1 87  ? 141.807 101.827 58.599 1.00 4.77  86  M 1 
ATOM   1347 H  HA   . LYS M  1 87  ? 143.330 99.755  58.017 1.00 4.77  86  M 1 
ATOM   1348 N  N    . LYS M  1 88  ? 144.175 98.693  60.077 1.00 4.97  87  M 1 
ATOM   1349 C  CA   . LYS M  1 88  ? 144.415 97.973  61.311 1.00 4.97  87  M 1 
ATOM   1350 C  C    . LYS M  1 88  ? 145.153 98.877  62.302 1.00 4.97  87  M 1 
ATOM   1351 O  O    . LYS M  1 88  ? 145.866 99.795  61.895 1.00 4.97  87  M 1 
ATOM   1352 C  CB   . LYS M  1 88  ? 145.223 96.704  61.055 1.00 4.97  87  M 1 
ATOM   1353 C  CG   . LYS M  1 88  ? 146.628 96.926  60.549 1.00 4.97  87  M 1 
ATOM   1354 C  CD   . LYS M  1 88  ? 147.328 95.606  60.302 1.00 4.97  87  M 1 
ATOM   1355 C  CE   . LYS M  1 88  ? 148.741 95.814  59.822 1.00 4.97  87  M 1 
ATOM   1356 N  NZ   . LYS M  1 88  ? 149.425 94.518  59.579 1.00 4.97  87  M 1 
ATOM   1357 H  H    . LYS M  1 88  ? 144.595 98.383  59.393 1.00 4.97  87  M 1 
ATOM   1358 H  HA   . LYS M  1 88  ? 143.546 97.705  61.648 1.00 4.97  87  M 1 
ATOM   1359 H  HB2  . LYS M  1 88  ? 145.284 96.205  61.885 1.00 4.97  87  M 1 
ATOM   1360 H  HB3  . LYS M  1 88  ? 144.759 96.168  60.393 1.00 4.97  87  M 1 
ATOM   1361 H  HG2  . LYS M  1 88  ? 146.599 97.427  59.719 1.00 4.97  87  M 1 
ATOM   1362 H  HG3  . LYS M  1 88  ? 147.152 97.407  61.209 1.00 4.97  87  M 1 
ATOM   1363 H  HD2  . LYS M  1 88  ? 147.360 95.100  61.129 1.00 4.97  87  M 1 
ATOM   1364 H  HD3  . LYS M  1 88  ? 146.855 95.105  59.619 1.00 4.97  87  M 1 
ATOM   1365 H  HE2  . LYS M  1 88  ? 148.727 96.320  58.995 1.00 4.97  87  M 1 
ATOM   1366 H  HE3  . LYS M  1 88  ? 149.236 96.296  60.503 1.00 4.97  87  M 1 
ATOM   1367 H  HZ1  . LYS M  1 88  ? 150.258 94.655  59.296 1.00 4.97  87  M 1 
ATOM   1368 H  HZ2  . LYS M  1 88  ? 149.448 94.051  60.337 1.00 4.97  87  M 1 
ATOM   1369 H  HZ3  . LYS M  1 88  ? 148.985 94.051  58.963 1.00 4.97  87  M 1 
ATOM   1370 N  N    . PRO M  1 89  ? 145.005 98.637  63.607 1.00 4.65  88  M 1 
ATOM   1371 C  CA   . PRO M  1 89  ? 145.751 99.442  64.578 1.00 4.65  88  M 1 
ATOM   1372 C  C    . PRO M  1 89  ? 147.253 99.252  64.431 1.00 4.65  88  M 1 
ATOM   1373 O  O    . PRO M  1 89  ? 147.727 98.300  63.811 1.00 4.65  88  M 1 
ATOM   1374 C  CB   . PRO M  1 89  ? 145.249 98.925  65.928 1.00 4.65  88  M 1 
ATOM   1375 C  CG   . PRO M  1 89  ? 143.930 98.331  65.641 1.00 4.65  88  M 1 
ATOM   1376 C  CD   . PRO M  1 89  ? 144.058 97.737  64.286 1.00 4.65  88  M 1 
ATOM   1377 H  HA   . PRO M  1 89  ? 145.536 100.384 64.490 1.00 4.65  88  M 1 
ATOM   1378 H  HB2  . PRO M  1 89  ? 145.858 98.253  66.272 1.00 4.65  88  M 1 
ATOM   1379 H  HB3  . PRO M  1 89  ? 145.173 99.666  66.549 1.00 4.65  88  M 1 
ATOM   1380 H  HG2  . PRO M  1 89  ? 143.743 97.634  66.289 1.00 4.65  88  M 1 
ATOM   1381 H  HG3  . PRO M  1 89  ? 143.239 99.011  65.663 1.00 4.65  88  M 1 
ATOM   1382 H  HD2  . PRO M  1 89  ? 144.416 96.837  64.330 1.00 4.65  88  M 1 
ATOM   1383 H  HD3  . PRO M  1 89  ? 143.192 97.751  63.850 1.00 4.65  88  M 1 
ATOM   1384 N  N    . ASP M  1 90  ? 148.000 100.181 65.028 1.00 6.42  89  M 1 
ATOM   1385 C  CA   . ASP M  1 90  ? 149.444 100.220 64.829 1.00 6.42  89  M 1 
ATOM   1386 C  C    . ASP M  1 90  ? 150.160 99.064  65.521 1.00 6.42  89  M 1 
ATOM   1387 O  O    . ASP M  1 90  ? 151.321 98.786  65.205 1.00 6.42  89  M 1 
ATOM   1388 C  CB   . ASP M  1 90  ? 150.000 101.563 65.307 1.00 6.42  89  M 1 
ATOM   1389 C  CG   . ASP M  1 90  ? 149.765 101.813 66.789 1.00 6.42  89  M 1 
ATOM   1390 O  OD1  . ASP M  1 90  ? 149.098 100.993 67.452 1.00 6.42  89  M 1 
ATOM   1391 O  OD2  . ASP M  1 90  ? 150.256 102.842 67.298 1.00 6.42  89  M 1 
ATOM   1392 H  H    . ASP M  1 90  ? 147.692 100.794 65.546 1.00 6.42  89  M 1 
ATOM   1393 H  HA   . ASP M  1 90  ? 149.632 100.154 63.880 1.00 6.42  89  M 1 
ATOM   1394 H  HB2  . ASP M  1 90  ? 150.954 101.594 65.135 1.00 6.42  89  M 1 
ATOM   1395 H  HB3  . ASP M  1 90  ? 149.555 102.273 64.818 1.00 6.42  89  M 1 
ATOM   1396 N  N    . ARG M  1 91  ? 149.525 98.437  66.501 1.00 6.46  90  M 1 
ATOM   1397 C  CA   . ARG M  1 91  ? 150.159 97.302  67.210 1.00 6.46  90  M 1 
ATOM   1398 C  C    . ARG M  1 91  ? 149.116 96.345  67.771 1.00 6.46  90  M 1 
ATOM   1399 O  O    . ARG M  1 91  ? 147.959 96.741  67.965 1.00 6.46  90  M 1 
ATOM   1400 C  CB   . ARG M  1 91  ? 151.033 97.810  68.360 1.00 6.46  90  M 1 
ATOM   1401 C  CG   . ARG M  1 91  ? 150.288 98.636  69.392 1.00 6.46  90  M 1 
ATOM   1402 C  CD   . ARG M  1 91  ? 151.196 99.661  70.045 1.00 6.46  90  M 1 
ATOM   1403 N  NE   . ARG M  1 91  ? 152.000 99.066  71.096 1.00 6.46  90  M 1 
ATOM   1404 C  CZ   . ARG M  1 91  ? 152.762 99.746  71.952 1.00 6.46  90  M 1 
ATOM   1405 N  NH1  . ARG M  1 91  ? 152.826 101.065 71.888 1.00 6.46  90  M 1 
ATOM   1406 N  NH2  . ARG M  1 91  ? 153.443 99.097  72.877 1.00 6.46  90  M 1 
ATOM   1407 H  H    . ARG M  1 91  ? 148.725 98.709  66.841 1.00 6.46  90  M 1 
ATOM   1408 H  HA   . ARG M  1 91  ? 150.726 96.813  66.571 1.00 6.46  90  M 1 
ATOM   1409 H  HB2  . ARG M  1 91  ? 151.438 97.038  68.808 1.00 6.46  90  M 1 
ATOM   1410 H  HB3  . ARG M  1 91  ? 151.757 98.353  67.985 1.00 6.46  90  M 1 
ATOM   1411 H  HG2  . ARG M  1 91  ? 149.539 99.099  68.960 1.00 6.46  90  M 1 
ATOM   1412 H  HG3  . ARG M  1 91  ? 149.923 98.043  70.083 1.00 6.46  90  M 1 
ATOM   1413 H  HD2  . ARG M  1 91  ? 151.787 100.051 69.366 1.00 6.46  90  M 1 
ATOM   1414 H  HD3  . ARG M  1 91  ? 150.651 100.384 70.423 1.00 6.46  90  M 1 
ATOM   1415 H  HE   . ARG M  1 91  ? 151.982 98.198  71.177 1.00 6.46  90  M 1 
ATOM   1416 H  HH11 . ARG M  1 91  ? 152.368 101.496 71.274 1.00 6.46  90  M 1 
ATOM   1417 H  HH12 . ARG M  1 91  ? 153.329 101.507 72.457 1.00 6.46  90  M 1 
ATOM   1418 H  HH21 . ARG M  1 91  ? 153.398 98.218  72.919 1.00 6.46  90  M 1 
ATOM   1419 H  HH22 . ARG M  1 91  ? 153.948 99.544  73.444 1.00 6.46  90  M 1 
ATOM   1420 N  N    . ASP M  1 92  ? 149.508 95.111  68.064 1.00 7.52  91  M 1 
ATOM   1421 C  CA   . ASP M  1 92  ? 148.594 94.135  68.707 1.00 7.52  91  M 1 
ATOM   1422 C  C    . ASP M  1 92  ? 149.003 94.016  70.176 1.00 7.52  91  M 1 
ATOM   1423 O  O    . ASP M  1 92  ? 148.133 93.680  70.973 1.00 7.52  91  M 1 
ATOM   1424 C  CB   . ASP M  1 92  ? 148.599 92.781  68.004 1.00 7.52  91  M 1 
ATOM   1425 C  CG   . ASP M  1 92  ? 149.977 92.479  67.459 1.00 7.52  91  M 1 
ATOM   1426 O  OD1  . ASP M  1 92  ? 150.923 92.558  68.246 1.00 7.52  91  M 1 
ATOM   1427 O  OD2  . ASP M  1 92  ? 150.093 92.229  66.240 1.00 7.52  91  M 1 
ATOM   1428 H  H    . ASP M  1 92  ? 150.363 94.825  67.949 1.00 7.52  91  M 1 
ATOM   1429 H  HA   . ASP M  1 92  ? 147.678 94.499  68.666 1.00 7.52  91  M 1 
ATOM   1430 H  HB2  . ASP M  1 92  ? 148.342 92.079  68.636 1.00 7.52  91  M 1 
ATOM   1431 H  HB3  . ASP M  1 92  ? 147.956 92.789  67.266 1.00 7.52  91  M 1 
ATOM   1432 N  N    . ASP M  1 93  ? 150.256 94.338  70.525 1.00 6.76  92  M 1 
ATOM   1433 C  CA   . ASP M  1 93  ? 150.729 94.272  71.901 1.00 6.76  92  M 1 
ATOM   1434 C  C    . ASP M  1 93  ? 150.848 95.690  72.446 1.00 6.76  92  M 1 
ATOM   1435 O  O    . ASP M  1 93  ? 151.701 96.460  71.996 1.00 6.76  92  M 1 
ATOM   1436 C  CB   . ASP M  1 93  ? 152.072 93.541  71.962 1.00 6.76  92  M 1 
ATOM   1437 C  CG   . ASP M  1 93  ? 152.556 93.294  73.379 1.00 6.76  92  M 1 
ATOM   1438 O  OD1  . ASP M  1 93  ? 151.901 93.735  74.341 1.00 6.76  92  M 1 
ATOM   1439 O  OD2  . ASP M  1 93  ? 153.612 92.646  73.529 1.00 6.76  92  M 1 
ATOM   1440 H  H    . ASP M  1 93  ? 150.867 94.598  69.979 1.00 6.76  92  M 1 
ATOM   1441 H  HA   . ASP M  1 93  ? 150.095 93.777  72.443 1.00 6.76  92  M 1 
ATOM   1442 H  HB2  . ASP M  1 93  ? 151.972 92.679  71.528 1.00 6.76  92  M 1 
ATOM   1443 H  HB3  . ASP M  1 93  ? 152.743 94.066  71.499 1.00 6.76  92  M 1 
ATOM   1444 N  N    . TRP M  1 94  ? 149.999 96.024  73.413 1.00 4.79  93  M 1 
ATOM   1445 C  CA   . TRP M  1 94  ? 149.951 97.357  74.005 1.00 4.79  93  M 1 
ATOM   1446 C  C    . TRP M  1 94  ? 150.818 97.490  75.257 1.00 4.79  93  M 1 
ATOM   1447 O  O    . TRP M  1 94  ? 150.931 98.589  75.800 1.00 4.79  93  M 1 
ATOM   1448 C  CB   . TRP M  1 94  ? 148.495 97.714  74.308 1.00 4.79  93  M 1 
ATOM   1449 C  CG   . TRP M  1 94  ? 147.719 97.784  73.062 1.00 4.79  93  M 1 
ATOM   1450 C  CD1  . TRP M  1 94  ? 146.925 96.817  72.544 1.00 4.79  93  M 1 
ATOM   1451 C  CD2  . TRP M  1 94  ? 147.702 98.862  72.130 1.00 4.79  93  M 1 
ATOM   1452 N  NE1  . TRP M  1 94  ? 146.394 97.228  71.353 1.00 4.79  93  M 1 
ATOM   1453 C  CE2  . TRP M  1 94  ? 146.862 98.483  71.073 1.00 4.79  93  M 1 
ATOM   1454 C  CE3  . TRP M  1 94  ? 148.312 100.113 72.090 1.00 4.79  93  M 1 
ATOM   1455 C  CZ2  . TRP M  1 94  ? 146.612 99.311  69.994 1.00 4.79  93  M 1 
ATOM   1456 C  CZ3  . TRP M  1 94  ? 148.066 100.930 71.015 1.00 4.79  93  M 1 
ATOM   1457 C  CH2  . TRP M  1 94  ? 147.222 100.529 69.984 1.00 4.79  93  M 1 
ATOM   1458 H  H    . TRP M  1 94  ? 149.420 95.479  73.741 1.00 4.79  93  M 1 
ATOM   1459 H  HA   . TRP M  1 94  ? 150.269 98.003  73.356 1.00 4.79  93  M 1 
ATOM   1460 H  HB2  . TRP M  1 94  ? 148.102 97.033  74.876 1.00 4.79  93  M 1 
ATOM   1461 H  HB3  . TRP M  1 94  ? 148.451 98.582  74.739 1.00 4.79  93  M 1 
ATOM   1462 H  HD1  . TRP M  1 94  ? 146.766 95.992  72.944 1.00 4.79  93  M 1 
ATOM   1463 H  HE1  . TRP M  1 94  ? 145.858 96.772  70.859 1.00 4.79  93  M 1 
ATOM   1464 H  HE3  . TRP M  1 94  ? 148.878 100.387 72.775 1.00 4.79  93  M 1 
ATOM   1465 H  HZ2  . TRP M  1 94  ? 146.050 99.045  69.303 1.00 4.79  93  M 1 
ATOM   1466 H  HZ3  . TRP M  1 94  ? 148.466 101.769 70.978 1.00 4.79  93  M 1 
ATOM   1467 H  HH2  . TRP M  1 94  ? 147.074 101.107 69.270 1.00 4.79  93  M 1 
ATOM   1468 N  N    . GLU M  1 95  ? 151.384 96.385  75.738 1.00 6.28  94  M 1 
ATOM   1469 C  CA   . GLU M  1 95  ? 152.486 96.279  76.696 1.00 6.28  94  M 1 
ATOM   1470 C  C    . GLU M  1 95  ? 152.172 96.600  78.151 1.00 6.28  94  M 1 
ATOM   1471 O  O    . GLU M  1 95  ? 152.860 96.079  79.032 1.00 6.28  94  M 1 
ATOM   1472 C  CB   . GLU M  1 95  ? 153.654 97.191  76.296 1.00 6.28  94  M 1 
ATOM   1473 C  CG   . GLU M  1 95  ? 154.410 96.800  75.049 1.00 6.28  94  M 1 
ATOM   1474 C  CD   . GLU M  1 95  ? 155.561 97.748  74.768 1.00 6.28  94  M 1 
ATOM   1475 O  OE1  . GLU M  1 95  ? 155.686 98.769  75.478 1.00 6.28  94  M 1 
ATOM   1476 O  OE2  . GLU M  1 95  ? 156.334 97.480  73.823 1.00 6.28  94  M 1 
ATOM   1477 H  H    . GLU M  1 95  ? 151.108 95.601  75.516 1.00 6.28  94  M 1 
ATOM   1478 H  HA   . GLU M  1 95  ? 152.814 95.366  76.679 1.00 6.28  94  M 1 
ATOM   1479 H  HB2  . GLU M  1 95  ? 153.340 98.102  76.181 1.00 6.28  94  M 1 
ATOM   1480 H  HB3  . GLU M  1 95  ? 154.302 97.181  77.018 1.00 6.28  94  M 1 
ATOM   1481 H  HG2  . GLU M  1 95  ? 154.776 95.909  75.164 1.00 6.28  94  M 1 
ATOM   1482 H  HG3  . GLU M  1 95  ? 153.808 96.816  74.289 1.00 6.28  94  M 1 
ATOM   1483 N  N    . SER M  1 96  ? 151.102 97.336  78.433 1.00 4.95  95  M 1 
ATOM   1484 C  CA   . SER M  1 96  ? 150.767 97.707  79.804 1.00 4.95  95  M 1 
ATOM   1485 C  C    . SER M  1 96  ? 149.509 98.565  79.794 1.00 4.95  95  M 1 
ATOM   1486 O  O    . SER M  1 96  ? 149.121 99.130  78.771 1.00 4.95  95  M 1 
ATOM   1487 C  CB   . SER M  1 96  ? 151.907 98.467  80.503 1.00 4.95  95  M 1 
ATOM   1488 O  OG   . SER M  1 96  ? 152.134 99.722  79.901 1.00 4.95  95  M 1 
ATOM   1489 H  H    . SER M  1 96  ? 150.553 97.645  77.848 1.00 4.95  95  M 1 
ATOM   1490 H  HA   . SER M  1 96  ? 150.583 96.900  80.310 1.00 4.95  95  M 1 
ATOM   1491 H  HB2  . SER M  1 96  ? 151.648 98.620  81.425 1.00 4.95  95  M 1 
ATOM   1492 H  HB3  . SER M  1 96  ? 152.735 97.962  80.503 1.00 4.95  95  M 1 
ATOM   1493 H  HG   . SER M  1 96  ? 152.947 99.803  79.704 1.00 4.95  95  M 1 
ATOM   1494 N  N    . GLY M  1 97  ? 148.886 98.664  80.967 1.00 4.08  96  M 1 
ATOM   1495 C  CA   . GLY M  1 97  ? 147.786 99.597  81.142 1.00 4.08  96  M 1 
ATOM   1496 C  C    . GLY M  1 97  ? 148.198 101.035 80.900 1.00 4.08  96  M 1 
ATOM   1497 O  O    . GLY M  1 97  ? 147.507 101.781 80.204 1.00 4.08  96  M 1 
ATOM   1498 H  H    . GLY M  1 97  ? 149.080 98.206  81.669 1.00 4.08  96  M 1 
ATOM   1499 H  HA2  . GLY M  1 97  ? 147.044 99.362  80.564 1.00 4.08  96  M 1 
ATOM   1500 H  HA3  . GLY M  1 97  ? 147.481 99.547  82.062 1.00 4.08  96  M 1 
ATOM   1501 N  N    . LEU M  1 98  ? 149.324 101.444 81.487 1.00 4.35  97  M 1 
ATOM   1502 C  CA   . LEU M  1 98  ? 149.821 102.805 81.323 1.00 4.35  97  M 1 
ATOM   1503 C  C    . LEU M  1 98  ? 150.076 103.129 79.861 1.00 4.35  97  M 1 
ATOM   1504 O  O    . LEU M  1 98  ? 149.678 104.190 79.371 1.00 4.35  97  M 1 
ATOM   1505 C  CB   . LEU M  1 98  ? 151.098 102.993 82.141 1.00 4.35  97  M 1 
ATOM   1506 C  CG   . LEU M  1 98  ? 151.816 104.337 82.014 1.00 4.35  97  M 1 
ATOM   1507 C  CD1  . LEU M  1 98  ? 150.932 105.487 82.425 1.00 4.35  97  M 1 
ATOM   1508 C  CD2  . LEU M  1 98  ? 153.073 104.329 82.842 1.00 4.35  97  M 1 
ATOM   1509 H  H    . LEU M  1 98  ? 149.820 100.947 81.983 1.00 4.35  97  M 1 
ATOM   1510 H  HA   . LEU M  1 98  ? 149.157 103.427 81.660 1.00 4.35  97  M 1 
ATOM   1511 H  HB2  . LEU M  1 98  ? 150.874 102.876 83.078 1.00 4.35  97  M 1 
ATOM   1512 H  HB3  . LEU M  1 98  ? 151.731 102.304 81.884 1.00 4.35  97  M 1 
ATOM   1513 H  HG   . LEU M  1 98  ? 152.095 104.478 81.096 1.00 4.35  97  M 1 
ATOM   1514 H  HD11 . LEU M  1 98  ? 151.461 106.299 82.385 1.00 4.35  97  M 1 
ATOM   1515 H  HD12 . LEU M  1 98  ? 150.183 105.557 81.812 1.00 4.35  97  M 1 
ATOM   1516 H  HD13 . LEU M  1 98  ? 150.611 105.342 83.329 1.00 4.35  97  M 1 
ATOM   1517 H  HD21 . LEU M  1 98  ? 153.583 105.131 82.647 1.00 4.35  97  M 1 
ATOM   1518 H  HD22 . LEU M  1 98  ? 152.832 104.310 83.781 1.00 4.35  97  M 1 
ATOM   1519 H  HD23 . LEU M  1 98  ? 153.598 103.545 82.616 1.00 4.35  97  M 1 
ATOM   1520 N  N    . ASN M  1 99  ? 150.760 102.206 79.194 1.00 4.75  98  M 1 
ATOM   1521 C  CA   . ASN M  1 99  ? 151.113 102.418 77.769 1.00 4.75  98  M 1 
ATOM   1522 C  C    . ASN M  1 99  ? 149.818 102.556 76.966 1.00 4.75  98  M 1 
ATOM   1523 O  O    . ASN M  1 99  ? 149.706 103.465 76.165 1.00 4.75  98  M 1 
ATOM   1524 C  CB   . ASN M  1 99  ? 151.972 101.305 77.182 1.00 4.75  98  M 1 
ATOM   1525 C  CG   . ASN M  1 99  ? 152.324 101.638 75.750 1.00 4.75  98  M 1 
ATOM   1526 O  OD1  . ASN M  1 99  ? 152.887 102.690 75.506 1.00 4.75  98  M 1 
ATOM   1527 N  ND2  . ASN M  1 99  ? 152.012 100.765 74.813 1.00 4.75  98  M 1 
ATOM   1528 H  H    . ASN M  1 99  ? 150.924 101.371 79.514 1.00 4.75  98  M 1 
ATOM   1529 H  HA   . ASN M  1 99  ? 151.621 103.260 77.698 1.00 4.75  98  M 1 
ATOM   1530 H  HB2  . ASN M  1 99  ? 152.791 101.209 77.709 1.00 4.75  98  M 1 
ATOM   1531 H  HB3  . ASN M  1 99  ? 151.479 100.460 77.212 1.00 4.75  98  M 1 
ATOM   1532 H  HD21 . ASN M  1 99  ? 152.223 100.926 73.970 1.00 4.75  98  M 1 
ATOM   1533 H  HD22 . ASN M  1 99  ? 151.592 100.017 75.028 1.00 4.75  98  M 1 
ATOM   1534 N  N    . ALA M  1 100 ? 148.838 101.713 77.239 1.00 3.93  99  M 1 
ATOM   1535 C  CA   . ALA M  1 100 ? 147.559 101.755 76.541 1.00 3.93  99  M 1 
ATOM   1536 C  C    . ALA M  1 100 ? 146.852 103.084 76.778 1.00 3.93  99  M 1 
ATOM   1537 O  O    . ALA M  1 100 ? 146.297 103.679 75.850 1.00 3.93  99  M 1 
ATOM   1538 C  CB   . ALA M  1 100 ? 146.675 100.583 76.973 1.00 3.93  99  M 1 
ATOM   1539 H  H    . ALA M  1 100 ? 148.889 101.110 77.850 1.00 3.93  99  M 1 
ATOM   1540 H  HA   . ALA M  1 100 ? 147.721 101.661 75.589 1.00 3.93  99  M 1 
ATOM   1541 H  HB1  . ALA M  1 100 ? 145.808 100.671 76.547 1.00 3.93  99  M 1 
ATOM   1542 H  HB2  . ALA M  1 100 ? 147.087 99.751  76.692 1.00 3.93  99  M 1 
ATOM   1543 H  HB3  . ALA M  1 100 ? 146.559 100.585 77.936 1.00 3.93  99  M 1 
ATOM   1544 N  N    . MET M  1 101 ? 146.875 103.575 78.018 1.00 3.66  100 M 1 
ATOM   1545 C  CA   . MET M  1 101 ? 146.250 104.859 78.321 1.00 3.66  100 M 1 
ATOM   1546 C  C    . MET M  1 101 ? 146.962 106.005 77.611 1.00 3.66  100 M 1 
ATOM   1547 O  O    . MET M  1 101 ? 146.317 106.935 77.120 1.00 3.66  100 M 1 
ATOM   1548 C  CB   . MET M  1 101 ? 146.231 105.092 79.833 1.00 3.66  100 M 1 
ATOM   1549 C  CG   . MET M  1 101 ? 145.292 104.199 80.617 1.00 3.66  100 M 1 
ATOM   1550 S  SD   . MET M  1 101 ? 143.559 104.519 80.234 1.00 3.66  100 M 1 
ATOM   1551 C  CE   . MET M  1 101 ? 142.752 103.227 81.176 1.00 3.66  100 M 1 
ATOM   1552 H  H    . MET M  1 101 ? 147.250 103.190 78.690 1.00 3.66  100 M 1 
ATOM   1553 H  HA   . MET M  1 101 ? 145.330 104.834 78.013 1.00 3.66  100 M 1 
ATOM   1554 H  HB2  . MET M  1 101 ? 147.126 104.958 80.182 1.00 3.66  100 M 1 
ATOM   1555 H  HB3  . MET M  1 101 ? 145.954 106.006 80.000 1.00 3.66  100 M 1 
ATOM   1556 H  HG2  . MET M  1 101 ? 145.479 103.273 80.397 1.00 3.66  100 M 1 
ATOM   1557 H  HG3  . MET M  1 101 ? 145.427 104.340 81.567 1.00 3.66  100 M 1 
ATOM   1558 H  HE1  . MET M  1 101 ? 141.803 103.421 81.221 1.00 3.66  100 M 1 
ATOM   1559 H  HE2  . MET M  1 101 ? 142.900 102.372 80.743 1.00 3.66  100 M 1 
ATOM   1560 H  HE3  . MET M  1 101 ? 143.121 103.207 82.073 1.00 3.66  100 M 1 
ATOM   1561 N  N    . GLU M  1 102 ? 148.293 105.953 77.550 1.00 4.25  101 M 1 
ATOM   1562 C  CA   . GLU M  1 102 ? 149.059 106.982 76.855 1.00 4.25  101 M 1 
ATOM   1563 C  C    . GLU M  1 102 ? 148.734 106.993 75.366 1.00 4.25  101 M 1 
ATOM   1564 O  O    . GLU M  1 102 ? 148.533 108.059 74.766 1.00 4.25  101 M 1 
ATOM   1565 C  CB   . GLU M  1 102 ? 150.554 106.754 77.092 1.00 4.25  101 M 1 
ATOM   1566 C  CG   . GLU M  1 102 ? 151.008 107.015 78.528 1.00 4.25  101 M 1 
ATOM   1567 C  CD   . GLU M  1 102 ? 152.467 106.671 78.766 1.00 4.25  101 M 1 
ATOM   1568 O  OE1  . GLU M  1 102 ? 153.102 106.091 77.863 1.00 4.25  101 M 1 
ATOM   1569 O  OE2  . GLU M  1 102 ? 152.977 106.981 79.862 1.00 4.25  101 M 1 
ATOM   1570 H  H    . GLU M  1 102 ? 148.774 105.332 77.901 1.00 4.25  101 M 1 
ATOM   1571 H  HA   . GLU M  1 102 ? 148.837 107.850 77.227 1.00 4.25  101 M 1 
ATOM   1572 H  HB2  . GLU M  1 102 ? 150.781 105.839 76.862 1.00 4.25  101 M 1 
ATOM   1573 H  HB3  . GLU M  1 102 ? 151.049 107.359 76.518 1.00 4.25  101 M 1 
ATOM   1574 H  HG2  . GLU M  1 102 ? 150.901 107.961 78.712 1.00 4.25  101 M 1 
ATOM   1575 H  HG3  . GLU M  1 102 ? 150.471 106.507 79.156 1.00 4.25  101 M 1 
ATOM   1576 N  N    . CYS M  1 103 ? 148.657 105.810 74.757 1.00 4.27  102 M 1 
ATOM   1577 C  CA   . CYS M  1 103 ? 148.305 105.715 73.345 1.00 4.27  102 M 1 
ATOM   1578 C  C    . CYS M  1 103 ? 146.880 106.192 73.098 1.00 4.27  102 M 1 
ATOM   1579 O  O    . CYS M  1 103 ? 146.597 106.836 72.083 1.00 4.27  102 M 1 
ATOM   1580 C  CB   . CYS M  1 103 ? 148.489 104.281 72.869 1.00 4.27  102 M 1 
ATOM   1581 S  SG   . CYS M  1 103 ? 150.209 103.771 72.899 1.00 4.27  102 M 1 
ATOM   1582 H  H    . CYS M  1 103 ? 148.795 105.055 75.144 1.00 4.27  102 M 1 
ATOM   1583 H  HA   . CYS M  1 103 ? 148.905 106.272 72.824 1.00 4.27  102 M 1 
ATOM   1584 H  HB2  . CYS M  1 103 ? 147.991 103.688 73.453 1.00 4.27  102 M 1 
ATOM   1585 H  HB3  . CYS M  1 103 ? 148.161 104.199 71.960 1.00 4.27  102 M 1 
ATOM   1586 H  HG   . CYS M  1 103 ? 150.444 103.312 73.983 1.00 4.27  102 M 1 
ATOM   1587 N  N    . ALA M  1 104 ? 145.972 105.900 74.029 1.00 3.59  103 M 1 
ATOM   1588 C  CA   . ALA M  1 104 ? 144.597 106.367 73.899 1.00 3.59  103 M 1 
ATOM   1589 C  C    . ALA M  1 104 ? 144.523 107.884 74.011 1.00 3.59  103 M 1 
ATOM   1590 O  O    . ALA M  1 104 ? 143.741 108.529 73.307 1.00 3.59  103 M 1 
ATOM   1591 C  CB   . ALA M  1 104 ? 143.717 105.700 74.952 1.00 3.59  103 M 1 
ATOM   1592 H  H    . ALA M  1 104 ? 146.139 105.455 74.746 1.00 3.59  103 M 1 
ATOM   1593 H  HA   . ALA M  1 104 ? 144.259 106.114 73.026 1.00 3.59  103 M 1 
ATOM   1594 H  HB1  . ALA M  1 104 ? 142.844 106.122 74.943 1.00 3.59  103 M 1 
ATOM   1595 H  HB2  . ALA M  1 104 ? 143.625 104.758 74.741 1.00 3.59  103 M 1 
ATOM   1596 H  HB3  . ALA M  1 104 ? 144.128 105.802 75.825 1.00 3.59  103 M 1 
ATOM   1597 N  N    . LEU M  1 105 ? 145.337 108.468 74.889 1.00 3.78  104 M 1 
ATOM   1598 C  CA   . LEU M  1 105 ? 145.427 109.922 74.991 1.00 3.78  104 M 1 
ATOM   1599 C  C    . LEU M  1 105 ? 145.897 110.530 73.678 1.00 3.78  104 M 1 
ATOM   1600 O  O    . LEU M  1 105 ? 145.317 111.505 73.182 1.00 3.78  104 M 1 
ATOM   1601 C  CB   . LEU M  1 105 ? 146.367 110.302 76.139 1.00 3.78  104 M 1 
ATOM   1602 C  CG   . LEU M  1 105 ? 146.670 111.778 76.392 1.00 3.78  104 M 1 
ATOM   1603 C  CD1  . LEU M  1 105 ? 145.424 112.550 76.719 1.00 3.78  104 M 1 
ATOM   1604 C  CD2  . LEU M  1 105 ? 147.682 111.933 77.520 1.00 3.78  104 M 1 
ATOM   1605 H  H    . LEU M  1 105 ? 145.854 108.045 75.430 1.00 3.78  104 M 1 
ATOM   1606 H  HA   . LEU M  1 105 ? 144.547 110.272 75.200 1.00 3.78  104 M 1 
ATOM   1607 H  HB2  . LEU M  1 105 ? 145.973 109.969 76.960 1.00 3.78  104 M 1 
ATOM   1608 H  HB3  . LEU M  1 105 ? 147.217 109.853 76.006 1.00 3.78  104 M 1 
ATOM   1609 H  HG   . LEU M  1 105 ? 147.066 112.161 75.594 1.00 3.78  104 M 1 
ATOM   1610 H  HD11 . LEU M  1 105 ? 145.649 113.493 76.738 1.00 3.78  104 M 1 
ATOM   1611 H  HD12 . LEU M  1 105 ? 144.751 112.394 76.038 1.00 3.78  104 M 1 
ATOM   1612 H  HD13 . LEU M  1 105 ? 145.089 112.268 77.584 1.00 3.78  104 M 1 
ATOM   1613 H  HD21 . LEU M  1 105 ? 147.677 112.852 77.830 1.00 3.78  104 M 1 
ATOM   1614 H  HD22 . LEU M  1 105 ? 147.440 111.344 78.251 1.00 3.78  104 M 1 
ATOM   1615 H  HD23 . LEU M  1 105 ? 148.565 111.701 77.193 1.00 3.78  104 M 1 
ATOM   1616 N  N    . HIS M  1 106 ? 146.934 109.922 73.114 1.00 4.28  105 M 1 
ATOM   1617 C  CA   . HIS M  1 106 ? 147.520 110.383 71.834 1.00 4.28  105 M 1 
ATOM   1618 C  C    . HIS M  1 106 ? 146.438 110.299 70.751 1.00 4.28  105 M 1 
ATOM   1619 O  O    . HIS M  1 106 ? 146.286 111.244 70.023 1.00 4.28  105 M 1 
ATOM   1620 C  CB   . HIS M  1 106 ? 148.773 109.591 71.459 1.00 4.28  105 M 1 
ATOM   1621 C  CG   . HIS M  1 106 ? 149.411 110.133 70.226 1.00 4.28  105 M 1 
ATOM   1622 N  ND1  . HIS M  1 106 ? 150.540 110.923 70.253 1.00 4.28  105 M 1 
ATOM   1623 C  CD2  . HIS M  1 106 ? 149.036 110.055 68.935 1.00 4.28  105 M 1 
ATOM   1624 C  CE1  . HIS M  1 106 ? 150.858 111.276 69.023 1.00 4.28  105 M 1 
ATOM   1625 N  NE2  . HIS M  1 106 ? 149.945 110.764 68.197 1.00 4.28  105 M 1 
ATOM   1626 H  H    . HIS M  1 106 ? 147.356 109.193 73.463 1.00 4.28  105 M 1 
ATOM   1627 H  HA   . HIS M  1 106 ? 147.772 111.331 71.941 1.00 4.28  105 M 1 
ATOM   1628 H  HB2  . HIS M  1 106 ? 149.416 109.629 72.202 1.00 4.28  105 M 1 
ATOM   1629 H  HB3  . HIS M  1 106 ? 148.531 108.650 71.313 1.00 4.28  105 M 1 
ATOM   1630 H  HD2  . HIS M  1 106 ? 148.293 109.590 68.597 1.00 4.28  105 M 1 
ATOM   1631 H  HE1  . HIS M  1 106 ? 151.595 111.806 68.774 1.00 4.28  105 M 1 
ATOM   1632 H  HE2  . HIS M  1 106 ? 149.939 110.854 67.325 1.00 4.28  105 M 1 
ATOM   1633 N  N    . LEU M  1 107 ? 145.669 109.220 70.709 1.00 3.81  106 M 1 
ATOM   1634 C  CA   . LEU M  1 107 ? 144.621 109.008 69.718 1.00 3.81  106 M 1 
ATOM   1635 C  C    . LEU M  1 107 ? 143.511 110.042 69.856 1.00 3.81  106 M 1 
ATOM   1636 O  O    . LEU M  1 107 ? 143.052 110.622 68.865 1.00 3.81  106 M 1 
ATOM   1637 C  CB   . LEU M  1 107 ? 144.061 107.593 69.870 1.00 3.81  106 M 1 
ATOM   1638 C  CG   . LEU M  1 107 ? 142.912 107.169 68.954 1.00 3.81  106 M 1 
ATOM   1639 C  CD1  . LEU M  1 107 ? 143.350 107.247 67.519 1.00 3.81  106 M 1 
ATOM   1640 C  CD2  . LEU M  1 107 ? 142.426 105.770 69.294 1.00 3.81  106 M 1 
ATOM   1641 H  H    . LEU M  1 107 ? 145.758 108.572 71.268 1.00 3.81  106 M 1 
ATOM   1642 H  HA   . LEU M  1 107 ? 145.012 109.084 68.834 1.00 3.81  106 M 1 
ATOM   1643 H  HB2  . LEU M  1 107 ? 144.787 106.968 69.716 1.00 3.81  106 M 1 
ATOM   1644 H  HB3  . LEU M  1 107 ? 143.748 107.493 70.783 1.00 3.81  106 M 1 
ATOM   1645 H  HG   . LEU M  1 107 ? 142.159 107.768 69.075 1.00 3.81  106 M 1 
ATOM   1646 H  HD11 . LEU M  1 107 ? 142.668 106.841 66.962 1.00 3.81  106 M 1 
ATOM   1647 H  HD12 . LEU M  1 107 ? 143.463 108.179 67.276 1.00 3.81  106 M 1 
ATOM   1648 H  HD13 . LEU M  1 107 ? 144.193 106.777 67.423 1.00 3.81  106 M 1 
ATOM   1649 H  HD21 . LEU M  1 107 ? 141.544 105.640 68.911 1.00 3.81  106 M 1 
ATOM   1650 H  HD22 . LEU M  1 107 ? 143.047 105.123 68.923 1.00 3.81  106 M 1 
ATOM   1651 H  HD23 . LEU M  1 107 ? 142.374 105.669 70.257 1.00 3.81  106 M 1 
ATOM   1652 N  N    . GLU M  1 108 ? 143.069 110.235 71.091 1.00 4.12  107 M 1 
ATOM   1653 C  CA   . GLU M  1 108 ? 141.969 111.176 71.413 1.00 4.12  107 M 1 
ATOM   1654 C  C    . GLU M  1 108 ? 142.399 112.588 70.991 1.00 4.12  107 M 1 
ATOM   1655 O  O    . GLU M  1 108 ? 141.596 113.279 70.406 1.00 4.12  107 M 1 
ATOM   1656 C  CB   . GLU M  1 108 ? 141.587 111.054 72.884 1.00 4.12  107 M 1 
ATOM   1657 C  CG   . GLU M  1 108 ? 140.923 109.727 73.206 1.00 4.12  107 M 1 
ATOM   1658 C  CD   . GLU M  1 108 ? 139.792 109.399 72.241 1.00 4.12  107 M 1 
ATOM   1659 O  OE1  . GLU M  1 108 ? 138.811 110.143 72.219 1.00 4.12  107 M 1 
ATOM   1660 O  OE2  . GLU M  1 108 ? 139.909 108.409 71.485 1.00 4.12  107 M 1 
ATOM   1661 H  H    . GLU M  1 108 ? 143.492 109.895 71.822 1.00 4.12  107 M 1 
ATOM   1662 H  HA   . GLU M  1 108 ? 141.187 110.921 70.871 1.00 4.12  107 M 1 
ATOM   1663 H  HB2  . GLU M  1 108 ? 142.395 111.150 73.430 1.00 4.12  107 M 1 
ATOM   1664 H  HB3  . GLU M  1 108 ? 140.975 111.784 73.114 1.00 4.12  107 M 1 
ATOM   1665 H  HG2  . GLU M  1 108 ? 141.592 109.010 73.166 1.00 4.12  107 M 1 
ATOM   1666 H  HG3  . GLU M  1 108 ? 140.564 109.755 74.118 1.00 4.12  107 M 1 
ATOM   1667 N  N    . LYS M  1 109 ? 143.643 112.984 71.226 1.00 4.42  108 M 1 
ATOM   1668 C  CA   . LYS M  1 109 ? 144.089 114.320 70.843 1.00 4.42  108 M 1 
ATOM   1669 C  C    . LYS M  1 109 ? 144.176 114.453 69.325 1.00 4.42  108 M 1 
ATOM   1670 O  O    . LYS M  1 109 ? 143.880 115.518 68.773 1.00 4.42  108 M 1 
ATOM   1671 C  CB   . LYS M  1 109 ? 145.424 114.669 71.504 1.00 4.42  108 M 1 
ATOM   1672 C  CG   . LYS M  1 109 ? 145.316 114.840 73.017 1.00 4.42  108 M 1 
ATOM   1673 C  CD   . LYS M  1 109 ? 146.618 115.261 73.686 1.00 4.42  108 M 1 
ATOM   1674 C  CE   . LYS M  1 109 ? 146.896 116.730 73.440 1.00 4.42  108 M 1 
ATOM   1675 N  NZ   . LYS M  1 109 ? 148.084 117.253 74.164 1.00 4.42  108 M 1 
ATOM   1676 H  H    . LYS M  1 109 ? 144.242 112.493 71.600 1.00 4.42  108 M 1 
ATOM   1677 H  HA   . LYS M  1 109 ? 143.439 114.968 71.158 1.00 4.42  108 M 1 
ATOM   1678 H  HB2  . LYS M  1 109 ? 146.060 113.958 71.328 1.00 4.42  108 M 1 
ATOM   1679 H  HB3  . LYS M  1 109 ? 145.752 115.499 71.124 1.00 4.42  108 M 1 
ATOM   1680 H  HG2  . LYS M  1 109 ? 144.645 115.513 73.209 1.00 4.42  108 M 1 
ATOM   1681 H  HG3  . LYS M  1 109 ? 145.041 114.001 73.418 1.00 4.42  108 M 1 
ATOM   1682 H  HD2  . LYS M  1 109 ? 146.543 115.125 74.644 1.00 4.42  108 M 1 
ATOM   1683 H  HD3  . LYS M  1 109 ? 147.358 114.745 73.330 1.00 4.42  108 M 1 
ATOM   1684 H  HE2  . LYS M  1 109 ? 147.028 116.881 72.491 1.00 4.42  108 M 1 
ATOM   1685 H  HE3  . LYS M  1 109 ? 146.130 117.236 73.754 1.00 4.42  108 M 1 
ATOM   1686 H  HZ1  . LYS M  1 109 ? 147.963 118.112 74.361 1.00 4.42  108 M 1 
ATOM   1687 H  HZ2  . LYS M  1 109 ? 148.197 116.799 74.921 1.00 4.42  108 M 1 
ATOM   1688 H  HZ3  . LYS M  1 109 ? 148.814 117.172 73.661 1.00 4.42  108 M 1 
ATOM   1689 N  N    . SER M  1 110 ? 144.542 113.374 68.629 1.00 4.37  109 M 1 
ATOM   1690 C  CA   . SER M  1 110 ? 144.545 113.402 67.165 1.00 4.37  109 M 1 
ATOM   1691 C  C    . SER M  1 110 ? 143.136 113.581 66.609 1.00 4.37  109 M 1 
ATOM   1692 O  O    . SER M  1 110 ? 142.915 114.377 65.684 1.00 4.37  109 M 1 
ATOM   1693 C  CB   . SER M  1 110 ? 145.161 112.117 66.620 1.00 4.37  109 M 1 
ATOM   1694 O  OG   . SER M  1 110 ? 144.341 111.009 66.927 1.00 4.37  109 M 1 
ATOM   1695 H  H    . SER M  1 110 ? 144.787 112.625 68.973 1.00 4.37  109 M 1 
ATOM   1696 H  HA   . SER M  1 110 ? 145.089 114.145 66.862 1.00 4.37  109 M 1 
ATOM   1697 H  HB2  . SER M  1 110 ? 145.240 112.181 65.655 1.00 4.37  109 M 1 
ATOM   1698 H  HB3  . SER M  1 110 ? 146.039 111.988 67.011 1.00 4.37  109 M 1 
ATOM   1699 H  HG   . SER M  1 110 ? 144.057 111.077 67.715 1.00 4.37  109 M 1 
ATOM   1700 N  N    . VAL M  1 111 ? 142.176 112.838 67.158 1.00 4.23  110 M 1 
ATOM   1701 C  CA   . VAL M  1 111 ? 140.783 112.978 66.746 1.00 4.23  110 M 1 
ATOM   1702 C  C    . VAL M  1 111 ? 140.298 114.398 67.013 1.00 4.23  110 M 1 
ATOM   1703 O  O    . VAL M  1 111 ? 139.589 114.998 66.193 1.00 4.23  110 M 1 
ATOM   1704 C  CB   . VAL M  1 111 ? 139.905 111.926 67.453 1.00 4.23  110 M 1 
ATOM   1705 C  CG1  . VAL M  1 111 ? 138.430 112.153 67.153 1.00 4.23  110 M 1 
ATOM   1706 C  CG2  . VAL M  1 111 ? 140.296 110.511 67.023 1.00 4.23  110 M 1 
ATOM   1707 H  H    . VAL M  1 111 ? 142.302 112.255 67.777 1.00 4.23  110 M 1 
ATOM   1708 H  HA   . VAL M  1 111 ? 140.727 112.817 65.791 1.00 4.23  110 M 1 
ATOM   1709 H  HB   . VAL M  1 111 ? 140.028 111.997 68.412 1.00 4.23  110 M 1 
ATOM   1710 H  HG11 . VAL M  1 111 ? 137.929 111.367 67.422 1.00 4.23  110 M 1 
ATOM   1711 H  HG12 . VAL M  1 111 ? 138.098 112.918 67.649 1.00 4.23  110 M 1 
ATOM   1712 H  HG13 . VAL M  1 111 ? 138.322 112.290 66.199 1.00 4.23  110 M 1 
ATOM   1713 H  HG21 . VAL M  1 111 ? 139.830 109.881 67.595 1.00 4.23  110 M 1 
ATOM   1714 H  HG22 . VAL M  1 111 ? 140.028 110.373 66.101 1.00 4.23  110 M 1 
ATOM   1715 H  HG23 . VAL M  1 111 ? 141.253 110.372 67.097 1.00 4.23  110 M 1 
ATOM   1716 N  N    . ASN M  1 112 ? 140.717 114.929 68.153 1.00 4.52  111 M 1 
ATOM   1717 C  CA   . ASN M  1 112 ? 140.342 116.303 68.560 1.00 4.52  111 M 1 
ATOM   1718 C  C    . ASN M  1 112 ? 140.887 117.288 67.517 1.00 4.52  111 M 1 
ATOM   1719 O  O    . ASN M  1 112 ? 140.143 118.121 67.037 1.00 4.52  111 M 1 
ATOM   1720 C  CB   . ASN M  1 112 ? 140.871 116.639 69.955 1.00 4.52  111 M 1 
ATOM   1721 C  CG   . ASN M  1 112 ? 140.253 117.911 70.489 1.00 4.52  111 M 1 
ATOM   1722 O  OD1  . ASN M  1 112 ? 139.121 118.212 70.161 1.00 4.52  111 M 1 
ATOM   1723 N  ND2  . ASN M  1 112 ? 140.984 118.639 71.313 1.00 4.52  111 M 1 
ATOM   1724 H  H    . ASN M  1 112 ? 141.351 114.540 68.678 1.00 4.52  111 M 1 
ATOM   1725 H  HA   . ASN M  1 112 ? 139.358 116.369 68.580 1.00 4.52  111 M 1 
ATOM   1726 H  HB2  . ASN M  1 112 ? 140.666 115.899 70.563 1.00 4.52  111 M 1 
ATOM   1727 H  HB3  . ASN M  1 112 ? 141.843 116.744 69.913 1.00 4.52  111 M 1 
ATOM   1728 H  HD21 . ASN M  1 112 ? 141.775 118.347 71.578 1.00 4.52  111 M 1 
ATOM   1729 H  HD22 . ASN M  1 112 ? 140.683 119.419 71.599 1.00 4.52  111 M 1 
ATOM   1730 N  N    . GLN M  1 113 ? 142.141 117.072 67.128 1.00 5.11  112 M 1 
ATOM   1731 C  CA   . GLN M  1 113 ? 142.834 117.940 66.147 1.00 5.11  112 M 1 
ATOM   1732 C  C    . GLN M  1 113 ? 142.073 117.860 64.820 1.00 5.11  112 M 1 
ATOM   1733 O  O    . GLN M  1 113 ? 141.691 118.896 64.332 1.00 5.11  112 M 1 
ATOM   1734 C  CB   . GLN M  1 113 ? 144.297 117.557 65.966 1.00 5.11  112 M 1 
ATOM   1735 C  CG   . GLN M  1 113 ? 145.022 118.572 65.094 1.00 5.11  112 M 1 
ATOM   1736 C  CD   . GLN M  1 113 ? 144.785 119.967 65.611 1.00 5.11  112 M 1 
ATOM   1737 O  OE1  . GLN M  1 113 ? 145.184 120.306 66.717 1.00 5.11  112 M 1 
ATOM   1738 N  NE2  . GLN M  1 113 ? 144.062 120.770 64.847 1.00 5.11  112 M 1 
ATOM   1739 H  H    . GLN M  1 113 ? 142.599 116.316 67.344 1.00 5.11  112 M 1 
ATOM   1740 H  HA   . GLN M  1 113 ? 142.790 118.868 66.475 1.00 5.11  112 M 1 
ATOM   1741 H  HB2  . GLN M  1 113 ? 144.728 117.512 66.845 1.00 5.11  112 M 1 
ATOM   1742 H  HB3  . GLN M  1 113 ? 144.348 116.671 65.551 1.00 5.11  112 M 1 
ATOM   1743 H  HG2  . GLN M  1 113 ? 145.984 118.380 65.094 1.00 5.11  112 M 1 
ATOM   1744 H  HG3  . GLN M  1 113 ? 144.696 118.505 64.171 1.00 5.11  112 M 1 
ATOM   1745 H  HE21 . GLN M  1 113 ? 143.722 120.470 64.088 1.00 5.11  112 M 1 
ATOM   1746 H  HE22 . GLN M  1 113 ? 143.918 121.606 65.096 1.00 5.11  112 M 1 
ATOM   1747 N  N    . SER M  1 114 ? 141.629 116.668 64.416 0.55 4.90  113 M 1 
ATOM   1748 C  CA   . SER M  1 114 ? 140.863 116.555 63.144 0.55 4.90  113 M 1 
ATOM   1749 C  C    . SER M  1 114 ? 139.536 117.326 63.248 0.55 4.90  113 M 1 
ATOM   1750 O  O    . SER M  1 114 ? 139.168 118.017 62.297 0.55 4.90  113 M 1 
ATOM   1751 C  CB   . SER M  1 114 ? 140.631 115.110 62.773 0.55 4.90  113 M 1 
ATOM   1752 O  OG   . SER M  1 114 ? 139.747 114.492 63.686 0.55 4.90  113 M 1 
ATOM   1753 H  H    . SER M  1 114 ? 141.266 116.108 65.036 0.55 4.90  113 M 1 
ATOM   1754 H  HA   . SER M  1 114 ? 141.406 116.977 62.424 0.55 4.90  113 M 1 
ATOM   1755 H  HB2  . SER M  1 114 ? 140.252 115.063 61.866 0.55 4.90  113 M 1 
ATOM   1756 H  HB3  . SER M  1 114 ? 141.490 114.631 62.771 0.55 4.90  113 M 1 
ATOM   1757 H  HG   . SER M  1 114 ? 139.464 115.080 64.225 0.55 4.90  113 M 1 
ATOM   1758 N  N    . LEU M  1 115 ? 138.859 117.253 64.392 1.00 4.69  114 M 1 
ATOM   1759 C  CA   . LEU M  1 115 ? 137.594 117.954 64.591 1.00 4.69  114 M 1 
ATOM   1760 C  C    . LEU M  1 115 ? 137.776 119.467 64.575 1.00 4.69  114 M 1 
ATOM   1761 O  O    . LEU M  1 115 ? 136.914 120.196 64.076 1.00 4.69  114 M 1 
ATOM   1762 C  CB   . LEU M  1 115 ? 136.965 117.506 65.904 1.00 4.69  114 M 1 
ATOM   1763 C  CG   . LEU M  1 115 ? 136.436 116.074 65.961 1.00 4.69  114 M 1 
ATOM   1764 C  CD1  . LEU M  1 115 ? 136.142 115.718 67.392 1.00 4.69  114 M 1 
ATOM   1765 C  CD2  . LEU M  1 115 ? 135.185 115.889 65.113 1.00 4.69  114 M 1 
ATOM   1766 H  H    . LEU M  1 115 ? 139.121 116.786 65.065 1.00 4.69  114 M 1 
ATOM   1767 H  HA   . LEU M  1 115 ? 136.991 117.729 63.865 1.00 4.69  114 M 1 
ATOM   1768 H  HB2  . LEU M  1 115 ? 137.632 117.597 66.602 1.00 4.69  114 M 1 
ATOM   1769 H  HB3  . LEU M  1 115 ? 136.223 118.099 66.102 1.00 4.69  114 M 1 
ATOM   1770 H  HG   . LEU M  1 115 ? 137.112 115.463 65.628 1.00 4.69  114 M 1 
ATOM   1771 H  HD11 . LEU M  1 115 ? 135.645 114.886 67.426 1.00 4.69  114 M 1 
ATOM   1772 H  HD12 . LEU M  1 115 ? 136.992 115.614 67.847 1.00 4.69  114 M 1 
ATOM   1773 H  HD13 . LEU M  1 115 ? 135.636 116.432 67.811 1.00 4.69  114 M 1 
ATOM   1774 H  HD21 . LEU M  1 115 ? 135.004 114.939 65.032 1.00 4.69  114 M 1 
ATOM   1775 H  HD22 . LEU M  1 115 ? 134.437 116.323 65.552 1.00 4.69  114 M 1 
ATOM   1776 H  HD23 . LEU M  1 115 ? 135.315 116.259 64.226 1.00 4.69  114 M 1 
ATOM   1777 N  N    . LEU M  1 116 ? 138.878 119.960 65.131 1.00 5.05  115 M 1 
ATOM   1778 C  CA   . LEU M  1 116 ? 139.138 121.397 65.104 1.00 5.05  115 M 1 
ATOM   1779 C  C    . LEU M  1 116 ? 139.387 121.874 63.680 1.00 5.05  115 M 1 
ATOM   1780 O  O    . LEU M  1 116 ? 138.920 122.949 63.282 1.00 5.05  115 M 1 
ATOM   1781 C  CB   . LEU M  1 116 ? 140.322 121.733 66.011 1.00 5.05  115 M 1 
ATOM   1782 C  CG   . LEU M  1 116 ? 140.104 121.561 67.520 1.00 5.05  115 M 1 
ATOM   1783 C  CD1  . LEU M  1 116 ? 141.408 121.733 68.279 1.00 5.05  115 M 1 
ATOM   1784 C  CD2  . LEU M  1 116 ? 139.056 122.534 68.048 1.00 5.05  115 M 1 
ATOM   1785 H  H    . LEU M  1 116 ? 139.484 119.491 65.522 1.00 5.05  115 M 1 
ATOM   1786 H  HA   . LEU M  1 116 ? 138.360 121.870 65.437 1.00 5.05  115 M 1 
ATOM   1787 H  HB2  . LEU M  1 116 ? 141.064 121.161 65.761 1.00 5.05  115 M 1 
ATOM   1788 H  HB3  . LEU M  1 116 ? 140.578 122.655 65.850 1.00 5.05  115 M 1 
ATOM   1789 H  HG   . LEU M  1 116 ? 139.769 120.669 67.702 1.00 5.05  115 M 1 
ATOM   1790 H  HD11 . LEU M  1 116 ? 141.268 121.446 69.195 1.00 5.05  115 M 1 
ATOM   1791 H  HD12 . LEU M  1 116 ? 142.101 121.192 67.870 1.00 5.05  115 M 1 
ATOM   1792 H  HD13 . LEU M  1 116 ? 141.673 122.666 68.255 1.00 5.05  115 M 1 
ATOM   1793 H  HD21 . LEU M  1 116 ? 139.130 122.592 69.013 1.00 5.05  115 M 1 
ATOM   1794 H  HD22 . LEU M  1 116 ? 139.204 123.408 67.653 1.00 5.05  115 M 1 
ATOM   1795 H  HD23 . LEU M  1 116 ? 138.172 122.210 67.813 1.00 5.05  115 M 1 
ATOM   1796 N  N    . GLU M  1 117 ? 140.102 121.074 62.890 1.00 6.09  116 M 1 
ATOM   1797 C  CA   . GLU M  1 117 ? 140.283 121.391 61.476 1.00 6.09  116 M 1 
ATOM   1798 C  C    . GLU M  1 117 ? 138.942 121.417 60.745 1.00 6.09  116 M 1 
ATOM   1799 O  O    . GLU M  1 117 ? 138.692 122.295 59.908 1.00 6.09  116 M 1 
ATOM   1800 C  CB   . GLU M  1 117 ? 141.244 120.379 60.849 1.00 6.09  116 M 1 
ATOM   1801 C  CG   . GLU M  1 117 ? 142.676 120.511 61.372 1.00 6.09  116 M 1 
ATOM   1802 C  CD   . GLU M  1 117 ? 143.615 119.439 60.848 1.00 6.09  116 M 1 
ATOM   1803 O  OE1  . GLU M  1 117 ? 143.145 118.498 60.174 1.00 6.09  116 M 1 
ATOM   1804 O  OE2  . GLU M  1 117 ? 144.829 119.532 61.124 1.00 6.09  116 M 1 
ATOM   1805 H  H    . GLU M  1 117 ? 140.479 120.343 63.141 1.00 6.09  116 M 1 
ATOM   1806 H  HA   . GLU M  1 117 ? 140.686 122.270 61.398 1.00 6.09  116 M 1 
ATOM   1807 H  HB2  . GLU M  1 117 ? 140.938 119.480 61.047 1.00 6.09  116 M 1 
ATOM   1808 H  HB3  . GLU M  1 117 ? 141.261 120.514 59.889 1.00 6.09  116 M 1 
ATOM   1809 H  HG2  . GLU M  1 117 ? 143.029 121.370 61.094 1.00 6.09  116 M 1 
ATOM   1810 H  HG3  . GLU M  1 117 ? 142.679 120.468 62.341 1.00 6.09  116 M 1 
ATOM   1811 N  N    . LEU M  1 118 ? 138.050 120.493 61.095 1.00 5.44  117 M 1 
ATOM   1812 C  CA   . LEU M  1 118 ? 136.683 120.381 60.513 1.00 5.44  117 M 1 
ATOM   1813 C  C    . LEU M  1 118 ? 135.896 121.645 60.854 1.00 5.44  117 M 1 
ATOM   1814 O  O    . LEU M  1 118 ? 135.268 122.209 59.984 1.00 5.44  117 M 1 
ATOM   1815 C  CB   . LEU M  1 118 ? 136.001 119.162 61.135 1.00 5.44  117 M 1 
ATOM   1816 C  CG   . LEU M  1 118 ? 135.154 118.291 60.216 1.00 5.44  117 M 1 
ATOM   1817 C  CD1  . LEU M  1 118 ? 134.146 117.487 61.035 1.00 5.44  117 M 1 
ATOM   1818 C  CD2  . LEU M  1 118 ? 134.466 119.108 59.137 1.00 5.44  117 M 1 
ATOM   1819 H  H    . LEU M  1 118 ? 138.182 119.944 61.808 1.00 5.44  117 M 1 
ATOM   1820 H  HA   . LEU M  1 118 ? 136.748 120.280 59.536 1.00 5.44  117 M 1 
ATOM   1821 H  HB2  . LEU M  1 118 ? 136.695 118.598 61.532 1.00 5.44  117 M 1 
ATOM   1822 H  HB3  . LEU M  1 118 ? 135.431 119.476 61.865 1.00 5.44  117 M 1 
ATOM   1823 H  HG   . LEU M  1 118 ? 135.758 117.649 59.768 1.00 5.44  117 M 1 
ATOM   1824 H  HD11 . LEU M  1 118 ? 134.618 116.943 61.689 1.00 5.44  117 M 1 
ATOM   1825 H  HD12 . LEU M  1 118 ? 133.634 116.908 60.443 1.00 5.44  117 M 1 
ATOM   1826 H  HD13 . LEU M  1 118 ? 133.542 118.095 61.495 1.00 5.44  117 M 1 
ATOM   1827 H  HD21 . LEU M  1 118 ? 133.946 118.518 58.565 1.00 5.44  117 M 1 
ATOM   1828 H  HD22 . LEU M  1 118 ? 133.876 119.761 59.551 1.00 5.44  117 M 1 
ATOM   1829 H  HD23 . LEU M  1 118 ? 135.136 119.569 58.602 1.00 5.44  117 M 1 
ATOM   1830 N  N    . HIS M  1 119 ? 135.947 122.064 62.122 1.00 5.74  118 M 1 
ATOM   1831 C  CA   . HIS M  1 119 ? 135.252 123.284 62.608 1.00 5.74  118 M 1 
ATOM   1832 C  C    . HIS M  1 119 ? 135.812 124.508 61.869 1.00 5.74  118 M 1 
ATOM   1833 O  O    . HIS M  1 119 ? 135.030 125.369 61.545 1.00 5.74  118 M 1 
ATOM   1834 C  CB   . HIS M  1 119 ? 135.357 123.419 64.135 1.00 5.74  118 M 1 
ATOM   1835 C  CG   . HIS M  1 119 ? 134.535 124.536 64.685 1.00 5.74  118 M 1 
ATOM   1836 N  ND1  . HIS M  1 119 ? 134.975 125.837 64.658 1.00 5.74  118 M 1 
ATOM   1837 C  CD2  . HIS M  1 119 ? 133.302 124.564 65.235 1.00 5.74  118 M 1 
ATOM   1838 C  CE1  . HIS M  1 119 ? 134.060 126.618 65.183 1.00 5.74  118 M 1 
ATOM   1839 N  NE2  . HIS M  1 119 ? 133.035 125.861 65.563 1.00 5.74  118 M 1 
ATOM   1840 H  H    . HIS M  1 119 ? 136.410 121.635 62.778 1.00 5.74  118 M 1 
ATOM   1841 H  HA   . HIS M  1 119 ? 134.298 123.198 62.373 1.00 5.74  118 M 1 
ATOM   1842 H  HB2  . HIS M  1 119 ? 135.068 122.576 64.550 1.00 5.74  118 M 1 
ATOM   1843 H  HB3  . HIS M  1 119 ? 136.298 123.565 64.378 1.00 5.74  118 M 1 
ATOM   1844 H  HD1  . HIS M  1 119 ? 135.747 126.104 64.341 1.00 5.74  118 M 1 
ATOM   1845 H  HD2  . HIS M  1 119 ? 132.745 123.826 65.397 1.00 5.74  118 M 1 
ATOM   1846 H  HE1  . HIS M  1 119 ? 134.129 127.551 65.291 1.00 5.74  118 M 1 
ATOM   1847 H  HE2  . HIS M  1 119 ? 132.296 126.153 65.935 1.00 5.74  118 M 1 
ATOM   1848 N  N    . LYS M  1 120 ? 137.117 124.588 61.642 1.00 6.94  119 M 1 
ATOM   1849 C  CA   . LYS M  1 120 ? 137.704 125.731 60.953 1.00 6.94  119 M 1 
ATOM   1850 C  C    . LYS M  1 120 ? 137.252 125.769 59.501 1.00 6.94  119 M 1 
ATOM   1851 O  O    . LYS M  1 120 ? 136.968 126.841 58.957 1.00 6.94  119 M 1 
ATOM   1852 C  CB   . LYS M  1 120 ? 139.226 125.668 61.063 1.00 6.94  119 M 1 
ATOM   1853 C  CG   . LYS M  1 120 ? 139.965 126.875 60.528 1.00 6.94  119 M 1 
ATOM   1854 C  CD   . LYS M  1 120 ? 141.474 126.717 60.664 1.00 6.94  119 M 1 
ATOM   1855 C  CE   . LYS M  1 120 ? 141.924 126.836 62.124 1.00 6.94  119 M 1 
ATOM   1856 N  NZ   . LYS M  1 120 ? 143.405 126.855 62.278 1.00 6.94  119 M 1 
ATOM   1857 H  H    . LYS M  1 120 ? 137.682 123.981 61.870 1.00 6.94  119 M 1 
ATOM   1858 H  HA   . LYS M  1 120 ? 137.406 126.548 61.382 1.00 6.94  119 M 1 
ATOM   1859 H  HB2  . LYS M  1 120 ? 139.445 125.586 62.004 1.00 6.94  119 M 1 
ATOM   1860 H  HB3  . LYS M  1 120 ? 139.553 124.888 60.587 1.00 6.94  119 M 1 
ATOM   1861 H  HG2  . LYS M  1 120 ? 139.763 126.981 59.585 1.00 6.94  119 M 1 
ATOM   1862 H  HG3  . LYS M  1 120 ? 139.697 127.666 61.021 1.00 6.94  119 M 1 
ATOM   1863 H  HD2  . LYS M  1 120 ? 141.736 125.844 60.333 1.00 6.94  119 M 1 
ATOM   1864 H  HD3  . LYS M  1 120 ? 141.916 127.413 60.152 1.00 6.94  119 M 1 
ATOM   1865 H  HE2  . LYS M  1 120 ? 141.562 127.647 62.515 1.00 6.94  119 M 1 
ATOM   1866 H  HE3  . LYS M  1 120 ? 141.600 126.065 62.615 1.00 6.94  119 M 1 
ATOM   1867 H  HZ1  . LYS M  1 120 ? 143.619 127.107 63.104 1.00 6.94  119 M 1 
ATOM   1868 H  HZ2  . LYS M  1 120 ? 143.740 126.045 62.127 1.00 6.94  119 M 1 
ATOM   1869 H  HZ3  . LYS M  1 120 ? 143.762 127.429 61.699 1.00 6.94  119 M 1 
ATOM   1870 N  N    . LEU M  1 121 ? 137.154 124.601 58.866 1.00 6.89  120 M 1 
ATOM   1871 C  CA   . LEU M  1 121 ? 136.638 124.530 57.503 1.00 6.89  120 M 1 
ATOM   1872 C  C    . LEU M  1 121 ? 135.186 124.986 57.441 1.00 6.89  120 M 1 
ATOM   1873 O  O    . LEU M  1 121 ? 134.803 125.757 56.555 1.00 6.89  120 M 1 
ATOM   1874 C  CB   . LEU M  1 121 ? 136.786 123.102 56.978 1.00 6.89  120 M 1 
ATOM   1875 C  CG   . LEU M  1 121 ? 136.318 122.766 55.565 1.00 6.89  120 M 1 
ATOM   1876 C  CD1  . LEU M  1 121 ? 137.080 123.577 54.538 1.00 6.89  120 M 1 
ATOM   1877 C  CD2  . LEU M  1 121 ? 136.493 121.280 55.308 1.00 6.89  120 M 1 
ATOM   1878 H  H    . LEU M  1 121 ? 137.359 123.837 59.205 1.00 6.89  120 M 1 
ATOM   1879 H  HA   . LEU M  1 121 ? 137.162 125.118 56.936 1.00 6.89  120 M 1 
ATOM   1880 H  HB2  . LEU M  1 121 ? 137.730 122.882 57.011 1.00 6.89  120 M 1 
ATOM   1881 H  HB3  . LEU M  1 121 ? 136.308 122.511 57.580 1.00 6.89  120 M 1 
ATOM   1882 H  HG   . LEU M  1 121 ? 135.373 122.969 55.487 1.00 6.89  120 M 1 
ATOM   1883 H  HD11 . LEU M  1 121 ? 136.899 123.221 53.654 1.00 6.89  120 M 1 
ATOM   1884 H  HD12 . LEU M  1 121 ? 136.791 124.502 54.586 1.00 6.89  120 M 1 
ATOM   1885 H  HD13 . LEU M  1 121 ? 138.029 123.518 54.730 1.00 6.89  120 M 1 
ATOM   1886 H  HD21 . LEU M  1 121 ? 136.305 121.089 54.376 1.00 6.89  120 M 1 
ATOM   1887 H  HD22 . LEU M  1 121 ? 137.408 121.035 55.519 1.00 6.89  120 M 1 
ATOM   1888 H  HD23 . LEU M  1 121 ? 135.882 120.783 55.875 1.00 6.89  120 M 1 
ATOM   1889 N  N    . ALA M  1 122 ? 134.366 124.518 58.380 1.00 6.56  121 M 1 
ATOM   1890 C  CA   . ALA M  1 122 ? 132.956 124.884 58.403 1.00 6.56  121 M 1 
ATOM   1891 C  C    . ALA M  1 122 ? 132.772 126.373 58.681 1.00 6.56  121 M 1 
ATOM   1892 O  O    . ALA M  1 122 ? 131.834 126.996 58.172 1.00 6.56  121 M 1 
ATOM   1893 C  CB   . ALA M  1 122 ? 132.228 124.038 59.443 1.00 6.56  121 M 1 
ATOM   1894 H  H    . ALA M  1 122 ? 134.599 123.980 59.009 1.00 6.56  121 M 1 
ATOM   1895 H  HA   . ALA M  1 122 ? 132.566 124.688 57.537 1.00 6.56  121 M 1 
ATOM   1896 H  HB1  . ALA M  1 122 ? 131.302 124.321 59.497 1.00 6.56  121 M 1 
ATOM   1897 H  HB2  . ALA M  1 122 ? 132.279 123.107 59.175 1.00 6.56  121 M 1 
ATOM   1898 H  HB3  . ALA M  1 122 ? 132.657 124.155 60.305 1.00 6.56  121 M 1 
ATOM   1899 N  N    . THR M  1 123 ? 133.659 126.961 59.484 1.00 7.31  122 M 1 
ATOM   1900 C  CA   . THR M  1 123 ? 133.606 128.398 59.721 1.00 7.31  122 M 1 
ATOM   1901 C  C    . THR M  1 123 ? 134.046 129.166 58.482 1.00 7.31  122 M 1 
ATOM   1902 O  O    . THR M  1 123 ? 133.495 130.227 58.173 1.00 7.31  122 M 1 
ATOM   1903 C  CB   . THR M  1 123 ? 134.470 128.769 60.928 1.00 7.31  122 M 1 
ATOM   1904 O  OG1  . THR M  1 123 ? 133.960 128.120 62.097 1.00 7.31  122 M 1 
ATOM   1905 C  CG2  . THR M  1 123 ? 134.483 130.277 61.145 1.00 7.31  122 M 1 
ATOM   1906 H  H    . THR M  1 123 ? 134.302 126.556 59.886 1.00 7.31  122 M 1 
ATOM   1907 H  HA   . THR M  1 123 ? 132.694 128.650 59.934 1.00 7.31  122 M 1 
ATOM   1908 H  HB   . THR M  1 123 ? 135.385 128.481 60.782 1.00 7.31  122 M 1 
ATOM   1909 H  HG1  . THR M  1 123 ? 133.261 127.701 61.895 1.00 7.31  122 M 1 
ATOM   1910 H  HG21 . THR M  1 123 ? 134.748 130.484 62.055 1.00 7.31  122 M 1 
ATOM   1911 H  HG22 . THR M  1 123 ? 135.113 130.697 60.539 1.00 7.31  122 M 1 
ATOM   1912 H  HG23 . THR M  1 123 ? 133.599 130.644 60.988 1.00 7.31  122 M 1 
ATOM   1913 N  N    . ASP M  1 124 ? 135.030 128.636 57.753 1.00 8.30  123 M 1 
ATOM   1914 C  CA   . ASP M  1 124 ? 135.501 129.298 56.541 1.00 8.30  123 M 1 
ATOM   1915 C  C    . ASP M  1 124 ? 134.428 129.291 55.460 1.00 8.30  123 M 1 
ATOM   1916 O  O    . ASP M  1 124 ? 134.339 130.227 54.657 1.00 8.30  123 M 1 
ATOM   1917 C  CB   . ASP M  1 124 ? 136.770 128.620 56.028 1.00 8.30  123 M 1 
ATOM   1918 C  CG   . ASP M  1 124 ? 137.366 129.322 54.822 1.00 8.30  123 M 1 
ATOM   1919 O  OD1  . ASP M  1 124 ? 136.811 130.351 54.385 1.00 8.30  123 M 1 
ATOM   1920 O  OD2  . ASP M  1 124 ? 138.392 128.834 54.304 1.00 8.30  123 M 1 
ATOM   1921 H  H    . ASP M  1 124 ? 135.429 127.895 57.930 1.00 8.30  123 M 1 
ATOM   1922 H  HA   . ASP M  1 124 ? 135.715 130.220 56.753 1.00 8.30  123 M 1 
ATOM   1923 H  HB2  . ASP M  1 124 ? 137.433 128.611 56.737 1.00 8.30  123 M 1 
ATOM   1924 H  HB3  . ASP M  1 124 ? 136.561 127.710 55.765 1.00 8.30  123 M 1 
ATOM   1925 N  N    . LYS M  1 125 ? 133.639 128.218 55.448 1.00 7.98  124 M 1 
ATOM   1926 C  CA   . LYS M  1 125 ? 132.537 127.992 54.479 1.00 7.98  124 M 1 
ATOM   1927 C  C    . LYS M  1 125 ? 131.232 128.616 54.993 1.00 7.98  124 M 1 
ATOM   1928 O  O    . LYS M  1 125 ? 130.244 128.495 54.287 1.00 7.98  124 M 1 
ATOM   1929 C  CB   . LYS M  1 125 ? 132.390 126.495 54.199 1.00 7.98  124 M 1 
ATOM   1930 C  CG   . LYS M  1 125 ? 133.616 125.856 53.570 1.00 7.98  124 M 1 
ATOM   1931 C  CD   . LYS M  1 125 ? 134.148 126.682 52.423 1.00 7.98  124 M 1 
ATOM   1932 C  CE   . LYS M  1 125 ? 135.243 126.000 51.635 1.00 7.98  124 M 1 
ATOM   1933 N  NZ   . LYS M  1 125 ? 135.481 126.687 50.345 1.00 7.98  124 M 1 
ATOM   1934 H  H    . LYS M  1 125 ? 133.694 127.571 56.087 1.00 7.98  124 M 1 
ATOM   1935 H  HA   . LYS M  1 125 ? 132.780 128.441 53.637 1.00 7.98  124 M 1 
ATOM   1936 H  HB2  . LYS M  1 125 ? 132.195 126.037 55.044 1.00 7.98  124 M 1 
ATOM   1937 H  HB3  . LYS M  1 125 ? 131.625 126.363 53.602 1.00 7.98  124 M 1 
ATOM   1938 H  HG2  . LYS M  1 125 ? 134.314 125.758 54.252 1.00 7.98  124 M 1 
ATOM   1939 H  HG3  . LYS M  1 125 ? 133.380 124.961 53.244 1.00 7.98  124 M 1 
ATOM   1940 H  HD2  . LYS M  1 125 ? 133.408 126.894 51.815 1.00 7.98  124 M 1 
ATOM   1941 H  HD3  . LYS M  1 125 ? 134.496 127.528 52.777 1.00 7.98  124 M 1 
ATOM   1942 H  HE2  . LYS M  1 125 ? 136.069 126.000 52.154 1.00 7.98  124 M 1 
ATOM   1943 H  HE3  . LYS M  1 125 ? 134.993 125.073 51.461 1.00 7.98  124 M 1 
ATOM   1944 H  HZ1  . LYS M  1 125 ? 136.152 126.274 49.896 1.00 7.98  124 M 1 
ATOM   1945 H  HZ2  . LYS M  1 125 ? 134.728 126.664 49.841 1.00 7.98  124 M 1 
ATOM   1946 H  HZ3  . LYS M  1 125 ? 135.712 127.551 50.495 1.00 7.98  124 M 1 
ATOM   1947 N  N    . ASN M  1 126 ? 131.229 129.276 56.154 1.00 8.52  125 M 1 
ATOM   1948 C  CA   . ASN M  1 126 ? 130.015 129.901 56.741 1.00 8.52  125 M 1 
ATOM   1949 C  C    . ASN M  1 126 ? 128.888 128.867 56.820 1.00 8.52  125 M 1 
ATOM   1950 O  O    . ASN M  1 126 ? 127.810 129.160 56.312 1.00 8.52  125 M 1 
ATOM   1951 C  CB   . ASN M  1 126 ? 129.529 131.135 55.978 1.00 8.52  125 M 1 
ATOM   1952 C  CG   . ASN M  1 126 ? 130.525 132.269 56.008 1.00 8.52  125 M 1 
ATOM   1953 O  OD1  . ASN M  1 126 ? 130.814 132.840 54.977 1.00 8.52  125 M 1 
ATOM   1954 N  ND2  . ASN M  1 126 ? 131.085 132.562 57.168 1.00 8.52  125 M 1 
ATOM   1955 H  H    . ASN M  1 126 ? 131.987 129.495 56.603 1.00 8.52  125 M 1 
ATOM   1956 H  HA   . ASN M  1 126 ? 130.235 130.189 57.658 1.00 8.52  125 M 1 
ATOM   1957 H  HB2  . ASN M  1 126 ? 129.357 130.885 55.047 1.00 8.52  125 M 1 
ATOM   1958 H  HB3  . ASN M  1 126 ? 128.685 131.439 56.371 1.00 8.52  125 M 1 
ATOM   1959 H  HD21 . ASN M  1 126 ? 130.925 132.059 57.876 1.00 8.52  125 M 1 
ATOM   1960 H  HD22 . ASN M  1 126 ? 131.621 133.262 57.235 1.00 8.52  125 M 1 
ATOM   1961 N  N    . ASP M  1 127 ? 129.169 127.682 57.357 1.00 6.70  126 M 1 
ATOM   1962 C  CA   . ASP M  1 127 ? 128.151 126.617 57.571 1.00 6.70  126 M 1 
ATOM   1963 C  C    . ASP M  1 127 ? 127.847 126.621 59.071 1.00 6.70  126 M 1 
ATOM   1964 O  O    . ASP M  1 127 ? 128.430 125.802 59.748 1.00 6.70  126 M 1 
ATOM   1965 C  CB   . ASP M  1 127 ? 128.649 125.263 57.062 1.00 6.70  126 M 1 
ATOM   1966 C  CG   . ASP M  1 127 ? 127.592 124.162 57.047 1.00 6.70  126 M 1 
ATOM   1967 O  OD1  . ASP M  1 127 ? 126.669 124.198 57.869 1.00 6.70  126 M 1 
ATOM   1968 O  OD2  . ASP M  1 127 ? 127.711 123.274 56.207 1.00 6.70  126 M 1 
ATOM   1969 H  H    . ASP M  1 127 ? 130.003 127.458 57.645 1.00 6.70  126 M 1 
ATOM   1970 H  HA   . ASP M  1 127 ? 127.350 126.846 57.064 1.00 6.70  126 M 1 
ATOM   1971 H  HB2  . ASP M  1 127 ? 128.987 125.374 56.150 1.00 6.70  126 M 1 
ATOM   1972 H  HB3  . ASP M  1 127 ? 129.391 124.967 57.628 1.00 6.70  126 M 1 
ATOM   1973 N  N    . PRO M  1 128 ? 126.965 127.479 59.619 1.00 5.77  127 M 1 
ATOM   1974 C  CA   . PRO M  1 128 ? 126.741 127.524 61.065 1.00 5.77  127 M 1 
ATOM   1975 C  C    . PRO M  1 128 ? 126.225 126.213 61.679 1.00 5.77  127 M 1 
ATOM   1976 O  O    . PRO M  1 128 ? 126.600 125.891 62.754 1.00 5.77  127 M 1 
ATOM   1977 C  CB   . PRO M  1 128 ? 125.692 128.634 61.255 1.00 5.77  127 M 1 
ATOM   1978 C  CG   . PRO M  1 128 ? 125.083 128.814 59.877 1.00 5.77  127 M 1 
ATOM   1979 C  CD   . PRO M  1 128 ? 126.196 128.501 58.906 1.00 5.77  127 M 1 
ATOM   1980 H  HA   . PRO M  1 128 ? 127.581 127.794 61.513 1.00 5.77  127 M 1 
ATOM   1981 H  HB2  . PRO M  1 128 ? 125.010 128.365 61.906 1.00 5.77  127 M 1 
ATOM   1982 H  HB3  . PRO M  1 128 ? 126.113 129.466 61.561 1.00 5.77  127 M 1 
ATOM   1983 H  HG2  . PRO M  1 128 ? 124.330 128.202 59.749 1.00 5.77  127 M 1 
ATOM   1984 H  HG3  . PRO M  1 128 ? 124.766 129.732 59.755 1.00 5.77  127 M 1 
ATOM   1985 H  HD2  . PRO M  1 128 ? 125.845 128.154 58.065 1.00 5.77  127 M 1 
ATOM   1986 H  HD3  . PRO M  1 128 ? 126.741 129.289 58.725 1.00 5.77  127 M 1 
ATOM   1987 N  N    . HIS M  1 129 ? 125.348 125.514 60.982 1.00 5.02  128 M 1 
ATOM   1988 C  CA   . HIS M  1 129 ? 124.765 124.273 61.476 1.00 5.02  128 M 1 
ATOM   1989 C  C    . HIS M  1 129 ? 125.834 123.227 61.751 1.00 5.02  128 M 1 
ATOM   1990 O  O    . HIS M  1 129 ? 125.834 122.585 62.805 1.00 5.02  128 M 1 
ATOM   1991 C  CB   . HIS M  1 129 ? 123.744 123.740 60.480 1.00 5.02  128 M 1 
ATOM   1992 C  CG   . HIS M  1 129 ? 123.184 122.415 60.872 1.00 5.02  128 M 1 
ATOM   1993 N  ND1  . HIS M  1 129 ? 123.741 121.229 60.452 1.00 5.02  128 M 1 
ATOM   1994 C  CD2  . HIS M  1 129 ? 122.173 122.082 61.706 1.00 5.02  128 M 1 
ATOM   1995 C  CE1  . HIS M  1 129 ? 123.067 120.221 60.972 1.00 5.02  128 M 1 
ATOM   1996 N  NE2  . HIS M  1 129 ? 122.113 120.712 61.739 1.00 5.02  128 M 1 
ATOM   1997 H  H    . HIS M  1 129 ? 125.099 125.746 60.192 1.00 5.02  128 M 1 
ATOM   1998 H  HA   . HIS M  1 129 ? 124.296 124.455 62.305 1.00 5.02  128 M 1 
ATOM   1999 H  HB2  . HIS M  1 129 ? 123.005 124.365 60.417 1.00 5.02  128 M 1 
ATOM   2000 H  HB3  . HIS M  1 129 ? 124.156 123.652 59.606 1.00 5.02  128 M 1 
ATOM   2001 H  HD2  . HIS M  1 129 ? 121.611 122.670 62.158 1.00 5.02  128 M 1 
ATOM   2002 H  HE1  . HIS M  1 129 ? 123.240 119.319 60.828 1.00 5.02  128 M 1 
ATOM   2003 H  HE2  . HIS M  1 129 ? 121.547 120.247 62.189 1.00 5.02  128 M 1 
ATOM   2004 N  N    . LEU M  1 130 ? 126.756 123.052 60.813 1.00 5.28  129 M 1 
ATOM   2005 C  CA   . LEU M  1 130 ? 127.830 122.084 60.980 1.00 5.28  129 M 1 
ATOM   2006 C  C    . LEU M  1 130 ? 128.739 122.462 62.142 1.00 5.28  129 M 1 
ATOM   2007 O  O    . LEU M  1 130 ? 129.133 121.600 62.940 1.00 5.28  129 M 1 
ATOM   2008 C  CB   . LEU M  1 130 ? 128.616 121.985 59.676 1.00 5.28  129 M 1 
ATOM   2009 C  CG   . LEU M  1 130 ? 129.788 121.014 59.622 1.00 5.28  129 M 1 
ATOM   2010 C  CD1  . LEU M  1 130 ? 129.324 119.615 59.936 1.00 5.28  129 M 1 
ATOM   2011 C  CD2  . LEU M  1 130 ? 130.428 121.058 58.252 1.00 5.28  129 M 1 
ATOM   2012 H  H    . LEU M  1 130 ? 126.778 123.490 60.073 1.00 5.28  129 M 1 
ATOM   2013 H  HA   . LEU M  1 130 ? 127.435 121.218 61.169 1.00 5.28  129 M 1 
ATOM   2014 H  HB2  . LEU M  1 130 ? 128.001 121.743 58.966 1.00 5.28  129 M 1 
ATOM   2015 H  HB3  . LEU M  1 130 ? 128.971 122.866 59.479 1.00 5.28  129 M 1 
ATOM   2016 H  HG   . LEU M  1 130 ? 130.459 121.278 60.271 1.00 5.28  129 M 1 
ATOM   2017 H  HD11 . LEU M  1 130 ? 129.948 118.980 59.550 1.00 5.28  129 M 1 
ATOM   2018 H  HD12 . LEU M  1 130 ? 129.297 119.505 60.899 1.00 5.28  129 M 1 
ATOM   2019 H  HD13 . LEU M  1 130 ? 128.439 119.477 59.562 1.00 5.28  129 M 1 
ATOM   2020 H  HD21 . LEU M  1 130 ? 131.261 120.562 58.278 1.00 5.28  129 M 1 
ATOM   2021 H  HD22 . LEU M  1 130 ? 129.823 120.652 57.612 1.00 5.28  129 M 1 
ATOM   2022 H  HD23 . LEU M  1 130 ? 130.597 121.979 57.999 1.00 5.28  129 M 1 
ATOM   2023 N  N    . CYS M  1 131 ? 129.088 123.745 62.240 1.00 5.91  130 M 1 
ATOM   2024 C  CA   . CYS M  1 131 ? 129.904 124.227 63.347 1.00 5.91  130 M 1 
ATOM   2025 C  C    . CYS M  1 131 ? 129.253 123.901 64.682 1.00 5.91  130 M 1 
ATOM   2026 O  O    . CYS M  1 131 ? 129.891 123.335 65.574 1.00 5.91  130 M 1 
ATOM   2027 C  CB   . CYS M  1 131 ? 130.131 125.729 63.203 1.00 5.91  130 M 1 
ATOM   2028 S  SG   . CYS M  1 131 ? 131.134 126.159 61.782 1.00 5.91  130 M 1 
ATOM   2029 H  H    . CYS M  1 131 ? 128.856 124.353 61.678 1.00 5.91  130 M 1 
ATOM   2030 H  HA   . CYS M  1 131 ? 130.777 123.805 63.314 1.00 5.91  130 M 1 
ATOM   2031 H  HB2  . CYS M  1 131 ? 129.273 126.171 63.104 1.00 5.91  130 M 1 
ATOM   2032 H  HB3  . CYS M  1 131 ? 130.578 126.060 63.998 1.00 5.91  130 M 1 
ATOM   2033 H  HG   . CYS M  1 131 ? 130.449 126.104 60.798 1.00 5.91  130 M 1 
ATOM   2034 N  N    . ASP M  1 132 ? 127.967 124.217 64.820 1.00 5.48  131 M 1 
ATOM   2035 C  CA   . ASP M  1 132 ? 127.281 123.991 66.084 1.00 5.48  131 M 1 
ATOM   2036 C  C    . ASP M  1 132 ? 127.145 122.505 66.376 1.00 5.48  131 M 1 
ATOM   2037 O  O    . ASP M  1 132 ? 127.222 122.085 67.531 1.00 5.48  131 M 1 
ATOM   2038 C  CB   . ASP M  1 132 ? 125.909 124.656 66.064 1.00 5.48  131 M 1 
ATOM   2039 C  CG   . ASP M  1 132 ? 125.215 124.578 67.402 1.00 5.48  131 M 1 
ATOM   2040 O  OD1  . ASP M  1 132 ? 125.634 125.300 68.328 1.00 5.48  131 M 1 
ATOM   2041 O  OD2  . ASP M  1 132 ? 124.254 123.795 67.528 1.00 5.48  131 M 1 
ATOM   2042 H  H    . ASP M  1 132 ? 127.475 124.553 64.200 1.00 5.48  131 M 1 
ATOM   2043 H  HA   . ASP M  1 132 ? 127.803 124.396 66.794 1.00 5.48  131 M 1 
ATOM   2044 H  HB2  . ASP M  1 132 ? 126.005 125.590 65.820 1.00 5.48  131 M 1 
ATOM   2045 H  HB3  . ASP M  1 132 ? 125.348 124.203 65.415 1.00 5.48  131 M 1 
ATOM   2046 N  N    . PHE M  1 133 ? 126.935 121.698 65.339 1.00 4.96  132 M 1 
ATOM   2047 C  CA   . PHE M  1 133 ? 126.879 120.250 65.500 1.00 4.96  132 M 1 
ATOM   2048 C  C    . PHE M  1 133 ? 128.176 119.716 66.096 1.00 4.96  132 M 1 
ATOM   2049 O  O    . PHE M  1 133 ? 128.164 118.980 67.093 1.00 4.96  132 M 1 
ATOM   2050 C  CB   . PHE M  1 133 ? 126.616 119.617 64.138 1.00 4.96  132 M 1 
ATOM   2051 C  CG   . PHE M  1 133 ? 126.460 118.140 64.172 1.00 4.96  132 M 1 
ATOM   2052 C  CD1  . PHE M  1 133 ? 125.267 117.579 64.563 1.00 4.96  132 M 1 
ATOM   2053 C  CD2  . PHE M  1 133 ? 127.501 117.309 63.819 1.00 4.96  132 M 1 
ATOM   2054 C  CE1  . PHE M  1 133 ? 125.111 116.227 64.590 1.00 4.96  132 M 1 
ATOM   2055 C  CE2  . PHE M  1 133 ? 127.340 115.952 63.850 1.00 4.96  132 M 1 
ATOM   2056 C  CZ   . PHE M  1 133 ? 126.146 115.419 64.239 1.00 4.96  132 M 1 
ATOM   2057 H  H    . PHE M  1 133 ? 126.826 121.970 64.531 1.00 4.96  132 M 1 
ATOM   2058 H  HA   . PHE M  1 133 ? 126.144 120.020 66.090 1.00 4.96  132 M 1 
ATOM   2059 H  HB2  . PHE M  1 133 ? 125.790 119.981 63.782 1.00 4.96  132 M 1 
ATOM   2060 H  HB3  . PHE M  1 133 ? 127.343 119.833 63.533 1.00 4.96  132 M 1 
ATOM   2061 H  HD1  . PHE M  1 133 ? 124.556 118.129 64.802 1.00 4.96  132 M 1 
ATOM   2062 H  HD2  . PHE M  1 133 ? 128.317 117.667 63.553 1.00 4.96  132 M 1 
ATOM   2063 H  HE1  . PHE M  1 133 ? 124.299 115.859 64.854 1.00 4.96  132 M 1 
ATOM   2064 H  HE2  . PHE M  1 133 ? 128.043 115.393 63.610 1.00 4.96  132 M 1 
ATOM   2065 H  HZ   . PHE M  1 133 ? 126.034 114.496 64.259 1.00 4.96  132 M 1 
ATOM   2066 N  N    . ILE M  1 134 ? 129.305 120.104 65.501 1.00 5.03  133 M 1 
ATOM   2067 C  CA   . ILE M  1 134 ? 130.616 119.674 65.982 1.00 5.03  133 M 1 
ATOM   2068 C  C    . ILE M  1 134 ? 130.840 120.153 67.413 1.00 5.03  133 M 1 
ATOM   2069 O  O    . ILE M  1 134 ? 131.305 119.397 68.272 1.00 5.03  133 M 1 
ATOM   2070 C  CB   . ILE M  1 134 ? 131.719 120.176 65.028 1.00 5.03  133 M 1 
ATOM   2071 C  CG1  . ILE M  1 134 ? 131.577 119.558 63.624 1.00 5.03  133 M 1 
ATOM   2072 C  CG2  . ILE M  1 134 ? 133.105 119.929 65.596 1.00 5.03  133 M 1 
ATOM   2073 C  CD1  . ILE M  1 134 ? 131.748 118.039 63.534 1.00 5.03  133 M 1 
ATOM   2074 H  H    . ILE M  1 134 ? 129.335 120.630 64.821 1.00 5.03  133 M 1 
ATOM   2075 H  HA   . ILE M  1 134 ? 130.642 118.704 65.994 1.00 5.03  133 M 1 
ATOM   2076 H  HB   . ILE M  1 134 ? 131.619 121.137 64.938 1.00 5.03  133 M 1 
ATOM   2077 H  HG12 . ILE M  1 134 ? 130.691 119.745 63.277 1.00 5.03  133 M 1 
ATOM   2078 H  HG13 . ILE M  1 134 ? 132.226 119.978 63.038 1.00 5.03  133 M 1 
ATOM   2079 H  HG21 . ILE M  1 134 ? 133.751 120.040 64.881 1.00 5.03  133 M 1 
ATOM   2080 H  HG22 . ILE M  1 134 ? 133.296 120.575 66.294 1.00 5.03  133 M 1 
ATOM   2081 H  HG23 . ILE M  1 134 ? 133.155 119.026 65.946 1.00 5.03  133 M 1 
ATOM   2082 H  HD11 . ILE M  1 134 ? 131.674 117.779 62.602 1.00 5.03  133 M 1 
ATOM   2083 H  HD12 . ILE M  1 134 ? 132.622 117.784 63.869 1.00 5.03  133 M 1 
ATOM   2084 H  HD13 . ILE M  1 134 ? 131.051 117.593 64.041 1.00 5.03  133 M 1 
ATOM   2085 N  N    . GLU M  1 135 ? 130.489 121.403 67.667 1.00 5.70  134 M 1 
ATOM   2086 C  CA   . GLU M  1 135 ? 130.686 122.013 69.003 1.00 5.70  134 M 1 
ATOM   2087 C  C    . GLU M  1 135 ? 129.853 121.255 70.039 1.00 5.70  134 M 1 
ATOM   2088 O  O    . GLU M  1 135 ? 130.444 120.817 71.036 1.00 5.70  134 M 1 
ATOM   2089 C  CB   . GLU M  1 135 ? 130.277 123.487 68.999 1.00 5.70  134 M 1 
ATOM   2090 C  CG   . GLU M  1 135 ? 131.234 124.397 68.267 1.00 5.70  134 M 1 
ATOM   2091 C  CD   . GLU M  1 135 ? 130.626 125.767 68.005 1.00 5.70  134 M 1 
ATOM   2092 O  OE1  . GLU M  1 135 ? 129.620 126.068 68.646 1.00 5.70  134 M 1 
ATOM   2093 O  OE2  . GLU M  1 135 ? 131.138 126.504 67.151 1.00 5.70  134 M 1 
ATOM   2094 H  H    . GLU M  1 135 ? 129.997 121.908 67.091 1.00 5.70  134 M 1 
ATOM   2095 H  HA   . GLU M  1 135 ? 131.639 121.943 69.245 1.00 5.70  134 M 1 
ATOM   2096 H  HB2  . GLU M  1 135 ? 129.391 123.562 68.586 1.00 5.70  134 M 1 
ATOM   2097 H  HB3  . GLU M  1 135 ? 130.200 123.790 69.927 1.00 5.70  134 M 1 
ATOM   2098 H  HG2  . GLU M  1 135 ? 132.051 124.508 68.798 1.00 5.70  134 M 1 
ATOM   2099 H  HG3  . GLU M  1 135 ? 131.482 123.989 67.409 1.00 5.70  134 M 1 
ATOM   2100 N  N    . THR M  1 136 ? 128.607 120.926 69.710 1.00 5.69  135 M 1 
ATOM   2101 C  CA   . THR M  1 136 ? 127.648 120.409 70.673 1.00 5.69  135 M 1 
ATOM   2102 C  C    . THR M  1 136 ? 127.901 118.943 70.981 1.00 5.69  135 M 1 
ATOM   2103 O  O    . THR M  1 136 ? 127.792 118.527 72.139 1.00 5.69  135 M 1 
ATOM   2104 C  CB   . THR M  1 136 ? 126.231 120.615 70.132 1.00 5.69  135 M 1 
ATOM   2105 O  OG1  . THR M  1 136 ? 125.987 122.016 69.958 1.00 5.69  135 M 1 
ATOM   2106 C  CG2  . THR M  1 136 ? 125.180 120.022 71.054 1.00 5.69  135 M 1 
ATOM   2107 H  H    . THR M  1 136 ? 128.290 121.021 68.916 1.00 5.69  135 M 1 
ATOM   2108 H  HA   . THR M  1 136 ? 127.735 120.908 71.500 1.00 5.69  135 M 1 
ATOM   2109 H  HB   . THR M  1 136 ? 126.146 120.171 69.274 1.00 5.69  135 M 1 
ATOM   2110 H  HG1  . THR M  1 136 ? 126.306 122.271 69.224 1.00 5.69  135 M 1 
ATOM   2111 H  HG21 . THR M  1 136 ? 124.308 120.381 70.826 1.00 5.69  135 M 1 
ATOM   2112 H  HG22 . THR M  1 136 ? 125.137 119.058 70.952 1.00 5.69  135 M 1 
ATOM   2113 H  HG23 . THR M  1 136 ? 125.382 120.243 71.977 1.00 5.69  135 M 1 
ATOM   2114 N  N    . TYR M  1 137 ? 128.255 118.148 69.967 1.00 5.32  136 M 1 
ATOM   2115 C  CA   . TYR M  1 137 ? 128.285 116.699 70.109 1.00 5.32  136 M 1 
ATOM   2116 C  C    . TYR M  1 137 ? 129.681 116.086 70.112 1.00 5.32  136 M 1 
ATOM   2117 O  O    . TYR M  1 137 ? 129.812 114.924 70.507 1.00 5.32  136 M 1 
ATOM   2118 C  CB   . TYR M  1 137 ? 127.446 116.053 68.996 1.00 5.32  136 M 1 
ATOM   2119 C  CG   . TYR M  1 137 ? 125.993 116.445 69.078 1.00 5.32  136 M 1 
ATOM   2120 C  CD1  . TYR M  1 137 ? 125.173 115.917 70.061 1.00 5.32  136 M 1 
ATOM   2121 C  CD2  . TYR M  1 137 ? 125.435 117.320 68.164 1.00 5.32  136 M 1 
ATOM   2122 C  CE1  . TYR M  1 137 ? 123.854 116.266 70.149 1.00 5.32  136 M 1 
ATOM   2123 C  CE2  . TYR M  1 137 ? 124.109 117.674 68.238 1.00 5.32  136 M 1 
ATOM   2124 C  CZ   . TYR M  1 137 ? 123.318 117.142 69.235 1.00 5.32  136 M 1 
ATOM   2125 O  OH   . TYR M  1 137 ? 121.991 117.479 69.329 1.00 5.32  136 M 1 
ATOM   2126 H  H    . TYR M  1 137 ? 128.481 118.435 69.189 1.00 5.32  136 M 1 
ATOM   2127 H  HA   . TYR M  1 137 ? 127.872 116.438 70.947 1.00 5.32  136 M 1 
ATOM   2128 H  HB2  . TYR M  1 137 ? 127.794 116.325 68.132 1.00 5.32  136 M 1 
ATOM   2129 H  HB3  . TYR M  1 137 ? 127.491 115.087 69.065 1.00 5.32  136 M 1 
ATOM   2130 H  HD1  . TYR M  1 137 ? 125.528 115.329 70.687 1.00 5.32  136 M 1 
ATOM   2131 H  HD2  . TYR M  1 137 ? 125.965 117.681 67.491 1.00 5.32  136 M 1 
ATOM   2132 H  HE1  . TYR M  1 137 ? 123.322 115.905 70.821 1.00 5.32  136 M 1 
ATOM   2133 H  HE2  . TYR M  1 137 ? 123.756 118.269 67.616 1.00 5.32  136 M 1 
ATOM   2134 H  HH   . TYR M  1 137 ? 121.786 118.019 68.719 1.00 5.32  136 M 1 
ATOM   2135 N  N    . TYR M  1 138 ? 130.715 116.820 69.695 1.00 4.75  137 M 1 
ATOM   2136 C  CA   . TYR M  1 138 ? 132.058 116.267 69.521 1.00 4.75  137 M 1 
ATOM   2137 C  C    . TYR M  1 138 ? 133.140 116.945 70.353 1.00 4.75  137 M 1 
ATOM   2138 O  O    . TYR M  1 138 ? 133.898 116.247 71.032 1.00 4.75  137 M 1 
ATOM   2139 C  CB   . TYR M  1 138 ? 132.409 116.289 68.026 1.00 4.75  137 M 1 
ATOM   2140 C  CG   . TYR M  1 138 ? 131.612 115.244 67.293 1.00 4.75  137 M 1 
ATOM   2141 C  CD1  . TYR M  1 138 ? 132.096 113.958 67.141 1.00 4.75  137 M 1 
ATOM   2142 C  CD2  . TYR M  1 138 ? 130.320 115.500 66.879 1.00 4.75  137 M 1 
ATOM   2143 C  CE1  . TYR M  1 138 ? 131.360 112.991 66.518 1.00 4.75  137 M 1 
ATOM   2144 C  CE2  . TYR M  1 138 ? 129.567 114.535 66.263 1.00 4.75  137 M 1 
ATOM   2145 C  CZ   . TYR M  1 138 ? 130.093 113.277 66.087 1.00 4.75  137 M 1 
ATOM   2146 O  OH   . TYR M  1 138 ? 129.368 112.286 65.485 1.00 4.75  137 M 1 
ATOM   2147 H  H    . TYR M  1 138 ? 130.649 117.652 69.486 1.00 4.75  137 M 1 
ATOM   2148 H  HA   . TYR M  1 138 ? 132.058 115.331 69.774 1.00 4.75  137 M 1 
ATOM   2149 H  HB2  . TYR M  1 138 ? 132.226 117.161 67.643 1.00 4.75  137 M 1 
ATOM   2150 H  HB3  . TYR M  1 138 ? 133.350 116.078 67.917 1.00 4.75  137 M 1 
ATOM   2151 H  HD1  . TYR M  1 138 ? 132.959 113.757 67.423 1.00 4.75  137 M 1 
ATOM   2152 H  HD2  . TYR M  1 138 ? 129.963 116.350 66.999 1.00 4.75  137 M 1 
ATOM   2153 H  HE1  . TYR M  1 138 ? 131.714 112.139 66.400 1.00 4.75  137 M 1 
ATOM   2154 H  HE2  . TYR M  1 138 ? 128.706 114.734 65.975 1.00 4.75  137 M 1 
ATOM   2155 H  HH   . TYR M  1 138 ? 129.810 111.572 65.461 1.00 4.75  137 M 1 
ATOM   2156 N  N    . LEU M  1 139 ? 133.243 118.277 70.343 1.00 5.15  138 M 1 
ATOM   2157 C  CA   . LEU M  1 139 ? 134.409 118.924 70.952 1.00 5.15  138 M 1 
ATOM   2158 C  C    . LEU M  1 139 ? 134.414 118.788 72.475 1.00 5.15  138 M 1 
ATOM   2159 O  O    . LEU M  1 139 ? 135.460 118.504 73.074 1.00 5.15  138 M 1 
ATOM   2160 C  CB   . LEU M  1 139 ? 134.485 120.398 70.541 1.00 5.15  138 M 1 
ATOM   2161 C  CG   . LEU M  1 139 ? 134.810 120.765 69.087 1.00 5.15  138 M 1 
ATOM   2162 C  CD1  . LEU M  1 139 ? 134.728 122.282 68.909 1.00 5.15  138 M 1 
ATOM   2163 C  CD2  . LEU M  1 139 ? 136.168 120.241 68.631 1.00 5.15  138 M 1 
ATOM   2164 H  H    . LEU M  1 139 ? 132.663 118.816 70.008 1.00 5.15  138 M 1 
ATOM   2165 H  HA   . LEU M  1 139 ? 135.217 118.493 70.633 1.00 5.15  138 M 1 
ATOM   2166 H  HB2  . LEU M  1 139 ? 133.626 120.801 70.744 1.00 5.15  138 M 1 
ATOM   2167 H  HB3  . LEU M  1 139 ? 135.163 120.828 71.085 1.00 5.15  138 M 1 
ATOM   2168 H  HG   . LEU M  1 139 ? 134.147 120.368 68.501 1.00 5.15  138 M 1 
ATOM   2169 H  HD11 . LEU M  1 139 ? 134.996 122.514 68.006 1.00 5.15  138 M 1 
ATOM   2170 H  HD12 . LEU M  1 139 ? 133.819 122.579 69.071 1.00 5.15  138 M 1 
ATOM   2171 H  HD13 . LEU M  1 139 ? 135.323 122.712 69.543 1.00 5.15  138 M 1 
ATOM   2172 H  HD21 . LEU M  1 139 ? 136.264 120.441 67.687 1.00 5.15  138 M 1 
ATOM   2173 H  HD22 . LEU M  1 139 ? 136.878 120.678 69.128 1.00 5.15  138 M 1 
ATOM   2174 H  HD23 . LEU M  1 139 ? 136.219 119.282 68.765 1.00 5.15  138 M 1 
ATOM   2175 N  N    . SER M  1 140 ? 133.263 118.984 73.122 1.00 5.52  139 M 1 
ATOM   2176 C  CA   . SER M  1 140 ? 133.212 118.887 74.580 1.00 5.52  139 M 1 
ATOM   2177 C  C    . SER M  1 140 ? 133.454 117.457 75.050 1.00 5.52  139 M 1 
ATOM   2178 O  O    . SER M  1 140 ? 134.145 117.230 76.053 1.00 5.52  139 M 1 
ATOM   2179 C  CB   . SER M  1 140 ? 131.870 119.403 75.101 1.00 5.52  139 M 1 
ATOM   2180 O  OG   . SER M  1 140 ? 131.723 120.784 74.840 1.00 5.52  139 M 1 
ATOM   2181 H  H    . SER M  1 140 ? 132.513 119.176 72.748 1.00 5.52  139 M 1 
ATOM   2182 H  HA   . SER M  1 140 ? 133.909 119.450 74.952 1.00 5.52  139 M 1 
ATOM   2183 H  HB2  . SER M  1 140 ? 131.153 118.933 74.647 1.00 5.52  139 M 1 
ATOM   2184 H  HB3  . SER M  1 140 ? 131.806 119.255 76.058 1.00 5.52  139 M 1 
ATOM   2185 H  HG   . SER M  1 140 ? 130.981 121.049 75.132 1.00 5.52  139 M 1 
ATOM   2186 N  N    . GLU M  1 141 ? 132.881 116.482 74.341 1.00 5.44  140 M 1 
ATOM   2187 C  CA   . GLU M  1 141 ? 133.127 115.075 74.648 1.00 5.44  140 M 1 
ATOM   2188 C  C    . GLU M  1 141 ? 134.614 114.753 74.571 1.00 5.44  140 M 1 
ATOM   2189 O  O    . GLU M  1 141 ? 135.157 114.061 75.441 1.00 5.44  140 M 1 
ATOM   2190 C  CB   . GLU M  1 141 ? 132.330 114.187 73.684 1.00 5.44  140 M 1 
ATOM   2191 C  CG   . GLU M  1 141 ? 132.429 112.681 73.926 1.00 5.44  140 M 1 
ATOM   2192 C  CD   . GLU M  1 141 ? 133.700 112.071 73.369 1.00 5.44  140 M 1 
ATOM   2193 O  OE1  . GLU M  1 141 ? 134.274 112.642 72.421 1.00 5.44  140 M 1 
ATOM   2194 O  OE2  . GLU M  1 141 ? 134.137 111.025 73.895 1.00 5.44  140 M 1 
ATOM   2195 H  H    . GLU M  1 141 ? 132.350 116.619 73.678 1.00 5.44  140 M 1 
ATOM   2196 H  HA   . GLU M  1 141 ? 132.818 114.891 75.549 1.00 5.44  140 M 1 
ATOM   2197 H  HB2  . GLU M  1 141 ? 131.391 114.422 73.750 1.00 5.44  140 M 1 
ATOM   2198 H  HB3  . GLU M  1 141 ? 132.635 114.353 72.778 1.00 5.44  140 M 1 
ATOM   2199 H  HG2  . GLU M  1 141 ? 132.425 112.522 74.882 1.00 5.44  140 M 1 
ATOM   2200 H  HG3  . GLU M  1 141 ? 131.671 112.224 73.528 1.00 5.44  140 M 1 
ATOM   2201 N  N    . GLN M  1 142 ? 135.292 115.259 73.542 1.00 4.79  141 M 1 
ATOM   2202 C  CA   . GLN M  1 142 ? 136.713 114.986 73.383 1.00 4.79  141 M 1 
ATOM   2203 C  C    . GLN M  1 142 ? 137.530 115.642 74.486 1.00 4.79  141 M 1 
ATOM   2204 O  O    . GLN M  1 142 ? 138.505 115.063 74.971 1.00 4.79  141 M 1 
ATOM   2205 C  CB   . GLN M  1 142 ? 137.196 115.455 72.011 1.00 4.79  141 M 1 
ATOM   2206 C  CG   . GLN M  1 142 ? 136.700 114.641 70.837 1.00 4.79  141 M 1 
ATOM   2207 C  CD   . GLN M  1 142 ? 137.195 113.215 70.874 1.00 4.79  141 M 1 
ATOM   2208 O  OE1  . GLN M  1 142 ? 136.418 112.283 71.061 1.00 4.79  141 M 1 
ATOM   2209 N  NE2  . GLN M  1 142 ? 138.501 113.044 70.749 1.00 4.79  141 M 1 
ATOM   2210 H  H    . GLN M  1 142 ? 134.959 115.766 72.933 1.00 4.79  141 M 1 
ATOM   2211 H  HA   . GLN M  1 142 ? 136.847 114.028 73.454 1.00 4.79  141 M 1 
ATOM   2212 H  HB2  . GLN M  1 142 ? 136.902 116.370 71.877 1.00 4.79  141 M 1 
ATOM   2213 H  HB3  . GLN M  1 142 ? 138.165 115.421 71.989 1.00 4.79  141 M 1 
ATOM   2214 H  HG2  . GLN M  1 142 ? 135.730 114.621 70.832 1.00 4.79  141 M 1 
ATOM   2215 H  HG3  . GLN M  1 142 ? 137.031 115.050 70.022 1.00 4.79  141 M 1 
ATOM   2216 H  HE21 . GLN M  1 142 ? 139.007 113.729 70.633 1.00 4.79  141 M 1 
ATOM   2217 H  HE22 . GLN M  1 142 ? 138.848 112.257 70.771 1.00 4.79  141 M 1 
ATOM   2218 N  N    . VAL M  1 143 ? 137.154 116.857 74.890 1.00 4.49  142 M 1 
ATOM   2219 C  CA   . VAL M  1 143 ? 137.859 117.519 75.985 1.00 4.49  142 M 1 
ATOM   2220 C  C    . VAL M  1 143 ? 137.719 116.709 77.269 1.00 4.49  142 M 1 
ATOM   2221 O  O    . VAL M  1 143 ? 138.703 116.478 77.990 1.00 4.49  142 M 1 
ATOM   2222 C  CB   . VAL M  1 143 ? 137.350 118.966 76.144 1.00 4.49  142 M 1 
ATOM   2223 C  CG1  . VAL M  1 143 ? 137.845 119.590 77.428 1.00 4.49  142 M 1 
ATOM   2224 C  CG2  . VAL M  1 143 ? 137.827 119.821 74.969 1.00 4.49  142 M 1 
ATOM   2225 H  H    . VAL M  1 143 ? 136.490 117.304 74.577 1.00 4.49  142 M 1 
ATOM   2226 H  HA   . VAL M  1 143 ? 138.802 117.565 75.764 1.00 4.49  142 M 1 
ATOM   2227 H  HB   . VAL M  1 143 ? 136.380 118.968 76.157 1.00 4.49  142 M 1 
ATOM   2228 H  HG11 . VAL M  1 143 ? 137.733 120.551 77.358 1.00 4.49  142 M 1 
ATOM   2229 H  HG12 . VAL M  1 143 ? 137.317 119.266 78.174 1.00 4.49  142 M 1 
ATOM   2230 H  HG13 . VAL M  1 143 ? 138.783 119.383 77.559 1.00 4.49  142 M 1 
ATOM   2231 H  HG21 . VAL M  1 143 ? 137.236 120.583 74.866 1.00 4.49  142 M 1 
ATOM   2232 H  HG22 . VAL M  1 143 ? 138.728 120.131 75.150 1.00 4.49  142 M 1 
ATOM   2233 H  HG23 . VAL M  1 143 ? 137.831 119.297 74.152 1.00 4.49  142 M 1 
ATOM   2234 N  N    . LYS M  1 144 ? 136.507 116.220 77.544 1.00 4.83  143 M 1 
ATOM   2235 C  CA   . LYS M  1 144 ? 136.288 115.404 78.735 1.00 4.83  143 M 1 
ATOM   2236 C  C    . LYS M  1 144 ? 137.105 114.119 78.678 1.00 4.83  143 M 1 
ATOM   2237 O  O    . LYS M  1 144 ? 137.698 113.704 79.680 1.00 4.83  143 M 1 
ATOM   2238 C  CB   . LYS M  1 144 ? 134.801 115.079 78.899 1.00 4.83  143 M 1 
ATOM   2239 C  CG   . LYS M  1 144 ? 133.922 116.256 79.272 1.00 4.83  143 M 1 
ATOM   2240 C  CD   . LYS M  1 144 ? 132.501 115.808 79.620 1.00 4.83  143 M 1 
ATOM   2241 C  CE   . LYS M  1 144 ? 131.707 115.401 78.389 1.00 4.83  143 M 1 
ATOM   2242 N  NZ   . LYS M  1 144 ? 130.284 115.092 78.707 1.00 4.83  143 M 1 
ATOM   2243 H  H    . LYS M  1 144 ? 135.811 116.327 77.050 1.00 4.83  143 M 1 
ATOM   2244 H  HA   . LYS M  1 144 ? 136.569 115.910 79.514 1.00 4.83  143 M 1 
ATOM   2245 H  HB2  . LYS M  1 144 ? 134.473 114.724 78.058 1.00 4.83  143 M 1 
ATOM   2246 H  HB3  . LYS M  1 144 ? 134.693 114.412 79.595 1.00 4.83  143 M 1 
ATOM   2247 H  HG2  . LYS M  1 144 ? 134.301 116.702 80.045 1.00 4.83  143 M 1 
ATOM   2248 H  HG3  . LYS M  1 144 ? 133.865 116.875 78.527 1.00 4.83  143 M 1 
ATOM   2249 H  HD2  . LYS M  1 144 ? 132.542 115.043 80.215 1.00 4.83  143 M 1 
ATOM   2250 H  HD3  . LYS M  1 144 ? 132.032 116.540 80.050 1.00 4.83  143 M 1 
ATOM   2251 H  HE2  . LYS M  1 144 ? 131.724 116.123 77.741 1.00 4.83  143 M 1 
ATOM   2252 H  HE3  . LYS M  1 144 ? 132.098 114.597 78.012 1.00 4.83  143 M 1 
ATOM   2253 H  HZ1  . LYS M  1 144 ? 129.888 114.729 77.997 1.00 4.83  143 M 1 
ATOM   2254 H  HZ2  . LYS M  1 144 ? 130.240 114.522 79.389 1.00 4.83  143 M 1 
ATOM   2255 H  HZ3  . LYS M  1 144 ? 129.853 115.839 78.925 1.00 4.83  143 M 1 
ATOM   2256 N  N    . SER M  1 145 ? 137.167 113.489 77.507 1.00 4.26  144 M 1 
ATOM   2257 C  CA   . SER M  1 145 ? 137.864 112.212 77.389 1.00 4.26  144 M 1 
ATOM   2258 C  C    . SER M  1 145 ? 139.374 112.391 77.507 1.00 4.26  144 M 1 
ATOM   2259 O  O    . SER M  1 145 ? 140.058 111.572 78.133 1.00 4.26  144 M 1 
ATOM   2260 C  CB   . SER M  1 145 ? 137.494 111.546 76.069 1.00 4.26  144 M 1 
ATOM   2261 O  OG   . SER M  1 145 ? 136.114 111.241 76.049 1.00 4.26  144 M 1 
ATOM   2262 H  H    . SER M  1 145 ? 136.834 113.784 76.771 1.00 4.26  144 M 1 
ATOM   2263 H  HA   . SER M  1 145 ? 137.575 111.628 78.108 1.00 4.26  144 M 1 
ATOM   2264 H  HB2  . SER M  1 145 ? 137.692 112.151 75.337 1.00 4.26  144 M 1 
ATOM   2265 H  HB3  . SER M  1 145 ? 138.006 110.728 75.968 1.00 4.26  144 M 1 
ATOM   2266 H  HG   . SER M  1 145 ? 135.685 111.835 76.460 1.00 4.26  144 M 1 
ATOM   2267 N  N    . ILE M  1 146 ? 139.906 113.464 76.921 1.00 3.93  145 M 1 
ATOM   2268 C  CA   . ILE M  1 146 ? 141.327 113.772 77.054 1.00 3.93  145 M 1 
ATOM   2269 C  C    . ILE M  1 146 ? 141.676 114.000 78.517 1.00 3.93  145 M 1 
ATOM   2270 O  O    . ILE M  1 146 ? 142.687 113.494 79.012 1.00 3.93  145 M 1 
ATOM   2271 C  CB   . ILE M  1 146 ? 141.700 114.985 76.176 1.00 3.93  145 M 1 
ATOM   2272 C  CG1  . ILE M  1 146 ? 141.605 114.623 74.688 1.00 3.93  145 M 1 
ATOM   2273 C  CG2  . ILE M  1 146 ? 143.080 115.516 76.549 1.00 3.93  145 M 1 
ATOM   2274 C  CD1  . ILE M  1 146 ? 141.639 115.802 73.726 1.00 3.93  145 M 1 
ATOM   2275 H  H    . ILE M  1 146 ? 139.459 114.044 76.469 1.00 3.93  145 M 1 
ATOM   2276 H  HA   . ILE M  1 146 ? 141.845 113.016 76.736 1.00 3.93  145 M 1 
ATOM   2277 H  HB   . ILE M  1 146 ? 141.057 115.690 76.348 1.00 3.93  145 M 1 
ATOM   2278 H  HG12 . ILE M  1 146 ? 142.348 114.041 74.462 1.00 3.93  145 M 1 
ATOM   2279 H  HG13 . ILE M  1 146 ? 140.779 114.139 74.530 1.00 3.93  145 M 1 
ATOM   2280 H  HG21 . ILE M  1 146 ? 143.453 116.028 75.814 1.00 3.93  145 M 1 
ATOM   2281 H  HG22 . ILE M  1 146 ? 143.004 116.096 77.322 1.00 3.93  145 M 1 
ATOM   2282 H  HG23 . ILE M  1 146 ? 143.670 114.772 76.744 1.00 3.93  145 M 1 
ATOM   2283 H  HD11 . ILE M  1 146 ? 141.513 115.471 72.823 1.00 3.93  145 M 1 
ATOM   2284 H  HD12 . ILE M  1 146 ? 140.926 116.419 73.952 1.00 3.93  145 M 1 
ATOM   2285 H  HD13 . ILE M  1 146 ? 142.493 116.259 73.778 1.00 3.93  145 M 1 
ATOM   2286 N  N    . LYS M  1 147 ? 140.838 114.750 79.232 1.00 3.89  146 M 1 
ATOM   2287 C  CA   . LYS M  1 147 ? 141.100 115.021 80.643 1.00 3.89  146 M 1 
ATOM   2288 C  C    . LYS M  1 147 ? 141.039 113.741 81.475 1.00 3.89  146 M 1 
ATOM   2289 O  O    . LYS M  1 147 ? 141.881 113.521 82.354 1.00 3.89  146 M 1 
ATOM   2290 C  CB   . LYS M  1 147 ? 140.111 116.076 81.137 1.00 3.89  146 M 1 
ATOM   2291 C  CG   . LYS M  1 147 ? 140.203 116.479 82.594 1.00 3.89  146 M 1 
ATOM   2292 C  CD   . LYS M  1 147 ? 141.543 117.081 82.931 1.00 3.89  146 M 1 
ATOM   2293 C  CE   . LYS M  1 147 ? 141.512 117.806 84.271 1.00 3.89  146 M 1 
ATOM   2294 N  NZ   . LYS M  1 147 ? 141.164 116.952 85.399 1.00 3.89  146 M 1 
ATOM   2295 H  H    . LYS M  1 147 ? 140.115 115.097 78.920 1.00 3.89  146 M 1 
ATOM   2296 H  HA   . LYS M  1 147 ? 141.991 115.394 80.726 1.00 3.89  146 M 1 
ATOM   2297 H  HB2  . LYS M  1 147 ? 140.260 116.884 80.621 1.00 3.89  146 M 1 
ATOM   2298 H  HB3  . LYS M  1 147 ? 139.208 115.763 80.971 1.00 3.89  146 M 1 
ATOM   2299 H  HG2  . LYS M  1 147 ? 139.522 117.145 82.774 1.00 3.89  146 M 1 
ATOM   2300 H  HG3  . LYS M  1 147 ? 140.052 115.711 83.167 1.00 3.89  146 M 1 
ATOM   2301 H  HD2  . LYS M  1 147 ? 142.200 116.369 82.982 1.00 3.89  146 M 1 
ATOM   2302 H  HD3  . LYS M  1 147 ? 141.797 117.719 82.246 1.00 3.89  146 M 1 
ATOM   2303 H  HE2  . LYS M  1 147 ? 142.398 118.159 84.450 1.00 3.89  146 M 1 
ATOM   2304 H  HE3  . LYS M  1 147 ? 140.870 118.533 84.241 1.00 3.89  146 M 1 
ATOM   2305 H  HZ1  . LYS M  1 147 ? 140.321 116.682 85.309 1.00 3.89  146 M 1 
ATOM   2306 H  HZ2  . LYS M  1 147 ? 141.684 116.230 85.411 1.00 3.89  146 M 1 
ATOM   2307 H  HZ3  . LYS M  1 147 ? 141.256 117.398 86.164 1.00 3.89  146 M 1 
ATOM   2308 N  N    . GLU M  1 148 ? 140.069 112.873 81.186 1.00 3.93  147 M 1 
ATOM   2309 C  CA   . GLU M  1 148 ? 139.953 111.593 81.882 1.00 3.93  147 M 1 
ATOM   2310 C  C    . GLU M  1 148 ? 141.201 110.738 81.676 1.00 3.93  147 M 1 
ATOM   2311 O  O    . GLU M  1 148 ? 141.770 110.195 82.632 1.00 3.93  147 M 1 
ATOM   2312 C  CB   . GLU M  1 148 ? 138.707 110.863 81.379 1.00 3.93  147 M 1 
ATOM   2313 C  CG   . GLU M  1 148 ? 138.412 109.544 82.057 1.00 3.93  147 M 1 
ATOM   2314 C  CD   . GLU M  1 148 ? 137.135 108.897 81.547 1.00 3.93  147 M 1 
ATOM   2315 O  OE1  . GLU M  1 148 ? 136.491 109.475 80.647 1.00 3.93  147 M 1 
ATOM   2316 O  OE2  . GLU M  1 148 ? 136.772 107.813 82.046 1.00 3.93  147 M 1 
ATOM   2317 H  H    . GLU M  1 148 ? 139.476 112.996 80.575 1.00 3.93  147 M 1 
ATOM   2318 H  HA   . GLU M  1 148 ? 139.842 111.748 82.833 1.00 3.93  147 M 1 
ATOM   2319 H  HB2  . GLU M  1 148 ? 137.937 111.438 81.511 1.00 3.93  147 M 1 
ATOM   2320 H  HB3  . GLU M  1 148 ? 138.820 110.688 80.432 1.00 3.93  147 M 1 
ATOM   2321 H  HG2  . GLU M  1 148 ? 139.142 108.926 81.893 1.00 3.93  147 M 1 
ATOM   2322 H  HG3  . GLU M  1 148 ? 138.316 109.694 83.011 1.00 3.93  147 M 1 
ATOM   2323 N  N    . LEU M  1 149 ? 141.633 110.603 80.423 1.00 3.53  148 M 1 
ATOM   2324 C  CA   . LEU M  1 149 ? 142.801 109.782 80.110 1.00 3.53  148 M 1 
ATOM   2325 C  C    . LEU M  1 149 ? 144.070 110.354 80.727 1.00 3.53  148 M 1 
ATOM   2326 O  O    . LEU M  1 149 ? 144.912 109.604 81.235 1.00 3.53  148 M 1 
ATOM   2327 C  CB   . LEU M  1 149 ? 142.940 109.646 78.594 1.00 3.53  148 M 1 
ATOM   2328 C  CG   . LEU M  1 149 ? 141.908 108.748 77.901 1.00 3.53  148 M 1 
ATOM   2329 C  CD1  . LEU M  1 149 ? 141.939 108.934 76.394 1.00 3.53  148 M 1 
ATOM   2330 C  CD2  . LEU M  1 149 ? 142.163 107.282 78.252 1.00 3.53  148 M 1 
ATOM   2331 H  H    . LEU M  1 149 ? 141.264 110.980 79.743 1.00 3.53  148 M 1 
ATOM   2332 H  HA   . LEU M  1 149 ? 142.663 108.899 80.487 1.00 3.53  148 M 1 
ATOM   2333 H  HB2  . LEU M  1 149 ? 142.866 110.527 78.196 1.00 3.53  148 M 1 
ATOM   2334 H  HB3  . LEU M  1 149 ? 143.824 109.298 78.397 1.00 3.53  148 M 1 
ATOM   2335 H  HG   . LEU M  1 149 ? 141.017 108.970 78.215 1.00 3.53  148 M 1 
ATOM   2336 H  HD11 . LEU M  1 149 ? 141.323 108.313 75.976 1.00 3.53  148 M 1 
ATOM   2337 H  HD12 . LEU M  1 149 ? 141.662 109.840 76.186 1.00 3.53  148 M 1 
ATOM   2338 H  HD13 . LEU M  1 149 ? 142.840 108.782 76.068 1.00 3.53  148 M 1 
ATOM   2339 H  HD21 . LEU M  1 149 ? 141.692 106.719 77.618 1.00 3.53  148 M 1 
ATOM   2340 H  HD22 . LEU M  1 149 ? 143.113 107.090 78.213 1.00 3.53  148 M 1 
ATOM   2341 H  HD23 . LEU M  1 149 ? 141.832 107.102 79.146 1.00 3.53  148 M 1 
ATOM   2342 N  N    . GLY M  1 150 ? 144.227 111.677 80.690 1.00 3.59  149 M 1 
ATOM   2343 C  CA   . GLY M  1 150 ? 145.373 112.298 81.331 1.00 3.59  149 M 1 
ATOM   2344 C  C    . GLY M  1 150 ? 145.401 112.034 82.822 1.00 3.59  149 M 1 
ATOM   2345 O  O    . GLY M  1 150 ? 146.454 111.747 83.394 1.00 3.59  149 M 1 
ATOM   2346 H  H    . GLY M  1 150 ? 143.677 112.226 80.321 1.00 3.59  149 M 1 
ATOM   2347 H  HA2  . GLY M  1 150 ? 146.196 111.985 80.925 1.00 3.59  149 M 1 
ATOM   2348 H  HA3  . GLY M  1 150 ? 145.322 113.257 81.197 1.00 3.59  149 M 1 
ATOM   2349 N  N    . ASP M  1 151 ? 144.233 112.095 83.464 1.00 3.83  150 M 1 
ATOM   2350 C  CA   . ASP M  1 151 ? 144.141 111.783 84.884 1.00 3.83  150 M 1 
ATOM   2351 C  C    . ASP M  1 151 ? 144.541 110.337 85.159 1.00 3.83  150 M 1 
ATOM   2352 O  O    . ASP M  1 151 ? 145.269 110.058 86.121 1.00 3.83  150 M 1 
ATOM   2353 C  CB   . ASP M  1 151 ? 142.722 112.049 85.382 1.00 3.83  150 M 1 
ATOM   2354 C  CG   . ASP M  1 151 ? 142.356 113.522 85.358 1.00 3.83  150 M 1 
ATOM   2355 O  OD1  . ASP M  1 151 ? 143.268 114.366 85.450 1.00 3.83  150 M 1 
ATOM   2356 O  OD2  . ASP M  1 151 ? 141.152 113.836 85.264 1.00 3.83  150 M 1 
ATOM   2357 H  H    . ASP M  1 151 ? 143.483 112.301 83.098 1.00 3.83  150 M 1 
ATOM   2358 H  HA   . ASP M  1 151 ? 144.747 112.358 85.377 1.00 3.83  150 M 1 
ATOM   2359 H  HB2  . ASP M  1 151 ? 142.097 111.579 84.809 1.00 3.83  150 M 1 
ATOM   2360 H  HB3  . ASP M  1 151 ? 142.633 111.725 86.292 1.00 3.83  150 M 1 
ATOM   2361 N  N    . HIS M  1 152 ? 144.078 109.425 84.300 1.00 3.63  151 M 1 
ATOM   2362 C  CA   . HIS M  1 152 ? 144.374 107.967 84.419 1.00 3.63  151 M 1 
ATOM   2363 C  C    . HIS M  1 152 ? 145.893 107.773 84.328 1.00 3.63  151 M 1 
ATOM   2364 O  O    . HIS M  1 152 ? 146.470 107.176 85.208 1.00 3.63  151 M 1 
ATOM   2365 C  CB   . HIS M  1 152 ? 143.627 107.139 83.350 1.00 3.63  151 M 1 
ATOM   2366 C  CG   . HIS M  1 152 ? 142.152 107.067 83.552 1.00 3.63  151 M 1 
ATOM   2367 N  ND1  . HIS M  1 152 ? 141.562 107.495 84.711 1.00 3.63  151 M 1 
ATOM   2368 C  CD2  . HIS M  1 152 ? 141.148 106.653 82.753 1.00 3.63  151 M 1 
ATOM   2369 C  CE1  . HIS M  1 152 ? 140.263 107.300 84.645 1.00 3.63  151 M 1 
ATOM   2370 N  NE2  . HIS M  1 152 ? 139.980 106.801 83.453 1.00 3.63  151 M 1 
ATOM   2371 H  H    . HIS M  1 152 ? 143.551 109.623 83.584 1.00 3.63  151 M 1 
ATOM   2372 H  HA   . HIS M  1 152 ? 144.079 107.668 85.311 1.00 3.63  151 M 1 
ATOM   2373 H  HB2  . HIS M  1 152 ? 143.806 107.531 82.466 1.00 3.63  151 M 1 
ATOM   2374 H  HB3  . HIS M  1 152 ? 143.990 106.226 83.347 1.00 3.63  151 M 1 
ATOM   2375 H  HD1  . HIS M  1 152 ? 141.990 107.805 85.410 1.00 3.63  151 M 1 
ATOM   2376 H  HD2  . HIS M  1 152 ? 141.232 106.303 81.885 1.00 3.63  151 M 1 
ATOM   2377 H  HE1  . HIS M  1 152 ? 139.639 107.518 85.316 1.00 3.63  151 M 1 
ATOM   2378 N  N    . VAL M  1 153 ? 146.528 108.396 83.356 1.00 3.75  152 M 1 
ATOM   2379 C  CA   . VAL M  1 153 ? 147.971 108.297 83.143 1.00 3.75  152 M 1 
ATOM   2380 C  C    . VAL M  1 153 ? 148.724 108.840 84.351 1.00 3.75  152 M 1 
ATOM   2381 O  O    . VAL M  1 153 ? 149.692 108.237 84.822 1.00 3.75  152 M 1 
ATOM   2382 C  CB   . VAL M  1 153 ? 148.374 109.028 81.848 1.00 3.75  152 M 1 
ATOM   2383 C  CG1  . VAL M  1 153 ? 149.883 109.083 81.695 1.00 3.75  152 M 1 
ATOM   2384 C  CG2  . VAL M  1 153 ? 147.762 108.349 80.624 1.00 3.75  152 M 1 
ATOM   2385 H  H    . VAL M  1 153 ? 146.125 108.884 82.774 1.00 3.75  152 M 1 
ATOM   2386 H  HA   . VAL M  1 153 ? 148.214 107.364 83.040 1.00 3.75  152 M 1 
ATOM   2387 H  HB   . VAL M  1 153 ? 148.054 109.943 81.879 1.00 3.75  152 M 1 
ATOM   2388 H  HG11 . VAL M  1 153 ? 150.096 109.335 80.783 1.00 3.75  152 M 1 
ATOM   2389 H  HG12 . VAL M  1 153 ? 150.253 109.751 82.293 1.00 3.75  152 M 1 
ATOM   2390 H  HG13 . VAL M  1 153 ? 150.261 108.211 81.886 1.00 3.75  152 M 1 
ATOM   2391 H  HG21 . VAL M  1 153 ? 147.770 108.976 79.884 1.00 3.75  152 M 1 
ATOM   2392 H  HG22 . VAL M  1 153 ? 148.296 107.572 80.397 1.00 3.75  152 M 1 
ATOM   2393 H  HG23 . VAL M  1 153 ? 146.848 108.071 80.793 1.00 3.75  152 M 1 
ATOM   2394 N  N    . THR M  1 154 ? 148.291 109.995 84.858 1.00 3.85  153 M 1 
ATOM   2395 C  CA   . THR M  1 154 ? 148.932 110.603 86.022 1.00 3.85  153 M 1 
ATOM   2396 C  C    . THR M  1 154 ? 148.898 109.660 87.218 1.00 3.85  153 M 1 
ATOM   2397 O  O    . THR M  1 154 ? 149.918 109.443 87.885 1.00 3.85  153 M 1 
ATOM   2398 C  CB   . THR M  1 154 ? 148.248 111.938 86.336 1.00 3.85  153 M 1 
ATOM   2399 O  OG1  . THR M  1 154 ? 148.471 112.832 85.239 1.00 3.85  153 M 1 
ATOM   2400 C  CG2  . THR M  1 154 ? 148.742 112.558 87.655 1.00 3.85  153 M 1 
ATOM   2401 H  H    . THR M  1 154 ? 147.608 110.423 84.559 1.00 3.85  153 M 1 
ATOM   2402 H  HA   . THR M  1 154 ? 149.860 110.796 85.817 1.00 3.85  153 M 1 
ATOM   2403 H  HB   . THR M  1 154 ? 147.293 111.795 86.429 1.00 3.85  153 M 1 
ATOM   2404 H  HG1  . THR M  1 154 ? 147.948 112.664 84.604 1.00 3.85  153 M 1 
ATOM   2405 H  HG21 . THR M  1 154 ? 148.362 113.444 87.759 1.00 3.85  153 M 1 
ATOM   2406 H  HG22 . THR M  1 154 ? 148.441 112.039 88.417 1.00 3.85  153 M 1 
ATOM   2407 H  HG23 . THR M  1 154 ? 149.709 112.627 87.668 1.00 3.85  153 M 1 
ATOM   2408 N  N    . ASN M  1 155 ? 147.717 109.104 87.452 1.00 3.90  154 M 1 
ATOM   2409 C  CA   . ASN M  1 155 ? 147.514 108.206 88.617 1.00 3.90  154 M 1 
ATOM   2410 C  C    . ASN M  1 155 ? 148.382 106.953 88.457 1.00 3.90  154 M 1 
ATOM   2411 O  O    . ASN M  1 155 ? 149.095 106.632 89.362 1.00 3.90  154 M 1 
ATOM   2412 C  CB   . ASN M  1 155 ? 146.035 107.938 88.833 1.00 3.90  154 M 1 
ATOM   2413 C  CG   . ASN M  1 155 ? 145.392 109.062 89.613 1.00 3.90  154 M 1 
ATOM   2414 O  OD1  . ASN M  1 155 ? 145.664 109.232 90.787 1.00 3.90  154 M 1 
ATOM   2415 N  ND2  . ASN M  1 155 ? 144.564 109.846 88.966 1.00 3.90  154 M 1 
ATOM   2416 H  H    . ASN M  1 155 ? 147.019 109.144 86.870 1.00 3.90  154 M 1 
ATOM   2417 H  HA   . ASN M  1 155 ? 147.833 108.687 89.416 1.00 3.90  154 M 1 
ATOM   2418 H  HB2  . ASN M  1 155 ? 145.592 107.849 87.964 1.00 3.90  154 M 1 
ATOM   2419 H  HB3  . ASN M  1 155 ? 145.926 107.097 89.323 1.00 3.90  154 M 1 
ATOM   2420 H  HD21 . ASN M  1 155 ? 144.376 109.687 88.117 1.00 3.90  154 M 1 
ATOM   2421 H  HD22 . ASN M  1 155 ? 144.194 110.535 89.378 1.00 3.90  154 M 1 
ATOM   2422 N  N    . LEU M  1 156 ? 148.402 106.337 87.289 1.00 4.14  155 M 1 
ATOM   2423 C  CA   . LEU M  1 156 ? 149.191 105.131 87.050 1.00 4.14  155 M 1 
ATOM   2424 C  C    . LEU M  1 156 ? 150.684 105.404 87.191 1.00 4.14  155 M 1 
ATOM   2425 O  O    . LEU M  1 156 ? 151.413 104.605 87.787 1.00 4.14  155 M 1 
ATOM   2426 C  CB   . LEU M  1 156 ? 148.864 104.560 85.670 1.00 4.14  155 M 1 
ATOM   2427 C  CG   . LEU M  1 156 ? 147.513 103.856 85.526 1.00 4.14  155 M 1 
ATOM   2428 C  CD1  . LEU M  1 156 ? 147.157 103.593 84.075 1.00 4.14  155 M 1 
ATOM   2429 C  CD2  . LEU M  1 156 ? 147.544 102.535 86.278 1.00 4.14  155 M 1 
ATOM   2430 H  H    . LEU M  1 156 ? 147.967 106.623 86.605 1.00 4.14  155 M 1 
ATOM   2431 H  HA   . LEU M  1 156 ? 148.956 104.473 87.722 1.00 4.14  155 M 1 
ATOM   2432 H  HB2  . LEU M  1 156 ? 148.864 105.293 85.035 1.00 4.14  155 M 1 
ATOM   2433 H  HB3  . LEU M  1 156 ? 149.564 103.938 85.417 1.00 4.14  155 M 1 
ATOM   2434 H  HG   . LEU M  1 156 ? 146.815 104.402 85.921 1.00 4.14  155 M 1 
ATOM   2435 H  HD11 . LEU M  1 156 ? 146.301 103.139 84.044 1.00 4.14  155 M 1 
ATOM   2436 H  HD12 . LEU M  1 156 ? 147.092 104.435 83.598 1.00 4.14  155 M 1 
ATOM   2437 H  HD13 . LEU M  1 156 ? 147.842 103.039 83.669 1.00 4.14  155 M 1 
ATOM   2438 H  HD21 . LEU M  1 156 ? 146.739 102.033 86.079 1.00 4.14  155 M 1 
ATOM   2439 H  HD22 . LEU M  1 156 ? 148.323 102.036 85.987 1.00 4.14  155 M 1 
ATOM   2440 H  HD23 . LEU M  1 156 ? 147.597 102.688 87.234 1.00 4.14  155 M 1 
ATOM   2441 N  N    . ARG M  1 157 ? 151.130 106.511 86.611 1.00 4.62  156 M 1 
ATOM   2442 C  CA   . ARG M  1 157 ? 152.566 106.885 86.712 1.00 4.62  156 M 1 
ATOM   2443 C  C    . ARG M  1 157 ? 152.921 107.087 88.185 1.00 4.62  156 M 1 
ATOM   2444 O  O    . ARG M  1 157 ? 153.909 106.536 88.619 1.00 4.62  156 M 1 
ATOM   2445 C  CB   . ARG M  1 157 ? 152.855 108.202 85.999 1.00 4.62  156 M 1 
ATOM   2446 C  CG   . ARG M  1 157 ? 152.830 108.083 84.492 1.00 4.62  156 M 1 
ATOM   2447 C  CD   . ARG M  1 157 ? 153.154 109.409 83.844 1.00 4.62  156 M 1 
ATOM   2448 N  NE   . ARG M  1 157 ? 153.240 109.244 82.412 1.00 4.62  156 M 1 
ATOM   2449 C  CZ   . ARG M  1 157 ? 152.921 110.186 81.543 1.00 4.62  156 M 1 
ATOM   2450 N  NH1  . ARG M  1 157 ? 152.486 111.355 81.979 1.00 4.62  156 M 1 
ATOM   2451 N  NH2  . ARG M  1 157 ? 153.027 109.953 80.247 1.00 4.62  156 M 1 
ATOM   2452 H  H    . ARG M  1 157 ? 150.642 107.005 86.024 1.00 4.62  156 M 1 
ATOM   2453 H  HA   . ARG M  1 157 ? 153.121 106.166 86.331 1.00 4.62  156 M 1 
ATOM   2454 H  HB2  . ARG M  1 157 ? 152.188 108.864 86.277 1.00 4.62  156 M 1 
ATOM   2455 H  HB3  . ARG M  1 157 ? 153.737 108.524 86.279 1.00 4.62  156 M 1 
ATOM   2456 H  HG2  . ARG M  1 157 ? 153.485 107.412 84.204 1.00 4.62  156 M 1 
ATOM   2457 H  HG3  . ARG M  1 157 ? 151.940 107.789 84.201 1.00 4.62  156 M 1 
ATOM   2458 H  HD2  . ARG M  1 157 ? 152.455 110.063 84.060 1.00 4.62  156 M 1 
ATOM   2459 H  HD3  . ARG M  1 157 ? 154.009 109.746 84.189 1.00 4.62  156 M 1 
ATOM   2460 H  HE   . ARG M  1 157 ? 153.523 108.480 82.102 1.00 4.62  156 M 1 
ATOM   2461 H  HH11 . ARG M  1 157 ? 152.417 111.503 82.842 1.00 4.62  156 M 1 
ATOM   2462 H  HH12 . ARG M  1 157 ? 152.272 111.983 81.403 1.00 4.62  156 M 1 
ATOM   2463 H  HH21 . ARG M  1 157 ? 153.315 109.170 79.965 1.00 4.62  156 M 1 
ATOM   2464 H  HH22 . ARG M  1 157 ? 152.811 110.582 79.670 1.00 4.62  156 M 1 
ATOM   2465 N  N    . LYS M  1 158 ? 152.072 107.791 88.925 1.00 5.18  157 M 1 
ATOM   2466 C  CA   . LYS M  1 158 ? 152.305 108.139 90.355 1.00 5.18  157 M 1 
ATOM   2467 C  C    . LYS M  1 158 ? 152.363 106.858 91.193 1.00 5.18  157 M 1 
ATOM   2468 O  O    . LYS M  1 158 ? 153.242 106.774 92.033 1.00 5.18  157 M 1 
ATOM   2469 C  CB   . LYS M  1 158 ? 151.255 109.143 90.834 1.00 5.18  157 M 1 
ATOM   2470 C  CG   . LYS M  1 158 ? 151.459 110.545 90.277 1.00 5.18  157 M 1 
ATOM   2471 C  CD   . LYS M  1 158 ? 150.766 111.657 91.039 1.00 5.18  157 M 1 
ATOM   2472 C  CE   . LYS M  1 158 ? 151.182 113.041 90.582 1.00 5.18  157 M 1 
ATOM   2473 N  NZ   . LYS M  1 158 ? 152.590 113.343 90.962 1.00 5.18  157 M 1 
ATOM   2474 H  H    . LYS M  1 158 ? 151.240 108.010 88.630 1.00 5.18  157 M 1 
ATOM   2475 H  HA   . LYS M  1 158 ? 153.187 108.574 90.412 1.00 5.18  157 M 1 
ATOM   2476 H  HB2  . LYS M  1 158 ? 150.368 108.823 90.568 1.00 5.18  157 M 1 
ATOM   2477 H  HB3  . LYS M  1 158 ? 151.282 109.184 91.812 1.00 5.18  157 M 1 
ATOM   2478 H  HG2  . LYS M  1 158 ? 152.422 110.733 90.258 1.00 5.18  157 M 1 
ATOM   2479 H  HG3  . LYS M  1 158 ? 151.140 110.558 89.349 1.00 5.18  157 M 1 
ATOM   2480 H  HD2  . LYS M  1 158 ? 149.796 111.565 90.928 1.00 5.18  157 M 1 
ATOM   2481 H  HD3  . LYS M  1 158 ? 150.970 111.564 91.995 1.00 5.18  157 M 1 
ATOM   2482 H  HE2  . LYS M  1 158 ? 151.094 113.105 89.612 1.00 5.18  157 M 1 
ATOM   2483 H  HE3  . LYS M  1 158 ? 150.594 113.708 90.984 1.00 5.18  157 M 1 
ATOM   2484 H  HZ1  . LYS M  1 158 ? 152.792 114.199 90.737 1.00 5.18  157 M 1 
ATOM   2485 H  HZ2  . LYS M  1 158 ? 152.696 113.238 91.856 1.00 5.18  157 M 1 
ATOM   2486 H  HZ3  . LYS M  1 158 ? 153.153 112.781 90.528 1.00 5.18  157 M 1 
ATOM   2487 N  N    . MET M  1 159 ? 151.514 105.879 90.895 1.00 5.22  158 M 1 
ATOM   2488 C  CA   . MET M  1 159 ? 151.432 104.578 91.613 1.00 5.22  158 M 1 
ATOM   2489 C  C    . MET M  1 159 ? 152.658 103.713 91.315 1.00 5.22  158 M 1 
ATOM   2490 O  O    . MET M  1 159 ? 152.825 102.725 91.997 1.00 5.22  158 M 1 
ATOM   2491 C  CB   . MET M  1 159 ? 150.172 103.809 91.228 1.00 5.22  158 M 1 
ATOM   2492 C  CG   . MET M  1 159 ? 148.916 104.469 91.735 1.00 5.22  158 M 1 
ATOM   2493 S  SD   . MET M  1 159 ? 147.452 103.782 90.930 1.00 5.22  158 M 1 
ATOM   2494 C  CE   . MET M  1 159 ? 147.174 102.347 91.968 1.00 5.22  158 M 1 
ATOM   2495 H  H    . MET M  1 159 ? 150.989 105.909 90.152 1.00 5.22  158 M 1 
ATOM   2496 H  HA   . MET M  1 159 ? 151.413 104.766 92.580 1.00 5.22  158 M 1 
ATOM   2497 H  HB2  . MET M  1 159 ? 150.128 103.739 90.254 1.00 5.22  158 M 1 
ATOM   2498 H  HB3  . MET M  1 159 ? 150.229 102.903 91.593 1.00 5.22  158 M 1 
ATOM   2499 H  HG2  . MET M  1 159 ? 148.843 104.335 92.704 1.00 5.22  158 M 1 
ATOM   2500 H  HG3  . MET M  1 159 ? 148.958 105.433 91.559 1.00 5.22  158 M 1 
ATOM   2501 H  HE1  . MET M  1 159 ? 146.343 101.926 91.717 1.00 5.22  158 M 1 
ATOM   2502 H  HE2  . MET M  1 159 ? 147.900 101.722 91.853 1.00 5.22  158 M 1 
ATOM   2503 H  HE3  . MET M  1 159 ? 147.129 102.623 92.891 1.00 5.22  158 M 1 
ATOM   2504 N  N    . GLY M  1 160 ? 153.447 104.059 90.305 1.00 6.11  159 M 1 
ATOM   2505 C  CA   . GLY M  1 160 ? 154.641 103.293 89.915 1.00 6.11  159 M 1 
ATOM   2506 C  C    . GLY M  1 160 ? 154.401 102.326 88.772 1.00 6.11  159 M 1 
ATOM   2507 O  O    . GLY M  1 160 ? 155.296 101.539 88.514 1.00 6.11  159 M 1 
ATOM   2508 H  H    . GLY M  1 160 ? 153.270 104.785 89.785 1.00 6.11  159 M 1 
ATOM   2509 H  HA2  . GLY M  1 160 ? 155.354 103.929 89.655 1.00 6.11  159 M 1 
ATOM   2510 H  HA3  . GLY M  1 160 ? 154.964 102.788 90.703 1.00 6.11  159 M 1 
ATOM   2511 N  N    . ALA M  1 161 ? 153.295 102.429 88.028 1.00 5.68  160 M 1 
ATOM   2512 C  CA   . ALA M  1 161 ? 153.010 101.513 86.900 1.00 5.68  160 M 1 
ATOM   2513 C  C    . ALA M  1 161 ? 154.054 101.713 85.779 1.00 5.68  160 M 1 
ATOM   2514 O  O    . ALA M  1 161 ? 154.506 102.844 85.635 1.00 5.68  160 M 1 
ATOM   2515 C  CB   . ALA M  1 161 ? 151.618 101.684 86.356 1.00 5.68  160 M 1 
ATOM   2516 H  H    . ALA M  1 161 ? 152.714 103.128 88.073 1.00 5.68  160 M 1 
ATOM   2517 H  HA   . ALA M  1 161 ? 153.078 100.613 87.280 1.00 5.68  160 M 1 
ATOM   2518 H  HB1  . ALA M  1 161 ? 151.477 101.064 85.620 1.00 5.68  160 M 1 
ATOM   2519 H  HB2  . ALA M  1 161 ? 150.970 101.504 87.058 1.00 5.68  160 M 1 
ATOM   2520 H  HB3  . ALA M  1 161 ? 151.503 102.595 86.037 1.00 5.68  160 M 1 
ATOM   2521 N  N    . PRO M  1 162 ? 154.409 100.749 84.886 1.00 7.28  161 M 1 
ATOM   2522 C  CA   . PRO M  1 162 ? 154.085 99.312  84.954 1.00 7.28  161 M 1 
ATOM   2523 C  C    . PRO M  1 162 ? 154.971 98.516  85.926 1.00 7.28  161 M 1 
ATOM   2524 O  O    . PRO M  1 162 ? 154.581 97.457  86.342 1.00 7.28  161 M 1 
ATOM   2525 C  CB   . PRO M  1 162 ? 154.330 98.822  83.521 1.00 7.28  161 M 1 
ATOM   2526 C  CG   . PRO M  1 162 ? 155.490 99.653  83.076 1.00 7.28  161 M 1 
ATOM   2527 C  CD   . PRO M  1 162 ? 155.248 101.006 83.709 1.00 7.28  161 M 1 
ATOM   2528 H  HA   . PRO M  1 162 ? 153.129 99.190  85.181 1.00 7.28  161 M 1 
ATOM   2529 H  HB2  . PRO M  1 162 ? 154.554 97.867  83.506 1.00 7.28  161 M 1 
ATOM   2530 H  HB3  . PRO M  1 162 ? 153.546 98.977  82.953 1.00 7.28  161 M 1 
ATOM   2531 H  HG2  . PRO M  1 162 ? 156.335 99.269  83.388 1.00 7.28  161 M 1 
ATOM   2532 H  HG3  . PRO M  1 162 ? 155.514 99.725  82.100 1.00 7.28  161 M 1 
ATOM   2533 H  HD2  . PRO M  1 162 ? 156.091 101.420 83.972 1.00 7.28  161 M 1 
ATOM   2534 H  HD3  . PRO M  1 162 ? 154.791 101.601 83.086 1.00 7.28  161 M 1 
ATOM   2535 N  N    . GLU M  1 163 ? 156.116 99.069  86.313 1.00 9.11  162 M 1 
ATOM   2536 C  CA   . GLU M  1 163 ? 157.116 98.359  87.156 1.00 9.11  162 M 1 
ATOM   2537 C  C    . GLU M  1 163 ? 156.554 97.984  88.534 1.00 9.11  162 M 1 
ATOM   2538 O  O    . GLU M  1 163 ? 156.810 96.847  88.932 1.00 9.11  162 M 1 
ATOM   2539 C  CB   . GLU M  1 163 ? 158.407 99.172  87.161 1.00 9.11  162 M 1 
ATOM   2540 C  CG   . GLU M  1 163 ? 158.962 99.335  85.753 1.00 9.11  162 M 1 
ATOM   2541 C  CD   . GLU M  1 163 ? 159.605 98.072  85.199 1.00 9.11  162 M 1 
ATOM   2542 O  OE1  . GLU M  1 163 ? 160.214 97.338  85.995 1.00 9.11  162 M 1 
ATOM   2543 O  OE2  . GLU M  1 163 ? 159.535 97.834  83.968 1.00 9.11  162 M 1 
ATOM   2544 H  H    . GLU M  1 163 ? 156.311 99.945  86.185 1.00 9.11  162 M 1 
ATOM   2545 H  HA   . GLU M  1 163 ? 157.316 97.512  86.695 1.00 9.11  162 M 1 
ATOM   2546 H  HB2  . GLU M  1 163 ? 158.228 100.055 87.545 1.00 9.11  162 M 1 
ATOM   2547 H  HB3  . GLU M  1 163 ? 159.070 98.718  87.722 1.00 9.11  162 M 1 
ATOM   2548 H  HG2  . GLU M  1 163 ? 158.236 99.605  85.151 1.00 9.11  162 M 1 
ATOM   2549 H  HG3  . GLU M  1 163 ? 159.631 100.052 85.753 1.00 9.11  162 M 1 
ATOM   2550 N  N    . ALA M  1 164 ? 155.776 98.815  89.227 1.00 7.30  163 M 1 
ATOM   2551 C  CA   . ALA M  1 164 ? 155.234 98.411  90.546 1.00 7.30  163 M 1 
ATOM   2552 C  C    . ALA M  1 164 ? 154.122 97.408  90.223 1.00 7.30  163 M 1 
ATOM   2553 O  O    . ALA M  1 164 ? 153.116 97.838  89.664 1.00 7.30  163 M 1 
ATOM   2554 C  CB   . ALA M  1 164 ? 154.740 99.593  91.340 1.00 7.30  163 M 1 
ATOM   2555 H  H    . ALA M  1 164 ? 155.409 99.570  88.902 1.00 7.30  163 M 1 
ATOM   2556 H  HA   . ALA M  1 164 ? 155.952 97.964  91.051 1.00 7.30  163 M 1 
ATOM   2557 H  HB1  . ALA M  1 164 ? 154.393 99.288  92.195 1.00 7.30  163 M 1 
ATOM   2558 H  HB2  . ALA M  1 164 ? 155.473 100.212 91.492 1.00 7.30  163 M 1 
ATOM   2559 H  HB3  . ALA M  1 164 ? 154.034 100.043 90.847 1.00 7.30  163 M 1 
ATOM   2560 N  N    . GLY M  1 165 ? 154.236 96.151  90.658 1.00 6.92  164 M 1 
ATOM   2561 C  CA   . GLY M  1 165 ? 153.314 95.083  90.241 1.00 6.92  164 M 1 
ATOM   2562 C  C    . GLY M  1 165 ? 151.868 95.338  90.628 1.00 6.92  164 M 1 
ATOM   2563 O  O    . GLY M  1 165 ? 151.010 95.167  89.782 1.00 6.92  164 M 1 
ATOM   2564 H  H    . GLY M  1 165 ? 154.779 95.909  91.347 1.00 6.92  164 M 1 
ATOM   2565 H  HA2  . GLY M  1 165 ? 153.372 94.981  89.258 1.00 6.92  164 M 1 
ATOM   2566 H  HA3  . GLY M  1 165 ? 153.612 94.231  90.648 1.00 6.92  164 M 1 
ATOM   2567 N  N    . MET M  1 166 ? 151.605 95.837  91.826 1.00 5.59  165 M 1 
ATOM   2568 C  CA   . MET M  1 166 ? 150.221 96.059  92.311 1.00 5.59  165 M 1 
ATOM   2569 C  C    . MET M  1 166 ? 149.565 97.323  91.718 1.00 5.59  165 M 1 
ATOM   2570 O  O    . MET M  1 166 ? 148.351 97.431  91.853 1.00 5.59  165 M 1 
ATOM   2571 C  CB   . MET M  1 166 ? 150.183 96.094  93.844 1.00 5.59  165 M 1 
ATOM   2572 C  CG   . MET M  1 166 ? 149.711 94.770  94.463 1.00 5.59  165 M 1 
ATOM   2573 S  SD   . MET M  1 166 ? 150.210 94.519  96.182 1.00 5.59  165 M 1 
ATOM   2574 C  CE   . MET M  1 166 ? 150.247 96.218  96.745 1.00 5.59  165 M 1 
ATOM   2575 H  H    . MET M  1 166 ? 152.252 96.152  92.384 1.00 5.59  165 M 1 
ATOM   2576 H  HA   . MET M  1 166 ? 149.687 95.288  92.011 1.00 5.59  165 M 1 
ATOM   2577 H  HB2  . MET M  1 166 ? 151.079 96.301  94.177 1.00 5.59  165 M 1 
ATOM   2578 H  HB3  . MET M  1 166 ? 149.584 96.812  94.130 1.00 5.59  165 M 1 
ATOM   2579 H  HG2  . MET M  1 166 ? 148.732 94.732  94.416 1.00 5.59  165 M 1 
ATOM   2580 H  HG3  . MET M  1 166 ? 150.062 94.028  93.926 1.00 5.59  165 M 1 
ATOM   2581 H  HE1  . MET M  1 166 ? 149.345 96.557  96.802 1.00 5.59  165 M 1 
ATOM   2582 H  HE2  . MET M  1 166 ? 150.662 96.258  97.616 1.00 5.59  165 M 1 
ATOM   2583 H  HE3  . MET M  1 166 ? 150.754 96.752  96.122 1.00 5.59  165 M 1 
ATOM   2584 N  N    . ALA M  1 167 ? 150.296 98.233  91.066 1.00 5.07  166 M 1 
ATOM   2585 C  CA   . ALA M  1 167 ? 149.727 99.509  90.580 1.00 5.07  166 M 1 
ATOM   2586 C  C    . ALA M  1 167 ? 148.602 99.286  89.562 1.00 5.07  166 M 1 
ATOM   2587 O  O    . ALA M  1 167 ? 147.510 99.735  89.842 1.00 5.07  166 M 1 
ATOM   2588 C  CB   . ALA M  1 167 ? 150.817 100.366 89.972 1.00 5.07  166 M 1 
ATOM   2589 H  H    . ALA M  1 167 ? 151.155 98.122  90.809 1.00 5.07  166 M 1 
ATOM   2590 H  HA   . ALA M  1 167 ? 149.348 99.989  91.353 1.00 5.07  166 M 1 
ATOM   2591 H  HB1  . ALA M  1 167 ? 150.435 101.202 89.655 1.00 5.07  166 M 1 
ATOM   2592 H  HB2  . ALA M  1 167 ? 151.494 100.556 90.643 1.00 5.07  166 M 1 
ATOM   2593 H  HB3  . ALA M  1 167 ? 151.224 99.894  89.227 1.00 5.07  166 M 1 
ATOM   2594 N  N    . GLU M  1 168 ? 148.815 98.511  88.504 1.00 4.44  167 M 1 
ATOM   2595 C  CA   . GLU M  1 168 ? 147.748 98.325  87.474 1.00 4.44  167 M 1 
ATOM   2596 C  C    . GLU M  1 168 ? 146.605 97.530  88.114 1.00 4.44  167 M 1 
ATOM   2597 O  O    . GLU M  1 168 ? 145.468 97.850  87.878 1.00 4.44  167 M 1 
ATOM   2598 C  CB   . GLU M  1 168 ? 148.344 97.782  86.175 1.00 4.44  167 M 1 
ATOM   2599 C  CG   . GLU M  1 168 ? 149.229 98.839  85.535 1.00 4.44  167 M 1 
ATOM   2600 C  CD   . GLU M  1 168 ? 149.720 98.632  84.117 1.00 4.44  167 M 1 
ATOM   2601 O  OE1  . GLU M  1 168 ? 149.618 97.495  83.616 1.00 4.44  167 M 1 
ATOM   2602 O  OE2  . GLU M  1 168 ? 150.234 99.621  83.538 1.00 4.44  167 M 1 
ATOM   2603 H  H    . GLU M  1 168 ? 149.551 97.986  88.400 1.00 4.44  167 M 1 
ATOM   2604 H  HA   . GLU M  1 168 ? 147.392 99.221  87.272 1.00 4.44  167 M 1 
ATOM   2605 H  HB2  . GLU M  1 168 ? 148.872 96.980  86.369 1.00 4.44  167 M 1 
ATOM   2606 H  HB3  . GLU M  1 168 ? 147.619 97.540  85.561 1.00 4.44  167 M 1 
ATOM   2607 H  HG2  . GLU M  1 168 ? 148.743 99.691  85.554 1.00 4.44  167 M 1 
ATOM   2608 H  HG3  . GLU M  1 168 ? 150.020 98.955  86.104 1.00 4.44  167 M 1 
ATOM   2609 N  N    . TYR M  1 169 ? 146.921 96.577  88.980 1.00 4.01  168 M 1 
ATOM   2610 C  CA   . TYR M  1 169 ? 145.892 95.728  89.630 1.00 4.01  168 M 1 
ATOM   2611 C  C    . TYR M  1 169 ? 144.938 96.568  90.492 1.00 4.01  168 M 1 
ATOM   2612 O  O    . TYR M  1 169 ? 143.761 96.423  90.331 1.00 4.01  168 M 1 
ATOM   2613 C  CB   . TYR M  1 169 ? 146.555 94.628  90.464 1.00 4.01  168 M 1 
ATOM   2614 C  CG   . TYR M  1 169 ? 145.550 93.777  91.191 1.00 4.01  168 M 1 
ATOM   2615 C  CD1  . TYR M  1 169 ? 144.937 92.700  90.566 1.00 4.01  168 M 1 
ATOM   2616 C  CD2  . TYR M  1 169 ? 145.160 94.088  92.479 1.00 4.01  168 M 1 
ATOM   2617 C  CE1  . TYR M  1 169 ? 143.997 91.924  91.224 1.00 4.01  168 M 1 
ATOM   2618 C  CE2  . TYR M  1 169 ? 144.243 93.310  93.161 1.00 4.01  168 M 1 
ATOM   2619 C  CZ   . TYR M  1 169 ? 143.646 92.236  92.524 1.00 4.01  168 M 1 
ATOM   2620 O  OH   . TYR M  1 169 ? 142.716 91.496  93.177 1.00 4.01  168 M 1 
ATOM   2621 H  H    . TYR M  1 169 ? 147.751 96.468  89.336 1.00 4.01  168 M 1 
ATOM   2622 H  HA   . TYR M  1 169 ? 145.357 95.295  88.917 1.00 4.01  168 M 1 
ATOM   2623 H  HB2  . TYR M  1 169 ? 147.091 94.061  89.871 1.00 4.01  168 M 1 
ATOM   2624 H  HB3  . TYR M  1 169 ? 147.158 95.045  91.115 1.00 4.01  168 M 1 
ATOM   2625 H  HD1  . TYR M  1 169 ? 145.176 92.483  89.680 1.00 4.01  168 M 1 
ATOM   2626 H  HD2  . TYR M  1 169 ? 145.567 94.814  92.922 1.00 4.01  168 M 1 
ATOM   2627 H  HE1  . TYR M  1 169 ? 143.597 91.189  90.788 1.00 4.01  168 M 1 
ATOM   2628 H  HE2  . TYR M  1 169 ? 143.994 93.534  94.042 1.00 4.01  168 M 1 
ATOM   2629 H  HH   . TYR M  1 169 ? 142.054 91.991  93.406 1.00 4.01  168 M 1 
ATOM   2630 N  N    . LEU M  1 170 ? 145.441 97.487  91.311 1.00 4.13  169 M 1 
ATOM   2631 C  CA   . LEU M  1 170 ? 144.616 98.274  92.218 1.00 4.13  169 M 1 
ATOM   2632 C  C    . LEU M  1 170 ? 143.909 99.399  91.476 1.00 4.13  169 M 1 
ATOM   2633 O  O    . LEU M  1 170 ? 142.798 99.792  91.845 1.00 4.13  169 M 1 
ATOM   2634 C  CB   . LEU M  1 170 ? 145.469 98.813  93.366 1.00 4.13  169 M 1 
ATOM   2635 C  CG   . LEU M  1 170 ? 146.030 97.767  94.341 1.00 4.13  169 M 1 
ATOM   2636 C  CD1  . LEU M  1 170 ? 146.951 98.399  95.361 1.00 4.13  169 M 1 
ATOM   2637 C  CD2  . LEU M  1 170 ? 144.904 97.009  95.034 1.00 4.13  169 M 1 
ATOM   2638 H  H    . LEU M  1 170 ? 146.286 97.642  91.355 1.00 4.13  169 M 1 
ATOM   2639 H  HA   . LEU M  1 170 ? 143.922 97.699  92.576 1.00 4.13  169 M 1 
ATOM   2640 H  HB2  . LEU M  1 170 ? 146.226 99.287  92.988 1.00 4.13  169 M 1 
ATOM   2641 H  HB3  . LEU M  1 170 ? 144.932 99.435  93.881 1.00 4.13  169 M 1 
ATOM   2642 H  HG   . LEU M  1 170 ? 146.553 97.119  93.843 1.00 4.13  169 M 1 
ATOM   2643 H  HD11 . LEU M  1 170 ? 147.356 97.694  95.890 1.00 4.13  169 M 1 
ATOM   2644 H  HD12 . LEU M  1 170 ? 147.644 98.911  94.915 1.00 4.13  169 M 1 
ATOM   2645 H  HD13 . LEU M  1 170 ? 146.426 98.981  95.933 1.00 4.13  169 M 1 
ATOM   2646 H  HD21 . LEU M  1 170 ? 145.268 96.464  95.749 1.00 4.13  169 M 1 
ATOM   2647 H  HD22 . LEU M  1 170 ? 144.268 97.648  95.391 1.00 4.13  169 M 1 
ATOM   2648 H  HD23 . LEU M  1 170 ? 144.460 96.432  94.393 1.00 4.13  169 M 1 
ATOM   2649 N  N    . PHE M  1 171 ? 144.530 99.912  90.419 1.00 3.79  170 M 1 
ATOM   2650 C  CA   . PHE M  1 171 ? 143.872 100.895 89.568 1.00 3.79  170 M 1 
ATOM   2651 C  C    . PHE M  1 171 ? 142.682 100.273 88.847 1.00 3.79  170 M 1 
ATOM   2652 O  O    . PHE M  1 171 ? 141.621 100.894 88.730 1.00 3.79  170 M 1 
ATOM   2653 C  CB   . PHE M  1 171 ? 144.874 101.442 88.562 1.00 3.79  170 M 1 
ATOM   2654 C  CG   . PHE M  1 171 ? 144.340 102.550 87.735 1.00 3.79  170 M 1 
ATOM   2655 C  CD1  . PHE M  1 171 ? 144.342 103.846 88.205 1.00 3.79  170 M 1 
ATOM   2656 C  CD2  . PHE M  1 171 ? 143.774 102.294 86.510 1.00 3.79  170 M 1 
ATOM   2657 C  CE1  . PHE M  1 171 ? 143.840 104.856 87.442 1.00 3.79  170 M 1 
ATOM   2658 C  CE2  . PHE M  1 171 ? 143.267 103.300 85.759 1.00 3.79  170 M 1 
ATOM   2659 C  CZ   . PHE M  1 171 ? 143.300 104.576 86.223 1.00 3.79  170 M 1 
ATOM   2660 H  H    . PHE M  1 171 ? 145.328 99.706  90.173 1.00 3.79  170 M 1 
ATOM   2661 H  HA   . PHE M  1 171 ? 143.555 101.638 90.105 1.00 3.79  170 M 1 
ATOM   2662 H  HB2  . PHE M  1 171 ? 145.651 101.772 89.040 1.00 3.79  170 M 1 
ATOM   2663 H  HB3  . PHE M  1 171 ? 145.148 100.727 87.967 1.00 3.79  170 M 1 
ATOM   2664 H  HD1  . PHE M  1 171 ? 144.718 104.044 89.032 1.00 3.79  170 M 1 
ATOM   2665 H  HD2  . PHE M  1 171 ? 143.749 101.423 86.186 1.00 3.79  170 M 1 
ATOM   2666 H  HE1  . PHE M  1 171 ? 143.856 105.730 87.758 1.00 3.79  170 M 1 
ATOM   2667 H  HE2  . PHE M  1 171 ? 142.897 103.113 84.927 1.00 3.79  170 M 1 
ATOM   2668 H  HZ   . PHE M  1 171 ? 142.954 105.265 85.703 1.00 3.79  170 M 1 
ATOM   2669 N  N    . ASP M  1 172 ? 142.886 99.054  88.392 1.00 4.02  171 M 1 
ATOM   2670 C  CA   . ASP M  1 172 ? 141.806 98.292  87.727 1.00 4.02  171 M 1 
ATOM   2671 C  C    . ASP M  1 172 ? 140.659 98.138  88.738 1.00 4.02  171 M 1 
ATOM   2672 O  O    . ASP M  1 172 ? 139.533 98.351  88.327 1.00 4.02  171 M 1 
ATOM   2673 C  CB   . ASP M  1 172 ? 142.330 96.951  87.193 1.00 4.02  171 M 1 
ATOM   2674 C  CG   . ASP M  1 172 ? 141.273 96.045  86.572 1.00 4.02  171 M 1 
ATOM   2675 O  OD1  . ASP M  1 172 ? 140.506 95.464  87.323 1.00 4.02  171 M 1 
ATOM   2676 O  OD2  . ASP M  1 172 ? 141.246 95.911  85.334 1.00 4.02  171 M 1 
ATOM   2677 H  H    . ASP M  1 172 ? 143.713 98.680  88.321 1.00 4.02  171 M 1 
ATOM   2678 H  HA   . ASP M  1 172 ? 141.480 98.822  86.962 1.00 4.02  171 M 1 
ATOM   2679 H  HB2  . ASP M  1 172 ? 143.014 97.129  86.515 1.00 4.02  171 M 1 
ATOM   2680 H  HB3  . ASP M  1 172 ? 142.753 96.464  87.929 1.00 4.02  171 M 1 
ATOM   2681 N  N    . LYS M  1 173 ? 140.916 97.846  90.025 1.00 4.18  172 M 1 
ATOM   2682 C  CA   . LYS M  1 173 ? 139.818 97.616  90.960 1.00 4.18  172 M 1 
ATOM   2683 C  C    . LYS M  1 173 ? 139.128 98.913  91.381 1.00 4.18  172 M 1 
ATOM   2684 O  O    . LYS M  1 173 ? 137.897 98.991  91.389 1.00 4.18  172 M 1 
ATOM   2685 C  CB   . LYS M  1 173 ? 140.325 96.848  92.179 1.00 4.18  172 M 1 
ATOM   2686 C  CG   . LYS M  1 173 ? 140.865 95.460  91.866 1.00 4.18  172 M 1 
ATOM   2687 C  CD   . LYS M  1 173 ? 139.777 94.534  91.328 1.00 4.18  172 M 1 
ATOM   2688 C  CE   . LYS M  1 173 ? 140.229 93.101  91.153 1.00 4.18  172 M 1 
ATOM   2689 N  NZ   . LYS M  1 173 ? 139.141 92.269  90.574 1.00 4.18  172 M 1 
ATOM   2690 H  H    . LYS M  1 173 ? 141.708 97.794  90.356 1.00 4.18  172 M 1 
ATOM   2691 H  HA   . LYS M  1 173 ? 139.134 97.087  90.521 1.00 4.18  172 M 1 
ATOM   2692 H  HB2  . LYS M  1 173 ? 141.048 97.352  92.584 1.00 4.18  172 M 1 
ATOM   2693 H  HB3  . LYS M  1 173 ? 139.597 96.747  92.812 1.00 4.18  172 M 1 
ATOM   2694 H  HG2  . LYS M  1 173 ? 141.556 95.531  91.189 1.00 4.18  172 M 1 
ATOM   2695 H  HG3  . LYS M  1 173 ? 141.237 95.075  92.675 1.00 4.18  172 M 1 
ATOM   2696 H  HD2  . LYS M  1 173 ? 139.010 94.546  91.921 1.00 4.18  172 M 1 
ATOM   2697 H  HD3  . LYS M  1 173 ? 139.524 94.850  90.446 1.00 4.18  172 M 1 
ATOM   2698 H  HE2  . LYS M  1 173 ? 140.984 93.064  90.545 1.00 4.18  172 M 1 
ATOM   2699 H  HE3  . LYS M  1 173 ? 140.476 92.729  92.014 1.00 4.18  172 M 1 
ATOM   2700 H  HZ1  . LYS M  1 173 ? 139.354 91.406  90.625 1.00 4.18  172 M 1 
ATOM   2701 H  HZ2  . LYS M  1 173 ? 138.377 92.403  91.010 1.00 4.18  172 M 1 
ATOM   2702 H  HZ3  . LYS M  1 173 ? 139.022 92.484  89.719 1.00 4.18  172 M 1 
ATOM   2703 N  N    . HIS M  1 174 ? 139.898 99.937  91.734 1.00 4.28  173 M 1 
ATOM   2704 C  CA   . HIS M  1 174 ? 139.326 101.141 92.340 1.00 4.28  173 M 1 
ATOM   2705 C  C    . HIS M  1 174 ? 138.808 102.130 91.299 1.00 4.28  173 M 1 
ATOM   2706 O  O    . HIS M  1 174 ? 137.635 102.510 91.318 1.00 4.28  173 M 1 
ATOM   2707 C  CB   . HIS M  1 174 ? 140.365 101.793 93.254 1.00 4.28  173 M 1 
ATOM   2708 C  CG   . HIS M  1 174 ? 140.680 100.984 94.467 1.00 4.28  173 M 1 
ATOM   2709 N  ND1  . HIS M  1 174 ? 139.808 100.871 95.527 1.00 4.28  173 M 1 
ATOM   2710 C  CD2  . HIS M  1 174 ? 141.767 100.251 94.792 1.00 4.28  173 M 1 
ATOM   2711 C  CE1  . HIS M  1 174 ? 140.345 100.097 96.451 1.00 4.28  173 M 1 
ATOM   2712 N  NE2  . HIS M  1 174 ? 141.533 99.709  96.031 1.00 4.28  173 M 1 
ATOM   2713 H  H    . HIS M  1 174 ? 140.752 99.957  91.635 1.00 4.28  173 M 1 
ATOM   2714 H  HA   . HIS M  1 174 ? 138.576 100.895 92.904 1.00 4.28  173 M 1 
ATOM   2715 H  HB2  . HIS M  1 174 ? 141.193 101.898 92.761 1.00 4.28  173 M 1 
ATOM   2716 H  HB3  . HIS M  1 174 ? 140.046 102.661 93.547 1.00 4.28  173 M 1 
ATOM   2717 H  HD2  . HIS M  1 174 ? 142.533 100.137 94.277 1.00 4.28  173 M 1 
ATOM   2718 H  HE1  . HIS M  1 174 ? 139.951 99.866  97.261 1.00 4.28  173 M 1 
ATOM   2719 H  HE2  . HIS M  1 174 ? 142.076 99.200  96.462 1.00 4.28  173 M 1 
ATOM   2720 N  N    . THR M  1 175 ? 139.668 102.559 90.381 1.00 3.92  174 M 1 
ATOM   2721 C  CA   . THR M  1 175 ? 139.281 103.609 89.443 1.00 3.92  174 M 1 
ATOM   2722 C  C    . THR M  1 175 ? 138.388 103.072 88.331 1.00 3.92  174 M 1 
ATOM   2723 O  O    . THR M  1 175 ? 137.333 103.648 88.043 1.00 3.92  174 M 1 
ATOM   2724 C  CB   . THR M  1 175 ? 140.529 104.288 88.884 1.00 3.92  174 M 1 
ATOM   2725 O  OG1  . THR M  1 175 ? 141.222 104.932 89.958 1.00 3.92  174 M 1 
ATOM   2726 C  CG2  . THR M  1 175 ? 140.176 105.309 87.815 1.00 3.92  174 M 1 
ATOM   2727 H  H    . THR M  1 175 ? 140.472 102.269 90.290 1.00 3.92  174 M 1 
ATOM   2728 H  HA   . THR M  1 175 ? 138.774 104.287 89.917 1.00 3.92  174 M 1 
ATOM   2729 H  HB   . THR M  1 175 ? 141.117 103.628 88.485 1.00 3.92  174 M 1 
ATOM   2730 H  HG1  . THR M  1 175 ? 141.349 105.742 89.774 1.00 3.92  174 M 1 
ATOM   2731 H  HG21 . THR M  1 175 ? 140.922 105.911 87.670 1.00 3.92  174 M 1 
ATOM   2732 H  HG22 . THR M  1 175 ? 139.977 104.866 86.975 1.00 3.92  174 M 1 
ATOM   2733 H  HG23 . THR M  1 175 ? 139.402 105.826 88.086 1.00 3.92  174 M 1 
ATOM   2734 N  N    . LEU M  1 176 ? 138.787 101.981 87.690 1.00 3.89  175 M 1 
ATOM   2735 C  CA   . LEU M  1 176 ? 138.029 101.435 86.571 1.00 3.89  175 M 1 
ATOM   2736 C  C    . LEU M  1 176 ? 137.001 100.390 86.986 1.00 3.89  175 M 1 
ATOM   2737 O  O    . LEU M  1 176 ? 136.269 99.897  86.125 1.00 3.89  175 M 1 
ATOM   2738 C  CB   . LEU M  1 176 ? 138.981 100.835 85.536 1.00 3.89  175 M 1 
ATOM   2739 C  CG   . LEU M  1 176 ? 139.949 101.826 84.877 1.00 3.89  175 M 1 
ATOM   2740 C  CD1  . LEU M  1 176 ? 140.858 101.121 83.920 1.00 3.89  175 M 1 
ATOM   2741 C  CD2  . LEU M  1 176 ? 139.256 102.990 84.197 1.00 3.89  175 M 1 
ATOM   2742 H  H    . LEU M  1 176 ? 139.499 101.538 87.883 1.00 3.89  175 M 1 
ATOM   2743 H  HA   . LEU M  1 176 ? 137.528 102.142 86.135 1.00 3.89  175 M 1 
ATOM   2744 H  HB2  . LEU M  1 176 ? 139.518 100.161 85.981 1.00 3.89  175 M 1 
ATOM   2745 H  HB3  . LEU M  1 176 ? 138.456 100.406 84.843 1.00 3.89  175 M 1 
ATOM   2746 H  HG   . LEU M  1 176 ? 140.518 102.192 85.573 1.00 3.89  175 M 1 
ATOM   2747 H  HD11 . LEU M  1 176 ? 140.996 101.648 83.117 1.00 3.89  175 M 1 
ATOM   2748 H  HD12 . LEU M  1 176 ? 141.711 100.998 84.365 1.00 3.89  175 M 1 
ATOM   2749 H  HD13 . LEU M  1 176 ? 140.472 100.264 83.679 1.00 3.89  175 M 1 
ATOM   2750 H  HD21 . LEU M  1 176 ? 139.918 103.538 83.747 1.00 3.89  175 M 1 
ATOM   2751 H  HD22 . LEU M  1 176 ? 138.608 102.648 83.562 1.00 3.89  175 M 1 
ATOM   2752 H  HD23 . LEU M  1 176 ? 138.811 103.528 84.870 1.00 3.89  175 M 1 
ATOM   2753 N  N    . GLY M  1 177 ? 136.922 100.050 88.265 1.00 4.79  176 M 1 
ATOM   2754 C  CA   . GLY M  1 177 ? 135.933 99.110  88.758 1.00 4.79  176 M 1 
ATOM   2755 C  C    . GLY M  1 177 ? 134.724 99.796  89.358 1.00 4.79  176 M 1 
ATOM   2756 O  O    . GLY M  1 177 ? 134.403 100.926 88.999 1.00 4.79  176 M 1 
ATOM   2757 H  H    . GLY M  1 177 ? 137.440 100.352 88.881 1.00 4.79  176 M 1 
ATOM   2758 H  HA2  . GLY M  1 177 ? 135.628 98.522  88.049 1.00 4.79  176 M 1 
ATOM   2759 H  HA3  . GLY M  1 177 ? 136.344 98.561  89.444 1.00 4.79  176 M 1 
HETATM 2760 ZN ZN   . ZN  PA 3 .   ? 134.712 110.111 68.601 1.00 16.76 201 M 1 
#


================================================
FILE: src/alphafold3/test_data/miniature_databases/pdb_mmcif/6ydw.cif
================================================
data_6YDW
#
_entry.id 6YDW
#
loop_
_chem_comp.formula
_chem_comp.formula_weight
_chem_comp.id
_chem_comp.mon_nstd_flag
_chem_comp.name
_chem_comp.pdbx_synonyms
_chem_comp.type
"C10 H14 N5 O8 P"   363.221 5GP . "GUANOSINE-5'-MONOPHOSPHATE"                  ? non-polymer         
"C10 H14 N5 O7 P"   347.221 A   y "ADENOSINE-5'-MONOPHOSPHATE"                  ? "RNA linking"       
"C3 H7 N O2"        89.093  ALA y ALANINE                                       ? "L-peptide linking" 
"C6 H15 N4 O2 1"    175.209 ARG y ARGININE                                      ? "L-peptide linking" 
"C4 H8 N2 O3"       132.118 ASN y ASPARAGINE                                    ? "L-peptide linking" 
"C4 H7 N O4"        133.103 ASP y "ASPARTIC ACID"                               ? "L-peptide linking" 
"C9 H14 N3 O8 P"    323.197 C   y "CYTIDINE-5'-MONOPHOSPHATE"                   ? "RNA linking"       
"C3 H7 N O2 S"      121.158 CYS y CYSTEINE                                      ? "L-peptide linking" 
"C6 H11 N O3 S"     177.221 FME n N-FORMYLMETHIONINE                            ? "L-peptide linking" 
"C10 H14 N5 O8 P"   363.221 G   y "GUANOSINE-5'-MONOPHOSPHATE"                  ? "RNA linking"       
"C5 H10 N2 O3"      146.144 GLN y GLUTAMINE                                     ? "L-peptide linking" 
"C5 H9 N O4"        147.129 GLU y "GLUTAMIC ACID"                               ? "L-peptide linking" 
"C2 H5 N O2"        75.067  GLY y GLYCINE                                       ? "peptide linking"   
"C10 H17 N6 O13 P3" 522.196 GNP . "PHOSPHOAMINOPHOSPHONIC ACID-GUANYLATE ESTER" ? non-polymer         
"C10 H16 N5 O14 P3" 523.180 GTP n "GUANOSINE-5'-TRIPHOSPHATE"                   ? non-polymer         
"C6 H10 N3 O2 1"    156.162 HIS y HISTIDINE                                     ? "L-peptide linking" 
"H2 O"              18.015  HOH . WATER                                         ? non-polymer         
"C6 H13 N O2"       131.173 ILE y ISOLEUCINE                                    ? "L-peptide linking" 
"C6 H13 N O2"       131.173 LEU y LEUCINE                                       ? "L-peptide linking" 
"C6 H15 N2 O2 1"    147.195 LYS y LYSINE                                        ? "L-peptide linking" 
"C5 H11 N O2 S"     149.211 MET y METHIONINE                                    ? "L-peptide linking" 
"Mg 2"              24.305  MG  . "MAGNESIUM ION"                               ? non-polymer         
"C9 H11 N O2"       165.189 PHE y PHENYLALANINE                                 ? "L-peptide linking" 
"C5 H9 N O2"        115.130 PRO y PROLINE                                       ? "L-peptide linking" 
"C3 H7 N O3"        105.093 SER y SERINE                                        ? "L-peptide linking" 
"C10 H26 N4"        202.340 SPM . SPERMINE                                      ? non-polymer         
"C4 H9 N O3"        119.119 THR y THREONINE                                     ? "L-peptide linking" 
"C11 H12 N2 O2"     204.225 TRP y TRYPTOPHAN                                    ? "L-peptide linking" 
"C9 H11 N O3"       181.189 TYR y TYROSINE                                      ? "L-peptide linking" 
"C9 H13 N2 O9 P"    324.181 U   y "URIDINE-5'-MONOPHOSPHATE"                    ? "RNA linking"       
"C4 H9 N O2"        103.120 UNK . UNKNOWN                                       ? "L-peptide linking" 
"C5 H11 N O2"       117.146 VAL y VALINE                                        ? "L-peptide linking" 
"Zn 2"              65.409  ZN  . "ZINC ION"                                    ? non-polymer         
#
_entity.id               17
_entity.pdbx_description "Mitochondrial ribosomal protein L46"
_entity.type             polymer
#
_entity_poly.entity_id      17
_entity_poly.pdbx_strand_id Bj
_entity_poly.type           polypeptide(L)
#
loop_
_entity_poly_seq.entity_id
_entity_poly_seq.hetero
_entity_poly_seq.mon_id
_entity_poly_seq.num
17 n MET 1   
17 n ALA 2   
17 n ALA 3   
17 n PRO 4   
17 n VAL 5   
17 n ARG 6   
17 n ARG 7   
17 n THR 8   
17 n MET 9   
17 n LEU 10  
17 n ARG 11  
17 n VAL 12  
17 n VAL 13  
17 n ARG 14  
17 n GLY 15  
17 n TRP 16  
17 n ARG 17  
17 n ARG 18  
17 n PHE 19  
17 n GLU 20  
17 n GLY 21  
17 n PRO 22  
17 n TRP 23  
17 n ALA 24  
17 n HIS 25  
17 n SER 26  
17 n LEU 27  
17 n GLY 28  
17 n SER 29  
17 n ARG 30  
17 n ASN 31  
17 n LEU 32  
17 n ALA 33  
17 n LEU 34  
17 n ALA 35  
17 n VAL 36  
17 n ALA 37  
17 n PRO 38  
17 n SER 39  
17 n SER 40  
17 n SER 41  
17 n SER 42  
17 n SER 43  
17 n PRO 44  
17 n TRP 45  
17 n ARG 46  
17 n LEU 47  
17 n LEU 48  
17 n GLY 49  
17 n ALA 50  
17 n LEU 51  
17 n CYS 52  
17 n LEU 53  
17 n GLN 54  
17 n ARG 55  
17 n PRO 56  
17 n PRO 57  
17 n LEU 58  
17 n VAL 59  
17 n THR 60  
17 n LYS 61  
17 n PRO 62  
17 n LEU 63  
17 n THR 64  
17 n PRO 65  
17 n LEU 66  
17 n GLN 67  
17 n GLU 68  
17 n GLU 69  
17 n MET 70  
17 n ALA 71  
17 n ASP 72  
17 n LEU 73  
17 n LEU 74  
17 n GLN 75  
17 n GLN 76  
17 n ILE 77  
17 n GLU 78  
17 n ILE 79  
17 n GLU 80  
17 n ARG 81  
17 n SER 82  
17 n LEU 83  
17 n TYR 84  
17 n SER 85  
17 n ASP 86  
17 n HIS 87  
17 n GLU 88  
17 n LEU 89  
17 n ARG 90  
17 n ALA 91  
17 n LEU 92  
17 n ASP 93  
17 n GLU 94  
17 n ALA 95  
17 n GLN 96  
17 n GLN 97  
17 n LEU 98  
17 n ALA 99  
17 n LYS 100 
17 n LYS 101 
17 n LYS 102 
17 n SER 103 
17 n ASP 104 
17 n LEU 105 
17 n TYR 106 
17 n GLU 107 
17 n GLU 108 
17 n GLU 109 
17 n ASP 110 
17 n GLU 111 
17 n GLN 112 
17 n ASN 113 
17 n ILE 114 
17 n LEU 115 
17 n LEU 116 
17 n ALA 117 
17 n GLN 118 
17 n ASP 119 
17 n LEU 120 
17 n GLU 121 
17 n ASP 122 
17 n MET 123 
17 n TRP 124 
17 n GLU 125 
17 n GLN 126 
17 n LYS 127 
17 n PHE 128 
17 n LEU 129 
17 n HIS 130 
17 n PHE 131 
17 n LYS 132 
17 n LEU 133 
17 n GLY 134 
17 n ALA 135 
17 n ARG 136 
17 n LEU 137 
17 n THR 138 
17 n GLU 139 
17 n ALA 140 
17 n ASP 141 
17 n LYS 142 
17 n LYS 143 
17 n ASP 144 
17 n ASP 145 
17 n ARG 146 
17 n THR 147 
17 n SER 148 
17 n LEU 149 
17 n HIS 150 
17 n ARG 151 
17 n LYS 152 
17 n LEU 153 
17 n ASP 154 
17 n ARG 155 
17 n ASN 156 
17 n LEU 157 
17 n ILE 158 
17 n LEU 159 
17 n LEU 160 
17 n VAL 161 
17 n ARG 162 
17 n GLU 163 
17 n LYS 164 
17 n LEU 165 
17 n GLY 166 
17 n ASP 167 
17 n GLN 168 
17 n ASP 169 
17 n ILE 170 
17 n TRP 171 
17 n MET 172 
17 n LEU 173 
17 n PRO 174 
17 n GLN 175 
17 n SER 176 
17 n ASP 177 
17 n TRP 178 
17 n GLN 179 
17 n PRO 180 
17 n GLY 181 
17 n GLU 182 
17 n THR 183 
17 n LEU 184 
17 n ARG 185 
17 n GLN 186 
17 n THR 187 
17 n ALA 188 
17 n GLU 189 
17 n ARG 190 
17 n THR 191 
17 n LEU 192 
17 n ALA 193 
17 n THR 194 
17 n LEU 195 
17 n SER 196 
17 n GLU 197 
17 n ASN 198 
17 n ASN 199 
17 n MET 200 
17 n GLU 201 
17 n ALA 202 
17 n LYS 203 
17 n PHE 204 
17 n LEU 205 
17 n GLY 206 
17 n ASN 207 
17 n ALA 208 
17 n PRO 209 
17 n CYS 210 
17 n GLY 211 
17 n HIS 212 
17 n TYR 213 
17 n LYS 214 
17 n PHE 215 
17 n LYS 216 
17 n PHE 217 
17 n PRO 218 
17 n GLN 219 
17 n ALA 220 
17 n MET 221 
17 n ARG 222 
17 n THR 223 
17 n GLU 224 
17 n THR 225 
17 n SER 226 
17 n LEU 227 
17 n GLY 228 
17 n ALA 229 
17 n LYS 230 
17 n VAL 231 
17 n PHE 232 
17 n PHE 233 
17 n PHE 234 
17 n LYS 235 
17 n ALA 236 
17 n LEU 237 
17 n LEU 238 
17 n LEU 239 
17 n THR 240 
17 n GLY 241 
17 n ASP 242 
17 n PHE 243 
17 n SER 244 
17 n GLN 245 
17 n ALA 246 
17 n GLY 247 
17 n LYS 248 
17 n LYS 249 
17 n GLY 250 
17 n HIS 251 
17 n HIS 252 
17 n VAL 253 
17 n TRP 254 
17 n VAL 255 
17 n SER 256 
17 n LYS 257 
17 n GLU 258 
17 n GLU 259 
17 n LEU 260 
17 n GLY 261 
17 n ASP 262 
17 n TYR 263 
17 n LEU 264 
17 n LYS 265 
17 n PRO 266 
17 n LYS 267 
17 n TYR 268 
17 n LEU 269 
17 n ALA 270 
17 n GLN 271 
17 n VAL 272 
17 n ARG 273 
17 n ARG 274 
17 n PHE 275 
17 n LEU 276 
17 n LEU 277 
17 n ASP 278 
17 n LEU 279 
#
_exptl.method "ELECTRON MICROSCOPY"
#
_pdbx_audit_revision_history.revision_date 2020-07-15
#
_pdbx_database_status.recvd_initial_deposition_date 2020-07-15
#
loop_
_pdbx_poly_seq_scheme.asym_id
_pdbx_poly_seq_scheme.auth_seq_num
_pdbx_poly_seq_scheme.entity_id
_pdbx_poly_seq_scheme.hetero
_pdbx_poly_seq_scheme.mon_id
_pdbx_poly_seq_scheme.pdb_ins_code
_pdbx_poly_seq_scheme.pdb_seq_num
_pdbx_poly_seq_scheme.pdb_strand_id
_pdbx_poly_seq_scheme.seq_id
Q ?   17 n MET . 1   Bj 1   
Q ?   17 n ALA . 2   Bj 2   
Q ?   17 n ALA . 3   Bj 3   
Q ?   17 n PRO . 4   Bj 4   
Q ?   17 n VAL . 5   Bj 5   
Q ?   17 n ARG . 6   Bj 6   
Q ?   17 n ARG . 7   Bj 7   
Q ?   17 n THR . 8   Bj 8   
Q ?   17 n MET . 9   Bj 9   
Q ?   17 n LEU . 10  Bj 10  
Q ?   17 n ARG . 11  Bj 11  
Q ?   17 n VAL . 12  Bj 12  
Q ?   17 n VAL . 13  Bj 13  
Q ?   17 n ARG . 14  Bj 14  
Q ?   17 n GLY . 15  Bj 15  
Q ?   17 n TRP . 16  Bj 16  
Q ?   17 n ARG . 17  Bj 17  
Q ?   17 n ARG . 18  Bj 18  
Q ?   17 n PHE . 19  Bj 19  
Q ?   17 n GLU . 20  Bj 20  
Q ?   17 n GLY . 21  Bj 21  
Q ?   17 n PRO . 22  Bj 22  
Q ?   17 n TRP . 23  Bj 23  
Q ?   17 n ALA . 24  Bj 24  
Q ?   17 n HIS . 25  Bj 25  
Q ?   17 n SER . 26  Bj 26  
Q ?   17 n LEU . 27  Bj 27  
Q ?   17 n GLY . 28  Bj 28  
Q ?   17 n SER . 29  Bj 29  
Q ?   17 n ARG . 30  Bj 30  
Q ?   17 n ASN . 31  Bj 31  
Q ?   17 n LEU . 32  Bj 32  
Q ?   17 n ALA . 33  Bj 33  
Q ?   17 n LEU . 34  Bj 34  
Q ?   17 n ALA . 35  Bj 35  
Q ?   17 n VAL . 36  Bj 36  
Q ?   17 n ALA . 37  Bj 37  
Q ?   17 n PRO . 38  Bj 38  
Q ?   17 n SER . 39  Bj 39  
Q ?   17 n SER . 40  Bj 40  
Q ?   17 n SER . 41  Bj 41  
Q ?   17 n SER . 42  Bj 42  
Q 43  17 n SER . 43  Bj 43  
Q 44  17 n PRO . 44  Bj 44  
Q 45  17 n TRP . 45  Bj 45  
Q 46  17 n ARG . 46  Bj 46  
Q 47  17 n LEU . 47  Bj 47  
Q 48  17 n LEU . 48  Bj 48  
Q 49  17 n GLY . 49  Bj 49  
Q 50  17 n ALA . 50  Bj 50  
Q 51  17 n LEU . 51  Bj 51  
Q 52  17 n CYS . 52  Bj 52  
Q 53  17 n LEU . 53  Bj 53  
Q 54  17 n GLN . 54  Bj 54  
Q 55  17 n ARG . 55  Bj 55  
Q 56  17 n PRO . 56  Bj 56  
Q 57  17 n PRO . 57  Bj 57  
Q 58  17 n LEU . 58  Bj 58  
Q 59  17 n VAL . 59  Bj 59  
Q 60  17 n THR . 60  Bj 60  
Q 61  17 n LYS . 61  Bj 61  
Q 62  17 n PRO . 62  Bj 62  
Q 63  17 n LEU . 63  Bj 63  
Q 64  17 n THR . 64  Bj 64  
Q 65  17 n PRO . 65  Bj 65  
Q 66  17 n LEU . 66  Bj 66  
Q 67  17 n GLN . 67  Bj 67  
Q 68  17 n GLU . 68  Bj 68  
Q 69  17 n GLU . 69  Bj 69  
Q 70  17 n MET . 70  Bj 70  
Q 71  17 n ALA . 71  Bj 71  
Q 72  17 n ASP . 72  Bj 72  
Q 73  17 n LEU . 73  Bj 73  
Q 74  17 n LEU . 74  Bj 74  
Q 75  17 n GLN . 75  Bj 75  
Q 76  17 n GLN . 76  Bj 76  
Q 77  17 n ILE . 77  Bj 77  
Q 78  17 n GLU . 78  Bj 78  
Q 79  17 n ILE . 79  Bj 79  
Q 80  17 n GLU . 80  Bj 80  
Q 81  17 n ARG . 81  Bj 81  
Q 82  17 n SER . 82  Bj 82  
Q 83  17 n LEU . 83  Bj 83  
Q 84  17 n TYR . 84  Bj 84  
Q 85  17 n SER . 85  Bj 85  
Q 86  17 n ASP . 86  Bj 86  
Q 87  17 n HIS . 87  Bj 87  
Q 88  17 n GLU . 88  Bj 88  
Q 89  17 n LEU . 89  Bj 89  
Q 90  17 n ARG . 90  Bj 90  
Q 91  17 n ALA . 91  Bj 91  
Q 92  17 n LEU . 92  Bj 92  
Q 93  17 n ASP . 93  Bj 93  
Q 94  17 n GLU . 94  Bj 94  
Q 95  17 n ALA . 95  Bj 95  
Q 96  17 n GLN . 96  Bj 96  
Q 97  17 n GLN . 97  Bj 97  
Q 98  17 n LEU . 98  Bj 98  
Q 99  17 n ALA . 99  Bj 99  
Q 100 17 n LYS . 100 Bj 100 
Q 101 17 n LYS . 101 Bj 101 
Q 102 17 n LYS . 102 Bj 102 
Q 103 17 n SER . 103 Bj 103 
Q 104 17 n ASP . 104 Bj 104 
Q ?   17 n LEU . 105 Bj 105 
Q ?   17 n TYR . 106 Bj 106 
Q ?   17 n GLU . 107 Bj 107 
Q ?   17 n GLU . 108 Bj 108 
Q ?   17 n GLU . 109 Bj 109 
Q ?   17 n ASP . 110 Bj 110 
Q ?   17 n GLU . 111 Bj 111 
Q ?   17 n GLN . 112 Bj 112 
Q ?   17 n ASN . 113 Bj 113 
Q ?   17 n ILE . 114 Bj 114 
Q ?   17 n LEU . 115 Bj 115 
Q 116 17 n LEU . 116 Bj 116 
Q 117 17 n ALA . 117 Bj 117 
Q 118 17 n GLN . 118 Bj 118 
Q 119 17 n ASP . 119 Bj 119 
Q 120 17 n LEU . 120 Bj 120 
Q 121 17 n GLU . 121 Bj 121 
Q 122 17 n ASP . 122 Bj 122 
Q 123 17 n MET . 123 Bj 123 
Q 124 17 n TRP . 124 Bj 124 
Q 125 17 n GLU . 125 Bj 125 
Q 126 17 n GLN . 126 Bj 126 
Q 127 17 n LYS . 127 Bj 127 
Q 128 17 n PHE . 128 Bj 128 
Q 129 17 n LEU . 129 Bj 129 
Q 130 17 n HIS . 130 Bj 130 
Q 131 17 n PHE . 131 Bj 131 
Q 132 17 n LYS . 132 Bj 132 
Q 133 17 n LEU . 133 Bj 133 
Q 134 17 n GLY . 134 Bj 134 
Q 135 17 n ALA . 135 Bj 135 
Q 136 17 n ARG . 136 Bj 136 
Q 137 17 n LEU . 137 Bj 137 
Q 138 17 n THR . 138 Bj 138 
Q 139 17 n GLU . 139 Bj 139 
Q 140 17 n ALA . 140 Bj 140 
Q 141 17 n ASP . 141 Bj 141 
Q 142 17 n LYS . 142 Bj 142 
Q 143 17 n LYS . 143 Bj 143 
Q 144 17 n ASP . 144 Bj 144 
Q 145 17 n ASP . 145 Bj 145 
Q 146 17 n ARG . 146 Bj 146 
Q 147 17 n THR . 147 Bj 147 
Q 148 17 n SER . 148 Bj 148 
Q 149 17 n LEU . 149 Bj 149 
Q 150 17 n HIS . 150 Bj 150 
Q 151 17 n ARG . 151 Bj 151 
Q 152 17 n LYS . 152 Bj 152 
Q 153 17 n LEU . 153 Bj 153 
Q 154 17 n ASP . 154 Bj 154 
Q 155 17 n ARG . 155 Bj 155 
Q 156 17 n ASN . 156 Bj 156 
Q 157 17 n LEU . 157 Bj 157 
Q 158 17 n ILE . 158 Bj 158 
Q 159 17 n LEU . 159 Bj 159 
Q 160 17 n LEU . 160 Bj 160 
Q 161 17 n VAL . 161 Bj 161 
Q 162 17 n ARG . 162 Bj 162 
Q 163 17 n GLU . 163 Bj 163 
Q 164 17 n LYS . 164 Bj 164 
Q 165 17 n LEU . 165 Bj 165 
Q 166 17 n GLY . 166 Bj 166 
Q 167 17 n ASP . 167 Bj 167 
Q 168 17 n GLN . 168 Bj 168 
Q 169 17 n ASP . 169 Bj 169 
Q 170 17 n ILE . 170 Bj 170 
Q 171 17 n TRP . 171 Bj 171 
Q 172 17 n MET . 172 Bj 172 
Q 173 17 n LEU . 173 Bj 173 
Q 174 17 n PRO . 174 Bj 174 
Q 175 17 n GLN . 175 Bj 175 
Q 176 17 n SER . 176 Bj 176 
Q 177 17 n ASP . 177 Bj 177 
Q 178 17 n TRP . 178 Bj 178 
Q 179 17 n GLN . 179 Bj 179 
Q 180 17 n PRO . 180 Bj 180 
Q 181 17 n GLY . 181 Bj 181 
Q 182 17 n GLU . 182 Bj 182 
Q 183 17 n THR . 183 Bj 183 
Q 184 17 n LEU . 184 Bj 184 
Q 185 17 n ARG . 185 Bj 185 
Q 186 17 n GLN . 186 Bj 186 
Q 187 17 n THR . 187 Bj 187 
Q 188 17 n ALA . 188 Bj 188 
Q 189 17 n GLU . 189 Bj 189 
Q 190 17 n ARG . 190 Bj 190 
Q 191 17 n THR . 191 Bj 191 
Q 192 17 n LEU . 192 Bj 192 
Q 193 17 n ALA . 193 Bj 193 
Q 194 17 n THR . 194 Bj 194 
Q 195 17 n LEU . 195 Bj 195 
Q 196 17 n SER . 196 Bj 196 
Q 197 17 n GLU . 197 Bj 197 
Q 198 17 n ASN . 198 Bj 198 
Q 199 17 n ASN . 199 Bj 199 
Q 200 17 n MET . 200 Bj 200 
Q 201 17 n GLU . 201 Bj 201 
Q 202 17 n ALA . 202 Bj 202 
Q 203 17 n LYS . 203 Bj 203 
Q 204 17 n PHE . 204 Bj 204 
Q 205 17 n LEU . 205 Bj 205 
Q 206 17 n GLY . 206 Bj 206 
Q 207 17 n ASN . 207 Bj 207 
Q 208 17 n ALA . 208 Bj 208 
Q 209 17 n PRO . 209 Bj 209 
Q 210 17 n CYS . 210 Bj 210 
Q 211 17 n GLY . 211 Bj 211 
Q 212 17 n HIS . 212 Bj 212 
Q 213 17 n TYR . 213 Bj 213 
Q 214 17 n LYS . 214 Bj 214 
Q 215 17 n PHE . 215 Bj 215 
Q 216 17 n LYS . 216 Bj 216 
Q 217 17 n PHE . 217 Bj 217 
Q ?   17 n PRO . 218 Bj 218 
Q ?   17 n GLN . 219 Bj 219 
Q ?   17 n ALA . 220 Bj 220 
Q ?   17 n MET . 221 Bj 221 
Q ?   17 n ARG . 222 Bj 222 
Q ?   17 n THR . 223 Bj 223 
Q ?   17 n GLU . 224 Bj 224 
Q ?   17 n THR . 225 Bj 225 
Q ?   17 n SER . 226 Bj 226 
Q 227 17 n LEU . 227 Bj 227 
Q 228 17 n GLY . 228 Bj 228 
Q 229 17 n ALA . 229 Bj 229 
Q 230 17 n LYS . 230 Bj 230 
Q 231 17 n VAL . 231 Bj 231 
Q 232 17 n PHE . 232 Bj 232 
Q 233 17 n PHE . 233 Bj 233 
Q 234 17 n PHE . 234 Bj 234 
Q 235 17 n LYS . 235 Bj 235 
Q 236 17 n ALA . 236 Bj 236 
Q 237 17 n LEU . 237 Bj 237 
Q 238 17 n LEU . 238 Bj 238 
Q 239 17 n LEU . 239 Bj 239 
Q 240 17 n THR . 240 Bj 240 
Q 241 17 n GLY . 241 Bj 241 
Q 242 17 n ASP . 242 Bj 242 
Q 243 17 n PHE . 243 Bj 243 
Q 244 17 n SER . 244 Bj 244 
Q 245 17 n GLN . 245 Bj 245 
Q 246 17 n ALA . 246 Bj 246 
Q 247 17 n GLY . 247 Bj 247 
Q 248 17 n LYS . 248 Bj 248 
Q 249 17 n LYS . 249 Bj 249 
Q 250 17 n GLY . 250 Bj 250 
Q 251 17 n HIS . 251 Bj 251 
Q 252 17 n HIS . 252 Bj 252 
Q 253 17 n VAL . 253 Bj 253 
Q 254 17 n TRP . 254 Bj 254 
Q 255 17 n VAL . 255 Bj 255 
Q 256 17 n SER . 256 Bj 256 
Q 257 17 n LYS . 257 Bj 257 
Q 258 17 n GLU . 258 Bj 258 
Q 259 17 n GLU . 259 Bj 259 
Q 260 17 n LEU . 260 Bj 260 
Q 261 17 n GLY . 261 Bj 261 
Q 262 17 n ASP . 262 Bj 262 
Q 263 17 n TYR . 263 Bj 263 
Q 264 17 n LEU . 264 Bj 264 
Q 265 17 n LYS . 265 Bj 265 
Q 266 17 n PRO . 266 Bj 266 
Q 267 17 n LYS . 267 Bj 267 
Q 268 17 n TYR . 268 Bj 268 
Q 269 17 n LEU . 269 Bj 269 
Q 270 17 n ALA . 270 Bj 270 
Q 271 17 n GLN . 271 Bj 271 
Q 272 17 n VAL . 272 Bj 272 
Q 273 17 n ARG . 273 Bj 273 
Q 274 17 n ARG . 274 Bj 274 
Q 275 17 n PHE . 275 Bj 275 
Q 276 17 n LEU . 276 Bj 276 
Q 277 17 n LEU . 277 Bj 277 
Q 278 17 n ASP . 278 Bj 278 
Q 279 17 n LEU . 279 Bj 279 
#
_pdbx_struct_assembly.details            author_defined_assembly
_pdbx_struct_assembly.id                 1
_pdbx_struct_assembly.method_details     ?
_pdbx_struct_assembly.oligomeric_count   95
_pdbx_struct_assembly.oligomeric_details 95-meric
#
_pdbx_struct_assembly_gen.assembly_id     1
_pdbx_struct_assembly_gen.asym_id_list    A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z,AA,BA,CA,DA,EA,FA,GA,HA,IA,JA,KA,LA,MA,NA,OA,PA,QA,RA,SA,TA,UA,VA,WA,XA,YA,ZA,AB,BB,CB,DB,EB,FB,GB,HB,IB,JB,KB,LB,MB,NB,OB,PB,QB,RB,SB,TB,UB,VB,WB,XB,YB,ZB,AC,BC,CC,DC,EC,FC,GC,HC,IC,JC,KC,LC,MC,NC,OC,PC,QC,RC,SC,TC,UC,VC,WC,XC,YC,ZC,AD,BD,CD,DD,ED,FD,GD,HD,ID,JD,KD,LD,MD,ND,OD,PD,QD,RD,SD,TD,UD,VD,WD,XD,YD,ZD,AE,BE,CE,DE,EE,FE,GE,HE,IE,JE,KE,LE,ME,NE,OE,PE,QE,RE,SE,TE,UE,VE,WE,XE,YE,ZE,AF,BF,CF,DF,EF,FF,GF,HF,IF,JF,KF,LF,MF,NF,OF,PF,QF,RF,SF,TF,UF,VF,WF,XF,YF,ZF,AG,BG,CG,DG,EG,FG,GG,HG,IG,JG,KG,LG,MG,NG,OG,PG,QG,RG,SG,TG,UG,VG,WG,XG,YG,ZG,AH,BH,CH,DH,EH,FH,GH,HH,IH,JH,KH,LH,MH,NH,OH,PH,QH,RH,SH,TH,UH,VH,WH,XH,YH,ZH,AI,BI,CI,DI,EI,FI,GI,HI,II,JI,KI,LI,MI,NI,OI,PI,QI,RI,SI,TI,UI,VI,WI,XI,YI,ZI,AJ,BJ,CJ,DJ,EJ,FJ,GJ,HJ,IJ,JJ,KJ,LJ,MJ,NJ,OJ,PJ,QJ,RJ,SJ,TJ,UJ,VJ,WJ,XJ,YJ,ZJ,AK,BK,CK,DK,EK,FK,GK,HK,IK,JK,KK,LK,MK,NK,OK,PK,QK,RK,SK,TK,UK,VK,WK,XK,YK,ZK,AL,BL,CL,DL,EL,FL,GL,HL,IL,JL,KL,LL,ML,NL,OL,PL,QL,RL,SL,TL,UL,VL,WL,XL,YL,ZL,AM,BM,CM,DM,EM,FM,GM,HM,IM,JM,KM,LM,MM,NM,OM,PM,QM,RM,SM,TM,UM,VM,WM,XM,YM,ZM,AN,BN,CN,DN,EN,FN,GN,HN,IN,JN,KN,LN,MN,NN,ON,PN,QN,RN,SN,TN,UN,VN,WN,XN,YN,ZN,AO,BO,CO,DO,EO,FO,GO,HO,IO,JO,KO,LO,MO,NO,OO,PO,QO,RO,SO,TO,UO,VO,WO,XO,YO,ZO,AP,BP,CP,DP,EP,FP,GP,HP,IP,JP,KP,LP,MP,NP,OP,PP,QP,RP,SP
_pdbx_struct_assembly_gen.oper_expression 1
#
_pdbx_struct_oper_list.id                 1
_pdbx_struct_oper_list.matrix[1][1]       1.0000000000
_pdbx_struct_oper_list.matrix[1][2]       0.0000000000
_pdbx_struct_oper_list.matrix[1][3]       0.0000000000
_pdbx_struct_oper_list.matrix[2][1]       0.0000000000
_pdbx_struct_oper_list.matrix[2][2]       1.0000000000
_pdbx_struct_oper_list.matrix[2][3]       0.0000000000
_pdbx_struct_oper_list.matrix[3][1]       0.0000000000
_pdbx_struct_oper_list.matrix[3][2]       0.0000000000
_pdbx_struct_oper_list.matrix[3][3]       1.0000000000
_pdbx_struct_oper_list.name               1_555
_pdbx_struct_oper_list.symmetry_operation ?
_pdbx_struct_oper_list.type               "identity operation"
_pdbx_struct_oper_list.vector[1]          0.0000000000
_pdbx_struct_oper_list.vector[2]          0.0000000000
_pdbx_struct_oper_list.vector[3]          0.0000000000
#
_refine.ls_d_res_high 4.20
#
_software.classification other
_software.name           "DeepMind Structure Class"
_software.pdbx_ordinal   1
_software.version        2.0.0
#
_struct_asym.entity_id 17
_struct_asym.id        Q
#
loop_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.occupancy
_atom_site.B_iso_or_equiv
_atom_site.auth_seq_id
_atom_site.auth_asym_id
_atom_site.pdbx_PDB_model_num
ATOM 1    N N   . SER Q 17 43  ? 162.672 264.147 303.911 1.00 104.46 43  Bj 1 
ATOM 2    C CA  . SER Q 17 43  ? 161.478 264.930 303.620 1.00 104.46 43  Bj 1 
ATOM 3    C C   . SER Q 17 43  ? 160.551 264.181 302.669 1.00 104.46 43  Bj 1 
ATOM 4    O O   . SER Q 17 43  ? 160.970 263.766 301.589 1.00 104.46 43  Bj 1 
ATOM 5    C CB  . SER Q 17 43  ? 161.857 266.287 303.024 1.00 104.46 43  Bj 1 
ATOM 6    O OG  . SER Q 17 43  ? 162.640 267.043 303.931 1.00 104.46 43  Bj 1 
ATOM 7    N N   . PRO Q 17 44  ? 159.295 264.000 303.074 1.00 115.21 44  Bj 1 
ATOM 8    C CA  . PRO Q 17 44  ? 158.333 263.328 302.193 1.00 115.21 44  Bj 1 
ATOM 9    C C   . PRO Q 17 44  ? 157.997 264.188 300.984 1.00 115.21 44  Bj 1 
ATOM 10   O O   . PRO Q 17 44  ? 157.754 265.392 301.099 1.00 115.21 44  Bj 1 
ATOM 11   C CB  . PRO Q 17 44  ? 157.110 263.118 303.093 1.00 115.21 44  Bj 1 
ATOM 12   C CG  . PRO Q 17 44  ? 157.236 264.161 304.150 1.00 115.21 44  Bj 1 
ATOM 13   C CD  . PRO Q 17 44  ? 158.707 264.346 304.379 1.00 115.21 44  Bj 1 
ATOM 14   N N   . TRP Q 17 45  ? 157.996 263.551 299.814 1.00 124.11 45  Bj 1 
ATOM 15   C CA  . TRP Q 17 45  ? 157.732 264.221 298.549 1.00 124.11 45  Bj 1 
ATOM 16   C C   . TRP Q 17 45  ? 156.706 263.430 297.755 1.00 124.11 45  Bj 1 
ATOM 17   O O   . TRP Q 17 45  ? 156.918 262.249 297.460 1.00 124.11 45  Bj 1 
ATOM 18   C CB  . TRP Q 17 45  ? 159.014 264.384 297.726 1.00 124.11 45  Bj 1 
ATOM 19   C CG  . TRP Q 17 45  ? 159.872 265.522 298.174 1.00 124.11 45  Bj 1 
ATOM 20   C CD1 . TRP Q 17 45  ? 160.962 265.456 298.990 1.00 124.11 45  Bj 1 
ATOM 21   C CD2 . TRP Q 17 45  ? 159.709 266.903 297.831 1.00 124.11 45  Bj 1 
ATOM 22   N NE1 . TRP Q 17 45  ? 161.490 266.710 299.176 1.00 124.11 45  Bj 1 
ATOM 23   C CE2 . TRP Q 17 45  ? 160.738 267.616 298.475 1.00 124.11 45  Bj 1 
ATOM 24   C CE3 . TRP Q 17 45  ? 158.793 267.605 297.042 1.00 124.11 45  Bj 1 
ATOM 25   C CZ2 . TRP Q 17 45  ? 160.877 268.997 298.355 1.00 124.11 45  Bj 1 
ATOM 26   C CZ3 . TRP Q 17 45  ? 158.932 268.975 296.925 1.00 124.11 45  Bj 1 
ATOM 27   C CH2 . TRP Q 17 45  ? 159.966 269.656 297.577 1.00 124.11 45  Bj 1 
ATOM 28   N N   . ARG Q 17 46  ? 155.602 264.083 297.413 1.00 135.34 46  Bj 1 
ATOM 29   C CA  . ARG Q 17 46  ? 154.591 263.520 296.531 1.00 135.34 46  Bj 1 
ATOM 30   C C   . ARG Q 17 46  ? 154.887 263.943 295.098 1.00 135.34 46  Bj 1 
ATOM 31   O O   . ARG Q 17 46  ? 155.343 265.063 294.855 1.00 135.34 46  Bj 1 
ATOM 32   C CB  . ARG Q 17 46  ? 153.191 263.983 296.943 1.00 135.34 46  Bj 1 
ATOM 33   C CG  . ARG Q 17 46  ? 152.052 263.259 296.243 1.00 135.34 46  Bj 1 
ATOM 34   C CD  . ARG Q 17 46  ? 150.703 263.776 296.723 1.00 135.34 46  Bj 1 
ATOM 35   N NE  . ARG Q 17 46  ? 149.585 263.097 296.074 1.00 135.34 46  Bj 1 
ATOM 36   C CZ  . ARG Q 17 46  ? 148.306 263.372 296.309 1.00 135.34 46  Bj 1 
ATOM 37   N NH1 . ARG Q 17 46  ? 147.977 264.316 297.180 1.00 135.34 46  Bj 1 
ATOM 38   N NH2 . ARG Q 17 46  ? 147.353 262.704 295.673 1.00 135.34 46  Bj 1 
ATOM 39   N N   . LEU Q 17 47  ? 154.641 263.040 294.152 1.00 137.26 47  Bj 1 
ATOM 40   C CA  . LEU Q 17 47  ? 154.910 263.296 292.743 1.00 137.26 47  Bj 1 
ATOM 41   C C   . LEU Q 17 47  ? 153.644 263.057 291.937 1.00 137.26 47  Bj 1 
ATOM 42   O O   . LEU Q 17 47  ? 152.955 262.053 292.143 1.00 137.26 47  Bj 1 
ATOM 43   C CB  . LEU Q 17 47  ? 156.056 262.414 292.233 1.00 137.26 47  Bj 1 
ATOM 44   C CG  . LEU Q 17 47  ? 156.329 261.107 292.986 1.00 137.26 47  Bj 1 
ATOM 45   C CD1 . LEU Q 17 47  ? 155.350 260.012 292.587 1.00 137.26 47  Bj 1 
ATOM 46   C CD2 . LEU Q 17 47  ? 157.766 260.652 292.776 1.00 137.26 47  Bj 1 
ATOM 47   N N   . LEU Q 17 48  ? 153.331 263.982 291.030 1.00 138.18 48  Bj 1 
ATOM 48   C CA  . LEU Q 17 48  ? 152.120 263.883 290.230 1.00 138.18 48  Bj 1 
ATOM 49   C C   . LEU Q 17 48  ? 152.394 264.339 288.806 1.00 138.18 48  Bj 1 
ATOM 50   O O   . LEU Q 17 48  ? 153.199 265.246 288.575 1.00 138.18 48  Bj 1 
ATOM 51   C CB  . LEU Q 17 48  ? 150.977 264.725 290.818 1.00 138.18 48  Bj 1 
ATOM 52   C CG  . LEU Q 17 48  ? 150.485 264.427 292.237 1.00 138.18 48  Bj 1 
ATOM 53   C CD1 . LEU Q 17 48  ? 151.283 265.210 293.269 1.00 138.18 48  Bj 1 
ATOM 54   C CD2 . LEU Q 17 48  ? 149.000 264.730 292.359 1.00 138.18 48  Bj 1 
ATOM 55   N N   . GLY Q 17 49  ? 151.716 263.701 287.855 1.00 135.43 49  Bj 1 
ATOM 56   C CA  . GLY Q 17 49  ? 151.707 264.149 286.482 1.00 135.43 49  Bj 1 
ATOM 57   C C   . GLY Q 17 49  ? 150.384 264.812 286.131 1.00 135.43 49  Bj 1 
ATOM 58   O O   . GLY Q 17 49  ? 149.360 264.601 286.775 1.00 135.43 49  Bj 1 
ATOM 59   N N   . ALA Q 17 50  ? 150.428 265.639 285.090 1.00 130.02 50  Bj 1 
ATOM 60   C CA  . ALA Q 17 50  ? 149.244 266.346 284.629 1.00 130.02 50  Bj 1 
ATOM 61   C C   . ALA Q 17 50  ? 149.304 266.468 283.116 1.00 130.02 50  Bj 1 
ATOM 62   O O   . ALA Q 17 50  ? 150.384 266.588 282.529 1.00 130.02 50  Bj 1 
ATOM 63   C CB  . ALA Q 17 50  ? 149.121 267.730 285.275 1.00 130.02 50  Bj 1 
ATOM 64   N N   . LEU Q 17 51  ? 148.131 266.439 282.491 1.00 127.85 51  Bj 1 
ATOM 65   C CA  . LEU Q 17 51  ? 148.013 266.429 281.039 1.00 127.85 51  Bj 1 
ATOM 66   C C   . LEU Q 17 51  ? 147.458 267.759 280.549 1.00 127.85 51  Bj 1 
ATOM 67   O O   . LEU Q 17 51  ? 146.498 268.285 281.121 1.00 127.85 51  Bj 1 
ATOM 68   C CB  . LEU Q 17 51  ? 147.117 265.280 280.572 1.00 127.85 51  Bj 1 
ATOM 69   C CG  . LEU Q 17 51  ? 146.876 265.173 279.065 1.00 127.85 51  Bj 1 
ATOM 70   C CD1 . LEU Q 17 51  ? 148.194 265.030 278.321 1.00 127.85 51  Bj 1 
ATOM 71   C CD2 . LEU Q 17 51  ? 145.949 264.010 278.748 1.00 127.85 51  Bj 1 
ATOM 72   N N   . CYS Q 17 52  ? 148.064 268.295 279.492 1.00 126.27 52  Bj 1 
ATOM 73   C CA  . CYS Q 17 52  ? 147.580 269.488 278.806 1.00 126.27 52  Bj 1 
ATOM 74   C C   . CYS Q 17 52  ? 147.282 269.077 277.369 1.00 126.27 52  Bj 1 
ATOM 75   O O   . CYS Q 17 52  ? 148.176 269.073 276.517 1.00 126.27 52  Bj 1 
ATOM 76   C CB  . CYS Q 17 52  ? 148.607 270.615 278.866 1.00 126.27 52  Bj 1 
ATOM 77   S SG  . CYS Q 17 52  ? 149.201 271.004 280.527 1.00 126.27 52  Bj 1 
ATOM 78   N N   . LEU Q 17 53  ? 146.033 268.707 277.107 1.00 117.88 53  Bj 1 
ATOM 79   C CA  . LEU Q 17 53  ? 145.621 268.248 275.787 1.00 117.88 53  Bj 1 
ATOM 80   C C   . LEU Q 17 53  ? 145.134 269.436 274.969 1.00 117.88 53  Bj 1 
ATOM 81   O O   . LEU Q 17 53  ? 144.159 270.096 275.343 1.00 117.88 53  Bj 1 
ATOM 82   C CB  . LEU Q 17 53  ? 144.526 267.191 275.898 1.00 117.88 53  Bj 1 
ATOM 83   C CG  . LEU Q 17 53  ? 143.910 266.774 274.563 1.00 117.88 53  Bj 1 
ATOM 84   C CD1 . LEU Q 17 53  ? 144.958 266.142 273.659 1.00 117.88 53  Bj 1 
ATOM 85   C CD2 . LEU Q 17 53  ? 142.749 265.828 274.792 1.00 117.88 53  Bj 1 
ATOM 86   N N   . GLN Q 17 54  ? 145.803 269.698 273.851 1.00 118.52 54  Bj 1 
ATOM 87   C CA  . GLN Q 17 54  ? 145.488 270.830 272.992 1.00 118.52 54  Bj 1 
ATOM 88   C C   . GLN Q 17 54  ? 144.817 270.326 271.723 1.00 118.52 54  Bj 1 
ATOM 89   O O   . GLN Q 17 54  ? 145.391 269.510 270.993 1.00 118.52 54  Bj 1 
ATOM 90   C CB  . GLN Q 17 54  ? 146.748 271.626 272.652 1.00 118.52 54  Bj 1 
ATOM 91   C CG  . GLN Q 17 54  ? 147.464 272.202 273.860 1.00 118.52 54  Bj 1 
ATOM 92   C CD  . GLN Q 17 54  ? 148.683 273.016 273.478 1.00 118.52 54  Bj 1 
ATOM 93   O OE1 . GLN Q 17 54  ? 148.961 273.222 272.297 1.00 118.52 54  Bj 1 
ATOM 94   N NE2 . GLN Q 17 54  ? 149.419 273.484 274.478 1.00 118.52 54  Bj 1 
ATOM 95   N N   . ARG Q 17 55  ? 143.598 270.796 271.480 1.00 113.62 55  Bj 1 
ATOM 96   C CA  . ARG Q 17 55  ? 142.952 270.625 270.189 1.00 113.62 55  Bj 1 
ATOM 97   C C   . ARG Q 17 55  ? 143.238 271.852 269.337 1.00 113.62 55  Bj 1 
ATOM 98   O O   . ARG Q 17 55  ? 142.879 272.968 269.740 1.00 113.62 55  Bj 1 
ATOM 99   C CB  . ARG Q 17 55  ? 141.455 270.444 270.349 1.00 113.62 55  Bj 1 
ATOM 100  C CG  . ARG Q 17 55  ? 140.733 270.185 269.037 1.00 113.62 55  Bj 1 
ATOM 101  C CD  . ARG Q 17 55  ? 139.290 270.650 269.102 1.00 113.62 55  Bj 1 
ATOM 102  N NE  . ARG Q 17 55  ? 139.013 271.693 268.119 1.00 113.62 55  Bj 1 
ATOM 103  C CZ  . ARG Q 17 55  ? 139.321 272.974 268.284 1.00 113.62 55  Bj 1 
ATOM 104  N NH1 . ARG Q 17 55  ? 139.923 273.375 269.395 1.00 113.62 55  Bj 1 
ATOM 105  N NH2 . ARG Q 17 55  ? 139.032 273.855 267.337 1.00 113.62 55  Bj 1 
ATOM 106  N N   . PRO Q 17 56  ? 143.874 271.703 268.180 1.00 114.98 56  Bj 1 
ATOM 107  C CA  . PRO Q 17 56  ? 144.258 272.868 267.384 1.00 114.98 56  Bj 1 
ATOM 108  C C   . PRO Q 17 56  ? 143.057 273.471 266.683 1.00 114.98 56  Bj 1 
ATOM 109  O O   . PRO Q 17 56  ? 142.018 272.811 266.528 1.00 114.98 56  Bj 1 
ATOM 110  C CB  . PRO Q 17 56  ? 145.255 272.283 266.375 1.00 114.98 56  Bj 1 
ATOM 111  C CG  . PRO Q 17 56  ? 144.800 270.875 266.201 1.00 114.98 56  Bj 1 
ATOM 112  C CD  . PRO Q 17 56  ? 144.288 270.438 267.549 1.00 114.98 56  Bj 1 
ATOM 113  N N   . PRO Q 17 57  ? 143.156 274.726 266.247 1.00 116.15 57  Bj 1 
ATOM 114  C CA  . PRO Q 17 57  ? 142.053 275.331 265.494 1.00 116.15 57  Bj 1 
ATOM 115  C C   . PRO Q 17 57  ? 141.864 274.658 264.144 1.00 116.15 57  Bj 1 
ATOM 116  O O   . PRO Q 17 57  ? 142.830 274.337 263.446 1.00 116.15 57  Bj 1 
ATOM 117  C CB  . PRO Q 17 57  ? 142.492 276.791 265.334 1.00 116.15 57  Bj 1 
ATOM 118  C CG  . PRO Q 17 57  ? 143.977 276.762 265.492 1.00 116.15 57  Bj 1 
ATOM 119  C CD  . PRO Q 17 57  ? 144.251 275.681 266.490 1.00 116.15 57  Bj 1 
ATOM 120  N N   . LEU Q 17 58  ? 140.600 274.449 263.778 1.00 116.27 58  Bj 1 
ATOM 121  C CA  . LEU Q 17 58  ? 140.270 273.823 262.504 1.00 116.27 58  Bj 1 
ATOM 122  C C   . LEU Q 17 58  ? 140.215 274.830 261.361 1.00 116.27 58  Bj 1 
ATOM 123  O O   . LEU Q 17 58  ? 140.604 274.507 260.234 1.00 116.27 58  Bj 1 
ATOM 124  C CB  . LEU Q 17 58  ? 138.934 273.084 262.609 1.00 116.27 58  Bj 1 
ATOM 125  C CG  . LEU Q 17 58  ? 138.884 271.888 263.562 1.00 116.27 58  Bj 1 
ATOM 126  C CD1 . LEU Q 17 58  ? 137.503 271.254 263.554 1.00 116.27 58  Bj 1 
ATOM 127  C CD2 . LEU Q 17 58  ? 139.946 270.864 263.194 1.00 116.27 58  Bj 1 
ATOM 128  N N   . VAL Q 17 59  ? 139.743 276.044 261.628 1.00 110.63 59  Bj 1 
ATOM 129  C CA  . VAL Q 17 59  ? 139.613 277.074 260.606 1.00 110.63 59  Bj 1 
ATOM 130  C C   . VAL Q 17 59  ? 140.674 278.138 260.846 1.00 110.63 59  Bj 1 
ATOM 131  O O   . VAL Q 17 59  ? 141.190 278.295 261.959 1.00 110.63 59  Bj 1 
ATOM 132  C CB  . VAL Q 17 59  ? 138.197 277.692 260.596 1.00 110.63 59  Bj 1 
ATOM 133  C CG1 . VAL Q 17 59  ? 138.060 278.749 261.681 1.00 110.63 59  Bj 1 
ATOM 134  C CG2 . VAL Q 17 59  ? 137.873 278.271 259.228 1.00 110.63 59  Bj 1 
ATOM 135  N N   . THR Q 17 60  ? 141.010 278.864 259.784 1.00 105.54 60  Bj 1 
ATOM 136  C CA  . THR Q 17 60  ? 142.011 279.914 259.869 1.00 105.54 60  Bj 1 
ATOM 137  C C   . THR Q 17 60  ? 141.427 281.168 260.510 1.00 105.54 60  Bj 1 
ATOM 138  O O   . THR Q 17 60  ? 140.245 281.483 260.349 1.00 105.54 60  Bj 1 
ATOM 139  C CB  . THR Q 17 60  ? 142.562 280.246 258.481 1.00 105.54 60  Bj 1 
ATOM 140  O OG1 . THR Q 17 60  ? 143.384 281.417 258.558 1.00 105.54 60  Bj 1 
ATOM 141  C CG2 . THR Q 17 60  ? 141.426 280.489 257.498 1.00 105.54 60  Bj 1 
ATOM 142  N N   . LYS Q 17 61  ? 142.275 281.882 261.244 1.00 98.53  61  Bj 1 
ATOM 143  C CA  . LYS Q 17 61  ? 141.844 283.097 261.913 1.00 98.53  61  Bj 1 
ATOM 144  C C   . LYS Q 17 61  ? 141.540 284.190 260.890 1.00 98.53  61  Bj 1 
ATOM 145  O O   . LYS Q 17 61  ? 142.039 284.151 259.762 1.00 98.53  61  Bj 1 
ATOM 146  C CB  . LYS Q 17 61  ? 142.918 283.578 262.886 1.00 98.53  61  Bj 1 
ATOM 147  C CG  . LYS Q 17 61  ? 143.171 282.633 264.046 1.00 98.53  61  Bj 1 
ATOM 148  C CD  . LYS Q 17 61  ? 144.091 283.258 265.081 1.00 98.53  61  Bj 1 
ATOM 149  C CE  . LYS Q 17 61  ? 144.264 282.348 266.288 1.00 98.53  61  Bj 1 
ATOM 150  N NZ  . LYS Q 17 61  ? 145.130 282.959 267.333 1.00 98.53  61  Bj 1 
ATOM 151  N N   . PRO Q 17 62  ? 140.716 285.171 261.253 1.00 97.74  62  Bj 1 
ATOM 152  C CA  . PRO Q 17 62  ? 140.458 286.288 260.340 1.00 97.74  62  Bj 1 
ATOM 153  C C   . PRO Q 17 62  ? 141.703 287.136 260.133 1.00 97.74  62  Bj 1 
ATOM 154  O O   . PRO Q 17 62  ? 142.668 287.080 260.898 1.00 97.74  62  Bj 1 
ATOM 155  C CB  . PRO Q 17 62  ? 139.357 287.083 261.049 1.00 97.74  62  Bj 1 
ATOM 156  C CG  . PRO Q 17 62  ? 139.506 286.725 262.488 1.00 97.74  62  Bj 1 
ATOM 157  C CD  . PRO Q 17 62  ? 139.933 285.287 262.495 1.00 97.74  62  Bj 1 
ATOM 158  N N   . LEU Q 17 63  ? 141.667 287.934 259.071 1.00 100.40 63  Bj 1 
ATOM 159  C CA  . LEU Q 17 63  ? 142.797 288.761 258.672 1.00 100.40 63  Bj 1 
ATOM 160  C C   . LEU Q 17 63  ? 142.618 290.179 259.198 1.00 100.40 63  Bj 1 
ATOM 161  O O   . LEU Q 17 63  ? 141.553 290.781 259.027 1.00 100.40 63  Bj 1 
ATOM 162  C CB  . LEU Q 17 63  ? 142.946 288.779 257.150 1.00 100.40 63  Bj 1 
ATOM 163  C CG  . LEU Q 17 63  ? 143.056 287.411 256.475 1.00 100.40 63  Bj 1 
ATOM 164  C CD1 . LEU Q 17 63  ? 143.238 287.556 254.972 1.00 100.40 63  Bj 1 
ATOM 165  C CD2 . LEU Q 17 63  ? 144.195 286.614 257.080 1.00 100.40 63  Bj 1 
ATOM 166  N N   . THR Q 17 64  ? 143.657 290.697 259.845 1.00 107.97 64  Bj 1 
ATOM 167  C CA  . THR Q 17 64  ? 143.667 292.093 260.253 1.00 107.97 64  Bj 1 
ATOM 168  C C   . THR Q 17 64  ? 143.516 292.982 259.019 1.00 107.97 64  Bj 1 
ATOM 169  O O   . THR Q 17 64  ? 144.073 292.666 257.964 1.00 107.97 64  Bj 1 
ATOM 170  C CB  . THR Q 17 64  ? 144.974 292.410 260.987 1.00 107.97 64  Bj 1 
ATOM 171  O OG1 . THR Q 17 64  ? 145.120 291.524 262.105 1.00 107.97 64  Bj 1 
ATOM 172  C CG2 . THR Q 17 64  ? 145.005 293.848 261.485 1.00 107.97 64  Bj 1 
ATOM 173  N N   . PRO Q 17 65  ? 142.750 294.076 259.102 1.00 107.81 65  Bj 1 
ATOM 174  C CA  . PRO Q 17 65  ? 142.603 294.962 257.932 1.00 107.81 65  Bj 1 
ATOM 175  C C   . PRO Q 17 65  ? 143.921 295.427 257.333 1.00 107.81 65  Bj 1 
ATOM 176  O O   . PRO Q 17 65  ? 144.005 295.621 256.112 1.00 107.81 65  Bj 1 
ATOM 177  C CB  . PRO Q 17 65  ? 141.785 296.141 258.486 1.00 107.81 65  Bj 1 
ATOM 178  C CG  . PRO Q 17 65  ? 141.775 295.966 259.988 1.00 107.81 65  Bj 1 
ATOM 179  C CD  . PRO Q 17 65  ? 141.881 294.498 260.212 1.00 107.81 65  Bj 1 
ATOM 180  N N   . LEU Q 17 66  ? 144.958 295.608 258.152 1.00 108.37 66  Bj 1 
ATOM 181  C CA  . LEU Q 17 66  ? 146.280 295.907 257.613 1.00 108.37 66  Bj 1 
ATOM 182  C C   . LEU Q 17 66  ? 146.764 294.776 256.714 1.00 108.37 66  Bj 1 
ATOM 183  O O   . LEU Q 17 66  ? 147.264 295.010 255.605 1.00 108.37 66  Bj 1 
ATOM 184  C CB  . LEU Q 17 66  ? 147.261 296.150 258.760 1.00 108.37 66  Bj 1 
ATOM 185  C CG  . LEU Q 17 66  ? 148.674 296.601 258.394 1.00 108.37 66  Bj 1 
ATOM 186  C CD1 . LEU Q 17 66  ? 148.637 297.948 257.693 1.00 108.37 66  Bj 1 
ATOM 187  C CD2 . LEU Q 17 66  ? 149.550 296.661 259.635 1.00 108.37 66  Bj 1 
ATOM 188  N N   . GLN Q 17 67  ? 146.602 293.533 257.172 1.00 108.81 67  Bj 1 
ATOM 189  C CA  . GLN Q 17 67  ? 146.992 292.387 256.360 1.00 108.81 67  Bj 1 
ATOM 190  C C   . GLN Q 17 67  ? 146.109 292.247 255.126 1.00 108.81 67  Bj 1 
ATOM 191  O O   . GLN Q 17 67  ? 146.569 291.758 254.091 1.00 108.81 67  Bj 1 
ATOM 192  C CB  . GLN Q 17 67  ? 146.951 291.114 257.204 1.00 108.81 67  Bj 1 
ATOM 193  C CG  . GLN Q 17 67  ? 147.901 291.140 258.391 1.00 108.81 67  Bj 1 
ATOM 194  C CD  . GLN Q 17 67  ? 148.113 289.770 259.002 1.00 108.81 67  Bj 1 
ATOM 195  O OE1 . GLN Q 17 67  ? 147.728 288.754 258.424 1.00 108.81 67  Bj 1 
ATOM 196  N NE2 . GLN Q 17 67  ? 148.730 289.735 260.177 1.00 108.81 67  Bj 1 
ATOM 197  N N   . GLU Q 17 68  ? 144.851 292.683 255.209 1.00 110.89 68  Bj 1 
ATOM 198  C CA  . GLU Q 17 68  ? 143.985 292.678 254.034 1.00 110.89 68  Bj 1 
ATOM 199  C C   . GLU Q 17 68  ? 144.476 293.670 252.987 1.00 110.89 68  Bj 1 
ATOM 200  O O   . GLU Q 17 68  ? 144.512 293.356 251.791 1.00 110.89 68  Bj 1 
ATOM 201  C CB  . GLU Q 17 68  ? 142.545 292.997 254.438 1.00 110.89 68  Bj 1 
ATOM 202  C CG  . GLU Q 17 68  ? 141.839 291.878 255.186 1.00 110.89 68  Bj 1 
ATOM 203  C CD  . GLU Q 17 68  ? 141.367 290.766 254.268 1.00 110.89 68  Bj 1 
ATOM 204  O OE1 . GLU Q 17 68  ? 141.481 290.917 253.034 1.00 110.89 68  Bj 1 
ATOM 205  O OE2 . GLU Q 17 68  ? 140.877 289.740 254.783 1.00 110.89 68  Bj 1 
ATOM 206  N N   . GLU Q 17 69  ? 144.845 294.877 253.421 1.00 119.08 69  Bj 1 
ATOM 207  C CA  . GLU Q 17 69  ? 145.448 295.841 252.506 1.00 119.08 69  Bj 1 
ATOM 208  C C   . GLU Q 17 69  ? 146.723 295.281 251.888 1.00 119.08 69  Bj 1 
ATOM 209  O O   . GLU Q 17 69  ? 146.964 295.440 250.684 1.00 119.08 69  Bj 1 
ATOM 210  C CB  . GLU Q 17 69  ? 145.744 297.150 253.237 1.00 119.08 69  Bj 1 
ATOM 211  C CG  . GLU Q 17 69  ? 144.526 297.820 253.844 1.00 119.08 69  Bj 1 
ATOM 212  C CD  . GLU Q 17 69  ? 144.878 299.094 254.586 1.00 119.08 69  Bj 1 
ATOM 213  O OE1 . GLU Q 17 69  ? 146.016 299.584 254.422 1.00 119.08 69  Bj 1 
ATOM 214  O OE2 . GLU Q 17 69  ? 144.018 299.605 255.334 1.00 119.08 69  Bj 1 
ATOM 215  N N   . MET Q 17 70  ? 147.551 294.620 252.702 1.00 119.12 70  Bj 1 
ATOM 216  C CA  . MET Q 17 70  ? 148.786 294.039 252.184 1.00 119.12 70  Bj 1 
ATOM 217  C C   . MET Q 17 70  ? 148.499 292.952 251.153 1.00 119.12 70  Bj 1 
ATOM 218  O O   . MET Q 17 70  ? 149.177 292.872 250.123 1.00 119.12 70  Bj 1 
ATOM 219  C CB  . MET Q 17 70  ? 149.628 293.487 253.335 1.00 119.12 70  Bj 1 
ATOM 220  C CG  . MET Q 17 70  ? 150.879 292.746 252.892 1.00 119.12 70  Bj 1 
ATOM 221  S SD  . MET Q 17 70  ? 151.859 293.670 251.693 1.00 119.12 70  Bj 1 
ATOM 222  C CE  . MET Q 17 70  ? 152.198 295.174 252.604 1.00 119.12 70  Bj 1 
ATOM 223  N N   . ALA Q 17 71  ? 147.494 292.112 251.408 1.00 117.23 71  Bj 1 
ATOM 224  C CA  . ALA Q 17 71  ? 147.151 291.056 250.461 1.00 117.23 71  Bj 1 
ATOM 225  C C   . ALA Q 17 71  ? 146.601 291.635 249.164 1.00 117.23 71  Bj 1 
ATOM 226  O O   . ALA Q 17 71  ? 146.901 291.130 248.075 1.00 117.23 71  Bj 1 
ATOM 227  C CB  . ALA Q 17 71  ? 146.146 290.093 251.089 1.00 117.23 71  Bj 1 
ATOM 228  N N   . ASP Q 17 72  ? 145.790 292.690 249.260 1.00 117.37 72  Bj 1 
ATOM 229  C CA  . ASP Q 17 72  ? 145.300 293.360 248.060 1.00 117.37 72  Bj 1 
ATOM 230  C C   . ASP Q 17 72  ? 146.459 293.920 247.245 1.00 117.37 72  Bj 1 
ATOM 231  O O   . ASP Q 17 72  ? 146.511 293.759 246.020 1.00 117.37 72  Bj 1 
ATOM 232  C CB  . ASP Q 17 72  ? 144.317 294.468 248.446 1.00 117.37 72  Bj 1 
ATOM 233  C CG  . ASP Q 17 72  ? 143.468 294.941 247.276 1.00 117.37 72  Bj 1 
ATOM 234  O OD1 . ASP Q 17 72  ? 143.969 294.974 246.132 1.00 117.37 72  Bj 1 
ATOM 235  O OD2 . ASP Q 17 72  ? 142.289 295.283 247.504 1.00 117.37 72  Bj 1 
ATOM 236  N N   . LEU Q 17 73  ? 147.405 294.580 247.919 1.00 119.96 73  Bj 1 
ATOM 237  C CA  . LEU Q 17 73  ? 148.572 295.115 247.226 1.00 119.96 73  Bj 1 
ATOM 238  C C   . LEU Q 17 73  ? 149.385 294.005 246.571 1.00 119.96 73  Bj 1 
ATOM 239  O O   . LEU Q 17 73  ? 149.873 294.161 245.443 1.00 119.96 73  Bj 1 
ATOM 240  C CB  . LEU Q 17 73  ? 149.436 295.910 248.205 1.00 119.96 73  Bj 1 
ATOM 241  C CG  . LEU Q 17 73  ? 150.798 296.368 247.685 1.00 119.96 73  Bj 1 
ATOM 242  C CD1 . LEU Q 17 73  ? 150.633 297.215 246.438 1.00 119.96 73  Bj 1 
ATOM 243  C CD2 . LEU Q 17 73  ? 151.550 297.134 248.760 1.00 119.96 73  Bj 1 
ATOM 244  N N   . LEU Q 17 74  ? 149.546 292.877 247.266 1.00 118.44 74  Bj 1 
ATOM 245  C CA  . LEU Q 17 74  ? 150.309 291.766 246.709 1.00 118.44 74  Bj 1 
ATOM 246  C C   . LEU Q 17 74  ? 149.627 291.192 245.476 1.00 118.44 74  Bj 1 
ATOM 247  O O   . LEU Q 17 74  ? 150.288 290.911 244.472 1.00 118.44 74  Bj 1 
ATOM 248  C CB  . LEU Q 17 74  ? 150.513 290.683 247.766 1.00 118.44 74  Bj 1 
ATOM 249  C CG  . LEU Q 17 74  ? 151.495 291.024 248.888 1.00 118.44 74  Bj 1 
ATOM 250  C CD1 . LEU Q 17 74  ? 151.535 289.909 249.915 1.00 118.44 74  Bj 1 
ATOM 251  C CD2 . LEU Q 17 74  ? 152.883 291.289 248.326 1.00 118.44 74  Bj 1 
ATOM 252  N N   . GLN Q 17 75  ? 148.305 291.017 245.529 1.00 121.57 75  Bj 1 
ATOM 253  C CA  . GLN Q 17 75  ? 147.584 290.533 244.356 1.00 121.57 75  Bj 1 
ATOM 254  C C   . GLN Q 17 75  ? 147.705 291.512 243.195 1.00 121.57 75  Bj 1 
ATOM 255  O O   . GLN Q 17 75  ? 147.891 291.101 242.042 1.00 121.57 75  Bj 1 
ATOM 256  C CB  . GLN Q 17 75  ? 146.116 290.286 244.704 1.00 121.57 75  Bj 1 
ATOM 257  C CG  . GLN Q 17 75  ? 145.881 289.058 245.568 1.00 121.57 75  Bj 1 
ATOM 258  C CD  . GLN Q 17 75  ? 146.176 287.763 244.836 1.00 121.57 75  Bj 1 
ATOM 259  O OE1 . GLN Q 17 75  ? 146.161 287.713 243.606 1.00 121.57 75  Bj 1 
ATOM 260  N NE2 . GLN Q 17 75  ? 146.449 286.705 245.592 1.00 121.57 75  Bj 1 
ATOM 261  N N   . GLN Q 17 76  ? 147.617 292.813 243.483 1.00 121.41 76  Bj 1 
ATOM 262  C CA  . GLN Q 17 76  ? 147.734 293.811 242.425 1.00 121.41 76  Bj 1 
ATOM 263  C C   . GLN Q 17 76  ? 149.103 293.751 241.760 1.00 121.41 76  Bj 1 
ATOM 264  O O   . GLN Q 17 76  ? 149.204 293.703 240.529 1.00 121.41 76  Bj 1 
ATOM 265  C CB  . GLN Q 17 76  ? 147.468 295.209 242.984 1.00 121.41 76  Bj 1 
ATOM 266  C CG  . GLN Q 17 76  ? 146.016 295.474 243.336 1.00 121.41 76  Bj 1 
ATOM 267  C CD  . GLN Q 17 76  ? 145.782 296.899 243.795 1.00 121.41 76  Bj 1 
ATOM 268  O OE1 . GLN Q 17 76  ? 146.644 297.764 243.637 1.00 121.41 76  Bj 1 
ATOM 269  N NE2 . GLN Q 17 76  ? 144.612 297.151 244.370 1.00 121.41 76  Bj 1 
ATOM 270  N N   . ILE Q 17 77  ? 150.173 293.743 242.560 1.00 121.50 77  Bj 1 
ATOM 271  C CA  . ILE Q 17 77  ? 151.509 293.737 241.969 1.00 121.50 77  Bj 1 
ATOM 272  C C   . ILE Q 17 77  ? 151.794 292.406 241.283 1.00 121.50 77  Bj 1 
ATOM 273  O O   . ILE Q 17 77  ? 152.530 292.360 240.289 1.00 121.50 77  Bj 1 
ATOM 274  C CB  . ILE Q 17 77  ? 152.579 294.076 243.026 1.00 121.50 77  Bj 1 
ATOM 275  C CG1 . ILE Q 17 77  ? 152.598 293.031 244.141 1.00 121.50 77  Bj 1 
ATOM 276  C CG2 . ILE Q 17 77  ? 152.341 295.466 243.594 1.00 121.50 77  Bj 1 
ATOM 277  C CD1 . ILE Q 17 77  ? 153.596 293.329 245.239 1.00 121.50 77  Bj 1 
ATOM 278  N N   . GLU Q 17 78  ? 151.203 291.311 241.770 1.00 127.63 78  Bj 1 
ATOM 279  C CA  . GLU Q 17 78  ? 151.360 290.022 241.105 1.00 127.63 78  Bj 1 
ATOM 280  C C   . GLU Q 17 78  ? 150.720 290.042 239.724 1.00 127.63 78  Bj 1 
ATOM 281  O O   . GLU Q 17 78  ? 151.334 289.616 238.738 1.00 127.63 78  Bj 1 
ATOM 282  C CB  . GLU Q 17 78  ? 150.751 288.916 241.968 1.00 127.63 78  Bj 1 
ATOM 283  C CG  . GLU Q 17 78  ? 150.750 287.538 241.324 1.00 127.63 78  Bj 1 
ATOM 284  C CD  . GLU Q 17 78  ? 149.964 286.520 242.129 1.00 127.63 78  Bj 1 
ATOM 285  O OE1 . GLU Q 17 78  ? 149.341 286.910 243.139 1.00 127.63 78  Bj 1 
ATOM 286  O OE2 . GLU Q 17 78  ? 149.967 285.329 241.753 1.00 127.63 78  Bj 1 
ATOM 287  N N   . ILE Q 17 79  ? 149.483 290.539 239.634 1.00 128.89 79  Bj 1 
ATOM 288  C CA  . ILE Q 17 79  ? 148.823 290.642 238.336 1.00 128.89 79  Bj 1 
ATOM 289  C C   . ILE Q 17 79  ? 149.572 291.607 237.426 1.00 128.89 79  Bj 1 
ATOM 290  O O   . ILE Q 17 79  ? 149.639 291.400 236.208 1.00 128.89 79  Bj 1 
ATOM 291  C CB  . ILE Q 17 79  ? 147.349 291.057 238.519 1.00 128.89 79  Bj 1 
ATOM 292  C CG1 . ILE Q 17 79  ? 146.601 290.011 239.349 1.00 128.89 79  Bj 1 
ATOM 293  C CG2 . ILE Q 17 79  ? 146.667 291.245 237.171 1.00 128.89 79  Bj 1 
ATOM 294  C CD1 . ILE Q 17 79  ? 145.159 290.370 239.635 1.00 128.89 79  Bj 1 
ATOM 295  N N   . GLU Q 17 80  ? 150.159 292.661 237.996 1.00 120.51 80  Bj 1 
ATOM 296  C CA  . GLU Q 17 80  ? 150.899 293.625 237.187 1.00 120.51 80  Bj 1 
ATOM 297  C C   . GLU Q 17 80  ? 152.154 292.998 236.589 1.00 120.51 80  Bj 1 
ATOM 298  O O   . GLU Q 17 80  ? 152.403 293.116 235.384 1.00 120.51 80  Bj 1 
ATOM 299  C CB  . GLU Q 17 80  ? 151.254 294.849 238.029 1.00 120.51 80  Bj 1 
ATOM 300  C CG  . GLU Q 17 80  ? 150.076 295.764 238.317 1.00 120.51 80  Bj 1 
ATOM 301  C CD  . GLU Q 17 80  ? 150.361 296.745 239.436 1.00 120.51 80  Bj 1 
ATOM 302  O OE1 . GLU Q 17 80  ? 151.384 296.573 240.132 1.00 120.51 80  Bj 1 
ATOM 303  O OE2 . GLU Q 17 80  ? 149.562 297.686 239.621 1.00 120.51 80  Bj 1 
ATOM 304  N N   . ARG Q 17 81  ? 152.958 292.327 237.415 1.00 127.65 81  Bj 1 
ATOM 305  C CA  . ARG Q 17 81  ? 154.175 291.694 236.924 1.00 127.65 81  Bj 1 
ATOM 306  C C   . ARG Q 17 81  ? 153.910 290.416 236.139 1.00 127.65 81  Bj 1 
ATOM 307  O O   . ARG Q 17 81  ? 154.830 289.913 235.485 1.00 127.65 81  Bj 1 
ATOM 308  C CB  . ARG Q 17 81  ? 155.125 291.390 238.086 1.00 127.65 81  Bj 1 
ATOM 309  C CG  . ARG Q 17 81  ? 155.793 292.620 238.677 1.00 127.65 81  Bj 1 
ATOM 310  C CD  . ARG Q 17 81  ? 156.934 292.237 239.606 1.00 127.65 81  Bj 1 
ATOM 311  N NE  . ARG Q 17 81  ? 157.606 293.409 240.160 1.00 127.65 81  Bj 1 
ATOM 312  C CZ  . ARG Q 17 81  ? 158.686 293.357 240.933 1.00 127.65 81  Bj 1 
ATOM 313  N NH1 . ARG Q 17 81  ? 159.223 292.186 241.246 1.00 127.65 81  Bj 1 
ATOM 314  N NH2 . ARG Q 17 81  ? 159.230 294.475 241.393 1.00 127.65 81  Bj 1 
ATOM 315  N N   . SER Q 17 82  ? 152.693 289.881 236.188 1.00 132.55 82  Bj 1 
ATOM 316  C CA  . SER Q 17 82  ? 152.370 288.695 235.409 1.00 132.55 82  Bj 1 
ATOM 317  C C   . SER Q 17 82  ? 152.400 289.006 233.917 1.00 132.55 82  Bj 1 
ATOM 318  O O   . SER Q 17 82  ? 152.138 290.132 233.487 1.00 132.55 82  Bj 1 
ATOM 319  C CB  . SER Q 17 82  ? 150.995 288.155 235.799 1.00 132.55 82  Bj 1 
ATOM 320  O OG  . SER Q 17 82  ? 150.618 287.084 234.953 1.00 132.55 82  Bj 1 
ATOM 321  N N   . LEU Q 17 83  ? 152.726 287.986 233.123 1.00 141.40 83  Bj 1 
ATOM 322  C CA  . LEU Q 17 83  ? 152.784 288.167 231.677 1.00 141.40 83  Bj 1 
ATOM 323  C C   . LEU Q 17 83  ? 151.391 288.102 231.062 1.00 141.40 83  Bj 1 
ATOM 324  O O   . LEU Q 17 83  ? 150.906 289.086 230.495 1.00 141.40 83  Bj 1 
ATOM 325  C CB  . LEU Q 17 83  ? 153.703 287.117 231.046 1.00 141.40 83  Bj 1 
ATOM 326  C CG  . LEU Q 17 83  ? 155.217 287.359 231.080 1.00 141.40 83  Bj 1 
ATOM 327  C CD1 . LEU Q 17 83  ? 155.777 287.271 232.494 1.00 141.40 83  Bj 1 
ATOM 328  C CD2 . LEU Q 17 83  ? 155.934 286.382 230.159 1.00 141.40 83  Bj 1 
ATOM 329  N N   . TYR Q 17 84  ? 150.729 286.953 231.185 1.00 138.40 84  Bj 1 
ATOM 330  C CA  . TYR Q 17 84  ? 149.374 286.749 230.687 1.00 138.40 84  Bj 1 
ATOM 331  C C   . TYR Q 17 84  ? 148.911 285.361 231.099 1.00 138.40 84  Bj 1 
ATOM 332  O O   . TYR Q 17 84  ? 149.722 284.476 231.384 1.00 138.40 84  Bj 1 
ATOM 333  C CB  . TYR Q 17 84  ? 149.286 286.904 229.164 1.00 138.40 84  Bj 1 
ATOM 334  C CG  . TYR Q 17 84  ? 148.728 288.236 228.722 1.00 138.40 84  Bj 1 
ATOM 335  C CD1 . TYR Q 17 84  ? 147.825 288.929 229.517 1.00 138.40 84  Bj 1 
ATOM 336  C CD2 . TYR Q 17 84  ? 149.110 288.805 227.515 1.00 138.40 84  Bj 1 
ATOM 337  C CE1 . TYR Q 17 84  ? 147.313 290.147 229.120 1.00 138.40 84  Bj 1 
ATOM 338  C CE2 . TYR Q 17 84  ? 148.604 290.023 227.109 1.00 138.40 84  Bj 1 
ATOM 339  C CZ  . TYR Q 17 84  ? 147.706 290.690 227.916 1.00 138.40 84  Bj 1 
ATOM 340  O OH  . TYR Q 17 84  ? 147.198 291.905 227.517 1.00 138.40 84  Bj 1 
ATOM 341  N N   . SER Q 17 85  ? 147.594 285.185 231.119 1.00 142.26 85  Bj 1 
ATOM 342  C CA  . SER Q 17 85  ? 146.972 283.899 231.385 1.00 142.26 85  Bj 1 
ATOM 343  C C   . SER Q 17 85  ? 146.297 283.383 230.122 1.00 142.26 85  Bj 1 
ATOM 344  O O   . SER Q 17 85  ? 145.916 284.154 229.237 1.00 142.26 85  Bj 1 
ATOM 345  C CB  . SER Q 17 85  ? 145.951 284.005 232.523 1.00 142.26 85  Bj 1 
ATOM 346  O OG  . SER Q 17 85  ? 145.350 282.749 232.786 1.00 142.26 85  Bj 1 
ATOM 347  N N   . ASP Q 17 86  ? 146.159 282.058 230.045 1.00 146.76 86  Bj 1 
ATOM 348  C CA  . ASP Q 17 86  ? 145.513 281.453 228.884 1.00 146.76 86  Bj 1 
ATOM 349  C C   . ASP Q 17 86  ? 144.067 281.911 228.760 1.00 146.76 86  Bj 1 
ATOM 350  O O   . ASP Q 17 86  ? 143.592 282.202 227.656 1.00 146.76 86  Bj 1 
ATOM 351  C CB  . ASP Q 17 86  ? 145.586 279.929 228.976 1.00 146.76 86  Bj 1 
ATOM 352  C CG  . ASP Q 17 86  ? 147.009 279.410 228.939 1.00 146.76 86  Bj 1 
ATOM 353  O OD1 . ASP Q 17 86  ? 147.939 280.227 228.775 1.00 146.76 86  Bj 1 
ATOM 354  O OD2 . ASP Q 17 86  ? 147.198 278.182 229.073 1.00 146.76 86  Bj 1 
ATOM 355  N N   . HIS Q 17 87  ? 143.355 281.991 229.886 1.00 143.58 87  Bj 1 
ATOM 356  C CA  . HIS Q 17 87  ? 141.955 282.403 229.864 1.00 143.58 87  Bj 1 
ATOM 357  C C   . HIS Q 17 87  ? 141.808 283.826 229.339 1.00 143.58 87  Bj 1 
ATOM 358  O O   . HIS Q 17 87  ? 141.013 284.086 228.428 1.00 143.58 87  Bj 1 
ATOM 359  C CB  . HIS Q 17 87  ? 141.361 282.274 231.266 1.00 143.58 87  Bj 1 
ATOM 360  C CG  . HIS Q 17 87  ? 139.966 282.801 231.387 1.00 143.58 87  Bj 1 
ATOM 361  N ND1 . HIS Q 17 87  ? 138.892 282.220 230.748 1.00 143.58 87  Bj 1 
ATOM 362  C CD2 . HIS Q 17 87  ? 139.468 283.854 232.078 1.00 143.58 87  Bj 1 
ATOM 363  C CE1 . HIS Q 17 87  ? 137.793 282.893 231.039 1.00 143.58 87  Bj 1 
ATOM 364  N NE2 . HIS Q 17 87  ? 138.115 283.889 231.844 1.00 143.58 87  Bj 1 
ATOM 365  N N   . GLU Q 17 88  ? 142.573 284.764 229.906 1.00 144.20 88  Bj 1 
ATOM 366  C CA  . GLU Q 17 88  ? 142.496 286.152 229.463 1.00 144.20 88  Bj 1 
ATOM 367  C C   . GLU Q 17 88  ? 142.938 286.295 228.013 1.00 144.20 88  Bj 1 
ATOM 368  O O   . GLU Q 17 88  ? 142.350 287.073 227.251 1.00 144.20 88  Bj 1 
ATOM 369  C CB  . GLU Q 17 88  ? 143.348 287.040 230.370 1.00 144.20 88  Bj 1 
ATOM 370  C CG  . GLU Q 17 88  ? 142.916 287.043 231.827 1.00 144.20 88  Bj 1 
ATOM 371  C CD  . GLU Q 17 88  ? 141.589 287.744 232.044 1.00 144.20 88  Bj 1 
ATOM 372  O OE1 . GLU Q 17 88  ? 141.201 288.571 231.193 1.00 144.20 88  Bj 1 
ATOM 373  O OE2 . GLU Q 17 88  ? 140.932 287.466 233.070 1.00 144.20 88  Bj 1 
ATOM 374  N N   . LEU Q 17 89  ? 143.972 285.551 227.614 1.00 150.45 89  Bj 1 
ATOM 375  C CA  . LEU Q 17 89  ? 144.455 285.625 226.240 1.00 150.45 89  Bj 1 
ATOM 376  C C   . LEU Q 17 89  ? 143.384 285.161 225.263 1.00 150.45 89  Bj 1 
ATOM 377  O O   . LEU Q 17 89  ? 143.108 285.834 224.263 1.00 150.45 89  Bj 1 
ATOM 378  C CB  . LEU Q 17 89  ? 145.732 284.795 226.090 1.00 150.45 89  Bj 1 
ATOM 379  C CG  . LEU Q 17 89  ? 146.537 284.942 224.794 1.00 150.45 89  Bj 1 
ATOM 380  C CD1 . LEU Q 17 89  ? 148.022 284.792 225.081 1.00 150.45 89  Bj 1 
ATOM 381  C CD2 . LEU Q 17 89  ? 146.100 283.926 223.748 1.00 150.45 89  Bj 1 
ATOM 382  N N   . ARG Q 17 90  ? 142.765 284.008 225.537 1.00 152.73 90  Bj 1 
ATOM 383  C CA  . ARG Q 17 90  ? 141.701 283.518 224.667 1.00 152.73 90  Bj 1 
ATOM 384  C C   . ARG Q 17 90  ? 140.519 284.478 224.647 1.00 152.73 90  Bj 1 
ATOM 385  O O   . ARG Q 17 90  ? 139.922 284.715 223.590 1.00 152.73 90  Bj 1 
ATOM 386  C CB  . ARG Q 17 90  ? 141.249 282.128 225.114 1.00 152.73 90  Bj 1 
ATOM 387  C CG  . ARG Q 17 90  ? 142.304 281.042 224.985 1.00 152.73 90  Bj 1 
ATOM 388  C CD  . ARG Q 17 90  ? 141.785 279.721 225.532 1.00 152.73 90  Bj 1 
ATOM 389  N NE  . ARG Q 17 90  ? 142.813 278.685 225.563 1.00 152.73 90  Bj 1 
ATOM 390  C CZ  . ARG Q 17 90  ? 142.621 277.456 226.032 1.00 152.73 90  Bj 1 
ATOM 391  N NH1 . ARG Q 17 90  ? 141.435 277.105 226.511 1.00 152.73 90  Bj 1 
ATOM 392  N NH2 . ARG Q 17 90  ? 143.613 276.577 226.022 1.00 152.73 90  Bj 1 
ATOM 393  N N   . ALA Q 17 91  ? 140.174 285.051 225.804 1.00 151.16 91  Bj 1 
ATOM 394  C CA  . ALA Q 17 91  ? 139.046 285.974 225.863 1.00 151.16 91  Bj 1 
ATOM 395  C C   . ALA Q 17 91  ? 139.295 287.204 225.000 1.00 151.16 91  Bj 1 
ATOM 396  O O   . ALA Q 17 91  ? 138.448 287.586 224.184 1.00 151.16 91  Bj 1 
ATOM 397  C CB  . ALA Q 17 91  ? 138.774 286.377 227.313 1.00 151.16 91  Bj 1 
ATOM 398  N N   . LEU Q 17 92  ? 140.462 287.836 225.160 1.00 153.35 92  Bj 1 
ATOM 399  C CA  . LEU Q 17 92  ? 140.757 289.032 224.378 1.00 153.35 92  Bj 1 
ATOM 400  C C   . LEU Q 17 92  ? 140.911 288.700 222.898 1.00 153.35 92  Bj 1 
ATOM 401  O O   . LEU Q 17 92  ? 140.504 289.488 222.035 1.00 153.35 92  Bj 1 
ATOM 402  C CB  . LEU Q 17 92  ? 142.008 289.729 224.920 1.00 153.35 92  Bj 1 
ATOM 403  C CG  . LEU Q 17 92  ? 143.367 289.021 224.908 1.00 153.35 92  Bj 1 
ATOM 404  C CD1 . LEU Q 17 92  ? 144.128 289.267 223.608 1.00 153.35 92  Bj 1 
ATOM 405  C CD2 . LEU Q 17 92  ? 144.198 289.456 226.107 1.00 153.35 92  Bj 1 
ATOM 406  N N   . ASP Q 17 93  ? 141.477 287.531 222.583 1.00 158.04 93  Bj 1 
ATOM 407  C CA  . ASP Q 17 93  ? 141.618 287.134 221.188 1.00 158.04 93  Bj 1 
ATOM 408  C C   . ASP Q 17 93  ? 140.259 286.958 220.528 1.00 158.04 93  Bj 1 
ATOM 409  O O   . ASP Q 17 93  ? 140.031 287.459 219.422 1.00 158.04 93  Bj 1 
ATOM 410  C CB  . ASP Q 17 93  ? 142.435 285.845 221.091 1.00 158.04 93  Bj 1 
ATOM 411  C CG  . ASP Q 17 93  ? 142.537 285.325 219.671 1.00 158.04 93  Bj 1 
ATOM 412  O OD1 . ASP Q 17 93  ? 143.236 285.958 218.852 1.00 158.04 93  Bj 1 
ATOM 413  O OD2 . ASP Q 17 93  ? 141.915 284.283 219.372 1.00 158.04 93  Bj 1 
ATOM 414  N N   . GLU Q 17 94  ? 139.338 286.257 221.195 1.00 152.75 94  Bj 1 
ATOM 415  C CA  . GLU Q 17 94  ? 138.009 286.061 220.624 1.00 152.75 94  Bj 1 
ATOM 416  C C   . GLU Q 17 94  ? 137.242 287.374 220.544 1.00 152.75 94  Bj 1 
ATOM 417  O O   . GLU Q 17 94  ? 136.508 287.609 219.576 1.00 152.75 94  Bj 1 
ATOM 418  C CB  . GLU Q 17 94  ? 137.232 285.028 221.439 1.00 152.75 94  Bj 1 
ATOM 419  C CG  . GLU Q 17 94  ? 137.821 283.622 221.404 1.00 152.75 94  Bj 1 
ATOM 420  C CD  . GLU Q 17 94  ? 137.812 283.008 220.014 1.00 152.75 94  Bj 1 
ATOM 421  O OE1 . GLU Q 17 94  ? 138.701 283.342 219.202 1.00 152.75 94  Bj 1 
ATOM 422  O OE2 . GLU Q 17 94  ? 136.913 282.189 219.734 1.00 152.75 94  Bj 1 
ATOM 423  N N   . ALA Q 17 95  ? 137.404 288.249 221.541 1.00 149.73 95  Bj 1 
ATOM 424  C CA  . ALA Q 17 95  ? 136.744 289.549 221.485 1.00 149.73 95  Bj 1 
ATOM 425  C C   . ALA Q 17 95  ? 137.228 290.374 220.300 1.00 149.73 95  Bj 1 
ATOM 426  O O   . ALA Q 17 95  ? 136.409 290.925 219.556 1.00 149.73 95  Bj 1 
ATOM 427  C CB  . ALA Q 17 95  ? 136.966 290.311 222.791 1.00 149.73 95  Bj 1 
ATOM 428  N N   . GLN Q 17 96  ? 138.545 290.458 220.098 1.00 150.30 96  Bj 1 
ATOM 429  C CA  . GLN Q 17 96  ? 139.069 291.205 218.961 1.00 150.30 96  Bj 1 
ATOM 430  C C   . GLN Q 17 96  ? 138.693 290.549 217.637 1.00 150.30 96  Bj 1 
ATOM 431  O O   . GLN Q 17 96  ? 138.419 291.247 216.653 1.00 150.30 96  Bj 1 
ATOM 432  C CB  . GLN Q 17 96  ? 140.587 291.346 219.080 1.00 150.30 96  Bj 1 
ATOM 433  C CG  . GLN Q 17 96  ? 141.037 292.145 220.293 1.00 150.30 96  Bj 1 
ATOM 434  C CD  . GLN Q 17 96  ? 142.543 292.301 220.364 1.00 150.30 96  Bj 1 
ATOM 435  O OE1 . GLN Q 17 96  ? 143.262 291.925 219.438 1.00 150.30 96  Bj 1 
ATOM 436  N NE2 . GLN Q 17 96  ? 143.029 292.859 221.467 1.00 150.30 96  Bj 1 
ATOM 437  N N   . GLN Q 17 97  ? 138.657 289.214 217.595 1.00 151.44 97  Bj 1 
ATOM 438  C CA  . GLN Q 17 97  ? 138.274 288.528 216.367 1.00 151.44 97  Bj 1 
ATOM 439  C C   . GLN Q 17 97  ? 136.824 288.819 216.005 1.00 151.44 97  Bj 1 
ATOM 440  O O   . GLN Q 17 97  ? 136.511 289.077 214.838 1.00 151.44 97  Bj 1 
ATOM 441  C CB  . GLN Q 17 97  ? 138.504 287.024 216.512 1.00 151.44 97  Bj 1 
ATOM 442  C CG  . GLN Q 17 97  ? 138.299 286.242 215.225 1.00 151.44 97  Bj 1 
ATOM 443  C CD  . GLN Q 17 97  ? 138.665 284.777 215.367 1.00 151.44 97  Bj 1 
ATOM 444  O OE1 . GLN Q 17 97  ? 138.752 284.049 214.377 1.00 151.44 97  Bj 1 
ATOM 445  N NE2 . GLN Q 17 97  ? 138.881 284.336 216.601 1.00 151.44 97  Bj 1 
ATOM 446  N N   . LEU Q 17 98  ? 135.926 288.798 216.992 1.00 148.86 98  Bj 1 
ATOM 447  C CA  . LEU Q 17 98  ? 134.535 289.147 216.723 1.00 148.86 98  Bj 1 
ATOM 448  C C   . LEU Q 17 98  ? 134.399 290.617 216.343 1.00 148.86 98  Bj 1 
ATOM 449  O O   . LEU Q 17 98  ? 133.602 290.963 215.462 1.00 148.86 98  Bj 1 
ATOM 450  C CB  . LEU Q 17 98  ? 133.663 288.821 217.936 1.00 148.86 98  Bj 1 
ATOM 451  C CG  . LEU Q 17 98  ? 132.970 287.455 217.941 1.00 148.86 98  Bj 1 
ATOM 452  C CD1 . LEU Q 17 98  ? 133.982 286.318 217.938 1.00 148.86 98  Bj 1 
ATOM 453  C CD2 . LEU Q 17 98  ? 132.028 287.335 219.129 1.00 148.86 98  Bj 1 
ATOM 454  N N   . ALA Q 17 99  ? 135.174 291.494 216.988 1.00 145.68 99  Bj 1 
ATOM 455  C CA  . ALA Q 17 99  ? 135.111 292.915 216.661 1.00 145.68 99  Bj 1 
ATOM 456  C C   . ALA Q 17 99  ? 135.546 293.172 215.225 1.00 145.68 99  Bj 1 
ATOM 457  O O   . ALA Q 17 99  ? 134.966 294.018 214.534 1.00 145.68 99  Bj 1 
ATOM 458  C CB  . ALA Q 17 99  ? 135.974 293.716 217.636 1.00 145.68 99  Bj 1 
ATOM 459  N N   . LYS Q 17 100 ? 136.567 292.452 214.755 1.00 146.95 100 Bj 1 
ATOM 460  C CA  . LYS Q 17 100 ? 137.039 292.630 213.387 1.00 146.95 100 Bj 1 
ATOM 461  C C   . LYS Q 17 100 ? 136.219 291.845 212.371 1.00 146.95 100 Bj 1 
ATOM 462  O O   . LYS Q 17 100 ? 136.274 292.159 211.177 1.00 146.95 100 Bj 1 
ATOM 463  C CB  . LYS Q 17 100 ? 138.514 292.233 213.279 1.00 146.95 100 Bj 1 
ATOM 464  C CG  . LYS Q 17 100 ? 139.442 293.056 214.160 1.00 146.95 100 Bj 1 
ATOM 465  C CD  . LYS Q 17 100 ? 139.237 294.550 213.946 1.00 146.95 100 Bj 1 
ATOM 466  C CE  . LYS Q 17 100 ? 139.610 294.973 212.533 1.00 146.95 100 Bj 1 
ATOM 467  N NZ  . LYS Q 17 100 ? 139.301 296.408 212.288 1.00 146.95 100 Bj 1 
ATOM 468  N N   . LYS Q 17 101 ? 135.468 290.833 212.812 1.00 146.63 101 Bj 1 
ATOM 469  C CA  . LYS Q 17 101 ? 134.598 290.100 211.900 1.00 146.63 101 Bj 1 
ATOM 470  C C   . LYS Q 17 101 ? 133.263 290.804 211.699 1.00 146.63 101 Bj 1 
ATOM 471  O O   . LYS Q 17 101 ? 132.679 290.714 210.613 1.00 146.63 101 Bj 1 
ATOM 472  C CB  . LYS Q 17 101 ? 134.377 288.677 212.420 1.00 146.63 101 Bj 1 
ATOM 473  C CG  . LYS Q 17 101 ? 133.447 287.827 211.565 1.00 146.63 101 Bj 1 
ATOM 474  C CD  . LYS Q 17 101 ? 133.953 287.708 210.137 1.00 146.63 101 Bj 1 
ATOM 475  C CE  . LYS Q 17 101 ? 132.991 286.903 209.277 1.00 146.63 101 Bj 1 
ATOM 476  N NZ  . LYS Q 17 101 ? 133.449 286.811 207.864 1.00 146.63 101 Bj 1 
ATOM 477  N N   . LYS Q 17 102 ? 132.768 291.510 212.721 1.00 149.37 102 Bj 1 
ATOM 478  C CA  . LYS Q 17 102 ? 131.516 292.243 212.568 1.00 149.37 102 Bj 1 
ATOM 479  C C   . LYS Q 17 102 ? 131.629 293.337 211.515 1.00 149.37 102 Bj 1 
ATOM 480  O O   . LYS Q 17 102 ? 130.622 293.722 210.910 1.00 149.37 102 Bj 1 
ATOM 481  C CB  . LYS Q 17 102 ? 131.084 292.839 213.908 1.00 149.37 102 Bj 1 
ATOM 482  C CG  . LYS Q 17 102 ? 130.550 291.819 214.900 1.00 149.37 102 Bj 1 
ATOM 483  C CD  . LYS Q 17 102 ? 130.124 292.485 216.198 1.00 149.37 102 Bj 1 
ATOM 484  C CE  . LYS Q 17 102 ? 129.052 293.533 215.952 1.00 149.37 102 Bj 1 
ATOM 485  N NZ  . LYS Q 17 102 ? 127.840 292.944 215.321 1.00 149.37 102 Bj 1 
ATOM 486  N N   . SER Q 17 103 ? 132.836 293.849 211.283 1.00 153.12 103 Bj 1 
ATOM 487  C CA  . SER Q 17 103 ? 133.065 294.846 210.248 1.00 153.12 103 Bj 1 
ATOM 488  C C   . SER Q 17 103 ? 133.347 294.232 208.883 1.00 153.12 103 Bj 1 
ATOM 489  O O   . SER Q 17 103 ? 133.244 294.935 207.872 1.00 153.12 103 Bj 1 
ATOM 490  C CB  . SER Q 17 103 ? 134.228 295.762 210.645 1.00 153.12 103 Bj 1 
ATOM 491  O OG  . SER Q 17 103 ? 135.428 295.024 210.805 1.00 153.12 103 Bj 1 
ATOM 492  N N   . ASP Q 17 104 ? 133.696 292.950 208.828 1.00 150.06 104 Bj 1 
ATOM 493  C CA  . ASP Q 17 104 ? 133.990 292.286 207.564 1.00 150.06 104 Bj 1 
ATOM 494  C C   . ASP Q 17 104 ? 133.253 290.954 207.461 1.00 150.06 104 Bj 1 
ATOM 495  O O   . ASP Q 17 104 ? 132.042 290.886 207.671 1.00 150.06 104 Bj 1 
ATOM 496  C CB  . ASP Q 17 104 ? 135.497 292.067 207.412 1.00 150.06 104 Bj 1 
ATOM 497  C CG  . ASP Q 17 104 ? 135.859 291.377 206.111 1.00 150.06 104 Bj 1 
ATOM 498  O OD1 . ASP Q 17 104 ? 135.698 292.000 205.040 1.00 150.06 104 Bj 1 
ATOM 499  O OD2 . ASP Q 17 104 ? 136.307 290.212 206.158 1.00 150.06 104 Bj 1 
ATOM 500  N N   . LEU Q 17 116 ? 133.163 280.213 224.046 1.00 145.92 116 Bj 1 
ATOM 501  C CA  . LEU Q 17 116 ? 133.824 281.452 224.439 1.00 145.92 116 Bj 1 
ATOM 502  C C   . LEU Q 17 116 ? 134.248 281.400 225.904 1.00 145.92 116 Bj 1 
ATOM 503  O O   . LEU Q 17 116 ? 134.010 280.409 226.594 1.00 145.92 116 Bj 1 
ATOM 504  C CB  . LEU Q 17 116 ? 132.909 282.657 224.197 1.00 145.92 116 Bj 1 
ATOM 505  C CG  . LEU Q 17 116 ? 132.645 283.081 222.748 1.00 145.92 116 Bj 1 
ATOM 506  C CD1 . LEU Q 17 116 ? 133.940 283.098 221.947 1.00 145.92 116 Bj 1 
ATOM 507  C CD2 . LEU Q 17 116 ? 131.596 282.203 222.072 1.00 145.92 116 Bj 1 
ATOM 508  N N   . ALA Q 17 117 ? 134.878 282.476 226.373 1.00 150.38 117 Bj 1 
ATOM 509  C CA  . ALA Q 17 117 ? 135.358 282.543 227.748 1.00 150.38 117 Bj 1 
ATOM 510  C C   . ALA Q 17 117 ? 134.316 283.114 228.702 1.00 150.38 117 Bj 1 
ATOM 511  O O   . ALA Q 17 117 ? 134.259 282.710 229.870 1.00 150.38 117 Bj 1 
ATOM 512  C CB  . ALA Q 17 117 ? 136.638 283.378 227.815 1.00 150.38 117 Bj 1 
ATOM 513  N N   . GLN Q 17 118 ? 133.490 284.050 228.229 1.00 142.89 118 Bj 1 
ATOM 514  C CA  . GLN Q 17 118 ? 132.488 284.656 229.099 1.00 142.89 118 Bj 1 
ATOM 515  C C   . GLN Q 17 118 ? 131.425 283.644 229.507 1.00 142.89 118 Bj 1 
ATOM 516  O O   . GLN Q 17 118 ? 130.930 283.680 230.639 1.00 142.89 118 Bj 1 
ATOM 517  C CB  . GLN Q 17 118 ? 131.852 285.861 228.409 1.00 142.89 118 Bj 1 
ATOM 518  C CG  . GLN Q 17 118 ? 132.831 286.982 228.103 1.00 142.89 118 Bj 1 
ATOM 519  C CD  . GLN Q 17 118 ? 132.150 288.215 227.546 1.00 142.89 118 Bj 1 
ATOM 520  O OE1 . GLN Q 17 118 ? 130.942 288.218 227.309 1.00 142.89 118 Bj 1 
ATOM 521  N NE2 . GLN Q 17 118 ? 132.924 289.274 227.337 1.00 142.89 118 Bj 1 
ATOM 522  N N   . ASP Q 17 119 ? 131.065 282.731 228.601 1.00 146.82 119 Bj 1 
ATOM 523  C CA  . ASP Q 17 119 ? 130.108 281.686 228.951 1.00 146.82 119 Bj 1 
ATOM 524  C C   . ASP Q 17 119 ? 130.655 280.792 230.056 1.00 146.82 119 Bj 1 
ATOM 525  O O   . ASP Q 17 119 ? 129.943 280.472 231.016 1.00 146.82 119 Bj 1 
ATOM 526  C CB  . ASP Q 17 119 ? 129.759 280.857 227.715 1.00 146.82 119 Bj 1 
ATOM 527  C CG  . ASP Q 17 119 ? 129.136 281.688 226.613 1.00 146.82 119 Bj 1 
ATOM 528  O OD1 . ASP Q 17 119 ? 128.456 282.687 226.932 1.00 146.82 119 Bj 1 
ATOM 529  O OD2 . ASP Q 17 119 ? 129.325 281.343 225.428 1.00 146.82 119 Bj 1 
ATOM 530  N N   . LEU Q 17 120 ? 131.922 280.388 229.941 1.00 143.97 120 Bj 1 
ATOM 531  C CA  . LEU Q 17 120 ? 132.531 279.559 230.976 1.00 143.97 120 Bj 1 
ATOM 532  C C   . LEU Q 17 120 ? 132.639 280.316 232.294 1.00 143.97 120 Bj 1 
ATOM 533  O O   . LEU Q 17 120 ? 132.434 279.736 233.367 1.00 143.97 120 Bj 1 
ATOM 534  C CB  . LEU Q 17 120 ? 133.907 279.077 230.517 1.00 143.97 120 Bj 1 
ATOM 535  C CG  . LEU Q 17 120 ? 133.963 278.376 229.157 1.00 143.97 120 Bj 1 
ATOM 536  C CD1 . LEU Q 17 120 ? 135.379 277.917 228.843 1.00 143.97 120 Bj 1 
ATOM 537  C CD2 . LEU Q 17 120 ? 132.992 277.205 229.107 1.00 143.97 120 Bj 1 
ATOM 538  N N   . GLU Q 17 121 ? 132.949 281.613 232.235 1.00 138.39 121 Bj 1 
ATOM 539  C CA  . GLU Q 17 121 ? 133.032 282.405 233.459 1.00 138.39 121 Bj 1 
ATOM 540  C C   . GLU Q 17 121 ? 131.674 282.510 234.141 1.00 138.39 121 Bj 1 
ATOM 541  O O   . GLU Q 17 121 ? 131.573 282.370 235.366 1.00 138.39 121 Bj 1 
ATOM 542  C CB  . GLU Q 17 121 ? 133.586 283.796 233.152 1.00 138.39 121 Bj 1 
ATOM 543  C CG  . GLU Q 17 121 ? 133.560 284.751 234.337 1.00 138.39 121 Bj 1 
ATOM 544  C CD  . GLU Q 17 121 ? 134.430 284.285 235.491 1.00 138.39 121 Bj 1 
ATOM 545  O OE1 . GLU Q 17 121 ? 135.428 283.575 235.242 1.00 138.39 121 Bj 1 
ATOM 546  O OE2 . GLU Q 17 121 ? 134.114 284.628 236.650 1.00 138.39 121 Bj 1 
ATOM 547  N N   . ASP Q 17 122 ? 130.617 282.755 233.364 1.00 136.27 122 Bj 1 
ATOM 548  C CA  . ASP Q 17 122 ? 129.278 282.822 233.938 1.00 136.27 122 Bj 1 
ATOM 549  C C   . ASP Q 17 122 ? 128.853 281.471 234.501 1.00 136.27 122 Bj 1 
ATOM 550  O O   . ASP Q 17 122 ? 128.190 281.408 235.543 1.00 136.27 122 Bj 1 
ATOM 551  C CB  . ASP Q 17 122 ? 128.281 283.308 232.888 1.00 136.27 122 Bj 1 
ATOM 552  C CG  . ASP Q 17 122 ? 128.626 284.682 232.352 1.00 136.27 122 Bj 1 
ATOM 553  O OD1 . ASP Q 17 122 ? 129.645 285.254 232.793 1.00 136.27 122 Bj 1 
ATOM 554  O OD2 . ASP Q 17 122 ? 127.881 285.189 231.488 1.00 136.27 122 Bj 1 
ATOM 555  N N   . MET Q 17 123 ? 129.232 280.381 233.829 1.00 138.10 123 Bj 1 
ATOM 556  C CA  . MET Q 17 123 ? 128.929 279.051 234.345 1.00 138.10 123 Bj 1 
ATOM 557  C C   . MET Q 17 123 ? 129.632 278.806 235.675 1.00 138.10 123 Bj 1 
ATOM 558  O O   . MET Q 17 123 ? 129.032 278.278 236.618 1.00 138.10 123 Bj 1 
ATOM 559  C CB  . MET Q 17 123 ? 129.329 277.991 233.319 1.00 138.10 123 Bj 1 
ATOM 560  C CG  . MET Q 17 123 ? 128.950 276.572 233.702 1.00 138.10 123 Bj 1 
ATOM 561  S SD  . MET Q 17 123 ? 129.525 275.362 232.494 1.00 138.10 123 Bj 1 
ATOM 562  C CE  . MET Q 17 123 ? 128.763 275.986 230.998 1.00 138.10 123 Bj 1 
ATOM 563  N N   . TRP Q 17 124 ? 130.906 279.192 235.770 1.00 136.46 124 Bj 1 
ATOM 564  C CA  . TRP Q 17 124 ? 131.634 279.040 237.027 1.00 136.46 124 Bj 1 
ATOM 565  C C   . TRP Q 17 124 ? 131.008 279.885 238.129 1.00 136.46 124 Bj 1 
ATOM 566  O O   . TRP Q 17 124 ? 130.875 279.430 239.272 1.00 136.46 124 Bj 1 
ATOM 567  C CB  . TRP Q 17 124 ? 133.102 279.416 236.828 1.00 136.46 124 Bj 1 
ATOM 568  C CG  . TRP Q 17 124 ? 133.795 278.588 235.791 1.00 136.46 124 Bj 1 
ATOM 569  C CD1 . TRP Q 17 124 ? 133.472 277.320 235.405 1.00 136.46 124 Bj 1 
ATOM 570  C CD2 . TRP Q 17 124 ? 134.920 278.975 234.994 1.00 136.46 124 Bj 1 
ATOM 571  N NE1 . TRP Q 17 124 ? 134.331 276.891 234.423 1.00 136.46 124 Bj 1 
ATOM 572  C CE2 . TRP Q 17 124 ? 135.229 277.889 234.152 1.00 136.46 124 Bj 1 
ATOM 573  C CE3 . TRP Q 17 124 ? 135.698 280.134 234.913 1.00 136.46 124 Bj 1 
ATOM 574  C CZ2 . TRP Q 17 124 ? 136.283 277.927 233.242 1.00 136.46 124 Bj 1 
ATOM 575  C CZ3 . TRP Q 17 124 ? 136.743 280.169 234.009 1.00 136.46 124 Bj 1 
ATOM 576  C CH2 . TRP Q 17 124 ? 137.026 279.073 233.186 1.00 136.46 124 Bj 1 
ATOM 577  N N   . GLU Q 17 125 ? 130.604 281.116 237.802 1.00 133.02 125 Bj 1 
ATOM 578  C CA  . GLU Q 17 125 ? 129.992 281.984 238.803 1.00 133.02 125 Bj 1 
ATOM 579  C C   . GLU Q 17 125 ? 128.671 281.413 239.299 1.00 133.02 125 Bj 1 
ATOM 580  O O   . GLU Q 17 125 ? 128.403 281.405 240.507 1.00 133.02 125 Bj 1 
ATOM 581  C CB  . GLU Q 17 125 ? 129.785 283.386 238.231 1.00 133.02 125 Bj 1 
ATOM 582  C CG  . GLU Q 17 125 ? 131.071 284.154 237.985 1.00 133.02 125 Bj 1 
ATOM 583  C CD  . GLU Q 17 125 ? 130.819 285.533 237.408 1.00 133.02 125 Bj 1 
ATOM 584  O OE1 . GLU Q 17 125 ? 129.640 285.874 237.179 1.00 133.02 125 Bj 1 
ATOM 585  O OE2 . GLU Q 17 125 ? 131.799 286.274 237.184 1.00 133.02 125 Bj 1 
ATOM 586  N N   . GLN Q 17 126 ? 127.828 280.928 238.383 1.00 132.06 126 Bj 1 
ATOM 587  C CA  . GLN Q 17 126 ? 126.550 280.374 238.808 1.00 132.06 126 Bj 1 
ATOM 588  C C   . GLN Q 17 126 ? 126.735 279.073 239.580 1.00 132.06 126 Bj 1 
ATOM 589  O O   . GLN Q 17 126 ? 125.981 278.808 240.520 1.00 132.06 126 Bj 1 
ATOM 590  C CB  . GLN Q 17 126 ? 125.624 280.176 237.605 1.00 132.06 126 Bj 1 
ATOM 591  C CG  . GLN Q 17 126 ? 126.097 279.164 236.583 1.00 132.06 126 Bj 1 
ATOM 592  C CD  . GLN Q 17 126 ? 125.303 279.223 235.293 1.00 132.06 126 Bj 1 
ATOM 593  O OE1 . GLN Q 17 126 ? 124.412 280.057 235.137 1.00 132.06 126 Bj 1 
ATOM 594  N NE2 . GLN Q 17 126 ? 125.624 278.335 234.359 1.00 132.06 126 Bj 1 
ATOM 595  N N   . LYS Q 17 127 ? 127.748 278.271 239.234 1.00 128.96 127 Bj 1 
ATOM 596  C CA  . LYS Q 17 127 ? 128.037 277.081 240.029 1.00 128.96 127 Bj 1 
ATOM 597  C C   . LYS Q 17 127 ? 128.495 277.455 241.433 1.00 128.96 127 Bj 1 
ATOM 598  O O   . LYS Q 17 127 ? 128.100 276.813 242.414 1.00 128.96 127 Bj 1 
ATOM 599  C CB  . LYS Q 17 127 ? 129.093 276.223 239.332 1.00 128.96 127 Bj 1 
ATOM 600  C CG  . LYS Q 17 127 ? 128.593 275.496 238.093 1.00 128.96 127 Bj 1 
ATOM 601  C CD  . LYS Q 17 127 ? 129.699 274.667 237.457 1.00 128.96 127 Bj 1 
ATOM 602  C CE  . LYS Q 17 127 ? 129.191 273.901 236.246 1.00 128.96 127 Bj 1 
ATOM 603  N NZ  . LYS Q 17 127 ? 130.253 273.047 235.645 1.00 128.96 127 Bj 1 
ATOM 604  N N   . PHE Q 17 128 ? 129.328 278.493 241.547 1.00 124.78 128 Bj 1 
ATOM 605  C CA  . PHE Q 17 128 ? 129.778 278.943 242.861 1.00 124.78 128 Bj 1 
ATOM 606  C C   . PHE Q 17 128 ? 128.613 279.459 243.694 1.00 124.78 128 Bj 1 
ATOM 607  O O   . PHE Q 17 128 ? 128.543 279.208 244.903 1.00 124.78 128 Bj 1 
ATOM 608  C CB  . PHE Q 17 128 ? 130.845 280.026 242.703 1.00 124.78 128 Bj 1 
ATOM 609  C CG  . PHE Q 17 128 ? 131.325 280.607 244.004 1.00 124.78 128 Bj 1 
ATOM 610  C CD1 . PHE Q 17 128 ? 132.290 279.956 244.754 1.00 124.78 128 Bj 1 
ATOM 611  C CD2 . PHE Q 17 128 ? 130.821 281.810 244.470 1.00 124.78 128 Bj 1 
ATOM 612  C CE1 . PHE Q 17 128 ? 132.737 280.489 245.948 1.00 124.78 128 Bj 1 
ATOM 613  C CE2 . PHE Q 17 128 ? 131.264 282.348 245.663 1.00 124.78 128 Bj 1 
ATOM 614  C CZ  . PHE Q 17 128 ? 132.223 281.687 246.403 1.00 124.78 128 Bj 1 
ATOM 615  N N   . LEU Q 17 129 ? 127.688 280.186 243.064 1.00 122.50 129 Bj 1 
ATOM 616  C CA  . LEU Q 17 129 ? 126.535 280.696 243.799 1.00 122.50 129 Bj 1 
ATOM 617  C C   . LEU Q 17 129 ? 125.558 279.583 244.162 1.00 122.50 129 Bj 1 
ATOM 618  O O   . LEU Q 17 129 ? 124.879 279.670 245.192 1.00 122.50 129 Bj 1 
ATOM 619  C CB  . LEU Q 17 129 ? 125.829 281.784 242.989 1.00 122.50 129 Bj 1 
ATOM 620  C CG  . LEU Q 17 129 ? 126.260 283.226 243.273 1.00 122.50 129 Bj 1 
ATOM 621  C CD1 . LEU Q 17 129 ? 126.103 283.546 244.752 1.00 122.50 129 Bj 1 
ATOM 622  C CD2 . LEU Q 17 129 ? 127.688 283.484 242.817 1.00 122.50 129 Bj 1 
ATOM 623  N N   . HIS Q 17 130 ? 125.472 278.535 243.339 1.00 124.27 130 Bj 1 
ATOM 624  C CA  . HIS Q 17 130 ? 124.581 277.424 243.653 1.00 124.27 130 Bj 1 
ATOM 625  C C   . HIS Q 17 130 ? 125.137 276.570 244.785 1.00 124.27 130 Bj 1 
ATOM 626  O O   . HIS Q 17 130 ? 124.395 276.174 245.691 1.00 124.27 130 Bj 1 
ATOM 627  C CB  . HIS Q 17 130 ? 124.343 276.571 242.407 1.00 124.27 130 Bj 1 
ATOM 628  C CG  . HIS Q 17 130 ? 123.598 277.281 241.320 1.00 124.27 130 Bj 1 
ATOM 629  N ND1 . HIS Q 17 130 ? 122.957 278.485 241.521 1.00 124.27 130 Bj 1 
ATOM 630  C CD2 . HIS Q 17 130 ? 123.400 276.962 240.019 1.00 124.27 130 Bj 1 
ATOM 631  C CE1 . HIS Q 17 130 ? 122.391 278.873 240.392 1.00 124.27 130 Bj 1 
ATOM 632  N NE2 . HIS Q 17 130 ? 122.645 277.967 239.465 1.00 124.27 130 Bj 1 
ATOM 633  N N   . PHE Q 17 131 ? 126.434 276.275 244.753 1.00 123.12 131 Bj 1 
ATOM 634  C CA  . PHE Q 17 131 ? 127.041 275.459 245.795 1.00 123.12 131 Bj 1 
ATOM 635  C C   . PHE Q 17 131 ? 127.241 276.280 247.061 1.00 123.12 131 Bj 1 
ATOM 636  O O   . PHE Q 17 131 ? 127.634 277.449 247.007 1.00 123.12 131 Bj 1 
ATOM 637  C CB  . PHE Q 17 131 ? 128.378 274.890 245.322 1.00 123.12 131 Bj 1 
ATOM 638  C CG  . PHE Q 17 131 ? 128.932 273.819 246.221 1.00 123.12 131 Bj 1 
ATOM 639  C CD1 . PHE Q 17 131 ? 128.636 272.485 245.993 1.00 123.12 131 Bj 1 
ATOM 640  C CD2 . PHE Q 17 131 ? 129.747 274.145 247.292 1.00 123.12 131 Bj 1 
ATOM 641  C CE1 . PHE Q 17 131 ? 129.144 271.497 246.816 1.00 123.12 131 Bj 1 
ATOM 642  C CE2 . PHE Q 17 131 ? 130.257 273.162 248.118 1.00 123.12 131 Bj 1 
ATOM 643  C CZ  . PHE Q 17 131 ? 129.955 271.837 247.880 1.00 123.12 131 Bj 1 
ATOM 644  N N   . LYS Q 17 132 ? 126.965 275.659 248.206 1.00 116.35 132 Bj 1 
ATOM 645  C CA  . LYS Q 17 132 ? 127.090 276.303 249.505 1.00 116.35 132 Bj 1 
ATOM 646  C C   . LYS Q 17 132 ? 128.171 275.612 250.323 1.00 116.35 132 Bj 1 
ATOM 647  O O   . LYS Q 17 132 ? 128.289 274.383 250.305 1.00 116.35 132 Bj 1 
ATOM 648  C CB  . LYS Q 17 132 ? 125.759 276.283 250.264 1.00 116.35 132 Bj 1 
ATOM 649  C CG  . LYS Q 17 132 ? 125.018 277.611 250.239 1.00 116.35 132 Bj 1 
ATOM 650  C CD  . LYS Q 17 132 ? 124.841 278.121 248.819 1.00 116.35 132 Bj 1 
ATOM 651  C CE  . LYS Q 17 132 ? 124.220 279.507 248.803 1.00 116.35 132 Bj 1 
ATOM 652  N NZ  . LYS Q 17 132 ? 124.099 280.040 247.419 1.00 116.35 132 Bj 1 
ATOM 653  N N   . LEU Q 17 133 ? 128.955 276.411 251.041 1.00 122.76 133 Bj 1 
ATOM 654  C CA  . LEU Q 17 133 ? 130.066 275.909 251.829 1.00 122.76 133 Bj 1 
ATOM 655  C C   . LEU Q 17 133 ? 129.629 275.679 253.274 1.00 122.76 133 Bj 1 
ATOM 656  O O   . LEU Q 17 133 ? 128.461 275.844 253.634 1.00 122.76 133 Bj 1 
ATOM 657  C CB  . LEU Q 17 133 ? 131.244 276.879 251.757 1.00 122.76 133 Bj 1 
ATOM 658  C CG  . LEU Q 17 133 ? 131.666 277.326 250.356 1.00 122.76 133 Bj 1 
ATOM 659  C CD1 . LEU Q 17 133 ? 132.813 278.319 250.434 1.00 122.76 133 Bj 1 
ATOM 660  C CD2 . LEU Q 17 133 ? 132.045 276.128 249.501 1.00 122.76 133 Bj 1 
ATOM 661  N N   . GLY Q 17 134 ? 130.584 275.293 254.118 1.00 129.65 134 Bj 1 
ATOM 662  C CA  . GLY Q 17 134 ? 130.282 275.055 255.514 1.00 129.65 134 Bj 1 
ATOM 663  C C   . GLY Q 17 134 ? 130.327 276.328 256.339 1.00 129.65 134 Bj 1 
ATOM 664  O O   . GLY Q 17 134 ? 131.088 277.255 256.064 1.00 129.65 134 Bj 1 
ATOM 665  N N   . ALA Q 17 135 ? 129.488 276.366 257.371 1.00 138.35 135 Bj 1 
ATOM 666  C CA  . ALA Q 17 135 ? 129.408 277.524 258.252 1.00 138.35 135 Bj 1 
ATOM 667  C C   . ALA Q 17 135 ? 130.539 277.469 259.271 1.00 138.35 135 Bj 1 
ATOM 668  O O   . ALA Q 17 135 ? 130.677 276.482 260.002 1.00 138.35 135 Bj 1 
ATOM 669  C CB  . ALA Q 17 135 ? 128.051 277.571 258.950 1.00 138.35 135 Bj 1 
ATOM 670  N N   . ARG Q 17 136 ? 131.347 278.530 259.322 1.00 130.79 136 Bj 1 
ATOM 671  C CA  . ARG Q 17 136 ? 132.483 278.568 260.234 1.00 130.79 136 Bj 1 
ATOM 672  C C   . ARG Q 17 136 ? 132.087 278.942 261.655 1.00 130.79 136 Bj 1 
ATOM 673  O O   . ARG Q 17 136 ? 132.785 278.556 262.599 1.00 130.79 136 Bj 1 
ATOM 674  C CB  . ARG Q 17 136 ? 133.536 279.556 259.727 1.00 130.79 136 Bj 1 
ATOM 675  C CG  . ARG Q 17 136 ? 133.810 279.469 258.237 1.00 130.79 136 Bj 1 
ATOM 676  C CD  . ARG Q 17 136 ? 135.032 280.286 257.861 1.00 130.79 136 Bj 1 
ATOM 677  N NE  . ARG Q 17 136 ? 134.968 281.647 258.384 1.00 130.79 136 Bj 1 
ATOM 678  C CZ  . ARG Q 17 136 ? 135.943 282.541 258.256 1.00 130.79 136 Bj 1 
ATOM 679  N NH1 . ARG Q 17 136 ? 137.061 282.218 257.620 1.00 130.79 136 Bj 1 
ATOM 680  N NH2 . ARG Q 17 136 ? 135.801 283.757 258.764 1.00 130.79 136 Bj 1 
ATOM 681  N N   . LEU Q 17 137 ? 130.992 279.683 261.830 1.00 133.57 137 Bj 1 
ATOM 682  C CA  . LEU Q 17 137 ? 130.559 280.141 263.149 1.00 133.57 137 Bj 1 
ATOM 683  C C   . LEU Q 17 137 ? 129.570 279.126 263.717 1.00 133.57 137 Bj 1 
ATOM 684  O O   . LEU Q 17 137 ? 128.360 279.345 263.762 1.00 133.57 137 Bj 1 
ATOM 685  C CB  . LEU Q 17 137 ? 129.956 281.539 263.059 1.00 133.57 137 Bj 1 
ATOM 686  C CG  . LEU Q 17 137 ? 130.891 282.628 262.527 1.00 133.57 137 Bj 1 
ATOM 687  C CD1 . LEU Q 17 137 ? 130.188 283.977 262.488 1.00 133.57 137 Bj 1 
ATOM 688  C CD2 . LEU Q 17 137 ? 132.159 282.703 263.364 1.00 133.57 137 Bj 1 
ATOM 689  N N   . THR Q 17 138 ? 130.111 277.993 264.160 1.00 133.35 138 Bj 1 
ATOM 690  C CA  . THR Q 17 138 ? 129.322 276.936 264.778 1.00 133.35 138 Bj 1 
ATOM 691  C C   . THR Q 17 138 ? 129.133 277.144 266.275 1.00 133.35 138 Bj 1 
ATOM 692  O O   . THR Q 17 138 ? 128.651 276.236 266.959 1.00 133.35 138 Bj 1 
ATOM 693  C CB  . THR Q 17 138 ? 129.970 275.573 264.522 1.00 133.35 138 Bj 1 
ATOM 694  O OG1 . THR Q 17 138 ? 131.309 275.575 265.032 1.00 133.35 138 Bj 1 
ATOM 695  C CG2 . THR Q 17 138 ? 129.999 275.269 263.033 1.00 133.35 138 Bj 1 
ATOM 696  N N   . GLU Q 17 139 ? 129.508 278.309 266.795 1.00 134.95 139 Bj 1 
ATOM 697  C CA  . GLU Q 17 139 ? 129.306 278.647 268.196 1.00 134.95 139 Bj 1 
ATOM 698  C C   . GLU Q 17 139 ? 128.457 279.891 268.396 1.00 134.95 139 Bj 1 
ATOM 699  O O   . GLU Q 17 139 ? 127.841 280.034 269.453 1.00 134.95 139 Bj 1 
ATOM 700  C CB  . GLU Q 17 139 ? 130.659 278.842 268.900 1.00 134.95 139 Bj 1 
ATOM 701  C CG  . GLU Q 17 139 ? 130.604 278.798 270.422 1.00 134.95 139 Bj 1 
ATOM 702  C CD  . GLU Q 17 139 ? 130.428 280.169 271.046 1.00 134.95 139 Bj 1 
ATOM 703  O OE1 . GLU Q 17 139 ? 130.488 281.174 270.307 1.00 134.95 139 Bj 1 
ATOM 704  O OE2 . GLU Q 17 139 ? 130.231 280.241 272.277 1.00 134.95 139 Bj 1 
ATOM 705  N N   . ALA Q 17 140 ? 128.404 280.792 267.412 1.00 139.06 140 Bj 1 
ATOM 706  C CA  . ALA Q 17 140 ? 127.569 281.980 267.543 1.00 139.06 140 Bj 1 
ATOM 707  C C   . ALA Q 17 140 ? 126.090 281.623 267.616 1.00 139.06 140 Bj 1 
ATOM 708  O O   . ALA Q 17 140 ? 125.316 282.326 268.275 1.00 139.06 140 Bj 1 
ATOM 709  C CB  . ALA Q 17 140 ? 127.829 282.937 266.380 1.00 139.06 140 Bj 1 
ATOM 710  N N   . ASP Q 17 141 ? 125.681 280.539 266.954 1.00 140.48 141 Bj 1 
ATOM 711  C CA  . ASP Q 17 141 ? 124.289 280.111 267.023 1.00 140.48 141 Bj 1 
ATOM 712  C C   . ASP Q 17 141 ? 124.001 279.307 268.283 1.00 140.48 141 Bj 1 
ATOM 713  O O   . ASP Q 17 141 ? 122.859 279.293 268.754 1.00 140.48 141 Bj 1 
ATOM 714  C CB  . ASP Q 17 141 ? 123.924 279.291 265.784 1.00 140.48 141 Bj 1 
ATOM 715  C CG  . ASP Q 17 141 ? 124.675 277.976 265.714 1.00 140.48 141 Bj 1 
ATOM 716  O OD1 . ASP Q 17 141 ? 125.822 277.916 266.203 1.00 140.48 141 Bj 1 
ATOM 717  O OD2 . ASP Q 17 141 ? 124.116 277.002 265.168 1.00 140.48 141 Bj 1 
ATOM 718  N N   . LYS Q 17 142 ? 125.010 278.635 268.840 1.00 134.61 142 Bj 1 
ATOM 719  C CA  . LYS Q 17 142 ? 124.797 277.853 270.053 1.00 134.61 142 Bj 1 
ATOM 720  C C   . LYS Q 17 142 ? 124.838 278.740 271.293 1.00 134.61 142 Bj 1 
ATOM 721  O O   . LYS Q 17 142 ? 123.839 278.877 272.005 1.00 134.61 142 Bj 1 
ATOM 722  C CB  . LYS Q 17 142 ? 125.847 276.744 270.155 1.00 134.61 142 Bj 1 
ATOM 723  C CG  . LYS Q 17 142 ? 126.107 276.000 268.857 1.00 134.61 142 Bj 1 
ATOM 724  C CD  . LYS Q 17 142 ? 124.858 275.311 268.339 1.00 134.61 142 Bj 1 
ATOM 725  C CE  . LYS Q 17 142 ? 125.153 274.532 267.067 1.00 134.61 142 Bj 1 
ATOM 726  N NZ  . LYS Q 17 142 ? 123.939 273.858 266.530 1.00 134.61 142 Bj 1 
ATOM 727  N N   . LYS Q 17 143 ? 125.993 279.349 271.561 1.00 130.78 143 Bj 1 
ATOM 728  C CA  . LYS Q 17 143 ? 126.225 280.262 272.679 1.00 130.78 143 Bj 1 
ATOM 729  C C   . LYS Q 17 143 ? 125.934 279.638 274.039 1.00 130.78 143 Bj 1 
ATOM 730  O O   . LYS Q 17 143 ? 125.924 280.350 275.050 1.00 130.78 143 Bj 1 
ATOM 731  C CB  . LYS Q 17 143 ? 125.421 281.559 272.519 1.00 130.78 143 Bj 1 
ATOM 732  C CG  . LYS Q 17 143 ? 125.982 282.503 271.471 1.00 130.78 143 Bj 1 
ATOM 733  C CD  . LYS Q 17 143 ? 127.408 282.899 271.812 1.00 130.78 143 Bj 1 
ATOM 734  C CE  . LYS Q 17 143 ? 127.980 283.857 270.782 1.00 130.78 143 Bj 1 
ATOM 735  N NZ  . LYS Q 17 143 ? 129.382 284.238 271.109 1.00 130.78 143 Bj 1 
ATOM 736  N N   . ASP Q 17 144 ? 125.698 278.330 274.099 1.00 131.40 144 Bj 1 
ATOM 737  C CA  . ASP Q 17 144 ? 125.447 277.643 275.360 1.00 131.40 144 Bj 1 
ATOM 738  C C   . ASP Q 17 144 ? 126.492 276.583 275.666 1.00 131.40 144 Bj 1 
ATOM 739  O O   . ASP Q 17 144 ? 127.062 276.578 276.763 1.00 131.40 144 Bj 1 
ATOM 740  C CB  . ASP Q 17 144 ? 124.048 277.003 275.351 1.00 131.40 144 Bj 1 
ATOM 741  C CG  . ASP Q 17 144 ? 122.935 278.027 275.449 1.00 131.40 144 Bj 1 
ATOM 742  O OD1 . ASP Q 17 144 ? 122.551 278.595 274.407 1.00 131.40 144 Bj 1 
ATOM 743  O OD2 . ASP Q 17 144 ? 122.442 278.263 276.571 1.00 131.40 144 Bj 1 
ATOM 744  N N   . ASP Q 17 145 ? 126.762 275.685 274.723 1.00 125.63 145 Bj 1 
ATOM 745  C CA  . ASP Q 17 145 ? 127.651 274.554 274.962 1.00 125.63 145 Bj 1 
ATOM 746  C C   . ASP Q 17 145 ? 129.095 275.042 274.977 1.00 125.63 145 Bj 1 
ATOM 747  O O   . ASP Q 17 145 ? 129.719 275.197 273.922 1.00 125.63 145 Bj 1 
ATOM 748  C CB  . ASP Q 17 145 ? 127.441 273.482 273.897 1.00 125.63 145 Bj 1 
ATOM 749  C CG  . ASP Q 17 145 ? 128.031 272.142 274.292 1.00 125.63 145 Bj 1 
ATOM 750  O OD1 . ASP Q 17 145 ? 128.682 272.064 275.355 1.00 125.63 145 Bj 1 
ATOM 751  O OD2 . ASP Q 17 145 ? 127.837 271.162 273.542 1.00 125.63 145 Bj 1 
ATOM 752  N N   . ARG Q 17 146 ? 129.624 275.289 276.173 1.00 123.19 146 Bj 1 
ATOM 753  C CA  . ARG Q 17 146 ? 131.031 275.617 276.354 1.00 123.19 146 Bj 1 
ATOM 754  C C   . ARG Q 17 146 ? 131.912 274.378 276.423 1.00 123.19 146 Bj 1 
ATOM 755  O O   . ARG Q 17 146 ? 133.141 274.505 276.438 1.00 123.19 146 Bj 1 
ATOM 756  C CB  . ARG Q 17 146 ? 131.221 276.448 277.628 1.00 123.19 146 Bj 1 
ATOM 757  C CG  . ARG Q 17 146 ? 130.339 277.684 277.717 1.00 123.19 146 Bj 1 
ATOM 758  C CD  . ARG Q 17 146 ? 130.774 278.756 276.734 1.00 123.19 146 Bj 1 
ATOM 759  N NE  . ARG Q 17 146 ? 130.058 280.011 276.945 1.00 123.19 146 Bj 1 
ATOM 760  C CZ  . ARG Q 17 146 ? 130.291 281.128 276.265 1.00 123.19 146 Bj 1 
ATOM 761  N NH1 . ARG Q 17 146 ? 131.225 281.151 275.325 1.00 123.19 146 Bj 1 
ATOM 762  N NH2 . ARG Q 17 146 ? 129.590 282.224 276.524 1.00 123.19 146 Bj 1 
ATOM 763  N N   . THR Q 17 147 ? 131.314 273.189 276.464 1.00 120.18 147 Bj 1 
ATOM 764  C CA  . THR Q 17 147 ? 132.038 271.936 276.619 1.00 120.18 147 Bj 1 
ATOM 765  C C   . THR Q 17 147 ? 132.125 271.136 275.328 1.00 120.18 147 Bj 1 
ATOM 766  O O   . THR Q 17 147 ? 132.651 270.018 275.343 1.00 120.18 147 Bj 1 
ATOM 767  C CB  . THR Q 17 147 ? 131.373 271.081 277.702 1.00 120.18 147 Bj 1 
ATOM 768  O OG1 . THR Q 17 147 ? 130.082 270.655 277.249 1.00 120.18 147 Bj 1 
ATOM 769  C CG2 . THR Q 17 147 ? 131.209 271.884 278.982 1.00 120.18 147 Bj 1 
ATOM 770  N N   . SER Q 17 148 ? 131.625 271.672 274.219 1.00 118.54 148 Bj 1 
ATOM 771  C CA  . SER Q 17 148 ? 131.618 270.943 272.961 1.00 118.54 148 Bj 1 
ATOM 772  C C   . SER Q 17 148 ? 133.006 270.928 272.336 1.00 118.54 148 Bj 1 
ATOM 773  O O   . SER Q 17 148 ? 133.743 271.916 272.398 1.00 118.54 148 Bj 1 
ATOM 774  C CB  . SER Q 17 148 ? 130.617 271.567 271.988 1.00 118.54 148 Bj 1 
ATOM 775  O OG  . SER Q 17 148 ? 130.928 272.926 271.735 1.00 118.54 148 Bj 1 
ATOM 776  N N   . LEU Q 17 149 ? 133.361 269.790 271.735 1.00 117.15 149 Bj 1 
ATOM 777  C CA  . LEU Q 17 149 ? 134.619 269.711 271.001 1.00 117.15 149 Bj 1 
ATOM 778  C C   . LEU Q 17 149 ? 134.608 270.627 269.785 1.00 117.15 149 Bj 1 
ATOM 779  O O   . LEU Q 17 149 ? 135.662 271.129 269.377 1.00 117.15 149 Bj 1 
ATOM 780  C CB  . LEU Q 17 149 ? 134.891 268.267 270.579 1.00 117.15 149 Bj 1 
ATOM 781  C CG  . LEU Q 17 149 ? 136.256 267.992 269.944 1.00 117.15 149 Bj 1 
ATOM 782  C CD1 . LEU Q 17 149 ? 137.367 268.200 270.960 1.00 117.15 149 Bj 1 
ATOM 783  C CD2 . LEU Q 17 149 ? 136.314 266.588 269.358 1.00 117.15 149 Bj 1 
ATOM 784  N N   . HIS Q 17 150 ? 133.431 270.864 269.203 1.00 119.46 150 Bj 1 
ATOM 785  C CA  . HIS Q 17 150 ? 133.275 271.750 268.056 1.00 119.46 150 Bj 1 
ATOM 786  C C   . HIS Q 17 150 ? 132.939 273.179 268.467 1.00 119.46 150 Bj 1 
ATOM 787  O O   . HIS Q 17 150 ? 132.307 273.912 267.695 1.00 119.46 150 Bj 1 
ATOM 788  C CB  . HIS Q 17 150 ? 132.203 271.196 267.115 1.00 119.46 150 Bj 1 
ATOM 789  C CG  . HIS Q 17 150 ? 132.333 271.667 265.700 1.00 119.46 150 Bj 1 
ATOM 790  N ND1 . HIS Q 17 150 ? 133.406 271.334 264.901 1.00 119.46 150 Bj 1 
ATOM 791  C CD2 . HIS Q 17 150 ? 131.523 272.440 264.939 1.00 119.46 150 Bj 1 
ATOM 792  C CE1 . HIS Q 17 150 ? 133.252 271.884 263.709 1.00 119.46 150 Bj 1 
ATOM 793  N NE2 . HIS Q 17 150 ? 132.118 272.561 263.706 1.00 119.46 150 Bj 1 
ATOM 794  N N   . ARG Q 17 151 ? 133.334 273.589 269.675 1.00 116.45 151 Bj 1 
ATOM 795  C CA  . ARG Q 17 151 ? 133.014 274.930 270.155 1.00 116.45 151 Bj 1 
ATOM 796  C C   . ARG Q 17 151 ? 133.683 276.000 269.299 1.00 116.45 151 Bj 1 
ATOM 797  O O   . ARG Q 17 151 ? 133.011 276.780 268.616 1.00 116.45 151 Bj 1 
ATOM 798  C CB  . ARG Q 17 151 ? 133.432 275.069 271.620 1.00 116.45 151 Bj 1 
ATOM 799  C CG  . ARG Q 17 151 ? 133.285 276.474 272.176 1.00 116.45 151 Bj 1 
ATOM 800  C CD  . ARG Q 17 151 ? 133.694 276.533 273.637 1.00 116.45 151 Bj 1 
ATOM 801  N NE  . ARG Q 17 151 ? 133.681 277.899 274.151 1.00 116.45 151 Bj 1 
ATOM 802  C CZ  . ARG Q 17 151 ? 133.957 278.225 275.408 1.00 116.45 151 Bj 1 
ATOM 803  N NH1 . ARG Q 17 151 ? 134.267 277.282 276.287 1.00 116.45 151 Bj 1 
ATOM 804  N NH2 . ARG Q 17 151 ? 133.923 279.495 275.788 1.00 116.45 151 Bj 1 
ATOM 805  N N   . LYS Q 17 152 ? 135.011 276.043 269.313 1.00 117.42 152 Bj 1 
ATOM 806  C CA  . LYS Q 17 152 ? 135.770 277.054 268.591 1.00 117.42 152 Bj 1 
ATOM 807  C C   . LYS Q 17 152 ? 136.622 276.389 267.521 1.00 117.42 152 Bj 1 
ATOM 808  O O   . LYS Q 17 152 ? 137.171 275.304 267.735 1.00 117.42 152 Bj 1 
ATOM 809  C CB  . LYS Q 17 152 ? 136.655 277.866 269.542 1.00 117.42 152 Bj 1 
ATOM 810  C CG  . LYS Q 17 152 ? 135.879 278.626 270.605 1.00 117.42 152 Bj 1 
ATOM 811  C CD  . LYS Q 17 152 ? 136.809 279.386 271.538 1.00 117.42 152 Bj 1 
ATOM 812  C CE  . LYS Q 17 152 ? 136.029 280.083 272.644 1.00 117.42 152 Bj 1 
ATOM 813  N NZ  . LYS Q 17 152 ? 136.923 280.801 273.593 1.00 117.42 152 Bj 1 
ATOM 814  N N   . LEU Q 17 153 ? 136.727 277.048 266.368 1.00 116.24 153 Bj 1 
ATOM 815  C CA  . LEU Q 17 153 ? 137.460 276.511 265.234 1.00 116.24 153 Bj 1 
ATOM 816  C C   . LEU Q 17 153 ? 138.638 277.371 264.802 1.00 116.24 153 Bj 1 
ATOM 817  O O   . LEU Q 17 153 ? 139.490 276.883 264.051 1.00 116.24 153 Bj 1 
ATOM 818  C CB  . LEU Q 17 153 ? 136.518 276.317 264.036 1.00 116.24 153 Bj 1 
ATOM 819  C CG  . LEU Q 17 153 ? 135.239 275.539 264.342 1.00 116.24 153 Bj 1 
ATOM 820  C CD1 . LEU Q 17 153 ? 134.370 275.417 263.102 1.00 116.24 153 Bj 1 
ATOM 821  C CD2 . LEU Q 17 153 ? 135.573 274.168 264.908 1.00 116.24 153 Bj 1 
ATOM 822  N N   . ASP Q 17 154 ? 138.712 278.626 265.242 1.00 114.21 154 Bj 1 
ATOM 823  C CA  . ASP Q 17 154 ? 139.819 279.499 264.880 1.00 114.21 154 Bj 1 
ATOM 824  C C   . ASP Q 17 154 ? 140.864 279.628 265.977 1.00 114.21 154 Bj 1 
ATOM 825  O O   . ASP Q 17 154 ? 141.912 280.237 265.742 1.00 114.21 154 Bj 1 
ATOM 826  C CB  . ASP Q 17 154 ? 139.301 280.893 264.510 1.00 114.21 154 Bj 1 
ATOM 827  C CG  . ASP Q 17 154 ? 138.591 281.574 265.661 1.00 114.21 154 Bj 1 
ATOM 828  O OD1 . ASP Q 17 154 ? 138.041 280.861 266.526 1.00 114.21 154 Bj 1 
ATOM 829  O OD2 . ASP Q 17 154 ? 138.580 282.823 265.698 1.00 114.21 154 Bj 1 
ATOM 830  N N   . ARG Q 17 155 ? 140.614 279.065 267.154 1.00 117.24 155 Bj 1 
ATOM 831  C CA  . ARG Q 17 155 ? 141.560 279.082 268.258 1.00 117.24 155 Bj 1 
ATOM 832  C C   . ARG Q 17 155 ? 141.854 277.656 268.702 1.00 117.24 155 Bj 1 
ATOM 833  O O   . ARG Q 17 155 ? 141.141 276.711 268.356 1.00 117.24 155 Bj 1 
ATOM 834  C CB  . ARG Q 17 155 ? 141.020 279.897 269.441 1.00 117.24 155 Bj 1 
ATOM 835  C CG  . ARG Q 17 155 ? 140.581 281.306 269.091 1.00 117.24 155 Bj 1 
ATOM 836  C CD  . ARG Q 17 155 ? 140.132 282.057 270.334 1.00 117.24 155 Bj 1 
ATOM 837  N NE  . ARG Q 17 155 ? 139.613 283.382 270.013 1.00 117.24 155 Bj 1 
ATOM 838  C CZ  . ARG Q 17 155 ? 139.268 284.288 270.921 1.00 117.24 155 Bj 1 
ATOM 839  N NH1 . ARG Q 17 155 ? 139.392 284.015 272.212 1.00 117.24 155 Bj 1 
ATOM 840  N NH2 . ARG Q 17 155 ? 138.803 285.469 270.538 1.00 117.24 155 Bj 1 
ATOM 841  N N   . ASN Q 17 156 ? 142.922 277.508 269.478 1.00 113.83 156 Bj 1 
ATOM 842  C CA  . ASN Q 17 156 ? 143.233 276.233 270.102 1.00 113.83 156 Bj 1 
ATOM 843  C C   . ASN Q 17 156 ? 142.516 276.132 271.441 1.00 113.83 156 Bj 1 
ATOM 844  O O   . ASN Q 17 156 ? 142.286 277.135 272.123 1.00 113.83 156 Bj 1 
ATOM 845  C CB  . ASN Q 17 156 ? 144.741 276.067 270.300 1.00 113.83 156 Bj 1 
ATOM 846  C CG  . ASN Q 17 156 ? 145.277 276.908 271.442 1.00 113.83 156 Bj 1 
ATOM 847  O OD1 . ASN Q 17 156 ? 144.906 278.071 271.601 1.00 113.83 156 Bj 1 
ATOM 848  N ND2 . ASN Q 17 156 ? 146.154 276.320 272.247 1.00 113.83 156 Bj 1 
ATOM 849  N N   . LEU Q 17 157 ? 142.156 274.908 271.811 1.00 117.97 157 Bj 1 
ATOM 850  C CA  . LEU Q 17 157 ? 141.427 274.665 273.045 1.00 117.97 157 Bj 1 
ATOM 851  C C   . LEU Q 17 157 ? 142.163 273.643 273.900 1.00 117.97 157 Bj 1 
ATOM 852  O O   . LEU Q 17 157 ? 142.908 272.801 273.397 1.00 117.97 157 Bj 1 
ATOM 853  C CB  . LEU Q 17 157 ? 139.997 274.188 272.760 1.00 117.97 157 Bj 1 
ATOM 854  C CG  . LEU Q 17 157 ? 139.112 275.189 272.013 1.00 117.97 157 Bj 1 
ATOM 855  C CD1 . LEU Q 17 157 ? 137.703 274.642 271.833 1.00 117.97 157 Bj 1 
ATOM 856  C CD2 . LEU Q 17 157 ? 139.084 276.528 272.733 1.00 117.97 157 Bj 1 
ATOM 857  N N   . ILE Q 17 158 ? 141.952 273.734 275.213 1.00 113.83 158 Bj 1 
ATOM 858  C CA  . ILE Q 17 158 ? 142.549 272.815 276.169 1.00 113.83 158 Bj 1 
ATOM 859  C C   . ILE Q 17 158 ? 141.443 272.284 277.071 1.00 113.83 158 Bj 1 
ATOM 860  O O   . ILE Q 17 158 ? 140.365 272.871 277.184 1.00 113.83 158 Bj 1 
ATOM 861  C CB  . ILE Q 17 158 ? 143.669 273.481 276.999 1.00 113.83 158 Bj 1 
ATOM 862  C CG1 . ILE Q 17 158 ? 144.690 272.440 277.466 1.00 113.83 158 Bj 1 
ATOM 863  C CG2 . ILE Q 17 158 ? 143.086 274.213 278.188 1.00 113.83 158 Bj 1 
ATOM 864  C CD1 . ILE Q 17 158 ? 145.859 273.029 278.223 1.00 113.83 158 Bj 1 
ATOM 865  N N   . LEU Q 17 159 ? 141.723 271.155 277.716 1.00 117.96 159 Bj 1 
ATOM 866  C CA  . LEU Q 17 159 ? 140.729 270.429 278.495 1.00 117.96 159 Bj 1 
ATOM 867  C C   . LEU Q 17 159 ? 140.864 270.768 279.973 1.00 117.96 159 Bj 1 
ATOM 868  O O   . LEU Q 17 159 ? 141.962 270.695 280.535 1.00 117.96 159 Bj 1 
ATOM 869  C CB  . LEU Q 17 159 ? 140.876 268.922 278.285 1.00 117.96 159 Bj 1 
ATOM 870  C CG  . LEU Q 17 159 ? 139.756 268.048 278.849 1.00 117.96 159 Bj 1 
ATOM 871  C CD1 . LEU Q 17 159 ? 138.420 268.435 278.235 1.00 117.96 159 Bj 1 
ATOM 872  C CD2 . LEU Q 17 159 ? 140.053 266.577 278.608 1.00 117.96 159 Bj 1 
ATOM 873  N N   . LEU Q 17 160 ? 139.745 271.135 280.597 1.00 129.48 160 Bj 1 
ATOM 874  C CA  . LEU Q 17 160 ? 139.681 271.396 282.030 1.00 129.48 160 Bj 1 
ATOM 875  C C   . LEU Q 17 160 ? 138.594 270.526 282.642 1.00 129.48 160 Bj 1 
ATOM 876  O O   . LEU Q 17 160 ? 137.483 270.456 282.110 1.00 129.48 160 Bj 1 
ATOM 877  C CB  . LEU Q 17 160 ? 139.396 272.874 282.319 1.00 129.48 160 Bj 1 
ATOM 878  C CG  . LEU Q 17 160 ? 140.586 273.780 282.641 1.00 129.48 160 Bj 1 
ATOM 879  C CD1 . LEU Q 17 160 ? 141.302 273.297 283.894 1.00 129.48 160 Bj 1 
ATOM 880  C CD2 . LEU Q 17 160 ? 141.543 273.865 281.466 1.00 129.48 160 Bj 1 
ATOM 881  N N   . VAL Q 17 161 ? 138.908 269.869 283.754 1.00 136.87 161 Bj 1 
ATOM 882  C CA  . VAL Q 17 161 ? 137.973 268.976 284.427 1.00 136.87 161 Bj 1 
ATOM 883  C C   . VAL Q 17 161 ? 137.583 269.581 285.768 1.00 136.87 161 Bj 1 
ATOM 884  O O   . VAL Q 17 161 ? 138.402 270.219 286.438 1.00 136.87 161 Bj 1 
ATOM 885  C CB  . VAL Q 17 161 ? 138.566 267.564 284.611 1.00 136.87 161 Bj 1 
ATOM 886  C CG1 . VAL Q 17 161 ? 138.693 266.867 283.267 1.00 136.87 161 Bj 1 
ATOM 887  C CG2 . VAL Q 17 161 ? 139.917 267.637 285.303 1.00 136.87 161 Bj 1 
ATOM 888  N N   . ARG Q 17 162 ? 136.323 269.392 286.149 1.00 151.13 162 Bj 1 
ATOM 889  C CA  . ARG Q 17 162 ? 135.837 269.829 287.450 1.00 151.13 162 Bj 1 
ATOM 890  C C   . ARG Q 17 162 ? 135.852 268.656 288.420 1.00 151.13 162 Bj 1 
ATOM 891  O O   . ARG Q 17 162 ? 135.243 267.615 288.155 1.00 151.13 162 Bj 1 
ATOM 892  C CB  . ARG Q 17 162 ? 134.425 270.405 287.339 1.00 151.13 162 Bj 1 
ATOM 893  C CG  . ARG Q 17 162 ? 133.794 270.771 288.675 1.00 151.13 162 Bj 1 
ATOM 894  C CD  . ARG Q 17 162 ? 134.649 271.772 289.435 1.00 151.13 162 Bj 1 
ATOM 895  N NE  . ARG Q 17 162 ? 134.041 272.166 290.702 1.00 151.13 162 Bj 1 
ATOM 896  C CZ  . ARG Q 17 162 ? 134.595 273.012 291.565 1.00 151.13 162 Bj 1 
ATOM 897  N NH1 . ARG Q 17 162 ? 135.775 273.556 291.298 1.00 151.13 162 Bj 1 
ATOM 898  N NH2 . ARG Q 17 162 ? 133.971 273.316 292.694 1.00 151.13 162 Bj 1 
ATOM 899  N N   . GLU Q 17 163 ? 136.552 268.826 289.540 1.00 162.19 163 Bj 1 
ATOM 900  C CA  . GLU Q 17 163 ? 136.655 267.786 290.555 1.00 162.19 163 Bj 1 
ATOM 901  C C   . GLU Q 17 163 ? 136.528 268.410 291.935 1.00 162.19 163 Bj 1 
ATOM 902  O O   . GLU Q 17 163 ? 137.204 269.398 292.237 1.00 162.19 163 Bj 1 
ATOM 903  C CB  . GLU Q 17 163 ? 137.981 267.024 290.442 1.00 162.19 163 Bj 1 
ATOM 904  C CG  . GLU Q 17 163 ? 138.128 266.212 289.165 1.00 162.19 163 Bj 1 
ATOM 905  C CD  . GLU Q 17 163 ? 139.362 265.332 289.175 1.00 162.19 163 Bj 1 
ATOM 906  O OE1 . GLU Q 17 163 ? 140.126 265.387 290.161 1.00 162.19 163 Bj 1 
ATOM 907  O OE2 . GLU Q 17 163 ? 139.566 264.582 288.197 1.00 162.19 163 Bj 1 
ATOM 908  N N   . LYS Q 17 164 ? 135.663 267.833 292.764 1.00 165.97 164 Bj 1 
ATOM 909  C CA  . LYS Q 17 164 ? 135.477 268.256 294.149 1.00 165.97 164 Bj 1 
ATOM 910  C C   . LYS Q 17 164 ? 136.057 267.171 295.050 1.00 165.97 164 Bj 1 
ATOM 911  O O   . LYS Q 17 164 ? 135.463 266.101 295.210 1.00 165.97 164 Bj 1 
ATOM 912  C CB  . LYS Q 17 164 ? 134.004 268.509 294.456 1.00 165.97 164 Bj 1 
ATOM 913  C CG  . LYS Q 17 164 ? 133.424 269.735 293.773 1.00 165.97 164 Bj 1 
ATOM 914  C CD  . LYS Q 17 164 ? 132.024 270.035 294.284 1.00 165.97 164 Bj 1 
ATOM 915  C CE  . LYS Q 17 164 ? 131.472 271.312 293.673 1.00 165.97 164 Bj 1 
ATOM 916  N NZ  . LYS Q 17 164 ? 130.115 271.638 294.195 1.00 165.97 164 Bj 1 
ATOM 917  N N   . LEU Q 17 165 ? 137.217 267.450 295.636 1.00 168.90 165 Bj 1 
ATOM 918  C CA  . LEU Q 17 165 ? 137.880 266.496 296.515 1.00 168.90 165 Bj 1 
ATOM 919  C C   . LEU Q 17 165 ? 137.275 266.587 297.915 1.00 168.90 165 Bj 1 
ATOM 920  O O   . LEU Q 17 165 ? 136.251 267.238 298.138 1.00 168.90 165 Bj 1 
ATOM 921  C CB  . LEU Q 17 165 ? 139.386 266.743 296.518 1.00 168.90 165 Bj 1 
ATOM 922  C CG  . LEU Q 17 165 ? 140.073 266.659 295.154 1.00 168.90 165 Bj 1 
ATOM 923  C CD1 . LEU Q 17 165 ? 141.578 266.829 295.293 1.00 168.90 165 Bj 1 
ATOM 924  C CD2 . LEU Q 17 165 ? 139.738 265.346 294.462 1.00 168.90 165 Bj 1 
ATOM 925  N N   . GLY Q 17 166 ? 137.912 265.927 298.884 1.00 171.61 166 Bj 1 
ATOM 926  C CA  . GLY Q 17 166 ? 137.369 265.914 300.232 1.00 171.61 166 Bj 1 
ATOM 927  C C   . GLY Q 17 166 ? 137.561 267.231 300.961 1.00 171.61 166 Bj 1 
ATOM 928  O O   . GLY Q 17 166 ? 136.656 267.703 301.656 1.00 171.61 166 Bj 1 
ATOM 929  N N   . ASP Q 17 167 ? 138.736 267.843 300.815 1.00 174.91 167 Bj 1 
ATOM 930  C CA  . ASP Q 17 167 ? 139.046 269.091 301.495 1.00 174.91 167 Bj 1 
ATOM 931  C C   . ASP Q 17 167 ? 139.291 270.254 300.545 1.00 174.91 167 Bj 1 
ATOM 932  O O   . ASP Q 17 167 ? 139.620 271.352 301.010 1.00 174.91 167 Bj 1 
ATOM 933  C CB  . ASP Q 17 167 ? 140.268 268.910 302.408 1.00 174.91 167 Bj 1 
ATOM 934  C CG  . ASP Q 17 167 ? 141.477 268.372 301.667 1.00 174.91 167 Bj 1 
ATOM 935  O OD1 . ASP Q 17 167 ? 142.126 269.149 300.937 1.00 174.91 167 Bj 1 
ATOM 936  O OD2 . ASP Q 17 167 ? 141.778 267.169 301.815 1.00 174.91 167 Bj 1 
ATOM 937  N N   . GLN Q 17 168 ? 139.144 270.054 299.236 1.00 175.00 168 Bj 1 
ATOM 938  C CA  . GLN Q 17 168 ? 139.378 271.108 298.261 1.00 175.00 168 Bj 1 
ATOM 939  C C   . GLN Q 17 168 ? 138.382 270.985 297.119 1.00 175.00 168 Bj 1 
ATOM 940  O O   . GLN Q 17 168 ? 138.082 269.879 296.661 1.00 175.00 168 Bj 1 
ATOM 941  C CB  . GLN Q 17 168 ? 140.810 271.056 297.710 1.00 175.00 168 Bj 1 
ATOM 942  C CG  . GLN Q 17 168 ? 141.878 271.477 298.705 1.00 175.00 168 Bj 1 
ATOM 943  C CD  . GLN Q 17 168 ? 143.281 271.320 298.157 1.00 175.00 168 Bj 1 
ATOM 944  O OE1 . GLN Q 17 168 ? 143.477 270.789 297.063 1.00 175.00 168 Bj 1 
ATOM 945  N NE2 . GLN Q 17 168 ? 144.267 271.783 298.916 1.00 175.00 168 Bj 1 
ATOM 946  N N   . ASP Q 17 169 ? 137.876 272.129 296.665 1.00 168.27 169 Bj 1 
ATOM 947  C CA  . ASP Q 17 169 ? 136.985 272.221 295.510 1.00 168.27 169 Bj 1 
ATOM 948  C C   . ASP Q 17 169 ? 137.646 273.173 294.517 1.00 168.27 169 Bj 1 
ATOM 949  O O   . ASP Q 17 169 ? 137.390 274.379 294.534 1.00 168.27 169 Bj 1 
ATOM 950  C CB  . ASP Q 17 169 ? 135.589 272.706 295.915 1.00 168.27 169 Bj 1 
ATOM 951  C CG  . ASP Q 17 169 ? 134.950 271.832 296.978 1.00 168.27 169 Bj 1 
ATOM 952  O OD1 . ASP Q 17 169 ? 135.285 270.631 297.048 1.00 168.27 169 Bj 1 
ATOM 953  O OD2 . ASP Q 17 169 ? 134.109 272.348 297.743 1.00 168.27 169 Bj 1 
ATOM 954  N N   . ILE Q 17 170 ? 138.499 272.629 293.653 1.00 159.42 170 Bj 1 
ATOM 955  C CA  . ILE Q 17 170 ? 139.305 273.423 292.734 1.00 159.42 170 Bj 1 
ATOM 956  C C   . ILE Q 17 170 ? 138.930 273.073 291.301 1.00 159.42 170 Bj 1 
ATOM 957  O O   . ILE Q 17 170 ? 138.527 271.941 291.010 1.00 159.42 170 Bj 1 
ATOM 958  C CB  . ILE Q 17 170 ? 140.815 273.204 292.968 1.00 159.42 170 Bj 1 
ATOM 959  C CG1 . ILE Q 17 170 ? 141.172 271.723 292.823 1.00 159.42 170 Bj 1 
ATOM 960  C CG2 . ILE Q 17 170 ? 141.225 273.726 294.336 1.00 159.42 170 Bj 1 
ATOM 961  C CD1 . ILE Q 17 170 ? 142.645 271.427 293.007 1.00 159.42 170 Bj 1 
ATOM 962  N N   . TRP Q 17 171 ? 139.059 274.056 290.411 1.00 144.42 171 Bj 1 
ATOM 963  C CA  . TRP Q 17 171 ? 138.893 273.855 288.972 1.00 144.42 171 Bj 1 
ATOM 964  C C   . TRP Q 17 171 ? 140.241 273.390 288.437 1.00 144.42 171 Bj 1 
ATOM 965  O O   . TRP Q 17 171 ? 141.054 274.182 287.960 1.00 144.42 171 Bj 1 
ATOM 966  C CB  . TRP Q 17 171 ? 138.414 275.138 288.303 1.00 144.42 171 Bj 1 
ATOM 967  C CG  . TRP Q 17 171 ? 138.043 274.985 286.860 1.00 144.42 171 Bj 1 
ATOM 968  C CD1 . TRP Q 17 171 ? 138.831 275.252 285.779 1.00 144.42 171 Bj 1 
ATOM 969  C CD2 . TRP Q 17 171 ? 136.785 274.539 286.340 1.00 144.42 171 Bj 1 
ATOM 970  N NE1 . TRP Q 17 171 ? 138.144 274.997 284.618 1.00 144.42 171 Bj 1 
ATOM 971  C CE2 . TRP Q 17 171 ? 136.885 274.557 284.935 1.00 144.42 171 Bj 1 
ATOM 972  C CE3 . TRP Q 17 171 ? 135.586 274.124 286.925 1.00 144.42 171 Bj 1 
ATOM 973  C CZ2 . TRP Q 17 171 ? 135.832 274.177 284.106 1.00 144.42 171 Bj 1 
ATOM 974  C CZ3 . TRP Q 17 171 ? 134.541 273.747 286.101 1.00 144.42 171 Bj 1 
ATOM 975  C CH2 . TRP Q 17 171 ? 134.672 273.775 284.707 1.00 144.42 171 Bj 1 
ATOM 976  N N   . MET Q 17 172 ? 140.479 272.086 288.520 1.00 147.69 172 Bj 1 
ATOM 977  C CA  . MET Q 17 172 ? 141.806 271.514 288.352 1.00 147.69 172 Bj 1 
ATOM 978  C C   . MET Q 17 172 ? 142.015 270.976 286.940 1.00 147.69 172 Bj 1 
ATOM 979  O O   . MET Q 17 172 ? 141.082 270.507 286.285 1.00 147.69 172 Bj 1 
ATOM 980  C CB  . MET Q 17 172 ? 142.030 270.391 289.368 1.00 147.69 172 Bj 1 
ATOM 981  C CG  . MET Q 17 172 ? 143.468 269.917 289.488 1.00 147.69 172 Bj 1 
ATOM 982  S SD  . MET Q 17 172 ? 143.610 268.411 290.466 1.00 147.69 172 Bj 1 
ATOM 983  C CE  . MET Q 17 172 ? 142.770 267.241 289.402 1.00 147.69 172 Bj 1 
ATOM 984  N N   . LEU Q 17 173 ? 143.260 271.057 286.478 1.00 139.16 173 Bj 1 
ATOM 985  C CA  . LEU Q 17 173 ? 143.650 270.404 285.241 1.00 139.16 173 Bj 1 
ATOM 986  C C   . LEU Q 17 173 ? 143.738 268.894 285.468 1.00 139.16 173 Bj 1 
ATOM 987  O O   . LEU Q 17 173 ? 143.996 268.445 286.588 1.00 139.16 173 Bj 1 
ATOM 988  C CB  . LEU Q 17 173 ? 144.996 270.950 284.764 1.00 139.16 173 Bj 1 
ATOM 989  C CG  . LEU Q 17 173 ? 145.334 270.960 283.270 1.00 139.16 173 Bj 1 
ATOM 990  C CD1 . LEU Q 17 173 ? 144.311 271.766 282.496 1.00 139.16 173 Bj 1 
ATOM 991  C CD2 . LEU Q 17 173 ? 146.725 271.512 283.037 1.00 139.16 173 Bj 1 
ATOM 992  N N   . PRO Q 17 174 ? 143.500 268.080 284.423 1.00 136.31 174 Bj 1 
ATOM 993  C CA  . PRO Q 17 174 ? 143.610 266.621 284.586 1.00 136.31 174 Bj 1 
ATOM 994  C C   . PRO Q 17 174 ? 144.959 266.176 285.134 1.00 136.31 174 Bj 1 
ATOM 995  O O   . PRO Q 17 174 ? 146.003 266.377 284.503 1.00 136.31 174 Bj 1 
ATOM 996  C CB  . PRO Q 17 174 ? 143.377 266.087 283.164 1.00 136.31 174 Bj 1 
ATOM 997  C CG  . PRO Q 17 174 ? 143.447 267.291 282.257 1.00 136.31 174 Bj 1 
ATOM 998  C CD  . PRO Q 17 174 ? 142.983 268.434 283.092 1.00 136.31 174 Bj 1 
ATOM 999  N N   . GLN Q 17 175 ? 144.935 265.578 286.323 1.00 135.35 175 Bj 1 
ATOM 1000 C CA  . GLN Q 17 175 ? 146.121 265.112 287.030 1.00 135.35 175 Bj 1 
ATOM 1001 C C   . GLN Q 17 175 ? 146.040 263.602 287.238 1.00 135.35 175 Bj 1 
ATOM 1002 O O   . GLN Q 17 175 ? 145.028 262.962 286.944 1.00 135.35 175 Bj 1 
ATOM 1003 C CB  . GLN Q 17 175 ? 146.278 265.834 288.372 1.00 135.35 175 Bj 1 
ATOM 1004 C CG  . GLN Q 17 175 ? 146.579 267.318 288.255 1.00 135.35 175 Bj 1 
ATOM 1005 C CD  . GLN Q 17 175 ? 146.837 267.965 289.602 1.00 135.35 175 Bj 1 
ATOM 1006 O OE1 . GLN Q 17 175 ? 146.707 267.325 290.646 1.00 135.35 175 Bj 1 
ATOM 1007 N NE2 . GLN Q 17 175 ? 147.204 269.241 289.585 1.00 135.35 175 Bj 1 
ATOM 1008 N N   . SER Q 17 176 ? 147.130 263.036 287.754 1.00 133.75 176 Bj 1 
ATOM 1009 C CA  . SER Q 17 176 ? 147.220 261.598 287.965 1.00 133.75 176 Bj 1 
ATOM 1010 C C   . SER Q 17 176 ? 148.177 261.315 289.116 1.00 133.75 176 Bj 1 
ATOM 1011 O O   . SER Q 17 176 ? 148.730 262.227 289.736 1.00 133.75 176 Bj 1 
ATOM 1012 C CB  . SER Q 17 176 ? 147.683 260.882 286.694 1.00 133.75 176 Bj 1 
ATOM 1013 O OG  . SER Q 17 176 ? 146.894 261.256 285.582 1.00 133.75 176 Bj 1 
ATOM 1014 N N   . ASP Q 17 177 ? 148.364 260.026 289.395 1.00 134.79 177 Bj 1 
ATOM 1015 C CA  . ASP Q 17 177 ? 149.341 259.551 290.362 1.00 134.79 177 Bj 1 
ATOM 1016 C C   . ASP Q 17 177 ? 149.995 258.296 289.806 1.00 134.79 177 Bj 1 
ATOM 1017 O O   . ASP Q 17 177 ? 149.390 257.559 289.023 1.00 134.79 177 Bj 1 
ATOM 1018 C CB  . ASP Q 17 177 ? 148.706 259.260 291.728 1.00 134.79 177 Bj 1 
ATOM 1019 C CG  . ASP Q 17 177 ? 148.221 260.516 292.424 1.00 134.79 177 Bj 1 
ATOM 1020 O OD1 . ASP Q 17 177 ? 147.166 261.051 292.025 1.00 134.79 177 Bj 1 
ATOM 1021 O OD2 . ASP Q 17 177 ? 148.898 260.969 293.370 1.00 134.79 177 Bj 1 
ATOM 1022 N N   . TRP Q 17 178 ? 151.238 258.056 290.216 1.00 142.13 178 Bj 1 
ATOM 1023 C CA  . TRP Q 17 178 ? 152.031 256.996 289.615 1.00 142.13 178 Bj 1 
ATOM 1024 C C   . TRP Q 17 178 ? 153.041 256.465 290.620 1.00 142.13 178 Bj 1 
ATOM 1025 O O   . TRP Q 17 178 ? 153.592 257.217 291.429 1.00 142.13 178 Bj 1 
ATOM 1026 C CB  . TRP Q 17 178 ? 152.752 257.500 288.360 1.00 142.13 178 Bj 1 
ATOM 1027 C CG  . TRP Q 17 178 ? 153.556 258.740 288.606 1.00 142.13 178 Bj 1 
ATOM 1028 C CD1 . TRP Q 17 178 ? 153.092 260.023 288.654 1.00 142.13 178 Bj 1 
ATOM 1029 C CD2 . TRP Q 17 178 ? 154.966 258.815 288.843 1.00 142.13 178 Bj 1 
ATOM 1030 N NE1 . TRP Q 17 178 ? 154.126 260.891 288.906 1.00 142.13 178 Bj 1 
ATOM 1031 C CE2 . TRP Q 17 178 ? 155.287 260.173 289.026 1.00 142.13 178 Bj 1 
ATOM 1032 C CE3 . TRP Q 17 178 ? 155.987 257.865 288.916 1.00 142.13 178 Bj 1 
ATOM 1033 C CZ2 . TRP Q 17 178 ? 156.588 260.604 289.277 1.00 142.13 178 Bj 1 
ATOM 1034 C CZ3 . TRP Q 17 178 ? 157.276 258.293 289.166 1.00 142.13 178 Bj 1 
ATOM 1035 C CH2 . TRP Q 17 178 ? 157.565 259.650 289.344 1.00 142.13 178 Bj 1 
ATOM 1036 N N   . GLN Q 17 179 ? 153.282 255.155 290.554 1.00 140.75 179 Bj 1 
ATOM 1037 C CA  . GLN Q 17 179 ? 154.303 254.528 291.375 1.00 140.75 179 Bj 1 
ATOM 1038 C C   . GLN Q 17 179 ? 155.685 254.777 290.770 1.00 140.75 179 Bj 1 
ATOM 1039 O O   . GLN Q 17 179 ? 155.812 254.956 289.556 1.00 140.75 179 Bj 1 
ATOM 1040 C CB  . GLN Q 17 179 ? 154.047 253.026 291.496 1.00 140.75 179 Bj 1 
ATOM 1041 C CG  . GLN Q 17 179 ? 154.330 252.219 290.233 1.00 140.75 179 Bj 1 
ATOM 1042 C CD  . GLN Q 17 179 ? 153.239 252.345 289.187 1.00 140.75 179 Bj 1 
ATOM 1043 O OE1 . GLN Q 17 179 ? 152.254 253.059 289.380 1.00 140.75 179 Bj 1 
ATOM 1044 N NE2 . GLN Q 17 179 ? 153.408 251.645 288.072 1.00 140.75 179 Bj 1 
ATOM 1045 N N   . PRO Q 17 180 ? 156.741 254.792 291.602 1.00 139.20 180 Bj 1 
ATOM 1046 C CA  . PRO Q 17 180 ? 158.082 255.138 291.101 1.00 139.20 180 Bj 1 
ATOM 1047 C C   . PRO Q 17 180 ? 158.545 254.295 289.922 1.00 139.20 180 Bj 1 
ATOM 1048 O O   . PRO Q 17 180 ? 159.406 254.726 289.148 1.00 139.20 180 Bj 1 
ATOM 1049 C CB  . PRO Q 17 180 ? 158.976 254.914 292.327 1.00 139.20 180 Bj 1 
ATOM 1050 C CG  . PRO Q 17 180 ? 158.072 255.131 293.486 1.00 139.20 180 Bj 1 
ATOM 1051 C CD  . PRO Q 17 180 ? 156.734 254.597 293.063 1.00 139.20 180 Bj 1 
ATOM 1052 N N   . GLY Q 17 181 ? 157.983 253.098 289.770 1.00 135.25 181 Bj 1 
ATOM 1053 C CA  . GLY Q 17 181 ? 158.324 252.240 288.655 1.00 135.25 181 Bj 1 
ATOM 1054 C C   . GLY Q 17 181 ? 157.674 252.589 287.337 1.00 135.25 181 Bj 1 
ATOM 1055 O O   . GLY Q 17 181 ? 157.880 251.875 286.352 1.00 135.25 181 Bj 1 
ATOM 1056 N N   . GLU Q 17 182 ? 156.897 253.667 287.282 1.00 137.08 182 Bj 1 
ATOM 1057 C CA  . GLU Q 17 182 ? 156.183 254.062 286.078 1.00 137.08 182 Bj 1 
ATOM 1058 C C   . GLU Q 17 182 ? 156.697 255.404 285.572 1.00 137.08 182 Bj 1 
ATOM 1059 O O   . GLU Q 17 182 ? 157.089 256.276 286.354 1.00 137.08 182 Bj 1 
ATOM 1060 C CB  . GLU Q 17 182 ? 154.675 254.141 286.339 1.00 137.08 182 Bj 1 
ATOM 1061 C CG  . GLU Q 17 182 ? 153.829 254.307 285.086 1.00 137.08 182 Bj 1 
ATOM 1062 C CD  . GLU Q 17 182 ? 152.344 254.191 285.367 1.00 137.08 182 Bj 1 
ATOM 1063 O OE1 . GLU Q 17 182 ? 151.980 253.776 286.487 1.00 137.08 182 Bj 1 
ATOM 1064 O OE2 . GLU Q 17 182 ? 151.541 254.515 284.466 1.00 137.08 182 Bj 1 
ATOM 1065 N N   . THR Q 17 183 ? 156.690 255.560 284.252 1.00 130.92 183 Bj 1 
ATOM 1066 C CA  . THR Q 17 183 ? 157.170 256.770 283.603 1.00 130.92 183 Bj 1 
ATOM 1067 C C   . THR Q 17 183 ? 156.071 257.827 283.567 1.00 130.92 183 Bj 1 
ATOM 1068 O O   . THR Q 17 183 ? 154.878 257.512 283.596 1.00 130.92 183 Bj 1 
ATOM 1069 C CB  . THR Q 17 183 ? 157.647 256.460 282.182 1.00 130.92 183 Bj 1 
ATOM 1070 O OG1 . THR Q 17 183 ? 158.349 255.210 282.177 1.00 130.92 183 Bj 1 
ATOM 1071 C CG2 . THR Q 17 183 ? 158.582 257.550 281.671 1.00 130.92 183 Bj 1 
ATOM 1072 N N   . LEU Q 17 184 ? 156.490 259.094 283.506 1.00 129.02 184 Bj 1 
ATOM 1073 C CA  . LEU Q 17 184 ? 155.532 260.194 283.444 1.00 129.02 184 Bj 1 
ATOM 1074 C C   . LEU Q 17 184 ? 154.716 260.147 282.159 1.00 129.02 184 Bj 1 
ATOM 1075 O O   . LEU Q 17 184 ? 153.502 260.384 282.173 1.00 129.02 184 Bj 1 
ATOM 1076 C CB  . LEU Q 17 184 ? 156.266 261.528 283.563 1.00 129.02 184 Bj 1 
ATOM 1077 C CG  . LEU Q 17 184 ? 157.066 261.730 284.849 1.00 129.02 184 Bj 1 
ATOM 1078 C CD1 . LEU Q 17 184 ? 157.941 262.967 284.754 1.00 129.02 184 Bj 1 
ATOM 1079 C CD2 . LEU Q 17 184 ? 156.125 261.830 286.034 1.00 129.02 184 Bj 1 
ATOM 1080 N N   . ARG Q 17 185 ? 155.367 259.842 281.035 1.00 125.72 185 Bj 1 
ATOM 1081 C CA  . ARG Q 17 185 ? 154.653 259.763 279.767 1.00 125.72 185 Bj 1 
ATOM 1082 C C   . ARG Q 17 185 ? 153.671 258.598 279.760 1.00 125.72 185 Bj 1 
ATOM 1083 O O   . ARG Q 17 185 ? 152.540 258.735 279.279 1.00 125.72 185 Bj 1 
ATOM 1084 C CB  . ARG Q 17 185 ? 155.652 259.644 278.618 1.00 125.72 185 Bj 1 
ATOM 1085 C CG  . ARG Q 17 185 ? 155.034 259.681 277.235 1.00 125.72 185 Bj 1 
ATOM 1086 C CD  . ARG Q 17 185 ? 156.064 260.119 276.211 1.00 125.72 185 Bj 1 
ATOM 1087 N NE  . ARG Q 17 185 ? 155.563 260.025 274.845 1.00 125.72 185 Bj 1 
ATOM 1088 C CZ  . ARG Q 17 185 ? 156.149 260.598 273.800 1.00 125.72 185 Bj 1 
ATOM 1089 N NH1 . ARG Q 17 185 ? 157.250 261.316 273.971 1.00 125.72 185 Bj 1 
ATOM 1090 N NH2 . ARG Q 17 185 ? 155.631 260.462 272.587 1.00 125.72 185 Bj 1 
ATOM 1091 N N   . GLN Q 17 186 ? 154.083 257.448 280.298 1.00 132.51 186 Bj 1 
ATOM 1092 C CA  . GLN Q 17 186 ? 153.167 256.318 280.411 1.00 132.51 186 Bj 1 
ATOM 1093 C C   . GLN Q 17 186 ? 151.994 256.642 281.326 1.00 132.51 186 Bj 1 
ATOM 1094 O O   . GLN Q 17 186 ? 150.860 256.229 281.055 1.00 132.51 186 Bj 1 
ATOM 1095 C CB  . GLN Q 17 186 ? 153.914 255.087 280.925 1.00 132.51 186 Bj 1 
ATOM 1096 C CG  . GLN Q 17 186 ? 155.119 254.696 280.089 1.00 132.51 186 Bj 1 
ATOM 1097 C CD  . GLN Q 17 186 ? 155.882 253.529 280.683 1.00 132.51 186 Bj 1 
ATOM 1098 O OE1 . GLN Q 17 186 ? 155.493 252.978 281.713 1.00 132.51 186 Bj 1 
ATOM 1099 N NE2 . GLN Q 17 186 ? 156.978 253.147 280.037 1.00 132.51 186 Bj 1 
ATOM 1100 N N   . THR Q 17 187 ? 152.245 257.383 282.408 1.00 131.91 187 Bj 1 
ATOM 1101 C CA  . THR Q 17 187 ? 151.163 257.778 283.304 1.00 131.91 187 Bj 1 
ATOM 1102 C C   . THR Q 17 187 ? 150.188 258.718 282.606 1.00 131.91 187 Bj 1 
ATOM 1103 O O   . THR Q 17 187 ? 148.971 258.593 282.773 1.00 131.91 187 Bj 1 
ATOM 1104 C CB  . THR Q 17 187 ? 151.737 258.432 284.560 1.00 131.91 187 Bj 1 
ATOM 1105 O OG1 . THR Q 17 187 ? 152.712 257.561 285.147 1.00 131.91 187 Bj 1 
ATOM 1106 C CG2 . THR Q 17 187 ? 150.634 258.703 285.570 1.00 131.91 187 Bj 1 
ATOM 1107 N N   . ALA Q 17 188 ? 150.705 259.659 281.814 1.00 133.19 188 Bj 1 
ATOM 1108 C CA  . ALA Q 17 188 ? 149.827 260.556 281.066 1.00 133.19 188 Bj 1 
ATOM 1109 C C   . ALA Q 17 188 ? 149.020 259.794 280.020 1.00 133.19 188 Bj 1 
ATOM 1110 O O   . ALA Q 17 188 ? 147.848 260.110 279.775 1.00 133.19 188 Bj 1 
ATOM 1111 C CB  . ALA Q 17 188 ? 150.647 261.666 280.409 1.00 133.19 188 Bj 1 
ATOM 1112 N N   . GLU Q 17 189 ? 149.632 258.789 279.390 1.00 135.20 189 Bj 1 
ATOM 1113 C CA  . GLU Q 17 189 ? 148.905 257.958 278.433 1.00 135.20 189 Bj 1 
ATOM 1114 C C   . GLU Q 17 189 ? 147.783 257.190 279.121 1.00 135.20 189 Bj 1 
ATOM 1115 O O   . GLU Q 17 189 ? 146.649 257.145 278.628 1.00 135.20 189 Bj 1 
ATOM 1116 C CB  . GLU Q 17 189 ? 149.869 257.000 277.732 1.00 135.20 189 Bj 1 
ATOM 1117 C CG  . GLU Q 17 189 ? 150.860 257.688 276.807 1.00 135.20 189 Bj 1 
ATOM 1118 C CD  . GLU Q 17 189 ? 151.898 256.735 276.247 1.00 135.20 189 Bj 1 
ATOM 1119 O OE1 . GLU Q 17 189 ? 151.856 255.537 276.598 1.00 135.20 189 Bj 1 
ATOM 1120 O OE2 . GLU Q 17 189 ? 152.755 257.183 275.457 1.00 135.20 189 Bj 1 
ATOM 1121 N N   . ARG Q 17 190 ? 148.085 256.576 280.268 1.00 137.16 190 Bj 1 
ATOM 1122 C CA  . ARG Q 17 190 ? 147.053 255.885 281.035 1.00 137.16 190 Bj 1 
ATOM 1123 C C   . ARG Q 17 190 ? 145.950 256.847 281.459 1.00 137.16 190 Bj 1 
ATOM 1124 O O   . ARG Q 17 190 ? 144.768 256.483 281.473 1.00 137.16 190 Bj 1 
ATOM 1125 C CB  . ARG Q 17 190 ? 147.674 255.206 282.256 1.00 137.16 190 Bj 1 
ATOM 1126 C CG  . ARG Q 17 190 ? 146.670 254.507 283.159 1.00 137.16 190 Bj 1 
ATOM 1127 C CD  . ARG Q 17 190 ? 147.358 253.841 284.338 1.00 137.16 190 Bj 1 
ATOM 1128 N NE  . ARG Q 17 190 ? 148.133 254.792 285.129 1.00 137.16 190 Bj 1 
ATOM 1129 C CZ  . ARG Q 17 190 ? 147.632 255.522 286.120 1.00 137.16 190 Bj 1 
ATOM 1130 N NH1 . ARG Q 17 190 ? 146.352 255.413 286.445 1.00 137.16 190 Bj 1 
ATOM 1131 N NH2 . ARG Q 17 190 ? 148.412 256.362 286.786 1.00 137.16 190 Bj 1 
ATOM 1132 N N   . THR Q 17 191 ? 146.318 258.084 281.795 1.00 139.17 191 Bj 1 
ATOM 1133 C CA  . THR Q 17 191 ? 145.327 259.090 282.158 1.00 139.17 191 Bj 1 
ATOM 1134 C C   . THR Q 17 191 ? 144.388 259.378 280.996 1.00 139.17 191 Bj 1 
ATOM 1135 O O   . THR Q 17 191 ? 143.164 259.268 281.131 1.00 139.17 191 Bj 1 
ATOM 1136 C CB  . THR Q 17 191 ? 146.024 260.373 282.606 1.00 139.17 191 Bj 1 
ATOM 1137 O OG1 . THR Q 17 191 ? 146.894 260.085 283.707 1.00 139.17 191 Bj 1 
ATOM 1138 C CG2 . THR Q 17 191 ? 144.999 261.416 283.027 1.00 139.17 191 Bj 1 
ATOM 1139 N N   . LEU Q 17 192 ? 144.945 259.747 279.841 1.00 141.63 192 Bj 1 
ATOM 1140 C CA  . LEU Q 17 192 ? 144.109 260.056 278.687 1.00 141.63 192 Bj 1 
ATOM 1141 C C   . LEU Q 17 192 ? 143.341 258.840 278.185 1.00 141.63 192 Bj 1 
ATOM 1142 O O   . LEU Q 17 192 ? 142.352 259.004 277.463 1.00 141.63 192 Bj 1 
ATOM 1143 C CB  . LEU Q 17 192 ? 144.956 260.651 277.557 1.00 141.63 192 Bj 1 
ATOM 1144 C CG  . LEU Q 17 192 ? 146.099 259.830 276.954 1.00 141.63 192 Bj 1 
ATOM 1145 C CD1 . LEU Q 17 192 ? 145.628 258.957 275.794 1.00 141.63 192 Bj 1 
ATOM 1146 C CD2 . LEU Q 17 192 ? 147.225 260.747 276.511 1.00 141.63 192 Bj 1 
ATOM 1147 N N   . ALA Q 17 193 ? 143.770 257.628 278.546 1.00 143.93 193 Bj 1 
ATOM 1148 C CA  . ALA Q 17 193 ? 143.045 256.438 278.119 1.00 143.93 193 Bj 1 
ATOM 1149 C C   . ALA Q 17 193 ? 141.916 256.066 279.074 1.00 143.93 193 Bj 1 
ATOM 1150 O O   . ALA Q 17 193 ? 140.870 255.584 278.626 1.00 143.93 193 Bj 1 
ATOM 1151 C CB  . ALA Q 17 193 ? 144.010 255.261 277.971 1.00 143.93 193 Bj 1 
ATOM 1152 N N   . THR Q 17 194 ? 142.098 256.279 280.377 1.00 145.46 194 Bj 1 
ATOM 1153 C CA  . THR Q 17 194 ? 141.129 255.841 281.375 1.00 145.46 194 Bj 1 
ATOM 1154 C C   . THR Q 17 194 ? 140.242 256.970 281.888 1.00 145.46 194 Bj 1 
ATOM 1155 O O   . THR Q 17 194 ? 139.014 256.846 281.870 1.00 145.46 194 Bj 1 
ATOM 1156 C CB  . THR Q 17 194 ? 141.855 255.179 282.553 1.00 145.46 194 Bj 1 
ATOM 1157 O OG1 . THR Q 17 194 ? 142.819 256.090 283.094 1.00 145.46 194 Bj 1 
ATOM 1158 C CG2 . THR Q 17 194 ? 142.563 253.912 282.096 1.00 145.46 194 Bj 1 
ATOM 1159 N N   . LEU Q 17 195 ? 140.840 258.069 282.358 1.00 142.21 195 Bj 1 
ATOM 1160 C CA  . LEU Q 17 195 ? 140.050 259.165 282.911 1.00 142.21 195 Bj 1 
ATOM 1161 C C   . LEU Q 17 195 ? 139.145 259.793 281.860 1.00 142.21 195 Bj 1 
ATOM 1162 O O   . LEU Q 17 195 ? 138.038 260.239 282.181 1.00 142.21 195 Bj 1 
ATOM 1163 C CB  . LEU Q 17 195 ? 140.968 260.229 283.517 1.00 142.21 195 Bj 1 
ATOM 1164 C CG  . LEU Q 17 195 ? 141.597 259.972 284.891 1.00 142.21 195 Bj 1 
ATOM 1165 C CD1 . LEU Q 17 195 ? 142.698 258.923 284.829 1.00 142.21 195 Bj 1 
ATOM 1166 C CD2 . LEU Q 17 195 ? 142.128 261.271 285.480 1.00 142.21 195 Bj 1 
ATOM 1167 N N   . SER Q 17 196 ? 139.594 259.839 280.604 1.00 140.98 196 Bj 1 
ATOM 1168 C CA  . SER Q 17 196 ? 138.776 260.410 279.541 1.00 140.98 196 Bj 1 
ATOM 1169 C C   . SER Q 17 196 ? 137.616 259.503 279.154 1.00 140.98 196 Bj 1 
ATOM 1170 O O   . SER Q 17 196 ? 136.610 259.998 278.635 1.00 140.98 196 Bj 1 
ATOM 1171 C CB  . SER Q 17 196 ? 139.642 260.710 278.317 1.00 140.98 196 Bj 1 
ATOM 1172 O OG  . SER Q 17 196 ? 138.870 261.273 277.272 1.00 140.98 196 Bj 1 
ATOM 1173 N N   . GLU Q 17 197 ? 137.739 258.194 279.389 1.00 135.62 197 Bj 1 
ATOM 1174 C CA  . GLU Q 17 197 ? 136.656 257.236 279.156 1.00 135.62 197 Bj 1 
ATOM 1175 C C   . GLU Q 17 197 ? 136.208 257.234 277.696 1.00 135.62 197 Bj 1 
ATOM 1176 O O   . GLU Q 17 197 ? 135.013 257.193 277.396 1.00 135.62 197 Bj 1 
ATOM 1177 C CB  . GLU Q 17 197 ? 135.470 257.510 280.085 1.00 135.62 197 Bj 1 
ATOM 1178 C CG  . GLU Q 17 197 ? 135.840 257.617 281.554 1.00 135.62 197 Bj 1 
ATOM 1179 C CD  . GLU Q 17 197 ? 134.680 258.079 282.413 1.00 135.62 197 Bj 1 
ATOM 1180 O OE1 . GLU Q 17 197 ? 133.581 258.302 281.863 1.00 135.62 197 Bj 1 
ATOM 1181 O OE2 . GLU Q 17 197 ? 134.868 258.222 283.639 1.00 135.62 197 Bj 1 
ATOM 1182 N N   . ASN Q 17 198 ? 137.171 257.276 276.779 1.00 129.66 198 Bj 1 
ATOM 1183 C CA  . ASN Q 17 198 ? 136.857 257.290 275.358 1.00 129.66 198 Bj 1 
ATOM 1184 C C   . ASN Q 17 198 ? 138.089 256.875 274.568 1.00 129.66 198 Bj 1 
ATOM 1185 O O   . ASN Q 17 198 ? 139.210 256.881 275.082 1.00 129.66 198 Bj 1 
ATOM 1186 C CB  . ASN Q 17 198 ? 136.372 258.671 274.903 1.00 129.66 198 Bj 1 
ATOM 1187 C CG  . ASN Q 17 198 ? 137.500 259.681 274.800 1.00 129.66 198 Bj 1 
ATOM 1188 O OD1 . ASN Q 17 198 ? 138.430 259.675 275.605 1.00 129.66 198 Bj 1 
ATOM 1189 N ND2 . ASN Q 17 198 ? 137.425 260.552 273.801 1.00 129.66 198 Bj 1 
ATOM 1190 N N   . ASN Q 17 199 ? 137.862 256.515 273.307 1.00 121.02 199 Bj 1 
ATOM 1191 C CA  . ASN Q 17 199 ? 138.944 256.208 272.374 1.00 121.02 199 Bj 1 
ATOM 1192 C C   . ASN Q 17 199 ? 139.384 257.519 271.734 1.00 121.02 199 Bj 1 
ATOM 1193 O O   . ASN Q 17 199 ? 138.711 258.055 270.850 1.00 121.02 199 Bj 1 
ATOM 1194 C CB  . ASN Q 17 199 ? 138.496 255.185 271.335 1.00 121.02 199 Bj 1 
ATOM 1195 C CG  . ASN Q 17 199 ? 137.204 255.577 270.646 1.00 121.02 199 Bj 1 
ATOM 1196 O OD1 . ASN Q 17 199 ? 136.405 256.339 271.189 1.00 121.02 199 Bj 1 
ATOM 1197 N ND2 . ASN Q 17 199 ? 136.993 255.057 269.443 1.00 121.02 199 Bj 1 
ATOM 1198 N N   . MET Q 17 200 ? 140.516 258.044 272.190 1.00 123.96 200 Bj 1 
ATOM 1199 C CA  . MET Q 17 200 ? 141.014 259.341 271.760 1.00 123.96 200 Bj 1 
ATOM 1200 C C   . MET Q 17 200 ? 142.451 259.205 271.279 1.00 123.96 200 Bj 1 
ATOM 1201 O O   . MET Q 17 200 ? 143.258 258.501 271.895 1.00 123.96 200 Bj 1 
ATOM 1202 C CB  . MET Q 17 200 ? 140.927 260.358 272.901 1.00 123.96 200 Bj 1 
ATOM 1203 C CG  . MET Q 17 200 ? 141.315 261.768 272.517 1.00 123.96 200 Bj 1 
ATOM 1204 S SD  . MET Q 17 200 ? 141.001 262.928 273.857 1.00 123.96 200 Bj 1 
ATOM 1205 C CE  . MET Q 17 200 ? 141.986 262.202 275.165 1.00 123.96 200 Bj 1 
ATOM 1206 N N   . GLU Q 17 201 ? 142.767 259.880 270.176 1.00 115.66 201 Bj 1 
ATOM 1207 C CA  . GLU Q 17 201 ? 144.092 259.821 269.570 1.00 115.66 201 Bj 1 
ATOM 1208 C C   . GLU Q 17 201 ? 144.889 261.040 270.022 1.00 115.66 201 Bj 1 
ATOM 1209 O O   . GLU Q 17 201 ? 144.619 262.164 269.586 1.00 115.66 201 Bj 1 
ATOM 1210 C CB  . GLU Q 17 201 ? 143.988 259.759 268.048 1.00 115.66 201 Bj 1 
ATOM 1211 C CG  . GLU Q 17 201 ? 143.149 258.601 267.531 1.00 115.66 201 Bj 1 
ATOM 1212 C CD  . GLU Q 17 201 ? 143.120 258.531 266.017 1.00 115.66 201 Bj 1 
ATOM 1213 O OE1 . GLU Q 17 201 ? 143.950 259.207 265.373 1.00 115.66 201 Bj 1 
ATOM 1214 O OE2 . GLU Q 17 201 ? 142.265 257.803 265.470 1.00 115.66 201 Bj 1 
ATOM 1215 N N   . ALA Q 17 202 ? 145.869 260.814 270.892 1.00 117.10 202 Bj 1 
ATOM 1216 C CA  . ALA Q 17 202 ? 146.717 261.870 271.422 1.00 117.10 202 Bj 1 
ATOM 1217 C C   . ALA Q 17 202 ? 148.131 261.723 270.876 1.00 117.10 202 Bj 1 
ATOM 1218 O O   . ALA Q 17 202 ? 148.651 260.609 270.767 1.00 117.10 202 Bj 1 
ATOM 1219 C CB  . ALA Q 17 202 ? 146.744 261.840 272.952 1.00 117.10 202 Bj 1 
ATOM 1220 N N   . LYS Q 17 203 ? 148.748 262.853 270.539 1.00 120.82 203 Bj 1 
ATOM 1221 C CA  . LYS Q 17 203 ? 150.096 262.887 269.981 1.00 120.82 203 Bj 1 
ATOM 1222 C C   . LYS Q 17 203 ? 150.986 263.704 270.910 1.00 120.82 203 Bj 1 
ATOM 1223 O O   . LYS Q 17 203 ? 150.846 264.929 270.994 1.00 120.82 203 Bj 1 
ATOM 1224 C CB  . LYS Q 17 203 ? 150.087 263.476 268.572 1.00 120.82 203 Bj 1 
ATOM 1225 C CG  . LYS Q 17 203 ? 151.408 263.346 267.834 1.00 120.82 203 Bj 1 
ATOM 1226 C CD  . LYS Q 17 203 ? 151.757 261.888 267.591 1.00 120.82 203 Bj 1 
ATOM 1227 C CE  . LYS Q 17 203 ? 153.066 261.752 266.833 1.00 120.82 203 Bj 1 
ATOM 1228 N NZ  . LYS Q 17 203 ? 153.409 260.327 266.571 1.00 120.82 203 Bj 1 
ATOM 1229 N N   . PHE Q 17 204 ? 151.897 263.028 271.606 1.00 125.72 204 Bj 1 
ATOM 1230 C CA  . PHE Q 17 204 ? 152.832 263.707 272.490 1.00 125.72 204 Bj 1 
ATOM 1231 C C   . PHE Q 17 204 ? 153.972 264.322 271.689 1.00 125.72 204 Bj 1 
ATOM 1232 O O   . PHE Q 17 204 ? 154.445 263.744 270.707 1.00 125.72 204 Bj 1 
ATOM 1233 C CB  . PHE Q 17 204 ? 153.391 262.739 273.531 1.00 125.72 204 Bj 1 
ATOM 1234 C CG  . PHE Q 17 204 ? 152.415 262.383 274.614 1.00 125.72 204 Bj 1 
ATOM 1235 C CD1 . PHE Q 17 204 ? 151.538 261.325 274.454 1.00 125.72 204 Bj 1 
ATOM 1236 C CD2 . PHE Q 17 204 ? 152.379 263.106 275.795 1.00 125.72 204 Bj 1 
ATOM 1237 C CE1 . PHE Q 17 204 ? 150.641 260.996 275.451 1.00 125.72 204 Bj 1 
ATOM 1238 C CE2 . PHE Q 17 204 ? 151.484 262.782 276.795 1.00 125.72 204 Bj 1 
ATOM 1239 C CZ  . PHE Q 17 204 ? 150.615 261.725 276.624 1.00 125.72 204 Bj 1 
ATOM 1240 N N   . LEU Q 17 205 ? 154.414 265.504 272.120 1.00 121.24 205 Bj 1 
ATOM 1241 C CA  . LEU Q 17 205 ? 155.467 266.215 271.402 1.00 121.24 205 Bj 1 
ATOM 1242 C C   . LEU Q 17 205 ? 156.851 265.713 271.799 1.00 121.24 205 Bj 1 
ATOM 1243 O O   . LEU Q 17 205 ? 157.602 265.202 270.961 1.00 121.24 205 Bj 1 
ATOM 1244 C CB  . LEU Q 17 205 ? 155.344 267.719 271.658 1.00 121.24 205 Bj 1 
ATOM 1245 C CG  . LEU Q 17 205 ? 153.967 268.330 271.399 1.00 121.24 205 Bj 1 
ATOM 1246 C CD1 . LEU Q 17 205 ? 153.973 269.814 271.724 1.00 121.24 205 Bj 1 
ATOM 1247 C CD2 . LEU Q 17 205 ? 153.536 268.092 269.962 1.00 121.24 205 Bj 1 
ATOM 1248 N N   . GLY Q 17 206 ? 157.202 265.847 273.070 1.00 130.10 206 Bj 1 
ATOM 1249 C CA  . GLY Q 17 206 ? 158.515 265.444 273.539 1.00 130.10 206 Bj 1 
ATOM 1250 C C   . GLY Q 17 206 ? 158.419 264.700 274.853 1.00 130.10 206 Bj 1 
ATOM 1251 O O   . GLY Q 17 206 ? 157.446 264.831 275.598 1.00 130.10 206 Bj 1 
ATOM 1252 N N   . ASN Q 17 207 ? 159.458 263.909 275.133 1.00 132.28 207 Bj 1 
ATOM 1253 C CA  . ASN Q 17 207 ? 159.476 263.119 276.359 1.00 132.28 207 Bj 1 
ATOM 1254 C C   . ASN Q 17 207 ? 159.764 263.982 277.581 1.00 132.28 207 Bj 1 
ATOM 1255 O O   . ASN Q 17 207 ? 159.380 263.618 278.699 1.00 132.28 207 Bj 1 
ATOM 1256 C CB  . ASN Q 17 207 ? 160.510 261.999 276.242 1.00 132.28 207 Bj 1 
ATOM 1257 C CG  . ASN Q 17 207 ? 160.456 261.029 277.405 1.00 132.28 207 Bj 1 
ATOM 1258 O OD1 . ASN Q 17 207 ? 159.414 260.859 278.039 1.00 132.28 207 Bj 1 
ATOM 1259 N ND2 . ASN Q 17 207 ? 161.581 260.384 277.690 1.00 132.28 207 Bj 1 
ATOM 1260 N N   . ALA Q 17 208 ? 160.429 265.117 277.395 1.00 129.27 208 Bj 1 
ATOM 1261 C CA  . ALA Q 17 208 ? 160.739 265.987 278.515 1.00 129.27 208 Bj 1 
ATOM 1262 C C   . ALA Q 17 208 ? 159.476 266.692 279.008 1.00 129.27 208 Bj 1 
ATOM 1263 O O   . ALA Q 17 208 ? 158.549 266.940 278.230 1.00 129.27 208 Bj 1 
ATOM 1264 C CB  . ALA Q 17 208 ? 161.789 267.020 278.115 1.00 129.27 208 Bj 1 
ATOM 1265 N N   . PRO Q 17 209 ? 159.410 267.019 280.299 1.00 132.17 209 Bj 1 
ATOM 1266 C CA  . PRO Q 17 209 ? 158.236 267.726 280.821 1.00 132.17 209 Bj 1 
ATOM 1267 C C   . PRO Q 17 209 ? 158.110 269.117 280.221 1.00 132.17 209 Bj 1 
ATOM 1268 O O   . PRO Q 17 209 ? 159.065 269.686 279.688 1.00 132.17 209 Bj 1 
ATOM 1269 C CB  . PRO Q 17 209 ? 158.499 267.795 282.331 1.00 132.17 209 Bj 1 
ATOM 1270 C CG  . PRO Q 17 209 ? 159.515 266.734 282.598 1.00 132.17 209 Bj 1 
ATOM 1271 C CD  . PRO Q 17 209 ? 160.359 266.661 281.366 1.00 132.17 209 Bj 1 
ATOM 1272 N N   . CYS Q 17 210 ? 156.902 269.668 280.318 1.00 129.55 210 Bj 1 
ATOM 1273 C CA  . CYS Q 17 210 ? 156.616 271.006 279.817 1.00 129.55 210 Bj 1 
ATOM 1274 C C   . CYS Q 17 210 ? 156.563 272.051 280.922 1.00 129.55 210 Bj 1 
ATOM 1275 O O   . CYS Q 17 210 ? 156.967 273.196 280.703 1.00 129.55 210 Bj 1 
ATOM 1276 C CB  . CYS Q 17 210 ? 155.294 271.012 279.044 1.00 129.55 210 Bj 1 
ATOM 1277 S SG  . CYS Q 17 210 ? 155.139 269.674 277.842 1.00 129.55 210 Bj 1 
ATOM 1278 N N   . GLY Q 17 211 ? 156.076 271.687 282.100 1.00 136.75 211 Bj 1 
ATOM 1279 C CA  . GLY Q 17 211 ? 156.066 272.608 283.225 1.00 136.75 211 Bj 1 
ATOM 1280 C C   . GLY Q 17 211 ? 156.247 271.868 284.528 1.00 136.75 211 Bj 1 
ATOM 1281 O O   . GLY Q 17 211 ? 155.885 270.695 284.650 1.00 136.75 211 Bj 1 
ATOM 1282 N N   . HIS Q 17 212 ? 156.808 272.561 285.516 1.00 134.65 212 Bj 1 
ATOM 1283 C CA  . HIS Q 17 212 ? 157.023 272.000 286.842 1.00 134.65 212 Bj 1 
ATOM 1284 C C   . HIS Q 17 212 ? 156.523 272.973 287.897 1.00 134.65 212 Bj 1 
ATOM 1285 O O   . HIS Q 17 212 ? 156.786 274.177 287.812 1.00 134.65 212 Bj 1 
ATOM 1286 C CB  . HIS Q 17 212 ? 158.502 271.694 287.090 1.00 134.65 212 Bj 1 
ATOM 1287 C CG  . HIS Q 17 212 ? 158.933 270.348 286.601 1.00 134.65 212 Bj 1 
ATOM 1288 N ND1 . HIS Q 17 212 ? 159.905 269.605 287.236 1.00 134.65 212 Bj 1 
ATOM 1289 C CD2 . HIS Q 17 212 ? 158.530 269.612 285.539 1.00 134.65 212 Bj 1 
ATOM 1290 C CE1 . HIS Q 17 212 ? 160.079 268.468 286.587 1.00 134.65 212 Bj 1 
ATOM 1291 N NE2 . HIS Q 17 212 ? 159.258 268.447 285.553 1.00 134.65 212 Bj 1 
ATOM 1292 N N   . TYR Q 17 213 ? 155.805 272.454 288.892 1.00 135.25 213 Bj 1 
ATOM 1293 C CA  . TYR Q 17 213 ? 155.323 273.300 289.979 1.00 135.25 213 Bj 1 
ATOM 1294 C C   . TYR Q 17 213 ? 155.377 272.542 291.296 1.00 135.25 213 Bj 1 
ATOM 1295 O O   . TYR Q 17 213 ? 154.938 271.392 291.372 1.00 135.25 213 Bj 1 
ATOM 1296 C CB  . TYR Q 17 213 ? 153.896 273.793 289.707 1.00 135.25 213 Bj 1 
ATOM 1297 C CG  . TYR Q 17 213 ? 153.785 274.683 288.490 1.00 135.25 213 Bj 1 
ATOM 1298 C CD1 . TYR Q 17 213 ? 153.974 276.055 288.588 1.00 135.25 213 Bj 1 
ATOM 1299 C CD2 . TYR Q 17 213 ? 153.497 274.151 287.241 1.00 135.25 213 Bj 1 
ATOM 1300 C CE1 . TYR Q 17 213 ? 153.875 276.870 287.476 1.00 135.25 213 Bj 1 
ATOM 1301 C CE2 . TYR Q 17 213 ? 153.395 274.957 286.125 1.00 135.25 213 Bj 1 
ATOM 1302 C CZ  . TYR Q 17 213 ? 153.585 276.315 286.248 1.00 135.25 213 Bj 1 
ATOM 1303 O OH  . TYR Q 17 213 ? 153.485 277.120 285.137 1.00 135.25 213 Bj 1 
ATOM 1304 N N   . LYS Q 17 214 ? 155.902 273.189 292.333 1.00 138.67 214 Bj 1 
ATOM 1305 C CA  . LYS Q 17 214 ? 156.024 272.582 293.650 1.00 138.67 214 Bj 1 
ATOM 1306 C C   . LYS Q 17 214 ? 155.177 273.334 294.667 1.00 138.67 214 Bj 1 
ATOM 1307 O O   . LYS Q 17 214 ? 154.975 274.547 294.559 1.00 138.67 214 Bj 1 
ATOM 1308 C CB  . LYS Q 17 214 ? 157.483 272.554 294.123 1.00 138.67 214 Bj 1 
ATOM 1309 C CG  . LYS Q 17 214 ? 158.319 271.446 293.510 1.00 138.67 214 Bj 1 
ATOM 1310 C CD  . LYS Q 17 214 ? 159.715 271.422 294.112 1.00 138.67 214 Bj 1 
ATOM 1311 C CE  . LYS Q 17 214 ? 160.537 270.265 293.567 1.00 138.67 214 Bj 1 
ATOM 1312 N NZ  . LYS Q 17 214 ? 159.905 268.949 293.855 1.00 138.67 214 Bj 1 
ATOM 1313 N N   . PHE Q 17 215 ? 154.684 272.594 295.658 1.00 143.45 215 Bj 1 
ATOM 1314 C CA  . PHE Q 17 215 ? 153.944 273.179 296.769 1.00 143.45 215 Bj 1 
ATOM 1315 C C   . PHE Q 17 215 ? 154.171 272.332 298.012 1.00 143.45 215 Bj 1 
ATOM 1316 O O   . PHE Q 17 215 ? 154.077 271.103 297.954 1.00 143.45 215 Bj 1 
ATOM 1317 C CB  . PHE Q 17 215 ? 152.446 273.293 296.456 1.00 143.45 215 Bj 1 
ATOM 1318 C CG  . PHE Q 17 215 ? 151.816 272.015 295.975 1.00 143.45 215 Bj 1 
ATOM 1319 C CD1 . PHE Q 17 215 ? 151.873 271.659 294.637 1.00 143.45 215 Bj 1 
ATOM 1320 C CD2 . PHE Q 17 215 ? 151.143 271.185 296.855 1.00 143.45 215 Bj 1 
ATOM 1321 C CE1 . PHE Q 17 215 ? 151.287 270.489 294.190 1.00 143.45 215 Bj 1 
ATOM 1322 C CE2 . PHE Q 17 215 ? 150.553 270.015 296.414 1.00 143.45 215 Bj 1 
ATOM 1323 C CZ  . PHE Q 17 215 ? 150.626 269.667 295.079 1.00 143.45 215 Bj 1 
ATOM 1324 N N   . LYS Q 17 216 ? 154.477 272.988 299.126 1.00 149.62 216 Bj 1 
ATOM 1325 C CA  . LYS Q 17 216 ? 154.790 272.310 300.375 1.00 149.62 216 Bj 1 
ATOM 1326 C C   . LYS Q 17 216 ? 153.709 272.593 301.408 1.00 149.62 216 Bj 1 
ATOM 1327 O O   . LYS Q 17 216 ? 153.137 273.687 301.440 1.00 149.62 216 Bj 1 
ATOM 1328 C CB  . LYS Q 17 216 ? 156.158 272.749 300.906 1.00 149.62 216 Bj 1 
ATOM 1329 C CG  . LYS Q 17 216 ? 157.300 272.479 299.940 1.00 149.62 216 Bj 1 
ATOM 1330 C CD  . LYS Q 17 216 ? 158.639 272.904 300.519 1.00 149.62 216 Bj 1 
ATOM 1331 C CE  . LYS Q 17 216 ? 159.771 272.621 299.544 1.00 149.62 216 Bj 1 
ATOM 1332 N NZ  . LYS Q 17 216 ? 161.098 272.996 300.105 1.00 149.62 216 Bj 1 
ATOM 1333 N N   . PHE Q 17 217 ? 153.435 271.602 302.250 1.00 143.58 217 Bj 1 
ATOM 1334 C CA  . PHE Q 17 217 ? 152.407 271.732 303.275 1.00 143.58 217 Bj 1 
ATOM 1335 C C   . PHE Q 17 217 ? 153.018 272.091 304.624 1.00 143.58 217 Bj 1 
ATOM 1336 O O   . PHE Q 17 217 ? 152.899 271.339 305.590 1.00 143.58 217 Bj 1 
ATOM 1337 C CB  . PHE Q 17 217 ? 151.599 270.437 303.392 1.00 143.58 217 Bj 1 
ATOM 1338 C CG  . PHE Q 17 217 ? 150.831 270.087 302.150 1.00 143.58 217 Bj 1 
ATOM 1339 C CD1 . PHE Q 17 217 ? 150.463 271.069 301.245 1.00 143.58 217 Bj 1 
ATOM 1340 C CD2 . PHE Q 17 217 ? 150.477 268.774 301.886 1.00 143.58 217 Bj 1 
ATOM 1341 C CE1 . PHE Q 17 217 ? 149.756 270.748 300.101 1.00 143.58 217 Bj 1 
ATOM 1342 C CE2 . PHE Q 17 217 ? 149.771 268.447 300.744 1.00 143.58 217 Bj 1 
ATOM 1343 C CZ  . PHE Q 17 217 ? 149.410 269.435 299.851 1.00 143.58 217 Bj 1 
ATOM 1344 N N   . LEU Q 17 227 ? 157.135 268.148 304.312 1.00 125.05 227 Bj 1 
ATOM 1345 C CA  . LEU Q 17 227 ? 156.195 267.564 303.362 1.00 125.05 227 Bj 1 
ATOM 1346 C C   . LEU Q 17 227 ? 156.009 268.470 302.151 1.00 125.05 227 Bj 1 
ATOM 1347 O O   . LEU Q 17 227 ? 155.534 269.599 302.277 1.00 125.05 227 Bj 1 
ATOM 1348 C CB  . LEU Q 17 227 ? 154.846 267.299 304.034 1.00 125.05 227 Bj 1 
ATOM 1349 C CG  . LEU Q 17 227 ? 153.726 266.761 303.141 1.00 125.05 227 Bj 1 
ATOM 1350 C CD1 . LEU Q 17 227 ? 154.132 265.448 302.492 1.00 125.05 227 Bj 1 
ATOM 1351 C CD2 . LEU Q 17 227 ? 152.443 266.591 303.938 1.00 125.05 227 Bj 1 
ATOM 1352 N N   . GLY Q 17 228 ? 156.388 267.969 300.971 1.00 128.22 228 Bj 1 
ATOM 1353 C CA  . GLY Q 17 228 ? 156.244 268.718 299.745 1.00 128.22 228 Bj 1 
ATOM 1354 C C   . GLY Q 17 228 ? 155.646 267.856 298.647 1.00 128.22 228 Bj 1 
ATOM 1355 O O   . GLY Q 17 228 ? 155.531 266.635 298.775 1.00 128.22 228 Bj 1 
ATOM 1356 N N   . ALA Q 17 229 ? 155.272 268.518 297.555 1.00 135.59 229 Bj 1 
ATOM 1357 C CA  . ALA Q 17 229 ? 154.709 267.825 296.410 1.00 135.59 229 Bj 1 
ATOM 1358 C C   . ALA Q 17 229 ? 155.086 268.574 295.142 1.00 135.59 229 Bj 1 
ATOM 1359 O O   . ALA Q 17 229 ? 155.273 269.793 295.151 1.00 135.59 229 Bj 1 
ATOM 1360 C CB  . ALA Q 17 229 ? 153.186 267.691 296.522 1.00 135.59 229 Bj 1 
ATOM 1361 N N   . LYS Q 17 230 ? 155.195 267.821 294.052 1.00 134.09 230 Bj 1 
ATOM 1362 C CA  . LYS Q 17 230 ? 155.610 268.330 292.755 1.00 134.09 230 Bj 1 
ATOM 1363 C C   . LYS Q 17 230 ? 154.658 267.812 291.689 1.00 134.09 230 Bj 1 
ATOM 1364 O O   . LYS Q 17 230 ? 154.215 266.660 291.748 1.00 134.09 230 Bj 1 
ATOM 1365 C CB  . LYS Q 17 230 ? 157.044 267.900 292.437 1.00 134.09 230 Bj 1 
ATOM 1366 C CG  . LYS Q 17 230 ? 157.266 266.407 292.605 1.00 134.09 230 Bj 1 
ATOM 1367 C CD  . LYS Q 17 230 ? 158.738 266.053 292.685 1.00 134.09 230 Bj 1 
ATOM 1368 C CE  . LYS Q 17 230 ? 158.919 264.566 292.931 1.00 134.09 230 Bj 1 
ATOM 1369 N NZ  . LYS Q 17 230 ? 158.240 264.126 294.181 1.00 134.09 230 Bj 1 
ATOM 1370 N N   . VAL Q 17 231 ? 154.339 268.668 290.723 1.00 135.01 231 Bj 1 
ATOM 1371 C CA  . VAL Q 17 231 ? 153.447 268.325 289.624 1.00 135.01 231 Bj 1 
ATOM 1372 C C   . VAL Q 17 231 ? 154.143 268.676 288.317 1.00 135.01 231 Bj 1 
ATOM 1373 O O   . VAL Q 17 231 ? 154.717 269.766 288.179 1.00 135.01 231 Bj 1 
ATOM 1374 C CB  . VAL Q 17 231 ? 152.083 269.037 289.740 1.00 135.01 231 Bj 1 
ATOM 1375 C CG1 . VAL Q 17 231 ? 152.256 270.540 289.888 1.00 135.01 231 Bj 1 
ATOM 1376 C CG2 . VAL Q 17 231 ? 151.200 268.706 288.544 1.00 135.01 231 Bj 1 
ATOM 1377 N N   . PHE Q 17 232 ? 154.109 267.736 287.371 1.00 135.12 232 Bj 1 
ATOM 1378 C CA  . PHE Q 17 232 ? 154.776 267.856 286.079 1.00 135.12 232 Bj 1 
ATOM 1379 C C   . PHE Q 17 232 ? 153.708 267.897 284.994 1.00 135.12 232 Bj 1 
ATOM 1380 O O   . PHE Q 17 232 ? 152.998 266.910 284.777 1.00 135.12 232 Bj 1 
ATOM 1381 C CB  . PHE Q 17 232 ? 155.736 266.691 285.848 1.00 135.12 232 Bj 1 
ATOM 1382 C CG  . PHE Q 17 232 ? 156.600 266.370 287.032 1.00 135.12 232 Bj 1 
ATOM 1383 C CD1 . PHE Q 17 232 ? 157.175 267.378 287.786 1.00 135.12 232 Bj 1 
ATOM 1384 C CD2 . PHE Q 17 232 ? 156.831 265.055 287.394 1.00 135.12 232 Bj 1 
ATOM 1385 C CE1 . PHE Q 17 232 ? 157.968 267.079 288.875 1.00 135.12 232 Bj 1 
ATOM 1386 C CE2 . PHE Q 17 232 ? 157.623 264.749 288.481 1.00 135.12 232 Bj 1 
ATOM 1387 C CZ  . PHE Q 17 232 ? 158.192 265.763 289.223 1.00 135.12 232 Bj 1 
ATOM 1388 N N   . PHE Q 17 233 ? 153.597 269.034 284.318 1.00 138.91 233 Bj 1 
ATOM 1389 C CA  . PHE Q 17 233 ? 152.629 269.220 283.246 1.00 138.91 233 Bj 1 
ATOM 1390 C C   . PHE Q 17 233 ? 153.266 268.835 281.917 1.00 138.91 233 Bj 1 
ATOM 1391 O O   . PHE Q 17 233 ? 154.289 269.410 281.525 1.00 138.91 233 Bj 1 
ATOM 1392 C CB  . PHE Q 17 233 ? 152.141 270.667 283.211 1.00 138.91 233 Bj 1 
ATOM 1393 C CG  . PHE Q 17 233 ? 151.342 271.064 284.416 1.00 138.91 233 Bj 1 
ATOM 1394 C CD1 . PHE Q 17 233 ? 151.971 271.457 285.584 1.00 138.91 233 Bj 1 
ATOM 1395 C CD2 . PHE Q 17 233 ? 149.959 271.042 284.380 1.00 138.91 233 Bj 1 
ATOM 1396 C CE1 . PHE Q 17 233 ? 151.233 271.818 286.695 1.00 138.91 233 Bj 1 
ATOM 1397 C CE2 . PHE Q 17 233 ? 149.218 271.404 285.489 1.00 138.91 233 Bj 1 
ATOM 1398 C CZ  . PHE Q 17 233 ? 149.856 271.793 286.646 1.00 138.91 233 Bj 1 
ATOM 1399 N N   . PHE Q 17 234 ? 152.663 267.863 281.235 1.00 134.22 234 Bj 1 
ATOM 1400 C CA  . PHE Q 17 234 ? 153.088 267.418 279.917 1.00 134.22 234 Bj 1 
ATOM 1401 C C   . PHE Q 17 234 ? 152.037 267.799 278.884 1.00 134.22 234 Bj 1 
ATOM 1402 O O   . PHE Q 17 234 ? 150.840 267.584 279.098 1.00 134.22 234 Bj 1 
ATOM 1403 C CB  . PHE Q 17 234 ? 153.301 265.902 279.885 1.00 134.22 234 Bj 1 
ATOM 1404 C CG  . PHE Q 17 234 ? 154.564 265.447 280.554 1.00 134.22 234 Bj 1 
ATOM 1405 C CD1 . PHE Q 17 234 ? 154.684 265.473 281.933 1.00 134.22 234 Bj 1 
ATOM 1406 C CD2 . PHE Q 17 234 ? 155.625 264.972 279.802 1.00 134.22 234 Bj 1 
ATOM 1407 C CE1 . PHE Q 17 234 ? 155.845 265.047 282.547 1.00 134.22 234 Bj 1 
ATOM 1408 C CE2 . PHE Q 17 234 ? 156.786 264.542 280.410 1.00 134.22 234 Bj 1 
ATOM 1409 C CZ  . PHE Q 17 234 ? 156.896 264.580 281.784 1.00 134.22 234 Bj 1 
ATOM 1410 N N   . LYS Q 17 235 ? 152.488 268.350 277.760 1.00 127.98 235 Bj 1 
ATOM 1411 C CA  . LYS Q 17 235 ? 151.591 268.748 276.685 1.00 127.98 235 Bj 1 
ATOM 1412 C C   . LYS Q 17 235 ? 151.407 267.614 275.685 1.00 127.98 235 Bj 1 
ATOM 1413 O O   . LYS Q 17 235 ? 152.342 266.861 275.399 1.00 127.98 235 Bj 1 
ATOM 1414 C CB  . LYS Q 17 235 ? 152.120 269.988 275.962 1.00 127.98 235 Bj 1 
ATOM 1415 C CG  . LYS Q 17 235 ? 151.913 271.288 276.717 1.00 127.98 235 Bj 1 
ATOM 1416 C CD  . LYS Q 17 235 ? 152.321 272.477 275.865 1.00 127.98 235 Bj 1 
ATOM 1417 C CE  . LYS Q 17 235 ? 151.978 273.788 276.547 1.00 127.98 235 Bj 1 
ATOM 1418 N NZ  . LYS Q 17 235 ? 152.378 274.957 275.719 1.00 127.98 235 Bj 1 
ATOM 1419 N N   . ALA Q 17 236 ? 150.191 267.503 275.155 1.00 124.65 236 Bj 1 
ATOM 1420 C CA  . ALA Q 17 236 ? 149.871 266.534 274.120 1.00 124.65 236 Bj 1 
ATOM 1421 C C   . ALA Q 17 236 ? 148.912 267.176 273.129 1.00 124.65 236 Bj 1 
ATOM 1422 O O   . ALA Q 17 236 ? 148.201 268.130 273.453 1.00 124.65 236 Bj 1 
ATOM 1423 C CB  . ALA Q 17 236 ? 149.260 265.254 274.706 1.00 124.65 236 Bj 1 
ATOM 1424 N N   . LEU Q 17 237 ? 148.905 266.645 271.911 1.00 117.02 237 Bj 1 
ATOM 1425 C CA  . LEU Q 17 237 ? 148.078 267.159 270.829 1.00 117.02 237 Bj 1 
ATOM 1426 C C   . LEU Q 17 237 ? 146.925 266.201 270.561 1.00 117.02 237 Bj 1 
ATOM 1427 O O   . LEU Q 17 237 ? 147.072 264.984 270.709 1.00 117.02 237 Bj 1 
ATOM 1428 C CB  . LEU Q 17 237 ? 148.906 267.358 269.556 1.00 117.02 237 Bj 1 
ATOM 1429 C CG  . LEU Q 17 237 ? 148.232 268.081 268.388 1.00 117.02 237 Bj 1 
ATOM 1430 C CD1 . LEU Q 17 237 ? 147.874 269.508 268.773 1.00 117.02 237 Bj 1 
ATOM 1431 C CD2 . LEU Q 17 237 ? 149.124 268.062 267.157 1.00 117.02 237 Bj 1 
ATOM 1432 N N   . LEU Q 17 238 ? 145.780 266.752 270.167 1.00 111.74 238 Bj 1 
ATOM 1433 C CA  . LEU Q 17 238 ? 144.598 265.953 269.875 1.00 111.74 238 Bj 1 
ATOM 1434 C C   . LEU Q 17 238 ? 144.550 265.637 268.385 1.00 111.74 238 Bj 1 
ATOM 1435 O O   . LEU Q 17 238 ? 144.436 266.545 267.555 1.00 111.74 238 Bj 1 
ATOM 1436 C CB  . LEU Q 17 238 ? 143.330 266.688 270.308 1.00 111.74 238 Bj 1 
ATOM 1437 C CG  . LEU Q 17 238 ? 142.006 266.022 269.930 1.00 111.74 238 Bj 1 
ATOM 1438 C CD1 . LEU Q 17 238 ? 141.964 264.588 270.427 1.00 111.74 238 Bj 1 
ATOM 1439 C CD2 . LEU Q 17 238 ? 140.831 266.812 270.482 1.00 111.74 238 Bj 1 
ATOM 1440 N N   . LEU Q 17 239 ? 144.634 264.350 268.050 1.00 112.02 239 Bj 1 
ATOM 1441 C CA  . LEU Q 17 239 ? 144.528 263.909 266.665 1.00 112.02 239 Bj 1 
ATOM 1442 C C   . LEU Q 17 239 ? 143.084 263.603 266.282 1.00 112.02 239 Bj 1 
ATOM 1443 O O   . LEU Q 17 239 ? 142.601 264.068 265.245 1.00 112.02 239 Bj 1 
ATOM 1444 C CB  . LEU Q 17 239 ? 145.409 262.678 266.433 1.00 112.02 239 Bj 1 
ATOM 1445 C CG  . LEU Q 17 239 ? 146.918 262.867 266.591 1.00 112.02 239 Bj 1 
ATOM 1446 C CD1 . LEU Q 17 239 ? 147.642 261.536 266.459 1.00 112.02 239 Bj 1 
ATOM 1447 C CD2 . LEU Q 17 239 ? 147.442 263.866 265.571 1.00 112.02 239 Bj 1 
ATOM 1448 N N   . THR Q 17 240 ? 142.387 262.825 267.107 1.00 112.72 240 Bj 1 
ATOM 1449 C CA  . THR Q 17 240 ? 140.988 262.492 266.862 1.00 112.72 240 Bj 1 
ATOM 1450 C C   . THR Q 17 240 ? 140.284 262.360 268.201 1.00 112.72 240 Bj 1 
ATOM 1451 O O   . THR Q 17 240 ? 140.656 261.510 269.017 1.00 112.72 240 Bj 1 
ATOM 1452 C CB  . THR Q 17 240 ? 140.855 261.198 266.056 1.00 112.72 240 Bj 1 
ATOM 1453 O OG1 . THR Q 17 240 ? 141.478 261.363 264.776 1.00 112.72 240 Bj 1 
ATOM 1454 C CG2 . THR Q 17 240 ? 139.389 260.842 265.860 1.00 112.72 240 Bj 1 
ATOM 1455 N N   . GLY Q 17 241 ? 139.281 263.204 268.427 1.00 112.39 241 Bj 1 
ATOM 1456 C CA  . GLY Q 17 241 ? 138.518 263.163 269.658 1.00 112.39 241 Bj 1 
ATOM 1457 C C   . GLY Q 17 241 ? 137.166 262.503 269.490 1.00 112.39 241 Bj 1 
ATOM 1458 O O   . GLY Q 17 241 ? 136.235 263.106 268.948 1.00 112.39 241 Bj 1 
ATOM 1459 N N   . ASP Q 17 242 ? 137.047 261.262 269.950 1.00 120.39 242 Bj 1 
ATOM 1460 C CA  . ASP Q 17 242 ? 135.806 260.495 269.875 1.00 120.39 242 Bj 1 
ATOM 1461 C C   . ASP Q 17 242 ? 135.359 260.229 271.309 1.00 120.39 242 Bj 1 
ATOM 1462 O O   . ASP Q 17 242 ? 135.683 259.189 271.887 1.00 120.39 242 Bj 1 
ATOM 1463 C CB  . ASP Q 17 242 ? 136.006 259.200 269.088 1.00 120.39 242 Bj 1 
ATOM 1464 C CG  . ASP Q 17 242 ? 134.704 258.479 268.811 1.00 120.39 242 Bj 1 
ATOM 1465 O OD1 . ASP Q 17 242 ? 133.900 258.990 268.004 1.00 120.39 242 Bj 1 
ATOM 1466 O OD2 . ASP Q 17 242 ? 134.484 257.400 269.399 1.00 120.39 242 Bj 1 
ATOM 1467 N N   . PHE Q 17 243 ? 134.612 261.172 271.876 1.00 125.10 243 Bj 1 
ATOM 1468 C CA  . PHE Q 17 243 ? 134.205 261.109 273.274 1.00 125.10 243 Bj 1 
ATOM 1469 C C   . PHE Q 17 243 ? 132.791 260.548 273.376 1.00 125.10 243 Bj 1 
ATOM 1470 O O   . PHE Q 17 243 ? 131.858 261.086 272.771 1.00 125.10 243 Bj 1 
ATOM 1471 C CB  . PHE Q 17 243 ? 134.284 262.493 273.916 1.00 125.10 243 Bj 1 
ATOM 1472 C CG  . PHE Q 17 243 ? 133.967 262.500 275.384 1.00 125.10 243 Bj 1 
ATOM 1473 C CD1 . PHE Q 17 243 ? 134.948 262.216 276.319 1.00 125.10 243 Bj 1 
ATOM 1474 C CD2 . PHE Q 17 243 ? 132.690 262.797 275.830 1.00 125.10 243 Bj 1 
ATOM 1475 C CE1 . PHE Q 17 243 ? 134.661 262.224 277.670 1.00 125.10 243 Bj 1 
ATOM 1476 C CE2 . PHE Q 17 243 ? 132.398 262.805 277.179 1.00 125.10 243 Bj 1 
ATOM 1477 C CZ  . PHE Q 17 243 ? 133.384 262.518 278.100 1.00 125.10 243 Bj 1 
ATOM 1478 N N   . SER Q 17 244 ? 132.637 259.471 274.141 1.00 130.58 244 Bj 1 
ATOM 1479 C CA  . SER Q 17 244 ? 131.334 258.873 274.383 1.00 130.58 244 Bj 1 
ATOM 1480 C C   . SER Q 17 244 ? 130.729 259.423 275.668 1.00 130.58 244 Bj 1 
ATOM 1481 O O   . SER Q 17 244 ? 131.444 259.824 276.591 1.00 130.58 244 Bj 1 
ATOM 1482 C CB  . SER Q 17 244 ? 131.443 257.349 274.467 1.00 130.58 244 Bj 1 
ATOM 1483 O OG  . SER Q 17 244 ? 130.182 256.759 274.733 1.00 130.58 244 Bj 1 
ATOM 1484 N N   . GLN Q 17 245 ? 129.395 259.434 275.717 1.00 128.80 245 Bj 1 
ATOM 1485 C CA  . GLN Q 17 245 ? 128.640 259.945 276.861 1.00 128.80 245 Bj 1 
ATOM 1486 C C   . GLN Q 17 245 ? 129.024 261.398 277.157 1.00 128.80 245 Bj 1 
ATOM 1487 O O   . GLN Q 17 245 ? 129.573 261.730 278.209 1.00 128.80 245 Bj 1 
ATOM 1488 C CB  . GLN Q 17 245 ? 128.834 259.050 278.092 1.00 128.80 245 Bj 1 
ATOM 1489 C CG  . GLN Q 17 245 ? 127.890 259.349 279.253 1.00 128.80 245 Bj 1 
ATOM 1490 C CD  . GLN Q 17 245 ? 126.435 259.074 278.920 1.00 128.80 245 Bj 1 
ATOM 1491 O OE1 . GLN Q 17 245 ? 126.126 258.253 278.055 1.00 128.80 245 Bj 1 
ATOM 1492 N NE2 . GLN Q 17 245 ? 125.531 259.762 279.608 1.00 128.80 245 Bj 1 
ATOM 1493 N N   . ALA Q 17 246 ? 128.731 262.266 276.186 1.00 127.68 246 Bj 1 
ATOM 1494 C CA  . ALA Q 17 246 ? 129.038 263.683 276.337 1.00 127.68 246 Bj 1 
ATOM 1495 C C   . ALA Q 17 246 ? 128.140 264.366 277.359 1.00 127.68 246 Bj 1 
ATOM 1496 O O   . ALA Q 17 246 ? 128.472 265.463 277.821 1.00 127.68 246 Bj 1 
ATOM 1497 C CB  . ALA Q 17 246 ? 128.926 264.394 274.987 1.00 127.68 246 Bj 1 
ATOM 1498 N N   . GLY Q 17 247 ? 127.018 263.748 277.720 1.00 128.61 247 Bj 1 
ATOM 1499 C CA  . GLY Q 17 247 ? 126.115 264.325 278.695 1.00 128.61 247 Bj 1 
ATOM 1500 C C   . GLY Q 17 247 ? 126.252 263.710 280.072 1.00 128.61 247 Bj 1 
ATOM 1501 O O   . GLY Q 17 247 ? 125.267 263.595 280.808 1.00 128.61 247 Bj 1 
ATOM 1502 N N   . LYS Q 17 248 ? 127.468 263.311 280.433 1.00 125.96 248 Bj 1 
ATOM 1503 C CA  . LYS Q 17 248 ? 127.713 262.724 281.739 1.00 125.96 248 Bj 1 
ATOM 1504 C C   . LYS Q 17 248 ? 127.891 263.817 282.791 1.00 125.96 248 Bj 1 
ATOM 1505 O O   . LYS Q 17 248 ? 127.941 265.012 282.488 1.00 125.96 248 Bj 1 
ATOM 1506 C CB  . LYS Q 17 248 ? 128.946 261.822 281.702 1.00 125.96 248 Bj 1 
ATOM 1507 C CG  . LYS Q 17 248 ? 130.258 262.572 281.540 1.00 125.96 248 Bj 1 
ATOM 1508 C CD  . LYS Q 17 248 ? 131.448 261.630 281.626 1.00 125.96 248 Bj 1 
ATOM 1509 C CE  . LYS Q 17 248 ? 132.761 262.393 281.596 1.00 125.96 248 Bj 1 
ATOM 1510 N NZ  . LYS Q 17 248 ? 133.934 261.479 281.668 1.00 125.96 248 Bj 1 
ATOM 1511 N N   . LYS Q 17 249 ? 127.991 263.389 284.050 1.00 120.94 249 Bj 1 
ATOM 1512 C CA  . LYS Q 17 249 ? 128.204 264.319 285.150 1.00 120.94 249 Bj 1 
ATOM 1513 C C   . LYS Q 17 249 ? 129.630 264.849 285.213 1.00 120.94 249 Bj 1 
ATOM 1514 O O   . LYS Q 17 249 ? 129.879 265.823 285.932 1.00 120.94 249 Bj 1 
ATOM 1515 C CB  . LYS Q 17 249 ? 127.843 263.653 286.481 1.00 120.94 249 Bj 1 
ATOM 1516 C CG  . LYS Q 17 249 ? 126.360 263.355 286.649 1.00 120.94 249 Bj 1 
ATOM 1517 C CD  . LYS Q 17 249 ? 125.530 264.631 286.660 1.00 120.94 249 Bj 1 
ATOM 1518 C CE  . LYS Q 17 249 ? 124.617 264.713 285.447 1.00 120.94 249 Bj 1 
ATOM 1519 N NZ  . LYS Q 17 249 ? 123.811 265.964 285.445 1.00 120.94 249 Bj 1 
ATOM 1520 N N   . GLY Q 17 250 ? 130.565 264.239 284.488 1.00 123.18 250 Bj 1 
ATOM 1521 C CA  . GLY Q 17 250 ? 131.923 264.742 284.431 1.00 123.18 250 Bj 1 
ATOM 1522 C C   . GLY Q 17 250 ? 132.013 266.047 283.669 1.00 123.18 250 Bj 1 
ATOM 1523 O O   . GLY Q 17 250 ? 131.833 266.074 282.448 1.00 123.18 250 Bj 1 
ATOM 1524 N N   . HIS Q 17 251 ? 132.289 267.138 284.379 1.00 125.29 251 Bj 1 
ATOM 1525 C CA  . HIS Q 17 251 ? 132.322 268.470 283.778 1.00 125.29 251 Bj 1 
ATOM 1526 C C   . HIS Q 17 251 ? 133.687 268.686 283.137 1.00 125.29 251 Bj 1 
ATOM 1527 O O   . HIS Q 17 251 ? 134.647 269.104 283.786 1.00 125.29 251 Bj 1 
ATOM 1528 C CB  . HIS Q 17 251 ? 132.019 269.538 284.821 1.00 125.29 251 Bj 1 
ATOM 1529 C CG  . HIS Q 17 251 ? 130.737 269.315 285.560 1.00 125.29 251 Bj 1 
ATOM 1530 N ND1 . HIS Q 17 251 ? 129.511 269.688 285.053 1.00 125.29 251 Bj 1 
ATOM 1531 C CD2 . HIS Q 17 251 ? 130.489 268.757 286.769 1.00 125.29 251 Bj 1 
ATOM 1532 C CE1 . HIS Q 17 251 ? 128.563 269.370 285.917 1.00 125.29 251 Bj 1 
ATOM 1533 N NE2 . HIS Q 17 251 ? 129.131 268.803 286.966 1.00 125.29 251 Bj 1 
ATOM 1534 N N   . HIS Q 17 252 ? 133.771 268.392 281.842 1.00 117.65 252 Bj 1 
ATOM 1535 C CA  . HIS Q 17 252 ? 134.965 268.633 281.044 1.00 117.65 252 Bj 1 
ATOM 1536 C C   . HIS Q 17 252 ? 134.674 269.751 280.053 1.00 117.65 252 Bj 1 
ATOM 1537 O O   . HIS Q 17 252 ? 133.661 269.713 279.348 1.00 117.65 252 Bj 1 
ATOM 1538 C CB  . HIS Q 17 252 ? 135.405 267.363 280.309 1.00 117.65 252 Bj 1 
ATOM 1539 C CG  . HIS Q 17 252 ? 134.422 266.883 279.289 1.00 117.65 252 Bj 1 
ATOM 1540 N ND1 . HIS Q 17 252 ? 133.315 266.131 279.617 1.00 117.65 252 Bj 1 
ATOM 1541 C CD2 . HIS Q 17 252 ? 134.377 267.051 277.946 1.00 117.65 252 Bj 1 
ATOM 1542 C CE1 . HIS Q 17 252 ? 132.631 265.856 278.521 1.00 117.65 252 Bj 1 
ATOM 1543 N NE2 . HIS Q 17 252 ? 133.254 266.403 277.493 1.00 117.65 252 Bj 1 
ATOM 1544 N N   . VAL Q 17 253 ? 135.556 270.746 280.008 1.00 119.25 253 Bj 1 
ATOM 1545 C CA  . VAL Q 17 253 ? 135.344 271.959 279.228 1.00 119.25 253 Bj 1 
ATOM 1546 C C   . VAL Q 17 253 ? 136.541 272.173 278.314 1.00 119.25 253 Bj 1 
ATOM 1547 O O   . VAL Q 17 253 ? 137.691 272.100 278.762 1.00 119.25 253 Bj 1 
ATOM 1548 C CB  . VAL Q 17 253 ? 135.137 273.190 280.131 1.00 119.25 253 Bj 1 
ATOM 1549 C CG1 . VAL Q 17 253 ? 134.861 274.428 279.291 1.00 119.25 253 Bj 1 
ATOM 1550 C CG2 . VAL Q 17 253 ? 134.007 272.948 281.121 1.00 119.25 253 Bj 1 
ATOM 1551 N N   . TRP Q 17 254 ? 136.269 272.431 277.036 1.00 115.00 254 Bj 1 
ATOM 1552 C CA  . TRP Q 17 254 ? 137.283 272.897 276.101 1.00 115.00 254 Bj 1 
ATOM 1553 C C   . TRP Q 17 254 ? 137.325 274.418 276.147 1.00 115.00 254 Bj 1 
ATOM 1554 O O   . TRP Q 17 254 ? 136.330 275.082 275.836 1.00 115.00 254 Bj 1 
ATOM 1555 C CB  . TRP Q 17 254 ? 136.987 272.415 274.681 1.00 115.00 254 Bj 1 
ATOM 1556 C CG  . TRP Q 17 254 ? 136.967 270.928 274.547 1.00 115.00 254 Bj 1 
ATOM 1557 C CD1 . TRP Q 17 254 ? 135.876 270.139 274.334 1.00 115.00 254 Bj 1 
ATOM 1558 C CD2 . TRP Q 17 254 ? 138.092 270.046 274.625 1.00 115.00 254 Bj 1 
ATOM 1559 N NE1 . TRP Q 17 254 ? 136.251 268.819 274.269 1.00 115.00 254 Bj 1 
ATOM 1560 C CE2 . TRP Q 17 254 ? 137.607 268.735 274.446 1.00 115.00 254 Bj 1 
ATOM 1561 C CE3 . TRP Q 17 254 ? 139.461 270.236 274.827 1.00 115.00 254 Bj 1 
ATOM 1562 C CZ2 . TRP Q 17 254 ? 138.443 267.622 274.463 1.00 115.00 254 Bj 1 
ATOM 1563 C CZ3 . TRP Q 17 254 ? 140.289 269.130 274.842 1.00 115.00 254 Bj 1 
ATOM 1564 C CH2 . TRP Q 17 254 ? 139.778 267.840 274.662 1.00 115.00 254 Bj 1 
ATOM 1565 N N   . VAL Q 17 255 ? 138.473 274.965 276.535 1.00 119.35 255 Bj 1 
ATOM 1566 C CA  . VAL Q 17 255 ? 138.586 276.379 276.870 1.00 119.35 255 Bj 1 
ATOM 1567 C C   . VAL Q 17 255 ? 139.797 276.969 276.160 1.00 119.35 255 Bj 1 
ATOM 1568 O O   . VAL Q 17 255 ? 140.791 276.276 275.919 1.00 119.35 255 Bj 1 
ATOM 1569 C CB  . VAL Q 17 255 ? 138.678 276.575 278.400 1.00 119.35 255 Bj 1 
ATOM 1570 C CG1 . VAL Q 17 255 ? 139.988 276.026 278.940 1.00 119.35 255 Bj 1 
ATOM 1571 C CG2 . VAL Q 17 255 ? 138.506 278.030 278.766 1.00 119.35 255 Bj 1 
ATOM 1572 N N   . SER Q 17 256 ? 139.702 278.248 275.804 1.00 122.61 256 Bj 1 
ATOM 1573 C CA  . SER Q 17 256 ? 140.792 278.967 275.164 1.00 122.61 256 Bj 1 
ATOM 1574 C C   . SER Q 17 256 ? 141.580 279.743 276.219 1.00 122.61 256 Bj 1 
ATOM 1575 O O   . SER Q 17 256 ? 141.375 279.576 277.423 1.00 122.61 256 Bj 1 
ATOM 1576 C CB  . SER Q 17 256 ? 140.249 279.877 274.066 1.00 122.61 256 Bj 1 
ATOM 1577 O OG  . SER Q 17 256 ? 141.298 280.548 273.390 1.00 122.61 256 Bj 1 
ATOM 1578 N N   . LYS Q 17 257 ? 142.489 280.613 275.772 1.00 127.00 257 Bj 1 
ATOM 1579 C CA  . LYS Q 17 257 ? 143.375 281.318 276.695 1.00 127.00 257 Bj 1 
ATOM 1580 C C   . LYS Q 17 257 ? 142.610 282.285 277.595 1.00 127.00 257 Bj 1 
ATOM 1581 O O   . LYS Q 17 257 ? 142.840 282.324 278.811 1.00 127.00 257 Bj 1 
ATOM 1582 C CB  . LYS Q 17 257 ? 144.455 282.054 275.899 1.00 127.00 257 Bj 1 
ATOM 1583 C CG  . LYS Q 17 257 ? 144.923 283.367 276.506 1.00 127.00 257 Bj 1 
ATOM 1584 C CD  . LYS Q 17 257 ? 146.041 283.168 277.511 1.00 127.00 257 Bj 1 
ATOM 1585 C CE  . LYS Q 17 257 ? 146.569 284.511 277.993 1.00 127.00 257 Bj 1 
ATOM 1586 N NZ  . LYS Q 17 257 ? 147.753 284.372 278.882 1.00 127.00 257 Bj 1 
ATOM 1587 N N   . GLU Q 17 258 ? 141.695 283.069 277.021 1.00 126.69 258 Bj 1 
ATOM 1588 C CA  . GLU Q 17 258 ? 141.007 284.103 277.788 1.00 126.69 258 Bj 1 
ATOM 1589 C C   . GLU Q 17 258 ? 140.134 283.494 278.880 1.00 126.69 258 Bj 1 
ATOM 1590 O O   . GLU Q 17 258 ? 140.313 283.776 280.071 1.00 126.69 258 Bj 1 
ATOM 1591 C CB  . GLU Q 17 258 ? 140.173 284.979 276.851 1.00 126.69 258 Bj 1 
ATOM 1592 C CG  . GLU Q 17 258 ? 140.982 285.777 275.834 1.00 126.69 258 Bj 1 
ATOM 1593 C CD  . GLU Q 17 258 ? 141.362 284.971 274.602 1.00 126.69 258 Bj 1 
ATOM 1594 O OE1 . GLU Q 17 258 ? 141.635 283.760 274.732 1.00 126.69 258 Bj 1 
ATOM 1595 O OE2 . GLU Q 17 258 ? 141.381 285.553 273.498 1.00 126.69 258 Bj 1 
ATOM 1596 N N   . GLU Q 17 259 ? 139.174 282.652 278.490 1.00 129.80 259 Bj 1 
ATOM 1597 C CA  . GLU Q 17 259 ? 138.332 281.997 279.482 1.00 129.80 259 Bj 1 
ATOM 1598 C C   . GLU Q 17 259 ? 139.126 281.043 280.365 1.00 129.80 259 Bj 1 
ATOM 1599 O O   . GLU Q 17 259 ? 138.712 280.779 281.498 1.00 129.80 259 Bj 1 
ATOM 1600 C CB  . GLU Q 17 259 ? 137.179 281.259 278.797 1.00 129.80 259 Bj 1 
ATOM 1601 C CG  . GLU Q 17 259 ? 136.278 282.148 277.950 1.00 129.80 259 Bj 1 
ATOM 1602 C CD  . GLU Q 17 259 ? 136.700 282.197 276.494 1.00 129.80 259 Bj 1 
ATOM 1603 O OE1 . GLU Q 17 259 ? 137.140 281.154 275.965 1.00 129.80 259 Bj 1 
ATOM 1604 O OE2 . GLU Q 17 259 ? 136.592 283.278 275.878 1.00 129.80 259 Bj 1 
ATOM 1605 N N   . LEU Q 17 260 ? 140.270 280.549 279.888 1.00 130.83 260 Bj 1 
ATOM 1606 C CA  . LEU Q 17 260 ? 141.148 279.742 280.729 1.00 130.83 260 Bj 1 
ATOM 1607 C C   . LEU Q 17 260 ? 141.669 280.562 281.901 1.00 130.83 260 Bj 1 
ATOM 1608 O O   . LEU Q 17 260 ? 141.580 280.142 283.062 1.00 130.83 260 Bj 1 
ATOM 1609 C CB  . LEU Q 17 260 ? 142.301 279.197 279.882 1.00 130.83 260 Bj 1 
ATOM 1610 C CG  . LEU Q 17 260 ? 143.280 278.143 280.407 1.00 130.83 260 Bj 1 
ATOM 1611 C CD1 . LEU Q 17 260 ? 143.986 277.497 279.232 1.00 130.83 260 Bj 1 
ATOM 1612 C CD2 . LEU Q 17 260 ? 144.307 278.740 281.346 1.00 130.83 260 Bj 1 
ATOM 1613 N N   . GLY Q 17 261 ? 142.232 281.735 281.610 1.00 132.72 261 Bj 1 
ATOM 1614 C CA  . GLY Q 17 261 ? 142.661 282.625 282.674 1.00 132.72 261 Bj 1 
ATOM 1615 C C   . GLY Q 17 261 ? 141.510 283.111 283.530 1.00 132.72 261 Bj 1 
ATOM 1616 O O   . GLY Q 17 261 ? 141.689 283.389 284.720 1.00 132.72 261 Bj 1 
ATOM 1617 N N   . ASP Q 17 262 ? 140.317 283.220 282.943 1.00 135.25 262 Bj 1 
ATOM 1618 C CA  . ASP Q 17 262 ? 139.148 283.630 283.717 1.00 135.25 262 Bj 1 
ATOM 1619 C C   . ASP Q 17 262 ? 138.742 282.558 284.722 1.00 135.25 262 Bj 1 
ATOM 1620 O O   . ASP Q 17 262 ? 138.354 282.874 285.853 1.00 135.25 262 Bj 1 
ATOM 1621 C CB  . ASP Q 17 262 ? 137.986 283.951 282.778 1.00 135.25 262 Bj 1 
ATOM 1622 C CG  . ASP Q 17 262 ? 136.680 284.169 283.519 1.00 135.25 262 Bj 1 
ATOM 1623 O OD1 . ASP Q 17 262 ? 136.568 285.178 284.246 1.00 135.25 262 Bj 1 
ATOM 1624 O OD2 . ASP Q 17 262 ? 135.764 283.332 283.373 1.00 135.25 262 Bj 1 
ATOM 1625 N N   . TYR Q 17 263 ? 138.823 281.286 284.330 1.00 135.63 263 Bj 1 
ATOM 1626 C CA  . TYR Q 17 263 ? 138.387 280.204 285.207 1.00 135.63 263 Bj 1 
ATOM 1627 C C   . TYR Q 17 263 ? 139.450 279.853 286.242 1.00 135.63 263 Bj 1 
ATOM 1628 O O   . TYR Q 17 263 ? 139.148 279.738 287.435 1.00 135.63 263 Bj 1 
ATOM 1629 C CB  . TYR Q 17 263 ? 138.020 278.968 284.383 1.00 135.63 263 Bj 1 
ATOM 1630 C CG  . TYR Q 17 263 ? 136.748 279.113 283.580 1.00 135.63 263 Bj 1 
ATOM 1631 C CD1 . TYR Q 17 263 ? 136.444 278.220 282.560 1.00 135.63 263 Bj 1 
ATOM 1632 C CD2 . TYR Q 17 263 ? 135.849 280.139 283.842 1.00 135.63 263 Bj 1 
ATOM 1633 C CE1 . TYR Q 17 263 ? 135.282 278.346 281.823 1.00 135.63 263 Bj 1 
ATOM 1634 C CE2 . TYR Q 17 263 ? 134.685 280.272 283.109 1.00 135.63 263 Bj 1 
ATOM 1635 C CZ  . TYR Q 17 263 ? 134.407 279.373 282.101 1.00 135.63 263 Bj 1 
ATOM 1636 O OH  . TYR Q 17 263 ? 133.250 279.500 281.367 1.00 135.63 263 Bj 1 
ATOM 1637 N N   . LEU Q 17 264 ? 140.698 279.676 285.808 1.00 134.80 264 Bj 1 
ATOM 1638 C CA  . LEU Q 17 264 ? 141.750 279.206 286.706 1.00 134.80 264 Bj 1 
ATOM 1639 C C   . LEU Q 17 264 ? 142.092 280.291 287.720 1.00 134.80 264 Bj 1 
ATOM 1640 O O   . LEU Q 17 264 ? 142.757 281.278 287.390 1.00 134.80 264 Bj 1 
ATOM 1641 C CB  . LEU Q 17 264 ? 142.981 278.790 285.908 1.00 134.80 264 Bj 1 
ATOM 1642 C CG  . LEU Q 17 264 ? 142.804 277.524 285.068 1.00 134.80 264 Bj 1 
ATOM 1643 C CD1 . LEU Q 17 264 ? 144.129 277.063 284.492 1.00 134.80 264 Bj 1 
ATOM 1644 C CD2 . LEU Q 17 264 ? 142.169 276.422 285.898 1.00 134.80 264 Bj 1 
ATOM 1645 N N   . LYS Q 17 265 ? 141.633 280.107 288.955 1.00 137.65 265 Bj 1 
ATOM 1646 C CA  . LYS Q 17 265 ? 141.877 281.041 290.049 1.00 137.65 265 Bj 1 
ATOM 1647 C C   . LYS Q 17 265 ? 143.260 280.904 290.689 1.00 137.65 265 Bj 1 
ATOM 1648 O O   . LYS Q 17 265 ? 143.947 281.921 290.850 1.00 137.65 265 Bj 1 
ATOM 1649 C CB  . LYS Q 17 265 ? 140.794 280.889 291.122 1.00 137.65 265 Bj 1 
ATOM 1650 C CG  . LYS Q 17 265 ? 140.067 279.555 291.107 1.00 137.65 265 Bj 1 
ATOM 1651 C CD  . LYS Q 17 265 ? 139.195 279.392 292.339 1.00 137.65 265 Bj 1 
ATOM 1652 C CE  . LYS Q 17 265 ? 140.022 279.484 293.612 1.00 137.65 265 Bj 1 
ATOM 1653 N NZ  . LYS Q 17 265 ? 141.088 278.445 293.660 1.00 137.65 265 Bj 1 
ATOM 1654 N N   . PRO Q 17 266 ? 143.720 279.709 291.071 1.00 140.01 266 Bj 1 
ATOM 1655 C CA  . PRO Q 17 266 ? 144.940 279.634 291.881 1.00 140.01 266 Bj 1 
ATOM 1656 C C   . PRO Q 17 266 ? 146.183 279.907 291.050 1.00 140.01 266 Bj 1 
ATOM 1657 O O   . PRO Q 17 266 ? 146.185 279.801 289.822 1.00 140.01 266 Bj 1 
ATOM 1658 C CB  . PRO Q 17 266 ? 144.937 278.195 292.416 1.00 140.01 266 Bj 1 
ATOM 1659 C CG  . PRO Q 17 266 ? 143.732 277.520 291.808 1.00 140.01 266 Bj 1 
ATOM 1660 C CD  . PRO Q 17 266 ? 143.299 278.360 290.659 1.00 140.01 266 Bj 1 
ATOM 1661 N N   . LYS Q 17 267 ? 147.260 280.264 291.753 1.00 148.42 267 Bj 1 
ATOM 1662 C CA  . LYS Q 17 267 ? 148.508 280.602 291.080 1.00 148.42 267 Bj 1 
ATOM 1663 C C   . LYS Q 17 267 ? 149.209 279.379 290.506 1.00 148.42 267 Bj 1 
ATOM 1664 O O   . LYS Q 17 267 ? 150.039 279.526 289.603 1.00 148.42 267 Bj 1 
ATOM 1665 C CB  . LYS Q 17 267 ? 149.447 281.333 292.041 1.00 148.42 267 Bj 1 
ATOM 1666 C CG  . LYS Q 17 267 ? 149.947 280.481 293.195 1.00 148.42 267 Bj 1 
ATOM 1667 C CD  . LYS Q 17 267 ? 150.971 281.233 294.030 1.00 148.42 267 Bj 1 
ATOM 1668 C CE  . LYS Q 17 267 ? 151.539 280.354 295.132 1.00 148.42 267 Bj 1 
ATOM 1669 N NZ  . LYS Q 17 267 ? 152.570 281.070 295.935 1.00 148.42 267 Bj 1 
ATOM 1670 N N   . TYR Q 17 268 ? 148.900 278.181 291.005 1.00 155.87 268 Bj 1 
ATOM 1671 C CA  . TYR Q 17 268 ? 149.550 276.982 290.487 1.00 155.87 268 Bj 1 
ATOM 1672 C C   . TYR Q 17 268 ? 149.064 276.652 289.082 1.00 155.87 268 Bj 1 
ATOM 1673 O O   . TYR Q 17 268 ? 149.833 276.147 288.255 1.00 155.87 268 Bj 1 
ATOM 1674 C CB  . TYR Q 17 268 ? 149.315 275.807 291.434 1.00 155.87 268 Bj 1 
ATOM 1675 C CG  . TYR Q 17 268 ? 149.991 275.984 292.771 1.00 155.87 268 Bj 1 
ATOM 1676 C CD1 . TYR Q 17 268 ? 151.334 275.678 292.934 1.00 155.87 268 Bj 1 
ATOM 1677 C CD2 . TYR Q 17 268 ? 149.290 276.466 293.867 1.00 155.87 268 Bj 1 
ATOM 1678 C CE1 . TYR Q 17 268 ? 151.960 275.843 294.150 1.00 155.87 268 Bj 1 
ATOM 1679 C CE2 . TYR Q 17 268 ? 149.907 276.633 295.090 1.00 155.87 268 Bj 1 
ATOM 1680 C CZ  . TYR Q 17 268 ? 151.242 276.319 295.225 1.00 155.87 268 Bj 1 
ATOM 1681 O OH  . TYR Q 17 268 ? 151.863 276.483 296.440 1.00 155.87 268 Bj 1 
ATOM 1682 N N   . LEU Q 17 269 ? 147.796 276.926 288.793 1.00 143.98 269 Bj 1 
ATOM 1683 C CA  . LEU Q 17 269 ? 147.256 276.720 287.458 1.00 143.98 269 Bj 1 
ATOM 1684 C C   . LEU Q 17 269 ? 147.228 277.995 286.627 1.00 143.98 269 Bj 1 
ATOM 1685 O O   . LEU Q 17 269 ? 147.115 277.912 285.399 1.00 143.98 269 Bj 1 
ATOM 1686 C CB  . LEU Q 17 269 ? 145.845 276.130 287.545 1.00 143.98 269 Bj 1 
ATOM 1687 C CG  . LEU Q 17 269 ? 145.752 274.727 288.149 1.00 143.98 269 Bj 1 
ATOM 1688 C CD1 . LEU Q 17 269 ? 144.310 274.253 288.179 1.00 143.98 269 Bj 1 
ATOM 1689 C CD2 . LEU Q 17 269 ? 146.624 273.751 287.375 1.00 143.98 269 Bj 1 
ATOM 1690 N N   . ALA Q 17 270 ? 147.339 279.164 287.255 1.00 137.42 270 Bj 1 
ATOM 1691 C CA  . ALA Q 17 270 ? 147.361 280.426 286.528 1.00 137.42 270 Bj 1 
ATOM 1692 C C   . ALA Q 17 270 ? 148.680 280.671 285.810 1.00 137.42 270 Bj 1 
ATOM 1693 O O   . ALA Q 17 270 ? 148.785 281.646 285.059 1.00 137.42 270 Bj 1 
ATOM 1694 C CB  . ALA Q 17 270 ? 147.068 281.588 287.482 1.00 137.42 270 Bj 1 
ATOM 1695 N N   . GLN Q 17 271 ? 149.681 279.820 286.021 1.00 132.72 271 Bj 1 
ATOM 1696 C CA  . GLN Q 17 271 ? 150.970 279.944 285.357 1.00 132.72 271 Bj 1 
ATOM 1697 C C   . GLN Q 17 271 ? 151.126 278.967 284.199 1.00 132.72 271 Bj 1 
ATOM 1698 O O   . GLN Q 17 271 ? 152.241 278.789 283.699 1.00 132.72 271 Bj 1 
ATOM 1699 C CB  . GLN Q 17 271 ? 152.102 279.749 286.366 1.00 132.72 271 Bj 1 
ATOM 1700 C CG  . GLN Q 17 271 ? 152.097 280.762 287.495 1.00 132.72 271 Bj 1 
ATOM 1701 C CD  . GLN Q 17 271 ? 153.182 280.502 288.519 1.00 132.72 271 Bj 1 
ATOM 1702 O OE1 . GLN Q 17 271 ? 154.178 279.838 288.232 1.00 132.72 271 Bj 1 
ATOM 1703 N NE2 . GLN Q 17 271 ? 152.994 281.024 289.725 1.00 132.72 271 Bj 1 
ATOM 1704 N N   . VAL Q 17 272 ? 150.038 278.325 283.767 1.00 127.77 272 Bj 1 
ATOM 1705 C CA  . VAL Q 17 272 ? 150.113 277.466 282.590 1.00 127.77 272 Bj 1 
ATOM 1706 C C   . VAL Q 17 272 ? 150.313 278.305 281.335 1.00 127.77 272 Bj 1 
ATOM 1707 O O   . VAL Q 17 272 ? 150.913 277.842 280.356 1.00 127.77 272 Bj 1 
ATOM 1708 C CB  . VAL Q 17 272 ? 148.858 276.577 282.494 1.00 127.77 272 Bj 1 
ATOM 1709 C CG1 . VAL Q 17 272 ? 147.619 277.418 282.237 1.00 127.77 272 Bj 1 
ATOM 1710 C CG2 . VAL Q 17 272 ? 149.029 275.519 281.414 1.00 127.77 272 Bj 1 
ATOM 1711 N N   . ARG Q 17 273 ? 149.836 279.552 281.344 1.00 126.48 273 Bj 1 
ATOM 1712 C CA  . ARG Q 17 273 ? 150.044 280.452 280.218 1.00 126.48 273 Bj 1 
ATOM 1713 C C   . ARG Q 17 273 ? 151.496 280.886 280.074 1.00 126.48 273 Bj 1 
ATOM 1714 O O   . ARG Q 17 273 ? 151.838 281.516 279.067 1.00 126.48 273 Bj 1 
ATOM 1715 C CB  . ARG Q 17 273 ? 149.146 281.684 280.353 1.00 126.48 273 Bj 1 
ATOM 1716 C CG  . ARG Q 17 273 ? 147.662 281.390 280.204 1.00 126.48 273 Bj 1 
ATOM 1717 C CD  . ARG Q 17 273 ? 146.993 281.126 281.543 1.00 126.48 273 Bj 1 
ATOM 1718 N NE  . ARG Q 17 273 ? 146.890 282.333 282.357 1.00 126.48 273 Bj 1 
ATOM 1719 C CZ  . ARG Q 17 273 ? 146.190 282.414 283.484 1.00 126.48 273 Bj 1 
ATOM 1720 N NH1 . ARG Q 17 273 ? 145.525 281.357 283.930 1.00 126.48 273 Bj 1 
ATOM 1721 N NH2 . ARG Q 17 273 ? 146.150 283.552 284.163 1.00 126.48 273 Bj 1 
ATOM 1722 N N   . ARG Q 17 274 ? 152.349 280.573 281.051 1.00 119.98 274 Bj 1 
ATOM 1723 C CA  . ARG Q 17 274 ? 153.770 280.876 280.920 1.00 119.98 274 Bj 1 
ATOM 1724 C C   . ARG Q 17 274 ? 154.394 280.073 279.786 1.00 119.98 274 Bj 1 
ATOM 1725 O O   . ARG Q 17 274 ? 155.151 280.611 278.970 1.00 119.98 274 Bj 1 
ATOM 1726 C CB  . ARG Q 17 274 ? 154.489 280.596 282.239 1.00 119.98 274 Bj 1 
ATOM 1727 C CG  . ARG Q 17 274 ? 155.996 280.753 282.164 1.00 119.98 274 Bj 1 
ATOM 1728 C CD  . ARG Q 17 274 ? 156.653 280.440 283.497 1.00 119.98 274 Bj 1 
ATOM 1729 N NE  . ARG Q 17 274 ? 158.106 280.552 283.422 1.00 119.98 274 Bj 1 
ATOM 1730 C CZ  . ARG Q 17 274 ? 158.925 280.351 284.449 1.00 119.98 274 Bj 1 
ATOM 1731 N NH1 . ARG Q 17 274 ? 158.434 280.026 285.638 1.00 119.98 274 Bj 1 
ATOM 1732 N NH2 . ARG Q 17 274 ? 160.236 280.475 284.288 1.00 119.98 274 Bj 1 
ATOM 1733 N N   . PHE Q 17 275 ? 154.086 278.781 279.719 1.00 124.86 275 Bj 1 
ATOM 1734 C CA  . PHE Q 17 275 ? 154.571 277.923 278.649 1.00 124.86 275 Bj 1 
ATOM 1735 C C   . PHE Q 17 275 ? 153.499 277.598 277.619 1.00 124.86 275 Bj 1 
ATOM 1736 O O   . PHE Q 17 275 ? 153.784 276.886 276.652 1.00 124.86 275 Bj 1 
ATOM 1737 C CB  . PHE Q 17 275 ? 155.151 276.626 279.226 1.00 124.86 275 Bj 1 
ATOM 1738 C CG  . PHE Q 17 275 ? 154.189 275.853 280.081 1.00 124.86 275 Bj 1 
ATOM 1739 C CD1 . PHE Q 17 275 ? 153.410 274.846 279.535 1.00 124.86 275 Bj 1 
ATOM 1740 C CD2 . PHE Q 17 275 ? 154.073 276.123 281.434 1.00 124.86 275 Bj 1 
ATOM 1741 C CE1 . PHE Q 17 275 ? 152.527 274.130 280.320 1.00 124.86 275 Bj 1 
ATOM 1742 C CE2 . PHE Q 17 275 ? 153.191 275.411 282.224 1.00 124.86 275 Bj 1 
ATOM 1743 C CZ  . PHE Q 17 275 ? 152.418 274.412 281.666 1.00 124.86 275 Bj 1 
ATOM 1744 N N   . LEU Q 17 276 ? 152.279 278.098 277.799 1.00 117.83 276 Bj 1 
ATOM 1745 C CA  . LEU Q 17 276 ? 151.240 277.932 276.795 1.00 117.83 276 Bj 1 
ATOM 1746 C C   . LEU Q 17 276 ? 151.359 279.017 275.733 1.00 117.83 276 Bj 1 
ATOM 1747 O O   . LEU Q 17 276 ? 151.592 280.188 276.045 1.00 117.83 276 Bj 1 
ATOM 1748 C CB  . LEU Q 17 276 ? 149.857 277.977 277.444 1.00 117.83 276 Bj 1 
ATOM 1749 C CG  . LEU Q 17 276 ? 148.658 277.885 276.498 1.00 117.83 276 Bj 1 
ATOM 1750 C CD1 . LEU Q 17 276 ? 148.689 276.585 275.710 1.00 117.83 276 Bj 1 
ATOM 1751 C CD2 . LEU Q 17 276 ? 147.359 278.018 277.275 1.00 117.83 276 Bj 1 
ATOM 1752 N N   . LEU Q 17 277 ? 151.203 278.619 274.472 1.00 108.03 277 Bj 1 
ATOM 1753 C CA  . LEU Q 17 277 ? 151.313 279.567 273.372 1.00 108.03 277 Bj 1 
ATOM 1754 C C   . LEU Q 17 277 ? 150.175 280.577 273.422 1.00 108.03 277 Bj 1 
ATOM 1755 O O   . LEU Q 17 277 ? 149.048 280.245 273.802 1.00 108.03 277 Bj 1 
ATOM 1756 C CB  . LEU Q 17 277 ? 151.306 278.836 272.032 1.00 108.03 277 Bj 1 
ATOM 1757 C CG  . LEU Q 17 277 ? 152.569 278.060 271.666 1.00 108.03 277 Bj 1 
ATOM 1758 C CD1 . LEU Q 17 277 ? 152.537 277.695 270.195 1.00 108.03 277 Bj 1 
ATOM 1759 C CD2 . LEU Q 17 277 ? 153.805 278.877 271.992 1.00 108.03 277 Bj 1 
ATOM 1760 N N   . ASP Q 17 278 ? 150.474 281.816 273.030 1.00 106.80 278 Bj 1 
ATOM 1761 C CA  . ASP Q 17 278 ? 149.461 282.864 273.029 1.00 106.80 278 Bj 1 
ATOM 1762 C C   . ASP Q 17 278 ? 148.629 282.835 271.754 1.00 106.80 278 Bj 1 
ATOM 1763 O O   . ASP Q 17 278 ? 147.422 283.101 271.794 1.00 106.80 278 Bj 1 
ATOM 1764 C CB  . ASP Q 17 278 ? 150.123 284.231 273.199 1.00 106.80 278 Bj 1 
ATOM 1765 C CG  . ASP Q 17 278 ? 151.058 284.283 274.390 1.00 106.80 278 Bj 1 
ATOM 1766 O OD1 . ASP Q 17 278 ? 150.918 283.436 275.297 1.00 106.80 278 Bj 1 
ATOM 1767 O OD2 . ASP Q 17 278 ? 151.932 285.174 274.420 1.00 106.80 278 Bj 1 
ATOM 1768 N N   . LEU Q 17 279 ? 149.259 282.519 270.625 1.00 104.98 279 Bj 1 
ATOM 1769 C CA  . LEU Q 17 279 ? 148.601 282.483 269.320 1.00 104.98 279 Bj 1 
ATOM 1770 C C   . LEU Q 17 279 ? 147.938 283.817 268.987 1.00 104.98 279 Bj 1 
ATOM 1771 O O   . LEU Q 17 279 ? 148.618 284.810 268.729 1.00 104.98 279 Bj 1 
ATOM 1772 C CB  . LEU Q 17 279 ? 147.567 281.354 269.263 1.00 104.98 279 Bj 1 
ATOM 1773 C CG  . LEU Q 17 279 ? 148.068 279.941 269.566 1.00 104.98 279 Bj 1 
ATOM 1774 C CD1 . LEU Q 17 279 ? 147.007 278.919 269.200 1.00 104.98 279 Bj 1 
ATOM 1775 C CD2 . LEU Q 17 279 ? 149.365 279.652 268.834 1.00 104.98 279 Bj 1 
#


================================================
FILE: src/alphafold3/test_data/miniature_databases/pdb_mmcif/7rye.cif
================================================
data_7RYE
#
_entry.id 7RYE
#
loop_
_chem_comp.formula
_chem_comp.formula_weight
_chem_comp.id
_chem_comp.mon_nstd_flag
_chem_comp.name
_chem_comp.pdbx_synonyms
_chem_comp.type
"C3 H7 N O2"     89.093  ALA y ALANINE         ? "L-peptide linking" 
"C6 H15 N4 O2 1" 175.209 ARG y ARGININE        ? "L-peptide linking" 
"C4 H8 N2 O3"    132.118 ASN y ASPARAGINE      ? "L-peptide linking" 
"C4 H7 N O4"     133.103 ASP y "ASPARTIC ACID" ? "L-peptide linking" 
"C3 H7 N O2 S"   121.158 CYS y CYSTEINE        ? "L-peptide linking" 
"C5 H10 N2 O3"   146.144 GLN y GLUTAMINE       ? "L-peptide linking" 
"C5 H9 N O4"     147.129 GLU y "GLUTAMIC ACID" ? "L-peptide linking" 
"C2 H5 N O2"     75.067  GLY y GLYCINE         ? "peptide linking"   
"C6 H10 N3 O2 1" 156.162 HIS y HISTIDINE       ? "L-peptide linking" 
"C6 H13 N O2"    131.173 ILE y ISOLEUCINE      ? "L-peptide linking" 
"C6 H13 N O2"    131.173 LEU y LEUCINE         ? "L-peptide linking" 
"C6 H15 N2 O2 1" 147.195 LYS y LYSINE          ? "L-peptide linking" 
"C5 H11 N O2 S"  149.211 MET y METHIONINE      ? "L-peptide linking" 
"C9 H11 N O2"    165.189 PHE y PHENYLALANINE   ? "L-peptide linking" 
"C5 H9 N O2"     115.130 PRO y PROLINE         ? "L-peptide linking" 
"C3 H7 N O3"     105.093 SER y SERINE          ? "L-peptide linking" 
"C4 H9 N O3"     119.119 THR y THREONINE       ? "L-peptide linking" 
"C11 H12 N2 O2"  204.225 TRP y TRYPTOPHAN      ? "L-peptide linking" 
"C9 H11 N O3"    181.189 TYR y TYROSINE        ? "L-peptide linking" 
"C5 H11 N O2"    117.146 VAL y VALINE          ? "L-peptide linking" 
#
_entity.id               1
_entity.pdbx_description "Protein PrgI"
_entity.type             polymer
#
_entity_poly.entity_id      1
_entity_poly.pdbx_strand_id J
_entity_poly.type           polypeptide(L)
#
loop_
_entity_poly_seq.entity_id
_entity_poly_seq.hetero
_entity_poly_seq.mon_id
_entity_poly_seq.num
1 n MET 1  
1 n ALA 2  
1 n THR 3  
1 n PRO 4  
1 n TRP 5  
1 n SER 6  
1 n GLY 7  
1 n TYR 8  
1 n LEU 9  
1 n ASP 10 
1 n ASP 11 
1 n VAL 12 
1 n SER 13 
1 n ALA 14 
1 n LYS 15 
1 n PHE 16 
1 n ASP 17 
1 n THR 18 
1 n GLY 19 
1 n VAL 20 
1 n ASP 21 
1 n ASN 22 
1 n LEU 23 
1 n GLN 24 
1 n THR 25 
1 n GLN 26 
1 n VAL 27 
1 n THR 28 
1 n GLU 29 
1 n ALA 30 
1 n LEU 31 
1 n ASP 32 
1 n LYS 33 
1 n LEU 34 
1 n ALA 35 
1 n ALA 36 
1 n LYS 37 
1 n PRO 38 
1 n SER 39 
1 n ASP 40 
1 n PRO 41 
1 n ALA 42 
1 n LEU 43 
1 n LEU 44 
1 n ALA 45 
1 n ALA 46 
1 n TYR 47 
1 n GLN 48 
1 n SER 49 
1 n LYS 50 
1 n LEU 51 
1 n SER 52 
1 n GLU 53 
1 n TYR 54 
1 n ASN 55 
1 n LEU 56 
1 n TYR 57 
1 n ARG 58 
1 n ASN 59 
1 n ALA 60 
1 n GLN 61 
1 n SER 62 
1 n ASN 63 
1 n THR 64 
1 n VAL 65 
1 n LYS 66 
1 n VAL 67 
1 n PHE 68 
1 n LYS 69 
1 n ASP 70 
1 n ILE 71 
1 n ASP 72 
1 n ALA 73 
1 n ALA 74 
1 n ILE 75 
1 n ILE 76 
1 n GLN 77 
1 n ASN 78 
1 n PHE 79 
1 n ARG 80 
#
_exptl.method "ELECTRON MICROSCOPY"
#
_pdbx_audit_revision_history.revision_date 2021-11-10
#
_pdbx_database_status.recvd_initial_deposition_date 2021-11-10
#
loop_
_pdbx_poly_seq_scheme.asym_id
_pdbx_poly_seq_scheme.auth_seq_num
_pdbx_poly_seq_scheme.entity_id
_pdbx_poly_seq_scheme.hetero
_pdbx_poly_seq_scheme.mon_id
_pdbx_poly_seq_scheme.pdb_ins_code
_pdbx_poly_seq_scheme.pdb_seq_num
_pdbx_poly_seq_scheme.pdb_strand_id
_pdbx_poly_seq_scheme.seq_id
J ?  1 n MET . 1  J 1  
J ?  1 n ALA . 2  J 2  
J 3  1 n THR . 3  J 3  
J 4  1 n PRO . 4  J 4  
J 5  1 n TRP . 5  J 5  
J 6  1 n SER . 6  J 6  
J 7  1 n GLY . 7  J 7  
J 8  1 n TYR . 8  J 8  
J 9  1 n LEU . 9  J 9  
J 10 1 n ASP . 10 J 10 
J 11 1 n ASP . 11 J 11 
J 12 1 n VAL . 12 J 12 
J 13 1 n SER . 13 J 13 
J 14 1 n ALA . 14 J 14 
J 15 1 n LYS . 15 J 15 
J 16 1 n PHE . 16 J 16 
J 17 1 n ASP . 17 J 17 
J 18 1 n THR . 18 J 18 
J 19 1 n GLY . 19 J 19 
J 20 1 n VAL . 20 J 20 
J 21 1 n ASP . 21 J 21 
J 22 1 n ASN . 22 J 22 
J 23 1 n LEU . 23 J 23 
J 24 1 n GLN . 24 J 24 
J 25 1 n THR . 25 J 25 
J 26 1 n GLN . 26 J 26 
J 27 1 n VAL . 27 J 27 
J 28 1 n THR . 28 J 28 
J 29 1 n GLU . 29 J 29 
J 30 1 n ALA . 30 J 30 
J 31 1 n LEU . 31 J 31 
J 32 1 n ASP . 32 J 32 
J 33 1 n LYS . 33 J 33 
J 34 1 n LEU . 34 J 34 
J 35 1 n ALA . 35 J 35 
J 36 1 n ALA . 36 J 36 
J 37 1 n LYS . 37 J 37 
J 38 1 n PRO . 38 J 38 
J 39 1 n SER . 39 J 39 
J 40 1 n ASP . 40 J 40 
J 41 1 n PRO . 41 J 41 
J 42 1 n ALA . 42 J 42 
J 43 1 n LEU . 43 J 43 
J 44 1 n LEU . 44 J 44 
J 45 1 n ALA . 45 J 45 
J 46 1 n ALA . 46 J 46 
J 47 1 n TYR . 47 J 47 
J 48 1 n GLN . 48 J 48 
J 49 1 n SER . 49 J 49 
J 50 1 n LYS . 50 J 50 
J 51 1 n LEU . 51 J 51 
J 52 1 n SER . 52 J 52 
J 53 1 n GLU . 53 J 53 
J 54 1 n TYR . 54 J 54 
J 55 1 n ASN . 55 J 55 
J 56 1 n LEU . 56 J 56 
J 57 1 n TYR . 57 J 57 
J 58 1 n ARG . 58 J 58 
J 59 1 n ASN . 59 J 59 
J 60 1 n ALA . 60 J 60 
J 61 1 n GLN . 61 J 61 
J 62 1 n SER . 62 J 62 
J 63 1 n ASN . 63 J 63 
J 64 1 n THR . 64 J 64 
J 65 1 n VAL . 65 J 65 
J 66 1 n LYS . 66 J 66 
J 67 1 n VAL . 67 J 67 
J 68 1 n PHE . 68 J 68 
J 69 1 n LYS . 69 J 69 
J 70 1 n ASP . 70 J 70 
J 71 1 n ILE . 71 J 71 
J 72 1 n ASP . 72 J 72 
J 73 1 n ALA . 73 J 73 
J 74 1 n ALA . 74 J 74 
J 75 1 n ILE . 75 J 75 
J 76 1 n ILE . 76 J 76 
J 77 1 n GLN . 77 J 77 
J 78 1 n ASN . 78 J 78 
J 79 1 n PHE . 79 J 79 
J 80 1 n ARG . 80 J 80 
#
_pdbx_struct_assembly.details            author_defined_assembly
_pdbx_struct_assembly.id                 1
_pdbx_struct_assembly.method_details     ?
_pdbx_struct_assembly.oligomeric_count   24
_pdbx_struct_assembly.oligomeric_details 24-meric
#
_pdbx_struct_assembly_gen.assembly_id     1
_pdbx_struct_assembly_gen.asym_id_list    A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X
_pdbx_struct_assembly_gen.oper_expression 1
#
_pdbx_struct_oper_list.id                 1
_pdbx_struct_oper_list.matrix[1][1]       1.0000000000
_pdbx_struct_oper_list.matrix[1][2]       0.0000000000
_pdbx_struct_oper_list.matrix[1][3]       0.0000000000
_pdbx_struct_oper_list.matrix[2][1]       0.0000000000
_pdbx_struct_oper_list.matrix[2][2]       1.0000000000
_pdbx_struct_oper_list.matrix[2][3]       0.0000000000
_pdbx_struct_oper_list.matrix[3][1]       0.0000000000
_pdbx_struct_oper_list.matrix[3][2]       0.0000000000
_pdbx_struct_oper_list.matrix[3][3]       1.0000000000
_pdbx_struct_oper_list.name               1_555
_pdbx_struct_oper_list.symmetry_operation ?
_pdbx_struct_oper_list.type               "identity operation"
_pdbx_struct_oper_list.vector[1]          0.0000000000
_pdbx_struct_oper_list.vector[2]          0.0000000000
_pdbx_struct_oper_list.vector[3]          0.0000000000
#
_refine.ls_d_res_high 3.90
#
_software.classification other
_software.name           "DeepMind Structure Class"
_software.pdbx_ordinal   1
_software.version        2.0.0
#
_struct_asym.entity_id 1
_struct_asym.id        J
#
loop_
_atom_site.group_PDB
_atom_site.id
_atom_site.type_symbol
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x
_atom_site.Cartn_y
_atom_site.Cartn_z
_atom_site.occupancy
_atom_site.B_iso_or_equiv
_atom_site.auth_seq_id
_atom_site.auth_asym_id
_atom_site.pdbx_PDB_model_num
ATOM 1   N N   . THR J 1 3  ? 180.798 156.981 49.506 1.00 100.87 3  J 1 
ATOM 2   C CA  . THR J 1 3  ? 180.336 158.053 50.380 1.00 100.87 3  J 1 
ATOM 3   C C   . THR J 1 3  ? 178.888 157.811 50.811 1.00 100.87 3  J 1 
ATOM 4   O O   . THR J 1 3  ? 178.076 157.312 50.030 1.00 100.87 3  J 1 
ATOM 5   C CB  . THR J 1 3  ? 180.468 159.436 49.691 1.00 100.87 3  J 1 
ATOM 6   O OG1 . THR J 1 3  ? 180.169 160.478 50.627 1.00 100.87 3  J 1 
ATOM 7   C CG2 . THR J 1 3  ? 179.541 159.546 48.488 1.00 100.87 3  J 1 
ATOM 8   N N   . PRO J 1 4  ? 178.569 158.139 52.065 1.00 96.05  4  J 1 
ATOM 9   C CA  . PRO J 1 4  ? 177.201 157.918 52.554 1.00 96.05  4  J 1 
ATOM 10  C C   . PRO J 1 4  ? 176.203 158.873 51.924 1.00 96.05  4  J 1 
ATOM 11  O O   . PRO J 1 4  ? 176.293 160.090 52.112 1.00 96.05  4  J 1 
ATOM 12  C CB  . PRO J 1 4  ? 177.326 158.152 54.065 1.00 96.05  4  J 1 
ATOM 13  C CG  . PRO J 1 4  ? 178.504 159.047 54.212 1.00 96.05  4  J 1 
ATOM 14  C CD  . PRO J 1 4  ? 179.457 158.664 53.117 1.00 96.05  4  J 1 
ATOM 15  N N   . TRP J 1 5  ? 175.251 158.334 51.169 1.00 82.05  5  J 1 
ATOM 16  C CA  . TRP J 1 5  ? 174.242 159.172 50.543 1.00 82.05  5  J 1 
ATOM 17  C C   . TRP J 1 5  ? 173.275 159.710 51.591 1.00 82.05  5  J 1 
ATOM 18  O O   . TRP J 1 5  ? 173.068 159.105 52.647 1.00 82.05  5  J 1 
ATOM 19  C CB  . TRP J 1 5  ? 173.467 158.390 49.486 1.00 82.05  5  J 1 
ATOM 20  C CG  . TRP J 1 5  ? 172.575 159.261 48.675 1.00 82.05  5  J 1 
ATOM 21  C CD1 . TRP J 1 5  ? 172.953 160.130 47.697 1.00 82.05  5  J 1 
ATOM 22  C CD2 . TRP J 1 5  ? 171.158 159.402 48.811 1.00 82.05  5  J 1 
ATOM 23  N NE1 . TRP J 1 5  ? 171.856 160.778 47.189 1.00 82.05  5  J 1 
ATOM 24  C CE2 . TRP J 1 5  ? 170.741 160.351 47.859 1.00 82.05  5  J 1 
ATOM 25  C CE3 . TRP J 1 5  ? 170.199 158.807 49.634 1.00 82.05  5  J 1 
ATOM 26  C CZ2 . TRP J 1 5  ? 169.408 160.720 47.709 1.00 82.05  5  J 1 
ATOM 27  C CZ3 . TRP J 1 5  ? 168.877 159.176 49.482 1.00 82.05  5  J 1 
ATOM 28  C CH2 . TRP J 1 5  ? 168.493 160.120 48.527 1.00 82.05  5  J 1 
ATOM 29  N N   . SER J 1 6  ? 172.676 160.860 51.291 1.00 78.94  6  J 1 
ATOM 30  C CA  . SER J 1 6  ? 171.730 161.484 52.213 1.00 78.94  6  J 1 
ATOM 31  C C   . SER J 1 6  ? 170.799 162.391 51.422 1.00 78.94  6  J 1 
ATOM 32  O O   . SER J 1 6  ? 171.235 163.417 50.892 1.00 78.94  6  J 1 
ATOM 33  C CB  . SER J 1 6  ? 172.462 162.265 53.300 1.00 78.94  6  J 1 
ATOM 34  O OG  . SER J 1 6  ? 173.149 161.389 54.176 1.00 78.94  6  J 1 
ATOM 35  N N   . GLY J 1 7  ? 169.526 162.014 51.347 1.00 80.09  7  J 1 
ATOM 36  C CA  . GLY J 1 7  ? 168.512 162.855 50.750 1.00 80.09  7  J 1 
ATOM 37  C C   . GLY J 1 7  ? 168.082 163.958 51.698 1.00 80.09  7  J 1 
ATOM 38  O O   . GLY J 1 7  ? 168.539 164.059 52.838 1.00 80.09  7  J 1 
ATOM 39  N N   . TYR J 1 8  ? 167.174 164.804 51.207 1.00 78.37  8  J 1 
ATOM 40  C CA  . TYR J 1 8  ? 166.760 165.964 51.991 1.00 78.37  8  J 1 
ATOM 41  C C   . TYR J 1 8  ? 166.084 165.523 53.284 1.00 78.37  8  J 1 
ATOM 42  O O   . TYR J 1 8  ? 166.332 166.093 54.351 1.00 78.37  8  J 1 
ATOM 43  C CB  . TYR J 1 8  ? 165.830 166.858 51.167 1.00 78.37  8  J 1 
ATOM 44  C CG  . TYR J 1 8  ? 165.412 168.151 51.846 1.00 78.37  8  J 1 
ATOM 45  C CD1 . TYR J 1 8  ? 164.409 168.939 51.311 1.00 78.37  8  J 1 
ATOM 46  C CD2 . TYR J 1 8  ? 166.073 168.622 52.974 1.00 78.37  8  J 1 
ATOM 47  C CE1 . TYR J 1 8  ? 164.036 170.122 51.913 1.00 78.37  8  J 1 
ATOM 48  C CE2 . TYR J 1 8  ? 165.705 169.801 53.581 1.00 78.37  8  J 1 
ATOM 49  C CZ  . TYR J 1 8  ? 164.688 170.550 53.044 1.00 78.37  8  J 1 
ATOM 50  O OH  . TYR J 1 8  ? 164.318 171.735 53.638 1.00 78.37  8  J 1 
ATOM 51  N N   . LEU J 1 9  ? 165.226 164.506 53.213 1.00 73.64  9  J 1 
ATOM 52  C CA  . LEU J 1 9  ? 164.645 163.967 54.439 1.00 73.64  9  J 1 
ATOM 53  C C   . LEU J 1 9  ? 165.730 163.390 55.340 1.00 73.64  9  J 1 
ATOM 54  O O   . LEU J 1 9  ? 165.719 163.604 56.560 1.00 73.64  9  J 1 
ATOM 55  C CB  . LEU J 1 9  ? 163.595 162.906 54.109 1.00 73.64  9  J 1 
ATOM 56  C CG  . LEU J 1 9  ? 162.192 163.335 53.661 1.00 73.64  9  J 1 
ATOM 57  C CD1 . LEU J 1 9  ? 162.211 164.303 52.488 1.00 73.64  9  J 1 
ATOM 58  C CD2 . LEU J 1 9  ? 161.355 162.112 53.321 1.00 73.64  9  J 1 
ATOM 59  N N   . ASP J 1 10 ? 166.683 162.668 54.750 1.00 75.23  10 J 1 
ATOM 60  C CA  . ASP J 1 10 ? 167.828 162.189 55.511 1.00 75.23  10 J 1 
ATOM 61  C C   . ASP J 1 10 ? 168.631 163.360 56.062 1.00 75.23  10 J 1 
ATOM 62  O O   . ASP J 1 10 ? 169.140 163.297 57.186 1.00 75.23  10 J 1 
ATOM 63  C CB  . ASP J 1 10 ? 168.695 161.293 54.624 1.00 75.23  10 J 1 
ATOM 64  C CG  . ASP J 1 10 ? 169.793 160.577 55.393 1.00 75.23  10 J 1 
ATOM 65  O OD1 . ASP J 1 10 ? 169.921 160.785 56.617 1.00 75.23  10 J 1 
ATOM 66  O OD2 . ASP J 1 10 ? 170.537 159.796 54.764 1.00 75.23  10 J 1 
ATOM 67  N N   . ASP J 1 11 ? 168.742 164.442 55.289 1.00 76.21  11 J 1 
ATOM 68  C CA  . ASP J 1 11 ? 169.449 165.624 55.770 1.00 76.21  11 J 1 
ATOM 69  C C   . ASP J 1 11 ? 168.755 166.229 56.984 1.00 76.21  11 J 1 
ATOM 70  O O   . ASP J 1 11 ? 169.416 166.658 57.932 1.00 76.21  11 J 1 
ATOM 71  C CB  . ASP J 1 11 ? 169.573 166.658 54.651 1.00 76.21  11 J 1 
ATOM 72  C CG  . ASP J 1 11 ? 170.510 166.210 53.546 1.00 76.21  11 J 1 
ATOM 73  O OD1 . ASP J 1 11 ? 171.452 165.444 53.836 1.00 76.21  11 J 1 
ATOM 74  O OD2 . ASP J 1 11 ? 170.303 166.623 52.386 1.00 76.21  11 J 1 
ATOM 75  N N   . VAL J 1 12 ? 167.423 166.274 56.973 1.00 71.19  12 J 1 
ATOM 76  C CA  . VAL J 1 12 ? 166.679 166.814 58.107 1.00 71.19  12 J 1 
ATOM 77  C C   . VAL J 1 12 ? 166.846 165.921 59.330 1.00 71.19  12 J 1 
ATOM 78  O O   . VAL J 1 12 ? 167.032 166.405 60.457 1.00 71.19  12 J 1 
ATOM 79  C CB  . VAL J 1 12 ? 165.197 166.989 57.729 1.00 71.19  12 J 1 
ATOM 80  C CG1 . VAL J 1 12 ? 164.358 167.240 58.967 1.00 71.19  12 J 1 
ATOM 81  C CG2 . VAL J 1 12 ? 165.039 168.124 56.733 1.00 71.19  12 J 1 
ATOM 82  N N   . SER J 1 13 ? 166.779 164.604 59.130 1.00 71.31  13 J 1 
ATOM 83  C CA  . SER J 1 13 ? 167.004 163.691 60.244 1.00 71.31  13 J 1 
ATOM 84  C C   . SER J 1 13 ? 168.397 163.882 60.831 1.00 71.31  13 J 1 
ATOM 85  O O   . SER J 1 13 ? 168.555 163.965 62.054 1.00 71.31  13 J 1 
ATOM 86  C CB  . SER J 1 13 ? 166.801 162.246 59.794 1.00 71.31  13 J 1 
ATOM 87  O OG  . SER J 1 13 ? 165.459 162.023 59.402 1.00 71.31  13 J 1 
ATOM 88  N N   . ALA J 1 14 ? 169.413 163.985 59.972 1.00 73.94  14 J 1 
ATOM 89  C CA  . ALA J 1 14 ? 170.773 164.209 60.451 1.00 73.94  14 J 1 
ATOM 90  C C   . ALA J 1 14 ? 170.904 165.566 61.130 1.00 73.94  14 J 1 
ATOM 91  O O   . ALA J 1 14 ? 171.700 165.728 62.061 1.00 73.94  14 J 1 
ATOM 92  C CB  . ALA J 1 14 ? 171.765 164.087 59.295 1.00 73.94  14 J 1 
ATOM 93  N N   . LYS J 1 15 ? 170.140 166.557 60.668 1.00 71.21  15 J 1 
ATOM 94  C CA  . LYS J 1 15 ? 170.140 167.860 61.321 1.00 71.21  15 J 1 
ATOM 95  C C   . LYS J 1 15 ? 169.612 167.753 62.742 1.00 71.21  15 J 1 
ATOM 96  O O   . LYS J 1 15 ? 170.146 168.383 63.660 1.00 71.21  15 J 1 
ATOM 97  C CB  . LYS J 1 15 ? 169.311 168.855 60.511 1.00 71.21  15 J 1 
ATOM 98  C CG  . LYS J 1 15 ? 170.142 169.773 59.635 1.00 71.21  15 J 1 
ATOM 99  C CD  . LYS J 1 15 ? 169.313 170.920 59.089 1.00 71.21  15 J 1 
ATOM 100 C CE  . LYS J 1 15 ? 170.176 171.888 58.300 1.00 71.21  15 J 1 
ATOM 101 N NZ  . LYS J 1 15 ? 169.369 172.970 57.676 1.00 71.21  15 J 1 
ATOM 102 N N   . PHE J 1 16 ? 168.559 166.963 62.943 1.00 68.61  16 J 1 
ATOM 103 C CA  . PHE J 1 16 ? 168.102 166.713 64.308 1.00 68.61  16 J 1 
ATOM 104 C C   . PHE J 1 16 ? 169.128 165.927 65.120 1.00 68.61  16 J 1 
ATOM 105 O O   . PHE J 1 16 ? 169.342 166.226 66.300 1.00 68.61  16 J 1 
ATOM 106 C CB  . PHE J 1 16 ? 166.749 166.005 64.309 1.00 68.61  16 J 1 
ATOM 107 C CG  . PHE J 1 16 ? 165.587 166.929 64.088 1.00 68.61  16 J 1 
ATOM 108 C CD1 . PHE J 1 16 ? 165.736 168.293 64.256 1.00 68.61  16 J 1 
ATOM 109 C CD2 . PHE J 1 16 ? 164.345 166.437 63.736 1.00 68.61  16 J 1 
ATOM 110 C CE1 . PHE J 1 16 ? 164.670 169.147 64.068 1.00 68.61  16 J 1 
ATOM 111 C CE2 . PHE J 1 16 ? 163.277 167.286 63.544 1.00 68.61  16 J 1 
ATOM 112 C CZ  . PHE J 1 16 ? 163.439 168.643 63.710 1.00 68.61  16 J 1 
ATOM 113 N N   . ASP J 1 17 ? 169.768 164.918 64.521 1.00 77.06  17 J 1 
ATOM 114 C CA  . ASP J 1 17 ? 170.752 164.149 65.286 1.00 77.06  17 J 1 
ATOM 115 C C   . ASP J 1 17 ? 171.927 165.017 65.719 1.00 77.06  17 J 1 
ATOM 116 O O   . ASP J 1 17 ? 172.413 164.888 66.848 1.00 77.06  17 J 1 
ATOM 117 C CB  . ASP J 1 17 ? 171.254 162.929 64.509 1.00 77.06  17 J 1 
ATOM 118 C CG  . ASP J 1 17 ? 170.136 162.119 63.888 1.00 77.06  17 J 1 
ATOM 119 O OD1 . ASP J 1 17 ? 170.103 162.001 62.647 1.00 77.06  17 J 1 
ATOM 120 O OD2 . ASP J 1 17 ? 169.286 161.602 64.642 1.00 77.06  17 J 1 
ATOM 121 N N   . THR J 1 18 ? 172.399 165.901 64.845 1.00 76.90  18 J 1 
ATOM 122 C CA  . THR J 1 18 ? 173.485 166.801 65.205 1.00 76.90  18 J 1 
ATOM 123 C C   . THR J 1 18 ? 173.016 167.991 66.028 1.00 76.90  18 J 1 
ATOM 124 O O   . THR J 1 18 ? 173.851 168.678 66.626 1.00 76.90  18 J 1 
ATOM 125 C CB  . THR J 1 18 ? 174.203 167.303 63.949 1.00 76.90  18 J 1 
ATOM 126 O OG1 . THR J 1 18 ? 175.476 167.849 64.314 1.00 76.90  18 J 1 
ATOM 127 C CG2 . THR J 1 18 ? 173.381 168.373 63.253 1.00 76.90  18 J 1 
ATOM 128 N N   . GLY J 1 19 ? 171.709 168.255 66.067 1.00 78.19  19 J 1 
ATOM 129 C CA  . GLY J 1 19 ? 171.207 169.320 66.916 1.00 78.19  19 J 1 
ATOM 130 C C   . GLY J 1 19 ? 171.381 169.012 68.389 1.00 78.19  19 J 1 
ATOM 131 O O   . GLY J 1 19 ? 171.777 169.879 69.172 1.00 78.19  19 J 1 
ATOM 132 N N   . VAL J 1 20 ? 171.089 167.780 68.785 1.00 76.12  20 J 1 
ATOM 133 C CA  . VAL J 1 20 ? 171.317 167.329 70.150 1.00 76.12  20 J 1 
ATOM 134 C C   . VAL J 1 20 ? 172.694 166.684 70.220 1.00 76.12  20 J 1 
ATOM 135 O O   . VAL J 1 20 ? 173.054 165.862 69.368 1.00 76.12  20 J 1 
ATOM 136 C CB  . VAL J 1 20 ? 170.212 166.362 70.606 1.00 76.12  20 J 1 
ATOM 137 C CG1 . VAL J 1 20 ? 168.869 167.069 70.596 1.00 76.12  20 J 1 
ATOM 138 C CG2 . VAL J 1 20 ? 170.158 165.132 69.713 1.00 76.12  20 J 1 
ATOM 139 N N   . ASP J 1 21 ? 173.487 167.090 71.210 1.00 78.41  21 J 1 
ATOM 140 C CA  . ASP J 1 21 ? 174.863 166.617 71.290 1.00 78.41  21 J 1 
ATOM 141 C C   . ASP J 1 21 ? 174.916 165.113 71.524 1.00 78.41  21 J 1 
ATOM 142 O O   . ASP J 1 21 ? 175.347 164.349 70.653 1.00 78.41  21 J 1 
ATOM 143 C CB  . ASP J 1 21 ? 175.608 167.363 72.396 1.00 78.41  21 J 1 
ATOM 144 C CG  . ASP J 1 21 ? 175.835 168.824 72.061 1.00 78.41  21 J 1 
ATOM 145 O OD1 . ASP J 1 21 ? 175.946 169.149 70.861 1.00 78.41  21 J 1 
ATOM 146 O OD2 . ASP J 1 21 ? 175.903 169.647 72.998 1.00 78.41  21 J 1 
ATOM 147 N N   . ASN J 1 22 ? 174.471 164.668 72.693 1.00 74.91  22 J 1 
ATOM 148 C CA  . ASN J 1 22 ? 174.565 163.267 73.084 1.00 74.91  22 J 1 
ATOM 149 C C   . ASN J 1 22 ? 173.277 162.819 73.765 1.00 74.91  22 J 1 
ATOM 150 O O   . ASN J 1 22 ? 173.294 162.151 74.799 1.00 74.91  22 J 1 
ATOM 151 C CB  . ASN J 1 22 ? 175.777 163.050 73.987 1.00 74.91  22 J 1 
ATOM 152 C CG  . ASN J 1 22 ? 175.825 164.032 75.138 1.00 74.91  22 J 1 
ATOM 153 O OD1 . ASN J 1 22 ? 174.925 164.855 75.304 1.00 74.91  22 J 1 
ATOM 154 N ND2 . ASN J 1 22 ? 176.881 163.956 75.938 1.00 74.91  22 J 1 
ATOM 155 N N   . LEU J 1 23 ? 172.134 163.193 73.182 1.00 72.21  23 J 1 
ATOM 156 C CA  . LEU J 1 23 ? 170.852 162.915 73.824 1.00 72.21  23 J 1 
ATOM 157 C C   . LEU J 1 23 ? 170.648 161.425 74.053 1.00 72.21  23 J 1 
ATOM 158 O O   . LEU J 1 23 ? 170.248 161.010 75.146 1.00 72.21  23 J 1 
ATOM 159 C CB  . LEU J 1 23 ? 169.708 163.483 72.989 1.00 72.21  23 J 1 
ATOM 160 C CG  . LEU J 1 23 ? 168.328 163.271 73.612 1.00 72.21  23 J 1 
ATOM 161 C CD1 . LEU J 1 23 ? 168.229 163.983 74.946 1.00 72.21  23 J 1 
ATOM 162 C CD2 . LEU J 1 23 ? 167.237 163.743 72.669 1.00 72.21  23 J 1 
ATOM 163 N N   . GLN J 1 24 ? 170.920 160.601 73.039 1.00 70.63  24 J 1 
ATOM 164 C CA  . GLN J 1 24 ? 170.840 159.157 73.230 1.00 70.63  24 J 1 
ATOM 165 C C   . GLN J 1 24 ? 171.802 158.707 74.320 1.00 70.63  24 J 1 
ATOM 166 O O   . GLN J 1 24 ? 171.425 157.974 75.242 1.00 70.63  24 J 1 
ATOM 167 C CB  . GLN J 1 24 ? 171.143 158.435 71.917 1.00 70.63  24 J 1 
ATOM 168 C CG  . GLN J 1 24 ? 170.834 156.949 71.947 1.00 70.63  24 J 1 
ATOM 169 C CD  . GLN J 1 24 ? 169.405 156.644 71.556 1.00 70.63  24 J 1 
ATOM 170 O OE1 . GLN J 1 24 ? 168.697 157.505 71.042 1.00 70.63  24 J 1 
ATOM 171 N NE2 . GLN J 1 24 ? 168.972 155.412 71.801 1.00 70.63  24 J 1 
ATOM 172 N N   . THR J 1 25 ? 173.052 159.167 74.242 1.00 72.05  25 J 1 
ATOM 173 C CA  . THR J 1 25 ? 174.029 158.829 75.267 1.00 72.05  25 J 1 
ATOM 174 C C   . THR J 1 25 ? 173.628 159.382 76.627 1.00 72.05  25 J 1 
ATOM 175 O O   . THR J 1 25 ? 173.752 158.681 77.636 1.00 72.05  25 J 1 
ATOM 176 C CB  . THR J 1 25 ? 175.407 159.349 74.865 1.00 72.05  25 J 1 
ATOM 177 O OG1 . THR J 1 25 ? 175.777 158.785 73.601 1.00 72.05  25 J 1 
ATOM 178 C CG2 . THR J 1 25 ? 176.447 158.961 75.898 1.00 72.05  25 J 1 
ATOM 179 N N   . GLN J 1 26 ? 173.147 160.627 76.676 1.00 73.20  26 J 1 
ATOM 180 C CA  . GLN J 1 26 ? 172.756 161.219 77.951 1.00 73.20  26 J 1 
ATOM 181 C C   . GLN J 1 26 ? 171.656 160.400 78.610 1.00 73.20  26 J 1 
ATOM 182 O O   . GLN J 1 26 ? 171.709 160.118 79.814 1.00 73.20  26 J 1 
ATOM 183 C CB  . GLN J 1 26 ? 172.301 162.663 77.739 1.00 73.20  26 J 1 
ATOM 184 C CG  . GLN J 1 26 ? 173.397 163.693 77.939 1.00 73.20  26 J 1 
ATOM 185 C CD  . GLN J 1 26 ? 172.920 165.105 77.674 1.00 73.20  26 J 1 
ATOM 186 O OE1 . GLN J 1 26 ? 171.782 165.454 77.979 1.00 73.20  26 J 1 
ATOM 187 N NE2 . GLN J 1 26 ? 173.791 165.926 77.101 1.00 73.20  26 J 1 
ATOM 188 N N   . VAL J 1 27 ? 170.660 159.989 77.824 1.00 70.38  27 J 1 
ATOM 189 C CA  . VAL J 1 27 ? 169.615 159.113 78.339 1.00 70.38  27 J 1 
ATOM 190 C C   . VAL J 1 27 ? 170.211 157.789 78.796 1.00 70.38  27 J 1 
ATOM 191 O O   . VAL J 1 27 ? 169.787 157.217 79.808 1.00 70.38  27 J 1 
ATOM 192 C CB  . VAL J 1 27 ? 168.521 158.911 77.274 1.00 70.38  27 J 1 
ATOM 193 C CG1 . VAL J 1 27 ? 167.570 157.803 77.685 1.00 70.38  27 J 1 
ATOM 194 C CG2 . VAL J 1 27 ? 167.761 160.204 77.059 1.00 70.38  27 J 1 
ATOM 195 N N   . THR J 1 28 ? 171.208 157.285 78.067 1.00 66.97  28 J 1 
ATOM 196 C CA  . THR J 1 28 ? 171.814 156.011 78.437 1.00 66.97  28 J 1 
ATOM 197 C C   . THR J 1 28 ? 172.453 156.080 79.821 1.00 66.97  28 J 1 
ATOM 198 O O   . THR J 1 28 ? 172.163 155.246 80.688 1.00 66.97  28 J 1 
ATOM 199 C CB  . THR J 1 28 ? 172.841 155.591 77.388 1.00 66.97  28 J 1 
ATOM 200 O OG1 . THR J 1 28 ? 172.192 155.449 76.118 1.00 66.97  28 J 1 
ATOM 201 C CG2 . THR J 1 28 ? 173.475 154.265 77.774 1.00 66.97  28 J 1 
ATOM 202 N N   . GLU J 1 29 ? 173.322 157.072 80.055 1.00 72.66  29 J 1 
ATOM 203 C CA  . GLU J 1 29 ? 173.906 157.156 81.396 1.00 72.66  29 J 1 
ATOM 204 C C   . GLU J 1 29 ? 172.874 157.531 82.451 1.00 72.66  29 J 1 
ATOM 205 O O   . GLU J 1 29 ? 172.996 157.088 83.594 1.00 72.66  29 J 1 
ATOM 206 C CB  . GLU J 1 29 ? 175.107 158.111 81.526 1.00 72.66  29 J 1 
ATOM 207 C CG  . GLU J 1 29 ? 176.428 157.677 80.874 1.00 72.66  29 J 1 
ATOM 208 C CD  . GLU J 1 29 ? 176.594 158.116 79.452 1.00 72.66  29 J 1 
ATOM 209 O OE1 . GLU J 1 29 ? 175.740 158.874 78.981 1.00 72.66  29 J 1 
ATOM 210 O OE2 . GLU J 1 29 ? 177.582 157.707 78.806 1.00 72.66  29 J 1 
ATOM 211 N N   . ALA J 1 30 ? 171.858 158.331 82.113 1.00 71.55  30 J 1 
ATOM 212 C CA  . ALA J 1 30 ? 170.840 158.641 83.113 1.00 71.55  30 J 1 
ATOM 213 C C   . ALA J 1 30 ? 170.124 157.377 83.571 1.00 71.55  30 J 1 
ATOM 214 O O   . ALA J 1 30 ? 169.974 157.134 84.776 1.00 71.55  30 J 1 
ATOM 215 C CB  . ALA J 1 30 ? 169.842 159.654 82.555 1.00 71.55  30 J 1 
ATOM 216 N N   . LEU J 1 31 ? 169.710 156.541 82.619 1.00 67.57  31 J 1 
ATOM 217 C CA  . LEU J 1 31 ? 169.026 155.299 82.949 1.00 67.57  31 J 1 
ATOM 218 C C   . LEU J 1 31 ? 169.947 154.332 83.681 1.00 67.57  31 J 1 
ATOM 219 O O   . LEU J 1 31 ? 169.513 153.645 84.613 1.00 67.57  31 J 1 
ATOM 220 C CB  . LEU J 1 31 ? 168.470 154.664 81.675 1.00 67.57  31 J 1 
ATOM 221 C CG  . LEU J 1 31 ? 167.565 153.444 81.827 1.00 67.57  31 J 1 
ATOM 222 C CD1 . LEU J 1 31 ? 166.434 153.521 80.822 1.00 67.57  31 J 1 
ATOM 223 C CD2 . LEU J 1 31 ? 168.355 152.161 81.641 1.00 67.57  31 J 1 
ATOM 224 N N   . ASP J 1 32 ? 171.217 154.256 83.275 1.00 72.67  32 J 1 
ATOM 225 C CA  . ASP J 1 32 ? 172.149 153.367 83.960 1.00 72.67  32 J 1 
ATOM 226 C C   . ASP J 1 32 ? 172.379 153.821 85.398 1.00 72.67  32 J 1 
ATOM 227 O O   . ASP J 1 32 ? 172.414 152.997 86.319 1.00 72.67  32 J 1 
ATOM 228 C CB  . ASP J 1 32 ? 173.467 153.305 83.188 1.00 72.67  32 J 1 
ATOM 229 C CG  . ASP J 1 32 ? 174.413 152.240 83.718 1.00 72.67  32 J 1 
ATOM 230 O OD1 . ASP J 1 32 ? 174.073 151.558 84.706 1.00 72.67  32 J 1 
ATOM 231 O OD2 . ASP J 1 32 ? 175.507 152.083 83.137 1.00 72.67  32 J 1 
ATOM 232 N N   . LYS J 1 33 ? 172.532 155.130 85.610 1.00 71.55  33 J 1 
ATOM 233 C CA  . LYS J 1 33 ? 172.715 155.655 86.958 1.00 71.55  33 J 1 
ATOM 234 C C   . LYS J 1 33 ? 171.496 155.382 87.824 1.00 71.55  33 J 1 
ATOM 235 O O   . LYS J 1 33 ? 171.628 155.006 88.994 1.00 71.55  33 J 1 
ATOM 236 C CB  . LYS J 1 33 ? 173.001 157.155 86.900 1.00 71.55  33 J 1 
ATOM 237 C CG  . LYS J 1 33 ? 174.385 157.517 86.392 1.00 71.55  33 J 1 
ATOM 238 C CD  . LYS J 1 33 ? 174.482 159.007 86.104 1.00 71.55  33 J 1 
ATOM 239 C CE  . LYS J 1 33 ? 174.396 159.829 87.379 1.00 71.55  33 J 1 
ATOM 240 N NZ  . LYS J 1 33 ? 174.607 161.279 87.119 1.00 71.55  33 J 1 
ATOM 241 N N   . LEU J 1 34 ? 170.296 155.566 87.269 1.00 70.34  34 J 1 
ATOM 242 C CA  . LEU J 1 34 ? 169.095 155.291 88.045 1.00 70.34  34 J 1 
ATOM 243 C C   . LEU J 1 34 ? 168.944 153.807 88.358 1.00 70.34  34 J 1 
ATOM 244 O O   . LEU J 1 34 ? 168.263 153.458 89.327 1.00 70.34  34 J 1 
ATOM 245 C CB  . LEU J 1 34 ? 167.865 155.824 87.305 1.00 70.34  34 J 1 
ATOM 246 C CG  . LEU J 1 34 ? 166.493 155.819 87.987 1.00 70.34  34 J 1 
ATOM 247 C CD1 . LEU J 1 34 ? 165.645 156.923 87.403 1.00 70.34  34 J 1 
ATOM 248 C CD2 . LEU J 1 34 ? 165.773 154.496 87.808 1.00 70.34  34 J 1 
ATOM 249 N N   . ALA J 1 35 ? 169.587 152.930 87.582 1.00 66.69  35 J 1 
ATOM 250 C CA  . ALA J 1 35 ? 169.434 151.494 87.785 1.00 66.69  35 J 1 
ATOM 251 C C   . ALA J 1 35 ? 169.942 151.034 89.144 1.00 66.69  35 J 1 
ATOM 252 O O   . ALA J 1 35 ? 169.492 149.995 89.640 1.00 66.69  35 J 1 
ATOM 253 C CB  . ALA J 1 35 ? 170.153 150.726 86.678 1.00 66.69  35 J 1 
ATOM 254 N N   . ALA J 1 36 ? 170.865 151.775 89.759 1.00 67.09  36 J 1 
ATOM 255 C CA  . ALA J 1 36 ? 171.402 151.403 91.059 1.00 67.09  36 J 1 
ATOM 256 C C   . ALA J 1 36 ? 171.016 152.357 92.179 1.00 67.09  36 J 1 
ATOM 257 O O   . ALA J 1 36 ? 171.066 151.959 93.347 1.00 67.09  36 J 1 
ATOM 258 C CB  . ALA J 1 36 ? 172.933 151.307 90.996 1.00 67.09  36 J 1 
ATOM 259 N N   . LYS J 1 37 ? 170.632 153.590 91.860 1.00 66.94  37 J 1 
ATOM 260 C CA  . LYS J 1 37 ? 170.209 154.579 92.850 1.00 66.94  37 J 1 
ATOM 261 C C   . LYS J 1 37 ? 168.843 155.099 92.431 1.00 66.94  37 J 1 
ATOM 262 O O   . LYS J 1 37 ? 168.736 156.111 91.726 1.00 66.94  37 J 1 
ATOM 263 C CB  . LYS J 1 37 ? 171.229 155.709 92.979 1.00 66.94  37 J 1 
ATOM 264 C CG  . LYS J 1 37 ? 172.582 155.242 93.477 1.00 66.94  37 J 1 
ATOM 265 C CD  . LYS J 1 37 ? 172.450 154.552 94.823 1.00 66.94  37 J 1 
ATOM 266 C CE  . LYS J 1 37 ? 173.808 154.194 95.400 1.00 66.94  37 J 1 
ATOM 267 N NZ  . LYS J 1 37 ? 173.680 153.478 96.700 1.00 66.94  37 J 1 
ATOM 268 N N   . PRO J 1 38 ? 167.768 154.426 92.850 1.00 68.68  38 J 1 
ATOM 269 C CA  . PRO J 1 38 ? 166.442 154.759 92.315 1.00 68.68  38 J 1 
ATOM 270 C C   . PRO J 1 38 ? 165.804 155.974 92.952 1.00 68.68  38 J 1 
ATOM 271 O O   . PRO J 1 38 ? 165.061 156.684 92.265 1.00 68.68  38 J 1 
ATOM 272 C CB  . PRO J 1 38 ? 165.630 153.501 92.616 1.00 68.68  38 J 1 
ATOM 273 C CG  . PRO J 1 38 ? 166.222 153.021 93.902 1.00 68.68  38 J 1 
ATOM 274 C CD  . PRO J 1 38 ? 167.701 153.332 93.834 1.00 68.68  38 J 1 
ATOM 275 N N   . SER J 1 39 ? 166.056 156.240 94.230 1.00 70.54  39 J 1 
ATOM 276 C CA  . SER J 1 39 ? 165.383 157.320 94.933 1.00 70.54  39 J 1 
ATOM 277 C C   . SER J 1 39 ? 166.204 158.596 94.992 1.00 70.54  39 J 1 
ATOM 278 O O   . SER J 1 39 ? 165.705 159.612 95.488 1.00 70.54  39 J 1 
ATOM 279 C CB  . SER J 1 39 ? 165.027 156.887 96.360 1.00 70.54  39 J 1 
ATOM 280 O OG  . SER J 1 39 ? 166.196 156.601 97.104 1.00 70.54  39 J 1 
ATOM 281 N N   . ASP J 1 40 ? 167.425 158.579 94.500 1.00 71.51  40 J 1 
ATOM 282 C CA  . ASP J 1 40 ? 168.310 159.702 94.730 1.00 71.51  40 J 1 
ATOM 283 C C   . ASP J 1 40 ? 167.868 160.912 93.909 1.00 71.51  40 J 1 
ATOM 284 O O   . ASP J 1 40 ? 167.348 160.766 92.800 1.00 71.51  40 J 1 
ATOM 285 C CB  . ASP J 1 40 ? 169.741 159.324 94.374 1.00 71.51  40 J 1 
ATOM 286 C CG  . ASP J 1 40 ? 170.519 158.829 95.569 1.00 71.51  40 J 1 
ATOM 287 O OD1 . ASP J 1 40 ? 170.038 159.024 96.701 1.00 71.51  40 J 1 
ATOM 288 O OD2 . ASP J 1 40 ? 171.606 158.245 95.379 1.00 71.51  40 J 1 
ATOM 289 N N   . PRO J 1 41 ? 168.040 162.115 94.445 1.00 72.15  41 J 1 
ATOM 290 C CA  . PRO J 1 41 ? 167.725 163.323 93.677 1.00 72.15  41 J 1 
ATOM 291 C C   . PRO J 1 41 ? 168.792 163.594 92.630 1.00 72.15  41 J 1 
ATOM 292 O O   . PRO J 1 41 ? 169.806 162.902 92.531 1.00 72.15  41 J 1 
ATOM 293 C CB  . PRO J 1 41 ? 167.709 164.427 94.737 1.00 72.15  41 J 1 
ATOM 294 C CG  . PRO J 1 41 ? 167.558 163.713 96.031 1.00 72.15  41 J 1 
ATOM 295 C CD  . PRO J 1 41 ? 168.278 162.420 95.862 1.00 72.15  41 J 1 
ATOM 296 N N   . ALA J 1 42 ? 168.537 164.627 91.831 1.00 68.90  42 J 1 
ATOM 297 C CA  . ALA J 1 42 ? 169.449 165.183 90.837 1.00 68.90  42 J 1 
ATOM 298 C C   . ALA J 1 42 ? 169.710 164.237 89.674 1.00 68.90  42 J 1 
ATOM 299 O O   . ALA J 1 42 ? 170.388 164.632 88.718 1.00 68.90  42 J 1 
ATOM 300 C CB  . ALA J 1 42 ? 170.795 165.605 91.445 1.00 68.90  42 J 1 
ATOM 301 N N   . LEU J 1 43 ? 169.199 163.008 89.712 1.00 66.88  43 J 1 
ATOM 302 C CA  . LEU J 1 43 ? 169.214 162.168 88.523 1.00 66.88  43 J 1 
ATOM 303 C C   . LEU J 1 43 ? 167.793 161.722 88.216 1.00 66.88  43 J 1 
ATOM 304 O O   . LEU J 1 43 ? 167.436 161.561 87.048 1.00 66.88  43 J 1 
ATOM 305 C CB  . LEU J 1 43 ? 170.136 160.956 88.678 1.00 66.88  43 J 1 
ATOM 306 C CG  . LEU J 1 43 ? 169.723 159.783 89.565 1.00 66.88  43 J 1 
ATOM 307 C CD1 . LEU J 1 43 ? 170.578 158.575 89.251 1.00 66.88  43 J 1 
ATOM 308 C CD2 . LEU J 1 43 ? 169.875 160.147 91.011 1.00 66.88  43 J 1 
ATOM 309 N N   . LEU J 1 44 ? 166.976 161.526 89.255 1.00 62.81  44 J 1 
ATOM 310 C CA  . LEU J 1 44 ? 165.564 161.231 89.034 1.00 62.81  44 J 1 
ATOM 311 C C   . LEU J 1 44 ? 164.891 162.349 88.255 1.00 62.81  44 J 1 
ATOM 312 O O   . LEU J 1 44 ? 164.229 162.103 87.240 1.00 62.81  44 J 1 
ATOM 313 C CB  . LEU J 1 44 ? 164.850 161.025 90.366 1.00 62.81  44 J 1 
ATOM 314 C CG  . LEU J 1 44 ? 164.662 159.603 90.876 1.00 62.81  44 J 1 
ATOM 315 C CD1 . LEU J 1 44 ? 164.144 159.655 92.300 1.00 62.81  44 J 1 
ATOM 316 C CD2 . LEU J 1 44 ? 163.706 158.844 89.980 1.00 62.81  44 J 1 
ATOM 317 N N   . ALA J 1 45 ? 165.051 163.589 88.717 1.00 63.51  45 J 1 
ATOM 318 C CA  . ALA J 1 45 ? 164.565 164.727 87.951 1.00 63.51  45 J 1 
ATOM 319 C C   . ALA J 1 45 ? 165.278 164.805 86.611 1.00 63.51  45 J 1 
ATOM 320 O O   . ALA J 1 45 ? 164.660 165.085 85.577 1.00 63.51  45 J 1 
ATOM 321 C CB  . ALA J 1 45 ? 164.759 166.015 88.748 1.00 63.51  45 J 1 
ATOM 322 N N   . ALA J 1 46 ? 166.587 164.547 86.611 1.00 63.88  46 J 1 
ATOM 323 C CA  . ALA J 1 46 ? 167.322 164.470 85.356 1.00 63.88  46 J 1 
ATOM 324 C C   . ALA J 1 46 ? 166.799 163.335 84.489 1.00 63.88  46 J 1 
ATOM 325 O O   . ALA J 1 46 ? 166.675 163.486 83.270 1.00 63.88  46 J 1 
ATOM 326 C CB  . ALA J 1 46 ? 168.815 164.297 85.627 1.00 63.88  46 J 1 
ATOM 327 N N   . TYR J 1 47 ? 166.483 162.190 85.100 1.00 60.60  47 J 1 
ATOM 328 C CA  . TYR J 1 47 ? 165.886 161.089 84.350 1.00 60.60  47 J 1 
ATOM 329 C C   . TYR J 1 47 ? 164.618 161.528 83.639 1.00 60.60  47 J 1 
ATOM 330 O O   . TYR J 1 47 ? 164.476 161.336 82.427 1.00 60.60  47 J 1 
ATOM 331 C CB  . TYR J 1 47 ? 165.579 159.921 85.282 1.00 60.60  47 J 1 
ATOM 332 C CG  . TYR J 1 47 ? 164.985 158.730 84.578 1.00 60.60  47 J 1 
ATOM 333 C CD1 . TYR J 1 47 ? 165.771 157.885 83.811 1.00 60.60  47 J 1 
ATOM 334 C CD2 . TYR J 1 47 ? 163.629 158.457 84.675 1.00 60.60  47 J 1 
ATOM 335 C CE1 . TYR J 1 47 ? 165.223 156.798 83.168 1.00 60.60  47 J 1 
ATOM 336 C CE2 . TYR J 1 47 ? 163.073 157.376 84.037 1.00 60.60  47 J 1 
ATOM 337 C CZ  . TYR J 1 47 ? 163.872 156.550 83.285 1.00 60.60  47 J 1 
ATOM 338 O OH  . TYR J 1 47 ? 163.317 155.471 82.646 1.00 60.60  47 J 1 
ATOM 339 N N   . GLN J 1 48 ? 163.681 162.118 84.380 1.00 61.22  48 J 1 
ATOM 340 C CA  . GLN J 1 48 ? 162.418 162.506 83.769 1.00 61.22  48 J 1 
ATOM 341 C C   . GLN J 1 48 ? 162.618 163.572 82.703 1.00 61.22  48 J 1 
ATOM 342 O O   . GLN J 1 48 ? 162.021 163.485 81.623 1.00 61.22  48 J 1 
ATOM 343 C CB  . GLN J 1 48 ? 161.441 163.000 84.832 1.00 61.22  48 J 1 
ATOM 344 C CG  . GLN J 1 48 ? 160.073 163.333 84.276 1.00 61.22  48 J 1 
ATOM 345 C CD  . GLN J 1 48 ? 159.096 163.765 85.344 1.00 61.22  48 J 1 
ATOM 346 O OE1 . GLN J 1 48 ? 159.445 163.860 86.519 1.00 61.22  48 J 1 
ATOM 347 N NE2 . GLN J 1 48 ? 157.858 164.028 84.941 1.00 61.22  48 J 1 
ATOM 348 N N   . SER J 1 49 ? 163.461 164.571 82.975 1.00 66.01  49 J 1 
ATOM 349 C CA  . SER J 1 49 ? 163.666 165.643 82.010 1.00 66.01  49 J 1 
ATOM 350 C C   . SER J 1 49 ? 164.298 165.117 80.729 1.00 66.01  49 J 1 
ATOM 351 O O   . SER J 1 49 ? 163.843 165.437 79.628 1.00 66.01  49 J 1 
ATOM 352 C CB  . SER J 1 49 ? 164.529 166.744 82.623 1.00 66.01  49 J 1 
ATOM 353 O OG  . SER J 1 49 ? 164.839 167.732 81.658 1.00 66.01  49 J 1 
ATOM 354 N N   . LYS J 1 50 ? 165.348 164.301 80.851 1.00 62.23  50 J 1 
ATOM 355 C CA  . LYS J 1 50 ? 165.992 163.755 79.662 1.00 62.23  50 J 1 
ATOM 356 C C   . LYS J 1 50 ? 165.074 162.806 78.908 1.00 62.23  50 J 1 
ATOM 357 O O   . LYS J 1 50 ? 165.080 162.796 77.674 1.00 62.23  50 J 1 
ATOM 358 C CB  . LYS J 1 50 ? 167.292 163.045 80.036 1.00 62.23  50 J 1 
ATOM 359 C CG  . LYS J 1 50 ? 168.320 163.948 80.688 1.00 62.23  50 J 1 
ATOM 360 C CD  . LYS J 1 50 ? 168.804 165.014 79.725 1.00 62.23  50 J 1 
ATOM 361 C CE  . LYS J 1 50 ? 169.815 165.927 80.391 1.00 62.23  50 J 1 
ATOM 362 N NZ  . LYS J 1 50 ? 171.093 165.218 80.672 1.00 62.23  50 J 1 
ATOM 363 N N   . LEU J 1 51 ? 164.282 162.004 79.620 1.00 55.13  51 J 1 
ATOM 364 C CA  . LEU J 1 51 ? 163.386 161.078 78.942 1.00 55.13  51 J 1 
ATOM 365 C C   . LEU J 1 51 ? 162.306 161.830 78.175 1.00 55.13  51 J 1 
ATOM 366 O O   . LEU J 1 51 ? 161.984 161.482 77.034 1.00 55.13  51 J 1 
ATOM 367 C CB  . LEU J 1 51 ? 162.773 160.118 79.955 1.00 55.13  51 J 1 
ATOM 368 C CG  . LEU J 1 51 ? 161.865 159.044 79.373 1.00 55.13  51 J 1 
ATOM 369 C CD1 . LEU J 1 51 ? 162.675 158.158 78.450 1.00 55.13  51 J 1 
ATOM 370 C CD2 . LEU J 1 51 ? 161.246 158.227 80.487 1.00 55.13  51 J 1 
ATOM 371 N N   . SER J 1 52 ? 161.739 162.876 78.783 1.00 58.66  52 J 1 
ATOM 372 C CA  . SER J 1 52 ? 160.769 163.700 78.069 1.00 58.66  52 J 1 
ATOM 373 C C   . SER J 1 52 ? 161.418 164.423 76.896 1.00 58.66  52 J 1 
ATOM 374 O O   . SER J 1 52 ? 160.815 164.553 75.825 1.00 58.66  52 J 1 
ATOM 375 C CB  . SER J 1 52 ? 160.119 164.699 79.023 1.00 58.66  52 J 1 
ATOM 376 O OG  . SER J 1 52 ? 159.266 164.041 79.940 1.00 58.66  52 J 1 
ATOM 377 N N   . GLU J 1 53 ? 162.646 164.910 77.081 1.00 65.81  53 J 1 
ATOM 378 C CA  . GLU J 1 53 ? 163.360 165.549 75.985 1.00 65.81  53 J 1 
ATOM 379 C C   . GLU J 1 53 ? 163.519 164.593 74.816 1.00 65.81  53 J 1 
ATOM 380 O O   . GLU J 1 53 ? 163.285 164.966 73.663 1.00 65.81  53 J 1 
ATOM 381 C CB  . GLU J 1 53 ? 164.729 166.027 76.468 1.00 65.81  53 J 1 
ATOM 382 C CG  . GLU J 1 53 ? 164.823 167.501 76.834 1.00 65.81  53 J 1 
ATOM 383 C CD  . GLU J 1 53 ? 164.613 168.437 75.659 1.00 65.81  53 J 1 
ATOM 384 O OE1 . GLU J 1 53 ? 164.395 167.965 74.524 1.00 65.81  53 J 1 
ATOM 385 O OE2 . GLU J 1 53 ? 164.659 169.667 75.875 1.00 65.81  53 J 1 
ATOM 386 N N   . TYR J 1 54 ? 163.901 163.351 75.104 1.00 59.32  54 J 1 
ATOM 387 C CA  . TYR J 1 54 ? 164.070 162.346 74.065 1.00 59.32  54 J 1 
ATOM 388 C C   . TYR J 1 54 ? 162.742 162.013 73.396 1.00 59.32  54 J 1 
ATOM 389 O O   . TYR J 1 54 ? 162.683 161.828 72.175 1.00 59.32  54 J 1 
ATOM 390 C CB  . TYR J 1 54 ? 164.710 161.104 74.676 1.00 59.32  54 J 1 
ATOM 391 C CG  . TYR J 1 54 ? 164.986 159.991 73.707 1.00 59.32  54 J 1 
ATOM 392 C CD1 . TYR J 1 54 ? 166.049 160.070 72.828 1.00 59.32  54 J 1 
ATOM 393 C CD2 . TYR J 1 54 ? 164.208 158.845 73.697 1.00 59.32  54 J 1 
ATOM 394 C CE1 . TYR J 1 54 ? 166.316 159.055 71.945 1.00 59.32  54 J 1 
ATOM 395 C CE2 . TYR J 1 54 ? 164.470 157.819 72.819 1.00 59.32  54 J 1 
ATOM 396 C CZ  . TYR J 1 54 ? 165.527 157.929 71.944 1.00 59.32  54 J 1 
ATOM 397 O OH  . TYR J 1 54 ? 165.800 156.912 71.061 1.00 59.32  54 J 1 
ATOM 398 N N   . ASN J 1 55 ? 161.668 161.931 74.183 1.00 55.92  55 J 1 
ATOM 399 C CA  . ASN J 1 55 ? 160.344 161.659 73.629 1.00 55.92  55 J 1 
ATOM 400 C C   . ASN J 1 55 ? 159.925 162.748 72.647 1.00 55.92  55 J 1 
ATOM 401 O O   . ASN J 1 55 ? 159.524 162.458 71.511 1.00 55.92  55 J 1 
ATOM 402 C CB  . ASN J 1 55 ? 159.340 161.529 74.777 1.00 55.92  55 J 1 
ATOM 403 C CG  . ASN J 1 55 ? 157.922 161.278 74.306 1.00 55.92  55 J 1 
ATOM 404 O OD1 . ASN J 1 55 ? 157.659 161.123 73.117 1.00 55.92  55 J 1 
ATOM 405 N ND2 . ASN J 1 55 ? 156.998 161.213 75.253 1.00 55.92  55 J 1 
ATOM 406 N N   . LEU J 1 56 ? 160.012 164.010 73.071 1.00 57.85  56 J 1 
ATOM 407 C CA  . LEU J 1 56 ? 159.659 165.115 72.183 1.00 57.85  56 J 1 
ATOM 408 C C   . LEU J 1 56 ? 160.587 165.185 70.980 1.00 57.85  56 J 1 
ATOM 409 O O   . LEU J 1 56 ? 160.148 165.503 69.871 1.00 57.85  56 J 1 
ATOM 410 C CB  . LEU J 1 56 ? 159.665 166.437 72.945 1.00 57.85  56 J 1 
ATOM 411 C CG  . LEU J 1 56 ? 158.428 166.781 73.772 1.00 57.85  56 J 1 
ATOM 412 C CD1 . LEU J 1 56 ? 158.257 165.920 74.998 1.00 57.85  56 J 1 
ATOM 413 C CD2 . LEU J 1 56 ? 158.539 168.224 74.179 1.00 57.85  56 J 1 
ATOM 414 N N   . TYR J 1 57 ? 161.872 164.895 71.176 1.00 60.05  57 J 1 
ATOM 415 C CA  . TYR J 1 57 ? 162.800 164.844 70.054 1.00 60.05  57 J 1 
ATOM 416 C C   . TYR J 1 57 ? 162.362 163.824 69.013 1.00 60.05  57 J 1 
ATOM 417 O O   . TYR J 1 57 ? 162.299 164.134 67.817 1.00 60.05  57 J 1 
ATOM 418 C CB  . TYR J 1 57 ? 164.203 164.534 70.578 1.00 60.05  57 J 1 
ATOM 419 C CG  . TYR J 1 57 ? 165.239 164.289 69.513 1.00 60.05  57 J 1 
ATOM 420 C CD1 . TYR J 1 57 ? 165.328 163.058 68.881 1.00 60.05  57 J 1 
ATOM 421 C CD2 . TYR J 1 57 ? 166.114 165.288 69.127 1.00 60.05  57 J 1 
ATOM 422 C CE1 . TYR J 1 57 ? 166.257 162.825 67.909 1.00 60.05  57 J 1 
ATOM 423 C CE2 . TYR J 1 57 ? 167.052 165.063 68.149 1.00 60.05  57 J 1 
ATOM 424 C CZ  . TYR J 1 57 ? 167.118 163.828 67.545 1.00 60.05  57 J 1 
ATOM 425 O OH  . TYR J 1 57 ? 168.044 163.579 66.567 1.00 60.05  57 J 1 
ATOM 426 N N   . ARG J 1 58 ? 162.069 162.598 69.446 1.00 58.38  58 J 1 
ATOM 427 C CA  . ARG J 1 58 ? 161.680 161.562 68.498 1.00 58.38  58 J 1 
ATOM 428 C C   . ARG J 1 58 ? 160.373 161.916 67.804 1.00 58.38  58 J 1 
ATOM 429 O O   . ARG J 1 58 ? 160.238 161.726 66.587 1.00 58.38  58 J 1 
ATOM 430 C CB  . ARG J 1 58 ? 161.566 160.217 69.208 1.00 58.38  58 J 1 
ATOM 431 C CG  . ARG J 1 58 ? 162.900 159.553 69.491 1.00 58.38  58 J 1 
ATOM 432 C CD  . ARG J 1 58 ? 163.871 159.707 68.335 1.00 58.38  58 J 1 
ATOM 433 N NE  . ARG J 1 58 ? 165.241 159.437 68.753 1.00 58.38  58 J 1 
ATOM 434 C CZ  . ARG J 1 58 ? 166.293 159.472 67.948 1.00 58.38  58 J 1 
ATOM 435 N NH1 . ARG J 1 58 ? 166.171 159.760 66.663 1.00 58.38  58 J 1 
ATOM 436 N NH2 . ARG J 1 58 ? 167.498 159.214 68.445 1.00 58.38  58 J 1 
ATOM 437 N N   . ASN J 1 59 ? 159.399 162.432 68.558 1.00 58.16  59 J 1 
ATOM 438 C CA  . ASN J 1 59 ? 158.133 162.817 67.945 1.00 58.16  59 J 1 
ATOM 439 C C   . ASN J 1 59 ? 158.327 163.928 66.924 1.00 58.16  59 J 1 
ATOM 440 O O   . ASN J 1 59 ? 157.735 163.893 65.839 1.00 58.16  59 J 1 
ATOM 441 C CB  . ASN J 1 59 ? 157.133 163.240 69.017 1.00 58.16  59 J 1 
ATOM 442 C CG  . ASN J 1 59 ? 156.401 162.065 69.619 1.00 58.16  59 J 1 
ATOM 443 O OD1 . ASN J 1 59 ? 156.905 161.403 70.521 1.00 58.16  59 J 1 
ATOM 444 N ND2 . ASN J 1 59 ? 155.203 161.796 69.117 1.00 58.16  59 J 1 
ATOM 445 N N   . ALA J 1 60 ? 159.154 164.925 67.250 1.00 62.06  60 J 1 
ATOM 446 C CA  . ALA J 1 60 ? 159.407 166.012 66.314 1.00 62.06  60 J 1 
ATOM 447 C C   . ALA J 1 60 ? 160.081 165.504 65.052 1.00 62.06  60 J 1 
ATOM 448 O O   . ALA J 1 60 ? 159.709 165.896 63.940 1.00 62.06  60 J 1 
ATOM 449 C CB  . ALA J 1 60 ? 160.257 167.092 66.980 1.00 62.06  60 J 1 
ATOM 450 N N   . GLN J 1 61 ? 161.067 164.621 65.203 1.00 65.39  61 J 1 
ATOM 451 C CA  . GLN J 1 61 ? 161.748 164.072 64.037 1.00 65.39  61 J 1 
ATOM 452 C C   . GLN J 1 61 ? 160.774 163.310 63.148 1.00 65.39  61 J 1 
ATOM 453 O O   . GLN J 1 61 ? 160.735 163.512 61.925 1.00 65.39  61 J 1 
ATOM 454 C CB  . GLN J 1 61 ? 162.895 163.171 64.494 1.00 65.39  61 J 1 
ATOM 455 C CG  . GLN J 1 61 ? 164.044 163.067 63.519 1.00 65.39  61 J 1 
ATOM 456 C CD  . GLN J 1 61 ? 165.192 162.262 64.080 1.00 65.39  61 J 1 
ATOM 457 O OE1 . GLN J 1 61 ? 166.240 162.807 64.420 1.00 65.39  61 J 1 
ATOM 458 N NE2 . GLN J 1 61 ? 164.998 160.957 64.189 1.00 65.39  61 J 1 
ATOM 459 N N   . SER J 1 62 ? 159.959 162.442 63.753 1.00 64.39  62 J 1 
ATOM 460 C CA  . SER J 1 62 ? 159.025 161.644 62.969 1.00 64.39  62 J 1 
ATOM 461 C C   . SER J 1 62 ? 157.998 162.522 62.267 1.00 64.39  62 J 1 
ATOM 462 O O   . SER J 1 62 ? 157.716 162.331 61.078 1.00 64.39  62 J 1 
ATOM 463 C CB  . SER J 1 62 ? 158.333 160.619 63.865 1.00 64.39  62 J 1 
ATOM 464 O OG  . SER J 1 62 ? 157.410 159.843 63.125 1.00 64.39  62 J 1 
ATOM 465 N N   . ASN J 1 63 ? 157.438 163.504 62.976 1.00 65.16  63 J 1 
ATOM 466 C CA  . ASN J 1 63 ? 156.437 164.361 62.357 1.00 65.16  63 J 1 
ATOM 467 C C   . ASN J 1 63 ? 157.033 165.219 61.252 1.00 65.16  63 J 1 
ATOM 468 O O   . ASN J 1 63 ? 156.389 165.421 60.216 1.00 65.16  63 J 1 
ATOM 469 C CB  . ASN J 1 63 ? 155.767 165.233 63.413 1.00 65.16  63 J 1 
ATOM 470 C CG  . ASN J 1 63 ? 154.853 164.439 64.316 1.00 65.16  63 J 1 
ATOM 471 O OD1 . ASN J 1 63 ? 154.525 163.290 64.026 1.00 65.16  63 J 1 
ATOM 472 N ND2 . ASN J 1 63 ? 154.434 165.045 65.416 1.00 65.16  63 J 1 
ATOM 473 N N   . THR J 1 64 ? 158.252 165.729 61.444 1.00 66.60  64 J 1 
ATOM 474 C CA  . THR J 1 64 ? 158.875 166.543 60.408 1.00 66.60  64 J 1 
ATOM 475 C C   . THR J 1 64 ? 159.147 165.725 59.153 1.00 66.60  64 J 1 
ATOM 476 O O   . THR J 1 64 ? 158.846 166.169 58.035 1.00 66.60  64 J 1 
ATOM 477 C CB  . THR J 1 64 ? 160.169 167.158 60.935 1.00 66.60  64 J 1 
ATOM 478 O OG1 . THR J 1 64 ? 159.877 167.977 62.072 1.00 66.60  64 J 1 
ATOM 479 C CG2 . THR J 1 64 ? 160.819 168.011 59.865 1.00 66.60  64 J 1 
ATOM 480 N N   . VAL J 1 65 ? 159.707 164.523 59.310 1.00 64.00  65 J 1 
ATOM 481 C CA  . VAL J 1 65 ? 159.978 163.718 58.124 1.00 64.00  65 J 1 
ATOM 482 C C   . VAL J 1 65 ? 158.671 163.316 57.452 1.00 64.00  65 J 1 
ATOM 483 O O   . VAL J 1 65 ? 158.580 163.285 56.220 1.00 64.00  65 J 1 
ATOM 484 C CB  . VAL J 1 65 ? 160.858 162.499 58.464 1.00 64.00  65 J 1 
ATOM 485 C CG1 . VAL J 1 65 ? 162.203 162.957 58.999 1.00 64.00  65 J 1 
ATOM 486 C CG2 . VAL J 1 65 ? 160.176 161.571 59.442 1.00 64.00  65 J 1 
ATOM 487 N N   . LYS J 1 66 ? 157.626 163.047 58.241 1.00 65.12  66 J 1 
ATOM 488 C CA  . LYS J 1 66 ? 156.341 162.691 57.649 1.00 65.12  66 J 1 
ATOM 489 C C   . LYS J 1 66 ? 155.745 163.847 56.855 1.00 65.12  66 J 1 
ATOM 490 O O   . LYS J 1 66 ? 155.240 163.645 55.745 1.00 65.12  66 J 1 
ATOM 491 C CB  . LYS J 1 66 ? 155.366 162.235 58.733 1.00 65.12  66 J 1 
ATOM 492 C CG  . LYS J 1 66 ? 153.992 161.855 58.202 1.00 65.12  66 J 1 
ATOM 493 C CD  . LYS J 1 66 ? 154.088 160.891 57.032 1.00 65.12  66 J 1 
ATOM 494 C CE  . LYS J 1 66 ? 152.711 160.542 56.496 1.00 65.12  66 J 1 
ATOM 495 N NZ  . LYS J 1 66 ? 151.754 160.214 57.587 1.00 65.12  66 J 1 
ATOM 496 N N   . VAL J 1 67 ? 155.779 165.064 57.402 1.00 65.92  67 J 1 
ATOM 497 C CA  . VAL J 1 67 ? 155.163 166.185 56.696 1.00 65.92  67 J 1 
ATOM 498 C C   . VAL J 1 67 ? 155.958 166.528 55.442 1.00 65.92  67 J 1 
ATOM 499 O O   . VAL J 1 67 ? 155.381 166.863 54.397 1.00 65.92  67 J 1 
ATOM 500 C CB  . VAL J 1 67 ? 154.993 167.401 57.629 1.00 65.92  67 J 1 
ATOM 501 C CG1 . VAL J 1 67 ? 156.328 167.937 58.097 1.00 65.92  67 J 1 
ATOM 502 C CG2 . VAL J 1 67 ? 154.200 168.492 56.929 1.00 65.92  67 J 1 
ATOM 503 N N   . PHE J 1 68 ? 157.288 166.435 55.509 1.00 66.56  68 J 1 
ATOM 504 C CA  . PHE J 1 68 ? 158.076 166.682 54.308 1.00 66.56  68 J 1 
ATOM 505 C C   . PHE J 1 68 ? 157.826 165.606 53.260 1.00 66.56  68 J 1 
ATOM 506 O O   . PHE J 1 68 ? 157.772 165.899 52.059 1.00 66.56  68 J 1 
ATOM 507 C CB  . PHE J 1 68 ? 159.558 166.785 54.657 1.00 66.56  68 J 1 
ATOM 508 C CG  . PHE J 1 68 ? 159.991 168.177 55.012 1.00 66.56  68 J 1 
ATOM 509 C CD1 . PHE J 1 68 ? 160.099 168.568 56.333 1.00 66.56  68 J 1 
ATOM 510 C CD2 . PHE J 1 68 ? 160.268 169.101 54.022 1.00 66.56  68 J 1 
ATOM 511 C CE1 . PHE J 1 68 ? 160.490 169.850 56.660 1.00 66.56  68 J 1 
ATOM 512 C CE2 . PHE J 1 68 ? 160.658 170.384 54.343 1.00 66.56  68 J 1 
ATOM 513 C CZ  . PHE J 1 68 ? 160.769 170.758 55.664 1.00 66.56  68 J 1 
ATOM 514 N N   . LYS J 1 69 ? 157.646 164.356 53.694 1.00 70.04  69 J 1 
ATOM 515 C CA  . LYS J 1 69 ? 157.283 163.302 52.755 1.00 70.04  69 J 1 
ATOM 516 C C   . LYS J 1 69 ? 155.929 163.584 52.123 1.00 70.04  69 J 1 
ATOM 517 O O   . LYS J 1 69 ? 155.731 163.326 50.934 1.00 70.04  69 J 1 
ATOM 518 C CB  . LYS J 1 69 ? 157.291 161.944 53.465 1.00 70.04  69 J 1 
ATOM 519 C CG  . LYS J 1 69 ? 157.067 160.718 52.570 1.00 70.04  69 J 1 
ATOM 520 C CD  . LYS J 1 69 ? 155.593 160.436 52.289 1.00 70.04  69 J 1 
ATOM 521 C CE  . LYS J 1 69 ? 155.424 159.353 51.239 1.00 70.04  69 J 1 
ATOM 522 N NZ  . LYS J 1 69 ? 153.999 158.953 51.085 1.00 70.04  69 J 1 
ATOM 523 N N   . ASP J 1 70 ? 154.979 164.093 52.908 1.00 70.15  70 J 1 
ATOM 524 C CA  . ASP J 1 70 ? 153.667 164.418 52.356 1.00 70.15  70 J 1 
ATOM 525 C C   . ASP J 1 70 ? 153.770 165.503 51.293 1.00 70.15  70 J 1 
ATOM 526 O O   . ASP J 1 70 ? 153.172 165.386 50.216 1.00 70.15  70 J 1 
ATOM 527 C CB  . ASP J 1 70 ? 152.719 164.850 53.472 1.00 70.15  70 J 1 
ATOM 528 C CG  . ASP J 1 70 ? 152.353 163.710 54.396 1.00 70.15  70 J 1 
ATOM 529 O OD1 . ASP J 1 70 ? 152.337 162.552 53.930 1.00 70.15  70 J 1 
ATOM 530 O OD2 . ASP J 1 70 ? 152.082 163.970 55.587 1.00 70.15  70 J 1 
ATOM 531 N N   . ILE J 1 71 ? 154.538 166.558 51.574 1.00 64.31  71 J 1 
ATOM 532 C CA  . ILE J 1 71 ? 154.721 167.619 50.588 1.00 64.31  71 J 1 
ATOM 533 C C   . ILE J 1 71 ? 155.375 167.070 49.326 1.00 64.31  71 J 1 
ATOM 534 O O   . ILE J 1 71 ? 154.941 167.362 48.203 1.00 64.31  71 J 1 
ATOM 535 C CB  . ILE J 1 71 ? 155.545 168.772 51.188 1.00 64.31  71 J 1 
ATOM 536 C CG1 . ILE J 1 71 ? 154.860 169.327 52.435 1.00 64.31  71 J 1 
ATOM 537 C CG2 . ILE J 1 71 ? 155.751 169.866 50.159 1.00 64.31  71 J 1 
ATOM 538 C CD1 . ILE J 1 71 ? 155.778 170.127 53.325 1.00 64.31  71 J 1 
ATOM 539 N N   . ASP J 1 72 ? 156.423 166.261 49.492 1.00 68.85  72 J 1 
ATOM 540 C CA  . ASP J 1 72 ? 157.144 165.727 48.343 1.00 68.85  72 J 1 
ATOM 541 C C   . ASP J 1 72 ? 156.266 164.795 47.517 1.00 68.85  72 J 1 
ATOM 542 O O   . ASP J 1 72 ? 156.316 164.814 46.282 1.00 68.85  72 J 1 
ATOM 543 C CB  . ASP J 1 72 ? 158.398 165.005 48.825 1.00 68.85  72 J 1 
ATOM 544 C CG  . ASP J 1 72 ? 159.551 165.947 49.062 1.00 68.85  72 J 1 
ATOM 545 O OD1 . ASP J 1 72 ? 160.691 165.462 49.183 1.00 68.85  72 J 1 
ATOM 546 O OD2 . ASP J 1 72 ? 159.318 167.171 49.125 1.00 68.85  72 J 1 
ATOM 547 N N   . ALA J 1 73 ? 155.464 163.963 48.181 1.00 65.97  73 J 1 
ATOM 548 C CA  . ALA J 1 73 ? 154.553 163.081 47.466 1.00 65.97  73 J 1 
ATOM 549 C C   . ALA J 1 73 ? 153.501 163.878 46.715 1.00 65.97  73 J 1 
ATOM 550 O O   . ALA J 1 73 ? 153.128 163.520 45.593 1.00 65.97  73 J 1 
ATOM 551 C CB  . ALA J 1 73 ? 153.894 162.103 48.437 1.00 65.97  73 J 1 
ATOM 552 N N   . ALA J 1 74 ? 153.004 164.960 47.319 1.00 64.99  74 J 1 
ATOM 553 C CA  . ALA J 1 74 ? 152.063 165.819 46.610 1.00 64.99  74 J 1 
ATOM 554 C C   . ALA J 1 74 ? 152.700 166.405 45.358 1.00 64.99  74 J 1 
ATOM 555 O O   . ALA J 1 74 ? 152.080 166.428 44.288 1.00 64.99  74 J 1 
ATOM 556 C CB  . ALA J 1 74 ? 151.567 166.931 47.533 1.00 64.99  74 J 1 
ATOM 557 N N   . ILE J 1 75 ? 153.947 166.864 45.469 1.00 67.26  75 J 1 
ATOM 558 C CA  . ILE J 1 75 ? 154.634 167.425 44.307 1.00 67.26  75 J 1 
ATOM 559 C C   . ILE J 1 75 ? 154.797 166.367 43.222 1.00 67.26  75 J 1 
ATOM 560 O O   . ILE J 1 75 ? 154.522 166.615 42.042 1.00 67.26  75 J 1 
ATOM 561 C CB  . ILE J 1 75 ? 155.993 168.017 44.717 1.00 67.26  75 J 1 
ATOM 562 C CG1 . ILE J 1 75 ? 155.807 169.113 45.765 1.00 67.26  75 J 1 
ATOM 563 C CG2 . ILE J 1 75 ? 156.721 168.564 43.502 1.00 67.26  75 J 1 
ATOM 564 C CD1 . ILE J 1 75 ? 154.983 170.274 45.286 1.00 67.26  75 J 1 
ATOM 565 N N   . ILE J 1 76 ? 155.244 165.170 43.607 1.00 71.16  76 J 1 
ATOM 566 C CA  . ILE J 1 76 ? 155.503 164.119 42.627 1.00 71.16  76 J 1 
ATOM 567 C C   . ILE J 1 76 ? 154.216 163.694 41.935 1.00 71.16  76 J 1 
ATOM 568 O O   . ILE J 1 76 ? 154.164 163.579 40.705 1.00 71.16  76 J 1 
ATOM 569 C CB  . ILE J 1 76 ? 156.205 162.925 43.299 1.00 71.16  76 J 1 
ATOM 570 C CG1 . ILE J 1 76 ? 157.602 163.325 43.761 1.00 71.16  76 J 1 
ATOM 571 C CG2 . ILE J 1 76 ? 156.302 161.755 42.342 1.00 71.16  76 J 1 
ATOM 572 C CD1 . ILE J 1 76 ? 158.489 163.764 42.631 1.00 71.16  76 J 1 
ATOM 573 N N   . GLN J 1 77 ? 153.158 163.457 42.708 1.00 74.01  77 J 1 
ATOM 574 C CA  . GLN J 1 77 ? 151.870 163.093 42.139 1.00 74.01  77 J 1 
ATOM 575 C C   . GLN J 1 77 ? 151.276 164.203 41.291 1.00 74.01  77 J 1 
ATOM 576 O O   . GLN J 1 77 ? 150.522 163.917 40.355 1.00 74.01  77 J 1 
ATOM 577 C CB  . GLN J 1 77 ? 150.903 162.718 43.266 1.00 74.01  77 J 1 
ATOM 578 C CG  . GLN J 1 77 ? 149.608 162.063 42.818 1.00 74.01  77 J 1 
ATOM 579 C CD  . GLN J 1 77 ? 148.547 163.075 42.436 1.00 74.01  77 J 1 
ATOM 580 O OE1 . GLN J 1 77 ? 148.119 163.881 43.261 1.00 74.01  77 J 1 
ATOM 581 N NE2 . GLN J 1 77 ? 148.126 163.046 41.178 1.00 74.01  77 J 1 
ATOM 582 N N   . ASN J 1 78 ? 151.610 165.453 41.583 1.00 75.47  78 J 1 
ATOM 583 C CA  . ASN J 1 78 ? 151.007 166.584 40.903 1.00 75.47  78 J 1 
ATOM 584 C C   . ASN J 1 78 ? 151.656 166.793 39.532 1.00 75.47  78 J 1 
ATOM 585 O O   . ASN J 1 78 ? 151.100 167.503 38.692 1.00 75.47  78 J 1 
ATOM 586 C CB  . ASN J 1 78 ? 151.109 167.797 41.862 1.00 75.47  78 J 1 
ATOM 587 C CG  . ASN J 1 78 ? 150.672 169.138 41.268 1.00 75.47  78 J 1 
ATOM 588 O OD1 . ASN J 1 78 ? 150.393 169.290 40.093 1.00 75.47  78 J 1 
ATOM 589 N ND2 . ASN J 1 78 ? 150.555 170.120 42.149 1.00 75.47  78 J 1 
ATOM 590 N N   . PHE J 1 79 ? 152.755 166.084 39.244 1.00 76.77  79 J 1 
ATOM 591 C CA  . PHE J 1 79 ? 153.341 166.125 37.905 1.00 76.77  79 J 1 
ATOM 592 C C   . PHE J 1 79 ? 152.308 165.775 36.843 1.00 76.77  79 J 1 
ATOM 593 O O   . PHE J 1 79 ? 152.188 166.465 35.824 1.00 76.77  79 J 1 
ATOM 594 C CB  . PHE J 1 79 ? 154.513 165.146 37.794 1.00 76.77  79 J 1 
ATOM 595 C CG  . PHE J 1 79 ? 155.770 165.599 38.471 1.00 76.77  79 J 1 
ATOM 596 C CD1 . PHE J 1 79 ? 155.885 166.866 39.000 1.00 76.77  79 J 1 
ATOM 597 C CD2 . PHE J 1 79 ? 156.855 164.744 38.553 1.00 76.77  79 J 1 
ATOM 598 C CE1 . PHE J 1 79 ? 157.054 167.261 39.614 1.00 76.77  79 J 1 
ATOM 599 C CE2 . PHE J 1 79 ? 158.021 165.138 39.162 1.00 76.77  79 J 1 
ATOM 600 C CZ  . PHE J 1 79 ? 158.121 166.398 39.692 1.00 76.77  79 J 1 
ATOM 601 N N   . ARG J 1 80 ? 151.557 164.702 37.066 1.00 84.01  80 J 1 
ATOM 602 C CA  . ARG J 1 80 ? 150.552 164.246 36.118 1.00 84.01  80 J 1 
ATOM 603 C C   . ARG J 1 80 ? 149.236 164.973 36.361 1.00 84.01  80 J 1 
ATOM 604 O O   . ARG J 1 80 ? 148.856 165.220 37.506 1.00 84.01  80 J 1 
ATOM 605 C CB  . ARG J 1 80 ? 150.365 162.730 36.232 1.00 84.01  80 J 1 
ATOM 606 C CG  . ARG J 1 80 ? 149.526 162.108 35.127 1.00 84.01  80 J 1 
ATOM 607 C CD  . ARG J 1 80 ? 148.094 161.873 35.581 1.00 84.01  80 J 1 
ATOM 608 N NE  . ARG J 1 80 ? 148.029 160.982 36.733 1.00 84.01  80 J 1 
ATOM 609 C CZ  . ARG J 1 80 ? 146.964 160.838 37.510 1.00 84.01  80 J 1 
ATOM 610 N NH1 . ARG J 1 80 ? 145.848 161.512 37.286 1.00 84.01  80 J 1 
ATOM 611 N NH2 . ARG J 1 80 ? 147.022 159.999 38.541 1.00 84.01  80 J 1 
ATOM 612 O OXT . ARG J 1 80 ? 148.527 165.332 35.421 1.00 84.01  80 J 1 
#


================================================
FILE: src/alphafold3/test_data/miniature_databases/pdb_seqres_2022_09_28__subsampled_1000.fasta
================================================
>4ffz_X mol:protein length:111  Envelope protein E
MASMTLKGMSYVMCTGSFKLEKEVAETQHGTVLVQVKYEGTDAPCKIPFSSQDEKGVTQNGRLITANPIVTDKEKPVNIEAEPPFGESYIVVGAGEKALKLSWFKKGSSIG
>2y3e_A mol:protein length:134  STREPTAVIDIN
MAEAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGNAEGDYVLTGRYDSAPATDGSGTALGWTVAWKNNYRNAHSATTWSGQYVGGAEARINTQWLLTSGTTEANAWKSTLVGHDTFTKVKPSAASHHHHHH
>7rye_J mol:protein length:80  Protein PrgI
MATPWSGYLDDVSAKFDTGVDNLQTQVTEALDKLAAKPSDPALLAAYQSKLSEYNLYRNAQSNTVKVFKDIDAAIIQNFR
>5eq0_B mol:protein length:6  unc3866
XFALXX
>5thk_C mol:protein length:266  Putative dehydrogenase
MAHHHHHHMVATHTLADKVVLIAGGAKNLGGLIARDLAGHGAKAVAIHYNSAASQAQAEETAAAVRAAGAEAATFQADLTTAAAVEKLFDDAKQRFGKIDIAINTVGKVLKKPFTEISEAEYDEMFAVNSKSAFFFIKEAGRHLEDHGKLVTLVTSLLGAFTPFYAAYEGSKAPVEHFTRAASKEYGARGISVTAVGPGPMDTPFFYPAEGADAVAYHKTAAALSPFSKTGLTDIEDVVPFIRHLVTDGWWITGQTILINGGYTTK
>1svu_B mol:protein length:327  Modification methylase HhaI
MIEIKDKQLTGLRFIDLFAGLGGFRLALESCGAECVYSNEWDKYAQEVYEMNFGEKPEGDITQVNEKTIPDHDILCAGFPCQAFSISGKQKGFEDSRGTLFFDIARIVREKKPKVVFMENVKNFASHDNGNTLEVVKNTMNELDYSFHAKVLNALDYGIPQKRERIYMICFRNDLNIQNFQFPKPFELNTFVKDLLLPDSEVEHLVIDRKDLVMTNQEIEQTTPKTVRLGIVGKGGWGERIYSTRGIAITLSAYGGGIFAKTGGYLVNGKTRKLHPRECARVMGYPDSYKVHPSTSQAYKQFGNSVVINVLQYIAYNIGSSLNFKPY
>3c0r_B mol:protein length:75  Ubiquitin
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRG
>3dnn_H mol:protein length:170  HIV-1 envelope glycoprotein gp120
TSVITQACPKVSFEPIPIHYCAPAGFAILKCNNKTFNGTGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEVVIRSVNFTDNAKTIIVQLNTSVEINCTGAGHCNISRAKWNNTLKQIASKLREQFGNNKTIIFKQSSGGDPEIVTHSFNCGGEFFYCNSTQLFNSTWF
>4igl_D mol:protein length:690  YenC2
MDIQLFSKTPSVTVFDNRGLSVRDIAYRRHPDTPKVTEECITYHQFDFRGFLAQSLDPRLNHKEVTNFSYLTDLNGNIIYTQSVDAGNTLVLNDTEGRSVIAMTNISRGENGKDDLSLAVTRTFQYENAPLPGRPLSVTEQVNGENARITEHFVYAGNTPQEKNLNLAGQCVSYYDAAGLIQTDSVSLTGKPLSVSRKLLKNLDDTNILADWQGNDTSAWNSLLATEIYTTVTRTDAAGAVLTTIDAVGNQQRVAFDIAGQLSASWLTLKGGQEQVIIKVLTYSAAGQKLREEGGNGVVTTYTYEAETQRLIGIKTERPNGHAAGAKVLQDLRYEYDPVGNVLSITNDAEETRFWRNQKVVPENAYRYDSLYQLVSASGREVAGAGQQGSDLPSPLVPLPSDSSVYTNYTRTYTYDSAGNLMRIRHSAPATNNNYTLNITVSERSNRGVMSSLTENPADVDALFTASGSQKCLQQGQSLIWTPRGELRTVLLVARGETADDSESYRYDGSSQRILKISSQQTNHSARVQRALYLPGLEWRTMTGGVAEAENLQVICIGEAGRAQVRVLHWESGKPDGIINDQIRWSYDNLTCSSGLEVDGDGLVISMEEYYPYGGTAVWAARSHIETAYKTVRYSGKERDATGLYYYGFRYYQPWAGRWLSADPAGTVDGLNLYRMVRNNPLRLTDPDGM
>2y1z_B mol:protein length:94  ALPHA-CRYSTALLIN B CHAIN
GAMEMRLEKDRFSVNLDVKHFSPEELKVKVLGDVIEVHGKHEERQDEHGFISREFHGKYRIPADVDPLTITSSMSSDGVLTVNGPRKQVSGPER
>7vy3_V mol:protein length:54  Antenna pigment protein alpha chain
MSKFYKIWMIFDPRRVFVAQGVFLFLLAVMIHLILLSTPSYNWLEISAAKYNRV
>7v2c_P mol:protein length:208  NADH dehydrogenase [ubiquinone] iron-sulfur protein 3, mitochondrial
TRPTIRPRNDVVHKQLSAFGQYVAEILPKYVQQVQVSCFNELEIFIHPDGVIPVLTFLRDHTNAQFKSLADLTAVDVPTRQNRFEIVYNLLSLRFNSRIRVKTYTDELTPIESSVTVYKAANWYEREIWDMFGVFFANHPDLRRILTDYGFEGHPFRKDFPLSGYVELRYDDEVKRVVAEPVELAQEFRKFDLNSPWEAFPAYRQPPE
>7eca_A mol:protein length:333  Kelch-like ECH-associated protein 1
MGHHHHHHENLYFQGHMTLHKPTQAVPCRAPKVGRLIYTAGGYFRQSLSYLEAYNPSNGSWLRLADLQVPRSGLAGCVVGGLLYAVGGRNNSPDGNTDSSALDCYNPMTNQWSPCASMSVPRNRIGVGVIDGHIYAVGGSHGCIHHSSVERYEPERDEWHLVAPMLTRRIGVGVAVLNRLLYAVGGFDGTNRLNSAECYYPERNEWRMITPMNTIRSGAGVCVLHNCIYAAGGYDGQDQLNSVERYDVETETWTFVAPMRHHRSALGITVHQGKIYVLGGYDGHTFLDSVECYDPDSDTWSEVTRMTSGRSGVGVAVTMEPCRKQIDQQNCTC
>2maa_A mol:protein length:13  Temporin-A
FLPLIGRVLSGIL
>7xi7_A mol:protein length:187  Dihydrofolate reductase
MVGSLNCIVAVSQNMGIGKNGDLPWPPLRNEFRYFQRMTTTSSVEGKQNLVIMGKKTWFSIPEKNRPLKGRINLVLSRELKEPPQGAHFLSRSLDDALKLTEQPELANKVDMVWIVGGSSVYKEAMNHPGHLKLFVTRIMQDFESDTFFPEIDLEKYKLLPEYPGVLSDVQEEKGIKYKFEVYEKND
>6zmn_A mol:protein length:125  Mothers against decapentaplegic homolog 3
GPAVKRLLGWKQGDEEEKWCEKAVKSLVKKLKKTGQLDELEKAITTQNVNTKCITIPRSLDGRLQVSHRKGLPHVIYCRLWRWPDLHSHHELRAMELCEFAFNMKKDEVCVNPYHYQRVETPVLP
>7vbn_G mol:protein length:88  Acyl carrier protein, mitochondrial
SDAPPLTLEAIKDRVLYVLKLYDKIDPEKLSVNSHFMKDLGLDSLDQVEIIMAMEDEFGFEIPDIDAEKLMCPQEIVDYIADKKDVYE
>7vaq_J mol:protein length:188  V-type ATP synthase subunit E
MSKLEAILSQEVEAEIQALLQEAEAKAEAVKREAEEKAKALLQARERALEAQYRAALRRAESAGELLVATARTQARGEVLEEVRRRVREALEALPQKPEWPEVVRKLALEALEALPGAKALVANPEDLPHLEALARERGVELQAEPALRLGVRAVGAEGKTQVENSLLARLDRAWDALSSKVAQALWG
>7osz_B mol:protein length:512  Bifunctional glutamate/proline--tRNA ligase
GAGEGQGPKKQTRLGLEAKKEENLADWYSQVITKSEMIEYHDISGCYILRPWAYAIWEAIKDFFDAEIKKLGVENCYFPMFVSQSALEKEKTHVADFAPEVAWVTRSGKTELAEPIAIRPTSETVMYPAYAKWVQSHRDLPIKLNQWCNVVRWEFKHPQPFLRTREFLWQEGHSAFATMEEAAEEVLQILDLYAQVYEELLAIPVVKGRKTEKEKFAGGDYTTTIEAFISASGRAIQGGTSHHLGQNFSKMFEIVFEDPKIPGEKQFAYQNSWGLTTRTIGVMTMVHGDNMGLVLPPRVACVQVVIIPCGITNALSEEDKEALIAKCNDYRRRLLSVNIRVRADLRDNYSPGWKFNHWELKGVPIRLEVGPRDMKSCQFVAVRRDTGEKLTVAENEAETKLQAILEDIQVTLFTRASEDLKTHMVVANTMEDFQKILDSGKIVQIPFCGEIDCEDWIKKTTARDQDLEPGAPSMGAKSLCIPFKPLCELQPGAKCVCGKNPAKYYTLFGRSY
>6y0u_A mol:protein length:115  Fucose-binding lectin
MATQGVFTLPANTRFGVTAFANSSGTQTVNVLVNNETAATFSGQSTNNAVIGTQVLNSGSSGKVQVQVSVNGRPSDLVSAQVILTNELNFALVGSEDGTDNDYNDAVVVINWPLG
>3j3y_5T mol:protein length:231  capsid protein
PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIEPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVL
>7pmz_D mol:protein length:504  Inosine-5'-monophosphate dehydrogenase
GSHMTANVDGVPEKFATLGLTYDDVLLLPGASAVLPNAVDTSSRISRNVRVNIPLLSAAMDKVTESRMAISMARQGGVGVLHRNLSIEDQANQVDLVKRSESGMVANPITIHPDATLGEADALCAKFRISGVPVTDGAGKLLGIVTNRDMAFETDRSRQVREVMTPMPLVTGQVGISGVDAMELLRRHKIEKLPLVDGDGILKGLITVKDFVKAEQYPHAAKDAKGRLLVGAAVGASPEALDRAQALAEAGVDFLVVDTSHGHNSNALSWMSKIKSSVGIDVVGGNVATRDGAQALIDAGVDGIKVGVGPGSICTTRVVAGIGVPQVTAIYEASLAARAAGVPLIGDGGLQYSGDIGKALAAGADTVMLGSLLAGCEESPGELQFINGKQFKSYRGMGSLGAMQSRGQGRSYSKDRYFQAEVASDDKLVPEGIEGQVPYRGPLANVLHQLVGGLRQTMGYVGAATIEEMESKGRFVRITSAGLKESHPHDIQMTVEAPNYSRSK
>3ccr_F mol:protein length:120  50S ribosomal protein L7Ae
MPVYVDFDVPADLEDDALEALEVARDTGAVKKGTNETTKSIERGSAELVFVAEDVQPEEIVMHIPELADEKGVPFIFVEQQDDLGHAAGLEVGSAAAAVTDAGEADADVEDIADKVEELR
>5omf_A mol:protein length:774  DNA polymerase,DNA polymerase,DNA polymerase
MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYFYALLKDDSAIEEVKKITAERHGTVVTVKRVEKVQKKFLGRPVEVWKLYFTHPQDVPAIRDKIREHPAVIDIYEYDIPFAKRYLIDKGLVPMEGDEELKMLAFAIATLYHEGEEFAEGPILMISYADEEGARVITWKNVDLPYVDVVSTEREMIKRFLRVVKEKDPDVLITYNGDNFDFAYLKKRCEKLGINFALGRDGSEPKIQRMGDRFAVEVKGRIHFDLYPVIRRTINLPTYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFLPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRRQSYEGGYVKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKKMKATIDPIERKLLDYRQRAIKILANSYYGYYGYARARWYCKECAESVTAWGREYITMTIKEIEEKYGFKVIYSDTDGFFATIPGADAETVKKKAMEFLKYINAKLPGALELEYEGFYKRGFFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIHEQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIGDRAIPFDEFDPTKHKYDAEYYIENQVLPAVERILRAFGYRKEDLRYQKTRQVGLSAWLKPKGT
>4chk_E mol:protein length:127  AUXIN RESPONSE FACTOR 5
GAMSKGSSWQKIATPRVRTYTKVQKTGSVGRSIDVTSFKDYEELKSAIECMFGLEGLLTHPQSSGWKLVYVDYESDVLLVGDDPWEEFVGCVRCIRILSPTEVQQMSEEGMKLLNSAGINDLKTSVS
>5yfm_A mol:protein length:414  Isocitrate dehydrogenase [NADP] cytoplasmic
MSKKISGGSVVEMQGDEMTRIIWELIKEKLIFPYVELDLHSYDLGIENRDATNDQVTKDAAEAIKKHNVGVKCATITPDEKRVEEFKLKQMWKSPNGTIRNILGGTVFREAIICKNIPRLVSGWVKPIIIGRHAYGDQYRATDFVVPGPGKVEITYTPSDGTQKVTYLVHNFEEGGGVAMGMYNQDKSIEDFAHSSFQMALSKGWPLYLSTKNTILKKYDGRFKDIFQEIYDKQYKSQFEAQKIWYEHRLIDDMVAQAMKSEGGFIWACKNYDGDVQSDSVAQGYGSLGMMTSVLVCPDGKTVEAEAAHGTVTRHYRMYQKGQETSTNPIASIFAWTRGLAHRAKLDNNKELAFFANALEEVSIETIEAGFMTKDLAACIKGLPNVQRSDYLNTFEFMDKLGENLKIKLAQAKL
>1h0k_B mol:protein length:364  2,4-DIENOYL-COA REDUCTASE
MITAQAVLYTQHGEPKDVLFTQSFEIDDDNLAPNEVIVKTLGSPINPSDINQIQGVYPSKPAKTTGFGTAEPAAPCGNEGLFEVIKVGSNVSSLEAGDWVIPSHVNFGTWRTHALGNDDDFIKLPNPAQSKANGKPNGLTINQGATISVNPLTAYLMLTHYVKLTPGKDWFIQNGGTSAVGKYASQIGKLLNFNSISVIRDRPNLDEVVASLKELGATQVITEDQNNSKEFGPTIKEWIKQSGGEAKLALNCVGGKSSTGIARKLNNNGLMLTYGGMSFQPVTIPTSLYIFKNFTSAGFWVTELLKNNKELKTSTLNQIIAWYEEGKLTDAKSIETLYDGTKPLHELYQDGVANSKDGKQLITY
>1b4n_B mol:protein length:619  FORMALDEHYDE FERREDOXIN OXIDOREDUCTASE
MYGWWGRILRVNLTTGEVKVQEYPEEVAKKFIGGRGLAAWILWNEARGVEPLSPENKLIFAAGPFNGLPTPSGGKLVVAAKSPLTGGYGDGNLGTMASVHLRRAGYDALVVEGKAKKPVYIYIEDDNVSILSAEGLWGKTTFETERELKEIHGKNVGVLTIGPAGENLVKYAVVISQEGRAAGRPGMGAVMGSKKLKAVVIRGTKEIPVADKEELKKLSQEAYNEILNSPGYPFWKRQGTMAAVEWCNTNYALPTRNFSDGYFEFARSIDGYTMEGMKVQQRGCPYCNMPCGNVVLDAEGQESELDYENVALLGSNLGIGKLNEVSVLNRIADEMGMDTISLGVSIAHVMEAVERGILKEGPTFGDFKGAKQLALDIAYRKGELGNLAAEGVKAMAEKLGTHDFAMHVKGLEVSGYNCYIYPAMALAYGTSAIGAHHKEAWVIAWEIGTAPIEGEKAEKVEYKISYDPIKAQKVVELQRLRGGLFEMLTACRLPWVEVGLSLDYYPKLLKAITGVTYTWDDLYKAADRVYSLIRAYWVREFNGKWDRKMDYPPKRWFTEGLKSGPHKGEHLDEKKYDELLSEYYRIRGWDERGIPKKETLKELDLDFVIPELEKVTNLE
>5b66_c mol:protein length:455  Photosystem II CP43 reaction center protein
NSIFATNRDQESSGFAWWAGNARLINLSGKLLGAHVAHAGLIVFWAGAMTLFELAHFIPEKPMYEQGLILIPHIATLGWGVGPGGEVVDTFPFFVVGVVHLISSAVLGFGGVYHAIRGPETLEEYSSFFGYDWKDKNKMTTILGFHLIVLGIGALLLVAKAMFFGGLYDTWAPGGGDVRVITNPTLDPRVIFGYLLKSPFGGEGWIVSVNNLEDVVGGHIWIGLICIAGGIWHILTTPFGWARRAFIWSGEAYLSYSLGALSMMGFIATCFVWFNNTVYPSEFYGPTGPEASQAQAMTFLIRDQKLGANVGSAQGPTGLGKYLMRSPTGEIIFGGETMRFWDFRGPWLEPLRGPNGLDLNKIKNDIQPWQERRAAEYMTHAPLGSLNSVGGVATEINSVNFVSPRSWLATSHFVLAFFFLVGHLWHAGRARAAAAGFEKGIDRESEPVLSMPSLD
>6ujv_A mol:protein length:129  Envelope glycoprotein GP41
LLELDKWASLWNWFDITNWLWYIRIFIIIVGSLIGLRIVFAVLSLVNRVRQGYSPLSFQTHLPTPRGPDRPEGIEEEGGERDRDRSIRLVNGSLALIWDDLRSLSLFSYHRLRDLLLIVTRIVELLGRR
>5lzf_d mol:protein length:205  30S ribosomal protein S4
ARYLGPKLKLSRREGTDLFLKSGVRAIDTKCKIEQAPGQHGARKPRLSDYGVQLREKQKVRRIYGVLERQFRNYYKEAARLKGNTGENLLALLEGRLDNVVYRMGFGATRAEARQLVSHKAIMVNGRVVNIASYQVSPNDVVSIREKAKKQSRVKAALELAEQREKPTWLEVDAGKMEGTFKRKPERSDLSADINEHLIVELYSK
>3j92_l mol:protein length:51  eL39
MSSHKTFRIKRFLAKKQKQNRPIPQWIRMKTGNKIRYNSKRRHWRRTKLGL
>4ato_A mol:protein length:194  TOXN
MTNKDNPKFHTISTEYIDYLREADSKVPFNKDEQHSRPYVGVLEKINGHDYFVPLTSRNDKNFNSQVSVKLFDNDEKRIGVLLVNNMIPVPEKECKEIDIAEKTAADPQYGNLMLKQYLFLKENMDRVTNKVEKVYKDVTVQGKPSHKQKFLKGVCCDFPKLEEKCQEYKERDQAKERDKARRIAYMRQMGRER
>6sh8_N mol:protein length:174  CRISPR-associated protein Cmrx
MSTQREYVFIPITNSITIDVKITIGGSDHITNIDERGIHNVLVITGYAVDEKNGRLVPTLDPCDYVKGILVAGTPQQAQSNDFLTLKLPANKLYLIRKKGNISDDLKIYIPYSSPDARNSMKTKPVSISDDTIVNNIIKEVFDKIYNITQKEKVKIEKVKEDIKELFSYYALEQ
>4v86_S mol:protein length:520  Capsid protein VP1
GADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL
>4kis_B mol:protein length:328  Putative integrase [Bacteriophage A118]
RDRMVMGKIKRIEAGLPLTTAKGRTFGYDVIDTKLYINEEEAKQLRLIYDIFEEEQSITFLQKRLKKLGFKVRTYNRYNNWLTNDLYCGYVSYKDKVHVKGIHEPIISEEQFYRVQEIFSRMGKNPNMNKESASLLNNLVVCSKCGLGFVHRRKDTVSRGKKYHYRYYSCKTYKHTHELEKCGNKIWRADKLEELIIDRVNNYSFASRNIDKEDELDSLNEKLKIEHAKKKRLFDLYINGSYEVSELDSMMNDIDAQINYYEAQIEANEELKKNKKIQENLADLATVDFNSLEFREKQLYLKSLINKIYIDGEQVTIEWLLEHHHHHH
>3vap_A mol:protein length:272  Aurora kinase A
GAMGSKRQWALEDFEIGRPLGKGKFGNVYLAREKQSKFILALKVLFKAQLEKAGVEHQLRREVEIQSHLRHPNILRLYGYFHDATRVYLILEYAPLGTVYRELQKLSKFDEQRTATYITELANALSYCHSKRVIHRDIKPENLLLGSAGELKIADFGWSVHAPSSRRTTLCGTLDYLPPEMIEGRMHDEKVDLWSLGVLCYEFLVGKPPFEANTYQETYKRISRVEFTFPDFVTEGARDLISRLLKHNPSQRPMLREVLEHPWITANSSKPS
>2ybu_F mol:protein length:381  ACIDIC MAMMALIAN CHITINASE
EAEAYQLTCYFTNWAQYRPGLGRFMPDDINPCLCTHLIYAFAGMQNNEITTIEWNDVTLYQAFNGLKNKNSQLKTLLAIGGWNFGTAPFTAMVSTPENRQTFITSVIKFLRQYEFDGLDFDWEYPGSRGSPPQDKHLFTVLVQEMREAFEQEAKQINKPRLMVTAAVAAGISNIQSGYEIPQLSQYLDYIHVMTYDLHGSWEGYTGENSPLYKYPTDTGSNAYLNVDYVMNYWKDNGAPAEKLIVGFPTYGHNFILSNPSNTGIGAPTSGAGPAGPYAKESGIWAYYEICTFLKNGATQGWDAPQEVPYAYQGNVWVGYDNIKSFDIKAQWLKHNKFGGAMVWAIDLDDFTGTFCNQGKFPLISTLKKALGLQSASCTAPA
>7ebk_A mol:protein length:187  Tripartite motif-containing protein 66
SPIENEDFCAVCINGGELLCCDRCPKVYHLSCHVPALLSFPGGEWVCTLCRSLTQPEMEYDCENARYGVRVLPGLSMYDQKKCEKLVLSLCCNSLSLPFHEPVSPLARHYYQIIKRPMDLSIIRRKLQKKDPAHYTTPEEVVSDVRLMFWNCAKFNYPDSEVAEAGRCLEVFFEGWLKEIYPDKCFA
>4pcf_B mol:protein length:239  Ma18-TIM
MSKPQPIAAANWKSGSPDSLSGLIDLFNSTSINHDVQCVVASTFVHLAMTKERLSHPKFVIAAQNAGNTDALASLKDFGVNWIVLGHFERRWYYGETNEIVADKVAAAVASGFMVIACIGETLQERESGRTAVVVLTQIAAIAKKLKKADWAKVVIAYEPVWAIGTGKVVTPQQAQEAHALIRSWVSSKIGADVAGELRILYGGSVNGKNARTLYQQRDVNGFLAGLKPEFVDIIKATQ
>3txx_F mol:protein length:359  Putrescine carbamoyltransferase
MGSSHHHHHHSSGLVPRGSHMKRDYVTTETYTKEEMHYLVDLSLKIKEAIKNGYYPQLLKNKSLGMIFQQSSTRTRVSFETAMEQLGGHGEYLAPGQIQLGGHETIEDTSRVLSRLVDILMARVERHHSIVDLANCATIPVINGMSDYNHPTQELGDLCTMVEHLPEGKKLEDCKVVFVGDATQVCFSLGLITTKMGMNFVHFGPEGFQLNEEHQAKLAKNCEVSGGSFLVTDDASSVEGADFLYTDVWYGLYEAELSEEERMKVFYPKYQVNQEMMDRAGANCKFMHCLPATRGEEVTDEVIDGKNSICFDEAENRLTSIRGLLVYLMNDYEAKNPYDLIKQAEAKKELEVFLDTQSI
>6oro_A mol:protein length:153  RC1 variant of HIV-1 Env glycoprotein gp41
AVGIGAVSLGFLGAAGSTMGAASMTLTVQARNLLSGIVQQQSNLLRAPEPQQHLLKDTHWGIKQLQARVLAVEHYLRDQQLLGIWGCSGKLICCTNVPWNSSWSNRNLSEIWDNMTWLQWDKEISNYTQIIYGLLEESQNQQEKNEQDLLALD
>2yso_A mol:protein length:46  Zinc finger protein 95 homolog
GSSGSSGSREKSHQCRECGEIFFQYVSLIEHQVLHMGQKNSGPSSG
>7nal_H mol:protein length:697  NAD(+) hydrolase SARM1
LAVPGPDGGGGTGPWWAAGGRGPREVSPGAGTEVQDALERALPELQQALSALKQAGGARAVGAGLAEVFQLVEEAWLLPAVGREVAQGLCDAIRLDGGLDLLLRLLQAPELETRVQAARLLEQILVAENRDRVARIGLGVILNLAKEREPVELARSVAGILEHMFKHSEETCQRLVAAGGLDAVLYWCRRTDPALLRHCALALGNCALHGGQAVQRRMVEKRAAEWLFPLAFSKEDELLRLHACLAVAVLATNKEVEREVERSGTLALVEPLVASLDPGRFARCLVDASDTSQGRGPDDLQRLVPLLDSNRLEAQCIGAFYLCAEAAIKSLQGKTKVFSDIGAIQSLKRLVSYSTNGTKSALAKRALRLLGEEVPRPILPSVPSWKEAEVQTWLQQIGFSKYCESFREQQVDGDLLLRLTEEELQTDLGMKSGITRKRFFRELTELKTFANYSTCDRSNLADWLGSLDPRFRQYTYGLVSCGLDRSLLHRVSEQQLLEDCGIHLGVHRARILTAAREMLHSPLPCTGGKPSGDTPDVFISYRRNSGSQLASLLKVHLQLHGFSVFIDVEKLEAGKFEDKLIQSVMGARNFVLVLSPGALDKCMQDHDCKDWVHKEIVTALSCGKNIVPIIDGFEWPEPQVLPEDMQAVLTFNGIKWSHEYQEATIEKIIRFLQGRSSRDSSAGSDTSLEGAAPMGPT
>3dv5_C mol:protein length:402  Beta-secretase 1
GPDEEPEEPGRRGSFVEMVDNLRGKSGQGYYVEMTVGSPPQTLNILVDTGSSNFAVGAAPHPFLHRYYQRQLSSTYRDLRKGVYVPYTQGKWEGELGTDLVSIPHGPNVTVRANIAAITESDKFFINGSNWEGILGLAYAEIARPDDSLEPFFDSLVKQTHVPNLFSLQLCGAGFPLNQSEVLASVGGSMIIGGIDHSLYTGSLWYTPIRREWYYEVIIVRVEINGQDLKMDCKEYNYDKSIVDSGTTNLRLPKKVFEAAVKSIKAASSTEKFPDGFWLGEQLVCWQAGTTPWNIFPVISLYLMGEVTNQSFRITILPQQYLRPVEDVATSQDDCYKFAISQSSTGTVMGAVIMEGFYVVFDRARKRIGFAVSACHVHDEFRTAAVEGPFVTLDMEDCGYNI
>5lky_C mol:protein length:300  N-acetylneuraminate lyase
MEHHHHHHNKDLKGLYAALLVPFDENGQVNEQGLKQIAQNAIETEELDGLYVNGSSGENFLLNTEQKKQVFKVAKEAVGDKVKLIAQVGSLDLNEAIELGKYATELGYDALSAVTPFYYPFTFEEIRDYYFDIIEATQNNMIIYAIPDLTGVNISIEQFSELFNHEKIVGVKYTAPNFFLLERIRKAFPDKLILSGCDEMLVQATISGVDGAIGSTYNVNGRRARKIFDLARQGQIQEAYQLQHDSNDIIETVLSMGIYPTLKEILRHRGIDAGLPKRPFKPFNEAHRQTLDQLIAKYDL
>5lzz_OO mol:protein length:168  uS11
MKARALSGSGVRRRRAAMAPRKGKEKKEEQVISLGPQVAEGENVFGVCHIFASFNDTFVHVTDLSGKETICRVTGGMKVKADRDESSPYAAMLAAQDVAQRCKELGITALHIKLRATGGNRTKTPGPGAQSALRALARSGMKIGRIEDVTPIPSDSTRRKGGRRGRRL
>6swb_A mol:protein length:135  Two-component response regulator
HHHHHHWKVLIADDEAIIREGIRESIDWNEFNMEVVAEAEDGEEALELALRHRVDVLFVDLSMPIMDGLTLMKYAREKLPNCHMIVITGYDEFSYAQEAIRLQVDDYLLKPTDPQRLREVVAKVKEKLEQEQKEK
>1z7h_A mol:protein length:447  Tetanus toxin light chain
GSHMMPITINNFRYSDPVNNDTIIMMEPPYCKGLDIYYKAFKITDRIWIVPERYEFGTKPEDFNPPSSLIEGASEYYDPNYLRTDSDKDRFLQTMVKLFNRIKNNVAGEALLDKIINAIPYLGNSYSLLDKFDTNSNSVSFNLLEQDPSGATTKSAMLTNLIIFGPGPVLNKNEVRGIVLRVDNKNYFPCRDGFGSIMQMAFCPEYVPTFDNVIENITSLTIGKSKYFQDPALLLMHELIHVLHGLYGMQVSSHEIIPSKQEIYMQHTYPISAEELFTFGGQDANLISIDIKNDLYEKTLNDYKAIANKLSQVTSCNDPNIDIDSYKQIYQQKYQFDKDSNGQYIVNEDKFQILYNSIMYGFTEVELGKKFNIKTRLSYFSMNHDPVKIPNLLDDTIYNDTEGFNIESKDLKSEYKGQNMRVNTNAFRNVDGSGLVSKLIGLCKKII
>6sic_o mol:protein length:174  CRISPR-associated protein Cmrx
MSTQREYVFIPITNSITIDVKITIGGSDHITNIDERGIHNVLVITGYAVDEKNGRLVPTLDPCDYVKGILVAGTPQQAQSNDFLTLKLPANKLYLIRKKGNISDDLKIYIPYSSPDARNSMKTKPVSISDDTIVNNIIKEVFDKIYNITQKEKVKIEKVKEDIKELFSYYALEQ
>1nlq_C mol:protein length:108  Nucleoplasmin-like protein
MAEESFYGVTLTAESDSVTWDVDEDYARGQKLVIKQILLGAEAKENEFNVVEVNTPKDSVQIPIAVLKAGETRAVNPDVEFYESKVTFKLIKGSGPVYIHGHNIKDDV
>3gtc_A mol:protein length:358  Beta-lactamase
APQQINDIVHRTITPLIEQQKIPGMAVAVIYQGKPYYFTWGYADIAKKQPVTQQTLFELGSVSKTFTGVLGGDAIARGEIKLSDPTTKYWPELTAKQWNGITLLHLATYTAGGLPLQVPDEVKSSSDLLRFYQNWQPAWAPGTQRLYANSSIGLFGALAVKPSGLSFEQAMQTRVFQPLKLNHTWINVPPAEEKNYAWGYREGKAVHVSPGALDAEAYGVKSTIEDMARWVQSNLKPLDINEKTLQQGIQLAQSRYWQTGDMYQGLGWEMLDWPVNPDSIINGSDNKIALAARPVKAITPPTPAVRASWVHKTGATGGFGSYVAFIPEKELGIVMLANKNYPNPARVDAAWQILNALQ
>7av1_A mol:protein length:613  Leukotriene A-4 hydrolase
GPGPEIVDTCSLASPASVCRTKHLHLRCSVDFTRRTLTGTAALTVQSQEDNLRSLVLDTKDLTIEKVVINGQEVKYALGERQSYKGSPMEISLPIALSKNQEIVIEISFETSPKSSALQWLTPEQTSGKEHPYLFSQCQAIHCRAILPCQDTPSVKLTYTAEVSVPKELVALMSAIRDGETPDPEDPSRKIYKFIQKVPIPCYLIALVVGALESRQIGPRTLVWSEKEQVEKSAYEFSETESMLKIAEDLGGPYVWGQYDLLVLPPSFPYGGMENPCLTFVTPTLLAGDKSLSNVIAHEISHSWTGNLVTNKTWDHFWLNEGHTVYLERHICGRLFGEKFRHFNALGGWGELQNSVKTFGETHPFTKLVVDLTDIDPDVAYSSVPYEKGFALLFYLEQLLGGPEIFLGFLKAYVEKFSYKSITTDDWKDFLYSYFKDKVDVLNQVDWNAWLYSPGLPPIKPNYDMTLTNACIALSQRWITAKEDDLNSFNATDLKDLSSHQLNEFLAQTLQRAPLPLGHIKRMQEVYNFNAINNSEIRFRWLRLCIQSKWEDAIPLALKMATEQGRMKFTRPLFKDLAAFDKSHDQAVRTYQEHKASMHPVTAMLVGKDLKVD
>3wkm_B mol:protein length:180  Putative zinc metalloprotease aq_1964
GSEVPKYLKEPVVVGYVQRDSIAQKIGIKPGDKIIKINGYEVRTWEDLRDALIRLSLDGVKETTLFLERNGEVLHLTIKVPNVQKGEELGIAPLVKPVVGGVKKGSPADQVGIKPGDLILEVNGKKINTWYELVEEVRKSQGKAIKLKILRNGKMIEKELIPAKDPKTGTYFIGLFPKTE
>7mei_e mol:protein length:215  DNA-directed RNA polymerases I, II, and III subunit RPABC1
MDQENERNISRLWRAFRTVKEMVKDRGYFITQEEVELPLEDFKAKYCDSMGRPQRKMMSFQANPTEESISKFPDMGSLWVEFCDEPSVGVKTMKTFVIHIQEKNFQTGIFVYQNNITPSAMKLVPSIPPATIETFNEAALVVNITHHELVPKHIRLSSDEKRELLKRYRLKESQLPRIQRADPVALYLGLKRGEVVKIIRKSETSGRYASYRICM
>1e67_D mol:protein length:128  AZURIN
AECSVDIQGNDQMQFNTNAITVDKSCKQFTVNLSHPGNLPKNVMGHNWVLSTAADMQGVVTDGMASGLDKDYLKPDDSRVIAHTKLIGSGEKDSVTFDVSKLKEGEQYMFFCTFPGHSALMKGTLTLK
>5dzn_F mol:protein length:114  T-cell immunoglobulin and mucin domain-containing protein 4
MVTSETVVTEVLGHRVTLPCLYSSWSHNSNSMCWGKDQCPYSGCKEALIRTDGMRVTSRKSAKYRLQGTIPRGDVSLTILNPSESDSGVYCCRIEVPGWFNDVKINVRLNLQRA
>3s34_L mol:protein length:214  1121B Fab light chain
DIQMTQSPSSVSASIGDRVTITCRASQGIDNWLGWYQQKPGKAPKLLIYDASNLDTGVPSRFSGSGSGTYFTLTISSLQAEDFAVYFCQQAKAFPPTFGGGTKVDIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC
>6wz5_A mol:protein length:135  Histone H3.2
ARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVALFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA
>6r1u_A mol:protein length:135  Histone H3.2
ARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVALFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA
>1ht6_A mol:protein length:405  ALPHA-AMYLASE ISOZYME 1
HQVLFQGFNWESWKQSGGWYNMMMGKVDDIAAAGVTHVWLPPPSHSVSNEGYMPGRLYDIDASKYGNAAELKSLIGALHGKGVQAIADIVINHRCADYKDSRGIYCIFEGGTSDGRLDWGPHMICRDDTKYSDGTANLDTGADFAAAPDIDHLNDRVQRELKEWLLWLKSDLGFDAWRLDFARGYSPEMAKVYIDGTSPSLAVAEVWDNMATGGDGKPNYDQDAHRQNLVNWVDKVGGAASAGMVFDFTTKGILNAAVEGELWRLIDPQGKAPGVMGWWPAKAVTFVDNHDTGSTQAMWPFPSDKVMQGYAYILTHPGIPCIFYDHFFNWGFKDQIAALVAIRKRNGITATSALKILMHEGDAYVAEIDGKVVVKIGSRYDVGAVIPAGFVTSAHGNDYAVWEKN
>2av7_E mol:protein length:100  Beta-2-microglobulin
MIQRTPKIQVYSRHPAENGKSNFLNCYVSGFHPSDIEVDLLKNGERIEKVEHSDLSFSKDWSFYLLYYTEFTPTEKDEYACRVNHVTLSQPKIVKWDRDM
>5pcd_A mol:protein length:138  Bromodomain adjacent to zinc finger domain protein 2B
MHHHHHHSSGVDLGTENLYFQSMSVKKPKRDDSKDLALCSMILTEMETHEDAWPFLLPVNLKLVPGYKKVIKKPMDFSTIREKLSSGQYPNLETFALDVRLVFDNCETFNEDDSDIGRAGHNMRKYFEKKWTDTFKVS
>5cx1_L mol:protein length:523  Nitrogenase molybdenum-iron protein beta chain
MSQQVDKIKASYPLFLDQDYKDMLAKKRDGFEEKYPQDKIDEVFQWTTTKEYQELNFQREALTVNPAKACQPLGAVLCALGFEKTMPYVHGSQGCVAYFRSYFNRHFREPVSCVSDSMTEDAAVFGGQQNMKDGLQNCKATYKPDMIAVSTTCMAEVIGDDLNAFINNSKKEGFIPDEFPVPFAHTPSFVGSHVTGWDNMFEGIARYFTLKSMDDKVVGSNKKINIVPGFETYLGNFRVIKRMLSEMGVGYSLLSDPEEVLDTPADGQFRMYAGGTTQEEMKDAPNALNTVLLQPWHLEKTKKFVEGTWKHEVPKLNIPMGLDWTDEFLMKVSEISGQPIPASLTKERGRLVDMMTDSHTWLHGKRFALWGDPDFVMGLVKFLLELGCEPVHILCHNGNERWKKAVDAILAASPYGKNATVYIGKDLWHLRSLVFTDKPDFMIGNSYGKFIQRDTLHKGKEFEVPLIRIGFPIFDRHHLHRSTTLGYEGAMQILTTLVNSILERLDEETRGMQATDYNHDLVR
>3cw1_1 mol:protein length:86  Small nuclear ribonucleoprotein F
MSLPLNPKPFLNGLTGKPVMVKLKWGMEYKGYLVSVDGYMNMQLANTEEYIDGALSGHLGEVLIRCNNVLYIRGVEEEEEDGEMRE
>7toc_A mol:protein length:363  Ketol-acid reductoisomerase, mitochondrial
SNAPVVSAAPLATRGLKTINFGGTEEVVHERADWPREKLLEYFKNDTMALIGYGSQGYGQGLNLRDNGLNVIIGVRKNGASWKAAIEDGWVPGENLFDVKEAITKGTIIMNLLSDAAQSETWPDLKPLITEGKTLYFSHGFSPVFKDLTKVEPPSNVDVILAAPKGSGRTVRSLFLEGRGINSSYAVWNDVTGKAEEKAIAMAVAIGSGYVYQTTFEREVNSDLYGERGCLMGGIHGMFLAQYEVLRENGHTPSEAFNETVEEATQSLYPLIGKYGMDYMYDACSTTARRGALDWYPRFKDALKPVFVELYESVKNGTETQRSLDFNGAPDYRERLEEELETIRNMEIWKVGKEVRKLRPENQ
>6yfg_IG mol:protein length:130  coat protein
SKPIAIFKLRELSSDSTLFTLPGHSVTLPNTLGIVSHLPTPRKGNPGTVKTMRNLRKTILLGAGTASERAVPIVIKTETSFPVGTTEEDRAEVLKQMASFLIEEVKNNQELAYSGYVQDKYFIEDLVITE
>4ac5_H mol:protein length:258  REACTION CENTER PROTEIN H CHAIN
MYHGALAQHLDIAQLVWYAQWLVIWTVVLLYLRREDRREGYPLVEPLGLVKLAPEDGQVYELPYPKTFVLPHGGTVTVPRRRPETRELKLAQTDGFEGAPLQPTGNPLVDAVGPASYAERAEVVDATVDGKAKIVPLRVATDFSIAEGDVDPRGLPVVAADGVEAGTVTDLWVDRSEHYFRYLELSVAGSARTALIPLGFCDVKKDKIVVTSILSEQFANVPRLQSRDQITLREEDKVSAYYAGGLLYATPERAESLL
>5m9e_B mol:protein length:77  Microtubule integrity protein mal3
SGSAKQAQQQITSLETQLYEVNETMFGLERERDFYFNKLREIEILVQTHLTTSPMSMENMLERIQAILYSTEDGFEL
>5o61_BH mol:protein length:132  30S ribosomal protein S8
MTMTDPIADFLTRLRNANSAYHDEVTLPHSKLKANIAEILKREGYISDYRTEDARVGKSLVVQLKYGPSRERSIAGLRRVSKPGLRVYAKSTNLPRVLGGLGVAIISTSSGLLTDRQAARQGVGGEVLAYVW
>6owg_CF mol:protein length:105  Ethanolamine utilization protein EutN/carboxysome structural protein Ccml
MQMAKVCGTVVGTQKLPSMTGVKLLLLQFIDANGELLPKYEVAADPVGAGLGEWVLVNRGSAARQTEYHQNRPLDAMVVAIIDTVTVNNRRLYGEGSWSHPQFEK
>6ywv_K mol:protein length:249  60S ribosomal protein L16
MKHNASSALLSAFQGLRISSSATPFRAASLATSAVRRPIAPTPVSVASHVRLFSATAIQAGSWLEPNLNRKKKMMKGRPRVPTGGSTKGTTVVWGDYGLRMRDHHRRISAQQLKLAEDTIKQRLRGQKYRLYKRVACNVGVYVSGNEMRMGKGKGSFDHWATRVAVNQIIFEIRGQLHEQVIRDAFRLAGHKLPGLYEFVKKGDPPVVGITKLEDGLTVEDLKNPRKKLLMPEITQSAASTSSTAAPPS
>2f0x_F mol:protein length:148  Thioesterase superfamily member 2
MTSMTQSLREVIKAMTKARNFERVLGKITLVSAAPGKVICEMKVEEEHTNAIGTLHGGLTATLVDNISTMALLCTERGAPGVSVDMNITYMSPAKLGEDIVITAHVLKQGKTLAFTSVDLTNKATGKLIAQGRHTKHLGNLEHHHHHH
>2q28_B mol:protein length:564  oxalyl-CoA decarboxylase
MSDQLQMTDGMHIIVEALKQNNIDTIYGVVGIPVTDMARHAQAEGIRYIGFRHEQSAGYAAAASGFLTQKPGICLTVSAPGFLNGLTALANATVNGFPMIMISGSSDRAIVDLQQGDYEELDQMNAAKPYAKAAFRVNQPQDLGIALARAIRVSVSGRPGGVYLDLPANVLAATMEKDEALTTIVKVENPSPALLPCPKSVTSAISLLAKAERPLIILGKGAAYSQADEQLREFIESAQIPFLPMSMAKGILEDTHPLSAAAARSFALANADVVMLVGARLNWLLAHGKKGWAADTQFIQLDIEPQEIDSNRPIAVPVVGDIASSMQGMLAELKQNTFTTPLVWRDILNIHKQQNAQKMHEKLSTDTQPLNYFNALSAVRDVLRENQDIYLVNEGANTLDNARNIIDMYKPRRRLDCGTWGVMGIGMGYAIGASVTSGSPVVAIEGDSAFGFSGMEIETICRYNLPVTIVIFNNGGIYRGDGVDLSGAGAPSPTDLLHHARYDKLMDAFRGVGYNVTTTDELRHALTTGIQSRKPTIINVVIDPAAGTESGHITKLNPKQVAGN
>3n7k_A mol:protein length:426  Botulinum neurotoxin type C1
NNINDSKILSLQNRKNTLVDTSGYNAEVSEEGDVQLNPIFPFDFKLGSSGEDRGKVIVTQNENIVYNSMYESFSISFWIRINKWVSNLPGYTIIDSVKNNSGWSIGIISNFLVFTLKQNEDSEQSINFSYDISNNAPGYNKWFFVTVTNNMMGNMKIYINGKLIDTIKVKELTGINFSKTITFEINKIPDTGLITSDSDNINMWIRDFYIFAKELDGKDINILFNSLQYTNVVKDYWGNDLRYNKEYYMVNIDYLNRYMYANSRQIVFNTRRNNNDFNEGYKIIIKRIRGNTNDTRVRGGDILYFDMTINNKAYNLFMKNETMYADNHSTEDIYAIGLREQTKDINDNIIFQIQPMNNTYYYASQIFKSNFNGENISGICSIGTYRFRLGGDWYRHNYLVPTVKQGNYASLLESTSTHWGFVPVSE
>6q6g_A mol:protein length:1855  Anaphase-promoting complex subunit 1,Anaphase-promoting complex subunit 1
MSNFYEERTTMIAARDLQEFVPFGRDHCKHHPNALNLQLRQLQPASELWSSDGAAGLVGSLQEVTIHEKQKESWQLRKGVSEIGEDVDYDEELYVAGNMVIWSKGSKSQALAVYKAFTVDSPVQQALWCDFIISQDKSEKAYSSNEVEKCICILQSSCINMHSIEGKDYIASLPFQVANVWPTKYGLLFERSASSHEVPPGSPREPLPTMFSMLHPLDEITPLVCKSGSLFGSSRVQYVVDHAMKIVFLNTDPSIVMTYDAVQNVHSVWTLRRVKSEEENVVLKFSEQGGTPQNVATSSSLTAHLRLAPETEPIVPELCIDHLWTETITNIREKNSQASKVFITSDLCGQKFLCFLVESQLQLRCVKFQESNDKTQLIFGSVTNIPAKDAAPVEKIDTMLVLEGSGNLVLYTGVVRVGKVFIPGLPAPSLTMSNTMPRPSTPLDGVSTPKPLSKLLGSLDEVVLLSPVPELRDSSKLHDSLYNEDCTFQQLGTYIHSIRDPVHNRVTLELSNGSMVRITIPEIATSELVQTCLQAIKFILPKEIAVQMLVKWYNVHSAPGGPSYHSEWNLFVTCLMNMMGYNTDRLAWTRNFDFEGSLSPVIAPKKARPSETGSDDDWEYLLNSDYHQNVESHLLNRSLCLSPSEASQMKDEDFSQNLSLDSSTLLFTHIPAIFFVLHLVYEELKLNTLMGEGICSLVELLVQLARDLKLGPYVDHYYRDYPTLVRTTGQVCTIDPGQTGFMHHPSFFTSEPPSIYQWVSSCLKGEGMPPYPYLPGICERSRLVVLSIALYILGDESLVSDESSQYLTRITIAPQKLQVEQEENRFSFRHSTSVSSLAERLVVWMTNVGFTLRDLETLPFGIALPIRDAIYHCREQPASDWPEAVCLLIGRQDLSKQACEGNLPKGKSVLSSDVPSGTETEEEDDGMNDMNHEVMSLIWSEDLRVQDVRRLLQSAHPVRVNVVQYPELSDHEFIEEKENRLLQLCQRTMALPVGRGMFTLFSYHPVPTEPLPIPKLNLTGRAPPRNTTVDLNSGNIDVPPNMTSWASFHNGVAAGLKIAPASQIDSAWIVYNKPKHAELANEYAGFLMALGLNGHLTKLATLNIHDYLTKGHEMTSIGLLLGVSAAKLGTMDMSITRLLSIHIPALLPPTSTELDVPHNVQVAAVVGIGLVYQGTAHRHTAEVLLAEIGRPPGPEMEYCTDRESYSLAAGLALGMVCLGHGSNLIGMSDLNVPEQLYQYMVGGHRRFQTGMHREKHKSPSYQIKEGDTINVDVTCPGATLALAMIYLKTNNRSIADWLRAPDTMYLLDFVKPEFLLLRTLARCLILWDDILPNSKWVDSNVPQIIRENSISLSEIELPCSEDLNLETLSQAHVYIIAGACLSLGFRFAGSENLSAFNCLHKFAKDFMTYLSAPNASVTGPHNLETCLSVVLLSLAMVMAGSGNLKVLQLCRFLHMKTGGEMNYGFHLAHHMALGLLFLGGGRYSLSTSNSSIAALLCALYPHFPAHSTDNRYHLQALRHLYVLAAEPRLLVPVDVDTNTPCYALLEVTYKGTQWYEQTKEELMAPTLLPELHLLKQIKVKGPRYWELLIDLSKGTQHLKSILSKDGVLYVKLRAGQLSYKEDPMGWQSLLAQTVANRNSEARAFKPETISAFTSDPALLSFAEYFCKPTVNMGQKQEILDLFSSVLYECVTQETPEMLPAYIAMDQAIRRLGRREMSETSELWQIKLVLEFFSSRSHQERLQNHPKRGLFMNSEFLPVVKCTIDNTLDQWLQVGGDMCVHAYLSGQPLEESQLSMLACFLVYHSVPAPQHLPPIGLEGSTSFAELLFKFKQLKMPVRALLRLAPLLLGNPQPMVM
>6riq_F mol:protein length:144  MinC
KDSAPRKPAEEPSPSVGEARPEPAKAEEKPAEPVSRPTKVVKTPVRGGMQIYAAGGDLIVLAAVSPGAELLADGNIHVYGPMRGRALAGVKGDATARIFCQQLAAELVSIAGNYKVAEDLRRSPQWGKAVHVSLSGDVLNITRL
>7ohr_v mol:protein length:231  Nucleolar protein 16
MTSVRKRKMNRSSVGKATRRNKDKQRKINIQSNPIIAANWDYSLTMAQNYKKLGLRAKLQTPAGGKEADLSKVVKRIPLTKPVLDEDEDEDEGEDEQNDYNAATVELDENEIPEGGARIQRDKNGDVVRVVYGKKKNFDADEDVNEIKARDTTEETEVVKKLEELASRPVIRKERSQSEREEEWLEKLYKKHGDDYKKMFFDKKLNIYQQSEGDLKRRLLRWKKRNGIASK
>4v89_B7 mol:protein length:65  50S ribosomal protein L35
MPKIKTVRGAAKRFKKTGKGGFKHKHANLRHILTKKATKRKRHLRPKAMVSKGDLGLVIACLPYA
>3gdv_D mol:protein length:3  YQF peptide
YQF
>7du2_M mol:protein length:708  DNA-directed RNA polymerase III subunit RPC5
MANEEDDPVVQEIDVYLAKSLAEKLYLFQYPVRPASMTYDDIPHLSAKIKPKQQKVELEMAIDTLNPNYCRSKGEQIALNVDGACADETSTYSSKLMDKQTFCSSQTTSNTSRYAAALYRQGELHLTPLHGILQLRPSFSYLDKADAKHREREAANEAGDSSQDEAEDDVKQITVRFSRPESEQARQRRVQSYEFLQKKHAEEPWVHLHYYGLRDSRSEHERQYLLCPGSSGVENTELVKSPSEYLMMLMPPSQEEEKDKPVAPSNVLSMAQLRTLPLADQIKILMKNVKVMPFANLMSLLGPSIDSVAVLRGIQKVAMLVQGNWVVKSDILYPKDSSSPHSGVPAEVLCRGRDFVMWKFTQSRWVVRKEVATVTKLCAEDVKDFLEHMAVVRINKGWEFILPYDGEFIKKHPDVVQRQHMLWTGIQAKLEKVYNLVKETMPKKPDAQSGPAGLVCGDQRIQVAKTKAQQNHALLERELQRRKEQLRVPAVPPGVRIKEEPVSEEGEEDEEQEAEEEPMDTSPSGLHSKLANGLPLGRAAGTDSFNGHPPQGCASTPVARELKAFVEATFQRQFVLTLSELKRLFNLHLASLPPGHTLFSGISDRMLQDTVLAAGCKQILVPFPPQTAASPDEQKVFALWESGDMSDQHRQVLLEIFSKNYRVRRNMIQSRLTQECGEDLSKQEVDKVLKDCCVSYGGMWYLKGTVQS
>6qiu_P mol:protein length:10  Ataxin-1 phosphopeptide
KRRWSAPESR
>7dbc_D mol:protein length:445  Tubulin beta chain
MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGSYHGDSDLQLERINVYYNEATGNKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWAKGHYTEGAELVDSVLDVVRKESESCDCLQGFQLTHSLGGGTGSGMGTLLISKIREEYPDRIMNTFSVMPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEALYDICFRTLKLTTPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSRGSQQYRALTVPELTQQMFDSKNMMAACDPRHGRYLTVAAIFRGRMSMKEVDEQMLNVQNKNSSYFVEWIPNNVKTAVCDIPPRGLKMSATFIGNSTAIQELFKRISEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATADEQGEFEEEEGEDEA
>2kd3_A mol:protein length:113  Sclerostin
GSHMNGGRPPHHPYDAKDVSEYSCRELHYTRFLTDGPCRSAKPVTELVCSGQCGPARLLPNAIGRVKWWRPNGPDFRCIPDRYRAQRVQLLCPGGAAPRSRKVRLVASCKCKR
>3e15_D mol:protein length:312  Glucose-6-phosphate 1-dehydrogenase
MAHHHHHHMDCQALAKSLEQMNHLHNVKYLEAKDLTDFNQKSAYYICHQIAEKQLSKEGGHVVIGLSGGKTPIDVYKNIALVKDIKIDTSKLIFFIIDERYKRDDHKFSNYNNIKFLFESLKINEKEQLYRPDTSKNIVECVRDYNEKIKNMVKKYTKVDIAILGMGSDFHIASLFPNIFFNIYMNNYQNSYIYDESSIKVANSNDTSDNDNLDLLKEYVYFTTTNNFDVRKRITVSLDLLGNASSKIFLLNSTDKLDLWKNMLLKSYVDVNYCLYPAVYLIDSMNTTVVTCGYTNYPQMLEDIYVSNSSLS
>6xhv_1S mol:protein length:112  50S ribosomal protein L18
MARLTAYERRKFRVRNRIKRTGRLRLSVFRSLKHIYAQIIDDEKGVTLVSASSLALKLKGNKTEVARQVGRALAEKALALGIKQVAFDRGPYKYHGRVKALAEGAREGGLEF
>4l1u_E mol:protein length:138  RNA polymerase-associated protein RTF1 homolog
GDITHMVSLPEELNRVRLSRHKLERWCHMPFFAKTVTGCFVRIGIGNHNSKPVYRVAEITGVVETAKVYQLGGTRTNKGLQLRHGNDQRVFRLEFVSNQEFTESEFMKWKEAMFSAGMQLPTLDEINKKELSIKEALN
>4v3p_LX mol:protein length:122  60S ribosomal protein L23a
RKSKKIRTSVTFHRPKTLKKARDPKYPRVSAPGRNKLDQYQILKYPLTTESAMKKIEDNNTLVFIVDLKADKKKIKAAVKKMYDIQAKKVNTLIRPDGKKKAYVKLTPDYDALDVANKIGII
>6vwr_A mol:protein length:346  Clavaminate synthase 3
MGSSHHHHHHSSGLVPRGSHMMMTVVDCSEYSADLLALASRLPRIPRQDLYGFLDAAHEAAGDLPEGLGTALDRFNADGSHDGYLMLRGLPVEDDDDLPATPTSTPAPVDRPLQNMEAMLAVIGRRLGLHTGYRELRSGTVYHDVYPSPGAHHLSSETSETLLEFHTEMAYHVLQPNYVMLACSRADHERKAATLVGSIRKALPLIPEEVRARLFDRPMPCCVDVAFRGGVENPGAIANVKPLYGDPRDPFLGYDRELLAPREPDDVEAVAVLSKALDEVSEAVRLTPGDLLVVDNFRTTHARTPFSPRWDGKDRWLHRVYIRTDRNDQLSGGERAGDVVDFSPRR
>6hsv_A mol:protein length:124  Toxin B subunit
TPQNITDLCAEYHNTQIYTLNDKIFSYTESLAGKREMAIITFKNGAIFQVEVPGSQHIDSQKKAIERMKDTLRIAYLTEAKVEKLCVWNNKTPHAIAAISMANGVSALEKEVSALKEKVSALEF
>4u1v_DW mol:protein length:76  50S ribosomal protein L27
TRNGRDSEAKRLGVKRFGGESVLAGSIIVRQRGTKFHAGANVGCGRDHTLFAKADGKVKFEVKGPKNRKFISIEAE
>5s53_D mol:protein length:445  Tubulin beta-2B chain
MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGSYHGDSDLQLERINVYYNEATGNKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWAKGHYTEGAELVDSVLDVVRKESESCDCLQGFQLTHSLGGGTGSGMGTLLISKIREEYPDRIMNTFSVMPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEALYDICFRTLKLTTPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSRGSQQYRALTVPELTQQMFDSKNMMAACDPRHGRYLTVAAIFRGRMSMKEVDEQMLNVQNKNSSYFVEWIPNNVKTAVCDIPPRGLKMSATFIGNSTAIQELFKRISEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATADEQGEFEEEEGEDEA
>3tbt_I mol:protein length:9  GLYCOPROTEIN G1
KAPSNFATM
>6yfg_LM mol:protein length:130  coat protein
SKPIAIFKLRELSSDSTLFTLPGHSVTLPNTLGIVSHLPTPRKGNPGTVKTMRNLRKTILLGAGTASERAVPIVIKTETSFPVGTTEEDRAEVLKQMASFLIEEVKNNQELAYSGYVQDKYFIEDLVITE
>2b9v_H mol:protein length:652  alpha-amino acid ester hydrolase
APAADAAQAHDPLSVQTGSDIPASVHMPTDQQRDYIKREVMVPMRDGVKLYTVIVIPKNARNAPILLTRTPYNAKGRANRVPNALTMREVLPQGDDVFVEGGYIRVFQDIRGKYGSQGDYVMTRPPHGPLNPTKTDETTDAWDTVDWLVHNVPESNGRVGMTGSSYEGFTVVMALLDPHPALKVAAPESPMVDGWMGDDWFHYGAFRQGAFDYFVSQMTARGGGNDIPRRDADDYTNFLKAGSAGSFATQAGLDQYPFWQRMHAHPAYDAFWQGQALDKILAQRKPTVPMLWEQGLWDQEDMWGAIHAWQALKDADVKAPNTLVMGPWRHSGVNYNGSTLGPLEFEGDTAHQYRRDVFRPFFDEYLKPGSASVHLPDAIIYNTGDQKWDYYRSWPSVCESNCTGGLTPLYLADGHGLSFTHPAADGADSYVSDPAHPVPFISRPFAFAQSSRWKPWLVQDQREAESRPDVVTYETEVLDEPVRVSGVPVADLFAATSGTDSDWVVKLIDVQPAMTPDDPKMGGYELPVSMDIFRGRYRKDFAKPEALQPDATLHYHFTLPAVNHVFAKGHRIMVQIQSSWFPLYDRNPQKFVPNIFDAKPADYTVATQSIHHGGKEATSILLPVVKQKLGPEQKLISEEDLNSAVDHHHHHH
>7z1z_G mol:protein length:281  Pol polyprotein
WIENIPLAEEEHNKWHQDAVSLHLEFGIPRTAAEDIVQQCDVCQENKMPSTLRGSNKRGIDHWQVDYTHYEDKIILVWVETNSGLIYAERVKGETGQEFRVQTMKWYAMFAPKSLQSDNGPAFVAESTQLLMKYLGIEHTTGIPWNPQSQALVERTHQTLKNTLEKLIPMFNAFESALAGTLITLNIKRKGGLGTSPMDIFIFNKEQQRIQQQSKSKQEKIRFCYYRTRKRGHPGEWQGPTQVLWGGDGAIVVKDRGTDRYLVIANKDVKFIPPPKEIQKE
>5lj5_O mol:protein length:590  Pre-mRNA-splicing factor CEF1
MPPVPIYVKGGVWTNVEDQILKAAVQKYGTHQWSKVASLLQKKTARQSELRWNEYLNPKLNFTEFSKEEDAQLLDLARELPNQWRTIADMMARPAQVCVERYNRLLESEDSGGAALSTGVTDLKAGDINPNAETQMARPDNGDLEDEEKEMLAEARARLLNTQGKKATRKIRERMLEESKRIAELQKRRELKQAGINVAIKKPKKKYGTDIDYNEDIVYEQAPMPGIYDTSTEDRQIKKKFEQFERKVNRKGLDGNKDKPSKKNKDKKRKHDENEHVEKAALGESTTLTDEYKKPKLILSAPGTKQGKVTYKKKLESKRQKLIEAQATGTVLTPKELLPHDSGQEDNERSNIKSGKQLKSRIRKFLVQMFASLPSPKNDFEIVLSEDEKEEDAEIAEYEKEFENERAMNEEDNFIEPPSQNDAPRVSLVAVPLAYSTLPIPEFKNNPQSAIDNKYNLLVANAINKEPHMVPEDTVDFLKEVESRMQHITQGRTSMKIQFKTAMPPTEVLLESIQSKVESIEQLQRKLQHVQPLEQQNNEMCSTLCHHSLPALIEGQRKYYADYYAYRQEIRSLEGRRKRLQAMLNSSSSI
>6j8m_D mol:protein length:147  Cytochrome c oxidase subunit 4 isoform 1
AHGSVVKSEDYALPSYVDRRDYPLPDVAHVKNLSASQKALKEKEKASWSSLSIDEKVELYRLKFKESFAEMNRSTNEWKTVVGAAMFFIGFTALLLIWEKHYVYGPIPHTFEEEWVAKQTKRMLDMKVAPIQGFSAKWDYDKNEWKK
>6vw1_F mol:protein length:217  SARS-CoV-2 chimeric RBD
RVVPSGDVVRFPNITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLNAPATVCGPKLSTDLIK
>3n99_b mol:protein length:290  uncharacterized protein TM1086
HHHHHHGHMRTNKDRLVRISVVGEIAPAKMRSPYSVTTEGTVRVIPVLGGITYNVKVGDSAYGWAGDHVEPGVSVMARRKEEEIPLMTLSCIGNEVIVMSGDAKGSRGFVTGKHGGVNHVLVHFEEEVLGKLMVGDKILIKAWGQGLKLLDHPDVKVMNIDPDLFEKLGIQEKNGKIHVPVVAKIPAHMMGSGIGASSSASTDYDIMASNPEDLGVADLKLGDIVAIQDHDNSYGVGKYRKGAVSIGVVVHSACVSAGHGPGVVVIMTGDESKILPEEVERANISDYLVR
>2j1k_M mol:protein length:197  FIBER PROTEIN
MRGSHHHHHHGSPPAAPITLWTGPGPSINGFINDTPVIRCFICLTRDSNLVTVNASFVGEGGYRIVSPTQSQFSLIMEFDQFGQLMSTGNINSTTTWGEKPWGNNTVQPRPSHTWKLCMPNREVYSTPAATISRCGLDSIAVDGAPSRSIDCMLIINKPKGVATYTLTFRFLNFNRLSGGTLFKTDVLTFTYVGENQ
>5dc3_D1 mol:protein length:87  40S ribosomal protein S21-A
MENDKGQLVELYVPRKCSATNRIIKADDHASVQINVAKVDEEGRAIPGEYVTYALSGYVRSRGESDDSLNRLAQNDGLLKNVWSYSR
>1nun_A mol:protein length:145  Fibroblast growth factor-10
GRHVRSYNHLQGDVRWRKLFSFTKYFLKIEKNGKVSGTKKENCPYSILEITSVEIGVVAVKAINSNYYLAMNKKGKLYGSKEFNNDCKLKERIEENGYNTYASFNWQHNGRQMYVALNGKGAPRRGQKTRRKNTSAHFLPMVVHS
>2w58_A mol:protein length:202  PRIMOSOME COMPONENT (HELICASE LOADER)
DERKRQESLIQSMFMPREILRASLSDVDLNDDGRIKAIRFAERFVAEYEPGKKMKGLYLHGSFGVGKTYLLAAIANELAKRNVSSLIVYVPELFRELKHSLQDQTMNEKLDYIKKVPVLMLDDLGAEAMSSWVRDDVFGPILQYRMFENLPTFFTSNFDMQQLAHHLTYSQRGEEEKVKAARIMERIRYLAYPIEITGPNRR
>4bp7_CY mol:protein length:129  COAT PROTEIN
ASNFTQFVLVDNGGTGDVTVAPSNFANGVAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKVATQTVGGVELPVAAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY
>6kbp_A mol:protein length:338  D-amino-acid oxidase
MRVVVIGAGVIGLSTALCIHERYHSVLQPLDIKVYADRFTPLTTTDVAAGLWQPYLSDPNNPQEADWSQQTFDYLLSHVHSPNAENLGLFLISGYNLFHEAIPDPSWKDTVLGFRKLTPRELDMFPDYGYGWFHTSLILEGKNYLQWLTERLTERGVKFFQRKVESFEEVAREGADVIVNCTGVWAGALQRDPLLQPGRGQIMKVDAPWMKHFILTHDLERGIYNSPYIIPGTQTVTLGGIFQLGNWSELNNIQDHNTIWEGCCRLEPTLKNARIIGERTGFRPVRPQIRLEREQLRTGPSNTEVIHNYGHGGYGLTIHWGCALEAAKLFGRILEEKK
>6yfg_HY mol:protein length:130  coat protein
SKPIAIFKLRELSSDSTLFTLPGHSVTLPNTLGIVSHLPTPRKGNPGTVKTMRNLRKTILLGAGTASERAVPIVIKTETSFPVGTTEEDRAEVLKQMASFLIEEVKNNQELAYSGYVQDKYFIEDLVITE
>2wqj_K mol:protein length:35  TUMOR PROTEIN P73
GSDEDTYYLQVRGRENFEILMKLKESLELMELVPQ
>3lyc_F mol:protein length:241  Putative pectinase
GGDGNITTENIPVSEYDCLELEGGGMVVNYTQSDAPEGLEIKTDRNIFEKYEFNVENHKLKIRPKKEFRKHTNFRPTEFMVTANSRNLKKLAAAGSTHVNINSPLQAEEFEAGLAGSGIIQFHDTASFTNLKIEIAGSGDFVGHKVYCEELNGDMAGSNTIVLGGTVGIAEFSIAGSGTVRAFDCTMDELECKIAGSGDIEAFVVNKIKAEIAGSGSVKYKGDPQDIQKKVMGSGKIEKVE
>6oj2_QQ mol:protein length:105  30S ribosomal protein S17
MPKKVLTGVVVSDKMQKTVTVLVERQFPHPLYGKVIKRSKKYLAHDPEEKYKLGDVVEIIESRPISKRKRFRVLRLVESGRMDLVEKYLIRRQNYESLSKRGGKA
>3sln_J mol:protein length:311  Capsid
ESRTKPFTVPILTVEEMTNSRFPIPLEKLFTGPSSAFVVQPQNGRCTTDGALLGTTQLSPVDICTFRGDVTHIAGTQNYTMNLASQNWNNYDPTEEIPAPLGTPDFVGKIQGVLTQTTRRDGSTRGHKATVSTGSVHFTPKLGSVQFSTDTSNDFETGQNTRFTPVGVVQDGSTTHQNEPQQWVLPDYSGRDSHNVHLAPAVAPTFPGEQLLFFRSTMPGCSGYPNMNLDCLLPQEWVQHFYQESAPAQSDVALLRFVNPDTGRVLFECKLHKSGYVTVAHTGQHDLVIPPNGYFRFDSWVNQFYTLAPMG
>6yfh_AK mol:protein length:156  coat protein
PAMTNIVLRDDQTSVATKTLIPIVSDGNMSVWRENAANVPIDGQIKLTGQWERMKDGTYRLNAKLEVPVMETAGAGGAYVAPPKVAYKVTASLTLYAPSRSTIADRANAMKMLSAVLCGADATAGTTLSPQSVTGDAWKNSALPFVFGFINQAFPT
>4qe8_D mol:protein length:13  Nuclear receptor coactivator 2
KENALLRYLLDKD
>5gaq_I mol:protein length:310  Lysenin
MSAKAAEGYEQIEVDVVAVWKEGYVYENRGSTSVDQKITITKGMKNVNSETRTVTATHSIGSTISTGDAFEIGSVEVSYSHSHEESQVSMTETEVYESKVIEHTITIPPTSKFTRWQLNADVGGADIEYMYLIDEVTPIGGTQSIPQVITSRAKIIVGRQIILGKTEIRIKHAERKEYMTVVSRKSWPAATLGHSKLFKFVLYEDWGGFRIKTLNTMYSGYEYAYSSDQGGIYFDQGTDNPKQRWAINKSLPLRHGDVVTFMNKYFTRSGLCYDDGPATNVYCLDKREDKWILEVVGLVPRGSGHHHHHH
>4c5q_B mol:protein length:79  PHOSPHOPROTEIN
MGDHYDDELFSDVQDIKTALAKIHEDNQKIISKLESLLLLKGEVESIKKQINRQNISISTLEGHLSSIMIAIPHHHHHH
>6f2n_A mol:protein length:227  Metallo-beta-lactamase type 2
SQKVEKTVIKNETGTISISQLNKNVWVHTELGSFNGEAVPSNGLVLNTSKGLVLVDSSWDDKLTKELIEMVEKKFQKRVTDVIITHAHADRIGGIKTLKERGIKAHSTALTAELAKKNGYEEPLGDLQTVTNLKFGNMKVETFYPGKGHTEDNIVVWLPQYNILVGGCLVKSTSAKDLGNVADAYVNEWSTSIENVLKRYRNINAVVPGHGEVGDKGLLLHTLDLLK
>5ef0_F mol:protein length:74  Transcription attenuation protein MtrB
MYTNSDFVVIKALEDGVNVIGLTRGADTRFHHSEKLDKGEVLIAQFTEHTSAIKVRGKAYIQTRHGVIESEGKK
>3tsz_A mol:protein length:391  Tight junction protein ZO-1
GSHMILRPSMKLVKFRKGDSVGLRLAGGNDVGIFVAGVLEDSPAAKEGLEEGDQILRVNNVDFTNIIREEAVLFLLDLPKGEEVTILAQKKKDVYRRIVESDVGDSFYIRTHFEYEKESPYGLSFNKGEVFRVVDTLYNGKLGSWLAIRIGKNHKEVERGIIPNKNRAEQLASVQYTLPKTAGGDRADFWRFRGLRSSKRNLRKSREDLSAQPVQTKFPAYERVVLREAGFLRPVTIFGPIADVAREKLAREEPDIYQIAKSEPRDAGTDQRSSGIIRLHTIKQIIDQDKHALLDVTPNAVDRLNYAQWYPIVVFLNPDSKQGVKTMRMRLCPESRKSARKLYERSHKLRKNNHHLFTTTINLNSMNDGWYGALKEAIQQQQNQLVWVSEG
>3jaj_d mol:protein length:107  Ribosomal protein eL31
NEVVTREYTINIHKRIHGVGFKKRAPRALKEIRKFAMKEMGTPDVRIDTRLNKAVWAKGIRNVPYRIRVRLSRKRNEDEDSPNKLYTLVTYVPVTTFKNLQTVNVDE
>5a1v_E mol:protein length:874  COATOMER SUBUNIT GAMMA-1
MLKKFDKKDEESGGGSNPLQHLEKSAVLQEARVFNETPINPRKCAHILTKILYLINQGEHLGTTEATEAFFAMTKLFQSNDPTLRRMCYLTIKEMSCIAEDVIIVTSSLTKDMTGKEDNYRGPAVRALCQITDSTMLQAVERYMKQAIVDKVPSVSSSALVSSLHLLKCSFDVVKRWVNEAQEAASSDNIMVQYHALGLLYHVRKNDRLAVSKMISKFTRHGLKSPFAYCMMIRVASKQLEEEDGSRDSPLFDFIESCLRNKHEMVVYEAASAIVNLPGCSAKELAPAVSVLQLFCSSPKAALRYAAVRTLNKVAMKHPSAVTACNLDLENLVTDSNRSIATLAITTLLKTGSESSIDRLMKQISSFMSEISDEFKVVVVQAISALCQKYPRKHAVLMNFLFTMLREEGGFEYKRAIVDCIISIIEENSESKETGLSHLCEFIEDCEFTVLATRILHLLGQEGPKTNNPSKYIRFIYNRVVLEHEEVRAGAVSALAKFGAQNEEMLPSILVLLKRCVMDDDNEVRDRATFYLNVLEQKQKALNAGYILNGLTVSIPGLEKALQQYTLEPSEKPFDLKSVPLATTPMAEQRPESTATAAVKQPEKVAATRQEIFQEQLAAVPEFQGLGPLFKSSPEPVALTESETEYVIRCTKHTFSDHLVFQFDCTNTLNDQTLENVTVQMEPTEAYEVLSYVPARSLPYNQPGTCYTLVALPTEDPTAVACTFSCVMKFTVKDCDPNTGEIDEEGYEDEYVLEDLEVTVADHIQKVMKVNFEAAWDEVGDEFEKEETFTLSTIKTLEEAVGNIVKFLGMHPCERSDKVPENKNTHTLLLAGVFRGGHDILVRSRLLLLDTVTMQVTARSSEELPVDIILASVG
>1b12_C mol:protein length:248  SIGNAL PEPTIDASE I
VRSFIYEPFQIPSGSMMPTLLIGDFILVEKFAYGIKDPIYQKTLIETGHPKRGDIVVFKYPEDPKLDYIKRAVGLPGDKVTYDPVSKELTIQPGCSSGQACENALPVTYSNVEPSDFVQTFSRRNGGEATSGFFEVPKNETKENGIRLSERKETLGDVTHRILTVPIAQDQVGMYYQQPGQQLATWIVPPGQYFMMGDNRDNSADSRYWGFVPEANLVGRATAIWMSFDKQEGEWPTGLRLSRIGGIH
>1ev4_D mol:protein length:221  GLUTATHIONE S-TRANSFERASE A1-1
SGKPVLHYFNARGRMECIRFLLAAAGVEFDEKFIQSPEDLEKLKKDGNLMFDQVPMVEIDGMKLAQTRAILNYIATKYDLYGKDMKERALIDMYSEGILDLTEMIMQLVICPPDQKEAKTALAKDRTKNRYLPAFEKVLKSHGQDYLVGNKLTRVDIHLLELLLYVEEFDASLLTSFPLLKAFKSRISSLPNVKKFLQPGSQRKLPMDAKQIEEARKIYKF
>7eyd_V4 mol:protein length:173  C-phycocyanin beta subunit
MTLDVFTKVVSQADSRGEFLSNEQLDALANVVKEGNKRLDVVNRITSNASAIVTNAARALFEEQPQLIAPGGNAYTNRRMAACLRDMEIILRYVTYAILAGDASVLDDRCLNGLRETYQALGTPGSSVAVGVQKMKDAAVGIANDPNGITKGDCSQLISEVASYFDRAAAAVG
>2cvk_A mol:protein length:110  Thioredoxin
MAKPIEVTDQNFDETLGQHPLVLVDFWAEWCAPCRMIAPILEEIAKEYEGKLLVAKLDVDENPKTAMRYRVMSIPTVILFKDGQPVEVLVGAQPKRNYQAKIEKHLPATA
>4ctf_D3 mol:protein length:226  P1
APIRVVSVPESDSFMSSVPDNSTPLYPKVVVPPRQVPGRFTNFIDVAKQTYSFCSISGKPYFEVTNTSGDEPLFQMDVSLSAAELHGTYVASLSSFFAQYRGSLNFNFIFTGAAATKAKFLVAFVPPHSAAPKTRDEAMACIHAVWDVGLNSAFSFNVPYSSPADFMAVYSAEATVVNVSGWLQVYALTALTSTDIAVNSKGRVLVAVSAGPDFSLRHPVDLPDKQ
>6vgn_G mol:protein length:200  ATP-dependent Clp protease proteolytic subunit
ILPSFIEHSSFGVKESNPYNKLFEERIIFLGVQVDDASANDIMAQLLVLESLDPDRDITMYINSPGGGFTSLMAIYDTMQYVRADIQTVCLGQAASAAAVLLAAGTPGKRMALPNARVLIHQPSLSGVIQGQFSDLEIQAAEIERMRTLMETTLARHTGKDAGVIRKDTDRDKILTAEEAKDYGIIDTVLEYRKLSAQTA
>6ase_A mol:protein length:170  GTPase KRas
GMTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTGGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQDLARSYGIPFIETSAKTRQGVDDAFYTLVREIRKHKEK
>1nno_B mol:protein length:543  NITRITE REDUCTASE
KDDMKAAEQYQGAASAVDPAHVVRTNGAPDMSESEFNEAKQIYFQRCAGCHGVLRKGATGKPLTPDITQQRGQQYLEALITYGTPLGMPNWGSSGELSKEQITLMAKYIQHTPPQPPEWGMPEMRESWKVLVKPEDRPKKQLNDLDLPNLFSVTLRDAGQIALVDGDSKKIVKVIDTGYAVHISRMSASGRYLLVIGRDARIDMIDLWAKEPTKVAEIKIGIEARSVESSKFKGYEDRYTIAGAYWPPQFAIMDGETLEPKQIVSTRGMTVDTQTYHPEPRVAAIIASHEHPEFIVNVKETGKVLLVNYKDIDNLTVTSIGAAPFLHDGGWDSSHRYFMTAANNSNKVAVIDSKDRRLSALVDVGKTPHPGRGANFVHPKYGPVWSTSHLGDGSISLIGTDPKNHPQYAWKKVAELQGQGGGSLFIKTHPKSSHLYVDTTFNPDARISQSVAVFDLKNLDAKYQVLPIAEWADLGEGAKRVVQPEYNKRGDEVWFSVWNGKNDSSALVVVDDKTLKLKAVVKDPRLITPTGKFNVYNTQHDVY
>6u3m_C mol:protein length:191  HLA class II histocompatibility antigen, DQ alpha 1 chain
EDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYVDLGRKETVWSLPVLRQFRFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLLPSAEESYDCKVEHWGLDKPLLKHWEPETSGDDDDK
>6wdh_z mol:protein length:58  50S ribosomal protein L30
AKTIKITQTRSAIGRLPKHKATLLGLGLRRIGHTVEREDTPAIRGMINAVSFMVKVEE
>4nrl_D mol:protein length:182  Hemagglutinin HA2 chain
GFFGAIAGFLEGGWEGMIAGWHGYTSHGAHGVAVAADLKSTQEAINKITKNLNSLSELEVKNLQRLSGAMNELHDEILELDEKVDDLRADTISSQIELAVLLSNEGIINSEDEHLLALERKLKKMLGPSAVEIGNGCFETKHKCNQTCLDRIAAGTFNAGDFSLPTFDSLNITAASGALVPR
>43ca_H mol:protein length:117  PROTEIN (IMMUNOGLOBULIN (HEAVY CHAIN))
QVQLVESGPGLVAPSQSLSITCTVSGISLSRYNVHWVRQSPGKGLEWLGMIWGGGSIEYNPALKSRLSISKDNSKSQIFLKMNSLQTDDSAMYYCVSYGYGGDRFSYWGQGTLVTVS
>5us9_c mol:protein length:541  Capsid protein VP2
MSENEIQDQQPSDSMDGQRGGGGGATGSVGGGKGSGVGISTGGWVGGSYFTDSYVITKNTRQFLVKIQNNHQYKTELISPSTSQGKSQRCVSTPWSYFNFNQYSSHFSPQDWQRLTNEYKRFRPKGMHVKIYNLQIKQILSNGADTTYNNDLTAGVHIFCDGEHAYPNATHPWDEDVMPELPYQTWYLFQYGYIPVIHELAEMEDSNAVEKAICLQIPFFMLENSDHEVLRTGESTEFTFNFDCEWINNERAYIPPGLMFNPLVPTRRAQYIRRNNNPQTAESTSRIAPYAKPTSWMTGPGLLSAQRVGPATSDTGAWMVAVKPENASIDTGMSGIGSGFDPPQGSLAPTNLEYKIQWYQTPQGTNNNGNIISNQPLSMLRDQALFRGNQTTYNLCSDVWMFPNQIWDRYPITRENPIWCKKPRSDKHTTIDPFDGSLAMDHPPGTIFIKMAKIPVPSNNNADSYLNIYCTGQVSCEIVWEVERYATKNWRPERRHTTFGLGIGGADNLNPTYHVDKNGTYIQPTTWDMCFPVKTNINKVL
>8dja_G mol:protein length:123  Major prion protein
GSKKRPKPGGWNTGGSRYPGQGSPGGNRYPPQGGTWGQPHGGGWGQPHGGSWGQPHGGSWGQPHGGGWGQGGGTHNQWNKPSKPKTNLKHVAGAAAAGAVVGGLGGYMLGSAMSRPMIHFGND
>4z96_A mol:protein length:530  Ubiquitin carboxyl-terminal hydrolase 7
SGPLGSEAHLYMQVQIVAEDQFCGHQGNDMYDEEKVKYTVFKVLKNSSLAEFVQSLSQTMGFPQDQIRLWPMQARSNGTKRPAMLDNEADGNKTMIELSDNENPWTIFLETVDPELAASGATLPKFDKDHDVMLFLKMYDPKTRSLNYCGHIYTPISCKIRDLLPVMCDRAGFIQDTSLILYEEVKPNLTERIQDYDVSLDKALDELMDGDIIVFQKDDPENDNSELPTAKEYFRDLYHRVDVIFCDKTIPNDPGFVVTLSNRMNYFQVAKTVAQRLNTDPMLLQFFKSQGYRDGPGNPLRHNYEGTLRDLLQFFKPRQPKKLYYQQLKMKITDFENRRSFKCIWLNSQFREEEITLYPDKHGCVRDLLEECKKAVELGEKASGKLRLLEIVSYKIIGVHQEDELLECLSPATSRTFRIEEIPLDQVDIDKENEMLVTVAHFHKEVFGTFGIPFLLRIHQGEHFREVMKRIQSLLDIQEKEFEKFKFAIVMMGRHQYINEDEYEVNLKDFEPQPGNMSHPRPWLGLDHFN
>3d2c_A mol:protein length:181  Lipase
AEHNPVVMVHGIGGSSSNFEGIKSYLVSQGWSRDKLYAVDFWDKTGTNYNNGPVLSRFVQKVLDETGAKKVDIVAHSMGGANTLYYIKYLDGGNKVANVVTLGGANRLTTDKAPPGTDPNQKILYTSIYSSDDMIVMNYLSRLDGARNVQIHGVGHMGLLYSSQVYSLIKEGLNGGGQNTN
>6yxl_HHH mol:protein length:221  ACPA F3 Fab fragment - heavy chain
QVQLVQSGAEVKKPGASVRVSCKASGFVTDYFIQWVRQAPGQGPEWMAWINPHNGETDYAPKLQDRVTVTCDTSTNTAFMELSRLTSDDTALYYCGRSGRTDARRAPVSYWGQGALVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKRVEP
>2jdt_I mol:protein length:20  CAMP-DEPENDENT PROTEIN KINASE INHIBITOR ALPHA
TTYADFIASGRTGRRNAIHD
>4qua_D mol:protein length:6  ACE-ASP-GLU-VAL-ASP-CHLOROMETHYLKETONE INHIBITOR
XDEVDX
>3daq_C mol:protein length:292  Dihydrodipicolinate synthase
THLFEGVGVALTTPFTNNKVNLEALKAHVNFLLENNAQAIIVNGTTAESPTLTTDEKELILKTVIDLVDKRVPVIAGTGTNDTEKSIQASIQAKALGADAIMLITPYYNKTNQRGLVKHFEAIADAVKLPVVLYNVPSRTNMTIEPETVEILSQHPYIVALKDATNDFEYLEEVKKRIDTNSFALYSGNDDNVVEYYQRGGQGVISVIANVIPKEFQALYDAQQSGLDIQDQFKPIGTLLSALSVDINPIPIKALTSYLGFGNYELRLPLVSLEDTDTKVLREAYDTFKAGE
>2ddw_B mol:protein length:283  Pyridoxine kinase
MSSLLLFNDKSRALQADIVAVQSQVVYGSVGNSIAVPAIKQNGLNVFAVPTVLLSNTPHYDTFYGGAIPDEWFSGYLRALQERDALRQLRAVTTGYMGTASQIKILAEWLTALRKDHPDLLIMVDPVIGDIDSGIYVKPDLPEAYRQYLLPLAQGITPNIFELEILTGKNCRDLDSAIAAAKSLLSDTLKWVVVTSASGNEENQEMQVVVVTADSVNVISHSRVKTDLKGTGDLFCAQLISGLLKGKALTDAVHRAGLRVLEVMRYTQQHESDELILPPLAEA
>6xt5_A mol:protein length:451  Legumain
RGSHHHHHHGSEVGTRWAVLVAGSNGYGNYRHQADVCHAYQLLIKGGVKEENIVVFMYDDIAYNAMNPRPGVIINHPQGPDVYAGVPKDYTGEDVTPENLYAVILGDKSKVKGGSGKVINSNPEDRIFIFYSNHGGPGVLGMPNAPFVYAMDFIDVLKKKHASGGYKEMVIYIEACESGSIFEGIMPKDLNIYVTTASNAQENSFGTYCPGMNPPPPEEYVTCLGDLYSVSWMEDSETHNLKRETVQQQYQSVRKRTSNSNSYRFGSHVMQYGDTNITAEKLYLYHGFDPATVNFPPHNGNLEAKMEVVNQRDAELLFMWQMYQRSNHQPEKKTHILEQITETVKHRNHLDGSVELIGVLLYGPGKSSSVLHSVRAPGLPLVDDWTCLKSMVRVFETHCGSLTQYGMKHMRAFGNVCNSGVSKASMEEACKAACGGYDAGLLYPSNTGYSA
>6l3t_E mol:protein length:279  Gap junction gamma-3 protein
MCGRFLRRLLAEESRRSTPVGRLLLPVLLGFRLVLLAASGPGVYGDEQSEFVCHTQQPGCKAACFDAFHPLSPLRFWVFQVILVAVPSALYMGFTLYHVIWHWELSGKGKEEETLIQGREGNTDVPGAGSLRLLWAYVAQLGARLVLEGAALGLQYHLYGFQMPSSFACRREPCLGSITCNLSRPSEKTIFLKTMFGVSGFCLLFTFLELVLLGLGRWWRTWKHKSSSSKYFLTSESTRRHKKATDSLPVVETKEQFQEAVPGRSLAQEKQRPVGPRDA
>3uk4_B mol:protein length:6  C-terminal peptide from Lactotransferrin
LEACAF
>1ztg_A mol:protein length:74  POLY(RC)-BINDING PROTEIN 1
GILTIRLLMHGKEVGSIIGKKGESVKRIREESGARINISEGNCPERIITLTGPTNAIFKAFAMIIDKLEEDINS
>1usv_H mol:protein length:170  AHA1
MRGSHHHHHHGMASMVVNNPNNWHWVDKNCIGWAKEYFKQKLVGVEAGSVKDKKYAKIKSVSSIEGDCEVNQRKGKVISLFDLKITVLIEGHVDSKDGSALPFEGSINVPEVAFDSEASSYQFDISIFKETSELSEAKPLIRSELLPKLRQIFQQFGKDLLATHGNDIQV
>5mfc_B mol:protein length:257  (KR)4-Green fluorescent protein,Green fluorescent protein
GPGSGSPKRKRKRKREGKLMSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSVLSKDPNEKRDHMVLLEFVTAAGITHGMDELYK
>4v7s_CF mol:protein length:100  30S ribosomal protein S6
MRHYEIVFMVHPDQSEQVPGMIERYTAAITGAEGKIHRLEDWGRRQLAYPINKLHKAHYVLMNVEAPQEVIDELETTFRFNDAVIRSMVMRTKHAVTEAS
>6zvt_ZA mol:protein length:258  Vipp1
MGLFDRIKRVVSSNLNDLVNKAEDPEKMLEQAILEMQEDLVQLRQGVAQAIAAQKRSEKQYNDAQNEINKWQRNAQLALQKGDENLARQALERKKTYTDTSAALKASLDTQSTQVETLKRNLIQLESKISEAKTKKEMLKARITTAKAQEQLQGMVRGMNTSSAMSAFERMEEKVLMQESRAQALGELAGADLETQFAQLEGGSDVDDELAALKAQMLPPATPVTQAQLPPQQETTPAKSNEVVDAELDSLRKQLDQL
>6pg2_A mol:protein length:189  Thiol:disulfide interchange protein DsbA
AQYEDGKQYTTLEKPVAGAPQVLEFFSFFCPHCYQFEEVLHISDNVKKKLPEGVKMTKYHVNFMGGDLGKDLTQAWAVAMALGVEDKVTVPLFEGVQKTQTIRSASDIRDVFINAGIKGEEYDAAWNSFVVKSLVAQQEKAAADVQLRGVPAMFVNGKYQLNPQGMDTSNMDVFVQQYADTVKYLSEKK
>6pm2_B mol:protein length:458  Glycine receptor subunit alphaZ1
MFALGIYLWETIVFFSLAASQQAAARKAASPMPPSEFLDKLMGKVSGYDARIRPNFKGPPVNVTCNIFINSFGSIAETTMDYRVNIFLRQQWNDPRLAYSEYPDDSLDLDPSMLDSIWKPDLFFANEKGANFHEVTTDNKLLRISKNGNVLYSIRITLVLACPMDLKNFPMDVQTCIMQLESFGYTMNDLIFEWDEKGAVQVADGLTLPQFILKEEKDLRYCTKHYNTGKFTCIEARFHLERQMGYYLIQMYIPSLLIVILSWVSFWINMDAAPARVGLGITTVLTMTTQSSGSRASLPKVSYVKAIDIWMAVCLLFVFSALLEYAAVNFIARQHKELLRFQRRRRHLKEDEAGDGRFSFAAYGMGPACLQAKDGMAIKGNNNNAPTSTNPPEKTVEEMRKLFISRAKRIDTVSRVAFPLVFLIFNIFYWITYKIIRSEDIHKQLVPRGSHHHHHHHH
>5nc7_J mol:protein length:12  ActA-derived 10-mer Ac-FPPPPTEDEL-NH2 with acetylated (Ac) and amidated (NH2) termini. Phe is substitued by Trp to increase affinity for crystallization
XWPPPPTEDELX
>7cwl_B mol:protein length:1273  Spike glycoprotein
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT
>7oo2_B mol:protein length:214  anti-MenX Fab light chain
ETTVTQSPASLSVATGEKVTIRCITSTDIDDDMTWYQQKPGEPPKLLISEATTLRPGVPSRFSASGYGTDFVFTIENTLSEDVADYYCLQSDNMPYTFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYPKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKSFNRNEC
>1h4l_D mol:protein length:147  CYCLIN-DEPENDENT KINASE 5 ACTIVATOR
STSELLRCLGEFLCRRCYRLKHLSPTDPVLWLRSVDRSLLLQGWQDQGFITPANVVFLYMLCRDVISSEVGSDHELQAVLLTCLYLSYSYMGNEISYPLKPFLVESCKEAFWDRCLSVINLMSSKMLQINADPHYFTQVFSDLKNES
>3b07_A mol:protein length:309  Gamma-hemolysin component B
MGHHHHHHAMEGKITPVSVKKVDDKVTLYKTTATADSDKFKISQILTFNFIKDKSYDKDTLVLKATGNINSGFVKPNPNDYDFSKLYWGAKYNVSISSQSNDSVNVVDYAPKNQNEEFQVQNTLGYTFGGDISISNGLSGGLNGNTAFSETINYKQESYRTTLSRNTNYKNVGWGVEAHKIMNNGWGPYGRDSFHPTYGNELFLAGRQSSAYAGQNFIAQHQMPLLSRSNFNPEFLSVLSHRQDGAKKSKITVTYQREMDLYQICWNGFYWAGANYKNFKTRTFKSTYEIDWENHKVKLLDTKETENNK
>6zqn_B mol:protein length:510  ATP synthase subunit alpha, mitochondrial
EKTGTAEVSSILEERILGADTSVDLEETGRVLSIGDGIARVHGLRNVQAEEMVEFSSGLKGMSLNLEPDNVGVVVFGNDKLIKEGDIVKRTGAIVDVPVGEELLGRVVDALGNAIDGKGPIGSKARRRVGLKAPGIIPRISVREPMQTGIKAVDSLVPIGRGQRELIIGDRQTGKTSIAIDTIINQKRFNDGTDEKKKLYCIYVAIGQKRSTVAQLVKRLTDADAMKYTIVVSATASDAAPLQYLAPYSGCSMGEYFRDNGKHALIIYDDLSKQAVAYRQMSLLLRRPPGREAYPGDVFYLHSRLLERAAKMNDAFGGGSLTALPVIETQAGDVSAYIPTNVISITDGQIFLETELFYKGIRPAINVGLSVSRVGSAAQTRAMKQVAGTMKLELAQYREVAAFAQFGSDLDAATQQLLSRGVRLTELLKQGQYSPMAIEEQVAVIYAGVRGYLDKLEPSKITKFENAFLSHVISQHQALLGKIRTDGKISEESDAKLKEIVTNFLAGFEA
>7oue_C mol:protein length:242  N-glycosylase/DNA lyase
GSHMIARIIGEIGIEGARFIEENIDEQFKALRYLSKGIDSETFVKLVIANSLVSYQLTGKGEQWWWEFAKYFYGRDVKSIYLAYKEFLPNSRFNRRLIPQKLSRIRRVETFLSTLTEERIEEYYGDMSSLWGSIARALGVDKESKTVVFSVKMFGYAARIVLSTFNPYPMEIPIPEDSRIVKLTKKLTNEKPRKFWMKIARESGVPPLHIDSILWPLLGGASIDSAPPELRDKLAELIKIIR
>6vyy_h mol:protein length:273  50S ribosomal protein L2
MAVVKCKPTSPGRRHVVKVVNPELHKGKPFAPLLEKNSKSGGRNNNGRITTRHIGGGHKQAYRIVDFKRNKDGIPAVVERLEYDPNRSANIALVLYKDGERRYILAPKGLKAGDQIQSGVDAAIKPGNTLPMRNIPVGSTVHNVEMKPGKGGQLARSAGTYVQIVARDGAYVTLRLRSGEMRKVEADCRATLGEVGNAEHMLRVLGKAGAARWRGVRPTVRGTAMNPVDHPHGGGEGRNFGKHPVTPWGVQTKGKKTRSNKRTDKFIVRRRSK
>6hgh_B mol:protein length:40  Alpha-1-antichymotrypsin
SALVETRTIVRFNRPFLMIIVDHFTWSIFFMSKVTNPKQA
>4g7g_B mol:protein length:448  sterol 14-alpha-demethylase
GKLPPVYPVTVPILGHIIQFGKSPLGFMQECKRQLKSGIFTINIVGKRVTIVGDPHEHSRFFLPRNEVLSPREVYSFMVPVFGEGVAYAAPYPRMREQLNFLAEELTIAKFQNFVPAIQHEVRKFMAANWDKDEGEINLLEDCSTMIINTACQCLFGEDLRKRLDARRFAQLLAKMESSLIPAAVFLPILLKLPLPQSARCHEARTELQKILSEIIIARKEEEVNKDSSTSDLLSGLLSAVYRDGTPMSLHEVCGMIVAAMFAGQHTSSITTTWSMLHLMHPANVKHLEALRKEIEEFPAQLNYNNVMDEMPFAERCARESIRRDPPLLMLMRKVMADVKVGSYVVPKGDIIACSPLLSHHDEEAFPEPRRWDPERDEKVEGAFIGFGAGVHKCIGQKFGLLQVKTILATAFRSYDFQLLRDEVPDPDYHTMVVGPTASQCRVKYIRR
>4glm_A mol:protein length:72  Dynamin-binding protein
GGAAQPAMAQGALTYGVALYRFQALEPNELDFEVGDKIRILATLEDGWLEGSLKGRTGIFPYRFVKLCPAAA
>7eyd_V5 mol:protein length:173  C-phycocyanin beta subunit
MTLDVFTKVVSQADSRGEFLSNEQLDALANVVKEGNKRLDVVNRITSNASAIVTNAARALFEEQPQLIAPGGNAYTNRRMAACLRDMEIILRYVTYAILAGDASVLDDRCLNGLRETYQALGTPGSSVAVGVQKMKDAAVGIANDPNGITKGDCSQLISEVASYFDRAAAAVG
>1mfr_K mol:protein length:176  M FERRITIN
MVSQVRQNYHSDCEAAVNRMLNLELYASYTYSSMYAFFDRDDVALHNVAEFFKEHSHEEREHAEKFMKYQNKRGGRVVLQDIKKPERDEWGNTLEAMQAALQLEKTVNQALLDLHKLATDKVDPHLCDFLESEYLEEQVKDIKRIGDFITNLKRLGLPENGMGEYLFDKHSVKESS
>7nvm_Q mol:protein length:548  T-complex protein 1 subunit theta
MALHVPKAPGFAQMLKEGAKHFSGLEEAVYRNIQACKELAQTTRTAYGPNGMNKMVINHLEKLFVTNDAATILRELEVQHPAAKMIVMASHMQEQEVGDGTNFVLVFAGALLELAEELLRIGLSVSEVIEGYEIACRKAHEILPNLVCCSAKNLRDIDEVSSLLRTSIMSKQYGNEVFLAKLIAQACVSIFPDSGHFNVDNIRVCKILGSGISSSSVLHGMVFKKETEGDVTSVKDAKIAVYSCPFDGMITETKGTVLIKTAEELMNFSKGEENLMDAQVKAIADTGANVVVTGGKVADMALHYANKYNIMLVRLNSKWDLRRLCKTVGATALPRLTPPVLEEMGHCDSVYLSEVGDTQVVVFKHEKEDGAISTIVLRGSTDNLMDDIERAVDDGVNTFKVLTRDKRLVPGGGATEIELAKQITSYGETCPGLEQYAIKKFAEAFEAIPRALAENSGVKANEVISKLYAVHQEGNKNVGLDIEAEVPAVKDMLEAGILDTYLGKYWAIKLATNAAVTVLRVDQIIMAKPAGGPKPPSGKKDWDDDQND
>6s61_M mol:protein length:182  Ferritin heavy chain
MTTASPSQVRQNYHQDAEAAINRQINLELYASYVYLSMSCYFDRDDVALKNFAKYFLHQSHEEREHAEKLMKLQNQRGGRIFLQDIKKPDRDDWESGLNAMECALHLEKSVNQSLLELHKLATDKNDPHLCDFIETYYLSEQVKSIKELGDHVTNLRKMGAPEAGMAEYLFDKHTLGHGDES
>5j8k_F mol:protein length:429  COMPLEX I 51KDA/NDUFV1
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCXXCXXCXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
>4wuz_B mol:protein length:229  Exonuclease
GSHMTPDIILQRTGIDVRAVEQGDDAWHKLRLGVITASEVHNVIAKPRSGKKWPDMKMSYFHTLLAEVCTGVAPEVNAKALAWGKQYENDARTLFEFTSGVNVTESPIIYRDESMRTACSPDGLCSDGNGLELKCPFTSRDFMKFRLGGFEAIKSAYMAQVQYSMWVTRKNAWYFANYDPRMKREGLHYVVIERDEKYMASFDEIVPEFIEKMDEALAEIGFVFGEQWR
>7xve_C mol:protein length:215  Sodium channel subunit beta-2
MHRDAWLPRPAFSLTGLSLFFSLVPPGRSMEVTVPATLNVLNGSDARLPCTFNSCYTVNHKQFSLNWTYQECNNCSEEMFLQFRMKIINLKLERFQDRVEFSGNPSKYDVSVMLRNVQPEDEGIYNCYIMNPPDRHRGHGKIHLQVLMEEPPERDSTVAVIVGASVGGFLAVVILVLMVVKCVRRKKEQKLSTDDLKTEEEGKTDGEGNPDDGAK
>5nd8_G mol:protein length:179  50S ribosomal protein L5
MNRLKEKFNTEVTENLMKKFNYSSVMEVPKIDKIVVNMGVGDAVQNSKVLDNAVEELELITGQKPLVTKAKKSIATFRLREGMPIGAKVTLRGERMYEFLDKLISVSLPRVRDFQGVSKKAFDGRGNYTLGVKEQLIFPEIDYDKVSKVRGMDIVIVTTANTDEEARELLANFGMPFRK
>7pr0_E mol:protein length:205  Spike protein S1
ETGHHHHHHTNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGKK
>2af7_A mol:protein length:125  gamma-carboxymuconolactone decarboxylase
MERYRRGMEILNRMNRKSYTAIRDELEDVAPDLARFVAEFAYGDVYSRGVLDLKTRELLTLAALTVLRADDQLKSHVRGALNAGCSKDEIIEVMIQMAVYAGFPAAINAVLAAKEVFTENDPAEV
>7ukn_A mol:protein length:1142  DNA damage-binding protein 1
GAMSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEGLRPVKEVGMYGKIAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIGRPSETGIIGIIDPECRMIGLRLYDGLFKVIPLDRDNKELKAFNIRLEELHVIDVKFLYGCQAPTICFVYQDPQGRHVKTYEVSLREKEFNKGPWKQENVEAEASMVIAVPEPFGGAIIIGQESITYHNGDKYLAIAPPIIKQSTIVCHNRVDPNGSRYLLGDMEGRLFMLLLEKEEQMDGTVTLKDLRVELLGETSIAECLTYLDNGVVFVGSRLGDSQLVKLNVDSNEQGSYVVAMETFTNLGPIVDMCVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGIKGLWPLRSDPNRETDDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVSQEPKALVSEWKEPQAKNISVASCNSSQVVVAVGRALYYLQIHPQELRQISHTEMEHEVACLDITPLGDSNGLSPLCAIGLWTDISARILKLPSFELLHKEMLGGEIIPRSILMTTFESSHYLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSLSTTNVFACSDRPTVIYSSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTIDEIQKLHIRTVPLYESPRKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHETSFGEEVEVHNLLIIDQHTFEVLHAHQFLQNEYALSLVSCKLGKDPNTYFIVGTAMVYPEEAEPKQGRIVVFQYSDGKLQTVAEKEVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELRTECNHYNNIMALYLKTKGDFILVGDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEILDDDNFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFHLGEFVNVFCHGSLVMQNLGETSTPTQGSVLFGTVNGMIGLVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTERKTEPATGFIDGDLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH
>4i10_A mol:protein length:406  Beta-secretase 1
MRGSFVEMVDNLRGKSGQGYYVEMTVGSPPQTLNILVDTGSSNFAVGAAPHPFLHRYYQRQLSSTYRDLRKGVYVPYTQGKWEGELGTDLVSIPHGPNVTVRANIAAITESDKFFINGSNWEGILGLAYAEIARPDDSLEPFFDSLVKQTHVPNLFSLQLCGAGFPLNQSEVLASVGGSMIIGGIDHSLYTGSLWYTPIRREWYYEVIIVRVEINGQDLKMDCKEYNYDKSIVDSGTTNLRLPKKVFEAAVKSIKAASSTEKFPDGFWLGEQLVCWQAGTTPWNIFPVISLYLMGEVTNQSFRITILPQQYLRPVEDVATSQDDCYKFAISQSSTGTVMGAVIMEGFYVVFDRARKRIGFAVSACHVHDEFRTAAVEGPFVTLDMEDCGYNIPQTDESRSHHHHHH
>5j88_D1 mol:protein length:56  50S ribosomal protein L32
AVQQNKPTRSKRGMRRSHDALTAVTSLSVDKTSGEKHLRHHITADGYYRGRKVIAK
>6wl8_oA mol:protein length:29  Form 2 peptide
QAKILEADAEILKAYAKILEAHAEILKAQ
>4z3s_1q mol:protein length:105  30S ribosomal protein S17
MPKKVLTGVVVSDKMQKTVTVLVERQFPHPLYGKVIKRSKKYLAHDPEEKYKLGDVVEIIESRPISKRKRFRVLRLVESGRMDLVEKYLIRRQNYESLSKRGGKA
>1tyq_D mol:protein length:300  Arp2/3 complex 34kDa subunit
MILLEVNNRIIEETLALKFENAAAGNKPEAVEVTFADFDGVLYHISNPNGDKTKVMVSISLKFYKELQAHGADELLKRVYGSYLVNPESGYNVSLLYDLENLPASKDSIVHQAGMLKRNCFASVFEKYFQFQEEGKEGENRAVIHYRDDETMYVESKKDRVTVVFSTVFKDDDDVVIGKVFMQEFKEGRRASHTAPQVLFSHREPPLELKDTDAAVGDNIGYITFVLFPRHTNASARDNTINLIHTFRDYLHYHIKCSKAYIHTRMRAKTSDFLKVLNRARPDAEKKEMKTITGKTFSSR
>7jxs_F mol:protein length:137  Matrix protein
GARASVLSGGELDKWEKIRLRPGGKKQYKLKHIVWASRELERFAVNPGLLETSEGCRQILGRLQPSLQTGSEELRSLYNTIAVLYCVHQRIDVKDTKEALDKIEEEQNKSKKKAQQAAADTGNNSQVSQNYHHHHHH
>1ww4_D mol:protein length:160  galectin
TTSAVNIYNISAGASVDLAAPVTTGDIVTFFSSALNLSAGAGSPNNTALNLLSENGAYLLHIAFRLQENVIVFNSRQPNAPWLVEQRVSNVANQFIGSGGKAMVTVFDHGDKYQVVINEKTVIQYTKQISGTTSSLSYNSTEGTSIFSTVVEAVTYTGLA
>3waa_G mol:protein length:131  Histone H2A.V
GSHMAGGKAGKDSGKAKAKAVSRSQRAGLQFPVGRIHRHLKTRTTSHGRVGATAAVYSAAILEYLTAEVLELAGNASKDLKVKRITPRHLQLAIRGDEELDSLIKATIAGGGVIPHIHKSLIGKKGQQKTA
>6ryr_H mol:protein length:123  Histone H2B 1.1
MAKSAPAPKKGSKKAVTKTQKKDGKKRRKTRKESYAIYVYKVLKQVHPDTGISSKAMSIMNSFVNDVFERIAGEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKAVTKYTSAK
>6umr_A mol:protein length:441  Damage-control phosphatase DUF89
MAVVPASLSGQDVGSFAYLTIKDRIPQILTKVIDTLHRHKSEFFEKHGEEGVEAEKKAISLLSKLRNELQTDKPFIPLVEKFVDTDIWNQYLEYQQSLLNESDGKSRWFYSPWLLVECYMYRRIHEAIIQSPPIDYFDVFKESKEQNFYGSQESIIALCTHLQQLIRTIEDLDENQLKDEFFKLLQISLWGNKCDLSLSGGESSSQNTNVLNSLEDLKPFILLNDMEHLWSLLSNCKKTREKASATRVYIVLDNSGFELVTDLILADFLLSSELATEVHFYGKTIPWFVSATTIHDFNWLIEQVKHSNHKWMSKCGADWEEYIKMGKWVYHNHIFWTLPHEYCAMPQVAPDLYAELQKAHLILFKGDLNYRKLTGDRKWEFSVPFHQALNGFHPAPLCTIRTLKAEIQVGLQPGQGEQLLASEPSWWTTGKYGIFQYDGPL
>1m64_A mol:protein length:571  flavocytochrome c3
ADNLAEFHVQNQECDSCHTPDGELSNDSLTYENTQCVSCHGTLAEVAETTKHEHYNAHASHFPGEVACTSCHSAHEKSMVYCDSCHSFDFNMPYAKKWLRDEPTIAELAKDKSERQAALASAPHDTVDVVVVGSGGAGFSAAISATDSGAKVILIEKEPVIGGNAKLAAGGMNAAWTDQQKAKKITDSPELMFEDTMKGGQNINDPALVKVLSSHSKDSVDWMTAMGADLTDVGMMGGASVNRAHRPTGGAGVGAHVVQVLYDNAVKRNIDLRMNTRGIEVLKDDKGTVKGILVKGMYKGYYWVKADAVILATGGFAKNNERVAKLDPSLKGFISTNQPGAVGDGLDVAENAGGALKDMQYIFAHPTLSVKGGVMVTEAVRGNGAILVNREGKRFVNEITTRDKASAAILAQTGKSAYLIFDDSVRKSLSKIDKYIGLGVAPTADSLVKLGKMEGIDGKALTETVARYNSLVSSGKDTDFERPNLPRALNEGNYYAIEVTPGVHHTMGGVMIDTKAEVMNAKKQVIPGLYGAGEVTGGVHGANRLGGNAISDIITFGRLAGEEAAKYSKKN
>5kwy_D mol:protein length:133  Epididymal secretory protein E1
EPVQFKDCGSVDGVIKEVNVSPCPTQPCQLSKGQSYSVNVTFTSNIQSKSSKAVVHGILMGVPVPFPIPEPDGCKSGINCPIQKDKTYSYLNKLPVKSEYPSIKLVVEWQLQDDKNQSLFCWEIPVQIVSHLA
>5jc9_AU mol:protein length:56  30S ribosomal protein S21
PVIKVRENEPFDVALRRFKRSCEKAGVLAEVRRREFYEKPTTERKRAKASAVKRHA
>2jd7_C mol:protein length:174  FERRITIN HOMOLOG
MLSERMLKALNDQLNRELYSAYLYFAMAAYFEDLGLEGFANWMKAQAEEEIGHALRFYNYIYDRNGRVELDEIPKPPKEWESPLKAFEAAYEHEKFISKSIYELAALAEEEKDYSTRAFLEWFINEQVEEEASVKKILDKLKFAKDSPQILFMLDKELSARAPKLPGLLMQGGE
>4r6o_H mol:protein length:19  Agglutinin beta-3 chain
EQSGISQTVIVGPWGAKVS
>2hzi_B mol:protein length:277  Proto-oncogene tyrosine-protein kinase ABL1
GAMDPSPNYDKWEMERTDITMKHKLGGGQYGEVYEGVWKKYSLTVAVKTLKEDTMEVEEFLKEAAVMKEIKHPNLVQLLGVCTREPPFYIITEFMTYGNLLDYLRECNRQEVNAVVLLYMATQISSAMEYLEKKNFIHRDLAARNCLVGENHLVKVADFGLSRLMTGDTYTAHAGAKFPIKWTAPESLAYNKFSIKSDVWAFGVLLWEIATYGMSPYPGIDLSQVYELLEKDYRMERPEGCPEKVYELMRACWQWNPSDRPSFAEIHQAFETMFQES
>6wyd_E mol:protein length:467  Myeloperoxidase heavy chain
VNCETSCVQQPPCFPLKIPPNDPRIKNQADCIPFFRSCPACPGSNITIRNQINALTSFVDASMVYGSEEPLARNLRNMSNQLGLLAVNQRFQDNGRALLPFDNLHDDPCLLTNRSARIPCFLAGDTRSSEMPELTSMHTLLLREHNRLATELKSLNPRWDGERLYQEARKIVGAMVQIITYRDYLPLVLGPTAMRKYLPTYRSYNDSVDPRIANVFTNAFRYGHTLIQPFMFRLDNRYQPMEPNPRVPLSRVFFASWRVVLEGGIDPILRGLMATPAKLNRQNQIAVDEIRERLFEQVMRIGLDLPALNMQRSRDHGLPGYNAWRRFCGLPQPETVGQLGTVLRNLKLARKLMEQYGTPNNIDIWMGGVSEPLKRKGRVGPLLACIIGTQFRKLRDGDRFWWENEGVFSMQQRQALAQISLPRIICDNTGITTVSKNNIFMSNSYPRDFVNCSTLPALNLASWREAS
>3cgx_A mol:protein length:242  Putative nucleotide-diphospho-sugar transferase
GMSESCILFFVKYPEPGKVKTRLGEVVGNDKAAMLYRHFVQDMLQGLARLHADLHICYVPGDADLPEKFKAWLGPQHMFAAQQGLDLGERMKHAMQKAFDDGYDRVVLMGSDIPDYPCELVQKALNDLQHYDAAIGPAFDGGYYLIGFRKDSFCPDVFDGIRWGEADVYQPTVEKMRRARLEVLQLPDWNDVDTVWDLNVLYRTNKNSSFRRSSTYALLRENDALIRQYDIDLPGMAPVEKE
>3dke_X mol:protein length:164  Lysozyme
MNIFEMLRIDEGLRLKIYKDTEGYYTIGIGHLLTKSPSLNAAKSELDKAIGRNTNGVITKDEAEKLFNQDVDAAVRGILRNAKLKPVYDSLDAVRRAAAINLVFQMGETGVAGFTNSLRMLQQKRWDEAAVNLAKSRWYNQTPNRAKRVITTFRTGTWDAYKNL
>6jxq_A mol:protein length:147  Lysozyme C
MRSLLILVLCFLPLAALGKVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQAWIRGCRL
>1ju2_A mol:protein length:536  hydroxynitrile lyase
LATTSDHDFSYLSFAYDATDLELEGSYDYVIVGGGTSGCPLAATLSEKYKVLVLERGSLPTAYPNVLTADGFVYNLQQEDDGKTPVERFVSEDGIDNVRGRVLGGTSIINAGVYARANTSIYSASGVDWDMDLVNQTYEWVEDTIVYKPNSQSWQSVTKTAFLEAGVHPNHGFSLDHEEGTRITGSTFDNKGTRHAADELLNKGNSNNLRVGVHASVEKIIFSNAPGLTATGVIYRDSNGTPHQAFVRSKGEVIVSAGTIGTPQLLLLSGVGPESYLSSLNIPVVLSHPYVGQFLHDNPRNFINILPPNPIEPTIVTVLGISNDFYQCSFSSLPFTTPPFGFFPSSSYPLPNSTFAHFASKVAGPLSYGSLTLKSSSNVRVSPNVKFNYYSNLTDLSHCVSGMKKIGELLSTDALKPYKVEDLPGVEGFNILGIPLPKDQTDDAAFETFCRESVASYWHYHGGCLVGKVLDGDFRVTGINALRVVDGSTFPYTPASHPQGFYLMLGRYVGIKILQERSASDLKILDSLKSAASLVL
>3oi9_A mol:protein length:164  Molybdenum cofactor synthesis domain
GPGSMTTRSARVIIASTRASSGEYEDRCGPIITEWLAQQGFSSAQPEVVADGSPVGEALRKAIDDDVDVILTSGGTGIAPTDSTPDQTVAVVDYLIPGLAEAIRQSGLPKVPTSVLSRGVCGVAGQTLIVNLPGSPGGVRDGLGVLAGVLDHALDQLAGKDHPR
>5zf0_C1 mol:protein length:80  Photosystem I iron-sulfur center
AHTVKIYDTCIGCTQCVRACPTDVLEMVPWDGCKAGQIASSPRTEDCVGCKRCETACPTDFLSIRVYLGAETTRSMGLAY
>3fq3_H mol:protein length:197  Inorganic pyrophosphatase:Bacterial/Archaeal inorganic pyrophosphatase
MAHHHHHHMGTLEAQTQGPGSMNIDAISIGSNPPEDVNVIIEVPVGGQPIKYEMDKKAGALIVDRFLYTPMTYPGNYGFVPHTLSEDGDPIDVLVCNTRPLIPGCVINVRPIGVLVMEDNSGKDEKIIAVPSPHLTRRYEKIHDYTDMPEITLKQIAHFFEHYKDLEPGKWVKIGDWGDEDYARKFIVEAIERAKGK
>7s5z_A mol:protein length:390  ATP-sensitive inward rectifier potassium channel 11
MLSRKGIIPEEYVLTRLAEDPAKPRYRARQRRARFVSKKGNCNVAHKNIREQGRFLQDVFTTLVDLKWPHTLLIFTMSFLCSWLLFAMAWWLIAFAHGDLAPSEGTAEPCVTSIHSFSSAFLFSIEVQVTIGFGGRMVTEECPLAILILIVQNIVGLMINAIMLGSIFMKTAQAHRRAETLIFSKHAVIALRHGRLCFMLRVGDLRKSMIISATIHMQVVRKTTSPEGEVVPLHQVDIPMENGVGGNSIFLVAPLIIYHVIDANSPLYDLAPSDLHHHQDLEIIVILEGVVETTGITTQARTSYLADEILWGQRFVPIVAEEDGRYSVDYSKFDNTVKVPTPLCTARQLDEDHSLLEALTLASARGPLRKRSVPMAKAKPKFSISPDSLS
>6zsb_g mol:protein length:166  39S ribosomal protein L49, mitochondrial
MAATMFRATLRGWRTGVQRGCGLRLLSQTQGPPDYPRFVESVDEYQFVERLLPATRIPDPPKHEHYPTPSGWQPPRDPPPNLPYFVRRSRMHNIPVYKDITHGNRQMTVIRKVEGDIWALQKDVEDFLSPLLGKTPVTQVNEVTGTLRIKGYFDQELKAWLLEKGF
>7xoa_C mol:protein length:1270  Spike glycoprotein
MFVFLVLLPLVSSQCVNLITRTQSYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLGRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFDEVFNATRFASVYAWNRKRISNCVADYSVLYNFAPFFAFKCYGVSPTKLNDLCFTNVYADSFVIRGNEVSQIAPGQTGNIADYNYKLPDDFTGCVIAWNSNKLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGNKPCNGVAGFNCYFPLRSYGFRPTYGVGHQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEYVNNSYECDIPIGAGICASYQTQTKSHGSASSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLKRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKYFGGFNFSQILPDPSKPSKRSPIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGPALQIPFPMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTPSALGKLQDVVNHNAQALNTLVKQLSSKFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT
>5dgf_M9 mol:protein length:188  60S ribosomal protein L19-A
ANLRTQKRLAASVVGVGKRKVWLDPNETSEIAQANSRNAIRKLVKNGTIVKKAVTVHSKSRTRAHAQSKREGRHSGYGKRKGTREARLPSQVVWIRRLRVLRRLLAKYRDAGKIDKHLYHVLYKESKGNAFKHKRALVEHIIQAKADAQREKALNEEAEARRLKNRAARDRRAQRVAEKRDALLKEDA
>4otz_A mol:protein length:395  Amino acid/amide ABC transporter substrate-binding protein, HAAT family
SNATNTDTNSTNNSPNNTTNTTTNVTTTSDKNTIPIGIALAQTSNVALLGQEQVAGAKIAEKYFNDKGGVNGTPIKLIFQDTAGDEAGTINAFQTLINKDKVVGIVGPTLSQQAFSANPIAERAKVPVVGPSNTAKGIPEIGDYVARVSAPVSVVAPNSVKAALKQNPNIKKVAVFFAQNDAFSKSETEIFQQTVKDQGLELVTVQKFQTTDTDFQSQATNAINLKPDLVIISGLAADGGNLVRQLRELGYQGAIIGGDGLNTSNVFAVCKALCDGVLIAQAYSPEYTGEINKAFRQAYVDQYKKEPPQFSAQAFAAVQVYVESLKALDTKNKVSKIQLPELRTELNKQLLTGKYNTPLGEISFTPIGEVVQKDFYVAQIKMEKDGSQGKFTFLK
>1dps_L mol:protein length:167  DPS
MSTAKLVKSKATNLLYTRNDVSDSEKKATVELLNRQVIQFIDLSLITKQAHWNMRGANFIAVHEMLDGFRTALIDHLDTMAERAVQLGGVALGTTQVINSKTPLKSYPLDIHNVQDHLKELADRYAIVANDVRKAIGEAKDDDTADILTAASRDLDKFLWFIECNIE
>7wxi_A mol:protein length:776  Delta-1-pyrroline-5-carboxylate synthase
MLQNSFKLAQSLRNGFYRNAWRAFSSHGPRQPLVSPERRLEKAHPTFTERSQLKYARRLVVKLGSAVITREDNHGLALGRLASIVEQVAECHLEGREVMMVTSGAVAFGKQKLAQELLMSLSMRETLNPKDSKEFDGATLEPRAAAAVGQSGLMSLYDAMFAQYGVKIAQVLVTKPDFYNEETRNNLFCTLSELISLNIVPIINTNDAVSPPMFIRDDEPAGGARRGIPIKDNDSLSAMLAAEVQADLLILMSDVDGIYNKPPWEDGAKLMHTYTSDDSNSIEFGKKSKVGTGGMDSKVKAATWALDRGVSVVICNGMQEKAIKTIIGGRKVGTFFTEATESANAVPVEVMAENARTGSRQMQALTPAQRASAVNTLADLLVSREKFILDANAKDLAEAQKSGLAKPLLSRLSLNPAKLKNLSVGLKQIAEDSHKNVGRVLRRTRLADQLELKQVTVPIGVLLVIFESRPDSLPQVAALAMASANGLLLKGGKEAAHSNKALMELVKEALATVGAEHAVSLVSTREEISDLLSMENHIDLIIPRGSSDLVRSIQQQSLHIPVLGHAEGVCHVYIDRDADLEKALRIARDAKCDYPAACNAMETLLIHEDLMSGAIFGDVCNMLKREGVKIYAGPRLNQQLTFGPPAAKSLKHEYGALECCIEVVPSLDEAINHIHTYGSSHTDVIVTENDAAARQFLGSVDSACVFHNASSRFADGFRFGLGAEVGISTARIHARGPVGVEGLLTTKWILEGQDHAAADFAEGGGRTWLHETLPLD
>4u1v_B3 mol:protein length:64  50S ribosomal protein L35
PKIKTVRGAAKRFKKTGKGGFKHKHANLRHILTKKATKRKRHLRPKAMVSKGDLGLVIACLPYA
>5l5h_J mol:protein length:198  Proteasome subunit beta type-4
MDIILGIRVQDSVILASSKAVTRGISVLKDSDDKTRQLSPHTLMSFAGEAGDTVQFAEYIQANIQLYSIREDYELSPQAVSSFVRQELAKSIRSRRPYQVNVLIGGYDKKKNKPELYQIDYLGTKVELPYGAHGYSGFYTFSLLDHHYRPDMTTEEGLDLLKLCVQELEKRMPMDFKGVIVKIVDKDGIRQVDDFQAQ
>6mu3_M mol:protein length:225  Fab 2G12, heavy chain
EVQLVESGGGLVKAGGSLILSCGVSNFRISAHTMNWVRRVPGGGLEWVASISTSSTYRDYADAVKGRFTVSRDDLEDFVYLQMHKMRVEDTAIYYCARKGSDRLSDNDPFDAWGPGTVVTVSPASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKS
>3sud_B mol:protein length:203  NS3 protease, NS4A protein
GSHMASMKKKGSVVIVGRINLSGDTAYAQQTRGEEGCQETSQTGRDKNQVEGEVQIVSTATQTFLATSINGVLWTVYHGAGTRTIASPKGPVTQMYTNVDKDLVGWQAPQGSRSLTPCTCGSSDLYLVTRHADVIPVRRRGDSRGSLLSPRPISYLKGSAGGPLLCPAGHAVGIFRAAVSTRGVAKAVDFIPVESLETTMRSP
>6bfq_I mol:protein length:127  Granulocyte-macrophage colony-stimulating factor
APARSPSPSTQPWEHVNAIQEARRLLNLSRDTAAEMNETVEVISEMFDLQEPTCLQTRLELYKQGLRGSLTKLKGPLTMMASHYKQHCPPTPETSCATQIITFESFKENLKDFLLVIPFDCWEPVQE
>5fl8_R mol:protein length:189  60S ribosomal protein L19-A
MANLRTQKRLAASVVGVGKRKVWLDPNETSEIAQANSRNAIRKLVKNGTIVKKAVTVHSKSRTRAHAQSKREGRHSGYGKRKGTREARLPSQVVWIRRLRVLRRLLAKYRDAGKIDKHLYHVLYKESKGNAFKHKRALVEHIIQAKADAQREKALNEEAEARRLKNRAARDRRAQRVAEKRDALLKEDA
>6hiv_BJ mol:protein length:333  mL76
MLRLSSWNLKSQHHNVLRRSRPHIHKYRELNRWQRQAQGISKWDQSHSHRPLPYVERFNPESVGLTRGTSAFAWKWWHTQYPWLPNVPPEAAQIDEAQKQERRSHRPPAWDDEFAKVVLNMNDAEIREYLMSKLTDVIFLETQRDGYELRRLDFEGKPLTSLPEPRIIENFVLEEETIRERVIYQVVEGVFRLSPTSADRRELRSVANIIDYVLTHVRAARPTDRERRQERPITSAALAVMQKCPIQPQLGFVHALPHDTRDALLQEWERMHHLDWQFGKAVYTPRSKENVRGNLTWLREDRHYDQRMKFMQEVESGEARAKHMKLIAEAAGN
>7kf1_B mol:protein length:218  anti-VEGF-A Fab bH1 light chain
DIQMTQSPSSLSASVGDRVTITCRASQDIPRSISGYVAWYQQKPGKAPKLLIYWGSYLYSGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCQQHYTTPPTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC
>2v7n_B mol:protein length:229  IMMUNOGLOBULIN HEAVY CHAIN
QVQLVESGGGLVQPGGSLRLSCAASGFTFRNSAMHWVRQAPGKGLEWVSSIWYSGSNTYYADSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCARFAGGWGAYDVWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSEFHHHHHH
>4ium_A mol:protein length:142  papain-like protease 2
GYNPPGDGACGYRCLAFMNGATVVSAGCSSDLWCDDELAYRVFQLSPTFTVTIPGGRVCPNAKYAMICDKQHWRVKRAKGVGLCLDESCFRGICNCQRMSGPPPAPVSAAVLDHILEAATFGNVRVVTPEGQGSSGHHHHHH
>5qob_B mol:protein length:189  Thiol:disulfide interchange protein
AQYEDGKQYTTLEKPVAGAPQVLEFFSFFCPHCYQFEEVLHISDNVKKKLPEGVKMTKYHVNFMGGDLGKDLTQAWAVAMALGVEDKVTVPLFEGVQKTQTIRSASDIRDVFINAGIKGEEYDAAWNSFVVKSLVAQQEKAAADVQLRGVPAMFVNGKYQLNPQGMDTSNMDVFVQQYADTVKYLSEKK
>7odk_AAA mol:protein length:617  Receptor-like protein kinase HSL1
GSSMDNQDGFILQQVKLSLDDPDSYLSSWNSNDASPCRWSGVSCAGDFSSVTSVDLSSANLAGPFPSVICRLSNLAHLSLYNNSINSTLPLNIAACKSLQTLDLSQNLLTGELPQTLADIPTLVHLDLTGNNFSGDIPASFGKFENLEVLSLVYNLLDGTIPPFLGNISTLKMLNLSYNPFSPSRIPPEFGNLTNLEVMWLTECHLVGQIPDSLGQLSKLVDLDLALNDLVGHIPPSLGGLTNVVQIELYNNSLTGEIPPELGNLKSLRLLDASMNQLTGKIPDELCRVPLESLNLYENNLEGELPASIALSPNLYEIRIFGNRLTGGLPKDLGLNSPLRWLDVSENEFSGDLPADLCAKGELEELLIIHNSFSGVIPESLADCRSLTRIRLAYNRFSGSVPTGFWGLPHVNLLELVNNSFSGEISKSIGGASNLSLLILSNNEFTGSLPEEIGSLDNLNQLSASGNKFSGSLPDSLMSLGELGTLDLHGNQFSGELTSGIKSWKKLNELNLADNEFTGKIPDEIGSLSVLNYLDLSGNMFSGKIPVSLQSLKLNQLNLSYNRLSGDLPPSLAKDMYKNSFIGNPGLCGDIKGLCGSENEAKKRGYVLEGSENLYFQ
>1ixm_B mol:protein length:192  PROTEIN (SPORULATION RESPONSE REGULATORY PROTEIN)
MKDVSKNQEENISDTALTNELIHLLGHSRHDWMNKLQLIKGNLSLQKYDRVFEMIEEMVIDAKHESKLSNLKTPHLAFDFLTFNWKTHYMTLEYEVLGEIKDLSAYDQKLAKLMRKLFHLFDQAVSRESENHLTVSLQTDHPDRQLILYLDFHGAFADPSAFDDIRQNGYEDVDIMRFEITSHECLIEIGLD
>7c0w_A mol:protein length:406  Sugar ABC transporter, periplasmic sugar-binding protein
MMKPEDVIKEQCARAKVVAELWHGFTGGAPKAALENLVVEFNKAQQGRCVRPVPQGGYRDLSTKIKAAFAAGKVPTMAQAFENNIALYLEAKALLPIESLGVKLQGVNLTFLNAVRFGGVVYGVPFNKSIQVLYYNKDLLKKHGVPVPATLEEFVAAAKKLSRAEGGPVYWFQPDASTFAYFFFNLGGSYLKDGKLVLNSKEAVEALTLLQNGVKEGWAKPITSGAINQNLGSGPYAFSVDTSAGYTYYLRAAKFDLGVATLPGRTKGQPGYGLVQGTNLVVFRQASKEEQAVAKDFLEFVLSPRAQAVFATATGYVPVTEGALKDPVYQAYAAENPDYATIVRQSRYAKFEPALAEWEQIRFDILGQAIKEAILNKADPKAALDRAQKLAEDLLSSRTRHHHHHH
>5pln_A mol:protein length:364  Lysine-specific demethylase 4D
MHHHHHHSSGVDLGTENLYFQSMETMKSKANCAQNPNCNIMIFHPTKEEFNDFDKYIAYMESQGAHRAGLAKIIPPKEWKARETYDNISEILIATPLQQVASGRAGVFTQYHKKKKAMTVGEYRHLANSKKYQTPPHQNFEDLERKYWKNRIYNSPIYGADISGSLFDENTKQWNLGHLGTIQDLLEKECGVVIEGVNTPYLYFGMWKTTFAWHTEDMDLYSINYLHLGEPKTWYVVPPEHGQRLERLARELFPGSSRGCGAFLRHKVALISPTVLKENGIPFNRITQEAGEFMVTFPYGYHAGFNHGFNCAEAINFATPRWIDYGKMASQCSCGEARVTFSMDAFVRILQPERYDLWKRGQDR
>7xxg_A mol:protein length:277  VP1
GDNQDRTVANTQPSGPSNSKEIPALTAVETGHTSQVDPSDTLQTRHVVNFHSRSESTVENFMGRAACVFMDQYKLNGEETSTDNFAVWTINVREMAQLRRKCELFTYMRFDIEMTMVITSCQDQGTQLEQDMPVLTHQIMYVPPGGPIPAKVDSYEWQTSTNPSVFWTEGNAPARMSIPFISVGNAYSLFYDGWSHFTQDGTYGYTTLNAMGKLFVRHVNKSSPHQITSTIRVYFKPKHIKAWVPRPPRLCPYINKGDVNFVVTEVTDARKSITDTP
>6ynl_A mol:protein length:183  YTHDC1
MHHHHHHSSGRENLYFQGTSKLKYVLQDARFFLIKSNNHENVSLAKAKGVWSTLPVNEKKLNLAFRSARSVILIFSVRESGKFQGFARLSSESHHGGSPIHWVLPAGMSAKMLGGVFKIDWICRRELPFTKSAHLTNPWNEHKPVKIGRDGQEIELECGTQLCLLFPPDESIDLYQVIHKMRH
>7xat_A mol:protein length:563  Somatostatin receptor type 2,LargeBit
MKTIIALSYIFCLVFADYKDDDDKGSGSHHHHHHHHHHLEVLFQGPMDMADEPLNGSHTWLSIPFDLNGSVVSTNTSNQTEPYYDLTSNAVLTFIYFVVCIIGLCGNTLVIYVILRYAKMKTITNIYILNLAIADELFMLGLPFLAMQVALVHWPFGKAICRVVMTVDGINQFTSIFCLTVMSIDRYLAVVHPIKSAKWRRPRTAKMITMAVWGVSLLVILPIMIYAGLRSNQWGRSSCTINWPGESGAWYTGFIIYTFILGFLVPLTIICLCYLFIIIKVKSSGIRVGSSKRKKSEKKVTRMVSIVVAVFIFCWLPFYIFNVSSVSMAISPTPALKGMFDFVVVLTYANSCANPILYAFLSDNFKKSFQNVLCLVKVSGTDDGERSDSKQDKSRLNETTETQRTVFTLEDFVGDWEQTAAYNLDQVLEQGGVSSLLQNLAVSVTPIQRIVRSGENALKIDIHVIIPYEGLSADQMAQIEEVFKVVYPVDDHHFKVILPYGTLVIDGVTPNMLNYFGRPYEGIAVFDGKKITVTGTLWNGNKIIDERLITPDGSMLFRVTINS
>3k7z_A mol:protein length:33  General control protein GCN4
RMKQLEDKVEELLSKAYHLENEVARLKKLVGER
>1uld_C mol:protein length:150  galectin-2
MLYHLFVNNQVKLQNDFKPESVAAIRSSAFNSKGGTTVFNFLSAGENILLHISIRPGENVIVFNSRLKNGAWGPEERIPYAEKFRPPNPSITVIDHGDRFQIRFDYGTSIYYNKRIKENAAAIAYNAENSLFSSPVTVDVHGLLPPLPPA
>1nz0_A mol:protein length:118  Ribonuclease P protein component
GSTESFTRRERLRLRRDFLLIFKEGKSLQNEYFVVLFRKNGMDYSRLGIVVKRKFGKATRRNKLKRWVREIFRRNKGVIPKGFDIVVIPRKKLSEEFERVDFWTVREKLLNLLKRIEG
>7wt2_B mol:protein length:184  Lactoylglutathione lyase
MAEPQPPSGGLTDEAALSCCSDADPSTKDFLLQQTMLRVKDPKKSLDFYTRVLGMTLIQKCDFPIMKFSLYFLAYEDKNDIPKEKDEKIAWALSRKATLELTHNWGTEDDETQSYHNGNSDPRGFGHIGIAVPDVYSACKRFEELGVKFVKKPDDGKMKGLAFIQDPDGYWIEILNPNKMATLM
>4v79_AS mol:protein length:81  30S ribosomal protein S19
XRSLKKGPFIDLHLLKKVEKAVESGDKKPLRTWSRRSTIFPNMIGLTIAVHNGRQHVPVFVTDEMVGHKLGEFAPTRTYRX
>4prp_B mol:protein length:99  Beta-2-microglobulin
IQRTPKIQVYSRHPAENGKSNFLNCYVSGFHPSDIEVDLLKNGERIEKVEHSDLSFSKDWSFYLLYYTEFTPTEKDEYACRVNHVTLSQPKIVKWDRDM
>6zpo_H mol:protein length:146  ATP synthase subunit delta, mitochondrial
AEAAAAQAPAAGPGQMSFTFASPTQVFFNSANVRQVDVPTQTGAFGILAAHVPTLQVLRPGLVVVHAEDGTTSKYFVSSGSVTVNADSSVQLLAEEAVTLDMLDLGAAKANLEKAQSELLGAADEATRAEIQIRIEANEALVKALE
>1yxo_B mol:protein length:328  4-hydroxythreonine-4-phosphate dehydrogenase 1
MSLRFALTPGEPAGIGPDLCLLLARSAQPHPLIAIASRTLLQERAGQLGLAIDLKDVSPAAWPERPAKAGQLYVWDTPLAAPVRPGQLDRANAAYVLETLTRAGQGCLDGHFAGMITAPVHKGVINEAGIPFSGHTEFLADLTHTAQVVMMLATRGLRVALATTHLPLREVADAISDERLTRVARILHADLRDKFGIAHPRILVCGLNPHAGEGGHLGREEIEVIEPCLERLRGEGLDLIGPLPADTLFTPKHLEHCDAVLAMYHDQGLPVLKYKGFGAAVNVTLGLPIIRTSVDHGTALDLAGSGRIDSGSLQVALETAYQMAASRC
>7n2u_Pp mol:protein length:3  Nascent peptide
MFK
>4ui8_C mol:protein length:48  TANKYRASE-2
MAHSPPGHHSVTGRPSVNGLALAEYVIYRGEQAYPEYLITYQIMRPEG
>4v8d_DT mol:protein length:96  50S ribosomal protein L23
MKTAYDVILAPVLSEKAYAGFAEGKYTFWVHPKATKTEIKNAVETAFKVKVVKVNTLHVRGKKKRLGRYLGKRPDRKKAIVQVAPGQKIEALEGLI
>5dcm_B mol:protein length:243  PhoB family transcriptional regulator
MSQEQGKIYIVEDDMTIVSLLKDHLSASYHVSSVSNFRDVKQEIIAFQPDLILMDITLPYFNGFYWTAELRKFLTIPIIFISSSNDEMDMVMALNMGGDDFISKPFSLAVLDAKLTAILRRSQQFIQQELTFGGFTLTREGLLSSQDKEVILSPTENKILSILLMHPKQVVSKESLLEKLWENDSFIDQNTLNVNMTRLRKKIVPIGFDYIHTVRGVGYLLQNDPSSSVDKLAAALEHHHHHH
>6v1q_A mol:protein length:773  Two pore channel 3
MSEGKTEKTSHTLTKDEGFTNGGNHVPSNVTDQMTEKFDLATVYVSDAKYNRNIFFDTSPQAVKLYLLYNHWFMQTLVYVFIIINLALALFEDPAVVPLPIWATSTIETICLSAFTVRIIHYAKVIPKDKFWKDPKNICIIIIVTLSFIDMVIYGALKATGHYGIRWSRVLRPLLLVNVTEGRQLRRAFRSIRNALPQISYVFFLFMFSVLVFSLMALKLFGKRGLLTINGSPYFTDYMDIVFDLYVLVTTANSPDVMMPAYNSSVYFTIFFILYIVINTYTFMSFFLAVVYNNYKKYLKEEVRQLVKAKRIKMCRAFSLLQENRGEGGEPVVTQANWNHLVKLVKPKISTAHRELLWSVLDDQNKGHIGKFAFVQLADLLSIQVITVKSQAHPIQICFPSLYNSLPSRFIRQMVHHRVFVYAYDLIILVNAVFIGLDEENPVVSNAEWGFLALYMLEILLKLYATEPRAFFARHQFWNWFDTIIVVSALFGTIINSALKHSGGYTSRQVLDIVFILRVLRLIRVVDSIKRFRAIINTLIKIGPTILTFGQLILVVYYIFAMVGMELFKGKIQFFEPNSTSPDREYCGNPLLKSTSFAKLNYCKNNFNDVISSFILLLELTVVNQWHVLTSGFTAVTHVSARLFFVIFHIVVVIIIINIFVAFILEAFLVEYTVDKSELQTSLEKKIEELELNVQQDGVDTGLVDAMETNDSDLGSSEDGKRKPSLMFKIASRRSRTVDGLLQRMFETDLRPEDFNEEELDNTNFSNPVFDSV
>6xza_O2 mol:protein length:117  50S ribosomal protein L18
MDKKSARIRRATRARRKLQELGATRLVVHRTPRHIYAQVIAPNGSEVLVAASTVEKAIAEQLKYTGNKDAAAAVGKAVAERALEKGIKDVSFDRSGFQYHGRVQALADAAREAGLQF
>7of6_J mol:protein length:192  39S ribosomal protein L11, mitochondrial
MSKLGRAARGLRKPEVGGVIRAIVRAGLAMPGPPLGPVLGQRGVSINQFCKEFNERTKDIKEGIPLPTKILVKPDRTFEIKIGQPTVSYFLKAAAGIEKGARQTGKEVAGLVTLKHVYEIARIKAQDEAFALQDVPLSSVVRSIIGSARSLGIRVVKDLSSEELAAFQKERAIFLAAQKEADLAAQEEAAKK
>5ltq_M mol:protein length:269  Green fluorescent protein blFP-Y3
MRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDPMVSKGEEDNMASLPATHELHIFGSFNGVDFDMVGRGTGNPNDGYEELNLKSTKGALQFSPWILVPQIGYGFHQYLPFPDGMSPFQAAMKDGSGYQVHRTMQFEDGASLTSNYRYTYEGSHIKGEFQVIGTGFPADGPVMTNSLTAADWCVTKMLYPNDKTIISTFDWTYTTGSGKRYQSTARTTYTFAKPMAANILKNQPMFVFRKTELKHSKTELNFKEWQKAFTDVMGMDELYK
>1rx0_B mol:protein length:393  Acyl-CoA dehydrogenase family member 8, mitochondrial
MVQTGHRSLTSCIDPSMGLNEEQKEFQKVAFDFAAREMAPNMAEWDQKELFPVDVMRKAAQLGFGGVYIQTDVGGSGLSRLDTSVIFEALATGCTSTTAYISIHNMCAWMIDSFGNEEQRHKFCPPLCTMEKFASYCLTEPGSGSDAASLLTSAKKQGDHYILNGSKAFISGAGESDIYVVMCRTGGPGPKGISCIVVEKGTPGLSFGKKEKKVGWNSQPTRAVIFEDCAVPVANRIGSEGQGFLIAVRGLNGGRINIASCSLGAAHASVILTRDHLNVRKQFGEPLASNQYLQFTLADMATRLVAARLMVRNAAVALQEERKDAVALCSMAKLFATDECFAICNQALQMHGGYGYLKDYAVQQYVRDSRVHQILEGSNEVMRILISRSLLQE
>1c4y_1 mol:protein length:36  THROMBIN:SHORT CHAIN
TFGSGEADCGLRPLFEKKSLEDKTERELLESYIDGR
>7tab_A mol:protein length:130  Isoform 4 of Transcription activator BRG1
GSAEKLSPNPPNLTKKMKKIVDAVIKYKDSSSGRQLSEVFIQLPSRKELPEYYELIRKPVDFKKIKERIRNHKYRSLNDLEKDVMLLCQNAQTFNLEGSLIYEDSIVLQSVFTSVRQKIEKEDDSEGEES
>6p4h_E mol:protein length:281  uS3
MSARRRRRRAAFRRRAEPFIPISVREPLPFLSAARGGKMAVQISKKRKFVADGIFKAELNEFLTRELAEDGYSGVEVRVTPTRTEIIILATRTQNVLGEKGRRIRELTAVVQKRFGFPEGSVELYAEKVATRGLCAIAQAESLRYKLLGGLAVRRACYGVLRFIMESGAKGCEVVVSGKLRGQRAKSMKFVDGLMIHSGDPVNYYVDTAVRHVLLRQGVLGIKVKIMLPWDPSGKIGPKKPLPDHVSIVEPKDEILPTTPISEQKGGKPEPPAMPQPVPTA
>6zzy_7 mol:protein length:221  Chlorophyll a-b binding protein, chloroplastic
VRELWFPGNKEVVPDYLDGSLVGDHGFDPLGLGSSPEQLSWNVHAEIFHGRLAMTGVAGILLTSLLHKGGADVPEWFEAGRVYLDRNPNVDFGALLFSTIVMSGFVEFKRLNDIRNPGSQGSGILPEDFKGVGGPQGRTVGGPYVGGRYFDPMGLCRGSPEQTLKYKWNEIRNGRLAMMAFLGFAAQYAATGKGPIDNLVDHVADPFHTTFVHNGVSVPFI
>5ai4_A mol:protein length:549  BIFUNCTIONAL EPOXIDE HYDROLASE 2
GMTLRAAVFDLDGVLALPAVFGVLGRTEEALALPRGLLNDAFQKGGPEGATTRLMKGEITLSQWIPLMEENCRKCSETAKVCLPKNFSIKEIFDKAISARKINRPMLQAALMLRKKGFTTAILTNTWLDDRAERDGLAQLMCELKMHFDFLIESCQVGMVKPEPQIYKFLLDTLKASPSEVVFLDDIGANLKPARDLGMVTILVQDTDTALKELEKVTGIQLLNTPAPLPTSCNPSDMSHGYVTVKPRVRLHFVELGSGPAVCLCHGFPESWYSWRYQIPALAQAGYRVLAMDMKGYGESSAPPEIEEYCMEVLCKEMVTFLDKLGLSQAVFIGHDWGGMLVWYMALFYPERVRAVASLNTPFIPANPNMSPLESIKANPVFDYQLYFQEPGVAEAELEQNLSRTFKSLFRASDESVLSMHKVCEAGGLFVNSPEEPSLSRMVTEEEIQFYVQQFKKSGFRGPLNWYRNMERNWKWACKSLGRKILIPALMVTAEKDFVLVPQMSQHMEDWIPHLKRGHIEDCGHWTQMDKPTEVNQILIKWLDSDARN
>6vlz_A0 mol:protein length:218  28S ribosomal protein S34, mitochondrial
MARKKVRPRLIAELARRVRALREQLNRPRDSQLYAVDYETLTRPFSGRRLPVRAWADVRRESRLLQLLGRLPLFGLGRLVTRKSWLWQHDEPCYWRLTRVRPDYTAQNLDHGKAWGILTFKGKTESEAREIEHVMYHDWRLVPKHEEEAFTAFTPAPEDSLASVPYPPLLRAMIIAERQKNGDTSTEEPMLNVQRIRMEPWDYPAKQEDKGRAKGTPV
>3j3q_eB mol:protein length:231  capsid protein
PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIEPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVL
>1c2y_H mol:protein length:156  PROTEIN (LUMAZINE SYNTHASE)
MNELEGYVTKAQSFRFAIVVARFNEFVTRRLMEGALDTFKKYSVNEDIDVVWVPGAYELGVTAQALGKSGKYHAIVCLGAVVKGDTSHYDAVVNSASSGVLSAGLNSGVPCVFGVLTCDNMDQAINRAGGKAGNKGAESALTAIEMASLFEHHLKA
>7vfk_B mol:protein length:505  Glycosyl transferase, group 1 family protein
SMNYFVGNSLGVNLTGIEKAIINRLNLFKEMGRPAQCVFLSWNRYLYRNAQNYITSSDYINMYDFFQEATYLERNEPFDWLSYWTDECHYTLKHVENSHDFRIYDQERFLMYAHFQDPKYRILDYVNHFDSQRRKVKRDFYDVRGFLSCSRILVDKQQTLCEFFYNPEGDTKLEKYFSYKDGKPEVQKIIVYYANKQYFFNNETELGAFFIKQLYQHGDLFFSDRNVYTAPIFNLTPESIPVVAVLHSTHIKNIDALDSSPFKNVYKAMFENLSRYRAIIVSTEQQKLDVEKRINHTIPVVNIPVGYSETIDTPVQTLDQRSVKLISVARYSPEKQLHQQIELIKRLVSYVPKIELHMYGFGSESKKLNELIQKYGLENHVYLRGFLSNLDQEYSDAYLSLITSNMEGFSLALLESLAHGVPVISYDIKYGPNELITSDFNGYLITKNDEDALFDKVKYVIDHPEVQQRLSKGSLAKAQQYSKASLIKQWDQFVRLILEHHHHHH
>5wns_L mol:protein length:124  30S ribosomal protein S12
PTINQLVRKGREKVRKKSKVPALKGAPFRRGVCTVVRTVTPKKPNSALRKVAKVRLTSGYEVTAYIPGEGHNLQEHSVVLIRGGRVKXLPGVRYHIVRGVYDAAGVKDRKKSRSKYGTKKPKEA
>4wss_B mol:protein length:514  Hemagglutinin
ADPGDKICIGYHANNSTTQVDTILEKNVTVTHSVELLETQKESRFCRVLNKAPLDLGDCTTEGWILGNPRCDKLLGDRSWSYIVERPDAQNGICYPGVLKEAEELKALIGSIDTIQRFEMFPKSTWTGVDTNSGVTSACTYNGGSSFYRNLLWIIKIRSDPYSLIKGTYTNTGSQSILYFWGVHHPPDDVEQANLYGLGTRYVRMGTESMNFAKGPEIADRPPANGQRGRIDYYWSVLKPGETLNVESNGNLIAPWYAYKFTSSRHKGAIFRSDLPIENCDAVCQTLTGAINTNKTFQNVSPIWIGECPKYVKSKSLKLATGLRNVPQVKTRGLFGAIAGFIEGGWTGMVDGWYGYHHENSQGSGYAADKESTQKAIDGITNKVNSIIDKMNTQFEAVEHEFSNLEKRISNLNKRMEDGFLDVWTYNAELLVLLENERTLDMHDANVKNLHEKVKSQLRDNAKDLGNGCFEFWHKCDNECINSVKNGTYNYPKYQEESRLNREEIKSGRLVPRG
>6ip5_2X mol:protein length:125  60S ribosomal protein L31
MAPAKKGGEKKKGRSAINEVVTREYTINIHKRIHGVGFKKRAPRALKEIRKFAMKEMGTPDVRIDTRLNKAVWAKGIRNVPYRIRVRLSRKRNEDEDSPNKLYTLVTYVPVTTFKNLQTVNVDEN
>5lng_C mol:protein length:164  Putative Fml fimbrial adhesin FmlD
FSCNVDGGSSIGAGTTSVYVNLDPVIQPGQNLVVDLSQHISCWNDYGGWYDTDHINLVQGSAFAGSLQSYKGSLYWNNVTYPFPLTTNTNVLDIGDKTPMPLPLKLYITPVGAAGGVVIKAGEVIARIHMYKIATLGSGNPRNFTWNIISNNSVVMPTHHHHHH
>6u42_Z0 mol:protein length:443  Tubulin beta
MREIVHIQGGQCGNQIGAKFWEVVSDEHGIDPTGTYHGDSDLQLERINVYFNEATGGRYVPRAILMDLEPGTMDSVRSGPYGQIFRPDNFVFGQTGAGNNWAKGHYTEGAELIDSVLDVVRKEAESCDCLQGFQVCHSLGGGTGSGMGTLLISKIREEYPDRMMLTFSVVPSPKVSDTVVEPYNATLSVHQLVENADECMVLDNEALYDICFRTLKLTTPTFGDLNHLISAVMSGITCCLRFPGQLNADLRKLAVNLIPFPRLHFFMVGFTPLTSRGSQQYRALTVPELTQQMWDAKNMMCAADPRHGRYLTASALFRGRMSTKEVDEQMLNVQNKNSSYFVEWIPNNVKSSVCDIPPKGLKMSATFIGNSTAIQEMFKRVSEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDASAEEEGEFEGEEEEA
>6htr_b mol:protein length:196  PROTEASOME SUBUNIT BETA TYPE-1
TSIMAVTFKDGVILGADSRTTTGAYIANRVTDKLTRVHDKIWCCRSGSAADTQAIADIVQYHLELYTSQYGTPSTETAASVFKELCYENKDNLTAGIIVAGYDDKNKGEVYTIPLGGSVHKLPYAIAGSGSTFIYGYCDKNFRENMSKEETVDFIKHSLSQAIKWDGSSGGVIRMVVLTAAGVERLIFYPDEYEQL
>3loe_A mol:protein length:30  Neutrophil defensin 1
ACYCRIPACIAGERRYGTCIYQGRLWAACC
>7o5h_K mol:protein length:117  30S ribosomal protein S11
RKQVSDGVAHIHASFNNTIVTITDRQGNALGWATAGGSGFRGSRKSTPFAAQVAAERCADAVKEYGIKNLEVMVKGPGPGRESTIRALNAAGFRITNITDVTPIPHNGCRPPKKRRV
>4dsq_D mol:protein length:184  Peroxiredoxin type-2
MGHHHHHHMSDLVNKKFPAGDYKFQYIAISQSDADSESCKMPQTVEWSKLISENKKVIITGAPAAFSPTCTVSHIPGYINYLDELVKEKEVDQVIVVTVDNPFANQAWAKSLGVKDTTHIKFASDPGCAFTKSIGFELAVGDGVYWSGRWAMVVENGIVTYAAKETNPGTDVTVSSVESVLAHL
>5nhk_B mol:protein length:140  Ferric uptake regulation protein
MNSKNLDLKEFGFKVTQPRVEILKLFEKNKDKHLSPDDVFSKLKAQGSTTGIATVYRVLNQFESAGIINRLKLDNEQVMYELNQGEHHDHIICVKCNMIQEFYSPGIEALQKQIVESFGAEMIDYSLNIYVKCKSCREKI
>4gkf_A mol:protein length:169  CRISPR system Cmr subunit Cmr5
MEVHMLSKDNKKSIRKTLEQRRGEYAYYVIKEVADLNDKQLEEKYASLVKKAPVMILSNGLLQTLAFLLAKAETSPEKANQILSRVNEYPPRFIEKLGNDKDEHLLLYLHIVYWLRENVDRNIDVKTLLSQDYSKVLWATKEAIALLNWMRRFAVAMLKEEGKENEGSS
>3sdj_B mol:protein length:448  Serine/threonine-protein kinase/endoribonuclease IRE1
PEKKKRKRGSRGGKKGRKSRIANIPNFEQSLKNLVVSEKILGYGSSGTVVFQGSFQGRPVAVKRMLIDFCDIALMEIKLLTESDDHPNVIRYYCSETTDRFLYIALELCNLNLQDLVESKNVSDENLKLQKEYNPISLLRQIASGVAHLHSLKIIHRDLKPQNILVSTSSRFTADQQTGAENLRILISDFGLCKKLDSGQSSFRTNLNNPSGTSGWRAPELLEESTKRRLTRSIDIFSMGCVFYYILSKGKHPFGDKYSRESNIIRGIFSLDEMKCLHDRSLIAEATDLISQMIDHDPLKRPTAMKVLRHPLFWPKSKKLEFLLKVSDRLEIENRDPPSALLMKFDAGSDFVIPSGDWTVKFDKTFMDNLERYRKYHSSKLMDLLRALRNKYHNFMDLPEDIAELMGPVPDGFYDYFTKRFPNLLIGVYMIVKENLSDDQILREFLYS
>3oeb_A mol:protein length:144  S-layer associated multidomain endoglucanase
MVNMVSNPGFEDGLDSWQDWQQDMSAVPEAAHNGALGLKIGGGKAAGGGQDIPLKPNTTYILGAWAKFDSKPAGTFDVVVQYHLKDANNTYVQHILNFNETDWTYKQLLFTTPDVFGSTPELALWKGDTSKANLYVDDVYLVEV
>6y5l_E mol:protein length:70  X-31 Influenza Haemagglutinin HA1,X-31 Influenza Haemagglutinin HA1
AVPNGTLVKTITDDQIEVTNATELVCITPNGSIPNDKPFQNVNKITYGACPKYVKQNTLKLATGMRNVPE
>5den_A mol:protein length:453  Phenylalanine-4-hydroxylase
MAAVVLENGVLSRKLSDFGQETSYIEDNSNQNGAISLIFSLKEEVGALAKVLRLFEENDINLTHIESRPSRLNKDEYEFFTYLDKRSKPVLGSIIKSLRNDIGATVHELSRDKEKNTVPWFPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYTEEEKQTWGTVFRTLKALYKTHACYEHNHIFPLLEKYCGFREDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKEGDSIKAYGAGLLSSFGELQYCLSDKPKLLPLELEKTACQEYSVTEFQPLYYVAESFSDAKEKVRTFAATIPRPFSVRYDPYTQRVEVLDNTQQLKILADSINSEVGILCNALQKIKS
>7jsd_A mol:protein length:263  Lysine hydroxylase
GPHMDVHEIDETLEKFLAENYTPERVQQLADRFQRTGFVKFDSHMRIVPEELITAVRAEADRLVREHKERRDLVLGTTGGTPRNLSVVKSQDVEQSDLIRAVTRSEVLLTFLAGITRERIIPEVSDDERYLITHQEFASDTHGWHWDDYSFAFNWALRMPPIASGGMVQAVPHTHWDKNAPRINETLCERQIDTYGLVSGDLYLLRSDTTMHRTVPLTEDGAVRTMLVVSWSAERDLGKVLTGNDRWWENPEAGAAQPVHRAG
>3hzo_B mol:protein length:293  protein Rv0554, putative Bromoperoxidase
MSYYHHHHHHDYDIPTTENLYFQGAMDPEFRVINLAYDDNGTGDPVVFIAGRGGAGRTWHPHQVPAFLAAGYRCITFDNRGIGATENAEGFTTQTMVADTAALIETLDIAPARVVGVSMGAFIAQELMVVAPELVSSAVLMATRGRLDRARQFFNKAEAELYDSGVQLPPTYDARARLLENFSRKTLNDDVAVGDWIAMFSMWPIKSTPGLRCQLDCAPQTNRLPAYRNIAAPVLVIGFADDVVTPPYLGREVADALPNGRYLQIPDAGHLGFFERPEAVNTAMLKFFASVKA
>4whv_G mol:protein length:83  Polyubiquitin-B
GPGYQDPMQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG
>4ng3_D mol:protein length:335  5-carboxyvanillate decarboxylase
SLRLIATEEAVTFQPVVDALRAHSRTDDASLDMILVRDVYGDEPARPAMIGRLSDVTGERLAEMDSNGVDMHLLSLTAPGVQMFDAETGTRLARIANDLMAQTVAANPTRFAGLGTFAPQDPASAAREIERVATQLRLNGLVINSHTNDLYYDDPFFHPVFEAIEASGLALYIHPRAPSKQIDRAFRDYGMNSAIWGYGIETSTNAVRMILSGLFDRFPRLKIVLGHMGEAIPFWLWRLDYMHGNATTFGGAPKLKLKPSEYFRRNFAITTSGVESHAALRYSIEVLGPENVMWAIDYPYQPMAPAVQFIRTAPIPEDVKAMVAGGNAARIFRIT
>7og4_0 mol:protein length:188  39S ribosomal protein L32, mitochondrial
MALAMLVLVVSPWSAARGVLRNYWERLLRKLPQSRPGFPSPPWGPALAVQGPAMFTEPANDTSGSKENSSLLDSIFWMAAPKNRRTIEVNRCRRRNPQKLIKVKNNIDVCPECGHLKQKHVLCAYCYEKVCKETAEIRRQIGKQEGGPFKAPTIETVVLYTGETPSEQDQGKRIIERDRKRPSWFTQN
>7kbl_B mol:protein length:481  2-oxoglutarate carboxylase small subunit
MKHHHHHHAMFKKVLVANRGEIACRVIRACKELGIQTVAIYNEIESTARHVKMADEAYMIGVNPLDTYLNAERIVDLALEVGAEAIHPGYGFLAENEHFARLCEEKGITFIGPHWKVIELMGDKARSKEVMKRAGVPTVPGSDGILKDVEEAKRIAKEIGYPVLLKASAGGGGRGIRICRNEEELVRNYENAYNEAVKAFGRGDLLLEKYIENPKHIEFQVLGDKYGNVIHLGERDCSIQRRNQKLVEIAPSLLLTPEQREYYGSLVVKAAKEIGYYSAGTMEFIADEKGNLYFIEMNTRIQVEHPVTEMITGVDIVKWQIRIAAGERLRYSQEDIRFNGYSIECRINAEDPKKGFAPSIGTIERYYVPGGFGIRVEHASSKGYEITPYYDSLIAKLIVWAPLWEVAVDRMRSALETYEISGVKTTIPLLINIMKDKDFRDGKFTTRYLEEHPHVFDYAEHRDKEDFVAFISAVIASYHGL
>3itu_D mol:protein length:345  cGMP-dependent 3',5'-cyclic phosphodiesterase
GSAMDDEYTKLLHDGIQPVAAIDSNFASFTYTPRSLPEDDTSMAILSMLQDMNFINNYKIDCPTLARFCLMVKKGYRDPPYHNWMHAFSVSHFCYLLYKNLELTNYLEDIEIFALFISCMCHDLDHRGTNNSFQVASKSVLAALYSSEGSVMERHHFAQAIAILNTHGCNIFDHFSRKDYQRMLDLMRDIILATDLAHHLRIFKDLQKMAEVGYDRNNKQHHRLLLCLLMTSCDLSDQTKGWKTTRKIAELIYKEFFSQGDLEKAMGNRPMEMMDREKAYIPELQISFMEHIAMPIYKLLQDLFPKAAELYERVASNREHWTKVSHKFTIRGLPSNNSLDFLDEE
>7mt7_n mol:protein length:61  30S ribosomal protein S14 type Z
MAKKALVNKAAGKPRFAVRAYTRCSKCGRPRAVYRKFGLCRICLREMAHAGELPGVQKSSW
>5xnl_2 mol:protein length:232  Chlorophyll a-b binding protein 8, chloroplastic
RKSATTKKVASSGSPWYGPDRVKYLGPFSGESPSYLTGEFPGDYGWDTAGLSADPETFSKNRELEVIHSRWAMLGALGCVFPELLSRNGVKFGEAVWFKAGSQIFSEGGLDYLGNPSLVHAQSILAIWATQVILMGAVEGYRIAGGPLGEVVDPLYPGGSFDPLGLADDPEAFAELKVKELKNGRLAMFSMFGFFVQAIVTGKGPLENLADHLSDPVNNNAWSYATNFVPGK
>6cjn_B mol:protein length:225  Chalcone--flavonone isomerase 1
GSHMAASITAITVENLEYPAVVTSPVTGKSYFLGGAGERGLTIEGNFIKFTAIGVYLEDIAVASLAAKWKGKSSEELLETLDFYRDIISGPFEKLIRTSKIRELSGPEYSRKVMENCVAHLKSVGTYGDAEAEAMQKFAEAFKPVNFPPGASVFYRQSPDGILGLSFSPDTSIPEKEAALIENKAVSSAVLETMIGEHAVSPDLKRCLAARLPALLNEGAFKIGN
>2d10_F mol:protein length:28  Ezrin-radixin-moesin binding phosphoprotein 50
KERAHQKRSSKRAPQMDWSKKNELFSNL
>1xbp_D mol:protein length:180  50S ribosomal protein L5
MQQLKTKYNDQVRPALMQQFGYSSVMAVPRIEKIVVNEGLGSSKEDSKAIDKAAKELALITLQKPIITKAKKSISNFKLRQGMPVGIKVTLRGERMYVFLEKLINIGLPRIRDFRGINPNAFDGRGNYNLGIKEQLIFPEITYDMVDKTRGMDITIVTTAKTDEEARALLQSMGLPFRKQ
>4y8m_R mol:protein length:260  Proteasome subunit alpha type-5
MFLTRSEYDRGVSTFSPEGRLFQVEYSLEAIKLGSTAIGIATKEGVVLGVEKRATSPLLESDSIEKIVEIDRHIGCAMSGLTADARSMIEHARTAAVTHNLYYDEDINVESLTQSVCDLALRFGEGASGEERLMSRPFGVALLIAGHDADDGYQLFHAEPSGTFYRYNAKAIGSGSEGAQAELLNEWHSSLTLKEAELLVLKILKQVMEEKLDENNAQLSCITKQDGFKIYDNEKTAELIKELKEKEAAESPEEADVEMS
>6jvb_B mol:protein length:540  Dihydropyrimidinase-related protein 2
MHHHHHHHMSYQGKKNIPRITSDRLLIKGGKIVNDDQSFYADIYMEDGLIKQIGENLIVPGGVKTIEAHSRMVIPGGIDVHTRFQMPDQGMTSADDFFQGTKAALAGGTTMIIDHVVPEPGTSLLAAFDQWREWADSKSCCDYSLHVDISEWHKGIQEEMEALVKDHGVNSFLVYMAFKDRFQLTDCQIYEVLSVIRDIGAIAQVHAENGDIIAEEQQRILDLGITGPEGHVLSRPEEVEAEAVNRAITIANQTNCPLYITKVMSKSSAEVIAQARKKGTVVYGEPITASLGTDGSHYWSKNWAKAAAFVTSPPLSPDPTTPDFLNSLLSCGDLQVTGSAHCTFNTAQKAVGKDNFTLIPEGTNGTEERMSVIWDKAVVTGKMDENQFVAVTSTNAAKVFNLYPRKGRIAVGSDADLVIWDPDSVKTISAKTHNSSLEYNIFEGMECRGSPLVVISQGKIVLEDGTLHVTEGSGRYIPRKPFPDFVYKRIKARSRLAELRGVPRGLYDGPVCEVSVTPKTVTPASSAKTSPAKQQAPPVR
>2pmp_A mol:protein length:160  2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase
TLPFRIGHGFDLHRLEPGYPLIIGGIVIPHDRGCEAHSDGDVLLHCVVDAILGALGLPDIGQIFPDSDPKWKGAASSVFIKEAVRLMDEAGYEIGNLDATLILQRPKISPHKETIRSNLSKLLGADPSVVNLKAKTHEKVDSLGENRSIAAHTVILLMKK
>4lbp_A mol:protein length:100  5-chloro-2-hydroxyhydroquinone dehydrochlorinase (TftG)
MLFLIYRKDRPGSLQVRIDNYAAHLAYLEPLKAKIQVGGPTLGAGTGTDDKDMTGSFLIMEAESWDEVHSFVENDPFTKAGLFAATIVERWKHGKHNDSK
>6jmq_D mol:protein length:219  Antibody
DIVMSQSPSSLVVSVGEKVTMSCXXXXXXXXXXXXXXXXXWYQQKPGQSPKLLIYXXXXXXXGVPDRFTGSGSGTDFTLTISSVKAEDLAVYYCXXXXXXXXXFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYPKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKSFNRNE
>5j46_A mol:protein length:189  Peptide deformylase
MAHHHHHHMANAAHRFTEYRKTMALLNILHYPDKRLHKVAKPVDKVDDRIRKLVADMAETMYAAPGIGLAATQVDVHERVIVIDVSEDKNELRAFINPEIIWSSDGKQVYEEGCLSVPGIYDEVERPDRVRVRALNEQGETFELDCEGLLAVCIQHEMDHLMGRVFVEYLSPLKQSRIKTKMKKLERAM
>5pf4_A mol:protein length:138  Bromodomain adjacent to zinc finger domain protein 2B
MHHHHHHSSGVDLGTENLYFQSMSVKKPKRDDSKDLALCSMILTEMETHEDAWPFLLPVNLKLVPGYKKVIKKPMDFSTIREKLSSGQYPNLETFALDVRLVFDNCETFNEDDSDIGRAGHNMRKYFEKKWTDTFKVS
>6zcd_V mol:protein length:95  Vascular endothelial growth factor A
EVVKFMDVYQRSYCHPIETLVDIFQEYPDEIEYIFKPSCVPLMRCGGCCNDEGLECVPTEESNITMQIMRIKPHQGQHIGEMSFLQHNKCECRPK
>4zzc_B mol:protein length:317  Proton-gated ion channel
GQDMVSPPPPIADEPLTVNTGIYLIECYSLDDKAETFKVNAFLSLSWKDRRLAFDPVRSGVRVKTYEPEAIWIPEIRFVNVENARDADVVDISVSPDGTVQYLERFSARVLSPLDFRRYPFDSQTLHIYLIVRSVDTRNIVLAVDLEKVGKNDDVFLTGWDIESFTAVVKPANFALEDRLESKLDYQLRISRQYFSYIPNIILPMLFILFISWTAFWSTSYEANVTLVVSTLIAHIAFNILVETNLPKTPYMTYTGAIIFMIYLFYFVAVIEVTVQHYLKVESQPARAASITRASRIAFPVVFLLANIILAFLFFGF
>5t0x_C mol:protein length:19  Estrogen receptor peptide
RAANLWPSPLMIKRSKKNS
>6msb_d mol:protein length:349  26S proteasome non-ATPase regulatory subunit 8
FIKGRAPRAPPRERRRATRGGLRQVVAPPRALGSTSRPHFRRASVCRRRCRKSGGLLAASRKMAAAAVNGAAGFSSSGPAATSGAVLQAATGMYEQLKGEWNRKSPNLSKCGEELGRLKLVLLELNFLPTTGTKLTKQQLILARDILEIGAQWSILRKDIPSFERYMAQLKCYYFDYKEQLPESAYMHQLLGLNLLFLLSQNRVAEFHTELERLPAKDIQTNVYIKHPVSLEQYLMEGSYNKVFLAKGNIPAESYTFFIDILLDTIRDEIAGCIEKAYEKILFTEATRILFFNTPKKMTDYAKKRGWVLGPNNYYSFASQQQKPEDTTIPSTELAKQVIEYARQLEMIV
>7o7y_Aq mol:protein length:135  40S ribosomal protein eS17
MGRVRTKTVKKAARVIIEKYYTRLGNDFHTNKRVCEEIAIIPSKKLRNKIAGYVTHLMKRIQRGPVRGISIKLQEEERERRDNYVPEVSALDQEIIEVDPDTKEMLKLLDFGSLSNLQVTQPTVGMNFKTPRGAV
>1trs_A mol:protein length:105  THIOREDOXIN
MVKQIESKTAFQEALDAAGDKLVVVDFSATWCGPCKMIKPFFHSLSEKYSNVIFLEVDVDDAQDVASEAEVKATPTFQFFKKGQKVGEFSGANKEKLEATINELV
>6zv6_I mol:protein length:208  40S ribosomal protein S8
MGISRDNWHKRRKTGGKRKPYHKKRKYELGRPAANTKIGPRRIHTVRVRGGNKKYRALRLDVGNFSWGSECCTRKTRIIDVVYNASNNELVRTKTLVKNCIVLIDSTPYRQWYESHYALPLGRKKGAKLTPEEEEILNKKRSKKIQKKYDERKKNAKISSLLEEQFQQGKLLACIASRPGQCGRADGYVLEGKELEFYLRKIKARKGK
>3nff_D mol:protein length:121  RNA polymerase I subunit A34.5
MGYQPPSDYKQCKHLKSFPVSELKGDNKELWLMKVPANIDISQLKSLPLDTDATVSTVELGSKNFNVLQNTSTQEGSDNTNLSLLIPSEKKKETLKVATSKDNKSVYFDRVFTISETARIP
>7lus_B mol:protein length:207  Immunoglobulin heavy constant gamma 2
GPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTFRVVSVLTVVHQDWLNGKEYKCKVSNKGLPAPIEKTISKTKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYDTTPPMLDSDGSFFLYSDLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSL
>5t15_E mol:protein length:4676  Ryanodine receptor 1,Ryanodine receptor 1,Ryanodine receptor 1,Ryanodine receptor 1,Ryanodine receptor 1,Ryanodine receptor 1,Ryanodine receptor 1
QFLRTDDEVVLQCSATVLKEQLKLCLAAEGFGNRLCFLEPTSNAQNVPPDLAICCFTLEQSLSVRALQEMLANTVEAGVESSQGGGHRTLLYGHAILLRHAHSRMYLSCLTTSRSMTDKLAFDVGLQEDATGEACWWTMHPASKQRSEGEKVRVGDDLILVSVSSERYLHLSTASGELQVDASFMQTLWNMNPICSCCEEGYVTGGHVLRLFHGHMDECLTISAADSDDQRRLVYYEGGAVCTHARSLWRLEPLRISWSGSHLRWGQPLRIRHVTTGRYLALTEDQGLVVVDACKAHTKATSFCFRVSKEKLDTAPKRDVEGMGPPEIKYGESLCFVQHVASGLWLTYAAPDPKALRLGVLKKKAILHQEGHMDDALFLTRCQQEESQAARMIHSTAGLYNQFIKGLDSFSGKPRGSGPPAGPALPIEAVILSLQDLIGYFEPPSEELQHEEKQSKLRSLRNRQSLFQEEGMLSLVLNCIDRLNVYTTAAHFAEYAGEEAAESWKEIVNLLYELLASLIRGNRANCALFSTNLDWVVSKLDRLEASSGILEVLYCVLIESPEVLNIIQENHIKSIISLLDKHGRNHKVLDVLCSLCVCNGVAVRSNQDLITENLLPGRELLLQTNLINYVTSIRPNIFVGRAEGSTQYGKWYFEVMVDEVVPFLTAQATHLRVGWALTEGYSPYPGGGEGWGGNGVGDDLYSYGFDGLHLWTGHVARPVTSPGQHLLAPEDVVSCCLDLSVPSISFRINGCPVQGVFEAFNLDGLFFPVVSFSAGVKVRFLLGGRHGEFKFLPPPGYAPCHEAVLPRERLRLEPIKEYRREGPRGPHLVGPSRCLSHTDFVPCPVDTVQIVLPPHLERIREKLAENIHELWALTRIEQGWTYGPVRDDNKRLHPCLVNFHSLPEPERNYNLQMSGETLKTLLALGCHVGMADEKAEDNLKKTKLPKTYMMSNGYKPAPLDLSHVRLTPAQTTLVDRLAENGHNVWARDRVAQGWSYSAVQDIPARRNPRLVPYRLLDEATKRSNRDSLCQAVRTLLGYGYNIEPPDQEPSQVENQSRWDRVRIFRAEKSYTVQSGRWYFEFEAVTTGEMRVGWARPELRPDVELGADELAYVFNGHRGQRWHLGSEPFGRPWQSGDVVGCMIDLTENTIIFTLNGEVLMSDSGSETAFREIEIGDGFLPVCSLGPGQVGHLNLGQDVSSLRFFAICGLQEGFEPFAINMQRPVTTWFSKSLPQFEPVPPEHPHYEVARMDGTVDTPPCLRLAHRXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXMPLSAAMFLSERKNPAPQCPPRLEVQMLMPVSWSRMPNHFLQVETRRAGERLGWAVQCQDPLTMMALHIPEENRCMDILELSERLDLQRFHSHTLRLYRAVCALGNNRVAHALCSHVDQAQLLHALEDAHLPGPLRAGYYDLLISIHLESACRSRRSMLSEYIVPLTPETRAITLFPPGRKGGNARRHGLPGVGVTTSLRPPHHFSPPCFVAALPAAGVAEAPARLSPAIPLEALRDKALRMLGEAVRDGGQHARDPVGGSVEFQFVPVLKLVSTLLVMGIFGDEDVKQILKMIEPEVFTEEEEEEEEEEEEEEEEEEDEEEKEEDEEEEEKEDAEKEEEEAPEGEKEDLEEGLLQMKLPESVKLQMCNLLEYFCDQELQHRVESLAAFAERYVDKLQANQRSRYALLMRAFTMSAAETARRTREFRSPPQEQINMLLHFKDEADEEDCPLPEDIRQDLQDFHQDLLAHCGIQLEGEEEEPEEETSLSSRLRSLLETVRLVKKKEEKPEEELPAEEKKPQSLQELVSHMVVRWAQEDYVQSPELVRAMFSLLHRQYDGLGELLRALPRAYTISPSSVEDTMSLLECLGQIRSLLIVQMGPQEENLMIQSIGNIMNNKVFYQHPNLMRALGMHETVMEVMVNVLGGGETKEIRFPKMVTSCCRFLCYFCRISRQNQRSMFDHLSYLLENSGIGLGMQGSTPLDVAAASVIDNNELALALQEQDLEKVVSYLAGCGLQSCPMLLAKGYPDIGWNPCGGERYLDFLRFAVFVNGESVEENANVVVRLLIRKPECFGPALRGEGGSGLLAAIEEAIRISEDPARDGPGVRRDRRREHFGEEPPEENRVHLGHAIMSFYAALIDLLGRCAPEMHLIQAGKGEALRIRAILRSLVPLDDLVGIISLPLQIPTLXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXNFDPRPVETLNVIIPEKLDSFINKFAEYTHEKWAFDKIQNNWSYGENVDEELKTHPMLRPYKTFSEKDKEIYRWPIKESLKAMIAWEWTIEKAREGEEERTEKKKTRKISQTAQTYDPREGYNPQPPDLSGVTLSRELQAMAEQLAENYHNTWGRKKKQELEAKGGGTHPLLVPYDTLTAKEKARDREKAQELLKFLQMNGYAVTRXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTPLYNLPTHRACNMFLESYKAAWILTEDHSFEDRMIDDLSKAGEQEEEEEEVEEKKPDPLHQLVLHFSRTALTEKSKLDEDYLYMAYADIMAKSCHLEEGGENGEAEEEEVEVSFEEKEMEKQRLLYQQSRLHTRGAAEMVLQMISACKGETGAMVSSTLKLGISILNGGNAEVQQKMLDYLKDKKEVGFFQSIQALMQTCSVLDLNAFERQNKAEGLGMVNEDGTVINRQNGEKVMADDEFTQDLFRFLQLLCEGHNNDFQNYLRTQTGNTTTINIIICTVDYLLRLQESISDFYWYYSGKDVIEEQGKRNFSKAMSVAKQVFNSLTEYIQGPCTGNQQSLAHSRLWDAVVGFLHVFAHMMMKLAQDSSQIELLKELLDLQKDMVVMLLSLLEGNVVNGMIARQMVDMLVESSSNVEMILKFFDMFLKLKDIVGSEAFQDYVTDPRGLISKKDFQKAMDSQKQFTGPEIQFLLSCSEADENEMINFEEFANRFQEPARDIGFNVAVLLTNLSEHVPHDPRLRNFLELAESILEYFRPYLGRIEIMGASRRIERIYFEISETNRAQWEMPQVKESKRQFIFDVVNEGGEAEKMELFVSFCEDTIFEMQIAAQISEPEGEPEADEDEGMGEAAAEGAEEGAAGAEGAAGTVAAGATARLAAAAARALRGLSYRSLRRRVRRLRRLTAREAATALAALLWAVVARAGAAGAGAAAGALRLLWGSLFGGGLVEGAKKVTVTELLAGMPDPTSDEVHGEQPAGPGGDADGAGEGEGEGDAAEGDGDEEVAGHEAGPGGAEGVVAVADGGPFRPEGAGGLGDMGDTTPAEPPTPEGSPILKRKLGVDGEEEELVPEPEPEPEPEPEKADEENGEKEEVPEAPPEPPKKAPPSPPAKKEEAGGAGMEFWGELEVQRVKFLNYLSRNFYTLRFLALFLAFAINFILLFYKVSDSPPGEDDMEGSAAGDLAGAGSGGGSGWGSGAGEEAEGDEDENMVYYFLEESTGYMEPALWCLSLLHTLVAFLCIIGYNCLKVPLVIFKREKELARKLEFDGLYITEQPGDDDVKGQWDRLVLNTPSFPSNYWDKFVKRKVLDKHGDIFGRERIAELLGMDLASLEITAHNERKPDPPPGLLTWLMSIDVKYQIWKFGVIFTDNSFLYLGWYMVMSLLGHYNNFFFAAHLLDIAMGVKTLRTILSSVTHNGKQLVMTVGLLAVVVYLYTVVAFNFFRKFYNKSEDEDEPDMKCDDMMTCYLFHMYVGVRAGGGIGDEIEDPAGDEYELYRVVFDITFFFFVIVILLAIIQGLIIDAFGELRDQQEQVKEDMETKCFICGIGSDYFDTTPHGFETHTLEEHNLANYMFFLMYLINKDETEHTGQESYVWKMYQERCWDFFPAGDCFRKQYEDQLS
>2isc_A mol:protein length:239  purine nucleoside phosphorylase
ATPHNSAQVGDFAETVLMCGDPLRAKLIAETYLENPKLVNNVRGIQGYTGTYKGKPISVMGHGMGLPSICIYAEELYSTYKVKTIIRVGTCGAIDMDIHTRDIVIFTSAGTNSKINRIRFMDHDYPATASFDVVCALVDAAKELNIPAKVGKGFSTDLFYNPQTELAQLMNKFHFLAVEMESAGLFPIADLYGARAGCICTVSDHILHHEETTAEERQNSFQNMMKIALEAAIKLHHHH
>4kzx_b mol:protein length:84  40S ribosomal protein S27
MPLAKDLLHPSPEEEKRKHKKKRLVQSPNSYFMDVKCPGCYKITTVFSHAQTVVLCVGCSTVLCQPTGGKARLTEGCSFRRKQH
>1y5k_A mol:protein length:141  Hemoglobin alpha chain
VLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR
>3ddo_D mol:protein length:253  Uridine phosphorylase
MSKSDVFHLGLTKNDLQGAQLAIVPGDPERVEKIAALMDKPVKLASHREFTSWRAELDGKAVIVCSTGIGGPSTSIAVEELAQLGIRTFLRIGTTGAIQPHINVGDVLVTTASVRLDGASLHFAPMEFPAVADFACTTALVEAAKSIGATTHVGVTASSDTFYPGQERYDTYSGRVVRRFKGSMEEWQAMGVMNYEMESATLLTMCASQGLRAGMVAGVIVNRTQQEIPNAETMKQTESHAVKIVVEAARRLL
>2klw_C mol:protein length:32  (POG)10
XPPGPPGPPGPPGPPGPPGPPGPPGPPGPPGX
>6qml_B mol:protein length:76  Polyubiquitin-B
LQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG
>6s1v_A mol:protein length:114  Gag-Pro-Pol polyprotein
WVQPITCQKPSLTLWLDDKMFTGLINTGADVTIIKLEDWPPNWPITDTLTNLRGIGQSNNPKQSSKYLTWRDKENNSGLIKPFVIPNLPVNLWGRDLLSQMKIMMCSPNDIVTA
>6cbe_X mol:protein length:736  Capsid protein VP1
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYAKSANVDFTVDNNGVYSEPRPIGTRYLTRNL
>2ide_E mol:protein length:157  Molybdenum cofactor biosynthesis protein C
MDLTHFQDGRPRMVDVTEKPETFRTATAEAFVELTEEALSALEKGGVGKGDPLVVAQLAGILAAKKTADLIPLCHPLPLTGVEVRVELLKAEKRVRIEATVKTKAETGVEMEAMTACAVAALTVYDMLKAASKGLVISQVRLLHKAGGKSGEWRREQ
>7f27_D mol:protein length:408  3-oxoacyl-(Acyl-carrier-protein) synthase
MKRVVVTGMAGITSLGETADDIFARFEAGKSGIRYMPEWEQYVDLRTKLAGPVETFHIPKHFNRKVTRGMGRVALMSVVCAETALQNAGLLGHEILSSGEAGVAFGSSAGSVDAVGEFASMLLHQSMSKINATTYIRMMAHTSAVNMTVYFGLKGLTLPTSSACTSGSMAIGQAYEAIKYGKQQVMIAGGAEELSAAGAAVFDVLFATSGMNDQPEKTPRPFDAKRDGLVIGEGAGCLILEEYEHAKARGAHIYAEVIGYGSNTDGQHVTRPESEMMGRCMELALKDASVEAKDIAYVNAHGTSTDQGDVAESQATAKVLGYKPISSLKSYFGHTLGACGAIEAWLSIEMMNRGRFIPTLNLDEIDSLCGELDYIVQQPRNLDADIIMSNNFAFGGINTSLIFKRVKQ
>3fi2_A mol:protein length:353  Mitogen-activated protein kinase 10
MSKSKVDNQFYSVEVGDSTFTVLKRYQNLKPIGSGAQGIVCAAYDAVLDRNVAIKKLSRPFQNQTHAKRAYRELVLMKCVNHKNIISLLNVFTPQKTLEEFQDVYLVMELMDANLCQVIQMELDHERMSYLLYQMLCGIKHLHSAGIIHRDLKPSNIVVKSDCTLKILDFGLARTAGTSFMMTPYVVTRYYRAPEVILGMGYKENVDIWSVGCIMGEMVRHKILFPGRDYIDQWNKVIEQLGTPCPEFMKKLQPTVRNYVENRPKYAGLTFPKLFPDSLFPADSEHNKLKASQARDLLSKMLVIDPAKRISVDDALQHPYINVWYXXXXXXDEREHTIEEWKELIYKEVMNSE
>4p18_G mol:protein length:176  Ferritin, middle subunit
MVSQVRQNYHSDCEAAVNRMLNLELYASYTYSSMYAFFDRDDVALHNVAEFFKEHSHEEREHAEKFMKYQNKRGGRVVLQKIKKPERDEWGNTLEAMQAALQLEKTVNQALLDLHKLATDKVDPHLCDFLESEYLEEQVKDIKRIGDFITNLKRLGLPENGMGEYLFDKHSVKESS
>4lb1_D mol:protein length:30  Neutrophil defensin 1
ACYCRIPACIAGERRAGTCIYQGRLWAACC
>6unz_H mol:protein length:604  fumarate hydratase 2
MGSSHHHHHHSSGLVPRGSHMASMTGGQQMGRGSEFMSLCDQCEIGCRRVGIKDIEDASAVNADFHFSAIFQPTDPHHHQTEFAKVEGSEKYVEEVEVFGRQALKVNPEALTILAHRAFSDVHHFFRKDHLEGWRRAIEDPEASDNDRYVATTLLKNACIAAGRVLPSCQDTGTAIVLGKRGELCWTGGEDEKYLSKGIWNAYRYHNLRYSQTAALDMFKECNTGDNLPAQLDLLAVPGSDYEFLFIAKGGGSANKAYLYQETKALLNPKSLRAFIEEKLKTLGTAACPPYHIALVIGGTSAEMTMKTVKLASCRYYDSLPTTGDKYGRAFRDPEWEKIVMEVAQKSGIGAQFGGKYFAHQARVIRLPRHGASCPVGLAVSCSADRQILAHINKSGIYIEQLEQNPAQYLPDIPEVHLSTTSVKVDLKRPIDKVRQQLSQYPVGTRVMLNGTLIVARDIAHAKIKEMMDNGEPLPEYMKTSPIYYAGPAKTPEGYASGSFGPTTAGRMDSYVDLFQSHGGSYITLAKGNRSKQVTDACKKHGGFYLGSIGGPAAILAKDSIKQVTCLAFPELGMEAVWKIEVEDFPAFIVVDDKGNDMYSKTLA
>7emd_A mol:protein length:275  Leucocyte antigen
GPHSLSYFYTAVSRPDRGDSRFIAVGYVDDTQFVRFDSDAPNPRMEPRAPWIQQEGQDYWDRETRKQRDTSQTYRVGLKNLRGYYNQSEAGSHTYQSMYGCYLGPDGLLLRGYRQYAYDGADYIALNEDLRSWTAADTAAQITKRKWETANVAERRRSYLQGLCVESLREYLEMGKDTLQRAEPPKTHVTRHPSSDLGVTLRCWALGFYPKEISLTWQREGQDQSQDMELVETRPSGDGTFQKWAALVVPPGEEQSYTCHVQHEGLQEPLTLRWD
>7sym_K mol:protein length:194  uS4
MPVARSWVCRKTYVTPRRPFEKSRLDQELKLIGEYGLRNKREVWRVKFTLAKIRKAARELLTLDEKDPRRLFEGNALLRRLVRIGVLDEGKMKLDYILGLKIEDFLERRLQTQVFKLGLAKSIHHARVLIRQRHIRVRKQVVNIPSFIVRLDSQKHIDFSLRSPYGGGRPGRVKRKNAKKGQGGAGAGDDEEED
>2n8n_A mol:protein length:72  Translation initiation factor IF-1
MAKQDVIELEGTVLDTLPNAMFKVELENGHEILAHVSGKIRMNYIRILPGDKVTVEMSPYDLTRGRITYRYK
>6v8z_O mol:protein length:231  VRC03 Fab Heavy Chain
QVQLVQSGAVIKTPGSSVKISCRASGYNFRDYSIHWVRLIPDKGFEWIGWIKPLWGAVSYARQLQGRVSMTRQLSQDPDDPDWGVAYMEFSGLTPADTAEYFCVRRGSCDYCGDFPWQYWCQGTVVVVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPK
>5nqv_H mol:protein length:11  EAR motif of IAA27
TELRLGLPGSE
>2fzd_A mol:protein length:316  aldose reductase
MASRILLNNGAKMPILGLGTWKSPPGQVTEAVKVAIDVGYRHIDCAHVYQNENEVGVAIQEKLREQVVKREELFIVSKLWCTYHEKGLVKGACQKTLSDLKLDYLDLYLIHWPTGFKPGKEFFPLDESGNVVPSDTNILDTWAAMEELVDEGLVKAIGISNFNHLQVEMILNKPGLKYKPAVNQIECHPYLTQEKLIQYCQSKGIVVTAYSPLGSPDRPWAKPEDPSLLEDPRIKAIAAKHNKTTAQVLIRFPMQRNLVVIPKSVTPERIAENFKVFDFELSSQDMTTLLSYNRNWRVCALLSCTSHKDYPFHEEF
>4x0g_D mol:protein length:109  Blastoderm-specific gene 25A
PMVTIGPNGTEVSRISLSAINWAMTGPSITRKLLCEIFDRDTLAHHTLSGKPSPAFRDCARPSKQQLDPLKVADLVYLMTNSCDMTPREVRTAITTKCADENKMLRSRM
>6cxa_C mol:protein length:209  Chimeric T cell antigen receptor alpha chain Va14,Va24,Ja18
MKTQVEQSPQSLVVRQGENCVLQCNYSVTPDNHLRWFKQDTGKGLVSLTVLVDQKDKTSNGRYSATLDKDAKHSTLHITATLLDDTATYICVVGDRGSALGRLHFGAGTQLIVIPDIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESS
>5y6p_z6 mol:protein length:177  R-phycoerythrin beta chain
MLDAFSRVVVNSDSKAAYVGGSDLQSLKTFISDGNKRLDAVNCIVSNASCIVSDAISGMICENPGLIAPGGNCYTNRRMAACLRDGEIILRYVSYALLAGDSSVLDDRCLNGLKETYIALGVPTASTSRAVSIMKAASTAFIMNTASGRKIEIAAGDCQALQSEAAAYFDKVGSAVD
>4r8o_B mol:protein length:104  Uncharacterized protein
GGNPGDNLIYNAEEVNGVVVSETIFKMEGTMLTNYMKHNYKYDANNQRTEDEAQKWNSNKNRWENNLCIRYTYGNKSMTTEYYKWNSKKKEYILVPEMTVTMDK
>2big_B mol:protein length:361  PHOSPHOSERINE AMINOTRANSFERASE
MVKQVFNFNAGPSALPKPALERAQKELLNFNDTQMSVMELSHRSQSYEEVHEQAQNLLRELLQIPNDYQILFLQGGASLQFTMLPMNLLTKGTIGNYVLTGSWSEKALKEAKLLGETHIAASTKANSYQSIPDFSEFQLNENDAYLHITSNNTIYGTQYQNFPEINHAPLIADMSSDILSRPLKVNQFGMIYAGAQKNLGPSGVTVVIVKKDLLNTKVEQVPTMLQYATHIKSDSLYNTPPTFSIYMLRNVLDWIKDLGGAEAIAKQNEEKAKIIYDTIDESNGFYVGHAEKGSRSLMNVTFNLRNEELNQQFLAKAKEQGFVGLNGHRSVGGCRASIYNAVPIDACIALRELMIQFKENA
>1dmx_A mol:protein length:248  MURINE CARBONIC ANHYDRASE V
CATGTRQSPINIQWKDSVYDPQLAPLRVSYDAASCRYLWNTGYFFQVEFDDSCEDSGISGGPLGNHYRLKQFHFHWGATDEWGSEHAVDGHTYPAELHLVHWNSTKYENYKKASVGENGLAVIGVFLKLGAHHQALQKLVDVLPEVRHKDTQVAMGPFDPSCLMPACRDYWTYPGSLTTPPLAESVTWIVQKTPVEVSPSQLSMFRTLLFSGRGEEEDVMVNNYRPLQPLRDRKLRSSFRLDRTKMRS
>6u42_Z7 mol:protein length:451  Tubulin alpha
MREVISIHIGQAGIQVGNACWELYCLEHGIQPDGQMPSDKTIGGGDDAFNTFFSETGAGKHVPRCIFLDLEPTVVDEVRTGTYRQLFHPEQLISGKEDAANNFARGHYTIGKEIVDLALDRIRKLADNCTGLQGFLVFNAVGGGTGSGLGSLLLERLSVDYGKKSKLGFTVYPSPQVSTAVVEPYNSVLSTHSLLEHTDVAVMLDNEAIYDICRRSLDIERPTYTNLNRLIAQVISSLTASLRFDGALNVDITEFQTNLVPYPRIHFMLSSYAPIISAEKAYHEQLSVAEITNAAFEPASMMVKCDPRHGKYMACCLMYRGDVVPKDVNASVATIKTKRTIQFVDWCPTGFKCGINYQPPTVVPGGDLAKVQRAVCMISNSTAIGEIFSRLDHKFDLMYAKRAFVHWYVGEGMEEGEFSEAREDLAALEKDFEEVGAESAEGAGEGEGEEY
>3oda_H mol:protein length:116  Poly [ADP-ribose] polymerase 1
MGSSHHHHHHSSGLVPRGSHMAESSDKLYRVEYAKSGRASCKKCSESIPKDSLRMAIMVQSPMFDGKVPHWYHFSCFWKVGHSIRHPDVEVDGFSELRWDDQQKVKKTAEAGGVTG
>3kaq_A mol:protein length:147  Flavodoxin
SKVLILFGSSTGNTESIAQKLEELVAAGGHEVTLLNAAEASADNLADGYDAVLMGCSAWGMEDLELQDDFAPLFDEMENMGLKGKKLAAFASGDMEYEHYCGAVPAIEEKARGLGAEVICEGLKIEGDASSDPDAVSAFAEDVLKKL
>5xxb_c mol:protein length:120  Ribosomal protein eL31
MKGTTRKAQNKSLQPVCRDYTIHLHKLIHGIQFKKRAPRALREIRRFAQKTMHTKDVRIDTKLNKFIWSGGIRNVPRRVRVRIARRRNDDEDSKEKFYTLVQHVPVASFENLKTEYVNEE
>2j57_B mol:protein length:105  AMICYANIN
DKATIPSESPFAAAEVADGAIVVDIAKMKYETPELHVKVGDTVTWINREAMPHNVHFVAGVLGEAALKGPMMKKEQAYSLTFTEAGTYDYHCTPHPFMRGKVVVE
>6y2l_SV mol:protein length:83  40S ribosomal protein S21
MQNDAGEFVDLYVPRKCSASNRIIGAKDHASIQMNVAEVDKVTGRFNGQFKTYAICGAIRRMGESDDSILRLAKADGIVSKNF
>7vxc_A mol:protein length:1261  Spike glycoprotein
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLDVYYHKNNKSWMKSEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYRYRLFRKSNLKPFERDISTEIYQAGSTPCNGVQGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSRGSASSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQGSGYIPEAPRDGQAYVRKDGEWVLLSTFLENLYFQGDYKDDDDKHHHHHHHHH
>6yam_f mol:protein length:71  ribosomal protein eS31
KKSYTTPKKNKHKRKKVKLAVLKYYKVDENGKISRLRRECPSDECGAGVFMASHFDRHYCGKCCLTYCFNK
>2fvv_A mol:protein length:194  Diphosphoinositol polyphosphate phosphohydrolase 1
MHHHHHHSSGVDLGTENLYFQSMMKLKSNQTRTYDGDGYKKRAACLCFRSESEEEVLLVSSSRHPDRWIVPGGGMEPEEEPSVAAVREVCEEAGVKGTLGRLVGIFENQERKHRTYVYVLIVTEVLEDWEDSVNIGRKREWFKIEDAIKVLQYHKPVQASYFETLRQGYSANNGTPVVATTYSVSAQSSMSGIR
>4fna_C mol:protein length:280  Ferric hydroxamate receptor 2
GSNNKAETKSYKMDDGKTVDIPKDPKRIAVVAPTYAGGLKKLGANIVAVNQQVDQSKVLKDKFKGVTKIGDGDVEKVAKEKPDLIIVYSTDKDIKKYQKVAPTVVVDYNKHKYLEQQEMLGKIVGKEDKVKAWKKDWEETTAKDGKEIKKAIGQDATVSLFDEFDKKLYTYGDNWGRGGEVLYQAFGLKMQPEQQKLTAKAGWAEVKQEEIEKYAGDYIVSTSEGKPTPGYESTNMWKNLKATKEGHIVKVDAGTYWYNDPYTLDFMRKDLKEKLIKAAK
>3zw8_A mol:protein length:742  PEROXISOMAL BIFUNCTIONAL ENZYME
MGSSHHHHHHSSGLVPRGSHMAEYLRLPHSLAMIRLCNPPVNAVSPTVIREVRNGLQKAGSDHTVKAIVICGANGNFCAGADIHGFSAFTPGLALGSLVDEIQRYQKPVLAAIQGVALGGGLELALGCHYRIANAKARVGLPEVTLGILPGARGTQLLPRVVGVPVALDLITSGKYLSADEALRLGILDAVVKSDPVEEAIKFAQKIIDKPIEPRRIFNKPVPSLPNMDSVFAEAIAKVRKQYPGVLAPETCVRSIQASVKHPYEVGIKEEEKLFMYLRASGQAKALQYAFFAEKSANKWSTPSGASWKTASAQPVSSVGVLGLGTMGRGIAISFARVGISVVAVESDPKQLDAAKKIITFTLEKEASRAHQNGQASAKPKLRFSSSTKELSTVDLVVEAVFEDMNLKKKVFAELSALCKPGAFLCTNTSALNVDDIASSTDRPQLVIGTHFFSPAHVMRLLEVIPSRYSSPTTIATVMSLSKKIGKIGVVVGNCYGFVGNRMLAPYYNQGFFLLEEGSKPEDVDGVLEEFGFKMGPFRVSDLAGLDVGWKIRKGQGLTGPSLPPGTPVRKRGNSRYSPLGDMLCEAGRFGQKTGKGWYQYDKPLGRIHKPDPWLSTFLSQYREVHHIEQRTISKEEILERCLYSLINEAFRILEEGMAARPEHIDVIYLHGYGWPRHKGGPMFYAASVGLPTVLEKLQKYYRQNPDIPQLEPSDYLRRLVAQGSPPLKEWQSLAGPHGSKL
>7ad0_M mol:protein length:14  Modified p53 peptide
ATSFAEYWALLXPA
>2d0c_A mol:protein length:310  ribonuclease HIII
MSNYVIQADQQLLDALRAHYEGALSDRLPAGALFAVKRPDVVITAYRSGKVLFQGKAAEQEAAKWISGASASNETADHQPSALAAHQLGSLSAIGSDEVGTGDYFGPIVVAAAYVDRPHIAKIAALGVKDSKQLNDEAIKRIAPAIMETVPHAVTVLDNPQYNRWQRSGMPQTKMKALLHNRTLVKLVDAIAPAEPEAIIIDEFLKRDSYFRYLSDEDRIIRERVHCLPKAESVHVSVAAASIIARYVFLEEMEQLSRAVGLLLPKGAGAIVDEAAARIIRARGEEMLETCAKLHFANTKKALAIAKRRK
>6ba1_O mol:protein length:321  Inosine-uridine preferring nucleoside hydrolase
GSHMKKLILDLDTGVDDTLAISYALGSPEMELIGITGTYGNVLMEQGVRNALAITDLLGHPEVKVYKGLSHASTKDSFEVLPISAFIHGDNGIGDVEIPDSPRKAEDESAVDFIIDSVKKYGKDLVYVPTGPMTNIAAALKKAPEIKDEIGKIVLMGGALTIHGNVNAWTEANISQDPDAADILFRSGAPVTMIGLDVTLQTLLTYKETKQWRDLNTKAGKFLADMTDFYIKAYETTAPHLGGCGLHDPLAVAVAVDPTLVTTLPINMQVDVEGPTRGRTIGDVTRLNDPVKTMQVAVGVDVPRFLNEFMTRISGLAKIAG
>3fch_B mol:protein length:281  Carboxysome shell protein CsoS1D
MSYYHHHHHHDYDIPTTENLTFQGAMEPTSSLNRGDRKKGSSLVTGSEVQSQSNGASCFITTDSEKSLVSRQASQVEQIELRTYVFLDSLQPQLAAYMGTVSRGFLPIPGDSCLWMEVSPGMAVHRVTDIALKASNVRLGQMIVERAFGSLALYHKDQSTVLHSGDVVLDAIGSEVRKRTKPSTSWTEVICAITPDHAVLINRQNRSGSMIQSGMSMFILETEPAGYVLKAANEAEKSANITIIDVKAVGAFGRLTLAGKEGDVEEAAAAAIRAIDQISNY
>3r37_B mol:protein length:151  4-hydroxybenzoyl-CoA thioesterase
MHRTSNGSHATGGNLPDVASHYPVAYEQTLDGTVGFVIDEMTPERATASVEVTDTLRQRWGLVHGGAYCALAQMLATEATVAVVHEKGMMAVGQSNHTSFFRPVKEGHVRAEAVRIHAGSTTWFWDVSLRDDAGRLCAVSSMSIAVRPRRD
>7zpp_G mol:protein length:281  Integrase
WIENIPLAEEEHNKWHQDAVSLHLEFGIPRTAAEDIVQQCDVCQENKMPSTLRGSNKRGIDHWQVDYTHYEDKIILVWVETNSGLIYAERVKGETGQEFRVQTMKWYAMFAPKSLQSDNGPAFVAESTQLLMKYLGIEHTTGIPWNPQSQALVERTHQTLKNTLEKLIPMFNAFESALAGTLITLNIKRKGGLGTSPMDIFIFNKEQQRIQQQSKSKQEKIRFCYYRTRKRGHPGEWQGPTQVLWGGDGAIVVKDRGTDRYLVIANKDVKFIPPPKEIQKE
>3aty_B mol:protein length:379  Prostaglandin F2a synthase
MATFPELLRPLKLGRYTLRNRIIMAPLTRCQATEDDHVPRTESMLKYYEDRASAGLIIAEATMVQPNYTGFLTEPGIYSDAQIEEWRKIVDAVHKKGGLIFLQLIHAGRAGIPEKILQQSKSDQDPLAGRLLAASAIPIKDHRIPAYFAASGEKETYGVPEELTDDEVRDGIIPLFVEGAKNAIFKAGFDGVEIHGANGYLLDAFFRESSNKRQSGPYAGTTIDTRCQLIYDVTKSVCDAVGSDRVGLRISPLNGVHGMIDSNPEALTKHLCKKIEPLSLAYLHYLRGDMVNQQIGDVVAWVRGSYSGVKISNLRYDFEEADQQIREGKVDAVAFGAKFIANPDLVERAQQNWPLNEPRPETYYTRTAVGYNDYPTYNK
>3rkc_A mol:protein length:148  Capsid protein
SRPFSVLRANDVLWLSLTAAEYDQTTYGSSTNPMYVSDTVTFVNVATGAQGVSRSLDWSKVTLDGRPLTTIQQYSKTFFVLPLRGKLSFWEAGTTKAGYPYNYNTTASDQILIENAPGHRVCISTYTTNLGSGPVSISAVGVLAPHSA
>3gew_B mol:protein length:224  Chaperone protein faeE
SLAVDQTRYIFRGDKDALTITVTNNDKERTFGGQAWVDNIVEKDTRPTFVVTPSFFKVKPNGQQTLRIIMASDHLPKDKESVYWLNLQDIPPALEGSGIAVALRTKLKLFYRPKALLEGRKGAEEGISLQSRPDGRTMLVNTTPYIFAIGSLLDGNGKKIATDNGTTQKLLMFMPGDEVQVKGNVVKVDSLNDYGELQTWTINKKKPAAPEAAKAEKADTAEQK
>2zmv_A mol:protein length:227  Trafficking protein particle complex subunit 4
MAIFSVYVVNKAGGLIYQLDSYAPRAEAEKTFSYPLDLLLKLHDERVLVAFGQRDGIRVGHAVLAINGMDVNGRYTADGKEVLEYLGNPANYPVSIRFGRPRLTSNEKLMLASMFHSLFAIGSQLSPEQGSSGIEMLETDTFKLHCYQTLTGIKFVVLADPRQAGIDSLLRKIYEIYSDFALKNPFYSLEMPIRCELFDQNLKLALEVAEKAGTFGPGSLEHHHHHH
>6y7f_A mol:protein length:288  Elongation of very long chain fatty acids protein 7
MAFSDLTSRTVHLYDNWIKDADPRVEDWLLMSSPLPQTILLGFYVYFVTSLGPKLMENRKPFELKKAMITYNFFIVLFSVYMCYEFVMSGWGIGYSFRCDIVDYSRSPTALRMARTCWLYYFSKFIELLDTIFFVLRKKNSQVTFLHVFHHTIMPWTWWFGVKFAAGGLGTFHALLNTAVHVVMYSYYGLSALGPAYQKYLWWKKYLTSLQLVQFVIVAIHISQFFFMEDCKYQFPVFACIIMSYSFMFLLLFLHFWYRAYTKGQRLPKTVKNGTCKNKDNAENLYFQ
>3ejm_A mol:protein length:146  Nucleoside diphosphate kinase
YKKAGLQRTLVLIKPDAFERSLVAEIMGRIEKKNFKIVSMKFWSKAPRNLIEQHYKEHSEQSYFNDNCDFMVSGPIISIVYEGTDAISKIRRLQGNTNPLASAPGTIRGDLANDIRENLIHASDSEDSAVDEISIWFPETKMETDN
>4hem_E mol:protein length:123  Anti-baseplate TP901-1 Llama vHH 02
QVQLVESGGGLVQAGGSLRLSCAASESTFSNYAMGWFRQAPGPEREFVATISQTGSHTYYRNSVKGRFTISRDNAKNTVYLQMNNMKPEDTAVYYCAAGDNYYYTRTYEYDYWGQGTQVTVSS
>3njk_A mol:protein length:128  Peptidase
SNAMFAPQGLAQFIKVNVTLENGEPVFIYTDANGQVCQGDITVTQAGTITYLLNDQTLKGLKFVGVGFVTPFDGIIDAVTISSDGMLVQLVDLDKTPGTTKFQFVLSNTANTLLVLSPAPQIINRPQN
>2xwq_B mol:protein length:133  SIROHYDROCHLORIN COBALTOCHELATASE
GMRRGLVIVGHGSQLNHYREVMELHRKRIEESGAFDEVKIAFAARKRRPMPDEAIREMNCDIIYVVPLFISYGLHVTEDLPDLLGFPRGRGIKEGEFEGKKVVICEPIGEDYFVTYAILNSVFRIGRDGKGEE
>7spi_F3 mol:protein length:453  TraB
MANVNKVVRRRQVALLIALVLGIGAGGAGTWMVSEMNLKKAPPAKAPKGEPAPDMTGVVNQSFDNKVQRSAIAEAQRLNKETQTEIKKLRTEMGLVSRDLKGSQDRIRELEDQNQLLQTQLEAGKNFDSLSAEPLPGALASQGKPAPAGNVPPPTSFWPAGGGQAPAAPVMTPIQRPGMMDSQEFSLPDTGPKKPRFPWISSGSFVEAIVVEGADANASVTGDKNTAPMQLRLTGKVQMPNDEEFDLTGCFVTLEAWGDVSSERAIVRSRSISCKLGDDDIDQKIAGHVSFMGKNGIKGEVVMRNGQILLYAGGAGFLDGIGKGIEKASSTTVGVGATASMSAADIGQAGLGGGVSSAAKTLSDYYIKRAEQYHPVIPIGAGNEVTLVFQDGFQLETLEEARAKAAARKKQNQPSASSTPAAMPGNTPDMLKQLQDFRVGDTVDPATGQVVTQ
>4clr_D mol:protein length:288  PTERIDINE REDUCTASE 1
MGSSHHHHHHSSGLVPRGSHMEAPAAVVTGAAKRIGRAIAVKLHQTGYRVVIHYHNSAEAAVSLADELNKERSNTAVVCQADLTNSNVLPASCEEIINSCFRAFGRCDVLVNNASAFYPTPLVQGDHEDNSNGKTVETQVAELIGTNAIAPFLLTMSFAQRQKGTNPNCTSSNLSIVNLCDAMVDQPCMAFSLYNMGKHALVGLTQSAALELAPYGIRVNGVAPGVSLLPVAMGEEEKDKWRRKVPLGRREASAEQIADAVIFLVSGSAQYITGSIIKVDGGLSLVHA
>4u50_C0 mol:protein length:105  40S ribosomal protein S10-A
MLMPKEDRNKIHQYLFQEGVVVAKKDFNQAKHEEIDTKNLYVIKALQSLTSKGYVKTQFSWQYYYYTLTEEGVEYLREYLNLPEHIVPATYIQERNPTQRPQRRY
>7ezx_G8 mol:protein length:177  B-phycoerythrin beta chain
MLDAFSRVVVNSDAKAAYVGGSDLQALKSFIADGNKRLDAVNSIVSNASCMVSDAVSGMICENPGLISPGGNCYTNRRMAACLRDGEIILRYVSYALLAGDASVLEDRCLNGLKETYIALGVPTNSSIRAVSIMKAQAVAFITNTATERKMSFAAGDCTSLASEVASYFDRVGAAIS
>5da5_c mol:protein length:116  Rru_A0973
MAQSSNSTHEPLEVLKEETVNRHRAIVSVMEELEAVDWYDQRVDASTDPELTAILAHNRDEEKEHAAMTLEWLRRNDAKWAEHLRTYLFTEGPITAANSSSVDKLAAALEHHHHHH
>2amf_A mol:protein length:259  1-Pyrroline-5-Carboxylate reductase
SNAMKIGIIGVGKMASAIIKGLKQTPHELIISGSSLERSKEIAEQLALPYAMSHQDLIDQVDLVILGIKPQLFETVLKPLHFKQPIISMAAGISLQRLATFVGQDLPLLRIMPNMNAQILQSSTALTGNALVSQELQARVRDLTDSFGSTFDISEKDFDTFTALAGSSPAYIYLFIEALAKAGVKNGIPKAKALEIVTQTVLASASNLKTSSQSPHDFIDAICSPGGTTIAGLMELERLGLTATVSSAIDKTIDKAKSL
>4v5r_AJ mol:protein length:105  30S RIBOSOMAL PROTEIN S10
MPKIRIKLRGFDHKTLDASAQKIVEAARRSGAQVSGPIPLPTRVRRFTVIRGPFKHKDSREHFELRTHNRLVDIINPNRKTIEQLMTLDLPTGVEIEIKTVGGGR
>7n02_B mol:protein length:362  Aminopeptidase P family protein
MSKIERISAFLNDKEVDMTFITNPTTLNYLTGLAISPHERIAGLMIFRDSTPMLFTPALEVEKAKEHTSGLDIFGYEDSQNPWEVVKNHVKSDVKSIAVEFSDIPLAKTEGLKAQFGDINFVNLTPLIERMRLIKSADEIEKMKVAGDFADKCFEIGFATAAERNGVTESDIVAKIEYEMKRMGVPQMSFDTLVLSGARAANPHGAPENVEIQENKLLLFDLGVMSGGYASDATRTIAIGQPNDFDAEIHKIVKEAQQAAMDFIKPGVTAHEVDAVARDLITKAGYGEYFNHRLGHGIGMDVHEYPSIVAGNDLVIQEGMCFSNEPGIYIPGKVGVRIEDCLYVTENGCESFTHTDHDLLIF
>2ivq_J mol:protein length:156  CYANATE HYDRATASE
MIQSQINRNIRLDLADAILLSKAKKDLSFAEIADGTGLAEAFVTAALLGQQALPADAARLVGAKLDLDEDSILLLQMIPLRGCIDDRIPTDPTMYKFYEMLQVYGTTLKALVHEKFGDGIISAINFKLDVKKVADPEGGERAVITLDGKYLPTKPF
>2p1n_D mol:protein length:160  SKP1-like protein 1A
MSAKKIVLKSSDGESFEVEEAVALESQTIAHMVEDDCVDNGVPLPNVTSKILAKVIEYCKRHVEAAASKAEAVEGAATSDDDLKAWDADFMKIDQATLFELILAANYLNIKNLLDLTCQTVADMIKGKTPEEIRTTFNIKNDFTPEEEEEVRRENQWAFE
>6png_A mol:protein length:421  Nitric oxide synthase, brain
CPRFLKVKNWETEVVLTDTLHLKSTLETGCTEYICMGSIMHPSQHARRPEDVATKDQLFPLAKEFIDQYYSSIKRFGSKAHMERLEEVNKEIDTTSTYQLKDTELIYGAKHAWRNASRCVGRIQWSKLQVFDARDCTTAHGMFNYICNHVKYATNKGNLRSAITIFPQRTDGKHDFRVWNSQLIRYAGYKQPDGSTLGDPANVQFTEICIQQGWKPPRGRFDVLPLLLQANGNDPELFQIPPELVLEVPIRHPKFEWFKDLGLKWYGLPAVSNMLLEIGGLEFSACPFSGWYMGTEIGVRDYCDNSRYNILEEVAKKMNLDMRKTSSLWKDQALVEINIAVLYSFQSDKVTIVDHHSATESFIKHMENEYRCRGGCPADWVWIVPPMSGSITPVFHQEMLNYRLTPSFEYQPDPWNTHVWK
>4v55_DR mol:protein length:103  50S ribosomal protein L21
MYAVFQSGGKQHRVSEGQTVRLEKLDIATGETVEFAEVLMIANGEEVKIGVPFVDGGVIKAEVVAHGRGEKVKIVKFRRRKHYRKQQGHRQWFTDVKITGISA
>5y6p_v1 mol:protein length:161  beta_APC
MQDAITAVINTADVQGKYLDDNSLDKLRGYFETGELRVRAAATIAANAATIIKESVAKALLYSDITRPGGNMYTTRRYAACIRDLDYYLRYATYGMLAGDPSILDERVLNGLKETYNSLGVPIGATVQAIQAMKEVTASLVGTNAGQEMAVYFDYICSGLS
>1lqo_A mol:protein length:135  PROBABLE Fosfomycin Resistance Protein
MLTGLNHLTLAVADLPASIAFYRDLLGFRLEARWDQGAYLELGSLWLCLSREPQYGGPAADYTHYAFGIAAADFARFAAQLRAHGVREWKQNRSEGDSFYFLDPDGHRLEAHVGDLRSRLAACRQAPYAGMRFAD
>1z5n_B mol:protein length:242  MTA/SAH nucleosidase
FQGAMDPEFSMKIGIIGAMEEQVTLLRDKIENRQTISLGGCEIYTGQLNGTEVALLKSGIGKVAAALGATLLLEHCKPDVIINTGSAGGLAPTLKVGDIVVSDEARYHDADVTAFGYEYGQLPGCPAGFKADDKLIAAAEACIAELNLNAVRGLIVSGDAFINGSVGLAKIRHNFPQAIAVEMEATAIAHVCHNFNVPFVVVRAISDVADQQSHLSFDEFLAVAAKQSSLMVESLVQKLAHG
>2xm1_A mol:protein length:716  O-GLCNACASE BT_4395
QNVSLQPPPQQLIVQNKTIDLPAVYQLNGGEEANPHAVKVLKELLSGKQSSKKGMLISIGEKGDKSVRKYSRQIPDHKEGYYLSVNEKEIVLAGNDERGTYYALQTFAQLLKDGKLPEVEIKDYPSVRYRGVVEGFYGTPWSHQARLSQLKFYGKNKMNTYIYGPKDDPYHSAPNWRLPYPDKEAAQLQELVAVANENEVDFVWAIHPGQDIKWNKEDRDLLLAKFEKMYQLGVRSFAVFFDDISGEGTNPQKQAELLNYIDEKFAQVKPDINQLVMCPTEYNKSWSNPNGNYLTTLGDKLNPSIQIMWTGDRVISDITRDGISWINERIKRPAYIWWNFPVSDYVRDHLLLGPVYGNDTTIAKEMSGFVTNPMEHAESSKIAIYSVASYAWNPAKYDTWQTWKDAIRTILPSAAEELECFAMHNSDLGPNGHGYRREESMDIQPAAERFLKAFKEGKNYDKADFETLQYTFERMKESADILLMNTENKPLIVEITPWVHQFKLTAEMGEEVLKMVEGRNESYFLRKYNHVKALQQQMFYIDQTSNQNPYQPGVKTATRVIKPLIDRTFATVVKFFNQKFNAHLDATTDYMPHKMISNVEQIKNLPLQVKANRVLISPANEVVKWAAGNSVEIELDAIYPGENIQINFGKDAPCTWGRLEISTDGKEWKTVDLKQKESRLSAGLQKAPVKFVRFTNVSDEEQQVYLRQFVLTIEKK
>3dll_2 mol:protein length:47  50S ribosomal protein L34
MKRTYQPNNRKRAKTHGFRARMKTKSGRNILARRRAKGRHQLTVSDE
>4cub_B mol:protein length:183  BETA-GALACTOSIDASE
QTEQGANISDQWTGSELPLAFASDSNPSDPVSNVNDKLISYNNQPANRWTNWNRSNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGAPKSYVIEYYVGKTVPTAPKNPSFVGNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAIRIRMVKADNKRGTSITEVQIFAKQV
>1otr_B mol:protein length:76  Ubiquitin
MQIFVKTLTGKTITLEVESSDTIDNVKSKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG
>2oig_A mol:protein length:111  RS21-C6
GPLGSRPFRFSPEPTLEDIRRLHAEFAAERDWEQFHQPRNLLLALVGEVGELAELFQWKSDTEPGPQAWPPKERAALQEELSDVLIYLVALAARCHVDLPQAVISKMDTNR
>5vhr_E mol:protein length:262  26S proteasome regulatory subunit 10B
GNVSYSEIGGLSEQIRELREVIELPLTNPELFQRVGIIPPKGCLLYGPPGTGKTLLARAVASQLDCNFLKVVSSSIVDKYIGESARLIREMFNYARDHQPCIIFMDEIDAIGGRRFSEGTSADREIQRTLMELLNQMDGFDTLHRVKMIMATNRPDTLDPALLRPGRLDRKIHIDLPNEQARLDILKIHAGPITKHGEIDYEAIVKLSDGFNGADLRNVCTEAGMFAIRADHDFVVQEDFMKAVRKVADSKKLESKLDYKPV
>6zke_s mol:protein length:137  NADH:ubiquinone oxidoreductase subunit B7
MGAHLARRYLGDASVEPEPLRMPTFPPDYGFPERKEREMVATQQEMNDAQLVLQQRDYCAHYLIRFLKCKRDSFPNFLACKHEQHDWDYCEHLDYVKRMKEFERERRLLQRKKRREQREADMAKGLGPGEVAPEVAL
>7lmx_C mol:protein length:75  Integrin inhibitor
STKCVVRFVFRGDLATLMLRAVKDHLKKEGPHWNITSTNNGAELVVRGIHESDAKRIAKWVEKRFPGVHTETQCD
>6qn7_L mol:protein length:216  Light chain of bovine anti-RSV B13
QAVLTQPPSVSGSLGQRVSITCSGSSDNIGIFAVGWYQQVPGSGLRTIIYGNTKRPSGVPDRFSGSKSGNTATLTINSLQAEDEADYFCVCGESKSATPVFGGGTTLTVLGQPKSPPSVTLFPPSTEELNGNKATLVCLISDFYPGSVTVVWKADGSTITRNVETTRASKQSNSKYAASSYLSLTSSDWKSKGSYSCEVTHEGSTVTKTVKPSECS
>5b00_A mol:protein length:294  MoeN5
MAHHHHHHVDDDDKAASWSHPQFEKGAENLYFQSMLAAEAANRDHVTRCVAQTGGSPDLVAHTAALRLYLRVPHFLTEWTTDPDRRAAVSRALALDIVSMKLLDDLMDDDTGLDRVELACVCLRLHLRALHELESLARDPKAVTDILEQDAVHLCGGQIRTKRSRATNLREWRAHASTYGSTFLGRYGALAAACGGEGQPADSVREFAEAFAMTITMADDLTDYDRNGERDGNLAHLMRTGAVAGQDVVDLLEELRGRALAAVAAPPGAPGLVPVVHLYTDDVLVRLLPRHLGE
>6iqt_D mol:protein length:166  Cag pathogenicity island protein (Cag10)
GTSSMADIGSGEFKIVKRSDARQIVNSEAVVDSATSKFVSLLFGYSKNSLRDRKDQLMQYCDVSFQTQAMRMFNENIRQFVDKVRAEAIISSNIQREKVKNSPLTRLTFFITIKITPDTMENYEYITKKQVTIYYDFARGNSSQENLIINPFGFKVFDIQITDLQN
>4o26_A mol:protein length:257  Telomerase reverse transcriptase
GSGFLYGGRGMHGFCLNRKRRTAAGPRRLQGQDLVRLVFFEGLPYLNGQERKPKKLPLRYFNMVPVFGRLLQRHRKCRYSSVLHRMCPVVELSRAAQGELSSLIPQHCAPHRVYLFVRECLTAVVPEELWGSDHNRLQFFSRVRGFLKSGKFERISVAELMWKIKVMDCDWLKLRRTAGRFPPSELAYRTRILSQFLTWLLDGFVVGLVRACFYATESVGQKNAIRFYRQEVWSKLQDLAFRRHIAKGEMEELSPAQ
>8d0k_B mol:protein length:374  CST complex subunit STN1
MHHHHHHQPGSSRCEEETPSLLWGLDPVFLAFAKLYIRDILDMKESRQVPGVFLYNGHPIKQVDVLGTVIGVRERDAFYSYGVDDSTGVINCICWKKLNTESVSAAPSAARELSLTSQLKKLQETIEQKTKIEIGDTIRVRGSIRTYREEREIHATTYYKVDDPVWNIQIARMLELPTIYRKVYDQPFHSSALEKEEALSNPGALDLPSLTSLLSEKAKEFLMENRVQSFYQQELEMVESLLSLANQPVIHSASSDQVNFKKDTTSKAIHSIFKNAIQLLQEKGLVFQKDDGFDNLYYVTREDKDLHRKIHRIIQQDCQKPNHMEKGCHFLHILACARLSIRPGLSEAVLQQVLELLEDQSDIVSTMEHYYTAF
>7mus_FD mol:protein length:163  DotD
MNNNKIVIMFIFSALLAGCAGTMKFKKPPINNPSDDATIKLAEAAVSVSDSMLEMAKVEKVITPPSKDNTLTIPNAYNLQARASVDWSGPIEELTARIAKAAHFRFRVLGKSPSVPVLISISTKDESLAEILRDIDYQAGKKASIHVYPNSQVVELRYAKIYS
>2olh_A mol:protein length:361  Chitinase-3-like protein 1
YKLICYYTSWSQYREGDGSCFPDAIDPFLCTHVIYSFANISNNEIDTWEWNDVTLYDTLNTLKNRNPKLKTLLSVGGWNFGPERFSKIASKTQSRRTFIKSVPPFLRTHGFDGLDLAWLYPGRRDKRHLTALVKEMKAEFAREAQAGTERLLLSAAVSAGKIAIDRGYDIAQISRHLDFISLLTYDFHGAWRQTVGHHSPLFRGNSDASSRFSNADYAVSYMLRLGAPANKLVMGIPTFGRSFTLASSKTDVGAPISGPGIPGRFTKEKGILAYYEICDFLHGATTHRFRDQQVPYATKGNQWVAYDDQESVKNKARYLKNRQLAGAMVWALDLDDFRGTFCGQNLTFPLTSAVKDVLARV
>6ue6_D mol:protein length:141  Histone-lysine N-methyltransferase NSD2
GGRDKDHLLKYNVGDLVWSKVSGYPWWPCMVSADPLLHSYTKLKGQKKSARQYHVQFFGDAPERAWIFEKSLVAFEGEGQFEKLCQESAKQAPTKAEKIKLLKPISGKLRAQWEMGIVQAEEAASMSVEERKAKFTFLYVG
>2nvy_C mol:protein length:318  DNA-directed RNA polymerase II 45 kDa polypeptide
MSEEGPQVKIREASKDNVDFILSNVDLAMANSLRRVMIAEIPTLAIDSVEVETNTTVLADEFIAHRLGLIPLQSMDIEQLEYSRDCFCEDHCDKCSVVLTLQAFGESESTTNVYSKDLVIVSNLMGRNIGHPIIQDKEGNGVLICKLRKGQELKLTCVAKKGIAKEHAKWGPAAAIEFEYDPWNKLKHTDYWYEQDSAKEWPQSKNCEYEDPPNEGDPFDYKAQADTFYMNVESVGSIPVDQVVVRGIDTLQKKVASILLALTQMDQDKVNFASGDNNTASNMLGSNEDVMMTGAEQDPYSNASQMGNTGSGGYDNAW
>2vd0_D mol:protein length:199  GLUTATHIONE-REQUIRING PROSTAGLANDIN D SYNTHASE
MPNYKLTYFNMRGRAEIIRYIFAYLDIQYEDHRIEQADWPEIKSTLPFGKIPILEVDGLTLHQSLAIARYLTKNTDLAGNTEMEQCHVDAIVDTLDDFMSCFPWAEKKQDVKEQMFNELLTYNAPHLMQDLDTYLGGREWLIGNSVTWADFYWEICSTTLLVFKPDLLDNHPRLVTLRKKVQAIPAVANWIKRRPQTKL
>1yf1_B mol:protein length:186  Alkyl hydroperoxide reductase subunit C
SLINTKIKPFKNQAFKNGEFIEVTEKDTEGRWSVFFFYPADFTFVCPTELGDVADHYEELQKLGVDVYSVSTDTHFVHKAWHSSSETIAKIKYAMIGDPTGALTRNFDNMREDEGLADRATFVVDPQGIIQAIEVTAEGIGRDASDLLRKIKAAQYVAAHPGEVCPAKWKEGEATLAPSLDLVGKI
>4g4s_B mol:protein length:250  Proteasome component Y7
MTDRYSFSLTTFSPSGKLGQIDYALTAVKQGVTSLGIKATNGVVIATEKKSSSPLAMSETLSKVSLLTPDIGAVYSGMGPDYRVLVDKSRKVAHTSYKRIYGEYPPTKLLVSEVAKIMQEATQSGGVRPFGVSLLIAGHDEFNGFSLYQVDPSGSYFPWKATAIGKGSVAAKTFLEKRWNDELELEDAIHIALLTLKESVEGEFNGDTIELAIIGDENPDLLGYTGIPTDKGPRFRKLTSQEINDRLEAL
>6mjz_C mol:protein length:495  Fusion glycoprotein F0
QIDITKLQHVGVLVNSPKGMKISQNFETRYLILSLIPKIEDSNSCGDQQIKQYKRLLDRLIIPLYDGLKLQKDVIVTNQESNENTDPRTERFFGGVIGTIALGVATSAQITAAVALVEAKQAKSDIEKLKEAIRDTNKAVQSVCSSVGNCIVAIKSVQDYVNKEIVPSIARLGCEAAGLQLGIALTQHYSELTNCFGDNIGSLQEKGIKLQCIASLYRTNITEIFTTSTVDKYDIYDLLFTESIKVRVIDVDLNDYSITLQVRLPLLTRLLNTQIYKVDSISYNIQNREWYIPLPSHIMTKGAFLGGADVKECIEAFSSYICPSDPGFVLNHEMESCLSGNISQCPRTTVTSDIVPRYAFVNGGVVANCITTTCTCNGIGNRINQPPDQGVKIITHKECNTIGINGMLFNTNKEGTLAFYTPDDITLNNSVALDPIDISIELNKVKSDLEESKEWYRRSNQKLSAIEDKIEEILSKIYHIENEIARIKKLIGEAP
>5vbr_A mol:protein length:113  Bromodomain testis-specific protein
GAASTNQLQYLQKVVLKDLWKHSFSWPFQRPVDAVKLQLPDYYTIIKNPMDLNTIKKRLENKYYAKASECIEDFNTMFSNCYLYNKPGDDIVLMAQALEKLFMQKLSQMPQEE
>1wuu_B mol:protein length:399  Galactokinase
MAHHHHHHAALRQPQVAELLAEARRAFREEFGAEPELAVSAPGRVNLIGEHTDYNQGLVLPMALELMTVLVGSPRKDGLVSLLTTSEGADEPQRLQFPLPTAQRSLEPGTPRWANYVKGVIQYYPAAPLPGFSAVVVSSVPLGGGLSSSASLEVATYTFLQQLCPDSGTIAARAQVCQQAEHSFAGMPCGIMDQFISLMGQKGHALLIDCRSLETSLVPLSDPKLAVLITNSNVRHSLASSEYPVRRRQCEEVARALGKESLREVQLEELEAARDLVSKEGFRRARHVVGEIRRTAQAAAALRRGDYRAFGRLMVESHRSLRDDYEVSCPELDQLVEAALAVPGVYGSRMTGGGFGGCTVTLLEASAAPHAMRHIQEHYGGTATFYLSQAADGAKVLCL
>1wp9_D mol:protein length:494  ATP-dependent RNA helicase, putative
MVLRRDLIQPRIYQEVIYAKCKETNCLIVLPTGLGKTLIAMMIAEYRLTKYGGKVLMLAPTKPLVLQHAESFRRLFNLPPEKIVALTGEKSPEERSKAWARAKVIVATPQTIENDLLAGRISLEDVSLIVFDEAHRAVGNYAYVFIAREYKRQAKNPLVIGLTASPGSTPEKIMEVINNLGIEHIEYRSENSPDVRPYVKGIRFEWVRVDLPEIYKEVRKLLREMLRDALKPLAETGLLESSSPDIPKKEVLRAGQIINEEMAKGNHDLRGLLLYHAMALKLHHAIELLETQGLSALRAYIKKLYEEAKAGSTKASKEIFSDKRMKKAISLLVQAKEIGLDHPKMDKLKEIIREQLQRKQNSKIIVFTNYRETAKKIVNELVKDGIKAKRFVGQASKENDRGLSQREQKLILDEFARGEFNVLVATSVGEEGLDVPEVDLVVFYEPVPSAIRSIQRRGRTGRHMPGRVIILMAKGTRDEAYYWSSRQKEKIMQE
>6mxv_B mol:protein length:252  Rhodanese-like family protein
MKIMQHSSGFLKLVDDAKSRIQECSVDDIQKMNETQTLDGLLIDTREESEVANGYIPNAIHLSKGIIESAIESAVPNKNQKMYFYCGGGFRSALVADKLREMGYKNVISVDGGWRAWNAKGYPTVSPNQFRPNEFLKLVNNAKTQIKECSTTELYNKINSQELDGIVFDVREDSEFNRFHIQGATHLSKGQIEVKIENLVPNKQQKIYLYCGSGFRSALAAESLQHMGYTNVVSIAGGIKDWLANNYPVSQN
>6owg_B9 mol:protein length:113  Microcompartments protein
MAVAVGMIETLGFPAVVEAADAMVKAARVTLVGYEKIGTGRVTVIVRGDVSEVQASVSAGTESVKRVNGGQVLSTHIIARPHENLEYVLPIRYTEEVEQFREGVGTPRNITRQ
>6x6s_IC mol:protein length:481  Type IV secretion system apparatus protein Cag3
MFRKLATAVSLIGLLTSNTLYAKEISEADKVIKATKETKETKKEAKRLKKEAKQRQQIPDHKKPQYVSVDDTKTQALFDIYDTLNVNDKSFGDWFGNSALKDKTYLYAMDLLDYNNYLSIENPIIKTRAMGTYADLIIITGSLEQVNGYYNILKALNKRNAKFVLKINENMPYAQATFLRVPKRSDPNAHTLDKGASIDENKLFEQQKKMYFNYANDVICRPDDEVCSPLRDEMVAMPTSDSVTQKPNIIAPYSLYRLKETNNANEAQPSPYATATAPENSKEKLIEELIANSQLVANEEEREKKLLAEKEKQEAELAKYKLKDLENQKKLKALEAELKKKNAKKPRVVEVPVSPQTSNSDETMRVVKEKENYNGLLVDKETTIKRSYEGTLISENSYSKKTPLNPNDLRSLEEEIKSYYIKSNGLCYTNGINLYVKIKNDPYKEGMLCGYESVQNLLSPLKDKLKYDKQKLQKALLKDSK
>6th6_Al mol:protein length:135  30S ribosomal protein S9
MRVIQTAGKRKTAVARATIREGKGRVRINHKPVEIIEPEIARFTIMEPLILAGEEIVSRVDIDVKVEGGGFMGQAEAARVAIARALVEWTNDMNLKEKFMKYDRTMLVGDSRRTEPHKPNRSTKGPRAKRQKSYR
>6lvv_G mol:protein length:775  N,N-dimethylformamidase large subunit
MKDIAIRGYCDRPSVATGETIRFYVSANETRGTFDAELVRLIHGDSNPAGPGYKEEAIKSDLEGQYPARFQRTQFGSYVEVADPDAGLQPDGAFSVHLFLWSTTPSRGRQGIASRWNDERQSGWNLAIEDGRVVFTIGDGSGATSSVVSDRPLFQQIWYSITGVYDPEKKQLRLYQKSVVNRTNSRFGLVVPLDSDCAVSADATVKAADSETSLLIAGLGEAAAQDGRTWCIAHYNGKVDAPKIYGCALGQDDAEKLSRGEIVRPISRLAHWDFSAGIGLNGIPTDHVVDASGYGHHGRCMNQPSRGSTGWNWDGHEENFIHCPEQYGALWFHEDCLDDCRWEKDFEFTVPEGLKSDFYAVKIRYEDTEDYIPFFVLPPRGTATAPILVIASTLSYLAYANEQIMHKADIGQAVAGHTPVLNENDVELHKNLSYYGLSTYDGHIDGRGVQYTSWRRPIMNLRPKHRQGFGSIWELPADLHLIDWLNHNGFEYDVATEHDLNDQGAELLRRYKVVLTGSHPEYQTWANADAWEDYLADGGRGMYLAANGMYWIVEVHPEKPWVMEVRKELGVTAWEAPPGEYHYSTNGRRGGRFRGRARATQKIWGTGMSSFGFDHSGYFVQMPDSQDERVAWIMEGIDPEERIGDGGLVGGGAGGYELDRYDLALGTPPNTLLLASSVEHSVVYTVIPDDKAFPHPGMNGGEHPFVRADITYFSTANGGGMFATSSISWLGSLSWNDYDNNVSKMTKNVLNQFIKDEPAPRVKLAAALEHHHHHH
>1esb_A mol:protein length:240  PORCINE PANCREATIC ELASTASE
VVGGTEAQRNSWPSQISLQYRSGSSWAHTCGGTLIRQNWVMTAAHCVDRELTFRVVVGEHNLNQNNGTEQYVGVQKIVVHPYWNTDDVAAGYDIALLRLAQSVTLNSYVQLGVLPRAGTILANNSPCYITGWGLTRTNGQLAQTLQQAYLPTVDYAICSSSSYWGSTVKNSMVCAGGDGVRSGCQGDSGGPLHCLVNGQYAVHGVTSFVSRLGCNVTRKPTVFTRVSAYISWINNVIASN
>3wry_B mol:protein length:431  Tm-1 protein
MATAQSNSPRVFCIGTADTKFDELRFLSEHVRSSLNSFSNKSSFKVGVTVVDVSTSWKETNSCADFDFVPSKDVLSCHTLGEETMGTFADTRGLAIAIMSKALETFLSIANDEQNLAGVIGLGGSGGTSLLSSAFRSLPIGIPKVIISTVASGQTESYIGTSDLVLFPSVVDICGINNVSKVVLSNAGAAFAGMVIGRLESSKEHSITNGKFTVGVTMFGVTTPCVNAVKERLVKEGYETLVFHATGVGGRAMEDLVRGGFIQGVLDITTTEVADYVVGGVMACDSSRFDAILEKKIPLVLSVGALDMVNFGPKTTIPPEFQQRKIHEHNEQVSLMRTTVGENKKFAAFIAEKLNKASSSVCVCLPEKGVSALDAPGKDFYDPEATSCLTRELQMLLENNERCQVKVLPYHINDAEFANALVDSFLEISPK
>4i55_F mol:protein length:384  Tubulin tyrosine ligase, TTL
MYTFVVRDENSSVYAEVSRLLLATGQWKRLRKDNPRFNLMLGERNRLPFGRLGHEPGLVQLVNYYRGADKLCRKASLVKLIKTSPELSESCTWFPESYVIYPTNLKTPVAPAQNGIRHLINNTRTDEREVFLAAYNRRREGREGNVWIAKSSAGAKGEGILISSEASELLDFIDEQGQVHVIQKYLEKPLLLEPGHRKFDIRSWVLVDHLYNIYLYREGVLRTSSEPYNSANFQDKTCHLTNHCIQKEYSKNYGRYEEGNEMFFEEFNQYLMDALNTTLENSILLQIKHIIRSCLMCIEPAISTKHLHYQSFQLFGFDFMVDEELKVWLIEVNGAPACAQKLYAELCQGIVDVAISSVFPLADTGQKTSQPTSIFIKLHHHHHH
>3dal_B mol:protein length:196  PR domain zinc finger protein 1
SSGLVPRGSKKMDMEDADMTLWTEAEFEEKCTYIVNDHPWDSGADGGTSVQAEASLPRNLLFKYATNSEEVIGVMSKEYIPKGTRFGPLIGEIYTNDTVPKNANRKYFWRIYSRGELHHFIDGFNEEKSNWMRYVNPAHSPREQNLAACQNGMNIYFYTIKPIPANQELLVWYCRDFAERLHYPYPGELTMMNLTQ
>6pjj_A mol:protein length:351  Serine/threonine-protein kinase PRP4 homolog
SMDFKENPNLRDNWTDAEGYYRVNIGEVLDKRYNVYGYTGQGVFSNVVRARDNARANQEVAVKIIRNNELMQKTGLKELEFLKKLNDADPDDKFHCLRLLRHFYHKQHLCLVFEPLSMNLREVLKKYGKDVGLHIKAVRSYSQQLFLALKLLKRCNILHADIKPDNILVNESKTILKLCDFGSASHVADNDITPYLFSRFYRAPEIIIGKSYDYGIDMWSVGCTLYELYTGKILFPGKTNNHMLKLAMDLKGKMPNKMIRKGVFKDQHFDQNLNFMYIEVDKVTEREKVTVMSTINPTKDLLADLIGCQRLPEDQRKKVHQLKDLLDQILMLDPAKRISINQALQHAFIQE
>7ajb_AO mol:protein length:75  ATP synthase F(0) complex subunit C2, mitochondrial
DIDTAAKFIGAGAATVGVAGSGAGIGTVFGSLIIGYARNPSLKQQLFSYAILGFALSEAMGLFCLMVAFLILFAM
>7a4g_FI mol:protein length:197  Antitermination protein N,6,7-dimethyl-8-ribityllumazine synthase,6,7-dimethyl-8-ribityllumazine synthase
MGNAKTRRRERRAEKQAQWKAANAGAGAGAMATPHFDYIASEVSKGLANLSLELRKPITFGVITADTLEQAIERAGTKHGNKGWEAALSAIEMANLFKSLRGTGHHHHHHGSSMEIYEGKLTAEGLRFGIVASRFNHALVDRLVEGAIDCIVRHGGREEDITLVRVPGSWEIPVAAGELARKEDIDAVIAIGVLIRG
>6r8h_E mol:protein length:250  Triosephosphate isomerase
ASNRKFFVGGNWKMNGSKESNQKLLKTLSDAKPDANTEILVAVPFVYLKDVREHLDKRFHVAAQNCYKVASGAFTGEISPAMIRDCGCEWVILGHSERRHIFGESDELIGEKVNHALTCGLKVVPCIGEKLDEREAGKTEQVCFRQLDAIKKGIPKAEDWSRVVIAYEPVWAIGTGKTASPEQAQEVHHAVRQWLEKNVSQAVASSLRITYGGSVTAANCKELAKKPDVDGFLVGGASLKPEFVDICNAN
>7of2_U mol:protein length:153  39S ribosomal protein L23, mitochondrial
MARNVVYPLYRLGGPQLRVFRTNFFIQLVRPGVAQPEDTVQFRIPMEMTRVDLRNYLEGIYNVPVAAVRTRVQHGSNKRRDHRNVRIKKPDYKVAYVQLAHGQTFTFPDLFPEKDESPEGSAADDLYSMLEEERQQRQSSDPRRGGVPSWFGL
>1xa6_A mol:protein length:466  Beta2-chimaerin
MRLLSSLSGSSVSSDAEEYQPPIWKSYLYQLQQEAPRPKRIICPREVENRPKYYGREFHGIISREQADELLGGVEGAYILRESQRQPGCYTLALRFGNQTLNYRLFHDGKHFVGEKRFESIHDLVTDGLITLYIETKAAEYISKMTTNPIYEHIGYATLLREKVSRRLSRSKNEPRKTNVTHEEHTAVEKISSLVRRAALTHNDNHFNYEKTHNFKVHTFRGPHWCEYCANFMWGLIAQGVRCSDCGLNVHKQCSKHVPNDCQPDLKRIKKVYCCDLTTLVKAHNTQRPMVVDICIREIEARGLKSEGLYRVSGFTEHIEDVKMAFDRDGEKADISANVYPDINIITGALKLYFRDLPIPVITYDTYSKFIDAAKISNADERLEAVHEVLMLLPPAHYETLRYLMIHLKKVTMNEKDNFMNAENLGIVFGPTLMRPPEDSTLTTLHDMRYQKLIVQILIENEDVLF
>6y9i_BBB mol:protein length:292  Major Capsid Protein VP1
GSHMGGVEVLNIITGPDSTTEIELYLEPRMGINSPTGDKKEWYGYSEVIHHADGYDNNLLSIQMPQYSCARVQLPMLNTDMTSDTLMMWEAVSCKTEIVGIGSLISVHLLEAKMAAKEGGDGPSQPIEGMNYHMFAVGGEPLDLQGIESNALTKYASAIPPKTIHPNDIAKLAEEEKPQLQGLVPKAKARLDKDGFYPIEEWSPDPSRNENSRYFGSFVGGLNTPPNLQFTNAVTTVLLDENGVGPLCKGDGLFVSAADICGVMVKADNEAIRYRGLPRYFKVTLRKRAVKN
>5hrm_B mol:protein length:504  Haloalkylphosphorus hydrolase
QVVIGPGDRPETGLQGQTTIEDVVSGRSKLPYHAGVRLVGRTDIWNRGGNLQLSWVDQCAYVSTFKQAGPITANSRSALFLREPAGVAVIDVRDPRAPKPVRLLRDRGSIDAVETMHAIAAPGRKVLVAGAYSGGIAGRGEEDAAWLSIYDASNCLNPKLQSEFKWPANIHMVTISPNGRRVYGTEVVPGLGSGKGGLHVLDISDMKRPRYLGRFGVTRPNGLTAGFTPHEVSISHDERRIYAAVLASETGDVPVGASILASDGDVPVENGSVYILDNSDIVDGRSQPKMRLVGEAKQGGFHSVVPASINGVPHLVGAAELGACPGTWPRIINIADEKNPKIVGEFKLQMNIKENCDAIRFTPRKEDPYASFIPIPDITARLGAVGSHFNDVDDARNTRLGLFPFFAGGVRIVDLRDPTKPVEVGYYKPGANPDTPLSGNGLNWTGLNDQVTDGCMSHVRYVPESGHIWFACVTTGFHVVELNPDLRARLGFPTVKLEHHHHHH
>1s5c_F mol:protein length:103  cholera enterotoxin B-subunit
TPQNITDLCAEYHNTQIHTLNDKIFSYTESLAGKREMAIITFKNGATFQVEVPGSQHIDSQKKAIERMKDTLRIAYLTEAKVEKLCVWNNKTPHAIAAISMAN
>3nvv_K mol:protein length:334  Xanthine dehydrogenase/oxidase
LFNPEEFMPLDPTQEPIFPPELLRLKDVPPKQLRFEGERVTWIQASTLKELLDLKAQHPEAKLVVGNTEIGIEMKFKNQLFPMIICPAWIPELNAVEHGPEGISFGAACALSSVEKTLLEAVAKLPTQKTEVFRGVLEQLRWFAGKQVKSVASLGGNIITASPISDLNPVFMASGTKLTIVSRGTRRTVPMDHTFFPSYRKTLLGPEEILLSIEIPYSREDEFFSAFKQASRREDDIAKVTCGMRVLFQPGSMQVKELALCYGGMADRTISALKTTQKQLSKFWNEKLLQDVCAGLAEELSLSPDAPGGMIEFRRTLTLSFFFKFYLTVLKKLG
>6lum_G mol:protein length:138  Succinate dehydrogenase subunit C
MSTQTEVPAPQPKKTRRRTLYRGDPGMWSWVLHRITGATIFFFLFVHVLDTALVRVSPQAYNEVIETYKTPIVGLMEIGLVAAVLFHALNGIRVILIDFWAKGPRYQRQMLAVIAGLFLVIFIAAVGVIGMHMVERFL
>1vav_B mol:protein length:222  Alginate lyase PA1167
PDLSTWNLTIPQGRPAITISTSQLQRDYRSDYFQRTADGIRFWVPVNGSHTRNSEFPRSELRETLSSGRPYNWRYARADNWLEATLRIEAVPSTRRMIIGQIHSDGSNSGQAAPLVKLLYQLRLDQGRVQALVRERPDDGGTRAYTLMDGIPLGQPFSYRIGVSRSGLLSVSVNGSALEQQLDPQWAYQGLYFKAGLYLQDNRGPSSEGGRATFSELRVSHQ
>3q6e_A mol:protein length:21  Insulin A chain
GIVEQCCTSICSLYQLENYCN
>4s17_F mol:protein length:481  Glutamine synthetase
SNAMTALETKADAEALINKEGIEYVSVRFTDLIGVQQHFTVPASEFLKDAFTDGMPFDGSSVEGFQAINESDMKLVPDVSTAFIDPFRKHKTLDVAFSIVDPLTDEPYSRDPRQVAGKAEAYLKSTGIADTASFAPEAEFFIFDKVRFENSMQRSFYEVDSIEAPWNSGIDTEDDGTPNIAFKNRVKKGYFPVPPIDHTQDLRDDMVANLQKVGLILERSHHEVAGAGQQEINYRFNSLQHAGDDLMKYKYVVHETAALAGKAATFMPKPIAGDNGTGMHCHQSLWKDGKPLFYDEKNYGGLSDLARWYIGGLIKHSSSVLAFTNPSLNSYHRLVPGFEAPVNLVYSARNRSAAIRIPLAGTSPAAKRIEFRAPDPSCNPFLAFSAQLMAGLDGILNHIEPPAPVDKDLYELPPEEHAGIKQVPSSLAEAMDALEEDHDFLTAGDVFTDDLIDTWISIKRGEIDQARLAPTPLEYELYFHI
>4dv4_D mol:protein length:209  ribosomal protein S4
MGRYIGPVCRLCRREGVKLYLKGERCYSPKCAMERRPYPPGQHGQKRARRPSDYAVRLREKQKLRRIYGISERQFRNLFEEASKKKGVTGSVFLGLLESRLDNVVYRLGFAVSRRQARQLVRHGHITVNGRRVDLPSYRVRPGDEIAVAEKSRNLELIRQNLEAMKGRKVGPWLSLDVEGMKGKFLRLPDREDLALPVNEQLVIEFYSR
>3zv2_A mol:protein length:320  Tyrosine-protein phosphatase non-receptor type 1
MEMEKEFEQIDKSGSWAAIYQDIRHEASDFPCRVAKLPKNKNRNRYRDVSPFDHSRIKLHQEDNDYINASLIKMEEAQRSYILTQGPLPNTCGHFWEMVWEQKSRGVVMLNRVMEKGSLKCAQYWPQKEEKEMIFEDTNLKLTLISEDIKSYYTVRQLELENLTTQETREILHFHYTTWPDFGVPESPASFLNFLFKVRESGSLSPEHGPVVVHAAAGIGRSGTFCLADTCLLLMDKRKDPSSVDIKKVLLEMRKFRMGLIQTADQLRFSYLAVIEGAKFIMGDSSVQDQWKELSHEDLEPPPEHIPPPPRPPKRILEPH
>4lyc_A mol:protein length:129  Lysozyme C
KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQAWIRGCRL
>6gaw_Bp mol:protein length:112  mL53
MAAALARLGLRAVKQVRVQFCPFEKNVESTRTFLQAVSSEKVRCTNLNCSVIADVRHDGSEPCVDVLFGDGHRLIMRGAHLTAQEMLTAFASHIQARGAAASGDKPSASTGR
>3bvb_B mol:protein length:99  Protease (Retropepsin)
PQITLWKRPLVTIKIGGQLKEALLNTGADDTVIEEMSLPGRWKPKMIGGIGGFIKVRQYDQIIIEIAGHKAIGTVLVGPTPVNIIGRNLLTQIGATLNF
>5djb_E mol:protein length:99  Microcompartments protein
MADALGMIEVRGFVGMVEAADAMVKAAKVELIGYEKTGGGYVTAVVRGDVAAVKAATEAGQRAAERVGEVVAVHVIPRPHVNVDAALPLGRTPGMDKSA
>6jpa_F mol:protein length:1046  Voltage-dependent calcium channel subunit alpha-2/delta-1
FPSAVTIKSWVDKMQEDLVTLAKTASGVHQLVDIYEKYQDLYTVEPNNARQLVEIAARDIEKLLSNRSKALVRLALEAEKVQAAHQWREDFASNEVVYYNAKDDLDPEKNDSEPGSQRIKPVFIDDANFRRQVSYQHAAVHIPTDIYEGSTIVLNELNWTSALDDVFKKNREEDPSLLWQVFGSATGLARYYPASPWVDNSRTPNKIDLYDVRRRPWYIQGAASPKDMLILVDVSGSVSGLTLKLIRTSVSEMLETLSDDDFVNVASFNSNAQDVSCFQHLVQANVRNKKVLKDAVNNITAKGITDYKKGFSFAFEQLLNYNVSRANCNKIIMLFTDGGEERAQEIFAKYNKDKKVRVFTFSVGQHNYDRGPIQWMACENKGYYYEIPSIGAIRINTQEYLDVLGRPMVLAGDKAKQVQWTNVYLDALELGLVITGTLPVFNITGQFENKTNLKNQLILGVMGVDVSLEDIKRLTPRFTLCPNGYYFAIDPNGYVLLHPNLQPKPIGVGIPTINLRKRRPNVQNPKSQEPVTLDFLDAELENDIKVEIRNKMIDGESGEKTFRTLVKSQDERYIDKGNRTYTWTPVNGTDYSLALVLPTYSFYYIKAKIEETITQARYSETLKPDNFEESGYTFLAPRDYCSDLKPSDNNTEFLLNFNEFIDRKTPNNPSCNTDLINRVLLDAGFTNELVQNYWSKQKNIKGVKARFVVTDGGITRVYPKEAGENWQENPETYEDSFYKRSLDNDNYVFTAPYFNKSGPGAYESGIMVSKAVEIYIQGKLLKPAVVGIKIDVNSWIENFTKTSIRDPCAGPVCDCKRNSDVMDCVILDDGGFLLMANHDDYTNQIGRFFGEIDPSLMRHLVNISVYAFNKSYDYQSVCEPGAAPKQGAGHRSAYVPSIADILQIGWWATAAAWSILQQFLLSLTFPRLLEAADMEDDDFTASMSKQSCITEQTQYFFDNDSKSFSGVLDCGNCSRIFHVEKLMNTNLIFIMVESKGTCPCDTRLLIQAEQTSDGPDPCDMVKQPRYRKGPDVCFDNNVLEDYTDCG
>2zoq_A mol:protein length:382  Mitogen-activated protein kinase 3
LGSMAAAAAQGGGGGEPRRTEGVGPGVPGEVEMVKGQPFDVGPRYTQLQYIGEGAYGMVSSAYDHVRKTRVAIKKISPFEHQTYCQRTLREIQILLRFRHENVIGIRDILRASTLEAMRDVYIVQDLMETDLYKLLKSQQLSNDHICYFLYQILRGLKYIHSANVLHRDLKPSNLLINTTCDLKICDFGLARIADPEHDHTGFLTEYVATRWYRAPEIMLNSKGYTKSIDIWSVGCILAEMLSNRPIFPGKHYLDQLNHILGILGSPSQEDLNCIINMKARNYLQSLPSKTKVAWAKLFPKSDSKALDLLDRMLTFNPNKRITVEEALAHPYLEQYYDPTDEPVAEEPFTFAMELDDLPKERLKELIFQETARFQPGVLEAP
>6pee_K mol:protein length:562  Protein InvG
MKTHILLARVLACAALVLVTPGYSSEKIPVTGSGFVAKDDSLRTFFDAMALQLKEPVIVSKMAARKKITGNFEFHDPNALLEKLSLQLGLIWYFDGQAIYIYDASEMRNAVVSLRNVSLNEFNNFLKRSGLYNKNYPLRGDNRKGTFYVSGPPVYVDMVVNAATMMDKQNDGIELGRQKIGVMRLNNTFVGDRTYNLRDQKMVIPGIATAIERLLQGEEQPLGNIVSSEPPAMPAFSANGEKGKAANYAGGMSLQEALKQNAAAGNIKIVAYPDTNSLLVKGTAEQVHFIEMLVKALDVAKRHVELSLWIVDLNKSDLERLGTSWSGSITIGDKLGVSLNQSSISTLDGSRFIAAVNALEEKKQATVVSRPVLLTQENVPAIFDNNRTFYTKLIGERNVALEHVTYGTMIRVLPRFSADGQIEMSLDIEDGNDKTPQSDTTTSVDALPEVGRTLISTIARVPHGKSLLVGGYTRDANTDTVQSIPFLGKLPLIGSLFRYSSKNKSNVVRVFMIEPKEIVDPLTPDASESVNNILKQSGAWSGDDKLQKWVRVYLDRGQEAIK
>6zg6_C mol:protein length:1273  Protein transport protein SEC31
MVKLAEFSRTATFAWSHDKIPLLVSGTVSGTVDANFSTDSSLELWSLLAADSEKPIASLQVDSKFNDLDWSHNNKIIAGALDNGSLELYSTNEANNAINSMARFSNHSSSVKTVKFNAKQDNVLASGGNNGEIFIWDMNKCTESPSNYTPLTPGQSMSSVDEVISLAWNQSLAHVFASAGSSNFASIWDLKAKKEVIHLSYTSPNSGIKQQLSVVEWHPKNSTRVATATGSDNDPSILIWDLRNANTPLQTLNQGHQKGILSLDWCHQDEHLLLSSGRDNTVLLWNPESAEQLSQFPARGNWCFKTKFAPEAPDLFACASFDNKIEVQTLQNLTNTLDEQETETKQQESETDFWNNVSREESKEKPSVFHLQAPTWYGEPSPAAHWAFGGKLVQITPDGKGVSITNPKISGLESNTTLSEALKTKDFKPLINQRLVKVIDDVNEEDWNLLEKLSMDGTEEFLKEALAFDNDESDAQDDANNEKEDDGEEFFQQIETNFQPEGDFSLSGNIEQTISKNLVSGNIKSAVKNSLENDLLMEAMVIALDSNNERLKESVKNAYFAKYGSKSSLSRILYSISKREVDDLVENLDVSQWKFISKAIQNLYPNDIAQRNEMLIKLGDRLKENGHRQDSLTLYLAAGSLDKVASIWLSEFPDLEDKLKKDNKTIYEAHSECLTEFIERFTVFSNFINGSSTINNEQLIAKFLEFINLTTSTGNFELATEFLNSLPSDNEEVKTEKARVLIASGKSLPAQNPATATTSKAKYTNAKTNKNVPVLPTPGMPSTTSIPSMQAPFYGMTPGASANALPPKPYVPATTTSAPVHTEGKYAPPSQPSMASPFVNKTNSSTRLNSFAPPPNPYATATVPATNVSTTSIPQNTFAPIQPGMPIMGDYNAQSSSIPSQPPINAVSGQTPHLNRKANDGWNDLPLKVKEKPSRAKAVSVAPPNILSTPTPLNGIPANAASTMPPPPLSRAPSSVSMVSPPPLHKNSRVPSLVATSESPRASISNPYAPPQSSQQFPIGTISTANQTSNTAQVASSNPYAPPPQQRVATPLSGGVPPAPLPKASNPYAPTATTQPNGSSYPPTGPYTNNHTMTSPPPVFNKPPTGPPPISMKKRSNKLASIEQNPSQGATYPPTLSSSASPLQPSQPPTLASQVNTSAENVSHEIPADQQPIVDFLKEELARVTPLTPKEYSKQLKDCDKRLKILFYHLEKQDLLTQPTIDCLHDLVALMKEKKYKEAMVIHANIATNHAQEGGNWLTGVKRLIGIAEATLN
>6v00_F mol:protein length:355  MCherry fluorescent protein,Potassium voltage-gated channel subfamily E member 3
GGMVSKGEEDNMAIIKEFMRFKVHMEGSVNGHEFEIEGEGEGRPYEGTQTAKLKVTKGGPLPFAWDILSPQFMYGSKAYVKHPADIPDYLKLSFPEGFNWERVMNFEDGGVVTVTQDSSLQDGEFIYKVKLRGTNFPSDGPVMQCRTMGWEASTERMYPEDGALKGEIKQRLKLKDGGHYDAEVKTTYKAKKPVQLPGAYNVDIKLDILSHNEDYTIVEQYERAEGRHSTGGMDELYKGSGENLYFQSSRATMETTNGTETWYESLHAVLKALNATLHSNLLCRPGPGLGPDNQTEERRASLPGRDDNSYMYILFVMFLFAVTVGSLILGYTRSRKVDKRSDPYHVYIKNRVSMI
>5a15_L mol:protein length:120  BTB/POZ DOMAIN-CONTAINING PROTEIN KCTD16
SMGSAVPNSFPEVVELNVGGQVYFTRHSTLISIPHSLLWKMFSPKRDTANDLAKDSKGRFFIDRDGFLFRYILDYLRDRQVVLPDHFPEKGRLKREAEYFQLPDLVKLLTPDEIKQSPDE
>4k6a_B mol:protein length:279  Triosephosphate isomerase
MHHHHHHSSGVDLGTENLYFQSNAMRHPLVMGNWKLNGSRHMVHELVSNLRKELAGVAGCAVAIAPPEMYIDMAKREAEGSHIMLGAQNVDLNLSGAFTGETSAAMLKDIGAQYIIIGHSERRTYHKESDELIAKKFAVLKEQGLTPVLCIGETEAENEAGKTEEVCARQIDAVLKTQGAAAFEGAVIAYEPVWAIGTGKSATPAQAQAVHKFIRDHIAKVDANIAEQVIIQYGGSVNASNAAELFAQPDIDGALVGGASLKADAFAVIVKAAEAAKQA
>4yzv_QL mol:protein length:132  30S ribosomal protein S12
MPTINQLVRKGREKVRKKSKVPALKGAPFRRGVCTVVRTVTPKKPNSALRKVAKVRLTSGYEVTAYIPGEGHNLQEHSVVLIRGGRVKDLPGVRYHIVRGVYDAAGVKDRKKSRSKYGTKKPKEAAKTAAKK
>5iia_D mol:protein length:129  Vitelline envelope sperm lysin receptor
AQTNAAADWDVYCSQDESIPAKFISRLVTSKDQALEKTEINCSNGLVPITQEFGINMMLIQYTRNELLDSPGMCVFWGPYSVPKNDTVVLYTVTARLKWSEGPPTNLSIQCYMPKSPVAPKLEHHHHHH
>7br8_y mol:protein length:176  Small capsomere-interacting protein
MARRLPKPTLQGRLEADFPDSPLLPKFQELNQNNLPNDVFREAQRSYLVFLTSQFCYEEYVQRTFGVPRRQRAIDKRQRASVAGAGAHAHLGGSSATPVQQAQAAASAGTGALASSAPSTAVAQSATPSVSSSISSLRAATSGATAAASAAAAVDTGSGGGGQPHDTAPRGARKKQ
>1aql_A mol:protein length:532  BILE-SALT ACTIVATED LIPASE
AKLGSVYTEGGFVEGVNKKLSLFGDSIDIFKGIPFAAAPKALEKPERHPGWQGTLKAKSFKKRCLQATLTQDSTYGNEDCLYLNIWVPQGRKEVSHDLPVMIWIYGGAFLMGASQGANFLSNYLYDGEEIATRGNVIVVTFNYRVGPLGFLSTGDSNLPGNYGLWDQHMAIAWVKRNIEAFGGDPDNITLFGESAGGASVSLQTLSPYNKGLIKRAISQSGVGLCPWAIQQDPLFWAKRIAEKVGCPVDDTSKMAGCLKITDPRALTLAYKLPLGSTEYPKLHYLSFVPVIDGDFIPDDPVNLYANAADVDYIAGTNDMDGHLFVGMDVPAINSNKQDVTEEDFYKLVSGLTVTKGLRGANATYEVYTEPWAQDSSQETRKKTMVDLETDILFLIPTKIAVAQHKSHAKSANTYTYLFSQPSRMPIYPKWMGADHADDLQYVFGKPFATPLGYRAQDRTVSKAMIAYWTNFARTGDPNTGHSTVPANWDPYTLEDDNYLEINKQMDSNSMKLHLRTNYLQFWTQTYQALPTV
>2acl_C mol:protein length:238  Retinoic acid receptor RXR-alpha
SANEDMPVERILEAELAVEPKTETYVEANMGLNPSSPNDPVTNICQAADKQLFTLVEWAKRIPHFSELPLDDQVILLRAGWNELLIASFSHRSIAVKDGILLATGLHVHRNSAHSAGVGAIFDRVLTELVSKMRDMQMDKTELGCLRAIVLFNPDSKGLSNPAEVEALREKVYASLEAYCKHKYPEQPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDTPIDTFLMEMLEAPHQMT
>7p1t_J mol:protein length:265  29 kDa antigen, Cfp29
MNNLYRDLAPVTEAAWAEIELEAARTFKRHIAGRRVVDVSDPGGPVTAAVSTGRLIDVKAPTNGVIAHLRASKPLVRLRVPFTLSRNEIDDVERGSKDSDWEPVKEAAKKLAFVEDRTIFEGYSAASIEGIRSASSNPALTLPEDPREIPDVISQALSELRLAGVDGPYSVLLSADVYTKVSETSDHGYPIREHLNRLVDGDIIWAPAIDGAFVLTTRGGDFDLQLGTDVAIGYASHDTDTVRLYLQETLTFLCYTAEASVALSH
>7pk6_K mol:protein length:758  Biodegradative arginine decarboxylase
MRALIVYTELTDKDSVISHAVARLASELNDEHVETVIIRDFEDGLAYIRSNTSIDCLLYGRDMSDRDEQIQAHRLITQLHRRQEDVPVFLLSDREEALVAFDRNMMEQVDEFAWILEDSADFIAGRVLAAIQRYRSQLLPPLMKSLIKYSDVHEYSWAAPGHQGGVGFTKTPAGRIYHDFFGENLFRTDIGIERVAVGSLLDHTGAFGECEKNAARIFGADQSYSVVVGTSGSNRTIMQACMTDDDVVVIDRNCHKSIEQGLILTGAKPVYMIPSRNRYGIIGPIYPKEMTPDAIKFKIAANPLTKGKVKQKPAYSVVTNCTYDGVCYNARKVQDLLDGSLDRIHFDEAWYGYARFNPLYRNHFAMRDEERTENEPTIFATHSTHKLLNALSQASFIHVRNGRNAIDFNRFNQAYLMHSTTSPLYAICASNDIAADMMDGNSGRSLTDEVIRESIDFRQSLAYLYKEFLNDDEWFFKPWNQEMVKDPATGKRYAFEDAPVELLMREQSCWVMHPEDKWHGFNDIPDNWAMLDPIKVSILAPGMGDDGKLLDTGVPAALVTAWLNHYGIVPTRTTDFQIMFLFSMGITKGKWGTLVNTLLSFKRHYDNNTALKKVLPEVVASAPEIYGEMGLRDLGDKMFAYLQKNNPGARLNQAYSQLPQVMMTPRDAYQQIVANRVEAVPVDQLMGRVAANSIIPYPPGIPMLLSGENFGDENSPHIHYLRSLQAWDSEFPGFEHETEGTEIIDGQYYVMCVKTCDE
>3pvg_A mol:protein length:331  Casein kinase II subunit alpha
SKARVYADVNVLRPKEYWDYEALTVQWGEQDDYEVVRKVGRGKYSEVFEGINVNNNEKCIIKILKPVKKKKIKREIKILQNLCGGPNIVKLLDIVRDQHSKTPSLIFEYVNNTDFKVLYPTLTDYDIRYYIYELLKALDYCHSQGIMHRDVKPHNVMIDHELRKLRLIDWGLAEFYHPGKEYNVRVASRYFKGPELLVDLQDYDYSLDMWSLGCMFAGMIFRKEPFFYGHDNHDQLVKIAKVLGTDGLNVYLNKYRIELDPQLEALVGRHSRKPWLKFMNADNQHLVSPEAIDFLDKLLRYDHQERLTALEAMTHPYFQQVRAAENSRTRA
>2bcb_A mol:protein length:75  CALBINDIN D9K
KSPEELKGIFEKYAAKEGDPNQLSKEELKLLLQTEFPSLLKGGSTLDELFEELDKNGDGEVSFEEFQVLVKKISQ
>6w6c_B mol:protein length:313  Probable dimethyladenosine transferase
MPKVKSGAIGRRRGRQEQRRELKSAGGLMFNTGIGQHILKNPLIINSIIDKAALRPTDVVLEVGPGTGNMTVKLLEKAKKVVACELDPRLVAELHKRVQGTPVASKLQVLVGDVLKTDLPFFDTCVANLPYQISSPFVFKLLLHRPFFRCAILMFQREFALRLVAKPGDKLYCRLSINTQLLARVDHLMKVGKNNFRPPPKVESSVVRIEPKNPPPPINFQEWDGLVRITFVRKNKTLSAAFKSSAVQQLLEKNYRIHCSVHNIIIPEDFSIADKIQQILTSTGFSDKRARSMDIDDFIRLLHGFNAEGIHFS
>4pbp_B mol:protein length:210  C-reactive protein
MEFFKNLSGKVLQFKTATDNSYVKLYPEKPLSLSAFTLCMRVATELPLDREVILFAYYTPDVDELNVWRERDGRVSLYIQSSKDAAFFRLPPLSTLQTHLCVAWESATGLTAFWMDGRRSLHQVYRKGYSIRSGGTVVLGQDPDSYVGSFDVDQSFVGEIANLQMWDYVLSSAQIKAVYYNQDNRVKGNVFDWDTIEYDVTGNVLVVPDN
>3pdg_A mol:protein length:98  Fibronectin(III)-like module
MVTIDSPVAGERFEAGKDINISATVKSKTPVSKVEFYNGDTLISSDTTAPYTAKITGAAVGAYNLKAVAVLSDGRRIESPVTPVLVKVIVLEHHHHHH
>1ttv_A mol:protein length:107  Ubiquitin-protein ligase E3 Mdm2
NHISTSDQEKLVQPTPLLLSLLKSAGAQKETFTMKEVLYHLGQYIMAKQLYDEKQQHIVHCSNDPLGELFGVQEFSVKEHRRIYAMISRNLVSANVKESSEDIFGNV
>6mux_Z mol:protein length:211  20S proteasome beta-5 subunit
TTTLAFKFKDGIIVAVDSRASMGSFISSQNVEKIIEINKNILGTMAGGAADCLYWEKYLGKIIKIYELRNNEKISVRAASTILSNILYQYKGYGLCCGIILSGYDHTGFNMFYVDDSGKKVEGNLFSCGSGSTYAYSILDSAYDYNLNLDQAVELARNAIYHATFRDGGSGGKVRVFHIHKNGYDKIIEGEDVFDLHYHYTNPEQKDQYVM
>4wiz_CB mol:protein length:338  Coat protein
MVRKGEKKLAKPATTKAANPQPRRRANNRRRSNRTDAPVSKASTVTGFGRGTNDVHLSGMSRISQAVLPAGTGTDGYVVVDATIVPDLLPRLGHAARIFQRYAVETLEFEIQPMCPANTGGGYVAGFLPDPTDNDHTFDALQATRGAVVAKWWESRTVRPQYTRTLLWTSSGKEQRLTSPGRLILLCVGNNTDVVNVSVLCRWSVRLSVPSLENPEETTAPIMTQGSLYNDSLSTNDFKSILLGSTPLDIAPDGAVFQLDRPLSIDYSLGTGDVDRAVYWHLKKFAGNAGTPAGWFRWGIWDNFNKTFTDGVAYYSDEQPRQILLPVGTVCTRVDSEN
>6b55_D mol:protein length:48  Flower-specific defensin
ARECKTESNTFPGICITKPPCRKACISEKFTDGHCSKILRRCLCTKPC
>4hnp_L mol:protein length:222  Proteasome component C5
QFNPYGDNGGTILGIAGEDFAVLAGDTRNITDYSINSRYEPKVFDCGDNIVMSANGFAADGDALVKRFKNSVKWYHFDHNDKKLSINSAARNIQHLLYGKRFFPYYVHTIIAGLDEDGKGAVYSFDPVGSYEREQCRAGGAAASLIMPFLDNQVNFKNQYEPGTNGKVKKPLKYLSVEEVIKLVRDSFTSATERHIQVGDGLEILIVTKDGVRKEFYELKRD
>3i4e_B mol:protein length:439  Isocitrate lyase
GPGSMSRQQQAQELQKQWETDPRWKGIKRAFTAEDVVRLRGSIQQEHTLAKRGAEKLWTLINNEPFVNALGALTGNQAMQQVKAGLKAIYLSGWQVAGDANVAGEMYPDQSLYPANSVPLVVKRINNTLTRADQIQWSEGKNPGDEGYVDFFAPIVADAEAGFGGVLNAFELMKAMIEAGASGVHFEDQLASVKKCGHMGGKVLVPTREAVAKLTAARLAADVMGTPTVLVARTDAEAADLITSDIDDNDKPYLTGERTVEGFFRTKPGLEQAISRGLAYAPYADLIWCETGKPDLEYAKKFAEAIHKQFPGKLLSYNCSPSFNWKKNLDDATIAKFQKELGAMGYKFQFITLAGFHALNYSMFNLAHGYARTQMSAFVELQQAEFAAADKGFTAVKHQREVGTGYFDAVTQTVEREASTTALHGSTEDEQFFDGQKVA
>1s89_C mol:protein length:152  Methylglyoxal synthase
MELTTRTLPARKHIALVAHDHCKQMLMSWVERHQPLLEQHVLYATGTTGNLISRATGMNVNAMLSGPMGGDQQVGALISEGKIDVLIFFWDPLNAVPNDPDVKALLRLATVWNIPVATNVATADFIIQSPHFNDAVDILIPDYQRYLADRLK
>7az7_H mol:protein length:6  Peptide 37
XQAXLF
>4elf_B mol:protein length:166  Dihydrofolate reductase
MIVSFMVAMDENRVIGKDNNLPWRLPSELQYVKKTTMGHPLIMGRKNYEAIGRPLPGRRNIIVTRNEGYHVEGCEVAHSVEEVFELCKNEEEIFIFGGAQIYDLFLPYVDKLYITKIHHAFEGDTFFPEMDMTNWKEVFVEKGLTDEKNPYTYYYHVYEKQQLVPR
>4ji2_B mol:protein length:256  RIBOSOMAL PROTEIN S2
MPVEITVKELLEAGVHFGHERKRWNPKFARYIYAERNGIHIIDLQKTMEELERTFRFIEDLAMRGGTILFVGTKKQAQDIVRMEAERAGMPYVNQRWLGGMLTNFKTISQRVHRLEELEALFASPEIEERPKKEQVRLKHELERLQKYLSGFRLLKRLPDAIFVVDPTKEAIAVREARKLFIPVIALADTDSDPDLVDYIIPGNDDAIRSIQLILSRAVDLIIQARGGVVEPSPSYALVQEAEATETPEGESEVEA
>6ydp_Ak mol:protein length:325  Mitochondrial ribosomal protein S35
MAATSLPAWLILKSRAGTFRAFSTAMSPATRSPRPALRTTERTSKPERALRRKALPPRTEKMAVDQDWPSVYPVAAPFKPSAVPLPVRMGYPVKRGVPMAKEGNLELLKIPNFLHLTPVAIKRHCEALKDFCTEWPAALDSDEKCEKHFPIEIDTADYVSAGPSIRNPKARVVTLRVKLSSLNLDDHAKKKLIKLVGDRYCKSTDVLTIKTDRCPLKRQNYDYAVYLLTVLYHESWKTEEWEKKKTEADMEEYIWENSTSEKNILETLLQIKAAEKNLELSKEELLGTKEVEDYRKSVVSLKNEGDNENTLSQYKESVKRLLNLA
>7f5s_Ld mol:protein length:125  60S ribosomal protein L31
MAPAKKGGEKKKGRSAINEVVTREYTINIHKRIHGVGFKKRAPRALKEIRKFAMKEMGTPDVRIDTRLNKAVWAKGIRNVPYRIRVRLSRKRNEDEDSPNKLYTLVTYVPVTTFKNLQTVNVDEN
>1izl_L mol:protein length:472  Photosystem II: Subunit PsbB
MGLPWYRVHTVLINDPGRLIAAHLMHTALVAGWAGSMALYELATFDPSDPVLNPMWRQGMFVLPFMARLGVTGSWSGWSITGETGIDPGFWSFEGVALAHIVLSGLLFLAACWHWVYWDLELFRDPRTGEPALDLPKMFGIHLFLAGLLCFGFGAFHLTGLFGPGMWVSDPYGLTGSVQPVAPEWGPDGFNPYNPGGVVAHHIAAGIVGIIAGLFHILVRPPQRLYKALRMGNIETVLSSSIAAVFFAAFVVAGTMWYXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGGELNGQTFTDPPTVKSYARKAIFGEIFEFDTETLNSDGIFRTSPRGWFTFAHAVFALLFFFGHIWHGARTLFRDVFSGIDPELSPEQVEWGFYQKVGDVTTRRKEAV
>2y0d_D mol:protein length:478  UDP-GLUCOSE DEHYDROGENASE
HHHHHHGSMNLTIIGSGKVGLVTGACLADIGHDVFCLDVDQAKIDILNNGGVPIHEPGLKEVIARNRSAGRLRFSTDIEAAVAHGDVQFIAVGTPPDEDGSADLQYVLAAARNIGRYMTGFKVIVDKSTVPVGTAERVRAAVAEELAKRGGDQMFSVVSNPEFLKEGAAVDDFTRPDRIVIGCDDDVPGERARELMKKLYAPFNRNHERTLYMDVRSAEFTKYAANAMLATRISFMNELANLADRFGADIEAVRRGIGSDPRIGYHFLYAGCGYGGSCFPKDVEALIRTADEHGQSLQILKAVSSVNATQKRVLADKIVARFGEDLTGRTFAIWGLAFKPNTDDMREAPSRELIAELLSRGARIAAYDPVAQEEARRVIALDLADHPSWLERLSFVDDEAQAARDADALVIVTEWKIFKSPDFVALGRLWKTPVIFDGRNLYEPETMSEQGIEYHPIGRPGSRQAVAARVTGTAPASA
>7pi2_J mol:protein length:343  Cysteine-rich protective antigen
DSRHVFIRTELSFIKNNVPCIRDMFFIYKRELYNICLDDLKGEEDETHIYVQKKVKDSWITLNDLFKETDLTGRPHIFAYVDVEEIIILLCEDEEFSNRKKDMTCHRFYSNDGKEYNNAEITISDYILKDKLLSSYVSLPLKIENREYFLICGVSPYKFKDDNKKDDILCMASHDKGETWGTKIVIKYDNYKLGVQYFFLRPYISKNDLSFHFYVGDNINNVKNVNFIECTHEKDLEFVCSNRDFLKDNKVLQDVSTLNDEYIVSYGNDNNFAECYIFFNNENSILIKPEKYGNTAAGCYGGTFVKIDENRALFIYSSSQGIYNIHTIYYANYEGGGGSEPEA
>1n2r_A mol:protein length:276  HLA class I histocompatibility antigen, BW-44(B-12) B*4403 alpha chain
GSHSMRYFYTAMSRPGRGEPRFITVGYVDDTLFVRFDSDATSPRKEPRAPWIEQEGPEYWDRETQISKTNTQTYRENLRTALRYYNQSEAGSHIIQRMYGCDVGPDGRLLRGYDQDAYDGKDYIALNEDLSSWTAADTAAQITQRKWEAARVAEQLRAYLEGLCVESLRRYLENGKETLQRADPPKTHVTHHPISDHEVTLRCWALGFYPAEITLTWQRDGEDQTQDTELVETRPAGDRTFQKWAAVVVPSGEEQRYTCHVQHEGLPKPLTLRWEP
>2nxx_B mol:protein length:235  Ultraspiracle (USP, NR2B4)
MTSNLQADMPLERIIEAEKRVECNDPLVALVVNENNTTVNNICQATHKQLFQLVQWAKLVPHFTSLPLTDQVQLLRAGWNELLIAAFSHRSMQAQDAIVLATGLTVNKSTAHAVGVGNIYDRVLSELVNKMKEMKMDKTELGCLRAIILYNPDVRGIKSVQEVEMLREKIYGVLEEYTRTTHPNEPGRFAKLLLRLPALRSIGLKCLEHLFFFKLIGDVPIDTFLMEMLEGTTDS
>4s3s_A mol:protein length:143  Thermonuclease
ATSTKKLHKEPATLIKAIDGDTAKLMYKGQPMTFRLLLVDTPEFNEKYGPEASAFTKKMVENAKKIEVEFDKGQRTDKYGRGLAYKYADGKMVNEALVRQGLAKVAYVYKGNNTHEQLLRKAEAQAKKEKLNIWSEDNADSGQ
>4e9x_C mol:protein length:339  Multicopper oxidase
MAEREFDMTIEEVTIKVAPGLDYKVFGFNGQVPGPLIHVQEGDDVIVNVTNNTSLPHTIHWHGVHQKGTWRSDGVPGVTQQPIEAGDSYTYKFKADRIGTLWYHCHVNVNEHVGVRGMWGPLIVDPKQPLPIEKRVTKDVIMMMSTWESAVADKYGEGGTPMNVADYFSVNAKSFPLTQPLRVKKGDVVKIRFFGAGGGIHAMHSHGHDMLVTHKDGLPLDSPYYADTVLVSPGERYDVIIEADNPGRFIFHDHVDTHVTAGGKHPGGPITVIEYDGVPVDDWYVWKDKDYDPNFFYSESLKQGYGMFDHDGFKGEFEQRQRRPGRKLAAALEHHHHHH
>6tg2_A mol:protein length:351  MotA
MGSSHHHHHHSSGLVPRGSHMDVVIASSGGGWQEAQDKALWAPAAKALNITYTQDTFQNWAEARAQVESGSVTWDIIQIGIADEPQAKAAGVLEKLDPDIVNKADFPPGSVTDSFVANSNYSTLIAWNKKTYGDNGPKSMADFFDVKKFPGKRALWNQPIGMIEAAALALGTPRDKVYEFLSTEEGRKAAIAKLTELAPSVSVWWESGAQAAQLIKDGEVDMIITWGGRVQGAINDGANFAYTFNDAQLGTDGYAIVKGAPHRDAAMRFLKEMSKAEYQKDLPNSFATAPANMKAYDLAKYTPEKMATMASAPENVAVQYSVDPNFWAKHAKWASEAYDNVRLSRHHHHHH
>6p60_K mol:protein length:212  Antibody A12V163-a.02 light chain
QFVLAQPPSVSGAPGQRVTLSCTGSNSNIGVNYVQWYQQLPGTAPKLLIYENNKRPSGVSDRFSGSQSGTSASLTITGLQSEDEADYYCQCYDISLGAHVFGSGTELTVLGQPKAAPSVTLFPPSSEELQANKATLVCLISDFYPGAVEVAWKADGSAVNAGVETTKPSKQSNNKYAASSYLSLTSDQWKSHKSYSCQVTHEGSTVEKTVAP
>5pg2_A mol:protein length:138  Bromodomain adjacent to zinc finger domain protein 2B
MHHHHHHSSGVDLGTENLYFQSMSVKKPKRDDSKDLALCSMILTEMETHEDAWPFLLPVNLKLVPGYKKVIKKPMDFSTIREKLSSGQYPNLETFALDVRLVFDNCETFNEDDSDIGRAGHNMRKYFEKKWTDTFKVS
>2oa6_C mol:protein length:320  Aristolochene synthase
MKKPNGTNGASSSLEPPPSTFQPLCHPLVEEVSKEVDGYFLQHWNFPNEKARKKFVAAGFSRVTCLYFPKALDDRIHFACRLLTVLFLIDDLLEYMSFEEGSAYNEKLIPISRGDVLPDRSIPVEYIIYDLWESMRAHDREMADEILEPVFLFMRAQTDRTRARPMGLGGYLEYRERDVGKELLAALMRFSMGLKLSPSELQRVREIDANCSKHLSVVNDIYSYEKELYTSKTAHSEGGILCTSVQILAQEADVTAEAAKRVLFVMCREWELRHQLLVARLSAEGLETPGLAAYVEGLEYQMSGNELWSQTTLRYSVVVD
>6qz0_5b mol:protein length:448  Major capsid protein
MRITFNDVKTSLGITESYDIVNAIRNSQGDNFKSYVPLATANNVAEVGAGILINQTVQNDFITSLVDRIGLVVIRQVSLNNPLKKFKKGQIPLGRTIEEIYTDITKEKQYDAEEAEQKVFEREMPNVKTLFHERNRQGFYHQTIQDDSLKTAFVSWGNFESFVSSIINAIYNSAEVDEYEYMKLLVDNYYSKGLFTTVKIDEPTSSTGALTEFVKKMRATARKLTLPQGSRDWNSMAVRTRSYMEDLHLIIDADLEAELDVDVLAKAFNMNRTDFLGNVTVIDGFASTGLEAVLVDKDWFMVYDNLHKMETVRNPRGLYWNYYYHVWQTLSVSRFANAVAFVSGDVPAVTQVIVSPNIAAVKQGGQQQFTAYVRATNAKDHKVVWSVEGGSTGTAITGDGLLSVSGNEDNQLTVKATVDIGTEDKPKLVVGEAVVSIRPNNASGGAQA
>7eqd_3 mol:protein length:62  Light-harvesting protein B-870 alpha chain
MWRIWQLFDPRQALVGLATFLFVLALLIHFILLSTERFNWLEGASTKPVQTSMVMPSSDLAV
>5k5o_A mol:protein length:98  AspA
GKISTDKYIFLTPRAYIIVHLLKVGKAKASEISENTQIPYQTVIQNIRWLLAEGYVVKEQKGEEIYYKLTDKGKQLATAELEKIRKLVEVVQHHHHHH
>3dby_N mol:protein length:269  uncharacterized protein
MSLERNYEESALFEHQFWLKVLTDHAQFLLDALAPKEKEDIKKATYFVETFTNLLNKVRNVNLMAFSKEAEQAAKEIRAFKLNIIQKQLEGKITIHFTPTFINHMVNEVEEYIAVLEFLKKGEVPPVFHELHYHLVWLTDAAGHAGSISGGLDLVEKRLKEKSEEFTKHFEQFYLKAVEMTGYLRTELHHFPALKKFTKDVSLELKLFSHFLHEVEELELSNEVLSVLSARMADHMAREECYYLLKLAQSSGLEMPKCNPLEGHHHHHH
>1sfo_E mol:protein length:215  DNA-directed RNA polymerases I, II, and III 27 kDa polypeptide
MDQENERNISRLWRAFRTVKEMVKDRGYFITQEEVELPLEDFKAKYCDSMGRPQRKMMSFQANPTEESISKFPDMGSLWVEFCDEPSVGVKTMKTFVIHIQEKNFQTGIFVYQNNITPSAMKLVPSIPPATIETFNEAALVVNITHHELVPKHIRLSSDEKRELLKRYRLKESQLPRIQRADPVALYLGLKRGEVVKIIRKSETSGRYASYRICM
>2zee_B mol:protein length:329  Glutaminyl-peptide cyclotransferase
ASAWPEEKNYHQPAILNSSALRQIAEGTSISEMWQNDLQPLLIERYPGSPGSYAARQHIMQRIQRLQADWVLEIDTFLSQTPYGYRSFSNIISTLNPTAKRHLVLACHYDSKYFSHWNNRVFVGATDGAVPCAMMLELARALDKKLLSLKTVSDSKPDLSLQLIFFDGEEAFLHWSPQDSLYGSRHLAAKMASTPHPPGARGTSQLHGMDLLVLLDLIGAPNPTFPNFFPNSARWFERLQAIEHELHELGLLKDHSLEGRYFQNYSYGGVIQDDHIPFLRRGVPVLHLIPSPFPEVWHTMDDNEENLDESTIDNLNKILQVFVLEYLHL
>6cae_1c mol:protein length:239  30S ribosomal protein S3
MGNKIHPIGFRLGITRDWESRWYAGKKQYRHLLLEDQRIRGLLEKELYSAGLARVDIERAADNVAVTVHVAKPGVVIGRGGERIRVLREELAKLTGKNVALNVQEVQNPNLSAPLVAQRVAEQIERRFAVRRAIKQAVQRVMESGAKGAKVIVSGRIGGAEQARTEWAAQGRVPLHTLRANIDYGFALARTTYGVLGVKAYIFLGEVIGGQKPKARPELPKAEERPRRRRPAVRVKKEE
>3hhq_J mol:protein length:167  Deoxyuridine 5'-triphosphate nucleotidohydrolase
MGSSHHHHHHSSGLVPRGSHMTATSDKVLKIQLRSASATVPTKGSATAAGYDIYASQDITIPAMGQGMVSTDISFTVPVGTYGRIAPRSGLAVKNGIQTGAGVVDRDYTGEVKVVLFNHSQRDFAIKKGDRVAQLILEKIVDDAQIVVVDSLEESARGAGGFGSTGN
>2a3s_A mol:protein length:101  Myocyte Nuclear Factor
ESKPPYSYAQLIVQAISSAQDRQLTLSGIYAHITKHYPYYRTADKGWQNSIRHNLSLNRYFIKVPRSQEEPGKGSFWRIDPASEAKLVEQAFRKRRQRGVS
>5dcp_A mol:protein length:175  Filamin-B
SMMNGLGFKPFDLVIPFAVRKGEITGEVHMPSGKTATPEIVDNKDGTVTVRYAPTEVGLHEMHIKYMGSHIPESPLQFYVNYPNSGSVSAYGPGLVYGVANKTATFTIVTEDAGEGGLDLAIEGPSKAEISCIDNKDGTCTVTYLPTLPGDYSILVKYNDKHIPGSPFTAKITDD
>2qsp_B mol:protein length:145  Hemoglobin subunit beta
MLTAEEKAAVTAFWGKVKVDEVGGEALGRLLVVYPWTQRFFESFGDLSTADAVMNNPKVKAHGKKVLDSFSNGMKHLDDLKGTFAALSELHCDKLHVDPENFKLLGNVLVVVLARNFGKEFTPVLQADFQKVVAGVANALAHRYH
>3fp9_H mol:protein length:153  Proteasome-associated ATPase
MPSGYGVLLATHDDDTVDVFTSGRKMRLTCSPNIDAASLKKGQTVRLNEALTVVEAGTFEAVGEISTLREILADGHRALVVGHADEERVVWLADPLIAEDLPDGLPEALNDDTRPRKLRPGDSLLVDTKAGYAFERIPKAEVEDLVLEELVPR
>6v3o_E mol:protein length:970  Phosphoenolpyruvate carboxylase
MASTKAPGPGEKHHSIDAQLRQLVPGKVSEDDKLIEYDALLVDRFLNILQDLHGPSLREFVQECYEVSADYEGKGDTTKLGELGAKLTGLAPADAILVASSILHMLNLANLAEEVQIAHRRRNSKLKKGGFADEGSATTESDIEETLKRLVSEVGKSPEEVFEALKNQTVDLVFTAHPTQSARRSLLQKNARIRNCLTQLNAKDITDDDKQELDEALQREIQAAFRTDEIRRAQPTPQDEMRYGMSYIHETVWKGVPKFLRRVDTALKNIGINERLPYNVSLIRFSSWMGGDRDGNPRVTPEVTRDVCLLARMMAANLYIDQIEELMFELSMWRCNDELRVRAEELHSSSGSKVTKYYIEFWKQIPPNEPYRVILGHVRDKLYNTRERARHLLASGVSEISAESSFTSIEEFLEPLELCYKSLCDCGDKAIADGSLLDLLRQVFTFGLSLVKLDIRQESERHTDVIDAITTHLGIGSYREWSEDKRQEWLLSELRGKRPLLPPDLPQTEEIADVIGAFHVLAELPPDSFGPYIISMATAPSDVLAVELLQRECGVRQPLPVVPLFERLADLQSAPASVERLFSVDWYMDRIKGKQQVMVGYSDSGKDAGRLSAAWQLYRAQEEMAQVAKRYGVKLTLFHGRGGTVGRGGGPTHLAILSQPPDTINGSIRVTVQGEVIEFCFGEEHLCFQTLQRFTAATLEHGMHPPVSPKPEWRKLMDEMAVVATEEYRSVVVKEARFVEYFRSATPETEYGRMNIGSRPAKRRPGGGITTLRAIPWIFSWTQTRFHLPVWLGVGAAFKFAIDKDVRNFQVLKEMYNEWPFFRVTLDLLEMVFAKGDPGIAGLYDELLVAEELKPFGKQLRDKYVETQQLLLQIAGHKDILEGDPFLKQGLVLRNPYITTLNVFQAYTLKRIRDPNFKVTPQPPLSKEFADENKPAGLVKLNPASEYPPGLEDTLILTMKGIAAGMQNTG
>2gf0_C mol:protein length:199  GTP-binding protein Di-Ras1
SMPEQSNDYRVVVFGAGGVGKSSLVLRFVKGTFRDTYIPTIEDTYRQVISCDKSVCTLQITDTTGSHQFPAMQRLSISKGHAFILVFSVTSKQSLEELGPIYKLIVQIKGSVEDIPVMLVGNKCDETQREVDTREAQAVAQEWKCAFMETSAKMNYNVKELFQELLTLETRRNMSLNIDGKRSGKQKRTDRVKGKCTLM
>1p3q_Q mol:protein length:54  Vacuolar protein sorting-associated protein VPS9
SSLIKKIEENERKDTLNTLQNMFPDMDPSLIEDVCIAAASRIGPCVDALLSLSE
>3c91_O mol:protein length:233  Proteasome subunit alpha
MQQGQMAYDRAITVFSPDGRLFQVEYAREAVKKGSTALGMKFANGVLLISDKKVRSRLIEQNSIEKIQLIDDYVAAVTSGLVADARVLVDFARISAQQEKVTYGSLVNIENLVKRVADQMQQYTQYGGVRPYGVSLIFAGIDQIGPRLFDCDPAGTINEYKATAIGSGKDAVVSFLEREYKENLPEKEAVTLGIKALKSSLEEGEELKAPEIASITVGNKYRIYDQEEVKKFL
>4wra_1A mol:protein length:105  30S ribosomal protein S10
MPKIRIKLRGFDHKTLDASAQKIVEAARRSGAQVSGPIPLPTRVRRFTVIRGPFKHKDSREHFELRTHNRLVDIINPNRKTIEQLMTLDLPTGVEIEIKTVGGGR
>4n06_A mol:protein length:347  CRISPR-associated endonuclease Cas1 1
GGMRLVVDGFGKYLGIENGLIVVKEKGKALRKVRPEDLKQVLIIGKAAISSDAIKLLLKNRVDVVFLDFNGEILGRLSHPLIGTAKTRREQYLAYGDKRGVHLAKEFIKAKMANQMAILTNLAKARKDSNPEVAESLLKAKKEIDACLNELDGVEAEMIDKVRERLLGIEGKASKHYWDAISLVIPEEYRFNGRRGIEIGSPRYAKDIVNAMLNYGYSILLAECVKAVELAGLDPYAGFLHVDVSGRSSLAIDLMENFRQQVVDRVVLRLISYRQIKPEDCEKRNMVCQLSDNARRLLLASLLERLDSKTQYRGRNLAYSSIILLHARDVVAFLRGERRYEGFVQKW
>6d6e_A mol:protein length:129  Lysozyme C
KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQAWIRGCRL
>1v1m_A mol:protein length:400  2-OXOISOVALERATE DEHYDROGENASE ALPHA SUBUNIT
SSLDDKPQFPGASAEFIDKLEFIQPNVISGIPIYRVMDRQGQIINPSEDPHLPKEKVLKLYKSMTLLNTMDRILYESQRQGRISFYMTNYGEEGTHVGSAAALDNTDLVFGQYREAGVLMYRDYPLELFMAQCYGNISDLGKGRQMPVHYGCKERHFVTISSPLATQIPQAVGAAYAAKRANANRVVICYFGEGAASEGDAHAGFNFAATLECPIIFFCRNNGYAISTPTSEQYRGDGIAARGPGYGIMSIRVDGNDVFAVYNATKEARRRAVAENQPFLIEAMTYRIGHASTSADSSAFRSVDEVNYWDKQDHPISRLRHYLLSQGWWDEEQEKAWRKQSRRKVMEAFEQAERKPKPNPNLLFSDVYQEMPAQLRKQQESLARHLQTYGEHYPLDHFDK
>7pak_H mol:protein length:132  30S ribosomal protein S9
MEKQSYYGLGRRKSSSAKVYLTPTQDKGKITVNRRDPSEYFPNKLVIQDMEQPLDLTDLKKNFDINVVVKGGGFTGQAGAIRLGIVRALLQFNPELKKILKSKKLTTRDKRVKERKKFGLYGARRAPQFTKR
>4gob_A mol:protein length:230  Kaede-type Fluorescent Protein
MSVIKSDMKIKLRMEGTVNGHKFVIEGEGEGKPYEGTQTMNLKVKEGAPLPFAYDILTTVFHYGNRVFAKYPKHIPDYFKQSFPEGYSWERSMTFEDGGICTARNDITLEGDCFFNEIRFDGVNFPPNGPVMQKKTLKWEPSTEKMYVRDGVLTGDINMALLLEGGGHYRCDFKTTYKAKKGVQLPDYHFVDHCIEILSHDKDYNNVKLYEHAVAHSGLPRQAKHHHHHH
>5f5k_B mol:protein length:7  Peptidic derivative of Gurken: ACE-ARG-LYS-VAL-ARG-MET-ALA-aldehyde
XRKVRMX
>6rkm_P mol:protein length:12  Cellular tumor antigen p53
KLMFKTEGPDSD
>2p1m_B mol:protein length:594  TRANSPORT INHIBITOR RESPONSE 1 protein
MQKRIALSFPEEVLEHVFSFIQLDKDRNSVSLVCKSWYEIERWCRRKVFIGNCYAVSPATVIRRFPKVRSVELKGKPHFADFNLVPDGWGGYVYPWIEAMSSSYTWLEEIRLKRMVVTDDCLELIAKSFKNFKVLVLSSCEGFSTDGLAAIAATCRNLKELDLRESDVDDVSGHWLSHFPDTYTSLVSLNISCLASEVSFSALERLVTRCPNLKSLKLNRAVPLEKLATLLQRAPQLEELGTGGYTAEVRPDVYSGLSVALSGCKELRCLSGFWDAVPAYLPAVYSVCSRLTTLNLSYATVQSYDLVKLLCQCPKLQRLWVLDYIEDAGLEVLASTCKDLRELRVFPSEPFVMEPNVALTEQGLVSVSMGCPKLESVLYFCRQMTNAALITIARNRPNMTRFRLCIIEPKAPDYLTLEPLDIGFGAIVEHCKDLRRLSLSGLLTDKVFEYIGTYAKKMEMLSVAFAGDSDLGMHHVLSGCDSLRKLEIRDCPFGDKALLANASKLETMRSLWMSSCSVSFGACKLLGQKMPKLNVEVIDERGAPDSRPESCPVERVFIYRTVAGPRFDMPGFVWNMDQDSTMRFSRQIITTNGL
>1jf1_B mol:protein length:100  beta-2-microglobulin
MIQRTPKIQVYSRHPAENGKSNFLNCYVSGFHPSDIEVDLLKNGERIEKVEHSDLSFSKDWSFYLLYYTEFTPTEKDEYACRVNHVTLSQPKIVKWDRDM
>7vot_Y mol:protein length:53  Rsp_7571 Protein-Y PufY
MPEVSEFAFRLMMAAVIFVGVGIMFAFAGGHWFVGLVVGGLVAAFFAATPNSN
>7o11_C mol:protein length:308  Probable ABC transporter ATP-binding protein NosF
MNAVEIQGVSQRYGSMTVLHDLNLNLGEGEVLGLFGHNGAGKTTSMKLILGLLSPSEGQVKVLGRAPNDPQVRRQLGYLPENVTFYPQLSGRETLRHFARLKGAALTQVDELLEQVGLAHAADRRVKTYSKGMRQRLGLAQALLGEPRLLLLDEPTVGLDPIATQDLYLLIDRLRQRGTSIILCSHVLPGVEAHINRAAILAKGCLQAVGSLSQLRAEAGLPVRIRASGISERDSWLQRWTDAGHSARGLSESSIEVVAVNGHKLVLLRQLLGEGEPEDIEIHQPSLEDLYRYYMERAGDVRAQEGRL
>7nt9_A mol:protein length:1287  Spike glycoprotein
MGILPSPGMPALLSLVSLLSVLLMGCVAETGMFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIADTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQDVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSPSRASSVASQSIIAYTMSLGAENSVAYSNNSIAIPTNFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILSRLDPPEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTDNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVAKNLNESLIDLQELGKYEQSGRENLYFQGGGGSGYIPEAPRDGQAYVRKDGEWVLLSTFLGHHHHHH
>5euj_T mol:protein length:573  Pyruvate decarboxylase
MYTVGMYLAERLAQIGLKHHFAVAGDYNLVLLDQLLLNKDMEQVYCCNELNCGFSAEGYARARGAAAAIVTFSVGAISAMNAIGGAYAENLPVILISGSPNTNDYGTGHILHHTIGTTDYNYQLEMVKHVTCAAESIVSAEEAPAKIDHVIRTALRERKPAYLEIACNVAGAECVRPGPINSLLRELEVDQTSVTAAVDAAVEWLQDRQNVVMLVGSKLRAAAAEKQAVALADRLGCAVTIMAAAKGFFPEDHPNFRGLYWGEVSSEGAQELVENADAILCLAPVFNDYATVGWNSWPKGDNVMVMDTDRVTFAGQSFEGLSLSTFAAALAEKAPSRPATTQGTQAPVLGIEAAEPNAPLTNDEMTRQIQSLITSDTTLTAETGDSWFNASRMPIPGGARVELEMQWGHIGWSVPSAFGNAVGSPERRHIMMVGDGSFQLTAQEVAQMIRYEIPVIIFLINNRGYVIEIAIHDGPYNYIKNWNYAGLIDVFNDEDGHGLGLKASTGAELEGAIKKALDNRRGPTLIECNIAQDDCTETLIAWGKRVAATNSRKPQALVPRGSGGGLEHHHHHH
>5y6p_A2 mol:protein length:318  LR_gamma4
MDSPAFAVNGMFSAVKVGNSSFTENKVTAVSKTAPTASVRMVVDPFQRKFQSIGKIGIDYSRPKKLATYKRVGYSVGLDFPNAVSMAGHYSLTDCTRAGGAAKILMKYDEYCAKGMLQVYKRSAVSTGVYTTKCTEATQPGVAYDVRVFNRTAAFRQAQKPVNVRLGEQYAARKACVTLAHNCSREEAQFKNMPMSCATFLAGKMEAMGTCYRTVRPSSKAEDYMAGSVRMQVYQKGNASGVYPVGGCEDGHAKGDADLRRVIALASEYRAAQQGAAAVTGAQYASSKMAIQLYGHSCNHEEGQFCDYPAVAAAMCRY
>7qgr_S mol:protein length:179  50S ribosomal protein L5
MAKLHDYYKDEVVKKLMTEFNYNSVMQVPRVEKITLNMGVGEAIADKKLLDNAAADLAAISGQKPLITKARKSVAGFKIRQGYPIGCKVTLRGERMWEFFERLITIAVPRIRDFRGLSAKSFDGRGNYSMGVREQIIFPEIDYDKVDRVRGLDITITTTAKSDEEGRALLAAFDFPFRK
>3q9i_A mol:protein length:10  Cyclic pseudo-peptide LV(4BF)FA(ORN)(HAO)LK(ORN)
LVYFAAXLKA
>4a35_A mol:protein length:441  MITOCHONDRIAL ENOLASE SUPERFAMILY MEMBER 1
SMVRGRISRLSVRDVRFPTSLGGHGADAMHTDPDYSAAYVVIETDAEDGIKGCGITFTLGKGTEVVVCAVNALAHHVLNKDLKDIVGDFRGFYRQLTSDGQLRWIGPEKGVVHLATAAVLNAVWDLWAKQEGKPVWKLLVDMDPRMLVSCIDFRYITDVLTEEDALEILQKGQIGKKEREKQMLAQGYPAYTTSCAWLGYSDDTLKQLCAQALKDGWTRFKVKVGADLQDDMRRCQIIRDMIGPEKTLMMDANQRWDVPEAVEWMSKLAKFKPLWIEEPTSPDDILGHATISKALVPLGIGIATGEQCHNRVIFKQLLQAKALQFLQIDSCRLGSVNENLSVLLMAKKFEIPVCPHAGGVGLCELVQHLIIFDYISVSASLENRVCEYVDHLHEHFKYPVMIQRASYMPPKDPGYSTEMKEESVKKHQYPDGEVWKKLLPA
>3zpv_S mol:protein length:62  PROTEIN PYGOPUS
GAMAIYPCGMCHKEVNDNDEAVFCESGCNFFFHRTCVGLTEAAFQMLNKEVFAEWCCDKCVS
>7y15_C mol:protein length:71  Guanine nucleotide-binding protein G(I)/G(S)/G(O) subunit gamma-2
MASNNTASIAQARKLVEQLKMEANIDRIKVSKAAADLMAYCEAHAKEDPLLTPVPASENPFREKKFFCAIL
>3glh_D mol:protein length:376  DNA polymerase III subunit tau
GPHMSYQVLARKWRPQTFADVVGQEHVLTALANGLSLGRIHHAYLFSGTRGVGKTSIARLLAKGLNCETGITATPCGVCDNCREIEQGRFVDLIEIDAASRTKVEDTRDLLDNVQYAPARGRFKVYLIDEVHMLSRHSFNALLKTLEEPPEHVKFLLATTDPQKLPVTILSRCLQFHLKALDVEQIRHQLEHILNEEHIAHEPRALQLLARAAEGSLRDALSLTDQAIASGDGQVSTQAVSAMLGTLDDDQALSLVEAMVEANGERVMALINEAAARGIEWEALLVEMLGLLHRIAMVQLSPAALGNDMAAIELRMRELARTIPPTDIQLYYQTLLIGRKELPYAPDRRMGVEMTLLRALAFHPRMPLPEPEVPRQ
>3k6s_C mol:protein length:1095  Integrin alpha-X
FNLDTEELTAFRVDSAGFGDSVVQYANSWVVVGAPQKITAANQTGGLYQCGYSTGACEPIGLQVPPEAVNMSLGLSLASTTSPSQLLACGPTVHHECGRNMYLTGLCFLLGPTQLTQRLPVSRQECPRQEQDIVFLIDGSGSISSRNFATMMNFVRAVISQFQRPSTQFSLMQFSNKFQTHFTFEEFRRSSNPLSLLASVHQLQGFTYTATAIQNVVHRLFHASYGARRDAAKILIVITDGKKEGDSLDYKDVIPMADAAGIIRYAIGVGLAFQNRNSWKELNDIASKPSQEHIFKVEDFDALKDIQNQLKEKIFAIEGTETTSSSSFELEMAQEGFSAVFTPDGPVLGAVGSFTWSGGAFLYPPNMSPTFINMSQENVDMRDSYLGYSTELALWKGVQSLVLGAPRYQHTGKAVIFTQVSRQWRMKAEVTGTQIGSYFGASLCSVDVDSDGSTDLVLIGAPHYYEQTRGGQVSVCPLPRGWRRWWCDAVLYGEQGHPWGRFGAALTVLGDVNGDKLTDVVIGAPGEEENRGAVYLFHGVLGPSISPSHSQRIAGSQLSSRLQYFGQALSGGQDLTQDGLVDLAVGARGQVLLLRTRPVLWVGVSMQFIPAEIPRSAFECREQVVSEQTLVQSNICLYIDKRSKNLLGSRDLQSSVTLDLALDPGRLSPRATFQETKNRSLSRVRVLGLKAHCENFNLLLPSCVEDSVTPITLRLNFTLVGKPLLAFRNLRPMLAADAQRYFTASLPFEKNCGADHICQDNLGISFSFPGLKSLLVGSNLELNAEVMVWNDGEDSYGTTITFSHPAGLSYRYVAEGQKQGQLRSLHLTCDSAPVGSQGTWSTSCRINHLIFRGGAQITFLATFDVSPKAVLGDRLLLTANVSSENNTPRTSKTTFQLELPVKYAVYTVVSSHEQFTKYLNFSESEEKESHVAMHRYQVNNLGQRDLPVSINFWVPVELNQEAVWMDVEVSHPQNPSLRCSSEKIAPPASDFLAHIQKNPVLDCSIAGCLRFRCDVPSFSVQEELDFTLKGNLSFGWVRQILQKKVSVVSVAEITFDTSVYSQLPGQEAFMRAQTTTVLEKYKVHGCGGLENLYFQ
>3tvu_C mol:protein length:769  Acetyl-CoA carboxylase
MASGSMHLRPIATPYPVKEWLQPKRYKAHLMGTTYVYDFPELFRQASSSQWKNFSADVKLTDDFFISNELIEDENGELTEVEREPGANAIGMVAFKITVKTPEYPRGRQFVVVANDITFKIGSFGPQEDEFFNKVTEYARKRGIPRIYLAANSGARIGMAEEIVPLFQVAWNDAANPDKGFQYLYLTSEGMETLKKFDKENSVLTERTVINGEERFVIKTIIGSEDGLGVECLRGSGLIAGATSRAYHDIFTITLVTCRSVGIGAYLVRLGQRAIQVEGQPIILTGASALNKVLGREVYTSNLQLGGTQIMYNNGVSHLTAVDDLAGVEKIVEWMSYVPAKRNMPVPILETKDTWDRPVDFTPTNDETYDVRWMIEGRETESGFEYGLFDKGSFFETLSGWAKGVVVGRARLGGIPLGVIGVETRTVENLIPADPANPNSAETLIQQAGQVWFPNSAFKTAQAINDFNNGEQLPMMILANWRGFSGGQRDMFNEVLKYGSFIVDALVDYKQPIIIYIPPTGELRGGSWVVVDPTINADQMEMYADVNARAGVLEPEGTVEIKFRREKLLDTMNRLDDKYRELRSQLSNKSLAPEVHQQISKQLADRERELLPIYGQISLQFADLHDRSSRMVAKGVISKELEWTEARRFFFWRLRRRLNEEYLIKRLSHQVGEASRLEKIARIRSWYPASVDHEDDRQVATWIEENYKTLDDKLKGLKLESFAQDLAKKIRSDHDNAIDGLSEVIKMLSTDDKEKLLKTLKLEHHHHHH
>2kj4_A mol:protein length:87  plasminogen
YVEFSEECMHGSGENYDGKISKTMSGLECQAWDSQSPHAHGYIPSKFPNKNLKKNYCRNPDRDLRPWCFTTDPNKRWEYCDIPRCAA
>7s3d_G mol:protein length:782  Photosystem I P700 chlorophyll a apoprotein A1
MTASPPKRNQASAATEQSPIPTSFERWAKPGHFDRTLARGPKTTTWIWNLHADAHDFDSHTNDLQDISRKIFSAHFGHLAVVFVWLSGMYFHGARFSNFSSWMADPTHIRPSAQVVWPLVGQDILNGDMGGGFRGIQITSGLFQMWRGEGFTNEFQLYCTAIGALVMAGLMIFAGWFHYHVRSPKLEWFQNVQSMLNHHLAGLLGLGSLGWAGHLIHVALPTNKLLDAGVAPQDIPLPHEFVLDKALMAELYPSFAQGIRPFFTLNWATYSDFLTFNGGLNPVTGGLWMTDIAHHHVAIAVLFIFAGHMYRTNWGIGHSIRTMLEDARHPKMLPFLSFIGPVGHRGLFEVLTTSWHAQLSINLAMMGSLSIIVAQHMYSMPPYPYLATDYGTVTSLFTHHMWIGGFLIVGAAAHAGIFMVRDYDPAENVNNVLDRVLRHRDAIISHLVWVCQFLGFHSFAMYCHNDTMRAFGRPQDMFSDTGIQLQPIFAQWVQHIQTMAVGSAQVAEPLGDALGGIQNIALSGVGTTAPGVASPASYAFGGGLVAVGGKVAMMPISLGTADFLIHHIHAFTIHVTVLVLLKGVLFARNSRLIPDKSELGFRFPCDGPGRGGTCQVSAWDHVFLGLFWMYNSIAMVIFHFFWKMQSDVWGAVDANGTVSHITGGNFAQSSITINGWLRDFLWAQATQVISSYGSALSAYGLMFLAGHFVFAFSLMFLFSGRGYWQELIESIVWAHNKLRITTAIQPRALSITQGRAVGAAHYLLGSIVTTWAFFLARMAAIG
>1hqz_9 mol:protein length:141  ACTIN-BINDING PROTEIN
MALEPIDYTTHSREIDAEYLKIVRGSDPDTTWLIISPNAKKEYEPESTGSSFHDFLQLFDETKVQYGLARVSPPGSDVEKIIIIGWCPDSAPLKTRASFAANFAAVANNLFKGYHVQVTARDEDDLDENELLMKISNAAGA
>6fq5_H mol:protein length:95  Histone H2B
RKTRKESYAIYVYKVLKQVHPDTGISSKAMSIMNSFVNDVFERIAGEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKAVTKYTSA
>6ek5_L mol:protein length:205  Capsid protein
APMYRKPTMYRMYRSPDIPRGCEGPCKVQSFEQRDDVKHLGICKVISDVTRGPGLTHRVGKRFCIKSIYILGKIWLDETIKKQNHTNNVIFYLLRDRRPYGNAPQDFGQIFNMFDNEPSTATIKNDLRDRFQVLRKFHATVVGGLYCMKEQALVKRFYRLNHHVTYNHQEAGKYENHTENALLLYMACTHASNPVYATLKIRIYF
>6f7b_A mol:protein length:361  Mitotic checkpoint serine/threonine-protein kinase BUB1
GSSLGTVDAPNFIVGNPWDDKLIFKLLSGLSKPVSSYPNTFEWQCKLPAIKPKTEFQLGSKLVYVHHLLGEGAFAQVYEATQGDLNDAKNKQKFVLKVQKPANPWEFYIGTQLMERLKPSMQHMFMKFYSAHLFQNGSVLVGELYSYGTLLNAINLYKNTPEKVMPQGLVISFAMRMLYMIEQVHDCEIIHGDIKPDNFILGNGFLEQDDEDDLSAGLALIDLGQSIDMKLFPKGTIFTAKCETSGFQCVEMLSNKPWNYQIDYFGVAATVYCMLFGTYMKVKNEGGECKPEGLFRRLPHLDMWNEFFHVMLNIPDCHHLPSLDLLRQKLKKVFQQHYTNKIRALRNRLIVLLLECKRSRK
>3cic_A mol:protein length:390  Beta-secretase 1
GSFVEMVDNLRGKSGQGYYVEMTVGSPPQTLNILVDTGSSNFAVGAAPHPFLHRYYQRQLSSTYRDLRKGVYVPYTQGKWEGELGTDLVSIPHGPNVTVRANIAAITESDKFFINGSNWEGILGLAYAEIARPDDSLEPFFDSLVKQTHVPNLFSLQLCGAGFPLNQSEVLASVGGSMIIGGIDHSLYTGSLWYTPIRREWYYEVIIVRVEINGQDLKMDCKEYNYDKSIVDSGTTNLRLPKKVFEAAVKSIKAASSTEKFPDGFWLGEQLVCWQAGTTPWNIFPVISLYLMGEVTNQSFRITILPQQYLRPVEDVATSQDDCYKFAISQSSTGTVMGAVIMEGFYVVFDRARKRIGFAVSACHVHDEFRTAAVEGPFVTLDMEDCGYNI
>6qea_A mol:protein length:129  Lysozyme C
KVFGRCELAAAMKRHGLDNYRGYSLGNWVCAAKFESNFNTQATNRNTDGSTDYGILQINSRWWCNDGRTPGSRNLCNIPCSALLSSDITASVNCAKKIVSDGNGMNAWVAWRNRCKGTDVQAWIRGCRL
>4br6_A mol:protein length:197  SUPEROXIDE DISMUTASE
KATLPDLKYDYGALEPYISARIMELHHSKHHQTYVNGLNSALEATAEAEAKGDFTKAASLAPLLNFHGGGHLNHTLFWENLAPASREGGGEPDGALKKAIEADFGSFETFRKQMNAALTGIQGSGWAWLAKDKDSGNLAIVTRANQDPVTGQLVPLMGIDAWEHAYYLQYENRKAEYFEAIWNVINWKTVAQRFEKA
>4hpe_B mol:protein length:308  Putative cell wall hydrolase Tn916-like,CTn1-Orf17
GADSDDENSNFSSGITGMNLSAEVLKHQPMVEKYARENGISEYVNVLLAIIQVESGGTAEDVMQSSESLGLPPNSLDTESSIKQGCKYFASLLSSSKNQGIDDLNVAIQSYNYGGGYVGYVAGKGKKHTFNLAESFAREKSGGKKVTYTNPIAVAKNGGWRWNYGNMFYVELVNQYLTVPQVSGELAQKVMNEALKYQGWKYVYGGSNPNTSFDCSGLTQWCYGKAGISLPRTAQAQYDATQHLPLSQAKAGDLVFFHSTYNAGSYVTHVGIYVGNNQMYHAGDPIGYADLSSSYWQQHLIGAGRVKQ
>6c7g_A mol:protein length:342  cGMP-dependent 3',5'-cyclic phosphodiesterase
SAMDDEYTKLLHDGIQPVAAIDSNFASFTYTPRSLPEDDTSMAILSMLQDMNFINNYKIDCPTLARFCLMVKKGYRDPPYHNWMHAFSVSHFCYLLYKNLELTNYLEDIEIFALFISCMCHDLDHRGTNNSFQVASKSVLAALYSSEGSVMERHHFAQAIAILNTHGCNIFDHFSRKDYQRMLDLMRDIILATDLAHHLRIFKDLQKMAEVGYDRNNKQHHRLLLCLLMTSCDLSDQTKGWKTTRKIAELIYKEFFSQGDLEKAMGNRPMEMMDREKAYIPELQISFMEHIAMPIYKLLQDLFPKAAELYERVASNREHWTKVSHKFTIRGLPSNNSLDFLD
>6a83_A mol:protein length:394  Phosphoethanolamine transferase EptC
MGSSHHHHHHSSGLVPRGSHMYRQQLNSLTKLLNENNALPPLANFKDESGNEPRTLVLVIGESTQRGRMSLYGYPRETTPELDALHKTDPNLTVFNNVVTSRPYTIEILQQALTFANEKNPDLYLTQPSLMNMMKQAGYKTFWITNQQTMTARNTMLTVFSRQTDKQYYMNQQRTQSAREYDTNVLKPFQEVLNDPAPKKLIIVHLLGTHIKYKYRYPENQGKFDGNTDHVPPGLNAEELESYNDYDNANLYNDHVVASLIKDFKAANPNGFLVYFSDHGEEVYDTPPHKTQGRNEDNPTRHMYTIPFLLWTSEKWQATHPRDFSQDVDRKYSLAELIHTWSDLAGLSYDGYDPTRSVVNPQFKETTRWIGNPYKKNALIDYDTLPYGDQVGNQ
>4eqh_A mol:protein length:128  Histidine triad nucleotide-binding protein 1
SLMADEIAKAQVARPGGDTIFGKIIRKEIPAKIIFEDDRCLAFHDISPQAPTHFLVIPKKHISQISVAEDDDESLLGHLMIVGKKCAADLGLNKGYRMVVNEGSDGGQSVYHVHLHVLGGRQMHWPPG
>7mjk_F mol:protein length:244  Fab ab1 Heavy Chain
EVQLVESGGGLVQPGGSLRLSCAASGFTVSSNYMSWVRQAPGKGLEWVSVIYSGGSTYYADSVKGRFTISRHNSKNTLYLQMNSLRAEDTAVYYCARGYGDYYFDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTSGQAGHHHHHHGDYKDDDDKG
>5p35_A mol:protein length:330  endothiapepsin
STGSATTTPIDSLDDAYITPVQIGTPAQTLNLDFDTGSSDLWVFSSETTASEVDGQTIYTPSKSTTAKLLSGATWSISYGDGSSSSGDVYTDTVSVGGLTVTGQAVESAKKVSSSFTEDSTIDGLLGLAFSTLNTVSPTQQKTFFDNAKASLDSPVFTADLGYHAPGTYNFGFIDTTAYTGSITYTAVSTKQGFWEWTSTGYAVGSGTFKSTSIDGIADTGTTLLYLPATVVSAYWAQVSGAKSSSSVGGYVFPCSATLPSFTFGVGSARIVIPGDYIDFGPISTGSSSCFGGIQSSAGIGINIFGDVALKAAFVVFNGATTPTLGFASK
>3j3y_9P mol:protein length:231  capsid protein
PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIEPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVL
>2wq5_A mol:protein length:119  PHOSPHOLIPASE A2, ACIDIC
NLYQFKNMIKCTVPSRSWWDFADYGCYCGRGGSGTPVDDLDRCCQVHDNCYNEAEKISKCWPFFKTYSYKCSQGTLTCKGGNNACAASVCDCDRLAAICFAGAPYNDNNYNIDLKARCQ
>5ot7_H mol:protein length:127  30S ribosomal protein S9
EQYYGTGRRKEAVARVFLRPGNGKVTVNGQDFNEYFQGLVRAVAALEPLRAVDALGHFDAYITVRGGGKSGQIDAIKLGIARALVQYNPDYRAKLKPLGFLTRDARVVERKKYGKHKARRAPQYSKR
>3iml_D mol:protein length:399  S-adenosylmethionine synthetase
GPGSMANDYLFTSESVSEGHPDKVADQISDAILDAILAQDKYSRVAAETLCNTGLVVLAGEITTTANIDYIQIARDTIKRIGYDNTDYGIDYRGCAVLVAYDKQSPDIAQGVDRAHDNNLDQGAGDQGLMFGYACDETPELMPLPIHLSHRLVERQANLRRDGRLPWLRPDAKSQVTVRYVDGKPHSIDTVVLSTQHAPEIDLPALREAVIEEVIKPTLPADLIKGDIKFLVNPTGRFVIGGPQGDCGLTGRKIIVDTYGGAAPHGGGAFSGKDPSKVDRSAAYAGRYVAKNIVAAGLASRALIQVSYAIGVAEPTSVMVNTFGTGRVSDETITKLVREHFDLRPKGIIQMLDLLRPIYEKTAAYGHFGREEPEFSWEAADKALALAEAAGVEPAVQVA
>6gsl_H5 mol:protein length:60  50S ribosomal protein L30
MPRLKVKLVKSPIGYPKDQKAALKALGLRRLQQERVLEDTPAIRGNVEKVAHLVRVEVVE
>3j3q_4p mol:protein length:231  capsid protein
PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIEPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVL
>5u23_A mol:protein length:382  Putative aminotransferase
MGSSHHHHHHSSRNLYFQGGGHMFFLNLKQINDRFNTEFITKFKEILESGWYILGKQCEKFENNFAKYCGVKHCIGVANGLDALRLIIKAYDFKENDEIIVPANTYIASILAITDNKCKPILIEPDINTYNINPDLIEEKITKKTKAIMVVHLYGQVCDMEKIQLLANKYNLKIIEDCAQAHGAIYKDKRVGNLGDAAGFSFYPGKNLGALGDAGCICTNDDNFASKIRALANYGSHKKYENLYTGLNSRLDEIQAAFLDIKLKYLDEDNNKRKNIANFYLQNIKNENIILPSNKFDHVWHLFVVKTKLRDELQHYLNNHDIQTIIHYPIPPHKQKCYKDLNHLKLPITENIHQEVLSLPISPTMKENDFKKVADILNKWKV
>6i7v_C5 mol:protein length:45  50S ribosomal protein L36 2
MKVLNSLRTAKERHPDCQIVKRKGRLYVICKSNPRFKAVQGRKKK
>6mrc_2 mol:protein length:100  10 kDa heat shock protein, mitochondrial
GQAFRKFLPLFDRVLVERSAAETVTKGGIMLPEKSQGKVLQATVVAVGSGSKGKGGEIQPVSVKVGDKVLLPEYGGTKVVLDDKDYFLFRDGDILGKYVD
>5jw4_B mol:protein length:162  Hemagglutinin
GLFGAIAGFIEGGWQGMVDGWYGYHHSNEQGSGYAADKESTQKAIDGVTNKVNSIIDKMNTQFEAVGREFNNLERRIENLNKKMEDGFLDVWTYNAELLVLMENERTLDFHDSNVKNLYDKVRLQLRDNAKELGNGCFEFYHKCDNECMESVRNGTYDYPQY
>6rjh_P mol:protein length:171  Ferritin light chain
SQIRQNYSTEVEAAVNRLVNLYLRASYTYLSLGFYFDRDDVALEGVCHFFRELAEEKREGAERLLKMQNQRGGRALFQDLQKPSQDEWGTTLDAMKAAIVLEKSLNQALLDLHALGSAQADPHLCDFLESHFLDEEVKLIKKMGDHLTNIQRLVGSQAGLGEYLFERLTLK
>6ch9_G mol:protein length:518  Envelope glycoprotein gp120
MDAMKRGLCCVLLLCGAVFVSPSQEIHARFRRGARAAKKWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVLGNVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLNCNNVNTNNTNNSTNATISDWEKMETGEMKNCSFNVTTSIRDKIKKEYALFYKLDVVPLENKNNINNTNITNYRLINCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCNSKTFNGSGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEIVIRSENITDNAKTIIVQLNEAVEINCTRPNNNTRKSIHIGPGRAFYATGDIIGNIRQAHCNISKARWNETLGQIVAKLEEQFPNKTIIFNHSSGGDPEIVTHSFNCGGEFFYCNTTPLFNSTWNNTRTDDYPTGGEQNITLQCRIKQIINMWQGVGKAMYAPPIRGQIRCSSNITGLLLTRDGGRDQNGTETFRPGGGNMRDNWRSELYKYKVVKIEPLGIAPTACKRRVVQ
>1w76_B mol:protein length:543  ACETYLCHOLINESTERASE
DDHSELLVNTKSGKVMGTRVPVLSSHISAFLGIPFAEPPVGNMRFRRPEPKKPWSGVWNASTYPNNCQQYVDEQFPGFSGSEMWNPNREMSEDCLYLNIWVPSPRPKSTTVMVWIYGGGFYSGSSTLDVYNGKYLAYTEEVVLVSLSYRVGAFGFLALHGSQEAPGNVGLLDQRMALQWVHDNIQFFGGDPKTVTIFGESAGGASVGMHILSPGSRDLFRRAILQSGSPNCPWASVSVAEGRRRAVELGRNLNCNLNSDEELIHCLREKKPQELIDVEWNVLPFDSIFRFSFVPVIDGEFFPTSLESMLNSGNFKKTQILLGVNKDEGSFFLLYGAPGFSKDSESKISREDFMSGVKLSVPHANDLGLDAVTLQYTDWMDDNNGIKNRDGLDDIVGDHNVICPLMHFVNKYTKFGNGTYLYFFNHRASNLVWPEWMGVIHGYEIEFVFGLPLVKELNYTAEEEALSRRIMHYWATFAKTGNPNEPHSQESKWPLFTTKEQKFIDLNTEPMKVHQRLRVQMCVFWNQFLPKLLNATACDGELSS
>7tk0_O mol:protein length:195  ATP synthase subunit 5
ASKAAAPPPVRLFGVEGTYATALYQAAAKNSSIDAAFQSLQKVESTVKKNPKLGHLLLNPALSLKDRNSVIDAIVETHKNLDGYVVNLLKVLSENNRLGCFEKIASDFGVLNDAHNGLLKGTVTSAEPLDPKSFKRIEKALSASKLVGQGKSLKLENVVKPEIKGGLIVELGDKTVDLSISTKIQKLNKVLEDSI
>5ap8_C mol:protein length:166  TSR3
MKVYIIDYHKDDPKRCTGKKLVKLKIAEFTRVGKGVVLDPFAQITLSNKDKDIVRRIGITIVDTSWNNTSQSEFKNIRGEHRRIPILFAGNPIHYGIAYKLSSIEALIATLYIVDEVEEAIKLSNVVKWGHTFIELNKELLEAYKNKTEEDIKKIEREIIEKILEK
>5qfe_A mol:protein length:321  Tyrosine-protein phosphatase non-receptor type 1
MEMEKEFEQIDKSGSWAAIYQDIRHEASDFPSRVAKLPKNKNRNRYRDVSPFDHSRIKLHQEDNDYINASLIKMEEAQRSYILTQGPLPNTVGHFWEMVWEQKSRGVVMLNRVMEKGSLKCAQYWPQKEEKEMIFEDTNLKLTLISEDIKSYYTVRQLELENLTTQETREILHFHYTTWPDFGVPESPASFLNFLFKVRESGSLSPEHGPVVVHCSAGIGRSGTFCLADTCLLLMDKRKDPSSVDIKKVLLEMRKFRMGLIQTADQLRFSYLAVIEGAKFIMGDSSVQDQWKELSHEDLEPPPEHIPPPPRPPKRILEPHN
>5xhz_A mol:protein length:66  SH3 domain-containing kinase-binding protein 1
GPGSEFRRRRRCQVAFSYLPQNDDELELKVGDIIEVVGEVEEGWWEGVLNGKTGMFPSNFIKELSG
>5ndg_C7 mol:protein length:136  40S ribosomal protein S17-A
MGRVRTKTVKRASKALIERYYPKLTLDFQTNKRLCDEIATIQSKRLRNKIAGYTTHLMKRIQKGPVRGISFKLQEEERERKDQYVPEVSALDLSRSNGVLNVDNQTSDLVKSLGLKLPLSVINVSAQRDRRYRKRV
>5lzd_e mol:protein length:157  30S ribosomal protein S5
ELQEKLIAVNRVSKTVKGGRIFSFTALTVVGDGNGRVGFGYGKAREVPAAIQKAMEKARRNMINVALNNGTLQHPVKGVHTGSRVFMQPASEGTGIIAGGAMRAVLEVAGVHNVLAKAYGSTNPINVVRATIDGLENMNSPEMVAAKRGKSVEEILG
>5anb_E mol:protein length:136  60S RIBOSOMAL PROTEIN L23
MSKAQAVGSNYRVSLGLPVGAVMNSADNSGAKNLYVIAVKGIKGRLNRLPSAGVGDMVMATVKKGKPELRKKVCTGLVVRQRKHWKRKDGVYIYFEDNAGVMCNPKGEVKGNILGPVAKECSDLWPKVATNAGTIV
>6ydw_Bj mol:protein length:279  Mitochondrial ribosomal protein L46
MAAPVRRTMLRVVRGWRRFEGPWAHSLGSRNLALAVAPSSSSSPWRLLGALCLQRPPLVTKPLTPLQEEMADLLQQIEIERSLYSDHELRALDEAQQLAKKKSDLYEEEDEQNILLAQDLEDMWEQKFLHFKLGARLTEADKKDDRTSLHRKLDRNLILLVREKLGDQDIWMLPQSDWQPGETLRQTAERTLATLSENNMEAKFLGNAPCGHYKFKFPQAMRTETSLGAKVFFFKALLLTGDFSQAGKKGHHVWVSKEELGDYLKPKYLAQVRRFLLDL
>3jbt_N mol:protein length:105  Cytochrome c
MGDVEKGKKIFVQKCAQCHTVEKGGKHKTGPNLHGLFGRKTGQAPGFTYTDANKNKGITWKEETLMEYLENPKKYIPGTKMIFAGIKKKTEREDLIAYLKKATNE
>1htq_N mol:protein length:477  glutamine synthetase
TEKTPDDVFKLAKDEKVEYVDVRFCDLPGIMQHFTIPASAFDKSVFDDGLAFDGSSIRGFQSIHESDMLLLPDPETARIDPFRAAKTLNINFFVHDPFTLEPYSRDPRNIARKAENYLISTGIADTAYFGAEAEFYIFDSVSFDSRANGSFYEVDAISGWWNTGAATEADGSPNRGYKVRHKGGYFPVAPNDQYVDLRDKMLTNLINSGFILEKGHHEVGSGGQAEINYQFNSLLHAADDMQLYKYIIKNTAWQNGKTVTFMPKPLFGDNGSGMHCHQSLWKDGAPLMYDETGYAGLSDTARHYIGGLLHHAPSLLAFTNPTVNSYKRLVPGYEAPINLVYSQRNRSACVRIPITGSNPKAKRLEFRSPDSSGNPYLAFSAMLMAGLDGIKNKIEPQAPVDKDLYELPPEEAASIPQTPTQLSDVIDRLEADHEYLTEGGVFTNDLIETWISFKRENEIEPVNIRPHPYEFALYYDV
>1sor_A mol:protein length:235  Aquaporin-0
RSASFWRAIFAEFFATLFYVFFGLGASLRWAPGPLHVLQVALAFGLALATLVQAVGHISGAHVNPAVTFAFLVGSQMSLLRAICYVVAQLLGAVAGAAVLYSVTPPAVRGNLALNTLHPGVSVGQATIVEIFLTLQFVLCIFATYDERRNGRLGSVALAVGFSLTLGHLFGMYYTGAGMNPARSFAPAILTRNFTNHWVYWVGPVIGAGLGSLLYDFLLFPRLKSVSERLSILKG
>6dv5_A mol:protein length:205  Heat shock protein beta-1
MTERRVPFSLLRGPSWDPFRDWYPHSRLFDQAFGLPRLPEEWSQWLGGSSWPGYVRPLPPAAIESPAVAAPAYSRALSRQLSSGVSEIRHTADRWRVSLDVNHFAPDELTVKTKDGVVEITGKHEERQDEHGYISRCFTRKYTLPPGVDPTQVSSSLSPEGTLTVEAPMPKLATQSNEITIPVTFESRAQLGGPEAAKSDETAAK
>5dat_c1 mol:protein length:155  40S ribosomal protein S11-A
STELTVQSERAFQKQPHIFNNPKVKTSKRTKRWYKNAGLGFKTPKTAIEGSYIDKKCPFTGLVSIRGKILTGTVVSTKMHRTIVIRRAYLHYIPKYNRYEKRHKNVPVHVSPAFRVQVGDIVTVGQCRPISKTVRFNVVKVSAAAGKANKQFAKF
>1o1e_2 mol:protein length:375  SKELETAL MUSCLE ACTIN
DEDETTALVCDNGSGLVKAGFAGDDAPRAVFPSIVGRPRHQGVMVGMGQKDSYVGDEAQSKRGILTLKYPIEHGIITNWDDMEKIWHHTFYNELRVAPEEHPTLLTEAPLNPKANREKMTQIMFETFNVPAMYVAIQAVLSLYASGRTTGIVLDSGDGVTHNVPIYEGYALPHAIMRLDLAGRDLTDYLMKILTERGYSFVTTAEREIVRDIKEKLCYVALDFENEMATAASSSSLEKSYELPDGQVITIGNERFRCPETLFQPSFIGMESAGIHETTYNSIMKCDIDIRKDLYANNVMSGGTTMYPGIADRMQKEITALAPSTMKIKIIAPPERKYSVWIGGSILASLSTFQQMWITKQEYDEAGPSIVHRKCF
>5b02_A mol:protein length:343  MoeN5,DNA-binding protein 7d
MAHHHHHHVDDDDKMLAAEAANRDHVTRCVAQTGGSPDLVAHTAALRLYLRVPHFLTEWTTDPDRRAAVSRALALDIVSMKLLDDLMDDDTGLDRVELACVCLRLHLRALHELESLARDPKAVTDILEQDAVHLCGGQIRTKRSRATNLREWRAHASTYGSTFLGRYGALAAACGGEGQPADSVREFAEAFAMTITMADDLTDYDRNGERDGNLAHLMRTGAVAGQDVVDLLEELRGRALAAVAAPPGAPGLVPVVHLYTDDVLVRLLPRHLGEAGAGAMATVKFKYKGEEKEVDISKIKKVWRVGKMISFTYDEGGGKTGRGAVSEKDAPKELLQMLEKQKK
>6r4o_A mol:protein length:1533  Adenylate cyclase 9
MASPPHQQLLQHHSTEVSCDSSGDSNSVRVRINPKQPSSNSHPKHCKYSISSSCSSSGDSGGVPRRMGAGGRLRRRKKLPQLFERASSRWWDPKFDSVNLEEACMERCFPQTQRRFRYALFYIGFACLLWSIYFGVHMKSKLIVMVAPALCFLVVCVGFFLFTFTKLYARHYVWTSLVLTLLVFALTLAAQFQVLTPLSGRVDNFNHTRAARPTDTCLSQVGSFSMCIEVLFLLYTVMHLPLYLSLILGVAYSVLFETFGYHFQDEACFASPGAEALHWELLSRALLHLCIHAIGIHLFIMSQVRSRSTFLKVGQSIMHGKDLEVEKALKERMIHSVMPRIIADDLMKQGDEESENSVKRHATSSPKNRKKKSSIQKAPIAFRPFKMQQIEEVSILFADIVGFTKMSANKSAHALVGLLNDLFGRFDRLCEETKCEKISTLGDCYYCVAGCPEPRADHAYCCIEMGLGMIRAIEQFCQEKKEMVNMRVGVHTGTVLCGILGMRRFKFDVWSNDVNLANLMEQLGVAGKVHISEATAKYLDDRYEMEDGKVTERLGQSVVADQLKGLKTYLIAGQRAKESHCSCSEALLSGFEVLDGSRVSSGPRGQGTASPGSVSDLAQTVKTFDNLKTCPSCGITFTPKPEAGAEGGAVQNGCQEEPKNSAKASGGPSSKTQNGLLSPPPEEKLTNSQTSLCEILQEKGRWAGVSLDQSALLPLRFKNIREKTDAHFVDVIKEDSLMKDYFFKPPINQFSLNFLDPELERAYRTSYQEEVVKSSPVRTFASATFSSLLDVLLSTTVFLILSITCFLRYGAASTPPPPAALAVFGAALLLEILSLVVSVRMVFFLEDVMTCTKRLLEWIAGWLPRHFIGAILVSLPALAVYSHVTSEFETNIHSTMFTGSAVLTAVVQYCNFCQLSSWMRSSLATVVGAGPLLLLLYVSLCPDSSTVISHLDAVQNFSSTRKLCNASLPHDGRSPASLIGQEVILVFFLLLLLVWFLNREFEVSYRLHYHGDVEADLHRTKIQSMRDQADWLLRNIIPYHVAEQLKVSQTYSKNHDSGGVIFASIVNFSEFYEENYEGGKECYRVLNELIGDFDELLSKPDYSSIEKIKTIGATYMAASGLNATQCRDGSHPQEHLQILFEFAKEMMRVVDDFNNNMLWFNFKLRVGFNHGPLTAGVIGTTKLLYDIWGDTVNIASRMDTTGVECRIQVSEESYRVLSKMGYEFDYRGTVNVKGKGQMKTYLYPKCTDSGAAALEVLFQGPGGVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTFGYGLQCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSYQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKAASAWSHPQFEKGGGSGGGSGGSAWSHPQFEK
>7ac8_E mol:protein length:253  Imidazole glycerol phosphate synthase subunit HisF
MLAKRIIACLDVKDGRVVKGTNFENLRDSGDPVELGKFYSEIGIDELVFLDITASVEKRKTMLELVEKVAEQIDIPFTVGGGIHDFETASELILRGADKVSINTAAVENPSLITQIAQTFGSQAVVVAIDAKRVDGEFMVFTYSGKKNTGILLRDWVVEVEKRGAGEILLTSIDRDGTKSGYDTEMIRFVRPLTTLPIIASGGAGKMEHFLEAFLAGADAALAASVFHFREIDVRELKEYLKKHGVNVRLEGL
>7l88_D mol:protein length:498  BG505 SOSIP MD39 - gp120
MGILPSPGMPALLSLVSLLMGCVAETGAENLWVTVYYGVPVWKDAETTLFCASDAKAYETKKHNVWATHCCVPTDPNPQEIHLENVTEEFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLQCTNVTNNITDDMRGELKNCSFNMTTELRDKKQKVYSLFYRLDVVQINENQGNRSNNSNKEYRLINCNTSAITQACPKVSFEPIPIHYCAPAGFAILKCKDKKFNGTGPCPSVSTVQCTHGIKPVVSTQLLLNGSLAEEEVIIRSENITNNAKNILVQLNTPVQINCTRPNNNTVKSIRIGPGQWFYYTGDIIGDIRQAHCNVSKATWNETLGKVVKQLRKHFGNNTIIRFAQSSGGDLEVTTHSFNCGGEFFYCNTSGLFNSTWISNTSVQGSNSTGSNDSITLPCRIKQIINMWQRIGQAMYAPPIQGVIRCVSNITGLILTRDGGSTNSTTETFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTRCKR
>1v9w_A mol:protein length:130  putative 42-9-9 protein
GSEGAATMATFEEVSVLGFEEFDKAVKEHESKTIFAYFSGSKDTEGKSWCPDCVEAEPVIREGLKHVTEDCVFIYCQVGDKPYWKDPNNDFRQKLKITAVPTLLKYGTPQKLVESECCQSSLVEMIFSED
>7uck_M mol:protein length:138  60S ribosomal protein L14
VFRRFVEVGRVAYVSFGPHAGKLVAIVDVIDQNRALVDGPCTRVRRQAMPFKCMQLTDFILKFPHSARQKYVRKAWEKADINTKWAATRWAKKIEARERKAKMTDFDRYKVMKAKKMRNRIIKNEVKKLQRAALLKAS
>4v9j_BU mol:protein length:117  50S ribosomal protein L20
PRAKTGVVRRRKHKKILKLAKGYWGLRSKSFRKARETLFAAGNYAYAHRKRRKRDFRRLWIVRINAACRQHGLNYSTFIHGLKKAGIEVDRKNLADLAVREPQVFAELVERAKAAQG
>2cvl_D mol:protein length:124  protein translation initiation inhibitor
MEAVKTDRAPAAIGPYAQAVKAGGFVFVSGQIPLAPDGSLVEGDIRVQTERVMENLKAVLEAAGSGLSRVVQTTCFLADMEDFPGFNEVYARYFTPPYPARATVAVKALPRGVRVEVACVALAE
>1joj_R mol:protein length:8  HEXAPEPTIDE
XMYWYPYX
>6w83_A mol:protein length:312  Potassium channel subfamily K member 2
MSFSSKPTVLASRVESDSAINVMKWKTVSTIFLVVVLYLIIGATVFKALEQPQEISQRTTIVIQREKFLRAHPCVSDQELDELIQQIVAAINAGIIPLGASSNQVSHWDLGSSFFFAGTVITTIGFGNISPRTEGGKIFCIIYALLGIPLFGFLLAGVGDQLGTIFGKGIAKVEDTFIKWNVSQTKIRIISTIIFILFGCVLFVALPAVIFKHIEGWSALDAIYFVVITLTTIGFGDYVAGGSDIEYLDFYKPVVWFWILVGLAYFAAVLSMIGDWLRVIAKKTKEAVGEFRAHAAEWTANVTSNSLEVLFQ
>3ijj_B mol:protein length:114  Macrophage migration inhibitory factor
PMFIVNTNVPRASVPDGFLSELTQQLAQATGKPPQYIAVHVVPDQLMAFGGSSEPCALCSLHSIGKIGGAQNRSYSKLLCGLLAERLRISPDRVYINYYDMNAANVGWNNSTFA
>5c54_F mol:protein length:312  Dihydrodipicolinate synthase/N-acetylneuraminate lyase
MASATFTGVIPPVMTPLHADGSVDVESLRKLVDHLINGGVDGLFALGSSGEAAFLTRAQRKLALTTIIEHTAGRVPVTAGVIETTTARVIELVEDALEAGAEGLVATAPFYTRTHDVEIEEHFRKIHAAAPELPLFAYNIPVSVHSNLNPVMLLTLAKDGVLAGTKDSSGNDGAIRSLIEARDDAGLTEQFKILTGSETTVDFAYLAGADGVVPGLGNVDPAAYAALAKLCLDGKWAEAAALQKRINHLFHIVFVGDTSHMSGSSAGLGGFKTALAHLGIIESNAMAVPHQSLSDEETARIHAIVDEFLYTA
>6kuo_A mol:protein length:300  Poly(ethylene terephthalate) hydrolase
MGSSHHHHHHSSGLVPRGSHMRGPNPTAASLEASAGPFTVRSFTVSRPSGYGAGTVYYPTNAGGTVGAIAIVPGYTARQSSIKWWGPRLASHGFVVITIDTNSTLDQPSSRSSQQMAALRQVASLNGTSSSPIYGKVDTARMGVMGWSMGGGGSLISAANNPSLKAAAPQAPWDSSTNFSSVTVPTLIFACENDSIAPVNSSALPIYDSMSRNAKQFLEINGGSHSCANSGNSDQALIGKKGVAWMKRFMDNDTRYSTFACENPNSTRVSDFRTANCSLEDPAANKARKEAELAAATAEQ
>1dmh_B mol:protein length:311  CATECHOL 1,2-DIOXYGENASE
MEVKIFNTQDVQDFLRVASGLEQEGGNPRVKQIIHRVLSDLYKAIEDLNITSDEYWAGVAYLNQLGANQEAGLLSPGLGFDHYLDMRMDAEDAALGIENATPRTIEGPLYVAGAPESVGYARMDDGSDPNGHTLILHGTIFDADGKPLPNAKVEIWHANTKGFYSHFDPTGEQQAFNMRRSIITDENGQYRVRTILPAGYGCPPEGPTQQLLNQLGRHGNRPAHIHYFVSADGHRKLTTQINVAGDPYTYDDFAYATREGLVVDAVEHTDPEAIKANDVEGPFAEMVFDLKLTRLVDGVDNQVVDRPRLAV
>3j3q_53 mol:protein length:231  capsid protein
PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIEPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVL
>6q8y_BH mol:protein length:172  60S ribosomal protein L20-A
MAHFKEYQVIGRRLPTESVPEPKLFRMRIFASNEVIAKSRYWYFLQKLHKVKKASGEIVSINQINEAHPTKVKNFGVWVRYDSRSGTHNMYKEIRDVSRVAAVETLYQDMAARHRARFRSIHILKVAEIEKTADVKRQYVKQFLTKDLKFPLPHRVQKSTKTFSYKRPSTFY
>7wu9_S mol:protein length:255  scFv16
DVQLVESGGGLVQPGGSRKLSCSASGFAFSSFGMHWVRQAPEKGLEWVAYISSGSGTIYYADTVKGRFTISRDDPKNTLFLQMTSLRSEDTAMYYCVRSIYYYGSSPFDFWGQGTTLTVSSGGGGSGGGGSGGGGSDIVMTQATSSVPVTPGESVSISCRSSKSLLHSNGNTYLYWFLQRPGQSPQLLIYRMSNLASGVPDRFSGSGSGTAFTLTISRLEAEDVGVYYCMQHLEYPLTFGAGTKLELKGENLYFQ
>1rxo_H mol:protein length:475  RIBULOSE BISPHOSPHATE CARBOXYLASE/OXYGENASE
MSPQTETKASVGFKAGVKDYKLTYYTPEYETLDTDILAAFRVSPQPGVPPEEAGAAVAAESSTGTWTTVWTDGLTNLDRYKGRCYHIEPVAGEENQYICYVAYPLDLFEEGSVTNMFTSIVGNVFGFKALRALRLEDLRIPVAYVKTFQGPPHGIQVERDKLNKYGRPLLGCTIKPKLGLSAKNYGRAVYECLRGGLDFTKDDENVNSQPFMRWRDRFLFCAEALYKAQAETGEIKGHYLNATAGTCEDMMKRAVFARELGVPIVMHDYLTGGFTANTTLSHYCRDNGLLLHIHRAMHAVIDRQKNHGMHFRVLAKALRLSGGDHIHSGTVVGKLEGERDITLGFVDLLRDDYTEKDRSRGIYFTQSWVSTPGVLPVASGGIHVWHMPALTEIFGDDSVLQFGGGTLGHPWGNAPGAVANRVALEACVQARNEGRDLAREGNTIIREATKWSPELAAACEVWKEIKFEFPAMDTV
>6lkh_A mol:protein length:294  ABC transporter, solute-binding protein
NVLTVYSPYQSNLIRPILNEFEKQEHVKIEIKHGSTQVLLSNLHNEDFSERGDVFMGGVLSETIDHPEDFVPYQDTSVTQQLEDYRSNNKYVTSFLLMPTVIVVNSDLQGDIKIRGYQDLLQPILKGKIAYSNPNTTTTGYQHMRAIYSMHHRVSDVHQFQNHAMQLSKTSKVIEDVAKGKYYAGLSYEQDARTWKNKGYPVSIVYPIEGTMLNVDGIALVKNAHPHPKRKKLVQYLTSRSVQQRLVAEFDAKSIRKDVSEQSDQSIENLKNIPLIPKSKLPDIPHHKFLEMIQ
>2pnv_A mol:protein length:43  Small conductance calcium-activated potassium channel protein 2
GSHMNIMYDMISDLNERSEDFEKRIVTLETKLETLIGSIHALP
>5uyk_Q mol:protein length:80  30S ribosomal protein S17
KIRTLQGRVVSDKMEKSIVVAIERFVKHPIYGKFIKRTTKLHVHDENNECGIGDVVEIRECRPLSKTKSWTLVRVVEKAV
>7mtw_q mol:protein length:518  Capsid protein VP1
DGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
>7jg2_D mol:protein length:355  Igh protein
WGQGTLVTVSAESARNPTIYPLTLPPALSSDPVIIGCLIHDYFPSGTMNVTWGKSGKDITTVNFPPALASGGRYTMSSQLTLPAVECPEGESVKCSVQHDSNPVQELDVNCSGPTPPPPITIPSCQPSLSLQRPALEDLLLGSDASITCTLNGLRNPEGAVFTWEPSTGKDAVQKKAVQNSCGCYSVSSVLPGCAERWNSGASFKCTVTHPESGTLTGTIAKVTVNTFPPQVHLLPPPSEELALNELLSLTCLVRAFNPKEVLVRWLHGNEELSPESYLVFEPLKEPGEGATTYLVTSVLRVSAETWKQGDQYSCMVGHEALPMNFTQKTIDRLSGKPTNVSVSVIMSEGDGICY
>6boh_DA mol:protein length:54  50S ribosomal protein L33
MASEVRIKLLLECTECKRRNYATEKNKRNTPNKLELRKYCPWCRKHTVHREVKI
>6j3h_D mol:protein length:264  Glutathione S-transferase
GLVPRGSHMIQQIHFYDIPRNRDEDDRTWNPNTSKTRLTLTYKRLPYKTIWVEYPDIERVCKEIGAEPSAFGLLKEGKPYYSLPVIHDPNTGTTISDSIRIARYLDKTYPDTPAVIPAELEAFHAVFEDAFWDTIFMPLFPFLVPAACPQLNPRSEAYFRETREGKFGSILGGKMENWAPTGPVRDDRWKALQAGFTKMAGWLSADGQERPFFMGEKLCYTDIVVGAWLISVKKVFGSDHPEWLQVEKWDGGRWSRLVQVVENF
>3tty_C mol:protein length:675  Beta-galactosidase
MINEKFPKIWYGGDYNPEQWDKATMEEDMRMFNLAGIDVATVNVFSWAKIQRDEVSYDFTWLDDIIERLTKENIYLCLATSTGAHPAWMAKKYPDVLRVDYEGRKRKFGGRHNSCPNSPTYRKYAKILAGKLAERYKDHPQIVMWHVSNEYGGYCYCDNCEKQFRVWLKERYGTLEALNKAWNTSFWSHTFYDWDEIVAPNALSEEWSGNRTNFQGISLDYRRFQSDSLLECFKMERDELKRWTPDIPVTTNLMGFYPELDYFKWAKEMDVVSWDNYPSMDTPFSFTAMAHNLMRGLKSGQPFMLMEQTPGVQNWQPYNSAKRPGVMRLWSYQAVAHGADTVMFFQLRRSVGACEKYHGAVIEHVGHEHTRVFRECAELGKELQQLGDTILDARSEAKVAVMYDWENRWALELSSGPSIALNYVNEVHKYYDALYKQNIQTDMISVEEDLSKYKVVIAPVMYMVKPGFAERVERFVAQGGTFVTTFFSGIVNENDLVTLGGYPGELRNVMGIWAEEIDALLPGHQNEIVLRQDWGGLRGSYSCGILCDVIHAETAEVLAEYGADYYKGTPVLTRNKFGNGQSYYVASSPDADFLQGLIANLCEEQGVKPLLNTPDGVEVAERVKNGTSYLFVMNHNAEEMTFDAGASRQRDLLTGKTISGQATIPARGVMILERA
>4adj_C mol:protein length:473  E1 ENVELOPE GLYCOPROTEIN
EEAFTYLCTAPGCATQTPVPVRLAGVRFESKIVDGGCFAPWDLEATGACICEIPTDVSCEGLGAWVPTAPCARIWNGTQRACTFWAVNAYSSGGYAQLASYFNPGGSYYKQYHPTACEVEPAFGHSDAACWGFPTDTVMSVFALASYVQHPHKTVRVKFHTETRTVWQLSVAGVSCNVTTEHPFCNTPHGQLEVQVPPDPGDLVEYIMNYTGNQQSRWGLGSPNCHGPDWASPVCQRHSPDCSRLVGATPERPRLRLVDADDPLLRTAPGPGEVWVTPVIGSQARKCGLHIRAGPYGHATVEMPEWIHAHTTSDPWHPPGPLGLKFKTVRPVALPRALAPPRNVRVTGCYQCGTPALVEGLAPGGGNCHLTVNGEDVGAFPPGKFVTAALLNTPPPYQVSCGGESDRASARVIDPAAQSFTGVVYGTHTTAVSETRFEDDDDKAGWSHPQFEKGGGSGGGSGGGSWSHPQFEK
>5d80_F mol:protein length:517  V-type proton ATPase subunit B
MVLSDKELFAINKKAVEQGFNVKPRLNYNTVSGVNGPLVILEKVKFPRYNEIVNLTLPDGTVRQGQVLEIRGDRAIVQVFEGTSGIDVKKTTVEFTGESLRIPVSEDMLGRIFDGSGRPIDNGPKVFAEDYLDINGSPINPYARIYPEEMISTGVSAIDTMNSIARGQKIPIFSASGLPHNEIAAQICRQAGLVRPTKDVHDGHEENFSIVFAAMGVNLETARFFKQDFEENGSLERTSLFLNLANDPTIERIITPRLALTTAEYLAYQTERHVLTILTDMSSYADALREVSAAREEVPGRRGYPGYMYTDLSTIYERAGRVEGRNGSITQIPILTMPNDDITHPIPDLTGYITEGQIFVDRQLHNKGIYPPINVLPSLSRLMKSAIGEGMTRKDHGDVSNQLYAKYAIGKDAAAMKAVVGEEALSIEDKLSLEFLEKFEKTFITQGAYEDRTVFESLDQAWSLLRIYPKEMLNRISPKILDEFYDRARDDADEDEEDPDTRSSGKKKDASQEESLI
>5fxy_H mol:protein length:85  METASTASIS-ASSOCIATED PROTEIN MTA1
GAAMKTRQAFYLHTTKLTRIARRLCREILRPWHAARHPYLPINSAAIKAECTARLPEASQSPLVLKQAVRKPLEAVLRYLETHPR
>1gav_5 mol:protein length:129  BACTERIOPHAGE GA PROTEIN CAPSID
ATLRSFVLVDNGGTGNVTVVPVSNANGVAEWLSNNSRSQAYRVTASYRASGADKRKYTIKLEVPKIVTQVVNGVELPVSAWKAYASIDLTIPIFAATDDVTVISKSLAGLFKVGNPIAEAISSQSGFYA
>6zkb_k mol:protein length:355  NADH dehydrogenase [ubiquinone] 1 alpha subcomplex subunit 10, mitochondrial
MALRFLRLVPASAASRGLAAVPPRVGGIHTSVQRKLQYGPLAYILGEKTTKKMTENSKLITVDGNICSGKSKLAKEVAEKLGLKHFPEAGIHYADSTTGDGKPLPVRFSGNCSLEKFYDDPKSNDGNSYRLQAWLYASRLLQYADALEHLLSTGQGVVLERSIYSDFVFLEAMYRQGFIRKQCVDHYNQVKKVTVCEYLPPHVVIYVDVPVSEVQSRIQKKGNPHEMKITSAYLQDIENVYKGTFLPEMSEKCEVLQYSAWEAEDAEKVVEDIQYLKYDKGPWLDQDDRKLHNLRMLVQDKLEVLNYTSIPVFLPEVTIGAHQSDRVFQEFTELPGRKYRAGYNEDVGDKWIWLK
>3kts_A mol:protein length:192  Glycerol uptake operon antiterminator regulatory protein
MSLELPFSNQSIIPAAHNQKDMEKILELDLTYMVMLETHVAQLKALVKYAQAGGKKVLLHADLVNGLKNDDYAIDFLCTEICPDGIISTRGNAIMKAKQHKMLAIQRLFMIDSSAYNKGVALIQKVQPDCIELLPGIIPEQVQKMTQKLHIPVIAGGLIETSEQVNQVIASGAIAVTTSNKHLWEGHHHHHH
>1tqb_C mol:protein length:219  VRQ14 Fab light chain
DVVMSQTPLTLSVTIGQPASISCKSSQSLLDSDGKTYLNWLLQRPGQSPKRLIYLVSRLDSGVPDRFTGSGSGTDFTLKISRVEAEDLGIYFCWQGSHFPQTFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYPKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKSFNRNEC
>5tbw_l mol:protein length:361  60S ribosomal protein L4-A
SRPQVTVHSLTGEATANALPLPAVFSAPIRPDIVHTVFTSVNKNKRQAYAVSEKAGHQTSAESWGTGRAVARIPRVGGGGTGRSGQGAFGNMCRGGRMFAPTKTWRKWNVKVNHNEKRYATASAIAATAVASLVLARGHRVEKIPEIPLVVSTDLESIQKTKEAVAALKAVGAHSDLLKVLKSKKLRAGKGKYRNRRWTQRRGPLVVYAEDNGIVKALRNVPGVETANVASLNLLQLAPGAHLGRFVIWTEAAFTKLDQVWGSETVASSKVGYTLPSHIISTSDVTRIINSSEIQSAIRPAGQATQKRTHVLKKNPLKNKQVLLRLNPYAKVFAAEKLGSKKAEKTGTKPAAVFTETLKHD
>2z6i_B mol:protein length:332  Trans-2-enoyl-ACP reductase II
MKTRITELLKIDYPIFQGGMAWVADGDLAGAVSKAGGLGIIGGGNAPKEVVKANIDKIKSLTDKPFGVNIMLLSPFVEDIVDLVIEEGVKVVTTGAGNPSKYMERFHEAGIIVIPVVPSVALAKRMEKIGADAVIAEGMEAGGHIGKLTTMTLVRQVATAISIPVIAAGGIADGEGAAAGFMLGAEAVQVGTRFVVAKESNAHPNYKEKILKARDIDTTISAQHFGHAVRAIKNQLTRDFELAEKDAFKQEDPDLEIFEQMGAGALAKAVVHGDVDGGSVMAGQIAGLVSKEETAEEILKDLYYGAAKKIQEEASRWTGVVRNDLEHHHHHH
>6o7a_B mol:protein length:554  Ion channel CASTOR
MAKGKSEVVEQNHTLILGWSDKLGSLLNQLAIANESLGGGTIAVMAERDKEDMELDIGKMEFDFKGTSVICRSGSPLILADLKKVSVSKARTIIVLAEDGNADQSDARALRTVLSLTGVKEGLRGHIVVEMSDLDNEVLVKLVGGDLVETVVAHDVIGRLMIQCARQPGLAQIWEDILGFENCEFYIKRWPQLDGMLFEDVLISFPAAIPCGIKVASYGGKIILNPDDSYVLQEGDEVLVIAEDDDTYAPAPLPMVRRGSLPKDFVYPKSPERILFCGWRRDMEDMITVLDASLAPDSELWMFNDVPEKEREKKLIDGGLDISRLENISLVNREGNAVIRRHLESLPLESFDSILILADESVEDSAIQADSRSLATLLLIRDIQARRLPYVAMASQTQGGNFSKGSWIGEMKQASDKTVIISEILDPRTKNLLSMSKISDYVLSNELVSMALAMVAEDRQINDVLEELFAEEGNEMHIRQADIYLREGEEMSFYEIMLRARQRREILIGYRLANAERAVINPPAKTGRRKWSLKDVFVVITEKEGSRSHHHHHH
>3j3q_6T mol:protein length:231  capsid protein
PIVQNLQGQMVHQAISPRTLNAWVKVVEEKAFSPEVIPMFSALSEGATPQDLNTMLNTVGGHQAAMQMLKETINEEAAEWDRLHPVHAGPIEPGQMREPRGSDIAGTTSTLQEQIGWMTHNPPIPVGEIYKRWIILGLNKIVRMYSPTSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPAATLEEMMTACQGVGGPGHKARVL
>7ls9_G mol:protein length:215  1-57 Fab light chain
EIVLTQSPGTLSLSPGERATLSCRASQSVSSSYLAWYQQKPGQAPRLLIYGASSRATGIPDRFSGSGSGTDFTLTISRLEPEDFAVYYCQQYGSSPSTFGQGTKLEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC
>2v2z_A mol:protein length:271  4-DIPHOSPHOCYTIDYL-2C-METHYL-D-ERYTHRITOL KINASE
GSHMIKVLSPAKINLGLWVLGRLPSGYHEILTLYQEIPFYDEIYIREGVLRVETNIGIPQEENLVYKGLREFERITGIEINYSIFIQKNIPPGAGLGGGSSNLAVVLKKVNELLGSPLSEEELRELVGSISADAPFFLLGKSAIGRGKGEVLEPVETEISGKITLVIPQVSSSTGRVYSSLREEHFVTPEYAEEKIQRIISGEVEEIENVLGDIARELYPEINEVYRFVEYLGFKPFVSGSGSTVYFFGGASEELKKAAKMRGWKVVELEL
>2jhu_B mol:protein length:138  RHO GDP-DISSOCIATION INHIBITOR 1
AMVPNVVVTGLTLVCSSAPGPLELDLTGDLESFKKQSFVLKEGVEYRIKISFRVNREIVSGMKYIQHTYRKGVKIDKTDYMVGSYGPRAAAYEFLTPVEEAPKGMLARGSYSIKSRFTDDDKTDHLSWEWNLTIKKDW
>6bet_A mol:protein length:12  H(DPR)(DVA)CIP(DPR)E(DLY)VC(DGL)
HPVCIPPEKVCE
>7r3v_D mol:protein length:239  Cytochrome c1, heme protein, mitochondrial
DLELHPPSYPWSHRGLLSSLDHTSIRRGFQVYKQVCSSCHSMDYVAYRHLVGVCYTEDEAKALAEEVEVQDGPNEDGEMFMRPGKLSDYFPKPYPNPEAARAANNGALPPDLSYIVRARHGGEDYVFSLLTGYCEPPTGVSLREGLYFNPYFPGQAIGMAPPIYNEVLEFDDGTPATMSQVAKDVCTFLRWAAEPEHDHRKRMGLKMLLMMGLLLPLVYAMKRHKWSVLKSRKLAYRPP
>3e21_A mol:protein length:45  FAS-associated factor 1
GSMDREMILADFQACTGIENIDEAITLLEQNNWDLVAAINGVIPQ
>6gcv_C mol:protein length:146  Chemotaxis transducer
SGLVPAGSHMYLSMSISPETINVAGAQRMLSQKMAREALQLRLGAGDPKALAATIAQYERSAADLDAGNAERNVSRMGAPEIAAQRQKVAQIWGRYRAMLDQVAQPASQVDLRGFSQYSTELLGELNNLVSLMSARADSVQHTQMW
>6ev1_A mol:protein length:220  Heavy chain
EVQLQQSGAELAKPGASVKMSCKASGYTFTSYWMHWVKQRPGQGLEWIGYINPSTGYTEYNQKFKDKATLTADKSSSTAYMQLSSLTSEDSAVYYCAPLWPLGTDYWGQGTTLTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSC
>6pbz_D mol:protein length:494  Guanosine-5'-triphosphate,3'-diphosphate pyrophosphatase
MGSTSSLYAAIDLGSNSFHMLVVREVAGSIQTLTRIKRKVRLAAGLNSENALSNEAMERGWQCLRLFAERLQDIPPSQIRVVATATLRLAVNAGDFIAKAQEILGCPVQVISGEEEARLIYQGVAHTTGGADQRLVVDIGGASTELVTGTGAQTTSLFSLSMGCVTWLERYFADRNLGQENFDAAEKAAREVLRPVADELRYHGWKVCVGASGTVQALQEIMMAQGMDERITLEKLQQLKQRAIHCGRLEELEIDGLTLERALVFPSGLAILIAIFTELNIQCMTLAGGALREGLVYGMLHLAVEQDIRSRTLRNIQRRFMIDIDQAQRVAKVAANFFDQVENEWHLEAISRDLLISACQLHEIGLSVDFKQAPQHAAYLVRNLDLPGFTPAQKKLLATLLLNQTNPVDLSSLHQQNAVPPRVAEQLCRLLRLAIIFASRRRDDLVPEMTLQANHELLTLTLPQGWLTQHPLGKEIIAQESQWQSYVHWPLEVH
>5k00_A mol:protein length:335  Maternal embryonic leucine zipper kinase
MDYDELLKYYELHETIGTGGFAKVKLACHILTGEMVAIKIMDKNTLGSDLPRIKTEIEALKNLRHQHICQLYHVLETANKIFMVLEYCPGGELFDYIISQDRLSEEETRVVFRQIVSAVAYVHSQGYAHRDLKPENLLFDEYHKLKLIDFGLCAKPKGNKDYHLQTCCGSLAYAAPELIQGKSYLGSEADVWSMGILLYVLMCGFLPFDDDNVMALYKKIMRGKYDVPKWLSPSSILLLQQMLQVDPKKRISMKNLLNHPWIMQDYNYPVEWQSKNPFIHLDDDCVTELSVHHRNNRQTMEDLISLWQYDHLTATYLLLLAKKARGKPVHHHHHH
>7xtb_R mol:protein length:584  Soluble cytochrome b562,5-hydroxytryptamine receptor 6
DYKDDDDAKLQTMHHHHHHHHHHHHHHHADLEDNWETLNDNLKVIEKADNAAQVKDALTKMRAAALDAQKATPPKLEDKSPDSPEMKDFRHGFDILVGQIDDALKLANEGKVKEAQAAAEQLKTTRNAYIQKYLASENLYFQGGTVPEPGPTANSTPAWGAGPPSAPGGSGWVAAALCVVIALTAAANSLLIALICTQPALRNTSNFFLVSLFTSDLMVGLVVMPPAMLNALYGRWVLARGLCLLWTAFDVMCCSASILNLCLISLDRYLLILSPLRYKLRMTPLRALALVLGAWSLAALASFLPLLLGWHELGHARPPVPGQCRLLASLPFVLVASGLTFFLPSGAICFTYCRILLAARKQAVQVASLTTGMASQASETLQVPRTPRPGVESADSRRLATKHSRKALKASLTLGILLGMFFVTWLPFFVANIVQAVCDCISPGLFDVLTWLGYCNSTMNPIIYPLFMRDFKRALGRFLPCPRCPRERQASLASPSLRTSHSGPRPGLSLQQVLPLPLPPDSDSDSDAGSGGSSGLRLTAQLLLPGEATQDPPLPTRAAAAVNFFNIDPAEPELRPHPLGIPTN
>6y35_C mol:protein length:119  CCAAT-binding factor complex subunit HapE
MGTWANVNQGLQGTARDILTTYWQHIINHLESDNHDYKIHQLPLARIKKVMKADPEVKMISAEAPILFAKGCDIFITELTMRAWIHAEDNKRRTLQRSDIAAALSKSDMFDFLIDIVPR
>1bcf_L mol:protein length:158  BACTERIOFERRITIN
MKGDTKVINYLNKLLGNELVAINQYFLHARMFKNWGLKRLNDVEYHESIDEMKHADRYIERILFLEGLPNLQDLGKLNIGEDVEEMLRSDLALELDGAKNLREAIGYADSVHDYVSRDMMIEILRDEEGHIDWLETELDLIQKMGLQNYLQAQIREEG
>3oqm_A mol:protein length:339  Catabolite control protein A
MNITIYDVAREANVSMATVSRVVNGNPNVKPTTRKKVLEAIERLGYRPNAVARGLASKKTTTVGVIIPDISSIFYSELARGIEDIATMYKYNIILSNSDQNMEKELHLLNTMLGKQVDGIVFMGGNITDEHVAEFKRSPVPIVLAASVEEQEETPSVAIDYEQAIYDAVKLLVDKGHTDIAFVSGPMAEPINRSKKLQGYKRALEEANLPFNEQFVAEGDYTYDSGLEALQHLMSLDKKPTAILSATDEMALGIIHAAQDQGLSIPEDLDIIGFDNTRLSLMVRPQLSTVVQPTYDIGAVAMRLLTKLMNKEPVEEHIVELPHRIELRKSTKSHHHHHH
>6epf_4 mol:protein length:201  Proteasome subunit beta type-2
MEYLIGIQGPDYVLVASDRVAASNIVQMKDDHDKMFKMSEKILLLCVGEAGDTVQFAEYIQKNVQLYKMRNGYELSPTAAANFTRRNLADCLRSRTPYHVNLLLAGYDEHEGPALYYMDYLAALAKAPFAAHGYGAFLTLSILDRYYTPTISRERAVELLRKCLEELQKRFILNLPTFSVRVIDKDGIHNLENITFTKRSS
>6t7g_CCC mol:protein length:674  Glyco_hydro_42M domain-containing protein
MGSSHHHHHHSSGLEVLFQGPAERISKQSTPFVGAQIFIEPGQTQEQIEQWFKLLAESNMTTCRIRMFGKYMKTPSGTYDFTLFDRAFKLADKYHIKVYATLFPDTEFTDVGGFKFPHSREHQKEVEDYIKNVVSHFSQYKNLAAWVLINEPGTPNLPFNEPFTKERFSDWKKEHNFSEYNEKGYPVLNFEKENFIIDYHNWYLNWLANQVRLYDKQHDLHVNPHNVFKLSGLYDFPTWRTFLNSLGGSAHASWHFGYFPRKAYTVAMSANAELIRSGAGELPWLMTELQGGNNLYSGANPLCPTAEEIIQWLWINFATEAKGGIFWSFNARSTAAEAGEWAMINFKNKSSDRLIAAATIGKFITENVKMMSNIKTLNSGISILYNHESMWVEAAQTRGKLNGNGRSIGAVMCSPLSYFEALSETGLQANFKEIKEFDFSLNDYTDQVIILSHQIALDNKVIKQLESFVEKGGTLIADGLTGYYDYQAHSTVVSGFALENLFGSYPIEYKIKENLFSLDFEKDNYKLPAHLWKGTIETSKATPIMDKEGECIACINQYGKGKVFWIPSPIALGARESKDFSELSKLTVSLLPNKILNDNPHFDKHYKDVMMKSFKSNGTMYSLIINKSASVQTVDIVGGKGKAFILFANKNAHSTANKLTISPEETVIIKWKNN
>5ysl_F mol:protein length:215  1H1 light chain
DIILTQSPAIMSASLGERVTLTCTASSSVSSSYLHWYQQKPGSSPKLWIYSTYNLAGAVPPRFSGSGSGTSYSLTISSMEAEDAATYYCQQYHRSPWTFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYPKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKNFNRNEC
>5ydz_C mol:protein length:580  mammalian endo-lysosomal TRPML1 channel
MATPAGRRASETERLLTPNPGYGTQVGTSPAPTTPTEEEDLRRRLKYFFMSPCDKFRAKGRKPCKLMLQVVKILVVTVQLILFGLSNQLVVTFREENTIAFRHLFLLGYSDGSDDTFAAYTQEQLYQAIFYAVDQYLILPEISLGRYAYVRGGGGPWANGSALALCQRYYHRGHVDPANDTFDIDPRVVTDCIQVDPPDRPPDIPSEDLDFLDGSASYKNLTLKFHKLINVTIHFQLKTINLQSLINNEIPDCYTFSILITFDNKAHSGRIPIRLETKTHIQECKHPSVSRHGDNSFRLLFDVVVILTCSLSFLLCARSLLRGFLLQNEFVVFMWRRRGREISLWERLEFVNGWYILLVTSDVLTISGTVMKIGIEAKNLASYDVCSILLGTSTLLVWVGVIRYLTFFHKYNILIATLRVALPSVMRFCCCVAVIYLGYCFCGWIVLGPYHVKFRSLSMVSECLFSLINGDDMFVTFAAMQAQQGHSSLVWLFSQLYLYSFISLFIYMVLSLFIALITGAYDTIKHPGGTGTEKSELQAYIEQCQDSPTSGKFRRGSGSACSLFCCCGRDSPEDHSLLVN
>6gqv_AF mol:protein length:124  40S ribosomal protein S15
KKRVFKTHSYRGVDLEKLLEMSTEDFVKLAPARVRRRFARGMTSKPAGFMKKLRAAKLAAPENEKPAPVRTHMRNMIIVPEMIGSVVGIYNGKAFNQVEIRPEMLGHYLGEFSITYTPVRHGRA
>3is7_S mol:protein length:158  Bacterioferritin
MKGDKKVIQHLNKILGNELIAINQYFLHSRMWNDWGLKRLGAHEYHESIDEMKHADKLIERILFLEGLPNLQDLGKLLIGENTQEMLQCDLNLELKATKDLREAIVHCEQVHDYVSRDLLKDILESEEEHIDYLETQLGLIQKVGLENYLQSHMHEDD
>3g5f_A mol:protein length:396  Cytochrome P450 121
MTATVLLEVPFSARGDRIPDAVAELRTREPIRKVRTITGAEAWLVSSYALCTQVLEDRRFSMKETAAAGAPRLNALTVPPEVVNNMGNIADAGLRKAVMKAITPKAPGLEQFLRDTANSLLDNLITEGAPADLRNDFADPLATALHCKVLGIPQEDGPKLFRSLSIAFMSSADPIPAAKINWDRDIEYMAGILENPNITTGLMGELSRLRKDPAYSHVSDELFATIGVTFFGAGVISTGSFLTTALISLIQRPQLRNLLHEKPELIPAGVEELLRINLSFADGLPRLATADIQVGDVLVRKGELVLVLLEGANFDPEHFPNPGSIELDRPNPTSHLAFGRGQHFCPGSALGRRHAQIGIEALLKKMPGVDLAVPIDQLVWRTRFQRRIPERLPVLW
>6wdh_l mol:protein length:143  50S ribosomal protein L15
RLNTLSPAEGSKKAGKRLGRGIGSGLGKTGGRGHKGQKSRSGGGVRRGFEGGQMPLYRRLPKFGFTSRKAAITAEIRLSDLAKVEGGVVDLNTLKAANIIGIQIEFAKVILAGEVTTPVTVRGLRVTKGARAAIEAAGGKIEE
>3ej7_D mol:protein length:70  Beta-subunit of trans-3-chloroacrylic acid dehalogenase
PFIECHIATGLSVARKQQLIRDVIDVTNKSIGSDPKIINVLLVEHAEANMSISGRIHGEAASTERTPAVS
>5t5h_e mol:protein length:245  60S ribosomal protein L2
GKTVLTCRKGNGSIYQVHGHKRLGPAKLRILDYAERHGFMRGVVKTIEHEPGRGAPLARVEFRHPYKYRRVKELMVAPEGMFTGQSVLCGVKAPLAIGNVLPLGQITEGCIVCNVEAKVGDRGTIARASGDYCIIISHNHETGRTRLKLPSGQKKTVPSNCRAMIGIIAGGGRIEKPVLKAGNSFYRFRGKRNCWPKVRGVARNPVEHPHGGGNHQHIGHPSTVSRHAPPGQKVGLIAARRTGRI
>6nsh_XJ mol:protein length:105  30S ribosomal protein S10
MPKIRIKLRGFDHKTLDASAQKIVEAARRSGAQVSGPIPLPTRVRRFTVIRGPFKHKDSREHFELRTHNRLVDIINPNRKTIEQLMTLDLPTGVEIEIKTVGGGR
>5lnn_A mol:protein length:206  Histidine kinase CKI1
GSSHHHHHHSSGLVPRGSHMASTDSESETRVKSVRTGRKPIGNPEDEQETSKPSDDEFLRGKRVLVVDDNFISRKVATGKLKKMGVSEVEQCDSGKEALRLVTEGLTQREEQGSVDKLPFDYIFMACQMPEMDGYEATREIRKVEKSYGVRTPIIAVSGHDPGSEEARETIQAGMDAFLDKSLNQLANVIREIESKRHLEHHHHHH
>2qxu_A mol:protein length:179  Lipase
HNPVVMVHGIGGASFNFAGIKSYLVSQGWSRDKLYAVDFWDKTGTNYNNGPVLSRFVQKVLDETGAKKVDIVAHSMGGANTLYYIKNLDGGNKVANVVTLGGANRLTTGKALPGTDPNQKILYTSIYSSADMIVMNYLSRLDGARNVQIHGVGHIGLLYSSQVNSLIKEGLNGGGQNTN
>1kyo_A mol:protein length:430  UBIQUINOL-CYTOCHROME C REDUCTASE COMPLEX CORE PROTEIN I
AEVTQLSNGIVVATEHNPAHTASVGVVFGSGAANENPYNNGVSNLWKNIFLSKENSAVAAKEGLALSSNISRDFQSYIVSSLPGSTDKSLDFLNQSFIQQKANLLSSSNFEATKKSVLKQVQDFEDNDHPNRVLEHLHSTAFQNTPLSLPTRGTLESLENLVVADLESFANNHFLNSNAVVVGTGNIKHEDLVNSIESKNLSLQTGTKPVLKKKAAFLGSEVRLRDDTLPKAWISLAVEGEPVNSPNYFVAKLAAQIFGSYNAFEPASRLQGIKLLDNIQEYQLCDNFNHFSLSYKDSGLWGFSTATRNVTMIDDLIHFTLKQWNRLTISVTDTEVERAKSLLKLQLGQLYESGNPVNDANLLGAEVLIKGSKLSLGEAFKKIDAITVKDVKAWAGKRLWDQDIAIAGTGQIEGLLDYMRIRSDMSMMRW
>7dbn_D mol:protein length:444  HIV-1 RT p51 subunit
MAHHHHHHALEVLFQGPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKQKKSVTVLDVGDAYFSVPLDKDFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYAGIKVRQLSKLLRGTKALTEVVPLTEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMKGAHTNDVKQLTEAVQKIATESIVIWGKTPKFKLPIQKETWEAWWTEYWQATWIPEWEFVNTPPLVKLWYQ
>7unu_Q mol:protein length:116  50S ribosomal protein L18
MSVKKETRLRRARKARLKMRELETVRLCVYRSSQHIYAQVIAADGGKVLASASTLDKDLREGATGNIDAAKKVGQLVAERAKAAGVTQVAFDRSGFKYHGRVKALADAAREGGLEF
>7lst_A mol:protein length:800  Pullulanase
MRTTKKIVSAVLAACMLASTAVVSSFAATADDSSAVSSDYARDNSYTKAAEDIDAQYAYSGNDLGVTYTKDATTFKVWSPTATGVKLNIFTKGSDDEQGASKVASYTLEKMLVDGEWNGVWTITLVGEWKDYYYTYSVTTTDTTHIGSDATKTYETQDVYSTATGVNGKRSMIVDLDETDPEGWSNDSHVLLDKSTKSSVWELHIKDFSYDKASGVSDANRGKYLAFTENGTTLNGEGKVSTCIDYLKELGVTTVQLNPFYDFQSVNEAGDDSQFNWGYDPVNYNVPEGSYSSNPYDGKVRIKECKEMIKALHDAGISVVMDVVYNHTYSTDSCFQYTVPNYYYRMKTTGAFSDGSGCGNEGATERAMYRQYVIDSLKYWVNEYHVDGFRFALMGLMDVETMNMAREALDQIDPRITMWGEGWAGGDSYHPTNTCSGTKFYPATQANASRLSDRIAIFNDGIRDGIKGSAMDISDVGFIQGSKSSAKGVSYGVRANSSGTYKWKAQAPSQCVTYDACHDNATLYDQIIASTGLADYGERNSEAVKMNRLASAIIYTSQGISFTLAGEEMARSKDGDTNSYKSAANLNMIKWQNVVDYADVVSYYKGMMQIKSAFSPLTAMDNSYADKYTFTKKVSASTNQISFTIQNDVEGEWNKMAVIYNNATTAADVTLSDTSVTDWVVIANGETAGLDSLGEVTGSTFTVPARSAIVAVDKAGYESAGIHSSKGKVKVNYVYEATGEKLEDSVILQGSVGSGYVTVPSAVIPDTYIVSRIGGNAEGKYTSDMQEVTYYYTDYIPESL
>4z9k_B mol:protein length:116  VHH2(F5) antibody
VQLVESGGGLVQPGGSLRLSCAASGFTLDDYAIGWFRQVPGKEREGVACVKDGSTYYADSVKGRFTISRDNGAVYLQMNSLKPEDTAVYYCASRPCFLGVPLIDFGSWGQGTQVTV
>7vnr_G mol:protein length:1049  Potassium voltage-gated channel subfamily KQT member 4,Maltodextrin-binding protein
MDYKDDDDKAEAPPRRLGLGPPPGDAPRAELVALTAVQSEQGEAGGGGSPRRLGLLGSPLPPGAPLPGPGSGSGSACGQRSSAAHKRYRRLQNWVYNVLERPRGWAFVYHVFIFLLVFSCLVLSVLSTIQEHQELANECLLILEFVMIVVFGLEYIVRVWSAGCCCRYRGWQGRFRFARKPFCVIDFIVFVASVAVIAAGTQGNIFATSALRSMRFLQILRMVRMDRRGGTWKLLGSVVYAHSKELITAWYIGFLVLIFASFLVYLAEKDANSDFSSYADSLWWGTITLTTIGYGDKTPHTWLGRVLAAGFALLGISFFALPAGILGSGFALKVQEQHRQKHFEKRRMPAANLIQAAWRLYSTDMSRAYLTATWYYYDSILPSFRELALLFEHVQRARNGGLRPLEVRRAPVPDGAPSRYPPVATCHRPGSTSFCPGESSRMGIKDRIRMGSSQRRTGPSKQHLAPPTMPTSPSSEQVGEATSPTKVQKSWSFNDRTRFRASLRLKPRTSAEDAPSEEVAEEKSYQCELTVDDIMPAVKTVIRSIRILKFLVAKRKFKETLRPYDVKDVIEQYSAGHLDMLGRIKSLQTRVDQIVGRGPGDRKAREKGDKGPSDAEVVDEISMMGRVVKVEKQVQSIEHKLDLLLGFYSRCLRSGTSALEVLFQGPMAKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTNAAAEHHHHHHHHHH
>6mng_A mol:protein length:208  4738 TCR alpha chain
MQQVRQSPQSLTVWEGETAILNCSYENSAFDYLPWYQQFPGEGPALLIAIRSVSDKKEDGRFTIFFNKREKKLSLHITDSQPGDSATYFCAGIDTGANTGKLTFGHGTILRVHPNIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESS
>4r4j_A mol:protein length:366  Aspartate-semialdehyde dehydrogenase
MGYTVAVVGATGAVGAQMIKMLEESTLPIDKIRYLASARSAGKSLKFKDQDITIEETTETAFEGVDIALFSAGSSTSAKYAPYAVKAGVVVVDNTSYFRQNPDVPLVVPEVNAHALDAHNGIIACPNCSTIQMMVALEPVRQKWGLDRIIVSTYQAVSGAGMGAILETQRELREVLNDGVKPCDLHAEILPSGGDKKHYPIAFNALPQIDVFTDNDYTYEEMKMTKETKKIMEDDSIAVSATCVRIPVLSAHSESVYIETKEVAPIEEVKAAIAAFPGAVLEDDVAHQIYPQAINAVGSRDTFVGRIRKDLDAEKGIHMWVVSDNLLKGAAWNSVQIAETLHERGLVRPTAELKFELKLEHHHHHH
>7p7j_B mol:protein length:220  NADH-quinone oxidoreductase subunit B
MDYTLTRIDPNGENDRYPLQKQEIVTDPLEQEVNKNVFMGKLNDMVNWGRKNSIWPYNFGLSCCYVEMVTSFTAVHDVARFGAEVLRASPRQADLMVVAGTCFTKMAPVIQRLYDQMLEPKWVISMGACANSGGMYDIYSVVQGVDKFIPVDVYIPGCPPRPEAYMQALMLLQESIGKERRPLSWVVGDQGVYRANMQSERERKRGERIAVTNLRTPDEI
>1ocz_D mol:protein length:147  CYTOCHROME C OXIDASE
AHGSVVKSEDYALPSYVDRRDYPLPDVAHVKNLSASQKALKEKEKASWSSLSIDEKVELYRLKFKESFAEMNRSTNEWKTVVGAAMFFIGFTALLLIWEKHYVYGPIPHTFEEEWVAKQTKRMLDMKVAPIQGFSAKWDYDKNEWKK
>7p7q_P mol:protein length:144  50S ribosomal protein L16
MLVPKRVKHRREFRGKMRGEAKGGKEVAFGEWGLQATESHWITNRQIEAARIAMTRYMKRGGKVWIKIFPHKSYTSKAIGVRMGKGKGAPEGWVSPVKRGKIMFEIAGVPEEVAREALRLASHKLPVKTKIVKREEMGGESNEG
>7tqa_C mol:protein length:231  Fab S9.6 heavy chain
EVQLQQSGPELVKPGASVKMSCKASGYTFTSYVMHWVKQKPGQGLEWIGFINLYNDGTKYNEKFKGKATLTSDKSSSTAYMELSSLTSKDSAVYYCARDYYGSRWFDYWGQGTTLTVSSAKTTAPSVYPLAPVCGDTTGSSVTLGCLVKGYFPEPVTLTWNSGSLSSGVHTFPAVLQSDLYTLSSSVTVTSSTWPSQSITCNVAHPASSTKVDKKISALPETGGGHHHHHH
>3taz_B mol:protein length:471  DNA double-strand break repair protein nurA
MGSSHHHHHHSSGLVPRGSHMRLLSKQSIERITKILLDELENVRENEQIRNIINSWKPLPSPEKSSIYAVDGSRSVSRLSGTVIYFLSALAVGSGKQLRLSYANAIKSNYGTSDQIVRMQMETLENMLGYLAYRKLEGEKRAILMDGTLTGSLVRPPVYPEDIRSLNVMRALIGESDFENLLNEFLEKLRDHYRKVEEHLEKNGNYDSPILTDNVVEKLRKKYIDTKVIAYGSGKVKVKIPRKALGYSPRVIPIEVLESSRGKSVDELLQELDEEKVELYLGKDDIYDALHMTLSYIEYLYSIDKLLEVKNLAYIAKSFYTKTLARTLGVEIVDTALLDAVIRTLIGHEKEGYLEIEHAVVPPKWSFPDFLLSKFRNIEKLIDKGIHLAYVRFEQGDVIYMLQSTTNIEKILPLILHHKAGGYLRPLQLAHHGVKISYKEARHTLEALINALRNRDPALKIFVKYGRSPLE
>7uwd_a mol:protein length:823  V-type proton ATPase subunit a
MAELQSGGGGGCCPPMDLFRSEPMQLVQIIIPIESAHLTVSYLGELGLLQFKDLNSEKSPFQRTYAAQIKKCAEMARKLRFFKEQMLKAGILSSVKSTTRADNNTDDLEVKLGDLEAELVEINANGDKLQRAHSELVEYKLVLQKAGEFFSSALTSAAAQQREMESQQTGEMTIETPLLTDKEMSADPSKQIKLGFIAGLVPREKSMSFERMLFRATRGNVFLRQAVVDEPVVDPVSGEKMEKNVFVVFYSGERAKNKILKICDAFGANRYPFNEEFDKQAQAISEVSGRLSELKTTLDAGLLHRGNLLQTIGDQFEQWNLLVKREKSIYHTLNMLSLDVTKKCLVGEGWSPVFATKQIQDALERAAFDSNSQVGAIFQVLHTKESPPTYFRTNKFTSAFQEIVDAYGVAKYREANPGVFTIVTFPFLFAVMFGDWGHGICLLLGTLVLIVREKKLASQKLDDITDMTFGGRYVILMMALFSIYTGLIYNEFFSVPFEIFSHSAYACRDLSCSEATTVGLIKVRDTYPFGVDPVWHGSRSELPFLNSLKMKMSILLGVAQMNLGIILSYFNATFFRIGVNIWCQFIPQIIFLNSLFGYLSLLIILKWITGSQADLYHVMIYMFLSPTDELGDNQLFPGQKTAQLVLLLLAFVSVPWMLLPKPFILKMQHQDRHQGQSYEALQSTDESLQPDTNHDSHGHEEFEFSEVFVHQMIHTIEFVLGAVSNTASYLRLWALSLAHSELSSVFYEKVLLLAWGYNNILILIVGIIVFIFATVGVLLVMETLSAFLHALRLHWVEFQNKFYEGDGYKFSPFSFALLDDEDE
>2r5b_L mol:protein length:17  HIV entry inhibitor PIE7
XKGACDYPEWQWLCAAX
>4zzh_A mol:protein length:356  NAD-dependent protein deacetylase sirtuin-1
GPYTFVQQHLMIGTDPRTILKDLLPETIPPPELDDMTLWQIVINILSEPPKRKKRKDINTIEDAVKLLQECKKIIVLTGAGVSVSCGIPDFRSRDGIYARLAVDFPDLPDPQAMFDIEYFRKDPRPFFKFAKEIYPGQFQPSLCHKFIALSDKEGKLLRNYTQNIDTLEQVAGIQRIIQCHGSFATASCLICKYKVDCEAVRGDIFNQVVPRCPRCPADEPLAIMKPEIVFFGENLPEQFHRAMKYDKDEVDLLIVIGSSLKVRPVALIPSSIPHEVPQILINREPLPHLHFDVELLGDCDVIINELCHRLGGEYAKLCCNPVGGGSGGGSQYLFLPPNRYIFHGAEVYSDSEDDV
>2i03_C mol:protein length:726  Dipeptidyl peptidase 4
SRKTYTLTDYLKNTYRLKLYSLRWISDHEYLYKQENNILVFNAEYGNSSVFLENSTFDEFGHSINDYSISPDGQFILLEYNYVKQWRHSYTASYDIYDLNKRQLITEERIPNNTQWVTWSPVGHKLAYVWNNDIYVKIEPNLPSYRITWTGKEDIIYNGITDWVYEEEVFSAYSALWWSPNGTFLAYAQFNDTEVPLIEYSFYSDESLQYPKTVRVPYPKAGAVNPTVKFFVVNTDSLSSVTNATSIQITAPASMLIGDHYLCDVTWATQERISLQWLRRIQNYSVMDICDYDESSGRWNCLVARQHIEMSTTGWVGRFRPSEPHFTLDGNSFYKIISNEEGYRHICYFQIDKKDCTFITKGTWEVIGIEALTSDYLYYISNEYKGMPGGRNLYKIQLSDYTKVTCLSCELNPERCQYYSVSFSKEAKYYQLRCSGPGLPLYTLHSSVNDKGLRVLEDNSALDKMLQNVQMPSKKLDFIILNETKFWYQMILPPHFDKSKKYPLLLDVYAGPCSQKADTVFRLNWATYLASTENIIVASFDGRGSGYQGDKIMHAINRRLGTFEVEDQIEAARQFSKMGFVDNKRIAIWGWSYGGYVTSMVLGSGSGVFKCGIAVAPVSRWEYYDSVYTERYMGLPTPEDNLDHYRNSTVMSRAENFKQVEYLLIHGTADDNVHFQQSAQISKALVDVGVDFQAMWYTDEDHGIASSTAHQHIYTHMSHFIKQCFS
>4nb5_B mol:protein length:171  DNA binding protein
VSVNDGVDQMGAEPDIMEFVEQMGGYFESRSLTRLAGRLLGWLLVCDPERQSSEELATALAASSGGISTNARMLIQFGFIERLAVAGDRRTYFRLRPNAFAAGERERIRAMAELQDLADVGLRALGDAPPQRSRRLREMRDLLAYMENVVSDALGRYSQRTGEDDHHHHHH
>5whf_A mol:protein length:90  Vimentin
GPHMEMRELRRQVDQLTNDKARVEVERDNLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEIAFLKKLH
>2rfz_B mol:protein length:430  Cellulose 1,4-beta-cellobiosidase
QRAGNETPENHPPLTWQRCTAPGNCQTVNAEVVIDANWRWLHDDNMQNCYDGNQWTNACSTATDCAEKCMIEGAGDYLGTYGASTSGDALTLKFVTKHEYGTNVGSRFYLMNGPDKYQMFNLMGNELAFDVDLSTVECGINSALYFVAMEEDGGMASYPSNQAGARYGTGYCDAQCARDLKFVGGKANIEGWKSSTSDPNAGVGPYGSCCAEIDVWESNAYAFAFTPHACTTNEYHVCETTNCGGTYSEDRFAGKCDANGCDYNPYRMGNPDFYGKGKTLDTSRKFTVVSRFEENKLSQYFIQDGRKIEIPPPTWEGMPNSSEITPELCSTMFDVFNDRNRFEEVGGFEQLNNALRVPMVLVMSIWDDHYANMLWLDSIYPPEKEGQPGAARGDCPTDSGVPAEVEAQFPDAQVVWSNIRFGPIGSTYDF
>3blw_J mol:protein length:354  Isocitrate dehydrogenase [NAD] subunit 2
ATVKQPSIGRYTGKPNPSTGKYTVSFIEGDGIGPEISKSVKKIFSAANVPIEWESCDVSPIFVNGLTTIPDPAVQSITKNLVALKGPLATPIGKGHRSLNLTLRKTFGLFANVRPAKSIEGFKTTYENVDLVLIRENTEGEYSGIEHIVCPGVVQSIKLITRDASERVIRYAFEYARAIGRPRVIVVHKSTIQRLADGLFVNVAKELSKEYPDLTLETELIDNSVLKVVTNPSAYTDAVSVCPNLYGDILSDLNSGLSAGSLGLTPSANIGHKISIFEAVHGSAPDIAGQDKANPTALLLSSVMMLNHMGLTNHADQIQNAVLSTIASGPENRTGDLAGTATTSSFTEAVIKRL
>7nvo_q mol:protein length:548  T-complex protein 1 subunit theta
MALHVPKAPGFAQMLKEGAKHFSGLEEAVYRNIQACKELAQTTRTAYGPNGMNKMVINHLEKLFVTNDAATILRELEVQHPAAKMIVMASHMQEQEVGDGTNFVLVFAGALLELAEELLRIGLSVSEVIEGYEIACRKAHEILPNLVCCSAKNLRDIDEVSSLLRTSIMSKQYGNEVFLAKLIAQACVSIFPDSGHFNVDNIRVCKILGSGISSSSVLHGMVFKKETEGDVTSVKDAKIAVYSCPFDGMITETKGTVLIKTAEELMNFSKGEENLMDAQVKAIADTGANVVVTGGKVADMALHYANKYNIMLVRLNSKWDLRRLCKTVGATALPRLTPPVLEEMGHCDSVYLSEVGDTQVVVFKHEKEDGAISTIVLRGSTDNLMDDIERAVDDGVNTFKVLTRDKRLVPGGGATEIELAKQITSYGETCPGLEQYAIKKFAEAFEAIPRALAENSGVKANEVISKLYAVHQEGNKNVGLDIEAEVPAVKDMLEAGILDTYLGKYWAIKLATNAAVTVLRVDQIIMAKPAGGPKPPSGKKDWDDDQND
>5z9m_B mol:protein length:207  DNA gyrase subunit B
GLDAVRKRPGMYIGDTDDGTGLHHMVFEVVDNAIDEALAGHCKEIIVTIHADNSVSVQDDGRGIPTGIHPEEGVSAAEVIMTVLHAGGKFDDNSYKVSGGLHGVGVSVVNALSQKLELVIQREGKIHRQIYEHGVPQAPLAVTGETEKTGTMVRFWPSLETFTNVTEFEYEILAKRLRELSFLNSGVSIRLRDKRDGKEDHFHYEGG
>3c74_F mol:protein length:253  Uridine phosphorylase
KSKSDVFHLGLTKNDLQGAQLAIVPGDPERVEKIAALMDKPVKLASHREFTSWRAELDGKAVIVCSTGIGGPSTSIAVEELAQLGIRTFLRIGTTGAIQPHINVGDVLVTTASVRLDGASLHFAPMEFPAVADFACTTALVEAAKSIGATTHVGVTASSDTFYPGQERYDTYSGRVVRRFKGSMEEWQAMGVMNYEMESATLLTMCASQGLRAGMVAGVIVNRTQQEIPNAETMKQTESHAVKIVVEAARRLL
>4unm_A mol:protein length:615  SECRETED PROTEIN
GSHMSTEKYHQYKINQPEYKAANGKWEIIEFPEKYRQNTIHAALLRTGKVLMVAGSGNNQDNSDDKQYDTRIWDPVKGTIKKVPTPSDLFCTGHTQLANGNLLIAGGTKRYEKLKGDVTKAGGLMVVHNENPDKPITLPAGTKFTGKENGKTFVSKDPVLVPRAEKVFDPATGAFVRNDPGLGRIYVEAQKSGSAYETGTEDNYRVQGLSGADARNTYGIAQKLALDKKDFQGIRDAFEFDPVAEKYIKVDPMHEARWYPTLTTLGDGKILSVSGLDDIGQLVPGKNEVYDPKTKAWTYTDKVRQFPTYPALFLMQNGKIFYSGANAGYGPDDVGRTPGVWDVETNKFTKVPGMSDANMLETANTVLLPPAQDEKYMVIGGGGVGESKLSSEKTRIADLKADDPKFVDGPSLEKGTRYPQASILPDDSVLVSGGSQDYRGRGDSNILQARLYHPDTNEFERVADPLVGRNYHSGSILLPDGRLMFFGSDSLYADKANTKPGKFEQRIEIYTPPYLYRDSRPDLSGGPQTIARGGSGTFTSRAASTVKKVRLIRPSASTHVTDVDQRSIALDFKADGDKLTVTVPSGKNLVQSGWYMMFVTDGEGTPSKAEWVRVP
>5nh3_H mol:protein length:121  anti-human ActRIIB mAb BYM338 Fv heavy-chain
QVQLVQSGAEVKKPGASVKVSCKASGYTFTSSYINWVRQAPGQGLEWMGTINPVSGSTSYAQKFQGRVTMTRDTSISTAYMELSRLRSDDTAVYYCARGGWFDYWGQGTLVTVSSHHHHHH
>5osi_D mol:protein length:182  Vacuolar protein sorting-associated protein 29
MLVLVLGDLHIPHRCNSLPAKFKKLLVPGKIQHILCTGNLCTKESYDYLKTLAGDVHIVRGDFDENLNYPEQKVVTVGQFKIGLIHGHQVIPWGDMASLALLQRQFDVDILISGHTHKFEAFEHENKFYINPGSATGAYNALETNIIPSFVLMDIQASTVVTYVYQLIGDDVKVERIEYKKP
>6ysr_T mol:protein length:100  50S ribosomal protein L23
MIREERLLKVLRAPHVSEKASTAMEKSNTIVLKVAKDATKAEIKAAVQKLFEVEVEVVNTLVVKGKVKRHGQRIGRRSDWKKAYVTLKEGQNLDFVGGAE
>2x6r_B mol:protein length:416  TREHALOSE-SYNTHASE TRET
MKMYEVKEFSSGKRKLEDYKSIIGEEEVSKIQEKAEKLKGRSFVHVNSTSFGGGVAEILHSLVPLLRSIGIEARWFVIEGPTEFFNVTKTFHNALQGNESLKLTEEMKELYLNVNRENSKFIDLSSFDYVLVHDPQPAALIEFYEKKSPWLWRCHIDLSSPNREFWEFLRRFVEKYDRYIFHLPEYVQPELDRNKAVIMPPSIDPLSEKNVELKQTEILRILERFDVDPEKPIITQVSRFDPWKGIFDVIEIYRKVKEKIPGVQLLLVGVMAHDDPEGWIYFEKTLRKIGEDYDVKVLTNLIGVHAREVNAFQRASDVILQMSIREGFGLTVTEAMWKGKPVIGRAVGGIKFQIVDGETGFLVRDANEAVEVVLYLLKHPEVSKEMGAKAKERVRKNFIITKHMERYLDILNSLGG
>6rj0_C mol:protein length:337  Coat protein
VRKGNKKLAKQATTKAVNPQPRRRNNNRRRGMRADAPLAKASTITGFGRGTNDVHLTGMSRIAQAVIPAGTGTDGYIVVDETIVPELLPRLGFAARIFQRYAVETLEFEIQPMCPANTGGGYVAGFLPDPTDSDHTFDAIQATRGAVVAKWWESRTIRPQYARALLWTSVGKEQRLTSPGRLILLCVGNNTDVVNVSVLCRWSVRLSVPSLETPEDTFAPILTLGPLYNDSLAANDFKSILLGSTQLDIAPEGAVYSLDRPLSIDYNLGTGDVDRAVYWHVKKVAGNAGTPAGWFHWGLWDNFNKTFTQGTAYYSDAQPRQILLPVGTLFTRADSGN
>5qn5_B mol:protein length:189  Thiol:disulfide interchange protein
AQYEDGKQYTTLEKPVAGAPQVLEFFSFFCPHCYQFEEVLHISDNVKKKLPEGVKMTKYHVNFMGGDLGKDLTQAWAVAMALGVEDKVTVPLFEGVQKTQTIRSASDIRDVFINAGIKGEEYDAAWNSFVVKSLVAQQEKAAADVQLRGVPAMFVNGKYQLNPQGMDTSNMDVFVQQYADTVKYLSEKK
>5e7k_L5 mol:protein length:49  50S ribosomal protein L34
MKRTWQPNRRKRAKTHGFRARMRTPGGRKVLKRRRQKGRWRLTPAVRKR
>4ru4_F mol:protein length:602  tail spike protein gp49
GSVGQSLQFLEMGRVTPAQFGAVGDGASHPLSERYATLAEAQTVYPHAVALSDEIDWAALQAAVDSGAPVHIPSGDYQINRGISSTGSLQIAGDGATSIIRPTAAFTGTSVLSCVGSLVALPNISSVSAGSLTIDFASTPNLVAGDVFIIYNPTDSSFSGFRTSYRAGEFCEVRAVSGNTVTIRSALYAAYDGATVAIYKVVSGVVDIASIQIVGGTVPMNGLLVEAVVSPRVDDVTVTLANNAGVYFARCYDAKITNSNISNIGDGGDDYGIIFGNCHDGGADNCKVYARRHAIATGGDAEVGCVPVRNVRMRNCTLRNDITSGTHCADFHGNAEDCSYENCTIYGGATWQGKDISYRHCTITNASGGWIVISAEILGGTFLLDQCTLYTTGDPQPGNRGVIDVGGNSAVLTTNTTQPCNFLIQGGSLRAPSLSTSSYLLRARLEGSTVPVNIQYSGQAIDVGSLGKVLQLDITSGSTSPEYLIVENLAGLPSGITLASAAGGFASAPMRMPVLGGRVQVTTATNASSVTAPVTFRYIYPKAPTVQVTKTDRSYAGNRVGVAIANPTSASGATLGLFTDDGTNFSSAVTNQLNWQAGIYEV
>4y0g_A mol:protein length:90  5'-AMP-activated protein kinase subunit beta-2
GPLGSPNSQARPTVIRWSEGGKEVFISGSFNNWSTKIPLIKSHNDFVAILDLPEGEHQYKFFVDGQWVHDPSEPVVTSQLGTINNLIHVK
>6pv4_D mol:protein length:653  Glycoside Hydrolase
MGSSHHHHHHSSGLVPRGSHMASTDGITENFYEIYPKPQEISYSGGEFQISDEINIVYDDGIDTYTKKRVDEVLEASNLEATVSNEIVPGKTNFLVGINESGGVVDNYFNKNIPHDESFFDEKMDANIVSVKDGVIGVIAEDTDSAFYGVTTLKHVFNQLEEGNEIKNFRADDYAEVAHRGFIEGYYGNPWSNEDRAELMKFGGDYKLNQYVFAPKDDPYHNSKWRDLYPEEKLSEIKKLAQMGNETKNRYVYALHPFMNNPVRFDTEENYQNDLGVIKAKFTQLLENDVRQFAILADDASAPAQGASMYVKLLTDLTRWLEEQQSTYPDLKTDLMFCPSDYYGNGSSAQLKELNKAEDNVSIVMTGGRIWGEVDENFANNFMNNISTEGHPGRAPFFWINWPCSDNSKQHLIMGGNDTFLHPGVDPSKIDGIVLNPMQQAEANKSALFAIADYAWNIWDNKEEADENWNDSFKYMDHGTAEETNSSLALREISKHMINQNMDGRVRPLQESVELAPKLEAFKQKYDSGASIKEDALELIEEFTNLQKAAEYYKNNPGNERTRDQIIYWLNCWEDTMDAAIGYLKSAIAIEEGDDEAAWANYSEAQSAFEKSKTYGFHYVDHTEYAEVGVQHIVPFIKSMGQNLSVVIGSIVD
>4e51_A mol:protein length:467  Histidine--tRNA ligase
MAHHHHHHMGTLEAQTQGPGSMTEQKRKLEKLTGVKGMNDILPQDAGLWEFFEATVKSLLRAYGYQNIRTPIVEHTPLFTRGIGEVTDIVEKEMYSFVDALNGENLTLRPENTAAVVRAAIEHNMLYDGPKRLWYIGPMFRHERPQRGRYRQFHQVGVEALGFAGPDADAEIVMMCQRLWEDLGLTGIKLEINSLGLAEERAAHRVELIKYLEQHADKLDDDAQRRLYTNPLRVLDTKNPALQEIVRNAPKLIDFLGDVSRAHFEGLQRLLKANNVPFTINPRLVRGLDYYNLTVFEWVTDKLGAQGTVAAGGRYDPLIEQLGGKPTAACGWAMGIERILELLKEEHLVPEQEGVDVYVVHQGDAAREQAFIVAERLRDTGLDVILHCSADGAGASFKSQMKRADASGAAFAVIFGEDEVTNGTASVKPLRGTGDDGEKSVQQSVPVESLTEFLINAMVATAEDGDD
>1j0n_A mol:protein length:752  XANTHAN LYASE
SDEFDALRIKWATLLTGGPALDPADSDIAARTDKLAQDANDYWEDMDLSSSRTYIWYALRGNGTSDNVNAVYERLRTMALAATTVGSSLYGNADLKEDILDALDWLYVNSYNSTRSRSAYNWWHWQLGIPMSLNDTAVLLYDDISAARMATYMDTIDYFTPSIGLTGANRAWQAIVVGVRAVIVKDAVKLAAARNGLSGTGIFPYATGGDGFYADGSFVQHTTFAYTGGYGSSVLETTANLMYLLSGSTWSVSDPNQSNVWQWIYEAYRPLLYKGAMMDMVRGREISRSYAQDHAVGHGIVASIVRLAQFAPAPHAAAFKQIAKRVIQEDTFSSFYGDVSTDTIRLAKAIVDDPSIAPAAAPNLYKQYAAMDRAVLQRPGFALGLALYSTRISSYESINSENGRGWYTGAGATYLYNQDLAQYSEDYWPTVDAYRIPGTTVASGTPIASGTGTSSWTGGVSLAGQYGASGMDLSYGAYNLSARKSWFMFDDEIVALGSGISSTAGIPIETVVDNRKLNGAGDNAWTANGAALSTGLGVAQTLTGVNWVHLAGNTADGSDIGYYFPGGATLQTKREARTGTWKQINNRPATPSTAVTRNYETMWIDHGTNPSGASYGYVLLPNKTSAQVGAYAADPAIEIVVNTSGVQSVKEKTLGLVGANFWTDTTQTADLITSNKKASVMTREIADERLEASVSDPTQANNGTIAIELARSAEGYSADPGITVTQLAPTIKFTVNVNGAKGKSFHASFQLG
>4qyj_D mol:protein length:516  Aldehyde dehydrogenase
MGSSHHHHHHSSGLVPRGSHMNSSLSAIDGLRLPHQMLIGGQWVSAQSGKTLNVYNPATGDILTEVPDGDVEDVNAAVESAAATLRSDTWRRMPPSARERILLRLADLLEVHGDELARLETLNNGKLLIYSKLMEVGASAQWLRYMAGWATKLTGSTLDLSLPLPPEVRSRASTQRVPVGVVAAIIPWNFPLLMAVWKIAPALACGNTVVLKPAEETPLTALRLAELAMEAGLPAGALNVVTGRGETAGDALVRHPKVAKVAFTGSTEVGRIIGSACGRSLKAVSLELGGKSPVIVLADCDPQEAAEGAAAAIFFNHGQVCTAGSRLYVHESIYEDVIQRLAVIGESIVVGSGLEQGVHMGPMVSKKHHENVLRHIRNGIEDGADLICGGTEAPCAQGFFVKPTIFANREKKDIRLLSQEVFGPVLVATPFSDIAEVVNEANRSVYGLGASIWTNDLSAALRINDELEAGTVWVNTHNMVDPNLPFGGFKDSGVGREHGAAAIEHYTTTRSLVIAY
>4b3w_B mol:protein length:190  CYTOGLOBIN
MEKVPGEMEIERRERSEELSEAERKAVQAMWARLYANSEDVGVAILVRFFVNFPSAKQYFSQFKHMEDPLEMERSPQLRKQASRVMGALNTVVENLHDPDKVSSVLALVGKAHALKHKVEPVYFKILSGVILEVVAEEFASDFPPETQRAWAKLRGLIYSHVTAAYKEVGWVQQVPNATTPPATLPSSGP
>6sql_A mol:protein length:270  Enoyl-[acyl-carrier-protein] reductase [NADH]
SMTGLLDGKRILVSGIITDSSIAFHIARVAQEQGAQLVLTGFDRLRLIQRITDRLPAKAPLLELDVQNEEHLASLAGRVTEAIGAGNKLDGVVHSIGFMPQTGMGINPFFDAPYADVSKGIHISAYSYASMAKALLPIMNPGGSIVGMDFDPSRAMPAYNWMTVAKSALESVNRFVAREAGKYGVRSNLVAAGPIRTLAMSAIVGGALGEEAGAQIQLLEEGWDQRAPIGWNMKDATPVAKTVCALLSDWLPATTGDIIYADGGAHTQLL
>2pty_A mol:protein length:432  Enolase
GSHMTIQKVHGREVLDSRGNPTVEVEVTTEKGVFRSAVPSGASTGVYEACELRDGDKKRYVGKGCLQAVKNVNEVIGPALIGRDELKQEELDTLMLRLDGTPNKGKLGANAILGCSMAISKAAAAAKGVPLYRYLASLAGTKELRLPVPCFNVINGGKHAGNALPFQEFMIAPVKATSFSEALRMGSEVYHSLRGIIKKKYGQDAVNVGDEGGFAPPIKDINEPLPILMEAIEEAGHRGKFAICMDCAASETYDEKKQQYNLTFKSPEPTWVTAEQLRETYCKWAHDYPIVSIEDPYDQDDFAGFAGITEALKGKTQIVGDDLTVTNTERIKMAIEKKACNSLLLKINQIGTISEAIASSKLCMENGWSVMVSHRSGETEDTYIADLVVALGSGQIKTGAPCRGERTAKLNQLLRIEEELGAHAKFGFPGWS
>3otw_D mol:protein length:163  Phosphopantetheine adenylyltransferase
HHHHHHMQKIGIYPGTFDPVTNGHIDIIHRSSELFEKLIVAVAHSSAKNPMFSLDERLKMIQLATKSFKNVECVAFEGLLANLAKEYHCKVLVRGLRVVSDFEYELQMGYANKSLNHELETLYFMPTLQNAFISSSIVRSIIAHKGDASHLVPKEIYPLISKA
>7ojp_J mol:protein length:261  Acyl-[acyl-carrier-protein]-UDP-N-acetylglucosamine O-acyltransferase
GSHMSLIDPRAIIDPSARLAADVQVGPWSIVGAEVEIGEGTVIGPHVVLKGPTKIGKHNRIYQFSSVGEDTPDLKYKGEPTRLVIGDHNVIREGVTIHRGTVQDRAETTIGDHNLIMAYAHIGHDSVIGNHCILVNNTALAGHVHVDDWAILSGYTLVHQYCRIGAHSFSGMGSAIGKDVPAYVTVFGNPAEARSMNFEGMRRRGFSSEAIHALRRAYKVVYRQGHTVEEALAELAESAAQFPEVAVFRDSIQSATRGITR
>6ev1_D mol:protein length:213  Light chain
DIVLTQSPAIMSASPGEKVTMTCSASSSVSYMHWYQQKSGTSPKRWIYDTSKLASGVPARFSGSGSGTSYSLTISSMEAEDAATYYCQQWSSNPPTFGAGTKLELKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLRSPVTKSFNRGEC
>1p44_B mol:protein length:269  Enoyl-[acyl-carrier-protein] reductase [NADH]
MTGLLDGKRILVSGIITDSSIAFHIARVAQEQGAQLVLTGFDRLRLIQRITDRLPAKAPLLELDVQNEEHLASLAGRVTEAIGAGNKLDGVVHSIGFMPQTGMGINPFFDAPYADVSKGIHISAYSYASMAKALLPIMNPGGSIVGMDFDPSRAMPAYNWMTVAKSALESVNRFVAREAGKYGVRSNLVAAGPIRTLAMSAIVGGALGEEAGAQIQLLEEGWDQRAPIGWNMKDATPVAKTVCALLSDWLPATTGDIIYADGGAHTQLL
>4v9c_DU mol:protein length:104  50S ribosomal protein L24
MAAKIRRDDEVIVLTGKDKGKRGKVKNVLSSGKVIVEGINLVKKHQKPVPALNQPGGIVEKEAAIQVSNVAIFNAATGKADRVGFRFEDGKKVRFFKSNSETIK
>6d3g_B mol:protein length:284  Beta-lactamase
SAQSPLLKEQIETIVTGKKATVGVAVWGPDDLEPLLLNPFEKFPMQSVFKLHLAMLVLHQVDQGKLDLNQSVTVNRAAVLQNTWSPMMKDHQGDEFTVAVQQLLQYSVSHSDNVACDLLFELVGGPQALHAYIQSLGVKEAAVVANEAQMHADDQVQYQNWTSMKAAAQVLQKFEQKKQLSETSQALLWKWMVETTTGPQRLKGLLPAGTIVAHKTGTSGVRAGKTAATNDAGVIMLPDGRPLLVAVFVKDSAESERTNEAIIAQVAQAAYQFELKKLSAVSPD
>7ce1_K mol:protein length:341  LacI-type transcription factor
ERPTLKTIAYMTGLGITTVSRALKDAPDIGAETKERVRLIAQQIGYQPNRAGVRLRTGKTNVIALVLSVDEELMGFTSQMVFGITEVLATTQYHLVVTPHTHAKDSMVPIRYILETGSADGVIISKIEPNDPRVRFMTERKMPFVTHGRSDMGIEHAYHDFDNEAYAYEAVERLAQCGRKRIAIIVPPSRFAFHDHARKGFTRGIRDFGVSEFPLDAITIETPLDKIRDFGKRLMQSDDRPDGIVSISGSSTIALVAGFEAAGVRIGKDIDIVSKQSAEFLNWIQPQIHTVNEDIKLAGRELAKALLARINGAPPETLQSVSRPVWSSMAPKPLEHHHHHH
>5tzc_B mol:protein length:344  cGMP-dependent 3',5'-cyclic phosphodiesterase
SAMDDEYTKLLHDGIQPVAAIDSNFASFTYTPRSLPEDDTSMAILSMLQDMNFINNYKIDCPTLARFCLMVKKGYRDPPYHNWMHAFSVSHFCYLLYKNLELTNYLEDIEIFALFISCMCHDLDHRGTNNSFQVASKSVLAALYSSEGSVMERHHFAQAIAILNTHGCNIFDHFSRKDYQRMLDLMRDIILATDLAHHLRIFKDLQKMAEVGYDRNNKQHHRLLLCLLMTSCDLSDQTKGWKTTRKIAELIYKEFFSQGDLEKAMGNRPMEMMDREKAYIPELQISFMEHIAMPIYKLLQDLFPKAAELYERVASNREHWTKVSHKFTIRGLPSNNSLDFLDEE
>1zwu_A mol:protein length:30  AMARANTHUS CAUDATUS ANTIMICROBIAL PEPTIDE 2 (ACMP2)
VGECVRGRCPSGMCCSQAGYCGKGPKYCGR
>7nei_A mol:protein length:267  Polyester Hydrolase Leipzig 7 (PHL-7)
MANPYERGPDPTESSIEAVRGPFAVAQTTVSRLQADGFGGGTIYYPTDTSQGTFGAVAISPGFTAGQESIAWLGPRIASQGFVVITIDTITRLDQPDSRGRQLQAALDHLRTNSVVRNRIDPNRMAVMGHSMGGGGALSAAANNTSLEAAIPLQGWHTRKNWSSVRTPTLVVGAQLDTIAPVSSHSEAFYNSLPSDLDKAYMELRGASHLVSNTPDTTTAKYSIAWLKRFVDDDLRYEQFLCPAPDDFAISEYRSTCPFLEHHHHHH
>3ab4_E mol:protein length:421  Aspartokinase
MALVVQKYGGSSLESAERIRNVAERIVATKKAGNDVVVVCSAMGDTTDELLELAAAVNPVPPAREMDMLLTAGERISNALVAMAIESLGAEAQSFTGSQAGVLTTERHGNARIVDVTPGRVREALDEGKICIVAGFQGVNKETRDVTTLGRGGSDTTAVALAAALNADVCEIYSDVDGVYTADPRIVPNAQKLEKLSFEEMLELAAVGSKILVLRSVEYARAFNVPLRVRSSYSNDPGTLIAGSMEDIPVEEAVLTGVATDKSEAKVTVLGISDKPGEAAKVFRALADAEINIDMVLQNVFSVEDGTTDITFTCPRSDGRRAMEILKKLQVQGNWTNVLYDDQVGKVSLVGAGMKSHPGVTAEFMEALRDVNVNIELISTSEIRISVLIREDDLDAAARALHEQFQLGGEDEAVVYAGTGR
>3qjn_I mol:protein length:7  Beta-PIX
AWDETNL
>6yft_AD mol:protein length:113  coat protein
STFSSLVIGSNTFIPTAPGYYSLSTRGFSDPRNQIKISGGKFNAKTGRVTAAVSRLWETDVTVAGLPVRSAAEVAIIMTLGRGITATNADVLLSDLNTLLDPARLDQILQGGF
>5w08_E mol:protein length:291  Hemagglutinin HA1
TNATELVQNSSIGEICDSPHQILDGENCTLIDALLGDPQCDGFQNKKWDLFVERSKAYSNCYPYDVPDYASLRSLVASSGTLEFNNESFNWNGVTQNGTSSACIRRSNNSFFSRLNWLTHLNFKYPALNVTMPNNEQFDKLYIWGVHHPVTDKDQIFLYAQPSGRITVSTKRSQQAVIPNIGFRPRIRNIPSRISIYWTIVKPGDILLINSTGNLIAPRGYFKIRSGKSSIMRSDAPIGKCKSECITPNGSIPNDKPFQNVNRITYGACPRYVKQSTLKLATGGALEVLFQ
>6t7m_C mol:protein length:266  3-oxoacyl-[acyl-carrier-protein] reductase FabG
MHHHHHHSSGVDLGTENLYFQSMSFEGKIALVTGASRGIGRAIAETLVARGAKVIGTATSENGAKNISDYLGANGKGLMLNVTDPASIESVLENIRAEFGEVDILVNNAGITRDNLLMRMKDDEWNDIIETNLSSVFRLSKAVMRAMMKKRCGRIITIGSVVGTMGNAGQANYAAAKAGLIGFSKSLAREVASRGITVNVVAPGFIETDMTRALSDDQRAGILAQVPAGRLGGAQEIASAVAFLASDEASYITGETLHVNGGMYMV
>4www_XU mol:protein length:51  30S ribosomal protein S21
IKVRENEPFDVALRRFKRSCEKAGVLAEVRRREFYEKPTTERKRAKASAVK
>3ab4_I mol:protein length:421  Aspartokinase
MALVVQKYGGSSLESAERIRNVAERIVATKKAGNDVVVVCSAMGDTTDELLELAAAVNPVPPAREMDMLLTAGERISNALVAMAIESLGAEAQSFTGSQAGVLTTERHGNARIVDVTPGRVREALDEGKICIVAGFQGVNKETRDVTTLGRGGSDTTAVALAAALNADVCEIYSDVDGVYTADPRIVPNAQKLEKLSFEEMLELAAVGSKILVLRSVEYARAFNVPLRVRSSYSNDPGTLIAGSMEDIPVEEAVLTGVATDKSEAKVTVLGISDKPGEAAKVFRALADAEINIDMVLQNVFSVEDGTTDITFTCPRSDGRRAMEILKKLQVQGNWTNVLYDDQVGKVSLVGAGMKSHPGVTAEFMEALRDVNVNIELISTSEIRISVLIREDDLDAAARALHEQFQLGGEDEAVVYAGTGR
>6sn9_E mol:protein length:87  Outer membrane protein assembly factor BamE
ERVVYRPDINQGNYLTANDVSKIRVGMTQQQVAYALGTPLMSDPFGTNTWFYVFRQQPGHEGVTQQTLTLTFNSSGVLTNIDNKPAL
>5o9f_B mol:protein length:352  Alcohol dehydrogenase
MKAVQYTEIGSEPVVVDIPTPTPGPGEILLKVTAAGLCYSDISVMDMPAAQYAYGLPLTLGHEGVGTVAELGEGVTGFGVGDAVAVYGPWGCGACHACARGRENYCTRAADLGITPPGLGSPGSMAEYMIVDSARHLVPIGDLDPVAAAPLTDAGLTPYHAISRVLPLLGPGSTAVVIGVGGLGHVGIQILRAVSAARVIAVDLDDDRLALAREVGADAAVKSGAGAADAIRELTGGQGATAVFDFVGAQSTIDTAQQVVAVDGHISVVGIHAGAHAKVGFFMIPFGASVVTPFAGTRSELMEVVALARAGRLDIHTETFTLDEGPAAYRRLREGSIRGRGVVVPTSHHHHH
>7vec_F mol:protein length:118  Gamma-aminobutyric acid receptor-associated protein
GPMKFVYKEEHPFEKRRSEGEKIRKKYPDRVPVIVEKAPKARIGDLDKKKYLVPSDLTVGQFYFLIRKRIHLRAEDALFFFVNNVIPPTSATMGQLYQEHHEEDFFLYIAYSDESVYG
>6r72_C mol:protein length:599  Multidrug exporter ATP-binding cassette
MSSSHHHHHHMPTKKQKSKSKLKPFFALVRRTNPSYGKLAFALALSVVTTLVSLLIPLLTKQLVDGFSMSNLSGTQIGLIALVFFVQAGLSAYATYALNYNGQKIISGLRELLWKKLIKLPVSYFDTNASGETVSRVTNDTMVVKELITTHISGFITGIISVIGSLTILFIMNWKLTLLVLVVVPLAALILVPIGRKMFSISRETQDETARFTGLLNQILPEIRLVKASNAEDVEYGRGKMGISSLFKLGVREAKVQSLVGPLISLVLMAALVAVIGYGGMQVSSGELTAGALVAFILYLFQIIMPMGQITTFFTQLQKSIGATERMIEILAEEEEDTVTGKQIENAHLPIQLDRVSFGYKPDQLILKEVSAVIEAGKVTAIVGPSGGGKTTLFKLLERFYSPTAGTIRLGDEPVDTYSLESWREHIGYVSQESPLMSGTIRENICYGLERDVTDAEIEKAAEMAYALNFIKELPNQFDTEVGERGIMLSGGQRQRIAIARALLRNPSILMLDAATSSLDSQSEKSVQQALEVLMEGRTTIVIAHRLSTVVDADQLLFVEKGEITGRGTHHELMASHGLYRDFAEQQLKMNADLENKAG
>2w85_B mol:protein length:12  PEROXIN-19
SQEKFFQELFDS
>1z4v_A mol:protein length:532  Hemagglutinin-neuraminidase
SPSESLITQKQIMSQAGSTGSNSGLGSITDLLNNILSVANQIIYNSAVALPLQLDTLESTLLTAIKSLQTSDKLEQNCSWSAALINDNRYINGINQFYFSIAEGRNLTLGPLLNMPSFIPTATTPEGCTRIPSFSLTKTHWCYTHNVILNGCQDHVSSNQFVSMGIIEPTSAGFPFFRTLKTLYLSDGVNRKSCSISTVPGGCMMYCFVSTQPERDDYFSAAPPEQRIIIMYYNDTIVERIINPPGVLDVWATLNPGTGSGVYYLGWVLFPIYGGVIKGTSLWNNQANKYFIPQMVAALCSQNQATQVQNAKSSYYSSWFGNRMIQSGILACPLRQDLTNECLVLPFSNDQVLMGAEGRLYMYGDSVYYYQRSNSWWPMTMLYKVTITFTNGQPSAISAQNVPTQQVPRPGTGDCSATNRCPGFCLTGVYADAWLLTNPSSTSTFGSEATFTGSYLNTATQRINPTMYIANNTQIISSQQFGSSGQEAAYGHTTCFRDTGSVMVYCIYIIELSSSLLGQFQIVPFIRQVTLS
>5xf9_E mol:protein length:591  NAD-reducing hydrogenase
MTTERQRTAPGLLAALHQARSRFGRPLDAQALAELSTAFSLPPGEIAATASFYHFFQTPPARYQIHFVDHVVDHHAGVAALCNHLCAAFAIQPGQRTADARLFVGWTACAGLSDQAPAALINGRPMPRLDAARIDALIEKIQAQIPMDQWPTEWFAVTNAIHRHGPLLTWLDTTPAEAVFEHPTAHDPDAILQAVTDAGLRGRGGAGFPTATKWRFCRENADPERFLICNADEGEPGTFKDRVLLTRYPEHLFAGMILAARAIGADKAILYLRYEYQYLLPQLEAARERIASAQATVPQAERVTLEIALGAGAYVCGEESALIESLEGKPGRPRVRPPYPVTQGYLGHPTVVNNVETLVAVAAIVGNGAAWWRALGTPDSSGPKLFCVSGDVAQPGLYEFPYGVALGDVVTAARPLGTRYAVQVSGPSGTLLPATPEQLARPLAFEALPCNGTVMVFDVRRDPVAIVHHFARFFAHESCGFCTPCRVGTQLIAKTFEKIAAGYATRFDLERLAPALEAMRLASNCGFGLSAGNPVRDLIAHFRQQLEAQLQPHDFIPAFSLDAELAATRRLTGRDDPHAHLAQFEQPEVTR
>2zh3_A mol:protein length:437  CCA-adding enzyme
MKVEEILEKALELVIPDEEEVRKGREAEEELRRRLDELGVEYVFVGSYARNTWLKGSLEIDVFLLFPEEFSKEELRERGLEIGKAVLDSYEIRYAEHPYVHGVVKGVEVDVVPCYKLKEPKNIKSAVDRTPFHHKWLEGRIKGKENEVRLLKGFLKANGIYGAEYKVRGFSGYLCELLIVFYGSFLETVKNARRWTRRTVIDVAKGEVRKGEEFFVVDPVDEKRNVAANLSLDNLARFVHLCREFMEAPSLGFFKPKHPLEIEPERLRKIVEERGTAVFAVKFRKPDIVDDNLYPQLERASRKIFEFLERENFMPLRSAFKASEEFCYLLFECQIKEISRVFRRMGPQFEDERNVKKFLSRNRAFRPFIENGRWWAFEMRKFTTPEEGVRSYASTHWHTLGKNVGESIREYFEIISGEKLFKEPVTAELCEMMGVKD
>5md0_C mol:protein length:74  Capsid protein p24
TSILDIRQGPKEPFRDYVDRFYKTLRAEQASQEVKNWMTETLLVQNANPDCKTILKALGPGATLEEMMTACQGV
>6myg_A mol:protein length:178  Gamma-crystallin S
MSKTGGKISFYEDRNFLGRRYDCDCDCADFRSYLSRCNSIRVEGGTWAVYERPNFSGHMYILPQGEYPEYQRWMGLNDRLGSCRAVHLSSGGQAKIQVFEKGDFNGQMYETTEDCPSIMEQFHLREIHSCKVVEGTWIFYELPNYRGRQYLLDKKEYRKPVDWGAASPAIQSFRRIVE
>3vyt_B mol:protein length:372  Hydrogenase expression/formation protein HypD
MEEPFEAYRSREVAMKLVEKIREEAKTLDGEIRIMHVCGTHEDTVTRHGIRSLLPENVKVVSGPGCPVCITPVEDIVAMQLIMRKAREEGEEIILTTFGDMYKIPTPMGSFADLKSEGFDVRIVYGIFDTYRIAKENPDKTVVHFSPGFETTTAPAAGMLNVAAQEELENFKIYSVHRLTPPAVEVLLKQGTVFQGLIAPGHVSTIIGVKGWEYLTEKYGIPQVVAGFEPNDVLMAILMLIRMYKEGEARIINEYERAVKYEGNVVAQKMIDKFFEVVDAKWRALGVFPKSGLELRKEWKDFEIRSFYKVEVPKNLPDLEKGCRCGAVLRGLALPTDCPLFGKTCTPRHPVGPCMVSYEGTCQIFYKYGVLF
>4atq_L mol:protein length:456  4-AMINOBUTYRATE TRANSAMINASE
MTTTANELSYRIEQKRNINGAFPGPKSQALAERRSAVVAAGVASGVPVYVEDADGGIIRDVDGNSFIDLGSGIAVTSVGASDPAVVAAVQEAAAHFTHTCFMVTPYEGYVAVTEQLNRLTPGDHAKRTVLFNSGAEAVENAVKVARLATGRDAVVAFDHAYHGRTNLTMALTAKAMPYKTNFGPFAPEVYRMPMSYPFREENPEITGAEAAKRAITMIEKQIGGDQVAAIIIEPIQGEGGFIVPAEGFLPALSEWAKEKGIVFIADEVQSGFCRTGEWFAVDHEGVVPDIITMAKGIAGGLPLSAITGRADLLDAVHPGGLGGTYGGNPVACAAALAAIDTMEQHDLNGRARHIEELALGKLRELAAELSAGGGSVVGDIRGRGAMLAIELVQPGSKEPNAELTKAVAAACLKEGVIILTCGTYGNVIRLLPPLVISDELLIDGLEVLAAAIKAHA
>2cha_C mol:protein length:97  ALPHA-CHYMOTRYPSIN A
ANTPDRLQQASLPLLSNTNCKKYWGTKIKDAMICAGASGVSSCMGDSGGPLVCKKNGAWTLVGIVSWGSSTCSTSTPGVYARVTALVNWVQQTLAAN
>1r7x_A mol:protein length:283  Glycoprotein-fucosylgalactoside alpha-galactosyltransferase
MVSLPRMVYPQPKVLTPCRKDVLVVTPWLAPIVWEGTFNIDILNEQFRLQNTTIGLTVFAIKKYVAFLKLFLETAEKHFMVGHRVHYYVFTDQPAAVPRVTLGTGRQLSVLEVGAYKRWQDVSMRRMEMISDFCERRFLSEVDYLVCVDVDMEFRDHVGVEILTPLFGTLHPSFYGSSREAFTYERRPQSQAYIPKDEGDFYYMGAFFGGSVQEVQRLTRACHQAMMVDQANGIEAVWHDESHLNKYLLRHKPTKVLSPEYLWDQQLLGWPAVLRKLRFTAVP
>6gzq_S2 mol:protein length:78  30S ribosomal protein S19
KGVFVDDHLLEKVLELNAKGEKRLIKTWSRRSTIVPEMVGHTIAVYNGKQHVPVYITENMVGHKLGEFAPTRTYRGHG
>4lmv_F mol:protein length:252  Glutathione transferase
SQPIVFYDIPSNDTLKQSPWSPNTWKIRYALNIKGIKYKTEWVEYPDIEDVVKKLGGKPTGKKPDGRDHYTVPVIYDPNTKTVVEDGIKIAKYLDDAYPDTPRLFPAGTDAFQAAFDDFVWSVTLAFPLLSLLLLDVSNSLPPRSSAYFRATREQQFGKRLEEQGGEERWQQLEAGLGKFKGYLERNGAGNDLLLMGTQGGITYSDVQIASLFVWAKVVWGEGSEKWKRLMGFHGGKWAQFCAQFAEYERAD
>1lhu_A mol:protein length:189  SEX HORMONE-BINDING GLOBULIN
LRPVLPTQSAHDPPAVHLSNGPGQEPIAVMTFDLTKITKTSSSFEVRTWDPEGVIFYGDTNPKDDWFMLGLRDGRPEIQLHNHWAQLTVGAGPRLDDGRWHQVEVKMEGDSVLLEVDGEEVLRLRQVSGPLTSKRHPIMRIALGGLLFPASNLRLPLVPALDGCLRRDSWLDKQAEISASAPTSLRSCD
>3fx7_A mol:protein length:94  Putative uncharacterized protein
MSRVQMDTEEVREFVGHLERFKELLREEVNSLSNHFHNLESWRDARRDKFSEVLDNLKSTFNEFDEAAQEQIAWLKERIRVLEEDYLEHHHHHH
>4xkj_A mol:protein length:335  D-lactate dehydrogenase
MKIIMFSVRDDEEAAIREWEKKTGVQVDINRLELDAETAQLTKGYDGIVIQQRSHISNPAVYETLQKNGLRQLTSRTAGYDMIDLEQASERGLVVTNVPAYSPNSVAELALTQTMRLIRNLPLFDARGAEQDFRWAGLMAREIRSLTVGIIGAGRIGGTVARLFKALGATVIANDIVERVELKDIVTYVSKEELLQAADVVTLHVPLMDSTTQLIDADALALMKNDAVLINASRGPVVDTDALIAALQNKQIAGAALDTLNGEEHFFNQDLCGKELPSEQLKVLRTLPNVLITPHIGFYTNKAVQNMVEISLNDVLAILKTGTSEHQLNKVAVEN
>6aw9_A mol:protein length:228  Catechol O-methyltransferase
MGDTKEQRILRYVQQHAKPGDPQSVLEAIDTYCTQKEWAMNVGDAKGQIMDEVIQEHNPSLVLELGAYCGYSAVRMARLLSPGARLLTMEKNPDYAAITQQMLNFAGLQDKVTILIGASQDLIPQLKKYDVDTLDMVFLDHWKDRYLPDTILLEECGLLRKGTVLLADNVIVPGTPDFLAYVRGSSSFECTHYSSYLEYMKVVDGLEKAVYKGPSSPKQPLEHHHHHH
>5w93_F mol:protein length:20  Paxillin
MDDLDALLADLESTTSHISK
>2fkb_C mol:protein length:180  Putative Nudix hydrolase yfcD
MEQRRLASTEWVDIVNEENEVIAQASREQMRAQCLRHRATYIVVHDGMGKILVQRRTETKDFLPGMLDATAGGVVQADEQLLESARREAEEELGIAGVPFAEHGQFYFEDKNCRVWGALFSCVSHGPFALQEDEVSEVCWLTPEEITARCDEFTPDSLKALALWMKRNAKNEAVETETAE
>4z2y_A mol:protein length:359  CalO6
GSHMELTTTAARPGLRHRMQQLIYGFFTAQTLHVAVRLRIPDLLADGARDVGDLASATGADAPSLRRLLRALVFLEVLDEPAPGTFALTEQGEVLRADVTGSMRELVLLLSGPESWAAWGQLEHSVRTGEVAWEHVHGRSCFDHLMADPQRQAAFNAAMAEGSRAFVPTLLSAYDFGDLRTVVDVGGGSGALLAGVLAAHPHLRGTVFDTPDGVADAARTVAEQGVADRCGVETGDFFVSVPPGADAYVLKSVLHDWDDEQCVEVLRTVRRAVRPDSRVILVESLMPTTVTTAPSVAQVVMNDLNMMVCHGGRERTVAEFRELLRVAGFRLESVTPCPAPSVVGILEAAPAPATGPDGS
>2prf_A mol:protein length:125  PROFILIN IA
SWQTYVDTNLVGTGAVTQAAILGLDGNTWATSAGFAVTPAQGQTLASAFNNADPIRASGFDLAGVHYVTLRADDRSIYGKKGSAGVITVKTSKSILVGVYNEKIQPGTAANVVEKLADYLIGQGF
>5m32_I mol:protein length:205  Proteasome subunit beta type-3
MSIMSYNGGAVMAMKGKNCVAIAADRRFGIQAQMVTTDFQKIFPMGDRLYIGLAGLATDVQTVAQRLKFRLNLYELKEGRQIKPYTLMSMVANLLYEKRFGPYYTEPVIAGLDPKTFKPFICSLDLIGCPMVTDDFVVSGTCAEQMYGMCESLWEPNMDPDHLFETISQAMLNAVDRDAVSGMGVIVHIIEKDKITTRTLKARMD
>1xm2_A mol:protein length:173  Tyrosine Phosphatase
MARMNRPAPVEVTYKNMRFLITHNPTNATLNKFIEELKKYGVTTIVRVCEATYDTTLVEKEGIHVLDWPFDDGAPPSNQIVDDWLSLVKIKFREEPGCCIAVHSVAGLGRAPVLVALALIEGGMKYEDAVQFIRQKRRGAFNSKQLLYLEKYRPKMRLRFKDSNGHRNNCCIQ
>1nez_B mol:protein length:99  Beta-2-microglobulin
IQKTPQIQVYSRHPPENGKPNILNCYVTQFHPPHIEIQMLKNGKKIPKVEMSDMSFSKDWSFYILAHTEFTPTETDTYACRVKHDSMAEPKTVYWDRDM
>6i50_A mol:protein length:170  SFRICE_029225
RPFIAAHFHGNTSHLNSAIHDHYKGNGLVRVSHDAPHDVWYPAPWTVASPHPRPTLTRTGHVHVHHTGVYLVYVQIYYLDSHDTISWVLHRTNADIEGRETLLQCAQSSYSTEPIDKPNSCFSAAALFLKAGDRLAVRNTAGDRHSLMQPEKSFIGLVKLADAEDPTQEL
>5zbo_c mol:protein length:209  Capsid protein
MGSSHHHHHHSSGLVPRGSHFNTRLSRTFGYTIKRTTVKTPSWAVDMMRFNINDFLPPGGGSNPRSVPFEYYRIRKVKVEFWPCSPITQGDRGVGSSAVILDDNFVTKATALTYDPYVNYSSRHTITQPFSYHSRYFTPKPVLDSTIDYFQPNNKRNQLWLRLQTAGNVDHVGLGTAFENSIYDQEYNIRVTMYVQFREFNLKDPPLNP
>5j8a_BM mol:protein length:114  30S ribosomal protein S13
ARIAGINIPDHKHAVIALTSIYGVGKTRSKAILAAAGIAEDVKISELSEGQIDTLRDEVAKFVVEGDLRREISMSIKRLMDLGCYRGLRHRRGLPVRGQRTKTNARTRKGPRKP
>7ban_B mol:protein length:1932  Teneurin-4
METACGDSKDNDGDGLVDCMDPDCCLQPLCHINPLCLGSPNPLDIIQETQVPVSQQNLHSFYDRIKFLVGRDSTHIIPGENPFDGGHACVIRGQVMTSDGTPLVGVNISFVNNPLFGYTISRQDGSFDLVTNGGISIILRFERAPFITQEHTLWLPWDRFFVMETIIMRHEENEIPSCDLSNFARPNPVVSPSPLTSFASSCAEKGPIVPEIQALQEEISISGCKMRLSYLSSRTPGYKSVLRISLTHPTIPFNLMKVHLMVAVEGRLFRKWFAAAPDLSYYFIWDKTDVYNQKVFGLSEAFVSVGYEYESCPDLILWEKRTTVLQGYEIDASKLGGWSLDKHHALNIQSGILHKGNGENQFVSQQPPVIGSIMGNGRRRSISCPSCNGLADGNKLLAPVALTCGSDGSLYVGDFNYIRRIFPSGNVTNILELRNKDFRHSHSPAHKYYLATDPMSGAVFLSDSNSRRVFKIKSTVVVKDLVKNSEVVAGTGDQCLPFDDTRCGDGGKATEATLTNPRGITVDKFGLIYFVDGTMIRRIDQNGIISTLLGSNDLTSARPLSCDSVMDISQVHLEWPTDLAINPMDNSLYVLDNNVVLQISENHQVRIVAGRPMHCQVPGIDHFLLSKVAIHATLESATALAVSHNGVLYIAETDEKKINRIRQVTTSGEISLVAGAPSGCDCKNDANCDCFSGDDGYAKDAKLNTPSSLAVCADGELYVADLGNIRIRFIRKNKPFLNTQNMYELSSPIDQELYLFDTTGKHLYTQSLPTGDYLYNFTYTGDGDITLITDNNGNMVNVRRDSTGMPLWLVVPDGQVYWVTMGTNSALKSVTTQGHELAMMTYHGNSGLLATKSNENGWTTFYEYDSFGRLTNVTFPTGQVSSFRSDTDSSVHVQVETSSKDDVTITTNLSASGAFYTLLQDQVRNSYYIGADGSLRLLLANGMEVALQTEPHLLAGTVNPTVGKRNVTLPIDNGLNLVEWRQRKEQARGQVTVFGRRLRVHNRNLLSLDFDRVTRTEKIYDDHRKFTLRILYDQAGRPSLWSPSSRLNGVNVTYSPGGYIAGIQRGIMSERMEYDQAGRITSRIFADGKTWSYTYLEKSMVLLLHSQRQYIFEFDKNDRLSSVTMPNVARQTLETIRSVGYYRNIYQPPEGNASVIQDFTEDGHLLHTFYLGTGRRVIYKYGKLSKLAETLYDTTKVSFTYDETAGMLKTINLQNEGFTCTIRYRQIGPLIDRQIFRFTEEGMVNARFDYNYDNSFRVTSMQAVINETPLPIDLYRYDDVSGKTEQFGKFGVIYYDINQIITTAVMTHTKHFDAYGRMKEVQYEIFRSLMYWMTVQYDNMGRVVKKELKVGPYANTTRYSYEYDADGQLQTVSINDKPLWRYSYDLNGNLHLLSPGNSARLTPLRYDIRDRITRLGDVQYKMDEDGFLRQRGGDIFEYNSAGLLIKAYNRAGSWSVRYRYDGLGRRVSSKSSHSHHLQFFYADLTNPTKVTHLYNHSSSEITSLYYDLQGHLFAMELSSGDEFYIACDNIGTPLAVFSGTGLMIKQILYTAYGEIYMDTNPNFQIIIGYHGGLYDPLTKLVHMGRRDYDVLAGRWTSPDHELWKHLSSSNVMPFNLYMFKNNNPISNSQDIKCFMTDVNSWLLTFGFQLHNVIPGYPKPDMDAMEPSYELIHTQMKTQEWDNSKSILGVQCEVQKQLKAFVTLERFDQLYGSTITSCQQAPKTKKFASSGSVFGKGVKFALKDGRVTTDIICVANEDGRRVAAILNHAHYLENLHFTIDGVDTHYFVKPGPSEGDLAILGLSGGRRTLENGVNVTVSQINTVLNGRTRRYTDIQLQYGALCLNTRYGTTLDEEKARVLELARQRAVRQAWAREQQRLREGEEGLRAWTEGEKQQVLSTGRVQGYDGFFVISVEQYPELSDSANNIHFMRQSE
>4o6c_D mol:protein length:377  NS1
AEHHHHHHSSGVDLGTENLYFQSNADTGCAIDISRQELRCGSGVFIHNDVEAWMDRYKYYPETPQGLAKIIQKAHKEGVCGLRSVSRLEHQMWEAVKDELNTLLKENGVDLSVVVEKQEGMYKSAPKRLTATTEKLEIGWKAWGKSILFAPELANNTFVVDGPETKECPTQNRAWNSLEVEDFGFGLTSTRMFLKVRESNTTECDSKIIGTAVKNNLAIHSDLSYWIESRLNDTWKLERAVLGEVKSCTWPETHTLWGDGILESDLIIPVTLAGPRSNHNRRPGYKTQNQGPWDEGRVEIDFDYCPGTTVTLSESCGHRGPATRTTTESGKLITDWCCRSCTLPPLRYQTDSGCWYGMEIRPQRHDEKTLVQSQVNA
>5wyk_AD mol:protein length:575  Utp9
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
>6grj_D mol:protein length:367  AhlB
MTNATTITMDQGMANQASQAMQIQTYCNSVKQQVPVDFSQFPNLKDNQTQINQGLDLAKGHADLYLNTIQPQIITNISNISNYFALQNAIPAVLPPGSTKAQWLRQLSVIKEQATEYQRLSSDTRLVIVNLNNNLITDSSNFQGIVVNLNSKVQGDNGVLAQLNGDIDKVNAAIDGAIAGIVAGGLLVIGGAFVTAIGAVADFVTAGTSTPVVIGGVAMMVAGAGGITAGAIVLHNSLGARQDLYQKRSSLNSEVLIATQIGNGYKGLQVQAQNAVTAATQMSNAWDSLTSDLGSLITDLDKGITSGDDIRQLWLTAADTTVKTVLTDVTTIKAQIAGVSPLQVPQTDTIANFVARLAALEHHHHHH
>3ria_G mol:protein length:221  Mouse monoclonal Fab fragment, heavy chain
EVQLQQSGPELVRPGASMKISCKASGYSFTGYTMNWVKQSHGKNLEWIGLINPYNGGTSYNQKFKGKATLTVDKSSSTAYMELLSLTSEDSAVYYCARDGDYYRYGRYFDYWGQGTTLTVSSAKTTPPSVYPLAPGSAAQTNSMVTLGCLVKGYFPEPVTVTWNSGSLSSGVHTFPAVLQSDLYTLSSSVTVPSSTWPSETVTCNVAHPASSTKVDKKIVP
>3jbv_u mol:protein length:104  50S ribosomal protein L24
MAAKIRRDDEVIVLTGKDKGKRGKVKNVLSSGKVIVEGINLVKKHQKPVPALNQPGGIVEKEAAIQVSNVAIFNAATGKADRVGFRFEDGKKVRFFKSNSETIK
>6tj2_B mol:protein length:285  Alpha/beta hydrolase
MKSIHIKIVLALCISIFTIMGLQPLNQHSTVAAANHKSSTKQTPLTFVLIHGSWATAGFWDETASELRKLGHTVYTPEYAGHGADKNNNVTHEQITKSVVDYIKQKDLKDFILLGHSFGGSVIQTVSQQVPDRIKRIVFFDAFAPLDGQSVADQFPAESLKSFEQLRDASGNNTITLPFPLFRDTFVNTASLAQAQAFYKQAPPEPATPLFEKLDLKKFYSLQIPKSYLYLTEDTAIPQGPYGFHPTQSSHLGVFRFIEGKGDHMTTVRTEPKMMAELMVKAGRD
>1vy7_AC mol:protein length:239  30S ribosomal protein S3
MGNKIHPIGFRLGITRDWESRWYAGKKQYRHLLLEDQRIRGLLEKELYSAGLARVDIERAADNVAVTVHVAKPGVVIGRGGERIRVLREELAKLTGKNVALNVQEVQNPNLSAPLVAQRVAEQIERRFAVRRAIKQAVQRVMESGAKGAKVIVSGRIGGAEQARTEWAAQGRVPLHTLRANIDYGFALARTTYGVLGVKAYIFLGEVIGGQKPKARPELPKAEERPRRRRPAVRVKKEE
>6q16_AJ mol:protein length:252  Lipoprotein PrgK
MIRRYLYTFLLVMTLAGCKDKDLLKGLDQEQANEVIAVLQMHNIEANKIDSGKLGYSITVAEPDFTAAVYWIKTYQLPPRPRVEIAQMFPADSLVSSPRAEKARLYSAIEQRLEQSLQTMEGVLSARVHISYDIDAGENGRPPKPVHLSALAVYERGSPLAHQISDIKRFLKNSFADVDYDNISVVLSERSDAQLQAPGTPVKRNSFATSWIVLIILLSVMSAGFGVWYYKNHYARNKKGITADDKAKSSNE
>2bo9_C mol:protein length:308  CARBOXYPEPTIDASE A4
SSNNFNYGAYHSLEAIYHEMDNIAADFPDLARRVKIGHSFENRPMYVLKFSTGKGVRRPAVWLNAGIHSREWISQATAIWTARKIVSDYQRDPAITSILEKMDIFLLPVANPDGYVYTQTQNRLWRKTRSRNPGSSCIGADPNRNWNASFAGKGASDNPCSEVYHGPHANSEVEVKSVVDFIQKHGNFKGFIDLHSYSQLLMYPYGYSVKKAPDAEELDKVARLAAKALASVSGTEYQVGPTCTTVYPASGSSIDWAYDNGIKFAFTFELRDTGTYGFLLPANQIIPTAEETWLGLKTIMEHVRDNLY
>7jor_A mol:protein length:137  Dehaloperoxidase B
GFKQDIATLRGDLRTYAQDIFLAFLNKYPDEKRNFKNYVGKSDQELKSMAKFGDHTEKVFNLMMEVADRATDCVPLASDASTLVQMKQHSGLTTGNFEKLFVALVEYMRASGQSFDSQSWDRFGKNLVSALSSAGMK
>5o09_2C mol:protein length:238  Bacterial kinesin light chain
DTALERQIASASRSVEEARRLAYHDPIRVGALVEQISVLADLRQKEGDFRKAESLYREALFRAQELRKQDPDLLTGIYSLLAHLYDRWGRMDKAAEFYELALKISAENGLEESDKVATIKNNLAMIFKQLRKFERAEGYYCEALETFQRLDGEQSARVASVYNNLGVLYYSHMDVDRAQVMHERALAIRQNLHEGQMDPADLSQTFINLGAVYKAAGDFQKAEACVDRAKRIRAAMNG
>6eq4_A mol:protein length:182  7,8-dihydro-8-oxoguanine triphosphatase
MKHHHHHHPMSDYDIPTTENLYFQGAMGASRLYTLVLVLQPQRVLLGMKKRGFGAGRWNGFGGKVQEGETIEDGARRELQEESGLTVDALHKVGQIVFEFVGEPELMDVHVFCTDSIQGTPVESDEMRPCWFQLDQIPFKDMWPDDSYWFPLLLQKKKFHGYFKFQGQDTILDYTLREVDTV
>7ezx_NP mol:protein length:161  Allophycocyanin alpha subunit
MSIVTKSIVNADAEARYLSPGELDRIKSFVLSGQRRLRIAQTLTENRERIVKQGGQQLFQRRPDVVSPGGNAYGEEMTATCLRDLDYYLRLVTYGIIAGDVTPIEEIGLVGVKEMYSALGTPISGVAEGIRCMKDVACSLLSGEDAAEVGFYFDYTLAAMQ
>5aqj_B mol:protein length:118  BAG FAMILY MOLECULAR CHAPERONE REGULATOR 1
GPLGSNSPQEEVELKKLKHLEKSVEKIADQLEELNKELTGIQQGFLPKDLQAEALCKLDRRVKATIEQFMKILEEIDTLILPENFKDSRLKRKGLVKKVQAFLAECDTVEQNICQETE
>6d8s_A mol:protein length:31  Potassium channel toxin alpha-KTx 5.4
AFCNLRRCELSCRSLGLLGKCIGEECECVPY
>1wgj_B mol:protein length:286  INORGANIC PYROPHOSPHATASE
TYTTRQIGAKNTLEYKVYIEKDGKPVSAFHDIPLYADKENNIFNMVVEIPRWTNAKLEITKEETLNPIIQDTKKGKLRFVRNCFPHHGYIHNYGAFPQTWEDPNVSHPETKAVGDNDPIDVLEIGETIAYTGQVKQVKALGIMALLDEGETDWKVIAIDINDPLAPKLNDIEDVEKYFPGLLRATNEWFRIYKIPDGKPENQFAFSGEAKNKKYALDIIKETHDSWKQLIAGKSSDSKGIDLTNVTLPDTPTYSKAASDAIPPASLKADAPIDKSIDKWFFISGSV
>4jfz_H mol:protein length:235  Fab heavy chain
EISEVQLVESGGGLVQPGGSLRLSCVTSGFTFRKFGMSWVRQAPGKGLEWVASIATGGHTTYYSDSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCTRGYSSTSYAMDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKSHTATGA
>5gup_Aj mol:protein length:47  Cytochrome c oxidase subunit 7C, mitochondrial
SHYEEGPGKNIPFSVENKWRLLAMMTLFFGSGFAAPFFIVRHQLLKK
>4e8g_B mol:protein length:391  Mandelate racemase/muconate lactonizing enzyme, N-terminal domain protein
MHHHHHHSSGVDLGTENLYFQSMKIAEIHVYAHDLPVKDGPYTIASSTVWSLQTTLVKIVADSGLAGWGETCPVGPTYAPSHALGARAALAEMAPGLIGANPLQPLVLRRRMDGLLCGHNYAKAAIDIAAYDLMGKHYGVRVADLLGGVAAERVPSYYATGIGQPDEIARIAAEKVAEGFPRLQIKIGGRPVEIDIETVRKVWERIRGTGTRLAVDGNRSLPSRDALRLSRECPEIPFVLEQPCNTLEEIAAIRGRVQHGIYLDESGEDLSTVIRAAGQGLCDGFGMKLTRIGGLQQMAAFRDICEARALPHSCDDAWGGDIIAAACTHIGATVQPRLNEGVWVAQPYIAQPYDEENGIRIAGGHIDLPKGPGLGITPDESLFGPPVASFS
>4h5r_B mol:protein length:383  Heat shock cognate 71 kDa protein
SKGPAVGIDLGTTYSCVGVFQHGKVEIIANDQGNRTTPSYVAFTDTERLIGDAAKNQVAMNPTNTVFDAKRLIGRRFDDAVVQSDMKHWPFMVVNDAGRPKVQVEYKGETKSFYPEEVSSMVLTKMKEIAEAYLGKTVTNAVVTVPAYFNDSQRQATKDAGTIAGLNVLRIINEPTAAAIAYGLDKKVGAERNVLIFDLGGGTFDVSILTIEDGIFEVKSTAGDTHLGGEDFDNRMVNHFIAEFKRKHKKDISENKRAVRRLRTACERAKRTLSSSTQASIEIDSLYEGIDFYTSITRARFEELNADLFRGTLDPVEKALRDAKLDKSQIHDIVLVGGSTRIPKIQKLLQDFFNGKELNKSINPDEAVAYGAAVQAAILSGDK
>6uea_J mol:protein length:245  Immunoglobulin heavy constant alpha 2
DYKDDDDKLVPRGSCHPRLSLHRPALEDLLLGSEANLTCTLTGLRDASGATFTWTPSSGKSAVQGPPERDLCGCYSVSSVLPGCAQPWNHGETFTCTAAHPELKTPLTANITKSGNTFRPEVHLLPPPSEELALNELVTLTCLARGFSPKDVLVRWLQGSQELPREKYLTWASRQEPSQGTTTYAVTSILRVAAEDWKKGETFSCMVGHEALPLAFTQKTIDRLAGKPTHINVSVVMAEADGTCY
>3pi4_A mol:protein length:152  Hemoglobin II
XTTLTNPQKAAIRSSWSKFMDNGVSNGQGFYMDLFKAHPETLTPFKSLFGGLTLAQLQDNPKMKAQSLVFCNGMSSFVDHLDDNDMLVVLIQKMAKLHNNRGIRASDLRTAYDILIHYMEDHNHMVGGAKDAWEVFVGFICKTLGDYMKELS
>4hmj_A mol:protein length:143  Thermonuclease
ATSTKKLHKEPATLIKAIDGDTVKLMYKGQPMTFRDLLVDTPEFNEKYGPEASAFTKKMVENAKKIEVEFDKGQRTDKYGRGLAYIYADGKMVNEALVRQGLAKVAYVYKGNNTHEQLLRKAEAQAKKEKLNIWSEDNADSGQ
>6hhq_AC mol:protein length:59  60S ribosomal protein L29
MAKSKNHTAHNQTRKAHRNGIKKPKTYKYPSLKGVDPKFRRNHKHALHGTAKALAAAKK
>2c37_X mol:protein length:248  PROBABLE EXOSOME COMPLEX EXONUCLEASE 1
MREMLQVERPKLILDDGKRTDGRKPDELRSIKIELGVLKNADGSAIFEMGNTKAIAAVYGPKEMHPRHLSLPDRAVLRVRYHMTPFSTDERKNPAPSRREIELSKVIREALESAVLVELFPRTAIDVFTEILQADAGSRLVSLMAASLALADAGIPMRDLIAGVAVGKADGVIILDLNETEDMWGEADMPIAMMPSLNQVTLFQLNGSMTPDEFRQAFDLAVKGINIIYNLEREALKSKYVEFKEEGV
>1gvd_A mol:protein length:52  MYB PROTO-ONCOGENE PROTEIN
LIKGPWTKEEDQRLIKLVQKYGPKRWSVIAKHLKGRIGKQCRERWHNHLNPE
>5d2q_A mol:protein length:102  Fibroin-modulator-binding protein-1
MHHHHHHETSEERAARLAKMSAYAAQRLANESPEQRATRLKRMSEYAAKRLSSETREQRAIRLARMSAYAARRLANETPAQRQARLLRMSAYAAKRQASKKS
>1u8t_F mol:protein length:16  Flagellar motor switch protein fliM
MGDSILSQAEIDALLN
>2vj0_P mol:protein length:12  SYNAPTOJANIN-1
NPKGWVTFEEEE
>6opd_A mol:protein length:275  HLA class I histocompatibility antigen, A-2 alpha chain
GSHSMRYFFTSVSRPGRGEPRFIAVGYVDDTQFVRFDSDAASQRMEPRAPWIEQEGPEYWDGETRKVKAHSQTHRVDLGTLRGYYNQSEAGSHTVQRMYGCDVGSDWRFLRGYHQYAYDGKDYIALKEDLRSWTAADMAAQTTKHKWEAAHVAEQLRAYLEGTCVEWLRRYLENGKETLQRTDAPKTHMTHHAVSDHEATLRCWALSFYPAEITLTWQRDGEDQTQDTELVETRPAGDGTFQKWAAVVVPSGQEQRYTCHVQHEGLPKPLTLRWE
>4jaw_B mol:protein length:644  Lacto-N-biosidase
MGSSHHHHHHSSGLVPRGSHMGYSATAPVNLTRPATVPSMDGWTDGTGAWTLGEGTRVVSSDALAARAQSLASELTKFTDVDIKAATGSATGKDISLTLDASKKAELGDEGFKLNIGSKGLEVIGATDIGVFYGTRSVSQMLRQGQLTLPAGTVATKPKYKERGATLCACQINISTDWIDRFLSDMADLRLNYVLLEMKLKPEEDNTKKAATWSYYTRDDVKKFVKKANNYGIDVIPEINSPGHMNVWLENYPEYQLADNSGRKDPNKLDISNPEAVKFYKTLIDEYDGVFTTKYWHMGADEYMIGTSFDNYSKLKTFAEKQYGAGATPNDAFTGFINDIDKYVKAKGKQLRIWNDGIVNTKNVSLNKDIVIEYWYGAGRKPQELVQDGYTLMNATQALYWSRSAQVYKVNAARLYNNNWNVGTFDGGRQIDKNYDKLTGAKVSIWPDSSYFQTENEVEKEIFDGMRFISQMTWSDSRPWATWNDMKADIDKIGYPLDIREYDYTPVDAGIYDIPQLKSISKGPWELITTPDGYYQMKDTVSGKCLALFTGSKHLDVVTQVGARPELRNCADVSVGQDQRNTANERNTQKWQIRADKDGKYTISPALTQQRLAIATGNEQNIDLETHRPAAGTVAQFPADLVSD
>5e7r_A mol:protein length:314  TAK1 kinase - TAB1 chimera fusion protein
SLHMIDYKEIEVEEVVGRGAFGVVCKAKWRAKDVAIKQIESESERKAFIVELRQLSRVNHPNIVKLYGACLNPVCLVMEYAEGGSLYNVLHGAEPLPYYTAAHAMSWCLQCSQGVAYLHSMQPKALIHRDLKPPNLLLVAGGTVLKICDFGTACDIQTHMTNNKGSAAWMAPEVFEGSNYSEKCDVFSWGIILWEVITRRKPFDEIGGPAFRIMWAVHNGTRPPLIKNLPKPIESLMTRCWSKDPSQRPSMEEIVKIMTHLMRYFPGADEPLQYPCQHSLPPGEDGRVEPYVDFAEFYRLWSVDHGEQSVVTAP
>4ndy_W mol:protein length:74  Centromere protein X
SGFRKELVSRLLHLHFKDDKTKVSGDALQLMVELLKVFVVEAAVRGVRQAQAEDALRVDVDQLEKVLPQLLLDF
>6u5t_G mol:protein length:2073  Fatty acid synthase subunit beta
MDAYSTRPLTLSHGSLEHVLLVPTASFFIASQLQEQFNKILPEPTEGFAADDEPTTPAELVGKFLGYVSSLVEPSKVGQFDQVLNLCLTEFENCYLEGNDIHALAAKLLQENDTTLVKTKELIKNYITARIMAKRPFDKKSNSALFRAVGEGNAQLVAIFGGQGNTDDYFEELRDLYQTYHVLVGDLIKFSAETLSELIRTTLDAEKVFTQGLNILEWLENPSNTPDKDYLLSIPISCPLIGVIQLAHYVVTAKLLGFTPGELRSYLKGATGHSQGLVTAVAIAETDSWESFFVSVRKAITVLFFIGVRCYEAYPNTSLPPSILEDSLENNEGVPSPMLSISNLTQEQVQDYVNKTNSHLPAGKQVEISLVNGAKNLVVSGPPQSLYGLNLTLRKAKAPSGLDQSRIPFSERKLKFSNRFLPVASPFHSHLLVPASDLINKDLVKNNVSFNAKDIQIPVYDTFDGSDLRVLSGSISERIVDCIIRLPVKWETTTQFKATHILDFGPGGASGLGVLTHRNKDGTGVRVIVAGTLDINPDDDYGFKQEIFDVTSNGLKKNPNWLEEYHPKLIKNKSGKIFVETKFSKLIGRPPLLVPGMTPCTVSPDFVAATTNAGYTIELAGGGYFSAAGMTAAIDSVVSQIEKGSTFGINLIYVNPFMLQWGIPLIKELRSKGYPIQFLTIGAGVPSLEVASEYIETLGLKYLGLKPGSIDAISQVINIAKAHPNFPIALQWTGGRGGGHHSFEDAHTPMLQMYSKIRRHPNIMLIFGSGFGSADDTYPYLTGEWSTKFDYPPMPFDGFLFGSRVMIAKEVKTSPDAKKCIAACTGVPDDKWEQTYKKPTGGIVTVRSEMGEPIHKIATRGVMLWKEFDETIFNLPKNKLVPTLEAKRDYIISRLNADFQKPWFATVNGQARDLATMTYEEVAKRLVELMFIRSTNSWFDVTWRTFTGDFLRRVEERFTKSKTLSLIQSYSLLDKPDEAIEKVFNAYPAAREQFLNAQDIDHFLSMCQNPMQKPVPFVPVLDRRFEIFFKKDSLWQSEHLEAVVDQDVQRTCILHGPVAAQFTKVIDEPIKSIMDGIHDGHIKKLLHQYYGDDESKIPAVEYFGGESPVDVQSQVDSSSVSEDSAVFKATSSTDEESWFKALAGSEINWRHASFLCSFITQDKMFVSNPIRKVFKPSQGMVVEISNGNTSSKTVVTLSEPVQGELKPTVILKLLKENIIQMEMIENRTMDGKPVSLPLLYNFNPDNGFAPISEVMEDRNQRIKEMYWKLWIDEPFNLDFDPRDVIKGKDFEITAKEVYDFTHAVGNNCEDFVSRPDRTMLAPMDFAIVVGWRAIIKAIFPNTVDGDLLKLVHLSNGYKMIPGAKPLQVGDVVSTTAVIESVVNQPTGKIVDVVGTLSRNGKPVMEVTSSFFYRGNYTDFENTFQKTVEPVYQMHIKTSKDIAVLRSKEWFQLDDEDFDLLNKTLTFETETEVTFKNANIFSSVKCFGPIKVELPTKETVEIGIVDYEAGASHGNPVVDFLKRNGSTLEQKVNLENPIPIAVLDSYTPSTNEPYARVSGDLNPIHVSRHFASYANLPGTITHGMFSSASVRALIENWAADSVSSRVRGYTCQFVDMVLPNTALKTSIQHVGMINGRKLIKFETRNEDDVVVLTGEAEIEQPVTTFVFTGQGSQEQGMGMDLYKTSKAAQDVWNRADNHFKDTYGFSILDIVINNPVNLTIHFGGEKGKRIRENYSAMIFETIVDGKLKTEKIFKEINEHSTSYTFRSEKGLLSATQFTQPALTLMEKAAFEDLKSKGLIPADATFAGHSLGEYAALASLADVMSIESLVEVVFYRGMTMQVAVPRDELGRSNYGMIAINPGRVAASFSQEALQYVVERVGKRTGWLVEIVNYNVENQQYVAAGDLRALDTVTNVLNFIKLQKIDIIELQKSLSLEEVEGHLFEIIDEASKKSAVKPRPLKLERGFACIPLVGISVPFHSTYLMNGVKPFKSFLKKNIIKENVKVARLAGKYIPNLTAKPFQVTKEYFQDVYDLTGSEPIKEIIDNWEKYEQSDYKDHDGDYKDHDIDYKDDDDK
>2cbo_A mol:protein length:115  NEOCARZINOSTATIN
AAPTATVTPSSGLSDGTVVKVAGAGLQAGTAYWVAQWARVDTGVWAYNPADNSSVTADANGSASTSLTVRRSFEGFLFDGTRWGTVDCTTAACQVGLSDAAGNGPEGVAISFNHH
>7z46_N mol:protein length:352  Major head protein
MANPTLFVSYDQNGKKLSFANWISVLSPQDTPFVSMTGKESINQTIFSWQTDALASVDGNNAHVEGSRAEDGEMKPTVIKSNVTQILRKVVRVSDTANTTANYGRGRELMYQLEKKGKEIKRDLEKILLSGQARTDVLADQYLTNSAADPAVAGLNDTHAARKTGAFQFLCAHGGLAGGVVDKTKNGPADPDTGAVTVKVAQNASNPTTNIGFDEADIFDMTLQLYTAGSEADIIMINPAHAKIFAGLQENTQGSRKRIFENTKQFIYEVNSITDPLGQSYKIIVNRWMPTDAVYFFRSADWTQMVLRAPKRTELAKDGSYEKWMIEMEVGLRHRNPYASGVLFTAAGKAAA
>1hmv_D mol:protein length:440  HIV-1 REVERSE TRANSCRIPTASE (SUBUNIT P51)
PISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDSTKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDEDFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFKKQNPDIVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLRWGLTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIKVRQLCKLLRGTKALTEVIPLTEEAELELAENREILKEPVHGVYYDPSKDLIAEIQKQGQGQWTYQIYQEPFKNLKTGKYARMRGAHTNDVKQLTEAVQKITTESIVIWGKTPKFKLPIQKETWETWWTEYWQATWIPEWEFVNTPPLVKLWYQLEKEPIVGAETF
>6e34_AN mol:protein length:233  Capsid protein of PCV2
MTYPRRRYRRRRHRPRSHLGQILRRRPWLVHPRHRYRWRRKNGIFNTRLSRTFGYTIKRTTVKTPSWAVDMMRFNINDFLPPGGGSNPRSVPFEYYRIRKVKVEFWPCSPITQGDRGVGSSAVILDDNFVTKATALTYDPYVNYSSRHTITQPFSYHSRYFTPKPVLDSTIDYFQPNNKRNQLWLRLQTAGNVDHVGLGTAFENSIYDQEYNIRVTMYVQFREFNLKDPPLNP
>7z4a_X mol:protein length:352  Major head protein
MANPTLFVSYDQNGKKLSFANWISVLSPQDTPFVSMTGKESINQTIFSWQTDALASVDGNNAHVEGSRAEDGEMKPTVIKSNVTQILRKVVRVSDTANTTANYGRGRELMYQLEKKGKEIKRDLEKILLSGQARTDVLADQYLTNSAADPAVAGLNDTHAARKTGAFQFLCAHGGLAGGVVDKTKNGPADPDTGAVTVKVAQNASNPTTNIGFDEADIFDMTLQLYTAGSEADIIMINPAHAKIFAGLQENTQGSRKRIFENTKQFIYEVNSITDPLGQSYKIIVNRWMPTDAVYFFRSADWTQMVLRAPKRTELAKDGSYEKWMIEMEVGLRHRNPYASGVLFTAAGKAAA
>3l51_B mol:protein length:166  Structural maintenance of chromosomes protein 4
GKVLDAIIQEKKSGRIPGIYGRLGDLGAIDEKYDIAISSCCHALDYIVVDSIDTAQECVNFLKKHNIGIATFIGLDKMTVWAKKMSKIQTPENTPRLFDLVKVKNEEIRQAFYFALRDTLVANNLDQATRVAYQRDRRWRVVTLQGQIIEQSGTMSGGLEHHHHHH
>5f59_A mol:protein length:154  Histone-lysine N-methyltransferase 2C
SKSSQYRKMKTEWKSNVYLARSRIQGLGLYAARDIEKHTMVIEYIGTIIRNEVANRKEKLYESQNRGVYMFRMDNDHVIDATLTGGPARYINHSCAPNCVAEVVTFERGHKIIISSSRRIQKGEELCYDYKFDFEDDQHKIPCHCGAVNCRKWM
>6tuv_D mol:protein length:76  Polyubiquitin-C
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGG
>3gfj_A mol:protein length:146  146aa long hypothetical transcriptional regulator
MLESNENRIQIMSTIAKIYRAMSRELNRRLGELNLSYLDFLVLRATSDGPKTMAYLANRYFVTQSAITASVDKLEEMGLVVRVRDREDARKILIEITEKGLETFNKGIEIYKKLANEVTGDLSEDEVILVLDKISKILKRIEEISQ
>4lf4_H mol:protein length:138  ribosomal protein S8
MLTDPIADMLTRIRNATRVYKESTDVPASRFKEEILRILAREGFIKGYERVDVDGKPYLRVYLKYGPRRQGPDPRPEQVIHHIRRISKPGRRVYVGVKEIPRVRRGLGIAILSTSKGVLTDREARKLGVGGELICEVW
>5j4d_KC mol:protein length:65  50S ribosomal protein L35
MPKMKTHKGAKKRVKITASGKVVAMKTGKRHLNWQKSGKEIRQKGRKFVLAKPEAERIKLLLPYE
>2hnb_A mol:protein length:147  Protein mioC
MADITLISGSTLGGAEYVAEHLAEKLEEAGFTTETLHGPLLEDLPASGIWLVISSTHGAGDIPDNLSPFYEALQEQKPDLSAVRFGAIGIGSREYDTFCGAIDKLEAELKNSGAKQTGETLKINILDHDIPEDPAEEWLGSWVNLLK
>7c2b_C mol:protein length:115  Thioredoxin F2, chloroplastic
ETVNVTVGQVTEVDKDTFWPIVKAAGDKIVVLDMYTQWCGPSKVIAPKYKELSEKYQDMVFLKLDCNQDNKPLAKELGIRVVPTFKILKDNKVVKEVTGAKYEDLLAAIEAARSG
>6be2_H mol:protein length:227  Fab (F598) Heavy Chain
QVQLQESGPGLVKPSETLSLTCTVSGGSISGYYWSWIRQPPGKGLEWIGYIHYSRSTNSNPALKSRVTISSDTSKNQLSLRLSSVTAADTAVYYCARDTYYYDSGDYEDAFDIWGQGTMVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKAEPKSC
>6uti_E mol:protein length:227  Proteasome subunit alpha
AYDRAITVFSPDGRLFQVEYAREAVKKGSTALGMKFANGVLLISDKKVRSRLIEQNSIEAIQLIDDYVAAVTSGLVADARVLVDFARISAQQEKVTYGSLVNIENLVKRVADQMQQYTQYGGVRPYGVSLIFAGIDQIGPRLFDCDPAGTINEYKATAIGSGKDAVVSFLEREYKENLPEKEAVTLGIKALKSSLEEGEELKAPEIASITVGNKYRIYDQEEVKKFL
>6rxq_B mol:protein length:254  NAD-dependent protein deacylase
MGSSHHHHHHSQDPKPRVLVLTGAGISAESGIRTFRAADGLWEEHRVEDVGTPEGFDRDPELVQAFYNARRRQLQQPEIQPNAAHLALAKLQDALGDRFLLVTQNCDNLHERAGNTNVIHMHGELLKVRCSQSGQALDWTGDVTPEDKCHCCQFPAPLRPHVVWFGEMPLGMDEIYMALSMADIFIAIGTSGHVYPAAGFVHEAKLHGAHTVELNLEPSQVGNEFAEKYYGPASQVVPEFVEKLLKGLKAGSIA
>2vil_A mol:protein length:126  VILLIN 14T
VELSKKVTGKLDKTTPGIQIWRIENMEMVPVPTKSYGNFYEGDCYVLLSTRKTGSGFSYNIHYWLGKNSSQDEQGAAAIYTTQMDEYLGSVAVQHREVQGHESETFRAYFKQGLIYKQGGVASGMK
>5szs_C mol:protein length:1325  Spike glycoprotein
FFTCNSNANLSMLQLGVPDNSSTIVTGLLPTHWFCANQSTSVYSANGFFYIDVGNHRSAFALHTGYYDANQYYIYVTNEIGLNASVTLKICKFSRNTTFDFLSNASSSFDCIVNLLFTEQLGAPLGITISGETVRLHLYNVTRTFYVPAAYKLTKLSVKCYFNYSCVFSVVNATVTVNVTTHNGRVVNYTVCDDCNGYTDNIFSVQQDGRIPNGFPFNNWFLLTNGSTLVDGVSRLYQPLRLTCLWPVPGLKSSTGFVYFNATGSDVNCNGYQHNSVVDVMRYNLNFSANSLDNLKSGVIVFKTLQYDVLFYCSNSSSGVLDTTIPFGPSSQPYYCFINSTINTTHVSTFVGILPPTVREIVVARTGQFYINGFKYFDLGFIEAVNFNVTTASATDFWTVAFATFVDVLVNVSATNIQNLLYCDSPFEKLQCEHLQFGLQDGFYSANFLDDNVLPETYVALPIYYQHTDINFTATASFGGSCYVCKPHQVNISLNGNTSVCVRTSHFSIRYIYNRVKSGSPGDSSWHIYLKSGTCPFSFSKLNNFQKFKTICFSTVEVPGSCNFPLEATWHYTSYTIVGALYVTWSEGNSITGVPYPVSGIREFSNLVLNNCTKYNIYDYVGTGIIRSSNQSLAGGITYVSNSGNLLGFKNVSTGNIFIVTPCNQPDQVAVYQQSIIGAMTAVNESRYGLQNLLQLPNFYYVSNGGNNCTTAVMTYSNFGICADGSLIPVRPRNSSDNGISAIITANLSIPSNWTTSVQVEYLQITSTPIVVDCATYVCNGNPRCKNLLKQYTSACKTIEDALRLSAHLETNDVSSMLTFDSNAFSLANVTSFGDYNLSSVLPQRNIRSSRIAGRSALEDLLFSKVVTSGLGTVDVDYKSCTKGLSIADLACAQYYNGIMVLPGVADAERMAMYTGSLIGGMVLGGLTSAAAIPFSLALQARLNYVALQTDVLQENQKILAASFNKAINNIVASFSSVNDAITQTAEAIHTVTIALNKIQDVVNQQGSALNHLTSQLRHNFQAISNSIQAIYDRLDSIQADQQVDRLITGRLAALNAFVSQVLNKYTEVRGSRRLAQQKINECVKSQSNRYGFCGNGTHIFSIVNSAPDGLLFLHTVLLPTDYKNVKAWSGICVDGIYGYVLRQPNLVLYSDNGVFRVTSRVMFQPRLPVLSDFVQIYNCNVTFVNISRVELHTVIPDYVDVNKTLQEFAQNLPKYVKPNFDLTPFNLTYLNLSSELKQLEAKTASLFQTTVELQGLIDQINSTYVDLKLLNRFENLIKRMKQIEDKIEEIESKQKKIENEIARIKKIKLVPRGSLEWSHPQFEK
>2fsy_C mol:protein length:282  major capsid protein
SLGSDADSAGSLIQPMQIPGIIMPGLRRLTIRDLLAQGRTSSNALEYVREEVFTNNADVVAEKALKPESDITFSKQTANVKTIAHWVQASRQVMDDAPMLQSYINNRLMYGLALKEEGQLLNGDGTGDNLEGLNKVATAYDTSLNATGDTRADIIAHAIYQVTESEFSASGIVLNPRDWHNIALLKDNEGRYIFGGPQAFTSNIMWGLPVVPTKAQAAGTFTVGGFDMASQVWDRMDATVEVSREDRDNFVKNMLTILCEERLALAHYRPTAIIKGTFSSGS
>6rxx_Cn mol:protein length:145  40S ribosomal protein s23-like protein
MSGGKPRGLNAARKLRNNRREQRWADLQYKKRALGTAYKSSPFGGSSHAKGIVLEKVGVEAKQPNSAIRKCVRVQLIKNGKKVTAFVPNDGCLNFVDENDEVLLAGFGRKGKAKGDIPGVRFKVVKVSGVGLLALWKEKKEKPRS
>6xqn_I mol:protein length:394  Calcium uptake protein 1, mitochondrial
GPTAAALEPHPEEKKKKRSGFRDRKVMEYENRIRAYSTPDKIFRYFATLKVISEPGEAEVFMTPEDFVRSITPNEKQPEHLGLDQYIIKRFDGKKISQEREKFADEGSIFYTLGECGLISFSDYIFLTTVLSTPQRNFEIAFKMFDLNGDGEVDMEEFEQVQSIIRSQTSMGMRHRDRPTTGNTLKSGLCSALTTYFFGADLKGKLTIKNFLEFQRKLQHDVLKLEFERHDPVDGRITERQFGGMLLAYSGVQSKKLTAMQRQLKKHFKEGKGLTFQEVENFFTFLKNINDVDTALSFYHMAGASLDKVTMQQVARTVAKVELSDHVCDVVFALFDCDGNGELSNKEFVSIMKQRLMRGLEKPKDMGFTRLMQAMWKCAQETAWDFALPKQSNW
>4fny_A mol:protein length:327  ALK tyrosine kinase receptor
RTSTIMTDYNPNYSFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMAQDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEVLEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEEEK
>7c5l_R mol:protein length:352  Glyceraldehyde-3-phosphate dehydrogenase
HHHHHHSSGLVPRGSHMASMSKVGINGFGRIGRLVLRRLLEVKSNIDVVAINDLTSPKILAYLLKHDSNYGPFPWSVDFTEDSLIVDGKSIAVYAEKEAKNIPWKAKGAEIIVECTGFYTSAEKSQAHLDAGAKKVLISAPAGEMKTIVYNVNDDTLDGNDTIVSVASSTTNCLAPMAKALHDSFGIEVGTMTTIHAYTGTQSLVDGPRGKDLRASRAAAENIIPHTTGAAKAIGLVIPELSGKLKGHAQRVPVKTGSVTELVSILGKKVTAEEVNNALKQATTNNESFGYTDEEIVSSDIIGSHFGSVFDATQTEITAVGDLQLVKTVAWYDNEYGFVTQLIRTLEKFAKL
>6f0v_B mol:protein length:317  Proton-gated ion channel
GQDMVSPPPPIADEPLTVNTGIYLIECYSLDDKAETFKVNAFLSLSWKDRRLAFDPVRSGVRVKTYAPEAIWIPEIRFVNVENARDADVVDISVSPDGTVQYLERFSARVLSPLDFRRYPFDSQTLHIYLIVRSVDTRNIVLAVDLEKVGKNDDVFLTGWDIESFTAVVKPANFALEDRLESKLDYQLRISRQYFSYIPNIILPMLFILFISWTAFWSTSYEANVTLVVSTLIAHIAFNILVETNLPKTPYMTYTGAIIFMIYLFYFVAVIEVTVQHYLKVESQPARAASITRASRIAFPVVFLLANIILAFLFFGF
>6yto_C mol:protein length:314  Calcium homeostasis modulator protein 4
MCPTLNNIVSSLQRNGIFINSLIAALTIGGQQLFSSSTFSCPCQVGKNFYYGSAFLVIPALILLVAGFALRSQMWTITGEYCCSCAPPYRRISPLECKLACLRFFSITGRAVIAPLTWLAVTLLTGTYYECAASEFASVDHYPMFDNVSASKREEILAGFPCCRSAPSDVILVRDEIALLHRYQSQMLGWILITLATIAALVSCCVAKCCSPLTSLQHCYWTSHLQNERELFEQAAEQHSRLLMMHRIKKLFGFIPGSEDVKHIRIPSCQDWKDISVPTLLCMGDDLQGHYSFLGNRVDEDNEEDRSRGIELKP
>6p4g_K mol:protein length:194  uS4
MPVARSWVCRKTYVTPRRPFEKSRLDQELKLIGEYGLRNKREVWRVKFTLAKIRKAARELLTLDEKDPRRLFEGNALLRRLVRIGVLDEGKMKLDYILGLKIEDFLERRLQTQVFKLGLAKSIHHARVLIRQRHIRVRKQVVNIPSFIVRLDSQKHIDFSLRSPYGGGRPGRVKRKNAKKGQGGAGAGDDEEED
>4v6w_CU mol:protein length:299  60S ribosomal protein L22
MAPTAKTNKGDTKTAAAKPAEKKAAPAAAAAKGKVEKPKAEAAKPAAAAAKNVKKASEAAKDVKAAAAAAKPAAAKPAAAKPAAASKDAGKKAPAAAAPKKDAKAAAAPAPAKAAPAKKAASTPAAAPPAKKAAPAKAAAPAAAAPAPAAAAPAVAKPAPKPKAKAAPAPSKVVKKNVLRGKGQKKKKVSLRFTIDCTNIAEDSIMDVADFEKYIKARLKVNGKVNNLGNNVTFERSKLKLIVSSDVHFSKAYLKYLTKKYLKKNSLRDWIRVVANEKDSYELRYFRISSNDDEDDDAE
>1oxy_A mol:protein length:628  HEMOCYANIN (SUBUNIT TYPE II)
TLHDKQIRICHLFEQLSSATVIGDGDKHKHSDRLKNVGKLQPGAIFSCFHPDHLEEARHLYEVFWEAGDFNDFIEIAKEARTFVNEGLFAFAAEVAVLHRDDCKGLYVPPVQEIFPDKFIPSAAINEAFKKAHVRPEFDESPILVDVQDTGNILDPEYRLAYYREDVGINAHHWHWHLVYPSTWNPKYFGKKKDRKGELFYYMHQQMCARYDCERLSNGMHRMLPFNNFDEPLAGYAPHLTHVASGKYYSPRPDGLKLRDLGDIEISEMVRMRERILDSIHLGYVISEDGSHKTLDELHGTDILGALVESSYESVNHEYYGNLHNWGHVTMARIHDPDGRFHEEPGVMSDTSTSLRDPIFYNWHRFIDNIFHEYKNTLKPYDHDVLNFPDIQVQDVTLHARVDNVVHTFMREQELELKHGINPGNARSIKAKYYHLDHEPFSYAVNVQNNSASDKHATVRIFLAPKYDELGNEIKADELRRTAIELDKFKTDLHPGKNTVVRHSLDSSVTLSHQPTFEDLLHGVGLNEHKSEYCSCGWPSHLLVPKGNVAGMEYHLFVMLTDWDKDKVDGSESVACVDAVSYCGARDHKYPDKKPMGFPFDRPIHTEHISDFLTNNMFIKDIKIKFHE
>7vmv_E mol:protein length:82  Core protein
MSYYHHHHHHDYDIPTTENLYFQGAMGSADLSLEKAANVQWDEMADITGSSPIIEVKQDEDGSFSIRDIEETNMIAQVKTQR
>5o4y_F mol:protein length:16  PHE-MAA-ASN-PRO-HIS-LEU-SER-TRP-SER-TRP-9KK-9KK-ARG-CCS-GLY-NH2
FANPHLSWSWXXRCGX
>4hel_B mol:protein length:525  60 kDa chaperonin 4
AAKDVKFGNDARVKMLRGVNVLADAVKVTLGPKGRNVVLDKSFGAPTITKDGVSVAREIELEDKFENMGAQMVKEVASKANDAAGDGTTTATVLAQAIITEGLKAVAAGMNPMDLKRGIDKAVTAAVEELKALSVPCSDSKAIAQVGTISANSDETVGKLIAEAMDKVGKEGVITVEDGTGLQDELDVVEGMQFDRGYLSPYFINKPETGAVELESPFILLADKKISNIREMLPVLEAVAKAGKPLLIIAEDVEGEALATLVVNTMRGIVKVAAVKAPGFGDRRKAMLQDIATLTGGTVISEEIGMELEKATLEDLGQAKRVVINKDTTTIIDGVGEEAAIQGRVAQIRQQIEEATSDYDREKLQERVAKLAGGVAVIKVGAATEVEMKEKKARVEDALHATRAAVEEGVVAGGGVALIRVASKLADLRGQNEDQNVGIKVALRAMEAPLRQIVLNCGEEPSVVANTVKGGDGNYGYNAATEEYGNMIDMGILDPTKVTRSALQYAASVAGLMITTECMVTDLPK
>3dmd_B mol:protein length:328  Signal recognition particle receptor
GSHMASMFGKLREKLKSFVKRVEEEVEKEEEEVEKKGLLDRILTVEIKEKDVDKALDELEIDLLEADVALEVVDALREKIKQKLVGKKVRIGTDKGKIIEEAVKEAVSEILETSRRIDLIEEIRKAEKPYVIMFVGFNGSGKTTTIAKLANWLKNHGFSVVIAASDTFRAGAIEQLEEHAKRIGVKVIKHSYGADPAAVAYDAIQHAKARGIDVVLIDTAGRSETNRNLMDEMKKIARVTKPNLVIFVGDALAGNAIVEQARQFNEAVKIDGIILTKLDADARGGAALSISYVIDAPILFVGVGQGYDDLRPFEKEWFLERIFGEENA
>3jcd_D mol:protein length:209  50S ribosomal protein L3
MIGLVGKKVGMTRIFTEDGVSIPVTVIEVEANRVTQVKDLANDGYRAIQVTTGAKKANRVTKPEAGHFAKAGVEAGRGLWEFRLAEGEEFTVGQSISVELFADVKKVDVTGTSKGKGFAGTVKRWNFRTQDATHGNSLSHRVPGSIGQNQTPGKVFKGKKMAGQMGNERVTVQSLDVVRVDAERNLLLVKGAVPGATGSDLIVKPAVKA
>3ccj_K mol:protein length:132  50S ribosomal protein L14P
MEALGADVTQGLEKGSLITCADNTGARELKVISVHGYSGTKNRHPKAGLGDKITVSVTKGTPEMRRQVLEAVVVRQRKPIRRPDGTRVKFEDNAAVIVDENEDPRGTELKGPIAREVAQRFGSVASAATMIV
>7c2o_A mol:protein length:368  R-specific carbonyl reductase
MTKAVPDKFQGFAVSDPKNWNRPKLASYERKQINPHDVVLKNEVCGLCYSDIHTLSAGWQPLQRDNLVVGHEIIGEVIAVGDEVTEFKVGDRVGIGAASSSCRSCQRCDSDNEQYCKQGAATYNSKDVRSNNYVTQGGYSSHSIADEKFVFAIPEDLPSSYGAPLMCAGITVFSPLIRNLGLDARGKNVGIIGIGGLGHLALQFANAMGANVTAFSRSSSKKEQAMKLGAHDFVATGEDKTWYKNYDDHFDFILNCASGIDGLNLSEYLSTLKVDKKFVSVGLPPSEDKFEVSPFTFLQQGASFGSSLLGSKTEVKEMLNLAAKHNVRPMIEEVPISEENCAKALDRCHAGDVRYRFVFTDFDKAFKA
>6iax_B mol:protein length:355  Cyclic nucleotide-gated potassium channel mll3241
MSVLPFLRIYAPLNAVLAAPGLLAVAALTIPDMSGRSRLALAALLAVIWGAYLLQLAATLLKRRAGVVRDRTPKIAIDVLAVLVPLAAFLLDGSPDWSLYCAVWLLKPLRDSTFFPVLGRVLANEARNLIGVTTLFGVVLFAVALAAYVIERDIQPEKFGSIPQAMWWAVVTLSTTGYGDTIPQSFAGRVLAGAVMMSGIGIFGLWAGILATGFYQEVRRGDFVRNWQLVAAVPLFQKLGPAVLVEIVRALRARTVPAGAVICRIGEPGDRMFFVVEGSVSVATPNPVELGPGAFFGEMALISGEPRSATVSAATTVSLLSLHSADFQMLCSSSPEIAEIFRKTALERRGAAASA
>5l64_F mol:protein length:288  Probable proteasome subunit alpha type-7
MTSIGTGYDLSNSVFSPDGRNFQVEYAVKAVENGTTSIGIKCNDGVVFAVEKLITSKLLVPQKNVKIQVVDRHIGCVYSGLIPDGRHLVNRGREEAASFKKLYKTPIPIPAFADRLGQYVQAHTLYNSVRPFGVSTIFGGVDKNGAHLYMLEPSGSYWGYKGAATGKGRQSAKAELEKLVDHHPEGLSAREAVKQAAKIIYLAHEDNKEKDFELEISWCSLSETNGLHKFVKGDLLQEAIDFAQKEINGDDDEDEDDSDNVMSSDDENAPVATNANATTDQEGDIHLE
>6zn5_a mol:protein length:72  40S ribosomal protein S25
DKLNNLVLFDKATYDKLCKEVPNYKLITPAVVSERLKIRGSLARAALQELLSKGLIKLVSKHRAQVIYTRNT
>3b3v_A mol:protein length:291  Bacterial leucyl aminopeptidase
MPPITQQATVTAWLPQVDASQITGTISSLESFTNRFYTTTSGAQASDWIASEWQALSASLPNASVKQVSHSGYNQKSVVMTITGSEAPDEWIVIGGHLDSTIGSHTNEQSVAPGADDDASGIAAVTEVIRVLSENNFQPKRSIAFMAYAAEEVGLRGSQDLANQYKSEGKNVVSALQLDMTNYKGSAQDVVFITDYTDSNFTQYLTQLMDEYLPSLTYGFDTCGYACADHASWHNAGYPAAMPFESKFNDYNPRIHTTQDTLANSDPTGSHAKKFTQLGLAYAIEMGSATG
>2owp_A mol:protein length:129  Hypothetical protein Bxe_B1374
GMEVNQPDIVAQVQAAFVEYERALVENDIEAMNALFWHTPETVRYGIAEVQHGGEAIRAWRERCEPVPKSRKLHRTVVTTFGTDFATVSTEFTSDATPLLGRQMQTWARLSPADGWKIVAAHVSLIAMP
>6dr6_A mol:protein length:16  ORT-CYS-VAL-PHE-XXX-CYS-GLU-ASP-ORT-ALA-ILE-ILE-GLY-LEU-ORA-VAL
ACVFACEDAAIIGLAV
>7phw_F mol:protein length:209  Monoclonal antibody Cy.004 light chain
ALTQPSSVSANPGETVKITCSGSTYNYGWYQQKSPGSAPVTVIYYNDKRPSDIPSRFSGSKSGSTGTLTITGVQAEDEAVYYCGNSDSRNVAFGAGTTLTVLRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC
>3gvt_B mol:protein length:351  Pumilio homolog 2
GTGRSRLLEDFRNNRFPNLQLRDLIGHIVEFSQDQHGSRFIQQKLERATPAERQIVFNEILQAAYQLMTDVFGNYVIQKFFEFGSLDQKLALATRIRGHVLPLALQMYGCRVIQKALESISSDQQSEMVKELDGHVLKCVKDQNGNHVVQKCIECVQPQSLQFIIDAFKGQVFVLSTHPYGCRVIQRILEHCTAEQTLPILEELHQHTEQLVQDQYGNYVIQHVLEHGRPEDKSKIVSEIRGKVLALSQHKFASNVVEKCVTHASRAERALLIDEVCCQNDGPHSALYTMMKDQYANYVVQKMIDMAEPAQRKIIMHKIRPHITTLRKYTYGKHILAKLEKYYLKNSPDLG
>6z0l_B mol:protein length:50  Cys-N2 Strand
XGLCALRSELQALRREGFSPEELAALESELQALERELAALRSELQALRGX
>4ujc_CC mol:protein length:293  40S RIBOSOMAL PROTEIN US5
MADDAGAAGGPGGPGGPGMGNRGGFRGGFGSGIRGRGRGRGRGRGRGRGARGGKAEDKEWMPVTKLGRLVKDMKIKSLEEIYLFSLPIKESEIIDFFLGASLKDEVLKIMPVQKQTRAGQRTRFKAFVAIGDYNGHVGLGVKCSKEVATAIRGAIILAKLSIVPVRRGYWGNKIGKPHTVPCKVTGRCGSVLVRLIPAPRGTGIVSAPVPKKLLMMAGIDDCYTSARGCTATLGNFAKATFDAISKTYSYLTPDLWKETVFTKSPYQEFTDHLVKTHTRVSVQRTQAPAVATT
>6ywy_OO mol:protein length:320  Related to ribosomal protein S15 (Mitochondrial)
MPPRLPGPQGLRSLTLCLRPAVASPAQALQPLIQTANISQKEKKRKMKQDPYGWAQAQQRKAVNVKRQAELQAQRDAAWGDPVKGITTPFVESFDSAGQASVSPPKVGPDGQLVEEPKPLPTSPHLRNYLLNKDEFDSAIQYAEHILKPIKAEDRLTADPEKEDEEAREHAARHAKAVAALERIAKLEHGGAKDRKHANIRRCIETFGRHITDQSLERPTPPLARGVEPKPQPVRAGPDTGSSEVQIAILTSKIRALSKALEGHGGNRDKNNKRSLRRLCHKRQRLLRYMERKERGSGRWHHMLETLGLTPATWKGQITL
>5vyo_D mol:protein length:200  Thiol:disulfide interchange protein
SNAAGFAQASPSAPVAGKDFEVMKSPQPVSAPAGKVEVIEFFWYGCPHAYEFEPTIEAWVKKQGDKIAFKRVPVAFRDDFVPHSKLFYALAALGVSEKVTPAVFNAIHKEKNYLLTPQAQADFLATQGVDKKKFLDAYNSFSVQGQVKQSAELLKNYNIDGVPTIVVQGKYKTGPAYTNSLEGTAQVLDFLVKQVQDKKL
>2i0c_A mol:protein length:259  Glutamate receptor, ionotropic kainate 2
GSNRSLIVTTILEEPYVLFKKSDKPLYGNDRFEGYCIDLLRELSTILGFTYEIRLVEDGKYGAQDDVNGQWNGMVRELIDHKADLAVAPLAITCVREKVIDFSKPFMTLGISILYRKGTPIDSADDLAKQTKIEYGAVEDGATMTFFKKSKISTYDKMWAFMSSRRQSVLVKSNEEGIQRVLTSDYAFLMESTTIEFVTQRNCNLTQIGGLIDSKGYGVGTPMGSPYRDKITIAICQLQEEGKLHMMKEKWWRGNGCPS
>2pod_A mol:protein length:410  Mandelate racemase / muconate lactonizing enzyme
MSLKITEIETLRPEEFPNLLWVLVHTDEGITGLGETFYGACSAEAYIHEWAANRLIGEDPLQIDRHAKRLSGYLGFRSAGAEMRGNSALDIALWDIFGKATGQPIYQLLGGKCRDTIRTYNTCAGPHYVRTAKQQSVANWGLANSVSARYDDLNAFLHRADELALDLLDSGITAMKIWPFDPYAEASDGYYISKSDLKRALEPFEKIRRAVGDKMDVMVEFHSLWNLPPALQIAEALREYETFWHEDPIRMDSLSSLKRYAERSLAPVCASETLATRWGFRDLLETNAAGIVMLDISWCGGLSEARKIASMAEAWHLPVAPHDCTGPVVLTASTHLSLNAPNALVQESVRAFYDGWYRDLVTALPTVKDGHITVPDGPGLGLELMPDIRERLTIAVRNTSDCEGHHHHHH
>6bsr_A mol:protein length:666  PBP4 protein
MGSDKIHHHHHHENLYFQGHMSQWQAKQELAEAKKTATTFLNVLSKQEFDKLPSVVQEASLKKNGYDTKSVVEKYQAIYSGIQAEGVKASDVQVKKAKDNQYTFTYKLSMSTPLGEMKDLSYQSSIAKKGDTYQIAWKPSLIFPDMSGNDKISIQVDNAKRGEIVDRNGSGLAINKVFDEVGVVPGKLGSGAEKTANIKAFSDKFGVSVDEINQKLSQGWVQADSFVPITVASEPVTELPTGAATKDTESRYYPLGEAAAQLIGYTGTITAEDIEKNPELSSTGVIGKTGLERAFDKELRGQDGGSLVILDDKENVKKALQTKEKKDGQTIKLTIDSGVQQQAFAIFDKRPGSAVITDPQKGDLLATVSSPSYDPNKMANGISQKEYDAYNNNKDLPFTARFATGYAPGSTFKTITGAIGLDAGTLKPDEELEINGLKWQKDKSWGGYFATRVKEASPVNLRTALVNSDNIYFAQQTLRMGEDKFRAGLNKFIFGEELDLPIAMTPAQISNEDKFNSEILLADTGYGQGQLLISPIQQATMYSVFQNNGTLVYPKLVLDKETKKKDNVISANAANTIATDLLGSVEDPSGYVYNMYNPNFSLAAKTGTAEIKDKQDTDGKENSFLLTLDRSNNKFLTMIMVENSGENGSATDISKPLIDYLEATIK
>1i48_J mol:protein length:445  CYSTATHIONINE GAMMA-SYNTHASE
MAKAVDAAAAAAAAIAPVDTTVVNEDVALVENETCNDQNVQFDSLPSMKYASFLNSDGSVAIHAGERLGRGIVTDAITTPVVNTSAYFFNKTSELIDFKEKRRASFEYGRYGNPTTVVLEEKISALEGAESTLLMASGMCASTVMLLALVPAGGHIVTTTDCYRKTRIFIETILPKMGITATVIDPADVGALELALNQKKVNLFFTESPTNPFLRCVDIELVSKLCHEKGALVCIDGTFATPLNQKALALGADLVLHSATKFLGGHNDVLAGCISGPLKLVSEIRNLHHILGGALNPNAAYLIIRGMKTLHLRVQQQNSTALRMAEILEAHPKVRHVYYPGLQSHPEHHIAKKQMTGFGGAVSFEVDGDLLTTAKFVDALKIPYIAPSFGGCESIVDQPAIMSYWDLSQSDRAKYGIMDNLVRFSFGVEDFDDLKADILQALDSI
>3u39_C mol:protein length:319  6-phosphofructokinase
MKRIGVLTSGGDSPGMNAAIRSVVRKAIYHGVEVYGVYHGYAGLIAGNIKKLEVGDVGDIIHRGGTILYTARCPEFKTEEGQKKGIEQLKKHGIEGLVVIGGDGSYQGAKKLTEHGFPCVGVPGTIDNDIPGTDFTIGFDTALNTVIDAIDKIRDTATSHERTYVIEVMGRHAGDIALWSGLAGGAETILIPEADYDMNDVIARLKRGHERGKKHSIIIVAEGVGSGVDFGRQIQEATGFETRVTVLGHVQRGGSPTAFDRVLASRLGARAVELLLEGKGGRCVGIQNNQLVDHDIAEALANKHTIDQRMYALSKELSI
>5i8e_C mol:protein length:222  VRC34.01 Fab heavy chain
QEVLVQSGAEVKKPGASVKVSCRAFGYTFTGNALHWVRQAPGQGLEWLGWINPHSGDTTTSQKFQGRVYMTRDKSINTAFLDVTRLTSDDTGIYYCARDKYYGNEAVGMDVWGQGTSVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEP
>3mhv_C mol:protein length:117  Vacuolar protein sorting-associated protein 4
GSPDLAARTTMFEINVGDTPCVLTKEDYRTLGAMTEGYSGSDIAVVVKDALMQPIRKIQSATHFKDVSTEDDETRKLTPCSPGDDGAIEMSWTDIEADELKEPDLTIKDFLKAIKST
>7opd_d mol:protein length:1143  DNA damage-binding protein 1
SNAMSYNYVVTAQKPTAVNGCVTGHFTSAEDLNLLIAKNTRLEIYVVTAEGLRPVKEVGMYGKIAVMELFRPKGESKDLLFILTAKYNACILEYKQSGESIDIITRAHGNVQDRIGRPSETGIIGIIDPECRMIGLRLYDGLFKVIPLDRDNKELKAFNIRLEELHVIDVKFLYGCQAPTICFVYQDPQGRHVKTYEVSLREKEFNKGPWKQENVEAEASMVIAVPEPFGGAIIIGQESITYHNGDKYLAIAPPIIKQSTIVCHNRVDPNGSRYLLGDMEGRLFMLLLEKEEQMDGTVTLKDLRVELLGETSIAECLTYLDNGVVFVGSRLGDSQLVKLNVDSNEQGSYVVAMETFTNLGPIVDMCVVDLERQGQGQLVTCSGAFKEGSLRIIRNGIGIHEHASIDLPGIKGLWPLRSDPNRETDDTLVLSFVGQTRVLMLNGEEVEETELMGFVDDQQTFFCGNVAHQQLIQITSASVRLVSQEPKALVSEWKEPQAKNISVASCNSSQVVVAVGRALYYLQIHPQELRQISHTEMEHEVACLDITPLGDSNGLSPLCAIGLWTDISARILKLPSFELLHKEMLGGEIIPRSILMTTFESSHYLLCALGDGALFYFGLNIETGLLSDRKKVTLGTQPTVLRTFRSLSTTNVFACSDRPTVIYSSNHKLVFSNVNLKEVNYMCPLNSDGYPDSLALANNSTLTIGTIDEIQKLHIRTVPLYESPRKICYQEVSQCFGVLSSRIEVQDTSGGTTALRPSASTQALSSSVSSSKLFSSSTAPHETSFGEEVEVHNLLIIDQHTFEVLHAHQFLQNEYALSLVSCKLGKDPNTYFIVGTAMVYPEEAEPKQGRIVVFQYSDGKLQTVAEKEVKGAVYSMVEFNGKLLASINSTVRLYEWTTEKELRTECNHYNNIMALYLKTKGDFILVGDLMRSVLLLAYKPMEGNFEEIARDFNPNWMSAVEILDDDNFLGAENAFNLFVCQKDSAATTDEERQHLQEVGLFHLGEFVNVFCHGSLVMQNLGETSTPTQGSVLFGTVNGMIGLVTSLSESWYNLLLDMQNRLNKVIKSVGKIEHSFWRSFHTERKTEPATGFIDGDLIESFLDISRPKMQEVVANLQYDDGSGMKREATADDLIKVVEELTRIH
>7ba7_A mol:protein length:236  14-3-3 protein sigma
GAMGSMERASLIQKAKLAEQAERYEDMAAFMKGAVEKGEELSNEERCLLSVAYKNVVGGQRAAWRVLSSIEQKSNEEGSEEKGPEVREYREKVETELQGVCDTVLGLLDSHLIKEAGDAESRVFYLKMKGDYYRYLAEVATGDDKKRIIDSARSAYQEAMDISKKEMPPTNPIRLGLALNFSVFHYEIANSPEEAISLAKTTFDEAMADLHTLSEDSYKDSTLIMQLLRDNLTLWT
>4v8d_CE mol:protein length:256  30S RIBOSOMAL PROTEIN S2
MPVEITVKELLEAGVHFGHERKRWNPKFARYIYAERNGIHIIDLQKTMEELERTFRFIEDLAMRGGTILFVGTKKQAQDIVRMEAERAGMPYVNQRWLGGMLTNFKTISQRVHRLEELEALFASPEIEERPKKEQVRLKHELERLQKYLSGFRLLKRLPDAIFVVDPTKEAIAVREARKLFIPVIALADTDSDPDLVDYIIPGNDDAIRSIQLILSRAVDLIIQARGGVVEPSPSYALVQEAEATETPEGESEVEA
>6ald_D mol:protein length:363  FRUCTOSE-1,6-BIS(PHOSPHATE) ALDOLASE
PHSHPALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQLLLTADDRVNPCIGGVILFHETLYQKADDGRPFPQVIKSKGGVVGIKVDKGVVPLAGTNGETTTQGLDGLSERCAQYKKDGADFAAWRCVLKIGEHTPSALAIMENANVLARYASICQQNGIVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQKYSHEEIAMATVTALRRTVPPAVTGVTFLSGGQSEEEASINLNAINKCPLLKPWALTFSYGRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESLFISNHAY
>3eff_N mol:protein length:139  Voltage-gated potassium channel
SALHWRAAGAATVLLVIVLLAGSYLAVLAERGAPGAQLITYPRALWWSVETATTVGYGDLYPVTLWGRLVAVVVMVAGITSFGLVTAALATWFVGREQERRGHFVRHSEKAAEEAYTRTTRALHERFDRLERMLDDNRR
>1px6_B mol:protein length:209  Glutathione S-transferase P
PPYTVVYFPVRGRCAALRMLLADQGQSWKEEVVTVETWQEGSLKASCLYGQLPKFQDGDLTLYQSNTILRHLGRTLGLYGKDQQEAALVDMVNDGVEDLRCKYISLIYTNYEAGKDDYVKALPGQLKPFETLLSQNQGGKTFIVGDQISFANYNLLDLLLIHEVLAPGCLDAFPLLSAYVGRLSARPKLKAFLASPEYVNLPINGNGKQ
>6lkn_C mol:protein length:361  Cell cycle control protein 50A
MAMNYNAKDEVDGGPPCAPGGTAKTRRPDNTAFKQQRLPAWQPILTAGTVLPIFFIIGLIFIPIGIGIFVTSNNIREIEIDYTGTEPSSPCNKCLSPDVTPCFCTINFTLEKSFEGNVFMYYGLSNFYQNHRRYVKSRDDSQLNGDSSALLNPSKECEPYRRNEDKPIAPCGAIANSMFNDTLELFLIGQDSYPIPIALKKKGIAWWTDKNVKFRNPPGGDNLEERFKGTTKPVNWLKPVYMLDSDPDNNGFINEDFIVWMRTAALPTFRKLYRLIERKSDLHPTLPAGRYWLNVTYNYPVHYFDGRKRMILSTISWMGGKNPFLGIAYIAVGSISFLLGVVLLVINHKYRNSSNTADITI
>1ees_A mol:protein length:178  GTP-BINDING PROTEIN
MQTIKCVVVGDGAVGKTCLLISYTTNKFPSEYVPTVFDNYAVTVMIGGEPYTLGLFDTAGQEDYDRLRPLSYPQTDVFLVCFSVVSPSSFENVKEKWVPEITHHCPKTPFLLVGTQIDLRDDPSTIEKLAKNKQKPITPETAEKLARDLKAVKYVECSALTQKGLKNVFDEAILAALE
>3ow9_B mol:protein length:6  KLVFFA hexapeptide segment from Amyloid beta
KLVFFA
>7ezx_hI mol:protein length:164  Phycoerythrin alpha subunit
MKSVITTVVSAADAAGRFPSNSDLESIQGNIQRSAARLEAAEKLAGNHEAVVKEAGDACFAKYAYLKNPGEAGENQEKINKCYRDVDHYMRLVNYCLVVGGTGPLDEWGIAGAREVYRTLNLPTSAYVASIAYTRDRLCVPRDMSAQAGVEFSAYLDYLINALS
>7o2z_P mol:protein length:9  P/A#1 epitope peptide
XAPAPAAPA
>6zsk_A mol:protein length:158  Cytochrome c
MNKPSFLLVGLLVVSGVLGAAETKVKYPDGFRSWYHVKSMVIQPGHPLENPFGGIHHVYANAEAIQGLRGGNYPDGAVLVFDLFDYQEDNHALVEGKRKLIGVMERDAKRFSATGGWGYEGFGEGKPDKRLVTDGGQGCFGCHAAQKESQYVFSRLRD
>5k28_B mol:protein length:64  Mitogen-activated protein kinase kinase kinase 11
HMPVWTALFDYEPSGQDELALRKGDRVEVLSRDAAISGDEGWWAGQVGGQVGIFPSNYVSRGGG
>6xc7_D mol:protein length:215  CC12.3 light chain
EIVLTQSPGTLSLSPGERATLSCRASQSVSSYLAWYQQKPGQAPRLLIYGASSRATGIPDRFSGSGSGTDFTLTISRLEPEDFAVYYCQQYGSSPRTFGQGTKLEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGECS
>3mfe_O mol:protein length:240  Proteasome subunit alpha
MEQAMRERSELARKGIARAKSVVALAYAGGVLFVAENPSRSLQKISELYDRVGFAAAGKFNEFDNLRRGGIQFADTRGYAYDRRDVTGRQLANVYAQTLGTIFTEQAKPYEVELCVAEVAHYGETKRPELYRITYDGSIADEPHFVVMGGTTEPIANALKESYAENASLTDALRIAVAALRAGSADTSGGDQPTLGVASLEVAVLDANRPRRAFRRITGSALQALLVDQESPQSDGESSG
>5uuh_A mol:protein length:241  DNA-7-methylguanine glycosylase
GPVPMHPFVKALQEHFTAHQNPEKAEPMARYMKNHFLFLGIQTPERRQLLKDIIQIHTLPDQKDFQIIIRELWDLPEREFQAAALDIMQKYKKHINETHIPFLEELIVTKSWWDSVDSIVPTFLGDIFLKHPELISAYIPKWIASDNIWLQRAAILFQLKYKQKMDEELLFWIIGQLHSSKEFFIQKAIGWVLREYAKTNPDVVWEYVQNNELAPLSKREAIKHIKQNYGINNEKIGETLS
>4y6t_C mol:protein length:166  Coat protein
MTAPIPVVPVSRPQAKTSLKLPNNQVWVTRKASEWSAKTIDTNDAIPFKTIVEGIPEINSETKFYRLLIGFVAVSDGTFGMVDGVTGDVIPDPPVVGRLGFKKNTYRSRDFDLGGKLLNQLDDRAIVWCLDERRRDAKRVQLAGYWIAISKPAPLMPPEDFLVNQD
>1hx6_B mol:protein length:394  MAJOR CAPSID PROTEIN
AQVQQLTPAQQAALRNQQAMAANLQARQIVLQQSYPVIQQVETQTFDPANRSVFDVTPANVGIVKGFLVKVTAAITNNHATEAVALTDFGPANLVQRVIYYDPDNQRHTETSGWHLHFVNTAKQGAPFLSSMVTDSPIKYGDVMNVIDAPATIAAGATGELTMYYWVPLAYSETDLTGAVLANVPQSKQRLKLEFANNNTAFAAVGANPLEAIYQGAGAADCEFEEISYTVYQSYLDQLPVGQNGYILPLIDLSTLYNLENSAQAGLTPNVDFVVQYANLYRYLSTIAVFDNGGSFNAGTDINYLSQRTANFSDTRKLDPKTWAAQTRRRIATDFPKGVYYCDNRDKPIYTLQYGNVGFVVNPKTVNQNARLLMGYEYFTSRTELVNAGTISTT
>2hbg_A mol:protein length:147  HEMOGLOBIN (DEOXY)
GLSAAQRQVIAATWKDIAGADNGAGVGKKCLIKFLSAHPQMAAVFGFSGASDPGVAALGAKVLAQIGVAVSHLGDEGKMVAQMKAVGVRHKGYGNKHIKAQYFEPLGASLLSAMEHRIGGKMNAAAKDAWAAAYADISGALISGLQS
>3wry_D mol:protein length:451  Replicase large subunit
SYTRSEEIESLEQFHMATASSLIHKQMCSIVYTGPLKVQQMKNFIDSLVASLSAAVSNLVKILKDTAAIDLETRQKFGVLDVASKRWLVKPSAKNHAWGVVETHARKYHVALLEHDEFGIITCDNWRRVAVSSESVVYSDMAKLRTLRRLLKDGEPHVSSAKVVLVDGVPGCGKTKEILSRVNFEEDLILVPGRQAAEMIRRRANASGIIVATKDNVRTVDSFLMNYGKGARCQFKRLFIDEGLMLHTGCVNFLVEMSLCDIAYVYGDTQQIPYINRVTGFPYPAHFAKLEVDEVETRRTTLRCPADVTHFLNQRYEGHVMCTSSEKKSVSQEMVSGAASINPVSKPLKGKILTFTQSDKEALLSRGYADVHTVHEVQGETYADVSLVRLTPTPVSIIARDSPHVLVSLSRHTKSLKYYTVVMDPLVSIIRDLERVSSYLLDMYKVDAGTQ
>6hvt_U mol:protein length:252  Proteasome subunit alpha type-1
MSGAAAASAAGYDRHITIFSPEGRLYQVEYAFKATNQTNINSLAVRGKDCTVVISQKKVPDKLLDPTTVSYIFCISRTIGMVVNGPIPDARNAALRAKAEAAEFRYKYGYDMPCDVLAKRMANLSQIYTQRAYMRPLGVILTFVSVDEELGPSIYKTDPAGYYVGYKATATGPKQQEITTNLENHFKKSKIDHINEESWEKVVEFAITHMIDALGTEFSKNDLEVGVATKDKFFTLSAENIEERLVAIAEQD
>5z3u_H mol:protein length:122  Histone H2B 1.1
AKSAPAPKKGSKKAVTKTQKKDGKKRRKTRKESYAIYVYKVLKQVHPDTGISSKAMSIMNSFVNDVFERIAGEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKAVTKYTSAK
>2ex3_C mol:protein length:575  DNA polymerase
MKHMPRKMYSCAFETTTKVEDCRVWAYGYMNIEDHSEYKIGNSLDEFMAWVLKVQADLYFHNLKFAGAFIINWLERNGFKWSADGLPNTYNTIISRMGQWYMIDICLGYKGKRKIHTVIYDSLKKLPFPVKKIAKDFKLTVLKGDIDYHKERPVGYKITPEEYAYIKNDIQIIAEALLIQFKQGLDRMTAGSDSLKGFKDIITTKKFKKVFPTLSLGLDKEVRYAYRGGFTWLNDRFKEKEIGEGMVFDVNSLYPAQMYSRLLPYGEPIVFEGKYVWDEDYPLHIQHIRCEFELKEGYIPTIQIKRSRFYKGNEYLKSSGGEIADLWLSNVDLELMKEHYDLYNVEYISGLKFKATTGLFKDFIDKWTYIKTTSEGAIKQLAKLMLNSLYGKFASNPDVTGKVPYLKENGALGFRLGEEETKDPVYTPMGVFITAWARYTTITAAQACYDRIIYCDTDSIHLTGTEIPDVIKDIVDPKKLGYWAHESTFKRAKYLRQKTYIQDIYMKEVDGKLVEGSPDDYTDIKFSVKCAGMTDKIKKEVTFENFKVGFSRKMKPKPVQVPGGVVLVDDTFTIK
>2jo4_D mol:protein length:22  KIA7
XAKAAAAAIKAIAAIIKAGGYX
>7vd5_b mol:protein length:484  Photosystem II CP47 reaction center protein
ALPWYRVHTVVLNDPGRLIAVHLMHTALVAGWAGSMALYELAVFDPSDPVLNPMWRQGMFVMPFMTRLGITDSWGGWSITGESVSNPGIWSFEGVALSHIILSGMCFLAAIWHWVYWDLELFRDPRTGEPALDLPKIFGIHLFLSGLLCFGFGAFHVTGLFGPGIWVSDAYGITGKVQPVAPAWGADGFNPFNPGGIAAHHIAAGIFGIFAGIFHLTVRPPQRLYRALRMGNIETVLSSSISAVFFAAFVTSGTMWYGAAATPIELFGPTRYQWDSGYFQQEIERQVETSVSEGLSESQAWSRIPDKLAFYDYIGNNPAKGGLFRAGPMNKGDGIAEAWLGHPIFRDKEGRELTVRRMPAFFETFPVILVDKDGIIRADIPFRRAESKYSIEQVGVTVDFYGGKLNGQTFKDAPTVKKFARKAQLGEVFEFDRTSLESDGVFRSSPRGWYTYGHANFALLFFFGHLWHGGRTIFRDVFTGIGAE
>7c4w_C mol:protein length:240  Capsid protein VP3
GIPAELRPGTNQFLTTDDDTAAPILPGFTPTPTIHIPGEVHSLLELCRVETILEVNNTTEATGLTRLLIPVSSQNKADELCAAFMVDPGRIGPWQSTLVGQICRYYTQWSGSLKVTFMFTGSFMATGKMLVAYSPPGSAQPANRETAMLGTHVIWDFGLQSSVSLVIPWISNTHFRTAKTGGNYDYYTAGVVTLWYQTNYVVPPETPGEAYIIAMGAAQDNFTLKICKDTDEVTQQAVLQ
>4w2f_CS mol:protein length:93  30S Ribosomal Protein S19
MPRSLKKGVFVDDHLLEKVLELNAKGEKRLIKTWSRRSTIVPEMVGHTIAVYNGKQHVPVYITENMVGHKLGEFAPTRTYRGHGKEAKATKKK
>5s64_B mol:protein length:445  Tubulin beta-2B chain
MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGSYHGDSDLQLERINVYYNEATGNKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWAKGHYTEGAELVDSVLDVVRKESESCDCLQGFQLTHSLGGGTGSGMGTLLISKIREEYPDRIMNTFSVMPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEALYDICFRTLKLTTPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSRGSQQYRALTVPELTQQMFDSKNMMAACDPRHGRYLTVAAIFRGRMSMKEVDEQMLNVQNKNSSYFVEWIPNNVKTAVCDIPPRGLKMSATFIGNSTAIQELFKRISEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATADEQGEFEEEEGEDEA
>3tdp_B mol:protein length:257  formate/nitrite transporter
RAHKETLDKLTNAAINKINLLNTSKVKYLVSSAFAGLYVGIGILLIFTIGGLLTDAGSPMTKIVMGLSFAIALSLVIMTGTELFTGNNMVMSAGMLNKGVSIKDTSKIWAYSWVGNLIGALVLGIIFVGTGLVDKGPVAEFFANTAASKASMPFTALFFRGILCNILVCVSVLCSFRTNSDTAKIIMIFLCLFAFITSGFEHSVANMTIYSVSLFSPTISTVTIGGAIYNLVAVTLGNIVGGALFMGLGTYILGKEK
>4jpj_B mol:protein length:181  Germline-targeting HIV-1 gp120 engineered outer domain, eOD-GT6
DTITLPCRPAPPPHCSSNITGLILTRDGGVSNDETEIFRPSGGDMRDIARCQIAGTVVSTQLFLNGSLAEEEVVIRSVDFRDNAKSICVQLDTSVEIDCTGAGHCDISRAKWDNTLKQIASKLREQFGDRTIIFKQSSGGDPEFVTHSFNCGGEFFYCDSTQLFDSTWFDSTGTKHHHHHH
>5ohm_F mol:protein length:116  K33-specific affimer
MSAATGVRAVPGNENSLEIEELARFAVDEHNKKENALLEFVRVVKAKEQIWEMDASKETMYYLTLEAKDGGKKKLYEAKVWVKMTHWIGAMNNFKELQEFKPVGDAAAAHHHHHHG
>7eqg_B mol:protein length:434  Type I-F CRISPR-associated protein Csy1
MTSPLPTPTWQELRQFIESFIQERLQGKLDKLHPDEDDKRQTLLATHRREAWLADAARRVGQLQLVTHTLKPIHPDARGSNLHSLPQAPGQPGLAGSHELGDRLVSDVVGNAAALDVFKFLSLQYQGKNLLNWLTEDSAEAVQALSDNAEQAREWRQAFIGITAVKGAPASHSLAKQLYFPLPGSGYHLLAPLFPTSLVHHVHALLREARFGDAAKAAREARSRQESWPHGFSEYPNLAIQKFGGTKPQNISQLNSERYGENWLLPSLPPHWQRQDQRAPIRHSSVFEHDFGRSPEVSRLTRTLQRLLAKTRHNNFTIRRYRAQLVGQICDEALQYAARLRELEPGWSATPGCQLHDAEQLWLDPLRAQTDETFLQRRLRGDWPAEVGNRFANWLNRAVSSDSQILGSPEAAQWSQELSKELTMFKEILEDERD
>4a98_F mol:protein length:307  CYS-LOOP LIGAND-GATED ION CHANNEL
PVDVSVSIFINKIYGVNTLEQTYKVDGYIVAQWTGKPRKTPGDKPLIVENTQIERWINNGLWVPALEFINVVGSPDTGNKRLMLFPDGRVIYNARFLGSFSNDMDFRLFPFDRQQFVLELEPFSYNNQQLRFSDIQVYTENIDNEEIDEWWIRGKASTHISDIRYDHLSSVQPNQNEFSRITVRIDAVRNPSYYLWSFILPLGLIIAASWSVFWLESFSERLQTSFTLMLTVVAYAFYTSNILPRLPYTTVIDQMIIAGYGSIFAAILLIIFAHHRQANGVEDDLLIQRCRLAFPLGFLAIGCVLVI
>6trc_z mol:protein length:36  Photosystem I 4.8K protein
MATKSAKPTYAFRTFWAVLLLAINFLVAAYYFGILK
>3lte_O mol:protein length:132  Response regulator
MSLKQSKRILVVDDDQAMAAAIERVLKRDHWQVEIAHNGFDAGIKLSTFEPAIMTLDLSMPKLDGLDVIRSLRQNKVANQPKILVVSGLDKAKLQQAVTEGADDYLEKPFDNDALLDRIHDLVNEGHHHHHH
>7jql_1D mol:protein length:276  50S ribosomal protein L2
MAVKKFKPYTPSRRFMTVADFSEITKTEPEKSLVKPLKKTGGRNNQGRITVRFRGGGHKRLYRIIDFKRWDKVGIPAKVAAIEYDPNRSARIALLHYVDGEKRYIIAPDGLQVGQQVVAGPDAPIQVGNALPLRFIPVGTVVHAVELEPKKGAKLARAAGTSAQIQGREGDYVILRLPSGELRKVHGECYATVGAVGNADHKNIVLGKAGRSRWLGRRPHVRGAAMNPVDHPHGGGEGRAPRGRPPASPWGWQTKGLKTRKRRKPSSRFIIARRKK
>6wvt_O mol:protein length:236  Catenin alpha-1
AIMAQLPQEQKAKIAEQVASFQEEKSKLDAEVSKWDDSGNDIIVLAKQMCMIMMEMTDFTRGKGPLKNTSDVISAAKKIAEAGSRMDKLGRTIADHCPDSACKQDLLAYLQRIALYCHQLNICSKVKAEVQNLGGELVVSGVDSAMSLIQAAKNLMNAVVQTVKASYVASTKYQKSQGMASLNLPAVSWKMKAPEKKPLVKREKQDETQTKIKRASQKKHVNPVQALSEFKAMDSI
>6oq5_F mol:protein length:142  7F
SNSQVQLVESGGGLVEAGGSLRLSCVVTGSSFSTSTMAWYRQPPGKQREWVASFTSGGAIKYTDSVKGRFTMSRDNAKKMTYLQMENLKPEDTAVYYCALHNAVSGSSWGRGTQVTVSSEPKTPKPQTSGAPVPYPDPLEPR
>5ekc_C mol:protein length:491  Aldehyde dehydrogenase
MIDLNIMKVANYINGEFKEPSTGAFQVKTSPVDGSKIAEVPRSGREDAREAIDSAFEALKAWANIPAIRRAEYLYKMLEVFRQMKEDFMKILTVEGGGTYRKVWGEVVFTERLIQNAAELARHYQGRVLQSDSESTISVVFKRSKGVVGVITPWNYPLSISMKKIAHTLAVGNTVVYKPASDTPVTGWLIAQMVAKAGLPKGVFNLVIGPGPVVGEEIVTHKRVAHVTFTGESSTGREIAAKAAGTLKTVTLELGGSDPLIILDDVDVDYAARLAVFASLFHQGQICTSAKRIIVHKAVADKFIERYVHYVKMLRIDDPRKDEKVDLGPLINERQVALMKEFVDDAVSRGGRLLIGGRSWGNFFEPAIFVDVDRNFRIMREEVFGPVRPIVVVENDDQAVEVANDTDYGLSGAVLTNNVNRAFRIAEAVESGMFHINDVTFLEESHVPFGGIKASGVGREGGEWSFHETTYDRWVTVTLRTRRFPIPSALK
>3fby_A mol:protein length:551  Cartilage oligomeric matrix protein
RSPWPGVPTSPVWWNSAQRFCPDGSPSECHEHADCVLERDGSRSCVCAVGWAGNGILCGRDTDLDGFPDEKLRCPERQCRKDNCVTVPNSGQEDVDRDGIGDACDPDADGDGVPNEKDNCPLVRNPDQRNTDEDKWGDACDNCRSQKNDDQKDTDQDGRGDACDDDIDGDRIRNQADNCPRVPNSDQKDSDGDGIGDACDNCPQKSNPDQADVDHDFVGDACDSDQDQDGDGHQDSRDNCPTVPNSAQEDSDHDGQGDACDDDDDNDGVPDSRDNCRLVPNPGQEDADRDGVGDVCQDDFDADKVVDKIDVCPENAEVTLTDFRAFQTVVLDPEGDAQIDPNWVVLNQGREIVQTMNSDPGLAVGYTAFNGVDFEGTFHVNTVTDDDYAGFIFGYQDSSSFYVVMWKQMEQTYWQANPFRAVAEPGIQLKAVKSSTGPGEQLRNALWHTGDTESQVRLLWKDPRNVGWKDKKSYRWFLQHRPQVGYIRVRFYEGPELVADSNVVLDTTMRGGRLGVFCFSQENIIWANLRYRCNDTIPEDYETHQLRQAGT
>6h58_h mol:protein length:129  30S ribosomal protein S8
SMQDPIADMLTRIRNGQAANKAAVTMPSSKLKVAIANVLKEEGFIEDFKVEGDTKPELELTLKYFQGKAVVESIQRVSRPGLRIYKRKDELPKVMAGLGIAVVSTSKGVMTDRAARQAGLGGEIICYVA
>4bts_DN mol:protein length:55  40S RIBOSOMAL PROTEIN RPS29E
MPNKLWRTHPRNYGKDSKECRVCGARQGLITKYEMMTCRRCFREQAPHIGFVKYR
>6qq8_A mol:protein length:239  Green fluorescent protein
MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTWGVQCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNAISDNVYITADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYK
>1a93_B mol:protein length:34  MAX PROTEIN
XCGGMRRKNDTHQQDIDDLKRQNALLEQQVRALX
>2fyq_A mol:protein length:194  Chymotrypsin-like cysteine proteinase
MAHHHHHHDDDDKAPPTLWSRVTKFGSGWGFWVSPTVFITTTHVVPTGVKEFFGEPLSSIAIHQAGEFTQFRFSKKMRPDLTGMVLEEGCPEGTVCSVLIKRDSGELLPLAVRMGAIASMRIQGRLVHGQSGMLLTGANAKGMDLGTIPGDCGAPYVHKRGNDWVVCGVHAAATKSGNTVVCAVQAGEGETALE
>6q98_n mol:protein length:130  30S ribosomal protein S9
MAENQYYGTGRRKSSAARVFIKPGNGKIVINQRSLEQYFGRETARMVVRQPLELVDMVEKLDLYITVKGGGISGQAGAIRHGITRALMEYDESLRSELRKAGFVTRDARQVERKKVGLRKARRRPQFSKR
>4ujd_Cc mol:protein length:69  40S RIBOSOMAL PROTEIN ES28
MDTSRVQPIKLARVTKVLGRTGSQGQCTQVRVEFMDDTSRSIIRNVKGPVREGDVLTLLESEREARRLR
>4eef_G mol:protein length:74  F-HB80.4, DESIGNED HEMAGGLUTININ BINDING PROTEIN
MDYKDDDDKGSHMASTRGSGRPWKFSENIAFEIALSFTNKDTPDRWKKVAQYVKGRTPEEVKKHYELEHHHHHH
>4quo_A mol:protein length:868  Aminopeptidase N
KTVHYLKDYQTPAYHILKTDLHFDINEPQTVVKSRLTVEPQRVGEPLVLDGSAKLLSVKINGAAADYVLEGETLTIAGVPSERFTVEVETEILPAENKSLMGLYASGGNLFTQCEPEGFRKITFYIDRPDVMSKFTTTIVADKKRYPVLLSNGNKIDGGEFSDGRHWVKWEDPFSKPSYLFALVAGDLAVTEDYFTTMSGRNVKIEFYTTEADKPKVGFAVESLKNAMKWDETRFGLEYDLDIFMVVAVGDFNMGAMENKGLNIFNTKFVLADSRTATDTDFEGIESVVGHEYFHNWTGNRVTCRDWFQLSLKEGLTVFRDQEFSGDRASRAVRRIENIRLLRQHQFPEDAGPTAHPVRPASYEEMNNFYTMTVYEKGAEVVRMYHTLLGEEGFQKGMKLYFQRHDGQAVTCDDFRAAMADANGINLDQFALWYSQAGTPVLEAEGRLKNNIFELTVKQTVPPTPDMTDKQPMMIPVKVGLLNRNGEAVAFDYQGKRATEAVLLLTEAEQTFLLEGVTEAVVPSLLRGFSAPVHLNYPYSDDDLLLLLAHDSDAFTRWEAAQTLYRRAVAANLATLSDGVELPKHEKLLAAVEKVISDDLLDNAFKALLLGVPSEAELWDGAENIDPLRYHQAREALLDTLAVHFLPKWHELNRQAAKQENQSYEYSPEAAGWRTLRNVCRAFVLRADPAHIETVAEKYGEMAQNMTHEWGILSAVNGNESDTRNRLLAQFADKFSDDALVMDKYFALVGSSRRSDTLQQVRTALQHPKFSLENPNKARSLIGSFSRNVPHFHAEDGSGYRFIADKVIEIDRFNPQVAARLVQAFNLCNKLEPHRKNLVKQALQRIRAQEGLSKDVGEIVGKILDSNA
>6olg_BM mol:protein length:120  40S ribosomal protein S12
VMDVNTALQEVLKTALIHDGLARGIREAAKALDKRQAHLCVLASNCDEPMYVKLVEALCAEHQINLIKVDDNKKLGEWVGLCKIDREGKPRKVVGCSCVVVKDYGKESQAKDVIEEYFKC
>6wgc_9 mol:protein length:513  Cell division control protein 6
MSAIPITPTKRIRRNLFDDAPATPPRPLKRKKLQFTDVTPESSPEKLQFGSQSIFLRTKALLQKSSELVNLNSSDGALPARTAEYEQVMNFLAKAISEHRSDSLYITGPPGTGKTAQLDMIIRQKFQSLPLSLSTPRSKDVLRHTNPNLQNLSWFELPDGRLESVAVTSINCISLGEPSSIFQKIFDSFQDLNGPTLQIKNMQHLQKFLEPYHKKTTFVVVLDEMDRLLHANTSETQSVRTILELFLLAKLPTVSFVLIGMANSLDMKDRFLSRLNLDRGLLPQTIVFQPYTAEQMYEIVIQKMSSLPTIIFQPMAIKFAAKKCAGNTGDLRKLFDVLRGSIEIYELEKRFLLSPTRGSLNSAQVPLTPTTSPVKKSYPEPQGKIGLNYIAKVFSKFVNNNSTRTRIAKLNIQQKLILCTIIQSLKLNSDATIDESFDHYIKAITKTDTLAPLQRNEFLEICTILETCGLVSIKKTKCKGKTKRFVDKIDVDLDMREFYDEMTKISILKPFLH
>7nqh_BF mol:protein length:294  Mitochondrial ribosomal protein L4
MLQLVRAGARTWFRPSGCRGLNTLAEEAVQQAEKPESVASLGLQPPVLRKCELPVPAHRRPVQAWIESLRGYEQERVGLTELHPDVFSTAPRLDILHQVAIWQKNFKRISYAKTKTRAEVRGGGRKPWVQKGSGRARHGSIRSPIWRGGGVAHGPRGPTSYYYMLPMKVRVQGLKVALTVKLAQDDLHIVDSLELPTADPQYLIELARYRRWGDSVLLVDLEHEDMPQNVVAATSGLKTFNLVPAVGLNVHSMLKHQTLVLTLPTVAFLEEKLLWHNSRYTPLYPFRLPYCDFP
>1xm9_A mol:protein length:457  plakophilin 1
GLTIPKAVQYLSSQDEKYQAIGAYYIQHTCFQDESAKQQVYQLGGICKLVDLLRSPNQNVQQAAAGALRNLVFRSTTNKLETRRQNGIREAVSLLRRTGNAEIQKQLTGLLWNLSSTDELKEELIADALPVLADRVIIPFSGWCDGNSNMSREVVDPEVFFNATGCLRNLSSADAGRQTMRNYSGLIDSLMAYVQNCVAASRCDDKSVENCMCVLHNLSYRLDAEVPTRYRQLEYNARNAYTEKSSTGCFSNKSDKMMNNNYDCPLPEEETNPKGSGWLYHSDAIRTYLNLMGKSKKDATLEACAGALQNLTASKGLMSSGMSQLIGLKEKGLPQIARLLQSGNSDVVRSGASLLSNMSRHPLLHRVMGNQVFPEVTRLLTSHTGNTSNSEDILSSACYTVRNLMASQPQLAKQYFSSSMLNNIINLCRSSASPKAAEAARLLLSDMWSSKELQGVL
>6h06_D mol:protein length:219  HUMAN FAB ANTIBODY FRAGMENT OF HCBTAU-22.1
DVVMTQSPLSLPVTPGEPASISCRSSQSLLHRSGHKYLHWYLQRPGQSPQVLIYLGSNRASGVPDRFSGSGSGTDFTLKISRVEAEDVGLYYCMQTLQTPWTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC
>4xr3_A mol:protein length:316  DNA replication terminus site-binding protein
MHHHHHHMARYDLVDRLNTTFRQMEQELAIFAAHLEQHKLLVARVFSLPEVKKEDEHNPLNRIEVKQHLGNDAQSLALRHFRHLFIQQQSENRSSKAAVRLPGVLCYQVDNLSQAALVSHIQHINKLKTTFEHIVTVESELPTAARFEWVHRHLPGLITLNAYRTLTVLHDPATLRFGWANKHIIKNLHRDEVLAQLEKSLKSPRSVAPWTREEWQRKLEREYQDIAALPQNAKLKIKRPVKVQPIARVWYKGDQKQVQHACPTPLIALINRDNGAGVPDVGELLNYDADNVQHRYKPQAQPLRLIIPRLHLYVAD
>4wqr_5I mol:protein length:61  30S ribosomal protein S14 type Z
MARKALIEKAKRTPKFKVRAYTRCVRCGRARSVYRFFGLCRICLRELAHKGQLPGVRKASW
>5dkn_A mol:protein length:92  Protein S100-B
MSELEKAVVALIDVFHQYSGREGDKHKLKKSELKELINNELSHFLEEIKEQEVVDKVMETLDSDGDGECDFQEFMAFVAMITTACHEFFEHE
>5z0z_B mol:protein length:465  Pilus assembly protein
MGRDPNSTTTVDFTLHKIEQTSDEQIQNTGHDLGLTGRKPVQGAQFKIFNVTDAFYQLLENHDKTTAASMISQNLGQYVNLQDPNAATVTTDADGLAAFKGLAAKTNGRHSVYAFHEAVTPQPYQKAADMIVSLPVRQDDGSDLTNIHLYPKDSLVTKNLTEINEQAVATKDLHDVAVGDVLTYQVQFQIPHDIGALADHSQDTFKYNQFKVLAYMTKEGLTFKALTAITVDGQDILKALTGKMAFMSSNDAAWQQTHNYPFGFELDFLGGTDPDAVRNLLTQYAGKRVTVAYTGIVNEKMIPDQKVGNTAEVSFDPDSKITVNGPEIQTGGIRFFKHEAGSSKSLANATFILQRMNGNVREYAVLEGVNGMAGTYQPTKITWTTNQDAATRLKTSGAETANLTIQGLLPGRYTLVETAAPEGYEILDPTTDFEVIAGTWGTKTIRIANTPVNQLLPLEHHHHHH
>6bjc_D mol:protein length:445  Tubulin beta chain
MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGSYHGDSDLQLERINVYYNEAAGNKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWAKGHYTEGAELVDSVLDVVRKESESCDCLQGFQLTHSLGGGTGSGMGTLLISKIREEYPDRIMNTFSVVPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEALYDICFRTLKLTTPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSRGSQQYRALTVPELTQQMFDAKNMMAACDPRHGRYLTVAAVFRGRMSMKEVDEQMLNVQNKNSSYFVEWIPNNVKTAVCDIPPRGLKMSATFIGNSTAIQELFKRISEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATADEQGEFEEEGEEDEA
>2v6a_M mol:protein length:140  RIBULOSE BISPHOSPHATE CARBOXYLASE SMALL CHAIN 1
MMVWTPVNNKMFETFSYLPPLTDEQIAAQVDYIVANGWIPCLEFAEADKAYVSNESAIRFGSVSCLYYDNRYWTMWKLPMFGCRDPMQVLREIVACTKAFPDAYVRLVAFDNQKQVQIMGFLVQRPKTARDFQPANKRSV
>3x37_A mol:protein length:123  ZYRO0C14696p
MSSWRLVASVRTLPSSLRLELDGAQVNSYEEFVPNIISESRANKIGLRHLIHNPDKYCVLERYGNGFWIRYDVLQMDLQEVEDEFTGNEHLINWAAIKEWNLMGFKDLLPLWKEDLEHHHHHH
>6yfc_EW mol:protein length:124  coat protein
MRLTDVDLTVGEETREYAVSEQQGTLFRFVDKSGTVANNTGVFSLEQRFGAANSNRKVTMLLTDPVVVKDASGADMTIKANASVTFSLPKTYPNEHITKLRQTLIAWLGQQCVSDPVDSGLNNY
>1vvj_QK mol:protein length:129  30S ribosomal protein S11
MAKKPSKKKVKRQVASGRAYIHASYNNTIVTITDPDGNPITWSSGGVIGYKGSRKGTPYAAQLAALDAAKKAMAYGMQSVDVIVRGTGAGREQAIRALQASGLQVKSIVDDTPVPHNGCRPKKKFRKAS
>1w4r_A mol:protein length:195  THYMIDINE KINASE
MRGSHHHHHHLVPRGSKTRGQIQVILGPMFSGKSTELMRRVRRFQIAQYKCLVIKYAKDTRYSSSFCTHDRNTMEALPACLLRDVAQEALGVAVIGIDEGQFFPDIVEFCEAMANAGKTVIVAALDGTFQRKPFGAILNLVPLAESVVKLTAVCMECFREAAYTKRLGTEKEVEVIGGADKYHSVCRLCYFKKAS
>5lmt_D mol:protein length:209  30S ribosomal protein S4
MGRYIGPVCRLCRREGVKLYLKGERCYSPKCAMERRPYPPGQHGQKRARRPSDYAVRLREKQKLRRIYGISERQFRNLFEEASKKKGVTGSVFLGLLESRLDNVVYRLGFAVSRRQARQLVRHGHITVNGRRVDLPSYRVRPGDEIAVAEKSRNLELIRQNLEAMKGRKVGPWLSLDVEGMKGKFLRLPDREDLALPVNEQLVIEFYSR
>7e6c_A mol:protein length:419  Cysteine desulfurase SufS
MGHMNITDIREQFPILHQQVNGHDLVYLDSAATSQKPRAVIETLDKYYNQYNSNVHRGVHTLGTRATDGYEGAREKVRKFINAKSMAEIIFTKGTTTSLNMVALSYARANLKPGDEVVITYMEHHANIIPWQQAVKATGATLKYIPLQEDGTISLEDVRETVTSNTKIVAVSHVSNVLGTVNPIKEMAKIAHDNGAVIVVDGAQSTPHMKIDVQDLDCDFFALSSHKMCGPTGVGVLYGKKALLENMEPAEFGGEMIDFVGLYESTWKELPWKFEAGTPIIAGAIGLGAAIDFLEEIGLDEISRHEHKLAAYALERFRQLDGVTVYGPEERAGLVTFNLDDVHPHDVATVLDAEGIAVRAGHHAAQPLMKWLDVTATARASFYLYNTEEEIDKLVEALQKTKEYFTNVFVDLEHHHHHH
>3pkj_F mol:protein length:355  NAD-dependent deacetylase sirtuin-6
GSVNYAAGLSPYADKGKCGLPEIFDPPEELERKVWELARLVWQSSSVVFHTGAGISTASGIPDFRGPHGVWTMEERGLAPKFDTTFESARPTQTHMALVQLERVGLLRFLVSQNVDGLHVRSGFPRDKLAELHGNMFVEECAKCKTQYVRDTVVGTMGLKATGRLCTVAKARGLRACRGELRDTILDWEDSLPDRDLALADEASRNADLSITLGTSLQIRPSGNLPLATKRRGGRLVIVNLQPTKHDRHADLRIHGYVDEVMTRLMEHLGLEIPAWDGPRVLERALPPLPRPPTPKLEPKEESPTRINGSIPAGPKQEPCAQHNGSEPASPKRERPTSPAPHRPPKRVKAKAVPS
>7mkd_K mol:protein length:91  DNA-directed RNA polymerase subunit omega
MARVTVQDAVEKIGNRFDLVLVAARRARQMQVGGKDPLVPEENDKTTVIALREIEEGLINNQILDVRERQEQQEQEAAELQAVTAIAEGRR
>1kz8_A mol:protein length:337  FRUCTOSE-1,6-BISPHOSPHATASE
TDQAAFDTNIVTLTRFVMEQGRKARGTGEMTQLLNSLCTAVKAISTAVRKAGIAHLYGIAGSTNVTGDQVKKLDVLSNDLVINVLKSSFATCVLVTEEDKNAIIVEPEKRGKYVVCFDPLDGSSNIDCLVSIGTIFGIYRKNSTDEPSEKDALQPGRNLVAAGYALYGSATMLVLAMVNGVNCFMLDPAIGEFILVDRNVKIKKKGSIYSINEGYAKEFDPAITEYIQRKKFPPDNSAPYGARYVGSMVADVHRTLVYGGIFMYPANKKSPKGKLRLLYECNPMAYVMEKAGGLATTGKEAVLDIVPTDIHQRAPIILGSPEDVTELLEIYQKHAAK
>5puo_B mol:protein length:156  Bromodomain-containing protein 1
MHHHHHHSSGVDLGTENLYFQSMEQVAMELRLTELTRLLRSVLDQLQDKDPARIFAQPVSLKEVPDYLDHIKHPMDFATMRKRLEAQGYKNLHEFEEDFDLIIDNCMKYNARDTVFYRAAVRLRDQGGVVLRQARREVDSIGLEEASGMHLPERPA
>6olf_F mol:protein length:294  60S ribosomal protein L5
VKVVKNKAYFKRYQVKFRRRREGKTDYYARKRLVIQDKNKYNTPKYRMIVRVTNRDIICQIAYARIEGDMIVCAAYAHELPKYGVKVGLTNYAAAYCTGLLLARRLLNRFGMDKIYEGQVEVTGDEYNVESIDGQPGAFTCYLDAGLARTTTGNKVFGALKGAVDGGLSIPHSTKRFPGYDSESKEFNAEVHRKHIMGQNVADYMRYLMEEDEDAYKKQFSQYIKNSVTPDMMEEMYKKAHAAIRENPVYEKKPKKEVKKKRWNRPKMSLAQKKDRVAQKKASFLRAQERAAES
>6x6k_AT mol:protein length:278  Cag pathogenicity island protein
MKLRASVLIGATILCLILSACSNYAKKVVKQKNHVYTPVYNELIEKYSEIPLNDKLKDTPFMVQVKLPNYKDYLLDNKQVVLTFKLVHHSKKITLIGDANKILQYKNYFQANGARSDIDFYLQPTLNQKGVVMIASNYNDNPNSKEKPQTFDVLQGSQPMLGANTKNLHGYDVSGANNKQVINEVAREKAQLEKINQYYKTLLQDKEQEYTTRKNNQREILETLSNRAGYQMRQNVISSEIFKNGNLNMQAKEEEVREKLQEERENEYLRNQIRSLLS
>3j78_82 mol:protein length:130  60S ribosomal protein L32
MASLPHPKIVKKHTKKFKRHHSDRYHRVAENWRKQKGIDSVVRRRFRGNISQPKIGYGSNKKTKFLSPSGHKTFLVANVKDLETLTMHTKTYAAEIAHNISAKNRVVILARAKALGIKVTNPKGRLALEA
>3sbp_D mol:protein length:638  Nitrous-oxide reductase
MSDKDSKNTPQVPEKLGLSRRGFLGASAVTGAAVAATALGGAVMTRESWAQAVKESKQKIHVGPGELDDYYGFWSGGHQGEVRVLGVPSMRELMRIPVFNVDSATGWGLTNESRHIMGDSAKFLNGDCHHPHISMTDGKYDGKYLFINDKANSRVARIRLDIMKCDKMITVPNVQAIHGLRLQKVPHTKYVFANAEFIIPHPNDGKVFDLQDENSYTMYNAIDAETMEMAFQVIVDGNLDNTDADYTGRFAAATCYNSEKAFDLGGMMRNERDWVVVFDIHAVEAAVKAGDFITLGDSKTPVLDGRKKDGKDSKFTRYVPVPKNPHGCNTSSDGKYFIAAGKLSPTCSMIAIDKLPDLFAGKLADPRDVIVGEPELGLGPLHTTFDGRGNAYTTLFIDSQVVKWNMEEAVRAYKGEKVNYIKQKLDVHYQPGHLHASLCETNEADGKWLVALSKFSKDRFLPVGPLHPENDQLIDISGDEMKLVHDGPTFAEPHDCIMARRDQIKTKKIWDRNDPFFAPTVEMAKKDGINLDTDNKVIRDGNKVRVYMTSMAPAFGVQEFTVKQGDEVTVTITNIDQIEDVSHGFVVVNHGVSMEISPQQTSSITFVADKPGLHWYYCSWFCHALHMEMVGRMMVEPA
>6yft_HF mol:protein length:113  coat protein
STFSSLVIGSNTFIPTAPGYYSLSTRGFSDPRNQIKISGGKFNAKTGRVTAAVSRLWETDVTVAGLPVRSAAEVAIIMTLGRGITATNADVLLSDLNTLLDPARLDQILQGGF
>5w40_B mol:protein length:352  PopP2 protein
SEFELGAPAGRQAGQQATVDRLRTQVTGFLSGALGKLQALSAQNMDPELAQFRVLDVDRAIMPLLIVAENARNPGLNLVPLHMDMAEDEEVRTQPPMAGSRHIAEFVASARPGRYRAVIDDGSHTRAADIRKDASGTSVIVVDPLRKEKDESAYVDYADNVNMEFGEHAKCAFIPVDIQKSSFDCRILSLSLALKMHDKDDAFAAFHETLRNGGDPSHHVSRAQQTEELGATLVLDGAPLVDARMMKHGQAASSVSRYLGNHPEQSTVPVNKRNETLGERTTRHLVKRKVRNRADSEGRVTSGETKEITFSNSVEQKRIALLNRAASYVNSAPPPVVMRMAKLLQDSLLDTN
>6lqt_B1 mol:protein length:923  Periodic tryptophan protein 2
MKSDFKFSNLLGTVYRQGNITFSDDGKQLLSPVGNRVSVFDLINNKSFTFEYEHRKNIAAIDLNKQGTLLISIDEDGRAILVNFKARNVLHHFNFKEKCSAVKFSPDGRLFALASGRFLQIWKTPDVNKDRQFAPFVRHRVHAGHFQDITSLTWSQDSRFILTTSKDLSAKIWSVDSEEKNLAATTFNGHRDYVMGAFFSHDQEKIYTVSKDGAVFVWEFTKRPSDDDDNESEDDDKQEEVDISKYSWRITKKHFFYANQAKVKCVTFHPATRLLAVGFTSGEFRLYDLPDFTLIQQLSMGQNPVNTVSVNQTGEWLAFGSSKLGQLLVYEWQSESYILKQQGHFDSTNSLAYSPDGSRVVTASEDGKIKVWDITSGFCLATFEEHTSSVTAVQFAKRGQVMFSSSLDGTVRAWDLIRYRNFRTFTGTERIQFNCLAVDPSGEVVCAGSLDNFDIHVWSVQTGQLLDALSGHEGPVSCLSFSQENSVLASASWDKTIRIWSIFGRSQQVEPIEVYSDVLALSMRPDGKEVAVSTLKGQISIFNIEDAKQVGNIDCRKDIISGRFNQDRFTAKNSERSKFFTTIHYSFDGMAIVAGGNNNSICLYDVPNEVLLKRFIVSRNMALNGTLEFLNSKKMTEAGSLDLIDDAGENSDLEDRIDNSLPGSQRGGDLSTRKMRPEVRVTSVQFSPTANAFAAASTEGLLIYSTNDTILFDPFDLDVDVTPHSTVEALREKQFLNALVMAFRLNEEYLINKVYEAIPIKEIPLVASNIPAIYLPRILKFIGDFAIESQHIEFNLIWIKALLSASGGYINEHKYLFSTAMRSIQRFIVRVAKEVVNTTTDNKYTYRFLVSTDGSMEDGAADDDEVLLKDDADEDNEENEENDVVMESDDEEGWIGFNGKDNKLPLSNENDSSDEEENEKELP
>3fi0_N mol:protein length:326  Tryptophanyl-tRNA synthetase
MKTIFSGIQPSGVITIGNYIGALRQFVELQHEYNCYFCIVDQHAITVWQDPHELRQNIRRLAALYLAVGIDPTQATLFIQSEVPAHAQAAWMLQCIVYIGELERMTQFKEKSAGKEAVSAGLLTYPPLMAADILLYNTDIVPVGEDQKQHIELTRDLAERFNKRYGELFTIPEARIPKVGARIMSLVDPTKKMSKSDPNPKAYITLLDDAKTIEKKIKSAVTDSEGTIRYDKEAKPGISNLLNIYSTLSGQSIEELERQYEGKGYGVFKADLAQVVIETLRPIQERYHHWMESEELDRVLDEGAEKANRVASEMVRKMEQAMGLGR
>6y67_MMM mol:protein length:293  Capsid protein VP1
MGSSHHHHHHSSGENLYFQGSHMGGIEVLDVKTGPDSTTTIEAYLNPRVGQNWGFSTEITVASNGYNDAPHLTEIPCYSSARISLPLLNEDITSPTLLMWEAVSVKTEVVGISSMLNMHSYGLRAFGGYGGGYTIEGSHIHFFSVGGEPLDLQGLMQNHSTQYPSPLVGPKKPDGTTDDSAQVLNPIYKAKLDKDATYPIECWCPDPSRNENSRYFGSYTGGVETPPVLSFTNTSTTILLDENGVGPLCKGDGLYLSSADVAGTFVQQTSQKQYWRGLPRYFNITLRKRAVKN
>1dzr_A mol:protein length:183  DTDP-4-DEHYDRORHAMNOSE 3,5-EPIMERASE
MMIVIKTAIPDVLILEPKVFGDERGFFFESYNQQTFEELIGRKVTFVQDNHSKSKKNVLRGLHFQRGENAQGKLVRCAVGEVFDVAVDIRKESPTFGQWVGVNLSAENKRQLWIPEGFAHGFVTLSEYAEFLYKATNYYSPSSEGSILWNDEAIGIEWPFSQLPELSAKDAAAPLLDQALLTE
>6gmt_A mol:protein length:108  Magnetosome protein MamM
GSHMEAVQNRIVEAAERVPGVRGVIHLRARYVGQDIWADMIIGVDPENTVEQAHEICEAVQAAVCGKIRRIESLHVSAEAREIGDTTKPSFSDQPLSFDEVMLSKVDN
>5a1w_F mol:protein length:177  COATOMER SUBUNIT ZETA-1
MEALILEPSLYTVKAILILDNDGDRLFAKYYDDTYPSVKEQKAFEKNIFNKTHRTDSEIALLEGLTVVYKSSIDLYFYVIGSSYENELMLMAVLNCLFDSLSQMLRKNVEKRALLENMEGLFLAVDEIVDGGVILESDPQQVVHRVALRGEDVPLTEQTVSQVLQSAKEQIKWSLLR
>5e81_3E mol:protein length:209  30S ribosomal protein S4
MGRYIGPVCRLCRREGVKLYLKGERCYSPKCAMERRPYPPGQHGQKRARRPSDYAVRLREKQKLRRIYGISERQFRNLFEEASKKKGVTGSVFLGLLESRLDNVVYRLGFAVSRRQARQLVRHGHITVNGRRVDLPSYRVRPGDEIAVAEKSRNLELIRQNLEAMKGRKVGPWLSLDVEGMKGKFLRLPDREDLALPVNEQLVIEFYSR
>6y5e_F mol:protein length:83  Histone H4
KVLRDNIQGITKPAIRRLARRGGVKRISGLIYEETRGVLKVFLENVIRDAVTYTEHAKRKTVTAMDVVYALKRQGRTLYGFGG
>5pgy_A mol:protein length:286  Corticosteroid 11-beta-dehydrogenase isozyme 1
GSHMASMTGGQQMGRGSNEEFRPEMLQGKKVIVTGASKGIGREMAYHLAKMGAHVVVTARSKETLQKVVSHCLELGAASAHYIAGTMEDMTFAEQFVAQAGKLMGGLDMLILNHITNTSLNLFHDDIHHVRKSMEVNFLSYVVLTVAALPMLKQSNGSIVVVSSLAGKVAYPMVAAYSASKFALDGFFSSIRKEYSVSRVNVSITLCVLGLIDTETAMKAVSGIVHMQAAPKEECALEIIKGGALRQEEVYYDSSRWTTLLIRNPCRKILEELYSTSYNMDRFINK
>7r4n_A mol:protein length:362  Hydroxyacid oxidase 1
MLPRLICINDYEQHAKSVLPKSIYDYYRSGANDEETLADNIAAFSRWKLYPRMLRNVAETDLSTSVLGQRVSMPICVGATAMQRMAHVDGELATVRACQSLGTGMMLSSWATSSIEEVAEAGPEALRWLQLYIYKDREVTKKLVRQAEKMGYKAIFVTVDTPYLGNRLDDVRNRFKLPPQLRMKNFETSTLSFSPEENFGDDSGLAAYVAKAIDPSISWEDIKWLRRLTSLPIVAKGILRGDDAREAVKHGLNGILVSNHGARQLDGVPATIDVLPEIVEAVEGKVEVFLDGGVRKGTDVLKALALGAKAVFVGRPIVWGLAFQGEKGVQDVLEILKEEFRLAMALSGCQNVKVIDKTLVRK
>6dec_R mol:protein length:9  unidentified
XXXXXXXXX
>6j9f_C mol:protein length:1383  DNA-directed RNA polymerase subunit beta
MTSYSFTEKKRIRKDFGKQRSILEVPFLLAIQVDSYREFLQEDVESTKRKDLGLHAALKSVFPISSYSGNAALEYVGYKLGQPVFDERECRQRGMSYGAPLRVTVRLVIYDRESSTKAIKYVKEQEVYLGEIPLMTGNGTFIVNGTERVIVSQLHRSPGVFFDHDRGKTHSSGKLLYSARIIPYRGSWLDFEFDPKDALFTRIDRRRKLPVSILLRALGYNNEEMLAEFFEINTFHINPDEGVQLELVPERLRGETLNFDLADGDKVIVEAGKRITARHVKQLEAAGVAALAVPDDYLVGRILSHDVVDGSTGELLANANDEISEDQLTAFRKAGVDAVGTLWVNDLDRGPYLSNTLRIDPTKTQLEALVEIYRMMRPGEPPTKEAAQNLFHNLFFTFERYDLSTVGRMKFNRRVGRKDVLGESVLYDKKYFAERNDEESKRLVAEHTDTSDILEVIKVLTEIRNGRGVVDDIDHLGNRRVRSVGEMAENVFRVGLVRVERAVKERLSMAESEGLTPQELINAKPVAAAIKEFFGSSQLSQFMDQNNPLSEVTHKRRVSALGPGGLTRERAGFEVRDVHPTHYGRVCTIETPEGPNIGLINSLAVFARTNQYGFLETPYRKVLDGKVSDDVEYLSAIEENEYVIAQANALTDAKNMLTEQFVPCRFQGESLLKPPSEVHFMDVSPMQTVSVAAALVPFLEHDDANRALMGANMQRQAVPTLRSQKPLVGTGIERAVARDSGVTVNALRGGVIEQIDAARIVVKVNEAEIGGGTDAGVDIYNLIKYTRSNQNTCINQRPLVNVGDVIARGDVLADGPSTDIGELALGQNMLIAFMPWNGYNFEDSILLSERVVEEDRYTTIHIEELTCVARDTKLGPEEISADIPNVSEQALNRLDESGVVYIGAEVRAGDIMVGKVTPKGESQLTPEEKLLRAIFGEKASDVKDSSLRVPPGMDGTVIDVQVFTRDGIEKDKRARQIEENEIKRVKKDFDDQFRILEAAIYARLRSQIVGKVANGGANLKKGDSVTDAYLDGLKKSDWFQLRMKDEDAADAIERAQKQIQAHEKEFEARFADKRGKITQGDDLAPGVLKMVKVFLAVKRRIQPGDKMAGRHGNKGVVSNVVPVEDMPYMATGESVDIVLNPLGVPSRMNIGQILEVHLGWAAKGLGRKIQRMLEAQAAVSELRKFLDDIYNHDNAINAQRVDLSQFSDEELLNLGKNLIDGVPMATPVFDGASEAEIKRMLELADLPQSGQTQLYDGRTGEAFDRKTTVGYMHYLKLNHLVDDKMHARSTGPYSLVTQQPLGGKAQFGGQRFGEMEVWALEAYGAAYTLQEMLTVKSDDVQGRNQMYKNIVDGEHEMVAGMPESFNVLVKEIRSLAIHMELEE
>2e7s_E mol:protein length:135  Rab guanine nucleotide exchange factor SEC2
GPLGSLEEQLNKSLKTIASQKAAIENYNQLKEDYNTLKRELSDRDDEVKRLREDIAKENELRTKAEEEADKLNKEVEDLTASLFDEANNLVADARMEKYAIEILNKRLTEQLREKDMLLDTLTLQLKNLKKVMHS
>2wfz_A mol:protein length:537  ACETYLCHOLINESTERASE
DDHSELLVNTKSGKVMGTRVPVLSSHISAFLGIPFAEPPVGNMRFRRPEPKKPWSGVWNASTYPNNCQQYVDEQFPGFSGSEMWNPNREMSEDCLYLNIWVPSPRPKSTTVMVWIYGGGFYSGSSTLDVYNGKYLAYTEEVVLVSLSYRVGAFGFLALHGSQEAPGNVGLLDQRMALQWVHDNIQFFGGDPKTVTIFGESAGGASVGMHILSPGSRDLFRRAILQSGSPNCPWASVSVAEGRRRAVELGRNLNCNLNSDEELIHCLREKKPQELIDVEWNVLPFDSIFRFSFVPVIDGEFFPTSLESMLNSGNFKKTQILLGVNKDEGSFFLLYGAPGFSKDSESKISREDFMSGVKLSVPHANDLGLDAVTLQYTDWMDDNNGIKNRDGLDDIVGDHNVICPLMHFVNKYTKFGNGTYLYFFNHRASNLVWPEWMGVIHGYEIEFVFGLPLVKELNYTAEEEALSRRIMHYWATFAKTGNPNEPHSQESKWPLFTTKEQKFIDLNTEPMKVHQRLRVQMCVFWNQFLPKLLNATAC
>5cnv_D mol:protein length:761  Ribonucleoside-diphosphate reductase 1 subunit alpha
MNQNLLVTKRDGSTERINLDKIHRVLDWAAEGLHNVSISQVELRSHIQFYDGIKTSDIHETIIKAAADLISRDAPDYQYLAARLAIFHLRKKAYGQFEPPALYDHVVKMVEMGKYDNHLLEDYTEEEFKQMDTFIDHDRDMTFSYAAVKQLEGKYLVQNRVTGEIYESAQFLYILVAACLFSNYPRETRLQYVKRFYDAVSTFKISLPTPIMSGVRTPTRQFSSCVLIECGDSLDSINATSSAIVKYVSQRAGIGINAGRIRALGSPIRGGEAFHTGCIPFYKHFQTAVKSCSQGGVRGGAATLFYPMWHLEVESLLVLKNNRGVEGNRVRHMDYGVQINKLMYTRLLKGEDITLFSPSDVPGLYDAFFADQEEFERLYTKYEKDDSIRKQRVKAVELFSLMMQERASTGRIYIQNVDHCNTHSPFDPAIAPVRQSNLCLEIALPTKPLNDVNDENGEIALCTLSAFNLGAINNLDELEELAILAVRALDALLDYQDYPIPAAKRGAMGRRTLGIGVINFAYYLAKHGKRYSDGSANNLTHKTFEAIQYYLLKASNELAKEQGACPWFNETTYAKGILPIDTYKKDLDTIANEPLHYDWEALRESIKTHGLRNSTLSALMPSETSSQISNATNGIEPPRGYVSIKASKDGILRQVVPDYEHLHDAYELLWEMPGNDGYLQLVGIMQKFIDQSISANTNYDPSRFPSGKVPMQQLLKDLLTAYKFGVKTLYYQNTRDGAEDAQDDLVPSIQDDGCESGACKI
>6fzd_A mol:protein length:392  Lipase
SRANDAPIVLLHGFTGWGREEMFGFKYWGGVRGDIEQWLNDNGYRTYTLAVGPLSSNWDRACEAYAQLVGGTVDYGAAHAAKHGHARFGRTYPGLLPELKRGGRIHIIAHSQGGQTARMLVSLLENGSQEEREYAKAHNVSLSPLFEGGHHFVLSVTTIATPHDGTTLVNMVDFTDRFFDFQKFVLKAAAVASNVPYTSQVYDFKLDQWGLRRQPGESFDQYFERLKRSPVWTSTDTARYDLSVPGAEKLNQWVKASPNTYYLSFATERTYRGALTGNYYPELGMNAFSAVVCAPFLGSYRNATLGIDDRWLENDGIVNAFSMNGPKRGSTDRIVPYDGTIKKGVWNDMGTYNVDHFEVIGVDPNPLFDIRAFYLRLAEQLASLQPHHHHHH
>6stf_C mol:protein length:178  Ras-related protein Rab-8A
MDYLFKLLLIGDSGVGKTCVLFRFSEDAFNSTFISTIGIDFKIRTIELDGKRIKLQIWDTAGQERFRTITTAYYRGAMGIMLVYDITNEKSFDNIRNWIRNIEEHASADVEKMILGNKCDVNDKRQVSKERGEKLALDYGIKFMETSAKANINVENAFFTLARDIKAKMDKKHHHHHH
>7pny_K mol:protein length:128  28S ribosomal protein S14, mitochondrial
MAAFMLGSLLRTFKQMVPSSASGQVRSHYVDWRMWRDVKRRKMAYEYADERLRINSLRKNTILPKILQDVADEEIAALPRDSCPVRIRNRCVMTSRPRGVKRRWRLSRIVFRHLADHGQLSGIQRATW
>8d5p_C mol:protein length:209  TCR-alpha
MDSVTQTEGQVALSEEDFLTIHCNYSASGYPALFWYVQYPGEGPQFLFRASRDKEKGSSRGFEATYNKETTSFHLQKASVQESDSAVYYCALGDPTGANTGKLTFGHGTILRVHPNIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESS
>6o22_D mol:protein length:279  Histone chaperone ASF1
SSIVSLLGIKVLNNPAKFTDPYEFEITFECLESLKHDLEWKLTYVGSSRSLDHDQELDSILVGPVPVGVNKFVFSADPPSAELIPASELVSVTVILLSCSYDGREFVRVGYYVNNEYDEEELRENPPAKVQVDHIVRNILAEKPRVTRFNIVWDNENEGDLYPPEQPGVDDEEEEDDEEEDDDEDDEDDEDDDQEDGEGEAEEAAEEEEEEEEKTEDNETNLEEEEEDIENSDGDEEEGEEEVGSVDKNEDGNDKKRRKIEGGSTDIESTPKDAARSTN
>6gqb_AA mol:protein length:105  40S ribosomal protein S10-A
MLMPKEDRNKIHQYLFQEGVVVAKKDFNQAKHEEIDTKNLYVIKALQSLTSKGYVKTQFSWQYYYYTLTEEGVEYLREYLNLPEHIVPGTYIQERNPTQRPQRRY
>1z9x_C mol:protein length:321  Death-associated protein kinase 2
GMEPFKQQKVEDFYDIGEELGSGQFAIVKKCREKSTGLEYAAKFIKKRQSRASRRGVSREEIEREVSILRQVLHHNVITLHDVYENRTDVVLILELVSGGELFDFLAQKESLSEEEATSFIKQILDGVNYLHTKKIAHFDLKPENIMLLDKNIPIPHIKLIDFGLAHEIEDGVEFKNIFGTPEFVAPEIVNYEPLGLEADMWSIGVITYILLSGASPFLGDTKQETLANITSVSYDFDEEFFSHTSELAKDFIRKLLVKETRKRLTIQEALRHPWITPVDNQQAMVRRESVVNLENFRKQYVRRRSKLAFSIVSLCNHLTR
>6qbx_S3 mol:protein length:228  NADH:ubiquinone oxidoreductase core subunit S3
ESASADTRPTVRPRNDVAHKQLSAFGEYVAEILPKYVQQVQVSCFSELEICIHPDGVIPVLTFLRDHSNAQFKSLADLTAVDIPTRQNRFEIVYNLLSLRFNSRIRVKTYTDELTPVESSVSVYKAANWYEREIWDMFGVFFANHPDLRRILTDYGFEGHPFRKDFPLSGYVELRYDDEVKRVVAEPVELAQEFRKFDLNSPWEAFPAYRQPPESLKLEAGDKKPEAK
>3h0r_Q mol:protein length:478  Aspartyl/glutamyl-tRNA(Asn/Gln) amidotransferase subunit B
MNEKYEAVIGLEIHVQMDTKTKMFCGCKVEFGAEPNTNVCPVCLGMPGALPIVNKRAVEYAIRASLALNCEVHEESVFARKHYFYPDLPKGYQISQYEKPLATNGWVELNLPNGEKKKVRIRRLHIEEDAGKNIHEGDKTLVDLNRAGTPLMEIVTEPDIRTPEEARLFLEKLRNIMRYAGVSKADMEKGQLRCDINVSIRPKGSKEFGTRVEIKNVNSFRFVQKALEYEIERQINVVEEGGEVVQETRTFDPQTGKTYPMRTKEEAEDYRYFPDPDLVPLKVKKEWIEEIKKNMPELPDQRFERLIKEYGLSEYEAGILVNHKEVGDFFEEAVRHFKEPKGIVNWLINDLLGLLRDKGISIEESPVKPEHLAELVKLIKEKVISTKIGKEVIKEMVETGKTPSQIVEEKGLKQITDENQIKELVKKIFEKHPKEVERLKQGEEKLIGFFVGQVMRETRGKANPQVVNKVIRELVKEV
>4v99_Al mol:protein length:242  Capsid protein
MNRNGATPTRGRGKRAIPNPPRRRARGKSVERGSTPLQYVTTLGPSRPRMGQGQGWQKLSHEEIILQVNSSTAADTIQTIPIIPRLSVPAGDKPIYSGSAPHLRTIGSAFAIHRWRALSFEWIPSCPTTTPGNLVLRFYPNYSTETPKTLTDLMDSESLVLVPSLSGKTYRPKIETRGNPPELRNIDATAFSALSDEDKGDYSVGRLVVGSSKQAVVIQLGLLRMRYSAEMRGATSISGVSA
>6zsa_XS mol:protein length:205  39S ribosomal protein L21, mitochondrial
MAASSLTVTLGRLASACSHSILRPSGPGAASLWSASRRFNSQSTSYLPGYVPKTSLSSPPWPEVVLPDPVEETRHHAEVVKKVNEMIVTGQYGRLFAVVHFASRQWKVTSEDLILIGNELDLACGERIRLEKVLLVGADNFTLLGKPLLGKDLVRVEATVIEKTESWPRIIMRFRKRKNFKKKRIVTTPQTVLRINSIEIAPCLL
>7pe9_I mol:protein length:409  DEP domain-containing mTOR-interacting protein
MEEGGSTGSAGSDSSTSGSGGAQQRELERMAEVLVTGEQLRLRLHEEKVIKDRRHHLKTYPNCFVAKELIDWLIEHKEASDRETAIKLMQKLADRGIIHHVCDEHKEFKDVKLFYRFRKDDGTFPLDNEVKAFMRGQRLYEKLMSPENTLLQPREEEGVKYERTFMASEFLDWLVQEGEATTRKEAEQLCHRLMEHGIIQHVSSKHPFVDSNLLYQFRMNFRRRRRLMELLNEKSPSSQETHDSPFCLRKQSHDNRKSTSFMSVSPSKEIKIVSAVRRSSMSSCGSSGYFSSSPTLSSSPPVLCNPKSVLKRPVTSEELLTPGAPYARKTFTIVGDAVGWGFVVRGSKPCHIQAVDPSGPAAAAGMKVCQFVVSVNGLNVLHVDYRTVNNLILTGPRTIVMEVMEELEC
>5v3t_A mol:protein length:132  Globin
MSKQPMTPFEAIGGEQCIEILVDTFYSYVSKHPDLSPIFPDDLTETARKQKQFLTQYLGGPNLYTEEHGHPMLRARHLPFEITPKRAEAWLSCMEQAMDDTGVHGHIREFVFERLALTAQHMVNTPNETGEI
>4wra_E5 mol:protein length:85  50S ribosomal protein L27
MAHKKGLGSTRNGRDSQAKRLGVKRYEGQVVRAGNILVRQRGTRFKPGKNVGMGRDFTLFALVDGVVEFQDRGRLGRYVHVRPLA
>4waj_A mol:protein length:229  Carbonic anhydrase 2
MDKIKQLFANNYSWAQRMKEENSTYFKELADHQTPHYLWIGCSDSRVSPEKLTNLEPGELFVHRNVANQVIHTDFNCLSVVQYAVDVLKIEHIIICGHTNCGGIHAAMADKDLGLINNWLLHIRDIWFKHGHLLGKLSPEKRADMLTKINVAEQVYNLGRTSIVKSAWERGQKLSLHGWVYDVNDGFLVDQGVMATSRETLEISYRNAIARLSILDEENILKKDHLENT
>2c97_A mol:protein length:160  6,7-DIMETHYL-8-RIBITYLLUMAZINE SYNTHASE
MKGGAGVPDLPSLDASGVRLAIVASSWHGKICDALLDGARKVAAGCGLDDPTVVRVLGAIEIPVVAQELARNHDAVVALGVVIRGQTPHFDYVCDAVTQGLTRVSLDSSTPIANGVLTTNTEEQALDRAGLPTSAEDKGAQATVAALATALTLRELRAHS
>5j4b_2e mol:protein length:162  30S ribosomal protein S5
MPETDFEEKMILIRRTARMQAGGRRFRFGALVVVGDRQGRVGLGFGKAPEVPLAVQKAGYYARRNMVEVPLQNGTIPHEIEVEFGASKIVLKPAAPGTGVIAGAVPRAILELAGVTDILTKELGSRNPINIAYATMEALRQLRTKADVERLRKGEAHAQAQG
>7n6p_A mol:protein length:227  1C3 Fab heavy chain
QVQLVQSGAEVKKPGSSVKVACKVSGGTFSSYTISWVRQAPGQGLEWMGGIIPSFGVGHYSQKFRDRVTLTADKSTTTAFLELSSVRSEDTALYYCAILGTFNWKSGGNYFGPWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSC
>2vt5_B mol:protein length:338  FRUCTOSE-1,6-BISPHOSPHATASE 1
MADQAPFDTDVNTLTRFVMEEGRKARGTGELTQLLNSLCTAVKAISSAVRKAGIAHLYGIAGSTNVTGDQVKKLDVLSNDLVMNMLKSSFATCVLVSEEDKHAIIVEPEKRGKYVVCFDPLDGSSNIDCLVSVGTIFGIYRKKSTDEPSEKDALQPGRNLVAAGYALYGSATMLVLAMDCGVNCFMLDPAIGEFILVDKDVKIKKKGKIYSLNEGYAKDFDPAVTEYIQRKKFPPDNSAPYGARYVGSMVADVHRTLVYGGIFLYPANKKSPNGKLRLLYECNPMAYVMEKAGGMATTGKEAVLDVIPTDIHQRAPVILGSPDDVLEFLKVYEKHSAQ
>6dhf_c mol:protein length:451  Photosystem II CP43 reaction center protein
ATNRDQESSGFAWWAGNARLINLSGKLLGAHVAHAGLIVFWAGAMTLFELAHFIPEKPMYEQGLILIPHIATLGWGVGPGGEVVDTFPFFVVGVVHLISSAVLGFGGVYHAIRGPETLEEYSSFFGYDWKDKNKMTTILGFHLIVLGIGALLLVAKAMFFGGLYDTWAPGGGDVRVITNPTLDPRVIFGYLLKSPFGGEGWIVSVNNLEDVVGGHIWIGLICIAGGIWHILTTPFGWARRAFIWSGEAYLSYSLGALSMMGFIATCFVWFNNTVYPSEFYGPTGPEASQAQAMTFLIRDQKLGANVGSAQGPTGLGKYLMRSPTGEIIFGGETMRFWDFRGPWLEPLRGPNGLDLNKIKNDIQPWQERRAAEYMTHAPLGSLNSVGGVATEINSVNFVSPRSWLATSHFVLAFFFLVGHLWHAGRARAAAAGFEKGIDRESEPVLSMPSLD
>5hg0_A mol:protein length:264  Pantothenate synthetase
SNAMIIADNIKQFHSIRNSLIKQQKIGFVPTMGALHNGHISLIKKAKSENDVVIVSIFVNPTQFNNPNDYQTYPNQLQQDIQILASLDVDVLFNPSEKDIYPDGNLLRIEPKLEIANILEGKSRPGHFSGMLTVVLKLLQITKPNNLYLGEKDYQQVMLIKQLVKDFFINTKIIVCPTQRQPSGLPLSSRNKNLTSTDIEIANKIYEILRQDDFSNLEELTNKINSTGAKLQYIQKLNNRIFLAFYIGKVRLIDNFLKETGPSC
>2h6s_A mol:protein length:340  Candidapepsin-3
QTVPVKLINEQVSYASDITVGSNKQKLTVVIDTGSSDLWVPDSQVSCQAGQGQDPNFCKNEGTYSPSSSSSSQNLNSPFSIEYGDGTTSQGTWYKDTIGFGGISITKQQFADVTSTSVDQGILGIGYKTHEAEGNYDNVPVTLKNQGIISKNAYSLYLNSRQATSGQIIFGGVDNAKYSGTLIALPVTSDNELRIHLNTVKVAGQSINADVDVLLDSGTTITYLQQGVADQVISAFNGQETYDANGNLFYLVDCNLSGSVDFAFDKNAKISVPASEFTAPLYTEDGQVYDQCQLLFGTSDYNILGDNFLRSAYIVYDLDDNEISLAQVKYTTASNIAALT
>6atb_B mol:protein length:501  Nicotinamide phosphoribosyltransferase
MNPAAEAEFNILLATDSYKVTHYKQYPPNTSKVYSYFECREKKTENSKLRKVKYEETVFYGLQYILNKYLKGKVVTKEKIQEAKDVYKEHFQDDVFNEKGWNYILEKYDGHLPIEIKAVPEGFVIPRGNVLFTVENTDPECYWLTNWIETILVQSWYPITVATNSREQKKILAKYLLETSGNLDGLEYKLHDFGYRGVSSQETAGIGASAHLVNFKGTDTVAGLALIKKYYGTKDPVPGYSVPAAEHSTITAWGKDHEKDAFEHIVTQFSSVPVSVVSDSYDIYNACEKIWGEDLRHLIVSRSTQAPLIIRPDSGNPLDTVLKVLEILGKKFPVTENSKGYKLLPPYLRVIQGDGVDINTLQEIVEGMKQKMWSIENIAFGSGGGLLQKLTRDLLNCSFKCSYVVTNGLGINVFKDPVADPNKRSKKGRLSLHRTPAGNFVTLEEGKGDLEEYGQDLLHTVFKNGKVTKSYSFDEIRKNAQLNIELEAAHHLEHHHHHHHH
>1oqj_B mol:protein length:97  Glucocorticoid Modulatory Element Binding protein-1
GAMEDMEIAYPITCGESKAILLWKKFVCPGINVKCVKFNDQLISPKHFVHLAGKSTLKDWKRAIRLGGIMLRKMMDSGQIDFYQHDKVCSNTCRSTK
>5m7g_A mol:protein length:451  Tubulin alpha-1B chain
MRECISIHVGQAGVQIGNACWELYCLEHGIQPDGQMPSDKTIGGGDDSFNTFFSETGAGKHVPRAVFVDLEPTVIDEVRTGTYRQLFHPEQLITGKEDAANNYARGHYTIGKEIIDLVLDRIRKLADQCTGLQGFLVFHSFGGGTGSGFTSLLMERLSVDYGKKSKLEFSIYPAPQVSTAVVEPYNSILTTHTTLEHSDCAFMVDNEAIYDICRRNLDIERPTYTNLNRLISQIVSSITASLRFDGALNVDLTEFQTNLVPYPRIHFPLATYAPVISAEKAYHEQLSVAEITNACFEPANQMVKCDPRHGKYMACCLLYRGDVVPKDVNAAIATIKTKRSIQFVDWCPTGFKVGINYQPPTVVPGGDLAKVQRAVCMLSNTTAIAEAWARLDHKFDLMYAKRAFVHWYVGEGMEEGEFSEAREDMAALEKDYEEVGVDSVEGEGEEEGEEY
>6z6j_LW mol:protein length:155  60S ribosomal protein L24-A
MKVEIDSFSGAKIYPGRGTLFVRGDSKIFRFQNSKSASLFKQRKNPRRIAWTVLFRKHHKKGITEEVAKKRSRKTVKAQRPITGASLDLIKERRSLKPEVRKANREEKLKANKEKKKAEKAARKAEKAKSAGTQSSKFSKQQAKGAFQKVAATSR
>6mte_F mol:protein length:225  uL30
NFAELKIKRLRKKFAQKMLRKARRKLIYEKAKHYHKEYRQMYRTEIRMARMARKAGNFYVPAEPKLAFVIRIRGINGVSPKVRKVLQLLRLRQIFNGTFVKLNKASINMLRIVEPYIAWGYPNLKSVNELIYKRGYGKINKKRIALTDNTLIARSLGKYNIICMEDLIHEIYTVGKHFKEANNFLWPFKLSSPRGGMKKKTTHFVEGGDAGNREDQINRLIRRMN
>4v93_BD mol:protein length:151  EXTRACELLULAR GLOBIN-4
ADDEDCCSYEDRREIRHIWDDVWSSSFTDRRVAIVRAVFDDLFKHYPTSKALFERVKIDEPESGEFKSHLVRVANGLKLLINLLDDTLVLQSHLGHLADQHIQRKGVTKEYFRGIGEAFARVLPQVLSCFNVDAWNRCFHRLVARIAKDLP
>7nk4_B mol:protein length:757  RNA-directed RNA polymerase catalytic subunit
MDVNPTLLFLKVPAQNAISTTFPYTGDPPYSHGTGTGYTMDTVNRTHQYSEKGRWTTNTETGAPQLNPIDGPLPEDNEPSGYAQTDCVLEAMAFLEESHPGIFENSCLETMEVVQQTRVDKLTQGRQTYDWTLNRNQPAATALANTIEVFRSNGLTANESGRLIDFLKDVMESMDKEEMEITTHFQRKRRVRDNMTKKMVTQRTIGKKKQRLNKRSYLIRALTLNTMTKDAERGKLKRRAIATPGMQIRGFVYFVETLARSICEKLEQSGLPVGGNEKKAKLANVVRKMMTNSQDTELSFTITGDNTKWNENQNPRMFLAMITYITRNQPEWFRNVLSIAPIMFSNKMARLGKGYMFESKSMKLRTQIPAEMLASIDLKYFNDSTRKKIEKIRPLLIDGTASLSPGMMMGMFNMLSTVLGVSILNLGQKRYTKTTYWWDGLQSSDDFALIVNAPNHEGIQAGVDRFYRTCKLLGINMSKKKSYINRTGTFEFTSFFYRYGFVANFSMELPSFGVSGINESADMSIGVTVIKNNMINNDLGPATAQMALQLFIKDYRYTYRCHRGDTQIQTRRSFEIKKLWEQTRSKAGLLVSDGGPNLYNIRNLHIPEVCLKWELMDEDYQGRLCNPLNPFVSHKEIESVNNAVMMPAHGPAKNMEYDAVATTHSWIPKRNRSILNTSQRGILEDEQMYQKCCNLFEKFFPSSSYRRPVGISSMVEAMVSRARIDARIDFESGRIKKEEFAEIMKICSTIEELRRQK
>2bwp_D mol:protein length:401  5-AMINOLEVULINATE SYNTHASE
MDYNLALDKAIQKLHDEGRYRTFIDIEREKGAFPKAQWNRPDGGKQDITVWCGNDYLGMGQHPVVLAAMHEALEAVGAGSGGTRNISGTTAYHRRLEAEIAGLHQKEAALVFSSAYNANDATLSTLRVLFPGLIIYSDSLNHASMIEGIKRNAGPKRIFRHNDVAHLRELIAADDPAAPKLIAFESVYSMDGDFGPIKEICDIAEEFGALTYIDEVHAVGMYGPRGAGVAERDGLMHRIDIFNGTLAKAYGVFGGYIAASARMVDAVRSYAPGFIFSTSLPPAIAAGAQASIAFLKTAEGQKLRDAQQMHAKVLKMRLKALGMPIIDHGSHIVPVVIGDPVHTKAVSDMLLSDYGVYVQPINFPTVPRGTERLRFTPSPVHDLKQIDGLVHAMDLLWARCA
>3nno_C mol:protein length:171  Peptidoglycan recognition protein 1
EDPPACGSIVPRREWRALASECRERLTRPVRYVVVSHTAGSHCDTPASCAQQAQNVQSYHVRNLGWCDVGYNFLIGEDGLVYEGRGWNIKGAHAGPTWNPISIGISFMGNYMNRVPPPRALRAAQNLLACGVALGALRSNYEVKGHRDVQPTLSPGDRLYEIIQTWSHYRA
>2feu_A mol:protein length:411  Cytochrome P450-cam
NLAPLPPHVPEHLVFDFDMYNPSNLSAGVQEAWAVLQESNVPDLVWTRCNGGHWIATRGQLIREAYEDYRHFSSECPFIPREAGEAYDFIPTSMDPPEQRQFRALANQVVGMPVVDKLENRIQELACSLIESLRPQGQCNFTEDYAEPFPIRIFMLLAGLPEEDIPHLKYLTDQMTRPDGSMTFAEAKEALYDYLIPIIEQRRQKPGTDAISIVANGQVNGRPITSDEAKRMCGLLLVGGLDTVVNFLSFSMEFLAKSPEHRQELIERPERIPAACEELLRRFSLVADGRILTSDYEFHGVQLKKGDQILLPQMLSGLDERENACPMHVDFSRQKVSHTTFGHGSHLCLGQHLARREIIVTLKEWLTRIPDFSIAPGAQIQHKSGIVSGVQALPLVWDPATTKAVHHHHHH
>6v3b_V mol:protein length:85  50S ribosomal protein L27
MATKKAGGSTKNGRDSNPKMLGVKVYGGQTVTAGNIIVRQRGTEFHAGANVGMGRDHTLFATADGVVKFEVKGQFGRRYVKVETV
>3qjv_C mol:protein length:34  Cytochrome c oxidase polypeptide 2A
MEEKPKGALAVILVLTLTILVFWLGVYAVFFARG
>6az1_b mol:protein length:112  ribosomal protein S26e
MTTKRRNHGRSKPAHSRGRVKPIHCFNCGRLTPKDKAVGRFVVRRMLDAASARDVAEASPVYGANFPMPKLYMKQRFCIACAIHSRTVRARPVGNRKIRYTRKVPFRPAGKK
>4v5l_AS mol:protein length:93  30S RIBOSOMAL PROTEIN S19
MPRSLKKGVFVDDHLLEKVLELNAKGEKRLIKTWSRRSTIVPEMVGHTIAVYNGKQHVPVYITENMVGHKLGEFAPTRTYRGHGKEAKATKKK
>3siq_F mol:protein length:136  Apoptosis 1 inhibitor
MASVVPIAFDQVDNNTNATQLFKNNINKTRMNDLNREETRLKTFTDWPLDWLDKRQLAQTGMYFTHAGDKVKCFFCGVEIGSWEQEDQPVPEHQRWSPNCPLLRRRTTNNVPINAEALDRILPPISYDLEHHHHHH
>7qp7_H mol:protein length:84  40S ribosomal protein S27
MPLAKDLLHPSPEEEKRKHKKKRLVQSPNSYFMDVKCPGCYKITTVFSHAQTVVLCVGCSTVLCQPTGGKARLTEGCSFRRKQH
>3wkn_O mol:protein length:54  AFFinger p17
GPGISAFSPGRGVYDPETGTWYDAAWHLGELVWATYYDPETGTWEPDWQRMLGQ
>5y2e_A mol:protein length:47  Non-structural glycoprotein 4
MIEKQMDRVVKEMRRQLEMIDKLTTRGIEQVELLKRIHDKLMIRAVD
>3rtf_B mol:protein length:258  Glutamate receptor 2
KTVVVTTILESPYVMMKKNHEMLEGNERYEGYCVDLAAEIAKHCGFKYKLTIVGDGKYGARDADTKIWNGMVGELVYGKADIAIAPLTITLVREEVIDFSKPFMSLGISIMIKKGTPIESAEDLSKQTEIAYGTLDSGSTKEFFRRSKIAVFDKMWTYMRSAEPSVFVRTTAEGVARVRKSKGKYAYLLESTMNEYIEQRKPCDTMKVGGNLDSKGYGIATPKGSSLGNAVNLAVLKLNEQGLLDKLKNKWWYDKGEC
>7cme_A mol:protein length:214  Cadherin-3
MDWVVAPISVPENGKGPFPQRLNQLKSNKDRDTKIFYSITGPGADSPPEGVFAVEKETGWLLLNKPLDREEIAKYELFGHAVSENGASVEDPMNISIIVTDQNDHKPKFTQDTFRGSVLEGVLPGTSVMQVTATDEDDAIYTYNGVVAYSIHSQEPKDPHDLMFTIHRSTGTISVISSGLDREKVPEYTLTIQATDMDGDGSTTTAVAVVEILD
>6vq7_h mol:protein length:155  V-type proton ATPase 16 kDa proteolipid subunit
MADIKNNPEYSSFFGVMGASSAMVFSAMGAAYGTAKSGTGIAAMSVMRPELIMKSIIPVVMAGIIAIYGLVVAVLIANSLTDGITLYRSFLQLGAGLSVGLSGLAAGFAIGIVGDAGVRGTAQQPRLFVGMILILIFAEVLGLYGLIVALILSTK
>5af9_I mol:protein length:12  HIRUDIN VARIANT-2
GDFEEIPEEYLQ
>3nhn_A mol:protein length:193  Tyrosine-protein kinase HCK
GIREAGSEDIIVVALYDYEAIHHEDLSFQKGDQMVVLEESGEWWKARSLATRKEGYIPSNYVARVDSLETEEWFFKGISRKDAERQLLAPGNMLGSFMIRDSETTKGSYSLSVRDYDPRQGDTVKHYKIRTLDNGGFYISPRSTFSTLQELVDHYKKGNDGLCQKLSVPCMSSKPQKPWEKDAWELEHHHHHH
>1gn2_H mol:protein length:207  SUPEROXIDE DISMUTASE
MAEYTLPDLDWDYGALEPHISGQINELHHSKHHATYVKGANDAVAKLEEARAKEDHSAILLNEKNLAFNLAGHVNHTIWWKNLSPNGGDKPTGELAAAIADAFGSFDKFRAQFHAAATTVQGCGWAALGWDTLGNKLLIFQVYDHQTNFPLGIVPLLLLDMWEHAFYLQYKNVKVDFAKAFWNVVNWADVQSRYAAATSQTKGLIFG
>2y2p_A mol:protein length:494  PENICILLIN-BINDING PROTEIN 1B
DISSISEITYSDGTVIASIESDLLRQDFLPSGTVTGISRDYLYFTTLAEAQERMYDYLAQRDNVSAKELKNEATQKFYRDLAAKEIENGGYKITTTIDQKIHSAMQSAVADYGYLLDDGTGRVEVGNVLMDNQTGAILGFVGGRNYQENQNNHAFDTKRSPASTTKPLLAYGIAIDQGLMGSETILSNYPTNFANGNPIMYANSKGTGMMTLGEALNYSWNIPAYWTYRMLRENGVDVKGYMEKMGYEIPEYGIESLPMGGGIEVTVAQHTNGYQTLANNGVYHQKHVISKIEAADGRVVYEYQDKPVQVYSKATATIMQGLLREVLSSRVTTTFKSNLTSLNPTLANADWIGKTGTTGQDENMWLMLSTPRLTLGGWIGHDDNHSLSQQAGYSNNSNYMAHLVNAIQQASPSIWGNERFALDPSVVKSEVLKSTGQKPGKVSVEGKEVEVTGSTVTSYWANKSGAPATSYRFAIGGSDADYQNAWSSIVGSLP
>7tpb_G mol:protein length:66  Ras GTPase-activating protein 1
GPLGSRRRVRAILPYTKVPDTDEISFLKGDMFIVHNELEDGWMWVTNLRTDEQGLIVEDLVEEVGR
>3dfq_A mol:protein length:363  Fructose-bisphosphate aldolase A
PHSHPALTPEQKKELSDIAHRIVAPGKGILAASESTGSIAKRLQSIGTENTEENRRFYRQLLLTADDRVNPCIGGVILFHETLYQKADDGRPFPQVIKSKGGVVGIKVDKGVVPLAGTNGETTTQGLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNGIVPIVEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQKYSHEEIAMATVTALRRTVPPAVTGVTFLSGGQSEEEASINLNAINKCPLLKPWALTFSYGRALQASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESLFISNHAY
>1anc_A mol:protein length:223  ANIONIC TRYPSIN
IVGGYTCQENSVPYQVSLNSGYHFCGGSLINDQWVVSAAHCYKSRIQVRLGEHNINVLEGNEQFVNAAKIIKHPNFDRKTLNNDIMLIKLSSPVKLNARVATVALPSSCAPAGTQCLISGWGNTLSSGVNEPDLLQCLDAPLLPQADCEASYPGKITDNMVCVGFLEGGKDSCQGDSGGPVVCNGELQGIVKWGYGCALPDNPGVYTKVCNYVDWIQDTIAAN
>6d0u_I mol:protein length:214  Antibody C05, light chain
DIQLTQSPSSLSASVGDRVTLTCQASQDIRKFLNWYQQKPGKGPKLLIYDASNLQRGVPSRFSGGGSGTDFTLIISSLQPEDVGTYYCQQYDGLPFTFGGGTKVVIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC
>2nti_F mol:protein length:244  DNA polymerase sliding clamp A
MKVVYDDVRVLKDIIQALARLVDEAVLKFKQDSVELVALDRAHISLISVNLPREMFKEYDVNDEFKFGFNTQYLMKILKVAKRKEAIEIASESPDSVIINIIGSTNREFNVRNLEVSEQEIPEINLQFDISATISSDGFKSAISEVSTVTDNVVVEGHEDRILIKAEGESEVEVEFSKDTGGLQDLEFSKESKNSYSAEYLDDVLSLTKLSDYVKISFGNQKPLQLFFNMEGGGKVTYLLAPKV
>3prc_C mol:protein length:336  PHOTOSYNTHETIC REACTION CENTER
CFEPPPATTTQTGFRGLSMGEVLHPATVKAKKERDAQYPPALAAVKAEGPPVSQVYKNVKVLGNLTEAEFLRTMTAITEWVSPQEGCTYCHDENNLASEAKYPYVVARRMLEMTRAINTNWTQHVAQTGVTCYTCHRGTPLPPYVRYLEPTLPLNNRETPTHVERVETRSGYVVRLAKYTAYSALNYDPFTMFLANDKRQVRVVPQTALPLVGVSRGKERRPLSDAYATFALMMSISDSLGTNCTFCHNAQTFESWGKKSTPQRAIAWWGIRMVRDLNMNYLAPLNASLPASRLGRQGEAPQADCRTCHQGVTKPLFGASRLKDYPELGPIKAAAK
>7pi5_V mol:protein length:32  Photosystem II reaction center protein Ycf12
SLTLILQLVALFAVVAAGPLVVVLLSVRGGNL
>6s39_P mol:protein length:12  Cellular tumor antigen p53
KLMFKTEGPDSD
>4v1a_b mol:protein length:380  MITORIBOSOMAL PROTEIN ML38, MRPL38
MAAPWWRAALCASRRWRGFSTSAALSRRAAPLGPMPNEDIDVSDLERLKKYRSFDRYRRRAEQEARKPHWWRTYREHFGEESGPKDRVDIGLPPPKVSRTQQLLERKQALRELRANVEEERAARLQTARIPLEAVRAEWERTCGPYHKQRLAEYCGLYRDLFHGATFVPRVPLHVAYAVGEDDLMPVYHGNEVTPTEAAQAPEVTYEADEGSLWTLLLTNLDGHLLEPDAEYVHWLVTNIPGNRVTEGQETCPYLPPFPARGSGFHRFAFLLFKQDKRIDFSGDTRPSPCYQLAQRTFHTFDFYKKHQDAMTPAGLAFFQCRWDDSVTRVFHQLLDMREPVFEFVRPPPYHPKQKRFPHRQPLRYLDRYRDSHEPTYGIY
>1z7n_E mol:protein length:208  ATP phosphoribosyltransferase
MIKIAITKGRIQKQVTKLLENADYDVEPILNLGRELQIKTKDDLQIIFGKPNDVITFLEHGIVDIGFVGKDTLDENDFDDYYELLYLKIGQCIFALASYPDFSNKNFQRHKRIASKYPRVTKKYFAQKQEDIEIIKLEGSVELGPVVGLADAIVDIVETGNTLSANGLEVIEKISDISTRMIVNKSSFKFKKDKIIEMVERLEDAQTN
>1ygz_A mol:protein length:173  Inorganic pyrophosphatase
MNLEKLEVSHDADSLCVVIEISKHSNIKYELDKESGALMVDRVLYGAQNYPANYGFVPNTLGSDGDPVDALVLSDVAFQAGSVVKARLVGVLNMEDESGMDEKLIALPIDKIDPTHSYVKDIDDLSKHTLDKIKHFFETYKDLEPNKWVKVKGFENKESAIKVLEKAIKAYQG
>5rkm_A mol:protein length:149  PH-interacting protein
MHHHHHHSSGVDLGTENLYFQSMSYDIQAWKKQCEELLNLIFQCEDSEPFRQPVDLLEYPDYRDIIDTPMDFATVRETLEAGNYESPMELCKDVRLIFSNSKAYTPSKRSRIYSMSLRLSAFFEEHISSVLSDYKSALRFHKRNTITKR
>4dvi_B mol:protein length:217  Tankyrase-1
QGTILLDLAPEDKEYQSVEEEMQSTIREHRDGGNAGGIFNRYNVIRIQKVVNKKLRERFCHRQKEVSEENHNHHNERMLFHGSPFINAIIHKGFDERHAYIGGMFGAGIYFAENSSKSNQYVYGIGGGTGCPTHKDRSCYICHRQMLFCRVTLGKSFLQFSTMKMAHAPPGHHSVIGRPSVNGLAYAEYVIYRGEQAYPEYLITYQIMKPEHHHHHH
>6xu6_CD mol:protein length:290  60S ribosomal protein L5
KNKQYFKRYQVKFRRRREGKTDYYARKRLTFQDKNKYNTPKYRLIVRLSNKDITVQIAYARIEGDRVVCAAYSHELPKYGIQVGLTNYAAAYCTGLLVARRVLNKLGLDSLYAGCTEVTGEEFNVEPVDDGPGAFRCFLDVGLARTTTGARVFGAMKGAVDGGLNIPHSVKRFPGYSAETKSFNADVHRAHIFGQHVADYMRSLEEEDEESFKRQFSRYIKLGIRADDLEDIYKKAHQAIRNDPTHKVTAKKSSAVTKKRWNAKKLTNEQRKTKIAAHKAAYVAKLQSET
>6m0s_E mol:protein length:159  V-type proton ATPase subunit c
MTELCPVYAPFFGAIGCASAIIFTSLGAAYGTAKSGVGICATCVLRPDLLFKNIVPVIMAGIIAIYGLVVSVLVCYSLGQKQALYTGFIQLGAGLSVGLSGLAAGFAIGIVGDAGVRGSSQQPRLFVGMILILIFAEVLGLYGLIVALLLNSRATQDVV
>7ckb_Bj mol:protein length:98  Major carboxysome shell protein 1A
MADVTGIALGMIETRGLVPAIEAADAMTKAAEVRLVGRQFVGGGYVTVLVRGETGAVNAAVRAGADACERVGDGLVAAHIIARVHSEVENILPKAPQA
>7l6g_B mol:protein length:299  Metallo-mystery pair system four-Cys motif protein
AGVKTQPVAVRFALVADGKEVGCGAPLANLGSGRLAGKLHEARLYVYGFELVDAKGKHTPIALTQNDWQYADVALLDFKDARGGNAACTPGNPAKNTTVVGAAPQGAYVGLAFSVGAPVESLVDGKPVFVNHSNVEAAPPPLDISGMAWNWQAGRRFVTIEVIPPAAVIKPDGSKSRTWMVHVGSTGCKGNPATGEIVACAHENRFPVVFDRFDPKTQRVELDLTTLFESSDISVDKGGAVGCMSALDDPDCPAVFRALGLNLADSAPGANDAGKPSRPGVSPIFSVGAAASKVAGGKQ
>3lcb_C mol:protein length:416  Isocitrate dehydrogenase [NADP]
MESKVVVPAQGKKITLQNGKLNVPENPIIPYIEGDGIGVDVTPAMLKVVDAAVEKAYKGERKISWMEIYTGEKSTQVYGQDVWLPAETLDLIREYRVAIKGPLTTPVGGGIRSLNVALRQELDLYICLRPVRYYQGTPSPVKHPELTDMVIFRENSEDIYAGIEWKADSADAEKVIKFLREEMGVKKIRFPEHCGIGIKPCSEEGTKRLVRAAIEYAIANDRDSVTLVHKGNIMKFTEGAFKDWGYQLAREEFGGELIDGGPWLKVKNPNTGKEIVIKDVIADAFLQQILLRPAEYDVIACMNLNGDYISDALAAQVGGIGIAPGANIGDECALFEATHGTAPKYAGQDKVNPGSIILSAEMMLRHMGWTEAADLIVKGMEGAINAKTVTYDFERLMDGAKLLKCSEFGDAIIENM
>2wl6_A mol:protein length:392  ACETYL-COA ACETYLTRANSFERASE
STPSIVIASAARTAVGSFNGAFANTPAHELGATVISAVLERAGVAAGEVNEVILGQVLPAGEGQNPARQAAMKAGVPQEATAWGMNQLCGSGLRAVALGMQQIATGDASIIVAGGMESMSMAPHCAHLRGGVKMGDFKMIDTMIKDGLTDAFYGYHMGTTAENVAKQWQLSRDEQDAFAVASQNKAEAAQKDGRFKDEIVPFIVKGRKGDITVDADEYIRHGATLDSMAKLRPAFDKEGTVTAGNASGLNDGAAAALLMSEAEASRRGIQPLGRIVSWATVGVDPKVMGTGPIPASRKALERAGWKIGDLDLVEAHEAFAAQACAVNKDLGWDPSIVNVNGGAIAIGNPIGASGARILNTLLFEMKRRGARKGLATLCIGGGMGVAMCIESL
>6qz0_6E mol:protein length:448  Major capsid protein
MRITFNDVKTSLGITESYDIVNAIRNSQGDNFKSYVPLATANNVAEVGAGILINQTVQNDFITSLVDRIGLVVIRQVSLNNPLKKFKKGQIPLGRTIEEIYTDITKEKQYDAEEAEQKVFEREMPNVKTLFHERNRQGFYHQTIQDDSLKTAFVSWGNFESFVSSIINAIYNSAEVDEYEYMKLLVDNYYSKGLFTTVKIDEPTSSTGALTEFVKKMRATARKLTLPQGSRDWNSMAVRTRSYMEDLHLIIDADLEAELDVDVLAKAFNMNRTDFLGNVTVIDGFASTGLEAVLVDKDWFMVYDNLHKMETVRNPRGLYWNYYYHVWQTLSVSRFANAVAFVSGDVPAVTQVIVSPNIAAVKQGGQQQFTAYVRATNAKDHKVVWSVEGGSTGTAITGDGLLSVSGNEDNQLTVKATVDIGTEDKPKLVVGEAVVSIRPNNASGGAQA
>5ez8_D mol:protein length:31  CC-Hept-I-C-I
XGEIAQALKEIAKALKEIAWACKEIAQALKG
>7jqm_2H mol:protein length:180  50S ribosomal protein L6
MSRIGRLPIPVPKGVSVEVAPGRVKVKGPKGELEVPVSPEMRVVVEEGVVRVERPSDERRHKSLHGLTRTLIANAVKGVSEGYSKELLIKGIGYRARLVGRALELTVGFSHPVVVEPPEGITFEVPEPTRVRVSGIDKQKVGQVAANIRAIRKPSAYHEKGIYYAGEPVRLKPGKAGAKK
>7ck8_B mol:protein length:173  Ferritin heavy chain
STSQVRQNYHQDSEAAINRQINLELYASYVYLSMSYYFDRDDVALKNFAKYFLHQSHEEREHAEKLMKLQNQRGGRIFLQDIKKPDSDDWESGLNAMESALHLEKNVNQSLLELHKLATDKNDPHLSDFIETHYLNEQVKAIKELGDHVTNLRKMGAPESGLAEYLFDKHTLG
>5gaq_C mol:protein length:310  Lysenin
MSAKAAEGYEQIEVDVVAVWKEGYVYENRGSTSVDQKITITKGMKNVNSETRTVTATHSIGSTISTGDAFEIGSVEVSYSHSHEESQVSMTETEVYESKVIEHTITIPPTSKFTRWQLNADVGGADIEYMYLIDEVTPIGGTQSIPQVITSRAKIIVGRQIILGKTEIRIKHAERKEYMTVVSRKSWPAATLGHSKLFKFVLYEDWGGFRIKTLNTMYSGYEYAYSSDQGGIYFDQGTDNPKQRWAINKSLPLRHGDVVTFMNKYFTRSGLCYDDGPATNVYCLDKREDKWILEVVGLVPRGSGHHHHHH
>2g2w_B mol:protein length:165  Beta-lactamase inhibitory protein
AGVMTGAKFTQIQFGMTRQQVLDIAGAENCETGGSFGDSIHCRGHAAGDYYAYATFGFTSAAADAKVDSKSQEKLLAPSAPTLTLAKFNQVTVGMTRAQVLATVGQGSCTTWSEYYPAYPSTAGVTLSLSCFDVDGYSSTGFYRGSAHLWFTDGVLQGKRQWDLV
>1egm_G mol:protein length:173  PROPANEDIOL DEHYDRATASE
MNTDAIESMVRDVLSRMNSLQGEAPAAAPAAGGASRSARVSDYPLANKHPEWVKTATNKTLDDFTLENVLSNKVTAQDMRITPETLRLQASIAKDAGRDRLAMNFERAAELTAVPDDRILEIYNALRPYRSTKEELLAIADDLESRYQAKICAAFVREAATLYVERKKLKGDD
>4oko_B mol:protein length:312  Rapid Encystment Phenotype Protein 34 KDa
MPAQYHIGTPGKKWGSEEKSQWLAEQNKKRSYQQEAEKKILALVSDFDIDEYGQLDYPVGSYKLYALKTKNWDASKPYVLVTGGVHGYETSGVQGAISFAQTRALEFARDYNIVILPCLSPWGYETINRWNPNALDPNRSFYLESGCQEAVLAMKYVFSLGVEFLMHIDLHETTDTDDSEFRPALAAREGIAINKWGIPDGFYLVANNRNPHYDFQKYIIDAVAKVTHIAPTDPSINILGDDIIRDGIMACDSDKERLCMSFTTAEYTTTTEVYPDSPRTNPQECILAQVEAIVAGLNFLKQKNLEHHHHHH
>4cih_B mol:protein length:150  LISTERIA NUCLEAR TARGETED PROTEIN A
RPKLSTKDLALIKADLAEFEARELSSEKILKDTIKEESWSDLDFANDNINQMIGTMKRYQQEILSIDAIKRSSEASADTEAFKKIFKEWSEFKIERIQVTIDLLNGKKDSEAVFKKTYPNQIIFDDVRTNKLQTALNNLKVGYELLDSQK
>6k3a_A mol:protein length:264  Proliferating cell nuclear antigen
GPGMFEARLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNEDIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFSASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYYLAPKIEDEEGS
>1myw_A mol:protein length:239  Green fluorescent protein
MVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKLICTTGKLPVPWPTLVTTLGYGLQCFARYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYITADKQKNGIKANFKIRHNIEDGGVQLADHYQQNTPIGDGPVLLPDNHYLSYQSALSKDPNEKRDHMVLLEFVTAAGITHGMDELYK
>5zmu_A mol:protein length:314  Cis-epoxysuccinate hydrolase
MGSSHHHHHHSSGLVPRGSHMTRTKLILEARINEYMPRRGNPHVPWTPKEIGEAAAQAREAGASIVHFHARQADGSPSHDYETYAESIREIRARSDVLVHPTLGQITLGGRESRLAHIERLCLDPALKPDFAPVDLGSTNIDRYDDVEKRYETGDRVYLNNIDTLQHFSKRLRELGVKPAFIAWTVPFTRTLDAFMDMGLVDDPAYLLFELTDCGIRGGHPGTIRGLRAHTDFLPPGRQIQWTVCNKIGNLFGPAAAAIEEGGHVAIGLGDYLYPELGTPTNGEVVQTVANMARAMGREIATPAETKEILGISN
>6yfb_CB mol:protein length:166  coat protein
SYTQSFGYTIPTEKDTLEIPQYQALLAKKASYMDDSQGKNTATYMNTAAPKDQPETITFGVNKVDNVYKQSNVQNQTFYASSSKGTKIRIDGKRIWRTQSTDVNTGLPVIVDCPLWTSFTLGFADFTLVDDSARKSTIEWMISQLELLKDDGVWSKLCSGVTRIYG
>1j0a_A mol:protein length:325  1-aminocyclopropane-1-carboxylate deaminase
MHPKIFALLAKFPRVELIPWETPIQYLPNISREIGADVYIKRDDLTGLGIGGNKIRKLEYLLGDALSKGADVVITVGAVHSNHAFVTGLAAKKLGLDAILVLRGKEELKGNYLLDKIMGIETRVYDAKDSFELMKYAEEIAEELKREGRKPYVIPPGGASPIGTLGYVRAVGEIATQSEVKFDSIVVAAGSGGTLAGLSLGLSILNEDIRPVGIAVGRFGEVMTSKLDNLIKEAAELLGVKVEVRPELYDYSFGEYGKITGEVAQIIRKVGTREGIILDPVYTGKAFYGLVDLARKGELGEKILFIHTGGISGTFHYGDKLLSLL
>4hgj_B mol:protein length:455  Bifunctional P-450/NADPH-P450 reductase
TIKEMPQPKTFGELKNLPLLNTDKPVQALMKIADELGEIFKFEAPGRVTRYLSSQRLIKEACDESRFDKNLSQALKFVRDFAGDGLATSWTHEKNWKKAHNILLPSFSQQAMKGYHAMMVDIAVQLVQKWERLNADEHIEVPEDMTRLTLDTIGLCGFNYRFNSFYRDQPHPFITSMVRALDEAMNKLQRANPDDPAYDENKRQFQEDIKVMNDLVDKIIADRKASGEQSDDLLAHMLNGKDPETGEPLDDENIRYQIITFLIAGHETTSGLLSFALYFLVKNPHVLQKAAEEAARVLVDPVPSYKQVKQLKYVGMVLNEALRLWPTAPAFSLYAKEDTVLGGEYPLEKGDELMVLIPQLHRDKTIWGDDVEEFRPERFENPSAIPQHAFKPFGNGQRACIGQQFALHEATLVLGMMLKHFDFEDHTNYELDIKETLTLKPEGFVVKAKSKKIPL
>6vmi_5 mol:protein length:423  39S ribosomal protein L37, mitochondrial
MALASGPARRALAGSGQLGLGGFGAPRRGAYEWGVRSTRKSEPPPLDRVYEIPGLEPITFAGKMHFVPWLARPIFPPWDRGYKDPRFYRSPPLHEHPLYKDQACYIFHHRCRLLEGVKQALWLTKTKLIEGLPEKVLSLVDDPRNHIENQDECVLNVISHARLWQTTEEIPKRETYCPVIVDNLIQLCKSQILKHPSLARRICVQNSTFSATWNRESLLLQVRGSGGARLSTKDPLPTIASREEIEATKNHVLETFYPISPIIDLHECNIYDVKNDTGFQEGYPYPYPHTLYLLDKANLRPHRLQPDQLRAKMILFAFGSALAQARLLYGNDAKVLEQPVVVQSVGTDGRVFHFLVFQLNTTDLDCNEGVKNLAWVDSDQLLYQHFWCLPVIKKRVVVEPVGPVGFKPETFRKFLALYLHGAA
>6uzq_C mol:protein length:9  Synthetic peptide THR-VAL-ARG-ALA-SER-GLY-HIS-SER-TYR
TVRASGHSY
>6wwl_A mol:protein length:451  Tubulin alpha-1B chain
MRECISIHVGQAGVQIGNACWELYCLEHGIQPDGQMPSDKTIGGGDDSFNTFFSETGAGKHVPRAVFVDLEPTVIDEVRTGTYRQLFHPEQLITGKEDAANNYARGHYTIGKEIIDLVLDRIRKLADQCTGLQGFLVFHSFGGGTGSGFTSLLMERLSVDYGKKSKLEFSIYPAPQVSTAVVEPYNSILTTHTTLEHSDCAFMVDNEAIYDICRRNLDIERPTYTNLNRLISQIVSSITASLRFDGALNVDLTEFQTNLVPYPRIHFPLATYAPVISAEKAYHEQLSVAEITNACFEPANQMVKCDPRHGKYMACCLLYRGDVVPKDVNAAIATIKTKRSIQFVDWCPTGFKVGINYQPPTVVPGGDLAKVQRAVCMLSNTTAIAEAWARLDHKFDLMYAKRAFVHWYVGEGMEEGEFSEAREDMAALEKDYEEVGVDSVEGEGEEEGEEY
>7l20_D mol:protein length:305  39S ribosomal protein L2, mitochondrial
MALCALTRALRSLNLAPPTVAAPAPSLFPAAQMMNNGLLQQPSALMLLPCRPVLTSVALNANFVSWKSRTKYTITPVKMRKSGGRDHTGRIRVHGIGGGHKQRYRMIDFLRFRPEETKSGPFEEKVIQVRYDPCRSADIALVAGGSRKRWIIATENMQAGDTILNSNHIGRMAVAAREGDAHPLGALPVGTLINNVESEPGRGAQYIRAAGTCGVLLRKVNGTAIIQLPSKRQMQVLETCVATVGRVSNVDHNKRVIGKAGRNRWLGKRPNSGRWHRKGGWAGRKIRPLPPMKSYVKLPSASAQS
>7d28_D mol:protein length:117  Endoribonuclease MazF
MVSDYVPDAGHLVWLNFTPQAGHEQGGRRPALVLSPAAYNGVTGLMQACPVTSRAKGYPFEVTLPAHLGVSGVVLADHCRSLDWRSRRAEQLAEAPADVLAEVRGKLGSLLGMSEKA
>6hvu_b mol:protein length:196  Proteasome subunit beta type-1
TSIMAVTFKDGVILGADSRTTTGAYIANRVTDKLTRVHDKIWCCRSGSAADTQAIADIVQYHLELYTSQYGTPSTETAASVFKELCYENKDNLTAGIIVAGYDDKNKGEVYTIPLGGSVHKLPYAIAGSGSTFIYGYCDKNFRENMSKEETVDFIKHSLSQAIKWDGSSGGVIRMVVLTAAGVERLIFYPDEYEQL
>2nyz_E mol:protein length:93  Lymphotactin
VGSEVSDKRTCVSLTTQRLPVSRIKTYTITEGSLRAVIFITKRGLKVCADPQATWVRDVVRSMDRKSNTRNNMIQTKPTGTQQSTNTAVTLTG
>5sce_D mol:protein length:447  Pyruvate kinase
GSMEGPAGYLRRADVAQLTQELGTAFFQQQQLPAAMADTFLEHLCLLDIDSEPVAARSTSIIATIGPASRSVERLKEMIKAGMNIARLNFSHGSHEYHAESIANVREAVESFAGSPLSYRPVAIALDTKGPGSGPGLSEQDVRDLRFGVEHGVDIVFASFVRKASDVAAVRAALGPEGHGIKIISKIENHEGVKRFDEILEVSDGIMVARGDLGIEIPAEKVFLAQKMMIGRCNLAGKPVVCATQMLESMITKPRPTRAETSDVANAVLDGADCIMLSGETAKGNFPVEAVKMQHAIAREAEAAVYHRQLFEELRRAAPLSRDPTEVTAIGAVEAAFKCCAAAIIVLTTTGRSAQLLSRYRPRAAVIAVTRSAQAARQVHLCRGVFPLLYREPPEAIWADDVDRRVQFGIESGKLRGFLRVGDLVIVVTGWRPGSGYTNIMRVLSIS
>7qrv_B mol:protein length:281  Tripartite motif-containing protein 2
SMNPIEDDLIFRVGTKGRNKGEFTNLQGVAASTNGKILIADSNNQCVQIFSNDGQFKSRFGIRGRSPGQLQRPTGVAVHPSGDIIIADYDNKWVSIFSSDGKFKTKIGSGKLMGPKGVSVDRNGHIIVVDNKACCVFIFQPNGKIVTRFGSRGNGDRQFAGPHFAAVNSNNEIIITDFHNHSVKVFNQEGEFMLKFGSNGEGNGQFNAPTGVAVDSNGNIIVADWGNSRIQVFDGSGSFLSYINTSADPLYGPQGLALTSDGHVVVADSGNHCFKVYRYLQ
>6wef_L mol:protein length:159  Uncharacterized protein
GGEVPIGDPKELNGMEIAAVYLQPIEMEPRGIDLAASLADIHLEADIHALKNNPNGFPEGFWMPYLTIAYELKNTDTGAIKRGTLMPMVADHGPHYGANIAMEKDKKGGFGVGNYELTFYISNPEKQGFGRHVDEETGVGKWFEPFKVDYKFKYTGTPK
>1v2a_A mol:protein length:210  glutathione transferase gst1-6
MDYYYSLISPPCQSAILLAKKLGITLNLKKTNVHDPVERDALTKLNPQHTIPTLVDNGHVVWESYAIVLYLVETYAKDDTLYPKDPKVRSVVNQRLFFDIGTLYKRIIDVIHLVMKKEQPSDEQMEKLKGALDLLEQFVTERAYAAADHLTVADICLLGTVTALNWLKHDLEPFPHIRAWLERVRAEMPDYEEFSKQVADDTLAYVASRK
>6onk_B mol:protein length:137  Dehaloperoxidase B
GFKQDIATLRGDLRTYAQDIFLAFLNKYPDEKRNFKNYVGKSDQELKSMAKFGDHTEKVFNLMMEVADRATDCVPLASDASTLVQMKQHSGLTTGNFEKLFVALVEYMRASGQSFDSQSWDRFGKNLVSALSSAGMK
>4v8e_CG mol:protein length:182  50S ribosomal protein L5
MPLDVALKRKYYEEVRPELIRRFGYQNVWEVPRLEKVVINQGLGEAKEDARILEKAAQELALITGQKPAVTRAKKSISNFKLRKGMPIGLRVTLRRDRMWIFLEKLLNVALPRIRDFRGLNPNSFDGRGNYNLGLREQLIFPEITYDMVDALRGMDIAVVTTAETDEEARALLELLGFPFRK
>7d1t_b mol:protein length:505  Photosystem II CP47 reaction center protein
GLPWYRVHTVLINDPGRLIAAHLMHTALVAGWAGSMALYELATFDPSDPVLNPMWRQGMFVLPFMARLGVTGSWSGWSITGETGIDPGFWSFEGVALAHIVLSGLLFLAACWHWVYWDLELFRDPRTGEPALDLPKMFGIHLFLAGLLCFGFGAFHLTGLFGPGMWVSDPYGLTGSVQPVAPEWGPDGFNPYNPGGVVAHHIAAGIVGIIAGLFHILVRPPQRLYKALRMGNIETVLSSSIAAVFFAAFVVAGTMWYGSATTPIELFGPTRYQWDSSYFQQEINRRVQASLASGATLEEAWSAIPEKLAFYDYIGNNPAKGGLFRTGPMNKGDGIAQAWKGHAVFRNKEGEELFVRRMPAFFESFPVILTDKNGVVKADIPFRRAESKYSFEQQGVTVSFYGGELNGQTFTDPPTVKSYARKAIFGEIFEFDTETLNSDGIFRTSPRGWFTFAHAVFALLFFFGHIWHGARTLFRDVFSGIDPELSPEQVEWGFYQKVGDVTTRK
>1swr_B mol:protein length:127  CORE-STREPTAVIDIN
AEAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGNAESRYVLTGRYDSAPATDGSGTALGWTVAWKNNYRNAHSATTWSGQYVGGAEARINTQWLLTSGTTEANAAKSTLVGHDTFTKVKPSAAS
>5xke_B mol:protein length:445  Tubulin beta chain
MREIVHIQAGQCGNQIGAKFWEVISDEHGIDPTGSYHGDSDLQLERINVYYNEATGNKYVPRAILVDLEPGTMDSVRSGPFGQIFRPDNFVFGQSGAGNNWAKGHYTEGAELVDSVLDVVRKESESCDCLQGFQLTHSLGGGTGSGMGTLLISKIREEYPDRIMNTFSVMPSPKVSDTVVEPYNATLSVHQLVENTDETYCIDNEALYDICFRTLKLTTPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTSRGSQQYRALTVPELTQQMFDSKNMMAACDPRHGRYLTVAAIFRGRMSMKEVDEQMLNVQNKNSSYFVEWIPNNVKTAVCDIPPRGLKMSATFIGNSTAIQELFKRISEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDATADEQGEFEEEGEEDEA
>6nx9_A mol:protein length:333  L-asparaginase 2
MHHHHHHLPNITILATGGTIAGGGDSATKSNYTVGKVGVENLVNAVPQLKDIANVKGEQVVNIGSQDMNDNVWLTLAKKINTDCDKTDGFVITHGTTTMEETAYFLDLTVKCDKPVVMVGAMRPSTSMSADGPFNLYNAVVTAADKASANRGVLVVMNDTVLDGRDVTTTNTTDVATFKSVNYGPLGYIHNGKIDYQRTPARKHTSDTPFDVSKLNELPKVGIVYNYANASDLPAKALVDAGYDGIVSAGVGNGNLYKSVFDTLATAAKTGTAVVRSSRVPTGATTQDAEVDDAKYGFVASGTLNPQKARVLLQLALTQTKDPQQIQQIFNQY
>2qr0_S mol:protein length:213  Fab-Fragment Light Chain
DIQMTQSPSSLSASVGDRVTITCRASQSVSSAVAWYQQKPGKAPKLLIYSASSLYSGVPSRFSGSRSGTDFTLTISSLQPEDFATYYCQQYSYYYYPFTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNR
>4v7v_B2 mol:protein length:46  50S ribosomal protein L34
MKRTFQPSVLKRNRSHGFRARMATKNGRQVLARRRAKGRARLTVSK
>5lze_r mol:protein length:65  30S ribosomal protein S18
FCRFTAEGVQEIDYKDIATLKNYITESGKIVPSRITGTRAKYQRQLARAIKRARYLSLLPYTDRH
>7b4v_A mol:protein length:132  Broadly neutralizing DARPin bnD.2
GPGSDLGKKLLEAARAGQDDEVRILMANGADVNASDADVGATPLHLAAWAGHLEIVEVLLKTGADVNAVDIWGLTPLHLAAAVGHLEIVEVLLKHGADVNAQDKFGKTPFDLAIDNGNEDIAEVLQKAAKLN
>7xjh_R mol:protein length:395  Beta-3 adrenergic receptor
DYKDDDDAMGAPWPHGNGSVASWPAAPTPTPDAANTSGLPGAPWAVALAGALLALEVLATVGGNLLVIVAIARTPRLQTMTNVFVTSLATADLVVGLLVVPPGATLALTGRWPLGATGCELWTSVDVLCVTASIETLCALAVDRYLAVTNPLRYGALVTKRRARAAVVLVWVVSAAVSFAPIMSKWWRVGADAEAQRCHSNPHCCAFASNIPYALLSSSVSFYLPLLVMLFVYARVFLVATRQLRLLRRELGRFPPAESPPAASRSRSPGPARRCASPAAVPSDRLRPARLLPLREHRALRTLGLIVGTFTLCWLPFFVANVMRALGGPSLVPSPALLALNWLGYANSAFNPLIYCRSPDFRSAFRRLLCRCRREEHRAAASPPGDPSENLYFQG
>6bx1_z mol:protein length:540  VP2
SGVGHSTGNYNNRTIFHYHGDEVTIICHATRHIHLNMSPTEEYKIYDTNHGPEFPNTGDQTQQGRNTVNDSYHAKVETPWYLINPNSWGIWFNPADFQQLITTCTHVTIETLTQEIDNIVIKTVSKQGSGAEETTQYNNDLTALLEVALDKSNMLPWVADNMYLNSLGYIPWRPCKLTQFCYHTNFYNTINLLEGTQQNQWSQIKEGIQYDNLQFTPIETSAEIDLLRTGDSWTSGTYHFKCKPTQLFYHWQSTRHIGAPHPTTSPEQEGQKGQIIQDTNGWQWGDRDNPISASTTVKDFHIGYSWPEWRWHYSTGGPSINPGSAFSQTPWGSEVGGTRLTQGASEKAIFDYNHGEAEPGHRDQWWQNNAQQTGQTNWAIKNAHQSELRNATASRETFWTQDYHNTFGPYTAVDDVGIQYPWGAMWGKQPDTTHKPMMSAHAPFTCQNGPPGQLLVKLAPNYTDSLNNEGLQTNRIVTFATFWWTGRCTFKAKLRTPRQFNAYQLPGIPSGTNPKKFVPDAIGRFELPFMPGRAMPNYTY
>7lkj_D mol:protein length:423  Aminofutalosine deaminase
MHHHHHHENLYFQGMQEIIGASLVFLCNEKCEVLEDYGVVFDEKIVEIGDYHNLTLKYPHLKAQFFENSVLLPAFINAHTHFEFSNNKASFDYGSFSGWLGSVLNNGGAILENCQGAIQNAIMAQLKSGVGSVGAISNHLIEVNLLKESPLNAVVFLEFLGSSYSLEKLKAFEAKFKELKDLEDQKLKAALAVHAPYSVQKDMALSVIQLAKDSQSLLSTHFLESLEELEWVENSKGWFENFYQRFLKESNFTSLYEGANDYIDMFKDTHTLFVHNQFASLEALKRIKSQVKNAFLITCPFSNRLLSGKALDLERVREAGLSVSVATDGLSSNISLSLLDELRAFLLSHNMPLLELAKIALLGATRHGAKALALNNGEIETNKRADLSVFGFNEKFTKEQAILQFLLHAKEVERLFLGGKRVI
>4xuc_A mol:protein length:218  Catechol O-methyltransferase
NLLAGDTKEQRILNHVLQHAEPGNAQSVLEAIDTYCEQKEWAMNVGDKKGKIVDAVIQEHQPSVLLELGAYCGYSAVRMARLLSPGARLITIEINPDCAAITQRMVDFAGVKDKVTLVVGASQDIIPQLKKKYDVDTLDMVFLDHWKDRYLPDTLLLEECGLLRKGTVLLADNVICPGAPDFLAHVRGSSCFECTHYQSFLEYREVVDGLEKAIYKGP
>3l0s_A mol:protein length:223  Adenylate kinase
MNILIFGPNGSGKGTQGNLVKDKYSLAHIESGGIFREHIGGGTELGKKAKEFIDRGDLVPDDITIPMVLETLESKGKDGWLLDGFPRNTVQAQKLFEALQEKGMKINFVIEILLPREVAKNRIMGRRICKNNPNHPNNIFIEAIKPNGDVCRVCGGALSARADDQDEGAINKRHDIYYNTVDGTLAAAYYYKNMAAKEGFVYIELDGEGSIDSIKDTLLAQLA
>7rqc_2P mol:protein length:150  50S ribosomal protein L15
MKLSDLRPNPGANKRRKRVGRGPGSGHGKTATRGHKGQKSRSGGLKDPRRFEGGRSTTLMRLPKRGMQGQVPGEIKRPRYQGVNLKDLARFEGEVTPELLVRAGLLKKGYRLKILGEGEAKPLKVVAHAFSKSALEKLKAAGGEPVLLEA
>4yus_A mol:protein length:382  Family 3 adenylate cyclase
MNHKVHHHHHHIEGRHMKRLTYISKFSRPLSGDEIEAIGRISSQKNQQANVTGVLLCLDGIFFQILEGEAEKIDRIYERILADERHTDILCLKSEVEVQERMFPDWSMQTINLDENTDFLIRPIKVLLQTLTESHRILEKYTQPSIFKIISQGTNPLNIRPKAVEKIVFFSDIVSFSTFAEKLPVEEVVSVVNSYFSVCTAIITRQGGEVTKFIGDCVMAYFDGDCADQAIQASLDILMELEILRNSAPEGSPLRVLYSGIGLAKGKVIEGNIGSELKRDYTILGDAVNVAARLEALTRQLSQALVFSSEVKNSATKSWNFIWLTDSELKGKSESIDIYSIDNEMTRKSSGGLEIARNIGHYLERVGDRQPSQIFGVKSLPL
>1ziq_A mol:protein length:173  Gamma crystallin E
GKITFYEDRGFQGRHYECSTDHSNLQPYFSRCNSVRVDSGCWMLYEQPNFTGCQYFLRRGDYPDYQQWMGFSDSVRSCRLIPHSSSHRIRIYEREDYRGQMVEITDDCPHLQDRFHFSDFHSFHVMEGYWVLYEMPNYRGRQYLLRPGEYRRYHDWGAMNARVGSLRRIMDFY
>4qx8_D mol:protein length:68  Lysine-specific demethylase 2A
QVHLTHFELEGLRCLVDKLESLPLHKKCVPTGIEDEDALIADVKILLEELASSDPKLALTGVPIVQWP
>6r0z_B mol:protein length:578  V-type ATP synthase alpha chain
MIQGVIQKIAGPAVIAKGMLGARMYDICKVGEEGLVGEIIRLDGDTAFVQVYEDTSGLKVGEPVVSTGLPLAVELGPGMLNGIYDGIQRPLERIREKTGIYITRGVVVHALDREKKWAWTPMVKPGDEVRGGMVLGTVPEFGFTHKILVPPDVRGRVKEVKPAGEYTVEEPVVVLEDGTELKMYHTWPVRRARPVQRKLDPNTPFLTGMRILDVLFPVAMGGTAAIPGPFGSGKTVTQQSLAKWSNADVVVYVGCGERGNEMTDVLVEFPELTDPKTGGPLMHRTVLIANTSNMPVAAREASIYVGVTIAEYFRDQGFSVALMADSTSRWAEALREISSRLEEMPAEEGYPPYLAARLAAFYERAGKVITLGGEEGAVTIVGAVSPPGGDMSEPVTQSTLRIVGAFWRLDASLAFRRHFPAINWNGSYSLFTSALDPWYRENVAEDYPELRDAISELLQREAGLQEIVQLVGPDALQDAERLVIEVGRIIREDFLQQNAYHEVDAYCSMKKAYGIMKMILAFYKEAEAAIKRGVSIDEILQLPVLERIGRARYVSEEEFPAYFEEAMKEIQGAFKALA
>6fl9_E mol:protein length:320  Cys-loop ligand-gated ion channel
MASLAAEPSDVFIGLKIDQITGINQKEENFSVVGSLRIDWRQPLLAFEHAPGEPKHRTYTLATFLKLLEEKQIRWPAFTYHNQQGRMDFQNRLISLSEDGTVMYLERFTSTFQAPAFDFRLFPFDNQLFFIHVDSIFPQHLFRFQEMQGFSGLGDQLGEEEWIVTEVNTHLTTHNEFTKGDASRFVLEFHAERHLNYYLMRILIPVLLIITVSWFTFFLQDYTKRIDLAGGNLLLFIAFNFTISSDLPRLGYITLMDAFLVGTFIITALVVLGNVWLRRLENHGKQALARKLDIYAITSYPLAYLLGALTLWLLFFWRSY
>7som_CC mol:protein length:443  Tubulin beta
MREIVHIQGGQCGNQIGAKFWEVVSDEHGIDPTGTYHGDSDLQLERINVYFNEATGGRYVPRAILMDLEPGTMDSVRSGPYGQIFRPDNFVFGQTGAGNNWAKGHYTEGAELIDSVLDVVRKEAESCDCLQGFQVCHSLGGGTGSGMGTLLISKIREEYPDRMMLTFSVVPSPKVSDTVVEPYNATLSVHQLVENADECMVLDNEALYDICFRTLKLTTPTFGDLNHLISAVMSGITCCLRFPGQLNADLRKLAVNLIPFPRLHFFMVGFTPLTSRGSQQYRALTVPELTQQMWDAKNMMCAADPRHGRYLTASALFRGRMSTKEVDEQMLNVQNKNSSYFVEWIPNNVKSSVCDIPPKGLKMSATFIGNSTAIQEMFKRVSEQFTAMFRRKAFLHWYTGEGMDEMEFTEAESNMNDLVSEYQQYQDASAEEEGEFEGEEEEA
>4r8p_H mol:protein length:122  Histone H2B 1.1
AKSAPAPKKGSKKAVTKTQKKDGKKRRKTRKESYAIYVYKVLKQVHPDTGISSKAMSIMNSFVNDVFERIAGEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKAVTKYTSAK
>2euz_A mol:protein length:345  NDT80 protein
GPLGSMNEMENTDPVLQDDLVSKYERELSTEQEEDTPVILTQLNEDGTTSNYFDKRKLKIAPRSTLQFKVGPPFELVRDYCPVVESHTGRTLDLRIIPRIDRGFDHIDEEWVGYKRNYFTLVSTFETANCDLDTFLKSSFDLLVEDSSVEGRLRVQYFAIKIKAKNDDDDTEINLVQHTAKRDKGPQFCPSVCPLVPSPLPKHQTIREASNVRNITKMKKYDSTFYLHRDHVNYEEYGVDSLLFSYPEDSIQKVARYERVQFASSISVKKPSQQNKHFSLHVILGAVVDPDTFHGENPGIPYDELALKNGSKGMFVYLQEMKTPPLIIRGRSPSNYASSQRITVR
>5e18_A mol:protein length:315  DNA-directed RNA polymerase subunit alpha
MLDSKLKAPVFTVRTQGREYGEFVLEPLERGFGVTLGNPLRRILLSSIPGTAVTSVYIEDVLHEFSTIPGVKEDVVEIILNLKELVVRFLNPSLQTVTLLLKAEGPKEVKARDFLPVADVEIMNPDLHIATLEEGGRLNMEVRVDRGVGYVPAEKHGIKDRINAIPVDAVFSPVRRVAFQVEDTRLGQRTDLDKLTLRIWTDGSVTPLEALNQAVEILREHLTYFSNPQAAAVAAPEEAKEPEAPPEQEEELDLPLEELGLSTRVLHSLKEEGIESVRALLALNLKDLKNIPGIGERSLEEIKEALEKKGFTLKE
>5xru_A mol:protein length:193  adenylate kinase
MADKIKDAKIIFVVGGPGSGKGTQCEKIVAKYGYTHLSSGDLLRAEVSSGSERGKQLQAIMQKGELVPLDTVLDMIKDAMIAKADVSKGYLIDGYPREVKQGEEFEKKIGKPCLLLYIDAKGETMVKRLMKRGETSGRADDNEETIKKRLDLYYKATEPVIAFYEGRGIVRKIDSELPVDEVFKQVSTAIDAL
>7oiz_l mol:protein length:136  50S ribosomal protein L16
MLQPKRTKFRKMHKGRNRGLAQGTDVSFGSFGLKAVGRGRLTARQIEAARRAMTRAVKRQGKIWIRVFPDKPITEKPLAVRMGKGKGNVEYWVALIQPGKVLYEMDGVPEELAREAFKLAAAKLPIKTTFVTKTVM
>7l08_4 mol:protein length:103  39S ribosomal protein L36, mitochondrial
MANLFIRKMVNPLLYLSRHTVKPRALSTFLFGSIRGAAPVAVEPGAAVRSLLSPGLLPHLLPALGFKNKTVLKKRCKDCYLVKRRGRWYVYCKTHPRHKQRQM
>5w5f_O mol:protein length:163  Tail tube protein gp19
MFVDDVTRAFESGDFARPNLFQVEISYLGQNFTFQCKATALPAGIVEKIPVGFMNRKINVAGDRTFDDWTVTVMNDEAHDARQKFVDWQSIAAGQGNEITGGKPAEYKKSAIVRQYARDAKTVTKEIEIKGLWPTNVGELQLDWDSNNEIQTFEVTLALDYWE
>1cah_A mol:protein length:259  CARBONIC ANHYDRASE II
SHHWGYGKHNGPEHWHKDFPIAKGERQSPVDIDTHTAKYDPSLKPLSVSYDQATSLRILNNGHAFNVEFDDSQDKAVLKGGPLDGTYRLIQFHFHWGSLDGQGSEHTVDKKKYAAELHLVHWNTKYGDFGKAVQQPDGLAVLGIFLKVGSAKPGLQKVVDVLDSIKTKGKSADFTNFDPRGLLPESLDYWTYPGSLTTPPLLECVTWIVLKEPISVSSEQVLKFRKLNFNGEGEPEELMVDNWRPAQPLKNRQIKASFK
>1rd4_D mol:protein length:191  Integrin alpha-L
GAMSCIKGNVDLVFLFDGSMSLQPDEFQKILDFMKDVMKKLSNTSYQFAAVQFSTSYKTEFDFSDYVKRKDPDALLKHVKHMLLLTNTFGAINYVATEVFREELGARPDATKVLIIITDGEATDSGNIDAAKDIIRYIIGIGKHFQTKESQETLHKFASKPASEFVKILDTFEKLKDLFTELQKKIYVIEG
>5tg8_A mol:protein length:332  Hemagglutinin HA1 chain
ADPGDKICLGHHAVANGTKVNTLTERGVEVVNATETVEITGIDKVCTKGKKAVDLGSCGILGTIIGPPQCDLHLEFKADLIIERRNSSDICYPGRFTNEEALRQIIRESGGIDKESMGFRYSGIRTDGATSACKRTVSSFYSEMKWLSSSMNNQVFPQLNQTYRNTRKEPALIVWGVHHSSSLDEQNKLYGTGNKLITVGSSKYQQSFSPSPGARPKVNGQAGRIDFHWMLLDPGDTVTFTFNGAFIAPDRATFLRSNAPSGIEYNGKSLGIQSDAQIDESCEGECFYSGGTINSPLPFQNIDSRAVGKCPRYVKQSSLPLALGMKNVPEKI
>7pi2_E mol:protein length:231  Monoclonal antibody Cy.003 heavy chain
AVTLDESGGGLQTPGGALSLVCKGSGFFSFSSYTMQWVRQAPGKGLEWVASISSGGGTNYGAAVKGRATISRDNGQSTLRLQLNNLRAEDTGTYYCAKHGVNGCDWSYSVGCVDAWGHGTEVIVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDK
>7qyd_B mol:protein length:724  Pesticidal crystal protein Cry11Ba
MQNNNFNTTEINNMINFPMYNGRLEPSLAPALIAVAPIAKYLATALAKWAVKQGFAKLKSEIFPGNTPATMDKVRIEVQTLLDQRLQDDRVKILEGEYKGIIDVSKVFTDYVNQSKFETGTANRLFFDTSNQLISRLPQFEIAGYEGVSISLFTQMCTFHLGLLKDGILAGSDWGFAPADKDALICQFNRFVNEYNTRLMVLYSKEFGRLLAKNLNEALNFRNMCSLYVFPFSEAWSLLRYEGTKLENTLSLWNFVGESINNISPNDWKGALYKLLMGAPNQRLNNVKFNYSYFSDTQATIHRENIHGVLPTYNGGPTITGWIGNGRFSGLSFPCSNELEITKIKQEITYNDKGGNFNSIVPAATRNEILTATVPTSADPFFKTADINWKYFSPGLYSGWNIKFDDTVTLKSRVPSIIPSNILKYDDYYIRAVSACPKGVSLAYNHDFLTLTYNKLEYDAPTTQNIIVGFSPDNTKSFYRSNSHYLSTTDDAYVIPALQFSTVSDRSFLEDTPDQATDGSIKFTDTVLGNEAKYSIRLNTGFNTATRYRLIIRFKAPARLAAGIRVRSQNSGNNKLLGGIPVEGNSGWIDYITDSFTFDDLGITTSSTNAFFSIDSDGVNASQQWYLSKLILVKESSFTTQIPLKPYVIVRCPDTFFVSNNSSSTYEQGYNNNYNQNSSSMYDQGYNNSYNPNSGCTCNQDYNNSYNQNSGCTCNQGYNNNYPK
>2vbj_B mol:protein length:152  DNA ENDONUCLEASE I-CREI
NTKYNKEFLLYLAGFVDADGSIIAQIEPNQSSKFKHRLKLTFQVTQKTQRRWFLDKLVDEIGVGYVRDSGSVSNYILSEIKPLHNFLTQLQPFLKLKQKQANLVLKIIEQLPSAKESPDKFLEVCTWVDQIAALNDSKTRKTTSETVRAVLD
>6nlj_K mol:protein length:158  Ferroxidase
MKGDKKVIQHLNKILGNELIAINQYFLHSRMWNDWGLKRLGAHEYHESIDEMKHADKLIERILFLEGLPNLQDLGKLLIGENTQEMLQCDLNLELKATKDLREAIVHCEQVHDYVSRDLLKDILESEEEHIDYLETQLGLIQKVGLENYLQSHMHEDD
>6zh9_FFF mol:protein length:134  Nanobody H11-H4
QVQLVESGGGLMQAGGSLRLSCAVSGRTFSTAAMGWFRQAPGKEREFVAAIRWSGGSAYYADSVKGRFTISRDKAKNTVYLQMNSLKYEDTAVYYCAQTHYVSYLLSDYATWPYDYWGQGTQVTVSSKHHHHHH
>6yfp_BQ mol:protein length:164  coat protein
SYTIDINCSTGDTQANLVLTEIPAEPYVHVSGDNKSTIEYLDTGSDNSLLVRPTQQFNCVSSQYPYRNYSKIPRSQQDPLAVRREFYTRRVEYWRKADASNVDAPEYTLPQSCSIRLASTVTKETTAADIAGIVLRTLAPIFPNGSGDWIKLQQLIDGLPRIFG
>3rap_R mol:protein length:167  PROTEIN (G protein RAP2A)
MREYKVVVLGSGGVGKSALTVQFVTGTFIEKYDPTIEDFYRKEIEVDSSPSVLEILDTAGTEQFASMRDLYIKNGQGFILVYSLVNQQSFQDIKPMRDQIIRVKRYEKVPVILVGNKVDLESEREVSSSEGRALAEEWGCPFMETSAKSKTMVDELFAEIVRQMNYA
>4fk2_A mol:protein length:903  DNA polymerase
MKEFYLTVEQIGDSIFERYIDSNGRERTREVEYKPSLFAHCPESQATKYFDIYGKPCTRKLFANMRDASQWIKRMEDIGLEALGMDDFKLAYLSDTYNYEIKYDHTKIRVANFDIEVTSPDGFPEPSQAKHPIDAITHYDSIDDRFYVFDLLNSPYGNVEEWSIEIAAKLQEQGGDEVPSEIIDKIIYMPFDNEKELLMEYLNFWQQKTPVILTGWNVESFAIPYVYNRIKNIFGESTAKRLSPHRKTRVKVIENMYGSREIITLFGISVLDYIDLYKKFSFTNQPSYSLDYISEFELNVGKLKYDGPISKLRESNHQRYISYNIIAVYRVLQIDAKRQFINLSLDMGYYAKIQIQSVFSPIKTWDAIIFNSLKEQNKVIPQGRSHPVQPYPGAFVKEPIPNRYKYVMSFDLTSAYPSIIRQVNISPETIAGTFKVAPLHDYINAVAERPSDVYSCSPNGMMYYKDRDGVVPTEITKVFNQRKEHKGYMLAAQRNGEIIKEALHNPNLSVDEPLDVDYRFDFSDEIKEKIKKLSAKSLNEMLFRAQRTEVAGMTAQINRKALINGLAGALGNVWFRYYDLRNATAITTFGQMALQWIERKVNEYLNEVCGTEGEAFVLYGDTDSIYVSADKIIDKVGESKFRDTNHWVDFLDKFARERMEPAIDRGFREMCEYMNNKQHLMFMDREAIAGPPLGSKGIGGFWTGKKRYALNVWDMEGTRYAEPKLKIMGLETQKSSTPKAVQKALKECIRRMLQEGEESLQEYFKEFEKEFRQLNYISIASVSSANNIAKYDVGGFPGPKCPFHIRGILTYNRAIKGNIDAPQVVEGEKVYVLPLREGNPFGDKCIAWPSGTEITDLIKDDVLHWMDYTVLLEKTFIKPLEGFTSAAKLDYEKKASLFDMFDF
>1yja_A mol:protein length:275  SUBTILISIN 8397+1
AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASFVPSETNPFQDNNSHGTHVAGTVAALDNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVINMSLGGPSGSAALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPAKYPSVIAVGAVDSSNQRASFSSVGPELDVMAPGVSICSTLPGNKYGAYSGTSMASPHVAGAAALILSKHPNWTNTQVRSSLENTTTYLGDSFYYGKGLINVQAAAQ


================================================
FILE: src/alphafold3/test_data/miniature_databases/rfam_14_4_clustered_rep_seq__subsampled_1000.fasta
================================================
>AY587142.1/1755-1856 Arsenophonus endosymbiont of Aleurodicus dugesii 16S ribosomal RNA gene, partial sequence; tRNA-Glu gene, complete sequence; and 23S ribosomal RNA gene, partial sequence. 
CTTTAACAATCTGGAACAAGCTGAAAATTGAAACACACATTATTGAAAAATAGTGTGGGGAACTCTCAAAACTCCAAGTTGAAGTGTTATGCAAATAGGCAG
>MTKT01000541.1/46599-46389 Punica granatum cultivar Dabenzi scaffold481, whole genome shotgun sequence. 
CTCATTACCCTAAAACCACAGGTTTCCGCAAAGTCGTAAGACCATGTATGGGGGCTGACGCTTGCCCTGTGTCGGAAGGTCAAGGAAGTTGATGACCTGATGACGAGGGAGTCGACGATCGAAGCCCCGGTGGACGAAGACTGTAACTATAACAGTCCTAAGGTAGGGAAATTTCTTGTCGGGTAAGTTCCAACCCGCACAAAAGGCGTAA
>ABRO02008320.1/60058-60003 Dipodomys ordii contig_8320, whole genome shotgun sequence. 
GGAGATATGGCTCAAGTGGTAGAGCACCTGCCTAGAAAGCACGTGGCCTATTGCCA
>MTKT01004810.1/4745052-4744924 Punica granatum cultivar Dabenzi scaffold70, whole genome shotgun sequence. 
TCGTTTGCAGATGCAGCTTCATCAAGATTCACATGCCGGCCTCTACGTTCGTCAGAGGTACCGTGTTTCTCGGACAGCTATAGTAGGTTCTGGTATTGGGAATCTTGATGATGCTGCATCGGCAAGAGA
>ABRO02033548.1/61663-61950 Dipodomys ordii contig_33548, whole genome shotgun sequence. 
GTAAGGGCAATCTGGCTACAACATCTGTCACCTCATTGATCACCACGGTTGATCTGGGTATCTGGCCTGCTAGGCAGGTGTCCCCTTCCTCCCTTACCTGTGTGCCCCTCCTGAAGCTGCATGCTTGGTTGAGGACGACCATCCCAGCATCTGATCGAGGAGGACTGGTCTTTAGTCAAGGGTATATGAGTAGCTGTGTTCTGATAGAACCTCCAAACAAGCTCTCAACAGAAGGGACAGGAGGGGAAAACAGAGAGAACACTGCCCATAAAGAAATGTAATCTTTAT
>AUSU01004475.1/2209-2114 Genlisea aurea contig_6775, whole genome shotgun sequence. 
CTTCTGCGGTGATGAAATTAATTTTCGCATGTCAGACTTCAGAGATTTTTCATTAAATCAATGAGATGAATAACTTCACTTTGACCTGAGCAGAAG
>GL896952.1/11483861-11483692 Mustela putorius furo unplaced genomic scaffold scaffold00055, whole genome shotgun sequence. 
AGCTTTGCGCAGTGGCAGTATTGTAGCCAATGAGGTTTATCCGAGGCGTGATTATTGCTAATTGAAAACTAGTTCATCATATTGGTCACGTGAGCTTCTCTCATCCAGCCTAGGAAATGTGAGATTTTGAGTGTGAGAGAATGCTGTTACCAGTTTTGCCTGGGAGAAGA
>KQ414408.1/749-926 Termitomyces sp. J132 unplaced genomic scaffold C248965, whole genome shotgun sequence. 
AACAGGCTGATCGCGGACGAGAGTACACATTGTCTCCGCGGATTGGCACCTCGATGTCGACTCATCCTATCCTCTGGGGGAAGAAGCTTGGAAGGGTTCGGCTGTTCGCCGATTAAAAGGGTACGTGAGTTGGGTTTAATACGACGTGAACTACAAAATTTTAATTAAACCCTTAAAT
>CP000593.1/393484-393597 Ostreococcus lucimarinus CCE9901 chromosome 13, complete sequence. 
TCTTCCTTAACTCAGCTGGTAGAGTGTCAGACTGTTAGGAAAAAGTCTCCGTCGAATATGACGGCTGCTCCGATAGAGATCTGGAAGCCGCGGGATCGAAACCCGCAGGAAGAG
>JFYO01000008.1/890-1 Microbacterium oleivorans strain RIT293 contigs6, whole genome shotgun sequence. 
GCGACTGTTTACTAAAAACACAGGTCCGTGCCAAGTCGCAAGACGATGTATACGGACTGACGCCTGCCCGGTGCTGGAAGGTTAAGAGGACCGGTTAGCCGCAAGGCGAAGCTGAGAATTTAAGCCCCAGTAAACGGCGGTGGTAACTATAACCATCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAACGACTTCCCAACTGTCTCAACCGCGAACTCGGCGAAATTGCATTACGAGTAAAGATGCTCGTTACGCGCAGCAGGACGGAAAGACCCCGTGACCTTTACTATAGCTTTGTATTGGTGTTCGGTGTGGCTTGTGTAGGATAGGTGGGAGACTTTGAAGCGGTGACGCCAGTTACCGTGGAGTCATTGTTGAAATACCACTCTGGTCACTCTGGATATCTAACTTCGAACCGTAATCCGGTTCAGGGACAGTGCATGGTGGGTAGTTTAACTGGGGCGGTTGCCTCCCAAAAAGTAACGGAGGCGCCCAAAGGTTCCCTCAACCTGGTTGGCAATCAGGTGGCGAGTGTAAGTGCACAAGGGAGCTTGACTGTGAGACTGACAGGTCGAGCAGGGACGAAAGTCGGGACTAGTGATCCGGCAGTGGCTTGTGGAAGCGCTGTCGCTCAACGGATAAAAGGTACCTCGGGGATAACAGGCTGATCTTGCCCAAGAGTCCATATCGACGGCATGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGGAGTAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCCCTATCCGCTGCGCGCGTAGGAAATTTGAGAGGATCTGACCCTAGTAC
>FWWT01000006.1/33934-33831 Desulfonispora thiosulfatigenes DSM 11270 genome assembly, contig: Dest_Contig00014 
ATATTTTATATCGGGAGCTTGAAAAGGCTGAGAGTATGATGTTTTCGTAGACCGATTGAACCTGTTGGGTAATGCCAGCGTAGGGAATGTGATTAAATTATTAC
>AWHE01032144.1/18768-18530 Amborella trichopoda AMTR_V1.0_contig_32144, whole genome shotgun sequence. 
TAGCGAGTGGTTTGAGTTTTTCATTTATTTTTTAATTCCATGGGAAGTGGTGCATGGCCATTCATAGTTGGTGGGGTGGGGTGATTTGTTGCCTAATTCCATTAATGAATGAGACTTTCAGCCTGCTAACTAGCTTCGTGAGATATCCTCCACAACCAACTGCTTAGACAGAGCGACGAAGTATGGCTGTTTAGGTCAAGAATGTTTGAGGTGAAAACAGGTTTGTGATGCCCTTAGAT
>CP014699.1/1893224-1893021 Streptococcus sp. TA 26, complete genome. 
AAATGTCTTCAGGGCAGGGTGCAATTCCCGACCGGCGGTGACTTTTCGTTTACTGTTCCAGCTTGATGGCCTGCAGAGTAGTTCTGCAGAGCTGATGCTTAAAAATAAGCAGCAGGAATATGAAGCGAGAAGAAGTCCGCGAGCGCAAGCTGATGCGGTGCAATTCCGCAACCGACAGTAAAGTCTGGATGGGAGAAGACGAAG
>JRRC01354587.1/210-1 Gossypium arboreum cultivar AKA8401 contig_360664_1, whole genome shotgun sequence. 
CTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTTAAGCGCGCGACCTATACCCGGCCGTCGGGGCAAGAGCTAGGCCCCGATGAGTAGGAGGGCGCGGCGGTCGCCGCAAAACCCGGGGCGCGAGCCCGGGCTGAGCGGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGAGGGGAA
>LFZV01000001.1/3925782-3925615 Bacillus sp. FJAT-27916 Scaffold1, whole genome shotgun sequence. 
TTTTCTGTATAAGCGCCAGAACTAAACCCATGTGGTGGGATTTAGTTGACGAGGTGGAGGTTATCGAAATGTTCGGCGGGAGCCTCCCAGCTTACATGTGCGGGCTGCAACTCTTTTTACCAAAACAGTTTGGCGACAAACTGGACAGAATAAAGAGAGAAGCACATA
>JJRU01049126.1/2855-2468 Picoides pubescens contig49126, whole genome shotgun sequence. 
TATACTCAGTCCAAAAATTTCTTGCAATGCATTTATAGAAGCTTTCTGATGCAGGTAGTTAAAGACTTGTGGCGGTCAAGTGTTCACAGCGACGTTGCTTTTTGATCCTTCATTGTCAGTTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCTACTAATAGGGAACATGAGCTGGGATTAGACCATCATGAGACAGGTTAGTTCTACCCTACTGATGATGTGTTGTTGCAATAGTAATCCTGCTCAGTATGAGAGGTACCACAGGTTCAGATTCTTGGTACATGCGATTGGCTGAGGAATCATGGATTCATAGAATCAAAAAGGTTGGAAAAGACCTCAAAGATCACACAATCACACAGAATCACAGAATC
>NC_009988.1/26865-27149 Bat coronavirus HKU2, complete genome 
GCATTTTTTTATTAACATTGGCAAATTTTGCAGATTTGTTTGACATACAATCCCTAGCTTTGCTTGTGGATTTAGTCTCATACACAATGGTAAGCACGTAATTATGCTAGTATGAGTAGAGTATAATTATATTGAGTCCTATAGACCAACGCAGTTAACTACATGTCCGGTGTGGCGGAGTAATCAAAGATCCGCTTGACGAGCCTATATGGAAGAGCCGTCACACCTCGTATGTATGTTGCTGCTAGTAGTTGTTAATTAGTTGATTCTTTGACAGTGATACAC
>GG697144.2/73122-72404 Mitsuokella multacida DSM 20544 genomic scaffold Scfld3, whole genome shotgun sequence. 
TGAGTAGCGAAACGATCCGTGAGAATCGGATCCACCGAAAGCCTAAGGGATCCTGAGCAACGCTCGTCGTCTCAGGGTAAGTCGGGACCTAAGCCGAGGCATAAAGCATAGGCGATGGACAACAGGCGAAAATTCCTGTACTGCATGATGTTGTTTGAGGATGGAGTGACACAGCAAGGAGCTTGAGCGCGCGATTGGAAATGCGCGTCGAAGGCGGTAGGCTGGTACAGAGGCAAATCCCTGTACTAAGGCCGAGAACTGATAGATAGGAGCGTACTTCGGTACAATCCAAATTCAAGCGTACTACACTGTCGAGAAAAGCTTCTAACGAGACATCATGTACCCGTACCAAAACCGACACAGGTAGGCGGGGAGAGAATCCTAAGGTGCGCGGGAAAACCCTCGTTAAGGAACTCGGCAAAATGCATCCGTAACTTCGGGAGAAGGATGGCCGGAGCTGGTGAAGACCCTTGCGGTTGGAGCTGGAGCCGGCGGCAGAAGAGAAGCCCAAGCGACTGTTTACCACAAACACAGGTGCCTGCTAAAGAGAAATCTGACGGTTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCCATAGAGCTTGCCAGCCGTGCCGTTCAGAGCGATACCCTGATAGTTGGCAGCAT
>CP000482.1/1312853-1313047 Pelobacter propionicus DSM 2379, complete genome. 
AATTGAATATCTGATCAAGGTGCCCGAGAGGGCTTGATAGGGAAGAGGGGTGCCGCTCTCAGTAACGAGCCATTCCCCCGCGGACCCGCCGCTGTAAGCGATGACGAAGGGCAGTATGCCACTGGTGAATAACCGGGAAGGCGCCCGGAGGATGACTCGCGAGCCAGAAGACCTGCCTTTTGATTATTGCCACAG
>LL238006.1/6014-5950 Echinostoma caproni strain Egypt genome assembly, scaffold: ECPE_scaffold0004910 
ATTCTGTCTGTGAGGTCCCCGATCAGGTACATTGCTGATGAGACCCAGACAGGTCGAAACAGTAG
>HF952018.1/1220924-1220795 Thermobrachium celere DSM 8682 genomic scaffold, scaffold33 
GATGTTGTTAAAGGGGAGTAGCTGCCCATTTTGGGTTGATAAAGTCAACATGCTGGCCTTTGGCCTGGCTTTATCGGACGTTTGTCAAGTGAGACCTTTAACACAATGCTTTGCATTGTGTTAAAGGTCT
>JH472210.1/112-1 Nannochloropsis gaditana CCMP526 unplaced genomic scaffold scaffold1650, whole genome shotgun sequence. 
GGGTTACTCCATTGCGCTACGCGCTAGTTGATAAAAGTTCGCACCTCTATCAAACTGGGTAACCCCACCTCTTGGCAAGGCCTAATTGTCAGATCAAATCGAAACTACTTCA
>AEYP01109460.1/2187-2427 Mustela putorius furo breed Sable contig109460, whole genome shotgun sequence. 
AAAAAGACACTGTGTTCGGGGATCATTTCTACAGTTTGTTGCTAGAGAAGTTTTTCTGAACATGTAGAGTACCTCAAACCATGTGGAGGAAGAGGAGTGCTCTCTTGTGAGCCTGAAGCTGGATTTAGGTGTTCTTTCCAAACAGCCAATTATGGGTGCCTGGGTTGCTCAGTTTGTTAAACAACTGCCTTTGGCTCAGGTCATGATACTGGAGTCCTGAGATCAAGTCCCACATCAGAGT
>ADNJ02000004.1/3715450-3715582 Metarhizium robertsii ARSEF 23 MAA_Scf_4, whole genome shotgun sequence. 
GACAGAGTGCCCGAGTGGTTAAGGGGAGTGACTTGAAGCGCTAGGCCTGGAGTGCGAGAAATCGTATGAAGAACCGCCTAGCAATAGATATCACTTGGTTTCGGCCTCGCAGGTTCGAATCCTGTCTCTGTCG
>CCCW010014085.1/4006-862 Brassica napus, WGS project CCCW01000000 data, contig: 30103 
TATTTTTAATTCTGGTCGAACCAACTCCAAAATGGTCGAGCTGAATTTTTCTCGACCAAAATTTTATCTGCTCGTGAGGGTTATTACAGTCTACGAGTCGGGTTGTTTGGGAATGCAGCCCCAATCGGGCGGTAAATTCCATCCAAGGCTAAATATGGGCGAGAGACCGATAGCGAACAAGTACCGCGAGGTAAAGATGAAAAGGACTTTGAAAAGAGAGTCAAAGAGTGCTTGAAATTGTCGGGAGGGAAGCGGAAGTGGGCTTGCGATGCATCCCGGTCGGATGCAGAATGGAGCAATCCTGTCTGCCGATCGATTCAGGGCGTGGACCGACGCGGATTAAGGTGGTGACCTAAGCCCGGCTTTTGTTACGCCGCTACCTTAATCATTGTCTGCGGCACGAGCCTCACGGCATTCCTTGGCATCTGCGTGCTCAGGGCGTCGGCCTGTGGGCTCCCCATTCGACCCCTCTTGAAACACGGACCAAGGAGTCTGACATGTGTGCGAGTCAACGGGTGAGTAAACCCATAAGGCGCAAGGAAGCTGATTGGCTGGATCCCTCACGGGTGCACAGCCGACCGACCTTGATCTTCTGTGAAGGGTTCGAGTGTGAGCATGCCTGTCGGGACCCGAAAGATTGTGAACTATGCCTGAGTGGGGCGAAGCCAGAGGAAACTCTAGTGGAGGCCCGCAGCGATACTAACGTGCAAATCGTTCGTCTGACTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGGTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCTCGGAAACGAGTTCTATCGGGTAAAGCCAATGATTAGAGGCATCGGGGACGCAACGTCCTCGACCTATTCTCAAACTTTAAATAGGTAGGACAGGTGGCTGCTTTGTTGAGCCATCCCACGGAATCGAGAGCTCCAAGTGGGCCATTTTTGGTATGCAGAACTGGCGATACGGGATGAACAAGAAGCCGGGTTACAGTGCCCAACTGCGCTAACCTAGAACCCTCAAAGGGTGTTGGTCGATTAAGATAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTAAAGCACGCGACCTATAACCGGCCGTCGGGCAAGAGCCATGCCTCGATGAGTTGGAGGACGCGGCGGTCGCTGCAAAAACTAGGGCGCGAGCCCGGGCAGAGCGGTCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGGGAACTTGGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAATGGCACTTTCACATGGGTTAGTCGATCCTAAGAGTCGGGGGAAACCCATCTGATAGCGCTTATGCACGAACTTCGAAAGGGGATCCAGTTAAAATTCCTGAACCGGGACGTGGCGGTTGACGGCAACGTTAGGGAGTCCAGAGACGTCAGCGGGAATTCCGGAAAGAGTTATCATTTCTGTTTAACAGCCTGCCCACCCTGGAAACGGCTCAGGCAAAGGTAGGGTCAAGTGGCTGGAAGAGCACCGCACATCGTGTGGTGTCCGGTGCATTCCCGGCGGCCCTTGAAAACCTGGAGGACCGAGTGCCGCTCACGCCCGGTCGTACTCATAACCACATCAGGTCTCCAAGGTGAACAGCCTCTGGTCAATGGAACAATGTAGGCAAGGGAAGTCACAAAATAGATCCATAACTTTGGGAAAAGGATTGGCTCTGAGGGCTGGGATCGGGGGTCCCAGTTCCGAACCCGTCGACTGTTGGCGGGCTACTTGAGCTGCTAACATGGCGAGAGCGGACCGCCTTGTGTCGGCCGGGGGACGGACTGGGAACGGCTCTTTCGGGAGCTTTCCCCAGGCGTCAAACAGCAAACTCAGAACCGGTACGGACAAGGAGAATCCGACTATTTAATTAAAACAAAGCACTGCGATGGTCCATGCGGATGCTAATGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCAGGAGTAACTATGACTCTCTTAAGGTAACCAAATGCCTCGTCATCTAATTAGTGACGTGCATGAATGGATTAACGAGATTCCCACTGTGCATGTCTACTATCCTGCGAAACTACAGCCAAGGGAACGGGCTTGGCAGAATCAGCGGGAAAAGAAGACCCTATTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGAATAAGTGGGAGCTCCGGCGGGGTAACAACCCCTTCTTTTAGACCCAAGACTCGCTTTGGCGTGTCGATCCAGGTGGAGGACATTATCAGGTCGGGAGTTTGGCTGGGGCGGCACATTTGTTAAAAGATAACGCAGGTTTCCTAAGATAAGCTCGACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTTCAGTACGAATATGAACCGTGAAAGCGTGGCCTATCGAACCTTTAGACCTTTGGAATTTGAATCTAGAGGTGTCAAAAAAGTTACCACAGGGATAACTGGCTAGTGGCAGCCAAACGTTCATAGTGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAATGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGGGTTTAGACAGTCGTGAGACAGGTTAGTTTTACCCTACTGATGCCGGCGTCGCAATAGTAATTCAACCTAGTACAAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGCGCTGGATTATGACTGAACGCCTCTAAGTCAGAATCCGAGCTAGAAGGGACGCATGCGCCTGCCGCCCGATTACCGACCCTCAGTAAGAGCTTCGGCTCCCAAAGGAACGTGTCATTGGCTAAGTCCGTTCGGCAGAAGCGTCCTTTGGACCGCCTTGAATTATAATTACCACCGAGTGGCGGGTAGAATCCTTTGCAGACGACTTAAATACGCGACGGGGTATTGTAAGTGGCAGAGTGGCCTTGCTGCCACGATCCACTGAGATTAAGCCCTTTGTCGCTAAGATTCGA
>CM001407.1/48474749-48475301 Lepisosteus oculatus linkage group LG4, whole genome shotgun sequence. 
AAACAACAACAACTTATCTCTTAATTTTTTTCAATCCCTCTCTTACTCAATGAAGTGGCAGAATGACCTCAGAGCAGGCTCATGTTACTGGCATCAGGTAGCCAGCACCTGCCAGCCACAACCTGCTCCAGGAACAGTGGTAGGTAGGAGATTTGACCGAGGAAGTACTATACCCATTAAAACATTATCGCAAGTATCCTAAAGTGAGGTCAAGGAGCACAGAAACCTCCTGTGGAGCAAAAGGCCACTATCTTAGCTTATGAAAACTCATTATGAATATAGATATTGAAAGTGGCAATCCTTTTGGCTTTTGGAAATTTAAGTAGAAAGTGTCAAAAAGTTACCACAGGTATACTGTAACTAGCTTTTGGAAGCCAAGCATTCGTAGAAGCATTACATTTTGATCCTTCAATGTCGGGTGTTTGAATTATTCTTCAACAAGACTTCACCTTCCGTTCAAACATTGGCTTGTTCAACCGCTAATAGGGGGAGTGATCTGTGCTGAGACTGTTGCAAGGCAAACAGGAGTTGAGCATGGGTCAGTTGGTATTAC
>JQCA01000072.1/4381-4571 Lactobacillus paucivorans strain DSM 22467 NODE_100, whole genome shotgun sequence. 
TTGGTTCTAAGGTGTACGCGTTGTCTCACTACAAGTTGCCGAACAAGTAATTTATATATGGGAATGTTCTATGGTGGAGAAGATGGCAGGCCTTTTCACTTGGAAGTCAGACACTCCAACAGACATTCCCCCCTGCATTGTCATCGCGGGTCAACATGACTGGACAATTAACGGCACCACTTAGATCAACC
>KB018237.1/393050-393252 Camelus ferus unplaced genomic scaffold scaffold2244, whole genome shotgun sequence. 
ATCGCTTCTTGGCCTTTTGGCTAAGATGAAGTGTAGTATCTGTTCTTATCAGTCAGGGCACCAGCAGATTCGGTGTCTGGTGAGAGCCCACATCCCGGTTCATAGACCTTCCAGCTGTAAGCTCACTTGGCGAGAAGGACCGGGGTTTTCTCTGATCTCTTTTATAAGAGCACTCATCCCATTCATGATGGCTCTGCCCCACC
>APMT01104059.1/10100-10194 Mesocricetus auratus contig104059, whole genome shotgun sequence. 
GATTGTATGCTGGCACTCCCCCGATCCATTGGAATGATACAGAGAAGATTAGCATGGCCCCTGCACCTACATATTGTAGGGTACCACCTATGTTT
>URS0001A24371_12908/1-89 unclassified sequences L2-Alphaproteobacteria ribosomal protein leader 
GGGGACCUUCGGGGCCCUAUACCAACGGUGGGCUUCACCCACCCUACAUAAGACGGGGAGACCCGUCUAAGCUAAACGGAAGACAGAAA
>LN907827.1/31808-32053 Erwinia sp. EM595 isolate E_g_EM595 genome assembly, chromosome: 1 
TATTCACAGCGTCAGGTAGACGAGCTTCCTCAGGAAGCGCTCAGGGATAGCCCGGAAGGCAGCAGAGCAGGGAAAAAGGATGGGGTCTGAAGGAGAGACCGTCAGGGATAAGGAAGCGCTCGGGATGAGTGGACAGCAGACGGGATAAACCGGGATGTTGATTGCATAAAGGGATGTAAAGGATGACTGTCCTTCTACGGAAGGTACGAAAAAAGGCGACAGATTGCTCTGTCGCCTTTTTTCTTT
>FR872580.1/1712617-1713059 Parachlamydia acanthamoebae UV-7, complete genome 
GGGGGTGTCACGGTTTCGACTGAGAAGTCAAGTATTGATTGCATGCGGAGGATGTCGGTTGGCCTCCTAAAAAAGCCGATAAAACAATAAATGCTAACACAAATAGCAAACTAATTAGTGGTGTTGATTTTGCCGCTGCTGTAGAAGCTGATTCAGTTTCTTACGCTGCTGCTGCTTAACCTGACTAATTGGTCGCTGTATAAAGCCTAACAGCTTTATCAGCACAGCAGTCTGAGACTGGACCAAGGGTCGAGGAGTCTGCTGTCATTGACTTGGTACGGAATAAAGTCCGCCGCTTCTAGGGTTTTATTCTAAGATAAATGAAGCAAGTTAATCATAGTGTGGTGGCTGCAATGTGATTGACTTATTTTCAGCACACTAAGCATGTAGATATTAATATGTAGATTTGCCCAGGACGAGAGTTCAATTCTCTCCACCTCCAA
>JH835313.1/5567540-5567270 Erinaceus europaeus unplaced genomic scaffold scaffold00025, whole genome shotgun sequence 
GGATATGAGGGTGATCTGGCTGCGACATCTGTCATCCATTGATTCAGCTGATCTGGTTGGCTAGGCGAGTGTTCTCTTCCTCCCTCATTGCTCCATGTGAGTCCCTGCCGATGGCCTTTCCCAAATAGAGAAGGGCGGGCGAGTCTTCAGTTGAGGGTATAGGAATAGCTGCGCTCCCCTGCTAGGACCTCCAAGCAAGCTCTCAAGAGTCATCTTCAACCTTAAGGTCAGCTAGACTTTTTATGTTCTCCTTGTAGATCACCATTTTACA
>CM007648.1/27503544-27503238 Zea mays cultivar B73 chromosome 2, whole genome shotgun sequence. 
CATTGGTGAGAATCCAATGCCCCGAAAACCCAAGGTTTCCTCCGCAAGGTTCGTCCACGGAGGGTGAGTCAGGGCCTAAGATCAGGCCGAAAGGCGTAGTCGATGGACAACAGGTCAATATTCCTGTACTACCCCTTGTTGGTACGGAGGGACAGAGGAGGCTAGGTTAGCCGAAAGATGGGGCTAGTTTGATAACTCCATTTTCTCAAGAAAAATGAACTAATTGTTCCTGGGGAAAATGAAAATCCTTTACATCACGTTTGGATCATTGGAATCGAATTTCATTCTAATAATAGTAATTTAGGCG
>CCCW010011448.1/3522-244 Brassica napus, WGS project CCCW01000000 data, contig: 32740 
CATGGTCGGATTTTGATGTTCTAGTGTGTTTTGTTGGAAACTGTTTATGAGAATCTCTTATTTGGGAGTTATCAGAGATTATCATGAATTTTAATTAGTTTTTGGGAATTTATTTGAGTATGTTGGTTTGGACAGGTTATAGATTCTAAGTAGCCGAACCATGCTTATCTAGACTTGATGTTAGGATATCGGCCTTATGAATGTGCATTGTGTCTTGTGTGGTTTCAGGATCGGACATGGACCGTGGTAAGGGAAAGGCACCGTGAAGACTCAGGCCATGAGAAGATGTGTGGTGAATGGGTCATTGTAGATAGATGTGACATACTGATAGCCTATTGTGCAACTTGTGAACTTATGTTTGACTAAGTGTGTATAACTTATTAGGACGAACCTAAGAATGATGTATGAATCTCAGTTTATATTTATACAATTGATTTGCCCCTTATGTTTCCTTGTTTAGATTTTTTGTATTGAACCTCAGTTGAATTGAATTGAATTTACAAAGATAAGAATTAAAACTTGGTTCACTCGGACTTAGATTGAAAGGATAAGGCCGCAGATCAGTTTGAGCAGCCACAAATTTCCTGTGTGTGCTGACGGACACACACGGACGTCCTGTGTTTGCTGACGGACACCCACGGACGTCCTGTGTGTACTGAACAAACAGCCCACGGGACATCACATACAACCCTTGGTAACTAGTGACCTTTGGCCACTCGTGCCTCTTGGGACATGACCAACCGTTTAGCCCAACAGCCCAGTCTATGGTGCAATTCGAACCGACCATCTAACCGACCAGCATCTAGGTTAGCGGTTTGGTTATGACCGGCCAAGTCTAGGGACGTGTTCCTTGGACTGAACCAACACAACCCTTCGTTTATAATCAGAAAGAAGAGAAAGGGCCGGATAGAAACAAGAAGAGGAGAAGCGGTTAGGTCTAATGGACCGACCAGAGCCGCGGTGCGATCACAAGGACCGTCCGTTCGGTCTGATGGAGCCATAGGCCACCACGTACGTTCTGAACCGTGTCAGGTTTCTCCATGCTCTTCTCCTGCTCTCGGTCTCCCATACTTGATCAGAGGTTGCTTCACAAACGATCAGATCGCCGGAAACCTAACCACCACACAATCGGCCTTGCTTTGGCCGGAAACTCTCTCTTTCTTTCTTTCTCTCTCTCTATGATTTTTCTGAGTATTTTACTCTGGAATTGGATGATTGAAATTGACATAGAGGACCCCATATTTAGAGAAAATTAGGGGGTAAGTCTTGCCCAAAGAACAGGCATGACTGGCAAACGGATGGGCACAATCGGCCAAGGGTTACACCCTCTCGGCCGCATACGTCCCTTCGCCAATACCACATGGGATTGGGTCGGATAGAGGGCCACGGCCTTGTCCCAAGCCCCAACGGTCCATGGCCTCATGGCCGGACCCCCATGTCCCGCCACCAGCCCGGACCCGGGCCATCGGACCGAAACCCGAACAGTCCGTCCAGCTGAGTTTAGCTGACTCCCAGCTGTCTCAGCTGAGTGGGCTAGTAGTTCAGCTAGTGGAGCTGACTTAGTAGTGGCCGAGCTGGAGTGAGCTTAACCTAACTCCGTTGAGCTGGTCGAGCTACTTGTTCCATCCGTCCAGCTACCGTCTTACTCGTCCTAGCTGACTCTCGACTTGTATAAGATTAAGTCTAAGTTTCCTTACGTCCTTAACCTTCTTATCTGGCCATGGAACACTTGTCTTGATGTCCTAAGACTAACTAGTACGTTTCCTCGAAACATGGCCGTCCCAATGATCCTATTCAGGATCCGGGATGTTACAACGTCGGCGGGAATTTCGGAAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCCTGGAAACGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCGCACGTCGCCTGGTGTCCGGTGCATTCCCAGCGGCCCCTGAAAATCTGGAGGACCGACTGCTGCTCACGCCCGTTCGTACTCATAACCACATCAGGTCTCCAAGGTGAACAGCCTCTGGTCGATGGAACAATGTAGGCAAGGGAAGTCGGCAAAATGGATCCGTAACTTTGGGAAAAGGATTGGCTCTGAGGGCTGGGCTCGGGGGTCCCAGTTCCGAACCCGTCGACTGTTAGTGGGCTGCTTGAGCTGCTAACTTGGCGAGAGCGGACCGCCTCGTGTCGGCCGGGTGATGGACTGGGAACGGCTCTTTTGGGATCTTTCCCCGGGCGACGAACAGCCAACTCATATTTGGTACGGATAAGGGGAATCCGTCTGTTTTATTAAAACAAAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGATGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTGTCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGAAAAATCAGCGGGGAAAGAAGACCACTAATTTTAACGTTATTTTACTTACTCCGTGAATCGGAGGCGGGGTAACAACCCCTCCTTTTAGACCCAAGACTCGCTTCGGCGGGTCGATCCGGGCGGAGGACATTGTCAGGTGGGGAGTTTTTCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCTTAAGATAAGCTCAACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTTCAGTACGAATACGAACCGTGAAAGCGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTTGATGTCGGCTCTTCCTATCATTATGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTTGGTTTAGACCATCGTGAGACAGGTTAGTTTTACCCTACTGATGCCCGCGTCGCAATAGTAATTCAACCTAGTACGAGAGGAACTGTTGATTCGCACAATTCGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGCGCTGGATTATGACTGAACGCCTCTAAGTCAGAATCAGGGCTAAAAGCAACGCATGCGCCCGCCGCCCGATTGCCGACCCTCAGTAGGAGCTTCGGCTCCCAAAGGCACGTGTCGTTGGCTAAGTCCGTTCGGCGAAAGCGCTGTTCGGACAGCCTTGAATTATAATTACCACCGAGCGGCGGGTAGAATCCTTTGCAGATGACTTAAATACGCGACAGGGTATTGTAAGTGGCAGAGTGGCCTTGCTGTCACGATCCACTGAGATTCAGCCCTTTGTCACTAAGATTCGA
>MJHW01000006.1/498708-498411 Roseburia sp. 831b contig000006, whole genome shotgun sequence. 
GTAAACACGAGGAAAAAGAGAGTACATCCCTTAGAACTTTACAGAGAAGTTTTTGAATGAGATGCATCCGCATACATTCGCTGAGAGAAAACGGGCAAAGAGAGATGGAAGATGGCTTTGGAGTGGCAGAGCTGAACGAAAAGCACTACATTTACAAACGTAGTTGAATTTCGATAAGTTTTGACAGGACCGCCTGTTATAGCGGTAGAACGTAACAACAAATGTTGCGTCAATGAGGCTTTCTCTGCAAAGAGAAGGTAAAGAGAAGTGGTACCACGGGTAGCAGCTCGTCTTCTGG
>JH835659.1/1480072-1479972 Erinaceus europaeus unplaced genomic scaffold scaffold00371, whole genome shotgun sequence 
AAAAAGCATTATCCAGCTTCCTTCCTACTCTGTCTCCAATATCTTTTTTGAACAAAAAAGATATTGGAGACAGAGTAGGAAGGAAGCTGGATAATGCCCAT
>MHBM01000110.1/8313-8490 Lentisphaerae bacterium RIFOXYA12_FULL_48_11 rifixya3_full_scaffold_2456, whole genome shotgun sequence. 
AATACCCTGCCTTGTTCGCAAACAGGCTGACGTCTCTGGCCCATTAATTGTAAGTTAGGGAGTTTGAATACGGCGGCAACTGAACGCCCTTTACTGGGACTCAGGAACCGACGGATAAAGCACCCACCTCGATTTCGAGGATCAGAGATAAATGCCTCTACGACAAAGTGGGGTATTT
>CM000379.2/41198104-41197644 Equus caballus chromosome 3, whole genome shotgun sequence. 
AACAAAAATGTCACGTTTAGTTACTTAATTTGACTCAACACAGGAGACCTCGCTTGGCCTGGCATGGACAAGACTGACAGGTTGATAGCTCTTTCTCTGTTCCATAGGTGGTAGAGTGTGGCCATTCTTAGTTGGTAGAGCCATTTGTCGGGCTAGTTCTGATAACAAACAAGACTCAGGCATGCTAACTAGTTATGGAACCTCCAAGCAGTGGTATCCTCCAACTTCTCAGAGGGACAAGTGCTGTTCAGCCACCCAAGGTTTAAGCAAATAACAGGTCTGGGCTGCCCTTAGATGTCCCGGTTTGCAGGCACTACACTAACTGGCTGAGTGTGGCCTATCCTGAGAATGCAGCTTCAGGTAACCCTTTGAACCCCATTCATGATGGGAATCTGGGATTACAATTATTCCCAAAGAACACAGAATTTCCATTAAGGGCCATAAGCTTGTGTTGATTGGTT
>CM000028.3/22112491-22112645 Canis lupus familiaris chromosome 28, whole genome shotgun sequence. 
AGCTTTGTGCAGTGGCAGTATCGTAGCCAATGAGGTTTATCCGAGGCGCGATTATTGCTAATTGAAAAGTGAGTGCTGGCCAGGAGAACAGGTGCATGCAGATGCTCAGCAAACTTTCATTGAGCACCTATTGTGCATCACCTTCTGTTTTAGGT
>JH594435.1/493167-492948 Eubacterium infirmum F0142 genomic scaffold supercont1.1, whole genome shotgun sequence. 
GAATAATAATATCATATTAATCCAGAGGAACGCATATTAGAGAGAACAGGCGCGGAACCCTGTATCGAGTGCCCTTCTTTGCAGATTCATATCAGCAGAGAAACTGTATTGTGGAGTTTTACTTATATGCCATTGGAACGAGGGACAAATTCTTCTTCCGAGAAGGCAAGTAAGACGGTGAAGCATAGCCAGGAGACTTATTAATGAGATATACACCTGA
>LL810796.1/383-1371 Gongylonema pulchrum genome assembly, scaffold: GPUH_scaffold0038229 
CTGTCGCATTTACGATGAAGTTATTGCACGGTAATAAAGAAATTACGCAGCAAATTACCGTAATTACAGTTAAGTGTCATAAAACCAATATAATGAACTATCCCAGTTACTATAATGATTTGCGTGTAATTTGAATTACTGTAATATTTGGTACCGTAGCATATGTTATTACTGGAATATATTACTGTAACGTAGGGCTACTGTAGTATGTATTAGTTTTTGGCATTCGATTACCGTTTGCCTCAGATCGCAGCCTAGAGTGGGTGGTAAACCTCATCTAAGGCTAAATACGGCCACGAGACAGATAGCAAACAAGTACCGTGAGGGAAAGAACTTTGAAGAAAGAGTTCAAAAAGGCGTGAAACTTTTTTTGCAGTAATGATAGTTTTCAGCAATTTTTCTTAGTTATAATTGAAAAAACAATTGAAATTTCGGCGTTCTCTTCAGGAGTAACTTAGCATTACTACATGTCTGCGATTTGTTACGATGCTCATCCACGACGGTACAGTGGTCTGATCACATCCCACTACTCCTACATATTGCTGTCCTGGGGCTGGATTCATTGCNNNNNNNNNNNNNNNNNNNNTTAGCGTTACTACATGTCTGCGATTTGTTACGATGCTCATCCACGGCGGTACAGTGGTCTGATCACATCCCACTACTCCTACATATTGCTGTCCTGGGGCTGGATTCATTGCGACCCACGATTTGCCGGCACGCTCGGCAGCTTCTCATCAATATTGTTCTTCTTCAAGCCGGTGAAGCAGTAGCCGCCTCACAGCTTTCCAATATTTTATTGAGCAATCAGGTTTGTCTTCGAGTTTTTTATGTTCGAGGTTTTTTCTAAGATCAGATTTTTGAGGTTTTTTTTTTTTTAAAAAACAGTACCTGCGATTTCTAATTTGCGCTTCCCGCGATCCTGGTTTTTTTTTCCAGTTAAAAAGTACCTTTTCACCCATTTCGGCCCTTTTTGGACCGGCCGTTTTTGG
>ALYE01010731.1/119708-119256 Gossypium raimondii Chr08_contig_1147, whole genome shotgun sequence. 
GTCCTTATACACTGGCAACAATGTCAATGCCAATCGAGTTAATACTCAATCAGCAAAATAGCACAAAATTTCATTAATTTATTTTATGAATAGTTTAGGAACGTGGATACAAGTGGTGCATGGCTATCGTCAGCTCGTGCTGGAAGGTGTTCGGTTAAGTCCCGCAATGAGTGCAACCTTCGTGTTTAGTTGCCACCGTTGAGTTTGGAACCCTGAGTAGATTGCCGATGATAAATTGGAGGAAGGTGAGGATCAAGTCAAGTCATCATACCCCTTATGCCCTGGGTGATACACTTGCTACAATGGACAAGTCAAAGGGTCACGACCCTGCAAGAGTGGGCTAACTCCAAAAACTTACCCTCAATTCGGATTGCAAGCTACAACTCGCCTACATGAAGCTGAAATTGTTAATAATCGCCGATCAACCATACGACGGTGAATTCGTTCCTGGGC
>JOOK01005830.1/289-4 Oesophagostomum dentatum strain OD-Hann O_dentatum-1.0_Cont11200.2, whole genome shotgun sequence. 
AAAGCGGATACAGGCGCAAAAGAATAATAGAATAATAGATACATAGCAGGAGATAACTGCGGCAATTCCGGAGCTAATATATGTGAATAAACCCTGATTTTCGAAAGGGTGCAATTATGAGAGCAAAACAATCATCTTCGGATGTAGTTTGCTGACTCTAAATAACGCTGCATATCGTCGGCTTGTCCAACGATATTCCGAAAAAGTGTCTGCCCTATCAATCTGATGGTAGTCTACCAGTCTACTATAGTTATTACGGGTAACCGAGAATAAGGGCTCGGTTCCA
>KB016774.1/3281454-3281537 Camelus ferus unplaced genomic scaffold scaffold490, whole genome shotgun sequence. 
TGGAGTGGGGGGGCAGGAGGGGCTCAGGGAGAAAGTGTGTGCAGCCCCTGGCCCTCTCTGCCCTTCCGTCCCCCGTTCCTAGAC
>CP013118.1/3064815-3064903 Salinivirga cyanobacteriivorans strain L21-Spi-D4 chromosome, complete genome. 
TGAGAACCGTAGCGAAGCGGAGCTCATGACCGTAGAGAATAACTCAGCCGAAGCCATAGTATCCCGATACTTCTAATTAGGAGAAGGGC
>FXAH01000012.1/80855-80720 Paraburkholderia caryophylli strain Ballard 720 genome assembly, contig: Ga0139045_112 
ATGAGTTCCCGTTTATTCCGTTTCCGCTGCAGTTGCGCCTTTCGACCGAACACGCCTTTCTTTCGTTCGCCGGGCGCAGCGCTTCGCTCGAAGCCGAGCCGCCAGCTCCGATGCACGAGGAGCGGCGGCTTTTTTA
>LZPO01018772.1/1933-2618 Neotoma lepida isolate 417 scaffold_18136, whole genome shotgun sequence. 
CTATGACCCTGAGATTAAGAGTCTCATGCTCTACAGACTGAACTAGCCAAGACTGTGGCAGCCAAACATTCATAGTGACATAACTTTTTGATCCTTAAATGTTGGCTCTTCTTATGATTGTGAGGCTGAATTTACCAGGCAGTGGATTGTTCATCCACTAATAAGAATGTGAGCTGAGTTTAGATTGTCATGAGACAGATTAGTTTTTCCCTACTGATGATGATGTATTGTTGCCATCATAATACTGCTCAGTACAAGAGGAACCACAGGCTCAGACATTTGGTGTATGTGCTTGGCTGAGGAGCCAATAGTGTGAAGCTACCATCTGTGGGATTATGACTGAATGCCTGTAAGTCAGAATTCTGGCAGAACAATATGGCAGTGCCAAAGGAGCCTCGGTTGGCCCCAGATAGCCAGATCCCCTTCCAGCTCCATTGGCAGTCTGTCCTGTTCTCGCACATGGCGGGTCCCCACAGTGTGTTGGGACCAGAGTCTGGTATGGACAGCCATTCATACAGAGAAACAGGGTATGGCTGAAAAGGGTGCTGCCCTCTCACCCATCACATTGAACACACATTTGTGTGGAACCTGGTGCTAAACCATCCATAGATGACCTATTTCAATGGTTATAAGTTGTAATAGGGTTGTTGGTGGAACAATGAAGTCTAGACTCAGGATCCTCTTTT
>HF986408.1/139458-139379 Blautia hydrogenotrophica CAG:147 genomic scaffold, scf339 
ACAGGTATGAGCACGCAGGCATATGCGCCGGAGTGCGAATGCCTGTCGGGATTGCGGGAGTGCGATGCACGGGGCAATCC
>LBYD01000004.1/63542-63156 Parcubacteria (Moranbacteria) bacterium GW2011_GWC2_40_12 UT79_C0004, whole genome shotgun sequence. 
GGGGATGCTAGGCATCGACAATTTGTTCTCTCAAAATACGCAAGCCGAGCATGACATTAGACTCGTAAAACCTTGTGTCAACGATCATAAGTGCAAACTTATTTTCAAAGGTTAAGCAAGCTTTTCAGCCTGCTTACGCCGTTGTTCCTGCCTAATTCGCGGGGACCATCAGCCTGCTGATGCCTAATAAGCAACCGCTGGTGTCATACATTGGGCTTGATTGATAGTTTTTCTCTGCGGCTATCTCTGACCATTGAGCAAAGAGGACTTTTCAAGGTTTTGTTTACTTTATACTTGAAAAGTTTCTCAAAACAAGTAAACTAAGCTTGTAGAATATTTTGGAAGATATAAATTTGGACATGGGTTCGAGTCCCATCATCTCCACCA
>CP013023.1/5009948-5010143 Paenibacillus bovis strain BD3526, complete genome. 
CGATGAGGTAGAGGTCGCAGCATGAATCAGTACAACCGGAGCAGGCGTAGAGCCGCCGCGAATCCCGGTTGAAAAGGTCCTGCTGCCGAAGTGCAGATTCCGCTCTGGGAATCCTGTGCTGGGGCTGTACCCGAAAGGGACAGAACTGTCACAATGAAAAAATCCAAGCATTTCATTGTGTTGAGCTATCTTAAAG
>AFEY01018855.1/2775-2892 Sarcophilus harrisii ctg7180001412063, whole genome shotgun sequence. 
GGATGTGAGGGCTATCTGGCTGCGATATCTGTCACCCCATTGATCGCCAGGATTGATTCGGCTGATCTGGCTGGCTAGGCGGGTGTCCCCTTCCTCCCTCACCGCTCCATGTGCGTCC
>CM000246.2/64301032-64300896 Rattus norvegicus chromosome 16, whole genome shotgun sequence. 
TATACAAGCAGCTACTCTCTCCCTCTGGAAAGTCCAGTCAAGATTTCAGGGCCATTGCAGGAGAGTGTAGGGCAGTCAGGCGTCTAGAACTGTAGGTCCATCCAAAGGAGGTGCTTCATGGTGGTCAGCCCTTGTTT
>LPNL01000017.1/7001-6356 Hanseniaspora opuntiae strain AWRI3578 Hanseniaspora_opuntiae_AWRI3578_scaffold228, whole genome shotgun sequence. 
TGCCAGAAGATTCGGTTAGACGATAAAAGCAAAGTTTAATTCAGAGTTTAAAACAGCTGTAGGCAATAAATTATACTTGAATGAATATTAAATAAGAGGTAAAATTCTAAGACTTTAATTAGCATTCCAAATAGTATAATGCTGAGAGCTAAAGCCATTACTTAAGGACTAGGATTAGAGACCCTACTACTGATGGTACTATCTATGATAATTATAGTAAACGAAAGTCAAGAATTATCTACTCGAAGATTAAGCCTTAACGGGTGAAAATCAAAGTTGAAGAGCGTTATATCATCAATTGAGTGGATCGTGCTGTTTAATTTGACAACCCCCAATAAACCTTACCTAATCTTGTATAATACAGGTGTTACATTATCGTCTTTAGGCATTATTGTGAAATTATTGCTGCAGGAGCTATTACTTATGGCCCCGTGACTGATCTACATGACTCTAACGATTAGGGCTACAGGCGCGATATCAAGAATTGAATTATGAAACTCTAATTCATGAATAAATAATCAGAAGTAATATGGTGTTAGAATTACCATATGAATATCAAAGATATAAGCTACTAATTGCCCATCAATCTCCTAGTGAGATAAGTTGACACAAAGTTACGCTAGATGAATTTGGCGTGGGAAATTAA
>LMAW01002579.1/3015099-3014999 Amazona aestiva scaffold_41, whole genome shotgun sequence. 
TGCTATGATGATGTAATTTGCATCTTATCCAGTGCTCAGCGACAGTTGCCTGCTGTCAGCATGCTGGCACTGCTGAGCTGAAGACCCCTTCGTTCTGAGCA
>GL010075.1/7513268-7513324 Loxodonta africana unplaced genomic scaffold scaffold_48, whole genome shotgun sequence. 
GATTCAGGGGTAGAATTCTCACCTTCCAAGTGAGAGAGGTTTGGGTTCAATTCCCAG
>APLE01005677.1/5643-4894 Erythranthe guttata cultivar DUN x IM62 scaffold_74_contig_8, whole genome shotgun sequence. 
CAACGGTTGACCAAGCCGCCTTGAAGAACAGTGCTGTGTAGCCGTCTGGCCCCGGTGCTTTAGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGGCGAGAGGTACTCCATGCATATAACGAAAAGATAAGGGGATAGCAATTATTTGGGGGTCGACCGGTTTGCACGTTGACTGAGAGCTCAGAAAATTCCGGTAAAAGGACTCGAATTCTTCAAGTACCTCATCCCTTGAGGTAGTAACCGATTCCGTTAACGAACGAGACCTCAGCCTGCTAACTAGCTATGCGGAGGTATCCCTTCGTGGCCAGCTTCTTAGAGGGACTACGGCCTTTTAGGCCGCGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGATGTATTCAACGAGTTTATAGCCTTGGCCGACAGGTCCGGGTAATCTTTGAAATTTCATCGTGATGGGGATAGATCATTGCAATTGTTGGTCTTCAACGAGGAATTCCTAGTAAGCGCGAGTCATCAGCTCGCGTTGACTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTCCTACCGATTGAATGGTCCGGTGAAGTGTTTGGATCGAGGCGACGTGGGCGGTTCGCTGCCCGCGACGTCGCGAGAAGTCCACTGAACCTTATCATTTAGAGGAAGGAGAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTG
>APMT01208959.1/14589-14458 Mesocricetus auratus contig208959, whole genome shotgun sequence. 
TCAAACCAAAATAAGGTCATAAGGTGTTCTTCCTAGGGACCTAATATGCTGTGGCTATAAACATCAGCAACCCTGGGGGTGTATTCAACCTCTTGCTTAAATGGGTTTCCCTAAGCAAACTTGAAGACAATT
>ALWT01321998.1/3958-4053 Myotis davidii contig321998, whole genome shotgun sequence. 
TGAAGGTGATGCTGCTATAACATCTATCACCCCATTGATCACCAGGGTTGATTCTGCTGACCTGGCTGGCTAGGTGTGTGTCCCTCTCCTCCCTTA
>AZNC01047644.1/7457-7628 Glycine soja cultivar W05 scaffold3943_7, whole genome shotgun sequence. 
TTGCACTATGTAGTATCGTAGGTCTCTCTGATTATGTGGAGCGGCCTTTGAGCAATGGTGCATAAAGTGAGAGCTGATTAGTCAGCAGGCAGCCAGACAACTGCCGAGGTGGATCCACAGATGAACGGCTCATTTGTTAATGCTGTTTGTCTACTAATTCCACCTTACATTT
>AWGT02000388.1/78840-78931 Colinus virginianus strain Texas jcf7180006226242, whole genome shotgun sequence. 
AAGCACAGCGATCACGACTGAACGCATCAATCTTTCGCCTTTTACTAAAGACTGCAGTGTCGTTTCAGCAAATAATGCGCCTCATACATCAA
>CP002637.1/13277-13481 Selenomonas sputigena ATCC 35185, complete genome. 
CTATGCTACAATCAAAGAACGCAATGGGCGTTTTCTATGTTGCTCTTTTGAGAAGCCTTTTCCAGTTCGGAGCGCGGCGCCTTGGTCTTGCGCAATGGAGTCTCGTGAACCCCGTCAGGTCCGGAAGGAAGCAGCGGTAAGCGAACCGCTTCATGTGCCGCGAGGGCGCCTGGGGGTCGCGCCCCGAAGTGGAAAAGGAGTATTT
>CM000232.2/104162388-104162527 Rattus norvegicus chromosome 2, whole genome shotgun sequence. 
ACATGGTTCAAACTTATAAATAAAGACTTATCTCATCCTGTGGGCCTCTCATAGTGTCCCGTGCTAGAGCAAACTGGCTCCTAACCATTGCCCAGCCTCGGTGCATGTAGGCTGCTGGCACTGAAGTGGGTCACACAGTG
>HE612865.1/664054-663926 Tetrapisispora phaffii CBS 4417 chromosome 10, complete genome 
TATTGTGATGACAAGTTGTCGCCCCAGGCGGATCTATTCAGTGTATATTATTTCTATTTAAGTATAAAATAATGTGCAGTCGGAAATGACAGAAATATAACAACAAGCCAAACACTGAAAATTCTGATA
>MEPB01000070.1/175699-175987 Bacteroidetes bacterium RIFCSPLOWO2_12_FULL_35_15 rifcsplowo2_12_scaffold_36, whole genome shotgun sequence. 
TACATTTGTCAACTTTTTGGTTCCTGAGTTTGATAAAATATCAAACCGGATTAAATGGGAATCAGGTGAAAATCCTGGACATTTCCCGATGCTGTAAGTTCTTATTAGTTTAAAGTTTATTTTTTAATTTTCTGGTTGTTAGACCTGAAAAACAAAAAACAAAACAAAATTCTAATATTTTTTTTAACATTCTTAGCCACTGTCTTGAATCGAATAAAGATTCTTTAAAGATGGGAAGGCGTTAAAAACAGAACAAGTCAGAAGACCTGCCAAAGAAATTAACATTTGT
>AAGB01000009.1/14123-14306 Wolbachia endosymbiont of Drosophila ananassae gdan_434, whole genome shotgun sequence. 
ACTGATTCCTTTATGATGGTGTCATCCCAGTGCCCAGACACTGGGATCCAGGAAACTTAATTGCAAGTAATGCATTGGATTTGGTGAGTATGGGTTTTGCGTTATAGAATGAAGCACTTTTGGTGAATTTATAAAGAAAGCTGGATCCCAGTGTCAAGCACTGGGATGACAAGGTATAAACCTT
>NATD01000006.1/25331-26764 Candidatus Parcubacteria bacterium 4484_255 ex4484_255_scaffold_717, whole genome shotgun sequence. 
TAGAGAATTAATTAGAGCATATGGTGGATGCCTAGACACCAAAAGCCGATGAAGGACGTAGCAGCCTGCGATAAGCCTCGGGGAGGCGGCAAGCAACCTTTGATCCGAGGATTTCCGAATGGGGAAACCTAGCGTTACAAAACAGCGCTGCACACCGTTTCACAGTGAATTCAAAAATCAAAAATCAAAGTGCAAAAATAATAAGAAAATTTACAAGAAACAAGATGCAATAACCAAACAATAGTCAATAAATCAATGACCGAATAATCAAACGGTTTGATTATTGAATATTGGAATTTGGAATTTGTTTGTATTTTGTATCTTGGTTATTGGTTGTTTCAAATAATTTTGATTTTTACATTTTACATTTTGAATTTACCGCGAAGCGGTGTGGGGGTACCCGGGGAAGTGAAACATCTCAGTACCCGGAGGAAAAGAGAGAAACCACCGCGCCTCACTATCGTTCGGCACGAATGTCTAATATCTAATGTCTAATTTCTAATAAATGTTTAATGTCAAAATGTCCAATGTCTAATTATTTTAGTCACTTGGTTATTAAGTCATTGGGATTTTATTAGTCATTAGGAATTAGGATTTAGAAATTCCTGTGACGAGCGGTAGCGAGGCACGGTGATATTTCCTTAGTAGTGGCGAGCGAAAGGGAAACAGTCTAAACTCTATAGAATCTTAGTTTTATAAGAGTCTTATCTTCGGATATTTCTTTTATTTAATGAAAGGTAGTAAAGCCAAAATATTCTATAAAGTGTTGTGGGGTAACTAATGTTTTGTTTTTTACTGAACAGAGTTAGGATTTAAATTTTTAGTCCAATAGCATGGAATTGCTAACCATAGAGGGTGAAAGTCCTGTAGATTAAAAAAATTTAAATTTTAATAATTAGTTATGCCCGAGTAATGCCAAACTCGTGAAATTTGGTATGAATCAAGGCGGACTATCGCCTAAGACTAAATACTTTTGGTGATCGATAGTGAACTAGTACCGTGAGGGAAAGGTGAAAAGTAGCCCGGTTAGGGCAATGAAAAGTACCTGAAACCATATGCTAACAAAGAGTCAGAGCCTTGTGCTTCGCACAAGGAAATTCAAAGCACGAAGCACGAAATCCCAAACAATATCAAAATCCTAATGTTTTAAATTCAAAACAAATTCGAGAAATTTCTGTTTTGGTCATTTGGATTTAGAATTTAAGATTTGTTTAGGGTTTCGTATTTAGAATTTTGGATTTTCTCGCGCGGAGCGCGAGGTAGGGTGAGTCTGTCTTAATTGACAGAGGAGGCCCGAACCCGTTGACCGTACAACATCATGGGATGAGCCGTGGATAGGGGTAAAAAGCCAATCGAACTCAGTGATAGCTGGTTCTCCCCGAAATAGCTTTAGGGCTAGCCCGTTCTTTACTCTCTGGGGGTAGAGCTACTGGA
>CM000129.1/18755739-18758932 Oryza sativa (indica cultivar-group) chromosome 4, whole genome shotgun sequence. 
AAAGAAATCGTTAAGGGCGTATGGCGGATGCCTAGGCTTTCAGAGGCGACGAAGGACGTGGTAAGCTGCGAAAAGCTGCGGGGATTGGCACACACGAATTGATCCGCAGATATCCGAATGGGGCAACCCGGCATATTGAAGATATGTCACCTCGCAAGAGGAGCAAACCCGGAGAACTGAAACATCTAAGTACCCGGAGGAAAAGAAATCGAAGAGATTCCGTAAGTAGTGGCGAGCGAAAGCGGATTAGCCCAAAAGTCTTTTTATGTTTAGAGGAATGTTCTGGAAAGAACAATCATAGAAGGTGATAATCCTGTACTCGAAAGGCATATAGAGATGATAAATGAGTAGGGCGGGACACGTGAAATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTCCTGAAAGACCGATAGTGAACAAGTACTGTGAAGGAAAGGTGAAAAGCACTTCGAATAGAAGGGTGAAATAGAACCTGAAACCGTACGCCTACAAGCGGTCGGAGCAGCGTAATGCTGTGACGGCGTGCCTTTTGCATAATGAGCCTACGAGTTAATTTTACTAGCGAGGTTAAGGTATTAAGTACCGGAGCCGGAGCGAAAGCGAGTCTGAATAGGGCGCATAGTTAGTAGGATTAGACGCGAAACCTTGTGATCTACCCATGGGCAGGTTGAAGCTCTGGTAACACAGAGTGGAGGACCGAACCGGTTGACGTTGAAAAGTCTTCGGATGACCTGTGGGTAGGGGTGAAAGGCCAATCAAACTGGGAGATAGCTCGTACTCTCCGAAATGCATTTAGGTGCAGCGTCGTATATAAGTTTATTAGAGGTAGAGCTACTGATTGGATGCGGGGGTTTCATCGCCTACCATTCCTGACAACTCCGAATGCTAATAAATGTTCTACGGCAGTGAGGGCATGGGTGCTAAGGTCCATGTCCGAGAGGGAAAGAACCCAGACCCACAGCTACAGGTCCCCAATATATGTTAAGTTGAAGCAACGCGGTTGGACTGCATTGACAGCTAGGATGTTGGCTTGGAAGCAGCCATTCATTTAAAGAGTGCGTAACAGCTCACTAGTCGAGCGGTCCGGCATGGATAATAATCGGGCATAAACATATTACCGAAGCTATGGATTTATATTTTAGATATATCTGGTAGGAGAGCATTCTATTTGCGCCGAAGCAGTACTGTGAGGTATTGTGGAGCGGATAGAAAAGAAAATGTAGGCATAAGTAACGATAAAGCAGGCGAGAAACCTGCTCACCGAAAGACCAAGGCTTCCTCAGCCATGCTAATCAGCTGAGGGTTAGTCGGGACCTAACGCGAACCCGAAAGGGGTAGTGGATGGACATGGGTTAATATTCCCATACTTGCTCACAATAAAAGGGGACGGTTGGATGTAGCTGCTGGAGACTGACGGAATAGTCAAGGCCTAGCCTTCGGGCGAAGCTGCTGTAGTGTAATCTGATCCGAGAAAAGCCGAAGTGAAGCNACCCGTACCAAAACCGACCCAGGTGGTCGAGGAGAGAATCCTAAGGTGCTCGAGTGAGTCGTGGCTAAGGAACTAGGCAAAATAGTCTCGTAACTTCGGAAGAAGAGACGCCACAGCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATGTAGGCATAAGTAACGATAAAGCAGGCGAGAAACCTGCTCACCGAAAGACCAAGGCTTCCTCAGCCATGCTAATCAGCTGAGGGTTAGTCGGGACCTAACGCGAACCCGAAAGGGGTAGTGGATGGACAATGGGTTAATATTCCCATACTTGCTCACAATAAAAGGGGACGGTTGGATGTAGCTGCTGGAGACTGACGGAATAGTCAAGGCCTAGCCTTCGGGCGAAGCTGCTGTAGTGTAATCTGATCCAAGAAAAGCCGAAGTGAAGCAACCCGTACCAAAACCGACACAGGTGGTCGAGGAGAGAATCCTAAGGTGCTCGAGTGAGTCGTGGCTAAGGAACTAGGCAAAATAGTCTCGTAACTTCGGAAGAAGAGACGCCAACAGCAATGTTGGCCGCAGTGAAGAGGCCCAGGCGACTGTTTATCAAAAACACAGGACTCTGCTAAATCGAAAGATGCTGTATAGGGTCTGACACCTGCCCGGTGCTGGAAGGTTAAGGAAGGTGCTTAGCGTAAGCGAAGGCATTAACTGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGTGTAACGATCTGGGCACTGTCTCAGCCACGAGCTCGGTGAAATTGTAGTATCGGTGAAGATGCCGATTACCCGCAATGGGACGAAAAGACCCTGTGAACCTTTACTATAACTTCGTATTGACTTTGAGTAAGTAATGTGTAGGATAGGTGGGAGGCTTTGAAGCAGGCACGCTAGTGTTTGTGGAGCCGACGTTGAAATACCACCCTTTACTTACTTGGAGCCTAACTTCTTTCAGAAGGACATTGCGTGGTGGGTAGTTTGACTGGGGTGGTCGCCTCCAAAAGAGTAACGGAGGCTTTCAAAGGTACCCTCAGCACGCTTGGTAACCGTGCGTAGAGTGTAATGGCATAAGGGTGCTTGACTGTGAGACCTACAAGTCGATCAGGTGCGAAAGCAGGACATAGTGATCCGGTGGTTCCGTATGGAAGGGCCATCGCTCATAGGATAAAAGGTACTCCGGGGATAACAGGCTAGTCTCCCCCAAGAGCTCACATCGACGGGGAGGTTCGGCACCTCGATGTCGGCTCGTCACATCCTGGGGCTGGAGAAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGTGGCACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCTCTATCTATTGCGGGCGTTAGATGTTTGAGAGGGCTTGATTCTAGTACGAGAGGACCGAATTGAACAAACCTCTGGTGTATCAGTTGTACCGCCAGGTGCACCGCTGAGTAGCTACGTTTGGAAGAGATAAGCACTGAAAGCATATAAGTGCGAAACTCGCCTCAAGATGAGACATCTTTTAAGGGTCGTTGTAGATGACGACGTTGATAGGCTATAGGTGTAAAGACAGTAATGTCATAGCCAAGTAGTACTAATTACCCGTAGATTTATAGTC
>CYGY02000008.1/113318-113432 Burkholderia sp. STM 7183 genome assembly, contig: CYGY01000008 
TCACCCCTGCGTGACTGGCGATAGAACCCGAAGCTGTCAAGCCTGACGGGTTCAAGGTGGAGCATCCCACCGTGAAGCGCAGGGTGCCGTTTTGCCGTTCGCCTGGGCAGCCATG
>ALWZ044793892.1/3195-2923 Picea glauca, whole genome shotgun sequence. 
GTCTGTGATGCCCTTAGATGTTCTGGGCCACACGCGCGCTACACTGATGCAGTCAACGAGTTTTTCTCCCTGGTTCGAGAGGATCGGGAAATCTTCTCAAATTGCATCATGATGGGGATAGACCATTGCAATTATTGGTCTTCAACGAGGAATTCCTAGTAAGCGCGTGTCATCAGCTCGTGTTGACTACGTCCCTGCCCTTTGTACACACTGCCCATGGGTGTGTGTTTTTTGGTCCGGTGGGAGTGCTTTGTTGAAACCTGGAGCTCAAGT
>CM000335.3/6839130-6839055 Pan troglodytes isolate Yerkes chimp pedigree #C0471 (Clint) chromosome 22, whole genome shotgun sequence. 
TGTCCTCTGGGGACTCAGCTTGCTCTGGCTGCTGGATTGAATTAGCTGCAGGACCAAGATGAGCCCTTGGTGGAGA
>AAQR03125679.1/12691-13758 Otolemur garnettii contig125679, whole genome shotgun sequence. 
GGGGAGTATGGTTGCAAACTGAAACTTAAAGAAATTGACAGAAGGGAACACCAGGGTGAAAACTATGGCTTAATGTGACCCGACTTGAGAAACCTCACCCAGCCTGAACACAGACCGCTTGGCAGACTGACAGCTCTTTCTTTCTTTCCTTTTTTGTTTTTCTTTTTTTCCTGAGACAGAGTCTCACTCTGTTGCTGCTCTGTAGAGTGCTGTGCTGTCACAGCTCATAGCAACCTCAAACTCTTGGGCTCAAGCATTTATTTCTCTTGCCTCAGCCTCCCAAGTAGCTGGGACTACAGGTGCCTGCAACAACCCCTGGCTTTTTTTTTTTTTTTTTTTTTTTCTAGTTGTCATTGTGGTTTTAGCAGGCCTCGGGCTGGAACCCACCAACTCCAGTGTATGTGGCTGGCGCTGTAACCACTGAGCTACGGGCACCATCTGATAGCTCTTTCTTGATTCCTTGGGTGGTGGTATGTGGCTGATCTTAGCTGAGGGAGCAATTTGGTTAATTCTGATAACAAACTCTGAGATTCTGGCATTCTAATTAGTTAGGCAACCCCAAGCGACCCACTGTCTCAACTTCTTTTTTTTTTTTGAGACAGAGCCTCAAGCTGTCCCCCTGGGTAGAGTGCTGTGGCATTACAGCTCACAGCAACCTCCAACTCCTGGGCTCAAGCGAGTCTCCTGCCTCCGCCTCCCAAGTAGCTGGAACCACAGGCGCCCGCCACAACGCCTGGCTATTTTTTGGTTGCAGCCGTCATTGTTGTTTGGCGGGTCTGGGCTGGGGATTCGAACCCGCCACCTTAGGTGTACGTGGCTGGCGCCTTAGCCGGTTGAGCTATAAGCGCCGAGCCACTGTCTCAACTTCTTAGAGGGCAAGTGGCATCCAGCCACCAGAGATTGATGCCCTTATATTGTCCAAGGCTGTAGACGCACTGTGCCTACCCTGTCATGGATAACTTGCTGAGCCCCATTTGTGAGGGAGATCAGGGATTGCAATTACCAGCATGAACAAGGAATTCCCAGTAAGTGCGAGCCATAAACTTGTGTTTATTAAGTCCCTTTAAA
>MKQR01000007.1/110347-110112 Actinokineospora bangkokensis strain 44EHW Scaffold15, whole genome shotgun sequence. 
ACACGAGAGAGGAGGTGGTCCACCAGTGAGTTCCGGTAGGACGCGTGAGGTGGCTGTCCGCTAAGGACCACCCATCAACGATGGACGCCGGCTCCGCCCACGGCAGACACCGGGTACCCGGTGCCGTAGGCGCGGCGCGTGGTCGGCGAATACCAGGCAGTCACCCGGCCCCTGGGCTTCCGTGGTAGTCCGCCACGGGCCTCCCTCGCGGAGGAGTCGCCCAGGGGCTGTGCCCT
>CM000916.2/23724354-23724270 Nasonia vitripennis chromosome 2, whole genome shotgun sequence. 
AACGTGTCAAAGTCTGGTAACTCCACCACCGTTGGCGGAATGTTAAAAAGCCAATGGGGTACGAGTTTCCTACCATTGACGCGTT
>JH209564.1/9089797-9089999 Pelodiscus sinensis unplaced genomic scaffold scaffold80, whole genome shotgun sequence. 
AGCTTTGCGCAGTGGCAGTATCGTAGCCAATGAGGTTAATCCGAGGCGCGATTATTGCTAATTGAAAACTTTTCCCATTCCTTTCCCTTCTCCCTCCGATCCCCCTTTCCTGTCCCTGTTCAGGGACCCTTTCTCATGAGAATCTCTTATGTCTGGAGGTACATCAGCTCATGGTGATAGGAATAATAGAAGTGGTTCCACCA
>DS546278.1/1-991 Physcomitrella patens subsp. patens PHYPAscaffold_3506 genomic scaffold, whole genome shotgun sequence. 
CAAGCATTGCGATGGTCCCCACGGATGTTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGAAAAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTAAGAGGTGTAGAATAAGTGGGAGCCCTCAAAGCGCAAGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCATGAGGTGGAGGCGGGACTCTGTCCCTGCTTCTAGTCTTAAGGCGCGCCCCTCGGGTGCGCCGATCCAGGTGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCATTTGATTTTGATTTTCAGTACGAATACAAACTGTGAAAGCATGGCCTATCGATCCTTTAGTCTTTCGGAATTTGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGNGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGCTCGGTGCCGCAATAGTAATTCAACTTAGTACGAGAGGAACCGTTGATTCACATAATTGGTCATTGCGTTTGGTTGAAAAGCCAGTGACGCGAAGCTACCATGTGTAGGATTATGACTGAANNNNNNNNNNNNNNNNNN
>DS232073.1/119557-119157 Culex pipiens quinquefasciatus supercont3.261 genomic scaffold, whole genome shotgun sequence. 
TATCAACATGACAAGATTATTCAATTCACGGTGGGAATGATCTGCCAAATCAGCGCTAATCAATTAGCTAATTGACAAAAATCAACGCTAGTTGATTAGCGTTACTATAATTGATTAGGTGTGTCTCACCCCTCGATAGAGGACTACCATGGTTGCAACGGGTAACGGGGAATCAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAATGGCTTCCATTTCCAAGGAAGGCAGCAGGCGCGTAAATTACCCAATCCCGGCACGGGGAGGTAGTGGCGAGAAATAACAATATAAGACTCTTTTATGATGTTTTATAATTGGAATGAACCGAGCATAAATCCTTCGGTAAGGATCAAGTAGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCACT
>LZPO01108083.1/67281-67406 Neotoma lepida isolate 417 scaffold_2510, whole genome shotgun sequence. 
AATGGAAATCAACTTGTTGGCTATGGCAGCCTCCCATTACAAGCCATGGAACAGCATATTCCTATTTGTTGGCAAGGCTGTCTCCATTTATTTGGTGTCTGTTTCTTATTTGCCCAAATAACTAAC
>JTHE01000287.1/5907-6033 Lyngbya confervoides BDU141951 scaffold_83, whole genome shotgun sequence. 
GCCTGTCAGGAACGCGGCTACCTCCTCCCAGCCGCCTACTGAAGGTGTTTTGCAAGGGCACCTCCTCCCGCCCTTGCAACTCGTGTTGAGCCGGACCGCTACCTCCTCCCAGCGGTCCGGCTTTTCT
>CM000685.2/62840825-62842378 Homo sapiens chromosome X, GRCh38 reference primary assembly. 
AGGGAACCATGAAAGAATAATTACAAATACAGAAAGGCAAAGATAATCCCTTCTAACATTTGCATAATGAATTAACTAGTATAATATTACTAAGAGAACTTTTTAGCTAAAATCCTTGAGACCAGAGGAGCTACCCATAGAAAGTCAAGAGAACACACTCATTTATACAGCAAAATAATGAGAAAATCAATGGGTAGAGGTAAAAGGCCTACCGAACCTGGTGACAGCTGGTTTTATCAAGATAGAATTTAAGTTTAACTTTAAGTTTACCTATAGAATTGTCTAATCCTATTGTAATTTTATATGTTAGTCTAAAGGGGGACAGCTCTTTAGATGTAGGAAATCACTTTTTCACTAACGGTAAGACACAAAACTCCTTTAGTTTGCCTAAAAGCAGACACCGATTAAGAAATCATTGAAGTTAAACATTTGAAACCCCTTAATTTCAATCACTACATCTAATTTCTAACACTATACTGGACCAATCTATTTTTAAATAGAAGAAATACTGTTAGTATAAGTAACAATAAATAATTGTCTTTGCATAAGCTTAGTCTTTGCGTAAGCTTAATCTTTGCATAAGCTTATGTCAAACTGGAAAATCCACTGAGAGTTAATAATCCAATACAGATAATCATATTATAAACTTTTTATTGTCCCAATTGGTAACCTAACACACAGATGCATTAAGGAAAGATTTTAAAAAGTAAAAGGAACTCAGCAAAATCAAACCCTGCCTGTTTACCAAAAACATCACCTCTGACATAACTAGTATTAGAGGCACTACCTGCCCAGTGACATAAGTTTAACAGCCACAGTATCCTGACCATGCTAAGGTAGCATAATCATTTGTTCCCAAAATGGGAACTTCCATGAATGGCCTCACAAGGGTTTAATTGTCTCTTACGTTTAATCAGTGAAATTGACCTATCTGTGGAGAGGCAGAAATATTTAAGTAAGATAAAAAAAACCTTATGGAGTTTCAATTTATTAGTAGAAATAAACTTATAAAAAAGCCTTAATAGGTCTTTTTGGGAGTAATTATTTTTATTTTTAAATATCTAGTGTACCACCATGGCATGTATTCTTTAAATTTTATACAAACAAGCACATTTTTTCAGTGTTTTGATGTATTTTCATATTTTTCTAACTTAGACGTGTAGGCAATACATTTTATCTAATGAACCAAAAATTTTGGTTGGGGTGACCTCAGAGCATAACACAACCTCTGAAATGATTTCAGCTAGGACCACACTAGTCAAGGTAATCTATTACACATTGACCCAAGTAGTTTGAGCAATGGAACACGTTACCTTAGGGATAGCAGTACAATCCTATTCTAGAATCCGTATCAGCAATAGGGTGTATGACTTCGATATTGGATCAGGATATTCCAATGATGTAACTACAATTAATGGCTCATATGTCCAATGATTAAAGTCCTATGTGATCTGAGTTCAGACCAGAGTAATCCAGGTAAGCTGCTATCTATTCAATATTTCTCTCAGTACAAAAGGACAAGAGAAACAGGGCCCACTTCAAAAAGTGCCCTCG
>DS022294.1/558139-558315 Mariprofundus ferrooxydans PV-1 scf_1099921033919 genomic scaffold, whole genome shotgun sequence. 
GCGCCCCTGCGTTGAGCGAATGGCAATCATGTTGCCTGAGCCGATACTTGTTGAACGGGAGCCAAGCTACGATGGCTGTGTGAATCCCTTTAGGGGATACCTGATGCCAGAGTGCTGCACCCACCTCTTGTTAGAGGGTTCGACAACAGATTGCCGCAACGTCAACGCGGGGGCGCC
>AEUN01000020.1/91-28 Staphylococcus simiae CCM 7213 contig00020, whole genome shotgun sequence. 
CTCAACAAACTTATGATGGGGTGCGCGCTTTTTTATTGTACAAGATAACGGATTTGTAGACATT
>URS0000D66E06_12908/1-81 unclassified sequences freshwater-2 RNA 
CATATAAATCTTTATATGTTCTTATGCGGAACCAAACCGCGTAGGCCTAGAACGCCACTTAATTTAAGGAGAAACAAAATG
>KV442016.1/37818-37189 Mortierella elongata AG-77 unplaced genomic scaffold K457scaffold_6, whole genome shotgun sequence. 
TTGAAAATGGTGCAGGAAGAGTTCTATATAGGTTTAATAGCTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTGATCCTTCGATGTCGGCTCTTCCTATCATACTGAAGCAGAATTCAGTAAGCGTTGGATTGTTCACCCACTAATAGGGAATGTGAGCTGGGTTTAGACCGTCGTGAGGCAGGTTAGTTTTACCCTATTGATGAAATGTTGTTGCAATAGTAATTGAACTTAGTACGAGAGGAACCGTTCATTCGGATAATTGTTACTTGGACCTGCCTGAGCTGGCAATGGCCCGAAGCTATTATCCATTGGGTTATGGCTGAATGCCCCCAAGTCCGAACCCGTGCTAGAACGCGAAGATTACCGTCTTTCGATTTTTTTTTTAGTTGAATATGAATAGACCTTCGGCTCCAAGATCATACTACATGGGGTTATGTTTTAGGGCTGAAGGCATTATGATGTTCCTGCTAAAACTTTATTCACGAATATCCCTTCCTCCGTACTTTAATTCGAGACAATATTGTGTCGAAAAATTTTGTGTGCTGGGCTCATGCACTTCCATATGATAACTTGCAAAAAGGGAAGCTAACTTAGTTCAAGGTCCATTTTTCATCCACAAA
>APMT01213728.1/1364-1077 Mesocricetus auratus contig213728, whole genome shotgun sequence. 
TTTGTTCAACGATTAAAGTCCTACGTGATCTGAGTTCAGACCGGAGTAATCCAGGTCGGTTTCTATCTATTTACAATTTCTCCCAGTACAAAAGGACAAGAGAAATGGGGCCTCCTTAATATAAGCGCCCCTAATTAATTAATGAAACCATCTCAATATAGTAAATCCATACTATATTTACCCTAGACAAGGGTTTATTAGGGTGGCAGAGCCCGGAAATTGCGTAAGACTTAAAACCTTGTCCTCAGAGGTTCAAATCCTCTCCCTAATAGTGCATTTAATTAATAT
>DS028102.1/263782-263910 Coccidioides immitis RMSCC 2394 supercont1.10 genomic scaffold, whole genome shotgun sequence. 
GGGCTGGTGGCGCAGCGGTTAGCGCGTCGGATTGCGTAAGTGGCGAATTAAGACAGATGCATCTCAGCAGCAAGCTAACCCTTTCATATAGAGATCCCAAGGTCCCCGGTTCAAATCCGGGTCAGCCCT
>CP003614.1/5692256-5692124 Oscillatoria nigro-viridis PCC 7112, complete genome. 
AGGAGCCGTGTGCGGAGAAATCCGCAAGCACGGTTCTGAAGACGAGTCGCTCCGGTGACGGGGCGGCTTCGTTTAACAAGCTTACGCTGTAATCTTTGATTCAGCATAGGAGGATGTCACCGTCCGAGTTTAT
>AODI01000030.1/8750-8667 Brochothrix thermosphacta DSM 20171 = FSL F6-1036 c30, whole genome shotgun sequence. 
TAAAGGTATAGAAAAAGACACTAGCGCAAACTAGCGTCCGTGTAGAACCGTTTAAGACGGTGGCTACGCAATTATAATACTAAA
>LBUD01000030.1/9979-10044 Parcubacteria bacterium GW2011_GWA2_38_13 US74_C0030, whole genome shotgun sequence. 
AGGCGTGTAGCTTAATTCAGTGGTTTCCAAAACCAGGGAGTGCGGGTTCAAATCCTGCCACGCCCG
>HF998384.1/8394-8081 Coprococcus eutactus CAG:665 genomic scaffold, scf48 
GAAAATGCAATGAAGAGGAGTAGTAGAATCCTGGAGATGTTCAGAGAACTGCCGGTTGGTGTGAGACAGTGATTGAGAGGATTTGAACTCGCCTTGGAGCAGCCCGCTAAAAGATACGACGTTACACAGTAGCGTTGAGCGTATCGAGTAGGATGGGACGGAGGCTGGCCGTTATAGCAGAAGGATATAAGATATGTAAAAGATATGTATTTGAGTTGTATAAGATCTGCATGTCTGTATCTGTAACGAGAGCATATTTTGTAATTATTATGAAGTATGAAATAGAGTGGTACCGCGTAACTTACGTCTCTATA
>LKEX01010032.1/13186-15658 Cyphomyrmex costatus contig10032, whole genome shotgun sequence. 
CCCGCTGAATTTAAGCATATTATTAAGCGGAGGAAGAGAAACTAACTAGGATTTCCTTAGTAGCGGCGAGCGAACAGGAAAGAGCCCAGCACCGAATCCCGCGGTTCCGCCGCAGGGAAATGTGGTGTTCGGGAGGATCCGTTTATCCCATGGTGTCGCGCCGCGTCCAAGTCCATCTTGAATGGGGCCACTTACCCGCAGAGAGTGCCAGGCCCGTAGCGACCGGTGCGCGTCTCGGGAGGATTCCTCCTTAGAGTCGGGTTGCTTGAGAGTGCATCTCTAAGTGGGTGGTAAACTCCATCTAAGGCTAAATACGACCACGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGTTGAAAAGAACTTTGAAGAGAGAGTTCAAGAGTACGTGAAACCGTTCAAGGGTAAACCTAAGAAACCAAAAGATCGAACGGGGAGATTCATCGTCAGCGACGCTGGCTTCGCGTCGGTGAGCGATGATCCTCGCGGCCCGCAGCGCGGACACGCTGCCGTGCGTCGACGTCCGGCGTACGTCGTCGTGCACTTCTCCCCTAGTAGAACGTCGCGACCCGCTGGGTGTCGGACTACGGCCCGGGTGCGGTGACTGACGCGTCGCCGGTAAAACGGCACGCGTCAAACCCCCGGTCGCCCGGCCGGCTGCCCGGCGGTACACGCACGGTATCAGGCCGCAGACAACGGTCGGGGCGCGGGGCCCCCCACGTCCTCCGTGGCGTGCGGGGGTCTCCACTCCGTCCTGCTTTGCGTCGAGGCCGTCGCAAGCGCGCGCCACGGTACACGGAGGCTTACGGACCTAGCGCCGTCACCGGTCCTGGCCCGCTGTTGGTCGTACGGTTAACCTTCGACCGGTCTACGAACGTTCCTCGCGTTTCCCCCTCGCGGGGCGGGCGCGGGGGACCGATACCGGTCGGCAACGTTACTGCTTTCGGTACTCTTAGGAACCGTCTTGAAACACGGACCAAGGAGTCTAACATGTACGCGAGTCATTGGGACTCTAGCGATACCTAAAGGCGTAATGAAAGTGAAGGTCGGCCCTGGTTGTCGACCGAGGGAGGATGGGCCGCGTCGCGATGCGGCTCCGCACTCCCGGGGCGTCTCGTTCTCATCGCGAGAAGAGGCGCACCCAGAGCGTACACGTTGGGACCCGAAAGATGGTGAACTATGCCTGGTCAGGACGAAGTCAGGGGAAACCCTGATGGAGGTCCGTAGCGATTCTGACGTGCAAATCGATCGTCGGAACTGGGTATAGGGGCGAAAGAATAATCGAATCACCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATACCTGGCACTCGGCCGTTCCGCACGGAACGCGCGCGAGTCTCATCTGGTAAAGCGAATGATTAGAGGCATTGGGCCCGAAACGACCTCAACCTATTCTCAAACTTTAAATGGGTGAGATCTCTGACTTTCTTGAACCGTGAAGTCACGAGTATCACTCGGATCAGAGTGCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGCTGTGGGATGAACCAAACACAGAGTTAAGGCGCCCAACTCGACGCTCATAGGACACCATGAAAGGCGTTGGTTGCTTAAGACAGCAGGACGGTAGCCATGGAAGTCGGAATCCACTAAGGAGTGTGTAACAACTCACCTGCCGAAGCAACTAGCCCTGAAAATGGATGGCGCTGAAGCGTCGAGCCTATACTCTGCCGTCAGCGGCAAGTGGGGCGGCCGTGTGCGCGTCGTCAGACGCGTGCGCGCCGCCACGAAGCCCTGACGAGTAGGAGGGTCGCGGCGGTGTGCGCAGAAGGGTCTGGGCGCGAGCCTGCCTGGAGCCGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATACTCCAGCGAGGCCCTGGAGGACTGACGTGGAGAAGGGTTTCGTGTGAACAGCCGTTGCACACGAGTCAGTCGATCCTAAGCCCTAGGAGAAATCCTATGTCAATGACGGCGTACGATACTCTAGTGTTGTCGTTGTCGCGCTCTCGATCTCCGACTCGCCGCCGCTCCCACGCGCGCGCGCGACGACGGGGAGGGGAGAGCGTGGTGTTTTCTTCTTCAACGAGAAGCGCTCTGACAGGACACACGCCCGTCGGGCGAAAGGGAATCCGGTTCCTATTCCGGAACCCGGCAGCGGAACCGCATACAATTCGGGCCCTCGTAAGAGTGTTCGTCGGGGTAACCCAAAATGACCTGGAGACGCCGTCGGGAGATCCGGGAAGAGTTTTCTTTTCTGTATAAGCGTTCGAGTTCCCTGGAAACCTCTAGCAGGGAGATAGGGTTTGGAACGCGAAGAGCACCGCAGTTGCGGCGGTGTCCGGATCTTCCCCTCGGACCTTGAAAATCCAGGAGAGGGCCACGTGGAGGTGTCGCGCCGGCTCGTACCCATATCCGCAGCAGGTCTCCAAGGTAAAGAGCCTCTAGTC
>ALWZ040927269.1/1-1274 Picea glauca, whole genome shotgun sequence. 
TTCGAATTGGGAGGGCGATCCTCCCGGTGAACTAACCGTACCCCAAACCGACACGGGTGAACAAGTAGAGTATACTAGGGCGCTTGAGAGAACCATGTTGAAGGAACTTGGGAAAATGACCCTGTAACTTTGGGAGAAGGGGTGCTCTCCCTCCTATCTTTGGGTTGGGAAAGTGGCACATACCAGGGGGTAGCGACTGTTTATTAAAAACACAGGACTCTGCCAAATGGTAACACGATGTATAGAGTCTGACACCTACCCGGTGCTGGAAGGTTGGAAGGAGAAGTGTGATAAGCTTCGAATGGAAGCCCCGGTAAACGACGACAGTAACTCTAACTATCCTAAGGTAGCGAAATTCCTTGTCGCATAAGTAGCGACCTGCACGAATGGTGTAACGACTGCCCCACTGTCTCCGACATGGACCCAGTGAAATTGAATTCTCCGTGAAGATGTGAAGTACCAACGGCTAGACGGTAAGACCCCGTGCACCTTGACTATAGCTTCGCAGTGACAACCTCTTATGAATGTGTGGGATAGGTGGGAGGTGGGGAACTCTCAATCCTGGAATACCACTCTTTCATCTAAGGATGCCTAACCATTTCTTTCTCTAGATTTATTCTCAGGGTGGGACACTACAAGGTGGGTAGTTTATCTGGGGCAAATGTCTCCTAAAGAGTAACAAAGGTGTGCGACGGTAGGCACTTTCTATAAGCAAGCATAATGGTCTAAGCCTGCCTGACTGTGAGACTCACTGGTCGAACAGAGACGAAAGTTGGCCATAGTGATCCGGGAGTCCCGCGTGGAAGGGCTCTTACTCAATGGATCAAAGGTATGTCGGGGATAACAGGCTAATGACTCCCAAGAGCTCTTATCGACGGAGTCATTTGGCACGTCGATGTCGACTCATCACATCCTGGGGTTGAAGAAGGTCCCAAGGGTTCGATTGTTCACCGATGAAAGTGGTATGTGAGTTGGGTTTAGAACGTCGTGAGACAGTTCGGTTCCTATCTACCGCTGGTGTTGAAGGGAGAACTGTGAGGAGCCAACCCTAGTATGAGAGGACTGGGTTGGGCCAACCTATGGTGTACCGGTTGTCATGCCTAGCAGCGTTGGGCAACCAAGTTGGTATGGAAGAACTGTTGAAAGCATCTAAGCGGGAAATCCTTTTCTAGACAAGTTCTCGTACGAGGTGAAAGAACATCACTTTGATAGGCGATAGGTGTAAGCACCGCGAGGTGTGAAATGATATCGTACTAATATTTTTACTTAGTCCA
>AE007869.2/110253-110382 Agrobacterium tumefaciens str. C58 circular chromosome, complete sequence. 
ATGGTGAAAGGCAGCGTCCATAAAAATAGACGCGCCCTGGAACATCAGACCGTTGAACGCTTTGACCACGGATGTACTGGCACTGACGAAAAACGGATGGAAAGGTCGGGCTCGCCCGGCCTTTTTGTTT
>LGKD01302340.1/501-591 Octopus bimaculoides Scaffold36772_contig_40, whole genome shotgun sequence. 
TATAGTTTTCAAAGTGACAACTAGTCACTGACCTATAGTAATTTTTTAAATTATAGATCAGTGACTAGTTGTCACTTTGAAAACTATATAT
>AACT01052938.1/746-1 Ciona savignyi cont_52938, whole genome shotgun sequence. 
AATTCTTGGATCGGCGCAAGACGAACGACTGCGAAAGCATTTGCCAAGAATGTTTTCTTTAATCAAGAGCGAAAGTCAGAGGTTCGAAGACGATCAGATACCGTCCTAGTTCTGACTATAAACGATGCCAACTAGCGATCGGGGGGCGTTACATTGACGACCCCTCCGGCAGCTTACGGGAAACCAAAGTCTTTGGGTTCCGGGGGAAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGAAATCTCACCCGGCCCGGACACAGTGAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCGATAACGAACGAGACTCTGGCTTGCTAAATAGTTACGCGACCATCCCGGTCGGCGTTTAACTTCTTAGAGGGACAAGTGGCGTTTAGCCACACGAGATTGAGCAATAACCCCTATTTCCACAAAGGAATAAATTTTAAAATCCAATCTACGTTCAGTTTCTAACATAACACATTTTTATTTTTGTTTCTTTCGCTGCAGCGTTTATCACCAACAATTAAAAAATACATGTCATATATATATATACCAAAACAAATATGGTGTTAACTGAAAATCCAACAATTAACCAAAGAAATAAAAAATACTACAACAAAACAGGAAGGCACCAAAAAAACC
>CCCW010012867.1/738-403 Brassica napus, WGS project CCCW01000000 data, contig: 31321 
ACTCTAGTCCGACTTTGTGAAATGACTTGAGAGATGTAGAATAAGTGGGAGCTCCGTGAATCGGAGGCGGGGTTGTTACCCCTTGTTTTCGACCCAAGACTCGCTTCGGCGGGTCAATCCGAGCGGATGACATTGTCAGGTGGGGAGTTTGGTTGGGGGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAAAACAGAAATCTCATGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTTCTGTACGAATATGAACCGTGAAAGCGTGGCCTATCGATCCTTTGGACCTTCGGAATTTGAAGCTAGAGGCTTCAG
>AFEY01211982.1/140-48 Sarcophilus harrisii ctg7180001785086, whole genome shotgun sequence. 
ATTGGTTTTCAGCCTTTTGGCTAAGATCAGTATCTATTCTTATCAGTTTAATATCTGATATGTCATCTATATGTATATACATAGGTATATGTA
>GL832959.1/2234038-2236146 Salpingoeca sp. ATCC 50818 unplaced genomic scaffold supercont1.5, whole genome shotgun sequence. 
TAACTGGTCGATCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTCTAAGTATGAATAGTATTCTTGATACTGTGAAACTGCGAATGGCTCATTAAATCAGTTATAGTTTATTTGATAGTTTGCAACTCGTTTTTCGGAGCGGTGTTGTGCTAGACGGATAGCCGTGGTAATTCTAGAGCTAATACGTGCGACAAGGCCCGAGAGAGGGGTGTGTGTATGCGCATTTTTTCTTCTCGAGGGCTGCATTTGTTAGGTATAAAGCCAGCAGGAACATGACTGGTGAATCAGAATAACTTTGCTGACCGTTACACTTTTGTGTGTGATGGTGTCTCATTCGAATTTCTGCCCTATCAACTTTCGATGGTAAGGTATTGGCTTACCATGGTGACAACGGGTGACGGGGAACATTTGGTTCGATTCCGGAGAGGGAGCCTGAGAGACGGCTACCACTTCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCTGACACAGGGAGGTAGTGACAATAAATACCAATGCACGGTGTTTTTTATGCACTGTGCAATTGGAATGAGAACAATGTAAAGACCTTATCAAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAAAAGCGTATACTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTCATGCGGGGTTCACGGTGTGTGGGTGGGGGTGAGACACTGTTTCACGCGCGCCTTCTTCTGCCCCGCACTGTTTGGACTCTGCAGTTTTAATATTCCCTGGTGGCGCCTTTGGCGCGTGCCCTTGATTGGGTGTGTGTCAAGTCACGTAGTGGTGGGGCGCTGTTGGGGGCTTTACTTTGAAAAAATTAGAGTGTCAAAGCAGGCAGTCATTTGATTTGCTTGAATAGATTAGCATGGAACAACGGAAGAGGACTTTTGGGCCTGTACTGTTGGCGTGTGGTGCGGGGTGTGTGGAAGAAGAAACCGCAAGGTTTTCTTATTCCTCCCTCACCACATCGGGTCTGAAGTAATGATTAATAGGGACGGTTGGGGGCACTGGTATTTCGTTGTCAGAGGTGAAATTCTTGGATTTACGAAAGACCGCCGACTGCGAAAGCATTTGCCAAGGACGCTTTCATTGATCAAGAACGAAAGTTAGGGGATCGAAGACGATTAGATACCGTCGTAGTCTTAACCATAAACGATGCCGGCCAGGGCTCGGTGGGCAGCACAAATGTTTCAACGCATGGTGGCGCCATCGGGACCTTTAGGGAAACCAAAGCGTTTGGGTTCCGGGGGGAGTATGATCGCAAGATTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTCCAGACATGGGAAGGATTGACAGATTGACAGCTCTTTCTTGATTCCAAGGGAGGTGGTGCATGGCCGTCCAGCTTTTGTTGTGAAATCTCTGTTTGATTACGGTAAACGGCGAGACCTTGACTTGCTGATTGGTGTGCGCCTGCGTTAGCAGGCGTTGGAGATTACGCGCAAGCGTGTCTTTTGATACACCACTCAGAGGGACACTCGGCGTTGCTATTGAGCGTAAGCCGAAGGAAGTTTGAGGCGATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCTGCACGCGCGCTACACTGACGGGGGCAGCGAGTATGCTTTGGGTGTTTGTGGTGGGGAAAGTCTTGTGCTTTTCTGCATTCACAAACATCTATTCCTGCGCTGGAAGGCGTGGGGACTCTTGTGAAAACCCGTCGTGCTGGGGATAGATGCTTGCAATTATTCATCTTGAACGAGGAATTCCTAGTAAGCGCAATTCAACAGATTGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGAATGGTTTAGTGAGGCCTCGGGATTGGCGCGTGGGCGCTGGCAACAGCTGCCCATGTGTTTCTTTGCTGAGAACCTGGTCAAACTTGATCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTC
>AGTP01003540.1/18890-19069 Ictidomys tridecemlineatus contig003540, whole genome shotgun sequence. 
AAGTATTATCTCTATAAAGACTTACTAGAGAAGTTTCTCTGATTGCATAAAGAACCAGAAATCAAGGAGGTGCAGTGTGAACAGGTACTTGGTGTTGTTTTGTTGCAACTACCATTTCCCATTGATGATTGTTGTTCTCTTCCGTTTAGGGAGAGTAAGAGGGAAAGAATGCCAAGTGGT
>CM004282.1/30198321-30198152 Daucus carota subsp. sativus cultivar DH1 chromosome 5, whole genome shotgun sequence. 
ATACCTTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATAATATCTGATATGTGGGCTTATAAGTTCACACGATATTAAGGGGCTGTTTGGTTGAGAGAAGCAGCTTCTGGCTTCTGCTTCTCTTGACCCGTTTGTGTAAAGAAGTAGAAGCACTTTTA
>AACT01036598.1/1017-1 Ciona savignyi cont_36598, whole genome shotgun sequence. 
TACTCTATTCAGCAGAACAAAAGCTGTTATAGGGGCCAGGCTTACGAAACTAATTGGAGAAGAACCTACCATCAAGACTCTGCAGCAACACCGCATCGAGAGCTTCTCCAAGCAGGTCCAGGGCTACGGATCCAGTCACTTTAGCAACACTCACTCCAACAGCTGGTTAACAGGATCAACCAGGCTAATGACTGGCCGTAACTACGTACAAGCCTGTGCACTCCGGACACAGACCCTGCCAACCCGCGAAGCCGTCTCAAGGGGAAGAGTCGGCGCGAACACCATCTGCCGAAACTGCGGGCTGGCAGAGGAAACACTGTCCCACATCCTGCAGAACTGCCACCGGACCAATAAGATCAGGATTCAACGGCATAACGCGGTTCTGCAGGTACTTGTCAAACATCTACGTAGGAGAAAATGGAAAATCCAAGAAGAACCATACATCCCCACTCCTACGGGCAGTGTCATTAAGCCTGATGTTCTGGCCACGGATCCTGACGGGAACGTGTTTGTCATCGATGCCGCCTGCCCCTACGAGGGTAACAAGAACTCCCTCGTCAATGCAGCAGCGGCAAAGGTGAGCAAATACACACCTTATAAACCCTCCATTCTTCATTATATAGGTGAGACCCCAACAACGGTCACTTTCCTCGGATTCGTGGTGGGAGCCCGTGGCGCAATGCCACCGCAGACACAACACTTCTGCAAGCAGGTAGGTCTTGGTAATGGCCAATTAGATCTAATGTCGGTACGGGCCATAGAAGGAAGCCTAAAAATCTTCCGATTATTTATGGCCCTGTAATATTAACTCGGGTACGCACCCACGAAGTATACGCAAGTGGTACTTCGGTAATGCGAAAAGACACGGTGCTATCGGACCTGACCTTTATGGTAAGGACCCGCGGCACCAAGTCAAACATAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCGCTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGG
>MHIF01000055.1/14859-14981 Candidatus Buchananbacteria bacterium RIFCSPHIGHO2_01_FULL_46_12 rifcsphigho2_01_scaffold_5410, whole genome shotgun sequence. 
GACCTAACCCTTGGGTAATTTATCTAAGGCATGGTCGAAAAACTCATCCTACATAAAGACGGTCTTCCGTCCAGTACTTGTAGGATGAGTCTATGCCCAAAAGGGTATAGTTGGTATATCTAA
>CP002273.2/732628-732803 Eubacterium limosum KIST612, complete genome. 
TTAATAACTTAATGATGCTGTTTTGTTAGAGGAAAGCGGTTGAAATCCGCTACAGCCCCCGCTACTGTAATTGCAGACAAGATCCTCATAGACCACTGTCAGGCGTATCCTGACGGGAAGGGAGGATGGAGAAGGAAGCAAGAGTCAGGACACTTGAAGCAAAGCAATATAATCAC
>AAGJ05103349.1/43054-43146 Strongylocentrotus purpuratus Contig103349_fixed, whole genome shotgun sequence. 
CCCGCCAGCCCGATCATTTTTGTGTTTATGCAACTTTTGTATTTTCACCGATCAGAGTAGTTGCATAGTCACAAAAGTGATTGGGAGGGTTGG
>MLAU01031941.1/12573-12707 Lupinus angustifolius cultivar Tanjil contig_31941, whole genome shotgun sequence. 
CTTGTGGGGAATGCTGTCCGGTTCAAGGACATAACACTATCTTTACAACCTATGATATATATAATTTGCGGATTGTATAATCGATTTTGTGTTATGACTTAGTGTTTCCTCGGACCAGGCTTCATTCCTCTCAAT
>KB096275.1/1122699-1122634 Helobdella robusta unplaced genomic scaffold HELROscaffold_19, whole genome shotgun sequence. 
TCCTATGATGAACCTGGCTTAGGAAGTGCCGTCAGATACATATATGATGATCGCTATTAGCTGATG
>CM002813.1/58122422-58122133 Capsicum annuum cultivar Zunla-1 chromosome 2, whole genome shotgun sequence 
TTAATTTGACTCAACATAGGAAAACTTACTAAGTCCAGACATGGTAAGGATTGATAGACTGAGAGCTTTTCTTTATATAATGGGTGGTGGTTCATGGCCATTCTTACTATATGGAGTGATTTGTCTAGTTAATTACTGATACGCCTAAATTACACCTCTTTTTTGAGAGAGTAAGTGATCTCTATCAAATATAGAACTCAACTGGGTTGGGTGTCGAATCACACAAGGAATATTGTGTTCACTAAATATTGTGATTGTTATTAGACTGTTGATCTAAGGTTCCTGAGTAC
>GL378484.1/35805-36021 Volvox carteri f. nagariensis unplaced genomic scaffold VOLCAscaffold_163, whole genome shotgun sequence. 
ACTTGGACAAGGCGGCTGGCGGTAACGCAAGCGAGCCCGGAGACATCGGCATCGGCCCTGGGAAGAGTTCTCTTTTCTTTTTAACAACCCGAAGGCCCTGGAATCGAATCATTCGAAGATAGGGCTCAGAGGTTGGTAAAGCACCGCACTTCTCGCGGTGTCCGGCGCGCCGTTGACGGTCCTTGAAAATCCGGGGGAGCATTTCCGATCTTGCCAA
>AFSB01153275.1/28776-28952 Heterocephalus glaber contig153275, whole genome shotgun sequence. 
ATCGCTTCTCAGCCTTTTGGCTAAGATCAAGTGTATTATCTGACTGTCTTCAGGGCTTTGCTCTCAGGGTAGGTTAATGCACAGGAAGTATTCACAAATGTGGAGCTTACCCACTTGAGTAAGCCCCACACACGCTTGAACACTAATCATCTGAAAAGGTTTTAGGATGTAAAAGTT
>EU151723.4/3777-3872 Opium poppy mosaic virus isolate PHEL5235, complete genome. 
GCAATATAGTGGGAGCCGGGTCCTGGTAAACAGGTTGAGTTGGTCTCGTAATCTCGGGTGGACTGCCAATCCACCGTCGCACCACTCTCATGGGCT
>JMQN01000048.1/178591-178475 Marinobacterium sp. AK27 AUG5_contig_7, whole genome shotgun sequence. 
CTATCTTGGTCGGGGTGCCCCGTCATTGGCGTTGGAACGCGAATGGTACGGGCTGAGATTAAACCCGCTGAACCTGATCCGGCTTGGACCGGCGTAGGAAATCGAGATATTCCGTAT
>URS0000D69473_1118056/1-77 Anaerococcus obesiensis ph10 skipping-rope RNA 
AATCATAGAGGTTAAGAAATCTGCCGATAACGCTATTTTATAGAAATGTGGGAGAGGAGGCAGTCCCACCTATGTTT
>JRRC01354207.1/1-1013 Gossypium arboreum cultivar AKA8401 contig_36035_3, whole genome shotgun sequence. 
CGTAAACCGTGAAAACGGGGTTGTGGGAGAGCAATAAAAGCGTCGTGCTGCTAGGCGAAGCGGTGAAGTGCCGAACCCTAGATGGCGATAGTCCAGTAGCCGAAAGCATCACTAGCTTACGCTCTGACCCGAGTAGCATGGGGCACGTGGAATCCCGTGTGAATCAGCAAGGACCACCTTGCAAGGCTAAATACTCCTGGGTGACCGATAGCGAAGTAGTACCGTGAGGGAAGGGTGAAAAGAACCCCCGTCGGGGAGTGAAATAGAACATGAAACCGTAAGCTCCCAAGCAGTGGGAGGAGCCCAGGGCTCTGACCGCGTGCCTGTTGAAGAATGAGCCGGCGACTCATAGGCAGTGGCTTGGTTAAGGGAACCCACCGGAGCCGTAGCGAAAGCGAGTCTTCATAGGGCAATTGTCACTGTTTATGGACCCGAACCTGGGTTATCTATCCATGACCAGGATGAAGCTTGGGTGAAACTAAGTGGAGGTCCGAACCGACTGATGTTGAAGAATCAGCGGATGAGTTGTGGTTAGGGGTGAAATGCCACTCGAACCCAGAGCTAGCTGGTTCTCCCCGAAATGCGTTGAGGCGCAGCAGTTGACTGGACATCTAGGGGTAAAACACTATTTCAGTGCAGGCCGCGAGAGCGGTACCAAATCGAGGCAAACTCTGAATACTAGATATGGCCTCAAAATAACAGGGGTCGAGGTCGGCCAGTGAGACGATGGGGGATAAGCTTCATCGTCGAGAGGGAAACAGCCCGGATCACCAGCTAAATATCCGGACTATTCTACAGGTTTCCACTTTCCTTCAATCCGTTGAAATTTCAACAGATGAAACTTGTAGATAAAAAAGACTTAGGTACAATGGTGGGAATTTAATGCTTGAACGGGGACAACACTGAACCAATTCCATTGTTTGTCGAGTTAGTCGATCTTGAGCCCATTGAAAATGTCGTTCTATTAAGTAATCAATTAAAAAGCATGATACGGTTTTTATTGACATTTTTTT
>KI545835.1/844-926 Toxoplasma gondii VEG unlocalized apicoplast scaffold scaffold00504, whole genome shotgun sequence. 
GGATTGATGTCTGAGTGGTCAATAGAAATAGACTGTAAATCTATAGAAGTTATTCTTCATCGGTTCAAATCCGATTCAATTCA
>KQ435742.1/1845933-1846233 Melipona quadrifasciata isolate 0111107301 unplaced genomic scaffold scaffold54, whole genome shotgun sequence. 
GAGTTCCCTCGAGTAACGCGGCGGAGCCACAATCGGAGTTCTCAGTGACTCTCAATGCTCTGAGGAAAGTCCCTGGACCTTGGACAGAAAGTGTTCGTAGCATCGCCGTTACTAGCCTCTCGTCGTCTTTCTCGAACTTGAGACAGGAAGCTTCGGCCGATCTTTTCGGGTTAGGACGAGAGTGTATTGGTCAGAGGAAAGTAATGCGTTTCAAATCAAAAAATTCTCTCTTTCAATCTCCCTTTGTGGAGAGAGAAACTGAGAATTTGTCCAACTAAACAGGGCTTACTACGAGGGAAAA
>KE148148.1/1651271-1651071 Ophiostoma piceae UAMH 11346 chromosome Unknown scf03, whole genome shotgun sequence. 
TCAGCTCTCTTTGCCATGACGGCTTAGATCAAGTGTAGTATCTGTTCTTTTCAGTTTAACAGCTGAAAAAGCCTTACTGAGGCTCTTCTGTTACGCTAATTTTTGGCAACTTGGGCAGGGCGGTCGACTGAGCTCGTCTCGCGCGACCATCCGTCCACGGTGTCCCTGGTATTTCACTGCTTCCAGGCGACGCGAACCCAC
>FR887668.1/64445-64618 Firmicutes bacterium CAG:41 genomic scaffold, scf118 
AAGCAAGGTAGAGGTGCGCTTGTGTATTAGTATGTATACGGAGATATGCAATTATCTTTGATGTATACGGAAAGGACACAGTGCCGAAGTTTGAATATTATTGCGAATATTCATTCTGGGCATATCGTTAACAGCGGTATGACTGTCATCGTAAGGTGGGGAGCTATCGCTGTT
>ASAF01228276.1/12168-11615 Nicotiana sylvestris Nsyl_contig228276, whole genome shotgun sequence. 
CATAAAAAAGTTTTGAATTCTTAATTAATTGTTTCCGATTCACCGGATCTTACCTCTTTTGAAAGGAGTCAATAAAAAGTCAAAATATGGATTAACTTAAACTAATTTAAAAATTAAATCGAANTCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGATGCAAGCGTTATCCGGAATGATTGGGCGTAAAGCGTCTGTAGGTGGCTTTTTAAGTCCGCCGTCAAATCCCAGGGCTCAACCCTGGACAGGCGGTGGAAACTACCAAGTTGGAGTACGGTAGGGGCATAGGGAATTTCCGGTGGAGCGGTGAAATGCGTAGAGATTGGAAAGAACACCAACGGCGAAAGCACTCTGCTGGGCCGACACTGACACTGAGAGAAGAAAGCTAGGGGAGCGAATGGGATTAGATACCCCAGTAGTCCTAGCCTTAAACGATGGATACTAGGCACTGTGCGTATCGACCCATGTAGTGCTGTAGCTAATGCNAGTGATAAAGGAGGTAGGGGTGCAGAGACAGCCAGGAGGTTTGCCTAGAAGCAGCCACCCTT
>CP001097.1/1124998-1125215 Chlorobium limicola DSM 245, complete genome. 
ATAAGTAATAACAGTTACGGTTTCCGGCGCCTGGAAGGGCGCCGGAATGAAAAGGGAACCCGGTGAAAATCCGGGACAGTGCCCGCTGCTGTGATCCCCCCGTCGGCATCTGCCGGCGGCGCGGTGCTTCCGAAAAGGCCACTGGTCCGCGCCTGCGGACCGGGAAGGCCGGAAGCATGGGGAGAGTCAGAAGACCTGCCGTAACGAAGTAATGCTTC
>KK502588.1/105838-105391 Glossina austeni unplaced genomic scaffold Scaffold188, whole genome shotgun sequence. 
AGAAGAAAAGATAGGGAAGTGCTGGCTGCAGCCTACTGGGAAGATGGCCAAGGTCCGAATATAAGCGTGTAACACAGATTGATAGCTTTTTCTCAAATCAGCGGATTGTGGTGGATGATCGTTCTTAGTTCTTATTACAAAAAGATGTTTTAAGGGTTAAGGTGTTGAAGCTTTTATGGAATCTGTTTATAAAAGTGGAACCGTATCTGTTAGTTTGTGTTTTTATAGGAGAAAATAATGCGATTAAGCAATGACAGCTCTGTAGCGCCTTTATATGCCCTGGGCTGCACAATGAACGTATTAATATATATTCCCTAGACCTAGTGATCCGGATAAATCGCTGGACCACTTTCAGACTTGGAATTGTGAAATGAAACTGTTCATTTGGAACTTGGAATTCCCAGTAAGTGTGAGTCGTTAATTCACATTGATTGAGTCCATGCTCTTT
>AFSB01210878.1/11034-11234 Heterocephalus glaber contig210878, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCAGAAACCAAACAAACCCCAAACAAGATGAAATCCATAACGAAAAACACAGTACTAAAACTGTCATTTACCAAAGATAAAAGGATGCATAAGAAAAGCAGTCAGAAATTTTTGTAAAAATTTTTGAGCTCACTGGGGATTTAGCTCAGTGGTTTGACCGCCT
>MLAU01024954.1/4432-4362 Lupinus angustifolius cultivar Tanjil contig_24954, whole genome shotgun sequence. 
CTTTTTATGGTGAATTAGTGTCCCAATCGATTTAAGATTGAATAAAAATGGTTCGAACCCATTTGAGGGGA
>AACT01006374.1/1536-1721 Ciona savignyi cont_6374, whole genome shotgun sequence. 
TGGTTTGTAATGTTGAGATTGATATATGAGTTTGCAAGAAAGCTGGCTATTTTGTTGGTTTTCGGAGAGCGAGGTAATGATTAAAAGAGACAGACGGGGGCATTCGTACTGTGCCGTTAGAGGTGAAATTCTTTGGATCGGCTCAAGACAAACGACTCGAAAGCATTAGCCAAGAATGTTTTCTTT
>CH990426.1/969-1 Drosophila simulans chrU_M_6102 genomic scaffold, whole genome shotgun sequence. 
TTAGGGTATTTCCGGGGGGGTTTTTTAATGGGATTAAAATTTGTTTTTTTTCTTATGTTCTTCTTATTAAAAACCTGCATTGGGGTTTTTAAACGAGTGTTTTTTTGGGGCGGGTATTTTTCTTTTGAACAAATTAGAGTGTTTAAAGCAGGTTTCAAATGCCTGAATATTTTGTGCATGGGGATAATGAAATAAGACTTCTGGTTTGTTTTCATTGGGTTTTCAGATCAAGAGGTAATGATTAATAGAAGCAGTTTGGGGGCATTAGTATTACGACGCGAGAGGTGAAATTCTTGGACCGTCGTAAGACTAATTTAAGCGAAAGCATTTGCCAAAGATGTTTTCATTAATCAAGAACGAAAGTTAGAGGTTCGAAGGCGATCAGATACCGCCCTAGTTCTAACCATAAACGATGCCAGCTAGCAATTGGGTGTAGCTACTTTTATGGCTCTCTCAGCCGCTTCCCGGGAAACCAAAGCTTTTGGGCTCCGGGGGAAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGAAAACTTACCAGGTCCGAACATAAGTGTGTAAGACAGATTGATAGCTCTTTCTCGAATCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTCGTGGAGTGATTTGTCTGGTTAATTCCGATAACGAACGAGACTCAAATATATTAAATAGATATCTTCAGGATTATGGTGCTGAAGCTTATGTAGCCTTCATTCATGGTGGCAGTAAAATGTTTATTGTGTTTGAATGTGTTTATGTAAGTGGAGCCGTACCTGTTGGTTTGTCCCATTATAAGGACACTAGCTTCTTAAATGGACAAATTGCGTCTAGCAATAATGAGATTGAGCAATAACAGGTCTGTGATGCCCTTAGATGTCCTGGGCTGCACGCGCGCTACGAATCCACCA
>CP000682.1/2154080-2154188 Metallosphaera sedula DSM 5348, complete genome. 
GCCGGGGTGCCCGAGCGGACCAAGGGGGTAGGCTCGAGACCTTTCCAGCGTTAAAGCGTGCGACCTACTGTCTCTCCGAGACACGCGGGTTCAAATCCCGCCCCCGGCG
>CBUU010045831.1/1-300 Eimeria praecox, Houghton, WGS project CBUU01000000 data, contig: Eph_scaff15802_1 
GAGCAATGCGGAAGACACAGTGAGGTGGGGAGTTTGGCTGAGGCGGCACATTTGTGAAACAATAGCGCAGGTGTTTTAAGGCAAGCTCAATGAGAAGAGAAATCTCATGTTTACCAGAAGGGGAAAAGCTTGCTTGATTTTGATTTTCAGTACGAATACAAACTGTGAAAGCATGACCTATCGATCCTTTAGGTCTGAGAAGCTTTCAGTTAGAGGTGGCAGAAAGGTTACCACAGGTATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGG
>KB016908.1/814362-814466 Camelus ferus unplaced genomic scaffold scaffold638, whole genome shotgun sequence. 
ATTTCAAAAAATTATCCCCAGGAGGGCTCTGGACCCCTCGGCATTGTATCTTCAGTACCGGCAGCTTGCAGTCCACCAGTTCAATCCTCAAGCGCCAGAACACGG
>JQBS01000032.1/75904-76076 Carnobacterium divergens DSM 20623 NODE_75, whole genome shotgun sequence. 
ATAAAAAATAGAGGTGCAACAATTATCAGTAATTAGTTGGAGGTTTGACAAAACCTGTGAAGACTAGTGAAAGGAATTTTTGCCGAAACAAAAAACTGTCATCTTTTTGTTGGGTCTTAGGTTGAATAAGCCGAGAACTGTCGCTTATCTTTAAGCGTTGCGCTATCTTACTG
>CM000839.2/46388956-46388601 Glycine max cultivar Williams 82 chromosome 6, whole genome shotgun sequence. 
CATTAGAGCATTAAGAAGACATTTCCCTAGTACAAGAATATTGGGAAGGACTCACCTTCGGTGTGCCAGTTATCGTGCCCAGCCACGGTAAACGTTGGGTTGCCAAGTGTGGAGTAGATAATTGCTGAAAGCATCTAAGTAGTAACCCTAAGGTGAGTGCTTTCATATTTCAACTTCCCCAAAGCCTCCGGTAGCACAACTGAGATAGTGATGGGTTCTCTGGCCCAACAGGGATGAAGTGAAATTTTTTAAAGAATTCAAGAGAAGGTCACAGTGAGATGAGTTGTTGCTAATTAATGATAGGTGTCAAATAGAAATGCAATGATGTATGTATCTGAGGCATCCTAACAAACCGT
>ALWZ040783527.1/524-606 Picea glauca, whole genome shotgun sequence. 
TATGGCATAGGATGTTATATCTTATTCTACACACTGAAATTACCGTGTAGATAACTATACACCTCTGACAAGCTGATGCCAAC
>AAYZ01665444.1/416-340 Ochotona princeps cont2.665443, whole genome shotgun sequence. 
TGCTCTGATGACACAGGTAGCAAATAGGAAGTGCCGTCAGAGCGAGAACTGACGATCCTGGAGACGCGTGTCTGAGC
>AFYH01197597.1/1946-2009 Latimeria chalumnae contig197597, whole genome shotgun sequence. 
TACACTTTAGTGAAGGCTATATAGAAAACCTTTCAAAGGCATATGTAGTCTGATGTTGTGTGTA
>MHXH01000017.1/67050-63467 Parcubacteria group bacterium RIFCSPLOWO2_01_FULL_48_18 rifcsplowo2_01_scaffold_382, whole genome shotgun sequence. 
GGGCATATGGTGGATGCCTTGACTTGAGAAGGCGATGAAGGACGTGGCGTGGCTGCGATAAGCTTCGGGGAGGCGCTTAGCAACCTATGATCCGGAGATTTCCGAATGGGGAACCCCCGCCGTGCAAACCACGGCGAGCCGTGCTTTGCACAGAAATCCGAAGTACGAAATACGAAATCCGAAACAAAAAGCTTCGAATTTCGATATTCGAATTTCGAGTTTCCGCGCAGAGCGCGGCGGCGTACCCGCTGAATTGAAACATCTTAGTAAGCGGAGGAAAAGAAACCAACATTCAGCTCTACGCTGTGCTAACTAAGTTACCTGCTCAATTTTTTGGATTTGGAGAATAAAAAAAGAGGACCGTCGCGCGCGGCGGTCCCAGAACTCAAGCACCCCGAGGACAGAAGTCAAGCAAGGGATGCTGATAGTATTATAGCATGCTGGTAGGTTTTGTCAAGAGTCCAAAAATTTGAGCAGGTATAAGGTTGGAACAGTGTTCTACTGAATCATTCCCTTAGTAGCGGCGAGCGAAAAGGGAGGAGCCTAGAGCTCGGGTGTGCAGCATCGGGAAGCTTCAAATTTCAAAGTCCATATTTCTATTTTTTTCGCGAAGCATATTTCAAATTATTTCAGAAATATGTGGAAATATATAGAAACTCAGAAATATGCGGACATATTTTGTCATTTGGAATTTCCGCTGCTGTGCATCTGGGCAGTTGTAAGATAGTAACGTCTTCCTGATTTATCAGAGAGGGGGGGTGTAAGTAAGACTTCGTTAGTAGAACAACTTGGAAAAGTTGGCCAAAGAGGGTGATAGCCCCGTATGCGAAAACGGTCTTATAACCCCAGTTATTATCGACTCTTTAGAGTCGGAGCTATGATATTTTTACATGTCGTAGTTTCTTGAGTACTTCGACGACAGAAAGCGTCGGAGGAAACCGCGAGTACTATCTCGCAAGGCTAAATACTTCTCAAGATCGATAGTGAACAAGTACCGCGAGGGAAAGGTGAAAAGTAGCCCTATTAGGGCAGTGAAATAGTACCTGAAACCATATGCTTACAAGGAACCGAGGCTGAGCATCTCACTGTCGTGAGATGCGGAATATAGAATCTTGAATTTTGAATTTGGAATGATTATTCCAAATTCTCCCGCCAATCTCCGAAGGGCGAAGCCCTAGGCAAGATTGGCGAGGATCCCGTACTGTCCGCGATGAAGATAGGACAAAATCTTCATTCGGAGATTGGCGGGACCCTAGCCAACTGTAGCCGCTCTCCCGCTTTCAGCGGGATCGCGGACAGTTGCGGGACAACTTCTTCCGCCAAAGGCGGATCCGCCTCAGGCGGAAAATTCTGCACCGAACGAGAGTGAGGTGCTTGGTGACGGTGTGCCTATTGAAGAATGAGCCAACGACTTTATCTATGTTGCAAAGTCTAATCCCGAAAAGGGAGAAGGCGCAGGGAAACCGAGTGTTAAAAGCGCGTTACTTTAGCTCGATAGCTTTTTAGCTCAACAGCTCGTTAGTTTTCTATCGAGCTAACGAGCTAATCGGCTAACGAGCTTAAGTTAGCAGCATGGATAAGACCCGAAACCAGATGAGCTTGCCATGGCCAGGATGAACGCCGGGTAACACCGTCGGGAGGTCCGAACCGGTGGGTTGTGCAAAACCCTCGGATGAGCTGTGGTAAGGAGTGAAAAGCTAATCGAATCTGGTAATAGCTGGTTCTCCCCGAAATCGCTTTAGGGCTAGCGGCGTTTTATGTCATGCCGGAGGTAGAGCTACTGGATGATCCTCAAAGGGCGAAAGCTCGGATGATCAATCAAACTCCGAATGCCGGCAGGATTACAACGCTAGTTAGACCGTGGGGGCTAAGCTCCATGGTCGAGAGGGAAACAGCCCAGATCGCCGTCTAAGGTCCCTAAATTCTTGCTAAGTGTAAAAGGTAGTAATCAGCCGAAGACAGGTAGGAGGTTGGCTTAGAGGTAGCCATCCTTTAAAGAGTGTGTAACAACTCACTATCATATCGGCCGCATCTCACTAAGGCGAGATACTTGAATGACCAATTTCTAATTGACCTAATTTCTAATAAATTTCCAATACCCAATTTCGGAATTCGGTTACTGGGATTTATTTAGAAATTAGAAGTTAGGATTTAGAAATTTGAGCACCGAACTTTAGTGAGGTGCGGTTGATTGGCTGGTTGCGCCGAAAATGTACCGGGGCTAAGCAAGATACCGAAGACGCGAATTACCTGCTCAAATTTTTGGACTAATAAAATAATAAAAAAGAGGCCACCCATTGACGAATGACCCCTGACCTGACTCGTGGAAGTTCTTGTTAGACGACTATGGTCGTAACGACCGCGACGATCACCCAAGAGCCGTAGATGAGTGTTCCTTTCATGGGTTCAACTCTCCACGCTTCGATCATGCGGCTTTCCGTAGCTCATGATCATTGAGATCGTTATCGCCCCAAAGACTAATGCCGAAACAAGTGAAGAAGTCGGTTCCACGACAAGCTCCTTGATTGAGGGTTCGTTGCAATTATAGCATAAAGTTAAGTTTTTTGTCGAGAGTCCAAAAATTTGAGCAGGTAGTGGTAGGGGAGCATTTTGTGCGCAGCGAAGGTTGACCCGCGAGGGCGACTGGAGCGCACAGAAGAGAGAATGTTGGCATGAGTAACCAACAATGCCGATGAGAAATCGGCACTCCGTAAGCCCAAGGTTTCCGTGGCAATGGCAATCAACCACGGGTGAGGCGGTCCTAAGCCGATGGCGAAAGCCGAAGGTGATGGACAGACGGTTAATATTCCGTCCCACCGATACTATTTCGATGGAGCGACGGTTGAAATAAGGCCGGGCGTCTTAATGGTTTGACGCTGTTTGCTTGAAGGAATGTTGGACAGGCAAATCCGTTCAACTGTCTTTTATGGCAAATTCCGAAAGCAGACGAAAGTTTTGGTTTTTACCAGGGCAATCCGGCTGAAGAGCGATCCAAGAAAAACTTCTAGAGTTAATAGTATTGGTTCCGTACCGCAATCCGACACTGGTGGGCGGGGCGAGTAGCCCAAGGAGAACGAGTGAGTCCTCGTTAAGGAACTCGGCAAAAAAGCGGCCGTAAGTTAGCGATAAGGCCTTCCCGAGCACCGCAAGGTGCGAGGGACGCAGCGAAAGTTTGCCTGGCGACTGTTTATCAAAAACACAGCTCCCTGCTAACTCGTAAGAGGATGTATAGGGGGTGACGCCTGACCGATGCGAGAAGGTTAAACGATGGGGGTCGTATGCATCTCACTAAGGCGAGATACTTGAATGACCAATTTCTAATTGACCTAATTTCTAATAAATTTCCAATACCCAATTTCGGAATTCGGTTACTGGGATTTATTTAGAAATTAGAAGTTAGGATTTAGAAATTTGAGCACCGAACTTTAGTGAGGTGTGTACGGCTCACTGTTGTAAGCCCTCGTCAATGTCAGCGATAACTATAATCGTTCTAAGGTAGCGCAATTCCTTTCCGGGTAAGTTCCGGAGCGCACGAAAGGCGTAACGACTGGGCAACTGTCTCAACGAGGAGCTCGGTGAAAATG
>ABRO02033478.1/54894-54660 Dipodomys ordii contig_33478, whole genome shotgun sequence. 
GCTGGGCGCTGTGGTGCGCCTGTAATCCCAGCTATTCGGAAGGCTGAGTCCAAGAGTTCTGGGCTACAGTGCGCTATGCCGATCGGGTGTCCACACTAAGTTCAGCATCAATATGGTGACCTCCCGGGAGCGGGGAACACCAGGTTGCCTAAGGAGGGGTGAACCGGCCCAGGTCAGAATTGTGACTGTGGTTCTGACATAGGAATAGACAGGTAGAACAATGAAACAGACTAGT
>ABGB01001252.1/615-1121 Enterocytozoon bieneusi H348 ctg01_717, whole genome shotgun sequence. 
CATTAGGTTGATTCTGCCTAACGTAGATGCTAGTCTCTGAGATTAAGCCATGCATGTCAGTGAAGCCTTACGGCGGAACGGCGAACGGCTCAGTAATGTTGCGGTAATTTGGTCTCTGTGTGTAAACTAACCACGGTAACCTGTGGCTAAAAGCGGAGAATAAGGCGCAACCCTATCAGCTTGTTGGTAGTGTAAAGGACTACCAAGGCCATGACGGGTAACGGGAAATCAGGGTTTGATTCCGGAGAGGGAGCCTGAGAGATGGCTCCCACGTCCAAGGACGGCAGCAGGCGCGAAACTTGTCCACTCCTTACGGGGGAGACAGTCATGAGACGTGAGTATAAGACCTGAGTGTAAAGACCTTAGGGTGAAGCAATTGGAGGGCAAGCTTTGGTGCCAGCAGCCGCGGTAACTCCAACTCCAAGAGTGTCTATGGTGGATGCTGCAGTTAAAGGGTCCGTAGTCGTGAATGCAATTAAATGTCGTTGTTCAATAGCGATGATTGCT
>KV453914.1/432734-432532 Candida tanzawaensis NRRL Y-17324 unplaced genomic scaffold CANTAscaffold_6, whole genome shotgun sequence. 
ATCATCAGTAGTGGTTATACTATATCTAATATATATAACTATTATTTCATAAAGATCTTGGATGGAGGCATGCATATCATAGATGTGTGCAGGCTGACCATTTAACTACCCATAGCTAAGCATTCGTTGACCTAACTAACAATTGGGCCACAACGAGTGTTTCGTTTCGGTCTTTTAGATTATTACGTTTGTTGACGGCATTC
>CM000034.3/40324702-40324549 Canis lupus familiaris chromosome 34, whole genome shotgun sequence. 
AGCTTTACGCAGTGGCAGCATCATAGCCAATGAGGTTTATCTGAGGCACGATTATTGCTAATTAAAATATGGAGGCAACATCTCAAATTCCACCCTGGTTCATTCAACTTTCTGGAGACATCTAGCTTTTTAGCAATCAGATCATGCTATTCTG
>JYDM01000907.1/879-1 Trichinella sp. T8 scaffold908s, whole genome shotgun sequence. 
GTATCATTCCTGGGGGAAGTGGCGCGGAAGGAAGGTTACCAGGTCATGATAGAGCCTAAGGTGTCAACCCCGGTCGGCGCGCTCAAGCCCGACCTCCTTCTCATCAAAGCCGACACTGCATTCATTGTGGATGTAGGCATTGCGTGGGAAGGTGGACGCCCACTAAAGCTGGTCAACAAAATGAAATGTGACAAGTACAAGATTGCCATCCCGGCAATTTTGGAAACATTTCACGTTGGCCATGCTGAGACGTACGGCGTTATTCTGGGCAGCCGCGGATGCTGGCTCAAGAGCAACGACAAGGCGTTGGCATCAATTGGGCTCAATATCACACGGAAGATGAAAGAACACCTGAGCTGGTTGACGTTTGAAAACACCATCCGAATTTATAACTCATTCATGAAGAACTGAGGTTTTTGTTTTCTTTTACCTTTTACCATTTTTTATTGTTACATTGTTGTTATTTGCTTTAATCCTGCATTTTACCGTCGGCAATTCCATCGTTATTATTACTGTTATTGTTATTATTATTACTATTGTTATTACTTTTACTTACTATTGTTATTACGATTTATTTCGTATACTTACGTTATTGTTACTACTACTTACTTTGCTCTCGCAAACGTTCGTTGTTGTTACTTTTGGACCAGGTTTAGAGAAATCGCACGCACAGCGGAACTGGACCGCTTAAGCCAGAAACAGTAAAGTAACAATAGCCAAATGCCTCGTCATCTAATTAGTGACGCGTATGAATGGATCAACAAGATTCCTTCTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAAAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCTGACTCTGTGAA
>MEUW01000021.1/52640-49699 Candidate division WWE3 bacterium RBG_19FT_COMBO_53_11 rbg_19ft_combo_scaffold_7, whole genome shotgun sequence. 
AAGAAGGTCTTTTTATAAGGTAGATGAAGGATGCCTTGGGGCAAAGGGCCGATGAAGGACGTACTAGGCTGCGATAAGCCTCGGTGAGCTGCCACGAAGCGTTATTAACCGGGGATTTCCGAATGGGGTAACCCAATCCGTAAGGATTACGCTTAAGCCAAGTTCCTGCCTTTTGGCGGGATAGTAACTTAAGTGAGGGAACTCAGCGAAGTGAAACATCTCAGTAACTGAAGGAAAAGAAAGAGAAGCGCTTTATGCGCGGGTTCCCTAAGGACTCTCGCGATTTATTTCGCGGGAAACCTTGGGGAATCTTCGATCCTCCGAGTAGCGGCGAGCGAAAGGGGGGAAGCCTAAACTCCGGCGCAAGCCGGAGGGTTGCAGGACCTGCATTAGGAAAATTATTGGTAGGAGAATGCCCTGGAAAGGGCGGCCATAGAGGGTGAAAGCCCCGTAACTTAAACTGGTAATTTTCTGGCGGGAATCCTAAGTATCACGAGAAAAGTGAAAGCTTGTGAGAATCGAGCCAAACCACTGGCTAAGGCTAAATACTCTTTGCCACCGATAGTGAACAAGTACCGTGAGGGAAAGGTGAAAAGAACCCCGGTAAGGGGAGTGAAATAGAATCTGAAATCATCTACTTACAAGCAGACGGAGCCCGCAAGGGTGACGTCGTGCCTATTGAAGAATGACCCGAGGAGTTATCGCCAGCAGCAAGGTTAATCGCGTCAAACGCGGCGAGCCGTAGCGAAAGCAAGTCCTAAATGGGCGAATAGTTGCTGGTGGTAGACCCGAAACCTGGTGAGCTAGCCATGGGCAGGATGAAAGCCGACGAGAGTCGGCTGGAGGTCCGAACCGATGTGCGTTGCAATGCGCTCGGATGACCTGTGGTTAGGGGCAATATACCAATCGAACCAGGTGATAGCTGGCTCTCCCCGAAATGTATTTAGGTACAGCCTTGCAAAGTAACGAAGGGGGTAGAGATACTGGAAGGAATGCCGAGCCCGCAAGGGTATCGCTTCCTACCAAACTCCGAATACCTTCGCGAAATTTGCAGGAGTGAGCAGGCGGGAGCAAGTTCCGTCGTGCTAAAGGGAAACAGCCCAGATCATCGGTTAAGGTCCCTAAGTTGGATTTAAGTGGGAAAGGCAGTGGAATTTCTTAGACATCCAGAAGGTAGGCTTAGAAGCAGCCATCCTTGAAAGAGTGCGTAACAGCTCACTGGTTGAGAAATTCTGCGCCGAAAATGTAACGGGGCTCAAAATCCACACCGAAACCGTGAACTCGCCGCAAGGCGAGTGGTAGGGGAGCGTCGCCACAGCAGTGAAGCTGGATCGTAAGGTCCGGTGGAGCGGTGGCGAGTGAGAATCTCGGGATGAGTAACGTTTGGCGGTGAGAATCCGCCTCGCCGGAAGTTCAAGGTTTCCTCCGCTCTGGTCGTCATCGGAGGGTTAGTCGGTCCTAAGCCGAGGTCGAAAGACGTAGGCGATGGGCAGGGCGTTAATATTCGCCCACTTCCGTCCGGTTCGATGGGGTAACGTTTTCCAAAGTTGCGAGCGTCCGCATGGTTGGGCGTTCGGCGCACCAAGGTGCTTTGTTGGCAAATCCGCAAGGCATAAGCCAAGGTGTGACGGGGAGTCCCGTAAGGGACAACTCGTGAGGCTGGAGAACCAAGAAAAACCTCTAAGTTATGCCGGACGGGATCCGTACCGCAAACCGACACAGGTGAACTAGGTGAGTAGCCTAAGGCGAGCGGGATAACGTTCTTTGAGGAATTCGGCAAGTTGGCCCCGTAAGTTCGCAAGAAGGGGTGCCCCGACTTAAACGTCGGGGTCGCAGCAACAAGGCTCAAGCGACTGTTTAACAAAAACACAGGTCTCCGCTCAACCCGTAAGGGGATGTATGGGGGCTGAAGCCTGCCCAGTGTCCGTCGGTTAAGGAGAGGTCTGAGATTATTTCAAGGATCGAACCTAAGCCCGGATGAACGGCAGCAGTAACTATAACTGTTTTAAAGTAGCGAAGTTCCTTGTCGGGTAAGTTCCGACCCGCATGAAAGGCTTCACGACTTGAGCACTCTCTTAAAGAATGACCCGGTGAAATTGAAATGGCCGTGAAGATGCGGCCTACCCACAGCAGGACAAAAAGACCCCGTGGAGCTTTACTGTAGCTTGACATTGGTTTGATGATCGGATTTGTGTAGCGTAGGAGGGAGCCGCAAGGCGCCAATGAAACACCTCTCGATTTGATCCTCAAATCTTACTTAGGCGGTTAACCCGTCTGGGAACAGTGTCTGGTGGGCAGTTTAACTGGGGCGGTTGCCTCGCAAAGAGTAACCGAGGCGCCCCAAGGTCGGCTTAGTCTCGATGGACACGAGACTGTAAGTGCAAAGACATATGCCGGCTTGACTGCGAGACCAACAAGTCGAGCAGGTGCGAAAGCAGGGCTTAGTGACCTGTTCACTTCGAGTGGCGGAGTGAACAACATCGGACAAAAGCTACCCCGGGGATAACAGGCTGATCTCCTCCAAGAGTCCATATCGACGAGGAGGTTTGGCACCTCGATGTCGGCTCGTCCTATCCTGGGGCTGAAGAAGGTCCCAAGGGTTTGGCTGTTCGCCAATTAAAAGGGCACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGACTCTATCCGCTGTGGGCGTTTAGCTTTTGAGGGGATTTCTCTCTAGTACGAGAGGACCGAGAGGAGCCAACCTCTGGTGTACCGGTTGTCCTACCAAGGGCATAAGATATGCCGGGTAGCTATGTTGGTAAGGGATAAGCGCTGAAAGCATCTAAGCACGAAGCCCACCCCAAGATGAAAAGCAGACCCCTTGTAGACTATAAGGTTGATAGACGGCAGGTGGAAGCGCAGTAATGCGTTAAGCCGAGCCGCACTAATAGGTCGTTTGATCTTCTTTT
>APMT01169783.1/38025-37737 Mesocricetus auratus contig169783, whole genome shotgun sequence. 
AGATGTGAGGGCAATCTGGCTGTGGCATCTGCCATCTCATGAATCACCAGGGTTGATTTGGCTGATCTAGCTGGCTAGGCTGGTGTCCTTTGTCTCCCTCACCATGCTTTGTGCATCCCTCCTAAGGCTGCACACTCAGTCAAAAAGGACAACCTTCCCCAACTAGAGAAAGACCTATCTTCAGTTAAGAATATACTAGTAGCTGTGTTCCCCTGATAGAACTTCAAACAAGCTCTCAAGGAACTACTTAAGTGGGGCCAGTAAGAACTTCGGTGCATGTAACTCAGTT
>JJRN01037118.1/15094-15301 Fulmarus glacialis contig37118, whole genome shotgun sequence. 
AATCCAGTGAAGGATTCACTGAAGGAAACTGCTTCAAATCCTGGATTCAAGCAAATTAGGAAGTTTGAACAAGGAAAAGACCTATAGGTGAGTTCAGATCTTCAGATTACCCCAAAATACCTTTTGTTCTAAGTTAGCTTACCTAGAGTTAAAACCTTGCTCTGCTTTCTATTTTTGCTCAAACTGACGTATCAGCAGAAGGTGTGGG
>JJRE01079984.1/1-608 Phoenicopterus ruber ruber contig79984, whole genome shotgun sequence. 
TTTTCATTAATCAAGAACGAAAGTCAGAGGTTCGAAGACGATCAGATACCATCGTAGTTCCGACCATAAACGATGCCGACTGGCGATCCGGCGGGGGTATTTCCATGACCCGCCGGGCAGCTCCCGGGAAACCCAAGTCTTTTGGTTCCGGGGGGAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGAAACCTCACCCGGCCCGGACACGGACAGGATTGACAGATTGAGAGCTCTTTCTCGATTCCGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGGTTAATTCCGATAACGAATTAAGCGCGCCCTCCCTCCATTCCCTCCGCTGCGCGGTGGAGGTTTTGGACTTGCGACCTCAGATCAGACGTGGCGACCTGCTGAATTTAAGCATATTAGTCAGTGGAGGAAAAGAAACTAACGAGGATTCCCTCAGTAACGGCGAGTGAAGAGGGAAGAGCCCAGCGCCGAATCCCCGCCCCACGGTGGGGCACGGGACATGTGGCGTACAGAAGCCCCCCTCCCCAGCGGCGCTCTCGGGGGACAC
>JXUM01141515.1/11783-11841 Aedes albopictus isolate Foshan contig141515, whole genome shotgun sequence. 
TAGCCTAGTGGTTAAGGCTATGGATTGCCAATCCGGAGACGGCGGGTTCGATTCCCGAT
>JH836770.1/104900-105236 Erinaceus europaeus unplaced genomic scaffold scaffold01482, whole genome shotgun sequence 
GGATGTGAGGACAATCTGGCTGTGACATCTGTCATCCCATTGATTGCCAGGGTTGATTCAGCCTATCTGGCTGGCTGGGCAGGTGTCCCCTCCTCCCTCACCTCCCTCACCGCTCCACGTGCATCACTCCTTTGAAGAGGACAGCCTTCCCAAATAGAGATGGACCAGTCTTCGGTCTAGGGTATACAAATAGCTGCGCTCCCCTGCTAGAACCTCCAAACAAGCTCTCAAAATTGTCAAACCCTTAGTCAGACTTACTAGAAAAGGGCGGTGGGCTAGAAGATACAAATATATAGAACTGTAAACAATAGAGGAGATACTGCCCTCCTTACTAGTT
>CP003597.1/1039739-1039660 Chroococcidiopsis thermalis PCC 7203, complete genome. 
ATCGTTCATCTCTCTTAAAAACACTCTTCACCGGATGCTGAGAGAGACGGAAGTAAGGAAATATCCAGAAGGAACGCACG
>APGL01003207.1/3249-3375 Dendroctonus ponderosae Seq01003220, whole genome shotgun sequence. 
TGAGGGGTTTTTAGTGGGTAGGCAGCCCCACGGGACTGAATCCCACATAACCTAGCCGACAATGAACATCGTCGGCACAAAATCCAGCACAACATCGGCTGGGTATCTTTGGAAGATTTTCCCCTCA
>KK198759.1/5784749-5784536 Eucalyptus grandis cultivar BRASUZ1 unplaced genomic scaffold scaffold_7, whole genome shotgun sequence. 
TAGCGACTGTTTATTAAAAACACAGGACTCTGCTAGGTGGTAACAGGATGTATAGAGTCTGACACCTGCCAGGTGCTGGAAGGTCGGAAGGAGAAGTGTTATAAGCTTTGAATGGAAGCCCCAGTAAACGGCGGCAGTAACTCTAACTGTCCTCTTTTCTTATTTATTTGACTCTATTTGAAGTATATTTCTTGCATCTTTTTTGTAATTATTA
>KB317698.1/876973-877093 Rhizoctonia solani AG-1 IA unplaced genomic scaffold scaffold3, whole genome shotgun sequence. 
GTCCTCTTCGGAGTGACATATACAAAAATTGGAACGATACAGAGAAGATTAGCATGGCCCCTGCACAAGGATGACACGCTAGTTCAGAGTGGACGGTCTACGGACCGCAATATTTATTTTT
>MJEQ01005272.1/36510-37593 Nicotiana attenuata strain UT scaffold05272, whole genome shotgun sequence. 
TACCTGGTTGGTCGTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCTATGCATGTGTAAGTATGACCAAATTCAGAATGTGAAACTGCGAATGGCTCATTAAATACGTTATAGATTGTTTGCTGGTATCTACTACTCGGATAACCGTAGTAATTCTAGAGCTAATACGTGCAACAAACCTGACTTCTGGAAGGGTTGCATTTATTAGATAAAAGGTCGACGCGGGCTCTGCCTGTTGCTGCGATGATTCATGATAAATCGACGGATCGTACGGCCATTGTGGCGGCGACGCATCATTCAAATTTCTGCCCTTTCAACTTTCGATGGTAGGATAATGGCCTACTATTAGACCCTAACTCTCTTTCATCGGGCGTGGCACGCCTATGGCAAGAATTTGGGTGTGATTGCCTTGTCATTGGCCTATGTGCGTGCGAAACGATCATGCGGACGATGGACAAGATATTGTCATTGAGGGCTGTTGTGGGCAAGTATTGGCCAAGGCCTTGGGACAGGCAAGGCGCGCTTTTCAAAGGCTTGACAAAGCAGCGTGGGCAATGTTAGGGCGGCATGGCACGACATGCACGCCAAAGTCAGTGGAACGACACTTTGGGTTGTGGCAGCTAAGTGCGGGCTAAGCTAAGGCAAGGCGAAAATGCGGGATGATGGCAAAGGCTTTCAATAGCTAAGGCAAGGCTTGTGAAGGAAAATACAAGCAATGGCACGAGGGAAATGAAGGTTGACATGGACAAGGCAGAAACTAAGCCAAGGCAGTGCGCGGGCGGCAGCGACGTCGGGCGTGTGTGGCCAAATCATGGCAGCAGGTTGCGGGCAAGTCATTGGCGCAGAGCAATGTCAAATTGAGCTAAGGCTTGGCACAAAGCAAGCCTTAGGCGTGATTCAGCTGGCCAAGTGAAGATGGCACATGCAATGCACATGAAAAGCAGTTTTGGTGGTTACCTTGTCAGTAACCTCTTTGTCCCATGACTGNCGCGACGTCGCGAGAAGTCCATTGAACCTTATCATTTAGAGGAAGGAGAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTG
>CP001848.1/3411853-3411422 Pirellula staleyi DSM 6068, complete genome. 
GGAGTTGGGCAGACGACCGCTGGCTGCCATTTGGCAGCGAGAGGAAAGTCCGGGCTCCACAGGACAGGGTGGTCGATAACGTCGACCGGTCGTGAGATCAGGGACAGTGCCACAGAAAACAGACCGCCGCTGCGGGCATGAGCCCCCGTCAAGGTTTGATTGTCTGCATGCGGTAAGGGTGAAACGGTGCGGTAAGAGCGCACCAGCAGTCGAGGCGACTCGGCTGGCTAGGTAAACCCCGCCCGGAGCAAGACCAAGCAGAGAGCATGTTGTCGGTGTCACAGCCGACAGCCGGAATCGGTTCGGTTTCGTATGACTCTCGGGTAGGTTGCCGGAGCTAGCGAGCAATTGCTAGCCTAGAGAAATGGTCGTCAGACGTTTTCGATCCGTCGAAGACGCCAACAGAACCCGGCTTATTGCCTGACTCCGAAA
>APMT01097187.1/1014-904 Mesocricetus auratus contig097187, whole genome shotgun sequence. 
GTGCTTGATTCAGCAGCACATATGTTAAAAATTGGAACAAGACACAAAAGATTAGCATGACCTCTGTGCAAGAAAGTATCCAAGGGGGCTGGAGAGATGGCTCAGAGGTTA
>GG697144.2/1-676 Mitsuokella multacida DSM 20544 genomic scaffold Scfld3, whole genome shotgun sequence. 
AGGCTACGAAAGCGGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATGCTAGGTGTAGGAGGTATCGACCCCTCCTGTGCCGGAGTTAACGCAATAAGCATTCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTTAATTCGACGCAACGCGAAGAACCTTACCAGGGCTTGACATTGAGTGAAAGGGCTAGAGATAGTCCCCTCTCTTCGGAGACACGAAAACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCCTTTGTTGCCAGCACATAATGGTGGGAACTCAAAGGAGACTGCCGCGGACAACGCGGAGGAAGGCGGGGATGACGTCAAGTCATCATGCCCCTTATGTCCTGGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCCATTGCGGAAGATTCCCCACTGCTGCCTCCCGTAGGAGTCTGGACCGTGTCTCAGTTCCAATGTGGCCGTTCATCCTCTCAGACCGGCTACTGATCGTCGCCTTG
>CP000270.1/1720642-1720704 Burkholderia xenovorans LB400 chromosome 1, complete sequence. 
CCGTCTCTCAGGTTCTAGCACGGCCCTCGGAATGGCTAGAACTTTTGGGTATACGGATTTAAT
>KX552040.1/184526-184806 Kaumoebavirus isolate Sc, complete genome. 
CCGAGTCTCAGATTAAAGCTGAGGCTAGTTACGCATTAATGAAAAATGCTAGCTACATTCGTAAATTGCGGGAAAATCTCACGATTAATAACACCATTAGCAGCTTGAGAAAGTTGCTGAGAACCTCAGGGAAACTTGAGAACAACGGTAAAAGATTATTAATAGAGACAATCCGCAGCCAAGCTTGTGAAGAAATATCTACACAAGAAGGTTCAGAGACTTTATACGAATGGGCGGTTCTACCGCTTAAGATAAAGTCCATGCCCCACTGTGAAGTGGAT
>LVLJ01001741.1/199221-199340 Marchantia polymorpha subsp. polymorpha scaffold2490, whole genome shotgun sequence. 
ATCTTTGCGCTTGGGGCAATGACGCAGTTCATGAGGTGAAACCGCGTCAATTGCTGGTTGAAAACTATTTCCATAAACCCAAAATGTTCTGTGGATTGAATTTAAGTAAAATGCGTGCTT
>CYZX01000004.1/41603-41740 Clostridium disporicum strain 2789STDY5834856 genome assembly, contig: SCcontig000004 
TAGTTTTGTGTTTTCTAGTGTGTAAAAGTCTAAGGAATTTTCTATGACTTTTACGCCTGAATGTTTATCATTCACAGGGCAGTAATTGAAAAGTTATTGTCTCCACGTATTTTGGGAAGGAAAATAAGTAGATTTAAT
>JPGV01000050.1/11129-10707 Chlorobium sp. GBChlB GB_Chlorobi_Contig_4394, whole genome shotgun sequence. 
AAGCTGCGCGGCGGCGGTCGCTGCTCCGACAGGTCGGAGCAGAGGAAAGTCCGAACATCACAGGGCTGGGCGCCGGACAAGGTTTTGTCGGCAACGATGAAACACAAGTTCGGGCGGGCGAAAGCAATTTCGCTCGACAGATAGCGCAACAGAAAGCAAACCGTCTCGACGCAAGTTGGGATAAGGGTGAAACGGCGGTGTAAGAGACCACCAGTTAACGCAGTAATGCGTTAAGCTCGGCAAGCCTCCCCGATGCAAGACTATGTAGGAAAACTTTTTCCGCGAGGAAAAAAGAGTTGCCCGCTCAATTCATGCGCTTTCGGGCGCGGGAGAGTTTTCGGGTGAGTCGCATAGATAAATGACTGCCTCTCGTTCAAGCACTTGAGCGGGAAACAGAATTCGGCTTACAAGCGCGGCTTCATT
>CM001455.1/27997587-27997665 Oreochromis niloticus linkage group LG12, whole genome shotgun sequence. 
GGCCTGCAAAATCCAATCACCACCTCCTCGCGGTGTCGGCTGGAAACAAGATCCTCTGGAACTTGGCTAACGGTGATGG
>APLE01000910.1/95410-95331 Erythranthe guttata cultivar DUN x IM62 scaffold_7_contig_2, whole genome shotgun sequence. 
GCCTGTGATGATGCTTTATTCAAGAAATGCATTTATGCATTCATGTTGAAAACTCCATTTTGACTAGGACGGTCTGAGGC
>JZQY01000031.1/173164-173396 Nitrospira sp. OLB3 UZ03_NOB00100CONTIG000031, whole genome shotgun sequence. 
GCGTCCCGGTAACGGGACCGTGGGTTCGAATCCCACCCTCTCCGCCATACTAGTGTGTTCGACCTCCGGCCGGTCTCGTAAGAATGTGGCGGCGGAGTCCGCCGTCGATGGTGATAGGGGCCGGGCCCTGTGCAACAGAACTCTGTGAACCCCGCCAGGTCCGGAAGGAAGCAACGGTAAGCGGTCCGTTCTGTGTGCCGCAGGATCACCTGGCCCCGCTAATTCTGGGACGT
>CM000401.2/17156931-17157025 Equus caballus chromosome 25, whole genome shotgun sequence. 
TATGGAATCGCTGGATCATATAGTGGATGTATATTTTGAGAAATTGCCAAACTTTTTTCCAAAGTGCTTGTACTATTTCACATTTCACTAGCAAT
>CM001002.2/3260960-3260256 Mus musculus chromosome 9, GRC primary reference assembly. 
GAGGGGTGTGGGTACAAAACTGAATCTTAAAGGAATTGATGGAAGTGCACCACTAGGAGTGGAGTCTGCAGCTTATTTTTGACTCAAAATGGGAAACCTCACCTGGCCTGGATATGGACAGCATTGACAAGATTGTTAGCTCTTTCTCAATACCATAGATGGTGGTTCATGGTAATTCTTGGTGGAGTAATTTCTCTGGTTAATTCTGATGAGAAATGAGATTCTGTCATGCTAACAAGTTATGAGACACCCACACACACACACAAGCAGTCAGCATCCTCCAATATTTTGAGGGACAAGTGGCATTCAGCTGCCTGATGTTGAACAATTACAGGTGCATGATGCTGTTAGATATCTTGAGCTGCACACCCATGACACTGACTGTCTCAGCATGTGCCTACCTTATGCTGACAGGCATGGGTAACCCGTTGAACTCCATTCATGCTGGGTGGATAGGGGATGGCAATTTTCCGTACGAATGAGGAATTCTCAGTAAATGTCAGTCAATAGATTGTGTTGACCAAGTCCCTGCCCTTTGTACACACTGCCCATCCCTACTACCGATTGGATGGTTTAGAGAGGCCCTCAGATCGACCCCACCAGGTTGGCACCTGGCCTGATCAGAAATTTGAGAAGATGGTTGAACTTGACTACCTACAGGAAGTAAAAGTCATAAGAAGGTTTCTGTAGGTGAACCTGCAGAAG
>JH836513.1/219899-219725 Erinaceus europaeus unplaced genomic scaffold scaffold01225, whole genome shotgun sequence 
AAGACTGTACTTTCAGGGATCATTTCTATAGTTTGTTACTGCTTCCTTCTATGGTATCTAAATACAAACTTCTGTAAGAGCAGGAATTTTTCCTGTTTTAGCAAGCTTTAGTCCCAAGAATAGCAGACAGTAGTTTGCACATACCTTTTAAAAATGAATAAGGGATATTTTCTAA
>DS562880.1/7595309-7595616 Cavia porcellus supercont2_25 genomic scaffold, whole genome shotgun sequence. 
AAATGCTGTATTAGCTGGCTATGGCTTCTGTCACCCCACTGATTGTCATGGCTGATTCTGCTGATCTGTCTAGGTGGGTGACCCCTTCCTCCTTCTCCCTCGCTGCTCCATGTGTATCTCTCCTGAAGCTATGTACTCAGTGGAAGAGAAAGATCATCACTGATAGAAGAGGACACTTTCCTCAGTCAAAGGTATACAAGTAGCTGTACTCCCCTACTAGAACTTCCAAAAAAGCTCTCAAAAAGTCATATACTTGCCAGGGTTACAGCTCAGCAGCAAGGCACCTGCCAGGCAAGCATGAGGTCCTG
>CCCW010013542.1/2343-2238 Brassica napus, WGS project CCCW01000000 data, contig: 30646 
AATCCGTGGTGTGGACATTCTCGCTGGAAAAACCTAAATCTAATCCACGTATCTTTGAAGGACTCTCCAGCCTTCTGCGAGAATGTGGAAATTTTGTTCCGAAGTT
>Y11506.1/699-3910 Pamaria palmata 5.8S & 28S rRNA genes, ITS1, ITS2, IGS 
GGATCTCAAATCAGACAAGATGACCCGCTGAATTTAAGCATATAACTAAGCGGAGGAAAAGAAACTAACAAGGATTCCCCTAGTAGCGGCGAGCGAAGCGGGAACAGCCCAAGATGAAAATCCCTTCGGGGAGTTGTAGTCTGAGTGTCCTTGGGTGGGTCAGTGCGGGCAAGTCTTCTGGAATGAAGCGCCATGGAGGGTGAGAGCCCCGTCCATCCCGCACAGGATCCATTCGTACAAGGACGCTTCAACCGAGTCGGGTAGCTTGGGAATGCTGCTCTAATTGGTGGTAAATCTCATCAAAGGCTAAATAGTGGTGGGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGGAAAGAACTTTGAAAAGAGAGTGAAAAGCACTTGAAACCGTCACGGGGGAAGCGGATTGCGTGAGTGATGGTGTCGCTTGTTCAGCGCTTTATTGCGTGCATTCTGGCGGCGCCGTGCCGGCGTGGCTGGCTGGACTGTGATTTTGACAGTCTCGGCTGGTGAGGGCTCCCTCGTATGAGGTGAGGACGCGGGCAAAATGACGCAATACGACCCGTCTTGAAACACGGACCAAGGAGTCTAGCACGGCTGCGAGTCGAAGAGTGATTAAACTCAAGGGCGCAGTGAAAGCGAAATTATAAGCAAATTGGGGAGGCGTTGCGTTTTTAACAAAATGTCCTACCTCGAGCATTTGTGCTGGGACCCGAAAGATGGTGAACTATGCCGGAGTAGGGCAAAGCCAGAGGAAACTCTGGTGGAGGCTCGTAGCGATGCTGACGTGCAAATCGCTCGTCGAACTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCTCTCAGGATAGCGGGCCGACACGCGTTTGTTGTTTTGTGCGGTAAAGCGAATGATTAGTGCATTTGGGGTACGAAGTACTTCGGGCGATTCTCAAACTTTAAATGCGCAAGGGGGTGGCTGCTTAATTGAGCCTACTCTTTGAAAAACGTCGGCCCTGTGGGCCACTTTTGGTAAGCAGAACTGGCGATAAGGGATGAACCTTAAGCGCGGTTAAGGCGCCTCATTACCCGCTTATAGACCCCACAAAAGGTGTTGATTCATATAGACAGCAGGACGGTGGCCATGGAAGTCGGAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATGAATTAGCCCTGAAAATGGATGGCGCTAAAGCGGGTAGCCGACACCGCGCCGTTCCGGCGAGACGAGGCCGGGATGAGTAGGAGGGCGTGGCGGTCAGTGAAGCAGGCTAGGGTGCAGACCCAGCTGAAACGGCCGCTAGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAGCGAGATCCTTGAAGGGCGAAGCGGGGAAGGGTTCCACGCAAACATTGATTGGGCGTGGGTGAGTCGTTCCTAAGCCGAGTGGCAATTGCTAAGTAGCGGCGAAAGGGAAGCGGGTTAAAATTCCCGCACACGGATATGGAGGCGGCGACGCAAGCAGAGGCGAATACGCTGGCCGAGGCGCTGGGCAGAGTTGTCTTTTCTGTTTGACCGGCATCGCGCCGTGTGGAATCCGCTTATCGGGAGAAACACGCGCGGGTATGGGCAGAGCGTCAAGTTTTTTTTGGCGTCCAGCTCGCCTCGGACGGCCCCTGAAAATTCGCCCGCGAACTTTAAAAATTTCATGCTGTGACGTACCGATATCCGCATCAGGTCCCCAAGGTGAACAGCCTCTGCTCAATATGAACAATGCAGGTAAGGGAAGTCGGCAAAATAGATCCGTAACTTTGGGAAAAGGGTTGGCTCTAGTGGGATGAAGGTCTTCAAAGGGGGCTTCGCTGTGCTTGGCGTCTGACGGGAGTGGCTAGCTTTCGGGCTGGATGCTTCTGTTGGATTCCTTGCGTGGGGGATGTTTCTCGCCTTCAGCATATCCCAGACTAGAACTGCAACGGGCAAAGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGAAGGCCGTGGCCGGTGTTGACGCAATGTGATTTCTGCTCAGTGCTCTGAATGTCAAAGTGAAGAGATTCAATCAAGCGCGGGTAAACAGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCTACTGTCCCTATCTGCTTCTAGCGAAACCACAGCCGAGGGAACGGGCTCGGCGGAATCGGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTATTCTAATTTTGTGAAGCAAGTTAGGAGGTGTAGAATAGGTGGGAGCTTCGGCAACCGTGAAATACCACTACTCTTAATCTTGCTTTACTTAGGGCGTGAGGCTGTACGGCCGCAAGGCTTGCTTATTGCATCAAGCGTGATTCGTTCGCGTGAACAGCGCGCCCAACACATTTAGGAGGGGAGTTTGGCTGGGGCGGCACATCTTCTACAAGACAACGAAGGTGTCCAAAGATAAGCTCAGTGAGAACAGAAATCTCACGTAGCGCAAAAGGGTAAAAGCTTGTTTGATTTTGATTTTCAGTGTGAGTTGAAAACGCGAAAGCGTGGCCTATCGATCCTTTCACGATTCGAGATTTGAAGCGAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCGGCCAAGCGTTCATAGCGACGTCGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGCGAAGCAGAATTCGCCAAGTGTCGGATTGTTCACCCGCCAACAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTATCCTACCGATGAGTTGTTGCCGCGGCAGTAATATATGGCAGTACGAGAGGAACGCATATTTCACACCACTGGTTCATGCAGCTGCCTGAGCAGGCAGTGCTGCGAAGCTACCGTGTGAATGATCAGAATAGCTGAGAGAGTCTAAGCTAGGATCGGTTCTGCTCAGCGGCGACTTATTTGTATCCGCCTCGACACTGTGTACAGATAGCCTTCGGGCGAGCACCATTGGGCGTAAGCTTATCGTCGTGCGTTTTAGCGGATGTAAAATCACCTGCAGATGACTGGGTTGGGACTGGAGCGTGTACAGCGTTGAGAGATCTTGTTATCTCGATTCCTTGAGCGTATCTGAGTCCTTACGATTTGT
>GL876983.1/220883-220724 Magnaporthe poae ATCC 64411 unplaced genomic scaffold supercont1.18, whole genome shotgun sequence. 
CACCGCCCGTCGCTACTACCGATTGAACGGCTCAGTGAGGCCTTCGGACTGGCCCAGGGAGGTGGGCAACTACCACCCAGGTGCCGGAAAGTTGTACGAACTCGGTCGTTTAGAGGAAGTAAAAGTCGTAACAAGGTCTCCGTTGGTGAACCAGCGGAGG
>GL897030.1/4179803-4179625 Mustela putorius furo unplaced genomic scaffold scaffold00133, whole genome shotgun sequence. 
AGCTTTGTGTAGTGGCAGTATCGTAGCCAATGAGGTTTATCCAAGGTGCAATTATGGCTAATTGAAAATATTTTTACCAGGCCCCAAAGAAATCTTGTACCCATAAACAATCACTCCCCATCCCTCCCACAGACACTTATTGGCATGCAGAGTTTTTAGCTCCATATCCAAACAACATG
>AFTD01079003.1/14897-14834 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
TCTTGATGATGCACTTCCAATAGATCCTTCTGACCCTCCACTGTGGACTCTCCATTCCACAAGG
>CM007654.1/638658-638533 Prunus persica cultivar Lovell chromosome G4, whole genome shotgun sequence. 
TACATAACGAGGGACAGTTTGTGTGTCTCTTGGATTGAGAAGAATAGCGAGGTAGAGTGAAAAGGCCGAGCCATCGTTTCGGTCGTCATTATTTGGATTGGCGATTCGATTGTTTCTCGTCCACAT
>AASG02044696.1/921-990 Ricinus communis cultivar Hale ctg_1100012308131, whole genome shotgun sequence. 
CGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATAAGCGGAGGAAAAGAAACTACCA
>KB671965.1/368135-367938 Anopheles epiroticus strain epiroticus2 unplaced genomic scaffold supercont1.71, whole genome shotgun sequence. 
ATCAATACAACTCTAGTAGCGTAAGGATGCGAGGTCTTTAGAAGTATAAAATAAGCTCGTCTTAGCTACTCCTATTTGTCACCATCGTACAGAGTGGTAACATATCTCCTAACACCTGAGCTTGGGTATAAGGAGAATTTCTTATAGAAGTGCCCGGTAAGGGCAAGCCAACTTAACTAAATGTTTCAAATGAGAGAA
>URS0000D6A915_12908/1-80 unclassified sequences skipping-rope RNA 
ATTAAATGAGGTGGACAATGGCATCCACGCACCTATATTGGTTAAAAGAGATGAAAGTACAGCCAGACTTTCCATTTAAT
>FR902120.1/11240-11312 Clostridium sp. CAG:914 genomic scaffold, scf4 
TTGATTGCTCAACCGCACGAAAAAGGTATATAAGTAGATTTTTCTCACCTTATAGGCGAGTCTTAAACAAAAT
>CM000941.1/117493038-117492965 Anolis carolinensis chromosome 5, whole genome shotgun sequence. 
CGATGATGATGATGATGATGATGATGATGATGATGATGATATCATCATCATCATCATCATCATTATCTTTATTT
>AAGD02001768.1/1-584 Caenorhabditis remanei strain PB4641 contig453.2, whole genome shotgun sequence. 
TCCGGACTCCAGGGATCCGAACGTCTAATTAAAACAGAAGTGACCAGATGGTCTTGCGGAAGTTGACTTACAGTGATTCTGCCCCAGTGCTCTGAATGTTAGCTCGTATTAATTAGAGTAAGCGCGGGTAAACTGCGGGAGAAACTATGACTCTCTTAAGGTAGCCAAAGGCATCGTCATTAAATTGTCACGCGCATGAATGGAATAACGAGATTCGTACTGTCCCTAACTACTATTTAGTGAAACCACAGCCAAGAGAACGGGCTTGGCTAAAGTAGCGGGTAAAGAAGACCCTGTTGAGCTTGACTCTGGTTTGACATTGTGAAGAGTCATGAGAGGCGTAGCATAGGTGGGAGACTTCGGTAGACAGTGAATTACCACCACTTTCATCGACTCTTTAATTATTGGGTTGAAAGAGAATACATCCGGCCCGTAGTAGGTCACGGACATAGATCTCGCTGAGATCTACATTTTGGTATATTTTTCAGGTCATAACACTGAGTTTGAAGCATTTACGAGCCGGCCCAGGTCGACCCGGTTTGCAAATATGTTTTGAACTAATTTTCAGAATCCAAATGAGCCGT
>URS0000D6BD91_395494/1-79 Gallionella capsiferriformans ES-2 int-alpA RNA 
GCCGCACCTAGTCCGTGCTTAATTACCACGGGCGAAAGCACAGAAACCCTTGCTGTGTTGGTGCGGCTTCTATTCAGGG
>AZRA01000138.1/15527-15395 Sphaerotilus natans subsp. natans DSM 6575 X805_138, whole genome shotgun sequence. 
CCGAAGGGTCGCTAGGGTTCCGAGGCCTACCATGCGGCAGGCCTGTCTGGTCCGAGAGCGACCGGCCTCAAGTGCCCGCGGCAGCTGCCGCGACGGCACTCAGGCTCCACGGCGGGACAAAAGCCCGGGAGGA
>MJEQ01005736.1/39329-39916 Nicotiana attenuata strain UT scaffold05736, whole genome shotgun sequence. 
TTGTGTATTTTGTTAAGCAAAATCGTCTAAGTCATTTCCTAGGGTGGGAAAATCATTTTGGCCAGGGAATCGGGGAATTCTTTGTCTTGGCCATAGGGTTGGCTATTGTGTTCTTGTATTCACATATTAATACGAGTTGGGAAGAAATTCCTGTATATCGTGTGTGCCTTTTTACTGTTTATGCTGCCTATTTCGTTCTAAGTTTCAAACGTCCCTAAAATAAAACTAAGTGTTGGAAAGGCTGAAGTCAAGGCTGGGCTTGACTGCCGCACGGAGGTGAACCTCGAGTAGAAATTTGAGTGACATAAATCACCCCTGTGACACCTACCATGGTGGTGACGGGTGACGGAGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAGGAAGGTAGCAGGCGCGCAAATTACCCAATCCTGACACGGGGAGGTAGTGACAATAAATAACAATACCGGGCTCTATGAGTCTGGTAATTGGAATGAGTACAATCTAAATCCCTTAACGAGGATCCATTGGAGGTCAAGTCTGGTGCCAGCAGTCGCGGTAATTCCAGCTCCAATAGCGTATATT
>MHFR01000003.1/41901-41805 Omnitrophica bacterium RIFCSPLOWO2_12_FULL_44_17 rifcsplowo2_12_scaffold_1117, whole genome shotgun sequence. 
CATGTAGTGTGGCGCAAATCGAAAGGTTAGGACGCAAAGCTTTAGAGCCTAAACCGACCGGGCAAAAACCCGGTAGGCATGGTTGTCAGTTGCCGAA
>AF137379.1/97379-97053 Nephroselmis olivacea chloroplast DNA, complete genome. 
GGGGTTGTCATGGAATCGACGTCTCTTCTAAGAACGAAAGGTTAAAGCAGGTCGAGGTCGAAGATGGACTCGTACTCTCCACTTCATTGCTTGATTGCATGCTAATCAGATTCTTCCTTTCTCTCGCCGGGTAGCCGTTGCTGCTTAAGCGAGTTTCTAGTGCCACTTTGTCACTAGTTTGTATTATGAGTTTCACACTCACTTCAATGACGGTGATAGATACTACATATCACTCCTGCTTAGAGGGTCATCTAAGCTAAACCATGTGAATATAACCTTTCGGGCCTCGAGAGACGGAAGTGAGTTCAATTCTCACCAACTCCACCA
>FO117623.1/2019842-2020021 Blastococcus saxobsidens DD2 complete genome 
GACCGAACACCGCCTAATCACCGCGCGGCGTGCAGTCCCGGCGCCCGGGGTGTACCGGGGACCCACCGCAGTTCTGGGGTGAGTTCTCCCGCGGCCGGCTCGCCGGTGCGTGGGGGATAGGGCCAGTCTTCCCAGCCCGAACCCGTCAGCTAACTCGGTCGGCGGTAGCTGAGGAAGAAA
>JH971392.1/893535-893437 Agaricus bisporus var. burnettii JB137-S8 unplaced genomic scaffold AGABI1scaffold_8, whole genome shotgun sequence. 
CCTATCTGATGATACAAGCGCAATCGCATAGTTCACGCTGAATCAAAAGTGTTGACAATCATGCATCTTTACGTCTTTCGCTCCTATCTGACTCATCTC
>AZIM01000372.1/334250-333937 Ophiophagus hannah scaffold373.1, whole genome shotgun sequence. 
GGATGTGAGGGTGATCTGTCTGTGACATCTGTCACCCCATTGATACCACAGTTAATTCAGTTGATCTGGCTAGCTAGGCAGGTGTCCCCTTCCTCCGTTACCACTCCATTTTTATTTTTCCATGAACTGTGTGCTCATGGAAGAGACAACTAATTTAGGGAGGAGTGTATCAATCTTTAGGCAAGGGTATGATATCCGTGCTCACCTTCTAGAACCGACAAACAAACCTTTTCCTCCATCCATTTGCCTGTTCGTTTCCCAGGCTTGAGATATAACAATGCATCTCAATGGCTTTGTTTGATCAGCAGTGCTTG
>CAJI01046266.1/316-1 Cucumis melo, WGS project CAJI01000000 data, contig: 46266 
AATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTGAAGCGCGCGACCTATACCCGGCCGTCGGGGCAAGAGCCAGGCCCCGATGAGTAGGAGGGCGCGGCGGTCGCTGCAAAACCTTGGGCGTGAGCCCGGGCGGAGCGGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTTGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAGGAGACGGGGGAAACCCGTCTGATAGCGCGAC
>CP013111.1/5040245-5040340 Bordetella sp. N genome. 
ACGCTTGAGGAGCGTTGCGACGGATCATTCCGCCAGGCTCAAGCATTCCAGGGTATGCCGCGTTCGCGCGGCACCATGAAACGGCGCTCACCTTAG
>LFJF01027493.1/1808-5852 Macrostomum lignano unitig_27548, whole genome shotgun sequence. 
TGACCTCGGATCAGACGTGATTACCCGCTGAAATTTAAGCATATTATTAAGCGGAGGAAAAGAAACTAACAAGGATTCCCTAGTAACGGGCGAGTGAACGGGAAGAGCCCAACACCGAATCCCTTGGCGCAAGTCAACGGGGAAATGTGGTGTTAAGGTAGCCCTTCGTGTCAGTCTAGGCGTCTCAAGTCCACCTGATTTGTGTGCTCAAGCCCAGAGAGGGTGTAAGGCCCCGTAGAGACGCTCCGACTGATTCCTGGGGTGTTTACCTACGAGTCGCTTGTTTGGGAATGCAGGCCAAAGCGGGTGGTAAACTCCATCCAAGGCTAAATCTGGCACTGAGTCCGATAGCGGACAAAGTCCGATAGGCGGACAAGTACCGTGAGGGAAAAGTTTGAAAGAACTTTGAAGAGAGAGTTCAATAGTACGTGAAACCGCTTAGAGGTTAAACAACGGACGGATGGAGCTCATAACTGGCCTGAGCTTCAATCAACTGTGACGGTGGCTGGACGAGGCTGGAGCGAGTTCGGATCTCTTCTTTTGGGACGGGCAGATCTGCTCTTTTGGTGACGCTCGGCGTTCGGTTGGCTATCAGCTCCTGACATCGGTGCCAATCTTGTCCCTTGGTGGCCTTCCGCCACGACCACGACACTGGCTACCCGCGGCTGGGGTAAGGTGACAAACTGCTTCGGCAATTTTGTGTATAGACCCGCGGCGTCGTCGGACATGGTTTTGGCCAGGACGTCGAGCTTGGCGGCGCCCGCTCCTTGTGTGGCTCGCATGTTTGGCTATAGCTTGGCTGCCGCCGATGCTTGCACTGGACAACCAGTACAGGTGGACGGTTGTGGTCTATGTCTCTAGTTGGCCTCTGCGAGTTTGGCGCCTTATAGTCTGTGGTGTACTTGTGGGTAGACTATCCGACCCGTCTTGAAACACGGACCAAGAGTCTAACATCTGCGCTGAGTCATGGGGATTTCCTACACGACCAAGTGTGCGCGCGAGTCATGGGGGGATTCTACGAAACCAAAGGCGCAGTTGAAAGTAAAGGCCTGCTTCTCGTAGGCTGAGGGTGGGATCTCGTGCATTCGCGAATTGGCGAGCGCACCAACCGGGCCCGTTCCTATCTGTCTCTGTCAGTGGGGCGGCGCAAGAGCGTACACGTTGGGACCCGAAAGATGGTGAACTATGCTTGCGCAGCTCGAAGTCAGTGGAAAACACTGATGGAGGAGCGCAGCGTTTCTGACGTGCAAATCGATCGTCAAACGTGAGTATAGGGCGAAAGACTAATCGAACCATCTAGTAGCTGTTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGCACTCGGGAAACAGTTTTATCCGGTAAAGCGATGATTAGAGGCATTGGGGTCGAAACGACCTCGACCTATTCTCAAAACTTTAAAAATGGTAAGATGCTCGTCTCGCTTTAATTGGAGGCGGGCTTCACCTCTCTATAAACGTGAATGTGAGTGCCCAGTGGGCCATTTTTGGTAAAGCAGAACTGGCGCTGTGGGATGAACCAAAACGCGCGGTTAAGGCGCCAATGCGGACGCTCATTGAGACACCACAAAAGGTGTTGGTCGATATACTGACAAGCAGGACGGTTCGGCCATGCGAAGTCGGAACCCGCTAAGGAGTGGTAAGCAACTGCACCTGCCGAATCAACAGCCCTGAAAATGGATGGCGCTGGAGCGTCGGGCCTATACCGTGCCGTTGGCAGGCGAAGCAGACAAATAATCTGTGTGGATGTCCCCAAACGAAGTAGGAGGGTCGCCGTGGTGAGCGCAGAAGGTGCGGCCGTGAGGCCGGCTGGAGCCGCCACGGGCGCAGATCTTGGTGTAGTAGCAATTACTCAAGTGTGAGAACCTTTTGAGGACTGAAGTGGAGAAGGGTTCCATGTGAACAGCAGTTGAACATGGGTCAGGCGGTCCTAAGCGATCTCGGTAACTCCGTACACTAGACGAGGGTGACAACTATCACTTGAACTAATACTGTGAAGTGTTATAGCCCTCCGGAGCGAAAGGGAATCGTGTTAATATTTCACGACCCTTACCGTGGAGATCGCCCCTTTCGGGGGGCAAGTGCGGTAACGCAAACGAACACAGAGACGTCGGCTGGAGCCCCGGGAAGAGTTCTCTCTTTTCTTTGTAAGGAGCCGTACCCCCTGGAATCGGCTTGTCCGGAGATAGGGGCGTGGCTTCCGTAAAGGCAGCGCGCGGTCTTGCGCTGTCCGGTGCACTCTAGTCGGCCCTTGAAAATCTGTGGGAGACAGTGTGATTTTCACGGTAGGCCGTACCCATATCCGCAAGCATGCGTCTCCAAGTGAACAGCCTCTAGTCCTAGAACAATGTAGGTAAGGGAAGTCGGCAAAATGGATCCCGTAACTTCGGGCGAAAAGGATTGGCTCTGAGGGCTGGGGTCGGATGGGCTGGCGTAAGAAAGCTGTTCCGGTGGTGAGGACTGGGCGAGGCTTTCGGGCTTTACTCGGACCATGCCGAGACCAGGCAGTAGACGACGTCAGCTGTGCTTGTCGTGTTTCGGCGCGGCGCGGCAGCTTCGTCCGGCAACAAACAGCCAATCTCAGAACTGGCACGGACTAGGGGAATCCGACTGTCTAATTAAAACAAAGCATTATGCGATGGCTCGTGTGCTCGATGTTGACGCAAATGTGATTTCTGCCCAAGCTGCTCTGAATGTCAAAGTGAAGAAATTCAATCAAGCGCTGGGTAAACGGCGGGAGATAACTATGACTCTCTTAAGCGTAGCCAAATGCCTCGTCGTCATCTAATTAGTGACGCGCTTATGAAGGTGGGGTATTAACGAGATTCCACTGTCCTATCTAACTATCTAAGCGAAACCACAGCGCCAAGGGAACGGGCGCTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACCTTTGTGAAGAGACGCATGAAGAGGTGTAGTATAGGTGGGGAGCGTCAGCGACTTTGAAATACCATACTTTTAATCGTTCTTTACTTATTCAGTGAAGCGGGGGGGGGGAGCGGCCTTCACGGCACTCGTTTCTGCGGTGTTTAAACGGCTGGCCCTCGCGGCCGGCCGTGAACCTTGCTCTGAAGTACAGGTCAGGCGGGGGGAGTTTGACTGGGGCGTGTACATCTGTCAAAAGGTAACGCAGGCTGTCCAAGATGAGCTCAGTCAGGACCAGAAACCTGCGTAGAGCAAAAGGGCAAAAGCTCATTTGATTTTGATTTTCAGTACGAATACAGACGTGAAAGCGCGGCCTATACGCATCCCTTTGATTAATCAGAGTTGATGCAAGGCGGTGTTCAGAAAAGTATCCACAGGATAACTGGCTTTCTCACGCGTCTGCGAGTGCGATGGCGGGCAAGCGTCATAGCGACCGTCGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCAATTGTGAAGCAGAATTCACCAAGCGTTTGGATTTGTTCACCACCCAATAGGAACGGTGAGCTGGGTTTTAGACCGTCGTGAGACAGGTTAGTGTTTACCCTACTTGATGTCTTCGGTCGTTGCCTATGGTAATCCTGCTTAGCTACGAGGAGAACCGCAGGTTCAGACATTTTGGTTTATGTGCTTGGTCGAAAGACCAATGGTGCGAAGCTGACCAATCTTTGACGGCGATTTAAGACCTGAAAGCCTTCTTTAAGTCTTGAATCGCCGCCACGAAACGTGCAACGATACTATCGGTGCCCCTACGCCGGGAGGCAACGAATATACTCGGCCCGCAGAATCCGATTTCGGCGGGCGAGCACTGGCTAAAGCACTCGATTACTGCGTGGCCACACCCGCTGTCTTTGTGAAATTTGCAGTCGGAGGCACAGACACGATTACCACTTGATATTGAGACGTTAGGGGTTTCTATAAATCGTTTGTTAGAGCGACTTAGATTCCGGTCGGGGTGCCGTACTTAGTTGAGCAGTTTCACTTGCGATGCTATTTGAGGGCCTAAGCCTTTTGACGGGGAGATATGT
>LMNA01000001.1/561241-561047 Pseudorhodoferax sp. Leaf274 contig_1, whole genome shotgun sequence. 
CCGCCCGTCTTGGGGGAGTAGCCAGCCTTCGCTTTGTGCGAGAGGGGTTTGCGTCAACAGACTTGTTCGTGCCGTGCCTTGGTGTGCGGTCCGACATGGCGCAAACGGACCACCAGCAGCAGCCTGCAACGGGCGATGCCTTGCCGGGGTTCAAGCGAGACCTTTGACTGCGCAGCTTCTCGTGCCGGGAAGGCT
>ALWZ043544869.1/1192-611 Picea glauca, whole genome shotgun sequence. 
GGTTTGGCATAATCAACAGAGAAAGAAGACCTTGTTGAGATTGACTCTAGTCCAACTTTGTGAAATGAATTGAGAGTTGTAGAATAAGTGGGAATCATTTTTGACACAAATGAAATACCACTACTTTTAACATTATTTTACTTATAATTTTGTGGGGCGAAGACGGGGCAGTTACCCTATTTTTGGCCTTAAGTCATGTTTCGATGGGTTGATATGGGCGGAAGACATTGTAGGTGGGGATTTTGGATGGGGAAACACATCTATTAAAAGATAACATAAAATATAATTTGTGTAGATAGAACATTTGTATTTGGGAGATCCTAGTGCACAACCACCCTTATTACCTTTCCCTCCTAATTTGTAGTTACATCCAATCATTTCTAAATTGAATCTAGTTTCCTCACTTGCACAATATGGATAGACGTGTGAACCCTATACATTATTAAATATTTCAAAACCCCTATCCATGAGCCTATGGTTACATACAAATGGGAAAAAAAAGGTGGATACAAAAATGACACCCATTCCTCCTCACAGTCCTCCCTAGGATCTTGTTGTATCTCATAATGTTGCACACTCCAT
>ALWZ042080687.1/2737-2632 Picea glauca, whole genome shotgun sequence. 
GAAGAATCCTTTATAGACGACTTAAATATGTGACGGGGTATTGTAAGTGGTAGAGTGGCCTTTCTACCACAATCCACTAAGATTCATCCCTTTGTCGCCTCAATTT
>ALWT01066045.1/576-1 Myotis davidii contig66045, whole genome shotgun sequence. 
TGGAGTCCAGGGGGCGTGGGAGGAACGGCCTCTCCAGCTCCCTTTGCTCCGCCGCCGCGTCCCACCGACCCGCCCCCCGAAGAAGCATCGGGACCGCTCAGATTTGCAGTCGGAGCCGCGTCCCGAGGGAGAGAAGGGGCGTGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAATGAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATGAACGAGATTCCCACTGTCCCTACCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGCGGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCTGGCACGGTGAAGAGACATGAGAGGTGTAGAATAAGTGGGAGGCCCCCGGCGCCCTTTCCCTCAGCCCCCTCTCGCGAGGGGGCGGGGAGGGGGGCACGCCGGCCTTGCGGGCCGCCGGTGAAATACCACTACTCTGATCGTTTTTTCACTGACCCGGTGAGGCGGGGGGGCGAGACCCGGGGGGGGGTGC
>APMT01039647.1/25991-25874 Mesocricetus auratus contig039647, whole genome shotgun sequence. 
ATGTTGTATCAGAGAGAATGTCAGCACTCTTCTTGCTAAGTATGAAAAGACCAATGAGCCTAACAGTGTACATTTAAGGCATTGATCCTTACAATGTGGCATCTAACCACTGTTTTTA
>AKHW03004724.1/5683634-5683707 Alligator mississippiensis ScZkoYb_22, whole genome shotgun sequence. 
CAACAAGAAGATGAATGGTAGGCTGGTCACTTTCCTGGGAAGTAAGAGTCAGGAGTTCAAACCCCTCTAGTTGA
>LGKD01319461.1/278-207 Octopus bimaculoides Scaffold40646_contig_8, whole genome shotgun sequence. 
TTACTGACCAAGTGGTTGTGAATGTGCTGCTAAATTGGACTTTCATATCACAGCCTGCTTGGATCAGTAACA
>AACY023405062.1/1217-1321 Marine metagenome ctg_1101668212413, whole genome shotgun sequence. 
AAAGTCGGAATGGGTGTTGAAAGATTACCGACAAGATGAGGGAAACACGCAACCCTCGTTCGATGCGGGTAATTATTCCAACAGTTCCGCATCGATGCCGCTGCT
>BDFN01000945.1/2677-5912 Ipomoea nil DNA, scaffold: scaffold0945, cultivar: Tokyo-kokei standard. 
CGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATAAGCGGAGGAAAAGAAACTTACAAGGATTCCCCTAGTAACGGCGAGCGAACGGGAACAGCCCAGCCTTAGAATCGGACGGCCTTGCCGTTCGAATTGTAGTCTGGAGAAGCGTCCTCAGCGGCGGACCGGGCCCAAGTCCCCTGGAAAGGGGCGCCGGAGAGGGTGAGAGCCCCGTTGTGCCCGGACCCTGTCGCACCACGAGGCGCTGTCTACGAGTCGGGTTGTTTGGGAATGCAGCCCCAATCGGGCGGTGAATTCCGTCCAAGGCTAAATACGGGCGAGAGACCGATAGCGAACAAGTACCGCGAGGGAAAGATGAAAAGGACTTTGAAAAGAGAGTCAAAGAGTGCTTGAAATTGTCGGGAGGGAAGCGGATGGAGACCGGCGATGCGCCCGGTAGTATGTGGAACGGTGAGAGCCGGTCCGCCGATCTACTCGGGGCGCAGACCAGCGAGGATTCGGGGGCGGCCAAAGCCCGGGCCTTTGATACGCCCGCGGAACGTCGTCTCTCGGATCGTGGGAAGCAGCGCGCGCCCCTGGCGTGCCTCGGCACCTGCGCGCTCCGGTCGCTGGCCTGTGGGCTCTCCATTCGACCCGTCTTGAAACACGGACCAAGGAGTCTGACATGTGTGCGAGTCAACGGGCGAGTAAACCCGTAAGGCGCAAGGAAGCTGATTGGCGGGATCCCCTCACGGGGGTGCACCGCCGACCGACCTTGATCTTTTGAGAAGGGTTCGAGTGCGAGCATACCTGTCGGGACCCGAAAGATGGTGAACTATGCCTGAGCGGGGCGAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCGATACTGACGTGCAAATCGTTCGTCTGACTTGGGTATAGGGGCGAAAGACTAATCGAACCGTCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCTGGCGCGAGAGTTCTATCGGGTAAAGCCAATGATTAGAGGCATCGGGGGCGTAACGCCCTCGACCTATTCTCAAACTTTAAATAGGTAGGACGGCGCGCGGCTGCTTCGTTGAGCCGCGCCACGGAATCAACAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGGAAGCCGGGTTACGGTGCCCAACTGCGCGCTAACCTAGATCCCACAAAGGGTGTTGGTCGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTTAAGCGCGCGACCTATACCCGGCCGTCGGGGCAAGAGCTAGGCCCCGATGAGTAGGAGGGGCGCGGTCGCTGCAAAACCTTGGGCGTGAGCCCGGGCGGAGCGGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGGGTCGGGGGAAGCCCGACAGACAGCGCGTTTTGCGCGTGCGCCGAAAGGGAATCGGGGTTAAAATTCCTGAACCGGGACGTGGCGGTTGACGGCAACGTTAGGGATTCCGGAGACGTCGGCGGGGGCCTCGGGAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCCTGGAAACGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCGCACGTCGCGTGGTGTCCGGTGCGCCCCGGCGGCCCTTGAAAATCCGGAGGACCGAGTGCCGTCCACGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGCAATGGAACGCTGGCAAGGAACGGGCGGGCCTTCCCGGGCGTCGAACAGCCAACTCAGAACTGGTACGGACAAGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGTCCCTGCGGATGCTAACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGGTAAACGGCGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTGTCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAGAATCAGCGGGAAAAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGGATAAGTGGGAGCCGAAAGGCGAAAGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCGTGAATCGGAGGCGGGGCATTGCCCCTCTTTTTGGACCCAAGGCTCGCTTGCGGGCCGATCCGGGCGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAGAAGGGTAAAAGCTCGTTTGATTCTGATTTCCAGTACGAATACGAACCGTGAAAGCGTGGCCTAACGATCCTTTAGACCTTCGGAATTCGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGACAGTGTCGCAATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTTTGCGGTTCGGATTATGACTGAACGCCTCTAAGTCAGAATCCGGGCTAGACCGACGCATGCGCTCGTCGCGTCCGTTTGGCCGACCCGCCAGTATGGGGGCCATTTGGCCCCCAAGGGGCACGTGGTCGTTGGGCTAAGCCGTCGTGGCGGAAAGGGGTCACGGTTGGGCCGCGCTTGAATATACAATTGCCGATCGAGCGGGGCGAGCTGAATCCTTTGCAGACGACTTAAATACGCGACGGGGTATTGTAAGGGGTAGAGTGGCCTTGCTGGCCACGATCCTCTGAGATTCAGCCCTTTGTCGCTCCGATTCGT
>JARO02002307.1/4880-4968 Scleropages formosus scaffold2307, whole genome shotgun sequence. 
TTGAGTTTTCAGCTTTGAGAACTGAATTCCAAGGGTTTTTGGATCAAGCTTTGCCCGTGGGACTTAGTTCTTAAAACTGGATGCTCCTG
>BABG01005904.1/1457-1294 Human gut metagenome DNA, contig sequence: In-R_005904. 
TATCGGACGGTGGTGATATTTTCTCGAAAAGTGCTGAAAATCAGGGTGGAGCGAACAGGACGTTCGCGACAGGCGGACGTTGCCATGGATGGCAACTGGAGCCGTGCCCGTGCGGATTAGAACCGATATCTCACTTTTCGTCAGAAAATTCCCACCGGGAGACC
>MHKX01000006.1/12218-16044 Candidatus Liptonbacteria bacterium RIFCSPHIGHO2_01_FULL_57_28 rifcsphigho2_01_scaffold_11526, whole genome shotgun sequence. 
ATGGTTGGCATTAAGGGCGCATGGTGGATGCCTAGACATCAAACGACGACGAAGGACGCAGCATAGCGGCGATACGCCACGGTGAGGTGCGGAGCAACCGTTGACCCGTGGATTTCCGAATGGGGCAACCCTGTTGAGTAAACCTCAACAACCTTCGCAAGAAGGAGTCACACCCGCTGAAGTAAAACATTTCAGTAAGCGGTGGAAACGAAAAAAAGTCCGCGCAAGCGGAAAAATTCCCCAAGTAGCGGCGAGCGAAACGGGAGAAGCCTAAACCACATGTTCGCAAGAATGCGTGGGGTTGTAAGGGAGGAACGCTATCACTTATAACCGAGAGCCGGGAGCGATCCCGGCATATCGGTTATGGGTGAAAAGGAGGAGTTACAAATTCATTTGCTAGCCGAAGCGTCCTGGAAAGGACCGCCAAAGTGGGTGATGGCCCCGTAGGCGAAAGCAGATGAACTTCTTAGTTTCTTTTCTTGAGTAGCTCGAGGTAAAACAGCTTCGAGTGAATCCGGGAGTACTATCTCCTAAGGCTAAATACGTTTGATGATCGATAGTGAACTAGTACCGTGAGGGAAAGGTTAAAAGCAGGCCGGTGAGGCCGTTGAAATAGATCCTGAAACCATGCGTTTACAAGGAACTGACGTCTTATGAGCCCGCCGCAAGGCAGGCCCCGGACTACAGTGTGCCTATTGAAGAATGAGCCAACGACTTTAGGTGTGCGGCAAGGATAAGTCCTCTCGGGGACGCATCCGTAGGGAAACCGAGTATTAACGTGCGATTTAGTCGTACACCTAAGACCCGAAGCCGGATGAGCTTGCCTTGGCCAGGTTGAACTCCGTAGAAATACGGAGGGAGGACCGAACCGGTAGGTTGTTCAACACCTTCGGATGAGCTGAGGTAAGGAGTGAAAAGCTAATCGAATTCGGTAATAGCTGGTTCTCTCCGAAACAGTTTTTGGACTGGCGGCGTAAAGTAGCGGGTGGGGGCTAAGCTCCATGTTCGCGAGGGAAAAAGCCCAGACCATCAATTAAGGTCCCCAAGTGCGTGCTAAGTGTAAAAGGCAGTGTTGTGCCATAGACAGATAGGAGGTTGGCTTAGAGGTAGCCACCCTTTAAAGAGTGTGTAACAACTCACTATTCGATCGGCACGGCGCGCCGAAAATGTATCGGGGCTAAGCACGCCACCGAAATTATGGGTTCGTATGTCCTTCGGGACGTATGAGCGGTAGGAGAGCATTCCCTTCTGCTGTGAAGCAGGACCCGCGAGGGCCTGTGGAGCGTAGGGAAGAGAGAATGTTGGCATGAGTAACCACAATCCCAATGAGAAATTGAGAGCCCGAAAATCCAAGGTTTCCGTGGCACTGGCAATCAACCACGGGTTAGGCGGTCCTAAGGCGATGGCGAAAGCCGCAGCTGATGGATAGCCGGTTAATATTCCGGCCCAGCCATGCGATCATAGCGAAGTGCGAAGGAAAAAGACGGGAGTGCCTTATTGGTTTGGCATTTATACTCCAAGGCGCAAGCCGGGAGCGTATGAATGTCCGGTTTTACCGGACAAACTTCCGAGAAGAGCCTTCCGAGAAAAGCTTCGTGAAAGCGAGCGCATGGTTTCCGTACCGTAAACCGACACTGGTGGGTGAGGCGAGAAGCCTCAGGGTAACGAGTGATTCATCTTTAAGGAACTCGGCAAAAAAGCGGCCGTACCTTCGGTATAAGGCCTGCCCATCGCAAGATGGGCCGCAGCGAAAGTCTCCCTGGCGACTGTTTACCAAAAACACAGCTCCCTGCAAACTCGCAAGAGGACGTATAGGGGGTGACACTTGACCGATGCGAGAAGGTTAAACTTGGCAGTGGTGTGCAGCAATGTGCATTGCCGACCGAGCGAAGCCCTCGTCAATGTCAGCGGTAACTATAACCGTTCTAAGGTAGCGCATTTCCTTTCCGGGTAAGTTCCGGAGCGCACGAAAAGTGTAACGACTGGGGAACTGTCTCAAAGATGAGCTCGGTGAAATTGCGATTCCCGTGAAGACGCGGGATACCTGTAGCGGGACGAAAAGACCCCGGAAGCTTTACTGCAGCCTGGTATTGATTTCAGAGTTATGATGCGTAGCGTAGTGGCGAGCCTTTGAAGCGTCCCTTTCGGGGGACGTGGAGGCGACAATGAAACAGCCATCTTCATCACTTTGACGTCTCACCGGGGAGGGACCTTAAAATGGAAACCTCCCTGGGACAGTGCTTGGTGGGTAGTTTAAATGGGGCGTTTTCCTTAACTTGACAATGCTTCCGTGTTGTCAGAAGGGGGACCCGATCCAGTCTTAAGATTGGAGGGAAAAATCTAATGTATATGCTGGAACATCCGCGGTATCAGTTTGTACCTTTGTCGAAAAGGTGAAAATCAAACTGTGGCGTCCGATGAAAATCGGGCCGGCGGACAATCAGCAGGCAACCTCGACGTAAGAATTGAGGAAGTCCTCAGAGACTATCAGTTAGAGCGGCGCACTACCCGCGCGCCGTATGATATAGTCCGAACTGCATGGCGACATGCAGGCCGCGCAAGCGGCACCTAAATACCATGAGATCAAGAATCATTGAAGAGCTTAAGAAACATCTGAAGCTTACTGCAATGCAAAGATCTCTTCTCGTAGGCCTGCTTTTAGGCGATGGCCATCTGGAACTACAGAGTGGTGGCAGAGAATATCGTCTGAAAGTTGAACATGGAGTTAAGCAGAAGGATTATGTGGATTGGTTGTACGAACAATTCAAAGATTTTGTTCGTACGCCGCCGCGTATCAAGACCAGGATTGTAAAAGGAATAACGTGTAAGAGCTACGGCTTTACCACTTATTCCTACGGATCATTTCGTTTTTACGCCCAGCAATTCTACGTTGGGCGAAAGAAAGTGATCCCGAAACTGATCTCCAAAATGCTTGACCCTAGAGCGTTGGCAATATGGTTCATGGATGATGGATCTTTCAAGTCCGTCAGCCACAAGACCTATATAATCCATACGCATGGTTACGAGAAGAAAGATTTGGAGCGTGTAAAAGATGTGCTCCAAAAGAAATTCGGTATTATCGTAGGACTGCATAAGCAATATGATCGCTGGCGAATCTACATAATGAGTGATTCGGCAACGGCGTTCAGAAATCTTGTCAGTGCCCATGTAATACCGTCAATGCGGTATAAGTTAGGGAACATCAAGCCTAAAGAGTAACGGAGGAGTTTATTAAGGTTGGCTAGGCCCGGATGGAAACCGGGCGCGTCGTGTAAAGGCATATGCCAGCTTGACTGCAAGACCTACAAGTCGCGCAGGCGCGAAAGCGGAACTTAGTGACCCGACGATTCTTTATAGAAAGGTCGGAGACAACGGATAAAAGCTACTCCGGGGATAACAGGCTAGTCTGGTCCGAGCGTCCACAGCGACGACCAGGCTCGGCACCTCGATGTCGGCTCGCCCTAGCGCGGGGGTGAAGAAGCTCCCAAGCGTTTGGCTGTTCGCCAATTAAAAGGGCACGTGAGCTGGGTTCAGACCGTCGTGAGACAGGTTGGTCTCTATCTGTTACAGGCGTTTAATCACTTGAGGGGAGTTGACCCTAGTACGAGAGGACCGGGTTGAACATACCTCTGGTCTACCGGCTTTGGCACCTGCTGAAACGCCGGGTAGCTATGTACGGAAGGGATAAGTGCTGAAAGCATCTAAGCACGAAGCCCACCCCAAGATTAGGTGATATGGTCTCGTCGCAGACTACGACGTTGATAGGCTCTAGGTGTAAGGATCGCAAGGTCTTCAGCCAAGGAGTACTAATGACCCGCCAACCATCC
>MDEO01000036.1/702348-702384 Mesorhizobium sp. UASWS1009 41, whole genome shotgun sequence. 
GGTCTCGCCGGAAGCGAGACCGCCGAACATGAAGGAG
>MEQJ01000121.1/2993-1439 Bdellovibrionales bacterium RIFOXYD1_FULL_53_11 rifoxyd1_full_scaffold_587, whole genome shotgun sequence. 
AAACATGAGAGTTTGATCCTGGCTCAGAGCGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGTGAAAGGGGGCAACCCCGAGTAAAGTGGCGTACGGGTGAGTAACGCGTAGGTAATCTACCCTGGAGTTCGGAATAACCTGCCGAAAGGCGGGCTAATACCGGATAGAGCGAGGGAACCTGTAAGAGGGTTTTTCGGGAAAGGGAGCTCGCAAGAGCCCTTGCTCCGGGATGAGCCTGCGTCCCATTAGCTAGTTGGCGAGGTAACGGCTCACCAAGGCGATGATGGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAAACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGACGGAAGTCTGACGCAGCGACGCCGCGTGAGTGAAGAAGGCCTTCGGGTTGTAAAGCTCTGTCACACGGGACGAACGGCGAGTGGGTTAACAGCCCATTTGATTGACGGTACCGTGGAAGGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTGCTCGGAATTATTGGGCGTAAAGGGCAAGTAGGTGGTCTCATTAGTCCGGGGTGAAAGCCTTGAGCTCAACTCAAGAAGTGCCTTGGAAACGGTGGGACTGGAGTCCTGGAGAGGGTCGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGAGATCGGGAGGAACACCAGAGGCGAAGGCGGCGGCCTGGACAGGAACTGACACTCAACTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGGGTACTAGACTTGGCGGGATTTGACCCCTGCCGAGTCGGAGCTAACGCGATAAGTACCCCGCCTGGGAAGTACGGTCGCAAGACTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGATCATGTGGTTCAATTCGAAGCAACGCGAAAAACCTTACCTGGGTTTGACATCCCCGGACAGCCGTAGAGATACGGTTTTTGTAGCAATACAACCGGGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTGGTGACATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTGTCCTTAGTTGCCAGCATTAAGTTGGGCTCTCTAAGGAGACTGCCGTGGTTAACACGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCTTTATGTCCAGGGCGACACACGTGATACAATGGCCGGTACAGAGGGAAGCGAAGTGGTGACACGGAGCCAATCTCAAAAAGCCGGTCTCAGTTCGGATTGGAGTCTGCAACTCGACTCCATGAAGGTGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGAAGCTGACTCAACCAGAAGACGTCCAGGCTAACCGTAAGGGGGCCGGCGGCGAAGGTGGGGTTGGTGACTGGGGTGAAGTCGTAACAAGGTAGCCGTAGGGGAACCTGCGGCTGGATCACCTCCTTT
>MNFI01000130.1/10369-10188 Gemmatimonadetes bacterium 13_1_40CM_4_65_7 13_1_40cm_4_scaffold_3525, whole genome shotgun sequence. 
CCGTCCTAGACTGATTCGGGATCCACGTTTGCGAACGGGGATTTACGGAAGCCGGTGCGAATCCGGCGCGGCCCCGCCACTGTAACGGGCTGTTCATCGCGGCTCAGAGCCACTGGGGAAACCTGGGAAGGCGAGCCGCGTAGCCCGAAGCCAGGAGACGTCTTCGTTCGCGCCACCAATCA
>MLAY01000007.1/1262-1155 Marine bacterium AO1-C Bin2_contig__6B_len_915437_cov_89.8812_ID_11, whole genome shotgun sequence. 
GCCGGTGTGGCGAAAATGGTTTACGCAGCTCAAGTTAGTTTGATTTGCGGCCAAGGCCTTGGGAATCGTGGCCTGTAAGGCGTGGGGGTTCGAGTCCCTCCATCGGTA
>ANKR01270450.1/11566-11419 Myotis brandtii contig270450, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAAAATATTATCTATCTGCTGCAAAGCAAGCTGTCTAGAATGATATAACTAAGGTTATCTATAAAATAATGAGGAGTTTCAAAATAAAATATTT
>DS022282.1/1685882-1685929 alpha proteobacterium HTCC2255 scf_1100007007381 genomic scaffold, whole genome shotgun sequence. 
TAAGGCTTACAACGGCTACCTGAAGTAAGTTGACATAAAAACGGAGCA
>EU420138.1/1-299 Bat coronavirus 1A strain AFCD62, complete genome. 
GACTTAAAGATATAATCCATCTACAGATAGAGTGTACTCTTCTAGACTTTTGTCTACTCCCCTCAACTAAACGAAATTTTTGCCATATGTTTATGGCTAATTGAAATTTCAGTCGGTTGTTAACATACTTGCACAAGTGTCGTGCATGTCGCCAGTCCCTCCTTTCAGTTCCGTCTGTTAGGTATACTAGGTGGCTGCCTTTGGTTCAGTTCCGTCTGGCCATTGTGTGGATAGTACGTTCCGTCGTGCTTGAAACCGATAACTAGCAGGTATGTCGTCCAACCTTGTGACATTGGCCT
>LSGP01000020.1/293217-293477 Anaerosporomusa subterraneum strain RU4 RU4_contig_5, whole genome shotgun sequence. 
GAAATGACGATGAACGGAACAGTAGTTACAGTCTGAGATAGTTTCAGAGAACTGGATTTGGTGTGAACCAGTACTATCTGCTGTCATGAATATCCTCCGTGAGTTGCACACCGAAGAATGTAGTAGGCTGTGCCGGGCCTCGATTGAGGAAACGCCACCCGTTATTGTGGCGAGGTATCGAGTGTAAACTCCGTACCGTTGAGAGACTATGGGCAACTATAGTAATTTGGGTGGTAGCGCGGATTAATCTCCGTCCCTTGT
>MEWZ01000006.1/7057-6737 Candidatus Adlerbacteria bacterium RIFCSPLOWO2_01_FULL_54_21b rifcsplowo2_01_scaffold_18878, whole genome shotgun sequence. 
TGAGCGCGTTGAGTAGTAGCCCCGACGTAACGTCGGGGAGGAAAGTCCGAACACTCCCTCTGGAAAACTGGAGGAGAAAGGTAGCAGGTAACGCCTGTCGTGCGCTTTTTGCGGGCGCAAGAGGTGCGAACAGAGACGAGTCTTCGACAATTTAGGGTTTACCTTGAGTATGTCGAAGGGTGAAACGGCAAAATCCTTACCCGAGTGCAAGGCCGTGTCCCGAGAGTAATCGAAGGAAGTGCCGCTTGATCCCGACGGTGACGTCAGGACCAGATAAATTACTGCTCACGACAGAATTCGGCTTACAGACGCGCGCGCAGA
>JANL01000037.1/68389-68165 Alkalibacterium sp. AK22 AUG3_contig_1, whole genome shotgun sequence. 
ACTAAACTGGATCTTGAAACACGTTCATGATTGATGCTTTACAGAGAGTCAATGCAGGCTGAGAATTGACAAGCAAATATCATGGTCATCATTCAAGGAGTTAGAAGCTGAATGTAGTAGGTTTCTACGTCTATCCGCGTTAAGGATACAGAGGATAAGTAGAAAAGCTCTAGTGGGCTGATACTTTTCAAACTAAGGTGGTACCACGAAGATTTCGTCCTTTCG
>LITN01000010.1/54782-54831 Bacillus sp. FJAT-21945 super19, whole genome shotgun sequence. 
GAGAGATTTGCTCCGCACAAATGTATACGATGAAGCATTGTGTCAGGAGC
>JNFA01000019.1/339474-339242 Listeriaceae bacterium FSL A5-0281 contig000019, whole genome shotgun sequence. 
ATAAAGACGTTGAAGGAGACAAGTAACGTTACCAAGTCATTGTTAGGGAGAGGTTACCTTAGACTGCAAGTAACCTTAGTGATACGTAATGCGAACATTTCAGCTCTGGAGTCGCTGTCGGGATTTTGTATAATGAAAGACAGATCGGTGTGAAGCCGTTATTGGAATGAAGTGGATAGCTTATTTAGCTGTCTATTAGGGTGGTACCGCGTGATTATAACCTCGTCCCTTTG
>ABLF02007471.1/1-1768 Acyrthosiphon pisum strain LSR1 Contig7649, whole genome shotgun sequence. 
CATGGAAGTCGGATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAAGCAACTAGCTCTGAAAATGGATGGCGCTGGAGCGTCGTGCCTATACTCGGCCGTCGACGGCATAGTGGGGCCAGTCGTCGCTCGCGGCGGCCGGTCCCGGCAAGCCTCGACGAGTAGGATGGCGCGGCGGTGTGCGTCGAAGGGCAGGTCGCGAGACCGCCTGGAGCCGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATACTCGAGAGGGGCCCTCGGGGGCTGCCGTGGAGAAGGGTTTCTTGTGAACAGCCGTTGTCCAAGAGTCAGTCGATCCTAAGCCCGGGGAGAGATCCTCGTACCACGGGCGAAGGCGTTTTCGAATCGCCCTTGGGGCGAGAGGGAATCCGGTTCGTATTCCGGAACCCGACGCGGAACCGCTCCCTAGTGTTCGGGGCTCTTTTGTCTCGTCTGGGTAACCAGAATGAACTCGAAGAAGCCGCCGGGGGATCTGGGTAGAGTTCTCTTTTCTCTGTGAGCGTTGTACGTCCCTGGAATCCTCTAGCCGGGCGATAGGGACGCGAGCGCGAAGAGCACCGCTCGTTGCGGCGGTGTCCGTGATCCCCACGCGGACCTTGAAAATTCGAGAGAGGGCCACGCGGAGTCTTCGCGTCGGTTCGTACCGATATCCGCAGCAGGTCTCCGAGGTGAGCAGCCTCTAGCCGCATAGAATAATGTAGGTAAGGGAAGTCGGCAAAACCGATCCGTAACTTCGGGATAAGGATTGGCTCTGAGGAGCGTGGCTGCCGGGTTCGGGTCGTCGTAGAAGCGTAGGCGTTTTTGGCGACACCCCGGCCGTCGCCCGTGCGCCCGGTCTTCGGAACGGGAGCCTCGAGGCGGCCGCGGGCCCGTCGCCGTCCGCCGACCGTGGAACCACCGAGCTTCGGTCGCTGGCCGCGTCGCGGCCGGCCGACCGCCTTGGTGTCGGTTCGCCGTCACCGGGCGGTCCGGCCGCCGCGCCGTCGGTCGCGTAGCCGGATCGACAGCCATGTAACGGTCAACTCAGAACTGGCACGGACCAGGGGAATCCGACTGTCTAATTAAAACAAAGCATCGCGATGGCCCGGGACGGGTGTTGACGCGATGTGATTTCTGCCCAGTGCTCTGAATGTCAACGTGAAGAAATTCAAGCAAGCGCGGGTAAACGGCAGGAGTAACTATGACTCTTTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCTCACTGTCCCTATCTACTAGCGTTGCGACAACAGCGACATAGTTCAGACGTGTGTTTCCACGTTCGACGTTGCTCCGAAGGGCGATCCTAGTGGTGATAACTGGCGATTAACTTAACTTCGAAAGTTTACAGGAATTTTTTCAAAAAAGTGTTCAAAAAGTTTTGGTATAGTGCATAGTGCAATCTAAGTCGGGTTTCACGGAAGTTCGCTTAGCCGTTCGTGGTTAAAAGCCGAAAGGCCACTTTTACGTGTTACAGGATAGGACCTTACCGTAAGTGGAGGGGAGAGCTCCGGTCGGCAGTCACGTACACCGAGCAATTCCTGGAATCGGCCGCCCGTCTGGAAATTCGCGACACGTGTAAGTGCGTATCACTGTTCATAAAAGCGCATAAAATAATTAACACGGCCGCCGTGAATATTATTTGGGTAAAATCGTAAATAAAATCGTGTTTTAAGTAAAGCCTATAATTTCGTGATATACGTTAAT
>LQOS01000013.1/108713-108903 Mycobacterium doricum strain DSM 44339 contig_20, whole genome shotgun sequence. 
GCCGCGCCATGCTTAGGATGTGCGATGTAATCGGCAGGCGTAGGAATCTGGTGAGAATCCAGAACGGTCGCGCCACTGTGAGAGTCAGACCCGACGCCTGCTTCATTCCACTCGGGACGCGAAATCCCGGAAAGGACCCCTGATGACGTCACCGCAAGCGCGCCAGACCCGCGTTCCGGCCATCGACCTGT
>KL543784.1/20050-21792 Capsicum annuum cultivar Zunla-1 unplaced genomic scaffold scaffold9433, whole genome shotgun sequence 
TACCTAGTTGATCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTGTAAGTATGAACAAATTCAGACTGTGAAACTACGAATGGCTCATTAAATCAGTTATAGTTTGTTTGATGGTATCTACTACTCGGATAACCGTAGTAATTCTAGAGCTAATACGTGCAACAAACCCCGACTTCTGGAAGGGATGCATTTATTAGATAAAAGGTCGACGCAGGCTCTGCCCGTTGCTGTGATGATTGATGATAACTCGACGGATCGCACGACCATCATGCCAGCGACGCATCATTTAAATTCTGCCCTATCAACTTTTGATGGTAGGATAGTGGCCTACCATGGTGGTGACGGGTGACGGAGAATTAGGGTTCGATTACGGAGAGGGAGACTAAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCTGACACGGGGAGGTAGTGACAATAAATAACAATACCGGGCTCAATGAGTCTGGTAATTGGAATGAGTACAATCTAAATCCCTTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTTAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGACTTTGGGATGGGCCGGCCGGTCCGCCTATGGTGTGCACCGGTCGTCTCGTCCCTTCTGTCGGCGATGCGCTCCTGGCCTTAACTGGCCGGGTCGTGCCTCCGGCGCTGTTACTTTGAAGAAATTAGAGTGCTCAAAGCAAGCCTACTGTCACGGGCCTAATTTTAACCACGTGCGGACAGCCTAACACTCACTATATTGAGGCTAAACTTCAGTCCTAAACCGCCCTGAACAACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACAAAAGTTGGGGGCTCGACGACGATCAGATACCGTCCTAGTCTTAACCTTAAACGATGCCGACCAGGGATCGGCGGATGTTGCTTTTAGGATTCTGCCAGCACCTTATGAGAAATCAAAGTTTTTGGGTTCCACGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGATGGAAGGGCACCACAAGGAGTGGAGCCTGCGTCTTAATTTGACTCAACACGGCGAAAATTACCAGGTCCAGACATAGTAAGGATTGACAGACTAAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCCTGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCATTAACGAACGAGACCTCAGCCTGCTAACTAGCTATGCGGAGGTATCCCTTCGCGGCCAGCTTCTTAGAGGCACTACGGCCTTTTAGGCCACGGAAGTTTGAGGCAATAACAGTTTCGTGACGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGATGTATTCAATGAGTTTATAGCCTTGGCCGACAGGCTCGGGTAATCTTTGAAATTTCATCATGATGGGGATAGATCATTGCAATTGTTGGACTTCAACGAGGAATTCCTAGTAAGCGTGAGTCATCAACTCGCGTTGACTACGTTCCTGCCCTTTGTATACACCGCCCGTCGCTCCTACCGATTGAATGATTCGGTGAAATGTTTCGATCGCGGCGACGTGGGCGGTTCGCTGCCCGCGACGTCGCGAGATGTCCATTGAACCTTATCATTTAGAGGAAGGAGAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTG
>CM001659.1/36667298-36667637 Nomascus leucogenys chromosome 13, whole genome shotgun sequence. 
GCCGGGTGCTGGGGCACGCGCCTGGAGTCCCAGCTACTCCTGAGGCTGAGGCAGGAGGATGCTTGAGCCCAGGAGGTAGAGGCTGCAGTGAGCCATGATCACGCCACTGCACTCCTGCCTGGGCTGTCGTGGGCTATGTCTAGCTGGAGTCTGCACTAAGTTCAGCATCAGCGTGGTGACCTCCCAGGTGCAAGGGGACTACCAGGTTGCCTAAGGAGGGGTGAACCAAATCAGATCAGAAATGGAGCAGGTGGAAATCCTGTGCTAATCAGTAGTGGGATCCCGCCTGTGAATAGCCACTGCACTCCAGGCTGGGTGACATAGCCAGAACCCATCTTTG
>ALWZ041907802.1/9044-8520 Picea glauca, whole genome shotgun sequence. 
GGGAAAGAAGACCTTGTTGAGATTGACTCTAGTTCGACTTTGTGAAATGACTTGAGAGATGTAGAATAAGTTGGAGTCATTTTCAATGGAAGTGAAATACCACTACTTTTAATGTTATTTTACTTATTCCGTGGGGCGAAGACGGGGCATTGCCCCTGTTTTTGGCCTTAAGACATGTTTCGGTGGGTCAATCCGGGCGGAAGACATTGTTAGGTGGGCAGTTTGTCTAGGGTAGCACATCTATTAAAAGATAACGTAGGTGTCCTAAGATGAGCTCAACGAGAACAAAAATCTCATGTGGAACAAAAGGGTAAAAGCTCATTTGATTTTGATTTTCGGTATGAATACAAACCATGAAAGTGTGGCCTATTATGAAAATGAAGTTATTTTGGCCTTAGATGATGGTGCATGTTTTATCAATGTGTAGCTTCACTTGTAATGCATCTTAAATTAATGCATAGCTTCACGTGTAATGAATAGTAAGAATCACAAGAACTTCCTGCTACATGCCTATAAGTTTAGCTT
>FAOM01433674.1/17830-17492 Triticum aestivum genome assembly, contig: Triticum_aestivum_CS42_TGACv1_scaffold_433674_5DL 
TCGAATTGTTTGTTGACACGGACAAAGTAAGGGAAAACCTCTGAAAGAATTTCCATATTGACCTTGGACATATAAGAGTTCCGAATCAAATCTCTTTAGAAAGATGATCTTTTGTCTCATGGTAGCCTGCTCCAGTCCCCAAATTCAGAGAAACCTTGGAATTAAAAAGGGCAATCCTGAGGCAAATCCGTGCTTTGAGAAAACAAGGGGTTCTCGAACTAGAATACAAAGGAAAATGATAGGCGCAGAGACTCAATGGAAGTTGTTCTAACGAATCGAGTTAATTACGTTGTGTTTACCAAAAGTTCCTACATTAATGGGAAATGCCCTACCTTTGAG
>CM000916.2/22526794-22526579 Nasonia vitripennis chromosome 2, whole genome shotgun sequence. 
AAGATCATACTTCACAGGATCATTTCTGTAGTATATCTTCACAGACTCTCTACCCAAAGTAGGAGTCGATGCAACCACGATGAGGAGACGTAGCTCTCCTTCCTGAGCGTGAGGACGACTCGGAATTGCGGCTTCGGTCGGAATACCAGTCATCGATGATCGTTCACCTTCTGCACTTTGTGCAGAAGGCATGGGAGGACGGGCTTTCTGAGTGGC
>MLCN01000008.1/279819-279740 Alkanindiges sp. H1 contig8, whole genome shotgun sequence. 
GGTCTCGAGGGGTGCTGCAACAGTAAAGTAATATACTGCCAGGCTCGAGCATGTCATTTATTGAACGGCATCCGCGAATT
>JPUK01000002.1/192788-192900 Candidatus Micrarchaeum sp. AZ1 Contig2, whole genome shotgun sequence. 
CCAAACGGTAATAGGAGCAGGGAAACGCCCGATCCCATTCCGAACTCGGAAGCTAAGCCTGCTCACGATATGTGTGTACTGTCTGCGGATGGGAAAGCATGTTGCTGTTTGGC
>AAQR03163520.1/18142-17999 Otolemur garnettii contig163520, whole genome shotgun sequence. 
ATCCTTTCACAGCTCATAAGCGGGGCGATTGGGTTTTCATGCGCATGCGTGCGCACACCCCTCCTCCCTCTCCTTCCCCCCTTCCCCCACCCTCCCCGACCCCGCCAAATCTTGTTATGACATTGGCACATTACCCATCTGACA
>ABAV01003903.1/1546-1268 Nematostella vectensis strain CH2 x CH6 NEMVEscaffold_21_Cont3903, whole genome shotgun sequence. 
TAGAACAATGTAGGTAAGGGAAGTCGGCAAAATAGATCCGTAACTTCGGGAAAAGGATTGGCTCTAAGGGTTGGGTCTGTCGGGCTGAGACTTGAAGCCAGTGGACCCGGCCCGGACTGGCCGAGGCCCTTCCGGGGGTCGAAGCTGGACCGGGAAGGGGCTGTTGGTGGATTGGCCCAGCTATGGTCGCGAGGCCAATTCGGCAGGCAATGAACAACCAACTTGCAATCAGATTTCGAATCGATCAAGAATTGAGTTAGAAGGTCCATGTACCATGTA
>AM910987.1/84270-80099 Plasmodium knowlesi strain H chromosome 5, complete genome 
TGTTTTCTAAATAGGAGAGCGAATCCGCCGAATTTAAGCATATAATTAAGCGGAAGAAAAGAAAATAACTATGATTCCTTTAGTAACGGCGAGTGAACAAGGAAAAGCTCAAGCGGATAATCTGTGTGTCTTTTCCTTTTTTTTTAAAAGGTTTAGCACAAAGAATTGTCGTGTATAAAAATACTATAGTAACTTTTCGGTATCTGTAAAAATAAAGCATATGTTACGAAGCGAGGTGGAATGCCTCCCCCAAAGAGGGTGAAAGGCCCGTAGGAAAACATTTATGGTTTAGCGTTACTGAGAGACCTCTATATGTAAAAGAGTCGTGTTCTTTGAGATTGGAGCACAAATGCGTGTGATACATTTCACATAAAGCTAAATATGTGTAGGAGACCGATAGCAAACAAGTACCGTGAGGGAAAGATGAAATAGTACTCAGGAATGAGCAATTAAAAAGTACCTGAAATCGTTAAGATGGAACGGATTAAGAGAGAAAAAAAGTAAATGCAGTCAAATAGTGATTTAGCAGCACTATCATAATTTAACTGCTTTATTAAAAGAAACATCAGTAAAAAGTTTTACGACCTATTCGGATAAAACTGTTGATGAAAAAAACATTTAATTTTTTTTTCTTATCCCAGGATAAAAAAAAAAATTAATAGTCTTTTTCACATTATCCTTATTTTAAAATATAGGATAAAAGGTTTTATAGAAAATCACGAAATAAAAGTGATAAGATAGTCCATTTTACTGAGGTTATATAAAAATGTGTATTTGCTTGTAAAAAAAAAAAAATATTCTTTGTGAATATCTTTTTTTTTACAGCTGCGCATTTTAAGTTGTTTCTATAAGATACTTTCTTAACCCACTCGTCTTGAAACACGGACCAAGGAGTCTAGCAAATGTGCAAGTGTATATGATATATTAAACATTAATGTACGTGAATAACGTACTGTTTTTATACGCATAATTAATGTAATATGTTATAATTTGTAGAATTAGTTGATAATTGCAAAATTATCACTAACGCATACAATACCGGTAGGCAAATTATGCCATATTGAGTAAGAGCATATTTGGTAGGACCCGAGAGGCTTTGAACTAAGCGTGGTGAGATTGAAGTCAGACGAAAGTCTGATGGAGGATCGAATTGATACTGACGTGCAAATCGTTCATTTCAATCACGTTTAGGGGCGAAAGACTAATCGAAAAGCCTATTAGCTGGTTATTTTCGAAAGATCTCTCAGGATCGCTGGAGTTGATTGTTATAATTTTACCAGGTAGAGACAATGATTAGAGGACTCAGGGAATTGAATTTCCTTGACCTATTCTCAAACTCCCAATGGGTAAAAAGGGATAAAAATAACTTTATTGTATTTTTCTCTATTCAAATAAAATAACTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGAGGGATGCTCCTAACGCTTGGATAAGGTGCCTAAATATTCGCTCATCAGATCCCATAAAAGGTGTTGGTTCATTATGACAGTAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTTACCTACCGAATGAACTAGCCCTGAAAATGGATGGCGCTAAAGCGAATTACCGATACCAGGCCATAGAAGGGCAAGAAAAAGAATTAGTACTTTCGGGTGTTTTTTCTTTTTTAGGAACCTTCTATGAGTAGAAAATCGTGGGGTTTTGTGTAGAAGCGAAATACGTGAGTTTTCGTGGAACATCTCCCTAGTGCAGATCTTGGTGGAAGTAGCAACTATTCAAATGAGAACTTTGAAGACTGAAGTGGAGAAGGGTTTCTTGCCAACTGTGTTTGTACAAGAGTTAGCCGCTCCTAAGAGATAGCTGAAAAGTGTTTATATGGGGAGGATTCTAATCTTTCTATCCCCGTCTCGAAAGGGAAACAGGTTTATATTCCTGTGCCAATACAAATCTATGGGTTAATTTTTAAAAGATGGCAACATATAGACAAATGAACCTCTTTACATAGGTTTTACCATCGGGGTGCGTTATCTTTGCACTTTACCTTTATAGCATACCTTGGAATCAATTTACTTGGAGAAGAGGTATGTTGAAGTCAATTCAGTTAAATTTTTGTATGGTTCTGTAATTCTCATTACAGAATTATATGTAAAAACTTTCCTGTTTTGTAGCAATAGTAATTCGTTTTTATGAATTATTCGATTCGGTATAAACTATCCTTGAAAAAAGGGGGGAACAACAAACCAAAGGGGGAGAAGTAGAATCGCCTACAAGTGATTTTAGTAATCGCAAGATTGCTAGTTCGGTTGTAAAAAGATTCTTTTCTCATTCTTGGTATGTACAACTCTAATTTGTAAAAATGAGCGTACCAACAACCGCATCAGGTCTCCAAGGTTAGTAACCTCTGGTTAAATAGAAAAAAGTAAGTAAGGGAAGTCGGCAAAATAGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGACATTAGAATGGAAAGAAATAGAAATATAGTCGAAAGAAAAGTCATTGAGGTGCTTTTACATGTTTTTTTTTTCCACAAAAAAAACGTGTAGGCATTTCTTTTGCACTCTTTTCTCTTCTGTTTTCCTTTTCTGCCCCCATTCGCCGTCATATATATATCTTTTCGCTTCGGCGATTGGCGTACATATGACACTTATAATGTTAACTCAGAACTGAAACGGACAAGGGGAATCCGACTGTTTAATTAAAACATAGCATTGTGACAAGCCATAACTGGTATTAACACAATGTGATTTCTGCCCAGTGCTTTGAATGTCAACTTGATGAAATTCAATCAAGCGCAGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTACTTGCTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGCCAAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTTACTCTAGTCTGGCTTTGTGAAACGACTTAAGAGGTGTAGCATAAGTGGGAGTAGAGATCGAAAGGTCTTTACGACAGTGAAATACCACTACTTTTAACGTTGTTTTACTAATCCATTTATTGGAATATATATGTATAAAAGGGATGCTCCTTTTTTTTTTAAGAAAGGGGTTTTATCTTTTACATATTATCGCAGAATTTATAGTTAGGGCTATGCATGTAAAAAATGTGTAGTTTTATCTATAGTTCCGATTTCTTATGGAGACATAGCCAGGTGGGGAGTTTGACTGGGGCGGTACATCTGTTAAACAATAACGCAGATGTCCAAAGACAAGCTCAGAGAGAACAGAAATCTCTTGTAGACTAAAAGGGGAAAAGCTTGTTTGATTTTTACTTTCAGAAAAAGTAGAAAACGTGAAAGCGTGGCCTATCGATCCTTTACATTTGCAAAATGATGGAGTTTATTCTCTTACTGTGCATGTAGAGGTGTCTGAAAAGTTACCACAGGGATAACTGGCTTGTGGCTGCCAAGCGCTCCTAGCGACGTAGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGGGACGCAGAAGTCTCAAAGTGTCGGATTGTTCACCCGCTAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGAATACTATTATTTTTATATACATATAGTATTGTGACAGTAATCCAACTTAGTACGAGAGGATTAGTTGGTTCAGACAATTGGTACAGCAATTGGTTGACAAACCAGTGTTGCGAAGCTAAGTCTGTTGGATAATGGCTGAACGCCTCTTAAGCCAGAACCCATGCTGATTAAACAATATTATTTCGATCTTTTTTGTAACAAATTTTTTACCGTCGATGTAAAAGAGAAATTATATATGCAGTTCTGTGTTTTTAACCGGGTGCATTATTAATCCTATTAACATATAATACTGTGTGTGTATCGTTTGCAAAAACTTACACCAAAACAGTAAAATGTTTAATATTATTTTAACAACAAGAAAGATTATCTGTGTTTGTAGACTACTTACTTGGTCCCGGGGTGCTGTAAACATGAAAGTAAACTTTGTTTTACGATCTGTTGAGGCTTATCCTCAGTGACATAAGAAAAT
>LTWW01000048.1/24870-24711 Staphylococcus sp. HMSC078E07 Staphylococcus_spHMPREF2905-1.0_Cont825.1, whole genome shotgun sequence. 
AGTGTCTTTTAAAAAGAGTCCAGAGAGGCTCAAAAGACAGGGTGACTAATGATATAAATATGATTAACTTTAATTGTTCGATTGTTATCAGACGAATCATATAAAATATTTTTATATACATTAAACCTCATGTCTTTGTAAAAGGCATGAGGTTTTTTCT
>MTEM01000151.1/7116-7366 Desulfobacteraceae bacterium IS3 Ga0073107_10151, whole genome shotgun sequence. 
ATACCCGAAATTTGTTCAGGTGTTTTATCGCTTAATAGGGAACCCCGTGAAAATCGGGGGCGGGCCCGCCGCTGTAATCGGGGACGAACGCCGCTTGAAACCACTGACGGAGAAAATGCAAAATGCAAAGTGCAAAATGCAAAGTTAACTTTGCACTTTTAACTTTACATTTTGCATTGTATCTGTCGGGAAGGTGCGGTCAGTAGGATGAACCGAGAGTCAGAAGACCTGTCTGAATGATATACCGGCGT
>JH591489.1/51165-51260 Lepisosteus oculatus unplaced genomic scaffold UNK80, whole genome shotgun sequence. 
AACCTTTTATTACTTTTTGATAATAAAAAAAAATCTGTTCTTATCAGTTTAATATCTGATACGTCCCCCATCGGGGGACCACATATTAAACNNNNN
>MICY01000022.1/569-1 Tenericutes bacterium GWF2_38_8 gwf2_scaffold_13316, whole genome shotgun sequence. 
TTTATGGAGAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAACGCACCATTTCGGTGGTGAGTGGCGAACGGGTGAGTAACACGTAGGTAACCTGCCCTTAAGACGAGGATAACCAAGGGAAACTTTGGCTAAAACTGGATAGGAACATCGAAGGCATCTTTGATGTTTTAAAAGACCTAGCAATAGGTATGCTTAAGGAGGGGCCTGCGGCGCATTAGTTAGTTGGTGAGGTGAAGGCTCACCAAGACGATGATGCGTAGCCGGACTGAGAGGTTGAACGGCCACATTGGGACTGAGAAACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATTTTCGGCAATGGGGGAAACCCTGACCGAGCAACGCCGCGTGAATGACGAAGTACTTCGGTATGTAAAGTTCTTTTATCAGGGAAGAATGGCTAGCGGAAAAGCTAGATTGACGGTACTTGATGAATAAGCCCCGGCTAACTATGTGCCAGCAGCCGCGGTAATACATAGGGGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGGGTG
>ABBZ01000577.1/639-936 Beggiatoa sp. PS contig21537_2600-2601, whole genome shotgun sequence. 
CAAGGGACTTAAACAAATTTGAGCACCTATTGCGAAATCTTTAGGTGAATGGAGTCTAATTCGGCGAAACCTTTAAAATGACAACGCCGAGCTAAGCTCAACGGTGGGGGCAAGGAAAGGGGATAATCATATCCCTTTTCCTTTCCCCTTTATTATTTTTTCTAAACCATTTCTCCTCCGTTGAGAAAGTGTAGAGACCATACGGCTCCTGCCTGACTAAATCCCTTCAATTATTTGATTGCGAGGCATTTAAAGGCAAAGACAGGGTCCAGACCACAAACATTCAATTAATTGAAAA
>MKTL01000001.1/659200-659282 Clostridiales bacterium 38-18 SCNpilot_bf_inoc_scaffold_0, whole genome shotgun sequence. 
CTATTATCTTGGCAAACTGCTTGAAAGAGTAGGACGCAAAGTTTGAAGTCTAAGGCACTAGCTATGACCGTTCAACTGCAGTA
>CP000680.1/4301122-4301323 Pseudomonas mendocina ymp, complete genome. 
CGGGTTTACTCCTGGTTTTTACCGTTTCGCCAAACCGAGGTTCGGCGGCGTTTTGGTGTCTGATTCGGTAACGAATCGGGAGCACCATCTGCGTAGGCCATCAGGCGAACCTGACATTTAAAACGCGAGTCACCTACGGTCTTGGATAGCCCCCGCCAGGCAGGGACCCCAATCTTTCAAAGCCGGCAGCGCATGGCTGCCG
>KK198757.1/45732841-45732932 Eucalyptus grandis cultivar BRASUZ1 unplaced genomic scaffold scaffold_5, whole genome shotgun sequence. 
TGATGATAATGATGATGATGATGATGATGATAATGATGATAATACTAGTAGTAGTAGTAGTAACATCATCATCATCATCATCATCAAAGGTA
>CP000705.1/1964394-1964162 Lactobacillus reuteri DSM 20016, complete genome. 
TAAAAAACGTTGACCGAGAATCGTCAATTCTGCTGAATTAAGAGAGCCGGTGGTTGGTGGAAACCGGTAGGAGGTAGTTGCGACAAATCCCTCGCGAGTTGTATGCCGAAATAATAGTAGAACATACTGGTAGCAGCCATTATCTTGCCGATTAATTGCCATTGTGGGCAGTTGATTGAGGCAACCCTTGTGTTGTAAATAAAGGTGGTACCACGTTGATAGACGTCCTTTTA
>AHHD01001364.1/1-303 Macrophomina phaseolina MS6 contig01813, whole genome shotgun sequence. 
GTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCTGCCGAAGTTTCCCTCAGGATAGCAGTAACGTATTCAGTTTTATGAGGTAAAGCGAATGATTAGAGGCCTTGGGGTTGAAACAACCTTAACCTATTCTCAAACTTTAAATATGTAAGAAGTCCTTGTTACTTAGTTGAACGTGGACACTTGAATGTACCGTTACTAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGAACGCGATGTTAAGGTGCCGGAATGCACGCTCATCAGACACCACAAAA
>AFYH01130564.1/25905-25790 Latimeria chalumnae contig130564, whole genome shotgun sequence. 
TTTGAAACCCAAACCAGCTAGATTTAATTCTATCCACGTCTGATCTCAGAAGCTAAGCAGGATCGGGCCTGGTCAGTACTTGGATGGGAGACCACTGAGGCAGCCCAGGTGCAGTC
>KB944511.1/1034622-1034709 Plesiomonas shigelloides 302-73 genomic scaffold scaffold00012, whole genome shotgun sequence. 
GTAAGACGCGCTATTTTGTTGTCATCACATCCCTGAAATTACACACGCAGAGATGTATTTCGGCCACCCCACCTTGGAGTGGCCTTTT
>CM002812.1/447709-447914 Capsicum annuum cultivar Zunla-1 chromosome 1, whole genome shotgun sequence 
TCAGTCATAGTTTGTTTAATGGTATTTATTACTCAAATAATCATAGTAACTCTAAAGATAATACATGCAACAAACCCTAACTTTTTAAAGGGATGCATATATTAGATAAAAGGTAGATGTGGGCTCTTCCCATTTTTTTGATGATTCATGATAACTCAATGGATTGCACGGTCATTATGTTGGCGACACATCATTCAAATTTTTGC
>AZHD01000026.1/410476-410398 Sporothrix insectorum RCEF 264 scaffold_26, whole genome shotgun sequence. 
AAAGGGGTAGTATAATAATTAAACACTTAAAAGACGCCGTAACGCCGCGACGTCGTAGGTTCGAATCCTACCCCTTTTA
>CM002818.1/23807342-23807451 Capsicum annuum cultivar Zunla-1 chromosome 7, whole genome shotgun sequence 
TTTTGTATTTTTCCACAGCTTTCTTGAACTGCATCTAATTACGATTTTCACTAATGAGGAAATTAATTCATATCGTTGCGGTTCAATAAAGCTGTGGGAAGATATAGATA
>AYZL01000006.1/155934-155671 Lactobacillus floricola DSM 23037 = JCM 16512 strain DSM 23037 NODE_9, whole genome shotgun sequence. 
AATTTTACTGAGAAAAGATGAGTAAATATTTATCTTATTTTAACAGAGAGCCATGTTAGGTGAAAGATGGTATTTAAGAAAATATTGAAGATGGTCTTGGAGTAAGTTTAAATTGTGAGCCAGTTAGGTTAGCAATTTACGGGATAACACACGTTACTGTGTTGAAGGATAGCTACCATGAGTGTCCGGATCGAAGATGGTGATAATAGCATTGTATAATTATCACTAATATAGGGTGGTACCGCGTTTAACAACGCCCCTAGG
>ALWT01124023.1/1602-1388 Myotis davidii contig124023, whole genome shotgun sequence. 
ATCGCTTCTTGGCCTTTTGGCTAAGATCAATTGTAGTATCTGTTCTTATCAGTTTAATATATATTTCCAAATTTTTCAGGTGGATGCCCCAAAGAGGGATTTCTGGGTTATATGGTAGCTCTATTCTCAATTTTTTTTTTGAGGAACTTTCATACTGTTAACATAGCGGCTGTAACAATTTACATTCCCACCAGCAGTGCATGAGGGTTCCCTTT
>JTDY01005470.1/30475-30582 Operophtera brumata OBRU01_Sc05470, whole genome shotgun sequence. 
TGATGATGATGGTGATGATGTTGGTGGTGGTGGTGATGATGGTGGTGGTGTAGGTGGTGATGTTGGTGACCATCATCATCACCACCATCATCATCATCATCACCTGCA
>LN774769.1/2382714-2382521 Lactococcus piscium MKFS47 genome assembly, chromosome: I 
GAAGCACTGGAATGTGCGAACTTACTCACATTTTTGACCGACTAAATCGTATTACCTAGGGAGTCTTTGAGACATCTTACCGCGTGCAAGCCATTTTAGATGGAAGCTGCTAAGTAAGAGCGAGACGCCCACCTGTTTAACATTTACAGCGGGTTCAATACAAGAGTGAGTAACGGCATTCAATCAGTGCTTTT
>AYUG01147828.1/3237-3115 Fukomys damarensis contig147828, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAAACAACATCTTATTAATTCTGGTTTGATTGTCTTTACCAAAAGAAATCATTCCTGAGGTTTTCTTATGGAAAATGTTTTGGAACTTTC
>URS0000D69AE5_12908/1-140 unclassified sequences RAGATH-24 RNA 
TTGACAGTCCAAAAACCACCTGCCCTCGGGAGATACCCGAGGTGTGACCTTCGCCGTTTATCGGTCGCCTCCCAGATTCATCGGGGGGCGGGGAGAGAGGGTCAGCGATTCGTTCGCTTGATGACGTGGGAATAGGACAC
>KB095811.1/12337799-12337623 Helobdella robusta unplaced genomic scaffold HELROscaffold_1, whole genome shotgun sequence. 
TGATGACGATGATGATGATGATGATGGCGACGATGATGATGATGATGATGACATTGTTGTTACATCAAAACAGCGATTTCGAATGCATAATTGGATGTGTTTTTGTTTGGCCCGGCAAATAACTGCTATTAAATGTCATCATCATCATCGTCGTCGTCCTCATCATTATCATCATCA
>LL990082.1/1-981 Schistosoma rodhaini strain Burundi genome assembly, scaffold: SROB_contig0004979 
GCATTGCGATGTCCACTGATTGGTTTTGACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATTACCGACGTTCAATCAGCTGCGTCAACCGCACTGAATTGCATCCTACGTGTGGGGTGAAGCAAGGAGACCCCCTGTCGCCACTCCTCTTCATCATGGTTCTCGACGAAGTACTGGAAGGTCTAGATACAATGACCCACCTAACAGTTGATGGAGAGAGCTTGAACTACATAGCTTATGCTGACGATCTCGTAGTTTTCGCTCCAAATGCAGAACTCCTTCAACGAAAACTCGATCGAATCTCCCTACTTCTACACGAGGCTGGATGGTCGGTTAACCCTGAAAAAAGCCGGACCCTGGACCTAATCTCTGGTGGCCATTCCAAAACCACAGCGCTCTCTCAGACAGAATTCACCAACGCGGGGATGCGTATACCACCGCTTTCTGCCGCCGACACCTTCGACTACCTGGGTATCAAATTCAACTTCAAGGGCCGATGCCCAGTGGCCCATATTGACTTATTGAACAACTACCTCACGGAAATATCGTGCGCTCCACTTAAGCCGCAGCAGCGCATGAAGATCTTGAAAGATAATCTACTCCCTCGACTCCTCTACCCCCTGACTCTAGGAATAGTACACCTGAACACCCTGAAGTCAATGGACCGAAATATCCACACGGCCATAAGGAAATGGTTGCGGCTACCCTCCGACACCCCGCTAGCATATTTTCACTCACCCGTCGCTGCCGGAGGCCTAGGGATCCTCCATCTGTCCTCATCGGTTCCATTCCACCGTCGAAAACGTCTAGAAACCCTCCTATCTTCACCGAACCGCCTACTGCACAAGTTGCCAACTTCTCCAACACTAGCTTCTTATTCACACCTTAGTCAACTGCCAGTTCGAATTGGGCACGAGACCGTAACGTCTAGA
>BDDD01008159.1/30464-30638 Cephalotus follicularis DNA, scaffold: scaffold8159, isolate: St1. 
ATACCCTTAACTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTCTGAGTTTATCATCTCATATGATTCACACGATATTTTTTTATATGGGAAAAGACTCATCACAATAGCTTACTATTGGGGTTTTTTAGCGTCCCTTATGTGTTCCATACCGTATGGACCTGACGCACCCCTA
>ALYE01001358.1/3372-2729 Gossypium raimondii Chr01_contig_1358, whole genome shotgun sequence. 
AATACGAACCGTGAAAGCGTGGCCTATCGATCCTTTAGACCTTCGGATTTGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAGCAGAATTCACCAAGTGTTGGATTGTTCACCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTACCCTACTGATGGCCGCGTCGCATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTGAAAAGCCAGTGGCGCGAAGCTACCGTGCGCTGGATTATGACTGAACGCCTCTAAGTCAGAATCCGGGCTAGAAGCGACGCACGCGCCCGTCGCCCGATTGCCGACCCGCAGTAGGGCCTCTGGCCCCCAAGGGCACGTGTCGTAGTGCAGCGGCCGCGGCGGACAAGTCGCGGGCGCCTCCTGGAGCGTAATTCCCACCGAGCGGCGGGTAGAATCCTTGCAGACGACTTAAATACGCGACGGGGTATTGTAAGTGGCAGAGTGGCCTTGCTGCCACGATCCACTGAGATTCAGCCCTTTGTCGCTTCGATTCGT
>CM001740.1/4627691-4627566 Gossypium raimondii chromosome 1, whole genome shotgun sequence. 
GGGCGTAGGCCTCTTAAAAGGAGTGCAAAGGCAGAAGGGAGCTTGATTCAAGACCCACCTGTCTAGTAAGGACGAAAATCAGCTTTAGTGATCCGATTGTGCCGAGTGAAAGGGTCGTCGCTCAAC
>KB730334.1/190955-191028 Fusarium oxysporum f. sp. cubense race 1 unplaced genomic scaffold scaffold395, whole genome shotgun sequence. 
GCCAAGGTGGCCGAGCGGTCTAAGGCGCCAGACTCAAGATCTGATTGGTTGGATCTAGAATCCCAACCTTGGCA
>MHLG01000025.1/17211-16820 Candidatus Liptonbacteria bacterium RIFOXYD1_FULL_36_11 rifoxyd1_full_scaffold_658, whole genome shotgun sequence. 
GGGGGTGAAAGGGCTCGACGGAGTTTCTTTGTTATAAAAGTGGCAGGTAGGTTTGACGAGACCTTAAAAACGTCAAAAAAATAAGTGCCAACTTATTCAACAGACAACCGGCTTTAGCTTACGCTTAAGTTGGTTGTAACCTTAGCTTTTATGCTGAGGCGTCGCTCTACTTTTTGCTTATAGGAGTGGAAGCGGTGTAAAAGTATAAGCTTTTCTTACTCTTTTAAACTTGGGGAGTGGGAGAAAAAAACAGGTTTGGCGGGTAAAAACTTTTTGGTAAATTATAAATTTTTACTCGTTTACCGAAAGGTAAAAAATAAAATTTACCTATATCTGTAGAAACTTTTATGGCTCAACTTCGGACATGGGTTCAATTCCCATCATCTCCACTA
>HF992493.1/15144-15489 Mycoplasma sp. CAG:877 genomic scaffold, scf27 
AATATATAGACAAACGCTGGGACTCTTGAGGTCCTTGAGGAAAGTCCATGCTCGCACAGTCTGAGATGACTGTAGTGTTCATTCTTAGGGAATAAATAACCTAAGGTAGTACTTGTACTAACGGCGGATACTATATCTAAGTCTTATGATATGATATAGTCCATAAAGTGCCACAGTGACGAATTCTTTGGAAACGAGGAAGTGAAACGCGGTAAACCCAATGAGCGAGAAACCCAAATTTTGGTAGGGGAGTTCCAACTTCGAGAAATGAATTGGAGTGGAGACCAGTAATGGTAGATAAATGTTTGTCGCTTAGGAAACTAAGAACAGAACATGGCTTATTTAT
>CM001498.2/114148093-114148035 Papio anubis isolate 1X1155 chromosome 8, whole genome shotgun sequence. 
TGACTTATTTGGTTAAAGTACCTGTCTAGTAAACAGGAGATCCTGAGTTTGAATCACAG
>KE356582.1/1391668-1391842 halophilic archaeon J07HB67 genomic scaffold scf_7180000098878, whole genome shotgun sequence. 
ACTGCAGGCTGTCGCTGAGACATGGTCGCTGATGTGCAGAGTAGGTAGGAGTCGTTACCGAGGCCCGTGCGCCAGCACGGCGCCCAGACACACATGAAACACTACCCGTCAGTGACTGTGACTCTCACTCCGGGAGGAGAACACCGGTAGCCGGGCAGTTTGACTGGGGCGGTAC
>CM000820.5/64985614-64985509 Sus scrofa isolate TJ Tabasco breed Duroc chromosome 9, whole genome shotgun sequence. 
GTTCTTGCCTCGGCAGTATATAAACTAAAACCGACAATACAGAGAAGATGAGCATGGTCCCTGTGCAAACATAGCATGCAAATGTCCATAAAAAAGAATGCTATTT
>CM000791.1/61008405-61008287 Oryctolagus cuniculus chromosome 2, whole genome shotgun sequence. 
ATCGCTTCTTGGCCTTTTGGCTAAGATCAAGTGTAACAATGCTAAAACATCAAAAAGATATTCAGTCTAAGTTATATATTATACAAAATATATTTGCTGTTATATATATTTAAACCTCC
>GL637601.1/22009363-22009461 Caenorhabditis tropicalis strain JU1373 unplaced genomic scaffold Scaffold629, whole genome shotgun sequence. 
TTTCGAAACAGAGTGACCGTCTGTAGTTTTTTTGTGTAGTGCTCCGAGCCAAAATGTGTTCGAAGCACCACGAGAAGCTGCAGATGGAACAACTTGTAT
>MNXL01000222.1/6266-6479 Anaerolineae bacterium CG2_30_64_16 cg2_3.0_scaffold_3852_c, whole genome shotgun sequence. 
CTCTTATCCAGAGAGGCAGAGGGACCGGCCCTGTGAAGCCTCGGCAACCAGGAGATGGTAAATTGGTAAACTGGTAAACTGGTAAATTGGTAAATTGGTGGTCTGCTCGATGGGCAGCGACTTGCCACCAATCTACCAACCTACCAATCTACCAATCTACCAGGTTACCACCCCATGGTGCCAATTCCGGCAGAGTTGATCTGGAAGATGAGAG
>MEVM01000037.1/1634-1766 Candidate division WWE3 bacterium RIFCSPLOWO2_02_FULL_53_10 rifcsplowo2_02_scaffold_176987, whole genome shotgun sequence. 
AGTTTATTAAGAGCGGCGGTTAGAGGCCTGGCTCGTTGACCCGCCCAGCAACTTGTTTGCGAGGCGTTGGAGAAACCCTCCGACAATCTTGGGATAAAGTGCTAAATCCAGCCCCGCTTGGGGAAGATAAATT
>ALWT01215141.1/49283-49606 Myotis davidii contig215141, whole genome shotgun sequence. 
GTTTGTAAGAACGGACATGTCATGTGACATCTGTCACCCCATTGATCGCCCGGGTTGATTCGGCTGATCTGGCTGGCTAGGCGGGTGTCCCCCTCCTCCCTCACCGACCCATGTGCGTCCCTCCCGAAGCTGCGCGATCAGTCGAAGAGGACGACCTCCGCTCCCCCCAGAGGACCGGTCTTCGGTCAAGGGTATACGAGTAGCTGCGCCGCCCTGCTAGAACCTCCAAACAAGCTCTCAAGAAATATCCAGGGGAGACAGAGTAAAATTTAAAACGAGTTTGGCCTATATTCAGTCTTAAAAGTTTCATGAAAATATAAAACT
>AYZV02077796.1/1114-1237 Spinacia oleracea cultivar SynViroflay scaffold18850.con0006.1, whole genome shotgun sequence. 
TAACCCCGGCACAAGGTTGACACAAAATTGAAATGATACAGAGAAGACATTTTCAAGATTGAAATTAATATGGCCCCTTTGCAAGGATGACACAAATTTAAGAAAACATTTTCAAGAAATCTTT
>FR899405.1/21238-21732 Mycoplasma sp. CAG:472 genomic scaffold, scf68 
TTGATATAATATTTATGTGGTGCATTATGCTAGTCACAATCACTATTTGAAGATGGGGCTAAAAATCCATTAATTGATACAATTGCACTTTATATATTTGCTGCTTCTGCCCAAGTTGGGGTGAATATGTAATTTAAAATTATAGGGAAATCATAACGGCATATGACTAACCCCCTGTAATTAAGCAAAAAAGGAAGAGTTATTCATGTCGTGCGTGGTTATTAGGGATTTAACGAATAATAATGTTGATGAAATCTTAACTGCAAAAGCGAATAAGAATAGTTTAGATGTGTCAGGGAAAACCTCTAGCGTGTTATTTATTATAAAGATTGAAGTGCGGACTATGTGGCAATCGAGTCATTAGTTAGGCAACTACTAATTATTTTCTTTAAAGAGAAATCGCCTAAGGGTAACCAAGGGAGAGAAAATAGAGAAATTCAACTCGACCAAAGCCGTAAGATTAATTTATAATAAACCATAACATTTTTAATAACT
>AFTD01054950.1/9395-9285 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
ATCGCTTTTCAGTCTTTTGGCTAAGATCAAGTTTAGTATTTGTTCTTATCAGTTTAGATTAGTACCCTGTTCTCTTTGAAGTATAAAAATAAGGTGAATTTAAAAAGTCAT
>MNTO01000093.1/21391-21316 Ruminococcus sp. CAG:9-related_41_34 Ley3_66761_scaffold_4291, whole genome shotgun sequence. 
AGTCCGTGTGATGATGTAGCACCGCTGGCAAAGGGTACGGCTGGATGAGAACCATGCAGGGGTGAGATTCCCATGA
>CP002528.1/2537163-2537236 Dokdonia sp. 4H-3-7-5 chromosome, complete genome. 
ATAACCAGGAGTTGGTCTATTAGAGAAGTCAGCAGAAGTCATAGTAGCTAAAGCCTGATATTTTAGTGAAGGAC
>AOTI010107864.1/9315-6890 Triticum urartu cultivar G1812 contig107864, whole genome shotgun sequence. 
TGGACCTAAGCCTGAGACTAAGTGCTTCTACTGCAAAGGGACTGGTCACTAAAAGCGGAACTGTCCCAAGTATTTATTGGATGAAACTAAGCAGAGGTCCGAACCGACTGATGTTGAAGAATCAGCGGATGAGTTGTGGTTAGGGGTGAAATGCCACTCGAACCCAGAGCTAGCTGGTTCTCCCCGAAATGCGTTGAGGCGCAGCAGTTGACTGGACATCTAGGGGTAAAGCACTGTTTCGGTGCGGGCTGCGCGAGCGGTACCAAATCGAGGCAAACTCTGAATACTAGATATGACCCAAAAATAACAGGGGTCAAGGTCGGCCAGTGAGACGATGGGGGATAAGCTTCATCGTCGAGAGGGAAACAGCCCGGATCACCAGCTAAGGCCCCTAAATGACCGCTCAGTGATAAAGGAGGTGGGGGTGCAAAGACAGCCAGGAGGTTTGCCTAGAAGCAGCCACCCTTTAAAGAGTGCGTAATAGCTCACTGATCGAGCGCCCTTGCGCTGAAGATGAACGGGGCTAAGCGATCTGCCGAAGCTGTGGGATGTCAAAATGCATCGGTAGGGGAGCGTTCCGCCTTAGAGGGAAGCAACCGCGAAAGCGGGGGTCGACGAAGCGGAAGCGAGAATGTCGGCTTGAGTAACGAAAACATTGGTGAGAATCCAATGCCCCGAAAACCCAAGGTTTCCTCCGCAAGGTTCGTCCACGGAGGGTGAGTCAGGGCCTAAGATCAGGCCGAAAGGCGTAGTCGATGGACAACAGGTCAATATTCCTGTACTACCCCTTGTTGGTACGGAGGGACGGAGGAGGCTAGGTTAGCCGAAAGATGGTTATAGGTTTAAGGACACAAGGTGACCCTGCTTTTTCAGGGTAAGAAGGGGTAGAGAAAATGCCTCGAGCCGAGGTCCGAGTACCAAGCGCTGCAGCGCTGAAGTATGAGCCCCGTGGACTAGCGATTGCTTCTCCACGAGGCTCATACCAGGCGCTACGGCGCTGAAGTATGTAACTGATGCCATACTCCCAGGAAAAGCTCGAACGACCTTCAACAAAAGGGTACCTGTACCCGAAACCGACACAGGTGGGTAGGTAGAGAATACCTAGGGGCGCGAGACAACTCTCTCTAAGGAACTCGGCAAAATAGCCCCGTAACTTCGGGAGAAGGGGTGCCCCCTCACAAAAGGGGGCCGCAGTGACCAGGCCCGGGCGACTGTTTACCAAAAACACAGGTCTCCGCAAAGTCGTAAGACCATGTATGGGGGCTGACGCCTGCCCAGTGCCGGAAGGTCAAGGAAGTTGGTGAACTGATGACAGGGAAGCCGGCGACCGAAGCCCCGGTGAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCCGCACGAAAGGCGTAACGATCTGGGCACTGTCTCGGAGAGAGGCTCGGTGAAATAGACATGTCTGTGAAGATGCGGACTACCTGCACCTGGACAGAAAGACCCTATGAAGCTTTACTGTTCCCTGGGATTGGCTTTGGGCCTTTCCTGCGCAGCTTAGGTGGAAGGCGAAGAAGGCCCCCTTCCGGGGGGGCCCGAGCCATCAGTGAGATACCACTCTGGAAGAGCTCGGATTCTAACCTTGTGTCAGACCCGCGGGCCAAGGGACAGTCTCAGGTAGACAGTTTCTATGGGGCGTAGGCCTCCCAAAAGGTAACGGAGGCGTGCAAAGGTTTCCTCGGGCCAGACGGACATTGGTCCTCGAGTGCAAAGGCAGAAGGGAGCTTGACTGCAAGACTCACCCGTCGAGCAGAGACGAAAGTCGGCCTTAGTGATCCGACGGTGCCGAGTGGAAGGGCCGTCGCTCAACGGATAAAAGTTACTCTAGGGATAACAGGCTGATCTTCCCCAAGAGTCCACATCGACGGGAAGGTTTGGCACCTCGATGTCGGCTCTTCGCCACCTGGAGCTGTAGGTGGTTCCAAGGGTTGGGCTGTTCGCCCATTAATGCGGTACGTGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCATATCCGGTGTGGGCGTTAGAGCATTGAGAGGACCTTTCCCTAGTACGAGAGGACCGGGAAGGACGCACCTCTGGTGTACCAGTTATCGTGCCTACGGTAAACGCTGGTAGCCAAGTGCGGAGAGGATAACTGCTGAAAGCATATAAGTAGTAAGCCCACCCCAAGATGAGTGCTCTCTCCTCCGACTTCCCTAGAGCCTCCGGTATCACAGCCGAGACAGCGACGGGTTCTCCACCCATACGGGGATGGAGCGACAGAAGTATGGAAATAGGATAAGGTAGCGGCGAGACGAGCCGTTTAAATAGGTGTCAAGTGGAAGTGCCGTGATGTATGCAGCTGAGGCATCCTAACGAACGAACGATTTGAACCT
>DF157098.1/956789-956946 Plasmodium cynomolgi strain B DNA, chromosome 6. 
TAACTGGCTTTTGGCTGCCAAGCGCTCCTAACGACGTAGTTTTTTGATCCTTCGATGTTGGCTCTTTCCATCATTGGGACGCAGAAGTCTGAAAGTATCGGATTGTTCACCTGCTAAAAGGGAACATGAGCTGGGTTTAGACCGTCGTGAGACAAGTT
>D90215.1/1270-1191 Nicotiana tabacum par gene, partial cds. 
CTAACAAGGGGATAAAAAAATTCAAATGTGAAACAACTAATATTCAAATGTACGACGACCTTAAACAGCTCGGTGAAACT
>HG719501.1/1361-1 Eimeria maxima Weybridge genomic scaffold, Emw_scaff1073 
AGACCTGAAGTCAGTCGAGGTTACTCGCTAAATTTAAGCATATTACTAAGCGGAGGAGGAGAAAATAACACTTCCCTCTAGGGAAGAGCTCAAAGGGAAAATCGTGAGTCCCTTTTGACCTCACGAATTGTAGCCTCTTGAGGCGTTGCCAGTGGGCGGGCAGGCTAAATATTGACGTGAGACCGATGGCGAACAAGTACTGTTAAGGAAATGTGAAAAGGACTTCGAAAAGAGAGTTAAAAGTGTCTGAAATTGCTGAATGGGAGGCGATTGAAACTTTAGTCTCTTCAGGGTGCGGGTGGATATTAGTTGTTCATTAGAAGGTAGCAAAATGCCTCGTCATCAAAATTAGTGAGGTGCATGAATGGATTAACGAGATTCCCACTGTCCCTATCTACTATCTAGCAAAACCACAGCAAAGGGAACGGGCTTGCCGGAATCAGCGGGGGAAGAAGACCCTGTTGAGCTTGACTCCAGTCCGACTTTGCTGAACGACTTGCGGGGTGTATCATAGGTGGGAGCTCCGACGACCGTGAAATACCACTACCCTCAATGTCACTTTACCTATTCCGTTAAGTTGAGATGCATGCTCGGCATCTGTTGAAGTCTTAAGGCACCCTTTTGGATCCGATAAATGCGGAAGACACAGTCAGGTGGGGAATTTGGCTGGGGCGGCACATCTGTGAAACAATAGTGTAGGTGTCCTAAGGCAAGCTCAATGAGAACAGAAGTCTCATGTTGACCAAAAGGGGAAAAGCTTGCTTGATTTTGATTTTCAGTGCGAATACAAACTGTGAAAGCATGGCCTATCTATCCTTTAGGTCTGAGAAACTTTCAGCTAGAGGTGTCAGAAAAGTTACCACAGGGCTTGTGACAGCTAAGCGTCCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGAGACGCAGAAGTCTCAAAGTGTCGGATTGTTCCCCCGCCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATAAAATTGATACTGCGACAGTAATCCAACTTAGTACGAGAGGAACAGTTGGTTCAGATACTTGGTTAATACGGCTAGCTGAGAAGCTGGTGCCGCGAAGCTACCATCTGTTGGATTATGACTGAACGCCTCTAAGTCAGAACCCATGCTGGCTAAGCAGTGTTTCGCATTGCCCCATTTGTTACTTGCATATGGTTTTAGTGCCTTTTGAGCACAACATCTCATCAAAGCCCTTTGCGTCATGCGCTGGGCTATAATCACAATTTCCCACAATTGAGGCGCTACATCCATTGCAGACGACTTTGGCGCAACCAGGTATTGTAAGTGT
>CP003171.1/2269902-2269995 Oceanimonas sp. GK1, complete genome. 
GCCCGGCGTCGGGTGTTCTCTTACTAGCGCACGGCTCAGCTAATGAGCCATTCCCCTGAGCCAGGTACACGGAATTTGTACCTGGCTTTTTTTG
>AACT01014037.1/2025-2536 Ciona savignyi cont_14037, whole genome shotgun sequence. 
TTTGGCCGCCAAACCATTGCAAATACCCGAAAGATGGTGAACTATGCCTGAGGAGGTTGAAGCCAGAGGAAACTCTGGTGGAGGACCGTAGCGATTCTGACGTGCAAATCGATCGTCAAATTTGGGTATAGGGGCGAAAGACTAATCGAACCGTCTAGTAGCTGGTTCCCTTCGAAGTTTCCCTCAGGATAGCTGGCGCTCTGTCGCAGTTTTATCTGGTAAAGCGAATGATTAGAGGTCCTTGGGGGCCGAAACGCCCTCAACCTATTCTCAAACTTTAAATTGGTAAGAAGCCCGACTCGCTCGTTTGGAGCCGGGCATGGAATGCGAGTGCCAAGTGGGCCACTCTTGGTAAGCAGGACTGGCGATGCGGGATGAACCGAACGCCGGGTTAAGGCGCCCGACGCGACGCTCATCAGAGCCCCAAAAGGGTGTTTGGTTGATATAGACAGCAGGACGGTGGCCATGGAAGTCGGAAACCGCTAATGGAGTGTGTAACAACTCACCTGCCG
>CM000236.2/115408586-115408648 Rattus norvegicus chromosome 6, whole genome shotgun sequence. 
GAATGAACACAGCTCTTTTAGAATTTTCCTAACAAGATTTCTGACTTTGGTCAGAAAACCCAA
>HG417174.1/11014915-11014980 Oryza rufipogon genomic scaffold, chr10 
AGGCCGATGATGCTAATCATGCTCCTATGGTTTTTCTCTAAGAATGTTTCCCAAGAGCTGAGGACC
>JH835324.1/5005558-5005616 Erinaceus europaeus unplaced genomic scaffold scaffold00036, whole genome shotgun sequence 
CTCTGTAAAACTTTTCCTATGCTGGGTAGTAAAAGACACCTTGTTACCTGAATGGACAG
>LMQS01000004.1/71000-70919 Methylophilus sp. Leaf416 contig_4, whole genome shotgun sequence. 
CCTTCTGAGGAACGCTGCGAGAGTTTCATACTCCCAGGCTCAGAGTGATAGCTGCGAAGCTTCTCAACTGCGTTCACTTTTC
>CM001441.1/4265140-4264954 Desulfosporosinus youngiae DSM 17734 chromosome, whole genome shotgun sequence. 
TGTATATTGGAAAATAAAGGTGCGCGTACTACATAGTACAGCTTAAAAGGGAAGCAGGTAAAATTCTGCACGGTCCCGCCACTGTAATGGGGAAATGTTTTATACTAATAGCCACTAGTCCTACCGGGAAGGCGTAAAGCATTGATGAACCAAAGTCAGAAGACCTGCCTTTGTTGAATGAACCAAT
>JEMT01029493.1/3587-3436 Rhizophagus irregularis DAOM 197198w jcf7180003195098, whole genome shotgun sequence. 
ATCCTCTCTTGCCTATTGGCTAAGATCAAGTGTAGTATCTGTTATTTTCAGTATAATATCTGAAACTTTACACACAGGAGTTCCTTGGCTTGCCAATACTCCCTCATGAGTGTCCCTATTATTGCACTACCTCTAGGCGACGCTCACATTTT
>URS0000D68632_7029/1-72 Acyrthosiphon pisum (pea aphid) type-P1 twister ribozyme 
UUUUUAAUCAUACCAGUAGUCUAAUUUUUAGAUUACUGACAGUCCUAAGUCUGUAAAAAAUGAGAAGGGAAA
>LXGJ01000084.1/21313-21202 Bacillus sp. WF146 contig084, whole genome shotgun sequence. 
CGCCTCTTTAACCGCAATCCCGTGAGGTTGCGAAGAGGTTTACGCGCTTTCCATGCCCATGGAAGGATGGAAGGAGTATGCCTCTTTGTGCCCGCACAAAGAGGTTTTTTGT
>MAVT01008674.1/885-718 Diaporthe helianthi strain 7/96 Scaffold_5759.1, whole genome shotgun sequence. 
TATTATTCAATGGGCAATCCGCAGCCAAATACTAAGTTTAGGTGTAGTCTTATTTAGTATGCAGTTCATCGACTAAACGGGTGTTGGTTTAATTTAAAATATACTGTAGTTAATAGTAAACCTTAAATTAGGCTTAAGATATAGTCAGTCCTAATATGAAAATATTGG
>MCOG01001818.1/1-185 Neocallimastix californiae strain G1 LY90scaffold_1818, whole genome shotgun sequence. 
CATACAAGAGGACCCCGGTTCAGGCGTGGAAGTATGTCCTGTTCTCGTCCTTGAATGATAACTTCAAATATTAATGAGGATAAATCCTTTGCAGACGACTTAAATTTATAAACTAGGTATTGTAAGCAGTAGAGTAGCCTTGTTGCTACGATCTGCTGAGATTAAGCCTGTGTTTACTGATTTGT
>GG665194.1/8635-8474 Plasmodium falciparum IGH-CR14 genomic scaffold supercont1.236, whole genome shotgun sequence. 
NNNNNNNNNNNNNATGTTAACAATAATTCATGATGTAAAAATGTTATCCAGTGATGTTTTTATTAGAGGCTAAAAAAAAATGTTTATGCAATGATAAAACGAGTTAAGCATTTTTTTTTAAGTTGCCGACTCACCTGACATTGGAACAACCAAAATTATTGT
>AYCK01025824.1/19605-19691 Poecilia formosa, whole genome shotgun sequence. 
ATTTGCTGCACGCAATTTGCGTACAATATAGCATAAAGTTACAGTTAGTATTTATGCTATATTGTACGCAAATTGCGTGCAGTTACA
>JOKI01000015.1/68827-69021 Rhizobium sp. R1-200B2 contig_15, whole genome shotgun sequence. 
AGTCAGCACAAGGAGGCAGACATGGGACGCGCTTACTCTCTGAATGTCCTGGCAGTTGGTGTAGCATTCGTATTCGTGGCTTCCATGCTCTTCATTTGAGCGCCACAGTTTCACAACTACCGGTCATATCTGGCATCCGTGACAATCATATAAAGATTTGAAAGCAGGAAACGCAGCTCCATCGGGCTGCGTTTC
>URS0000D698DF_12908/1-132 unclassified sequences RT-16 RNA 
CTAGCAAACCGTTTTTACGAAGTCAGCTAGTTATACGCTTATTTACTATGGGAGTTTACTCTTATAAAATGCAATCACGACACCTAATGTGTGAAGTGGTGGTGAAAACAAGAAGTAAATAAGCTAACTTGG
>AE009948.1/273558-273684 Streptococcus agalactiae 2603V/R, complete genome. 
GCTGTTTTTTTAGCGAGCTCAAGGTAGTGAAAGTTGGGTAGAATAGGATGAATATTGGCACTTTTTAGTGAGTAAAAGTACAATCAAAAATGAAGTAATAAATTAGGGTGGAACCGCGTCTTTGACG
>GL830965.1/1574-57 Succinatimonas hippei YIT 12066 genomic scaffold Scfld66, whole genome shotgun sequence. 
ATAATGAAGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCTTAATACATGCAAGTCGAACGGTAACATAGCGAAAGCTTGCTTTTGCTGATGACGAGTGGCGGACGGGTGAGTAGTATCTGGGAAACTGCCCTGAAGAGGGGGACAACAGCTGGAAACGGCTGCTAATACCGCATAAACCCTGCGGGGGAAAGGAAGGCAACTTCCGCTTCAGGATGTGCCCAGAAGGGATTAGCTAGTAGGTGAGGTAAAGGCTCACCTAGGCGACGATCTCTAGCCGGTCTGAGAGGATGACCGGCCACATCGGGACTGAGACACGGCCCGGACTCCTACGGGAGGCAGCAGTAGGGAATATTGCACAATGGGGGGAACCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGGGGAGGAAATTAAGTTAGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATAACTGGGCGTAAAGGGCACGCAGGCGGGCTGATAAGTAAGGTGTGAAATACCGGGGCTCAACCTCGGGGCTGCATTTTAAACTGTCAGTCTAGAGTATTGCAGAGGGAGACGGAATTCCGGGTGTAGCGGTGAAATGCGTAGATATCCGGAAGAACACCGGAGGCGAAGGCGGTCTTCTGGGCAAATACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGATTAGGAGATTGAGCAGAAGCTTGGTTTTCGGAGCAAACGCGCTAAATCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGACCTTGACATCTGAGGAATGCCTGAGAGATTTAGGCAGTGCCTTCGGGAGCCTCAAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTTTGTTGCCAGCGCGTGATGGCGGGAACTCAAAGGAGACTGCCGGTGACAAACCGGAGGAAGGCAGGGATGACGTCAAGTCATCATGGCCCTTACGGTCAGGGCTACACACGTGCTACAATGGGGCGTACAGAGGGAAGCGAGGCCGTGAGGCGGAGCGGAGCCCACAAAGCGTCCCACAGTTCGGATTGGAGTCTGCAACTCGACTCCATGAAGGCGGAATCGCTAGTAATCGCAAATCAGAATGTTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGATTGCACCAGAAGTGGCTTGCCTAACCCGTAAGGGAGGGCGGTTACCACGGTGTGGTTTATGACTGGGGTGAAGTCGTAACAAGGTAACCCTAGGGGAACCTGGGGTTGGATCACCTCCTTA
>JH835900.1/331024-330895 Erinaceus europaeus unplaced genomic scaffold scaffold00612, whole genome shotgun sequence 
CTCCATGAATCTTTGAGTCCTGTTGACTGTGGCAAATATCCTTCCTAGACACAGAAGAGCATATTCTTGTATACTGACATAGCTGCCATCAGTTAATTGATTTCAGTTCTAACTTTCACAAGTAACATTT
>AANH01013162.1/16565-16141 Gasterosteus aculeatus cont1.013161, whole genome shotgun sequence. 
CCTCTTCAGACTCTACCTCGACTAAAGACTAACAAATTGTAGCACTTAAATTGTACTTGTAACGTGACTCATCTATAGCAAATTGTAAATTGGCTTATTTGAGGAAATTGCACTTTCTTGTTTCTTGTTCTCCTTTGTACCCTATGGTTGAATGCACTTATTGTACGTCGCTTTGGATAAAAGCGTCCGCTAAATGACATGTAATGTAATGATGGTGTCAAGCGCCTGGCTCAGACGGTGCGGTACACCTGTCAAACGGTAACGCAGGTGTCCAAAGGCGAGCTCAGGGAGGACAGAAATCTCAGAAGGGCAAAAGCTTGCTTGATCTTGATTTTCAGTATGAATACAGACCGTGAAAGCGCAGCCTCACGATCCTTCTGGCGTTTTGGGTTTTAAGCAGGAGGTGTCAGAAAAGTTACCACAGG
>ABLF02002078.1/866-1 Acyrthosiphon pisum strain LSR1 Contig2110, whole genome shotgun sequence. 
CCGGCAAGCCTCGACGAGTAGGATGGCGCGGCGGTGTGCGTCGAAGGGCAGGTCGCGAGACCGCCTGGAGCCGCCGTCGGTGCAGATCATAGGTGGTAGTAGCAAATACTCGAGAGGGGCCCTCGGGGGCTGCCGTGGAGAAGGGTTTCTTGTGAACAGCCGTTGTCCAAGAGTCAGTCGATCCTAAGCCCGGGGAGAGATCCTCGTACCACGGGCGAAGGCGTTTTCGAATCGCCCTTGGGGCGAGAGGGAATCCGGTTCGTATTCCGGAACCCGACGCGGAACCGCTCCCTAGTGTTCGGGGCTCTTTTGTCTCGTCTGGGTAACCAGAATGAACTCGAAGAAGCCGCCGGGGGATCTGGGTAGAGTTCTCTTTTCTCTGTGAGCGTTGTACGTCCCTGGAATCCTCTAGCCGGGCGATAGGGACGCGAGCGCGAAGAGCACCGCTCGTTGCGGCGGTGTCCGTGATCCCCACGCGGACCTTGAAAATTCGAGAGAGGGCCACGCGGAGTCTTCGCGTCGGTTCGTACCGATATCCGCAGCAGGTCTCCGAGGTGAGCAGCCTCTAGCCGCATAGAATAATGTAGGTAAGGGAAGTCGGCAAAACCGATCCGTAACTTCGGGATAAGGATTGGCTCTGAGGAGCGTGGCTGCCGGGTTCGGGTCGTCGTAGAAGCGTAGGCGTTTTTGGCGACACCCCGGCCGTCGCCCGTGCGCCCGGTCTTCGGAACGGGAGCCTCGAGGCGGCCGCGGGCCCGTCGCCGTCCGCCGACCGTGGAACCACCGAGCTTCGGTCGCTGGCCGCGTCGCGGCCGGCCGACCGCACATTGGTGTCGGTTCGCCGTCACCGGGCGGTCCGGCCGCCG
>AYUG01116302.1/14860-14978 Fukomys damarensis contig116302, whole genome shotgun sequence. 
CTCTAGCAAAGTAAGTTTCTTTACTTGTGGATGCACAGTGGCTTCACACAGCAACTCCTTTAGTTGTGTACACAGACTATTGTTTGTATGGGTCGCCCTAAGGGACCTTAAAGAAGTTT
>KK502427.1/433055-433166 Glossina austeni unplaced genomic scaffold Scaffold27, whole genome shotgun sequence. 
GGCAAGGGCACTCTGTGACACTTGTTATTAATTTTAAAGTGTAAACAATTTGTTACCTTGCCAGAATAAATCAATTACGTAAAACCTTAACCAATGTCGTATTATAGATTGA
>CM000999.2/44792791-44793384 Mus musculus chromosome 6, GRC primary reference assembly. 
TTCTATAATTCTTTCTATACGAGTACACATTTTCATCTTGCAAGAAACAACCAAAACTAATTTAAGAAATATTATCAAACATGTTAATAAAAATTGAGTGTTAATAAAAATAACTAAAATACAAAATTATTGGATACTTAGATGGTGAACTATGCCTGGGCAGGGCGAAGCCAGAGGAAACTCTGGTGGAGGTCCGTAGCGGTCCTGACGTGCAAATCGGTCGTCCGACCTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCTCTGAAGTTTCCCTCAGGATAGCTGGCGCTCTCGCTCTTTTCCCGACGTACGCAGTTTTATCCGGTAAAGCGAATGATTAGAGGTCTTGGGGCCGAAACGATCTCAACCTATTCTCAAACTTTAAATGGGTAAGAAGCCCGGCTCGCTGGCGTGGAGCCGGGCGTGGAATGTGAGTGCCTAGTGGGCCACTTTTGGTAAGCAGAACTGGCGCTGCGGGATGAACCGAACGAATTATATTTTATATAATGTATATGAAATATCAAATATTAAGGAATGACATTTGATTTTGTTGTGTAATTGTATCATGCATCTTTT
>MRAE01000082.1/2029-1 Clostridium sp. IEH 97212 scaffold_81, whole genome shotgun sequence. 
CGCAAATAGGCAGAGATCCAGGGATTTCCGAATGAGGGAACTCACATGGGTAACCCCATGTATCATGCACTGAATACATAGGTGTATGAGGGTAAACCCGGGGAACTGAAACATCTAAGTACCCGGAGGAAGAGAAAGAAAAATCGATTTCCTAAGTAGCGGCGAGCGAACGGGAAAGAGCCCAAACCAGAAACTTGTTTCTGGGGTTGAGGATAGATCATAAAAGAAGAGGTATCTTAATCGAAAAGGGCTGGAACGCCCTACCATAGAAGGTAATAGTCCTGTAGATGAAAAGAGAAAACTTCGAGATCTAATCCAGAGTACCACGAGACACGTGAAACCTTGTGGGAAGCAGGGAGGACCACCTCCCAAGGCTAAATACTACCTAGTGACCGATAGTGAAGCAGTACCGTGAGGGAAAGGTGAAAAGAACCCCGGGAGGGGAGTGAAATAGAACCTGAAACCGTGTGCCTACAACCGATCGGAGCACGTTAAAGTGTGACGATGTGCTTTTTGTAGAACGAGCCAGCGAGTTACGCTATGTAGCAAGGTTAAGTACTTAAGGTATGGAGCCGAAGGGAAACCGAGTCTGAAAAGGGCGAAAAGTTGCATGGTGTAGACCCGAAACCGGGTGACCTATCCATGGCCAGGTTGAAGCGAGAGTAAAATCTCGTGGAGGACCGAACCACGTTGGTGTTGAAAAACCATGGGATGAGCTGTGGATAGCGGAGAAATTCCAATCGAACTCGGAGATAGCTGGTTCTCCCCGAAATAGCTTTAGGGCTAGCGTCGTGTAATTGAGTAATGGAGGTAGAGCACTGAATGGGCTAGGGGCTATAGTAGTTACCGAACCCTATCAAACTCCGAATGCCATATACTTGTATCACGGCAGTCAGACTGCGAATGATAAGATCCGTAGTCAAAAGGGAAACAGCCCAGACCATCAGCTAAGGTCCCAAAGTGTAAGTTAAGTGGAAAAGGATGTGGGATTTCTAAGACAACTAGGATGTTGGCTTAGAAGCAGCCACTCATTTAAAGAGTGCGTAATAGCTCACTAGTCAAGAGATCCTGCGCCGAAGATGTCCGGGGCTCAAACTTACCACCGAAGCTATGGGGTGTACACTATGTGTACGCGGTAGGGGAGCTTTCTGTATGGGTTGAAGTCGTACCGTAAGGAGTGGTGGACTGTACAGAAGTGAGAATGCTGGCATAAGTAGCGAGAAATAAGTGAGAATCTTATTGGCCGAAAACCTAAGGTTTCCTGGGGAAGGCTCGTCCGCCCAGGGTTAGTCGGGACCTAAGCCGAGGCCGAAAGGCGTAGGTGATGGACAATCGGTTGATATTCCGATACCACCTATTTACGTTTGAGAGATGGGGTGACGCAGTAGGATAAGATGTGCGCACTATTGGATGTGCGTCTAAGCATTTAGGCATGCTTGATAGGCAAATCCGTCAGGCTAAGCTGAGATGTTATGGGGAGCCAAATGTGGCGAAGTATCTGATTCCACACTGCCAAGAAAAGCCTCTATCGAGTAAATAGGTGCCCGTACCGCAAACCGACACAGGTAGGTGAGGAGAGAATCCTAAGGCCATCGGAAGAATTGCTGTTAAGGAACTCGGCAAATTGACCCCGTAACTTCGGGAGAAGGGGTGCCTACGAAAGTAGGCCGCAGAGAATAGGCCCAAGCAACTGTTTAGCAAAAACACAGGTCTCTGCTAAAGCGAAAGCTGATGTATAGGGGCTGACGCCTGCCCGGTGCTGGAAGGTTAAGGGGAACACTTAGCGAAGCGAAGGTGTGAACTTAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCCGCACGAATGGCGTAATGATTTGGGCACTGTCTCAACAGCAAATCCGGCGAAATTGTAGTGCAAGTGAAGATGCTTGCTACCCGCGATTGGACGGAAAGACCCTGTAGAGCTTTACTGTAGCTTAGCATTGAATCTCGGTATTGTCTGTAC
>KV454051.1/1465-1655 Pachysolen tannophilus NRRL Y-2460 unplaced genomic scaffold PACTA_scaffold_41, whole genome shotgun sequence. 
ACCTGTTTGCCAACACTCTGGTGCCGAATCAAAAAGATTTTATATATTTCTTTTTCGATATATTCGGTTCCTATTTTGGAGCAAACTAGATTGATTTAGCCAATTACTCACCATAATATTCGTGATTTATTTAAAAAAAATTTTTTTTTTAGATTAAGATGAATATGATGGTCCATTTCAGTGGCGTAAAT
>ACSJ01000007.1/1211646-1211440 Clostridium botulinum D str. 1873 CLG.Contig181, whole genome shotgun sequence. 
CAATAAAATATAAAAATAGGTGTCAGTTATAATAAAAATTTTAATTATGAACTGGTGAAAAGGGAAGATGGGTGTAAATCCTACACGGTCCCGCCGCTGTAAATGAGGAGCTTTTTTATGTGTAACCACTGGTGTTATTTATACTGGGAAGGATAGAAAAGTGATGATACTTAAGTCAGAAGACCTGCCTATTTTTGTACACCGATG
>ALAR01116409.1/116042-115647 Tupaia chinensis contig116409, whole genome shotgun sequence. 
AAAAGAGTAATGAAATTTCAAAACAAAATATAGAAGCTACATGGTCACTTTTACCAGCTTATGGTGAAATGAAAGGGAAAAAGGATGATTTCAAGAAAGAATTTATAATGAAAAGGGAATTAGGTTCAGTCCTCTGACTCCAGAGCGACCAAAATGGGCACTGCGGCGGGTCCAGTGCAGTGATGCAATCATCCTGGAGAAGCTGCTTGAGTCCCTGGGGAGAGTTCTCTTTTTTGTGGACATAGTGGGGTCACCCCGGGGAAGGGGTCCATGCCTTTAAAATGCTGTGGTTCCCGTAAGTTCTTACTGGCCCTTAAAAAATACAAGGGAGAAGGTATAAATCTACCACCAGGCCACACACATATCCGCAGCAGGTGTCCAAGATAAACAGCCTCT
>KZ248601.1/687242-687373 Danaus plexippus plexippus isolate F-2 unplaced genomic scaffold DPSCF300057, whole genome shotgun sequence. 
GCTGGCTTTTATCGAAGCTCTCATATTTTTCCTATAAATATGGAAGTCAAACAAAGCCTATAGTGAAGATCTCTATCGGTCGCGGTCTAGGTAAATCATACCTCTAACGTATCACCAAGGAGGTCAACAGTT
>LRGB01001036.1/60242-60133 Daphnia magna strain Xinb3 scaffold01036, whole genome shotgun sequence. 
TCCTATTGTACCGCAGCTGCTGAACACTGCCCAAGATTGGCGTGAACAATTCTAACGGAAGGCAACTCTTGTGCGTGTGACAGCGGCTATGGTATTCAGGAAATATCTTC
>AACT01048137.1/180-1 Ciona savignyi cont_48137, whole genome shotgun sequence. 
TACCTGGTTGATCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCAAGTCTAAGTACGAGCTCTCGTACAGTGAAACTGCGAATGGCTCATTAAATCAGTTATGGTTCATTTGATCGTACAGTTTACTTGGATAACTGTGGTAATTCTAGAGCTAATACATGCGAGAAGCG
>ACJG01011252.1/789-1 Daphnia pulex DAPPUscaffold_852_Cont11252, whole genome shotgun sequence. 
CGACCTGAGAGCAGGCAAGGTGACCCGCCAAATTTAAGCATATTAATAAGCGGAGGAAAAGAAAACAACCGTGATGCCCTTAGTAATGGCGAATGAAACGGGCAGAGCCCAGCACCGAACCGCCGGCCATCCAGGTCGCGCGGAATGTGGTGTTTGGGGGAGCCTCCTCGCGACGCGTCGGCCGGTCCAAGTCCACCTTGACTGGGGCCACGGCCCACAGAGGGTGATAGGCCCGTAAGACGGCCGATGCGTTGTGCCGGCTTTCCCCTAGAGTCGAGTTGCTTGGGAGTGCAGCTCAAAGTGCGTGGTAAACTCCACGTAAGGCTAAATATGACCCCGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGTTGAAAAGAACTTTGAAGAGAGAGTTCAAGAGTACGTGAAACTGTGTAGTGGTAAACGGAGGGGCTCTCGAAGTGGGTCTCGGAGATTCAGGTTGGCGGCCGGGCGGCCGGGGCGAGCGCGATCCGCGAGGACGCCTCGTTTCGGTCGGCTCGGTCGGCGGCTGCACTTCTCCGGGACTTGACGCGACGAACCGCTGTCTGCGGAACGAGGACCGGGGTGAAGTTCGTCGTCCTCACGGGCGGCGAGCCCCCGGCTCCTGTCTTCGCGGGCGGCGGGTATCTGAGTCGACTTGTATAGCAAGCCCTCTCGCTAGGGCGGTCGGCATCTCTGTCGCGAGTAGGTCGGCGGCCCCTCCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGTGTGCGAGCCATTGGGCGGACTAA
>CM000780.4/228503464-228503665 Zea mays cultivar B73 chromosome 4, whole genome shotgun sequence. 
ATACCTTTGTCGACCTGTTGACTAAGATAAAGTGTAATGTTTGTTCTTACTAGTTTGATATCTGATATGTGGATCGTATGTTCACTTTATTAAATTTTATTTTTTTATGGGTATCAAATATGATTGTGTGTCTATCGGGGTGATAATTAGGGGTACCCAGATTATCCCTCCGAAAAACGCACTCAGGAGAAGTAAACACATA
>KN819335.1/889548-890013 Paxillus involutus ATCC 200175 unplaced genomic scaffold PAXINscaffold_13, whole genome shotgun sequence. 
ACAGTCCGAAAGTTACGATGCTCACCACACACTGCAAGACATGTCAAAGATCGTGAGTAGACTAAGGTCTGAGTATTCTATTCTCAATCGACTCTTCCTGGGTTCATTCCTAACGGACTGCGCGATGTCCAGAAATGCAATAGCCAGTTTCCCCACGGTTACTGAGTTAGTAGGGACGGACAACTTTGAAAATGCGTCGCAGAGATCGGGTGAGCACCTTTCCTCACTTGATTCCCTGTTGCGGTAGACGTGCCCATCATTGCGCGCAACGTGATCGCGTTCTTCGTTCGCATTCATGTCCGCGTATTAGGACATCGGGTCCGACGAATCAACCGCGGCTCGTACTAGCAGTCATCAATACTACACCCCATCACGCGACTGCAACCAAGTCAACTCGATTATTTTTTCTCGTACGAGATTTTTCAATCATCTTTTGAAACTCGATTCAGACTACTCTTAGGACTGT
>AASG02001279.1/18109-18241 Ricinus communis ctg_1100012357581, whole genome shotgun sequence. 
TGTCATGCTTTTCCACAGCTTTCTTGAACTTCTTCTTCTTCTTCTTCTTCTTCTTAGATTTCTTTCTCATTGCCTATATCTTTCTTGATGTGGCACAGAATAAGTTCAAGAAAGCTGTGGGAGAACATGGCAA
>JH835358.1/2695321-2695604 Erinaceus europaeus unplaced genomic scaffold scaffold00070, whole genome shotgun sequence 
GGATCTTAGTGTGATCTGGCTGTGACATCTGTCACCCCATGGATAACATGGGTTGATTTGGCTGGTCTGGCTCGCTAGACGAGTGTCCTCTTCCTCCCTCACTGCTCCTTGTACGTTCAGTCAAAGAGGACAACCTTCCTGAGTCTTGGGTCAAAGGGTATACGAGTAGCTACACTCCCCTGCTAGAACCTCCAAACAAGCTCTCAGTAAGTTTTGCTCTTTATTTTTTTCCCTTTTGTTGCTTATCTTTGTTACTATTATTGTTGTTACTGCTGTCGTTGTTG
>CM001941.2/563785-564154 Chlorocebus sabaeus isolate 1994-021 chromosome 1, whole genome shotgun sequence. 
GCCGGGCATGGAGATGTGCACCTGTAGTCCCAGCTACTTGGGAGGCTGAGGCGGGCGGATCACTTGAGCCCAGGAGGTCAAGGCTGTAGTGAGGCGTAATCACACTACTGCACTCTAGCCTGAGCGACTGAGACCCTGTCTTGGAAAAAAGAAAAAAAAGGATAAGATGGGACATTTTACATTATTTTTTTTTTTTTTTTGAGACGGAGTCTCGCTTTGTCANNNNNNNNNNAATGTAAAATGTCCCATCTTATCCTTTTTTTTCTTTTTTCCAAGACAGGGTCTCAGTCGCTCAGGCTAGAGTGCAGTAGTGTGATTACGCCTCACTACAGCCTTGCCCTCCGGGGCTAAAGTGACCCGCCCGCCTCAG
>GL018725.1/468056-468262 Oryctolagus cuniculus unplaced genomic scaffold chrUn0027, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGCAGAATCTCTGTTTCAGAGTCCCCCAGCCATCACGGCGCCTGCGGTCCCTTTTTTTTTTTTTTTTTTGACAGGCAGAGTGGACAGTGAGAGAGACAGAGAGAAAGGTCTTCCTTTGCCGTTGGTTCACCCTCCAATGGCCGCCGCGCTGATCCGATGGCAGGAGCCAGGTACTT
>MRDE01000088.1/1-303 Tersicoccus phoenicis strain 1p05MA scaffold90_cov825_read201, whole genome shotgun sequence. 
GTGACGGCACTTCGCGTGCTCGAGCGGGTGTGGGCCGCAGAGACCAGGGGGAAGCGACTGTTTACTAAAAACACAGGTCCGTGCGAAGTCGCAAGACGATGTATACGGACTGACTCCTGCCCGGTGCTGGAAGGTTAAGAGGACCGGTTAGCGCCCCTCGCGGGTGCGAAGCTGGGAATTTAAGCCCCAGTAAACGGCGGTGGTAACTATAACCATCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGAGTAACGACTTCCCCGCTGTCTCAACCATAAACTCGG
>CM000380.2/94669007-94668751 Equus caballus chromosome 4, whole genome shotgun sequence. 
TCGAAGTTTCCCTCAGGATAGCTGGCACTCTCACATGTGAACCCAGGCAGTTTTATCCAGTACAACGAATGATTAGAGGTCTTGGCGCCAAAACGATCTCAATCTATTCCCAATGGGTAAGAAGCCCACTGGCATGGAGCTGGGCATGGAACACAAGGGCCTAGTGGGCCACTTTTGGTAAGTAGAAGTGGCACTGCACGATGAACTGAACACCAGGTTAGGCATTGATAACTTGATAACTATAGTTTTATAATAGA
>CM000941.1/92177923-92177799 Anolis carolinensis chromosome 5, whole genome shotgun sequence. 
ATTTTCCTGACTACTGAAATGCCCTCAATGTACCACATCCCATTTGATCTTGGAAACAATGCAGGATTAGTCCTGATTAGTACTTAGATGGGAGACCACCAACGAATACTAGGAACTGTAAAAAC
>LBBL01000003.1/104201-103670 Ceratocystis platani strain CFO contig_00003 mitochondrial, whole genome shotgun sequence. 
GAGTTTGGTGATGGCTCTGATTGAACGCTGTCTAAGTGCTTGACACATGCTAATCGAACGATTAATACAGTTAAAAAAAAACTAAATTAATAGTGGTGTACAGGTGAGTATAAGATATTTTTGCCGACCTTAAAGTAAGAGGACAATAAGATCTCTTATAAACAAAAGGGTTGTACCGCTTTAAGAGGATGAGAAATATCATAGAGAGAGGTAGTTGTTAAAGTAATGATTTAGCTAGCCGCAGATTCTCTTAGTCGAAACTGAAAGGTTGATCGACCACATTGGGCCTGAAAAAATCCCAATGCAAAAACGTACAGCAGTGAGGAATATTGGTCAATGGTCTAACGATCGAACTGGCAACTTAGGGAAATGGATGATATAAAATAATTATATAATAAAGTTTATATAATAATTATTAATATGCAATAGTTGTGAAGTTTTGTCTACATATTGATAATGACAATATGTATAAACAGTCTCGACTAATTACGTGCCAGCAGTCGCGGTAATACGTAAGAGACAAGCGTTATTC
>CM000762.3/2300100-2300430 Sorghum bicolor cultivar BTx623 chromosome 3, whole genome shotgun sequence. 
CTCCCAAGAAACCTCAGGGTCCCAATGGGCCTTCATCATGAATCGAAAAGGGCCCATGGGAGAGGGAAACAGCCCGGATCACCAGCTAAGGCCCCTAAATGACCGCTCAGTGATAAAGGAGGTGGGGGTGCAAAGACAGCCAGGAGGTTTGCCTAGAAGCAGCCACCCTTTAAAGAGTGCGTAATAGCTCACTGATCGAGCGCCCTTGCGCTGAAGATGAACGGGGCTAAGCGATCTGCCGAAGCTGTGGGATGTCAAAATGCATCGGTAGGGGAGCGTTCCGCCTTAGAGGGAAGCAAACGCGAAAGCGGGGGTCGACAAAGCGGAAGCG
>JSZA01002193.1/1101-1450 Candidatus Thiomargarita nelsonii contig_2193, whole genome shotgun sequence. 
AGATCATTATGAGAATCCCCGTAATGTGGGCACATTGGATAAAGAGGATCCGTCAGTGGGGACGGGCATGGTTGGCGCACCAGCTTGTGGTAAATAACATTGCCACGTAATTCTGCTATATGCAAGAAACTCTCGTTAGGTTGTAGGTACTAATGTTTAACCAAACACGCAAAATAACAAAATAGTGTGCCCAAATACTTGAGTAAAATACTCAAGTATTAACCAGATGGGTTAGTAAAAACCCTACAAATAGAGACAATTTGCAAGGAAGTCGTGGTTGACCCTTCAGAGACTATACGCAGAACATCAATGAGATGAAGACATAGTCCGAACTACACGGAGACGTGTAG
>MKUE01000019.1/22195-22263 Thiobacillus sp. 65-1059 scnpilot_expt_750_p_scaffold_1345, whole genome shotgun sequence. 
GAACTGAAGAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGAATGCTTTACACATGCAAGTCGAACGG
>URS0000D699AF_12908/1-539 unclassified sequences ROOL RNA 
AATCAACGCGAAGGATTGTTTCAACCATGTGTATTCACAATTCCATGTGGTCATGGACGTGTTCAAGGAGTTCCACTATGGAGGATACCCCATAGGTAGGCTTTACCAGATAGGTAGAAGAGATGGAAAATCTCAACCGAGCAGGCACGGTGCTGTGATGAAACGCAAGAAAATGGTATTGCTAACTGGTCGCTATCGCAATAGATATGAGGTACGCACCTCATTGAACCAAGTAGAGGATAGTGTGGCAGCTATGTCAATCGCTTGGAGTGCCATAAGATAGTTGTCCAATTGATGCTGGTAATCAGATATAAGACCAGACGCGAGTACGAGTAGCCCAAAGTTGGAATATATTAGAAGATTAATATGCTGAATGGTGGGTGAAAGTTGTTGGTAGCCAATCCAGCCATAGATTGACGTAAGTTGGGATGGAAAGATATGGGGTCGCTCCCTGTGTCTCAGCTCCATTTCCTATGTGACCGAATTACCACTACGTTTTATGAAGGTACGATGAAGATCGGAGACAATCTTTCGCGTTG
>CM001752.1/52724704-52726253 Gossypium raimondii chromosome 13, whole genome shotgun sequence. 
CAAAAGAAGAGTTTGATCCTGGCTCAGAAGGAACGCTAGCTATATGCTTAACACATGCAAGTCGAACGTTGTTTTCGGGGAGCTAGGAAGAAGGAAAAGAGGCTCCTAGCTAAAGGTAGCTTGTCTCGCCCAGGGGGTGAGAACTGTTGAGAACAAAGTGGCGAACGGGTGCGTAACGCGTGGGAATCTGCCGAACAGTTCGGGCCAAATCCTGAAGAAAGCTAAAAAGCGCTGTTTGATGAGCCTGCGTAGTATTAGGTAGTTGGTCAGGTAAAGGCTGACCAAGCCAATGATGCTTAGCTGGTCTTTTCGGATGATCAGCCACACTGGGACTGAGACACGGCCCGGACTCCCACGGGGGGCAGCAGTGGGGAATCTTGGACAATGGGCGAAAGCCCGATCCAGCAATATCGCGTGAGTGAAGAAGGGCAAGGCCCGCTCGTAAAGCTCTTTCGTCGAGTGCGCGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGAGACATGCCGCTTAGAGTGAAAAGTCTTTGCAACCGAAGTGAGCCGACGGAGCCGAAGTGACGGGCCAAGCTCTTCTAATTGAGCGCCTGCACGTAAGCTGTGCTGTCAGTAAGAAGGGGAGCCCGCCGCCTTTCGAATTTGAAAGCACTTTTCTAGTGTGCGCTGTTTTTGATTGCAGCTAGCGAGCGAAGAAAACGGATGGCGCGAACGCGGCTTTTCTTTCGCCTTGCTTGTTGTACTAATAACATAGAAAGGGCTTTCTTTTCTCGCTTGTTTAGTAAAGTCAAGTTTTTGGCCTTATCTTGCAGGTGACGACGACGTCGAGTTGGCGGCGGAGAAAGACTCGGCATTCAGGCGAGCCGCCCGGTGGTGTGGTACGTAGTGGGTTTAGTACGCCCCGCCAAAACAACTCCGAAACAAACGAAAAGGTGCATGCCCCCCTTCCGAGGGACTGCCAGTGATATACCTCACGAAGGTGGGGATGACGTCAAGTCCGCATGGCCCTTATGGGCTGGGCCACACACGTGCTACAATGGCAATTACAATGGGAAGCAAGGCTGTAAGGCGGAGCGAATCCGGAAAGATTGCCTCAGTTCGGATTGTTCTCTGCAACTCGGGAACATGAAGTTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATATGTACCCGGGCCCTGTACACACCGCCCGTCACACCCTGGGAATTGGTTTCGCCCGAAGCATCGGACCAATGATCACCCATGACTTCTGTGTACCACTAGTGCCACAAAGGCTTTTGGTGGTCTTATTGGCGCATACCACGGTGGGGTCTTCGACTGGGGTGAAGTCGTAACAAGGTAGCCGTAGGGGAACCTGTGGCTGGATTGAATCCTTC
>MCGO01000050.1/321272-322593 Rhizoclosmatium globosum strain JEL800 BCR33scaffold_50, whole genome shotgun sequence. 
TACCTGGTTGATCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTCTAAGTATAAACTCGTTTGTACTGTGTGAAACTGCGAATGGCTCATTAAATCAGTTATAGTTTATTTGATATAACCTTACTACTTGGATATCCGTGGTAATTCTAGAGCTAATACATGCAATTAAAATCCTGACTTCTGGAAGGGATGTATTTATTAGATAAAAAACCAACCCGGCAACGGTTCTTTGGTGATTCATAGTAACTTTTCGAATCGCATGACTTTACGTCGGCGATGGTTCATTCAAATTTCTGCCCTATCAAGTTTCGATGGTAGGATAGAGGCCTACCATGCTTTTTACGGGTAACGGCGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCTGATTCAGGGAGGTAGTGACAATAAATAACAATCCAGGGCTTTTGTCTTGGAATTGGAATGAGAACAATTTAAATCTCTTAACGAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAATAGCTCGTAGTTGAATCTTGGGCCTGGTTTGGCGGTCGCGCTTTAGGGCGTGTACTGTCGGCCGGGTCTTTTACTTGCGGGGAACGTGCGTGCCTCTCGGGGTGTGTACGGGAACCGTGGCTATTACTTTGAAAAAATTAGAGTGTTTAAAGCAGGCGTAAGCTTGTATACATTAGCATGGAATAATAGAATAGGACTTTGGTTTTATTTTGTTGGTTTCTAGGGCCGAAGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTTAATAGTCAGAGGTGAAATTCTTGGATTTATGAAAGACTAACTTCTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTCAGGGGATCGAAGATGATCAGATACCGTCGTAGTCCTGACCGTAAACTATGCCGACTAGGGATCGGGCGTTGTATTTCATGACACGCTCGGCACCTTATGAGAAATCAAAGTCTTTGGGTACCGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTCCAGACATAGTAAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGATAACGAA
>AP009608.1/824477-824563 Mycoplasma fermentans PG18 DNA, nearly complete genome. 
CGGTAGTTGCTCGAGAGGCTGAAGAGGTTGGTCTCGAAAACCAATAATGGTGAAAGTCATTCAAGGGTTCAAATCCCTTACTACCGG
>CP001719.1/360474-360390 Methanobrevibacter ruminantium M1, complete genome. 
GCCATGATGACTGAGTCAGGCTTAAGGTATCCGCCTTGAGAGCGGACGTATGAAAGTACCAGAGGTTCAAATCCTCTTCATGGCG
>LFJF01047615.1/1-2366 Macrostomum lignano unitig_47682, whole genome shotgun sequence. 
ACTTTTTGAGCCCCGTAATTGGAATGAGTACACTTTAAATCCGTTAACAAGTATCTATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAATGTTGCTGCAGTTAAAAAGCTCGTAGTTGGATCTGAGGACTCGAATTGGTGGTGCACCCATACGGTGTTACTGCCCGATTCGGCCTACCTAGTCGGTGCTCGCTCTTGGTGTTCTTAATTGAATGCCCTGAGTGCCCGGCAAGTTTACTTTGAAAAAATTAGAGTGCTCAAAGCAGGCCATTAGCCGGAATACTTCAGCATGGAATAATGGAATAGGACTTCGGTTCTATTTTGTTGGTTTTCGGAACCCGAGGTAATGATTAAGAGAGACAGACGGGGGCATTCGTACTGCGGTGTTAGAGGTGAAATTCTTGGATCGCCGCAAGACGAAACAACTGCGAAAGCATTTGCCAAGAATGTTTTCATTAATCAAGAAACGAAAGTCAGAGGTTCGAAGACGATCAGATACCGTCCTAGTTCTGACCATAAACGATGCCAACTGGCGATCCGAGATCGTTTGCTTATTTGACCTCTCGGGCAGCCTCCGGGAAACCAAAGTTTTTAGGTTCCGGGGGAAGTATGGTTGCAAAGCTGGAACTGGCAAAAATTGAACGGCAAGTGCACAACCAAGTGGTGGAAGGCCCTTGCGGCTTTAAATTTGACTCAAACCCGGAGTAAGATATTTACTTCACTTGTGTGTCGTTAACTGTTCTCCATAACGAATCAGGACACTCCAGGATCAGCTCCCCTATGAGTGTTAGCAAAGTTCAAATTCAAGAATTATTTGATTGTCCATGAGACAGTTAGAATTGAAGAGCAATTACAAAATTTGTATTATGCTATGATATTCCTAATGGTAGGTTTTAACCCTTCTAAATTGCGGCAGTGGCCTGACTTTGAGTGTAACAGGGTAATCTGGTTAGAAAATGTTTAAAGTCACTGAGACCCAGTTGGCCTTAAGTCTAAATTTCCCCCACGAACCTATTGGCTTACTCAGCGACTATATGTTCAGAGCCGCTGGGCGATTAGATAAATTCTTGCAGGCTATCAACGATCGAAATCCTTTGACCTAAGGCTTCCTACTGCACATGGCGGTACTGGTGCTTGAAGGCGGCTCCAGGTTACGATGATCCAAGACAAAAGAAAGTCTAATTAAAAAAAATACTCTCATCACCTGTTAAGCCTAAAAGACTTTGAACCAAAAAATCCGTGTGTGGAAAGGCAAGAAACTGCCTACGTAGGTACCAAAAGCTGCCCGTACGACCTTTATCTGGCTCCATTACCCGGTTTATTGAGGATTATCTGGGCAAGTGTCTTGGTCGACCACGGCTGGAATTTCGCGAAAGGCCACAAAAAGGATCAAGGGAATTTTAGGGTAATAGAAAGGAATCAAGAACTGTTACACAAAGGAAAATAAGAATTTATCGCGGTTAAAGGCGCAAAAATTGAGGGAAGTCGCTTTTCTTTGATCAGAAGCTGCTCGTTCCAAGTCTCATCGGCTGTCGTGGTGGGAAATCACTGCGATTTCAGCTGCCGTTAAGCCACGGAAGGGCCGGAGTAAACGTGAACGCTCGGCTGCTGGGACATCTAAGCGCTTTTCGTAGCAAGGATTAGGGTCATTATATGAGCCTACGGGGTGAACCTAAGGAATATTGACGGGCCAAGGGCACCACCAGGAGTGGAGCGCGCTGGCGCTTAATTGACTCCCACGGCGGAAAGACTCACGTACCGGAATTAGGACAAGCAGGGACAATTGAGAGCTCTTTCTTGATTTCGCGTGGGTGTGGTGCATGGCCCTTTGGCTCTTTAGTTGCCCGTGGAGCGATTTGTCTGGTTAATCCGTATACGAACGACTCTCTAGCCTGCTAAATAGTACGCCGAATTTGCGTGCACTGACTAGACGGACAATTTGCAAAATTTGACCAATAAAGGTACTGTGACAGTGCGCCTTAGAGTTCGCGCACGGCGAGCAGAAACAAGGTCTTTTTTCCTGGTTCGAAGAGCGCGGGTAATCTGTTGAATTCCCTTCGTGACAGGATTCCGGGTTGCAATTATTCCCGGTGAACGGGAATTCCCTTCCCAGTAAGACGCTCATTACCCTGACCTACTTGAGCCGAACCGGTAACTGCCCTTAGAGATTGTTGACGCCGCCAAGGTCCTCCGGATTGGTTTGCACCCGATGGGCGACTCTCTTGGCCGACTTGGTGCAACACTAGGTCGGATACTGAAAAGAAGATCAAACTTGATCATTTAGAGGAAGTAAAAGTCGTAACAAAGGTTTCCGTAGGTGAACCTGCGGAAGATCATTA
>KZ248836.1/34641-34948 Danaus plexippus plexippus isolate F-2 unplaced genomic scaffold DPSCF300292, whole genome shotgun sequence. 
ACTGGGAGCGTGGCGCCTCTTGTAATCCGTGCTACTCGGAGGTCGGGGTCGAGGGATGGTTTGAGGTTTGAGGTCCTGGGACTGAGATGGCCACAACAACCGGATGGCCACATTCAAGCCTAGTATGACTTTGATCTTCTGGAAGAGTCTAGACTCTAGAGGGTGCATTCTACGGAGGGATAACAGTTCAGGCCCAGGGAGACAACTCAGGGGCCTAGGAATCCCTTCGTACCGGGCTGGAGTGGAATTTAGCCGGGAGTGAACTAACTCAGTAACAACCTAACCGATATAACCAGACCCTTCCCTAT
>CP001899.1/298032-298087 Ferroglobus placidus DSM 10642, complete genome. 
GCCGATGATGACCCCTCCCCTAGCTGAAGAGTGATGAATTTGCCGATTACTGAGGT
>FAOM01693974.1/1165-1 Triticum aestivum genome assembly, contig: Triticum_aestivum_CS42_TGACv1_scaffold_693974_U_6BS-0.065204_1BS-0.034861 
CGGTGCGCCCCCGGCGGCCCATGAAAATCCGGAGGACCGAGTACCGTTCACGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGCCAATGGAACAATGTAGGCAAGGGAAGTCGGCAAAACGGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGACTGGGCTCGGGGGTCCCGGCCCCCGAACCCGTCGGCTATCGGCGGATTGCTCGAGCTGCTCACGCGGCGAGAGCGGGTCGCCGCGTGCCGGCCGGGGGACGGACCGGGAATTGCCCCTTCGGGGGCTTTCCCCGAGCATGAAACAGTCGACTCAGAACTGGTACGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAACGGGCTTGGCGGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGGATAAGTGGGAGCCCTCACGGGCGCAAGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCGTGGGTCGGAAGCGGGGCATGTCCCCTCCTTTTGGCTCCAAGGCCCGATCTTACCGGGCCGATCCGGGCGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTAGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGACAGTGTCGCGATAGTAATTAAACCTAGTACGAGAGGAACCGTTGATTCACACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGTGCCGGATTATGACTGAACGCCTCTAAGTCAGAATCCAAGCTAGCATGCGACGC
>AEAQ01007696.1/1567-1612 Solenopsis invicta Si_gnG.contig11298, whole genome shotgun sequence. 
TTAATTGCTCCTTTTGGAGCAATAAATATTGCAATATAAAAAATTT
>CM003288.1/100477756-100477466 Salmo salar isolate Sally breed double haploid chromosome ssa10, whole genome shotgun sequence. 
GGATGACGTGTCAGAGTTTGGGGTTCCTAATGGAAGTATCCACTCTGCATCATTTCCTCCTCATATCTTCCTTGTAGGGTACATAGTGGCCATCCTGTAACCAATTAGACAAGATATGCTCAATTTGTTCAGCATTTGGGCCGTGGTGCGGCCGGAAGCTTTGGCCTGAGGATATACGCAGCAGCTCTCGTTAAACTGAGGATCTGAGATAGTTTCTGACTTCACCATCTGGAATTCTAGTCTGGGGTTCTGCTAAAAGCTGCTGACCCACGATTCAACTCTTAAACTCAG
>AAVT01000001.1/231300-231180 Marine gamma proteobacterium HTCC2143 1100111000176, whole genome shotgun sequence. 
CGCAAACCTAAGGGGTGGCTTTTGCCTGAGATGCCTTGATCTGCTTGTTACTGTCGATCAACAGCGAACCCTTGAACCTGATCCGGTTAATACCGGCGTAGGAATAGGTGTCCCCAACCGA
>MHIN01000011.1/1-803 Candidatus Buchananbacteria bacterium RIFCSPLOWO2_01_FULL_40_23b rifcsplowo2_01_scaffold_14059, whole genome shotgun sequence. 
GAAGCTCCCAAGGGTTTGGCTGTTCGCCAATTAAAGCGGTACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTAGATTCGTGCTGTCTATAAATTCGGCTATATGCTGGAAAATCCGAGAATCTTATGATACTCATCCATAAAAATTGGGTAGTGAAAATTCATAAGTGCGGACAATCAGCAGGAAACTTAATAATAGTTTGTTATTAATAATATTATTTATGTTATTGCTAACAAAATTGTCGAGAGCGGCTTCTAATAAAAAAATTATATTATTAGAAGCGTTAAAATAGTAGTGATTGTAAATACAGTAGTGGTTTATAATAACCAATCTACATAAATTATTGCCGTAGACTCGAATTATTATGAATCCTCAGAGACTATACGCCGAAATTCCGATAAAAATCGGAAATAAGATATAGTCCGAACTGCATGGCGACATGCAGATTCCGGCAGAAATTGTCGGAACGCCATAGAGCAATTGATGTTTTAAGATATGGTTTTGCAAAGTAACAGATTGTCGGTCTCCTATCCACTGTGGGCGTTGAAATTTGAGGGGGCTCATTTTTAGTACGAGAGGACCAAAATGAATAAACCTCTAGTGTACCAGCTGTCCTACCAAGGGCACAGCTGGGTAGCTACGTTTAGTTTAGATAAGCGCTGAAAGCATATAAGCGCGAAGCTGTCCCCAAGATTAGATTTCGTTATAGGCTCCCGGGAGACGACCGGGTTGATAGGCGGTAGGTGTAAGGCCAGCAATGGCTTGAGCCGAGCCGTACTAATAGCCAATTTCTATTTAACCAC
>AP008230.1/3620544-3621014 Desulfitobacterium hafniense Y51 DNA, complete genome. 
TTAATGCTAATGACGAGAAAGAGTACACCTTAGCCGGAATGTCCAAGAGAGTCAGCGTTGGTGAGAGCTGATACAAACCGTTTGGTGGAATGGGTCTCTGAAGCGCAAGCTGAACGAATCTGCATCTTGACTATCAGGATGGAGATATCAAGTAGGCAAGCCGGGGGTTTCCCGTTACAGAAACACGGGTATCGAGAGCATGGATCATTCTCTCCGCATCCGGTTAGAGGTATGGGACAGCTTTTTTAATTCCAGCGGCTTGCGCTGACCCATATAAATTAAGGTGGCAACACAGAAGTACTTTCTGTCCTTTACATAGGACGGGAAGTTTTTTATTTTAAAATAAAGTGCCGCCCTCTCCGGATGAACAAGAGATGAAATTATGTTTTCTCCGTACCTGATAGAGGTACTTGTAGATACACTACACAAGTACAAATTAAGGTGGCACCACAGAAGCTTTCTGTCCTTTGG
>CM003280.1/7976717-7976643 Salmo salar isolate Sally breed double haploid chromosome ssa02, whole genome shotgun sequence. 
TGCCCCCGTGCGAGGAATCTAAGATAGAATTGGACTTTGCTGTGAAATTCTATCTTAGATTCCTCGCACGGGGGC
>MGZN01000446.1/306-243 Hydrogenophilales bacterium RIFOXYA1_FULL_63_33 rifoxya1_full_scaffold_3877, whole genome shotgun sequence. 
TCGGGGCGCCAGCCCCCGATGTCTGAGCACGATGCTCACAAGACGGTGTCCCGTCCAAGCCTGG
>LZPO01097937.1/23658-23530 Neotoma lepida isolate 417 scaffold_12034, whole genome shotgun sequence. 
TTTGCAGGCTGATGGAGTCAGCAAGGAAGAGGTTTATGAACAGCAGCCACTCTGCATAGGATGGCTGCAGGGAATGTTCTCATGCTTGCCCAGAGAAGTCTGCCAGGGTCACTGAGATACCTCTGAGAT
>CP011974.1/3783475-3783356 Bacillus endophyticus strain Hbe603, complete genome. 
AGACCCTTTAACATCAGTCCTGTGAGGCTGAGAAGGAAACGGACCGCAGATGCAGCAGGCGTCTGCAAGCTTACTATACCCGGCATCCTCTCAGTCACGGACAAAGAGGATGCTTTTTTT
>JXSO01000068.1/6302-6422 Achromatium sp. WMS3 contig-199_67, whole genome shotgun sequence. 
TAATTTTTTTAAATATTTCACATATATACCGACACAAAACGTAGGGTGCCTTAATTACCTTTAAATATTAAAGTGAATACCTGTTAAAAAGGTTACGTTTTGGGGCATATAGAGGCAAAAC
>CM002304.1/542199-542383 Ogataea parapolymorpha DL-1 chromosome V, whole genome shotgun sequence. 
CACTCCTGTTTCTGCCTCATATTCCCTTGCTCCATGGAATAATGGGTTCTGGTGATGGAGAAGATCAAGCCCGTCGTCGTCTCTGCGATTTGATACTTTGTTGAGTTCGAGGACGGGATCGTGAAAACGCATATACCCAGGGCTGCCAGACAGGTTGGCGGCTCTGAATTGTCGTTTCTACATCT
>ABJB010136869.1/1-805 Ixodes scapularis strain Wikel colony gcontig_1108379663008, whole genome shotgun sequence. 
CATCCGCAGCAGGTCTCCAAGGTGAACAGCCTCTAGTCGATGGACCAATGTAGGTAAGGGAAGTCGGCAAAACGGATCCGTAACCTTGGGATAAGGATTGGCTCTGAGGACTGAGCCGGTCGGGCTGGGGACCTGAAGCAGGAACGGCACTGCACCGGGACTGGGCGGGGCTCGCCGTTCACGCGGCGCGGCCAAGCCCGGACCAGCGTCGGGACCTTCCTGTGGAAAGCCTCAGCTGCGCGGCGTCTGAGGGCTTCGTGCCCAAAGTGCTATGCTTCGGCCGGCAAAAAACAGTCAACTCAGAACTGGCACGGACCGGGGGAATCCGACTGTCTAATTAAAACAAAGCATTGCGATGGCCGCTGGTCGGTGTTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAACGTGAAGAGATTCATCAAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTGTGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTATCTACTGGGAAGGAAGAAGAAGACCAGACCTCCTAGACCATCAGATTGTAAGCTGTATCGTTCCAGTAATTTTTCTTTAACTTCTAGCCATTATTTCTTAAAAACAACCTAGCGGTAGGATTTCTAAGAACTAGCGATCACCCTGTTATCAAATTTAAGACTGTTAACCCATTAATTTTTCTTAAAATACACCTTTGGAATCACTGTTTACACTGCGGCCATATTGCCACGGTTGTAGATGTTGAACCCCAAATTTGAAAATAACT
>CVUF01000026.1/144661-144885 Staphylococcus capitis strain CR03 genome assembly, contig: BN1517_Contig_4 
TTTTTATTCATAAGGCATCTCGGTAATTCAGTTTAGTGAAGTTTATTCAATGATAGGAAAGTGCCTTATATTTTAAAGTATATCGATGTGAAATTACATGGTAATATGTAGTATCTTTGACGAGATTCCTGAAGGAGCAGTCCCAGTCCTAAACCTAGATTGAGACGGACACACTGCGACACGAAACCATACTATACGAAGTAATGAATATAAAAGTAGCAGTAA
>KC954775.1/132832-132944 UNVERIFIED: Cronobacter phage S13, complete genome. 
GGGGTGATCGTCTAGTGGTAGGACGCTTAAAGACGCAAACTGATAAGTTTGTATTCAGCATTTAACTTTCCATTCCAAGGAAGAAACGCGTGGTTCGAATCCCGCTCACCCCG
>URS0000D67EE2_12908/1-83 unclassified sequences c-di-GMP-I-GGC riboswitch 
AAUAAAAAAGGUACAUCUGUCGAAAGUUUGGGGCGCGAAGCCGCGGAUUUAAUACGACAGCUGCGAUGAGCGGGCUACCGUGG
>KE355093.1/339-1 Streptomyces afghaniensis 772 genomic scaffold STAFG_scaffold694, whole genome shotgun sequence. 
GCGCAAGCGGCGGAGGCATGTGGCGTTAATTCGACGCAACGCGAAGAACCTTACCAAGGCTTGACATACACCGGAAAACCCTCGGAGACAGGGTCCCCCTTCGTGGTCGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCCGTGTTGCCAGCAGGCCCTTGTGGTGCTGGGGACTCACGGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGCCCCTTATGTCTTGGGCTGCACACGTGCTACAATGGCCGGTACAATGAGCTGCGAT
>ALWS01100951.1/21533-21438 Pteropus alecto contig100951, whole genome shotgun sequence. 
ATTTTCAGTTATAAGATAAGTAAGTTCTGCTAAGCAGGTTGGACCTGGTTAGTACTTGGATGGGAGACCACCCAGGAAGACCAGGTGCTGTAGGCA
>CP019433.1/1335117-1334970 Jeotgalibaca sp. PTS2502, complete genome. 
AATATTGAAAGAGGATGCGAAAAAAATCAGTAGGTTTCGAAAGGGTTTTTCGCCGAAATGCAGCTTAGCTGTGTTGGGGTCCGTTTGAATAAGACGGGAACTGCCTGATAGTCTTGCCCAAAGACTATTAAGGAGTGCTGTCATTGTT
>CM001241.2/28956953-28956880 Oryza brachyantha chromosome 1, whole genome shotgun sequence. 
GTGAGCCGTGTAATAGGCGACTATTTCGCGCGGTTCGGGGGGCACTTGAAATCTTGAATAAGCCGTCAGCCCTC
>ALWZ044178298.1/15950-15905 Picea glauca, whole genome shotgun sequence. 
TCAAAGGATTCCTTCGAATCCACCATGATCATATTTCGAAAATAGT
>CP012413.1/1770895-1770659 Piscirickettsia salmonis strain PM15972A1, complete genome. 
AAAGTTCAGCCCTGAAAATGCAGCTCAGCATATCAGGTACCGAGCCTTGAGTAAGTACTGGTAACAGTGCGTGCTAAGCGTAGGCAGGGAAATAATAGGCCGTAAGCCAAAGAGCTGAAGTGATTGAGCCTCGTAAACATAATACTGAGATAGCCGATGGTTTGGAATGTATCAGAAGGCAATATCGAATAGGACGTTAAGAGAAGAAATATTCGACATCTCCGGGGTCTTAGAGCA
>AGTP01050901.1/2323-2414 Ictidomys tridecemlineatus contig050901, whole genome shotgun sequence. 
GGGGATGTAGCTCAGTGGTAGAGCACCCTTGGGTTCAAATCCCAATACCTAACAGGGGTGGGGGTAATGGTGGTAAGGTCCCTCCATTACCT
>KE346365.1/91830-91967 Capsaspora owczarzaki ATCC 30864 unplaced genomic scaffold supercont2.6, whole genome shotgun sequence. 
ATCTTTGTGCAAGGGTGGTGCCATCGTGCGTGAGGGAATTCCCGATGCGTGGCTTTTTGCTGATTGCAAACTAAACATCCAAGCCCGCGACATGTGAAGCTTGCTTCCTGTCGCAATTTTTGTAGCTGGCCCAGGTCG
>ALWS01164951.1/7774-7926 Pteropus alecto contig164951, whole genome shotgun sequence. 
ATCACTTCTCGGCCTTTTGGCTAAGATCAAGTGTAAAATTGCCTAGATGTAAATATGTGTATATGTGCATGTTTGTACCTGTAAATATGTGTATATGTGCACGTTTGTACCTCTATGCGCGTGCGCGCAGGCGCGCGCGCGCGCGCACACACA
>GL883275.1/454-1 Melampsora larici-populina 98AG31 unplaced genomic scaffold MELLAscaffold_189, whole genome shotgun sequence. 
TTCTACCCACAAGGAATATCCGGGTGGCTCCGCCACCCGGGGCGCGTCTCCGAAAAAAAAAAAAAAATTAGAGGGCTTGGGAATGTAATGTTCTTAACCTATTCTCAAACTTTAAATATGTAAGACGTACTTGTTTCTTAATTGAACTTGTACATGAATAAAAGTCTTTAGTGGGCCACTTTTGGTAAGCAGAACTGGCGATGTGGGATGAACCAAACGCAGAGTTAAGGTGCCGGAATATACACTTATCAGACACCACAAAAGGTGTTAGTTCATCTAGACAGCCGCACGGTGGCCATGGAAGTCGGAATCCGCTAAGGAGTGTGTAACAACTCAACGGCCGAATGAACTAGCCCTGAAAATGGATGGCGCTCAAGTGTATTACCTATACTCTGCCGTTAGTATTCTTTTAAAGATATTAACGAGTAGGCAGGCGTAAAGGTTGCGTAGAAGC
>AYZS02020768.1/14673-14528 Beta vulgaris subsp. vulgaris Bvchr7.sca021.con0307.1, whole genome shotgun sequence. 
TTGGGTTCACAATATAGTTAGGCAAAAAATGGTGCTGATTAATAAATGGGCATTGTTTTAAAAAGTGGATCCGAAAGTGAATTGTTCCCCTCGCTATCCAGTGTAGAAATTTCTTTGCTACATTTGGACGTTGGGAAACTATATTT
>KE159628.1/947698-947606 Lachnospiraceae bacterium COE1 genomic scaffold acPFN-supercont1.2, whole genome shotgun sequence. 
AGCAGTTCCTTAAGTGCCTTGTGAACAGGGAGTTGTCACAGGGACGAAAAAGCCCTCTGGGGCTTTGCGGTACGAGGTTCGCATCCCGCTGCT
>MGUZ01000016.1/78253-78409 Elusimicrobia bacterium RIFOXYA12_FULL_49_49 rifixya3_full_scaffold_62, whole genome shotgun sequence. 
TTGTCCCTGCGATGTTGGTGTGGTATTATCTGATTTGAACCGACAAGTTCCTTTCAGGGAGTTGCAGGTGAGCTATACGCCTTAGGGCTATAGACCCGGACACCCACTTAATGAAAAGGGCTCAATCAGATGAAACTCACGGCAGAGTGGGGATTTT
>AE017283.1/720172-720358 Propionibacterium acnes KPA171202, complete genome. 
GCTAAAATCCTCGCGTCAGGTTGCTGGTGACCACACCAGCGCTGGAATCCGGTGAAAAGCCGGAGCTGACGCGCAGCGGTATGACTGATCCGCCCCGACTTGAACCACTGGCGCCATGCGCACTGGGAAGGCGCCGGGAACGGAGACGAAGTCGAGCCCGAAGACCACCTGACGACGCCCTGTTGTT
>AOTI010241097.1/1-750 Triticum urartu cultivar G1812 contig241097, whole genome shotgun sequence. 
TTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGGATAAGTGGGAGCCTCACGGCGACGGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCGTGAATCGGAAGCGGGGCGTAGCCCCTCCTTTTAGATCTAAGGCCCGTTCGCGGGCCGATCCGGGCGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTTCAGTACGAATACGAACCGTGAAAGCGTGGCCTATCGATCCTTTAGACCTTCGGAATTTGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGACAGCATCGCAATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGTGCCGGATTATGACTGAACGCCTCTAAGTCAGAATCCAAGCTAGCATGCGACGCCTGCGCCCGC
>LADO01000055.1/61648-61600 Peptococcaceae bacterium BRH_c4b BRHa_1001649, whole genome shotgun sequence. 
GGTTGGCCCCGTGAGGGGTTTCAAGATCCGATTACTTGGGTGGGTAGTC
>AAQR03071181.1/131-221 Otolemur garnettii contig071181, whole genome shotgun sequence. 
CCCTCAGGAGGACTGTGCCGGTCAGCTCCATGGAGTTTCAGTCAAGGAGTTTCTGAGCCTATGGATCTACAATATTTGACTGCCTGGGGCA
>KE951434.1/4972-1857 Actinobaculum sp. oral taxon 183 str. F0552 genomic scaffold Scaffold35, whole genome shotgun sequence. 
GTTGTAGGTGTTGTAGGGCGTTCGGTGGATGCCTGGGTACCGGGAGCCGAAGAAGGACGTTGCAGCCTGCGATATGCCTCGGGGAGCCGGCAAGCGGGCTTTGATCCGAGGGTGTCCGAATGGGGGAACCTGGCCGGGGTTGTGCCCGGTCGCTCGTGCCTGAATTCATAGGGTGCGGGTGGTGACGCGGGGAAGTGAAACATCTTAGTACCCGTAGGAAGAGATATTCCGTGAGTAGTGGTGAGCGAAAGCGGAGGAGCCTAAACCGTGGGCGTGTGAGAGCCGTCGGGTGTTGCGTGTGCGGTGTTGTGGGAGATGATCGTGATCATGCCGACGCGTGGTCGCGCAGTGATAAACCGTGGGGATAGGCGAAGGGTCTGGGAAGGCCTGCCGGAGAGGGTGAGAGCCCCGTAGCTGAAATTCTCGTGGCTGTGTGATTGTGTTCCCGAGTAGCATGGGGCCCGTGGAATCCCGTGTGAATCTGGCAAGACCACTTGTCAAGGCTAAATACTCCTGGTGACCGATAGTGGAGAGTACCGTGAGGGAAGGGTGAAAAGTACCCCGGGAGGGGAGTGAAAGAGTGCCTGAAACCGGGCGCCTACAATCCGTCAGAGCCTCCGTGGTGGGGGTGATGGCGTGCCTTTTGAAGAATGAGCCTGCGAGTTAGTGGCATGTGGCGAGGTTAACCCGTGTGGGGGAGTCGTAGCGAAAGCGAGTCCGAAGAGGGCGTGAGTCGCGTGTTCTAGACCCGAAGCGGGGTGATCTACCCATGGCCAGGGTGAAGCTCGTGTAAGAGCGTGTGGAGGCCCGAACCCACCAGGGTTGAAAACCTGGGGGATGAGTTGTGGGTAGGGGTGAAAGGCCAATCAAACTCCGTGATAGCTGGTTCTCCCCGAAATGCATATAGGTGCAGCGTTGCGTGGTTCCTTCCGGAGGTAGAGCGACTGGTTGGCTGATGGGCCTTACCGGGTTACTGACGTCAGCTAAACTCCGAATGCCGGGAGGGTGGAGCGTGGCAGTGAGACGGCGGGGGATAAGCTTCGTCGTCGAGAGGGAAACAGCCCAGATCGCCGGTTAAGGCCCCTAAGCGTGTGCTAAGTGGGAAAGGATGTGGAGTTGCTGGGACAACCAGGAGGTTGGCTTAGAAGCAGCCATCCTTGAAAGAGTGCGTAATAGCTCACTGGTCAAGTGGTTCCGCGCCGACAATGTAGCGGGGCTTAAGCACACCGCCGACGCCGCGGCAGTCCATCGTGGTCCTAGCCTGTCCGTTGGGCGGGTTCAGGGGGTGGGCTGGGTAGGGGAGCGTCCCGCGTTGGGTGAAGTCTCGGGGTGACCCGGGGTGGACGGCGTGGGAGTGAGAATGCAGGCATGAGTAGCGAGAGGCGGGTGAGAAACCCGTCCGCCGATTGACTAAGGGTTCCAGGGCCAGGTTGATCCGCCCTGGGTTAGTCGGGTCCTAAGGCGAGGCCGACGGGCGTAGTCGATGGACAACGGGTTGATATTCCCGTACCGGCGCTTGACCGTTCAATGTTCGCCGGGGTGATGCTAACCATCCCCGATCCTGTGTGTCTCTTTCGGGAGGCGTGTGGGGGAGGGCGTGGGGTCCGAGCCTGGGTGGGCAAGCGTGGTAACAGGTGTGACGCAGAGTGGTAGTCCAACCGTGTCGTATGGCTGAGCACGGCTAAGGGTGCAGCCCGTCTCCCAGGTAAATCCGGGGGGCGTTCGGGTCAGGCCTGATGGGGACCGTTTGACGGGAAGTGGATGATCCTGTGCTGCCGAGAAAAGCATCGACGTCAGGGCAAGCGCCGCCCGTACCCGAAACCGACACAGGTGGTCAGGTAGAGTATACCGAGGCGTGCGAGTCAATCGTGGTTAAGGAACTCGGCAAAATGCCCCCGTAACTTCGGGAGAAGGGGGGCCCGGGCCTTGATGTCCCCGTGCGGGGCGGAGGGGTCGGGGCCGCAGAGTCCAGGGAGAAGCGACTGTTTATCAAAAACACAGGTGCGTGCTAAGCCGCAAGGCGATGTATACGCACTGACGCCTGCCCGGTGCTGGAAGGTTAAGCGGACTGGTCAGCCCTTCGGGGTGAAGCTGGGAAGTTAAGCCCCAGTAAACGGCGGTGGTAACTATAACCATCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAACGACTTCTCCGCTGTCTCGACCACGAGCTCGGTGAAATTGCAGTACGAGTAAAGATGCTCGTTTCGCGCAGCAGGACGGAAAGACCCCGGGACCTTTACTATAGCTTGGTATTGGTGTTCGGTACGGCTTGTGTAGGATAGGTGGGAGACTGTGAACCGGTCACGCTAGTGGGCGGGGAGTCGTTGGTGAAATACCACTCTGGCCGTGCTGACCATCTAACCTCGGTCCGTGATCCGGGCCAGGGACAGTGCCTGGTGGGTAGTTTAACTGGGGCGGTTGCCTCCTAAAGGGTAACGGAGGCGCTCAAAGGTTCCCTCAGCCTGGTCGGCAACCAGGTGGCGAGTGTAAGTGCACAAGGGGGCTTGACTGTGAGACTGACGGGTCGAGCAGGTACGAAAGTAGGAACTAGTGATCCGGCGGTGGCTTGTGGAAGCGCCGTCGCTCAACGGATAAAAGGTACCCCGGGGATAACAGGCTGATCCTGCCCAAGAGTTCATATCGACGGCATGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGGAGTAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCCTATCCGCTGCGCGCGTAGGAGAATTGAGAAGGGCTGTCCCTAGTACGAGAGGACCGGGACGGACGAACCTCTGGTGTGCCAGTTGTTCCGCCAGGAGCATGGCTGGTTGGCTACGTTCGGGAGGGATAACCGCTGAAAGCATCTAAGCGGGAAGCCTGCTTCAAGATAAGTTCTCCATCCAGCCTGTGTGCTGGGTGAGGTCCCCCGCAGACGACGGGGTTGATAGGCCGGACGTGGACGCCTCGTAAGGGGTGGAGCTGACCGGTACTAATGGACCGACCGCCTACACCAT
>AAAB01006367.1/1-1388 Anopheles gambiae str. PEST whole genome shotgun sequencing project, whole genome shotgun sequence. 
TATTCGAACGAGCTCTTGGATGACTGAAGTGGAGAAGGGTTTCGTGTCAACAGCAGTTGAACACGAGTTAGCCAATCCTAAGCCGCATGGGAATCCAGTCGTAACCCATCAGTCGGCGAAAGGGAATCCGGTTACCATTCCGGAGCCTGTTGAGTACCCGTTTGCGCCAGCCTAGTAGGGTTTAGCTCGTCCGCACCCGAACGGTTAGTGTGTAGCTTCATGGCAACATGAATCCTTTTCTTCGAGAAGCCAACGAGAGGCATCGGAAGAGTTTTCTTTTCTGTTTTACAGCCACACCGACCATGGAAGTCACTCACAGAGAGATATGGTTGGACCGGTCTGGTAGAGCACGGCCGCCGCAACTGCCGTGTCGATGCACTCTTCTTGGACCGTGAAAATCGAAGACTGGGGCACACTTTATATGGTAATAACGCACACTCTCAACAGATTGTACCGAATCCGCAGCAGGTCTCCAAGGTGCAGAGTCTCTAGTCGATAGATCAATGTAGGTAAGGGAAGTCGGCAAACTGGATCCGTAACTTCGGGACAAGGATTGGCTCTGAAGGCTGGGTGCGACCAGCCGGGACCGGTGCTCCACCTGCCGCAAGGTAGGCTGGCCCGTGCCCGCGGTCGCACAGCAAACAGCCAATTCAGAACTGGCACGGCTGAGGGAATCCGACTGTCTAATTAAAACAAAGCATTGTGATGGCCCCGGGTGGGTGTTGACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAACGTGAAGAAATTCAAGCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCTCTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGATGCACTAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCTGGCATTGTAAGGCGATATAGGAGGTGCAGCATAGGTGGGAGGGCTTCCTCGTGGAGCTCGCCTCTGAGATACCACCACTCTTACTGTTGCCTTACTTACATGATTGGGTGGTACAAGCGCGGGCCCCAGGTCCGGATCGTGCGCGCACCTCCTCCGGGGGGCTGTGGCGGCGGTTCGCCTGCGCGCGCCCAATGCGCCGTGTTTCTCGCTCAGCGTCCAGTGTGTCGCTGGGTGGTGCCGCCGGGGAGACTGCATCGTAGCATCGTCGTGTGTAGCGTGTTACCCGCTTGTCCGACCGTGAGCCGTGGCCCGCAAGGGTACAAGCTTGCGTACGTCGGTGCATTCGTGGTGCACTGCTTCTGCGCGGTCGATCGTTTATGATGTCACGTTTGCCCCCGGTTCCGCGCGCCGC
>JH835377.1/4969955-4970252 Erinaceus europaeus unplaced genomic scaffold scaffold00089, whole genome shotgun sequence 
GGATGTGAAGGCAATCTGGCTGTGACATCTGTCACCCCATTGATCACAAGGGTTGATTTGGCTGATCTGGCTGGCTAGGCAAGTTTCCCCTTCCTTCCTAACTGCTCCATGTGCATTGAAAATAGCCTTGCTTGAATCGAGACGGACCGGTCTTCATTGGAGGGTATACAAGTAGCTGCGCTCCCCTGCTAGAACCTCCAAACAAGTTCTTCAAGATATACTACAGAACAATTTGTTTAATAATCAGGAACCTAAAGGCAAAAAATATAGCAGATGAGATTCGGGAGGGTCTTCATTT
>CP014222.1/4334669-4334580 Janthinobacterium sp. B9-8, complete genome. 
TTCAATGGTGGGGCGTGGTGGGGGCTACCTCGGTAGCGTCGGTTTACTATTTCGCCGATACGCCAACTCTGCCACGTTCCTACCTCCTTC
>FQXP01000006.1/145863-146131 Clostridium collagenovorans DSM 3089 genome assembly, contig: EJ35DRAFT_scaffold00004.4 
ATAAATGCTATGAAAAAGGAAAGTAGTGTATTGGAGGGTTACAGAGAGAAAGCGATGCTGAGAAGCTTTCACCTATAAGATATATGAAGTGCCCTTTGGAGCATGGATCCGAAATGGAGTTACACAATAGTTGAGTAACTTAAAAGTAGGAGACCACGGGTTCGCCCGTTAAAGCGATAGGGCATTATTATGTGCTTGAAGATAAAGTGAGATTCTTTTTGAATCTAATTAGGGTGGAACCACGGAGTAAACATAGCTTCGTCTCTAGA
>URS0000D6C44C_12908/1-87 unclassified sequences c-di-GMP-II-GAG riboswitch 
GCGAGGGGUAGGAGCUCGGAACCGCGGCCCGCAAGACGGGCACUGAAGGGGCGCAGGGGGCUAGUGGUGCGACCGGCUACCGCUCCG
>URS0001A235AD_371731/1-41 Rhodobacter sp. SW2 L2-Alphaproteobacteria ribosomal protein leader 
GGAUCCCAACGAUGGAUCCUUCAACUGACGGAAGACAGAAA
>FQUW01000011.1/34981-34776 Desulfotomaculum australicum DSM 11792 genome assembly, contig: EJ60DRAFT_scaffold00008.8 
CAATTGAATAATTGAACGGGTGCTCCCTTTTTCAAGGGATAGAGGGAAGTCAGTGCAAATCTGACGCGGTGCCGCCACTGTGAATGGGGAGCTGGCCACACAATGCCACTGGTCGGGCACCTGCATTGGCCGGTGTCCGGTTGGGAAGGCGTGGTTAAAGCGATGATCCATGAGCCAGGAAACCTGCCCGTTCTATTTCACCGTTT
>URS0000D6A184_12908/1-121 unclassified sequences Flavobacterium-1 RNA 
CGAGATAGGGGTACAAGTTCTGCAGTATTGCGTTCCTCTGGACCTAAGCAACGACCTGAAAGGGTAGCGACGAAGCTCGGCGTTAGTGGAGAGAGTCCCAGACGTGGTGTCTCCACTGACG
>MUNX01000075.1/101357-101431 Flavobacterium sp. A45 NODE_7_length_112147_cov_12.4241_ID_13, whole genome shotgun sequence. 
TTTTAGCCCCGATAGCAGTGTAAATCCTCTCTCGTTTTTCAACGAGAGAGATTGAAACGGATAGCGGGACTTTGC
>KQ948572.1/3318-23 Streptomyces longwoodensis strain DSM 41677 genomic scaffold PRJNA299227_s024, whole genome shotgun sequence. 
GGCCAAGTTTTTAAGGGCGCACGGTGGATGCCTTGGCACCAGGAACCGATGAAGGACGTGGGAGGCCGCGATAGTCCCCGGGGAGTCGTCAACCAGGCTTTGATCCGGGGGTTTCCGAATGGGGAAACCCGGCAGTCGTCATGGGCTGTCACCCACTGCTGAACACATAGGCAGTGTGGAGGGAACGAGGGGAAGTGAAACATCTCAGTACCCTCAGGAAGAGAAAACAACCGTGATTCCGGGAGTAGTGGCGAGCGAAACTGGATGAGGCCAAACCGTATGCGTGTGAGACCCGGCAGGGGTTGCGTATACGGGGTTGTGGGATCTCTCTTTCACAGTCTGCCGGCTGTGAGACGAGTCAGAAACCGTTGATGTAGACGAAGGACATGCGAAAGGTCCGGCGTAGAGGGTAAGACCCCCGTAGTCGAAACGTCAGCGGCTCGTTTGAGAGACACCCAAGTAGCACGGGGCCCGAGAAATCCCGTGTGAATCTGGCGGGACCACCCGCTAAGCCTAAATATTCCCTGGTGACCGATAGCGGATAGTACCGTGAGGGAATGGTGAAAAGTACCCCGGGAGGGGAGTGAAATAGTACCTGAAACCGTGTGCCTACAAGCCGTGGGAGCGTCGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTCTCGTGACTGCGTGCCTTTTGAAGAATGAGCCTGCGAGTTTGCGGTGTGTTGCGAGGTTAACCCGGGTGGGGTAGCCGTAGCGAAAGCGAGTCCGAACAGGGCGTTTCAGTAGCACGCTCAAGACCCGAAGCGGAGTGATCTAGCCATGGGCAGGTTGAAGCGGAGGTAAGACTTCGTGGAGGACCGAACCCACCAGGGTTGAAAACCTGGGGGATGACCTGTGGTTAGGGGTGAAAGGCCAATCAAACTCCGTGATAGCTGGTTCTCCCCGAAATGCATTTAGGTGCAGCGTCGTGTGTTTCTTGCCGGAGGTAGAGCACTGGATAGGCGATGGGCCCTACCGGGTTACTGACCTTAGCCAAACTCCGAATGCCGGTAAGTGAGAGCGCGGCAGTGAGACTGTGGGGGATAAGCTCCATGGTCGAGAGGGAAACAGCCCAGAGCATCGACTAAGGCCCCTAAGCGTACGCTAAGTGGGAAAGGATGTGGAGTCGCAGAGACAACCAGGAGGTTGGCTTAGAAGCAGCCACCCTTGAAAGAGTGCGTAATAGCTCACTGGTCTAGTGATTCCGCGCCGACAATGTAGCGGGGCTCAAGCGTACCGCCGAAGTCGTGTCATTGCAGCATATACGGCCAACGCCGGCTGTGATGGGTAGGGGAGCGTCGTCTGCCGGGTGAAGCGGCACTGGAAGGTAGTCGTGGACGGTTGACGAGTGAGAATGCAGGCATGAGTAGCGATACACACGTGAGAAACGTGTGCGCCGATTGACTAAGGGTTCCTGGGTCAAGCTGATCTGCCCAGGGTAAGTCGGGACCTAAGGCGAGGCCGACAGGCGTAGTCGATGGATAACCGGTTGATATTCCGGTACCCGCTGTGAAGCGTCAAACATCGAATCCAGTGATGCTAAGGCCGTGAAGCCGCCCTGATCTCTTCGGAGTTGAGGGGAGTGGTGGAGCCGCTGACCCGATCTGGTAGTAGGTGAGTGATGGGGTGACGCAGGAAGGTAGTCCAGCCCGGGCGGTGGTTGTCCCGGGGTAAGGGTGTAGGCCGTGCGATAGGCAAATCCGTCGCACATAAGGCTGAGACCTGATGCCGAGCCGATTGTGGTGAAGTGGATGATCCTATGCTGTCGAGAAAAGCCTCTAGCGAGTTTCATGGCGGCCCGTACCCTAAACCGACTCAGGTGGTCAGGTAGAGAATACCGAGGCGTTCGGGTGAACTATGGTTAAGGAACTCGGCAAAATGCCCCCGTAACTTCGGGAGAAGGGGGGCCACAACCGGTGATGAGTCTTGCACTCTGAGCTGGGGGTGGCCGCAGAGACCAGCGAGAAGCGACTGTTTACTAAAAACACAGGTCCGTGCGAAGCCGTAAGGCGATGTATACGGACTGACGCCTGCCCGGTGCTGGAACGTTAAGGGGACCGGTTAGCTCCATTTCGGTGGGGCGAAGCTGAGAACTTAAGCGCCAGTAAACGGCGGTGGTAACTATAACCATCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAACGACTTCTCGACTGTCTCAACCATAGGCCCGGTGAAATTGCACTACGAGTAAAGATGCTCGTTTCGCGCAGCAGGACGGAAAGACCCCGGGACCTTTACTACAGTTTGATATTGGTGTTCGGTTCGGCTTGTGTAGGATAGCTGGGAGACTGTGAAGCCTGGACGCCAGTTCGGGTGGAGTCGTCGTTGAAATACCAGTCTGGTCGTGCTGGATGTCTAACCTGGGTCCGTGATCCGGATCAGGGACAGTGTCTGATGGGTAGTTTAACTGGGGCGGTTGCCTCCTAAAGGGTAACGGAGGCGCCCAAAGGTTCCCTCAGCCTGGTTGGCAATCAGGTGTTGAGTGTAAGTGCACAAGGGAGCTTGACTGTGAGACCGACGGGTCGAGCAGGGACGAAAGTCGGGACTAGTGATCCGGCGGTGGCTTGTGGAAGCGCCGTCGCTCAACGGATAAAAGGTACCCCGGGGATAACAGGCTGATCTTCCCCAAGAGTCCATATCGACGGGATGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGGAGTCGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCCCTATCCGCTGTGCGCGTAGGAGTCTTGAGAAGGGCTGTCCCTAGTACGAGAGGACCGGGACGGACGAACCTCTGGTGTGCCAGTTGTCCTGCCAAGGGCATGGCTGGTTGGCTACGTTCGGGAGGGATAACCGCTGAAAGCATCTAAGCGGGAAGCCTGCTTCGAGATGAGGACTCCCACCCACTTGATGGGGTAAGGCTCCCAGTAGACGACTGGGTTGATAGGCCGGATCTGGAAGCACGGTAACGTGTGGAGGTGACCGGTACTAATAGGCCGAGGGCTTGTCCTC
>MJAT01000005.1/39405-39606 Firmicutes bacterium MLFW-2 MLFW-2_Contig_13_85X, whole genome shotgun sequence. 
GACAAGGCTACGATAAGGAAAGTAAAAAACGGAGCATTACAGAGAGTGGGCAAACAGCTGAAATTGCTTACATGTTGAAGTTTTTGAAAATGCACCTTGGAGCCGTGCAGAATGATTCTGCAACGGGGAAACCCGTTATTCGTTTGAGTGATGCAAAGGACTTTGCATAATCAGAGTGGAACCACGAGAAATCGTCTCTGTT
>LBSQ01000033.1/4164-6256 Parcubacteria bacterium GW2011_GWA2_37_10 US35_C0033, whole genome shotgun sequence. 
GAGATCTTTGGAAAACACCATTAGGTGGATAACTAGGTTTAGTTTACTGATGAAGGACGTGGCAAGCTGCGAAAAGTCTTGGCTAGGCGCATGCAGCCTTTGAACCAAGAATTTCTGAATCAGACTTCTGAATCTCTTCGGAGATATGTTGGAAACAACAGGGAACGCAGGGAATTGAAGCGTCTTAGTACCTGCAGGAAAAGATATCAATAGATATGCTGAAAGTAAGGGCGACCGAAATCAGCAAAAGGCAAACTGAATCTGTTATTGAAAAATAACAGAGATGTGGTGTTTTAGGCTAATATTTAATCTTAACCAAAAGACCTGAAGTTTTCTGGAAAGAAACACTTTAAAGGGTGATAGTCCCGTAGGGGAAATTTGGAAAGATTGAGTTAGTACTAGAGTAGTGCTTACTGGATACTAAGCATGAATTTGGGAGGCATTAACTCCTAACTTTAAATATAAACTAAGTCCGATAGCACATAAGTACTGTGAAGGAAAGTTGAAAAGAACTTTTAATCAGGAGTTAAAAGACTTGAAACCTAATGGTAATAGAATATTACGGCTCTTAGGAGTTGTAATGTACGTTTCGAATAACGGACTAGGAAGTGTATTTGAGTGGCGAAGATAATCTTAATATTAGAGTATCTAAAGGGAAACCAATTTTCCGCAATTTATGAGGGAAAAGGTATGAAAATGCCTTTGAGTCACTTGAGTACGACCCGAAACCAGGCGATCTATCCTAGAGCATGGTGAAGTGAGATTTAAAATCTTATGGAGGCCAGAAGAGATACTACGTGCATGTGTTCTTCTGACTTTAGGATAGGGGTGAAAAGCCAATCGAGCCTGGTGATAGCTGGTTCCTGCTGAAATAGGCCGTAGTCTAGTGTTAGAAGAGATAACTAAGATTGTAGAGCTACGGATAGAGAGTTTAGGAGGAGAAATCCTTCGGCTTTCTGTCCAACTCCAAATGTTTTAGTATCGTAGAATCTAATAAACGGGGATGCGGGGTAAGCTCGTATTCCAAGAGGGGAACATCCCAGACCATAGTTAAGGTCCCTAAATGTTAGTTAAGTGTGAACGGGTGAAAGGTGTTCATAACCATAGACAGAGGGGAGGTTTGCTTAGAAGCAGCAATCCTTTAAAGAAAGCGTAACAGCTCACCCTTCAAGGTTATGTGCCCTGAAAATGGACGGGACTAAACTAACTACCGATACTATGGACTTCTTATAAAGAAGGGGTAAGCAGGCATTCTATTAGGGCAGAAGTTTTTTTGTAAAAGAAAATGGACCTAATAGAGAAGAGAATCCTAGTGGTAGTAGGATCTATATATGGTGAGAATCCATATTACTGAAAGGGCCAGGGTTTCTTAGCAATAAAGTTTAGCTAAGAGTAAGTCGATCCTAACTCAGTTCCTAACAGAAACTGGGGAAAGGGCAAAAGGTTAAGATTCCTTTACTATTTAGGTACTTATGGTAACATAAGTTTGATCTCTGACATTTTGGGTTAGATTGACATTTACTATCGTAAATGCTAATTAGAATAAATCAATAGAGTACTGTAATGGTGAGAAATTGATTAAATCTAAGAATGGTTGGCCTTATGGCTGATTTGATTGATACCTGGGATTGATAAAAAGGAGATTAAACGGATCCTAAATAATCGTACCTAGAACCAACACTGGTGCCCCTAGGTGAGAAGCCTAAAGTATTAGGGTTTAATCTAGTTGAGGGAATTCGGCAAGTTGGCTCTGTGACTTCGGTTTAAAGAGTCCCTGGGATTGTAATCGTATGATTGCAATTTCAGGGTGCAATGACAAGGGACGTCCGACTGTTTAACAAAAACGTAACTTATTGCTAATCTGTAAAGATTTATATAATAAGTGACATCTGCCCAGTACTAGTATCTCAAACTTCTTTTCAAGGAAGCTAAGGACTAGCAAACGGCGGGAATAACTGTAATTCTCTTAAGGTTAATTCGTAGCTTTAAGACCCAAAGTTAAACAGAATAACTAAAAAGATTGGGATAATAATTTGGCTATATGCTGGAAAGTCCGGGTATCTCACACTACCATAAATTTTATTAAGGTATAA
>MTYJ01000241.1/79877-79597 Hypsibius dujardini strain Z151 scaffold0241, whole genome shotgun sequence. 
GCTTTGCATTGAGAGCAGACTGTGTGACCTAAAAGGCGAAAAAATGGGAGCACGCTGTAAGGATAAATAGGAACAGACAGGGGCATTCGTATTGCGGCGTTAGATGTGCAATTCTTGAATCATCATCGCAAGACGCGCTCCTGCGAAAGCATTTGCCAAGAATGATTTCATCAATCAAGAACGAAAGTTGGAGGCTCGAAGGCAATCAGATATCGCTCTGGTTCTAACCGTAAACGATGCCCACAGCACAAGTGCCCACAAGTTCAGCACAAATTTTGGCT
>CM001380.3/48396693-48396738 Felis catus isolate Cinnamon breed Abyssinian chromosome A3, whole genome shotgun sequence. 
GCACAGGTTCCACTAGGAACTACACACATAATTTGGGAACATTTGG
>GK000025.2/32398425-32398628 TPA: Bos taurus chromosome 25, whole genome shotgun sequence. 
GCGGCTTAATTTGACTCAACACGGGAAACCTCACCCGGCCCGGACACGGACAGGATTGACAGATTGATAGCTCTTTCTCGATTCCGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCGATAACGAACGATTCATGTGGCATGCTAACTAGTTACGCGACCCCCGAGCGGTTTTACCTGC
>CP003316.1/1347629-1347568 Pyrobaculum oguniense TE7, complete genome. 
AACACCCTGGGCAACACCCCTGTAGGGGGGGCGAATGAGCCTGGTGGGTTACCCCGGCCATA
>KI628545.1/15615-15455 Sclerotinia borealis F-4128 unplaced genomic scaffold scaffold00005, whole genome shotgun sequence. 
GGCGCGATAGTTCAATGGTAGAACATCCTCATCCAACTCAGATCACCCCTTCCACAATTTCAGGAGTGCAGTTATGCGAATAACTGCACTATGTTGTATATTAGGAAGATGGTGGTCTTTGGATAGTGAGGGAGATGGAGGTTTGATTCCTTCTTGTGCCA
>URS0000D6D378_443218/1-79 Hoyosella subflava DQS3-9A1 hya RNA 
TGCGTCACGCAAGTGGGCCGAGGGTCGACTCCTGTGACGAAGGGGCTTCGAGGCACTGTCCCGCCCCGGAAAGTGGCAA
>BDFN01002532.1/3650-265 Ipomoea nil DNA, scaffold: scaffold2532, cultivar: Tokyo-kokei standard. 
CGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATAAGCGGAGGAAAAGAAACTTACAAGGATTCCCCTAGTAACGGCGAGCGAACCGGGAACAGCCCAGCCTTAGAATCGGACGGCCTTGCGTTCGAATTGTAGTCTGGAGAAGCGTCCTCAGCGGCGGACCGGGCCCAAGTCCCCTGGAAAGGGGCGCCGGAGAGGGTGAGAGCCCCGTTGTGCCGGACCTGTCGCACCACGAGGCGCTGTCTACGAGTCGGGTTGTTTGGGAATGCAGCCCCAATCGGGCGGTGAATTCCGTCCAAGGCTAAATACGGGCGAGAGACCGATAGCGAACAAGTACCGCGAGGGAAAGATGAAAAGGACTTTGAAAAGAGAGTCAAAGAGTGCTTGAAATTGTCGGGAGGGAAGCGGATGGAGACCGGCGATGCGCCCCGGTAGTATGTGGAACGGTGAGAGCCGGTCCGCCGATCTACTCGGGGCGCAGACCAGCGAGGATTCGGGGGGCGGCCAAAGCCCGGGCCTTTGATACGCCCGCGGAACGTCGTCTCTCGGATCGTGGGAAGCAGCGCGCGCCCCTGGCGTGCCTCGGCACCTGCGCGCCTCCGGTCGCTGGCCTGTGGGCTCTCCATTCGACCCGTCTTGAAACACGGACCAAGGAGTCTGACATGTGTGCGAGTCAACGGGCGAGTAAACCCGTAAGGCGCAAGGAAGCTGATTGGCGGGATCCCCTCACGGGGGTGCACCGCCGACCGACCCTTGATCTTTTGAGAAGGGTTCGAGTGCGAGCATACCTGTCGGGACCCGAAAGATGGTGAACTATGCCTGAGCGGGGCGAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCGATACTGACGTGCAAATCGTTCGTCTGACTTGGGTATAGGGGCGAAAGACTAATCGACCGTCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCTGGCGCGAGAGTTCTATCGGGTAAAGCCAATGATTAGAGGCATCGGGGGCGTAACGCCCTCGACCTATTCTCAAACTTTAAATAGGTAGGACGGCGCGGCTGCTTCGTTGAGCCGCGGCCACGGAATCAACAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGGAAGCCGGGTTACGGTGCCCAACTGCGCGCTAACCTAGATCCCACAAAGGGTGTTGGTCGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTTAAGCGCGCGACCCTATACCCGGCCGTCGGGCAAGAGCTAGGCCCCGATGAGTAGGAGGGCGCGGCGGTCGCTGCAAAACCTTGGGCGTGAGCCCGGGCGGAGCGGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGGGTCGGGGGAAGCCCGACAGACAGCGCGTTTTGCGCGTGCGCCGAAAGGGAATCGGGTTAAAATTCCTGAACCGGGACGTGGCGGTTGACGGCAACGTTAGGGATTCCGGAGACGTCGGCGGGGGCCTCGGAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCCTGGAAACGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCGCACGTCGCGTGGTGTCCGGTGCGCCCCGGCGGCCCTTGAAAATCCGGAGGACCGAGTGCCGTCCACGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGCCAATGGAACAATGTAGGCAAGGGAAGTCGGCAAAATGGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGGCTGGGCACGGGGGTCCCAGTCCCGAACCCGTCGGCTGTTCGGCGGACTGCTCGAGCTGCTACCGCGGCGAGAGCGGGTCGCCGCGTGCCGGCCGGGGGACGGACTGGGAACGGCTCTTTCGGGGCCTTCCCCGGGCGTCGAACAGCCAACTCAGAACTGGTACGGACAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGTCCCTGCGGATGCTAACGCAATGTGATTTCTGGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTGTCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGGATAAGTGGGAGCCGAAAGGCGAAAGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCGTGAATCGGAGGCGGGGCATTGCCCCTCTTTTTGGACCCAAGGCTCGCTTGCGGGCCGATCCGGGCGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAGAAGGGTAAAAGCTCGTTTGATTCTGATTTCCAGTACGAATACGAACCGTGAAAGCGTGGCCTAACGATCCTTTAGACCTTCGGAATTCGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGACAGTGTCGCAATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGCGTTGGATTATGACTGAACGCCTCTAAGTCAGAATCCGGGCTAGACCGACGCATGCGCTCGTCGCCCGTTTGCCGACCCGCAGTAGGGGCCATTTGGCCCCCAAAGGGCACGTGTCGTTGGCTAAGCCGTCGTGGCGGAAGGGTCACGGTGGCCGCCTTGAATTACAATTCCGATCGAGCGGCGAGCTGAATCCTTTGCAGACGACTTAAATACGCGACGGGGTATTGTAAGGGGTAGAGTGGCCTTGCTGCCACGATCCTCTGAGATTCAGCCCTTTGTCGCTCCGATTCGT
>FR877557.1/2581256-2582181 Salmonella bongori NCTC 12419, culture collection SGSC SARC11, complete genome 
ACCTGAGCTTCCATTTCACGGTCAGACAGGCCACCGCAGATCTGGATAATACGGTCAGACAGCGTCGATTTACCGTGGTCAATGTGAGCAATGATCGAAAAGTTACGTATGTTCTTCATAGAGATAAATTATTATGCCTTACGCCTGGTTGACCAGACTTTAGAGGTCGCTGTTCTGAGCTTAACGTCTGTTTTAACTGAAACGCCGCATTCTACACTACAACGCTAAGGCGAGGAAATGTTCATAATGTAAGGAGAGCGGGAACTGGCAAGCGTCTCACTTTTTACGTAAGTCACTGTAACGCCGAAAAAGCCCCTGATAGCGCAAGCTTATCGGCCCGACATCTCCTGCATGGCAGGAAAAAATGACCTTAGCAGACCAGCTAAACGCAGCGCTATCCGGCACAGCGTCTACTGGCGCGTTTCGATTGATGTGGTTTCGACGCGAACAAGCTCGGACGGGAGGGCAACGCTTAAAATCACCGGTTGCCAGGTATCGCGCTCCGCCAGTTTCCGGGAATAGCCTCGGGCAAGCAAAAAACCGCCAACGCCACCTAAAACAGCGCCGCTTAATGCCGCAAGGTCAGATCCAAACAATACCTGGAAAAGCACTGCAAAGAGAAATAACCCCGCTAAAGGCGACATATAGACCAACAATGCCGACCCTAAGAGGCTTTTTTCGGCGATGCCAAGCTCAACTTTCTGCCCCGGCGACAGCGGCTCCACGCTTGGCACCACAATTGTATGAGTCGTTTGCGGCCCTAATTTATTCAGCACGCGGCTGCCGCATCCCGCCCGGGAGGCGCAGTTGCTGCACGATGTTTTAACATCACAACTCACGACCGCCTGGCCATTCCGCCAGGAGACGACCGTCGCCCACTCTTTAATCATTGTACTGCCCTGAACTTGATACTGTCTGCAATACGC
>MFEL01000009.1/24516-24224 Candidatus Doudnabacteria bacterium RIFCSPHIGHO2_01_FULL_46_24 rifcsphigho2_01_scaffold_3549, whole genome shotgun sequence. 
ATAAATGCGTATTAGTTTGCGCAAATTGCCACAGAGAATTACATGCAGGAATATCGCAGCTTCCGAGCGAAAGCTCGGTTGAAAAACGAGGTGAATTCGGGGAAGTCCAGCCCCACTTTTGAAAAAAGTGGAGCGGGATAATCCCGAGCCAAGCCCAGCCCCGGTTTTGAAAACTGGAGCTGGGAAGGTGTAGAGACTATCTCGAAAGAGAGTAGCCCCCGCCGCAGGCGAGGTCGAAGCGCCTCGGACCTTAAATGGTCATGATATAGTCCATCCCTAGAAGCAATTTTAGG
>AY765264.1/10602-10676 West Nile virus strain Rabensburg isolate 97-103, complete genome. 
CAGTTGTCAGACCACACGCAAGTGTGCTACTCTGCGAAGAGTACTGTCTGCGTTAGAGCCCCAGGAGGACTGGGA
>CM007898.1/80153181-80153635 Helianthus annuus linkage group 9, whole genome shotgun sequence. 
AAAAGGCGTAGCAAAAAGCTGTATTTTAACCATTCAAAGTAAGATATTCGAGAGCAAAAAGGTTGATACATTTTGAAGCAGCCAGGGCTCTTGAAAAGGAGGGACGCCTTCGGGAACGCGGACACAGGTGGTGCATGGCTGTAGTCAGCTCGTGCCCTAAGGTGTTGGGTTAAGTCCAGCAACGAGCGCAACCATCGTGTTTTGTTGCCATCATTGAGTTTGAAACCCTGAAGAGACTGCCGGTGATAAGCCGGAGGAAGGTGAGGATGACGTCTAGTCAACATGCCCCTTATGCCCTGGGCGACACACGTGCTACAATGGCCGGGACAAAGGGTCGCGATCCCGCGAGGGTGAGCTAACTCCAAAAACCCGTCCTCAGTTCGGATTGCAGGCTGCAACTCGCCTGCATGATACCGGAATCGCTAGTAATCGCCAGTCAGCCATACGACGTACTT
>CM000803.1/27767415-27767313 Oryctolagus cuniculus chromosome 14, whole genome shotgun sequence. 
ATCAATTCTCCTTCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTTTCAGTTTGAAATGTGTCATCAAATTACTGATTTCCCTCTTCAGTTCTTACCCCTG
>CM000014.3/49188721-49188634 Canis lupus familiaris chromosome 14, whole genome shotgun sequence. 
TGGTCGATGATGATTCCCACATACGCATTCTTTGGAAGTCTGAACAAAATGAGTGAGGGGGAAAAAAAAAGAATCACAATTCTGCCCT
>MGNC01000058.1/1340-1465 Chloroflexi bacterium RBG_13_60_13 RBG_13_scaffold_216383, whole genome shotgun sequence. 
TCTCCGAAAGGGCAAAGGCACGGGAAACCGTGTCGGCGCAAAGCCGCGGATCTAAGGTCTCCCGCTTCGACAGGGACGTTCACAGCGGCAGTAGGAGCGAGAGACTATGGTGGCCGGGCTACCGAA
>CM001394.3/25602295-25602396 Felis catus isolate Cinnamon breed Abyssinian chromosome F1, whole genome shotgun sequence. 
GCCGAGTAATACTCCATTTTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATATATATATATACACACACACACACACACACACACACACAAAATGTGTATATA
>URS0000D67331_12908/1-219 unclassified sequences RT-2 RNA 
CGAGGTCATATGGAGTAGCGAAAGTGAAAGACGACCTTCGCAAAAGGAGATATACTTCCCTGGGTGAAAATCCTTAAAACTGCCTTACGACGATCACACACGGACGCTGCTTGCATGGCGAAGAATTGCGCTACCTTCGTTTCATGTGTGGGATCAAAGTAGTTTAGATGCGCACCTACAAAACAACTATGCGAAAGGCGAAAACTTATTATGACAAGC
>LQHI01000015.1/6633-6747 Hadesarchaea archaeon DG-33 contigWOR1_52_54_12788, whole genome shotgun sequence. 
GCGGGGATAACTCAACCTGGGAGAGTGTCGGTCGTTCGAGTACAATCGAACGGGCAAAACTGAAGTTCCCAGAATAGATATCCGAATGTTGGGGGTTCAAATCCCCCTCCCCGCA
>AFCW01000383.1/1-68 Salmonella enterica subsp. enterica serovar Urbana str. R8-2977 Contig383, whole genome shotgun sequence. 
CACACACTTAATTAATTAAGTGTGTGNNNGCCGCAATTCAGCATTAGTAACCAAGGGGTCTGCTCGTG
>AAQR03179128.1/9880-9794 Otolemur garnettii contig179128, whole genome shotgun sequence. 
ATCCTTTTGTATTTCATAAACTACTGACTGTGTTTTCACACTTATGAGCAAACCTTGTTAGGATGTGGATACATTACCTGTCTGATG
>CCCW010025129.1/8929-12059 Brassica napus, WGS project CCCW01000000 data, contig: 19059 
CGACCCCCAGTCAGGCGGGATTACCCGATGAGTTTAAGAATATCAATAAGCGGAGGAAAAGAAACGAACAAGGATTCCCTTAGTAACGGCGAGCGAACCGGGAAGAGCCCAGCTTGAAAATCGGACGTCTTCGGTGTTCGAATTGTAGTCTGGAGAATCGTCCTCAGCGACGGACTGGGCCCAAGTTCCTTGGAAAGGGGCGCCAGAGAGGGTGAGAGCCCCGTCGTGCCCAGACCCTATTGCACCACGAGGTGCTGTCTACGAGTTGGGTTGTTTGGAAATGCAGCCCCAATCGGGCGGTAAATTCCGTCCAAGGCTAAATATGGGCGAGAGACCGATAGTGAACAAGTACCACAAGATAAAGATGAAAGGACATTGAAAAGAGAGCCAAAGAGTGCTTTAAATTATCGGGAGGGAAGCGGATGGGGCCGGCGATTCGTCCCGGTCGGATGCGGAACAGAGCAATCTCGTCTACCAATCTATTTGTGGCGTGGACTTACGCGGATTAAGGTGGTGACCTAAGCCCAGGATTTTGTTACACTTGCGGAGACGTCGCTGCCTTGATCGTGGTCTGCAGCTCGCGCCTCACGGCGTGCCTCGGCATCTGCTTGCTCAGGGCGTCGGCCTGTGGGCTCCCCATTTGACCCGTCTTGAAACACTGAACAAGGAGTCTGACATATGTGCGAGTCAAAGGGTGAGTAAACCCATAAGGCGCAAGGAAGCTGATTGGATGGATCCCTCACAGGTGCACAGCCGACCGACCTTAATCTTCTGAGAAGGGTTCGAGTGTGAGCATGCCTGTCAGGACCCGAAAGATGGTGAACTATGCCTGAGCGGGGCAAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCGATACTGACGTGCAAATCGTTCGTCTCACTTGGGTATAGTGGCGAAAGACTAATTGAACCATCTAGTAGCTGGTTCCCTCTGAAGTTTACCTCAGGATAGCTGGAGCTGGAAACGAGTTCTATCGAGTAAAGCCAATGATTAGAGGCCTCGGGGATGCAATGTCCTCGACGTATTCTCAAACTTTAAATAGGCAGGACGGGGTGGCTGCTTTGTTGAGCCATCCCACGGAATCGAGAGCTCTAAGTGGGCCATTTTTGGTAAGCAGAATTGGCGATGCGGGATGAACCAGAAGCCGGGTTATGGTGCCCAACTGCGCGCTAACCTAGAACCCACAACTCACCTGCCAAATCAACTAGCCCCAAAAATGGATGGCGCTGAAGCGCCCAACCTATACCTGGCCGTCGGGGCAAGAGAGAGGCCTCGATGAGTAGGAGGGCGCGAGCCCGGGCGGAGCGGCCATCGGTGCAGATCTTGGTGGTAGTAAGGGAAATGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCATAAGAGTCGGGGGAAACCCGTCTGATAGCGCTCTTCAAAAGGGGATCCGGTTAAAATTTCGGAACCGGGACATGGCGGTTGACGGCAACGTTAGGGAGTCCAGAGACGTCGGCGGGAATTCCGAAAAGAGTTATATTTTCTGTTTAACAGCCTGCCCACCCTGGAAACGGCTCAGACGGAGGTAGGGTCCAGCGGCTGGAAGAGCACGGCACGTGGCGTGGTGTCCGGTGCATTCTCGGTGGCCCTTGAAAATATGGAGGACCGAGTGCCTCTCACGCCCGGTTGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCGATGGAACAATGTAGGCAAGGGAAGTCGGCAAAATGGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGGCTGGGTTCGGGGGTCCTAGTTCCGAAATTCTCGACTGTTGGTGGGCTGCTTGAGCCGAACAGACCGCCTCGTGTCAGCCGGGGGATGGACTGGGAACGACTCTTTGGGGAGCTTTTCCCGGGCGTCAAACAGCCAACTTAGAACTGGTACGGACAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGTCCCTGCGGATGCTAACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCACCCAAGCGTGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATAAGTGATGCGCATGAATGGATTAACGAGATTCCCAGTGTCCATGTTTACTATCCAGCAAAATCACATCCAAGGGAATGGGTTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTCACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGAATAAGTGAGAGCTCCGGTGCAAGTGAAATACCACTACTTTTAACGTTATTTTACTTACTCCGTGAATGGGAGGCGGGGTACCAACCCCTTCTTTTAGACCCAAGACTCGCTTCGGCGGGTCGATCCGGGCAGAGGACATTGTCAGGTGGGCAGTTTGGCTGGGGCAGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGTTCAACGAGAACAGAAATCTCGTGTGAAACAAAATGGTAAAGCTCGTTTGATTCTGATTTTCAGTACGAATACGAACCGTGAAAGTGTGGCCTATCGATCCTTTAAACCTTCGGAACTGGCTTGTGGCAGCCATGCGTTCATAGCGATGTTGCTTTTTGATCCTTCCATGTCGACTCTTTCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGATCGTGAGACAGGTTAGTTTTACCCTACTGATACCCGCATCACAATAGTAATTCAACCTAGTACGAGAGGAACCATTGATTCGCACAATCGGTCATCGCGCTTGGTTGAAGAATAGTCAGTGGCGCGAAGCTACCGTGCGTTGGATTATGACTGAACGCCTCTAAGTCAGAATCCGGGCTAGAAGCGACGCATGCGCCCGCCGCCCGATTGCCGACCCTCAGTAGGAGCTTCGGCTCCCAAAGGCACGTGTCGTTGGCTAAGTCCGTTTGGTGGAAGCGCCGTTCGGACCGCCTTGAATTATAATTACCACCGAGCGGCGGGTACAATCCTTTGCAGACGACCTTTGTCGCTAAGATTCGA
>LZPO01045535.1/8544-8610 Neotoma lepida isolate 417 scaffold_13965, whole genome shotgun sequence. 
GCTGGGGTAGTTCAAAGGCAGAACATTTGCCTGGTATGCATGAGAGCCTGGGGGTCATTCCCCAGTA
>AHJH02011678.1/302-41 Hammondia hammondi strain H.H.34 contig09893, whole genome shotgun sequence. 
AGCGACAATCCTACCACTTAGAGTTGTCGGATCACTAAGACCGACTTTCGTCCTTGTTTAAGTAGTTACTCTCACAATCAAGCCTTTTACGCAACAGTGTTTTAAAAGATAATTATTGTCTAAAAAAAAACTCATATCTAATTAGCTAGTTGGTGAAGTAATAGTTTTACCAAGGCGAAGATTAGTAGCTGCCTTGAGAGGGGAAACAGCCACATAGAGATTGAAATACAGCTCGGCTTATCACACAGTAGGGTAGCTGCAG
>MTEO01000012.1/38100-38064 Desulfobulbaceae bacterium A2 Ga0073110_1012, whole genome shotgun sequence. 
GTTTTCCGGGGCGCACGCGCCCCGGCCTCTTTGAAGC
>CP003050.1/1069873-1069696 Halovivax ruber XH-70, complete genome. 
AAGTACCTCTGAGTCCGTCGGACGATACGTCCGCGGATAGGAGTAACGGCTGGTTGGCGCAGCCATCGACTCACCTGTTCGACAAGTCAACGGGTGGATTCCACCCACAAGAACAGGTTGTGTCGTAGACCTTAATATCCCAACTGCGGTCGGGAATCCTCGCCCTTCAGGACGGGAG
>JMFI01080173.1/8540-8495 Phalacrocorax carbo contig80173, whole genome shotgun sequence. 
AAAGAGGTCTTCCTAAAGACCACACCAGCCTTTGAAGCACACTTTA
>LDZF01000115.1/1-68 Pluralibacter gergoviae strain JS81F13 contig_136, whole genome shotgun sequence. 
AAACCCCTTTTGATTTGTTAAAACAGATTGCGGTCTGGCAACTGCAACGTTTAACAAGAAATCAAAAG
>AWGX01000534.1/1451-1535 Smithella sp. ME-1 CONTIG_7599, whole genome shotgun sequence. 
TAGTAAATTTATTTACTTGACAAAAAAGTAAAGTTTTATTAAATAAAAATCGTTCGCTTGGATCCGTAAGGACTGAGACGAGAGG
>JMFL01092903.1/16205-16066 Opisthocomus hoazin contig92903, whole genome shotgun sequence. 
CTGCATTCTTAACCCTCCTGGCAGCTCTGTTTATTAGCTTCCAGGATAAGAATGAATGCCAGAGAAAACTGTTGATTAATCCAAAATGAAGAGCTCTCCTCCCGTGGCTCTCCATTATTTCACGTCTTCAACATTGATTT
>JJRE01013351.1/703-1 Phoenicopterus ruber ruber contig13351, whole genome shotgun sequence. 
AAAACAAGCGAGGTAGTGGTATTTCACCAGGGCCGGGAATGGCTAGCATGCAGGGAAAACAACTGGGCTCGGTAACACGACGCGTCATACGCCTGCCGAAAGACACCAATTGCTGGACTCGTCTAAGGTGGACAGGTCCCCTATGCTTAACCTGGAAAAGGAACATGTATAATTTTATATATGTTTGCTAAATAGCCAAATGCCTCGTCATCTAATTAGTGACATGCATGAATGGATGAACAAGATTCCCACTGTCCCCACCTACTATCCAGCGAAACCACAGCCAAAGGAACGGGCTTGGCGGAATCAGCAGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCTGGCGCTGGGAAGAGACATGAGAGGTGTAGAGTAAGTGGGAGGCCGGGTGCACGCTCAGCAGTGCGACCTGCCCACCAGCACCCCGGCCATCGGTGAAATACCACTACTCTGGTCCTTTTTTCACTTACCCGGTGAGGCGGGGGGGGGCAAGCCCCAAGGGGGGCTCTCACTTCTGGCACCAAGCGCCTGGTGTGCACCGGGAACAGTGGCAGGTGGGGAGTTTGACTGGGGCAGTACACCTGTCCAAGCGTAAGGCAGGTGTCCTAAGGCAAGCTCAGAGAGGACGGAAACCTCCTGCAGAGCAGAAGGGCAAAAGCTCACTCGATCTTGTTTTTTCAGTATGAATACAGCACACG
>MERU01000008.1/32885-32784 Burkholderiales bacterium RIFCSPHIGHO2_01_FULL_63_240 rifcsphigho2_01_scaffold_62, whole genome shotgun sequence. 
ACTTTCGAGGAGCGTTGCAAGGCCCGTCCCGTCGTTGAACACGGCGCGAACCGCTGGCCCCAGGCTCGAAAGCTTCTCCTTTTGCAACGGCGCTCACCCGCA
>FQTV01000009.1/145137-144950 Bacteroides luti strain DSM 26991 genome assembly, contig: Ga0131163_109 
TATCTTTGTTTCGGTTTTGGTAACAAAGCTTATGCTTTAGGAGAAAAGGGAATACCGTGAAATCCGGTAACAGTACCCGCTGCTGTGATTCTCGAAGAACTTGAGTAACAAGCCACTGCATTTATTTGTGGGAAGGCACTTTAAGAGAGAGATAAGTCAGAAGACCTGCCAGAACTACACATTATAGA
>HG764815.1/187153-187284 Tetrasphaera australiensis Ben110 genomic scaffold, 2552_scaffold1 
CGCGTTTTCGCTCAGGCGGAGCTCGACCGCCGACTCAAGTGATCGTGGCCTATATCGACGCCTATCGGGGTCAGTTCGGCGCCCATGCCGATCTGTGCCGTGCTGACCGAGCACGGCATCACGATCGCGCCG
>MIJY01000003.1/25265-25023 Enterococcus termitis strain LMG 8895 11, whole genome shotgun sequence. 
CAAAACACATATTCAGAACAAGTAGTCATCGTTCATTTCCTGACAGAGACTTTTTCATTCGCTGAGAGAAAAAGCTGGAAACCGTTGACGAACACATCTGTCTAGTCAGCTTCTGAATTTAGTAAGAAGCTGCGGCATTCTCCGTTATCAGAAAAGAATCTCTATTACTATTAGAGACTCTATGAGGTCACCATTGCGAAATCGTGACAAATTGAGGTGGAACCGCGAATCTTCGTCCTCTTG
>CM000999.2/135584192-135584306 Mus musculus chromosome 6, GRC primary reference assembly. 
TGCTGAGTGCAGTTCCGGGCTGCTTCCATGTTCTGTTAATTAAACATTGAAATTGGCTGAGAGAGATGATTAAATGGAAAGTGTTATTCTGTTCATATACTGATAGCTCACATAT
>JXUM01069429.1/36725-36871 Aedes albopictus isolate Foshan contig69429, whole genome shotgun sequence. 
TTCAGGCCATATCGAAGCAGGACAAAGGCCATTTCTTATGCCTGTTGTCCTGTCAAAAATTGGCCCAGAGTAAACGCTCCGTCGACGGTCATTGGAAGCCTTGACATCCGTGTGGTTTACCAATAACATATTTGGCGGTGTACAATA
>CM000999.2/123737012-123736886 Mus musculus chromosome 6, GRC primary reference assembly. 
CCAGCTCCTAGAAGGGTTGCAAGTGTGGCTGCTGTGTCATTTCTGCATCAGGATGTGGCAGAGAAGAGAGAGACAAAAAAAAAAAAAGACCTTCAGTGTTCTGACCTATGATTAATAGCCTAACAGT
>AP012044.1/987471-987303 Oscillibacter valericigenes Sjm18-20 DNA, complete genome. 
CGCTCAGATAGAGGCGCGAGGTTCATCAGTACCGCGAGCAGCCGGCAGGCAGCCGGCGCGGGAAAGGGGACATCGCCGAAGGGTTTCGGAGCTGCCTGCTCCGAGATACCTGGGCTGTCGGGGAATACCCGTCGGACTGTCACATTTTTTGTGAAGCGCTATCGATGGC
>ACPB03020461.1/16978-17135 Rhodnius prolixus Rhodnius_prolixus-3.0.3-473.8, whole genome shotgun sequence. 
AGAGTCCTGGCGTCGAGGTTACCATGATCAACAAGGTGGTTCCTCCAGGGTGAGGTCTATTCATTGCACTAAGAATTGGCTGACCCCTGCGAATGTTCCAAAAAATATTTCTAATAGTAGAATTCATTAGTGCTATACTATTTTTGAAATAATATAAA
>AFYH01196721.1/7358-7251 Latimeria chalumnae contig196721, whole genome shotgun sequence. 
ATGAGTCGGTGCATCCCCAAGAGGGGAGGTTGGGAGGGTATTGGTGTGGCTGTATGGAGTATCCCTAATACCCTCCCAACCTCCCCTCTTGGGGATGCACCGACTCAT
>KQ959571.1/48198-48573 Clostridiales bacterium KA00274 genomic scaffold Scaffold7, whole genome shotgun sequence. 
GGGGATGTAAAGGCTTCGACAGGGTTGTTGAGATTGGAATAGCGGGTAGAGGATGCGCGTTGGCCTCTTTAAAAAACGGGCAAAAAATTTAGTTGCAAAAACTAATAGATTCGCTGTAGCTGCGTAAGCTTGGCGCACAAACTTGATGAATCTGCTAATTGAGTGATTGTGTTAGACTAGCAGACCTTGATCGTTAGAGGTCAAACTTTCAAATTTCAAGTTAAGCTTTGCCCTTGGAATTATCTATGAAGCTACTTTCATAAGCGATTGTTCAAAGTCTACCTTATGAGGGGAATTTAGAAAATTTGAACTGCACCCGGAGAAGTTCTGATTAAGGCGATTTTGGACACGAGTTCGATTCTCGTCATCTCCATTC
>CM000998.2/25188643-25188361 Mus musculus chromosome 5, GRC primary reference assembly. 
GGATGTGAGGGAGATGTGGCTACATCTGTCACCCCACTGATTACCAGGGTTGATCACCTGCTTTGGCTAACCCGCCTCCCTCATCCTTCCACGTGTGCCCTTCTGGACTTTCCCTGAATAGAGGACGACCAGTCTTCAGTCAAGAGTACATGAGTAGATACATTCCCCTGCTAGAACCTCCCAACAAACTCTCAAGGGAGCTGAATTCTTATGCCACATGTCTACTACAAGATAGTATGCACATACACGGTAGGCAGGTGGGGCAGGGAGGGGCTTCTTTCGT
>AODH01000041.1/17134-17262 Brochothrix campestris FSL F6-1037 c41, whole genome shotgun sequence. 
ATAACCTTTAACCTAGTCCAGAGAGACTAAGAAGGCATTGAATCGTATACAGGGGTAAAACTACCTTTGTAGAACAGTAGTTTGGCTACTGTTAAAAACGCTTATGCCCTCGCATAGGCGTTTTTTTTT
>GL010035.1/48904364-48904178 Loxodonta africana unplaced genomic scaffold scaffold_8, whole genome shotgun sequence. 
TTGAACCGGTTCTTTCTGGTTCGACCCCCTGCTGAGATGTGAATTTCCACCCCAGATATACTGAATCAGAACCTACATTTTAACTATAATTTTAAAATTTTAACTATAATGTAGGTTCTGACTCAGTATATCTGGGGTGGAAATTTAAATTCTCAGCAGGGGTTCGAACCAGAAAGAACCAGTTCAA
>LQXD01000036.1/27026-26945 Anaerobacillus sp. NB2006 Ga0137927_1036, whole genome shotgun sequence. 
AAAGAGCTATAACCGCTCATTAAAGGGTTTTGAAGTATTTGCTCTTAGCAAAACACCCCTCATGGCGAGTCTGAGTATATTA
>CGIH01000026.1/124551-124798 Syntrophomonas zehnderi OL-4 genome assembly, contig: OL-4DRAFT_scaffold-26 
TAAAATGTGATGAACAGGACAAGTAACCTGCCGGTAACCTTGCAGGGAGGCCGTATCATGGACTGAAAGTATGGCCAGGGGAAAGCAGTTGAATTCACCTGGGAACAGTAAACTGAAACATAGATATCTTTTTACCGTCTATTCAGTAGGTTTAACCGCAGGTCGGCGTTAAAGACATCAAGTGAACCGGTTGCGTTTGACATCGGTTAATCGGGGTGGTACCGCGGAAGCAAGCTTTCGTCCCTTGG
>CP011382.1/3084471-3084633 Calothrix sp. 336/3, complete genome. 
AAAATTAAATATACCAAGCCGGAGACAGCAGGTGTCCTTGACTTAAATATCCTGCCTAGGTTTGCACTCCATTTGTTCCATGAAGACTCATAGTGGTTTGACCATGGCAAAAAGAGATTTGTAAAACCCCGGCTTGGTATAGCTGGGGTTTATTAATTGGGGA
>MFFM01000041.1/12342-12480 Candidatus Edwardsbacteria bacterium GWF2_54_11 gwf2_scaffold_564, whole genome shotgun sequence. 
AAATTGAATCTCCGATCCCGTTTTTCTAAAGCTTAAATGCCATGGATGACGGGACGGTTCCCCCGAAAAGGGCGGACAAGGGTAGGACTGGAAACGGTCTTGCCTCCCGTGTTTGGAAAGGAGAGGTTGCGATTAACTT
>CM000237.2/27621459-27621601 Rattus norvegicus chromosome 7, whole genome shotgun sequence. 
CCTGCCCCTAGAGGCATTGCAGCTACGACTGCTGTGTCATATGTGTGTCAGTAGGTGGCAGAGATGAGACAGGCTATGTCTATGCTCAGTGTTCGGACCTGGGAAACCCGGGGGTGCAGGTGGCAGGGAGTGAGCCTAAGACA
>CM000780.4/158285691-158285793 Zea mays cultivar B73 chromosome 4, whole genome shotgun sequence. 
GTGCGAATCACAGTGCAGCTCTCCTCTGGCATGAAGGCTGTGAGAGAGGCATGACAATTTCTGGCCTTGCCCTGCCAAAGGAGAGCTGTCCTGCCATTCATTA
>CM000236.2/108598299-108597972 Rattus norvegicus chromosome 6, whole genome shotgun sequence. 
GGGTGCAAAGGCAATCTGCCTGTGGTGTCGAGCACCCCGTTGATAACCAGAGTTGAATCAGCTGATCTGGAAAGCTAGACAGGTGTCCTCTTCCTCCCTCACCACGTTCCATGTGCCTCCTTCCTGGGGCTGTGTATTTGATGGCAAAGGAAGATCTTCTCAGATAGAAGAGGGCCAGCCGCTGTTAAAGATATCTAAGCAGCTGCTAGATCCCCTGCTAGAGTCTCCAAACAAAGCCCTCAAAGTCCAAAGGCACAAATGGTAAATTAAATGGCAGTAATGTTGATCGAAACCCTCTGTGTTTGAGGAGGTAGCTCTCAACTCTGAG
>FRBW01000003.1/337999-338120 Labrenzia suaedae strain DSM 22153 genome assembly, contig: Ga0131142_103 
TCGCGTCTCACCGAGCTACCTCCTCCCAAGCTCGAGACGTGCGACCCGGCGGAGCATCCTCCTCCCAGTTCCGCCAAGTCAAATGCGCCTGCCAGCACCTCCTCCCGCTGGCGGGCGTTTTG
>MNUO01000109.1/8594-8798 Candidatus Desantisbacteria bacterium CG1_02_38_46 cg1_0.2_scaffold_8344_c, whole genome shotgun sequence. 
CAAGTCCGACTTAGGTAAAGGTTAGCCACCAGCCTAACACTTAATCTCACACTTTATTTGGTAACAAATAAAGTGGTGCGGGAAGCGGGAAATATCGAGCTATAACGCAAGTGAAGGAATTGAGCCCCGAAATAACCAGCGTGTCAGTGGTCGATACTCTTCATTAAGGAGCAGACAATAGTCTCACAACCGATAAAAGGCGAGG
>AAGD02011599.1/18221-19185 Caenorhabditis remanei strain PB4641 contig406.1, whole genome shotgun sequence. 
AATTATGAAGTAAGAAGTAAGAAAGAAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAAAAATAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTTTGACATTGTGAAGAGTCATGAGAGGTGTAGCATAGGTGGGAGACTTCGGTCGACAGTGAAATACCACCACTTTCATCGACTCTTTACTTATTCGGTTGAAAGAGAATTGGCTTCACGGCCTTTTTTCGAAGCATTAAGCGGAGCCATTTTATGGCACCGTGACTCTCCTCGAAGACAGTGTCAAGCGGGGAGTTTGACTGGGGCGGTACATCTATCAAATCGTAACGTAGGTGTCCTAAGGCGAGCTCAGAGAGGACGGAAACCTCTCGTAGAGCAAAAGGGCAAAAGCTTGCTTGATCTTGACTTTCAGTACGAGTACAGACCGCGAAAGCGTGGCCTATCGATCCTTTTAATCCTGATTGTTTCAGGTAAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTCCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGCGAAGCAGAATTCGCCAAGCGTTGGATTGTTCACCCACTAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGTTGACTTGTTATTGCTAAAAACGACGATTTTCCATGTAAAAACACGTAACTTCCACTACGAACCTTCCTCGTCTATCAATCACTCCTTGTCTCGGATCCATCAGCCCGCCGAGCTTCGGCTTTCCGTTTTCGTAGATCTCTGGGAACTCGACATGAGCGACGGACATTCTTTTCTGCAAAAAACCAAAATCTTAGCCGTGTTTCCCGATTTTTCCGCATTACAATACGGTGCCGGATTTCTACACCGTCAATCGCTCTTCCGAGAGGAGTACACGGCCGGCGGCCTAGGAA
>ABLE03011848.1/1-1240 Caenorhabditis japonica strain DF5081 Contig9538.1, whole genome shotgun sequence. 
GACTTTTGAAGAGAGAGTTCAAGAGAACGTGAAATCGCTGGAGTGGAACCGGAGACAGTTGATGTTGCTTGGAGACAATCTTGGTGGCTGATCGCTTAGCTGTGATCGCCGCCGGGAGTCGTTTCCTATGCTACGCCGACGGCGTTGGCCGCTCGTTCTGGCCCGACAGTGTTGCCCATCTCGCAAGAGACGGTGTCTTGTTGTCGGTCGTTGGTTCGTGGTGGCTAGCGTTTAGTTACGCTAGTGTGTGTGACGTCGGTGTGAAAGTCGACGACGTTTCCGACCCGTCTTGAAACACGGATTACGGAGTGTTTGTCTGCTGCGAGTCAAAGGGTGTAAACCTTGCGGCGCAATGAAGTGAAGGTTAGTCTCGAACTGACCGACGTGGGATCCGTGCTCTTCGGAGTGCGGCGCACCACGGCCCTATGCGTGTCACTTGTGACTGTGTAGAGGTTGAGCAGTAGGCAAGCGACCCGAAACGATGGTGAACTATGCCTGAGCAGGATGAAGCCAGAGGAAACTCTGGTGGAAGTCCGTATCGGTTCTGACGTGCAAATCGATCGATAGACTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCTTCCGAAGTTTCCCTCAGGATAGCTGGAACTCTTGCAGTTATATTCGGTAAAGCTAATGATTAGAGGCCTTGGGGACGTAATGTCCTCAACCTATTCTCAAACTTTCAATGGATATGGCGTCGCAGTTTCTTTAGTGAACTGCGGCGTGAATGCGAGTTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGCTGTGGGATGAACCAAACGTGGAGTTAAGGTGCCTAACTTCTCGCTTATGAGACCCCATAAAAGGTGTTGGTTGATATTGACAGCAGGACGGTGGCCATGGAAGTCGGTACCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCTGAAAATGGATGGCGCTTAAGCGAGAGACCTATACTCCGCCGTCGCGGCATGTGCGTTGTCTAGCGCCCAGGTCGCGACGAGTAGGAAAGGACGTGGCGGTTGCGTTGAAGGCTATGAGCGTAGGCTCGGCTGGAGCTTCCGTCAGTGCAGATCGTAATGGGTAGTAGCAAATATTCAAGTTCGATCCTTGAAGACTGAAGTGGAGAAGGGTTCCACGTGAACAGTAGTTGGATGTGGGTCAGTTCGATTCCTAAGGTACTGGCGAAAGCTTTG
>JH159154.1/6686760-6686937 Phytophthora sojae unplaced genomic scaffold PHYSOscaffold_4, whole genome shotgun sequence. 
ATGCTTCCCAGGGTGACTACCGATTGGCCAAGAAATGCATGTATGAAAAATGAGAGCGTTGACATGAGCCGGAGCAGGCCCCTTGCACTCCGGTGCTGTAAGGGTTCAGGAATGCTCTTTTGAGTAATTCCACAGTAGAATTTTTGTCAGCGGGGGTGAGCGCGTGCGCCGCCCCCAC
>AAOX01000007.1/31274-31356 Bacillus sp. NRRL B-14911 1099999053126, whole genome shotgun sequence. 
AAGAATATAGAACACTGTGATGAGCGGTTTTTATTTGCACTTTAAACCGCTTGGAGTGACTAGTGCAGCCGGCCAATGATCTA
>AZAQ01049668.1/23412-23144 Stegodyphus mimosarum contig49668, whole genome shotgun sequence. 
GGCTTAATTTGACTCGACACGGGCGAACTTTACGCGGCCCAGACACAGGAAGGATTGAGAGATTCAAGAGCTCTTTCTTGATTCTGTGGGTGGTGATGCATGGCCGATTTTAGTTAGTGAAACGGTTTGTCTGTCCGATAGCGAAAGACTCTAGCTTACTAAATAGACGCTCCGATCCTTCGAGTCGGACGTTCTTAGAGCGACGTTTAGCTGCATGAGACAGAGCGATAAACAGGTCTGTGATGCCCTTAAGATGTCCGGGGCCGCAC
>CP002691.1/7079696-7079516 Haliscomenobacter hydrossis DSM 1100, complete genome. 
ATTTTATAGAGAAGAGGGGAGAGAACGGGCTCTAAGAACCTCTGGCAACCATGCTTTTTTAAGCGAAAAGTGAAAAGCGAAAAGTGAAAAGTAAGATTAGCTGCTTTTCGCTTTTCACTTTTCACTTTTCACTAAATAAAAGTAACGGTGCCAAATCCCGCCATTAATGGGCATATAAAAT
>AB701766.1/10364-10418 Culex flavivirus RNA, complete genome, strain: Toyama71 
ACGCGCGCAAGGAAGGACATGGCTGTCCTTGGGTACTAACGACACCCCGCCCCCA
>LFJF01047439.1/12546-13056 Macrostomum lignano unitig_47506, whole genome shotgun sequence. 
TATCTGGTTGATCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTCTAAGTACAAACCTTAATACGGTGAAACCGCGAATGGCTCATTAAATCAGCTATGGTTCCTTAGATCGTCTCATCCTACTCGGATAACTGTGGAAAATCTAGAGCTAATACGTGCTTACAAGCCCTGACCTCACGGGAGGGGCGCATTTATTAGATCAAAACCAATCGGGGCTTGCCCCGTCTGCTTGGTGACTCTGGATAACTTTTGTGGCTGATCGCATGGCCTCTGCGCTGGCGACGTATCTTTCAAGTGTCTGCCCTATCAACTTACGATGGTAGGTGATATGCCTACCATGGTTATAACGGGTAACGGGAATCAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGCAAATTACCACACTCCCGGCACGGGGAGGTAGTGACGAAAAATAACGATACGGGACTCTTTTGAGCCCCG
>KE124372.1/17462-21459 Plasmodium falciparum UGT5.1 unplaced genomic scaffold supercont1.10, whole genome shotgun sequence. 
GAGGATAAAAATAGGAGGGCAAATCCGCTGAACTTAAGCATATAATTAAGCGGAAGAAAAGAAAATAACTATGATTCCTTTAGTAACGGCGAGTGAAGAAGGAATAGCTCAATAAGTAGAATCCTTCGAATCTTAATGATATATTTATACATAGAATAAAGAATTGAAGGAATTGTCAAGTTGAATTGTACTCTTGTAGGCCTCACAGGTGAAATGAATATATAGAAGTAAAGTAGGAATACTTCCTCATAGAGGGTGAAAGGCCCGTATCATATATCATTTCGTGGGCTTTGGAGTATTTATATTTTACTGAGTAGTGTTCTTTGAGATTGGAGCACAAATTGGTGTGATACATTTCACATAAAGCTAAATATGTACAGGAGACCGATAGCAAACAAGTACCGTGAGGGAAAGATGAAATAGTACTCAGGAATGAGCAATTAAATAGTACCTGAAATCGTTAAGATGGAACGGATTAAGAGAGAAAACAAGTAAAGAGGGGAATTTTTAATTTTTTTTGTTATAATTCTCTTCTTTATTAAAAGAAACATCAGTGATTAATTTAATTTCAATAAAGCAATCCCCTGAAATTCAAAATTTCTTTTAATTTTGTTTTCACTTTCTCCCCGCACTAATGTGGGGAAAACTGGCTTTATTTCTTCAATTATTTTTTTTGCTGAGGAATTTTAAAATTATTTGAATTTTTCTTCTTATAATTTAAGTTGTTTCTATATAGTACTTTCTTAACCCACTCGTCTTGAAACACGGACCAAGGAGTCTAGCAAATGTGCAAGTGTATATGATTCTTTAAACATTTCTCTTTTTAATATACGCATAATTAATGTAATATGTTTCTTTATTGTAGATTTGTGGTGTTTAATTTTTATTAAATCCCCACTTTGCATACAATACCGGTAAGCAATTATGCTTTATTGAGTACGAGCATATTTGGTAGGACCCGAGAGGCTTTGAACTAAGCGTGATGAGATTGAAGTCAGGCGAAAGTCTGATGGAGGATCGAGTTGATACTGACGTGCAAATCGTTCATTTCAATCACGTTTAGGGGCGAAAGACTAATCGAAAAGCCTATTAGCTGGTTATTTTCGAAAGATCTCTCAGGATCGCTGGAGTTGAGTTGATTATAATTTTATAAGGTAGAGACAATGATTAGAGGGTTTAGGGGATTAAATATTTCTTAACCTATTCTCAAACTTCCAATATGTAAAAAGGGTGATATATCTGAATTGTGTGTATTTCACTCTGTTTTAAATAAAATAACTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGAGGGATGCTCCTAACGCCTGGATAAGGTGCCTAAATATTCGCTCATGAGATCCCATAAAAGGTGTTGGTTCATAATGACAGTAGGACGATGGTCATGGAAGTCGAAATTCGCTTAGGAGTGTGTAACAACTCACCTACCGAATGAACTAGCCCTGAAAATGGATGGCGCTAAAGCGAATTACCGATACCGGGCCATAAGAAGGTAGAAATTATAAATGTTAATTTAGCTCAGATCTTTTTATGAGTAGAAAATCGTGGGGTTTGTGTTGAAGCGAAATACGTGAGTTTTCGTGGAACATCTCCCTAGTGCAGATCTTGGTGGAAGTAGCAACTATTCAAATGAGAACTTTGAAGACTGAAGTGGAGAAGGGTTTCTTGTCAACTATGTTTGTACAAGAGTTAGCCACTCCTAAGGGATAGCTGAAAAGTGTTTAAAAGAAGAAATTCATTATAAGAATTATATAATGAAACTTCATCTCGAAAGGGAAACAGGTTAATATTCCTGTGCCATAAGTAATAAGAGTGCAAACAGAGATGGTAACATACATATAAATGAACTCCTTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTAAGGGAAGTCGGCAAAATAGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGACATTAGAAAAGAGAAGAAAAAAAGAGGGTTGAGAATAAAATTGCAGATTTATTTGCTTTTCTCTCTGATTTGCTTGTAAATTTTCTTTTTCTTTTTCTTCTTTTCTTTTTTTTTCTGTCCCTCTTTTCGTCTTCATTTTATTGTAATTTTTGTTACTTTAATTTGATACATATATAATGTTAACTCAGAACTGAAACGGACAAGGGGAATCCGACTGTTTAATTAAAACATAGCATTGTGAAAAACCATAACTGGTATTAACACAATGTGATTTCTGCCCAGTGCTTTGAATGTTAAGTTGATGAAAAATTCAATTAAGCGCAGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTACTTGCTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAAAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTTACTCTAGTCTGGCTTTGTGAAACGACTTAAGAGGTGTAGCATAAGTGGGAGTAGAAACTGAAATATGTTTTTACGACAGTGAAATACCACTACTTTTAAAGTTGTTTTACTAATCCATTGATAGGGATATATAAAACTTATAAATAATTTTTATTTTAAGTTACTTTTGAATTTAAGATATGTGTGCATTTATATCTATTAAATCCCATTTTGTATATATATATATATTATATATATGTGTATAATACGATTTTTTTTATGGAGACATAGTTAGGTGGGGAGTTTGACTGGGGCGGTACATCTGTTAAAAAATAACGCAGATGTCCAAAGACAAGCTCAAAGAGAACAGAAATCTCTTGTAGACTAAAAGGGGAAAAGCTTGTTTGATTTCTATTTTCAGAACAAGTAGAAAACGTGAAAGCGTGGCCTATCGATCCTTTATATTTGCAAAATGACGTAATAAATTACTTACTACTGTGCATATAGAGGTGTCTGAAAAGTTACCACAGGGATAACTGGCTTGTGGCTGCCAAGCGCTCTTAGCGACGTAGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGGGACGCAGAAGTCTCAAAGTGTCGGATTGTTCACCCGCTAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGAATTTTATTATATTTTTTATATATACATATAGTATTGTGACAGTAATCCAACTTGGTACGAGAGGATTAGTTGGTTCAGACAATTGGTACAGCAATTGGTTGACAAACCAGTGTTGCGAAGCTAAGTCTGTTGGATAATGGCTGAACGCCTCTTAAGCCAGAACCCATGCTGATTAGACAATTCTAAATTTGATCTTTTTGTTAAACGATAAAAATTATATATATATTTTTTTTATCTTTACTGCATAATGTAAAAGAGAAATTATACATATATATATATATATATATTAGAAAAGAAAAAATGATGTAATTAATTATTATTATTATTTTTTTTTTTTTTTAGTATTAATATATAATTATGAATATATAAATAATCCTATATCTTTATATAAAAATTAAATTTTTAATTTTATTAGAATTTTTTTTTTTTATATATATAGATTGTAATTTAACAACAAAAAGTATTAAGCCCAAATCGTAGACGACTTTTCTGTCTCAGAGTACTGTAAACATGAGAGTAAACTTTGTTTTACGATCTGTTGAGGTTTATCTCTTGTGACATTGAGCTAA
>MDLB01000098.1/10133-10486 PVC group bacterium (ex Bugula neritina AB1) isolate AB1-3 AB834_contig000098, whole genome shotgun sequence. 
AAAGTTGATTGGATCATCGGTGCTGTTGATCTCAAGATATTGATTTAACAGTGCAGGAAAGTCTGGACTCCGCAGGGTAAGATGCTACTGTTATGGTTGTGAGGGTGACCTTAAGGAAAGTGCCACAGAAAAAAAACAGCCTATTGGAAACGACTCGTTTCGATTGATGGGTGATGGTGAAAAGGTGAGGTAAGAGCTCACCAGTTCTGGTTTGAAACCCAGAAGCTAGGTAAACCCCATCTGGAGCAAGACCAAGTAGGAAACGTGATAGTTACCCGCTATATGTTTTCGGGTTGGTTGCATTAGATGAATGATGGTCATAAACAGAATCCAGCTTATAGATCAACTTTGCCT
>JRRC01046601.1/9504-9338 Gossypium arboreum cultivar AKA8401 contig_129_9, whole genome shotgun sequence. 
ACTTTTTAAGTTTGCTGTCAAATCTCAAGGCTCAACCCTAGACAGGCGGTGGAAACTACCATGCTGGAGTACGGTAGGGGTAGAGGGAATTTTTGGTGGAACGGTGAAATGCGTAGAGATCGAAAAGAACACCAACGACGAAAGCACTCTACTGGGCTGACACTGAC
>JH835603.1/135856-135729 Erinaceus europaeus unplaced genomic scaffold scaffold00315, whole genome shotgun sequence 
AGCCCCATTCTAGATGAAAATGGGCACTGTTGCTTTTGGTGTTCAGAAACAGATGTGGCTATATTGATACAGGTTAAGCTTTCACCATAGTACCTTACTGTAGTGGTGACAATGAGGCTGCAACATGT
>KV428048.1/4065-3885 Sistotremastrum suecicum HHB10207 ss-3 unplaced genomic scaffold SISSUscaffold_45, whole genome shotgun sequence. 
TTCGTGCGGCGTCACGGCTATACTTTCCCCATGTTGCTCACTTCTGCTGATCGTGCGGTGGTTCGAGTGTCAAGCCGTGTCCAGAATAATTTTCGTGGACGTCTTAGTGCCTTTTTAACCCTCCTTTTATGGCTCTTGTAGCCTTTTTGGGAGGAGGGTTGGGTCGGTGGTTCTTACACTC
>MGVC01000060.1/14949-14867 Elusimicrobia bacterium RIFOXYA2_FULL_39_19 rifoxya2_full_scaffold_498, whole genome shotgun sequence. 
ACGTTATCCCGCTACTGGCGGATTTGTGGGCCTAAACCACAAGGGACCGGGATAATTTCAAGCCGACCGCCTGGGCAGAAGTT
>LZPO01057484.1/678881-679115 Neotoma lepida isolate 417 scaffold_0, whole genome shotgun sequence. 
GGATATGAGGGTGATCTGACTTGACAGTGTCTCCTTTCTCCCTTATTCTTCCATGTGTGTCCCTCCCGAAGGTGCCCATTCACTGTTTTGAAGACTAAAGGAGGATTGGACAAGTACCTGTGCTCCACTGTTAGAGCCTCCAAACAAACTCTCAAGAAGAAAACCAGATGAGAACAGATGGCCAGATAGTTTATTGTTCATCACTCTAAATAGTAGACACAATTCAAATTATTCT
>AAAB01007393.1/1-1983 Anopheles gambiae str. PEST whole genome shotgun sequencing project, whole genome shotgun sequence. 
ATACCATGAAAGGTGTTGATTGCTAAAGACAGCAGGACGGTGGACATGGAAGTCGTCATCCGCTAAGGAGTGTGTACAACTCACCTGCCGAAGCAATTAGCCCTTAAAATGGATGGCGCTCAAGTCGTTTGCCTATACATTGCCGCTGGCGGTATGGCGCATCGGGGGCTTAACCACCCTGCGATGAGACCCCAGTGAGTAGGAGGGTACGGTGGTGCGCGTCGAAGTGTTTGGCGCAAGCGGCATGGAGCCGCCACTGGCACAGATCTTGGTGGTAGTAGCAAATATTCGAACGAGCTCTTGGATGACTGAAGTGGAGAAGGGTTTCGTGTCAACAGCAGTTGAACACGAGTTAGCCAATCCTAAGCCGCATGGGAATCCAGTCGTAACCCATCAGTCGGCGAAAGGGAATCCGGTTACCATTCCGGAGCCTGTTGAGTACCCGTTTGCGCCACCTAGTAGGGTTTAGCTCGTCCGCACCCGAACGGTTAGTGTGTAGCTTCATGGCAACATGAATCCTTTTCTTCGAGAAGCCAACGAGAGGCATCGGAAGAGTTTTCTTTTCTGTTTTACAGCCACACCGACCATGGAAGTCACTCACAGAGAGATATGGTTGGACCGGTCTGGTAGAGCACGGCCGCCGCAACTGCCGTGTCGATGCACTCTTCTTGGACCGTGAAAATCGAAGACTGGGGCACACTTTATATGGTAATAACGCACACTCTCAACAGATTGTACCGAATCCGCAGCAGGTCTCCAAGGTGCAGAGTCTCTAGTCGATAGATCAATGTAGGTAAGGGAAGTCGGCAAACTGGATCCGTAACTTCGGGACAAGGATTGGCTCTGAAGGCTGGGTGCGACCAGCCGGGACCGGTGCTCCACCTGCCGCAAGGTAGGCTGGCCCGTGCCCGCGGTCGCACAGCAAACAGCCAATTCAGAACTGGCACGGCTGAGGGAATCCGACTGTCTAATTAAAACAAAGCATTGTGATGGCCCCGGGTGGGTGTTGACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAACGTGAAGAAATTCAAGCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCTCTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGATGCACTAGCGGGGAAAGAAGACCCTGTTGAGCTGACTCTAGTCTGGCATTGTAAGGCGATATAGGAGGTGCAGCATAGGTGGGAGGGCTTCCTCGTGGAGCTCGCCTCTGAGATACCACCACTCTTACTGTTGCCTTACTTACATGATTGGGTGGAACAAGCGCGGGCCCCAGGTCCGGATCGTGCGCGCACCTCCTCCGGGGGGCTGTGGCGGCGGTTCGCCTGCGCGCGCCCAATGCGCCGTGTTTCTCGCTCAGCGTCCAGTGTGTCGCTGGGTGGTGCCGCCGGGGAGACTGCATCGTAGCATCGTCGTGTGTAGCGTGTTACCCGCTTGTCCGACCGTGAGCCGTGGCCCGCAAGGGTACAAGCTTGCGTACGTCGGTGCATTCGTGGTGCACTGCTTCTGCGCGGTCGATCGTTTATGATGTCACGTTTGCCCCCGGTTCCGCGCGCCGCCCGGCTCGAAGACTCCTGGACAGGTCCTTTCGGTCCACGTCATGGACAGTGCCAGGTGCGGAGTTTGACTGGGGCGGTACATCTCCAAAACGATAACGGAGGTGTCCAAAGGTCAGCTCAGTGTGGACAGAAACCACACGCTGAGCATAAGGACAAAAGCTGGCTTGATCCCAACGTTCAGTACACTTCGGGACAGCGAAAGCTTGGCCTTACGATCCTTTTGGTTATAACGAGTTTTTAGCAAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCCGCCAAGCGTTCATAGCGACGTGGCT
>LCGI01000002.1/5713-5334 Parcubacteria bacterium GW2011_GWA1_43_27 UV92_C0002, whole genome shotgun sequence. 
ACGTCAACCCAGGTGATTGCTCCGTATTTTACGGAGAGGAAAGTCCGAACACCACAGTGTTCCCGCTAATTTAAGGGAAGGGTAACTCCTAATTGGAGCCGTTGATCCGAGTAATCGGATCGCAGGACAAGTACAACAGAAAACAAACCCACTTTAATAAAATCATTGAAGATAGGGGTGAAACGGTGAGGTAAGAGCTCACCAGTATCTATGGCAACATTGATGGCTAGGTAAACTCTACCCGGTGCAATACCAAGTAGGTCCGCATCTTGGCGGACGGGTTGGTAGCTTGAATCCTGGTGCGAATCAGGATCTAGATAGATAATCACCGCCCTGCCTCGCGCAGGGTACAGAATTCGGCTTATAAGGTTGAGGTGAGC
>JPVT01000244.1/2256-2451 Tetragenococcus muriaticus 3MR10-3 WGS_Sequence244_061, whole genome shotgun sequence. 
ATATCAATACACAGAAAACCTAGTACATGATTTTGACCTTTCAGAGAGCTGATGTTTGCTGTGAATCAGTAGGAAAAATGATGGAATCCAGTTTTTAATGTTTCTTTTAATAAAGAACCTATACTCTTTGGTTACAAGAGACAAGTGCGGTTAATAACCGAACTTGGGTGGCACCGCGAACTATTTCGTCCCAAGC
>MHLL01000003.1/8974-8834 Candidatus Lloydbacteria bacterium RIFCSPHIGHO2_02_FULL_50_13 rifcsphigho2_02_scaffold_10435, whole genome shotgun sequence. 
AGTTTATCGCGAGTGCGGGGGAGGGAATTGGCCCTAGAATCCCGCCGGCAACCATTCTGAATGACTCCTACGGTTTTGGAGAACCGTAAGAACTTCAAAAAAGAGGTGCCAAATCCAAACCCTTAAGGGGAAAGATGAAAT
>ALAR01193235.1/10683-11037 Tupaia chinensis contig193235, whole genome shotgun sequence. 
GAATATGAGGGCAATCTGGCTATGATAACTGTCATCTCGTTGATGGCCAGGGTTGGTTCCTCTGATCGGGCAGGCTGGATGGATATCCTCTTCTTCCCTCACTTCTCCATACATTTCCTTTCCCAAACTGTGTATCCAAAGAAGATGGCCTTTTCAGGTATACAAGGCCCATTGTTGGGCTGAGCTGCTTGGGTAGCTCAGCCCAAGAATGTGTTCCTCAACCAGAACCTCTGAACAGACTCTTCTACTTAGTACTACCTTTACTCACTCTTGTTTTTTATTCTGTAAAGGAATATTCTATGCTATTTCTTGTATATAGAAAATTTCCACAGCATCATTTGGTGGCATGATAGTG
>ANKR01173204.1/1886-2165 Myotis brandtii contig173204, whole genome shotgun sequence. 
ACCGGGCGTGGTGGCGCGCGCCTGTACTCCCAGCTACTCGGGAGGCTGAGGCTGGAGGATCGCTTGAGCCCAGGAGTAGGGCTGTAGTGCGCTATGCCGATTGGGTGTCCACACAAAGTTCGGCATCAATATGGTGACCTCCCGGGAGCGGGGGGCCACCAGGTTGCCTAAGGAGGGGTGAACCGGCCCAGGTCGGAGACGGAGCAGGTCAAAGCTCCCGTGCTGATCAGTAGCGGGAAACCTGGAACCCTTCACTTGCAGGCCAATGCTCTATCCTCTG
>BA000039.2/281279-281411 Thermosynechococcus elongatus BP-1 DNA, complete genome. 
GACAACTCAAGACTAAAACCGAAGACCGCAGGGGTCTGGCTGAGACATAATCTTCCTGCCGAGGTTTGCGAAGTCCATCCGTTGCGATTGGGCGATCGCCCCGGCACCCTTGCTGGGGTTTTTCTTTCACTGA
>ALWT01112214.1/10402-10542 Myotis davidii contig112214, whole genome shotgun sequence. 
AGCTTTGCGCAGTGGCAGTATCGTAGCCAATGAGGTTTATCTGAGGCGCGATTATTGCTAATTGAAAGAAAAAAAGAAAAGAAAAGAGGGAGATGACTGGCGGTGGCCATCGCCCTGCCCACTGGTCACCCCACAGATGGG
>MHQJ01000053.1/3212-2967 Candidatus Sungbacteria bacterium RIFCSPHIGHO2_02_FULL_49_12 rifcsphigho2_02_scaffold_96412, whole genome shotgun sequence. 
NNNNNNNNNNAGAAGCAATTCTCTTGTAACAAACTTGGCTATATGCTGGAAAACCCGCGCATGCAGAAGTACTTAAGTACTGTACAGTACTTAAGTGACAATCTTCTGCCGATGCGGACAATCAGCAGGCAACCTATAAGTTCAATAGACCAGTCTATCGAATTCATAGAGAGTCCCCAGAGACTATACGCCGAGCCCCCAAGTTTTGGGGTGATGATATAGTCCATGCCTTATGGCGACATAGGG
>DS989904.1/4377794-4377629 Synechococcus sp. PCC 7335 scf_1103496006895 genomic scaffold, whole genome shotgun sequence. 
TTGTGTCGCTATGCGCCGTGCTAGGCTAGGTAGCCTGCATGGGGAAAGTTCGGTGAAAAACCGGCGCTGTCCCGCAACTGTGATGGCAATCTCTAACAAAGTTTCTTCAATATAGTTGCTTTCTTTTGCCTGAGCCAGAATGCCTGTGCGGGTTTTCGCTACACTC
>AFTD01105653.1/47017-47121 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
GGCTTGTTTGAAGGTAGTGAGTTATGTATTGCTCAAAGGCAGTTGCATATTAGACCCCTTTTCTATACTTTCTCCTGTCACACTATCACACCTGACAAGTTTAAA
>MGYS01000080.1/2479-2377 Gammaproteobacteria bacterium RIFCSPLOWO2_02_FULL_57_10 rifcsplowo2_02_scaffold_5319, whole genome shotgun sequence. 
TAACTCAACAACCAACGTCGCACATACACCGTCACATGTGTTTTGGGTGCCTTGAAATCCTCGCGGATTCGGGGTTAAACCATGGGGTGTGTGGAGGCTTAAC
>CP003219.1/1938094-1938153 Streptomyces cattleya DSM 46488, complete genome. 
CGCCCGGTACGGACCCGTGGGGGGATCCGCTTCCGGGGCACGGGGGCGCCCCGCTCCGGA
>LJYW01000001.1/1800734-1800628 Prosthecomicrobium hirschii strain 16 C1, whole genome shotgun sequence. 
TGCCAGTCCGAGGGGTGCTCCTGTGGGAGCTGAGATGGCGCTGCGGCGTCGGACCCTTTGAACCTGATCCGGGTCATGCCGGCGAAGGGACGGGATCAACCGGCTTT
>JH932293.1/704875-704772 Bergeyella zoohelcum ATCC 43767 genomic scaffold supercont1.1, whole genome shotgun sequence. 
CGAGATATAAGCATTTTTTATCAATTATAAAAGTACCATTTTTTACCACATTGCCTAAAAATAAAACACCCCAAACCATCGTTTGGGGTGTTTTTATTAATCTA
>GL541731.1/40376-40515 Microbotryum lychnidis-dioicae p1A1 Lamole unplaced genomic scaffold supercont1.89, whole genome shotgun sequence. 
TCAGTCTCTCTTCTGGACTGAGCTTAATCGGCATGCGTCTCTGGTAACGGGGGGGTATGAAGCCCGAGGATAACGTAGCCTCTTTAGCTTTTTACTCCTTTATTTTCGAAAATAAAGGCCAAAAGAAAAAAAAAGGGAGG
>LHUR01000022.1/308140-307852 Clostridium homopropionicum DSM 5847 CLHOM_contig000031, whole genome shotgun sequence. 
AAATATATTAAAGCGCCAGAGCTAAGCAGGGAGCCTGAATCAAAGATTGTCTTATAGGAAACTCAAACTAAGGTCTGAGTAAGCTCGAATAAGCCAAATTAGCACTCTGTGTAAGTGACTTGCACCAAATCATAGATTTGGGCAATCTACTTAAGATTTGGATTCTCGCTTAGCTGACGAGGGTGGGGAGTATCGAAAATTCGGCGGATGCCCCACGGTATAGTGCTACCGATAAAGACTGGCAAAACTGAAAAGTAATTTTCAGTACAAATTCAGTCAGGCACTCACA
>CP008889.1/1694819-1694882 Dermacoccus nishinomiyaensis strain M25, complete genome. 
GGAATGCCGGTGCGAATCCGGCAGCGGTCCCGCCACTGTGATCCCCGACGGGGTAAGCCAGGAC
>HF993839.1/17775-17516 Clostridium sp. CAG:127 genomic scaffold, scf188 
TAGTAGTTCGATGGACTGAGAAGTGAAGAACGAGGAGTTGGTTATGAATCTGGTAAAAGGAACAAGGATGTTGCGGAAGGATAATAACCCATATGGGGCACAGCCCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTGAACACGAAAGTGGCTTGCCTGCAATTCCCATGTGTACGGGCGATAGAGGGGTTCGGATGAACCAGAGTACACCTACA
>CAJW010074381.1/2720-1779 Hordeum vulgare subsp. vulgare, WGS project CAJW01000000 data, contig: morex_contig_74381 
ATGGGGCACGTGGAATCCCGTGTGAATCAGNNNNNNNCACCTTGCAAGGCTAAATACTCCTAGGTGACCGATAGCGAAGTAGTACCGTGAGGGAAAGGTGAAAAAACCAAGTGGGTAATAAAAAACATCGTGAAACCTTGTCGAGCTCCCAAGCAGTGGGAGGGGAAAGTGATCGCTGACCGCGTGCGTGTTGAAGAATGAGCCGACGATTCATATGCAATGGCTTGGTTAAGGGAACGAAACCCACCAGAGTCATAGTGAAAGAAAGTCTTAATAGGGCGATTGTCACTTCTTATGGACCCAAACCCCTGTGGTCTATCCATGACCAGGATGAAGGTTGGACGAAACTAAGCAGAGGACTGAACCAACTGATGTTGAGTAATCAGCGGATGAGTTGTGGTGAGGGTTGAAATGCCACTCGAACCCAGAGCTAGATGGTTCTCCTCGAAATGTGTTGAGGCGCAACAGTTGACTGAACATCTAGGGGTAAAGCACTGTTTCGGTGCGGGCTAAACGATCGGTGCCAAATCGAGGCAAACTCTGAATACTAGATATGACCCAAAAATAACAGGGGTCGAGTCGGCCTGTGAGACGATGGGGAATAAGCTTCGTCGTCGAGAGGGAAACNNNNNNGATCACCAGCTAAGACCCCTAAATGAACGATTAGTGATAAGTAAGGTGGGGGGGGGGGGCAAAGACAGCCATTAGGTTTGCCTAGAAGCAGCCACCCTTTAAAGAGTGCGTAATAGCTCACGGATCGAGCACCATCGTGCTGAAGGTAAACAGGGATAAGCAAGGTGCCTAAGCTATGAGATGTCAAAATGCATTGGTAGGGGAGCGTTCCGTCTTAGAGGGAAGCAACCTCTTTCCTAAATATGTATCGGTTATATTTCATGGTCGAGGCTCATTTTTCTATTGTTTTACCATACATGGTTTGTTTCT
>FKLB01000042.1/73555-73404 Pseudomonas sp. 1 R 17 genome assembly PSEFL294_LIB5394, contig: PSEFL294_LIB5394_000042 
ATCCTTCCCAAGTGCCTGCTGACGTTGTCAGCAACATGCTCAGGGCAGCTTTGATCTAGAAAGCTGCAACGTACATACCGTACGCCGATCACCACCCAACCGCTAAAGCATTCAATTTGTGGTCACACGTCAGCGTTATCGACGTGGAATGC
>CM001665.1/38959911-38959726 Nomascus leucogenys chromosome 19, whole genome shotgun sequence. 
ATTGCTTCTTGGCCTTTTGGCTAAGATCAAGTGTAGAAATCCATGAACACTAAAGGACTGCATTGACTTTTTCAGAGAGTAGAAAACAACTTAGTTTTTTTTTTTCCTGAATGCGTCATAGGCTTGTGAGTGATTTTTGTCCATTCAATTGTGCCTTCTTTGTATTACAATAAGATGGGGGTACTT
>CP011568.2/2789266-2789207 Pandoraea thiooxydans strain DSM 25325, complete genome. 
TGTCTCCTCCACCTCCTCCTGGTGGATTTTATGGCCAGCAGATTGCTGGCCATTTTTTTT
>ARZA01000139.1/3294-3076 Caldisalinibacter kiritimatiensis strain L21-TH-D2 NODE_28, whole genome shotgun sequence. 
ATATAAGCTGTGAAAGGTAATAGTAGATATTTAAGGCTTACAGAGAGGAAATCCTAGGCTGAGAGATTTCTAGCCCTCTGAATATTGAACCCGGCCTGGAGCTTCTAGACTGAAAAAAAGTAAGTTTAGACGGTGTTAGCCGTTATAAAATTAAGTGAGCCAATGAAATGTATTAATTGGTTAAATAGGGTGGTACCGCGGATAAACTTCGTCCCTTTT
>CAGP01000005.1/749-1 Helicobacter bizzozeronii CCUG 35545, WGS project CAGP01000000 data, contig: tsc_c98 
CTACTACTACACCGATAGCGCACAAGTACCGTGAGGGAAAGGTGAAAAGAACCGTGGGTAACGGAGTGAAATAGAACCTGAAACCATCTACTTACAATCATTCAGAGCACCATAGTGAATCCCCCTGAGGAATTGCGGGGGGGGGCTGTATATAACACTTATACGCCCTCTCCTCCTCCATGATTTCTCGATATCTTTTTTGGTAAGGAGTTTTCATGAAACCCCAAGACAATGCGTCAAACATGCAAAACCCGAATCGTGGGACTAGCGGGACAAATAGGCAATACGACCAAAATCAGGGGAATAGGGGAAGCCAACTAAACCCTAACAACCCCAACAACAGGAAATAGGTAAGGAGAGGTCTCATGGGAAGAGGACAACCAGATAACGACCCTAACGAAGCAGGCTATCCTTCCACGACAGGTAACCCAAGCGGTGGCGGTCGTGGCAATGATGACCCTGATGACGATTAGGTCTAACTAGGTCTCAAACAAGGAGGGGAAAAACTTCAATTCTTCAGTGGGATTCACTGGTGTGATGGACTGCCTTTTGCATAATGATCCTGCGAGTTGTGGTGTCTGGCAAGGTTAAGTGAAAACGAGCCGTAGCGAAAGCGAGTCTGAATAGGGCTATTTAGTCAGACGCTGCAGACCCGAAGCCAAGTGATCTATCCATGGCCAAGTTGAAACGAGTGTAACAGCTTGTGGAGGACTGAACCCGTGCCCATTGAAACGGGCTGGGATGAGCTG
>BDFN01001244.1/2524-2921 Ipomoea nil DNA, scaffold: scaffold1244, cultivar: Tokyo-kokei standard. 
ATTCAAATGAGAACCCGAAGGCCGGTTCAGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGGGTCGGGGGCGCGCCCGACAGACAGCGCGTTTTGCGCGTGGCCGAAAGGGAATGAGAATAATTCGAGGGCGTTCGACCCGATGTTCTAATCATTGGCTTTACCCGAGAGACGGCGCGGCGCTCAAGAGTTGAGGGAAACTTCGGAGGAACCCCCCTGGAAACGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCACACGTCGCGTGGTGTCCGGTGCGCCCCCGGCGGCCCTTGAAAATCCGGAGGACCGAGTGCCGTCCACGTTCGGTCGTACTCGGTCCCGCAGGTATCCTGGTGAACAGCCTTGGTG
>JH815222.1/1813753-1813619 Clostridium sp. 7_2_43FAA genomic scaffold supercont2.3, whole genome shotgun sequence. 
ATTGTTAAGAAGAAACAAAGCCGTTTCTCACCTTACGGCAGAGCTTAGTAAGGTAGTATATTCTTATTTTAATTTATTATTTAAATTAAACGTGAGTATTATGAGGACGGCATATTGCTGTCTTTTTTATTTTGT
>AACY023865031.1/116-206 Marine metagenome ctg_1101668672382, whole genome shotgun sequence. 
CTGAGTTTCTTGCTTTTCTATAAGAGCAAGTGGTGCGCTACATCCGCGTAGTTTCCTAGTTCTACACAAAAACTAGGTGGCGAGCATATTA
>ANKR01167074.1/25401-25567 Myotis brandtii contig167074, whole genome shotgun sequence. 
ATCACTTTTTGGCCTTTTGGCTAACATCAAGTGAAGCATCTGTTCTTATCAGTTTAATAAAATATTTGCTTCAGAAACTGCCACCTCTGAAGAGTCAAGCTGCCATGAAGCAGGTAAGTGCATGGAGCCACCATCAACAGCAAACTCATTTCTGGAGTGAAAGCTCA
>MHKU01000038.1/195-563 Candidatus Liptonbacteria bacterium GWB1_49_6 gwb1_scaffold_7743, whole genome shotgun sequence. 
TTGGCAATTCAGATGATCGCTCTTTATCGCAAGATAAAGGGAGGAAAGTCGGGACACCCTGAGCCGAAAGGTTTATAAAAAAGTAGCGGCTAACAGCCGTCGTCCGCAAGGACAGAGGTGCGAGCAGTGACGCTCCGACGCGAAAGTATCGGAGGGACCCTATCCCAAGCTAGAAGGTCCAACTCCGCGATAGGGATAAGAAAGCGGAGGTGAAACGGCTAAATCCTTACTGGGTGCAAGACCGTACTCCAATGCGGAGCATTGGTTTGTGTCGCTTGAGCCCGCGAGCAATCAAGGGCCCAGATAAATGATCGCCGCCGCCGATAACAATCGGTGTGCACAGAATCCCGCTTACGAATTGCCGCAAAC
>MHXM01000167.1/11573-11672 Desulfuromonadaceae bacterium GWC2_58_13 gwc2_scaffold_6790, whole genome shotgun sequence. 
CTTTGCTCAGAGCAAACCACGGGAAACCGTGGGGCGCAGAGCCACGGGACTTCCGGTTTGCAGGCAGGAACCTGCGACCAAAGTCAGCCGGGCCGCCAGA
>AAPU01011573.1/516306-516391 Drosophila mojavensis strain TSC#15081-1352.22 Ctg01_11574, whole genome shotgun sequence. 
ATATTTTCTAATGATGATAACTACATAGCAAATCAGAGCAATAATGTTGAAATTTACAGACAATGCACTACCATCTGATTGCTATA
>KB916025.1/11687-8703 Neofusicoccum parvum UCRNP2 chromosome Unknown NP2_03_scaffold_387, whole genome shotgun sequence. 
CCTGGAGATAGAGTGCACTTCTAGGGTATAATCTTCACAAAACCCCCCCTTGGTTCTAACCAAGGCAGTTGGTTCTACTAAACTCTTAGAGAAATTATATTAATAAACGAAGTGAATTGAAATATCTTAGTAACTTCAGGAAAATAAATCAAACGAGATTCTATGATTAGTGTGAACGAAAGTAGAAAAGCCTAAATATTAAGCAAGTAAAATGGATTAATCTGTTTGAATATAGGGGAACCTTCCTCTAAGGCTAAATATGATATATAAGCGATAGTGAATGAGTACCGTGAGGGAAATGTTTTGAAATAGTAGTTTTATAAGCAGCTCGAGTGAAGTTTAAATAAAAAACAAGAGCGTACCTTTTGTATAATGGGTCAGCAAGTTAATATTAGATGCGAGCATAGCACTATGCCTAGATAAACCGATTATGAAATAATGAATAAGTATCTAGTATTAGACCCGAAGCCTAGTGATCTTACCATAATCAGGATTATAAAAGTCCGAACGGGTTATCGTTGTAAAGATATCCGAAGAATTGTGGTAAGTTAGTGAAAGACAAAACTGACTAGGATAGCTGGTAAAAATTAGTGTGAGCTACTAATTAGGCCAGTAAGTAGAAGTGAACCTTCTGCTATAGACCATCAAATTGACGGGAAAGCCCTAAAGCAAATTCAACCAAACAAATGTGGTAACACATTTGTGGCGCAGGTAATGACTCGCGGTAAGGTAACATCGAAATTGATAGCGAAAGTGAATGGGTAATCCGCAGCCAAGCACCTTATGGGTGTGCAGTTCATCGACTAAATGTTGGTTGGCGCAAGCTTAAGATATAGTCAAGCCTCATCCAAAAGGATGCAGAATAATAAAATACTTTTTTTATTTAATTTTCCGCCTTTAAGGCACATATCTAATCCTTTATTACCTTCAAATAGACTTAGGTTGTACCTTTTGTATAATAGGTAAACAATCCTAAAGGAAAACATATCTTCTAATGTTTTACATTAGAGGTATGAATCCGAATCTTTTTTTTTAATAGCCGATAAACTATCACAAGTAAATACTAATACAGAATTAGAATATGCAAGTTTAACTGATGCAGCTAAGGCTATAGCTGTTAGTAGAACAGCTGTAAAAAAAGCTCTTGACACAGGTAGAACTGTAAAAGGATAATATATAGTAGCCACAAAAAATTAAATAAAAAAAGTATTTTATTATTTGTAAATGGATAGCTAATAGCTATTTAGGGAGAAGGACCTCAGCTCGGCCCTTTAAAGTTTTATTCATATTCACAATAAAAAAAATAAAGGCTAAAGATGGTCATATCTGTTTCCGCGAAACCTATATAAGTAGGTAATTCAAGTAACATCTTAGCAGGTACAGAACTGTGATCTCAGGTAAAATTATATTATTTTAGAAATCTAAAATAATAATTTTGCATACATCGGGGGATCGTGAAGATTTTATCGGTGAGTATTTGCTCTCGGAAGGGCAAAGATGATTATTGAATAATCAGACATAGTACGATAAGGTTGTATGTCTAAAGGGAAACAGCCCAGAACAAGTGTTTAAGGTTCCAAAATTATTGTTAAGTGAAATTAAGGAAGTATTTTTCAAATACAACCAGGAAATAGGCTTAGAAGCGGCCATTTTTTGAAGACCTCGTAACAGAGCACTGGTTCAATTATAAATTAATATAAATTTATACAAGTTAAAAGCGCCAAAAATATAACGGATCTAAAACAATATACCGAAACCTTGTCCATATTTATAAATATATAGGAAGTTAAAGATCTGGGTGAAATCTTTATTTTTTTTTTTGAAATAAAGATTTCACTTTTTATAGTAATAATAATAATTAACAAATCTTTAAGCTTCATGCTTCAATATGTAGCAAAGATATTGTATTTATGGGGTAGCGGAACGTTGGGGAAATCTTAGATTTTTACTTTTTAAGTAAAAAAATTAGATAACCCAAGTGAGAATGCTGACATGAGTAACGAAAAAGGGGAATACCCTCGCCTTAAGCTTATGGAATTTCTTTAAAGTAACGGCCTCTAAGTTTACAGACCTGTCCTAAAGGATTAAACGATGAGAAAATCTTCCTTATGTATGACAACCTTAGAATAATAGTTAATCTGTTTAATAGATAAGAAGATTTTGTATTAACAGTTAATGCATTTGAAGATTTTGTATTAACACTGTTAATGCATTTGAAGGTCATGTTAAATGCGCCATGATATATCAAATCTGGTCTACTAACCAGATTTGATATACCGACCAGTAAAGCTGGATACTCTGTCACTGCTTGCCACAGGGCCTATGATCGTTGCAGGCCTACTGGTTCTTATTTTTTAGTATTGAATTATATGGCAAGTATTTTCAGTATATCCCTTTTCCCTGCAGAGGAAATATCCCCTCTAAAGGAAACTTAGGGAAATAAACTGTATAGTAACAAAGGATGCTAGACAGATATTAAATAGATTAATAGTTGAGAGTACTAAGCGTTCTGGAAAAAGACATAAGGGTAAAACCGTACCTAGAAACTACCACCAGTAAGCAAGTAGAGAATACGAAGGCGTTTGAGCTAACAATCATTAAGGAACTCGGCAAATTGACTCCGTAACTGCGGGATAAGGAGTGCCATTCTAACTGGATAATATCAGATTTAGAAGAGGAGGCACAGAATGGTGTTGTACGACTGTTTAATTAAAACACAGCACTTTGCGTAAGATGACAAATCGAAGTATAAAGTGTGCCGTCTGCCCGATGATGGATGGTTAACGAATTTATTTAGCTGACTAAAATAGGTTAGGTTTTGAAGGAACCCCCATTCAATGGCGGCCTTATCTATAAGGGTCCTAAGGTAGCGGAATACCTTGGCCGTTAAATGCGGTCTTTGCATGTTTTCTCTTTAGTTTAGGTAACTAAAGTAAAGGATTAACCAATAAAAAAAAATAAATAAGGGAGAAATCTCTCCAAGCC
>LJSX01000001.1/215848-215664 Rhizobiales bacterium HL-109 ITZY_scaf_5, whole genome shotgun sequence. 
TGGCCCCTTGCCGTGGTCGGCGCCCTTTCGGGCCCAACAGGGAAACCGGTGCGAGACCGGTGCTGCTCCCGCAACTGTAATCGGTGAGCCCGTCCGAAAGCCACTGGTGCCCCGCGCACCGGGAAGGTGGACATCGCGGTGATGACCCGAGAGCCAGGAGACCTGCCGACGTGAAGCAACCCTGA
>NATL01000046.1/9039-8946 Candidatus Omnitrophica bacterium 4484_70.1 ex4484_70.1_scaffold_5627, whole genome shotgun sequence. 
AGCGATAAAGCCAAACCCAGGGAAATCTGGGGGCGGAAAGCCACGGGTCCTCAAAATCAGGATTATTATTGAGGGGATAGCCGGGTTGCCGAAA
>CP000248.1/722861-722994 Novosphingobium aromaticivorans DSM 12444, complete genome. 
CCCCAACATCGAGAGTTGGGGTGACGCTCCAACGCCAACCTGCCGTTCCGGGCAAGGTGGTACCCGATCCGCAAGGCGGCCCCGGCCGAATTGCGAAAGGGGATGTGGCCGATCCGGCAACCAAACGGACACGG
>DS562862.1/42992321-42992756 Cavia porcellus supercont2_7 genomic scaffold, whole genome shotgun sequence. 
AATGGCGGTGACCTCTGGTCCCGTCTGTCTCGTTTGTTCAGTCGTCCGTTGGTCAGTCGGTCGGTTGTCCCCCTCCCTCTGAGACGCGAGCTCAGATCAGACGTGGTGACCGGCTGAATTTAAGCATATTAGCCACCAGAGGAAAAGAAACTAACAAGGATTCCCTCAGTAATGGCGAGTGACCAGGGAAGAGCCCGGCGCCGAATCCCCGCCCTGCGGTGGGACAGGGGAAATGTGGGGAATGGAAGACCCGCTCCCTGGCGACACTTGTGGGAGGCCCAAGTCTTTCTGATTGAGGCAAAGCCCATGAACGGTGTGAGGCTGGGAGCGGCCCCCTGCGTGCTGTGTTCGGGGGAATCACGAGATGGATACTTAAATACCATAAGGGAAAGTTGTAAAGAACTTTGGAGAGAGTTCAAGTGGGCTTGAAACTGTT
>CAFZ01000031.1/6993-6912 Piriformospora indica DSM 11827, WGS project CAFZ01000000 data, contig: PIRI_contig_0034 
CCACTCTTAGCTCAGTTGGTAGAGCGTGCGGCTGTAATTTCCCTAAACCGCAAGGTCGCTGGCTCGAATCCGGCAGAGTGGA
>JPZU01000001.1/1721226-1721354 Lachnospiraceae bacterium TWA4 TWA4_scaffold00001, whole genome shotgun sequence. 
ACGAAACGATCAGCACCGCCGAAGACAGCAGGTGCCGTATGGCGTAAGGTGTAACGCCTGCCGAGACGATTTTAAGGAATGCCTTATATACCTCTCTGTCTTTGGATAGAGAGGTTTTGTTTATATACA
>LQBR01000004.1/128232-128109 Microbulbifer sp. ZGT114 ZB100003, whole genome shotgun sequence. 
TAGCTGGTCTGTAAATATGCACGGGCCAGCCGAATCTTCAAAGCATATTACGACGAGGTAATTCGTTATGGCACTGACTGCAAATGAAAAAGCAGCCATCCTCAAAGAGCACGGCCAGTCTGAA
>CP009505.1/1989432-1989301 Methanosarcina sp. MTP4, complete genome. 
CGGTTGCTTGCAAGCGGACCTCGAAGCCTCATTTCACACACACACACGAGAATCACAACGATTACTCTAGATGGATAGGTTCATCCCTTCTTCCTGTCCGTTCCGTTCGCTTGTGAGTACCACCCCATCATA
>CP021112.1/3034288-3034406 Pseudorhodoplanes sinuspersici strain RIPI110, complete genome. 
TTTTATTTCGTGGACGCTTCTCATCGTAGGAAGGCGCATCGCTGGGGGTGGTTGAAACCACCTATGCCGGGCGATGCGCTGTTCAGGGGGCCTCACGGGCCCTTTTTTCTTTTCCCGGA
>AYZV02091783.1/3282-3039 Spinacia oleracea cultivar SynViroflay scaffold22748.con0008.1, whole genome shotgun sequence. 
AGTAGAGTAAGAGAGCTTCCTTCAGCCCACTCATGGATGGAAAAAAGGGGTATTGAATTATCTGCCGACTCATTCATTCAAACACTGAGTAGAACAAACAAGGAATGTACAACACGCATGCGTACAGGGGGTGCAAGTGCAAGTGCAAGTGCAAGTGCTACTGTGATTGCGTGAATGATGCGGGAGATGATTTCATCCTTGTCTCTCCGTGCTTGGACTGAAGGGAGCTCCCTTTCTCTATTCC
>URS0000D6BD70_684738/1-44 Lactococcus lactis subsp. lactis KF147 DUF1646 RNA 
GGTTGGGCGCAAGCTTCAAGACATATCTCCAAGGGTGAGGAGAT
>ASAF01269073.1/1229-1323 Nicotiana sylvestris Nsyl_contig269073, whole genome shotgun sequence. 
CGGAGCCGTATGAGGCGGAAGTCTCACGTATGGTTCTCTAAGAAGGGAGTGACTACCTACAGGAGCTTCGACCAAGCACCACCGGTCAATTCCGC
>JNGA01002875.1/199-1 Arabis alpina cultivar Pajares Aa.chr2_contig_422, whole genome shotgun sequence. 
CGACGGATCGCATGGCCTTTGTGCTGGCGACGCATCATTCAAATTTCTGCCCTATCAACTTTCGATGGTAGGATAGTGGCCTACCATGGTGGTAACGGGTGACGGAGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCTGACACGG
>FP929041.1/559079-558959 Eubacterium cylindroides T2-87 draft genome. 
ATAATGAGACTCCTGTCCAGCCACAGTCCGAGCGTGATATGCCCTGCTTCAGGGTGATGCCGTCGCAGGCAATGGGGGCAGCCGATTTGTAGAGATCCTACCGGGGGTGCAATTCCCGTGG
>CM001383.3/68159736-68159614 Felis catus isolate Cinnamon breed Abyssinian chromosome B3, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATTGTTATAAGTCAAAATTTAGAAGAGTAAATCACATTCAAGCAAAAAGAAGCAAAAATAGATCTTGCTTCATAGATCTACACAAA
>AACT01034500.1/16165-16123 Ciona savignyi cont_34500, whole genome shotgun sequence. 
GACTTCGAATCAGAAGATGAGGGTTCGAGTCCCTCTGTGGTCT
>CP003005.1/936847-936934 Myceliophthora thermophila ATCC 42464 chromosome 4, complete sequence. 
GGCCGTGTGGTGTAGTGGTAGCATACTTGCTTTGGGTCGTGAGATTTCAATCTGCAAGTGGTCCCAGGTTCAAGCCCTGGCTCGGCCC
>MCOG01000628.1/21312-21242 Neocallimastix californiae strain G1 LY90scaffold_628, whole genome shotgun sequence. 
GGAGGGTTGGCGCAATGGTAGCGCGTCCCCTCCAGAGCGGAAGGTTGGGTGTTCGAATCACTCACTCTCCA
>KB319013.1/681-1 Rhizoctonia solani AG-1 IA unplaced genomic scaffold scaffold1318, whole genome shotgun sequence. 
GCAGCTCGAAAGCCGCATTTGCTCGCCACGCACGTGCCGATTTACTCGGCGTCTCGCGAGCGGGCTAAGGTCTGAGCATTCTAGTCCCCTTGTACGTGTGTCTAGCCGGCACCGGCTCCAACAGGGCCGAGCAGAGTATCAGACATGCGCTCGGTGCTGCTTGTTCCGCCCAGAGACCCGCAAGGGGAGGGCACAGCAGCACGTGAGCTTGGAACAACTCTGCGGGGACAGAGCCGTCTACTTGCCTCCCCGTCCCGAGTCTCTTTTTGTCCTCTTTCCCACCCGTGCGCTAGCCTCGAGAACTAGCGCCCAGTTTTTTCAGAGACTGAGCATCATGCATCTGACTCTTCCCTCGCTCCGCAAGGCACGGAGCAGTGTACGGCCTGGGTTGGCTTCTGGGCGCCGATCGAACCTGGGGATCTCACATCGCTACGACTGGCGCGGCAGCGCTGAGCACTGGGACTCCCCATGCCCGGCAAAATGCTCCGCGTACAGGTAACGAGCTCTTGTTTTCCTTTTATTTCCTGGATATTCCTGGAGAGGCCACGCTGGTGGTTCGATTGGTTGCGGTGATCGAGGAGGACGATCGGTCTTGGACGGGGAACGGGCGGCTCTTGAGTTCACTTTGCGGCTCGCAGTCATTCGCTTTGGCGATTGCGAAACTCGATTCAGACTACTCTT
>AFSB01087678.1/359-79 Heterocephalus glaber contig87678, whole genome shotgun sequence. 
GAATGTGAGGGCAATCTGGATGTAACATGTTACCCCATTGATGGCCAGGGTTGATTCAGCTGTATGGCTGGTAGGCAGGTGTCCCCTTCCTCCCTCACTGCTCCAGGCGCGACCCTCCCTAAGCTTCGAGCACAGTTAAAGAGGATGACCACTGTTTCCTTGGTCAAGGGTTTACAAGTAGCTGTGCTCCCCTGCTAGAACCTCCAAACAAGCTCTCAAGATTTAAAAACTAAAAGGAGAATGGGAGTTGGGATATAGCTCAGTGCAAAGGCCCAAGATTT
>MKUQ01000060.1/39144-39044 Burkholderiales bacterium 70-64 SCNpilot_expt_1000_bf_scaffold_93, whole genome shotgun sequence. 
CGATCTGCTCCGGGGTGCGCAGCACGCTGAGACGGGCCCAGGCCTGAACCCGAGAACTTGATCCGGTTAGGACCGGCGAAAGAAGAGCGATCCGTCGCCCC
>CM007893.1/130149511-130149874 Helianthus annuus linkage group 4, whole genome shotgun sequence. 
TGTGTCGTAGACTAAGCGTGCATGACGGATGAGTCGTGCAGGCCGCCTTGAAGTACAATTCCCATCAAGCGATGGGTAGAATCCTTTGCAGACGGGTGACGGGATAGAATCCCCTATCAACTTTCGACGGTAGGATAGTGGCCTACTATGGTGGTGACGGGTGACGGAGATTTAGGGTTCGATTTCGAAGAGGGAGCCTGAGAAACGGCTACCACATCCTAGAAAGGCAGCAGGCGTGCAAATTACCCAATCCTGACACGAGGAGTTAGTGACAATAAATAACAATACCAGGATCAAACGAGTCTGGTAATTGGAATGAGTACAGTCTAAATCCCTTAACAAGGATCCATTGGAATAAACCATA
>AFEY01266293.1/3612-2555 Sarcophilus harrisii ctg7180002245042, whole genome shotgun sequence. 
CCACATTCAGGGCCCCAGGTGGGGCAAGATGGCAGCCGAGGTTACACCCAGAGAGTCTTTAGAAATTCAATAGTAAGATATGATCAATTATCCAAAAGGCAATTGGATGGAAGAAGGAGATTATACAATCAATCAGCCAAAGGGCAATCAGAAGGTAAAAGGGGATTGAAATTAGGAAAAACAGAGTTGTATGCAGTAGAGACTACTGAGATATCATCCCCTGGAGAGGTGAAATCTGTTCCTGTCCAGCTTATAGATCCCTTGCCTCCAGGCACAGTAGGCTTGACCATTTCACCTCCTGAGGGTGCTTACAAAACAGTGGCCATGGACATCGGAATCCTCTAAGGAGTGTCTAACAACTCACCTGCCGAATCAACTAGCCCTGAAAATGGATGGCACTGGAGCATTGGGCCCATACCTGGCCGTCGCTGGCAATGGGCACAAAGCAGGAACAGAAACGTGTTGTTTCCTGAGAACAGATTCCGCACAAGGGAGGAAGGCACGAACTCACTCCTCAGGGGCTAGGCCACGATGAGTAGGAGGGCTGCTGCGGTGGGCCTGGAAGCCTAGGGCATGGGCCCAGGTGGAGCTGCCGCAGGTGTAGATCTTGGTGGTAGTAGCAAATATTCAAACGAGAACTTTGAAGGCTGAGGTGGAGAAGGGTTCCATGTGAACAGCAGTTGAACATGGGTCAGTCAGTCCTGAGAGATAGGCAAGCGCCATTCCAAAGGGACAGGCAATGGTCTCTGTTGCTCTCAGCTGATCGAAAGGGAGTAGCGTTCAGATCCCAGAATCTGGAGTGGCAGAGATGGGCCCTGTGAGGCATCCAGTGCAGTAACGTGCCTGATCCCAGAAAAGCCGGCTGGAGCCCCGGGGGAGAGTTCTCTTTTCTTTGTGAAGGGCAGGGCTGCCCTAGAATGGATTTGCCCTGAGAGTGGGCTTGTGGGCTTCTATATCTCCCAGAGTGCTCCTGGCTCTCAGTCTCCCAGAGTGCTCCTCTCTGACTCTTGTTGATGTTTCGAAGTAACTAACCCAAAGCTAAGAGCCTCTTTATACAT
>LGSR01000020.1/1425329-1425226 Escovopsis weberi scaffold00001, whole genome shotgun sequence. 
GGCAGAGTGGCCGAGTGGTTAAGGCGATGGTCTTGAATCGTGGGTTCCCATGATAAAGCCAACCATTACGTTCGCGTGCGTAGGTTCGAATCCTGCCTCTGTCG
>JENH01053621.1/966-1 Agrilus planipennis Contig53639, whole genome shotgun sequence. 
TTTAGTATAAATACTCTGTAAATATTGAAATAAAATTAGTCTAACACCAGGCTCACTCTTATTCTGATGCTGATAAAGTGTCAACCCTTGGGATCCTCAAAGATGCAGATAATGTATCCAACGGTATTACTAAATCGGTTCTTCTCAGAACCCCAACTTTGATAGTCACATCTCTCATCATATACGACTACAGAGAGTGGCTACAGTTGTATCATTTATTACTATTTATTATTTTAACGATTGACCATCTCAGGCTAGACCTTTTTCATCTAATAGCTTGACTCTGTGATATAAGAGTTGTGATATTTATGTGTGTGCGCCGTCCTAGTTTATTATTTTAGGTGACAGCTAGTAACCGATACCAGTGATGCGAGTCCTGGGTTTCAGTCCTGTGTGACGTGGGCCGACTCAGGGCGGCGAAGCGGTTGCTTAACGGCGTCCCAGACGTCTCCGGCGAATTCCGCTTTCTCAGCCAGAGAACTTCGCTTAACGATTTTTCCAAGGCCCGTATATGCCGATACTCCCTTTGAACAGGTCAAGTTTGACAGGTTTCCTCGGGCCAGGAGTCGTTAGTTCTATTGGGGGCGAGACTTAGATGACTCTACAAGGCATCGCTTTGGTACTCGAGGCGAAGCAGATGAGCCAAAGCTACTCGGCAAGGCTCATCGGAGCCGGGGTGCCGAATTAGGGCTTATGCTTGTCTAAGCCCTGTGGCAATCACGCCAGACCACCGTGGAAAGTGTGAGATCGCGGTCTCATAGAAATAGCCAAAAGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACCAGATTCTCTGTGACCCTACCCACTATCTAGCGAAACCACTGCCAAGGGAACGGGCTTGGAAAAATTAGCGGGGAAAGAAGATCCTGTTGAGCTTGACTCTAGTCTGGCACCGTAAGGAGACATGAGAGGTGTAGCATAAGTGGGAGACGGTA
>AAPU01006125.1/5918-6168 Drosophila mojavensis strain TSC#15081-1352.22 Ctg01_6126, whole genome shotgun sequence. 
GGTCCATCAGGATAAGGATTGGCTCTGAAGATTGAGATAGTCGCGCTTGATTGGGAAACAATAACATGGTTTATGTGCTCTCTAAATAGAGATCTATCATTTTATGGTAGTTTCTAGTTCCCCGGATAGTTTAGTTACGTAGCCAATTGTGGAACTTTCTTGCTAAAATTTTTAAGAATACTAGCCGGGCAACCGATTAGTTCTTTTAAATTATAACGATTATCAATTAACAATCAATTCAGAACTGGCAC
>LBPO01000002.1/47954-48343 Parcubacteria (Magasanikbacteria) bacterium GW2011_GWC2_34_16 UR53_C0002, whole genome shotgun sequence. 
GGTTGTTGGTGGATGATCGCTTTGCCTGTAAAGGCGGGGAGGAAAGTCCGAACACGCCTCTAGCGAAAGCTAGAAAGGATAGCGGGTAACGCCCGCCTGGAGCAATCCACGAGGTGCGAGCAGAGACGTCTAGGCTTGAAAAGGTCTAGAGAGCTAAACCCTGTATTCTTGATTAATCAGGAATAATAGCTTAATCCTGGCCATAGGGAAATAAGGTCAGGGGTGAAACGGCTAAATCCTTATCTGCGTGCAAGAGCAATGTTTCCTGTTGTTTAGACGGGATTCAGAAAGTTAGCTCGCTTTGATTCTAATGGAAACATTAGAACTAGATAAATGATCGTCGCCCAATTTATTGGGATACAAAATTCGGCTTATAGCCAACAATACCCT
>CM000856.1/137442353-137442632 Callithrix jacchus chromosome 1, whole genome shotgun sequence 
GTCAGGTATGATGGCGCATGCCTGCAGTCCCAGCTACTTGGGAGGCTGAGGCAGGAGGAGTACTTGATCCCAGGAGTTCTGGGCTGTAGTGTAGTATAGCACTGCACTAAGTATCTGCACTAAGTTCTGCATCAATCAGGTTGCCTAAGGATGGTTGAACTAACCCAGGTGGAAACTGGAGCAGGTCAAAACTTCAGTGCAGTGCTGATCGGCAGCAGGATCTCACCTGTAAGTAGTCACGGCCCTCCAGCCTGGGCAACATAATGAGATCCCATCTCTA
>CP009129.1/1068541-1068746 Planococcus sp. PAMC 21323, complete genome. 
TTAATGACAGCGAAGAGGACTAGTAGTTTGTGTATTTTCCACAGAGAGCCGGCGTTTGGTGCAAGCCGGTAAAATGCGCAACCGAACTCACCTTGGAGTCAGTGTATGTGAAACTAAGTAAGATACACCGTTTTCCGCGTTAAGGAGTCAAGTTGAGCGAGCAGTCGCTAATTTGGGTGGTACCGCGGGAAAATCCCGTCCCTTAT
>JTDY01000669.1/96851-97292 Operophtera brumata OBRU01_Sc00669, whole genome shotgun sequence. 
GGTCATTATCACCACAATAGATGGCGCTGTTTGCAACTTTATACCAGGCTATACCTATATATATACATATCGACTTTGTTTTATAACTCAAGAAGTGGGCCGACAATTTTACTTTGAACAAATTAGAGTGCTCAAAGCGGGCTCAAAATGCTGCTTGAATATTTCGTGCATGGAATAATAGAATATGATCTCGGTTTTATTTTGTTGGTTTTCAGAACTCCGAGGTAATGATTAATAGGGATAACTGGGGGCATTCGTATTGCGATGTTAGAGGTGAAATTCTTGGATCGTCGCAAGACGAACATCAGCGAAAGGTGTTTTCATCAATCAAGAACGAAAGTTAGAAGTACGAAGGCGATTAGATACCACCCTAGTTCTAACCGTAAATATGTCATCTAGCGATAAAATTGACGCAATTTTGAAAAAAGAAATGAATCTTTAT
>FRBH01000005.1/40291-40383 Chishuiella changwenlii strain DSM 27989 genome assembly, contig: Ga0131172_105 
AAGTAGCGACAGGGATTGACGTGAAAATCCTTTTTACAACTGAGATTCTCTCGAAGTTTAGTAAAAAGATTGTAACAAAAAGCCCGCTCGGTC
>FQWL01000004.1/126785-126917 Spongiibacterium flavum strain DSM 22638 genome assembly, contig: Ga0070522_104 
TGGTTATCGAGAAAGGCGGAGGGACTAGACCCTGTGAAGCCTTAGCAACCCTTAGCACATCCCATCATCTGGGATTCTGAGAAGGTGCTACATTCTACCTAACATCGGTACATGATGATGGGATGGATAACGA
>KQ758491.1/45269-45062 Bacillus enclensis strain SGD-1123 genomic scaffold Scaffold10, whole genome shotgun sequence. 
GGATATTCAATGATGAAGAGAGTAATTCCCGCGTGGATCTAAAAGCGAACCAGGGACGGTGCAAGCCTGGTGTGAAACCCGGAATGAAGCGCACTTCTGAGAAGTCTTTCCCCAAATTTCAGTAGGGAAAGACCGGGTAAAACCGTTAATTTATGAGCGCCCTTTCTGGGAATAAGAGTGGTACCGCGAGTCAAAACTCGTCTCTACA
>AHIQ01000233.1/47283-47180 Brettanomyces bruxellensis AWRI1499 AWRI1499_contig2762_scaffold53, whole genome shotgun sequence. 
AAACCTAAARATGATGATTGAGAATTAACGCATAGTTCAACTGRTATCTATGAAGAAAATATTTCCATCAATATAGTCTTTCACCCCTATCTGATTTTAGGCTT
>URS0000D685E2_12908/1-80 unclassified sequences type-P1 twister ribozyme 
AUGUUAAUGCGACCUAGUUACUGGUAACCGUAAUACCUAGUGCUAGAGGGUGGCAAGUCCCUUUAACGCAGAGUCGACAU
>CM000801.1/33200308-33200628 Oryctolagus cuniculus chromosome 12, whole genome shotgun sequence. 
GTTAGCTCGGGCCGGGAGGAGCCGCCACCGCCGCCGCCGGAGGAGGAGGGGGAGGAGGAAGGAGAGAAGGAAGAGGAGAGGGGGCCGCGGTGACGACTCGGCGCCGGGGAGCCGGGCTCATGGACGGGTGAGGCGGCCGTGTGCGCAGACAGTGCTCCAGCCGCGCGCGCGCCCCAGGCCCTGGCCCGGGCCTCGGCTCCGGGAGCAAGAGGAGCTCGCGGAGGCGCCGAGGAGAGCGGGCCGTCCCGCAGCCCGAGCAGGAGAGGGAGCGCGAGCCGCGCCGGCCCCGGCCGGGCCTCCGAAACCATGAACTTTCTGCTT
>KB456266.1/1688805-1688699 Sphaerulina musiva SO2202 unplaced genomic scaffold SEPMUscaffold_7, whole genome shotgun sequence. 
GCCCGCTTAGCTCAGGGGTAGAGCGCATCACTCGTATACCTGGATGGCTGTAAATCACCTGGTTTGGTGGGATGATGAGGTCATTAGTTCGATTCTGATAGTGGGCT
>CM001381.3/152175418-152175578 Felis catus isolate Cinnamon breed Abyssinian chromosome B1, whole genome shotgun sequence. 
ATCGCTTCTTGGCCTTTTGGCTAAGATCAAGTGTAATATTAAAAGTTAATATTTCTGTAGTGCTTCCATTGCACAAGGTACTATTCTAAGTATTTTACATATATTGACATATTTACATTTCTAAAAACCTTAAAAGGTAGTCACCTTTTAAGGAAAGTATT
>AASG02000564.1/14627-14791 Ricinus communis cultivar Hale ctg_1100012361959, whole genome shotgun sequence. 
GCCTTGGTGGTGAAATGGTAGACACGCGAGACTCAAAATCTCGTGCTAAAGAGCGTGGAGTCCTCGGGTAGTCTCCTCTATAAAGGCATTCCAGCTTCAGAGGTAGGTGAGCCAGGTCAGGAAGGAGTTTGACTGCTGGGATAGGATCGGATCCTATTCGAAGCA
>AZIM01000830.1/116066-116143 Ophiophagus hannah scaffold831.1, whole genome shotgun sequence. 
CGATCTGGCTGCGACATGTGTCACCCCATTGATCGCCAGGGTTGATTTGGCTGATCTGGCTCCATGTACATCCCTCCT
>MUXU01000055.1/10129-9985 Moraxella caviae strain CCUG 355 355T_ctg_0000055, whole genome shotgun sequence. 
ATTTGCTTGACGGAGTGCGGTTTGAGACCGCTGAGATTGCGTCTTTGGTGGGTGCGCCATTGGTGTTCCACATGAAACTTATAACGCAAAATCCGTTGAACCTGAACAGGTTAGTCCCTGCGTAGGAATCAAGCACGTCCGCCAT
>FQTY01000030.1/12262-12128 Tissierella praeacuta DSM 18095 genome assembly, contig: EK13DRAFT_scaffold00030.30 
TGTTAATTAAATAGATTGCCGTAGACAGTAGGTACCTTAAGGTTTAATTTCCTACCGAGGTTGAGATTAATCTAATTTATAAAATTGAAATTAGGATCTCTCTGTGTCTACGGAGGGATCTTTATTTATTCGTCC
>JH835452.1/508250-508573 Erinaceus europaeus unplaced genomic scaffold scaffold00164, whole genome shotgun sequence 
GGATGTGAGGGAGATCTGGCTGCAACATCTGTCACCCCATTGATCAACAGGGTTGATTCCTCTCATCTGCCTGGCTAGGGGGGTGTCCCTTCCTCCTGCACTGGCAGTGTGTCACTAACAAAGCTGCGGGCTCTGTTGAAGAGGACGGCCTTCCCGGAACAGAGACGGCTAGGTCTTCGGTTGAGGGCATATGAGTAGCTGCTCTCCCTTGCTAGAACCTCCAATAAAGCTCTCAAAATGTGTTCAAAATATTTTCGGATTACAAACAGAATTACTCTTCACTAGCAGACACGCAAAGACAATACATTATAGGAATTTCGTTGT
>HE999757.2/3449466-3449336 Carnobacterium maltaromaticum LMA28 complete genome 
TTAGGTTAATAAATATTACCGAAGACAGTAGGTGGCGTAAGCCTTAAAATACCTGCCGAGGATGAATATATGTGAAAGCATACAACTATCCCTCTATGTCTAAGGTGACATGGGGCTTTTTGCTTTGAATC
>KZ114138.1/13605-9139 Helianthus annuus unplaced genomic scaffold HanXRQChr00c0817, whole genome shotgun sequence. 
GCCCAGTCTTTCAGATGGGCTTGGCCCATTTCTGTAAAACGTATTTATACGTAAATGCACGTAACCGGCTGTCATTCTTCAACCCTAGCTCCTTGTGTGTGTGACGGCAGACCCTCACATCCGAAGCCAAATCCCTTTTGTTGATCATCCTTAATCTCGGTTAGTATCTGATATCGTATTACTTTTAATTGATTGCTGGAATGATTGATGTTAATTAGTGTGCTAACCGGCCGGACGTGGCTGTTGATCGGCCGGATACGGTTGATAACTGGCCGGACTTGTAATCATTAACCGATCGGATGTTGTTAACCGGGTATTGCTTATATGATAATCGAATAGTTGTTCGGATTCGTTATATGATGTTTGATTGTTAGTATGTTCATTCAAGATTTCGGTATGTGTTCATATGTTATGTTAATAAGGTTCGATAATGTGACATACTATGTTAATCGGCTTGGTGTACGCATAAATTAGGGATCACGATGGGTATTAGTATTATGATGATTGCATGATGATTTGATGATGATCCTATGATTGCTGCATGATTGTTGTTTGATCGATAATGTTGTTGACGGCTGTTAGCATGTTTAGGGTTTCTGAAATTGTAACTGTTGTTGACGTAACTGATATGTGTCGAAAGATACTTGTAGTCGAAACATAGTTGTCGAAACATAGTTGTAACCGAAAGATATCTGTTGACCGAAGGATAGATTTGACCGAAACATAATTAGGTTGACCGAAAGATGCCATTTGGTCGAAAGATGACTGGTGGTTCGAAACATAACAACCAGTCCGAAAGATAACTGTGAAAACTTGTAAGTGTCGAAAGATTACTGATGTGTCGAAAGTTAACAGTGGATCGAAGGATAGTGGCAATTATAAACATCCTTCGAAGGATGGAATGTATACATGAACTATTTGACATGCCATGCTTGATGATGAATGTTTACATTTGTAATTGTGTGCACTAGCTGATGAGTAACTAGGAAATGGTACGTGTTGCGCCGATGTACAAACTGACTGTTACGTGAACATTATATTGCATGCGAATCATTGTGAACATGAACTGATTTGTTATACATGCATACAATAGGACGTGATTAATTACTTGTGAGTACATAACCTAGCATACCGAGCAAACCAAGGTGAGTTCACACTCTTACTAAGGCATGGGATTCCCGGGTTGTGGGAATGGGTTAAAGGCTTGATGATAAACTAATAACGTACATACACTACGCTTTTCCTAGACTATCACCTATCATAGTCCTCGGATGTCAGGACGGTTCCGTAGGTTGGAAAACACCTACGTGGTTCCGTAGGTTGGGATAACACCTACGTGGTCAGATGCCAATTACTATCCTCGATACAAAGGATACGCACGTAAGACATACGTGTACGCATTACTTACTTCTTCCGTAGGTTGGGATAACACCTACGTGGTCATATGCAAATTACTATCCTCGATACAAAGGATACGCACGTAAGACATACGTGTACGCATTACTTACTTCTTCCGTAGGTTGGGATAACACCTACGTGGTCATAATACGAATAGTCTAGTGGTCACTTAACATGGGAAGCCCCCACCTGTATAACTTACTATTGGCCCGGTAGAGCCACCCGTTACTTACTATTACGCATTTACGTACTGTGAACTCGCTCAACTATTTTGTTGATCCTTTCTTTTACATGCCTTGCAGATCGTTAGGTACTGGGAGCTTGCACTGGAGGCGCGGACGTTGTGGACTTGGATCGTGAACATCATATGGAACCCATATGATACTTGATACACTTTTACATTGGATATTTTTATATATACGCTTCCGCTAAACATTGATAACTGGCTTATGTTTTGGAAACACCTTTCATATGGATTTGTTCTGAATTATACTGCAATTACTTTTACTTTATACAATGTTCTATATGATTGGTGGCTTGGTCCTGGTCAGTCACGCTCCCAAGCGGTGATACTCCGCGTGTGGATTTTGGGGGTGTGACACAACGGGTGAGTAAACCCGCAAGGCGCAAGGAAGCTGATTGGCGGGATCCCCCTCGTGGGGTGCACCGCCGACCGACCTTGATCTTCTGAGAAGGGTTCGAGTGTGAGCATGCCTGTCGGGACCCGAAAGATGGTGAACTATGCCTGAGCGGGGCGAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCGATACTGACGTGCAAATCGTTCGTCTGACTTGGGTATAGGGGCGAAAGACTAATCGAACCGTCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCCCGGGTGCGAGTTCTATCGGGTAAAGCGAATGATTAGAGGCATCGGGGGCGCAACGCCCTCGACCTATTCTCAAACTTTAAATAGGTAGGACGGCGCGGCTGCTTTGTTGAGCCGCGCCACGGAATCGAGAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGGAAGCCGGGTTACGGTGCCAAACTGCGCGCTAACCTAGAACCCACAAAGGGTGTTGGTCGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTTAAGCGCGCGACCTACACCCGGCCGTCGAGGCAAGTGCCAGGCCCCGATGAGTAGGAGGGCGCGGCGGTCGCTGCAAAACCTTGGGCGTGAGCCCGGGCGGAGCGGCCGTCGGTGCGGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGAGACGGGGGAAGCCCGTCAGATAGCGTGTTTCACGCGAGCTTCGAAAGGGAATCGGGTTAAAATTCCTGAACCGGGACGTGGCGGCTGACGGCAACGTTAGGGATTCCGGAGACGTCGGCGGGGGCCTCGGGAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCCTGGAAACGACTCAGTCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCGCACGTCGCGCGGTGTCCGGTGCGCCCCCGGCGGCCCTTGAAAATCCGGAGGACCGAGTGCCTCCCACGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCGATGGAACAATGTAGGCAAGGGAAGTCGGCAAAATGGATCCGTAACCTCGGGAAAAGGATTGGCTCTGAGGGCTGGGCACGGGGGTCCCTGTCCCGAACCCGTCGGCTGTCGGTGGACTGCTCGAGCTGCTTCCGCGGCGAGAGCGGGTCACCGCGTGCCGGCCGGGGGACGGACTGGGAACGGCCTCTTCGGGGGCCTTCCCCGGGCGTCGAACAGCCAACTCAGAACTGGTACGGACAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGTCCCTGCGGATGCTAACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTGTCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGTATAAGTGGGAGCCCTCGGGCGAAAGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCGTGAATCGGAAGCGGGGCAACGCCCCTCTTTTTGGACCCAAGGCCCGCCTCGGCGGGTCGATCCGGGCGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTAGAACAGAAGGGTAAAAGCTCGTTTGATTCTGATTTCCAGTACGAATACGAACCGTGAAAGCGTGGCCTAACGATCCTTTAGACCTTCGGAATTTGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGATAGTGTCGCAATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGCGCTGGATTATGACTGAACGCCTCTAAGTCAGAATCCGGGCTAGAAGCGACGCGTGT
>FR881992.1/3645-4018 Firmicutes bacterium CAG:238 genomic scaffold, scf351 
GGGGATGTAAAGGTTTCGACGGGGGTGTAGAAGCCGGATAAGCGAGCGGTAGTTGGCTCAGACTACCTTAAAAAGGGCCCGTTAAATATAAACGCTAAAAATAACAACAATTTCGCATTAGCAGCATAGTTCTGCAGCGCCTAAGGCGCGACGCGCGTCGGCCACAGCTCACCCGTAGGCTGTGATACCGGCGTCGACTATACGGGAAAACCTGCAGGGAGTTCTCGGTACCTCGCAGGGAACAACGAGATAGCCGACATGGCAGCATGTTAATGGGCGGCCACGGAGGCGAAATTTTAAAACATTGACTGCGCTCGGAGAAAGTCCTGTGGAAATGCTTTCGGACGCGAGTTCGACTCTCGCCATCTCCACCA
>AWUE01008835.1/507-1 Corchorus olitorius cultivar O-4 contig08862, whole genome shotgun sequence. 
CAATAAGCAAAATAAGGGCGCACGGGGGATGCCTGTGGCTCTCAGAGGCGAAGAAGGACGTGATAAGCTGCGATAAGCTTCGGGGACTGGCACACACAGATTGATCCGAAGATTTCCGAATGGGGCAACCCGGTATGTTGAAGACATATCACACCGATAGGTGAGCAAACCCGCTGAACTGAAACATCTAAGTAGGCGGAGGAAGAGAAAACAAAAGTGATTCCGTAAGTAGTGGCGAGCGAAAGCGGATTAGCCCAAACCAGAGTTGTTACGGCAATTTTGGGGTTGTAGGACTGCGAGATTTCATGCAAAGGGAACTGGAATTAACTGGAAAGTTAAGCCATAGAGGGTGATAGCCCCGTATAGGTAACCGATGTAATGGATAGCAGTATCCTGAGTAGGGCGGGGCACGTGAAACCCTGTCTGAATCCGGCGGGACCATCCGCCAAGGCTAAATACTCCTGAGAGACCGATAGTGAACCAGTACCGTGAGGGAAAGGTGAAAAG
>URS0000D6AF63_12908/1-91 unclassified sequences DUF3800-VII RNA 
GGCAGGCAAGCGCTAGGGGTATCCCCGAGTTACCTTCGGGCAGCAGCTGTCGGTGAGACAGTGGTACAGGGGCCTAGGGGTCTGCCGCTCT
>LL014082.1/6803-6907 Trichobilharzia regenti genome assembly, scaffold: TRE_scaffold0014079 
TCCAAGTGCTCTGAATGTCAAAGTGAAGAAATTCAATCAAGCGTGGGTAAACGGCGAGGGTAACTATGACACACCGTCGAAAAATTAGTTCATCCTTCTAATGAA
>BAUT01000003.1/65796-65988 Bacillus wakoensis JCM 9140 DNA, contig:contig_3. 
TTGAATATCGAGCAAATAGGTTTTTAGGAACGTTTCGTTCTAAACTAAGAGGGAAGTTGGTGCAAGTCCAACACGGTCCCGCCACTGTAAACGATGAGGAAGATTAGTATCGTCCACTGTGCGAGTTAGCATGGGAAGGATAATCGACAATGATTCGTAAGTCAGGAGACCTGCCTATTTGTCTTTAAGCTTC
>AF221911.1/108-513 Chelydra serpentina telomerase RNA gene, sequence. 
TGCGGCGGCAGGTGGGGGCTCAGTCTTTCTAACCCTAAGCGAAATGTGACCCCTCCCCGCTGCAGCCGTCCGCTGTTTTACTCGCTGACTTTCAGCGGACGGGGGGAGCGGGTGGAGACGCCAACCAAAAAACGTCAGCGAGGGGCCCTCCCCTCCCACGCCGACCTGGGCCTGTGGTGGGGCCCGCCAGCGAAGTCCCCGCCGCCCCGCCCCGGTGAGGCCGCGGTCAGCCGGCTCGCGCCACTGCTGCCGCGAAGAGTTCGTCTCTGTCAGCCTCGGGGGCGGCCGGGGTGGAAGGGCGGGTCCCGAGCCCGTCGGCCGGGAGAGCAAACGTGAGCGGCAGCCCCTGCGCCACCGCCCTCCCCTAAGCTGTGGGGCCCGCGGTCGGGGCTGCGCTCAGACACGC
>AFSB01201159.1/18941-18806 Heterocephalus glaber contig201159, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAAAGATGTTGATATCTGATTTTAATTTTTAAAAATTCATTTATCTATTTTATTAGTACATGTTTCCAGTACGTAATGATTACATTTATCACAGGGAGTTACT
>AFSB01036238.1/931-791 Heterocephalus glaber contig36238, whole genome shotgun sequence. 
TTAATGGCTTTGAGGCTATCTCATTTTCATTATACCAGAAGCACAACTGATTAGATACAATCAGCAACACCATAGCATTAAGTACATCTTAGAAAATGACAATTTGTAGTAGTTATTAATCTATCACCTTTAACTCTGTGA
>MFMU01000019.1/4604-5929 Candidatus Kaiserbacteria bacterium RIFOXYD1_FULL_47_14 rifoxyd1_full_scaffold_6810, whole genome shotgun sequence. 
CATGAGAGACATAAGAGTACACGGTGGATGCCTTGGCCTAGGACGGCTAAGAAGGACGCGACTAACCTGCGAAAAGCTTCGGGGAGGCGGTTTGTAGCCTTTGATCCGGAGATATCCGAATGGGGAAACCCTCCAATTTTAAATTGGAATCCGCGGGGTAACGCCTGCGTGAAGCGAACCCGGGGAAGTGAAACATCTCAGTACCCGGAGGAAAAGAGAACAATATGAGTTGCGTTCCGTCGGCGCGTATGTTCGTGCTGATGGAACGCAACTCGCGTGATACCCTGAATAGCGGCGAGCGAAAAGGGAAAAGCCCAAACCTCATTTTTCGAAATGGGGGGTTGTAAGATATGAACGGCGTACTTGTACGCGAAGAGTTATCAATCGTCTTTATAGCAGAAGCTGCTGGGNNNNNNNNAGGTGAAAAGAACCCCGAGAGGGGAGTGAAATAGAACTGAAACCGTGTACTTACAAGGGGTCGGAGCGGTGAGTTTATTCGAACCGTGACGGCATGCCTATTGAAGAATGAGCCGGCGAGTGTGTGTATCTTGCGCAGCTAAGCCCTTACGGGGCGGAGCTTTAGGGAAACCGAGTGTGAATAGCGCGTCTGTAGGATACATACGACCCGAAGCCAGATGAGCTTGCCATGAGCAGGGTGAAGTTTGTCGAAAGACAAATGGAGGCCCGAACCCGTAGGTCGTACAACGCCTTGGGATGACTTGTGGTAAGGAGTGAAAAGCTAATCGAATCTGGGAATAGCTGGTTCTCTCCGAAACAGCTTTTGGGCTGGCGTTGCCATATCGCGTGCGTGGGGGTAGAGCACTGGAAGGGACCAACAGGGAGAAATCTCGTGGTTCCTATCAAACTCCGAATACCATGCACTCGGGCAGCAGTTAGAAGGTGGGGGCGAAGCTCCATCGATCGAGAGGGGAAGAGCCCAGATCGCCAATTAAGGCCCCAAAATCGACGCTCAGTACATCACAAGGAAGTGAGGACTCATAGACAGTGAGGATGTTGGCTTAGAAGCAGCCACCATTCAAAGAAAGCGTAACAGCTCACTCATCGAGAGTCCTTGCGCCGAAGATGATCGGGGTTAAGCGTCGTGCCGAAATTGCGGGTTTAATCCGTATTTATATAGATTAAGCGGTAGGAGAGCGTTCTGTTCGCGATGAAGCTTAAGGGGTAACCCATGGTGGAGCGTACAGAAGTGAGAATGCCGGTACAAGTAACCACAATGCGGGTGAGAACCCCGCACATCGAAAGACCAAGGTTTCCTCAGCTATGGTGATCAACTGAGGGTTAGTCGGGCCTAAGGGGATGGCGAGA
>CM008309.1/24191905-24191844 Astyanax mexicanus chromosome 10, whole genome shotgun sequence. 
GATTATGATTGTGCAAGCAACTCTAGTGTATATACACTAGAGTTGCCTGCACAGTCAGAATC
>LODT01000020.1/379504-379185 Dictyostelium lacteum strain TK GAOABQK02G6SYV, whole genome shotgun sequence. 
TTGTGTTACGTGAAGAATTGATCATAGAAGCCAACAAAACGCCTAGTTGCTCTGTCAACTATAAAACAACCAGATTTTCAAATCAAAATGCTTTTGGAAAAGTCCCCAGACCCTAGAACAGAAAGTGTTGCCCGTTAAGGTTATGATCAAGTTTTAGTTCACTCGACAGAGAAGGTATAAGATTCAAGTTTAAGTATTTGTGCTCTCTACCCGAGTCATTGGTGAAATTACTTGGTCACTGGTCACAGTAAAAGTAATATGAAATTAAGAATTTTAAATAAATATTCTCTACAAAATGGGGCTTACTCTCAACGTACACC
>DS562862.1/33829905-33829809 Cavia porcellus supercont2_7 genomic scaffold, whole genome shotgun sequence. 
TGTGAGGGTGCCCTGGCTAGGACTGCTGTCCACCACTGAGCCCCAGGGTTGATTGGGTTGATCTAGTTGGGAGGGTGTCCCCTTCCTCCCTCATCAA
>CM002922.1/12055086-12055241 Cucumis sativus cultivar 9930 chromosome 1, whole genome shotgun sequence. 
GTTTGTATTCTTCCACAGCTTTCTTGAACTGCATCCCTTTCCTGAACTCAATTCGCTCTTAATTTCCCCTTTCTCGATCTCTCTCGATCGATCTCAAAGCGTTTTTTGTTCATCAATTTTGTTGCGGTTCAATAAAGCTGTGGGAAGATACAGTCA
>CAJI01053789.1/175-1 Cucumis melo, WGS project CAJI01000000 data, contig: 53789 
AATTAGCAAGGACCACCTTGCAAGCCTCTGACGGGGCTCCTGACTGACCTATAGTGAAGTAGTACCGTGAGGGAAGGGTGAAAAGAACCCCCATCGGGGAGTGAAATAGAAGATGAAACCATCAGTTTCCAAGTAGTGGGAGGAGACCAGGACTCTGACCGCGTACCTATTGAAG
>AEAQ01060326.1/1-120 Solenopsis invicta Si_gnG.contig39779, whole genome shotgun sequence. 
ATGAAGAACGCAGCTAATTGCGCGTCAACTTGTGAACTGCAGGACACATGAACATCGACATTTTGATCGCACTTTGCGGTCCACGTATACAATTCCCGGACCACGCATGGTTGAGCGTCG
>ADWL01010905.1/30966-31223 Oryza glaberrima chromosome 5 Oglab05_0141_29, whole genome shotgun sequence. 
GTGCCATGCATCTCTCTTATCAAGTTATTTCTGACAGCGGGGAATTCATTGACTGACTTGGCCTTGATTGATGATCCATCAACTCGTGGCTTTGCGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAATGCCGCGTGGAGGTGGAAGGCCCACGGGTCGTCAACTTCTTTTCTCGGAGAAGAAACAATGACGGTATCTGAGGAATAAGCATCGGTAGTCTCGCCCTGCTTCAAAACTACAGGGCGCA
>LN554852.1/2943365-2943181 Moritella viscosa genome assembly, chromosome: 1 
CTCCTAAGTAGAGGTGCGCAATTCATAAGTAGTGTTATTTAGGTAGCTCCAATAATAACAACACAAAAGGGAATTGCGCCGAAGAATGAATTTTAAGCTAAAAAAATTCATTCTGGTGATGTGTTCGAATAGAGACATCACTGTCATAGTCAATTTTATATTAACTATGGGGCGCTACTAAATAG
>KB706892.1/31142-31033 Eutypa lata UCREL1 unplaced genomic scaffold EL1_03_scaffold_1554, whole genome shotgun sequence. 
TGGGAGTGGGACTATGTAACGAACAGCCCTCTTGCCTTTTACCAGATGGCTCCTTGCATAGCCCAAAATACTCCATTCCCTTAATCTTTGGAACCACTTCTCTGGAGCAT
>AEXM01000026.1/37053-36910 Anaerococcus prevotii ACS-065-V-Col13 contig00011, whole genome shotgun sequence. 
AAAAACAAAGAAGCGCCAGATCCCTAGTGGATGACGAGGAAGACAGTTATCGAAAGTTCGGCGGGAGCTGTCTGGGTTCACAGCCCTAGTATTAGACAAAACATTTGAGCAATCAGATGGACAGAGAAGATACAGTGGCCTCAT
>BARX01000002.1/207412-207105 Agarivorans albus MKT 106 DNA, contig: contig00002. 
TAGATTCCGTATAGTTGTTTGTGCACGGAGGCACTGACGTTTATCAGGATGAGAAACGTAGCAGGAGCTAAAAAGGAACAGCTACAGGAAGTAGCAAGGGACACCTCCTAGGAAGGAGACGTGCAACTGGTATGGATGACCGGTTATGCCATAGAAGGCTAAAGGACAGCTCAAAGGATTTGAGAAAAGGATAACTACAGGACGTAGTAACACAGTCAAAAAGGATTGCAGGGAGCAACTACCCGTTCACGGATTTGAGCGATATGACTACTAGGGGCGACACGAAAGTGTCGCCCCGACCTTTTTCT
>FR853096.2/50293108-50292759 Gorilla gorilla gorilla genomic chromosome, chr3, whole genome shotgun sequence 
GCTGGGTGTGGTGGCACGTGCCTGTAGTCCCAGCTACTCGGGAGGCAGAGGCAGGAGAATTGTTTGAACCCGGGAGGCGGAGGTTGCAGTGAGCCAAGATTGTGCCACTGCACTCCAGCCTGGCGAGAGAATGAGACTCCGTCTCAAAAAAAAAAAGAAAAAAAATGTAGGGAAGTTTATGATTTGTAAATCAAACCAGGATGCTTGAAGATGAACCTTGTGGGTTTTTTTGTTTTTGTTTTTTTTTAAGAGACGGAGTCTCGCTCTGTCACCTAGGCTGGAGTGCAGTGGCACGATCTCGGCTCACTGCAACCTCCGCCTCCCAGGTTCATGCAATTCTCCTGCCCCTC
>MFUA01000016.1/12713-12896 Candidatus Nomurabacteria bacterium RIFCSPHIGHO2_02_FULL_37_13 rifcsphigho2_02_scaffold_5465, whole genome shotgun sequence. 
ATAAGTATATACTAAAAGGGTTCATTAAAAAATCATGAAAAGTGATTGGGGAAACTGGTGACCTACCCGAAATGTTGCGCATAATGTTGCAGGCGGGGATTCCAGTACAGTGCCGCTACGGTAAGCCCACGACGTAAAAAATCGGGGACAAGTCCGAATACCAATCATTTTGTGTGTTTCCCGA
>CP001700.1/9933843-9933644 Catenulispora acidiphila DSM 44928, complete genome. 
GTCGGGGCACCGCCGAATCCGTGTACGTCGCGGAGCCGGGGAACCAGGTTCGTCGGCGCGGCCCGCGCGGTAAGCGAGGGTGGCGCCAGTGGGGTGAATCGGTCGGCGTGCACTCGCCGTCGTGTGTGCGCGTGCGACCGTAGGGCTACTTCTTCAGTCCGAATCCGTCAGCTAACCCGGTAGGCGGACAAGGAGGAGAT
>JH930370.1/159056-159130 Tolypothrix sp. PCC 7601 strain UTEX B 481 genomic scaffold FDUTEX481_Contig13, whole genome shotgun sequence. 
GTCCAGGTCGCCAAGTGTTTAAGGCATCGGCTTGCAACACCGACTGCTTCGTGGGTTGAAATCCCACCCTGGACT
>FCNR01000023.1/21709-21816 Eubacteriaceae bacterium CHKCI004 isolate CHKC4 genome assembly, contig: {contig23} 
CAGCATTACTCTGGAGAGTCTTCACCGGCTTCGGCATACGGTGAAGCGCCGAAGGTGTACGGCAGATAGTTCTGCCAATCTCTCAGGCAAAAGGACAGAACACGTAAA
>KB016992.1/120673-120603 Camelus ferus unplaced genomic scaffold scaffold726, whole genome shotgun sequence. 
TGGAGCAATGATGACTGCTGTGACATATGGGACCTACAGGATTAATCCCTGTCCGGAACGCTGAGGTCCAG
>CM001006.2/22879507-22879377 Mus musculus chromosome 13, GRC primary reference assembly. 
TCTGCCCCTAGAGGCATTGTGGATGTGGCTCTTGTTCACCAGTAGGTGGCAGAGAGGAGAAAGGCTGTCTAAGCTCAGTGTTCTGACCTATGACATCTTTAACATTTCCTGAAAGAAACAAGCCTGACACC
>CP002734.1/2242961-2242819 Pseudopropionibacterium propionicum F0230a chromosome, complete genome. 
GGCCCGCCCCACCGGGCTGGCGGCATTCAACGATGCACAGGGGAACCCGGTCGGATTCCGGGACTGACGCGCAACGGTGGGTGGACGCCTCCGAGGAGACATGCCACGAGTCCGAGCACCTTGCCAGCCCCCGTAAAGAGCCT
>KE695978.1/687932-687680 Alligator sinensis unplaced genomic scaffold scaffold505_1, whole genome shotgun sequence 
TCAGCATCTCAGCCTTTTGGCAAAGAACAAGCAGTTTTGGCACCAAGGAGAGGGTTTCAGGGCTGGCTCTGGCCTTCCCAGTGCTGACCTGATATTGCAGTACCTCCAGGCCTGGTGCTAGTTCCCTGTGGAAGGAGGTGGGGGAAAGGTTCCCATCAGCATTTTTGGCATCAGCGGAGGGTGTTGAAGCTTGCTCCAGCTTCTCCACGTGCTGGCCTGGTATTGCAGTACCTCTAGGCCTGGTGCTTATTCC
>LL012517.1/9492-9054 Trichobilharzia regenti genome assembly, scaffold: TRE_scaffold0012516 
CTGGTTGATCCTACCAGTAGTCATATGCTAGTCTCAGAGATTAAGCCATGCATGTCTAAGTACATACCTTAAAACATGAAACCGCGAATGGCTCATTAAATCAGCTATGGTTCCTTAGATCATATATACTACATAGATAACTGTAGTAATTCTAGAGCTGTTACATGCAATTATGCCCTGACCCGCAAGGGAACAGGTGCATTTATTAGAACAGAACCAACCAGGGGCAGTTTCGGCTGTCTCAGTCGGCCTTGTGTCGGTTACGGATCTTTCAAATGTCTGTCCTATCAATTTGTTGGTAGGTGATCTGCCTACCATTACAATAACGGGTAACGGCGAATCAGGGTCAGACTCCGGAGAGAAGACGGCAGCAGGCGCGAAAAATACCCACTGCCAGCACGGGGAGGTAGTGAAGAAAAAATATTGTAAAGTGTAGTCG
>NNAY01029724.1/129-174 Trichomalopsis sarcophagae strain Alberta scaffold29957, whole genome shotgun sequence. 
CCATCGGCCCTTTTCAGGGCCACAAAAACATCCATACGTATCGCAT
>CM002290.1/17870538-17870716 Phaseolus vulgaris cultivar G19833 chromosome 3, whole genome shotgun sequence. 
TGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGGATAAGTGGGAGCTGGAAACAACGAAAGTGAAATACCACTACTTTTAACTTTATTTTACTTGTACCGTCCCGTATCCGGGCGTTGACAAAGTCAAGGTCAAAGTCAACGTCGGGGTCAAAGTCAACATA
>MKTJ01000058.1/456830-456745 Chloroflexi bacterium 54-19 SCNpilot_cont_500_bf_scaffold_42, whole genome shotgun sequence. 
GGGCCGGTGTCAGAGCGGTTAATGTGCCTGTGTGCTAAACAGGTGTGGCCGAAAGGCCACCGGGGGTTCGAATCCCTCCCGGTCCG
>JH815307.1/89016-89141 Simonsiella muelleri ATCC 29453 genomic scaffold supercont1.8, whole genome shotgun sequence. 
AAACAGCATTCAGAGTTGGATTTTCCATGCCAACCTGCCAACATTCAATCATGCTGGTAAGGTGGATAACGGTTTTAAGATCGTTGATGTGGTCTATTTTTAAAATAGGCAATCATGACGAAACTC
>HG917868.1/2308269-2308036 Clostridium bornimense replicon M2/40_rep1, complete genome, type strain M2/40T 
TAATAAGCTATGAAAAAGAAAGTAGATTTAAGGAATAAAGTAGGGAGAAAAAGCCAAAGACTGAAAGCTTTTTTATTAGGAATTAAATCGAAGTTCACTTTGGAGCTCTCTAGGGGAAGTTATAGTAGTCTAGAGCGGTATTATAAAAGCCGATATTTTTTAATGAAGTGGATAAGGGTATGGATTATGCTCTTATCAACTAGGGTGGTAACGCGGATATACTCCGTCCCTTTT
>MNDT01000042.1/12913-12775 Archaeon 13_2_20CM_2_53_6 13_2_20cm_2_scaffold_3200, whole genome shotgun sequence. 
GGGGCCGTCGTCTAGCTTGGTCAAGGGATTAGCCCCGCCCAGAGGATACCAGAGTCCGATTATGGACGGTGACCCTGGGGCGCTGGCGACCTCGAGAAATCGAGGCCAGAGGTCGTGGGTTCAAATCCCACCGGCCCCA
>JH210461.1/2478657-2478034 Pelodiscus sinensis unplaced genomic scaffold scaffold75, whole genome shotgun sequence. 
ACCACTGAATTTAAGTATATTACTTGGTGGAGGAAAATAAACTAACCAGAATTCCCTCAGTAACGGTGAGTGAACAGGAAAGAGCCCAGCGCTGAATCCCCATCCCGCAGTGGGGTATGAGAAATGTGGTGTACAGAAGGCCCACTCTCCCCAGTGCCACTCTCAGGGGCCCAGGTCCTTCTGATAGAGGCACACCCTGTGGACAGTGTGAGTCCGGTAGCAGCCCCTGGCTTACTGGGACCAGGTCTTCTCGGAGTCAGGTTGCTTGGGAATGCAGCCCAAAGAGGGTGATAAACTCCATCTAAGGCTAAATACTGACATGAGACCAATAGTCAACAAGTACCATAAGGGAAAGTTGAAAAGAACTTTGAAGAGAGAGTTCAAGAGGGTGTGAAACCATTAAGGACATATAGGTGATCTAAATCTTTAATGCTTGAATTGGGTTGAATAAATGAATGGTACATTGACTAATACATAATAAAGGCATAGGAAAATGCATATTCATGCACTGAGAGTGAGACAGTCTTGTCACTTTTTATTTTCAAGATGGGAAATGCTATTCCCCTCCCTCAATTACTGGACTAATTCATACTTTTAATTAGTTTAACAATTTTTCAAAGAACT
>JHTR01000147.1/10830-11400 Villosiclava virens strain UV-8b Sca_147, whole genome shotgun sequence. 
AAAAGCTCTTAAGGTAGCCAAGGGTAAGTCACGTGGGTATCTAGAGGTCACGTGACATTGGGCAAGTCACGTGGGATTACAGAAGGAAGACATAGGCCCACTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGGAATGGGCTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTTTGACATTGTGAAAAGACATAGGAGGTGTAGAATAGGTGGGAGCTTCGGCGCCGGTGAAATACCACTACTCCTATTGTTTTTTTACTTATTCAATGAAGCGGGGCTGGATTTTCGTCCAACTTCTGGTATTGATTAATAGGGACAGTCGGGGGCATCAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAGGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGACGATGTTATTTTTTGACTCGTTCGGCACCTTACGAGAAATCAAAGTGCTTGGGCT
>MEPC01000031.1/22924-22691 Bacteroidetes bacterium RIFCSPLOWO2_12_FULL_37_12 rifcsplowo2_12_scaffold_5312, whole genome shotgun sequence. 
CCTTTGCAGGCAATCAAAGGTGACATCCTATTTCTTTTCCAAGAAATTATTTGTCATAATAGGGAACCGGGTGAGAATCCCGGATAGTACCCGCTGCTGTAAACTCTAAAAAGTTTTATGCTTACGCTGGATGCTCAATCCGGTAGCCACTGTTAATCCTTTAATTTAAAGATAACGGGAAGGTGCAGAAAACGAGAGTAAGTCAGAAGACCTGCCTTTGAATTTATTTTTATT
>JXRR01000017.1/5494-5709 Jeotgalibacillus campisalis strain SF-57 contig00017, whole genome shotgun sequence. 
CCTAATGCAATGATAAGGACCAGTAGATAATGCTGATACGAAAGAGATCGGAGTTCAGCGGCTGAAAGACTCCGACGTGCCTCACATTATTGAACCTGCCTTTGAGCGACAGGAAAACCTGTCCGTTCTCCCTCGTTACGGGTGAAGAAGAGTGCCGGATTATTCATGTTCGGCAAATTAAGGTGGTACCACGGAAGCAGCCCTTTCGTCCTTTTA
>DS544962.1/17936-20730 Physcomitrella patens subsp. patens PHYPAscaffold_73 genomic scaffold, whole genome shotgun sequence. 
ATTTAGGATTTAGGATTTGTTTAGGATTTAGGATTTAAGATCTACTTAAGGTTTAGAATTTAGGATTTTTTTAGGATTTAGAATTTAGGATTTGGCCTAAGATTAGATTAAAGTCTATTAAGGTTTTAACCAAGATTAAATTAAGACTTGGTTAAGATTTATTTAAGATATATTTTTTATTATTCTAATAATTTTTTAGGATTTCTTAGGGATTCTTTTAAGGTTTATTGTAGATTTCTTTTGATTGCTTTTAAGATTTCTTATTCTTTCTTTTATGTTTTCTTTAAGATTTCTTTTGAATTTGATTAAAGCTTATTTAACATTGTTAAGATTTAATTAGAATTTATTTAATATTCTATTAGAGTTAAGATTTTGTTATTGTAATTTCTATTCTACTTTCTACAACTATGAGCCTAGTACATTCTTTAGCAAGACTTTATGTAATATAACAATGTTTTCAAAAATCTTCATACAAATTGAATTTTCTTATCTAATATAATATCTTTAGATGGTGAACTATGCCTGAGCAGGACGAAGCTAGAGGAAACTCTAGTAGAGGCTCGTAGCGATACTGACGTGCAAATCGTTCGTCAGACTTGGGTATAGAGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGTTAGAGCTCGTATAAGAGTTTTATCAGATAAAGCGAATGATTAGAGGCATCGGGGGTGTAACACCCTCGACCTATTCTCAAACTTTAAATAGGTAAGCCGACGGGGTTGCTTGGTTGAACCCCGGCACAGAATGAGAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGAAAGCCAGGTTACGGTGCCAAATTGCGCGCTAACCTAGATCCCACAAAGGGTGTTGATTGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGTCCCGAAAATGGATGGCGCTTAAGCACGCAACCTACACCCGGCCATTGGGGCGAGTGTGAGGCTTCAATGAGTAGGAGGGCATGGGGGTCATGGAGCAGCTTTGGATGTGAGCCCGAGTGAAATGGCCCCTAGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGACTGAAGTGGAGAAAGGTTCTATGTGAACAGCAATTGGACATGGGTTAGTCGATCCTAAGAGATGGGACAATCCTGTGTCAATGGCGCAATGTGCGTCGTGCATCGAAAGAGAATCGGGTCAATATTCCTGAATCGGGACATGGCAGTGGACGGTGACGTGGCTGAATCCTGAGACGCCGACGGGGGCCCCTGGAAGAGTTCTCTTTTCTTTTTAACAGCCCGCCCACCCTGGAATCGGATTACCCGGAGATAGGGTCCAGCGGCTGGTAAAGCACCGCACGTCTTGCGGTGTCAGGTACATCCTCGGCGGCCCTTAAAAATCAGGAGGAGCGATTATTGATCATGCTCGGTCGTACTCATAACCGCATCAAGTCTCCAAGGTGAACAGCCTCTAGTCGATAGAACAATGTAGGTAAGGGAAGTCGGCAAAACAGATCCATAACTTCGGGAAAAGGATTGGCTCTGAGGGTTGGGCCTAGGGGTCTGTGCCTTGACCCCGTAGGCTGTCGGAGGTCTGCCCGAGCTGCTCTCGCCGCGATGGCGGACCCCTGCGTGCCGATCAGGCGACGGATACAGAATGAGGTCTAGAGGGTGGGTGACTGCCCCCCTGCCTCGCTTTTCCCTAGGCAGTGAACAACCGACTCAGAACTGGTACGGACAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGTTCCCACGGATGTTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACGAAGTGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTATCTACTATCTAACGAAACCACAGCCAAGGGAACGAGCTTGGAAAAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTAAGAGGTGTAGAATAAGTGGGAGCCCTCAAAGCGTAAGTGAAATACCACTACTTTTAACGTTATTTTACTTATTCCAAGAGGTGGAGGCGGGACTCTGTCCCTGCTTCTAGTCTTAAGGCGCGCCCCTCGGGTGCGCCGATCCAGGTGGAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAATGCAGGTATCCTAAGATGAATCAACGAGGACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGTTCATTTGATTTTGATTTTCAGTACGAATACAAACTGTGAAAGCATGGCCTATCGATCCTTTAGTCTTTCGAAATTTGAAGCTCATGAATATCTATAATAGTTATAAATCTATTTTTACTTCCATTAAAAGTAGCATTTACAATCTTTCCTTCTATAGACAACTCAAACAACTTCAAAAATTTAAATTAAAAGAAGATAATCTACAACCTTTAATATCAAATGAAAATTTCTACAAAGAGAGATAATCTATTTTTTTAAGAAAAAAAATAGTGTTAAAAAAACTACACTATTTATTTAAAGGTGAGTAGTCTACAACCTTCAAAATATAATAATAGAAGTAGAATAATCCACTCACTTCTAAAACAAG
>LOEY01000035.1/5228-5158 Lutibacter sp. BRH_c52 BRHa_1002952, whole genome shotgun sequence. 
TATCTTTGCCAACTGCAAACCAAAAGGTTTAGCAATACATAAAAATTATTAATAAAATTAATGTTAGCATG
>MEEQ01000424.1/3292-3474 Bacterium SCN 62-11 ABS71_C0424, whole genome shotgun sequence. 
GGTCGCCTGCAGAGTAGGTGTTGGAGCTTACAATCCTGGGCCAATGTAACAACCTCGGATGTGATGAGCTATCCCTGTGTCGAGTGCCGCGGTGCGGAGTCCTGACGGGGTAGCCCAAGGTCGCGTCCACCTGCTTTGAGCAGGTCCAGGGGTTCAAGCTCGCCACCGCTCAGGTGGGTCCCT
>CM003505.1/6777488-6777685 Vigna radiata var. radiata cultivar VC1973A chromosome 2, whole genome shotgun sequence 
TCCAATATGCTGCCTTTGCCTGCATTTGCACCTGCACTTTACTTGCTTTTCTCTCTTCAACTATCTACCTGAATTAGTCCCTACAAAACACACATTTTCATGGAAAAAAACACAAGATTACGTTGTGTATGTGTGTGGGAATGGATGAGAAACCAAGCACGAGGTGCAGGTGCATCTGCAGGCGAATGACATCTTGGA
>KQ435782.1/726561-726383 Melipona quadrifasciata isolate 0111107301 unplaced genomic scaffold scaffold99, whole genome shotgun sequence. 
ATTGCTTGACGAGAATAAAAGTTATCTGTTCTTATCAGCTTAATATCTGATATATGTACTTCCCATAGAAAAGTCAGAATATTAACCTAATTTTTAAAAACCGGTGGAATTGGCCAGGCTCGCTCTTCTTCTGTCATAGATTGGCCCAGTATTGCAGTGCCATTGCCAAGCTGTGTTTT
>ADNT01000040.1/13066-12970 Aerococcus viridans ATCC 11563 = CCUG 4311 strain ATCC 11563 contig00050, whole genome shotgun sequence. 
ATAAAAAGAGGGAATGAGGTTCTCCCTGGTCAAGTAGATGGTGATTTTAGGCCATCCCATACCGAACCGCTGAAAAGCTGATGACTTCTGCAAGTAA
>LK941638.1/22456-22528 Angiostrongylus costaricensis strain Costa Rica genome assembly, scaffold: ACOC_scaffold0001535 
GCCTCATTGTCTCAGAGAGTAGAGGGTCAGCCTTTTGAACAGGAGGTCTCTGGTTCGATTCCAGCAAGAGGCA
>NBLS01000022.1/6421-6598 Desulfobacteraceae bacterium 4572_19 ex4572_19_scaffold_9363, whole genome shotgun sequence. 
ATCATTATATTATCATTCAGCAAACGGAACACGGTGTAAATCCGTGGCATATCCCGATGCTGTAACCCTTTTTGTTTTCTTTGGCATTTTTTAGTCACTGTTGTAATGTTTTTTTACAATGGGAAGGCTGTCTAAAGATGGGGAAGCCAGAAGACGTGCTGAATGATTAAAACAAGTT
>CAGS01000178.1/3560-3832 Nitrolancea hollandica Lb, WGS project CAGS01000000 data, contig: 00259-1568 
GCAACGGCTATGACGGAAACGAGTACGCGGAACACCACGTTTAGCGAGTCCGGGGCCGGTGGAAGCCGGATAATGTCGGGTTTCGCGGAAAATCCTTCCCGAGCCGCCACCTGAACCGTCTGATTTGGACGTAGTAAGCATGGCCGGGGTCGTCGCCCGTTATCGCGACGGAGATGCCGGAGCATCCTTCATCACATCGCGCGGCATCTCGGAAAGTGGGTTCCGTTTACCGGACCAACTGAGGTGGTACCGCGGGTTATCCCCGTCCTCAAC
>AADN04003456.1/8626-12973 Gallus gallus breed Red Jungle fowl, inbred line UCD001 Contig3860.1, whole genome shotgun sequence. [11-NOV-2016] 
ggacctcaggtcagacgtgcgacccgctgaatttaagcatatagtcagcgggaaaagaaactaacgaggattccctcagtaacggcgagtaagagggaagagccccagcgccgaatccccgcccccgccgtggggccgcgggaggtgtggcgtaccggaagccccccatccgccgcgcccgctctcggggggcccaagtccttctgatcgaggcccagcccgcgacggtgtgaggccggtagcgccccccggcgcgccgggcccggggcttctcggagtcgggtgcttgggaatgcagcccaaagcgggtggtaaactccatctaaggctaaatacccggcacgagaccgatagccaacaagtaccgtaagggaaagttgaaaagaactgtgaagagagagttcaaagagggcgtgaaaccgttaagaggtaaacgggtggggtccgcgcagtcgcccggaggattcaacccggcgggccaagtcggccggcgcgggcgccgtcgatccccgcctccgcctccccctccgtccctccccttcgccgggcggggcgggcccaggggggcgggcgggccggggaccgccgcccgccgcgtccggccccgtcggcgcattcctccgcggcggtgcgccgcgaccggctccgggacggctgggaaggctgccggcgggcaggtgcccggcgccggcgcgagcggccgccgggtgttaagccgccgggcccggatcgtcgccgaatcccgggccgaggagaggaccgccgccgcccctcccccgagggcggccccccggagggccccccgcgccgaccgcgtcgggccggccgcgccgcgcgcgcgtccgcgccgccgccgtacgccgccgccgctctctctccgttccccgccccgggtccgtccgggcgcggggcgggggggtcgggtgccggcgcggctcggcgcggcgccgcgcgtgtggcgcgcggcctccagcccggcgcgggcgaggccgcgggggcgccgggggggaaccttcccccttctgtcgggccgcctccgttcccgcggggcggcccgttcgggggacgggcccgccgccccgcgcgctgtccgaccaggggcggactgcgctcagtgcgcccgaccgcgcggcgccgccggccgggccggccacgccagcgcccgggtccgcggcgacgtcgctaccccccgacccgtctgaacacgaccaaggatccagcacgcgccgcgagtcgcggctcgcgcgaaagcccgcgcgcaatgagggagggccgcgcgcgccgctgagtgggatcccgggcggcaggccggaaggcccggcgcaccaccggcccgtctcgcccgcctcgccggggaggtggagcatgagcgcgcgtgctagacccgaaagatggtgaactatgcctggcagggcgaagccagaggaaactctggtggaggtccgtagcggtcctgacggcaaatcgtcgtccgacccgggtataggcgaaagactaatcgaaccatctatactggttccctccgaagtttccctcaggatagctggcgctcgggcggcggtgcagtttacccgtaaagcgaatgattagaggtcttggggccgaaacgatctcaacctattctcaaacttcatgggtaagacgcccgctcgctgcgtggagccggccgtgaatgcgagcgctcagtgggccacttttggtaagcagaactggcgctgcggatgaaccgaacgccgggttaaggcgcccgatgccgacgctcatcagagcccagaaaaggtgttggttgatctagacagcaggacggtggccatggaagtcggaacccgctaaggagtgtgtaacaactcacctgccgaatcaactagccctgaaaatggatggcgctggagcgtcgggcccatacccggccgtcgccggcggtgcggagccgcggggctaccgccgcgacgagtaggagggccgctgcggtgcgcctggaagcctggggcgcggccgggtggaggccgccgcaggtgcagatcttggtggtagtagcaactattcaaacgagagctttgaaggccgaagtggagcagggttccatgtgaacagcagttgaacatgggtcagtcgtcctaagcgataggcgagcgccgttccgaagggacgggcgatggcctccgttgccctcagccgatcgaaagggagtcgggttcagatccccgaatccggagcggcggagacgggcgccgcgaggcgcccagtgcggtaacgcaagcgatcccggagaagccggcggggagccccgggagagttctcttttctttgtgaagggccgggcgccctggaacgggttcgccccgagagagggggcccgcgccttggaaagcgtcgcggttccggcggcggtccggtgagctctcgctggcccgtgaaaatccgggggaggagggtgtaaatctcgcgccgggccgtacccatatccgcagcaggtctccaaggtgaacagcctcttggcatgttggaccaatgtaggtaagggaagtcggcaagccggatccgtaacttcgggataaggattggctctaagggctgggtcggtcgggctggggcgcgaagcggggctggcgcgcgccgcggctggacgaggcgccgcccgcccccgccccccctttccccgctcccgctcgccggggcgccgggggggggtcagcgggcggcgcggcggcggcgactctggacgcgccgccgggcccttcccgtggatcgccccagctgcggcgggcgccgctcgcccccctccttgcccctccgcccccccgctcccggcgcccctcccgtcggccgtcgtcccggccgccccccgtcccgagcgccctcctccgcgaggggcgcgaggggcggcggcggcggccgcgggcgcggcggcggcgggggggggggccgccggcggcgccgggcggggcggtcccgggcggggggggtctccgggccggcgccccgctcggccggcgcctagcagccggcttagaactggtgcggaccaggggaatccgactgtttaattaaaacaaagcatcgcgaaggcccgcggcggtgtgacgcgatgtgattctgcccagtgctctgaatgtcaaagtgaagaaattcaatgaagccgggtaaacggcggagtaactatgactctcttaaggtagccaaatgcctcgtcatctaattagtgacgcgcatgaaggatgaacgagattcccactgtccctacctactctccagcgaaaccacagccaaggaacgggcttggcggaatcagcgggaaaagaagaccctgttgagcttgacctagtctggcgctgtgaagagacatgagaggtgttagaataagtgggagccccgcggtcgcgcgacccgcgccgcggcccggccgccggtgaaataccactactctgatcgttttttcacttacccggtgaggcggggggcgaccccgagggctctcgcttctggcgccaagcgcccggcgcgccggcgcgacccgctcccgggacagcgtcagtggggagtttgactggcggtacacctgtcaaagcgtaacgcaggtgtcctaaggcgagctcagggaggccagaaacctcccgtggacagaagggcaaaagctcgcttgatcttgattttcagtacgaatacagaccgtgaaagcggggcctcacgatccttctgactttttgggttttaagcaggaggtgtcagaaaagttaccacaggataactggcttgtggcggccaagcgtcatagcgacgtcgctttttgatccttcgatgtcggctcttcctatcattgtgaagcagaattcaccaagcgttggattgttcaccccactaataggaacgtgagctgggtttagaccgtcgtgagacaggttattttaccctactgatgatgtgttgttgcgctagtaatcctgctcagtacgagaggaaccgcagttcagacatttggtgtatgtgcttggctgaggagccactggagcgaggctaccatctgtgggattatactgaacgcctctaagtcagaatcccccctaaacgtagcgataccgcagcgccgaggcgcctcggtgggcctcgcgatagccggccgccgcccccctcggcgggcggtcggtgcggagcgccgctcgtggtcgggacccggagcgcggacagatgtggcgccgcctctcccccgccgcgtaccgccatgttcgtggggaaccccggtgctaaatcattccgtagacgacctgattctgggtcggggtttcgtacgtagcagagcagctccctcgctgcgatctattgagagtcagccctcgacacaaagctttgt
>KE695965.1/2672926-2673057 Alligator sinensis unplaced genomic scaffold scaffold337_1, whole genome shotgun sequence 
GCATCTAAATCTTTCCTGTTCCTTGCAATACAGTGCAGGATTGGGGACACATGGTGCTACAGCAAAGCAGAGTGAATCCAGACAGGTTTCTTCACTTATACTGGGACTTGTCTCTACAACTCTGCAACATTT
>LNAL01000007.1/177069-176668 Cytophagales bacterium MC1A Contig_23, whole genome shotgun sequence. 
GTGATGCGCCGCCCCACCGCTGCGCCCGCAAGGGCGGAGAGGAAAGTCCGGGCAACGCAGAGCACCCTGCTTCCTAACGGGAAGGACGACGGCGGGAGACGGCCGCCGGACAGCCAGTGCCACAGAAAACTACCGCCTAAGCTGCCCTCGGGCAGCCGGTAAGGGTGAAAAGGTGCGGTAAGAGCGCACCAGCGGGCGGGCAACCGTTCCGGCTGGGTAAACCTCAGGGGTTGAAAGGCCAAATAGGCCGGCAGGCGGGGCTTCGGCCCTGCAACGGGCGGCTCGTTCGTTGTCGGCGGGTAGGCTGATGGAGCCCACGCGCGAGTGTGGGCCTAGATAAATGGTGGGGCCGCTGCCCTTCGGGGTGGCGGACAGAACCCGGCTTACAGGCGCATCACCAAA
>ACPB03012429.1/2213-2327 Rhodnius prolixus Rhodnius_prolixus-3.0.3-164.10, whole genome shotgun sequence. 
ACTAACTTTAGAACTGTATTTACTATCTTTGTGGGAACGATACAGAGAAGATTAGCAAGGCCCCTGAGCAAGGATGACACCGGCAGACGGAACTCCCATGCCGCAGAATGTTTTT
>GK000028.2/19825245-19825332 TPA: Bos taurus chromosome 28, whole genome shotgun sequence. 
GAGTTGGACACGGCTGAGCAACTTTCACTTAAATTACTCTAAAAGAAATGAATCCTAGATGGTTTTCCATCCAAGTCAAGTGTCTTGT
>JJRV01059395.1/8054-8163 Calypte anna contig59395, whole genome shotgun sequence. 
AGTATTGATTTCTTAAAACAAAAAGCAGTGCTGCAGTAATTTCAGCAGCTGGCATTGTTGGTTTTCATGCAGATGTGCTGGTTAAACTTGGTATCGCTGCTGAAACAATT
>MGZC01000016.1/20791-20922 Gemmatimonadetes bacterium GWC2_71_10 gwc2_scaffold_12486, whole genome shotgun sequence. 
GGAAGCCGGTGGAACTCCGGCACGGCCCCGCCACTGTAACGGGTTGGGAGCAGTTGCTCCCCACGGCGCCTCACATGCCACTGGCCTCAGGCCGGGAAGGCGAGGCGGCCGCGACACCCGAAGTCAGGAGAC
>KB915673.1/27675-28419 Neofusicoccum parvum UCRNP2 chromosome Unknown NP2_03_scaffold_35, whole genome shotgun sequence. 
GGAGCCTGCGGCTTAATTTGGCTCAGCACGGGAAGATTCACCAGGCCAAGACACAGTAAGGACTGACAGATTGAGAGCTCTTTCCTGATTTTGAGGAAGGTGGAGCATGGCCGTTCTTAGTTGGCAGAGTGATCTGTCTGCTTAATTGCGACAACGAACGAGATCTTGACCTGCCAGGCCCGTTTTGGCGGATCGTCGGCTTCTTAGAGGGATGATCGGCTCAATCTCATGGAAGTTTGAGGCGATAACAACTTAACCATTACACGCATGTGATAACGGGGCCCCGACTTACTTTCGTGGGATTTTCCGCCAGTCGATCGTCCGTGACCGTTGGGCAAGCGCCCTAGTATCCAGCAGTCGGGCTGCTGAAGGGCAGCCTAGGATACAGCAAGACAGCCTGGTTTTGGGACTCCAGTTCAGGCTGATCAATCCCGAGGCAAGTTACTATAGCGAGCACCCGTTATAATGCTAAATCCTTATTAATAGAGCTCGTAAGAAAAGGCCTGATACATCGAAGCGTACGGGAGTCACCGAGCAAGGTGGCTGACATGAATTGTTGTTAAGCTCTTAGATTTTCAGGGCCGCCTGCACGCTACGCCAACAGAGTAAACGAGTTTGCTACCCTGGCCGGAAGGTCCGGGGGATTTTTTGAAACTTTCCCGTGCTGATGATACAGCACTACAAACTTCTCAGAGTGTCTGGTGTGCTATAGCCGGCCCTGAGATTAGCGGCACTTGTGTAGAAT
>KB822693.1/397760-397927 Marinobacter nanhaiticus D15-8W genomic scaffold super1, whole genome shotgun sequence. 
ATCTCCATAGACTCAATAGCAGAGGAGACTCTGACATGTATATGGATGCTGTCGTTTTCGCAGGTATCGCTACCGTCGTCCTGATATTCGGCTTCTTTGGCGGTGTGGGTTATTTCATTTACAAGGACTCCCACAAGAAGTCAGACGAGAAGCACTAACCGGTTCCAG
>ALWS01089583.1/31226-31330 Pteropus alecto contig89583, whole genome shotgun sequence. 
ACATATGATTTTATTTTCTTCAGAAAAACTTAATTTTATAAGCAGGGTCGGGCCTGGTTAGTACTTGGATGGGAGACTACCTAGGAAGACCAGGTGCTGTAGGCA
>FRAG01000030.1/20374-20550 Clostridium caminithermale DSM 15212 genome assembly, contig: EJ27DRAFT_scaffold00030.30 
TTAAGCCTAGGATGTTCGTTAAAGCCTTGAAATTCAACCACCAATAAGCATCCGGGAGTCCAGGTTTTTATGGCGATGACGGGCCTCAATATAGTGGAAGTCAGAACTATAGAATAGGACACCCACCTAGGTGATACCGGGTGTGAATTTACAAGGTAACGACATCTTGGGTATATA
>LM154274.1/11133-10866 Schistosoma mattheei strain Denwood, Zambia genome assembly, scaffold: SMTD_scaffold0004766 
TGTGGTCGCACATAAATCGGGTATGATAATCCAAACATTTCATCATCTAAATACCTGAGAGGGAGCCTGAGAAATGGCTACCACATCCAAGGACGGCAGCAGGCGCGAAAATTACTCACTCCCGGCACGGGGAGGTAGTGACGAAAAATACAAATACGGGACTCAGTTGAGGCTCCGTAATTCGAATGAGTGCAATCTAAATCCTTTAACGAGGACCAATTGGAGGGAAAGTCTGGTGCCAGCAGCCGCGGTAACTCCAGCTTCAAAA
>GL378999.1/3793-3024 Volvox carteri f. nagariensis unplaced genomic scaffold VOLCAscaffold_724, whole genome shotgun sequence. 
NNNNAATGTATGCGAGTTGGCGGGTTGAAAACCCGTAAGCGCAAGTAACCTGACTGGTGGGATGGCCTGTGCCTGCACCATCGACCGACCATGTTGCTTTTGCGAAAGGTTTGAGTGCGAGCATACCTGTTGGGACCCGAAAGATGGTGAACTATGCCTGAGCAGGGTGAAGCCAGAGTAACCTCTGGTGGAGGCTCGTAGATGTGCTGACGTGCAAATCGCTTTTCAGACTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCCCCCAGGATAGCTGGAGCTTGATCAGTTTTATCGGGTAAAGCGAATGATTAGAGGTTCGGGGGATGAAACATCCTTCACCTATTCTCAAACTTTAAATAGGTAAGACGTGTCGGTTGCTTAACTGAACCGTCACATTCAATGTGAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGATAGTCGAGTTAAGGTGCCAAACTGCGCGCTAACCTAGATCCCACAAAGGGTGTTGATTGATATAAACAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAATTAGCCCCGAAAATGGATGGCGCTTAAGCGCGCGACCTATACTCGGCCATGGATGCAAGTGCGACGCGTCCATGAGTGGGTGGGCGTGTCTCAAAGATTAAGCCATGCATGTCTAAGTATAAACTGCTTATACTGTGAAACTGCGAA
>LWSG01000002.1/200085-200211 Bacillus litoralis strain C44 Scaffold10, whole genome shotgun sequence. 
TTAAACAAGTAGAGGCACCCGCTTCTCACCTGATTGACACATCCGTTTGTAGTTGGCAGGTTACGATGATCTTTTATGTATACAATCGTAGTGTGGGTGTCTAAGGCATCCACACTTTTTTATTTTC
>URS0000D696C4_12908/1-84 unclassified sequences c-di-GMP-II-GAG riboswitch 
GGGAGCGGGGGAUCCAGGGCACGACGCCCAAAACGGUCGCCUGACCGUCGUGCCUAGCGAGCGGCGAGACCGGCCCCACCGUGC
>MNYX01000050.1/4741-9257 Candidatus Nomurabacteria bacterium CG2_30_43_9 cg2_3.0_scaffold_4245_c, whole genome shotgun sequence. 
TAACAGGAAATATAAGAGCATATGGTGGATGCCTTGGTTCTAAGAGGCGATGAAAGACGTAGCATGGCTGCGATAAGCTTCGGGGAGGTGCCTAGCAACCTTTGATCCGGAGATTTCTGAATGGGGAAACCCCATAACCGTAATAGGTTATGACCTACATTTAAATGTAGGAGTATACCCAGGGAAGTGAAACATCTCAGTACCTGGAGGAAAATAAAAAAAGCCGCCGAATGGCGGAACATTTCCTGAGTAGCGGCGAGCGAAACGGAAATAGCCCAAACCTACTATTTATAGTAGGGGTTGTAAGGCAGAGACGTCGTATTTATACGAGAGGAGTTACAAAATGTAATGTTAGTTGAATATGCTGGAAAGCATAGCCCTAGACGGTGATAGCCCAGTAAACGAAAACCTTACATCTTCTTTGTCTTTGTTCTTGAGTACTTCGAGACACGAATAGCTCGGGGGAATCTACCAGAACTAACTGGTAAGGCTAAATACTCTTAGAAACCGATAGTGAACTAGTACCGTGAGGGAAAGGTGAAAAGAACCCCGGTGAGGGGAGTGAAATAGAACTGAAACCATATGCTTACAAGGAGTCGGAGCCCCCCACCACTCGTGGTGGGGGGTGACGGCGTGCCTATTGAAGAATGAGCCAACGAGTTAATGTATACAGCGTGGCTAAGCCCTTGTCGGGTGGAGCCTTAGGGAAACCGAGTGTGAATAGCGCGTTTGTTGTATGCATTAGACCCGAAGCCAGATGAGCTTACCATGAGCAGGGTGAAGTTTGTAGAAATACAGATGGAGGCCCGAACCGGTTGGCCGTGCGACACCATCGGATGACTTGTGGTAAGGAGTGAAAAGCTAATCGAATCTGGTAATAGCTGGTTCTCTCCGAAATATGTTTAGGCATAGCGTCTAGCGTACCCTCTGGGGGTAGAGCACTGGAAGGACTGAACAGGGAGCAATCTCGTCAGTCCTATCAAACTCCGAATACCAGAGATAGGCCCACCACATAATAATTTTTCGTTGCGAAACGAAAATTTTTAGCGGAAATCATGAAGCGTGATGAGCCTATGCGAGCATAGGCGACGAGCGATGAATGATTTGTAGCAAAAATTTTAAGTTGTAGCAGAAAAGATTGTTGTGTGGTGGGCCCAAATACTAGGCAGTAAGACTACGGGGGCGAAGCTCCGTCGGTCAAAAGGGAAACAGCCCTGATCTCAAGTTAAGGTCCCAAAATTTACGCTAAGTGTACTTAAGGAGGTGGAGTTTCTCAGACAGTGAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAACAGCTCACTCACTAAGAGACTCTGCACCGAAGATAATCGGGGCTAAGCGTAGTACCGAAACTGAGGGTTCTCTCGTCTTTCGAGATGGGGGAGCGGTAGGAGAGCGTTCATGTCTGCGCTGAAGGAGAAGTGTGAGCAACTCTGGAGCGGCATGAAGTGAGAATGTTGGCACAAGTAACCACAATGCGGGTGAGATCCCCGCACGCCGTAAGAGCAAGGTTTCCTTTGCGATGTTGATCAGCGAAGGGTTAGTCGGGCCTAAGGTTATAGCGAAAGCTGAAGCCGATGGACATAGGGTTAATATTCCCTAACTTTTTATTTGTGCGATGGAGTGACGAAGGTTAGTATGTCTTGCGCATTATTGGATTTGCGTTTGTGTCATCAGTGTGACTCTTAGGTAAATCCGGGAGTCTGGTTTTAATACCGACCGCAAGTGAAGCAGAAATGCATGGGTTCGCCCAGTGCAGATAAGGCAAAGCAATTTTCCGAGAAAAGCTTCTAAGCATAACAAATAAAAAACCGTACCTAAAACCGACACAGGTGCTCGAGTCGAGTAGACTAAGGCGAACGAGTGATTGCTTCTCAAGGAACTCGGCAAAAAAGCAGCCGTAACTTCGGGATAAGGCTTGCCTCCACCACTTTGTCTTTAAAGACGCATAGATAAAATTACTTCATTAGCGACGTAGAGCGAGAGAAATGAAAAGGTATTTTTTCATTTCCAAGCCGAGGAGCTAATATAAGAGGTAACCCTGCTTTTATTTGCATCGTTGAGAAGAATTTTTTCCTCCACGCAATGTACACTTGTACATCTTGGTCGTAAAAAATTCTCCCCGCCTCGCAACTAAAGCAATTTAATCAATGCTTATGCAATAGTGATGGAGTCCGAAGAATTGAGTGTATCGAGACCGTGTTTAGTATCAGAGCTGATACTAAACACAAAAAAGTATTTGAGAAAGTGAGTGATTGTGGGTTTCGTAGAGGGGGGATTCTGGATTTAAATAGAGAAGATAAGATTCGCAAGAATCAAACGACACTCAGGTGTCAACTTCGTTGGGTGCTACCATCCACTATTTCTTTGAATAATCTTGTCAGACGGGAAACCGCATAGACTAAAAGATCGTAATTAGATCGATTCGAAGGTTAACCATGAACTCTCTCCATTCTATGAAACTCATAATCATAGATCGTATCAAATACAAAAATGTTGACTAATTTTTCTAGGACTTAGACATCATCTCTCAAAAATCATTTCGCATATCATCAGTAAATTTCTGCTGTGACTTTGAGAAAAATTTTATTCGAACCTCGGTTCGAGTCAAATTTTTCTCTTCGTCTCGCTAGAAATTTCCCTGAAGCTAAGCGAAGCATTTTATGAGAAATGATGTAGCACCGCTTTGAAAATAAAGTGGTGGAGGCCGCAGCGAAAGATTTCCTGCCAACTGTTTACCAAAAACACAGCTCCATGCGAACTCGTAAGAGGATGTATATGGGGTGACGCCTGACCAATGCCAGAAGGTTAAATACGGGTGGTGCCGAGCACCATGAAGTTAAGTAGAATTTCGTTGAATATTTTTGTTCAGTGGTTCTATTTGAAAGCATGGTGCTCGGTGCTGGCTTGTATAAGCCCTGGTGAATGTCGGCCGTAACTATAACGGTCCTAAGGTTCCCTGCTTATCAATGATGAGCAGGGAAGGACTAGGACTGTTATAGAAAAAAGTAAACAATTAATTTAAATTCATTACATGTTTAAGCTACCTGGCACGCAGTAATGTGTGTTAGTCCAATCATGATAAACGAGAGACCAACGTCATGGACCCTACTTTTAAGGAAGAGGGTAAAGATAGAGTCCAACTGAGAGGAATAGTTGAGCGTAATTCCTTGTCTGGTAAGTTCAGACGTGCACGAATGGCGTAATGAGTGGGAAACTGTCTCGAGAAGCAGCTCGGTGAAAATACAATACCGGTGAAGATGCCGGTTACCTGCAGATAGACGAAAAGACCCCGTGAGCTTTACTATAGCTTAATATTGAACATGTTTTGTTTCTGCGTAGCATAGGTGGGAGGCTTTGAAGCGACCGTTTCGGTGGTCGTCGAGCCAACAGTGAAATACCACCCTTAATTGAGGCATGTTCTAATCTGTAAGGAAAAAACTTACGGAGACAGTATTTGGCGGGTAGTTTGAGTGGGGCGCTCTCCTCCTAAAAGGTAACGGAGGAGTCTATTAAGGTCCTCTAGGCGCGAATGGAAACCGTGCCGATAGCGTAATGGCAAAAGAGGGCTTAACTGCAAGACGGACATGTCGAGCAGGTGCGAAAGCAGAGCATAGTGAACCGACGACACGCTTTAGATGCGGTCGAAGATTAACGGATAAAAGCTACCACGGGGATAACAGGCTAGTTCTGCCCAAGAGTTCATATCGACGGCAGAGTTCGGCACCTTAACATAATCGGGGTGCGTCAGGAGTAATCCTGTAGCGACAAATTTATAATCGTCAATAAATAATATATAAACAAGAAATCTTGGCTTATAACGGTGAAACCCATTTGCATGAACAATAAATGGGCAATACCGTGGGAAGTTTGCGTGTAAGAAAGCGATCACTCTAAATTTTTAGAGAGCTGCTACATCCTTTGTGGATGTGATTATACGTATAACCCTGTAGAGACTTGTCACGTTAGCGCGTAGAGATGCAACTAACAAAGTGACGGAGTTATGAGAAAATCATAGCTAATACGCCAACGCCTCTTTTGATCGAGAGGGTGAAGATATAGTCCGATCCTCGCAGTAATGCGAGACAAATACGACAGCGATGTCGGCTCATCTTATCCTGGAGGTGGAGAAGCTTCCAAGGGTTTGGCTGTTCGCCAATTAAAAAGATACGTGAGCTGGGTTCAAACCGTCGTGAGACAGGTTGGTCTCCTATCTTCTGCAGGCGTTGAATTTTGAGGGGATTTGCTCCTAGTACGAGAGGACCGGAGTGAACTGACCTCTGGTGTGGCTGCTGTCCTGCCAAGGGCACCGCAGCGTAGCTATGTCGGGAATGGATAACCTCTGAAAGCATCTAAGAGGGAAACCAACCCCAAGATCAGAATTCGTTTGAGGCCCGTAAGAGATGATTACGTTGATAGGCTCTATGTGTAAGACGAGTAATCGTTTCAGCAGAGGAGTACTAATACGCCGATTCCTGGTGGG
>AYYY01000070.1/37374-37142 Lactobacillus vaccinostercus DSM 20634 NODE_168, whole genome shotgun sequence. 
TAAAAAACGATGAAAAGATGAGTAGCAGTTAACACCTTTTTAGAGAGCCTCTGGTTGGTGAAAAGGGGTAAGGTTGGTGATTGTGAATATGGTCTTGAAGTGAGGAATGTTGAGCGTATGCGAGGCATTCATGGGGACGCCCATTACCGCGTGCGAGTATGATTGTACTCAGCGAGGGAGTGTATGTGAATACATTCTAAATTAAGGTGGTAACACGAGAGATCGTCCTTACT
>AAQR03042857.1/1-1187 Otolemur garnettii contig042857, whole genome shotgun sequence. 
GCCCCAGTGCTGCCAGTCCCTGTGCTGTAAGCCCATCTGCTGCCGCCCCAGCTGCTGCCAAACCACCTGCTGCAGGACCACCTGCTGCCGTCCCAGCTGCTGTGTGTCCAGCTGCTGCAGGCCCCAGTGCTGCCAGTCCCTGTGCTGTAAGCCCAGCTGCTGCCAAACCACCTGCTGCAGGACCACCTGCTGCCGCCCCAGCTGCTGCTAGGGACCTGCTATAGAACAATCTGTTGTTGTTCCACCTGCCAGACCACCTCTTGCTGCTGAGTGTCCTGCTCCAGATCCATGAACTTTCATGACCCTTCCTTTAGTCTAGTTAGAGAGGATCTAGTCACTGAAGACATGAACTTCCTGGGGCTATGGACTTAACAAACAGACCCATGGATGAATTTGCAAAACCCTGGTTTCTATATTAGTATTTTCTCTATTCTGTAGGTATATTTCATTATTATAGCAAATCAGTATTTACAGCCAGATTCTGCATCAAATTGCTTTAGTATTCCTAGTTCTGATTCAAAATACAGGAGTCTTCAAATGTTCTCTTCATAGATATTTTTATAACATTTTCAGTAGAATCCATTGTCATGTGGAATTATTGCTCAATGTTGCCAAATAAAAGTTCTTAGCATCCAAATGCACCCAAATTGGTCATTTCTCATTATTAACAAAATGTTCCTGTCTCTTTTCTGCACAACACTAGAGCTCATGTTTTCAGGAGAACACACAATGGAAACATTAAATTGGTCTTCTCCAGTGACATTGTTATCAAAACCTGAATTCACCCCCCAACTTCTAAGAAGGACAAGTGGTGTTAAGCCACCCAAGATTGAGCAATAACAGGCCTGTGATGCCCTTAGATGTCTGGGGCTTCAATGACTGGCTCAGCATGCAGGCACTGGTAACCCGTTGAACCCCATTCATGATGGGGATCAGGGATTGCAATTATTCCCCATGAACGAGGAATTCCCAGTAAGTGCAGGTCATAAGCTTGCGTTGATTAAGTCCCTGCCCTTTGTAGACCCTGCCCGTCGCTACTACCAATTGGATGGTTTGGTGAGGCCCACGGATTGGCCCCAGTGAGGTTGGCCCTGGTGGAACGCTGAGAAGATGATCAAACTTGACTATCTAGAGGAAGTAAAAGTCATGACAAGGTTTCCATAGATGAATCTGAAGAAGGAAAAATT
>KQ042022.1/603975-604625 Larimichthys crocea isolate SSNF unplaced genomic scaffold scaffold95, whole genome shotgun sequence. 
CCTCACGCTTAAGCCCGGCTTCGGGACCCCCCCACAGCACCCAATGCACACCGCGGCTACCGCGGTGTGCATAGTGACGAAAAATAACAATACAAGACTCTTTCGAGTCCCTGTAATTTAAATGAGTACACTTTAAATCCTTTAACAAGGATCAATTGGAGGGCAATTTTGGTGCCAGCAGCCGCGGTAATTCCAGGTCCAATAGCGTATCTTAAAGTTGCTGCAGTTAAAAAGCTCATAGTTGGATCTCGGGATTGAGCTGACAGTCTGCCGCGAGGTGAGCTACTGTCGGTCCCAGCCCCTGTCTCTCGGTGCCCCCTCGATGCTCTTAGCTGAGTGTCCTGCGGGGTCTGAAGCGTTTACTTTGAAAAAATTTGAGTGTTCAAAGCAGGCCCGGTTGCCTGAATACCGCAGCTAGTAATAATGGAATAGGACTGGCCAGGGGAGGTGCCGCTAGAGGTGAAATTCTTGGACCAGCGCAAGACGGACGAAAGCAAAAGCATTTGCCAAGAATGTTTTCATTAATAAAGAATGGAAGACGATCAGATACCGTTGTAGTTCCGACCATAAACGATGCCAACTAGCGATCCGGCAGCGTTATTCCCATGATCCGCCAGGCAGCATCCAGGAAACCAAAGTCTTTGGGTTCCG
>GL897038.1/2640067-2640202 Mustela putorius furo unplaced genomic scaffold scaffold00141, whole genome shotgun sequence. 
AGCTTTGCGCAGTGGCAGTATCGTAGCCAATGAGGTTTATCCGAGGCGCGATTATTGCTAATTAAAGCAGCAAGAGAGAAATGAGACCTTATTTATAAGGCAAAAAAATTAGAATGACAGTGAATTTCCCATCAAA
>AWHE01044218.1/1319-1427 Amborella trichopoda AMTR_V1.0_contig_44218, whole genome shotgun sequence. 
GTGCCTTAGGGTTGAACTAGTCCCGGATATTTAATCATTCCCACCAACTTCACATTCTCAGTGAAGTTTTTCCTTGTTGTCTTATCTGATAATTCAAGATGGAAATATA
>AFSB01019533.1/7909-8012 Heterocephalus glaber contig19533, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGCAGTAGGAAGAAGGATCCAGTGTGGAGTCATAAATATATAAATTTTATTATTTATCAATACATTAATTTAT
>AYUG01084532.1/52955-52729 Fukomys damarensis contig84532, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGGAAAATAGAAAATTTCATACGTAAGCAAAACAATTTCTCCTAACCCTATCTCACCAAAACAAAAACTTCTCACATTTTTTCACAAGTATTTCAATTACGTGCCTCTATTTATCCTAGAGCTCTCTTGCAAAACAGGAACAGATCCAAACTGAGAAAGAATTGCTTTTCAGTTTTAGTGCAGTTGACGTTTA
>LLXS01000009.1/35786-35931 Stenotrophomonas maltophilia strain JCM 9942 contig_17, whole genome shotgun sequence. 
CTTGGTGTGTGACCACCAATAGCCTGAAGTGGCGTGCGTCTCTGGCAACGGAGGGGTGCGAAGCCCACTGAACAAGTCCCCCGCAAGGGGCGCAACAACCGCGAGGTTTTCGCGCAGATTCCGGTAGCAGCAGACCGGATGAGGGG
>CCCW010015579.1/1-2359 Brassica napus, WGS project CCCW01000000 data, contig: 28609 
ACGGACAGCCACAGACGTCCTGTATCTGCTGGCGGACACCCACGGATGTCCTGTGTGTACTGAACAGACAGCACACGTGGGCCAAAATCTCCGGAACAGTCCACGGGAAGGGTCAGCGTGCTAAGTCCAAGGACCAATGTGCTGATATGTGTACTGATGGACAGCCACGGACGTCTTGTGTGTGCTGACGGACACACACGGACATCCACGGACGTCCTGTGTGTGCTGATGGACACACACGGACGTCATGTGTGTGCTGACGGACACTTGGTCGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCCGCTAAGGAGTGTCTAAAAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTGAAGCACGCGACCTATACCCGGCTGTCGGGGCAAGAGCCAGGCCTCGATGAGTAAGAGGGTGTGGCGGTCGCTGCAAAACCTAGGGCACGAGCCCGAGCGGAGCGGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCCAATGAGAACTTTGAAGGCCGAATAGGGGAAAGGTTCCATGTGAATGGCACTTGCACATGGGTTAGTCGATCCTAAGAGTCGGGGGAAACCCGTCTGATAGCGATTATGCGCGAACTTTGAAAGGGGATCCAGTTAAAATTCCGGAACCGGGACATGGCGGTTGATGGCAACGTTAGGAACTCCGGAGACGTTGGCAGGAATTCTGGAAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCCTTGAAACGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGTACCGCACGTCGCGTGGTCTCTGGTGCATTCCCGGCAGCCCTTGAAAATACGGACCGAGTGACGCTCACGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGATGAACAACCTCTGGTCGATGGAACAATGTAGGCAAAGGAAGTCGGCAAAATGGATCCGTAACTTTGGGAAAAGAATTGGCTCTGAGGGCTGGGCTCGGGGGTCCCAGTTCCGAACCCGTCAACTGTTGGCGGGCTGCTTGAGCTGTTAACGTGGCGAGAGCGGACCGCCTCGTGTCGGCCAGGGGAAGGACTGGGAACGGCTCTTTCAGGATCTTTCCCTGAGCGTCGAACAGCCAACTCAAAACTGGTACGGATAAGGGGAATCCAACTGTTTAATTAAAAGAAAGCATTGCGATGATCCCAGTAGATGCTAACGCAATGTTTTTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGTGCGGGTAAACGGCAGGAGTAACTATGGCTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTGTCTACTATCCAGCGAAAACACACCAAGGGAACGGGCTTGGAAGAATCAGCGGGGAAAGAAGACCCGGTTGAGCTTGACTCTAGTCCGATTTTTTGAAATGACTTGAGAGGTGTAGAATAAGTGGGAGCTCCAGCGCAAGTGAATACCACTACTTTTAACGTTATTTTACTTACTCCGTGAATCGGAGGCGGCGTAATAACCCCTTCTTTTAGACCCAAGACTCGCTTTGACGGGTCAATCCGGGCGGAGGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACGAAGGGGTCCTAAGATGAGCTCAATGAGAACAGAAATCTCGTGTGGAACAAAAGGGTGAAAGCTCGTTTGACTCTTATTTTCAGTACGAATACGAACCGTGAAAGCTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACCAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGCTCGTGTCGCAATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGCGCGAAGCTACCGTGCGCTGGATTATGACCGAACGCCTCTAAGTCAGAATCTGGGCTAGAAGCAACGCATGTGCCCGCCGCCCGATTGCCGACCCTCAGTAGGAGCTTCGGCTCCCAAAGGCACGTGTCGTTGGCTAAGTCCGTTCAGCGGAAGCGCCGTTCGGACCGCCTTGAATTATAATTACCACCAAGCGGCGGGTAGAATCGTTTGCAGACGACTTAAATACACGACGGGGTATTGTAAGTGGCAGAGTGGCCTTGCTGCCACGATCCACTGAGATTCAGCCCTTTGTCACTAAGATTCGA
>MNRN01000197.1/5697-5757 Clostridium sp.CAG:217_53_7 isolate CAG:217_53_7 Ley3_66761_scaffold_9517, whole genome shotgun sequence. 
GGAGAGGTACCGAAGTGGTCATAACGGAGCGGCACCGTGGGTTCGAATCCCACTCTCTCCG
>LIZX01000155.1/9306-9787 Candidate division WOR_1 bacterium DG_54_3 WOR1_52_54_19713, whole genome shotgun sequence. 
AGAGCAGGCCAGATGATCGTGCCTCGACTCACTTCGTTCGCTCGGCACAAGCCCCTTAGTCTGAGGGGTTTATACCGAGCGAGGCCGAAGGCCGAGTCGAGGTAAGGAAAGTCCGGACTCCGCAGAGCAGCGTGGTTGCTAACGGCAACTGAGGGCGACCTTAAGGAAAGTGTCACAGAAATTACACGGCCCACTCTGACCCTAAAGGTCAGAAGGCAAAGGTGAAATTGGGAGGTAAGAGCTCCCACAGGACTGACCGGTGACGGTCGCTGCGGTAAACCCCACGCGGAGCAAGACCAAATAGGGAAATGGGTGGCTCGCCCGCCCTGCCCGCAATGCTACGCATAGCGTTGCAGGCGGGTATAATCCCGAGTAGGTCGCATTGAGGCAGTCAGCAATGGCTGCCCCAGATAGATGATCATCGAACCCAGCACGGTATGGTGCTGGGTGAACAGAATCCGGCTTACCGGCCTGCTCTTTTT
>MFJD01000004.1/58273-58056 Candidatus Gottesmanbacteria bacterium RBG_16_52_11 RBG_16_scaffold_141, whole genome shotgun sequence. 
ACAGAAGGCTCAATTTGGGCTCACTGAAAACTATTTTAGTGATAGTCCGGCTGTATCGGTGAAATCCTGAGCTAGCCGAAGGACAACACCGAGGCAATCCCCCTTCCGCATAAAATATGGGGGCGAGTCCGTAGAGACTATACGCCGGACCCCGCCTACAGTTGATAACTCAATTGTTGGCGGGGAAGATATAGTCCGACACTCTCAGTAATGGGAGA
>GK000003.2/42786018-42786224 TPA: Bos taurus chromosome 3, whole genome shotgun sequence. 
ATCACTTCTTGGTATTTTGGCTAGAATCAAGTGTAGTTTCTGTTCTTATCAGTTTAATATCTTCTCCCACTGAAAAATGTGGCTCTGCTATGTTGGGGCCAGGAGTAATTAAACCAGTGTTAGGAGGAAAGAAAGTGAAGTCACTCAGTCGTGTCTGACTCTTTGTAGCCCCATGGACACCGGGCTCCTCCGTCCATGGGATTTTCT
>LFZU01000001.1/2811527-2811462 Bacillus sp. FJAT-27231 Scaffold1, whole genome shotgun sequence. 
CAAAAAGGAACGACGGCTAAAGACGCGACACCGTGTCGCAACGCCCTCACTAGCACATCATGTGCG
>GL637602.1/252614-252701 Caenorhabditis tropicalis strain JU1373 unplaced genomic scaffold Scaffold630, whole genome shotgun sequence. 
TGTCCACTGATGACAACCTTACATACACCATTACGATCTCTGAAGACTTCGTGCTGAACATGTTTCCATGCAACACCAACTGAGGACG
>LL029687.1/1-1177 Trichobilharzia regenti genome assembly, scaffold: TRE_scaffold0029590 
CTCCTTGTGTTTAAAGTTAGTGCTTACAAGAAACAAATGATTATCAGAACAGAACTGTAGGAGATCAGTATCAGTTCTTTATTAATCAGCTTCAACAACAATACATCTCATCCAGTTCTGCTTTAATATTCTCCGTAGGCAAATGAGACAAGTACGCTAAGTATCCCAAAAATGCCTAAGCCCAGTAAGAATGCTAAAGCACCGACGGCGGTGCTGTGCAGTCTACAAACAAACAAAAAGTTGTATTCAAATACCACCAGAAACTTTTCACTCAATCTATTCCACATTCTCAAAATACTTCCGAAGGTTGCAGAACCAGTGCCATTCAATCATTTCACAGAGATGGACACTCCACATTAAGTTGTACAATAATTCCTATCCCTAAATTAACTTAAACTCTGAGATATGCACTGAATGAAGCTAATTTGATCATCAAATGTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCCGACAAGAGCATTGATATGACAGACTTATCTCCTGTAATTTCTGTTTCTGCGAATGGTGAGCGGACAAAAAGACTGAAACTCCAAGAACTTCATTATTCGCGTTAAAAACACCACGTTAGCGATTTTAGATAGAACGTACGGACAACTATTGTAAAGTGTGCAAACAAGGTGAAAAGAAACGGGAAATCGGGGTTCGATTCCGGAGAGGGAGCCTGAGAAATGGCTACCACATTCAAAAACCGCAGCAGGCGCGAAAATTACCCACTCCCGGCACGGGGAGGTAGTGACGAAAAATACGAATACGGAACTCAATTGATGCTCCCTGGTTCGAATGAGTACAATTTGAATCCTTTAACGAAAACCGATTGGAGGGCAAGTCTGGTGCCATCAGCCGCTGTAACTCCAGCTCCAAAAGCGTAAAGTTGCTGCAGTTAAAAAGCTCGTAGTTGTGTGGTCGCATGCCATTGGTTCTTCGCGGCTTTGGTTACGATCAGAACTTGTGTTCGGCTCGGTGTAGTGGCTGTGCAGCCTTTCAGTCATATCTGTGTAAAGGGGTGCTGACGGAGATGGGTGAGCTTGTCTTGCCCGCTATCTGTTGGCATGCTTCCGGATGCCTTTAACCGGGTGTCGGGAGCGGACGGCATCTTTC
>JYDL01002072.1/1-274 Trichinella nelsoni scaffold2457s, whole genome shotgun sequence. 
TTGAAACACGGACCAAGGAGTCTGACATGTGTGCGAGTCAACGGGTGATTAAACCCGTAAGGCGCAAGGAAGCTAATGCGCGGGATCCCTTTACGGGTGCACCGCCGACCGACCTTGATCTTCTGAGAAGGGTTCGAGTGTGAGCATGCCTGTCGGGACCCGAAAGATGGTGAACTATGCCTGAGCGGGGCGAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCGATACTGACGTGCAAATCGTTCGTCTGACTTGAGTGTAGGGGCGAAAGA
>DS562881.1/23395652-23395568 Cavia porcellus supercont2_26 genomic scaffold, whole genome shotgun sequence. 
AAATCATAATCCAACTCTAGCATTAGCCATGGGTTTAGCATTCCTCTTGAGGAAAGCAGGGGTTCCTCTTTTGCCCCCCATTGGC
>FAOM01514816.1/33945-33090 Triticum aestivum genome assembly, contig: Triticum_aestivum_CS42_TGACv1_scaffold_514816_6BS 
CTGTATGATCCTGCTAGTAGTCATATGCTTATCTCAAAGATTAAGCCATGCATGTGCAAGTATGAACCAATTTGAACTATGAAACTGTGAATGGCCCATTAAATCAGTTATAGTTTGTTTGATGGTACGTGCTACTAGGATAACTGTAGTAATTCTAGAGCTAATACATGTAACAAACCCCGACTTCTGGGAGGGGGCACATTTATTAGATAAAAGGCTGACGCGGGCTCTGCTCGCTGATCCGATGATTCATGATAACTCGACGGATCGCACTGCCTTCATGCCAGCGACACATCATTCAAATTTCTGCCCTGTCAACTTTGGATGGTAGGATAGGTGCCTACCATTGTGGTCACGGGTGACGGAGAATTAGGGTTCGATGCCAGAGAGGGAGCTTGAGAAACGGCTACCACATTCAAGGAAGGAAGCATGCGTGTAAATTACCCAACACTGACATGGGGAGGTAGTGACAATAAATAACAATACCGGGCGCATTAGTGTGTGGTAATTGGAATGAGTACAATCTAAATCCCTTAACAAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGTCGTGGTAATTCTAGCTCCAATAGCGTATATTTAAGTTGTTGTAGTTCAAAATCTCATAGTTGGACCTTCGGGCCGGTCGGCCGGTCCGCCTCACAGCGAGCACCGAAATACTCGACCCTAGCCTTAATTGGTCGGGTTGTGTTTTCGGCATCGTTACTTTGAAGAAATTAGAGTGCTCAATGCAAGCCATCGCTCTAGATACATTAGCATGGGTGTCACGCCCAAGATGCGACCCTATCCTAAAGGAACTCGAAGGTCCCACTAAGGATAGAAGCACATCTT
>GG700527.1/116493-116761 Anaerococcus vaginalis ATCC 51170 genomic scaffold SCAFFOLD1, whole genome shotgun sequence. 
AATAAAACTTTGATCAGAAGTAAGTAAGTTTTATAAATCTTTTATAGAGAGCTTGTGTGTGGTGGAAACAAGCAAAGAAGTAAAACCGAATGGATCTGAGAGTGCTAAGGTGAAAAAAGTACCCGAGGCCGTCTTCCCACGTTATAGGGATATGATATGAAATTATTTTAAATTAGTATCAGAATAAAGATATGTAGGATTTATTAATTTATTGAAATTTATTTTACATAAAAAGGATGGCACCGCGAATTCAACCATTTGCTCCTTTG
>CM007396.1/65217892-65218035 Nicotiana attenuata strain UT chromosome 6, whole genome shotgun sequence. 
TGTAAAGGTTTCCTCGGGCCGGACGGAGATTTACCCTCGAGTGTAAAGGCAGAAAGGAGCTTGACTGCAAGACCCACCCGTCGAGCAGGGACGAAAGTCGGCCTTAGTGATCCGACGGTGCCGAGTGGAAGGGTCGTCGCTCAA
>AFSB01270989.1/241-552 Heterocephalus glaber contig270989, whole genome shotgun sequence. 
AGATGTGTGGGACAATGTGGCTATGACATCTGTCACCCCATCGATCACCAGGGTTGATTCGCCCGATCTGGCTGGCTAGGCAGGTGTCCCTTTCCTTCTTCACCACTCCACGTGTGTCCCTCCCAAAGATGCACAATAGGTCGAAAAGAACGAACACCCAAGCTACAGGAGGACAATTTCCTCATCAAGGGTATATGAGTAGCTACACTCCCCTGCTAGAACCTTCATACAAGAGCTCAAGAATACTCCACTATAGGACCCGGATGTAGCTCAGGGGTACAGAACTTGCCTAAATGCACAGGTCTTGGCTTT
>FN543502.1/2725931-2725592 Citrobacter rodentium ICC168, complete genome 
TTTGGCGACGTCCACCTGCTGGATTTGGGCATACAGTTTGCCGACCACTTCGGCGATCGACGGATGCCAAGAGACGGCGCGATTGACCGCCTGAGAAAGTGTAAGTTCGCCGGGGGCGGCGCTGTCGCCGGTTAGCGGCATTGGTCCATTCAGCGAGGGCAGCTCCTGCTGCTCAACCCACTGCTGCGGGGCGATGCGGGGTGACTCTTCGGCGGCAATGGCCGGAAACGCGCACAGGTTTCCAGCCAGCCACCAACAGGTCAGCTGTCGTTTTCCCATTTTTTACTTCCCTAAGCTGGCTTCTTTTCGCCCCGGGCGAACGTGCGCCCGGGGTCGTTGT
>CM000685.2/82594813-82595002 Homo sapiens chromosome X, GRCh38 reference primary assembly. 
AGGCATGTGATCAATCAGGCTGAGACATCTGTTACTGCATTGATTGACTTGGATGATCAGGCTTGTGAAATAGGTGGCCCCATCCTACTTTGCTGCCCCCAAGTACATCTGTCTCAAAGCTTACACTGCTGGAAGGGGATGACCATCCCTATTAGAGGACAGTCATTCTCTGGTCAGGAGTAGAGAAATA
>DS995940.1/1722-1546 Penicillium marneffei ATCC 18224 scf_1105668340736 genomic scaffold, whole genome shotgun sequence. 
GCTGGCGACGGCGACCCGGGAGAAGCCCTGGGCCGCTGGCTGGCGGATTGCAATGTCACCACGCGCGGGGATAAATCCTCTGCAGACGACTGAAGTGACCAAGCGGGTCATGTACGCGTACGAGTAGCCTAGTTGTTACGAGTCGCTGAGTGTCAGCCCGACCTTGGCTCGATTTGT
>MLHJ01000044.1/15422-15261 Rodentibacter rarus strain CCUG17206 contig_44, whole genome shotgun sequence. 
TTTATCGCATAACTCCGAGCTTGTTTAGTCTAAGTTCCTCTTTGGTGAAAATACTTGGGTGAGGAATATGACGGCAATGCCAATAACGCTATTTGTTATTCAGGGATACGCTGGAAACGGCTTGTCCTCTCCATTTTAGAAAGGTGTCACATGCAATCTATT
>MAVT01007669.1/869-1028 Diaporthe helianthi strain 7/96 Scaffold_4854.1, whole genome shotgun sequence. 
ACACGCATGAGCCGGTGCCAATCCGCCCGTGCCAGGTCCGAGAGTCCTGCTTCAGCAGCACTCAAAGTGATTTCGGCGCGACGGCGGAGTTGCTGAGATTACACGGCTTCGGAACTTGATCTTGGATAATACCAGCGAAAGGATCATGCGTCTCCCCCCC
>CDMY01000201.1/99855-100012 Vitrella brassicaformis CCMP3155 genome assembly, contig: scaffold135 
AAACTTACCTGGCTGGGCCTCGGGGGCGCTCACGAAGGTCCCTGTGCTGTCGTGGAGCTCCCATTGCATTCGGGGGTACGTGAAGCGGCATGGGGGGGCTATGCTCCTGCCAACAGCGGAATTTCTGGCAGAGCTGGCTTGCGTTCGCGCAGCCGGCA
>CM002822.1/201709819-201709930 Capsicum annuum cultivar Zunla-1 chromosome 11, whole genome shotgun sequence 
GTACACCCCAAAGGAGTGTACATGAGAACACAAGTGTATTTTAGTTTTTTACAATTTCAATTTCTATATCTAAAATGTACTTGTGTTCTCAGGTCACGTCTTTGAGAACACC
>MGVN01000036.1/14680-14207 Elusimicrobia bacterium RIFOXYB2_FULL_49_7 rifoxyb2_full_scaffold_1450, whole genome shotgun sequence. 
CTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTCTGTGTTACCAGCGGATAATGCCGGGGACTCACAGAAGACTGCCTCTTTTTTGAGGAGGAAGGTGAGGATGACGTCAAGTCCTCATGGCCCTTACGTCCAGGGCTACACACGTGCTACAATGGCCGGTACAGAGGGTCGCAATGCCGCAAGGTGGAGCTAATCTCAAAAAGCCGGTCTCAGTTCGGATTGGAGTCTGCAATTCGACTCCATGAAGTTGGAATCGCTAGTAATCGCGGATCAGATACGCCGCGGTGAATACGTTATCGGGCCTTGTACACACCGCCCGTCAAGCCATGAAAGCCGGGAGTACTCAAAATGGTTGCCTGAACCGTAAGGAGGGCGCCCCTAAAGTAAAACCGGTGATTGGGGCTAAGTCGTAACAAGGTAGCCGTACCGGAAGGTGCGGCTGGATCACCTCCTTT
>LVVY01000041.1/1-81 Devosia sp. S37 DIN_R1_(paired)_trimmed_(paired)_contig_135, whole genome shotgun sequence. 
TATGCCACTGGCGCAAGCCGGGAAGGCGCCCGCCGGGGATGATCCCAAGTCAGAAGACCGGCCAGATGACCTCTTGAAGCT
>ANKR01162454.1/9860-9985 Myotis brandtii contig162454, whole genome shotgun sequence. 
TAACCTCCGCAGGCTGGCTGGCCCTCAGGCTGAGCTGGGTGAGTATCTTTTCTGTTTTGGGAGGACGGGGAAGAGGGGGGACCCAATATCTTTTTGAGAGGCTCGCCCTCAAGCACAACTAAGAGC
>LGPB01000006.1/253-1 Bacillus galactosidilyticus strain PL133 scaffold000006, whole genome shotgun sequence. 
GATTAAGTTGTTAAGGGCGCACGGTGGATGCCTTGGCACTAGGAGCCGATGAAAAGGGACGGGGACTAACACCGATATGCTTCGGGGAGCTGTAAGCAAGCTTAGATCCGAAGATTTCCGAATGGGGGAACCCCCTACCTTTAATGGGGTAGGATCCAATTCTGATTCTGAATACATAGGAATTGGAACCCGGGGAACTGAAACATCTCAGTACCCGGAGGAAGAGAAAGAGAAAGAAAAATCGATTCCCTAA
>CAQQ02314174.1/33-1 Megaselia scalaris, Durham, NC isolate 2 -- Noor lab, WGS project CAQQ02000000 data, contig: ctg0000314174 
AAACCGGTTCTTTTCAGAACCACCAATTTTTTT
>LL082930.1/890-2011 Trichobilharzia regenti genome assembly, scaffold: TRE_contig0003919 
GACTGATGAGCAGGTTTCTTTTAAAGTGAGTTCATTTAACCTCTTTTTGTATTCTATTCTATATCCGCCATTTTTCTGAAAAATTTTTGAGTAATATCACCATTCATCTATTCGTTTTATTATTATTATTATTGTTAATATTAACTCACCTCCATTTCAAATTTATTTAAGCGAAAGTGTTCATACTACTAACATAGTCTATTCAGTAGTATTCATTTTAAAATGTATATTTTTCGAATTGAGGTGCATTAAAACAACAGGTGTTATAGTAAAGAAAAAGAAGAAGTTTTGAAGGGAGGACGAATAACTCAGTGGTGATGTGATTTATATCAGATGTCTTTGTATTACCGTCGTTGGATAGACTTTATCGAAAGCATTTGCTAAGAATAATTTCATTGATCAGGAACGAAAGTCAGAGTTTCTAAGACTATCGTTTCAGTTCTACCATTAAACAATGCCAACTGACGATCTGTGTTGGTTCTTTAATTGTCAATGAACGCACTATCCAGGAAAACTTCAAGTCTTTCAGCTCCGGAAGAAATATGGTTAAATAGCTGAAATTTACAGGAATTGAAGGAAGGGTACCACCAGGAGTCGAGCCTGTGGTTTAATGGAACCCAACATGGGAAAAATCGTTCGGCACGGACATATTCAGGATTAACAGATTGAAAGCTGTTTCTTGATTTGGTTGATGGTAGTGCGCGGCCGTTCTTATCTGCTATCTGTTGCTTCTTAGTGGAGTAGTGTGATCGTTAACTGGAGAGTATGGTACCAGCTTTTGTCTCTTAAACAGACAGACTGCACACTGAAGTCGTACGACATTGAGCAACAACAATTCTGTGATGCCCTTAGACGCCCAAAGCTACACCTGCGCTACAATGACGGTGCCAGGGTTAAGCCACCTGTTTTATCACCGTCGTGACTGGGAACGCTACCTGCAATTGTTCTCTGTGGAAGTCATAAACATCTACTGATGACGTCACTGCCCCTTGTACACACTGCCCGTCTCTATTACCGATTGAATACTATTCATAAACATGAACAATTGAGAATGGTTGGCGTTAATGTTTAATATATCGCCAAATTTGTCTTGATTGATGAGTAGACAGAACGAAATCAAAG
>FWFV01000002.1/64217-64338 Palleronia marisminoris strain CECT 7066 genome assembly, contig: 0002 
GTGACATACGAGCACCCACCTCCTCCCGGGCGCCTCGTATTCGGCGACGACACCGACCTCCTCCCCGGTGTCGTCGCCACAGATTACGCAGCGCCGACCTCCTCCCCGGTGCTGTGTTTCAG
>MNVI01000024.1/6358-6450 Candidatus Micrarchaeota archaeon CG1_02_55_41 cg1_0.2_scaffold_10394_c, whole genome shotgun sequence. 
CCCGCAGTAGCTCAATTTGGCAGAGCACCTGACTGTAGTTAGAAAATCCGAGTGGACATCAGGGGGTTGCCAGTTCAAATCTGGCCTGCGGGA
>AAGJ05017846.1/1565-1174 Strongylocentrotus purpuratus Contig17846_fixed, whole genome shotgun sequence. 
GAGACACTGGCCGGGGCCCCGGGAAGAGTTGTCTTTTCTTGTTAAGGAGCGGGATCCCTGGAATCGGTTCGACCGGAGAGAGGGTCTGCGGCTCCGTAGAGCGCCGCGTCTACGGCGGCGTCCGGTGCGCTCCGGCTGGTCCTTGAAAATCCGGGGGAAGTGTTGGGACTCTCGCCTCGGGTCGTACCCATGACCGCAGCCGGTCTCCAAGGTGAATAGCCTCTGGCCGATAGAACAATGTAGGTAAGGGAAGTCGGCAAGCCGGATCCGTACCCCCCGCAGGGATGGATTCCACCCCTCTGTCACATCATCTCTCTTTACTATAATACCCTCCTCTCCCTTTTCTTTTAAAACCAATGGATGATGTATGGGTCCCCTCCCCTTCCCCTCGT
>MOOB01000036.1/196011-195921 Penicillium nalgiovense strain IBT 13039 PENNAL_contig0036, whole genome shotgun sequence. 
ACTACGTGATGATCAATTTTGAATTTGCAATCCTGACAACCACCTATCATATGTGAGGTTGTGTGTTGACTCTTCTACACTTGATCTGACC
>CP002770.1/704081-707325 Desulfotomaculum kuznetsovii DSM 6115, complete genome. 
GGTCAAGCTGGTAAGGGCATACGGTGGATGCCTGGGCGCTTTGGGCCGATGAAGGACGTGGCAAGCTGCGAAAAGCCACGGGGAGCCGCAAGCAGGCGTAGATCCGTGGATCTCCGAATGGGGCAACCCGGCGGGGGTGAACCCCCGTCATCCCGTACTGAACACATAGGTACGGGAGGGGCACCCGGGGAACTGAAACATCTTAGTACCCGGAGGAAAAGAAAGCAAAAGCGATCCCCGTAGTAGCGGCGAGCGAAAAGGGGACAGCCTAAACCCGGCACTCAACTGAGTGTTTATGTTATGCATACAACAAGCTGATGCATCCGGGAAGTGAAAGTTGGGGTAAGAGCATAGCGTAAACACCGAGTTGAGTGCCGGGGGTTGCGGGACTCCCGTTGACGTACTGCGGAACTTAGCCGAAGCGGGCTGGAAAGCCCCGCCGCAGAAGGTAAAAGCCCTGTAGGCGAAAAGGGAAGCAGTGCGGGGAGGATCCCAAGTACCGCGGGGCACGTGGAATCCTGCGGGAATCAGGGAGGACCACCTTCCAAGGCTAAATACCCAAAGCGACCGATAGTGGACCAGTACCGTGAGGGAAAGGTGAAAAGCACCCCGGGAGGGGAGTGAAATAGGACCTGAAACCGTATGCCTACAAGCAGTCGGAGCCCAGCACTCAACTGGGTGCTTACCTTAGGCTTTAGAGGGGCTGATACATTCCGGGAGGGAAGGGCCTGTTTAAGGCAACCGTAAGCACCGAGTTGAGTGCTGGGTGACGGCGTACTTTTTGTAGAACGGACCGGCGAGTTACGTTCAGCGGGCGAGGTTAAGGCTGGGAAGGCCGGAGCCGTAGCGAAAGCGAGTCTGAAGAGGGCGATAAGTCCGCTGGAGTAGACCCGAAACCGGGTGAGCTACCCATGTCCAGAGTGAAGCGTAAGTAAAGTTACGTGGAGGCTCGAACCAACCGTCGTTGAAAAGGCGGTGGATGAGGTGTGGGTAGGGGTGAAATGCCAATCGAACCCGGAGATAGCTGGTTCTCCCCGAAATAGCTTTAGGGCTAGCCTCATACGAGAGTACCGGAGGTAGAGCACTGACTGGGCTAGGGGCCTTCGCGGGTTACCGAACCCAATCAAACTACGAATGCCGGTTACTTGATGTATGGGAGTCAGACTACGAGTGCTAAGATCCGTAGTCGAGAGGGGAACAGCCCGGACCGCCGGCTAAGGTCCCGAAGCGGTGCTAAGTGGGGAAGGATGTGGGGCTGCGAAGACAACCAGGATGTTGGCTTAGAAGCAGCCATCATTCAAAGAGTGCGTAATAGCTCACTGGTCAAGTGGCCCTGCGCCGAAAATGAAACGGGGCTCAAGCACCGCACCGAAGCCGCGGATCTGAGAGGTGAGAGGTGAGAGGTTGGAAGTGGGAATAACGATTCTCACATCTCACTTCTCACATCTCACCTCTCAGGTGGTAGGGGAGCGTTCCCACCGGGTAGAAGTCACACTGGGAGGTGTGGTGGACTGGTGGGAAGTGAGAATGCCGGTATAAGTAAGCGAAAAGGCAGGTGAGAATCCTGCCCGCCGAAAGCCTAAGGGTTCCTGGGGAAGGCTCGTCCGCCCAGGGTAAGCCGGGGCCTAAGCCGAGGCCGAAAGGCGTAGGTGATGGGGAATCGGTTGACAATCCGATGCCACCGGTAGGCCGATTGAGGATGGGGTGACGCAGGAGGGTAGGCCAAGCGCGCGGCTGGAAAGGCGCGTCCAAGCCGGTAGGGTGTGGGGCAGGCAAATCCGTCCCACGGTAAGCCCGAGAGGTGATGGGGAGGGAAATAAGAGTACCGAAGTGGCTGAACCCAAACTGCCGAGAAAAACCTCTAACGAGGAATACCGGTGCCCGTACCGCAAACCGACACAGGTAGGCGAGGAGAGAATCCTCAGGCGCGCGAGAGAACCCTCGTTAAGGAACTCGGCAAACTGACCCCGTAACTTCGGGAGAAGGGGTGCCCCGGTAGCGTGAAGGTATGAACTGCTGGAGCGCGAGGGGGCCGCAGAGAAGAGGCCCAAGCGACTGTTTACCAAAAACACAGGTCCCTGCGAAATCGAAAGATGAAGTATAGGGGCTGACGCCTGCCCGGTGCTGGAAGGTTAAGGGGAAGGGTTATCCGAGAGGAGAAGCTCTGAACCGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCCGCACGAAAGGCGTAACGACTTGGGCGCTGTCTCAACGAGGGGCTCGGCGAACTTGTAGTACCCGTGAAGATGCGGGTTACCTGCGACGGGACAGAAAGACCCCGTGGAGCTTTACTGCAGCCTGACATTGGACTTCGGTATTGCATGTACAGGATAGGTGGGAGGCAGGGAAGCCGGGGCGCCAGCCCTGGTGGAGCCGACCTTGGGATACCACCCTTGTGGTATTGGAGTTCTAACAGGGTACCGTGGAGCCGGTACATGGACAGTGTCAGGTGGGCAGTTTGACTGGGGCGGTCGCCTCCTAAAAGGTAACGGAGGCGCCCAAAGGTTCCCTCAGCGCGGTTGGAAATCGCGCGTAAGAGTGCAAAGGCAGAAGGGAGCTTGACAGCGAGACTGACTGGTCGAGCTGGGACGAAAGTCGGGCTTAGTGATCCGGCGGTAGCGAGTGGAAGCGCCGTCGCTCAACGGATAAAAGCTACCCCGGGGATAACAGGCTTATCTCCCCCAAGAGTTCACATCGACGGGGAGGTTTGGCACCTCGATGTCGGCTCATCGCATCCTGGGGCTGGAGTAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGTGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCCTATCCGTCGCAGGCGCAGGAAACTTGAGAGGAGCTGTCCCTAGTACGAGAGGACCGGGATGGACAGACCGCTGGCGTACCAGTTGTCCCGCCAGGGGCAGCGCTGGGTACCCAAGTCTGGTGGGGATAAGCGCTGAAAGCATCTAAGCGCGAAGCCCTCCTCAAGATAAGGTTTCCCACCCGGCACTCAACTGAGCTTGTCAGGCCAATCCACTTTAAGGAGAGATTGGCACGCTCAGTTGAGTGCCGGGGTAAGACCCCTGGAAGACTACCAGGTAGATAGGCCGGGCGTGTAAGCCGGGTAACCGGTTGAGCGGACCGGTACTAATAGGTCGAGGGCTTGACCAG
>CM002293.1/9210050-9209896 Phaseolus vulgaris cultivar G19833 chromosome 6, whole genome shotgun sequence. 
ATACTTACCTAGATAGGTCAATGGATTATCAAGAAGATTCATGGTTTATGAAAGTAACTTTCATTGCAATTTGGATGGATGCGTTTCTGATTTTGTCAATCTTCATATAATTTGTGACCGATGAAGTCTGAACTTTTGAAAGTTTCACTTTCATT
>FP929055.1/3038167-3038356 Ruminococcus torques L2-14 draft genome. 
TGATTATGAATGATCAGAGGAACGACGTGGGAAATCTGGACTGGTGAAAAGGGAAACAGGTGAGAATCCTGTACGAACTCGTCACCGTATTTCGTGAGCTTGTGTTTTGAGACCACTGGGAGACCGGGAAGGTGAAGCAGAAGCATTTGAACGATCAGCCGGGAGACCTGCCTTTCGCAGTACAGGAATG
>ALWZ042737980.1/1504-1133 Picea glauca, whole genome shotgun sequence. 
TGAAGCTTTACTATTTCCTGGGAATAAATATGGATTCTTCTTTACATTTTTGGTGGACAGCAAAGAAGTTCCTTTAATGTGGGGCTTGAGCCATAACTGAGATACAGCTCTAGCAGAGTTAGAATTCCAACCTGTATTAGGACCCATGTTCCAAGGGGATGATCTTGGGTAAATAATTTCTATGGGGCGTAAGACTCAAAAGGTAATGGAGGCATGCAAAGGTTTCTTTGGGCTGCGCAGAAATTGACCCTTGAATGTAAAGCAAGAGCTAGCTTGACTGAAGAACCCACCTGTCAAGCAGAAGCAAAAATTGGCCTTAGTGGTTCAGCAGGATTGAGCAGAAGTGTCATTGCTCAATGGTAGAAGGTACTC
>CM001000.2/104264790-104264683 Mus musculus chromosome 7, GRC primary reference assembly. 
GTGTTCTTGCTCAGGCATCATATGTGCCCAAAGTAGAATGATCAGGGAATGTTAATATGGCCCCTGCTCATGGATGACATGCGAGTTTATGAAGCATTCCATATTTTT
>ACTA01010209.1/17005-16720 Ailuropoda melanoleuca scaffold917_80, whole genome shotgun sequence. 
GAGTGTGTTGAGGATCTTTCCACATCAGTTACCCTCCTAATGGCTGGAGTTGACTCGGCTGATGGGGATGGCTAAGTGGTGTCCCCTTCCTTTTTCACTACTCCATGGACATCCCTCCTAAAACGAAGTGCTTTTGGATGCAGAGGACAGCCCCATCGAAGTTGTTTTGTCAAGAGAAATTGATAGCTACACTCTGCTATTTGAATCTTCAAATTTAACACTTGCTTTTCTGTGCTTTCTCTTTGTTTCTCTTAAAAATATTATATATGATAACACATTTGGAAAG
>CM001415.1/8836720-8836132 Lepisosteus oculatus linkage group LG12, whole genome shotgun sequence. 
AAGGAGCAATGACACAAGAGTTCCTGTCACAAGTCAGACTCGGTCCAGGGATAATGCTGGGTGGGGAGGGCTAGTATTAAGGACAGTGGGCTGCACAGGGCGACATCACTTTTTGATCCTTTGATCCTTCCTAGAACTGTGAAGTAGGATTCACTTAGTATTGGATTGTTCACCCTCTAAATGGGAATGTGAGCTGGGTTAGACACTCATGAGACAGATTAACTTTACCTCATGGCTTTACCGATGATGCGATGTTGCGATTGCTGTTGTGATCTGCTGCTCTTTATGAGAGGAACCACAGGTTCAGACACTTGATGTCTGTCTGTGCTTGGCTGAGGAGCCAATGACACAGAACCCACAATTTGTGGGATTATGGTTGGATACCTTCATGACAACCCCAACGCCTTAAAAGGTGTAAATGTTCTGCGACACAGAGTTACAAAGCAGATTAAGATTTCACAGCAAATCACCAAAGAGACACCTTCTTCACCGTTCTAGAAAATCCTTTTCTACATTAAAGTCCCTGAAATAAGGAAGATCCTTGAAGGTGCTAATTCTTGCACAACAGACACTAGTGCAGTCAATAAGG
>FR799005.1/397220-397284 Leishmania braziliensis MHOM/BR/75/M2904 complete genome, chromosome 30 
CCGCTGCATCAGTACAGCGACATCATCTTTTCGAGTGGTGATGCCTGCTGGCGATGTCAGCAAGA
>AUSU01007329.1/5457-5644 Genlisea aurea contig_12937, whole genome shotgun sequence. 
TAGGGGTATAGAGAGCTTTCTTCAGTTCAACCACAGGAGAATTAGGATTCAATCTGCTGCCGATTCATTTAAACAAACGATGTACGGATTTATCGAGTACTTCGATTGAACGAATGATGCGGGAGTCAAGTTGAATTCCATTTGCTTTTCTTGTGTTTGGACTGAAGGGAGCTCCCTTTTTTCTTCTT
>GL871722.1/1-494 Dictyostelium purpureum unplaced genomic scaffold DICPUscaffold_800, whole genome shotgun sequence. 
CTCTGGGGTTAGAGTGCGGCAACGTATCTTTGCTTCAAGGAGTGTGTAGTCTGACTTGATAGGTACGTTAACAAAAAACTTCTTAGAGGGACTACCTGCCTCAAGCAGGCGGAAGTCCGAGGCAATAACAGGTCTGTGATGCCCTTAGATACCTTGGGCCGCACGCGCGCTACAATGCAGATAGCAAAAAGGTTCCTGGTCTGGAAAGATTGGGTAATCAATTGAATTTTCTGCGTAACTGGGATTGATCTTTGTAATTATTGATCATCAACGAGGAATTCCTTGTAAGCGTAAGTCATTACCTTATGCTGAATATGTCCCTGCCCTTTGTACACACCGCCCGTCGCTCCTACCGATCGAATGATACGGTAAAGTTAACGGATAGTTTTTTTGTGGCAACACAATTAAAATTAAAAGTTATTTAAATCTCATTGTTTAGAGGAAGGAGAAGTCGTAACAAGGTATCCGTAGGTGAACCTGCGGATGGATCATTT
>CM002821.1/68112919-68113024 Capsicum annuum cultivar Zunla-1 chromosome 10, whole genome shotgun sequence 
GACCACGTGATTAGGGAATTGATTAATTTATCATTCAATCATTGCCATACTTCATACAAAGGTTCACCATTGAGTTGGCAGAACTTTATTATTCAATCTCTAGGTT
>AYYE01001153.1/1824-2049 Tannerella sp. oral taxon BU063 isolate Cell 1/3 contig_2519917771, whole genome shotgun sequence. 
ATTTTTGCCGCCGTTTTCGGTGACGCCAGGTCGGACGGTCCCGTCCGCGACGTGAAAAGGGAATCCAGTGAAAGACTGGAACAGTGCCCGCTACTGTAACACCCCACCTATCGAACGAAGGAGAGCACCCGCAAGACGTGCCACTGCCGCCACTGAGGCGGTGGGAAGGCCCACAGCCCTCCTTCAGGGTGAAGTCAGGAAACCTGCCGGAAACAACAACGTATAC
>AZNC01074805.1/442-855 Glycine soja cultivar W05 scaffold3126_15, whole genome shotgun sequence. 
GACTCTGATGCTATATCAATAAATGTCCATATAGGAAATGGCTATCCTAATGGCTCGAGTGGCATAAACGAATGAGAGGTAACAAAGGCTTGCAAGGGTTTCCTCGGATCAGATGGAGATTAGGCCTTTAGTGTAAAGGCAAAACAAAGTTTGATTGTAAGACCCACCCATCGAGTAAAGATGGAAGTCAATCTTAGTGATCTGATGGTGCCAAGTAGAAGGATTGTCCCTCAATGGGCTATAGGGATAACAGACTCATCTTCCCCCAAGAGTTCAGATCGACAAGAAGGTTTGGCACCTCAATGTCGGGTCTTCGACATTTGAGGTTGTAGTATGTTCAAAGGATTAAGTTGTTCGCCCATTAAAGCGGTATATGGAAAATGCAAGTTCTGTAAGGCACATAAGATTGTGTTA
>MCGE01000002.1/764806-764528 Absidia repens strain NRRL 1336 BCR42scaffold_2, whole genome shotgun sequence. 
AGCAACGAAGAAGATCTGCATGTTTGACGCACCACACACACGGGGGTTTTATACTCATTATAAATTGCGTTAGGGAAGTTCTCCAGACATGTGTACCTGTAATGGGTTATTGAAAGCAGCCTTTCTTAAGGTTGTGGTATTCAATTATGCCAAATTATCAGCTAAGATAGCTGTGGTATGGTTGGGTATCCAATAGTTCTTGTCATAGGAATAGGTATTGCGGATCTTGGTAAAATTTATTTTATCATGAACTCAATGGAGGCTACTCTCTTTTGTTGC
>ASAF01079751.1/2035-2138 Nicotiana sylvestris Nsyl_contig79751, whole genome shotgun sequence. 
TACGCAGGAGAGATGATGCTGGATAATGGACCATCCCTGCTTAGCTATCTCAAGAGATTGGAGGGAGCTTTGATTATTTAGCCAGCATCATACTCCTGCATATT
>JXLN01013749.1/1932-192 Sarcoptes scabiei Contig13748, whole genome shotgun sequence. 
TATCTGGTTGATCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTCTAAGTACATACCGCATTAAGGTGAAACCGCGAATGGCTCATTAAATCAGTTATGATCTATTGGATGTTGACCAATTACATGGATAACTGTGGTAATTCTAGAGCTAATACATGCCGAAAAGCTCCATCGCAAGGTGGGGTGCATTTATTAGACCAAGACCAAAAGGTGGAAACACCTTGTTGTGGTGACTCTGAATAACTGCAGCTGATCGCATGGCCTCGTGCCGGCGACATATCCTTCGAGTGTCTGCCTTATCAACTTTCGATGGTAGGTTATATGCCTACCATGGTTGTAACGGGTAACGGGGAATCAGGGTTCGATTCCGGAGAGGGAGCCTGAGAGATGGCTACCACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCTTGGAACAAGGAGGTAGTGACGAAAAATAACAATACGGGCTTCGCTTACGCGTTCTCGTAATTGGAATGAGCACAGTTTAAATCCTTTAGCGAGGATCAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGTGGTTAAAAAGCTCGTAGTTGGATCTCAGCCCAAGTGCATTGGTCCATCATGACGATGGTTACTGGTGTGCTGGGCACTTTACCGTTCACGTGCTATGGTGTTCTTAACCGGGCGTCATAGTCGTACGGTAGTTTTACTTTGAAAAAATTAGAGTGCTCAAAGCAGGCATCATCGCCTGAATACTGTTGCATGGAATAATAGAATAGGACCTTGGTTCTGTTCTGTTGGTCTTCGGATCCGAGGTAATGATTAAGAGGGACGGACGGGGACATTAGTACTGCGGCGATAGAGGTGAAATTCTTGGACCGCCGCATGACTAACCAAAGCGAAAGCATTTGTCAAGAACGTTTTCATTAATCAAGAACGAAAGTTAGAGGTTCGAAGGCGATCAGATACCGCCCTAGTTCTAACCATAAACGATGCCAACTAGCAATCAGCCAGAGTTCGTTTATGACTCGGCTGGCGGCTTCCGGGAAACCAAAGTTTTTCGGTTCCAGGGGAAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTNNNNTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCGATAACGAACGAGACTCTAGCCTACTAAATAGCAATCGGAATTCGTTTCGACTTCCGATCCAAGCTTCTTAGAGGGACAAACGGCGTTTCAGCCGTATGAAAAAGAGCAATAACAGGTCTGTGATGCCCTTAGATGTCCGGGGCCGCACGCGCGCTACACTGAAAAGATCAGCGTGCATATGTTACCTACTCCGAAAGGAGCGGGCAACCCAGTGAAACTTTTTCGTGATTGGGATTGGGGATTGTAATTATTGTCCATGAACGAGGAATTCCCAGTAAGCACAAGTCATCAGCTTGTGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGGATGTTTTAGTGAGGTCTTCGGACTGGCCAACGTAGCCATCCTCGTGGTGGCCATGTTGTGCGGGAAAGATGACCAAACTTGAACATCTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTA
>CM001648.1/54674393-54674536 Nomascus leucogenys chromosome 2, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATCAAGAAATGAAGATGGAATATTATTTTACAATGTCTTGATAAGTTGGGGAGCCTCATTATGAAAATATGGGAATCATAGAATCTCT
>CP001720.1/2579904-2579665 Desulfotomaculum acetoxidans DSM 771, complete genome. 
TCACAAGTGATGATAGGGAAGAGTAAACCTGTACTGTTTACAGAGAGAAGCCGCCTTGGTTGAAAGCGTCTTTAAAAGAAGGCAGGTTAAAAACCACCCTTGAACTGCATAGCCGAAAATTTTAATCCTCAGGGGATTATAGATCAGTAAGCTTAGCCGGCGGCAAACGTTAATTGCTCTGAAGTGAGGAAATTTTATTTCCTAATTTGGGTGGAACCACGGAATAAGACCGTCCCTATT
>JMCC02000032.1/46273-46035 Enhygromyxa salina strain DSM 15201 ES-Contig_32, whole genome shotgun sequence. 
ACTCCGAGGTCGAGGCTAACAATGGCCCTCCGGCGCGCGAGCGCCGGCTGAAAATCGGGTGAATTGCCAGAAACTCCGGGGACGGACAACCGGCAGCCAAGGTCGAGACGGCGGTGCAGCGATGCCCAAGGGCTCGGCAAGGTTCAGAGACTAGGGCCCGAGCGAAAGCGGTGATGGCCCCACGAGCGCCCGACATCTCCCGCGGGAGATGATGAGATAGTCCGTACTGCCGCGATAAT
>LPNI01000102.1/691-2685 Bacterium P201 scaffold_101, whole genome shotgun sequence. 
GCGAAAGAAAGTTAGGGCGTCTGGTGGATGCCTTGGCTCTCGGAGGCGATGAAGGACGTGATAAGCTGCGATAAGCCATGGGTAGGTGCAAATAACCTTTGATCCATGGATTTCCGAATGGGACAACCCAGCCGGCTGAAGGCCGGTTATCTCTGCCTATGCAGAGAGGCAAACCTAGGGAACTGAAACATCTTAGTACCTAGAGGAAGAGAAAATAAACAATGATTCCCCCAGTAGTGGCGAGCGACCGGGGAAGAGCCCAAACCGCATGTGTAGCAATGCATATACGGGGTAGTAGGACCACGTCGTGGCATGCTGATCGTGAGAAGAATGTTCTGGAAAGTTCAATCATAGAAGGTGACAATCCTGTAGTCGAAGCGTGATGCAGCCTAGTGGCATCCTGAGTAACGCGGGGCACGAGTAATCCTGCGCGAATCCGCCGGGACCATCCGGTAAGGCTAAATACTCCCGAGAGACCGATAGCGAACCAGTACCGTGAGGGAAAGGTGAAAAGCACCCCGACGAGGGGAGTGAAAGAGTACCTGAAACCAGTCGCCTACAAGCGGTCGGAGCATGTTTATCATGTGACGGCGTGCCTTTTGCATAATGAACCTACGAGTCACCATCACAGGCGAGGTTAAGTCACTAAGTGACGCAACCGCAGTGAAAGCGAGGCTGAAGAGGCCGTTTAGTCTGTGGGGGTGGACGCGAAACCGAGTGATCTACACATGGTCAGGGTGAAGTCCCGGTAACACGGTATGGAGGCCCGCACCAATAAGCGTTGAAAAGCTTCTGGATGAACTGTGTGTAGGAGTGAAAGGCCAATCAAACTCGGAGATAGCTCGTACTCCCCGAAAGGCATTTAGGTGCCGCGTGCTGTGTTCACCCTGTGAGGTAGAGCGACCGATAGGTCAAGAGGGCTTCACCGCCTATCGCGACCTGACGAACTCCGAATGCACAGGGTCCGTAGCAGTGCAGTAAGGGTGCGGGTGCTAAGGTCCGTGCCCGAGAGGAGAAGAATCCAGACCGCCGTCTAAGGTCCCGGAGTTCTGCCTGAGTTAGTCTAACGAAGTCTGGTCTCGATGACAGCTAGGATGTTGGCTTGGAAGCAGCCATTCATTCAAAGAGTGCGTAACAGCTCACTAGTCGAGAGACCGGGCGTGGATAATAATCGGGTATAAGGCAGACACCGAAGGCGCGGGATAGCAAATAATAAAAGTATCGGTAGGGGAGCATTCCATCTGCGCCGAAGCAGACCGGTGACGATCTGTGGAGCGGATGGAAAAGCAAATGTAGGTATAAGTAACGATAAGGGGCGTGAGATCCGCCCCCGCCGAAAGACTAAGGTTTCCCGGGCGATGTCAATCAGCCCGGGGTCAGTCGGGTCCTAAGGCTCAGCCGAACGGCGAGGCCGATGGCTGACACGGTTAATATTCCGTGACTTCCCATTGGGGCGATGTGGTGACGGAGCAGTGGAACTGCCGCGCGGCGACGGATGTCCGCGTTAAAGGGTGTAGGCGTTGATTGGGGCAGGCAAATCCACCCCAAGAGCTGAAACCTGAAAGTACGGGACTCTCTTCGGAGAGACCTGACAGAGCAGGTAATCATACTCCCGAGAAAAACCGCTAAGCTTAACCTTTTGGGAACCCGTACCGCAAACGGACACACGTAGTCGGGTAGAATATACTAAGGCGTTGAGAGATTCGTGGCTAAGGAACTAGGCAAACTGACCCTGTAACTTCGGGATAAAGGGTCCTCGCTTATAGCGAGGCGCAGAGAATAGGTCCAGGCAACTGTTTAACAAAAACACAGGGCTGTGCAAACTCGAAAGATGATGTATACAGCCTGACACCTGCCCGGTGCCGGAAGGTTAAGAGGAGACGTCAGCCTTAAGGTGAAGCGTTGAATTGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGG
>LXWF01000040.1/121949-121803 Rothia nasimurium strain PT-32 scaffold4_size309601, whole genome shotgun sequence. 
ACAAAACAAAAATTATCAGGCAGAAGCGGGGGACCCACCTTTCGGGCTCACCACCTAGGAGCCCTTGGGGTTAAGTTGCAGGCAACTGTGACCGAGTGACTTCATACTCGAACCCGACAGCTCACCTCGTTCGGCAATGGAGGAAAA
>AFTD01062031.1/43354-43570 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
AATCAGTTGTATGTATGTACTCTTTTGCATGCATGCACACGCGTGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCCTTTACAAAACTTGGATTAACAAAATCTTTTATGTATGTTGCTTGTTTGGTTTGGTGTTTGTTGAGACAGGGT
>CM000665.2/44861892-44861973 Homo sapiens chromosome 3, GRCh38 reference primary assembly. 
CAGCGGGTGCCAGGCACGGTGTCAGCAGGCAACATGGCCGAGAGGCCGGGGCCTCCGGGCGGCGCCGTGTCCGCGACCGCGT
>GL010031.1/37115110-37115156 Loxodonta africana unplaced genomic scaffold scaffold_4, whole genome shotgun sequence. 
AAACAGGCTCTCTAACAGAGCCACAGAATGTTAAAAAAAAAAAAAAA
>FQXS01000031.1/44397-44023 Desulfofustis glycolicus DSM 9705 genome assembly, contig: EJ46DRAFT_scaffold00031.31 
CGCCGCCGGATAACAGGCGCATCGTATCTGGTTATTAAGAGGTCCGGTCGAAACATCACATGATGCCTCGGCTCTACCACAAAAGGGGTTCACGAAAGAACCCTGCAAAAAGGAGTAATTCAACATGGCTGAAGGCACAGTAAAGTGGTTTAACGATGCGAAAGGTTTTGGTTTTATCGAGCAGGATGGCGGCAAGGATGTGTTCGTGCACCATTCGGCCATCCAGGCTCAGGGCTTCAAGTCCCTGACCGAGGGTGCTCGCGTATCCTTTGACGTTGTCGACGGCCCGAAAGGACCGGCGGCAGCCAACGTCGTCCAGCTCTAAGAGCCGGATACGGTTGTTGTGGACCCCGCACCCTGGGTGCGGGGTTTTCT
>LCFB01000050.1/5945-6029 Microgenomates (Gottesmanbacteria) bacterium GW2011_GWA1_43_11 UV59_C0050, whole genome shotgun sequence. 
GCCGAGGTGATGAAATGGTAGACATGCAGGGCTTAGGACCCTGTGAGCCTTAAAACTCGTAGAGGTTCAAGTCCTCTCCTCGGCA
>AFOY02000015.1/191187-190961 Pseudomonas fluorescens HK44 Contig15, whole genome shotgun sequence. 
CCTACACGCCTTGTTACGGGTGCCCTTCACAGGGTGAAACGGGAAACCGGTGAATCATGTGCTTTACTCAAAAGCCATGTCAGTCCGGTGCTGCCCCCGCAACGGTAAGCGAGCGAAGAATCAGATCCACTGTGCCAGAAGTTCGGCATGGGAAGGCGATTCTTGCAGGTTCGGCGAATGCCAGCCCCTCGTGAGCCCGGAGACCGGCCCGCAACACATAGTGCCTT
>AAAB01000498.1/1506-345 Anopheles gambiae str. PEST whole genome shotgun sequencing project, whole genome shotgun sequence. 
TGGCGGCGGTTCGCCTGCGCGCGCCCAATGCGCCGTGTTTCTCGCTCAGCGTCCAGTGTGTCGCTGGGTGGTGCCGCCGGGGAGACTGCATCGTAGCATCGTCGTGTGTAGCGTGTTACCCGCTTGTCCGACCGTGAGCCGTGGCCCGCAAGGGTACAAGCTTGCGTACGTCGGTGCATTCGTGGTGCACTGCTTCTGCGCGGTCGATCGTTTATGATGTCACGTTTGCCCCCGGTTCCGCGCGCCGCCCGGCTCGAAGACTCCTGGACAGGTCCTTTCGGTCCACGTCATGGACAGTGCCAGGTGCGGAGTTTGACTGGGGCGGTACATCTCCAAAACGATAACGGAGGTGTCCAAAGGTCAGCTCAGTGTGGACAGAAACCACACGCTGAGCATAAGGACAAAAGCTGGCTTGATCCCAACGTTCAGTACACTTCGGGACAGCGAAAGCTTGGCCTTACGATCCTTTTGGTTATAACGAGTTTTTAGCAAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCCGCCAAGCGTTCATAGCGACGTGGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAAAATTCACCAAGCGTAGGATTGTTCACCCTTTCAAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGGTGTGTGCTTATAGTCGCTATCTTAACGGAATTCCTGTGCAGTACGAGAGGAACCACAGGTACGGACCACTGGCTCATACTAGTCCGACCGGACTTTGGTATGACGCTACGTCCGCTGGATTATGCCTGAACGCCTCTAAGGTCGTAGCCAATCCGAGCTGATAGCGCTTCTCAAACCCATTAGGTGTTCGGAAGCTAGCGGGCCTAACAACCCTCTGAGATCCGTTGGAGTCTGCGTCTGCAGCCCGGCGTCTCATCCCGCTATACCTAGGCCGCAACGAGTGGAGTTCGCTGCACGTGTTAGTACCGTAACTGGGAACGCCGTTGGCTTGAGCTCTGCCCAACGTGGATATACCTAGTTTCGACACCTATCAACCGCCCGCAAACGACGGGACTTCAGGCTGGGAGCTGCGAGTTGTAGAGATGCGTTCGCATCGATCCTCTCAGGCGACCCATGCTTGGTGGTTTGTC
>URS0000D6AEAC_12908/1-95 unclassified sequences Rhodo-rpoB RNA 
GGGTCGGAGGGCGGCCAGTGGGACGGCCGCCTCGGATGGACCCCTCGACGTCCGCTCTCATGGGGGAAGGCGCCGCGGCCCCGGCGGCGCCCGCC
>CYSP01000003.1/255745-256067 Propionispora sp. 2/2-37 isolate 2/2-37 genome assembly, contig: 2/2_contig3 
GTATACGAGGGAACGCTGTACATTGTGCAGAGGAAAGTCCGGACAGGCACGGGCTGCGATGCCCGTAGTGATTGCGCGTGACCTAAGAAGTCACGGAAGGAAGCTCATTCCTTACGGCGGCAAAACCGACTCTGTCTGAGTTGGCGGTAGCCTGAAAGTGCCACAGAAACGAAACGTTCCGGCGACGGAACGATGCAAGGGTAAACCCCGCAAGCCTGAAACTCAAATTACGGTAGAGGAACCCTAGGAAGGGAATAAAACCAGATTAGGGCGCATGAAACTGCGAGATAAATGTTTCCTAAAACAGAATCCGGCTTACGGTA
>KI669466.1/623363-623809 Kwoniella mangroviensis CBS 10435 unplaced genomic scaffold supercont2.9, whole genome shotgun sequence. 
AGTCCAATCTCATCTCACACTCGCGAGCGGGCCAAGGTCCTGGAATTTCAACCCCCCTTTCATCTTATTTCCTTATGGAAGAAGATGTCTGACCGATCTTAGCGGATCCTTGAGTTAATTTCAAACCAAGTAATTCCCGACCAGAAATGCGTCCTCTCCATCTTATCCGTAAAGGAAACCCATAGAAGCGTTTGACGTGGAGGGTATGGATGGAGATATTTTGGACTTGGTATGGGAATGGTGAGGTAGCCTTATATCGATGTTCTCTATCCTCGATGCCTGGATAAAGAGTCTCTGAAATCAAAGAGAAGTGTTTTGGTCATAGACCAAACCCCGATATACATAAAAAGGCTTTAGTGCAATTTGGTGACGTCCTCATACTCAAAAACCTTCTTTGATCTCAAGTTGAAGAAGGGAGGATAACTCGATCAGGACTACTCTGGGACT
>LT629734.1/2109114-2109055 Agrococcus carbonis strain DSM 22965 genome assembly, chromosome: I 
GCCGCCCGTCCTGACACAACGGATCGTCCGGCACGTGCCTGCCGGTGGAAGGAAAGAGAC
>X51710.1/1-45 Dengue-2 virus RNA for capsid protein, partial, from a case of dengue fever (M3) 
ATGAATAACCAACGAAAAAATGCGAGAAAAACGCCTTTCAATATG
>JH835393.1/4707706-4707998 Erinaceus europaeus unplaced genomic scaffold scaffold00105, whole genome shotgun sequence 
GGATGTGAGGGTGATCTGACTACGAAATCTGTCACCCCATTGATCACCAGGGTAGATTCGGCTGATCTGGCTGGCTAGGCGGATATCCCCTTCCTCCCTCACCACTCCATGTGCATCCCTCCTGAAGCTGTGCACCGGTCTTCAGTCGAGGGTATAGGAGTAGCTGCGCCCCCCTGCTAGAACCTCCAAACAAGCTCTCAAGAAAGAGCAGAGCCCTACTCAGCTCTGGCTTATGGTGGTGCTGGGGATTGAACCTGGGACTTCAGAGCCTCAGGCATGAGAATTCTTTGCAT
>AWUE01002803.1/746-1 Corchorus olitorius cultivar O-4 contig02805, whole genome shotgun sequence. 
AGCTTACCGACTCAAAGCTTTAAGGCCTTAAAGCCCGTTCGCCCTGGATGATTCTGAAAAAATTGAGGATTTTGGTCTTGAAAAAGAGTAGTCGATGATTAACGTTGGATGATTGGAGTCGCGCGAGTACCGTGTGGAAGGGTGAAAAGAACCCCCGTCGGGGAGTGAAATAGAACATGAAACCGTAAGCTACCAAGCAGTGGGAGGAGCCCAGGGCTCTGACCGCGTGCCTCTTGAAGAATGAGCCGGCGACTCATAGGCAGTGGCTTGGTTAAGGGAACCCACCGGAGCCGTAGCGAAAGCGAGTCTTCATAGGGCAATTGTCACTGCTTATGGACCCGAACCTGGGTGATCTATCCATGACCAGGATGAAGCTTGGGTGAAACTAAGTGGAGGTCCGAACCGACTGATGTTGAAGAATCAGCGGATGAGTTGTGGTTAGGGGTGAAATGCCACTCGAACCCAGAGCTAGCTGGTTCTCCCCGAAATGCGTTGAGGCGCAGCAGTTGACTGGACATCTAGGGGTAAAGCACTCTTTCGGTGCGGGCCGCGAGAGCGGTACCAAATCAAGGCAAACTCTGAATACTAGATATGACCTCAAAATAACAGGGGTCGAGGTCGGCCAGTGAGACGATGGGGGATAAGCTTCATCGTCGAGAGGGAAACGGCCCGGATCACCGGCTAAGGCCCCTAAATGACCGCTCAGTGATAAGATAAAGGAGGTAGGGGCAGAGACAGCCAGGAGG
>AZST01000551.1/9313-8979 Rhizoctonia solani 123E scf_551, whole genome shotgun sequence. 
CTCTTGCCATTGTTGTGGGCAGATATAGTGAATGTGGGCGTCGACCCCCCCAGCTGTGATGATCAGTTTCTCGCCTGCGATCACTTCCGTGTTGGCTCCAGCTACCAAGTCAGGGTCGACTCCGTCCATAATGTCAGGATTCCCCGCTTTTCCAATTCCAACTATCTTCCCGTGTCGTATTCCAATATCAGCCTATGCACGTCGTGAGTATTGACGCAGGGAAAACTGAGCGATGCGAATACCTTGTAAATTCCGGACCAGTCGATGATGAGTGCATTGGTGATTAAGAGATCAAGGACCTCGTATCGCTCTCCGCAAGCCCGGCCCTCTCCGTG
>LGUE01000001.1/1373798-1373578 Bacillus marisflavi strain JCM 11544 scaffold1, whole genome shotgun sequence. 
CAAAAGGCTGTGACAGGGAGAGTACGTTTCAGCAATAACCTTTATCAGCGAATCGGGGGCGGTGCAAGCCCGGTAGGGAAATGAAGCGGAAGATCACCCTTGAGCCCTGTCTGTGAACAAATGCTAGCAGACGGCGACTGATCCATGTTACGGATTTTCGAGTGAGGGCAATTATGCCCTTATGAGGGTGGTACCGCGGGAAAAGCTTTCTCGTCCCTTTC
>AEDQ01000029.1/68978-69146 Atopobium vaginae PB189-T1-4 contig00020, whole genome shotgun sequence. 
ACGTAGTTTCAGGGCGGGGCGAACATCCCCACTGGCGGTAAATAAACGCACTAGCTGCACTAGCTGTACTAACTGTAATAAACGCGTTTACAAGCCCGCGCGCCACACTGTGGCTGATTTGGTGAAAGTCCAAAGCCAACGGTTATAGTCCGGAAGAAAGAAACGAGGA
>JMFP01072321.1/1087-1 Pygoscelis adeliae contig72321, whole genome shotgun sequence. 
AACGCACGCTGGAGTAGAGGAAACAAGAAAGATGCAAGGAGAATTGGAGGAAGAGACTAAGAAGCAAGGAGTAGCAGAAAGAAACCATTATGCACTGACCCCAGCCTCCTGCACATTGCCTCACCAAGGGGACTGAGTGTGATGTGCGGTGTTGGCCTGAAGTCAAGCCTGGGAAAGAGGAGGAAATGCATTTCCCTAAGTGTTTGTCTAGTTATCTTCGTGGGAGTTTGGGTTTTTTTTTCTCAATACCCAAATAGGTAATTAAAAGTTTATGTTAATTTGCAATACATTAAATTAGCTGAAATTCCCTGAGTCGAGACTGTTCTGCCCATGACACCTACCCATCCCAGAAAATAACAAGAAGGTTTGACCAGTGATTAGTGTTAAGAGCCTGCTTTGTGCAGCCTTTCACTTTGACCATGATGAAGTTACTTGGTCTCCCGGAGCTGCATTTTCCCATTTCTAAAATGAACACGTCTTTCAAAAGAGACATTGTAAATCTATTTCATTTTTGAGATGCTGAGGTGGAATGGGAAATCATCTGACAATAGAGTGGGGGAAGACCCCCAAGTTGGTCGGCGTCCAACTTCTTAGAGGGACAAGTGGCGTTCAGCCACCCAAGATTGAGCAATAACAGGTCTGTGATGCCCTTAGATGTCCGGGGCCGCACGCGCGCTACACTGACTGGCTCAGCTTGTGCCTACCCTCCGCCGGCAGGCGCAGGTAACCCGTTGAACCCCATTCGTGATGGGTATCGGGGATTGCAATTCTTCCCCGTGAACGACGAATTCCCAGTAAGTGCGGGTCATAAGCTCGCGTTGATTAAGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGGGTGGTTTAGTGAGGTCCTCGGATCGGCCCCAGCGGGGTCGGCCCCGGCCCTGCCGGAGCGTCAAGAAGACGGTCAAACTTCACTATCTAGAGGAAGTAAAAGTCATAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGGGGGTCGGGGTCGCGCCGGGCGTCCGGCCGCGCCGCCGACTCGATTCGCCGCTCACCCGCGCCCCGCCG
>LHQN01016515.1/4388-3427 Habropoda laboriosa contig16515, whole genome shotgun sequence. 
GAACATATGGAGAATGTCTACTCCGATGCACTTACGACCATCGTGTCTAGGGAATCCGGTTCCTATTCCGGAACCCGGTAGCGGAACCGAAATCCATTCGGGCCCTCATTGAGTGTTCGTCGGGGTAACCCAAAATGACCTGGAGACGCCGTCGGGAGATCCGGGGAGAGTTTTCTTTTCTGTATAAGCGTTCGAGTTCCCTGGAAACTTCTAGCAAGGAGATAGGGTTTGGAACGCGAAGAGCACCGCAGTTGCGGCGGTGTCCGGATATTCCCCTCGGACCTTGAAAATCCAGGAGAGGGCCACGTGGAGGTGTCGCACCGGTTCGTACCCATATCCGCAGCAGGTCTCCAAGGTTAAGAGCCTCTAGTCGATAGATTAATGTAGGTAAGGGAAGTCGGCAAATTGGATCCGTAACTTCGGGATAAGGATTGGCTCTGAGGAGCGGGGCGTGTCGGGCTTGGTCGGGAAGCGGGTCTGGCTGACGTGCCGGGCCTGGGCGAGGTGAACCTGTGGTGTCTCCGCATGGGATCCGAGCTCGGTCCCGTGCCTTGGCCTCCCGCGGATCTTCCTTGCTGCGAGGCTTCCGTTGGCGGCCTGCCGTCGGCGGTCGTCCTCTTCGGCCGCCATTCAACGCTCAGCTCAGAACTGGCACGGACTAGGGGAATCCGACTGTCTAATTAAAACAAAGCATTGCGATGGCCCCCACGGGTGTTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAACGTGAAGAAATTCAAAAAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTTGCAAAGACTTTCGCTCTCCGAGGTGGCGTCATCTGTTCGTCCTGGGGACTATCTTGCCCTCCAGATTGCTAGGGCACGTAGGTGCCTTAGCGATCACGGCGAACCCATCGACACCCCTGCGAAGGAGTCGCGCCGTTGGGCTGCGGC
>AEWC01017985.1/26701-26812 Solanum tuberosum cultivar DM 1-3 516 R44 scf00126_13, whole genome shotgun sequence. 
ATTCCATGAACAACCAGGAAATAACAAATAAAACTGGAATGACATAAAGAAGATTAGCATGCCTATGGGCAAGGATGACATGCCCAAATCAAGAAATAACAAATAAAATCTT
>CCCW010003393.1/857-2271 Brassica napus, WGS project CCCW01000000 data, contig: 40795 
AACCCGTCCTGGAGGAGTGTTGTTAAAGGGTGAAGACCTGGGTTCGAGTCTCACCAACAACCTAATTATGGAGTCAGAGAGGACTCATAATGGAGGGGTTGGGGTCGGTGCGCTGCAGCGCTGTGAACCTAGGTTCCTAGTGAGAGGATGGGTTGTCACACTCTGCCCGTTGCTCTGATGATTCATGATAACTCGACGGATCGCATGGCCTTAGTGCTGGCGACGCATCATTCAAATTTCTCCCCTATCAACTTTCGATGGTAGGATAGTGTCCTACCATGGTGGTAACGGGTGACAGAGAATTAGGGTTTGAGTCCAGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGTAAACTACACAATCCTGACACGGGGAGGTAGTGACAATAAATAACAATACCTTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGTAGCCGCGGTAATTCCAGCCCCAATAGCGTATATTTAAGTTGTTGCATTGAACCTTGGGATGGGTCGCCCGGTCCACCTTCAGTGACCACCGGTTGGCTTGTCTCTTCTGTCGGCGATATGCTCCTGGCCTTAACTGGCTGGGTCGTGCCTCCGGTGCTGTTACTTTGAAGAAATTAGAGTGCTCAAAGCAAGCCTACGCTCTGTATACATTAGCATGGGATAACTTCATAGGATTTTGATCCTATTGTGTTGGCCTTCGGGATCAGAGTAATGATTAACAGGGACAGTCGGTGTAGAAACCCGTTAAAAAAAGAGAGAATGGTTGAGTATCTTTGTGTTGGTCGAGTCGCGGGTGATACTTATCGATCGAGAAGTTTTGAAGTACGAGGTGGGCGAAGAAGTGATCGTGAGTGAACTGTGAGTCGAATAAGTTGCTCGACCATAGTTACAAAATGTCTTAGATTAACGAGACAGACGTTTTGGAAGCATAACATTTTTGGAAGTACGACGGTTTAGAAGCTCGACGTTTTGGAAAAATGACGTTTCTTCAGCACGAAGTTTTCCGCGAAAACTCGTATCAGCGGAATATTATTTCGAAGACATTGGAAGGAGGACGGGAATTAAGCACGATGGGCAGCAAGCACGACAGGATCGAAGCACGACGGGAAAACCCAAAATTGGACGAAAACCCTAATTTCGGTATTATGAAAGTTTTCGATGAAGCCAAAGGATCTAGAAATGTTTACTGCCAAGGTCATAGTTCAGATTGGAGTTTATTAAAAATATTCCGCTCATCAGAATGGGAGCAGAAAGTATTCGGGATTAATCGCGGGTCAGAAATTTACCGGAATGACCGTAATCAGACAAATAGACCGAGAAGCTCGAGGTGGCTCGTTGCATGGGTTCAGAACGTGGTGTCAACCATCTAAAATGCTGAGTGTCTCCAGAAGCTCGAGG
>GL637601.1/12317752-12317884 Caenorhabditis tropicalis strain JU1373 unplaced genomic scaffold Scaffold629, whole genome shotgun sequence. 
ATCCCACTGATTACAAATTTCGCTGATACCTGCCCACCCGAAAGCCTGGAGGCCACAGGGAGTGGGGTCCCGCCGGTCGATGAATGGCTGACAACGGTGGGAACCATGATACAGATTATGAGAGATGAGGGTT
>AARH02006624.1/20544-20687 Populus trichocarpa scaffold_19_contig_351, whole genome shotgun sequence. 
AATAACCAAAAATAAAACTTGGGCTAAGGGTAACGTTGGTAATTGTTCTTACATCTCCCACCCCTGGAAACCAGGTATCATATACGGGCCCAAAATAAGGAGCTTTGAATATCTAAAATTGTCGTAATTTTATTTCTCTTTCCA
>JRES01001669.1/266737-266612 Lucilia cuprina strain LS Scaffold353, whole genome shotgun sequence. 
TAACAAAAAAATAAAAATAAACAAACTAAGTACTGGTGCAGCAGGAACTATATGGAGCTAAATGCTGTTGCTCCATTTAGTTCCTGCTGTACCAGTACTTAGTTTGTTTATTTATAAGAACAAAAC
>DS981450.1/8754-8822 Bacteroides coprocola DSM 17136 Scfld_02_23 genomic scaffold, whole genome shotgun sequence. 
ATGCAGACGCTTAAAACACTTGGATGTATGTGAATATGTGTAAGTGTTACCTGTTCCAGAAGTGGAAAA
>AJXZ01000015.1/19268-19422 Nitratireductor aquibiodomus RA22 Contig15, whole genome shotgun sequence. 
ATAACAAGAGGGTGAAGCTGAAAATTCATCCTCACCACGCGGTCAAAGTCTTGGGAGGATGCGGTCCAGGCGCGGTTACACGCAGCCGCCGACGATGATACGGTAAAGGATCGGACGCGTTGAGTTAGCAAGGCCTCTTGGCCTTGCATTTTTTT
>KQ034000.1/288106-288014 Lactobacillus apis strain Hma11 genomic scaffold Hma11_scaffold2, whole genome shotgun sequence. 
GGTCAAACATAAGACATGCGAGATTGTAAATAACTTTTGAATCGGAATACTATTATTTAGTTAATAGGATCCATATTCATTGCGATACGTCTC
>GG729934.1/356366-356523 Oribacterium sp. oral taxon 078 str. F0262 genomic scaffold Scfld1, whole genome shotgun sequence. 
AAATTCCAGTGTCATAAGGAGCTGTCCCCCCATCGTGCTTGCACGAAGGGGGGACAGCTCCTTATGACACGCCCCCTTATGAGCATGCAGCGGAGGTTTTTCCCGCGGAATGCGAATAAGGGACAGCATGGCGAGCTCAGCGATGCCATGCGGAATTT
>ALXA01000123.1/6897-6525 Pseudomonas putida S11 PPS11_c212, whole genome shotgun sequence. 
CCACCCAATGCGCCACCTATACCTGCTCCGGTATTGCCGCCTGCCGACGCAACGCCGCTCAGCAGGCCAAGTGACAACAACAGAATCGAGGAGTACTTCATTTGTAAAAAGCCTCAAAGGGATACGGAGGCGATCCTGAGGCTCTGGACAGGGCCTTACAATGGAAATCCGACGAGTGACACGACTTGGAAAAATTCTCCAAGTTATTGTTTTCCCGATGGAAACTTAAGGGATTTTCAACGGTCACAGGCTGATTGCAAAAAGCCTTTCCAGTGGTGGAGAAGCCTTTTATTTCTACCCGTCACCCCGTGCCTTCCCCTCCAAACTCACTACCCTTCTGCCCCAGACCTTGCTTGCCCCAAACCGCTGGATC
>AFSB01219390.1/2517-2353 Heterocephalus glaber contig219390, whole genome shotgun sequence. 
ATTCCTTCTTGGCCTTTTGGCTAAGATCAAGTGTAATATTCTAGTTCCTAAAGTAACTATATGCTTATAAAAAAATCTTGCCTTTTGGGGGTCTTAAGAGAGTCTAATGATCTTGTGCAGTGTAAAAAATGCATTATGACTTCCTTGTTATGTTTTGCATTCTCT
>FR892523.1/19058-19295 Prevotella sp. CAG:592 genomic scaffold, scf208 
GCAAAGTATATCGCAAGCGGTTTGCCCTCACGGGTGATTAAAAGGGAATCGGGTGGAAATCCCGGACAGTCCCGCTGCTGTGAGCCGCCCCTTATGAAAGGGTCGAACAATAGCCACTGGAAATTCTTATAGCTCCAATCTGTTATTATGAAATGTCTAACGATTGTTGGAGGTTAACGGGAAGGCGTTCGATACCGGGCGGCAAGTCAGAAGACCTGCCATTGCGACACATGGCGTA
>KB202646.1/8509-7967 Lottia gigantea unplaced genomic scaffold LOTGIsca_5069, whole genome shotgun sequence. 
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCGCGGTCCTGCCTCGTTTTTCTCCTTCCGGGAGAGAACCCGCCGCATTTTCTGTCTACCTTGAAAAAATTAGAGTGCTAAAGGCAGGCTAAAACCCCGAGCCTGAATATTTCGTGCATGGAATAAGCGGGGATGCTCTTTTCCGGAGGGCGGTCCGACCGACTGGCGACGTCGCTTTCGCTGTCGGTTTCGCCGGAGAGCTAGGATTCGAGAGGAACGGTGGGGGGCGAGCGTACCGGGCGGGGAGAGGTGAAATTTTGTGATCCGCTCGGGACGACTCGAAGCGAAAGCGCTGGCCCCGGACGTCTTCCTTAATCCAGAACGAAGGTGGGTGGAGCAAAGACGATCAGATACCGTCGTAGTACCGACGGTAAACGCTGCCGACCGGGCCGCGGACGAGGCTCGAGAACAGCGGTTATGGACCCGTCCGTGGCGGCTTCGGGCAACCTGAGAGTTTACGGGT
>AZGB01000027.1/63184-62919 Lactobacillus ghanensis DSM 18630 NODE_73, whole genome shotgun sequence. 
TAAAAAACAGCAAGAAGAGTAAATGGAAAAATTGTTTTAAGCGAGTCGTTGGTTGATGAAAAACGATAACAATTGACTGTTGAAGATGGTCTTGTTGAGAAGTTCTATTGCTGAGTTGTGCTGAATAATAAGGCAATAGCGGGAACTCCCGTTAGCGAGTCGAAGTATCTTCTGGAGATAAATAAGAATGTACTTTTGAAGGAATAGTTTGTGAGAACTATTTAAATTAAGGTGGTAACGCGAAAAGCAGTCTTTTCGTCCTTAGC
>CM001425.1/10442330-10442236 Lepisosteus oculatus linkage group LG22, whole genome shotgun sequence. 
CCCAGCAGCCATGTCGCTCTGCCACTCAGCGGGTGTGAGCCTGGGCAGTACCTGGATGGGAGACCTCCTGGGAAAAACTGAGGTTGCTGCTGGAA
>AP013066.1/2828303-2828212 Sulfuricella denitrificans skB26 DNA, complete genome. 
AGAACCCATGCGGGAGAGCGTGCGATTATTTTCGCACCACCGAAGGCGCAACCACCCGTAACCGCTCAGGTATCAGGAACCGCATGGAACAC
>CM000251.2/46867717-46868010 Rattus norvegicus chromosome X, whole genome shotgun sequence. 
GAGTTTTCTGGCTTGGATATCTGACATCCCATTGATTGCCACAGTTGATTTAGCTGATCTTGCTGGTCGGCAGGTGTCCCCTTCCTCCTTCACTGCTTCATGTGCATTCCTCCTGATGCTGCGCACTCCGTTGAAGATGATGAACCTTCCCTGAAGGGAGAAGGTCCAGTCTTTGGGCAAAGATATTCGAGTAGTTGTGTTCCCCAGATAGAACCTCCAAACAAACTTTCAAGGAAGAAAATTTTAGTTTGGTTTCTGGTTCCAGATGGTGGGCATGCTGGCATGACAGCAAAC
>FNHO01000002.1/3411-3594 Pseudomonas balearica DSM 6083 genome assembly, contig: Ga0056079_102 
CAGCTAACGGAAAAGTATTCCAATTCGGTTTAACGGCCCGGCAGATCCGGTCGGCAGAATCCGAAAAACGGACTAATACTTGAAATCACTGGCGAGACATTCCCCCCACTGTCTGGCCAGTCGAGACCGTGAGGACCGCGTTCTCGAAACTCCTAATGGTCTTGACCCGGCTCCCTCAGGCCGG
>JH836242.1/293875-293781 Erinaceus europaeus unplaced genomic scaffold scaffold00954, whole genome shotgun sequence 
CTCCGGCGCAGGGCGGCCACTGCCCCCCGCACACTGCGCTGCTCCGACCCACTGTGCGTGTGACAGCGGCTGTCCTGTCCTGGCAGCGCGACCGG
>CH672395.1/1696787-1697001 Leeuwenhoekiella blandensis MED217 scf_1099517004314 genomic scaffold, whole genome shotgun sequence. 
ACTTCGCAAACGTATTTTGGTGGTGTTTTTTGTTTTTAAAAACACCTTAAAAGGGAATCAGGTGCTTCTTTGTAAAAATCCTGAGCTGTTCCCGCAACTGTAAGCTTAGTTCGTAAAAGAACGGTAAAGATCGTCTTACACCACTGTCAATATTGATGGGAAGGTTTGATCTTTATACGCGAGCCAGGAGACCTGCCAGAAGAAACTAATAACTA
>AZAQ01029315.1/12443-12290 Stegodyphus mimosarum contig29315, whole genome shotgun sequence. 
ATACTTACCTGGCACTGGGAACGCCTTGATGAACAAAGAGGCTTCCCGAGCAGAGGGCTCCCGTTGCACAGCGAGAGGTTGACGTTCGCTACACTCGCCGTAAATTGGGCAATTATTTCCTAGCGTACATGGAGTAGCATCAGATGCCAATGGA
>ALWZ045079265.1/261-1397 Picea glauca, whole genome shotgun sequence. 
AAGATTTTGTGCGTTTCTCTCTCTACGTTCCGGATTTCGTAGTGACGGATTTATGAGTAGATTCGATCGAAGAAGTTACAAATTGTATGATGGAAAAACCAAAGTGAACCCTAGGTACACCTCATTTCGGTGGTCCCGAAATCAATAGGGTAGTCCCGGGTTATCACTGATAATTTCGAGATGAATTCTCCGTAATTGTGTGTTCATCGGAAATAGCTGGTTTTCCGCGAAATCCATTTAAGTGGAGCGTCTAATGTTCAGGCCCGAGGTAGAGCACTCAATGGGCTAGGGTGGCCAAAAGCTTTACCAATCCCAACGAAACTCCGAATACAGGTCTCTGCAGTTAGTACAGACAGACTTTGGGTGCAAAGATCCAAGGTCGAGAGGGAAACAGCCCAGATCGTGCGCTAAGGTCCCAATGCAATTACTTAGTGTCAAAGGTAGTGATCGCGCGATGACAACCAGGAGGTAGGCTTGGAAGCAGCCAGCCTTTGAAGAAAGCGTAATAGCTCACTGGTCCAGCTCCGTAGCACCTAAAATGTATCGGGGCTAAAGTAATTCACCGAAGCGACGAGACTAGTCTCCGAGATTGATAGCTCGGGAAAGTGAGAACCTTGAAAGCACACAAGTAGCTCACGTAGTCTATATGGTCCAGATAGTGTCTAACTAAGCTTATTCAAGGGTCAGTAGCGGAACGTTCCGTATATCGGAGAAGGGGCTACACCTGGAGGKATCAGAAGTGAGAATGCTGACATGAGTAACGATTAATCGTGTGAAAAACACGATCAGTTCACGGGTTTTCACGTTCAGTCAATCTACGTGGAGTGAATCGGTCCCTATAGTGGGAGATGTAAGCACGAGTTACTCCGGCAGCTGTTTTATGGCCCCCGCTGATAGACTAGGGGCTAACCTGATCTTTCTACTGTTGCCACCTATACGCAATTGTTTATTAAAAACACAGGACTCTGCTAAGTGGAAACACAATGTATAGAGTCTTACATCTGCCCAGTACTGGACATCGTATTATGGGTTTCTGTCACTTTTCCCTAGGGAATAAAACTAGATAGGTCAGTTATTATAAGTAAATTCTTGGAGATTTCCTGATTCCGAAAGCTGCCGGTGCACTTGGCCACCTTC
>GL945483.1/1284982-1284843 Serpula lacrymans var. lacrymans S7.3 unplaced genomic scaffold SERLA73scaffold_10, whole genome shotgun sequence. 
GGCCGACTAGCTCAGTTGGTTAGAGCGTCGTGCTAATAACCTAGGCACAATGGATCAGACCACCATGCATTTGCATGGTGGTCTGATCGCTGGCCTTGTGTCATACGCGAAGGTCTTGGGTTCGATCCCCACGTTGGCCA
>URS0000D6AED6_12908/1-65 unclassified sequences c-di-GMP-II-GAG riboswitch 
CGGGAAGCUCUGACACGCGGUCCCGGCCGCCGGGACCGCGCCGAGCCACUGGCGAGACCGACCCG
>ALWT01224760.1/3828-4038 Myotis davidii contig224760, whole genome shotgun sequence. 
ATCGCTTCTCTGCCTTTTGGCTAAGATCAAGTGTAGTACAAGTTCTGGTACATAGTAGGGTTCTGCAAGATAGCAGTGGCCATTACTATTATTATGATTAATCATGACCATTGCTATTAAGTTTTCATTGCAAAGTAATGGTATTAGGTGATGAGGAAAGGTGTGTATCTGGTGTGGGAAATGGGTGGGACTTACATTTATTATATGCCTA
>KV453843.1/252671-252748 Tortispora caseinolytica NRRL Y-17796 unplaced genomic scaffold CANCAscaffold_3, whole genome shotgun sequence. 
GACAGTGATGAAAAAAATTACTCACAGACCTGTACTGAACATTTCATGTGGATAAAGCAATATTGCCTTTTTCTGAGT
>ABCM01000001.1/368790-368897 Pedobacter sp. BAL39 1103467000516, whole genome shotgun sequence. 
TACTTATAAAGAAAGACTGAGGGAAAGGCCCTGTAACGTCTTAGCAACCTGTACTAGCCGGAAGTAAAAGGTGCTAATTCCTACTCTGTAGAAAGAGAAAGATAAGTT
>CP002512.1/771378-771640 Aerococcus urinae ACS-120-V-Col10a, complete genome. 
ACACACCCATTGATAGGGAGAGTAAGTGTTAAACACTTTGAAGAGAGGTTCCGTTTGGTGAGAGGAACCAAGTGAAAGGCGCTGAAGATGGCCTTTGAGGGTATCTTGTCAATAAGTAGACAAGGTCGGCTGGGCTCGGTCGATAGAAAGAGCGCTAGTCTAGGCATTATCGCCTATGGCTAGGTCGAGGGAGTAGCTACTACTATACTTATTAACAGTAGTACTCTGAACAAAAGGTGGTAACACGATGCGTCGTCCTTTAC
>CP017623.1/2830701-2830798 Candida albicans SC5314 chromosome 1 sequence. 
TTGGCTATGATTATTTGCATTATATTACCAATTGTTCCAACTGAATATCCCGGGTTGACAACCGCATTATCGTTAAGTTTCAGCCTTGTCTGAGCCTT
>ALWZ041464526.1/1-432 Picea glauca, whole genome shotgun sequence. 
ATAACCGTAGTAATTCTAGAGCTAATACCTGCACCAAGTCCTGAATATTTGGAAGGGATGCATTTATTAGATAAAAGGCCGGTGTGGGCTTGCCTGCTTCTCCAGTGAATCATGATAACTCGACGGATCGCACAGCCATTGTGCTGGCGATGCTTCATTCAAATTTCTTCCCTATCAACTTTAGATGGTAGGATAGAGGCCTACCATGGTGGTGACGGGTGATGGAGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAATGGATACCACATCCAAGGAAGGCAGCAGGCGTGCAAATTACCCAATCCTGACATGGGGAGGTAGTGACAATAAATAACAATACTAGGCTCATCGAGTCTGGTAATTGGAATGAGTACAATCTAAATCCCTTAACGAGGATCCATTGGAGGGTTCACTGTCCCCTCCTCT
>ABDH01025731.1/1497-1292 Termite gut metagenome tgut2b_Contig26382, whole genome shotgun sequence. 
TCCATCGTGAGGTGGAATCTGAAGGAAGCCGGAGGCAAAGTCCCGGGCCGACGAACAGAAACCGCATATAAGGCAATGCAAGGCGGACGAGTTTGCATAACAAAACGAAGTCCAAAAAGGCCGGGGAGGAAGAAAACAGACTCCGGTTTTACTGCCCGAACCTTGCAGTGTAGATGCGGCGGCTATATGGGATGAAGGTTATCAGC
>AFFK01018367.1/6133-5846 Strigamia maritima strain Brora ctg7180001228879, whole genome shotgun sequence. 
AGGCGTGTGTCTGAGACACATCTGAACATTGATCGCTGTTATTAGGCAGATCTGCTCAGAGGTAGTGTCCCTTAACCACACAAGACCATATTGAGTCGGTATTCCCGCTGCCACAGTACGCACGGTACGAGTACCTTCTCACACAGTTGCGCCCCAAGCGCATATCAGGGTATAAATCTGGCCGTTCTCCTAGCTTAGCTGTTTCAAAATTGGGGAAGTTTGCTAGCATCTTCCATGATTTAAGACGCCACCAATAAAGGCGCTGAGTGTGTCAGCCTGCCTTTTAAT
>CCCW010037878.1/9850-6604 Brassica napus, WGS project CCCW01000000 data, contig: 6310 
TCTTTTCAAGTTTCATGTGATCAAAACTCAACATTCCTCCAAATACGTATTCTCCCAAAAGCTTGGTTTCAGATTCTGACTTTTACACTCTTGACAATTTTATTCCGAAGGGCGGGGTAATACAGACTGGGCCCTAGTTCCCTGGAAAGGGCGCCATTGAGGGTTAGAGCCCCGTCGTGCCTGGACCCTGTCGCACCACGAGGAGCTGTCGACGAGTCCAAGTCTGCCGATCGGGCGGTAAATTCCGTCCAAGGCTAAATATGGGCGAGAGACCGATAGCGAACAAGTACCGCGAGGTAAAGATGAAAAGGACTTTGAAAAGAGAGTCAAAGAGTGCTTGAAATTGTCGGGAGGGAAGCGGATGGGGGCCGGCGATGCGTCCCGGTCAGATGCGGAATGGAGCAATCCGGTCTGCCGATCGATTCGGGGCATGGACCTACGCAGATTAAGGTGGTGACCTAAGCCCGAGCCTTTTTTACGCCCGCGGAGACGTCGTTGCCTTAATTGTGGTCTGCAGCACGTGCCTCACAGCGTGCCTCGGCATCTGCATGCTCAGGGCGTCGGCCTGTGGGCTCCCCATTCGACCCGTCTTGAAACACGGACCAAGGAGTCTGACATGTGTGCGAGTCAACGGGTGAGTAAACCCATAAGGCGCAAGGAAGCTGATTGGCTGGATCCCTCACGGGTGCACAGCCAACCGACCTTGATCTTCTGAGAAGGGTTCGAGTGTGACCATGCCTGTCGGGACCCGAAACGTAGTGAACTATGCCTGAGCGGGGCGAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCGATACTGACGTGCAAATCGTTCGTCTGACTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCTCGGAAACGAGTTCTATCGGGTAAAGCCAATGATTAGAGCCATCGGGGATGCAACATCCTCGACCTATTCTCAAACTTTAAATAGGTAGAGCCATCGGGGACGCAACATCCTCGACCTATTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGGAAGCCGGTTACGGTGCCCAACTGCGCGCTAACCTAGAACCCACAAAGGGTGTTGGTCGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCCCTAAGGAGTGTGTAACAACTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTGAAGCGTGCAACCTTTACCCGGCCGCCAGGCCTCGATGAGTAGGAGGGCGCGGCGGTCGCTGCAAAACCTAGGGCACAAGACAAGGCAGAGCGGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGAGTCGGGGGAAACCCGTCTGATAGCGCTTATGCGCGAACTTCGAAAGGGGATCCGATTACAATTCCGGAACCGGGACGTGGTGGTTGACGGCAACGTTAGGGAGTCCGGAGACGTCGGCGGGAATTCCGGAAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCCTGGAAACGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCGCACGTCGCGTGGTGTCCGGTGCATTCCCGGCGGCCCTTGAAAATCCGGAGGACCGAGTGCCGCTCACGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCGATGGAACAATGTAGGCAAGGGAAGTCGGCAAAATGGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGGCTGGGCTCGGGGGTCCCAGTTCCGAACCCGTCGACTGTTGGCGGGCTGCTTGAGCCGCTAACGTGGCGAGAGTGGACCTCCTCGTGTCAACCGGGGGACGGACTGGGAATGGCTCTTTCGGGAGCTTTCCCCGGGCGTCGAACAGCCAACTCAGAACTGGTACAGACAAGGGGAATCTGACTGTTTAATTAAAACAAAGCATTGCGATGGTCCCTGCGGATGCTAACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGCGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTACCACAGCCAAGGGAACGGGGTTGGTAGAATCAGCGGGGAAAGAAGACCCAACTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAGGTGTAGAATAAGTGGGAGCTCCGGCGCAAGTGAAATACCACTACTTTTAACGTTATTTTACTTACTCCGTGAATCGGAGGCGGGGTAACAACCCCTTCTTTTAGACCCAAGACTCGCTTCGGCGGGTCGATCCGGGTGGAGGACATTGTCAGGTGGGGAGTTTTGCTGGGGCGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTTCAGTATGAATACGAACCGTGAAAGCGTGGCCTATCGATCCTTTAGACCTTCGGAATTTGAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCACTGTGAGACAGAATTCAACAAGTGTTGGATTGTTCACCCACCAATTGGGAACATGAGCTGGGTTTAAACCGTCGTAAGACAGGTTAGTTTTACCATATTGATGCCCATCTCGCAATAGTAATTCAACCTTGTACGATAGGAACCGTTGATTTGCACAATTTGTCCTCGCGCTTGGTTGAAAAGCCAGTGGCGCAAAGCTGCCACTAAGTCAGAATCCGGGCTAGAAGCGACGCATGCGCCCGCCGCCCGATTGCCGACCCTCAGTAGGAGCTTCGGCTCCCAAAGGCACGTGTCGTTGGCTAAGTCCGTTCGGCTGAAGCGCCGTTCGGACCGCCTTAATTTATAATTACCACCGAGCGGCGGGTAGAATCCTTTGCAAACGACTTAAATACACGACGGTGTATTGTAAGTGGCAGAGTGGCTGATGTGCCCCAGTCCATGGACCAGACCGATCAGAACGTTCTAGACGTCCCA
>ACJG01006097.1/11398-11489 Daphnia pulex DAPPUscaffold_154_Cont6097, whole genome shotgun sequence. 
GCCTGGCTAGCTCAGTCGGTAGAGCATGAGACTCTTAATCTCTCGCATGAGAATCTTAATCAGGGTCGGGGGTTCGAGCCCCCCGTTTGGCG
>CM000231.2/255777208-255777080 Rattus norvegicus chromosome 1, whole genome shotgun sequence. 
CAGCCTATTTCCAAGGATAGAGCTGGGTGTGGCTATGGGATCTCCAACTGCAGGCCAGAGTAATTGGAGAGACTTTAACAGCAGAGGTCAACACAGTGCCTGCGGCTGCCACTTGCTTTTCCTGTATGT
>CYZX01000011.1/96755-96903 Clostridium disporicum strain 2789STDY5834856 genome assembly, contig: SCcontig000011 
AACTAAATCAAAGATTTAGGATCTCACTTAAGTTGACGAGGATGGGGAGTATCGAATTCTTCGGCGGGTGCCCCACGGTATCGCACTACCGTTAACAGTTAGTAAATCTATGAAGTGATTTGTAGGACAACACTAACTTGGTGTTAAAA
>KN838613.1/75725-74394 Laccaria amethystina LaAM-08-1 unplaced genomic scaffold K443scaffold_78, whole genome shotgun sequence. 
TACCTAACAGAATTTACAGGTATTCAAGTAGCGTTGATTCAGTCAGATGGTTGGGGTTTGGTATGTCGGCTGGACCGATTCACCATGGTCGTGGCTTTGTATGTCAGCTGGGCTGATCATCACACATGCATACTAGGTCTTATTAGGAGTTATATGTGGTATACTACATTCCAAATGACCGGAAACTGGCCTGGGTGAATAACTTTTCTACCTGGCATAAGTCTGGCGCGGCCTCTGGAAGGGCCTGAATTCCCCTGGTAACAGACGGAAATGTCTGAATTCAGAGGGGACACCTCATGTAGCCAGGTACGAAATCTTGGTGTCTGTCGTACCTGATTCATCTTGTACCAGGTAAGCCAGACACGTGCACATTTCCTGATGCTCTTGGTGAGCCGGCGTGCCCTTTATTGGTGTGTGTTGGGGAACCAGGACTTTTACCTTGAGAAAATTAGAGTGTTCAAAGCAGGCATTTGCCCGAATACATTAGCATGGAATAATAAAATAGGACGTGTGGTTCTATTTTGTTGGTTTCTAGAGTCGCCGTAATGATTAATAGGGATAGTTGGGGGCATTGGTATTGAGTCGCTAGAGGTGAAATTCTTGGATTGACTCAAGACCGACTATTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACAAAGGTTAGGGGATCGAAAATGATCAGATACCGTTGTAGTCTTAACAGTAAACTATGCCGACTAGGGATCGGGCGACCTCAATTATGATGTGTCGCTCGGCACCTTACGAGAAATCAAAGTCTTTGGGTTCTGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGATGGAAGGGCACCACCAGGTGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTCCAGACATAACTAGGATTGACAGATTGATAGCTCTTTCATGATTTTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGATAACGAACGAGACCTTAACCTGCTAAATAGCCAGGCCGGCTTTCGCTGGTCGCCGGCTTCTTAGAGGGACTGTCAGCGTCTAGCTGACGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGACAGAGCCAGCGAGTTTTTTTTCCTTGGCCGGAAGGTCTGGGTAATCTTGTGAAACTCTGTCGTGCTGGGGATAGAGCATTGCAATTATTGCTCTTCAACGAGGAATACCTAGTAAGCGTGAGTCATCAGCTCGCGTTGATTACGTCCCTGCCCCAACCGACCACTC
>AFEW01015811.1/2627-2450 Jatropha curcas cultivar GZQX0401 scaffold191_29, whole genome shotgun sequence. 
TGTCATGTTTTTCCACAGCTTTCTTGAACTTCTTTTTTCTTTTCTTTAATTTTTTCTTTCAAGAATCTCCCTCATTTTAATATGTATGAAAGAGATTCTTAAATGGAAGAATTAAAGAGGAGGAAATGTATACGTGTATTGTATAGGAGTTCAAGAAAGCTGTGGGAGAACATGGCAG
>JH226135.1/756984-757073 Exophiala dermatitidis NIH/UT8656 unplaced genomic scaffold supercont1.6, whole genome shotgun sequence. 
GCTCTCTTAGCTCAGTGGTAGCAGCGCCACACTAGTAGTTCCTAACATTACGAGATGTGGAGGTCACAGGTTCAAGTCCTGTAGGGAGCA
>AZGY01000051.1/130-3252 Aschersonia aleyrodis RCEF 2490 scaffold_51, whole genome shotgun sequence. 
TACCTGGTTGATTCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTCTGAGTATAAGCAATTATACAGCGAAACTGCGAATGGCTCATTATATAAGTTATCGTTTATTTGATAGTACCTTGCTACTTGGATAACCGTGGTAATTCTAGAGCTAATACATGCTAAAAATCCCGACTCCGGAAGGGATGTATTTATTAGATTAAAAGCCAATGCCCTCTGGGCTCTCTGGTGATTCATGATAACTTCTCGAATCGCACGGCCTTGCGCCGGCGATGGTTCATTCAAATTTCTTCCCTATCAACTTTCGATGTTTGGGTAGTGGCCAAACATGGTTGCAACGGGTAACGGAGGGTTAGGGCTCGACCCCGGAGAAGGAGCCTGAGAAACGGCTACTACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCCGACTCGGGGAGGTAGTGACAATAAATACTGATACAGGGCCCTTTCGGGTCTTGTAATTGGAATGAGTACAATTTAAATCCCTTAACGAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGTGGTTAAAAAGCTCGTAGTTGAACCTTGGGCCTGGCGGGCTGGTCCGCCTCACCGCGTGCACTAGTCCCGCCGGGCCTTTCCCTCTGCGGAGCCCCATGCCCTTCACTGGGCGTGGCGGGGAAGCAGGACGTTTACTTTGAAAAAATTAGAGTGCTCCAGGCAGGCGTATGCTCGAATACATTAGCATGGAATAATGAAATAGGACGCGCGGTTCTATTTTGTTGGTTTCTGGGACCGCCGTAATGATTAATAGGGACAGTCGGGGGCATCAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACAACTGCGAAAGCATCTGCCAAGGATGTTTTCATTAATCAGGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGACGATGTTATTCATTGACTCGTTCGGCACCTTACGAGAAATCAAAGTGCGTGGGCTCCAGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGAAATTGACGGAAGGGCACCACCAGGGGTAAACGTGCACTGTCTAAGCCGCAGTCAACTCTGCTCCAGAAAGCCGCCCGAAAGGGTCGGTGGTCGCCCCCCAACGCTGGCTAGTCCCGTCCGCCACCGCGCGGCGGGGCAACACCCTCAAACTGCCGGGGAACTCCTAAAGCCCTCGCTCCGGACGGCGCTGGGAAACCAGCGTCCGCTCACCAGGTTAACGACCTCGGGCATCGGAAGCAACGCGGGGGATGCTACAATGGACGATCCGCAGCCAAGCCCCTACGTGCGACAGCATACGGGGAAGGTTCAGAGACTTGACGGGGGTGGGTCGGGGACGCATGTCGGGACGCCTGAAGGCGCTGGAACACCGGCACGAGGGCGCTGGAGTCTCGCCCGCGAGGGGCTGGCACCTCCGCCTGAAGAGCGCTGGGATCCCGGCGACCGAGACGCCCGCATCGCCCACCGGCTTGAGGTAAAGTCCGCTGTCGCGCCAAAAGCGCGCCCCATGCGATGGATCATCGCTCGGCAACCACAACGGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTTAACACAGCGGGCAACGCTTGTTGCGTGTCTGGGCCTGGAATAGTGAGAGCCCGCCAGGGGGCGGCCTCGCTAGTATTCGTCCTTAACCCGCGCGGGGGGAGCCCCCCTACTCTGGGCGCAGGGAGCGGTCGCGCTACGGCGCGCCGCTTGGGCGGTGCAACACCAGCTGGTACAGGGAACGCCGACTACCCCTCGGGGGGCAAGGGCCGATCCTGTGGCGAGTCCGGGCTGCGCCGGACCGTCGCAACGCACGCCAAGCGGTGGGCTGGCTCAGGCTGGCTTAAGGTACGTGCTAATCCCACGGGGCAACCGTGGCCGCCCTGAATAGTTCCGAGTTTTACGAAGCAGGGCGGGGGCGCACCTCCGGGTGCGCTCGTCCGAGTCCACAGCGGGCTCGAGTGCCAGACACAATGAGGATTGACAGATTGAGAGCTCTTTCTTGATTTTGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGCTTAATTGCGATAACGAACGAGACCTTAACCTGCTAAATAGCCCGTATTGCTCAGGCAGTACGCCGGCTTCTTAGAGGGACTATCGGCTCAAGCCGATGGAAGTTTGAGGCAATAACAGGTTGACCTACACAGGCCTGTAGTAGTGGCGCCTCCGGTGGGACAGAGGGAAGAAGACCGCTAGTCCAACAGCATAACCCCCGTGAAGGGAGCCCTTCGGAATCGGGCGGGGGGGCGGCCACTGCCCGTGGCCGCTCGCTGTGGGCGACACCACCTGGTACAGAAGACGCCCACGGGGCCAATTCTGTGGCGAGTCCGGGTTGCGCCGGACCGTCGCAACGCGCGCTAAGGGGTGGGCCGGCGTCCTCTGCGGAGGCCCGGCTTAAGGTACGTGCTAATCCCACGGGAAGGAGAAACCGTGCCGACACACAGAGCCCCGATCGGCGAAGTGTGCCGGGGCGTCCCTGCGCAGCGTCGCAGGGCGCCGGTCTCGGGGGCACACAGGCTGCTTCAGCATGTCCTGGCCCCCCGAGGAAATGCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGACGGAGCCAGCGAGTACGCCCTTGGCCGGAAGGCCCGGGTAACCTTGTTAAACTCCGTCGTGCTGGGGATAGAGCATTGCAATTATTGCTCTTCAACGAGGAATCCCTAGTAAGCGCAAGTCATCAGCTTGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGAATGGCTCAGTGAGGCGTCCGGACTGGCCCAGCGAGGTGGGCAACCACCACGCAGGGCCGGAAAGCTCTCCAAACTCGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTCTCCGTTGGTGAACCAGCGGAGGGATCATTA
>CP022437.1/2870568-2870713 Virgibacillus necropolis strain LMG 19488 chromosome, complete genome. 
GTTACCTTTAATTCAGTCCTGTGAGACTGGCAAGGTGGAACAGATGAAGATCTGTTTTATAAATAAAACTCGGAAAGGTTTCTTCCTTTTGCGAGCCTTTTATTTGTACACTACACCTTGCCAGAATAGGCAAGGTGTTTTTTTGG
>GL385398.1/3795320-3795665 Gaeumannomyces graminis var. tritici R3-111a-1 unplaced genomic scaffold supercont2.4, whole genome shotgun sequence. 
ACATACGACCATACCCACTGGAATATACGGGATCCCGTCCGCTCTCCCCTANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCAAACCAGTGAGGGCCGAACTAGTACTCAGGTGGGTGACCACTGGGGAATCCTCGGTGTTGTATGTT
>AFEY01233609.1/1-1134 Sarcophilus harrisii ctg7180001910850, whole genome shotgun sequence. 
CCAGCCCCTGCCTCTCGGCGCCCCCTCGATGCTCTTAGCTGAGTGTCCCGCGGGGCCCGAAGCGTTTACTTTGAAAAAATTAGAGTGTTCAAAGCAGGCCCGAGTCGCCTGGATACCCCAGCTAGGAATAATGGAATAGGACCCCGGTTCTATTTTGTTGGTTTTCGGAACTGGGGCCATGATTAAGAGGGACGGCCGGGGGCATTCGTATTGTGCCGCTAGAGGTGAAATTCTTGGACCGGCGCAAGACGGACCAGAGCGAAAGCATTTGCCAAGAATGTTTTCATTAATCAAGAACGAAAGTCGGAGGTTCGAAGACGATCAGATACCGTCGTAGTTCCGACCATAAACGATGCCGACTAGCGATCCGGCGGCGTTATTCCCATGACCCGCCGGGCAGCTTCCGGGAAACCAAAGTCTTTGGGTTCCGGGGGGAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGAAACCTCACCCGGCCCGGACACGGAAAGGATTGACAGATTGATAGCTCTTTCTCGATTCTGTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCGATAACGAACGAGACTCTGGCATGCTAACTAGTTACGCGACCCCCGACGTGGTCGGCGTCCCAACTTCTTAGAGGGACAAGTGGCGTTCAGCCACCCGAGATTGAGCAATAACAGGTCTGTGATGCCCTTAGATGTCCGGGGCTGCACGCGCGCTACACTGACTGGCTCAGCGTGTGCCTACCCTACGCCGGCAGGCGCGGGTAACCCGTTGAACCCCATTCGTGATGGGGATCGGGGATTGCAATTATTCCCCATGAACGAGGAATTCCCAGTAAGTGCGGGTCATAAGCTTGCGTTGATTAAGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGGATGGTTTAGTGAGGTCCTCGGATCGGCCCCGCCGGGGTCGGCCCACGGCCCTGGCGGAGCGCTGAGAAGACGGTCGAACTTGACTATCTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTA
>MEQV01000070.1/1472-1355 Betaproteobacteria bacterium RIFCSPLOWO2_02_FULL_62_17 rifcsplowo2_02_scaffold_16404, whole genome shotgun sequence. 
TAGCGGGTTGAAGTCCCGTCCGGGGAGTTGTCCGTACGCCCCGGTAGCTGAGGAAGCGGCGCCGTGGCAACACGGGGTCGTGAGTTTGCAAACAGCAAGAGAGCAGGCCGTAACGCAA
>GG738884.1/92380-92084 Naegleria gruberi genomic scaffold NAEGRscaffold_40, whole genome shotgun sequence. 
CTGGGCTACTGTAGGGAGGTAGCTGTTATGGTTCTCTGCCACAGCGTCAGGCAAAGGGATGGTTCTTCAGACTCATTCCTTTGTTAGCAATATGGTGACGATGTTCTGTCTGACCAATAGCGGTGTGACCATAGTATCTCCCCATGAATAAGGAGAAACTAGGGTCCTAATGAAAGGTGAACCGGTTGAGGCAGGATAACTGAGCAAATCATAGCCTTCACACTGTAGGATGGTCAGATTGCAGAACTGAGCATGAGCTATCAGAGAGTGAAATCTGGGAGTCAGACTAATGTTTTT
>GL349550.1/1-552 Thecamonas trahens ATCC 50062 unplaced genomic scaffold supercont1.118, whole genome shotgun sequence. 
TTTTGATTCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGCGTCGGATTGTTCACCCGCAAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACCGATGGAGCGTTATTGGGCAAGTAGAGCAACTCAGTACGAGAGGAACCGTTGTTCGACAGAATTGGTCTTGCGGTTGGTCGAGGGGCCACGCCGCGCAGCTACCCTGTCTAGGATTACGGCTGAACGCCTCTAAGCCGGAAACCATGCTTAGGCAAGCAGTAACGGGAAACTGGATGCAAGTGGCGAGCGGCGCAGAAGCGCAGAGTAGGGCAGTGCAAGCTGTCGGCAACGCGGGGGGGAGACTCGGTCCTTGCCTTTTTCATGAAGCTGTGGGGCAAGGGCTGGTCTTTGAGATGTGGAGTACGCGGTAGTCACTTGCGTGGATCCTCTGTAGATGACTTTGTTCGCATGGGGAGTTGTAGGAAGCTGAGTGGCCGAGTTTGCCACGAACTTTTGAGACCTTGCCCTATCTTTTTAGAGT
>MJEQ01002762.1/109736-109880 Nicotiana attenuata strain UT scaffold02762, whole genome shotgun sequence. 
AAAATAAGTGCCTCTTAGAAAGCCTCGGATGATGCCTACAATACCATTTTGTAGGATCATAAGCCTTTTAATTTGAAGTTTAAAACCCTACATAAATTAAGGTTTTAGGCAAGTCATCCTTGGCTATCAAAGCAAGCTCTTTATT
>FAOM01049750.1/126257-125942 Triticum aestivum genome assembly, contig: Triticum_aestivum_CS42_TGACv1_scaffold_049750_1BS 
TTTTTTTTAAATGTGCCATGTCATGCACATGTATTTTGTAAAAAAGAATGTCAGCATTAAAAATGCAATGTGTGTGATGCCTTGAACGTGATTATAAAAACACTATTGTTACTGACATGTGGTGACGGGTGACGGAGAATTAGGGTTCGATTCCAGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAAAAAGGCAGCAGGCGCGCAAATTACCCAATCCTGACACGGGAAGGTAGTGACAATAAATAACAATACCGGGCGCATTAGTGTCTGGTAATTGGAATGAGTATAATCTAAATCCCTACATCATCATAA
>AFYH01012672.1/16268-15971 Latimeria chalumnae contig012672, whole genome shotgun sequence. 
ACTCAATCTGTTATCATTTTTTCACTTACTTGGTGAGCCAAGTCCCAAGGGGCTCTCAATTCTGGTAACAAGTGCCTGGCTCAGCAGGGTGCGGCCCACTCCAGGGACAGTAGCAGGCGGAGAGTTTCACCAGGGCAGTACATCTGTCAAACAATAACACAGGTGTCCTAAAGCAAGTTCAGGGAGGACAGAAACCTCCCGTGGAGTAGAGGGTTTTGCCTCTGAGTCGGAGGGTTGCAGGTTCAAATCCACCTGGGGACCTTGGGATCTGTCAACTCCCCAGTATGGTATCTGGGGG
>KB846873.1/2237147-2237221 Nelumbo nucifera unplaced genomic scaffold scaffold00090, whole genome shotgun sequence 
GTCTTACACTTGATCTCTAAGGTAAGTTCATGTGTTGACAAGTACATAGAATAGAAAAAGCTCTGAAAGGTTGCT
>LKHD01000187.1/27860-29827 Candidate division Hyd24-12 bacterium Vib_1 contig65, whole genome shotgun sequence. 
AATGAAGCTACCAAGGGCATACGGTGGATGCCTTGGCACAGGCAGGCGATGAAGGACGTGGTAAGCTGCGATAAGCTCCGGTGAGGTGCAAGCAACCTTTGACCCGGAGATCTCCGAATGGGAAAACCCACCTGGAATAAAAGACCAGGTATCTCCTTACTGAACACATAGGTTTGGAGAGGCTAACCCGGGGAACTGAAACATCTTAGTACCCGGAGGAAGAGAAAGCGAAAGCGATTCCCTGAGTAGAGGCGATCGAAACGGGAAGAGTCTAAACCGAGCGGTGCGTGATAGCTGCGCAAGCGTTGCACCGCCGGGGTAGAGGGAAGTGTCCGGAGGATGCGTCACCTCGGATCGAAAAGCATGCTAGCAGAAGCTTCTGGAAAGTTGCTCCAAAGAGGGTGAAAGGCCCGTACGCGAAAGCATGCTCTGGATCTGGGACACTCTCCCAAGTAGCACGGGGCACGTGAAATCCTGTGTGAATCCGGGCGGACCACCGCCTAAGACTAAACACTCGCCTGTGACCGATAGTGAACTAGTACCGTGAGGGAAAGGTGAAAAGCACCCCTGGCGGGGAGTGAAATAGTACCTGAAACCGTGTGCCTACAAGCAGTCGGAGCAGACTTGTTCTGTGACGGCGTGCCTTTTGCATAATGAGCCGGGGAGTTGCTCGTACGTAGCGAGGTTAAGGCCGGGAGGCCGGAGCCGCAGGGAAACCGAGTCTGAACAGGGCGATTCAGTTGCGTACGGCAGACCCGAAGCCAGGTGATCTATCCATGGCCAGGCTGAAACTTGGGTAAAACCAAGCGGAGGGCCGAACCCACTAACGTTGAAAAGTTAGGGGATGAGCTGTGGATAGGGGTGAAAGGCCAAACAAACCTGGAGATAGCTGGTTCTCCTCGAAATAGCTCTAGGGCTAGCGTCGATGCAGTGTTCCGGAGGTAGAGCACTGGATGGGTTAAGGGGCCTACAAGCTTACTGACCCCAACCAAACTCCGAATGCCGGAACATGGTCTACGGCAGTCAGGCCGCGGGGGCTAAGCTCCACGGCCGAGAGGGAAACAACCCAGACCGCCGGCTAAGGTCCCCAAGCATACGTTAAGTGTATCTAAGGAAGTGGAGTTGCTTAGACAACTGGGATGTTGGCTTAGAAGCAGCCATTCATTTAAAGAGTGCGTAACAGCTCACCAGTCAATGCGATTCTGCGCCGATAATAATCGGGGCTCAAACGTATCACCGAAGCCGCGGACTGTCGCCTTGAGCGACAGTGGTAGAGGAGCGTTCCGTATGCGCTGAAGGTGTCCTGTGAGGGATGCTGGAGTGTACGGAAGTGATCATCCCGGCATGAGTAGCGATAATGCAGGTGAGAAACCTGCACACCGAAAGCCTAAGGTTTCCTGGGCAAGGCTGATCCTCCCAGGGTAAGTCGGGTCCTAAGCACAGGCCGAAAGGCGTAAGCGATGGGAAGCAGGTGAATATTCCTGCACCATTGTGTGTGCGTTCGAGCGATGGGGTGACGCGGAAGGTAGGGCCATCCGGGTGATGGATGTCCCGGTTTGCACCTGTAGGAGGGAGCGGCAGGCAAATCCACCGCTCCAACTCCGAGGGGTGTGACGAGAGCTTCGGCTCGCAAAGTGGTCGTGTCCATGCCGCCNNATCCTCAGGTGTTCGAGCTAACCCGGGTTAAGGAACTAGGCAAAATGGTCCCGTAACTTAGGGATAAGGGACGCCCGGTCTGGTGACGGTGTACAACCTGAGCCGGGCTGGGCCGCAGAGAAATGGCCTGGGCGACTGTTTACTAAAAACACACGTCTCTGCCAAGTCGTAAGACGACGTATAGGGACTGACACCTGCCCGGTGCTGGAGCGTTAAGGGGAGAGGTCAGAATACGCCTAACCGTGTATTCGAAGCTTTGAACCGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGA
>AMYB01000001.1/3357429-3357616 Mucor circinelloides f. lusitanicus CBS 277.49 MUCCIscaffold_01, whole genome shotgun sequence. 
CGTATCTGCCTTAGATCCTTTGTCAAGGTTTTGATGTTTATCATCCTAATCTACAGAGCTTATGTTTTGCTTTTCGTTGACAAAGCTTGAGTCATTCAGATACAAGATTACCTATACCTCCATCTCGGTCCAGTTTTATGGCTTCTTGGCTGTCTGTACTCTGTAGATTTTGCTTATATGGATACTTG
>BBIW01000001.1/9239-9376 Paenibacillus sp. TCA20 DNA, contig: PspTCA2nb01. 
GACTGATAACTGCCGAATTCTCGCACCAAGAAGCGGGGGACCCGACCATTTATGGGTGAATTGATCAATATTAAAGTGATCATAGGGAACCTTCAACCGAATCCTTAGCTAACCTCGCAGGCATTGGAAGGAGTATTA
>ALWS01013471.1/7379-7260 Pteropus alecto contig13471, whole genome shotgun sequence. 
TCATACGGATAACTTCCAATTAAAATTCAGGACTACAGCCTGATCTCAGAAGCTAAGCAGGGTTGGGCCTGGCTATTACTTGGATAGGCGACCACCTAGGAAGACCAGGTGCTATAGGTG
>LOER01000038.1/6182-6000 Desulfitibacter sp. BRH_c19 BRHa_1005201, whole genome shotgun sequence. 
ATAATCCTGCTAAGTTCGTGTTAGGGCCGGTTATTTTGAAACCAACACTAAAACATTGGGAATTCGGTGTCTGGTTGAGTATGAAAAGCCTTCTGGGAAAGGAATTCAAAACCAACTAGCAGAGTACCCACCTGCGTAGGCAGGTTTCTCAAAATTCCGGCAAACGGCTAGAGCGGGAGATGC
>GL378346.1/56514-56307 Volvox carteri f. nagariensis unplaced genomic scaffold VOLCAscaffold_25, whole genome shotgun sequence. 
TGCATTCACCGTTTTCGAAAACTCGCAGGCCGACAGCCCCAAGCAGGCCATCAGCAATGCGAACATTGTTCACGACTAAAATATCTGCCCTATCCACTTTCAATGGGAGGATTGAGACCTACCATGGTGGTAGCGCGTGACGGAGGACTAGGGTTCAATACCGGAGAGGGAGCTAGAGAAATGGCGAACACAACCAAGGAAGGCCGCA
>CM000392.2/29331781-29331980 Equus caballus chromosome 16, whole genome shotgun sequence. 
AAGGACGGAAACAGTGTCTTCTGCTTGATCCAGAAAGACGTTCCTCATAAAAGTCCGTAGAAAATTAAAATCTTCCACAAGAAGGAGGGGCGGCGTTCTCTCCTGAGTGTGAAGCCAGCTCTTGGTGTTGCTTCACTGCAACTGCCATTTGCCATTCATGGTCTTGGGGAATAAGAGAGAGAGGACAGAGTCTGAGTGAT
>MNYG01000183.1/3075-2991 Deltaproteobacteria bacterium CG2_30_63_29 cg2_3.0_scaffold_12261_c, whole genome shotgun sequence. 
CTTGCCCTCCGCCACGACCAGCAAACAGAAGACGGCGCCGAATTCGGCGCCGTCTTCTGTTTGCTGGCTGACGCGGCACGTCAGC
>LJSX01000027.1/46243-46357 Rhizobiales bacterium HL-109 ITZY_scaf_197, whole genome shotgun sequence. 
CACTCTGGAAAGAGGCAGGTCGAGACAGGCCTGCCCACCGAAGGGCGTAACTCGGCAGTTTCGAAACCTGGTTTCGAGGGTTCCGAGGAAATCTCTCAGGTTACGGGACAGAGGG
>KL543181.1/848-2043 Capsicum annuum cultivar Zunla-1 unplaced genomic scaffold scaffold24819, whole genome shotgun sequence 
CGACCCCAGATCAGGATGGATTACCCGCTCAGTTTAAGACTATCAATAAATGGAGGAAAATAAACTTACAAGGATTCCCTCAGTAACGAAAAGCAAACCAAGAATAGCCAACCTTAGAATTGAGCGGCTTCATCATCCGAATTATAGTCTGGAGAAGCTTCCTCAGTGGCAGACCGGCCCAAGTCCCCTGGAAGGGGTGCTAGAGAGGGTGAGAGCCCCATTGTGCTCGGACCCTATCGCACCACAAGGCGCTATCTATGAGTCGAGTTGTTTGGGAATGCAGCCCAAATCGGGCGGTGAATTCCGCCCAAGGCTAAATACGAGCGAGAGGCCGATAATGAACAAGTACCGTGAGGTAAAGATGAAACTGAATTTGAAGAAAGAGTCAAAGAGTGCTTGAAATTATTGGGAGGGAAGCGGATGGGAGACGATGATATGCCCCAGTCAGATGTGGAACGGAGATGAGCCGGTTCGTCGTTCGACTCAGGGTGTGGACCAGCATGGATTGGGGGAGGCCAAAGCCCGAGCTCTTGGTACGCTCGTGGAATGCCGTCTCCTCAATTGTGGCAGGTAGTGCGTGCCTCCGATGTGCTTCAACATCTGCGCACTTTGGATGCTGGCCTGTGGGCTCCCCATTCAACCCGTCTTGAAACACAGACCAAGGATTCTGACATGTGTGCGATTCAATGTTCGAGTAAACCCATAAGACGCAAGGAAGATGATTGGTGGGATCCCCCTGAGGGGTGCATCGCCGACCGACCTTGATCTTCTGAGAATGGTTCTAGTGTGAGCATACTTATCGGGACCCAAAAGATGGTGAACTAGGCCTGAGCTGGGCGAAGCCATAGGAAACTTTGGTGGAGGCCCACAGTGATATTGACGTGTAAATCGTTCGTCTGACTTGCGTGCACCACATGCTAAGTGCACGGATTCACCAATGAACCATGGGCAAAATGGCCACTAAGGATTATGTGCTTGGCACCCGTATGCCCGTGCACCCACTGTGAGCACACTATGTATTCGGCACTCGCACACCACAACACCAATAAAACACCATGCCACATGCCCCAAAATGGATCGGCGACCCCTGCACCATGCAAAAATAAAAGGAACATAAACATGTGAGGGTTCATAACTAGTAACTTCGACAATTACAAAATAAATGCTTCCACCAAGGTTCGTTCATCCTAATACTT
>LQOK01000039.1/11515-11571 Mycobacterium bohemicum strain DSM 44277 contig_44, whole genome shotgun sequence. 
CCGGGCCCGGTTCCCGCTGGCCGACCAGGTGCAGCTTGCTGCCCGCGACCCGGCCCC
>CP010951.1/2115046-2114927 Ramlibacter tataouinensis strain 5-10, complete genome. 
GCCGCTGCTCCGGGGTGCGAGCGGCCCTTCGAAAGAAGGCCGGTATCGCTGAGATGGTGAGTCCAAACCCGTGAACTTGAACCGGTTCGTACCGGCGTAAGAAGAGCTGACAGTGTCCCT
>JH835735.1/956530-956203 Erinaceus europaeus unplaced genomic scaffold scaffold00447, whole genome shotgun sequence 
GGATGTGAGGGCACTCTGGCTGCGACATCTGTCCTCCCATTGATCGCCAGTGTTGATTCGGCTGATCTGGCTGGCTAGGTGGGTGTCCCCTTCCTCCCTCACTGCTCCATGTGTGTCGGTCCCGAAGCTGCGCGCTCGGTCGAAGAGAAAGAGGACAGCCTTCCCCGAATAGAGACAGACCGCTCTTCAGTTATACGAGTTATACGAGTAGCTGCACTCCCCTGCTAGAACCTCCAAACAAGCTCTCGAGAAACCTTGGGGCCTGGCGGTGGTGCACCCAATAAAGGACACATGACACAGTGTGCAAAGAACCTGGTTTGAGCTCCTG
>CP000517.1/489591-489403 Lactobacillus helveticus DPC 4571, complete genome. 
TTGGATTTAGTATAATTTTATCCGTAGAAAAGCTGAAGCGGTGGCTATCCCTCAAGGAGATGGTACTTATGAGTATTTTTTAACTCGTATTCCTATCTTAAAAGAAAGGAGAAGCCCTCGTGTCTGTATCAGATGCGTTACAGCTAATACTAGATTTCGGCTCATTTGTCGTTATACTAATCTCATTAA
>CM000798.1/58059981-58060079 Oryctolagus cuniculus chromosome 9, whole genome shotgun sequence. 
ATCACATCTTAGCCTTTTGGCTAAGATCAAGTGAGGAATTTTTCAGATTTAATTTTCATTACTACTATAAGTAGTAAAACTATTAAACTTGTAGCCTTC
>LM151543.1/11334-11803 Schistosoma mattheei strain Denwood, Zambia genome assembly, scaffold: SMTD_scaffold0002192 
ATGTTAGTAGTACAAAATAAGATGACGAATTCCCAACTGTTATTCAGGCTTGACTACTCGTATGATCCCTCGTTCAATAACTTATCGTCATTAAGTGTTAAATTTTCATCGATCTGTAAGCATCTGCTACGAAACCAGTATTTTTTTAGTGAAGTATAGTTTCGAATTGTTGTATTGTGCGGTTTGGGATACGCTGTTTATTTCATTTATTTATTTGAACACATAAATATTAGTTTAAAAGGGTACCGAATACATATGCGCCACACAAGTCAATTGATTTGTGTGTGAGCTGTGATACTACCCAGGTGCTCAGACCGAATGTTTTCATTGATCAGGAGCAAAAGTCCGAGTTTCGAAGACGACCAGATACCGTCGTAGTTGTGACCATAAACGATGCAAACTGACGATCAGCGTTTGTTCTATGATTGACATCGCGGGCAGTCCCCGGGAAACCTTTAAGTCTCTGGGCT
>EU622808.1/288-49 Bacillus phage Nf, complete genome. 
CAAGGTGCAACACTTCCTATAGTATGGCACATGATTGGGGTATATCCTGATTGAGTTCAGCCCACATGTCACGGGGATTGATAACCCTCTTACTAAAAGTGATTGTTTCTTTGTCCTTTGTAACAATGCCACTGACGAAACGTTAAAGCGTGGGTTTCAGTGGTATTTTAATTTGTTCACAGATGTAGTAAATTATAGGTACATAGATGTATAAATATGCAGTTACAACCCTGCCCTAAT
>FR853100.2/134335079-134334871 Gorilla gorilla gorilla genomic chromosome, chr7, whole genome shotgun sequence 
GCTGGGTGTGGTGACACGCGCCTGTAGCCCCAGCTACTTGGAAGGCTGAGGTGGGAGAATTGCTTGAACCTGGGAGGGAGAGATTGCAGTGAGCCAAGATTGTGCCACTGCACTCCAGCCTGNNNNNNNNNNCAGGCTGGAGTGCAGTGGCACAATCTCGGCTCACTGCAACCTCTGCCTCCTGGGCTCAAGCAATTCTCCTGCCTCAG
>CM000316.3/76140660-76140798 Pan troglodytes isolate Yerkes chimp pedigree #C0471 (Clint) chromosome 2B, whole genome shotgun sequence. 
TTATCAGCTTGGGATAATCTTTACCTGTTCCTTCTTTTGGAGGGCCAAATTAAGGACATGATTGGCGGTCTCACATCAGTATGCGATTAACGTCTCTGAGTAGATCAGGAACTTCCAGTACCCTATTGTGCTATCTGAT
>KE713303.1/22354-22189 Biomphalaria glabrata isolate BB02 unplaced genomic scaffold LGUN_random_Scaffold3540, whole genome shotgun sequence. 
ATACTTACCTGGCATAGGCGGACAATGATCACAAAGGTTGTCCTCCCAGGTCGAGGCTCGTCCATTGCACTTAGGGCGGGCTGAAGCCTGCGACCACCCTTATCTTTTTTTATTCAAATTAAAAGCGCTTTTTTTTAATAATGATATCTTTTGAATGTAAATTTGC
>CM001013.2/117960327-117960221 Mus musculus chromosome X, GRC primary reference assembly. 
GATGCAGTCCCGGGCACCATCTTGGGACTGCTGCTGTAAGACCCCCTTTCGGGGACCCCCACTCTAGTATTGGGAGTGAGAGAGCACTCAAAGAAACATGAGAATCC
>MHZW01000213.1/12164-11957 Rhodocyclales bacterium GWA2_65_20 gwa2_scaffold_6804, whole genome shotgun sequence. 
ATGAATACAACAGACAGCGGCCCGGCTATAATCCGCCCCGATTCGGCCAAGAGAACACGGTGCAAATCCGTGGCGGGCCCGCCGCTGTAACCGGGGACGAACGCCGCCTGTCGCGAGACGGCCACTGCCGGGGACCACCCTGGCGGGAAGGCGCGGCGCTTCGGACGATCCGGGAGCCAGAAGACCTGTCGAGTCCTTTTCTCGAAAC
>LMSD01000007.1/142068-141895 Paenibacillus sp. Soil750 contig_15, whole genome shotgun sequence. 
TGTGCCTTTAAAAACAGTCCAGAGAGGCTGGCAAGGTAAAACGATAAGAAAAGTCGGGTAATGCTGAATCGAGAATTCAGTAAGCTTACGGATGTGCGCATCCTACAGCCCCGCTCTATCTCTTTATGCACTCGTAAACTCCTTGCCAAGAATTGGGCAAGGAGTTTTTTGGTT
>FWYF01000005.1/72068-71837 Reichenbachiella faecimaris strain DSM 26133 genome assembly, contig: Ga0069982_15 
AGATTTGCGGCAATTATTGGTTTTCGAAGGAAACGTATCCTGAGAAATTAAAAGGGAATTCGGTGAAGTGCTTAGCGCTCATTCCGAAGCTGTTCCCGCAACTGTAATTCGAAGATATCCTTGTGATATCATTTTTGATCTACCATTGCCACTGTCCTAATGAATCGGGATGGGAAGGCCGATCAAAAGATTTCGAAGAGCCAGGAGACCTGCCAGTAGTTATTATTTATCT
>CBUT010022175.1/1809-1930 Eimeria mitis, Houghton, WGS project CBUT01000000 data, contig: Emh_contig2519_2 
GCTGCTGCTGCTGCTGTTGCTGCTGCTGCTGGTGCAGCAGCAGCAGCAGCAGCAGATGAAGAAGGAGATAGGCTTCGGCTGCTGCAGCTGTGTGACCATTTGCTGCTGAAGAGACACACAGA
>CM001945.1/16929330-16929657 Chlorocebus sabaeus isolate 1994-021 chromosome 5, whole genome shotgun sequence. 
GCTGGGTGTGGTGGTGCACGCCTGTAATCCCAGCTCCTCAGGAGGCTGGGGCGTGAAAATAGTTTGAACCTGGGAGGCGGAGGTTGCAGGGAGCTGAGATTGCACCACTGCACTCCAGCCTGGGTGATAGAGCAAATGCTCTGGCTATTGTGTTGGCAGCAGATTGGAGGAAAACAAGAGTCGGAGGGTGAGACCTCTGAGCGAGTTACTTATGTTCAGACAGCAGTCCTGTCCTGAACTGCTGGAGTGCCCAGGCTGGAGTGCAGTGGCGTGATCTCTGCTCACTGCAACCTCTGCCTCCCAGGTTCAAGCTATTCTCCTGCCTCAG
>MTYJ01000796.1/4174-1035 Hypsibius dujardini strain Z151 scaffold0796, whole genome shotgun sequence. 
AGATAAAGCTACTAAGGCATAGGTGGTACCTTGGGGAAGTAGAGGCGATGAAGAGACGTCGGTGTACATCTGCGGATATTTGCTTCGGGGAGCTAGGTAAATAAGCTTTGTATCCGGAGATTCCGAAGTGGGGCAATCCCCTTTACATGAGATGTTGTAAATGACACTGCATGAGTTCAAGTAGTGCTGATGAGTCGACGCAGGCGAATGAAACACTCTAAGTTACCTGCAGCTGAGTAGAATCAAACGAGATTTTCTTGCAGTAGCGGCGAGCGCAGAATCGCAGAAGAGCCCAAAACCATTTGTGCGTGCACATTGGGGTTGTAGGATCTCGTATCAAGGGGAGTTAGTTAGCAAGAACGGTTTGGGAAGGCCGGCATAGAGAGTGAAAGCTCGTATAATACGAAAACTAACAACACCTGGCACGAGTATTCCCTGAGTAGAATCGGGGCACGTTGAAAACCCTGTTTGAAACTGGGGGGACCACCCTCCAAGCTACAAATACTACCTTACTACCACCGTAGTGGAGCTAGTAAACGGCGAGGGAAGGTGAAGAAAGAACCCCGATAGAGGCGGAGTGAAATAGATTTTTTGAAACCGTATGCTTACAAACAGTCAGGAGGGCTATTGTTAAAGCCTGATGACGTAACCTTTTGCATTTGATTCAGCGAGTTTATGGCTATGTGGCAGGTTAAGCCGTTGCGAGGGTGTAGCCGTAGGGAAACCGAGTACTGAAGTAGGGCGTTAAGTCGGCAGTGCTTGTAGAGCCCGAAACGGGATGACTGCTATCATGTTGCGGCAGGCTTTTTGAAGCGGAGGGTAAAACTTCGTATTGGACCTGGGACCGAACTCTTTGAAGGTTAAACTTTGGGATGACTGTGGATTAGGGAGTGAAAGGCTAATACAAACTTCGGAATAGCGGTTCTCTCCGAAAATCTATTTAGGTCATGCGTTCTAACGTATTTTCGGGGGTACAGCACTGACTATGGATAGAGGGTCACGCGTAGCTTACCAAACCTATTCAAACTCCGAATACCAGACGAGTCGAGCAGTGAGACAGATGCGGATGCTAAGTCCGTGGTCAAGAGGGAAAGAAACCCAGCCGCCAGTAAGGTCCCAGAAGATACATACTAAATCTGGACATGAAGTGAGCGAAGGTTGAAACTGACAGTCAGGAGGTTGCTTAGAAGCAGCCCACCCTTTAAAGAAGCCTCGTGAATAGCCACTGGACTTGTGGTTCTGCGGCCGAAAATGTAACTGGGCTTAAGTGTTCGTACGAAGCTACTGGACTTTTTTAAGTGGTAGGAGCACTTTGTGTGTGCCTTGAATGAAGGCGTACCGTACAGGAGCGTTGGGTCTCCACAAGAGCTTGATGCTGAATGAGTAGCGATTAAGGACGAGCGAGAATCTTCTCCCCCGTAATAATCTGGAAGGGTTCCTGGGCTCAGGTGGAATCCTCCCAGGGTAAGTCGGTTTCTAAGGCGAGCGCCGAAAGGCGTAGTTTCGCATGAACCATCAGGTTAATATTCCTGAACTTGTATGGTAAACGTTTGACTGGAAGGAGTGACGGAGAAAGATAGCAGATCTGGAGCATTGTTGTTCCAGATGTGAGGGTAGTAGGTGTGTGAGATAGGCAAATGCCGTCACAGTATATCACAAGGCCTTTGATTGCCGAATGCGCAAGCAGAGTCTGTTACTCTACGCCTTCCAAGAAAAAGTTCGCTAGGGAGTTATGTATTAATCCGTCGCTTAAACCCGACACATGGGTTATAGATGAGGAGAAATCCTAAGGTGATTGGATGAACTCTACGTTAAGCCCGCCCCTCTGGCAACTTAGATACTGGTAACTTCGGGAGAAGGCGCTGAATGTGAAGTCACTTGCTGACGTAGCATTATGAGGGTTGCAGTAAATGGGGTGAGCGACGTGTTTTTACCAAAAACAAGGGCCTTACTGCAACACGCAAGTGGAAGTATATTGGGCTGAGCGCTGCCGCGGTGCTGGAAGGTTAATGAGGTGGGTTATGCGCAAGCGCGCAAGCTTTTAAATTTTTGACAGTCCCAGTAAAACGGGCGGCGTAACATATACGGTTCCTAGTAGCGAATTTCGTTAGTCGGGTAAGTCGACCTGACGAATCGGCGTAACGGACTCCCCCTGTCGTCGAATCTGCGAGATCCAGCGAAATTTTGCGGTTGTGAGCGTCTGTGAAGAAACGCGCTTCGACCGCGCGGAGGATCCGAACAGAGGACCCCGTGAGCCTTTACTTGGTAAAAAAACCTTTTTGGTGGGGGCATTTGGGTTTATTCGGGAAAATAAAGGGGCCATGCGTCTAGGATAGGTGGGAGTTTTTGATCGTGCGTTCCGGCGAATTGAGCGTTCGGGGAGAACCAACCTTGGAAATACCACCCTTGCTTATTTTGGTAAGTCCATAACCTGCGGTCCTAATTCGCGGGCCGGGGGACAAATTGTCTGTGTGGGCACGTTTTGACTGGGGGGCGGTCGGCCTCACTAGAAAGAGTAACGGAGGCGCCGAAGGTCCTCTGAGCAGTTGGAAATCCGGCGAAAGGAGTGTAAACGCATTAAGGGAGCTTGACTGCGAGACAAACACGTCGAGCAGGAACGAAAGTCGCGGCTTAGTGATCCGGTGAGTTTGCCGAGTTGGAAGGGCCATCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATCTCCCCCAAGAGTTCACATCGACGGGGAGGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGAAGCAGGTCCCAAGGGTTTGGCTGTTCGCCAATTAAAGTGGTACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCCTATCTACTGTGGGCGCAGGAAATTTGAGGGGGTCTGTCCTTAGTACGAGAGGACGACCGGAGTGATGAACGAAACTCTGGTGTACTCGGTTGTCACGCCAGTGCATGCCGGTAGCTAAGTTCGGAAGATAAACCGCTGAAAGCATCTAAGCGGGAAGCTAGCCTAAGATGAGTTCCCTAGCACCCTTGAGTCCTAAGGCCGTTCGAGACCAGACGTTGATAGGTGGGGGTGGAAGCGCTAGTGTGAGCTACCATACTAATTCCGTGAGGCTTACCTAT
>KQ483358.1/2572342-2572106 Curvibacter sp. PAE-UM genomic scaffold Scaffold1, whole genome shotgun sequence. 
CGTAAAATCTACAACGTTGGTGCTCGCGGTGTGGTTCACATGCCGCAGTTCAACGGGAAGCAGGAAGGTGAGCCGTCATGGCGAGCCCAACCTGCGCTGCCCCCGCAACGGTAAGTGGACGAGCCGCAAGGCTCCGCTTTCATCACCCAGCCACTGGATGCCCTGAACAAGCGTCCGGGAAGGCGATGAAGGTTGTTTCCATCAGCCCGGATACCGGCCAATGAAGTGGTGTCGCGC
>AOLZ01000036.1/1-202 Halobiforma lacisalsi AJ5 contig_36, whole genome shotgun sequence. 
GTACCGGTTGTTCGAGAGAGCACGTGCCGGGCAGCCACGCACCACGGGGTAAGAGCTGAACGCATCTAAGCTCGAAACCCACCTGGAAACGAGATACCGCCGAGATCTCTCCTAGAAGAGGAGTTCGATAGACTCGGGGTGTACGCGCCAAGGCAACGAGGCGTTGAGCCCGCGAGCACTAATCGATCGAGCCACACACTCA
>AYZS02054104.1/146-603 Beta vulgaris subsp. vulgaris contig144508.1, whole genome shotgun sequence. 
GCATAAACCAGTTACAGCAATTGATGGATGCCTTGGCTTCATCAGGCGACGAAGGACGCAGCAAGCTGCGATAAGCTTCGGGGAGCGGCACGCACGCTATATATCCGAAGATTTCCGAATGGGGAAACCCGGCACCTCTCATAGGGTGTCACTTCGATCTGAATACATAGGGTCGATAGAGCAATACGTGGAGAAGTGAAACATCTCAGTATCCACAGGAAAAGAACGAGAATCGATTCCGTAAGTAGTGGCGAGCGAAAGCGGAAGAGCCCAAACCGCCGGGATTTATCCTGGCGGGGTTATAGGACCATAATGTGAGACCACAGAAGTTAGACGAACACTCTGGAAAGTGTGACCATAGCGGGTGACAGTCCCGTAGTTTAAAACTCGAGTGGCTCTATTGGTATCCTGAGTAGCACCGTACACGTGAAATTCGGTGTGAATTCGTGGCGACCACG
>JPJR01003066.1/1-928 Pseudogymnoascus pannorum VKM F-3808 contig_3066, whole genome shotgun sequence. 
GACTGTGAAGGAAACCCCGATCAATGGCGGCCTTATTTTGAGGGTCCTAAGGTAGCGGAATACCCTGGCCGTTAAATGCGGTCTTGCATGAATGATTTAACGATACAACAGCTGTCTCAATGATTGGCTCAGTGAAATTGGAATAACTGTGCAGATACAGTTTACCTCTAGTTAGACGAGAAGACCCTATGCAGCTTTACTGTTGCTAGTTATTGGATATGATTGAATTAATTTTAGTAGTATAAGGTAATTGGTTAGATATAATTGAAATACCTTTATTGTGTTTGTCATATTGATAGATTTAATCTATTTTCTTATCTAAAGATAGGAAATGACCCCTACTATGTTAGGGGAACAATGGCTAGGAGGCAGTTTATGCGGGGCACAGATCCCATAAAAAGTACCTGGGTGTATCCAAAGTTAATTTTGTAAAATTGACATGACTTACTTCTAAATTTATAATTTGGAAATAAGTTTTCATGACTAATAATACATTATATATTTAATGTATTTATTTTTAGTTTGTTATTTGGTATAGCTTATGCTATAACTAATCCAGCTATTTATCTATTAAGTTAGAAATATTTTTTTATCCAAGTAAGATTTTATCTATATGGAAAATAGATGTAATTAAAACATTGACGTAGATATCTTTCCAATGTTTTTTAATTTTTTTATTAGGTGTATTTGGTGAAACCAAACTACAAATTGCTAATAAGACAATTATGTTTATTACTTGTCAAGTTTAATGGCTTAATCTTGCTTTACTGTTTGACTTACACGTCTATCAGTCGCGTAAGCGGGGCATATGATCACAAGATGCAGAAAGGAAAGGTCTTGGATTTATGAAAAAGCTACGCTAGGGATGTTAGTCCTCCAATGTTTAAGTCTACTAATATTTATTATTGGGTTAATTAGACTTAAACTC
>CP009129.1/1242075-1242156 Planococcus sp. PAMC 21323, complete genome. 
TCATTGCTGCAACCGCTCGAATCAGGTTACGTTAAGAAGATGCTTCGGCAGATCACCTGAATAGGCGAGTCTTAATCTAGAG
>KM349742.1/1-304 Betacoronavirus HKU24 strain HKU24-R05005I, complete genome. 
GATAAAGTGTGAATCGCTTCCGTAGCATCGCACCCTCGATCTCTTGTTAGATCTAATCTAATCTAAACTTTATAAAAACACTAGGTCCCTGCTAGCCTATGCCTGAGGGTTTAGGCGTTGCATACTAGTGTCTTAGGAATTTGACTGATAACACTTCCCTGCTAACGGCGTGTTGCACTCTCAGTCTAAGCCTCCCACCCATAGGAGGTATCATGGCTAAGCGAGTCAACAAATACGGCCTCACGCTAAAATGGGCCCCAGAATTTCCGTGGATGTTTGAGGACACAGAGGAGAAGTTGGGTAA
>MFFM01000046.1/175782-172748 Candidatus Edwardsbacteria bacterium GWF2_54_11 gwf2_scaffold_695, whole genome shotgun sequence. 
GGTCAAGCTACAAAGGGCACATGGTGGATGCCTTGGCAGATGAAGGCGATGAAGGGCGTGGTAAGCTGCGATAAGCTTCGGGGAGGTGCAAACAACCTTAGATCCGGAGATGCCCGAATGGGGGAACCCGTTCCGAGTCATATCGGAACACGCCGGGATGAAAACATTAGGAAGTAATCCTGGAGAGCTAACCTGGCGAACTGAAACATCTAAGTACCCAGTGGAAGAGAAATCAACCGAGATTCCCAAAGTAGCGGCGAGCGAAATGGGAAGAGTCTAAACTCGGTCCTGCGTGATAGCTGATACGCGTTGCAGGACGGGGGTATCAGGGTCGTTACGGATCCCGTGTATCAACCGGGGTCGGGGAGTCAAAAAGTCGTTCCTTAGCCGAAAGGTCTGGGAAGTCCTACCATAGACGGTGAAAGTCCGGTAGGCGAAAAGGAAGCGATCTCCCTGGTTGCGATTCCTAAGTACCATGGGGCACGAGAAACCCTGTGGGAATACGGGGGGACCACCCTCCAAGACTAAATACTCTCATCTGACCGATAGTGAACTAGTACCGTGAGGGAAAGGTGAAAAGCACCCCTGGCGGGGAGTGAAATAGTACCTGAAACCATGTGCCTACGATCAGTCGGAGCCTCGATTTATTCGGGGTGACGGCGTGCCTTTTGCATAATGAACCGGCGAGTTGCTTGTATGCAGCAAGGTTAAGTCCTTCTGGGACGTAGCCGAAGCGAAAGCGAGTCTGAATAGGGCGATTCAGTTGCATGCAGCAGACCCGAAACTGGGTGAGCTACCCATGGCCAGGCTGAAGTGACGGTAACACGTCATGGAGGGCCGAACCGGTGAATGTTGAAAAATTCTCGGATGAGCTGTGGGTAGGAGTGAAAGGCCAACCAAACCCAGGGATAGCTGGTTCTCCTCGAAATATATTTAGGTATAGCCTCGGAAAGTATGTGGCGGAGGTAGAGCACTGACAGGGCAAGGGACCTTACCAGGTTACCAACCCCTATCAAACTCCGAATGCCGTGCACAGGAATTCCGGGAGTCAGGCAGTGGGGGATAAGCTTCATTGCCGAGAGGGAAACAACCCAGATCGTCAGCTAAGGCCCCTAAATATCAGCTAAGTGAGAAAGGATGTGGAATCTCATAGACAACCAGGATGTTGGCTTAGAAGCAGCCACCATTTAAAGAGTGCGTAATAGCTCACTGGTCAAGTCATTCTGCGCCTACAATACACGGGACTATTAAGCTGATTGCCGAAGCTGCGGACTTGATTGATGTTCGCATCAGTCATTTGGTAGAGGAGCGTTCCACAGTAGGATGAAGCGGTGCCGTAAGACACCGTCGACGAGCTGGAAGTGAGAATGCCGGTATAAGTAGCGATAAACCAGGCGAGAAACCTGGTCACCGAAAACTCAAGGGTTCCTGGGGAAGGCTAATCCGCCCAGGGTAAGTCGGGCCCTAAGCCGAGGCCGAAAGGCGTAGGCGATGGAAATCCGGTTAATATTCCGGAACCACTGGTAAAGCGTTATCACCTAAGGGGGGACGCAGGAGTGAGATCCCATCCGCGATTGGAAGTGCGGGTCTAAGCTGGTAGGGGGATCCTGTAGGCAAATCCGCAGGGTCGTTAACCCCGAGAAGCGATGGGGAGTCCGTAAGGACATAAAAGGGATCGAATCACGCTGCCAAGAAAAGCCTCGTAGGGAGTTTTGCCGGTGTCCGTACCGTAAACCGACTCAGGTGAGTGAGAAGAGTATTCTAAGGTGCTCGAGATAACCTCCTTTAAGGAACTAGGCAATTTAGCCCCGTAACTTCGGAAGAAGGGGTCCCCGATTCTGTTAGGTAAATTCTTGCTGAAGCAGATTTGGGGCGCAGTAAATGGGCTCGAGTGACTGTTTATCACAAACACACGACTCTGCTAAGCCGATGAGGCGAAGTATAGGGTCTGACACCTGCCCGGTGCCGGAAGGTTAAGAGGAGAGGTCAGCCGCAAGGCGAAGCTTTGAATTGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGTGTAACAACTTGAGCGCTGTCTCAAAGGAGGACTCGGCGAATTTGTAGTGGCGGTGAAGATGCCGCCTACCCGCAGATGGACTAAAAGACCCCGTGAACCTTTACTGTAGCCTGGCATTGAATTTTGGTAAGGCATGTGTAGGATAGGTGGGAGACACTGAAGCTGGGGCGCTAGCCTCGGTGGAGTCGACGTTGAAATACCACCCTTGTGTTATTGGAATTCTAACCTAAATCAGTGAATCCTGGTTGGGAACCGTGTCAGGTGGGCAGTTTGACTGGGGCGGTCGCCTCCTAAAGAGTAACGGAGGCGCGCAAAGGTTTCCTCAGCGCGGTCGGTAATCGCGCTTATAGAGTGTAAAGGCATAAGGAAGCCTGACTGTGAGGGAGACATTCCGAACAGACACGAAAGTGGGCCTTAGTGATCCGGTGGCTACACGTGGAAGCACCATCGCTCAACGGACAAAAGGTACTCCGGGGATAACAGGCTGATCTTGCCCGAGAGTTCACATCGACGGCGAGGTTTGGCACCTCGATGTCGGCTCATCGCATCCTGGGGCTGGAGAAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCTCTATCCTCTGTGGGTGTAGGAGATTTGCGAGGATCTGTCCTTAGTACGAGAGGACCAGGATGGACAAACCTCTAGTGTACCAGTTGTTCCGCCAGGAGCAATGGCTGGGTAGCTATGTTTGGTCGGGATAACCGCTGAAAGCATCTAAGTGGGAAACCCACCTCAAAACTAGATCTCCCTTCCTGTTTATTCAGGACTGAAGGCTCCCTGTAGACTACAGGGTTGATAGGCCACCGGTGTAAGATCCGTAAGGATTTCAGCCAAGTGGTACTAAATTGGCCGTGCGGCTTGATCAT
>CM001436.1/1586328-1586399 Methanoplanus limicola DSM 2279 chromosome, whole genome shotgun sequence. 
GTCCCGATAGGGTAGTGGATATCCTAGAAGCTTGCGGAGCTTTTGACCCGGGTTCGAGTCCCGGTCGGGGCG
>HG764817.1/91383-91181 Clostridium ultunense Esp genomic scaffold, CULT_3033 
AACTTCATATCTCTTTTAGGTCACTTAGTTGACTCGCTAAGTGTTAATAGGGAAGTCCGGTGGAAATCCGGCGCGGTCCCGCCACTGTAAGCAGGGAGAGACGTTTAGGCCGAAAGGCAGCCACTGTGTACCGTCGTGCATGGGAAGGTGAACGAATCGAGGAACTGCAAGCCAGGAGACCTGCCTAAAAGAACGGCAAGTTC
>FOGW01000010.1/58334-58502 Lachnobacterium bovis strain S1b genome assembly, contig: IE07DRAFT_scaffold00007.7 
TAAAGAGATAGAGGTTGCGCAAGTCAAAAGTACTTTGCTAGATGAAGCAAATCAGATGACAGTAGAGGAAAGGGGCAAGCGCCGAAAGGGTTATTTTTGCAGAATAATTCTTGGGCATAAAGTTAATAGCTTTATGACTGTCATCGTAAGATGGAGTGCTATCATATAA
>FR883370.1/19793-19582 Clostridium sp. CAG:221 genomic scaffold, scf18 
TATTGAAGGAATTAGTATGGTGCTTTTAGTTTATAAATATAAATAGGCAAAAGTTAAAAGGGAATGTGATGAAATTTCACAACAGCCCCCACTACTGTGATAGAGGATGAAAGCTAAAATTATAAATTCCATTGAGAGATTTTCTTGAGAAGGAGTTTAGTGAGTAAAGAGATTCTTAAGTCAGGAAACCTGCCATAACTTTAATAGTGTTT
>CP013068.1/4601278-4601164 Pannonibacter phragmitetus strain 31801, complete genome. 
ATACCCTACGGAGCGCCTGGGTCCGCCGCATCTCCTGGGTCCGTGGGGCAAGGCCGGCGCGGTGTCTGCCCGATGAGTGGCCTCCTCGGATTGGCAGTCCCGCGCCGGCCGCCAC
>AOCG01000006.1/51721-51599 Listeria aquatica FSL S10-1188 c5, whole genome shotgun sequence. 
AGATCCTTTAAATGTAGTCCAGAGAGGCTGAAAAGGTTAACGCTCATTTTGGAGAAGGTTCTCCATTTTAATTCGTGAGGTACGTCTATACCCTTTGCCGCTTTGGCAAAGGTTTTTTTTGTA
>AQHR01000110.1/102878-102980 Lunatimonas lonarensis strain AK24 S14_contig_28, whole genome shotgun sequence. 
TGCCCATCGGGTGATGGGGTGCCACCCAAATATCAGGGACTTATCCGAAGTTTTCTGATTTTTTGAACCGCTTCGCAAGAATGCTGATGACTCCTACTTCAAC
>FXAQ01000027.1/27875-27818 Paracoccus sp. J56 genome assembly, contig: M511DRAFT_scaffold00027.27 
CATGGAGCAGGGTGAAATTTCCGGCTGGGTTTTCCGGCCGCCTGTCCGCCGGACAACC
>HF986872.1/13619-13817 Firmicutes bacterium CAG:555 genomic scaffold, scf18 
CAAAACCGATAGGTATTCGGCTCTGGGCCAGCTCGATTAAAAGGGAATCCGGTTCGAGTCCGGAACAGCCGCCATTACTGTATTTGACACAACGGGAGTCCATTTTGCCATTGGTGCGGCCTGTCCTTCGGCGGGCGCATCGAGAAGGCGGGCTTTCCGGTCATAAGTCAGGAGACCTGCCGTGCTTTTTAGGTTTACA
>CM009307.1/3068679-3068534 Populus trichocarpa isolate Nisqually-1 chromosome 18, whole genome shotgun sequence. 
TTCAAAAGCTATTGGGTGTGACTGAGCAGCCGGATCCAACACTATTGGATCTTGTCATGTAGACCCTAAGCGATTGGGTTTTGTTGGGCAGCAGATTCCAATGTTGTTGAATCCTGCCAAGCTAGACTTAATAACACTTTTTGACT
>JSDP01000122.1/5559-5705 Aphanizomenon flos-aquae 2012/KM/D3 spades_262_len_T:9526, whole genome shotgun sequence. 
CACTCTCTACAGTCAGAGTTGATAGGAGGGATTCTATCAAGCGTACACCAGAGAGTCCAAACTCAAACCCAGTGATGTGGGTGACTATATCCAAATATAAAACCGAGCCAGTTAGCTTGGTAGGGAAACCGAAGACTTAACTGGCTC
>AYZS02017825.1/46586-46515 Beta vulgaris subsp. vulgaris Bvchr6.sca027.con0066.1, whole genome shotgun sequence. 
GTCTCTTCAAAGACATCTGATAAAATTGGAACGATATAGAGAAGATTAGAATGGCCCCTGCACAAGGATGAC
>CCCW010005528.1/2486-80 Brassica napus, WGS project CCCW01000000 data, contig: 38660 
CGGCCAAAATCACCCAAACAGTCCACGGGAAGGGCCAGCGTGCTGAGTCCAAGGACCAACGTGCTGATATGTGTACTGATGGACAGCCACTGACATCCTGTGTGTGCTGACGGACACACACGGACACACACAAACAGCCACGGACGTCCTGTGTGTGCTGACGGACACACATGGACGTCGTGTGTGTGCTGACGGACACCCACGGACGTTGTGGCTGCTTTGATAGCTGGAGCTCGGAAACGAGTTCTATCGGGTAAAGTCAATGATTAGAGGCATCGGGATGCAATTTCCTTGACCTATTCTCAAACTTTAAATAGGTAGGACGGGGTGGCTGCTTTGTTGAGCCATCCCACGGAATCGAGAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCCATGCGGGATGAACCGAAAGCCGGGTTATGGTGCCCAACTGCTCGCTAACCTAGAACCCACAAAGGGTGTTGTTGATTAAGACAGCAGGACGGTGGTCATGGAAGTCGAAATCTGCTAAGGAGTGTGTAACAGCTCACCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTAAAGCGCGCGACCTATACCCGGCCGTCGGAGCAAGAGCCAGGCCTCGATGAGAAGGAGGGCACGGCGGTCGCTGCAAAACCTAGGGCGTGAGCCCGGGTGGAGCAGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGAGGGGAAAGGTTCTATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGAGTCGAGGGAAACCTGTCTGATTGCGCTTATGCGCGAACTTCGAAAGGGGATCCGGTTAAAATTCCAGAACCGGGACGTGGCGGTTGACGGCTACGTTAGGAAGTCCAGAGACGTCGGCGGGAATTCCGGAAAGAGTTATCTTTTCTGTTTAACAGCCTGCCCACCATGGAAAGGGCTCAGCCGGAGGTAGGGTCCAGCGGCTGGAAGAGCACCGTACGTTGCGTGTTGTCCGGTGCATTCCCGGCGGCCCTTGAAAATCCGGAGGACTGAGTGCCGCTCACGCTCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTTGTCGATGGAACAATGTAGGCAAGAGAAGTCGGTAAAATGGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGGCTGGGCTCGGGGGTCCCAGTTCCGAACACGTTGACTGTTGGCGGGCTGCTTGAGCTGCTAACGTGGCGAGAGCGGACCGCCTCGTGTTGGCCGAGGGATGGACTGGGAACGGCTCTTTCGAGATCTTTCCCCGGGCGTCGAACAGCCAACTCAGAACTGGTACGGACAATGGTAATCCGATTGTTTAATTAAAACAAAGCATTGTGATGGTCCCTGCGGATGCTAACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATGAATCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCACATGAATGGACTAACGAGATTCCCACTGTCCTTGTCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAATGACTTGAGAAGTGTAGAATAAGTGGGAGCTCCGACGCAAGTGAAATACCACTACTTTTAACGTTATTTTACTTACTCCGTGAATCAGAGGCGGGGTAACAACCCCTTCTTTTAGACCCAAGACTCGCTTTGGCGGGTCAATCCGGGCGGAGGACATTGTCAGGTGGGGAGTTTGGCTGGGGTGGCACATCTGTTAAAAGATAACGCAGGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTTCAGTACGAATACGAACTGTGAAAGCATGGCCTATCGATCCTTTAGACCTTTGGAATTTGAAGCTAGAGGTGTCAAAAAATTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGTGTTCATAGCGACGTTGCTTTTTGATCCTTCAATATCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTTGATTGTTCACCCACCAATAGGAAACGTGAGCTGGGTTTAGACCGTCGTGAGACACGTTAGTTTCACCCTACTGATGCCCGCGTCGCAATAGTAATTCAACCTAGTACAAGAGGAACCGTTGATTCGCACAATTGGTCATCGCACTTGGTTGAAAAGCCAGTGGCGCGAAGCTACTGTGCGCTGGATTATGACTGAACGCCTCTAAGTCAGAATCTAGGCTAGAAGCAACGCATGCGCCCGC
>ALAR01193061.1/17763-17860 Tupaia chinensis contig193061, whole genome shotgun sequence. 
ATCCTTGGGTGGTTTATGAGTGTGATGGTTGGGCGTTCACACCATGTGTGAGATGAGTTCCTGAGCCTTGTTATGATGTGGCGCTGTCACGTCTGATG
>AAIZ01015480.1/2116-801 Drosophila persimilis strain MSH-3 cont1.015479, whole genome shotgun sequence. 
AGTCGGGCTTGATTGGGAACAATAACATGGTTTATGTGCTCGTTCTGGGTAAATAGAGTTTCTATCATTTATGGTAGTTACTTGTTCCCCGGATAGTTTAGTTACGTAGCCAATTGTGGAACTTTCTTGCTAAAATTTTTAAGAATACTAATTATGTTAAACCAGTTAGTTCTTATTAATTATAACGATTATTAATTAACAATCAATTCAGAACTGGCACGGACTTGGGTAATCCGACTGTCTAATTAAAACAAAGCATTGTGACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAAGTAAGCGCGGGTCAACGGCGGGAGTAACTATGACTCTCTTACGTGAAGCGGAACTTTTTCGTCCCCAACACGGCTGGGTGTGTCAGCCCACGCGTTTGCTAACAGGTCAAGATTACCGAAACGGTATCAAGCTGCGAATAAATGTCCTACCATCGAGGTCTCGTACCACGAGGGGCAGAAATGAATTGGAACGGCAATGTCGTGCAGGTTGTGATGCTCCCGAAACAACAAACCACATCCTGCAAAATTGTTACCGTACGCATGGGAGGCGGGTAGCAGGACATAACTGTGTAGTCAATAACCTTCAGAGGATTCTTGAGGAGAAGGGCCACACAGTGCACGTCGAACCAAGTTTGCAGCTGGAAACCTCGGTAAGTAAACCAGACCTGGTGTGTATCCGTGACAATCACGCTTGCGTGATTGATGCGCAGATTATAACAGATGGACTGTTTCTCGACGATGTGCACCATCGCAAAGTTGAGAAATATAAAAGACCTGAAGATATTTCTGCACTGCGGAGAGAATTCGGAGTGTCGGGCAACGTTGAAGTCCTAAACGCGACGTTAAACTGGCGTGGGATCTGGAGCAATCAATCCGTTAGAAAATTGATAGCAAAGGGTCTCATCTCATCCGGTGACAGCAATGTCATCAGCGCCAGAGTGGTAACAGGCGGACTATATTGCTTCAGACAGTTCATGTATCTCGCAGGTTACACGCGAGATTGGACTTAGCCTATACACTATGTTGGAGAGAAGACGCTTGCTACCTAGGCATAATGTGAAATTAGGTATAAACATCGTGGTTGTAAAACTTGAGGTGGGTTTTTAGTACGTATGCGTGATTACTTCGTAATCATGAATCGTGCATGCTAGTGGGGTTTGGCCTCCACTACTATCTTTGAAGATTTTCCTTCCTCAGCGATAAAAAAAAAAAAAAAAAATAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAATGAGATTCCTACT
>CP014135.1/3524579-3524757 Pseudomonas agarici strain NCPPB 2472 genome. 
ACCCCGGTATTATTGCTGTCATGGGTTTTAATCGAGCTTAGCCTTGTTCATTTTTTTACACAACACCCCATAAAAGATCCTACACGGCCCGCTCAAGCCTGCAGGACCCAAAGAGACGCAGAGGCAAAAAACGCCCAAAAACGCCTGAAAAAAGGCTCTGCGGTGCTTTCTCAGCACAA
>AFFG02002037.1/1014-1 Drosophila ficusphila Contig2037, whole genome shotgun sequence 
AGATCAGAAGAGATTTTAGATAGATCTCGCTCCTCAGCAAGGGGGAGTGTTTGCCCGACAAGCACACACTCGAATTGCTACCGGGATAGTTGCTACGTACATAGCTGTAGCTTCTATTTTGGGGCGTTGGTCTGGCGCTTAATCTAGACACATGCACTATATACATGGGTATATAAGAGTGTCGTGGCTGTACTCCCTTCAATGTGGAACACGCCACGTTAAATAAAACTCGGAGGGATCCGATCCACACCTGTCCCTATCTACTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGAATAATTAGCGGGGAAAGAAGACCCTTTTGAGCTTGACTCTAATCTGGCAGTGTAAGGAGACATAAGAGGTGTAGAATAAGTGGGAGATATTAGGCTTCGGTTTGATATCGCCAATGAAATACCACTACTCTTATTGTTTCCTTACTTACTTGATTAAATGGAACGTGTATCATTCCTAGCCATTATACGGATATATTTATTATATCTTATGGTATTGGGTTTTGATGCAAGCTTCTTGATCAAAGTATCACGAGTTTGTTATATAATCGCAAACTAAATCTTTAATAAAACGATGCATTTATGTATTTTTGATTTGAAAATTTGGTATAACTCCAATTACTCAGGTATGATCCAATTCAAGGACATTGCCAGGTAGGGAGTTTGACTGGGGCGGTACATCTCTCAAATAATAACGGAGGTGTCCCAAGGCCAGCTCAGTGCGGACAGAAACCACACATAGAGCAAAAGGGCAAATGCTGACTTGATCTCGGTGTTCAGTACACACAGGGACAGCAAAAGCTCGGCCTATCGATCCTTTTGGTTTAAAGAGTTTTTAACAAGAGGTGTCAGAAAAGTTACCATAGGGATAACTGGCTTGTGGCGGCCAAGCGTTCATAGCGACGTCGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAAAATTCACCAAGCGTTGGATTGTTCACCCATGCAAGGGAACGT
>URS0001A23A8E_12908/1-67 unclassified sequences L31-Actinobacteria ribosomal protein leader 
GCGGUUCCGGUUCACGCCACCAAGGGUCGGCCCGCCCCAUGACGGGUGACCUGGCGACCCGGCGACC
>URS0000D6C5EB_12908/1-87 unclassified sequences GA-cis RNA 
GACAGGCGAAATATAACAGCTCGAAGAGCTGTATTGTAATACATTTCGCCGCACAGCCGCCGAACGAAGTGAGGGGCAATACCGCTG
>MEDQ01000009.1/7811-8223 Bordetella sp. SCN 67-23 ABS43_C0009, whole genome shotgun sequence. 
AGAGCAGATCAGGCAGTCGCGGTGCCTTCGGGCATCGAGGAAGGTCCGGACTCCACAGGACAGGATGGCGGCTAACGGCCGTCCGGCGATCGCTGGGGCGCAAGCCCGGGCGCGAAGCCGAGGAATAGGGCCACAGAGACGAGTCTGCGGCGAGGGCGGACGATGTTCGCACCGGTACGGCCACTCCGTACCGTTCGCACGGGCAACCGTGCGAGTCGCGGCAGGGTGAAACGCGGCAACCTCCATCCGGAGCAACACCAAATAGGCATGCGCGCGGCTTCGGCCGCAATAGGGCGGTCCGCCCGAGCATGCGGGTAGGTGGCTAGAGCCGTCCGGCAACGGCCGGCCCAGAGGAATGACTGCCCGCGGGCGACGCCCGTGTACAGAATCCGGCCTATCGATCTGCTTTGCCT
>URS0000D69D6E_12908/1-58 unclassified sequences RAGATH-30 RNA 
GTAAAAATAAGATTTTGCCGAATATATTCATATAGATGAATCTGTTATGAAACAGAAA
>JH835302.1/8483619-8483740 Erinaceus europaeus unplaced genomic scaffold scaffold00014, whole genome shotgun sequence 
AAGACAGAGAAATAGAGAACATTAAAAACTAATCTGTATTTTTTGTAACTGGCGATAGCAATGCCATATTACAAGCCTTAATGACATTGGGGTCTTTAAGGTCCCTGAAAGTGGCTATATGA
>URS0001A239EB_186490/1-52 Candidatus Baumannia cicadellinicola L31-Gammaproteobacteria ribosomal protein leader 
CGUGUGGCUUAUAGUUAAAAUCGUCGAUAGCGACACAAUCUGACGAAUAGGU
>JH417673.1/4548-4310 Flavonifractor plautii ATCC 29863 genomic scaffold Scfld77, whole genome shotgun sequence. 
TTAAACGCAATGAGGGAGAAGAGTACTGCGGGGACTCAGTCCCAGCGAGCGGGGGATGGTGAAAGCCCCGCACAGGAGGCCGCGGGAAGAACGCTCCGGAGCGGAAACCCGAACGCACCGCGCCAGTAGGGGGAACGGGCTGCGACCGTTACATCGCGCCGACTTGTCAGAGCCGGAAAAGGGGCCGCCGTCCGGCGGCAAATTAGGTGGCACCGCGGAGCGCAGCATTCGTCCTAATC
>MHBP01000260.1/25988-25933 Lentisphaerae bacterium RIFOXYB12_FULL_65_16 rifoxyb3_full_scaffold_468, whole genome shotgun sequence. 
GGGTGTAACGGCACGGGGGTTCGTTACAGGCGCTCTGGGTGGTCGGGCCGCCATCC
>URS0000D65EAA_12908/1-173 unclassified sequences malK-I RNA 
TCCAACCCCCGCGTCTTACTCCACCTATGTAATCCACGGGGGAAATAAAGAAGGAGGAAAGTTTTTCCGCCTGACCGGCGGTGCGGCAGTGTGGAGACCTGTCGTAAGGCAGCGTGGCGGCTGCGAGGCTCCGTTTCGCGGAGGCGGCGGGGCTACGGTCAAGCATTATGGCA
>CAJW010157214.1/4791-4634 Hordeum vulgare subsp. vulgare, WGS project CAJW01000000 data, contig: morex_contig_157214 
AAGGAGAAGTGTGATAAGCTTTGAATGGAAGCCCCGGTAAACGGCGGCAGTAACTCTAACTGTCCTAAGGTAGCGAAATTCCTTGTCGCATAAGTAGCGACCTGCACGAATGGTGTAACGACTGCCCCGCTGTCTCCGACATGGACCCGGTGTCGTTT
>CH966573.1/1-1154 Drosophila willistoni strain TSC#14030-0811.24 scf2_1100000007260 genomic scaffold, whole genome shotgun sequence. 
GAAGTATTTAGGTATCCGGTTCGCTGTGGATGGGCGGGCTCGGTATAGTCCAGCAGACGACCTCGGTCCGAAGCTGTTAAGATTAATAAGAGCCCCTCTGAAACCACAACAGAAGTTATTTGCACTTAGGACTGTCCTTATCCCACAACTCTATCACCAACTAACACTTGGGAATTTGATGATAGGCGTCCTAAGAAAATGTGACAGATTGGTACGGCAATTCGTAAGGAGATGGTTAGATCTCCCACTGGATGTACCAGTTGCGTACTTTCACGCCTTCCACACTTGTGGGGGTCTCGGGATTCCGTCAATTAGATGGATGGCACCGATGCTGCGTCTGACGCGATTGAGCATGATTAAATGGCCCCACCTCGAACAACCCGAGGTAGCTAGCTCTTACATTGACGACGAATTGCAAAGGGCTTGAGATAGATTAAAGGCGGAAAATGTGCAGTTGTGTTCGCGTCCAGGCAAACATTGCCAGGTAGGGATCGGCCTATCGATCCTTTTGGTTTAAAGAGTTTTTAACAAGAGGTGTCAGAAAAGTTACCATAGGGATAACTGGCTTGTGGCGGCCAAGCGTTCATAGCGACGTCGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAAAATTCACCAAGCGTTGGATTCTTCACCCATGCAAGGGAACGTAAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTAATGACAAAACGTTGTTGCGACAGCATTCCTGCGTAGTACGATAGGAACCGCAGGTACGGACCAATGGCACAATACTTGTTCGAGCGAACAGTGGTATGACGCTACGTCCGTTGGATTATGCCTGAACGCCTCTAAGGTCGTATCCGTGCTGGACTGCAATGATAAATAAGGGGCAATTTGCATTGTATGGCTTCTAAACCATTAAAAGTTTATTTTATAAACGACAATGGATGTGATGCCAATGTTATTTGTAACATAGTAAATTGGGAGGATCTTCGATCACCTGATGCCGCGCTAGTTACTTATTAAGACATTATTTAATACAATGACAAAGCCTAGAATCAATTGTAAACGACTTTTGTAACAGGCAAGTGTTGTAAGTGGTTGAGTAGCTGCCATACTGCGATCCACTGAAGCTTATCTT
>JXUM01182853.1/1550-1 Aedes albopictus isolate Foshan contig182853, whole genome shotgun sequence. 
ACTGGAGAGTTCGTTATCTGCCGTAACCGGTCGCTGGTTCAAGTTCAACTAGAATGTGGCTTTTACTCCCAGAGAGGGTGATAGGCCCGTAGAGCGGAGCACCGATGGTAGAAGATCTTTCCATGGAGTCGTGTTGCTTGATAGTGCAGCACAAAGTGGGAGGTAAACTCCTTCTAAAGCTAAATATCACCACGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGTTGAAAAGCACTCTGAATAGAGAGTCAAAAAGTACGTGAAACTGCCTAGGGCTCAAGCCCGTTGAACTCGATTATCCGAGCGGAGACATTCACCTGCGGTTGGCCGGCGACGGCACGGCCGCAGGGCACTTGTCTCTCGCACTAGCCAAGAGGACACTGCGATCCATTACGAAACAGCTTTCGCGCCGCAAGGCGCAAGGTCGCCCGACAACTGCCCCTGGTGCTGGTTGCTTGCCCCACAGTAGCGACGCTCAGTTCTGAAGGCCTGTGCCGCGAGGTGGGGCTTACTGCACGTGGTGTTTTGCAGTCGGGCGCGTGATGGATTCCCCCGGACACCGGGTGGTCTTCCCGTAAGGGGCCACCGGACTGTCGATCGGCAGTGAAAGAATCGAGGTACCTTCGGGACCCGTCTTGAAACACGGACCAAGAAGTCTATCTTGCGCGCGAGCCAATGGTCGTCCTCCGGAGCACCAAAGGCGCAGAAAACATAACTTGAGTTGTGCGGGATTACGGGCGCGGCTCTCTGCTCGTCCCTCCATCCCCGGGTGTTGTAATCGGCATGCGGCTACCGGGACCCAGGCTTCACGGCCCCCGGCACCGTGCCACAACATACCGTGAGTGTGCAGGATGTGACCCGAAAGATGGTGAACTATGCCTGATCAGGTTGAAGTCAGGGGAAACCCTGATGGAGGACCGAAGCAGTTCTGACGTGCAAATCGATTGTCAGAATTGGGCATAGGGGCGAAAGACCAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCACGCAACGTTTCGAATGCTATTCTTATCTGGTAAAGCGAATGATTAGAGGCCTTAGGTTCGAAATGATCTTAACCTATTCTCAAACTATAAATGGGTACGTACCATAGCATTCTTGCATGATGCTGTTGCAAACGTTGGTAAACGCCGGGCCGTCCCCTGTCAGGGCGTGCCACGGCGTAGAAGATATCTGTGTGCTTAGTGGGCCAAGTTTTGGTAAGCAGAACTGGTGCTGTGGGATGAACCAAACGTAATGTTACGGCGCCTAAATAAACGACGCATCATAGATACCATGAAAGGTGTTGATTGCTACAGACAGCAGGACGGTGGACATGGAAGTTGTCATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAAGCAATTAGCCCTTAAAATGGATGGCGCTTAAGTCGTTTGCCTATACATTACCGCTGGCGCACAAGTGGGGCAGCGCCCCTGTAGCGCGTCTGCCCTTTGAGGCGCCAGCGAGTAGGAGGGTCTGGTGGTGTGCGTTGA
>CP009227.1/527376-527281 Treponema sp. OMZ 838, complete genome. 
GGCGGCATGGATGCCGCTCGTATTAAGCAGAAGCAAGTTTGACACCGGTCAAACTTGTGTTCAGCGAAGTACATGGATGTGCTTCGCTGAACGAGT
>FQVI01000001.1/71074-70885 Lactonifactor longoviformis DSM 17459 genome assembly, contig: EJ64DRAFT_scaffold00001.1 
AAAAAGAATAAACGGTATGGTCTGTGCTCAGCAATGAGTCAGTTTACAGGGAATCCGGTGAGAATCCGGAACAGCCTTTCTCTACTGTGTGAGGGACGAAAGCAGCGTAAAACCACTGGAACTATCCGGGAAGGTGCTGCTGGTAGGAAGAACTCAAGTCAGGATATCTGGCATACTGCGTGAAAAAAGC
>MTEJ01000117.1/16469-16381 Thiothrix lacustris isolate A8 Ga0073116_1117, whole genome shotgun sequence. 
ATCGGGTTAAATAAACGACTGACTAAACATGTAGTAGCCTTCAGATGGAGGGTTTGCGGACGCGGGTTCAATTCCCGCCGCCTCCACCA
>LJIY01000004.1/279997-280249 Psychrobacillus sp. FJAT-21963 super7, whole genome shotgun sequence. 
ACATCAAATTTTGAAGGGACGATGGGTGGCCGATGAAGTTTTAATCTTATTTCTCAGTAGAAGTTTTTCTGCGATATATTTGCGCAGTAACAAAATAAAACTTTACGAAACCGGAAATAGGATTAGTCTGCCCATTTTTCAAAATTACTGCAAATAATTCTCTACAATACGCTAACGCTTTGTAGTGGTTTTTTGCATATTCATTTAATGGTCAGTATGTAATCCTACCGTTTAATATCGGAGGGATTTTTTT
>CP011058.1/4424379-4424646 Paenibacillus beijingensis strain DSM 24997, complete genome. 
GCTATCGCTATGACGGGCACAAGTAGTACTGCGAACGACGCTTTCAGAGAACCGGTGGACGGTGCGAACCGGTACGCGGCGCAGCATGAATTACCGCCTTGAGCTGAACGGGGGAAAGCGGGCCGGTCCCACTGGGGGCAGTGTCCGGCCGGTAGCCCGTTTCCGGAAGCATCCGCTTCCGTTATCAATAATGAAGTGAGAGCCTAATCTGCCCCGGCAGCGGCTCTAACGAGGGTGGTACCGCGAGCAAATCCTTCTCGTCCCTTGA
>LL009840.1/12805-13384 Trichobilharzia regenti genome assembly, scaffold: TRE_scaffold0009840 
CTCCTGGAAAAACCAATATCCAGCCAATGCTTGTGTCAGAGATTAAGTCGTGCATGTCTAAGTACATACCTTAAAACGGTGAAACAGCAAATCGCTGATTAAATCAGCTATGGTTGCTTAGACCACATATGCACTACATGGATAACTGTAGTAATTCTAGAGCTAATAAATGAAGTTATGCCCTGACCCGCAAATCAACAGAAAATTTATTAATACAGAACCAACCGCGGGTGGGGGGGGTAGTTTCGCCTGGATAGCTTTAATGTGATCGCGATCGGCCTTCCATTGGCGATGGATCTTATCGTAGAAGGAAACAACACAGAGATTCTGTTTCACCGATCAATTTAGAAGGTTAAACAACATTGGAATAAACACAGGAGTCAGACAATGGTGCTTATTATCACCAATTATACTTCATTCACTTACTTATCTAGGGAGCATTGTCTCAACTACAGGAAGTCGGAGAGGACGAGGATGTCAAATCGAGCTAGAATCGGGAAGGCAGGCGAGAAACATATTCATCAACCTGAAACAACCAATCTGGAAATATTCGTCACTCAGCCAGAATCAACAACAAAAT
>JRRC01447532.1/91-1 Gossypium arboreum cultivar AKA8401 contig_57480_1, whole genome shotgun sequence. 
GCTGTCTACGAGTCGGTTTGTTTGGGAATGCAGCCCTAATCGGGCGGTAAATTCCGTCCAAGGCTAAATACGGGCGAGAGACCGATAGCGA
>GG692400.1/806114-806247 Candida tropicalis MYA-3404 genomic scaffold supercont3.6, whole genome shotgun sequence. 
GCCCCCTTGGTGCAGCCGGTAGCATGAACGATTCCGGTTCGACTCCTGTTTCGAAGCTTTAAAATACTTTAAAGGTTTTTGAAAGGAGAATTGGAACTAGCGTTTGGTCGCGGGTTCAAGTCCCGCAGGGGGCT
>FOVK01000004.1/141686-141486 Proteiniclasticum ruminis strain ML2 genome assembly, contig: Ga0073291_104 
ATATAAACGATGAAAAGAACCAGTATGGAAGTCCTGCCTTCATAGAGAGAGGGGATTGGTGAAAGCCCTCAAGGAAAGTTTCCAGAACCTGTCTTGGAGTTTCTCAACCATTTGAGCGGGGAAAGCCGTTATACTTTAGAGTGGATACGTTAGGAGAAGTATCAATAAGGGTGGTACCGCCGAAGAGATTTGGCCCCTTTT
>LAKY01000004.1/16245-16356 Clostridiales bacterium PH28_bin88 ph28_547, whole genome shotgun sequence. 
TGATCCTTTAAGCCGGTCCCGCGAGGCCGGTAAGGAGCTACGGTCAGGGTATGCCCGTGTAGACGTGGGATATCAAGGCCTCCTTGCCGCTGGGACAAGGAGGCCTTTTGTT
>CM000878.1/138264228-138264130 Callithrix jacchus chromosome X, whole genome shotgun sequence 
CTGCCTCGAAGTCTGNNNNNNNNNNGCAATGGCTGCAAACAGCAGCTTCCTTGGTAGTGTTCTTTGTATGGGTTGCTCTAAGGGACCTTGGAGACAGGC
>FAOM01307123.1/40010-39638 Triticum aestivum genome assembly, contig: Triticum_aestivum_CS42_TGACv1_scaffold_307123_4AS 
TTTTGCAGTTTGCGAGAAAGTTGAAAGTAAAGGGAGAACAACATATAATGAGGTTAGTGCTTTATTAGTTTTTAGCTCAAAATTCCTGTTGTTATTTTTTCATCATTTGTGTGGGCTGCATGCGTTTTGCCATATATTAACCAGAAACCAGGCTGCAACTCGCCTGCATGAAGCAGGAATCGCTAGTAATCGCCGGTCAGCCATACGGCGGTGAATCCGTTCCCGGGCCTTGTACACACCGCCTGTCACACTATAGGAGCTGGCCATGTTTGAAGTCATTACCCTTAACCGTAAGGAGGGGGATGCCTAAGGCTAGGCTTGCGACTGGAGTGAAGTGGCCATAGTTTGATATGTGACCCTATTCCTTCGCATA
>JMFQ01059681.1/962-834 Aptenodytes forsteri contig59681, whole genome shotgun sequence. 
TAGGCCCTGAATGAAGACCACCGGTTTGCTGTAGCCGTTGGTTTCAAGCAGGAGCCCAAAGGAAACGTCTCCCGGTCTGTGGGCGCTCCCATCCCTGTGGAACGGCCAATTCGTGTGGGAGCGACACTA
>LFJN01000024.1/399316-399149 Phialophora attae strain CBS 131958 Contig24, whole genome shotgun sequence. 
GGTGAGATGGCCGAGTGGTTATGGCGCTAGTTTCAGGAATACCTGGAGCCTTCGCTTTCTGGTTGAAAGTACTAGTGGGTGTACGTAAAACCATCCTACAGTACCCTCAAGAGCACTACTGACAATTTCCTTTAGAAAACCGCGTGGGTTCGAGTCCCACTCTCATCA
>AFSB01069799.1/15973-16145 Heterocephalus glaber contig69799, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAATAGTAGCTGCCGTGATTCTGTTAATACAAGTTAGATTGTTTCTTTTCTCTGCTTAAAACCCTCCAATGGCTTCCCATGTCTCTTAGCAAAGCCAAAATTTCTCAAGACTTATGACGTGTGAGTGATTCTGAACCTCT
>GL378325.1/524376-524459 Volvox carteri f. nagariensis unplaced genomic scaffold VOLCAscaffold_4, whole genome shotgun sequence. 
GAGGTGTGATGATTTGAAACTTTTGGTCCGTGTTTCTGAGTGCCTAGCGCACCTCTGACGACTACAGTTTCTTCGTCTGACCTC
>GG749280.1/539059-538827 Selenomonas noxia ATCC 43541 genomic scaffold SCAFFOLD3, whole genome shotgun sequence. 
TCATATTGAATTGGATCAAGTGCAGGGGTTTTGACATCATCAAAGCCTCAATGCTTCATAGGGAATCCGGTATAGGAATCATTGATTTCATAAGCCGGAGCGGTCACGCCACTGTAACAGGGAGTGATTCCGCACGCCAATTGAGTTGGCAGTCACTGGAGAGCGATCTCTGGGAAGATGCGGAAGAACGATGAACTGGAGCCAGGAGACCTGCTTGATTAACAATCACCGAT
>GL988045.1/3052953-3052577 Chaetomium thermophilum var. thermophilum DSM 1495 unplaced genomic scaffold scf7180000011820, whole genome shotgun sequence. 
TCCTCTTCAACGCTGCGTTTCTATGCCACAAACGGAGAGCGCTTGCGCAAGCAGCGCTTTCAAATCCATCTTTCTCTGGCATATGAGAAATTCGGAGAATCGGCTTCACTCTTGGTTTGTCCATTCCTCACTCTCGGGTGTTGGATGGGTTACGAGCTCTGCCGGTGACGGCTTGGCGCGAATTCGCGTCTGTAATTGGCATCAGAAAAGCAGGGCTTAGAGGCCAACCTTGTGCTTTTGCGAGGGGAATTGGTCATCTAGGTTCCTCTGGGAGGGCCGTTACGAAGCTTGTGAGCAATCACTTGAGTGCAATACGCAGCGTGTGGCCTGCCTTCTGGGCAGATCACACAATTCGATTCCGATTATCCTGTTGAGGA
>CM002820.1/173650899-173648878 Capsicum annuum cultivar Zunla-1 chromosome 9, whole genome shotgun sequence 
AGGCTTACGGTGGATACCTAGGCACCTAGAGATGAGGAAAGGCATAGTAATCGATGAAATGCTTCGGGGAGTTGAAAATAAGCATAGATCCGGAGATTCTCGAATAGGGCAAACTTTCAAACTGCTGCTGAATCCATGCGCAGGCCAGAGACAACCTGGCGAACTGAAACATCTTAGTAGCCAGAGGAAAAGAAAGCAAAAATGATTCCCGTAGTAGCGGCGAGCGAAATGGGAGCAGCCTAAATCGTGAAAACGGGGTTGTGGGAGAGCAATACAAGAGTCGTGTTGCTAGGCGAAACAACCTGAATGCTGGCGAAAAACCAGTAGCCAAAAGCATTACTAGCTTACGCTCTGACCCGAGTAGCATGGGGCACGTAGAATCCCGTGTGAATCAGCAAGGACCACCTTGCAAGGCTAAATACTCCTGGGTGACCGATAGCGAAGTAGTACCGTGAGGGACGGGTGAAAAGAACCCCCATCGGGGAGTGAAATAGAACATGAAATCGTAAGCTCCCAAGCAGTGGGAGGAGCCAGGGCTCTGACCGCGTGCCTATTGAAGAATGAGCTGGCGACTCATAGGCAGTGGCTTAGTTAAGGGAACCCACCGGAGCCGTAGTGAAAGCGAGTCTTCATAGGGCAATTGTCACTGCTTATGGACCCAAACCTGGGTGATCTATCCATGACCAGGATGAAGCTTGGGTGAAACTAAGTAGAGGTCCGAACCGACTGATGTTGAAGAATCAGCGAATGAGTTGTGGTTAGGGGTGAAATGCCACTCGAACCCAGAGCTAGGTGGTTCTCCCCGAAATGCGTTGAGGCACAGCAGTTGACTGGACATCTAGGGGTAAAGCACTGTTTCGGTGTGGGCCACGAGAGCGGTACCAAATCGAGGCAAACTCTGAATACTAGGTATGGCCTTAAAATTAAAAAAGAGGGGTCAAAGTCGGCTAGTGAGACAATGGGGGATAAGCTTCATCATCGAGAAGAAAACAGCCCGGATCACCAGCTAAGGCCCCTAAATGGCCGCTCAGTGATAAAGGAGGTAGGGGTGCGGAGACAGCCAGGAGGTTTGCCTAGAAGCATCCACCCTTGAAAGAGTGCGTAATAGCTCACTGATCGAGCGCTCGTGCGCCGAAGATGAACGGGGCTAAGCGATCTGTCGAAGCTGTAGGGTGTAAAAATACATCGGTAGGGGAGCATTTCGCCTTAGAGGGAAGCCTCCGCATGAGCGGTGGTGGACAAAGCAGAAGCGAGAATGTCGGCTTGAGTAACGCAAACATTGGTGAGAATCCAGTGCCATGAAAACCTAAGGGTTCCTCCATAAGGTTCGTCCACGGAGGGTGAGTCAGGGCCTAAGATCAGGCCGAAAGGCGTAGTCGATGGACAACAGGTGAATAGTCCTGTACTACCCCTTGTTGGTCCCGAGGGACGGAGGAGGCTAGGTTAGCCAAAAGATGGTTATCGGTTCAAGAACGTAAGGTGTCCCTGCCCTTTTTTCAGGGTAAGAAGGGGAAGAGAAAATGCCTCGAGCCAATGTTCGAATACCAGGTGCTATGGCGCTGAAGTAACCCATGCCATACTCCCAGGAAAAGCTCGAACGGCTTTGAGCAAGAGGGTACCTGTACCCAAAACTGATACAGGTGGGTAGGTAGAGAATACCTAGGGGCGCGAGACAACTCTCTCTAAGGAACTCGGCAAAATAGCCCCGTAACTTCGGGAGAAGGGGTGCCTCTTCACATTACAAAGGGGGTCGCAGTGACCAGGCCCGGGCGACTGTTTACGAAAAACACATGTCTCTGCAAAGTCGTAAGACCATGTATAGGGTCTGACGCCTGCCCAGTGCCGGAAGGTCAAGGAAGTTGGTGACCTGATAACAGGGAAGCCGGCGACCGAAGCCCCGGTGAATGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCAGGTAAGTTTCGACCCGCACGAAAGGCGTAACAATCTGGGCACTGTCTCGGAGAAAGGCTCGGTAAAATAG
>URS0000D6A535_12908/1-73 unclassified sequences RAGATH-1 hammerhead ribozyme 
AAGACAGUCUAGGAGUCUAUAAAAUUGUUACUGAAGAGACUAGAACGAAACUUCUUUAAUUAGAAGUCUAACA
>AYMY01S001259.1/103935-104737 Nicotiana tabacum cultivar TN90 Ntab-TN90_scaffold1259, whole genome shotgun sequence 
ATTTCAAAATTTTGTAGCTTGTTTCGGGCAATAAAATGACTGGTACCATCCTAGTCAAATTAGAAAAACTTTTTGATGAAGGTGCCATTATAAGGCGGACCGGGCCCAAGTCCCCTGGAAGGGGGCGCCAGAGAGGGTGAGAGCCCCGTTGTGCCCGGACCCTGTCGCACCACGAGGCGCTGTCTACGAGTCGGGTTGTTTGGGAATGCAGCCCAAATCGGGCGGTGAATTCCGTCCAAGGCTAAATACGGGCGAGAGACCGATAGCGAACAAGTACCGCGAGGGAAAGATGAAAAGGACTTTGAAAAGAGAGTCAAAGAGTGCTTGAAATTGTCGGGAGGGAAGCGGATGGGGGCCGGCGATGCGCCCCGGTCGGATGTGGAACGGTGNTACCGCGAAGGAAAGATGAAAAGGACTTTGAAAAGAGAGTCAAAGAGTGCTTGAAATTGTCGGGAGGGAAGCGGATGGGGGCCGGCGATGCGCCCCGATCGGATGTGGAACGGTGTTGAACCGGTCCGCCGATCGACTCGGGGCATGGACCAGCGTGGATTGGGTAGACTTTTGATTTGGGTGAAGTTACTTGTTGATTGATAGAGCTTAGCTTCTTAATTAGCTTATTCCTAAGACATTTCCTTTTCGGACTTCTTAAATTCTAACTATGTTTAGTTGAATGTTCTAAAGCATACATAGAACAATTTGTTGCTAAGTAGAATAATCCCCTGCTTCACACTTTACCCACAATTCAGTTTGCATTCCATAGTAAAAGTACTATTTTGGGGTTCAAGAAAAAATTTGAAACCTTT
>CM000024.3/41982868-41983007 Canis lupus familiaris chromosome 24, whole genome shotgun sequence. 
ATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAAATAAAAAAATACATTATTTTAAAAATCTGATATGAAATGATATTTATTGGGGCTTCTGGGCAAATCAATCACCCTTGTGCTAGAGTGTTAGGATATGTAGAGTG
>CM000400.2/42839630-42839710 Equus caballus chromosome 24, whole genome shotgun sequence. 
TGGACCTCTCATGAACCCACCATGACGCCTGGTGGCAGATGTCATAGGTGATGAACATGTGTCTGGAACCCTGAGGTCCAA
>MNVL01000027.1/1734-2078 Candidatus Hydrogenedentes bacterium CG1_02_42_14 cg1_0.2_scaffold_12826_c, whole genome shotgun sequence. 
GGGGGCGCAAGGTTTTGACGGCGACGGAATTGTCGAGGTGGCGCGCTGGGGCATGCTTAGTTGCCTCGTAAAAAATACTGAGCAACTTTTAACTGCCAACACTGAATTGGCTCTAGCCGCGTAAGCGGCAGACTGCATAGGCGACGCCCGCTGACTCTTGCAGTCCTCATAGCGGGCTGGCTTTCGGTTATGTACCGGGGATCGGGAGCGAGGAGAACACTCGGACTAGCGGAAAGGGAAGCCTGTCCATGGGCCATCTTTTTGCGAAATTAATACACGGACTACGCGCGTAGAAACCCGATGAAACAGTTGTTCGGACGTGGGTTCGATTCCCACCGCCTCCAA
>JRRC01272952.1/16470-12774 Gossypium arboreum cultivar AKA8401 contig_2968_9, whole genome shotgun sequence. 
TCACTTACTTAAATACTTACTTACTTAATCAAATTTATTAATAAATTTTACTTACCTTTTTTTTTATCAAGCATACATGAACATTATATACTTACCTTTGCTCTTCTAGCATGAACTTGTCTTACCTTTTTAGTATAACTCGTCTTACCTTACCTTACCTTGATATTCTCTTTAAATTATTTCCCGTTGAACCACTTGGAATACTAAGGATACATGGGTACCTTACCATTGCCATGACTTGTCATGGTCTTACGTGGTGTCCTTTTGAAACTTACCATTGCCATGCCTTGGTATGGTCTTACATGGGACTTTTGCCTTATAGTAACTTATTAATGCCTTGTCTTGACATGGTCTTACATGGTATCCTTACCTTAGAAACCTTACCAATTGAGATGCCTTGGCATGGTCTTACATGGTATCCTTAAACCCTAATGTCATGACATTTGTATCCTACACATTCCTAAGGTTCAACCAGGACTTTCTGAAATTACTTCTCCGTCAATTCATGCTTAAGTCTTCTTCGAATAATTTCATAAAATAAATATACACATGCTGGAAATTAGCAAAATTAACATAAAATAATAGAATATTGCATTTATTTACCGCAAACTTACCTCGAAACAAAATACGATCAATTATATCGATTTAGTCCACTATCTTTTTCTTTCCCCGATCTAACTCCGAATTTTTTTCTTCTTGATCTATAATAACAAATTTAGCTTATTTAATACTCACATTTATTAAAACAGTCATTGACTCAAACTTTGGCAAAATTACACTTTTACCCTAAACTTTTACATATTTATACTTTTTTCCTAAGGCTCGGAAATTAAACTTCATCCTATTTTCTTATGTTTTATGACATTCTAATCATTTTTCCCTTCTATGGAAACATAAAATTCTCACTCTAACATGTAGTTATGAACATTAGGTATTTTTACCGATTATGTCGTTTTACTCGTTTTCACATAAAATCGCTTAGCAAAAGTTGTTTAACATAATTTCGAGCTTCATATTCTACCATAAAATATCAAAATAAACACATTTCACCTATGGGTAGTTTTCCAAATATAAACCCTAGGTTAAATTATTGCTAGAATAAGCTTAATCAAGTTATCGGGACCCTAAAAACGTAAAGAACATTAAAAACGGGGCTTAGAATCACTTACTATAGAGCTTGGAATCTTGAAACAAATCCTAGCTACGGGGAACCCTTGAAGATGAGCACATTTTTGCCATTTTTTCCCTTTTTAATTCTTTTATTTGACACTTTACTAAAATGCCCTTTATTAAAATTTTTTAGTTATTTTTACCTATGTATATCCATTTTTGTCCATGAAAATATAATGGTCTAATTCCATTTAAGGACCTCTACTTCAATTATGCAATGACCAGGATGAAGCTTGGGTGAAACTAAGTGGAGGTCCGAACCGACTGATGTTGAAGAATCAGCGGATGAGTTGTGGTTAGGGGTGAAATGCCACTCGAACCCAGAGCTAGCTGGTTCTCCCCGAAATGCGTTGAGGCGCAGCAGTTGACTGGACATCTAGGGGTAAAGCACTGTTTCGGTGCGGGCCGCGAGAGCGGTACCAAATCGAGGCAAACTCTGAATACTAGATATGACCTCAAAATAACAGGGGTCGAGGTCGGCCAGTGAGACGATGGGGGATAAGCTTCATCGTCGAGAGGGAAACAGCCCGGATCACCAGCTAAGGCCCCTAAATGACCGCTCAGTGATAAAGGAGGTAGGGGTGCAGAGACAGCCAGGAGGTTTGCCTAGAAGCAGCCACCCTTGAAAGAGTGCGTAATAGCTCACTGATCGAGCGCTCTTGCGCCGAAGATGAACGGGGCTAAGCGATCTGCCGAGGCTGTGGGATGTAAAAATGCATCGGTAGGGGAGCGTTCCGCCTTAGGGGGAAGCACCCGCGTGAGCGGGAGTAGACGAAGCGGAAGCGAGAATGTCGGCTTGAGTAACGCAAACATTGGTGAGAATCCAATGCCCCGAAAACCCAAGGGTTCCTCCGCAAGGTTCGTCCACGGAGGGTGAGTCAGGGCCTAAGATCAGGCCGAAAGGCGTAGTCGATGGACAACAGGTGAATATTCCTGTACTACCCCTTGTTGGTCCCGAGGGACGGAGGAGGCTAGGTTAGCCGAAAGATGGTTATCGGTTCAAGGACGCAAGGTGCCCCTGCTTTTTCAGGGTAAGAAGGGGTAGAGAAAATGCCCCGAGCCAATGTTCGAGTACCAGGCGCTACGGCGCTGAAGTAACCCATGCTATACTCCCAGGAAAAGCTCGAACGACCTTCAACAAAAGGGTACCTGTACCCGAAACCGACACAGGTGGGTAGGTAGAGAATACCTAGGGGCGCGAGACAACTCTCTCTAAGGAACTCGGCAAAATAGCCCCGTAACTTCGGGAGAAGGGGTGCCTCCTCACAAAGGGGGTCGCAGTGACCAGGCCCGGGCGACTGTTTACCAAAAACACAGGTCTCCGCAAAGTCGTAAGACCATGTATGGGGGCTGACGCCTGCCCAGTGCCGGAAGGTCAAGGAAGTTGGTGACCTGATGACAGGGGAGCCGGCGACCGAAGCCCCGGTGAACGGCGGCCGTAACTATAAGGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCCGCACGAAAGGCGTAACGATCTGGGCACTGTCTCGGAGAGAGGCTCGGTGAAATAGACATGTCTGTGAAGATGCGGACTACCCGCACCTGGACAGAAAGACCCTATGAAGCTTCACTGTTCCCTGGGATTGGCTTTGGGCTTTTCCTGCGCAGCTTAGGTGGAAGGCGAAGAAGGCCTCCTTCCGGGGGGGCCCGAGCCATCAGTGAGATACCACTCTGGAAGAGCTAGAATTCTAACCTTGTGTCAGGACCTACGGGCCAAGGGACAGTCTCAGGTAGACAGTTTCTATGGGGCGTAGGCCTCCCAAAAGGTAACGGAGGCGTGCAAAGGTTTCCTCGGGCCGGACGGAGATTGGCCCTCGAGTGCAAAGGCAGAAGGGAGCTTGACTGCAAGACCCACCCGTCGAGCAGGGACGAAAGTCGGCCTTAGTGATCCGACGGTGCCGAGTGGAAGGGCCGTCGCTCAACGGATAAAAGTTACTCTAGGGATAACAGGCTGATCTTCCCCAAGAGCTCACATCGACGGGAAGGTTTGGCACCTCGATGTCGGCTCTTCGCCACCTGGGGCTGTAGTATGTTCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGTGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCATATCCGGTGTGGGCGTTAGAGCATTGAGAGGACCTTTCCCTAGTACGAGAGGACCGGGAAGGACGCACCTCTGGTGTACCAGTTATCGTGCCCACGGTAAACGCTGGGTAGCCAAGTGCGGAGCGGATAACTGCTGAAAGCATCTAAGTAGTAAGCCCACCCCAAGATGAGTGCTCTCCTATTCCGACTTCCCCAGAGCCTCCGGTAGCACAGCCGAGACGGCAAGGGGTTCTCTGTCCCTGCGGGGATCGAGTGACAGAAGTTTTGAGAATTCAAGAGAAGGTCACGGCGAGACGAGCCGTTTATCATTACGATAGGTGTCAAGTGGAAGTGCAGTGATGTATGCAGCTGAGGCATCCTAACAGACCGGTAGACTTGAACCT
>JPUW01000003.1/58274-58063 Lysinibacillus sp. BF-4 contig00003, whole genome shotgun sequence. 
AACGATGCAATGATAAGGAAGAGTAAAAAGTACGCGTAGGCAAGAGAGGGAACGGTAGCTGAGAAGTTTCTACTAAAGCGCTTTTGAAGGTAGCCTTGGAGCAACATTTGTGAACAACAGTAGCAAATGTCGGCAGCTAAGCCGTTATGTATTGAGTGCTAAGCTTCGGCTTGGAATAAAGGTGGTACCGCGAAAGCTCCTTCGTCCTTTTT
>ABWE02002692.1/6421-6661 Hyaloperonospora arabidopsidis Emoy2 Contig279.1, whole genome shotgun sequence. 
TTTAAAAAATGAAAGAATCTAACTCTAGTACGAGAGGACCGAGAAGGGTAAATCTCTGGTGTATCGGTTGTTGAAAAGCATCGCCGAGTAGCTAAATTTATTTTGGATAATTACTGAAAGCATCTAAGTAAGAAACCATTCTTAAATTTTTTTTATATAAAAACTGTAAAAGATCATTACATTGATAGGTTTAAAGTGTACGTATTGTAAAATATTTAGCTTAAAAATACTAAAAGTTTAA
>CM000842.2/19036600-19036948 Glycine max cultivar Williams 82 chromosome 9, whole genome shotgun sequence. 
GCTTGTGGTTTAATTTTACTTAACATGAGAAAACTTACCAGATCTAAACATAGTATGATTGACAGAATAAGAACTCTTTCTTGATTTTATGGGTGTTGTTACATGACCATTTTTAGTTGGTGGAGTGACTTGTCTAATTAATTTTGTTAACAATGAGAACTCAGTTTGCTTAAAAATGTTTTTGTTGAATAATTGTTCTTAAAAATGTTATGATTCAAGACAAATTCAGATTTAATTTAGAAGTAAATAGTAACTAAATGTTAAACCAGAAAACAAAAGGAATGCATTCAGCAAAATAAAAATTAATGCAAACAGAATGGGCCTCAAATTTTTTAGGTTACATGAGGAC
>MNRE01000021.1/40-1 Clostridiales bacterium 41_21_two_genomes Ley3_66761_scaffold_14658, whole genome shotgun sequence. 
GGATCACTCCATTTGGGGTTAAGGCCATACGGACAGCCGG
>KI927239.1/392135-395996 Plasmodium falciparum Palo Alto/Uganda unplaced genomic scaffold supercont1.2, whole genome shotgun sequence. 
GAGGATAAAAATAGGAGGGCAAATCCGCTGAACTTAAGCATATAATTAAGCGGAAGAAAAGAAAATAACTATGATTCCTTTAGTAACGGCGAGTGAAGAAGGAATAGCTCAATAAGTAGAATCCTTCGAATCTTAATGATATATTTATACATAGAATAAAGAATTGAAGGAATTGTCAAGTTGAATTGTACTCTTGTAGGCCTCACAGGTGAAATGAATATATAGAAGTAAAGTAGGAATACTTCCTCATAGAGGGTGAAAGGCCCGTATCATATATCATTTCGTGGGCTTTGGAGTATTTATATTTTACTGAGTAGTGTTCTTTGAGATTGGAGCACAAATTGGTGTGATACATTTCACATAAAGCTAAATATGTGTAGGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAATAGTACTCAGGAATGAGCAATTAAATAGTACCTGAAATCGTTAAGATGGAACGGATTAAGAGAGAAAACAAGTAAAGAGGAGAATTTTTTACATTTTTATTTTTGTTTTATAATTCTCTTCTTTATTAAAAGAAACATCAGTGATTAATTTAATTTCAATAAAGCAATCCCCTGAAATTCAAAATTTCTTTTAATTTTGTTTTCACTTTCTCCCCGCACTAATGTGGGGAAAACTGGCTTTATTTCTTCAATTATTTTTTTTGCTGAGGAATTTTAAAATTATTTGAATTTTTCTTCTTATAATTTAAGTTGTTTCTATATAGTACTTTCTTAACCCACTCGTCTTGAAACACGGACCAAGGAGTCTAGCAAATGTGCAAGTGTATATGATTCTTTAAACATTTCTCTTTTTAATATACGCATAATTAATGTAATATGTTTCTTTATTGTAGATTTGTGGTGTTTAATTTTTATTAAATCCCCACTTTGCATACAATACCGGTAAGCAATTATGCTTTATTGAGTACGAGCATATTTGGTAGGACCCGAGAGGCTTTGAACTAAGCGTGATGAGATTGAAGTCAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTATTCGCTCATGAGATCCCATAAAAGGTGTTGGTTCATAATGACAGTAGGACGATGGTCATGGAAGTCGAAATTCGCTTAGGAGTGTGTAACAACTCACCTACCGAATGAACTAGCCCTGAAAATGGATGGCGCTAAAGCGAATTACCGATACCGGGCCATAAGAAGGTAGAAATTATAAATGTTAATTTAGCTCAGATCTTTTTATGAGTAGAAAATCGTGGGGTTTGTGTTGAAGCGAAATACGTGAGTTTTCGTGGAACATCTCCCTAGTGCAGATCTTGGTGGAAGTAGCAACTATTCAAATGAGAACTTTGAAGACTGAAGTGGAGAAGGGTTTCTTGTCAACTGTGATTGAACAAGAGTTAGCCGCTCCTAAGGGATAGCTGAAAAGTGTTTAAAAGAAGTAAGATATTATATGGAAATATATAATTAGATCTTCGTCTCAAAAGGGAAACAGGTTAATATTCCTGTGCCATAAGTAATAAGAGTGCAAACAGAGATGGTAACATACATATAAATGAACTCCTTAACATAGATTTTACTCATGGGGTGCGTTATCTTTGCACTTTAATTTTATAACAAACCTTGGAATCAATTTATTTGGAGAAGAGGTTCGTTGAACTCAATTCAAAAAAAAAAAAAAAAAAAAAAATTAATTATAGAAGGAAAGGATTTTCGGATCCTTTGTACTTTTTTTTTTTTTTTTTTTTTTTTTTTATGTTTTGTAGCAATAGTAATTCATTTCTTTTGAATTATCCATAGTGGTAAAAACTATCCATGAAACAAGGAGGGAACAGCAGCAATTATATAATTTTTGGGGTTCTTTGAATTCCTTATTATTTTTGCAATATTCTTAATACTTGTACGAGCGTACCAATAACCGCATCAGGTCTCCAAGGTTAGTAGCCTCTGGTTAAATAGAAAAAAGTAAGTAAGGGAAGTCGGCAAAATAGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGACATTAGAAAAGAGAAGAAAAAAAGAGGGTTGAGAATAAAATTGCAGATTTATTTGCTTTTCTCTCTGATTTGCTTGTAAATTTTCTTTTTCTTTTTCTTCTTTTCTTTTTTTTTCTGTCCCTCTTTTCGTCTTCATTTTATTGTAATTTTTGTTACTTTAATTTGATACATATATAATGTTAACTCAGAACTGAAACGGACAAGGGGAATCCGACTGTTTAATTAAAACATAGCATTGTGAAAAACCATAACTGGTATTAACACAATGTGATTTCTGCCCAGTGCTTTGAATGTCAAATTGATGAAATTTAATTAAGCGCAGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTACTTGCTATCTAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAAAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTTACTCTAGTCTGACTTTGTAAAACGACTTAAAAGGTGTAGATATAAGTGGGAGTAGGAAAATGAAATACGTTTTTTACAATAGTGAAATACCACTACTTTTAAAGTTGTTTTACTAATCCATTGATAGGGATATATAAAACTTATAAATAATTTTTATTTTAAGTTACTTTTGAATTTAAGATATGTGTGCATTTATATCTATTAAATCCCATTTTGTATATATATATATATATTATATATATGTGTATAATACGATTTTTTTTATGGAGACATAGTTAGGTGGGGAGTTTGACTGGGGCGGTACATCTGTTAAAAAATAACGCAGATGTCCAAAGACAAGCTCAAAGAGAACAGAAATCTCTTGTAGACTAAAAGGGGAAAAGCTTGTTTGATTTTTACTTTCAGAATGAGTAGAAAACGTGAAAGCGTGGCCTATCGATCCTTTATATTTGCAAAATGACGTAATAAATTACTTACTACTGTGCATATAGAGGTGTCTGAAAAGTTACCACAGGGATAACTGGCTTGTGGCTGCCAAGCGCTCTTAGCGACGTAGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGGGACGCAGAAGTCTCAAAGTGTCGGATTGTTCACCCGCTAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGAATAATATTATTATATTTTTTATATACAATATATAGTATTGTGACAGTAATCCAACTTGGTACGAGAGGATTAGTTGGTTCAGACAATTGGTACAGCAATTGGTTGATAAACCAGTGTTGCGAAGCTAAGTCTGTTGGATAATGGCTGAACGCCTCTTAAGCCAGAACCCATGCTGATTAGACAATTCTAAATTTGATCTTTTTGTTAAACGATAAAAATTATATATATATTTTTTTTATCTTTACTGCATAATGTAAAAGAGAAATTATACATATATATATATATATATATTAGAAAAGAAAAAATGATGTAATTAATTATTATTATTATTTTTTTTTTTTTTAGTATTAATATATAATTATGAATATATAAATAATCCTATATCTTTATATAAAAATTAAATTTTTAATTTTATTAGAATTTTTTTTTTTTATATATATAGATTGTAATTTAACAACAAAAAGTATTAAGCCCAAATCGTAGACGACTTTTCTGTCTCAGAGTACTGTAAACATGAGAGTAAACTTTGTTTTACGATCTGTTGAGGTTTATCTCTTGTGACATTGAGCTAA
>KI925462.1/351230-352057 Heterobasidion irregulare TC 32-1 unplaced genomic scaffold scaffold_09, whole genome shotgun sequence. 
ACAGATCCAAGGCCACAATGCTCGTCCCGCACAGGACGTCTGAACGACAGTTCTGGCTTCCATCTTTGCGAGCGGGCTAAGGTCTGAGTGTATAGCTCCCTCGATCGACTCTCGCAGGGTCCGAGTCTAACGGCTCGAGCAACATACAAGAAATCCGTCTGCTTCACCTTGTCCGAAGACACGCTATCTGTTTCTCTAGATTCGGCGGCGTCGAGGGTGGTGAATGTAGGCTTGAGATATGTTGCGGAGTTTGGGCAGTACGTTTTGTCTCATCTATCCTCCGAGTCGTGGGTCGGAGTGCCCTCGATGCCCTATCGCACCTTTCGTCTGTGTCAGACGATCAGACATCAGGCAGTGTCTGAAGTGTTGTCAACTCGCTTCATTGCGACACAGACAGGAGTATATGACTCTGGGAGCACACCACTCCGATCAGAGCCTCCGGGAGAACACCACTCCAGTCTGATTAGGGAACACCCTTCTCCAAGTCGAACCTCTTTCCTGGACGAATGTTAGCCCTTCAGTCATGATCCGTGGCGAGAAGCGGGGGTCATAACTCACACCTGCCGCCTTTACCCAACGAGATCAGAAGACATAACCTGTCGCTGTTGTGGCTAATACAGGAAAGAGTGTCTGCCAAACCCTGGTGGGACGTGGACCTTGTCCAGTTGCGTTTCGATGGTCATGAGTTGATGACACTGGTGTATGAGGGGTTGGGAGTTTGTGAGGTGCACATCGGTACTGTCCTTCAGTGCAATTTGTGGCTCGCGCCTTTCGTTCTCCTTCTGGAAACGAAGGCGTGAAACTCGATTCAGACTACTCTGGGTCTGT
>ALWZ046142499.1/4049-4180 Picea glauca, whole genome shotgun sequence. 
GGTTCCTTGGTCTAGTGTTCAGGACATTGGACTCTAAATCCATTTTTGAATGTTGTGTACAAATCCATGGTCTAGTGTACATGACATTGGAATCTGAATCCAATAGCTTGAGTTGTAATCTCGATGGGACCT
>LATL02000069.1/39931-40100 Limnoraphis robusta CS-951 contig069, whole genome shotgun sequence. 
GTCAAGAACTCGCCGCTAAACCCTATGCGCTTTTCGCGCAGCAGGCTTCGCCAACGGGTTAAGCGCGGGAGCTTGTAAAAAGGCTCTAACTTGACCAGACTCAGCCCTTTTTGGGGCTACGTTATTTGGCTCACGAAACCCATGAATGCGTGCCAGTTTGCGGCTCTTTC
>CM003279.1/134475214-134476476 Salmo salar isolate Sally breed double haploid chromosome ssa01, whole genome shotgun sequence. 
AACTCTTATGATTCAGAGTGGTTGGGTTAAATGTGGAAGACACATTTCAGTTGAAGGCATTGTTGTACAACTGACTTGGTATCCCCCTTTCCCTTGTAAGGAGAGACGATGATCCCTCTCATTTGCAAAGAGTTGGGATATGATAATATTCATAAATGGGGAATCAGGGTTCGATTCCAGAGAGGAAGCCTGAGATGCACCTACCACATCCAAGGAGGGCAGCTGGCACGCAAATTACCCACTGCTGACTCAAGGAGGTAGTGATGAGAAATAACAATACAGGACTCTTTAGACGCCCCGTAATTGAAATAGGTACTCTTGAAATCCTTTAATGAGGATCCATTGGTGGGCCAATCTGATGCCAGCAGCTGCGGTAATTCAACCTCCAATAGTGCATCTTAAAGTTGCTGCAGTTAAAAAGCCAGTAGTTGGATCTCGGGTATAAGCTGACGGTCTGCCGCAAGTTGAGCTACGGCCTTTCTCAGCCCCGGTACGCTTAACTGACTGTCCCTTGGGGTCTTAAAAAGTGTTCAAAGCAGTCTGTCGCCTGAATACCGCAGCTAGGAATAATGGAGAAAGACTCTGGTTCTATTTTGTTATTGTTTTCTTCTGAACTGGGCCAATGGTTAAGAGGGACTGCCGGGGGCATACATATTGTGCCGCCTGAGGTGAAATTCTTGGACTGGCGCAAGAATGTTTTCATTAATCAAGAATGAAAGTCGGAGGTTTAAAGACTTTCAGATACCGCTGTAGTTACGACCATAAGCGATGACAACTAGCGATCCGGCGGCTTTATTCCCATGACCCGCCGGGCAGCGTCCGGGAAACCAGATTCTGGGTTCCAGGGGGGAGTATTGTTGCAATGCTGAAACTTACAGGAATTGACGGAAGAGCACCAGCAGGAGTGGAGCCTCCGGCTTAATTTGACTCAGGAAACCTCGCCCGTACATGAAAAGATTTGACAGCTCTTTCTCGATTCTGTGGGTGGTGGTGCATGACCGTTCTTAGTTGGTGGAGTGATTTGTTTTGTTAATTCCAATTACGGACATGACAACTAATAAACTTTAAACTAGTTATGCGGCCAGAGCGGTCGGCGTCCAACTTCTTTGGGGGACAAGTAGTGTTCAGCCACACGAGATTGAGCAATAACAGGTCTGTGATGCCTGGGGCTGCACGCGCGCCACACTGAGCCGGTTGGCGTGTCTACCCTTCGCCGAGAGGCGTGGATTGGTTTCCGTAGGTGAACCTGTGGAAGGATCATTA
>HE978326.1/163659-163887 Kazachstania naganishii CBS 8797 chromosome 13, complete genome 
ATCCCCCGTGCCTCGCTCGGCCAGCTGCGTGTCTTCAGGGACACTTTGATCTGCTGGTCTTGAGCTGGACGTGTTTCCCCTCGCGGGAAGCTGGTGGGGGGATACTGAACTTCAGTGACGACTTTTTGAGTACAAGGGCGCCCGGGATACTTCGTATCCCGCACAATGGTGTCTTCAAGATTTAATACTTCATTTTAAATTGTATTGTAATTAGTACGTTCATACATGT
>LCMH01000002.1/67321-67516 Microgenomates (Amesbacteria) bacterium GW2011_GWC1_46_24 UX46_C0002, whole genome shotgun sequence. 
ACGGAAGGCTAGTAGTATGGGCCCCGCCGGTAGTAATACCGGTGCGCAAACTTGGCTATATCGGTGGACATCCTGAGCTTGTCGAAGGACAATACCGAGGCAACCTCGAAAGAGAGAGTCCGTAGAGACTACACGCCAAGCACCCCGACGTTATGTCGGGGTGATGATATAGTCCGACTCCCCGAGTAATCGGGGT
>GL636099.1/5798-5944 Serratia symbiotica str. Tucson genomic scaffold scaffold00192, whole genome shotgun sequence. 
TAACAAAAAAATACCGAATACGATTCCTATATTCGGTCTAGGGAAATGGCTCCTAGGAGAGCCATGCGCTAAAAGTTAGCGTTTAGTGCATAATTTATCCAGTCATACTGCACTAAGCGTAGCCTATCACACTATTTTTGCCAGCTA
>JH711579.1/1959477-1959901 Coniophora puteana RWD-64-598 SS2 unplaced genomic scaffold CONPUscaffold_7, whole genome shotgun sequence. 
ACGTCGTCTGAAGAATCGCCATCGCAGCACACGCACAAGAAACGTCCTCATACGATGCTTTCTACCCTACGCTGTGGGAAAAGTCCCCGGAGACACAGAGTCCCCCTCGTGGGGCCGGCCCCCGTTCGCTAACGGAAAGCCCTGGCTGCAACCACGCCGAGGAAGGGCGGGGGATCGGTCGGGCGAGTTCACCCTGCTTGCTTCTCTATTCCTCTCGGATGGGAATGCAAGCTCGGCTCGCCCAGCTCTGTTGCGCTGCCCGACGTCCCGCGGTCTATCGCGAAGACACGAGCCTTGGCCGCGCTTTTGTGGGCGGAGGGCGCGCACGTCGTTGCTCATAGACATAGTTATGCGATTGTCGGCTTTCGCGGTTCATTCTTGTGGATCGCGGCCGTCATCTCAATGGGGCTTACTCTCATTCGACG
>ABLE03011845.1/1131-1 Caenorhabditis japonica strain DF5081 Contig9535.1, whole genome shotgun sequence. 
TACCTGATTGATTCTGTCAGCGCGATATGCTCAAGTAAAAGATTAAGCCATGCATGCTTTGATTCATAAATGAAATTGCGTACGGCTCATTAGAGCAGATATCACCTTTCTCGGAATCCTGAAAAGGATAACTGCGGAAATTCTGGAGCTAATACATGCGACTATACTCCAACGCAAGGCGGGGTGCAATTATTAGAACAGACCAAACGTTTTCGGACGTTGTTTGTTGACTCTGAATACCGTCGTTTACTGTCAGTTTCGACTGACTCTATCCGAGAAGGGTGTCTGCCCTTTCAACTAGATGGTAATCTATTGGACTACCATGGTTGTTACGGGTAACGGAGAATTAGGGTTCGACTCCGGAGAGGGAGCCTTAGAAACGGCTACCACGTCCAAGGAAGGCAGCAGGCGCGAAACTTATCCACTGTTGAGTATGAGATAGTGACTAAAAATATAAAGACTCATCCTTTTGGATGAGTTATTTCAATGAGTTAAATATAAATTATTCTTCGAGTAGCAAGGAGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCTCCTAGTGTATCTCGTTATTGCTGCGGTTAAAAAGCTCGTAGTTGGATCTAGGTTACGTGCCGCAGTTCGCAATTTGCGTTAACTGTGGTCGTGACTTCTAATTTGCTGGTTTGAGGTTGGGTTCGCCCTTCAACTGCCAGCAGGTTTACCTTGAATAAATCAGAGTGCTCAATACAGGCGCTTGCTTGAATAGCTCATCATGGAATAATGAAACAGGACTTCGGTTCTTTTTGTTGGTTCTAGAATTGATCTAATGGTTAAGAGGGACAAACCGGGGGCATTCGTATCATTACGCGAGAGGTGAAATTCGTGGACCGTAGTGAGACGCCCAATAGCGAAAGCATTTGCCAAGAATGTCTTCATTAATCAAGAACGAAAGTCAGAGGTTCGAAGGCGATTAGATACCGCCCTAGTTCTGACCGTAAACGATGCCATCTCGCGATTCGGAGGGTTCATGCCCTACCGAGGAGCTACCCGGAAACGAAAGTCTTTCGGTTCCGGGGGTAGTATGGTTGCAAAGCTGAAACTTAAAGAAATTGACGGAAGGGCACCACAAGGCGTGGAGC
>MELN01000046.1/18551-19023 Actinobacteria bacterium RBG_16_64_13 RBG_16_scaffold_3124, whole genome shotgun sequence. 
GCAGCTCGGGTAGCCGCAGGGGCTCACCAACCGTGAGTTCTTGAGGAAAGTCCGGACACCATAGAGCAGGGTGCTGGATAACGTCCAGCGGGGGAAACCCCAGGGAAAGCGCCACAGAAATTACACAGCACGCCGGCGCAGCCGGTTGCAAAGGTGAAATGGTGCGGCAAGAGCGCACCGGCGTCGTGGTGACACGGCGGCCAGGCAAGCCCCACCCGGTGCAAGGCCGAATAGAGAGGCGTCTGAGGGCTGCTCGCCCGAAGCCTCCGGGTTGGCCGCATGAGCCGTCCGGCAACGGCCGGCCATAGATAGATGGCTACCCAAGAGGCTGCTGGGGAATGAGGCTCGCCGCCAGGGTGCGATTGGCATGCGCGAGAGAAGGACGCACTATCGGGCCGCCTAGTGCGGTCCGGCGGCCGGGGCCTTATTTCCCAGCAGCCTCAGGACAGAATCCGGCTTACAGGGCTGCTACC
>CP009284.1/1108194-1108485 Paenibacillus sp. FSL R7-0331, complete genome. 
TCACACGCAATGAACGGGAGCAGTAGATGATGAAGGTGTGCAGAGAGCTGCGGGCTGGTGCAACGCAGTCACCTGATAGGCATTGAATCTCGCCCGGGAGCGGAGCGGCGGAAACAGGAAGTACGCCGCAACGGAAGTCCCCGTTACCGGACATCTGTATTTGCCGGACTATACCCGTATGGGGATGAGCCGGATACGGGGTGAGCTGGGCGCAGCTTGCGGTTTATCAGGAAGGTAAGCCGGATGCGTCAACAAGAGTGGTACCGCGGTGGGGTGACCCGCCGTCTCTTAT
>KE695927.1/3217556-3217637 Alligator sinensis unplaced genomic scaffold scaffold391_1, whole genome shotgun sequence 
GCATGGAGCTGGCTGCTCCAGGGAGCAGGTGGGAGCTGGATTCCCAGCCTCTGTCTGCTCCCTGGAGCAGCCAGCTCTGACT
>KQ414443.1/2085-2243 Termitomyces sp. J132 unplaced genomic scaffold C252961, whole genome shotgun sequence. 
ACACTGATGGTGAAGTGGTTATCATGCTTGCCTTCCATTGCATAGAAGCTATTGCATCTGTCTGAAGCAAGCGGCAGGGGTTCTGCTTGCCTTCCATTGCATAGAAGATATTGCATCTGTCTGAAGCAAGCGGCAGGGGTTCGATTCCCCTTCAGTGTA
>FJ872372.1/9644-12466 Uncultured Verrucomicrobia bacterium clone 106 genomic sequence. 
ATTCAAGCAAACAGATGGCACATGATGGATGCCTTGGCGTTGATAGGCGATAACGGACGCGACAAGCTGCGATAAGCCATGGATAGCGGCAAATACGCTTTAACACATGGATCTCCTATGGGGTAACCCGAGGGCTCAGCCCTCATCCTGCCTTTTACAGGCAGTGAAGCGACACTCGGTGAAGTGAAACATCTCAGTAACCGAAGGAAAAGAAAGCGAAAGCGATCCTGTGTGTAGCGGCGAGCGAAAGCAGGACAGCCCAAACCGGCGTTAAACCCGGGGTTGTAGGACCAGGCATAAGCGATGTGATCAGGTTGGTTCAAAAGGCTGGAAAGCCTTCCGATACCGGGTGAAAGGCCCTTAAACCGACTCGGCCCACATTGCGCCTGGCTCCTGAGTAACGCGACATAAGTGAAACTTCGCGTGAATCAGCGCGGACCACCGCGTAAGGCTAAATACTCATCAACGACCGATAGTGAACAAGTACCGCGAGGGAAAGGTGAAAAGAACCGCTACAAGCGGAGTGAAATAGATCCTGAAATCATGTGTCTACAAGGTGTCAAAGCCCTTCGGGGCGATGGCGTGCCTTTTGCTTAATGAGTCTGCGAGTTATCTTCAGTGGCCAGCCTAATGTCATTTGACAGGAGGCCCAGCGAAAGCGTGTCCGAAATGGGCGTCAATAAGTCGCTGGAGATAGACCCGAAGCGGAGGTGATCTACCCATGGTCAGGATGAAGCGCGGGTAAAACCGCGTGAAGGTCCGAACTGGTGGACGTTGAAAAGTCCTCAGATGAACTGTGGGTAGGAGCGAAAGACTAATCAAACCCCGTGATAGCTGGTTCTCCCCGAAATAGCTTGAGGGCTAGCCTCTTGTTCCTCCTTCCGGAGGTAGAGCACTGGATGAACTAGAGCCCATACCCGGGTATCGAACTCAATCAAACTCCGAATGCCGGAAGATTTAAACAAGGGAGTCAGTCGGCGAGGGATAAGCTTCGTCGGCGAGAGGCAAACATGCCAGACTAGCAGCTAAGGTGCCCAAATGCCGCGTAGTGCAAAGGCTGTGGCGATACACAGACAATGAGGATGTTGGCTTAGAGGCAGCCACCATTTAAACAGTGCGTAATAGCTGACTCATTTAGTGTCTCCGCGCCGATAATGATTGGCGATCAGCGGTATACCGAAGCTCTAGGATAGTACGTCCGAGAGGATGTGCGATCGGTAGGGGAGCATTGTTGTCTGTATTGCCGTGGCGTAAGCCGCGGTTTAAGAACAACAAGTGAGAATGCAGACATGAGTAACGATAGCCCTGTTGAATCCAGGGCCGCCGAATACCCCAAGGTCTCCTTGGCAAGGATTGTCCGCCAAGGTCTAGTCGGATCCTAAGTTGAACCCATACGGCTACAACGATGGAAACCAGGCTAATATTCCTGGACCGCCGATATTTAACCCATCCTTGGTGCGCAGGTGCAAGCAGGCCGTCGAATGCCTGTCCCGAGAGGGCGAGTTCCAGCTCTGCTGGAGCGAAGTTGTCATGACGCGCACCGCAAGAAAAAGATGGCGTATAATCAGGTGTCCGTACCAAACCGACACAGGTGGGGTCGCGCAAGAGCGCGAAGGCGTAAGAGTGAAACCTCGTTAAGGAACTCGGCAATCTAACCCCGTAACTTTGGAATAAGGGGTGCCCTCGCAAGAGGGTCTCAGTAACCGGGTCAACCGACTGTTTAACAAAAACACAGCACTCTGCCAAGTCGAATACGACGTATAGGGTGTGACACGTGACCAATGCGGAAAGATTACGGTAAGGGGTTAGCCGCAAGGCGAAGCTCTGAGCCCAAGTCCCCGTGAATGTCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATCGTGTAACGAGTTGACCGCTGTCTCGACGAGGAGCTCAGTGAAATTGTAGTGGCGGTGAAGATGCCGCCTACCCGCAGCAGGACGGAAAGACCCTATGCACCTTTACTGTACGCTGTAACTGTGGTCCTTAACCCTTTGCCTAGAGTAAGTGGGAGACTGTGAACCTGTCCCTCCGGGGGCAGGGGAGTCGCCAATGAAACACCACCCTTAGGGTTGAGGGCCTCTAATCTGGATTTTTCTCCAGAGAACATTGCAGTCGGTCAGTTTTACTGGGGCGGTATCCTCCTAAAGAGTAACGGAGGAGTGCGAAGGTTGGCTCAGCCCGGTCAGCAATCGGGTGACGAGTACATGGATATAAGCCAGCCTAACTGCAAGACCTACAAGTCGCGCAGATGCGAAAGCAGGCCCAAGTGATCCGGTGACGGAATGTGGAATCGTCATCGCTCAACGGACAAAAGGTACGCTAGGGATAACAGGCTGATCCTGCCCAAGAGCTCATATCGACGGCAGGGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGGAGAAGGTCCCAAGGGTCCGGCTGTTCGCCGGTTAAAGTGGTACGCGAGCTGGGTTCAGAACGTCGCGAGACAGTTCGGTCCTTATCCGCTGTGGGCCCAAAAGAAGTGAGAAGTTTAGATTCTAGTACGAGAGGACCGAATTTAACGGACCAAGGGTGTTAGAGTGGCCGTGTCAACGGCCCGGCTCTGTTGCTATGTCCGGAACGGATAAACGCTGAAAGCATCTAAGCGTGAAGCCACTTTCAAGATTGCTTCTTTATTGTAGGCGTGGGAGACCACCACGTTGATAGGCCAAAAGTGCAGATGCAGCAATGTATCGAGCTAACTGGTACTAATCCGACAAATGCTTGAATGA
>CP001720.1/3486540-3486319 Desulfotomaculum acetoxidans DSM 771, complete genome. 
GAAATCCCGTCTGGTAAGACTCTAGCCAAGTCACCAGTAGCGAGTCTTGGACTCGATGGAGTAATTCATAGAGTTAAGCGTAGACAGGTAGGTAGTAGGCCTGAATGTGATTGAGCCCCGTAATGGGCAAACGGGAAGGTTGACGGTTTCGAAACTCCGGAAAACTATATCTTGGTACGCGATATGGCGAGTGTATTGAGACTTCCTCGGGGTCTAAGAGCC
>AFTD01223909.1/154-1 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
GAATGTGAAGACAATCCTGTGACGTCTTTCACCTCATTGGACTTCAGGGTTAACTTGATTGATGGGGCTAGAGGGCGTGTCCCCTCCTGCATCACTCCAAGTGCATACTTCATGGTGCTGTGCACTCAAACAGGACAACCTTCCCTAATGGAGT
>MGPA01000055.1/20568-20297 Coxiella sp. RIFCSPHIGHO2_12_FULL_44_14 rifcsphigho2_12_scaffold_6640, whole genome shotgun sequence. 
CCCGATCACTCATTGAGAGGTTTCATTAAGTTGAATTAAAAGGGAATCCGCACGCTTTGATACAAAATCAGAATGAAAGCTAATGCCATACAAAACGGCTGTGTATTTATTCTGCATCATGCTAAAAGTATTAAAGCAATTGGAGCTGTCCCCGCAACTGTATGCAGCAAGTGCTGTTCTATAAACCACTGGCACCCTTGGACGGGGCTGGGAAGGTGGATGGCACGTTTGAGCTGTTAGCCAGTAGACCTGCCTTCGATGAATAATTAGCT
>CP001472.1/654493-654256 Acidobacterium capsulatum ATCC 51196, complete genome. 
TATTCGTAAACGCTTTGGGATGTTCGGGAAGGCGGTGAAAATCCGCCACTGCCCCGCAACTGTAAGCGCGTTCGTGTGCTTTCTCGTCTGTTGAATACAGAGGGCACACAGAGGTCCGGGCGTAGGATGCCACTGGAGCAGATGCTCCGGGAAGGTGATTCCGCGATGCCGCCCGGCTTCGATTCCACAGGGAATGAGCGCCTAAGTCAGGAGACCGGTCCCATGCGCCTTTTTCACC
>JRRC01082395.1/3124-5153 Gossypium arboreum cultivar AKA8401 contig_15521_1, whole genome shotgun sequence. 
GTTCAAACGAGGAAAGGCTTACGGTGGATACCTAGGCACCCAGAGACGAGGAAGGGCGTAGTAAGCGACGAAATGCTTCGGGGAGTTGAAAATAAGCGTAGATCCGGAGATTCCCGAATAGGTCAACCTTTCGAACTGCTGCTGAATCCATGGGCAGACAAGAGACAACCTGGCGAACTGAAACATCTTAGTAGCCGGAGGAAAAGAAAGCAAAAGCGATTCCCGTAGTAGCGGCGAGCGAAATGGGAGCAGCCTAAACCGTGAAAACGGGGTTGTGGGAGAGCAATAAAAGCGTCGTGCTGCTAGGCGAAGCGGTGAAGTGCCGAACCCTAGATGGCGATAGTCCAGTAGCCGAAAGCATCACTAGCTTACGCTCTGACCCGAGTAGCATGGGGCACGTGGAATCCCGTGTGAATCAGCAAGGACCACCTTGCAAGGCTAAATACTCCTGGGTGACCGATAGCGAAGTAGTACCGTGAGGGAAGGGTGAAAAGAACCCCCGTCGGGGAGTGAAATAGAACATGAAACCGTAAGCTCCCAAGCAGTGGGAGGAGCCCAGGGCTCTGACCGCGTGCCTGTTGAAGAATGAGCCGGCGACTCATAGGCAGTGGCTTGGTTAAGGGAACCCACCGGAGCCGTAGCGAAAGCGAGTCTTCATAGGGCAATTGTCACTGCTTATGGACCCGAACCTGGGTGATCTATCCATGACCAGGATGAAGCTTGGGTGAAACTAAGTGGAGGTCCGAACCGACTGATGTTGAAGAATCAGCGGATGAGTTGTGGTTAGGGGTGAAATGCCACTCGAACCCAGAGCTAGCTGGTTCTCCCCGAAATGCGTTGAGGCGCAGCAGTTGACTGGACATCTAGGGGTAAAGCACTGTTTCGGTGCGGGCCGCGAGAGCGGTACCAAATCGAGGCAAACTCTGAATACTAGATATGACCTCAAAATAACAGGGGTCGAGGTCGGCCAGTGAGACGATGGGGGATAAGCTTCATCGTCGAGAGGGAAACAGCCCGGATCACCAGCTAAGGCCCCTAAATGACCGCTCAGTGATAAAGGAGGTAGGGGTGCAGAGCTAAGGATACATGGGTACCTTTCCTTTTTAAACTTACCATTGTCATGTCTTGACATGGTCTTACGTGGTATCCTTGCATTATGAACTCACCATTGCCATGCCTTAGCATGGTCTAACATGGGATCTTTGTCTTATCGTAGTTTATCAATGCCATGTCTTGACATGGTCTTACATGATTTCCTTGCCTTGTAAAACTTACCAATGACATGCCTTGGCTTGGTCTTATTTGGTATCCTTAAACCCTAATGTCATGACATTTGTATCTTGCACATGATATTTCGTACGGCCCTATGAACCTCGGACTCAGTTTGCCCTTACGGCCAAATCTGAGTATCTTTTTCAAAGGTGAAACTTTAAGAAACACTTTGTCTCCCACCTGATACTCAATATCTCTTCGTTTTAAATCCGTGTACTACTTCTGATGATCTGATGCTGCCTTCAGACTTTCACAAATTATTTTTATTTTCTGCTCAGTATCTTTAATCAAATCAACTCTGAAATTTTACTTTCACTGAGCTCAGTCCAAAACAATGGTGTACGGCATTTACGACCGTACAAAGCCTCGTAAGGTGCCATCTTAAGACTTGATTGAAAACTATTGTTGTAAGCGAATTCAATCAAAGGTAAATACCGCTCCCATGAACCACTAAACTCAAGGATTCAACATCTCAACATATCCTCGAGTATCTGAATTATTCGTTCGGATTGACCATCGGTCTGAGGATGAAAAGCGGTGCTAAAATGCAACTTGGTACCCAAAGCTTCTTGCAATTTCTTCCAAAATCGTGAGGTGAATCTCGGATCTCTATCCGACACAACAGAAATCGGTACCCCGTGGAATCGCACAATCTGAGAAACGTACAATTCAGCTAGTTTATCCAATCAAAAATCCGTACGCACGGGGATAAAGTGAGCCGACTTAGTCAGTCTATCAACAACAACCCAAATCGCATC
>MEZX01000002.1/385086-385203 Candidatus Berkelbacteria bacterium RIFCSPLOWO2_01_FULL_50_28 rifcsplowo2_01_scaffold_16, whole genome shotgun sequence. 
GTTGGTGCTTTTTGCGGTTGGGGTACACCTCGTTACATTCCGAACCGAGCAGTTAAGCCAGCCAGCGCCGATGGTACTTACGGCATTCAGCCGCCGGGAGAGTAGGCCAGCGCCAACA
>LNFO01001542.1/1-433 Phytophthora nicotianae strain race 0 contig1542, whole genome shotgun sequence. 
AACAGGCTGATGACTCCTAAGAGCTCCTATCGACGGAGTCGTTTGGCACCTCGATGTCGACTCATCACATCCTGGAGCTGAAGAAGGTTCCAAGGGTTCGGCTGTTCGCCGATTAAAGTGGTACGTGAGTTGGGTTTAGAACGTCGTGAGACAGTTTGGTTCCTATCTTCTATAGATATTTTGAAAAATGAAAGAATCTAACTCTAGTACGAGAGGACCGAGAAGGGTAAATCTCTGGTGTATCGGTTGTTAAAAGGCATCGCCGAGTAGCTAAATTTATTTTGGATAGTTACTGAAAGCATCTAAGTAAGAAACCATTCTTAAAAATTTTTCATATAAAAACTGTAAAAGACGATTACATTAATAGGTTTTAAGTGTAAGTGTTGTAAAATATTTAGCTTAAAAATACTAAAAGTTTTAAAAATTAAAATAT
>CP012602.1/5017483-5017399 Bacillus sp. FJAT-18017 genome. 
ATCTGACAAAGGCAAACCTGTCTAAAGGCAGGGACGCAAAGCGATGGGCCTACCCGGGAAACCGAACGGCTGCCACGCCGCCGGA
>KI391971.1/1387979-1387852 Granulicatella elegans ATCC 700633 genomic scaffold supercont2.1, whole genome shotgun sequence. 
TGAGCGTCATGATGGTAATAATCATCTTGCGGTTGTGAGATGAGAAGTCTGAGGCTACTGTAAAGTAGCCTTATTCTTTCTCATGATTATTTAGTCTAGCTCGCTGTCTCCCCGCCAGCGTTGGCGGG
>CAIX01000365.1/7381-7448 Albugo candida, Ac Nc2, WGS project CAIX01000000 data, contig: AcNc2_CONTIG_365_length_25035 
AGGGATGTAGCTTGTCGGGAAGGCGTTCGCTAATCGAAAGGACCCGGGATCGAAACCCGGCTTCCCTT
>HG322950.1/5060379-5060502 Pseudomonas knackmussii B13 complete genome 
TCTGAGATGGCGCAGGACGCGCCATCCGCGCAAACGCGCCGCCCGGGCAGCGGTTGCGGACGGGGCAACGTGGAGCCCCGCGGCAGACCGTGGCGACCAGGGACGGCCGCCTCGGAGTGCACTT
>DS562870.1/37046228-37046111 Cavia porcellus supercont2_15 genomic scaffold, whole genome shotgun sequence. 
TTGTGTCTAGATGTAGCCCCAAAACCTTATGCTCAAACTAAAGAGATGTCTTTCTATGGTCTGTTGGCCATTTCAGAACTTGGGCGTGAAGTGGTCAATTCATCAGAAAGAAACAGAT
>AGTP01080057.1/11891-11451 Ictidomys tridecemlineatus contig080057, whole genome shotgun sequence. 
TCTGTTGAAGTGGATGCTCATCAGGGACCCCCTCCTTAGCCAATGGCACAAGCCATCGTGGAAACAGTGCCAGGTGGGTGGTTTGACTGGGGTGGAACACCTGCCAAACAGTGATGCCGGTGTCCTAAGCCAGCTCAGGAGGGCAGAAACCTCCTGTGGTGCCGAAGGGCAAAAGCTCACTAAGTCCTGGTTTTTCAGGATGAATACAGGCGGTGAAAGCAGAGCCTCATGATCCTTCTGATCTTCTGGCTTTCAGCAGGAGGCATCCGAGAAGTTGCACAGGGATAAGTGGCTGACGGCAGCCAAGCCTTCATAGAGCTGTCACTGTTGGACCTGGCCGTCTGCTCTTCCTTTCGATGTGCAGCAGAATTTGTCAACCACTGGACTGTGTGTCTAGTGACCGTGAATGTGAGCTGGGTTTAGACCATCCTGAGACAGGAC
>BDFN01001543.1/367-1030 Ipomoea nil DNA, scaffold: scaffold1543, cultivar: Tokyo-kokei standard. 
TATGGGGTGTGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCTCAGCCTGCTAACTAGCTATGCGGAGGTATCCCTCCGCGGCCAGCTTCTTAGAGGGACTACGGCCTTTCAAAGCCGCGGAAGTTTGAGGCAATAACAGGTCTGTGTCCTATTACGTTGGCCTTCGGGATCGGAGTAATGATTAACAGGGACAGTCGGGGGCATTCGTATTTCATAGTCAGAGGTGAAATTCTTGGATTTATGAAAGACGAACAACTGCGAAAGCATTTGCCAAGGATGTTTTTCATTAATCAAGAACGAAAGTTGGGGGCGAAGACGATCAGATACCGTCCTAGTCTCAACCATAAACGATGCGACCAGGGATCGGCGGATGTTGCTTTTAGGACTCCGCCGGCACTTATGAGAAATCAAAGTCTTTGGGTTCCGGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTTACCAGGTCCAGACATAGTAAGGATTGACAGACCTGAGAGCTCTTTCGAGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTTA
>HE616749.1/573542-573633 Torulaspora delbrueckii CBS 1146 chromosome 8, complete genome 
AATAATGATGAAAAAATGGTCGCTTATCAATGCTTCAGATCTATCTGTGATGGAAACAAATAAATTAACCATTCAGAACCGCTACACTGATT
>CP022657.1/1323203-1323416 Tumebacillus algifaecis strain THMBR28 chromosome, complete genome. 
AAATAGGCAATGATGGAGCGAGTAGCGTTTTGTAGGATTGTGCAGAGAGCCGGTGGTTGCTGTGAACCGGACAGTCCGATCACGTGAAGTACACTCCGGAGCCGCTTGGAGGCAATGCCAAGCCGGTCGCGCGAGTGATCGTTACGTCAATGAAGGAGTTTCTATTTTTGAAACTGCTTAGGGTGGTACCGCGAGTTCAAACCTCGTCCCTATT
>CP011601.1/33522-33359 Kluyvera intermedia strain CAV1151 plasmid pCAV1151-296, complete sequence. 
TGGTGCTGGAGGCTTTTGCCCCAGCCAGCGGTAACACTGTTTGACTGTGGTAAAAGCAGAAAGCCCCGAGTAATTTTTCAATTAACCTGTACTGCACCCATTTTGTTGGACGATGAAATGGAATAGTCCCTGATATGTCAAAGCCAAAATACCCCTTCGAAAAG
>AMPR02000442.1/14789-14883 Cupriavidus sp. HPC(L) contig68, whole genome shotgun sequence. 
CACTCCGAGGAGCGTTGCAACGGACGGCGCGCGGGCCCAACCCCGCATTCTGCCATCCGCCAGGCTCGGAATGTCTTCAACGGCGCTCGCTGAAC
>CM000811.1/53837939-53838120 Oryctolagus cuniculus chromosome X, whole genome shotgun sequence. 
ATCACTTCTCGGCCTTTTGGCTAAGATCAAGTATAGTAATCTTAGGAAATGTCCCTGTCAAATAGCAAGAACTCAGAAATTATAACAATGTTTAGTGATATTAAAGGTTCTAATGTACCTGTCTCATACCTAGGGAGCTTGTATGCTTTTTCTACTTTTGCAAAATTTCTCTAAAGACTTCT
>KQ059250.1/49614-45799 Gossypium hirsutum cultivar TM-1 unplaced genomic scaffold scaffold2565.1, whole genome shotgun sequence 
CGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATAAGCGGAGGAAAAGAAACTTACCAGGATTCCCCTAGTAACGGCGAGCGAACCGGGAAAAGCCCAGCTTGAGAATCGGGCGCCATCGGTGTTCAAATTGTAGTCTGGAGAAGCGTCCTCAGCGGCGGACTAGGCCCAAGTCCCCTAGAAAGGGGCGCCGGAGAGGGTGAGAGCCCCGTCGTGCCCGGACCCTGTCGCACCACGAGACGCTGTCTACGAGTCGGGTTGTTTGGGAATGCAGCCCTAATCGGACGGTAAATTCCATCCAAGGCTAAATACGGGCGAGAGACCGATAGCGAACAAGTACCGCGAGGGAAAGATGAAAAAGACTTTGAAAAGAGAGTCAAACAGTGCTTGAAATTGTCAGGAGGGAAGCGGATGGGGGCCGACGATGCGCCCCGGTCGGATGAACAAGTACCGACGCGGGTCGTGGCGGCGGCCCAAGCCCGGGCCTTTGATACGCCCGTGGAGACGTCGTCGCCTCGATCGTGGGATTCAGCACGCGCCGCCTCGGCGTGCTTCGGCACCTGCGTGCTCCGGGCGTCGGCCTGCGGGCTCCCCATTCGGCCCGTCTTGAGCCCCGGTCGGATGTGGAACGGCGAGAGCCGGTTTGCAAATTGGCTCGGGGCGTGGACTGACGCGGGGCGTGGCGGCGGCCCAAGCCCGGGCCTTTGATACGCCTGTGGAGACGTCATCGTCTCGATCATGGGATCCAGCACGCGCCGTCTCGGCGTGCTTCGGCACCTGCGTGCTCCGGGCGTCGGCCTGTGGGCTCCCCATTCGGCCCGTCTTGAAACACGGACCAAGGAGTCTGACATGTGTGCGAGTCAACGGGCTGGAAAACCCGTAAGGCGCAAGGAAGCTGATTGGAGGGATCCCTCACGGGTACACCGCCGACCGACCTTGATCTTCTGAGAAGGGTTCGAGTGAGAGCATGCCTGTCGGGACCCGAAAGATGGTGAACTATGCTTGAGCGGGGCGAAGCCAGAGGAAACTCTGGTGGAGGCCCGCAGCAATACTGACGTGCAAATCGTTCGTCTGACTTGGGTGTAGGGCCGAAAGACTAATCGAACCGTCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGAGCCCTTAGTGAGTTCTATCGGGTAAAGCCAATATTAGAGGCATCGGGGGCGCAACGCCCTCGACCTATTCTCAAACTTTAAATAGGTAGGACGGTGTGGCTGCTTCGTTGAGCCGCCCCACGGAATCGAGAGCTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGGAAGCCGGGTTACGGTGCCCAACTACGCGCTAACCTAGAACCCACAAAGGGTGTTGGTCGATTAAGACAGCAGGACGGTGGTCATGAAAGTCGAAATCCGCTAAGGAGTGTGTAACAACTCCCCTGCCGAATCAACTAGCCCCGAAAATGGATGGCGCTTAAGCGCGCGACCTATACCCGGTCGTCGGGGCAAGAGCCAGGCCCCGATGAGTAGGAGGGCGCGGCGGTCGCCGCAAAACCCAGGGCGCGAGCCCGGGCAGAGCGGCCATCGGTGCAGATCTTGGTGGTAGTAGCAAATATTGAAATGAGAACTTTGAAGGCCGAAGAGGGGAAAGGTTCCATGTGAACGGCACTTGCACATGGGTTAGTCGATCCTAAGAGACGGGGGAAGCCCGTCCGATAGCGCGTTCAGCGCGAGCTTTGAAAGGGAATCGGGTTAAAATTCCTGAACTGGGACGCGGCGGCTGACGGCAACGTTAGAGAGTCCGGAGACGTCGGCGGGGGCCTCGGGAAGAGTTATCTTTTCTGTTTAACGGCCTGCCCACCCTGGAAACGGCTCAGCCGAAGGTAAGGTCCAGCGACCGGAAGAGCACCGCACGTCGCGTGGTGTCCGGTGCGCCCCCGGCGGCCCTTGAAAATTTGGAAGACCGAGTGCCGTCCGCGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCAATGGAACAATGTAGGCAAGGGAAGTTGGCAAAATGGATCCGTAACCTCGGGAAAAGGATTGGCTCTGAGGGCTGGGCACATCGTGTGGTGTCCGGTGCGCCCCCGGTGGCCCTTGAAAATCAGGAGGACCGAGTGCCGTCTGCGCCCGGTCGTACTCATAACCGCATCAGGTCTCCAAGGTGAACAGCCTCTGGTCAATGGAACAATGTAGGCAAGGGAAGTTGGCAAAATGGATCCGTAACCTCGGGAAAAGGATTGGCTCTGAGGGCTGGGTACGGGGTCCCAGTCCCGAACCCGTCGGCTGCCGGTGCACTGCTCGAGCTGCTTCCGCGGCGAGAGCGGGTCGCCGCGTGCCGGCTGGGGGACGGACTAGGAACGACTCCTTCAGGGGCCTTCCTCGGGCGACGAACAGTCGACTCAGAACTGGTACGGACAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGTCCCTGCGGATGCTCACGCAATGTGATTTCTGCCCAATGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTGTCTACTATCCAGCGAAACCACAGCCAAGGGAACGGGCTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTCACTCTAGTCTGACTTTGTGAAATGACTTGAGAGGTGTAGGATAAGTGGGAGCTCTCGGGCGAAATTGAAATACCACTACTTTTAACGTTATTTTACTTATTCTGTGAATCGGAGGCGGAGCACGACCCCTCTTTTTGGACCCAAGGTTGGCTTCGGCCGACCGATCCGGGCAGAAGATATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTTAAAAGATAACACATGTGTCCTAAGATGAGCTCAACGAGAACAGAAATCTCGTGTGGAACAAAAGGGTAAAAGCTCGTTTGATTCTGATTTCCAGTACGAATACGAACCGTGAAAGCGTGGCGACGATCCATCCTGGCGATGATCTGGCGAGCCATCCCAGGATATACAAAACGGCGCAACGAGTCCCCCCCCGGAATTTGAAGCTAAAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCAATCATTGTGAAGCAGAATTCACCAAGTGTTCGATTGTTCACCCACCAATAGGGAACGTGAGCTGGAGTTAGACCGTCGTGAGACAGGTTAGTTTTACCTTACTGATGGCCGCGTCGCAATAGTAATTCAACCTAGTACGAGAGGAACCGTTGATTCGCACAATTGGTCATCGCGCTTGGTTGAAAAGCCAGTGGTGCGAAGCTACCGTGCGATGGATTATGACTGAACGCCTCTAAGTCAGAATCCGGGCTAGAAGCGACGCACGCGCCCGTCGCCCGATTGCTGACCAGTAGTAGGGGCCTTTGGCCCGCAAGGGCAGTGTCGTAGGTGCAGCGACCACGACGGACAAGTCGCGGGCGCCTCCTTGGAGCGTAATTCCCATCGAGCGGCGGGTAGAATCCTTTGCAGATGACTTAAATACGCGACGGGGTATTGTAAGTGGCAGAGTGGCCTTGCTGCCACGATCCACTGAGATTCAGCCCTTTGTCGCTTCGATTCGT
>ATMG01007873.1/439-612 Angomonas deanei Cont7876, whole genome shotgun sequence. 
CCCGGGGGGTACCCCCCGGGGGGGGGGGTAAAAAAACCCGGGGGGTTAAAAAAAACGGGGGGGGGGTTAAAAAAAAACCCCCCGGGGGTTAAAAAAAAACCCGGGGGTTTTTTTAAAAACGGGGGGGTTTAAACCCCCGGGGTTTTACCCCCGGGGGGGGGGAAAAACCCCCCC
>GL010040.1/62122050-62122364 Loxodonta africana unplaced genomic scaffold scaffold_13, whole genome shotgun sequence. 
GGATGTGAGGGCAATCTGGCTGAAACACCTGTCACCGCATTGATTGCCAGGGCTGACTGGATGATGCTGCTCACCCTCATCCCTTAATTTCTCCTTCTGTGTCTTTCTGGAAGCCTTGGGCTTGGTGAAAAGGGAAGACTTTCCCAAAGACAGGAGGCCATTCTGCAATTATTAAAGATATGTGGGTAGTAGGTTGACCAGCTTTCCCTTTTTACCTGGGACTGAGGGTTTCCTGGGATGCACGACTCTAGTGCTAAAACCAGGAAACCCAAAAAACCCAGTGCCATTGAGTTGATTCTGACTCATAGTGACCCT
>LFJF01048753.1/46-1 Macrostomum lignano unitig_48821, whole genome shotgun sequence. 
ATACTTACCTGGCGCGGGGGATACCGTGATCAAGAAGGCGGTGCCT
>URS0000D694FA_12908/1-95 unclassified sequences DUF3800-IX RNA 
TTCCCCTCGGCGAAAGAGTGCCCTCATTGGGCGCGTGCCAGGTGGTTGAATGCTCTGCATAAGAGCCATAACCTGGATAGCCGAGGCGGTTTTAT
>GL896944.1/3131193-3131114 Mustela putorius furo unplaced genomic scaffold scaffold00047, whole genome shotgun sequence. 
GGAACTTCAAAAAGGGTCGTCCTTCCTGTGCTTGCTTTACTGATGGTGCATTTTTGAAGTGCGTCCCATTTTTCAGAATC
>AZAF01012014.1/4245-4334 Dictyocaulus viviparus strain HannoverDv2000 D_viviparus-1.0_Cont414.7, whole genome shotgun sequence. 
TATATTCACACAATCGGCGAGCGGTTTTCACTGTGATCTGAGAGTTCATACTTCTGAGATCATTGTGAAGGCCACTTGCCTTGTGCCGAT
>AP006878.1/1476852-1476910 Thermococcus kodakarensis KOD1 DNA, complete genome. 
ACCGATGAGGAGTGTCATCCCTCCTGATGTCGAGATGATGACATTATCCCCACCTGAGG
>CP004044.1/1196775-1196896 [Clostridium] stercorarium subsp. stercorarium DSM 8532 chromosome, complete genome. 
ACAACAAAGTAGAAGTGTCCACTTCTCACCCTGTGTCCTGTTGACTTCAGGGTTTAAATCGTAGCAGTATGTTGCTGTGATTTAACGCAGGTGAAGTGGCTTACCTGCTTTTTTATTTGTCA
>JMSN01000007.1/154622-154723 Tilletiaria anomala UBC 951 K437scaffold_7, whole genome shotgun sequence. 
GGCCAATTGGCGCAATGGTAGCGCGTTGCTCTCCTACATGTGATGATTGCTTCATGCGCTTGGGGCAAGCAGAGGTTGCAGGTTCGACCCCTGCATTGGTCG
>LOHF01000026.1/9999-9927 Pseudomonas caspiana strain FBF102 scaffold00026, whole genome shotgun sequence. 
TGGCCTGAAGCATTGGCGGTTGATGCACTGGCCTCATAAGCCAGCGAAGGGGGTTCAAGTCCCCACAGGCCAA
>AFTD01049056.1/8014-8294 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
GGACAGTGTGGCTGTGATATCACCCCATTGATTGCTAGGGGGTGGTCCTGATGTCCTTCTCATCACAGCTCCATGTATGTTCCCTGAAGCCACTTGCTGGTTTGAGGAGGACCTTTTTAGGGGAGGACCAGTGTTTTGTCAAAGATGTACAAATAACTACACTCTCCAGCTAGAACCTCCAAACCAGCTTTCAAGGTCCATTTGTAGGGAAATGTGGTGGTCGAGCTTCGAAGACTCAGGGCATACCAAGTGAGGCAATGCGTGGCAGTCTGCCTTCCTTT
>CP000102.1/1672674-1672743 Methanosphaera stadtmanae DSM 3091, complete genome. 
AACAAATAAGGTGATGAGGTTCCACCTATTTAACTGCCAGTGATTACTGGATGATGACTTCTATTTTTAA
>LM433890.1/66331-66460 Nippostrongylus brasiliensis genome assembly, scaffold: NBR_scaffold0000505 
ATGCGTGATCTCAACACGCGTACTGCCTCCTACGGCGTACGTGTCTGTAATGCACGCTAGAACGAATGCGCCGGATTTCGCTAGCACCGCGTCCAGTGACCGGAGTTTGATAGTAGACCGGGGCACATTA
>KV440972.1/762318-763371 Phycomyces blakesleeanus NRRL 1555(-) unplaced genomic scaffold PHYBLscaffold_2, whole genome shotgun sequence. 
GGTCCGTACTTTGAGCGATTCTACCTGCATTTACTGCAGTGGAAAAGAAACCAAAAGGGATTCCGTCTTGGACTTTATTGTTTGAGATGGAGAAGCTCCAATGTTTGAACCGGAGTAGTCTTTTGACTGCTCCGGATTGTGAACTAGTGAACTGCTTTTCCAGACATACCAACAAGTCAGTAGCCTTCACTCCCTGGAAAAGGTTACTGGAGGGTGCAATCCCCTCACCTTGTCTTGAGTTCTTGTCTTTGTGTTAAGTAGCTTCCGATGAGTCGGGTTGTTTTACAAACTCCCTAATCCTGGTGAAAAGTTTCATCGAAGGCTAAATATACTTATAAAAAACCAACTGAACACAAGTACCGTAAGGGAAAGTAGCTCTTAGTGTAGAGCATACTGGACGTTAAAGACCTTCCTGAGCCACTCATATGAAGGCGAAAGCCGGATGAAATCCACGTCAGTTTTTTCTGTGTTGTGCGGCACATAACATGGAGAAGACTGAGGAACGCAGAGGTAGCTTTATGCTATTTTCTTAGGACGTTGGATATTGGCTCTCCAGATTTTGTCCTTTGGGGCATGTCAAGATTGTCACATAAAGGTGCAAGTATAAGGGTGTATCACCTGGATGCGTAGAGTTTTTTAAATTCGTTGAGCACCTGGACGTGAGGTAATACAGGTAGATTCCAGCAGAATCGACAGATTACCCAGTACAATCGCCTGTATTTTACTGCTTCCTGTTGAAATGATCCCTGTGCTTTTCAAGTCCCTCATTGCTTAGACTTTGATACTTGTAACCCACGCTCTGGTAAACAGAACTGGACATGAGGGACGAACCCGAAGCAAAGTTAAGGTGCCTAAGTAAATGCTATGCTGTTCACTTGGGTGTCTCAGACACCTGTCCCGAGCAGTTTGGCATTAAAGCATTTCACCGATACTTTGCCGTCATGGTAAATTTGATGCCATGCCGAGTAGGCAGGAATGAGGGTTGTTGAGAAGCTTGGGTGTAAACTTGAGTGGATCGGCCTTCAAGCGCAGGTCTTGACAAAAAAATCTTTGT
>GL010085.1/8876859-8876953 Loxodonta africana unplaced genomic scaffold scaffold_58, whole genome shotgun sequence. 
TAGCCTGGGCGGCGGCGGGAGCCTGCGCGGCCAGGTGGGGAGGCGGCAGGGCCCGGGCGGGCGCCTGCTGTCTGCCCAGAGCCGGCCTTTGTACA
>HF997045.1/49466-49290 Roseburia sp. CAG:50 genomic scaffold, scf107 
ATATCAAATAGAGGCGCGGTTTACCGGGTAGCAGCAAATGATAAGGAACATTATTTCCAAGGTTGTCTGTGAAGGGGTGGATCGCCGAAAGACCGGATCTGTAATGGGAGAAGGACTTGGGGCAAAGGCGGACAGCTTTTGCACTGTCATGTGAAAACGTGGGGCGCTATTCATCAG
>CP002734.1/423330-423196 Pseudopropionibacterium propionicum F0230a chromosome, complete genome. 
AACTGGCTAGGCTGTCCCGCGACGACTGACCATTCAGCTTGCCGACAACGAAGGAATCCGGTGCGAATCCGGAGCGGTGCCGCCACTGTGACCACCCGGGTGGGAGCCAGATACTTCGGGCCAGCCAAGACCGAA
>AFYH01035016.1/408-649 Latimeria chalumnae contig035016, whole genome shotgun sequence. 
GTGCCGCACCAGAGACTGAAGTCCTCTGTTTATCCACAGAACAGGTACAGCAAGGGCAGCGGCTGTGCAGGCTTCCCCTCGTATTGTAGAAAAGGCTTTCTCTCATTTTGTACTTATGGCCAGATCCTTTCTGCAGTAGGGCCCATTGCCCTGGCAGTGTGCCTCAACCCTGTCCTGGTGGGACTGCCTCTACAGGGTGAGAGGATAGTTCAGTCTCTATGCCCATTCACTCCTTGGCCTCT
>AAQR03046981.1/275629-275572 Otolemur garnettii contig046981, whole genome shotgun sequence. 
CAAAAGGCTCTCTCTTTCCTCTTTGCAGAGAGCCACCCAAATTGTAGTAAAATTATAT
>CM000866.1/73130079-73130313 Callithrix jacchus chromosome 11, whole genome shotgun sequence 
GAATGTGAGGGTGATCTGGCTGTGACATCTGTCACCCCATTGATCACCAGGGTTGATTTGGCTGATCTGGCTGGCTAGGTGGGTGTCCCTTCCTCCCCCACCTCTCTGTGTTCATCCCTCCCAATGTGACCATCCTTGATACAGGGCATATGAGTAGCTGTTATCCCCCTGCTAGAACTTCCAAACAAGCTCTCAAGGTCATGAGAGAATGGGGCAGATCTTGTCCAGTATAGTT
>AKKU01000011.1/303476-303556 Alishewanella agri BL06 contig011, whole genome shotgun sequence. 
GGATTTTTAGCTCAGCTGGGAGAGCACCGCCCGCTTTTTACAAAAATACGGTTGCCACTGGTTCGAACCCAGTACAATCCA
>JPDO01000048.1/47729-47855 Acidomyces richmondensis BFW scaffold_48, whole genome shotgun sequence. 
GCTTCGATGGTTTAGTGGTAGAATTTCACCTTCCCAAGGTGGAGGCACGGGTTGTAGGTTGCTCACCTGATTCTCGTAAATTTCCGCATCATACTTATCAATGTTGCAGCGATTCCCGTTCGAAGCA
>URS0000D6D023_12908/1-115 unclassified sequences EGFOA RNA 
GACTGCCCAGATGTGCGAAAGCGACCGTCCTAGTCCACGAAAGTGGAGGATAATGCCCTGAAAGGTGAAAGTCCTTGCTCTGTAAAGCTAGACCTGGGGGAGTTAGAGGGGTAGC
>CM002905.2/43709859-43709995 Danio rerio chromosome 21, GRCz11 reference primary assembly. 
AGCCAAAGCGTTGAGTTCAGCTCTGGGTTTCTCCCCAGTTCTGCTAATTAATCTTTGGTACAGAAAATGGCTGAGTGGTGATCAACATGAAGGGGTTATACTTTGACCTCCTTTATTAAACCCTTCAGCCGACATGA
>FWFW01000005.1/209292-208875 Pacificibacter marinus strain CECT 7971 genome assembly, contig: 0005 
ACGGATGGCTGGATGACCGCGGGTTCTGGGCGCGCAAGCGTACTGGGACGCGAGGAAAGTCCGGACTCCATTGAACAACAGTGCCGGGTAACGCCCGGCGGGGGCAACCCTAGGGACAGCGCCACAGAGAACAGACCGCCCTACGCGCGCGCAAGCGCACGCTGGGGTAAGGGTGAAACGGTGGAGTAAGAGCCCACCGCGCGAGCGGCAACGCAAGCGGCACGGCAAGCCCCACTGGGAGCAATGCCAAATAGGGGTTTCGTGTGAGGCACTGCGTTCGCGCAGAGTGATCATAGGGAGGTTCAAGCCCGAGAGACCCGGGTTGGCAGCTTGAGCGTATTGGTAACAATGCGCCTAGAGGAATGGTCATCGAGGGGGCAACCCCAGACAAAATCCGGCTTATAGGCCATCCGTGCAT
>AGTP01074074.1/1268-1332 Ictidomys tridecemlineatus contig074074, whole genome shotgun sequence. 
TCCTTGTTCAGATCTGTGTCCAAATGATTTCCTGTACTTGCAGGGGACAGGTGGGGTTTCAGAAG
>FRCC01000012.1/1582-1684 Flavobacterium flevense strain DSM 1076 genome assembly, contig: Ga0131122_112 
TTTGCGTTAGGGATGGAAGCGGCATCCTTTTGTGAGAGCAGTAATTTTCAGGTTTAAACTACTATTACCCGAACAAAAGATACAGCGTACAGCCCGACCTTGT
>CM002818.1/210608794-210608329 Capsicum annuum cultivar Zunla-1 chromosome 7, whole genome shotgun sequence 
AAGGTAGACGTTTATGACATTTTAAGACAATGAACCTGTACAATTGACCACTCTAAAAGGGCTAGAATTCTAACATTATGTTAGGACCTGAGGACCAAGAGATAGTCTCAGATAGACAATTTTTATGGGGCGTAGGCCTACTAAAAGGTAATGGAGGCATGCAAAGATTTCCTCGGGCCGAACAAAGTTTGTCCCTCGAGTTCAAAGGCAGAAGGGAGCTTGAATGCAAGACCCACCCATTGAGCAAGGACAAAAGTCTGCCTTAGTGATTCAACGGCGCCGAGTATAAGGCCCGTCGCTCAACTGATAAAAGTTACTCCTACAGATAGCAGGTTGATCTACCCCAAAAGCTCACATCGATGGAAAGATTTAGCACCTCGATATCGGCTCTAAGCCACCTAGGGTTGTAATATGTTTCAAGGGTTGGGCTGAAAATCAAGACCGGGCCGCTTTGTGGGACACTAGG
>AGTP01053200.1/11304-11443 Ictidomys tridecemlineatus contig053200, whole genome shotgun sequence. 
GGGGATGTGGCTCAGTGGTTGAGTGCCCCTGAGTTCAATCCCCAGTACCAAAATTAATTAATTAATTAAAATAAAAAATAAAGGACTATGGATGTAGCTCAGAAGTAATGCACCCCTGGGTTCAATCCCCAGTACCCCCA
>AYUG01121489.1/14996-14569 Fukomys damarensis contig121489, whole genome shotgun sequence. 
TTATTGGTTGATGTCATGATAGCAGCCATTCTTTCTAGGGTGAGGCGGAATCTCAGAGTTGTTTTTATCTGCATCTCTGGAATGAATGACTAGTAACTCAAAAACAGCTCATTGAACCCTGCCCCCTCAGCCTGGTGGAAGGGAGGGGGAGCAGGAGCCTGCAGCTTGGGTGACTCTAGATAACTTCAGGCTAATTGCACAGTGTGCACAGACACACACACGCGCACGCACCCCGAGGTGGCATCAACCCATTTGAACATCAGCCCTATCAACTTTCCATGGTAGTCATCATGCCTACCATGGTGACCTCGGGTGATGGGGAATCAGGGTTCAATGCCGGGGAAGGAGCCTGAGAAATGGCTACCACATCCAAGGAAGGCAGCAGGCATGCAAATTACCCACCTCTGACCCGGGGAGGTAGTGATGAA
>JJRU01010803.1/22820-23049 Picoides pubescens contig10803, whole genome shotgun sequence. 
GTGCATGCTGGGCTACACTTCATGAAATGGAGCTCAGGAGCAACCAATTGCTTAGCTCCTCCTAACATGTCCAACTGGCTATGAAAAGCTGGAGGTGCTGCACAGAACAATGAAGAGGAGCTATCCCACATATTAATCTGCTTATCAAGGATTGCCTTCTGTATAGGTTAATGGGAAGCATGTAAAAGGGGGGGGGGGGGGGAAGAGGGGGGGAAAAAAAGGGGGGGAAA
>LM550152.1/1576-1768 Onchocerca flexuosa genome assembly, scaffold: OFLC_contig0009332 
AATGTTGTTGCGATAGTAGTCCTGCTCAGTACAAGAGAACCGTCAGATCATTGGGTCATTGGGTTCATGTGCCTGACCGATTGGAAAATTGTACGAAGCTACCATCTGAGGGATTATGACTGAACGTCTCTAAGTCAGAATTCCTTTATCAAATTTTGTATTTTGCGTTACAAATAAAACCGAAAAAAAAAAA
>AAIZ01025588.1/144-25 Drosophila persimilis strain MSH-3 cont1.025587, whole genome shotgun sequence. 
CGACGATCGGGTCTTTCGAGTGGAGGGGAGAGTGTTGGAGTTGGCGGACATGGAGTGTTCCACCATGAACCTCGTCTGCCACTCTCATCTCGTCCACCCGCTCGAGAGGTTGCGATCGTC
>BX284602.5/14617143-14617209 Caenorhabditis elegans chromosome II 
GTGCGATGAAGGTTAATGATAAGTTTCGGCTGACTCAAATTGATGACACCTTTAATATGCTGAGCAC
>NHBU01000111.1/1-68 Bacterium TMED15 isolate TMED15 146485, whole genome shotgun sequence. 
TGACAAACATGTAGTAGCTTTTTTTGAGATGTTTTCGGACGCGGGTTCGACTCCCGCCACCTCCAATT
>AACT01044066.1/1177-1 Ciona savignyi cont_44066, whole genome shotgun sequence. 
AAACTTTGCATTAATCCTGAGAATTTGGTATTTTTGTATGATTATGACTTTAAGAGCTTTAAGAATCTTAGCAAAGAACAATTGACAATTACACTTGTGGATCATCATCACATACAAAAGTGAGTATTTGTCGTCAAAAAAATCCTGGGTTGAACTACAACAATAGTAATGTCTCAACCATGCAATAAGCTGCAATAGCTCTGGTAATCATGCAGTAAGCACTAGGTATTTTTGACTTGCTGTGTGATAATGCCTCTTGTGTTTTTTCATTTACATTCTTTTAATTATTCCTTTTAATAAAGAGAAAACTCATAAAGGTTTTTTCTAATTTTTTGTGTTATGTTAATAGTTCCCATGTGCTTCATGGGTGTGAGATCACACATGACAGAAATATTGGATCATCGCCCACAAGAATATGCTACTGCACCTGGCGTTGAAGTTTCTATTTGTAAAGTGGGTTCATGCAGTACTCTAATTGCTACGAGGGTTTTGCAGAATTTGAGAGAAGATCAACTTCTACCCGAAGTCGTCACTTTGCTGTTAGGTTGGCGCACTAGCGTCGGACGAGGGCCGCGACCGGCTGGGCGGCGGGCAAACGGCTCCGGGCAAGGTAACCCCGCTTCGGCGGGGTGCTACAGGCCCGGTGCGCGCAAGGGTCGCCGCCCGGTCGAGGAGAGATGCGCGCCGCACCTGCCCCGTTCGCGGGGCCGGGGAAGCCGTTCGAGCAGCGTCGTGTCGCGGTCCGGGACTGTCCTCAGTCCCGGGTCGTCTCGGCGCGGTTCCGAGCGGTCGCTCCCTCGCGAGGTGCCGCGGGTCAGCGGCTGACGCCAGCCACCTTCCCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGTGCGCGAGCCGCGGGGCAGTACGAAACCCGTAAGGCGAAATGAAGGTGAACGCCGGCGCGGTCCGGCGGAGGTTGGATCCCGTCCCGTCGGGGCGGGCGCACTACCGGCCGATTTTTTCCGCCCTGTCGGCGAGGTCGAGCGAGAGCGTGCAAGTCGGGACCCGAAAGATGGTGAACTATGCCTGAGGAGGTTGAAGCCAGAGGAAACTCTGGTGGAGGACCGTAGCGATTCTGACGTGCAAATCGATCGTCAAATTTGGGTATAGGGGCGAAAGACTAATCGAACCGTCTAGTAGCTG
>KV454486.1/94097-93978 Ascoidea rubescens DSM 1968 unplaced genomic scaffold ASCRUscaffold_12, whole genome shotgun sequence. 
GCAATATTCTACGGGTGCCTCATGATTTTAATTTCTAATTATGATCTATGGCTGAGATTATACCGTCTACTGGAACTCGATCAAGTTAATACTTGCGTGAGGAAGTAATATTGTTATATT
>URS0000D69B4B_12908/1-89 unclassified sequences c-di-GMP-II-GAG riboswitch 
CGGCGATTGGACACTTTGACCCCCGGGTGCGGGCAGCAGCGGTCACCAGGTTCCGGGGCGAGTGAATGGTGAGACCGGCCAATCTGCCG
>JH835753.1/1489368-1489540 Erinaceus europaeus unplaced genomic scaffold scaffold00465, whole genome shotgun sequence 
GGCTGGGCTGTTCGCAGTGCAGGAAGCCAGCTGTTCTGAGGGAATCGAGGTGTCACCAGGAGCCTTGCTATTGCAGTGGGTTGTGGTCACAGGCTGAGTCCCAGGGCAGCCTCCATCCAGGCCTCTTGTGCTGAACTGGAGAGCAGCCTGAGGACTGACTGGGGCTCCCAAGG
>CP004349.1/2893589-2893441 Polaribacter sp. MED152, complete genome. 
AACTAGCTTGCATGAGCGATAGAAACGACATCCTTTTTATGTATAAATTGGTTCTAAACTTTTTTTAGATAGCTTTAACCTTATAAAAAACCAGATACTGATACAAGTTCTGCATAAATAAAAAGATACAGTGAATAGCGCAGTTTTTG
>LAZP01002266.1/658-335 Ophiocordyceps unilateralis strain SC16a Contig_2342, whole genome shotgun sequence. 
AATTGGGCGAAGCTACCATCTGCTGGGTAATGGCTGAACGCCTCTAAGTCAGAACCCGTGCTAGAAGCGTGGACGATTTTTTCTTGCTTTGCAATTAGAAGTGCAGAAATAGGAAGTCTTCGGGCTTTCGTGTGCCATAAATTTGAGGGTCCTGGTATCTTGAGCGGAAAGGCTTGGGGTACCTGCCTTCGTAATTACAACGAAAATATGCGGGCAAGGGAGGATCTCTTGCAGACGACTTGAATGGGAACGGGGTGCTGTAAGCAGTAGAGTAGTCTTGTTACTACGATCTGCTGAGGCTCAGCCCTATGTTCTTAGATTTGT
>MTEJ01000052.1/21539-21679 Thiothrix lacustris isolate A8 Ga0073116_1052, whole genome shotgun sequence. 
AGTTTGCAGCGCTGTTTAGGTGCGCTCATTGCGGTGAGCGTTAAACGGGAAGTTGGTGCAACACCAACACTGCCCTCGCAACGGTAAGCAGGTTATGCCAATCTGATAAGTCCGACACCGGCCTGACAAGGCGCGACTCTA
>LGKD01099238.1/4615-4769 Octopus bimaculoides Scaffold8256_contig_7, whole genome shotgun sequence. 
ATAGTTTTCTTGAATTCCTGGGGTTTGCTGAACCCAATCAGAGACCATCGATATTAAACTGATTTTTAGAACGAGGCGAAGAGTTAGGGGCTTGCTCCGCCTTTGTCACGGGTTGGCCTGGTATATCAGTACTTCTAGGATTCAGCCCATCTCCC
>MKVI01000100.1/16871-16982 Legionella sp. 40-6 scnpilot_expt_750_p_scaffold_1464, whole genome shotgun sequence. 
TGCCTTGGTAGAATGATCGCCTTTAACGAATACTAAGTAGTTCCGGGAGTGAAGAATGTCGCTAAGTAGCGCAGATAAAGCAGCAATTGTAAATGAGTTCAAGCGTGATGAC
>LBRP01000004.1/36699-35151 Parcubacteria (Nomurabacteria) bacterium GW2011_GWF2_36_19 US08_C0004, whole genome shotgun sequence. 
AAAGTATCTCTGGCAACTGTTTATCAAAAACACAGCTCCCTGCGAACTCGCAAGAGGATGTATAGGGGGTGACACCTGACCAATGCCAGAAGGTCAAATATCGGTGGTGCATGGTCGCAAGATTGTGTGCTGGCTGATATAAGCCCTGGTGAATGTCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAGTACCTTGTCGGGTAAGTTCCGACGCGCACGAATGGTGTAATGACTGGAGAACTGTCTCGAAGACCTGCTCGGTGAAAATACAATACCGGTGAAGATGCCGGTTACCTGCAGATAGACGAAAAGACCCTAGAAGCTTTACTGCAGCTTGATATTGAGTATATTGTTTTAATGCGTAGCATAGATGGGAGAGGTTTGATGGTTAGGGTCTCGGCTCTGATCTACTCGTCAGTGAAATACCATTCTTTACAATAATATGCTCTAATCTCTAAGGCAAAAACTTAGAGAGACAGTATCTGGTGGGTAGTTTTACTGGGGCGGTATCCTCCTAAAGAGTAACGGAGGAGTTTATTAAGGTTAGCTAGGCGCGAATGGAAACCGTGCCGATAGTGTAATGGCACAAGCTAGCTTAACTGTAAGACGTACATGTCGAGCAGATACGAAAGTAGAACATAGTGAACCGACATTTCGCATTAGATGCGGATGAAGATTAACGGATAAAAGCTACTCTAGGGATAACAGGCTAGTTCCGCCTAAGAGTTCATATCGACGGCGGAGTTCGGCACCTCGATGTCGGCTCACCTTATCCTGGTGGTGGAGAAGCTGCCAAGGGTTTAGCTGTTCGCTAATTAAAAAGGTACGCGAGCTGGGTTCAAACCGTTAAGATCATAAACGATTGTGATTTTAACAGTTTGAACCGTCGAGGAAAGTAAAGAAATCTCGTATATTTCTTTCAATGTTTTAATCTGAGATTAAGACCGCTATACACAGTTGTGTATATCACGGCGGCCCCGCCAATAAAACGACGGGGAGAATTTCACTTATATCGGTGAAGTCCTACTTTTATAAAAGAGGATAATACCGAGGGAAGCGTAAGCACCCGTAGAGACTAAATGTGAAATATTTTTTGAGAAATCAAAAGAGAAAGTTATAGTCCAATCCCACAAGTAATTGTGGTTCCCATTTTTGTATTTAAACGCGCAAAAATGAAGAGACTAAATCATTTTTAGTAAAAAATGATCGTCCGAACTTTTGTTTACAAAAGTTTTAGGAAGTAAAATATAGATGCGTGAGACAGGTTGGTCTCCTATCTACTGCAGGCGTTGATTCTTGAGAAGATCTGCTCTTAGTACGAGAGGACCGGAGTGGACTGACCTCTGGTGTGTGGGCTCTACTGCCAAGTGGACTGCCCAGTAGCTATGTCGGGAATGGATAAGTTCTGAAAGCATCTAAGAACGAAGCCAACTTCAAGATGAGGAATCGTTTGAGAAACCTAAGAGATGATTAGGTTGATAGGCACTAGGTGTACAGACAGTAATGTCTTTAGCCGAGGTGTACTAATCGTTCGATTCCTATTAGGAA
>CM000244.2/78118522-78118698 Rattus norvegicus chromosome 14, whole genome shotgun sequence. 
AGCTTTGCACAGTGGCAGTATCGTAGCCAATGAGGTTTATCTGAGGCGCGATTATTGCTCATTGAAAACTTGCTCACAACCTCCGGTTCCCCCACACACACATACACACTATAAGCCCAGTATCGATGAGCTGTGCCCTGTCCCCTGCGTGCCTCATTTTCTGGCCCACAGCTCTGT
>CH476646.1/112655-112774 Sclerotinia sclerotiorum 1980 scaffold_26 genomic scaffold, whole genome shotgun sequence. 
GGTCGTGTGGTCTAATGGTTATGATATCTCGTTCACAAACATGTGTTCATCAATTCTGATTTCGATTGTACCCGTTATCTGATTCCGAGATGGTTCCCAGTTCGATCCTGGGCACGATCA
>MLBF01000159.1/890-1 Desulfosporosinus sp. OL contig00159, whole genome shotgun sequence. 
CGACTGGAAGAGCACGTCCAAGCAGTGAGGCTGAGTTTACAGGCAAATCCGTAGACTTAAGGCTAGGCTGTGATGGCGGGAAGGAATTATAGTACCGAAGTCACCGATCTCATGCTGCCAAGAAAAGCCTCTAGTGAGGAATGGGGTACCCGTACCGTAAACCGACACAGGTGGGTGAGGAGAGAATCCTAAGGCGCTCGGGAGAACTCTCGTTAAGGAACTCGGCAAAATGACCCCGTAACTTCGGGAGAAGGGGTGCCTCGATAGGGTGAAAGCCCGAGGAGGCCGCAGTGAAAAGGCCCAAGCGACTGTTTAGCAAAAACACAGGTCTCTGCAAAACCGTAAGGTGAAGTATAGGGGCTGACGCTGCCCGGTGCTGGAAGGTTAAGGGGAGAGGTTAGCGTAAGCGAAGCTTTTGAACCGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCAGGTAAGTTCTGACCCGCACGAATGGCGTAACGACTTGGGCACTGTCTCGACGAGAGACCCGGCTGAAATTGTAATACCTGTGAACGATGCAGGTTACCCGCGACAAGACGGAAAGACCCCATGGAGCTTTACTGTAGCCTGATATTGAATTTTGGTACGATCTGTACAGGGATAGGTGGGAGCCAGAGAAGCCGGACCGCTAGGTTCGGTGGAGGCAATGGTGGGATACCACCCTGATCGTATTGAAATTCTAACCTACATCCCTAAACGGGATGAGGGACCGTGTCAGGTGGGCAGTTTGACTGGGGCGGTCGCCTCCTAAAGAGTAACGGAGGCGCCCAAAGGTTCCCTCAGAATGGTTGGAAATCATTCGCAGAGTGTAAAGGCAGAAGGGAGCTTGACTGCGA
>DF087494.1/2012-1880 Oryzias latipes DNA, scaffold4344, strain: Hd-rR. 
GGCTTAATTTGACTCAACACAGGAAACCTCACACGAAGGATTGACAGACTGATAGCTCTTTCTCAATTCAGTGAGAGGTGGTGGAGTGATTTGTCAGGTTAATTACCCCTTGTGCTATCTTAGATGACCCCAC
>BA000039.2/1466104-1465982 Thermosynechococcus elongatus BP-1 DNA, complete genome. 
TTGGCGACGTTCACTGTGAGAAGCAGCCTGTAGGGAAAATCCAGTGCAAGTCTGGTGCTGTGCCGCAGCTGTGATGGGAATCTTCCCTCAGCCAGAATGCCTACTTGCTGTGGTTCACTCTAT
>LCPG01000034.1/4881-5287 Parcubacteria bacterium GW2011_GWA1_48_11b UY24_C0034, whole genome shotgun sequence. 
TGAGGGCGTAATAAGAGCGTATGGTGGATGCCTTGACACAAAATGGCGATGAAGGACGTAGCGTAGCTGCGAAAAGCCCCGGGGAGGTGTGTAGCAACCTTTGATCCGAGGATATCCGAATGGGGAAACCCTCCGCGGTAAACCCGCGGAACCAGTGCGTTGCACTGGAATGACTAATTCCTAATTGACCTAATTCCTAATCAATTTCTAATGCCGAAATGTCCAATGTCTAAAATTATTTTAGTCATTGGCTATTAAATCATTGGGGGTTTATTTAGAAATTAGAAATTAGAGCTTAGAAATTCCACTGCAGCGCAGTGGCGTGGTAGGAGAGCATTCTTAATGCTGCGAAGGAGGATCCGCGAGGACCTCTGGAGCGTTAAGAAGAGAGAATGTTGGTATGAGTA
>JPKY01000002.1/344887-343367 Acremonium chrysogenum ATCC 11550 scaffold2, whole genome shotgun sequence. 
CAATGCGCGTCGCCTCCCCCACAGTCCTCCGATTCTCGTTTTCCGCAAGGAATGTCTATCGTAGACCCCCCTCACAGGCTGGTTTGCCCACGGTGTGCCGCTCTCGAGCCTGTATCAGGACCTCGCTGCCAGCCGCATTTGGATTCACCGTGGTCTCTTGCCGTCGATTCCTCGAGGTCCAGCCTAGCCCGGGGGAACGATGTTTCGGAACTTAACCCTAAGTATACACGTGGTTTTCAGTTTTGCGCTCTTGTCGTTCGAACCGCCTTCTAAGTTGGCCGGGTTGTACCAGGAGACCGACACCGCTGAATAAGCGGAAGGCTGAACGGAACACCTACGCCGACGGACTGCCGGGGAGGACAGCCCAGTCACCTCACGGTGCGCAAGAGGGGGGATGCCATGAGCCGTATCGGTAAGAGCCTCTGGTCTGAGGACGCTCGTCGGCCCTGCCCGCTGGAACTAGCACAATGGTCAAGAGTAGGCCGTCCAGGAGGTGCTGTCGGTTTGAGGGTGCGGAAGTTGCTGGTCTGCTATGAGCTTGACCTCCGGGTCGAGCCTTGGCGGCAAAGGCGTCGGAAGTACGAGAAGAGAGGGTTTGAGCACAGAACTGGCCACAAACAATCAGCCAAGCGTTTCGACATTCTCCGCCCTGAAATGCTGCTTTGCCGGAAAGCCCACTTGCCCGCGAGCCAGTTGGGTTGCAAGGACTTCAGGCTACACACGGAAACGAAAACGGCTGATCATATCCTTCGCCATTCTGCGAAAGCTCTCGGTACCCTCAAACTCGTACAAGTCCCGTCGTCGCTGTTCATGGCAACCACTGCAACCAACCTGCACTTCTTCCCGTGGCTCCCTGTACCGCACCACAGCAGTAGCTACCGGTGTGTGATGCTGGTTGCATCTGGCCTGGCCAAGCGCATTAACGTCCGGCCGTAGGCTCCGTCCTGCGGCTCAGGAAGGCGCCAGTCACTTGTCGCGGTCGTCCCGATTTGCGACAGCTCCCTCCGGTTCGCACTCTTGTGGTGTACCTGGAGACGATAGCTCGGCTTTTATGGATGTCTTTTGGCCGTGCGGAATGCCCTCCTTGCTCGCTCTGTGAAGAGCATCTGGAGAGGAAATCAAAAACCAATCCTTGTTGGCAGCGCAACACAAACAGAAGGAGCTCTCGGTACCGGTCCTGGACTCTTGGAAGGCTATGGCGCGACTGCGCGGAAAACATACGACGGCATCGGGATTTTGCGATACTTGTTTGGGAGAGGCGATACCGGTACATAGGCACTGGCGTCTCTGGGTGCTTATTCCTCGTCACGATTGCTTGCATCACTGGGACCCATCTCGTGTTGGAGTCAAAGTTTCGTACTTGTCCGGCGGTGTTGGTACTGTGGCGTAAAGGACCTGCTCCCAGGATCCTAAGCCTCGTCCCGTCCTTTCATATTGGATCAAGGGGCAAGCCAAGCAGGGAGGCAGCCCCGGCTGTCCTCGTGCCTGAAATGGTGGGAGGACAGCCCCCCTATGGTGAGG
>CP010557.1/4001542-4001177 Raoultella ornithinolytica strain S12, complete genome. 
TATGGCCGGAGCAGGGGTGCGAGCAGCAAACCTGTCGCAGTTCCTCGAAGCCGGCGTAAAAGAAGTGCACAGCTCCGCCGGCCAGTGGCTGCCTTCGCCGATGCGCTTTCGTAATTCCAGGCTGTCGATGTCTACGGATGCCGAAGCAGATGAATATTCACGCTATGCCGTTAACGGCGCAGCGGTGGCGGAAATGAAGAGCATTATTTCCGCCTGAGTGCCCGCATTGTTTGCGCGCAGCCTGCGGGCTGGTCAGCACAACGGCTGCGGGCAGAGAGAGAAAACCGTTTTTTGCTGCACATCATGTCGCCCAATATGATGATTGCCCGTACCAGGCCCCTGCAATTTCAACAGGGGCCTTTTTTT
>ALWZ043173632.1/1-308 Picea glauca, whole genome shotgun sequence. 
GATGGGGAATCCTTGTATCAAGGGTGCACTCTGCATGAACATCGAAAGAGAATTGGGTTAATATTCTCGAACCGGGACATGGTGGTGGACGACAATGTTAGGAAATCTAGAGATGTCATCGGGGGCCTGGGAAGAGTTATCTTTTCTTTTTAACGACTTTCCCACCCTAAAATCAGTTCAAATGGAGATAGGGTCTGTAACCTACCCACTACTTAAATCAAATTTTTCCAGTCCTCTGTCAGACTCGATCTCCTAAATAACCACAGAGATCCAACGTAAACTAGCTCTTTCTATTTTCTTCCCCATTC
>JJMO01001155.1/572062-572450 Vigna radiata var. radiata cultivar VC1973A scaffold_43, whole genome shotgun sequence 
ACGAGGAAGGGCGTAGTAAGCGACGAAATGCTTCGGGGAGTTGAAAATAAGCGTAGATCCGGAGATTCCCGATATAGGTCAACCTTTCGAACTGCTGCTGAATCCACGGGCAGGCAAGAGACAACCTGGTGAACTGAAACATCTTAGTAGCCAGAGGAAAAGAAAGCAAAAGTGATTCCCGTAGTAGCGGCGAGCGAAATGGGAGCAGCCTAAACCGTGAAAACGGGGTTGTGGGAGGGCTATACAAGTGTCGTGCTGCTAGGCGAAGCAGCATAGAATGCTGCACCCTAGATGGCGAGAGTCCAGTAGCCGAAAGCATCACTAGCTTACGCTCTGACCCGAGTAGCATGGGGCACGTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
>HG722747.1/1-1525 Eimeria necatrix Houghton genomic scaffold, Enh_scaff2711 
AGTGACTGACTATACTCCCCGAGGAAGGTAGGCTTTTCGTGGGCTGTTATAGCCTCTGGGTTTGTGTTCAGTTGTTCACTGAGGTGTGTTTTGTTTGCGTTCGTCAGCTGCACTTTCGAGTACTGGCGTTCTGCGATGCTGTCCTTAACGGTTTCAACCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATATGTGCGAGTATGCGGGCAGAACCCCTGTATGCACAATGAAAGTGAGAGTAGGGAGAGGTTTTGTTTTTTTGGCAGGCCTCGCACCTACGACCGACCACGAGCTTTGCGAGAGGTTTGAGTTGTAGCACATCTGTTAGGACCCGAAAGATGGTGAACTATGCCTGAGTAGGGTGAAGTCAGGCGAAAGCCTGATGGAGGCTCGTAGCGATACTGACGTGCAAATCGTTCGTCAAACTTGGGTATAGGGGCGAAAGACTAATCGAACCGTCTAGTAGCTGGTTTCTTCCGAAGTTTCTCTCAGGATAGCTGGAGTTCAGTTAGTTTTATCAGGTAAAGCGAATGATTAGAGGCCTCGGGGGCGCGTTGCCCTCGACCTATTCTCAAACTTTAAATGGGTAAGATCCAGCGGTTACTTCACTGAACTGCTGGGGTTAATATGAACTCCANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTAGGGTTGACTGGTTGGTAAAGCTTCCTGGCTTCCAGGGAGTCCGGTGCGCTCCTGACTGCCCTTGAAAAGAGGAGGGAAAGTTGTTATTTGCACCCCTGGCCGTACCATTAACCGCATCAGGTCTCCAAGGTTAGCAGCCTCTGGTCGATAGAAGAAAGTAGATAAGGGAAGTCGGCAAAATGGATCCGTAACTTCGGGAAAAGGATTGGCTCTGAGGGCTGGGTGCATAGCGCCAGTGCGTTCTTCGTTGGTCGGAGCTGTGCGGGCCCGTTCGTGCTTCGCGGCGCGTCTGTGGACCGCCGGCACTGACTGCGTTGTGACCCTTGGTCTGCGTGCACAGTGAACAGCTAACTCAGAACTGGAGCGGACAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGCCGCAAACGGTGTTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAATGTGATGAAATTCAACCAAGCGCGGGTTAACGGCGGACGTAACTATGACGTGGAAAATTTTGCTTGCTGGGTTTTTGGAGTGAGTGGTCCTCCCCAAAGAAAAAGGAAAGAGATAGTTTGTAGGGAGCCTCAGCTCCTACGGCACGCCCAAAGTCTAGGGCCAACCGTTTTCACTCGCCATAACATACATCTACTACCGAGAGTGACTAAGTATAAGTGCATCATTTGTGTACTATTCACTGCATGTTGGCTGTGCGAGAGCGATTTCCTCCTCGCGCCCGCCTTGATCCATTGTCAGCCACGTGAAAACCCCAGAT
>AVBC01000026.1/54293-54503 Halomonas huangheensis strain BJGMM-B45 contig41_scaffold4, whole genome shotgun sequence. 
TGAGCGCACACCGTCTCGGCTTTCCCGCAGATGTGTTGGGGTGAAACGGGAAGTCGGTGATATTCCGACGCTGCCCCCGCAACGGTGATCGAGTTAAATACGGCCCATGAACGCCACTGTGTACTGCATGACAGTCACGGGAAGGTGGTCGTATCCAACACCCTGTGTTGACTCGTCAGCCCGGAGACCGGCCTGAGATTCCATGCCAGGG
>URS0000D67C52_12908/1-206 unclassified sequences RAGATH-7 RNA 
ACUAUACCGCUUUAUUAUGCACAAAUAAAGUUAAAGAUUGUAUAGUAAUCCACGUGGUAGAGGCACAGUUAGGUUCGCUGUGGUGCAACUCUUAGUAGCAACUAAUCUAAAGCAAGUAUGGGAGAAUAGGUUUAAACUAUUUUUAGGUAGUUAAAAAUACGUAAAAUCCGAUCCUAAUAAGGUAGCAUGAUAGUAUUAGUGCAGAU
>CM000812.5/30921558-30921482 Sus scrofa isolate TJ Tabasco breed Duroc chromosome 1, whole genome shotgun sequence. 
GCTGTACATGATGACAACTGGCTCCCTCTACTGAACTTCTATGAGGAAACTGCCATGTCACCCTATCTGACTACAGC
>HE717023.1/2219309-2219667 Halobacillus halophilus DSM 2266 complete genome 
TTCCCATAGAAGTACTCTGGAGTTTATTTTTCCGAGTTTCTATGGATTTTTTATGTTCTTATCATCATTTGTGAATTATCACGTATTACGTGTAAGAAGTTTTTAGGAGGATTCATATCATGCAAAACGGTACAGTAAAATGGTTTAACGCGGAAAAAGGTTACGGCTTCATCCAAGTAGAAGGTGGAAATGATGTATTCGTACACTTCTCTGCAATTCAAGAAGAAGGTTTCAAATCTCTAGAAGAAGGTCAAACCGTTTCTTTCGAAATTGTTGAAGGCGACCGCGGACCACAAGCAGCTAATGTTGAAAAACAATAAATAAAATCCAAAGCAGCCTCTATAGAGGCTGCTTTTTTT
>CM002888.2/48184797-48184945 Danio rerio chromosome 4, GRCz11 reference primary assembly. 
AGACAATCGCGGCTTCTCGTTGGACAAGAGTCTACAGTCTACAGTTACCATTGCACGTTCCCTGGGCAGATGTCTGCGAACTCCCCAAATGTGGGAATCTCGACTGCATAATTTCTGGTAGTGGGGGACTGCGTTCGCGCTCTCCCCTG
>LXTC01000002.1/1795932-1795468 Metschnikowia bicuspidata var. bicuspidata NRRL YB-4993 METBIscaffold_2, whole genome shotgun sequence. 
ATGCCAGTATCAATACCAACACCAGTGTCGAATCAATTAATACCAACACTGAATACCAACACTAATGAATAGCTAAACCAGGATAGACACCAACAAATACCAACACTAAAGACCAAAACTAATAAATACCAATACAAGTATCAATACCGATAAATACCAACACCAATAAAAACCAATACCAATAAATACCAATACCAGTACCAACACCAATATCAATACCATTACCAATTCAACACCATTATTGGTATTCAGTTGTAAAAGGTGAAATTCTTAGATTTTCCAAAGACTAGCTACTGCGAAAGCATTTGTCAAGGACGTTTTCATTAATCAAGAACGAAAGTCAGGGATCGAAGATGATCAGATAGCGCCGTAGTCTTAACCATAAACTATGCTGACTAGGGATGGGGCGACGCCTCATGTAAATGACAGGCCCAGCACCTTACGAGGTATCAAAGGTTTTGGGTT
>AVOS01044062.1/5145-5403 Chaetura pelagica isolate M959 contig44062, whole genome shotgun sequence. 
CATTAGGGAGGGAGAAGATCATGCTTCATTTCAGACCTGCTTCTCGGTTCAGGATTTTGTGAGATTTGGTAGTTTAAATTTTTTTTTATGTCTTATTTGTCAGCTACACTGACTGGCTCAGCTTGTGTCTGCCCTCTGCCGGCAGGCATGGGTAACCCATTGAACCCCATTTGTGATGGGGATTAGGGATTGCAATTCTTCCCCTTGAACAAGGAATTCCCAGTAAATGCGGGTCATAAGCTCGCATTGATTAAGTACC
>GL433863.1/231672-231585 Chlorella variabilis unplaced genomic scaffold CHLNCscaffold_29, whole genome shotgun sequence. 
GCACCTATGGTGTAGTAGGTTATCACACTCGCTTAGTAGTGCTCTGTTGAGTAGCGAGAGGTCTGCGGTTCGAATCCGTGTGGGTGCA
>LCQF01000020.1/16551-16970 Parcubacteria bacterium GW2011_GWA2_49_9 UY50_C0020, whole genome shotgun sequence. 
CTGATGGGAAACAAGGGCGTATGGTGGATGCCTTGGCTTAAGAAGGCGATGAAGGACGCAGCGTGGCGGCGATACGCTCCGGGGAGGTGCCGAGCAACCTTTGATCCGGAGGTCTCCGAATGGGGAAACCCTTCCGTGTAAACCACGGAAGCCGTGTCTTACACAGAATGTCTAATTTCTAATTAACCTAATTCACCTAATAAAATTCCAAATACCAATACCAAATATCCAAACCGGACTTTGTGATTGAGCATTTCTTTACTTTGGGTTTTTATTAGAAATTAGAATAATTAGATGAATTAGGAATTCCGCGTAGGACGCGGCGCGTACCCTGGGAAGTAAAACATTTCAGTACCAGGAGGAGTAGAAACCAATAAGTATTCCGTCAGTAGCGGCGAGCGAACGCGGAGAAGCCCAAAC
>LCPW01000021.1/2447-2376 Candidate division CPR1 bacterium GW2011_GWC1_49_13 UY40_C0021, whole genome shotgun sequence. 
AGCGCGGAAGCCGAGTGGTGAGGCGGACGGGCCGCAACCTGTCGGATGAAGGTTCGAATCCTTCCCGCGCTT
>JXRR01000014.1/312777-312893 Jeotgalibacillus campisalis strain SF-57 contig00014, whole genome shotgun sequence. 
AACCTTTTTAATTAAAGTCCAGAGAGGCTTTCAAAAGGGAAGAGCAGCTGCCGCTAAATGTGATGCAGTGTATCTTTTGAACACCTTTTGAGGGCTTTTCTCAAAAGGTGTTTTTTT
>JH207677.1/46913-46403 Pelodiscus sinensis unplaced genomic scaffold scaffold782, whole genome shotgun sequence. 
GTTTTCACTTTTTTTGATTGTATCCCTTTCGTATATACGGTCATGCCAATTTTCTTCCACAATTTCATCTGAGGAAGTGGGTCTGGCCCACGAAAACTCATCACCTAATAAACCATCTTGTTAGTCTTTAAAGTGCTGCATAGTCCTGTCTTTTGTTTGAGAAAAAAAAAACAGGTTCCAACTAAAGTAAAAAGTTTGGGAAACCCTGGTCTAGCCAGCTTTCTCTCCATCTTACAGTCCATTTATCCAATCCATACTCCCTTAACTTGCTGGCAAGGATATTGTGGATGACCGTATCAAAAGCTAGAGGTGAAATTCTTGGACCGGCACAAGACGGACCAAAGCGAAAGCATTTGCTAAGAACGTTTTCATTAATCAAGAACGAAAGTCGGAGGTTCGAAGACGATCAGATACCATCGTAGTTCCGACCATAAACGATGCCGACTCACGATCCGGCGGCGTTATTCCCATGACCCTCCAGGCAGCCTACAGGAAACCAAAGTCTTTGAGT
>URS0000D6955D_12908/1-88 unclassified sequences c-di-GMP-I-GGC riboswitch 
GUUGAAAAAGGUACACUAUCCCAAAGGGUAGGCCGCGAAGUUUUGGGUCUAAAUCACUUUUAGUGACAUGAUUGCCAAGCUGCCGAUU
>CAWC010010349.1/2261-2560 Onchocerca ochengi, WGS project CAWC01000000 data, contig: 07842_10349 
TAGCATAGATCCGAAAGATGATGAACTATACTTGAGCAGGATGAAGCCAGAGGAAATTCTGGTGGAAATCCGAAATAATTTTGACGTATAAAACGATCGTCTAACTTTGGTATACAGGCGAAAGACTAATCGAACAATCTTAGTAGTTGATTCCTTTTGAATTTTCCCTCAGAATAGCTGGAATATGTAATGAAGCTGTTATATTCGATAAAGTGTTTGATTGGAGGAATAGTGGGACGAAAAATTTTCAGTCTGTCCCCAAACTTTCAAATGAATATGATATTTCGTTTGCTTGAATGA
>URS0000D6BF5F_12908/1-247 unclassified sequences ARRPOF RNA 
CTAAACCCTACAAGAATATTTTCAAAAAATTTCATCATACAATTTGTGATGAGCTGATAGGCACTAATCAGTCCAAGTCTTTTAAAGGTTGGTAGGAATTGTTGCAACGTGAGGACAACGGAACAAAGGTCAGGTGGTTTATTGTTTTGGGGTGTCTTTTATACCTTTATAAAACTGAATGTAGGCAGTTAAGGTCGAACACGTGGGCAATAAAGCGTGGATTGTATCAAACAAGTAAAAGGCAAGT
>CAWC010018757.1/493-342 Onchocerca ochengi, WGS project CAWC01000000 data, contig: 15636_18757 
TCGTTGCGATGGTAGTCATGCTCAATATGATAAGAACCATTGGTTTAGACATTTAGTTCATATGCTTGGCCGATTATACAATGGTGTGAAGCTATCATTTTCGGTACTATTACTGAGTGACTCTAAGTTAGAAATCCTTCTGCACATGATGA
>AASG02003498.1/19751-18974 Ricinus communis cultivar Hale ctg_1100012349913, whole genome shotgun sequence. 
TACTTGGTTGATCTTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTGTAAGTATGAACTAATTCAGACTGTGAAACTGCGAATGGCTTATTAAATCAGTTATAGTTTGTTTGATGGTATCTGCTACTCGGATAACCGTAGTAATTTTAGAGCTAATACATGCAACAAATCCCAACTTCTGGAAGGGATGCATTTATTAGATAAAAGGTAGACGCGAGTTTTAAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCCCAAATTAGCCAATCCTGACACGGGGAGGTAGCGACAATAAATAACAATACCGGGCTCTTTGAGTTTGGTAATTGGAATGAGTACAATCTAAATCCCTTAACGAGGATCCATTGAAGGGCAAGTCTGGTGCCACCAGCCGCGGTAATTCTAGCTCTAATAACATATATTTAAGTTGTTACAGTTAAAAAGCTCGTAGTTGGACCTTGGGTTGGGTCGACCGGTCCGCCTAGCAGTGTGCACCTGTCGTCTCATCCCTTCTGCCGGCGATGCGCTCCTGGCCTTAACTGGCCGGGTCGTGCCTCCGGCGCTATTATTTTTGAAGAAATTAGAGTGCTCAAAGCAAGCCTAAGCTCTGTATACATTAACATGGGATAACATCATAGGATTTTGGTCCTATTCTGTTGGCCTTCGGGTAAAAGAAATTATGGCACAGCTAAGAGTTGATTGTACTTCGTCAATTAAGAGCATCAGATCTTGCAGTCTAATGAAACCTTAGCAGAACAATG
>ABGB01000728.1/1246-78 Enterocytozoon bieneusi H348 ctg01_1523, whole genome shotgun sequence. 
TGTGTGGAAGTTCCGGAGCAGATCTTGGAAGTAGTAGCATCATTTGTATGTGCCAATGGAGGCGGGTTTGTCCTTTTAATAGAAGGAAGTGATACGAGCCTAGTAAAAGGGAATATAGTAGATATTCTATATAGATGTACCTATGTGGCGACACGACAGCGACCCCAACGACGTGTGCCGGTGAGAATTTTCCGGGACACCCAGATCTTATGAGCGTCACGCTGAGACTAAGAACGAGTTGGGCGGTGAAAATGAAGGAACATCCTCGTACCGAACCGCAACAGGACTCCTAGGTGAGAAGCCTAAGGCATAATTGTAATGTGAGCAAGGGAAATCGGCAAAATGGATGAAAAACCTCGGGATAATCATTGGCTCTAGCATGCTAGAACTGGGCTTACAAGGGGAATCTGACTGTTTAATAAAAACATAGCTTTGTGTGTACGCAAAGTGAATTCTGCCCAGTGCTTGGGACGTTAAGGAAGTAATTTTAAGTACGCACCTGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCGCCTAATTAGCGACGCGCATGAATGGAGCAACGAGATTCCCACTGTCCCTGCTCACAGATTTGCGAACCTACAGCCAAGGGAACGGGCTTGGGACATGCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGCCAAGCACAGGCCTCTGTGACTATATCGTAGCGAGGTGGGAGAAATGTGTGAGACCACTGACATAGTCGGCGGGGGCACTCGCAAAGCTTGGTGGGGAGTTTGGCTGGGGCGGCACGACTACTAAAACATAACGTAGACGTCCAAAGGTAAGCTCCGAGGGGATGGAAACCACTCCGAGAGTATAAGGGCAAAAGCTTGCTTTAGTTATTAATGTAAATTAATAATACTGGAAACAGGGGCCTAGAGATCCTCTATGAAACTAAGCATAGAGGTGACGGAAAAGTTACCACAGGGATAACTGGCTTGTGGCGGCCGAGCGTCCATAGCGACGCCGCTTTTTGATTCTTCAAGGTCGGCTCTTCCGAGCATGGGGGAATATCAGCCACCAAGTGGTGTGATTGTTCACCAACTTACAAGGGAACGTGAACCTGGGTTTAAACCGTCCCGAGAAAGGGTAATTTTTACCCTACGGCATTCCCTT
>CP006019.1/170272-170332 Palaeococcus pacificus DY20341, complete genome. 
ACCGGTGATGACTTTGCAGGGTAGCTACTGAAATTGATGAAGAAGTCGCTCCAGTCTGAGG
>LDJP01000070.1/64830-64953 Stenotrophomonas daejeonensis strain JCM 16244 contig_70, whole genome shotgun sequence. 
CGATGAAGGCGAACAGCTTCCAGCACGAATCCAGCGCCGCCCGGCAGGCCACCGGCATGACCTCGCGCGCGCGTCGACCGGAACCCCACATCCTCGCTGGGTAACCGGAGCTTCGTGCTGTCTG
>CP001043.1/1023491-1023327 Burkholderia phymatum STM815 chromosome 1, complete sequence. 
ATGAGTGCCTGTTCACATACTTTTTTCCGCAGTTGCGCTGCAGATCGCGTAGTCGTCGTCGCTGACCACAAGGCAGTGACAACGGCAATGAAGCGAGCCACGAGGCGCCATGCGATGACCGAAGTCGAGCCGCTTGCCCCGGTTGCCGGGGCGGCGGCTTTTTTA
>URS0000D6A032_12908/1-68 unclassified sequences type-P1 twister ribozyme 
AAUUUAACCUCGCCUUAUUAUUUAAGAUAAUAUGCUGGUGACAAGCCCAGAUAAAGAGGGAGUCAAAU
>MHIB01000050.1/15016-14517 Candidatus Buchananbacteria bacterium RIFCSPHIGHO2_01_FULL_39_14 rifcsphigho2_01_scaffold_9139, whole genome shotgun sequence. 
CAAGTAAGCAAGGTGGTCGCCCCCTCACTTGGTCCGATGATTAGTATTTAGGAAACATAAATACCTTATATATTTAATCATTAAGCCAAGTGAGGGGGAGGAAAGTCCGAACACCATTCCCGATTTAATGTCGGGGTAAAATGGCAACTCCTAACGGGAGCCGAGAGTAACAAAAGAGTAGAAGCGCTTAAGACTTCTGCACTTTTGCCAAGCTTAGGGCAAGTGCAACAGAAAATATACCGCCTAAGTCCTCCGCAGTTGCGGTGGAACGGTAAGGTTGAAATCGTGGGCCCACCTTTGGGTGGGATACCCTCGCTTCGGCGAGATAAAGTAAGAGCCCACGGCCGACAGACTGGTAACAGTCGGGTTGGTAAACTCCTGCCTGGTGCAATGCCAAATTAGGTAGGCAGCTTGATCCCGACGGCAACGTCGGGACCAGATAGATGACCACCCCCCTTAAAAGTGGGTGACAGAATTCGGCTTATTAGCTTACTTGGATA
>AFTD01027444.1/26113-25813 Cricetulus griseus cell line CHO-K1, whole genome shotgun sequence. 
GGATGGGAGGGCCATATAGCTGTAGCTCCTTTCATCTCATTGACTACCAGGACTGATTTGGTTGGTCTGACTGGATTGATAGGTGTCCCCTTCCTCCCTTGTTGTGCATCTCTCTGGAAGCTGTTTGCTCAGCTGGTCAAAGAGGATGACTTTTCCCTTAATAGAGGACCAGTCTTTGGTCAAGGGCATACAGGTAACTACCACCTCTGTTAAAAGCTCCAAACAAGCACTCAAGAGCCTGCCTATATATTTGAAAGAGATCAGACTTTGCCTCTAGGTGGTGCCTTGAATGGCTGTAAGA
>NGMM01000004.1/415496-415725 Enterococcus sp. 9E7_DIV0242 scaffold00004, whole genome shotgun sequence. 
AAATAGACAGAGAGCAAGAGGAGTACTGTCAGCGGGATTTTTAGAGAGAAAATCGGCTGGTGAAAGATTTTACGATCCTGACAGGAAGGTAGCTTGTGAGTCAATCATTTGAACAATTTTCAGTAGGGTGGTTCGAGTCGTGATCGTTATCTCACGTTGAATGAAGAGGTAATTGATTTATTTGATCAATTACAAATTAGGTGGTACCGCGTAGTATTTACGTCCTAAAA
>HF991826.1/221174-221022 Clostridium sp. CAG:678 genomic scaffold, scf125 
ATCAACTACTCAGTACTAAATAATTGAGCCTATCTCAGTAACAATGGTGCGTTCGTTTGAACAAGTTGACTACCCTAAGTCTTGAAACAGAGGCTACGTTATACAAGAATATATAGTCACCGGTGGGCATTTGCCCTAACCTGCCGCTCTGAG
>LK878649.1/3737-3610 Ascaris lumbricoides genome assembly, scaffold: ALUE_scaffold0006683 
TTACTAACCTTCATGGCGAGGCTTGGTCATTGCACTTTCGACCAGGCTGACCCGTGTGGCAGTCCCGAGTTGGGATTGGCCAACAGCATAATTTTTGCGTTTGGGGACAGCGTTCGCGCTTCCCCGCT
>ALWZ041214672.1/20-119 Picea glauca, whole genome shotgun sequence. 
ATATTTTTAAAAATTAACGTGATAGTACAATTAAGCATGCTCGAGACAGAGTAGTATTAGGATGGGCGACCGCTAGAGAAGTCCTAGTGTTTTACATGTC
>JH601103.1/54151-54248 Dolosigranulum pigrum ATCC 51524 genomic scaffold supercont1.1, whole genome shotgun sequence. 
GAAGCACAAATCTGAGCAAGCGGTGAATAGGTGACTATTCATGCAGCCCGGCTACTAAACGTAGCAGCAGAGTGTTAAGGCACATCTGTGAGACAGTT
>LVLJ01000773.1/73947-73799 Marchantia polymorpha subsp. polymorpha scaffold3569, whole genome shotgun sequence. 
ATCTTTGCGCGTGGGGCAATGACGCAGTTAGTGAGGTGAAACCGAGAGACGCGTCAATTGCTGGTTGAAAACTATTTCCAAACTATTTGCATACTACGAGTTCGTTTTAGTGCAATTTCTTCTTTTCTCCCTTACAAAAGCGTAAGAAA
>AGUA01000030.1/104638-104479 Staphylococcus pettenkoferi VCU012 contig00012, whole genome shotgun sequence. 
GTAACAAGGGGATAACGAATAAGGTGATTTAGGGGTAGGCTATTACATAATATAATAGTTACAATCTCTTGTTCGTATGCGTTACTATTCAAACATCTTCAATATTTATTACTTACTTTCCTTTCTATTTGCCGACTAGCGATGACTAGTCGGTTTTTTA
>JH205222.1/90660-90343 Pelodiscus sinensis unplaced genomic scaffold scaffold192, whole genome shotgun sequence. 
GTCTAAGTAAACAAGGGCGTTACAGTGAAACTGCAAATGGCTCATTAAATTAGTTAGGGTTCCTTGGATCGCTCCAAGCCTTACTTGGATAACTGTGGTAATTCTAGAGCTAATACATGCTGACGAGTGCTGACCTCCGGGGATATGTGCATTTATCAGACCAAAACCAACCCGGGCTTGCCCAGCTGCTTTGGTGACTCTAGATAATTTCGGGCCAATCGCACACCTCCATAGCAGCAACGATGCATTCGAATGTCTGCCCTATCAACTTCAAGAGATGTCCCCATGGGTACTTCACATCTAAGGCTTCATTTTGTT
>GG700633.1/173169-173635 Leptotrichia hofstadii F0254 genomic scaffold Scfld1, whole genome shotgun sequence. 
GGCGGGCGAGAATCCCGCCGGCCGGAAGTCCAAGGTTTCCAGGGGAAGGTTTGTCCGCCCTGGGGAAGTCGGGACCTAAGCATAAGCAAAATTGTGATGGCGAATGGAAAACAGGTTAATATTCCTGTACCGCTGTTATCGCCTGAGAGACGGAGTGACGCAGGAAGGTATGCGGGAAGGCTGACGGAATAGCCTTTCTAAGGGCGTAGCATGGGCATGCAGGAAAATCCGCATGCCTAAATGTGAGACCTGACGGGTAAGTGCATCTTGCATAAGCCGCAGATCCTACACTGCCGAGAAAAACTTCTATCGATGAGAGCCAGCGCCCGTACTGTAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTATAGCGGAGCCGAAGGGAAACCCGAGTCT
>DS990197.1/12350-12464 Ruminococcus lactaris ATCC 29176 Scfld_02_34 genomic scaffold, whole genome shotgun sequence. 
GGATGCCAGGGTCAAAAGGTCTAAACCCACATGAGCTTGCTCATAGGTGGGTGAAAGACCTTAGGACCCGCCCCGATATGAGCATCAAAGTCGGGGGCTTTTGACCCCGACATCT
>CM003380.1/18255055-18254968 Vigna angularis cultivar Jingnong 6 chromosome 10, whole genome shotgun sequence. 
ATGAATGCTGATGCATGCACTGGGCTCTGAGAAGTTTTAACCTCAACTTTTGATGAAAATGCACGGCCTTGAAAGCTATTTCTGATAC
>CP000673.1/1358718-1358907 Clostridium kluyveri DSM 555, complete genome. 
TATGTGGCAGTGAATAGAAGAAGTAAATATATTCTTATATGTAAAGAGAGGAAGTAGAGGGTGTAAAGCTTCTCATATGAGGTTTATTGAAGGCTGTCTAGGAGCCTATTATGGTGTTTGAGAGATATGGATTTTATAATTTTAAATCTATATAATTAGGGTGGTACCGCGAAAAACTTTCGTCCCTTTT
>MKSM01000113.1/13291-13495 Nitrobacter sp. 62-23 SCNpilot_cont_300_bf_scaffold_662, whole genome shotgun sequence. 
CTTGTTTGCGGCGTCATCGGTGCCTCCCGAGGGAGGTGAAACGGGAACGCGGTGCGGGGATATGACCCCAACGCCGCGGCTGCCCCCGCAACTGTAAGCGGCCATCCGCGTCCATTCCGCTGCCGAACATGCCGCGCATGTGAGGAAAATCGGATCCGGATAACGGCCGCGAGCCAGGAGACCGGCCGGCGACGCCTTCGGAGCA
>CP011125.1/5773983-5773818 Sandaracinus amylolyticus strain DSM 53668, complete genome. 
AAGAGGGAAGCCGGTGAGAAGCCGGCGCGGCCCCCGCCACTGTGACCGGGGACGGCGCGGACGCGGTGCGAGCGCACCGAGTCACCACTGCGCGTGCTCGTCGTGTGAGCGGCGGGGCGCGGCGGGAAGGTGGTCCGCGACGGACGATCCGGGAGCCAGGAGACCT
>CM009294.1/24125792-24125654 Populus trichocarpa isolate Nisqually-1 chromosome 5, whole genome shotgun sequence. 
TAATTTATTTGGGGAAGATTTTCATCTAGTTGTAATATATTTATATTTGATTGCTCAGAATCATCAGTTATTATAAAATTAACTATATCATTGACCCTTATAAAATATATTTAGAAAAAATTGTTTATAAAATCATGAT
>ALWZ044874107.1/2364-1677 Picea glauca, whole genome shotgun sequence. 
GGGTTTTTCCTTTTGTGGAATTTGAATTTTTATGTTTTTTAATTTTTTATTATGTTATAATATATATAATTATAACACACACACACACACACACACAATATAACCTTATAATAGTCGACTCAGAGCTATTTCAGACAAGGGGAATCTCACTATTTAATTCAAACAAAGAATTGTGATGGTCCTTGTGGATGTTGACGCAATGTGATTTCTGCCCAATGCTCTAAATGTTAAAGTGAATAAATTCAACCAAGCACGGGTAAACGACGGGGGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGCCATCTAATTAGTGATGCACATGAATGGATTAACTAGATTCCCACTATCCCTATCTACTATCTAGTGAAAACACAACCAAGGGAATGGGCTTGGCATAATCAACACGGAAATAAGACCTTGTTGATATTGACTCTAGTCCAACTTTGTGAAATGAATTGAGAGTTGTATAATGATCCAGATTATTTTTGGCACGAAACGAGAGCGGAGATATAACACAAAAATATTCAGAGATATTGCAAGAGAGACAAAAATATAACAATGATATATCATAAATATAACAAGAGTCACATATATAAAGTAATACATGATTTCTATTAATGAAAGAAATGTACAGAGATTGTAAAAATATAGAGTGAAAGACTTGCTAGAATGGTGGCAGCTT
>JH835382.1/3324878-3324510 Erinaceus europaeus unplaced genomic scaffold scaffold00094, whole genome shotgun sequence 
GGATGTGAGGGCGATCTGGCTGAGACATCTGTCATGTCATTGATCATCAGGGTTGATTTAGCTGGTCTAGATGGCTAGGCAAGTGTCCCCTTCCTCCCTTGCCACTCCATGTGTGTCCTTCCTAAAGACTTTGGGTCTTTGGGACCTATGTGTGCTGGGTCGAAGAGGAAGGCCTTACCAGAATAGTGACTGACCGGTATGCTCGGTAGAAGGTATACAAGTAGCTGTGCTCCCCTGCTAGAGCCTCCATACAAGCTCTCAAGAAAGTTGCAACTGTACTGAGTTTGTAATTGCTTTGATTGATGGCTACTATCTCTGGCAACATTCTGCCTCACCTCAGGCTGGGCTCTCACACAGATGCTCTCTCCT
>KI930470.1/1116-1201 Candidatus Entotheonella sp. TSY2 genomic scaffold TSY2_scaffold00655, whole genome shotgun sequence. 
GAGAGCCGGATGCAGCGACAAGTTGCATGTCCGGTTCGGAGGGGGTTTGACGCCTAACCTCATGGGCTAGTCGCTTACTACCCTAC
>AZIM01000385.1/98908-98846 Ophiophagus hannah scaffold386.1, whole genome shotgun sequence. 
AATGGTGTTTATGACATAGTTAGATTAAAGCCTTTGGGAAGTCTAATTGCTGATGTTGCCATT
>AZFW01000017.1/10903-10974 Lactobacillus harbinensis DSM 16991 NODE_20, whole genome shotgun sequence. 
GCGAATGTAGTTCAGTGGTAGAGCAACAGGTTTTCCAACCTGTGGATGTAGGTTCGACTCCAACCATTCGCT
>AACY023338535.1/830-742 Marine metagenome ctg_1101668145886, whole genome shotgun sequence. 
TTTCCTTTACACTTCTCAAACCGGGATCAAGAGAAGCAAAGCATCCCTCATATCCACGATGGAGGGTGTCGTGGAGTATACTGTACCAA
>CAJW011240374.1/263-1 Hordeum vulgare subsp. vulgare, WGS project CAJW01000000 data, contig: morex_contig_1240374 
CTCGAGCCGAGGTCCGAGTACCAAGCGCTGCAGCGCTGAAGTATGAGCCCCGTGGACTAGCAATTGCTTCTCCACGAGGCTCATACCAGGCGCTACGGCGCTTAAGTATGTAACCGATGCCATACTCCCAGGAAAAGCTCGAACGACCTTCAACAAAAGGGTACCTGTACCCGAAACCGACACAGGTGGGTAGGTAGAGAATACCTAGGGGCGCGAGACAACTCTCTCTAAGGAACTCGGCAAAATAGCCCCGTAACTTCGGG
>ACTA01130975.1/19881-19796 Ailuropoda melanoleuca scaffold1408_79, whole genome shotgun sequence. 
GATCACGGTGATGGCTGACCAGGGCTCCTTGACCTATACAGACCTCTGCTATGGGGGTGATGGCCAGTCCTGGTGTCTGAGTGATT
>ABAV01023618.1/749-1 Nematostella vectensis strain CH2 x CH6 NEMVEscaffold_317_Cont23618, whole genome shotgun sequence. 
ATTGCTGACTCTATGGGAGACAAGGATGACCTAAATTTTAACAGATTAAGAGTACTGTAAGTAATATTTGAAAGGTTTACTTCTAAAACTTGTGATTTAGACTCATAATATATATTACAGAATGGCAAAGTTAAATTAAGAAACAGCAGGAACTTGGTTCCATTGCATCAATAAATTATGCTCAATTCATTTTCAGACAGTCTTGAGGGCCCGTTTCTTGTCAAGAGAATCAAAACTCTTCCAAAGACTGGCCTTCTCAAAACCTTGGTAACCGAAGCCGGACAGTGAATGCGAGTTCCTAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGAACGCGCGGTTAAGGTGCCAAAGTCGACGCTCATCAGACCCCACAAAAGGTGTTGGTTGCTCTAGACAGCAGGACGGTGGCCATGGAAGTTGGAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAAGCAACTAGCCCTGAAAATGGATGGCGCTCAAGCGTCGCACCTATACCGTGCCGTCGGAGCAGATGCGAAGCTCCGACGAGTAGGAGGGCGTGGGGGTCGTGACGCAGCCTCTGGCGCGAGCCTGGGTGAAACGGCCTCCAGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAGCTTTGAAGACCGAAGTGGAGAAAGGTTCCATGTGAACAGCAGTTGGACATGGGTTAGTCGATCCTAAGAGATAGGGAAATTCCGTTGCAAGCG
>AWWV01004333.1/1226-446 Corchorus capsularis cultivar CVL-1 contig04341, whole genome shotgun sequence. 
GGGCCAAGGGACAGTCTCAGGTAGACAGTTTCTATGGGGCGTAGGCCTCCCAAAAGGTAACGGAGGCGTGCAAAGGTTTCCTCGGGCCGGACGGAGATTGGCCCTCGAGTGCAAAGGCAGAAGGGAGCTTGACTGCAAGACCCACCCGTCGAGCAGGGACGAAAGTCGGCCTTAGTGATCCGACGGTGCCGAGTGGAAGGGCCGTCGCTCAACGGATAAAAGTTACTCTAGGGATAACAGGCTGATCTTCCCCAAGAGCTCACATCGACGGGAAGGTTTGGCACCTCGATGTCGGCTCTTCGCCACCTGGGGCTGTAGTATGTTCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGTGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCATATCCGGTGTGGGCGTTAGAGCATTGAGAGGACCTTTCCCTAGTACGAGAGGACCGGGAAGGACGCACCTCTGGTGTACCAGTTATCGTGCCCACGGTAAACGCTGGGTAGCCAAGTGCGGAGCGGATAACTGCTGAAAGCATCTAAGTAGTAAGCCCACCCCAAGATGAGTGCTCTCCTATTCCGACTTCCCCAGAGCCTCCGGTAGCACAGCCGAGACGGCAAGGGGTTCTCTGTCCCTGCGGGGATCGAGCGACAGAAGTTTTGAGAATTCAAGAGAAGGTCACGGCGAGACGAGCCGTTTATCATTACGATAGGTGTCAAGTGGAAGTGCAGTGATGTATGCAGCTGAGGCATCCTAACAGACCGGTAGACTTGAACCT
>LWDE01000750.1/11196-11290 Tilletia controversa strain DAOM 236426 scaffold_750, whole genome shotgun sequence. 
GACGACGTGCCGGAGTGGTTAACGGGTGCGCCTGCTATTCTTAGCATGTCAGTGTATAGGCTCTGCCTGCGTGAGTTCGAATCTCATCGTCGTCG
>MGWF01000052.1/10424-10220 Firmicutes bacterium GWF2_51_9 gwf2_scaffold_5678, whole genome shotgun sequence. 
GCATAAGCTGTGAACGGGAGTAGTAAACGTCACGCTTCATTCAAGAGAGCCGCTCCTTGGTGCAACGCGGTATGAAGCAACGTCGAACGTGTCCGGGAGCTGGTCGTGCGAAAGTTGAGTGCGATCCGTCGTCGGCGTTAACGAACAGAGTTGCCGGGAGAAATTCCCGGAAGTTAGGTGGTACCGCGTCAATCACGTCCTTTCA
>CM001219.2/34740290-34740361 Medicago truncatula strain A17 chromosome 3, whole genome shotgun sequence. 
GTGAGTTTAGCCCAGTTGGTAGGGATATTGCATATTATATGCATGGGCCAGGGTTCGAACCCTGAACTCTCC
>CBUS010004920.1/7915-7704 Eimeria acervulina, Houghton, WGS project CBUS01000000 data, contig: Eah_scaff963_1 
TGAACGATCCTAAGTATTGCTCCACGAGTGGCAGTTACTCTAGGGATAACGCGTTGATCTCCCCGGAAAGTTCGTACTGGCTGGGAAGGTTGGCACCTTAATATCGGCTCGTCGAATCGTGAGGCTAAAGTAGGTGGGAAGGCTTGGCCTGTTCGCCCAATAAAGCGCCACGTGAGCCGGGATCAGAACACCGCGGAATAGCTCGGTCCATA
>DS563006.1/382953-382865 Cavia porcellus supercont2_151 genomic scaffold, whole genome shotgun sequence. 
GGGTCAACAATGACACCCCAGCTGCATTCCCTGGAGCTGAATAAAATGGTGCGAACACTAAGCCATCATTCCCAGCAGGCCTGAGGTCC
>LMSO01000009.1/146994-146864 Arthrobacter sp. Soil782 contig_4, whole genome shotgun sequence. 
GGTAACGAGTGACAGTGCGGCAGGTTCCACCCGCCATCAGCCCCGGCTTGCTGTCCGGCAACCCTCCCTCGCGGCGGGGTGCCCCGGGTGAAGACCAGGCCCTGCATGCAGTGCAGGAGCAAGCGCGATTC
>BBWW01000001.1/3012297-3012404 Leptolyngbya sp. NIES-2104 DNA, contig: contig1. 
GGAGAGGTTGCTATAGGTAGGGCAAATCGTTTGCTAAACGAACACCTTCGGTGCAGCGAAGCTAGCGAGGATTAATCCCCTCTGTGGGTTCGATTCCCACTCTCTCCG
>LCQR01000039.1/11318-11692 Parcubacteria bacterium GW2011_GWF2_50_9 UY62_C0039, whole genome shotgun sequence. 
ACGCTGAAATAAGCGTCTTGTTGTCCCTTCTATCAGTAATGATAGAATTAGTATGCGGCTTATAACGGTGGAGCGAGAATCGGTCTTTCCTCAAAAGAGGTTTTCGTATTCTCGTAATACCGTGGGAAGTCCCACTACTTAAGTAAAGTGGGACCCCGTAACGACTGGATTCGAGTCCCGCCAACAGGCGAGATAAGATGAAGATAGTGGATGCCCGAGTGCTCGATGTTCGAATAGCACCGCTATAATACGCCGCCTCCAGCCGTAATTTTTGATTGGGCTTTAAGGTTCAACCTTCTTCCCGATTCAAGATTGAACCTTGGAATCAAAAATTACGGCTGGATGAAGATATAGTCTAATTATCGAAAGATAAAT
>CM001001.2/99651431-99651489 Mus musculus chromosome 8, GRC primary reference assembly. 
TGACTCAGTGGTCTGGAGTGATTGCTTTACAAGCAACAGAATCTGAGTTTAGATCTCAG
>KN847319.1/4624885-4625042 Exophiala xenobiotica strain CBS 118157 unplaced genomic scaffold supercont1.3, whole genome shotgun sequence. 
GGGGATGTGGTCTAGTGGTATGACGTGTAAGCATCGCACCACACAATTGAACGAAGCACTCATCTAATATGACAACAGTTCCTTAGCAGAAGTTGAATCCTGAAAGGATTGCCCACAACATCTGGAAAAGGTTCTGGGTTCGATTCCCAGCTTCTCCA
>JARO02016333.1/3903-2330 Scleropages formosus scaffold16338, whole genome shotgun sequence. 
TGGTTTTAAGGTGGCGGGTGGACTGGGCCCTTGTGTGCAGCCGTTGAAAAATACGCACAGGGTATAACATCTTTTCCTGTGTCTCTTGAATTTAAATGTCTATTGGCTGGGTCTCTCCAAAGTTCCCCCTCAGAAGAACATTCACTATCTTGTTGTTTTACCTGGTAAAGCAAACTTCTTGAGGTGCTGGGGCCAAAATGGCATGAAGGCTTATTCACATCACCTGAGACTAAGATCTCAATTTTATTCTGATGAGATCCCAGAAGATCCCATAAGATCTCATCTTTATCCAAAATGTTGACATACTCAAACACCTGAGAATCCTCAACAGTTTAGCATTAGTGTCTTATTGCTCTCACCCAGACTCCCCCCCCCCAATCATTTGCCAAGTTGGGCTCCAGAAATGGTTCCCTAAAGGGTTGTTGGAGATATCATTTTTATTTGCAGATCAATCATTGTTGAATTTGTCTTTTAAGAAATAATTTTAATCTACCCAATGCAAACTGTCATTTAAGGGGATGTGGTGGCGCACTGGGTTTGGCCAGGGTCTGCTCTGTGGTGGGTCTGCGGTTTGAGTCCTGCTGGGGGTGCCTTGTGGCAGACTGGCGTCCTGTCTGGGGTATGGTCCCCCCCGCATCATTTAACTTCTGCCCTAGAAAAAGAAGATTATGGTCAGAATTTTAAAAAGTTCAGTAGGTAAGCTAACTAGTCTTGCATATTTGGCAAAGAAATGTACTTTGTGGAATGCAAGTCACCTAGTGGGCAATCTTTGGTATGTAGAACTGGTGCTGTGGGATGAACCAGATGCTAGGTTAAGACACTCAATGCCAATGCTCATCAGACTACAAAAAAAGGTGTTGGTTGGCATAGACAGCAGGACGGTGGCCATGGAACTCAGAATCTGCTAAAGTGTTTTAACAACCCACCTGCAGAGTCAACCAGCCCTATAACTGGATGGCACTGGAGAGTGTCAGGTCCATCGTGGCAACAGGAGCCGCAAAAGCTAGGACATGACAAATAAGACAGCTGCTGCGGTGAGCTATCCTAGAGTGTAGGCTTCAGTGGAGCCACCACAGGTGCAGATGTCGGTGGTGGTAAGAAATATTCAAACAAAAACTTTGAAGGCTGAAGTCCATGTCAACAGCAAGTGAACACGAGTCAGTGGTTGTAAGATGCAAATGATGGTCAGAGGGGGCCGGCAATGGCCTCTATTTCCCCCTGCTAATTGAAAGAGAATCAGGTTGGGACTCCTGAATCTGGAGTGGTGGAGACAGATACCATGAGGCATCCAACAGAGTAACGTGAACAATCTCGGAGAAGCTGGAGAGAGCCCCAGGGAGAGTTTAGCCTCCTTTGTAAAGGGTAGGGTGCCTCAGAAGGAGTTTGGCTGGAGAAAAGGGCTCCAGCCCTGGAAAGCATTACAGTTTCAACAATGTCTAGTGATCTCTTATTGATGTTAAATCTGTGGACATAGTGTAAATCTTGCACCAAGTTGTACTCATATCTGCAGCAGATCTCCCAGGTGAGCAGTCTCACATGTGTAATGTCAGATCTGTAGCTTTGGGATAAGGATT
>URS0001A24131_12908/1-50 unclassified sequences eL15-Euryarchaeota ribosomal protein leader 
ACGGGAUCCGUCCCGGAGAGGAAUGUGGUCCUUCUGGACUGAACCUAGGU
>FAOM01224274.1/16511-16416 Triticum aestivum genome assembly, contig: Triticum_aestivum_CS42_TGACv1_scaffold_224274_3B 
AGGAGCCGTATGAGGTGAAAATCTCATGTACGGTTCTTCGTCGTCGTGGAGCTCGTTATGCCAGGGCTCCGGGTGAAAATCTTTGTCTACACGGAC
>JH835471.1/1830309-1830596 Erinaceus europaeus unplaced genomic scaffold scaffold00183, whole genome shotgun sequence 
GAATATGAGGGTGATCTGGCTGTGACATTTGTCACCCCATTGATCACCAGGGTTGATTCAGCTGACCTGGCCGGCTAGGCAGGTCCCTTTCCTCCTTCACTATTCCATGTGTGTCCCTCCCAAAGCTTTGAGCTCAAAGATGACTGAATAGAGACAGGCCCAGTCTTCAGATGAGAGTCTACAGGTAGCTGTACTCCTCTGCTAGAACCTCCAAACAAGCTCTCAAAGCCCCTAATCTCAGGATGTTTCTTCATATGACGCTATATACTCTTGGGGTAAATCTTCTGA
>HF997179.1/95514-95443 Ruminococcus gnavus CAG:126 genomic scaffold, scf59 
GGATACATAACTCAATCGGTCAGAGCGGCAGCCTTATAAGCTGTGTGTCACGGGTTCGATTCCCGTTGTCCG
>AKWO02000047.1/149928-149814 Leptospira borgpetersenii str. 200701203 ctg1130286793315, whole genome shotgun sequence. 
AAATAGATCAGTATGGACATATCTGGGAGCAAAATGTATTTACTCGAAGAAAAACAAACACAACTGAAAGGGGATCAAACCTTGACTTGCGCAGGATGCAGATCAAAAGTCACGC
>LFJF01019852.1/9646-11555 Macrostomum lignano unitig_19906, whole genome shotgun sequence. 
CCCGCTGAATTTAAGCATATTATTAAGCGGAGGAAAAGAAACTAACAAGGATTCCCCTCTAGTAACGCGAGTGAACGGGGAAGAGCCCAACACCGAATCCCTTGGCGCAAGTCAAGCGGAAATGTGGTGTTAAAGGTAGCCCTTCGTGTCAGTCTAGGCGTCCTCAAGTCCACCTGATTGTGGCTCAAGCCAGAAGAGGGTGTAAGGCCCGTAGAGACGCCTCCGACTGATTCCTGGGGTTTACCCTACGAGTCGGCTTGTTTGGGAATGCAAGGCCAAAGCGGGGTGTAAACTCCATCCAAGGCTAAATACTGGCACGAGTCCGATAGCGGACAAGTACCGCCGTGAGGGAAAGTTGAAAAGAACTTTGAAGAGAGAGTTCAATAGTACGTGAAACCTGCTTAGAGGCAAACGGATGGTGGCTCATACTGGCCTGAGGAATTCAACTGTGACGGGGCTGGACGAGCTGGCGTTCCGATCTCTTCTTTTGGGACGGGCGTCGGTTTGGCTATCAGGACTCTGACATGGTGCACTTTCCTTGGTGCCTCCGCCGACGACCGACGACACTGGCTACCCCGCGGCTCGGGGTAAGGTGACAAACCTGCTTCGGCATTTGTGTTATAGACCCCGGGGCGTCGGACATGGTTTGGCCAGGACGTCGAAGCTTGCGGCGCCCGCTCGCTTGTGGCTCGCATGTTGGCTACTTGGCTGCGCCGATGCTTGCACTGGAGACAACCAGTACAGGTGACGGTTGTGGTCTTGTCTCTAGTTGGCCTCTGCGAGTTTGGCGCCTATAGTCTGTGGTGTACTTGTGGGTAGACTCTATCCGACCCGTCTTGAAACACGGACCATTGAAGGAGTCTAACATGTGGCGCGAGTCATGGGGATTCTACGAAAACCCAAAGGCGCAGTGAAAGTAAAGGCCTGCTTCTCGTAGGCTGAGGTGGGATCTCGTGGCATCGCATCGCGATTGGCGAGCGCACGCACCGGCACCGTCCTATCTGTCTCTGTCAGTGGGGCGGCGCAAGAGCGTACACGTTTGGGACCCGAAAGATGGTGAACTTATGCTTGCGCAGCTCGAAGTCAGTGGAAACACCTGATGGAGGAGCGCAGCGTTTCTGACGTGCAAAAATCGATCGTCCAAAACGTGAGTATAGGGCGAAAGACTAATAAGGGGGCGAGACGTCATAAGTAGCAACCATCCTTGAGCTGGATTCCCTTCCGAAGTTTCCCTCAGGATAGCTGGCACTGCGGGGAAAACAGTTTTATCCGTAAAGCGAATGATTAGTAGGCATTGGGGGTCGAAAACGACCTCGACCTATTCTCAAAACTTTAAATGGGTAAGGATGCTCGTCTCGCTTAATTGGAGGCGGGCTTCACGCTCTCTAACGTGAATGTGAGTGCCCAGTGGGGCCATTTTGTTGTAAGGCAAGAACTGGCGCTGTGGATGAACCAAACGCGGCGTTGAAGGCGCCCAATGCGGACGCTCATGAGACACCACAAAAGGTGTTGGTCGATACTGACAGCAGGGACGGTGGCCATGGAAGTCGAACGGCCGCTAAGGAGTGTGTAACAACTCACCTGCGCGAATCAACCAGCCCTGAAAATGATGGCGCTGGGAAGCGTCCGGCCTATAGGATCGGGTTGACCTGGTGTGACTCGATGTGGGGATAGGATAGCAGACAAACTAATCTTGTAGGTATGTCCACTAACGAGTAGCGAGGGTAGCCGTGGTGTAGCGCAGAGTGATGTCAGCCGCACGTAATTGTGAGGCCAGTGACTGGAGCCGTCCAACGGGTAAATATTCCGCGGCGGCAGATCTTGCGGTGGTCAGTACAATACTCAGCAAGATAGAAAGCGTTGAGGACTGTAAAGTGTTTGAGAGAGGGTTCATGTGAAACAGCATAGTT
>JSYM01000001.1/27642-27547 Flavobacterium sp. AED Contig01, whole genome shotgun sequence. 
TTTTAGCCCCGATGGGAGCGATATCCTTTTCGAGTCTTTTCTCGTTCCTAAAACGAGAAAAGACTCGAAAAGATAAAGAGGACAGCGGGACCCATG
>AP014808.1/1488830-1488748 Lactobacillus acetotolerans DNA, complete genome, strain: NBRC 13120. 
TAATATAAAAAGAAGCCCTGTGAATAACAGAACTTCTCATGTAGAGCCGTAAAAGACGGTGGCATGATAATAATTACTAAAAA
>FR889406.1/108529-108414 Firmicutes bacterium CAG:449 genomic scaffold, scf101 
TTTAATAGTTCCAATATACCAAAGACAGCAACGGCTATTAGCTTAATAATGTTGCCGAGGTAAAGTAAGTTATTTATAAATAATGACAAGCATTACTCTTGTATATTGTTGACTAT
>AGTP01109286.1/18627-18514 Ictidomys tridecemlineatus contig109286, whole genome shotgun sequence. 
GTGTTGTATGAAAGAAGACAAGGTTATTCTGTTTTGTCAAGGATGGAAGAAACCCTTAGGCCTGACCACACGCATATTGTTAAGATATCACATAGCATCTAACCATTGACTTTT
>CP001014.1/1643612-1643672 Thermoproteus neutrophilus V24Sta, complete genome. 
CGGCGGCGGAGAGCCCCGCGCGGGGCGCCGTGAAGCTACCGCAGTCGGTCCCCCTTGTACA
>MNDA01000091.1/220-1 Ktedonobacter sp. 13_2_20CM_53_11 13_2_20cm_scaffold_5687, whole genome shotgun sequence. 
GGGGATGTCGGGTTTCGACAGACGAACAGATTGTTGAATTGCAGGCCGAGGTGTCGGTATGCACTCTCGTTAAACAACCGACAAAACAATAGATGCCAACAAACAGGCACCTGCTTACGCTTTCGCTGCTTAATAACCAGTAGGCGTCGTCCGCCCAGTTTTTTCTCGTGGGATTGGAACCGGGCGTCGAAAACACGAGGTGCTATGACGGTGACCGCCC
>ACTA01034202.1/35881-35939 Ailuropoda melanoleuca scaffold919_18, whole genome shotgun sequence. 
TGCTCTGATGAAATCACTTATAGGAAGTGCCGTCAGAAGCGATACTAGCCATTCTGACA
>DS028111.1/11289-9911 Coccidioides immitis RMSCC 2394 supercont1.19 genomic scaffold, whole genome shotgun sequence. 
GGGCACATGGTGGATGCCTTGGCATCAAGAGCCGATGAAGGACGTTGGAGCCTGCGATAAGCCCTGGGGAGTTGGCAACCGAGCGTTGATCCGGGGGTGTCCGAATGGGGAAACCCAGCACGAGTCATGTCGTGTTACCTGCGCCTGAATCTATAGGGCGTTTGGAGGGAACGCGGGGAAGTGAAACATCTCAGTACCCGTAGGAAGAGAAAACAATAGTGATTCCGAGAGTAGTGGCGAGCGAAATCGGATGAGGCTAAACCAACTGCGTGTGATAGACGGCAGTCGTTGCGTAGTTGGGGTTGTGGGATATGTCTGTCATCGTCTGCCGGCGGTGAGCTCAGTAAGAAACCAAGCATGAAGGTGAACCAGTTGGGAAGCTGGGCCGTAGCGGGTGATAGCCCCGTAATCGTATGTGTTTGGCTGGGTTGATGTACTCCCAAGTAGGACGGCACTCGTGGAATGTCGTGTGAATCTGGCGGGACCACCCGCTAAGCCTAAATACTTCTTGATGACCGATAGCGGACCAGTACCGTGAGGGAAAGGTGAAAAGTACCCCTGGCGGGGAGTGAAATAGTACCTGAAACCGTGTGCCTACAATCCGTCAGAGCCCGGCCGGCTGTTTACAGCAGTGGGGGTGATGGCGTGCCTTTTGAAGAATGAGCCTGCGAGTTAGCGGTGTGTGGCAAGGTTAACCCGTGTGGGGTAGCCGTAGCGAAAGCGAGTCCTAATAGGGCGATTGAGTCGCGCGCTCTAGACCCGAAGCGAAGTGATCTAGCCATGGGCAGGTTGAAGCGCCGGTAAGACGGCGTGGAGGACCGAACCCACTTCAGTTGAAAATGGAGGGGATGACCTGTGGTTAGGGGTGAAAGGCCAATCAAACTTCGTGATAGCTGGTTCTCCCCGAAATGCATTTAGGTGCAGCGTTGTGTGTTTCTTGCCGGAGGTAGAGCACTGGATAGCCGATGGGCCCGACCAGGTTACTGACGTTAGCCAAACTCCGAATGCCGGTAAGTGAGAGCGCAGCAGTGAGACAGTGGGGGATAAGCTCCATTGTCGAGAGGGAAACAGCCCAGACCATCAGCTAAGGCCCCTAAGCGGTAACTAAGTGGAAAAGGATGTGGAGTCGCAGTGACAACCAGGAGGTTGGCTTGGAAGCAGCCACCCTTGAAAGAGTGCGTAATAGCTCACTGGTCAAGTGATTCCGCGCCGACAATGTAGCGGGGCTCAAGTTATCCGCCGAAGCTATGGCACTCCGGTTTTCCGGGGTGGGTAGGGGAGCGTCGTGTATCGGGTGAAGCAGCGGAGTGATCCAGCGGTGGACGGTACGCGAGTGAGAATGCAGGCATGAGTAGCGAATGATGTGTGAGAAACACATC
>LN902847.1/6110633-6109254 Echinococcus multilocularis genomic scaffold, pathogen_EmW_scaffold_07 
TAAAATACTGCAGATGGGGGAAGTCGGGATTCTTAATCCATAACATCGGAAAGAGGATTGGCTCTGAAAGCTGAGCGGAACAGGCTAAGGAAAGAAACAAGCTAACTCAGTTTGCTGATGGACGGGCTGGCTAACTGTTGATACACCGCCTCCACCGCCGTCGTTGCGGTGGTGGGTGGGTGTGGAGCATGCAGTTGAGCCCATCCCTTGGCTGGAGGCGAGTAGGGTGAACCGTGGGCGGACCCAGATAAATGTGCACCTCGGTCGATTGATTGGTTAGTTAGTTGTCGATGATGCTGCTTGTTGGCTGTTAGTTGGCGAGTGTTGTGGTGCTCGGCACTGCTACTGGTTAGCCTCGTTGGGGGGTGCTTGTTTAGTGCCAAACACCCAACCCAGAACTAACATGGACCTGAAAAATCCGACTCTCCAATTAAAACGTAGTTTTGTGATGTCCGCTGGTTTGTTCTAGTGCAATGTGATTTCTGCCCAGTGCTCTGAAGTCAAAGTGAAGATTTTCAACCATACGCGGGTAAATGGCGGGAGTAACTACGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAACTAGTGACGCGCATGAATAAAATTAATGAGATTTCTATTGGCCCTGGCTACCATCTAGCGAAATCACAGCCAAGGGAGCAGGCTTGGCAGAATCAGTGGGAAAAGAAGACCCTGTTCAGCTTGACTCTAGTCCGACTTTGTGAAGAGATATGGTGGGTGTAGCAATAAGTGGTTCAACTGTGGCTTTCTATGAGATAGCTGTGCTTTTCATCTTTGTGCTCAGCATGCACATCACCTTGTTAGCCCGCCAAATCTAACATTTACTCTTTTGCGCTTTTACATTCCTGTCATCAGGAGGTAGATAGAATGCTCGTAAATGCTTAAATAGAAAAATGATTTAAGACAAGGAAAATTGGTTTGGGCATTTCCAGTTCATGTTGTACCTAGTCATTGATTTACTTCCTTTAATGGAAGCTGCGAAGAGGTGGTTTGAGAGCACTAAAAACCTCTAATTTTGTCTCATCAACTGGGCATATAAGCATTCGTTCATTTCCAAAACTTCTGACAAGCCCGCTTGACGCCTCATGTTATTAATGGGTTAGTGTTTGCAATCAGTGGTAAATGAAGTTGATCCATGAAGGTTAAATATGCTTTGCAAATTGCAGTATAGTCACCACAATTGAACAAATTTCACATGCCAAAAAGAGGGGTCACCCATAAATCATGCGATTCATTACAGTCTACAAGGTTAGTAGAACTACTAATTTATCGAAGCGTATGTTTTAGAAAAGGTTGCAGACTAATGTCCATCCCATTCATTCTGCCAATTTTAAAGCATTTCTCTTTTCGTCTGC
>LZPO01055098.1/393046-393292 Neotoma lepida isolate 417 scaffold_519, whole genome shotgun sequence. 
GGACGGCTAGGCAAGTATCCCCTTCCTCCTTCACTATTCAAGTGAGTTCCTCTCAGAGCTGCATGTTCTGTGCAAAACAATGATTTTCCCCAATAGAGGAGCACCATTCTTGGGTCAAGGGGATCTGAGTAGCTGTGCATCCTTGCTAGAACTTCCAAATAAGCCCTCAGGTGCTGGTGGCCATGTCAGAGGAGTAGCAAGTAGCAGTTGAAGTTCAAGGTGTCAGCCCACCAGGAGGAAACTCTCT
>AURB01000101.1/106632-106430 Alicyclobacillus acidoterrestris ATCC 49025 contig_19, whole genome shotgun sequence. 
TGAACGGCGTTGAAAGGGAGGAGTAAGGCGGTTTCGATTGTCCAGAGACGGTGCAGCGCGCTGAAATGCACCGCTTTCGTCCGTCTGAAGGTCGCCCTTGAGCTGCTTACCCCGGGTCATTCCGTTATCGATGTCGAGTGTTTCGTTCGTCTCGCGATGAGCGGAAAATTCAGGTGGTAACGCGGAGCCTATCCGTCCTGAGG
>CM004482.1/68495215-68495614 Xenopus laevis strain J chromosome 9_10L, whole genome shotgun sequence. 
TGATGACTAACATGTCCACGAGAAGGAATTTCATATATGAATGGAATGCCGATTGCCCTGTCCAAAACCCCAGTGTTAGGACCATATTAACCAGCAAGAAAGAAAAAATTGCCTATATACTTGTCAGATTTGCAGTAGTGAGGGGACAACAGCACAAGTACAGTATGATTAACTGCATCATCAACAGTGCCATGGGCAGCACCAAAACCTATAATTGTGACAATACATTCGGATGTCTGCCCCATGAACATTCGATGGTGCTTTCTGCAACTACCATGTTGACCACAGGTAATGGGGAATCAGGGTTCAATTTCGGAGAGGAAGCCTGAGAAACTGCCACATCCAAGGAAGGCAGCAGGTGCGCAAATTACCCACTCAGAACCTTCTGTGAATAAATATG
>AJMR01000139.1/797-1134 Pseudomonas pseudoalcaligenes KF707 = NBRC 110670 strain KF707 ctg1510, whole genome shotgun sequence. 
CCGCCCAGCGCGCCACCAATACCGGCATCGGTATTGCCGCCGGCAAAGGCGCTGCCACTGGCGAGGCCAAGAGACAGGAGAAGGATCGAGGTGTACTTCATGGTGAGGATCGCCTCAGTGGTTTTGGTGAGGCGATATTTACTGTGGGATTTGTCTTACGCAAGTGTCTGACGACGAAAAACACGAACTTTTATTATTTTTTTTATTGGGCGATTCGACAGAAGAACTTTTTCCCTTCAGGGGAGTCAGAGGCTGGTTGAAACCCCCGCTCCATGCGCGTCTTGCGCTTTCTGGTACTGGCACTTCGCCTAATAAGTTCCCTTTGAAGTTGGAACTTT
>MNIQ01000128.1/3562-3838 Ktedonobacter sp. 13_1_20CM_4_53_7 13_1_20cm_4_scaffold_29355, whole genome shotgun sequence. 
TTATAGGCAACGAAGGAACGAGTAGGTCCCCATATCTTGTCGAAGAGAGCCTGGGGGTGGTGTAACCAGGTCAGGATCGTGAGCCGAAAATCATTCCAGAGCCGCTAGCCGAAACAACAAAGTAGACCTGGCCGGGACCTTCCCGTTATCATGAAGGGCTGTATGGATCCTCTCAATTGGGGAGTTACAGCTAAACCAAGTGAGCCATATCTATCTCACACCTCGTGAGAATGTGGCTAATAAGGGTGGTACCGCGGGAGTTCCTCTCGTCCCTATG
>BARX01000007.1/79604-79779 Agarivorans albus MKT 106 DNA, contig: contig00007. 
CAGCGCGCTTTTGGGGAGTAGCTGCCCATATCAATAAGGTATGGGGCATTTATCAACATACTTAGTGCTCATCACTATGGTAAATGCAGCCTTTATTGGCCTAGCAAGACCAAATGCACATTAACGCCATAAAGAGGTGAGCTGCGTTGTGTGCATTGGTTTATTCGCTCGCCTCA
>CM001383.3/74376359-74376250 Felis catus isolate Cinnamon breed Abyssinian chromosome B3, whole genome shotgun sequence. 
CCTCGATGATGAATTGCCATGCTAATACTGAGTCACCAGGTGGGGCAGTGTTGCCCTGGTTTGGGTGCCAGTGAGTTTAACAAAACTTCTCACATGGAGACCTGAGGGGC
>AOKF01002516.1/2805-2760 Pseudomonas syringae pv. actinidiae ICMP 19096 scaffold552, whole genome shotgun sequence. 
TTGGCTTTTAACCAATTGGTCGTAGGTTCGAATCCCACACGACCCA
>AWUE01016600.1/22634-22748 Corchorus olitorius cultivar O-4 contig16633, whole genome shotgun sequence. 
GGGTGCAATCATACCAGCCCTAATGCACCGGATCCCATCAGAACTCCGTACTTAAGCATGCTCTTGGAGTTGGCTATCATCAAAAGTGTCATTATTCTAACTACTTTTGCAAATG
>JH835377.1/3849674-3849364 Erinaceus europaeus unplaced genomic scaffold scaffold00089, whole genome shotgun sequence 
ATGTGAGGGTGCTCTGGCTGTGACATCTGTCACCCCATTGATTAGAAGGGTTGATTCAGCTGATCTGGTTGGTTAGGAGGTGTCCCCTTCCTCCCTCACCACTGAATGTGCTTCCCTCCCAAAGCTGCAGTGCTTGGTGAAGAAGACAGCCTTCCCCAACAGAGATGGACAGGTCTCGGTGGAGGGTATCAGACTAGCTGTACTCCCCTGCTAGAAATTCCAAACAAGCTCTCAAAATGTCTCTTGGAAATTTGCCAGATTTCATATGAAAAGAGTCATTCTATATTTTTCCTATAGAAAGAAGATCATTT
>URS0000D6B09B_12908/1-98 unclassified sequences skipping-rope RNA 
CATGCCGGAGGTGGGAAATTGTGTTGCACCCACGCACCTTGCGTACATGACGTAACGGTTAAAAGAGATGGAGCAGATTGCAACGGCTCCCCGGCATA
>CP000108.1/2027693-2027787 Chlorobium chlorochromatii CaD3, complete genome. 
CGGCATCCCCATTACCTATGGTCACGGTGCTGGAAGCTCTGGGAAGGGTTACCCTTCCAATGGTGAATTGATCAGGAGAGCTTTTCCGTGTCCCA
>LCZI01000091.1/60703-61080 Emmonsia crescens UAMH 3008 supercont1.108, whole genome shotgun sequence. 
GCGTAGGCGAAAATCATTTTACTACATACATATAAAATTCAATTACCCCAATTTGTATAATATTAAATTATGGCTATCTGCAGTTAATGCCGTGAGACATGGTTAATTCTTTTAATGAACCCAAACCCTAACTTTCTTTATTTCTCTATATAAAGTAACTTGCTAAAAATTGGTTAGAGAATAGGGACCAAGACAGGTCATCATGACCATAAATAATATTATGGGCTATAGACGTACCACACACGCCTTAACAAAAGGATGCTATATTGTAAAATGGAGCTAATCCTTAAAACATAATATAATATGAGGTGTTGTCTGTAACTCGACAACAGGGACAAAAAAGTACTAGTGATCGTGAATCATCACGCCACGGTGAGT
>CP016199.1/1032825-1032926 Mogibacterium pumilum strain ATCC 700696 genome. 
TCCTTATTAAGAGCGAGTGAGGGAATGGGCCCGGCGAACTCGCGGCAGCATCGCATATTGCGGTTGTGCCAAGTCCCACAGGCAAAGCCTGAAAGATGAGGA
>DS562928.1/6888831-6889130 Cavia porcellus supercont2_73 genomic scaffold, whole genome shotgun sequence. 
GATTCCAGCAATCTGCCTGTGACGTCTGTCACCCTTGTCATTGTGTGGGCTGGTTTGGTTAATCTGGCTGGGGAGGTGGGTGTCCTCTTTCTCTTTCACAGCACCATGTGCATCTCTGTTGAAGCTGTGTGCTTGGTGGAAGAGGAGGACCTTCCCCGAAAGGATCAGGACAAAGATACATGAGTAGCTTCACTTCCCTGCTGGAACCTCCAGACAAGCTCTCGAGGATAGGATTTACCATGTGACACAGTAGTGGAGAATTTGAACAAAAGTCTATGTTGCTCATCATGGTAATTCAGG
>CM000236.2/126073376-126073451 Rattus norvegicus chromosome 6, whole genome shotgun sequence. 
GAGGGGCTCACAGCTCCGGTCCTTGGAGCTCCAGAGAAAATGTTGCTCCGGGACTGAGTTCTGTGCACCCCCCTTG
>APWO02002148.1/5885-5949 Astyanax mexicanus Unplaced_Scaffold4491, whole genome shotgun sequence. 
GTGTTTTTCTGCAACTGAAAAACTCCTCTGTAGCTCAAAAATGAGCTTTTTAAGACTGAAACACA
>CM001883.1/35529231-35529093 Theobroma cacao cultivar Matina 1-6 chromosome 5, whole genome shotgun sequence. 
AATGCCTCCAGAATAACCAGAAGGTTAGAATATGATCCGACGCCGTCTTGGTTCAGACAGAGGCTTAGAGCAATTCGAATCCGTTTGAGGGTAAGGAACGATTTTCCTCCGTTCCTTTCCTAGATGTCTTCGAATATTT
>JH711575.1/1398613-1398696 Coniophora puteana RWD-64-598 SS2 unplaced genomic scaffold CONPUscaffold_3, whole genome shotgun sequence. 
GGGCGTTTGGCACAGTGGTAGCGCGTATGCTTTGCATTTAAGCAACTTGCATAAGGTCGTGGGCTCGAATCCCATTCATCTCCT
>FQVZ01000030.1/1153-1 Fibrobacter sp. UWB8 genome assembly, contig: Ga0136280_130 
TGGAGGTCGCAGGGAAACGGCAGAAGCGACTGTTTACCAAAAACACAGGGCCATGCTAACACGCAAGTGGACGTATATGGTCTGACACGTGCCCGGTGCCGGAAGGTTAACAGGAGGGGTCAGCGCAAGCGAAGCCCTGAATCGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATCGTGTAACGACTTCTGCACTGTCTCCTCCCGGGACTCGGCGAAATTGCAGTGCCGGTGAAGATGCCGGCAACCCGCACCTGGACGGAAAGACCCCATGAACCTTCACTGTATTTTGACATTGGTTTTAGGGCCCGCATGTGTAGGATAGGTGGGAGGCTTTGAAACGGCGACGCCAGTCGTCGCGGAGCCGCCCTTGAAATACCACCCTTGCGCGCTTTGAGATCTAACCTCGTCCCGTCATCCGGGACAGGGACCGTGTCTGATGGTCAGTTTGACTGGGGCGGTCGCCTCCTAAAAGGTAACGGAGGCATCCAACGGTTCCCTCAGCGCGGTCGGCAATCGCGCGTAGAGCATAAAGGCATAAGGGAGCTTGACTGCGAGGCGGACACGCCGGGCAGGTACGAAAGTAGGGCTTAGTGATCCCGCGGTACAGCGTGGAAAGGCCGTTGCTCAATGGATAAAAGGTACTCTGGGGATAACAGGCTGATCTCCCCCAAGCGTTCATAGCGACGGGGAGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGGAGAAGGTCCCAAGGGTTTGGCTGTTCGCCAATTAAAGCGGCACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCCTATCCGGTGTGGGCGTTCGAGACTTGAGGGAAGCTGTCCTTAGTACGAGAGGACCGGGACGGACGTACCTCCGGTGTACCGGCTGTCGCGCCAGCGGCATTGCCGGGTAGCCGTGTACGGATCGGAGAAACGCTGAAGGCATCTAAGCGTGAAGCCGTTCCCAAGATCAGGTCTCGCGGGGGCAACCCCATGTAGGGCCGTCGTAGACTACGACGTCGATAGGCCGCAGGTGTGAGCGTGGCGACACGTTGAGCCGAGCGGTACTAATAGCCCGGTAGAGCTTTT
>AAPE02046865.1/69583-69781 Myotis lucifugus cont2.46864, whole genome shotgun sequence. 
GAATCTGATAATCAACAGGGTTAAAAGACAGTTGAACACCTGAAGTACATTATGATGATTTAAATAATGTGCAGTTTGCCCAAAAACGTTCGGTCCCTGGCGTATGTCTTAGAGATTTCTATGCGGTATGCAATGTGTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACTCGCATGAATGAATGAACGAGATTC
>HF998428.1/32618-32277 Coprococcus eutactus CAG:665 genomic scaffold, scf147 
GGGGTTGACTGGTTTCGACAGGGGTTTTGAAGCTATGGAAGCCATCCGTGGACCAGAGCCACGCTAAAAGCTGGACAAAAAATAAACGCTAACGATAATTTAGCATACGCTGCCTAGTTGCAGCCGTCATCCTTTAGGAACGCCGAGCCTTTAGGAATGGCGTCGACTTTCGGCAAACTCCTGCATCTAAGCTTTGCGATGTAGGAAAATCCATGAAGCTACTAAGGTCTATAGCATGTTAGTGGGCGATAGGCTGAGGGAATGTTAAAGCACTGACTGTGATGGAAGAAACTGTAGTGAATGAGCTTTTGGACGGGGGTTCGACTCCCCCCAGCTCCACTA
>FJUW01000012.1/748132-747973 Rhynchosporium commune strain UK7 genome assembly, contig: RCO7_scaffold012 
GGCCGAGTAGTGCAATGGTCAGCATCTCACATCCATAATGTTCTGGATTGCGAGCGCGCGTGCGTGTCATCGGATCTTGTATCGTTTACTGTATTCTTATTGCTTCGGCGTTTGGGTGTAGGATTATGTGAGGATGGAGGTTCGATTCCTTCCTTGGCCA
>CM001586.2/2047421-2047222 Ovis aries breed Texel chromosome 5, whole genome shotgun sequence. 
ATCACTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTAACAGTTTAAAATAGTATGTTCCAGACCCTGGCTGCTGAAATGTATCTCTCAATCTCTAAAATCCCTGTGGGTTGCTGAATCATAAGGGCTTGGTTCCTGGTGCATTTTAAATTTTGTCTTTGTTTCTGACACCGGAGGATGACTCACTCTTT
>AP008955.1/1357281-1357003 Brevibacillus brevis NBRC 100599 DNA, complete genome. 
TTGATGGCAATGAGGAAGAAGAGTAGTCATTTTACGAGACTTCAGAGAGCTGATGGTTGGTGCGAATCAGTGTTAAGGAAATGATGAATGGGCTTCCGAGCTCCAAACCAAACCCGCTACTCATGGCGGCAGTAGGCTTTGGCGTTACGTCCGTACGTTACAATGGACACCGTATCAAGCTGTCTTACACAGAAACGGTACGGATTAAAGAGATTTTGCGTATGGATGATTCCTTGCGCGAAATAACAAGGGTGGCACCACGGTTCATTCGTCCCTGTC
>ADKL01000252.1/892-837 Hot springs metagenome ctg_1106426166129, whole genome shotgun sequence. 
CTTGATGAGTACACTCTTTGCTGATTCAATGAGGAGAGTGGCCAGGGCTGAAGAGG
>MIDV01000105.1/1073-1170 Xanthomonadales bacterium RIFOXYA1_FULL_69_10 rifoxya1_full_scaffold_59073, whole genome shotgun sequence. 
ATCCCCCAGACATGCCCGCCGGCGTTGCCGGTGACATGCCCAGGTAGCCATCGATCTTCAAGGCTGCGGCGCGGCTTGTCCGCGTTGATCGAAACCCG
>FPAA01000006.1/128109-128175 Marininema halotolerans strain DSM 45789 genome assembly, contig: Ga0104500_106 
GTGTTGGTAGTTTAATTAAAATTCCGACCTTTCAAGTCGGCGATGAAGGTAAAATCCTTCCCACACG
>MJEQ01037189.1/69339123-69338966 Nicotiana attenuata strain UT chromosome 7, whole genome shotgun sequence. 
ATACTTACCTAGACGAGGTCAATGGACGAACGATAAGACTCATGGCCTAGGTTGGGGACTTCCATTGCACTTTGGAGGTGCCCGCCTATGGTCGACCCAAGTGTCTGAACCTACGTCATAATTTGTGGTAGTTGGGGCTTACGTTCGCGGGCCCCTAC
>KV423970.1/63913-63812 Calocera cornea HHB12733 unplaced genomic scaffold CALCOscaffold_57, whole genome shotgun sequence. 
GGCAACTTGGCGCAGTTGGCTAGCGCATCTGTCTAACAAGTTGCCTCTCCAGGCAGGTCCTTTGTACACAGAAGGTCGCAAGTTCGAGCCTTGCAGTTGTCA
>ALWZ040150818.1/688-1 Picea glauca, whole genome shotgun sequence. 
CATCGAAAGGAAATCGGGTTAATATTCTCGAACCGGGACATGGCGGCGGACGACAACGTTAGGAAATCCGGAGACGTCGTCGGGGGCCCCGGGAAGAGTTATCTTTTCTTTTTAACAACTTGCCCACCTTGAAATTGGCTCAACCGGAGATAGGGTCCAGCAGCTGGAAGAGCATCACACGTCTTGCGGTGTCTGGTGCGCCCTCGACGGCCCTTGAAAATCTGGAGGACCGAGTACCGTCCATGCCTGGTCATACTCATAACTGCATCAGGTCTCCAAGGTGAACAACCTCTGGTCAATAAAACAATGTAGGTAAGGGAAGTCAGCAAAACGGATCCATAACTTCAGGAAAAGGATTGGCTCTGAGGGCTGGGCCTTGGGGTCTGCGTCCTCAACCCGTGGGATGTCGGCAGTCTACCCGAGCTGCTATCACGGCGAGGGCGGGCAGTCGCGTGCTGATTGGGCTACGGACGTAGAATGTCCTCTCGCGAGGGCTTTTCCCTAGGCGACGAACAGTCGACTCAGAACTGGTACGGAAAAGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATCGTCCCTGCGGATGCTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATATCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTT
>AYUG01104772.1/8786-9026 Fukomys damarensis contig104772, whole genome shotgun sequence. 
GGATGTGAGGGCGATCTGGCCGATCTGGCCAGCCAGGCAGGGGTTCCCTCCCTCCTGCGCTGCTACAGAAGCTGCATGCTTGGTCGAAGAGGATGACCACCCTGATGGGGGAGACCGTGTCCTCTGTCAGGGAATCTGAGTAGCTGCACTCCCCTGCTAGAACCAAACAAGCTCTCAAGGAAAGTGAGCCACAGCACTCACCAGAGGCAGAGCTGGGATTTGAACCCCGGCCTCCTGGCTC
>GL344173.1/24246-24358 Anolis carolinensis unplaced genomic scaffold chrUn0991, whole genome shotgun sequence. 
ATCTAGGAGTACAGGGTTGTTGTATGTCTTTTGGGCTGTGTGGCCATGTTCCAGAACATCAGAACTTCTGGAACATGGCCACACAGCCCGAAAGACATACAACAACCCTGTGA
>URS0001A24820_12908/1-49 unclassified sequences eL15-Euryarchaeota ribosomal protein leader 
GCGGAUAAUAAUCCGUAGGGAUGUAACCCAAACGGGGUUGAACCGCAAA
>MNWA01000007.1/20574-20446 Candidatus Pacebacteria bacterium CG1_02_43_31 cg1_0.2_scaffold_487_c, whole genome shotgun sequence. 
ATATGTTAATTTAACAATGCTGTGGAATGTAGTGAAAATCTACAACTGTGCCGCAACGGTGTATTTTTGGTATTTTCCAAAATAAGTCCGATCTTCAGCAAAAAATTTTTAAACTTGCTTAGGCAAGTT


================================================
FILE: src/alphafold3/test_data/miniature_databases/rnacentral_active_seq_id_90_cov_80_linclust__subsampled_1000.fasta
================================================
>URS000254B5FC rRNA from 1 species 
ATGGAAGTCGACAGAGCCCCGGCCGCTGCCGCGGGAGGAGGATCCTCCTCTGGCGCGATGGCGGTGGACGCGGCCGGCGGCGTGGAGAAGCCGCGGTTCGACGCGCTGATGCCAAGCGAGATGAGCGGCGGGAGGCCACAGTACCGCAAGGTCCAGGTGCCGCCGCACCGCTTCGCGCCGCTGAAGAAGGCGTGGCTGGAGATCTACACCCCCGTCTACGAGCACATGAAGGTCGACATCCGCATGAACCTCAAGGCAAAAAGGGTCGAGCTGAAGACGAGGCATGATACACCAGATGTGAGCAACCTTCAGAAGTGCGCGGACTTCGTGCATGCTTTTATGCTTGGATTTGACATTGCCGATGCCGTTGCCTTGCTTCGTCTTGATGACCTGTATGTGGACTCCTTTGAGATCAAGGATGTGAAGACACTCAGAGGGGAGCATCTGTCACGTGCCATTGGGCGCCTGTCAGGGAAAGGAGGCAAGACCAAGTATGCCATCGAGAACTCTACGAGGACTCGCATAGTTATCGCTGATACGAAGATCCACATACTTGGATCCTTTGTTAACATCAAGGTTGCCAGGGATTCACTCTGTAGTCTTATCTTAGGTTCTCCTGCCGGCAAGGTCTATTCTAAGCTTAGGGCTGTATCTGCTAGGTTGGCAGAAAGGTATTAG
>URS0000B78375 rRNA from 1 species 
GTGGGGAATATTGGACAATGGGGGGAACCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTTTGGTTGTAAAGCACTTTAAGCGAGGAGGAGGCTACCGAGATTAATACTCTTGGATAGTGGACGTTACTCGCAGAATAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCAAGCGTTAATCGGATTTACTGGGCGTAAAGCGCGCGTAGGTGGCCAATTAAGTCAAATGTGAAATCCCCGAGCTTAACTTGGGAATTGCATTCGATACTTGGTGGGTAGAGTATGGGAGAGGATGGTAGAATTCCAGGTGTAGCGGTGAAAAGCGTAGAAATCTGGAGGAATACCGATGGCGAAGGCAACCATCTGGCCTAATACTGACACTGAGGTGCGAAAGCAAGGGGAGCAAACAGGATTAGATACCCCTGTAGTCC
>URS0001CC990C rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACGGACGAGAATCTTGCTTCTCTGATGTTAGCGGCGGACGGGTGAGTAGCACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATTTTGAACCGCATGGTTCAAAAGTGAAAGACGGTCTTGCTGTCACTTATAGATGTATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTACAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGAACTGGGCGGAAGACTGACGGAGCAACGCCGCGTGAGTGATGAGGGTCTTCGGATCGTAAGACTCTGTTCTTAGGGAAGAACATATGTGTAAGTAACTGTGCACATCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS00013D39E1 rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGGTCTTTAAGTCAGGGGTGAAATGCCAAGGCTCAACCTTGGAACTGCCTTTGATACTGGAGATCTTGAGTCCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGGAACTGACGCTGAGACGCGAAAGCGTGGGGAGC
>URS00023ED20D lncRNA from 1 species 
TCAGAATAAGCATAGCTAGGAAGGAATGTTTGAATAATGCACTATTTTTTTCCTCATGAGATAAAAAAAGAAGAAGAAAATATTCTTTTAGAGTAGCAGCAGTGGATGAAAAAAACTCAAAAAAATTGGAAACGTGAAAAAGTGCAAAACCAGAGGGTGAGGAACGTGTCGGTAGAAGAAGGGCTGGCTCGCTCTCGTTCGATCAGATCAAATACTACCGGAG
>URS00017AA725 rRNA from 1 species 
TACGGGGGGAGCAAGCGTTGTTCGGATTTACTGGGCGTAAAGGGCGCGTAGGCGGCCACCGCAAGTCGACTGTGAAGTTTCCGGGCTTAACCCGGAAAGGTCAGCCGATACTGCGGGGCTAGAGTGCAGAAGGGGCAACTGGAATTCTCGGTGTAGCGGTGAAATGCGTAGATATCGAGAGGAACACCTGCGGCGAAGGCGGGTTGCTGGGCTGACACTGACGCTGAGGCGCGAAAGCTAGGGGAGCGAACGGG
>URS00023C6B8F lncRNA from 1 species 
GTCATACTCAATATAAATTAATAGTAATGGATGCAAATGACAACGGTGCTCTCCAACAGGTGCTTTTTAATAAAAGGATGATGACTCAACATAAAAATAAATAGATAGGCCCTACGCAGAGGGAAGCAGGGATTTGTAGAGGTGCCAGAGCTCGATTTTTGAATAGAGATAAATAATATTTTGAGCGGCATACTTTCATTGTTAACATAACAACCGAGAGATCTCGATATCTTCCATGCTACACACATTATAGGCGGTTCCCAAACATAATGGTAAAGTTTATACTCCCCCTCCACCAACAATCATCAATTCATGGCTTTCCCGAAACAACGGGTGCCTCCAACTAACAACAATCCTAGGGGAGTTTTGTTTGCAATTATTTTGATTTGATTTGAGCATGGGACTTGGCATCCGATGACCAGCCATTTTCTCGTGAGTGAGGAGCGGAGTCCACTCCTCTTGAGAATAACCCATCTAGCATGGAAGATACAGACAACCCTAGTTGAGACATGAGCTGTTAAAGCATACAAAATAGAATTTCATTTGAAGGTTTAGAGTTTGGCACATACAAATTTACTTGGAACGACAGGTAGATACCGCATATGGGAAGGTATGGTGAACTCATATGAAATAACTTTGGGGTTTATGGAAGTGAATGCACAAGCAGTATTCCCGCTTAGTACAAGTGAAGGCTAGAAAAAGACTGGGAAGCAACCAACTAGAGAGCGACGACAGTCATGAACATTCATTAAAATTAATAGACATTGAGTGGAAGCATGAGTAGGATATAATCCACCATGAACATAACATCGTGGAGGCTATGTTGATTTTGTTTCAACTACATGCGTGAACATTTGCCAAGTCAAGTCACTCGAATCGTTCAAAGGAGGATACCATCCTATCATACCACATCACAACCATTTTAATAATATGTTGGCATGCAAGGTAAACCTTTATAAACTCCTAGCAAATTAAACATGTCATAAGAAACTATAATCTCTAATTGTCATTGCAAACATGTTTATTCATAATAGGCTGAATCGGGAATGATGAACTAATCATATTTACAAAAACAAGATAGGTCAAGTTCATACCAGCTTCTCTCATCTCAATCAGTCCATCACATATCGTCATTATTGCCTTTCACTTGAACGACCGAACGGTGTGGATAATAATAATAGTGCACGTGCATTGGACTAAGCTGGAATCTGCAAGCATTTGATACAAGGGAGAAGGCAACGTAATATGGGCTTTTGGTTAAATCAACAATAATGCATATGAGAGCCACTCAACATTTTCATCATGGTCTTCCCCTCTCGACCTCCAAAGAAAAGAAAAGAAATAAAACTATTTACACGGGAAAGCTCCCAACAAGCAAAAGAAGAACGGAAAATCTTTTTGAGTTTTCTTTTAATTACTACTACTACAGGAATGGAAAGTAAACTATCTAATAGCTATAACTAATTTAAATTTTTGGTTTTTTCTTAAAGTTTTTCAAACACACAAGAAGAAAGCGAGAAAAAGAAAATAAACTAGCATGGATAGCACAATGAAAAAGTATGAGCACCGACAACTGGAATGAATGTGTGAACATGAATGTAATGTCGATGAGAAATACGCACTCCGCCAAGCTTAGACTTTTGGCCTAAGTTGGTCTATGCCCATGGATTGAAGCTACTCTCTCCGGTGTACTGAGGAATGTCATCAGGGTGCCACTGGTTGGCAATCTCCTCCGAATACCACTTATAAATGGAGCGTCGATAAGGGTCCAGTGGTGGTTCCGGCTCAGGCTCTGGAGCTGGTGTTAGGCTCCGGTATGCGTAAACGGCCTCCGGCAAGATGAGGTACGTGCCTGAAAATATGTTAAGCAAAGATGGTGCAGGCAAGATAATAGTCTCACTGTGAGTTTTATTAAATCCCAAATTATACTCAAGCATCATCTTCTTATTTTTAACAATAAATTCATGTGCTACCATACTCTTATAATCTAGAAAATAGGGGGC
>URS0001774F8E rRNA from 1 species 
CCTACGGGCGGCAGCAGTGGGGGATATTGCACAATGGGGGGAACCCTGATGCAGCGACGCCGCGTGGGTGAAGGAGTGCTTCGGCATGTAAAGCCCTATCGGCAGGGAAGAAGCAAGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATCCGTAGGGGGCGAGCGTTATCCGGATTCACTGGGTGTAAAGGGAGCGTAGACGGCCATGCAAGCTAGGGGTGAAACCCCGGGGCCCAACCCCGGGACTGCCCTTGGAACTGTGCGGCTAGAGTGCGGGAGGGGCAGGCGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGGCGGCGAAGGCGGCCTGCTGGACCGCGACTGACGTTGAGGCTCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCCGGTAGTC
>URS00018E4F15 tRNA from 1 species 
ACACCAGTGGTGAAACGGTTATCATGCTTGCCTTCCATTACCGTGAGCAAGCGGCGGGGGTTCGACTCCCTCCTGGTGTA
>URS0000B64D6B misc_RNA from 1 species 
TGAAGATCTCTCCCTACACACCTCAGCAGTTGCAGATCAAATCTCTGGTTCAGCTAACCAAAGAGTTGAAATTGAAATGGAGATTCTTTCTCTTGGTCAAATGTTTGGGCCTTTGACAAACGGTTCCATCGGTGAAAAAGAGAATTCTTATCATGCTAAGGCTGAATACACAGAAAAACAGCTTCTCTTAAATGTTTCTGCTCAACTTAG
>URS00011ACD89 rRNA from 1 species 
TACAGAGGTGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCTTGTAGGTGGCCAACTAAGTCAGACGTGAAATCCCTCGGCTTAACCGGGGAACTGCGTCTGATACTGGATGGCTGGAGTGTGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCGGTGGCGAAGGCGGCATCCTGGACCATTACTGACACTGAAAAGCGAAAGCCAGGGGAGCAAACGGG
>URS0001176963 rRNA from 1 species 
TACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGTTTAAAGGGTGCGTAGGTGGTCTATTAAGTCAGTGCTGAAATATCCCGGCTTAACCGGGAGGGTGGCATTGATACTGATGGACTTGAGTAAAGTTGAGGTAGGCGGAATTGACGGTGTAGCGGTGAAATGCTTAGATATCGTCAAGAACACCGATAGCGAAGGCAGCTTACTAAGCTTTAACTGACACTGAGGCACGAAAGTGTGGGGATCAAACAGG
>URS000182FF44 rRNA from 1 species 
TGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGAAGGCGTTGTGGTTAATAACCGCAACGATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCCGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACA
>URS0000745C0A rRNA from 1 species 
CCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAAAGCCTGATCCAGCCATGCCGCGTGCAGGATGAGGGCCTTCGGGTTGTAAACTGCTTTTGTACGGAACGAAAAGACTCTGGTTAATACCTGGGGTCCATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTATATAAGACAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTTGTGACTGTATAGCTAGAGTACGGCAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAANCANCCGATGGCGAAGGCAATCCCCTGGGCCTGTACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCAACTGGTTGTTGGGTCTTCACTGACTCAGTAACGAAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGTTGNAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGTTTAATTCGATGCAACGCGAAAAACCTTACCCACCTTTGACATGTACGGAATCCTTTAGAGATAGAGGAGTGCTCGAAAGAGAGCCGTAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGCCATTAGTTGCTACGAAAGGGCACTCTAATGGGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATG
>URS0001C47DC8 misc_RNA from 1 species 
AAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAAAGTGTTTCGGAGCCTGGCTCGGGCATCTCACCTCGAGGTGTCGGTGTCAGCGCCCCCACACGTGTTTACTCAACTTGGTTGCCTTGGTGAGCCTGCCCTCGTGGCTGCCGGGGATGCCTCACGGCGTTCCGGGCTCGTGCTCACCAGTGGATCATTTGAACTCTTCTGTGAAAATAGCCAGTCTGAGCATTATGCAAATTAAATAAAACTTTCAACAACGGATCTCTTGGTTCCG
>URS0001C9BECE rRNA from 1 species 
GATGAACGCTAGCGGCAGGCTTAATACATGCAAGTCGAGGGGCAGCATGAAGTAGCCATACTTTGATGGCGACCGGCAAACGGGTGCGGAACACGTACACAACCTTCCTTTAAGTGGGGAATAGCCCAGAGAAATTTGGATTAATACCCCGTAACACAACTAAGTGGCATCACTTTGTTGTTATAGTTTCGGCGCTTAATGATGGGTGTGCGTATGATTAGATAGTTGGCGAGGTAACGGCTCACCAAGTCTACGATCATTAGCTGATGTGAGAGCATGATCAGCCACACGGGCACTGAGACACGGGCCCGACTCCTACGGGAGGCAGCAGTAAGGAATATTGGTCAATGGACGCAAGTCTGAACCAGCCATGCCGCGTGAAGGATTAAGGTCCTCTGGATTGTAAACTTCTTTTATATGGGACGAAAAAAGGTCTTTCTAGACCCCTTGACGGTACCATATGAATAAGCACCGGCTAACTCCGTG
>URS0000FFB7EB rRNA from 1 species 
TACGTAGGTGACCAGCGTTGTCCGGATTTACTGGGCGTAAAGAGCGCGCAGGCGGTCGTTCAAGTCGAGTGTGAAAGCCCCCGGCTCAACTGGGGAGGGTCACTCGATACTGATCGACTTGAAGGCAGGAGAGGGAAGCGGAATTCCCGGTGTAGTGGTGAAATGCGTAGAGATCGGGAGGAAGACCGGTGGCGAAGGCGGCGCTCTGGAACATTTCTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGG
>URS00002FFC52 rRNA from 1 species 
TTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGGGATCAATATAACGGTCATGCCGTTGGTATGCACTGTTATAATTGATTTCTCACCTTCTAAAGAACCGTAATGCCATTAATTTGGTGTCACGGGGAATTAGGACTGTTACCTTGAAAAAATTAGAGTGTTTAAAGCAGGCTCACGCTTGAATACATTAGCATGGAATAATGAAATAGGACATCCGATTCTATTTTGTTGGTTTCTAGGATCGATGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGGCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGATGATGTTAATTTTTTAATGACTCATTCGGCGCCTTACGGGAAAC
>URS00002B11A3 rRNA from 1 species 
TGGAACTTGTTCTGGTGGATTAGTGGCGAACGGGTGAGTAACACGTGAGCAACCTGCCCAAGACTTTCGGGATAAGCCTGGGAAACTGGGTCTAATACTGGATATGACCTTTCATCGCATGGTGTTTGGTGGAAAGATTTTTTGGTTTTGGATGGGCTCGCGGCCTATCAGCTTGTTGGTGAGGTAATGGCTTACCAAGGCTTCGACGGGTAACCGGCCTGAGAGGGTGACCGGTCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGTCAGGAACAAGCCACTTGTGGTGAGGGTACTGGCAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTATCCGGAATTATTGGGCGTAAAGAGCTTGTAGGCGGTTTGTCGCGTCTGCTGTGAAAGCCCGGGGCTTAACTCCGGGTCTGCAGTGGGTACGGGCAGGCTAGAGTGATGTAGGGGTAACTGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCACGAAGAACACCGATGGC
>URS0000D07B33 snRNA from 1 species 
ATACTTACCTGGACGGGGTCAATGGGCGATCAAGAAGACTCATGGCCTGGGCTAGTGACCTCCATTGCACTTCGGAGGGGTGCTTGCTTAAGGTCTCCCCAAGAGGGAGAGCCTACGTCATAATTTGTTGCAAGGGGGTTTGCGTTCGCGCAGCCCCCAC
>URS00007AB434 rRNA from 1 species 
CCTACGGGGGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCCATGCCGCGTGAATGATGAAGGTCTTAGGATTGTAAAATTCTTTCACCGGGGACGATAATGACGGTACCCGGAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGCTCGGAATTACTGGGCGTAAAGGGAGCGTAGGCGGATAGTTTAGTCAGAGGTGAAAGCCCAGGGCTCAACCTTGGAATTGCCTTTGATACTGGCTATCTTGAGTATGGGAGAGGTATGCGGAACTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCATACTGGCCCATTACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGAGTGCTAGTTGTCGGCATGCATGCATGTCGGTGACGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGAATTAAAACTCAAAGGAAATTGACGG
>URS0000128881 rRNA from 1 species 
TTGACGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGCCTTGACATGCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGACACAGGTGCTGCATGGCTGTCGTCAGCCCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCTTAGTTACCAGCACGTTATGGTGGGCACTCTAAGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGGCCTGGGCTACACACGTGCTACAATGGTCGGTACAAAGGGTTGCCAAGCCGCGAGGTGGAGCTAATCCCATAAAACCGATCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGTGAATCAGAATGTCACGGTGAATACGTTCCCGGGCCTT
>URS0000FA1FD2 rRNA from 1 species 
ATTGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGATCGGTAACGCGGGGGCAACCCTGGCGACGAGAGGCGGACGGGTGAGGAACGCTTGGGAATCTGCCTATCAGCGGGGGACAACACGGGGAAACTCGTGCTAATACCGCATACGCTCTACGGAGGAAAGCCGGGGACCGCAAGGCCTGGCACTGATAGATGAGCCCAAGTCGGATTAGCTAGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGAACTGAGACACGGGCCAGACGCATACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGAAACCCTGATCCAGCGACGCCGCGTGGGTGAAGAAGGCCTGCGGGTTGTAAAGCCCTTTCGGTAGGGACGAAAGCTCTCGACCTAACACGTCGGGAGGTTGACTTAACCTACAAAAGAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAAGAC
>URS000258AA4F rRNA from 1 species 
ATGGCCGCTCGTGTTAGCGGGCTCGCGGTGGGCTTCCTCTGCCTGCTTGCAATGTTGTCGCCGTCCGCGCAGCAATCCCCGCCCCCAGACTCCCCAGATTTAAAGTCGTCAATAGACACAGACACCCCACCTCTCCCTGACATACGCCCGCCCCCGAGCTCCCCGCGCGGCTACGAGTTGGACGTGCCCCCCAGGAACGTCACGTGCAAGGATACCGACGGTAAGCGGCCGGGGTGCACGGGAACTTGCCCTCGCCGCTGCCCCCAGTGCATCGTCCTCTGCCCCGACTGCAAGACATTATGCCATGACGAGGTACAGATGCCAAGGCCCGTGCCGCCACCTGCCATGTTGGTGTTCGGAGATGGGCAGTTCGACAACGGTAACAACGGATACTTGGAGCCCCCTAACTACCCCTACTCTGGCACCGGCAGGCTTAGCAACGGGGCCAACCTTGCCGATGCCATTGCATACACTATCGGATTCCCGCAAAGTCCTCTACCCTTCATGTCGTTGCGCGGCCGGATCAGCATGTGGGGCGCCAACTACGCTTCCGTGGGCGCTGGGATTCGGAACTCCACGAACGGAGAGCGGAGCATCCCTCTTTCGCAGCAGCTGGAGGACTTCAGGACGACGAGGGCCCTTATGGGGATAATGCTAGGGGGTGAAGCCAAGCTGCGCGCGTACCTGTCCAAGTCCATCTTCCTCCTCGGCATCGGCAGTCAGGACCTCGACCCAAGATGGAACATACACCTCGCAAATTCGACCGAGATCCAGAGCCTCGTTGCCCTATACGGGGAGGCCGTCACGTCCCTCTACGACATGGGCGCTAGGAAGCTGGCCATCGTCAACGTTGGGCTCATCGGCTGTGCGCCCCAGATCTTTGACTACAGGTACGGTTGCGACGAGAGCCTGAACGACCGCGCCGCCGCGTTCAACGCCGCCCTCAAGCCCCTCATGGCTGGCCTTGCGTCAAAGAAGAAGGGCCTTTTCTACTCCATCGGCGACTTTCATAGCTTCACCACCACCGTCTTCGCCGACCCGTCAGCTTATTGGATGGTGAACATCCGGGACTCGTGTAGCTTCACGGACCACCCAGAGAGGACGTGCTCTCCCCAGGAAGAGCACTGGTTCTGGGATTCAGAGTTCATGACGGATCAGGCATGTAGGCTGACGGCCACTGCATTTTACTATGGACCGCCTCAGTTTACCGCCCCCATGACCTTCAAGGCACTGCTGGAGAAATAA
>URS0001D7E6BA misc_RNA from 1 species 
GATGAAGAACGCAGCGAAATGCGATAAGTAGTGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATCCCGAGGGGCATGCCTGTTCGAGCGTCATTTCAACCATCAAGCCCCAGCGCTTGTGTTGGGGGCCTGCGGCTGCCGCAGCCCCCTAAAAGCAGTGGCGGGCTCGCTATCACACCGAGTGCAGTAGTTCATCTTCTCTCCGGTCTTGTGAGGCGGGTTCCGGCCGTGAAACACCCCACTACATTCAAGGTTGACCTCGGATCAGGTAGGAATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS0002341CEB lncRNA from 1 species 
GGCAACGTGTTCCGGTCCTCTTCCACATCACGGAAGATTTGCTCTTTCCTCTTTGCGATGAATCTTGCTGCTGGTCACCCTTTGGGTCCACACAGCATTTATGAGCTGTAACTTTCAGTGCGAAGGTCTGCAGCTTCATTCCTGAAGCCAGCGAGACCACAAACCCACCGGGAGGAAAGAACAGCTCCAGGCGCGCCGCCTTAAGCGCTGTAGCACTCACCGCGAAGGTCTGCAGCTTCACTCCTGAGCCAGCGAGACGACGAACCCACCGGGAGGAACGAACAACTCCAGGCGCGCCGCCTTAAGAGCTGTAACACTCACTGCGAAGGTCCGCAGCTTCACTCCTGAGCCAGCGAGACCACGAACCCACCAGACGGAAGAAACTCTGAACACATCCAAACATCAGAAGGAACAAACTCCGGACACGCCTCCTTTAAGAACTGGAAAGACTCACCGCGAGGGTCCGTGGCTTCATTCTTGAAGTCAGTGAGACCAGGAACCCACCAATTCCGGACGCACTTCCTCCGGACTGTTGGTGCACTGAGTGATCTGAAGTGCTCCCTGGCCACCATGAATGTAAGCAGAGATGGTGTCTCACTTTGTTGTGCAGGCTGGAATGCAGTGGCACAATCATAGCTCACTGCCGCCTCGAACCCTTGGACTCAAGCAATCCTCCTGCCTCAGCCTCCCAAAGTACTGGGATTACAGGTATGA
>URS0000160626 rRNA from 1 species 
TCTAACACATGACACGTCGAACGGTAACAGGAATTAGCTTGCTAATTTGCTGACGAGTGGCGGACGGGTGAGTAATGCTTGGGAATTTGCCTTTGCGAGGGGGATAACAGTTGGAAACGACTGCTAATACCGCATGATGTCTACGGACCAAAGGGGGCTTTTAGCTCTCGCGCAAAGAGAAGCCCAAGTGAGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGACGATCTCTAGCTGTTCTGAGAGGAAGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTTGTGAGGAAAGGTTGGTAGTTAATACCTGCCAGCTGTGACGTTAACAACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTCAAGCGAGATGTGAAAGCCCCGGGCTTAACCTGGGAATTGCATTTCGAACTGGCAGGCTAGAGTCTTGGAGAGGGGAGTGGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAACATCAGTGGCGAAGGCGACTCCCTGGCCAAGACTGACGCTCATGTGCGAAAGTGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCCCACCGTAAACGCTGTCTACTAGCTGTGTGTGC
>URS000188CCB0 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGGGTGCGTAGGCGGGTCTTTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGAAGATCTTGAGTTCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGATACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATGACCTTGTA
>URS00019B19CC lncRNA from 1 species 
GTCAGTATGAGCATGGAACTTGCTTTAGCCAGTGAAATGTGAACCGTGTACCCTGTACCACTCTCAGGAGGAAGATTTGCAAGCCACTAAGTGGACCTGCCTGACCCCTCCCTTGATGAAGTTACCTTTGCCCCACGTTCTAATCAACCTATACCCCGTAGGCCATCCTTACACTTCTGCTGGGGGTCTGGGTGGACCCCAGGTCAGACAACAATTCATGCTAAGCTGCTTATGAACAGCAGACCACCTGCTGCAGAATCAGGCAGGACATGTGTAGCCTATTTCCATCAAACCTTCTGAAATGGAAACCCCAGGAGTAGAGTCCAGCATCCAGGCCCACAGGATTCCCAGACATACTCAGGTATAAAAATGCCACTGAGTCCTCTGTTAATTATTGACTCCAAAACATTTCTTTGCAGAAGATGATGTTTTCTAAGACAGTGATCTGATTTTAAATTACCAAGACACTGAGTCCTTATTTTATATTCTTTTTCATCTTTACACAAATTTTCTTAAATTAATGCTCTTTAAAATAAGCTCATTTAAAAAAAATGGTGATAAATCTCCAGGTTCTACAGATGGAAAGACTGAAAATAAGACACAGGTATCAAAAACAGAATAAGTGGATCTAATGCAGGGATGTCAGGTGTGCCTCTGGGCCCTCATCCATTCCAAATCCCACTCCACACCTACCTGTCCATTCTCAGATTAAAGAACAGAATGCCCAGACTGCAAAGAAATTAACATGCCCCTTCGTTTTTATTAGCTTTTATTTTAGGCTCATTATCCATACCTCTGTGCATCCCTATTCTGTGTCTGCACTCATTTAGAAGCCAAATACCAGTAGGCCAATCAGCACATT
>URS00021FE078 rRNA from 1 species 
GCAGCCCCCTGGGCCAATACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCAACTAGTTGTTGGGGATTCATTTCCTTAGTAACGTAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGATTAATTCGATGCAACGCGAAAAACCTTACCTACCCTTGACATGGTCGGAATCCTGCTGAGAGGCGGGAGTGCTCGAAAGAGAACCGGCGCACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTTAGTTGCTACGCAAGAGCACTCTAAGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTATGGGTAGGGCTTCACACGTCATACAATGGTCGGAACAGAGGGTTGCCAACCCGCGAGGGGGAGCTAATCCCAGAAAACCGATCGTAGTCCGGATTGCACTCTGCAACTCGAGTGCATGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTTTACCAGAAGTGGCTAGTCTAACCCGCAATGAGGACGGTCACCACGGTAGGATTCATGACTGGGGTGAAGTCGTACAGGGTTAGCCCGTAATG
>URS0000794101 rRNA from 1 species 
CTGATAATTGGAATGAGAACAATCTAAATCCCTTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTCTGGCAGGAGCGACCGGTCACACACTCTGTGTGTGAACTTGTGTTGTCTCTGGCCATCCTTGGGGAGATCCTGTTTGGCATTAAGTTGTCGGGCAGGGGACATCCATCGTTTACTGTGAAAAAATTAGAGTGTTTAAAGCAGGCTTATGCCGTTGAATATATTAGCATGGAATAATAAGATAGGACCTTTGTTCTATTTTGTTGGTTTTTAGAATTGAGGTAATGATTAATAGGGATAGTTGGGGGCATTCGTATTTAACTGTCAGAGGTGAAATTCTTGGATTTGTTAAAGACGGACTACTGCGAAAGCATTTGCCATGGATGTTTTCATTGATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCCTAGTCTTAACCATAAACCATGCCGACTAGAGATTGGAGGTCG
>URS0000E403FD rRNA from 1 species 
TAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGCGATGAAGGCCTTCGGGTCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTGCTAGTTAAATAAGCTGGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGAAACTTGAGTGCAGAAGAGGAAAGTGGAATTCCAAGTGTAGCGGTGAAATGCGTAGAGATTTGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCCCGTAGTCC
>URS00003FB220 rRNA from 2 species 
TTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGCAGAACCTTACCAGCCCTTGACATACCGGTCGCGGACACAGAGATGTGTCTTTCAGTTCGGCTGGACCGGATACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGCCTTTAGTTGCCATCATTTAGTTGGGCACTCTAAAGGGACTGCCAGTGATAAGCTGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTACGGGCTGGGCTACACACGTGCTACAATGGTGGTGACAGTGGGCAGCAAGCACGCGAGTGTGAGCTAATCTCCAAAAGCCATCTCAGTTCGGATTGCACTCTGCAACTCGAGTGCATGAAGTTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGTTCTGCCCGAAGGCACTGTGCTAACCGTAAGGAGG
>URS0000583501 sRNA from 1 species 
TCAAAGTGATCTCCCGCAGGCGGACTGCCA
>URS0001BC1447 sRNA from 18 species 
CCGCGCCCGCUGCUUGAGGGUCAAGGCCCUCUUGCCUGUGCGCAAAAUCUGGUCGAGCCGCUGACUUCUGGGUCACCGCCAUGCGCACAACAGAUACCGCCGGUCUAAAGCGUCCGCGUAGGUCUCGCGCAGUUUCCGAACUGAUCGGCAAUGCCUUCGGUUUGGCGAUGUAGAUAGCUCGACAGGUCG
>URS00018C39BD rRNA from 1 species 
TACGGAGGGTGCAAGCGTTATCCGGATTCACTGGGTTTAAAGGGTGCGTAGGCGGATAGGTAAGTCCGTGGTGAAATCCTGCAGCTTAACTGCAGAACTGCCATGGATACTATCTATCTTGAATGTCGTGGAGGTTAGCGGAATATGTCATGTAGCGGTGAAATGCTTAGAGATGATATAGAACACCCATTGCGAAGGCAGCTAACTACGCGATAATTGACGCTGATGCACGAAAGCGTGGGGATCAAACAGG
>URS0001C413C7 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACGGACGAGAAGCTTGCTTCTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATTTTGAACCGCATGGTTCAATAGTGAAAGACGGTCTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCCGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTGGGGAAGAACAAATGTGTAAGTAACTGTGCACATCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS00023022DC rRNA from 1 species 
TGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTATGGTTGTAAAGCACTTTAAGCGAGGAGGAGGCTACTTTAGTTAATACCTAGAGATAGTGGACGTTACTCGCAGAATAAGCACCGGCTACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCAAGCGTTAATCGGATTTACTGGGCGTAAAGCGCGCGTAGGCGGCTAATTAAGTCAAATGTGAAATCCCCGAGCTTAACTTGGGAATTGCATTCGATACTGGTTAGCTAGAGTGTGGGAGAGGATGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGATGGCGAAGGCAGCCATCTGGCCTAACACTGACGCTGAGGTGCGAAAGCATGGGGAGCAAACAGG
>URS00003F74AF piRNA from 1 species 
TCTGACCTTCACACCTACACCGT
>URS000219B0C7 rRNA from 1 species 
TGGTGGGTAGTTTGACTGGGGCGGTCTCCTCCTAAAGAGTAACGGAGGAGCACGAAGGTTGGCTAATCCTGGTCGGACATCAGGAGGTTAGTGCAATGGCATAAGCCAGCTTGACTGCGAGCGTGACGGCGCGAGCAGGTGCGAAAGCAGGTCATAGTGATCCGGTGGTTCTGAATGGAAGGGCCATCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATACCGCCCAAGAGTTCATATCGACGGCGGTGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGAAGTAGGTCCCAAGGGTATGGCTGTTCGCCATTTAAAGTGGTACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCCCTATCTGCCGTGGGCGCTGGAGAACTGAGGGGGGCTGCTCCTAGTACGAGAGGACCGGAGTAGACGCATCACTGGTGTTCGGGTTGTCATGCCAATGGCACTGCCCGGTAGCTAAATGCGGAAGAGATAAGTGCTGAAAGCATCTAAGCACGAAACTTGCCCCGAGATGAGTTCT
>URS0000670AD8 snoRNA from 2 species 
CCTGCTCCTGGAAGTGTTGCTGGTGTGGCTGCTGTGCCACATGTTCGCCAGTAGGTGGCAGATAGGAGAGAGGCTGTGTTTATGCTCAGTGTTCTGAACTGTGAACTGTGAATGATTCGTAGCCTAACAAT
>URS0000C73CE8 ncRNA from 1 species 
GTGTCCGAGGAGCGTTGCAAGGCCGGTCGATTCAGGCGACCGCCCCAGGCTCGGACCCCTTCCCACAGGCAACGGCGCTCACCCGTC
>URS00002A852C rRNA from 1 species 
AGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAGCGGAAAGGCCCTTCGGGGTACTCGAGCGGCGAACGGGTGAGTAACACGTGAGCAACCTGCCCTTAGCTCCGGGATAGCTCCGGGAAACCGGAATTAATACCGGATATGACCTAGGCCGACATCGGCTGTGGGTGGAAAGTTTTTCGGCTGGGGATGGACTCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCGACGCCGCGTGGGGGATGAAGGCCTTCGGGTTCGTAAACCCCTTTCAGCAGGGACGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCGCCGGCTAACTACGTGCCAGCAGCCGC
>URS0002550A56 misc_RNA from 1 species 
TCCGGTTTAGCACCGGCAGTCTCCCTAGAGTTCCCGGCTTTACCCGCTGGCAACTAAGGACAAGGGTTGCGCTCGTTGCGCCACTTAAGGCAACACCTCACGGCACGAGCTGACGACAGCCATGCACCACCTGTGCAGGCTCCGTAGAGCGCCGGCTTTCACCGGCTTTTCCCACCATGTCAAACCCAGGTAAGGTTCTTCGCGTTGCGTCGAATTAAACCACATGCTCCGCTGCTTGTGCGGGCCCCCGTCAATTCCTTTGAGTTTTAGCCTTGCGGCCGTACTCCCCACGCCGTAAACGATGGGCACTTATCGCGTTAGCTACGGCACGGAAGGGGTCAATACCTCCCACACCTAGTGCCCAACGTTTATAGCGTGGACTAC
>URS00023AAB80 lncRNA from 1 species 
TTTTTTTTTTTTTTTTTGCAGCGCCCCGTGGTGCACCTATTCCTGCTCCAGGTATAGATATATTCATAAATCCTTTGAAAATATAAACCATCAATACAAACTGAATTCTATTTGCTTATTAGTTTATTTATTCGTTTGACAGGTCCAGTCTCTCTAGCACCCAAACTCTCCCCTGGAGCTTCACCATCTTTAAGCCCCCAAAGTCCCATTGTGCCGGAACCGACACCATCTGCCGAGGTGCCTGATTCCGGCACCACACCGGCTCTAACTCCACCATCGTCCACAGCAGGTTCGGGAGCCCCGACGGCCGCAACGGGGAGCCGCCCTGTTCTCACCCCATCAGCTGCCAACCCCGCTTACAGTTTCTCACCATTCCTTTTGGTGTTCACATTGGGATTTGTGATTTTCAAGTACTAATTATATAATATGTATTGATTGATTTGTTTGGCGAGCGGTATTCTTTTAGTGGCTTGAACTGAAAACCATTGTTTTGCCTTTTAAGAGCTAATATTGGGTGACTTTACATTTTATATAAAATATACATATTAGTGTAATTTTTATTTATTGAGTAATAATTTTTTTTTATTTCTGCAATGATTATTTTTTAGGGTAAACTACACATATAGTCACTTTTGTTTACTTTAGGTTACATTTTGGTTACTTATGTTTAAAATATTACGTTTTAGTCACTTACGTTATCGTGTTGTAACATTTTAATCACTGAGCCGTTAATTTCCGTTAACGGTGTGACGGTAAGCTGACGTGGCACGTTAAATCATCATTTCAAACAAAAATTTTAGGTTAAATTATACAACTGATCCCCATATTTTTTTTGGGCAATTTAATTTTTTTCTTTTATATTCTTTAAACCTTACTCTCTCTTTTTCTCTTTATTTTCCATTATCTTCTGTTTCTCCTTCTATTTTCCTACCTTTTCCATGTCTTTTAACATATTAAGAAGTCGAATTGGCAGTGAAGAAAGAAGTAGGAAGCCGAAAGCCATCATTGCCTATAATCAAAACCCATAAACCCGTACCATGATTCTTTCTTCACTGCCAATTTGACTTCCTGATATGTTAAAAGAAATGGAGAAGGTAGGAAAACAGAGGGGGAAGCAGAAGAAAATGGAAAATAAAGAAAAAAAGAAAGTTAAAAGAACATAAAAGAAAAACTTAAATTGCTCAAAATGACAAAAATATGGGGACCAATTGTATAATTTAACCTAAAATTTTTGTTTGAGATGATAATTTAACGTGTCACGTCAGCTTACCGTTACAATGTCAATGGCAATTAATGGCTCAATGACTAAAATGTTACAACATGAAAACGTAAGTGACAAAAATGTAACATTTCAAACATAAGTGACTAAAATGTAACCTGAGATAAACAAAAGTGACCATAGATATAGTTTACCCTATTTTTTATTGGTTAATTTGATGTGAAAAATGGGAAAAGATCATAAATTATTGGTACATTACTGATCTTCTATTATTAGCAAATTAAGTTGTTTATTAATTCCATTTGAGTAATTCTCAAGGAATTCAATATGAGATCCCAGAGGTTTTTTTTTTATCATGTTATTTTTAAGTTTTTTAGAATCAAGATTAAATAGATAGAATGCATAAATTTAAGGGTTAAATTTGTTGAATTTTTAGAATTAGGACCAATTTGATAGAATTTGTAAACATTGTAGGGTTAAATTTGTTGATTTTTTTAGAATTAAGACCAAATTGATAGAATCTGTAATTATTGTAGAGCTAAATTTGTTATTATGTAAATAAAATAGATCACGTCAGCATCCAAATAATAATTTAACAAAGGAGTGATCAAAATATTAAATGTCAATAATGTTAATGACTAAATCTGAAATTTTTGGAGATGGGTGACCAAAACATAAATATGCTAATAGTTGGGTGATTGCGAGTGTGGTTTACCCTAAGATTAACAGTAATAAGAGGATCAGATTGTGATAAATTAAAGTATAGAGACTAAATATCCAAATTGAGTATACAATAAGGATGTAACCGCAATTTAACCTAATTAACTAAAATGATTTATTAGGCCCCTCACTAACGGCCATTCCCGCCATATTCATTTCCAATTTACTTAAATACCCTCTCCCTAACAGATTTTTAACTACCATAATCAACCGTCTCTCACTTCCTCTCACCGCCATGGCAGCGAACATCTTCATATTGCTCCTCCTTGGTGTGGCGGCGCAGCCACTTCCACCAGCACCCCAGCAACCAGGCTGCGTGGAGGAGCTGGTGGCGTTTTCGCCTTGCCTGCCCTTTGTATCAGACCCACCAAACAACGCCACAGACTCAGTTGCTCCACAGTGCTGCGACGTCTTCAATTCTGCTTTCGAATCCGGCGACGGTTACTGTTTCTGTTACATCCTCCGGCAGCCGCGGATCTTTGGGTTTCCGTTGAACAGAGAAAGGGTTGCTTCACTGTCTTCCTTTTGCATGGCCAAGAACGGCGTTGCTTCTCTAGACTCGCTCTGCTCTTCAGGTTTTTCATCTTTTCTTAAACCCAATTGTTTAATTCACGGATTTCCGGATTAAGAATTTCATCAGGTTCAAGGCCATTTTAATCTTTTGATTAAAAGAAAAAATAGTTATTTAACGCTTTGATTGATGTAATTATGCAATTCTTAATTAGTATTATGCATTAGGTGCACCAGCGCTGCCGCCATTGCCAAGCACCACAGATTCAGGGATATTGAAACCATTCAATTCTCGTAAGTAAAGTCCGAATATCTTTTCTTTTTTATTTTTTCTCCTTTCGGAACCGAATCGGCGGTCAAACCTTACTACCTTAGTAGTTCTCGATCAGACTAATTCAATGATCAGACTGGTTTTAATTAAATAAATCATTTAAAAATTTATAAAATTTTTGAAAAGTAAAATATATTAAAAAAGTATAAAACTTGGTTCAACCGGTTTGCAGGTCAGTCAGTTCTTTCCCTTACTCTAGACTAGTGTACCAGCTGGTTCCCGTCCAACCGGCCAACCTTGCATTTTGTTCTTCCATGGCTGTAATAAAAGATTACCTAAAAGGAAATGTTCATTTGCAGCGTTCTTGCTTGTAGATTGACCAAATATAAGCCTAAATTATTTGTTTTAAAGATAGACCGGATTTTAAAACTCGTAAAAGGCCGATACCAAAAGCATATCAAGGCAATGGCATTATCAGTGATCTGTTATTGGTGGTAGAATCCTTATGAAAACTATTCTACAGGTTTAGATAATGATTCAACAAGCTCACCCCCAGAATCTGCGGTCAAGTCGCTAACTCCGCCAAGTTCCTCAGCAGAAGAAGCTGTTTTTTCTTCTGCAACAAACCAGATTTACAAGCATATCACTTGGTTCCTACTTGGAATGGTGATTTTTCTGCTTAATCTACATTCATTCTTGGTCTGACAGTAGCTAAGATTTTCCCGATTTCATTCGATTATACTTACTGATACGATAAACACTTTGTAATCAGCAAAATGATATGATGGAAAGAGTTTTATTAGCAGAAAAACATCATCAAAAACAGATGGTAACAGTGTACGAAGATCTCTCCTCTTTTCGTTTGCTTTTACCACTATGCCGTCGTACTGTCTCTTGAAGTGAACAGGTAAGTTCATCACATTCGCTACTGTGAAAACAAAAGCATAAAAAAGCAAAAGAATCATTGTAGGATGCGTGTATTTCATTTCCACCCATCGGACCACTCAGCTTCATCCGTGAAAGGAATGAGATTTCCAATTTCCTTGGTATCTTCACCCCACATTTCAGCAATGCTGTTTTCATCATCGACCCGACAATCCTCCGGAGTTGAAACTTCTGCATCATCTTCATACTCTTGCCTTTCAGGCAGAGCACAACCCAGGTAAGAGTTATGATCGGCACAACGCCATATAAGCTGACTCCAGTAAGGGTCCTGCCATTCATTTATTATCAATGATTAAAAGCCTTTGGTTGTAGACATTAGATGATAATCACAAGTGAAGATTGGTACCTTGGAAATTATGTGAGGATTTCCAACAATAACAAGTAAAGCTATGGCGCGAGTAACCGCCACATTAAACCTTCTAGGATTGCTCAAAAACCCGAGACAGTGGGTTCTGTCGAACTCATTGTGTTTGATTGTTGATCGGACGGTAGATATAACGATAACTTTTCGTTCTTGGCCTTGAAATTGTTCGACGGTGCCAACCTTGACATCTGGTATGTCGAGATTCTCGAAGGCCTTCATTAGTTTAAGGACTTGCTGCCTATAGGGGGTTATCACCCCGATATCTTTCTCGTTCAGAATCCCACTTGCTGTCAAACTACTAACAATTTCTACAACCTTGCTGGCTTCAATCCGATTGAACCATGACGGATTACTTCCTTCCCTCTCATCACAACCTTGTATACCAAAGAAAAAAACAGGGTAGTCCTTATTAGGAAGAAACTTTACTGAGTTCAATAATGAACCTATGTCATCTTTGCAAGGGATCAATTCATCATTGTAGAAGAGAAGTGAAGGGAGATAGAGGATCTCCGGGTGACATCGATAGTTTCTAACCAGTTTTGTCACATAGTTTTCATTGCCATTAGAATAAAACTCGTGTTCAAACAACCTTTCTAAGTATGACTTCCCCAGTCCAAAATTCTCGGCTTCTTTGGAGTATATAACTGGACCTAACTGCTTTGGATCCCCAGCAAGAACAACAACAGTCTCTCTTCGGCAAAGGTTCGCTACAGGGATCATGCTTTCTGGCTCTGAAGCTTGACCTGACTCATCCAAGAAAATATGAGAGAAATGGCCTTTACCAACACTTTCTGCATACAGAAGGGAGGAACTCATGTAAGTTGAGATGATGATTCTGTAGCAGGCGAGAACACTAAGTGGAGGACATTTGAAAACAAGCTCATCAAAGAAGCAAAACCGGAGAAAATCCGGGTTGACGTCGTAATATGGTCGTGTAGCTGCATTTAGTCTGAATATTTCATTCTCTTTAATCTCAACAGACTCCTCATTAAGGAGTCTCTCTAGTATGAAATCAGCCGCGCTATTTGAAGGTGCACACACAAGAATTCGAGAAGATTTTTGGGTTGAGTAGAGCTGGAGGATTGCCTCCACTATTGTCATGGTCTTCCCTGTACCTGGTGGCCCAAAAATCACATAAGGAGGTCCTCCTTTGCAGCCAAGGATCATCTCAATTGAACACATCTGCTCCTCGTTAAGTGTACAACATATGGGCACTAGTGGAGTGGTTTCAATCACCCTACTTTTGGGTGACCCAGATGGAAAAAGGAGACTTACATTTAGGCTTTTTGCTGCATCAATGGCCTGGTATTGCCTCCGCATATTGATTCGGTTATAGGTGAACTGCACATTATAAAGATTCTCATCTATGTGATTCGAGTGAAATTCTGGTGCAAACTTCAAGTACACTTCATCAGCTTCTACCCGATGGATACAACCCTGAAAATCACCACATTCACTTGTCAGAAAGACAGAAATTCTCCAAAAGAAATAGAGGCCATGGGACTGGAAAGACTAAAATGAACACAAGGGAAAGAGTATACAACAGAAGATACCGAGATAAATTTAAGCCAAAGAGGAAGTACTTCAATGATAAAAGGATAAAGCATATAGTATTTTTCGTGTAAAGCAGACCTCATAAACTCTGTCTGATCCACTAGCATCTTCACATGCAAGTTTAGCAAAAATATGATCTCCATGGACAAGGGAAGGCCTTTTTTCAGCGAGCCCAGGGACCTGAAGTGATAAATAATTCCCTCTCTTCCTCATGTTGATATTCTCCATGTTATAGGCCCTCATGTCCTCCTGAAGCCAAAAAAAGGGAATTTCTCAGTTTTGTAACACGAATATCAACCATCTAAGCTACCGAAGGTTAGAATTACCTCGAGTTGTAACTCTTCCAAGATTAAGAGATGTTTGAAGTAAGATACATAATTATCCCTTGTAAGACCTGCTTTAATAGCATCAGTAGTCTGCTTATTCTCAACCAGTTCTCTAATATCCTTCGGAATGTCATATGGGAGAAGCCTGTTTCGAACACCTCGACCCATTGCCCTTACCGGGCGTGGCCCTGTAACAAATTCATCCACTGGAAATTGCTTCTTTCTTTGAGCTCTGGAATATGGCTTCTTAGAAGCCAAAGATTGTGAGATCTTATCTTCAACCAAGAGAAAGACCATTCTTTCCAATCTTTCACCCTCCACATCAAAATGCACTATGGTAGTATGCAACCCAATTTCCTTTGCTTTGCAAGACAACCAAATGGTTAAAGTCTCTCCAGGCTGTATCATTCGGTCCTCTAAATCGAAAAGCTCGACAAACCCTTGGCTCATATCGTCTTCAGAATTTGCCGATGGGGGTTTCATCAAAGAAAGAACGAAAGAATCCTTAGGCGTTGATGCGTAAATTTTAGTCCACAACTCAACCGGTTCACTAGTGGTGTTTTCGATACTGATCAAATCAAATGCAGTTGCTCCCACGAATACAGATTGAGGATTCCCTTTCGAAAATGGGAATGGTGCAGAAATTATGAGAGGACCCCCCTCATGATTGTAATCACAAACAGATTTGTTGTTTGCATAATCGATGAAATTGATTTCGCGTTTGTCCCCGATGACCGAATACTCATCATCGGATTTGTCACCAACTGTTCCCATCACTAACTAGAAAGGGAAGAACTGCTTTGCAACAAAATCCACAAATATGCAATCATTAAAAAACCCTTATACAAGCAGGAACACACTTGTAAGATACAGTACACCACCATATATATATACCGATAAAATAACACTTTTAAACACGATTATGACGCAACAAAATACACGAAATTAACACGAATGCATAAATAAAGCAGGATGATAATCAAGTTTAAGCATTTTCAAATGTCATAAAAAAAAAGAGAAAAAGAAACCCAGCATTTCAATTTTTGCAATGCAACATAATACAATCATAGATAGATAGATAGTACAATACGTGAATCATAGGCAATAACGATCATTTAAAATTCATGATCAAAAGCAAAAACAAGGTCACAAAGCAGAAATTAACAAAACCCAGAAACAAGATAGTGACAATGTAGAAAAAATTAGAAAAAAATATTATTCAAATTCACTGTGCCAAAATTATAAACATTTAGAGTACGTTAGCATGAACTACTCTATGGGTAAAAAAAAAAAAAAGGAAAAAGAACTCACCTCAGTGAATCATAAACCAAAGCTAGAAACTACCATATGAATGAGAGGTTTTCCTTTTTTTTAAATGCAGAGAAATCAAATGAACCTTGAATTCAGTTTTTTAAAGTTTTTTAATTAAAATCAAATGAAAGAGACAATTTTTAAAGAAAATAAAAATAATATGACCCATCACAATCAGCAGATTTTGCCCTACAAGCTGCAAATAAAAAAAAAAACACATAGGTTCATATATTTCATTTTTTTGGCAAAAACAGGGAATTCATAAACAGACGAGGAAGTTAGTTTCACTTATCTATCACTTAAAATAAAGTATAAAAAATGTAAATTTTAATTAAAAATGGTATAAACAATTTAGATATTAAAGGTTTAATTTTTCTTTCAATCCCTCTAGTTTTTAGTTTTTTTTAATTTAATCCCTTTATTTATTGGATTTAAATTAACTTCAACAAAAATAAATTAAAGTTGTTATTAATTTAATTTTAATTTTTAAATCAAATAAGATACTAAAAAGAGAATGATTAAATTTTAAAAATATTGATAATGGGGAAATTGAGAGTACAATTAGAATTAGGGGTGAGAGTTCGATCGAATCAAGTGAAAAAATTTTGAGTTAATCAAGTTCACAAGTCCTATTTTATCATCTTAACTCAATTTAAATTTTTTCAAATATAGTCAAATTGAGTGAAATTATTCAAGTTAAATTAAAAAAATTAAACATGTTAAATAAAAATATTGTTACAGAATGACTAATTTTATGTTAGAGCATATAAATTTGAAACCATATATATTTGAAATAATTTTCAAAGCAAAATAATAATAATAATAAGATACTTGAGTATGATAAATTTGAATCATTAATTAGGTCTCTAAAATTATTATTTTATAAAATTTTTAGAATTTTTTAAAACTTTTATAATTTTTTAAAAAATATAAAATTTGAAATTTTTATAAATATTTTGAATTATTTTGTAATTTTTGTTGAGAGAAAAGCCAATTTATTTATTTCCAAAGTTGATAGGGACTAAAAGGTATTTACACCATTATTCGAATTGTGAAATTCAACTAACTTGAACTCAAAATTTGAATCGAGTTATTCGTGTTAATGCAAATCATTTAAAATTCAAAATTAACTCGATTCAATTAATTTGAAATTTAAAATTCTTTTCGATATTTTTAAATACCCTGATTCAAACTATTAAAAAGGAACTCATAAATATAGTTGAAAAAATTTACAGAGAAAATTTCTTCTTACATATTTTTATTTATTCTTACTAATAAATCCCATTGGCTTATATGACTCTTTTAGCCAATTGGCTTTCTCAGTGATAGAGACAGTTAATTTCCATTTTGATGAATGTATTAACTAATAATTAGAACTGACGTGGCTAAACCCTATTGGTTATTATGACACTCACCAATTGGCTTGTGAAGGGGTCCAAAAAATTTTCTATTTTTTAGTAATGAAATTAAAATAAAATGAGTTTTAAATTTTCTTTGATTTTTAATTGTATCTATTTTTTTGTAGGGGAAATTTATAGGAGTTTCTCTCCTAGTTTTTTTTAATAAATAAATTTTCTTTTTAATTTTGTTCTTTCATGAAATTGAAATCTTTTTAAAAACCGAATTCATCCAATCCGCTCCTATTCCTGTTGTGATCTTAACATAAATAGTGAGACAAATAACATGCCAAAGCTTCTCTACCTTTATGCAATAATCCTTTGTCTACCAAGTCCGGGGCGTAGTTAGGGGCTTCCCTCCTTTAAATTTTTTTAAATTTTAAATTAGTAAAGATAAAATTATATTTTAATCCTCTAAAATTGATAAAAATTTTTATTTAATTCTTTAAAAATTATAAAGATATAGGTTGTGAAATTATATTTTTACTATTATAAAAATTACAATTTAATTTTGACCCTCCCTAAAATAATTTTCTGGCTTCGTTCCTGACCAAGACCCTTATAAGATTCCAATTATCAAAAATTAAATTTCAGCCCCTCAAAAACTCGGTACTTTATTATTGGATTCAGATATGAAATATGCATATATTATTCTACTAGCTAAGATATATCAAAGCAAGTTAAAAAGGAATAAATCTTAAAAAATACATACCAGAATGAGGGAGCTATATAACCTTTCAGGGAGATCCTTGGAAGAGATGATCTTCAAATATACAAAAAAAAGGGTTGTTTTTTTCTTTTTCTTTTAACACCTGGGTAATTAGCATAGAAGTTTAATATATGTAAGTGATATTTTCGAGCGCGTGAAAATAATCAATTTATATAGAAAGCGAGAAACTTAATTTGGTATGTCCAGTAAGTAACCAAAAGTAATATAAATGAATAAATTTAGAATATTGGGATATTTTTATAATTAAAATATAAATTTAAATGATTTTAAATATGGGTTGTTGAAGCCTCCTCATTTTAAAATATTAATAAAATTATTTGTATATGTAATATATAACTGTAAAAATTATATTATATTGATAATAATGTTATTAATAATTTGTAAAAAAATTTGAATCTAATTATTTTAAACTTTAAATTTTTTTTATGTGAATCTATAATTTCAAAATAACAATTGAATAATCTATTTTATCTAATTTAATAAATAAAAATGTGTGACAATCCTTTTCTTTTACCAATAAATTAATAGAACTCAAATATAAAAAATATGCTACTAAGAGATTAGAAACATAATTCAAAGATCTTTTGCTCTCCATAAAAAATTTCCATCTCAAAATACATTGGTTAAGATGTGGCAGCCACAAATTGCTGTACTCTTTTGAAAGTTTAAATGTTAACTTCTTTATTTTTATTTTGAACAACTTTTATTTAAAAATAATAATTTTTCTATTTTTCAAATTTTAAAGTTCAAGTCTAACCATTAATATTAATATTTTTAAAATTCAAATTAATTATATCTTTTTTTTTAAATTATATGGCTATCAAGTAAGTTTTTTTTTATTTCATAATATCACACTAACAAATTTTAAAAAAAAAGTTAAACAATATTTAATAGTAGAATTTGAATTGTGAAATCTGAAAGGTAAAAAAACTAAATTCCTGAAAAAATACAAAGCTTAAATTTCAATTTTTTGAGAAGTATAGAGACTAATGGCATACTTTAATCAAATACAGTATCCCTACATCCCCAGATTTCGAACACCATCACAGCAACAACTTAGTTTTTAATATAAAAGGTTTGGCTGCTCAAGTCAAACATACTGTTTCCTGTCGTTAAAATGCAAATTAAAACATTCATTATGAAAGAGCAATCAAGGATAAAAATCTTTCAAGCTGAAGCAACTGCAGCATCCTTGACCGATTCACGCCAGGCATACTGCCTCGCTCCATCTTTGTCGACGATCTTGATAACAAAGTTTGGAGGTGCCACAACAAGTCGTGACCTTATCTCCATTATGCATTTATCTACCAAGTCGATGGCTTCTTCCACAGTCATGCCGCTGTGGTAGTGCCTGTCCATCATAGAGAGAGAAAAATAGGATCCGTACCCGAATGCTCCCTTATCAACTTTGTGAAGTGTAGCGATGTAGTCAATGTAGTAAAGTGAGGGGCCTGTCTCTTTGTCGTAGCCAGCAAGAAGAATGTTCACGAAGTATGGGTTCTATAAAAAACCAAATGCCATTGTTAATAATAATGATAGTAAGACGAACACGCGGGTGAGCAGAGACCTTAATTCAGCATTCTCATGTCAGACAGGACAAGAAATAAATAATAATAATAAACTCACTGCTAGAAGGAAAATATGCATAGGCAACCTAATAAGGAACTTCAAAACTAGATTTGCAAGATCCAAGAACCGCAAAGACCAATAAGTGCATTGAGCATCAAGCATGGCAGCAACAAAGATCAACAGAGATTTGAAAAGAAACTACATGTGCCAAGAGTCATCATCGGAACTCCAAAAAAAAAACACAGAGTATTGTAATTGTACTTTCAAAATTCCTTGGCCTTATTCTAATCTGATCTTCCTATCCAAAACAACAGCAATTAATCCATAAAGCTTGACAAGAAGTTCTATCAGAAACTACACCTTAAATTGAAATAAAATGTCATATGGTAATGGTCTCGTGCCATAAAAGCATCAACTCCTTTTTGAATCCTATAACAAGCTTACATATTTCATTATAAATTTCAAGCTCAAAAAATTTTAGTTCGAGCAAGCACAGCTGATTGTCTAGTGGAAATCTGAAGGAATATTTTCCTAGATTGTTTAATACAAGATGTAACCCATCTTTTCTCGGCTGAAAAGAATACCTTTACAGGAATCTCATTCAAAAACATATGGAATGGGAAACCACTAACTAGAAGACCCACAAACCAGACACAAAATCTCAGTGAAGGTACCACTAGTATTGCCAAGGGATGGACCTAGGCATTCCATCTTAGCGTCAAAAGATAAAAGAGCCTCAGATCTCTTCAGGCCAGGTGCATTTGATCAGGCACATGCTTGATGTGCATAAGCATACTTTTAAAGTTCCCTTTAATTTAACTTTTTTTAAAAAACATTTTCACTGGATATACATTTATTAGTAAGAAAAGGGAATTAATCAAGGGCTAAGATCCACTCCATTACTTTTTCATCCATTAATATCCAATACAATGATTATCACCATTCAAATGGTAGGACCCATCTATTAAATGTGAAAATCAACTTGTGAATGATGATTAAACGTGCATTGGATATTAATAGATGAAAAAGTAATTGAGTGGAGCCAAACCCATAAATCAAAACCTCTACTTCCCAGTATTGGAGAACTCGACAACAAATATGGGACCGTAAGGGAATCAAGCATATTGGCCAATAAAAATAAAAGAAAGCTTTGCATGTTTTATAGATAAATTGCATCAATCTTTAGAGTTTATTATCATAATTACATGCCTCAAGCTTTATATATACACAAAGACATAAAATTGCGCCTTTACTCAGTCAAGTGCTTTTTTTGTGCTTTGTGTCTTGGGCAATATAAGGGTTCTAACACTAGAGTGCCCCATGTGCTCTTGACAACACTGGGTAGAGATAGAAGGCCAAATAAAACCTTGAAGCCAAGATGAATAAGACAGTCTCTTAGTGAGGTAGCATCCAAACTTTGCACCAAAAAACAAATCCACAGGTTAACACTAAATGTTTAAGTAAGCAAAGGAAATGATAGCCCAGCAACTTCAAAACTTCCTGTGGTTTAGCTAAGCACTCAATAACTCAGCTGGCCCCAAAAGTGGTTACCATCACCCAGGAATCCCAAAAAAAAAATCGGCTTTAACATAACATATGCTTATCTTAGGTACTAGTTCAATGTCCTATGCTGTAAATCAAGCAAAGAAGTGATTGCAATCGGTTCTGGTAAAAGAGGGACCAAAGCACATATCAAGCTACACCAATCGTCGCACATTTCAGGGCATGGTAAAGCTATATCAAACCACTTTGCTTCCAATTCTAACTCATCTAACCCTTCCAGCATTGCTCTATACAAATAGTTTCCAAACCGGAAGCTTCTTCAATTATCGAATATCACCATAATGAGAAATCAAGCAGAGGTAAAACACAGATTATAGCTAATATTTCAATCCCAACGCACAATACATCATTTGAAACTAGTGCAAACCCTAACAAATATTGTATTCCACATAGATTCATTACTCTTCGCCGGTAAAATTTCCACAAGCAAGTAAATTGCAATTAAAGAGCATAACCCTTAATTGAAACTATATAATTGAAACTATATATATGACTAGTATCGATACCTTCCTTAATGCAGTGGCAAGCTCACCGCGAGTGAAATTGGCAGCGGCGGCAGTTGTCAAAGGAATACCATTGCGAAACTGATACAAAGCCACGTTTTTCTGTATATACTCCGTGAATTGCACTCTAGGGAAAAGGAAAAAAGGTTATATAGGAGGAAAAGAAAACAGGGAAGTATATACGTAGATTTATAGGGAGAGAAAGAAAAAGGGGGAAACCTGTCACCGGATTCACCGCTGGCGGCGATGAGTTTGTGAGAATCGAGGACCATGATCTTGTCTTCGTTGGATTTGTGGACGAGGATGCTGTGAACCGCCGATGTGTCCGCCGCCACTACGGCAAAGCCATTGCCTACGAAGCCGAACACGCACTCCATTTTCACTTTTTTTTTGAGGTTTGATTTTGAGGCTTTTGATTTTTTTTTTTTTAAAGCTAATATAAGTTAGTAGAACTGCCTTGAAGAAAAAGTTGTTCTTAGAGTGGGAAAATGGGGAATTTTGGGGAAAGATCGAGGGCTATTTTGTCATAGAAAGAACACTTGGTTTATTGTAACACGCGGTGCTATTTGCAAGGTCGGATTAAGACTCGATTTTAAAAAGATCCCAAGCCTAGCTCGACTAAGCGAATTCAAAATTTTTATATTCTTTTTTTAAAAAAATAATAAAATAATAAAATATATTTATATTTATATATTTTATAATTAAATTTAAATGAAGATATTTAAAAATCATTCTATTAACAATAAATATATTACTATAGTTTTCAACAAGTAGCATCTTATATTTCATCAATAATACATAAACTTAGGAAACTTATATCCTGATGTTGTCAACTTCAAGTATCAGTCATTTGTTCCAGCCTAGTTTTTAAACCTTCATAGACACAACCCCATAACTCCAAGCTCCAATGCTACGCTGCGTGAGAAGCCCATGATCCAAGTTCCATTTCTGTCTCGAAGCAAGCCTCCAATTACAGCCATCCATATTCAATTTGGTCCAGCAAATCTTTCTTCTCGCCACCCTCCAAAGTGTACTTGCCTAGATCCAGCATTAAAATCACCTGAACTGACAATAATGGAGTTCCTTTGTTCCCAGATTTTCCATACAATAATGTGCATTGTTAAACAATAGCCCATGCAGTCTTTAAATAAAACCAACTTTAATCTGAATTTTATCACTCTAAATGTAATCTATCTGATTATTTATTTATGTACTTCACTCACTCATATTTTATTTTAATAAAAGGGAAAACACAAGATTATGTTAAAGGAAAAAGTAAAGATTTCCCTCTTATTTTATTCCTTAAAACCAAAGGACTCCAAAACACACAACAAAACAAGGCTCTTCCTCTTTACATAGGCCACCCTTATTTTATTCCACCATTACATGCCTTACAAAACTACTACTTAGAACAAGCGTGCAAAGTCCAGGAACGGCGATAAGGGGTTATTACTTCCCCTCCTCTCATCAAATCCACGCCGACTCTGTCCAGACACGAAGTAAGATTCTTGCGGGTTGTTGTTGAATACCTCATCCACCAACCTTGACTCCACCCCAAACGCCAGCTCCTTGGCCTGGCGATCCCATTGTCTCACATTGTTGGTTTTCCCAGCCACGAAGATCCTCTTGTTGTCTTGGCCGTTGTAGAGTCCGAACCCGAGCAATCCTAGGTCCTCGTTTTGGGAGGCAACGAATGTGACTGGATGGCCTGCTGGGACTACAAATAGGTCACCGGTTGATAACTGGGCTCTCACTCTCTTGTATTGTCCACTTCTCCTTTCAACTTCTTGTTCTTCTTGTTCTTCTTCCTCTCGGGAGGACCAGTGTGAGCTCTGCCTAGAAAGGTGAGGGCAGACCATTTCGACGTGGCCGTTTCCTTCG
>URS0001836490 rRNA from 1 species 
TGCGTAGGCGGATTTTTAAGTCAGTGGTGAAAGCCCGGAGCTCAACTTCGGAACTGCCATTGATACTATTAATCTTGAATACAGTTGAGGTGGGCGGAATGTGTAGTGTAGCGGTGAAATGCTTAGATATTACACAGAACACCGATTGCGAAGGCAGCTCGCTAAACTGTTATTGACGCTAAGGCACGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCC
>URS000010477A piRNA from 1 species 
GAATATCCCTTTTGAGCTTGCTTG
>URS000188E1BA rRNA from 1 species 
ATACGTAGGGTGCGAGCGTTGTCCGGAATTACTGGGCGTAAAGAGCTCGTAGGTGGTTTGTCGCGTCGTCTGTGAAATTCCGGGGCTTAACTCCGGGCGTGCAGGCGATACGGGCATAACTTGAGTACTGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCAGTAACTGACGCTGAGGAGCGAAAGCATGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGGTGGGCGCTAGGTGTAGGGGTCTTCCACGACTTCTGTGCCGTAGCTAACGCATTAAGCGCCCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTCAAATGAATTGGCGGGG
>URS00023A7F2B lncRNA from 1 species 
CCGGCTATACTAGTTAGAAATTTTCCAACAGTATAGTCGCACGGATATACAAAATTGCTTTTCTCATCCAACGAAGTAGTTTTTCATTCTTATTTTTTTCGTAATGGGGCGGGTCAGGGAACTAATTCTGCAATGAAGGCTGGTATGGGCCAATGGCGGATTGAAGACCGGCATATTCTGAATATGGGCACCAATATACCGGTCGACTAGTTCTCCAAGCCAGTGGCAGTGGTTGCAGTTGATTTCCCCCATTATCACCTATTGGACAACCTTTGCCTTTTCTGTGTCTTGGTGTTTCACCATTTTGGCCAACCATAGTCTCCAGTACCTCGGCCATACTTAATTCCAGTCACCTTAAATGTAACCGAAAATACTTGCTCGAACTCATTCATTTTGGCCCGCCCTAGTTGACTCCCATTTATTTGTCTGCTATTCTAGATCTAGTCATTATCAATCACCATAATAAAGCTCCACTCTTGTAGTTTCAGTTTCACCTGTGCCTTTGATTATTTAGAACAATTTAGACTTTAATGATATGGTCACGGTTACAGCACAAAAGACAAATACCAAAAGCGGCCCTCGTGAAGAAGGGTATGGTCATTGGTCACCCTCAGTTTCACCTGTGCCTTCTCATCACTTTCATTCTCGCCTCCTCATCACTCTCTGTCGTCTGTGGTGCTCAGGAGCACCACCACCACAACGGCATTATCAGCCATGGAGCTCTCTCCGACACCGAAGCCCTCTACATCAAGCAGCGCCAGCTTCTCTACTACGGGGACGAGTTCGGCGACCGAGGCGACCTAGTCACGGTCGACCACCATCTCTGGTTTTTGAGAACCAGAGAATCAGAAATGCTTACATGGCTTTACAAGCTTGGAAGCAAGCCATTCTCTCCGACCCGCTTAATCTCACGGGTAATTGGGTCGGATCTAATGTCTGCAACTGTATTCAATTTAATCAACTGTAGGATTCATTTACAAGGCGAGTGGAAGGAGTCATCAATTTTGAATTAACAAGTTTCTACTTTAACGTATAACAACTATGTTCATATTTATTGGCTGGATAACTTGTTATATTCAGCCAATTACTTGGATAACGTATGCACTTAAGGTGCAAGTGCTTTGACATTTGTGCCACATAGAATTACATTCCTTTTTAAATATTTTATGATATAATTTTTTTTTTATTTTTAAAATTTTGAAATCATTTTTTGGTCCAATGTTACCCCTTATGACTTGAATTGGGTAATAGTCATTTATGTCATATTGCCTACTACCTATTGCATAGGTATATATATATATATATATTTTTTTTTTTTCATATTTTCGACAATGTGTCATAGTATTTTATGTACCTTTTTTTAATAGGTAACATATAATTTTATTTTGTCTATTTTTGTATCTGACTTATGGGTAGTCTTCTAATTTATGTTCCTAACTTATAGATAACACGATTTATCACTAAATATTTTTCGTTGCTAATAATAACACTATTTACTTGTATGTCATGTACATAATTTAATATGGGTGCTTGTCTGATCGATTGGTATAATATGTGGGTCTTTACTTTTTATTAATTAAATCGTATTTTATCCATATATTAGGAATATTATCAAAGAAAGAATTTAAATTTTAAATTATGAAATTCAATTACAAGGAAATAATGCATTAAATTTAGATTTTCAATGTGGTTTCCTTATTTGCCTCAAAGGGTAAAATTGACACAACAAAAAAAAGTAATAAATGTCAAAGGACTTACGTCTAAAACCAAAAACGCGAGCACTAAACCCAATGATAGCTAATCGTTTTGGGCCTAGATCTAAGAAGCCCTTTTATTTATTATCTAACATCGTTGCATGCCATTGATAGTGTGCCTATGGATGAGGAAGAGAAAGTTGTGCTTGACTGATGATTGACGGAAACTTTCGCAAGTAAATCCTCGATGCTACTGGTTGAAGGCCCTTTGATGTTAAAGTTAGCTTAAGGGGATGAGCGCAAGCTATCGACAATGCAAGGGCATAAGTGTCAAGTAGCAAGTCTTACCCTGTATCTAGGGTAAGGAGTTATATATATAGGGAATTCTGGGTTTTTTTGGGTGCTTAGTTTCGATGTGGGACTCGTGGGAGTGCCTTCCAAGGCTAACACGCGTCCCAGCAAATATCCTAGCGATGAACTCAAGAACATCCTGCAAGATGCCTTCTAAGGCGTAGAATTTGGCAAGGCATGCCGAACACACTTACCGGTCGTGGGCCGATCAGTGAACAATTGGCGAATGGAGCTAGAAGCGTCTGCCGTTTGTAGGATTAGACCTACCAGGATGGGTTACAGGGCCATGTTGTGCGTAGAATCGGTCGTGGGTGCCGAAAAGACCTACCGATTAGTACTACTGGGCTTGCCAGGGCGGGCCATGGAGCCTTCCTTCACGTGTCATGGCATGAGATGCGGGTCAGGTATGATACAAACAAACTTAAATTAATTAAACCCATCATGCAATGCATTCCCTTTCAATTTTTTGTGATAAACTCATAGATAATTGACTAAATAAACATCATCCAAAGTTTCAATAAAAATTACCAAGTTTTTTTTACAATTTCCGTAGTTTTTATTCAATTTTTATCGATATCGATAATATCCCGATATTTCCATCAAAATTTCCGTGTTTTTGAACTATCGATATTTTTAATACCATCAATATTTTATACCTTGGCTGTAGGCATTGATTATCAAACTAATTATCAGGGGACCAGTTGTTGGATGACACTTGGGCCAGATTAGAAGTGCATTAAATGTTTCCTTTAGTAATTCTTGGAAACCTGTGCAAGCTAGATTGCTTATAGAGGCGATCTGTGGTGGATTTTCCAGTTGTTTTTTATTTTCTTATGCTTGATTTAATCAAGAAGTGTGAAGGAGTTATTATCTAACATCGTTGCATGCCATTGACTATGGATGAGGAAGATAAAGTTGTGCTTGACTGATGATTGACGGAAACTTTCGCAAGTAATCCTCTCTAGCATTGCTCGTGCCGGAAGTGTAATTGAGGAGCTGTATGGGTTTGGTGTTGTGTGATGAGTATATTAAGGCGTATCAAGGGTATTTTTGGTAGTTAAATAGGATGTACTTAGTTAATTTTATATTTTAATTTAAATATTTGGGTGTACTTAGATCATAAGGTGTACTCAGTTAATTTTAGAATTCGTTTAACCACACTATATTATTATTAATAGTTTTCTATCAAAACAAACCCTTAAGGTCCTTAACTATTGGCTTGCAGCCACATATAATTACTGTGGTGACCTTCTCGAATCATCAATTTTTATTCATTTAAGTTGTTGATCAACTGCTGCAGGCAAGTTATTCTCCTGAACTCGAGTCCCATCAAGAGCGGGTCAAGGGGGTGAGTAATTGTCTCAATTCCACACGTAAACAAACAAAGGCTCACAAAACTCTCCAAAATATACGCATTAATTCTTTGCTTCTTTTCCCTTTATAAGAAGAAGAAAGCCGTCTAATTCATCATCACCAACACAAGCAAACTCAACATCAACAATGTCGACAAAGTCTAGCATTACCGTCCTTGCCTTTGCCTTTTGTTTCTTGTCCCTCCTCAGTTTCGCTTACTCCAACACCACCGACGACAAAATCTCTACCTCACCGGCCTGGTCTACTGTGACAACTGCCAATTGAAGTCTATGACCGAGATGAGTAAGATGATAAGATTTGAATATGAGATTTATGCATGCATGCATGCACATTGCCCATTGATCAGGTGCACATCTTTTTATCTTTTACTTTACTAATTCTTAATTAAGATTCAATTTAGGACCTATTTAAAGAGAAGAAAAATACGATTTAAAATATATCTTATAACCTAATAATCTCCTAATCAAAATATTAAACTTTTAAAATGTCACATATCAATTTAGCCCTTAATTATACTAAGCTTAAATTCCATGGTCCATACTAGTTTGATTTTTATTTTTTATTTTGGTGTGAAAATTTGGTATTTTCTTTAAAATAATGTGCTTGATAGCGTGAAAGTAGCAAATAAATAATGATGTGTTCAAATTGGATTTGAACACACATCACAACCCATATCATCATTAAGGCCCTAAAAATTAAATCATTATGTGCTTGGTTAATACGTTAAGTAGTTTATGAAGTGATTAAGATCAAAGAGGATCCATGACTTGTAATGGATCACTTGTTCATTTACTTAAAAATAAATAAATAAATAAATAAAAGCAAAGGACCCACTAGTGTAGTGGTTTGGAGTATTTACTCCCTTAGGTAAGGTCCTGGGTTCGAGTCCTAGCATCCGTGTTGTGTGTGTGAGTTTAATATGCTATCGCCCCTTTCAATAGGAAAGGACCTCAAAAAAAAAAAAAATAAATAAATAAATAAACTCGCAATACCGACTCCATTCGTAATTCCATCAATTACGCGACCAAAACTTCGTCGCTCAAAGTCTTGCGCGACGAAAAACAATTCGTAGCGCAAAGTCACTTCGCGCGACAAACTTTTGCGCGACGACAATACATCGTCGCTCAAAGTCTTGCGCGACCAAATTTTGCTCGACGAAAAAAATTCGTCGCGCAAAGTCACTTCGCGAGACAAACTTTTGCGCGACAACAATACATCGTCGCTCAAAGTGACTTTGCGCGACGAAACAATGAACTTCGTCGCGCAAAGTCCTTATAAAAATAAAATATATATATTTTAAAATCTTTGCATGACGTAATCCAAATATTTCGTCGCCTAAACTAATTTATTTTTGTTTTTTATTTTGTATGCATAACACTTAAGAAATTAAACAGTATATATATTTATTAAGTAGCTTTAAATTTATTATTTTAGATCAGATCGGATTTTTGTTAGAAAAATATATTATTGTTGTTCAGATTGGGTTTTTGTTAGAAAATATATATTTTAAATTGACGATCGAATTAGTTCATTGTATTCATATATGGTCAAGGAGTGTAGCTATAAAAAGCATCAAAATTGGAGTTAAAATAACCGTTAAATCGTGATTTTTCATTATAACCGTCGAAAAGTTTTGTCCCATTACTTGATCTCTGAATGTTTATTTTTTCTGATTTTTGGCGTATATGATCTCGAAGTATAAACAAACAAGTTTGACGGTTGGATCGTTGAAACTAGTTTTGGTGAATGCATATGCCATCAAAACAATATATTCACTAACAGTTAAGAGTTTATTTATACGTTCGTTAAATATAACATAAGATTTTGTGGTATCCACTAGTGTAAATATTTTAAATTGAAGATCAAATTCAGTCGTTGTATTCACATAGGGTCAAGGAGTGTAGCTGTAAAAAATCATCAAAATCGGAGTTAAAATAACCGTTAAATCGTGATTTTTCATTATAACCGTCGAAAAGTTTTGTCCCATTACTTGATCTCTGAATGTTTATTTTTTCCGATTTTTGGCGTATATGATCTCGAAGTATAAACAAACAAGTTTGACGATTGGATCATTGAAACTAGTTTTGGTGAATGCATATGCCATCAAAACAATATATTCACTAACAATTAAGAGGTTATTTATACGTTCGTTAGATATAACATAAGATTTTGTGGTATCCACTAGTGTAAATATTTTAAATTGAAGATCAAATTCAATCATTGTATTCATATATGGTCAAGGAGTGTAGCTGTAAAAAAAATCATCAAAATCGGAGTTAAAATAACCGTTAAATCGTAATTTTTCATTTATAACCATCGAAAAGTTTTGTCTCGTTACTAGATCTCTGAATGTTTGTTTTTTGCGATTTTTGGGGTATACGATCTTGAAGTATATACAAATAAGTCTGACGGTTGGATCGTTGAATGGTGTGTGTATATATATTTATTTATTAAGTAGCTTTAAATTTATTTATTTTGTACGTATAACACTTAAGAAATTGAATAGTATATATATTTATTAAGCAGCTTTAACCTTATTTATATTTTAAATTGTAAAATAAAATAATTTTATTTTTATTATTCCTAACAATTATTTTTATAAATATTGTGTTACGAACCAATTTTTCGTCTCTCAAAAGTTTGCGCAACCAACAGTTTGTCGCGCAAAACTCTAAAAATTTGGACGGGTACCAAAAATGGGACGCGGGATTTTTAAAAAAAATAAAAAAAATTTAGACTTTGTGCGACCAATATTTTTTGTCGCTCAAAACTTTGCGCGACCAATATATATTTTTCGTCTCTCAAAAATTTGGGCAGGTACCAAAAATGGGAAGCGGGAATTTTTTTAGACTTTGCGCGACTAGTATGTATTTTTCGTCGTGCAAAAATTTAAAAATTTTGGCAGGTACCAAAAATGGGACGCGGGGATTTTTATTTTTTTAAATAATTTTTTTAGACTTTGCGCGACCAATATTCCTATATTCGTCGCGCAAAAATTTAAAAATTTTGGCGGGTACCGAAAATGGGACGCGGGGATTTTTATTTTTTTAAATAATTTTTTTAGACTTTGCGCGACCAATATTCCTATATTCGTCGCGCAAAAATTTAAAAATTTTGGCGGGTACCGAAAATGGGACGCGGGGATTTTTATTTTTTTAAATAATTTTTTTAGACTTTGCGCGACCAATATTCCTATATTCGTCGCGCAAAAAATTAAAAATTTTGGCTGGTACCAAAAATGGGACGCGGGGATTTTTATTTTTTTAAATAATTTTTTTAGACTTTGCGCGACCAATATTCCTATATTCGTCGCGCAAAAATTTAAAAATTTTGGCGGGTACCAAAAATGGGACGCGGGGATTTTTATTTTTTTAAAATATTTTTTTTAGACTTTGCGCGACCAATATTCCTATATTCGTCGCGCAAAAATTTAAAAATTTTGGGGGGTACCAAAAATGGGACGCGGGGATTTTTATTTTTTTAAAATAATTTTTTTAGACTTTGCGCGACCAATATTCCTATATTCGTCGCGCAAAAATTTAAAAATTTTGGCGGGTACCAAAAATGGGACGCGGGGATTTTTATTTTTTTTAAATAATTTTTTTAGACTTTGCGCGACCAATATTCTTATATTCGTCGCGCAAAACTTTGCGCGACCAATATGTTTCGTCGGGCAAAAGTTTGCGCGATCAATATTCCAATATTTTTCGTCGCACAAACCTTTGCGCGACCAACAATATTTTTCGTCGCGCAAAGTGATACGGTTTTTAAAACCGAAATAACTCATCCACCATTTTCTCAATGCCTTTCTCTACTCTTACCTCTCCTTTCTCTTTCCCTCTCCCCAAATCCCACCATTTCTCTCACTTACTCCTCTCACTTAATCTCTCATCTCTCTCTCACTCACTCTCTCATCTCTCTCACTCACTCTCTCATCTCTCTATCACTATCTTCTCTAATTCTCTCACACTCACTTCTCCCTCTCATTCTCATTCACTCTCAATCTTGCCAAAAGGTATATTCTCTCCAAATTTTAAATTTTTTTCATTAATATGTGTTTTTGGAGTTAATTTTGAGTTTGTGTGGGTTTTAGGGTTGAGTAAAGGGGAGGGATTGGAGTTTGGGTTGGATTTGTGGTATAACAATTTTAGGGGAGATTATGCCTTCTTTTTTTTTTTTTTTGTGGTTATTTGACCATATTTATTTTTTTTGTAGGGAATCATCGAGACTTTGACGGCTAAAGTTGAGGATTAGGAAGCTATCAAAACATCTCCTCTGCCACTACCACCACAATACGCTTGTATTAGGGTTTTATTATTGTACTTTGTTAATTTATGTGAACATTTTGAATATTATATATATATATATATTTATTGGATAATTTAATCACTATTTTTCATATGTAATTTTATTTTGAATATGTCAATTTAAATTAAAGTAATTAAAAAAATCATACAATTAAATTAAATTTAAAAAGTAAAAATTAATATCAATTTAAATTAAAGTAATTTTAAAAAGAAATCATACAATTAAATTAAATTTAAAACGTAAAAATTTGAAAAAATTCATATAAATAAATTCATATTAAAGAAATAATAAAACAAAAAGTCAAAAATCTTGCGCGACAAAATATTTCGTAGCGCAAACTATTAAATTAGTTTATTTTAAATTAAAAACATTTAAAACAAAAAATATTTCGTCGCGCAAAACTCAAAAAATTTGGGCAGGTACCAAAAATTGGACGTGGGAATTTTTTAGTTTTTTAAAATTTTTTTTAGACTTTGCGCGACCAATGTTTTTCGTCGCGCAAAACTTTGAGCGACCAATATATTTCGTCGCGCAAATCTTTGCGCGACTAATGTATTTCGTCGTGCACAACTTTGCGCTACCAATATTTTTCGTCGTGCAAAGTCACTTTGCGCGACCAATCTTTTTCGTCGCGCAAAGTCGCTTTGTGCGACCAATATTTTTTCGTCGCGCAAAGTCACTTTGCGTGACCAATGAAAAAATTCGTCGCGCAAAGTCTTTCTTCACGATCTTTGCGCGACGGATTCTGCGCGACGAAGTTTCTGTCTCGCTGAAATTTGTGCGACTACAATGTATTTTGCGCGACGAAATTCTCTTCGTCGCGCAAAGTGTAAAATGTAGTAGTGGTACCAGTTGTGCTTATTTACTTTTTACCATGGCTCTCACAAATCAAGAGACCTCTGCTTAGCTTTTCTTTTTATTTTGGCCATTTGCTCCTCTCAAGCATCATCTCACTAAATTTATGATGAGACTGGATGGCTCAATTTGGGCCAGTTTTTTTTATAAGGATGCTGAGGAGAAGGAGAGGCGATTCATGATAGTCAAGGCCAACTTGGAGTTCATTAAGGCTTTTAACAAACACATGAGCCAGAACTACTTCACACTAAGCTTAAATGAATTTGCAGACCTAACCAATGAGGAGTTTCGGGAAATTCGTAATGGTTACACGAAACGATCCTCCAAATCGATCATGTCCAATTCCACGAAAGCTACATGTTTTAGATATTGAAATGTCACTGATGTGCCACCTTCAGTGGATTGGAGAGAAAAGGGTGCAGTGACACCTATCAAGGACCCAGGCAAATGTGGTAAGTATTAAACAAGTTGTTAAATGATGACGCATTCACTGTTTCACAACCTAACATGTTATTGAATGATGAGGCATGTTATTTCAATTTTATAGGGTGTTGTTGGGCATTCTCAGCAGTGGCAGCTACAAAAGGGGTTAACATGCAAGCTCAAAGCCAGAAACTTAATCTCACTATCAGAGCAAGAGCTTGTGGATTATGACACTACAGGTCAAGATCATGGCTGTGAAGGTGGTCTAATGGATGACGCTTTTCAATTCATCCACGCAACAAAGGCTGACAACTGAAGCTAATCACTTCTACCAGGGTTACAACACTCAGAAGGCTGCATCCCAAACAGTGTCCATAAATGGGTACGAGGATGTGCCTAAAAACAACCAAAATGCTATGTTGCAAGCCGTCGCTAACCAACCAATTTCTTTTGGAATTCAGACTATGATCTGAATTATAACTTGCCTTCTACAAATACTACTGAATGAGTAAAGGTTTCAGAGAGATTTTCAGAATGAGAGAGAGCTCGAGGAAAGAGCAAAAAGATGAATTCTATTCTTCTTCTCACGCACACACTGTGCACTAATAACAGTTGGAACAGGAAATTCCCAAATTACATCATTCAAATCTAGCCATCCATTCTTCTATTCTAAGATTACATCTTAGCTGTCCACTTGGATTGTAATCCAAGGGCTCACATTTAAATCTGTAAATTTGAACTAAATACAACATCATATCAGCAAAAACAGTTATATTTCAACACTCCCTTCTAAGTGTTTAGCTGAGATTACTCCAAGCTTTCTTCTCAGGTATTCAAACCAATCTCTTGCTAGAGCCTTAATAAAGATGTCTGCAGTCTGCTCTTCAATTTTGCAACATAGTAAATCAATCTCTCCATTTTGCAAAGCATCTCGGATGAAGTGAAACCTCCTGTTTATATGCCTTGTCTTATGATGATGCACATGATTCTTGGTTATGGCAATAGCAGAGGTATTATCACATAGAATTGTAGTAGCACCCACATGTTCTTCACCAATGTCTGAGAGAATGAAGCGCAACCAGATTGCTTGTGCAGTAGCTTCTGCTGCACTAACATACTCTACTTCTACTGTAGACAGAGCTACACTACTTTGCTTGACTGAAGCCTAGGAAAACATACCTGATCCAAGATTAAATGCAAATCCAGAGGTGCTTCTCATGTCATCCTCGCTCCCCGACCAATCACTGTCACAGTAGCCAATGAGCCTTGCTTCTTTGCCTTTCTCATATGCTATGCCACAATCAAATGTGCCTTGAATGTACCTCAATACCCTTTTGGCAGTTCCCATATGTTTTCTAGTAGGTCCATGCATAAATCTAGCCAAAAGACTTGCTGCAACCATGATGTCTGGCCTTGTTGCAGTCAAGTACAACAGATTTCCAACTATCTGCCTATAAACCCCTTCATCAGCTTGTTCACTTCCATCTTCCTTGGATAGCTTTTCATTCATTGCAAGAGGAGTAGCCACTGCTTTATAGTCCTTGAAGCCAAATTTGTCTAGCAATGTCTTAGCATATTTCTTCTGGTGCAAGAAAATGTAAGACTCAGTTTGTATCACTCCTAACCCCAAGAAATGGTGAAGCAAACCAAGATCAGTCATTTCATACTGCATCACCATTTCAGTTTTGAACTCCATGATCAAGGCTTTTGAGCTTCCAGTGTAGATAATATCATCTACATATAAAGAAACAATAATAATACTACTTTCTGCAGCCTTTACATATACTGTTGCCTCACTAGGACTTCTCTGGAAACTTGCCTTGATGAAGTAAGAATTGATTTCTTCATACCAAGCTCTTGGAGCTTGTTTAAGTCCATATAATGCCTTCTTGAGTCTATACACTCTATCCTCTTTGTTCTTAATCATAAAACCAGGAGGTTGATCCACATACACCTCTTCATGCAATACTCCATTCAAGAATGCAGACTTCACATCTAACTGAAATAGTTTCCACCCCTTTTGTGCAGGCAATGCCACCAATGTTCTAATGGTATCCAGCCTAGCAACAGGTGCAAATGTTTCATTGAAATCTATCCCTGGCTTTTGAGAATAGCCCTTTGCCACTAGCTGAGCCTTGTCTTTTTGAACTGTACCATCTAAATTCAGCTTGGTTTTATAAATCCATTTGACACCAATTACTGGTTTATCAGTTAGTCTATCAACCAACTCCCAAGTTTTGTTCTTCTCTATAATTTCTATCTCATTCTCCATTGCTTTCTGCCATGCTTCATCCTTAACAGCCTCTTCAAAGGTCTCAGGCTTGATAATACACAAGTTACATCTTGCATACACTTCTGCAATACTCTTGTATTTCAGAGGTGTGTGATCAACATCCAGTGATCCTGAGTCAGGATCAACATGCCCCTCTTCTGAAATCTCTTCTTGACTCAGGCTAGAATCATTAGATTCCTCTTCTCTCTCAGTGAGTGTCTCATTAAGAGGTATTGAGATATCACATTCCTTTTGTGCATTTCAATCCCAAATAGATGCCTCATTGAATATCACATCCCTGGAAATAATCATTTTTTTCAGATGCAATGTTATATAGTCTGAAGCCTTTTCACAGTTGCCATACCCTTCTGCCTTTGTTGATTTGGAACATGTGCATAGCACAAAGAACCAAACACTCTTAAATGCTTAACTCCTAGCTTTCTACCACTATAAGCTTCAAATGGAGTTTTCTTGTCTAAGGCCTTAGTTGGACATCTATTCTGGACATACACTGCAGTGTTTACTGCCTTAGCCCAAAATTCTAGAGGCATCTTCTTCTCAATCATCATGCATTTAGCCATCTCCATAATTGTTCTGTTCTTTTGTTCTGCTATTCCGTTTTGCTATGGTGAATATGTCACAGTTAGCTGCCTTTCCATTCCCATGTCTTCACAAAATTTGTTGAATTCATTGGAAGTATATTCGCCCCCCTGTCACATCTTATTTTCTTCAATTTATATCCACTTTGCAGCTCAACAGTGGCTTTAAATTTCTTAAAGACATTAAGGACTTTTGATTTGTATCTCAAGAAATAGATCCAACACATACGAGTACAATCGTCTATGAAGGTAAGAAAATATCTATTTCCAGCTTTGGTAATAGTCTGCATTGGTCCACATACATTTGTGTGTACCAACTCGAGTGGGATTCTGGCAATCCAAGTACCATTCCCTGATCTTGCAGCAGCTTCAAACTGGTGAAGTTTAAATGCCCCATTCTTCTATGCCAAACTAAAGTTGATGACTCTACATTTGCTCTTAATGCAACCTGTAAAGTTGTGTGAAGCTTCAAAGGAAAACTTATGTCGCCTTTCAGTTGCACCTTAGCAACTAGATTTGATAAAGAACAATCATCATAAATTTCAACCTTATTAGCTCCAAAAATCAGAACATATCCATGCTTCATCATTTGCCCTACACTGAGCAAATTCTTCTTGAGACCAGCAACTAACAGCACTCCTTTGACATACCTTCTTCCCATCTTAGTGTCAACAACAAGATTTAATTTCCTTTTCCAACAACATTAACCAATTGTCCTGTCCCCATTGCAACTTTTGCAATTATATTCCTATCAACATCAACTAATACATCTTCTCTCCCAGTCATATGGTTGCTAGATCCGCTATCCAAATACCATATTGTTCACCCGTTTTGTGTTTGTTCCTGTGATGGTAGGGCAAAATTCCCCATTGCCTTGAAAATCATTGACTGGTCAACAAGTCAACTTTCTTTAGTGTGCGAGCGTGCCACTACTAGCAATGAGAAATCCTAGAAGACTTTAAAAATAGATAACTTGCACCCCAAGTTACTGATTTCTAATCAAACAGTTGTGAATTTGGGTGAGGAATATCTCCCAAGTAAGTTCTTTTCTTGCCTCAGACTGGTGAGTACTTCATAATTTTTCACAGTATAAAACTGGTAGTTCTGGCCAGAATAAATGATGAGAAAATGAACTGTTTTGAGGTAGAATTGCCTTTTACAAAACTCAAAAGGGAAAAGCCAACTCTAGAAAGACAAAAAGAAGGCTGGACTTCCATTTCTGCATGGATAGATGCTTCTGATCCAGGCTGGACTAGACTATCAGCAACTTCAACTGTCAAGTTTCAGCTGTAAATCGATACCAACGTTCGAGTTTGGCAGAGCTTTAATCTATTTCAAGCCCTGGAAGGCTTTTTGAACGGACAGAATTACGGCCTATTCAGTCTGAAGGGTGCAGAAGTGGCTGGACTCAAGGATTATTGAGCTGGAACTGCATTGTGATACTTGTTCTACTTGATCAGGGTTCTCCATAAATTTGTTGAGGTTTTCATTTTTGTGAAAACCCAAGCTCTGCTTGTTTTGGCTTTTGCTGAACCAAATTTGTAACAAGAGAAATCTCATTTTAAATGACTTTTCTCTAAGTCTGAAATTGATTTGTAGTTGGCTTCTTTCTTCTTGAAATTGATTTGTAGTTGGCTTCTTTCTTCTGGCTCAATGAGCTTTTGGTTGCTTCAGTTTGTTTGAAGGTTCTTTGAGATCAAGTGATCATTTTGAGTTTTTGTCTTTTGACTGATTTTTTGGTTGTTTGATTGATTGTCTGATCTTTTGCTCTGTTCACCCTCTCCTATATTTATAAGAGATGCTTTGTAGTGGTGCTTCTAATTCTTTTAATAATGGGCGGAAAAATTTCTCAAAAGATCTTTCATTTTTAAATGCAAAGAAAAAGGGTTTTTATCAATTCTGGCAGATAAGCTTTCTATAGTCAGTTCCTAAGGCAGTCACTTCCCTGTATTTCTTGAAAAAGAAACCTAACCCTTCTTCCAATTTAACTGCTCTTTGTAAGAGTTCAAACTGTGATGGTTTAGTTTTGATCTTCCAGATGAACAACTCCCTGCTTCCCACTTATCTTTTTAGAAAATATGGCCTGCTTATCCCTTGGAAATGATATCTAACGAATTTTTTTGGATATAGAAAAGGATTCTGATCTTTTAGCCCCAAAGTTTCAGGGAAGTCTCTCTGCTAATGACCTGCTTTCATTAATTACCAATCTACTCTCTTGTGACAGTTGAAATTGTTGACTTTTTAAAGTCAGGTATTCACGTGGGCTCTGAGAATAGACTTTCCAAAAATCAGCTGATCTTATACTCCGTGTTTTGAGATAAATGGTGAGTACTTAGATGCTGGGCCCAATCCAATTCTTTTTTATCTACTTTAGTGGTCAATTGCCACTTAATTTGGCCTTCTTTTTTTTTTTTTACAACTTTGCCATTTCGTAAAAGACGTGGGCCTTTCTTCTTTTTTAATTATGCCAAGCCCAGTTTGAGTTGAGCTATGGGCTGATTTCTTTCTTTTCTTCCTTTTCGAAGCCCAAGTTTATTGTCGTGGTTTCGATAGATCACGGGCTGGGCTTTTTTGAATTTTGGGCCCTCGATTCCTGTTTATTTTGCAAAGCCCAGACTGCTTGGGCCCTGTGGCTTTATTCTGGGCTCTATAGTGTTGGGCTAGGTGCACAGGATTTTGGCCCCAACACATACATCATCACATCCTTTTACACTAGCAGAACCTTTATTACTAGCATAAAACATGGTTGGTGTGGATTCGGTCTGAGTAGCATAGTTGAGCTGTTGTGCTGGTTTCTTGCTATAGCAATCTTTTGCAATATGACCAAATTTGTCACAGTTGTAACATTTTGGTTTTCCCTTAAACCGAAAATCACCAAAATGTAGTTCGCCACAATGTTTGCAGGGGTTTCTGGCTCCATCAGTTGATATATTATCCCACTTTTTGCCTTTTGTCCTCCAATTCCTTTGATCCCTAAAACCACTTTGACTTCCACTGTAATTTTTTGATTGGGATTCACACAAAGACTAGCAAATGCTTTCTCAGTCTTATCTCCAAAGTGCCTATCTAGCCATAATTCAAAACTCTTCAAAGAGGTTACCACTTCTTGTACCTCAATTTCATCCAAATCCTTAGAATGCTCAATAACAGAACAGATTGAATCATAAGCTGATGGCAAACTGATTAGTAATTTTTGAACAATCCTTGCTCTAGCTAAATCCTTTCCATAGCTCCTCATTTGGTTTATCAGATCAAACGGTTTGGTAAGATAAGCAGAAAGGGACTCATCATCTCTGATTCTTGTATATTCAAATTCTCTACATAGACCTTGCAATTTAACACTTCTAACCTGTTTATCACCATGGAATTCCTTCATCAAGATATCCCAAGCTCCCTCAAAGGTTTCTTCATGAGAGAATCGAGGGAAGATCTCATCAGACGCTGCTCCTTGAATAAGACCCAGAGCTTTAGCATTCTTCATGAGTAGCTCAGTGAGAGTCATCTTCCAAGCACCACTCGATTCTTCCTTTTCTTTCTTCTTTGCATCAGATTCTCCAGCTCCCTTCGAATTTGAGCACTCTATTCCCTTCTCAACCAATTCCCAAAGCCCATGAGATTTGAAAATGGTTTTCATTCTTATGCTCCAATTTTCGTAGTTATCACCGCCAAAGATCGGCACTCTCAGCTCACCACCTCCATACCCTGCCATGTTAGACACAAATCGCGAAACCACTTTTCCAAATTTCAGCTAGTTTTCTTCACAGATTTAATCGCCCAAAGTTAAACAATAGAACCTGGCTCTGAGGCCATGTTAGAATTCAAACTATGATCTGAATTATAACTTGCATTCTACAAATGCTACTGAATGAGTAAAGGTTTCAGAGAGATTTTTAGAATGAGAGAGAGCTTGAGGAAGGAGCAAAAAGATGAATTCTATTCTTCTTCTCTCGCACACACTCTGCACTAATAACAGCTGGAACAGGAAATTCCCAAATTATATCATCCAAATCTAGCCATCCATTCTTCTATTCTAAGATTACATCTTAGCTGTCCACTTGGACTGTAATCCAAGCGCTCACATTTAAATCTGTAAATTTAAACTAAATACAACATCATATCAGCTAAAACACTTATATTTCAACATTTCGGTTGCCATTGACGCAAGTGGCTGTACATTCCAGTTTTATTCAAGTGGTGTGTTCACTGTGGTATAAACTTAGATCATGGTGTTACCGCAGTTGGATACGGGACTAGGACTAGTAGTGATGGGACTAAATACTGGCTGGTGAAGAATTTTTAGGGCACATGGTTGGGGGAGGATGGATATGTGACGATGCAAAGGGGCATTCCTGCCAAGGAAGGACTCTGTGGCATTGCTATGGAAGCTTCTTATCCAACCGCATGATTAATTAAAATGCATATATGTCATAATATAGTGTGGTGTATAAAATATGTATAATTGAATAATATAGAAAGACGCTAGCTATGAGCTGCTATCCTTCCACTTTGAAATCCATGCCTCAAAACATAGAAACAATTAACCCATGACGTGGATTTGCTCTTAAAATCTCACTCAATGAATTAGCAGCTATAGCTATGAGGTTGACATGTTTTCATTACCATTGCAAGGTTAAATCAAGTTAGATTAAGGGTGCATATTTTTGCTCACCATCATTCTTAATATTTGACATGTGTCTATGGGTATAACCATATAGTTCTATAAATATATAACTATGATTATGTCAATGAACACGTGTCAAGTGTTAAAATGGGTAGTGAGAGTACACATTTGGTTAAAGTGGTGAGTAAATATATTCCCTTAGAGTAATCACATGATCATGTCACTGATCCTACAAGGTAAAACTGTGAAACGACGTCATTACACTTGTTCGGAGGTGGCATGGATTGGAAACACGTAATTAACCATATATATAACATCAATTTACAACTTAATTATACTTATTCTTAAAGCCATTTCTGATCGGACATTTTTGGAGAAATTAATTTCTCAGGCAAGTAAATGGCAGCAGAAGAGGACCGGAAAATTTAGGTGCCAGTAGAAGAGAAAAACTCTCTCGCACGTACCTGGTTTATGGAAGTTTGCTGTAACAGGAGAGCTAGATAAAACTTAATTTGAAAAATTCTAGGATACGTAACTAGAGCTTACAAGGTGGTGTTGTTGACTGGCTACAACTTCAAATACAAACCGTTGAGCTAGCTTGCTGTGCGCAGTATATAAAGATTATTTAGGACTAGCTAGGCTCATAATTAATATATACATATATATATAATTACTTTATATTTTTAAAGAGGGGGAAGTACAATATTATGATGAAGAGATGAGTCTTTTTGCCAATTAAAATGCACCATTTATATATTCTGTATCCAGATTACCTTTTGCATGATCTTGCCATGAACATCCAAAAATGCACCAATCTAGTTAAAATTCAAAACAAATTTAAAGATTTTTACATCGTAGTTAAAGGAAATTCATTGTTCCTATAACTTGTGCTTCCTATACACACACAAATTCCATGAATCAATTGACAATGTGATATTAATATTACCATATAACATTTTCAACATTTTCATCTCGTCCTAGCATTCAAGTAAAGAAAAGAATACACGTATACTTGGATTGTTGATGTCTAACTTTGACTCAACGGATTAAGATCGTAAAAACGACACATTCACATCATGACACACACTCAAGTCAGGCTACGTCCATAATATACAATTAGTGAACTGAATTACATGAATCTACAAGTACGGGATATAAAAGCTACAAGCCCTACATGCTACAATATCTGTCCTATTTTTGGGTCAACTGTTCCTTATTCTCTTTGATAGTACAATCGAGTTTACATGTTAGGATCCTAACGGGGATATTAAATGCTGAAAAGGAAATAATCAATTCCCAATAAGCCCTTAAGATCGTCTAACCAAGATACAAGCCTCATATATATCTTAACAAATCTTTCTAGTTCTTAAAGGTTATAGCATCCATCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTATATATATATATATATATATATCCTCTCATATAAGTCCAAATTATCATGATATTTGTCTTTAAAGAATTAATTAACATACTTATCACCGCGCAGAAAATTAATTTATGTCTTCAAGATGTCTATAGAGCATTATTAAACTAATCCTAAAATAAATAAATATTTTTATTCTTAGTGCAATGTGGAAATATCTTTAAAGAATAGAATATTTCACCAATATAGAAGAGCGGCTATACTCAACAAATATAAATTTTCAATAGTCTAGCCGAGTGGCTGTACTCTATAAATATAAATTTTTTAACAGTACAACCGCATGGCTATACTCTTTAAATAGAAATTTCAAAATTATAGCCGTCCGGCTATACTAGTTAAATAGAATTTTTCCAACAGTATAGTCGCACGGATATACAAAATCGCTTTTCTCATTCAACGAAGTAGTTTTTCATTTTTATTTTTTCTGTAACGGGGCGGGTCAGGGAACCAGTTCCTTAATAAAGGCTGGTATGGGCCAATGGCGGATTGAAGACCGACATATTCTGAATATGGGCACCAATATACCGGTCGACTAGTTCTCCTAGCCAGTGGCAGTGGTTGCGGTTGATTTCCCCCATGATCACCTATTGGACAACCTTTGCCTTTTCTGTTCTTGGTGTTTCACCATTTTGGCCAACCATAGTCTCTAGTACCTCGGCCATACTTAATTCCAGTCACCTTAAATGTAACCCAAAATACTTGGTCGAACTCATTCATTTTTGCCCGCCTTAGGTGGCTTTTGGCAGCGCTTAATTTTTTTTAAAAGCAACTTTAATACAAATTTGGCATGAGTTGGGTGTTTGGTAAACCCAAAAAAACACGCTTATTTTAAAAACACCCATCATAAAAAGCAAAAACTCAACGTCAGGTATATGGAGCTTTCAAAAGCTGTTTAAAAAAAGAGCTGGTTTTCTTGTTAATGAAAGTTTCATTATCCCTATAGTACCCCTAAGTATTTCACAAAATGACAACGTTTGACCCTCTCACAAAATAGATCTCGCGACCTTCACACTTTCTGACCTCACTCTCAGACTGCTCTTCTCACTATTCTTCTTCTTCCTCCCCCTGCATCTCAAAACTCCATCTCAATCAAGGACTTTAATTGCCAACAACAATCAGCTACTTATCAGTGAGTTCATCTTCCCATTACATTTATGATTTTTGGGTTTATATATGTTATGAAATTAGGTTTTTCATTTGGTTCTATGCAATTGGGGGCTTTGTGTTCTTGAGGCTTTAAGGGGAAAATACGGGAGAGACAGAGAGAGAGTTTTGCTGCAAGTTTTGTACTGGGTTTGTCTCTCCTTGCTCTTTGACAAGGAGAGATTTCTCCCTAGCTTGGTTCAATTGGCCTTTGGGTCAGATACTTCTCTCTCTGTTTCTATTTCTCTGAAACATGTCTGTCCTGGATGCTTTTTTTCTATAGATTACACAACCATCATTGTTCATAGATTTACTCATTGTATAGTTTGGTACAGTTCCAAAATATCAAGAACAAAACCCGTTATGCTAATCTGGTTCTTTATATACATAAATATAAATATAAATAAATATATATATATATATATACAGTCCCCTTCTATTGAGAGATCTCTCAAATAATTTTATTTGAGGGACGCCCTTAGGGTACCCTACAATTTTCTTTCCAATGATCCAAACCATCTATTTTTTAGGTCTTCATTCATAAATCATCCTTACAAAAAATTAGATAAATCGGAAACCGTTTTGACATCCAATTGTATCTTACAAAATCAATGAACACGTTCCTTCAAGAAAGTACTAAAATTTCAATAACTCAAATGAGTGGTCAAATGATATCATATTCGAGTAATTTTTTTGTAGAGATGATCTTTGAATGAATATCTACAAAATAGACTGTTTGGATTAGTTAAATACAATTCGGAGTGGGGCCTATAAGGAGTGTCCCTCAAATACTTATTTGAGGGATCCCTCAATGGAAACTCTCTGTATATATATATATATATATATATATATATATATGATTGCAACCCAAGTCCCCAAGTCAGGTCCGTGTTGATTTTTCCATTGTCCTAACCTTGTTGTCTTCAAGCTCAAACATAATTCCTTTGGACTTTAGTTTTAGTTCTCTTTTAGTTAGAAGACAAGAAAAGAGTGAAGAAGCCATTAGCTCCAGATCTGGGGCTTCTGTTTTCTCAAGAATTTTTTTAAAAAAAAAAAAGATCCTATTATGTGAAACTGCTGTTCCATCTAAGTTGTCATCCATTATTGTGTTAGAAGATTTTTGGTAAACAAAGCTTTTATTTTTTAGTGGTCATAGTTTCAAGTTCTTCCTTATTATTATTTTTCAGTGTCGGTGGACTTTATTATTGTGTTAGAAGATTTTTGATTGGGTAATGGTTTGAAGTTCTTCCTTCTATTTATATTTTTTTGTGTTGGTGGGCTTTATCAAAAGTGATTGTAGCATGCTGGTCATTGTGGTGGGGAACTCATAAACTGACATATGGTTGAAATATAAAAATTTTGTAAATTGGTATGAAATTGCATTCTCAGTAAATTATGGGAATGCAATATCATCTTGCCTTAGAACATATGATAGAAACAAAACATTTTAACCACAACACAGACTTAAGAGATTCAATAAACTGTTCCCTAGTAAGCTGGAAATATTGGCTAAGACTTTATGTTATCTTTGTCTCCTCTTGGCAGAATAGGCTTGCTAGTTCCTCAAGTAATATATGTTAAAGATTAGGAAAATTATATAGTTCTTGTTCTTAGGTCAATTGTGAAGGTGATCAGTTTATTTTCATGTGTGGATTCTTTTCGTTCTTGGTTTTCTTTCATGAATCATTAGGAATACTCTATGCTTGGACTCTTTGTCCCTTGTTGAGAATGAGAAGTGGGTTTAAGGAAGTTTTGTTGGGAGCCATCATCATTTTTAAACATATAGCATATAGTGGATAATATAGATGAATATTCATACCTGTGGGAAAAGGAAAGTTTGTTATTTTTATGCTTTTAGTATAATGTATATCTTGGGACAATTATTTGCTATTATCTATTTCTCATACTCAACACATATTGCTTTAGTAAGGATGGGAAAGAATGTGAGAAGTTCATCAAAAGCTCCAGCGACATGGAATAACCATAATATATCCATATTCTGTGATTTGTGCATCAAGGAGATATGCCTAATTATCCATTCAACAAGCAAGTGAAGATAGTCATTGCTACAATGACACTTCATAATTATATAAGGAGGCATGCCCAACGTGATAGACATTTTGATGCTTCAAATGATATCTTAAGTGAAGAGATAGGTGAGGATGTTGATGTACAACAAGAAGTTCATAGTCTTAATGACAATGGAACACAAGAGATGGAAGCATTGAGAAATAGCATCGCTACAAGTTTCATGAATGCATCTAATTAGCTTCTTTTATATTGTAGTGATCCATTTTGGCATGTTAAAATTGAACAATTTTTGTATATTTGTTATGCTAACCCTCTCCGAAGCCCTCAAAACACATTGTTATTATTAATATAACAATATTTAGAACTACTTTTGTTACAATATTAATTTATAATTTATGGTAATATATGTGTGCTAATTGTAGATTACAAATTTTGATAAATTAAAAATGTGTAAATTAAAAAAGAAAACAAATTTATGTAGTGAAGTTTGTTTTCTTTTTTTTAAAGTAGAAAAAGAATGAAGAAAAAAAGAAACCGTTTCATCATCATGTCCTTTTCGTTCATTATACATACTAAAAGCACTTCTGATAAAAATTTACCGAACACTTCGACTACTCACAGCCTTTTTTCATATACAGTTTACCAAACGCCTAGCTGTTTTTTTTTCATAGCTGATTATTTTCGCAGCACAGCAGAAACAGTTTTTTTTTAAAGCACAACAATGCCAAACTAGCCCTTAGTTGACTCCCATTTATTTTTCTGCTATTCTAGATCTAGTCATTATCAATCACCATAATAAAGCTCCACTTCTTGTAGTTTCAGTTTCACCTGTGCCTTTGATTATTTAGAACAATTTAGACTTTAATGATATGGTCACGGTTACAGCACAAAAGACAAATACCAAAAGCGGCCCTCGTGAAGAAGGGTATGGTCATTGGTCACCCTCAGTTTCACTTGTGCCTTCTCATCACCTTCGCTCTCGCCTCCTCATCACTCTCTGTCGTCTGTGGTGCGCAGGAGCACCACCACCACAACAACATTATCAGCCATGGAGCTCTCTCCGACACCGAAGCCCTCTACATCAAGCAGCGCCAGCTCCTCTACTACGGGGACGAGTTCGGCGACCGAGACGAGCTAGTCACGGTCGACCCATCTCTGGTTTTCGAGAACCAGAGAATCAGAAATGCTTACATGGCTTTACAAGCTTGGAAGCAAGCCATTCTCTCCGACCCGCTTAATCTCACGGGTAATTGGGTCGGATCTAATGTCTGCAACTGTATTCAATTTAATCAACTGTAGGATTCATTTACAAGGCGAGTGGAAGGAGTCATCAATTTTGAATTAACAAGTTTCTACTGTAACGTATAACAACTATGTTCATATTTATTGGCTGGATAAGTTGTTATATTCAGC
>URS0000B8F910 rRNA from 1 species 
GTGCCAGCCGCCGCGGTAATACGTAGGGGGCCAGCGTTGTCCGGAATCATTGGGCGTAAAGCGCGCGTAGGCGGCCAGACAAGTCCGGTGTGAAAGTCACAGGCTCAACCTGTGAATGCCGCTGGAAACTGTCTGGCTAGAGTCCGGAAGGGGCGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCTATGGCGAAGGCAGCTCGCTGGGACGGTACTGACGCTGAGGCGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCCTGTAGTCC
>URS0000C2AFAE pre_miRNA from 1 species 
CAAGTACTCCCTCCGTCCAAAAATACTTGTCGCAGAAATGCATAAAAATGGATGTATCTAAAACTAAAATATGTCTAGATACATTCATTTTTTCCGACAAGTATTTCCGGACGGAGGGAGTACAAC
>URS00023A1339 lncRNA from 1 species 
CAGCCTATAAACGGACGCAAGTTAATATCGGTACGGCCGACCATCGAATCACCGTCGAAACCAAATTCTACGGCGCAGGACCAGGTTTAAGAGAAGTAGTCATCATCGAACGAAACTCTTCAAAATTCACATTGCCATCACCATCGGCATCCACCGGCTTAATCATCGCCACACATCCATCAACCGAGCACTTAATTCCGAGCCTGTTCAACACCAAATTCAACTCCTCCGCCGAAATCAAGCCGTTCTTGTCCTGATCGTAGAGATCAAACGCCTCGCGGAGCTCGGCCTCGCCGGCGGCACCAGAGGAGGTCCGGC
>URS000118CADB rRNA from 1 species 
CCTACGAGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGCGAGCCTGAACCAGCCAAGTAGCGTGAAGGATGACTGCCCTACGGGTTGTAAACTTCTTTTATAAAGGAATAAAGTGAGGCACGTGTGCCTTTTTGTATGTACTTTATGAATAAGGATCGGCTAAATCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGAGCGTAGATGGGGTGTTAAGTCAGTTGTGAAAGTTTGCGGCTCAACCGTAAAATTGCAATTGATACTGGCAGCCTTGAGTACAGTTGAGGTAGGCGGAATTCGTGGTGGAGCGGTGAAATGCTTAGATAACACGAAGAACGACGAGTGCGAAGGCAGCTTACTAAACTGCCACTGACATTGAGGCTCGAAAGTGTGGGTATCAAACAGGATTAGATACCCTTGTAGTA
>URS000006351C rRNA from 1 species 
GCGGGGTAAAGGCCCACCAAGGCAACGATGGGTAGCCGGCCTGAGAGGGTGATCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATTTTGCGCAATGGACGAAAGTCTGACGCAGCAACACCGTGTGAGGGATGAAGCATTTCGGTGTGTAAACCTCTGTCGATGATGAATAATGTTTCGGGGAGTGGAAAGCCTCGGAATTGAAGGTAATCATGAAGGAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGGGGGTGCAAGCGTTGTTCGGAATCACTGGGCGTAAAGGGAGCGTAGGCGGAACTACAAGACAGAGGTTAAATCTCCGGGCTCAACCTGGAACTTGCCTTTGTGACTGTGGTTCTTGAGTATGGTAGAGGTTGGCGGAATTTCCGGTGTAGCGGTGGAATGCGTAGAGATCGGAAAGAACACCAGAGGCGAAGGCGGCCAACTGGACCAATACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGAACACTAGATGTCGGGAGGGGTTCCTTCCGGTGTCGTCGCTAACGCAGTAAGTGTTCCGCCTGGGG
>URS0000ECDE64 rRNA from 1 species 
GGGCCCGCACAAGCAGCGGAGCATGTTGTTTAATTCGACGCGACGCGAAGAACCTTACCAAGGCTTGACATGCACGGGAATGTCGTAGAAATATGGCAGCCCTTCGGGGCTCGTGCACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTGTCCCATGTTGCCAGCGTGAAAGACGGGGACTCATGGGATACTGCCGGTGACAAATCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGTCTTGGGCTACAAACGTGCTACATTGGCCGGTACAAAGGGCTGCAAACCTGCGAGGGTGAGCGAATCCCAAAAAGCCGGTCCCGGTTCGGATTGGAGGCTGAAACTCGCCTCCATGAAGGCGGAGTTGCTAGTAATCGCGGATCAGCAACGCCGCGGTGAATATGTTCCCGGGCCTT
>URS0000175B41 rRNA from 1 species 
AGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTCTCAGTATAAGCAGTCAAATGGTGAAACTGCGAATGGCTCATTAAAGCAGTTATAGTTTATTTGATGGTTGCTGCTACATGGATAACTGTGGTAATTCTAGAGCTAATACATGCATCCAAGCCCGACTTTGCAGAAGGGTTGTGTTTATTAGATCCAGAACCAACCCAGGCTCCGCCTGGTCATGTGGTGATTCATGATAACTTGACGAATCGTGCGGCCTTGCCGACGATGCGTCATTCAAGTTTCTGACCTATCAGCTTCCGACGGTAGGGTATTGGCCTACCGTGGCAATGACGGGTAACGGAGAATTAGGGTTTGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCTGACACAGGGAGGTAGTGACAAGAAATAACAATACAGGGCATCCATGTCTTGTAATTGGAATGAACAGAATTTAAATCTCTTTATGAGTATCAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCGGTTAAAAAGCTCGTAGTTGGATTTCTGTTGAGGATGACCGGTCCGCCCTCTGGGTGAGTATCTGGCTCAGCCTTGACATCTTTCTGAAGAACGTATCTGCACTTGACTGTGTGGTGCGGAATTTGGGACATTTACCTTGAGGAAATTAGAGTGTTTCAAGCAAGCGCACGCTTTGAATACATTAGCATGGAATAATAAGATAGGACCTCAGTTCTATTTTGTTGGTTTCTAGAGCTGTGGTAATGGTTGATAGGGATAGTTGGGGGCATTCGTATTTAACTGTCAGAGGTGAAATTCTTGGATTTGTTAAAGACGGACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTGATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCCTAGTCTTAACCATAAACCATGCCAACTAGAGATTGGAGGTCGTTACTTGCATGACTCTTTCAGCACCTTATGAGAAATCAAAGTCTTTGGGTTCCGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTTACCAGGTCCAGACATAGTAAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCTTAACCTGCTAAATAGTTACATGTAACCTCGGTTACATGGGCAACTTCTTAGAGGGACTTTGTGTGTCTAACGCAAGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTAGATGTCCTGGGCTGCACGCGCGCTACACTGATGCGCTCATCAAGTTTTCGATCTTGCCCGAAATGGCTGGGTAATCTTTTTAAAATGCATCGTGATGGGGATAGATCATTGCAATTATTGATCTTCAACGAGGAATTCCTCGTAAGCGCGAGTCATCAGCTCGTGCTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTCCTACCGATTGAGTGATCCGGTGAATAATTCGGACTGACGCAGTGCTCAGCTTCCGGACGTTGTGTTGGAAAGTTTCATGAACCTTATCACTTAGAGGAAGGAGAAGTCGTAACAAGGTTTCC
>URS0001B743B1 rRNA from 1 species 
CCTGGTTGATTCTGCCAGTAGTCATACGCTCGTCTCAAAGATTAAGCCATGCACGTCTAAGTATAAATACTTTACTTTGAAACTGCGAATGGCTCATTATATCAGTTACAGTTTATTTAATAGTCCCTTACTATTTGGATAACCGTAGTAATTCTAGAGCTAATACATGCGTCAATACCCTTCTGGGGTAGTATTTATTAGATTGAAACCAACCCCTTCGGGGTGATGTGGTGATTCATAATAAGCTTGCGGATCGCATGGCTTTGCCGGCGATGGATCATTCAAGTTTCTGCCCTATCAGCTTTGGACGGTAATGTATTGGATTACCGTGGCTTTAACGGGTAACGGGGGATTAGGGTTTGATTCCGGAGAGGGCGCCTGAGAGACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGTAAATTACCCAATCCTGACACAGGGAGGTAGTGACAAAAAATAACAATGGCGGGCCTTTCTAGGTCTGCCAATTGGAATGAGAACAATTTAAAAACCTTATCGAGGACCAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTGTGGTGGCGCCCGAGGTCCAATTGTTGGTACTATCGGGTGCTGCCATCCTTGGGTGGAATCTGTGTGGCATAGGTTGTCGTGCAGGGGATGCCCATCGTTTACTGTGAAAAAATCAGCGCGTTCAAAGCAGGCTTATGCCGTTGAATGTATTAGCATGGAATAATAAGATAGGACCTTGGTACTATTTTGTTGGTTTGCGCACCGAGGTAATGATTAATAGGGACAGTTGGGGGTATTCGTATTCCATTGTCAGAGGTGAAATTCTTGGATTTCTGGAAGACGAACTACTGCGAAAGCATTTACCAAGGATGTTTTCATTAATCAAGAACGAAAGTAAGGGGATCGAAGATGATTAGATACCATCGTAGTCTTTACCATAAACTATGCCGACAAGGGATTGGTGGGGTTTCGTTACGTCTCCATCAGCACCTTATGAGAAATCACAAGTTTTTGGGTTCCGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGAAATTGACGGAAGGGCACCACCAGTAGTGGAGCCTGCGGCTTAATTTGACACAACACGGGAAAACTTACCAGGTCCAGACATAGTGAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCGCTGCCTGCTAAATAGTCCAGTCAGTGAATTTCACTGGCGAGGACTTCTTAGAGGGACGTGCATTC
>URS0001EA0CFC rRNA from 1 species 
ATAATAATCGGGCATAAGTATACCACCGAAGCTATGGACTTATTTTATAAGTGGTAGGGGAGCATTCTAGTTACGTTGAAGGTGCATGGCAATGTGTGCTGGAGTGGCTAGAAAAGAAAATGTAGGAATGAGTAACGATAATGCGGGCGAGAAACCCGCACACCGTAAGACTAAGGTTTCCTGAACAACGCTAATCGGTTCAGGGTTAGTCGGGTCCTAAGGCGCACCCGAATGGGGAAGTCGA
>URS0000169475 rRNA from 1 species 
AACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGGAAAGTGGAGCAATCCACGAGTATAGTGGCGACCGGGTGAGTAACACGTGACTACCTGCCCTTGAGTGGGGGATAACCTTGGGAAACCGGGGCTAATACCGCATAAAATCGAAAGATCAAAGGAGCAATCCGCTTTTGGAGGGGGTCGCGGCTGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGAAGATCGGTATCCGGCCTGAGAGGGCGCACGGACACACTGGAACTGAAACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGCGCAATGGGGGAAACCCTGACGCAGCAACGCCGCGTGGAGGATGAAGCCCCTTGGGGTGTAAACTCCTTTCGACCGGGAAAATTATGATGGTACCGGTGGAAGAAGC
>URS00003DDD0E piRNA from 1 species 
TNGGGCCTTAGTATCACTCTCAGTTACC
>URS0002242497 RNase_P_RNA from 1 species 
GCAGTTGGACGGTCTGTCGCCGGCTCCTTTCGAGGGGCTGGAGGAAAGTCCGGGCAACGCAGAGCGTTCCACTTCTTAACGGAAGTTGTCGGCGACGGCAGGGTAACGCAGAAGAAAACAACCGCCGGTGCGACGTTGCGGGCCCCCGTTTCAAGTAATGTCCATCGGTAAGGGTGAGAAGGTGGGGTAAGAGCCCACCGGGCGACGCGGTGACGCGCCGTGCCGTGCGTCCTGGAAGTTGCAAGTTCATGTAAACCGGCGTCAGAGGGCTGCTCGTCCGAGCCGGAGGGTAGAACGCGTCAGATAAATGACAGACACCTCGCCTGCGCGGGGCACAGAACCTGGCTTACAGACCAACTGCCGTT
>URS0000AF82F7 rRNA from 1 species 
TGAGGGAAAGGCGAAAAGAACCCCGGCGAGGGGAGTGAAAAAGAACCTGAAACCGTGTACGTACAAGCAGTGGGAGCACAGGTTTACCTGTGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCTGTAGCAAGGTTAACCGAATAGGGGAGCCGGAGGGAAACCGAGTCTTAACCGGGCGTTAAGTTGCAGGGTATAGACCCGAAACCCGGTGATCTAGCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACCTGTGGCTGGGGGTGAAAGGCCAATCAAACCGGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGTGAATTCATCTCCGGGGGTAGAGCACTGTTTCGGCTAGGGGGCCATCCCGGCTTACCAACCCGATGCAAACTGCGAATACCGGAGAATGTTATCACGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGAAGAGGGAAACAACCCAGACCGCCAGCTAAGGTCCCAAAGTCATGGTTAAGTGGGAAACGATGTGGGAAGGCCCAGACAGCCAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAATAGCTCACTGGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTAAACCATGCACCGAAGCTGCGGCAGCGA
>URS00019A0A0A lncRNA from 1 species 
GGGGGATGTAGGGATTCATCTTTGTCACATTTTCTCTCTAATTTAGCTGTCTAGGGAGCCTCCCTTGTTTTGCAGAAGTGGAAACATCCAGTTTAATTTCATCTTTTCTCAGACTGCAGTAGCTTGCTTCCTCAGAAGCCAGGGTCTCTCTCCATTTATTCTTAGTGTTTATCCCTTTAATTCTCCTACAGTTTCACAAGTGCTTCTGGTATATTTTGTAATTTTAGCTTATAATCACATTTTTCGAAGAGGCACCATCTGGTTCCTGACATGGCTTAAAATAACAATCTAACTAACACGAACCCTGCAGCAATGCTTTGCGCCCTTCCCAACCCAGTGTGAGAGTGTCCCCACCTATATTTCTTCACAAATGCTCCACTGTTAGGTTCCATCCCTTCCGATAGATCTCACAGAAAGCGGGGCCTTTTACCTCTTTCATCTCGAACCCAGTCGTTTCAGGCAGTCAAAATGGATGCGTTAAAAAAAAAAAAAAAAAACCTTGCAGCTAGGACAGCAGAGGATCTGCTGTGAACTGCTCAGTCAGAGACTTGGAGCTGGAGCTCACGTCTGTATTTCAGCTGCCCTCTGGTGCTTAGCACTGCAGCAGTACACGCCATCATCATGGCCCCAGTGCTTGGAGGTCCCTGCGACGGAGCAGCGGAAACCAAGCACAGCAAAAATTCCTTTGAAGACAGAAAAGTGGCCCAGTGCTGTGCAGCAGGGCTACGGTGCTGGAATCCAGCCCGGCCCAGTGCCGGCGTTGGCAGCGGCCTTCCCATTATATCAGGAAGGGCTGTATCCCGTCGCCACCATGCCCCAACCCCCCCGGCTCGCCTCAGCTGTCTGCGGGACGTGGAGCCAGGCAGAGGGTGCCCTGCAAGAAGCAGAGCTGTTGGTTTGAGGTGCGGAAAGCCGGCCAGTCTGGATGCGACTGCTGCTGCGTGGCGGACAGGAACTGACATACAGCTTCAGTGCTTCCCACCGCAAGGGCACTCCAGGATCCAGACTCTGGAGGAGAAGCTGTGGCTGTAGGATTGCTAATTGCAGCCGGTGCCAACGCTGCTGCCCGTTTTCAGGTGAGTGTGGTGGAGGGCACTGTAGAGACGCACGGCTATTCACAGAGCGTGCACTTCCAGCACCTGAACTGCTGGATCCGCTCTGACCGATGTACGGCAATTACATTTGGTGCTGCACTGCTATAATTTCACTGCACGTTAATAGCCACCTAGTGCAGAGGTAAAGGCCCTTCCCTCGCCCGGTGCAGAAGGAATGCCTGGATTTATTCAGCTGAGTAAAACGAGCTGTGATTTTCGGAGCAGATGGCAGAGGTTTTGTGTGTTGGAAAAGCGTTTGCCGGTGCAGTGCTGTTTCCCTGCACCCTGACGGGTGTGCGGGAGGCTCCTGGAAAAGTCCCATCCTCGGGTCCTGGCAGGGGGAGGGGAAGAGATGGGGATCATGTGCCCCATTTTGAGTGGCTCATCTGCTACCACCCAAACTCTGCTGCAGTCCCCCCCCCTCCCTTCAGCAGCTCGGCTGAGCACTGCAGGCGCTGTCAGATTTCTCTGGCAAAATTAGTGATCAAAACACCCCCCCCCCCCCACACACACACGCACACCTTCACTAAGGCTGGTGTTTTTAAGGTTGGGGGGGTGATGGGGCGCGGGTGGGAGCGCACGGCGAGGGTACGAGGAG
>URS0000B155C2 tRNA from 1 species 
GGCTTCGTAGTTCAACTGGATAGAATGACGGATTTCGGCTCCGTTGGTTGCAGGTTCGAACCCTGCCGAGGTCACGA
>URS00025AB7F7 tRNA from 1 species 
GCTGGTGTAGCTCAGTTGGTAGAGCAGCTGATTTGTAATCAGCAGGTCGCGGGTTCGACTCCTGTCACCAGCTCCA
>URS0000328ABF rRNA from 1 species 
ACGCTGGCGGCAGGCTTAACACATGCAAGTCGAACGGTAACATAAAGAAGCTTGCTTCTTTGATGACGAGTGGCGGACGGGTGAGTAATGCTTGGGAATCTAGCTTATGGAGGGGGATAACTATGGGAAACTGTAGCTAATACCGCGTAGAATCGGGAGATGAAAGTGTGGGACCTTCGGGCCACATGCCATAGGATGAGCCCAAGTGGGATTAGGTAGTTGGTGAGGTAAAGGCTCACCAAGCCGACGATCTCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGGGCAACCCTGACGCAGCCATGCCGCGTGAATGATGAAGGCCTTCGGGTTGTAAAGTTCTTTCGGTAGCGAGGAAGGCATTTAGTTTAATAGACTAGGTGATTGACGTTAACTACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATAACTGGGCGTAAAGGGCACGCAGGCGGTGACTTAAGTGAGGTGTGAAAGCCCCGGGCTTAACCTGGGAATTGCATTTCATACTGGGTCGCTAGAGTACTTTAGGGAGGGGTAGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAATACCGAAGGCGAAGGCAGCCCCTTGGGAATGTACTGACGCTCATGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGTCGATTTGGGGGGTTGAGCTTTGAGCTTGGCCGCCCGTAGCTAACGTGATAAATCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAA
>URS00021F8B86 rRNA from 1 species 
AGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCCTAATACATGCAAGTTGAGCGCTGAAGGTTGGTACTTGTACCAACTGGATGAGCAGCGAACGGGTGAGTAACGCGTGGGGAATCTGCCTTTGAGCGGGGGACAACATTTGGAAACGAATGCTAATACCGCATAAAAACTTTAAACACAAGTTTTAAGTTTGAAAGATGCAATTGCATCACTCAAAGATGATCCCGCGTTGTATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGATGATACATAGCCGACCTGAGAGGGTGATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGAGAAGAACGTTGGTGAGAGTGGAAAGCTCATCAAGTGACGGTAACTACCCAGAAAGGGACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTCCCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGTGGTTTATTAAGTCTGGTGTAAAAGGCAGTGGCTCAACCATTGTATGCATTGGAAACTGGTAGACTTGGGTGCAGGAGAGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCCTGTAACTGACACTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGATGTAGGGAGCTATAAGTTCTCTGTATCGCAGCTAACGCAATAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATACTCGTGCTATTCCTAGAGATAGGAAGTTCCTTCGGGACACGGGATACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATTGTTAGTTGCCATCATTAAGTTGGGCACTCTAACGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGATGGTACAACGAGTCGCGAGACAGTGATGTTTAGCTAATCTCTTAAAACCATTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGGGAGTTGGGAGTACCCGAAGTAGGTTGCCTAACCGCAAGGAGGGCGCTTCCTAAGGTAAGACCGATGACTGGGGTGAAGTCGTAACAAGGTAACC
>URS0002423514 lncRNA from 1 species 
AGTGCTTAGGTCCTTTGACACCGTTGGCGGGAGACTTTTCGTCGTTTGGGGTGGGGATGAAAAACATCAGCGTGTTTATTCCTCAGGCAGCCCAGAAACCTTAGGTTTGCACCACCAGTAGCTTGGCAACGCGGTCACGGGTACACAGCACTGGCACAACATGACTGTGTGTGTGTGTGTGTGTGTGTGTGTGCTATGCTGTCCTATGCTCATGATGCTCTCATGGCCTTTCGCTACAACAGGTCCAAGGCCTTATCATTGCCGTCATGTACGAGAAATCCCGGGGAAGGCAGTCACGATGGGCGCCGTACTTGAACCTGATCCCGGACGACATGACCCACATGCCGCTGTACTGGAAGGTACGGTAATGTACGGGAAAGGTGGATCGTACCGTGGACACCGTGCCACTCGCCTCCCAAACTCTATGCGCCGTGGCGAGAGCTCATCTTCACGCACTCAGCGAGTTCTGGTCCCCCGCCCTTAAACCCCGTCTACGGACAGCATAGGGAGTTCAAGGAGCTGCGTGGTACGGCAGCGTACGACAAGATGATGGGCAAGGTGCAGTGTCCCGCCGACGCACCCACGCAGGTCGGTTAACACTTTGTATTGTATGGGGTTGTCATGTGCGTCGCATCACTGCTCTTTTGCGGATCGTGGTACGACACATCACTGCTTTCCCCCCTCCCCGTTGACCGGGCGATCTGCAATCCTCCGCTGTACTGTGCAGGTCCCCGTTCTGTGGAGTGAGGTGGTGGAGCCCTTCATCCAGGAGCACCCGGAATTAGAGCTGCCGGAGGGGAAGGCGGGGTATGACTTATACCGCTGGGCCACGTGCGCTGTGGCGTCGTACAGCTTTATCTTGGGTGATGACAAGTACCAGGTGGGCATTCCAGTCCTGTACGGCCGGGGGCTCGTGACTGCGGCTGCTGCAAATGATGTCGTACCATGAGCACCTTATCCAATCTAACTACGAAAGCCCCCTTCATTCTCTCCCCCCTCTTTTCCTCCCCCTCTCCCCCTCTCCCCCTCTCCCCATCTCTCTCCTTTCCTCCTCTCATTTCTTTCCCACATGCGTATGAAGCCCACCTCTAGGCGCCCTCCTGCTCACCCAGCACCCTCCTCCCCCTCCCCCTCCGTCCCCGCGCTGGCGGCCGCCCCAGGCGATGGTCCCCGTCTGGGACCTGCTCAACCACATCACAGGTCGGGTGAACGTCCGACTGCACCACTGCGCCAAGAGGTAAAGAAGAAGGGAGGAAAGGCGATATTCGGGGTGGCTGCACCCCGTAGGGCCCTCCTGGAGTGGGTGGACGGGTGGCGTCGCGGGCCCCAGGGGAGTGAGTACGACCGCTCGCTGCACGGGGCGAGGCCATGCAAGCCAATCGCCAAGCGTCCTTGCTAGGTTGGGGATAACCCAACCAACCAACCAACTCCGGGCCCTATATCAGTTGGCAACTTGCTCATTGGGTAACCGGTATATATGTATGTATATATATTATATAACCCCCGGACGACTGCTGAAGCCGGAAGGGCGGACATGGTGATCTCGTCGCATGGCAGCTGTCCCGTGAGCCCACGGAGTTGTGTGGGATGTGCCGATGAGGCGGCGGCATTTGGGGCGTGGCGTGAAGCGTGTATGAGGTTGGCTGATGTCGGCGCCTCACGCACCAAGAGCGCCGCCAGGAACGTACCCGCACCGCACGGGAGAGCGGGCGGGGAGCCGTGTCCGCGTTCTTATCCGGCGGGTCTGTCCTAACCCGCCTAACCTTACCCGTCCTAACGGGGCACCGTGCGCCACCCTGCTGGGGATGGAAGCACCCCCCAGGTCTCAGCAGCCACTGGATTGCGCTTCCCGCTTGCGGCGTTGTTTGTTGCGCCGGTACTGCAGGCACGTGCTTCACATGATTGCCACTCGGGACATCCTTCGCGGTGAGGAGCTGGTCAACAACTACGGTGAGCTTTCCAACGCGGAACTTCTGCGGGGGTACGGCTTCGTGGAGGCACGCAACCGGAACAATCACGTACAGGTCGGTTGGGGATTGAAGGAGGCTGCTGGTTTGGGAGGAGAGTTAATATGGCTGTGGAGCGGGTGCTGGAGCAAAGCGCGCTTCGCACATGACGAGGAGGTAGCGGGTGACAAGAAAATGAGGCGGGTCGGGGGCGGGTAAGGGGTGGGCCTCCCTCCCCCCAGCGTGCTGAGCCCGGGTAAACGCTAAGCCGCCAACCCCGTCACCAATGCCTACCACTATAGTTACCCAGTTACCGCCAGGCAAGGCTTGTCCGTTGAAGAGGGGCGGCTGCGGGGCCGACGGGGTGAGGGTGGGGATGCTGGCACCTGCGTTTTGGTTTTGGGAGGGGAGCCATACCCAGCCGCTGCCATTGGACTCCGGCTCGCCCACGTGGCCCTCCGCGCAACCTGCCTAGGTTCCACTGGGCTTTGTGGTCCGTGCGGCGACGGAGCTTCTCCGAGAGGACATCACGGCAGCGGCGGGTGCCGGCCCTGGACCCGGTCCTGGTAGTCAGTCCGACCAGGGGGAGATACGAGCCCGCGCATCTGCGCGGTTGCGCCTGGCTCGCCGGTGCGACCTGTTGCCACAGCACCATGTGTTCAAAATTTTCGAGGGGCGGCCACCTCCGCCCCCCATGACTGCGCTCATCCATCTGCTGCTGGCGTCGGATGCCGACATTCCGGCTGTGCGGGGTGCTGTCCGCCGTGCAGCCGCGGCCGTAGTGGAAGGTGAGGATGGCGCGGATTGCGGCAAGGATAAGGGCAAGGCCCGGCGGCGTAATGTCGCGGCAGCTGGGGCGGTTCTACAAGCACGCACAGCGGCTGCGGTGGCGGCAGCCTTGGCTGGGAACGAGACGGCGCTGGCGCGGGTCGCGAGGGTGTACGACATGATTGTGCAGCGCATGCTCGGCCGGTACAGCTGTGACCTCGCAGAGGACGACAGGTTGCTGGCGGAGGCGGAGGCAGGACGCCGAGTACTTCCGCCACGCTTACATGCGGCGGTGTTGGCTCGGAAGCCGGAGAAGGACGCGTTGCTGAGTTTGCGGAAATTCATCGGTCAGGAAGGAGCTTTGCGTCAATCCTTGGCTGTCAATTCCGGCAAGAGCTTGTCGAAGACAGTCTTCGGAATAGCAGGAGCAAAGGGGTCAGAGGAACAGCTCTCTGAACCGCTAAAATACAGTCGTGCCATGGCTAAGAGCTGTAGCGCTGCTCCTGTCAATAAGTTTGCCCCTGCTTCGTTTTCGTTCGGTTTCTCTCTGTAAGTTTTGAGTTCGACTTGCTTCAGTTCGCTTTAATATGTGAGGATTCAGCAAAACTGGGAGGATCTAGTAAAACCATTGCATCTCAGGGATAGCCGCTTCTGTTCAGTGCGTGCCATTACAGATTTTCGTATCCCCGTCGGCAAGCGCATGTTCCCATCTGCAATGGTACCCAACGCCCTCTTAGTGCTTAGCTGAGGATGACGGTCACAATCCATGGATCGCAGGTTACAGTGGCCAACGTGCCCGCAGGTATAAAGGTGTCACTCTTCTCCTTCAAACGGCCTACCGAACCGCCACGGCTCCAAAAAATGCTGGCTGTCCGAACCCGCAAAAAGACAACGAGGGCATAGCACCCGGCAACCTTAACCAGGACATAGCAGTCGGTCACAAACGCCAGAGCGACAGGCGCACATTCACGTATGACCGTGAAGACGTGCCGATATTGAACCGTCAGGTCGGGAACAGCCTCCCCATACCGCCTCAAATTGCTATTTGTACAGAGACTCAGGCCCAGACATCATCGCTAAGCACTTCCCTCGATGAAGCAGCAAAACGAGAGCCACAGGCGTGAGCGTCACGTGCAAGCACACGCTTCGGCGCATTTACGAGGAGGGAGCCTCCTTCTCAATGTACCTGAGCACGCAGAGATGGGGGCAATGAGGGGGGAAAAGAGATTACGGGGAAAGGAAATAGTTTTGTACACAGTAATAGTCGCATACATACAACTTCAAAAATCAAAATGTGTGGCGTCCCGACACCATGCTCCCAGCTACACCAGCACTCACACGAACAGCGTAGCCATTCCGATGGCTGGCAGAACCAGGCCAGTCAGGGGCACGAACAGCGAGGGAGCCCAGGCCGGGGGCACGAAGGGGTAGCCCTCAGCAGCGCTAGCAACGGTGGCGATGACCTGCGAGGCCTCAGCCTGCAAGCATACAAGTGGACGACGAAAGATCGGTAGCCTGGGAGAGCCTCCGCTGCACTTCAGCATATTCCCAGACAAAGATGCAAAATCTGATTGTGCAAACAGTACGCAGCCATATCTCTGAAGCTTGTAAACAGGACTGGACGGAAGCGCCTTCCCCATCAAACATAAACACATAAACCAAAATTAAGCGCTGAGTAGGAAATGTCAGTTGCCCTC
>URS0000054DFE rRNA from 1 species 
GTAGTCCTGGCTGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCGGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGCTGGATCACCTCC
>URS000187D73E rRNA from 1 species 
TACAGAGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCGCGTAGGCGGCCTGCTAAGTCGAACGTGAAATCCCCGGGCTCAACCCGGGAACTGCGTCCGATACTGTCGGGCTAGAGTGTGGAAGGGGCTACCGGAATTCCGTGTGTAGCGGTGAAATGCGTAGATATACGGAGGAACACCAGCGGCGAAGGCGGGTAGCTGGGCCAACACTGACGCTGAGGCGCGAAAGCTAGGGTAGCAAACGGG
>URS0002587220 misc_RNA from 1 species 
TCCGGTTTACCACCGGCAGTCTCCCTAGAGTGCTCGGCTTTACCCGTTAGCAACTAAGGACAAGGGTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACACGAGCTGACGACAGCCATGCAGCACCTTGCACTCTGCCTAGGTTTCCCTAAGAGGCTCCATCTCTGGAGTTGTCAGAGGCATTCTAGCCCTGGTAAGGTTCTTCGCGTTGCGTCGAATTGAACCACGTGCTCCACCGCTTGTGCGGACCCCCGCCAACTCCTTTGAGTTTCAATCTTGCGATCGTACTTCCCAGGTGGGATACTTAATGCTTTCGCTCAGACACACACTGTGTATCGCGTATGTCGAGTATCCATAGTTTAGGGCGTGGACTAC
>URS0000A3D8A0 misc_RNA from 1 species 
AATGTGATTGGAAAAGAAAATGAAGGAGAACTAATTAGTGGAGGGTTGAGGGTAAAGTGCTACAATTAGAGACTACAAAGTTAAATGTACAATGAACTAATGTTAAGATTAATGGGTCAAAGTTGTATGTAATGTAGATCCGGTAAACTATAATTCTTCTTTCAGATGCTCAACAGTATCATGTCTTGTCGTTACATTGAAGCTTCTCAATAACTTCCTCCAAGGGAGGATCTCCAGGTCTACGGAAGACTTGATCCCC
>URS000015B95D rRNA from 1 species 
ATGGAAAGTCCGGCCTGCCCGGTGAGAGATTCTCTTAAACGGCAGTAGTAAAGTTCTTTAATCGTAGCTCAATTTTCTTGCCCTTTAATTGTGGAGCGATGTGAATGGTAAGACGAGGGTTCAACTGTCTCGCTGTTACGAAGTGAAAACGGAGTGTAGGTGAAAATACCTACATGGATTATAGGGACGACAAGACCCCGTGGAGCTTTAGTGTGCTATTTTCTAGCTGAATTTAGGTTACTTAGGCTGGGGCAGCCAGATGGGAAGCAAATACCATTTGAGAGACGCTTGAGGCGTGCGGGCTTTTAACGATCCACCTCCCTTGAAATAATGGGGAAAATTGTGTGTATGTATGCAGAAAGAGGTGAAAGACGGAACAACGTTACCCCGGGGGTAACAGGCTAATTTCGCTCTGAGAGATCCTGTCGATGAGCGGGTTTGGCACCTCGATGTTGGCTTAGGGTATCCCGAAGATGCAGGGGTCTTCAAAGGTTGGTCTGTTCGCCCATTAAAACCCT
>URS0000B01B68 rRNA from 1 species 
TGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCCACGCCGCGTGGGTGATGAAGGCCTTCGGGTTGTAAAGCCCTGTCGGGAGGGACGAATACTGACGGTACCTCCAAAGAAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTGCTCGGAATTATTGGGCGTAAAGCGTACGCAGGCGGCCGTACAAGTCGGGTGTGAAAGCCCGGGGCTCAACCCCGGAATTGCGCCCGAGACTGTACAGCTTGAGTGCGGGAGAGGGAAGCGGAATCCGTGGTGTAGAGGTGAAATTCGTAGATATCACGGGGAACACCAGTGGCGAAAGCGGCTTCCTGGCCCGACACTGACGCTCATGTACGAAAGCGTGGGGAGCAA
>URS000211E027 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGATCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGGAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATCCCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS00004A1422 rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGACCTTCGGGTCTAGTGGCGCACGGGTGCGTAACGCGTGGGAATCTGCCCTTGGGTTCGGAATAACTCAGAGAAATTTGAGCTAATACCGGATGATGACGAAAGTCCAAAGATTTATCGCCCAGGGATGAGCCCGCGTAAGATTAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGACGATCTTTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCCTTAGGGTTGTAAAGCCTTCTTACGA
>URS0000110120 piRNA from 1 species 
TGAGAAAACAGATTTTGAAACTGTCAGTCTT
>URS0000B33149 rRNA from 1 species 
GTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTATCCGGATTTACTGGGTTTAAAGGGTGCGTAGGTGGGCAGTTAAGTCAGTGGTGAAATCTCCGAGCTTAACTCGGAAACTGCCATTGATACTATCTGTCTTGAATATCCTGGAGGTGAGCGGAATATGTCATGTAGCGGTGAAATGCTTAGATATGACATAGAACACCAATTGCGAAGGCAGCTCACTACGGGGTTATTGACACTGAGGCACGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCC
>URS00002664CE rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGTGACCCAGGGCTTGCCCTGGTGATCAGTGGCGAACGGGTGAGTAACACGTGGGGCAACCTGCCCCTGACTTCGGGATAACTCCTCGAAAGAGGAGCTAATACCGGATACGACCACTTCGGACATCCGATGGTGGTGGAAAGTTTTTCGGTCAGGGATGGGGCCCGCGGCCTATCAGCTAGTTGGTGGGGTAATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCGACGCCGCGTGAGGGATGAAGGCCTTCGGGTTGTAACCTCTTTCAGCAGGGACGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCA
>URS0000049829 rRNA from 1 species 
GCCAGACTGGAACCGGGAGAGGTAAGAGGTACTACAGGGGTAGGAGTGAAATCTTGTAATCCCTGTGGGACCACCGTGTGGCGAAGGCGTCTTACCAGAACGGGTTCGACGGTGAGGGACGAAAGCTGGGGCACGAACCGGATTAGATACCCGGGTAGTCCCAGCCGTAAACGATGCTCGCTAGGTGTCAGGCATGGCGCGACCGTGTCTGGTGCCGCAGGGAAGCCGTGAAGCGAGCCACCTGGGAAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACAACAACGGGTGGAGCCTGCGGTTTAATTGGACTCAACGCCGGACAACTCACCGGGGGCGACAAGCAATATGTAGGCCAAGCTGAAGACTTTGCCTGAATCCGCTGAGGGGTGGTGCATGG
>URS00022BB341 rRNA from 1 species 
CCCAAAGGTGGGTGGTAAACTCCATCTAAGGCTAAATACGTGCACGAGTCCGATAGCGGACAAGTACCGTGAGGGAAAGTTGAAAAGAACTTTGAAGGGAGAGTTCAAGAGTACGTGAAACCGCATAGAGGTAAACGGGTGGACCCGCAGCAGTTCGACCCGGGGAATTCAGCTCGGCGGCTAGCGGCGCCGCGGCCGGTACTCAAGGGGATACTCCCGTACCCCGCCGGTCGTCGACCGCGCCTGCCGCCGGGTGCACTTTCTCCGGGCCGAGAGCCACGACCGGCTCCGTCGGCGGTCAGAAGCCCGGCTGGGAAGGTGCCCCGAGCCCGGACGCTTGCGTCCGGCGCGCCGGGAGTTACAGCCCGCCGATGGTGGACACGTCGCGGGGCCGAGGAAGCCTTGCGCCGCCGGTCTCGGTCCTCCGGTGCCCCTCGCCCGTCCCGACCTCCGCGTCACTGCCTCGTCAGTGCGCGGAAACCGCGGAGCGGGGGCCACGCCGGGGTGTGCCAGGCCTGTGCGAAGGGTCGGTGGCGAATCGGTCGGTGCTCCACCCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACGTGTGCGCGAGTCACGGGGACTCGACAAACG
>URS0002354398 lncRNA from 1 species 
CCAAGTTCAAGCCTTTGCTTGGGTATATTTTTGTTTTTAATTGAATAAACCCCTATCTCTAGTCAGTAGGCTTAAAATAAATATTGGAAAAATATGTCAGAATGGTCCTACTGGTCTGGTGGTTAAGTGGTGTGTTGGGGTCTTGAGTTTGAATCTCTATACGTGTTAGGGGGTTTTTTTGTACATGTGTCGTGAAGGAGTTTGAAATGTGGTAAAATTCTGAGTATTTGAGGAGTGTGAGGATGTTGTGGCCGAT
>URS00025EA52A lncRNA from 1 species 
GTCTAGCATTGTCTTGCATTAGGAGGAACCCAGGGCCAACCGCACCAGCATATGGTCTCACAAGGGGTCTGAGGATCTCATCTCGGTACCTAATGGCAGTCAGGCTACCTCTGGCGAGCACATGGAGGGCTGTGCGGCCCCCCCAAAGAAATGCCACCCCACACCATGACTGACCCACCGCCAAACCGGTCATGCTGGAGGATGTTGCAGGCAGCAGAACGTTCTCCACGGCGTCTCCAGACTCTGTCACGTCTGTCACAGCGTCGTGTAG
>URS000112801C rRNA from 1 species 
TACAGAGGGTGCTAGCGTTGTTCGGAATTATTGGGCGTAAAGGGCGCGTAGGCGGCGCCACAAGTCACCTGTGAAAACTCTGGGCTCAACCCAGAGCCTGCAGGCGAAACTGTGGTGCTGGAGTATGGGAGAGGTGCGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGGGAGGAACACCTGTGGCGAAAGCGGCGCACTGGACCATAACTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACAGG
>URS0000474C22 rRNA from 1 species 
GAGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAGCGGGGTTGAAGCGAGGGGTAACTCGAGTTTCTACCTAGCGGCGGACGGGTGAGTAACGCGTGGGCAACCTGCCTCAAGGACTGGGATAACAGCTCGAAAGGGCTGCTAATACCGGATAAGCCTATGGCCTCGCATGGGGCCATGAGCAAAGGGGAAACCCGCCTTGAGATGGGCCCGCGTCCCATCAGCTAGTTGGTGAGGTGAAGGCTCACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGGGGCAGCAGTGGGGAATCTTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGCGAAGAAGGCCTTCGGGTTGTAAAGCTCTGTCTGGAGGGACGAAGGAAGTGACGGTACCTCCGGAGGAAGCCACGGCTAACTACGTG
>URS00019BDD9E misc_RNA from 3 species 
TAACCCTCAAGCCTAGCTTGGTATTGGAGTCGCTATACAGCGGCCCCTAAAATCAGTGGCGGTGCCTATAGGTTCTACGCGTAGTAATTTTTCTCGCTATAGATCCCTATAAGTGCTTGCCAACAACCCCAATTTTTTCA
>URS0002519978 rRNA from 1 species 
ATGTCTGGAAGCACGGGAGAACGTTCTTTTGCTGATATTATTACCAGTATTCGATACTGGGTTATTCATAGCATTACTATACCTTCCCTATTCATTGGTTTGTTATTTTTCAGTACATGTTTAGCTTATGACGTGTTTGGAAGTCCTAGGCCAAACGAGTATTTCACGGAAAGCCGACAAGGAATTCCATTAATAACCGACCGTTTTGATTCTTTAGAACAACTCGATGAATTTAGTAGATCCTTTTAG
>URS000071DEB1 tRNA from 1 species 
GGGGGTGTAGCTCAGTGGTAGAGTGCTTGCCTGGTATGCATGAGGCCCCGGGTTCCAGCCCCT
>URS0001088F60 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGCGCACGTAGGCGGATCGTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGGCGACCTTGAGTTCGGGGGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGATACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGG
>URS00008DF95F rRNA from 1 species 
CGCAGGGCCTTGCGCTGGSGATGTTTCATTCAAATTTCTTGCCCTATCAACTGTCGATGGTAAGGTATTGGCTTACCATGGTTACAACGGGTGACGGAGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCTGACTCAGGGAGGTAGTGACAAGAAATAACAATACAGGGCTTTTCTAAGTCTTGTAATTGGAATGAGTACAACTTAAATCCTTTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTCGGGACGGGCCGGCCGGTCCGCCGCAAGGCGTGTTACTGACCGGGCTGTTCTTCTTCGCAAAGACTGCATGTGCTCTTAGCTGAGTGTGTGTAGGACTTGTGACGTTTACTTTGAAAAAATTAGAGTGTTCAAAGCAGGCCAGCGCTTGAATACATAAGCATGGAATAATGGAATAGGACTTTGGTTCTATTTTGTTGGTTTCTGGAACCGAAGTAATGATTAAAAGGGACAGTTGGGGGCATTCGTATTTCGTTGTCAGAGGTGAAATTCTTGGATTTACGAAAGACGAACTACTGCGAAAGCATTTGCCAAGAATGTTTTCATTAATCAAGAACGAAAGTTAGAGGATCGAAGACGATCAGATACCGTCCTAGTTCTAACCATAAACGATGCCGACTAGGGATCAGAGAGTGTTATTGGATGACCTCTTTGGCACCTTATGGGAAACCAAAGTTTTTGGGTTCCGGGGGAAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTCCAGACATAGGAAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCTTAACCTGCTAAATAGTTACGCGAATCCCGATTCGCGGCTAACTTCTTAGAGGGACTGTTGGTGTTCAACCAAAGTCAGGAAGGCAATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGACGATGTCAACGAGTCTCTCCTTCGCCGAAAGGCGTGGGTAATCTTCTGAAACATCGTCGTGCTGGGGATAGATCATTGCAATTCTTGATCTTGAACGAGGAATTCCTAGTAAGCGCGAGTCATCAGCTCGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCG
>URS00023E717A lncRNA from 1 species 
AGTCCAAGCTACATTATTGGCGCTGGCAGGGCTAAAACGCCTAGATATGACAGAAAATGTCACTTCCATTCTTCCTATAGAGGATATGCTACCGGCAGTTGCTCAGGGAGCCATTGGTATTGCATGCAGAAGTGATGATGAGACAATGGTATTCACATCGTTTCTTCCATAAATATAGTTGCTTCTATTGCAGTTCTCTATTCGATGACGAGACAATGGTATTCACATCGTTTCTTCCATAAATATAGTTGCTTCTATTGCAGTTCTCTATTATTCTTTAATGAAAAACTTCAATCACAGGCCAATTACATTGCCTT
>URS00007532CF rRNA from 1 species 
TGCTCAGGATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAATGGATTAAGAGCTTGCTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACCGCATGGTTCGAAATTGAAAGGCGGCTTCGGCTGTCACTTATGGATGGACCCGCGTCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGCTTTCGGGTCGTAAAACTCTGTTGTTAGGGAAGAACAAGTGCTAGTTGAATAAGCTGGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGCAGGTGGTTTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGAGACTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACACTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGAGGGTTTCCGCCCTTTAGTGCTGAAGTTAACGCATTAAGCACTCCGCCTGGGGAGTACGGCCGCAAGGCTGAATCAG
>URS000255B89B rRNA from 1 species 
ATGGCGCCATCGACCAAGCTCTTCCTCCTGCTCCTCGGCTTGAACCTGATGGTCGCCGATGTGCACGGTGGCTGCGGAGCCCACTGCCCGACTCCGCCGCCACCGTCGACGACCAACGGCTCGTGTCCGATCGACACGCTGAAGCTGGGCGTGTGCGCCAAGGTGCTGAACCTGCTAAAGCTTGGGCTCGGTGTGCCGCACAGCGAGACGTGCTGCCCGCTGCTGGCCGGTCTGGCCGACCTGGACGCCGCGGTGTGCCTCTGCACCGCCACCAGGGCCAAGGTCCACGGCGTCATCAACCTCAACGTCCCCATCGACATAGTGCTCCTGCTCAACCAGTGCCACAAGACCTGCCCGCCCGGCTTCACCTGCCCGCTCTGA
>URS00017EA271 rRNA from 1 species 
TACAGAGGTCTCAAGCGTTGTTCGGATTCATTGGGCGTAAAGGGTGCGTAGGTGGCGTGGTAAGTCGGATGTGAAAGCCCCCGGCTCAACTGGGGAGGGTCATTCGATACTGTTCGACTCGAAGGCAGGAGAGGGAAGTGGAATTCCCGGTGTAGTGGTGAAATGCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGACTTCCTGGCCTGTTCTTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACGGG
>URS0001FED583 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACATCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGCTCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAAACAGAAAGCCACGGCTAACTACGTG
>URS0002417CDE lncRNA from 1 species 
AGAGACAAAATCATTGGGACACCAAATCTGTTAAAGCAGGCATCACTCTTGTTTCAATGTGGTTTTCACAGCATCTCAATGCCGTTTCATGCTGTTTAGAAATCATAAACAGCTCTGGAGACGTGCCTCACTCAGTCGTGGGAATCTCCAGTCATCAATTCAGGAGACAATAACACCAAATTTGTTCAATGTGCGTTTAACAACATTCTGAAACGTCATAAGTAATGCAGGCTGTCTCGCATGCAGTCTTTCAGCACTGAAACGTTGTAGAGTCGAAGTGTATAGCGCTGCCTTAGTCCAGACAGCATGCTATTGTGAACTTGTCTCCAGTCAATTGGCTCGATAATTTTGAGCTCTCGTGCATGCAGCGGCATACATCTGAGGGACATGGACTTCCATGGGCCAACGATGAATATTACTCTATTTTCTCATAGGTCACAGCCACGGAAGAATGCGATGCCGCTCAATACGACCTTGGCCAACGATGAATATCACTCTATTTTTTCATAGGTCACAGCCTAGGAAGAACGCGATGCCGCTCAATACGACCTCTATGAGTGGTATTAGCACTTGGTGCTCATTCCCTTGAGGAAGGAAAGGTGACATTGCAAGGGCATATTGGCAAGCATATCGATGGCCATCAAATTTTCATTTTAAGGTTGCATTGCATTATATGATTTCAAGA
>URS0002158408 rRNA from 1 species 
GGTTTCCTGGGCAAGGCTAATCCTCCCAGGGTCAGTCGGGGGCTAAGGCGAGGCCGGGAGGCGTAGCCGACGCGCAGCAGGCAGACATTCCTGCACCGCGCACGCGGCGCTACGACCGACGGGGCGACGGATGGGGGTGGCTCGGCGGGGTTCTGGACGTCCCCGTGATGGAGCGCGGCCCGCGGACCAGGGAAATCCGGTCCGCACGAGGGCGAGGCTCCGGACGAAGCGATTGAGCGAAGCGAGTGAGCCCGAGGTCCCTAGAAAAACCCCTAGGCAGGCGCGTGCGCGCCCGTACCGCAAACCGACACAGGTGGGTGGGTAGAACATACCGAGGCGATCGGGTCAACCATGGTCAAGGAACTCGGCACAATGGCCCCGTAACTTCGGGAGAAGGGGTGCCCGCGCGTACGTGAACCGGCTTGCCCGGGGAGCGGAGGCGGGCCGCAGTGGAGAGGCCCAAGCGACTGTTTACCAAAAACACAGGACTCTGCAGAAGCCGCAAGGCGACGTATAGGGTCTGACGCCTGCCCGGTGCCGGAAGGTCACGCGGAGGAGTTAGCCGTCAAGGCGAAGCCCCGAAGCCAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAAAGGCGCAACGACTTGGGCGCTGTCTCGACCATGGACCCGGTGAAATTGCACTGGTCGTGAAGATGCGACTTACCCGCGGAAGGACGGAAAGACCCCGTGAACCTTCACTGCAGCTTGGCATTGGCCGCTGGTCCCGCGTGTAGAGGATAGGCAGGAGGCACAGATCCGGAGGCGCCAGCCCCCGGGGAGCCGCCCTTGGAATACTGCCCTCGCGCGACCGGCGTCCTAACCCGAGGCCGTCAACCGGCTCGGGGACCGTGCCAGGCGGGCAGTTTGACTGGGGCGGTCGCCTCCTAAAGGGTAACGGAGGCGCGCGAAGGTCCGCTCGGGACGGTCGGCAACCGTCCTTTTGAATGCAAGAGTACAAGCGGGCTTGACTGCGAGGCCCACAAGCCGAGCAGGTGCGAAAGCAGGCTCTAGTGATCCGGCGGCCCCGAGTGGGTGGGCCGTCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATCTTGCCC
>URS0000E09CF4 tRNA from 1 species 
GCCGGTGTAGCTCAATGGCTAGAGCACTTGACTGTGGATCAAGGGGTTATGGGTTCAAGTCCCGTCGCCGGTA
>URS0000BDAE45 snRNA from 1 species 
GAATGTTGGGCTAATTTGGCTGAAGCACCTGTCAGCCTACTGATTGCCAGCATGGATTCAGCTGATCTAGCTGGCTAGGTGGGCGTCTCCTTCCTCCCTCACTGCTCTATGTGTAACCCTCCTGAAAGTGGTCAGAGGACACCTTTGTGGAATTGGTTCTTTCCTCTTTCCTTGGGTTCCAGGGGTCAAACTCAGGTCAGTAGGCTTACACAGAAAGCTCACCATCTCT
>URS0000B28382 lncRNA from 8 species 
TGTAAACAAAACCAAAAAAAAAAAGGCATAAGATTAATAAAGATGTATTAAATACATAAGATTAACACATAAATTTCGTTATACAAAAGCATTTTGATAAACCGAACCAAATCATCTAGATAGGAAAATTGAAAACATGTGATTGAATATCTTGTTTTATACTTTATTTACATATAAAACTTTAAGAAACATGAAAGAGATATTTGGCAGATTTAATCATGCCAACAAAGATTGATTTATCTAATAAATATCTATTGTGTCCCTGGGTACTGGACATTGTTATTAGAGAAAAGAAATAATATGAAACCTCTACCGTAATATCATAGAGTCTAGGAAAGAAAATTCATCTATTCTTCTATCCAGATTAGACTAAGAG
>URS0002201BE9 tRNA from 1 species 
TCTCCTTTAGCTCAATAGTCAGAGCGTCCGGTTGTTAACCGGAGGGTTCTGGGTGCAAGTCCCAGGGGGAGAT
>URS00014BEA7C rRNA from 1 species 
TACGGGGGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCTCGTAGGTGGCCAACTAAGTCAGACGTGAAATCCCTCAGCTTAACTGGGGAACTGCGTCTGATACTGGATGGCTTGAGTTTGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAATACCGATGGCGAAGGCAGGTCTCTGGGCTGACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS00023B1992 lncRNA from 1 species 
GACTACGAATCGACATTGTAGCTTAGGAAAGTTTCATTTCATCCGTGGATCCTGAAGAGCAAGGTATCCTCTCTCCGTCGTACCTTTTTTCACATCGATTCGTTATATATTTCTTGCATTTTTGAACTTAGGGTTTTCATGCAAATGTAGGATGCCGAGGCGTGGAAAAGCTAAGAAACTAAGGTAATCTCAACGCCCGTAGTTATGTTATATACTCATTGTTGTGTATCAAATGAAAAAACCTTAAATGTAGGTTTATTCCTAAGTGCGTTTGATTCATAGAACCAAATAAACAAAATTGTAGTTATGGCGCTAAGAAGACCGGAAATGCGTTCGATCCATTGCCTCTGCCTAGTGGTGTTCCAGTGCCGATGTGCTTTTGCGGCGATCCTTGCAAGGTAGCCAAGTCCGAAGAACATGCC
>URS0001EBED66 rRNA from 1 species 
CCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTGGATCAC
>URS00006566BF snoRNA from 5 species 
CTGCATGATGAACTCTTAATTTCGCTGTGTTCTTACCGAGGCACACTTTGAAGAAACAAAATATCACCTTGGAGAACTGACAC
>URS00006E3F2F snoRNA from 1 species 
TATGCTGTGATGAGATTAAGCACCATAGGGTGTATTGGGCAGTGGAAGAAGGTTTAAAAGCCTTCTCCGTGAGCTTATTAATTAACGACTTCTCCTTCCACTGAGCATC
>URS00000BBF13 rRNA from 1 species 
AGAGTTTGATCCTGGCTCAGGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAGCGAGATTTTATAAAATTACTTTTCGAAGGAAGTTTTATAGATAAAGCGGCGGACGGGTGAGTAACGCGTAGGCAACCTACCTTATACAAAGGGATAGCCTCGGGAAACTGGGATTAATACCTTATAATACTTTGGGATCGCATGATCCTAAAGTCAAAGATTTATCGGTATAAGATGGGCCTGCGTCTGATTAGCTAGTTGGTGGGGTAACGGCCTACCAAGGCAACGATCAGTAGCCGACCTGAGAGGGTAATCGGCCACATTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGCGATGAAGGCCTTCGGGTCGTAAAGCTCTGTCGTGAGATGGGAAAGAATGACGGTACAATAAGAGGAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAACGTTGTCCGGAATTACTGGGCGTAAAGGGCGAGTAGGTGGTTTGCTAAGTCAAAAGTGAAAGGCTACGGCTTAACCGTAGTAAGCCTTAGGAACTGTAAGTCTTGAGTGCAGGAGAGGAAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGACTTCCTGGCTTGTAACTGACACTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGGTGTAGAGGGTATCGACCCCTTCTGTCGCAGCTAACGCAATAAGTATCCCACCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGACGCAACGCGAAGAACCTTACCAGGGCTTGACATCCTACGAATCCTTAGGAAACTAGGGAGTGCCCTTCGGGGGAACATCTAGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCATTAGTTGCTACGCAAGAGCACTCTAATGAAACTGCCGTTGACAAAACGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCAACACACGTACTACAATGGCCGATAACAACGGGAAGCAATACAGCGATGTGGAGCCAATCCCAAAAATCGGTCTCAGTTCGGATTGCAGGCTGCAACTCGCCTGCATGAAGCCGAAATCGCTAGTAATCGCAGGTCAGCATACTGCGGTGAATACGTTCCCGGGCCTTGTACACACC
>URS0001DD25E8 rRNA from 1 species 
ATTGAACGCTGGCGGCATGCTTTACACATGCAAGTCGAACGGCAGCACAGGGAGCTTGCTCCTGGGTGGCGAGTGGCGAACGGGTGAGTAATGTATCGGAACGTGCCTGGTAGTGGGGGATAACTACTCGAAAGAGTGGCTAATACCGCATGAGATCTTTGGATGAAAGCGGGGGACCTTCGGGCCTCGTGCTACTGGAGCGGCCGATATCAGATTAGGTTGTTGGTGGGGTAAAGGCCTACCAAGCCTGCGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATGTGGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGCAGGACGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACAGAACGAAAAGTCTCTGGCTAATATCTAGAGATCATGACGGTACTGTAAGAATAAGCACCGGCTAACTACGTG
>URS000170AD9B rRNA from 1 species 
TACGTAGGTGGCAAGCGTTTGTCCGGATTTACTGGGCGTAAAGAGCGCGCAGGCGGCTGGGCAAGTCCGATGTGAAAGCTTCCGGCTTAACTGGAAAATTGCATCGGAAACTGCTCGGCTTGAAGGTGGGAGAGGGTAGCGGAATTCCCGGTGTAGTGGTGAAATGCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGGCTACCTGGCCCACTCTTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACGGG
>URS000204CED6 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAAGGGAGCTTGCTCCTGGATTCAGCGGCGGACGGGTGAGTAATGCCTAGGAATCTGCCTGGTAGTGGGGGATAACGTCCGGAAACGGGCGCTAATACCGCATACGTCCTGAGGGAGAAAGTGGGGGATCTTCGGACCTCACGCTATCAGATGAGCCTAGGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCGTAACTGGTCTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGGTTGTAAGGCACTTTAAGTTGGGAGGAAGGGCAGTAAGTTAATACCTTGCTGTTTTGACGGTACCAACAGAATAAGCACCGGCTAACTTCGTG
>URS0000E460B3 rRNA from 1 species 
CGGCGAGTGAAGCGGCAACAGCTCAAATTTGAAATCTGGCCTCGGCCCGAGTTGTAATTTGCAGAGGATGCTTTTGGTGCGGTGCCTTCCGAGTTCCCTGGAACGGGACGCCACAGAGGGTGAGAGCCCCGTATGGTTGGACACCAATCCTGTGTAAAGCTCCTTCGACGAGTCGAGTAGTTTGGGAATGCTGCTCTAAATGGGAGGTAAATCTCTTCTAAAGCTAAATACCGGCCAGAGACCGATAGCGCACAAGTAGAGTGATCGAAAGATGAAAAGCACCTTGAAAAGGGGGTTAAACAGTACGTGAAATTGTTGAAAGGGAAGCACTTGTGACCAGACTTGGGCCGGGCGGCTCATCAGGGGTTCTCCCCTGTGCATTCCGCCCGGTACAGGCCAGCATCGGTTCTTACCGGGGGATAAGAACGGCAGGAACGTGGCTCCCCCTCGGGGGAGTGTTATAGCCTGCCGTACGATACCCTGGCGGGGACCGAGGTTCGCGCTTCCGCAAGGATGCTGGCGTAATGGTTACTAGTGACCCGTCTTGAAACACGGACCAAGGAGTCGTCCATTAGAGCGAGCGTTTGGGTGTCAAACCCCCACGCGTAATGAAAGTGAAATTAGGTGAGAGCTTCGGCGCATCATCGACCGATCCTGATGTTCTCGGATGGATTTGAGTAAGAGTTTTAACGGACGGACCCGAAAGACAGTGAACTATGCTTGTATAGGGTGAAGCCAGAGGAAACTCTGGTGGAGGCTCGCAGCGGTTCTGACGTGCAAATCGAT
>URS0000657173 tRNA from 1 species 
GGGGATATAGCTCAGCTGGTAAAGTGCTTGCCTTCCATGCATAAGACTCTGGATTCTATCCCCA
>URS0001FC8B0A rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTAGAACGCTGAAGGAGGAGCTTGCTCTTCTGGATGAGTTGCGAACGGGTGAGTAACGCGTAGGTAACCTGCCTGGTAGCGGGGGATAACTATTGGAAACGATAGCTAATACCGCATAAAATTGATTATTGCATGATAGTCAATTAAAAGGTGCAATTGCATCACTACCAGATGGACCTGCGTTGTATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATACATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGGAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGGTTTCGGATCGTGAAGCTCTGTTGTAAGAGAAGAACGAGTGTGAGAGTGGAAAGTTCACACTGTGACGGTATCTTACCAGAAAGGGACGGCTAACTACGTG
>URS00009B8067 lncRNA from 7 species 
TTTGTAGCGGTGCCAGTGAAGAAGAGGACACATGAAGACTTAGCATTCCCTGCAGAAAACGCCCCTTCCCCGTGTGTGTGTGACAGCGTGTATGTAATGGCTTCTGATATCTGTGAAAGCTGCCAGGCAACAAACTTCTTCTACTGGAAATGTCCCCAGATCCACAGCAGGCACACATGTTCCCAAGGGACCAGGGGTTGTATGCATTCTGACTGTGTGCTTCTTGTTCTCTGTGGTAGGTCATGGGAAGAGCCCTTTTGATCAACTTGGAGGGCTCTTCAGCTAACCCCCCAATGGCTGCTTTGAACTTACTCAGGAAAGCCAGCCCCTGGAATATTGTGCAAGTCAACACTATCACTTCCTTAGGAAGGTTCTAGAACATCTCGAAAGGATATCAGTTTTCCTTACCTGCAAACAGAAAACAAACCCACTTTGTTTGTACTGAAGCTTAAAGCAAATGTGGCCAAGTGGGGCCAAACTGACTCAATAGGCAGTCTGTCATAGTCCAGTTCTGCCTCTGTGAAAAGTGTTAGGGCAACTGGGTTAAAATAGGGTTGGAGAAAGAGTCCAGAGCTAGAAAGAAGATATTTTTAGTATGTGAGGTTATCTAGGACTTAAGTTTCATAATTCAGTGCTGTGGAAATGGGAAAATGATTGAAAAGGTAGAAAGGAAATGACCTTAAGGACTGGGGTGAGGCACAGAAATCTGATTAAAGGTTGAAATCAGTGTTTCAGAATTCAGATTGCCTCAATTTTCCAAAATGGTCACTAAAGCATCTGATAAAACCCAGAATTCTTCGGCCAGCTGTGTGGATTAACAGGCCTGTCACAACATAAAAGGCTGGCATGTATATTGGCAGGTGGAGATTGTCACTGTAAAACTTAGCAGTTTCACTCCGAGGTTAGTCTATGGTGGTCAGTGCACTGTGAGGGGAATCCTTGTCCCTCCCTGGCAGCTAGCAAACATTCCTCTATTTACTATAATTGGAATCCTCCCTTCCCCTGCAGCAGGCCGTCAGCTCACCTCACACAGCCCAGTTTTCTCTTCATGTAGCATGTCCAGGCATGCTCCAGAGCTGGGTTTCCTGGCCTTCCCACACTCCCAGATCACAGTCTCTTACAACCATGCTTTTCAGGATCCAGGAAGTAGTAAGTGTGCTGGGAGATACCCAACTAACTGCAAGCTCACAAGCACCACATCTTCTTGAGACATCAGTTTTTCTTTCCAAATGATTTGAAGTCAAGAGATGACCATATTTTTTAATGGAACAAATGCTTATGTTATACAAGAGAATGTTCATACACCTAAAGTGCTAAACTAAAATAGGAAACTTGGAAGGAAACTCATATTTGTAAGTGGACAGTGATTCTATCTCCTCTGCTTGTGTGGTATTTCCATGTTCACTTTGAGATTTTGTCTGAACTGGATTCAGGCAGCCTTGGGGTTGCTGTTGATCAAGGTCTAGACTTCCAGATCCAAGGAGTCCACCTTGGAGTAGTACATCTCCCTTTTCCTGTCAGCCAGCTTGCCTGTGTACTTATCACAAAGCTTTAGGGGCAGCTAACATGTGTATGTACAGGATAGTTCTGAGGCAGAAACAGCATAGACTTATTGTAGGAGTCCTATTTATGTCATTGTTCAGCCCTGTGCATGCTAGAAAATGATTTATCCCTTTGAGGCCAGGAAACTGCCAAGCCACTCTGCTGTAGGCTAGGATTACTGAAACTCACCACACATACAAGGATATTGGGGCAGAGCGGAGTGTGAGATCTAAAAATATGTATACTTTCCCCAGCTGGTGGCTAGTAGATGGCTTAGACAATTTTGGTGTCTTACCATCTGTCTGCAAAGACTGGAGAATTTAATACATCTTGAGTTGACAACCTCCAGTGATATCCTGTTCTGCCAAAATTTTAAAAGAAGGGCCACTGTAGAAAGAGTGTAAACTATCACAAGATTGAAAAGACTTGACAGTTTGGAAGCTTGTCTTGTCTTTCTCAGTAATCATTGATCTTTACATGTTGACCTTATATTAGCAATGAACAGATCATTGCCTCTCCACCCAATCATGCTATTTCTTTAAATCAGTATTTGGGGAATGCAAGCATTTATGCAGTGGTTATAAACAGAAATATAAGATTTGCCAACCTGTCTCTTTAAATTACCATCTCTCTGAAATCCTCAAGGAAAGCATTTTCCCTTTACTTAGTAAGGGTTTCAGATTCACTTTATGGGCTCCTGCTGTCTTCAACACTGATAAAACTTTAACCAGAAAAGCATTAAACACAGCACAGCAGCCCCTAGCCCAGATCCCTAAGTTCCTAGTGGCAGCATTTATCAATGTAAGAACAAGAATACTTTCTGTACTGGTATCAGCTTCGTCCTCAAAGCTATGACCTCTTACTTGGCCTTGTGCCCCATAGTGAACGAAGCTTCTTGCCTTTCCAGGTCAGTGTGAGTTAAGATTGTCAGAGTTGTATGTGTCCTGACAGACTGTGGACAGCAGGGTTTGCCCAAATCATCAAGTGATACAGGTAATGAATGTCTCTAAAATAAGTTGGGTCCTCCAAACAAGTCCTGGATACCTTCTGAATGTTAAGTTTCTGAGTGCTGAGAGTAATTTGTTCATTGGTTTGGTTTGATACCGTTATATCTATCTAGGGCAGTTCCAAGAAGTGCTTGACTTCTCAGCTCTAACAGCCAGTAAGAGTAAGTAACCTTAGTACAGGCAATGAGCCTCTGTAGATGTGCAGAGGACAAGTCACTTGTCTGTAGTTGCTAACAAACAATGGAACCAGTTTTGAGCACAGCACTCCCTGCTCTGCAGTCAGCCCTCTGCCCCACACCATGACTCACCTACAGATTGAGAGAGAGAAAGGCTTTCAGTTCCCCCAGTGTAGTATGCCCATTCACACTCGGAATTCTTTTTCAAAGACATCAAGATGGCCTTAGTACTCTGCTCTAGTAGATGTTGTAAGTATTCATTGTTCCTTCCAGGAGCTGGATTTTTGGTACAGTCCCCACAAAGGAAAATAAAGGCCTTCAAGAGTGTAAAGTTTTTAGACAGAGTTGGAGGTAATGGTAGTCTTCTAACATTATCTAAATATCTCCTGCTTCATTACTATAGAAAGCAACTCTTCATGTTTTAGGAAACCCAGCTACCATGTTTGTACTCTGAGAAGGTGCCAATACAAATCACTAATTTTGGACTCCCTTCCTGGAGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTAAATGAGAATGAGATTTGTACACACCCACATATTCTATACCACTTAATTAAGAGTTAAGTGAAGTTCAAAGCAGCCCCTGGTGATCTTACTTAACACCACAAAGTTTTCTACTAGGTCCATGAAAGTATAAACAGATAATTGGAGTGTGACTGCTGGCTTTCCAGAATAACCCACTTGTGGTAGATGTCAACTCTTACAGCTCCAAGCCAAGGTGACGACAACCCAGCCCTCTTCCACCATGTCTAATAACATGGGACATGGTAGATGCCTTGTCATTTGGTGACCTGGATCTGGGCCCGAGTTTAGAGCTGCAGAATTTATAACCTTGTAGTAGTCAGTGGTCTAAGAAGTCCTCTCTCCCCACAGAGAAAATGTCTTGCTGATTCCTGATATTCTACTCTCATAAGCTGTTCAGTACACACTTCTCAGTCAATTGGTTGCTTGTTTACTATGTGCTGAGCACATCTAGATTTTTTGTTTGTTTAAAGTTAAAAGTCCCATTATAAATCAAGTCTAACCCTGCCCTAAGAGAAAAGACCCACAGAGACTGCACATCTCACTGACGCTGCCTTCACCCATTAGTGTTTGAGGCCCACCATCCTATGGAGCCAGGTATTCCCACATCATTCAGATCACTGGTGTTTCCCATTACTGTTTGAGGCTGAGCAGAAACACTAACAAGGACCAGAGCAGGAACGGGAAAATAAATGAAGACACTTGGAGTGCACTGTTGAGAAAATAGCCAGAGTCCATGCTGGGCTTGATGTGGCTTTAGGGGACCAATCATATATACTTTATGGAAGTTAAACCTGACCAGTCTTTACAGTGACAGGCCACAGCGCGTGAGTGGGTAGAACCAACAAATCCATTGTCTTCTGCCTGTTTTTGTGTGCACAGTCACATTCCCTCCTTAGTCATCTTCCCCTTCCACTCTTTACACTAAACAAGGGAACACTCAATCTTTCAAGGGAATTACATATCTGAGTTAATGTTTCAGTATATCATTTTCATACTGTAAATTATTTTGTAAGAGAGATTTACTGCTATCCCAGGATGTTCGGACTTGGCGCCCCTGTGCATTTGGAAATCAATAAACTATTACTGGAAATACC
>URS0001E92C0D rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAGCGACGCTCTTCCTTCGGTGAGGTGACGGAGCGGCGAACGGGTGAGTAACACGTGGGCAACCTGCCCCTAGCTCTTGGACAACACCGGGAAACCCGTGCTCATACCGGATACGGCATCGAGCGGCACCTCTCGGTGGGTAAAAAGTTTTCGGGTAGGGATGGGCCCGCGGCCTATCTGCTTGTGGGGGGGGGGTTGTCGCACCCAGGGGCGGACGGGGGGCCGGGCTGGGAGGGCGGCCAGACAGACAGGGACTGAGACACGGCCCAGCCTCCGACGGGAGGAGGGAGGGGGGAAGATTGAGGAACGGGCGAAAGCCGGACGAAGCGAGGCCGCGGGAGGGATGCCGGCCTTCGGGTTGTAACTCTCTTTAAGCAGGGACGAATTCAGACGGTACCTGCAGAAGAAGCACCGGCCAACTACGTG
>URS00002FCF40 rRNA from 1 species 
TAAGTCACTTTGTCTTAATGGCAAATGTGAGATGCAGTGTATGGAATATCTTAATATCTAGTATGAGAAATTAACGATTTAAGTCCTTCTTAAAAGAGGCCATTTACCCATAGAGGGTGCCAGGCCCGTATAACGTTAATGATTACTAGAAAGATATTTCCAAAGAGTCGTGTTGCTTGATAGTGCAGCACTAAGTGGGTGGTAAACTCCATCTAAAACTAAATATAACCATGAGACCGATAGTAAACAAGTACCGTGAGGGAAAGTTGAAAAGAACTCTGAATAGAGAGTTAAATAGTACGTGAAACTGCTTAGAGGTTAAGCCCGATGAACCTGAATATCCATTATGAAAAATTCATCATTATATATGTAATATTAATTGATTAATATTATAATAATAGTGTGCATTTTTTTCATATAAGGACATTGTAATCTATTAACATAAAAAGTATTTATCAAAAGATCATTGGCTTTAAGTTTATTTTAATTAATTTGCTTTATTGCTTTTTAACATTAAATAAATGCCTAATGATTTGATAAAGTGTTGATAGATTTATTATATATAATGCTTAAATTCATTTTGAATTTTACAATAATGTTATAAACATTGATTTAAAAATTAATGTACGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTGAAACACGGACCAAGGAGTCTAACATATGTGCAAGTCATTGGGTTATATATATAAACCTAATGGAGTAATTAACTTAACTAATTTAATGGGATTAATTTTTAGTCTATTTATAATAGTCTATTAATTCAATCCCGGGGCGTTCTATATAGTTATGTATAATAATAATTTATTATTATTTATACCTCTAACTGGAGCGTACCTTGAGCATATATGCTGTGACCCGAAAGATGGTGAACTATACTTGATCAGGTTGAAGTCAGGGGAAACCCTGATGGAAGACCGAAACAGTTCTGACGTGCAAATCGATTGTCAGAATTGAGTATAGGGGCGAAAGACCAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGTGCATTTATATATTATGTAAAATAATCTTATCTGGTAAAGCGAATGATTAGAGGCCTTAGGGTCGAAACGACCTTAACCTATTCTCAAACTTTAAATGGGTAAGAACCTCACCTTTCTTGATATGAAGGTTGAGGTTATGATATAATGTGCCCAGTGGGCCACTTTTGGTAAGCAGAACTGGCGCTGTGGGATGAACCAAACGTAATGTTACGGTGCCTAAATTAACAACTCATGCAGATACCATGAAAGGCGTTGGTTGCTTAAAACAGCAGGACGGTGGACATGGAAGTCGTAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAAGCAACTAGCCCTTAAAATGGATGGCGCTTAAGTTGTATACCTATACATTACCGCTAAAGTAGATGATTTATAATACAATTTCGATTGAATTATAAATTTTGAAACTTTAGTGAGTAGGAGGGTACAATGGTGTGCTTAGAAGTGTTGGGCGTAAGCCTGCATGGAGCCGCTATTGGAACACATCTTGGTGGTAGTAGCAAATAATCGAATGAGACCTTGGAGGACTGAAGTGGAGAAGGGTTTCGTGTGAACAGTGGTTGATCACGAGTTAGTCGGTCCTAAGTTCAAGGCGAAAGCCGAAAATTTTCAAGTTTTAATGCAAAGAAATAACCAAACAATTAAAAAAAAAAAAAGAAAAAAGTAAACTTAAAGAAAATGAAAAGAACAATTTTAAAACTTTATTAATAAAAAAATAATTAATTACTACTATGTTTTTTCATTTTTTGTTTAACTTTTTTTCTTTTTTTTTAAATTGAAATTTTTGAATTTTTAAACACTTGAATAATTTTGAACGAAAGGGAATACGGTTCCAATTCCGTAACCTGTTGAGTATCCGTTTGTTATTAAAAATGGGCCTTGTGCTCATCCTGGCAACAGGAACGACCATAAAGAAGCCGTCGAGAGATATCGGAAGAGTTTTCTTTTCTGTTTTATAGTCGTACTACCATGGAAGTCTTTCGAAGAGAGATATGGTAGATGGACTAGAAGAGCATGACATTTACTGTTGTGTCGATATTTTCTCCTCGGACCTTGAAAATTTATGGTGGGGTCACGCAAACTTCTCAACAGGCCGTACCGATATCCGCAGCTGGTCTCCAAGGTGAAGAGTCTCTAGTCGATAGAATAATGTAGGTAAGGGAAGTCGGCAAATTAGATCCGTAACTTCGGGATAAGGATTGGCTCTGAAGATTGAGATAGTCGGGCTTGATTGGGAAGCAATACCATGGTTTATGTACTCGTTCTGGGTAAATAGAAAATTTCGATTTTTGTTCCCCGGATAGTAGTTACGTAGCCAATTGTGGAACTTTCTTGCTAAAATTTTTAAAGTTATATACATTTAATAAAATGTATATTCTTTTTAAATTATAACGATTATCAATTAACAATCAATTCAGAACTGGCACGGACTTGGGGAATCCGACTGTCTAATTAAAACAAAGCATTGTGATGGCCCTAACGGGTGTTGACACAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAAGTAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCACTGTCCCTATCTACTATCCAGCGAACCACAGCCAAGGGAACGGGCTTGGAATAATTAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCTGGCAGTGTAAGGAGACATAAGAGGTGTAGCATAAGTGGGAGATATATAATTTCGATTATTTATCACCAATGAAATACCACTACTCTTATTGTTTCCTTACTTACTTGATTAAGTGGAACGTGTATCATTGCTTAGCCATATTAAGGATTTATTTATAAGTCTTATGGTATTGGGTTTTGATGCAAGCTTCTTGATCAAAGTATCACGAGTTTGTTATATAATTGTAAACATATTTTAATGAAATGATAACATTTCGGTGTTATTATAATAATTAAAATTTGGTATAACTCCAACACTCAGGTATGATCCAATTCAAGGACATTGCCAGGTGGGGAGTTTGACTGGGGCGGTACATCTCTCAAATAATAACGGAGGTGTCCCAAGGCCAGCTCAGTGCGGACAGAAACCACACATAGAGCAAAAGGGCAAATGCTGACTTGATCTCGGTGTTCAGTACACACAGAGACAGCAAAAGCTCGGCCTATCGATCCTTTTGGTTTAAAGAGTTTTTAACAAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCGGCCAAGCGTTCATAGCGACGTCGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAAAATTCACCAAGCGTTGGATTGTTCACCCATTCAAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTAATGACAATTATTATTGCGACAGCATTCCTGCGTAGTACGAGAGGAACCGCAGGTACGGACCAATGGTACAATACTTGTTCGAGCGAACAGTGGTATGATGCTACGTCCGTTGGATTATGCCTGAACGCCTCTAAGGTCGTATCCGTGCTGGACTGCAATGATAAATATGGGGCAATTGCATTGTATGGCTTCTCTAAACCATTTAAAGTTTATAAATTTTATTTATAAACGACAATGGATATATGTGATGCCAATGTTATTTATAACATAGCAAATGCGGGAGGATCAAATATCACCTGTATGACGCGCTAGTTATATATAAAAACATTATTTAATACAATGACAATGCCTAGAATCAATTGTAAACGACTTTG
>URS0000ADD968 rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCACGGGAGCAATCCTGGTGGCGAGTGGCGAACGGGTGAGTAATACATCGGAACGTGCCCAATCGTGGGGGATAACGCAGCGAAAGCTGTGCTAATACCGCATACGATCTACGGATGAAAGCAGGGGATCGCAAGACCTTGCGCGAATGGAGCGGCCGATGGCAGATTAGGTAGTTGGTGAGGTAAAGGCTCACCAAGCCGTCGATCTGTAGCTGGTCTGAGAGGACGACCAGCTACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGCAGGATGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACGGAACGAAACGGCCTTTTCTAATAAAGAGGGCTAATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTATGTAAGACAGTTGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGTGACTGCATAGCTAGAGTACGGTAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGACCTGTACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS0001CBEDC2 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGATGAGGAGCTTGCTTCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACATATGTGTAAGTAACTGTGCACGTCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS00020C5C01 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTTGAGCGATGAAGATTGGTGCTTGCACCAATTTGAAGAGCAGCGAACGGGTGAGTAACGCGTGGGGAATCTGCCTTTGAGCGGGGGACAACATTTGGAAACGAATGCTAATACCGCATAACAACTTTAAACATAAGTTTTAAGTTTGAAAGATGCAATTGCATCACTCAAAGATGATCCCGCGTTGTATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGATGATACATAGCCGACCTGAGAGGGTGATCGGCCACAGTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGCGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGAGAAGAACGTTGGTGAGAGTGGAAAGCTCATCAAGTGACGGTAACTACCCAGAAAGGGACGGCTAACTACGTG
>URS00025F86BA lncRNA from 1 species 
TGCGAATCATAGACGGCGCGACATCATAGTCTTCCCTCATGGCAGCCTTTTGGCGCGAAGAAAAGGAAAGTTTGAAAAAATTACCATATCTTTGAACTGTTTTAATAAAGCAAGAAATTATATTGTGCAAATCTGGATGCAAGATAAAGAAACTCTTTGATTTTGTTCATTCTACATTATTTATCAGTTGAAGATCTGTAGTATGATGACACCGTCGATGGAATGTTCGATCAAATCTTTCTGGGTCTTGTCCGTTAACAGGAGCACGGAGATGTGAAGGCATGGAAGTGGGGATGATGTCCTTAAAGAGGCACGGTATTAATCCTGGAGGACTACTTTGGTGGACGGACGTTGGAAGACAACTGATTTCAGGTGTTTTTTCCGTTTTCTCTTGTTATTCCTCTTGGGTTTTTTCCATGAGGTCAGGTGGTTGTTGTTAATGGTCTGGCGTCCAATATGAGCACTCTATCGAAAGTTCCGGGTGACACATCGCTGACTAGCTGGATCCTCCTCAACAAGGAAACAACTCCGTGGGAAATAAATTTTATGGCTTTTAGCCTAACTTGATAAAACGCTCAAAGTTAAGAATTTTTTTAATAATGAAAGTTTAAAATAACACTTTATGGGGAGTCTGTCCCTCACATATATTTAATAATATATTAATTTGTTTAGAGACAGATTAACAACTTGCCTATGATAGAGATTAAAGTATAAATAACTGGAATTTTCATTTTACTTTCATCATTGAAAAAAAACACTATATACATCATGAAAACATTTATCATGGTTGATTAGATTTTTCTATTAATTAAATATTGAAAAATTACTCTTCAAAGCTTTTCCTTAACATATGATTAGTAGCAGTGGTTATTTTTGTGTTACTTGAGTCATTATCAGTTCAGTTTATGTTTAATTCATTTACCTTTCTTATTTTGCTGACAATTAAGTTATCTCTAGGAATGGATCATTTTCATTTTTCTGCTAATTCAGCTTTCTTTGGAAATGAAAATCCTTGTACTTTCGGTCCAGTCAGATAGTTGCCTTTACGCAGGGGCGCCACTAGCTGTTTGAACGCCCGCGTGCAATACCGATTATGTTGCCCCCTGTTTAACTACGATTACTTATGCTGAGCTTGCCAGAAAGGCTCTTTGCCGCCCCCTGGACGTGCCGCCCGCGTGCGGTGCACGTCTTGCACGCCCGCTTACGGCGGCCCTGCCTTTACAATCGGTTATACAGCACTTGTATGGGCATTTTGCATGACCTTATCACATTTACAAATCCCTAATATTTATAAAATGCTTTTGTAACACAGTCAACAAACAAAAAAACCCAAATATTCTAAGAAAATTATCCAATATTTCAATTTAATTACAATAATTGAAAGCATGAGAACTTAACAGCATATGGCTACTATTGTAATAGACAACAATTACCCCATGAGCACTCAGGCCTGATTATGTAGGTGGCATTAATTAGTTTTACCTTTAACATGGAGAAGACCTCATGCGTCCACTTTTGTTAAAGACATGGTATGCACCTTGATCCTGAAACTCACTGAAATGGGATTAAAATTCCAATAGTCAATGAGGCCATGGCTATCAAGGCCTGTTCTTAGCTTCTTGATCCCATTGGAGTGTGTCAAGGCAGTTTCATGATAATGTTGATTAGGGGCTGTTACAGACCATGGAATATCATTTATTACGTATGAGTTAGAGTGGAAAAAAATAAAAAATAATTTATTGTCACACTTATCTTTCAAAAGTCTATGTCATATCTATAAGACTGTGATTTTATTTAACTATTCTTGAGAAAATTTATTATTTTTTGCTATTAAAAATATAAAATAGTAAAAATATGCTTTACTCAAAAACTCATTTGCACATGTATGAAGCCAACTGCATTTAAAGGAAAAAAGCTTCATTGTTTTTTTAAAGGAATAATTACATAATAGATTAAGATATTTTTAATATCTTTCTTGTTACAGGTGTATGGTTTGTTTACACTTTTATTTATCTTGTCACTATTTTTTTGGCAGTGGTTAAGAAGTAATATTTTACATAATCTTGAAATTAATAGATTGGTGATTTCTTTTGGGTGAGTCTCCCTGCCACATCCACATTGAAGCCAAGGGATGAGACACACACAATGCTTTAGTTGCATTCTCAATTTAAACAAAATTTTTTGTTGCATTGGTAATTTGTCTATGTGATTTTTCACAGCTAGGACCATTCCAGTAAGTCTGAGTTGAGGATAATGGAAGCTTCTTGTCCTGAAATCTAATCATGTCGTTTGTTGATGATGATGTCTGGCTCTCTATAAAATTTTCTGTAGCCTGTCTGCATTTGTGTGTCTAGCACAACATGACACAGATAGCCTGCTACTATACCAGTGGCCCAGAAAAGTGAGATATAGGGAAATAACATTGAAAATCAACCAATATAAAATTACAACTGCCTGACTATTTAAAAGGCTACTGATGTTCAGCTTGCATTAATTATGAAAATTGAAACTTATTGGTTCAAGAATTATTAAGTTTCAATAGGTAAATGTTAAAAACAAAAAAAAATCTACTAATCCATGGATATAAAAAAGAATTTATTTTAAA
>URS0001859E2D rRNA from 1 species 
TACATGGGGTGCAAACGTTGCTCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGTTACTCAAGTCGGATGTGAAAGCCCTCGGCTTAACTGAGGAAGTGCACCCGAAACTGAGTAGCTAGAGTACCAAAGAGGGTCGCGGAATTCCCGGTGTAGAGGTGAAATTCGTAGATATCGGGAGGAACACCGATGGCGAAGGCAGCCCCCTGGGTCAACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS0002165809 rRNA from 1 species 
GGGGAACCGCCTGAACTGAAACATCTAAGTAGGGCGAGGAAGAGACATCAAACGAGATTCCGTAAGTAGTGGCGAGCGAACGCGGAAGAGGGCAAACCGAAGGTAGAAATACCTTCGGGGTACGGAGCGCATTTAAGACTCAAGTTGTTAACCGAACGGCATGGGAAGGCCGGTCAGAGAGTGTGAGAACCACGTAGGTGAAAACGGAAAGAGCTGCGCAGATTCCAGAGTACGGCCAGACACGTGAAACCTGGTCGGAAGATGGGGGGACCACCCTCCAACCCTAAATACTACCCAGTGACCGATAGCGTATAGTACTGTGAAGGAAAGGTGAAAAGCACCCCGGGAGGGGAGTGAAAAAGAACCTGAAACCCTGTGCCTACAAGCACCTAGAGCACGTCAAAGTGTGATAGGGTACTTTTTGTAGAACGGTCCGGCGAGCGATTGTATGCAGCAAGGTTAAGGACTTAAGGTCTGGAGCCGAAGCGAAAGCGAGTTTGAAAAGGGCGTTAAGTTGCATATAATGGGCCCGAAACCGGGTGACCTACCCATGGTCAGGTTGAAGTGGAAGTAAAATTCCATGGAGGACCGAACCGACCTCCGTTGAAAAGGCGGCGGATGAACTGTGGGTAGCGGAGAAATTCCAATCGAACCCGGAGATAGCTGGTTCTCCCCGAAATAGTTTTAGGACTAGCCTCAAGTTAGATACCTGGAGGTAAAGCACTGAATAGCCTAGCGGCCGAGAGGTTAGCGAAGCTTATCAAACTCAGAATGCCAGAGTATTGATGCTTGGGAGTCAGACAGTGTCAGATAAATGTCATTGTCAAAAGGGAAACAGCCCAGATCTACAGCTAAGGTCCCAAAGTCAGGTTAAGTGGAAAACGATGTGAAGATACGCAGACAACCAGGATGTTGGCTCAGAAGCAGCCACTCATTCAAAGAGTGCGTAATAGCTCACTGGTCGAGCGTCTTTGCGCGGAGAATTTAACGGGGCTAAACCTGACACCGAAGCTTAGGCAATCCAGTAATGGATTGGGTAGGGGAGCGTTGTATACGCGGAGAAACAGTAGCGTAAGCGGCTGTGGAGTGTATAGAAGTGAGAATGCCGGAATGAGTAGCGCGAATGCAGTGAGAATCTGCATGGCCGAAAGCCTCAGGTTTTTGGAGGAAGGTTCGTCCGCTCCAAGTTAGTCGGGAGCTAAGGTGAGGCCGGAAGGCGTAGCCGATGCACAGACGGTAGAGATTCCGTCACCACCAAAAGAGTTAAGCACAGGGACACATTTGAAGTCTCAGAGCCGGGTGTTGGTTCCGGTAGAGATCGAGGGAAGTTAGTACCGAAGTCTGGGATGGAAGATGGCGAGAAAAGCTGTGTGTATTTCTGAGGTGCCCGTACCGCAAACCGACACAGGTAGGTAGGAAGAAGATTCTAAGGCCAACGGGAGAAGGGTTGTTAAGGAACTCGGCAAATTGACCCCGTAACTTCGGGAGAAGGGGTGCTCCAGAGATGGAGCCGCAGAGAATCGGCCCAAGCAACTGTTTACCAAAAACACAGGTTTGTGCTAAATCGAAAGATGACGTATACGAGCTGACGCCTGCCCGGTGCTGGAAGGTTAAGAGGAGATGTGCAAGCATTGAATCGAAGCCCCAGTGAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCAGGTAAGTTCTGACCCGCA
>URS000003CBAA rRNA from 1 species 
GTTTCTGCTCAATGGAACTCTAAATAGCCGCAGTACTCTGACTGTGCAAAGGTAGCATAATCAATTGGCCTCTAATTAAGGTCTGGAATGAACGAACTTATGGGTAGCAACTGTCTTAAAATAGTTAATTAAATTGATTAATAAGTGCAAATACTTATTCAGTTACATTAGACGAGAAGACCCTAGAAACTTATAATTATTTTGTTGGGGCGACAGAATTACATAAAAACTAATTTTATTTTACAAGACGTAAAGCAGAAAGAAAAAGTTACTCTAGGGATAACAGCATAATTTTTAATAGCTTGTGACCTCGATGTTGGACTAGGTAGATAGTTTTTTAGAAGAAAGCTTTCTTGGCTCTGTTCGAGCAATTTTAACCT
>URS0001415BDF rRNA from 1 species 
TACGGGGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGTTCGTAGGTGGCTTGTTAAGTCAGACGTGAAATCCCTCGGCTCAACCGGGGAACTGCGTCTGAGACTGATGAGCTCGAGTGCAGGAGAGGAACGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCGGTGGCGAAGGCGGCGTTCTGGACTGACACTGACGCTGAGGCGCGAAAGCTAGGGTAGCAAACGGG
>URS00008DF9B1 rRNA from 1 species 
ATACGTAGGGAGCAAGCGTTATCCGGATTACTGGGTGTAAAGGGAGTGTAGGCGGGAGTTACAAGTCAGATGTGAAAACTGTGGGCTCAACTCACAGATTGCATTTGAAACTGTAGTTCTTGAGTGAAGTAGAGGTAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACATCAGTGGCGAAGGCGACTTACTGGGCTTTAACTGTACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGATTACTAGGTGTGGGGGGACTGACCCCTTCCGTGCCGGAGCAAACGCAATAAGTAATCCACCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGCCCCACAAGCAGTGGAGTATGTGGTTTAATTC
>URS0001F9E606 misc_RNA from 1 species 
AAGTCGTAACAAGGTAACCGTAGGTGAACCTGCGGTTGGATCATTAAAAAAAATTGAAGCTTCAACCCTTTCAAGGGTAGAAGCGTCAGTGCTCCTCTAACAAGGAGCTTGACTACTCCAATTTTGTGAACTTGCAACCAAAAAATGTTTTGATAGTGGTGAAAGATTTGGGCATTACCCGCCCAAGTTTTTCCCTTCTTGAAAAAATTGTTAACCCTGAAGAAATAACTTGTCTTTACCGTTTTTTATAAATAAAAATTAATAAACAACTTTTGACAACGGATCTCTAGGCTCTC
>URS00023BEA17 lncRNA from 1 species 
GTAAAGGCTGCACAGGAATCGATGGAAGATGCTTGAAAAGCCTCATTCCCAGAAACATCTCCAGCTGCTTTTGCCGTGAACTATCAACCATTGCATTTTTATATCTTCTCTGTAAGGTAATTTTCATGTTTTTCTGTGCTGCAGAAAACTGTTTAAACGCTCCTGACTCTTCACTGAAGATATTGAGAACTTGGCTGTGCATAGCTTTTGAGCCAGTATAGAGAGTTGCATGGATATCACCTTGTTGCAGAAAAAGATCTGCGAGCTCAGACACAGGAGACAAGATAGTTGATCTCTTAAACTCCTCAAACCTCATGTCAAGTCTCTTCCATGGTTTATCAGGACATGGATGACTCCATGTTGTTGTCTTAGTATTGTGATCAATAAAATAAGATTTTCCAGTGACTGCATCAGCTCTTTTCTCCCATCCCGGTGGAAGCGGAGCAGTATAGCTACTCCCAGAATTATAACCATATCCAATATCAGTATCAAGTGATATCCCCAGCCTTCTACATTGCTCAACGAACACTTGAAGACCTATAGAAGTAGCAGAGCCATCAGCAAGACTTCCACCTCCATTCGCGTTGTCCCTGGAGTAGGATTTTGAAAGCAGAACCGCTCCTCTTCCGGCACAACAAGACTTGCAAGCTTTCTTCCTACACTGTAAACATAAGAACACTGAGCCTGGCTCTCCCCCCAAACTCTTGGTAGTAGATCCAACTGAATTTTTGTTGACCTCGGCTCTGACTTGACACACTCCACCGTTACAACCCTCACCAATTCCGTTAATATTCCAGAAATCTATCACACTATTTTCCAGCTTCTCTAAATCAATAGAAGCTATAAGTTTATCTTCAAGAGAAGCCTGGCCAAGAACTGCAAGTGCATTTGCTATTCTGCATAATCTTCCAATATATAACTCGTCGTGTGAAGAGTTCGGATTAATTGTAGCAGGATCAATTCCAATTGATAACAGTGCCCTATCTCTTTCTGCTGCAGAAATATTCAGACGTAGCCGTTCAATTTCAAGTTTAATAGCTTCTATAAACTCAAGCTTCCTTCCCTGTATTATAATAGACATGCAGAAATTAAGTTTACAATTAAAATGGCAGTTTAAGAGGACATATAACATCTGAGATGAATAGCTGAACCAAGAAAGGAGTCATAAGATCAGAAATGGTATGTGACAAGATGAAGTAACATACCATGTTTGGACCCATAACGGACTTCAGACAATTTAAGTACAGATGAGAACCACTCTCTCTAGAACTTTTATCTTGTGAAGAAGACATGCTGGGAACAGTTTCAGGACCACTATATTGAACAACTGCTTGGTCTAAGAAATCAAGCATGTCATTTCCTCCACTTGCAACACATTCCACCGCTGGTTGTGGGAAGGGGTCAGAAGCAGAAACCTCTCCTGTCAAAAGGTCAAGCAGATTACTAGGAAACGGATCATTCTGTTGTACTGGTGTGGACACAGTTTCAGCCTGTAAAGATTTTGCGGCAAAAGGATTCGAGTCAGAACAAGATGAAAAAGGAACTTCATCTTCTTTTGTTTTCCCTGCAATCTCAGCCAATCTTCCTCCGGTACGTTCGCTAGTAAACATTCCTTTCCATGGAAGAGAAACTCCAAGGACTTCTATCTGTATCACAAACACAATGCAGAAGAAGTTTTGTTTTAAACTGTTTTGCTTTCATGTTGGCTAGTCATACTATTAGATAAATCATTAATTTTAGTCCAGAAAGTAGTTATTACCTGACCAAGAGTCATGGGGATTTTAAGAGAACCAGCTGGATAAAATGTAACAGAAACTACACGGGTCAAGAAATCCAGTTGTCCTTCTAGTTCTTCAAAATCATACAGCAGTGAAAGACTTGACGTATCTTTTTCATGGAGACGCGCACCAGCTCCAGTAATAGCAATATCCTCATCACGAATTGGCCCTGGTAAGGGTATCAGAAGATTTGTACCATTCGCACACCGCGGTATCGAAGCATCCTGTCCAAAAACCAGAAATACAGACAATCGTCATCCAGTTGAACTAGCTTGCATGCACGTCTACATGATACAATAAAAGAGAAGGGACAAGAGAGTCAGTCAACCTGAACAACTAATTTAAGGTCCTCTAAGTGGCGTCCAGTTTTCACGTTCACAGTGGATGGACATGTCAAATCATCCGCACCGTGTGATATTGTCAGTACAAGTTGACATACATGGCAAGGCTCACTGAGGTAGATAACTAACTCAACAGCATCTGCAGCTTGTGGACATAGCTGCAAAGTATATAAAAAGCAGGGGAAACTTTTAGCTCAAATTTTTGAGGGATGAGAACAAAGAGGTAATGTTTTATCCAAAAGGAGGTACCCAAGTTATGTCCTTCGTCTTGATACTCAGCAGACTGGACCCATCATTGGAAGTCTCAGACATGCTCGGTACAGGTTTCAGAAAGAAACCACCTGGCCGAGAAAGTACCTGACATGAAAAAAAGTTCCAGTGAGCAGTAACATTAACATAGCTGCAGTGAAAAATTGTATTAGTTTGCTTACATGTAAAGGCTGCACAGGAATCGATGGAAGATGCTTGAAAAGCCTCATTCCCAGAAACATCTCCAGCTGCTTTTGCCGTGAACTATCAACCATTGCATTTTTATATCTTCTCTGTAAGGTAATTTTCATGTTTTTCTGTGCTGCAGAAAACTGTTTAAACGCTCCTGACTCTTCACTGAAGATATTGAGAACTTGGCTGTGCATAGCTTTTGAGCCAGTATAGAGAGTTGCATGGATATCACCTTGTTGCAGAAAA
>URS00000FB6E5 piRNA from 1 species 
TAATAACAGGTCTGATTGCTTCATTAAC
>URS00021C6D14 lncRNA from 1 species 
CTAGATTTAGTTTTATCTGATATTAACAAAATTTCTGATAATATTATTTGTTGTTTGAATAAAGCACAAAAGTGCTGATTTTATGAGAAAAAAAATCCATGTAAATATCTTATTGAATTTAGATTCATTTGAAATCGAAGTGAAACATAACTGATGTTTACATTTGTGAAATTAGCTTTTGTGCATAACTGAAATTCACAAATTAATGTTTATTAAGTAGATGTACACAGTTATGTGGATATATTTGATTGGGCGAGTATTCATATTGACTTGACATGCAGATAATTGTTTGAACGAATTAATGTATTGACCGGAGATGTAGATAAATGTTAGGACGACTATTTAATGATTGGACGGATCTATAAATGAATTGACGAATGTATATACTGATTGACATATACAGTATAATTGGATGAATATATAAACGAATTGAAAGATATTTGAACGATTGACAGATGAATAAACGATAGACTGATATATGTATGATTAACGGATACGTTCATGATTGACGGATATATACATGGATAGACGGATATATAAATGATTGACAGATACATGTATATGCATGGCTAGACCGTTATATAAATGATTGACGGATATATGCATGGATAGACGAATATATAAATGATTGACGGATATATGCATGAATAGACGGATATGAAATTGATTTGAATGGTTTTTGAATGATTTGACGAGTATATTAAAAATGATTGAATGGTTTTTGAATGATTGGACGAGTATATTAAAAATAATTGAATGGATATATTTTTGATAAGATGGATATATGAATGGGAATTTGACGGATATATGACTTGACAAATAGATGCATGATATAACGGATATATGATTAATTTGACGGATACATGATTAATTGGACGATTTATAAATAATCGGATAGTATAAACCTCGATATGGGCGATATATTCATATACATATATTTGTTAAATGCTAGATATTATATATCATTCATCGGATGGATATTTTTTGTTTGCAAGGACTCATGATTGAGTAAATGATATTTGGTTATTTGTAAGAAATCCTTTTTTTATTTTTACGTTGTACGAGGTAGTTGCTTATAGTTTTAATATGTTTTTGTATGTTTTTTTGTTATGTTTTT
>URS00000D240F rRNA from 1 species 
CGTGTAGGCGGCCAGGTAGGTCGGTTGTGAAAACTGGAGGCTTAACCTCCAGACGTCGACCGAAACCATCTGGCTAGAGTCCGGAAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCTAAGGCGGCTCTCTAGTACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACA
>URS000210495B rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCGAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCTTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAAGCAGAAAGCCACGGCTAACTACGT
>URS00023FD586 lncRNA from 1 species 
GGAAGATCCAGCCTCGACAACGGTGGAATTCGGTAGAAGGTCACGGAGGTCAGTGAAGCTTCGCCGGTAGTTAAAACCAGAGGAATGTTCTAGAAACTGCAGAGGAGACGAAGGAATCGAATCCGTCTTGTGAACTTCCTCTTCCTTAACACCCTCCGTAATAGCTTTGTTGTTGTTGTTATCTTCTTCACCGTTTACCTTAGCTTTGATTTTACTAATCTGCAACCAAAAACTTTAAAAATCAAACCTTTTTGCATTTTCGTCTCTGAAGTTTCAATTTTTATGGTTTAAAGTCTCTAATATTGTACCTCTTGGAGAAGGGAATCATTGTCACGGCGGAGAGAATCGAAATTGTGGCGGAGAGAATCGTATTGACCCTTAAGAACACCGTAATCTTTTTCAAGCTGTTTTGTTTTCCACCGTGCACGACGGTTCTGAAACCAAACAGCTACTTGACGAGGTTGAAGTCCAAGCTCTTGTGCTAATTTAGTTTTCCTCTCAGGTTCGAGTTTATTCTCAAGTTCGAAATTCTTCTCAAGAGCTTTGACTTGGTCAACTTTTAATCTTCTCTTCTTCTCCGATAGACCCATGTGGTGGTGGTTGCCGGAATATTCCTCGATTAGTGTAGCATCTTCATCGTAACCTTCAAGCATAGATTGGTAATTACTTCCGTACCCTCTTGGACTCTGTTCATCTGTTGTGTAACCAAATGAATCTTGTCAATAAAAGAAACAGTGGAAAGTGAAGAAAGGATCACATGGGTTTTGTCTGACATTAGCAAAAAGTAGAAAGAACAAAGATGGTAATAAGAACCTGTAGAAGTGGAGATTAGACCACACATTGAATCTGAGCTGCTTAGTCTCTTCATGATGACACTTTAAAATAGTTCTACTCCAGCTTTTTCTTTATTATCAGAGAAATTCTTATGAAGTTTTGAAATTACAACAATGTTGTAAACATAATTGAGCTTCTTCACTTGAACAACAACATGAACAAAACGAGGAGACTTTAGAGGCTCAAATTAGAAAAAACAGAGAGAGGGATATGGATTGAGAAAGTCCAAAAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAAGCTTTTAATCTAGAGAGCAATGGTTCTTTTCAATATGAACAAGTTGGTTTCACACTTTCTCTTTCTTTAAATAAACCAAACTTATCTTTCTTTAAATAAACCAAACTTAGAGAAAGGGTTAAAATGTAACTAAGGTTAAGTTTGAACCAATAGTTATACGGCTTGGCTCGGCTCGGCTTAGAACAAGTGGTGGAGTCTGTGATACGTCACCGTATGGGTTTATTTTTGGTAATGCTTAACCTTATTTTTTTTAAGGGTGTTTCTATTTTCTTAAACTTAAAAATTCAGAGAAATTAATAAACAGCGGATAGTAGAGAGATACGTAAGATGCATTTAAAAAGTAGATTTTTAAAATATAACATCCTCTGAAAAACGTCAGAAGGTACGTCACAGAAGATTTGATGACAAAATGATAAACTATAATTTGTTTGTTGATTAATGAAACCAAATGTAATTTTCCTGAGCAAACTTAAAATTCGATAGGATAAGTTATAAAATTATACGGATGGCATATTTAATCCCATATATTAGATGTGGGATATATTATTAAAAACATTAGTGTTATATGTTATTGTTGGCAACGCAGGGGAGTGGAAAGAAAGACTTGTGGGTGGGGGAACAAGACTGACGCAATTTGGGTTTGGTTCATTGAATTGTCCAAAAACTATGGGCTCGAACGGCACCGTCAAAAAATATCAATTCTTGTTTTGAA
>URS0000538100 piRNA from 1 species 
TGCTGGCTGCTGGGTGGAGCATGTAGGG
>URS0000D6DD09 lncRNA from 1 species 
AACTACGAGTCCCGACGTGCCGCGCGCGGCATGCAGAAGCTTCACTGAGCGGGCACTGGAGGTCGCGAGCACGTTGCTAGTGGGCGCGGCTGGCGGGGCCGGGGGCGGCAGGGGGCTAGCGTCCGGCTGAGCCCGGCGGGTTCCTGCACGCGGACCCACGCTTTGTCGGGCTGCTCTGCTGAGTGACACCGCCGTGGCATCCGAGGAGCTGTGGTCCAGCCTGCGCGGCGGGAAGCGGCGGCGGCGGCTCCAGCGTCCTAAGAGATTGCAACACCTGCTCGGTATACCGTGACTTTGGGAGGAACATCTGTCACTGTGAAGTATCTGCGCAGTCATGGCTACATGTCCACGCCGCCACCCGTCAAGGAGTATCTGCAGGACAGGATGGAAGAGACAAAGGAGCTTATCACAGAGAAAATGGAAGAAACAAAAGATAGACTCACTGAAAAGTTACAAGAAACCAAAGAAAAAGTTTCCTTTAAGAAAAAAGTGGAATAAGGTGCCTTATATAGCAGTATAGAAAATTCCTGCACTTTAACCCTTTGGAAACTATGGGCAAAGATACATGTGTCTGATTATTTTTTTGGTTAGTTGCCGAAATATACTAGTTCTCTGAGGGTTAAAGAAGTAAAATACCTTTTTAAAGTTAAATATCACTAGAAAAATCAGTGTTATTACAAGGGAAGAAATGAACCCAGTTTAAGAATTTGCCATCAGTAGCAGTATTAAGCAGTGGTTAATGTCTTAGAAGTCAGACTTCTTTTTCAAGGTCTTCAGAACCACACTTGATTTCTGTTTTGTTGCAGCTGTAATTGACACATACTAGGCAGCTGACTCCTTGAATATCCAGTGTGACCCATAAAATAGTCTGTTAATACCGGATCTTAATTTTTATGTTATTCATTAAGATTTTAACTATATTCAGTACGTAATTTGGAGACAAACTAGCATCATCAAAACTGCCTGTAAATAAGGTGTTTAGTCTTTCTATAAAAACAGAATAGAGCAGTTACCTACCAGTTAAAATATCTTATATGAAGAAAATAGAATAAAGATCCAGTCATATATGTAAATAAGATGTACTGATTGTACGTA
>URS000037851E rRNA from 1 species 
TTCAGAGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATACGATCTGACCTCGGCATCGAGGATGGATGAAAGGTGGCCTCTATTTATAAGCTATCACTGAAGGAGGGGATTGCGTCTGATTAGCTAGTTGGAGGGGTAACGGCCCACCAAGGCGATGATCAGTAGCCGGTCTGAGAGGATGAACGGCCACATTGGGACTGAGACACGGTCCAA
>URS00003C52C3 rRNA from 1 species 
ACCGGGGCGACGATCAGTAGGGGTTCTGAGGAGGAAGGTCCCCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGAAGGCAGCAG
>URS0000E650A4 rRNA from 1 species 
GGTTGTCACAATACCATGTGCTGAGATCCTCTAAGCTAAGTAGCATTGGATCTGGTTATTACTTGGATGGGAGACCTCAAAGGAGCATGTAGGATTACAAGTA
>URS00007CE4A8 rRNA from 1 species 
ACATGCAAGTCGAGCGGGGTCCAACCGGTGGCAACACCGGGGACGGCCGAGCGGCGAACGGGTGAGGAACACGTGAGCAACCTGCCCCGAAGTCCGGGATAACACCGGGAAACCGGTGCTAACACCGGATGTCCTCCCTCTGGCGCATGCCAGGAGGAGGAAAGGTTACGCTTCGGGAGGGGCTCGCGGCCTATCAGCTTGTTGGTGGGGTCACGGCCCACCAAGGCGACGACGGGTAGCTGGTCTGAGAGGACGGCCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCAACGCCGCGTGCGGGACGAAGGCCTTCGGGTTGTAAACCGCTTTCAGCAGGGACGAAACTGACGGTACCTGTAGAAGAAGCCCCGGCCAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGCTGGGCAAGTCGGGTGTGAAAACTCCAGGCTCAACTTGGAGACGCCACTTGATACTGCCCTGGTTTGAGTCCGGTAGGGGAGCGCGGAATTCCTGGTG
>URS0001630D6F rRNA from 1 species 
CCTACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGCGCAAGCCTGACCCAGCAACGCCGCGTGAAGGAAGAAGGCTTTCGGGTTGTAAACTTCTTTTGTCAGGGAAGAGTAGAAGACGGTACCTGACGAATAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTACTGGGTGTAAAGGGCGTGTAGCCGGGTTGACAAGTCAGATGTGAAATCCTGCGGCTTAACCGCAGAACTGCATTTGAAACTGTTGATCTTGAGTACTGGAGAGGCAGATGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGTCTGCTGGACTGTGACTGACGTTGAGGCCCGAAGGCGTGGGGAGCAAACAGGATTAGATACCCCAGTAGTC
>URS0000B3F91B rRNA from 1 species 
GAGACCCTACGGGGGGCAGCAGTGAGGAATATTGGTCAATGGGCGCAAGCCTGAACCAGCCACGTCGCGTGAGGGATGACGGTCCTATGGATTGTAAACCTCTTTTGTCGGGGAGCAAGGCCCGCCACGTGTGGCGGGAAGGAGAGTACCCGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGGTTTAAGGGTGCGTATGCGGAAGGGTAAGTCAGC
>URS0000D2A1B2 rRNA from 1 species 
ACGATGAAACCGCGAATGGCTCATTATATCAGACATAGTTTATTAGATCCCCCTCCCCCTACTTGGATAACTGTAGTAATTCTAGAGCTAATACATGCACCAAAGCCTTTACTTTTCGGTAAAGGCGCAGTTATTAGATCAAGACCAACCGAAGCTTGCTTCGTTGTTTTGATGACTCTGGATAACATTAGCCGATCGCATGAGCTTGTCTCGGCGACGTATCTTTCAAATGTCTGACCTATCAACTTTCGATGGTAGGTGATATGCCTACCATGGTTGTAACGGGTAACGGGGAATCAGGGTTTGATTCCGGAGAGGGAGCCTGAGAAATAGCTACCACATCCAAGGAAGGCAGCAGGCGCGTAAATTACCCACTCCCGGCACGGGGAGGTAGTGACGAAAAATAACGATACGGGACTCTTTCGAGGCCCCGTAATTGGAATGAGATCACATTAAACACTATGTGGAAATCTATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAACTCCAGC
>URS00023D0B22 lncRNA from 1 species 
TATTACAGATCGTGCCCATCCCACTTCTCTCTATCATAACCGAACATAACAACCTCAATCACAGCCTGGCATGCCCACCCCAGCTGGGGGTCCTCTGTCCATGCCTGCCCCGGCGGGGGTTTGCAGGCTAAAGGAGCCCGCCCCGATGGGGGTATAGGAGTTTAGTTTTTTAAATCCTATTACAGATCGTGCCCATCCCACTTCTCTCTATCATAACCGAACATAACAACCTCAATCCCATGAATCCTCTCCAAATCGCCCACTTCCCATAGAAATTGGCCCACTTACACTCCCATATAAATCCAACTCCAATCTCTTCCATTCTATACCAAATCCACATCACACTTCAGATTTCCATCAAAAACCTAGGGTTTCTCATC
>URS00009F6D70 rRNA from 1 species 
GGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCCTAGGGTTGTAAAGCTCTTTCAGCTGGGAAGATAATGACGGTACCAGCAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCAAGCGTTGTTCGGAATCACTGGGCGTAAAGCGTACGTAGGCGGATATTTAAGTCAGGGGTGAAAGCCCGAGGCTCAACCTCGGAACTGCCTTTGATACTGGGTATCTTGAGTCCGGGAGAGGTGAGTGGAATGCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGCGGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGGTACTGACGCTGAGGTACGAAAGCGTGGGGAGCAAAC
>URS0001120C71 rRNA from 1 species 
TACAGAGGTCTCAAGCGTTTGTTCGGATTCATTGGGCGTAAAGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTCGGGGCTTAACTCCGAAACTGCATTCGATACTGCCGTGATTGAGGACTGGAGAGGAGACTGGAATTTACGGTGTAGCGGTGAAATGCGTAGATATCGTAAGGAAGACCAGTGGCGAAGGCGGGGTCT
>URS0000F57DDE rRNA from 1 species 
GTGTCAGCCGCCGCGGTAATACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTTCGTTAAGTCTGATGTGAAAGCCCTGGGCTCAACCTGGGAATTGCATTGGATACTGGCGGGCTAGAGTGCGGTAGAGGATGGCGGAATTCCCGGTGTAGCAGTGAAATGCGTAGAGATCGGGAGGAACATCTGTGGCGAAGGCGGCCATCTGGACCAGCACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGAAACCCCTGTAGTCC
>URS0000092071 rRNA from 1 species 
CAAGTCGAGCGGCAGCGACAACATTGAACCTTCGGGGGATTTGTTGGGCGGCGAGCGGCGGACGGGTGAGTAATGCCTGGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATGATAGCTTCGGCTCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCCAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCAGTGAGGAAGGAGGTATCGTTAATAGCGGTATCCTTTGACGTTAGCTGCAGAAGAAGCACCGGCTAACTCCGTGCCAGC
>URS0002572490 rRNA from 1 species 
ATGGCGGCGGCGGTGGACCTGGAGGATGCGTTCGGCGCGGTCTTCGGCGAAGCCAAGCCGGAGGGCCACCCCACCGCGCGCCCCGTCCTCTTCCGCGCCCACGCCCGCTCCGCCGCCGCCCTCCGTGTCGTCGCCACCGACTGCCACTCCCTCGCCTGGGACTGCTCCCTCTCCGTCTCCGACCTCGACGACCTCAGAGACGATGTTGGAATCGGGGGCTCCTGGGCCGACTTTCTAGATTATCTCAAGTCCTCCTTGTCCTCCGGCGAGGTGAAGCTGCTCTTCGCCACCGACAAACTCCGCAAGTCAACCGGTTCTGATGGTGCAAAGCTTGTGGCTACCAAGGCAAAGGGCCTGCCTCGCATCACCATTTCTCTCCATAGTGTTACTGGCGCTACGACGAGTGATATCATAGCCGAGTTCTCGCTAGCGCTCTATGGAGCTTATAGGACTGCACGGGAGCTTGTATCCAAAGAACAAGAACAAATGTCACAGCTGATGGGAAATCTGTCAACTGAAAGAGAAAAGAACGAAATCATGCAAAAACAACTCGAATCTCTTTCTTTCCTAGACAAAAGAAAGGCAACAAAGCCAAAGCTGTTGGCTGATCAGGTTCCAAGTGTGTCTGCTGTGACTCTGGTCTCTGACCAAGTTACAGCTCCTGTGCAGCAGCAAATATCAGTACCTTCACCTAGTAAAGCCCCTCCTGCTAAAGTCACGAAGAGGGTAGCCCCCACGTCTCGGAGGGCAAGAGTGCGAGGAGCTCTGCTGCAAGATAATGAGGATGAGGATGACAACTGA
>URS00013FFE9F rRNA from 1 species 
GTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTCACCGGTGAAGATAATGACGGTAACCGGAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCACGTAGGCTGATATTTAAGTCAGGGGTGAAATCCCGGGGCTCAACCCCGGAACTGCCTTTGATACTGGGTATCTTGAGTATGGAAGAGGTCAGTGGAATTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAGGAACACCAGTGGCGAAGGCGGCTGACTGGTCCATTACTGACGCTGAGGTGCGAAAGCATGGGAAGCAAACAGGATTAGATACCCCTGTAGTCC
>URS00004AF1E8 rRNA from 1 species 
ACAAGCGGTGGAGCATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCTGGGCTCAAATGTATGTTGACGTATTCTGAAAGGGTAATACTTCTTCGGACAATATACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGGTTAAGTCCCATAACGAGCGCAACCCTATCATTAGTTGCCATCAGGTCAAGCTGGGGACTCTAAGTGAAACTGCCTACGCAAGTAGTGAGGAAGGTGGGGATGACGTCAAATCAGCACGGCCCTTACGTCCAGGGCTACACACGTGCTACAATGGCCGGTACAAAGGGCAGCTACCTGGTGACAGGATGCTAATCTCAAAAGCCGGTCTCAGTTCGGATCGGAGTCTGCAACCCGACTCCGTGAAGCTGGAATCGCTAGTAATCGCGCATCCGCCATGGCGCGGTGAATACGTTCCCGGGCCTT
>URS0000EEE034 lncRNA from 1 species 
GGCTTAGGGGAAAGTCCCCTTAGGGAAGTCCCTATTGACCCAGGAAGTCCAGCCAACTTAGCCACTTAGTCCCTCAGCCCTGGCTTGTGGAAGCAGAGATTCCTAATACGGCCCTCACTTCTCCACTTTCTCCACTGGGGTTGGAAGCAGTAGGAGTAGCTATAGAGGATGTATTAACACCAATTTACAGAGATCCTATTGAATTTACATCTCTCCAGCAGGTGTGATGCAAGGAAAACAAAGCTAATACCCAAAGTCTTTGAGCGTGGAAAGAGAGAAAGTCCACTTTAAGCGATGGAAAATCAGCCCCAATTCTGAAGGAACAACCATGAACAGATGATTTAAGGAGAATCAATTCTTTGCTCTTTGCAGAAGGAGCCAACAGAGTGAGATGAAGGGGACAACTTCAGATACTCAGGCAGAAGCATAAGTCCCCACCTGCTGACCTGCTGCCTGCTATCTTAACACGAATTCTTCATCTGAATGGATGAGCTTTTCACAGAGTTCCAAACTAAGGAATCCAGGAGTGGCCAATCCAGAGATTCATTCCTTATCTTTGACGAACATCTGAACTCCTGGCTCATCCTGTGGAATTCAGGCCATACAGGAGATCAAGGTCATTTGCTTTGGGTTAAATGAATGTTGCCAGGTGGAGGTTGCTAGAGGGAGAGTGCTATGTGAAAGTGCTGTATAAACTGCTTGCTTTTCACAAACAGTAGTGATTCTTTATCCTGTCCAGCCTGCCACAACTGGACCATCCTGTATGTAAGTCCCCTTAATAAATCCTGTGTCTCATTCACTGGCTTCAAGTCTCTTCCTGGGCCTCTTGAACGTGGTGCCACCTGTATTGAAGTCAACAGAAGTTCAGCACAACACAGGTCAAAATGAAGATTCTGACTCAGTAGGTCAGGATGTTCTAACGAGCTCTAGCTGACATGATACGTCAGGGCTGCAGACTAGCTTTGAGCAACAAGGTGCTAGAGAAATACCTATAGAACAACAGAGATGCAAGACAAATGAGTTGGAAGTTAAAAGATTTAAATTCTTGTCTTAGTTTTCTCATTAAAGAAAAGCTGTGTGACTATGAAAAAAAATGGCTCTCTGAGACTTTTGTTTGCTCATCCAAGATGAAAATATTGAAATGTATTATACAATAAACATTTGCAAACAG
>URS00017D46D8 rRNA from 1 species 
TACGAAGGGGGCGAGCGTTGTTCGGATTTACTGGGCGTAAAGGGCGCGCAGGCGGCTCATTTTGTCAGGCGTGAAAGCCCCGGGCTTAACCTGGGAGGTGCGTTTGATACGGATGGGCTAGAGTTCGGGAGAGGAGCGTGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCGGTGGCGAAGGCGGCGCTCTGGACCGAGACTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACGGG
>URS000151634F rRNA from 1 species 
GTTGTATGGTTAAGTGACTAAGCGTACACGGTGGATGCCTTGGCAGTCAGAGGCGATGAAAGACGTAGTAACTTGCGATAAGCCCAGATTAGGTAGTAACAACCATTTGAGTCTGGGATTTCTGAATGGGGAAACCCACGTGCATAAGCACGTATCCTTACCTGAATACATAGGGTAAGGAGGCGAACCGGGGGAACTGAAACATCTAAGTACCCCGAGGAAAAGAAATCAACCGAGATTCCGAAAGTAGCGGCGAGCGAAATTGGACTAGCCCTTAAGCTTTACACGCGTTAGACGAACGGTCTGGAAAGTCCGACGATACAGGGTGATAGTCCCGTAGTTGACGACGTGTGTTCAGTGAAATCGAGTAGGGCGGGACACGTGATATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTACTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCCCTGTGAGGGGAGTGAAATAGAACCTGAAACCGTGTACGTACAAGCAGTAGGAGCACCTTCGTGGTGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCAGTGGCAAGGTTAACCATCTAGGGGAGCCGTAGGGAAACCGAGTCTTAACTGGGCGTTCAGTCTCTGGATATAGACCCGAAACCAGGTGATCTAGCCATGGGCAGGTTGAAGGTTGAGTAACATCAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACTTGTGGCTAGGGGTGAAAGGCCAATCAAACCTGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGGACGAATACTACTGGGGGTAGAGCACTGTTAAGGCTAGGGGGTCATCCCGACTTACCAACCCTTTGCAAACTCCGAATACCAGTAAGTACTATCCGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGGAGAGGGAAACAACCCAGACCGCCAGCTAAGGTCCCAAATTACTACTAAGTGGGAAACGATGTGGGAAGGCTCAGACAGCCAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAATAGCTCACTGGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTAAGTAGTAAACCGAAGCTGCGGCAATGTGCTTTTGCACATTGGGTAGGGGAGCGTTCTGTAAGCGGTTGAAGGTGTGTGGTAACGCATGCTGGACGTATCAGAAGTGCGAATGCTGACATGAGTAACGATAAAGGGGG
>URS000043C123 rRNA from 1 species 
CTACGTGCCAGCAGCCGCGGTAATACGTAGGTCCCGAGCGTTATCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGTTAGATAAGTCTGAAGTTAAAGGCTGTGGCTTAACCATAGTACGCTTTGGAAACTGTTTAACTTGAGTGCAAGAGGGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCTTGTAACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGGTGTTAGACCCTTTCCGGGGTTTAGTGCCGTAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGA
>URS0001C76D33 rRNA from 1 species 
AAATTGAAGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGAAGCTTGCTTCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGATAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTTGTTGGTGGGGTAACGGCTCACC
>URS00012CC989 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCTTAATACATGCAAGTCGAGCGAGCGGCGGACTGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAAAGGTAGCTAATACCGCATACCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAATGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGGGGAGGCGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATTC
>URS000186D9C0 rRNA from 1 species 
ATTGAACGCTGGCGGAATGCTTTACACATGCAAGTCGAACGGTAGAGGGGGCAACCCCTCGAGAGTGGCGAACGGGTGAGTAATATATCGGAACGTGCCCAGTCGTGGGGGATAACGTAGCCAAAGTTACGCTAATACCGCATACGATCTAAGGATGAAAGCGGGGGATCGCAAGACCTCGCGCGATTGGAGCGGCCGATATCAGATTAGGTAGTTGGTGGGGTAAAGGCTCACCGAGCCAACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTGCGGGAGGCAGCAGTGGGGAATTTTGGACAATGGACGCAAGTCTGATCCAGCCATTCCGCGTGCAGGATGAAGGCCCTCGGGTTGTAAACTGCTTTTGTACGGAACGAAAAGGTCTCTCTTAATACGGGGGACTCATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCCGCCGCGGTAACAC
>URS00000166F6 tRNA from 1 species 
CCTGGTTAGCATAATTAGTAATGCGATTGTTTTGTAATCAATAGACTGTAAGTGCAAGTCTTACACTGGGCTA
>URS000226E0A8 rRNA from 1 species 
TGGCAGGTCGAGCGAACAGGATAAGGAGCTTGCTCCTTTGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTACCTATAAGACTGGAATAACTTCGGGAAACCGGAGCTAATGCCGGATAACATATAGAACCGCATGGTTCTATAGTGAAAGATGGTTTTGCTATCACTTATAGATGGACCCGCGCCGTATTAGCTAGTTGGTAAGGTAATGGCTTACCAAGGCGACGATACGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGCGTAAGTAACTGTGCGCATCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGAAACTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGCAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACGCTGATGTGCGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAAATCTTGACATCCTTTGAAAACTCTAGAGATAGAGCCTTCC
>URS000163AA4F rRNA from 1 species 
TACAGAGGGTGCTAGCGTTGTTCGGAATTATTGGGCGTAAAGAGCGTGTAGGCGGTCAGGTAGGTCCGTTGTGAAAACTCGAGGCTCAACCTCGAGACGCCGATGGAAACCATCTGACTAGAGTCCGGAAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCTAAGGCGGCTCTCTAGTACGGTACTGACGCTGAGACGCGAAAGCGT
>URS00008DBA8C rRNA from 1 species 
AACAGCCAGAAATGGGCTGCTAATACCCGCATAAGACCGAAGCGCCGCATGGCGCGGCGGCCCAAAGCCCCCGGCGGTGCAAGATGGGCCCGCGTCTGATTAGGTAGTTGGCGGGGTAACGGCCCACCAAGCCGACGATCAGTAGCCGACCTGAGAGGGTGACCGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAAGGATGAAGTATTTCGGTATGTAAACTTCTATCAGCAGGGAAGAAGATGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGCGATGCAAGCCAGATGTGAAAGCCCGGGGCTCAACCCCGGGACTGCATTTGGAACTGCGTGGCTGGAGTGTCGGAGAGGCAGGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCCTGCTGGACGATGACTGACGTTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTA
>URS0001561C6B rRNA from 1 species 
CCTACGAGAGGCAGCAGTGGGGAATCTTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAAGAAAATGACGGTACCTGATTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTCCTGGGTGTAAAGGGAGCGTAGACGGCAGCACAAGTCTGGAGTGAAATGCCGGGGCTTAACCCCGGAACTGCTTTGGAAACTGTGCAGCTAGAGTGGAGGAGAGGTAAGTGGAATGCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACTGTAACTGACGTTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCCTGGTAGTC
>URS0000A47F93 rRNA from 1 species 
CAGAGGGCGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGCGTAGGTGGCCAGCATAAGGCCGCGGTGAAAGTCCGGAGCTCAACTCCGGATCTGCCGCGGCGACTGTGCGGCTTGGGCACTGTAGAGGCAGATGGAATTCCGGGTGTAGCGGTGGAATGCGTAGAAATCCGGAAGAACACCGGTGGCGAAGGCGATCTGCTGGGCAGTGGACCGCAAGGTCCAATAGCCGACACTGAGGCGCGACAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGGCACTAGGTGCTCCGGGGAGCGACCCTTGGAGTACCGGCGCTAACGCATGAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGGCTG
>URS0001DD09C6 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGTTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGCGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGCCGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS0000594F9C rRNA from 1 species 
GCAAGTCGAGCGAACGGACTAGAATCTTGCTTCTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATTTTGAACCGCATGGTTCATAAGTGGAAGACGGTCTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGATAGTTGGTAAGGTAACGGCTTACCCCGGCAACGATGCATATCCGACCTGAGAGGGTGATCGGCCACGCTGGATCTGAGACGCAGGATCCAGACTCCTACTGTAGGCAACAGTAGGGAATCTTCCTCAGTGGGCGGAAGCCATGAACCGAACAACGCCGCGTGAGTGATGAAGGTCTTCGCATCGTAAAACTCTGTTATTAGGGAAGAACATATGTGTAAGTATCTGTGCACATCTTGACGGTGCCTAATCAGAAAGCCACGGCTCAGTACGTACCAGCAGCCGCGGTAATAGGTAGGTGGCAAGCGTTATCCGGAATTATTGGTCGTAAAGCGCGAGTAGGCGGTTTTTTAAGTATGATGTGAAAACCCACGTCTCATCCGTGGAGGGTCATTGGAATCTGGAAATCTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGCAGAGATATGGAGGAACACCGGTGCCGAAGGCGACTTTGTGGTCTGTATCTTCCTCTGATGTGCGAAAGCGTGGGGATCAAACACGATCAGATTCCGTGGTAGTGCTCGCCCTAAACGATGAGTACTAAGTGTTAGGTGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTC
>URS000230E4F6 sRNA from 1 species 
GACCAATATGATCATCACAATAAATTAGTATACGCAGTAAGGAAAGTGACCGATGATCAAGTATATCACTTCGACTCTAATCAAGGAAAACACAATAAAGTAGTTTAAGCTACCGGCTGTAGCACTGAGAATTCTTTATTAAGAAAGAGGCATTATTTAGCGTTCTCTTTCAATCCACTTCAACTTGCGAAATATCTCTTAACAATCTCAATTTTTTCTTCTTTTGTAATAAAAACATACCAGATGTACCAAATCCAATCCTTGGATGCATAATTTGCTTGAGGGTGGCATAATCTTCAGCCTTAATCAATTGTGAAACTTCATTCCTCGTAGTTTCATCCTAATGCGTTCAATCTGTTAGTTCCACAGTACTTCCATAGTAAATATAGTCCTAATACTTACTTGATCTAATTTGAACCACTCATCTACTAATTCTTGCAAAATCGGATCCATCTTGCCAAATGGGAATTGTTACCATTTGTTTGCTACACACACAATACACGTATCTCATCACCTCGTTTAACGCGTCCTTACGCCGTGGTATTTCGTATCCGTTTTCTTACAAAAATGATTTTAATAAAATAGACTCAAAAACAAAAAGTAGTAATAATATTATACTCATGACCTCCAATTATTCTAGAGAATTTCTTAAAACATTAGCTGCAAAAAGAAGCCTAGTAATTTGAAAGCAGCAGTTAATTACGATATATACCGCTTACAAAAAGGAGAAATTGGAAGAATTCAAGACCTGACGTCAATTCGCAAGCTGAATCGTTTTAATTAATAGGCGTCGGACAATGGGATTCACTTAGGCTTGGCGACGTTCTTGTCTAAAAATTGCTTGTCGGAATGTGTCATTGAACCGAAAAGGTTTGAAGCTCTTGACTAATAAACAACAGTAACTGATGTTAACTTTTTATAGAATATCCCAGGTTTCAATTCAACACGTTTATTCATAAATCTCAATCTATGTTATGCAGATGAGATTGAAAATCAATACCATCAAGTACAACTTCTCTAAACTGAACGGGTTAAGTATGGAATGGTTTAAAGTTTTAAGTACTGGATCACTCCAAGCTTTGAGATACGATAAGAAAATTAGTGTTAGTACATTTGTGGCTTTAATCACACCTTTTCCATAACCAGGAACTAAGTTTTCAAAGATCTACTATTCGATGATGAAAAAATAGCATTCATAAAGTTGATAACAGCATACATAAATGAAACTGAAATATTGAGGAGGTAAGGCAAACATGATGACCATAGTTTCAATTGACTATGTAATACGTACTATGGCTCATTAAAACCTATCAAAGAAAGAGAAATACGAATAAGAGGAAATTCAAGCCTGTTTAGAATGAGAAGAGAATAAAGATTGGGTTTTGGCGAAGGATACGCTGTTGCATTAAAACAGCCTTAAATAGGTTCTATAAATGGTTAGCATGTAAAAAAAATTAAAATTGAATCATGAAAAAATATTAAAAAATAATAAAAAAACCTACCACTTAAGAGCTTGTTCAAATTGTTGAGACGAGAACCAACACTGACATCAAGAATATTATCACCAATTTCAACAAT
>URS000119B5B9 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGCGTGGCGGACGGGTGAGTAATGTCTGGGTAACTGCCTGATGTAGGGGGATAACTACTGTACACGGTAGCTAATACCGCATACCATCGGATGTGCCCAGATGGGATTAGTTAGTAGGTGGGGTAAAGGCTCCCCTAGCCGACGATCCCTAGCTGGTCTGCCAGGATGACAAGGCAAACTGGAACGGAGACACGGTCCAGACTACGACGGGAGGCAGCAGTGGGGAATGTGGAACAAGGGACGCAAGCCGGATGCAGCCATGCCGCGTGGAGGAAGAAGGGCGTCGGGTTGTAAAGTACTTTCAGCGGGGAGGCGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATAC
>URS00021073CB rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACGGACGAGAAGCTTGCTTTTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATTTTGAACCGCATGGTTCAAAAGTGAAAGACGGTCTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGGGTAGCCGGCCTGAGAGGGTGACCGGCCACAATGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATAACGGCCTTCGGGTTATAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAGTGGGTAAAGAAGCACCGGCTAACTACGTG
>URS0000A0DC81 rRNA from 1 species 
TAGTCCACGCCGTAAACGATGGATACTAGCTGTATGTCTACTTCAGGTAGATGTGTGGCTAAGCGAAAGTGATAAGTATCCCACCTGGGGAGTACGATCGCAAGATTGAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCAGGGCTTAAATGTACGTTGCATGATTTAGAGATAGATCTTTCTTCGGACTACGTACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCAGGTTAAGTCCTATAACGAGCGCAACCCCTATCGTTAGTTGCCAACAGGTTAAGCTGGGAACTCTAACGAGACTGCCTGTGACAAACCGCGAGGAAGGTGGGGATGACGTCAAATCATCACGGCCCTTACGTCCTGGGCCACACACGTGCTACAATGGCCGGTACAGAGAGCACGCCACTCCGCGAGGAGGAGCGAATCTAATAAAACCGGTCTC
>URS0000C91A8A tmRNA from 1 species 
CAGGTTTATATCCATTACAAATAGACTTATATTCGTGCTGCCGGCTTGCCGGCTATAGCGCTAAACGGTTTGCGGAATAAGCGTTGCGGACCCGGGGGCGGTACCCGGCGCCTCCACCAGTTTTGTGGCTTTCAATACATCACTGGGGTATTTTTGGGGGCGAAACAGGATCGACGCGCGTGGTAAAGGCAGACTTTGTGCTCGGCATGGTACCACCGTTATCGGGCTATAGTCGTTAAATGCCAACGACAACTTTGCGGGCGAAGCCCGCCTCGCTGCTTAACTTAGGTTAGGTAAGCGCGGTTCGGGGGGCACCGGGCAACAGAAGCCCCCCACT
>URS000232319A pre_miRNA from 1 species 
GGGGGGAGGTCGGATTCTTGGCTATGTCCCCGGCGCCCTGTGCTCCTGGGCCTGTGCTGTTGGATTCGTGCTCCTGGCCGGACAGCCCCCT
>URS000259C9B7 misc_RNA from 1 species 
GTGAATCATCGAATTTTTGAACGCAAATTGCACTCTCTTCTGTGAGTATGCCTGTTTGTGGTTCAGCCTAAGAAAAATCGACATATTCGCTGTTTCGCGGTTTCTTTCGTTTGCAGTTTTGTCATCTTAAACCTTTTTGTTTTAAGCGGCTTAAAATTTTCTTTACGTTTCCACTAACTTTTCTAACATTTACTTACTCTTTTAATGTATCGATCTTTATTAGACGTGGCCGTTTCATCGGATCGCGTCCATATATATTTCGTTAACTTA
>URS00009D7A85 rRNA from 1 species 
GATGAACGCTAGCGGGAGGCTTAATACATGCAAGTCGAACGGTAACAGGTCTTCGGATGCTGACGAGTGGCGCACGGGTGAGTAACGCGTACGTATCTACCTTGTACACGGGGACATACACTGGAAACGGAGTAAATACCCGATAGTCTGGAAACAGTAAAGCTACGGCGGTACAAGATGGGCGTGCGTCTGATTAGCTAGATGGTGAGGTAATGGCTTACCATGGCGATGATCAGTAGGGGGCGTGAGAGCGTGATCCCCCACACGGGTACTGAGACACGGACCCGACTCCTACGGGAGGCAGCAGTAAGGAATATTGGACAATGGGCGGAAGCCTGATCCAGCCATCCCGCGTGTAGGATGACTGCCCTATGGGTTGTAAACTACTTTTATATGAGAAGAAGCGCCTTTCTGCGGAAGGGTTTGACGGTATCATATGAATAAGCACCGGCTAACTCCG
>URS0001E0D339 rRNA from 1 species 
TACGGAGGGTGAGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGCTAGATGTGAAAGCCCCGGGCTCAACCTGGGATGGTCATTTAGAACTGGCAGACTAGAGTCTTGGAGAGGGGAGTGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACATCAGTGGCGAAGGCGTCTCCCTGGCCAAAGACTGACGCTCATGTGCGAAAGTGTGGGTAGCGAACAGG
>URS000061A91B rRNA from 1 species 
TAGGGTTTGATCCTGGCTCAGAACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGATCCCTTCGGGGATAGTGGCGCACGGGTGCGTAACGCGTGGGAACCTGCCCTTAGGTTCGGAATAACTCAGAGAAATTTGAGCTAATACCGGATAATGTCTTCGGACCAAAGATTTATCGCCTTTGGATGGGCCCGCGTTGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCATAGCTGGTCTTAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCCTAGGGTTGTAAAGCTCTTTTACCCGGGATGATAATGACAGTACCGGGAGAATAAGCTCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGAGCTAGCGTTGTTCGGATATACTGGGCGTAAAGCGCACGTAGGCGGCGCCGTAAGTCAGGGGTGAAATCCCGGAGCTCAACTCCGGAACTGCCCTTGAAACTGCAGTGCTAGAATCCTGGAGAGGCGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAANGCGACTCGCTGGACAGGTATTGACGCTGANGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGATAACTAGCTGTCCGGGCTCAT
>URS00023F57E9 lncRNA from 1 species 
GGATCTGAATCCTAGACCCTTTTAGAACGCCAGGGTCGTAGCCTTTCCGCCAAGTCACCGGAGGAGAACCCATTCCCCCGCCCTTCTCTCCACCGGCCTCCTGCTCCAAACCTCTCTGCTCTGCGCTCTGGGCGTCACCCACTCGATCGATATGAAGAGGCCGAGATGTGTTCTTCTTCCCGGGATCTCGATTTTTCGTCTCGTCCTCATTTCTTGCGTCTTTCTGTGCTCTATTCCTAGTAAAGCAAACCAATTCTCTTCTTTTTCTTTAAAAAAATGTTATTTGTAAATATTTTGCATGGATTTCCCTCTTATTTAAAGACAGGAAAGAGAATAAATTGACTGCATGCATTTGGAGAAGTCTATCAAATTTTCTTGGGAACAGTTGGGAGATTTCACAGGTTTCTAATTCATATCGTGAGAGAGAGTAAGAAAGGATAGAGGTTGGAAACTGCTAAAATCTAGTTGAATTTTAGATATGATTTGCAGGAGTAACAGAAATAATTAAGAAAATAAGAGTTGGCTGCCAGTTTGGATAATAATGGTAAGAGGACAGGTTTTGTTTAGGATAGGTGTGAAATTATTATCGTTCATCAGATTCTTTATTGTTCATGAGTTTTTTTCTCCTCCGAAAAAAAACTTAAATATGAGCTGGAGGGTGTTTCCTAGGTTTGTTTTTTATGAATTGTTTTTCGTTTTCTTTGTGCTATTGCAATGGTTGATTTTGTCCCCCAATTGCAAATACATTATTTTCAGTTCCTTGAAAATTAATATAGGAATTTGAAGCAATGAGTCAGAAAATGAAGATCAGCTAAAATTTTTTGGAGCATGCTTTTCAGAGTCAAAGCATACGACTATGCATGTTGACCTACAGTGCTTGATTGTTGCATGGGTAGTTTCTTTACCTAGAGAAATTTGTGGCTTACTATATCAACTACAAACATTATGGAAGTTACATCCAATCCAAGAGAGAGAGAGGGGTCATGGAATACTAGGAAACATTTGGATATTGAGTTATAAAGGAATTTGTGGTAGTTGATAGAATAGACGAAATAATTCAGTGCAAATGGAAAAGGATATTTGCTTTTATTTTTTTTTGTTCTTGCCATATGTATCTGTTGATTTATTAAAAGGTTAAAATTTGCAAGCACAATAAAGATTCATGGTTCGTGTGGTTTGATATCTTTCCATAAAATGCTCTCAAGTTGTCAACTTTAATAGTATTGGCTTCTATGATCATGGGTGAAGGTTTTAGAGTTTTCAGATTGGGG
>URS0000642F76 tRNA from 1 species 
GGTGGCTCAGTGGTAGAGCGCTTGCCTTGCATGCATGAGGCAGGCCCTGGGTTCGATTCCTCAGCACCA
>URS0000D63273 lncRNA from 1 species 
CTGTCACTTAAATCTTTGAGCTGTGTAGCCCACAAACTATTGCTAGAAACCAATGACGTTGTAAAGCAACTTTGAATTGGGCTTCCAGGTGGTGCCTGTTAGAAGGGCCTAAGAGCAAGGCATCATGGGAGACCGGGCGCCATGAATGTCTCGCTGTCGACTGGGAGGTTGCAAAGCGGCTGCTGCTGTTTTCCTTCCAATCCCGGAGCCAGCTGTCTGGCCCACAGCTCCAGATATATCAAGATTGAGACACATTTCCAAGCACCAAGAGACTGCTGGGATCTCTCTCTGAATTGGTACCTAAGTACTTTGGCCACCTCAAGCGAAGAGTTGACTGATTGGAAAAGACCCTGATGCTGGGAGGGACTGGGAGCAGGAGGAGAAGAGGACGACAGAGGATGAGATGGCTGGATGACATCACTGACTCGATGAACGTGAGTCTGAGGGAACTCTGGGAGTTGGTGATGGACAGGGAGGCCTGGCGTGCTGCGATTCATGGGGTTGCAAAGAGTCGGAC
>URS00007413E9 rRNA from 1 species 
TACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGGCCTTCGGGTTGTAAAGTACTTTCAGTCGTGAGGAAGGTGTTAAGGTTAATAACCTTAGCAATTGACGTTAGCGACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGGGCACGCAGGCGGTTAATTAAGTTGGATGTGAAATCCCCGGGCTTAACCTGGGAATGGCATTCAAGACTGGTTAGCTAGAGTCTTGTAGAGGGGGTAGAATTCCATGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAATACCGGTGGCGAAGGCGGCCCCTGGGACAAAGGACTGACGCTCATGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACC
>URS000236D244 lncRNA from 1 species 
AGGCGGTTAGTGAGGTAAGCGCTAGCATGTAACTCAAGGGATATGATAACATAATGACATGTCCAAAAACCAGTCAAAACCATAATGTACACATTTATATACATATATATAAGTTTTCATGATAGGGAACAAGGTTAAAGCATGAGGTTATCATTAACTTGGACTGTGTAGCTCTAACCATTCTAAAAACACCTATGAGCTATATGGGTCTGGATCACCCCACTGAAAGGGCCCTAGTGTATGTTATCCACATGAGCCAGAGAATTCTAAGGAAAGCCCAGGGAATCTATGACCCTACTCTAATCATACGTATATATATATATATATATCAAATAAGAACTATGCACACAGTCATGAAGGCCCCCACACGGAAAATATGGTTTCTAGTATAGGTCGCCCCTAAGGCCTCC
>URS0002273E9A tRNA from 1 species 
GTTTATGTAGTTTATAAAAACATTACATTTTCAATGTAAAAATAAAAGGAATCTTTTCATAAATA
>URS00015EFEAA rRNA from 1 species 
CCTACGGGTGGCAGCAGTGAGGAATCTTCCACAATGGGCGCGAGCCTGAACGAGCCACGTAGCGTGAAGGATGACTGCCCTACGGGTTGTAAACTCCTTTTATAAAGGAATAAAGTGAGGCAAGTGAGTCTCTTTTATTTGACTTTATGTATTTGGATCGGCTAACTCCGTGCCAGCAGCGGCGGTACTACGGAGGGTCCGAGCCTTGTCCGGATTTATTGGGTTTAAAGGGAGGGTAGATGGGTTGATAAGTCAGTTGTGAAAGTTTTCGGCTCAACCGTAGAATTGCATTAGATACTGGTGGACTTGAGTACAGTAGAGGTAGGCGGAATTCGAGGTGTAGCGGTGAAATGCTTAGATATAACGAAGAACTCCGATTGCGAAGGCAGCTTACTAAACTGCCACTGACGTTGAGGCTCGAAAGTGTGGGTAGCAAACAGGATTAGATACCCGAGTAGTC
>URS00016A3A0B rRNA from 1 species 
TACAGAGGTCTCGAGCGTTAGGCGGAATTACTGGGCGTAAAGCGCGTGTAGGCTGCTCAGCAAGTCGGATGTGAAAGCCCTGGGCTTAACCTAGGAAGTGCATTCGAAACTTCTGAGCTAGAGTTCTGGAGAGGAAGGCGGAATTCTCGGTGTAGAGGTGAAATTCGTAGATATCGAGAGGAACACCGGTGGCGAAGGCGGCCTTCTGGACAGTGACTGACGCTGAGACGCGAAAGCGTGGGGAGCAAACAGG
>URS0001B06EC2 rRNA from 1 species 
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGAAGCTTGCTTCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACCGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCTGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTGAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTC
>URS0000A96D3A lncRNA from 14 species 
CAATTCCCAATGTCCTCTGAAACCTTGAATACTCCTTTCTGCCTTACACACTTCTTCTCACACAGGTCTGCAGTATTCCCTCCAAAATGGCCCAGCAAGCTTTGATTACAGCTTCAAAGTGTTGCTCTGCTAGCTGCCCCCCCTCCCCATTCTTCCAGTCCCTCCATAAACCAGACCTCAAGGCCTGTGGACCAGATGTTCAGGTTTCTCACAGGGAGTGGCCCACTCCCAGGACTAATTATCCATATTAGTGCAAGTTTTCACTGCTTTGAGACAATATCGACACCAAGCGATTTACGGGAGGAAAAGACTTTTGTTTTGTTTCCACAGATTGAGGAGAATGAAGTTCATCATGTCAGGGAAGCCGTGGCAATGGGCGGCTCTGCTGGGCTTGCGTGTCTGTCAGAGAGGAGGGAGATTTGGGCTGAGACCAGCGATAGATTGGTCGAGCGCGGGAAGAAAAGGAAGAGGAGCGAATTAAATAGGAGCGCCG
>URS0001F14516 rRNA from 1 species 
GATGAACGCTGTCTACAGGCTTAACACATGCCAGTCGAGGGGAAACGACGGGGAAGCTTGCTTCCCCGGGCGTCGACCGGCGCACGGGTGAGTAACGCGTATCCAACCTGCCTCTGACTGAGGGATAACCCGTCGAAAGTCGGCCTAATACCTCATGGCATCGTCTGCGGGCATCCAACGACGATTAAAGATTTCATCGGTCAGGGATGGGGATGCGTCTGATTAGCTTGTTGGCGGGGTAACGGCCCACCAAGGCTACGATCAGTAGGGGTTCTGAGAGGAAGGTCCCCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGGGAGCCTGAACCAGCCAAGTAGCGTGCAGGATGACGGCCCTATGGGTTGTAAACTGCTTTTATGCGGGGATAAAGTGAGGGACGTGTCCTTCATTGCAGGTACCGCATGAATAAGGACCGGCTAATTCCGTG
>URS000021B5FE rRNA from 1 species 
GAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCATGATCTAGCTTGCTAGATTGATGGCGAGTGGCGAACGGGTGAGTAATACATCGGAACGTGCCCTGTAGTGGGGGATAACTAGTCGAAAGATTAGCTAATACCGCATACGACCTGAGGGTGAAAGTGGGGGACCGCAAGGCCTCATGCTATAGGAGCGGCCGATGTCTGATTAGCTAGTTGGTGGGGTAAAGGCCCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTCCGGGTGTAAAGCACTTTGTCCGGAAAGAAATGGCTCTGGTTAATACCTGGGTCGATGACGGTACCGGAAGAATAAGGACCGGCTAACTACGTG
>URS0000E81CC4 lncRNA from 1 species 
TTCCAATTTCTGTCTTGCGTCTCTGTCCACTTCACACTACTCGTCTATAACTGCCAGTGTTGGAGGAAGCAAGTAAAGGAATAGGGAAGGCCTTACAATTTAGAGTATGAAAAGTATGACCCCCAAGCTGATTATGAGGATCATCTCTATCTCTCATCATCCCCACTCTGTTAAGTGACAAAGAATTTTAGGGGAGTTGTAATTCATGGCACCTGAAGGATCAGAGGAGGAAAAGGAGGAAGAAGGACATTTGAATTCACTTACTTCAGAGAGAAAATGGTTTGAAAACTTCCTAGGCACTAAGAAAGCTTTCAGTGACATCCTTTACCCTTGGAGGACATGCTGCCAAACTCTGAATTCATGGAACATTTATATGGTTCCATTAATTACAAATTAATATGACCTGTACATGGAGTCAGTCTGGAGCATCTCAAGGTAT
>URS00004DE10A rRNA from 1 species 
GAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTTTCGGGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGGGTGATCTGCCCTGCACTCTGGGATAAGCCTGGGAAACTGGGTCTAATACTGGATAGGACCATGGGATGCATGTTCTGTGGTGGAAAGCTTTTGCGGTGTGGGATGGGCCCGCGGCCTATCAGCTTGTTGGTGGGGTGATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGTGTCCGGCCACACTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGGGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGTATCGGCGAAGCTTGCGGGTTTTCTCGCAGGTGACGGTAGGTACAGAAGAAGCACCGGCCAACTACGTGCCAGCAG
>URS0001FF2370 rRNA from 1 species 
GACGAACGCTGGCGGCGCGCCTAACACATGCAAGTCGAACGAGCGAGAGAGAGCTTGCTTTCTTGAGCGAGTGGCGAACGGGTGAGTAACGCGTGAGGAACCTGCCTCAAAGAGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATAAGCCCACGGTGCCGCATGGCACAGAGGGAAAAGGAGCAATCCGCTTTGAGATGGCCTCGCGTCCGATTAGCTAGTTGGTGAGGTAACGGCCCACCAAGGCGACGATCGGTAGCCGGACTGAGAGGTTGAACGGCTACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAATCCTGATGCAGCGACGCCGCGTGGAGGAAGAAGGTCTTCGGATTGTAAACTCCTGTTGTTGGGGAAGATAATGACGGTACCCAACAAGGAAGTGACGGCTAACTACGTG
>URS0000F8DDB5 rRNA from 1 species 
TACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGTGGTTTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGGAAAGTGGAATTCCAAGTGTAGCGGTGAAAATGCGTAGAGATTTGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACACTGAGGCGCGAAAGCGTGGGGAGCGACAGGA
>URS0001627BDD rRNA from 1 species 
CACGGGGGGAGCAAGCGTTGTTCGGAATCACTGGGCGTAAAGGGCGTCTAGGCGGTCAGATAAGTGGGATGTGAAATGCCCCGGCTCACCCGGGGACCGGCATCCCAAACTGTCTGGCTTGAGTATGGGAGAGGATGTGGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS0002226441 misc_RNA from 1 species 
AACAAGGCGTACCTGCGGACCTGCGGAAGGATCATTACGAGAGTGTCACCACTCCCAACCCATTGTTTACCTACCCGTCCACCGTGCTTCGGCAGGCAGCCCTGTGGGACAGAGCCTCGCCCCCTTTCGCGGGGGGTGCCTGCCGCTTGCCAACCAAAACTCTAGCTGTTTTAGTACCATCTGAGTCTTCCACAAATGAACAAAACTTTTAGCAACGGATCTCAGATCGGAAGAGCACAC
>URS00002E10EA rRNA from 1 species 
AGGATGAACGCTGGCGGTCTGCTTAACACATGCAAGTCGAACGGAGTAGCAATACTTAGTGGCGGACGGGTGAGTAACGCGTGAGAATCTACCTTCAGGACGGAGACAACAGTTGGAAACGACTGCTAACCCCCGATGTACCGAAAGGGCAAATATTTATAGCCTGAAGAAGAGCTCGCGTCCGATTAGCTAGTTGGAGAGGTAAAAGCTCACCAAGGCGACGATCGGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAAGACCGCGTGGGGGAAGAAGGCTCTTGGGTTGTAAACCCCTTTTCTCTGGGAAGAACACAATGACGGTACCAGAGGAATCAGCATCGGCTAACTCCGTGCCAGCAGCCGC
>URS000137F4FF rRNA from 1 species 
CCTACGGGTGGCAGCAGTGAGGAATATTGGTCAATGGCCGAGAGGCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGCCCTACGGGTTGTAAACCTCTTTTGTCGGGAAACAAAGCGAGTCACGTGTGCCTCATTAAGAGTACCCGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGAGGGATGCGAGCGTTATCCGAATTTATTGGGTGTAAAGGGTGCGCAGGCGGAGGTGCAAGTCAGTGGTCAAATTGCGGGGCTCAAACCCGTACTGCGGTTGATACTGCATCCCTTGAGTGCGCGAGAGGTATGCGGAATGCGTGGTGTAGCGGTGAAATGCATAGATATCACGCAGAACTCCGATTGCGAAGGCAGCATACCGGCGCGCAACTGACGCTCATGCACGAAAGCGTGGGTATCGAACAGGAGTAGATACCCGAGTAGTC
>URS0000A3AF07 rRNA from 1 species 
TACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGTCTTTTAAGTCAGTGCTGAAATACTCCAGCTTAACTGGAGGGGTGGCATTGATACTGGAAGACTTGAGTGTAGTCGAAGTAGGCGGAATTGACGGTGTAGCGGTGAAATGCTTAGATATCGTCAAGAACACCGATAGTGAAGACAGCTTACTAGGCTACAACTGACGCTGAGGCACGAAAGTGTGGGGATCAAACAGG
>URS00010B2DDF rRNA from 1 species 
TACGGGGGGAGCAAGCGTTGTTCGGATTTACTGGGCGTAAAGGGCGCGTAGGCGGCGTGACAAGTCACTTGTGAAATCTCCGGGCTTAACTCGGAACGGTCAAGTGATACTGTCGTGCTAGAGTACAGAAGGGGCAACTGGAATTCTCGGTGTAGCGGTGAAATGCGTAGATATCGAGAGGAACACCTGCGGCGAAGGCGGGTTGCTGGGCTGATACTGACGCTGAGGCGCGAAAGCCAGGGGAGCGAGCGGG
>URS0002390407 lncRNA from 1 species 
GACAAGAAAACAAGGGGAAAGAAGTACCTAATGAGATTATGAAGGAAGAAACTGACCGTGGACTTGCACAAGACCGACTGGACTCTGATTGCTTCGAGGTGGGTAAAAAATTACATTAAGAAATCGTCCCTACTAGGAACGATTAGTTAATGTAAATTTTGGGCTCAACTCGTACCTTGAATCCAAAATTTTGGATTTGGAATTAACGGAATTGGGCAGGTTTTTTGGGGGAAAGGTTACTAAATTGGTATAAAGGGGAGGGTGGAGAGTGTATATGGTGAACTTGGGTTAGTTTAGAGGAGTTATGATTTTTGGTTTGAATCTTAGATCCGAAATATGAGCAATTTAGCGGGGATTTGGGAAAAAATAATTGGGGATCTAGGATGAGGAGGGGGTGAGGAACCGCCATAGGGCGATTTCCAAAAACTAATTTGGAGCATGGGAACCGTCGTGGGGCGATTTTCGGCGGGTGATTTGTGGCGAGGCAGCAGGGGAAATCCTAGGCGGCTAGAGTTTGATCTGTTTATAGAGATGAGAGTAAAAT
>URS000226779B rRNA from 1 species 
AAACTGGAGAGTTTGATCCTGGCTCAGAACAAACGCTGGCGGCGTGCTTAACACATGCAAGTCGTACGAGAAAGTCCGCTTCGGCGGATGAGTAAAGTGGCGCACGGGTGCGTAACACGTG
>URS0001472A94 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGAATCATTGGGCGTAAAGCGCGTGTAGGCGGTCCGGTAAGTCCGCTGTGAAAGTCGGGGGCTCAACCCTCGAATGCCGGTGGATACTGTCGGGCTAGAGTGCGGAAGAGGCGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGAGTGGCGAAGGCAGGTCTCTGGGCCGACTACTGACGCTGGAGAAGCGGAAAAGCATGGGGGAGCGAAACGGG
>URS00006461F6 tRNA from 1 species 
TCCCTGTTGGCTCAGATGGTAAAGCATCTGCCTACAATGCAGGAGAACCAGGTTTAATCCCTGGGTCAGGAA
>URS000199F6C3 lncRNA from 1 species 
GGAACCGCGGGCACGGCGGGGCAGGGAGCGCGCCCGGGGCTGGGAGACTCAGGGGCGGGGCAGCCCCGGGACAGCGCCGGGACAGCGCTGGGATTGGACTGGGATAGCCCGGGACAGCGCCGGGACAGCGCCGGGACAGCGCTGGGATTGGACTGAGGAGGGCCAGAAGGAATGAAATCCATCGTGGCTCAGCCTGGGCTGGTGAAAGCGAGCTGGGAAAGGCAGGAGCAGGGATTCCAGCATTTCCCTGAACCACAGGAAAATCCTGGGAACGGAGAGGAGCAGAGAGGGGGAGATTCCGAATGGGGATTTGGAGCATCCAGCCAGTTTTACTGGGACTCCTTTCAAGGGCTGCCCGGAGCCCCCCGCGGTAAATAGTGCACAGCTCGGGCCAGGAGGATTTCCTCACCGCTGGGACTCTTAATGTCGAAAGCAGAGGTGTCAAACAAGGGGCTCAAAGCCCCGTGGTGGCCCCGGAGAGTTCCACATCTGGCCTGGATCTCGGTGCTTAACACGTTTTAACTCTTGCCCCGAGCAGCTCCGGATTTCCCTCGGCAGCCCGGGTTAGGTTTGATTTAAGAGGCTGCAAGGAAAAGCCAAAATAAAAA
>URS00021F6806 misc_RNA from 1 species 
CGGAACTTCATTTCCCAGCCATGGATGTGGACGTCAATCCCTATCCTGGTGCACGCATTCCTGCTGCCTCACACGCTCGCCCACCAGTGTCGTCTTCACCTAGCGCTCGACCTCCAGCTCACCTCTGCCCTCTCATGCTTGCCGAGCTGCTCTCAGATGGTTGCTCGCGAGTTTCTTCCTCCCCAACACCGTCAGCTTGCCGCGTCTCTGGTCCAGCTCCAGCTCGTCGAGTCCCTCTCTGTGTGCGCCATGCAGCTCGCTCGGCCGCGACCTTGCCGAGCTCCGCCCCTGCTCCACGTCTCCTGGTCGGGCTCTCGTTCTGCGCGTGACGCCGCTGTTCCCTGGTGCTCCCTGCTCGACCCTGCTTCTTCTTCCTTGAGCCTCGCCGTGCGAGTTCTCCCTGGCTCATGTGCCTACCGCCGTCGGCCCCAGTCTCTCGCTCGCAAGGTCTTCCCAAGCCGTCGTCTCCTGCCTCTGGCTGTCAAGCGCGACGAACTCGTCCCGAGCTCGTCACAACGTCTCAGCCCTGCGTGTCGCGCTAGCTCGCGTCTATGGTCGCGTCCGCTGAACTCGCCAACGCCCTGTTGCCAGTCCGACTATCGTCGCTACTGCGTGCCTCGCTGCGCGCTCGTTGGTGGTGCCGTCTGTTGTGCCCCTGCATCCGCCCTTGTCGCTAGTGCCAACTCCGGCCGTCGCGGTATCTGCTCCGTCCTGGCGCCCTGCGCTAGTGCTCTGCTTCCTGGCCCCGCCTGGCCTCCAGCTTGCTCAACAGTACTATCCATTTCGTCGTCATACGTCTCCGCGTCATGTACAATAACGTCGTCGACCATGCCTTCGCCTGCTTTGACGCGTCGAGCTCCTTCCCGTTGTGACTCGCGCACCATCTATTCATCAAAATGGAATACTAATGAGCTCCTCGCGACGCAGTTTCTCTGTGTCGTCGTTCGCGCCGGTAAGATCCACGGTTCTGCTTTGTTCCATTAAATTCTCTTCTAGCACTATTTTGGCTAGGTGTGGATTTATGTGTATATGTGTGGATCTGTAAAGGAAGACGAAAGGGAAGCGCCAGTGCAACTTGTAACACCCCAGGTGTTTGCCTTAAATTAAACTGCAATTATGGATCCTTAAGAAAAATATCAGTTTGGATCACTCGAATTAGCGAATGTAAATTTAGGAAGCACTTGTATTTATAATTCGGACCTCACTAGTTTGGATCGACGTGTATTCAATTCAAATTAAATTTAAAATTAAG
>URS00014751E2 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTTTGTCGCGTCGAATGTGAAAACCCAGGGCTCAACCCCGGGCCTGCAGTCGATACGGGCAGACTAGAGTGCGGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS0001C1925D rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGACCTTCGGGTCTAGTGGCGCACGGGTGCGTAACGCGTGGGAACCTGCCCTTAGGTTCGGAATAACTCCCCGAAATTGGTGCTAATACCGGATAATGTCTTCGGACCAAAGATTTATCGCCTTTGGATGGGCCCGCGTTGGATTAGCTAGTTGGTAGGGTAAAAGCCTACCAAGGCGACGATCCATAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTACCCGGGATGATAATGACAGTACCGGGAGAATAAGCTCCGGCTAACTCCGTG
>URS0001957C9E lncRNA from 1 species 
CCCACATTGTCCATAACAACTGACTGAGGTTCTTGTACCCAGGGCTCTAACCTGAATTTTTTGCCTGACTTTCTGTCTTCCCTAATCATTTTATATTTGCTAAAGTGGGTCTTAAAGACTTGCTTGTTCCTTTCTTACTTTAAATTCTCAACCTCCAAGATTCCTTGTGCATAGATGCTGGGTTATGCATTCCTTTTTCCAATTTTTATTTTGTTTTTCTAAGTGATGCTATTTTACTATCCTTCCATGACAGGATCCCATCAGGCCTCTACTGCACAAATAACAAGAAAAAAAAGAAAAGAAAAGAAAAGAAAGCAAACAAGTGTAATTTGTAAATCTAATATTCTTGCACAAGGAATCCACTGGATATTGTAGGCAATGGCCTTGTCATCTTAGCCACTAGAAGACTCCATCTATCAGAAGCTGGCAATTCTGAATTTTGTACAGCAAGCCGTGAGTATGGAAATGCAAGTAAGAGTTGACATTGCAGTTTTGATTCCAAATTCCATAGCTAAGCAAGTTAGAAACTCAGGTAGTATTTCTATGTTGCAGTTTTGAGGCAGATTCCTCTTCCTTCAGGAAACCTCAGTGTTTGCTCTTTAGACCTTCAGCTAATTGGATGTGACTCACCCACATTATGCAGGGTATCTAGCTTATTGCAGGTCTGCTGATTAAAAAAAGTGCCTTCATAGCATCAAGACATCTTGTTGTTAATGAAACAACTAGATATCATAACCTCGTCAAGTCGACACACACAATAAACCTTCAAAGGAATATTTTATTTAATAACCT
>URS000133998B rRNA from 1 species 
TACGTAGGGGGGCAAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGTCCGGTAAGTCGGCTGTGAAAGTCCAGGGCTCAACCCTGGGATGCCGGTCGATACTGCCGGACTAGAGTTCGGAAGAGGCGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCAATGGCGAAGGCAGCTCGCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGAGCAAACAGG
>URS00011EADB4 rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCGTGTAGGCGGCCATACAGGTCAGCTGTGAAAACTCGAGGCTCAACCTCGAGACGTCGGTTGAAACCGTATGGCTAGAGTCCGGAAGAGGAGAGTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCGGGAAGAACACCCGTGGCGAAGGCGGCCTGCTGGGCAGTTTTGCTGACACTGAGGCGCGACAGCGTGGGGAGCAAACAGGG
>URS0001797414 rRNA from 1 species 
TACGAAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGTAGGCGGTTGTTTAAGTCTGCTGTGAAATCCCCGGGCTCAACCTGGGAATGGCGATGGATACTGGCGAGCTAGAGTGTGTCAGAGGATGGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGAGATCGGGAGGAACATCAGTGGCGAAGGCGGCCATCTGGGACAACACTGACGCTGAAGCACGAAAGCGTGGGGAGCAAACAGG
>URS00012E3FAA rRNA from 1 species 
ATTGAACGCTGGCGGCATGCTTTACACATGCAAGTCGAACGGTAACAGGTTAAGCTGACGAGTGGCGAACGGGTGAGTAATGCATCGGAACGTGCCCGATCGTGGGGGATAACGCAGCGAAAGCTGCGCTAATACCGCATACGATCTGAGGATGAAAGCGGGGGACCGTAAGGCCTCGCGCGATCGGAGCGGCCGATGTCAGATTAGGTAGTTGGTGGGGTAAAGGCTCACCAAGCCAACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGAGACGGCGCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAAGCCTGATTCAGCAATGCCGCGTGCAGGAAGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACGGAGCGAAAAGGCTCTCTCTAATACAGGGGGCTCATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCCGCCGCAGTAAGAC
>URS000218DCF5 lncRNA from 1 species 
TATACTAAACCTCATCTAATAACCCACTCAGGAAACTACATGAAAAAAGTCACTACTGACGTGTAAAGTCATATACATACATACATATATACTAACCTCATCTAACAACCCACTCAGGGAAACTACATGAAAAAGTCACTAATTGATGTAGTAAGATCATATACTACATACATATATACTAAACTCATCTAACTAACCCAACTTCAGGAAAACTAAATGAAAAAGTCCTACTGATTGTAGTAAGTCATATACATACATACATATATACCTAAACCTCATCTAATAACTCACTCAGAACTACACAAAACGAAAAAGTCACTACTGATGTAGTTAAGTTATATACATACAAGACATATATACTAAACCTATCTAAACAACCCATTCAGGAAACTACAAACGAAAAGTCAACTACTGACGTAGTAAGTCATATGCCTACATAAAATAATATACTAAACTCATATAAACAACCCACTCACGGAAACTACAATGAAAAGTCACTACTGACGTAGTAAGTCATATACATACATACATATATACTAAACTCACTACCAACCCACTCAGGAAACTACATGAAAAAGTCACCTACTGACGTAGTAAGTCAATATAACATACATACATATATACTAAACCTCATCTAACAACCCACTCAGGAAACTACATGAAAAAGTCACTACTGATGTAGTAAGTCATATTCATACATACATACTGTATTACATATATGTTAGAAATGAACTAATTTTTTCGACGTATTTGTTCATGTGAATTTTGCAATATAAAGAGTTGTTTCAAATGTGGCGGTATTGAATCTTCTTTTATATACTGTGGATTCATTATGATTATTGGGATACCAATTTTCATAGAATTTGTGGGTATTTGTAAACCACAAGGAAATGTGATATAATTGCCAATGAGACAACTATCCAATGCTGGCAGACAGTTAACATGGGTTGATTCAATGGTTACTGCCTAAGATTTAAGATGAACACTTTATTCATTTATCCAAAAAAGGAGAAAGAGGATGGTTAAGACTTATACAAAAGACTTTTTTAAGTAGTAAAGTACTCCTTAACTAGCACAATAAGAAAAGGCACAAATATCAATTAAAAAAAACTGTTAAATTTTAGTGAAAATTAATTAGCAATTTTAATAGAAATTTTATTTAACATCATGAATCAAAATTTTTAAAAAAAGTAACGCTCATGTATTCTTGTTTAAAAGTATGAACAATTTGTATCTTCCAGGCAGTAGATCTGTTACTCCAGCAGTTAACATCTTCACTGGATGAAGACTTGGCCGATGTTGATGAGTATGAAAGAGGCGTTGATGATGTGAAAAATACGATAAAAACTCCTATCATACCCAGGACTATACAGAAATATTGAG
>URS000051BDF4 rRNA from 1 species 
ATAGCGTATACTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTCTAATCTCTCTTGGGGTTCCTTTTCTAAAGAAATGTGCGACCATTCAAGAGAGATTATCCTCGTGCCTAGCCTTTCTCACTTTCATTAGTCAGGAAGGGGACGCACGTCATTTACTGTGAGCAAAATAGAGTGTTCAAAGCAGGCTTAGGCCATGAATATATTAGCATGGAATAATAAGATAGGACTTGGGTCTATTTTGTTGGTTTGCAGACCGAAGTAATGATTAATAGGGATAGCTGGGGGTATTTATATTCCGATGTCAGAGGTGAAATTCTTAGATTTTCGGAAGATAAACTTATGCGAAAGCATTTACCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGATGATTAGATACCATCGTAGTCTTAACCATAAACTATGCCGACTCAGGATTGGTGAACGTTGATTTAATGACTTCATCAGCACTGTATGAGAAATCAAAGTCTTTGGGTTCCGGGGGGAGTATGGTCGCAAGGCTGAAACTTA
>URS00021995E3 rRNA from 1 species 
GGTTAAGCGACTAAGCGTACACGGTGGATGCCCTGGCAGTCAGAGGCGATGAAGGACGTGCTAATCTGCGATAAGCGTCGGTAAGGTGATATGAACCGTTATAACCGGCGATTTCCGAATGGGGAAACCCAGTGTGATTCGTCACACTATCATTAACTGAATCCATAGGTTAATGAGGCGAACCGGGGGAACTGAAACATCTAAGTACCCCGAGGAAAAGAAATCAACCGAGATTCCCCCAGTAGCGGCGAGCGAACGGGGAGCAGCCCAGAGCCTGAATCAGTGTGTGTGTTAGTGGAAGCGTCTGGAAAGGCGTGCGATACAGGGTGACAGCCCCGTACACAAAAATGCACATACTGTGAGCTCGATGAGTAGGGCGGGACACGTGGTATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTCCTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCCCGGCGAGGGGAGTGAAAAAGAACCTGAAACCGTGTACGTACAAGCAGTGGGAGCACGCTTAGGCGTGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCTGTAGCAAGGTTAACCGAATAGGGGAGCCGAAGGGAAACCGAGTCTTAACTGGGCGTTAAGTTGCAGGGTATAGACCCGAAACCCGGTGATCTAGCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACTTGTGGCTGGGGGTGAAAGGCCAATCAAACCGGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGTGAATTCATCTCCGGGGGTAGAGCACTGTTTCGGCAAGGGGGTCATCCCGACTTACCAACCCGATGCAAACTGCGAATACCGGAGAATGTTATCACGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGAAGAGGGAAACAACCCAGACCGCCAGCTAAGGTCCCAAAGTCATGGTTAAGTGGGAAACGATGTGGGAAGGCCCAGACAGCCAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAATAGCTCACTGGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTAAACCATGCACCGAAGCTGCGGCAGCGACGCTTATGCGTTGTTGGGTAGGGGAGCGTTCTGTAAGCCTGTGAAGGTGTGCTGTGAGGTATGCTGGAGGTATCAGAAGTGCGAATGCTGACATAAGTAACGATAAAGCGGGTGAAAAGCCCGCTCGCCGGAAGACCAAGGGTTCCTGTCCAACGTTAATCGGGGCAGGGTGAGTCGACCCCTAAGGCGAGGCCGAAAGGCGTAGTCGATGGGAAACAGGTTAATATTCCTGTACTTGGTGTTACTGCGAAGGGGGGACGGAGAAGGCTATGTTGGCCGGGCGACGGTTGTCCCGGTTTAAGCGTGTAGGCTGGTTTTCCAGGCAAATCCGGAAAATCAAGGCCGAGGCGTGATGACGAGGCACTACGGTGCTGAAGCAACAAATGCCCTGCTTCCAGGAAAAGCCTCTAAGCATCAGGTAACATCAAATCGTACCCCAAACCGACACAGGTGGTCAGGTAGAGAATACCAAGGCGCTTGAGAGAACTCGGGTGAAGGAACTAGGCAAAATGGTGCCGTAACTTCGGGAGAAGGCACGCTGATACGTAGGTGAAGCGACTTGCTCGTGGAGCTGAAATCAGTCGAAGATACCAGCTGGCTGCAACTGTTTATTAAAAACACAGCACTGTGCAAACACGAAAGTGGACGTATACGGTGTGACGCCTGCCCGGTGCCGGAAGGTTAATTGATGGGGTTAGCGCAAGCGAAGCTCTTGATCGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAATGATGGCCAGGCTGTCTCCACCCGAGACTCAGTGAAATTGAACTCGCTGTGAAGATGCAGTGTACCCGCGGCAAGACGGAAAGACCCCG
>URS0000E9EAA2 lncRNA from 1 species 
CCCATCTCCGTGGCTGAGGGCCTAGGGAGGAGGGAAAATCCATCCTCAGACACACTAGATCCTCAGCGAGACCTGCTGTGGAGAGCATCAAACGGACCGCACGCGGACCCACCTGCCTTCCAAAGTTTGGGGCGTGAGGAAGCTGAGGCACGTGGCGTTTGGTTATGGCACAGCTGAGGGGTCTGCAGGAGACCCCAGAAAATGCCGCTGAGGACGGATTCACCGACGTCATCAAAAGCCGCGCTGGTACTGACAAGACATTGAAATTGCTGCCGAAGTAAATGACTAGAGGAATAGGTAACTCTTTTTATTTTGTAACCTATTATTTTTCTACCTTTCCTAATAAAGAGAGAGAATTGACAAATACTGATTTAGGAACTGTGGGCTAGTCTAATGTGTTGTTGACAGAAGTTGAAGAGGGTAGTGAAAAAATGATCACGAATTATCGCTAAAGTTAAATTCAAAGTAAATTATTTTCTAACTTCAAAACAAAACTTTATAAACATCTCTAGAAAATGTTCTCTTAGTTATGCCCATTTTGTTTACAGTTGATTAGAAGTAGAATAGAAAAATGACAGAGT
>URS0000292678 rRNA from 1 species 
GCCTAACACATGCAAGTCGAACGAAGGCTTCGGCCTTAGTGGCGCACGGGTGCGTAACGCGTGGGAATCTGCCCCTTGGTTCGGAATAACAGTTGGAAACGACTGCTAATACCGGATGATGACGTAAGTCCAAAGATTTATCGCCGAGGGATGAGCCCGCGTAGGATTAGGTAGTTGGTGTGGTAAAGGCGCACCAAGCCGACGATCCTTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTACCCGGGATGATAATGACAGTACCGGGAGAATAAGCTCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGAGCTAGCGTTATTCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGCTTTGTAAGTAAGAGGTGAAAGCCCAGAGCTCAACTCTGGAATTGCCTTTTAGACTGCATCGCTTGAATCATGGAGAGGTCAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTGACTGGACATGTATTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGATAACTAGCTGTCCGGACACTTGGTGTTTGGGTGGCGCAGCTAACGCATTAAGTTATCCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCTGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGCAGAACCTTACCAGCGTTTGACATGGCAGGACGACTTCCAGAGATGGATTTCTTCCCTTCGGGGACCTGCACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGCCTTTAGTTGCCATCATTTAGTTGGGCACTTTAAAGGAACCGCCGGTGATAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTACGCGCTGGGCTACACACGTGCTACAATGGCGGTGACAGTGGGCAGCAAGCACGCGAGTGTGAGCTAATCTCCAAAAGCCGTCTCAGTTCGGATTGTTCTCTGCAACTCGAGAGCATGAAGGCGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCAGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGATTCACCCGAAGGCGTTGCGCTAACTCGTAAGAGAGGCAGGCGACCACGGTGGGTTTAGCGACTGGGGTGAAGTCGTAACAAGGTAGCCGTAGGGGAACCTGCGGCTGGATCACCTCCT
>URS00013010D6 rRNA from 1 species 
TACAGAGGTCTCAAGCGTTGTTCGGATTCATTGGGCGTAAGGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTTGGAGCTTAACTCCGAAACTGCATTCGATACTGCCGTGCTTGAGGACTGGAGAGGAGACTGGAATTTACGGCGTAGCGGTGAAATGCGTAGATATCGTAAGGAAGACCAGTGGCGAAGGCGGGTCTCTGGACAGTTCCTGACGCTGAGGCACGAAGGTCAGGGGAGCAAACGGGG
>URS00004F080A rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACGGACGAGAAGCTTGCTTCTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGTAGCTAATACCGGATAATATTTTGAACCGCATGGTTCAAAAGTGAAAGACGGTCTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACATATGTGTAAGTAACTGTGCACATCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGTTTTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGAAAACTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGCAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACGCTGATGTGCGAAAGCATGGGGATCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAAATCTTGACATCCTTTGACAACTCTAGAGATAGAGCCTTCCCCTTCGGGGGACAAAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTAAGCTTAGTTGCCATCATTAAGTTGGGCACTCTAAGTTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGATTTGGGCTACACACGTGCTACAATGGACAATACAAAGGGCAGCGAAACCGCGAGGTCAAGCAAATCCCATAAAGTTGTTCTCAGTTCGGATTGTAGTCTGCAACTCGACTACATGAAGCTGGAATCGCTAGTAATCGTAGATCAGCATGCTACGGTGAATACGTTCCCGGGTCT
>URS000069B5BC tRNA from 1 species 
GCCTGGGTGGCTCAGTCGGTTGGGCGTCCGACCTCAGCTTAGGTCATGGTCTCATGGTTCATGGGTTCGAGCCCCACCTCAGGCT
>URS000209731F rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTGCAGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGCCTAATACCGGATAGGAGCCATTTTTAGTGTGATGGTTGGAAAGTTTTTTCGGTGTAGGATGAGCTCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGGCGACGGGTAGCCGGCCTGAGAGGGTGGACGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAAGATTGCACAAGGGGCGCAAGCCTGATGCAGCGACGCCGCGTGGGGGATGACGGCCTTCGGGTTGTAAACTCCTTTCGCTAGGGACGAAGCTTTTTGTGACGGTACCTAGATAAGAAGCACCGGCTAACTACGTG
>URS0001E64AC9 rRNA from 1 species 
AGCGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGAACCTTTCGGGGTTAGTGGCGGACGGGTGAGTAACACGTGGGAACGTGCCTTTAGGTTCGGAATAACTCAGGGAAACTTGTGCTAATACCGAATGTGCCCTTCGGGGGAAAGATTTATCGCCTTTAGAGCGGCCCGCGTCTGCTTAGCTAGTTGGTTGAGGTAATGGCTCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCCATGCCGCGTGAATGATGAAGGTCTTAGGATTGTAAAATTCTTTCACCGGGGATGATAATGACGGTACCCGGAGAAGAAGCCCCGGCTAACTTCGTG
>URS0000A2C0F7 rRNA from 1 species 
CACCGCGGTTATACGAGAGGCCCAAGCTGACAGCTACCGGCGTAAAGAGTGGTTAATTCACCCCCACAAACTAAAGCCGAACATCTCCAAAGTTGTAAAACGCACTCGAAGGTATGAAGATCACCCACGAAAGTGGCTTTATAACCCTTGAACCCACGAAAACTAGGGAA
>URS0000BA4FCD rRNA from 2 species 
CGTGGGAATACCTGCCCAGTATGCGGGGGATAACTATCTGAGACTCAGATGCTAATACCGCATAACAACTTCGCCCGCATGGTCCGAGTTTGAAAGATGGCTTCGGCTATCACTTCTGGATGGTCCCGCGGCGTATTAGCTAGATGGTGAGGTAACGGCTCACCATGGCAATGATACGTAGCCGACCTGAGAGGGTAATCGGCCACATTGGGACTGAGACACGGCTCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCACAATGGACGAAAGTCTGATGGAGCAACGCCGCGTGAGTGAAGAAGGGTTTCGGCTCGTAAAACTCTGTTGTTAAAGAAGAACATATCTGAGAGTAACTGTTCAGGTATTGACGGTATTTAACCAGAAAGCCACGGCTAAGTACGTGTCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGTTTTTTAAGTCTGATGTGAAAGCCTTCGGCTCAACCGAAGAAGTGCATCGGAAACTGGGAAACTTGAGTGCAGAAGAGGACAGTGGAACTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCAGTGGCGAAGGCGGCTGTCTGGTCTGTAACTGACGCTGAGGCTCGAAAGTATGGGTAGCAAACAGGATTAGATACCCTGGTAGTCCATACCGTAAACGATGAATGCTAAGTGTTGGAGGGTTCCGCCCTTCAGTGCTGC
>URS00004CE42D rRNA from 1 species 
GATCAGGCTCAGGATGAACGCTAGCTACAGGCTTAACACATGCAAGTCGAGGGGCAGCATGGTCTTAGCTTGCTAAGGCCGATGGCGACCGGCGCACGGGTGAGTAACACGTATCCAACCTGCCGTCTACTCTTGGACAGCCTTCTGAAAGGAAGATTAATACAAGATGGCATCATGAGTCCGCATGTTCACATGATTAAAGGTATTCCGGTAGACGATGGGG
>URS0000251C9B rRNA from 1 species 
GACCAAGGAGTCTAGCATGTGCGCGAGTCATTGGGACATAACTAAACCTAAAGGCGTAATGAAAGTAAAGGTCTGCCTTGCGTAGACCGAGGGAAGATGAGCGGTTTGCCCATAAAGTGGCCGCTCCGCATTCCCGGGGCGTCTCGTTCTCATTGCGAGAAGAGGCGCACCAAGAGCGTACACGCTGGGACCCGAAAGATGGTGAACTATGCCTGGTCAGGACGAAGTCAGGGGAAACCCTGATGGAGGTCCGTAGCGATTCTGACGTGCAAATCGATCGTCGGAACTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCTCCGAAGTTTCCCTCAGGATAGCTGGCGCTCGTTGCGTACGAGTTTCATCCGGTAAAGCGAATGATTAGAGGCATTGGGGTCGAAACGACCTCAACCTATTCTCAAACTTTAAATGGGTGAGATCTCCGGCTTGCTCGAACTCATGAAGCCGCGAGACTCGAATCAGAGTGCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGCTGTGGGATGAACCAAACGTCGAGTTAAAGCGCCTAAATCGACGCTTATGGGATACCATGAAAGGCGTTGGTAACTTAAGACAGCAGGACGGTG
>URS0000A30B64 rRNA from 1 species 
CTGGCGGCGTGCCTAATACATGCAAGTCGAGCGGAATGATGAAGAGGCTTGCTTCTTCTGATTTTAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTACCTTGTAGATTGGGATAACTCCGGGAAACCGGGGCTAATACCGAATAATCCATTTTGCTTCATGGCGAGATGTTGAAAGACGGTTTCGGCTGTCACTATAAGATGGGCCCGCGGCGCATTAGCTAGTTGGTAGGGTAATGGCCTACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGGCAGCAGTAGGGAATCTTCCACAATGGACGAAAGTACTGATGGAGCAACGCCGCGTGAGTGAAGAAGGTTTCGGTATCGTAAACTACTGTTGTAAGGAAGAACACGTACGAGAGTAACTGCTCGTACCTTGACGGTACCTTATTAGAAAGCCACGGCTAACTACGTG
>URS00015CBD71 rRNA from 1 species 
TAGGGAATCTTCCACAATGGACGCAAGTCTGATGGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGACCGTAAAGCTCTGTTGTTGGTGAAGAAGGATAGAGGTAGTAACTGGCCTTTATTTGACGGTAATCAACCAGAAAGTCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGAAGAATAAGTCTGATGTGAAAGCCCTCGGCTTAACCGAGGAATTGCATCGGAAACTGTTTTTCTTGAGTGCAGAAGAGGAGAGTAGAACTCCATGTGTAGCGGTGGAATGCGTAGATATATGGAAGAATACCAGTGGCGAAGGCGGCTCTCTGGTCTGCAACTGACGCTGAGGCTCGAAAGCATGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGATG
>URS0001547F59 rRNA from 1 species 
TCGGGAATTTTGCTCAATGGGGGAAACCCTGAAGCAGCAACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTTCTCAGGGACGATGATGACGGTACCTGAGGAATAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTACTGGGCGTAAAGAGCGCGCAGGCGGTCGTGCAAGTCGAGTGTGAAAGCCCCCGGCTCAACTGGGGAGGGTCACTCGATACTGCTCGACTCGAAGGCGGGAGAGGGAAGTGGAATTCCCGGTGTAGTGGTGAAATGCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGACTTCCTGGCCCGTTCTTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACG
>URS000083C0E2 tRNA from 1 species 
CAGAACATAATTAAATTAGAATGCTGGCTTTGGGGGTCAGTTGTGGGGGTAAGAGTCCCCCTGTTCTGA
>URS0000ABDE67 miRNA from 1 species 
TTTGGTTTGAAGGGAGCCCCT
>URS000003005D rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGGACAGATGGGAGCTTGCTCCCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATGCTTGTTTGAACCGCATGGTTCAAACATAAAAGGTGGCTTCGGCTACCACTTACAGATGGACCCGCGGCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTACCGTTCGAATAGGGCGGTACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGCGGTTCCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGACAATCCTAGAGATAGGACGTCCCCTTCGGGGGCAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATCTTAGTTGCCAGCATTCAGTTGGGCACTCTAAGGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGACAGAACAAAGGGCAGCGAAACCGCGAGGTTAAGCCAATCCCACAAATCTGTTCTCAGTTCGGATCGCAGTCTGCAACTCGACTGCGTGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGAGGTAACCTTTATGGAGCCAGCCGCCGAAGGTGGGACAGATGATTGGGGTG
>URS00020EF123 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCATTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTCGACTTTGGGATAACTTCAGGAAACTGGGGCTACTACCGGATAGTAGCTCCTGCTGCATGGAGGGGGGTGGAAAGTTTCGGCGGTCGGAGATGGACTCGCGGCTTATCAGCTTGTTGGGGGGGTAGTGGCGTACCACGGCTTGGACGGGTAGCCCGCCTTGGAGGGGGAGCGGGCACATGAGGACTGCGATACGGCGCAGTGTGGAACATGGGGCAGCAGGGGGGAATATTACGCAGCGGGCCGGCGCGTAATGCAACAACGCCGCGTTCGGAATGACCGTCTACGGGTTGTAAACCGCTTAAGCCTGAGACGAAGCGTGATTGACGGTAACGGGTAAAGAAGCACCGGCTAACTACGTG
>URS00000CB0F4 tRNA from 1 species 
ATTAAAGTGGCAGAGTAGTGCATTAGATTTAAGCTTTAAACATAGAGAAGTTCTCTTTAATA
>URS0000AF4368 rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAAGATTTATCTTAGTGGCGAACGGGTGAGTAACGCGTGGGAATCTGCCTTTCAGTGGGGGATAACTCAGAGAAATTTGAGCTAATACCGCATACGACCTTCGGGTGAAAGATTTATTGCTGAAAGATGGGCCCGCGTTAGATTAGGTAGTTGGTAGGGTAAAGGCCTACCAAGCCTACGATCTATAGCTGGTTTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGAAACCCTGATCCAGCAATGCCGCGTGAGTGAAGAAGGCCTTCGGGTTGTAAAACTCTTTCAATGGGGAGGATGATGACGTTACCATAGAAG
>URS000012F352 misc_RNA from 1 species 
TGTACTCGATCCAGAATCATTCCCAAAAGGTCGGAACGAGGTATGTGGCTTTCAAACTAGGTTCTGGGTTCATAAAAGACCTGAATCAGGAACAAGGGATATTAGCTCAGGTGGTTAGAGCGCACCCCTGATAAGGGTGAGGTCCCTGGTTCGAGTCCAGGATGGCCCACCTGCACAGGTGGCAAAAACAAAAAAAACAAGCGAGGAATCCCCACCTTATCTTACTTATATAGTAAGAAAGAATGCTGGCTCTGAGTACAGAGTCCGAAGGAACCTTGAAAACTGCATAGAGCTAGGTGAAAAAGCCAAAAAAAAGGACCGCAAA
>URS000182AB58 rRNA from 1 species 
TACGTAGGGGCCTAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGTTCGGTAAGTCAGGTGTGAAATCTCCACGCTCAACGTGGAGGCGCCACCTGAAACTGCCGTGACTCGAGTCCGGTAGGGGAGTGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGAGAGGAACACCTGCGGCGAAGGCGGGTTGCTGGGCTGACACTGACGCTGAAGTGCGAAAGCTAGGGGAGCGAACGGG
>URS0001D66A4A rRNA from 1 species 
AACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCCCTTTCGGGGGAGCGGCGGACGGGTGAGTAACGCGTGGGAATATGCCCTTCTCTACGGAATAGCCTCGGGAAACTGAGGGTAATACCGTATACGCCCTGTGGGGGAAAGATTTATCGGGGAAGGATTAGCCCGCGTTGGATTAGGTAGTTGGTGGGGTAATGGCCTACCAAGCCGACGATCCATAGCTGGTTTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTAGACAATGGGGGCAACCCTGATCGAGCCATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTCAGCTGGGAAGATAATGACGGTACCAGCAGAAGAAGCCCCGGCTAACTCCGTG
>URS000233F9F7 lncRNA from 1 species 
CAGCTCAAGGCTGTAGGAGGAAGAAAAATCTAGTCCCTGGGGGTACTGATGAATCAGTTGGATGGTGGGCGTTGGACTGTGAATTCCTGATGCCTCTGGGTAAACTCTGGAGGAAATTCTGTTTCATTACTTGCACTCAGCCCTCCTATTTTGTACTAAGGTATTCTTGAATACAAGTGCACCGGCCAAAAAAGTAAACTTACGCATAAAAAGAAAGGCTCTCTTCCTTCCAAGAATGCTGAACACCTTTGAAGTCTCTGTTGCTGCCTCATCTTTTAGATACAATCATTGATTATGTATTTTTGGCATCGTCCTGAACTTTGTTTCATTTCCTTCACAGTTGAATGTGCAGTTGGCTTTGTCCACTCAGTGATGGTCCTTGTGACTGTTCTTGGCTTTTCTGTTGTTTTTCCATCTTTCTATAGGAAGCTTGAGACCGATACTCATCGTTTGCTTTCAGCACCTTAATTTTGCTTTGTTCATTTTTGTAAAGTAAGGGCAAATGGCCACCGGAATGTACAGTGATTAAAGAAGCAAACTCTGTCAAAGATGGTGATTAGTGGCCAGCCAGTCCCTCTCAGGATCACTGTATTAAAAAGTGCTCATTTGCCAGTGACATTTTTTTTTGGTTTTGGTTTTTTTTTTTTTTTTTTTTTTTGAGACTGAGTGTCACTCTGTCGCCCAGGCTGGAATGCAGTGGCCTGATCTCAGCTCACTGCAACCTCCACCTCCCAGGTTCAAGTGATTCTCGTGCCTCAGCCTTCTGAGTAGCTGGGACTACAGGCGCCCAATACCATGACTGGCTAATTTTTTTTTTTTTAAATTTTAAGTAGAGATGAGATTTTGCCATGTTGGCCTGTTTGGCCTTATACTCCTCATCTCAGGTGATCCACCTGCCTCGGCCCCCCAAATGCCAGTGACATTTGTAGGTGGATTCAGATTAAGGTGGGTAGCTTAGTTGAGGCGTCTCAACCCTTTTCTGTGCACTCTCTCAAGATGATTTCTGAACACACAACTATAAGTGCATGAGAACTTAAATACGTGTGCTCTTATGCTAATTATACACAAAGTAAAAGTTTTTTCACAAGGAGAATTTTTTTCTCCAGCAAATAGCTCGCTCACCCTAGGGGTACATACACCCCACTTTAGAGACCCTCAAGTTACAGTGGTATCATTAAACGATCCATAAAGGAGTGGGTTTAAGAAAGCTGATACAGGAACATGTTTGAAATAATACATTTTCTCAAGGGTGTCCTCCAACCATTTTCTTTGATAAATTATATTTCTGCCCATTGTTGACTTGAAATTGTCCTCACCCCTCTACCAAGTTCACCCAGTGTATTCTGAAGGAAAATGAATGAATATGGAAACCTCTCTCATCCTAGGCAGTAGAGCGAGGGAAGCTGCACTGGCTGAGAGGCTGTGGAACCGGATGAAAAAGCAGCCCCTGAGTCCTGTGGCGTTGGCTGTGAGTCGGCCACGTGCTTGCTGTGTGCTTTAGGAAAGTTACTTAATTTCTCTGAGCTTTAGTTTTCTCCCTCATAAGTAGGCTTGCTGTGAAAATGAAGTGAAATCACATTAATCTGCATGAGCATTTAACACGGTGCCTGGTGTACATCAGGGGTGTGACAGTGAGTGCTGGCTGCTGTAGTAATTGAATGCTTAGCTACGTGCCGGGCCCTTTGCCAGCTACAGCTCATGTGAGACCTCATGTTCAGTCTTGGCAGTAACCCAGCAAGGTAGGCATTTTACATGTGAGGAGCCTGAGAAATTCAGTCTTGGCCTGGATCACAGAGCTGGTATCCAAATTCAGGTCCGAGGCCAAAGCCCAGATCTTTGCACTACACCTTGTTGCCTGGCACAGGTGAGAGTGCCCAGCCCATAGTGGGTGCGCAATATCTGTTTCTATTTGAATGACCCAGGCAGGCGGTTAATAATGCTTGTGATTTCTTTGAGAGAGAAGTAAGTTCTTGTCTTTGGTGGGGGAAGCATCAGGTGACCAGCATTTGTCCAGAGCCTGGTACCCATCCTCTCCCAAGCCCAATCAGTGGTGCTTTCTCAAAAAGAAACCATCTCCTGACCACTTTGGCCATATTGGGCCTTTGCTCCTCTTCTGTAGCTATTGATAAGAGGGCTGTGGGCAGTTAGTGATAATCAAGGTCGTATCCCAACTAAGTGACAGAGCTGAGACAGTTAAGTTCCAGGACAAGTGTGTTGATCTCTGTACCCACTTGTGCCAGGTGCCTGGGGAGGTAGGGGCATGGCTGTCTGAGGGTGGAGGGGTGAGTAGGGGGCCTGCAGTGTGCTGTGACGCCTGGGAAGGGGATTCTAAGCCATTTCCCATCAGCCGTTTACTAAGTAGCCTGGGGATCTTGTTAAAATGCAGATCCTGATAGATTAGGGCTGGGGTGCTGCCCAAGATTCTACATTTCTAAGAGTCCCTGGATGACGGTGGCATTCACAGACCACAGCTTCTATGTGAGGGAGAGCAGTTGGGTTTCTGTCTGCCTGCCGCACCTGATCAGTAGTTAGTGCCTGCATGTGTGGCGGCCAGAATTTTACTTGGGGAGACGCTCGGCTCCTAGCACCCTCTGTGGTAGGGGTTTTCCAGAGTGTGGGCATTACCCCAACTGTCTCTGCAGACGGCTTCCTGCATGTTTCCCACAAGCGCTCAGATGGCTGAATTGGCAAGTCTGTGGTGCTGCTCTTTGGGGCCACCTCGTTCTTTGCCTTTCCCTCCCCTTAGCGATGTGTCCCATCCGTTGCCTACAGTCAAGTCAGTCCACATGTTTAGGCTAAGGTGGGCATGACCGAGTGGCCTTCCCCCGGGAAGACCAGTGTCGTAACTGGAATTAAGTTGTGGAACATAAGAGTCAAGGCTCGTGTCTGCTGTGAACTGGAGTTGAGGGAATGTTTGGGGATCCCACCTGGTATCAGTAAGGGAACCATGGCGACGGCCAGCCTTGCCCATGTGAGGCATTTGCTTTGTCAGGCCTTCTCAGTAGTGGAGAAGGGAGGAAGGAGAATGCAGCTCTTTCAGTGCTGTCTAGCAGTGCCCAAGAGCCGTGATTGGGCACCTCACTTAACGTCTAACTTCAGATTCACTCTTGGGCATTCCTGTCTTCCTCTCCAATCTTGAATGGATGTTGGCTTCGATAATGTCATCCTGAAGTTTCTTTGTCCACACAGCCCTGGCTGGTTGTTAATAAGCTGTTAATGCAGCCTTGCACTCAGGAAGCCCTGATGTTTAAAGGAACTGTGTCTTTGTTCTTCCTCTCTTCCCTCTTTCTCTTAGTCCCACTTTATCTCTTCTTTCTCTTCCTCTCCCTCCTCCTTTTCCCCTCTCCCTCCTACTCTCCCCCTTTCTCTCCTCCTTCTCTAAGAAACCCAGTCTTAATTCCACACAATGCATGCACATGCAGTAGCTTCTCTGCTTGAGTGAGCTGGTGTGATTAGGTTTTCTAAACATGCACATTGGCCTTGCTACTTGTCCTTTTATTCCCTTCCCACAGACCATAAACCAAGAATTATTTTTATTTGTATTATTTTGATTTTTTTAAAGTAAAATATTAACTTTTCCTCTTTGAAATAAATTCCCATTTGGAACATCAGCATACAGTTTGAACATTTATTCGCCTCCTGAGCTTGTACAACAGTCGTGGGAGTTGCTGCAGAAGCAAGCGAAAAGCCAGATGAGCGCTTCTAAACTTAGAGAGAGGGAGAGCGCCTCATCTCTTCCATTTTCCAGGTATTCCTGAGATGATTTATTGGAGCTCAAAGCTTTGGGAGAGTTGGGGCCTTCCATTCCCTCCAGTAAATACTTGTTTTTCTTCCACCGCTGAGGCAAATGCGGGGTGGCTGATCACCTGGCAGACATCTTAGGAAACAGGAGCACCGGTCTGGGAAACTGCTGGCCTGGCCTAACACCTGGCGCTGTGGTGCAGGCAAGAGGGCAGCCACTGAGGATTCTTGAGGAGAGAGAGACCATAGAATGAATGAAAGAGTTGGAAAGACTTTAAAGCTCTGGGAGGCTGAATCCTTTATTTCGCTGGAAGAAAAACTGAATGCCAAGAGGGCCTCACTTTCCCCAAAGCTATACAGCCATCAGGGGCAATGCTGGGATTCCCCCATGGATCTCTTGACTCCTAATACAGTGCTCTTTCTGATATGCCATCTGGCTCCATAATGAACATTGTGTTCCAGGAAAATCAGTCTGCGCTGAACAGGATGGAATTGGGGCAGGACGTCCAGTGAGGAGGACATTGAGGCAGTAGAGCAGTTGATTGCCGAATGACCACCTACCCTGACTTAAAAGATCAACCTCAGGGAGGATTGGAGCTTTCTAGAGTCTCTTGGGACAGCAGAAGCACAGGCCGGGTTGGACTGAATCTTTAAGTGGACATGAGGGACAAAGTACCTCCTGTTGGTAAACATCTCACCACCAACCCACTGTGGTGGCTAAAATCCCACCTTTAGTCCCAGCAACATATGAGCATGTCACCAGGAGGTCTTCACAGGCCTGTCTGCCACCTGAGTGTAGACATCTTTTGGCCCTGGAGCCCAGAGAGGCTGAATGTGGAGAGGGTGGAGAGAGGTCTGTAGTCCTCAGAGAAGACTTGCAGCTTTTTCAGAGCCACCAACCCATAAAAAAAAAAATCCCCAAACAGAAAAATCCTAACTGTGGTGACCAGGTACCTCCTGAGACATGAAGCCTCCACTTACCTGGACCCTGGAGGCCTCTCCGGGCACAGCTGCCAATGTTGATCTTAGATAAGACCACCAGCAAGTAAACATCCACTGTGCAAAGCTGTGTTATCTTTGGGGAACTGAAATGTCCCCTGGGAGTTGGAAACTCCCCTAGCCACATACCACAGAGTTGAGGAAGGAAGAGCTGATGGACGGAAGAACCATGGCGGGAGGAGTCATCCGGAAGCTACCTCGCTGCCCTGTCAGTTACGGAACAGAGGAGAGATGCCGGCTGGAGGACACAGCAAATTTGAACCAAGAGGAGCTTGGAGGAAGCCCGAGCGACCTGGAGGGGACTGGCTGACCTTCCTCATTCTTTTCAAGTGTGAATAATAACCAAGCCCAGTTTGGCAACTCCTTGAGGGTGAGGACGAAGCCCCATTCTCCTTTTTGGAACTTGGTGGGGCTCAGGAAGCAGGTTCTCTCCAGTCGGTGGCTTTCCTTTCTGTTGCGGGTCTCTTGAGGGCCTGCCTTCATGAAGGCACATGAGTGACTCATCATTTGTGAATTAATTGCTATATGTGAAGGGCATCTGAGAACAAATTATCTTCATAGACTTTTCATTATAATTTTATTTGTACTGATAATTAGTTGGTTTAGCAAGCTCTTTTTTCATAGATTTGGCTAAACTTCAGTCTGAAAGAGGCAAATTCTGGGGTTCTAGAAAGAGATTTTATTCTTTGATATAGGGCTATTTGGTGGGGTTGCTTTTTGTCCTAGTTGTAGCTTTTATAATTTCGAGATTCACATTTTGCAATAGAAATATACAGGCATACCTTGGAGGCATTACAGCTTTGGTCCCAGACCACAATGAAGCAAGTCACACGAATTTTGTTGGTTTCCCAGTAAATATAAAACGTATGCTGATACCATACTATAGTCTAAGTGTGCAACAGCATATGTCTAAATGAATATACATATATATTTTTTTGAGACAGGTTCTTGCTCTGTCACCCAGGCTGGAGTGCAGTGGCACTATCATGGCTCACTGCAGCCTCCACCTCCCTGGACTAAGATGATCCTCCCACCTCAGGCTCCCAAGTAGCTGGGACTACAGGTCACACCACCACACCCAGTTAATTTTTGTATTTTTTGTAGAGACAGAGTCTTGACATGTTGCCTAGGCTGGTCTTGAACTCCTGGCTTAAGTGATCTGCCTGACTTTGCCTCCCAAAGTGCTGGGATTACAGATGTGTAGTCTTTGAAATCCAGTGTGTGTTCTTACAGTGCATTTCAATTTGGACTAGCCATGTTTCAAATGCTCAGCAGCCACATGCGGCTCATTCTAGATAGGCGGCCATCGCTCTTAAATCCTCCCTGACCTTAGCCATGCTCTCTCATCCCTCCTCTTCGCCAAGCTCTGCCTCTCTCACTGGGGCTTCCCTAGCCTCCGGCCATCTTGGGGCCAAAGCTCTAACACTTTGCCTCTCTCGTGTCTTCTGTTCCCCTCCAGTGGCTTCTGCTTTCTGCCTTAAAATACACCCAGGTTCCTAATCCTGAAAACGTCTGTTGTGCACCGATCCCACCCTCCCCTCGTGTTACCATCTCCATTTCCTTCCCCTTTCCTTGTGTCCTCTTCTTTGCTGTGTCCTGGCCCCTCAAAACTTGACCTTGCCTCTCATCCCCACTGCTGTACTGAAACTGTTGTCTCAGCGTTGCTGATCATCCAGCCTTTTAGTCTATGGACCGCTAAGAGCCATAGGACGACCTCAGGGTGGGACGTGGCTTGGAGGGCCATCTCGTCTCAATTTCCAGATACAGACCTGTGTTGGGTTGTGTTGGATTCATGAGGAAAGCTTCATAAGTTTTATGCACGTTTATAAGACTCCATCCTTGGATTCTGATCCAGTAGCTCTGGCGTGGGGGCTTTAGAATCTGTTTCAAGTATCTCAGGTAATTTTGATTATAAATTACCAAGTATCCCAGGTAAATTTTGATTATAAATGCTTGCTTCCAGCAGAAAATATAAACATATGGAAGATGAAATCTTTCTCTCTGAATAACCCAATTCAGTTTCCACTCGTGAATATCTTATATAACCGTAGTACATTTATCAAAATTAAAACACCAGTGTTAGCACATTACTGTTAATCTCCAGACTATTTGTAAGTCACCAATTTTTCCATTGTCCCATCTGTTCTTCCTTTTCTTTCTCTTGTCATAACCACTTTTAGAGGGTTTTGAATGGTATCATTTTGTCTTCACCGTCGGCTTATTAGCTATACTGTACTGTTCTATTCTTTGAGTGGTTGCTCTAGGATTTACAAATATGACTTCAACATATTGCAGAATACCTTCAACAACTACGATATCCTTTCACAGATAGTGTAAGAACTGCACCACAGAATGCTTTCATTTCCCCACTTCTATTCTTTGTGATATTATTGTCACACATTTTATTTTTACTTAAGGTATGAGCCCCACAATGCATGTTAAATAGCCAAAGTTTTTAGACAGATTAAAGAAATTAAGAAAAAGTCTTATGAACTCAGGTATTTACTATCGTGTTGCTCCTTATTCCTTAGTGCAGATCCATTTTTCTTTTCTTTTTTATTTGAGACAGGGTCTCACTGTGTCACCTGTGGTTGAATGCAATGGCGTGATCTCAACTCACTGCAGCCTCCACCTTCTGGGCTCAACTGATCCTCCCACCTCAGCCTGTAAAGGGATATTTGCAAAGGGATATCGGAGTTGTTGAAGGTATTTGCAATATGTTGAAGTCATATTTGTTTTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTCTTGCTCTGTTGTCCAGGTTAGAGTGCAGTGGCGTGATCTTGGCTCACTGCAACCCATACCTCCTGGGTTCAAGCAATTCTCCTGCCTCAGCCTCCTGAATAGCTGGGACTACAGGCATGCGCCACCACACCCAGCTAATTTTTGTATTTTTGCTAGAGATGGGGTTTTGCCATGTTGGCCAGGCTGGTCTTGAACTCCTGACCTCAAGTGATCCATCTGCCTTGGCCTCCCAAAGTGCTGGGATCACAGGCATGAGCCACCGCGCTGGGCCTGAAGTCGTATTTGTAAATCCTAATTTTTGTATTTTTTTTTGTAGAGACAAGGTCTCACCATGTCGGTCAGGCTGGCCTCACACTCCTGGGCTTAAGCAATCCTGCTGCCTCAGCATCCCAAAGTGCTGGGATTACAGGTGTGAGCCGCTGTGCCCAGCCTGTTTTTCATCTAGTATTTTCCTTCTGCCTGAAGGAAACTTCTTTGACATTTCTTGTAATGGCAGCTCTGCTGGTGATTAATTCTTTCAGCTTTTATTTGAAAGAGTCTGTATTAAAATATATATATATTTTCACTAGGTATAGAATTTGAGGCTGACAGGTTTTTTTTTTTTTAATTTTTTCAGTACTTTAAAGATGTTAATTTTCTTATGGTTTGCCTACTTTCTGATGAGAAGTTGGCTGCTGCTCCTTTTTTTTTTTTTTTTTTTTTGAGACAGAGTCTTGCTCTGTCGCCCAGGCTGGGGTGCAGTGGCGTGATTTCGGCTCACTGCAACCTCCACCTCCCGGGTTCAAGCAATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGATTACAGGCACCTACCACCATGTCTGGCTAATTTTAGTAGGGATGGGGTTTCACCATCTTGGTCAGGCTGATCTCGGACTTCTGACCTCGTGATCCACCCGCCTCAGCCTTCCAAAGTGTTGGGATTATAGGCGTGAGCCACGGCGCCTGGCCTGCTGCCACTCTTATATTTGTTCTTCTGGATGGAATGTCTCTTTTTTTTCTGGTTGCTGGGAACATGGGCTATTCCCACCCCTATGTGAGCTCCAGCTGCTTGGTCTATTGGTTTCACCCTTCATATATGAAGGTTAGTACTTGTCCAAAGACTCCAGGAGACTCTTCAGCTCTCAGGAGCTTGCTCTGTGCAGCTTCCTCCTCTCGTCCTCTTCTGCCTTCAGTTCTGCCTTGGTCTTTTTTGTTTGTTTGTTTGTTTTTTGAGACAGAGCCTTGCTCTTTCGCCCAGGGCAGAGTGCAGTGGTGTAATCTTTGCTCACTGCAACCTCCGCCTCCCTGGTTCAAGCAATTCTCCTGCCTCAGCCTCCCGAGTAGTTGGGATTACAGGGGTGCAACACCACGCCCGGCTAATTTTTGTATTTTTAGTAGAGACAGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCTTGATCTCAGGTGATCTGCCCGCCTTGGCCTCCCAAAGTGCTGGGATTACAAGCGTGAGCCACCGCGCCCGGCCTGCCTTGGTCTTCCTGAACTCTGACTTCTGTCTCTTCAACTCCTGGAGACTACTAGACTCTGGAGTCTCTCTTTACCTTTTGGCCCAGAAACTGCTTCTGGGTAGTAGTAACCTGGTGCATTTGTTG
>URS000117373B rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGAGCGGCGGACGGGTGAGTAATGTCAGGGAAACTGCCTGATGGAGGGGGAGAACTACTGGAAACGGTAACTAATACCGCATACCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAATGGCTAACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCAACCTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGCGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATTC
>URS000199CEE7 lncRNA from 1 species 
ATGAGCCTTGACAAAACTGTGGACAGCATACTGCTAAGCCTCACATTGTTCAGCCTTCTGATTTTCCTTGGAAGTTTGCTGATATGTGCGTGTAGAAGGTATAGATTCCTGGAAGTTATAACCATGCCCTTTCCAGCTCCTACAGATAAAGTTACAACGTGGTTAGCTACAGATGAGACTCACCATCAGAAACAAAATTCAGTGCAAATGGAGATGCAGTCAGAGGTCATACTGAGAATATCAGAAGATAATGGAGATGAGGACATTCAACAACATACACATTTGAAAGAATCTGAAGACCTGAATTAATGCCTCCTTAGAGGAACTTGGTCAAAGCAGGGACTAGACAGGCAAAAGAGTAATGCATGTGTGTCAGACTGGAGTTTCCAAGACTTGCTGAAATTTTAATAGATCTTCCTGGCATGTGTAATGGATAAATGAGTGAAAGAAGCTAACCCAAGAAAAGTGAACAGACAGATCAAAACTGGTACCACATCATCTGGCTGGGGACTTTGCTAATGTGACAAAACTGATAAGAGTCTATAGCAGCATATAGATGTCCAGGTAATACAGGAGGAAATACATTCTAGTGCTACCTCTTGTGTAACAGCCTCCTCACCCACTTTTCTCTGCCACAGAAGGCCCGCTACTTCTGCCTCTGATGTGCGGACAGAGGTGGCTAATGTCATGTGAGGTGCACCAAGCATGCGGAGTGACAGGAGCAGGTCTTATTAGTAAGTGGGGAGGAGGCAGGC
>URS000005DFD5 sRNA from 1 species 
CGGCGCTGTGGCGCCGGTTCGTTGCGGAGGATGCCGGCCGAGCGATCAGCCGGCATTCTCCGTTTCTG
>URS00017CC290 rRNA from 1 species 
CACGTAGGGTCCGAGCGTTGTCCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTGGGTCAGTCGCTGGTGAAAGCCCCACGCTCAACGTGGGAATGGCCAACGAGACGGCCCGACTGGAGGCAGGGAGAGGCCGGTGGAATTCCGGGTGAGTGGTGAAATGCGTAGATATCGGGAGGAACACCAGTGGCGAAGGGCGGTTAGCTGGCCTGTAACTGACACTGGAGGCGCGAAAGGCTAGGGGGAGCGAACAGG
>URS0002351B0D lncRNA from 1 species 
CTTGTGTTCGATTGATTGATAGATGTCTCATTACAAGGCCCTAGGGTCTACATTTATACCCTGCTCAAAGAGCTATAATCAGACTCGACTAGGACTCGAATTCCAAATTAAACAGAATCCATATACAAAACAAATTTAAATAACTAAGAAAAACATAAAACCACCACTTCGTAACCGACCGGAACACCGCCACAGATCAATCGGCAACCTCCACGCTTCCCTTCAGATTCATCGGCAGTCTTCCTGTTATAGCCATCGGCAAACACCAATATTAATCATCGGC
>URS0002307C0E misc_RNA from 1 species 
AAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAACGAGTTCTGAAAGGGGTTGTAGCTGGCCTTCCGGGGCATGTGCACACCCTGCTCATCCACTCTACACCTGTGCACTTACTGTAGGTTTGGCGTGGGCTTCGGGGCCTCCGGGTCTTTGAGGCATTCTGCCGGCCTATGTATCACTACAAACACATAAAGTAACAGAATGTATTAGCGTCTAACGCATCTAAATACAACTTTCAGCAACGGATCTCTTGGCTCTC
>URS000259D3E0 sRNA from 1 species 
GTCCCAAGTTACCCCAAGGACGCCGGTGGGCATTCGCTCCCTCCTCACCCAGCTGTCAGGGCGCCGCGAAGCCGGTGCGAACCTGCGGAGGACGTTTTCAACGTGCCAGAGGGAGCGCAAACTCCATGGAGATTCCTAGCGCAGAAGGAATTCCTGCGGTCGGGAATTTCTTGAAAAAGATTCTTCGCAGGGGCCCTGAGCCGATAATGCTGAAATTAACATCTTTGGATATACAATTCTCTGCTTCTGAAGAATGAAAAGATAAATAACAGAGCTAAGAAAGGGACTGATGAAACAACAGCAGGTCTCAAATTTTTGGTCTCAGGACCCCTTTATGCTCTTAAAAATGATTGACAGCCTCCAAGAGCTTTTGTTCATGCTTTGGTAAGGCTGTGAGAGCACAGAGCTGAATTAGGGATCTTGGACTTCAAGTTACTGACTAGCCCCAGCACTCGCCAAGCTCACAAAGAAGACAGAAACGAGGTAAACATCCAACCATGTTTATGGAAGAGTTCATCTCTCTGTCAGCATTACGT
>URS000094A37D SRP_RNA from 2 species 
GCCAGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCAGAGGCAGGTGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGACCAACATGGAGAAACCCTGTCTCTA
>URS00004E1280 rRNA from 1 species 
TCATGCGTCGCATTAGCTAGTTGGCGGGGTAACGGCCCACCAAGGCGACGATGCGTAGGGGTTCTGAGAGGAAGGTCCCCCACACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGCCGCAGGGCTGAACCAGCCAAGTCGCGTGAGGGATGACGGTCCTATGGATTGTAAACCTCTTTTGTCAGGGAGCAAAGGGCGCCACGTGTGGCGCTTTGCGAGTACCTGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGCAGGCGGAATGTCAAGTCAGCGGTAAAATTTCGGGGCTCAACCCCGTCGTGCCGTTGAAACTGGCGTTCTTGAGTGAGCGAGAAGTATGCGGAATGCGTGGTGTAGCGGTGAAATGCATAGATATCACGCAGAACTCCGATTGCGAAGGCAGCATACCGGCGCTCAACTGACGCTCATGCACGAAAGCGTGGGTATCGAACAGGATTAGATACCCTGGTAGTCCACGCAGTAAACGATGAATACTAACTGTCCGGGCAGAATGATGCCTGG
>URS0000355545 rRNA from 1 species 
TTCCGGTTGATCCAGCCGGAAGCTACTGCTATCGGGATTCGATTAAGCCATGCGAGTCGAGAGGGTTCGGCCCTCGGCTGACGGCTCAGTAACACGTGGATAACCTGCCCTCAGGTAGGGGATAATCTCGGGAAACTGAGGACAATACCCTATAGACATCCTTTGCTGGAATGCTTGGATGTTCAAAGGCAACGCCTGAGGATGGGTCTGCGGCCTATCAGGTTGTAGTGGGTGTAACGGACCCACTAGCCTACGACGGGTACGGGCCTTGAAAGAGGTAGCCCGGAGATGGACTCTGAGACACGAGTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAAACTTCGCAATGCGGGAAACCGTGACGAGGGAATCCCGAGTGCTCATACAATGTATGGGCTTTTATGATGTGTAAAAAGCATTAGGAATAAGGGCTGGGTAAGACCGGTGCCAGCCGCCGCGGTAATACCGGCAGCTCTAGTGGTAGCCACTTTTATTGGGCCTAAAGCGTTCGTAGCCGGTCAGGTAAATCCTTGGGTAAATCGTACAGCTTAACTGTGCGGATTCCGAGGAGACTGCTTGACTAGGGACCGGGAGAGGTTGGAGGTACTCCTGGGGTAGGGGTGAAATCCTGTAATCCTAGGTGGACCACCGGTGGCGAAGGCGTCCAACCAGAACGGCTCCGACGGTGAGGGACGAAGGCTAGGGGCGCAAACCGGATTAGATACCCGGGTAGTCCTAGCTGTAAACGCTGCAGACTTGGTGTTGGAGATCCTACGAGGGTGTCCAGTGCCGAGAGAAGTTGTTAAGTTTGCCGCCTGGGAAGTATGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACGCAACGGGAGGAGCGTGCGTTTAATTGGAATCACGCCGAAATCTC
>URS0000A75A1F rRNA from 1 species 
TACGGAGGGAGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGTTATTCAAGTCAGAGGTGAAAGCCCGGGGCTCAACCCCGGAACTGCCTTTGAAACTAGATGACTAGAATCTTGGAGAGGTCAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGACTGACTGGACAAGTATTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGATAACTAGCTGTCCGGGTACTTGGTACTTGGGTGGCGCAGCTAACGCATTAAGTTATCCGCCTGGGGAGTACGGTCGCAAGATTAAA
>URS00009F80D5 rRNA from 1 species 
GACGAACCGAGCGAACGTTGTTCGGAATCACTGGGCTTAAAGGGCGCGTAGGCGGGCTGTCAAGTCTGGGGTGAAATCCCACGGCTCAACCGTGGAACTGCCTCAGATACTGACGGCCTCGAGGGAGGTAGGGGCGAGCGGAACGGGTGGTGGAGCGGTGAAATGCGTTGATATCACTCGGAACTCCGGTGGCGAAGGCGGCTCGCTGGACCTTTTCTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACGGG
>URS00007B79EE rRNA from 1 species 
AAAACGACTCTCGGCAACGGATATCTCGGYTCTCGCATCGATGAAGAACGTAGCGAAATGCGATACTTGGTGTGAATTGCAGAATCCCGTGAACCATCGAGTCTTTGAACGCAAGTTGCGCCCTAAGCCTTCTGGCCGAGGGCACGTCTGCCTGGGTGTCACAAA
>URS000123EF67 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAAGTGGCGAACGGGTGAGTAACGCGTAATCAACCTGCCCTTCAGAGGGGGAAAACAGTTGAAAACGACTGCTAATACCGCATACTGAAGGAGGGGATTGCGTCGGATTAGCTAGTTGGAGGGGTAACGGCCCACCAAGGTGATGATCAGTAGCCGGTCTGGAGGGATGGACGGCCACAATGGGACTGGGACCCGGCCCAGACTCCTTCGGGAGGGAGCAGTGGGGAATCTTCCGCAAAGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGACGGCCTTCGGGTTGGAAAGCTCTGTTAATCGGGACGCGGTACCGGAATAGAAAGCCACGGCTAACTACGTGCCAGCCGCCGCGGTAATTC
>URS0000638341 rRNA from 1 species 
GTCTACGGCCATACCACCCTGAACATGCCCCATCTCGTCTGATCTCGGAAGCTAAGCAGGGTCGGGCCTGGTTAGTACTTGGATGGGAGAAATGTTAACTAAAAATA
>URS000020D105 rRNA from 1 species 
AATACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGCGGTTCGTTAAGTCTGTCGTGAAAGCCCTGGGCTCAACCTGGGAATTGCGATGGATACTGGCGAGCTAGAGTACGGTAGAGGATGGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGAGATCGGGAGGAACACCCGTGGCGAAGGCGGCCATCTGGACCAGTACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGCGAACTGGATGTTGGGCACACTTAGGTGCTCAGTGTCGAAGCTAACGCGTTAAGTTCGCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGCCTTGACATGTCCGGAATCCTGCAGAGATGCGGGAGTGCCTTCGGGAATCGGAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTTAGTTGCCAGCACGTAATGGTGGGAACTCTAAGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGGCCAGGGCTACACACGTACTACAATGGTCGGTACAGAGGGTTGCAATGCCGCGAGGCGGAGCCAATCCCAGAAAGCCGATCTCAGTCCGGATCGGAGTCTGCGACTCGACTCCGTGAAGTCGGAATCGCTAGTAATCGCGAATCAGCATTGTCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGGTTGC
>URS0002194E4A rRNA from 1 species 
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGAAGCTTGCTTCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTATTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTGGATCACCT
>URS0001BA8378 rRNA from 1 species 
ATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCCACGGAAGGCAGCAGGCGCGCAAATTACCCAATCCCGACACGGGGAGGTAGTGACAATAAATAACAATATAGGGCCCTTTTGGGTCCTATAATTGGAATGAGTACAATTTAAATCCGTTAACGAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAACTTCAGACCTGACCGGGCGGTCCGCCTAACGGTGTGTACTGTCTGGCCGGGCCTTACCTCTTGGTGAGCCGGCATGCCCTTCACTGGGTGTGTCGGGGAACCAGGACCTTTACCTTGAGAAAATTAGAGTGTTCAAAGCAGGCTTACGCCGGAATACATTAGCATGGAATAATAAAATAGGACGTGCGGTTCTATTTTGTTGGTTTCTAGAGTCGCTGTAATGATTAATAGGGATAGTTGGGGGCATTTGTATTGCGTTGCTAGAGGTGAAATTCTTGGATTTACGCAAGACAAACTATTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAGGTTAGGGGATCGAAAACGATCAGATACCGTTGTAGTCTTAACAGTAAACTATGCCGACTAGGGATCGGACGACCTCAATATTATGCGTCGTTCGGCACCTTACGAGAAATCAAAGTCTTTGGGTTCTGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACAGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACCCAACACGGGGAAACTCACCAGGTCCAGACATAACTAGGATTGACAGATTGATAGCTCTTTCTTGATTTTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGATAACGAACGAGACCTTAACCTGCTAAATAGCCTGGCCGGCTTTTGCTGGTCACCGGCTTCTTAGAGGGACTGTCAGCGTCTAGCTGACGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGACAGAGCCAGCGAGTTTTTTTTCCTTGGCCGGAAGGTCATGGGTAATCTTGTGAAACTCTGTCGTGCTGGGGATAGAGCATTGCAATTATTACTCTTCAACGAGGAATTCCTAGTAAGCGTGAGTCATCAGCTCGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCATCGCTACTACCGATTGAATGGCTTAGTGAGACCTCCGGATTGGCTTTGGGGAGTCGGCAACGACACCCCGTTGCTGAAAAGTTGGTCAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAG
>URS0000DCA084 rRNA from 2 species 
TGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTTGACTGGGAGCAAGCCCTTCGGGGTGAGTGTACCTTTCGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTATCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTTCGTCGCGTCCGGTGTGAAAGTCCATCGCTTAACGGTGGATCCGCGCCGGGTACGGGCGGGCTTGAGTGCGGTAGGGGAGACTGGAATTCCCGGTGTAACGGTGGAATGTGTAGATATCGGGAAGAACACCAATGGCGAAGGCAGGTCTCTGGGCCGTCACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACA
>URS0001D81814 misc_RNA from 1 species 
ACAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAAAGCATGGCGAACCTCGTGTTTCGCGAGGTTTTTGCGTCCATTTTTCGTATTTAAAACATCCACTCTTTTAAAAATTTATCTAATGATAAAATAAAAAAGATCACTTTCAACAACGGATCTCTTGGCTCTCAGAGACAGACAAACTTGGTCATTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAAAGCATGGCGAACCTCGTGTTTCGCGAGGTTTTTGCGTCCATTTTTCGTATTTAAAACATCCACTCTTTTAAAAATTTATCTAATGATAAAATAAAAAAGATCACTTTCAACAACGGATCTCTTGGCTCTCGCATCGATGAAGAACGCAGC
>URS00022FF30A rRNA from 1 species 
TGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGCGATGAAGGCCTTCGGGTTGTAAAAATCTTTTGTATGGGAAGAAAATGACAGTACCATACGAATAAGGACCGGCTAATTACGTGCCAGCAGCCGCGGTAATACGTAAGGTCCGAGCGTTATCCGGATTCATTGGGCGTAAAGCGCGCGCAGGCGGCTCTTCAAGCGGAACCTCTAACCCCGGGGCTCAACCTCGGGCCGGGTTCCGAACTGGAGGGCTCGAGTGCGGTAGAGGCAGGCGGAATTCCCGGTGTAGCGGTGGAATGCGCAGATATCGGGAAGAAAACCGATGGCGAAGGCAGCCTGCTGGGCCGGCACTGACGCTGAGGCGCGAAAGCTAGGGGAGCGAACAGG
>URS00012276C6 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAACGCAGTGGGGATGGGTGAGTAACCCGTGGGTAACCTCCCCTCAGACGGGATAACACTTGGAAACAGGTGCTAAACCGATATTGATTGATGGACTCGCGGTGCATTAGCTAGTTGGTGAGGTAACGGCGCACCAAGGCCACGATGCATAGACGACCTGAGAGGGTGAGAGGCCACACGGGGACTGAGACACGGCCCAGAAGCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTGGTAGAGAAGCGGTATCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATAC
>URS00022361F8 tRNA from 1 species 
CGGGGCTGTGGTAGCCGGCCATCCCGGCACCGATGCCGACGGTGGGCAGTCCGGCGGCGGCGTAACGGCGGTTGTCCGAGGCGACCGGCCCCGCC
>URS0000016AA7 rRNA from 1 species 
GGGTCTCGAGCTGATCGGGCTCCGGCCCGATCCTCCCACCCTTTGTGTACCTACCTCTGTTGCTTTGGCGGGCCGCGGTCCTCCGCGGCCGCCCCCCTCCCCGGGGGGTGGCCAGCGCCCGCCAGAGGACCATCAAACTCCAGTCAGTAAACGATGCAGTCTGAAAAACATTTAATAAACTA
>URS00023DAE2E lncRNA from 1 species 
GTCTATGTCAAAAGTTTGCATATAGATAAACTTGTTTCTTGGTCCATAGTTGTTTAAAGGTTACTGATTCTATCATGCTGAAGAACATAAGATGCTCATCAACAGTAGGGCATTCCTTTTGGAAAGAAGTTTCTTAGAGAAGGAACTGATACCTATCAAGTTGAACTTGAAAGTTTGACTTGTAAAAAATGAACTGACATAATCTAGTAAACCTACAGAATCGGATTTGATTAGATCAAACTCGGAGCCCATTAAAGTAACACCTTTAAGG
>URS0001703742 rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCGTGTAGGCGGCCATACAGGTCAGCTGTGAAAACTCGAGGCTCAACCTCGAGACGTCGGTTGAAACCGTATGGCTAGAGTCCGGAAGAGGAGAGTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCGGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGCGGTACTGACGGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS0000241E50 rRNA from 2 species 
TTAGAGTTTGATCCTGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTGATACGTAGGGTGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGGGCTCGTAGGTGGTTGATCGCGTCGGAAGTGTAATCTTGGGGCTTAACCCTGAGCGTGCTTTCGATACGGGTTGACTTGAGGAAGGTAGGGGAGAATGGAATTCCTGGTGGAGCGGTGGAATGCGCAGATATCAGGAGGAACACCAGTGGCGAAGGCGGTTCTCTGGGCCTTTCCTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGCTTAGATACCCTGGTAGTCCACGCTGTAAACGGTGGGTACTAGGTGTGGGGTCCATTCCACGGGTTCCGTGCCGTAGCTAACGCTTTAAGTACCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGCCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGTAGAACCTTACCTGGGTTTGACATGGATCGGGAGTGCTCAGAGATGGGTGTGCCTCTTTTGGGGTCGGTTCACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTCACTGTTGCCAGCACGTTATGGTGGGGACTCAGTGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACGCATGCTACAATGGCTGGTACAGAGAGTGGCGAGCCTGTGAGGGTGAGCGAATCTCGGAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCTCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGGCTTGTACACACCGCCCGTCAAGTCATGAAAGTTGGTAACACCCGAAGCCGGTGGCCTAACCGTTGTGGGGGAGCCGTCGAAGGTGGGACTGGTGATTAGGACTAAGTCGTAACAAGGTAGCCGT
>URS00009FA0E6 rRNA from 1 species 
GTCCACGCCATAAACGATGAGGACTAGACGTTGGAGGCTTTAGGCTTTCAGTGTCGTAGCTAACGCGCTAAGTCCTCCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCATGGAATCCCGCAGAGATGTGGGAGTGCCGTAAGGAACCATGAGACAGGTGCTGCATGGCTGTCGT
>URS00023F6A50 lncRNA from 1 species 
CTTATCCTAAATAAAGAAAAATTTGATGTCGACGTCATGCCCGACACAATATTTACAGACTCAATATTATTGGCAAAATTAGGACTGTTGACAACCAAAAAGAATCTTAACAAAGTGGTAAAGGGTTTGGTGGATGATTCTTGAGCTCCCAAGGTCGAATGCTAGTTGATTCATATTTTCAACTAAGTTTATTTTTTTAAAAAAATAAATGAAAGAGATAGAATGCTATCATTCTCTCTACAAAAAAAGAAAAGAAAAGAAAATTTA
>URS0000783EF6 rRNA from 1 species 
TACGTAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTAAAGGGAACGCAGGCGGTCCTTTAAGTCTGATGTGAAAGCCTTCGGCTTAACCGGAGTAGTGCATTGGAAACTGGGAGACTTGAGTGCAGAAGAGGAGAGTGGAACTCCATGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGGCCTGCTGGACTGCAACTGACGTTGAGGCCCGAAAGCGTGGGGAGCAAACAGG
>URS0000768CC5 rRNA from 1 species 
GCATATCAATAAGCGGAGGAAAAGAAACCAACCGGGATTGCCTTAGTAACGGCGAGTGAAGCGGCAAAAGCTCAAATTTGAAATCTGGCGTCTTCGACGTCCGAGTTGTAATTTGAAGAAGGCGACTTTGTAGCTGGTCCTTGTCTATGTTCCTTGGAACAGGACGTCATAGAGGGTGAGAATCCCGTGTGGCGAGGATCCCAGTTATTTGTAAAGTGCTTTCGACGAGTCGAGTTGTTTGGGAATGCAGCTCTAAGTGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGACAGCGAACAAGTACAGTGATGGAAAGATGAAAAGAACTTTGAAAAGAGAGTGAAAAAGTACGTGAAATTGTTGAAAGGGAAGGGCATTTGATCAGACATGGCGTTTGCTTCGGCTTTCGCTGGGCCAGCATCAGTTTTAGCGGTTGGATAAATCCTCGGGAATGTGGCTCTGCTTCGGTAGAGTGTTATAGCCCGTGGGAATACAGCCAGCTGGGACTGAGGATTGCGACTTTTGTCAAGGATGCTGGCGTAATGGTTAAATGCCGCCCGTCTTGAAACACGGACC
>URS0000555B9E rRNA from 1 species 
AGAACGAACGCTGGCGGCATGCCTAATACATGCAAGTCGAACGAACTCTTCGGAGTTAGTGGCGCACGGGTGCGTAACGCGTGGGAATCTGCCCCTTGGTTCGGAATAACAGTTGGAAACGACTGCTAATACCGGATGATGACGAAAGTCCAAAGATTTATCGCCAAGGGATGAGCCCGCGCAGGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCAACGATCCTTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTGGACAATGGGCGAGAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTACCCGAGATGATAATGACAGTATCGGAGAATAAGCCCGCTAACTCCGTGCTAGCAGCCGC
>URS000075F11E ncRNA from 2 species 
GTGAGTGCTGGGTAGAATGGGAAATGAGGGATGGAAGCTGCAACCGAGGGGCTATAGGCTCAAGCTGGGCTTGTGATGCTCTCTGTAGAGCATCCTCCTCTCGGCCCCTGTCACTTTCTACTCTACCTTCTACTCAG
>URS0002564330 rRNA from 1 species 
ATGGCTGTCAGCACTGGTAGCTTCTTGGCCATTGCCATGGCCCTCGCTCTCCTTAGTGGCGACATGGCCCACGCCGGCCGCCTCCTGGCCGACACCACGGAGGCAGCAGCGCCCGCTGCAACGCCTGCCGCTGTCCCAGGCATCCCCGCGCCGAAGCCGCCCGTGCCCACCATGCCTACAATGCCACCCGTGCCCGCGCTCGCCGTTCCCCAGTTCACGGTACCCCCCATGACGGCCGTGCCCGCGATCACCGTGTCCCAGGTCACGTTGCCGCCCATGCCGGCCGTCCCTGCGGTCACCGTGCCCAAGGTCACGTTGCCGCCCATGCCCGCAGTTGTTGTGCCGAAGGTGACGATGCCGCCAATGCCTGCAATTCCATCCATCTCCATACCCAAGGTGGCATTGCCTCCGATGCCTTCCATTCCCACTGTGAACGTGCCGATGCCAACCCTTGCGCCACCTCCTTCAGCATAG
>URS0000DAC67E ncRNA from 1 species 
ACACGCGATGCGGGAGAGCTCGGTTCGCCGAGCACCGAAGGAGCAAGCCTCCCCGCCAATCTCTCAGGTTCTGTACCGCATCGAACTG
>URS00004A01BA rRNA from 2 species 
ACTGCTCAGTAACACGTGGACAACCTACCCTTGGGTCTGGCATAATCCTGGGAAACTGGGTATAATTCCGGATAGGTCACAGATGCTGGAATGCACTGTGGCCGAAAGCTCCGGCGCCCAAGGATGGGTCTGCGGCCTATCAGGGTTGTAGTGGGTGTAACGGACCTACTAGCCTACGACGGGTACGGGTTGTGAGAGCAAGAGCCCGGAGATGGATTCTGAGACACGAATCCAGGCCCTACGGGGTGCAGCAGGCGCGAAAACTTTACAATGCGGGAAACCGTGATAAGGGAATCTCGAGTGCCAGCATATAATGTTGGCTGTCCAGATGCCTAAAAAGCATCTGTTAGCAAGGGCCGGGCAAGACCGGTGCCAGCCGCCGCGGTAACACCGGCGGCCCGAGTGGTAACCGCTTTTATTGGGTCTAAAGGGTCTGTAGCCGGCCAAGTAAGTCCCTTGGGAAATCTGGCAGCTTAACTGTCAGGCTGCTAGGGGATACTGCTAGGCTTGGGACCGGGAGAGGTGAGAGGTACCTTGGGGGTAGGGGTGAAATCTTGTGATCCTCGGGGGACCACCAGTGGCGAAGGCGTCTCACCAGAACGGGTCCGACGGTAAGGGACGAAAGCTAGGGGCACGAACCGGATTAGATACCCGGGTAGTCCTAGCCGTAAACGATGCTCGCTAGGTGTCAGTCACGGTGCGACCGTGATTGGTGCCGTAGGGAAGCCGTGAAGCGAGCCACCTGGGAAGTATGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCAC
>URS00021D2EAF rRNA from 1 species 
GCGATAGTACCAGCACTAATGCACCGGATCCCATTAGAACTCCGCAGTTAAGCGTGCTTGGGCGAGAGTAGTACTTGGATGTGTGACCCCCTGGGAAGTCCTCATGTTGCACCCC
>URS0000A1EE98 rRNA from 1 species 
CGGAGGATCCAAGCGTTATCCGGAATCATTGGGTTTAAAGGGTCCGTAGGCGGTTTAGTAAGTCAGTGGTGAAAGCCCATCGCTCAACGGTGGAACGGCCATTGATACTGCTGAACTTGAATTATTAGGAAGTAACTAGAATATGTAGTGTAGCGGTGAAATGCTTAGAGATTACATGGAATACCAATTGCGAAGGCAGGTTACTACTAATGGATTGACGCTGATGGACGAAAGCGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGATACTAGCTGTTGGGAGCAATCTCAGTGGCTAAGCGAAAGTGATAAGTATCCCACCTGGGGAGTACGTTCGCAAGAATG
>URS00008B5885 lncRNA from 1 species 
GCAGTTGAGCAAGATCACGCAAAAACCTCTGCCAAGACAGAACGTGCATCAGCTCAGCAGGAAAACAGTTCAACGTGTATAGGGTCGGCCATCAAATCAGAGAGTGGGAACTCAGCTCGGAGCTCTGGCATCTCCAGTCAGAATAGCTCTACAAGTGATGGAGATCGATCTGTTTCCAGCCAAAGCAGCAGCAGCGTTTCCTCTCAGCTGAATAAACCACATCAAAGGAAAGGGACCACAGTATTTGAATGTTTGAAAGTCTGTAAAGCTTAAGGTTTTAAAAATGTTGCCCGTAATGTTGAACGTGTCTGTTAAAAAATAAAAGAAAAAATAGTTGCTTCAAACTA
>URS0000F1E2A3 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTCTGTCACGTCGACTGTGAAAACCTGGGGCTCAACCCCGGGCCTGCAGCCGATACGGGCAGACTAGAATTCGGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGATATTGACGCTGAGGAGCGAAAGCGTGGGGAGCAAACAGG
>URS0000D90CA0 rRNA from 1 species 
AACTTTTAATAATAGATCTTTTAGTTTTAATATTAATAAAGAATATAGTAAAATATAATAAGTAATATAAATTATAGAATTTAATAAATTATTAAATCTTTAAACGTATATTACGCTTATTAGTATTTTAATAAGTATACCTATTTAAGCGTTA
>URS00023A597C lncRNA from 1 species 
TTGTTTTTTTTATTTTCTTTTTAATTTCAGAATTTATATTTAATTGCTTTATTTTGTTTAATTCATAATAATTTCATTTTTAATCCAAAAAATATGGGACTTTCACCAAAAATATTTTTGGATTTTTCTCTTTTATATTCTGAATTAAAATTATTTTTCGGATTAATTTTGATATTTTTCATGAATTAAATATTTTTGTGTATGTTTTTAATTGATTAAAAATACTTCTGATTTTTCAAAAGTGATGATTTTTT
>URS0000BE2407 tRNA from 1 species 
GCCTTCGTGGTGTAGTGGTCAGAACGTATTCGAGAGGTCCGTGGTTCGAGTCCCGGTGAGGGCA
>URS0000E01B97 lncRNA from 1 species 
AAAAAGTTTCAGAGAAGTTCAAATTGTGAAAATTAAGGTACTGAGAAATGTTGCCAGAGGTTATGAACTGCATTTTTTTTTTTTTTTAGCGTGTTTGGAGTAAGGATTGGAATGACTGTCTTTTTCCTTGTAGCTGATGAAACTGAATGGTTTGAATGGTGTCCAGGTAACAACAGACAGATGCTGACTCCAGAATGAATGACTGCAGTGATGGAATACTCAAGCAAAGACTGCCAAGCCTCCACACGGGAGTCCGTGCCTGAACGCGAAATAAAGAGGGATCCATGGAATGATTGTCCCACGATGGTAACTTCGTGATCATCTTTACAAAATACGAACATAGGCCCATGGAGAGAGGAAATCAAAC
>URS0000762E71 miRNA from 1 species 
CGTTTGTGCGTGAATCTAACA
>URS0001E5F21C rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGATCCTTCGGGGTCTAGTGGCGCACGGGTGCGTAACACGTGGGAATCTGCCCTTAGGTTCGGAATAACAGTTAGAAATGACTGCTAATACCGGATGATGACGTTAAGTCCAAAGATTTATCGCCTGAGGATGAGCCCGCGTAGGATTAGCTAGTTGGTGTGGTAAAGGCGCACCAAGGCGACGATCCTTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTACCCGGGATGATAATGACAGTACCGGGAGAATAAGCCCCGGCTAACTCCGTG
>URS0001C02308 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGTGAAGCGAGTGCTTGCACTCGTGGATCAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCATCACTCTGGGATAAGCACTGGAAACGGTGTCTAATACTGGATACGACCAACCCTTGCATGGGGTGTTGGTGGAAAGATTTATCGGTGATGGATGGACTCGCGGCCTATCAGCTTGTTGGCGGGGTAATGGCCCACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGTGAAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGAAGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCACCGGCTAACTACGTG
>URS0001E5A028 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACATAGGGAAACTTACGCTAATACCGCATACGACCTATGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS00012AECC2 rRNA from 1 species 
AGCGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGAAGTCTTCGGACTTAGTGGCGGACGGGTGAGTAACACGTGGGAACGTGCCTTTAGGTTCGGAATAACTCAGGGAAACTTGTGCTAATACCGAATGTGCCCTTCGGGGGAAAGATTTATCGCCTTTAGAGCGGCCCGCGTCTGATTAGCTAATTGGTGAGGTAAAGGCTCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACATTGGGCACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCCATGCCGCGTGAATGATGAAGGTCTTAGGATTGTAAAATTCTTTCACCGGGGACGATAATGACGGTACCCGGAGAAGAAGCCCCGGCTAACTTCGTGCCAGCCGCCGCGGTAAGAC
>URS00015A0908 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGAAAGAGCTCGTAGGCGGTTTGTCGCGTCGAATGTGAAAACCCGGGGGCTCAACCCCGGGCCTGCATTCGATACGGGCAGACTAGAGTTCGGTAGGGGAGTCTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGACTCTGGGCCGATACTGACTGAGGAGCGAAAGCGTGGGGGAGCAAACAGGG
>URS0002375287 lncRNA from 1 species 
GCGCAAAACCAAAATTGAGTGGGTCAGTAAAACAATTCTTTTCCAAATCCAAACATTTCTCAAAACGTTGTAACCCCTCTCCGTAAAACCTGTATACTTTCCCAGAAATATAAAATATAAATATACATATATATATTCTCAATACTTCAATTCATTAACTCAACATTTTCATCATAATTATGCCATGCCACATCATCTCAACATTTCTCATATTAATTATGCCATGCCACATCATCTCAACAGTAATAAGGTATGAATGCATCAACATAAATCATATCAGGTGCAATAAAGTAATCAACCGGAGGCCCTCTAATAGCCCTGTACGGTTGAACCTAGAGCTCAAAATCTATCACTCTCACACTCTGCCGGAGTCACTCCGCGTGACCTGTACGGCCTTCTGCACATAAGTTACGCTCTAGTGCTTCTCATAAATCATCTGTGCACATAATCTAAGGTTACCCACCAGTCGGAATCTCACTAACACTCTCGCGACTGGCCTGTCGTACCCACTCCGCGTGGACTGTACGACTAGCATCTACTTGGATCCAAGGCGAGCGTGCGATGCGGTGAATACTATAAGCACTAAACTATGGTGCAGGATTTGAGCTCAATATACATCAACATCATCATAACAGAAATAACTACTCACCTGTGCGTCCATCGCACCATTTCATACATATGCATCATATCAATTCTTACCTGTGCGTCCACCGCACCAATTCATACATATGCATCATAAATCAATTCTTACATGTGCGTCCACCGCACCAATTCATACATATGCATCATATATTAATTCATGCATGGCATTTCAACTCACATTTCTATATACTTTTCATATCAATTCTATGCATGGTATTTCACTTCCCGTTTTTCCACATAACTCATATGCATTTCATTTTAAACATATTTTCATTTCAATTCAATTTCTGGGAAACGTCAAGTATATATATATACGGAAAACAAAACTGCCCACTCACCTGGAGTTCATCCAACAACTCCCTAGCACCACACATCAAGGCGTCACGACGATCGCCGCCTAGAATAGTAATCAAATCCAACCTCAGAATTCATATCGATAGAATATATAACTTATATAAAATACGTCCCTACGTAGATC
>URS0002362E6B lncRNA from 1 species 
AGTCAGGTCCAACCATTAAATGATAGGGTTAAGTCTAATCAACTAATAGATGACCAAGCCCGAGTGTAGCTCGACTCACCTGACCGCCTATTGAAGGTACACTTAACTCATCATATATTGAATGACAATTCCAATGCTTGATAAGTACCAGGCGTGTAGCACCTCCAATAATTATCAAAACATTGGACCCATTATCACCCAACTTAATGGAAGGCTATGATCTAGTTATCTCCATAACCATTCATTTTAAGAACCTAATAATTTTAGAGGATTTCATAATTAGGATAGATGAGAAGATCCGGTTAGTC
>URS000199E9B9 lncRNA from 1 species 
GGTGTCATGGGAAAGGAAGTGGTGTAATGCAATATATTCACCATCTCCTGACAGTACCACAATGAGATACCTTTTTCTGTAGGTGGTTCAGATGTATGTCAGTAGATAGTGCCGATAAATGCTCTTCCAGCCTGATCCTGCTCGACCTGATGTGCAAATAGATGCAAAAGATATCCAAGCCCATGGAGTGAAACAGTGGTGCTTGCTGCTCGACATGAAAGATGTATCTTCTGTGGGAGCTCATTTCTTTTGTTACAGCAGAAAATAAAAAGATTTTCATAAAAGTGAAGATAAAACACTTGATAATATGTCTGTGAACATAGTTCCATTTTACCTCAGCTGTGGCATGAAAGACCATGAAATATCTTCAACTGGCTCTTCATTAAATCACACTATCTTTAAACATATTTCAAGGAAAGTAAGGAGTTTCAGATATTAAAAAACATATACAAATATTTCATAGGTACTGTATGTGAAGGTTCACTCAATCATCCAAGGCCAAATTACTTGAAGAACTGTTAAATTATTATGATTTTAAAAATAATTACTGTAATACTTTGGGGAATACATTTGTCATAACAAATACAGAACATATTTTCTAATTTCTATTATGGCTGTCAAGGTCATTCGGTGACAGAATGCAAAATCTTATTTTTCTCATTCAGATATTGTTAGATGCATAAATTCTTTAGCTAATGTAGAAAAGCATTTAAAAATTTAAATTAATTAATGAAGAAATTGTCTTTGCCTGATATCACACAACCATTTTTTTATCTTGTGAACAGAATTTAACAATACACAGGCTCAGGCTGGCTTTATTCCACTAATACATGCCATTTCCAAAAGTGTGTTGCCTATGTATTAAACACCATGCACACACAAGTATTTTAGCATTCCTTGAAAATGATTTTTAAATCCACATTTATTGTAAGTGCTTTGGAGGCAAGAACCATCTTTTGTTATTGAACAATGCAAATGGGATCTTGGTCCATAATTGGGGCTTCTAAGCACCGTGAATTCTTTCACTAATGTTTCTCATTCTCTTTTTCCCTCTCTTTGTCCCTCCGCAGATTTGCTAGTGTTTAAAAAAGTTAGGATCCCTTGCATCCTCACCAGTCTTTACATTTGCCCAAGAATCAGATTCAGTTTAGCCCAGCATTCTTCACAAAGATAAAAGGGTGACAGATCCTGACACACTTGTAATTTTCAAAACCAGAGAAGCTGATTCCTAAAACAGCATCCAAACTGAAACTGTACCAGTGTTGGTA
>URS00023F5E43 lncRNA from 1 species 
TTTTTTTTTTTGGTAGGTCACGGGGAGAAAAGCTCTCCCCACAATTTATTAAGAAACTAAAAAACAAAAATCAAATTCGGATATGCTTTGGAAACGCAGTTTCTCAGTCATCATCCTCTACAAATGACGCCACAAAGGGTGGAGCAACATCTAACAAATGAAACCATAAAGGGAAAGAAAATGCATAGTTCGCTAACCCGTCCGCAAGACGGTTAGCTTCTCTATAAACATGAGTAACATGGACTAACCAGTCTCTTGATAAGAAGCCATGGCACAATCGCACCAGGAACGATAAAGGATGAGTATCACTAATCCCCCTCGTTAAAAAACCCACCACCAACTCTGAATCAACCTCCAACTCCACTCGCCTAAACCGCCTCTCCCAAGCAATATAAAGCCCGTAACAGACACCAATATTCAAGGCGAACCCACCGCACCAACGACCTTGACCATCACGCACAACTCCTCCTACTGTAGCCAATCCCGGATTTCCCCGTGAAGCGCCATCAGTGTTAAGCTTCATCCAATCTTCTTTCGGTCATTTCCAGGCCACCATTCTCTCCATTTGAGTATTCGATCTGCCCGTATAGCGATTCAGTTTGTGAGCTTGACTTACTTGAGAAGCGAAGTCCTTAACAAACTGAACTCTATCTCTACATTTACCAATCTCGCCAAAAACGTAGCCACACCGCCACTTCCAACTCCACCAAACCACAATGGAGAACAAGGTTGCCCATGAATACCCGACCTCATCATTCACCATTCCCAGATTCAAATATAACCAACCAAGAAGAGACCCATTGAAAAAATCATGTCTCCTGCGAACCGGCACTAACCTTCTCCAATGCAAGACTCGGGGTGAGTCTCACACGGGGATAGATATGGTGGCTTCACAAGCTGGCGATCGCTTCTCTCTTGTGAAGGAAAGATGGTCGAAGGTGGAAATCTGACACGCTAGCGGTCGCTTCTCTCGTGTGAGATCAAATCAGGGTTTTGATGGTGGATTGATGATCGCCACTCAAAAGTGTGAAAGCCTTTGTGATAAGATCACGAACCTTTGTCTCAAGGAATCCACACAAGAGACATTGATTCACACGTTTACTAAGTAAAGGAATCTACCTAACTTAAATAAACAAAAACAAAGCCTAAGCTTTAGAGAAAACTCTTTCTATTACTTTCAAATTTCGTGGTCCTTTACAATGAAACAAATGAGCTTTTTATAGCTCTTACATGACTAAGCTACATTAAAAGAAAATATTCTAAGTTAAATACAAATCAATCGATATAATAGAGAAAGCGTGATTGGTGGTGACGATGAGGAACAAATCGTGGGCATTGATGGAGCTTTATCTCTAGATGCATTCTCTGGATTAAATGGTGGATCAAGGATTTCGAGCAAGCAATACTCCTTAGCAATTAATGCTAATTTAATTACGTCGAATAACGAAAGTTTATTTCCTTTGAATTTCTCTTTGATTCCTTTTGATATTCCGGCCAAAGATGTTTTGCAAGCTTCTTCTTCATTTGGAGGGTTTGAAATCTCCAACATAAACGATCCAAGGTTGATGGATGATTCACTTTCCTTGCTTGGTTCGACGTGTAGTAGTTCAGGAAGTCCTTCAGCAAGTCTTTCAGGAAGTTCGTCAGAAAGTCCATCAATCAGTACATCAGCAAATGTGATGTCCGCATCATACTCTCCTTCTTGAGAAAGTTTTGTCCTCAAAACTAATTTCATTTTTTTTTTTTTTTTTAAATCACAGAACAAGAAAAAAAAAATTTAATCGAAGAAAACAAAACAGAAGCAAAAACGATTGATGATATAGGAGCTTTGAGCTCTGATACCAAATGATGCAAGACTCGGGGGTGAGTCTCACACGGGGATAGATATGGCGGCTTCACAAGCTGGCGATCGCTTCTCTTTTGTGAAGGAAAGATGGTCGAAGGTGGAAATCTGACACGCTGGCGGTCGCTTCTCTCGTGTGAGATCAAATGAGGGTTTTGATGGTGGATTGATGATCGCCACTCAAAAGTGTGAAAGCCTTTGTGATAAGATCACGAACCTTTGTCTCAAGGAATCCACACAAGAGACATTGATTCACACGTTTACTAAGTAAAGGAATCTACCTAACTTAGATAAACAAAAACAAAGCCTAAGCTTTAGAGAAAACTCTTTCTATTACTTTCAAATTTTCGAGGTCCTTTACAATGAAACAAATGAGCTTTTTATAACTCTTACATGACTAAGCTACATTAAAAGAAAATATTCTACAAATTACATACAAATCAATCGATATAATAGAGAAAGCGTGATTGGTGGTGATGATGAGGTACAAATCGTGGGCATTGATGGAGCTTTATGTCTAGATGCATTCTCTGGATTAAATGGTGGATCAAGGATTTCGAGCAAGCAATCCTCCTTAGCAATCAATGCTAATTTAATTACGTCGAATAAGGAAAGTTTATTTCCTTTGAATTTCTCTTTGATTCCTTTTGATATTTCGGCCAAAGATGTTTTGCAAGCTTCTTCTTCATTTGGAGGGTTTGAAATCTCCAACATAAACGATCCAAGGTTGATGGATGATTCACTTTCCTTGCTTGGTTCGACACGTAGTAGTTCAGGAAGTCCTTCGTTCAGCAAGTTCTTCAGGAAGTTCGTCAGAAAGTCCATCAACCAGTACATCAGCAAATGTGATGTCTGCATCATTCTCCAAATGCCCGCTATTGACGGACAATCCCTTCGCACATGCAAGATTGGTTCGTCCCCACCTTTGCAGACCTGACAAACACTTGACTCTCCAATATGACCTCGAACTCGTTCCACATTCGTCATGATAACCTGTTGAGTAACCAACCAAAGAAACGTTCTAACCCTTTCCGGAGCCATCACCTGCCACAGTCTAGCAAAAAAGGAAGACATATCTGTTCGGCACTCAGAATTTTCCATCAACATCTCATAAGCCGACGTAACCGTAAAAGCACCATCGGCAGAGTACCCCAAGATAACCTATCCCGCACGCCAGTCACGTTATCTAAAGCAATAGAGGCTAACTCCAACTGAGTATTATGAGAAACGTAGGGCAAAATTCTGTCAAGTCTCCAACCCATGCCATCCACCCATAGATTGTGAGCTCGCAACTCCTTATCTGTATTTGGTATCTCTAGAACTGCTCTTTCAGAGACTGATACGATAACCATTTATCCGCCCAAAAACGAATTTCTTGCCCATTACCAATCACCCATCTACTACCCCGAGTAGCCACTTCTCTTAACCCTGCCACGATGCTTCTCCAAGTTGACGAGCATGGCCTTTTTTTCTCCATCCAAGTTCGATCATGAATCTCTCCCACTTTATACTTTTTGCGCAAGATTCTAGCCCACAAACTCTGCCGATCATGAATAAGCCTCCAGCCAATTTTAGATACTAGAGCTTTGTTCATAAACTTTGACTTTTGAATGCCAAGACCCCCCTCTCTCTTTGGCAAACAAACTCTATCCCAAGCTACCAAATGCATCTTCTTTTTCTCTAACGAACTACCCCACAAGAAAGCTCTCGCCAGCTTATCTAATCCCTCCAACGTTGACTGTGGTAAAGAGAGAGTACTCATTGTGTGTATCAGAATAGAGGAGAGAACCGACTTGGTTAGAGTTAATCTCCCCGCAAAGCTTAAAGAACGGCCTTTCCAACCCGCTAGCCTTGAAGCCACTCTTTCAAGAACCTCTCCAAACGTATCTTTATTTATCCATCTTTCGAGAATAGGCATTCCAAGATACTTCCCCAACTCTCTTGTTGATTTAATCCCACTCTCATTACTAATCAACTTTTCCAAGTCTCATGAAACATTCTTTGAGAAAAATATCTTATATTTCTCCAAGCTCACTTTTTGTCCAGAAGCTACACAAAACGTTTCCAAGATTCTTCGTATAACCCTTATTTGAGAGACCGTTGCTTCTGCAAATAGAATTAGATCATCGACAAAACAAATATGTGAAATCTTCGGCCCTCCCTAAGACAGACCAATAGGCTTCCACTCTTTTGCAGCTACAGATCGATCGATCATGTGACAAAGTCGCTCAAGATAGAGAACAAATAAGTACGGAAACAATGGATCTCCCTGTCGAAGCCCACGTGACGGTTTAAAGCTAGCAGTCTTCTCTCCGTTCCAAAGGATACTCATAGACAGACCAGTGATGCATTGCAAAATCCATTGGACCCATCTCTCCTCCATACCCGCAGCCCGTATCGTATCCTCCAGGAAGTCCCACCGAATACGATCATATGCCTTCTTCAAATCCAGTTTCAAAAGCATCTACCCTTTTCTCCCTTGTTTCCTTCTCATCGAGTGAACAGCTTCTTGCACCACAATAATGTTGTCTAAACTGAGCCTCTCCGGGATGAAGCTAGATTGTGCTGGACCAATTAGCTTTCCAATAACTTGCTTTAAGAGTAACACTAACATCTTAGTAAGCATCTTAAAAAGAGCATTGCGCATCTTAGTATGTGCCAAACTTCAAGACTTGTAGAGTTTTGACGAGTGGAGTAGAAGACTTGGATTTTAGGATCCTCCAGACAGTAGAGACCTTCAAGTGTTCTTCCCATTATCAGCAGCTTCTTGGTTGCCTTATCATTTATACGAACACTATCAACATCAAACTCAATAGAGCACGGGTAGTCACTTGTGAGTTTTGAAACAGACAAAAGAGATTTAGCAATATCATGGCAAGCAAGAACTTCTTTTAAAGGTATTTTACCTGAAGAGGAAGCAATACTACCTGAACCAGTGTGAGTAATGGGCAAGAAGTTACCATCAACTACCATTATAAAATCAGAACCATGATAGGGTTGAGACTATTGCAAAACTTGGTGATTATTGGTAACATGAGCTGTAGCTGCTGAATCTGGAATCCACTTGTGGCCATGATGGTTTGTAACATTTGTAATGCGCATTGTACCAAGAGTCATTGGTAAGTCTTCGTATTGATAGTTGTTGTCAAACCTATGCCAACATTTCAGAGCATGGTGACCAGCTTTACCACAGATTTGACATACCACACTTGAGTTTTCCGACTGAGAAACAGATGAAGATAAAATTTGTTGATGAAAATCATGTCCTCTAGTCGAGAATGAACTCCTGCCACGGCTAGAGTTTGACCTTTCTTTTCCTATGTTGTTGCGAAATTAGCCATTGTCTGAGTGAGTGACATTGAAAGCAACATGAGGAGAGATAGATGCTTCAGTCACATAGCTTTGAAGACGGTCATCATAGCCTTTTAACTTAGAAGCAACTTCATCAAGAGAAAGACTTGGAGTAGAGTCAACAGAGTTTTCAATATTTGTTTTAATTGGCTCATACTCTCTTCCAAGACCATTCAAAGCAGAAAAGATTTTCATTTTCTCTGGAACATGGTTACCAATAGAGGCTAACTGATCAAATATATATTTCAGATCTTTGAGAAAAGTTTCCATGATGTTATGTTTCTTTTCCAGAGTTTGCAATCTTCTTTGCAGTTCAAACAAGCGAGAGGATGATACTCTATTAAAGTGATTAGCAAGAGTCATCCATACCTGATGAGAAGCGAAGCAGTTGACCACCACACTTAAGATATCTTCAGCAAACGAACCAAGTAACCAAGACTTAACAACTTGGTCTGGTTGGTGCCAAGTGTAAAACTCCTGAATTTGTTCTTCAAAGGTGACACTGTTGTGAGTAGCAGTCCGAGTTTGCGTCAGAGCAAAGATAGAACCAATGACAAAGCCGACCAGCCCTTGACCAGATAAAAAATTCTCGAACTAGCTCTTCCTTCTAGAGAATGTAGTTTTGTTGGTAAAGAGTAATGGTGAAACAGTTGGAAATATTGAGAACTGGGTGGAATTGTATAAGGTGCCATGGATCTTACTTCTATGAGATCTGATACCATGTTGACATTTCTAAACTAAGAATGGTTTATGCTCAAATGAGCTTATTAACATAGAAATCTAAAATTGGAAAATACAATAGTTCAATGAGCTTTATTGAAATATAAAGAAGAAAAAGAAGCTTTAGGTTTTGTCACCAAGAACACTTAGAAGAAAAATCCACCATTTTCAATGGAAGACAAAAATCCAATCAGATTTCCCATAAAAACCTAACTCTTCCTCAAGTCATTGAAGAGCTAAAAGAGCTCTGGGCTATGGTTTTACCAATCATAGCAATAATTTTTATATGTATTAGCGTTCTTGGTGAAATAAGAATGAAGCATAATTGTTGTAAATCAGTGACAAATCTAATATACTTCATTCTTTTTTCTCCAAGAATGCTAATATATATATAAACTCGTCAAACAATCTAAACTATTGTTTGTTAATTGAACTTCAAGCAAGCATTATGTATAAGTTTGACATGTTCACAAAACATGTTAAATTCATTTGGTGGTTGGTTGAGGAAGTTTTGCTCACCTATGTTCTTTCAAACAATTTCAACAACACATTTGATGGCACGTTGAATTAAATCTAAGATCATAATCTCGGTGATCAATCTACACTACGCAATAAGAACCACCATAGATGTATAACCATATATGTATTTAATATTAATCTTATTAATTCTGAATTTTGTTGCTTTCAACTCATTACCCCGATAGTATTTAGAAAGCGATGTTGTTTAAACATGAATTAATTGATTCAACATCAAAATTCTGGTAAATATTGGTTGGTAAATTGTTCAAAATCGTGGGTAGAAAATTAACAACATTTCTTCGTTTATAAACTAAATTGCACGTTTTTATTAGTATGTGTTTTATTTTACATAATATAGTTTGTCATACTTTTATTATATACACTATACATTATAACCGTAATTCCATACGAAGAAAACACATATTATAACCGTAAACCCAAATACATAATCTATTATTCAACTATACGAATTTCATTCAATATATAAATTTTATTAAAAAATTGTCAAAATCTAGTTATTAATATTAGAACTTATAAGATGAGGACCCAAATAAGGGTATTAGAAAGTGAAGATCACTTAAACTCTCTCATACACAATGATCGAGGCAGCCTTATCGAACCCTTTCTCCGACGTCGATGAAGCCATGGCTCGCCGGCGTCGGGATTTGTCTTCCCTTTACTACGTTGTTTCTCTCCCAACACATCCAAATCCTTTCTCGGCCCATGTCCCACGATCTCCCATGCCCACTCCTTGCGACGATTCCTATATATCTGAATTTCTTCAAGTTACAATCGTCTTCCTCTGCTATCAAACAACACCGTTTGATGCGGCTCAGCCCACTCCTGAAACAAGATCTTCTCCCTCTAAACCTTTTGTGATTCCTGTAAATCGTCCCTCTCAATGGCTCCCCTTGAAGTCAAGACCTGCATCTCACAACTCCTTTCTTTGGGATTCAATTCCCCCCACCTAGTGTTTTTCTTGGTTTCGTTTGGACCGGAGCTCTGCTTTGACGCCGGAGCCGATGAGGATTTCGACGACGGAATCTTCAACCCACTCCTCAGCTTTGGCAACGCTGACTCGACTAGCTCTATTACCAAGAAAACTCACCGTCGGCGTGCGGCCACCGTTGACGAATAAGGGAGGTAGCTTCCTAACCCTAATGTTGCTTTTCCTTATTTGGTTTGGGCCTAGCCCAAGAACTGTTTACCCTCCCTCCAATCCATTTTTCAAGTCCTCGAAGCCCATGAACAGTTTTTTTAGGTTAAGCCCACATCTTGTTTGGCCCAGGTTAGGTCTTTATTTCACTCTAGCAAACCCAAACGTTTTGATTTCTTTCTCGTCTTTGGAGAGTAGCTACCTTCCGAGATTAGTTGTGATGGTCATTGTTTGGTTTTGGTTTTCTCTCCCACAAAGTTTGGCAAATAGGTTAGCTCGTTGGTTTTATGTTACAAATCTGATCTCAAAAAGCTTTGGGCTAACTCCACTTTTGAAGTGTTTTAGAGTCTTGATGCCCATGATCCGTATTGTTATGTTTCTGTCAATTACAACCCCTATAGCACCCTTTAACTTTGTTTTGGCTGGTCGTGGACTCCACGCTAACAGAGTAACAGTTCTTTTAGGCTGTTTTGATAGATACTTTTGTCGAGGTCATTTGTTAATTTTGTTTCGAACCCTATTTGAGACTATCATCCCAAACCTTTGGCAATGTCCAAAAGAGTGAAGAAGAACGCCATTATGATCCCATCTCCACGGAGCGGTGGTTACCGAAGCTTCTTCAACTCTCTACCTCCTTACCCGCCAATTACCAAGCTCCTTCAAGGTATCTTCAAGTATACGGATAAGTTGCAAATCTGTGAAAGCTTGGCAAAGAGCGGCGTTATGATCTACCCTTTATTTTCTCCCGTGGAGCACCTTTTCAAAGGCTCATATGCATTGTTTGCAATAGCCGTTTATGACCACACGTTGGTCGAGGATTTCGCGAAGCCCGTCTTCATGGTCGAATCCGCCAAAGCCTCAACAGATTTTTCAAACCTTGTAAACTTTTTTAAAAGTGAACACCTCTTTGCAAAACTCATGAAGCCTCTATCTTCATTTTCTTGTACTATCTTAGTTCTAATTTGTATGAACTTCCCTTTTTTTAGGCTTAAGTGAATGAAAATTATTGTTTGAGAAAAAAAAAAAATAAGATGAGGACCCAAAAGCTCATAGTTCGTCATCTGTAACATGCTGCATTTTTCAGGCAAAGCAATCCGACTAAAATCAAGGAGATGTGGAGGGGAGAAGCTTCCGCCTGATACCAACGGTAAGAGCTCCACATGCGGTGTAGCGATGCAGAGTAGAAAAGGGAGATCTACGGCGAAGAACGAGAGAGACAAGTAGATAGATCTGAGACCGAAAATTGTGGCGGTTCCACGAGATCTTTGTCGATGGGGGAGGTATATTTGATCCGGCAAAGCGAAGCCAACGTCGAAGGTCTCTGTTTTCTATTCCCTACTATTTTCTCTCTTTCATGACTGAGCAAGGATCTCTTCAACAAAAACGAGATCGGCTCTCTTCCTCCTTCTCAAAACAACTCTACAGTGGCGGCATGGCAACAAATTTTGGATCACCATCTCGTTTGGCTGTCCTATTTCAGCGAGAATCTGCAGTTTTGGACGGCGGCTCGATCATGTTTTTTGATTGAGATTAGGGTTTTCAATCTTGGTTAGTTAAATTCGGTTTGTAAATTTGAGATGGCTTTAGTTTTGAGCTGCTTTGTTTATTGTATTGAAGTTTGTGGATTGGGTTTTTGCGATTTTGTATATGCTCTATCTAGAAATAGCCCATTAGACATTATATATAACAAAAAAAAAACATGAAAAACACTAGAAATCATACAATCAAATCCGCATACCTGAAACTTAAAAGACTGGCACATTCGCTAATAATGAAACATGCATCAATGGTCTCTCAAGAGTCATATTATTTGCATAAGTTGATTTGTCCCTGCAAATTCCAATACAAAGCCTTGTGGACTTAATTAAGATAATAGATGTGAAAATTCAAACACATGAATCTGTTTAAAAGACAAAATAAACGTGGCATTATATCAAACATCTTGTAATTTCATATACATAAATATCAAATTGATATTTCCCTCTCTTTGAGAACTGTCCTTACGAATTCGTTTCTAAATAACATGTTTTAGATCCTAACTGTTTGTGTTCTTATGTGATGGTTTTTTAGGGACCGGTAGGTACAACGTGACTCATTCTTGTGAGAATCCAAGTTTTGAACTATGATTTAAAGTCACAATATATGGTTACCATCTCAAATTTTATGTAGAGTGCAACTTTTTCTTGAATTGGCGTGTGTTTGGTCTTCTCGAACTTGCTTCTAACGCTATTTCAAACTTGGAAAATTTTGATTTTCACTCTTTATCATCTTGTTTGTTCAATGAGATTAGCCGTTTTGTTTGTATATTGGGTGTGTCCAATTATGCTCTTTTCTTATGTTATTGTTTATGAATAACTTGTTGAACATTTTACTTATCAATTCACTCCAATATATCCTAAAATTGGGATATGCTCAAATCACATCTAGATCTCATGATTCATATTTCTATACCATTCTTTCGATTTTGATCTTGTTTCTGTCTACACCTCCTGTAAAATATATTTTTTACACAAAATGTATTTAAAACCCATTATACAAAATAATAAACTCCAGTAAAGTGAAGAATTACAAGTAGAAGAAAAAAAAAAGACATCTCGTACAAAGTCAGAATTGAGAGAGCCCTAAACACAAGGAAAAAAACAAGAACAACAAGAAAAAGTCCACTTTGTTTGGTTTTAGACAAAAACAGTAACTTACTTTTTTGGTCAAACTCTGTAGAAAGAATCAATCTCCCTTGTAAATCTCACCCTCCTGTCACCATCTTCCCTCCGTCACTTTCCCAATTTAATTTATAATCAGAAACCCTACATATACACCTAGGTTTAGGGTTTCGCTTTTTCAGAGAAAAATAGTTTCTTTTTCTTCAAGTTAAAAAAAAAAAATTATTAATCTGGTACGCTACAGTGCACCGAAATCCCATAGATGTATAATACTCTGAGCCGTTGATGAAGCTGACGCAACCGCCACATGTCTATCATCGGCAACAATGGCGTCAACTTCTCCTACTCTCTCCCTAATACTGTACAGATACTCTCCTCTCTCTACCTCCCACACGCGCATTATACCACCTGCGCACATTAGCGCGTGCAGTCTATTAACACAACCCATTACTCTTCTCTGCGCCGCTCCACTAACACGGAACTCACACACCGTTTGTTGCGTGTTCACCCTTCGCACGCTAGCGTTTCCTCTACTGTCCAATCTAACGTACGCTTCGTCGTTGGCATCGAAGCCTGTCACTATTAGTCCTCTACGTTGCTCTTCGTCTTCTCCGATGATCACTCCTTGGTTTCTTAGATCGATCACCATGATTCTCCATCTCGTGCATGCTACCGCCGTCTCGTTACCGGAGATTCTGAGACGGCCAAGGGACGTTGTTAGCTCTGTTAACGTGTGCCATCCCATGACAGCTTCAGGGTCGGTGAGTGTACCACCGACGAATGTTGTCTCTTCGCTGTTACAGTCCCATATGTGAAAGGCACGACCTGGCACACCCGCGAAAAGACCGACCCACCAACGTCCACAGCCAGTGAAATCTACCAACGCACCGTCGTTAACTATATCTCCTGCGTAAGCCGTGCGTGTGTGACCAACACCGTCTATTTCCGCCACGTGGATGTCTCCGTCCATCGTAGCGAACGTGAGCCTTGAGTCGGAGATAACAATGCCTGAGACGGCTCGTGAGAATCTACCAAAGCGGTCACGTAGAGGTGGCCGTAAGGTCCTGACGTGGAGTCGGTTGTTTAAAAGAAAAAGCCGGACGGTTCCGTCGGCGAACCCTGCGGCTAAGTAGAGGTCTGAGAGGGTGAGACAACGGCAAGAGAGACTATCAGGCTCGTCCACATCAGACGGGTCAAATTGGAGAGTGAAGTAGGTGTGAGTACGCGTCCGGAAGTTTCTAGCCGTCCGATGACGGTAGATGAACTCGTCCCGCCACGTGTCGTGCATCAAATGTGTTCTTGCCCAAACTTGGCGAGATAGTAGTTGCCATAGATGGTCGGAGCGAGAGACAGCGTGCCACGTGGTGCAAACCTGCGATTAAGAAAAATTATTATAAGTTTTAACAAATATTATAATTAGTAGCTTAATTAATAAATGTATAAATAAGGGAGAGAGTAAAAAAAGACATAGAAAGAAGATAAGTAGGCCTGCAACGAAGCATGAAAGACTCTATATATAGGGACTAGGAAGATGGAAAGACAACGACAGACTCAGACACAAGCTCTGCGTAATATTTGTCTTACTCATCGAAACACACAACTCATTTTTATAAAAATCTATTTTATGACATATGTTCAATTGACGGGACTAATCAATCTCTGGAAGCTATAGATAGAGATATAACAACAGAAGCCCTAGTGTAAAAGGAATAATGAGAGGAAGCCCTAGTCCCATGTCAAAAGAACAAAAAACAAATCAATGTGACAATAATACAAAACAGATGATATGTTAATTTATTAGGACAGATGAGAAGACTTTAAATGAGTTAAGCTGAACATGAGATTCCGACTTTGCCAACAAGCGTGCCCTTCTCTCTTTCATTTCCAAGAAAGGATAGCTTTTAAGCCTTTGGTCTTGTTAAAAGTAGAGCTTCCCATAAATACACAAATATTACACTTATATATAGTAGATGTTTCTCTGTCTCTCTCATCCCTCTCCAACAATCCGTGGACCTACATTCTCTACATTTACGTTTATATTGTTATTTATTGTACATCTTTATTCCTCATTAAACGCAAAGTAATGTATTTGACTTCGTACTCTAGCTCTATAGTACAACCTAAAATCAAATATTTCGAATTCTATACGAAAAGAAAAGATATCTTGTCAAACCAAAGGTTTAATGTCTATTAGTCAGATAATCATTATAAAAAAAGAATAATCTAGGCACTAGGGCACGAAATGTAACATAAAATAGATTAGTACAACAAATAACATATGATGGAATGGCAAATCCTATTTATTATTATGCAAATTACCAATCACATCAATATGATATACTTCAAATAAGAAGGGAAAGAAAGTAGTTCAAATATTCCTGAGTTCTAAGATGACCAGATTCAGAATATCACTTTTGTATTTTAATGTGTGATATATCAAATGTAAGAACATAGTATATAATCTATAGACACCACTGCACGTGCTCTAAGAGACCCTTAACATTGGGTTCCATGTGCTTTTCGGCATATGTATGCCCATAATGTCGTCTCTTTTGACTGAAAAAAATTAAGGAAAGAAAAAAAAAAGATAAAAACCCACTTCAATGGAAAAGATGAATCGAGTCAGGAAAAAAGATAATTCCATGATCAATTTCAAAGTAAAAAACAACAATGAAAACTCTAGACTTATAGCCTTAATTCTCTGACAAAAGTGTTATGCTGTAACTACACTGCAGTTTCTTAAAATTTTAGGGCAAATTTGAAAATTCAATTAATTAGAAAATATTATGGGATTTAATAATGATTTAGAATTATCATGTATACATAGAGAAGTGAGATAAAATAAGAGAATGAGAAGTTGTCAGAAGCTCTGCATGCATTACTCAGTGGATCATAATATTGGCAGAGAAAAAAATAACAAAAGCAGGACGCAAAAAATGTACATATGTACTTATATACTATTCCTCGTTACTATATATGAGAAAAATCTTCAGCATAATATATATATGTATTATTTGTTTTTTTATGAACAAAAGAAAAAACAGCTATTTTCATATATAACATAGGATTATTAAAAAGAATAATATGAATGCCTGATATAATACATGGATCATATATCTGTTGATGAATAGAGTTTTCATGTATGTAGAAAATAACCTAATGTGGTAATATAGGACTAACATTGGCAAGGCAAAAAGACAGGACCTTACTTAGGTTTCTTTTCATTCTCTTTTTAGATGTTGTTAAATGTGCAACGACATTTTCTAGTTTTATGAGTCTGTCGTGAGAGGTCACTTTCTATTATTATAATTTTAAAACAATTAGCAGATAAATACCGTTATAATTATAATTCTAAAAAATATTAAATCTATTGGGCATTGGACTAAAGACTGTGCCTAATGTCTATCAACCAATATTTGGAGACAAGAAAGTGTTTAATTTGATTATTATTGTAAGAACTTTTGAGTCAAAAAGTGGATTTCTTGATCTTAAAAAAGGGCTTTCTACATGCCAAGAAAGGAAGATTTAAAGCCAATAAAATAAAATAAAACCTTGATTTTGTGCCCTAAGGGATCCAATTCATAATATAATATTAATATTAGAGTTACTATGCCCAAATGTTGTACAAAGATTACACAAACGAGATGGGGTTGTATGGTCTCCTTAGAGGATCCAAAAATAGACATTAAAAGGTATCAAAAGTAGACGAGAGAACAATGAAAAAGAAATAAACTTATTGGGTAAAAATGGAAGACAAAAAGTTTCTAAATACATAAAAGAAAAACAAAGTCCCCAAACTATATGATATGTGAAAGAGACATCAAATTAATGTCGTCTTGTTAGACATAAAAGTTGGACTTGGACCCATCATAGAAACACAGAAAGGGCGGTTACCTTTCCAAAGGTCAGTTTTTTTTTTTTTTTGTCTCTTCAGAATCCCAACCTTACAAACTAATATCACATTCAATCGAATTGAAGTAACATCATCACTTAATTATGATCTAAAGAGTAAGAATTCGTTATACCAAAAAGAATTAGAACGGCAGAATCAAATCTAAGCTTAGAAACAACTAAAGTACAAGACACTTGAAACAAGCAGTACATTTGACTAGACCAAGATTGTGTCCCTCCACTTAAGTTATTATAGACCCACGACTACTTTGACTTTGTTTTGTCTGCATAAGATCTATGTCTCACTATTTTCAAGTTCAAATATAAGCTAATAAACGAATTCAGATAGTGTAACGAAAATATTACTTTACTACCTGAAGTACATATATATATAGAGAGACACGAGATAATTGATGTGTCTCGACCGTTACAAAACTAAAAGAAGGTATTCAAAGAACGTTAGAACTGACCCGAAAAACGTTGGCAAGAGCCGGAGCTGCGGCGAGGAGGCCGGCGGATGTGGAAGCGTTAACGGCAACTTGAACGGCGAGAGATTCAAGAAAAGGCTCCGGCCAAACATCGTTGGCTCCGCGGCGAGGGCGGGATGGAGATGGGGCCTCGAAAACGCCGCCGCTTCCACCGGCTCCGTTGTCGGAAGAAGAGGAGGAGGTAGACATGAGACGAGAGGGGTTATAAGAGGAACAGGGGAAGAAGAAGAAGCGGAGAGAGGAGAAAGAATGGTGGGGGAGAGAGGAAACAAAGGACAAAAAGTGTAGATAAAGACATACTTCTCCGAGGTGGGGGACCCAGGTTGTGAAGGTATGTTTTTTTCCTATTTTTATTTTCTTTTGTCAAGATTTGTTATTATTTGTTTTTGTTTATTCTTAATAGATGCAGATTTGTTTGTGAAATAGCTTCAATTTTATATTTTTTAGGAAAAGTATTGGTTCAGTATGGTGACATATTTCAAAATTTCTTTCTTTTGATATGCAGATTTTGAATTATAATGGCAATATAACAGCTATATTATTATAAATCACTAGATTTATATTTTGACGATTTTTTATATTTAAAATAGTGTTATATATCATTAAGAATTCAACAATATATTTGCTAAGTTTATTTCCTTCCGCGAACATTAGTAAATTTTTTGTATATGGTAAACTATTGGCTAAACACAAATATTTGTAGATCGATCCATTTTAAAAATGAGAAATAAAATAATATGTATACGCAAAAAATTTGTCAGAGAGATCAAACTCGTAGCACCAAATCTCGACTTTCATACCAGTAGTAAAAACTTTTAAAGCATAGTTTAACATATTTTTTTTTCCCAACATACTATTGTCATTATAAGTAAATAATTTTTGGAAATCTGGTTAAGCATATTCTTATCATTACAATCCTCAAACCTAGAATTCGCCATATTCTGTCATCACAAAACTTAACCCTACTTTTTCTCATATTGCAGCTATCACGATCCTCAAAACCACGGTTCATCGTGAACTTTAGTCCAAACTCATCACAAACCAACACATGAGCATGCGATGCTTTTAAGTTTATTCCTCAATCTAAATATAGAAATATTTACATTTTCTGAAAATTATTCATATATATAGTGCTTTTATATAATTACAATTAACATTTTTGATTAGTATTTTTTAGTTAAAACATTTTTATTCTTTTTTAATTAAAAATAATTAACGAAATAATGATGAATCACGTTATTAAGAGAGAAAAAAAAATAAAGCCACATTATTAACGTCACTAAGAGGAACATTTTGGTTTTCCTCCCAGACATTGTTCATCTTGGGAAAAAAAAATGTCTTCTCTTTTACTAGGTGTTTATCCGAAAACGAAGAAAACCTATTTCTCGTGGCTATTCTCTCTTTCTCTCGTCTCTTCCGCCCGAAACTTTTAACGTCGTTGTCATCGAGTCACATTTCGTCTCAACTCAACTTGTTTCGATATGTGTCAAATCTTTATTTCGATTTTTCCGACAATAATCAGACATCTAAGTTCAATAGCAAGTGATTCCCATGATTAAAACCATTTTCTAAAACCACTGTTATGATATTGATGGTTTTTATCGACGCTTATTACGGCTGATTTTTGCCGTCGATTTACATATGGTGGCTGATTTGTTATTTCTATTCGATTTGATGGCTGAGTTATTGTATGCTTTAGGACTGATTTATGATTTATTAATGCATATGTGGTTGAGTTTGTTTTGTGTTGTGGCTTGGTTACTGTATGTTTTATGACTGATTTATGATTTATCAATGCATATGTGGCTAGGTTTGTTTTATGTTGTGGATGAGTTATTGTATGTTTGACTGAGTTATGATTTATCAATGCATCTGTGGCTAAATTTGTTTTATGTTGTGGCTGAGTTAATGTATGGTTATGGCTGATTTATGGTTTATTAGATGGCTAAGGTTATTTCTGAAGAACAAGCAAAGGATTACCCTCTAAGAATTTACGCAGAAGGAGAGTCTAATCTAGAGAATAAACTCATTAATCACAATATCAAGATGACATATTTCTATGGGATTTAGAGAATTAGTATGATAAGATGTGTGGGATCAAATGAAGGAGGCACCTATTGGAATAATTACTAAGTTATCGAATAGTCAATTCGTGTGGTCTCGTAAGACTGTACATTTTCTATTAAGTAGACAGTTAATAATACTTTTGAAGGAGATTTGGTGTCTCGTTGGTTAATGCTATAAAGATGTTGAGGCCTATTGGAAAGTCGTACACCATCAGTGGTATGGTTTTCATGTTACAGGCTTGGGCATATGATTCAGTCAAATGCTTTGGAGAGCGATATAGGAACGTAGTCAATAAGGATGAAATATCGTTGCTTAGATGGGGTGGAAACCGTACACGTACAACAATGGAATTTGATGTAGGTCAAATTGCTCTAAGTTTACTCCCTCAAATAAGAGATCGTCGTTAGTACTTAAGGGTAAAATTCCACAAAACTCTTTTGTTCACACAATAGGCTAAAGTATCAAAATCAAGCTAGATAGATGATAAGAAAATAAAAAGAAAGCAAGTAAGTAGATAGTGGATTGTGAAGTTGTAAGACAAGATAATAAAAACGTTAGGTTTAGGGTATTCTCAGGAAATAGATGATAAGAGATATAGAAATAGCTAGGATGTTATCGAATCGTTCTTAAACTCAAACCCTAATTACAGAATAAGCGGTGGTTCGCCGTGCTACTCAATATGCCTAGGGCTAAAGATTCCCAGCGGTCGCTTGGCAAATCCCTATATTAAGACATGCATGATAAACGAGTTTGATAAGTTCACCTAAATAGATAGGCCGATTCTTATTTCACATCTATAAACTTGGCTCATCAAATAGTATTTCTGGTAACATATACCTTTTTGGGCATACCTATTATTTAAGATTAAGTTCTAATTAGTTACTCTAGAACTAGCATTAAGAATAACCAAAGATGAAAAATCCTACATATATCCTAGCAGGTGAACAATCTACTAAATCATCTAAATCCCTAATGAGAAACCCTAACCCTAACAAGTAGACTACTCATACATGATGGATGAAACAAACAACATTTATGAATGAGAAAGCATAAACAAAATCAATAAGAAGAAAGAGTTAGAAAATATCTCTTCGGTATTATTGAAATCTCTGATAAAACTCAGAAAAATGAATCCAATGTATAAATAGCTTATAAAATGCTTTAGAACAAGTTAGGTGGCTAAAAACTTGTTAGGTCACAACAATGACCTTAAAACTATATATATATATATATATATATATATATATAACCTAAAAACGTGTAGGTTACATTATTAGGGCGCAACTGGTGTCGATCGACACCAAGAGTGTGTCGATCGACACTCTCGACTTGATCTGAAACTAAATTCGTCATTTGGCTTAGTTTCTTTAGCATTTGCTCCAAATTGTCTCCTTAACTCCATTCTTGTCCCAATCCAAAGAATACCTTAAAAGACTCTAAAAGGACTCTAAAACCTATATTTAAATCATAGTTAATGTTGGTGTCGGATCCCGCATCATGGGCTCGGATCCGGCCAAAGATTGCTACGTGGGTAAAAGAAGCCCATAAGAGAAAGGCCCATAAACGTCCTCGAGGTGAGAGTATGGATGAGGTGTTGAGTTGCGAAGTGAATACATCATCGAAGTCAAGACTACCCGGATTGAAGAGGCCGAATGGGCCGAAAGGTGAAGTCAAGAAAAGCTCGGAGTGGATTCAAGTTCCAACGTTCAAATAGTTAATTCGAAGGCTAGAAACGGACACATTTAAGATAGAATGATTGTGAGTAAATAGGTATTAAATGTATTCTTTGGGTATAAATTGTGGGTCAAAGACCATGTAAAGACAGACGCATTTCTTGGTGCAAATTAGCTATACACACTCTTTTACAATACTCATAGTTTTCTCTATAGTCACTTGTCTATTTTCTAGTATATTTGTCCTCAAGAATAATCCTTCCCACTAAATAAATAAATACTTGAGTGTGCGAATCCGACATCCACAGTTAAAAACAGTAAAAATAGGGTTATATCAGAATCGACCATTGCTAAAGATATCTAAGTGCATGGTGAGATAAGGTTTTGGCTGTGTTGTGATAGTTACTGATTGAGTTATGATTTGAAATGGCTGATTTATGGTTTGTGATGGCTGATTTATATTTTATGATGGATGATTTATGGTTTGTGATGGCTAAGTTATATTAGTGATGGTTTAGTTTTGATTTATTGATATTTGAGTTATATTTTAGTGATGGCTTAGTTATGGTTTAGTGATGGTTGAGTTATGGTTTAGTGATGTCTAAGTTATAATTATTGATGATAGAGTTTAAACTAACTAATGTGTTTTATTTTGTTATAGTTGCGTGTGAGTAAAATGGTTATGAAGGATGATGTAAGAGAGTTATTTCATACGTGGCCAAATCAAGTAGAAGACCCAACACTTGATCACTTGATCGAAAACATACATGAGAATAAGTTTGTTAAAGGTTATAGGGATGTGAAGAGAAATGAGAAGAAGAACAAACATGTAAATGGTAAAGTAGCGGTTGAGTCTGAATCTCACGCAAAGAAGCAGAAAGTCTCCCACAGTGAGGGTGGTGAATATTATGAAGGACATGCACAAAGGAAGAAGAAGAAAGAAAGAAGCAAAGGTAGTGATTTGTGAACAAAAGTGAGGCTGGTGAATCTGGTGAAGGAGATGCACAAAAGATGAAGAAGAAGAAGAAAGAAGCTAAGGTAAGTTATATGGTCTATGGTGAGTTTATATTTTATGTAATGTTTGGCTAGCTTGTTAGTGTTTGTTTTTTTGTATGTATTGCATGGTGTTAGTGAGGAGGATGATGTTCTCGAAGATGTGTTGGTTAGAGCAGTCGTGGATATGGTGTCCAAATTAACTTCAAGTTTTAACACTGTTGATACAAGCATTAGAGAAATGTCTTCAAATCTAGAGAAGGTGATTGGAGATAGAGTGGAAGCGAAGATGGATGCAAAGTTGGAAAGCGGATTTGGATATATTGATAGTGAGTTCAAACAGAAGAAAGAGCATTTGAATGTCATGGCCATGGGGGTAGAGCAAACTGACCAAAAAGCTAATGATTACGAGAACTCAGAATTCAAAATTACAGATCTACTCAGTATTTAGAAGCAGCGAGATCAGCTACTATGACAACAACAACAACAAAAAACACCAAAAGGTTCAAGAAAACCTCGACAAAACTACTATGTTACTAGTCCTCCTCATGTAAGCTAATAGTGCAACACATATGTTTGAATTATAAATACATTGCGGCTGATTAATAATTTTCTTATTTACTTACGGCTGAGTTATCATTATCTTATGACTGAGTTATCATAATGTTTATACAGGCGAAGGATATTGTCGATGTAGTAGAGAAGGATAATGGTATTGATGAGGTCAATAAGAATATGGATAAAAAATTTGTGAAGGCCATTGATGGGGTCAATAAGAATATGGATAAAGAATTTGTTAAGGCCATTGATGAAAAACGATGGTGATATTGGTTTCATTGAGAAGTCTCTTGGTTATAGGAAATTACGCCCTACGACGAGGAGAAATAACAAAGAGAATGAAGAGGTAAAGAAGAAATCCGTCAAAGAGCAAATCATCAAAGAGCCAACCGTGAAAGGTAAGAGAGGTAGAAAACCTGTAGAGGCGAAAAAGTTGACCATATAACTACATCCTGCTCTTGTTATTAATGAGAAGGGAGAAGCTGATGAAACAAAATTACCTGCTCTTAATGTGAAGAGAGAGTGTTGTTGTCTCCAAAAAAGCTGAGGAAGTCACTGACAATGATGGTTAGAAGGAAGGTGACAGTGACGTATGAGATGTCACATACCAGTTTATCGGTGAAAACGGAAGCACGTTCCCTGAGTCTGATGATGATGAGGATTGATATAATCGAAGCTTTAAAGACGCAGAGTATTAAGCTGTCTACGGATGGTAGTGCATTGAATCCACTCTTTAATCTCTCAACACGGGTTTTTCCTAATACTGGAGACAACAGACTGAAGTGCATGAGGAAGAATTGTGTGCCTTCAGCTGGAATATATGATCCTCTATCACCGGCTGATACAGCCAAATTGTAGAAACTTAAGGATTACTTATCCCCATTCTAGTATGACCCTTTATACCTTATTAAGTTGTTAATTACAACTTGTTAACATTATTTCTGTATATTAACTTGTGTTTATTTGTTAGGAATCTCCCATTGGGCAGGGCAACAAACGATGTTGATTTCTACAGGGTTATCATCTCCGAAAGAAAGCACTGACCAACCAGAGAATATGGATGGTTGTTCGATAGTGTAAGTATTACATTAGCAGAGTTATTAGTGTGTTTTGTCAGAGTTTTACTACATTATGGCTGAGTTATTGGTGTGTTATGCTACATTATGGCTGAGTTATTAGTGTGTTTTGTCTAAGTTATGTTATATTGTGTCTGGGTTATTATTTTGTTTTGTCTGAGTTTTTTTTTTGTACAACATGTGGCTGCGTTATATAGAGTCCTCAGGAATAGGTACAAGCGAAATCTCTGCCCATTCCACAACAAACGCATTGCATTTCTAGACACGTGATTCGTGTCTTTTTGGGTTAGAGAGTATGTACAGTGCAAAATATAAAAGAAGATGTTTAAATTCAAAGACACCCCGTATGAAAAGATAGTTAATGGTTTGCTTCCAGATAATCAACAGACAAATATGAAGTGAATAGAAGATGTGAATCACTTGTATTTGATTCCCCAAACCAGAGGCGATCACTAGGTGGCACTACACATGGACCAGATTAAGGGGCACATTGATTGCTATGATATCATTGTGGGATAAGTTACAAGAAACTGAATAGAATTGATTAGAATGTTGTAGGCCGTTTACGAGAATGATTCCAGCAATGATGAACGTGCTAATTCCTACTACAATCGGTGAACATAGGTTTGAGCAGTTTACATTCAAAAGGAGTAGTGTCTCCAGGGTCCCTCAAAACGTACAAGTTGGAGCTGCGGCGTGTACTCGTGTTAATTTTTTGAATGTCTAACGCTTGGTATAACTTTCAATGACATATGTGATTTCAACCTATACAGGTTAAGATGGCAGCATATATCTACAATAAGGCACCTAATCTGCTTGGACAGTTTAGGATTTTGACTTGGGATAATTATATTAACTTTTGAATCGTATTTTTTTCAACAATCCATAAGACCAATGAATTTTGTTTTCTTTATAATGGTTTGATTTCAAACTAATTTTCATATCTTGGCATTTTCAGATAATTAAATTGGAATTTTACATTACAATTATTCTTCTCATAGAATCAAAATGATAAATCTATATTAAATATGTTACTATATTCCAAACTTTTTTGGTTTAGTTTTATGGACTTACTATATTGTGCATAACTCAAATTAAATTAAGACATTTTCACTTGGGATCACTATATTAATTTTTGAACCGTATTTTTTTCAACAAACTATAAGGCCAATGAATTTTGTTTTCTTGTAATGGTTTGATTTTAAACTAATTTTCATATCTTGGCCTTTTTAGATAATTTTATATTAGAACTATTCTTCTCATAAAATCCAAATGATAAATCTAAATTAAATATATTGCAAATCTTCCGAACTTTTGTTTGGTTTAGTTTTATAGACTTGCTATATTATGCATAACTCAAATTACATTTAAAAACTCCATTTGTCAAACATTAGGTTTTAACAAATACCTCCATAATCCCCATGTGGCTTTCTAGTACAATTATTTGTCAAACCTACGATCTATCTTCATTTTAGAATTTCTGAGATTTCTCTCACAGCCTATAAATCAAGTACAACATTAGGTTTATAGCATGATCTCCAACATTAAGAATAATCAAGTTTTTACCATTTGTTGTTATTTCCAACTTAACATGATCAAAACTAAATGCGTGGAGTCTTTATGTCCTCGACATAACATTATGTAAATACTTTTTGACTAAAAATAGTACCATTCACCCTTCTAACTCTATGTCAATTTGACTACAAAAACATTTTGACAAAAAAATGAACGATTACAAATTACACTGATGGAAAATATACTTAGTCGAATAACCACCAACGGTTGAATGTAAATGTGGAGTTCCAATTATTAATCATTTTTTTCGGCACTCAATTCACGAATGTGAATCACCACTAACGCATCTAGGAATATATATAGTAAGGTATACAACTTATTTTTTAATCAAAACAAAAAAATATTTGTAGATTTTTGGGACCTTTGGTTTTCCTTAAAATAGATAAGGGAATATTGGAGGATAGATATGAATCTATATGAATTAGAATTTAAGGTCTTAAATCCCTTTGTGATAAGGTTTGGGATACCTATATTTTAGGATCTGTGTTTATCTCCTGTGGAAACTCTCTTGTATAAATACGAACGTGAGTTCATCAATAAAAGCAAGTCACTTTGATAACCAATTCTACATGGTATCAAAGAGCTGAGATCATCAAAATCATCTTCAAAAATTTTGTGTTCTTAAGTTAAGAATTCTTAAATTGTTTCCTTTCTCTGTTGAGTTGATAGTCTTGTGTGTCAAGTAACAATGACAAACCCAACGTCTGGTGATGGATCTTTGTCAACCATGTCGAGTTCTATCGGAAAACAACCAGAGGTGGTGACGTCGGCGGTGACAGTGTCACCGTTCACTCTTTCTAGCTCCGATAATCCGGGGGCTATGATTCCATCGGTCATGTTGACTGGTGACAACTACAATTCTTGGTCGACAGAGATGCTAAACGCTCTTCAAGCCAAACGAAAGACGGGTATCATTAACGGTGCAATACGTAAACCACCTGCTGATGATCAAAATTTCGAAAATTGGACAGCGGTGAATTCTATGATAGTTGGATGGATCCGAGCTTCCATCGAACCAAAGGTGAAATCCACCGTGACTTTCATCTCAGATGCTCATCAATTGTGGATTGATTTGAAGCAAAGATTTTCTGTGGGCAACAAAGTGCGTATTCATCAACTCATAGCACAGCTCGCGACATGCCGTCAAGATGGACAATCTGTTTTAGATTACTATGGACGGTTGAGTTCGTTGTGGGAAGAATACCAAATTTACAAACCCATCACTACGTGTACGTGTGGTTTGTGCACTTGTGGTGCCACATGACAACCATCCAAAGAACGAGAAGAAGAGAAGATTCATCAATTTGTGTTGGGACTTGATGAATCTAGGTTTGGAGGAGTTAGTACCAATATCATATCTATGGATCCTCTTCCAACTCTTGGTGAAGTATATTCGAGAATCATAAGAGAGGAGCATTCTTCTCGCAACAACGAGCAACATCGAGAGTCAGTTGGTCTGTTTACTCGACATGACCAGTCTGCTTCAGATGTCGCTGCCTACTTTGGGAAATCAGATGTGACTGCTTTAAACAGACCTGAATCCTCAATCATCAAACCCCGAGATTGTAACGTGCTCTGTTCGCATTGTGGACGAGCTGGGCATGAAAAACAGGAGTGTTGGCAGATCGTGGGGTTTCCTGATTGGTGGAAGGAACGAGAACGTCTTCAAAAGGCTAGTGGTCGTGGAGGAGGAGGACGAGGAGCAGGACGAGGAAGAGGACAAGCTTTTACAGCTCATGCCACAAGCTCACATTCCTCTGTTTTTCCTGACTTTACACCGGAACAAATAAAGGTTCTTCAACAAATGGTCACCGAAAAATCAAGCACCAATAACGTCGACAAGTTGTCGGGTAAGAGAGCTCTTGGTAATGTGATACTTGATACAGGGGCTTCTCACCACATGACGGGAAACCTTTCTCTATAACATAACATCAAAAATATTTCGCCATGTTCGGTGGGATTCGCAGATGGAAGTAACACATTTGCCTTGAGTATGGGAGTGTTCCCATTGTCTGACACGGTTTCGTTAACCGATGTCCTATACGTACCATCTTTAAATTGCACACTTATCTCAGTTGCTAAGTTCATAAAACAAACCAAGTGTGTAGCTTTGTTTACTGAGACCTTGTGCGTTTTGCGGGACCAATTTTCGAAGACTTTGATTGGAAGCGGTGAAGAGCGTGATGGGGTTTACTACTTTACGGATGTTGTTTCACCAAAGATACATAGCGTGGATGTTGTTTCTGACAAAGCGTTGTGGCATCGGCGATTGGGACATCCATCATTTTCTGTTCTTTCAACTTTGCCTATGTTTCTAGTTCTTCGAAATCTGCTACTCCAAGTCCTTGTGACATTTGTTTTAGAGCTAAGCAGACTAGAGAGGTTTTTCCAGAGAGTTTTAATAAAGCAAACGATTGTTTTTCTTTAATACATTGCGATGTTTGGGGGCCTTATCGGGTTCCATCTTCATGTGGAGCAGTTTACTTCTTGACTATTGTTGACGATTATTCAAGAGCGATGTGGACATATCTGCTTCTTCAAAAGTCAGAGGTACGAAATGTGTTGACAAACTTCATTGCATATGCAGAGAAACAATTTGGAAAAACAATAAAAATCGTTAGGAGTGACAACGGGACTGAATTTATGTGCCTCTCTTCTCACTTTAAGCAGCAGGGTATCATACATCAAACATCTTGTGTTGCGACGCCACAGCAGAATGGTAGAGTTGAGAGAAAACATCGCCACATTCTTAATGTTGCTAGGGCATTGTTGTTCCAAGCTAGCTTACCTATCAAGTTTTGGGGAGAAGCAATTCTTACTGCAGCATATCTCATCAATTGCACACCCTTTTCAGTTAACAATGGTCGTTCCCCATATGAAATTCTACACAACAGCAAGCCTCCCTACGATCAACTCCGAGTGTTTGGTTCAGCTTGTTATGTTCATCGTATGGCTCGAGACAAAGATAAATTTGGAGAAAGAAGTAGACTTTGCATTTTTGTTGGTTATGCTTATGGAAAGAAGGGATGGAAGGTTTATGATTTGGAGAAAAATGAATTTTTCATATCTCGTGTTGTTATTTTCCGGGAAGATGTTTTTCCATATGCAGCTGGTGATGTTAATTATGTGCATGTTTCTTCAATACAAGTCATTCCTGATGAAGACTGGCTGGTACCTCCGTCTATAGTTGTAAGGGGGAGCTCAGAGTCTCAAATCGACTCTGTTCCAGCAACTCAAGCGGCTCCTCAAATCGACTCTGTTCCAGCAACTCAAGCGGCTCCTCAAATCGACTCTGTTCCAGCAACTTTAGCGGCTCCTCAAAACGACTCTGTTCCAGCAAGTCCGGTTTTGCTTGAAAAATCCACGAGTTCGTCTCCTGTTACAATTACACCACCAGCTTCTCCGAAAATAAGAACATCGTCTTCTTCACCAACACTAGCGCCACTTGTTGATGTTTTAAAACCTGCAGATTCGCCTCATCCTATTGTGGAATTGCGTCGAAGCAAACGAGAACGACAGGAATCTGTTAGACTCAAAGATTATGTGGCTCATAAAGTAGTATGTTCTTCAGAAACCCATCACGCTCTGCCCATCACTGCCTCTCCATCATTGTCTTCGTCAACGGTCTAAGGTACGTTTTCATCTGAATATGAGTCTCTGTATTCGTTAACAGATTTTATCTCGGATGAACAATTCTCACTAGGACATCGTGCGTTTTTGGCTACCATTACAAAATCGGTTGAGCCTAAGCATTTCAAGGAAGCTGTTCAAATAAAAGTTTGGAATGATGCTATGATCAAGGAAGTTGATGCTCTTGAAATTAACAAGACGTGGGATTTGGTTGAGCTTCCTCGCGGAAAAATTGCACTTGGAAGTCAGTGGATTTACAAGACGAAATACAACTCGGATGGTACGATAGAACGGTATAAAGCTCGTCTAGTAGTCCTGGGTAATAATCAGATCGAGGGAGAGGATTACAAAGAAACTTCCGCCCCTGTCGTGAAAATGACTACGGTTTGTGCTCTTCTTCGACTCGTTGCTGCTAATCAATGGGAGGTATACCAAATGGATGTCCATAATGCATTTCTCCACGGAGACTTGGAAGAAGAGGTATACATGAAACTCCCTCCAGGCTTCCGTCATTCACACCCCGATAAAGTTTGTCGACTTAAAAAGTCTCTATACGGACTTTAACAGGCTCCACGTTGTTGGTTCAAGAAGTTGTCTGATTCGTTACTTCGATTCGGGTTTGTTCAATCATATGATGACTACTCTTTATTCTCTTACACTCGTGAAGGTATGGAGATCCGAGTTTTGATATATGTCGACGATCTCCTCATTTGCGGGAATGATAATTATATGCTTCAAAAGTTTAAAGAATATTTGAGTCGTTGCTTTGCAATGAAAGACTTGGGGAAACTCAAATATTTTTTGGGGATAGAGGTGAGAAGAGGACCAGAGGGTATTTTTCTGTCACAGCGCAAGTATGCTTTGGATATTGTGGCGGATTGTGGAACTCTCAGTGCTACAGCTGCTGCAACTCCTCTTGAACAAAACCATCACTTAGCTGATGACGATGGTCCCTTACTGGCTGAACCAAAGAAGTATCGAAGGCTGGTAGGACGCTTGATCTATCTCACTCACACACGACCCGAGTTAAGCTATTCGATACACGTTTTATTTCAATTCATGCAAGTTCCACGTGAGGCTCATTGGGATGCTGCTCTTCGTGTCGCTCGTTATCTAAAGGGAGCTCCTGGTAAAGGCATTTTGCTCAAAGCTAATCCGGATCTTACTCTTACTGTCTACTGCGATTCAGATTATAATTCTTGTCCTCTAACAAGGCGCTCTTTGAGTGCTTTTGTTGTTTTGCTTGGTGGCTCTCCTATTTCTTGGAGAACAAAGAAACAAGACACTGTCTCTCACTCTTCCGCTGAAGCTGAGTATCGCGCAATGTTTGTCGCTCTCCGTGAGATAAAATGACTTCGAAAACTCTTGACAGGATTGGGTATCAAACTCACTGCGCCAGCTCGTTTCTTTTGTGATAGTTAGGCTGTGATTCACATTGCGGCAAACCCAATGTTCCACGAACGCACCAAGCACATCGAATCAGACTGTCACTTTGTCCGAGATGCTGTCCGAGATGGACTTATCACTACTTGTCATATTGGCACTACGGAACAGCTAGCAGATGTCTTAACCAAGGCCCTTGGACGTGTTCAATTTCTTACCTTAATGTCCAAGTTGGGCATTCAAGACCACCATGCTCCAACTTGAGGGGGAGTATTGGAGGATAGATATGAATCTATATGAATTAGAATTTATGGTTTTAAATCCCTTTGTGATAAGGTTTGGGATACCTATATTTTAGGATCTGTGTTTATCTCCTGTGGAGCTCTCTTGTATGAATACGAACGTGAGTTCATCAATAAAAGCAAGCCATGATAACCAATTCTACAGGGAATTTTAATAAAATGTCAAATCTCTCAAATTCATTTTGTTTTGTGGGTACTTGAATTCAGCAAACGATTTGTCATTTAAAAAAAAAATCCTAAGCAATCAAAATTTATGGTTTTTAGCTAATTTGATTTGCGTGGCAACATTGTATTTACCGATTCTGTGCAAATTTGACTTAGGCCTTGTGAAACCCCAAACAAATAGGATGGCAAATAATGACAAGAAAACCTCATTTTGCTGTATGATTGATACATTTATTTTGCAAATGTCTTTGTAGTCAAACCCGACCATACAACTAAATATAAAATTTGATTGGATCAGAAACCATATATTCTCTCGCTGGACTCTTGTAAGAAAACTAAAGATAATCTAATACGATTCAGGTGAAAAAAACTAACATCACATTATTTTTGTATAAGTTAATATTGAACTATATATATATATATATATATATATATATATAATCCTTTTACAAAAAATATATTTTATATATATATATATATATATATATATATATATAAATCTAAAGAAGAAAAACACATGCCTCTTTTCTCGAAATATAGATGAGTGTTGCCATAAAACAAATATGCAAATAAGTATGTACAAACTTAAGTATTTTTTACCAAAAAAAACATAAGTTTTTTGGTCAATTATTTATAATAAAAGATTTTCTAGTTCATATCATTGTGGAGGATGGGCTTTAAAAAGTATTAAAAAGATATTTAAGAAATGAAAAATAAATGGCAGTAGAAAAAAAGAAAAAAGAAAAATAAATGATGGCAAATATATCTAATGAAGAGGAGGATTTAACAAGATTTATGAAAAACTATAAAACGTTATATAGTGTGTAAAAAGGTAATAAATAAGTAATTTTTAAAATTAGTGAAATTTATAATAATAATTTTTAAAATTAAGATTAAATTCTATTATAATTATAAGAGGATAATATAAATCAATTCTTAAGAAATTATCAGAATTGGCAATGGATTCTGTGTATTATAATTATAAGAGGATAATATGATTCATTTAGATTCAGTCAGCGACTCTAAAAAATTATACTTTACAACAACATAATAAATCATAAGAATTGGCAATGGATTCTGTCTACCGAAAGATGTGGGGTGAATTCATATGACGAAATAAGTGGTGCAATTTCGTAATAATCGAAAGATATGGGGACTAAATCTTAAATAGAAACGTTAACTTGATCACAACGGCTATAATTAGTTACTAATCACAGTAATTAAACCACTAAACTCAAAAGAAAAATGGAAACAACAAAAAGCCCTACCCTCTTTCCTTAAAGAGAAGGCAACTTTTTTCTGCATTATTCGATCAGCGGCTCTCCATCTTTCTAATTTCCTTGTTCCTCACGACTTCATTCTCAGAGCTTTCGAGTCTTTCGGTTCCATTACAATGACTATGTACGATCTCACGGATTCAGGGAAGGATATGTGTTCGAGTCTTTGTTTACTGGCCGAAGTTGCGGTTATGGTTGCGGAAGAAGAACAATTTCGTCGTCTTCTAAAGACTGTCTCTAAAGAAGAAGATAGCGACAAGAGTTTCTTCTATCGTTTCCCGAGAAAAATCAGATCGTCTTTGGTGAAGAGAAGATACACGCAGCAAAACCCTAACGGGGCTTCTACTTCTTCAGCGGTTCTCGATCTGAACCTAATCACCACTGATTACGACTTGAAAACCCAACAAAACCCTAGTTTTGATGAGCCGTTAGTTGGTGTATAATGGGGCTTCTGCGTCTTCATCGTTCTTGAACCTTCGTTGTTATGATCCTTCGTTACCCTTGGATTACAACACGGCTAAGTTGGGGAAGACAGAGAAGAAAAACCTAACAAACCCTAATTACCAATCTTCATCTTCGTCTTCATGCCTAACGGAGAACAAAAGCCGCAAGAGGCGTGCCGTGCAGCAGAGGAAGAGTGGTAAACTCAAGAAAGCGAGGGTTGTTTCTTTGCCAAGGATGTCTATAGAGACGCCAGAGTGGGTTTTCCAGGTGATGAGATACATGAACGCTGATGCTGAAACCCCGAGGCTGATATTTGAGAGGACTCTGTTCAATAGTGATGTCAAATCAGGCCTGAGCCGTCTCTTAATCCCTTTCCAGCAGCTAATCAGAAACGACTTCTTGACGCCTGCGGAGTGTAGAGCCATACAGAAAGACGAAGACAACGAAGATGACAAGAATATTGGTGTGGGAACGATTCTTGTGAACCAAAGATCTAAAATGTGGGGTTTGCGTTTCAAGATATGGGCGATGGAGAAGGACTCTGGACACGGAACATTGAATTACATTTTGAATTGGGGTTGGAACGATGTAGTCAAAGGTAACGGCTTAAAGGCTGGCGACAATATCAGTCTTTGGACTTTCAGGTGCCGTGGAGTCCTCTGCTTTCCTCTTGAGACATAGTAGCTCTCTGATATTTTCATTTGTCTCTTGAGGTTTCATTTATATAGTTTCAAGTGATTCTTGAGGTTTTTGCCTTTTTAGCATAGTAGTAACTTGTTGGAAGTGTTAAGTAACTTGTCTGTCTCCTCTGTTGTCTCAGTTCTTTATCATTGTTTGAAAATAAACTATTTTGTCATAAGTATGGTTTGTTGTTTTGTCTACTTAAGTTACTGCATTGTTCAATATACCTTTGTGTTATCTCAGATCTCTCCTCTAAACCTGTTGCAATGATGGAAATGGTCTATTCCTGCAAGAGTTTTGGTACATTCCTCCGAAATGCTCGATTTAGAACCAAAAACAATCAAAAAATGTCAGAGAAAAAGCAAGTTTTGGTAACAAGGATTTATCTACGCATTGATAATATCGACAAGTTAGTTTACTCATATTAACACCAAATCATATTGTTTCTGTCGAAAGCTTAAGCTTCTCCAAGATCTCCCCATCTCACATTGTACTTAGATGCAAGGTAATGTGCACCAACAGGACCTCTGCTTCCATATGGATAGAGCTCAGGAATGATTTTCTTCTCCTCTAGTTCCTTCAAAGCCGGTGTGAATAGATCCCATGCTGCATCTAGCTCATCACTTCTGATAAACAACCTCCTCTCTCCTTCGATTGCATCGAGAAGCAGTCTTTCATATGCATCTGGTATCTCTCTTGGATACCTATCAACCCCAAAAGAATATAAATAAATAATCTCTATAGGAAAACTAGAATCAGTAGTATGCATTGTTGTACCTGGATCGATATAGAAGGTTAAGGTCGCTGCGATCTAGTCTCATTCCAAGACCAGGAACTTTGTTGTTGATCCTCAGGTATATCCCTTCATCAGGCTGAACTCTAATCACTAGTTCATTTGTTGCATTGTCTAAATTAGTAGCAAAACTTTTCTTGTACAAGTTTCCTGGGACATGTCTGAACTGAACTCTGATCTCTGCTCCTCTGGTATGGAGAGCTTTTCCAGCTTTCATAAGAAAAGGAACACCGTCCCATCTCGCATTGTTGATGAACATGGCTGCTGCAGCAAATGTAGGAGTGAGACTGTGATTTGGAACCGTTGGATCGTCTGTATAACCTGGATAAGTTTTTCCTCCCTTGTTATGGCCTTTGTATTGACCAACAACCACATCTTCAAGCCGCAACGGTTTCATTGATCTCAAAACTTTCACCTTACAGGAACACATAATCATCGGTATAGTATTTTATAACCAACCTAAAGCTTTTCTTCTTAGTGAAAAAAGTCTTACCTTTTCACTTCTTATGTCCTCAGCATCTAAGCTCACTGGCGTCTCCATTGCAAAAAGTGCAAGTATTTGCAAGAGATGGTTTTGCATGATGTCTCGTATGATTCCATATTGATCAAAGTAACTGCATCGATTTAACATTAGTAAGGTGTTCAGTGTCATACTGATCAAAGGTGTTCAGTGTTCATGCTTTGTAAGTTGTTTATGAAAGCTTACCCTCCACGCCCTTCTGTTCCGAAATCCTCAGAAAAAATCAGCTGAACGTTGCGTATGTAATTTCTTGACCACAGAGGCTCGAAAACAAGATTTGAGAATCGGAGCACTGAAAGGTTCTCAACAAGCTCCTTTCCCAAATAGTGATCAATCCTACGTATGTCACATAACATTGCAGTTAAGTTCCAGCTTAAAAATGAATGGCAGTGATGGCTGTTGGGCTAAGGAAATGGCTAACCTGAAGATTTGCTCCTCTGTAAGATACTGTTTCAGACATCTAGTTAACTCTCCGGATGATTCAGAGTCACGACCAAATGGCTTTTCCACAATGACCCTTGTCCAGCCATTCTCTGAGGAGGCTCTAAGACTTGCACACCTAACCACATCAACGAATATGTTTGGGGGTATCGACAAATAGTACAGCCTGTTTGATATCTTTCCTGCCTACAAAGCAGAAAGGAATTAGAAATGTGCTTCGTGCCATTGGTACAAGAAATAAGCATAGAGAGAGTGAAAGAAAATTACCTCTTTCTCTTTGAGCTTCTTGTTTAGTTCCGCAAAATCCTCTTCCGAGTTATACTGACCCGAATGGTAAAAGCATCTTTTCAAGAACTGCTCCATCTTATCCCCACATTTTTCCCTGTTGATTCCAACTTTTGTTCATATAACCAAAGCATAAACTTTAACTAAAACATACACTAAAAACGTATAGCAGAATATACCTCTGATCAATCCGGCAAGTTAAAGTACTACTAATCATGTCACGAAGCTCTTCATGAGTGAGTTTAGTCCGAGCATAACCAAAAACAGAAAAGTCCTGAGGAAGACAACCCTCATAAAAGAGAGCAAACAATGCAGGAAATATCTTCTTCTTGGCTAAGTCCCCTGACGCTCCAACAACTGTAATACTAAGAGTAGACTCTCCTTTTGTAACATGTTCCTCTGTAAGTTGATCTCCAGCTGAAACAATTTGGTAAAAACCATCCTCCAAAGAATCAAAAACACAAACAAAAGCTACAAAACTACTTCAATTCATAAAAAGAGAGACTTTATCAACCAAATTGCTAAACCAAACCCTCACTACCTCACAATCACTCTAATCTACTACATTCAATCCTAGAATACTCAAAGACATAATCCTTAGATGAGAAATGGTATCCTTGAGTACAAAAGATACAATCTTGAACTACTTTCTTCAATCGTCAAAAACACAGACAGAGGCTACAAAACTACTTCAGTTCATAAAGAAAGAGACTTTATTAACCAAATTCCAAAACCAAACCCTTACTCATTGCTATCTAACCAACTCACAATCACTCTAATCTTCTACATTCAATCCTAGAATACTCAAAGACATAAACTTTACAATCAAAGATGGTATCTTTGAGTATAAAAGGTCATAAAGATACAATCTTGAACAACTTTCTTCAATAGACATAAAACTGTTACAATCCTAACAACACAATCAACGACAGGTACAAGAAACTTCATCAAGAATTCTATCAAAAACTAATCTAGTCACATAGAAACTGGAGAAGAAACTCACAATCTTGTAAAGAAGCGAAATTAGTGGCACACCCATTTGAAGTATCAAGCTGAGAATGTTTCTCGGCGAAGAATCTCAAGCGAACCTGAGAAAACAAGGATTTTCTCGGGAATGTGAGAGATCTACTAAAGAGTGGTAGAGTCTCTTTAAACGGAGACGCAGCAGTAGCGAGAGACGAGGAAGAAGAAGAAGGAGAAGGAATGATCATAGAATGTGTCGCCATGCAAATTTTCTTGGAGCGTCAAAACAAATGTGATGATGATGATGATGCCATTGTTTTTTGCCTTATGAGGCTATTTGTATCGTCTCTTACATTATCCACAACAGTAGTTTTATTATATAGTTTTCGATATTTCTTATCTCTCACATTATCCACATATCTTATTTGTCAAAAAAGTTTTATTTTTCTTTGCATAAATTCTTTTTTTCTCAAGAAAGTAAACCGTATTAACATCCATCTCTGGTATAGCTTAACCGGATTATTCCATTCGAACGACCACAATTCGCTGGAAAGGTGATTTTGGTTTAGCAGTAAATTTCATACTTTATTCATTTTAGTACTCTCTTATGCACACTTTATTAATTTACTAGGTGAATATCCGGGATTTTTCGTAAATGTTTTACTTATAACAACAACAAAGGAAAGTTGTTTTATGTTATCTCTTTCTAGCCTTTTTGGCTTTTTCTAAATATACTGCATAAGCTGACTTCTCTGATTAACAAAGACTCCAATTTAGCATGATGAATAATGAGCATCATTTATACAAATATTATTTCTAAGATTCTATTTTCACCTAATTTAACCACATTTTGTAGAATTACTTACAATAAAAATTTAAAAAACCTATTCATTTTGTTTAAAATATTTTACTTAATTAAAATTTTATCATTAATCTTTCTGTCATTTACTTTTTGAGTATTATTGATTTTTATAAATCATATCAAAAAAGTTCAAAATATTTTTAATCTAAAAAAAACAAAGTATAAGAAAAATTTTAATGCCTAAAACTTATGAATACTTAAACTTTTTCACATTTATTTAACTACTTTAACTATCTTAAAATTACATACAAACTTATTAAATAGTACACATGCTTGACGACATTAAAATATATTCTCCTACTAAATATACAACAATCACCCAAAATAATAAAACACAGGTTGAATCCTAGTCATTATTTAGAATGATCATCTCTTGTGTCCCTTTTGTGGGACAACTAATCTGCAAAACCACTTTAGAGTCTTCCTATCTCCTTTGAGTTAATGAATTGTGTTAAGACGAATTTACCCCTGTATTTTATTTTGAATGAATAATTAATATTTCTAGAAAACATTTTGAAAAAAAAAAAAACGGAAAAAAAAAAAAAGCTCGAGCTCGTTCTTCTTCGGGCTTCTTCCTCCGGCGAGCCGCATTGTCGTTTTTCTCCTCCTGCAAGCTGCATCAATCTACTAAGTCCAGGTATGGAGAGAGCTTCAAAAGCTTTGAATTACATATTTTGAGGATTTTGAAATTCAATCAAATTAGATTTGGATTATTGTGTTTTAGCACCTACATTAGAAGTTTAAGTATAGATTTAGGCTTCATTTGGTCTGTTAATGGGTAAGCAATTGATTTCACATGCTGATTCATACTAAATTGAACTCAAATCGAATATTTGTTCTTGTCGCGAAAATAATACTGGTCGCACTAACTATAGTAGTACCGTAATTTATATAGATAGTATGTTTTAATAGCACCAATATTACTTAGACACGTAGTATTTCATATATGTAATAGTATTACTCACACATGTAATATTTCAGAATTAGTAATAGTATTACTGAAAATGTACTAGAATCGATAATACTAGTAATATTGACTGAGTATGTGTATTGTTTTGGCAGGTTACAATGAAAGAGAACGTGATCATATATTTTAAATTCCAAGGTCGCATGTATAATGTGATGATGAAGACATTAGGGGAGAAGATTACTCTCTCAATGTTAGAAGATAGGATAATGACGAAGCTTGGATTAGATGCAAATAAGGTAAAATTGCATATGAGGTACAATCCACGGTTGTTCGGAGTAGAGGAAGAAATGAACGTTTGTGATGATGAGGATGTCTTTGTTTATGTAACATCCGCAAAAAATAACTGAAGAAGTGTTTTGGTTGTGGAGGAGATCTCTAAACCGCCCGAGCCGGAGCAATTGCCCGAGCAATTGTCTAGAGTTGGTAAAAGTTCTGTTGGTAAGAACTATACAGAGGAGGATGAAATGAGAGTGGATGATGGTGCACTCATCGTCTTATTAGAAGAGGAACAAGGAACTCAACATCAACTTGAGGCAATAGTGGAGGATCACGGGACTCAACATCAACTTGAGGCAATAGTGGAGGATCACGGAACTCAACATCAACTTGAGGCAATAGTGGAGGATCACGAGACTCAAGAAGATGAAACACGCTATGATGAGTCTATGGATGATTCTGATAGGGGGGAACAGTATGTTGAGTCGCCACCTGTTGTAGAACCGGGTATGTTTAAGAAAGAATGGGAAGACGGAATTGGGTTGACCTTACGTCAAGAATTTCCAAACAAGGCGGCATTGCACGAGGTGGTGGATAGAGCTGTATTTGCTACCATTTTTGGTTATGTGATTAAGAAGTCGGATAAGGAGCGCTATGTCCTAAAGTGTGCCAAAGAGAGCTGTTCTTGGCGTTTACGAGCGTCCAATATCAGTAATATTGATATATTCTCGATTAGAAGGTATAATAAGATGCATAGTTGCACTCGGCTAAGTAAAGGTAGTAGTAGGCTCAGGAAAAAAAAAGGCAACCCACAATTAGTCGCAGCTCTCCTTCATGATCATTTTTCGGGACAGTTGGAAACTCCGGTTCCAAGAATTATCATGGAGCTAGTTCAGACGAAATTAGGTGTGAAAGTATCATACTCGACAGCGCTAAGGGGGAAATATCATGCGATTTATGATTTAAAAGGTAGCCCGGAAAAAAGCTACAAGGATATCAATTGTTATTTATACATGTTGAAGAAGGTAAATGATGGTACAGTTACTTATCTGAAATTGGATGAGAATGATAAATTTCAGTACATATTCGTAGCTTTGGGAGCTAGCATTGAAGGTTTTAGAGTGATGAGGAAAGTTTTAATTGTGGATGCAACACATTTGAAGAACGGATATGGCGGAGTGCTAGTGTTTGCCTCGGCTCAAGATCCTAACCGTCACCATTACATCATAGCGTTTGCCGTACTCGACGGTGAGAATGATGCTAGTTGGGAGTGGTTTTTCGAGAAGCTAAAAACGGTTGTACCCGATACTTCAGAATTGGTTTTCATGACGGACAGAAATGCAAGCCTCATAAAGGCCATACGGAACGTGTATACCGCGGCTCATCACGGGTATTGTATTTGGCATTTGTCCCAAAATGTGAAAGGTCATGCTACTCACACCAACCGAGATGTACTCGCATGGAAGTTTCAGGAGTTAAGTCGGGTCTACGTCGTGGCAGACTTCAACCGAGCGTATGACGGGTTTAAGTTGAGATATCCTAAGGCGACCAAGTATTTGGAGGATACAACCGTGAAAGAAAAATGGGCAAGGTGTTGTTTTCCCGGAGAAAGATACAACTTAGACACAAGCAATTGTGTGGAATCTTTGAACAATGTGTTTAAAAACGCAAGGAAATACTCGTTAATACCAATGCTTGATGCGATCATCAAAAAAATCTCCGTTTGGTTTAATGAACATCGGATGGAAGCCGCGTCTGGATCCTTAGAAAATAAGATGGTGCCTTTGGTCGAGAATTATTTGCATGATTTGTGGGTTTTTGCCGAGAAGCTAAAAGTGGTGGAACTAAACTCATTCGAGCGTGAATATGTAGTCACATGCGACAAAGGAATAGATTATACGGTGAGCTTGCTTTTGAAAACTTGCAGTTGCAAGGTTTTCGATATCCAAAAATATCCTTGTATTCATGCATTAGCCGCTTTCATTAACATTATGGATGATGAAGATCGGAGAAGAGGTTTGGAGTAACATGATTTGGTTACAAAATATTATTGGGCGGAGTTGTGGGCATTGGCCTATTATAGGACTATTTATCTTGTTCCGGATAGGTCGCAGTGGGAAGTACCAGATGAAGTAAAGGCGTTGAAGATAGTTCCGCTGTCTAAAAAACCGAAGAAAGGAAGCAAAAAAATGCTAAGGTTTCCATCAACCGGGGAAAAGCGGCCAAAACGACAAAGGACGCAAAACAAAAGGCGTCCAAGGCAATCGTGTCAATGGTTATTATTTGGGAATACGCCTATCTGAGTTTTTTACTTTGTTTTTGCAGTGATTTGTTGTTTTTATGGTATGGACTTACTATGTAATACTGTATTTCCCCTTCTATAGTACTATGTCTGTTTCTATTGTTTTTTTGTAATACTGGTTATAACAAGTAATATCATGTCTGTTTCTGTCGAATTTGTGGTCATATTAGTACTACTGGTAATACTAAGTTGGTGTTATGGAGTTCGAATTTGTTTACCTCAAAAGTCAATGAAAATGAATACAGTGAGTTATTAACAGATAAAAATGTATTATTAATCATTTATACTTAATTAAATTAGAAATTTTAATATTAAATCGTTTTAACTTATCTTTAGTAGACTCAATACAACATTTCCCTTATACTTTTAAGCTCACTTTTAATATTATCACCAACTTAAAATGAAAAATTCATATTGCTACATATATTTAATTTATAATTACACAAAATATTTAAACCTCTATATTTATAAAGTTCAATCCAGTGTACTACTAAATAAATAAATTATAAATATAGGAAATACTGCTAAACATGAAAAACATGGAAAGTAATACTATTTGAGAAATTGGCACTACCAAAACCTTAGGAAATACTATGCTGTAAAAAGGCTGCGCACATGTCAAAAATCTCCAAAAAACGGCGCACACGTGGGAAATTAATTTTTTTGGTTTTCCTCCAAATTTTTTGGCGCCTAACAAATTTTGAGATTCCCTCCAAAACCAAAAATTTAACTTTTTTCTTTTTCCTCTTTCTTTTTCGATCTCTTCTTACAACTTTCTTTCATCTCTCATCTCTCTTCTCCCACATCTATCATCTCTCTCTTCGACTCGAATTCTCTCACATCTCTAATCTCTCTTTCATCTTTCTACCATGGATAGACTGTGTGAGAGAGACCCCTACTACGTTGATATAAAAGTGGCGAAGAGAGCCATTGAGCAAATGGAAATGGTTGCGATGATGGAAGGGATTCCTAAGTTTTGTCCATGTGGTGGTAGCATTGTCGACACTCGAAAGGATGAAAAGAGATACTATCAATGCGAGAAGTTTAAGGTATGTTGATGTAGAGCACAAGTATTTCAAGTTTGTGTAGATCTAGATCTAGATATATTTGGTATTCCAGAGTATTTCCCGTTTTGGTAATACTGCCTAGAACAAGTAATACTGCACAAGTTTTTCTAGTTTTTGTAGATCTAGATCTATATTTGATAAATATTTGGTACTTTGTAGGATAATAGAACTGATTGTATGCACATCCGTAAACTTTGGGATAAGGCTATAGAAGAAGAGGTGAGTAGCTTAAGGGAGAGTGTTGATTACAATCAGAATAAAGTTCTAAGTCATGAGTATCTCATAGAAGAAATGCAAAAAGAATTGAAAGCCCACCGTGCAGAGATTGTGAACGTGAGCAAAGTGGTATTCCGTAATCCTATGGCTCCCAAGAAGTAATGTGTTATCCTATTGTTCCTTAATCTTATTGTTAATTTGCTTGTAAGACTTTCCCTATGCTTTATAAGACTTTCCGTATGCTTTGTAAGACTTTCCCTTCGATTGTAAGACTTCTCTTTGATTGGTAATACTATGGTTGTTCAGTTTGATATTTCCAGTATATCTCTTAGTAGTAATAGCACGAGGTATTTCCCGTATTATTGTTAACAATATCATAAAATATCCTAATACATTAATTGAATCCAAACATAGTCTTACGAGTACTTGCGAAATCCTAAAACAAAGTCAAAGTACAAGAAATCAAAATACAAATCCGGAGAAGTTACACGAATAGTTTTCACACGTCACTAGACTTTGCACGGGTTGAACGGCTCACTCGTTTGGGCACAACAGGAGCAGCCGCATTTTCCTTGATTGTTGATTCCTCCTCATCTGGTGGGTTCTGAGACATCTGCATTGTTAATTTAGTTAAACCTTGGTATTACGCGATATTACCAATTATGGAACAGTATATCCGGTATTACCCAGATTTACCTTGGCTTTCATCTCATCCATAAATGCTTCGAACGTTGCTTGTTTTTCCTCCATTTCCATAAGCGCCAACAAAGCTTCATTCAGCTTGTCATTGATGGAATGAAGCTTCTCCATTACATCAACTAACGTCGGGTCTCCCGGTCCAACAGCTGTGGGAACTTCCTCTTCATTTGGGGCTTCCATTCGTGCCTGCACATCCTCGTTGTACACCTCTTCAAATCTAATTTAACGCCCTTGACCAAGACGCTTCATCCAACTATCAATTACAACATCGTGCTTATCAACATCATCCTCTACTCCCGTGATTTCAGCCAAAAGAGGTACTTCTTCAGCCTTCTCTCTAATTATACTCTCAATGACCTATGGAAATAATAGACAATGAAATATTAGAAAGAAATAAAATCATATTTGCTCAAGGAATAATAGGAAATACTAACCTCAGTTGTTCCGAGTACATGGTTGATTTGCTCAAGGGTAAACCCTTTCATCTCGGTCCTCTTGAAATTCACCTTGCACATCCTTGGACAACCGGCATGTGCACCATCTTTTTCTTCTATGAATCTTTCCCTAAGTGATGGAATGGCCTCAAATGCTAAAAGCTACACAAAACACATGAAATTTAATTGTTAGCTTCAATTACGAAAATGTAACAAGGATAAACATGTGACTTACCTCAAGCGGCACACAGAATCCGGGAACAGGCCATGGTGACTGAGTGTTCGGGACGACACCGTTAAAATGATCCAATGTGTGTGAGATCGATTTTAACATGTACTCAAATGAATATCTCCCCCATGGAAATGTCTTACAAAACGTAAGATCACTTGCAGCCCTAACACAGAAATCATCAATTGGACTAGCCCTTTCTCCAGTCTTAGTAGGCACGGCAATGATGCTTGTTAGAAAATAGAGGACCGCCATCCGCAACCTATCCTTTGATCTAGCCGGTTCCATCTCCATTAGCTTGGTTTTCACGTCTTCACGTCTAATTACCCCGGTTTTGAAGTACCTGTTGGCGAAGTTCATATTACCAGCGCTCTGATAATTAGCTGGATGGGCCTTGCAGTTGAAACTAAAGATCAAAGCATGCTCCCTAATACCATAGCGGATGGGAACTCCATTAACAACGAACCAAACCTCCTTCTTCTTCTCAATAGATGCCGTTTGAAGAAAAAACATCCACATCCCCATTAACTTGTGGGTATATCCGAAAGGCAGGTGGTAGATGTGCTTGAAACTCGGATGCTCCATAAAATAATTCTTCTCAACATGCGTTAGAGGATGTTCCAAGTCAGCGAAGGTCTTCAACACCTCCGAGATATAACACCTCGTTGCTAACTTCATCTTCTTGGTATACTCCGACGCCGGGAAGTACATACCAAGTGGCTGCATTGCCATCGCTTCCTCCATATCCTGAAAAAAAAAAACATTCATTCATATATCACTCAATTGTAAATAGTACTGCACAGTATTACTCTGTATTTCTCAGAAGTATTCCCCGTAATTACCAGTATTACACAGATACTCCTATTTTACTATGTAGTATTTCTCAAAGTTACTAGTACTAACTATCGATAAATCACAATTATAGTATTACTCTAAGGTATTACCCACATCCGCCAATATTACCTAAATATCAACATAGCATTTCCCAATGTTACTAGTACTGTCCACAGTTCACAATTGCATTATTACCCAATTAGATCGGTATTACGAAATGGAATACTTACCACATTTGCGATGTCCTCGTCTATGGTCCTCTCCTCCACGGGTTTTGCCACTATCACGTCCTTGTCTCTCTCGTCCTCGTTTCCCTCCTCCTCCACGGACTTTTCCACATTGACGTCCTCGTCGCTCGCGGAGCTCCTCTCCTCCTCCTCCTCGATAACGGCTAGGCCGTCATCTTGTCTCTCCACCTCTTCCACGGGATTAGCACACGCGAGTTCTTTGTTTGTCTCCGTCTCCTCTGAATCGGAATCGGAGCCCAAGGTTCGGCTACTCTTCCCTGATTCTTCTTCTTCACTTGCTTCTTCTTTTTCATTTTCATCTTCCACCTCATCAGTTTGCATATTCTCTTGAATTTCTTCAGTAGGAATATGCTTCAAAGCATCATAAAACGTAGAATCATCAAGCATCGGGCTCTCTGTCGTTGGAGCCGTCGTTGGAGCCGTTGTCGTTGGAGCCGCTGTCGTTGGAGCCGCATTGGTTGCCATCGCCGTCGCAGTCGTTTGTGCCGGCGCCTGCTCCTCAGCCGGCACTTTCTCTTTATCTTTCTTCGCCGACGCCTGAACCTTCGCTTTCTTCGCCGGCACCTTCTCCTTCACTTTCTCCGCCGACGCCTTAACTTTCTCTTTCTTCATCGGCGCCGACGCTTCTATCTCCTTTCTTTTCCCTACCTCCTCCACGCGTCTTAGGCGGCATGACTGATTTCGAATCGGAAATAGAACGGAAATACTGGTGAAAGGAAGAAGAACGGTCGATTGAATTTAAAGAAATATGGAATGTTGCGGTTAATTTCAGCGGTTACTAAGGAGAAGAAGAAGAAAAATCGAAAACGGTTGTAATGAGAAAAAGAATGAAATTCGAATAAAGAGTAAAGGTTCCCTAGGCCCTGGAAATATTAGGTTTTTTTTTGGATTTTCAAATAAAGAGTAAAGGTGGTTCGGGTGGTTTGGTTCGGAAACGAACCATGGTTTTTCTGGTAATTAATAGGTTCAGATGGGGATATACTAGTAATATCCATATATTTCAAATTAAAAAATAAATAAATTATTTTTGTTTTTTACAAGGATTTTTTGGCTTCCTCTTTGAAAAAAAGGGACTGGCCAGACGACCATCATAACTACAACATATTTATAAACACAACAACAAAAATGAAACTTGATAATGTTGTAATACGAACAAGAATCGAAGTTATTTTCAGCACATTCTTCGATTTTTTTTCCTGGAAAACCGAAACCAACTCAACATAACCCATTGAAACATTTTGTACCTGGCAGGCACTTGGTAGCAATGCCTTTGTGTGTTTTAAGTCTGGTTTGAGAGGACCACTGTGGAAGAAATGTCTTGGGCAGAGTTGAATTGGGTTTGACCTGAAGAAAGAGAAGAAGAGTCGTTAAAAAGAGATCTTTGGATTTTCTTTAGTTCTTTGACAACTTCCACCATCGTTGGAACTTCTTCACTAGGACCCATGCATCTCAGTGACAACATTCGGAAAGCTTTCATTTGACAAAGCTCTTCTTCGGAAATTTGACCCATCTTTTCTATCATCTTTGGATCTGCAATCTCTTCCATTGATCGGTCTTCCTTTAATGTTGACAGCAAATTTCGAGCATGTCTTTTCATCTTCCTGTCAAATCCACCTTCACTTTCTTCTTCTTCTTCTCCTCGATAATGCTCGAAAAAGCTTTCCTAATAGAAGCCTTATACCCATAAACATTCCAAAGCCAAAGACATCTGTTCTCTCTGAGACTACGCCACTGCTAATGTAATTATCGGCAAAGTAACTATAGAATCCCTCTGCTGCCTCAACCTGGACAAATGTGTCTCCTTCTGGAATTCAGACGCAGTGAGAAAAATCAGTCAGCTTCGCGACCCCATCTTCATCCAATAAAATATTCCAATGAGACAAAATCCTATATACAAAGAGCCTAGGGAACGCAGTGTGAAGGTAAGCTAAAGCAGTAGCAATATCTTCAACTATCTTCATTCTCCTTTTCCATGGATGTTCACTTATTTCTAATTTGTAATGTTTCTTAACACCATGATAAACTTTGACTGAATCTTCAAACTCAAGACAACATCCAACCAATTTCAAAAAGGTTTTGTGACCACTCACCATCGATGAAACTGCTATGTCGCGGCTCAAAAGATCTACTTTGAAGAGACTCGACAAGCCAAGATCTTTCTTAATGAGAATCATGGGATGGTTCTCGTTCTTACCTGAATACCAGTGGTAGTAAAATTCTTTTCGAGAAACAAGATTAGTCGCTGAAATTGTTGGTGGCATTGCGGATCTCATCACCAGAGAAGAATTTGATGGGATTGGATTTGCCATGGCCGAATTCGATGAGCTCTTCTAACAACTTGGCCCCTCTCTTGGCCACTCTACCGGAAAGAAAGCTTTATTTTTCACATAACTCAAAATCTAAGAATTAACGGAAAGAAAGCTTTATTTTTCAATCAAGTGAGCAAAAGTTTCGAGACGACCTCACACTTTCTTGATAACTAAATTCTTGTTGAGTGTTGACTATTCAACACAGATGTCCTTCTGCGAAAATCAGAAATAAACATTTTAATGGATTTTGTGGAAGTTAGAGTTGGAAGAATTGATATCATCCTATTATAATAAATCACCAGTCACTTCCCAAATAACTGCAGCTCTATATATTTGACACTTGTCCTAACTCCTAAGTCTCAAATTCTATTATTTTACTTTCTTTTATATCCTAATTTATGACAATTTTATTATAATAAATCACAAATAACTTCTCAAAGAATTGGCTCTATACCTTTAACACTTGTCCTAAGTCTCAATTTCTATTATTTTACCTTTTTTTTTTCTTTTTATCCCAATTTACGACAATAAAAAAAAAAAATGTTATTCTTCCCCATCTTCTCCACGATCACTATAATATCCAAGCAAACAAAATACAAAATTTTTAAATCTCAAAACTACAAATTATAATTGGTTATTTTACAATTGGAACAGCCATTCAAGCATCTTCAACGTCTCCTTTAAGTTTTTTTAACAAAAATTCTCAATCACAAAAATCATCATCATCGTCACCAAATAATTTTGCAAAATAAATTGTTACACTGATTTGACCGCGTAAAGCGCAGGTTATTAAACTAGTTTTATGATATTAAGGTGATTTTCTACGATTTTTTGGCCATGCTTTAGTTATCAATTCAAAATTATAAACGGTTGTCTTTTTTTTTTAACCGTTGTTATTAATTGTTTAGTGAATGGTCTTCAAAAGCTCACACACTCGGCTGGGATTAGATCATCAATTATTACTATAAATCAATCGTTAAGATTCTCGGTTGCTACCTTTTCCAAATTAAGAAAATATGTTCCGTAAATTTATTCCTCTTCTCTTTTTACCAAATATTTTTCAGCTTTACTGATACTGAGGTAAGCGATTTTTTTCTTATTTGATATAGCATCTGTGTAGTATATGCTAAAAGAATGACGATTTTAGGCTGTGTTGTGTGATTTTAGGATTTTATTGTTTGTGAGTTGAGTCTCATGTATTAATAAAGTTATGTGTATTTATTATTAATTCTGTTGTGTTTATTATTAATTGTATTATGTGTTTATATCATATTGTATTTAAAGGCTTTTTAAATGTACTTCCTCCGTCCCATTAAGATAGATTTTTAAAGAAAAAACTGTCCTACAAAGATAGACATTTTATGTTTTCAATACAAAATTTAGAGTTTTTTTCATATTTTTCTCATTCGTGAGACTGGTCTTCTCCATTAACTAAAAGTACATATTCCAACATTCTCCTTCCTCCATGCACCGAGATTATATAAGTACAACATTTTGTGTCATCATTTTTTTTATTTTCAAAACTAAAAGAAAAATGTCTTCTTCTTCAAATTCATTAAGTCTTTGGGAAACGTGAAAAAGGAAGAAAAAAACAAATGAAGAAGGAAGAAACACATCGTGAAGTTTATATCAATCATGAGCTGGACTTGAACCAACTTTCTATCGAAACCACTATATTAACCATGCTCAAGATAATGTTTCCAAAATATTTTTAAATTTGTGTAAGTTATTTTAAGAATATGGCGTAAGCCTTTTTTTTCTTTGTAAGTTGGCTTAAGATTTTTGTAGTCATGATTTTAATTTTCTAGTTCTAATACAATGATCATGATAATGCTATATTTATTCAGATCTTATTGTAAGATTAATATTTTTGGTTTGAAATCTAAACCTTTTATTTCGGAGCATAGAGGCAAAGCAAAGAATATTCTTATTGATATACATTAACAATCATTTCTTTTTTCATGAACTATTCATTTTTTTGTGGTGATATTGATCTTGTTTTATGTGTGTGTATTTTTAGATGTTTTGACTATTAAATATTGTAAGTCAAAAATAAATTCTCATAAAACAAAATAATAATAATAAATTCTAAAACAACAGATACAATCATTGAAATAAACTCGATTGACCAAATTCAATTAGGAAAAAAACAAACACACAAATCTAAACATAACATGTTCTAAAATAATAAACTTGCTAAAAATTCCATTACACCTCTCACCAAAAATAGATCACAAGAGATTTGTATAGGTAGACGACCTTCTCTTTCCAATGAACCCTTCTTCATATGTAGAATTTTGTACTTATTTGAGCCTTTGGCTTTCATGATCTCTAACATGCAAGATTGCAAAGTTAAAAAGATCTGATTCACCTGTTTGCGGGGTATTCGTCAAATGATGTCTCTGCCGCCGACACAAGTTCTTCTACCGTTGTTGGACATACATTGTGTTGTAGTGATTGGATAGCATTAAAAAATCCAAGATCCAATATATTCAAATCCGGTGAATTCAGTGGTTGACACATCAAGCGTATATCAAACCCAAACTGTGAAGCAATTGCTTGAAATTGTGCATCTCTCGTATCCACATGCGTTCTTGCATTATCTTGTTGAACGAAAATAGTTTTCCCAAAATCTTCTCTTGACCACTTTTCGCGAATTTTTGAGATCACTTTTTCAATCAAGCATCTCTTTATATCCTCTCTCTTGATGGAGACCATCGGTTTCAATTCCAACATTCCCGCTTCTCTATTTATGCTTCGTCGCTTAGACAATGAAGCACAAACCAAGCCCGCTAGCAACTTAAACCCAAGTAAAACTTCATTGGGTGTTGATTGTTAATTATTAGGAATTAATTGTTAAAATATTATAAGATGTGTTGTGTGATGTTATGCGTTAGGTTGTTAGCGTGATATACATGTTGATTTGCTTGACGTCTTTAAGACGTATTTTTAAATAAAAATATAAAGATAAATAAAAGAGAATAATGATATTAAAGAAAGGATAAGATTGAGGATGTTGGACTGTAATGGAACTGACGGGTTTATTACAGGTCATTAATCGCTGACGAGCAATGAGAGGAAGGATCGAGCTACGGGCCGTGGTCTTCCATAATTAGGCTTGAGGAGCCATAAGTTAACGTATGTTAAAAACTAAGAAAAGAAAGTAAAAGATCTTGCGGTGAGCAAGACGGAAGCTTGTCTGTTATAGCTTACTAGGAAAGTTTAAGCTATATGCTTGTTGTTTGAGTCTATGCTTATGAAATAGAAATTGTGTGAAAGTATAATCGTGTTATTGTGATTCGGTGGACAGTTTTGACTGCCTTCACTGAATAATTAATTACTCACCCCCTTTTCTTTTCCCTCAGGTGAGGAAGAGAATGTTGAGTAGCTGCTCGCTTGGTGTTATTTCGGGGACTTTGGGTTTTATTTGATTTATCGTTATTTCTTATATTTCTAAACATGGTTTCTTTATTCATTTTTATCCAACGATTTTAATTTATTTATGCTATTATTTTGAGACAATTTATTTCTGATTCTTAATAAAAGAAAGTTTCCCAAAATTTTGATATTTTATTTCAAGATTTGTTTTGAAGAAATTGAATAAATGAATGGAAAGGATGAAAGTACGCCGTCTCAAGGTTGAGAGAGACGGGTATTATAGAGGGACACCTCTGAAGACACTTTACACCAAATGAGTAGTCGTATTCATTATTTATAACTAATATATTTATATCAATATTATGAGATGTCATCAGTAGCGGAGGCAGAATAGTTAGTCATAGGAGTCATATTTTTTTCTAAGCCAAATACAAAAAAAAAAGTTGAGAAAAAATGACAATATCATAGTTTAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGAAGATAAAATGAGAAAGAAAAAAATTGTTCTGGTAAAGTAAACACTAAAACTAAGGTAATTTATAATGTGTTAAACAATAATAATGAGATTAACCTAGTTTAATGGACTTATGTTTTTATTTATAAAATTAATTGGGTTAACATGCTGTAGGTTTTATTTTTTTATTAGACTATATTTGGATATATATATTTGATGGGGGTTAATAATACTTTAGGAAAAGGGTCAATCTATAAAAATTAACAAAAAATAAACATATTTTCTAAAATCCATGGAGTCAATTGACCTCCATGGTTAAACACTCCCTCCGCCACTGGATGTCATTGATAATTTATTTTCTACCATAAAAGTTTTGTAACAATTTATAGCCACGAAGACTTTCACGTTTTCGCTCAATTCTCAATATTTCAGTTTTATATTATTCTGATTTTGGGTCCAAATGAAATTTAAGATCACAATTTATGGTGTTACAATTGACTTCTAGGTGTAGTTTTCAAATAAATTTGGAAAGTGTTTCACTTAAATACCAAAGAAACGTACATGCATGATGTTTTGAATTCCTTCTTTTATCAAACATGTTCAGCTTGTCATTAAATTCATTGAAAAGTTCACGTATCCTTTTATGTATTTAAAGTTTAATTTATTTAAAAGTAAATAAGTAATGTTAAAATTGTCATTATATATTATCTCTTAAATAACGTAAAATTTCTAAAAATTCATATTTGTGGGACGGAAGAAGTTTTTTTTTATAATAATAATTGTTTTTATTTTCTTATTTCAAAATTTTTACTAAGAACATAAATAACTAAAAATAGTTATTAAAAATTATGTCAATTTTTGTTAAGTTAGTTTAATTATAGTTGATATTTTAACAATTTATCTACAGTTATTATTAATATGCAATCACAAAAATATAAATATATAAAAAAATATAAAATTGTAAAATAATTAAGATAGAGTGTTGAATTTTATTAAACAAAACTAGTGTAATGTTTTAAAAAGTAAGTGGGTGTTGAATGATAATGTGGAAGAAATAGAAAATGATGTGGAGTCTTAAAAAATGAAGCTTGAAAATATTCTAACGGAATGTAAGAGTAAGACCATCTTCTGTTAAAGTTTGGTTGTTTGTTGTTAGCTTCCAGCATCTTCCGGCACATCTACAAGTAAAAAATAGAATGTTTACGATTAAGTTAGGTTTCATCTCTTATTAAAAGAAATGACCTTTAGAGATAAAGTAAAAAAACGGTAATGTTATTAAGTACCAACAAATATCACCTGTTCATCGGCCAACACCAACTCAAGCTTCTCGCTGGTACTCATGGTATATTAGCACCACAATTATAGGATTTATACTTGCACTCAGCCACGCAGTTTTGTATGGGTGTAAGTCCAGATAAACGAAAGAAGCAACCATAAAAATGATAAATGTTTGTTTGTTGGTTATATGCAATAGTTGCTTTCAGATTTGGTGATGTTAGAAGATGCAAATGATGGGATTATTTATAGTGGTTTAGAAGTCGATAGGGGATGGACATGAGTTAGTAGAGAAAATCTTGGTGAGCAAGCAAAAAAAAGAAAAAAAAATCACCATTATAAAATAAAATAAATGATTTAGAGACATAAAAATCTTTTTAATCTCATAAATTTCTGAATTTCGTCCAGATGTATTTTACTAGACCTGCTTGTAATTCATGATGTAAATTTGAATCACGTAACTCGGATCTAGCACGCACATGACTTGCAAATTCTGGTAACACCTCAATTGAGAATGGTTGTGGTGTACTAGAACCACTTGCCTCAGATTGATTATAATCGGACCAATGTTGAGCATATGTCTCTCGTTCATCATTAACAATCATATTATGCAATATGCAATGTTGAGCATTAGGTGAACGATCTAAAACATTTAATTATATCATTCAATGTGCCTGGACACCTAAAAAAGGCATGCCAGATCTTTTGATCATGAGATGCAACTCCTTCAAAAATAACAATGGTGGTTCCCTTATCTCCCTGAGTAAATTGGTCTTCCCACGCTGTATGAAATTTTTTCTACTCCTAGTGCATGCAATCAATACTCCCAATCATCCTTGAAAACCCCCACAACTCGCTAACACGCAGAATTCTTTGCAGGTTGTCTTGAGGCGGAGCTCTAAGATAATCTTCTTCAATTTTGTTGTGACACACTCTAATCCAGTTGATGATATACCTCACTTCAATATGAGATTATCTTTTATAAGCTTCGATATTGAAAGGAAATTCTGATTGATCCATTGGATTTTTTATTTTAGTAAGATGATCTTTGTGATATTAATTCATTAATAGAAGAATGAGTTTTCATTTATAAAAAATAGAGTGGTTGAAAGAGAAGGATAAGAGAAGGATTTGATTAAAAGATCATGTGGTTGAAATCCAATACTCAACAATTTTACCCCAGTATGATTCACTTTTTTGGTTTTTGCCAACAATGATGTATGTTCCATAATACATCCACTTAATAACACTCAAATTTTGCTCAATTCTCCATTTGAGGCTTTTCCGGCGAGTAGAAGTTGATACATCATTATTTGGAGTATTTTCATTAGCACTGGTCATACTTCCAAGAGTCATTTGTGTTGAAAATCCATGAAATTCAGGAGGCAGTTAAGATGAATATGTCATCATCGATCCATAATATGGATGATATTTTGGAACAGATGATGACATAGAAAAATTTGGTGGTAAACTATAATTTGGGACATTTTGAGATTGGTTGAAAGATGGACTTTGAAATTGATAATTATTGGGATTTAAATAGGGAAAAGGATAATTGGTAGAATTTTGGATAGAATTATTGTTGGAATTTGGATAGGAAAATGGAAAATTTATAATATTTGTGAAGGATTATTTTAGAATCTATTTCACAAAATAAAATAAAAAATAGAAGCAAGAGTTTATTAGAGGATAATAAAGATATTATGATAGAAATGGTGTTTTTTGTATGTATCTGAATGAAATGAATCAAGTTTCCTTTTATAGAGCTTAAAAAGTAATAAATATCCATATAAATGTTTTAAATTTTTTTTTATTATCTATATATTCATTTACATGGGATTTTTGCGTTAATTCCCTTAAACCCGGCTTTAATTCATTTGGGTTGGGTTTCGATCCGGTTTTATCGTATTCAGATCTTGAATAGGATATTTGGGTCGAGATTTCTTTTGTTCGGATCGTGTTTAGGAATAACATGTGCATCTTTAATCGAGTTAAATTCTTCTTTTAATCCACGTAATTATTTCCTTAGATTCTGTCCACCATATTCGGCTTACTACGACTTATCCTTATATATTTGCAATCTTAACAATTATATTGCTACCTACTGAATCTACATATACATTTTTACAGGAATTTTAGCAATTAAATTCTCAAGTTAGAACTTATTTACAAGGAATACCATTGACATTAATTATTATCATTTAATTAATATTCCTAATTATTAGCATTTTCTTATTTAATATATTTCCATCAATTCTAATTACTTTTAAAAAGGAGAAATCTTAGGACTTTATTAATATTATACTTTATTAAAGATAAATACTATAGTTATTTAAAGTTTATAAAATGTTTAAAATATTTAACGAAAAAACTTTTAGAATATATATATTATATAAAATCTATAAAATTAAATAACCATTTCAAAATAAAACTTTTAAATTGATTTGAATTATAAATTTTTTGATAAAAATATTATTAAAACAAACAAAAAAATGTTTAATTTTACGGAACTGGATTAGATGGTGGAACGGGTTTAGAATATTATAATGTATGTATTTTATAACAATTAAATAACCATTTGAAAGAAAAAATTTGTATTAATTTGAATTATATGTTTTTTAAATTAAAATATTATTAAAACAAAAATAACAAAAACAAAATGTTTAATTTCATTGCACGGGGTTAGATGGTAGGACATGTTTGGGTCGACAGTAATACGAGACGGTATACCACGAGTGAAATCCATTAGATATGTTTAGTTTCACTCAACGGGATTAAATGGTAGGACGTGTTTGGGTCGATAGTAAAAAGAGTCGGTATATCACAGGTGAAATCCTAGATATAACAATCAAAATACAATTATATTATCTTAAGAACTAAACAAAACAAATAATATTAATAAAATAAAGATAATTAAAATTTAAATTATTTAGTTATAATCTAGATTTTAAATTAATGAACTGTACATTATTGTTCATATATTTTTAAACAGTAAAAATCAAACATATTAATTGTATATTGAATAATATACATATATAAGAGTTGTACATACATAAAATACAAAATATGAAATCATATATATTCTTAATCGACTAAATAAATTAAATTTTTATTCTTAAAAGAACAAAATCGTCATGCAATACATCGCGGGTTAAAATCTAGTCTTTCTATATTCTCGTTATACTCTGCAACTAAATATACTCCCTCCGTCCCACTAAGATGAACTTTTAAAAAATTTCACATTCTTTAAGAAATATTGTATAAAGATAATTTTAACCTCTTAATATACTTTAAAAATAATAATAAATATTTATCTAATTATTAGTAAGGGTAAAACGGGAAAACAGTTTTAAAATTTGCATTGGAAATATAAAACTTCTATCTTTGTGGGACAAATATTTTTCCTAGAAAATTTATCTTTATGGGACAGAGGGAGTATTTTCTATCATTCTAAAAAGTTTAAACTATCAGAAATCTTTGTGCCACTTATCATATTAGAAAGAAGTAGCCTGTCCATTTCCCACTGCCACCTTACAAAGCTTGTCTATCTCCCTTATGCATGCACGAGGTAGTCTACAAGCTGCAAGCCAAAAATTGCATATGCTCCACAAAACCCAACTGATCAGATTTAAACGTCCAGCAAAAGAAAGAAATCGGGACGTCCAAGATTCAATTTTCCTTGTAATCTTTTATAACAGGGGAAGACAGCCAGATGCTGTGAATCGCTTAGTGACCAGAGGGAGTCCGAGATACCTCACTGGTAACTGACCAACTTCGAAAGGGAACCTTTGGGTTATCTCATGGTGGACTGAATCTTAAATTCCCGTCAGATACATTGTCGACTTTTCCTTGCTTATTTTTAGTCGTGATAATTTTTGCAAAATCGTTTAACACATGAACTATTCCTCCTATTGATATGACCTTTCCATCGGATAGGATCTTAAGGTTATCAGCAAAGCTCAAGTGAGTTAAGCCAAGACTTCCACATTTCAGATGGTAACCAAATTGTCTAGCACCTGAAGCTTTATCCAACATTTTAGAGAGAACATCCATACTAATGACGAATAAGTATGGAGAGAGAGAGCATCCCTGTCTTTAACCTCTTGCACTGTTGAAAAAAACAACTAATTCCCCATTAACTTGAACCGAGAAGGAAGACGTAGCTATGCAGAGGGTAACCCAATGAATAAAGACTGAGGGAAAGTCCATGGCTGTGAGAACTTTGGTGAGGAAGTCCCACTGTACCGAGTCAAACGCTTTTGATATATCAATTATTAGAGCGCAACGGCTAGAAATTGAGTCATTATGGTAGTCCTTGACTAATTCTGTCGCCAACAACACATTCTCTATCAATAGACGGTCCTTTACAAACGCTGACTGATTTCCCGCTATGAATTGAGGAAGAACCAATTTAAGCCGGTTTGCAATTATCTTGGAGATAACTTTATATGTCACATTGCAGCATGAGATAGGCCTATAGTCTTTAATCTCTTTCACATTTTTCTCTTAGGAATAAGTGCTAATATCGTGGAGTTGATGCCTTTAGGTAAGAAGCCTTCAACAAAGAAAGACTGAATCGCCAATACAAACTCATCTCTGGTGATTTCCCAAGCTCCTTTATAGAATTCTGAGGTAAATCCATCTGGTCCCGGAGATTTATCATTAGGCATAGAGAACAAAGCCTTTTTAATCTCAGCTGCAGTGACTTCATTGGTAAGCATCTCTTTTTCTATTTCCATACAACAAAAGGGTAGTAACTCTTGAAGCTCAGCCACTGAAATACCTTCGAAATCATTAGGAACTAGCTGCAAAAATTCTCTAAAGAACCGTTCAGCCTCTGTTGTGATTTCCTCCTCTTGTGCCGTCACAGTCCCATGTTGGCATTGAATCTCTCTAATTGTGTTCCGTGCCTCCCGCGTTGTAACAGCTCTATGAAATGCTTTATTGTTTCGATCACCAATCTTCATCCAATGTAATTTTCATTTCTGCTTCAAATATATTTCTTCCAGAGCTGCGACCTTGTCCCAAGTGTCATACGCCTCATTTTCTTCTTGCATTGAGCTTGTGGTGGGGTTAGACAAATTGGCCTCCTGCTTCTGACACAATTTCTCATACGCATCTTTTGTTAAAAAACACATTTTGATTTTCTTATAAGAAGTTTAAACATTATAAATACTAAAACTTTATATTACGGGTGAAATCTTAGAATTAACGAGTATGAGTCAATATTAATATAGGATGATATACCACCTGTGAGATCCTAAAATTAATAATTAAAATACAATTATAAAATCTTAAAACACTAAATAAAGTAAACATTATTAACAAGACAAATACAACTAAAAATTTCAAATATTTAGTTATAAAATATAGTCTATCTTACATTAAAACCAAACAAAACAATAACATATATCTACAGAATTTGTTTTAACTAAAATATATGCATGCGGTGTATCACGGGTTCATATCTAGTATGCTACATAATAATTGATTGTAAATAAATAAGGTGAGATAAAAATCTCCAAAATCTCAATTGCCAATAACATTACAACAAGTGTGTCTCTCAATAATTTCTTTCTTTTTTGAACAAATAATAATAGAAAACGCTTTACTTGCGAGCTAGGTGTGTGAAACATCTTCCAATCATATGGTGATACGTGGCATGGGCGAACCCAAATAAATTTTTTTCTATATGTTGAATAGATTCAACACCTAAAAATCTAATGCAAATTTTTTTTCAACAGGTCCAATGCAAGCAGTTTTAGTCACATGCAGTTAAAGTATTAAATCCTTCTACTTATAAATATTTTATTCCTACTTAATAGCATGTATGTATTTTGGCAAAAAAATGCTAAATCGGAGATGAAGTTAAAATATATATTGTGCGCTCTAATATCAAATTAAGAATTATATTTCGTCCAAGCTACTTAGTACGTACATGTTGTATTCACTAGTTGTCCTTCCTTTCTTCTTTTCCATGGTCACAATTTGGTTCATTGTTTCTTCTAAGGGATTGAGCAATCACGGTTTTTCGGGAGAGTGTTTTTTGGGCAATATCTCTTTATATATTTAAGAATGCTAAAATGTAGTATTTTTGTTGGTTCTTGTTTCATTGCCAACATTGTACGAGGCGTGATGAAGGCAGTGAAGAGAATAAGGGTAGTTTCGTAGACATAGTAGTTGAAGAGCTAAAGCTAAGAGAAGACGAATAACACACATACATGTTGCTAAGAAAGGAGCGTCTTCGCAAGGGAGAAATCCGAGGTGATTCGAGCTAGGCAAAGAGGATGGAAAGATGTAATTGTGTTTTCAAATCATATATATGAAAGGAGGTGACCTATCTCCATATGAATGACATGTTACACCATAGAGATGATATTTTCTGTATTCTCTCATCTTATTCGGAAACCTAAAAAGGTATGGTGAAAAATATAAGAATAGAAGAATGAGAAAATGGAGGCTTCTTAAACTAATTTTAAATTGTATTTGCTTAATTTAGGACTTGAAAATATATTCTGTATATTTTGAAGATTAGTGAAATTAATGGGTAATTTTCTCAGACATGGAAATCTTGTTTTATTGTTTTTCCTTTATGACTTTGCAAATATAGTAGGTTTCAGGAATTTTTATGAACTATTTTATCTTCAACTAGAATTAATACTCCAAGTACTTATATATATATATATATATATATATATATATATATATATATATATATATATCATATTTAAATTCATATTAATTTGAAAGTGTTAAAAATGCCCTTGAAGATGACAAACAACTGAAACAAGACATTTGAGCAAACAACTTGAGATGCTAACAAATGGTTTTAGTAGACATCTAAACAAATCCAAATTCTAATAAGATTTATTTTGTTAGTCATGTACATATACCCTATAACCCTAATATGGAAACCAAATAAATAGGTCACTATGGATTATGTATTTTGACCAAAAAAAAAAAAAGAAGAAGATGAATAATGTATTTTTCTGTCTCTACATACAACGAAACATAGTTAAATGTTTAAAGTTCAAAATCTACTAGAATTTGGCTACTCAGAATTATAAAAGAGATTCAAGACATTTATGTAGTACCTCTGTTGAAACATTTTTTGAGAATTTATAGTGAAAAGTGTAGTCATTTTGTGATCTTTTCCAGCTTCCTATATTTCATGCGTTTTAGCTATATACTATCCTACTATATTATTTGGGAAGTACATTTTAAAATTTAACCTTAATTTTTATAACTAATTACATGACAATGCCATTAAAAAAATCTAATCAAAGACAAAATTGTTTCAAATCATTAAGGTTAGTAAAATCATTTAACGATAATATCCATCTACTAATCACACAAGTTAATGGATATATAAACGGGTTAAATATTTTTCTGCCATTTATTAAAAATTTTCGTCAATTCATATTTGTAAGATTTTTTAAACAATAAGATCTTTTTGTTACCAGGTGGAGAATAAGTTGGAACACACTTATATAGTTTCCTTTGAAAATCAACAAAATCTTAGCCACTATATCGATTCCTATCACCATATCTCGCTGTTATAATATTTCTCATCACTATATTCCGGTTAACAAGTAATATTCCTTGAGCTACAATTTTTTTAAATAATCTTCTTTCTATCAAATAATCTATCTTAAACAATTAACTACTAACTGATTTAATTAGATCTTCAATCTATTGAATTCACCCATCAGTATTATAAATAAGCAGATAACCATCATGATGTCTGTACCTTCTCACATACACACCTATCAAAAACTTAAAACCTTTCAAAACCTCTTGGTATATTCATATTAGGATTCTTCATTCATGGAATCATTATTCCAAGGGTTTTGGGATGTCTTATGAAATAATTTTGGCAGAAGAGTATGTAAAATTTTTTGAATAAAAAGTAGTCAGCAAAACTTTTCTTTTTTTGGACTTTTTAGATAATTAATTTAGAGAATAGGGTTGGGCATATGATTAACCCATTCGAGTTCGGGTAGAACCCGTTCGAGTTTGGGATTAATGGGTATTGGATTTACTACTTAATACGGTAATTCTAAATATTCGGTTCGGTCGGGTCCAGTCGGTTTTCAGTCAGTTTGGATAAAAAGTTTCAGGCCATAAAAATACCCAAAAAAATAGAAACGGGTATTTTGTATGTAGATAGCGGATCCCCAAACAAAAAAAACTTTTAAATTTGTTAAGTTTTAAGAAATTTAGTTATATTTGAATATATTTTACTAAATTTTGACAAACATAACAAATGATTTTTGAATAGTTTAGTTGTTTTGGATATTTAGGTCCAACATTAATTGACATATTTAAATTTTTTTTTTTTTTTGTCAACCGATATAAATTAAAACTCAAAAGAGCCAATCCCGAGGGATATTGTTTACATACGTGACATGATGCGGTACGGTACGAATCTTTCGTGCCAACTTATCCGCTTTTACATTTGCACTACGAGAAATTAAAGATAAAGAGAAATTTGTGAATTCTTCCCTATCACTCTGCAACTCCTCCAAATACACTGAAAACGCCGGCCATTCGGTTGGAGAAGACACCATCTTCACCAAGTCTGAACAGTCTGTAAAGAAAGCTACGTTCTGGTTATCTGCTCCAATCATGCACTTCATCGCCCAAAGAAGAGCTTCCATTTCGGTATGTAGAGGAGATAGACTTCTACGAACGTTGGCGGCTCCCATGGTTGGCGACTCTCCAAGAGATGATAGACAGAACGTTGGAGACATATTTAGATTTATAATTATAATCTTAGATAATTAGATTATATTAAGATTAAATATATTAATATTTTGGATATTAAATAAATGTTTGGGTTTTCGAATACCTTTTTGGGTAACGGGTAATCTCCGGACCAATCGGATACCCACGGGTTTACTAAAACTCTATCCAATAAGGAAAATTTATTAAAATTCTAACCTGCCCTAACCCGATTTTTTGGTTCGGGTATTGGGTTGGTTATCTGGTCTGTTTTTTTGTCAGCCCTATTAAAGATAATCTAATATAGGGCCCAATTAGGCCACAAATATAACCAAAATACTATACAAATACTAATTCTAAGTTAGGCCAAAAATTAGATCCTCTATTACAAACGAAACATGTTTCTTACCAAAACAACTTGTATACAAATTTTACACATTTACTTAAAACTACATATGTTGTATTTATTATAAAAATGACATTTTTAAACAAAGTTAATCCAATGCAGCATTATATCCAAATAGCAAAAAACATTGAAAAATATTATGGCATCACTTTTACACTATACTATTTTTTATGTAATTCAAACAAAGTATACAATTTAGTTTATACAAAATATTAATGCCTGTGCTATATAGCACGGGTTATGATCTAGTCTACTTAACATTTTTGAAGTACAAAATAAAGAATTTTTCGGGTCGGTTTTTTTTTTTTGTTTTACCCGGTTTTTTTGACCCACATCCTATTATTTTAAATGCTAATCAAATCTTACCAAAATTAATCGCTTTAAATACGATTTAGTTACAATTAATTATTTCCGTTCAGCAAAGTAAATCCGACTTATATGGAATGAATATATTAACATTGCAAAACAAATCCGACTTAGGTAACTTAGTATTTATCCGTTCAGCAAAGTAATTACTCGAGTAAATATTCTATTAACTACGAAATCTTCAAGTTAAACGAAATCAAAATCTGCATTCCACTACATAATTTTCGGAGATCTTAAGAACTAAATTAAAGCATATTCCTAAGCATAATTTAAAAAATCTCGCTACACAATTTCCTAATATCGCAATAGTCAAATCATGGGCGAAGATTGTGATTATCATATGTTCTCTATATAAATAAGGAATTTGAATTGAATTTCTATGCTAAGCCATTTGCCATAAAAATCTCAACAAAATATTGAATTCATTATCTCTACAATCTCGACAATAGAAACTATATGATTGTATTAAAAAACGGATTTGGTGCATATTCCTTGAATATTCGATTAAGAAGATTTGATTTAATTTAGTTAAGGTGCAAATAATTTGTTATGGCCCCAAACCTAATCAGAACTCGCCTATATATATTCTCTAGCTTTACCTCTCATCACATTATCAAACACACAAAGCTCATCACATATCTTTGGATTTTGAGACAGAAAATAAAAAATATGATTCAGGTTGAGAGAGTTACTGAATTCATCACGGAACCACAGAAGCGATGCAGTGGTTCATCGGAGAAGCCTGAAACGGCTTCAAAAGTTTCTAGAGAATATCAGAAGATCCCAATCTCTAATCTTCATAGTGAAGATTAAATAGAGAGAGAGAGAAAGAGAGATTAGATGTACATCACGTAAGATTGGCGACAAAGGAATCGCTAAGGGGTCGAGTGGTTTAATCGGAAATCGTATTCGATAATATCAATGAAGCAAAATGAAAGTAGCACACATAGGTTTGTATGGTGAGACTTGAGAGCATCTTCGACCATCAGAGAGGGACAACTTCATGAGAATCGATGGAAAAAAAAATTAGCTTCGAGGAAGAAGCAATGGTTTGACGAAAAACTAGATGGTCACAAATGATTGGTAGGCATCATGTTCAAAAGCTTAGCTTGCTCGAGAAGTCACCGACGAACGTGGAGTTGGCCGGAGTTTCTGTCATCAAAACCGCGTTCAGTTTTGCATTGCAGAAATCAAAGAAGATGCTTCGTTATTATCGATGGGGAAGAAGCATAAAAAAAAGTCTTCCTCTGATGTTAAAACTAGGCCAAGTATTTGTCATGCCCATAGAACTTGCAACAGAAAGCAACGTTAGTCTTTGGATAGAAAACAATTACGGTATTTTTTTATGTGGTTTATACATTACACTAATTATGTTAAATATTTTTCAATAGTATTAACGAGAAGCACAATCTATATATATATATTTTTGGAGAAACTTTGGGTCAAATCCTTTTATAATTTCTTATTTATACATTTAGTCCTTATAAAATAATCTGATAAAAATATTGTCTTAAGCAATTTTGACAAATAAAATTTAAGTAAATAACATTAATTAGTTATAGATGATTTACGGCAATATTTCCTAAGAAATAAAAAATTTGCGACATTAATGCTATTAGAAAAGAACTAAATAAAAATCTTCAATGGTATATTTCATTATTAATTCGCTTTATTCCTAAAAATATTTAAACAAAATTTAGTCATTGATTTGCAAATACAGAAATTGTATATGTAGTTATAACAAACAAATATTTTCAAATCAAATGATTTTCTATTTAAATGCTAGAAAAAACATAATAAGTTTTTAATGTCATATCTAAGAAAATCAATAAATTGATATATTATTTTAACAAATCAATATCTAATGCTAACAATAAATTAATTTGATACACGTTTTTAATTTAATGCTAATAAAAAAATAATTTGTTCTAACGCTTCCTATTTAAATGCTAGAAAAACGTAATAATTTTTTTAATGTCATATCTAAAATAAACAATAAATTGATATATTGTTATAACAAATAAATATTCAATGCTAACAATAAATTAATTTGATACACGTTTTTAATTTAATGCTAATGAAAATTAATTTGTTCTAACGTTTTTAATTATGGCATTAAAGATTTATTGTCAAAAATAAAATTAAAGTACTTGATAGTTTGTATATATATTAAATTACTTAAAAGTTAAAATTAATGTATATATAAATATAATAACAATTAAAGTACATAAACAAACAATCTTTAGTTGTTATATACTATTAGTAAAAAGAAAAATGACAAAATGATTTTTATTTTAACAGACGGGGTTATATGGTAATACGGATTTTAGTCGATATTAATAAGAGACGATATAGCACGGGTGAAATCCTAAAATTGATAGTCAAAATATAATAATAAAATCTTAAAAAAGAAAACAGACAATTATTTAATTATATAATTATACCGGACAAGGTTATATAGTATGACAGCTTTTGGTCGATATTAATACGAGATGGTATACAACGGGTGAAACCGAAGAATTAACAATCAAAGTACACTTATACAATCTTAAGAATCAATTGCCGGACAATAAACAATATTAGTAAAACAAATACAAATAAAATTTAGTTATAAATTAACCCGCGGACTGGAGCACACCGCGGGTCATATCCTAAACAATAATTTCTTTAGGATAACTACAATTCCATATAAAAAACTAAATTTAAAACAATTTTTTTATAATAATGTTATTTTAAACAAAACAAAAAACAATATAACAAAAATGTAATAATGCACCATAAAATACACACTCTATATAATGATGCGTATAATAAATATGTTTTCTTAAATAAATAAAATTAAATCAAACACATACTAATATAACATCAAAAATGAATAGATATAAAAGGTAAGGTGATAAATTAAAAATATAACTTGATTATTTAGATAAAAACGATATCGAATTAAAAAAATAATTTAATTTCTAACACAAATAATCAACTCGCGGTACACCGCGGGTCAATATATAGTTAAATTAAGGTTAGAAACTTAGAATTAAGAGATTTATAATTATAACCGGTGCCGTGGTCATGGACTCATGCGTATATATCGGTATTTTAAAGACAAAAATAACGAAAACGGCACGCAGTTTATCCCTCAACACCCGAGACAACACTTCTCGTAGTCCGTGCTTAAATTCGCCACGTAGTTCACTTTATTCAACTTAAAAAAGCATGACGTTTTGGTGCATCTATCTTCTTCTTCCCCCTTCCTCTCTTAGCTTCTCTCCCACCACTAAGGAGAAACGTTCCAAAGATCCCTCTCTCAGAAAAATCTCCAAGAAAACGAAACCCTAATGGAGAATCATTCTGATCCCTGAAACTTTTGGCTTGCGGCTGAATCGATTTCAAGATTGCAAGTATTGCCTAGTGTGAATATGCTGTTGCTGTGTGATGCTTTGGTTAAGGAAGTGACTGTTGAATGCTGAAAGGACGACTTGGAACCTTATCTCGGGTTGCATTACTCGGCAAACTTCGATATTTCTTTATATGAGAAACAAGGTTACGATGATTTCAAGAACTGTGCTAATCTTTGCCCAAGATTTACATGTAAATGGTACTGATTGAGTGTTAAAAGGAAGAAGCTTCATACATACAATATACATTGATCGGATATAGTTTTAGAGTAGGTTCCGAGTTCCAAAACAAAGTGAACTATACTGAGTATTTCAACATAGAAAAGTTATAAAATTGACATCCTTTGCAAAGTAAAAGCCATATCATAACAAAAAAATCGGAACATTTAACCGAAAACAGAGACAACCCACAAAAGAAGAAGAAGAATGCTAAAATTGAGAAGCACTGATGGAGTTGGTCGAAGGGGACCAAACGGAAGGGAATATATCTTCTATAGACTGCTTACGAGTTATGAATTGAGTTGCGTCAACGTGTGATTCTGATCCGGCTGAAGGAAAGGCCGCTTCATGTGAATACGCACATGGTTCCTTGTACGCCTCTCTTTCCGAAACGTTGGCTGCAACTTCGTATGATTGTATTTGTAGCGGGCCTAGCGGCATTAGTTTCAGATGGCTGATGATTTTCTTGAAATTTTTTGGTGGAAGCGAATTAGAGATAACATACTTCGGAGGATATGCATTTTAATAACATATTTATAAGTTTTGAGTATCGCATATTACGAAAACGAAAGCATTTGAAAGATTCGAGATTTCACTATCGAAAGTGGGGGAAGACACGC
>URS00006236D2 tRNA from 1 species 
CTCCCCATAGCTCAACAGGATAGAGCAGCCGCCTCCTAAGCGGCCGATAGAGGTTCGAGTCCTCTTGGGGAGG
>URS0000187CC4 rRNA from 1 species 
ATTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGCGAAAGCCCTTCGGGATGAGTAGAGTGGCGGACGGGTGAGTAACGCGTAGGAATCTATCCTGTAGTGGGGGGATAACGTTTCGAAAGGAACGCTAATACTGCATACGCCCCAAGGGGGAAAGCGGGGGATCTTCGGACCTCGTGCTATAGGAGGAGCCTGCGTCGGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACCGGAACTGAGACACGGTCCGGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCCATACCGCGTGTGTGAAGAAGGCC
>URS00023B9165 lncRNA from 1 species 
GATAGAACACACTTCAAGCATTAGATTTAAGAAAATTTATATCTTCTCTCATCTTTTGATTTTCGGTCTTGAATTCGAGTTTGAGAAAGTTGGAAGTTAGAATCTTGACGTCGAAGTTCTAGTTTGCTGCTCTACACAAGGTCAGTAATCTCGTTCATTTGGTTCGTTTTCAAGGATTGGTTATTATAGTATGGAACATTTTTGTGTTGTTATTCTCTGATTTAAATATGCACTGAAATATGTCTTGCTGTATTTTAGTTAGAAATCAGCTTGCAACAGGTTAAATGAGTTTCTTAGATTAAGAGAATTGACT
>URS0000F2E397 rRNA from 1 species 
CCTACGGGTGGCAGCAGTGAGGAATATTGGTCAATGGGTGGGAGCCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGTCCTACGGATTGTAAACCTCTTTTGCCGGGGAGCAACGGGGTCCTTGCGAGGTCCCAATGAGAGTACCCGGAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGAGCGTAGGCCGGTCTTTAAGCGTGCCGTGAAATTTTGTGGCTCAACCATGAGAGTGCGGCGCGAACTGGAGACCTTGAGTGCGCGGAAGGCAGGCGGAATTCGTGGTGTAGCGGTGAAATGCTTAGATATCACGAAGAACCCCGATTGCGAAGGCAGCCTGCCGCAGCGTTACTGACGCTGAAGCTCGAAAGCGCGGGTATCGAACAGGATTAGATACCCTTGTAGTC
>URS0000620B57 rRNA from 1 species 
AGAGATCATGGCTCAGAGTGAACGCTGGCGGCAGGCCTAACACGTGCAAGTCGAGCGGCAGCGGGTCCTTCGGGATGCCGGCGAGCGGCGGACGGGTGAGGAATGCGTCGGAATCTGCCTCTTTGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCGGGGGACCTTCGGGCCTCGCGCAGGGAGATGAGCCGACGCCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGAAGAAGGCCTTCGGGTTGTAAAGCTCTTTTGTTGGGGAAGAAAAGCACTGGTTTAATACGCTGGTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTTCGTTAAGTCTGATGTGAAAGCCCCGGGCTCAACCTGGGAACTGCATTGGATACTGGCGATCTGGAGTGCGGTAGAGGGTGGCGGAATTCCCGGTGTAGCAGTGAAATGCGTAGATATCGGGAGGAACATCCGTGGCGAAGGCGGCCACCTGGACCAGCACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGCGAACTGGATGTTGGGTGCAACTTGGCACTCAGTATCGACCTAACGCGTTAAGTTCGCCGCCTGGGAAGTACGGTCGCAAGACTGA
>URS0000D14622 rRNA from 1 species 
AACAGCTCAAATTTGAAATCTGGCCTCTTCGGGGTCCGAGTTGTAATTTGTAGAGGGTGTTTCGGGCGCGATGCCGGTCTAAGTTCCTTGGAACAGGACGTCGCAGAGGGTGAGAATCCCGTACGCGACCGGTGATCAAGTCTGTGTGAAGCCCCTTCGACGAGTCGAGTTGTTTGGGAATGCAGCTCAAAATGGGTGGTAAATTTCATCTAAAGCTAAATATTGGCCAGAGACCGATAGCGGACAAGTAGAGTGATCGAAAGATGAAAAGCACTTTGGAAAGAGAGTCAAACAGTACGTGAAATTGTTGAAAGGGAAGCGCTTGCAATCAGACCGGTCCGGAGGCGATCAGCCGCTGCTCGTTCAGCGGTGCACTCGCCTCCGATCCGGCCAGCATCGGTTTGGGCGGCGGGATAAAAGTCCCGGGAATGTAGCTTCTCTCGGGGAGTCTTATAGCCCGGGTCGCAATGCCGCCCGCCTGGACCGAGGACCGCGC
>URS0001D2993E rRNA from 1 species 
GCTAAGGCCCCCAATTCATGGCTAAGTGGGAAAGCAGGTGGGACGACCAAAACAACCAGGAGGTTGGCTTAGAAGCAGCCATCCTTTAAAGAAAGCGTAACAGCTCACTCATCAAGCGATCCTGCGCCGAAAATGTAACGGGGCTAAAGCCATTTACCGAAATTGTGGGCTCGAAAGAGCGGTAGCGGAGCGTTCCGTAAGCGGATGAAGCCGAAGGGTAACCGACGGTGGACGTATCGGAAGTGCGAATGCTGACATGAGTAGCGACAAA
>URS000241757C lncRNA from 1 species 
CTACTAAAAGCATACTGCATAAACAGCTTGAGAGCATCATTGTTGTTTAAAAACTCGGGCTCATATATCTCATCACCAAGTCTGCTTAGTGACTGTTTATCTCTAGTTGTTATAATGATTCGACTTCCGCCACCAAATGAAGGTTGCTTTCCAATTAAGGCTTCAATTTGGGATGAACTCTCCACATTATCCACAACAACAACAACAACAACAAAGCCTTTTCCCACTAAGTGGGGTCGGCTATATGAATCCTAGAACGCCATTGCGCTCGGTTTTGTGTCATGTCATCCGTTAGATCCAAGTACTCTAAGTCTTTTCTTAGAGTCTCTTCCAAAGTTTTCCTAGGTCTTCCTCTACCCCTTCGGCCCTGAACCTCTGTCCCGTAGTCACATCTTCAAACCGGAGCGTCAGTCAGCCTTCTTTGCACATGTCCAAATCACCGGAGCCGATTTTCTCTCATCTTTCCTACAATTTCGGCTACTCCTACTTTACCTCGGATATCCTCATTCCCAATCTTATCCTTTCTCGTGTGCCCACACATCCCACGAAGCATCCTCATCTCCGCTACACCCATTTTGTGTGTACGTGTTGATGCTTCACCGCCCAACATTCTGTGCCATACAACATCGCTGGCCTTATTGCCATCCTATAAAATTTTCCCTTGAGCTTCAGTGGCCTACGACGGTCACACAACACGCCGGATGCGCTCTTACACTTCATCCATCCAGCTCGTATTCTATGGTTGAGATTTCCATCTAATTCTCCGTTCTCTTGCAAGATAGATCCTAGGTAGCGAAAACGGTCGCTTTTTGTGATCTTCGCTAGATTGCTCCGGTCATTAGTGTGGATAAGTATATATAAATGGATAGAGATAGGAAAGCAAACACAAGATGTACGTGGTTCACCCAGATTGGCTACGTCCACGGAATAGAAGAGTTCTCATTAATTGTGAAGGGTTTACACAAGTACATAGGTTCAAGCTCTCCTTTAGTGAGTACAAGTGAATGATTTAGTACAAATGACATTAGGAAATATTGTGGGGGAGAATGATCTCGTAATCACGAAACTTCTAAGTATCGGAGTGTGGTGTCGTCTTGACTTGCCTTATCTGTCTCATAGGTAGATGTGGCATCTTCTCTGGAAGTACTTTTTCCTCCATCCAGGGGTGGTATCTTTAACTGGTGGAGATGCACAAGGTAATGTATCAATTTCACTTGAAGCTTACTTGTAGTTTCAGGCTTGGTCAAGCGCGATACAAACCATGTAGTAGGAGTCCCCCAAGTCGCCGAGCTAGGGGGTCTGCTGAAAGAGGTGACAGACAAGGTAAGCAATCAGAGCTCCGACTGATTGTTCACCTTCTCCCCATCTTGCAGCAGCATGAAGGATAAAGAGAAGAAAAATGAGAAGAGATGATATGAGATACTTTTGCTTTTGAAGAAGTAACTTTTCCACAGGCTTATTCTTGAACTGAGCTGGAGGGTTTTCTGGTTTCCTCCAGAGTATAAGGCCGACTGAAGAATTTGAGGGTCAAAACAAGTCCATCAAATCTAGAGTACGTTCCACCCTGCTGATATGGGATACTTTTGCTTTTGACAGAGTAATGGATGTATCGGCACGTGTGCTGTTACGCTTGTCTCCACATGCTTCCTTGTATCCTTCGCACTTGCCCTATCTGTTCCTCAAGCAGATGCGGAATCTTCCCTGGAAACATAAGATGTTGAAGATGAGTACTCGAGAGCAATGCCAGGTAAGTAATCAGGTAAGGGGTTCCAGGCAGTCAGTTCCTGGCTGGAAGCTTGATTCCAAGTGCTGACTGATTGCTCTCTTTCTCCTTGTCTTGCAGGTAAAAACAAGGCCAAAGGAAAAGACAGGGAAAAAGCATGATATGGGATACTCTTGCTTTTAACCCTGATGATATGAGATATTCTTGCTCTAGTATAGCTTGTTTGCAGAGGTATTATCGGGGGGAAAGAAAGCTGAATATTTCGAAAGGCTTCGTTGGGAGTGCCCTCTCAGATATGATGAAGGGTTGAGCATTTTTGCAGGTCTGCCTGTCCGTTGGGGATGGAGGTCGACATATATAGGAGTCTCCCTAACAACAAGTAGTAATGCTATTCCTTTACCCTGCTTGGTCATAGCACGGTAGTGGGAGCTGCCAGTTTCACATGTTTTAACTCTGTCAGAGCACTTTGAAAAAGTGGTCTGTGGTATCTGGCTCTCGAGATTCGGAGAACGATGCCTCTTCGATTTTTGAGAAAGCAATCATGCTGGGGGTCTGGCTCTCGAGATTCGGAGAGCAGTGTCTCTTCGATTTTTGAGGAAGTAATCATGTTGGGAGTCTGGCTCTCGAGATTCGGAGGGCGGTGCCTCTTCGATTTTGGAGCAAGCAATCTTGTTGGGAGTGTTGTCTCGAATGTGAGTAAAGGTTGGGCATGTTTGCTAGTCTACCTTGCCACGAAGCACAAAGGTTGACACACAGGGACTTTCCAATTATCCAGCAATGGTACTGTTCCTTTACCCTCTCTTCGATTTTGAGAAAGTAGTCATGTTGGGAGTCTGGCTCTCGAGATTCGGAGGACGGTGCCTCTTCGATTTTGGAGCAAGCAATCTTGTTGGGAGTGTTTTCTCGAATGTGAGTAAAGGTTGGGCATGTTTGCTAGTCTACCTTGCCACGAAGCACAGAGGTTGACACACAGGGACTTTCCAATTATCCAGCAGTGGTACTGTTCCTTTACCCTTGTGGGTAATAATATGGTAGCTAGACCTTCAAAATTTATGTGTCTAAACTTTGTTAGTGCTGTTTCTTTGCTATTCTTTTACCTTTCTTGGTCAGAGCGATGTAGTGGGAGCTGCAAGCTTCACGTGCTCAACTTTGGCAGAGAACTTTGGCAAAGTTATCTGTGGTACCCATGAGCTATTGTTGCGTGTGGGAAGTGGGTGATTGAACAGTAAGATTCATGTGCTTTCTACTTCACCAGAAGTCTTCGACAGAATGCCCATAATTTCTGCAAAGCTGAGTGTGCGTGTGACAGGTGCTGACAAGGCTAGAAAAGTAGGTGCCTCTTCGATTTCTGAGATCGGCCCTCGTGGTCTCTGAGCAGCCCAGCTTTTGAGAAAGCGAGCGCCTCTTCGATTGATTCGGAGAACGATGCCTCATCGATTTTTGAGAAAGCAATCATGCTGGGGGTCTGGCTCTCGAAGATTCGGGGAGCAGTGTCTCTTCGATTTTTGAGAAAGTAATCATGTTGGGAGTCTGGCTCTCGAGATTCGGAGGGCGGTGCCTCTTCGATTTTGGAGCAAGCAATCTTGTTGGGAGTGTTTTTCTCGAATGTGAGTAAAGGTTGGGCATGTTTGCTAGTCTACCTTGCCACGAAGCACAGAGGTTGACACACAGGGACTTTCCAATTATCCAGCAATGGTACTGTTCCTTTACCCTCTCTCTTCGATTTTTAAGAAAGTAGTCATGTTGGGAGTCTGGCTCTCGAGATTCGGAGGACGGTGCCTCTTCGATTTTGGAGCAAGCAATCTTATTGGGAGTGTTTTCTCGAATGTGAGTAAAGGTTGGGCATGTTTGCTAGTCTACCTTGCCACGAAGCACAGAGGTTGACACACAGGGACTTTCCAATTATCCAGCAGTGGTACTGTTCCTTTACCCTTGTGGGTAATAATATGGTAGCTAGACCTTCAAAATTTATGGGTCTAAACTTTGTTAGTGCTGTTTCTTTGCTATTCTTTTACCCTTCTTGGTCAGAGCGATGTAGTGGGAGCTGCAAGCTTCACGTGCTCAACTTTGGCAGAGAACTTTGGCAAAGTTATCTGTGGTACCCATGAGCTATTGTTGCGTGTGGGAAGTGGGTGATTGAACAGTAAGATTCATGTGTTTTCTACTTCCCCAGAAGTCTTCGACAGAATGCCCATAATTTCCGCAAAGCTGAGTGTGCGTGTGACAGGTGCTGACAAGGCTGGAAAAGTAGGTGCCTCTTCGATTTCTGAGATCGGCCCTCGTGGTCTCTGGGGAGCCCAGCTTTTGAGAAAGCGAGCGCCTCTTCGATTTCTGAGATCGGCCTTCGTGGTCTTTGAGCAGCCCAACTTTTGAGAAAGCAAACGCCTCTTCGATTTCTGAGATCAACCCTCGTGATCTCTAAGCAGCCCAGCTTTTGAGAAAGCAAACGCCTCTTCGATTTCTGAGCAGGCGCCTCTTCGATTTCTGAAGCTCCGTCGAGTGCAGATTTTTATATAGGGGCTGGCATTAAGTTCCAAAGCACACTTGAATCTCCACCAGTAGAAGCTTCATTCTTGCACTTCTAAGATCTTGATTTGTCCGACCTCTTCTCTCTTCAACACCTTTGAAAATGTCTGGCCCCTCCGACCGTCGTTTTGACTTGAACCTTGTTGAAGAGGCAGCCCCGCCTTCTCCAGACAACATATGGCGCCCATCCTTCGTCTCCCCTACTGGTCCTCTTACCGTTGGGGATTCCGTGATGAAGAATGATATGACCGCTGCGGTGGTGGCCAGGAACCTTCTCACTCCCAAAGATAACAGACTACTTTCCAAACGGTCTGATGAGTTAGCTGTTAAGGATTCGCTGGCTCTCAGTGTTCAGTGTGCAGGTTCTGTGTCTAATATGGCCCAACGCCTATTTGCTCGAACCCGCCAAGTTGAATCATTGGCGGCTGAAGTGATGAGTCTCAAACAGGAGATTAGAGGGCTCAAGCATGAGAATAAACAGTTGCACCGGCTCGCACATGACTATGCTACAAACATGAAGAGGAAGCTTGACCAGATGAAGGAAACTGATGGTCAGGTTTTACTTGATCATCAGAGATTTGTGGGTTTGTTCCAAAGGCATTTATTGCCTTCGTCTTCTGGGGCTGTACCGCGTAATGAAGCTCCAAATGATCAACCTCTGATGCCTCCTCCTTCTAGGGTTCTGTCCAGTACTGAGGCTCCAAATGATCCCCCTCCGGTGCCTTCTCTTTCTGGGGCTCTACCGACTGCTGAGACTTCTCCTAAGCAACCTTTGTGAAGGCTCCCTCTTGTGTGTTTATTTTGACTCATGTATATGTACATATTTGTAGCTTATCGGGGATATCAATAAATAAGCTTTCCTTCATTTCAACGTATTGTGTTAAATACACCAAAGCCTTCTTCGCTAAGTTCTTTGAATTTTCTTTTGTTGAAGCTTGTATGTTGAAGCTTTCTGAGTGGAGCATGTAGGTTGGGGTAGTGTTCCCTTAATTTCCCGAGTGAGGAAAACTTCTCGGTTGGAGACTTGGAAAATCCAAGTCACTGAGTGGGATCGGCTATATGAATCTTAGAACGCCATTGTGCTCGATCCTGTGTCATGTCCTTCGTTAGATCCAAGTACTCTAAGTCTTTTCTTAGAGTCTCTTCCAAAGTTTTCCTAGGTCTTCCTCTACCCCTTCGGCCCTGAACCTCTGTCCCATAGTCGCATCTTCTAATCGGAGCGTCAGTAGGCCTTCTTTGCACATGTCCAAACCACCGTAACCGATTTTCTCTCATCTTTCCTTCAATTTCGGCTACTCCTACTTTACCCCGGATATCCTCATTCCTAATCTTATCCTTTCTCGTGTGCCCACACATCCAACGAAGCATCCTCATCTCCGCTACACCCATTTTGTGTACGTGTTGATGTTTCACCGCCCAACATTCTGTGCCATACAGCATCGCCGGCCTTATTGCCGTCCTATAAAATTTTCCCTTGAGCTTCAGTGGCATACGGCGGTCACACAACACGCCGGATGCACTCTTCCACTTCATCCATCCAGCTTGTATTCTATGGTTGAGATCTCCATCTAATTCTCCGTTCTTTTGCAAGATAGATCCTAGGTAACGAAAACGGTCGCTCTTTGGCATTTCTTGATCTCCGATCCTCACCCCTAACTCGTTTTGGCCTCCATTTGCACTGAACTTGCACTCCATATATTCTGTCTTTGATCGGCTTAGGCGAAGACCTTTAGATTCCAACACTTCTCTCCAAAGGTTAAGCTTTGCATTTACCCCTTCCTGAGTTTCATCTATCAACACTATATCGTCTGCGAAAAACATACACCAAGGAATATCATCTTGAATATGGGGTATGGGCGGTATAAACTATTTTAAAATGTAAAATATAAAATATAAAATTAATAAATAATAATTAATAAAAATTGACTGTATTATGTACGATGAATAATTACGATCACGGAATCCCTAGGATCCCAAAAGAAAAATTCGGTGAGAATCCTTTTCCAGAATTTTTAATCCAACCGTTTCTTGTGTTAAATTTATCCCAAAAATTAGTTTTGACCAAAAATTGATTTTTAGTCCAAGGGTTGGAGCAAATTGAGAGAGTTAAAAAACTAAAATTTAAGCTAAAGTCCAAAGATTTGAGTTAGTCTAACAAATACAAATGAGAGAAAGTAACATTCATATTTTATTGCGGCTTTTAATTTTTATTTAAAATGGTATCTAAACTTGGTATAATTACTTACTTTTAAAATTGATAAAAATGGTCTTTGAGATTGTCTACCATCAATCATTTTGGTCATTCTGTGAAAAATCTTAATTAAATTAGAGGTATTTTTATCAATACCTTTGAATTGATGATTTCTTCAATTTAATGAAATATTTTCACAAATCATGGTGCATATTATTGGTGGTCCTAAGCTCCTTTATATGTGTAGCGTATGCTTATGTCATGATCTTTCTGCTTCTACTAAATATCAGATGATTTTGTTTTTACTATTTGTTTTACTTTGTACATGGGGTGGCTTTTAGGTTCCCCTGTTGTCTTACTTGCTATGTTATTTCCTCAACAAGGTTTGCTTTTATGTTTCCCTCATTTGTAAATTTCCTTTTTTTTTGTTTTTACTTTAATATGATAATGGGATGCTCGGTGAGCACTATTACCCCATGATTTTCACGCATGCACACAAAAAAAAAAAAATTTATCGTCACAACTAGCATATTTATCAAAATACTCGAAAAGTTAGAGTTTCTAGTCACAACTAACATTGCCATATAGTCAAAATGCTCAAAGTATAGAAAAGAAATATAAAGAAGATATCAAGTTAGATCAGTTACATAGAGAGAGTCATTCCCATGGGATTGCATGATTTCTCTATCATTGCAATGTATTTTTCATAAAACTTCCTTTTCATGATTAGGGACTACGATCCTTGGTGCTATAAATTCAGCAGTTGACTCAAGCACAGAAGTTATCTACAGTGAGAATCCTGATGGTAATTTTGTAAAGTCAAACAACTTTGCATATGCCATTGTTGTGGTTGGCGAGTACCCTATGCTGGGACTGCGGGAGACAGCCCAAACCTTACGATGGCGGAACCTGGCCCAAGTGTCATCAGCAATGTGTGTGAAAGTGTAATGTGCATTGTTACCATAATAACTGGAAAACCTATTGTAATAGAACCATACTAGAAATTACGCCCGTTGTTGCGGAAACCAACTGTTACAGGCGTAATCGAATTAATAAAACACATTTAAGTTGAATAAGAATGTCCCCATGATTAGTCTTCTCGTTTATTTTTCACAAACCAATCACATATTAAAAATCCAAGTACGAAAGCTTTGCAAAGATAAATAAAAAATTTATATAACTAATTAGACTTTGAACATGCAATCAAGGCACATACTCGTATACCTAAAAATAGCAAGGAACCGGCTTCTTCCTCCCACAACCAGAGTTCCTGAAATTTCCAAAGAAAGTAAATCCGTTAGCAATTCAGAGAAATTGGAAGACCAAATCGTATTACATTTGAGTTAAATGAGCAAAGGTAAACCAATTAAATGAGATACTAAACACATTTCGAATCTATGAAATAGAAGAATAATCATGTTAGGACTCCCAAGATGGTGTCCTAAGCACAAAATTATAGGTTAAGAAAGGTAAATCCCAATCCAAAGCTCCAACCTTTTAACTGAAAATGAAACAAAAAAGCATGGATCATATATTTCAGTTTTATTATTAGATTTTCTAAATCCCCAATTTGAATGTGTTGTAAAGACCTGCTAAAGATAATACCACCAACTAAGGGTGGCAATCTGACCAGCGTTGTGCATGTCATGTCGACTCTATGCAACTTAATATATAACATTTAAGCAGCATTAGACGGTCTCCTAAGCATCTACAAACCATTTAACATTATTTCCCCAATTTTATTTCCCAATTTTATCAAATGCTGCATAAACGATCACAATTTACTCCCTTACAATTTCCACCTAACTCCGAACAAACAATATTGATAAATCTTTATCATCACCTTTAACGAAACAGATTACAGCGAAAAGAAAAAAAAAGTTACTATGAAATCAAATTCTTCTAGATGTCCAACCTAACCCATCTATGGGAAGGCAAGCAATCGGACGTGCATTTAGACCAAGCAAAATAAATTTTACAATTTATCAAAACAGCAACTGATTCTCCCAAAGAGAACACAACATACCAACATATTATTCACCATATTCTAAGCTTTCATTTTCGTTCTATCTCTTTCGTTATCTAAACTTATAGTTATCAAAACAGCAATAAAATCATAGACAAACCTTCAATCATTTATCAAAACTGAATTAATTAAACTTCTGCTCCGCAGTCCGTTAATTTTAATTGCAACTCTCATTCTAAAAATTTAAAATTTTGCATTGAATAATCAAACGCACTTGCACGTTACATTCCTTTTATTGGTTCTTGACATAATACATTTTAGGATTGATGTAATAATATCACTACAAACATGAATTGCGATAGATATAGAAACCAAACTTGCACACAAATGTTTGACTGAATTCAGAACCACTTAATTCAACATAAAAAATTACCTCACATGCTTGCTCCCCTTCTGCTCTCGCATCGTCGGCTCCGCTACTAAACGATTAATGAAGTCCCAAAGCAAAAACAGAACAAAAAACATTTACCAATCCAACATTTCAACACATGGTTTTGGCAGGTATAACATTTCAACATAAGCATGATATAGAAAGAAAGAAATCCACATGTCACTTTGTTTTTTCAGAATCAACAAAAAGGGCAACTAGAAGAGAATGTAACCAATTTTAAAGAGTAAATCAGTCTCCCAATAAAGGAGAACAATGCTGGCGGTAGACCAAGAGTAAGTACAACCCGACTGCAGCAACAAAAACACAATTGACTTTCACACTACAGAAATAAATAATAAAAAAACACATACCTGCACCCAATGCATTGTTTTTTTTTTCCTCTGCAGTATAAGAATAAAAAAGAATAACATTCCCCTGAAACCAAATTCATCCCCCAATTTCTTGCAACAAAGAGGGAGACCAACCTTGTGTTCTTGGAGAACAGTATAACAATTAGACACAATCAGACTAATCCAAGTTCCCACTATGATAATGAAAAATTAAAATTAATAAAATAGCTCAAATCATATCACAGTATGTCACAAAGTACACCATTTGATAACCAATAAATTTAACAAAAATAGATTCAATAGTCTATATCAATTAATCAATAGTCTAAAGTATGAAAAAAATTGATTTCAAAGCCTTCCTTAGGAACTTCACAACGTATCAACAGACATTATGATATCGATGATGGTATCCATGAAACCCCAAGCTGCAAGCAAATACTGCCTTTGGAAATTTTCAATATAAATGGTTTTGCAAACCAGCCACTAATGAAACATCTAATTTCAAACAAATAATAAAAGCTTTCTTTAACTGACACATTATCCTTCTTCTTTCCTCCCATTTACTTCCCACCCTCCCTATTAATCCCTCCATTTTGAAACTCCTATATTCTTCCTATTCTGTACAAAACCTGCCAAATCATTTCCTCACTTCTCAAAACCCAAATAATCACTTAAAATGCACAAAATTACAATTAAATCAATATTACATTACACAAAATGACATTCAAAACCACAATACACTAAAACCAAGCGTGAATTCTACACCCTCAATAAGTGGAAGCATTCGTACCTCAAATGAATTTGCAACTTAATTTTTTGCTGAAAAACCTTGACCTACAAAACCAAATTACATTTAGGGTAAATTACAAAAAATTATCTCAACTATTGGTGGCACGACACTTTCATACCTCATCTTTTAAAATTGACAATGTCATACCTCATTTTACGAATTTATGCCAACGTTATACCTTCCGTTAGCTTGGCATAAATTTCTCAGTTAAATGTTGATGTGGCTTGATCTGGGGCCCATTTTCTGTTAAAAAAATTATTAAAAACTAAAAAAAATCATTTAATTTTTTTTAAATATTAAAATAATAAAGAAAAGTTATATAAAATAAAAAAATAAAAAAACCAACCAACACCCAGTTCGTCCCCTTCCCCCCCCTTTCTCTCTCCTCCCCATCTTCATCTTCTTCCCCCTTCTTGCAACTGCAACCCAGAAAAAAGAAGAGAAAAAAAAAACCAATTTGTCTTCCCCACACCCACTCTCCGCACCCATCTTCATCTTCTTCCCCCTTCCAATTGCAACCCAGAAAAAAAAAAAAAAAAAAAAAAAACCAATTTGTCAATTTTTTTTTTCTTCCTCCTTTCTGGGTTGCAGGAAGATGGGGAAGAGAGAAGGGGGAGGGACAAACTGACCTAAGGTTTTATTTTATTTTATTTTTATTTACTTTTCTTTATTATTTTAATATTTAAAAAATACTAAATAATTTTTTAATAGAAAGTGGGCCCCGATTCAAGCCACGTTAGCATTTAACTGAAAAATTCATGGTCAAGTAACGGAAGGTATAACATTGGCACAAATTCGTAAGATGAGGTATGACATTATCAATTTTAAAAGATGAGATATGAAAGTGTCGTGACACCAATAGTTGAGTTAGTTTTTTGTAATTTACCCTTACATTTATCAACAAAAAGGAATCAATGTAAGAAAGCAAACACAATACAGAAAAAATGGCCATTCAAGTCAGCTCTATTTAGATTATAATAACTCTCAATTTAAGAAAGCAAATGCAATACAGAAAGCAAATATAATCCAAATTACCTTGAACACCACCATCATATTTTTACTCCGTTACGTATACATGTCCTTTTCTTTCTAGATAAACTTTATTTCTTTGAAGTTTCTGCAGGGTGCATTCCAATTTAACCCTTTAAATGTTTGTATAAAACTTAGGGTGCGATGGCAAGTGCCTTCGCCCATAAACGGTAGATCTCGGGTTCGAGACTTGGGAGCAGCCTCTCCATAAATGGGGATAAGGCTAGCCGACATTCACCTCTCTCAGACCCTGCGTAAAGCGGGAGCCTTGTGCACTGGGTACGACCTTTATATTCTCGCCTGCTTGCAAGTCAACTAAGTCAACTATTCAACCTTCACATATTGTTTATTAGTTTTCTTGATACTAATGTATGGAAAGGGCTTAAATCCTTCAATGTATGGAAAGGGCTTAAATCCTTCAATTATGGATATACTAATGTATAATCCTTTGTTCTAGACCAATTTTGTTCTTAGTTCTTAGTTTTCTTGATACAAACTTTTTTTTTTGTATTAATATAAATTTGTTTGCACCAAGGGATGGGGTGGGAACATATCTTGAAATATGGCCACGTCCACATTTGCAGCTGAAGAACACTTCAATATAAGTTTAATTTGGTGCAACTTTAGGTTTAATTTGGGTATGTTCCACCACTTAAAATTTGCAATACTAATTTTGAACAATGAATAAGAAAATTCTACCAAGAGAGAGTAAAATAGTAAATCAACTTAATTTCTGTAAAAAAAAAAAAAAAAACTTGCAAAAATTTCATGAAATTTTGGTAAAAACGGAAAAGAAAAGGGTTAAGACAATCAAGACTAATGGAAAATTTGATATTGTTTTAACATTAACTTAGGTTGATTTTGTTCACCAGCATTAATAAAACGAATGACTTTAACTTGGGCAAGCAAACAATTAAATTAGACGTAAGCCAAGTAACTTAGAAGTTAACCATATGAAAAAAGGAAAACTAATGAAAAAAGCTTGAAAACTTTGAGTTTTAATGATAAGGACAAAATAAAGGGTAAAGTGAATAGTACCATGATTGACTTTTTAGTGTAAAAATGTGGTTTTTCGTTAAAGTGAATAGTACCGAGTGCTTTTCGTTAAAGTTCCCTATGAAAAAAAGCAATGACAATCAAACTGACCTCTTCTTTCATATGAAGTATAATCTGTTCTCTATTTTGCCTTTGTGAAGAATGCACTTTTCACTTCCTACACACAAAATAGCATACATTGAAAATGCTCCGTAGCATTATAAAAACTATAGATATACAGTACTGTATATGTATCATATACTATATTGTGTACGTAGTTGGACATAAGGTATAAAGATTTACTAACATAATTAAGCTTAAATTTAACAAAAGAAGTAATTACAAATTGAAATCAAACGATATTCTAGTTATTCAAAAAAATTCTGGCTAAATTTTACAAATAGTATTATAAATTGTTAAAAAAAATAACACAATTGAAAAAACTCACCACTCAAATCTGCAATTCTATTAAAAACACATCACTAAAAATTAACTCCAACAAAAGGGGATTAACAAATTATACCTTTTTAAGAGTTGGAATTGTTTATCTATATCTTGAGCTGGACCCGCTGGATTTGAATCCTCAGTTGACTTAGAGGGAGGATAGGCATGAAAAGAAGTGTAAGGTTCACTGGATCATATTTTTAAGAGATAGAGAGAGTTCTACTTTTCAACAGCGGAGAGAACATATTCAATCTTGGGCATAAAAAGAAAAAATAGAAGCTTCATAGCACAATAATTAACCACAATCCTCTGTTTTTCTAAATGCAAATAGAAAAAAGGAATCAAAATATTCAACACAAAATCTTCACATTAGCTCAAGAACTATATTATTTCCAGTGCTTTCCAATTTTCCAGCACGGAACAACAAACATAAAAGCATTAAAAATATATAATTGCAAAAAAAAAAAATAGCAATTCCAAGAAACTAAATGCGAAGTTAGCCAGATCTGCACAGTAACACAAACCCATTACTTGAATTAAGAGCATTGTGGCTCACCCTGAAAACACCCATTTTGCAATGAGGAAGAGAGACACTGCTGCTCTGGCTGCTGAGTGCTGCTGGCTCCAAAGCAGTTTGTCTACCAGAACTTTATAAGAGCAAGTCCAACCCTTCAAAGCCACTGTAAATCGCCAAGGATTTACATCATTCTGCTTGCCTAAAAAAAGCAAACAAAAAAGAAAAAAATGGAAAGTATAAAATTCAAATGACCCTTGATGAACATAACCCATAAATTTTCCTTGTATTCCATAAATGCAATAAAACAAAAGTCAGTGTCTCCATTTTCCAAAAAACCAAGCAAGCAAGCAACAAATTTCGAAAACCCTAATTCTAACCAATTTAGAACTATAACCAAGTAAACCACTTAATCAACAAAACTCACTAATTTTCTCAAAAACCCAACAAATTTAAAGGATATCCAGATGATAAATCCCAGTAAAATCCCAAATTTGAAAACCAGAAGAAAAAAAAAGACAAAGAGGCTTATCTTTCTTCACTAATCGGGCACTAACAGAAAAACCTTAATTCATATTATTCAGATTACAAATACACAGGGACCAAATAGCTAATAATGCTGGACAATTTGTCCCCAATCCAACACAAAAATTGTTCTTGTTATACATACGATACCCGCCTAAAATATCAACCAATTCCAAATTAAAATGGAAAATGAAACGGAGCATCATAAATTGAATACAATTTGGAGAAAATTATCTCACTTGGGGCGCCGAATCTCCAAGAGGTCCCAATCCGAGCAGGCTCCAAATTGGGTTGTTGAAAATGGTGATCAAGGAAGGGTTTTGGAGGTGGGTCTGATCAGAACAAAGCCGAAGCCATTAGGTTTGGGGGGAGAGGAACAAAGAGCCACTGAGAGAGAGAGAGAGAGAGAGAGAGAGCATGCGTTGTCCTTTTCTTCTATCCGGCCACTGGATCGCAGTTCCTTCACAAAAATTATACACGTGTGTTACTTTTTCAAGTTCTAGTTTTGTAATCACCTAATCGATCATAACACCATTCGCAAATATGACAAACATAAACAATTAAGTCAGCAACATGATATGCCATTCCTTTCATATTGCACATATAAAGAAAAAAGAAATGAACCAAAATAAAATTATACTATAATCCAATTATATGAAGGCCAAACTTGAGTTGGGGCTGGTGGCCGTTGACCACATCATCGCCTCCATTTGAGAGAAAAGGGTTTGTTTGGCTTTTTTGTCCAATTATTTACACTAACCATATATAAATGAAGAAGGACAACATCTATGTTGCTCCCTTCTTGTGATCCAAATTTGAAGAGGGCCGATGGGGAGGGGCAGTTATAAGTGTCATCCTCTTTGTTTCTCCTATCCCTGCATTATCAACCAAAAAAACATCAAACCAAGTGCAATACAATCCAATTTAATGCTCACAAAATTTGAGCTCCAAACAAGGTCACAGGTCAGCAATCGCCTAATCGATCATAACACCATTCGCAAACATAAACAATTAAGTCAGCAACTTGATATGCCATCCCTTTCATACAAACACAGATTGCAATTCATATATGCCGCATTATTTACAAACAATTACAAATCAAGAAACAATTAAATCATCATCATGAATTATAGTGTAATAACAGCATCATCAATTAGAAGAGACAGAGCTACATGGCAATAAACATATAGAGAGTAAACATACAGAGAGGAACTGCTTCATATCCTTCCCAAAAGCAATCTTCCGCAGGATAACAAAAGAGCGGTTGATCTCTGATCTAATTGCAGACGCAATCTGCAGAACCGACTTCTATGGAATTTTAACTTGTGAAATGTGGGGTGGAGATTTGAATGTAACAAATTGGTGTTAAGTGAATAATTCCAAACATATGAAATTTAGATAATCACATCCGAACGCAAACAGAAGAATTAAATAAAGAATCAAAGGCATATGCAATCTAATTAGACAAATAAGTGAACTTTCCCATGCCAAAATCCGAAAGGCCAACAGATATCTCTCATTACAGGACTTAATACATATCTTAAAAGACAAAACTTAAAATAACAAAAATTAGGTGAAACAATTGAAGAGAACATAATCCTTGTAACCAATCCGGAAAAGATGCTTTTAAATCCCAGAAAACAAATTATGAGAAGTTTTTAAAAAAACCATCATTTCAATTATTTTCCAGTCTTACATTTGGGAATAAACAGAAAATATAACTAAAATGCCAACTTTCTCAAAAAACTACAACTACTTTAACAAATTTCCATCACTCAACACTGAAAAATGAGAATCACGAAGCAACGAAGAACGGAACACGCTAGAAATAACAACAAAGCCTTTTCCCACTAAGTGAGGTCGGCTATATGAATCCTAGAACGCCATTGCGCTCGGTTTTGTGTCATGTCCTCCGTTAGATCCAAGTACTCTAAGTCTTTTCTTAGGGTCTCTTCCAAAGTTTTCCTAGGTCTTCCTCTACCCCTTCGGCCCCGAACCTGTCTCGTAGTCACATCTTCGAACCGGAGCGTCAGTAGGCATTCTTTGCGCATGTCCAAACAACCGTAACCGATTTTCTCTCATATTTCCTTCAACTTCGGCTATTCCTACTTTACCTCGGATATCCTCATTCCCAATCTTATCATTTCTCGTGTGCCCACACATCCCACGAAGCATCATTATCTCCGCTACACCCATTTTGTGTACGTGTTGATGCTTCACCGCCCAACATTCTGTGCCATACAACATCGCTGGCCTTATTACCGTCCTATAAAATTTTCCCTTGAGCTTCAGTGACCTATGACGGTCACACAACACGCCGGATGCACTCTTACACTTCATCCATCCATCTTGTATTCTATGGTTGAGATCTCCATCTAATTCTCCGTTCTCTTGCAAGATAGATCCTAGGTAGCGAAAACGGTCGCTTTTTGTGATCTTCGCTAGATTGCTCCGGTCATTAGTGTGGATAAGTATATAAATGGATAGAGATAGGAAAGCAAACACCAGATGTACGTGGTTCACCCATATTGGCTACGTCCACGGAATAGAGGATTTCTCATTAATTGTGAAGGGTTTACACAAGTACATAGGTTCAAGCTCTCCTTTAGTGAGTACAAGTGAATGATTTAGTACAAATGACATTAAGAAATATTGTGGGAGAATGATCTCGTAATCACGAAACTTCTAAGTACCGGCGTGTGGTATCGTCTTGACTTGCCTTATCTGTCTCGTAGGTAGATGTTGCATCTTCTCTGGAAGTACTCTTCCATCCAGGGGTGGTATCTTTAACTAGTGGAGATGCACAAGGTAATGTATTAATTTCACTTGAAGCTTACTTGTAGTTTCAGGCTTGGTCAAGCGCAATACAAACCATGTAGTAGGAGTCCCCCAAGTCGCCGAGCTAGGGGATCTGCTGAAAGAGGTGACAGATAAGGTAAGCAATCAGAGCTCCAAGCAATCAGTCCTAGATCAGAACTTTGATTTCGAGTTCCGGCTGATTGTTCACATTCTCCCTATCTTGCAGGCAGCATGAAGGATAAAGAGAAGAAAAATGAGAAGAGATGATATGGGATACTTTTGCTTTTGAAGAAGTAACTTTCCACAGGCTTATTCTTGAACTGGGCTGGAGGGTTTTCTAGTTTCCTCCAGAGTATAAGGCCGACTGAAGAATTTGAGGGTCAAAACAAGTCCATCAAATCTATAGTACGTTCGACCCTGCTGATATAGGATACTTTTGCTTTTGACAGAGTAGTGGATGTATCGGCACGTGTGCTGTTACGCTTGTCTCCACATGCTTCCTTGTATCCTTCTCACTTGCCTTATCTGTTCCTCAGGCAGATGCGGTATCTTCCCTGGAAGCATAAAATGTTGAAGATGAGTACTCGAGAGCAATGCCAGGTAAGTAATCAAGTAAGGGGTTCCAGGCAGTCAGTTCATGACTGGAAGCTTGATTCCAAGTGCTGATTGATTGCTCTCTTTCTCCTTGTCTTGCAGGTAAGAACAAGGCCAAAGGAAAAGACAGGGAAAAAGCATGATATGTGATACTCTTGCTTTTAACCCTGATGATATGAGATATTCTTGCTCTAGTATAGCTTGTTTGCAGAGGTATTATCAGGGGGAAAGAAAGCTGAATATTTCGAAAGGCTTCTTTGGGAGTGGCTCTCAGATATGACGAAGGGTTGAACATTTTTGCAGGTCTGCCTGTCCGTTGAGGATGGAGGTCGACATATATAGGAGTCTCCCTAACAACAAGTAGTAATGCTATTCCTTTACCCTGCTTGGTCATAGCACGGTAATGGGAGCTGCCAGCTTCACATGTTTTAACTCTGTCAGAGCACTTTGAAAAAGTGATCTGTGGTATCTGGAAAGCTGATGTTGCGTGTGAAGATTACAGACAAGCTTTATCCAAGGAGATCCAGCTCTTGAAGTTGGGAAAGTGGTGCCTCTTCGGTTTTCGAACAAGTAATCCTGTCGGAGATCTGGCTCTCGAGATTCGGAGAACGATGCCTTTTCGATTTTTGAGAAAGCAATTCTGTTAGGGGTTTGGCTCTCGAGATTCGGAGAGCGGTGTCTCTTCGATTTTTGAGAAAGTAATCATGTTGGGAGTCTGGCTCTCGAGATTCGGAGGGCGGTGCCTCTTCGATTTTGGAGCAAGCAATCTTGTTGGGAGGGTTTTCTCGAATGTGAGAAAAGGTTGGGCATGTTTGCTAGTCTACCTTGCCACGAAGCACAGAGGTTGACACATAGGGACTTTCCAATTATCCAGCAGTGGTACTGTTCCTTTACCCATGTGGGTAATAATATGGTAACTAGACCTTCAAAATTTATGTGTCTAAACTTTGTTAGTGCTGTTTCTTTGCTATTCTTTTACCCTTCTTGGTCAGAGCGATGTAGTAGGAGCTGCAAGCTTCACGTGTCTCAACTTTGTCAGAGAACTTTGGCAAAGTTATCTGTGGTACCCATGAGCTAATGTTGCGTGTGGAAAGTGGGTGATTGAACAGTAAGATTCATGTGCTTTCTACTTCACCAGAAATCTTCGACATAATGCCCATAATTTCCGCAAAGCTGAGTGTGCGTGTGACAGGTGCTGACAAGGTTGGAAAAGTAGGTGCCTCTTCGATTTCTGAGATCGGCCCTCGTGGTCTCTGAGCAGCCCAGCTTTTGAGAAAGCAAGCCTCTTCGATTTCTGAGATCGGCCTTCGTGGTATTTGAGCAGCCCAACTTTTGAGAAAGTAAACGTCTCGTGGTCTCTGAGCAGCCCAGCTTTTGAGAAAGCAAACGCCTCTTCGATTTCTGAAGCTCCGTCGAGTGCAGATTTTTATAGAGGCTGGCATTAAGTTCCAAAGCACACTTGAATCTCCACCAGTAGAAGCTCCATTCTTGCACTTCTAAGATCTTGATTTGTCCGACCTCTTCTCTCTTCAACACCTTTGAAAATGTCTGGCCCCCTCCGACCGTCGTTTTGACTTGAACCTTGTTGAAGAGGCAGCCACGCCTTCTCCAAACAACATATGGCGCCCATCCTTCGTCTCCCCTACTGGTCCTCTTACCGTTGGGGATTCCGTGATGAAGAATGATATGACCGCTGCGGTAGTGGCCAGGAACCTTCTCACTCCCAAAGATAACAGACTACTTTCCAAACGGTCTGATGAGTTGGCTGTTAAGGATTCTCTGGCTCTCAGTGTTCAGTGTGCAGGTTCTGTGTCTAACATGGCCCAACGCCTATTTGCTCGAACCCGCCAAGTTGAATCATTGGCGGCTGAAGTGATGAGTCTCAAACAGGAGATTAGAGGGCTCAAGCATGAGAATAAACAGTTGCACCGGCTCGCACATGACTATGCTACAAACATGAAGAGGAAGCTTGACCAGATGAAGGAATCTGATGGTCAGGTTTTACTTGATCATCAGAGATTTGTGGGTTTGTTCCAAAGGCATTTATTGCCTTCGTCTTCTGGGGCTGTACCGCGTAATGAAGCTCCAAATGATCAACCTCTGCTGCCTCCTCCTTCTAGGGTTCTGTCCAGTACTGAGGCTCCAAATGATCCCCCTCCAGTGCCTGCTCTTTCTGGGGCTCTACCGACTGCTGAGACTTCTCCTAAGCAACCTTTGTGAAGGCTCCCTCTTGTTTGTTTATTTTGACTCATGTATATGTACATATTTGTAACTTATCGGGGATATCAATAAATAAGCTTTCCTTCATTTCAACGTATTGTGTTAAATACACCAAAGCCTTCTTCGCTAAGTTCTTTGAATTTTCTTTTTGTTGAAGCTTGTATGTTGAAGCTTTGTGAGTGGAGCATGTAGGTTGAGGTAGTATTCCCTTAATTTCCCGAGTGAGGAAAACTTCTCGGTTGGAGACTTGGAAAATCCAAGTCACTGAGTGGGATCGGCTATATGAATCTTTGAACGCCATTGTGCTCGGTCCTGTCATGTCCTCCGTTAGATCCAAGTACTCTAAGTCTTTTCTTAGAGTCTCTTCCAAAGTTTTCCTAGGTCTTCCTCTACCCCTTCGGCCCTGAACCTCTGTCCCATAGTCGCATCTTCTAATCGGAGCGTCAGTAGGCCTTCTTTGCACATGTCCAAACCACCGTAACCGATTTTCTCTCATCTTTCCTTCAATTTCGGCTACTCCTACTTTACCCCGGATATCCTCATTCCTAATCTTATCCTTTCTTGTGTGCCCACACATCCAACGAAGCATCCTCATCTCCGCTACACCCATTTTGTGTACGTGTTGATGCTTCACCGCCCAACATTCTGTGCCATACAGCATCGCCGGCCTTATTGCCGTCCTATAAAATTTTCCCTTGAGCTTCAGTGGCATACGGCGGTCACACACAACACGCCGGATGCACTCTTCCACTTCATCCATCCAGCTTGTATTCTATGGTTGAGATCTCCATCTAATTCTCCGTTCTTTTGCAAGATAGATCCTAGGTAACGAAAACGGTCGCTCTTTGGTATTTCTTGATCTCCGATCCTCACCCCTAACTCGTTTTGGCCTCCATTTGCACTGAACTTGCACTCCATATATTCTGTCTTTGATCGGCTTAGGCGAAAGACCTTTAGATTCCAACACTTCTCTCCAAAGGTTAAGCTTTGCATTTACCCCTTCCTGAGTTTCATCTATCAACACTATATCGTCTGCGAAAAGCATACACCAAGGAATATCATCTTGAATATGTCCTGTTAACTCATCCATTACCAACGCAAAAAGGTAAGGACTTAAGGATGAGCCTTGATGTAATCCTACAGTTATGGGAAAGCTTTCGGTTTGTCCTTCATGAGTTCTTACGGCAGTCTTTGCTCCTTCATACATATCCTTTATAGCTTGGATATATGCTACTCGTACTCCTTTTCTTCTCTAAAATCCTCCAAAGAATGTCTCTTGGGACCCTATCATACGCTTTTTTCCAAATCTATAAAGACCATGTGTAAATCCTTTTTCCCATCTCTATATCTTTCCATCAATCTTCGTAAGAGATAGATTGCCTCCATGGTTGAGCGCCCTGGCATGAACCCGAATTGGTTGTCCGAAACCCGTGTCTCTTGCCTCATCTATGCTCAATGACTCTCTCCCAGAGCTTCATTGTATGACTCATTAGCTTAATACCCCTATAGTTCATGCAATTTTGTACGTCGCCCTTATTCTTGTAGATAGGCACCAAAGTGCTCGTTTCGCCACTCATTTGGCATCTTCTTCGTTTTCAAAATCCTATTGAAAAGGTCAGTGAGCCATGTTATACCTGTCTCTCCCAAAACTTTCCACACTTCGATTGGTATATCGTCTGGGCCCACTGCTTTTCTATGCTTCATCTTCTTCAAAGCTACAACCACTTCTTCCTTCCGGATTCGACGATAAAAAGAGTAGTTTCTACACTCTTCTGAGTTACTCAACTCCCCTAAAGAAGCACTCATTTCATGTCCTTCATTGAAAAGATTATGAAAATAACCTCTCCATCTGTCTTTAACCGCGTTTCTCTGTAGCAAGAACCTTTCCATCCTCATCCTTGATGCACCTCACTTGGTTTAGGTCCCTTGTCTTCTTTTCCCTTGCTCTAGCTAGTTTATAGATATCCAACTCTCCTTCTTTGGTATCTAGTCGCTTATACATATCGTCATAAGCCGCTAACTTAGCTTCTCTCACAGCTTTCTTCGCCTCTTGCTTCGCTTTTCTATACCTTTCACCATTTTCATCGGTCCTATCCTTGTATAAGGCTTTACAACATTCCTTCTTAGCCTTCACCTTTGTTTGTACCTCCTCATTCCACCACCAAGATTCCTTTTGGTGTGGGGCAAAGCCCTTGGACTCTCCTAATACCTCTTTTGCTACTTTTCGGATACAACTAGCCATGGAATCCCACATTTGGCTAGCTTCCCCCTCTCTATCCCACACACACTGGGTGATTACTTTCTCTTTGAAAATGACTTGTTTTTTCTTCTTTTAGATTCCACCATCTAGTCCTTGGGCACTTCCAAGTCTTGTTCTTTTTTCTCACTCTTTTGATATGTACATCCATCACCAACAAGCGATGTTGATTAGCCAAGCTCTCTCCTGGTATAACTTTGCAATCCTTACAAGTTATACGATCCCCTTTCCTCATTAGAAGAAAATCTATTTGTGTTTTTGACGACCCACTCTTGTAGGTGATCACATGTTCTTCTCTCTCTTCTTAAAGAAGGTGTTGGCTAAGAAGAGAGATCATATGCCATTGCAAAATCCAAGATAGCTTCCCCATCCTCGTTTCTCTCCCCAAAACCATGGCCACCATGAAAACCTCCATAGTTGCCTGTCTCCCTGCCCACGTGTCCATTTAAATCTCCTCCTATAAATAACTTCTCCGTCTGAGCAATTCCTTGCACCAAGTCTCCAAGGTCTTCCCAAAATTTCTCCTTCGAACTCGTATCCAACCCTACTTGAGGTGCGTACGCACTAATCACATTGATAAGTTCTTGTCCTATTACAATCTTGATTGCCATGATTCTATCTCCTACCCTCTTGACATCTACAACATCTTGTGTCAAGGTCTTGTCCACGATGATGCCAACACCGTTTCTCGTTCTATTTGTGCCCGAATACCAAAGTTTAAACCCTGAGTTTTCTAGATCCTTTGCCTTAAGACCAACCCACTTAGTTTCTTGTAGGCACATAATATTTATCCTTCTCCTCACCATAACTTCCACTACTTCCATAGATTTTCCCGTTAAGGTTCCTATATTCCACGTTCCTAAACGCATTTTGCTCTCTTGAACTCTACCCTTCTGTCCTAGCTTCTTCACCCTCCCCCATCTAATAGGATCAAAGTACTTCTTTTGTGTGTTCCGTGTAAAGTTGATAGGAGCATATGCTTCTAAACAACTTTGAGTGGAGTCGTTCGAAAAGAAGTTTCTATGGCCCCCTTGCTCATTTAACACTGCATCCGGGTGCCGATGGAGATACAACGACCCTTGCTCACTTATCACTGTGCTCGGGCCACACAGCGCGCCACTTACTGGTGACACCCTAGCTTTAGCGCAATTTCGTTCTGGATTCATTTTCATAAGGATTCGACGTAATCATGGAGTGCCGGCTGTCGACTACCTGACGCCCTCCCCCTCCTCCTTTATCCAGGCTTAGGACCGGCAATGTAAGATAAACTTACACAGGCGGAGTTAACGGAACACGCTAGAACTGAAACATTAAAAACAACATGTACCCATTTCAAAGACCAAAAATCCTGCAAGGACAAAAAAAAAATCCGAGAAAATCAGTACATCAGTACTCCCTGCAAAACCCCAAAATCAGAAAATTAGAAAAAGAACCCAAATCAGTGGCATGGTCCTTGTTTCTCCATTAATCAGTAGGTAATGACCTAATGAAAAAGAACCCAAAACAGACGGCTTAAATTATGGAAAGTGCTTATAAAGCTCATGAATAACTTTCAAAGCCTGCATTCCACAGTGTGCACACGCACAAACATAAAATATACATGCATAGTTAATTTTAGACAATAATACCTCAGAACATAAGTTGCAATTTGGGACTATTTGGTTGACTCAAAAGAAATTGATGGGTTAGAAAACCACAAAAAAAATACAAAGACGGATGTTTTTATGTCGTTCATTTCTTACGTCGACAAAACACACACACCTGTGTTTTAATGCTCCTCCAATACTCAATGAGAAGGCACCAGGCAAAAAGAAGGTCAAGGCTGGAAAGAAGCTTCCAAAGAGAACAATATATAAAGCAGACCACAAAAATTAGACAAAACCCAAAAACTAAACAGTAGAAAAACCTCTAAAATATATAAATATATATATAATTAAATAATTTAAAAAAAAACTAAACTGCAAATACTCTAGAAATCGTAAAATGAACTGCAAACCCGTCAATCATTTCCCAAAACCACATAACCAAAGAGTAAAAAAGGGAGTACGGGAGAGAGAAGCAGCCAAAATACAGAGAAGATGGCAAGAGAGAGAGAGAGAGAGAGAAAAATGAATTATTTTGGTGCCTCTGGTTCCTGCCTTTGTTCTTTGTTTTTCATTTATTTATAGGTAACTTGCTCAAGTCCAAAGGCAATTAAACATGATTAGTAAAGCACCATAATAAAGCATGAGAGATATCTATTTTAATTAAATCTGTTGTGGGCTCACTGTGATTGTACATCATCATCATAAATAATGCATGCTTGAACCCCATTTTAGTTTCATGCCTATCATAATTAAATCATGGATGGTCAAGAAGCATAGGACTGAGAAATCAGAGCCTAATTTCCAATATCAAAAGAGTACAAATTATTCAACTTAAACGCTAATTTCGTTAACGAAGATTAAAATAGGCGTGAAATCCATACAATTTATACGTTACCATTGATTCAAGTTCTGGTAGGTATCCATGGAAACTATCCGTTGCCACTCTCTCAGTTCCCATATTTTCTGTATGTTTCATTAAACAATATAAACTTTTGATGCTCTTCCATCTGGAGCTAAAACAGATTACCAATAATAACAAAGAGGTCTAAATAATAGAAATCAAAATTTTGATTTTTGCGGACTTTAGAGAATCTGCAAACTTTAGCCTAACATTATGTGATTGCCTCACTTCTTCAGTAACTCAGAGGAGGTGAATTACTCAAAGTATGGAGGACTTCTGCTAACATATTTCAAGCACTTGTAACATTAAATGTAATGACAGGTTGACATTATTATTATTTTTTTTTTGTAAAGAATTGTTGCAAGAAGTTTGACCCTTTGTCTTTTTATTTCTGTAAGGATTTATAGGTACATATAAAATCCATATTATATATGGTTCACAGATGAGAGTACTTCAAACACCAAATATTCATTCATGATTGGAGATAAGAAAGCTTACTAAGAGGCAATCGCCTTTGTGATGTTTACTTTTGTGCTTATCCTTTGTCTTCTTTTCTGAGGCAAAATATGTCAATGTGATAAGTAATTTCCCATAAAGAATATCATCCTCAATAGGCTAAACAACTACAATGGTTAGTCAAATAATGTACTTTCATGTAGTTAATCTCCTCGGTTTGTGTTTACTTTTTCAATATCAAAACATCTCGAAGAAACAACGTTTTCCCTTACTCTACAAACACCGAATGTGCCCGATAAACCACTAACAACGCCATTACTCTAATTCGACTGCAGAGTGAGAGTTAAGATAAGAAGATACTCACAGGCCAAAACGGATGACATCACCAACACATAAATCCAAAAGCCACAACCAAATTTAATTTTGTTTTTACGTTGAATTTTTTTTTCTTGAATCCGTTTGGATGCTGAGAACGTGTGGTATGGGATTATTAATTACCGGCAGGGAAAATGACGATTTCTCCTATTTGCATTTGCAGGTGGAGGAATCATAGCCGAGGGATTGCAGTTCGTCGGTGACCATCTTCCTCAAATCGTCTTTTTGTTTGAGATTCTTGTTTGCTTCGACGATCCTCGCCGTATCAGCCAGGAGGTTTCTCTCCGAGACGCTCACGCATGGAATCAGACTCTGATTAAACAATAATTAAGCAAACAATCAATCACCCATATTCATATTCTGTGTTTGGTTGCCAAGAAACCGCGAGAAATGCAAAAACAATTTACTAATAAAAAAGTGTAATCAAAGCAACCATTATTTATACTTTTGTACCTTAAGAATATCTGAGGCGTCGCCACCGAACGAACCGGAGGAGATTGAATCACCGAAACCTCCACCGAATATATCGAACTCGTCGTCGGAGCTGTCATTGCTGTTGCCGTGAAAGCAATTGCAGCGGTTCCGTCCACATTTCGGCGGAGGTTGCTTCTCGTTGCTTTCTTCGATGAAATTCTGAACCATCTTCGCCAAGCAGACCGAACTTGGCTTGAACTCAGGCCGCGGCGCTGACGGTCCCTTCATCCTTGCTGATATTGAGGCCGCAGGAGTGGCGAGTTGTGATGTGGACTCAGGCCTCTCGGCCTCTGGGTTTTACGGAGAAGGGGAAGATGGTGAGGGTTGAGAGAGATGCAGAGTCTGAAAGAGAGTGAAAGAGAAAGGGTTATAAGAGAGGTTGAGTGTGACAGAGACGATTGAAGCAAAACGCACGATGATAAACGCGTGTGCTCGGTTCAGAATGGCAAGCCCGTAAATACCCAATGACAGATTTGTAAATAAAATGAAATTCACTTCAAAATACTGTTCATTTTAATAGTGCCTATTGAAAACCTTACTTTAGACTAAAGTAACTAAAAATTATGTTTGCGCGTTGCTACTAGAACCAACTGTTTCAAACGTAATTGGATGGACAAAACACATTTAAGTTGAATAAATTCAAAACAATTACGAACAAACAGAAGGATACATGAGTGCATGAGGCCGGTAAGATCAGCAGTTTTGCTTTTGTACACTTGTAAGTGAGTTGACATATAAACACATTGCACAATGAGTGAGAATAAACTCTACGTGTTTGAAACTTCATTTTAAACTAACATTCACACAATCCTAATCATTTGTGAATTACCATATTCTTATCATTATTCCAATATCTCTTCATGTAGATGGGGTGAGCTCATACCAGTCACTAAGAGCATTTTTGATACTCTACTTGAATCCAACTTTTTAAATTCAAAAACAATTTTCAAGTTTTAAGCCTTAAAAACTTGTTTGGTAAGATTATTTTCAAAAATTGAACTTAAGATTAACTCAAAACTATAGTTTACTCTCTAAAAACACAAAATGTAAATTTTTAGAGTTTTTAAACTTAAACTCACTCATTTCTTTTCTCTCCCTCCTCCTCTCTCACTCCAAATCTATCTCTCTTTTCTTCTTTCTATGTCCCCCTTTTTTTTTTTTTTTTTACCTTTTTCGTCTCTCATCCAATCCGCTCTCTTCATTATCTCGATTCTTTTTCTCACTTATCTTCCTCTATATCTCCTCCGATCCTCTCTTCTTTCTCTTTCCTTCAATCATATCTTACTTTCTTTCCTCCTCTTTCCTCTTTCTCCCTCGACCCCCTCTTTTTGGATCTCTTTGTCCAGTTTAAGTTGTAAGATTTAAAAATTTTAAATTACATACCAAACAAGTTTTTTAGTCTTAAATAAAATTATTTTTCAAGAAAAATTCTTAAAAAATGTTTTGAGAAATGATAAAAAATTTCAAATAGGATACCAAACAAGCATTAAAATTGCTAATGTATTTAGTGATTATACAGAGCAACTTAACTATAGAAACGCTCCTCAAATCACTCTATACGTTTCCATTTTGCTTTTCAAATTAGCATGTTTATATATTGACATTAGAGAAAACGAGAATGCTGATGAAAATTGGATTATTAGAGGTTAAACGGCAGCGACCCCCCCCCCCTCCCCCCCCCAAATCCATTTTTGTTGGTTGACATTCTGAATATTGACGGTTTACCTTGTCCTCCTTAATTTCCTATAATCGGTAGTATAGGGGCGACATCTTGGCATTTGTTGCAGTGTCGTATCCATCTGTACCCCCCTCCACTACCTTGCTTGTCTCCTTTAGTTTATCTGTTGCTTGCCTCCCTTAACGAGCAGAAACCAAACAAGAACACCCAATTTTGACACGTGTACAACACACTCAAACATCATCAGCGTCCAAGAAGGCTAGGCGCCATATCACAGAGATCCATCTTGGCCTAGGTCCCTCTCTAGTTTCTTGCTAATCAAAATTCAAACCCAATTTTTTATTCGGAAATAAATTTCAAAATTTAGGAAATTTTATTATCTGAAAAAGAAATAATTTTCAAGGGTTACACTGTGACTGTGCTGATAAACACATGGATACCAAGCTCTGTTGTGATTGCTTCCCTTTACGTTTTTTCGCCAATCTTTGTGCACCATTTAGACATTGATAGTGATGCCAGTTTTAGCTGTATCCTCACATAAAAATTGCCAAATATACACAGATGTCAAAGATCTTGAAGTTTGGTTCACATGCTTTGTCAGGGAAGATCAATGTATGCGATTGGGTCGTCTGGAATTAGCAGTGTAAAAGGTGTTGGTATACGGTCCAGCCCATGATCAATGTTCTAGATTATTCTAGTAAGCAAGAGATGAGGCTGGAGCTTGCTAGACAATTCTAGCATGTTATTAAGTTGATGGAAGAAGCTAGAGAGTACTAGCTTCCTTGGTTGCAAATGGAAAGATCTAGAAGCTACAAGTATGTGGCTAGTCTAGATTTTTCTATACTAGAGGTTTGAAGAAGGAACTAGAAACTAGTAGAATGCCAAGCCCTCACCTATAAATATGGGTGTGATGTAACCAATTGAAAATCAAGAAAGAGTGAGTAGCAAAGGATCAAGTCCAAAGCTAGAGTTCCACTCCAAGAGTGAGAGTGAGAGTGTTCCACTACACATTGTGTGAGTGAAGTTTAGAGTGATAGAAAGTGTGTGTTATACTTTCTTGTATCCATCAAGCCTTGTCTTTGGCTTGGTAAGACTACTCTTGTTGTATTCATTTTTTTCATATAGTGAAGATTGATCCTTGTTTGGTGGACGTAGGCATAAATTGCCGAACCACATAAATTCTTGGTGTCCATTTTCTACTTTACCTTGTGCATTCTCTATCTTGTAGTACTGACATTCCTAACAAGTGGTATCAGAGCCCGGTTGGCTCGTACTACGAGATGGAAGGAAGTGGCACTATGATCAAACTCACCAACTCCAATTGGGTAACATGGAAGCCAAGGATGGAGGACATTCTCTATTGCAAGGATTTGCATGAGCCAATTGAAGGAGATGCCGCTAAGCCCGAGAGCATGTCCGATGCCGAGTGGAAGAAGATGAATCGCAAGGCTATTGGCACAATTAGACAATGGGTGGATGATAGTGTTTTTCACCATGTGTCTAATGAAACCAATGCTCGCGAGTTTTGGACGAAGCTTGAGTCCTTGTTCGAGAAGAAGACCCCAGCCAAGAAAGCCTTCTTGATCAAAGAGCTCATCAATGTGAAGTACAAGGATGGTTTAAGTGTAGCAGAACACTTGAACAATTTCCAGAATATCATCAACCAGTTGGCTACTATGAAAATGACGATCGAGGACGAGCTACAAGCGCTCTTGTTACTTGGATCCTTGCCAGACAGTTGGGAGACCTTTGTGGTGAGTATAAGTAACTCTGCTTCTAATGGTGTTCTTACTCTTGATAATGTTAAAAATAGCATGCTCAATGAAGAAACAAGGAGAAAGACTTCTGGCACAGATAGCAGCCAAGTATTTGTCACAGAGAACCGCGGAAGAAGCAAGAGTAGAGGGCCTAGAGGTCATGGCAGGAGTCCTAGCCGATCCAAGTCAAGGTTCAGGGGTGCATGCCACCATTGTGGCAAAGAAGGCCATATGAAGAAAAATTGTCGAGTTTGGAAGAGAGAGCAAAAGGAAGGAAACAATCAGAAGAAAGATGATACTGGCAATACCACTGCTGTCATATGTGGTGATGTACCAGAAATATTGTCTGTTGGTGAATGTCTGCATATGGGCAACTCTGACAGAGACATTGAATGGATCTTTGATAATGGAGCTTTCTTCCATGCTACGTCCAAACGGGAGTTCTTCAGTACATACAAAGAAGGTGACTTTGGCATAGTGAAGATGGGGAATGAAAGCTATTCCAAAATTCTTGGAATTTGGTGATATCTGCTTAAGAACTAATCTCGGCTGCCAATTGATGTTGAAAAGATGTGAGACATATTCCTGATATACGTCTCAATCTGATATCCATCGGTACCCTTGATCGACAAGGATATTATCACCATATTGGCGAAGGAAAATTGAAGCTTACTAAAGGCTTAATGGTGGTAGCAAGAGCACGACTTTGTTGTACGTTGTACCGGTCAAATGCCAAGGTTTTGAAAGGTGAGTTGAATGCTGTGGAAGACTCATCTCTAGACTTGTGGCATAAGAGGCTAGGCCACATGAGCGAGAAAGGCCTACAAGTTTTGGCAAAGAAGTCTCATATTCCCTTTGCCAAAGGTACGTCGTTAAACTCTTGTGAGCATTGTTTATTCGGAAAACAAAGAAGAGTTAGTTTTTCTGTTCCATCTACAAAGAAAGGAAACTTGTTAGATCTTGTTTATTCAGATGTGTGTGGTCCCATGGAAGTCGAGTCACTTGGAAGAAATAAAATATTTTGTTACTTATATTGATGATGCTTCACGAAGGGTGTGGGTGTATTTGTTGAAATCCAAAGACCAGGTGTTTCAGACATTCCAGGAGTTCCATGCCATGGTGGAGAGGGAAACTGGGAAACCTCTCAAGTGCCTTCGTAGCGACAACGGCGGCGAATACACATCTCACCAGTTTAGAGAGTATTGTGTAAAACATGGCATACGTCATGAGAAGACAGTTCCTGGAACTCCACAACATAACGGTGTTGCTGAAAGAATGAACCGAACCATCATGGAGAAAGTCAGGTGTATGTTGAGGACTGCAAAGTTATCTAAGCAGTTCTGGGGTGAAGCTGTAAGGACAGCCTGCTATTTGATCAACCGATCTCCATCAGTACCATTAGGTCTTGATGTTCCAGAGAGAGTATGGACTGGTAATGATGTGTCTTACTCTCATCTGAAGGTGTTTGGTTGCAAAGCTTTTGTGCATGTGCCCAAAGAGCAGAGATCGAAGTTAGACTACAAAGCTACACCGTGCATCTTTCTTGGTTATGGCGGTGAAGATTTTGGTTACAGATTATGGGACCCATACCAGAAGAAGTTTATCCGAAGTAGAGACGTGGTCTTTTATGAAGATCAAACAATTGGGGATTCGGATAAAGAGGCACAACCAGATGGCGCAGTCAGAGGAGTTGATCCATTAGTTTCAGATGAAGAAAGTCACGATGACATCCCTGAAGCAACTGCCAATGAAGTGCCTGCAGAATCAGATAATGCTGATCAAGAGGAGCCTGATCAAGATGTGCCAGACCATGAGATTGCTGATCAGGGGGAGCCTAGTCAAGAAGAGCAGATTCAAGGAGAATCCAATCAGGGGGAGCCTCTAGCCCCGCAAGAGAATGAAGATCAGGTCAGAAGATCCAGCAGAAGTCGAAGACCGTCTACCAAGTATTCTTCATCAGAGTATATCATGTTGACTAATTATGGAGAGCCCGAAACTTATGAGGAGGCCAGAGCTCATAACGACAGTGATAAATGGATGAAGGTAACTTGGAGTCATGATCGGAATTCCTCCCTCATGGACTGGAGGGGGAGATTGTTGGTATACGGTCCAGCCCATGATCAATGTTCTAGATTATTCTAGTAAGCAAGAGATGAGGCTGGAGCTTGCTAGACAATTCTAGCATGTTATTAAGTTGATGGAAGAAGCTAGAGAGTACTAGCTTCCTTGGTTGCAAATGGAAAGATCTAGAAGCTACAAGTATGTGGCTAGTCTAGATTTTTCTATACTAGAGGTTTGAAGAAGGAACTAGAAACTAGTAGAATGCCAAGCCCTCACCTATAAATATGGGTGTGATGTAACCAATTGAAAATCAAGAAAGAGTGAGTAGCAAAGGATCAAGTCCAAAGCTAGAGTTCCACTCCAAGAGTGAGAGTGAGAGTGTTCCACTACACATTGTGTGAGTGAAGTTTAGAGTGATAGAAAGTGTGTGTATACTTTCTTGTATCCATCAAGCCTTGTCTTTGGCTTGGTAAGACTACTCTTGTTGTATTCATTTTTTTCATATAGTGAAGATTGATCCTTGTTTGGTGGACGTAGGCATAAATTGCCGAACCACATAAATTCTTGGTGTCCATTTTCTACTTTACCTTGTGCATTCTCTATCTTGTAGTACTGACATTCCTAACAAAAGGAGGATTGATGAATCTGAGAAAGAGGATTGAAAGCAAAAGAGATGAGAAGCTGAATGGAAAACGTCGCTCCAGCTTCCTCTTTGATTCAATCTCGCCCACTGAATAAAAATGAGAGAGACAACGCAAGAAGGAACCGTTACAAACTTCACATGCATTACACACCTCTCATACTCGCAAACCTCTATCCAGTCTAGTAAGGGCTTTGAAGCAGCTTCTAAAACGGACTAAGGGCTCGTTTAAGCATAATAAAAAATTGGGTTTACACCCCCCTTGTGTACCTGGTAAGCCCCTCTTCACATTGGATCTAAGCATATATTCTTAGCTTTTGAAGCATCCGACAAATAAGGAGGATAGGTTTTTTTAGAAGTTTCTGACTCTTCTTCAAATAAATCCATTTTATCGGGATTAAAAATAGGAATTGGTAAAAATCTCAAAGACAACACAAGAAGGAACTGTTGCAAACTTCACATGCATCACACACCTCTCATACTCACATGTCTTGCATGTGTATATCTAAGACAAAGTCCGCTACTATGACAGCTGGCACAATCCGAACCTATGAGCTAGTCTAATCTCAACCATTTAATTTCAATTCAAACAAATAAGGACAAGACTATGGAACTTGAATTCTAAGAAATCAGCTTCAAGGCTTAATCACTAACAATACATACCTGATCAAAAAAGAAAGAAAAAACACAACTTTACAATACATACGGATAAGTAAATACTGTCCACGTACTAACCGCAGGTGAAGAAAGAAATACGCGAAAAAGCAAAAAACTAAATAGAAGAGCTCTCAGAATAAAGAAACCAACTCAAAACACAAAAGAGTGATAAACTCTACCACACAAAATCACCATTTATTCCACCTCCCATGTCCCCAGTCTTACTACATATCAGTGATGATGCGCCAAATACCTCAATCCCCATTACCCCGTGACCCACAGATACAACCCCATATTCTCCCACCTCTCCTTGATGCTGCCACCGCCTTCTCCTTCTCTTCCTCATGGCTCGACTGCTTGAGATAACTCAAAATTGCCTCAACAGCCACCGCCTCCTTTTCCTCGCAGCTTGAGTCCACCGTCACAGTCAACGGTGCGGTGCTCTGATTCTGATCCAAATTCCCAGAAGTGCTGAAACTTTGTCGTTTTGGGTGGGAACCCTTTGATCCATGATTGCTGTCCTGATGTATACTAGTTCCCTCTAGTGTACTCTCTGCCTCAAGGAACTCCAAATCTCGCAGCCTCATCTCTTCCCCATAACTTGACTCCTCATGATCTGTCAAAATTTCTGAACCATCGCTCCAGGGGAGGAGGGATTCCCCATCAGCCACCGCTTCATTTTGCTCATTGTTTGGGACCATGGCAATGATGGCATTAATCATAGGTGCAGTGCTTCGAAACTGAGCCAAATCCGCCAAAGTGATGAATTGTTGTTTAGGGCGGTAACCACGTATACCAGTTCCCCCTATGTGAAGGTTCTTCAAATACCGTAAGTCTTCAGGCAACTTCGAAAGTTCTGAGCACCCATGGAGATTGAGCCATTCGAGACTCAACAAATTGCAGATACTGTCCGGAATATAGACCAGGCTTTTGCACTTTTTCAGATTTAACGACACTAGCCCCTGAAGCCGTTCAATTGATGCAGGAAGCTCTCTGATAGATGTTCGATCCAAATCAAGGCTGGCTAACCTTTCCATATTTTCTAATATGTCTGGAAACACCTCAAACTTTGTACAACCAGAAAGAGAGAGATAATTTAGGGACTTGAGTTGACAAATGTTGCTTGTAAGACTCTTAAAGTCTTTGCTATACCGTAGCGTCAAAGTAGCAAGTCCCGTAAGACTATAAATTATGGATGGCAATTCTTCAATTGCAATCCCTGAAAACTCAACAATTTTTCGGCGGCGAGAGGCTTGCTCACGTTCAAGCTCTGTAAGATTTTTGAATGTTGATGAATCTTCTGTAAATATAGTCCAATCGAAATTAAGCTCTGTTAGGTTCTCCATACCTTCTAGAAACTCTGGAAAATTCTTCAGATTTGAGCAGCCAGAAACATTCAGGACTTGAAGAGATCTCATATGAATGCTGCCTGGAAAAATCTTTAATCTTCTGCAATCCTTCAGGCTCAGGGTAACGAGTCCTGTAAAATTTTTTATGGACGAGGGCAGTTCTGAAATTGCAGTCTCATCTAAATTAAGCTCTAATAGGTTCATAACTTCAGGAATTTCTGAAAAATTATCCAGATTTGAGCAGCCGGAAAGATTAAGGGTTTGAAGAGATCTCATGTGAATGCTGCTTGGAAGGCTATGAAGTTTCTTGCACTGCTTTAGACTCAAACTCTCAAGGTTTTCAAGAGAATAAATTGATGGGCAAAGGTCTTCAACAGATGTCTCATCCAAGCGAAGCTCTCTTAATCCTTCCATATTTCCGCCATTTTCTGGAAAGGCTTTGAGCTTTGAACAACCAGAAAGATTAAGAAATTGCAGGGACTTGAGTTGAACAATGCTGTTTGGAAGAATCTCAAGTTCTCTGCAATATTCAAGATTCAAAGTAACAAGCCCCGTAAGATTGTTAATTGATCGAGGCAGTTCTTTTATTGCAGTCCCTTGCAAATAAAGCTTTGAAAGCTTCTCCATAATTTCTGAAATCTCTGGAAACTTCTCAAGTATTGAGCAAAAAGAGAGATCAAGGGTTTCAAGAGATTTCATACAAATGGTGCTTGAAAAGGTCTTGAGTTTGCCGCACCAACTTAGATCCAAGAGGACAAGTTTTTCAAGGGCAGAAATGGATGGGTGAACCTCATATAAACTTTGTGCATCCACCAAGAATTAGGTTCTCAAGATTCTTTGCCTCAGTGAAGTCAGGTGTTTCCTTAAGACGATAAGAGCCTTTTAAGTTGATAATTTTCAACTTTTCCAGAGGCTGTCAATATACAACAAGGAAAATATGTGTTACCTACATAATAAGGCATTTAAAAACTAAACAATTTAAAAGCAGTATATAGGCAAATGATGAACGTACCTGAGTTCCTTTCCAGAGGTGTTCAACCCAACTATATTGCATGTCAATGTCAACAAGATTCTCTGGGTTAAAATTGGACGATAAAGACTTTAGAGGACATTTGTGCCAGAACAAATAACTTAATTTTTCAGAGAGAAACTTTAGATCCTTGTATTTCCATTCATCATCGGATTCCCTGCCCGGTGGTTGTAAATAGTGGGTATGGACTCTGAGTAGTCTTAGTTTTATCATTTTAAAAAAAGCGGTGTCTAATTCCACCACATTGTTTGAGTATGGCCAACGCACAATTATGCTTTCAACTGCTTCTGTAGCCTGGATAACCAAAATTGCAAATTGAATGAGTACAAAACTTAAGATTATAACTTCTAAATGCACATGTTTCTCATTAATTGGATTTTGGTCAAAGTTGAAGCTTTATACTTTTTATTAATATTAATAATAATAATATTATTATTAACATTATTATTATTATTATTATTATTATTATAATTATTACTATTATTAAATTTACTAATATTAATGTGAGAGAGAAGATTCAAAGCAATTACATTAATGGAAGGGAGGGAGTGCGTTTCTCACCGTTTCTCGACTTAACACATGATGAACATCTTCATAGCTCCACAACCTACTGCGCCTCCCAGGCTCTTTTATAGATTCCTGGCGTACGATTTCGCGACCCATTTCCTCTAGTAAATCATGCATCTCGAGTACACCATCAGATGAGACAGTGACAAGAGCTCTACCAACTAGAACGTCTAATCCGGTATGGGGATGGAAGTCACAACCCTCCATAATCCTTGTTGCAAAGTCTTTCTTCATTTGTTTAAAGAAACATGCAATATCAAGAAATATTTCCTTCTGCAAACCATCTAGTCCATCAAAGCTTGTTCTAAGGACTGTCTGGATTCCCAGGTGCGGATTTCTCGCTATTTTCTTTAACTCATCTTTCCACACAAGTACACTTTTGTTATCGAGGAATGCTCCCAAGACTTTGAGTGCTAAAGGCAAACCTTGAGCATATTTTATGAAATGGCCTGACAAATCAACGTATTCTTCTGTGGGTTGCTTTGTACTGAAAGCATACTGCATAAACAGCTCGAGAGCATCATCGTCATTTAACAACTCGGGCTCATATATCTGATCACCAAGTCTACTTAGTGACTGTTTCTCTCTAGTTGTTATAATGATTCGACTTCCGCCACCAAATGAAGGTTGCTTTCCAATTAAGGCTTCAATTTGGGATGAACTCTCCACATTATCAAGAACAAGTAAAACCTTTTTCCTACCAACTCTTTCCATCATCTTCTGAAAACCATTTCTCAAAATCTCTGAACTCCCCACCTTCATAT
>URS0000222F4A rRNA from 1 species 
ACGGGGTGCAGCAGGCGCGAAAACTTCACACTGCGCGAAAGCGCGATGAGGGAATCCCAAGTGCTTGCACGTAAGTGTAAGCTGTTTCTATGTCTAAAACGCATAGAGAGTAAGAGCTGGGTAAGACGGGTGCCAGCCGCCGCGGTAATACCTGCAGCTCAAGTGGTGGCCGTTATTATTGGGCCTAAAACGTCCGTAGCCGGTTTATTAAATGCCTGGGTAAATCGGGCCGCTTAACGGTTCGAATTCCGGGTAGACTGATAGACTTGGGACCGGGAGAGGCTAGAGGTACTCCTGGGGTAGAGGTGAAATTCTGTAATCCTAGGGGGACCACCAGTGGCGAAGGCGTCTAGCTAGAACGGGTCTGACGGTGAGGGACGAGGCCCTGGGGCGCAAACCGGATTAGATACCCGGGTAGTCCAGGGTGTAAACGCTGCTTGCTTGATGTTAGTCGGGCTCCGAGCCCGATTAGTGTCGGAGAGAAGTTGTTAAGCAAGCTGCCTGGGAAGTACGGCCGCAAGACTGAAACTTAAAGGAATTGGCGGGGGAGCAC
>URS0000E1B154 rRNA from 1 species 
TGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCCTAGGGTTGTAAAGCTCTTTCAACGGTGAAGATAATGACAGTAACCGTAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGTCCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGATATTTAAGTCAGAGGTGAAATCCCGGAGCTCAACTTCGGAACTGCCTTTGATACTGGGTATCTTGAGTATGGAAGAGGTAAGTGGAATTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAGGAACACCAGTGGCGAAGGCGGCTTACTGGTCCATTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACA
>URS00022EEFAF misc_RNA from 1 species 
TGGCTCTCCCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACCTTGCGCCCTCTGGTATTCCGGAGGGCATGCCTGTTTGAGTGTCATTAAATTCTCAACTTCAAAAGTTTTTATTGAATTTTTGAAGCTTGGATGTTGGGGGCTTGCTGGCGTCTTTAGATGTTCGGCTCCCCTTAAAGTTATTAGTGGGAATGTCTTTTATTAGGCAATCCTTGGTGTGATAATTATCTACACTTTGGATGGTTTAATGGTTCCAATGAGGCTATTGGTATTGCAATTAAGTTTGCTGTACCTTGGGTCTTAGGGGAAAAGATAAGTCTTGCTTTCTAACCGTCTGTGTTACATGGACAATTTATTGACTATTTGACCTCAAATCAGGTAGGACTACCCGCTGA
>URS00001F1239 rRNA from 1 species 
TAAAGGTATTCCGGTAGACGATGGGGATGCGTTCCATTAGATAGTAGGCGGGGTAACGGCCCACCTAGTCTTCGATGGATAGGGGTTCTGAGAGGAAGGTCCCCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGAGGAACATTGGTCAATGGGCGAGAGCCTGAACCAGCCAAGTAGCGTGAAGGATGACTGCCCTATGGGTTGTAAACTTCTTTTATAAAGGAATAAAGTCGGGTATGGATACCCGTTTGCATGTACTTTATGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGAGCGTAGATGGATGTTTAAGTCAGTTGTGAAAGTTTGCGGCTCAACCGTAAAATTGCAGTTGATACTGGATATCTTGAGTGCAGTTGAGGCAGGCGGAATTCGTGGTGTAGCGGTGAAATGCTTAGATATCACGAGGAACTCCGATTGCGAAGGCAGCCTGCTAAGCTGCAACTGACATTGAGGCTCGAAAGTGTGGGTATCAAACAGGATTAGATACCCTGGTAGTCCACACGGTAAACGATGAATACTCGCTGTTTGCGATATACGGCAA
>URS000107D7B1 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGCCCGGTAAGTCCGCTGTAAAAGTCAAAGGCTCAACCTTTGAATGTCAGTGGATACTGCCGGGCTAGAGTCCGGAAGAGGCGAGTGGAACTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAAGAACACCGATGGCGAAGGCAGGTCTCTGGGCCATAACTGACGCTGAGAAGCGAAAGCATGGGGAGCGAACAGG
>URS0001943432 rRNA from 1 species 
GTGAGGAATATTGGTCAATGGGCGAGAGCCTGAACCAGCCAAGTAGCGTGCAGGATGACGGCCCTATGGGTTGTAAACTGCTTTTACACGGGGATAAAGTGTGCGACGTGTCGTTCATTGCAGGTACCGTGCGAATAAGGACCGGCTAATTCCGTGCCAGCAGCCGCGGTAATACGGAAGGTCCGGGCGTTCTCCGGATTTATTGGGTTTAAAGGGAGCGTAGGCCGTCTGTTAAGCGTGTTGTGAAATGTAGATGCTCAACATCTGAATTGCAGCGCGAACTGATAGACTTGAGTGCGCAGGAAGTAGGCGGAATTCGTGGTGTAGCGGTGAAATGCTTAGATATCACGAAGAACACCGATTGCGTAGGCAGCTCACCAGACCACAACTGACGCTGAGGCACGAAGGTGCGGGGATCAAACAGGATTAGAAACCCTTGTAGTCC
>URS00007057CD snRNA from 1 species 
AAAATGAGGGCAATCTGGTTGCGACATCTGTCACCCCACTGATCACCAGAGTTGATTCGGCTGATTTGGCTGGCTAGGCGGGTGTCCCCTTCCTCCCTCACTGTTCCATATGCGTCTCTCCTGAAGCTGCATGATTGGTTGAAGAGGACAACATCCCAGGTATAGAAGGAGTGTACTGAGGTCTCCAGTCTTCGATCCCAGATATACTATAGCTGCACTCCCCTGCTAGAACCTCCAAACAAGCTCAAGGCCCATATCAAAGTCCATAATGGTGGCCCCTAAGTTTGTCCTCAACTTATACATGTGGTGGACTTATA
>URS0000B96F2F misc_RNA from 1 species 
TTGTTATAAATAATAAGCAGAAGAAAAATATATTGTTTACCTAGTTTACTTTTAAACGATGAGAATTGCAAAATTTGGATAAAATTGTGAGATTTGAATTGCAAATCATCAATTTGCTTATGATTTTGATCAATTTCAATTTGCTTATGATTTTGATCAATTTCAATTTGCTTGGTTTGAATTGATTGAGACTTGATTTGGTTCAATTTTAATTGTGAACTTTACAATTCTTGTAACTGTGCCATGTCAATATGTGGATCTCTCTTTGCTGAGCCCTTCTATGCGGCTATGCTAGAGTATGCTAGAGTTTCATCATCATAAAGGTGTGATACTTGGGATAAAAACTACACTTGATACCTGCACGTTAGTCGAGTAACATATATCACCTTTTGACAAAGCTTGTTGTTTCTTTATGTGAAACAAGAAAATGGAGTGGCTGAAGCTCTTTTAGTGGGTGCCACTGCTTCACCCTAAATTAAGTGATTAGCTTTTTCCATTATATCCTATATATCAGTAGCTTTATGTCTTCAGAATCTATTCCCAACATTTGATGTTGTTTTGAGTTTAGAATAGGGGATGGAAAACTATGTGCCGCTTGTTGCTTGTCGCTTGATGTAACAAACTATAAGGTTAAGTGTTCTCAAATCTCAATTTATTGGATTCCATGGCTTATGTTGCTAGGCATTGGCATGAATGGAAAGCGGTCTTTGTACCATAATACATATGGGTACTCCCAATATACATATAGCCCCTTTGGGACTGGTGACTGGTCATATTATATGGTCTTCATGTTCCCCTTGTCATCATTACTGGAAGTCTGGAATGAATGCACAAGCAATGCAATTCTAAGATCAAAATTCTGTCCTTTTTTTCTTTAGTAATAAGTTGACTTAAGTGAAGCCAATTTATTTTTCTCAGTATAATTTTTTGAACTTGGTTAATTTTGCAAATGAGCCCATTGCCACCAATCATTATTCACTATTGGTGTAGAGATTATTGCACATGCTTGATTATCTTGATTTTTTTCTCAAGTGCAAGTGCTTTGGATTCTTTCCTATTAACAGCTTTTCATCATGGATGAAAGAGAATTTCTCTGTTTTTTATTTGATGCATTGTGCCTGTCTTTCTTCTTCTTTTTTAAACTGAGCCAATCTGTATGCATTCGAAAATTGTATTGTAGGCTATAAAATGGAGAATTTTCACATGCTAACTTGCAACATGTGTTTTTATTAAGCGCTGCCAGCTAAATTATGATCTTGCATAAATTTTGTCCTTGTTTATGACATCATATGGCCATTAATTTTTTTTTCTTTTATAATTAACCCTGTTTTTGTCAATAATCTTTTTAGACGGTCTCTCCTATGTGGTCGTTGGTGGTTTTTCTTTCTTTTTAAAGCAGCTTTGAAGTTTTCAGGGATTCTTTGATTTATATCTTAAAGTATCCATATTCTATCTATCCTAATCTATGCTTTGAACAAGTTATGCCATCCAATACTGTCATTACAGGCAAAGTGGAGGCAAGAAGTGA
>URS0000D729CC rRNA from 1 species 
GGATGCGATCATACCAGCACTAAAGCACCGGATCCCATCAGAACTCCGAAGTTAAGCGTGCTTGGGCGAGAGTAGTACTAGGATNNNNNNNN
>URS00003FE27D rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAGGTCCACCGCGTAGCAATACAAGGGAAGACCTAGTGGCGAACGGGTGCGTAACACGTGAGGAACTTGTCCCGGTCTCTGGGATAACAGTTGGAAACGACTGCTAATACCAGATGACGTCGGAATCTCGCATGGGATACTGACGAAAGGGTTACTGGATCGGGAGAGCCTCGCGGCCTATCAGCTTGTTGGTGAGGTAACGGCTCACCAAGGCGTCGACGGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCAACGCCGCGTGCGGGAAGAAGGCCCTCGGGTTGTAAACCGCATTCAGTAGGACGAAAATGACGGTACCTGCAGAAGAAGGTGCGGCCAACTACGTGCCAGCAGACGCGGTAAAGTAGTCGTGT
>URS00023E9193 lncRNA from 1 species 
CAATGTTGGAAACGAAGTTGGATTTGCTCCTAACATCCAGGTTAACCATAGTTCTTGCGGCTTCTCCGGCATTGCACCACCGCCTCCAAACAGACCCCAGTTATGGATCTTGTGATTACCCATCTTCCACAAGGAACAGAAACATTTGGTCAAGTTTCTTGCTCTGCATCTGCGATTACGTCAGCAATGTTTAAGTTATCCTTTCTCAGTGCAGGGAATAAAAAAAAAAACAAAAAGTCCAAACAATTCAGTCGAAGAATACTCGCAGAGAGAGAGACCTAATGGAGGAAGGGCTCAACGGAAAGGAGTACTTGCTCAAGGTGGTGCTGATAGGCGACTGAGATCTGGGACACCGCCAGCCAAGAACGCTTCAGGGCCGTCACCTCTGCTCACTCTCTCTCAAAGCCCTAATCTTTAACCATCGGCCGTCACCTCTGCTCACTCTCTCTCAAAGCCCTAATCTTTAACCCTAAAAAATCCCCAAATCTCTTCATCTCCTTTCCCCCGCACGTACAACGATGGCTCTAATGAGACCCTAATCCGGAAACCAACCCCC
>URS0000805F26 rRNA from 1 species 
AATAGATACCCCGGTAGTCCATGCCGTAAACGATGAGTACTAGCTGTCTGGGGTATCGACTCCCTGGGTAGCGCAGCAAACGCGATAAGTACTCCGCCTGGGGACTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCGTGCGGTTTAATTCGAAGCTACGCGAAGAACCTTACCAGGGCTCGACATGTCCCTGACCGCCGATGAAAGTCGGTTTCCCTTCGGGGCAGGGTCACAGATGCTGCATGGCTGTCGTCAGCTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTCGTGTGTTGAATTTTTCACACGAGACTGCCCGGAGCAACCGGGAGGAAGGCGGGGATGACGTCAAGTCAGCATGGCTCTTACGTCCTGGGCTACTCGCACGCTACAATGGGCAGTACAGACCGTTGCGATATCGCGAGATGGAGCTAATCGGACAAAGCTGTCCTCAGTACGGATTGCAGGCTGC
>URS0000ACA7F0 rRNA from 1 species 
AATGAACACTGGCGGTAGGCTTAACACATGCAAGTCAGACAGAAACGATGAAGTGCTTGCACTTCAGGCGTCAAGTGGCGGACGGGTGAGTAACACATGGGAATCTACCTATAGTTGGGGACAACATATGGAAACATATGCTAATACCGAATGTGCTCTAAGGAGTAAAGGAGCCCTCTCTTGAAAGGTTTCGCTATAGGATGAGCCCGCGTGAGATTAGCTAGTTAAGGTAATGGCTTACAAGGCAACGATCTCTAGCTGGTTTGAGAGGATGATCAGCCACACTGGGACTGAGACACAGCCCAGACTCCTACAGGAGGCAGCAGTGGGGAATATTGCACAATGAGCGAAAGCTTGATGCAGCCATACCGCATGTGTGAAGAAGGCCCGAGGGTTGT
>URS00012146AA rRNA from 1 species 
CCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGACGAGAGTCTGAACCAGCCAAGTAGCGTGAAGGATGACTGCCCTATGGGTTGTAAACTTCTTTTATATGGGAATAAAATGTTCCACGTGTGGGATTTTGTATGTACCATATGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGAGCGTAGGGGGATTGTTAAGTCAGTTGTGAAAGTTTGCGGCTCAACCGTAAAATTGCAGTTGAAACTGGCAGTCTTGAGTACAGTAGAGGTGGGCGGAATTCGTGGTGTAGCGGTGAAATGCTGAGATATCACGAAGAACTCCGATTGCGAAGGCAGTTCACTGGACTGCAACTGACACTGAGGCTCGAAAGTGTGGGTATCAAACAGGATTAGATACCCGAGTAGTC
>URS0000767CA2 rRNA from 1 species 
GATGAACGCTGGCGGCATGCTTAACACATGCAAGTCGGACGGGAAGTGGTGTTTCCAGTGGCGGACGGGTGAGTAACGCGTAAGAACCTGCCCTTGGGAGGGGAACAACAACTGGAAACGGTTGCTAATACCCCGTAGGCTGAGGAGCAAAAGGAGGAATCCGCCCGAGGAGGGGCTTGCGTCTGATTAGCTAGTTGGTGAGGTAATAGCTTACCAAGGCGATGATCAGTAGCTGGTCCGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAATGCCGCGTGGAGGTAGAAGGCCCACGGGTCGTGAACTTCTTTTCTCGGAGAAGAAACAATGACGGTATCTGAGGAATAAGCATCGGCTAACTCTGTGCCAGCAGCCGCGGTAAGACAGAGGATGCAAGCGTTATCCGGAATGATTGGGCGTAAAGCGTCTGTAGGTGGCTTTTCAAGTCCGCCGTCAAATCCCAGGGCTCAACCCTGGACAGGCGGTGGAAACTACCAAGCTGGAGTACGGTAGGGGCAGAGGGAATTTCCGGTGGAGCGATGAAATGCGTAGAGATCGGAAAGAACACCAACGGCGAAAGCACTCTGCTGGGCCGACACTGACACTGAGAGACGAAAGCTAGGGGAGCAAATGGGATTAGATACCCCAGTAGTCCTAGCCGTAAACGATGGATACTAGGCGCTGTGCGTATCGACCCGTGCAGTGCTGTAGCTAACGCGTTAAGTATCCCGCCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAAAGCGAAGAACCTTACCAGGGCTTGACATGCCGTGAATCCTCTTGAAAGAGAGGGGTGCCTTCGGGAACGCGGACACAGGTGGTGCATGGCTGTCGTCAGCTCGTGCCGTAAGGTGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTGTTTAGTTGCCACCATTGAGTTTGGAACCCTGAACAGACTGCCGGTGATAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGCCCTGGGCGACACACGTGCTACAATGGCCGAGACAAAGGGTCGCGATCCCGCGAGGGTGAGCTAACCCCAAAAACCCGTCCTCAGTTCGGATTGCAGGCTGCAACTCGCCTGCATGAAGCCGGAATCGCTAGTAATCGCCGGTCAGCCATACGGCGGTGAATTCGTTCCCGGGCCT
>URS0000BE21C0 hammerhead_ribozyme from 1 species 
GTACTGCTGACGAGTCCAAAACAGGACGAAACAGCTGTGCAGTGC
>URS00023CDC16 lncRNA from 1 species 
GAGATGATTCTACTTTTCAGCTGGAGAACTTAGCAATAAGTTGTGGTAAGGAGATAAAAATTCCTAAGCAATGGCTACTTCAATTAGATAATCTGGAAAGCTTGTCACTGCATCGCTGTTGGTCAGATGAGCTGAAATCTCTACGTTTCCAGAGATTGAAGAAACTCACACTTGGTCAACTTAGTTGCTTCACTGTTTTCTCATTCCCAGACTTTGAAAGACTTCAACAGCTCAGAGAATTACGAATAGCACATTGTGATTCATTGGAACATATCGTGGAGGTTGTTAATGGTGAAGAAGCTTCTGGCATGGATACGGAGACTGCTGCACTAGTTCAGCTGGTAAAAGTCTATCTTGAGGGTTTGCCAAAACTCAGAAGTTTTACACACACAAAGTCTAAGAATCTTATGGCCAGTTTAGAGCAGGTGGAAGTGGAGCCCTCGATTCTTTTCAGGTGCCCTGTCGTTGGAAATCTCCAACAGCTCAGATGGTTAGACGTGACTGATTGCAGATTGTTGGAAGGCATTGTGGAGGTTGCAAGAGGCTATCAGACTTCTCACAGGAATGACCACATTATCACATTCCCTCAGCTCTATTCCATTAAACTTAGAAATTTGCCCAACCTCCAAAATTTCAGTCCCACTAAAAGCTATAGTTTCAAGATGCCCAAATTAACAGGTTTCGGTCTGTTCTATTGTCCCCGGATGGAGAATAAACCCTTCATGCAAATAATCGCAGAAAGGGTACATTTTTCTTCCGAGGAGCGTCGACGACTGATAATAGTTGAAAACCTCAAGGACTACACACTTAGAAAAATAAACAAGCTCGAAAGCGTGGGGGAATCAAGTAACAGCAATCAGGATGTGGAAACAGAAACAATGAGAGTTGAACAAGCGGAAGCCATAGTTGTTCAACAACGGGAAGAGGGAGTTGGTGCAGAAGAAGACGACTTTTTCTTCTTAAGAAAGTCTCAGACTTCATTGTTTTTCATTTTGTTTTTGTTTTTGGTTTTGGTTTTGTGTTTGAAGGAGGTCTGAGCGTCTGACACTGAATTGTAAGTTGTGAAAAGCGACAACTGAGGATGCGGGCTGATTGGAGGCCCAGTTCCAGTAATACAATTTCAGGTCCAATATCTATGGCCTGCATAATTTTTAAGAGTTAAGTTCCATGTAGTATATTTATGTAGTACTGTAGGCCACGTATATTCTGCAACTATAAAATGACATAAAAACATTGCAAAATATATGAAACTTGTTATTTTGTGAAATACATTCTATAAATATCACTATTTCATGAAAAATATTGAAAATCATTTATGTTCGACAAGTATAACACATATGTTCAGTAATATGTAAATATGTTCTGCAAACCTAACATGTGTTGCAGAATAATGTGTTTTTCACTATTTAACTTGTGGAATGTTTAAGATTGTCAAAAATTTTAACAAAATAATGATATTTATAGAACATGATTTGCAAAATAACACAGTTTGCAATGTTTTTATGTCATTTTATAGTTGCAGAACATACGTGGTCTACGGTACTACAGTAAATATGTGGATTACATGGAACTTTGTTCTAATTTTTAATGTATATATTAATTTCAAAGCACTTCATCCAAATTATGTATACACACAATATATATTACATTTTATTATTTATTTTATTGATCTGTTAATTAGAACCTATAACCTAGACTGCAATCGTCAACCTTCAATTTTGATTATTTTTCTGCCAAAAAAATAAATTTTATCAAGTTCAAAATTTGTCAACTTTTATCATGGCGATACTAAATACTCCCTCCGTCCCAAATTAATTGTCCAGTTTGACTTTTTGATGGTCAATTTGACCCAACTTTGATTGGAAATTAAAAATTATCCTTTTACAATTTTACAAAACTGAAAAATATATTCAAAAATAGATTTGATAATCTTTTCAATGATATATATTTCATAATTTTATTCAATTATTTAATATACATATTTTTCAGTCAAAGTTGAGTCAAATTGACCATCGAAAAGTCAAACTGGACAGTTAATTTGGGACGGAGGGAGTAGATATTAAGCAGTTTCTTGATTTGATTATGCCTATAAATTATTTGTTTTTTCATTTAATGATTCCTTCCGTTAATTAGAGGCTTTAATTTAGAATGTATTATTAAATTTTTATTTCTCAAATATTTCTTAAATAAACAATTGAATAATGTTTTTTTTGAGAGAATTGAATAATGTTATGTATCCCAAATTTTATTCTCAAAATTTTTATCAAGTGGAGAAGAACCAATCAAACAGAATTTGGAAACACTTTTTCAAATACCTAATATTTTCCAGTTTCAAAAAAAATACCTAATATTTCCTAAATAATTTATGGGCCAATATACCTCTTTTTAACATTTTTATTGCAATAATACAATTTTCTCCCAAAAATTGCATATTTACTTTTTTTTTTTAAAAAAGCTACAAAGTATTTGCATATATACGACTATGACTATGAACTGCTTCCTGGAGTAAGTGAGAGAGAGAAACAAGCGAACCCGTTCTTTGTTCTTGCCTCACCCTTCCTCCTCTGTGGCTCATTTTGATCTGTCTCTCTCTTTAATTCCCTCTCTCTTCTGCCTCCATCTCTCCTCGCTCTCTCTATCTTTTTCTTCGATCCATTGATTATGTCAGCCGTACATTCTCCGATCACGAAGCCCTAGGTACTCATAGGGAGTACAATCTTAGTGGTGTTCTTGATGATTGTTGGATCGGTGATTATAGCGGATACACACAAGATGACTTTAAAAGAAGGGAGAAACGTCGAAGTAGAAACTCCTAAACATGGCTGCTGATGTTGATTTTATGTGAATATATTTTTGTTTTTTGTTATGCTTCATCTCTGTAGAAGTTTTGGTTAGCGCTGGTTACTTGTGGTTGCAAAACTTGTTGATTCTTTTGGCCCCGCAGGGGCATTTATTTTTCTGTCTTTGCAACTAGTTGCAACTTATTATGCAACCTAATATAATTTTAGCATTTTTTAAAAAAAAAGTTACATATGTAGTTGAAAGTATGGTTGCTCGCAGTTGCAGATTTGGTTACATATGCAAAATCGTATTTTTGCAAAAAAAAATTGAATGATAGAGTTTTTTTTATTTTAAAAAATGATAGTATTTTTGCAAAATTTCTTTTTGACTTGGGTATTTATTAAAAAAACCCATAATTTATTCCTATAAATAAAGAATGTCAAACACATAAATATTTAATTCTCAGGTAGCAAAGAAAGGTTACTCGCAATTATTTAGGAGCCCAAACTAAACCAAGGCACAATTGACAATACCAAACAGCAAAGAACACGCTCCCAAACATAAAAGCGCAAAGGAGCAAATAGCAATTCAAGATCATATTGTACTCCAACCATTGACTAGCTAGTCAGACAAAAACTATCTAAACTTCAACCAATATACAGTATACTTGGGACATAAACATCCACTTAACAAGATCAAAAAGGTCCTGGTTGATATTACTCCTCTTTCTCGACTCTCGAGGAAGTTGGGGTTCGAGTTAGGGTGATTCCATGTTTCCATTGTTGTTACTCCATTAACCATTGATGCAAAGCTGAAGCTGTGGTATTGCTGAATTTATTACATTAAATACTAGTCAGTATTTACTGTATGCCTTAACATGGCTTGATGCAATCAAATAAACGAAATCCTTGCAACACAAACGAATTCAGTGATACAAAACCATAGCTACTAATATATGGGCAAGGCAGACAAAAATAGATGCTACAAACAGTTGGAATACGTCGGTTCTTTATGAACTACCTAAACCAATGACTAATTGTGCAGTCGCATAAAAACTGAAACCGCGTCATTCAAACACAACTGGTGCCAACTCCTACCAGAGATAAAACATGATATATCTATATTAATGAGCTCATGATGCAACTATTTAGTAGTTCCCGAGCTATATTGTTTTGAGATGCACAATATTATTGTAAGAGCTTAGCTGGATTTCATAAAGATCTGCACGTTGAGCCACAGTACAACTTACCAAGCTCTCAATTTCTTCGTGCAATGCTGATTAGCCCAAGGATGTTCTTTCAAATTTTTTAAACCATCTAGTTTCACTGATGAATGATGATAGAATATGGAAACAACTTCTTGTATTGGTTTGGGCCGAAGCCCAGGATCGCTGTACCTGATCCAGATCTTATTAGAGAGGTTTTGATGAATTCCTTAGGCCGAGTTGTTGCTTGGAGATGGACTTGTTGGATATATTGACCGGTGAGAAATGGCCTGTTCTGTATTCTTTTTTAAGATTGCATAGTGGCTTGTTTTTATGGTGTGTGTGTGTGTGAGAAGTGTGTGTTCTGTTTTAATGTCAACACTCCTAAAGTACCAGAGCCCAGGTTAGAATTCAGTACTTAGTTCAGGGAGATGGATTTCCAGACTCTGGAGCTAAATGACAATCAGCTAGGCAGTTTCTGAAACAGTTTCCTGTAGTTCTAATCTAGTTATGTGGCATAGAGGGCAACTATTGCCTGTGATCTCACTTGATCACAAGTCTATTTTAAGAAGGGGAGCTATGTTATATTTTCATTTATATTTTATGTATGTCATGTCAACTCTTACAATTTTGCTGGATAATTAATTAAGTACTCCCTCCGTCCTTTTTTACATGTCCATTTTGATTTTTGACCAGTCAAATTAACTATATTTTGACTGAACTTTACACGTATTAGATAATTGGAAAAATTAATAAAAATTATATTACTAGAAAGTATATTTAATCTATTTTAATATGCAACTTTCAGATTATAAAAATAACGAGTAGATAATTTGTAATGTTTAGTCAAAAATTGGTGAATTTGGCTTCTCGAAAAGCAAAATAGACATGTAAAAGGGGACGGAGGGAGTATTTATTTGCATCTCGGTTTAGTTGGATCGCCATCAATAGAATTTATTTTATACTTCTTCCGTTTCAAAGTAAGTGCCGTTTTAATTTTTGTCACGTGACTTGAGGTGGAATATTTATTTCGTTTACCAAAGACTTTGACCTTTCACCCATGCATACCGGGTAGTTGTTGTTGACCGTTCTTATAAAAAATAAAATATCAACATTGTCACCTCTATTTTTGATTTTTTTATTTATTTCTGACCTATGATCGGTATCTTAGTATTTTAAATTTCACGTGTATCATTGTATCTTATTTGCAATTTAAATAAATAAATTAGTTAATTATTGAAACCTCATTTTTTTTTGCACTTTGGACATCTATAATGATTTACTACTTAAAAGTTGCAATCATAAACTATTTGAATAAATTGAATTTTAAAAATCCAGAAAGTATTTTAAAGAATATTCTTCATTATACTTTGTACTATCAATTTTTTTAGTAAACTTTTTATGTGATATCCTTACCATTGAAGTATGACTAATATTAATTAGTATATTAAATTTGAAATACAATAATATCACCGAAAAATTTAATGAATAAAAAATGATAAGAAAGTCAGAGGCAGAAGGAGTTTTCTTTAAGAAAATTTAATCCTCTTGTGCATGACTTTAAATCTTCATATATCACGTAAATTCGACATGTTTGAGCGACACAAATAACATGCATCGAGCACGATTGGATAGCTCAAGTGGTGGGTTTATCCTCTGTTGTCCCGGAGACCCGAGTTCGACTCTGCCTCATCCGAACAGTATTAGAACGGATACTCATTTGTAAGGCATATAAGATTCTATTATCAAAAAAAGTAAAAAATAAAAAAAATTAACATGCATCATTGCCAGTCGCCCTGAGTGAGGGATGCGGTTGTTATTCTTTGTGAATCATATACGTAAGCTTTTAGTTTCTTCTTTGTCAAATTGATTTCAGTTTTTCTTAATGTTATTGATTTTCTTTTTATTGTTTTGATTTTTTCAATATGTTAAATGAGTTCTCTACTTCTCTTGCCTTTTTATCATGTTAAAATGATTTTTTCAATATATTAAAATGAGTTCTCTTGTGCACTTTAGCGTCGGTTAGAAAAACCGACGCAATAGAGACTACTCTATAGCGTCGGGTTCATATACTGCGCTGGACTGCCGACGCTAAAGGTCTTATTTGACTTAGGCATTTTTGTACTAGTGTAAAATAATAAAAAGTAAAATGATTATTCTACTTTCCTCAGCTTTCCACAAATGGGGACATTTTTTTAGTAATACGAAAAACTCATTTCCAAATATATATATTTCAAATGGACATAATATCGGTTGTCATTTTAAATTTTCTAACTTATTCAAACAATATAATATTCGTGAAAATAGTATACTAGCATTTGGATTGTCATTTGAGATTTTAAATTAAGATTAAATTCCTCATTTCTTACCTAACATATCATGCATCTGGCTAAATATATAATTTGGAACAAACTGTAATTTCCAAATAAGTACTAGAATTTCTTTCTTTATTTTCTTTCCAAACTTTTATCGATGATTTTGTCTGCCCTCTCCGTCAAATTGATTTCTTTCTTTCCTTTTATCTCAGGTTAAAGATTGACCTTCTCATGTGAAATACTTACAGTATGTTACTATGTTAGTATTGAACTGATTTCGTAACAAGTGAAATTTCTTTTTGTGTTTACAATAATATTTGATAATTTAGCACTGAGAAAATGTTTTATCACATGTGGTGATAGGACTCGTATTAAAATATTAAATTAAATATCTGAAAGTAACTTGTCCAAAAGTCAATCTTTCTATAGGCCAATCAAATACAAACAAGTGACACCGACTATATGTGCTTGTTGGTGACAGTCTTTCTGTGATAATTACACCTTTCCTACTACCATTAGTCACATTGACGACTATATATGAAGGTATCAGAGATGACTGTTGAATGGAGGTTGTTTTTTTTTCATAGCAAAAGACGTTAGAGCAAATCCAATGCAAGATGTAAAATAGTTATAGATATTGTTATAAATTAGTATTAAAAAGTGTTTTTCATTGTTGAAATAGAACTTCAACTCCAATGCTAGATGCATTTTGCATCCAAATAATTCCAAATTTAAGTAACTTTAGTCCCTCTCTCTTAAATTTTATTTAAAGTTCACCATTATATATACCAATTATAGTTAATTGATGATGTGTCATGGATGCATAAATGCATATTTGGTTTCAAATTTAGAATTAAAAAGTGTTTTTCATTGTTGAAATAGAACTTCAACTCCAATGCTAGATGCATTTTGCATCCAAATAATTCCAAATTTAAGTAACTTTAGTCCCTCTCTCTTAAATTTTATTTAAAGTTCACCATTATATATACCAATTATAGTTAATTGATGATGTGTCATGGATGCATAAATGCATATTTGGTTTCAAATTTAGAACCAAAGATGCATAAATACATATTTGGTACGAGTAAAGGCCGTTTGACGTGATTTAAAAATAATGTTTATTACTTATAAATGAGAAGTTAATTATAAGTAAAAAGTAACTTTTATCTTATGAGTTGGGATATATTTTTTGGTGTTTATAATTAAGTGGGTATAAAAATTATTAATATAATAATAAATTATCTTTTAAAATGATCTTGTACATATTTGTAAAATCAAGTAAAAAAAATAAAATAAAATTATCAAAAAAAGTTGAGATTTCCAACTTCTCAGATTATGACTTATAAGTTGGAAATGAACTTATAAATTCGTCATACAAATAATAGGAACAAATAAATTCAAAAACTGGGTTTATAAGTGGAGTCAAACACAACCTAAGTCGCTTGTGATTTATAAGTCAAAAAACTGACTTTTAAAATACAGTTAAACTGCCTCTACTATTCAAATTAGGTTTAAAATAATCCATTGACCTAATATAAATACTAAGTTTCCCTAATATAATTGAAATTAGCTGTACTAAGCTGAAATATGTCAAATTCATTCTATTTTACTAAAGAGCATGACGTTTCTCCAATGCATAATTGTTTGAATAACTTATCTTTTAATATTATAAAGAAATAATCCTTTGTACGCGTGAGTTACTTCTTCAAATAGTTTTTGATATTTTTGCACCCCGGGCCTGGGATCGTCTCAGACTCCTCAAGGGGCGGCTAGCATCTGAGGGTTTTCAGTAGATGTTCCCTTTTGCTGTTTTTATATCCTTGATGTCTAAATACTAAGTACTAAGTAGCAAGCTTTTGTTTTCCTAGGTTTGTCTACATGCTTGCATAGTTGCATGACTTTCTTGGAGTCTCTTTCATTTCTATGTAGTTTGGTGCTCTATGACTGGTTCTATGCTTTTTTGTATTGGCTTTGCTAAGTCAATATGTAAGATGTTCCGAGATTGATTTATAAACAGATGTATGGCTGGCTTTATGCTTTTTTGGGTTTTTTTACAATCGGAAAATATTTTTGTAAAATTTTTGTAATTTTTGAAGAAAATTTGCAAAAATATAATTTTACAAATAAAAATTGAAACGATACTAATTTCTGAATTCAATTTTGCAGAAATACGGAAGTTTCATTTGATAAAAAAAAAGAGTTTGTTGACATGATTTCAAATGAAACTTTCGTATTTCTACAGAATTGTTATATACACAATCGTAAATACATAGAAATTTATATTTGCAATTGATTGGAAAAAAGGAAAAATGAGTGTACAAGGTCAATGCTCATATCACATAAAAAATCACAAAATCAAACAGCAGTTGTTGAACTCACAGTTTGTTAAGCTAACATGGAGAGAGAGAACAGAAAAGTAAAACTTGTATTCAACTAACTGAGTCTTACAGAGTGGCTTCACTACAATATATACAAGCAAGCTAACTAATTCTCTAACAAACTATATGCTGTTGACAGGCTGTATGTACACGTGTAGTATAGAGAATAAATATTAATCATGTAATGCCAACACCCCCCCGCAAGTTGGAGGGGAGCACACCCAACTTGGACATAATGTTCTGATGTTTAACACCATTCAGGGCTTTGGTGAACACATCCGCAAGCTGTAATGTAGTAGGAGTGTAGGAAAGTGAAATAAGACCAGAACTTAGTTTTTCACGAACGAAATGGCAGTCCAAATCAATGTGTTTCGTTCGCTCGTGGAAAACTGGGTTCTTAGCTATGTATATTGCAGATTGACTATCACACTTCACTGGAATAGGTGTCACATCTGGAACAGAAAGTTCATTTAGAAGACGAGATAGCCAAGCAAGTTCAACAGTAATGCGGCGGATAGAACGGTATTCAGCTTCTGCTGAAGATAAGGAAACAGTGTGCTGCTTCTTTGATTTCCAGGAAATAATGCTGTCACCTAGCATAACAACAAAACCACTCACAGATTTTCGAGTATGTGGGCAAGCAGCCCAGTCTGCATCGCAATAGGCAGTAAGATTGTATACTGGATTTGAGTTGTAAAATAAACCTTGACTGGGAGTAAGCTTAAGGTATCTGAGAACATGTAAAGCTGCTTCCCAATGTGGAACTCGAGGAGAACTCATGAATTGACTAAGGTGTTGGACAGCAAAAGATATATCAGGACGTGTGTTAGTGAGAAAATTCAGTTTGCCAACCAACTTTCTGTATGAAGAGAAGTCAGAAACAGGATCGCCTTGATCATGGATAAGTTTAATAGTAGGATCGAGGGGACTGACTGCAGGTGGAGCATCGAGACAATCAAATTCTTTGAGTAAATCTTGAGTAAATTTGGTTTGAGACACAACCATACCAGATGAAACATTCTGAAATTCAAGGCCTAAGAAATAACTCAGATTTCCCAAGTCTTTGATTTTGAAGGTGTCGTTGAGAAAGGCTTTTACAGCAGTAATCTCAGTTAAGTCATCCCCAACCAGTAAGATATCGTCAACATAGACAGCTAGAAAAACAGTAGAAGATCCTGTTTTCTTGTAGAAAAGTGAGTAGTCATTCTTGGAATAAGAATATCCCCGTGACAAGAGAGCACAACAAAGTTTGTAATTCCAATTTCTGGATGCTTGACGAAGTCCGTAAAGGGATTTAATGAGTTTGCAAACTAATGTGGAATCACTAACTTCAAGACCTGGAGGTAATTGCATATAAACATCTTCAAATAAATCGCCATGTAAGAAGGCGTTGTTCACGTCTAGCTGGTACATGTGCCATTGTTTCTTAACTGCAGTAGCAACAAGAGTTCGAATAGTTGTCATCTTAACAACTGGAGAAAAAGTTTCAGTAAAATCAATACCAGCCTTTTGAGTGAACCCTTTAACAACTAGTCGAGCTTTGTAACGCTCGATGGAACCATCAGCATTATGTTTTACTTTGAAAACCCAACGACAGGAGATTGCCTTTTTACCAGGAGGCAAGGGGACTAACTTCCAGGTATTATTGGCTTCTAATGCAGAAAACTCAGCAGCCACAGCCTGCTGCCATTCTGGGTAGATCATTGCTTCTGCAAAAGATTTAGGCTCTGCAACTGGTATTTGGAGAGGAAGTGGTGTGGGAATAGCACAGCAAACAGATTGAGGAGAAAGCAATGAATTAAGAGGAATACAATTTGAGGTAATGGTGCATGAACACAAAGAATCTGAACAAGCATTATGTACAGAATGAACATAATCTGTTAGATAGTTTGGCAGTTTTGAAGTTCTGGTTGATTTTCTGAGAGGTGGTGGCTGTGGTGAATCTGAGACAGAACTTTCAGATTGTTGAAATGAAGAGGAGGACTGTATAGGTGTATGAGAGACTGTAGGAGTAGAAGAGTGTATGGGAGACTGTGTAGAAAGTTGTGAAGGGATAGACTGTGATGATGACTGTGATGGTGACTCAACAGTAGGAGTAGATTGATCAGGAATAGGAAAGTCAGGGACAGGTAAGGGAAAGAATGTAGAGGAGTTAACATCTACATATGGAAAATGGTTTTCATAGAAAACAGCATCTCTGGAAATTAAAATTTGCTTTGTTTCCAGACTGTAAAATTTATAGGCTTTCTTGCCCTGTGGATAACCAAGAAAGACACAAGTGATTGCTCTGGGGGTGAATTTATCCCTGACAGCATCTCTGGAGATTAAAATTTGCTTTGTTTCCAGACTGTAAAATTTATAGGCTTTCTTGCCCTGTGGATAACCAAGAAAGACACAAGTGATTGCTCTGGGGGTGAATTTATCCCTATGAGGTTTTGGAGTAGTCACCAGGCTTAAACAACCAAAAGGTTTTAAGTGATCAAAACTGGGTTTTTCCTTGAGTAATACTTCATAAGGGGAAAGATTATTTAAAACTCTGGAAGGAAAGAGATTAATAAGGTGAGTGGCTGTAAGGATGCAATCACCCCAGAACTTAACAGGAAGCTGTGATTGGAAGAGAAGAGCTCTGGCTGTCTCTAGTAAATGCTTGTGTTTTCTCTCCACAACTCCATTTTGTTGTGGAGTAAAAGCACAAGAAGTCTGATGTTGAATGCCTTTAGATTTAAAGAAATCTTTAGCAGCATGACTGAGACCAATTTCTAAAGCATTATCAGACCTTACTGATTGTACAGGTAATTTGAATTGTTTCTCAGCTAAGATAATGAATGATTTAAGGAAGTCAAACGCAGAGCTTTTGTTAGCAAGCAAATAGGTCCAAGTAGCTCTAGAAAAATCATCTACTATGGTAAGAAAATATCTGAATTTGTTGTAAGTGGGAACCTTGTATGGGCCCCAAACATCAACATGAATTAATTGAAAAGGACTTTTACTGTGAATATGACTGACAGGAAATGGCAACCTTTGTTGTCTTGCCTTAGCACAAACAATACAAGGTACATCAAGCATAGAGTCAACATTACAAATATGTAATGATTTAAGTTTGTCAAAAGGTAAATGACCTAATCTGGTATGCCACATCATGCATTCTTTATTATTACTAGCAAAAGTCTTACTAGTATTAGCAATAGAAGCAGAAATGACATTTGGAAAGGTGACAGAAGTGTCTGATGAAGATGATGAAGGTGCAGAGCTGGAATATGAAAGAAGATACAAGCCTTTAAATGCTTTACCAATTTCCAGTTGTCTCTTCTGTGAAGAGTCCTGCAAATAACAAAAGTCATTAGTGAATTGTAAGGTACAATTCAGCTGACTTGTTAATTTGCTCACAGAAAGAAGATTGAACTGGAACAGTGGAACATATAAGACATTGGCAAGAGTGATATCATGTGATATTGGAACAGTGCCAATGGAAGTGATGTGTAAAATGTGACCATTAGGCAGAGATATGGTTAGAGGTGTGTTTAAGATGGTAAGTGAACTGAATAAATGTTTCTGTGAACACATATGATCATTAGCCCCACTATCTATGATCCAAGTAGTAGAGTCAGATTGTGACATACAAGCAACTATAGAGTCTGAACAGAGAGAGTTACCAGCAAAGTTTGCATAAGAAGTATCTTGATCTGGTGGCTTAGTAGTTTTGAGAAGCTGGAGCAATTGAGAGTACAATTCTGGAGTCATAGCTGGAGCAGAATTATTTGATGAAGTTGTAGAATCTGCAACTGTGTCAGGAGTAGAATCATGTTGGAGGACATCAGCATTTGCAGCAAACCTTTTAGTAGACTTTGTGAACTTGAAATCAGATGGGAAGCCATGAACTCTGTAACATTTGTCAATAGTGTGCCCTGTCTTCTTGCAGTATTTGCAAGTAAGATTAGATTTCTTGAATTGACCCTGAGAAGCCTGAGAAGTCTGAGAAGAAAATGGCTTGGAATTGACATGAAGTGATGTAGAATCTGTTATCAGATTGTGAGAAGAATGAATTTCTCGTTGAGCTTCTTCCTGTAGAAGAAGATTGTACACTTGACTGATGGATGGCAGAGGATTGGACATCAGAATAGAACCTCTCATCACATTGTAAGATTCATTTAGACCCATAAGGAATTTGACAACTCGTTGATTCTGACGCAAAACAGCATTCTTAGGTGCTGCTTCACAGGTGCAAACAGGAGTGAGGCAAAGAGAATCAACATCATCCCACAAGACTTTCAATCTAGTGAAGTAATCAGCAACAGTGCTATTTCCTTGACGTATTTCACAAAGATCCTTTTGCAAAGCAAACAGTTGTGTTCCATTAGAGACATTATAGCGCTCATCAAGTTCTTTCCACATTTGATAAGCCGAATCAGCACGACTAACACTACGAGCAATGGTCTTGTCCAAGGCACCAAGAATCCATGAAATTACCATGTCATTACAACGAGACCAGCTGGTAAACGAAGGAGAAGAAGGATCTGGTTCTGGAATCCTTCCATCAACAAACCCTAACTTGTTGCGAGCAGATAAGGCAATTCTCATTGATCTTTTCCAACTACTAAATCCAGTTCCATCAAAACAATCACTCACAAGTTTCATTCCTGGACTGTCTGATGATTGCAAATGCAGTGGATTATCTTGAAGAGTGGTAGAATTGTGATCGAAAACATGATTGTTTGAAGAACTCATGATGTTACAACTCAAAACAATCAATCAATTAAGAAGGGAAGACTAAATCTCTGAATTAATCGCTATGGTAACGAACAATCACCAGAGTAAAACGAGCAAGATTGAACAATCACGAATCAACAAAACAATCTAAAGATGTTTACAAACAAATATGTACAGTAACAGAGAGGAATAACGAAGTAAAGTGAGAAACGAAATCACCGGAGAAATCACCGGAGATGAACAAGCAGCGGAGATGAAGGAACAAGCAGCGGAGTTACAGCGGAGATGAACGGAGATGAGTAGATCGGTGTCGCTCTGATACCATGTTGAACTCACAGTTTGTTAAGCTAACATGGAGAGAGAGAACAGAAAAGTAAAACTTGTATTCAACTAACTGAGTCTTACAGAGTGGCTTCACTACAATATATACAAGCAAGCTAACTAATTCTCTAACAAACTATATGCTGTTGACAGGCTGTATGTACACGTGTAGTATAGAGAATAAATATTAATCATGTAATGCCAACAGCAGTAAATCAGATCTTCAAATCTGAGATTATATTTTTGTTATTTATACAAATATTTGAGATATAATCAAAAAGAAAATTTGATATATTTTAATAATAAAACTTGTTAAACTTGAAAACTAGCGCTTGATTTCTCTGAATTTTAATAAATTTATAATAATCAAAAAGAAGTTTTAATAAATTCTAAATTTGTCAAACAGAGTTTTATCGTCTACCTAAACTATTAAAAGAATTTAACCATTTCATTCTCGTACTATAAATAGTATTCTGCAGGAGCAAATAATTCACCATCTCGACTTTGCAATTCCACTCATTGTATTCTCAAACTCTTCCCTTTTCTTTTTACTATTCATAACATATATACAAAAACAGAAGTTGAAAAAATCATTATGGATCCAACTAGCATTCCCGTTGTGGGAAAAATTGTGGAGAAAATATCCGATATAATCGTGGCAGCTTTGTTTAGCCATCTAAACTATATGTTTTGCTCCAAGTCTCTTGTTGAAGATCTCAAATCTGAGAATGAAAAACTTGAGATCGTGGAGAATGTGATGTCCAGAAAAGCTGATGAAGAAAGTAACAACAGCAGAATAATGGAGAAGCATGTGGTGGACTGGAAAAAAGCTGCCAGACAAAACCAGGAGAGTGTTAAAAGCTGTTTGGAAAAATACGATAACCGTCCTTCAGGGAGGTGCTTCCGGGGCTCCTTCAAATTACTAACCACCCGGAACAAAATCTTTACAAAACTAACCACCTTTTTTTTCACTTCACAAAACTAACCACCCTAATTCATAATCATCCAGAGGCGAACACCACACAAAATATTTTTGCAGGAGGCCCTTCCCAGGGGCGAACAACAAAGAATTTTCCTTATATGTTCGCCCCCCCCCCACGGGCGAACATAGTAGGGAAATTTTTTGTTCGTTTGCTCAAAAATTCTTCACTTTTCAGTTCGTTTATTTAATTTATAAAAAATTCAAAAAAAGGGAAAATTGTGATAATTTATATTATTATATTTTATAATATTATATTATATAATGATATAATATTACAAAATTATTTTATATTAAAATATAATATTTTAATATTTAAGTTCATATTTAAGCTCATAAAAGATAAATAATATTGTTATTGTTTTATTTTTGTTAATCCGAAAACGTCATGTAATATCTTGTCCCGAATGCATTTGATCAAACACAGCACTTTTATTCATAGAAGATATTAAAACAACGATAACACGACTTAAATTGAAAAGCAGAAAACAATCACGACGAAACTACAGACCACTTAATCGTCCTCGGACGACATTACACTATCAGAATAATAATCCGGAGTGGTGACCAATGCAAGGTATTGTTGTTCCTTAAACCGGTCCCCTTCTTCCCGAAACATCCTAGCATCATCGTATAGACTATGACGATGCAGTCGCAGATTCATGCGATTCTCCTCTTCTCTCGCTCTGAGAGGGCGGCCGTCCACGCTGCTGCGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCCCGAAAGGACGGGTCCTGGGTGAAGTGGGGGAGGTGTGTGATCCTCTAAGAATGACATGTCAGGACGATATACATATGACTCTGACAAGTGATCCTGTGACGGACCCTCATCGTCCTGTGCCTCATCATCCCCTAATCTGCTCCTTTGGGGCCATGGAACCCCCTCAGATGTAGAAGGCTGAATGAATGGAGACCAACCACCAGCCTCAAAAGTACCTGCTCCATCATGACCTGCAGAATGTGAGGTGCCTGCAAGGTGTGAGCTACCCACATGGGTGTAGTAAGTGCCCTCTTCGGGCACTACCGGTGTGACTGGTGGTCGTCCCCTACGCCCTGCAGGAGCCCGTGCCCTAGGTCTGGCAGGGGCCTGTTCCGTAGGTCGACGCTGTACACGAGTAACCATATCCTGTAAAATATGGTTTGCCAGACCCAAATCAGGAGCATAAGGGTCAATGGCACGCTGCATAGCGGATAACTGCTCCTCCTGTTTACAAACATGTATATTTAAGTCAGAACAGTGTACAAAACAAGCTGAGAACATGTATATTTAAGCATGTATATTTAAGCATGTATATTTAAACATGTATATTTAAGCTGTATATTTACCAGTTCCGGTGTCGAGAGCTGTGTTCCCTGGAAGGCACCCTCCTGCTGTGGCCAGTGTAAGGGGTTAATGATGATTCGACGTGTGACCCTGTGGAACCATGGCAGGTATGAGGCAGTGCAACCCTCGCCATGCATAAGTGGAGGAGATGCGAGGGCACGCTCCATGCGCGAATCCCAAAGATCAACAAATGGCTCCCTCGCGTACATCCAATCAACCTGCTCGTTGTAGTGGTCGTGCGATTTGCAAAAATAAAAACTGCAAATAAAAGTACATTTGATAAGTTCGAGGTCTTTAATATTCTCAATCCTGAGTTATGTCGACATAATAGTCGGAATCATAATCTTCATCATCATCTTCAGCATCAGCGGCCACCGAGGTATGCTTTTCATAGGTAAATCAGCATATGGCCTCCATCGAAACTGTCGGGGTGTCAACGCATCCAACTCATATTGTGTCATGCGGCTCTGCGCATGCGGCACCTGACAACGCCTAAGTGGCGCCTTCCACCTACAGTGGAAGTTGGCATAAGTGCTCAGAGGTTATACATGCAACAAATATGAATTGAAGTTAATCAACAAAAGGAGTGACAACATACCTCAGCGCCAGCGGGTACTCGAACAAGGGTTGACCCCTGTGCCTAGGCGCTAGTGACGGAAAGCGCTCGTAAATCCACACCTAGCGGCAAGGTTAGTACAAGTGCACATGATGAATAAATAATACAACAATAAAGACGAGAAATAAATATTACTTAATTTTAAATTCGAAATAATTATCTCTAACTATTTTTACAAATCTGATTTTTTTAATTTAAACTAGTAATCTAAACTAAAATTAGCACTACCACTACTAATCAACAACAATCATCACCAACTACTAATCTATTTAATTTAATGGTGTCAAGTTTACTTTTAAATTCGATTTAATTTAATTTCATTAAATTCAATAAAAGCTAAAATTAAATTGATTACTGATGATTAGGGTAGGGAGAGGAATATGGTACACCCTGCATAAAACCAAACTGCCTCGTCACCCTGTCCGTGTAGCACCACTCGACGTAGGACATGTACATCATGGGGGCGGGAGCCGTCCAACGCAAGTACACAGTGGCCTCCGGGTGATGCTCTGCAGGTAAATCAGCATATGGCCTCCATCGAAACTGTCGGGGTGTCAACGCATCCAACTCATATTGTGTCATGCGGCTCTGCGCATGCGGCACCTGACAACGCCTAAGTGGCGCCTTCCACCTACAGTGGAAGTTGGCATAAGTGCTCAGAGGTTATACATGCAACAAATATGAATTGAAGTTAATCAACAAAAGGAGTGACAACATACCTCAGCGCCAGCGGGTACTCGAACAAGGGTTGACCCCTGTGCCTAGGCGCTAGTGACGGAAAGCGCTCATAAATCCACACCTAGCGGCAAGGTTAGTACAAGTGCACATGATGAATAAATAATACAACAATAAAGACGAGAAATAAATATTACTTAATTTTAAATTCGAAATAATTATCTCTAACTATTTTTACAAATCTGATTTTTTTAATTTAAACTAGTAATCTAAACTAAAATTAGCACTACCACTACTAATCAACAACAATCATCACCAACTACTAATCTATTTAATTTAATGGTGTCAAGTTTACTTTTAAATTCGATTTAATTTAATTTCATTAAATTCAATAAAAGCTAAAATTAAATTGATTATATTTAATCTACTCTTAACGTAAATAATACAACAATCATCACCAACTACTAATCTATTTAATTTAATGGTGTCAAGTTTACTTTTAAATTCGATTTAATTTAATTTCATTAAATTCAATAAAAGCTAAAATTAAATTGATTATATTTAATCTACTCTTAACGTAAATAATACAATAATCATCACCAACTACTAATCTAAACTAAAATTATCACTACCACTACTAATCAACAACAATCATCACCAACTACTAATCTAAACTAAAATTATCACTAACATAAGCTACTACCAAATACCAACTAACAAAACCCATTATAAATTATCAAACAAATTACTAATCAAGTCTAATTTTTAATTCATTCAAAATATGAGATCTACACTAATTTTCCCAATTTTATAATTCGAAAAAATTGTACTATATTTAGGATTTTTTTATGCAATATTTGTTATTAAATTCGAAAATTATTTTAATTAAATCAAATAATTAAAACGCTAGTGACGGAAAGCGCTCGTAAATCCACACCTAGCGGCAAGGTTAGTACAAGTGCAAATGATGAATAAATAATGCAACAATAAAGACGAGAAAGAAAGTTGTGGTTGGTTTAGTATTACCTGTACCAATGTGGCGTAGCCACAGAAATCAGTACAGTTAGCCCTGCTAGAAGAACATAGCTTCTGGTATAGGAAGCCAAGAACAGCACTACCCCAGCTATACCGACGCAGCTGGTCCATGTCCCTCATTAACCATAGAAGGTCAAGCTGCACGCGGTTCCCGCTGCTGTGGGGGAACAATGATCCAATAACGCATAGTAGGTGCGCCCGAATATGGTAGGTAACCTGTACACCATAACCTATATCCTCTGGATCCAACTGCTCCAACCGCTCACAAGACCCGAAGTTATCCACAAGCCATTTGATCTTTAAACCACCTCGGTTAACATCGTCCTTGGCTTCTGGTAATAGCCCAAGAAATTCGCCTACTAGCACGCGCCTTTCCTCCACGCTGGTACTCGCTCCACGGAGGATCAGTGGATCCACCCTCAGGTACGGGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATTCCAAAATCGAAATAATTCAAATTAAATTCGAAAATGTGAGATTGCTTATTTTTATTCTATTTTTTAACGTAAAACACCCAAATTTAATCTACTAACCTAATTTCTAAATTTAATCTACTAACCTAATTTCTAAAATTAACATAATCTACTAACAAATACCAACTAACAACATTCATTATAAATCATCATACAAAATTACTAATCAAGCTTGTCATATAATTTGTAGCTACTAGCAACTAAGAACAATCATTATAAAATTTATAAAAATACATGCATGCAATTTGATGAGATTGAGAATGGTGGAAAAACCTTGAAAATGGGTGAAATTGATTAATTTGATCCGGTGAAAGTAGCAAAGCAAGCTCCTTTTTCCCCCCTTTTCTCTGTCCGGATCACCCTTTCTTCTAGAAATTGAAGCTTGCAATGTGTGAAAATCTGAGAAGAAGCTGTTTGCTGCGGCGAAGATGAAGAAGAAACAAAGGGGTTGGGGTTTTGAGGGGTAAAAGGGACACGTGGCCGCCCCTGACTGGGCCGGACACGTCAATGCTTCACAGGTATGTTCGCCCGTGGCAGGGGCGAACACACTTGCCTGGAGTTCTTCTGTTCGCCCGTAGCAAGATCTGGGCTTAAAAAAAAATTTCAGCTGTGTTCGCCCGAGGGGTGTATGAATTAGGGTGGTTAGAAATGTGAAGTGAAAAAAAAGGTGGTTATATTTGTAAAGCTTTTGTTCAAGGTGCCTAGTAATGTGAAGGAGCCGTGCTTCCGGTGTCTCCCAATTCCTCATCCCTTCTCCCGTTACAGATTAGGCATGGAGGCGGAATCGATAGCCAAGACAACAACTGAATTAGCTACTTCCGGAAATGGCTACCTGGCTCACCCAATTGCATATCTCCCACTGGATATGAAAGCACCAGTAACTGAATTTCATGAATTCAAATCTAGAGAAGAGGCTTATCAAAAGCTGGAAGGGCTAGTCACCGATTCTAGTTCTTCAATCCTTGGGATATACGGAATTCCAGGAACAGGAAAGACTCGATTAATGGAGCGAATCACGACAGAAGTTGGTAAGAAGGGAACCTTTGACAAGGTCGTACGAGCCAATGTGAGGAACGCGAAGTTGGATGTGATAGGCATACAACAACAGCTTGCAGGGAAGCTAGGTTGCGACTTTGAATCTGAAACTGATGTGGAACGTAGAGCTGGTCAGCTGAGATCTAGTTTAAGGCAGGGAGGTAAGGTACTCGTCATACTAGACGACCTATGGAGTGAAATTCCTTTAGATAGAATCGGAATTTTGTCTGAAGATGGTATGAGTTCCAAGGGCGGTAAGATTCTGTTGACATCACGAAGTGAGGAGGTATGCAAGAGCAACAAATGCAAGCATCCAGTCAAAATACAACCTCTTACATTTCCCGAAACTTGGGATATGTTCAGCAAAACAGTTGGTGCTGATACAATCAACTCTTTGCAGAATAGATCCCTTGCCTAGGACATCTGTAAGAGATGCGGGGGTTTACCACTAGTCGTTCTTGCTATAGGTAAAGCGCTCAAATTTAAGCGTCTTGCTTCATGGATGGATGCACTCAATCAACTTAAAAATTCCAATATTGAAGAAGTTCCTGGAATAGGTAAAGAAGAGTATGCGTGTTTAGAGTTGAGTTTTGATAACTTGGAGCACGACGATGCAAAGAAATGTCTCTTGTTGGCTTCTATGTGCCCTGAAGATGCTGACATTCCTACGAGGATGGTGGTTCAGTTAGCAAGAGGCTCCCAGCTTGTGAAGGGTGATGAAATAAAATTAAGAGTACATTCAATGATATCTATACTGCAGTCAGCCTCGTTGTCGCTTCAAGGGAAGGATGGTGATCATATCAAACTACATGACATCATAAGGGACATGGCAAGATCCATTGCCAAGAAACACCACGGATTCTTATTCGCAAGAAGTAGGTCGTTGCCCAATGATTCAGCTGAGTACTCTGGTCTGAAAGTTCTGCATTTAGATGTAGAGGAGACTCATTCACGTTTTCCAAGTGATGTGGAGTGCCCAGACCTGCATCTACACTGTCACTACATTCATCATCATCTACATATATTGACCCAACACCGATGCAGGTATTCATAGACTGTTTTACATATTCACTCAATTGATGATAACTATGATGATTAGTGTTATAGAACGTAAATTGGGACCTTGTAGCACTTTTAAGCGGTTGAGTGAACGTTTAAGTAGAATTTTGAGGCGCTCAATAGCGGATCAATAATATATAATTAAATATTTAATTGCAATATTAATTTAGTTAAAACTAAAGTTATCTATTGGTTAGAATTTAAATTTATAATATTTTTTATAATATATATATATATATATTTTTAATTTTTAATATGACTATAGTTATATTGTAAAAATTATTTTAAAATTAAAAAATTAACAAGTCAACATCATTTTGACCGCTTAATGATCGTTTAATCAATTTATTGTCCGCTTAATTTTCAAAACCACGTAATCACTTTCATACAAAAAATTAGGCGGCCTCTTAATGTGACACAACTGACGATAAAATAAAAATAAATGATTTTTACGGTTCATCAATCAATGCTATCGTCTAGTAATATTAGCTGTATCAATATTTTATAATTGTTATAATATAATTATATATAATTTTACTAAAATATAATATAAACAATAAGTTATAAATCAAGTCATGTTTTAGTGGAATTGTATAATATCAAAAATTAAATATATTTTTGAGTGTATAATTTTAAATATGAACTAAAAATAAAATAATATGTGATACATAATATTTGAATCGGTTTAGTTGTTTATATTAAAAAATTTATTTATTTTAATCATGATCAATTATCAGGTTAAATAATATATATCTGCTACTTAATATATCAATAAAATTAATTTTATACAAAAAAATAATTATTGAAAAAGTATTTCAGTTAAAGAAAAGATTTTATCTTGTACAAATCCCTCTAAATTAAGTTACATACGAACTAAACACAAAATATTAAATCTTGTAATATTTATTTATAAAATATTAAAGTTATAAATAAAGAGTGCCAGTTAATATTTATTTATAAAATATTAAAGTTATAAACCGTATAGAATTGATTGGGACGGAGGGAGTATGAATTAGACTTGTTCATTGAATGACCGTTCAAGGATTAATCAAATAATTGAATCATTAATCAGAACTAATTAAATATTATTTATAAAATTATATATAATTTGGAAGTTAAAATTTAATAAAATAACTTAAATTTATATAGGATAAGTTTTTTTTATTATATATACAATTATCATCAAGAAAATTGACCAAAAATAAAAAAAATTTAACAAAATCATATATGTATATTTAAGCTTATTTAAATTAAATTAATTTTAAAATTTCAATTTTTTATTTATAATTGATCAACTTTTGATCAATCAGATTTTTTAAAAATTATTTTTCGACACGATTACTCAATTCAATCAAGACAGAATCGGTCAATTAAACATCAACTCTAGAAGTTTAAAGGAACGCCTCCAACACACAACTATATTTTCCACATTCACTTTTATGATTTTTTTTATATGTCACTTTTGACTTGTGTATCTAGGTGTATTGACTTGATAGTAAAAAATTATTATTTTTAATTGATTCTTTTTTGAATTAAAATTTTGATTACGTATTTTTTTTCAAAAAAGAAAATTTCAAAAATAATATTTTTAATTCTCCGGTCAAAATACTTAAAAGTGTGTGCTAAAAAATTAAACGTCATATATTAAAAAACATAGGGAGTATATTCATAATGTGTTGTTCAAACGATATTCATCCTCGTCCTTTTTATAAGTCACTTGGACTTTTTACACATAATTTTATATTTTTACCACTTATTTAAAATTATCTTTTCTAATTTTTTTCTTAATTAAAATATGAAACTTATACTTTTATTAAAAAAATTAAAAAATATTAATTCGAAGTATGTGGTCAAAATCAAAAAAGAAAAGAAGTCAAAGTGACTTATATATAAAATTAGGAGGAGTACATGTAAATAAAAAAAAAATAAAAATCACAATTCTTTACAAAAATTTCAGGAATGGATTGGTCAAGGTCAGCAGCTATTTGCAAATCTCAGGTTCTTGGTGCTTGTGGAGTTTAGTTGGCCGGAGAAGTTCTCTCTTGAATCCTTAGACAATCTTAAAACTCTTTGGTTCATCACATGTGACCTTGTCCATTTTGGGAAGAGCGAAGTTGGATTGCTTCCGAAAAAAACTAGAAAATCTTTGTTTTTGGGATTGTGATTTTTCAAAAGAGCTGAATTTAGCAAAACTAAATCATCTTCGCAAGTTAGAGATCTATATCAACACGAGACCTTGGTTGTGGGAAGATAAAATCATTGTGAAGCAGAATACAATATCAAGACTATCCGATCTAGAAGAATTAAGTTTCCCACTGAATTCTACATCCGTGAAGAATGTGCAGAAGATGGATCATTGCCGATATTAGACGAGGTCTGTAAATTGTCACGCTTGACAAGTTTAAATATTTGTTCCCGAGAATCCAAGTCAGGTAAACTTGCAACTATATTTTGCAACTTACGTGAATTCCATTTGTTTGTTGGTAAAAGACCAGATTTTTGGTCTCCGGGAGTGTCTTCGAGGACCAATTCAATTACATTGTCCAACCACGATCTCATAGAACACTACAAGCCTCTGTTTGAAAAGGCTGAAGAGGTGATATTGTGTGGTACTAACTTCACAGGGAGTAGCATTGATATTAGAGACACTAAAGAATTTATCAACTTGAAGTACATGAAGATTCAGGATTGCCGGTTCATTGAGTATTTGGCTAGGATGTCACCGGGTAATAAGATTGGTGGAAGTCTTCCCCAGTCAATACCTTTTTCTAACCTTACCAAATTGAAAATCAATAATTGTCACAGCTTAAAATACCTCTTCTGCAACTCTGTTGCAAGATGTCTTAACAAAGTGCAAAAGCTCAAGATAGAGAATTGTCATATGATGGAAGAAGTCGTGCTCGGAGAAGGCACAAGTGATGGAAATATGAGTATGCCCGAATTACGAAAAATGACCTTAATTGATCTGCCAAGACTCATACATTTTTACAAGGATAACACTTTCTCCGGGCAAATTCAACCTCTCTTTAATCAAACGGTATGCTTGCTTAACCCTTAAATATGTTATAATTGTATTCAAGCGAAATTAGTAAATTATATTTTCAAATATTTAAGCTACATTTATTTCATTAAAAATAAATCATTTTGTTTACTTCATTGAGGCAATATATTTGTTTTCTAGGGATTAAAGTTCAAATTGTCCACCTCAAATATTAGTAATTGCCCATTCTTGATATTTATATAATTTTCATAAACATATGAAATCATTGGCTTAATTAACTTTCTACTAAGCTACATATGAAATATTAGTAATTGTAAATATTGTACAAAATTGGGATAGGGCCACTGTGTACAAAACATGTGAGAAAATATGATTCCCTCCCCTTCGAAAATATCTACTTTCTTATATAGACTAGTACTCTCTGCACAGAGATGAGTACTGGAGTATATACTCTCAGGAGTTATACTTATACATGGCACTTGGAGTGAGTTAGAAATAAGAACCGAACCAAATACCCCTTTCTCTGATGGTATGTTTTGGTTGACTATTTGAGCAGGTTGAATTCCCTTTATTGGAAGAGTTGGATATTAGTGGTCTGGAAGATATAACTGATATTTGGGGAGATAATAATGGCAATGCCTTCTCCTTTTTCGAGCTTAAGAAGTTGAATGTATGGAACTGTAATAAGCTTAAAAATGTGATCCCACCTGCCAAGTTGCCTAGTTCACTCACCTCTGAAGTTGACACTCTTGGAAGCAACACAGATTCGGTCGCTGGCAGAGCTTCTGAAGGACAAGTGAAGGCCATGAATTCTCATAATCCAAACAAAAAATTACAAATTTTTTTGAAGAAAACTGTGCTTGTGTCGAAATCTGTATGCAGGAGGACCCCGACGATAACAGAAGAAAATTTGAATGATCCCTCTGATATTTTAGTTCAAGTTCCGTCACAGAACACAAGGGTATGTCCATTGGTTGAAATGAGTTTACAGAAATTGCCTTGTTTGGAAAAGACAGGGTTGAACTTTGAGGATCCATCTGGAGTAGTGAGTACTTACCCATATCTTGAAAAATTAAATATATGTGAATGCAACAGATTGGAAAACGTGTTCATATCTTCTCGTGATGCAAATTTTAAGAATCTTGAGGACATGTCCGTCACTAATTGCATTATAATGAGAGAGATAATCGGGGCAGGTGACCAAAAAATTGCCAATGGCATTGTGTTCCCTAAGTTATGTTCTGTTAAACTAACGGAGTTGTTAAGTTTGACCAGTTTTTGGGGGTACCCGAGTGAAGAAGCTAACAGCCACAAGGTATATTTACATTTACTGCCAAATGAGTAACATTGATAACATGCATTTGTTTGTGTGCTTGAGTATATATATAAATGCTTAATTCTCTTATGTATGGCTGATAAAACGCGATATTCAGGACCTGATTTTCATGTATATATACTTAAAATCTTCATCTAGTTAGAGCTCCTGTTTGCTGTAAAAGTTTTTAGGTAAAGATTTTCTAAAGTTAGGCATATGCATTATCATAAAGAATGACATTGTTTTGTGTAGGTTGAATTCCCAAATTTGAAGAGTTTTGAACTCAGCTGTGGCAAAATTACTAGCTTGGAAATGATAGAGTTTGGCAGCAGAGATGGCTCTATTTTTCGGCTGGAGAAGTTAGATATAAGTTGTGATGAGGAGATACAAATTCCCAACCAATGGCTACCTCATTTGAATAATCTGGAAAGATTGTCACTGAGACGCTGTTGGTCAGATGAGCTGAAATCTCTACATTTCGCAAAATTGAAGGTGCTCTTACTTCAAGAACTTAGTTGCTCAACTATTTTCTCATTCCCAGACTTTGAAAGACTTCAACAGCTCCGAGGATTAGTGATAACAAAATGTAATTCATTGGAAGCTATTGTGGAGGTTGTTGAGGGTGAAGAAGCTTCTGACATGGATACGGAGACTGTTGCACTAGTTCAGCTGGAATCAGTCCATCTTGAGGGTTTGCCAAAACTCAAAAGTTTTATGCACACAAAGCCTAAGAATCTTATCCCCAGTTTAGAGCATGTGGAAGTGGAGCCCTCCATTCTTTTCATGTGCCCTGTCTTTGGAAATTTCCAACAGCTCAAAAGGTTACAAGTGATTGATTGCAGATTGTTGGAAGGCATTGTGGAGGTTGCAAGAGGCTATGAGACGGATGACAGGATTATCACATTCCCTAAACTCTCTGACATTCATCTTAGAGATTTGCCAAACCTCCAAAATTTCAGTCCCACTACAAGCTATAGTTTCAACATGCCCAAATTATTTCATTTTCATATGTTTCGTTGTCCCCGGGTTGAGAATAAACCCTTATTACAAATAATCGCACAACGGGTACTTGTTTATTCCGATGAGCATCCACAAGGGATTGTCATTCTAAACCTCAACGAGTACACAAGAAGAATAAAAAACCTCGAAAGCGTCGGGGAATCAAGTAACAGCCATCAGGATGTGGAGATGGAAACCATAACAGTTGCAGAAGAGGAAGACAGAGTTGTTGAACAAGAGGCAGAGGTAGTTGTTGTAGGAGAAGAAAGAGGAATAGAGGAAGATTCGTAATTCAATTGTTTTTCATCAACTCAGCTTTCTTTTCCTTTCTTTCTCAAATGTCTCAGACTGTGCATTGTTTTGTATTTGTTTTTCAAGGAAATCTGACGCTGAATTGTGAGATGTGAAAAGTGTCAAGCTCTTAGCTATTTGAATTACAAGATCAACAGACAGGCCTTGTCTTGGAGGTTCTTCGACTCAAGTAACACATTCTTCGTTACTACTTTATTCACATAAGTCATTACTTTTTTTATCTTTTGATAGCAACATATAAATCACTGGATAGGTTTGTCATTAGGTTAGGTTCTGCGTTTTTAACAGGTATGACAGATTTAACAGGTTAGGCTTATTTCCAGATTTCCTCCCTTGCAACTTTTTTAGGCCTCCCTGAAAAGTTACGGTCCGAAATGTGTACTTACTTACTTTGTTGATGTCTCGATATAAGAATCAAGAAAGTAAGGAACAGAAACTGAGCTCCGAAAAAATATTCAATGATGAATGCAAGACATTCTACTTTGCGGGTAAGGAAACGAATGCTAAACAATCTTGTGTCTGTGGAGAGAGTTCATCTCCAAGTGCTGATAATTTAACCGACTTAAAGATTGTAAGTCATATTTTCATTTCATACTGCTTTTTTTAAATTTGTTGTTTTCATAGAATTAACGACCTTTTTGAACTTCTAAAATTAACTAGAAGTGATAAATCTAAATGGATATCCTTGCATTCAACATTGGGAGAGTGATAATTAGTAATACCCGAGTGGATAAAATGCCTGAATTGTGTGTGTTTGTTGGCAGATAAACATGATTCTGAATGAAACACTTCGACTCTACCCACCAGATGTGATGCTAACGAGGGAGACGAATAGAACTGTAAAGCTAGGCAACCTCCAAATTCCAGCTGAAACGCAGCTCTATTTGCCTATGACTGCAATTCATCATGACACTGACATATGGGGAGCAGATGCAAAAGAGTTCAATCCTATATGTCCATGCTCCAAGGCAGTTGATGACCATGCAACCTCAATTTGGGGCACAAATACTTTTTACTAGAATTCCCTGAGTGAAGCCTATAAAACAGACCAGATTATTGTTTTCGACTAATACTTTTGTCTTGTAGAATATTATGACAGGTCAGCTCAATATGTATGTATAACACAATATGAGTGGCAACAAGCCTTCTAATTATATATTTCAAGATTTTTTAAAATGCGAGTTTGAACGGTCTTCTACCAAAGGCACAGGAAAAACGAACCTAAAAAGTCGATCTTCATTTATATTTTGACCATGTAATGTTGATCTTACAAACTTTGTCAGATCATGTGTTGTTGGATTGAGGTCTAGTACGGTGGTCATCACTAAAATTTACTTTAAAGAGAGATTTTAAAGAATTCATCTGTTCCCCAATGAACTCTGGAAAACCCCTGCCGGGATTCTGTTATATTTATTGTTGATGAACAAATCTTTGTTCTTTTGTACTTGAGGGTTAAATTTTATGCGGTGTTTTAGTATGATATCGGTCCTGGTTCTATGGAGTTGGCGGAAATTTCTTATCTTTTTGGATCTATAGGGACTCAGCGCTTGTTGGTGACACTCTTTATTCTATGGTCTGTGGAAGTTACTCACATTGAAGATGGAGGTATGAGATCAGTGTTAAATGGAGGTTGTTTGATACGGTTCGAATGCATAGAGAATAGGCCCATAAATGTCAACAAAAACAGTGACTCCACGTCCACGAGACGGAAGTTCCTGACTATGAAAAATTGATTTTTTTCCCTTTTTCTATAAATCTTTGTGAAGGTGGGGAATCTCTTTTTACTTAAAAAAATACGGTTGTTTTATGGTGGGCACACACTAAACACTAATTTTTATGATTTTGGTGCATTCTTATTGGTCATGTAATCATAAATATGAATGCCTCCTACATTTACACCAAATCCACCAATTAAAATCCACTAAACTCATCAAATTTAGTGCTTAATGTGTGCTCTTGGACACACACTAGAAAGATCCCAAAAAAATATACTCCCTCCGTCTCGTTAAACTTTTCCTGTTTCAAATGTTGGGACTGTTCATAACATGAGACAAATTATTAATTTACGTCTAATCTATAAGACTAAATATAGTCATGAGTGATCTTGTTGGATTCGTATTTACGAGTACTTTAATACAGTGAAATTTTTATATTTAATGCTAATACGAAATTAAAGATATTAACGATTAAAAATGTGCGTTGGCAAACGTGTCCGGTCAAAACAGGAAAAGTATTTAGAGACGGAGGGAGTACAAAGTTGGTTTGGATGTTTGGCGATACCGCCGCGAAGCACGACCTTGACAATTAGTTTATTATAACATAAAGATTCTAATATTATTATAGAAATGATACTCCAATGCTAAATATGCTTTTCATCTTATAAACACTATAAATTATTAATCCTTTTTAATTTATAGTAAAGTAGCTGTATAATGTATAAAATAATTACTAATGATTCGAAAGGCACTAATAATTCTAAAGGCGCCCGCCATAGTTGAACTGCCCACTTTAGTCCAGAGAGCATTCAACAAACAATACACCAATGCATTGAATAAACTCAGCCGGCTGATTCCTTTTTCTTAACCTTTAGAATTATTAGTGGTTTTTGAATCATTAGTAATTATTTTATAAAAGACACCCACCCACTAATGACCAATCAAATACAAAAGACGCCAACTAATCTTCCACTAATGTCAGTTTACCAACCCGGGAGCATCTTCTGCTTATTTCCTGTCATCTAAAAAAAAAAAATATTTTCATAATTCTAAAATATAAAAACTAGGAATTAATGATCAGAACAATTATATTGAATAATTATTTAGTTTTACGAAGTTTCCTATCAGTCTAATCGCAATCTCCTTCCCTTGATAACTGTTATCGTCTCCCATTATCATTAACTTCAGCCTAGAAACTGGAAAATAAAATATTAATGATTATTCAATTCTATTCCAGCCTCTATCCTAATTTTACATACAGATTTTATAGTGTGTGCTGAGCACATATTAAAATCCACTTTTTAATTAGGTGTTGTATATTGACTCGCATCCCTTTAACAATGATGGTCATCTTCCTCTTAATTAAAAAGTGTACCGACCCTTTTCCATACTCCTTCCGTCCTATTTGATTGTATACAGTTTCTTTTTTGGATGTCCCATCAATTGTATACATTCCAAAAATGGTAAATTTTTATAATATAAAAAACTTAACTACACTCACTGCCTTCTTCCACTACACCCGCTTTATACATTAAAAATTAGTAGGTTCCACCATTTTACTAACCCTACACTTATTTTACACATTAAATATTAATGGGTCCCACTATTTCATCCACTTTTCTTACTTTCGTGCCACTTCCCATACGTATACTAATTACTGGGACGGAGGGAGTATAACTCTTGTTAATAAGCCAGGCATACGCAAGGGTCATACGTACCTAACCTTGCTATCTACTCCAATATTCTCAGTCTAAAGACTCCAAACGGAACCTTTCAAACATAAACTGTTACATACAGATATAATATATATTTGATCATAGTTAAAAATTCTAAACGCTACTGGTGAGTGGTGATTGGAGAACTTGTACGATAAATACTGCACACTAAGGGAGAATTCTGAAATTCTTTTTCCCACTCATCTTATTGTCTGATCATCAACTCGCTTCTAGCTTTCCTCGCTATATTATTGCCGCCCAGCTCTTTTCTACTTCTCTCTTGTTAGTCATTGTTGAAGTTTAAGCAATTTCATCAGCATCTTTCCTCTCTTTTCACCATAAAAAAAATTTGAAAAAATCATGATAGATCTGAATTCCATTCCATTTGTAGGACCGTTGGTAGCTAAAATTTCCGACAAGACAATAGAAGCACTGTTCCGACATGTAGAATATATGTTCCGTTACAAGGGTCTTGTTAAGGATCTGAAATCTGAAAATGATAAACTTCTGGCTGAGGAGACGAAGATGTCCAGAAAAGCTGAGCAAGAAAGTAACAATGGTAGAATACTGGAGAAGTATGTGGTGGAGTGGCAGAAAGAAGTCCAAGAAGAGCAGGAGAAAGTCACGAGGTGTTTGCAAGAAAATGAGAAGCTAAAGAGCCAACAGCAAAACTGTCCTCGCTACATCCGCTATATCCCACTTCCTCATCCCATCTCTCGTTATAGATTAGGCAAGGAGGCGGCCAAGGTGGCCAAGAGCACAACTGAGCTTACTGCAACCGGAAGTCACCACCTGGCAAGTCAAATTGCATATCTTCCTCTGGATATGAATGTACCTGTAACTGCATTTCAAGAGTTCAAATCTAGAGAAAAGGCTTATGAAAAGCTGGAGGAGCTAGTGACAGATGGAAGCTCTTCAATCCTTGGGATATATGGAATTGGAGGAGCCGGGAAGACTCGATTAATGGAGCGAATCACCACAGAAGCTGGTAAGAAGGGAACCTTTAACAAGGTCGTCCGAGCCAATGTGGGGAATGAGAAATTGGAGAACAAGACCATCATAAGCATACAAAACCAGATTGCAGGTAATTTAGGTTGCGTTTTTGAACGTCAAGATGATGTGGGACATAGAGCTGGTCAGCTGAGATCTAGTTTAAAGCAGGGGGGTAAGATACTCATCATCTTAGATGATGTATGGAGTAGGATACCTTTAGGTACTATCGGAATCATGTCTGCAGATGGTATGAGTTCCAAAGGAGGTAAGATTCTTTTGACGACACGAGATCACGAGGTATGCCAGCGTAACGACTGCGGGGATCTAGTCAAAGTAGAACCTCTTACACCTGCCGAAGCTTGGGATATGTTCAGTGAAACAGTTGGTGCTAAGATAATCGACTCTCTGCAGAATATATCCGTTGCCGAAGACATCTGTAAGAGATGCGGGGGTTTACCACTAGTCATTCTTGCTGTAGGTAACGCCCTCAAATTTAAGCCTCTTGATTCATGGAAGGATGCACGCAATCAACTTAAATTTTTCAAAATTCAAGAACTTCCTGGAATAAGCAAAGACGTGTATGCGTGTTTAAAGTGGAGTTTTGATAACTTGGTGGACGATGCGAAGGCATGTCTCTTGTTGGCTTCTATATTCCCTGAAGATGCTCACATTTATGTTAGCGAGTTGGTTGAGTTAGCAAGAGGCTCCCAGCTTATAAAGGCTGATGATATAAGAACAAGAGTATATTCAATGATTTATATTCTCAAGTCAGCCTCGTTGGTGCTTCAAGTCCGTTGGGGTATTATTGAACGTATCAAACTACATGACATAATAAGGGACATGGCAAGATCCATTGCTACCAAAGACTACGCATTCTTATTCGCAACAAGTAGCTCGTTGCCCAAGCATCCTGCTGATTACTCCGGTCTGAAAGTTCTGCATATAGATGTCGAGGAGGAGACTAGTCTACGTTTTCCAAGTAATGTAAAGTGCCCAGAACTGCATACACTGTCGCTATATTCATCATCATGGACATCATCATGGAAAACACCACGTACACTGATACAGCAGGTATTCAAAAACTGTTTTACATATTCGCTCAATTTTTGATTTATGATAACTATATATCTGATGATAGAATAAAAATAAGTGATTTGACGACAGATAAGTTTAAACGATATGAATTGTTATGAAACAGGATTTATGAGTCACATTTCATTAATTAATGCTATCGTCTAATATAAGCGTTATTTAACTTTTATAATTATTATATTATAATTGCTATAAAATTTTACTAAATTCTGATGTAAATAATAAATTAAATATTGAGTCATACATTAATCAAGATTGTGGAATTGTATAATATCAAAAATTAATTATATTTTAGGTGTCTAATTTTTAATATAAATTAAATTAAGTAATATGTGATTTATAATACATGAACCCGATCCACTTGTTTATTCTAATGAAAAAATATTTATTTTGATCTTGATTAATTAACGAGATAAATAAAAATATATACTAATTTAAATATATTAATTAAATTAATTTTTTTATTTATGCTAAAAGATTAATTATTTAAAAAGTATTCCAGTTAAAGGGAAAATTTTATTCTTGTACAAATACCTTTAAAATAAAGTTACATATGAACTAAATACAAAATATTAAAGTCTATAATATATATTTAAAATATGAAAATTATAAGTAAATATTAAAAATTTGTACAGGGAAATACTCAGTTTAAAAGGAAGGCCTCCAACAATTGACAAAGGCCAGGTATTTTGGACATTCTCAAACATACTCGTATGATGTTTTTTGAACAAAAAGAACAATCTTATAATAACATATTATTAGACAGTGTTATTTGATTTGAAAATTATATATGATTGAATTTTTGGAATGATATATATTTAATATCCCGTGAAAACTTCTCACTGTTAATATTGTTGTACTGATTTTTACAAAGATGACTTATAATACATATCATAAAAAAGTTTAGTTTGATAACTAAAAAATTTATGAATTTTTTATAGTCTTCTACTATAAATTTGAAATCTTTTATATTTATTTTCGATTATCGGATAACTCTCTCTCGTAGGCTTTTGTTTATCAATGTTTCTAGATTTCTTAATCATTCTCTCACAGTAGTATGGATCGATGATTATGTATTTTATATGTATTATAGTTTTAAAAATTTTGTTTAGCCAAATCTTTAATTTATCCTCAGTTTTCATGGTACCTCTGTGCATGAGGTATTTACCTCAAAACAAATTTGATTAAAAATAGATCTAATTTTATTGTTTGGTTCAAATAGGTATTTTAAATTGTTTATTTTGCATATAGCTAAGTTTAGAGTGTTGTTTATAATTGGGTGCCGGCCCACTCTAAATTTATTTATATTATACATATTCTACATCCTCTTTTATATCAAATTGTGCATGTCTTTTATTATTTCAATTCACCAACTATCGGATAATTTAATACAAAGTAGATGTAAGGGAATGCATAAATCACCACCCTTGTTATTTTTATAAGAAAATAATACAAAAAATAAATATGATTACTCTAATGTTAAATTTGAAGAACATGTACGAGTTCTTTAAAATTTAGTTGTTGTATTTAAGAGCATTCACATCCGGACCCAACCCTCAATCCCAAAAATTTACTAAAAATATTAATTCCTCAAAAAAATTACAAATTTTTAAAAGTTTCTTACATCCCATTCCCTATATTCAATCCCTATTCTCATAGAAGTATAAGATAAGAATTGATATTTAATAAAATTATAATGAAATGATAATGAAATGGAGGATGAATAATGTATGAGGTACAAATAGTGAAACTCCAAATATGGGGATTTATTTCTAGTCCCAAAACCAAACCTTATTTTGGGATCTGAATGTAGACTACGTTTTTACAAAAAATAGTAGATTTCTTTAAAATAAATTATGGAGATGCGGTTGGCTTTGGGGGTTAGGGATGTGAATGCTTGATATGATTGATCCAAAATTTTGTTGTGGAATAATTGATATGGTTGATCCAAAATTTAGTTTTGGAATGATTGATATGATGATTGCTCCAAAATTTAGTTTTGAAAAAATTAGTACTATTGATTTAAAATTTAGATATTAGCTTTAATTGATTAAAAATGAATTAAATTTAACCGGAAGTTAGTTAAACTCAATAAAAGACAAGATCCAACCAATAAATTTGATTGGTCTAAAATTTAATTATGATAGTTTAAAATTATTTCAAAAATGGGTCTAAAATTTAGGTGTGAAGATTAAAAATAAATCAAAATTCACGGTTATATATCTCAAAAGATGAAGACTTAACATTATTGATCTAAATTTAACCGTCATATCAAATTATCTCAAAAATCACTAATCGGTTAAGTCAATGATTCAGGAGACTCGTGTCTTTGTAATTATCTTCCTATAATTTTGATATGAATAAAATGATTATTTATTCTTTTTTTAAGCAACATATACAACACATAACACATTTCATCCTTATTATTGGTTAGCTTCCTGAAAAAGCGAATCAGCGTGATCTTTGCAAATATGATAACTACACAGTTATAATATTTGTTCGTAAAATTTATACCTTTAAACATTTGATTAGACGTATATGTGAGGTAGAGTTACCTATCAATCCTTATATTTGTTCCCATATTATTATTTTAATAATAAATTTGAGAGACAAAATAGAAAATAGACAAAGACCAAGAAAGAAGAGGAGAGATGAATTTTTTATTCATAAATATTAAATATGTAATGACCAATAATTATTTAAAAATAGATAATGGATACCGTATCTAAATATGAGTTTAAGAACTTATTTAACTAATCTATTGGACTCTTTAAGATCTCATCCTCTTCTGTAAGGCCATAAGTAGTCATATTTGTCAAAGAAAATAAAAAAGCTGTTATTTTGAAAATTCTAATTATGTCTGCACTTGATGCATGTTATATGCTGGTGAAATAAAACACAAAAAATAACGATTCTTGCTTAAATTTCAGGACTGGATCAACGGTAAAATATTTACAAATCTCATATTTCTGGTGCTTGTGGGGTTTTCCTGGCCAAAGAAATTGTCTCTCAAATCATTGGGTGAACTTAAAACGCTTTGGTTCGACAATTGTGACCTAGAGTTCTTTGGTGAGACGGATGTTAAAATTCTTCCAGAGGGACTGGAAAATCTTTGTATTTGGGGGTCTCGTATGCCAAAACAGTTGAATGTACCAGAACTGAGCCATCTTCGAAAGCTAGACATCTATTCCAGTTCCGGAGGTAGATTATGTATGGTGCCAAATACCATATCAAGACTATCCACTTTAGAAGAATTACGTTTGCCATCTAATTTCTACATCAATGAAGAATGTGCAGAAGGTGGATCATTGTCGGTATTGGACGAGATTAGTGAATTGCCACTGACAAGTTTACATATTCGTTCCCGAGTATCCAAGTCAAGTAAACTTGCAACTATGTTTTCCAACTTACGTGAATTCCATTTGTTTGTTGGTGAGCCGCCGGCTAATAATCGGTCTATGAATCTGTCACCTGTTTCAGTGACGAAGTCAATTAAGTTGGTCAACCACGATCTTGTAGAGGGCTACCAGACTCTATTTCAGAAGGCTGAAGAGGTGATATTGTATGAGACTGATTTCCCAGGGAGTAGCATTGGGATCAGAGACACTAAAGAATTTATCAACTTAAGGTACATGCAAATTGAAAATTGCAAGGCCATGGAGTATCTAGCAAGGATTTCATCACCACAGGGTGAGATTCAGGAAAGTCTTCAGCGATCAACACCTTTTTCTAACCTGATCAAATTGGAAATTAAGTGTTGTCTCAGCCTAAAATACCTCTTCTGCGACTCTATTGCAAGATGTCTCCTCCTACTGGAAGAGCTCCACATAAGGGACTGTCCTTTAATGGAAGAAGTTGTACGTGAGGAGGGCAAAAGTGATGGAAATATCATTAACATGTCCAAATTACGAAAAATGAGCTTAATTAAATTGCCAAGACTCGTACATTTTTACAAGGACAAGATTCCCTATGCGCAAATTCAACCTCTGTTTGACAGAATGGTATGCTTTGCTTACCCCTCATCAATCATCATCATCATATTAATAATATTACTTACACTGTGTAATGATTTCAGGCAAAGTCAATAAACTATTTTGCACATAATTGATTCTTTTTGGTTACTTCTTTATGTCAATATATTTGTTTTAAGGGATTAAAGTTCGGAACTTGTAATCTTTACATTGTATCATGTACTCTCACAAGTAATAATGGCACTTGGAGTAAACTTTGGAAATAAGAACCTAAACAAACACCCTCGGAACTTGTAATCTTTACATTGTATCATGTACTCTCACAAGTAATAATGGCACTTGGAGTAAACTTTGGAAATAAGAACCTAAACAAACACCCGTCACGTATAAAAAAATATGTTTACGCTGTTCATGTAATATAATTTTAAGATTTTTAATACAGTAGTAACTTTTTATTACAAGTAGCACTTGGTTACAGTGTCCTTTCTGTTCTCTGATGGTATGCCTTTCACTGACTATTTGAGCAGGTTGCATTCCCTTCCTTGGAAATGTTGGATATCAGTGGTTTGGAAGACATAACTGACATTTGGGGAGATAATCATGACAATGCTTCCTCCTTTTCCCAACTGAAGACCCTGAAAGTAAAATTCTGTAATAAGCTTAAAAATGTGATCCCACCTGCCACGTTGCGTAGTTCACTCACCTCTGAAGTTGACACTCATGGAAGCCACACAGATTTGGTTACTGGCAGAGCTCCCGAAGGACTTGTGAAGGCCGTGGTTTCTCATAATCCATACAAAAAATTACAAATTTTTTTGAAGAAAACTGTACGTGCGTCGAGATCTGTATGCAGGAGGACCCCCACAATAACAGAAGAAAATTTGAATGATCCCTCTGATATTTCAGTTCAAGTTCCGTCCCAAAACACAAAGGTATGTCCATTGGTTCAAATGAGTCTAGAATGGTTGCCTTGTTTGGAAAAGACAGGGTTGAACTTTGAGGACCAATCCGGAGCAGTGAGTTTGTACCCGGATCTTAAAAAGTTAAATATAAATATATGCGAAAGATTGGAAAACGTGTCCATCATACCTTGTACCAACGGACATTTGATGAACCTTGAGGAAATGTCCGTGAGGCAATGCATTACGATGAGAGAGATAATTGGGGCAGGACCGGCAGGTAAACACAAAATGGCCAATGGCATTGTGTTCCATAAGTTGTGTTCTCTTCAACTAAGTGACTTGCCAAGTTTGACCAGTTTTTGGGGGGAGGCCAGTGGGGAAGCCAACAGCCACAAGGTATATTTATATTTAATTGCCAAATGAAAAAAATTTAAGATTCATAACATGCATCTGTTTTTTTTTTCGCGCGAGAGTGAGAGTATAGATCTATTATTGCTTTTATATCAAACTGACCACTCGTTTCGTCAAAATTTCTCACTTGACCCATCCATTTAATTTCAAACTCAAGCCACTATAAACCAAATACTATATATATTATTTTACCCACATTATTATTCATATTTCTTCACTTAATCATTTATCAAAAATCAAATGTTTGTTTTTTTTACCACAAAATCACTTCGAGTACTTTCATAATTGTCTCTAGTATATATCAAAATAATTTGGAAATTTTTAAAACAACATTACTATGTAGTTTAAAAAATATAAAGTTATAAATATATAATTATATGATCACCTTAGCTATGTTATTTTAAAAATTCCCAAATTATTTTGATAAATACTAGAGACAGTCATGAAAATACTCGAAGTTGTTTTGTAGTAAAAAAACAAACGATTGATTTTTGATAAATGATTAAGTGAAGAAATATGAATAATGATATGGGTAAAATGATATATATTTGGTTTATAATGACTTAAATGAGTCCGAAATTAAATGTGGGTCAAATGAGAAATTTTGACGAAATGAGTGGTCAGTTTGATATAAAACCCGATCTATTACTGTATCAATTTAACATTTCTGAGGTAAAGACGTTAAAGTGAGGAAGGCGCATTCACCGAGTCAGATTGACATAATGTATGGGATTGTTTTTTGTAGGTTGAATTCCCAAACTTGAAGAAGCTTCAACTCCGTTGTGGGGAAAATACTAGCTTACTGGAAATGATAGAGTCAGGCAGAGATGGTTCTACTTTTCAGCTGGAGAACTTAGCAATAAGCTGTGGTAAGGAGATACAAATTCCTAACCGATGGCTACTTCAATTAGATAATCTGGAAAGCTTGTCACTGGAACGCTGTTGGTCAGATGAGCTGAAATCTCTACGTTTCCAGAGATTGAATAAACTCACACTTGGTCAACTTAGTTGCTCTAGTATTTTCTCATTCCCAGACTTTGAAAGACTTCA
>URS0000AE3A4B tRNA from 1 species 
GCTCCGATCGTCTAGCCCGGTCCAGGACAATGGCCTTTCGAGCCATGAACACGGGTCCGAATCCCGTTCGGAGCA
>URS0001D9EE47 rRNA from 1 species 
AGCGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGAACCTTTCGGGCTTAGTGGCGGACGGGTGCGTAACACGTGGGAACGCGCCTGTAGGTTCGCAATACTTCAGGGAAACTTGTGCTAATACCGAATGTGCCCTTCGGGGGTAGGAGTTATCGCCTGTAGAGCGGCCCGCGACCGATTAGCTAGTTGGGTGGGGTAATGGCTCACCACGGCGTGGATCAGTAGCTGGTCTGAGAGAATGAGTAGCCACATTGGGACTGAGACACGGCCCACAATCCTACGGAAGGCAGGAGAGGGGGATCCAGCGCGATGGGGGACAGCCTGACGCAGCCATGCCGGGTGAATGATGAAGGTCTTAGGAAAATGAATTTCTTTAACCGGGGGCGATAATGACGGTACCCGGAGAAGAAGCACCGGCTAACTACGTG
>URS000212D443 rRNA from 1 species 
TCAAGTGAAGAAGCGCATACGGTGGATGCCTTGGCAGTCAGAGGCGATGAAAGACGTGGTAGCCTGCGAAAAGCTTCGGGGAGTCGGCAAACAGACTGTGATCCGGAGATGTCTGAATGGGGGAACCCAGCCATCATAAGATGGTTATCTTGTACTGAATACATAGGTGCAAGAGGCGAACCAGGGGAACTGAAACATCTAAGTACCCTGAGGAAAAGAAATCAACCGAGATTCCCTTAGTAGTGGCGAGCGAACGGGGACCAGCCCTTAAGTTGTATTGAGATTAGCGGAACGTTCTGGAAAGGACGGCCATAGTGGGTGATAGCCCTGTACGCGAAAATCCCTTTGCAATGAAATCGAGTAGGACGGGGCACGAGAAACCTTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTACTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCGCGGAGAGCGGAGTGAAATAGATCCTGAAACCGTATGCGTACAAGCAGTGGGAGCCCACTTTGTTGGGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATTTTCAGTGGCGAGCTTAACCGAATAGGGGAGGCGTAGCGAAAGCGAGTCTTAATAGGGCGTCTAGTCGCTGGGAATAGACCCGAAACCGGGCGATCTATCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTACCGTTGAAAAGTTAGCGGATGACCTGTGGATCGGAGTGAAAGGCTAATCAAGCTCGGAGATAGCTGGTTCTCCTCGAAAGCTATTTAGGTAGCGCCTCATGTATCACTGTAGGGGGTAGAGCACTGTTTCGGCTAGGGGGTCATCCCGACTTACCAAACCGATGCAAACTCCGAATACCTACAAGTGCCGAGCATGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGAAAAGGGAAACAACCCAGACCGTCAGCTAAGGTCCCAAAGTCATGGTTAAGTGGGAAACGATGTGGGAAGGCTTAGACAGCTAGGAGGTTGGCTTAGAAGCAGCCACCCTTTAAAGAAAGCGTAATAGCTCACTAGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTCAAACCATGCACCGAAGCTACGGGTATCATCTTTTGATGATGCGGTAGAGGAGCGTTCTGTAAGCCTGTGAAGGTGAGTTGAGAAGCTTGCTGGAGGTATCAGAAGTGCGAATGCTGACATGAGTAACGACAATGGGTGTGAAAAACACCCACGCCGAAAGACCAAGGTTTCCTGCGCAACGTTAATCGACGCAGGGTTAGTCGGTCCCTAAGGCGAGGCTGAAAAGCGTAGTCGATGGAAAACAGGTTAATATTCCTGTACTTCTGGTTATTGCGATGGAGGGACGGAGAAGGCTAGGCCAGCCTGGCGTTGGTTGTCCAGGTTTAAGGTGGTAGGCTGAGATCTTAGGTAAATCCGGGATCTTAAGGCCGAGAGCTGATGACGAGTGTTCTTTTAGAACATGAAGTGGTTGATGCCATGCTTCCAAGAAAAGCTTCTAAGCTTCAGGTAACCAGGAACCGTACCCCAAACCGACACAGGTGGTTGGGTAGAGAATACCAAGGCGCTTGAGAGAACTCGGGTGAAGGAACTAGGCAAAATGGCACCGTAACTTCGGGAGAAGGTGCGCCGGTGGAGGTGAAGCATTTACTGCGTAAGCCCCTGCCGGTCGAAGATACCAGGCCGCTGCGACTGTTTATTAAAAACACAGCACTCTGCAAACACGAAAGTGGACGTATAGGGTGTGACGCCTGCCCGGTGCCGGAAGGTTAATTGATGGGGTTAGCGCAAGCGAAGCTCTTGATCGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAACGATGGCGGCGCTGTCTCCACCCGAGACTCAGTGAAATTGAAATCGCTGTGAAGATGCAGTGTATCCGCGGCTAGACGGAAAGACCCCGTGAACCTTTACTATAGCTTTGCACTGGACTTTGAATTTGCTTGTGTAGGATAGGTGGGAGGCTTTGAAGCGTGGACGCCAGTCTGCGTGGAGCCAACCTTGAAATACCACCCTGGCAACTTTGAGGTTCTAACTCAGGTCCGTTATCCGGATCGAGGACAGTGTATGGTGGGTAGTTTGACTGGGGCGGTCTCCTCCTAAAGAGTAACGGAGGAGTACGAAGGTGCGCTCAGACCGGTCGGAAATCGGTCGTAGAGTATAAAGGCAAAAGCGCGCTTGACTGCGAGACAGACACGTCGAGCAGGTACGAAAGTAGGTCTTAGTGATCCGGTGGTTCTGTATGGAAGGGCCATCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATACCGCCCAAGAGTTCATATCGACGGCGGTGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGAAGCCGGTCCCAAGGGTATGGCTGTTCGCCATTTAAAGTGGTACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCCCTATCTGCCGTGGACGTTTGAGATTTGAGAGGGGCTGCTCCTAGTACGAGAGGACCGGAGTGGACGAACCTCTGGTGTTCCGGTTGTCACGCCAGTGGCATTGCCGGGTAGCTATGTTCGGAAAAGATAACCGCTGAAAGCATCTAAGCGGGAAACTTGCCTCAAGATGAGATCTCACTGGAACCTTGAGTTCCCTAAAGGGCCGTCGAAGACTACGACGTTGATAGGTTGGGTGTGTAAGCGCTGTGAGGCGTTGAGCTAACCAATACTAATTGCCCGTGAGGCTTGACCAT
>URS0001E7BB53 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCATGTCGAGCGAACGGACGAGAAGCTTGCTTTTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATTTTGAACCGCATGGTTCATAAGTGAAAGACGGTCTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACATATGTGTAAGTAACTGTGCACATCTTGGCGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS0001963736 lncRNA from 1 species 
GTCCAGCCTTCAGCCCGGTTCGGTTTCTAGGTTGGACCCAGGGCAACTCCAGCCGTTTCCAGACCCGGTTTCGGAAAAGAAATGATCAAATAAAGCCTCGAAAGCTCCTGAGGTAAAAGCCGCAGAGGATCTGAGCGGGACGGCCCAGCCCCTCCGGAGGCAGCGAGCGCGTGGAGGCGGTGGCTCCGGCTCAGGAAAGAGAGAAGCTAACAAGAAAAGCCACTCTTCTTGTTTCCATCTCCACAGTGGAAGAAATGCCCTCTTTTTTAGTTAAGAAAACAGAGAGTCAAAAGAAGATGGGAGACCTCTGCACACTCAATCAGGAAATTCCTGGAATACCAGACTGTTTCCATCAATGGTAGGTCATTGCTTTTATCAGCTTGTATTGCTGAAATGCAGTAAGCACTGATTACACAAGCACTAAATGCCAAGCAATGCTCATAAATCTTGGTAGGAACATGAGCTTTAGAGTTGAGGTCTCGGATTTTCTTTTTACCTTGGTACTGAGTCAAAAAGAAAGATTTTAGAATCAGGGTCTTCTTCCACCCCTAATAAAATGCTCTCTTCACTCTCTTTGTGGAGTATT
>URS00015412A1 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTATCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTTTGTCGAGTCTGTTGTGAAATCTCGAGGCTCAACCTCGGGTCTGCAGTGGGTACGGGCAGGCTGGAGTGCGGTAGGGGAGAGTGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGTTCGCTGGGCCGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS000242BE45 lncRNA from 1 species 
CTAGAGAAAAATCAGAAACAACGCCCTACTGTTCCTTCATCTTCCTCAGATTTCAACTCACCTCAACTCGCCCGAGTTCACTCAAATGGTCCCCTTCCCTCCACGTTATTTGATTCCCAACAGTTTTTGTTAGAAAGAATTCGAATATTCTCTCAAAATCGCACAATTTTGGGTACGAAAGAACGATTTGTTGGATGAATGGGAGCTGTGGATAGATGTAAGTCGATCCACGCCCTCCATTTGTCCCAAAATTGTTCAAAAAACTCGAAGATATTTGGATTTTTGGGCAGATTTTTGAGATTTTTTGAAGGCTATATATATGAGGTAAGTTCTATGTGCTAGGTTAGAGGGAGATCAGAGAAAAATCTTCAGAACTTAGCCGAGTAATTTTCTAGGGTTTTAGTTGTTATCGTCTTCAAGTCTACTTTTTCTTCAAAAATAAAACATACCAAAAAGAGCACAATGGTCTGAGTTCAATTTTTCTAGTCGAGTTTACTTTATTTTTTAGAGAAAAATAAAAAAAAAAATCACTGAGCACAGATATGTCTTAGTGCTTGTTCTTTCTTTTGAAGTTCTGTTTTTCTCAAGAGAACTTGATTTTGAAAATTCAAGTTATAGTCGAGTTTGTTTTGGAGTTCAAAATTTCGGTTAGTGGCTCAATTCAAGTTGGTTGATTCTTGTCTTCTTGTTGCTGTTCGTTTCAAGCTCTAAGCCGCGGTTTTGCTCGAGTCGATCTAGTTGCTGTAATCCCTGAAGTTTTTTGTTAATTAAAAGGTTCATCTCTTCACTCCTTCTTAATTTGTTCTGGTATTGATCAAAATGTGATGATGGCTGAGACTTTGCTAGATTGGAAGTGTTTATGAGCTGGTTCATGAGAAACCAGTCTGTGATGCAGTTTTTTTTTGTTTTCTTTCTTGGCTCCGGATACATCTCCCTTATTCTATTCGTTCTGTGTGCTCCAATTCATTCGGGTTATACCCTGTGTTGCCTTGTTATTTACTGGTGAATGGTGTATAAATTCATTTTTCTTTACCATACAGAATTCATGTCTGTTCTTGAATTGATTAAAATTTCCAAACATTGAATGCTAAGGTTGGGTATGGTCTGGATAAGCCAACAGCTTTATAAAATATGAGTGTCACACAGTTTTTAATGAAATACACTAACTTCCACAAGCAGCTTGTATTTAGTTGAGATCCACATTGTCCTTTTAAGAGATACTGTTGATGTTAGTAAGTAGTTAAGAAAAAAAACTTTTAAGTCATGAATCATGATTCTTTTAATTGCATTTGAAGCAAAAACATCAATGGTGAATAATGAAACAAAACTGGAAAGCAGAGAACAACTAGAGCAGTTAGCTTCACTGATTCTCTTTGAGCTCGAAATGTACATGTGAGAGAATGCAAAGCAATGACTACATCAGAAGAAAATTGTTCTAGAGTTAACTTTCTTTCCTTTTTGATGTATTGGCTATCTGTGTATGGTGAACGTGATATCAGGAAATGTGTGTCTTCTATCACTATTACTCCTTGTTAAGTCATATGTAATTGACTTGTTATGATATCAGTAGACTTACTTATGTTTAGACATAGTTTAAATGTTTTCTTTTGTGCTGTTTTGTTGCCTATACGGCCCTGCCATTCAAGAGAACATGGTGATTTCTTAGGCTTGCATATCACTGTTGAAATGCATCTATCTTAGTGTTTGACAAAAGAATATGTCACACATAGGATTAACAAGATGACTGAAGTTGGTTAAAATTAAGTCAAATTGAATGTTAGTTTAAAGTCATTTACCTGCTACATGCTAATATTTTTATATAACAGTGTGACGACCCGACTAGTCATCGCATGAATTACCGCCCTGTTTTTCCTATTTTTGCTTCTTTATGCTTCGTTATTCGTGTTTTATGTGGTCGAGTTGATTGGTTTGCATTTGGTGTGATTTTAGTAAGAAATGAGACACTTAGTCTCTTTTAAGAAGGCTTAAGTTGGAAAAGTCAACTAGATGTTGACTTATGAGTTAGAGGGCTCGGATGTGAGTTCTTATGGTTCGGTTAGCTTCGGGAGGTGACTTGTGACATAGGAGTGTGATCGGAAGTGGTTTTGGAGGCCCAGTGTAGAATTAGGCTTGAATTGGCGAAGTTAGTATTTTGGCAATTTCTGGTTGATAGGTGAGATTTTGATCCGGGGATCGGAATGAAATTTCGAGAGTTACTGTAGCTTTGTTATGTCATTTGTGATGTGAGTGCAAAATGTTAGATCATTCGGACACGGTTTGGTTGGGTTTTGATCAAAAGTGTGTTTCAGAAGTTTCTAGAAAAGCTAGGCTTGAATTCGATGTGAACTGATGTATTTGGTGTTGTTTGAGGTGTTTTGATGATTAGAACAAGTTTGAATGAGGTTTTAGGATGTGTTGGTACTTTTGGTTAAGGTCCCGGGGGCCTCGGGTGGTTTCGGATGGCTAACGGGAAGTTTTGAGTCATTGGAGATTGCAGAAAATGCAGCAGCAGTTGCAGAGGATTTTTGGCCTTCGCGATCGCGTGAGGTCCCTCGCGATCACGTAGAAGGAAGTTGGGTGGCCCTGCATTTGTGCTTCGCATTAACGTCTGCTGCCTCGCATTCGCGAAGGGGCCTTGAGGTTATGCTTTGCGTCCGCGTGATGGGTATCGCGTTCTCATAGTGGAGATGGGCACGTGAAGGTCGAGGAGCTATTGCTCTTCGCGCTCGCGTAAGTGGTATCGCGTTCGCGTAGGTTCAAAGTTCCAAAGCATCGCATTCACGGGTGTGGTGCCGCATTCGTGAAGGGTTATTTGTGGTTCAAGGAAAATTGTGCATCACGAACGCGTGGGTTTGACCGCGTTCGCGAAGGAGGGATTTCCAAAACTGAACAGTGAAGTTTTTAAACATTTCCTCCGTGAGTTTTAGTCTTTTTTCCACCATAGTTGAGTATTTTGAGAGCTCTTTGAGGGGAATTGAAGAGGGATTCAAGGAGAATTGGTTGGAGGTAAGTTCTATGAACCACAAACGTGATTATATTGTGAAGTTAACCTAGAAATTCATGGAAATTTAGCTAAAAATAGAAGAACTAGGGCCTGGGATTTTGAGATTTTAAATTGGGATTTGAAGGGACATTTGAGGTCGGATTTGAGAAATTTTGATATGTATGAACTCGTGGCGAGATAAGGAACCCGTTGATGTGAAAATTTCTGAGTTTCCAGAAGTAAACCCGGGGCTCGGGTTTTGCTAATTTCGGGATTTTTGATATTTTTCGATTGTTTTCGCTTGGCCTTTTTCCCCTTAGCATATTGTGACGTATTCGCTCTGGTTTTGGTTAGATTCGATGTCCGAGAGGCTGATTTGAGAGGCAAAGGCATAGCGAGCTAGAGCTTTAGCCGGTTCGAGGTGAGTCATGAATGTAAATGATATCCTGAGTGTTTGAAACCCCAGATTTGCACATCGTAGTGCTATATTGAGGTGAGACACGCGCTTGATGATGAGAGTGGGGTCATGTACTATTGAGGATTGGGACTTGGTCCGTCCTGAGTGTTGTTTTTACCGTGCATTTTGATTGAAGCTTATTTGTTATCATCATTGTTTGGACTAATTGCCATACTTGGACTTCGTGCCAACTATTTGAACCCTTCGGGGAGTTTTATCACTATTTCCTCACTGTTTTGACTTACTACTTGAACTTACTCGTACCGTTTTCCACTGTTTTACAACTCAACCACTTTTTACTCGGTTTTGAAACTAAAATGATACATATTAAATGATATTTTGGGCTGAGAACTACTGTTTTACTAATGCCCGAGGGGCTTATATGATTTCTGGACGGAGTACGGCCAAAGGCCAGATGGGAGGATACTATGGGATCGGGCTGCGCGCTGCAACAGTGTTATACTGATATTGATACGAGGCTGAGGGCCTAGATTTGATGCCACGAGATGACTTGATATTGTGCTTGGGCCGTAAGGGGCCCCTCCCGGAGTCTGCACATCCCCAGTGAGCGCCGTCAACGATAAATGTATGGATCGGGTTACACGCCGTAGCAGGTACTATAGGGTACCGTTCTATGTGTTGATTTTCTTTATATGTCTGTCACCTAACTGCTTATTTGTGGTAGCATTTCCACATTTCGTTTCCATTGGTTTATTACTTTCATATTACTTATTTAAAATGCTGCATTATAGATTACTCTGTGTTTCTTCGTGATTTCTTATTCTCAGTCATTATTTATGCTTATTACTCACTGGTTCGGAGTACTCACATTACTCCCTGCACCTTGCGTGCAGATCCAGGTGCATCTGAGGCTAAGTGAGGATTTTTAGTTGAGAAGCGCATATCCGGGAGCATCGAGGTAGCTGCATGGCATCCGCAACCCTGATCTCTCCTTTCTATCCTTTTGTTTTATN
>URS0000BE1683 snRNA from 1 species 
TAACTTACCTGGAGGGTAAGTCCAGTAGTCAACTTCGCTGGACTTATTGGGCATGATGGGGCATTGCACATCCCGTCCGGTCGTGTTCAACGAATGTCATTACGGCATCTCGGCCTTATAATTTCTGGTTTGGATTCCTCTGGCTTGCCGGGGAATCCC
>URS000002E6E7 rRNA from 1 species 
AACGAACGCTGGCGGCGTGGATAAGACATGCAAGTCGAACGGGATTATTTTTGTAGCAATACAGAAATAATTCAGTGGCGAACGGGTGCGTAACACGTGGGCAATCTGCCGAAAAGTGGGGGATAGCTCGCCGAAAGGCGAATTAATACCGCATGTGGTGAGGGACGACATCTTCCTGAATCCAAAGCCGGGGCAACCTGGCGCTTTTTGTAGGAGCCCGCGGCCTATCAGCTTGTTGGCGGGGTAACGGCCCACCAAGGCTATGACGGGTAGCTGGTCTGAGAGGACGACCAGTCACACTGGAACTGAGACACGGTCCAGACACCTACGGGTGGCAGCAGTCGAGAATTTTTCTCAATGGGGC
>URS0001E82C61 rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGACCTTCGGGTCTAGTGGCGCACGGGTGCGTAACGCGTGGGAACCTGCCCTTAGGTTCGGAATAACTCCCCGAAAGGGGTGCTAATACCGGATAATGTCTTCGGACCAAAGATTTATCGCCTTTGGATGGGCCCGCGTTGGATTAGCCAGTTGGTAGGGTAAAAGCCTACCAAGGCGACGATCCATAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCGACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATACAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTACCCGGGATGATAATGACAGTACCGGGAGAATAAGCTCCGGCTAACTCCGTG
>URS0001712CA9 rRNA from 1 species 
AGAGTTTGATCCTGGCTCAGAACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGCGAACGTTTCTTCGGAAACAAGTAGAGTGGCGGACGGGTGAGTAACGCGTAGGAATCTGCCTAAGGGTACGGAATAACGCCGGGAAACCGGTGCTAATACCGTATACGCCTTAAGAGGGAAAGCGCTATGTAGCGCCCTGGGATGAGCCCGCGTTAGATTAGGTAGTTGGTGAGGTAATGGCTCACCAAGCCTATGATCTATAGCTGGTTTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGAAACCCTGATCCAGCGATGCCGCGTGAGTGAAGAAGGCCCTAGGGTTGTAAAGCTCTTTCAGTAGGGAAGATGATGACGGTACCTACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGAGTACGTAGGCGGTTTGATAAGTTGGGAGTGAAATCCCGGGGCTTAACCTCGGAATTGCTCTCAAAACTATTAGACTAGAGTATGGTAGGGGACAGTGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCAGTTGCGAAGGCGGCTTACTGGTCCGGATCTGACGCTGAGATGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGGGTGCTAGGTGTTGGGTAGCTTGCTATTCAGTGCCGAAGCTAACGCGTTAAGCACCCCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGCAGAACCTTACCAGCCCTTGACATACCAATCGCGATTTCCAGAGATGGATTTCTTCAGTTCGGCTGGATTGGATACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGCCTTTAGTTGCCAGCATTTAGTTGGGCACTCTAGAGGGACTGCCGGTGATAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTACGGGTAGGGCTACACACGTGCTACAATGGCAGTGACAATGGGTTGCGATCCCGCAAGGGCTAGCTAATCCCCAAAAACTGTCTCAGTTCGGATTGTTCTCTGCAACTCGAGAGCATGAAGTTGGAATCGCTAGTAATCGTGGAACAGCATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGTTTTACCCGAAGGTGGTGCGCTAACCGCAAGGAGGCAGCCAACCACGGTAAGGTCAGCGACTGGGGTGAAGTCGTAACAAGGTAGCCGTAGGGGAACCTGCGGCTGGATCACCTCCTT
>URS0000F24664 rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGAATCATTGGGCGTAAAGCGCACGTAGGCGGCTTCGCAAGTCCCATGTGAAAGCCCACGGCTTAACCGTGGAAGTGCATGGGAAACTGCAGAGCTTGAGTACTTAAGAGGATCGCGGAATTCCCGGTGTAGAGGTGAAATTCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGGCGATCTGGGAAGATACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGG
>URS00003B973F rRNA from 1 species 
CGACGAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGCATGCTTTACACATGCAAGTCGAACGGTAACGGGGACTTCGGTCTGCCGACGAGTGGCGAACGGGTGAGTAATATATCGGAACGTGCCCAGTAATGGGGGATAGCTCGGCGAAAGCCGGATTAATACCGCATACGCCCTGAGGGGGAAAGTGGGGGATCTTCGGACCTCACGTTATTGGAGCGGCCGATATCAGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGAAGAAGGCCTTCGGGTTGTAAAGCTCTTTCAGCCGGGAAGAAAACGCATGGGTTAATACCCTGTGTGGATGACGGTACCGGAATAAGAAGCACCGGCTAACTACGTG
>URS00019E32A1 tRNA from 1 species 
GGATATAGTTCAGCTGGTAGAATGTGTGCCTCACATGCACAGGCCTGGGGTTCAATACCCAGCACCA
>URS0000ED2EE6 rRNA from 3 species 
CAAAATGGTGCCGTAACTTCGGGAGAAGGCACGCTGACACGTAGGTGAAGTGATTTACTCATGGAGCTGAAGTCAGTCGAAGATACCAGCTGGCTGCAACTGTTTATTAAAAACACAGCACTGTGCAAACACGAAAGTGGACGTATACGGTGTGACGCCTGCCCGGTGCCGGAAGGTTAATTGATGGGGTCAGCGCAAGCGAAGCTCCTGATCGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAATGATGGCCAGGCTGTCTCCACCCGAGACTCAGTGAAATTGAACTCGCTGTGAAGATGCAGTGTACCCGCGGCAAGACGGAAAGACCCCGTGAACCTTTACTATAGCTTGACACTGAACATTGAGCCTTGATGTGTAGGATAGGTGGGAGGCTTTGAAGTGTGGACGCCAGTCTGCATGGAGCCGACCTTGAAATACCACCCTTTAATGTTTGATGTTCTAACGTGGACCCGTAATCCGGGTTGCGGACAGTGTCTGGTGGGTAGTTTGACTGGGGCGGTCTCCTCCTAAAGAGTAACGGAGGAGCACGAAGGTTGGCTAATCCTGGTCGGACATCAGGAGGTTAGTGCAATGGCATAAGCCAGCTTGACTGCGAGCGTGACGGCGCGAGCAGGTGCGAAAGCAGGTCATAGTGATCCGGTGGTTCTGAATGGAAGGGCCATCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATACCGCCCAAGAGTTCATATCGACGGCGGTGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGAAGTAGGTCCCAAGGGTATGGCTGTTCGCCATTTAAAGTGGTACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCCCTATCTGCCGTGGGCGCTGGAGAACTGAGGGGGGCTGCTCCTAGTACGAGAGGACCGGAGTGGACGCATCACTGGTGTTCGGGTTGTCATGCCAATGGCACTGCCCGGTAGCTAAATGCGGAAGAGATAAGTGCTGAAAGCATCTAAGCACGAAACTTGCCCCGA
>URS00025C3F13 lncRNA from 1 species 
CTTGGGGATTTGCAGCTAATGTAAGAACCAAATGCTATTTAAAAAAAAAAATGTTTTTTAATACTTTTAAGTGTTTTTTGCACACTTTTGAAATATATTTTTACTTTATCTGCACATGCAAAGATAGGTCACGTGTAATAATGATTTCCTAATATAAATAAAGAGGGAACTAGTTAAAAAAAAAATTGAATAAGAATTCCTTGAGAAGGGGAGATGATTAGTCTGAAATGGGTCCACGTATAATGAGCAAAAACCTCCCAGGCGAGCAGCCCCAGGGCCAGAGAATGGGAGACAAGCCTTAAAGTATAGCTGTAGTTGAGACGGTCCTATTTGGGCAGGGGTGAAAAATGCTCCATCGGGAGATCTATATTCAGAAAAATCATGAGATGTATTAAGATAAACAAGACTAAAACTGAAAATATGTTAACCTATCTTTGATCATTAGTCCTTAAACAACAGAGAAGTACTTCTGTTGTCAAAAGTTCAATCAGGTCACAAGCACACCAGCTGCATTTGCTGTCAATCGTCACTGGAATGAATGATTTGAGTTTTCTGGGCCAATGAATGTTTCAGTAGAGTCGGCGAAAACTTAGATAGTCCAGAGATATGCCTAGCTTAAACACAGTGGCATCGCTAAGGGAGCCATGGTCCACCGATCATCATGCCGTGCCTCCAAGTGACGACGCTGTTTCATGGGCCGGCCTTAGGGTTGAGCTCACACAGCTACCCGGTGGAAGATTTCATTATTCTCCACCCGGGATTATTAAAAAACCCAAAACATTGTGACAGGGGCGGTGCATACCAGGAAGCAGAGGTGTGGCTAAAAG
>URS0000978C1D SRP_RNA from 2 species 
GCTGGGCATGGTGGCGCATGCCTGTAATCCCAGTTACTCTGGAGGCTGAGGCAAGAGAATCGCTTGAACCCGGGAGGCAGAGGTTGCAGTGAGTTGAGATAGCACCACTGCACTCCAGCCTGGGTGACAGAGCCAGACTCTGTCTCAA
>URS000131FCF1 rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGTATCAGGTCTTCGGATGCTGACGAGTGGCGAACGGGTGAGTAATACATCGGAACGTGCCTAGTAGTGGGGGATAACTACTCGAAAGAGTGGCTAATACCGCATGAGATCTACGGATGAAAGCAGGGGATCGCAAGACCTTGTGCTACTAGAGCGGCCGATGGCAGATTAGGTAGTTGGTGGGATAAAAGCTTACCAAGCCGACGATCTGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGGGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGCAAGCCTGATCCAGTAATGCCGCGTGCAGGATGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACGGAACGAAAAGCCCTGGGTTAATACCCTGGGGTCATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCCGCCGCAGTAATAC
>URS00013B03C6 rRNA from 1 species 
TACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTTGTTAAGTCTGATGTGAAGCCCTGGCTCAACCTGGGAACTGCAGTGGATACTGAGAAGCTAGAGTGTGTCAGAGGATGGTGGAATTCCGGTGTAGCGGTGAAATGCGTAGAGATCGGGAGGAACACCAGTGGCGAAGGCGATCACCTGGGATGTTCTGACGCTGAGGAGCGAAAGCTAGGGAGCAACGGGG
>URS000157F4D5 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGAGTGGCGGACGGGTGCGGAATACATCGGAATCTACTCTGTCGAGGGGGATAACGTAGGGAAACTTACGCTAATCCCGCATAAGATTGTATGAGCCGATGTCGGATTAGCTAGTTGGTGGGGTAAAGGCGCACCAAGGCGACGCTCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGTAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAAGGGGCGCAAGCCTGATCCAGCCATGCCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAGGCGGTACCCAAAGAAGAAGCACCGGCGAACTTCGTGCCAGCAGCCGCGGTAATAC
>URS00000C806B tRNA from 1 species 
TTTTAAGTAGTTTATGGATAAAATATTAAGTTGTGGTCTTAGAGAAAAAGATTGCTTTCTTAAATG
>URS00008F77FE rRNA from 1 species 
TACGGAGGGTGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGCGTAGGTGGCTTGGTAAGCGTGTGGTGAAAGCTCGGGGCTCAACCCCGAGTCGGCCATGCGAACTGCCGAGCTTGAGCACTGTAGAGGCAGACGGAATTCCGGGTGTAGCGGTGGAATGCGTAGAGATCCGGAAGAACACCAGTGGCGAAGGCGGTCTGCTGGGCAGTTGCTGACACTGAGGCGCGACAGCGTGGGGAGCAAACAGG
>URS000080C6B8 rRNA from 1 species 
TACGGAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGTTTTCCAAGTCAGAGGTGAAAGCCCGGGGCTCAACTCCGGAATTGCCTTTGAAACTGGGAAACTTGAACACGGGAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAGGAACACCAGTGGCGAAGGCGGCTCACTGGACCGTTGTTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGG
>URS000134990F rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTACCACATGCAAGTCGAACGCGTGGCGGACGGGTGAGTCATGTCTGGGAAACTGCCCGATGGAGGGGGATAACTACTGGAACCGGTAGCTACTACCGCATACCATCGGATGTGCCCCGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAAGGGGCGAAAGGCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGCGTTACTCGAAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATTC
>URS0000B4737C rRNA from 1 species 
TTGCCTACGGGGGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGCGATGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAAGAAAATGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGTCCTGCAAGCAAGATGTGAAAGCCCGGGGCTCAACCCGGGGACTGCATTTGGATCT
>URS00000D2088 rRNA from 1 species 
AACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGAGAGCCTGAACCAGCCAAGTAGCGTGCAGGATGACGGCCCTATGGGTTGTAAACTGCTTTTATGCGGGAATAACGTTCACTACGTGTAGTGTTTTGCATGTACCGCATGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGAGCGTAGGCGGAGGATCAAGTCAGCTGTGAAATGTAGACGCTCAACGTGTGCACTGCAGTTGAAACTGGTTCCCTTGAGTGCGTAAGAGGCAGGCGGAATTCGTCGTGTAGCGGTGAAATGCTTAGATATGACGAAGAACTCCGATCGCGAAGGCAGCTTGCCGGGCCGCAACTGACGCTGAAGCTCGAAGGTGCGGGTATCGAACAGGATTAGATACCCTGGTAGTCCGCACAGTAAACGATGGATACTCGCTGTCGGCGATATACGGTCGGTGGCCAAGCGAAAGCGTTAAGTATCCCACCTGGGGAGTACGCCGGCAACGGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGAGGAACATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCCGGGCTTGAATTGCTAACGACGGTTACTGGAGACAGTTTCCTTCCTTCGGGACGTTAGTGAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTAAGGTGTCGGCTCAAGTGCCATAACGAGCGCAACCCTTGCCGTTAGTTGCCATCAGGTCATGCTGGGCACTCTATCGGGACTGCCATCGTAAGATGTGAGGAAGGTGGGGATGACGTCAAATCAGCACGGCCCTTATGTCCGGGGCTACACACGTGTTACAATGGGGGGTACAGAGGGAAGCCACCTGGCGACAGGGCGCGGATCCCGAAATCCCTTCTCAGTTCGGATCGGAGTCTGGAACCCGACTCCGTGAAGCTGGATTCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCAAGCCATGAAAGCCGGGGGCGCCTGAAGTCCGTAACCGCGAGGATCGGCCTAGGGCGAACCTGGTAATTGGGGCTAAGTCGTAACAAGGTAGCCGTACCGGAAGGTGCGGCTGGAACAACTCCTTT
>URS00016E4775 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTTCGTCGCGTCGGCTGTGAAATCCCGAGGCTCAACTCCGGGCCTGCAGTCGATACGGGCAGACTGGAGTTCGGCAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGGTCTCTGGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS0002360704 lncRNA from 1 species 
TTTTTTTTACTTTTTTCTGTATTTCTTTTTTCTTTTTGTTTCTTCACTCGTTTTCTTCTGTTTTTTATATTCTTTGTTTTTTCACTGGGTTTCTTCATCTTTTTGTTGGGTTTTATTGTTTTTCTTTTATTTGCTTTTGCACGATTTTCTGTGTTTCTTTCTCGATTTCATTTTTTTTCCTGTTTTCTTTAGTTTGTTTTTATTTTATTTGTGTGGTTTCATTTGTTT
>URS00018D31DC rRNA from 1 species 
TGCCAGCAGCCGCGGTAATACGAAGGGACCTAGCGTAGTTCGGAATCATTGGGCGTAAAGAGAATGTAGGCGGAATTATAAGTCTGGTGTGAAATCCCACAGCTCAACTGTGGAACTGCATCGGATACTGTTTTTCTTGAATTGTAGAGGGGGTCGCGGAATTTCTGGTGTAGAGGTGAAATTTGTAGATATCAGAAAGAACACCGGTGGCGAAGGCGGCGACCTGGCTATTAATTGACGCTGAGATTCGAAAGCGTGGGTAGCGAACAGGATTAGATA
>URS0000E7B100 lncRNA from 1 species 
ACATAAGCAGTAGGTGTCTGAAGGCTGGATTTTCAATACAGGCATAAAAGATAGTATTTAAATAAAACAGAAAGCAGAATTTGAATTGTCTTGGCTCAGGTTGGGACATCCACTGAATCTGATGTTCCTGGTACTGAAGACCCTTGGACCCACCTAGCACGGCTGTAGACTTTGCGGTCTGGCATACACTGGGATATCTGTGGACAGAACTCCCCTGCATGGTGAAGCTTTTTTGTTGGCTGCACAGGAGAGTGACTGTACAGTTGGCTCTAGTGTGGCTGCACACTAGACTGTCTCTCGAAAGGAGCTGAGCTTCATTCCTATCCCTAGGAAAACTTCAGCTAAAGTTAACTTGGTTGGATGCCATGTCTGCTTCCTTTCATTTCAAAGTAGGAAAAGTCAGAATGAGAACACTAGTTCTTCACTTCAGTTCTGCTGTCATGAGGATCGAGTACCTGTAGAGCTCTATCATAGGGCTACAGGTAACACTCTTGTATAAACTGGAGCAAAAATGTTTGCCACAGTCCAGACCCTGAAATAAAATGGACATTTAGCAAAAGATGACCATTTTCAAGGTTACATCCGGAGTGGGAAGAAAACACCACAGATTTTGCATCTTTGTGGCGTATCTTGAAGATGTTCCAGCAAAGTCATCAGTTTGGACTGTGCCCAACAGATTTGTACAAGGGGAAAGAATAAGAGGAAAGAAAATGAACTCCTTATTCTATCCCACTCCACCAAAATGCAATCACATCCATGGATTTTGTCAGAGG
>URS0001BF4730 lncRNA from 10 species 
ctggtccctaagcccttccagcccaggagccagacctgtgagcaaacaagcctttagtgattccaggctctggctggaaccttgagtcttctcagctTGGGGCATGCACCTCAGGGGGAGCCAGCATCAGTGTCCAGCCCCAAGAGCTTCCCTGTACGTCTCAGTGAGTCTTCACATGCCTCCAACTGCCTGGACAACCACACGTGATACCTGTCCTGCCAAACGTGtcctgaacccataaaatccagagaaaagaaaatcgttttaaactgctgaggtttggggtctttcctgtgctgttttcgtgatagtgaatgagtgtcacgagatccgatggttttaaaaacgggagtttcctgcataagctctctctctgcctgctgccatccatgtaagatgtgactcgctcctccctaccttccgccgtgattgtgaggcgtccccagccatgtggaactgtaagtccattaaaccttcttcctgtgtaaatta
>URS0000115D96 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAATGGATTAAGAGCTTGCTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAATATTTTGAACCGCATGGTTCGAAATTGAAAGGCGGCTTCGGCTGTCACTTATGGATGGACCCGCGTCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGCTTTCGGGTCGTAAAACTCTGTTGTTAGGGAAGAACAAGTGCTAGTTGAATAAGCTGGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGC
>URS00009CA41E rRNA from 1 species 
GGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGTCCTACGGGAGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGATCCGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGGAACCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTATGGTTGTAAAGCACTTTAAGCGAGGAGGAGGCTACTGAGACTAATACTCTTGGATAGTGGACGTTACTCGCAGAATAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCGAGCGTTAATCGGATTTACTGGGCGTAAAGCGTGCGTAGGCGGCTTTTTAAGTCGGATGTGAAATCCCCGAGCTTAACTTGGGAATTGCATTCGATACTGGGAAGCTAGAGTATGGGAGAGGATGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGATGGCGAAGGCAGCCATCTGGCCTAATACTGACGCTGAGGTACGAAAGCATGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGATGTCTACTAGCCGTTGGGGCCTTTGAGGCTTTAGTGGCGCAGCTAACGCGATAAGTAGACCGCCTGGGGAGTACGGTCGCAAGACTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGT
>URS0000EF3AE3 lncRNA from 1 species 
CCCTGATGGTGCAGAGACTGTCACGTAAACTGCCTCAGCTTTCTGGGGACTGTTCTGGAGTGCTCACCTACACTAGGCTTGGGGACCATGTTGGTGCCATTTCCCCAGACTGGGTACTGACCTCTTCACAGTTCCCGTGGCGCCTGAAGGACTGGAGAGTTTATGTTCCCATGTCTCCTCTGGGTGTTGGCCAGAGCTGTGATCACCATGACGGGAATCCTCCTTATTTGCTCCTTAAGCAAATAATCCTTGTGTTTTTGATTATGCCCTTAATCTTTGTCCTGAACTGCTGATCTTCAGAGGGACCCAGGAGAAGATGAGTCCAC
>URS000081BA44 rRNA from 1 species 
ATTGAACGCTGGAGGCATGCTTAACACATGCAAGTCGAACGGCAGCATGATGTGTAGCAATACACATTGATGGCGAGTGGCGGACGGGTGAGTAACGCGTAGGAATCTGCCTTGAAGAGGGGGACAACCCGAGGAAACTCGGGCTAATACCGCATAATATCGAGAGATTAAAGTCTGGGTGGTAACACCTGGAGCTTCAAGAGGAGCCTGCGTCCGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGATGATCGGTAACTGGTCTGAGAGGATGACCAGTCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGGACAATGGGGCCAACCCTGATCCAGCGATGCCGCGTGTGTGAAGAAGGCCTC
>URS0000CE0126 antisense_RNA from 1 species 
TCCTTCCCTTCCGGAGCCCGGGGTAGGCGAGAAGCAGGCAAGGGCGCGGAGGATGGAATCTCGCTCTGTCTCCCAGGCTGAAGTGCAATGACGCAATCTCGGCTCAATGCAGCCTCCGCCTCCCAGGTTTAAGCGATTATCCCGCCTCAGTCTCACAAGTAGCTGGGATTACAGGTGCCCACCACCACGCCCAGAAGTGCATTTCGCCTCCCGCCATGATTCTGAGGCCTCCCCAGCCCTGTGAAACCGTAAGTCCAATTAAACCTCTTTTTCTTCCCAGTCTCAGGTATGTCTTTATCAGCATCATGAAAACGGACTAATACACTATTCTTAATTGATATGCCAACACAAATATAGAGACACATAGCAACATATATACACAAAATGCAAACAAAATTACTTGCAGCTTTAAGTAGATCTAAGTATACTTTTCCTTCTTCAGTGGGAACAAAGGTGTTGTAATTG
>URS00006C0526 Y_RNA from 2 species 
AGCTGGTTCGAAGATAGTGTTATCTCAATTAACTGTTCACAGTCAGTTACAGATCAAACTCCTTGTTCTACTCTTTCCCCCTTTCTCACTACTGCGCTTGACTAGTCTAGA
>URS00015EBCF0 rRNA from 1 species 
TACGTAGGGTGCGAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCACGTAGGCGGATTGCTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGGCGATCTTGAGTCCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGGTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS00016A2BA6 rRNA from 1 species 
CCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGGAACCCTGATCCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAAGAAAATGATGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGTTGGCAAGCGTTGTCCGGATTTACTGGGTGTAAAGGGCGTGCAGCCGGGAAGACAAGTCAGATGTGAAATACCGCGGCTCAACCGCGGAACTGCATTTGAAACTGTTTTTCTTGAGTATCGGAGAGGTAATCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAAGAACACCAGTGGCGAAGGCGGAGTACTGGACGACAACTGACGGTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTC
>URS000112369F rRNA from 1 species 
TACGGGGGGAGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCGCGTAGGCGGCAAGGCAAGTCAGGTGTGAAAGCCCCGAGCTTAACTCGGGAATTGCATCTGAAACTGCTGTGCTTGAGTTCTGGAGGGGGTAGTGGAATTCCCAGTGTAGCGGTGAAATGCGTAGATATTGGGAGGAACACCTGCGGCGAAGGCGGCTACCTGGACAGAAACTGACGCTGAGGCGCGAAAAGCTAGGGGGAGCGAACGGGG
>URS00022A0584 misc_RNA from 1 species 
GAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCGCCAGTATTCTGGCGGGCATGTCTGTCCGAGCGTCATTTCAACCATCAAGCCCCCGGGCTTGTGTTGGGGACCTGCGGCTGCCCGCAGGCCCTGAAAACCAGTGGCGGGCTCGCTGTCACACCGAGCGTAGTAGCAATCACCTCGCTCAGGGCGTGCTGCGGGTTCCGGCCGTTAAACAGCCTTACAAAACCCCAGGTTGACCTCGGATCAGGTAGGAAGACCCGCTGAACTTAAGC
>URS0000E790F2 lncRNA from 1 species 
ATGCAAACTTTGCCCGAATTTTGCTACTTAAAATGCCTTAGCGATAAAGTAAATGTTACTAAAATTATTAACCGAAATATAACAAAACTAAAGCTAGATGGATTTATCGAATTGGATCGTGAGATAGAGGATTTTACGAAATTAAGAAATTCAATTGTTAATGAACAATATAAAGGGTTGACAGAAAAATTATTTCAAGCACACAAAGAATATTTATTTTATTTTGATACTTTTTTAAAAAAAAAACTATTAAAAGATGAAAATAAAGTATTATATACTAATGATTGTTTTGATAGAACAAAAAAGGTTGAATACAATTTTGAAAACGAAATAGTTATTGTTATATATAATATAGGTTTTATTACTACAGCTATATTAAAATCTAAAAAAAAAGACAAGGATGTAAAATTATTAAATAAATTGTCACAAGAAGCAATAAATATTTTTAATTACTTATTCCAAAGTATTATTAATGAAACTTACAATGACTTAAGTGACATAAATTGTTTAAGTTGTTATGTATTTTTAAATTTATCATTAGCTTATCATGAACATTTATTTTATAATACAGCTTTGGCAAAAAAATATAAAAGAAATTTATTAGCAAAAATATCATATAATATATATAGTTATTTTAATAATATGTTAAATTGTTTAGATGGTAAAAAATTAGATGTATTTACAAAAATGGATGCATTTGTTAATGCAAAAAATAATCTTATATTAACTCTTCGAAATAGTAATAGTCTTCTTTATAACTTTATATATGTAAATAAATTAATTTTTTTAAGTATTACCAATTATCAAACAACTTTAAAATACTGTCAATTAAACCCAAATAGTGAAGAAGTAGTAATACAAAAATATGAAGAAGAAAAAATAGGAGAAATTATATCTAGATTACAATTTAGTACAGAAAATATAAAGAAAGCAGAAGATTTAAGTAAAAAATATAATTTACATATTAATGCTGAAATGTTGAAACAAAAAATAAACAATGCTTTAGTTTTTTTTGAAAAAGATAATAAAAATATATATTTTGAGTCAATACCAGAATATAGTACCTTAGACAGTTTAAAAGGAACAGAAATTGTAAAAATACCAGATCCTAATATATCAACTATTTATTTGAAAAAAGAAATCAGTAATAATTTAAAATTATTATTTAATGAAAAAGCAAAAAATATATTTGACGAATATAATACAGAGGCTTGTAAAGTACATGATTTATATGAAAAACATCTTAGCAGTTTAAAAGATCAATATAAATTAATTAATTTATCTTATCGAAAAAATATATTTACAATTCTTAATAATGTACTTTTAAATATATATAATACATTAAAACAATCATATAATCCTACTATATATGATAAAAATTTACATTTTTTAATGGATGTTGAAAAAAATTTAAATTTAACACTAAACCAAATCGAAACAAGTTTAAACACAGAAAATTCTAATCACTTGAATTTCCAAAAAATGTATACCAATATAGGCGTTAACCAAGACTCGTTAAATTCTTATAAAAAATATGTTTACCATTTAAATAACTTTAAAAAAATATTAACCGAAATAACAACTAATATAGTTGAATTTAAAAGTTTTCTTGAAAATAATTATTATTATTTACAACTATGTGAAATGAATGTTTCTAATTTTTTTAAACATATGATAGACGAACTTAACTCCAATTCAAATACATGTGTTGAATCCTTTGATAGCGATTATACATTTTATAAGAACTTATTATCAGAAGAAAAAGAAAAAGAAAACGAAGAAGAAACAAAAGAAGAAACAAAAAAAATGAAAAATAATACATCATCAACAACAACAGCAGCAGAAGCAACAACAACAGCAGCAGCAACAACATATATGAACGAACAAAAAGTAATACTACCAGCTTCACCACCACCATCACTTACCAATAATATTCCTAAATTAACATATTCTAACTTTCACAAATTTTTAAAAAAAAACAATATATCAGTTACTGCGTCAAGTAGTATTAATAATAGTAGTAATATAAAATATTTTGAAATTTTAAAAAATTATATAAATATACATTCAGAAGAAAAATTATATTTTACAATAAATGCTATTTACTTTTCTATGAATATCCAATTAGAACAATTTTCAAACGACCTTGCAGAGATTAAAGGATATATGCAAAATTCATTTTTAAATTTAATAACGGTAATGATATAA
>URS0001C1D8E2 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGATAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGACGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS000183E284 rRNA from 1 species 
TACGAAGGGAGCTAGCGTTGTTCGGAATCACTGGGCGTAAAGCGCACGTAGGCGGATTTGTTAGTCAGGGGTGAAATCCCGGGGCTCAACCTCGGAACTGCCTTTGATACTGCAAATCTCGAGTCCGGAAGAGGTGGGTGGAATTCCTAGTGTAGAGGTGAAATTCGTAGATATCAGGAGGAACACCGGTGGCGAAAGCGGCTTCCTGGCCCGACACTGACGCTCATGTACGAAAGCGTGGGGAGCGAACAGG
>URS0000164332 rRNA from 1 species 
CCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATACCGCGTGTGTGAAGAAGGCCTGAGGGTTGTAAAGCACTTTCAATGGGAAGGAATACCTACCGGCCAATACCCGGTAGACTGACATTACCCATACAAGAAGCGCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAGGCGTGCGTAGGCGGCTTGTTCAGTCAGATGTGACAGCCCCGGGCTTAACCTGGGAACTGCATTTGATACTGGCAGGCTAGAGTTTAGTAGAGGGGAGTGGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAACACCAGTGGCGAAGGCGGCTCCCTGGACTAAAACTGACGCTGAGGTACGAAAGCGTGGGTAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCAACTAACTGTTGGGTTCTTAAAGAACTTAGTAGTGGAGCTAACGTATTAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACCCTTGACATGTAGTGAACTTTCCAGAGATGGATGGGTGCCTTCGGGAACACTAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTATCCTTAGTTGCCAGCGGGTAATGCCGGGAACTCTAGGGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGGCCCTTATGGGTAGGGCTACACACGTGCTACAATGGTCGGTACAGAGGGCAGCAAACTCGCGAGAGCCAGCAAATCCCAAAAAGCCGATCCTAGTCCGGATTGCAGTCTGCAACTCGACTGCATGAAGTCGGAATCGCTAGTAATCGCGGATCAGAATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGT
>URS00013EF64C rRNA from 1 species 
GACAGAGGATGCAAGCGTTATCCGGAATGATTGGGCGTAAAGCGTCTGTAGGTGGCTTTTTAAGACCGCCGTCAAATCCCAGGGCTCAACCCTGGACAGGCGGTGGAAACTACCAAGCTGGAGTACGGTAGGGGCAGAGGGAATTTCCGGTGGAGCGGTGAAATGCGTAGAGATCGGAAAGAACACCAACGGCGAAAGCACTCTGCTGGGCCGACACTGACACTGAGAGACGAAAGCTAGGGGAGCGAATGGG
>URS00016C3B12 rRNA from 1 species 
TACGAAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGGGTGCGTAGGCGGTTCGGTAAGTCGGATGTGAAAACTCAGGGCTCAACCCGGAGACGCCATCCGATACTGCTGTGACTTGAGTCTGGTAGGGGAACACGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCAAAGGCAGTGTTCTGGGCCAGTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCAAACAGG
>URS0000F147F0 rRNA from 1 species 
TACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTGTAAGCCAGATGTGAAATCCCCGGGCTCAACCTGGGAATGGCATTTGGGACTGCAAGGCTGGAGTACGGCAGAGGAGACTGGAATTCCTGGTGTAGCAGTGAAATGCGTAGAGATGTGGAGGAACACCGATGGCGAAGGCAGCCTCCTGGGCCAGCACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS0000104AE7 rRNA from 1 species 
GAGCTCGTAGGCGGTTTGTCGCGTCTGCCGTGAAAGTCCGAGGCTCAACCTCGGATCTGCGGTGGGTACGGGCAGACTAGAGTGATGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGGTCTCTGGGCATTTACTGACGCTGAGGAGCGAAAGCATGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGTTGGGCACTAGGTGTGGGGGACATTCCACGTTTTCCGCGCCGTAGCTAACGCATTAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGAAGAACCTTACCAAGGCTTGACATGTTCCAGACCGCCTCAGAGATGGGGTTTCCCTTCGGGGCTGGTTCACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTTCCATGTTGCCAGCGGGTTATGCCGGGGACTCATGGGAGACTGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGTCTTGGGCTTCACGCATGCTACAATGGCCGGTACAATGGGTTGCGATACTGTGAGGTGGAGCTAATCCCTAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCCCATGAA
>URS0000D394E6 rRNA from 1 species 
CACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGAGCTTAACTTGGGAACTGCATTTGAAACTGGCAAGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGAAAATTTGACGGA
>URS0002160948 rRNA from 1 species 
TGCTGGAGGTATCAGAAGTGCGAATGCTGACATAAGTAACGATAAAGCGGGTGAAAAGCCCGCTCGCCGGAAGACCAAGGGTTCCTGTCCAACGTTAATCGGGGCAGGGTGAGTCGACCCCTAAGGCGAGGCCGAAAGGCGTAGTCGATGGGAAACAGGTTAATATTCCTGTACTTGGTGTTACTGCGAAGGGGGGACGGAGAAGGCTATGTTAGCCGGGCGACGGTTGTCCCGGTTTAAGCATGTAGGCTGATTGTCCAGGCAAATCCGGATAATCAAGGCTGAGGTGTGATGACGAGGCACTACGGTGCTGAAGTAACAAATGCCCTGCTTCCAGGAAAAGCCTCTAAGCATCAGGTAACATCAAATCGTACCCCAAACCGACACAGGTGGTCAGGTAGAGAATACCAAGGCGCTTGAGAGAACTCGGGTGAAGGAACTAGGCAAAATGGTGCCGTAACTTCGGGAGAAGGCACGCTGGTGTGTAGGTGAAGTCCCTGCGGATGGAGCTGAGACCAGTCGAAGATACCAGCTGGCTGCAACTGTTTATTAAAAACACAGCACTGTGCAAACACGAAAGTGGACGTATACGGTGTGACGCCTGCCCGGTGCCGGAAGGTTAATTGATGGGGTTATCCGTAAGGAGAAGCTCTTGATCGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAATGATGGCCAGGCTGTCTCCACCCGAGACTCAGTGAAATTGAACTCGCTGTGAAGATGCAGTGTACCCGCGGCAAGACGGAAAGACCCCGTGAACCTTTACTATAGCTTGACACTGAACATTGAGCCTTGATGTGTAGGATAGGTGGGAGGCTTTGAAGCGTGGACGCCAGTCTGCGTGGAGCCAACCTTGAAATACCACCCTTTAATGTTTGATGTTCTAACGTTGGCCCCTGACCGGGGTTGCGGACAGTGTCTGGTGGGTAGTTTGACTGGGGCGGTCTCCTCCCAAAGCGTAACGGAGGAGCACGAAGGTTAGCTAATCCTGGTCGGACATCAGGAGGTTAGTGCAATGGCATAAGCTAGCTTGACTGCGAGCGTGACGGCGCGAGCAGGTGCGAAAGCAGGTCATAGTGATCCGGTGGTTCTGAATGGAAGGGCCATCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATACCGCCCAAGAGTTCATATCGACGGCGGTGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGAAGTAGGTCCCAAGGGT
>URS00025841D4 rRNA from 1 species 
GCGCAGATGACTCGCTACTGAATCAACTAAAACATAAAACAAAATATTTAGTTGATAATGTAAGAAGAAAATAATGATATTATCTTATGTTTAGTGTCGTCTAAAACTGGTGCCAGAAGACTCGGTAAGGCCGGAGACGCAAACGTTAGTCATCCTTATCAGGCGTAAAGGGTTTGTAGGCTGCTTTGAAAGTTTCTATCTTTTAAATTAATTAAAAAATGGGGCGAAGCTCGGTTATAACTAATTATCTTTAAAATATAATAAAATAGAAATAAATTAAAGCTAGAATCTAATAGAGGTTATATTGAATAATACTTAGTTTAGGTCTAATATCCTAATAGATTAAGGGGAATATTAAAAGCGAAGGCTTCTCTCCACTATAGATTGACGCTGAGAAACGAAGGTGAGGAAAGGAAATAGGATTAGATACCCAAACTACCCCTCACTGTCAACGATGAATGGTAGTCATTAGTGCATATTAGTGACGTAGTTAACACAATTACCATTCCGCCTTGTTAGTAAGACTGCAAAGTTAAAAACAAAAAAATTAGTCGGTTTCGGAGTAAACGAAGTGAAGCATGTTATTTAATTCATTAAATCCGCAAA
>URS0001424B59 rRNA from 1 species 
CTACGGGCCGCAGCAGTGGGGAATATTGGACAATGGGGGAAACCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTGCGGGTTGTAAAGCACTTTCGGTTGGGAGGACTGCTTCTAGCACTAATATTGTTGGAAGTTGACGTTACCTTCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGCTAGATCAGTCGGGTGTGAAGGCCCCGGGCTTAACCTGGGAACTGCATCCGATACTGTCTAGCTAGAGTACAGGAGAGGAGAGTGGAATTCCACATGTAGCGGTGAAATGCGTAGATATGTGGAGGAACACCAATGGCGAAGGCAGCTCTCTGGCCTGATACTGACGCTGAGGTGCGAAAGCGTGGGGAACAAACAGGATTAGATACCCCTGTAGTC
>URS0000AE892D rRNA from 1 species 
TCGAGAATCATTCACAATGGGGGCAACCCTGATGGTGCAACGCCGCGTGGAGGATGAAGGTCTTCGGATTGTAAACTCCTGTCATCTAGGAGCAAGACCTGGCGCTGAATCGTCGACAGGGTTGATAGTACTAGAAGAGGAAGGGACGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGTACCGAGCGTTATTCGGAATCACTGGGCGTAACGGGAGCGTCGGCGGCGTGGGCAGCAAGATGTG
>URS0000ECDF55 rRNA from 1 species 
TAGATACCCTGGTAGTCCACGCCGTAAATGGTGAGTGCTAGGTGTCGGGAGTCAAATCTCGGTGCCGACGTTAACACATTAAGCACTCCGCCTGGGGAGTACGCACGCAAGTGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCAGCGGAGCATGTGGTTTAATTCGATGCAACGCGAAAAACCTTACCAGGACTTGACATATGGATGCCCGGTATAGAGATATACCCTTCTTCGGAACATTCAT
>URS000188AE03 rRNA from 1 species 
ACTACGGGTGGCTGCAGTGGGGAATATTGGGCAATGGGCGCAAGCCTGACCCAGCAACGCCGCGTGAAGGAAGAAGGCTTTCGGGTTGTAAACTTCTTTTCTCAGGGACGAAGAAAGTGACGGTACCTGAGGAATAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGATTTATTGGGTGTAAAGGGCGTGTAGGCGGGAGCGCAAGTCAGATGTGAAAACTCAGGGCTCAACCCTGAGCCTGCATTTGAAACTGTGTTTCTTGAGTGCTGGAGAGGCAATCGGAATTCCGTGTGTAGCGGTGAAATGCGTAGATATACGGAGGAACACCAGTGGCGAAGGCGGATTGCTGGACAGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCGTGTAGTC
>URS000107BACB rRNA from 1 species 
TGGGGAATTTTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGCGGGAAGAAGGCCTTCGGGTTGTAAACCGCTTTTGTCAGGGAAGAAATCTTCTGAGTTAATACCTCGGGAGGATGACGGTACCTGAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTGTAAGACAGAGGTGAAATCCCCGGGCTCAACCTGGGAACTGCCTTTGTGACTGCAAGGCTTGAGTGCGGCAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGGCCTGCACTGACGCTCATGCACGAAAGCGTGGGGAGCAAAACCAGGATTAGATAGCCCCTGGGTAGTCCACGCCCTAAAACGATGTCAACTGGTTGTTGGGAAGGTTCCTTCTCAGTAACGTAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGTTGAAAC
>URS00003DBB63 rRNA from 1 species 
AGGGAATCTTCCACAATGGACGCAAGTCTGATGGAGCAACGCCGCGTGAGTGAAGAAGGGTTTCGGCTCGTAAAGCTCTGTTGGTAGTGAAGAAAGATAGAGGTAGTGACTGGCCTTTATTTGACGGTAATTACTTAGAAAGTCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTTGGCGTAAAGCGCGCGCAGGCGGATTGGTCAGTCTGTCTTAAAAGTTCGGGGCTTAACCCCGTGATGGGATGGAAACTGCCAATCTAGAGTATCGGAGAGGAAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAAGAACACCAGTGGCGAAGGCGACTTTCTGGACGAAAACTGACGCTGAGGCGCGAAAGCCAGGGGAGCGAACGGGATTAGATACCCCGGTAGTCCTGGCCGTAAACGATGGGTACTAGGTGTAGGAGGTATCGACCCCTTCTGTGCCGGAGTTAACGCAATAAGTACCCCGCCTGGGGAGTACGACCGCAAGGTTG
>URS0002247035 tRNA from 1 species 
GCACCGGTCGTATAGTGGCTAGGTATTTAGTACCACACAAATTATCTCGGCCTTCCAAGCCGATAACCCGGGTTCGAATCCCGGCCGGTGCA
>URS0000B6A44E rRNA from 1 species 
GTGTCAGCAGCCGCGGTAATACGTAGGCAGCGAGCGTTGTTCGGAGTTACTGGGCGTAAAGCGTGCGTAGGCGGCAGTCCAAGTCTGGTGTGAAATCTCCCGGCTCAACCGGGAGGGTGCGCCGGAAACTGGGCTGCTGGAGTGCGGGAGAGGTAAGCGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGGGAGGAACACCTGCGGTGTAGACGGCTTACTGGACCGCCACTGACGCTGAGGCACGAAAGCGTGGGTAGCAAACAGGATTAGATACCCTGGTAGTCC
>URS00008315DC rRNA from 1 species 
GTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGGGAAGACGGTTTTCGGATTGTAAACCTCTGTCTTTGGTGAAGAAAAAAATGACGGTAGCCAAGGAGGAAGCTCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGAGCGAGCGTTGTCCGGAATTACTGGGTGTAAAGGGAGCGCAGGCGGGAAGACAAGTCAGCTGTGAAATACATGGGCTCAACCCATGGACTGCAGTTGAAACTGTTTTTCTTGAGTGGAGTAGAGGTAGGCGGAATTCCGAGTGTAGCGGTGAAATGCGTAGATATTCGGAGGAACACCAGTGGCGAAGGCGGCCTACTGGGCTCTAACTGACGCTGAGGCTCGAAAGTGTGGGGAGCAAACAGGATTAGAAACCCTAGTAGTCC
>URS00014517AB rRNA from 1 species 
TACGTAGGGGGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGTTGGGTAAGTCGGGTGTGAAAACTCAGGGCTCAACTCTGAGACGCCACTCGATACTGCTCTGACTCGAGTCCGGTAGGGGAGCGTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCGGGAGGAACACCAGTGGCGAAGGCGGCGCTCTGGGCCGGAACGGACGCTGAGGAGCGAAAGCGTGGGTAGCAAACAGG
>URS00009B6ECF lncRNA from 8 species 
GATCATCTGAGGTCGGGAGTTTAGACCAGCCTGGCCAACATTGTGAAACCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTGTGGTGGCGCACACTTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGTAGAATCACTTGAACCTGGGAGGCGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTGCACTCCAGCCTGGGCAACAGAGGGAGACTCCATCTCAAAAAGAGAAAATAATTATAAAAGTTGCTTTAAAATCCTTGCTGCTAATTCCCAAGATTAGAAATTCCAACATCTGAGTCATAACTTTTTCTCTTTGGGAGTGAGTTTTGAGTATGATTCCATTTTCTGTTTCTTCATATGCCTAGTACTTGTTTATTGTAGCTGGACATTGTCAAGACTATGGATTTTGTTATGTTCCTCTGAAGAGTGTTAATTTTGTTCTAACAGGCAATTAACCTGGTTGGACTGAAACTCCAATCTTTGTGAAAGGCAGTAGCTGGAATTCCTACTCTGTTCTTGCTCCCAGCTGCTGATTTTACTGGGACTCCTGGAGACTCCTGCGCATATGTGCAGTTGGACAACCAAGGATTTGGACAGAGTTTATATACAGATTTTGGGACTTGTTTGCTCTATAGAATTTCTTTCTGTGAGTTCCCTCTTAATTTTCCAGCCACACTTCTCGCCTAGAACTCTGTACTCGGCACCTCAAACCAGTAAGACCGTAGCTTTCTATGCATTTCCACCTCCCACACAAATTACAGAGTGCCCTCACACAAATAACCACAAAAATATAAGTCTAGTACAGGGCAGCTCCCACCTTTCAAGAGTTGATTTTCCTCACATTTCTAATTGCTGTTAGGTGTTCTTTAGTGCCTTCAAATATTTGGGTTTGGTTGTTGTTTATTTTATTCAGGTTTTTGGTTTTTTGTTTTGGTTTTGTTTTGAGATGGAGTTTTGCTCTTGTCGCCCAGGCTAGAGTGCAATGGCACGATCTGAGCTCACTGCAACCTCTGCCTCCCAGGTTCGAGTGATCCTCCTGCCTCAGCCTCCTGAGTAGCTGGGAATACAGGCATGCACCACCACGCCTGGGTAATTTTTGTATTTTTAATAGAGACAGGGGTTTCACCATGTTGACCAGGCTGGTCATGAATTCCTGACCTCAGGTGATCCACCTGCCTCGGTCTCTTAAAGTGCTGGGATTACAGGTGTGAGCCACTGTGCCCAGCCAGGTTTTTTGTTGTTGTTGTTATTGTTTTGTTTTTAAGAGACAGGATCTTGCTTTGTTGCCCAGGCTGGAGCACAGTGGTATGATCATAGCAAACTGCAGCCTTGAACTCCTGAGCTCCAGCAATCCTCCTGCCTCAGCCTCCCAAGTAGCTGGGACTACCAGCGCATATCACCATGCCTAGTTAATTTTTTGAAAACTATTTTGATAGAGATGGAGTCTTGCTGTGTTGCCCAGGCTGGTCTTGAACTCATGGCCTCAAGCGATCCTCTCACCTAAGTCTCCAAAGGTGCTAAGATTACAGGCATGAGCCACTGTACCTGGCCTTGTTTCAGGTTTTTTTTTGTTTTTGTTTTTGTTTTTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACTTCCTGGGTTCAAGTGATTCTCCTGCCTCAGCCACCCGAGCAGCTGGGATTACAGGTGTGCACCACAAGCCTGGCTAATTTTTTGTGTATTTTTAGTAGAGATGAGGTTTCGTCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAAATGATCTGTCTTCCTCAGCCTCCAAAAGTGCTGGAATTACAGGCGTGAACCACGGCACCTGGCCCTTGTTTCAGTTTTATAATTGCTATCTGAGGCATGATTATTCTGACCAAATTATTGTGCTATTAGGGAAACCATTTGTTTAAGTTCACATAGCTAGTTTGTGGAAGAGCCAAAATCTAAAACCAGTCAGATTACATAATCCTATGCTTGCTCCAGTTCACCACTATTCCTAAACACCTCAAGGTGGTTTGGATTCCAGCCTAGAGCCCTCTGGAAAGTATTTGGGGCTGGAAGGAGGAAAGAGCCCTCAAAACTCCTATTCAGGCTAGGGCAGTAGTTGCCCAGGCTGGAGTGCAGTGGAACAATCTTGGCTCACTGCAACCTCTGCCTGCCGGGATCAAGCAATTCTCCTGCCTCAGACTTCTGAGTAGCTGGGATTACAGGCGTACACCACCAAGCCCAGCTAATTTTTGCATTTTAATAAAATCACAAAGCCAGACTTAGATAGTTGAAAGTGCCCACCTCTGTTCCTGAGAGTTGGGCCTGAGACAGAGGATTCTAAGTGGAAACCACGCTCAACTAAGAGGACCCAAGAAAGGCAAGTTCTTTTTAAAAATTTTTTTTTCATTTTTTGTCTCTCTCTGTCACCCAGGCTGGAGTGCAATGGTGCAATCATGGCTCACTGCAGCTTTATCCTCCTGGGCTCAAGCCATCTTCCCACCTCAGCCTCCCAAGTAGCTGGGACTACAGGCACATGCCACCATGCCTGGCTAATTTTTATATTTGTTGTAGACAAGTTTTCACCATGTTGCCCAGGCTAAGTCAAACTTTTCTTTTTTTTCTATTTTTTATTTTTTTTAATTATTATTTTTTGAGATGCAGTCTCGCTCTGTCGCCCAGGCTGAAGTGCCATCTCTGCTCACTGCAAACTCCACTTCCTGGGTTCCTCAGCCTCCCGAGTAGCTGGGACTACAGGTGCCTGCCACCACGCCCAGCTAATTTTTTGTATTTTAATAGAGACGGGGTTTCACCGTGTTAGCCAGGATGGTTTCGATCTCCTGACCTCGTGATCCACCCGCCCGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCATGAGCCACTGCGCCTGGCTCAAATTAGATTTCTATATCCAGTAACAGTATCCTTCAAAAATGAAGACAAAACAGAGACATTGTCAAATAAACAAAAACTGAGTTT
>URS00011F5567 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGTGAACGAGGGAGCTTGCTCCCTCCGGATCAGTGGCGAACGGGTGAGTAACACGTGAGCAATCTGCCCTGGACTCTGGGATAAGCGTTGGAAACGACGTCTAATACCGGATACGAGACGCGAAGGCATCTGCAGCGTCTGGAAAGAACTTCGGTCCAGGATGAGCTCGCGGCATATCCGTGAGTTGGTGAGGTAACGGGTCACCAAGCCTACGACGGGTAGCCGGCCTGAGGGGGTGACCGGCCACGCTGCAGCAGAGATACGGCCCAGACTGCTACGGGAGGCATGAGTGGGGAAGGTTGCACAATGGGCGCAAGCCTGATGCAGCAACGCCGCGTAGGGGACGACGGCCTTCGGGTTGTACACCTCTTTTAGCAGGGGAGACGCGAAAGTGACGGTACCTGCAGAAAGAGCACCGGTTAACTACGTGCCAGCCGCCGCCGTAACAC
>URS0000FFF241 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGCTTCTTAAGTCGGTGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTCGATACTGGGAAGCTCGAGTCCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGATACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGGG
>URS0002017531 rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGACCTTCGGGTCTAGTGGCGCACGGGCGCGTAACGCGTGGGAACCTGCCTTTAGGTTCGGAATAACTCAGAGAAATTTGAGCTGATACCGGATGATGTCTTCGGACCAAAGATTTATCGCCTTTAGATGGGCCCGCGTTGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCATAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTACCCGAGATGATAATGACAGTATCGGGAGAATAAGCTCCGGCTAACTCCGTG
>URS0000DCAE13 sRNA from 1 species 
GCAACCCGATGTCGGGGGCTTGGGCGGAAGCCCACGTTGCCCGACAAAAAACGTACCCCCGGCGCGGTCTGCGCCAAGGAATCGAAATGAAGCAACGTGAGCAGTCCGCCCCGTTCGCGGGAAGTGGACGGCAACACGGTCTTCCAATGTATACTAAACGACTCTCGGCAACGGATATCTCGGCTCTCGCATCGATGAAGAACGTAGCGAAATGCGATACTTGGTGTGAATTGCAGAATCCCGTGAACCATCGAGTTTTTGAACGCAAGTTGCGCCCGAAGCCATTAGGCCGAGGGCACGCCTGCCTGGGCGTCACGCGCTCCGTCGCCCCGCAACCCCGAACCCCGAAACGGGCCAGGGTACTTGTGGTGCGGAGATTGGTCTCCCGTGTGCCTTGCTCGCGGCTGGCCTAAAATTGAGTCCCGGGCGCTCTGTTCTGCGGCCGACGGTGGTTGAGAAGCCCTCGAAATTGTGCTGCTGCAGTGCTGCCCGATGCGGACCCTGTGACCCTTGCGCGACCTCTCCCCTTGGGGTGAGGGAGCTCCATCTGA
>URS000109E99B rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTGAGTTAAGTCTGTCGTGAAAGCCCCGGGCTCAACCTGGGAATGGCGATGGATACTGGCTCGCTAGAGTGCGGTAGAGGAGAGTGGAATTCCCGGTGTAGCAGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS0001484F89 rRNA from 1 species 
CCTACGGGTGGCTGCAGTGGGGAATATTGGGCAATGGAGGCAACCCTGACCCAGCAACGCCGCGTGAATGATGAAGGCCTTCGGATTGTAAAGTTCTTTTCTTCGGGACGAAGAAAGTGACGGTACCTTAGGAATAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGAGGCAAGCGTTATCCGGAATGACTGGGCGTAAAGGGTGAGTAGGTGGTTGGACAAGTTAGACGCGAAATTCCGGGGCTCAACCCTGGAACTGCGTCTAAAACTGTTGGTCTTGAGTGAAGGAGAGGCAGTCGGAATTCCGGGTGTAGCGGTGGAATGCGTAGATATAAGGAGGAACACCAGTGGCGAAGGCGGATTGCTAGACTGTAACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCCAGTAGTC
>URS0002155384 rRNA from 1 species 
TCAAGTTACTAAGGGCATGTGGTGGATGCCTTGGCGCCTGGAGCCGATGAAGGACGTGGCGTGACTGCGAAAATCCCTGGCTAGCTGTCAAGCGAGCTTAACCGGGGGTATCCGAATGAGGCAACTCAGCTCAATTTTATTGAGTTACCGCTGATTGAACACATAAATCAGATGGAGGGAACCGGGGGAACTGAAACATCTAAGTACCCTGAGGAATAGAGATTATTCCCTTAGTAGCGGCGAGCGAACGGGGAACAGCCCAAACCGTCTTCTGCGGAAGGCGGGGTTGTAGGACAGTTCATATGGAGTTACAAATTGTTTCGATAGCTGAAGCGCCTGGGACGGCGTGCCACAGATGGTGACAGCCCAGTAAGTGACATTGAAACAACTCCGAGCTGTATCCTGAGTAGTGCGGGACACGAGAAATCCCGTATGAATCTGGGAAGACCACTTTCCAAGGCTAAATACTCCAGGCGACCGATAGCGTATAGTACCGTGAGGGAAAGGTGAAATAGTACCCCGAGAGGGGAGTGAAATAGTTCCTGAAACCGCATGCTTACAAGCAGTTGGAGCCAGTTCGTTCGCGAATTGGTGACAGCGTGCCTATTGAAGAATGAGCCAACGAGTTACGTTCAGTGGCAAGGTTAAGCGATGAGAGTCGTGGAGCCGTAGCGAAAGCGAGTCTTAAAAGGGCGAAAGTGGCTGGACGTAGACCCGAAACCGAGTGATCTACCCATGGGCAGAGTGAAGCGGGAGTAATGCCCCGTGGAGGCTCGAACCTTCCTGAGCTGCAAATCAGTTGGATGACCTGTGGGTAGCGGAGAAATTCCAATCGAACTCGGAGATAGCTGGTTCTCCTCGAAATGTATCTAGGTACAGCCTCGTGTGTTTTCTTCTGGGGGTATGGCTCTGAATGGACTAGGGGGCATAGCGCTTACCAAACCCAATCAAACCGGGAATACCAGAAGATTAGAACGCGGGAGTGAGACTGTGGGAGCTAACTTCCATGGTCAAGAGGGAAACAACCCAGACCCCCGGCTAAGGTCCCTAAATCCATGCTCAGTGTGCAAGGATGTCCAGTTGCATAGACAACCAGGATGTTGGCTTAGAAGCAGCCACCATTTAAAGAGTGCGTAACTGCTCACTGGTCGAGTGGCCGGGCGCCGACAATGTAACGGGGCTCAAGCATGGTACCGAAGCTAGGGGACCGCTTTTTAGCGGTCGGTAGAGGAGCGTTCTGTATGCGATGAAGCTGTGCGGGTGACCGTCGGTGGAGCGTACAGAAGTGAGAATGTTGGCATGAGTAGCGAAATTCAGGTGAGAACCCTGAACGCCGTAAGCCCAAGGGATCCTACGCAAAGCTAATCCGCGTAGAGTTAGGCGGGCCTAAGCCGAGGGCGAGAGCCGTAGGCGATGGACAGCAGGTAAGTATTCCTGCCCCACCATATGGGCGTTTGAGATGTGAGGTGTGACCCAGAAGGATAGACAGAGCGGGCCCTGTGGACATGGTCCGTCCCTACACCGTAGGCGTCTGACGATAGGAAAATCCGTTGTCAGGTTAAGCGGAGGGTGAGGGGGGCAGTGGAGACTTCGGTCAAAACGACTCTGTTGAGTCCATGCTGGCTAGAAAAGCATCGGCATCGAGTGCATATGGTGTCCGTACCGCAAACCGACACAGGTGGGCGACGGTAAGTACCGTAAGGCGAACGAGAGAACCTTCGTTAAGGAACTCGGCAAAATAGCTCCGTAACTTCGGGAGAAGGAGCGCCCTTGTGAGTGAAACACTTTACGTGTGGAGCATCACGAGGGCCGCAGTGAGCAGGCCCAGGCGACTGTTTAACAAAAACACAGGTCTCTGCGAACCAGTAATGGGATGTATAGGGGCTGACGCCTGCCCAGTGCCGGAAGGTTAAGGAGATGGCTGAGAGGCCAGAACTGAAGCCCCGGTGAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCCGCACGAATGGCGTAACGATCTGGGCACTGTCTCAACGAAGGACTCGGCGAAATTGAGATGGCCGTGAAGACGCGGCCTACCCGCAGCAGGACAAATAGACCCCGTGGAGCTTTACTGCAGTTTTGCGCTGGCGTATGTGATTAGTTATATAGTATATGGGGGAGGCTTTGAACCATGACCGTCAGGTTGTGGGGAGCCGTCAGTGGAATACCCCATTTCTAATTTTGTACTCCTCACCAGTGAGCAAGCACTGGGACAGCGCATGATGGGCAGTTTGACTGGGGCGGTCGCCTCCGAAAGAGTAACGGAGGCGCGCAATGGTTCCCTCAAGGTGGATGGTAATCACCTGTCGAGTGCATTGGCATAAGGGAGCTTGACTGCAAGACAGACAAGTCGAGCAGGGGCGAAAGCCGGCCAAAGTGATCCTATGGTCCCGAGTGGAAGGGCCATGGCTTAACGGATAGAAGCTACCCCGGGGATAACAGGCTGATCCTTCCCAAGAGTTCACATCGACGGAAGGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGAAGAAG
>URS000254E3BB rRNA from 1 species 
AACGGCTATACCATGCTGAATATACCGGTTCTCGTTAGATCACCAAAGTCAAGCATCAGTGGGCGCAGTCAGTACTTGGGTGAGTGACCATCTGGGAACACCGCGTGCCGTT
>URS00000821D9 rRNA from 1 species 
TGCGAACGTTTGCGGCGGGCCTAACACATGCAAGTCGAACGCACTAGCAATAGTGAGTGGCGCACGGGTGCGTAACACGTGGGTAATCAACCCTTCAGCCTGGGATAACGACTCGAAAGGGTCGCTAATACCGGATACGGCGCGAGAGGCTTCGGCTTCTCACGAGAAAGCCACGCAAGGGGCACTGAAGGACGAGCCTGCGGCCCATCAGCTAGTTGGTGAGGTAAGAGCTCACCAAGGCTAAGACGGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCCACGCCGCGTGAGCGATGAAGGCCTT
>URS00005A9635 rRNA from 1 species 
GGGGCCTGCGGTTAATTTGCTCAACACGGGGAAACTCACCAGGTCCAGACACAATGGGTTGACAGTTGATAGCTCTTTCTTGATCTTGTGGTTGGGGGCATGGCCGTTCTTAGTTGGTGGGTGATTTGTCTGGTTAATTCCGATAACGAACGGCCATCCCCTGCTAAATAGCCGGCCGGCTTTGGCTGGTCGCTGGCTTCTTAGAGGGACTTTTAGCGTTTAGCTAAAGGAAGTTGGTGGCAATAACAGGTTAACGTCTATAATCACAGGCCTGTAAAAGCGGTGGTGCCAACTTATAAGTGCTAGTGATCTAGTGCTACAAAATCCGCTAGTCCAAGAGGTTAATCGATGCGGAAAAGCTTTCCATAGTCGGGCATCGAGAGTGTTTTAACTAACACTTGCTTCTGGGCGACACAACCTGGTACAGGGAACGCCAAACAGGTAATGCTGAGGTCGATCCTGTGGTGAGTTAGAGTAGCGTCTAACCATCGCAACGCGCGCAAAGGTGTGGGTCTTATCTGTGGATAAGGCTTAAGGTACGTGCTAATCCCACTAGTAATAGTGGTTTGCTTGAGAGCCCACAGCTAAATCAGTAAAGGGTTTGGACTTTAAGTTCAGACCGAATCCATTA
>URS0000F720C2 rRNA from 1 species 
ACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGCGAAAGCCTGACCCAGCAACGCCGCGTGAAGGAAGAAGGTCTTCGGATTGTAAACTTCTTTTATGAGGGACGAAGGACGTGACGGTACCTCATGAATAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCAAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCTGTGCGACAAGTCAGGGGTGAAAGCCCGCCGCCCAACGGTGGAACTGCCTTTGATACTGTCGCGCTGGAATACGGATGCCGTGGGAGGAATGAGTAGTGTAGCGGTGAAATGCATAGATATTACTCAGAACACCGATTGCGAAGGCATCTCACGAATCCGTCATTGACGCTGAGGCACGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTA
>URS0002411ED0 lncRNA from 1 species 
AGCATTATATCCCCACGTTTGGCACATTAATCAACCCAATGTCAATCAAACCAATTGCAAAAGTCCTTTTCTTGGGTAAGTAAGTCTCCTACAACTCGCTAACCCTTTCTAATTGCTACAGGTTTTGTCTTAGAAGCACATAAGGGTATGGACATAGTCATGGATACGCATGTCAAGGAGGACACGTGTGTCCATAACGCGTCCCCAATGAGTCCAATAAAAAAAATAATTAAAAAATAGACAAGCCAAGTGGCATGTCAGTGTTCGACACGTGTCACACAC
>URS000239296D lncRNA from 1 species 
TTTTTCCAAAACAGCAAAGCACGTCTCCTTAATAAAAGCACCAAGAACTTTACATGAATGTATTTATCGAAGATTCAGTAGCAAGGGCATTATTTACAAAAGGGACCATTTTGCCCCTTACAGGAGACAAAAAACAAACCCATTGAATTGGCATGATCTCAGAACAGCTCCATAATTTAATGAAACTCATGGATTCTCTTGAACTCCCCACCGCCCAAACCAAAATTGAACCTGACAAACAAGTACTGCAAATCACAAAAAAATAACCCACTCTTACTGGCTATTTTCACGCTTGTTTTTGCTGCTTCCACTCTCTTCCCCCTCCCCTGTGGCGTGACCTGTAACCACGTCTATTCAAAAACAAATTTGGAAATAGCAAGCTAACGCCGGTAAAAGAAACAGCAAAAAAGGAAACAAATAACCCTCTTTGATATTTAATACTTGATGACAACGTCAAGATTTCTTTAAAAACTACTGTTACTGTTATTTCCACGCTTGTTTTTGCTGTTTCCACTACCTTCCCCTGCCGCACCCTGACCTGTAACGACATCTCTTCAAAAACAAATTTGGAAATAGCAAGCTAACGCCGATAAAAGAAACAGCAAAAAATGAAACAAATACCCTCTTTGATGTCTAATACTTGACGACAAGGTCAAGATATCTGAAATTGAAAAAAATATGCAGAGAAAAACAGAGTTCTTGCCAAATCCAGATGAAAAAGCATGAAATTGTGGGAATTAGACATGGGTTTTGCTTAATTGTGAAGAGGGTTGGGGCCGGAGGGGACTAGTCTCTTCTCAACGCCGTATCTTGGATCGATTTCGTCGATTGGCGGCAGCGGTGGTGACAGAGGAGGGCCGTGGGGGATTCTTGGAAGGTTGTAGTAGCACATGGTGTTGCAAGAACGGGGTATATGGTGGCAGTGGTGGTGGCGGCTTTGGCTTGAAGAGGTTTCCCGCGACTTTGGGTTTGGTAATACTTGGGCCGATGATGATGATGGGACTATGAGTAGAAAAATTGTGAGAATCTGTAGGTGGCTAATGAGTGGCATGGTTGAAGAGAGAGAGAGCTCTTCACGGCTTGCACTCTGTGCTTAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGGAGTGGTGGTGGTGTTTATAGGAGGAGACGGGAAACTTGATTAATTTCAATCTTGATAGTAAAGATGACAACAAC
>URS00025DB68B rRNA from 1 species 
ATGAGCATGCAGTTGATGGTAGCCACTTTCAATAACTACCAGGAGTTAGTAGATCGTGCGCTTATGATTGAAGGAAAGCAGCAGCAGATTGACAATCGTAAGAGGAAGTATGCACAGGGGAAGTACAATTCTGGAGCTCAGCAGAAGCCACGTTTTACCCCAAAGTCAGGGGACACTTTCAGCATACTCATGGAGGAGGCAGCTCGCACAATCATAATGGCACAAAGAATGGAAACGGAAATGGAGGAAGCAATGGACAAAACCGCACCAACCCGTCAACACCATCCAAGGCAGACCTGA
>URS0000382751 rRNA from 1 species 
GATCGACCGCAGTCTACGAACCATGACTGCATGTACCGAACGATCGGGTAAGAAGCTCATAAGTACTGTAGAGAACGAGTCTATCATTGTGACGTACTAGATAGCCCGCTACTACGTCAGCAGCGCGTATCGGTAGTCGAGCGTATCGATTACTGCGTAAGCAGGCAGACGTATAGCAGATGTGAAATCCTGCTCAACTGGAACTGCGTCTGAACTGATAGCTAGAGTGGTCAGAGGGGGGTAGATCACGTGTAGCAGTGAATGCGTAGAGATGTGGAGGATACCGATGCGAAGCAGCCCCTGGATAACACTGACGTTCATGCTCGAAGCGTGGGTAGCAACAGGATTAGATACCCTGGTAGTCACGCCTAAACGATGTCGATTAGCTGTTGGGCAACTTGATTGCTTAGTAGCGTAGCTAACGCGTGAAATCGACCGCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGATTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATGTACGGAACCTTCCAGAGACGGAAGGGTGCCTTCGGGAGCCGTAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCATTAGTTGCCATCATTTAGTTGGGCACTCTAGCGAGACTGCCGGTAATAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGCTGGTACAACGAGTCGCAAGCCGGTGACGGCAAGCTAATCTCTTAAAGCCAGTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGAGGTAACCGTAAGGAGCCAGCCGCCTAAGGTGGGATAGATGATTGGGGTGAAGTCGTAACAAGGTAGCCGTATCGGAAGGTGCGGTTGGATCACCTCCTTC
>URS000256CAD8 rRNA from 1 species 
ATGTCATGTGCATTCCCTGTGCCCATTATTTGCTCACATGACATGATTGCCATGATTTCTTCTAGTGTGTTGCATTTTCGCTCCACTAGTTTGCACGACTTGATTACTATGCTTCCTTATGTTGCATCACCAATGACTCATACTTGCTCATTTCATGCGGTTGACGACAACCATCTATATGCTTTGCACACGATTCATATTGCTCCTTGTCATATCTCTCCATATGTTGACTCCCTCATGCTAGATGATTTGCCATGTATTGAGTGCAATTATGCCTTTATTCCTTATAATGAGTTTGCCCCCATAGCGCATTCTCACATATATTTGGAGATTTTGACATATTCCTTGTGA
>URS0001407240 rRNA from 1 species 
GACGGAGGATGCAAGTGTTATCCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGCACTGTTAGTCAGGCGTGAAAGTCCTGGGCTCAACCTGGGAACTGCGCTTGATACGGCAGAGCTAGAGGATGGAAGAGGCTCGCGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCGGTGGCGAAGGCGGCGAGCTGGTCCATTACTGACGCTGAGGCGCGACAGCGTGGGGAGCAAACAGG
>URS00021EF7D7 rRNA from 1 species 
ACTTACGGCCACACCGCCTGGTTCACGCCCGATCTCGTTTGATCTCGGAAGCTAAGATAGGTTGGGCCTGGTTAGTACTTGGATGGGAGACCGCCTAGGAATACCAGGTGCTGTAAGGC
>URS0000188C7A rRNA from 1 species 
GAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGTGATTTTTGTGGAAATTCTTTCGGGAATGGAAATGAAATGAAAGTGGCGAACGGGTGAGTAACACGTGAGCAACCTACCTTACACAGGGGGATAGCCGTTGGAAACGACGATTAATACCGCATGAGACCACAGAATCGCATGATATAGGGGTCAAAGATTTATCGGTGTAAGAAGGGCTCGCGTCTGATTAGCTAGTTGGAAGGGTAAAGGCCTACCAAGGCGACGATCAGTAGCCGGTCTGAGAGGATGAACGGCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGGAACCCTGATGCAGCGACGCCGCGTGAGCGAAGAAGGTTTTCGAATCGTAAAGCTCTGTCCTATGAGAAGATA
>URS0000626BAC rRNA from 1 species 
TGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAAGGAAGAAGTATCTCGGTATGTAAACTTCTATCAGCAGGGAAGATAATGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGGCGGCGGAGCAAGTCAGAAGTGAAAGCCCGGGGCTCAACCCCGGGACGGCCTTTGAAACTGCCCTGCTTGATTTCAGGAGAGGTAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACTGACAATGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATACTAGGTGTCGGGGCTCATAAGAGCTTCGGTGCCGCAGCAAACGCAATAAGTATTCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGCCTTGACATCCTGCTGACCGGTGAGTAATGTCACCTTTCCTTCGGGACAGCAGAGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATGTTCAGTAGCCAGCATTAAGGATGGGCACTCTGGACAGACTGCCGGGGATAACCCGGAGGAAGGCGGGGATGACGTCAAATCATCATGCCCCTTACGGCCTGGGCTACACACGTGCTACAATGGCGTAAACAAAGGGAAGCAAGAGGGTGACCTGGAGCGAATCCCAGAAATAACGTCCCAGTTCGGACTGTAGTCTGCAACCCGACTACACGAAGCTGGAATCGCTAGTAATCGCGAATCAGCATGTCGCGGTGAATACGTTCCC
>URS00017894DA rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCGTGTAGGCGGTCCGGTAAGTCAGCTGTGAAAGTCAAGGGCTCAACCCTGGAATGCCGGTTGATACTGTCGGGCTAGAGTCCGGAAGAGGCGAGTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCGGGAGGAACACCAATGGCGAAGGCAGCTCGCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCAAACAGG
>URS00003589C1 rRNA from 1 species 
CCGCGAATTCGCCCTTCGGGGTGCACCAGGCGCGAAACCTTTACAATGCTGGCAACGGCGATAGGGGGACCTCGAGTGCCAGGTTACAAATCTGGCTGTCGTTGTGTCTAAAAAACACGATATAGCAAGGGCCGGGCAAGACCGGTGCCAGCCGCCGCGGTAACACCGGCGGCTCGAGTGGTAACCGTTATTATTGGGTTTAAAGGGTCTGTAGCCGGCCTGGTTAGTCCTTTGGGAAATCCGGCAGCTCAACTGTCGGGCTTTCAGAGGATACTGCCAGGCTCGAGACCGGGAGAGGTAAGAGGTACTTCAGGGGTAGGGGTGAAATCTTGTAATCCTTGAAGGACCACCAGTGGCGAAGGCGTCTTACCAGAACGGATCTGACGGCAAGGGACGAAAGCTAGGGGCACGAACCGGATTAGATACCCGGGTAGTCCTAGCCGTAAACGATACTCGCTAGGTGTCGGCCACGGTGCGACCGTGGTCGGTGCCGTAGGGAAACCGTGAAGCGAGCCACCTGGGAAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCAC
>URS00024242CB lncRNA from 1 species 
CTAGGTCTTAGTTAATAATTGTTTTTATATTTTCAACTTATACCCCATTGAAAAACCCAACAGCCAAGCGGCTGGGTTTAATTATGGTAGTCCAACAGATTTTTTTTTATTAGTTTTTATTTTAATCCTAATTTTTAATCTATCTTGATTTATATATCCAAGTTGTTGTTGTAAATAATAACTAGTCATGAATGGCCTAGAGGAGAGAGGGTAGTTTCTAGGTCTTTAGTGGAGTGGGTTCAATACCCACATTTGTAGCATTTTTTTTTCTTTTAGCATTTTATTTCTTTTAGCATTTTTTATGTTTATGTTTT
>URS00010F895C rRNA from 1 species 
ACGAACGCTGGCGGCGCGCCTAACACATGCAAGTCGAACGAGCGAGAGAGAGCTTGCTTTCTTGAGCGAGTGGCGAACGGGTGAGTAACGCGTGAGGAACCTGCCTCAAAGAGGGGAACAACAGTTGGAAACGACTGCTAATACCGCATAAGCCCACGACCCGGCATCGGGTAGAGGGAAAAGGAGTGATCCGCTTTGAGATGGCCTCGCGTCCGATTAGCTAGTTGGTGAGGTAACGGCCCACCAAGGCGACGATCGGTAGCCGGACTGAGAGGTTGGACGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGGAGGAAGAAGGTCTTCGGATTGTAAACTCCTGTTGTTGAGGAAGATAATGACGGTACTCAACAAGGAAGTGACGGCTAACTACGTGCCAGCCGCCGCAGTAAGAC
>URS000253A30D misc_RNA from 1 species 
TCCGGGTTTCGCCCGGCAGTCTCCCTAGATTATTCAACATAGGACAAGGGTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACACGAGCTGACGACAACCATGCACCACCTGTGTACGGCCCAAAAGGACACCGTATCTCTACGGCTTTTCCGTACATGCCAAACCCAGGTAAGGTTCTTCGCGTTGCCTCGAATTAAGCAACATGCTCCGCCGCTTGTGCGGGCCCCCGTCAATTCCTTTGAGTTTTAGCCTTGCGGCCGTACTCCCCAGGCGGGGCACTTAATGCGTTAGCTACGGCACAGATCCCGTTGGTTGAGACCCACACCTAGTGCCCAACGTTTACGGCGTGGACTAC
>URS000078C8E8 rRNA from 1 species 
CCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGACGAAGCGCAAGTGACGGTACCTGCAGAAGAAGCGCCGGCCAACTACGTGCCAGCAGCCGCGGTAAGACGTAGGGCGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTCGCGTCGACTGTGAAATCCCGCGGCTCAACCGCGGGTCTGCAGTCGATACGGGCAGGCTAGAGTTCGGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGGTCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGTTGGGCGCTAGGTGTGGGGGACCTCTCCGGTTCTCTGTGCCGCNGCACGCATAGCGCCCGCCGTCGGGAGGTACGGCCGCGACGACGTAAACGTTAAATAGAGTTAGACGGCGTGAGACGTGACCGACGGACGACGACGAGGGAGGTTAGG
>URS0000E2B2B0 rRNA from 1 species 
CCCCTAGTAACTGCGAGTGAAGCGGGAAGAGCTCAAATTTAAAATCTGGCAGTCTTCGATTGTCCGAGTTGTAATTTAGAGAAGTGTTATCCGCGCTGGACCGTGTATAAGTCTCCTGGAAGGGAGCATCATAGAGGGTGAGAATCCCGTCTTTGACACGGACTACCAGGGCTTTGTGATGCGCTCTCGAAGAGTCGAGTTGTTTGGGAATGCAGCTCTAAATGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGAACTTTGGAAAGAGAGTTAAACAGTACGTGAAATTGCTGAAAGGGAAACGCTTGAAGTCAGTCGCGTTGGCTGGGGATCAACCTTTCTTCTGATTGGTGTACTTCCTAGTCGACGGGTCAACATCAGTTTTGACCGTTGGATAAAGGTTAGGGGAATGTGGCATCCTCGGATGTGTTATAGCCTCTGATTGTATACAATGGTTGGGACTGAGGAACTCAGCACGCCGCAAGGCCGGGTTTTTAACCACGTACGTGCTTAGGATGTTGGCATAATGGCTTTAATCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGCCTGCGAGTATTTGGGTGGAAAACCCATATGCGTAATGAAAGTGAAAGTTGAGAACTCTGTCGTGGAGTGCATCGACGCCCAGACCAGACCTTCTGTGACGGATCTGCGGTAGAGCATGTATGTTGGGACCCGAAAGATGGTGAACTATGCCTGAATAGGGTGAAGCCAGAGGAAACTCTGGTGGAGGCTCGTAGCGATTCTGACGTGCAAATCGATCGTCGAATTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCTGCCGAAGTTTCCCTCAGGATAGCAGAAACTCATTATCAGATTTATGTGGTAAAGCGAATGATTAGAGGCCTTGGGGTTGTAACAACCTTAACCTATTCTCAAACTTTAAATATGTAAGAACAAGCCGTCTCTTGACTGGACCGCTTGGCGATTGAGAGTTTCTAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGAACGCGAGGTTAAGGTGCCGGAATTCACGTTCATCAGACACCACAAAAGGTGTTAGTTCATCTAGACAGCAGGACGGTGGCCATGGAAGTCGGAATCCGCTAAGGAGTGTGTAACAACTCACCTGCCGAATGAACTAGCCCTGAAAATGGATGGCGCTTAAACGTGATACCCATACCTCGCC
>URS00007CECD4 rRNA from 1 species 
ACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCCATGCCGCGTGAATGATGAAGGTCTTAGGATTGTAAAGTTCTTTCGCTCGTGACGATGATGACGGTAACGAGAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAA
>URS00004EF8E6 rRNA from 1 species 
GAATCTGCCTGTGGGTCGGGGACAACCACTGGAAACGGTGGCTAATACCGGATGAGCCGAAAGGTAAAAAATTTATTGCCCACAGATGAGCTCGCGTCTGATTAGCTAGTTGGTAAGGTAAAAGCGTACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGAGCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAAGACCGCGTGGGGGAGGAAGGTTTTTGGATCGTAAACCCCTTTTGTCAAGGAAGAAGTTCTGACGGTACTTGACGAATAAGCCTCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGAGGCAAGCGTTATCCGGAATGATTGGGCGTAAAGCGTCTGTAGGTGGCCAGCTAAGTCTGCTGTTAAAGATCACAGCTCAACTGTGGGAAGGCAGTGGAAACTGGCAAGCTAGAGGCTGGTAGGGGTAAAGGGAATTCCCGGTGTAGCGGTGAAATGCGTAGATATCGGGAAGAACACCGGTGGCGAAAGCGCTTTACTGGGCCAGACCTGACACTGAAGGACGAAAGCTAGGGGAGCGAAAGGGATTAGATACCCCAGTAGTC
>URS0001F5106B rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCAAATGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS0001EC9022 rRNA from 1 species 
ACGAACGCCGGCGGCGTGCTTAACCCATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS000222C3C5 misc_RNA from 1 species 
AGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAGCTCGTAGTTGAATTTCGGGATCAATATGTTGGTCGTGCCTCGGTACGTACTAGCATATTGGTTTCTCCTTTCTGAAGAACCATGATGTCATTTATTTGGTGTCGTGGGGAATCAGGACTGTTACTTTGAGAAAATTAGAGTGTTTAAAGCAGGCTCACGCTTGAATACATTAGCATGGAATAATGAAATAGGACGTTTGATTCTATTTTGTTGGTTTCTAGGATCGACGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGATGATGTTAATTTTTAATGTACTCTATTCC
>URS0002325A80 pre_miRNA from 1 species 
AAAAAGACAAACCCTGGTTTCCGTGCCCAACGTTTGACCGTCTGTCTTATTTAAAAAAATTATGAAAAAAATTAAAAAGACAAGTCATGCATAAAATATTAATCATGTTTTATCATCTAACAACAATGAAAATACGAATTATAAAAAAATTTCATATAAGACGAACAGTCAAAGTTGGACACGGAAAACCAGGGTTTGCCTTTTT
>URS000130A086 rRNA from 1 species 
GTAGGTGGCAAGCGTTGTCCGGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTCTTTAAGTCTGATGTGAAAGCCCACGGGCTCAACCGTGGAGGGTCATTGGAAACTGGAGAACTTGAGTACAGAAGAGGAAAGCGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGGCTTTCTGGTCTGTAACTGACGCTGAGGCGCGAAAGTGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGCCGCAAAGGCTG
>URS00002466F2 rRNA from 1 species 
CCCCTACGGGAGGCAGCAGCGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGGGGGTGAAGGCCTTCGGGTTGTAAACTCCTTTCGCCCGGGACGAAGCCCACCTGGTGGGTGACGGTACCGAGCGAGGAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATGGGG
>URS00012DC715 rRNA from 1 species 
TACAGAGGTCTCAAGCGTTGTTCGGATTCATTGGGCGTAAAGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTCGGAGCTTAACTTCGAAACTGCATTCGATACTGCCGTGCTTGAGGACTGGAGAGGAGACTGGAATTTACGGTGTAGCGGTGAAATGCGTAGATATCGTAAGGAAGACCAGTGGCGAAGGCGGGTCTCTGGACAGTTCCTGACGCTGAGGCACGAAGGTCAGGGGAGCGAAACGGGGATTAGA
>URS000259BFCE rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGGGTGCGTAGGCGGATCTTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGAAGGTCTTGAGTTCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAGGAACACCAGTGGCGAAGGCGGCTCACTGGCTCGATACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGG
>URS000164E0EC rRNA from 1 species 
CAGTCGCCACGGTAATACGGAGGGAGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGTTACTCAAGTCAGAGGTGAAAGCCCGGGGCTCAACCCCGGAACTGCCTTTGAAACTAGGTGACTAGAATCTTGGAGAGGTCAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAGGAGCACCAGTGGCGAAGGCGGCTCACTGGTCCGGTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCCCGTAGTCCCTGTCTCTTATAT
>URS0000370A15 rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGGCAGCACAGCAGTAGCAATACTGTGGGTGGCGAGTGGCGGACGGGTGAGGAATACGTCGGAATCTGCCCAGTCGTGGGGGATAACTAGCCGAAAGGTTAGCTAATACCGCATACGACCGAGAGGTGAAAGCGGGGACCGCAAGGCCTCGCGCGATTGGATGAGCCGACGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTTCGGTTGTAAGACGACTTTATTCAGGACGAAAAGACGTT
>URS00019773DC lncRNA from 1 species 
ACACTTATTGAAGATTTATCTTGTATAGATTCTTTCTAAACTGCTTTATATATTCACTCATGTCATCATCACATAAACCTATGATGCAGGTAATAGTATTATCTCTCTTTTACAGATAAGAATACTAAAGCATGGAGAGATTGCTAGCACTAAATCACTTAGCTAATAAATGTCAGGATAAGAATTTGAGTACAGGGAGTCCAGGTCCAGAGTCTGTCCACTTAGTGCTGCCAAGTTGTGTGCGTGTTGGGGGCAATGGGTAGGTTAGAGGCAAAGATAGAGATATATAGATAGTTTTCAAGAGTTCCTGCCATGCCTCAGTGGAAAAGAATCTGACTAGTATTCATGAGGACACAGGTTCGATCCCTGGCCTCGCTCAGTGGGTTAAGGATCTGGCATTGCTGTGATCTGTGGGGTAGGCCATAGATGTGGCTTGGATCCCATGTTGCTGTGGCTGTGGTGTAAGCCGGCAGCTATAGCTCCGTTTTAACCCCTAACCTGGGAAAATCCATATACTGAGGGTGTGGCACTAAAAAGACAAAAAAAAAAAAAAAAAAAAAAAAAGAGAGAGAGAGATAGTTTTCAGATTCTTAATCTTGGTTACATTGGTGAATGGAGTTGGGCATAAAAGGTTGTTGCTTAATGTGGGATGTGATGAGTTTTTTTTTAAAAAACAGCAAGCAAGAAAGAAAAGTTTCACTTATAATTTGATAATGATTAAATTTTTATAATCTGCATCATCACTTTTACCATAAAAATTTCAAACCTGAAAAAATATTCTTTTTTCCTTCAACACATTTAGAAATACTGCTTTTGATTCTAAAAACAAAAAGAATGTAGATGTGGGCGTTCCCGTCATGGCGCAATCCAACTAAGAACCACGAGGATGTGGGTTTGATCCCTTGCCTTACTCAGTGGATTAGGATCCGGTGTTGCCGTGAACTGTGGTTCAGGTCATAGATGCGGCTTGAATCCTCCATTGCTGTGGTTGTGGTGTAGGCTGACAGCTGCAGCTCCAATTCAACTGCTAGCCTGGGAACCTCTATATGCCACAGGTGCAGCCCTAAAAAGCCTTAAAAAAAAAAGAATTTGTCTGTACTACAGGCCCAGTTTGCCACATATACATCTATGTCCTTGGGTCTTGACTTGACCACACCATGCTTTAGTTTCCTCTCCTGCATAAAAGGAATCATGATCCGTCCTCCCCCACTGGCTTGTGGTGAGTATCCAGTAACATCAGAGTTAAGTGCTCTGTGCAATGCCTGGTGCTTTATTCATCTCTCTCAACATTAGCTACCATAGTCATCATTGCCAGGCTGAACTCTTATTGCCCCTTCTCCTGGCCATTTGGAATTAAGATTGCAAACTGATTAAGTCATCTGAAGCAGTCAAGATACCAGGACAATGACGTTGGTGTGCTGAATAGAGAGTGTAAGTATACATGAGAGACTATCCTCAAGTAACTACTGATTAAAAACTGTTAAGTAGTTGTCAACTGGAAAACAAATGCACCATATGAGTTGTGAGTTAAGCTGGGGCAAAATGATGACTATAGCCTGGGAGAAAGCATTTCATATGGCTCTGAAAAACTGCTTTGAAGAGGTAGGAGAATAATATCAGTATATATGTGGTTTTGGTGAAGGGGAGGTACATGCAATCAAGCACAGATTTTGCAGAAGGTCACTGCTAGTCTTGTGAAGGTTACTGCTAATCATGAGGAGCAGATGTATCCACTAATGATTTCATTGCTTCTTTAGATATGAGAAGATGCAAGAATTCAGCGCATAAAATCTTTTAAAAATATCTAACTATCTGAAGGCCTGTTCTGCCAGGGATTCCCAGGCTGCCTCAATCCAGATCTCTACCTTAAACTCTTTCCAAGGGGTATTGAAGGTCAGGGGCTGCAGTGGCTTGTGCCTTAATCCTTGTAGAGACAGATGGCAAGTACCAATTTTTAGTAGTCAAAGGCTTGACCTGCAATGGTGACCTTGACAATGGTCCACCCCCTGAAGTGCTCCAAGCATTGGAGTTTTAGAAATCCAACCTCTGCCCATCAGCTCTCAGAATAAGGGGTCCCTTTTGTTCAAAATGGTGGTGTCTGCCATTGCTCCTTGTTTGCTCAGTAAGGATGAAAAAAGCCCAATAACATTATAAACCCTTCTTAACTCCTGCCTTTTACTTTTGAGGGAAGACTATGTATTCAGGAAGTGCTCATGGCAAAGCCTATTTAAGAAATAAAAAGAACAATAACAAAACATCTCAGAAATTCCTTTTGAAAACAAGAGCCCAGAACTTGCCTGAGACTTAATTGCCGCACACACACACACACACACACACACACGTGCACACACATACAGAGCTTGTCTCCTACATTTTCAGACTGTTTTAAAGTACAAGGCACAACCAGGTTAATAAAACATGCTTGAGGCTATGTTCTGTTTGTTCATTACACTATAAAGCATTTTAAACCTACAATTAATTTTAGATAAATTAAAGATTTGACACAGCCATGGTACTCGTGCAAGAGCATTTGTGTTAATATCTTATATTTTTCATACTCAATCACCCTGCTGAAAAGTTTAACAGCCTTCCATATTTATAACTGCTTTCTAGATTCTTCTTTCTTTTTTTTTTTCCTACCTTAGTTGTCAAAAGCATTAACGAAGCTGGCTTTGGGGAAGAATTCCAATTCAGAGTTATTTTTCCATGAGGTACTTAAGACTCCACACGGCAGCTTGTGATTATGTTGGCAGTGGCTTTGCATAACTGTTGGTTTCCTGTAGTATAAATAAGTGAACAGCTAAGAATGCTAATGTTTTGCTTTGACTAAGAAAAAGCTCTCAATAAATGACAAGGAATTACCCTCATTGGACTACTTAAGTTTTTCTTTCTCCTTCCTTTAAAGGGGTAAGTTAAACCAAAGCAATAGAGATAAGTGATCACATAATACTTGCTACCGCTTTAAGATCATTCTTCAAGTTGCAAAAAAAAATCAAATTGTTTCATTCCCAAAGTCCTTTCTAGTTGAGAAATTGAAGTGGGAGAAAGGCCATGAGGATCACTGGAAAACGCCAATGCAAGCAGTGTCCAATTGCAGCTAAATACAGGGCAAAGAAAGTCAGAGCCTTTGCCCTCTTGAGATTTGGACCAAAAACAGGAAAAAGATGCTTTGGCTAGGAGAAAGGACAGACAGAGTTTAGGGAGGAAAGGTTGCAGAGGAGAAAGCTTGGCAAAAAAGGTGTATGCAGATGGAATTCTCAGGAGCAGCTCCTGAGAGAGGCTTTGCATCATGTCAGCTGTCATGGTCAGGAGCAGGACAGGGACTCTGTGGGATGAGATATTATGGACCTTGCACAGAGCCCTGGGCCTTTGGCTAATTCCACATCCTCCAAAATCTCGAGTACTAAATGTTCCCATCCAGTCTCATCTGTTTTCACTCTTTCCCTCACAGAAGACAATCCCAATAAATGGAGTAAAAGCCAGAGAAATGTCCTCCCAGGACACCTGGCAGCTACCATTGCCCACAAGCTTCTCTGATCCCCACCTACCTTCTACCCAGTGAAGACTCAGCCTTCCAGCTGCCATCCTTCTTTCCAGGACAGGTTGACTGCACTGCCTTGGTGGATGAGCCATTGTTCACTTGGCTGCTATTCTGCAGTTCTGTGTTTCTCCAAAGGGAACCCTCCTGCACTGCTGGAGGGAATGTAAACTGGTACAGCCACTATGGAGAACAGTTTGGAGATACCTTAGAAATTTATACATAGAACTTCCATATGACCCCGCAATCCCACTCTTGGGCATCTATCCGGACAAAACTCTACTTAAAAGAGACACATGCACCCGCATGTTCATTGCAGCACTATTCACAATAGCCAGGACATGGAAACAACCCAAATGTCCATCGACAGATGATTGGATTCAGAAGAGGTGGTATATATACACAATGGAGTACTACTCAGTCATAAAAAAGAATGACATAATGCCATTTGCAGCAACATGGATGGAACTAGAGAATCTCATCCTGAGTGAAATGAGCCAGAAAGACAAAGACAAATACCATATGATATCACTTATAACTGGAATCTAATATCCAGCACAAATGAACATCTCCTCAGAAAAGAAAATCATGGACTTGGAGAAGAGACTTGTGGCTGCCTGATGGGAGGGGGAGGGAGTGGGAGGGATCGGGAGCTTGGGCTTATCAGACACAATTTAGAATAGATTTACAAGGAGATCCTGCTGAGTAGCATTGAGAACTATGTCTAGATACTCATGTAGCAACAGAACAAAGGGTGGGGGAAAAAATGTAATTGTAATGTATACATGTAAGGATAACCTGACCCCCTTGCTGTACAGTGG
>URS0000B9BAF2 tRNA from 1 species 
GTCTTCGTGGCTCAGTTGGTTAGAGCGTTGGTCTCATAGTATGATCCAATCTCAGGTTGGGATATCCAAAGGTCGTGAGTTCGAGTCTCACCGAGGACA
>URS0000679C41 pre_miRNA from 1 species 
CTTTTAATATAAGTATGTCCCATGAAATATTTGGGATATGCTTATACTAAAC
>URS00004B7CE6 rRNA from 1 species 
GGCCGCGGGAATTCGATTCAGGCCTAACACATGCAAGTCGAGCGATTCTCTTCGGAGAAGAGCGGCGGACGGGTGAGTAACGCGTGGGTAACCTGCCCTGTACACACGGATAACATACCGAAAGGTATGCTAATACGAGATAATATGCTTTTATCGCATGGTAGAAGTATCAAAGCTCCGGCGGTACAGGATGGACCCGCGTCTGATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGACGATCAGTAGCCGACCTGAGAGGGTGATCGGCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAAGGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGCGATAGAGGCCTTCGGGTCGTAAAGCTCTGTCCTCAAGGAAGATAATGAC
>URS0000D1B51B rRNA from 2 species 
AAGTCGAGCGGACCGACGGGAGCTTGCTCCCTTAGGTCAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATGCTTGATTGAACCGCATGGTTCAATCATAAAAGGTGGCTTTTAGCTACCACTTGCAGATGGACCCGCGGCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAACTCTGTTGTTAGGGAAGAACAAGTACCGTTCGAATAGGGCGGTACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAA
>URS0000C4FCDB tRNA from 1 species 
GCCTTCGTGGTGTAACTGAAAGCATACTAGACGTGTATTCGATAGGTCCAGGGTTCGAGTCCCGGCGAAGGCA
>URS00022EE1E1 rRNA from 1 species 
CCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGAGATCGGTTTATTGGTCGTGCTATTGTACGTACTGGTATTACCGGTTTCTCCTTTCTGACGAACCTTAATGCCATTAATTTGGTGTTTTGGGAAATCAGGACTGTTACTTTGAAAAAATTAGGGTGTTTAAAGCAGGCTCACGCTTGAATACATTAGCATGGAATAACGGAATAGGACGTTTGATTCTATTTTGTTGGTTTCTAGGATCGACGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGATGATGTTAATTTTTTAATGACTCATTCGGCGCCTTAC
>URS00003E1810 rRNA from 1 species 
ACGGGAGGCAGCAGTGGGGAATACTGCGCAATGGGAGAAAGCCCGACCCAGCAACGCCGCGTGAAGGAAGAAGGCCTTCGGGTTGTAAAACTTCTTTTAAGAGGGACGAAGAAGTGACGGTACCTCTTGAATAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCGAGCGTTATCCGGATTTACTGGGTGTAAAGGGCGTGTAGGCGGAGCAGCAAGTCAGAAGTGAAATCTCTGGGCTCAACCCAGAAACTGCTTTTGAAACTGTTGCCCTTGAGTATCGGAGAGGCAGGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCCTGCTGGACGACAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGAATACTAGGTGTGGGGGGACTGACCCCTTCCGTGCCGCAGTTAACACAATAAGTATTCCACCTGGGGAGTACGATCGCAAGATTGAAACTCAAAGGAATTGACGGGGGGCCCGCACAAGCAGTGGATTATGTGGTTTAATTCGACGCAACGCGAAGAACCTTACCGGGATTTGACATCCTGCTAACGAAGTAGAGATACATTAGGTGCCCTTCGGGGAAAGCAGAGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATTGCCAGTTACTACGCAAGAGGACTCTGGCGAGACTGCCGTTGACAAAACGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCTTTATGACCTGGGCTACACACGTACTACAATGGCGTTTAACAAAGAGAAGCAAGACCGCGAGGTGGAGCAAAACTCAAAAACAACGTCTCAGTTCAGATTGCAGGCTGCAACTCGCCTGCATGAAGTCGGAATTGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGCACTCACCGCCCGTCA
>URS0000E780C0 lncRNA from 1 species 
GGCGAGGGGGACACCGTGGAGGGGGGTTGGGGGGGACGAGGCCGGGCAGCTCTCCCGCAGGGGGCCGGGCAGGGCAGCGGGGGTGGGCTCTGCTGGGCGTCATCCCCCCCTCCCCTTCTCCCCGGGGAACCGGGGCGGTGTGGGGGGGGGGCCGCTCCCGGAGCATCCCCCCTTTGCCCGGCTCCCCCCCTCCTCCTCCTCCTCCCCGCTTCCTCCGTTTAAAGGCCGGGTCCCGGCGGGGCCGAGCGGAGGAGCAGCGGCCGCTCCGCAGCCCCAGTGCCGCGGCGGGGGCGCGCAGCGCACGGGGCGGGCGCTGGATGCGGCGCCGGGGGCGGGCGGGCGGCAGCCGAGCGGCTCCGGTCCGGTGCCCGGTCCCCGGTCCCCTCCTCCCGTCCCCCCCAGCGGGTCCTCCCCGCGCGGCGGCGCGGAGCTGGGAGCGATGAGCGCGGCCGGAGGAGCCGGCACCGCGGCGGGCACCGCCACCTCCGCCCTCTGCCTGCTCCTCTCGCTCACCGCCGTGGCCGTCTGCCTGCTGCTGGGAGCCAAAACGGCGGAGCTGCAGGGCCGCCTGGCAGCCCTGGAGGAGCGCGGAGCCGCCGGTCCCGGCCCGCTGCTGGAAGCGCTGCAGCCCCGCCTGGAGCAGCTCCTCCGAGAGAAACTGGGTGAAGGACTAGCTAAGCTGCGGACAGCGAGAGAGGCTCCGTCAGACTGCATGTGCCCCCCAGGCCCTCCGGGGAGGCGAGGGAAGCCCGGACGGCGCGGAGAGCCCGGTAAGCATCGCGGTCACCCCACCGCTGTCACGGGGCTGGGCACAAACATCCCGGTACCGCTACCATCACCTCTCTCTGACGGGCTGGCTCCTGGTTAA
>URS000240ACFD lncRNA from 1 species 
AACCTGTTAATATGATTAATTATTGCAGTCAGAAGCAATCAATTTCCTGAGAGAAAATAAAAGTATTTAGTATTTCCTGAGAAAAGAACAATAAGTACATAAATTGAAATTACAACAGCAATGAAAGGTGGAAACCAAATCAGAGAAGAAGATAAAACTGGCAGAGGAGTGGAGATGTTTTGCCGCACGAAAAAAAAAAGTCAACAAAAAATACCGCATTAAACGTAAGATGATCCTTCGGATATGGTAAATAAATATATCCGATGAGATGAATTCAAACTATTATTGCGACTGTAGAGGAATTAACATGCTGGAACGAAGTCGCCCTAATTTTTCGTCTAGGGAGGGCAACTCGGGAGTCGAAGCGACGCTAGAGATGAAGGTGGAATGAAAAGTCTCTGAAGGAATTAAATGGAAAGAGAATGAGAAAAATAAACTGATGGGTGGGATCCATGAGCAAATAAGTTAAGATGACAATTGACTTCCCATAAAAGCCAATATTTTAAGATGGTAGGTAGGTCCCACAAAATTTTTTTGAAAAGTCTCTTAACCAATTAAAAAAAAACTGATAGATAGGCCCCAACATAAATCCACAATTAAGCAAAATATATTAGGCTGACAGGTAGGTTCAACAAAGATTCAAATTAAGCTAATATCGTCACGTGGACAAAAGGATATGGGATTTTATAGTAGTTAGTAGATGAGATGAATCCAAACCATTATTACGACCGGAGAGGAATTAACACGCTAGAACGAAGTCGCCCCAATTTTCCGTCTAGGGAGGGCAACTTGGGAGACGAAGCGACGCTAGAGACGAAAGTGGAATGAAGAGTTTCTGAAGGAATTAAATGGGAAGAAAATGAGAAAAATAAACTGAAGGATCGGTCCCATGGGCAAATAAGTTAAGATGACAGTTGACTTCCCACAAAAGCCAATGTTTTAAGATGATAGGTAGGTCCCACAAAATAAAATTTTGAAAAGTCTCTTTACCGATTAAAACAAAACTGACAGATGGTCCCCAACATAAATCCACAATTAAACAAAATATGTTGGGCTGACAAGCAGGTCCCATAAAGATTCAAATTAAACTAATATCGCTACATAGACAAAAGAACATAAGATTTCATAATAGTTAATAAATAACTCGCTAGCATTAATTTTTTGGTTTTTTTTTTGTTTTATTTTAGAATTATGTAAATGCATTTTAATTTACTCTCAATCAAACAAAGTTACATTTTGAATATTTTAAAAAACTTTATTTATTTTATAGCATGCGACAGGTGAATGTTCGCTTCCTCGATCTAAAAAGTATGAAACAAAAAATGTCAAATTTTTTTTTCACATGAATAATCGTTTATCTAGTCATCGGTGGGTTTAGTTTTAAGAAAAGAGGAATGCTTCAATACACCGGCTAAATTAAATCTAGCCGTTCATATTTGAGGGGCAAGATTGACTTTTGCATAATAGTTACCTGCTCAACAAGTTACCATTCGTAAGGGTACACTACAACAAAAATAGTCTATAGCTACACTTTTAAATATAGGTACATGTCAAAAAAGTGCTGTTAGCTAAAATTACCGACACTTTTAAAAAGTGTTGCTATACGTGGGGTCGCTAGATATATAGTGACAGTTAAAGAGTGTCGCTATAACCTAAAAGAGTGCTGCTAATTTACCAACACTTATTTGTTGGATTGGGCTTTATATTTAGGCATTAATAGATGTTTTTTTAAGTTTTAGCAAAAATGGGACACTTACTCAAAAGTGTCCCAAATATGTGTCCCTATAACCTAATTCTGTTGTAGTGGTAATATGGGAAAACAAATACAAGCTAATTACCAAATTTGATTAACCCTATACA
>URS0002381478 lncRNA from 1 species 
ACTTACATAGCACTCGTACAATCGACTTGACAAGCAACAGAAAAGTACCCAATTAGTGTAGAATCAAGTATCAAAGCAAACAAAAAGGTAAAAATATAAAAAGAAAAACAAAGGAAATAAAGAACAAGGAAAGAACAAAAAGAAAAGAAAAGAAATGATAGAATTAGTTAGAAGGATTTAAATTAACTACCAACCAGCCTCCCGACGTTTAACAAAAATATTTCTCTATCGCATATAATGGGTTTTGAACTTGGAACCAAATAGAATACAAATATATGCTTAACCAGTGAACCAACAGGTTCATTCTTAACATAAATTTACACAGAATTGCACTTAACTATATAACACGGATAGGGGTTTTTTTTAAAAACAAAAAACAAAACTTCTAACAATGCGACTCGAACTCCCAATTTTTAACACAATAGAAGAACACAGAATCACAGATACAAAATTTTAATTACTGCAGATTCTCACAATTAAATTCTCAAATTTTTAGGGCGTTACACCACCACCCTAAGCTCTCAACAATGGACCTGTTGACTCTCATCCAGCACTCAACTGTATGATTATTCAATCACAAAGCAATATTTATAAACCAAGAAAAATTAGTCATTTTAATACTACTCTTTTCCAATTACTTTAAGGCACAATGTGTGTTTTTCCGTAATAAAACACATTTCCATAGAAAATTATGTCTCTTTATCTTGATACTTTTCCATAAAATTTATTATTTATATTATTTATATTATGTATCTCTTTGTAATGTGGGAACACTAACATTGGAAACTATTAATAGATTTTATTAACAAATTGAAGCACCAACTGAAGTTGTAAATGATTCAATCATTAAGTCAAAAGAGATGGTCAATAGAAAGAAAATGGTAATGATTAAAATAAAATAAAAGAGTTTATATATCATTAAAATAATTATTAAGTATATTTAAAATTATCATTATAAATATTTATATATGTGGAGTGTTTCTTGCATTTTTTGTTCAAATTAGAGTCAAAGTAGAGGCGACGTTGCAATGAGGAATCACGCGACGTCGCAACGAATCGACGACATTCGAAACAGAGGCAATGTCGTGACGATACGACGAGTTCCAAACTTAAAGTAGTTACGTATTAGACTATCAACAAGGTTACTTTTCCTAGTTAAACTCTGATTACATTAGAGATATTATAGTCATATTAGAACTCTAATCTTAGCCTATTTAAAGGGCAATAACAATCCTAAAATCGGAAGAACATAACACAGCATTAGAGAGAAAATCAAGAGAGAGTTTTAGAGAGCTTTAAGGGAATTTTGTGTTTTTAGCCACTGAGAGCTTTGTATTATGGGTTAAGGTTTGTTTTGAATTTCTCCATCTTGAATTCTTTGTTTGTTTGCTCATTAGTGAAGTCTCCTTTGCCTATGGTTTTTTATTCTCTTGATTGGAGGGATTTTTCCACGTAAATTTGTGTGCCTAGTTTTCTCTATTCCTTCTTTCTCGTTGTTTATACGGGTTGATCCCCAACAATATTTAGTATTTTATTATTTTATGTATTTTTATAATTTTTCATTGAAAAAAATATAAATGTTTTAAGTTTTTTTTTTCAATTTTTGAATTTTTTAGAATTAAGATTAAATTGTTAGAATGTGTAAATATTAATACCTAAACTTGTTAAGTTTTTAGAATTAGGATCAAATTGATAGAATGTGTAAACATTGGAGAGATAAATTCATTATTATGCCAATAAAAAATCACATCAAACTTCCCTTAACTATTTAAAGACAGAGTGACAAAAAAATCAAACTTAAAAAATGTTAGTGACTAAATTAAAAAATTTTATAGTTGACATTTTCTTTATTTCTATTCATATTCATTTTACAATACATATAGGATTGTGGGTACCTCCCAACAATGTTGTTTTCAATGTTTAAACTTGTGTTCTTCTCTTATGAATACAATATGTCTTACCACTCCACCAAAAACATGTATATAATAGTAATAAACTTTTTTTTCTCTCCATGCGATGCACGAGTTGCTTGTGTGTATTAATTAAAATATATGTAAAAAATAGAATGTCAGTAATGACAATATATCACAAAGAAAAGAGAAATAAAAATAAAGAACACACCAATTTTTACGTGGAAACCCTTTTGGGAAAAAACTACAGGTAGAGGAGAAAAAAATTCACTATGTCGAATTCGAATGATTACAAGAGGAGTAAACTATGTCTATTTATAGGCTTTGTAAAACCATATTCTAATAGGAGTGTAGTAAGATTGAAACACCTTATTCTAATCAATATCAAATAGATAGAGTTTAATAAGGTTTAAAAAACCTTATTCTAAAATAAAATAAAAGAAGTATAATTCTATAGGGATTTTACTTTTATTTTATTTTACCACTGTATTCTATTTAAATAAGGATTCGGGTCACTTAATTCTAACAATATATTATATTAAATTTTAAAATTTATACATAACATATTATAAATATTATTATTAAAAATTAAAAATAATATAAATATTTAATTTTGTAATGATGATAATTTAAAATATAATCAATATAATTAAAAAAAAATTTAATAAAATAAAATAGTTAATATTACTCTCAATTATGATTTCCGCATTACTTAAAAAAAATGCACAACTAATGGAAATATTTGAGTACAAAAATCTGAATATTAGGATAATGAAATTGTTTAGCAAAAGTCAACAATGATTAAGCATTGACACCCATAAACTTAAAGCATAATGAATGGGGTGTTTAAATTTAATTTTTTTAACATTTACTTGTGGAAAAAAGTATTAACCAATTAGGTAAATATTCAATTTTCAGCGTATTTATTTATTTAATGTAATGCTTTGTAATTTTTTTACTACAAACCATAGTCATAGGGAATACTAACATATTCTTATTCAAATGAAAATTTAATGCTTCATTAAGATAATTTTAAGCATTTAAATGTTAAATTAAATTATTATTCAGTTTACAACTTTTAACAATACGTACACATTAATGTGATAAATGTCATGTTTTAAATATGCTACATTGAATTAGCTGCTTAAATTGTAATTGTATATATATGATGTCATCTCCTACCGACTTAAGAAAAACTCTCAAATCCAAAATAAATTGAAATCTAAATCTAAATACAAATATGCTGAAACCTGCTTGTTTGCACTTTAATGGATCTTATAAACTAGTTGTGGGCCTGTATGTATCAAACCTCCTTATCCAAATGCAAAATAAACCCTAATTCATTTAGAAATAAGTACAGAGAGATCTGGTTATAAGCTTCTTAAGATGGAGGACGCCACATATGCCCCAGAAAAAAGTCCAAAGGCATCGCTTGGTACTTGGTACTCCCATTTCATTCTTTTGGTGGTTTGTTTCACTGAGTTTAATCTTAAATGGTTCCTTATTCACTGTTAATTTCGAATCGTCTATTTGGTTTCAACAATCAGTGATTGGCCGTGATGACACAAAGGCCGGACTTACGGCTGCTACTGCTCTTCCCTTGTGTGGTAGTAGTATGATGTTTGTTGTGATAAGGTGTTTGTGCTGAGCCACTTTTCTCTCTACGCTTTCTCTATTTTACTTGAGATATTTATACTGTGGATTTCTAGTTTGAATACAATTTTTTTGGTTATAGTAAACATGGGTTTGTTTTTGGTGAGCCTGCCCTGAATTTGTGTGGGATTCCCTTTGTAGTTCTAGGAATTAGTTTACCGATTCTACAACTGACCCTTGAAGAATTAAGTATTCCTTCATTTTCCTCATCTTATGCAGCTGATCAGCAATGATTCCTTTTAGGCTTGTTCTCTTCTGAACTTCAAATTACATCCTTTATAAGAGATTTGGTCAAGCTATTGTGTAGGGTTTGTAAGATTTTGCATTTTATTGGCTTTTGCATTGCATCATTGACACATGGTTCCATGTAAATTCTGATATTTCAACTTCTAACAAAGCATTTTTGGCTGTGCCTCAATGCTATGTATGGAACACTACTGGTGTTGTTTTGCCTGCTTTTTTGTTTTTACGAATTATGTTTAAAAGCCTTGTTTTGCTCTCAGTCCAGGATCAGCAGTTAGACATTTAGATCACATCGATGAATGTAGGTCTTGATAGTTGTTGATTCTTTACATGCATAGAAGCTAAAGAAAAAAGTTCCAATTGAATTGCCATGTATCTTTGTCACAAAGACATGATTTTTCCTACATTTGTAGAGTGTATGAGTTGCAATTAACTACTATCATAAGGGCAAACCATGCAACTATTACCTGCAAAAGAAAATGTAAGAGCATTTGAAGTGATGACTGCATTCTATAGCTGAGAATGCAACAAGGCCATAAGAAACAGTTTGTTCAACTTGATAAACATCATAACTTCTCTTGTTCCTATGTGATGATTGTCTGTGGAAGATTAGACCTTTAGAGTTGGCAATACTTAGAAGGTTATTGTTCCATTTAATATTACTCTCAAAGTTAGGCACCTCTGTTGATTTCAATCCTTCATGAAGTTTAACGGACGATCCGAATATCCCTCAAGTCCTGGATCTTCAGAAAAGGACCGACCAAAGTCTCCATGCATTAGAATTGATATGGATATCAAAGAGGGTCAAACAATAACTAGATGTTAACTTTGCAAGCAACCTGGTCTTGTTGGAAAAGAATACACCGAAATGTTCTGCAATTTAATGCACAAAGGTAAATTTTATTTTAATGCTTAAGCCATGATCATTTTAGTTATTTTATATTCTCTGGTCTTATATGTCAATATGCATAATTTTTGTTAAACGAAAAATATGTACAATGCCAAAAAAAAAAAAAGATTATTAGATGTATTTTTTCGCTATTCATAATTCTTCTTTTCGTTCATTTATCAATTGGCTTACAAGTTATCCTACAAAATTAGCTGGGGTGGTTATTTTTTCTGGTTCCAGAAAAATTCAAGATTATCCTTTGAATAGATTTATTTTTATTTTTTATTATCTTATATCAACCTGTTTATATAAAATGTAAACTGACAAGAATTGTTATTGTTTTATTTTGGGATAATGTCACTTTTGATACTTGTACTTTCACAAAATATTTAATGTGATATTTGTACTTTTAAAGATGTATATGTGGTACTTAAACTCAATATATGTTTTATTATAATACTTGTCCTTTCGTAAAATGTCCAATGTGTTACATGTACTTTGAAGATGTCTAATGTGGTACATTAATTATCAATATATGTTTCATTATGGTACTTATTAACAACGATAGTAAATTGCTAAATTAACCAATAAAAATGTGACACAATCTTTTTTCCAAATCATAAAGACTACATGAATAATTTAACATTATGCAAAAAATTAAATAAAAAAATTAAAATTAAAAAACAAGTAACCATATGGTTGATAAAGAAATAAGTAAATAGTAAACTTACAGAAAAGTACATGTATTTTCATGGTAAAAAAAATCATTTCAAAAAGGAAAATTTTATATAGAAGATGATGTTTTTGTTTATGTAAGTTTAATGTTTATTTCCTTTTTATTAATTGTATGATTAGTTATTTGTTTTTTTAATTTAATTTGATGTGTTTTCTTTATTTACTTTCTCACATAATGTTATATTATCTGTTTGGACTTGATGATTTGATAAAAAAATTACGTGTTGAATTTTCATTGGTTGGTTTAGAAATTTTCTAACAGTGCTATTAGTAGGTACCATAATAAAACACATTTATAATTTGAGTACCACATTGAACATTTTATGAAGGTACAAGTATCATAAAAAAATACTTATTAATAGTTTAGGTATCATATTGAATTTTTCAAAGTATAGATACTATATTTTTGAAAGTATAAGTACCAAATGTAGCATTATTCTTTTTATTTTTTATTTATAAAAAGCTTACACCACACGGATTTGTTTGTCTTGGTACATTTTCAACTATCTAAAATATTATTTTCGATAGTCTTTTTTTTTTCTCCGACATCAAACTATTTTTTTTTGTGACTTCGAAGATAAAAAACAAACACAAATTACAAATACTAGCCCAATTCCCCAAGTGGAGATACTTCAAAAATTCACAACTCATGGCTTTCCCTATGTACCAGCTTGACCAGTCTGTCAGTCTCCTGATTGTCTTCTCTAGAAATATGTGAAACACTCCAATGATTAAACTGTGTCAGCAATTGAAAAATCCTCTTTATCAAGGTCGAGTTAAATCCTTCTGTCAGACTCTTTTGAATAATCTTAATTGCTTCAAGACTATCAGTATGAATAATCATGTGATCATAACCCCGATCAATTAAAGTACCTAAATCATCCAAGATTCTCCATAGCTCAGCCTCAAACACTGAGCAGCTCTCCAAGAATCTATTGAAGCTAAAAATTCACTCCCCATTTCGGTTTCTCACAATTCCCCCTGCAGCAGCAGAACCACTTTCATATATGATAAAGCCGTCATTATACAAACACGCCTAGTTCCCAACCAAATGTATAGAAGAAGTCAGAATTTGAGTCGAATAATTTAAAGTCATACCAGATGAGGCAAAATGTTTGGCCCAACAATGAGAAACTTTGATGGACTCAACATTACTCCAAGAAACATCTTGGAATATGAAGATATTACGATTCTTCTATATACACCAAATAATAATCCCAAAAAAGCATTGCCAAATTATGATGATTTTGTAAGTTTGAGGTGAGCCAGTCCTACAGATTGTTAGAATAAAATGTCTTGTCAATCAATGGGAATTAATAGATTCTAAATGTTACACACTGCATTACAGTCCCTGATAGCATGCAGTACATCTTCTGAGATATGTCCACAAACCCTACACAATGAACTGTGCTCGAGACCTCGACGAACCCTTTCCACATTTCTCATCAGCCTCTACTTGAACGCAAGCCAAATGAAGAATCTAACCTTCTGGGGTCCTTGAAACTTAAAAGGAAAAGTGCTACACATCCTACTTTGGTTTCCAAGATGATTCCCAAAGTTTACCATATGCTTTTAACAGAAAAGGAGCCTGTCGAGGTACTTTCCCATATAATTCTATCAGTACCTACTGCCAAATGCGATGGGGGAATCCCTATAATCTTACAAATTATCATCTTAGGCAACCAAAGTTGAAACAAATCTAGATTCCAAGTGCCATTACCAAGAACCATATCACTCAAAACATAGTCCAAATCAAGGTTCATGTGACTAGGAATCATTCAAACAAGAGGCCCCACACCTAGTACCCACGAATCCTGCCAGCATCTGACACTTTTCCCATCTCTCACTAACCAAAGCAGATTCTCCAAGTAAGTGGCCAAACCTTTATAAGGGCTCTCCACAAAAACAATCATCTGTTGCGCGATAATGAGTCGGGCAAACTTTTGCAACCTCATATTTAGCTCGGAGAATCTAGACCCAAAGAGTTTTAGAATCTGTCACAAGTTTGTACCTTAAATTCATTATAAAAGACGTGTTAGAATCTTGAAGCTTCCGAAAACCAAGACCTCCATGATCTTTAGGCTGATAGATATCTTCCTAGCTAATCAAAGCCATTTTCTTGCCACTACTCGAAGATCCCCAATCAAATTGATACACCATATGTTCAACTTCCTCACACAAACCTTTGGGTATCATCATTGACCGCATAAAGTAACTAGGGATCACCAGTAAGACTGATTGAGCCAGAGTAGCCTTACTAGCTAGAGATAACGAGCTTGCATCCCAACATCACAATTTGCTCTGAACCTTGTCAACAACAAACCACAAAGTGTTATTTGTTACTTTTTCATGGAACAAGGGCACATCCAAATATTTCCCAAGATTTTGGACTTTTCGAAAGCCAAGAAGATTGCAAAATCTATCCCCCATATCCTCACACCATCTGAAAAAAAAATATTAGTTTTATTAGCATTAATCTTATGTCCAGAAAAAACATAAAAACTATCTAGGATTCTCTTCAGGACTGTGGCTTGATCCTCTTCTGCTTGGCCAAACAAAATCAGACCATCTGCAAAAAAATAGGTGAGACAGGGGAGGACCTGATTGAGCCAAGTGAATAGGCATTCAACACCTAGAATTGACACTCGAATGTATATTGTGGTCGAGCCATTCCATACATAGAATGAACAGGTACGGTGAAAGTGGACACCCTTGACGTACCCCTTAGTTGGACGGGACTTCTGTGTTGTTGTGTCATTCCACAAAATTTGCATGGTGGAAGTTTTGATAGCTAACATAATAACATTAATTAAAAAATTTGGAATACCTGCAGCTTGGAGAGATGCTTCAATAAACTCTCATCGCACACGATCATAGGCATTCTCAAGATTAATCTTAACTGCAAACCAGTTAATAGACTTTTTCTTAATCCTTATAGAGTGAAACACTTCCTGAGTAATAATAATATTATTTGTAGTGCTCCTTCCTGTAATAAAACCAATCTACTCTTGGCTGATAATTTTTGAAAAAACCAACTTAAACGGATTGACAATGATCTTCATCACCAACTTATAGAGAACCGAGCACAAACTGATAGGTCAAAACTGAGAAAAACATTTTGGAGTTTGAAACCTTTGGAATGAGAACAATTAAAGTATTGTTGAGCTGCGGGTCCATTTTTCCCCTAGCAAAGATATTTTTGATCCATGCACAATGTAACACCCCGAAAGTTGCTACAGTAAGAAAGTGAGATATTATCTTTGATATAGTAAAATAAGAAAATAAAATGAAAAAAAAGGGAAAAGTTTGAGTTAGGTAAACAAAATCTGTTTAGGAAGTATATTATGATGTATTAATTCAAGAAAAGACTAAATAGCAAAAGTGAGAAAAGTTTTGTGACCTAAGAGTAAATACTCAAAATTTGATGGGTTAAAGTGTAAATTTGAAAAAGTTGAAGGACCAATAGTGCAAATATTTTAAGGGTAGAAGGATCTAGAAAATAGGGAAAATGGATGAATTAGGACCAAATTGAATAAGTGGAAAAAATATAAGGGGTTAAATTGCAATTTTACTAGAATGAGTAATGACTCAATGGAGGAATTTTGAAAGATCATAAAGGGCAAAATAGTTATCTAGCAAGAAAGATATTTGAAGAGTAATGATGATGTTGGTGATATTTTAGATTAAATAAATAAATATTAGTTTATTAATATTTTGATTTGACATTTAATTATATTTAATTATTATATTTAGTATATAAGGAAAGAAAGATGAAGAATTCTCTTCATCTTTCCATGGTTCCAACGTGAGAAGAAGAAAAGAAAGAAAGAAAATTTTTCTTTCCTTTACAATTTGGTCATTTCACCAAAAATCCTCCATTTTCATTTTGAAATCAAAAGAATTTCTATAGCCACCAAGAGAGAAAAATAATAAGGAGACTATGGGGAGCTAGAATATCAATTTAGATTCGAGAAAATAGAAGTTGGAGGAGAGAGAAAGTTAAGTTAAAGTTTGGTTTCATTAAGTTGATGTGAAAAAAGAGATAGTGGAATTAATTATGTGAATTAAGTGAGATGTCAAAGAAAAATTATGTAATAATGAATAGAGAACTTTTATGAAAAAAGGTGATTAAATTGGAAAGTTATAAAAGTTTACAAGAAAATATTGATAATAATGCACATAGTGAAAAATAAAAGAATATATGAATATTGTAATCCAAACTAAAATTATTTCCTAAGTTGTGGAAATTAATGGTTAAATCGTAAATTTGAGAAAATTTATATTAGAAATAGAAAAGTGAAGTGCATAACAATTAGAATGAGAAAAATTGATGTTGTAGTGAATTTTGGAATATTAATAAGTATTGAATTATGTTATATGTGTTATTAAAAGTAAATATATTGTTATACGAAATATTGTGCTAATAACTAAATTACAAAATATTAAAAGTGATATGTGAAATACATGATAAGGATTATGAGAGAATTATGGATGAATATTGAATTTAGTAATATATTACATGTATTAAAGATAGTGAAGATATAAGTATATGGATTATTGTTATAAGGATTAAATTGTAAAGTATGTAAAAGCATTATGCGAAAAGTGTAAAAGTGATATGTGTGTATGATATAAATTGCCCAAGTAGACGAGATTAGAACTACTAGGATATTAGTGGCATGCCATTAAGGGACCCTAGCGCGCTCTTCGATTATTAGTACGTCAGTGTTATCTGATTAGCACATTTGTGCTCTTTGTATAGCACTTTAGTGCTCTCTGTTCAATAGTGCATAATAATGCACCTCTGTATCAGTTTCATATATATTAAGTGTTCTGTTTAGTCTACTGGGCCTTTGCTAAAAAGGTAAACAATTTTCGTTACAAGGTAAAGGTTTATCTTTGATTCATGTTTGAAATAATGAATTAAAATAAATTGTGAAAGAAATAGTGAGAAAATCATGAAAAATTACACTAAATGGTGAAATATGATACATGTATAAAAAGAGTAGTAATTTTTATAAGTTTATTTGAGGACTTAAGGACTAAATTGTGAAATATGTAAAAAGTTACAAATGAATATGATAAATAAACAAAGAAACGAGATATTGGAAATTAAGAAATTTAATAGAGTTTAAATATCATGGGTACTTACTAAGTCTTCACTGACTTAATGCGTTTATTTTCAACGCGTAGGTACAGTGCTTTTGAAGAGTTGTAATTGAGGTCATGGACATCCATCTCATCACATCTCCAAGTATCAAGAGGGTATGTTTCAAAATTTTGAATAGAATGACATGTACTTAGGAAGATCAAGCGTGTTCCAAGTAGTAGGGACTAAAATATAAGTTATGAAAACTTTATTTTTTTTAATGTTCAAACATATTAGTGATTAGCCAAAATCACTTTGGCACCAAATGTAATATTCCTATATCAAGTTCCTTTGGGTCAAACCGGGTATAGGGGTGTTACACATAAATCGAGCCCCCAATATGATCTCACTGACTCTGGAAGAAGAGAGCTTGATATCCATCACTTTCTAGAGCCTTTAGAGGGTCCCATATCAAACAAAGTGGTCTTTATTTCCTCATCAGTGATGGGCTTCAAAAATTGGGTCTCGCCATCCTGAAGTTGCGAGAAAGAACTAGTAGGAAGTCCCTTCATCGGTCCTGGGTCTTTACCATATAAATTGTTAAAAAATCAAATCGCCTCATGCCGCAAGTTTTTATCATAAAAAATCCACTCTCTTTTATTATTTTTCAGAGCCACAATTTGACTTTTCTTTCTTCTTCTAATAGTATGGCTACAAAAAAATTTTGTATTTCGGTCCCCCAAAGAGAGCCAATCACATCTCGTCTTCTGTTTCTAGAGAAGTTCTTCGTGATACAAGACCTGTTCCAGTTCCTCCCTAACTTCCAAATCCAACTGAAATAGAGAATCCGACTAAGAATAATCCAAATTATGCTGAATAGAATGAAATTTATGAAGCAACCTTTTTTACGAGACCCAATGTGACCATAAACCTGTTTGTTCCACTCTTTTATTTGACTTGTAAAGTTAGCCACTATATTTGACATTGAGCCATGAAAATTCCAACTCTTCTATACAAAGTCAGTAAACTCTGAATGTTCAACTCATCCTGCTAGAAACTGAAAAGGACATCCCATAATAGAATTAAGCCTAGGATGAAGTGATAAAAACAAAGGCCTGTGGTCAGACTTGAGTCTAGGGAGGTGAGTCACATAACAATTTGGAAAAGACACAAGCCACACACCATTCTTGATAAATCTGTCTAACTACTCATAGACTCTACCTTTATACCACGTGAAAGGAGCCCCTCTGAATCCAAAATCATGAACCCCAGTCGTATCCATAAAATCCCCAAAGTAAGAACATCTTTTCCCACTAACTCGCCCACCTTTCTTTTCGCTAGAGGCTTAAAGCGTGTTAAAATCTCTAACTACCACCCAAGGAGAACCATTACTTGGAAAAGTCGCATTTAGAGCGTCCCAAAGCCGTTTTCGTTTACAACTATTAGAATTATAGTAAACAAAAATAACAAAATGGGATGCTGGGAAGAACTATCGAAAACACGAGTTAAAATAAATTTAGGATGGCTTCGAAGAATTTCGACTTGAAGTGACTTCTTCTATCCAATCCAAATACCTTTAGAGAAACTGATTGCTTCTACCTGGTGAGAACATTGAAAACCAAGATTAAGGATAACCGAGTCAACTTTTCCACCACTAACTCTTATTTCTAACAGACGCACAATATCTGGTTTATATTCTCGATTATATTCATGAAAAATTTGCAAAAACTTGCTACTAGCACACATTTGAAAATTCCAAGAAAAATAGAAATAGTCAAATAATAATAAAAAATAAAGAAGGTAAAAAGTAACTATAAATACTAATTAACAACCTCTTTCACAATTTTTTCCATCATGGTTCAAACTTCCCTTCTCAACCTCTTTCTTGATCTACGAGCTTATGAGTTTGGCCATAGAATTCATGGAGTTTAATAGCGGAACCCTCGCATTACCTGAGTTTTTAAATCATTCCCCACGGTCCCAAACGATTTTGCTAATAGCGTCGCCACTTCAGATAGAACCACTTTTAGCCCCTGAACCCTTCCTTTTGAAATCATTATTCCTTTACCTCTTCCAAAAGAATCAACACCTTCATTTGAACTGATATTTTTAGGTAGCTCATTATCCTTGAAAATAATAACTAAATGTCTCATAGGGTCAAGGACCTCGCTATTGAGTTTCACCATTGACTCAATAGGATCGTTGAAGGTAGGGTTAAAATGGGAATTCACACCCATCATGATTAGATCATCCATAATATGCGAAGCCCCCAAAACTTGATTTTACTTCATACCGTCTTCTTTCAAAGGCAAAACAATATCCAATTTATTCCCATTTCCAAGCTCACATTGACCAGTCTCTGTTAAAATTGGGTCTCCGCTTATTGCATTTTCTATAACCCCCGAATCTGTGTCAATACAAGGTGGACCATTTTGTATACTCGTATTTGCTCCAAGCCCAACCTCTATTAGAGTATCAGTCTCAGGGTGAGTTTGGATGGGTGGTACGTTTACCTGCGGTTAGTGTAAAAACAACGGTGGCGGTGAGATTAGATACTATAGCGATACTGTAGTGTGAGACAAAAAGTAAGCTAAACGCACCACACCGCACCCAATCACCCATCCAAACCCACCAGCATCTATGGCCCAAAAGCCTCTATCGTCTCCACCACCTTATATTTTTCCAATGAGACTTCCACTGCCGAGACTCTATCCACCTCTGTAATGTTCGTTGAGCCGGAGCTAGGACAAAGATTCTGCATGTGTCCAAACCTGCCATAATAGAAGCACACTAACGGGAGCGATTCGAATTCAACCCTCTGAACCACTTTCTTAACCAGGATCTGTGAGATCAGAAGTTTTCCCAGATCGATGAACACTGCCATTTGGGTAAATTTGCCTCTCGAGCCCTTGTCCATCTGAAAGTCGAGTTTCGTGACTTTACCTATCAGACTCCCTATCTATTGCAAAACACACTATTTGTAAAGGTCACTTGGCAGACCAAGCAACCAGACCCAGACCATAGTGCTACTGGGAAAGTCTTGAAGGGGATTAAACTTTGGGGGTCCACGATTGAACAGTGAGGTACTGTCTGATCACGATCCACGACCCTTGGGGGAGAACTTTCTTGTAGTCCTCTCGGCTTTGAAATCTAGCTAGGAAATATCCATTTTCAACATCCATGAGATGGAACTATTGTGAGGGTTTTCAGAGGTTGTGAATCCTATTTTGTAGGAGGGTGTAGGATAAGTTCCGACCTAATAGTTTAACCACCACTGTGGTCGTCATATCTCTAACGACAATTTGTTGGATCCTTTCGGAGAAATTGATTGCTGGAATTCCATTGACATTAGTCCTCATGATATCTCATTCTATAAAGTCAAAGTCCTCATCGCAACCAGATCCAGAAATCCCTCGTCCCAGAACTTTGTCTATCCAAGACATTCCCGATGTTGGTGTTGAATCTACGGCCATATCGCTATTCGAATTTGAATCCAAGTCCTTAAAACGAACTTTTTTGGTGTTCCGATCAATCGAGTTGTCACCTCCGCCATCCTCAGTCATCTATATCAGTTGATTTTATTTTCTCTTATCAGTGCTTTGATTAAATGATAACGATGTTCACATCAACATATATTTTAATGTTTTAGTAGGTACCTAAAAAAGCATAAAGTTAGTTTATGTTTTCCAAGTTTTTTTTCTTTTCTTTTTTAAGTATATATAATTCAACACAATTCAAATTTATTTTCATTCATATTTATATATTTGATAAAAGCATCTTTATTATAACTAAATGACCATAAAATCAATGGGAAAGACCTTGCTTATGCTTGTTATTAGTGCACCCCTCGATCATGACCTTGATTACCTTAGCACAATTGGGTTCGACCACCACCTATCATAATTTATCTCCCTTAACCACGCCATAACTTCTGCAAGATCAGGTGCCAAGCTTCCTAAATTGTGCCCAGTACAACATTTCACCAGAATGTTGATTGCGTCCCTGTTACGCGCCATCCACCCCGCTGCATTTTCATTCTCCAAAGTGATTGCATCAACATTACATTTGGTCCAACAACTAATTTACCTTTTAAATCACCCAACTTATCATTTAGTTTCACATAGATCATAAATCTTTAATTTAATAATATCACATCATTTGACTTTTAATACTGGCAAACTGTTGAGAAGCATCAAACGGTTGAATTCATTTCACAATAAGCTTATGTTAGAATTAAGTGACCCAAATCCTTATTTAAATAAAATACTGTGGTAAAATAAAATAAAAGTAAAATCCCAATAGAATTATACTTCTTTTATTTTATTTTAGAATAAGGTTTCTAAACCTTATTAAACTCCATCTATTTGATATTATTTGAATAAGGAGTTTCACTCCTATTAGAATAAGGTTTACAAGCCTATAAATAGGCATAGTCTACTCCTCTTGTAATTAAGTTTTTTCGACATAGTGAATTTTCTTCTCCTCTGCCCGTGGTTTTTTCCCGAAAGGGTTTCCACGTAAAATTTGTGTGTTCTTTATTTTTCTATTTCTATTTTTCTTTGCGATATATTGTCATTACCGACATTATATTTTTCTCAAATTGGTATCAGAGCTTCCGGGTTGTTCATCTCAATCACGGTAATGACATTTTTAACCTCCTAACTATATTTAACAACTAACCAACTATATATAACTAACATCACTACATTCCCCCTCAAGTTGTGCCCCCAATTTGGATAAAAGATATTTATGTTGTTGAATTCCCAGACCTTTTGATAATATGTCAACTAGTTGTTCCTTTGTTGTGACATGTTTGGGCTAAATGGAGATTTTCTCATATAAAGTGAAAATAAATTTCTATATGTTTAGTTCGCTCGTGAAAGATATGTTGGATAATTTGAGTTGAGATGATAGATCTGGAGACAATATAAAATTAAAACAGTAGACTTCGAGGCACGAGTGACGCTTTCCAAATAGAACAATTTGCCCCCACACAATTTCTAGAGGGTTAAGAAAAGGTCTTTTCGGGACATAATGAAGACTTTTTATTTCTTTTGGTTAGCAAAATCGAGGAATTCCCTAACTCTTACTCTAATTTCTAAATTTGGATTGATTGTAATAATAATGTTTTGAGCTCCATAGTCCCTCTATTTATACGCACTAAATGGAAACTATTAAAGAGCCACAACCATTCATATTGGACATACTTTTTAGAAGAAACATATCCCATGGAAATAAAATGTATCCATTGGACGAATGAATCATCACTTTTTAATCCAAATAAGTGCTCATGAATCACACCAAGTGATCCATTAATAATATTTAATGAATTTGAAATCTACAATTTCCAACAATCCCCCACTAGATTGCTAATTCCAGAAAATAAGTACACAACGATCATGCATAAAGAAGGGTGTCCACAGATTGAACCTTCCTTTAGTGCAAACTCTTAAAGTATCAACAAAGATAATGATGGCTAGTCACTTGAAGCATCACTCGTCAATACCGAAAAAATTACACACATAACCATAAAGTATTAGAGTAAGAATTTATTTGCTTTAGCACTGTTATGCTCATGTGGTCATCCCGTTTCATGAACATGTACGAGAGAAAACCATAAAGAAAACTCTCGTTGAAGTAACACCACTTCATGTCCATGTAGGTGGATTTCATGACAATAAATGTCCATCCATTAAGAGTAAAACTCATCCTCTTAAAACATAAACACTAAATCCTGATTCTTAGTGCACGTTGTCATTCGATAACTTGTTATTACCCTTTGAACCTCGAAACTAACTTTTGGCTAGAAGAAAGTAGGGTTTCCATTATCAATGACGCGATTAGAATGATTTTAATCCTATCTTAGTGGTGGTACTCTTAACCAAATCCCTCGACAAACCTTTTGTTAATGGATCCACTAAATTGCCCATTGACTTAACATAGGTAATAGTTATCACACCGTCCCTAACCAGTTGTTTCACATACTCATGTCTCAAACTTATATGTCTAGACTTTCCATTATACACCTTATTGTACGCTCGAGACATGGTGGATTCACTATTACAATGTACGAAAATAGCAAACCTACGTTGTGGCCATAACTTTAGATCTAGCAAGAGATCTCTTAGCCATTTCGCTTTATTGCCAATATCCGCCAACACTATAAATTCAGCCTCCATAATTGAATGTGAGATGCAAGTTTGTTTTTTGGAGGCCCAACTAATGACTCCACCTGTGATTGTAAAAATCCATCTCGATGTGGACTTATTGTCACTTAAACTTGTAATCCAACTTGCATCCGAGTAACCTTCTAGTATCACGAGATAATCACTATAGAATAATCCCAAATTTTTTGTTTTCTTAAGATAGTAAAAAATCCTACTAATTCCTTTCCAATGATTGATACTAGGAAAACTTGTAAATCTCGCCAATTTGCACACAATAAATGTTATATCGGGTTTAGTGCAATGTATTGCATACATTAGACTTCCCATTGCGCTGGCATACTCAAGTTGCACTATAGCCTTGCCATTATTCTCATTTAACTTGAAGTTCAAATTGAATGGAGTTTTCGAATCCTTAATATTCAAGTGTTTGAACTTCTCCAATAATTTCTCGATGTATTGAGATTGCTTTTGTACAAAGCCTCTTTCATGCTTTTGCACCTTTATACCTAGAATTGTATCTACCTCGTTGAGATCCTTCATCTTAAAATTCGAGGCTAGATACTCTTTGGTCTCACGAATGCCTTCCAAGTTCATCCCAAAAATCAACAAATCGTCTACATAGAGAAAAATAATTACACTGTACATATCGCTGAATTTAGTGTAAATACATTTATTCGCACCATTATGTAAAAAACCATATGACAAGATAATCGAGTCAAATTTCTCATGCCACTTTTAGGTGCTTGTTTTAAACCATATAATGACTTGATCAACTTACACACCTTATGTTTATTCCCAGGAAGCGCAAAGCCTTCTGGTTGCTCTATGTAGACTTCATCTTCGAGATTACCATTCAAAAAAGCTGTCTTAACATCCATTTGATATACATGTAACTTATGGATAGATGCAAGTGCCATGAGAATTCGAATGAAGGTCATTGTAGCCACCAGTGCATAGGTGTCAAAATAATCTAGGCATTCCTTTTACCTGAATCCTTTTGCCACCAATCTAACCTTAAAGGTTGGAGAACCCCTGATTGGATTATTCTTGTAAACACTCATTTACACCTGATAGACTTTGATCATTGAGGAAGATAAACTAGGATCCAAGTATTGTTGGACAATATTGAATCCATTTCATCATTGATCACCTCTTTCCAAAATTCTGCATCCTTAGAAGTCATGGCTTCACCATAGGATTATGGATCACCATCCACATTAAACATTATGAGGATCTTTCTAGTTATGGATTCTCCATTTCCCTCAATGAGGAATGCTAGATATTGCGAGAAAATGAAATCGATACCAAAGTCCTTTACTTTTCTCACTCCTTGACGTTTCCTCAACTTCGTATCATTATTGTCACAAAGACATCTCTTGGTTTGATCACTTGAGATCATTGGTTGATATTCTTTTCCGAATCTGGTGAATCATCGAAAACTTTATTTTTAATGAATACAACATCTCTTATTTCAGTTATCGTATTTGACACTAAGTCAAGAACATTATAAGCCTTAGAGTGTTGGGCATATCCAAATAATGCACCTTTGATGGCTTTTGGTCCTAACTTTTTTCTTCGTTGGTTGAGAACTCTATAGTAAGCCAAACACCCCTACACTTTGAAATAATCTAATTTTGGCATCTGACCCTTCTATAACTCATATGAAGATACTTAGAATTTTCTTGATGATATTCTGTTAAGATATAACATGCAGTCAATAATGCTTTACCCTATAGATTATATGGAAGTTTAACATTTAACAATATCAAGTTAACCATATCCATTAAAGTACGATTGTTTCTTTCTGCTAAACCATTTTGTTGCAGAGTATAAGGTGGGGAACACTCATGTACTACACCTTGTTCCTCACAAAATACATTAAAATCATTTGAAAAATATTCATCCCCTTTATCACTACGAAGCACTTTTATTTTCTTACTAAACAAATTCTTAACCTCATTTTAAAAATGTTTTAACATATCAAAAGCATCCCCTTTACTTCTCATGAGATACACATAAGTAAATATAGAGAAGTCATCTATAAAAGTGATAAAATATCATTTTCTATCTCTTGTTAGAGTTACATTTAATTCACAAACATCTGAATGAATTAAATCTAACACTTGTGAATTCCTTTCACATTTATTAGGAAACAGTTTCTTGGTAATTTTTGATTGAATATAAACATCACATTTATTTACAAACTCATCGTTACTTAGACTGATACAACCATTCTTTTGTATATATGGCAAAGTTTTAAAATTAAAATCTGCTAGACGTGCATGCCGCAAATGAAAAGATTCAACAATATGAGTAAAAGAATTGACTTTATTCATATCAATGCTCAACTTGAACATGCCTTCGTTACAATATTCTTTTCCCACATATATATCACCCTTAAGCAGGACTAACTTATCGGATTCCAAGATAACCTTGAACCCTTTATTACACAGAAGACTTGTGGACACTAAATTCTTTCTCGCATTGGAAACATGCAACAGATTGATCAAATTCAATTTCTTTCCAGATGTGAAGTTAAGTTCCATCGTCCCTTCATCGAGCACCTTAAAATTGATTAGTTGCCCATAAGCACTTCACGGTTTGCCATTAGTTCATAACTCTAGAATTTTTTCGGTCATTACACACATTGACAGTAGCTCCGGGGTTGAGCCACCAATTATAAGACATATCAGTCATGGCTATGTTGAGTTCGGTAATCATACCAATTTTCAAACTCTCGATCCCTTCTGTAACCATGGCCACTAAGTCCATGTCCTCCACCATACTAGCTTTGAAAGTTGTGACATCTTGCTTCTTTTTGAGAAGTTTACAATCCTTAATGTAGTGTCCTTTCTTATTGCAATTATAACAATTACAAGATTTTTTCTTCTTGTCTTGTATGTTCTTGGTTTTGAATGTGGCCTTTCACTTACTGTTTCGAGAGTTCTTGGACTTACTCACATAGTTCACTTTATAACTTTAGGGAAGATACACCCCATCACGCTTTTGATTTTCCTCTTCAATACATAAATGCCTAAGTATTTTCTCCACAGTGAAGTCCTCTTCCATAAGCAGAAGTTTATTTCGATAATTTTTCCAAGACAAGAGAACTTCAAGATGATAGCCCCGACTTGTAACAATTCTGAAATAAAAAATTTTAGGTCACGAAGCCTACTTACAAGGACTTGATCCATGTTTGGGATACTATCGAGCATTTTGAATTCGAAATACTTCATTATTAAAAATTTATCGGTAACTTGTTGCTCGGTGTTGTATTTCTCTTCAAGAGCTTTCCATATTTCCACCAACGATTGCATTCACATGTAGAGATCATACAATCAATTGAACAAGGTGTTAAGGATGGGTCCACAACATGTGAAATTGTCTTCCTCGTGCTTCTTCTTGAGTTTGTCCACTTTCGTAATTTCTTGAGGTTTGTATTAGGGGTAGGATCCTCTATGGATTGTAGGTTTGGGTCCAGAACTTACGCTACATTCAAGATGGTAAGAAGGAAAAACATCTTGTCCTTTTAGTGATTGAAGTTTGAGCATCAAATCGGTCAAGTTTCACAAACTCTTGGTTCATCACTTTGAATATGGTGGTAACCTGCATTGCCATCTCCTAAATTGTTCTATTTGATTGTTGGATAATTTGAGTGGAGACGATAGATCTAGAGATAATATGGAACTAAAATAGTAAACTTTGAGGCACGGGTGACACTTTCCAAAAAGAACAATTTTCCCTCACACAAAATTGTTAGAGGGTTAAGACAAAGGTCTTCCCGGGATATGGACCTTTTTTTATTTCCTTTAATTAGAAAAATTGAGGCATTCCCTAAATCTTACTCTAATTTTTGAAAGTGGATTGATTGTAATAATAATTTTTTGAGCACCATAGTCCCTCTACTTATATGCACTAAATGGACACTATTGAACAGCCACAACCCTTCGTATTAAACATACTTCTTACAAGAAACATGTCTTATGAAAATAAAATGTATTCATTGGATGAACAAATCGTCACTTTCTAATCCAAATAAGTGCTTATGAATCACACTAAGCGATCCATTAATAATATCTAATGAATTTGCAATCTACAATTTCCAACAAGATAGGATTTACAGTTATTTGAATTGTTACTTTACTATCACAACACAACATAGGTGATCCTTTGTGCCTGTCACATCCCGAGATCAGGTTCGGAAGTTTTGGCCATACGAAGTTAAGGTTCACCATCAAAACTTGGGCGAACTGGGGGTTCACCAAGGTTCAAGCGAGCTAGGTGTTCGCTAGGGAAGTTTTAGCAAAGGGGTTTGCTAGCAGCATTGCACTTCAAATGAAGTGGTAAGGGGTTCGCCAGTTCCACTGCGAGGCAAGTTCATTAATGTGTTTGGCAACTTGAGATCCACCAGTCTGTGTGATGAACTGTGTTCGCCAGGTAAGTTGCGAACTGGGTTCGCTAGTCAATGTGCAAACTGGGTTGGCCGATCAAAGTTACAATCAAACTCAAATTAGGAAAAAAGTGATTTACCGTATCTAGGAATACTTTATGTACAAGAAATAAATTTCTTAAGTTAGGTTTTCCAAAGATATCTAGGATTCTTAGGTCTATAAATATGACCCTTAATTCTGTGAATTCTTTACTGAATATTCTGCCATTAAAGTCCCTGTTCTAAGTTCTGTCCGTAGCAATTCGAGTAAGTCTGTGTCTTGCTTAAGTTGATCATCTCTAAAGTTGGGTTCGCTTGTGTGTGTGATGTCTGTATGTTCTATTAGTAATTTGTTTGTTTGTTAATAACCAGCTGGACCATCTTCTAGCAAGGACAAAGCCAAAGCCAAACTCTTTTAAGTTTCTCTATTTTTTGATGAGTGATCAAGTTCAGATATGAATATGCTAACTGTCATGTTTTTCAGTTTATTCTGATATGTTTTTAAGAAATATGTTCCGAAACAAGTTCAAAGGCAGGTTTTCTGAAAAGCTCTGTTCTAAGCTACGAAACTCTGTTAAAAAAGATTTTTAAAAGATGATTTTAAAGCACTATTTAATGCGAGCTTCTATGCAAGCTATTGATAATATGAATGTTTTGAAAGAATGGTTTTAAACTGTGTATTTGAAAGGCACTTAACATGAGAGTTTTTTTAAGCAAACAATTTGGCTTTGCTTTGTACAAGCTCTCTAATTAGCTTTGCCTTAGTATGAGCTTTCTATTCTGTGTGCTCCTTAATGAGCCTTGTGATTGGTATAACAATGGTGTGAATACTCACCCTGTTAAGTCTCACTTTGGTGGTCCTTTGAGAGCATGAGCCTTTGTAAGCCTCACTCTACGTGTTTATTGAGAGCATGGGCTTTTGTGAGATTTGTGATATGTCTCATTCTGTTTGCTCCTTACGAGCTAGGTTGAATATAACTTATTCAATGAGATATGTCTTTTGTTTGATGAACCAGTTGTGTAAACTAAATGCCGACTCTATTCTTAATTTTTGATATGTACGAGCCGATCTCACGGCTTTATTCTAAACTCAAATTCATTTGTTAAAAAGAAATATAGCCTTGCACGATTTTAATGCGAGTCCCTTTTAAAAGAAATTTTTCGAAGGAAAAGATTTGTAAACATTGCTTTTAAACTGTCTTCAAAAAAATTGTTTTCAGATGCAAACTGCTCTTGCATTCTCAACTGCGAACTTAGCACGCAAAACATTTTCAAATTAAAGTTTTCTACTGTTTTCAAATATTTTTTAAGGCATGATTTAATGGTTTCTGATTATTCACTAAGTTCTCCCTGAACTCACCCACTTTTCTCTTACCTCTCAGGTAAGTAGATTGCGAGTGGCATTGGAGAGGTTGATGATTTGGCGAGACACCTAATTGGTATCGACGAACCATATAGATGGGCTATGGGTTGTTATATGATTTTTTTTCTAAGAATAGTTATAACATTGATTTGGTTACCCGAAAAATTTGTTTAAGGATTAGTTTAGTATGTTTGATTTTAAATTAATTTTATTATTGCGAACCATGTCTTGAAATACACATGTTCTTTTTCACTATCAATAGAATGATGTTATTCATGTACGTTTATTTTGTTTACTATTTATGGTTATAAATTACTTGTGTACTCTTGTATGATACATTATTTGCATAAGATTCAAAATTATTGTACATGATCCGCTGAATCCTGTGAACTCATGTTGTTGTGTGAGCCTATATTAAACTGCGAACCTATGGTTGTGTGTTTATCTGTAGCCTTTTATGTTGGTAAAAGTTTGGGAGCTATGTTTGAATGTTTTGCTTGATGTTTTAGAGTAGTGCGAACCTATTGATATTTTTAAGTATTTAGAAGTATTGCTTCACACAATTATATACTCTGATGTTTTGTGCATGCGAACCCTTTTGGTTTGTGTAAGAGTGTTTTTTGCGGCCTTGTTAAAGATTAACACTATGTTCACGTGCTTTATATATATGTATAAGTTGTGTGTTGGAGGTTAGGTTGGGAGTTAATAGAGAGTCACTTCGGTGGCTAATGTGGCACGCCAAATTTGGGTCGGATCTTTCTGACCGAGTTTGGGGTGTGACAGTGCCCAACACCAAGTTCCTTAAGCAAGCCACTTAACTGCACTAGTACAACCATTATTGAAGCAATACTTCAATATTTTGTTTCTATCGAAGAGCATGACATAATGCTTCTTTTTTTACTTCCATGAAAGTAAGGGATCCCCAAGCTTAACATAAAACCCCGAGACAGATTGTCTTGACATGGGACATGATGCCCAATCAGAATCATAATACACCACCAGTTGTATATCATCTATTGCTGGAATAAACAACCCTTGACCAAGATTCTTTTTTATGTACCTAATCACCCAAAGAGCTACATCGTAATGTGACTTCTTTGGCCACTGCATAAATTGACTAAGATGTTGCACCATAAAGTTATTTATAGCCTTGTGTCTATTAAGTATAACAACCTCCCAATAAGTCTTTGATAAAGAGTAATGTCAACAAACTCATTATCATCAGAATTTGCTTTTATAAATTCATCATACTTGCATGATGTCAAATTCTAACTTTGTTCCAAAAGAGTGATTGTCGTCTTAGATCCCCCTAACCTTGCATCATGAATCAACTCTAGAGCATATTTTCATTGGTTCCATAGTATACCAGCCTCGAACTGTGCAACCTCAATACCAAGAAAATACTGAAGATATCCCAAATATATCATTTTAAAATTTTATGCAAAATATTTTTAAGTTCAACTACAAGGTCACTATCATTATTGATTATTAAAAGGTCATCTACATATATAAGCATGAGACTAATTTATCTCAATTTCTCTTAGTGAATAAAGAATAATCATGTTTCCTCTAAACATAATCATTGCAAAGAAAAGCTTCAGTAAGCTTGATATTCTAATTTTGAGAGGTTGCTTCAAACTATACAAGGATTTGAGCAATCGACACACTCATGTCTCCCGCTAATTGTGAAAACCCTAGGGAAGAGTCATATACACTTCCTTATGCAAGTCGCCCTGTAGAAAGGCATTGTAAACATCCATTTGAAATAAAGGACAACCTAACCAAACATCAAAAGCAAGAACGAGATGGGCAATAACCTATTTAGCAACAGGAGAAAATGTATCATAGAAATCAATACTCGGCTATTGAGTATACCCTTGACCAACGAGATGAATTTTAAATTGTTCGATAGTTCCATCCAACTTGTACTTGAACTTATAAACCCATTTACAAACATAGGGGTCTTACCTCGAGGTAAAGGCCTCCAAATCTTGAATCTCGTATTTCACAACATTAACCCAACTAGGGTCCCTAGCTGCTTCTTGATAAGTATTTGGTTCAACAATATCGGATAGAGAAGCAATAAAATATTAAGCATGTAAAGGTAAATGATAATTAGTGATACATTGATAAATGGGATATTAAACTTTAGCAAGTGAAAAAGATGAAGAAGATTGAGAAGAGAAAAAAAAGTCTGTCAACCATGATGGCGGTCGGTTGGACCAGGTAGAATGACATAAGGGTGAAATTGGATTAGACAAAATAAGAGTAGGAGAAGAGGGAGGAATGTTGCAAAAAAATAGGATGAAGAAGATGGGGTGAGAGAAGGTAATGAAGTAAAAGGATGAAACAAGTTAGCAGGTGGGTCAAAAGGTAAGCTAGAACCTAAGGAAAGAAGTTAACGTAAAAATTATAGGAAGAGGAAATGGGAAATAAATGTGGTGTAGTAGACTAACATTAAAAAGGAAAAATCGTCTTATGAAATTTAACATCACAATTAACAAAAAAATGATTGGTAGCAAGATTGAACAAAAGATAATCCTTTTGAACAATGGAGTAACCCATAAAAGTAAAAGGTATAGATTGAGGTTGAAATTTATCTAAAGAATGAAGGACTTTAGCATAGCAAAGGAAACCAAAGACCTGTAAGAGGGACAACTCAAGTGGTTTATTATATAAAATTTCAACGAGTCTTCCAACCTAAAACTGAGGTCCGTAAATGATAGATAATAAAAAAACTAGTGAGAATAAATTCATCCAAAAATTTAGTAGGAACAGTACATTGAAATTTAAGGACTCTAGCTATTTCCAACAAGTGACAATGTTTACCATTAGGTATACCATTTTGTTGGGGCATACAGACACGAATCTTGATGAAAAATACCCAAATAAGAAAACAAAGAATTATACTCGACAATAAAAAATTCAGTAACATTATCATTACGAAAAATTTTATAATAATGAAAAATTGAGTTTTACCAAGGTAATAAATTGCTTTAAAGCAAAAAATAGCATCACTTTTGAGTGTAAGAAGATACGTACAAGTTGCTCGAATATAATCATAAACCATCGTAAGAAAGTAAAGATCCCACTATGTGTGGAAAATTTATATGGCTTTCGCAAGTCAAGATTGACTAAGGAGAATGATGTTTCAACTCGAGAATGACTAAAGGGAAAAGGTAAACGTGTTTGTTTAACTAGTAGAAAAACATGAAAAATATGAATATAACCATTGTTCAAAGGATTATAATGAAAATGGTCCATTTTGTTCATTTTGGAAAAAGGAGGCATGACCAAAGAAATGATGCATCGATTGTGGACAAAAAATAAGAAACTAAAGAAGGTGTAGCCTTAGTTGAAGAAAAATGTGGTAAGAGTAGATAAAGACCATGCCGCACTCTACCAAACCTCTTCACCTATCAATTGCAAAGGTCTTGTAAAAGAGAAATATGAATATAAAAAGAAACAAAAAATGTAAGTCACGAGTCAATTTTTAGATGGAAATCAAATTAAATTAAAATAAGGGATATAAAAAACATTGGTAAGCTTGTGCGAATGTGAAAAGGCTCGAGTACCCATATGAGAAATAGAGATAGACTTATCAATAGGAAATAAAAAAGATGATGGACAAGATGCATGTAGAACTAAAGAATCCAAACAGTGGATATCCGATGTCATATAGTTGGTAGCACCAATATCCAAAATCCAACGAGAAGCAAAAGGCTGTGAAACTATATCTGTTGTAACAACCCGATTTTTAGTGGTGCCAAAAAGGGTAGTTTTGGAACCCCATATTCGTAAAATGGGTCCATAAATATTAAATATAGAAATTTATGAAGTTGGTATAAAAGTTTATTAAAGTTTGGACCATCAATTTTGTTTATTAATTGTTTAATTAATGTACAAGGACTAAATTATAAAACTGTTATCGTTATAGATTTTTAATTGGCAAAAGGCTTAAGGACTTAAATTGTAATTAACCAAATATCCAAAATAGTAATTAAACTATTTTGTAACATGGAATAGTGGCATATGATGACATTCCCTCTAACTTTGATTAATGGTTAATTAATTAAGTTTAAGATAATTAATAAAATTTAGTTAATCCCTAATTATACTATATAAACTAAATTAAACAAAGAAGGAAAGAAAACCCTTATTGAAGGTCAAACTTTCGATCCTCAATTGGTGAGTTCAATTAAGTCATTTTCTTGTAAGTTATATGTTTTGAGGTCATGGGAGCTTGTTTTAGCTAGCCTATGTACGAATTTGTGAAACTGTTAAATTTTTTTAAGTTTCCATTGCTGATTTCTTGAATAAATTGGTCTTAAATTGATAGTTTTTAAGCTTAGATGTGAAAAGGATTAGATTGTAAAGTTTAACTATTAGTTTTGCACAAAAGGAATAAAGGGAATAAATTTTAAAAAGCATGTGAAATATCTAGAATAATAGATAGTAGGGAGTCCCTAAGGGGTGTAATTGAGATCGATTTTAAAATCGAGGCTTAAAATTGAAAGATATTTTTATTTTGGTTTTATGGACTAAATTGAATAAAATACAAAAAATTAAGGGGCATTTAAAAAATGGAATTAAATAGGTTCATGAATATCATGGAGTGATATAAATATGTTTGATATTGATGCATTGTCTAAAATAATTGTTTAGATCAAGAATTGAATCTAATCGGTGATAACCGGAGAACAACAAAATTGTGGAAGTCTTTGAAGTTTCAACTTGTTGTTTTTGCCAGGTAAATTCATATGAAACTTACTAATTTATTTGATGTTATGCTGAATTGTGTTTATTTCATAAATATGTTTAGTTTAAGGTGAATTTGGCATATTTTCATCAATTGGATTGAATTTCAAAATATAGAAATATTGTTTATTACGAATAGGTACAAAGTACAAAAATGAAGATGTTTAACATTGAATTACATGTGCTTGAATATTTTATTGTAAATTGACGATCGGGTCGAGCGAGGGGAGTTACATTTAGTGGTATCAAACCTACGGTTTAGTCAATTCTAGGACTGAAATGTAAAGCATGTTGAGTCTAGAAATACATGCCACAATAACCTGTGATAGTGTGATGTCTTCTGATTCGAATTGACTTTTTTTCCATATAGCTAAACCATGTCAGCCGAATCAAATCGAGTTGTGTCTAATGAAGTTGAAAGTAATATTTGTGCTTTCAAACAGGGAGCTTCCCGAAGTTTTCCCATTCCACAACGGCTAGGGAGTGAGGCAAGAGATGCCTTCTTCCAAATGATGAACTAGTGGTTCACCCAATATATGGGAGCTACCCCTTCCGCTCCACAACCTCAAATGCACCTTCCTTCCCCGATTGTGCCTCCTGTGGTACCCTTTCATCCTCAAGTTTCTAATTCGGTACCCATTAACCATCCTCTGATATATAAAATTTGTAAATGTGGGGCAAAATAATTCAAAGGCAAGAAAAAGGATGAACCAAAAAAAGTTGAGTATTGGATAGAAAACACTAAGAGGGTTGTTGACAAGTTATTTTGTATTCCTGATGATTTTTTAGGATGTGTCGTATCATTGCTCAAAGAAGAAGCATACCAATGGTGGATGACTCTAACGTTTGTTGTTCTGAAAGATCGAGTAAACTGGGAGTTCTTCCAAATTGAATTAAAAAGAAGTATGTTAGCCGACTATATCTTGAAAATAAAAAGAGAGAGTTTATGAAACTGAAACTGAGAGATAGGTTAGTAGTTGAATATGAATGAGAATTCATTTGCCTCAGTAAATATGTCAGAGAGCTTGTATTTAGTGAAGCTGAAATGTGTACTCGTTTTGAGTGGAGATTGAACGAGGACATACAAATGTTAGTAGGAGGTGTGGAATTGGAAAAGTTTGTTATTCTATCGGAGAGGGCTCAGAAAATGGAGGAAATGCATAAGGAGAAAAAGTAGACCAAACCTAAGATATGAGATTCTAGTAAATGGTGTATGGCCATATCTTTCCCAACTCATCCATCTAAAAAGTCAAAATATTTGTAAAGTCGTTTCTCTACTCCATTAGGGATTTTTGAGAGAGATGGGCCGAGACCGAGTATTCTGCAACCTCAGACTACGTCGGTAGCTAGTGTCAAAAGTGTTCGTAATGCAAATAGACCAATTTGATGACATTGTGGAAGAAACATAATGGTGAATGTAGATTGAAAAATGGAGCTTGTTTTCTATGTTGTTCCAAACAACATTTAAGAAGAGATTGTTCGAATAGGCCAGATCAAAGCAAGGAACAAAGTGTAAAGCCAGTGTCGACTCTGTAGAGGATTAGAAGACCAGGAACTGGTAGCAGCGCTGGTGCTAATCGAGGTGGAACTAGAGATAAGTTATGAGATTCGAGGCTTGTGCACCTACTAGAGCTTATGCTATTCGAGCCAGAAAGGAAGGTACTGCTACTAACATTATTGCTGATACATTTTTCTCTATTTGATGCTTTTGTGCCTGCATTGATTGACTCTGGGTCAACATATTCATACATCTACACCTCATTAGTAGCTTAAAAAATATACTAGTAGAATTGATAGAATTTGATGTTTGGGTAACCAACCTGTTAGGTTAAAGTGTTCTTGTCAATAAAAGTTGTAATGACTGTCAACTGGAAATTTGAGGCCGTAAGTTTTTAGCTAATTTGATGTTATTACTTTTTGATGAATATGAAATATTTTTCAGAATGGATTGGTTGACTTTTCACGATGTAGTGGTCAACTGTAAACAAAAGTGAATATCATTGCGGTGTCAGGATGGTGAATTGATAAATGTGAAGGCTGACAGATCTGATTGCTCGACTAACATAATATCAATGATGTTAGCTCGACTAACATAATATCTATGATGTCAACTCAATAATTAATCAAAAAAGGGTTTGAGGCATATTTAGCCTATATTCTAGATACTAGAGTGACAGGATCTAAAATAGAGCAAGTTTCGATGGTTTGAGAATTCACATACATGTTTCCCAAAGAGTTGTTAGGTTTCTCGCCTGAGAGAGAAATTAATTTTGTTGTTGAAATAACACCAAAACTATTTCGATTTCTATTGCATCATACAGGCTGACTCTGATTAAATTAAAAAAATTGAAAGCTCAGTTGCAAGAACTGTTAGATCAGGGATTTATCCGACCAAGTGTGTCACCTTGCTCCAATATTATTTGTGAAAAAGAAAGATGGAACCCTAAGATTGTGTATCGACTACTGGTAGTTGAATAAAGTGACCATAAAGAACAAGTATCTAATGCCCTAAATCGATATTTTTTTATCAATTGATAGGAGAAACAATGTTTTCTAAAATTGACCTTTGGTAATCCATTTGGGGTTACTAATGCTGTAGCCGATTTTATGGATTTGATAAACAAAATATTTCAGCAGTATCTGGAAAAGTTTGTTTTTGTGTCAACATTTCAGAATTGTATTACAGACTTTTCGAGAAAAGCAATTATATGCAAAGTTCAACAAATGTGAATTTAGGTCACGAGAAGTGGGATTCCTAGGTTACATTATATTAGCTAAAGGCATTCAAGTGGATCCGAGTAATATCTCAACAATTGTTAACTAGAAACCTTCGAAGAATATCACTGAGATACAAAGTTTTATAGAATCGGTCTGATACTATCGACAGTTTGTTAAAGGTTTCTCGATAATAGCCCTCCTATTAACAAAATTGTTACAAAATAATATCAACTTTGTTTTGTCAGGAAAGTGCCAGCAAAGTTTCAAACAGTTGGAAGCAATGTTAACAGAAGCTCTAGTTTTAAGTTAGGCTGAATCTGGAAAAGAATTTTTTGTGTTCAGTGACATGTCACTCAACTGTTTGGGTTGTGTACTAATACAAGAGGGAAAATTAGTTGCTTATGCTTCTTAGAAACTTAAGCCACATGAGAAGAATTATCCTACACATGATCTCGAACTTTCAACAGTGGTTTTTACTCTAAAGATTTGGAGACACTATTTGTACGTGGAAAAATGCCACATTTTCATAGATCACAAAAGTCTAAAATACTTGCTGACACAGAAAGAATTGAAATTGAGACAACGCAGGTGGCTTGAATTGCTTAAAGACTATGATCTGATTATAGATTATCATCCTAAAAAAGCTACCATTGTAGCTGATGCCTTGAGTCAAAAGTCCCTATTTACTTTAAAGGTGATGAATACCCGTTTGGCTTTGGAACGAGATAGTTCTATTTTAGCTGAGTTGATAGTTAAACTTATTTTTCTTCAAAAGATTCAGGAGTTGCAAAAAGATGATTCCAAGTTGTAAGCAAAATAGAAACTTGTTGAAGATAATCAGAGCAAAGAGTTCAGTGTTGATGATAACGTAAATCTATATTTTTGAAAGTGTTTGTGTGTACCGAATAATTTAGAATTGAAATGAGACATTTTGCACGAAGCTCATAATAGTACTTACATGATACATTTGGGCATCAATAAGATGTATAATGAGTTGAAACTGTTTTATTGGTGGCCGAGAATGGAAAGATAGAGTACTGAATACAAGTGGAAACACAGAAATATACACACTTTTTCATGCCTTTTTTAACTCAAATTCATGTAGTTTCAGTAAAATTCTTATCGAAAAAATATATAATAATTATAAAATACTTAAGTTGCACTCAAATTATGGACATGTTTAATTTTAATTAATTTTATATAAAATTTTGATTATTTTTTATTATTTTTGACAGATTTGCACAAAGGGCAAAAAATGGCTCGACAGACACTGCTAAAAGCACAAAACCGAGAAGCAATTTTGAAGCATGAAGGCGAAATAATTTTTCAGCATAAGATGGTCAAAATTATGTGTATTAATTCATAATATAATTAATTTTAATTTTAATCCAATTTAATTTGGGTTAAATAAATTACTATTAATTAATTATGAAAAGGGGCCCAATTGAGCTGAACCGAGAAAATTGAACCAATCGAGCACTGGGCAAGCCAAAATCGTCCAACATGCTGACCCAATCAGCTTGCTTGGCTGGTTATTTGGCTTGAAAAATGGCTCTTGAAGACTCCTTCAAATTTCATTCAAACCCTAGTATTTCTGCCTTTCTAGATTTGCCCCAACCTTAAAATAGCAAGTTTGAAACCTTAAAACTTGCCACTAGTGTGGTCGGCCATGGGGGGACTCTATGGCTGCTGATTTTTGCTAATTTTGGAAGCCATCTCAACCTATAACAAACCCCTTGGCTAATCACTTCAAGCACATCTTAAACTCATTCATTTCTTTACTTCTTTTTCATTTTTTTCTCTTCATTCCCTTCCATTGTTATTCATTTTCATCCCCTATTCCTATGCCGATTTCACCTCTTGAAAAAGAGTCCTTCAACCACCATTTGGAGTAGCATTCAAGTGTTCGTGGAAGCCTCGATTTAACAAGAACAAGCAGAGAAGGAGGAGCGGAGCAAACTAGTCAAGCCTCGGAGAAACACCAAATTTGATTCTTGTTCCTTATCTTTTTAATTTAATTGTTGTTGTTATGAACATGTTTATGAATATTTGTGATGTTGATATGTTTAATTTAGTTCATATAGCTTAAATTTAATTCGGGTTAGGTTGATTGCATTTCGTCTACTTGAGTTATTAAAATCGTGTTTGTGTTGTTACAGGCCTCGTTAAGATGTTTGATTAAGTAAAACCATGACTAAGTTATTCTTGCATTACAATTGTAAGGTAACTAATGAATTAATTATTTAATTGGATTTAAATTGTAATTATTGACACGATACTTAATTAGTGCATGTTTAATCATCTAAGGTAGCTGAGGGTTAAGTTAGCAACGGTATCTAACGATACATTAGCCTTGCATAACTTGCAAGATTATTGTGATTAAACTGTTTGAAGGTAGAAATACATTGTTACCTCACGTAATCCTTTATGTGCTTATGAGATTGAATTAATTGTTTGAATTGACATACAGATATGTACAAGAGATTATTTTAATTTCATAGGTATGTATGTGTATTAAAATATTTTCTTATTAAAATTTGTTTATTCAGTTGAATTGACATAGAGATATAGTCAAGAGATAAATGGATTTTGGTATGTAAGTATGTTCATAAGTTAGAAATTACCGAGTTACCGTGAATTTATTCGTAACAACATAAACATGAGTTTAATAATTCTAAGTTAAGAAATGTAATTAATCTAGCACAATTATGTCATTTTGAGTAAAATCATCTTTTGAAATCATGCATTGGAACTTTTATTTTAATTTTATTTATTTTACTTAGTTAAAATATTTTTCTTCACCAAAGTGTTTTTAAAATTGCATTCATAAATATTTTTTTTCACAGTCCTTGTGGGTACGATAACTCTACATTTACTTGTCACTTTATTACTTGTTGCGATTGTGTACACTTGCACATTCCTGTCGTTTCAAGTTTTTGGTGCCGTTGTCGGGGGACAACTTTAAAAATTCATTATTTGTGAATTTGTTAATTTTTCATTTTGGTTTATTTCTCTATTCAATTTTAACTTAATTAATTTTTCTGTGTTTTTTTCAAGTGTTTATGAGTATTGATCGAATTATCGATTTACTCCATGTAGACCCTGAGATTGAAAGAGCTTTTCGACAGCGGAGAAGACAAGCAAGTCAAAGAAGGACCGAAGAGATGAACTTCAAAAATCTGAATCAAGGAAATAGAGCAAACACTGCCCAAAATCCTATCCTTATTGCTGATGATAGGGATAGAGCTTTAAAACAGTATGTTGTGCCAGTGTTTCATGATCATAATTCGGGTATTAGGGGACCCAAAATTGAGGCACAACAGTTCGAGCTGAAGCCATTCATGTTCCAGATGCTTCAGATAGTGGGCTAATTCAGTGGAATGCCTACCGAAGATCCTTAACTTCACTTAAGACTATTCATGGAGGTGAGCGATTATTTTAAGTTAGCTTGAGTACCCGAAGATATGCTACGATTAAAATTGTTCCCATATTCGTTGAGGGACAGATCTCGAGGCCGGTTGTACTCATTGCCCCCGAATTCAATTTCCATATGGCAAGAGTTAATAGAAAGATTCCTCATGAAGTATTTTCTACCTAGCAAGAATGCTAAGTTGAGGAATGAGATCACTGCTTTCTAACAAATGGATGATGAGTCCTTGTATGAGGCATGAGAAAGGTACAAAGAATTATTACTAAAATGCCCTCATCACAGAATCCCATATTGCATCCAACTTGAGACGTTTTATAACGGTCTCAATGCCCACACGAGGATTGTAGTGGATGCTTTTGCTAATGGTGCTCTCCTTTCTGAGTCTTATAATGAGGTTTATGGAATCATTGAGAGGATTGCCAGCAAAAATTATCAATATCCAACCAATCGAGTAACGTCAGGAAGACGAGTTGCTGGAATACATGAAGTAGATGCTCTTACTTCACTCACATCTCAAGTATCCTTAATATCCTTAATGCTTAAAAATTTTACCACTAATGGGTTTAATAGTTTTGCAGCACAACCACCGCACCAATTTGAAAATGTAGCCTGTGTCTATTGTGGGGAAAGACATATGTTTGAAGAATATCCATCGAACTCAGAATCCATTTATTACATGGGTAACTAGAACCAAAACCGAGGAAGGCAGGGAATACAATCCAATTCCTACAACCCATCGTGGCGAAACCACCCTAATTTCTCCTAGAGTAACTAAGGGGTTGGACCCAGTAACACATATGCCCAACCTAGACCGACCCAGCCACCTATTTTTACCCAATAAGTTCAGAAACAACCTCAAGCTGAACCATCCAATGGCTTAGAAAACTTGTTGAAGGTATACATAGCCAAGAATGATGCCTTAATCAAAATCCAGGCAGCTACATTGAAAAACTTGGAAAACCAAATCAGCCAGCTTGCAACTGAACTCAGAAACTGACTACAAGGTGCTTTACCTAGTGATACGGAGAATCTGAGGAATTCTGGGAAGGAACATTGTAAAGCGTTGAAATTGAGAAGCGAAAAGACATTAGAGCCCAACACACTCGAAGTTTAAAAGGAGCCAACTGATGCTCAAGACTCAGGGGAAGTTCCATCGAGTGTTGAAATTCCAGTTACACTAGAACCAGAATATGCCAAATCTGATAAGGTAACTTCTTAACCACTTAATTTTGATAAACTAACAAATTCATTAGATGCAGAATTGCCACAGAAGACGAATAAACCAGTTCCAGTAAAGAAGCCTCCACTACCCTACCCTCAGAGACTTCAGAAGTAGAAGAACGAAGTTCAATTCTAGAAGTTTCTAGACATACTCAAGAAACTTCATATCAACATTCCATTGGTTGAAGCACTTGAATAAATGTCGAACTAGGTCAAATTCATGAAGGATATCCTGTCAAAATAATGAAGACTTGGAGAATTTAACACGGTAGCCTTGACAAAGGAATGCAATGCATATCTTTAAGACAAAGTACCTCCAAAGTTGAAGGATCCTAGATGTTTTACCATACCTTGCAACATTGGAGCAACATATTGTGGTAAGACACTATGTGTTTTGGGCGCGAGTATCAACTTGATGCCCATGTCAATATTTAGGAAGTTGGGGATAGGTGAAGTTAGACCTACTACGGTTACACTTCAATTAGCAGATCGGTCCTTAGCACGCCTAGAAGGAAAAATTGAGGACGTGTAGAAAAAATTATTTTTCTTACTGAATTTGTTATTCTAGACTTTGAAGCAGACAAAGAAGTGCCAATCATACTAGGAAGGCCTTTCCTAGCAACTAGAAGGACCCTTATTGATTTGCAGAAGGGCAAGCTTACCATGCGTGTCCAAGACAATCAGGTAACATTTAATGTTTCTAGGTCCATGAAAATTTCCTAACACAATTGATGATTGTTCTACAGTGTTCGATTTAGAAGAATTAATCATGGAAATTTAACTCAACTATGTTGAGGACCCATTGGAACAAATTTTGACATCAGAACCTCCAAGTGATGAAGAGGAATATGAATACTTAGCTTTGCTAGAAGCTAATCAAAGGGGATTTAATCTGTAATCCCTCTTTGAATCTTTGGAGTCAGAGAATTGAAATTATGCCCAACCAAAAGCGTCAATTGAGGAGCAACCTAAATTAGAACTGAAGGTACTTTCCTCACATTTAAAATATGTTTATTTAGGTAATGCTTCTACTTTGCCTGTGATTGTTTTAGTGGAATTAACCGTTGAGCAAGAAGGCTATCGGATGGACCATAGTCAATATTCACAGTATTAGTCCATCTGTATGCATGCACAAGATCATCGTGGAAGATGGCGAAAAAGGGATGATTGATGGACAACGAAGACTGAACCCCATCACGGAGGACGTGGTAAAGAAAGAAATCATCAAGTTATTAGATGAGGGTATAATTTACCCCATCTCAGATAATTCGTGGGTAAGTCTGGTCCAGTGCATGCTAAAGAAAGAAGGTCTTATAGTCATTGAAAATGATAATAACCATTTGATACTGACTAGAACGGTTATGGGATAGAGAATTTGCATCGATTACCAAAAGCTAAACAAGGCGACTAGGAAATATCACTTTCCTTTGCCATTTTTGGACCAGATGCTGGATAGACTCACAGGGTGAGACTATTACTGTTTTCTCGATGGATACTCGGGGTATAATCAGATTACAGTAGCACCGAAAGATCAAGACAAGACAACATTCACCTACCCATATGTATTCAGAGATACATATGATGATTGCCTAGCCAATCTAGCCAAGGTACTAAAGCGATGCAAAGAAACAAACCTCATACTCAAATGGGAAAAGTGCCATTTCATGGTACAAAAAGGTATTGTTTTAGGGCATTGGATAATGAGACATGAAATTGAGGTAGGTAAAGCAAAAGTAGACTTTATTGAAAAACTCCCACCTCCAACATCTGTAAAGAGTGTTGGGGCTTTTTGGGCCATGCCGGTTTCTATCGAAGATTTATCAAGGACTTCTCCAACATTATTTAACCCTTATACAAATTATTGGAGAATGACACGCCATTCAAATTTGATGAAGAGTGCTTAAGAGCTTCCAAGGATTTGAAGAGTCGATTAGTTTAGGCACCCATAATTGTCACACTAGACTGGGGTTTTCCATTTGAATTGATGTGTGACGCAAGTGACTTCGCGATAGGAGCTGTCATGGGCCAGCGAAGGAATAAGGCTTTTCATCCCATCTACTATACAAGCCGGACTCTTACAGGTGCTCAACTGAATTATACGGTAACAGAGAAAGTGTTACTTGCTATTGTGTTTGCTTTTGACAAGTTTCGATCTTATCTTGTAGGTACCAAAGTGATTATCTATACGAACCATTCAGCAATTAAGTATTTACTTTCCAGGAAAGATGCTAAGCCAAGACTGATTTGATGGGTTTTTCTATTTCAAGAATTTGATCTAGAAATTCAAGATTGAAAGGGAGTAGAAAACCAAGTAGCAGACCACTTGTCCAGATTAGAGCCGCAAGAAGGGAATTCTCCACTTATACCCATTCAAGAGACATTTCTAGATGAACACATACTAAATGTAAATCATGTCCATAATACCCCTTGGTTTGCTGATATTGCTAACTTTTTAGCTTGTGGTTTGATGCCGATTGATAAGACGTATCATCAAAAGAAAAGGTTTCTTCACGATGTGAAGTACTATTTCTTGGAAGAACCATACTTCTTTAAAAAGTTTACAAATCAAATGATTAGGAGATACGTGGCAGAAGATGAAGTGCATAAGATTCTATATCATTGTCACTCAATTCCGAGTGGGGACACTTTAGAGGTACACGTACTGCGGCCAAAGTATTGAAAGTTATATTCTTTCGGCCAACACTATTCAAAGACACATATGCTTCCATAAAGAGTTGTGATCGAAGTCAAAGGGTTGGAAACGTCACCAAAAGAAATGAGATGCCCCAAACAAACATCATTGAGGTAGAATTATTCGAGGTTTGGGGTATTGAATTTCTCAGTCCTTTCCCTCCATCTTTTGGTCACAAGTACATATTGATAGCAGTAGACTACGTGTCTAAGTTGGTTGAGGCCGAGGTATATCCAACAAATGATGATAAGGTTGTGATGAAGTTTTTGCAGAAGCATGTGTTCACAAGGTTTGGAACCCTTAGAGCTATCATTAGTGATGAAGGGTCTCATTTTGTGAACAGATGGTTGAAATGGTTACTCGACAAACATGGAGTGAAGCATAAGGTTTCCACAGCTTACCATCCGCAGACGAATGGGCAAGCTGAACTAGCAAACAAAGAGATCAAAGGCATACTCGAGAAGGTAGTTTGGCCGAACCGATGAGATTGGTCCAAAAGACTGGATGATGCTTTATGGGCCTATAGGACAACATACAAGGCACCTTTAGGGATGTCACCCTATAGGTTGGTCTTTGGGAAAGCCTGTCATCTGCCCTTGGAGTTAGAGCACAAAGCTTACTGGGATCTCCAACAACTCAACTCGGATTTTAAGCTTGCTAAAGAGAAACGAATGCTCCAACTCAACAAGTTAGAAGAATTCCGAATGTTCTCATACGAGAATGCCAAATTACTCAAGGAAAGACTTAAGAGATGGCATGACAAGCACATTCGAGTTCGAGAATTTGAAGTAGGTCAGCAAGTCTTGTTATTCAATTCTAGATTAAGGTTCTTTCTAGGTAAGTCAAAATCACGTTGGTCCAGTCCATTTACGATTCACCGATTTTATCCATACGGAGTTGTCAAACTTCAAAGTAAGGTAGGTAATTTTCGAGTCAATGCTCAGTGCTTAAAACATTACTGGGGGATAAAATTGAACGGGATCAAATTTCGTTCGTTTTATCAAATATTTAATTCTTCTTGTTTTTGTTTTTTAATAAATGATTTAGGGTATATTTTTGGGATTAGTATGTTCAAATAAATTCTGTCTAGGAGATTAGAACTTAAGCGGGACCGATTGTGACCCCTCCAATCTTTCCTAGGAATTGATTTTAACATAATCTTTTGAGAAATTTCCCTAAATGGCAAAATAAATTTTTAGTTTTAAAATAAAAGGGTCAATTTTGATCTACGTTTTAAATTGCAACTCAATTTTGAATTTTCCTTAAGTCCAGGTACTTAATTAAATTATTTTCAAAATTTGGTTTCTCTTTTTGTAAGTATTAAAAATTAGATGTCTCTTTTTGTAAATATTTTCAAAAGGCATCTAGAATAAATGTTTTTAATTTAATAAATAAGATGATAATTATTAATATATAATTATGTCCATTATAATATATATTAATTATTATCAACTTTGCATAGAATTAGGATTAGTTTAAATTTGATCATATTTTATTTAATAAGTTTTATTTTAATAAACTAATAACAAATAATAATTTAATATACATTATATTAATTATTAATTTTTGTTAACTTTATGTAGAATTAGAACTTAGAATATTTTAATTATTAATTTGTTCTAAGAATTCTAATTAAACTCCTACTCCTTTCATTATAAATTTCACCCACCTTTTCCATTTTTTCACTCATCCCTCAATTAAATCCTAGCATCCACAACTCACCAAGCTCCAAATCACCTAGTGCCAAAATCTCTAGCCGCAACACCGCCTAGCTTCACTCGGCACCCTCACCCATTCGGCCAGCAGCCCCACGCATGTACCCAGCAACCCCACGCACAACGTGTGCGCCACCAGCCGCTCTGTGCCGTTGCACCTGCCACTCGTCCGGCTCTAGTAGCTCGCCAGGCCTGCTCGACTCACTTGCTTACTGACCACTACCCTACATCCGAGCGGCACACACATGCCCTGCTACTCCTTAGCATGCTGTTGCCGCCTTGCTACTCACACCACACTATCAAGACACCCTACAACCATCCCTAAACCAACCTCTTTTGCTTTTGCTTTAGATTTATTTTCTTTGAGTTCTTAACTTTTATAAAAAGGTGGTAAGACAAATTTTTCTCCTAAAATTTCAATTTTATTTAATTATTTAAAATTTCAAATTATTGAATTATTAATATTTTATACTAATTAAATTTTTGAGAAAATATTTTTTCTATCTTATGATTAGGTTAATCATGCCTCGTAAAAGAACTCGTGCCTCTACCCAAATTGACGAATCACAAAACAAATTCCACTATGAAGAAGCTAAAGCGAGATACGAAAACATTTTCAAGAATCAATAGATGCACCCAGAAAAAGGCTTTACGCTGAAAAAAACAACTATATTGATTTCATGGCATGCATTCGACAAGTTGCTGAAGCTCTCAATTGGGAGTTGTTTTGTGAGAAAAGACCTAGTGTGGATGAGGAGTTAGTCCGTGAATTTTATGCGAATTTAATTTTAAGCGATTTGATGGAAGTTTCTGTTCGCGAAATCAAGATACCAATAACCTGAAATGCTATTAATGAATTCTTTGAATTACCTAATTTCAAAAACAACGAATATTATTCCTTGATGAGCAATATGGAGTCTAAAAATCTGCAACAAATTCTCGAGGAACTTACAGTTCCAGGTTCTAAGTGGACAGTGTCAAAGTAAGGAATTCACACTTGTCGCAAAGAATATTTGACACCACTAGCGAAGGTATGGTTATATTTCATTCGATTCAGCCTTATGCCTATTTCACATGGGACTACAATTTCATTAGAGCGAATGGTCTTATTATACTCGATTTTAACTGGAAAGACCACTGATGTGGGAAAAATCATCCTGAGAGAAATACAAAATTGTGCCTCTAGACGTTCTGGCCCAGCTTACTTCCCCTTACGATAACAATTTTGTGCTTGAAAGCTAAAATTCTTGCAAACGTAAAGAAAACAAGTTATAGCCAGGGCACAATCACAGATTGGGACCTCTACGGGATAGCCAGAGACTCAGTTCTACAGCAACGAGTTGAAGAAAGCGAGGATCCCGAATAAGAAGAAGAAGATCCCACAGAGATCAAACCGATGCAATCAGCTGAAATCCCTGATAAGGCAGAACCAATGGAACCAGTAGCCGAACCTGATGTCACAACTTCAATGTTTAGAACTCAATCGTCTTGCCTAGATCTTCGAGATGAGCTGTCAAAGTTGATGGACATAATGCAGCATATGCAGTGGCAGCAACAAACTTACTAGAGATATTCAAAAATACGGGATGACTCAATGAGAAGCGCTCTTACGAAAATATACAATAACCCGTTTATTTTTGTTCCTGATTTTCCATATTTCATATTTGAACCATGGAGTCCACTATCGAAGAAGAAGCAAAGACGACGGAGCAAAAGATGAGTCAAATTCGGAAGGATCTGCAAATAAATAAAAGGGGGAGATCTTGACTTTATTTTATTTCTATTCTTAGGTTATTTAATGTTTTAGGATTAGGTTCAATTGGGATTTTTATTTTTCGCATAATAAAACAAGAGGTGGAAATCATAAATAAAAATGAGCAAGTTGCAAAATACAAAGTGTGTCAATAGATATATACATGTCTAAGATTGGATCTAGAGAGAGCTTGGTACTTTGAAATTTTTCTTCTCAGAATAAATTTTTCTTTTAATTATGATTAGTATATATTTTGTTCAAAAATTTGAAATTTTGTTAAGTATGCTAAACTTCAGTATAAATAAAGTTCGATTATTTCAATAATTACTATGTTAGCTTAATAATGACATGAATGTATTTTTAATAAAAATATTTTAGCTCCTTAGGAAAGTTAGGCATGCATGAAAGTTTAAGTCTCTACAATTGGCTTAGTAGTTTCTTGAGGCGAAATCCTAGGAAGCATGGAATGTTCAAAATGATTTAGGCAACTTGTTTTTGGACCGTTTGAGCTTTTCAAGCCAACCATGATGAATTTTTATCCCTTGAAACCCAACTTTGAGACTATATGGCCTAATTTTATTTGAACCCTTGCAATGTTTAGCCATCACTTCTCTCTTAATTATCTTTAAATTATCCGAAACACTAGACTCAGTACTATTTAGAATATTCTTTGAAAATAAGTTTGGAGGAGTTGAAAAGAAGTATCAAATGCTAAAAAAAATTGTAGTGCATATAGTAAAATGATCATGTTAAAAAAAAGAGAGCATATGTACTTGAAAGAAAATAGATGAACAAAAGAGCATGTGAAAGCAAAGTAAGTTGGTGTGTTGAAGGTAATTATTTCGAAGGTCCGATTGAAGCTGAGTCTAGGGTTTTTAGCCTAAATTTATCTATCTTTTACCTACCCCTAGCCTAGCCATGTTACAACCTTTTTAAAGACCTATTGATTCAAGTTTCTATGCTACCTACATTAGTGGAGAGAAGTTGCTATGATCAACATATGAAGGCATAAGTTAAACTTAATGGTTGCAACTTAATCTTGAATAAGAGAATAAAATCAAATTCGCAGGGATTTAACATGTCCAACTATAAATAGATGCCTCTTCCTTCATTGTAAAGAGGGGAAGTGGGGAGTAATAATAATTCTTAAGAGTATTTACTCAAATTTCTCTCTCTCTTGCGTTCTTATTTTGTTAATTTGTGTATAATTTATTTATTGATTTGTATATTATTGATTTCAAATCTCTTTTTCCCTTATTATTCATTTTCAAATTCATTATTTTCAAATTTGTTTACATTTTATTTTGCCTTATATTTTTTTTTGATACTCTTTGTTTTAAATTCATTGGTCTTTGATTATTGATGCTATTTAATCCTCTATTTGTTATTTTAGTTTTTCTTATTATTAAATTAATTATTTTAATATTATTAATACTATTATGTGCCATCATTAATCTTGTATTATTATTATTATTATTATTATTATTATTATTATTATAATATTCATGCGCATGCATCGTTTTTATGTAATATATATATTGTTTTATATATAGTATACGTATGCTTATATATATTTTATACATATGTTTTTGTTTTTATTTTACTTCCTAACTTTTATATACATATATATACTTTTATATTTAGTTTCAATTTTTTTTTACTTTTGTATATATGTACATGTATGTATTTATATATTTTTTCTAATGAATATTTATATATATATATATACGCACATGTCTATGTTTTTTAATTGCTTAAATACAAACTTAAATTTTCAACACATATGTTATAATGTATATATGTATATTTATATATTTTTCTTTATTTTCATAAATGCATTATATATATTTTGTTATAAATTCTATAGTCCAAAATTTTATATGTAAACCCATGTGTATGTATTTTATTCTTTATAATTTCATGTATATATTTTGTACCTTTTTTTTCTCTTTATATTTTTTTGTTTATTTCTTTCATTTGCTTATTGATTTGTGTTTTCATTTATATTGTTCATTTGATACTTTACATGTCGTTGTTTTTTATGTACATTAATTTGGTTTATTTCTATGCCATTGTTGTATTTATTATTGTATTTTACACTTAATGTAGCATTACATCATTTTTTTACTCGATTTTAAAATTTTCAAAATTGAGATAATACTCGTATTTAGGATTTTCAAGGAAATTGAGCCCTAACGTATTGGGTTCCAATTTTCTTCGTTAAATCTAACAATCGAGAATTGCTCATTAATCAAAAACTAAAATGAAAAGCTTGTTGTCGGGAATTTAATATGTTGTATCCTAACGTATTGGATGTGACGTATTGATTTCTCGAGACAAAGATTTTTTTTTTAAAAAATAATAACAAAGGAAATATTTCAAGTTTAGGATTTTGAGAAATTGTGCCCTAACGTATTGGGCCGCGATTTCTTTATAAATCTTAAACAAATGAATATTCTTTTAAATTTTATTACACGAGTATTTTGGACTAATTCATTTTTGAGGAATTAGAATGTCGTGCCCTAACGCATTGGGTGTGACATTTTCTTTCTTCGAAATGATAAGAGTCTTAATAAGTAACGTTTTTTAAGTTTTTATTAAGGATCATATTTTTAAATTTTCGACATTAAAGTACTAATTAATTAACTAGGTACCAATTTTGGGCATTACGAGGGTGCTAATCCTTCCTCGTACGTAACCGACTCCTGGATCCATTTTTCTAAAACTCGTAGGCCAAAGCTATTTTTTAGGTGATCCAATCACACCTCAATAAAATATTGGTGGCGACTCCCAATTTTTGTTTTTTTAAAGTAGACAACTAATTTTTGTTTTTTTCCAAAATAAAAGTTAGTTTCGACAGCTTGGCGACTCCGCTGGGGACAAACACGAGAGTCGAGCCAAAAATTGATTAATTTCTGTCTTATGTCGAAAATTTTTTTGAGATCCTTTTGTATTCATTATTTTCTTGCTTAATTGATCTTTGCATTATACATTGCATGAGTTGAATGATTTTACCCCTCTAAGTGGGAGTGAGAAACTAGTCCTTCGTGATGTTTTCACCTCTGTGCAGGATAGTGGATCTCTTTCGGGATACATTCGTACCTATGTCTTCGTGAGATTTTCATCTCCGTGTAGCCATAGGGAAATGTATCCCCTTGAACTGAACTCGGTCTGTATGAGCCTATAATGGGTGAGGATTGAGAAATCTGCTGGTTCAGGTACCCTTACTTCAGAACCGAACCGCATATAGAAGACCTTAGGAGCTCACCCTAGGTAGAGCCACTTCAAACCCCTAGTGGTCACCCGAATAGACGTTTTATTTATTCTTGCTTGTTTTTGCTTTGTACTAACCTGTTTCTTTTTTGTTATGATTGCATTACATTTTCATCATAAAAAAGAGGTGTTGATTCACGTTCAGTTGTGAAATAGAGAGCTTGTCATAAGAAAATGAGTTTCTTGATAAAATGGAAGACAATATGGTTGTCCGAATATGGTCCAAGAAAACATGGTAAGAGAAGGATGACAGTTTAATGGAGGATTACACGACTATGGCTCCGTTGCCCAAGGATTCAAGATAACAAAGATTATTCGAGAGCCGCTAAACTTTCTTAAAGAGAAGCCAACGAGCATCACGAGGATGAGTGAGCAATGATTTACAGCCCGGATCAAGCAAAGAGGAGATGGAAGAGACGTACCTTTTGAAGAGTTCGTGAGATTTATCTTAACGCTCGAATGAAGAAAAGGATCGAATGTCTTCGCCTATGAGGGCAAGGCCATATAAATATCCATTTTATGCAAAGAGATTTATTTTCTAGAAAAGTTTTCTAAATGAAATTGAATCAAAATTGACGCCTTTTTGCATTCATTTCATGCATTGCATTTGCTTCATATATATTAAAAAAATACTAAAAAATTCTATTTAATTTAAGTCATTCCTCAGATAATCTAGAAACCAACCAACCTACCAAACACCGCTACGGTACTCGATCGAAAACTAAAGACATGGAACAAAGGCTAGAACAGTTCCAAAAGGAAATGCAAGATCAGCTTCAACAACAAATGAATGAGCAGCTTGAGAAGATTCAACAAAAAAGATGGACAAAATGATGGAATCTCAAGGGAATATGATGGTTAAGTTGACTCAGTTGCTGACTGGAGGAATTGATAAAGGAAAAAGCTCTGTGCTTAATGTTGAAGAAGGAGACAGTGAGGGACCTGTTTATCCCCTAGGCTTTACCCCTCAGCATGTTGAGGTATATCCACGCAAATCTTCTGTCACCATCAAGCCCCAGCAGTTTCAGGCCGGTGCTGTAACACCAATGAATTTTCAAGCAGGATCAGGCTCTAACCCCGGAGACAACATTGTTAATCCTGCTATCCCTAACTTCGACGAAACAGCTAAAAAAGAGAAAATGAAGGATGAATTGCCAAAACAGCTAGAAAAAAAGTACAAATGGCTGGAAGAGAAATTTAAAGCGATGGAATGTGTTGAGAGCTACTATGGGATTGATGCTAAAGAATTAAGCTTGGTTCCAGATTTAGTACTCCCTTACAAGTTCAAAGTGCCAGAGTTTGAGAAGTATAATGGAACTAGTAGTCCTGAAGCCCATATTACTACGTTTTGTAGGCGGATGACTGGGTATGTTAGTAATGACCAGTTGCTGATACATTGTTTCCAGGATAGCCTCACAGGGGCAGCGTCCAAGTAATACAGTCGACTAAGTCATGCCAAGATTAATTCATAGAAAGATTTAACATAGGCATTCATAAAGCAGTACAATCATGTAACTGACATGGTACCAGATAGAATCACTCTACAAAACATGGAAAAGAATCCCGGTGAAAGTTTTAGGCAATACGCATAGAGGTGTAGGGAGGTCGCCGTCCAAGTTCAGCCACCGCTCTTGGAAAGGGAAATGACAATGCTATTCATAAATACATTGAAAGCTTCGTTCATCACACATATGTTAGGGAGTGCCACAAAAAGATTTTCTGACATAATCATGAATGATGAAATGATTGAAAGCGCCATAAGGAGAAGAAAGATTGATGCTGGAAGGCAAGCCTCAAAAGAAAAAGAAAATGAGGTGAACAACGTGAATACATACAGCAAATCGATTGCTAATCAGTAGGGTTCATCAAGACAAGAATCATGTGTGAAGCAAGATACTGAAAAACTCCAGTTCACGCCAATTCCAATGTCGTACAAGGAGTTGTATCAAAGTTTATTCGATGCGCATGTTATTTCTCCTTTATATGTGAAGCCTCCATAGCCTCCGTATCCCAAATGGTACGACGCAAGTGCACAATGCGATTATCATGCTGGAATTACGGGACACTCAATAGAGTTTTTTTAAAAAACTCTAACGATTATCATGCGGTTTTGCCTATTGAAGATAAAATTCTTTCTAAGTTTTTGAATCCAATTCTGATTGAAAAGAAATGTTCAAAGTTGTCCATCATGGTCAAATGTGTCAAAAGCAAATGATGCAAGTTCACAAAAAAGGTCCGTCCTAAAGAATTCCTTGAGAGAGACCTGGTATTGAAGAAGATCCTTCCCATACAAAAAGAACTTCATCCCAAGCTGGGAAGGACCTTATGTGAAAGACCTTATTTGGAAAAGCGTCAATTTTGATCAAAAAGAATAACAATGACATGCATAATCCTATGATTTCAGATTCAATCAAAAATATTTCAAAATATAAAAAAAAGCAAAAAAAAAGGAAGAAAAGAAGAAAGAAAATGGAGAGCCAAGGTGAAAACCCGCAAAGGGCGCCTTGAGACCAAAGGGGATTTAAGTTGAAAACTCAAAAAGGGCGGCTCAAATATTGATCAGAATGGGGCATGAGGTGATCAGAGTAGTTCAAATTTTGATCAGATTGGGGCATATGATGATCTTGAATCAACAGGAAAGGGTAGACAACATCTTGGGACATCGACAGAGTACTGTAGATCTCCTAAACACATGTCAAACTCAGAAAGTTTGTATAGAGAAGTTCAAGCTGCGATATCTGGGGCATCCAATTTTTAAATTGAATTTGCTATTTTTGGAATACTTCATTCTTTTCCAAGATACACATTCCCAGTCAATTTCTTTGTTATCCTTATTTTTTGATAATCTATTCCTTTCGAGCTATGCTCAGAACCAATTGTATTCTCATCCATTGTTATACCCTTTTTGCAAGCATGTTGCATTGGAATAATGATTAATGGACTAATAAAACTTTCACAAGGGAAGTTTGGCATATTACTCTAGAAGTTTCTAAATAATACAGGAACCTGAAACAAGACTATTGTTTAGAACGCACCATGTTTAAATGTTGGAAATCTGAAAAGGAAGAGTCTAAATTAGGACTTTCTCTTTGGATTTTGTTGTTAAAAACATTGATTGAACAAAATGACAAAGCTAAAATAAACAAGTAAGCAATGATCACCGAACAGTAGGAAGAGGTTTTCTTGGAGAAGAAAGCCTTCATTTATGATTGAGCCTTTTGTACGATACCTTGGGAATGGTGTAAGGGACCAAAGAGATTTAGATCCTGTATCATTGAATTGTGATAAGAGAGGATCGAGAAAAAGCCATATATTCCTACCTTTGGGTTACAGTGGGAGAATGATGGTACAAATTTTGCGCCCCAATGGATTGAACTTTGAGGTTTATAGTGGGGGGCAACCTGACTAAATGTTTCTTCAAAAAAGCTAGCCAAGCAAGAAGGTGTCGTAGCACATCAGTGTTAAAGCCTTAATAAACTTCGAGCAATGACAACCTAAGTGGGATCATTCTCGGAAAAAAAATTATTAAAAAAATTATGCATTCGTGCAAACACCATTAAAAAATGTCTAGTTAGGAGCATTTGATTCATTTTATGCCATCCTAATCATTAGGCAAAATTAGGTTCATTAGACATGTCATGTTCCCCAGAGAGCAGATCAGTGAAGATAACAGATCTTGCCTTCCTACACTGACAGCAAAGCAGATTGAAGACACCAGCCTTGTCTCCCTGGGTTGTAGCGGAGCAGGTTAAAAATAGCAGATCTTGCCTTCCTGCACCGACAGCGAAGCAGATCGAAGACACCAGCCTTGCCTCCCTGGGTTGCAGCGAAGCAGGTTAAAAATAGCAGATCTTGCCTTCCTGCACGGACAGTGAAGCAGATCGAAGACACCAGTCTTGCCTCCCTGGGTTGTAGCGGAGCAGGTTAAAAATAGCAGATCTTGCCTTCTTGCACCGACAGCAAAGCAGATCGAAGACACCAACCTTGCCTCCCCGGGTTGTAGCGGAGCAGGTTAAAAATAGCAGATCTTGCCTTCCTGCACCGACAGCGAAGCAGATCGAAGACACCAGCCTTGCCTCCCTGGGTTGTAGCGGAGCAGGTTAAAAATAGTAAATCTTGCCTTCCTGCACCGACAGCGAAGCAGATCAATAACCCCAGCCCTATCTCCCTGGACAGCAGTGGAATAGGTTGAAGATTGTAAGTCCTATCTCCCTGGTTAGTAGTGGAATAGGTTGAAGATTGTGAATCCTATCTCCCTGAGCAACAGTGGAGTAGGATGAAAATAGCAGATCTTGCCTTCTTGTACTGGTAGTGAAGCAGATCGAAGACATTAGTCTTATCGCCTTGACGTTGCAATGGAAAAGATTGAAGCCACAAGGCAAATCTTATTTCCCTGGCGTTGTAGCGGAGCAGATTGAAGCTACGACGGTGAATCTTATCTCCTGAGCATTAAGGCTTGGATTATCTGAAGTGGAGCGGATTGAAGCTGTGTGCAGTGAATCCTATATCTTTGGCATTACAGTGGAGCAGATTGAAACCACGACGGTGAATCTTACTCCCCTGACGGTGTAGTGGAACAGATTGAAGCTACGACGGTGAATCTTGTTTCCCCAACATTGCAATTTAAAAGACTGAAGATGGCGAATCTTATCTCCCTGAAGTTGTAGTGGAGCAGATTAAAGCCAATAATCCTATCTCCCTGAAGTCACAGTGGAGCGGATTAAAATCACAAATCTTATCTCCTTGAAGTTGCAGTGGAGCAGACCCAAGAAAGCGAGTCTTATCTCCCTGAAGTTGCAGTGGAGCAGACTCAAGAAATCAAGTCTTATCCCTCTGAAATTGCAGTGGGGCAGACTAAATAAACAAATCCCATCTCTCTAAAGTTGTAGTAGAGTGGATTAGAATCTCTCTGAAATTACAGTAGAGCAGATCGCATCAAGTTCATCTTTAAAGTTGCAGCAGATCAAGTTGAAGCTATAAGTCTTATCTCCCTGGAGTTGCAGTGGAGCAGATTAAAGATAGCAAATTTTGAAAAACTACAACGTGCAAATCCTATCTCCCTGGCATTGCAGTGGAGTAGGTTGAAGCACCAGTTCCTATACCTCTAAAGATGCAGTAGGAAGGAATGAGGCTATTTGAAGAAGAAGAAGAAGAGTGCTAAAGTCTAGTACGACCAGCAAAATTGGTCATTTCTAAAGTCTTTGCTCCGTTCTTGTTACATGATAATGAGAAAAGAGGGGCAGCTGTAATAGACCAATTTAGCCCGGGCTCATAAAAAAATAATAAACCCAAAATAATAAAACAAAGTCCAAAATTATATCATTTGGCCCGATCGGGATGGCCCATTACTTGAAAAGGTTGAAGGTCTATCTACAAGCTTGATGCATATGGAAACATAATCTTCAATGATATGCAATCTTCGATATGATATGTAATCTTAGATATGATATGCAATCTTAGATATGATATGTAATCTTAGATATGATATGCAATCTTAGAAGATATGATTTTGTAATCTTAGAGATTTAATTTGTAGATACCTTTTAATCTTAGCCGTTGATGTAATTAATCTATACCGTTGGATTTGGGGAGGCTCAGCTATAAATAGATGTCTCTCCCTTCATTGTAAAGGGGGGAAGTGGGGAGTAATAATAATTCTTAAGAGTATTTACTCAAATTTCTCTTTCTCTTGCGTTCTTATTTTGTTGATTTGTGTATAATTTATTTATTGATTTGTATATTGTTGATTTCAAATCTCTTTTTCCCTTATTATTCATTTTCAAATTCATTATTTTCAAATTTGTTTACATTTTATTTGGCCTTATATATTTTTTATTTTATACTCTTTGTTTTAAATTCATTGGTCTTTGATTATTGATGCTATTTAATCCTCTATTTGTTATTTTAGTTTTTTTATTATTAAATTAATTATTTTAATATTATTAATACAATTATGTGCCATCATTAATCTTGTATCATTATTATTATTATTATTATTATTATTTTATATTCATGCGCATGCATCGTTTTTATGTAATATATATATTGTTTTATATATATTATACGTATGCTTATATATATTTTATACATATGTTTTTGTTTTTGTTTTTATTTTACTTCCTAACTTTTATATACATATATATACTTTTATATTTAGTATCAATTTTTTTTTTACTTTTGTATATATGTACATGTGTGTATTTATATATTTTTTGGACTAATTCATTTTTGAGGAATTAGAATGTCGTGCCCTAACGCATTGGGTGTGACATTTTCTTTCTCCGAAATGATAAGAGTCTCAATAAGTAACGTTTTTTTAAGTTTTTATTAAGGATCATATTTTTAAATTTTCGACATTAAGGTACTAATTAATTAACTAGGTACCAATTTTGGGCATTATGAGGGTGCTAATCCTTCCTCGTACGTAACTTACTCCCAGATCCATTTTTCTAAAACTCGTAGACCAAAGCTATTTTTTAGGTGATCCAATCACACCTCAATAAAAGATTGGTGGCGACTCCCAATTTTTGTTTTTTAAAGTCGACAACTAATTTTTGTTTTTTTCCAAAATAAAAGTTGGTTTCGACAATTGGTATGGCCTATCTGCGAACACCTTAACTTCGAATCGGTCTAGACTGTGAGGTCGAGAGATAAGTAGCTCTTTCCAACTCATTATTCTAGTGGAAGATCAGAAGATCCTACAAGGGTATCGACTAGTTGATTGAACAAGAAGCCCAAAGAGACAATTGATTATGATTAGTGAAGCGAGCTAATCACCCATGCTTAGATTTGATAAATTCTACTATTTGATTTCCTGCTATTTATTTATTTATGTTCTTTTATTATTATAAAAAAATCCCAAAAACCTTTCTTTATATTTTGATGTAATATAATCTATCTAAAGTATTAATTAGACATATTTGTGCTTAGGTTAGAGTTAACTTGCCTCCCTTGGGTATGATCCTCAGAGTACTTACCTACTCCGTTGTAACTATATTACAACCTGACCCGTATACTTGCGGTTACATCCTTTTTAAAATATTTTGTGCAGAATTTTTACTCTGGACGTTGGTACGTCTGGAGGCGGTCAATATCTTCTTCATTCGACAAAAATAAGGAACATAAAAGAAATAAGCTTGTATGTTACTCAACACCATTTTCGTGAGATAATCCAAAGGTTAATGAGCTTCTTCATTGAAATTTTTATTAGATTTCTACCCTATTATGATAGATGAAAATGACCCACTTGATAAATTAGAAATTGTCAAATTTTAGCTTAGTAACCATTAATGAAAGTTTGAATGCTAGTGACATAATGGTTGAACTTTGAGTAGTATTATGTTTATTGTTAATTAGATGTTCCTCAATTATAGTTTCAAAGTTGTATTTAGATTCGATAGGGTAAAATATAAAATATGAGGATTTCAAATATTAGAGCTATAAGGGACCTAATTAAAAAGAATGCATAAAAAGTTTAATTTAAATTTTTATAAGTAGGAGAATTTAATAATGTCTTTATACTTGAAATATTGAAAGATGCTAAAAACGAGGTTGGAACATTGAGGGACAATGAACAAGTAAGATCAGATAACAAGCAATGATGTCAATTTGTGCTACTATAATTAGATTTCAGTAATTTATTTTATTGAATAGCTAGTCGATATAATCTAGTACGAAATAAATGTCAAGGTAACTACATCTCTACTTAAAAGCTTTGAAATGATGAATTAGATGTGTTTGTGTAAATCATGTTATAAATGATTGATTTTAGGATATGATTCTATATACTCAATTTATAAGCATTGCTATATTGATATTTGACTATGATGATATATGTTATGATAATAATTATAATAATACTTCCCCATTAAACAATGTTAGATGTAGTTTGAGTGTAGTTGGCATGCCATAGGATTATTATCAGTGATTTTATTTAGCCCCAATTCCCAGAAGATCATGAGAAGTCCCAATTCCAAAGGGTCATGCACATATATTGATATACAAATTAGTAGCTTTAATTCCTAAAGAGTCGTGAGCAGTCCCAATTCCCTGAGGGTTGTGGGCAATTCCAATTTCTAGAAGGTCATGGACTTACTTTGACATGCATATTTGAGTATTCATTCTAGTGTCTACATTCAGTTAATAGGGGCTACACTGAATAAGAAATGAAAAGTGATATTTATTGAAATGTTATATGTTTGAATAGGCATTAATGCTTAATAATGAACTATGAAATGAAATAACCTAATATTGGGAAATGAGACAGTAACTATCTTGACTTATATGTAAACATGTTCTATGTTTGATTCATTTATATATAATTGTATTAATTTCAAATTATTGGCACAACTGAATATTCAATATGTAGCGTATAGATTTGTTTGTTTTCATGCGTAGGTACAAATTAGACTTGTTGGTAGACCGTAGGACCATCAAGCGTCCAACTTTTGACAACTCAGCTCAACTTGGTTAAATCTTGTGTTAGTTTTCTATAAAGTTAGTTAATGGCATCTATTTAACAACTCAATTTTTAGTGGTACTGGAAAAGGCAATTTCGGAACCCCACTTTTATAAAACGAGTCTCTAAATATTAAATATTTATATTTATGAGGTAAACATAGAAATATATCAAAGATTGGTCAATTTATTGAATTGATAGTTAATTAAGGTACAAGGACTAAACTGTAAAAGTTTATCTCTATAGGTTTTTAATTGGCCAAAGACTTAGGGAATTAGTTTGAAATTAACCAAAGGTATCAAATGAGAATTAAACCATTTTAATTTATATGTTAGTGGAGTATGATGAGAGAATCCACTTATATAAGTTAATGGTGGATTAAGTTAATAAAATGTAATTAAACTAATTAATTAAAGTGTAATTAAACTAATTAAACATCCTAAAAGTGTAAGGAGAAACCATGTTTTAGCTTAAACAATTCTGTCCCTAATTGGTAAGCTTTTCTAAGTCCTTTTTTCTTGTAATTTTTATGTTTTTAAGGTCATGAGAGCTTGATTTAGCTAGCCCATGTACCAATTCGTAAAAATGTCAAAGTTTTTAAAAGTTTCCATTGTTTATTTCTTGAAAAAATTGGTGCCAAATTGATAGATTTTAAGCTTAGATGTGAAAAAGGACTAGAATGTAAAGTTTAATTGACAGTTTTGTACATAAGGACTAAAGTGTATAAATTGTATAATTGATATGAAATTTTTGTTATAATAGATAGTATAGGGGTCCTAAAAGGGTGTGATTGAGATTGATTTTGAAACTGATGCTCAAAATCGAAAGTTATTGTTATTTCAATTTTAGGGGCGAAATTGAATAAGATGTAAAAATTTAGGGGTTCAAAAAATTGAAATTTTATAGGTTCATGCATATCACGGAATGATATAAAATATTTTATATTGATGAATTGTCTAAAATAATTGTTTAGATCAAGAATTGAATCAAATTAGGGATAATCGAGGAAAAGCCACAATTATTGAATAGCCCCTGAAGATTCAACTTATTTGTTATTTTTTTCCCGGTAAGTTCATATGGTATAAATGTTTTTAAGTTGTGGTTTATTTTATTTGTGATTATATGTGTTTGGTTGCGAATTGGTATTAAGGTGAGATTTGGACTAAATTGTAAAGAAATGTATATATGTGTTAAAAATGCTCAGGTGAATGATCTATCTTAATTTGATATGTCAAAGTAGTCTTCCCAGTTATAATTAAGGAGCTTGTTTTCAAGCAAATTAGTTTTGCGTAGTTTTCAGATTTTTTTTTTATTCAATAAGTGTTTAATGTGTTTTTGTGCTCATTTTGAGACCCAAATTGGACAAATGCGCCATTTGGACCCTAATGATCGATTAAGTGTTGTAAGAACTCAATGATGGCTCATTTTTTAGCGAAAACATCACCAAGGAGGGGTTATTACGATATCAAAGCATGAAAATCATGATACCCTTAACATTCCTAAAATGAAAAGAAAAATGAAGACCACCTACAGTGGTGTTGCGATACCTAATACCCAGCCTTCAAAGGGAACTCCTCATTTAGAAATTGCCAACGATATCATGATATCTAGACCATGGGTATTGCGATATCATTGTCATGAGGGGAAAAAAGTTAACATCAGAGGTAGTCTTTGTCCAACCGAAGCACCAATCAAAAAGACATGTTGAAGGGCATTTTGGTAAAAAAAGGGTCAAAATAGTTGCTAAAAAGAACCAAAAATTGGCTAAAGAGAGTGAGAGGAGGCATTAGGCATAATTTTTAGTCATCTTCTTAGTTGCTCTCCTTTATAGTTGTAGATATAATTTTCTACTAGTTTCCTCGTGTTTCTTTGCATTCTTAACTGTAGCTTAGGTTTATTTACACGTTTAGGACCTTTAACTTTCTTGTACTGACATTTTCATCTCTAGTTTAATGTTCTTTCAATATGTTTTCTTTTTCTTTATTAAAAATCTAATATTTATTATTCTTGTTCATTTATCTTGTTCTTAGTTTCTTTTCCTTTAATTCTTTCAAATTAAAAACCCAAGCTTTCATCTTTTTATTGAGTTTTATGTTCATGCCTTTCATGGTAGCTTCTTTGATGTTAGCTTAGAAAAGATAATGGTTAACTAAACCCTATGGGGGTTGGTTAATGGAGATGTAGGTAACTTATTTTTGGGTCGAGGAATAAATTGCAATAAATTGGACTAAATTGAATGAACTTAAAAACTTAGGATTGATGCCCCTAAGGGAAAATCAAGATAAGTGAGACTGAGAGGTAACCTTATTGGGAACCGATTCATTAATTCTTGGTTAATCAGGTGAGATTGAGAGGTAAACCGAACTAATTTATCTAACTTGGTAAAATTGAGACTGAGAGGTAAAATAGATCCATTTTAGGAGTTTAAGCAATTTAGATCCCTAATTCAATGATTAATAAACCGCATTGAAGTTAACCAACCACCGCTCATTATTGATTGGATAGTTTTATCACCTTGCATGCTTTACAATTTGGTCATTTTGTTAATTATTTAGCTAATTGGTTTAATAAAACTCAAATTCATGGTCTGTCGTACTATGTTATCTAGCGAATAGTTGTTTAAACTCTTTATTTGCATGTTTGTAGCTAGAATTCACTTAATCGTCGAGTTCTGTGGGTTCAATTCTTAGAACACTCATGTACCCCGTTGTACAAATTATATTACAACTGACCTGTCACACTTCTAGACACCACATGTACTTATTCTTGTAATGGCCCAAATTTGCCCAGCCCAAATCAGAAGTAAATAAATAATAAATATAAAACCAAAATTAAAAGTCCAAAATAGTCCCTTTACACCAGGCTCAATGTGGCCCAAACCAAACAGACCCTAAATCCCCAATCCAAGTTACAGAAACCCAACTAGCCTAACCCCAAAACCAAGCCCAAATACCCGCAGCCCAAAATAGAGAAAATCAGCAGCAAACCCTAGAGACCAAAACCCTAAACTAAGACGCCACAGCAGCCTCGCAACGCGCTGCCTTCGGCTTTCCTCTCTACGCGCGCCACGCCACCACCTCCGTACCCCCGTACCTTCAAACAAACAAACAAAAACAGCACAACAAAAAGAAAAAGAACGATTGTATTTTATTTTCGTTTTCGGCTATAAAAGAGCCAACAAAATCTGTAAAAGGTTCCCTTTTTTTACGATCAACAGACAGAGAGAATACGCAGAGATTGTATCAAAAAAAACAAAAATAAATACAAAGGAAAAGGTTTTTTTTCATTCTCTTTTTCGATTGCTTTTCTTTTTGGCTGGTTCGTTATTAATCGCATATAAGCATATATAAGGAAAATAAGAAAGAGAAACTTACCTGGTTGGTGTCGTTAACCCCCCGTTTTGCTCTGTTGAAATCGGAGTTAGAAAAGGTGGTCGTCTCTTGGCTGCAAACGGCGGAGCGGCGCAACATTTGGGGGCTGATGTTTAGTTTTTTTTTTTAAGTTTGTTTAAGGCTAATAGTTATTGATTTAGGGTTTATTTAGTTTTGTTTTATAACCAAAGAAACGACACCATTTTAAGACTGCTTAAGTGGCTTCAAAACGACGCCGTTTAGAGGCTTGCGACCCCGCGGTGACCCGACCCGGGGAAGGATCCGCGCGTTTTGGCCTCTGTTGGGAAATTTGCGCAGATAGTCCTCCACTTTTATAGAGCTTTCAAATTGATCCTTTTATTTCTTTTAAATTTGATCGCTCATTCTGTACTACATTTCAATTAGGTGTGTGCAAGGATACTGTGTATTGAGGGAAGGGATATTTACCCTTTTAGTCCCCAAGTTGTTCGCGCGTTCCTTTGTGGTCCTTAATGTTATTTTATTTTTATTTTCTCTTTTAATTTTGGAATTAAACGCAAGTTAGCCTGTTTTTGCTTAATTTAAATGTATTCAAAATTTTATTTTATTTTAATATTCATCATTTTTAAAATATATTTAACTTTACATCTAGCATTATTTTATGTTTAAATTTAGTATATTTTAAATTTATTACAATATTATTTTAATATTATAACATATTATTGTTCTAAACATATCATTAACATTATTTTAAATTTATCATGTACAATCTTATGCATTCTTGTTGCAAATTCAATATAATTTATACATATTTTACATCTTTATTTTATAATACATTTTTAACTACACTTATATAGTTCTTTGCTTTAAGATTTATACAATAATATTCTTACTTAATATTTTTCTATACATGTATATATAATTTGTGTTAAATTATTTTTATATATATACATAATATATTATCGATTTCATATTATTACATATCCTTTCATATATTTTTATGTATAAATAACTTATTTATTTCAAACCCTATTTTATTATATGTTTTACTTATTTCAACTCTTTTATCTATTATTATGTGTAATTTATTTATATTAAGTTTTCCACTCCATCTATTACTTATTTTAAAGTGTATATCATTCTTTTCTATTTTTGAATGTTTCAAGTTTGCAAATGTATTATTCATTTTAATTCTTTATTCATATACGTATAACCTATTATTGACGATTTCAAATATTTTATTTTTTCTCATCATTTTTGTTTTTGTTAGATGATTCCCTAATTACCTTTTAATTCATTTACCTTTCTAACATAATATTAATATTGGTTTAATGTGCGGTATGATTGCTTTTATGCTTATTGTATAACTTATTCGCATGAATTGATTCTTTGTAACTCGTTAGTATTGATTTTAGTTTGTAAATTAGCTTTTCCCGATGTACAATGTTATTTCGTTATTCATTCAAAAGATTACAAGTGTCAAAGTTATTTCATTCAAAAACTTTCAAAAATACTCGAAGTTTGGAATCCTCGAGAGAATTGAGCCCTAACGTATTGGGTTTCAATTTTCCTCGTCAAATCTAAATAATCGAAATTTTTTCAAACATACAAATTTCAAATAAAAACCCATTTTCGGGAATTCGACATGTTGTGTCCTAACGCATTGGATATGACGTGTTATTTCCTCGAGATGAGAATTTTTAAAATAATAATAAAGGTAATATTCAATATTTAGGAATTTAGTGAAATCGAGCCCTAACTTACTGGGTTTCAATTTTCTCATTTGACCTAAATGATCAAATATCCTTCTCAAAAATGCATAGGTTTTAAAAGTTAAAAGATAAACTTAATTTTGAAGATTAAAAATGTTGCACCCTAACTCACTGGGTGTGACATTTTATTTCTTTGAAATAAGAGTGTTTTATCATTCAATTTATTCAGGTTAAAAGAATCGTACTTTAAAATCTTTTCAAAATTTCGACACTAAGACATAAAATGATCAATTCGGTACCAATTTTGGGCGTTACGAGGGTACTAACCCTTCCTCGTGCGTAACCGACTCCTGAACCTATTTTCTCAAATCTCGCAGACCTAAAATTTATTTTAATGGTGAACCGGTCACACCTTAATAAAAGATCGGTGGCGACTCTCATTTTCATTTTTAACTCGATAACTAAAATATTTTGTTTTTCAAAAATGGTTTCGACAATTCTGATTTGATTGTTGTATTAGTTGTTAGCACCGTTGTCGGGGAGCTAGTGCTAGATTGAGTGACTATAGCTTTATTGCAAGATTTATAGGGAGATAGTTGACTAAAGCTTTATTTATAGATATGAATTTTTATTTTGTTTCTTTGCTTGTTATTTTGTTCAAAAAATTTATTGATTGTGTGAATCTCTTTTGCTTGTAGGAGGTAGTTTATGACTCAGACTAGTAATAAGATTGTACTATTTGAACCGAAATTGAAAAGAATCTTGACACATAGTCAACAAGAACAACTTTTGAGAAGAGCCCAACCTCCACCATTTGACAACCCAAGAGTTGAGGAACATCCACCACCAATTCATCAAAGACCGATGGCGGAAAGGACAATGAGAGACTACACCATGCGTAATCTTTACGCTGTGGAAGGAAGCATTAACCGCCAAGCGATTAATTGGGGAGGTCACAATGAACACAATCAATGTGAAGTTCAACTACTTATGAAATAAGGGGTACCTACAATCAATGGGGTCCTTACAATCAAGAAGTACCCAACTTCAACCCACCTAGGCCTAATGCACCATAACAAGCTCCGTAGCCATTTAGGGTAGCCCAAGAAACTATGAGAAAATTCGCCTAGAATAGCAACCCTCTAATACCCATTCATGTGAGTAAACTAGAGGAAGGCTTGCATTCGATGCAAGCAGAAGTGTGCCTAATGCAAGGTCAATTGCGCCAAATTTTTCATATGCTACAAAGTAGTGCTTCCTTTAGCATATCAAGAAATATTGAACCAAACCCGAAGAGGGAAGGGAAAGAACATGCTACGACCATTACCCTTAGATTTTGAGTGGTGGTTAAAACCCTATTAGACTGGTGAATGGAGAAGAGGTAGTAGAGAAGGAAGAGAACACCTACACTCCTAGTGGTGGACATAGGGTAGGAGAGAGAGTAGAAGCAGAAGTTGATCCCAAACAACCCAAACCTCAGGATAGGCCCATTGCACCCTCAAGTCAAGTACCCGTACCTTTTTTGACCCGTCTTGAGGAAAAAAAAAGAAAAAGAAGAGTAAGGAATTTCCAATTTTCATTTACATGTTTAAGGCGTTGAGTGTTAATCTCCTGTTATTAAAGCTCTTAGAAAAATTTTGAAATATGTTAAGTTTCTAAGGGAAGTTATGTTCCAGAGGAAGAAGATTGGGAGAGGAAAACATATTGCTCTTAACGCTAAGTGTTGTGTGATTGTGCCCATAAAATTTCCCCTAAAACTCAATGACCCGGGCAGCTTCAGAATCCCTATAGAAATAGGAGTGAATTACGAGAAAGCCCTTTGTGATTTAGGGGCTAGTATCAACCTCGTGTCATTATCAATTTATTAGAGGTTAGTATTAGGGAACTTTAGGGAGACCTCAATGACTTTGCAACTTTTCAATTGCCCTTTTTTTCCTTCCTAAGGGAGTCTTTGAGGACGTATTAGTTAGATTTAGGCAATTCATCCCATCAGTGGACTTTATTGTGTTAGACTTTGAGGAAGACCTAAAAATCCCTATCCTACTAGGAATGCCATCTTTGGTAGCCTCTATGGCAACTATAGATGTCAAAAAAGGGGAGTTGACGATAGACAGAGATGGGGAGGTCAAAATCTTTAAGTGTGTTGACCCCAACCTTAGTTCTAATGAGTCATCACTCTCTCAAGGGTATGAGTGTTAAGCAGTTGAGATAATATCCTATCATGCCACTGATCTTGCAACTATTATGAAATGATGTGAACTTAAAGTTTTTAGCTCAATGTGAAAAAAAAAGATCCAAAAACGAAAGAAATTTAGTAAGCCATGGCGATCCTAAAGTAGCCTCAGTCAGGTGATGAACAAGATGTGAATTAAAGTATCGAGCACACCACATTAGTACCACTTCGGGGGCATAACTGATCACCTTGAAGCTAATTTGTAATTTTTCTAGAAGGTAATTCAAATTAAGTTTGTAAATATTTGAATGATCCGAGCACGGAGTCCGTTTGTTTTCCTTGTTTAGTTTAGGTTTAAATTTGAGCATGTTTAATTTTTGCACTTGGTAGGGTAGATTTTGGATAATTGGGAGATTAGATGATAATTTTGTATGTTTTTTGGGCACCCTTCTAGTCGTATTGCGATATCCAAGAGGGAATATCACGATAACCTTAACAGTCTAGGGGGATGCTCAAAATTTTCTAGATATTGCAATACTGGTCCCTTGGTATCGCAATATCCCTAGCTATTTCAAAAATAAAAAAATTGTCAAAGTTATAATGGTATTGTGATACCAGTATCTCGGTATCTCGGTATCGTAGTAGTTTCAAAATAAAGGGTACAAAGTGAAAGGGGTATCACGATACCCACCTTCAGTATCGCAATATCTATGTTAGGTCGTGATCCCCAAGGTTTGGAGGCTTTTTAAGCCTCCAAACACCCTAACACCCAGATCTCTTTCATTCTTATGCCCTATTCGTTTTCAAAACACTCCCATCTTCATCTTCTCCTCTATTTTCCTTTTTAACCTTCATTTACTTTTCTCACAAATTTGCCTATTTAGTATTATTTCTTCTTCTTTTCATTCTTATTTGTAGGTTTTCCTTCTCCTTGCCTTGGAACAATAGTACTACATCCCCTCCAACCGCTTTGCCATTGCCATCAATACATTTTTATCGTGTCAAATTCCTTTTCCCTTTGTTTTCTTTGAAATTTTTATTTTTTTAGTGTTGCACTATTGATTTGTCTATTGGTTAGTTTATTATTTGTTAAAAAGCTTGATTAAATTGTGAGGTTAGTAAAATGTCGCCTAGACAAACTAAACGAACTAGGTCTCAATCGAACCCTCTTCTACCATCGGCGGTGGTTCTAGAGTGATTTACAAATAAAGAGGTTGAAAATTATTTTATGTCAATCCAAGGCGAAACATTTATTCTTGAGCATGGTTCCGACCCAATTGCTTCTCTTTGTAATGAGATTTGGGACTTTGTCTATTACCATGGATGGTTCAATATTTTTCTAGTCCCAAAATCGACTGTGGTTATCCCCACTGTTCTTGAGTTTTATGAAAATTTAAAAGTTTATGTTGAAGCTGCGTACTGGTTCAGGGAATAGAGATTGACATTTCCCTAAGTGCTATTAGCGAGCACTATGGTGTTCCATGGTATCAACAAGATGACATTGAACAAATGGATTTAAAATTTTATAAAATGTCGACATAGACCTCATTCTCGCCTACCTAATGTAAGGTCAAAGGGAATAGAAATGGGAATAGTACAAAAACCTTCCTCTATCTTTTAATCAAGTAATAATATTTTCCTTAGGAAAAATATAGATTCAATTTATCTCGACCCGTGTTAGTCTCATGCTCAACACTAACACAGTTAACAATTTTGTAGCAGTTTTTTTTTCAATTTTGTAATGGAAGCGAGTTTGTCTTGGGATGTGGATAAATCATTAGATGAAGAAGTGTCTTAGGGAGCAAAGTTGGCATGTACTTCCCTCATCTGATTATGGACTTATGTCATAAGAAGAGGGTAAAAATGAACCTGACTGAGTAGTTTCACCGCCCCACTTAGGGTATTATAGGCAATACCATGATACTTTAGCTTCACAAGTTGGAGTGGTAGAAAATTTAGGAGTGGAATCAAAGGCGCAAGCACAAGATGGAAATGCCTACGACCCTAAAGAAGAAAACCACAACAAAGAAGGTGTACGAAGGTACATAGTGGCAACGTAAGTTGTTTGATAAGGTTCGCTACAACACTCGACTACTCGAGGCGATAAAACCATTTATAAAAATATTTTTGATGAGCCAAGGGATAGAGGGCCCACAGTGGCCCGAACGATTGACCAACGCATCCTTTAGTGGCGAGGAGGAACAAGAAGAAAGAGAGAAATTGGAAGAGGAAGCAGATGAGGATGATAAAGAGATAGAAGATGATGACCCCGCACTGTATATTGATGATTTTGACGCGATTTTCGCTCCCGAGTGACCTACCACGACCAAGTTAATCTTCAAAGGCCTGAGACCACCGAGGCATCAGGGCTACTAAAGGTTGGCCAACAAGGGAAAATGGAAGGAGATAGTTAGACCGGAGTCGGGCTCTCATGATGATTAGTTACATGTTTTCACATTCTTTTCTTTT
>URS0000BE9894 tRNA from 1 species 
GGCTCCATAGTATAGTGGTAGCACATCTGCTTTACATGCAGAAGGTCCTGGATTCGTGCCCCAGATGAAGCCA
>URS0000C75118 pre_miRNA from 1 species 
GAGATACTCCCTCCGTCCCAAAATTCTTGTCTTAGATTTGTCTAAATACGGATGTATCTAACGTAACTAGATACATCCATATCTAGACAAATCTAAGACAAGAATTTTGGGACGGAGGGAGTATATG
>URS000029BCEB rRNA from 1 species 
GACGAACGCTGGCGGCGCGCCTAACACATGCAAGTCGAACGGGGAAGTTAGCAATAACTTCTTAGTGGCGAACGGGTGAGTAACGCGTGGACAACCAACCTTCTGGTGGGGGACAACACTTCGAAAGGAGTGCTAATACCGCATGAGCTCTATAGGCCGCATGGTCTGCAGAGGAAAGGAGCTTCGGCTCCGCGAGAAGACGGGTCCGCGTCTGATTAGCTAGTTGGAGGGGTAACGGCCCACCAAGGCAACGATCAGTAGCCGGTCTGAGAGGATGAACGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTCGAGAATAGTCTACAATGGCCGGAAGGCTGATAGTGCGACGCCGCGTGTGGGAAGAAGGCCTTCGGGTCGTAAACCTCTGTCATGGGGGACGAAGGAAGTGACGGTACCCCAAGAGGAAGCCCCTGCTAACTACGTG
>URS0000023D8D tRNA from 1 species 
ACATTTTTAGTATAATAGTACATTTGACTTCCAATCAAAAGGTCCTTTCCAAGGAAAATGTA
>URS00018C1C85 rRNA from 1 species 
TACGTGAGGGTGCGAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTCTGTCGCGTCGGGAGTGAAAACTCAGGGCTTAACCCTGAGCTGCTTCCGATACGGGCAGACTAGAGGTATGCAGGGGAGAACGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGTTCTCTGGGCATTACCTGACGCTGAGGAGCGAAAGTGTGGGGAGCGAACAGG
>URS00017FF56C rRNA from 1 species 
TGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGAGGAGGAAGGTGGTGAACTTAATACGTTCATCAATTGACGTTACTCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTTGAAACTGGCAAGCTAGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACCGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAAACGATGTCGATTTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAATCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGTC
>URS0000142B05 siRNA from 1 species 
GTCAAATAACCTATCGAAAGTGT
>URS0001228231 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCGTGTAGGCGGCCAGGTAGGTCTGCTGTGAAAACTCGAGGCTTAACCTCGAGATGTCGGCGGAAACCATCTGGCTAGAGTCCGGAAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGACGATACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS0002355A6F lncRNA from 1 species 
AAGAACTGTACGCCACTCAACTCTCACAGCTACAAGAAATGGGTTTCTTTGATACCCGAGAGAATATACAGGCGCTGATAGCCACTGCAGGGAATGTTCATGCTGCGGTGGAGCGGCTATTGGGGAACCTTGGTCAGTAGATAATAATCATTTGTTATTGTCCTATTCGTCGCAACATTTATTGTCAGTCGGGCCCGATGAAATTGGTTTGGACCGGACTAAAGAGGATTTTTCAAAACCTATCTTGGCTATGAATTAAAAATACAGATTCGATGTTTTGAAGTTCTTGGCATAAGGTATGATCATGGGAATACCCTCTTCTATTCCCCACCCCAATAGTAAAGCGAGTGATATGTACATACACTATTATGATTGTCTCTCGTAATTTTTTTTATTTGTAATACAAATTTTTCTATTTTTTTTTGGGTGGGTGGGTAATTTACTTTTTCTTTACCCTACGCTGGGTGGGTGAATTCTTATAATTATACTTGATCTGATGTACTGTTTCGTTTTTCTGCACTTTGTTATCTAGATGCAAGTTTCCGATTGCGGAAATGGAGGTGGAATAACTGGGGATCGATATAGTTTTTCTGCCGAATGCGATGTGGTTATTTTCATAGGCAATTGTTATATTATGATGTGTTTTAAAATTAGTGATTATGGTTGGTTGGTTTTTTATTTCTCCTTTTGAATCCCATGGCAACCAGATGGCATTGGAACCCGAAGGGTAGATTAAAATCCATTTTCATAGATAACCAAGCAAATAATAATAAAAAGGGAGCTGCTAATGCCTCGTTGAGAAGTTATGGAGCCATGCACAAGTAGTCAATTTGACATATTTACCCTCGAATCATTTTCAGTCAACTCTCTCTGCAAATTACGTTCCTTTATCCTCCATCAGTTTCCTCTCTCTCCCCAAAACCAGATCACTCTTCCTCAGTTGTTATAAAATTCTCCTTTAAAATATTGTAAACTCGCTAAAGAAATTGAACAATCTTACAAATATCATTTACACTAGGCAAGGCAAATGAGAATCTGACTTTTGACACCCTCCCTGTGATGATGGAATCAACCAGATCCAACACCACCCATCAAAAACCTAACATGATCCCGTCCACAGAGTTAAATTACGCTGCGGATTGTACATCTTTATAGACTTGATGATCATCGGCCTTCACCTGATCAGCCCTTGGTTTCCGGGCTGCCTCTTAGGGTAAGCCAACGGTTTCTTTCATGGTTTTCTAATCCAACCAACAAGATGAAGAGAGTCGCTCCATTTAGAACCATCCTCCATTTCAGAGGATTGAATTTTCATCCTACAGACGTGACGGATGAAAGAAAAAAATAGAAAATCCTTCATTTCACGATTCACTTTTTTAAATTTTCTAAATTGCTCTCTTCAACTCTTTGATTTTAAATTTGAACACCAATTTTATTCTTCTTATTTTTTATTGCTTTCTGATAAACTACATATAACTTTTAACATAGACATTTAAGTTTTATAAAATTAACATGGTTGAATATACATGGACTATACCTTTAAAATGATACCCATATTCAATATATTCTCTAACAATTTGAAAATTGGTTGGACATATAAAATTTCTTAGAAAAACAATGGAGGAAAATTTTTAGAAATGGAAGTAGAGATTTGTGGTTGGAGTTGAATAAAAAAGAATATTTTGATCTTCTAAATTGGGTTGGAGATGCTCTTAGATGGTGTTTGGTGATGCTTATTAGCAATAACTTATTCTTTTTTCTGTTTTAAAAGTTGTATCAGAGTACTTATCACAATTTTTATTTATATTTACGAGCTAAAAATAACTTAAAAATTGATTTTTGCAAAGCTACATTATTATTGTGATACTTTTTTACTTCTATTTTTGAATAATTACTTTTAATATAATTTCAGGTACAACAAACACTCTTAATTTAAATTAGACCAATAAGCCCCATCTAATGAGAAGAAAAAAATTAAAGTACAAAGAATAATGCGCATGATAATAAAAACTTGCAGGAAATAACTTGTTATTATAGAGGACTCATTTGTCTTTTTACATATCGTCACAATATTTTACAAAAAGGCGCTTGAGTATAGCCGTTAGTTCTCGCCTCCACCATCCGGTCCCAGTTGCGATTCCCTACCCACTCACCACCCAAAACTCGATGCACCGGATCACCAACAGCCTCAATCATCACGAACCGTACATTTTCATTATAAAAACAAAAAAACGGACGATCCAAAATCAAGGGACGCAACCTTTTGAAATGAGTTAGATACATTGGGAGTAGGTGAATATAACGGCCAATTCAAAAGTTTCCCACCAAAACTATATATATAACCACCTTCCTATTCCTTCCGCATCCAAATCTCTCTCTCCACAATGACTAACCCCAATGATTCCCCAAACCAATCCCCCACCAACAAAGCCCCGAAGCCTCTCTTCGCCTGATAGGGACCCTTTGGCAACACTCCTCCTCCCCTGAGTCCTATCGAAGTCAGTCTCTCCCGGTAACCTCTTCAAGGCTTCAAAACTCATACTACCACCGTGATTGGCGGCGGAGGCGGTAGGGGCGGAACCAAAATTTATGTTCAGTGGGGTCAAAAGAGTCAGAATTTATATTAGTGGTGTCAAAATTATAAAATTTATAAAATTTAGGACAAATTACTAATTTTTATGAAATCAATATGTATTTATGATAAATTATATTATAAAAAATAGCGTGCTTTTTTTCTGACCTCAATGCCCCTATGTAGCTCCGCCACTAGGGGAGGTGATGCCACCATTGGAGAGTCTTCTTCTGGTGGTGGCGGCGGTGGTGAGACTATACTGGTGTTTGCAAGTTTAGCCCTACTAGCAATTGGTGGTAGTGGGGATAGTGTGGCGGCCGCTGCTGGTGGAGGCAGCAGCATTGTTCGTAGGAAGAGACCCCAAGACTGAGTGCTGCCGCTGGAAGGCCAGCCATTGCAATGCCCAGTGTGCGGAAGGTGTTTTCCTTCTAATCGTAGCTTAAGTGGGCATATGAAGATACACCCCGACCGTGGCTGGCGGGGGATCCATCCACATCCAGTTTTTAGCCGCAACGAGTTTGGTGACATTCTCGGACAGGCGGAGGAGGAAATGGCGGCAGCGATGGTTGTGAATGAGGCCGAGACTGGTGGTGACAAGGAGGAAGAGGAGGTGGTGGTTGCAGCGGTGGCGGAGGGGAGAGAGGAAGTAGCGGCGGAGAAGGGCAGGGATGGAGTTGATCTGAAGGAAGAGCCACCGCGAAAACTGCTGGACTTGAACAGGCCTCCTTCACCGGATGAGTAATATTGGTTTTCTTAATTATTATTGGGTTGTTTCTCTATTTATTAATTACAAAGTTTTTCTTGTTTTTGAATGATGGTTTGGTGAATGGATGTTGTTATGAGGTTGTTTTTTCTAAGTATTAATTACACAGAGTTTATGTCTGTTAAACATGGATTATTCTATGGAGGATTTTAAATTTGGGAGATTAATATTGAGTTCTCTGTATTTTTTGATGAATAATTACATTATTCAATTCTATTTAAGTCCCATGCTTAATTGAACACAGGGAGAGAGAGAGAGAGAGTCTGATTATTAATGATCAACTGTTATGATTATTAATAATTACACTTTCCTCTTTTTATTTGTATTTATCATGATGAATTTACTCAAAATATTACTATTTAAATAAAAGTAAATATTTTAATAAAATTATTCTACTAAAACAAAAAAAATGGGTGCAATTACAGAAAAAGTGAGTGTAAAAATAGCATTTTTAAAAATAACTTAACCGAGTGATTTTCAAACTTTTTTTCAACACTCGTAAGTTTTCTAATTAAAAATAATAAAAAAAGTTATAAGGGAGATAAACGATCCAATCTTTTAACAAACTAAACTTTAATATTTTTTTAAAGTTTGTTAATATTTCAAACAAGCTTGAATACTCTACCATTCATTTCCATAAGTTGTTTAAAAAATTTAAATTACTAAAGGTCAGCAGCACGCTTGAGACCAATATAAGCTCGATTATAATTTTAAAACCTCGTTAATATTTTAAACCAAAATTAAACATTTCGTTAATCAATTCTACTGATTTCCCATGCTTGTTTACTGTGCAAACAAATCCTTAGGTCATGAATCATTGTTTAAATTACAATGAGAATCCTTGTTTCAAAAATCAGGGCGAGCAGTTGCTTTAGTCGGCTATCAACCGTTAGATCCTCAAATGAAAACCCTAGATTTTTGTTGCCTATATAATCACTTCGGGAGAGAAGAAAAAAAGAAAATAGGGTTTTTGTTGTAGAGAGATAAAGAAAGAGAGCGAGCGATAGAGAGCGTCCCGAGACAGAGTTTGTGTGCTACAAAGAGAGTTGCGGTTGAGAGAATTGATTTGATCACTGATTCCGTTAATGCAGTGAGTATTGAGTAATTGCTTCTTGTTTTGAATTTAGATCATCAGGTTTGTTGTTTGATTCTTGTGGTTTTACTTTTTTTTTCTTATTTCATATCATCATCTGTTCTTGGATCTTCGATTCTGTCTTCGTAATTAGGTATTTTGAGACTGATATAGATTTTTATTGCAGTTTTAGTGAAGATATTTGCGTTTGTGTAAGTTCTCCTTGTTTTGATTTCAATTATCAGGTTTGTCTGTCGATTGATTCTTGTGGTTTAGCGTTTTTTTCCTTTTAATATGATCTCCAATTATTTCATATCATCATCTGTTATTGGATCTTTGATTCTGTTTTAATAATTAGATGTTTTGTCTTTTTTTTTTGAGACTGATTTAGATTTCTATTGCATTTGCAGTGAAGATTTTTTTGCGTTTGTGTAAGTTCTCCTTCTTTCATACTTCGATCATCAGTTTGTCCATTTGTCCTTAGATTCTTGGGGTTTTACTTTTTTTTTCTTTGAATTTGATCTCCAATTATTTCATATCATCATCTGTAGATGGTTGTTACCTATAAATAATGCGATTAATTCCTCCATATCACGTCTAGTAGCGATTTGTCTCCCTTCTCTCTCCTTCTCTCTTTGTGTTCTGCGATTATCAATCCAAAACCCTCGCAAGCAATGCAATTCGTGGAATCATTCAATCTACGAGGAGAGACACACGTGAGGGATTGTTAATCTTCTCGATCTTTCTCTGATCTGCTAGCGATTGCCTAATTTGTTATGTAATTTATTTAATTTTTTATGTACATCCATTTATGTAATTGCTTCAAGGATCTTCCTTCTTGTATCAGTACATGCCGATTTGATTCTTCCTGTTCTAATGAATTTCTATGAAGATGTTGTTTTCACTTGCATCAATTAAACTCCAAATATTGCAGGCGTTGAAAAATATCAAAGTGGCTGCACTTTTTGATTGGATAGTCACAATACGAATCTTGGATCTCCTTGAAGTTCTGTCACAATCAGTAGCTCTCTCTCCCCTCTCCTCCTCCTCTTCTTCTTCTTATGATGATGATGAGTTTTCTATGAATATATCATTTTTTTCTTATGCCCATTAAACTCAAATATTGCAGGTGTTGAAAGAAGTTGAAAGTGTTTACTATTCTTGGTTGGATAATCGCAATATGAATCTGGGATTGAATTCTGTCTTTGAAGTGAAGCACTGTCACAATCAATAGCAATCTATCTCTCCCCCCCCCACTCTCTTCTTTTTTTTGTACTGCTGAATCTTCTATTTGTTTTCTCAACCACCAAGTATTTTGTTTCCACATCTAAAATTAACCTAGTGTTAATCTGCAACAGAAGGGCTGTTCTTGGAGACTTGAACAAAAGGGGAGTGTGAAATCACTCATCTATTGAACAATATGATTTCGTTTTTCCTTGAAAAGAAAATAAACAAAAAAGAAGGCTTTTCCTGATTTTAAAACCTCACGGAAGTTATTGCACAAGTCTGAGAAATAATATATTTTTATTGTAGAGGAAATATCAACAAAAAATTATATAGTTTGCTCCCTTTAAGACCTTCACATAATCATGCAAGGGCTCTCTTTTTCCGTCTTTATCCTTTTTTTTCTTCTATTCAGTGTACGGTTTGAATATTGAAGTAGCTTATTATTACTCAGAAATAGGAGAGCAGTTACTTTCTTTTTTGAACAAGAGGAAGGCGTGTTTACCATCTTAGCTAAAATTTACGAGGATGGTGTCATTAACACATGATAATATTCTTGGACCTTCACTTCTTATTATTACCAATGTGGTGAGTATAAATAAAATGACATACTATTGGAAACTAAGGATCTGTTCATAATATTTAACTGATGACATTAAAGGTTGGCTTATTCTTTTTCCTTTTTTAGGTTGGGAGATGGGGCTTGAGGGGGTGGCGCTGCCTGCCATTGCATATAGAGACTGCAGTACATTTTCTACCTCCACATGATAGGCTGGGCTTCTGATTGTTTGGGGACATAAAATGTTTTGGGGGCTATCAAGTGATATAAATGAAGAAACATCTGATCAGTGAGAGAGAAATAAATCTGTGTGGTCGCCCCTGGAGCTGTATTAATCGACACTTGTTGAGAAGCGAATTGATTGTGGGAGGCAGATGCGTCGAGATTCTGTGGTGATAATTAATTGGTTTTATCAGCCCTAGTGGTTTTCCGTTGTTTTTTGGCTGGGGTTCGGGCCTTGAGTTTTCAATATAGAATGGAAGATAGAAAAAATATTAGCTTGGTTTTACAGAGAATCATAGGGTTTGACTGCTTTTGAGAGTGTTTCAGATAGTCAATCGTTGCCTTGAAATTTCTGGCTTTCTTTCAGGCACATTATTAGTTTTATTTTCCAGAATATGCTTTTTTTTTCCTTTTCTTTTCATGTTGCATATTCCTTGATTGTAGACTTCTAGCTTTTCAGTTTGTTATACTTTAAAATTCAAATGGTTAGGCTTTGCATGCCACAATCAAGTAATTAGCCTTTTTATCTATGCTACATCATCTTTCCGTGTTTTCTTTTCATTAAAGTATGTACATGCTTCTGCTTTAGTATTGATTTTACAATTTGGATGCATTCTGCTTTGTATGGATTGAATCTAACATCTTTAAACCTTTTAAGTAACTTTCAGTTCCAGAACTGTATGGCAAGGAGGTGGAAATTGTCATAAATATTAAAGATGATCTTGAGGATTGTTTGATGCTTAAAATTTTTATGTGCCATTTAACAAGACTCCGAAATGTTTATTTGCATGGTTACTAATAGGTTTTTACATATTTTCCGCTGATGGCGGGTTTCTGTTGCTTCAATATTTAAGTAACTCATGGAGCCCTTTGGTAATGCATTCTTGTGACTAAAATTTAAATTCATATTTGAGGATGTTTTTGTTTTCCTCTCTATCCTTTGCGCTTTCTACTGCTCAAATGAATCTTAATTAGTTTTATACCTACGTTGAGATTCTCCACTTCTTAATCTGACTGATATATTTATATTGAATCTTAATGAAGTTTACCAGCCACCTTATGATTCTGCAATTATCGCTCTGATTGAAAAATTTATCATAAATGGTACCTTTAGTCTAAGGCCACCAGTGGGCTTGATTATTATGGCAGTGTCTTGATTCAGCACAATTTCTTTAGCAGGGAAGATGCTATCTTGGAGAGCAGGGAGTCCTTTGAATGACAATGTTGTGGTAATGGAATAGTTACTGTTTCTGACTATCATTCTTTGATTTATCACTAAAGTGTTTCCGTCAGTATATCCTATTTAGTTATCAGTTGGACAGAGTGCTCAGCTGCTCTGTCTTATTACCAGACAAGGAGGAATCCATCTAGTTTATTACAGTGTGCTGGACACTTGTGACATTAAACGGAGATGCTTTTGCAAAAAGCCATTGACCAAATAGATATCTTGTTAACCTCGTAGTAAGAGTTGGTGAACTTTTTGAACTTGTAATTTTACAAAAATAAGCTGGTTTCTCACATCAGCTTCCAGTCCTTTTTAAGTCCATTTCCTTGTCTCTCAATGGCTGTTAGGGAAATCTTTTTTCTATGAGTTTACAGAATATCATAATCCCACTCCCCCCAACCCATCCCCCCACCCAAATGCAATGTGCACCCAAAAAGGAAATCACCTTCAATCTTTGTTCCAGTTTCTTGGTTTCAACTATGTAGATTCGTTTCCTCTGGTAGCGTTCGTTAAATACCAAATTCTTATTTAAGTTTAAAGTATTATGCCATTCTTTACCGTCTCAAAGATGTTCACTTTGTTAGGATGGTTATGTTCAATATTATTCAGTAAGAATCAAATTGTGCTTGGTAACTGCAGAAGACTACTCAAAGAAGTGCAAGTCTTTCTGGAGATGTTGAACAATTCCCGGGCCCAATGTGGGCAGCATGGGTTGTACATCTGATGTGATGTGTTTTTCGGTAACACATCCAAATGCAAGAAATTTAATATTATCATTGTAGAGGTTGGTCAAATGGAGTTTCTTGAGGTAGGCGTGTTTTCAAGGTTTATTTTGTGACTTGAAATTGTGGAGAAAGAATTAGCTAATCGATTGTTGACCCATGTATTATTGTTCAATACTATTTTGTTGACAATTACAATAAAAATGTGTCTTGATTTTTTTTTGTTTATGTTTACTACTATTGATATTTTATTAGTATACTTGACACATTTGTTTGATATTTTTTAAATATTTTTTATCTTGATTCAATCGGTGGTAATATATCTTTGGTCCGTTATCTAAAAATCTATGAGAAAAATACTTTTTTAAATTTAACATGTTTGACAACTCGCCTATTCACAATGTATAGTCGAATGATTTATATTTTACTCTATTTTATAATTATTTTGGTATTTGATTATAATTATATTTATATATTTGTCAAAAAGTTTTTTTCTACTTGCTAATACTTTCTCCTAATGTTTTTGAGCGTATTGTATTTCATCGTCTAAGTTGATTCTCTGTTTTACATATAATTTGCTCAAGTAGTCCATTGTAAGTTTTATCCATACCAATTCCTCGGATTTTTGAAAATCGAATGAGTTTTCCTTAATCGGTACGTAAAGTTTTTTAAAAATTACGTTGTCGTGTTAAATTATTATATTTAGGATATTTAACTTGTAAATTATTACATTTTGAATTGACATCGTTTGTGTTTCATTTGACTTATCATTTCTATTGTTGATTGGGTCTTGGGTAAGTAGCACAATTGTGATGTGATTTACACCCCTTTATAGACGATCTCTTTAATTTATTTCATTTGTGTTTTGTTACCAGGTAGTCTCCTCACATTTGCGTATGCTTTAGGAACTTGTTACGTGCTTGGATGAGTGTTCCTTCATCGTTCCGTGAAGTGTTTAAAACATTGCATAATTGTGAAATAGTTTGATTGTTTAATATACTTGTAATTTGATTTACCCCTACCTTTTTCGATAATATCTCTAATTGACTCGGTTTTAAATTTTTATTTCCAGGTCGTGACTTCTTGGTTATGTAGCTAAGTGGTATTGATCTAGTAGTGCATGGAAAGTGTTATACTTACGATTCTTTTGGTTTTTAAAAATCATAAACAATTTTAAAATTGAGATCCTTGGGGTATTTTTATAGTTGCGATGTGATTTACTGCTAATTTCTTCAATTTTGTATTGTCTTTGCAGGTGATGTCTTCCACATCTACAACTACTTTGGGACCTTGGTCTTGTGCTTGGAATCAATTTTCCTTGTTCCGTGAAGTGTTTTAAAATATTACATAACACATGGATTATTAAATTTGTTTTTTTTAATGTTCTTGTAATGTGGCTTACCCCATGCTTCTTGATAATATCTCTAATTAGCTTAGTTTGAATTTCATTTGTAGGTCGTGACTTCTCATTTCTATAGTTGTGTCGAGCTTACTCAATTAATGCATTGTAAGTGTTATACTTGGTGATTCCTCTGTTTTTTTGAAATTCATAAGCAATTGTAAAGTTTATATTAGGATTATTATATTTTGAGTTTTCTTTGTAGGTGTGTCTTCTCATTTCTATTGCCTCTGCTTTGAGGCACAGTCTTGTGCTTGGAGTGGATTTTCCTCAGCGGGTTCAATGAAGTTTTTAAAATATTGCATTTCATTAAATTATTACTTGTAGGATTTTTACCCATGTGCTTCTCGATATATCTCCAATTGAGGCTTAGTTTGAATTTCTTCTGCAGGTCTCGACTACTAGTTTCTGAAGTTGGTTGAGAGTAGCTTTTGTAGTACATTATAAGTGTTACCCTTAGTGATTCCTTGGATTTTAGTTTATTTCGTTTTGTTGTGATGTGATCTATGCCATTTCGTGGACGATTTCTCTGATTTATTCAATATTGAGTTCCCTTTTTAGATGTTCTCTTCTCACTTCTGGAGATGCTTTGTGACCTTTTCAAGTGCTTCGAACGAGTTTTGATTAACCGTTTCATGAAGTTTTTTCAAAATTTTCAAATTTATTATATTTATTTTTTTAATATACTTGTCTCTAATTTGTAAAATTTTGTATTTCTGTTGTAGGTATTGTTTTGTCACTTCTGCAGCTGCTTTAGGACCTTGTCATGTTTTTGGAATGTTTTTCCTTAACGGTTTTGTTGTGTTTTTTAAAGAATATTCATAATTGTGAAATATTTAGCTTGTTAAATGTACTTGTAATTCGATTTACCTCTACTCTTCTCGATCATATCTCTAACTAATTTAGTTTCAGTTTCTTGTGCAGGTTTTGACTTGATCATTCCACTAGTTTGTTTGGACTTGCTCTAGCAGTGTATTACAAGTGTTACCCTTAGTGATTACTTTATTTTTGAAATTCTTAAGCAATTGTATTATAAGTTTTTTCAAAATTTTTAAAATTTCAAATTTATTATATTTGTTTTTTTAATATACTTATCTCTAATTTGTAAAATTTTGTATTTCTGTTGTAGGTGTTGTTTTATCACTTCTGCAGCTGCTTTAGGACCTTGTCATGTTCTTGGAATGGTTTTCCTTAACGGTTTTATTGTGTTTTTAAAAAATATTCATAATTGTGAAATATTTAGGTTGTTAAATGTACTTGTAATTCGATTTACCTCTACTCTTCTCGATCATATCTCTAACTAACTTAGTTTCAGTTTCTTGTGTAGGTTTTGACTTGATCATTCCACTAGTTTGTTTGGACTTGCTCTAGCAGTGTATTATGAGTGTTACCGTTGGTGATTACTTTATTTTTGAAAGTCTTTAGCAATTGTAAAATTGAGATATTTGGGTTATTCAATTTTTAGTTTCCTTTGCAGGTGGTCTTCTCATTTTTGCAGTTTCTTTGGGACACATGGTCTTGTGCAAGAATGGCTCTTCCTTAATCAGTTGGTGAAATTTTTTAAATATTGCATTGTCTTTAAACTATTATTTTTAGGATTTTTAATATACTTGTAATGTGATTCACCCATTCCTTTCTCGATATCTCTCTTATTGAACTAATTTGAATTCTTTTATAGCTTGTGACTTCTCGTTTCTATTATTGCTTGGGACTTGCTCACTTTGTGCATTGTAAGCATTATCTGTGGTGATTATTTGGAGTTTTTTAAAATGTTAATCAACTTTAGTATTGAGATCTTTAGCTTATCTCTTACAATTGTGATGTAATTTATGCCACTTCGGGGACGGTATCACTGGATTATTCAGTTTTTTATTTCCTTTTGCAAGTGTTGTCTCCTCACTTCTGCAATTGGTTTAGGACCTTGGCATGTGCTTGGTATGAGTTTTTCTGAATCTTTCTATGAAGTTTTTAAAATATTACCTAGTTGTGAAGTTTATATATTTGGAGTTATTTAATATCATTGTAATATGAGTTAATTAAATGGATTGTTACTAATATATATTTAACTTATTTGAACCTGGCAGTTGGAATTGCTGAATCCAGCTAGGGATGCTAGGTTGCCGATAATTGGTGGCCTAAGTGGGTTTTGTCTCCCAGAGGTTGAGAGCATTTTGTTCCAAACAGAACATTGCTTCATTCATTCAGTTTACGCAGAACTCAGCTCTGTGCTCTTTGCACGTCACTTTCATGGATTTGCAAAAAGGATTGAGTACATTCTTTAGGCGGCCCTTTACGAATCTGTTGGGTTGATATTGTGCTTCTTGGACGGTTGGACCTACAACATTGACGCAAGATCACTAAAGCTTAGTACGAGGAGATCAAGAAGCTTATGGAGGAGCTTCATTTGGTTATGTTCTTGCAATTGGTTACTAAGGAGGTTCTAGACTGCAGTTATACTCTCCCATTTGACAAGGCAAGTGAAAATTATCCACTTCCTGATTGATTGAAAACTTGAAATACATGGGGCCCAGTGAGAAGTGGGATATATCTAGCCGTATCCATATTCTATTCTCGTAGGTCTTACCATATTGATGTACCCTCATTGTACCTGTACCCATAAACGTGCTTCATAGCTTTTGACGCATGCACGCGCACAAACACCAATTAATATAGCTTTGTAAACCAATTAACTAGGTACTAAAAGTGTCCTCATGTTTTAGGGATAACACTGATGGAGACTTGGGGAAAATGGCAACTTAGAATTAGGTTTTGGAGGGTGGGGTAGCGTTGAATGGAATTTTTATAGAATTTGAGCATGAATATTGCATTTGGCATTAAAATACTTTAGGAGGACAAGAAGTGTAAGCATGCAGCCGAGCCCCCATCTGGAAGTATTGTCCACTTAGGCCTGGCTAAACAACTTCCCTCAATGGATTGTCCCTCTGGCATCCTAGCCCAAAAGGCACCTCCAAGTTGGAAGTGTCTTTCGCTGTCTTGTTTGGTCATCGCGGGCATTGTCCGCAATCCATGTGAGATTCCCACAAGAAGCATAGAAGTGGATACTCGGACCATAGCCTCTTGTAGGTAAGTTTTTACCTTTTCTTCTTTTTTAGTTTTCCATGCTGATGTAATACTCAATGTGCTTTTATTGATTTTATACATTATAGGATCAACTTTTTGAGTTGCATATAAGAAGTTTCTAAAATTTAGTCTCTTTTTCACAAGGCAGGAGTTGTGTCTTAATAATGAATTCTGTAGTTGAGGCTGTAACTATATTTATTGATTCTTGTAGTTTCATTATGCAAGTTAACTACATCATATGAAGTCTGAACTTTTATTCACTTAATATAGAAATTGCCAAAATGCTTTTGTAAAGTGTTCTTCCAAACCTGGAGTATACTTGAGCCTCTTTCATTGCATTTCCTGGACTTGTTAGATTGGTATGAAACTTTTATTTAGGAGAATAAACAACCTTATGCTTGGAGTTGGCGAGAACTGTGTCTCCACCCCTTCTATGCGTGCGTTCACATAAACCCTATATGGTTGTATCTTCGTGGATTATATTAGTTTACATTACTACGATTTGGATGGTATGCTAGGATGGGGAATAAAAAAGTACGCGTAGTTAGTACCCATAAAAGGTGTCTAGGAGGGATAAATTGGTAAAAACTTGACATTTGACAATATATGCACAAAGTGATTGTCGTCAGGAACCTACAACCTCAGGTTTAGTATGCCATGTTTTAACCACTGAACTAATGGATGGATGGTATGCTAAGAAGGGAAATACGAATGAATATTCATAAAAATCGGGATTGCTTAAATTAATGGATTGAGAGAAGGGGAAAAAACTATTACGAGGCTTGCATCTATATCTATACTTCGACAAGTGCTCTGAAGAATCGGAGTAGAATTAGGCATCGTTGCCAAATCCTAAACAAAGGAAACCTTGCTATCCAAATGTAGTTTTGTGGCTCAGCCGCCACCTCACAAATTATAGATCTAATTGAAGTAACATTACTGTTCATCACCCTTCCCTGTGCCATTTTTTTTTATTCAATGGAAGTCCCTGTGCTATTTTTTTTTTCATCCAAAAACAAATTTGTCCTTTCATTAGGGGATGATGTTTGCAAAAACTGTGTATAGCATCTTCACTTTATTGGTATCATTGAAGTAAACTGTTTGAATAACGGTAAAATATTGATTTACATTTTAGTTATCATGCACTTGTTACGATAAGCAAGATTGCCTGGCCTACATCTTAAAATATGATCGGTAGTGAAGTTTAATAATGAAGTATGTTTTAACGAATTCCTTATGCATTTTTTTTTACAAACTGGTTGTGCCTTTTCACCGTTTTGTTCGACGGAGCCCTGTTATATAAGTTTGTATGTATATCCATGTATAGATGTTGGTTTTATTTCAAAGTCATTTTAGTTATGTTGCATTAACGACTTCAACCATAATATAAGCTGGTTTTTTAGATGAAACTCTTTGCCTTTGCACAGGTTAGTAGTTCCTGAAGACCCTTTTGCCCTGTTCTTTAACACCCTTAAATTCCATATCTCTTCTGCATTTAGTTTACGGACTGGTTGTGCTTTTCACCCTTCTGACTTAATAGTTTCTTGATTGTTTTTTCCCCATATATAAATCTAGCTTTTCTTCTTGGCTAGCACCATTGGGAACTGTCCACATATTATACCTAAACCTGAACTATATTTATTTATTTTCCTTGTATCATGGACAGGATTGGTGGCAGATCACACTGTTCACTTGGTTCGTGGTTTCGCTCCAACTGTACCAGTCACCACTGCATGTGCAACCAACACTGGAGTTCCAAATTCTACTCCAAGTGGCGTGGCGTCTGTTGGTTCTGACGAAGGGGCATTGGGAGGAACTGGTTTGGGCTCTTCGCTCTTTCCTGGACTTGGTTTTAATGGATTAGGCAGCAGCAATGGATTATATGGAGCTGGACTTCCAGAAATTGAACAAGTGCAGCAACAGTTGACTAAGAACCCCAATCTGATGAGAGAATTAATGAACATGCCTCTTGTTCAGAACCTAATGAATAACCCAGACATTATGCGGAATATGATAATGAACAACCCACAGATGCGTGAAATCATTGATCGAAATCCAGAGCTTGGTCACATACTCAATGATCTTAGCACTCTCTGTCAGTCATTGGAGACTGCAAGAAACCCTGAACTCATGCGTGAGATGATGCGCAATACTGACAGAGCAATGAGCAATATCGAATCTTCTCCTGAGGGATTTAACATGCTGAGGCACATGTATGAAAATGTCCAAGAGCCTTTTCTAAATGCAACAACCACGGCTGGGGATACTGGAAATAATCCAGGATCAAACCCTTTTGTGGCTCTTTGGGGGACTCAAGGTGGCTGGCAGGGCAGAGATCTGGATACTAATCCTTCTAGCACTGGTTCCAAAACTAATACCAATTCTCCTGCTTCAAACACTAATCCACTTCCCAATCCGTGGGCCTCTGGTGGAGATAAGTTAAGCTCTCTCTTTAGTCCTCTTTTTCTTCTTTAGGATTTTGAATGTTTTGGTGTTGAGATACATGAATTTGAGGCTGTACTTATCCTTATTATCCTTTGCTCTGCTGCTTCATTTTGTTTGGGTTAAATTGTGGCGTTATACGTTGCTGATGTCAGCATTTTTAAAAATAAAAAGTTGGTTTTTATCTATACTTTTCTCATTTTTATTCAGTGTAGGTTGGAAGGATATCTTGTTTATAAGCTAGTCATATTAATAAGAGAGCCAACATATGACAAAAGTATTAGCATTCATTATAGGCATAGACTATTCAAGTTGAAAAACTTTGCTGCATCATATGTGATATGTGTAGTCCTACTAATTAGAATATCATCCCCAATTTTATTGTTCCTGTTCAATTTTTTAAAAGGTGTCACCGTTTTTCCCTGAACTTCATTATCTGAAGTTGACTTTAAATAAATTATATGGATTGTTACTAATGTTTAACTTACTTTGAATTTGGCAGCTGGTGGTGCCCAAACAAACTCCACTATGAGATCGAGTCCAGGTGGGGATGCTAGGTTGCCGACACTTGGTGGCCTAAGTGGTGTTGGTCTCCCAAGACATGTTTGGTTTCACACAAGACAACGCTTCATTCAGTCAGTTTATGCAAAGCCCAGCTGTATCACAGATGATGCAAAGTCTCCTCTCCAACCCTCAGTACATGAATCAGGTAGTACTTTTAATTTTTTACAATGTAGTACGTGTTTATTACCGCTTTCAGGGCTTGCTTATAGTTCGTTTGGTGTTTCTGTTTGTTGCAGCTTTCTAAAACAGCTCATGACCCTGACTTGAATATGACTATCCAGAAGCACACTTATGGATGCTTTTGGCTTCCGCTTACAGATTATCAACTTTCAGATTTAAATAAGATGAGACCAAACTGCCTCTAATATGGTTCATTTGACTATGGCTTTTCTAATTCTAATATGTATTTCAATTGGTAGATTCTTGGGCTGAATCCCCAGCTGCGCAATATGATGGATTCCAATTCCCAACTTAGAGAGATGATGCAAAACCCAGAATTCCTTCGCCAATTGACTTCCCCTGAAACAATGCAGGTACGATGCTTGAAATCCCACGTCCCTCTCATGCACTCTGTCTCCCTATATTTGGAAATGAAAATGAGACTTGCATATTATTGATATTGGTGTGATTAAAATAATGAAGGGCTGTATTGAGTCATTGACATCTCTCCAAGTGAAATCTGTTCCATTTTAGCATTTTAAAGTATTGTTTTGCAGCTTCCGACAATTATTTAGGAATTTAACATTTCTCTAATATCTTTCAAGAACTGCTTCGCTATAACCATCCCCTTGTGGTTGGTGAAGGGAGGGCCTCAGAGCCCCTATTGGTAGAAAAAAACCCACAATCCCTTGAGGTCCTCCTGAAGAAGAAAACGGATTAAATTCAGTGATAATTTGATTCTTTGTTGTTGCTTAACACATGCCAGTCTTACGAGCCGAAGTAGCTCTGCATGGTATTGTCATTTTACCTATAATAAATTGGTTTACTGAATAAGATTCAATTGGCCGTCTCTTAGGAACTGACCAAAGAGTTAAGGAGTTACGATCATCTCATATTGAGAAAACGTCATTGATAGCTTCCGCTACCCGACCCAGCCTTTGCTTTTTATTTAGGGTAAATTTCATTTATGACAAATGCAACTACCTCCTTTGTAGTTTTAGAAATAGTGTTGACCTCCCTTTCTTTTGAATCTAATGTCAACATTCCACCTGAAACTAATTTTTGTGCAAAAATGACAAATTTGCAATTTGATTTAGGGATTCCAATTTTTTTTTTCTCTATACACATTAAAATAAATAAATATTTTCTTCTTTTTCTCAAAATATCATTTACTTGTAAATAATTTTATTTTTATTTTTTATCACTAAGTAATTTTTGTAAAAAGGATTTTGATCTAAACAGTTTACTTTTTAAGTGCTCCAAATCTAAACATTCTTAAAAAATATTTTTTTTATCATTTTTTTAAAAATAATAGAATGTTTATTTATTTTAATGTGTGTTGAGAAAATAAATTTGGAAGTCCTAAATATAAGGGCGAGATTGTATTTTTGCTCAAAATTAGCTTTCGGGGAGAATCTTGGCCATAATTTCAAAAGTAAGGGAGATTAGAGCTATTTCAGAAACTATAAGGGAAGTGGTTGTATTTGTCAGAAACATCAGGGGAGGTCAATGAAATTTATTCTTTTATTTATTATTGGAAATGGGAGGCTGAAGAGAGGTTTATGTTGTTTTTCCTTTTATTTTTTGAGATTTGTTTGTCAACGACTAGTTTGTTTTCAATCTGGCTGTACAAACTCTTTAAATTTTTATTTTTTACTTAGAAAGGGCTTTCTCCCTAATACTAGGCATTGGATTGGGTACTTATTATCAATTTTCTCATTTTACAGTTTACAGATAGATCAATTGCCATCATAAGTGTCTCGAGTTCTCACCCCTTACTCATTTAGGTTTCTTGTTTTTTGGAACATCATGAGCTAAAATTAAAGTTCCTCCCCACCAACTGCATGGGTTGTTATGGGAAAAGTAAATGATTCATGTAAGAAATATCTCAATAAGTAGCATAGTTTATTCTCTACAGCACACTATAGGCATATGGACCCACTATTCCCGTGGCTTATTGTCATTGGGCGGGGCTTGTAGGCAAGACAATGAACAAGTAAAACACCCGGTGTGGTGCTGTATGATACACGTTAGACAGTCCCGCCAATTTGCAAGCAATAAGTTGACAAAATGCCAAGGAAAAGGCTACTCAAGCATATGAAAGTGAGACATTCAAGAGCGAAATGACAGCTTTCCATTGATCAAAAAGGTGTATTACAATGTTTTAGCCATGCACCCAAGTACATAACTCAAAACAAACCATTGTCAAAAAACTAGTTAAAGACAATGGTTGGGCAAGTCATGAACCTGACCCTAATGGTTCGTCAAAGTAGCTTGTCCCATTTTCCCTCAAGGGACCTTCATCAAATGTTATGCGAGAGAGAATTCACCACACGATGACTTGGTGACAAGCCAAATCTCTGCATCAATCAGCCGTCATAGCTGGAAGGAAATCGAATCCGTTGTTTAACTGCTAGGACTGATCCATGCATTCAACCGTCGGCCAGAAAAGTGAATGGGCTCCAACTGGTTTGCCTCCTGGACCAACCCATTCTATAATTTGAAGGATCTGTTCTCCAACAGAAAGTGAAATCCTCTCCTATTGGGATCATAGATGCCTCACCAGAGATTGCCCTGGCTCCCATCCAGTCATTTTTCTCCTATAATTTTACACTATGTTAGAGCACCATTACTCGTAGGCTCCACCGCGTCATTTCCACAATAAAAAAATAATAAACTTCAGATTTAAGATTCTTATATCTATCAAATAACTTTTTTAATTTGGCAGGCACTTAATTTTTTACGAAACACATTTTCAGCTGACAAAATTCAGCATTCAGTAATTAGTTTTATCTAACGCCACCTATGTTACTTGATTCTTGTAGTTTCATGGTGTAAGTTAACTGCATCTAGTAAATCTTGAATGTCTGTCACTGAATATATAAATTGCCGAATTGCCTCAGTCGATGTGCTCTTCCAAATTGGGAACTACTTGAGCCCCATTTTGCATTCCATTTCCTGCACTTGTTTTGCATAGGAGAAGTCATGATTAATATGAATGAAGTGGGGGAAATAGAACAAATTGGAATGCAAACATGTGGTAGTTACATCTTATTTGAACTTAAGTGGGAACTTTCTTATTTGTGGAGAACTATTCAATATCAGCATGCATATATGCATGTGCATGTGCATGTTTGAGCCTTTTGTCCCTCCTTTTGTTTTAAAACGTATTAACTTTGTTCTTTATTACTTTATTTCCTCTGGGTTGGGCCACTTCTTCCAAGAATTATATATAGCTCGTTCATAAATCCACTTGACCACTCAGACTTAACGACGAAGTCCTTCTTCATTACTTTATTTCCTCTCGTTCTTAATTTTTATTTTCCCTGTTTCAGCAAATTTTGACCTTACAGCGAACTCTTCGTCTCAGCTTGGTCAGCAATCTTCAACCAGGTAAGTGATTTTGCTTCTAGATTTTGTACAGTAAAGGAAACCAATTTCAAGCCTGCTAGTCTTATCATTAACCATACGTTTATCAGTGTAACTCACTTTTTACTCATATAGCTGTATGTAAATGTTGACACAATCAATATGTTCACGTTACTGTCCAGATTATTTGAAACATTGATTTTTCTAGCCTTTTATACCTGGCGACCATATAGAATTTTGTTGATTAGATTTAACCCCTTTCCTTTTTTAATTTGTCTATTTGTAATTGCACTCTTGCAGGGAAGCAGGTCAAGGTGTTGGTGGGACAGGTACGTTATCTTGGAACTTGACATTCTAATTGCATATATTTAACCATAATGCTCAGTGATTCTGAAATCAGAGTGTCTATTCGTGGTAATGCAAGATTGCAGCTTGTCTTGCCTCATCTATCTCAAGTTGAAAATTCTTTAAGCTTAAACTTCAATTCTAAAATAGGGATCTCCCAAGGCTGTGTTTGGATCAAAAGGGAAAAGGTGGAGGATCCAATGGTCCCGAACGGTTGGATCCTCTAACTTTTCTATTTTCTTTTCCTTCACCAAATCCTTGATCCAAACACGGCCTATGAGCTTGAAGACTGTTCCTTTGTAATCTTTTGTTGAATGTGGAGGATTCTGGGATTGTGTCCTTCCATCAATTAAGCACAACATGCCTAATCTGAAATCTCTGTTGATGCTAACCCTGAACCCCATATTTATTTTGTAAAAGAGAAAGGAAAACCGAATAAACAAGACATGAAGATGGCATTATATGAAAATTTCCGGTTGTTTTCTTTAATAGTAGTTATTTAACTCACAGTGACGTGCCCTTGTTCTCTCAATAGCAGAGAAATTGATGGCATGGGGCTGGAGATGTTGATGAACATGTTTGACAGACTCGGGATCGCAATGCCTCCGTCTCTAGGGGTAAGCCAACAGTTTCTTTAATGGTTTTCTAATCCAATAAATAAGATGAAGAGAGCAACTCCATTTGGAGCATCTCCAACCCACCATCTATATCTTCAAAATGAGAAAATAGAGAATCTTTCATTTCACGATTCACTTTTTTAAATTTCAAATTTGCTCCCTTCAACTCTTGATTTTAAATTTGATTACCAATCTTATCCTTTCTACTTTTTATTGCTTTTTGATAAACTACATATAACTTTTAACATACATTTATTTTTTATAAAATTAACATGGTCGAGTATATGTGGAGTATACCTTTAAAATAAGACCAATATTCAATATATTCGCTAACAATTTGAAAATTGATTGGAGGAACTTTTTTAGAAATAAGAGTAGAGATTTGTGAATTGAGTTTGCTTGAATAATAAAAGCCTCTAAACTTAATTTTTGAATAAAAAAGAATATTTTTATGTTATTCTGATTATGGCAATTTTTGAAGCTAGTTATTGTTTACACTATATTTTTTTTTATTTGTATTTGTCAGGGTGAATTTATTTTAAATATTAATATTTGAATAAAAGTGGGTATTTTAATAAATTTATTCTAATAAAGACAAAAAAATAGTGCAATTGAAAAAAAAATGAGTATAAAAATAGCCTTTTAAAAATAACCTAGGCTATTTAAAAAAAATTCTATTTTAACTCGATAATTAGTAACTTTTTTTCTTTCATTAATTTTCTCCTACCGTTCTGAAATCTTATGCTTTCCGATACTATATTCTAAAATTGTAATGCAAGCATATATGAGAATCTTTCACATAATGGGGATTGGGGACCAACAAAGGCCAAACCTATCCGCCATAACAAATTCACGATCCTTCCTAATCTGGCAAATCTTCTTATTTACCAAAAGCAAAAAAATCAAAATTTATGAAAAAATACAAAAAAAAAGAGAAGTGAAAAAATTCTACGGATTCAATTGATCAGAAGATATCAAGATTTTTCAAAATGAAGCCATTGCATATAGGGTAATTACCTCTCCGAACCCAAAGCTCCCTCGAACACAGCCTGCAAAATATATGCCCAGAAGGTGTGAATGCAGCCCCCTTGTGCTTCTCCATACACACGCAAAAGTTTTGCATTTTCAAACCTCTCTTTTCTACCGTTGCACTTATTTTTTTTTCTTTATTATTTGTTATGGTAAATTTACCCAAATATGCTTTTATAAAATAATTTTTTTATTTTTTACTTTATTTTCCCCTTTAAAACGAAGGTATTTTTGTTATTTCACTTAGTCATTATTATATGTGTGATTTGGTTCAAGATAATTATAATTGAATAAGTTTCTTAATGGATTAGGCAACCCCCCAAAAATTATTCTAAACATATCTCAAATAGGAACTTAAACTTTGTTTGATAATAAATTTTGAGGGTGAAATTAGATTATTAGTTATGTGGGGCCTATTTTAATTATGTTTTAGTGCAAAAATTGATTTCTAGACTAATAGTTCATTGAGACTATTAATCTCCAATGAATAGATGATTAAGAATTCCATGGGGGTTGGTTTACTAATTCAATCCCATAAAACTATTAATTCAAAGGAATTAGAATTAGATTTGAATTGATAAACTCACTAAATTGAATTTTGTTATTAAACATGGCCTTAGACCCAATTTTCATATTGTTTGAAAGCCCCTAATATGTTGTTCACCTAAATAGAGAAAAATAAAATTTCAAAAATCAAAATTTCAATGCCCAAACTAGAAGAAAAAAAATCCCAACGCCCAATTTCCAAGACTCATAAATTTCCTAATTAAAGACAATGAAAAAAAGGTGTCATGATTTTCAAAATTCTATTTTGGCTAATTTACAAGGCTAATAAACGAATCAGGTTGCTTTGAGATTGCTTTTGTTCATCTCATTAGAAGCTCATAATTGGTTTGTTACTTTAACAAACTAAGTTTGAACACTATCACTTGTTTCAATAAGCTTGTGCTATTTAACAAAATTCAAGTTACTCGAGTTCAACCGATTACAACGCGCTTAAGATCAACCAAGCTCGAGCATAATTTAAAAAACTCATTAAGTTTACAAACTAAGCTTGAAAACTCTAATGTTCAGCTCTTAAATGAACCCTCTACGCTACACTGTAGGTGTATGGACCCACCATCCACATGGCTAGTAGTCATTGGATGGGGGCTTGTAGGCAAGGTGTGGTGCTTACCAATTCACTTTAGGCAAGTACCCCAAGCTCAAATCACTTGCATCTAGGTTGCAAGCAATAAGTAAAAACAATGCCACGGAGAGGGCTACTTTAGTAATATAAAAGAGATCCTCAAAAGAAAAATGGTAACATTTTATGAATTAAATGGTGCATCACAAATTCTTTAGACATGACCACAAGGTTACAACTCAAAACAATAGTTGAGCAACTCGTCAAGGTAACACTTGATGTAAATAGAATTCTTAACTTTTTATCGTCAAGGTAACACTTGATGTTTTGGGAGTCATAATTCCTCTTAAAAATCACTGAAAATAGAATAATAACAATTGGATATGGGCTAAGCATCACAAAATAATACATCAAATATACATTTGACCTTAGTTTGTGCGGCAAAAGGAGTTTGAATATATTTGTAAAAAGTTAAGAACCTCTCCAATAATAGCTCTTATTCTGTCCCTAAATTTTAACAAAAAAATACATTCTCTATTTTTAAGGGATCATTTTTCAACTACAAACTCCAACAATACTATCTACTTTTATCATATTTCTTTTAAATACTATTTTTTAATTTATAATATTCTCCTCCAACTTCTCTCTCCTCCCTTCATCTCTCTGCACCAACCCAAACATCCAATCTCCCTTTTGCATTAACCCAGACGCCCAATCCCATTGCAATTTTACATAAATGGCATGATCTTCACCTCTTTATTGTGATTTTTCACCTTTGATAGCTATAAATTGGTTCTTGATTTTCTCAATTTTTGCGGTCTCGGTGAGTGATTTCTGAATGGTATTCTCGATCTTGATTTGTGAACTTGGCAATATCTTCACCGATCTCGATGGGGGGATATCCAAGGATATCTTTGATTAGTTTGTAGAGATTCTAGAAGGACTTCTTTTTGTTATTTTTTCTTCATATTGAAGTCTCCAATGACAAAGCAACAAGGAGTTTTCACAACTCAGCGCACATAATCATAATCTCCACCACTTTGGTTGTCTGTGTTGTTATGTGGTTTGCTCGGGCGAGAGACGAAGAATGCTGTTCAATTTCAGTTCTGTGTTGTTTGGGACTTGCTCAATTAATGTATTGTAAGTTTTATCCTTGGTGATTCTTTAGAGTTTTTAAAATCTTAAACAATTGTAAAATTTTGATCTTTAGGTTATTCTTACAGTTGTAATGTGACAATATCTCTAATTTGTAAAATTTTGTGTTTATATTGTAGGTGTTGTTTTGTCACTTCTGTAGTTACGTTGGGACCTTGTCATAATTGAGTTACGTTGGGACCTTGTCATAATTGTGAAATATTTAGGTTGTTAAATGTGCTTGTTGGGACCTTGTCATAATTGTGAAATATTTGGGTTGTTAAATGTGCTTGTAATGCGATTTTCTCCTACCATTCTCTCTAATATCTCTAACTAACTTAGTTTCAATTTCTTGTGTAGGTTTTGACTTGATCATTCCATTAGTTTGTTTGGACTTGCTCTAATAGTGCATTGCAAGTGTTACCTTGGTGATTACTTTATTTTTGAAATTCTTAAGCAATTATAAAATTTAGATATTTGGGTTATTCAATTTTTAGTTTCCTTCGCAGGTGGTCTTCTCATTTATCCAAGAATGGGTATTTCTTAATCATTCGGTGAATTTTTGCGGTCAGTTGGGTTTCGAGATTGCAAAAGATTGTTGCTCTTTCTACCACAGAAGCGGAGTATGTGGCTGCTACCGAAGCTTGCAAGGAGATGGTTTGGTTGCAGAGTTTTATGAGAGAGTTGGGCAAGGAGCAATCGAATTGCACTATCTACAGCGATAGTCAAAGTGCAGTTCATTTGGCAAAGAATTCAGCATTCCATGCCAGAACGAAACACATCGACATTAGATATCACTTCATCCGATCACTCCTAGATGAAGGGTTGATAAGTTTGGAGAAGATCCACACAAATCAGAATCCTGCAGACATGTTCACAAAAGTTGTGATCATTGAGAAACTGAAGCTATGTGCAGCTTCAGTGGGTCTTCTAGTATGAGGGCCGTAATGCCACACCGTTTGAGTAAATATTGAAACAAGTGGGAGTTACCCGGAGGAGCAGTTTGGTGGTCAGCCTTCAAGTGGGAGATTGTTAGGTATGTGAAATGTGGAGCCTGACATTTCAATGTCTACAATTACGGTTGAGTCCAAGTCTCCGATTGCGGCAAGTCCAAGTCTACAATTGTGGCAAGTCCAAGTCTCCGATTACGGCAAGTCCAAGTCTCCGATTGCGGCTGAATGACATCATTGCTTAAGTCATCCTCTTCCTAGGTTTCTCTATAAATAGATGTTGAAGTCTAGGAGAATGATAAGAAGGTAGCTAAGGCTAAGAGAGAGAGAAAGAGTGAGGGAGAGATTGTAATCCTAAATTTTGTTTTGGGGAATTGCTACTCGGTGTGGCCGTGGATGTAGGCTTAATTGGCCGAACCACGTAAAATCTCTGTGTCCCTTTTATTGTTTGTTTCTTACTTGCTTGTTTGTGTTAGAGGTGCACAAAATACCCACCCGACCCGAGACCCGACCCGACCCGACTTCATTGGGTCGGTTTGGGTCGGTTTTTTCAAGTCCATGGGTCGGTTTCGGGTCTAAAAATTATAGACCCGAGCGGTTCGGGTCGGTTCTCGGGTCCCTAAGTTTTTTTACCCAGAACCGACCCGACCGGAACCGACCCGAGAACCGAAGGGTAGAACCAACCCGATCGGACCCGACTTGAGAACCGAAGCCTAGAACCGATTATATGGGCTTATAATGTACTCTACCACACTTGATTATTGCCTATTTTATATAGAATAAGTGAAAATATTTTTAAAAAATTGAAGAACTGACCCGACCCGACGACCCAACCCGAGAATCGAAGAACCGAAGAACCGAACCGAACCGAACCTGAGCGGGTCGGGTCGATTCGGGTCGCCGGGACATTCGGGTCGGTTCTGGGTCTAAATTTCTGGAACCGTTGATGGTCGGGTCGGGTCTGGGTTCGACACATACCCGACCCAACCCGACCCGTGTGCACCCCTAGTTTGTGTGCGTGTTATTATTCCCGATCCATTAGGGTGAAAATACGCATTGGTGTTTTTATCACAACACATTTCTCCAACAGAAAGTGAAATCCTCTCCTATTAGGATCATAGATGCCTCACCAGAGCGCTCTCTCTCTCCATAGATTGCCATGGCTCCCATCCAGTCATTTTTCTCCTATAATTTTACACTACGTTAGAGCACCATTACTCTTAAGCTCACATCCCATCGTACTCAACAATGAACCTTCCCATTTCCCACACATACCATGTAGCATTGCAAAGCAATTCAAGTGTGTATGTGAGTGTATAGATAGTTGCAAACTAGGTACAACTAAGTGTGATCCATGTTCAGGGCCGACATTAATAGAGTGAGCATGAATTTTGCATTTTGGCATTAAAGTACTCTACATGTCAGAGAAGCATAAAAGTGGAAAGCGGGGACCATACCCTCCTGGACATAAGTTTTCACCACATTTTGTTATCAACTTTTAGCTAACCTACAGGTAGCTATCATAGGAAGTATGCATCGATGTGCACCACTATCACACAATTACCATCGCCACCCTTCGACACAATCCCTATGACCACCACCACCACTCCACTCCCACCACCCTCCATCATCATCACCATAGCCACCACAATCATTAATTCCACTACCATTTCACCACAACACCAACACCAACACCACTACCTCCACCTCCACCCCACCTCCACCCACTCTCTACCTTTACCACCATTGTTACCACCATCCCTCCACCTCCACCACCATTGTCATTGTTGCCATAACTATCAACATCATTCTACTACTATTACCGTCACCACACCACCACCATTGCCACTCTACTTCAATCATCACAACTATCACTACCCTACTGCCGCCTTCAGCACCTCCACTATACCACAAACACAACCAGCACTGCCGCCACCACCGCGTCATCACCACAATAGAAAAATAATAAACTTCAGATTTAAGATTCTTATACCTATCAAAAAACTTTGTTAATTTGGCAGGCACTTAATATTTTGTGAAACTTATTTTCAGCTGAAACAATTCAGTATTTAGTTTTCAGTAATTAATTTTATCCAACACCACCTATGTTACTTGATTCTTGTAGTTTCATGGTGTAAGTTAACTGCATCTAGTAAATTTTGAATTCTCTCACTGAATATATAAATTGTCGAAATGCCTCAGTTGATGTGTTCTTCCAAATTGGGAACTACTTGAGCCCCTTTTGCATTCCATTTCCTGCACTTGTTTTGCATAGGAGAAGTCATGATTAATATGAATGAAATGGGGGAAATAGAACAAACTGGAATGCAAACATGTGGTAGTTGCATCTTATTTGAACCTAAGAGGGAGCTTTCTTATTTGTGGAGAACTATTCAATATCAGCATGCATATGCATGTGTGAGCCTTTTGTCGCTCCTTTTTGTTTAAAACGTATTAACTTTGTTCTTTATTACTTTATTTCCTCTCGTTCTTAATTTCTATTTTCCCTGTTTCAGCAAATATTGACCTTACAGCGAACTCTTCTGTCTCAGATTGGTCAGCACCCTTCCACTAGGTAAGTGATTTTGCTTCTAGATTTGTATGGTAAAGCCGTAAAGGAAACCAATTTCAAGCATGATAGTCTTATCATTAACCATACGTTTATCAGTGTAACTCAAGTATTACTCATATGGCAGTATGTAATTGTTGACACAATCAATATGTTTTTGTTACTGTCCAGATTGTTTGAACCATTGACTTTTCTAGCTTTTTATACCTGACGGCCATTTAGAATTTTGTTGATTTGTCTATTTGTAATTGCACTCTTGCAGGGAAGCAGGTCAAGGTGTGGGTGGGGCAGGTACGTTATCTTGGAACTTGAAATTCTAATTTCATATCTTTAACCATAATGCGCAGTGATTCTGAAATCAGAGTGTTTATTCATGGTAATGTGGTAATGCAAGGATTGCAGCTTGTCTTGCCTCATCTATCTCAAGTTGAAAATTCTTTAAGCTTATAAACTTTAGTTCTATGGATCTCCCAAGGTTGTGTTTGGATCAAAAGGGAAAAGGTGGAGAATCCAATAGTCCCGAACGATTTGATCCTCTAACTTTTCTATTTCCTTTTCCTTCACCAAATCCTTCATCCAAACACAGCCTATGAGCTTGAAGACTATTCCTTTGTAATCTTTTGTAAATCCTTCATCCAAACACGGCCTATGAGCTTGAAGACTATTCCTTTGTAATCTTTTGTTGAATGTGGAGGATTCTGGGATTGTGTCCTTCCATCAATTAATCACAACATGCCTAATCTGAAATCTCTGTTGATGCAACCCCTGGACCCCATATTTATTTTTGTCCAGATAAAAGAAAAAGGAAAACCGAATAAACAAGACAGAAAGATGGCATTATATGAAAATTTCCTGTCGTTTTCTTTAATTGTAGTTATTTAACTCAGAGTGACGTGACATTGTTCTCTCAATAGTAGGAACTGATGGCATGGGGTTGGAGATGTTGATGAACATGTTTGGCGGACTCGGGACCGGAAGCCCCGTTGCACCAAGCATATCCAATGGTGATTATTATTTCCTTTTCCCTCGAGCCTTCCGATCTATGTTTTTGTTGATTTGTTGGCTAAATTCTTTTGGGCTCAAGCCCAATGCTAATTCTAGGCCCAAGCTTAGGCCCAAGCCCACAGAGAGCCATTGTCAAAGTTGCAGCTTCTTCTCTTGTTGCTGCCGACAGAGGAAGTAGTCGGCCGAAAGAGGAAGAAGCCATTTGTCAACAATGGTGGCACCTCCCCTCCCAAGTCAAGCTTGGTGAGGTCATTGCTTAGGTAATTCTGTCCCTAGCCTTCTCTATATAAAGCTGCGCTGATAGAGTAAAATGGCAGGGCAGAAATTAGAGAAAAATCAGAGAGAGTAGAAGGGCAGAGAGCTTGAGAGAATTCTCTCAAATTGTATTTGTATTTGTTTCTCTCCATATAATAGAATTGCTGCCACCCGAGGACGTAGGCAACATTGCCGAACCTCGTAAATTGTGTGTTTGTGTTGGATTTGTTAGTGTGTGTTATCAGAATTTGTTATTCCGCACAACAATTGGTATCAGAGCCAAAATCGGCATTTCGGACCTCTGTAAAAGTGGTCGAAATTGATTTCTGATTGCACCACCTTGTTCGTCTCCTCGAGACGAAACTCTAGCATCAAACCGCGTCGAAATCGGACTCCGAACGAGCTCACACGAGTTGCGTGAAGTCGGTGACGCGTCTCTGTTTCGCGTCTCTGTAAATTTGAGGAAGACGAACTGTTCATTGGTAAATTACAGTTTCAACCCCTGAAGTTTCTGTTATTTACATTTTGGTCCTTAAAGTTTTGATAATTACAGTTTGGTCCTTATATTTTCTAAAATTATAGTTTGGTCCCTGTATTTTCTAGAAATTACAGTTTGGTCCCTGAAGTTTTAAAAATTACAGTTTAGTCCCTGTAATTTTTGAAAATTGTATTTTAGTCCCTGAAATTACTAAAAATTTCAGATTGGTCCCCAGGAGTTCTAATTTTGACAAATTGGCCCCACAAGTTTCTGATTGTGACAGATTGGCCCCAAAAGCTTTTGATTTTTTCAGTTAAGCCCTTCTTAAGTTTTTTCAGCATTCCGGACTCACCTGTGTGGTCAAAATTTGCATATTTTGATCCTATATATCAGTTTGGGTGGAGTTAAGTTGTTTAGATGGAAGAAGATAAAATCACTAGCACTTCCACTAGCACTTCCGGTAGCTCTGGGCATAGGACTACAATGTCCAATGCCAAATTTGAAGTTGAAAATTTGATGGGACAAATAACTTTGGCATGTGGCAATGCGAAGTTTTGGATGTCCTAATTCAACAGGACTTGGATATTACTCTGGAGGCCAAGCCAGAGGACATGTCAGAGAAAGATTGGGCAAAATTGAATCGCCAAGCTTGCGGTACGATCAGACTTTGTCTTGCAAAAGACCAGAAGTACTTTGTTATGAAGGAGACCTCAGCAAAAGAATTGTGGGGCAAACTCGAGAACAAGTACATGACCAAAAGCGTTGAGAACCGGCTCTATCTGAAGAAGAAACTCTTCCGGTTCCAATTCAAGCAAGGTACGTCAATGCATGAGCATTTAAATGCATTTAATAAAATTTTGGCTGATTTGCAAAATTTAGACGTAGAAATTGACGATGAAGATAAAGCTCTTTTATTGTTAAATTCCTTGCCTGATACGTATGAGCATTTGACTACTACTTTGCTGTATGGTAAAGATGAAATTAAGTTTAACGATGTTTCAAATGCTTTGATGAACAACGAGGTGAGAAAGAAGGATCAAGACGCTCACCGGGAATTAAGTTTAAATGCATTGACAGCAAGGGGTAGGACGAGTACCCGAAAATCTGGAGGGGATGGAAGTCTCGCTCAAAATCAAGGAAAAAATCATCCGAGAGACGGCAGCTTGCAAAGGATGAGTGTGCCTATTGTCATCAGAAAGGCCACTGGAGAAAAGATTGCCCAAAGATAGAAGGCAAAGAACCAAAAGCGAACATAGCTCATGATGCAGTCGAGAAAGATGACACTGCATTTACTGTTTCTTTGTCTGCTAGCCATTTTGACGAATGGATTCTAGATTCTGGTTATTCCTATCATATGTGTCCTCACAGGGACTGGTTCTCGAGCTTTGAAGAGCTCGATGGAGGAGTTGTTCTAATGGGAAATGACAACGCCTGCAAAACGATGGGAATTGGCACAATCAGATTGAAGATGTTCAGTGGAACCGTCAAGGTTCTTACTGATGTTCGCTATGTACCAGATTTGAAGAAAAATCTCATTTCATTGGGAGATTTTGATTCAAAGGGGTACAAGATTATCTTGGAAGGTGGAGTTCTGAAGGTTGTTCGTGGTGCTCTTGTTATTTTGAAGGGCACTCGTAGAGGAAATCTCTACTTCCTCGATGGGAGTACTGTCACAGGGAGAGCTGCTGTCTCCAACAGTTCAGACGAATCAGACACTTCCAGATTATGGCATATGCGATTGGGGCATACTGGAGAAAAAGCTTTGCAAACTTTGGTACGTCAAGGAGTTCTGAAAGGAGCTAAGACTGGAAAAATTGAATTCTGTGAGCATTGTGTGCTTGGCAAGCAGACAAGGGTGAAGTTTGGCACAACAATTCATCAGACTGAAGGCATTTTGGATTATGTTCATTCCGATGTCTGGGGGCCTTCTAAAAATGCATCTTTGGGAGGCTCACGCTATTTTGTAACCTTCGTTGATGACTTTTCTAGAAGAGTTTGGGTATACACGATGCGGCACAAGGATGAAGTCCTTGAAATCTTCTTGAAATGGAAGAAGATGATCGAAATCCAGACTGGTAGAAAGATCAAGAAGCTCAGATCTGATAATGGTGGAGAATACAGGTCAGATCCTTTCTTCGATGTTTGTTCCAAAGAAGGGATTGTCAGACACTTTACTATTAGGGGCACGCCGCAACAGAATGGAGTTGCAGAAAGGATGAACCGCACCTTAGTAGATAAAGTTCGATGTATGATATGCAATGCTGGTTTGAGCAAAGCATTTTGGGCTGAAGCAATAAACTATGCCGCACACCTTATCAACAGACTTCCTTCCACGGCTATTGAAGGAAAAACTCCTATGGAGGTATGGTCAGGAAAATGTGCTACTGATTATGATAGTCTTCACATATTTGGATGTCCTGCATACTTTCATGTAAAGGAAGATAAGTTGGATCCCAGAGCCAAGAAAGCTATCTTTGTAGGCTTTAGCACTGGGATAAAAGGATACAGACTATGGTGTCCCGAAATAAAGAAAATTATTAACAGTCGGGATGTTACATTTGATGAGTCTGTGATGCTGAAGAATTCTGAGAAAGAAAATCTGAGTCCTACATCCACCCAGCAGGTGGAGCTCGTGAGTCCTGTAGTGCCAACTAAAACTGTTCAGACAGTTGATATTCCTGACGAGGAATCTGATGATATCGACACTACACCAGATCTGAAAGAGGCTCAATCTTCACAACCAGCAGAATTCATCGCGACGAGTAGGCCACAACGAGTGATTCGTAGACCTGCTCGATATACTGATACTGTGGCATATGCACTTCCAGTGATTGAGGGAGTCCCATGTACTTACAAAGATGCTGTGCAGGGGACTGAAAATCCAAAATGGAAGAGGGCCATGGATGAAGAAATGAAGTCGCTTCACAAGAATCAAACTTGGGAGTTGGTGCCGCTGCCCAAAGGAAAGAAAGCGATCGGTTGCAAGTGGATATATGGCAAGAAGGAAGATACTCAGGGAGTCAGATTCAAAGCTAGATTGGTGGCTAAAGGCTACGCACAGAAGGAAGGAATAGACTACAACGAGGTATTTTCTCCTGTTGTGAAGCATTCGTCTATTCGCATTTTGCTAGCTTTGGTTGCTCAGTTTAATCTTGAGTTAGCTCAACTCGATGTCAAAACCGCTTTTCTACATGGAGATTTGGAAGAAGAGATTTACATGTCACAGCCAGATGGGTTCCAGGTGCCTGGAAAAGAACATTTGGCATGTCGGTTAAAAAAGTCTCGAAGACAGTGGTATAAAAGGTTTGATTTGTTCATGGACGAGCATGGGTATACACGGAGTCAGTTTGATCATTGTGTATATTTTCGCAAACTCCAAGATGGTTCCATGATTTATTTGCTCTTATATGTGGATGATATGTTAATTGCATCTAATAGCAAGGTGGAGATTGACCGATTGAAAGCTCAACTCAGTCGGGAATTTGAAATGAAGGATCTTGGCGAAGCCAAGAAAATTTTGGGCATGGAGATTAAGAGAGACAGAGTGAAAGGTACAGTTTGGTTGACTCAATCTCAATATCTGAAAAAGGTTTTACAGAGATTTGGAATTGATAGTTCAACTAAACCTGTTAGTACACCGTTGGCCTCTCACTTCAGATTAAGTGCTTCTATATCTCCTCACACAGAAGATGAGCGAAAGCATATGGAGAATATTCCTTATGCTAATGCTGTTGGTGCCTTGATGTATGCAATGGTTTGCACAAGCCCAGATATTTCACATGCTGTTAGCATGGTCAGCAGGTATATGCACAACCCAGGAAAAGTTCATTGGCAGGCCGTGAAATGGATTTTACGCATGGTTATCAAAATCGCGATCCGGATCGTAGGATCATACGATCCCACGATCCCAAATGGTTGAATCGATCCGGATCGATAAAATAATCGCAGTGGGATAGGATCGTGATAGGATCGTTACAGGATCGTATAGGATCGTATGGGATCGTATAGGATCGTGACAGGATCGTAGTAGGATCGTTAAAGAATATAAGAATAAGAATTCTTGAATTTTTGTACTTTTGAATTCTTATAAGTTCAAACTATTAATATTTTATATGTTACTTTAGGTGCATTCAAAGCAAATAAATCGTTGACACCAAAAAAAATTGAATGATTTGGTTTTTGTTTTGCACAATTTGAAATTGAGACAAAGGCATTTTTTTCTTTTTGATATTTTAACTATTTTTTATATAATTTATGTTCATTTTCTATTAATTTTGAAGTAATTATCATAAATTAAAAAAATTATTAACCTTTTGCTCCTATTTGGTAGGATCTTACGATTCTCGATCCGATCCTACGATCCGATCCGAAAGGCCCCAAAACGATCCAAGGTAGGATCCCGATTTTGACAACCTTGATTTTACGATATATTCACGGTACAGTCAATGTTGGTTTGAAATTTCAGAGGGACAATAAGTCAAGTCAATATTCAGTTGGGTATGTTGATTCAGACTATGCCGGAGATCTTGACAAGCGAAGATCCACCACTGGTTATGTGTTCACTATGGCTGGTGGACCAGTATGTTGGCGATCTACTCTTCAGTCTACAGTTGCTTTGTCTACTACTGAGGCAGAGTACATGGCAGTGACAGAAGCCTTCAAGGAAGCAATCTGGCTTCATGGTTTGATAAATGATTTGGGAATTGATCAGGAGCATGTTGATGTCTATTGCGACAGTCAAAGTGCGATTTGTTTGGCTAAAAACCAAGTTCATCATTCCCGCACCAAACACATTGATGTTCGGTTTCATTTTATTCGAGAAATTCTGAATGAAGGAGATGTACTGCTTGAGAAGATCAGCACCAAAGACAATCCTGCTGATATGTTGACGAAGGTCGTATCTGGAATCAAGTTTAAACATTATTTGAACTTGATCAATATTTCTGAGCAGCATGGCGCCTAACGGCGCATTGGTGGCAGCATCACTCAAGTTGGGAGAAGTTTCGCCAAGGTGGAGATTGTTGATTTGTTGGCTAAATTCTTTTGGGCTCAAGCCCAATGCTAATTCTAGGCCCAAGCTTAGGCCCAAGCCCACAGAGAGCCATTGTCAAAGTTGCAGCTTCTTCTCTTGTTGCTGCCGACAGAGGAAGTAGTCGGCCGAAAGAGGAAGAAGCCATTTGTCAACAATGGTGGCACCTCCCCTCCCAAGTCAAGCTTGGTGAGGTCATTGCTTAGGTAATTCTGTCCCTAGCCTTCTCTATATAAAGCTGCGATGATAGAGTAAAATGGCAGGGCAGAAATTAGAGAAAAATCAGAGAGAGTAGAAGGGCAGAGAGCTTGAAAGAATTCTCTCAAATTGTATTTGTATTTGTTTCTCTCCATATAATAGAATTGCTGCCACCCGAGAACGTAGGCAACATTGCCGAACCTCGTAAATTGTGTGTTTGTGTTGGATTTGTTAGTGTGTTATCAGAATTTGTTATTCCGCACAACAATTTTGTCACATACTCACCCTTTTATTTTATTTTTTTTCATTTTTAGTGCCCCCGGAAGAACTGTACGCCACTCAACTCTCACAGCTACAAGAAATGGGTTTCTTTGATACCCGAGAGAATATACGGGCGCTGATAGCCACTTCAGGGAATGTTCATGCTGCGGTGGAGCAGCTGTTGGGGGAACCTTGGTCAGTAGATAATAATCATTTGTTATTGTCCTATTCGTCTCAACATTTATTGTCTGTCGGGCCGATGAAATTGGTTTGGACCGGACTAAAGAGGATTTTTCAAAACCTATCTTGGCTATGAATTAAAAATATAGATTCGATGTTCTGAAGTTCTTGACATAAGGTATGATTGTGGGAATACCCTCTTCTATTCCCCACCCTAATAGTAAGGTGAGTGATATGTACATACACTATTAT
>URS000039472C misc_RNA from 1 species 
TTGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGTGCGGGCTGCCTCCGGGCGCCCAACCTCCCACCCGTGACTACCTAACACTGTTGCTTCGGCGGGGAGCCCCCTAGGGGCGAGCCGCCGGGGACCACTGAACTTCATGCCTGAGAGTGATGCAGTCTGAGCCTGAATACAAATCAGTCAAAACTTTCAACAATGGATCTCTTGGTTCCGGCATCGATGAAGAACGCAGCGAACTGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAGTCTTTGAACGCACATTGCGCCCCCTGGCATTCCGGGGGGCATGCCTGTCCGAGCGTCATTGCTGCCCTCAAGCCCGGCTTGTGTGTTGGGTCGTCGTCCCCCCCGGGGGACGGGCCCGAAAGGCAGCGGCGGCACCGTGTCCGGTCCTCGAGCGTATGGGGCTTTGTCACCCGCTCGATTAGGGCCGGCCGGGCGCCAGCCGGCGTCTCCAACCTTATTTTTCTCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAA
>URS00020CB488 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAGACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGTGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATGGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCAGAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGTGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS0000A7B684 snRNA from 1 species 
GTGCATGCTACAACTTCTTGAATCCACATGCACATATACTAATATTAGAACGGTCTAGAGAAGATTAGCAGGCTTCTGTAAAAGGAAGACATAAAATTTCTGAAGCATTTCAATAGCAT
>URS0000077F17 rRNA from 1 species 
CGTGTAGGCGGCCAGATAAGTCCGCTGTGAAAACTCGAGGCTCAACTTCGAGCTGTCGGCGGAAACTATCTGGCTAGAGTCCGGAAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGACGGTACTGACGCTGAGACGCGAAGCGTGGGAGCGAACA
>URS0000CF0C65 rRNA from 1 species 
GTGTCAGCCGCCGCGGTAACACGTAGGAGGCGAGCGTTATCCGGATTCACTGGGCGTAAAGCGCGTGCAGGCGGTTTGGTAAGTTGATCGTGAAAGCTCCCGGCTCAACTGGGAGAGGTCGGTCAATACTACCGAACTAGAGAGTAGAAGAGGAAGATGGAATTCCCGGTGTAGTGGTGAAATGCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGATCTTCTGGTCTATTTCTGACGCTCAGACGCGACAGCTAGGGTAGTAAACGGGATTAGAGACCCCGGTAATCCTAGCCGTAAACGATGTGAACTTGGCGTCGGTGGCTTAAACACCATCGGTGCCGAAGCAAACGCGATAAGTTCACCGCCTGGGGACTACGGCCGCAAGGTTAAA
>URS00022DC966 tRNA from 1 species 
GCTGCAATAGCTCAGATGGTAGAGCGGCTGCCTTGTAAGCAGCGGGTCGCGGGTTCGATGCCTGCTTGCAGCACCA
>URS0001ACB2BC rRNA from 1 species 
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCATGCTTAACACATGCAAGTCGAACGAGAAAGTGGGCTTCGGCCCGCGATTAAAGTGGCGGACGGGTGAGTAACACGTAGGAATTTTTCCTGAAGTGGGGGACAACTCCGCGAAAGCGGAGCTAATACCGCATAATCTCTACGGAGCAAAGCAGGGGATCGCATTTCGGTGTGACCTTGCGCTTTAGGGTGAGCCTGCGGCGGATTAGCTTGTTGGTAGGGTAACGGCCTACCAAGGCGACGATCCGTAGCCGGTCTGAGAGGACGATCAGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTGCGGGTTGTAAAGCACTTTCAGTAGAGAAGAAATGCTCAAGGTTAATACCCTTGAGAGTTGACGTTACCTACAGAAGAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCAAGCGTTAATCGGAGTTACTGGGCGTAAAGCGTGCGTAGGCGGATATTCAAGTCGAGTGTGAAAGCCCCGGGCTTAACCTGGGAAATGCGCTCGATACTGGGTATCTAGAGTATGGTAGAGGAAAGTGGAATTTCCGGTGTAGCGGTGAAATGCGTAGATATCGGAAAGAACATCAGTGGCGAAGGCGGCTTTCTGGACCAATACTGACGCTGAGGTACGAAAGCGTGGGGAGCAAACAGGATTAGAGACCCTGGTAGTCCACGCCGTAAACGATGAGAACTAGACATTACCTTGCACTTATTTTTATCGAATGGTGAAAATAAGTGCGGGGTAGTGTCGAAGCTAACGCGTTAAGTTCTCCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCTACGCGAAGAACCTTACCTACCCTTGACATCCTCGGAATCCTGTAGAGATACGGGAGTGCCTTCGGGAATCGAGTGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCTTAGTTGCCAGCCTCACTTCGGTGAGAGGAACTCTAAGGAGACTGCCGGTGATAAACCGGAGGAAGGCGGGGACGACGTCAAGTCATCATGGCCCTTACGGGTAGGGCTACACACATGCTACAATGGGTAGTACAGAGGGTTGCCAAACCGCGAGGTGGAGCTAATCTCACAAAACTACTCGTAGTCCGGATTGAAGTCTGCAACTCGACTTCATGAAGTCGGAATCGCTAGTAATCGCGAATCAGAACGTCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGAATTGTACCAGAAGCGGGTAGGATAACCTTCGGGAGTCCGCTCACCACGGTATGATCCATGACTGGGGTGAAGTCGTAACAAGGTA
>URS000199E147 lncRNA from 1 species 
GGAAGTGGTTCTTAGAGGCAGTGTGTCTCCCTCTGGTGGCAGAAAAACTGGACCACAGGCTCGAGAGCAAACCACAGTCCCCTCTCGCTGCGTCCAGCTCTGTTATATAAAGCAAAAGAAACGATTTAGGAAAATAAAGACAAAGCGTCTCCTTTATAGACATATGAGCACCAATGAGCTGCGGCCTCACACCGCTGAAGGTAAATTTGTCCTACAAAGTTCAAGACTTCCTTTAGGTGACCTCAAATAAATGGAAAAGCTGTGTCTCACTTACAGAGAAGGCTTTTCCATGTTGTTTGTAAAGTAAATAACAGTCAGTGACCTAAACACGCTCACCTTCACCACGGATGCACAGTCCTCTGGATTTTTTACTTGCTAGCAACAAAATACTGAAAACATAGTGAGCTCATCTCCATGACAATGTATCAAACCTAAACCAACACATAAACACTTTAACACAGTACATTTGATAAAGCTCTAGATTTAATGCACATTCATGGGATTTTCTTTTATTAAACCTCTTATGCAGTCATATATAATAAAGCACTAACCTGAGGCTGATGCCATAAAGACTCCTGCCTGCTAGATACAACATGCCCGACTCCTTCAGCTCAGCCACTGCTTCAGGGGAGAACTTCACAACACAATTTGCATATAGCATAAGATCAGCCTTTTACTTTGTGCATGATGCAAACTTTAGTTTTCACTCTTTATTCAAGTAACAGGCCAGATGGCAAGAAAATCCACAGAGAGACACGGCAGCGGCACACCTCGCTTCCATGTTGTGACAACAGCAGCTTGTTTTAATGCTGAAACCTGCCCCTTGTAGGTGTGCACCAGGTAGGAGTCCTCTTTAAGACCTTCAGGTCTTTCAGGGAGCAGATGAGACACAGATGATCATGAGGCGGTTTTTCCGAGCACACCGGGACGAGGACTTCAGTCAGATCCAGTATCTGACGGCCAAGTGCACCCGCTTAGCTCATGACAAAGCGGTGTTGGACAGAGAGTTTCTGGTGTCCCGAGAGAGGGAGAGAAGGCTGCAGAATGATCTGGAAGCTGTGACCGCCCGACTCCTCGAGCAAGACCAGCTCAATATGGAACTCAGGATGAACCAGACCCAACTCATCAGCAGGATCCAGCAGCAGCAGGACCTGGTGAACCTGCTTCGGCAGCGCGTGGTCCTGCTAGTGGAGGCGAGCTCCCGGGATGCAGAGCTACTGCGGCAGGTCGGCGCAGAGCTGCTTTGCCTGCAGAGCTCTGAGGTGAAGCTGGAGGGCCTGGTGGAGGAGCTGCAGGCTGAGGCCCAACATAGAACTGAGGTGGCAGAAAATCTCCAGACAGAGCTGTATGCTGAGGCCCGGCACAGAGCTGCACTCACTGAGAGCCTCCACGCAGAGCTGCGCAGTAAGACAGTGGAGCTGGAAAAGCTAGAAGAAACTAACAGGACGCTGACAGAAGAGCTGACGGATCTGCGCAGAACTTATCAGAAGGAGGTGAGAGAACTGCAGCAGGAAAATGAGGGAAGCCTGAGGAAACTTCAGGAGACGGCAGAGCAGTTCGAGTGGCTCTGTCAGCAACAGCGTTACTGGATGTCTTGTGTGAAGAGGTTCAAAGACTGCCTCATGGAGGAGAGAGAAGCTCTGCTGCGACAGGTCAGCAGGTTGGAAAAGAAAGCTGAGAAACTAAAGCGTTCACACGACGGCAGTCCAACACGGAGGCTTGTCTGCCCCCTTCAGGACGCCGAGAGCTGTGACAGCAGTATAACATCATGGGAGGCAGATGCAGTGACCAACCTGGAGTCTCAGGTGGAGAAGTCAAACGTGCTGTATGAAGAGCTCCTCGACCAGGCAGGGAGCCCTATCAACGGATACCAAAAACCTCCATGAGGACAGAAGCCTGGATGTCTTTGCTTTCTTTTCTCACCTTCTGCAAGCCAGGAGATGCAATGTTTTATGTGTTTGTGGTTAGCTTACCTTCCAGTCATTGTTTTGAAAAACCAAACACCCTTGGAAAAACACACCCGTGAAGCCACACACGCATTGTTTTGTTTCCACTATTGTTCATTGTGATATATGACCGAATTAAAATACAATGTGCTCCTGTCCCGCTTTTGGTGTCACACATGCACATCACATGTGCCTCGAGTCTGTCTGGTCACATTTTTCAGTAATTGTCCATTGTTCAAACCTTGTAATCAACACCACTAACAAGAGCACAAGCACCTGCAAATGTTCTCTTTTGTTGTTTTGCCAATGAAACGTTGCAGGACAACCAGCAGCTGGCGTGCAGAGGAAGCAACAAATGTTCTTTTCAACAAAATGAAGCTATACTGATTATCCCCCCACTGGTACAGCTTGACTCTGATGATCAGATCTCTTCATTCATCAGTTTGCATGTGGCTCACATTAAACACAGTGACTCAGACGCTTTATCATATGTGAACCATATGATACACACATATTGCAAACGCAGTTTACACACGGTGAGCCAAGACTTTTAAAGTATGCATTGTGTCACACTACAAACATTACACTGCAATCAACATGAGGAGCTACACGTTTATTCAGGACTACAGCAAACTTTCAACATGCATAAGAAATCTTAACATCACTAAACCATTAATGACACTGGAACCATCATTATATTTCATCGGTGGTGCTGGGACAACATTTTTTTCTTTGCCCACCTTAAAGTTAGCATGACAGGGGTTCGTTTGACCAACAGTGGACAAGAAGGCCTGTGTGACTTAAGCTTTGACTCCATGATCAATAGGCTTTACACAAACTACACCACAGTCTCATAGCTTTAATGGCACGACCACCAAGCTCCTGCACTCAGTCCGATGATGCTGAATAGCAAACATTTGTTTGCAAATATCAAACATATCTAAAACTTTGGGTATGTTGCTACATTTTATGTCTAAATCTCACAACCAAAAACCTGCTGACTTCATGATGAGTGAACCATTACAGTTCTTACTGGTTTCAGGGCTTGATCCAGTATTTGAGGTAATCAGTTTTTAGCCTGGAAATATTGCTAATTCTCTATGTGAAATAAAAATAATGCATATATATATATGTTCATAACTTACATGATTAAGTTATGTTGGCCCATAGCCTATCAGATCATAAATTTACATGGTGTATTGCAGAGGAGAGATAGTTGGGCATTAACCTATGAACTTTGTTATAAAAATGAAATTCCACATTTCAGAACTGGAGGACATATTGCGACTAAATCACACCAGGACCACATTCATCTTAGAGCTCTGCCTTTGCTTCATTGTAAAACCCCCATATCGAAAGGTTTCTTGACTCTTTTGCTTAGTTGTTATGGTAACAAAGTGACAGAAAAGGCAGTGACTGAATTGGTAGTTTATGCTACCGTAGCATTCTTCCTTTTGCCAAATGAATGTTTGCTCTTTAAAAATGAATTAATAACAGGTTACAAGCCTGTCTGACAGCAAATAAAGCTCTTAACATCCACCTCAGTTCTATGAAGCAGAACTTTGTTTTGTCCAGGTAACTTTAGGGTAACCCTGG
>URS000201C513 misc_RNA from 1 species 
GATGAAGAACGTAGCAAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCGCCAGTATTCTGGCGGGCATGCCTGTTCGAGCGTCATTTCAACCCTCAAGCACAGCTTGGTGTTGGGACTCGCGTTAATTCGCGTTCCTCAAATTGATTGGCGGTCACGTCGAGCTTCCATAGCGTAGTAGTAAAACCCTCGTTACTGGTAATCGTCGCGGCCACGCCGTTAAACCCCAACTTCTGATTGTTGACCTCGGATCAGGTAGGAATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS00025EF403 lncRNA from 1 species 
GTGTTCTTCACTTCATGATGGAAGGGCTACTGACCCAGAGTGGAAAGTTTAGCTGGTGTTTTGATCAGGATTTCTTACCTTTTTCTTCATTAGAGAGATTCTTCTTGCTGCTGTCCTGCTTCAGAGCTGCAAGGAACACTTGGGAATGACTAAAGCGGTGTCTGTGCTGGAGTCAGAGGAGTGGCAGAGCAGGAGGCACATCTGTCTGTCGCCTTGCCTGCTGAACAACAAAGGCAGTGCTTCATAGCAGCGTGGCTTTTGGATAGGTAGCCCAAAAAAAGCAACCGTGATCAGAAATCTGGGTCGTTGTGCTTCCCCTGAGCAAGCAAAGTTAAAGATAGCTTGGGAGACGTTTGCTGCTTCTCCTGCCTATTCCTGCTGACATCCGTGGGGATTTGCTGGCATAGTGAGCTACAGGCTGGTGCACTTCAGAAGAAAAGACTCTTCATCATCCGTTCCCCAGCTAGTATCCTGGGTGGCTCTCTTCTGCTGTGTTTCTCCACCAGTTGTGGTGCCCTACAGTGTGTAACAATTCTTGTGGCTTCCAAGTAATTATTTTCAAACGCATATGAAGTAACTGAAACTGTCTTGTAAGAAGAAAAAGAAGTTCCATGAAATCTGATGCTGTGTTTAGAGGATGTTGGTGTGTTCTCAGCAGGTGCGCTTTGCCTACATGTGGATCCTCAGGGTGGAGTTTTTAATTGTTAAATGATATATGACGAATCAAATAGCACGTACAAAAGACAAAGGAAAAGAAGACGAGAAGGTAGAAAATGGGAATTCAGGGACTGGTAAATGTTCTGCACACCAACTCACAGAGTGCATTTCTAGTTTGAATGCCAGTGCCTTGCATCAGCTGGAAGAATAAGTTGATAGCTTCCTGATGCTGCTGTTCATTTGCTTTTTATTTGAGTCTGTTTTCACATGGATTATAAAGTACTGCAATCCTTTTCCTGTAAGCCTGAATGCAGAATTACATCACTTGTTTGTATGCAGTACATAGAGCTAAAGTCTCCTGGGAAATGACAAGTCGTTAGCCTGACTACTTAATCATACTGTGATATGAAGAAAAATATTTGTAACTTCACAGTCTGCCATAGAACATCTTCATGCTTTATAATGGTGTGCTCCAAATGAGAAACTGCTTAACCTTGCTTTGCAGTTCTCTCATTGTTCTGGAATTGTTGTTTGAGCAATGAAACTTAATTTGCAGTGCAGAACTATTTTAATAATAAAGAACACTTGATTTCAT
>URS0000CAA0FA rRNA from 1 species 
CCTACGGGAGGCAGCAGTGGGGAATCTTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGGAGGAAGAAGGTCTTTGGATTGTAAACTCCTTTTCTCGGGGAAGAGTAGGGACGGTACCCGAGGAATAAGTCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTTTCAAGTTCGACGTGAAAGCTCCCGGCTCAACTGGGAGAGGTCGTTGAAAACTGAGGAACTTGAGGCAAGGAGAGGGGTGTAGAATTCCCGGTGTAGTGGTGGAATGCGTAGATATCGGGGGGAATACCAGTGGCGAAAGCGGCACCCTAGCCTTAGCCTGACGCTCAGGTGCGAAAGCGTGGGGAGCGAACGGGATTAGATACCCTAGTAGT
>URS00005B6C50 rRNA from 1 species 
TACGTAGGGGGCGAGCGTTGTCCGAATTTACTGGGCGTAAAGCGCGCGTAGGCGGGTCAATAAGTTGTGGGTGAAATGCCGAGGCTCAACCTCGGCGCTGCCTGCAAGACTGTTGGTCTTGAGGTATGGAGGGGAAAGCGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGATGGCGAAGGCAGCTTTCTGGCCATATCCTGACGCTGAGGTGCGAAAGCCAGGGTAGCGAACGGGATTAGATACCCCGGTAGTCCTGGCCGTAAACGATGGATACTAGGTGTTAGAGGTATCGACCCCTCTAGTGCCGGAGCTAACGCATTAAGTATCCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATACGTCACTAACCGTAGGACCTTACCCAGGCTTGACATCTGGAGTAAGTCCATGAAAGTGGCACCCCTGTATGGTAACATACAGCTCCAAGACAGGTGTTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCATTCCATGTTGCCAGCGTAAAGTCGGGAACTCTTGGAAAACTGCCCGTGTAAGCGGGAGGAAGGTGGGGATGACGTCAAGTCAGCATGGCCCTTACGCCTGGGGCTACACACGTGCTACAATGGACGTGAACAAAGGGCAGCGATACCGCGAGGTGGAGCTAATCTCACAAACACGTTCTCAGTTCGGATTGCAGTCTGCAACTCGACTGCATGAAGTCGGAATCGCTAGTAACCGCAGGTCAGCTAAACTGCGGTGAATACGTTCCCGGGCCT
>URS0001C9C972 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCCGAGAGGGTGGCCGGGCCCCATGGGCCCTGGGGACGGGCCAGGGCGCTACAGGGGGCAAGGGGGGGGAAATTTTGCCAAAGGGGCGGAGCCCGTAGAGAGCAACCCCGGGGGGGGAAGGCCGCCTTTGGGGTGGAAAACCCCTTTCGCCTGTACCGAGGCGGGGGGGCGGTTATTGGTGAAAAAGCCCCGGCTAACTTCGTT
>URS0001CC6C7B rRNA from 1 species 
GTGAACGCTGGCGGTAGGCCTAACACCTGCACGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACAATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS0002105CC3 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGAGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGTAGGGTAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTAGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS00025E055D rRNA from 1 species 
ATGAGTTCCTTGCCCTGTGGATGCAAGTCACGGACATTCATCTTGACTGAGATGCCACAGACTCAATCTCCCGGTCTTGGGAAACTAGTGGTGACTTCTCTACCAAGACAACATACATGGCGAAGTTTTGGAGAAGACAAGTGTTGCCCAGGCCTGCCTTCACTTCGAAAGCAAGGGCCCCGTTGCAGTGCCATTTTTTTTGCATGGCTTGCACTTCTAACAGATGTTGGACTTCCGACCGCCTGGCATGCCGTGGCTTGGATCATCAGGAGAGTTGCCCTTTCTATGCATGGGAGAGGAGAAAACAATCGAACACATACTGCTTTAATGTGTCATCGCAAGGGAGGCGTGGACCATCATATGTCGAGCTCTAGGCAAAATGGATTGGGTACCAGAGATAGGATCAAAGTTGGTGGATTGATGCACAAACAAGCTTAG
>URS0000DB583F tRNA from 1 species 
GGGTCCATAGCTCAGTGGTAGAGCATTTGACTGCAGATCAAGAGGTCACCGATTCGAACCCGGTTGGGCCCT
>URS0002538569 rRNA from 1 species 
ATGAGCAGCCGGGCTCCCAAGTTTATGCAGAACGTGCGCAGCTTCCCCGATGGTAAGCGCAACTGCTACAAGATTCGGTCCCTGGTGCGCGGGCTCAAGTACATCATCCGAGCGTGGTTCTTGTACGGCAACTACGACGGCCTTAACACATCGCCCATGTTTGACCTCTACATCGGCGCAAACTTTTGGACGACGGTGAACATGTCAGGGGGGCCATCGGACACTTATTTAACTGTAGAGGCCATGGTGGTCGTGCCGGACGACTACGTGCATGTCTGCCTGGTGAACACCGGCGATGGGACGCCGTTCATCTCGGCCCTGGAGCTGAGGCCGCTTAAGAGCATGCTCTATCCACAGGTGAGCCCGAAGCAGGGCCTGAACCTGCACCGCAGGTTAGACCTCGGCACGGGGAGTAAAACGCGCGTAATAAGGTACCCTGATGACCCACATGACCGAATATGGAGACCAGTGGATACCACCGCAGAATACCCCAGCATCACAACGTTTAGAAGGGTGCAGAACCCAAACGATGACCTTTTCCAGGTGCCGACGGAGGTGATGGAGACAGCGATGACTGCCCGGAACGCCTCCGCGCTCATAGAGATCACCATGCACCCTCAGCCTCAGCGCAACAACCCGTCGCCCGGGTACATTGCTGTCCTGCACATCGCGGAGCTAGGCATTCTCAGAGGCAACGCCGTGCGCCAGTTCTACGTCAACGTCAACGGCAAGCGATGGTACCCAGATGCTCTCACACCGAAATACCTCTCCAGTGGTGCCATCTACGGTGCCATTGTTCCCGATCAACAAGGCACCATCACCATTTCCATCGAAGCCACTGCCGGCTCGACACTGCCGCCGATTGTCAATGCTTTCGAGAGTTTCTCCGTCATGCCCACCACTAAAGTCGACACCGAGTCCGAGGAGGGTACGCCCTCGCCCACTCCCACCACTAACGCCGGGTCCAAGGATGGTAACTTCGGCTCCAACAAGTCCGAGGATGACGTTTGCATCGGTGGCAGTTCATGCAAGAAGAGTAATAAGCTTGTCCTCTACATAGCCGTCCCTATAGCCGGGCTTGTGGTGATAGGATCGGCGGCACTACTAATCTTTTGCTTGCTAAGACGGAAGAAGCAAGGATCAAGATGA
>URS00008935E5 rRNA from 10 species 
AGTCGAGCGAATGGATTAAGAGCTTGCTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAATATTTTGAACTGCATGGTTCGAAATTGAAAGGCGGCTTCGGCTGTCACTTATGGATGGACCCGCGTCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGCTTTCGGGTCGTAAAACTCTGTTGTTAGGGAAGAACAAGTGCTAGTTGAATAAGCTGGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGCAGGTGGTTTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGAGACTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACACTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGAGGGTTTCCGCCCTTTAGTGCTGAAGTTAACGCATTAAGCACTCCGCCTGGGGAGTACGGCCGCAAGGCTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGAAAACCCTAGAGATAGGGCTTCTCCTTCGGGAGCAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATCTTAGTTGCCATCATTAAGTTGGGCACTCTAAGGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGACGGTACAAAGAGCTGCAAGACCGCGAGGTGGAGCTAATCTCATAAAACCGTTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGGGGTAACCTTTTGGAGCCAGCCGC
>URS0000FCD8C1 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTTGTAGGCGGTTTGTCGCGTCTGCCGTGAAAGTCCGGGGCTCAACTCCGGATCTGCGGTGGGTACGGGCAGACTAGAGTGATGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAAGAACACCAATGGCGAAGGCAGCTCTCTGGGACGGTACTGACGCTGAGACGCGAAAGCGCGGGGAGCGAACAGG
>URS000055AC24 piRNA from 1 species 
TGACAAGTCCCAAGCGATAATACAGGCTA
>URS000027137F rRNA from 1 species 
CCTGGCTCAGGACGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGAGTTCTTGTGATTGAAGCTTCGGCAGATTTCACTTGAACTTAGTGGCGGACGGGTGAGTAACGCGTGAGGAACCTGCCTTCCAGAGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATAATGCAGCGTGGTCGCATGACCGTGCTGCCAAAGATTTATCGCTGGAAGATGGCCTCGCGTCTGATTAGATAGTTGGTGAGGTAACGGCCCACCAAGTCTGCGATCAGTAGCCGGACTGAGAGGTTGAACGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGGGCAACCCTGACGCAGCAACGCCGCGTGAAGGAAGAAGGTCTTCGGATTGTAAACTTTTGTCTTATGGGAAGATAATGACGGTACCATAGGAGGAAGCTCCGGCTAACTACGTG
>URS0001F1045E rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGCAGCACGGGTGCTTGCACCTGGTGGCGAGTGGCGAACGGGTGAGTAATACATCGGAACATGTCCTGTAGTGGGGGATAGCCCGGCGAAAGCCGGATTAATACCGCATACGATCCACGGATGAAAGCGGGGGACCTTCGGGTCTCGCGCTATAGGGTTGGCCGATGGCTGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTCGGAAAGAAATCCTTGACTCTAATACAGTCGGGGGATGACGGTACCGGAAGAATAAGCACCGGCTAACTACGTG
>URS00007CE013 rRNA from 1 species 
TTGAACGCTGGCGGCATGCTTTACACATGCAAGTCGAACGGTAACAGCACTTCGGTGGCTGACGAGTGGCGAACGGGTGAGTAAGACATCGGAACGTGCCTGGTAGTGGGGGATAACTACTCGAAAGAGTAGCTAATACCGCATGAGATCTAAGGATGAAAGCAGGGGACCTTCGGGCCTTGTGCTACCAGAGCGGCTGATGGCAGATTAGGTAGTTGGTGGGATAAAAGCTTACCAAGCCGACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGCAGGATGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACGGAACGAAAAGCTCTCTTCTAATACAGGAGGGTCATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTGTAAGACAGAGGTGAAATCCCCGGGCTCAACCTGGGAGCTGCCTTTGTGACTGCAAGGCTGGAGTGCGGCAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGGCCTGCACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCAACTGGTTGTTGGGAATTAACTTTCTCAGTAACGAAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGTTTAATTCGATGCAACGCGAAAAACCTTACCCACCTTTGACATGGCAGGAACTTACCAGAGATGGTTTGGTGCTCGAAAGAGAACCTGCACACAGGTGCTGCATGGCCGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGCCATTAGTTGCTACGAAAGGGCACTCTAATGGGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTATAGGTGGGGCTACACACGTCATACAATGGCTGGTACAAAGGGTCGCCAACCCGCGAGGGGGAGCCAATCCCATAAAGCCAGTCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGTCACGGTGAATACGTTCCCGGGTCTTGCACTCACC
>URS00018E2463 rRNA from 1 species 
GTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCAACGCCGCGTGAAGGAAGAAGTATTTCGGTATGTAAACTTCTATCAGCAGGGAAGAAAATGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGGTGGTATGGCAAGTCAGATGTGAAAGCCCGGGGCTCAACCCCGGGACTGCATTTGAAACTGTCAGACTAGAGTGCAGGAGAGGTAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACTGTAACTGACACTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGAAACCCCAGTAGTCC
>URS000076782D rRNA from 1 species 
CGGATTTCTGGGTACCGGTTAATGCGTAATATCAGAAGAACACCCATGGCGAAGCAGCCAACTGGGCCAATACTGACGCTGAGGTACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCTACTTGTCGTCGGGAGGGCTAAACCTTTCGGTGACGGAGCTAACGCATTAAGTAGACCGCCTGGGGAGTACGGCCGCAAGGTTGAATCTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAAAACCTTACCTGGCCTTGACATCCTGCGAACTTTCTAGAGATAGATTGGTGCCTTCGGGAGCGCAGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCTTTAGTTGCCAGCACGTTATGGTGGGAACTCTAAAGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTATGGCCAGGGCTACACACGTGCTACAATGGTCGGTACAGAGGGTAGCCAAACCGCGAGGTGGAGCCAATCCCATAGAGCTGATCTTAGTCCGGATTGCAGTATGCAAATGGACATGTCATGAAGTCGTCCTCTATAGTGATTCGTG
>URS0002117D6C rRNA from 1 species 
ATTGAACGCTGGCGGCGGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGCAGCTTGCTGCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTG
>URS0001747A8B rRNA from 1 species 
AGTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAGTGGAGCTTGCTCCACCCTTCAGCGGCGGACGGGTCAGTCATGCCTAGGAATCTGCATGGTCGTGGGGGACAACGTTTCGGAAGTAACGCTAATACCCATACGTCCTACGGGAGAGAGCAGGGGACCTTCGGGCCTTGCGCTATCAGATGAGCCATGGTCGGATTAGCTAGTAGGTGAGGTAATGGCCCACCTAGGCGTCGATCCGTAACTGGTCTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCAGTAAGTTAATACCTTGCTGTTTTGACGTTACCAACAGAATAAGCACCGGCTAACTTCGTGCCAGCCGCCGCCGTAACAC
>URS00004DFF5E rRNA from 1 species 
GCAGCCGCGGTAATTCCAGCTCCAATAGCGTATGCTAATGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTTTAAGGGTGTCTGCTTCTAGTGTCCTACGTGACTCTAAAGTTGCAGACTCCCCTTATTTTGCCTCAGTGCTCGGTTGGGATTCATTTCTCGATCGGGCTTCCGGGGCGTGTTTACTTTGAGAAAATTAGAGTGTTCAAAACAGTCTTGTGATTGTATATCATAGCATGGAATAATAACTGATGACGTCGGTCATTTTTTGTTGGTTCGGATGGCTGAAGTAATGATTGATAGAGTTAGTCGGAGGTATTAGTATTTTATCGTTAGAGGTGAAATTCATGGATCGGTAAAAGACTAACAACTGCGAAAGCATTTATCTAGGATTTGCTCTTTGATCAAGAACGAAAGTTGGGGGATCGAAGACGATCAGATACCGTCGTAGTCTCAACTATAAACTATACCAGCTAGGGATTGGTGGGCGTTGCTTGACCTCATCAGAACCTTATGAGAAATCAAAGCATTTGGGTTCCGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACAAGTTGTGGATCCTGTGGCTTAATTTGACTCAACACGGGAAAACTTACCAGGTCCAGACATAGCAAGGATTGACAGATTGATAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACTATTACCTGCTAAATAGTATGCCCGGGCCTTTGGCGCGGGCTTACTTCTTAGAGGGACTAGCCATCTGTTAAGTGGCTGGAAGTTAGTAGCAATAACAGGTCTGTGATGCCCAAGGGCGATTCGTTAAAACTGCAGGA
>URS00008EA5F3 rRNA from 1 species 
GGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGATTGTAAACCACTGTCGCGAGGGACGAAAATCTGACGGTACCTCGAAAGGAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGCCGGGTGAGTAGGGGGTGAAATCCCACAGCTCAACTGTGGGGCTGCCTTCTAGACTGCTTGGCTCGAGCACGGTAGAGGCTGGTGGAATTCCCGGTGTAGCGGTGGAATGCGTAGAGATCGGGAAGAACATCGGTGGCGAAGGCGGCCAGCTGGGCCGTTGCTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAA
>URS0000EF886C tRNA from 1 species 
CGGCAATTAGCCGGTCTGAACAGCAGTTCTCAACGCCCTGTTTGAACTTTCTCCAGTACCAATGGTCAGAGTCGTCGTACTTTTCAGGAAACAGCAGACTTTCTGGGTTGTTTCTGAAGAACATTCCACGACCTTGCCTATCAATGCCAT
>URS0000B48067 misc_RNA from 1 species 
ATCGCCTCCAGTTCAACCCACTGCTTGCTTCCTTATTGCCTATGCCCATCTCCCTACCTGCTCCCATTGGATCTGGGGCGCTGCCAAGTCTCAAATCCTCTTCTTTTAGCTAAGAGTTGTGTAGTTAGGGCCATAGAGAACAATGTTGTCGGTCACTAATCACTGCCCAATTTAGTTGCATTATAATTTTGAACCCGTGTTCAGACCCAGGTTGGTCCTGCCCTGCCGTCCTCGTCCTCACCATATTAGTCCATTTGGATTTTATTTGCCAGTACAAGTCATGGTCAAACTCGAGTCAAACTCTTCCTAAGCCTGTCCAAACAAGCTGTGCCAAAACAAGGACCAATAATCTCAATTTTCCCATAATACCCTCCCTTCAGACGACGTCGTTTCCTTCATTGCCTTTTGATATGCTGTGACCACATCACGTCACCTCTACTGCTCTCTTTATAAAAAGCCTAAACACGTGCTTCAACACCGCGATCCCGGAACACGGCCCTTCAGTGGCATCCTCGTTATTTGCAATCTTTTCGAGGTCAAATTCCTTACCTCTCTGTGTTTAGCTCACCTTCCCCGACCCACCCTTTCATATAACTACTCTTGCTGCCTCTTGACCAGAAACTCAGAACAAAACTTGAAGTCCGGTTCACCCTGTTTGCCTCTCGAGAAAATTTCTAATCGAGAAGAGTTTCTATCGATTAGCTTTTCTGGCTCTGTTGCAGTAGTAGTGTTGAGGGAGCTTCGTCGGAAAATGACGTCGGGGACGAGAATGCCGACGTGGAAGGAGAGAGAGAATAATAAGAGAAGAGAGAGGAGAAGAAGGGCGATCGCGGCGAAGATCTATGCTGGACTGAGAATGTATGGAAATTACAAGCTCCCTAAGCACTGCGACAATAATGAAGTCCTTAAAGCTCTCTGCAACGAGGCCGGTTGGACAGTTGAAGAAGACGGCACCACTTACAGAAAGGGCTGCAAACCTGTCGAACGTATGGACATTATTGGAGGGTCTGCGTCAGCAAGTCCGTGCTCATCCTATCACCCAAGTCCATGTGCGTCTTATAATCCAAGTCCTGGATCATCTTCTTTCCCTAGTCCTGTTTCATCCTGTTACACTGCCAATACTAATGGTAAGGCTGATGCCAATTCCCTCATCCCATGGCTTAAAAACCTCTCATCTGGCTCATCATCAGCCTCATCCAAGCACCCTTACCATCTCTTCACTCACAGTGGTTCCATAAGTGCTCCAGTCACCCCTCCATTGAGCTCCCCAACTGCTCGAACTCCGCGTGCCAAAAATGACTGGGATGACCCGGCGGCTGGTCCATCATGGGCAGGTCAGAATTATTCGTTCCTGCCCTCATCTATGCCGTCATCTACCCCACCAAGTCCTGGCCGTCAGGTCCTGCCTGATTCAGGATGGCTAGCTGGTATTGAAATTCCCCTAAGTGGACCATCATCACCCACATTTAGCCTTGTTTCACGGAACCCATTTGGCTTCAGAGATGAGCCTCTATCTGGTGCTGGATCGCGAATGTGGACTCCTGGGCAAAGCGGGACATGCTCTCCTGCTGTTCCTGCAGGTGTTGACCAGACAGCAGATGTTCCAATGCTAGACAGTATGGCAGCTGAGTTTGCATTTGGAAGTAACACAACAGGGTTAGTGAAACCTTGGGAAGGAGAGAGGATCCATGAGGAATGTGTATCTGATGATCTTGAGCTTACACTTGGAAATTCTAGGACCAGATGAGGGGGAACTGACAGAAAGGGTGAGAATGAATTATCCTCGGATTTCTTGATTTGGCTTCTTGCTTCCCTTTATGTTTCATGTCAATGACTTCATATTGTGCATGCTTCGGTTGGCAGAGAGCTGAGATAGAGGTACAGTGAGTAGGAGCACCTGTTCCTTTTTTCTTGTTCTATTATTTTTTACTTTTTGGTTTGCTTTTCC
>URS0000F753B8 rRNA from 1 species 
TACGTAGGCAGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGAGCTCGTAGGCGGTTTGTCGCGTCTGCCGTGAAAGTCCGGGGCTCAACTCCGGATCTGCGGTGGGTACGGGCAGACTAGAGTGATGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGGTCTCTGGGCATTAACTGACGCTGAGGAGCGAAAGCATGGGGAGCGAACAGG
>URS00004B85F5 rRNA from 1 species 
GATGAAGGTTTTCGGATCAAAAAGTTCTGTTGTTAGGGAAGAACAAGTACCGTTCGAATAGGGCGGTACCTTGTTGGTATTTTAACAGAAAGCCACGGCTAACTACGGGCCAGCAGCCGCGGTAATACGTAGGCGGCCCGCGTTGTCCCGGAATTATTGGCCGTAAAGGGCTCGCAGGGCGGTTTCTTAAGTCTGATGTGAAAAGCCCCCCGGCTCAACCGGGGAGGGTCATTGGGAAACTGGGGGAACCTTGAGTGCAGAAGAGGAGAGTGGAATTCCCACGTGTAGCGGTGAAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCCGCCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCCGCCCTGGGGGAGGTACGGGTCGCAAGACTGAAACTCAAAGGAATTTGAACGGGGGCCCCGCAACAAGCCGGTGGGAGCATGTGGTTTAATTCGGAGGCAACCGCGGAAAGAGCCTTACCAGGGTCTTGGACGATCCTCTGGACAGTCCTTAGAGATAGGGACGTC
>URS00022660AC lncRNA from 1 species 
CTAGAATTACTTTTCTTAGTGAATTAAGTCCATAGGAAGCAGTTTGACGGAAGTATGAGTGCCAAGAATGGTTCCAAAAATTCTGATTGGAGAATAGGACTTTCACAAATATGCCATGTGAAAAGCAACCTGTTGAGCTGGATAATGATGTGCTGAGAGTTGCTGTTGAGAGAAATCCAGAAGCAGCAATCAAGGAATTGGTCACAATTGTCCATTCATTCATTTCAACTTTCAGAGGCTTCTACAGGACTTTGATTGTGTGTCAAAAATGGATAATGAGTTTCAGCCACAAAATCTGTGACCTAGCATGTAAATATTTGCATTTCCTTGCTCTCCCATGAAAAGAGAGAGTTGTTTTTGAAAAGAGTGGTTATGGGAAATAAAAAATGTTTTCACAAATGTCCG
>URS00003A7160 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTAGAACGCACAGGATGCACCGTAGTTTACTACACCGTATTCTGTGAGTTGCGAACGGGTGAGTAACGCGTAGGTAACCTGCCTGGTAGCGGGGGATAACTATTGGAAACGATAGCTAATACCGCATAAGAACATTTACTGCATGGTAGATGTTTAAAAGGCGCAAATGCATCACTACCAGATGGACCTGCGTTGTATTAGCTAGTAGGTGAGGTAACGGCTCACCTAGGCGACGATACATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATTTTCGGCAATGGGGGGAACCCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAGCTCTGTTGTTAAGGAAGAACGAGTGTGAGAATGG
>URS0000C46E39 snRNA from 1 species 
ATCTTTGCGCTTGGGGCAATGACGCAGTTGGTGAGATGAAACCGAGACGCGTCAATTGCTGGTTGAAACTTTCCAAACATCTATATTTAGAATGTCTAATCTACAAAGATCCGGTGATGATGGATATTTCACATGAAA
>URS0001CDBEA4 tRNA from 1 species 
GCCGGGGTGGTGGAACAGGTAGACACAGGGGACTTAAAATCCCCTTCGCCGAAAGGCGAGTGCGGGTTCGATCCCCGCCCCCGGCACCA
>URS000118F557 rRNA from 1 species 
GACGTAGGGGGCAAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGCTCGATAAGTCTGCTGTGAAAGTCCAGGGCTCAACCCTGGAAGGCCGGTGGAAACTGTCGGGCTAGAGTCCGGAAGAGGCGAGTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCTGGAGGAACACCGGTGGCGAAGGCAGATCTCTGGGCCGTAACTGACGCTGAGGAGCGAAAGCATGGGGAGCGAACAGG
>URS00016F7E24 rRNA from 1 species 
TACGTAGGGCGCAAGCGTTATCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCCTGTCGCGTCGGGAGTGAAAGCCCACTGCTTAACGGTGGGTCTGCTTCCGGTACGGGCGGGCTGGAGTATGGCAGGGGAGACTGGAATTCCTGGTGTAGCGGTGGAATGCGCAAATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCATTACTGACGCTGAGGAGCGGAAGCGTGGGGAGCGAACAGG
>URS00023D8557 lncRNA from 1 species 
GATTCTTCTTCAGCTTGTTTTCTTTTCCTTTTCTTCTTCTCTCCAGCATCAGCATTTTCAACCGCATCAACATCCTCAGCTGAATGCTTCTTCTTCTTCTTCTTTTCCTTCTTCACGGGTTCCTCTTCTGCTTCCACATTTCCATTTATGTCATTTGACGCAGGCATGTCTTCATCATCAGCCTTCTTCTTCTTTTTCTTCTCTTTCTTATCTTCTCCAGCAGGTGTCGTTTGGCCAAGAACAGAATCTGCTGCGGGATTATATGCCT
>URS00020BFB22 rRNA from 1 species 
AGCGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGACCCTTCGGGGTTAGTGGCGGACGGGTGAGTAACACGTGGGAACGTGCCTTTAGGTTCGGAATAGCTCCTGGAAACGGGTGGTAATGCCGAATGTGCCCTTCGGGGGAAAGATTTATCGCCTTTAGAGCGGCCCGCGTCTGATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCCATGCCGCGTGAATGATGAAGGTCGTAGGATTGTAAAATTCTTTCACCGGGGACGATAATGACGGTACCCGGAGAAGAAGCCCCGGCTAACTTCGTG
>URS000081A35D rRNA from 1 species 
CTACGACTCTCGACAATGGATATCTCGGCTCTCGCTTCGATGAAGAACGTAGCGAAATGCGATACCTTGTGTGAATTGCAGAATCCCGTGAATCATCGAATCTTTGAACGCAAGTTGCGCCCGAGGCCTAGGCCGAGGGCACGTCTGCCTGGGTGTCGTGAAA
>URS00004E6ABB rRNA from 1 species 
AGGAAGGAGAAGTCGTAACAAGGTTTCCGTAGGTAAACTTGCGGAAGGATCATTG
>URS0001751255 rRNA from 1 species 
GACAGAGGGATCAAGCGTTATCCGGAATGATTGGGCGTAAACGCGTCTGTAGGTGGCTTTTCAAGTCCGCCGTCAAATCCCAGGGCTCCAACCCTGGACAGGCGGTGGAAACTACCAAGCCTGGAGTACGGTAGGGGCAGAGGGAATTTCCGGTGGAGCGGTGAAATGCATTGAGATCGGAAAGAACACCAACGGCGAAAGCACTCTGGCTGGGCCGACCACTGACACTGAGAGACGAAAGCTAGGGGAGCAAATGGG
>URS000100F795 rRNA from 1 species 
TACGGGGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCTCGTAGGCGGCCAACTAAGTCAGACGTGAAATCCCTCGGCTTAACCGGGGAACTGCATCTGATACTGGATGGCTTGAGTTCGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGTTCTCTGGGCCTTACCTGACGCTGAGGAGCGAAAGCATGGGGAGCAAACAGG
>URS0001BD843F lncRNA from 10 species 
TGGGTGCCGGAGAAGCTCCATATAGTGCTAGgcccaactattccatgagctccaaactagagcgtctcacaccccctgtgtcccgtcctcctggatagctaatggatgtcttggatgtgggaaacttatccaggccagcatgggactctggatctttgccctaaacctgctcctccccaggcttcaccttctcagcagtggcatcacatccagccagctgctccagcccaaatgtgatgagatcattttgattccccttctctccacatcctctccccatattcaattcaacagcaggtgctgtcagtgctgccccagcctctgtctccctcgtgtctctccagggctgcactgtgacaaggccacggtgtctacctggacggccacagggactcccagttggtcttcctgcctctactgccgcccccgttgctctattccaacagggaaagtgtgacctcgtaagtcctgctcatcccctcccaggatttttcactgcacatggaaaggatccacctttctgcaaggtcctgcgtgacctggcacttgcctcgttttctgacgtgacctccttccctgctgccccttgttccagctgcactggccatttctccaacacaacaaatcctttctcatcatgccgcattccctgccccagaccttcacctggtggctgcctcaggttcttcaggactcaggggagatgttgtctcctcagatgccttctgggaccacctgaccaatgtggcacctcaagcc
>URS00008EF1EE rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGGACGGGATTTATTCGACGAACCTAAGTAGTTTACTATGAGGGGGAGTTGGGTAAATTTAGTGGCGGACGGGTGAGTAACGCGTGAGGATCTATCCATTACTGGGGGACAACAGCTGGAAACGGCTGCTAATACCGCATAAGCCTTTGGGTGAAAGAAGCGATTCGGTATAGGAGGAACTCGCGTCCTATCAGCTAGTAGGTGGGGTAACGGCCCACCTAGGCGAAGACGGGTAGCCGGCCTGAGAGGGCGCACGGCCACACTGGAACTGAGATACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGCGAAAGCCTGACCCAGCGACGCCGCGTGAATGAAGAAATCCTTCGGGATGTAAAGTTCTGTTGTACGGGAAGAGCGAGAGACGGTACCGTACGAGGAAGCCCCGGCAAACTACGTGCCAGCAGCCGCCGTAACAC
>URS0001035ED5 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAAGTGGCGAACGGGTGAGTAACGCGTAATCAACCTGCCCTTCAGAGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATACTGAAGGAGGGGATTGCGTCTGATTAGCTAGGTGGAGGGGTAACGGCCAACCAAGGCGATGATCAGTAGGCGGTCTGGGATGAAGGACCGCCAAATTGGGAATGAGACAAGGGCCAGGATCCCTAGGGAGGGAACAGTGGGGAATCTTCCGAAATGGGGGGAAGTCTGGAGGAGCAACGCCGGGTGAGTGGTGACGGTCTTCGGGTTGTAAAGCTCTGTTAATCGGGACGCGGTACCGGAATAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATAC
>URS0001134E72 rRNA from 1 species 
AGTGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAGAACGGAATATAGCTTGCTATATTTGTCAGCTAAGTGGCGCACGGGTGAGTAATGTCTAGATAACCTGCCCTTAAGAAAGGAATAACAGTTGGAAACGACTGCTAATGCCCTATATGCCTTTAATACATAAGTATGCAAGGGAAACGCTTTAGTGCTTAAGGATGGGTCTGTATGGTATCAGCTTGTTGGTGAGGTAATGGCTCGCCAAGGCTATGACGCCTAACTGGCTTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGACGAAAGTCTGATGCAGCAACGCCGCGTGGAGGATGACACATTTCGGTGCGTAAACTCCTTTTATATAGGAAGATAATGACGGTACTATATGAATAAGCACCGGCTAACTCCGTGCCAGCAGCCGCAGTAACAC
>URS000222E680 rRNA from 1 species 
TACGGAGGGGGCTAGCGTTGCTCGGAATTACTGGGCGTAAAGAGCACGTAGGCGGGTATTCTAGTCAGGCGTGAAAGCCCCAGGCTCAACCTGGGAACTGCGTTTGATACTGGATACCTAGAGTCCGAGAGAGGGTGGTGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCAGTGGCGAAGGCGGCCACCTGGCTCGGTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAAC
>URS00023D9DA4 lncRNA from 1 species 
CCCTCACAGCATGTGTATTTTACACATACGCACCTCCATGTCCGATCTCACGCAATTCGGCACATAAAATATTAGATCTTTTCGCGATTTAACCGTTTTGCCAATTTGACCTCTCAGCGATAACTTTGCAAATACCGGAGATCCATCCGTCGAATTTTCGATCCGACAGTACCATTGCGTTCGGCACGTCGGGTGCATCGAATCTAGCATTTCGTTTCGTCCAATTTGACCCCCGATTCACGACGAAATCCGTCCGCTCTCCAATTTCAAAAACCACACACATATATCGATGTGTAATCCCGCTAAATCCTTAATTCAAATTCAAATTTGAATCTCCTACCACTAGTAGGTACAT
>URS0001FED5D7 ribozyme from 1 species 
ACCTCGTGGAGAGCAATAAGGAAAAGCTGGTCCGTGCCCAGAGAGAGGAGCAGGAGCGGCAGATGGAGAAGGCGGCAGAGCAAGCCGGTCAACAGGCTGCAGTCCCTGACCTTGGATGGAACTCGCACCAGGGAATCGACCAGCAGATTG
>URS0001E7E931 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAAGGGAGCTTGCTCCTGGATTCAGCGGCGGACGGGTGAGTAATGCCTAGGAATCTGCCTGGTAGTGGGGGATAACGTCCGGAAACGGGCGCTAATACCGCATACGTCCTGAGGGAGAAAGTGGGGGATCTTCGGACCTCACGCTATCAGATGAGCCTAGGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCGTAACTGGTCTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACGCCTACGGGAGGCAGCAGCGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCAGTAAGTTAATACCTTGCTGTTTTGACGTTACCAACAGAATAAGCACCGGCTAACTTCGTG
>URS00019E4D72 tRNA from 1 species 
GGCTGTGGCTCAGTGGTTGAGCGTTTGCCTCGCACGTGTGAAGCACTGGGTTCAATCCTCAGCACCA
>URS00000CF716 rRNA from 1 species 
CCGTGTGGCGGCCCCTGTAAAAAGGTTGGAANCAACTTGGGTGGAGGGATTTTAACCGTAGAGTCGGGTTGCTTAGTACTGCAGCCCTAAGTAGGTGGTAAACTCCATCTAAGGCTAAATACTACCACGAGTCCGATATTTGACAAGTACCGTGAGGGAAAGCTGAAAAGGACTCTGAAGAGAGAGTTCAAGAGGACGTGAAACCATTAGAAGCTGAAACGGGTGGAACTGTGAAGGTGGAAAGAGGGGATTCAGGCTGTGGGCATAGACATTGGCTTGAGTTTTTGTATTGTGAATGGACCCGGCATACGAGTGAGTTGCCGGTGCTTTTCTTGCCTTTGTTTTGTGTCGGCGGGCTTAATTCTCCCTCGAGTACTAAACGTGGCGACCCGCTGGACGGACCCCGAGGGCCCTTAAGGACTGGTAGCCTATATCTTTGGTGTGGGTGATGACCTTAT
>URS000006D2C9 rRNA from 1 species 
AGAGTGGCGAACGGGTGAGTAACACGTGAATAATCTGCCTCCGGTGTTGGGGATAACAGTTCGAAAGGACTGCTAATACCGAATAAGATGGTAGGTACAAAAGTACTAGTCATTAAAGGTGGGGACCGCAAGGCCTACCGCCTGGAGATGAGTTCGCGGCTGATTAGCTAGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGGCCTGAGAGGGTGAACTTTCACATTGGGACTGAGATACGGCCCAGACTCCTACTGGAGGCAGCAGTTAAGAATCTTGCGCAATGGGAGCAATCCTGACGCAGCGACGCCGCGTGAATGATGAAGGCCTTCGGGTTGTAAAGTTCGACAAGCAGGGAAGAATAAGTGTGGGGTAATATTCCACATGATGACGGTACCTGCCTAAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTATGGGGCGAGCG
>URS000108241F rRNA from 1 species 
TACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGTGTGCGCAGGCGGCCGCGCAAGTCGGGTGTGAAATCCCCGGGCTTAACTTGGGAATTGCGCTCGAAACTACGTGGCTGGAGTGTGGCAGAGGAAGGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCGATGGCGAAGGCAGCCTTCTGGGCCAACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS0000A837F7 lncRNA from 1 species 
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCATCTAAGCTAAGGATGTCTTCACTGTAACCTCTGCCTCAGCAAGCTTTTCCCTTGCTGATCCCATCAGAACCATCCCCATTTGAGCTTCAGACTCCCCTCTGCCAACACTTAATCTTCTCTTTCAGCAAGAGTAAACAGATAACAGAATGTTCTTCCCTGAAGCTTACTAAAACTTTAAGTCCCGGTGTTATTCTCCAAAGGAAGCTGCTTTCTTCTGGCCACCAGGTCACCAGCTCCTATAGTGAGCTCTGAGCAGATTCTAGTCAGTCTCTTTAAGGGGCTGGGACTAATCGCTGTGACCTCAATCAAGCCTGCTGGTTTTATGATACCAGGAAGGCTCACCAGGTGAACTTCTGCTCCTTTTAGGAGGCTAAGCATCCCCCAGCCACCTTGGACTTGAGCAGTGTTACCTGCCAGCAAGCGCAACAGTGCCAACCACTGGTCTCTTCTTTTGGAAAACGTTTGACTTTTAACTTGCTTTCTTCTCTATTTCATCATTATCCTCCTTTCTGACTTTCATGTACTCCTAAAATTTTTGGTTGTAGAACTAAGCAAGAGAATGAGAACTGGGAAGAACCTTGGAACAATGCTGAGAGGCTGCCCAGATGCTCTTCTGTGTTCCACAGTACTGCCGAATCTTCCTTGTGGCTCTGGTACTGTACTGCCACTCAAATTTTGGTACAAACCATTGAAGTATTTTTTGCTTGTTTTTATTGGTCTACATAGTAATCTTAGTGTTCTGTTCCTGGAATAGTCTCTCAGTTAGCACATTCCCCCTTGTCCTGAGATCACCAAGACCTTCAAGATTAAGGCTCTTGCTTTCTACCCTGCCAGCTCTGACGCAAAGCAAACACCCTTTTCTACTCTGCAGTATGAAGTGCTCAGGACTGTGTTTTTAGCTGTTCAGAATGTTAGAGTTATTAATGTTGGTTAGTGGAGTTATCCTTCAGTGTAGAAAGAGAAAACTGCATGAAAAACTGGCACTAACTTAAGTGGCCTCTGACACCTTCCCTAACCCTGTCCCAGTTTGTGTCACATTCTACAATAGATGAGTGATCATGATCAGCAAAACTGTTTCTTTCTTTCCTTCATTTCTTCCTTCCTTCCTTCCTTCCTTCCTTCCTTCCTTTCTTCCTGTCTGTCTTTCTTTCTGTCTTTCTTTCTTTCTTCCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATCTATTTATTTTGGTGTTTGTTATAGCAGAATTTGATTCATGAGAAAATCATCAGGCAGCTGGCAAGTCCCAGCTTCTCCCAAACTCTATGTAACCTGTTCCCAGCCACCTATCTTGACCCAGTGTTCCTCATGTTTTAAACTAGCTGGCAAACACATTTGCACAGCCTTATTGTGGGAACATTCAACTTGGCAATAAGTACTTTGCTCTTGATAGGATCTCAAAGATTCCTTCAGACCAAGAGAGACTCCAGCAAGCATACAGTTACAGATACTGTTGCCCAACCTGCACATCTCTGTGCCTGCCTCCCAACACAAGTCAAATGTGGGAACCAATCCCCCACCAACTACACATACACACACAAACACACACCTCTGTCCTTTTTGGTATTAGTATTCCTTTTTTTTTTTTTTTTTAAATTTCACGCATCTCTTCAAAATCTGGACCTCTGGATCTACAGCCCTGGGTCGTCATAAATAGCTCAAAAATGAGAAATCATGACTTCGGCTTTCTTTTTTAAAATTACTTTAATAAATACCCCAACATGTTCACTATACCACTGTACAGACTTTATTTGTTTGTTTGTTTGTTTATTTAAGTGCTTCCAGACCTGTAGTTTGAATATATGTAGTTCAGGGACTGTTGTTTCTAGGCATTCTACCTAGGAGTTTGTGCCTGTGGAGCATGTGGATGCCCCACCCCTCAGCTACACCCAACCCATACAGAAGTGCTGACGGGACTGTTTCCAGAGTTCTAGCCTGTGGTATTAAGACTTTAAAAAAAAAAAAAAATGTAATGATTTTTTAAGCCTTTTCTTTTCTGGTTGCCCTTGCAATTAAATTAAATAAAAAGAGGCATATGTTCAAAGTTTTACTGTGGCAACAGTTAAACATACAACTAAGCCCTGTCAAGAAACAATCAAGTGGGGAGATAGATGCTTAAGTCTAGAAACTGCTGTCTTCGAGAAATGTGAAAGCAGAGACCACATACTCATGATCTCCCTCACTCCCACACGGCAGCAAAGGATTCCTTTCAGCTTTACTGATTCACACTGTGGATACAGAACATTCTAGAAGGCCAGCTCTTGCTTCTCACCTGTGTTTATTGTCCAGAAAGGACAAGTCTTTAGAGACAGAGGAGGCAGTATCATCCAGGATAAGTTATTAGGCCTGGCTTGCCATTCCTTTTAATCTAGTCCTTCAGGGAGGCTGCCATCAAGGAACAAAGCCAGAGAGAATGTAGAGATAGGGCCTCTCATGGCTGGAAAGCCAAGGCCTATTGCTTCAACTTGTGTCCTTGAGGTACTGTGTCTGTACAGAAATTAAGACCCCGAGAGGCCAACAAAAAATGCAATTTAAACTGCACCTAAGATAATAAAATTGGATGAAAAGTAAAAAGAAAAAAACAGATTTCCTGGTACTAGGGTTTCCTGTAAACACCTTGTGGGTACCTCATAAGCAGCTGAGATTATTAGTGTTTGGTCCTAGTGACTATTTCAGCTGCCTTATCCACATTAGCTGCTAAGAAGTGATAACTCCCCAAGTTCCCATATAAAGTCTCTCCTGCTACCGTATTACATGGCAAGGAGAACAGGGGCTTTTGTTTGTTTGCTTGCTTGCTTGCTTGTTTTACTTCCTTGAGGTTAAAACTAGAGTCCCACCCCCACCCCAGATTAGTCTAGAGTTGGGGCAGCAGTAATAAATTAGGACGCATTCAGGTGTGACAACACAGCTACCTTTGATGGTGAAGACCTAGAGTGATTTAGTGTATCTGTGCATTAAATTAGAAAATATTTAGCAGAAACATGTAGCATAGCCGCATTTGAAAACGAGATTGTGCACTTGGGAGGCAGAAGCAGGTAGATATCGGAGTTCAAGGCCACACGTGTTCTACAGAGTGAGTTCCAGGATAGCCAGGGCTACACAGTGAAACTCTGTCTCAAAAACTCCAAGAAAATAAAAAATAAAAAAATGAGATTGCGTTTTGAAAATACTTGAAGTATTTCCTGACCTCCAGGTACCACTTTAAGCATGCTAGATATCTAGGTTGGGAGTCACTGAAGCACACCCCACAGCTATATTGGCCAGTAATGGAAAGTCCACTTTGTAGGAAGTTGATAGTGCCTGCTCCACAGACGCTGTCATTTCTTAAGCCAATCTTTAGAATCCCCAAATGTTTGGGGCAGTGAAAAACAGTAAATATACTTTGTTAATTAAAAACAGACTTTCTTTTTTAATGATATACTTTTACATGACAAATGAAAAAAAAAAAAAACTTGTAATCTGTGTCTGTCACACTAAGACACCAGATACCACAGAGAATCTCTTAAATCGCCACCAAAGAAATGGAGAGAATAAATCAAATGTTTGAAAAAATAGAGAATGGCCTTGGGAGATGGCTCAGTATGTAAAGAACTGACCACACAACTATGGGAGCCTGAGTCAGGACCCTCAGAACAGATATACATCTGGGCAGGCATAACAGCTTCCTGCCATTCCCTTGTCTAAGAACGCAAAGACAAGTGACACCCCGCCCCCACCCCCTGCAACAGGGCAAGCTGGCTAGCTGGATTAGCTCTGGCTTCAAATGGAAGGCCCTGCTCCCATTTATAAAGTGGAGAGATATTAAGGAAGATATTTGACAATAACTTTAGGTCTCCAGAGATATGTGCACACATGTACATCCACACCCAAAGTCACACATGCAAAAGAAAGTGGACTAGAATCATAGTTAGTTCTTAGCACCTTACTGGAGTTCTTATAGTGTGGAACTCTTGTCTTATGGAACGAATGTGGTAACATTCCTACATACAGGAGATGGGTGGCCTCTCAGAGGGGCTCAAGTTTACCCAGAAGGCCAGTTAGTCTTTGAAGCTAGTCACTATTCAGTTTAATCCTTGGAGGCTAGTCTTCTTGACATGAACTGTCTGATTTTCGACACTATATATATAGAAATAGAAGTAGCAATCTATTCATTATGCCAACTTTATAGCTACTTCTGAAGACCTCATGTTGTGCTTGCCTCTCAGAAAGAGATGCCTACTCCTTACCTACTGCCTTCAGTAACAGCAGAGCTCCATGGGGCTGTCCTTCATGACATTATTCAATCCTGACATTCATTGTGGTATTAATATAAAGAAATTTAGTCTGCATACACGAGGTTTTGTGTTCCAACTTGTTTACTATCCTGAGTGTCCAGGTCCCTCATAGAGTCCAGAAGTCTCTGAAGGACTCTGAACATTGCCAAAGGCTTCAGTGAGGGAGTCTAACAGGTCACTACTAAATCAAGGCTTCTAGAGAAATGGTTTGCAGGGTGCTGCTTCAGTCAGATTATTTGCTGTTAGACACTGAGGCTCACAGTTTAGTGTGACTTAGTTCCAACTGTCCAGACTCCTTGGCTGGTAGATGTAATGCTCCGTTTTGTCATGTGAATTTGAAAGGTCACCAGGTGAGGGCAAATGAAAGCCATCACTGTGATTTGGAAATCAGCTCTCAGAAGCAGTTGAGTGACCATCCTTGGACCTTCTGCATGTCACAGTGCATTTTAGGATCTGTCATAGACAAGGCTTATGAAAGTAGCTTTTTGGGAAATTGGAAGGATAAGAGGGGTGGCTCACAGGAGCACAAATGCAGACCCACAACTCATATCAGAATTGAAACTGCTAAGTCCTCACTGCCAACTTCCCAGCTGGCTGGCTTGAAGATGACAACAGCTCAGGGAGCCTTTGAGCAAGTGAAGAAAATTAAATCCTCATTTCCCTGAAAAACTAAATTCTCAGGTGATTGCCTGACAGGGGGAAGGGGGGAATTTTTAAATCATGGCCTTTGTTGATGTTCTCTGGCTTTTTCTTGGGAGGCTGCTTCAAGCAATAACGTGAGGTATGAGGTAACCCTGTCAGGTGGTATGCTGGGCTTTTAAGTCTTGTGCAGGTTGCCTGCTTACCCACACAATTCACATAGGGGCTGAAAAGCTTAACTTATCAGGGATGGAACTAGGTTTTACAGAGTTCCTTTAACCAAATAGGCTTGCTACTTTTTCCTTTCTTCCTGCATCTGCCAAGTCTTTCCGACCATTTTCATTGATCTCACCAGATGAGTAACACTTTAAATTCCAAAGGCTTAAAAATCAACTCCTTGTCATTTTTTTCCAATTTAATTTTTCACTCTTTGTCATATTTTCATCTTCTTGCATTAGTTCCCATGGCAATGTGTCTGTTGGCAGAGAAAATTTAACTCTTTTAGTGTTGATCACAATGTAAAATCCTTTTTAGGCAAGTGCCACAAAAACAAGCAGAGACTGGAATTCTCTTGCTAATACGTTTTCTTATCTCTTATATTGATTTCCCATCCTATCCCCAAGCAAAGCTCTCACAGAAAAACATGCAGAGGCCTTTGAGGCAGCTACAGCTTCAAGGATTTAACCTTTGGCTTCCCATGGCTTCCCGTTCCAAGTGTTAAAAATATGAATGCATCTATCAGGAATGTACAGAAGACAACTTTCAATTTCTATCAGAAACACCCAGTGTATCTGAGGAAATACACACGTCCTAAAATGAGCCTCAAGTCAGGGTCTAATGGCAAGATGAGAGGCACTTAAGCAGATTTCCTCCCAGTAAGTAAATGGCAAAGAGGCCAAGCAAGCTCTAAGTTCTTGAAAGAAGCAGCAAAGACTCAGGTGGAAAGCAAATGACATGGTTACTTGTATGGGGGAAGCGGCACTTCAGTTCAGACAGTTTGTGATCAAGTATGAAAAAGCAAGCAACTGCATCAGGCTTGATGATGTATGCCTATGATTCCAGCAATGGAAGGTCAAAGGCAGGAGGATTACAAGTTTGAGGCCAGTCTGGGCTACATGGGAAGATCTTGCAAGGACTAGGTTTCAAGGTGCTAGGTTCAATTCCTAGGACCTAAAAGGCCTACTAAAGCCTTTAGAAATGCTTTAGAAATAGAATGTAGGGATAAAGGGAAGAGGACTATGCAGAAAGCCCAACCCAAGATTAAATGTTTGTTTCAAACTTTAGGTTCCATCATGGCTTGGCATTGGCAGCTCCTTCTACTGCTTCAGTATCCAGAAGCAACAGGTCTACTGTCAGAAATTGAACAGACTGACCCAAATATGTGTAGGATTTTTTTTTTTTAAGAAAAACTGATGAATTCAGGGGAATGAAATAGATATTAAATAAAATGTGGTTATCTTAAGTATAGTTAGGAAAAACGATCAAATGTAATTGATCTTCTTGCTTAGTCTAATGAGACACTTAAGCACTAAGCTGCTTGTATTGTATAAATGTATTTTTGGCTGTTCAAAGGTTATTTTCCTATATTAAGAAGTTTATTAAAACCTTTTATTGCAACTCAGGTTTTGTGTCTTTTAGACACACATTTTTCTTTGCTAGTTTGTTTTGCACAGCTGGAGTTTTGAGGTGGAATAATGCCTGGGCATGGCAGTCAGCTAAACTGCCTGATAGCGAGACTAAGGAAGGTACTTGACATGTGGACAAGCCACATTGTTGTTTCATAGCTCTCCATGCCTCCACTAAATACAGTTAGCCGGGAAATCTCACATGATTTTGTTTGTTTGTAAAAAGTCTCTGGAGAAACCAAGACGAATCTCTCAGGCAGATAAAGAGCTTTCCGTATTTGCCTAAACGTACTATTGAAATAAATATTATTTTCAATACTTGTTTTTCCACTCAGAGGGCACGCACTGGTCTCAGACCAGGGAGAGGACATCTGGCTTAGATCAGGACTGCTGAGTGCTGTGTAACTCTTAGGAAACTTTGTTTTGATGTCAGTGTCAACAGATTGCAAGGAATGGTTCGTATTTCTGCTCCCAACATTTCGATATTTCCTTTGCTTCCCTCCTCTGAAGAGCGAGCCTTACTGTGATATGTTTGGAGTAAAGACAAAGGCAATTGACAGGCAAACCGCACTTTTGTTGGAAGAGCCAGTTAAGTTCTCTTTGTACTCAGTGAATGTGAGGGACTGAAGGCAGATGGAGAATGTAAAACTGTTTATACATGAAGGAAGGGGCACTGTCCAGGGCTGGCAGGAAGCCAGAGGTAGATCTATTGAACTTCAAAGGGTAAGGTCATTGCAAGGTCACTACAGGTTATAGCAAAACCAGAATTTTCTTTCCTACTTACAGCCATGAAAGGGCACCTCACCATCAGCTGTGTATGAGAAACTCATACTGCAGTCTCATTCTTTTCAGGAAAGAAACATTAAGTAATTCAGATGGAAGAATAGAAAAGTAATTCTGACGGAAGACAATGGTGGGTTTACAAGAGGTTTGTAAAGAATTATACACACTACAGACTGATTTTTTTAAACACTCATGAAATTTATTTTTCACTTTCAAAACTATCAGATTGATGATTTCTTGCCCTCAGTAATTTGTGAGAGATGAACGTATTTCATTATTCTGTAAATGTTTTATGTGTCAAGCACATAAAAATTTTGAGGTCGTATTTGCCAGTTAACATTTCATTCTCATAAAAAGTCGTAAGAGAAATTCCTAAGTGGTGACGCAGCTTTGGGTCTCTTGACCATACTCTCTGATGGGATCTGGCTTCATTACCATAAGTGCGGTACCCGGGTAACAGATCTGCAGTAACCGCAGGAATCTTCCCTCAGAACCAGAACTGGGACCTCATTCCTAAATCTCCCATCTAGCTGATGACAGGTGGCAGGTGAGTGTTCCTTCTGTCCATCCTTTGCTGTCTATGTGGACATTCTGATATGTGTCAGTGAGCTGAATTCTACACGCTGTATATATTGCATGCATTTCACTGCAGTCTATGGACATGCCCTTTGTAGAGCTTTTATGGAAGAACCAAGAAGCCAAGGCAGTTTAGCAAACGAGGCTCAATATTTATAAACTGGGGCCTTTTCTGTCTCTTTGCTAGCCTAGGTGGCTGTATACAAACTGGGTGGGAGGGGCAGCAAACACCTCACACATCACATTTAGATTTTCTACTTGGGTGTACTCTAGCCAATTCAAAACAAATTGCTTACTTTAATAATAAAGTTTACCATTTTATATTAAAGAAAATCAAACCATGACATGTTTAATTGAACTGGCTGTATTGTAATTAATATTTTGAGATAATTGTGATTTTCAGCTTAAAATTATATATAAAAATTGTCATTTTTGTATGTGTTAAAAAAATGTACCATGATTAACAGTACTTTTTAGTTAAACTACATATTGGTGTAAATAAAACTGAATGAAGAAACACTTACTACTTTACTAACTTAGATTGTGAATGTACTTCATGGTTTTTTTGCCATATGAGACCATAACAACCTTGAAAGAAAGCTGTTTAATTTTATGTGCAAAGTCCCACTAACCTGTATTTCAACTCTGCCAAGCCAATGACTTTGCAAGTGTGATCTGTACTCTCCAGCTGTGTCTTACGTTCTGACACTATGGGTTAGGGGTAGGGTGTAGCCTGGAAGCATCTGCAGATGCGCTTTGTACAGATAATAGCGCTGTGTGGTGTATAGCAGAGCCATTTTTAGGTTCTGTTGTACTCAATTTTTTCAGAATTTAAAAAAGTGTTTTGAATAACATAAAAGTCTATTGTATAAATAATAAAATGTCACCTTATTA
>URS0000CDA9EC sRNA from 1 species 
GTCTTAATTAAGGGAGCCCCGAGACCTTACTCTTTCACTTTACCTAGGAGTTTGGTTCCTAAACTCACCATTCAAATCCAGCAACAGAACTGATTGAAAGGAACCTTTGTCTTTTGTGTGAATGCTCATGAGGGGCCATCCTTACAGTGGAAACGCTCCTGAGGCTCCAGCGAATCAAGACTCTCAGACCCCCGGGCTGTCCCCACCCCATGACCACATGTTCCACAGGCACCCTCAGCACTGTGCCCTGCGTGTCACCCAGGCAGGTGTTTGTTTTCGAGCGCAGATTCTGCCTGTGGCCATAGCCATGTGGAGATGTTCACGCATGTACTTCCCTTTGTGATTTCAGCCGATACGGAAGATGTGTGCATCGTAGAGAGATTGTTCTCCAGCAGCCTAGTGGCCATTGTGAGCCTTAAAGCACCAAGGAAGCTAAAGGTTTGCCACTTTAAGAAGGGAACTGAGATCTGCAACTACAGCTACTCCAACACGATTCTGGCTGTGAAGCTCAACAGGCAGAGGCTGATAGTATGCCTGGAGGAGTCCCTGTACATTCACAACATTCGGGACATGAAGGTGCTGCATACGATCAGGGAGACGCCTCCAAACCCTGCAGGCCTGTGTGCGCTGTCAATCAACAACGACAACTGCTACTTGGCGTACCCAGGGAGCGCGACCATCGGAGAGGTGCAGGTCTTCGATACCATTAATTTGGTGAGATGCCTTTCCTGCTCGAATAGCTCTCTAAAGTGTGGCTTTTTCTTGAAGAGGAGCACTGTGGTGTCCCTGGCATCCTGACTTGGCTCAGCAATACAACCGCTGCACTTTTTTTTTGAGACAGGGTCTTGCTCTGTCGCCCATGCTGGAGTGCAGTGGTGCAGTCCTAGCTCACTGCAGCCTCAACCTCCCGGGCTCAAGTGATCCTCCTGCCTCAGCCTCCCAAGGAGTTACAGTCATGCAACACCACACCCAACTAATTTTTTATTTTTGTAGAGATGGAGTCTTGCTGGGTTGCCGAGGCTGGCCTCAAACTCCTGGCCTCAAGCCATCCTCCCGCCTTGGCCCCCTAAAGTGCTGGGATTACAGGCGGGTGCCCCGCGCCCAGCCCCGCTACTCTCTTCTCAGTAGCAGAGCAGGTCTGGCTCATTCTGCTTCTGGATCTGCTGCAGCGTTCAGACCAGTGCTGAGCTCCTCGCCATGGGAATGTTTGAAGGAACATAGAAAACCTTAGGGATAAACTGCTTTGCTTTTTCTAAATTTGGAGCAGCATTTCCTTGGATGCCCAGCCCCAGTAAATCAAGTGGGTTTGGCATTTGTTTGGACCGTAATGGTGTTTTAGGAATAGCTAATTGGCACTTGCGGACCAAGTGCCAGCCCTGGGGCGTGGGCGGTCACTGTGCGGCGGCCACGCTTTATTGGTGTCCCTTTTTCAGAGAGCTGCAAACATGATTCCGGCTCACGACAGTCCTTTAGCGGCATTGGCCTTTGACGCAAGTGGAACTAAACTTGCCACGGCTTCGGAGAAGGTGAGTCTGCTTTTCCCTGGGGGAGCGCTGGTGCCAAGGCGTCCAGAGACTTTTTCAGTTCTGTTCACACAGCCAGCTTAGAGGCAAGGTCTTATACTTACCAGCTCCGGGAGAAGCGAAGACAGCCACCCGCTTGTCAGGCCATGGGCTCGTGCTGCCCGAGAGTGAGCGGAGCTTGCGGTGTGTCACTGGGACGGGAGAGCTGGTCCACGTTTGTAGTAGAAAATACAGAAATGTCCAGAGGAGACGAAGTGCCGTGTGTAACCACGCCGCTCACCCAGTGTGTTTCTAAATGATGAAACTAACACGTAACAGTAAAGAACCCAGACAGTGATAAAACGTGAAAAAGCAAGGCCAGAATTCTATCCAGCCCGTCTGAACACATTTCAGTGTATTTCCTTTCATTTTCTCTTTAGTCAACAAAATTGGGATCTTACTATGGGTATAATTTATCCTTTTTCACTCTGCATGACATTTGTCTAAGTTCAAAAACACTTGTAATGGCCGTGCAGTATTTAGTTGTGATTTATGTCAACATCACCCTTTTGGGACTTTGTTTCTAATATGTTGCTGCCGTAGGTAGTAGTGTATTTAAGTCATGTATCAATCTTTTATATGTATTTCTAACTATGAATTCAAGAGATTCCAGTAAGAAGAATGTCTGGCTTTAAAGGAGATGGCCTCTAAATGTCCCCGTATACCTGTGACCGCGTGGCGAGGCTCCCTGGCCCCCAGGAGACTGAAGGCTCCTCGTTCTCTTCCTCACTTGGACTGTGCCTCTCTTTTCGTTTCAGTTCCTCTTTTCTTGAAAGTTCCGTCTTCTCTTCTTCTGTCTTGAGGTCGCGTCTGCTCTCCCGCCTCCGTTGTCTCCTCTGGATGCCAGTCTGCTCTTCATTGCCCACCGATGACCTTTACTTTGATTTGGATATGATTTTGCTTCTCATTGAAATCCTAAAATAGCCTCCCCTTTCAAGCCATCTCTCCCCTCAAACTATCGACCAGAGAAGATACAATAAAACGTCGGCTCACTTCCTTA
>URS0002144F5F rRNA from 1 species 
GCGGAGGGATCATTACACAAAAAATATGAAGGCTGCAACCGCCAGTTTTGGCGGGGAAGCTGAATTATTTTTCACCCATGTCTTTTGCGCACTTGTTGTTTCCTGGGCGGGTTCGCCCGCCACCAGGACCACACCATAAACCTTTTTTATGCAGTTGCAATCAGCGTCAGTATAACAAATGTAAATCATTTACAACTTTCAACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATACGTAGTGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCTTTGGTATTCCAAAGGGCATGCCTGTTCGAGCGTCATTTGTACCCTCAAGCTTTGCTTGGTGTTGGGCGTTTTGTCTTTGGCTTTTGCCCAAAGACTCGCCTTAAAACGATTGGCAGCCGGCCTACTGGTTTCGGAGCGCAGCACATTTTTGCGCTTGCAACTAGCTAAAGAGGCCAGCAATCCATCAAGACCTTCTTCTCACTTTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAT
>URS00023B0815 lncRNA from 1 species 
ATACATTCCTAATGGAACTGTCGCTGATCATCTTCATGGAAGACAGTCGAACTCTGGTTTGCTCACTTGGCCTTTTCGGTTGAGCATTGCTATAGAGACAGCCAGTGCACTTGCATACCTCCACGCTTCAGATGTCATACACCGTGATGTCAAAACCAATAACATTCTCCTAGACAACGACTTCCATGTGAAAGTGGCTGATTTTGGTTTGTCGAGATTGTTCCCAACTGATGTTACTCATGTATCGACTGCTCCACAAGGAACGCCTGGATATGTTGATCCGGAGTATTATCAATGCTACCAACTGACGGACAAGAGCGACGTTTACAGCTTTGGTGTGGTCTTGATTGAGCTGATATCAGCTTTAGAAGCAGTGGACACCAATAGGCATCGGCATGATATTAATTTGTCCATCATGGCAGTGAAAAAAATCCAAAACCATGCTTTAAATGAGTTGGTTGATCCATTTCTTGGATTTGACAAGGATTTCGTGGTGAGGAAGATGGTAACATCAGTTGCAGAATTAGCTTTCCGGTGTTTGCAACAACAGAGG
>URS00021A59B7 tRNA from 1 species 
GGGGGCGTAGCTTAATGGTAAAGCCTCAGTCTTCCAAACTGATTACGCGGGTTCGATTCCCGTCGCCCCCTC
>URS000061A097 rRNA from 10 species 
GGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTGGATCACCT
>URS0001E193C8 rRNA from 1 species 
AACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCGCCCTTCGGGGTGAGCGGCGGACGGGTGAGTAACGCGTGGGAACGTGCCCTTCTCTGCGGAATAGCCTCGGGAAACTGAGAGTAATACCGCATACGCCCTTTGGGGGAAAGATTTATCGGAGAAGGATCGGCCCGCGTTGGATTAGGTAGTTGGTGGGGTAATGGCCCACCAAGCCGACGATCCATAGCTGGTTTGAGAGGATGATCAGCCACACTGGGACTGAGACCCGGCCCAGACTCCTAGGGGAGGCAGGAGGGGGGAACTTGAAAAAATGGGGGCAACCCGAAGCTGGCCTGGCCGGGGGGGGGATGAAGGCCTTGGGGTTGAAAAGCTCTTTCAGCGGGGAAGATAAGAAGGGACCCAGCAAAAAAAGCCCGGGCAACCTCCGG
>URS0000C56DA5 snoRNA from 1 species 
GAGTGGAGTGATGATTGTATTTGATTCCCTATTGGTTTGATTGCCAGTGTGATGGCACGCATTATAATAGCTTTATCTGACCACTC
>URS0001BF6C2A lncRNA from 10 species 
ccagcagtggcaacccgctagggtccccttccacactgtggaagctttgttctttcgctcttcacaataaatcttgctgcttctcactctttgtgtccacaccgcctttaagagctgtgacactcactgtgaaggtctgtggcttcactcctgaaatcagcgagaccatgaacccaccaagaggaatgaacaactctggacgcgccacctttaagaactgtaacattcactacgaaggtctgcggattcactcctgaagtcagcgagaccatgaacgcaccggaaggaatgaacagctctggacgtgccacttttaagagctgtaacactcactgtgaaggtctgcggcttcactcctgaactcagcaagaccacaaacccaccagaaggaagaaactctggacacatctgaacatctgaaggaacaaactctggacacaccatctttaagaattgtaacactcaccgcgagggtctgcggcttcattcttgaagtcagcaagaccaagaacccactggaagggaccaactctagacacattttggtgacccagatgggactattgcctatcgccaagcagattgaggccatcaagctacagatggtcttacgaatggaatcccaaatgagctcgactaacaacttctatagaggacccctggactgacctgctggccctttcacggcctaaagagttcccctctggaggacactatcactgcagggccccttctttgcccctgtccagcaggaagtagctagagtggtcatcgggtaattcccaacagcagttggggtgtcctgtttagaggggagatGgagaggtgaagccgactgggcttctgggtcaggtggggacttggggaaattttctgtctagctaaaggattgtaaacacaccagtcagtgctctgtgtctagctaaaagtttgtaaatgtaccaatcagcactctgtaaaaatggaccaatcagcactctgtaaaatggacgaatcagtgctctgtaaaatggataaatcagcaggatgtgggtggggccaaataagggaataaaagctggccacctgagccagcagcggcaacctgcttgggtccccttccacgctgtggaagctttgttctttcgctcttcgccgtaaatcttgctgctgctcactctttgggtctgcacaaactttaagaactgtaacactcactgcgaaggtctgcagcttcactcctgaagtcagcaagaccacgaacccaccagaaggaagaaactccggacacatctgaacatctgaaggaacaaactccg
>URS00022B9349 lncRNA from 1 species 
TTCATTAGCTCAAATATATACATATGTCGAGGCACATTCCTAGGTAATATCTTCTCATTCAGATAAATAACTTCAAGTTAATATTAAAGTCATTATTCATTGATGCAGAAAAGTCTCTCCACTGTACTTTCCCAATTCTTGGGCATTCTACAAAAAATGCTCTTTCTGCAATGTATATCCCCTGAAACACAATGTTAAATTTGAAAAGGTTTAAATATTTTCCCAGCTCAAGAGAAATAAGGCAGATTTTCTATCATTGCTAGAATGAAAGGAGGTTTGTTTATCCTGTTCACTAAATCAACAACATACTTCCTGCTAATAGGATCAGAGAATGAGATGGGTAAAATGTGAAATCATTTGATTTCTTTGTTTTGTTTACACGTGTATGTTAACGAAGCATCAGATAAGAATGAGGTCTAATTTCCTCTTCTGCAGGTAGAATTTGAGTTAGGTTTCCAGAAGGACTTACCAAATTCTAGTAGCCATACACCGGTAAACAGGTCAACCTCTAGGTATTTAGAAAAACAAATGTCCTTTCCCAAACTTCTTAGTTACAGAGCCTTTCAAAAGCAGCTCATAATTTGTTCACATGTTGTTATTTGCCTAATGCACTTGATACATACTATCAGAACTGCACATAATGCCTGAGCTCTACAGATAAAAGCTAAAATGAAGGATACAATATATCTGATTTTCAGAGGCCTAGTATCATTTAAAAAGTCAGCTAACAATTCCAGACTATCTCTAGTTAGATTCTAAACACAAGAATCCATCCATCCATTCAATAAATACTTATTCAGCTAGACAATATGCAAAACCATCCCAAGGGGGTTGAGATTAAAAAAAAAAAAAAAAATCAAGATAAATCTGCCATCTTGCCACTAACAAAACATATCCAGGACAAAAAGTACTATAAGGGAAATGAGAGTGAAGAGCTTCAGCTTATGCAAAGACCCTGTACTGAATGAAAATGAGTAAATTTATGGGCCATAAAATGTAAATACATAGCATTGAAGAGAGGAAAATTCATGTAGTCCATAAAATTGGAATTCAGTAGATTGTGAGCCTTGCAAGAAAATCACTCACCATACAAGTCCTAGAAGCAAGAGGTACAGCTCTCCCATTAACCAGCTCTAGGACTTTAGATCAAGTCATTTCATTGCTCTGAGATTCTGTTTCTTCATCTGTAAAATGAGAGTTAAAATTTCTAAGCTACCTACCACTCATGATTGTCAAGGGATTATGCATGAAAAAATGCTTTACTAAACTAAATATCTCATATATACTAGTACTGGTTCAGCTTTTTTGGGGTCTTATTTTTAAATAAATAAGTTGAAATGATATTTTTTAAGATTGCATTTATTTGGGAGATTGTGCACAGACTAGCAAACTGGGTGGTGGGGGAGGAATAGAGGGAAGAGAGAGACTCGAGCAGATTCCACGCTAAGCATGCAGCTTGACACAGGGCTTGATCTCACAACCCTGAGAGTACAACCCCAGCCAAAATTAAGAGTCGGACGCTTAACCACCTAAGCCACTCAGGCACCCCAAGTTGAAAAGACTTTTAAGTTCTCTTTTTAGCACTGTAAGATTTTACGACCTAAAAACTAATCTTAACTCAATGAGTAACTAAGAGATTTCTAACTTCCTAAGCATTATTATTAGTAGCATCAATCAATAAATTACCACAGAAAAGGAGGTATGAGCTAAAACAAACTGTTCTAAAATATTGGTTAAAAAAGGAAGGGGGATGAGAATCAAAGGACATATGGAAGAAAGTTAAAATGACTATTAATAGTGAAGGAATCAAAAGTAACCCTGAGTCTGAGGGGAGAACCGAGATGACATTCTTCTGGCAATCCTTCACGACGGCAAACTATCAACTTTATAGGAAAAAGTTATTTCAATTGAAAAAGATTTCCCAAGCAAGTCTGGTGAATGAGCTTAGAATTCAAATTCATGATACAGCACTGATTCAAAAGCAAAATGTGCCAGAAATTGAGGGACAGGGCTCAGTATTTCCGAAAAGCGAGTTGTAAAAGGAAATTTCAGAAATCTGACTTCCGCAATTAATGCAGATGGTCTGTTAATGGTAACTCTATTTAGCACTCACTTTAATACATATTCTAAAATACTTCTTTAAAAATTACTACTACTACTACTACTGGCGATGGGTGGCTCAAGTGGTTGAGTCTGCCTTTGGCTTGACGTCAGGGTCCTGGAGTCCTGGGATCGAGTCCCACATCAGACCCCCAATGGGGAGCCTGCTTCTCTCTGTGTGTCTCTCATGGATAAATAAATAAATCTTTAAAAAGAAATTACTACTACTGTTACTTCACAATCAGACTATTCTATCATCCCTATTTTCCAATAATTAAGCATCTGGCTGGGAAAGCAAAACACAGTTAGTTACACAAAAGATAAGACAAAGGACCTACATTTCCAACAAAGCTAGACCGCATATTACACACCAACCCTCTTGCAATTAAAAAGTTAGACAAATGTATATTTTTTTTAATTCTTAAAAATATCAGAGGATATAAACTGGTGCAACCGCTTTGAAAAACTGATAGTTAACTACTGAAGCTAAATTATATCTACCAACAGCACCATACCCAGGAATACTTCCAAAAGAAGGAAGTGCATATCCGACAAAATACACATGTAAGAATGTTTGTAGCAGATTTATTATAGTAGTCCAAAATTGGAAATGATGCAAATGCCATTAAAAGTAGAATGGATAACCAAACTGTGATAGATCTGTATATGAGGCTACTACTATAGCACACTGTATTTTCCAATAATGGTGCCTACAATACTTCTGGTCTCACAAGCTCTTCCAGAACCTCAACTCCCCCCATCAAGAGGTAGAGTCCATTTCCCCTCTCTTTAAACCTCGGCAGGCTCATAACTGCTTCAAAGAGCAGAATACAATGGAAGGAAAATTGCATTAAGTTTCAAAGCCAAGTCATAAGAGGCAATCTAGTGTCTGTCTGGCCCATGGGCTCTCCACCCCACTCCACTCCCCACTGCCTGTGGGTGCAGGACACTAGCCCTTGGAACACTGCCACCGTACTATTAAGCACAGTCAGGCCACATTTAGGTGTTCCGTCATCAACCAGCAGACATGTGAGTAAACCTTCAAACACTTTTAGGCCCAGCCTTCAAACAGCCCTACTTGAAACCAAATGAAGCTAAGACAAGCATTGCACAAATTACAGTGTTGTGCAGAAAATATATGTTGTCACTGTTTAAGTCACTGAGTTGCTAGGCAATTTTTTAGGTGCTACAGTAACTACAAGTACAGTAACTACAAGAAACACTACTGCTATGTGCAACAACACAGCTGAATTTCACTGATACTATACAATGTTGAACAAAACAAGCCAGATCAGACACACGGGAGTAAAACATACCGTATGATACTATTTTGAAAAGAAAACTAAAAACTGCAAAACTGTTGACAGAAAACCAAGTAATTGCAACCTGCATCAGGAAAGGAAGATATAGATGGGGAAGGGGTGTGACAAGGTCTTCTGGGGTGGCAAAAATGTTCTACATCTTGAACTGGATATGATTACATATTTAGTTACATTCATAAAAATTCTTCAGGTTATACATTTAAGATTGGTGCACATTATTATATGTATATTATACCTTAATGAAAACGCAGGAGAGGATAGTAATCAAAGAGCTAACAAGGTAATAAGGAACTACTAGGCACAGTAGTCCAAGAGGACAGAGAGGAGCACAGCACCCTGGGGTCTCTTGTCCCCTGGAAATGCCTGCCTAATCAAAAAACTGCATGTAGGCAGGCTAGGAAAGTAGGAAGACAAAATGTCAGAGTACAAGATCCACCAAAGGAGCCATCCCTTGCTTTAGAATAAGACCCCAAAAAGCTGAATCCTGGAAGAGAGAACACAGAAGGAAACTAAACCAGTCATTGCATAGATAGACTCAAAAAAACAAACACAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
>URS00023D8047 lncRNA from 1 species 
TAGGGTTTGATTTAGGGTTTAGGGTTTGGTTTAGGATTTGTTTGGAATTTGGTTTAAAGTTTGTTTAGAGTTTGGTTTAGGATTTAGGGTTTGATTTAGGATTTAGGATTTTATTAGGATGTAAGATTTAATTAGTTTTGGCCTAAAGTTTGAATGAAGTTCAATAGGATTTTGACTAGAATTAAATTAAGATTGAATTGAGATGTATTTGAGTGATATTTGTGATCATTCTAATATTTCTTTAAGAATTTTTATTGTTGATTTGAAATTTCTTTGAGGTTTTTTTGTATTTGATTAAGCTTGCATAGCATTATTATGGTCTAATTAGAGCATTTTTAGTATTCTATTAGAATTAGAATTTTGTTATTGTAATTTCCATTCTTTCTTGTAGAGCTAAATGCCCAGAGCA
>URS0001D8C773 rRNA from 1 species 
TCCTGGAAATAGCCTCCCTATTAGACCGTACCCGAAACCGACACAGGTGGTCAGGTAGAGAATACCAAGGCGCTTGAGAGAACTGCGTTGAAGGAACTCGGCAAATTGCACGCGTAACTTCGGAAGAAGCGTGACCCTCACTCACGCAAGTGGATGAGGGTGGCACAGACCAGGGGGTAGCGACTGTTTATCAAAAACACAGG
>URS00006048F4 rRNA from 1 species 
GAAATCCCTCGGGATGTAAACTTCGCAAGAACGGGAAGAATAAGTAGGGGACAATACCCCCTATGATGACGGTACCGTTTGTAAGCTCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGGGGGAGCAAGCGTTGTTCGGATTTACTGGGCGTAAAGGGCGCGTAGGCGGCCAGCACAAGTCAGTTGTGAAATCTCCGAGCTTAACTCGGAAAGGTCAACTGATACTGTGCGGCTAGAGTGCGGAAGGGGCAACTGGAATTCTTGGTGTAGCGGTGAAATGCGTAGATATCAAGAGGAACACCTGCGGCGAAGGCGGGTTGCTGGGCCGACACTGACGCTGAGGCGCGAAAGCTAGGGGAGCGAACGGGATTAGATACCCCGGTAGTCCTAGCCTTAAACGATGAATGCTTGGTGTCTGGGGTTATAAAGTCCCCGGGTGCCGTCGCTAACGCTTTAAGCATTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAG
>URS0000A15EFB rRNA from 1 species 
AGCAGAGCACGTCCTACGGGAGGCGAGCAGTGGGGAATCTTAGAGCAATGGGGAAACCCCTGATCTAGCCATGCCGCGTGAGCGATGAAGGCCTTAGGGTTGTAAAGCTCTTTCAGCTGGGAAGATAATGACGGTACCAGCAGAAGAAGCCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCATGCAGGTGGTTTGTTAAGTCAGATGTGAAAGCCCGGGGCTCAACCTCGGAATTGCATTTGAAACTGGCAGGCTAGAGTACTGTAGAGGGGGGTAGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAGATACTGACACTCAGATGCGAAAGCGTGGGAGCAAACAGGATTAGATACCCTGGTAG
>URS0001056185 rRNA from 1 species 
TACCAGCACCCCGAGTGGTCGGGACGATTATTGGGCCTAAAGCATCCGTAGCCGGTTCTGCAAGTCCCCCGTTAAATCCAGCTGCTCAACAGATGGGCCGCGGAGGATACTACAGAGCTAGGAGGCAGGAGAGGCAAGCGGTACTCAGTGGGTAGGGGTAAAATCCGTTGATCCATTGAAGACCACCAGTGGCGAAGGCGGCTTGCCAGAACGCGCTCGACGGTGAGGGATGAAAGCTGGGGGAGCAAACCGGGATTAGAA
>URS000182C5B8 rRNA from 1 species 
ACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGGCGGAAGCCTGAACCAGCCAAGTCGCGTGAAGGATGAAGGTATTATGTATTGTAAACTTCTTTAGATGCAGAGAAATAAGCCCCTCGCGAGGGGTGATGCTAGTATGCATAGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGCAGGCGGCGCGTTAAGTCAGCGGTGAAATGCAGGGGCCCAACCCCGGCAGTGCCGTTGATACTGGCGTGCTGGAATGCGGTCGAGGCGGGCGGAATGTGGCGTGTAGCGGTGAAATGCATAGATATGCCACAGAACTCCGATAGCGAAGGCAGCTCGCCAGGCCTGCATTGACGCTCAGGCACGAAAGCGTGGGGATCGAACAGGATTAGATACCCTGGTA
>URS0002400B5F lncRNA from 1 species 
TTTATTGATGAAGAAGGGTGTAGAAGTATTTTTGTGGTTTTTTTTTTGTAGAGAAAGGACAGGAATGTTTTTGTGTTTTTTGTTTATTATGACTGGGCCATATAGAATATGGTTGCCTACGTACTCCCGTGTATCAGGGAGATCAGGTCGACGTAGTTCACCCCTCAGGATGAATTGCAGTTGAAGAGAAGTGTGAATCCCATGTGCATGCTATACTGCGGGGAGAAGAAAGTTTGATACCATGATGGGGACAAACTGTAGGTTTGGAAAAAGTTTGATCCCGTCTTTAAGACAAACTGCAAGCGTAGAAAAGTTTAATCCCGTCTTCAGGATAAACTGCAGGTGTGAAAGGTTCAATTCCGTCTTCTGGATAACCGAAATTGTATGGAAGGTTTGAAATGAGGTGAAACTAGGCTGCTGGTTTGAAGTGTATATTTCCCTGAGGAGCAGAAGAGTATGTATAAAAGGTTAGAAACCGG
>URS00004FA46A piRNA from 1 species 
TCTGAAACCAGAGGTACAGGTGTA
>URS000239D036 lncRNA from 1 species 
AAGTGAGGGTTAATATAATTTTTCTACTCCTAATATTGGTTTTTATTTAGAAGAATCATAAACTACCGAAGTTTAAAGAGACTATGCTTTTAGATTCTAAGCCCAATGATTTGGGCATATAGTAATGGGTAAATCTTTTATGATTGGCACTGCATACATTAACGAATTGGTATGCATGCTACATATACAAAATTAATTTGCAGATCTAAATTCAGATGATGTGAGATTTATCTAACTTCATTTATACACTGACAGTATAGAAAAGTTAATCCATATTAATAGGATAAATCTTTTCTGTATCGACACTGTATACATTAGTGGATTTAGATGCATGCCACACACATAAAATCTCAGGGGTACCAAGTTATATTTCTAAAACCACAGGGGGCCAAGTGATGTTAAGAGAAACTTCAAAGGAGGTTTCTAATATTATTCCAACACATATTCAGTAGGCAAAAGATACTATTTCAATTATTTAGGTGGCAACGAGTTTTTTTTTGGCCTTATCACTGCATGTGATACTCGTGTACAAGGACAAAACTAGGGGATTAGGGCTGAAGTTTTATAGAATTCAATTTTCCTCCCTTACAAAATTACATATTGTCAAATCAAATAATCTTGCTCCCGAAAAAACCTAAAGATATTTATATTATA
>URS00001FA05A rRNA from 1 species 
AGAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGGCAGCATGAGATGGGGTAACCCATTTTGATGGCGAGTGGCGGACGGGTGAGTAATATGTAGGAATCTACCTAGAGGAGCGGGATAACTTAGGGAAACTTAAGCTAATACCACATAATCCCTACGGGGGAAAGCAGGGGACCGCAAGGCCTTGCGCCTTATGATGAGCCTACATCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGATGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGCAACCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTTAGGGTTGTAAAGCACTTTCAGTGGGGAGGAAGTTTATTGTGTTAATACCATAATGAATTGACGTTACCCACAGAAGAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGGGTGTGTAGGTGGTTGCGTAAGTTAGATGTGAAATCCCCGGGCTTAACCTGGGAACTGCGTTTAAAACTGCGTAGCTAGAGTATTGCAGAGGATAGTGGAATTTCCAGTGTAGCGGTGAAATGCGTAGATATTGGAAGGAACACCAGTGGCGAAGGCGACTATCTGGGCAGATACTGACACTGAGACACGAAAGCGTGGGGAGCAAACAGGA
>URS0001FB0CF8 rRNA from 1 species 
GGGCACCGGGGGGGTGCCTAATACATGCAGTCGAACGCGTTGGCCCAATTGATTGATGGTGCTTGCACCTGATTGATTTTGGTCGCCAACGAGTGGCGGACGGGTGAGTAACACGTAGGTAACCTGCCCAGAAGCGGGGGACAACATTTGGAAACAGATGCTAATACCGCATAACAGCGTTGTTCGCATGAACAACGCTTAAAAGATGGCTTCTCGCTATCACTTCTGGATGGACCTGCGGTGCATTAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGATGATGCATAGCCGAGTTGAGAGACTGATCGGCCACAATGGGACTGAGACACGGCCCATACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCACAATGGGCGCAAGCCTGATGGAGCAACACCGCGTGAGTGAAGAAGGGTTTCGGCTCGTAAAGCTCTGTTGTTAAAGAAGAACACGTATGAGAGTAACTGTTCATACGTTGACGGTATTTAACCAGAAAGTCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGATTTATTGGGCGTAAAGAGAGTGCAGGCGGTTTTCTAAGTCTGATGTGAAAGCCTTCGGCTTAACCGGAGAAGTGCATCGGAAACTGGATAACTTGAGTGCAGAAGAGGGTAGTGGAACTCCATGTGTAGCGGTGGAATGCGTAGATATATGGAAGAACACCAGTGGCGAAGGCGGCTACCTGGTCTGCAACTGACGCTGAGACTCGAAAGCATGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCATGCCGTAAACGATGAGTGCTAGGTGTTGGAGGGTTTCCGCCCTTCAGTGCCGGAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCTACGCGAAGAACCTTACCAGGTCTTGACATCTTGCGCCAACCCTAGAGATAGGGCGTTTCCTTCGGGAACGCAATGACAGGTGGTGCATGGTCGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTACTAGTTGCCAGCATTAAGTTGGGCACTCTAGTGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGACGACGTCAGATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGACGGTACAACGAGTCGCGAACTCGCGAGGGCAAGCAAATCTCTTAAAACCGTTCTCAGTTCGGACTGCAGGCTGCAACTCGCCTGCACGAAGTCGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGAGAGTTTGTAACACCCAAAGTCGGTGGGGTAACCTTTTAGGAGCCAGCCGCGAAGGTGGAACAGGAT
>URS0001125F2F rRNA from 1 species 
TACGGGGGGGGCAAGCGTTGTTCGGATTACTGGGCGTAAAGGGCGCGTAGGCGGTCAGCACAAGTCAGTTGTGAAATCTCCGGGCTTAACCCGGAAAGGTCAACTGATACTGTGCGACTAGAGTGCGGAAGGGGCAACTGGAATTCTCGGTGTAGCGGTGAAATGCGTAGATATCGAGAGGAACACCTGCGGCGAAGGCGGCATCCTGGACCGGTATTGACGCTGAGGCGCGAAAGCCAGGGGAGCAAACGGG
>URS00020FB289 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGATGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTCCCTATAAGAGTGGGATAACTTCGGGAAACCGGATCAAATACCGGATAATATATTGAACCGTGTGGTTCAATGGTGAAAGACGGTTTTGCTGTAACTTATAGATGGTTCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGGTACGATGCGTAGCCGACCGGCGAGGGGGATCGGCCACACGGGAACTGGGACACGGTCCAGGCGCCTACGGGAGGCAGCAGTAGGGAATGGTCCGCAATGGTCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS000014A96C rRNA from 1 species 
AGCCATGCATGTCTAAGTATAAACTGCTTATACTGTGAAACTGCGAATGGCTCATTAAATCAGTTATAGTTTATTTGATGGTACCCACTACTCGGATAACCGTAGTAATTCTAGAGCTAATACGTGCGTACATCCCGACTTCTGGAAGGGACGTATTTATTAGATAAAAGGCCAGCCGAACTTTGTTCGACCTGCGTTGACTCATGATAACTTCACGAATCGCACGGCCTTGTGCCGGCGATGTTTCATTCAAATTTCTGCCCTATCAACTTTCGATGGTAGGATAGAGGCCTACCATGGTGGTAACGGGTGACGGAGGATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGCAAATTACCCAATCCCGACACGGGGAGGTAGTGACAATAAATAACAATACCGGGCATTTAATGTCTGGTAATTGGAATGAGTACAATCTAAATCCCCTAACGAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTTAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTCGGGTGGGTGCTAGCGGTCCGGCTCTGCTGTGTACTGCTAGTGCCTATCTTTCTGTCGGGGACGGGCTCTTGGGCTTCATTGTCCGGGACTCGGAGTCGACGTGGTTACTTTGAGTAAATTAGAGTGTTCAAAGCAAGCGTTCGCTGTGAATACATTAGCATGGAATAACACGATAGGACTCTGGCTTATCTTGTTGGTCTGTAAGACCGGAGTAATGATTAAGAGGGACAGTCGGGGGCATTCGTATTTCATTGTCAGAGGTGAAATTCTTGGATTTATGAAAGACGAACTTCTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTGGGGGCTCGAAGACGATTAGATACCGTCGTAGTCTCAACCATAAACGATGCCGACTAGGGATTGGCAGGTGTTTCGTTGATGACCCTGCCAGCACCTTATGAGAAATCAAAGTTTTTGGGTTCCGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGGCGGAAGGGCACCACCAGGCGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTTACCAGGTCCAGACACGGGGAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTGTG
>URS00019D9398 rRNA from 1 species 
TGGCGGCGTGCCTAATACATGCAAGTCGAGCGGACAGAAGGGAGCTTGCTCCCGGATGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGAGCTAATACCGGATAGTTCCTTGAACCGCATGGTTCAAGGATGAAAGACGGTTTCGGCTGTCACTTACAGATGGACCCGCGGCGCATTAGCTAGTTGGTGGGGTAATGGCTCACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTGCGAGAGTAACTGCTCGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGAAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGACAACCCTAGAGATAGGGCTTTCCCTTCGGGGACAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATCTTAGTTGCCAGCATTCAGTTGGGCACTCTAAGGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGACAGAACAAAGGGCTGCAAGACCGCAAGGTTTAGCCAATCCCATAAATCTGTTCTCAGTTCGGATCGCAGTCTGCAACTCGACTGCGTGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGCAACACCCGAAGTCGGTGAGGTAACCTTTATGGAGCCAGCCGCCGAAG
>URS0000FD7098 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGGGTGCGTAGGCGGGTCTTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGAAGATCTTGAGTTCGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGATACTGACGCTGAGGTGCGAAAGCTAGGGGAGCAAACGGG
>URS000131717B rRNA from 1 species 
TACGAAGGTGGCAAGCGTTACTCGGAATTACTAGGCGTAAAGGGCAGGTAGGCGGTTTGGTTAGTCTGTTGTGAAAGCTCCTTGCTTAACGGGGAGAGGCCAACGGATACTGCCAGACTTGAGTATAGGAGAGGGTACTGGAATTCCCGGTGTAGCGGTGAAATGCGCAGAGATCGGGAGGAACACCAATGGCGAAAGCAGGTACCTGGACTATTACTGACGCTCAGCTGCGAAAGCTAGGGGAGCAAACAGG
>URS000115C7E9 rRNA from 1 species 
TACGGAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGCTTTGTAAGTTAGAGGTGAAAGCCCGGAGCTCAACTCCGGAACTGCCTTTAAGACTGCATCGCTTGAACGTCGGAGAGGTAAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGACCGGTACTGGCGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGG
>URS0000E4B3A6 misc_RNA from 1 species 
GCGTCCGTTTCTGTCCTGTCGTCGAGGGAAGCGCTGGGATTTATCCCAGCCGTCCCTCGACGGTCGTGTTGAGGCGTCGTCCGGGAACGGGCGTCCCTTCAAGTGCGAA
>URS00023A6056 lncRNA from 1 species 
TACTTTGGCTAAAGACTTCCAGAATCATCGATCTATGATATCACATAGGATGTTTGCTCTCCTTATTAGGAGTGACTGATCCCTCATTGATTACTCACAACCTTCATGCATACTTTACCACATCCAAAATATCCCATATAAGGATCAAAGAATCAAGTTAGGTAGTGAACCAAAATATGGATTCATGTACACAAGGTATTATGACGATCTCAGGTCAAAGGATCACTTACACAACTCCCATT
>URS0000CE10A7 sRNA from 1 species 
TTATTACAAAAAAATGCTGTTTAATTTCACATGATAGAGTTATATGGTAGAACGGTTTGGATTGATATTATGGAATATATACCACGCGTAAAATCTTAAAATTAAATAT
>URS000013D6AF rRNA from 1 species 
CAAATGACTCTCGGCAATGGATATCTTGGCTCTTGCATCGATGAAGAACGTAGTGAAATGCGATACTTGGTGTGAATTGCAGAATCTCGTGAACCATTGAGTCTTTGAACGCAAGTTGTGCCCGAGGCCTTGCGGTCGAAGGCACGCCTGCTTGGGCGTCATT
>URS0002063A20 rRNA from 1 species 
TTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAAGGGAGCTTGCTCCTGGATTCAGCGGCGGACGGGTGAGTAATGCCTAGGAATCTGCCTGGTAGTGGGGGATAACGTCCGGAAACGGGCGCTAATACCGCATACGTCCTGAGGGAGAAAGTGGGGGATCTTCGGACCTCACGCTATCAGATGAGCCTAGGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCGAAACTGGTCTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCAGTAAGTTAATACCTTGCTGTTTTGACGTTACCAACAGAATAAGCACCGGCTAACTTCGTG
>URS0001992F3F lncRNA from 1 species 
CAGAACCGAAGATCGCTTACGTTTCCACACGGACCCGTTTTAGTGACGTACCCATCTGCCGTCAGCTTCTGTAAGTTTGGTGACTTGATTTTAATCGTGTTCTGTTCATTTACCTGCTTCCTAAACATAGGTGAACTCTTCTAATGTCTACCATAGAGACTTGCTGTAAGCTACAGACGTCTTTTCTGAATGGAGAAGATGGAGGATTATCCACTCTACTGCATCAAATGATTCCAGCATTACTGATCTGCACCCTAGAATATCCTGGAATAATCACTTGTGCAGTTTTGATGACATCTCTTGAAGTGTTATGA
>URS0001E8D186 rRNA from 1 species 
TGAGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGCAGGAAGAAGCATCTATGGTGTGTATCCTGCTTTTGTACGGGAAGAAACACTCCTTCGTGAAGGAGCTTGACGGTACCGTAAGAATAAGGATCGGCTAATTCCGTGCCAGCATCCGCGGTTATACGGAGGATCCCAGCGTTATCCGGAATCATTGGGTTTAAAGGGTCCGTAGGCGGTTTAGTAAGTCAGTGGTGAAAGCCCGTCGCTCAACGATGGAACGGCCATTGATACTGCTAGGCTTGAATTATTAGGAAGTAGATAGAATATGTAGTGTAGCAGTGAAATGCTTAGATATTACAAGGAATACCAATTGCGAAGGCAGGTTACTACGAATGGATTGACGCTGATGGACGAAAGCGTGGGGAGCAAACA
>URS000118D854 rRNA from 1 species 
TACAGAGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCGCGTAGGCGGCCTTCTAAGTCGAACGTGAAATCCCCGGGCTCAACCCGGGAACTGCGTCCGATACTGGAAGGCTTGAATCCGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGGTTCTCTGGGCATTGCCTGACGCTGAGGAGCGAAAGTGTGGGGAGCGAACAGG
>URS00010E7D1D rRNA from 1 species 
TACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCGCGTAGGCGGTGCGGTAAGTCACCTGTGAAATCTCCTGGCTCAACTGGGAGCTTGCAGGCGAAACTGCCGTGCTGGAGTGTGGGAGAGGTGCGTGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCTGTGGCGAAAGCGGCGCACTGGACCACAACTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACAGG
>URS00009F8AF6 misc_RNA from 1 species 
CCTGTTGAAGATGGAAGAGTTGGCTGAGATGCCACGGATGTGTTTGACCCTTTTGAAAAAAAGTTGCCTGGGACATCAGTTACAGGTTGAGCAGCAGATCCAGTTGAAGCTTGATAGCCAACTTGTGAAGCAACAGGGGCAGTAGAGCCTTGTGGGAAAATGTTTTCATTGTTAAACTGTGGAGTTGGTCCTATTGCATTTTGATGAGCAACTTGTAAGCCTACTGGGGCAGCAGAACCCTGTTGTTGGAAAAGGTTTCCATTGTTAAACTGTGGAGTTGGTCCCGTTGCATGGTAAGCAGCT
>URS0002410C40 lncRNA from 1 species 
CAGTCTCTCTCTAACTTTATCCTGGTATAGCATCCGTCTCTTATCCTTTATCTCTGTGAATCTCTCTCGCTAACTCTTTCTCTCTCTTGGAGCATAAAAATCCATCCATCTCAAACTTAGTGGTTTACTTCTTTACTATGTTTTTAGATAGAAAAAGAACTTGGGTATTTTGTTGTTATAGAGAAGAAAGGAAGAATAAATTCCTAAGTTCTTTATCTTTCAAAGCTTCCGCTCAACTTTAGCTTTTAACCCAAAAGAATCTCTTCATTTTGACGCGCCCACAGCCACAAAAAACAGCAACAGTAAGTCAGTCACAGAGTTGGTGGCAAAAAATCTCTTCACATCAGGATTAGGTTTGGGGATTGGGTGTGAGAGAGAAGCAGCAGGCAAATATACAAAATCTCAAAGAAGATCGAAGGATTAGGTTTGGGGATGAGCCTTAATCTGTTTTTTTTTTTTTCCTAAAAATGTTAGGC
>URS0002280BA0 misc_RNA from 1 species 
GAAATGCGATAATTAATGTGAATTGCAGAATTCAGTGAATCATCGAGTCTTTGAACGCACATTGCGCCCCCTGGTATTCCGGGGGGCATGCCTGTCCGAGCGTCATTGCTACCCTCAAGCACGGCTTGTGTGTTGGGCTTCCGTCCCTGGCAACGGGGACCGGCCCAAAAGGCAGTGGCGGCACCATGTCTGGTCCTCGAGCGTATGGGGCTTTGTCACCCGCTCCCGTAGGTCCAGCTGGCAGCTAGCCTCGCAACCAATCTTTTTAACCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGC
>URS00016372AB rRNA from 1 species 
CAGTCGCCGCGGTAATACCGAGGGTGCGAGCGTTAATCGGATTTACTGGGCGTAAAGCGTGCGTAGGCGGCTTTTTAAGTCGGATGTGAAATCCCTGAGCTTAACTTAGGAATTGCATTCGATACTGGGAAGCTAGAGTATGGGAGAGGATGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGATGGCGAAGGCAGCCATCTGGCCTAATACTGACGCTGAGGTACGAAAGCATGGGGAGCAAACAGGATTAGATACCCGTGTAGTCCCTGTCTCTTATAA
>URS00017BF492 rRNA from 1 species 
TACGTAGGGTCCGAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTTTGTCACGTCGGGCGTGAAAACTCAGGGCTCAACCCTGAGCGTGCGTTCGATACGGGCAGACTAGAGGTATGCAGGGGAGAACGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS00019F2EB9 rRNA from 1 species 
GGCGGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGAAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGACAACCCTAGAGATAG
>URS000031863D rRNA from 1 species 
TTGGCGGACGGGTGAGTAACGCGTGAGTAACCTGCCTTCAAGAGGGGGATAACATTCTGAAAAGAATGCTAATACCGCATAATGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTTGTTGGTGGGGTAACGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGACGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCATG
>URS00002862DB rRNA from 1 species 
CGGGTGAGTAACACGTGAGCAACCTGCCTTTCAGTGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATAACGTGCCGGAAGGGCATCCTTTTGGTACCAAAGATTTATCGCTGAAAGATGGGCTCGCGTCTGATTAGATAGTTGGTGAGGTAACGGCCCACCAAGTCGACGATCAGTAGCCGGACTGAGAGGTTGATCGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAG
>URS0002137456 rRNA from 1 species 
GAAAGTAAGAAAGGGCGTATGGCGGATGCCTAGGCTCACGGAGGCGATGAAGGACGTGATAAGCTGCGATAAGCTTCGGGTAGGTGCAAATAACCCTTGATCCGGAGATTTCCGAATGGGACAACCTAGCCGTCTGAAGGACGGTTACTCAATCTTCAAGGTTGAGAGCTAACGCAGGGAACTGAAACATCTTAGTACCTGCAGGAAGAGAAAATAAATGAATGATTCCCCTAGTAGTGGCGAGCGAACGGGGAACAGCCCAAACCGTTGACGTCGCAAGGCGCCAGCGGGGTTGTAGGACCGCGACATTGTATGCAAATCGTGAACAGAACACTTTGGAAAATGTGACCATAGACGGTGATAGTCCAGTATGTGAAGCGAAATGCAGCATAGCGGTATCCTGAGTAACGCGGGACACGAGGAATCCTGCGCGAATCTGCCGGGACCATCCGGTAAGGCTAAATACTCCCGTGAGACCGATAGCGAACGAGTACTGTGAAGGAAAGGTGAAAAGAACCCCGAGCAGGGGAGTGAAATAGTTCCTGAAACCATACGCCTACAAGCGGTCGGAGCATCTTACGATGTGACGGCGTGCCTTTTGCATAATGATCCTACGAGTTACCGTCACTGGCGAGGTTGAGTGTCACGAGACACGTAGCCGCAGTGAAAGCGAGCCTGAACAGGGCGCATAGTCAGTGGGGGTAGACGCGAAACCAAGTGATCTACACTTGGCCAGGATGAAGTCCCGGTAACACGGGATGGAGGTCCGCACCAATAAGCGTTGAAAAGCTTCTGGATGAGCCGAGTGTAGGAGTGAAAGGCCAATCAAACTTGGAGATAGCTCGTACTCCCCGAAAGGCATTTAGGTGCCGCGTCGGATGGTCACCGTGAGAGGTAGAGCGACCGATAGGACAAGAGGGCTTCACCGCCTATCGAGTCCTGACGAACTCCGAATGCTCACGGTCTGCAGTCCGGCAGTAAGGGGGCGGGTGCTAAGGTCCGTCCCCGAGAGGAGAAGAATCCAGACCGCCGTCTAAGGTCCCGGAGTTCTGCCTGAGTTAGTCTAACGAAGTCTGGTCCCCGCGACAGCTAGGATGTTGGCTTGGAAGCAGCCATTCATTTAAAGAGTGCGTAACAGCTCACTAGTCGAGGAGTCGGGCGTGGATAATAATCGGGTATTAAGTTGTCTACCGAAGCAGTGGGATCATTAATATGATCGGTAGGGGAGCATTCCAGTCGGCGTCGAAGGCGTACCGTGAGGTATTCTGGAGCGTCTGGAAAAGCAAATGTAGGTATAAGTAACGATAAAGGGGGCGGGAAACCCCCTCGCCGAAAGACTAAGGTTTCCTGATCAACGCTAATCGGATCAGGGTCAGTCGGGTCCTAAGGCTCAGCCGAACGGCGATGCCGATGGCAGAAACGGTTAATATTCCGTTACTACCTTCAGGAGTGACGTGGAGACGCAGTAGTGACAGTGCCGCCATCTGACGGAATAGATGGTTGAAGGGTGTAGGAGTCGATCATGGCAGGCAAATCCACCATGAGATCCGAACCTGATAGTATGCCGCGTCCTTCGGGACAAGGCAATAGTGCGCGTAAGCATGCTGCCGAGAAAATCCGCTAAACTTAATCCTGCAGGTACCCGTACCGCAAACGGACACACGTAGTCGGGATGAATATTCTAAGGCGCTTGAGTGATTCACGGTTAAGGAACTAGGCAAACTGACCCTGTAACTTCGGGAAAAAGGGTCCCGTCTCGCAAGAGCGGGCGCAGAGAATAGGTCCAGGCAACTGTTTAACAAAAACACAGGGCTGTGCGAAGTTTAAAGACGAAGTATACAGCCTGACACCTGCCCGGTGCCGGAAGGTTAAGAGGAGACGTCATCGCAAGAGAAGCGTTGAATTGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGG
>URS000140E52B rRNA from 1 species 
TACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGCCTTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAAGGTCATTGGAAACTGAAAGGCTTGAGTACAGAAGAGGAAAGCGGAATTCCACGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAATACCGATGGCGAAGGCAGGTCTCTGGGCTGACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS0001C1D63F rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGCACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATAGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGT
>URS0000AD8EAF misc_RNA from 1 species 
TGTGGGAGCGGGCTTGCCCGCGATAGCGGTGTGTCAGTCGATAGCAATGTTGGCTGGCAGTCAGTCATCGCGGGCAAGCCCGCTCCCACA
>URS000009FFA8 rRNA from 1 species 
AGTCTCAGATAGCCATGCATGTCTAAGTATAAACGCTTTATACTGTGAAACTGCGAATGGCTCATTATATCAGTTATAGTTTATTTGATAATCTCTTACTACTTGGATAACCGTAGTAATTCTAGAGCTAATACATGCATAAATACCTAACTTTCGGGAAGGGTAGTATTTATTAGATTGAAACCAATTGATCTCGGTCATATTGTGGTGATTCATAATAACTTTGCGGACCGCATGGCTTTACGCCGGCGGTAGATCATTCAAGTTTCTGCCCTATCAGCTTTGGATGGTAGGGTATTGGCCTACCATGGCTTTAACGGGTAACGGAGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAGACGGCTACCACATCCAAGGAAGGCAGCAGGCGCGTAAATTACCCAATCCTGACACAGGGAGGTAGTGACAATAAATAACAATGCCGGGCCTTTTTAGGTCTGGCAATTGGAATGAGAACAATTTAAATCCCTTATC
>URS0001F65059 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCTCCTGCTTGCAGGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGGGTGATCTGCCCTGCACTTCGGGATAAGCCTGGGAAACTGGGTCTAATACCGGATAGGACCACATTTTGGATGGTGTGGTGGAAAGTTTTTCGGTGTGGGATGAGCTCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGTCGACGGGTAGCCGGCCTGAGAGGGTGTACGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAGGCCTGATGCAGCGACGCCGCGTGGGGGATGACGGCCTTCGGGTTGTAAACTCCTTTCGCTAGGGACGAAGCGCAAGTGACGGTACCTGGAGAAGAAGCACCGGCTAACTACGTG
>URS000066A79F rRNA from 1 species 
AGCTATGGCTCTGTTGTATTAGGGATGTAGGCAGTTTCTTTCTCGTCTGATCTCGGAAGCTAAGCAGGGTCGGGCCTGGTTAGTACTTGGATGGGAGACCGCCTGGGAATACCGGGTGCTGTAGGCT
>URS0000B505A9 rRNA from 1 species 
TACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTCGTTAAGTTCGTTGTGAAAGCCCCGGGCTCAACCTGGGAACGGCAATGGAAACTGGCGGGCTTGAGTGCGGCAGAGGGGGGTGGAATTCCGCGTGTAGCAGTGAAATGCGTAGAGATGCGGAGGAACACCGATGGCGAAGGCAGCCCCCTGGGCCGACACTGACGCTCAGGCACGAAAGCGTGGGGAGCAAACAGG
>URS000084F4BB rRNA from 1 species 
ACCTGGCTCAGGACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGGACAGAAGGGAGCTTGCTCCCGGATGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGAGCTAATACCGGATAGTTCCTTGAACCGCATGGTTCAAGGATGAAAGACGGTTTCGGCTGTCACTTACAGATGGACCCGCGGCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTGCAAGAGTAACTGCTTGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAACTGGGAAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGACAACCCTAGAGATAGGGCTTTCCCTTCGGGGACAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATCTTAGTTGCCAGCATTCAGTTGGGCACTCTAAGGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGACAGAACAAAGGGCTGCGAGACCGCAAGGTTTAGCCAATCCCACAAATCTGTTCTCAGTTCGGATCGCAGTCTGCAACTCGACTGCGTGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGCAACACCCGAAGTCGGTGAGGTAACCTTTATGGAGCCAGCCGCCGAAGGTGGGGCAGATGATTGGGGTGAAGTCGTAACAAGGTTA
>URS0002524E6B rRNA from 1 species 
ATGGTCGTAGCAGTTGCGATATGGATCATAGGATTCTTTTCTGTTCGCCGCAGGAGTATTTTACCTGTAAAGTTGCGATGCCGATCAAAATGCTGCTTGTTTTCTCTTCTTCCCCACATGGCCACGCCCACCGGATCTTGGACTTCACACCTCTTTCCATTATTTTTAGTTCCCGTTGGAGCGTATCTGTACGTCTGCACCTCAACAAGAATGTTCTCTCACTGGTATTTGATTAATACTACCACTAGTTTTTTGGAGAATGTTTGGTAA
>URS00020B9359 rRNA from 1 species 
GACGAATGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTGCAGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGGGTGATCTGCCCTGCACTTCGGGGTAAGCCTGGGAAACTGGGTCTAATACCGGATAGGAACCATTTTTAGTGTGATGGTTGGAAAGTTTTTTCGGTGTAGGATGAGCTCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGGCGACGGGTAGCCGGCCTGAGAGGGTGGACGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGGGGGATGACGGCCTTCGGGTTGTAAACTCCTTTCGCTAGGGACGAAGCTTTTGTGACGGTACCTAGAGAAGAAGCACCGGCTAACTACGTG
>URS000047804E rRNA from 1 species 
GATCCTGGCTCAGGATGAACGCTGGCGGCATGCTTAACACATGCAAGTCGAACGAAGCCATAGGAAGCTTGCTTTCTTTGAAGCTTAGTGGCGGACGGGTGAGTAACGCGTGAGTAACCTGCCCTCGAGTGGGGAATAACATCGAGAAATCGGTGCTAATACCGCATAACGTCGGAGAACCGCATGATTTTCCGACCAAAGGATTTATTCGCTTGAGGATGGACTCGCGTCCGATTAGCTAGTTGGTGAGGTAACGGCCCACCCAAGGCGACGATCGGTAGCCGAACTGAGAGGTTGATCGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGCGAAAGCCTGACCCAGCAATGCCGCGTGAAGGATGAAGGTCTTCGGATTGTAAACTTCTTTGATTGGGGAAGAATAAATGACCTACCCAAAGAACAAGTCACGGCTAACTACGTGCC
>URS000041CA9B rRNA from 1 species 
TCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTGATACGTAGGGTGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGGGCTCGTAGGTGGTTGATCGCGTCGGAAGTGTAATCTTGGGGCTTAACCCTGAGCGTGCTTTCGATACGGGTTGACTTGAGGAAGGTAGGGGAGAATGGAATTCCTGGTGGAGCGGTGGAATGCGCAGATATCAGGAGGAACACCAGTGGCGAAGGCGGTTCTCTGGGCCTTTCCTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGCTTAGATACCCTGGTAGTCCACGCTGTAAACGGTGGGTACTAGGTGTGGGGTCCATTCCACGGGTTCCGTGCCGTAGCTAACGCTTTAAGTACCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGCCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGTAGAACCTTACCTGGGTTTGACATGGATCGGGAGTGCTCAGAGATGGGTGTGCCTCTTTTGGGGTCGGTTCACAGGTGGTGCATGCCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTCACTGTTGCCAGCACGTTATGGTGGGGACTCAGTGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGCCCCTTATGTCCAGGGCTTCACGCATGCTACAATGGCTGGTACAGAGAGTGGCGAGCCTGTGAGGGTGAGCGAATCTCGGAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCTCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGGCTTGTACACACCGCCCGTCAAGTCATGAAAGTTGGTAACACCCGAAGCCGGTGGCCTAACCGTTGTGGGGGAGCCGTCGAAGGTGGGACTGGTGATTAGGAC
>URS00016BE8EB rRNA from 1 species 
TACGAAGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGCAGGCGGTCCTTTAAGTCAGGGGTGAAAGCCCAGAGCTCAACTCTGGAACGGCCTTTGAAACTAGAGGACTTGGGTACGGGAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGTTACCGACGCTCAGGCGCGACAGCGTGGGGAGCAAACAGG
>URS000104102D rRNA from 1 species 
TACGTAGGGTGCGAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTTGTAGGCGGTCTGTCGCGTCTGCTGTGAAAATCCGGGGCTCAACCCCGGACTTGCAGTGGGGTACGGGCAGACTAGAGTGTGGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGGTCTCTGGGCCACTACTG
>URS0001017A28 rRNA from 1 species 
TACGGAGGGTGCGAGCGTTGTTCGGAATCACTGGGCGTAAAGCGCGTGTAGGCGGCCTTGTAAGTCTGGTGTGAAAGCCCGGGGCTTACCCCCGGAAGTGCACTGGAAACTGCAAGGCTAGAGTACCGGAGAGGAAGGTGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGGCCTTCTGGACGGATACTGACGCTGAGACGCGAAAGCGTGGGGAGCAAACAGG
>URS0000908CE3 ncRNA from 1 species 
CTGGTTAATTCCGATAACGAACGAGACTCTGTCCTGCTAACTAGGCGGGTAAACCCGGGTCGGCGTGTGCGCGGCGCTGGCGGTTTCGGCCGTCAGTGTTCGCGTACCCGTCGGCTCGGCCCGGTATCCCCGAACGCGTTCGCCCGTCGTCCACGGCGGTCGTCGGGCGCGGCCGCGCCATCCGCGTCCCGGCGTTCGGCGGGCGTATGTCGGCCGGGGGGCAACCTCCGGTCGGCCTGCGTCCGTCGTGCGTCGGGCTCCGTGGTGAAGCGCGCCGTGTTCGCGGCCGTCGCCGGCGGATCACGATACGTTACTAGGGCTACCGCCGGCTCCCAGGAGCTTAAACTCTTCTTAGAGGGACAGGCGGCGGACGAACATAGCCGCACGAGACTGAGCGATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCCGCACGCGCGCTACACTGAAGGAATCAGCGTGTTTAACAATCCTGGGCCGACAGGCTTCCGGGTAACCCGCTGAACCTCCTTCGTGCTTAGGGATCGTGGCTTGCAATTTTTCCACGTGAACGAGGAATTCCCAGTAAGCGCGAGTCATCAGCTCGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGAACGGTCGCATTGAGGTCTTCGGAGTGGACGCGCGTTATTCGGCCCCCTCGGGGGCTGGGTCGTCGCGCGATCGCGAAGATGACCGAAATCGGCCGTTTAGAGGAAGTAAAAGTCGTAACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTA
>URS0001269AD4 rRNA from 1 species 
TACGTAGGTGGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGCGCGCAGGCGGTGCGGTAAGTCTGTCGTGAAATCTCCCGGCTCAACTGGGAGGGTGCGGTGGAGACTGCCGGACTGGAGGCACTCAGAGGCCGGTGGAATTCCCGGTGTAGTGGTGAAATGCGTAGAGATCGGGAGGAACACCAGTGGCGAAGGCGGCCCACTGGGCCGGTACTGACGCTGAGGCACGAAGGCGTGGGGAGCGAACGGG
>URS00004A8CD5 rRNA from 1 species 
CCTTGCCAGCCCGCTCAGAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCCGGAGACCCTTAGGAAACTAGGGGGTGCTTCCATCTGGAAGAATCTGGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGCCTTTAGTTGCCAGCAGTTCGGCTGGGCACTCTAAAGGGACTGCCGGTGTTAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCTTTATGACCAGGGCTACACACGTACTACAATGGCCGATACAAAGGGCAGCGACACTGCGAGGTGAAGCCAATCCCGTAAAATCGGTCTCAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTTGGAATCGCTAGTAATCGTGGATCAGCATGCCACGGTGAATACGTTCCCGGGCCTT
>URS000236C264 lncRNA from 1 species 
CTGCATCCTTCCAAACAGAGAAATAGGATGAGAATCAGTATGTCTGAACTATAGGCTAAAGCGGCATGAGGTTCAGGTGCATCAACATGATTCAGTTTCCATGACCAGATTGCTCATTACAAAAATCAAAGCAGAAATATATTCCCTACACTAAAACAGAGTAAAGAGTTAGAAATATCATGGTCTCCAAGGCCACAATCCAGTTATGCACTCAAAAAGTCCAATAACGTCCAGGCTAGCAATTAAACATGCTAGCTTTCAAGTTCAACGATTCAAAGTTTATTGATTTATAACGAATCTTGAGAAGTTCCAAAGGAAGCATGCAGTGCATCATCCTAATCATTAATATCCTAAAATAAGGCTTAAATCAACAACAGCTCCAAGTATGCAGGTATCAAGAATCACCTTTGACAGCTAAATACAAGACATTTCATCTCTAATTGGCAGGTATGCTGGTAAGCTATTACAGAATAACCGATGAACAGGGTAACTATTATTTTGCTTCTTAACTGCCAGGGGGAACCAACTGAAGCATGGCATCTACATAATGTCATGTCTTGTGCCTGCTTCAGTTGCGGATCACTGAAGTAAAAATTCTTTAACCTAAATTAATAAATATACTACCAGAAGCAAGAGAGTCAAAAATGAAATGGATTACTAAGTATTACCAATCACATACATTTCCAACAGTCATATCAGAAGCTTCAAATTAACTAATAGATTTAAGATTTCGAATATCTCCCTCATTCCTTTATAATATTTTGTAGGTCACTTGGAAAGAAACGAATAGGAGGGTTTTGATGGGCTTTATTTGGCCTTTTGTAGATATGGATCATTGGCTCCAAAATTCTCTGTTTTTTTTGCTTAAAGATCATCCTCTCTCCCCTAAGTAGGATCGTGAAGAGCTTGATATTTTGACCAGCTTGCAACCTATGGTTTCGTATATGAATGCCACTTCCTTGCTGTCTTGTTAATATACTTAAAAAAATAATAATAAATTTTTAACCTGCCTTGAGCAGGCTTAAATTTAAGGATTATAACAGCAAGAACTTATTTATTATTTTTAAATATTGATATTAACAATGGTACCAATGGGGCACCACCCATATATAATATATTTACATGTCAATTAAAACTTCAATGACATTTCCAAAATTTTCCGGCCTATTAATGTCATGACCCAAAACCAAGAAACCAAAAATATGAATTCATCTATCTCTAATATTAACAAACTCCCTTTTTATTTCTTCAAATGCTCTAACATTCCTTTCTTTCCACACGACCCAAAAAATAGATAAAGGAATCAGAAGAAGATAAGTTTTCTTTGTACATAAGCCCGCCCAAGCCCACAACTCATCTCTCGCCAACCCTGCAATCACCCAATTGATCCCTAGGAGACCGTACACCATAGACCAAATACCATACACCATTGGGCACCATAGCAAAATATGGTTACATGATTCTGCATCCATCTTAAATAAAAGCAGTGATTAACTAGAATTTTGCCCCTCCACCTCAGCCTATCAATAGTTAGGATGCATTCTCTACTCATTTCACAAGCAACCAAAAAACAATTGTTGGTGGTGCCTTCGTCTTCCATATCTATTTAACTGGATAATGGACAGTTTCACTCCTTTTTCCCCTAGTCAAATGCTTGTAGAAGGTCTTTACAGAGTAATCTTCTTGTTTCCTCAATTTCCACATCAACTGGTCCCTTCGATCATCTAATTGAATTTGAGATAACAGGAGTAATAAGGCTTCATACTCTTCGATAATTATTGAGATTTCTTGTGACGTTCATATTCCACCCCCTACTCCCGCTCGCTGTCAAGTGAGCCTCCTCCGCCACCATGTTCTTTGATGACACAATGGCGAAGATCGCTGGAAACTGATCTTTCAGCCTATCCTCACCAACCCATTCATTCTTTCAAAAATGAATTCTATCGCCCTTATCCACCTTCCTCTTTGTGCATTCAAGAAATTTGTGTTTCTCCACACTAATTTTCTTCTATTCACATCCCTGACGTCCTCACCCACTTCCCTCACACCCCACAGAGCCTCCACAACAAGAACTTATTTATAAGTTGCGAGTGAAATATCAACACCACCTTCCATACACTAAATTATTATTATTGGACATTTGCACAAAGAAGTACTCAAATTAATTTACCATGAAAAGGAAATAATGCTCATACAGTATAATGGCCATTAATAAATGCTATTTTAGAACTCATAAAAGCCACTTAGTGTCTAAAAATTGAACAAATTCAGCTTTCAGATATAAAAGAATTAGATATCCCAGCAAAAAGAGAGAATTTCATGTCATATTATTGTTAGAAACTTGGGACTTCTTGCAAGCATTTTAGCAAATATGAAAAAAATCACAAAAGAACTTTGCCTACTACCATCCTCAGTCTCATCAAACTCCATCCTAATGCGATATACATGACTATGTTGCTTCGGTTTGACCTTGTGCAAAGCCCTAGGCTCTCTATGGTTTTTGCTAAAAAAATGTGACCTGTAATTCTGTGTACAATCATCAAACAATAACTGCACTAAATATCATGCAAATACAAAAAGTTGTTTCCTATCAAGTATTTCACAGTTTCTCTCTCAAAAAGTTTTCCATAGTTTTTTATCTCATGTCATATCTCATTTGTGTAGCATGCATACATACATAATAGTCATAACTGCATGTAAAGAATTGACATGCTAGATACATGACTGAAATAACTTACTGAGAAAGCCAACATGAGAGAAAAACTAAGATGAAGCAAAGCAAAATATCCAGTAAATTTTACTACATCCCATACCTTATACTGGTCATGCTATTAATATGTAGGCAAGTAAAACGACAAGACCTAAGCATGCTTCTTAAAACCAGCTGAGAAAAATTAGACAAAATCTAGCAGAAATTATAATAGATCTATCTCCAAATTGTAGTTTCCTGTTTATGGATGCGAATCAAGAAAAATAAATGCCCAAACTATCATAATGACAAGCAAATGCAAGAAAACAAGTTCACAATACAAAATACAGAAGTACAGATCTATGATATTTCTTTTAAAGATAGGGAGGAAGAAAATATCACAAACAATGTAGAAG
>URS000135D842 rRNA from 1 species 
GACGAACGCTGGCGGCGCGCTTAACACATGCAAGTCGAGCGAAGCGGCGGACGGGAGAGTAACACATGAGTAACCTGCCTCAGACATTGGGATAGCCGCGGGAAACCGGGATTAATAGCAAATGGTCTAAGATGGCCTCGCGTCTCATTAGCTCGTTGGTGAGGTAACGGCCCACCAAGGCGACGATGGGTAGTCGGTCTCAGAGGGTGGACGGCCACATTGGAACTGGGAAGCGGTCCAGACTCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGAGGGAGCTATGAAGATTCGATGCCGCGTGAACGAAGAAGGCTTTCGAGTCGTAAAGTTCTTTTATATGGGCAGTGGTACCATAAGACAAAGGCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATAC
>URS0002034EF4 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTGTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGATGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS00025BECD2 rRNA from 1 species 
ATGCGGGTGGTTGGACTTGTGGTCATGGAAAGCGCTAGGAAAATACCAAGCTCTAGGGTCACTAACATTAAAGAGGGAGATGCCAACACCCGCTATTTTCACTCGAAGATCAATGGAATTCGGTGGAAAATCCTAATTCACCGCCTTAAGCATGGGAGTGGCGGGGTAACGGATCACGACTACAAGAAGGCCATTATCCATGCTCACTTCTCAGCTATGATGAAAAAGAGCAACCCACGCGCTAAGAGCGTCAATTGGGCTTCCATTCCTGCTGCCGACCATGACCTATCCCATCTTGGGGACCCCATCATGGAGGAGATCAAGGCTGCGATTTTTGCCCTCCCTAGTGACAAGGCTCACGGGCCTGACGAATTCACCGGGAAATTCTGCAAAGAATATTGGGATATTATCAAAGATGGCATCATGCTTGTGATCAATAACTTCTCGGGCCTCCACACGAAAAAAATTCACTGGCTAAACTCGACTAATCTTGCTCTCATCCACAAGAAAGATGGCGTCGAGGACATCACTAACTTAGGCATATTAGGCCCAAGGAGCTTGGAGGATCCATGCGCACTGGCGTGCACTTCCCCTGTTCAGGGCGCCATGACGCAGCCTTTAAAGGAGCAACCGGTAGTCAAGGACGACCTGGTTGGCCACGGCGTCACCGGTGGAGGACACTCGGAAGTTGATGGTGCGGATGGCGGGTGGGGAGGGGGGGTCACCGACGCCGGAGAAGAGTCTGAACCTAGAGGAATGGCGGGGGCAGCGGCAAGGCAATGA
>URS0002234228 rRNA from 1 species 
GGTTAAGTTGTTAAGGGCGCACGGTGGATGCCTTGGCACTAGGAGCCGATGAAGGACGGTACTAACACCGATATGCTTCGGGGAGCTGTAAGTAAGCTTTGATCCGGAGATTTCCGAATGGGGAAACCCACTGCTCGTAATGGAGTAGTATCTTCACCTGAATTCATAGGGTGATGATGGCAGACCCGGGGAACTGAAACATCTAAGTACCCGGAGGAAGAGAAAGCAAACGCGATTTCCCAAGTAGCGGCGAGCGAAACGGAAGAAGCCCAAACCAAGAGGCTTGCCTCTTGGGGTTGTAGGACACTC
>URS0000D4A060 sRNA from 1 species 
CTCCTGTCTGCAGGATTTACGCGCACGTTGGAACCGAAGAGAGCTCTGTTGTTGCAATGTTCAGCCCACAAGACCTTACTGGTGAAGGAATGGGACAAGACCCATCTTTATGCAAAGCCAGCGTTACAGTAATGTCCCAGCATCTCATAATCTATCCTGGGGAATTCAGCTGCCTCCCAGGGTGAATACAGGTATTCCTGATGACAGTCTGCCTTCTATCTTACAGAGCAGCTTGTTGCTATATACCATTGAAAAGCCTTCAGAGCTGAGAGGTTAGTTGATATTTTTTGTTCCTTACAGCTTATGCCACCAAGTAGGCAGTTTCTATGATGAATCAAACTAGCTCACTATGACCGACAGTGAAAATACATGAACACCTGAGAAACTGGAGAACGCAGGGAGTGGGGGGTAACCATGTCTGAGGAATCTTTCACCCACAGCTTTGTTTTTCTCTAGGTACTACTAACCAATAACCTGCTTGGCTCAAAGGGCCAGCACCTTCTCTCTAAAGCCCAAGAGGAGTTTGAGGTAAA
>URS0001621A90 rRNA from 1 species 
ATACAGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGCTTGGTCAGTCGGATGTGAAAGCCCTGGGCTCAACCTGGGAATTGCATTCGATACTGCCAAGCTAGAGTATGGGAGAGGGAAGTGGAATTTCCGGTGTAGCGGTGAAATGCGTAGATATCGGAAAGAACACCAGTGGCGAAGGCGACTTCCTGGCCCAATACTGACGCTGAGGTGGGAAAGCGTGGGGAGCGAACAGGATTAGAAACCCTAGTAGTCC
>URS000183796A rRNA from 1 species 
CACGTAGGGTGCAAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCTCGTAGGCGGCTTAGTAAGTCGGGTGTGAAAACCCCAGCTCAACCTGGGGACGCCACCCGATACTGCTATAGCTAGAGTCCAGTAGGGGAGTGTGGAATTCCCAGTGTAGCGGTGAAATGCGCAGATATTGGGAGGAACACCAGCGGCGAAGGCGGCACTCTGGGCTGGAACGTGACGCTGAGGAGCGAAAGCGTGGGTAGCAAACAGG
>URS0001FEE94D rRNA from 1 species 
GATGAACGCTGACAGAATGCTTAACACATGCAAGTCTACTTGAACTTCGGTTTGGGTGGCGGACGGGTGAGTAACGCGTACAGAACTTGCCTCACAGTTAGGGACAACATTTGGAAACGAATGCTAATACCTGATATTATGATTTTAGGGCATCCTAGGATTATGAAAGCTATATGTGCTGTGAGAGAGCTTTGCGTCCCATTAGCTAGTTGGAGAGGTAACGGCTCACCAAGGCGATGATGGGTAGCCGGCCTGAGAGGGTGAACGGCCACAAGGGGACTGAGACACGGCCCTTACGCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGACCAAAAGTCTGATCAAGCAATTCTGTGTGCACGATGACGTTTTTCGGAATGTAAAGTGCTTTCAGTTGGGAAGAAAAAAATGACGGTACCAACAGAAGAGGTGACGGCTAAATACGTG
>URS0001E248AA rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCCAGTCGAACGAGACCTTCGGGTCTAGTGGCGCACGGGTGCGTAACGCGTGGGAACCTGCCCTTAGGTTCGGAATAACTCCCCGAAAGGGGTGCTAATACCGGATAATGTCTTCGGACCAAAGATTTATCGTCTTTGGATGGGCCCGCGTTGGATTAGCTAGTTGGTAGGGTAAAAGCCTACCAAGGCGACGATCCATAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCAATGCCGCGTGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTTACCCGGGATGATAATGACAGTACCGGGAGAATAAGCTCCGGCTAACTCCGTG
>URS00001C5077 rRNA from 1 species 
AGAGTGGGGGATAACGCAGCGAAAGCTGTGCTAATACCGCATACGATCTAAGGATGAAAGCAGGGGACCGCAAGGCCTCGCGCTCATGGAGCGGCCGATGTCAGATTAGGTAGTTGGTGGGATAAAAGCTTACCAAGCCGACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGAAA
>URS000002F2FF rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGGTAACAGGGGGCTTCGGCCCGCTGACGAGTGGCGGACGGGTGAGTAATACGTAGGAATCTACCTTTTAGTGGGGGATAAACTTAGGGAAACTTAAGCTAATACCGCATAATCACTACGGTGGAAAGCAGGGGCTCGCAAGACCTTGCGCTGATAGATGAGCCTACGTCGGATTAGCTTGTTGGTAGGGTAAAGGCCTACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGGGCAACCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCC
>URS0000AD69CA ncRNA from 1 species 
GACCGGAAGGCCGTGTGGACTGTATAGAAGAGAGAATGTTGGCATGAGTAGCGAGAGGTGAGTGAGAATCTCACCCATCGAAAGCCTAAGGTTTCCTGAGGAAGGCTCGTCCACTCAGGGTAAGTCGGGACCTAAGCCGAGGCCGAAAGGCGTAGGCGATGGACAACTGGTTGATATTCCAGTACCACCTTTAAACGTTTGAGAGATGGGGTGACACAGAAGGATAGACTATCGCACTGATGGAATAGT
>URS00025CD331 rRNA from 1 species 
ATGGCCAATGGATTTTACACTTCGTCATCGGCCTACAAGGTGCAATTCGAGGGGACTGTGGCCTCCAACATGACACGGGTCGTTTGGGGCAATTGGGGGCCTCCCAAGTGCAAATTATTTGCGTGGCTTGTCATCATGAATCGGGTTTGGACGGCGGATTGGCTTCGGAGGAGAGGATGGCCAAATTATAACTTATGTCAACTCTGTAAGAGGGAGCCTGAGACGGCGGCGCACTTCCTCTTGCATTGCAGGTTCTCCACACGCATTTGGAATGCGGTTAAGTGTTGGCTCGTCGTTCAGGAGTTGGATATCGCCACCTGGGCTGGGATCCCCACGGTCAAGCAATGGTGGGAGAAGACCGTCCTTGGACGAGGTCACAGGAGGAAGGCCGTGTCCTCTCTTCTAATGCTTGTATCATGGGAGCTGTGGAACGAGAGGAATGCGAGGGTGTTCCAAAAGAAAGCCACGATGCCGACCGTTGTGGTCAATCGTATCAAGGCGGAGTCTAGAAATTGGGTTCTGGCCGGGGCAAAACATATGGGATATTTGATGCCGCGAGAGTAG
>URS0001ED03C2 misc_RNA from 1 species 
CAAGAAGCCGAAAGGCTACTTAAAACCATCGCGAACTTATCCAAGTTGCTTCGGCGGCGCGGCTCCCCTCACGGGGGACCGCAGCCCCCGCCTCTCAGGAGGTAAGGGGCAGCCGCCGGAGGTACGAAACTCTGTATTATAGTGGTATCTCTGAGTATAAAATAAATAAGTTA
>URS0001607725 rRNA from 1 species 
GCAAGTCGAGCGAGAAGCCATCCTCGGGTGGTAAAGAGCGGCGAACGGGTGAGTAACGCGTAGGTATCTACCTAGTAGTGGGGAATAACCATTGGAAACGATGGCTAAAACCGAACGCCCTGAGGGGGAAAACTGAGGTGCTATTAGAGGAGCCTGCGTTAGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCTATAGCTGGTTTGAGAGGATGATC
>URS0001D85733 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCTGCTTTCCCTTGTGGATTGCGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGAGTGATCTGCCCCCAACTTGGGTATAAGCCTGGGAAACTGGGTCTAATTCCCGATAGGACTGCAGGGTGGTGCCTGTGGTGGAAAACGATTTTCTAGTGGTTGGGGATGAGCTCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGGCGACGGGTAGCCGGCCTGAGAGGGTGGACGGCCACATTGGGACTGGGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAGTATTGCACAATGGGCGGAAGCCTGATGCAGCGACGCCGCGGGGGGGATGACGGCCTTCGGGTTGTAAACTCCTTTCGACCGCGAGGAAGCCACCTGGTTGGAAGGGTGGTGACGGTAGTGGTAGAAGAAGCACCGGCTAACTACGTG
>URS00025A5E17 rRNA from 1 species 
ATGGGTTTCCGTGACATCCACTGTTTCAACCTGGCTCTGCTTGCAAAACAAGCATGGCGTCTCCTTGATAATCCTGACTCCTTGTGTGCTACTATTCTAAGGGCCAAGTACTATCCTAATGGTGATTTGCTGAACTCCAAGCCAAAGCATGGTGCTTCCTTCACCTGGCAAAGCATTATGGCAGGCATCACTACTCTTAAGCGAGGTTATATTTGGCGAGTGGGGGATGGACATAACATCAATATTTGGGAAGATGCCTGGATCCCAAATTGTGCCTCTAGGAAGATTATGACACCTAGGGGGGGGCATTTGTTATCAAAAGTCGTAGATTTAATTGACCCAGTCTCCAATAATTGGGATGAGGACCTGATTAGACAAACTATGTGGACCGTTGACGTACAACGAATTCTTTCAATCGCAATTTCGCAACATAATATGACGGATTTTATTGCCTGGAGTTATACGAAAAATGGTATGTTTTCGGTACGGTCTGCTTATTTAGTGGAGTGGAACTATCAATATGGGAGCAAGCTAAAATATTCCAATGGGATGGGACGGAGCACACCTAATCCTATATGGTGTCAGATATGGAAGTTGTCTTGTCTGGCTAAAGTCAATTTTTTTATGGCGGACACTACATGGCACTCTCCCATGCCGGGCAACACTCACTAA
>URS00017A11C2 rRNA from 1 species 
TACGGAGGGTGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGCTTTTTAAGGGTGCGGTGAAAGCCCGGGGCTTAACCCCGGGTCGGCCGTGCCGACTGAAAAGCTGGAGCACTGTAGAGGCAGGTGGAATTCCGGGTGTAGCGGTGGAATGCGTAGAGATCCGGAAGAACACCAGTGGCGAAGGCGGCCTGCTGGG
>URS00012833E7 rRNA from 1 species 
AGCGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGACCCTTCGGGGTTAGTGGCGGACGGGTGAGTAACACGTGGGAACGTGCCTTTTGGTTCGGAATAGCTCCTGGAAAGGGGTGGGAATGCCGAATGTGCCCTTCGGGGGAACGATTTAACGCCTTTAGAGCGGCCCGCGCCTGATTAGCTGGTGGGTTGGGGTAATGGCCCACCAAGGCTACGATCAGTAGCTGGTCTGAGAGGATGACCAGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCCGCAGTGGGGAATCTTGCGAAATGGGCGAAAGCCTGACGCAGCCATGCCGCGTGGATGATGAAGGTCTTAGGATTGTAATATCCTTTCACCGGTGAAGATAATGACTGTAGCCGGAGAAGAAGCCCCGGCTAACTTCGTGCCAGCCGCCGCGGTAAGAC
>URS0001D3FFBA rRNA from 1 species 
AGTGAACGCTGGCGGCATGCTTAACACATGCAAGTCGCACGGGCAGCAATGTCAGTGGCGGACGGGTGAGTAACACGTAGGAATGTGTCTTGAGGTGGGGGACAACCCTGGGAAACTAGGGCTAATACCGCATATGTCCTGAGGGACAAAGCAGCGATGCGCCTTGAGAGTAGCCTGCGTCCGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCGGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGGGTGAAGAAGGTCTTCGGATCGTAAAGCCCTTTCGGCGGGGACGATGATGACGGTACCCGCAGAAGAAGCCCTGGCTAACTTCGTG
>URS0000E6A59F rRNA from 1 species 
ATCTACAGCCATACCACCCAGAAGGCTCCCAATCTCGTCTGATCTTGAAAGCTGAGCAGGGTTGGGCCTGGTTAATACTTGGATGGTAGAAAACAGTGTGAAGTCGAGG
>URS00000EB6A6 rRNA from 1 species 
CTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCAGTGAGGAAGGTGGGTATGTTAATAGCATACTCATTTGACGTTAGCTGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCATGCAGGTGGTTTGTTAAGTCAGATGTGAAAGCCCGGGGCTCAACCTCGGAATTGCATTTGAAACTGGCAAACTAGAGTACTGTAGAGGGGGTAGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAGATACTGACACTCAGATGCGAAAGCGTGGGGAGCAAACAGGATTAGATAACCTGGTAG
>URS000167F6B8 rRNA from 1 species 
TACAGAGGTGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCGCGTAGGCGGCCTTCTAAGTCAGACGTGAAATCCCCCGGCTTAACCTGGGAACTGCGTCTGATACTGGGAGGCTAGAGTGCGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAATACCGGTGGCGAAGGCGGCATCCTGGACCGGCATTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS0000D6C981 ncRNA from 1 species 
AAAGGGCCAAAGGCGCCCGGACGAGGTGCGCCGTACCCGGCCAGCGACAAGACGGCGTAAG
>URS0000E05209 SRP_RNA from 1 species 
GCCATGAGCGATGTCACCCACCTATAATCCAGCTACCAGGGAAGCTGAGCCTGGTAGATCTTTAGTTTAAGAGTTCTGAGCTTTAGTGAGCCATGTTGATGGGATGTTCACACTAAGTTTGGCATCAGTGTGGTGAGCCCCTGGAATTAGAGGACCACTAGGTTGTCTAAGAAGGGTTACAAATGGGAGCAGGTTAGAGCTCCCAGACCACTTAGTAGTGGGATCAGGCCTGTGAGCAGCCCCTGTACCAGTTCCAGCTCAGAGTGAGATGGAGAGACCCAGTCTTT
>URS0000BAE8CB rRNA from 1 species 
CCTACGGGACGCAGCAGTGAGGAATATTGGTCAATGGCCGGGAGGCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGCCCTACGGGTTGTAAACCTCTTTTGTCAGGGAGCAAGGTGCAGGTCGGGACCTGCTGTGAGAGTACCTGAAGAAAAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAAAACGTAGGGTGCAAGCGTTGTCCGGAATTACTGGGTGTAAAGGGAGCGCAGGCGGATTGACAAGTTGGGAGTGAAAACTACGGGCTCAACCCGTAACCTGCTTTCAAAACTGTCAGT
>URS00000F1EB4 rRNA from 1 species 
GCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAACCTTCGGGTTAGTGGCGGACGGGTGAGTAACGCGTGAGAATCTGCCCTCAGGAGGGGGATAACGGTTGGAAACGACCGCTAATACCCCATATGCCGCGAGGTGAAATGAATTTCGCCTGAGGATGAGCTCGCGTCTGATTAGTTAGTTGGTGGGGTAAAGGCCTACCAAGACATCGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGGGATGAAGGCCTCTGGGCTGTAAACCTCTTTTATCAAGGAAGAAGATCTGACGGTACTTGATGAATAAGCCACGGCTAATTCCGTGCCAGCAGCCGCGGTAATACGGGAGTGGCAAGCGTTATCCGGAATTATTGGGCTTAAAGCGTCCGCAGGCGGTCTGTCAAGTCTGCTGTTAAAGCGTGGAGCCTAACTCCATTTCGGCAGTGGAAACTGACAGACTA
>URS0000D30CB5 rRNA from 1 species 
GGATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGGGTGAAGAAGGCCCTAGGGTTGTAAACCCCTTTCAGCGGGGAAGATAATGACGGTACCCGCAGAAGAAGCCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGACCTGCAAGTCGGGGGTGAAAGCCCGAGGCTCAACCTCGGAACTGCCTTCGATACTGCGGGTCTCGAGTCCGGGAGAGGTGAGTGGAATTCCTAGTGTAGAGGTGAAATTCGTAGATATTAGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGCCCGGTACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAA
>URS00003ED92D rRNA from 1 species 
AACTTCTGAATGTTGACCTCGGATCAGGTAGGAATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACAGGGATTGCCCTAGTAACGGCGAGTGAAGCGGCAACAGCTCAAATTTGAAATCTGGCTCTCGGGCCCGAGTTGTAATTTGTAGAGGATACTTTTGATGCGGTGCCTTCCGAGTTCCCTGGAACGGGACGCCATAGAGGGTGAGAGCCCCGTCTGGTTGGATGCCAAATCTCTGTAAAGTTCCTTCAACGAGTCGAGTAGTTTGGGAATGCTGCTCTAAATGGGAGGTATATGTCTTCTAAAGCTAAATACCGGCCAGAGACCGATAGCGCACAAGTAGAGTGATCGAAAGATGAAAAGCACTTTGAAAAGAGAGTTAAAAAGTACGTGAAATTGTTGAAAGGGAAGCGTTTATGACCAGACTTGGGCTTGGTTAATCATCTGGGGTTCTCCCCAGTGCACTTTTCCAGTCCAGGCCAGCATCAGTTTTCCCCGGGGGATAAAGGCGGCGGGAATGTGGCTCTCTTCGGGGAGTGTTATAGCCCACCGTGTAATACCCTGGGGGGGACTGAGGTTCGCGCATCTGCAAGGATGCTGGCGTAATGGTCATCAACGACCCGTCTTGAAACACGGACCAAGG
>URS00001448B3 rRNA from 1 species 
AACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCCCAGCAATGGGAGCGGCAGACGGGTGAGTAACACGTGGGAACCTTCCCTATAGTACGGAATAGCCCAGGGAAACTTGGAGTAATACCGCATACGCCCGAGAGGGGAAAGATTTATCGCTATAGGATGGGCCCGCGTAGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCCTTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCTTAGGTGTAAGCTCTTTGCCGGGGACGATAATGACGGTACCCGGAGAATAAGCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAAT
>URS000098BB64 pre_miRNA from 1 species 
TTTTTAGTATCAGTATGTCCCATACAGTATTGGGGACATACTGATGCTAAAA
>URS0001061001 rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGATTCATTGGGCGTAAAGAGCGTGTAGGCGGCCAGGTAGGTCGGTTGTGAAAACTGGAGGCTCAACCTTCAGAGGTCGACCGAAATCATCTGGCTAGAGTCCGGGAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCGAAAGCGGCTCTCTGGAACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS0000C64DF9 hammerhead_ribozyme from 1 species 
ATCCAGCTGACGAGTCCCAAATAGGACGTGACGCGCGTCGTGTAT
>URS000215D057 rRNA from 1 species 
TTAAGCGACTAAGCGTACACGGTGGATGCCCTGGCAGTCAGAGGCGATGAAGGACGTGCTAATCTGCGATAAGCGTCGGTAAGGTGATATGAACCGTTATAACCGGCGATTTCCGAATGGGGAAACCCAGTGTGTTTCGACACACTATCATTAACTGAATCCATAGGTTAATGAGGCGAACCGGGGGAACTGAAACATCTAAGTACCCCGAGGAAAAGAAATCAACCGAGATTCCCCCAGTAGCGGCGAGCGAACGGGGAGCAGCCCAGAGCCTGAATCAGTGTGTGTGTTAGTGGAAGCGTCTGGAAAGGCGCGCGATACAGGGTGACAGCCCCGTACACAAAAATGCACATGCTGTGAGCTCGATGAGTAGGGCGGGACACGTGGTATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTCCTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCCCGGCGAGGGGAGTGAAAAAGAACCTGAAACCGTGTACGTACAAGCAGTGGGAGCACGCTTAGGCGTGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCTGTAGCAAGGTTAACCGAATAGGGGAGCCGAAGGGAAACCGAGTCTTAACTGGGCGTTAAGTTGCAGGGTATAGACCCGAAACCCGGTGATCTAGCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACTTGTGGCTGGGGGTGAAAGGCCAATCAAACCGGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGTGAATTCATCTCCGGGGGTAGAGCACTGTTTCGGCAAGGGGGTCATCCCGACTTACCAACCCGATGCAAACTGCGAATACCGGAGAATGTTATCACGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGAAGAGGGAAACAACCCAGACCGCCAGCTAAGGTCCCAAAGTCATGGTTAAGTGGGAAACGATGTGGGAAGGCCCAGACAGCCAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAATAGCTCACTGGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTAAACCATGCACCGAAGCTGCGGCAGCGACACTATGTGTTGTTGGGTAGGGGAGCGTTCTGTAAGCCTGTGAAGGTGTGCTGTGAGGCATGCTGGAGGTATCAGAAGTGCGAATGCTGACATAAGTAACGATAAAGCGGGTGAAAAGCCCGCTCGCCGGAAGACCAAGGGTTCCTGTCCAACGTTAATCGGGGCAGGGTGAGTCGACCCCTAAGGCGAGGCCGAAAGGCGTAGTCGATGGGAAACAGGTTAATATTCCTGTACTTGGTGTTACTGCGAAGGGGGGACGGAGAAGGCTATGTTGGCCGGGCGACGGTTGTCCCGGTTTAAGCGTGTAGGCTGGTTTTCCAGGCAAATCCGGAAAATCAAGGCTGAGGCGTGATGACGAGGCACTACGGTGCTGAAGCAACAAATGCCCTGCTTCCAGGAAAAGCCTCTAAGCATCAGGTAACATCAAATCGTACCCCAAACCGACACAGGTGGTCAGGTAGAGAATACCAAGGCGCTTGAGAGAACTCGGGTGAAGGAACTAGGCAAAATGGTGCCGTAACTTCGGGAGAAGGCACGCTGATATGTAGGTGAAGTCCCTCGCGGATGGAGCTGAAATCAGTCGAAGATACCAGCTGGCTGCAACTGTTTATTAAAAACACAGCACTGTGCAAACACGAAAGTGGACGTATACGGTGTGACGCCTGCCCGGTGCCGGAAGGTTAATTGATGGGGTTAGCCGCAAGGCGAAGCTCTTGATCGAAGCCCCGGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGCGTAATGATGGCCAGGCTGTCTCCACCCGAGACTCAGTGAAATTGAACTCGCTGTGAAGATGCAGTGTACCCGCGGCAAGACGGAAAGACCCCGTGAACCTTTACTATAGCTTGACACTGAACATTGAGCCTTGATGTGTAGGATAGGTGGGAGGCTTAGAAGTGTGGACGCCAGTCTGCATGGAGCCGACCTTGAAATACCACCCTTTAATGTTTGATGTTCTAACGTTGACCCGTAATCCGGGTTGCGGACAGTGTCTGGTGGGTAGTTTGACTGGGGCGGTCTCCTCCTAAAGAGTAACGGAGGAGCACGAAGGTTGGCTAATCCTGGTCGGACATCAGGAGGTTAGTGCAATGGCATAAGCCAGCTTGACTGCGAGCGTGACGGCGCGAGCAGGTGCGAAAGCAGGTCATAGTGATCCGGTGGTTCTGAATGGAAGGGCCATCGCTCAACGGATAAAAGGTACTCCGGGGATAACAGGCTGATACCGCCCAAGAGTTCATATCGACGGCGGTGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGAAGTAGGTCCCAAGGGTATGGCTGTTCGCCATTTAAAGTGGTACGCGAGCTGGGTTTAGAACGTCGTGAGACAGTTCGGTCCCTATCTGCCGTGGGCGCTGGAGAACTGAGGGGGGCTGCTCCTAGTACGAGAGGACCGGAGTGGACGCATCACTGGTGTTCGGGTTGTCATGCCAATGGCACTGCCCGGTAGCTAAATGCGGAAGAGATAAGTGCTGAAAGCATCTAAGCACGAAACTTGCCCCGAGATGAGTTCTCCCTGACCCTTTAAGGGTCCTGAAGGAACGTTGAAGACGACGACGTTGATAGGCCGGGTGTGTAAGCGCAGCGATGCGTTGAGCTAACCGGTACTAATGAACCGTGAGGCTTAACCTT
>URS00016AAB81 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCTTAACACATGCCAGTCGAGCGAGCGTCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTCGCTAATACCGCATTCCATCCTATGTGCCCATATGGGATTAGCTAGTAGGTGGGGTAATGGCTAACCTAGGCGACGCTCCCTAGGTGGTCTGAGAGGATGACCAGCGAGACTGGAACTGAGAGACGGACGAGACTAGTACGGGAGGCAGCAGTGGGGAATAGTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCGTTCGGGTTGTAAAGAACGTTCAGCGAGGAGGCGTTACTCGCAGAAGAAGCAACGGCTAACTCCGTGCCAGCAGCAGCGGTAATTC
>URS00018C3972 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGAATCATTGGGCGTAAAGCGCGCGCAGGCGGTTAATTAAGTTGGGTGTTTAAGCCCGGGGCTCAACCCCGGTTCGCATCCAAAACTGGTTGACTTGAGTGTAGGAGAGGAAAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGCCTATAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGG
>URS00007617FE rRNA from 1 species 
TACGTAGGGGGCGAGCGTTGTCCGGAATTACTGGGCGTAAAGAGAGCGTAGGCGGCACTACAAGTCTCATGTGAAATACCCGGGCTTAACTTGGGGGTTGCATGGGAAACTGTAGAGCTTGAGTACAGGAGAGGCAAGCGGAATTCCTAGTGTAGCGGTGAAATGCATAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTACTGGACGGCAACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGG
>URS0000A668E1 tRNA from 1 species 
TCTAAAATGACAGATGAATGTATAAGATTTAAGCTCTTACCATGGAGATTTATTCTTCTTTTAGAATC
>URS0001CAF6B7 misc_RNA from 1 species 
GATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGACCGCCAGTATTCTGGCGGGCATGCCTGTTCGAGCGTCATTTCAACCATCAAGCCCCCGGCTTGTGTTGGGGACCTGCGGCTGCCGCAGGCCCTGAAAAGCAGTGGCGGGCTCGCTGTCACACCGAGCGTAGTAGCATACATCTCGCTCTGGGCGTGCTGCGGGTTCCGGCCGTTAAACCACCTTCATAACCCAAGGTTGACCTCGGATCAGGTAGGAAGACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS0001A89386 rRNA from 1 species 
TAGAATTAGGGTTCGATTTCGGAGAGGGAGCATGAGAAACGGCTACCACATCTAAGGAAGGCAGCAGGCGCGTAAATTACCCAATCCTGACTCAGGGAGGTAGTGACAAGAAATAGCAAACCGGGAACCTCATGGTTTCACGGTATTGCAATGAGAACAATTTAAAACCCTTAGCGAGAATCAAGTGGAGGACAAGTCTGGTGCCAGCACCCGCGGTTATTCCAGCTCCACTAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAACCTCTGTCTGGGGCTAGTTTTGGCTTTGGTCAGGCTAGTTCTAGGCATCCGCCTACAAGACTTAGAGGGCATTCAGTTGTTCACTAGGAGTAGTAGGCATTTTACTTTGAAAAAATTAGAGTGTTTAAGGCAGGCAATCGCCCGCATATATTAGCATGGAATAATAGAATAGGACACTTTTCCATTTCGTTGGTTATTGGAATCGTGTAATGATTAATAGGGACAGTTGTGGGCATTTGTATTTAGTTGTCAGAGGTGAAATTCTTGGATTTATTAAAGACAAACTAACGCGAAAGCATTTGCCAAGGGTGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCAAAGACGATCAGATACCGTCCTAGTCTTAACTACAAACTATTCCGACTCAATGTTTGACTGGCTTATATAACCAGTTGAGCGTTGTATGAGAAATCAAAGTCTTTAGGTTCTGGGGGGAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGAGCACAACCAGGAGTGGATTCTGCGGCTTAATTTGACTCAACACGGGGAAACTTACCAGGTTAAAACAATAGTGGGATTGACAGTTTGAGAGCGCTTTCTTGATTGGTTGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGCTTAATTGCGTTAACGAACGAGACCTTAACCTGCTTACTAGACTGGCGATCATCAATCGTTAGCTCTTCTTAGAGGGACTTTGGTTGTTTTAACTCCAAGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTTAGATATCCTGGGCCGCACGCGTCATACAATGACTAGTTCAGAAAGTTTTCTCCTGACCCGAAAGGGGATGGGTAATCTTGATAATACTAGTCGTGTTAGGGATCGATCTTTGCAATTATAGATCTTGAACGAGGAATTCCTAGTAAGTGCGGTTCATCAGACCGTACTGATTACGTCCCTGCTCTTTGTACACACCGCCCGTCGCTTCTACCGAGTGGGTGGTCCGGTGAGATAATTGAACTTCGCAGGTAACTGAGAGGAAAGATTATCAAACCTATCCACCTCGAGGAAGAAGAAGTCGTAACAAGGTT
>URS00018335DB rRNA from 1 species 
TCTACGGGTGGCAGCAGTGAGGAATATTTGTCAATGGGCGTAAGCCTGAACCAGCCAAGTCGCGTGAGGGATGAAGGTTCTATGGATCGTAAACCTCTTTTATAAGGGAATAAAGTGTGGGACGTGTCCTATTTTGTATGTACCTTATGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCAGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGCCTTGTAAGTCAGCGGTGAAAGTCTGTGGCTCAACCAAGGAATTGACGTTGAAACTGGGGGGCTTGAGTATGTTTGAGGCAGGCGGAATGCGTGGTGTAGCGGTGAAATGCTTAGATATCAGGCAGAACACCGATTGCGAAGGCAGCCTGCCAAGCCATGACTGACGCTGATGCACGAAGGCGTGGGGATCAAACAGGATTAGATACCCGAGTAGTC
>URS00021B9194 rRNA from 1 species 
GCTTGTCTCAAAGATTAAGCCATGCATGTCTAAGTATAAATAGTATACAGTGAAACTGCGAATGGCTCATTAAAACAGTTATAGTTTATTTGATAATTGAAAATTACATGGATAACCGTGGTAATTCTAGAGCTAATACATGCTATCAAGCCCGACTTCTTGAAGGGTTGTATTTATTAGACTTAAGCCAATATTCCTTGTGTCTATTGCGATGATTCATAATAACTGATCGAATCTCAAATTTGAGATAAATCATTCAAGTTTCTGCCCTATCAACTGTCGACTGTGATATAGACGCTCACAGTGGTTTTGACGGGTAACGGGGAATCAGGGTTCGATTCCGGAGAGGGAGCCTTAAAAACGGCTACCACATCCAAGGAAGGCAGCAGG
>URS0000AFABFB rRNA from 1 species 
TAAGGAATATTGGACAATGGGCGGGAGCCTGATCCAGCCATGCCGCGTGAAGGATGAAGGCGCTCAGCGTTGTAAACTTCTTTTGGACGGGAACAATATCCCCGACTTGTCGGGGCTTGAGGGTACCGTCAGAATAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTATCCGGAATCACTGGGTTTAAAGGGTGCGTAGGCGGTCTTGTAAGTCAGTCGTGAAATCGCTGGGCTCAACCCATGCAATTGCGATTGATACTGCTAGACTTGAATGGGGTTAAGGCAGGCGGAATGTGGCATGTAGCGGTGAAATGCTTAGATATGCCATAGAACACCGATTGCGAAGGCAGCCTGCTGGGCCTTTATTGACGCTGAGG
>URS0001536541 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGATTGACTGGGCGTAAAGGCGCGTAGGCGGTTTGTACAGTCAGACGTGAAATTCCCGGGCTCAACCTGGGGGCTGCGTTTGATACGTGCAGACTTGAGTTCGGAAGAGGGTCGTGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCGGTGGCGAAGGCGGCGACCTGGTCCGATACTGACGCTGAGGCGCCGAAAGCGTGGGGAGCAAACAGG
>URS0000DB123A rRNA from 1 species 
GGATGCGATCATACTAGTACTGAGGCACCGAATCCCATCAGAACTCCGAAGCTAAGCGTGCTTGGGCGAGAGTAGTACAAGGATGGGAGACCCCCGAGAAGTCCTCGTGTTGCATCCC
>URS00009B63B2 lncRNA from 7 species 
CACACTCTGACGTTGAAACAGTTTCCATGCAGAGCGCCCCCTCTCCGCCTCCCAGTGCCCCAGGTGCCTCAGGTGTAGAGGGACTGAAGATTTTCGGGGGGCTAGCGGAATGTCAGCACTACTACTAGTGCCCATACGGCAGAATGAACTGTTTCCATGAAAACGGGGCCTAAGGAGTTGGCATCCTTATGACAGAACAGTATTTTAAAAGTCAAGGATGCCCTAAGAGCATTTCAGAAAGAGAAGATCACTTTGGGGTCCTCAAGATGGCTCACTGGGTGAGGGCACATCACCTCTAAGCATGGCAACAGGGGTTCAGTGCCTGCACCCCACACTGAGGAAGGAGGAAACGGACTCCCTCAAATCATCATCCGACCCCCACATCTGAGCAAGATCCGCCTCCCCCTCCAACACACGCA
>URS0000351846 rRNA from 1 species 
AGAGTTTGATCCTGGCTCAGATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGTAGAGGGGCAACCCTTGAGAGTGGCGAACGGGTGAGTAATGCATCGGAACGTGCCCAGTCGTGGGGGATAACGCAGCGAAAGCTGTGCTAATACCGCATGTGATCTGTGGATGAAAGCAGGGGACTTGGTAGCAATACTGGGCCTTGTGCGATTGGAGCGGCCGATGTCAGATTAGCTAGTTGGTAGGGTAAAAGCCTACCAAGGCGACGATCTGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCCACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGCAGGACGAAGGCCTTCGGGTTGTAAACTGCTTTTGTACGGAGCGAAACGGTCTGGGTTAATACCCTAGGCTAATGACGGTACCGTAAGAATAAGCACCGGCTAACTACGTGCCAGCCGCCGCGGTAATAC
>URS000003707E rRNA from 1 species 
AATGGCCTAACGGCTGAACCAGCAACTTGGAAGAATGTAGGTGTATTAATATTAATTAATGCAATAACGATTCTATCGTATAAAATTCTAAATAGATTAATGATAATGACTATTATCTGTTTATAAGTCTTGACCAAATTGCGTGCCAGCAGTCGCGGTAATACGTAGAAGACTAGTGTTAGTCATCTTTATTAGGTTTAAAGGGTACCTAGACGGTAAATTAAACCTTAACGGGTACTTTTTTACTAGAGTTTTATATGAGAAGGGGAGTATCCTTGAAGTAATGTTATAATATTTTAATAACAAGGAGACTGGTAAAGGCGAAGGCTGCCTTCTATTAAAAACTGACGTTGAGGGACGAAGGCTTGGGTAGCGAGAAGGATTAGATACCCTAGTAGTCCAAGCAGAAAATTATGAATGTCATAAGCTAGATTAGACTTTACAATTAAAACACTAATATATTCGGGATATTAGAAATAAAGAGTAGTTTAACTAAATAGGGTGTTAACTATAAGGAGGACAACCGCCTATAGGTAGTCTCTTCTAATGTAAGTAAATTTTAGCTTATAAATGAAAGTGTAAGCATTCCACCTCAAGAGTAAAATGGCAACATTTAAACTGAAATCATTAGACCGTTTCTGAAACCAGTAGTGAAGTATGTTAGTTAATTCGATAGTCCGCGAAAAACCTTACCACAATTTGTATATTATTAAATTATTACACGAGCTGCATGGCTGTCTTTAGTTAATGTCGTGAGATCTGGTTAACTCCTTTAATTAACGAAAACCCTCACCTTATTTATTTACATAAAGTGGTTCACCGCTATATTGGATTTGATAAGAGGGATTAAGACAAGTCATCATGGCCATAATATTGT
>URS00004A8811 rRNA from 1 species 
CGGACGGGTTAGTAACGCGTGGGAACGTGCCCAGATCTAAGGAATAGCCACTGGAAACGGTGAGTAATACCTTATACGCCCTTCGGGGGAAAGATTTATCGGATTTGGATCGGCCCGCGTTAGATTAGGTAGTTGGTGGGGTAACGGCCTACCAAGCCTACGATCTATAGCTGGTTTTAGAGGATGATCAGCAACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTAGACAATGGGGGAAACCCTGATCTAGCCATGCCGCGTGAGTGATGAAGGCCCTAGGGTCGTAAAGCTCTTTCGCCAGGGATGATAATGACAGTACCTGGTAAAGAAACCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGGGTTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGATTGGTAAAGTTGGGGGTGAAATCCCGGGGCTCAACCCCGGAACTGCCTCCAAAACTTCCAGTCTTGAGTTCGAGAGAGGTGAGTGGAACTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGCTCGATACTGACGCTGAGGCGCGAAAGTGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACACCGTAAACGATGAATGCCAGTCGTCGGGCAGTATACTGTTCGGTGACACACCTAACGGATTAAGCATTCCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGCAGAACCTTACCAACCCTTGACATCCTGATCGCGGTTAGTGGAGACACTTTCCTTCAGTTCGGCTGGATCAGTGACAGGTGCT
>URS0001995650 lncRNA from 1 species 
ATGCCTCGGGGTCACAATGCAGAGAAGGAACACTTCGCTCTGGACGCCCGGAGAGGGACAGCTGGCCTGGGTGTGCCAGCTTCCAAAGGGCGGGAGGGACTTCATCAGGGAGACCATCCGTCCAGGCGGCCCCCAGGGTCTGAAATGGCCAAGGCGTCCAGGCGGCCCCCAGGGTCTGAAATGGCCAAGGCGGGGTCCCGTCCGCCCCCTCCCCCGCAGGGCAGCCCGGGTCCCCAACGTGGGCCGGGGCGCGGGGGCGGCAGGTTTCCGGCCGGTCCCACCCAGGTCCCACCCAGCCGACTGGCCGGGGCGGGGACCCCCCAACCCCCCCAACCTTCCCGGCCCCCCCCCCCCCCGCCGGCCTCCCCAGCCCAGCCTGGTCCCGGGTCCGGAGGCGGGCGAGAGGCAGGGGGGAGGCAGAGGGGAGGGGCGGGGGGGGAGCGGGGGGAGGCGGGCTGGAGGCAGGGGGGAGGCGGGCGGGCGGGGAGGGAGCAGGGGGCAGGCGGGCGGGAGGCAGGGGGGAGACAGAGGGGAGGGGCGGGCGGGGGGGAGCAGGGGGGAGGCGGGCGAGAGGCAGCGGGGAGGCGGGAGCGAGCGGGCCGCTGCCCGGAGGCCGCGCCGCCCCGGCGCAAACATTTCCTTATGTGGTGGCTCCGCGGGGCCGGGGCGGCGCCGGGGGCTGCGGGGACGGCGGCCACGCCCGGGGCCTCGCGGCCACCCTGGCCCTCGGCTGGGCCGCCGCGCCGCGCCTGCTGGACGAGACCAAGAGGGGAGGCCCCCGCCCCGCGTGTCCCCCGCAGCGCGTCCCTCGTTCCCCTGAAGGAGGAGCAGACCCTGTGGCGCCCCGACTTGGCCCGCGCTTGTGGGGGCTCCCGGGTCCGGACGAAGAGGGGGCGCGGGGTCCCCCGGCCCGCCACCTCCCTGCCCCTCCCCGGCGCAGCCGCCCAGCGCCGCAGCCTCCTTGGCCTTGGGAGCTGCATTTGGGGGTGGAGGGATAGCGGGGCGACGGCGGGGGGATGGCCCAGGGCCGGAGCGGCGAGTGCCTCACTGGAAATGTCGCGGCTCTCGGCGGGCTCCAGGCTCCAGGCTCCAGGCTGCAGCCCTCCCGAGAGAGCTCGGCCTCAAAACCTGGAGCCCGCGGCTGCCTTCCTGCGGCCAGGGCGTCCCGAGCCTGAGGAGTGCGACCCGGCTCCGACACCCCCACCCCCACCCCCACCCGAGCTTCGCAGGTGTCTGCTCCGACCCCCCAAACTGTCCTGGGGCCTCAGGCCGGCCTCCTCGCCAATTGCAGCCTTTGAGCCAACTTTCATAGCTGATAGGGCAGGTTCCCTATGGGATATTTATTAA
>URS0000856D3B rRNA from 1 species 
TACGTAGGGAGCAAGCGTTGTCCGGAGTTATTTGGCGTAAAGCGCTCGTAGGCGGTTCCGTAAGTCGGGTGTGAAAAATCTGGGCTCAACCCAGTGGAGCACCCGATACTGCGGTGACTCGAGTCCGGTAGGGGAGTGTGGAATTTCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGACGGCGAAGGCAGCACTCTGGGGCGGTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCAAACAGG
>URS0001FB44EA rRNA from 1 species 
ACGAACGCTTGCGGCGTGCCTAAGAAATGCAAGTCGAGCGGGGACAGCAATATCCTAGCGGCGAACGGTCGCGTAACACGTAAGCAACCTGCCTCAAAGACCGGGACAACATTCCGAAAGGAGTGCTAATACCGGATGTGGCCACCTTTTCGCATGTTTAGGTGATTAAATCAGGAAACTGGCTTTGAGAGGAGCTTGCGGCCTATCAGCTAGTTGGTGGGGTAACGGCCTACCAAGGCGACGACGGGTAGCTGGTCTGAGAGGACGATCAGCCGGACTGGGACTGAGATACGGCCCAGACTCCTACGGGGGGCAGCAATTAGGAATCTTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGGAGGAGGAAGTCCTTCGGGATGTAAACTCCTTTTAGGTGGGAAGAAACAAATGACGGTACCACCTGAATAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTGTCCGAAGTTACTGGGCGTAAAGCGCGCGTAGGCGGGTCGTTAAGTGGGAAGTGAAAGGCTGGGGCTCAACCCCATGCAGTGCTTCTCATACTGGCGGTCTTGAGTGAGGTAGGGAGAAGTGGAATGGCTGGTGTAGCGGTGAAATGCGTAGATATCAGTCGGAACACCGGTGGCGAAGGCGGCTTCTTGGGCCTTTGCTGACGCTGATGCGCGAAAGCCAGGGGAGCGAACGGGATTAGATACCCCGGTAGTCCTGGCCGTAAACGATGGATACTAGGTGTAGGGGGTATCGACCCCCCCTGTGCCGCAGCTAACGCATTAAGTATCCCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCTGCGAACTTGGCTGAGAGGCTGAGGTGCCGAAAGGAGCGCAGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCTTAGTTACCATCATTAAGTTGGGGACTCTAAGGAGACTGCCGGTGATGAACCGGAGGAAGGCGGGGACGACGTCAAGTCATCATGGCCTTTATGGGTAGGGCTTCACACGTCATACAATGGTCGGTACAGAGGGTCGCCAACCCGCGAGGGGGAGCTAATCTCACAAAGCCGATCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGCGGATCAGCATGTCGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTTCACCAGAAGAGGGTAGCCTAACCGCAAGGAGGGCGCTCGCCACGGTGAGATTCATGACTGGGGTG
>URS00021EF114 pre_miRNA from 1 species 
GCTGGTTTCCGATGGTGGCTTAGAGTGCGGTCCTCCATCTAGCACCATTTGAAATCAGTG
>URS000103BC31 rRNA from 1 species 
TACGTAGGGTGCGAGCGTTGTTCGGATTCATTGGGCGTAAAGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTTGGAGCTTAACTCCGAAACTGCATTCGATACTGCCGTGCTTGAGGACTGGAGAGGAGACTGGAATTTACGGTGTAGCGGTGAAATGCGTAGATATCGTAAGGAAGACCAGTGGCGAAGGCGGGTCTCTGGACAGTTCCTGACGCTGAGGCACGAAGGCCAGGGGAGCAAACGGG
>URS00005A39E1 rRNA from 2 species 
GGGATGGGGGGCATGCTATACATGCAAGTCGAGCGAACTGATTAGAAGCTTGCTTCTATGACGTTAGCGGCGGACGGGTGAGTAACACGTGGGCAACCTGCCTGTAAGACTGGGATAACTCCGGGAAACCGGAGCTAATACCGGATAACATTTTCTCTTGCATAAGAGAAAATTGAAAGATGGTTTCGGCTATCACTTACAGATGGGCCCGCGGTGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGCTTTCGGGTCGTAAAACTCTGTTGTTAGGGAAGAACAAGTACAAGAGTAACTGCTTGTACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGGAACTTGAGTGCAGAAGAGAAAAGCGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGGCTTTTTGGTCTGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCTGGTAGTGCACGCCGTAAACGATGAGTGCTAAGTGTTAGAGGGTTTCCGCCCTTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTCTGACAACTCTAGAGATAGAGCGTTCCCCTTCGGGGGACAGAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGATCTTAGTTGCCAGCATTTAGTTGGGCACTCTAAGGTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGATGGTACAAAGGGCTGCAAGACCGCGAGGTCAAGCCAATCCCATAAAACCATTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGAAGCTGGAATCGCTAGTAATCGCGGATCAGCATGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGGGGTAACCTTTATGGAGCCAGCCGCCTAAGGTGGGACAGATGATTGGGGTGAAGTCGTAACAACAGC
>URS000041F567 rRNA from 1 species 
TGGATCCAGACTTTGATCATGGCTCAGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAAGCTTGACGAATGATTTCTTCGGAATGAATTCCGATATGACTGAGTGGCGGACGGGTGAGTAACGCGTGAGGAACCTGCCCTTCAGAGGGGGATAGTGTTTGGAAACGAACAGTAATACCGCATAATGTATTTTTACCGCATGATAGAAATACCAAAGATTTATCGCTGAAGGATGGCCTCGCGTCTGATTAGATAGTTGGTGGGGTAACGGCCTACCAAGTCGACGATCAGTAGCCGGACTGAGAGGTTGAACGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGGGAAACCCTGATGCAGCAACGCCGCGTGAAGGAGGACGGTTTTCGGATTGTAAACTTCTGTTCTTAGTGAAGAAAAATGACGGTAGCTAAGGAGCAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTACTGGGTGTAAAGGGGGCGCAGGCGGGAGAGCAAGTCAGTTGTGAAATCCATGGGCTTAACCCATGAACTGCAGTTGAAACTGTTCTTCTTGAGTGAAGTAGAGGTTGGCGGAATTCCGAGTGTAGCGGTGAAATGCGTAGATATTCGGAGGAACACCGGTGGCGAAGGCGGCCAACTGGGCTTTTACTGACGCTGAGGCCCGAAAGTGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACACTGTAAACGATGATAACTAGGTGTGGGGGGACTGACCCCTTCTGTGCCGCAGCTAACGCAATAAGTTATCCACCTGGGGAGTACGACCGCAAGGTTGCAACTCAAAGGAATTGACGGA
>URS000022D4E2 rRNA from 1 species 
CGGACGGGTGAGTAACGCGTGGGGAACCTGCCCTGTACAGGGGGATAACACTTAGAAATAGGTGCTAATACCGCATAAGCGCACAGTATCGCATGGATACAGTGTGAAAAACTCCGGTGGTACCAGGATGGACCCGCGTCTGATTAGCTGGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGGCCTGAGAGGGTGAACGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGAAGGCAGCAG
>URS00023619E2 lncRNA from 1 species 
AGCACAGATCCATTAAGGCTGACCACAAATTGATCATAATGTTTGTGAATAGATTTGAATGAATTTGAACTCTTAGCCTAAGCTTTTTTCTTTCTATCAATAAAAGAACAATATCTATAATTATGTTTACTGCTCCGTTCCTTCGATCTACACCAACAATGTTTGTATTTTTGGGGAGATCCGGTGCTTAAAGTAAAATTTTTAACGCAATGAATAGGGTGCATTTTTTTCTGATATTTTGGTTTCTCTGTTCCCTATTTATCCAAAATATGCTCACCCCAAATTCTTTAGTGCAAGAGCATGATGGAGCTTTCTCTTGCTGCTTTTCCTTGAAAGAAAGAATGGCAACCAGGAGGTGCTTGTAGCTAGCCACTTAAGTAGGCATGTGCCTCCCCAAAGCACACACTTAAAATAGAACAAGCTTGATCTTGAAGACTATTTAATCGACAAGATGATACATTTTGCGAGAGGAAGTATTAAGATAATAACAAGCTCGAAGACATCCGTACGTTGTCGGCTAGGATTCCTTTAGATTAATGGATTGGAGATCATCATCCCTCTTCACACCCTACATTCTCTAGATGCTCTTATCCTTGGCATCTGCACGAACAAGGATTTGTA
>URS00025F6FB7 lncRNA from 1 species 
GTCACAGGAGGGAGAGAGCATTGTTAGATCCATGGACATGCAAGGAGAGGGATGCTCCTGCAGAAGCATGGTCCCCAACTATAAAGGCAGCATTGAATCACAGAATCATTGAAAAGGTTGGAAAGCCAATAAGAACATCTAGTCCAACAATCAACCCATGCCTGTGACTGCTCAAGACCATGTCATCCATGGATACAAAAGGGTTTTCCTTTCGGACAATATGAAACAAAGTGCTTGGTGGGATCAGACCAAGCAGCAGAGCCTTGCTTTGGAGCAGCTGCTCGTGCCACGTTGTTTTGTTTGCTGATGTCCTTGGGCTCTGCAACCTGACAGAATGCTGCATTCCTGGTGCTCCTGCTTTGCATTGGGATCAAACTGAAAGCTGGTATCTGGTGCCAAGAGGAAGGAGAGCTTTGGATTTTTGACCCTGAGCATGGAGCTCTCACTGTTGGGCTGTGAGCTCTTCACAGCATGAAGAAAGCACGATTCACTGCTGTAACGGAGTTCTTCAGAAAAAAAAACGTGTTGTATCCTGGGTATGAAATGCCTAATCAAATCATGTTTACTGCTCAGCACTACACTGC
>URS0000B25448 lncRNA from 8 species 
TGGAGCCAGCTTATTCTAGACCAAAAGGGCCTGGACTGTTCTAGGTACAAGATGGTGCCATGAATGTGCCAATCTCGCCTCTTAAGAAAATGTTAAAACTAAAGTAAGTGCATAAACTATTAAACTAAATGCATGAGTCTTATTTACATATAGGAAATGGTAATTCAGAAAGCTAGCCTGTGAGATTATCAATCATCACCAAACCAGATCTTGATGACTGTCACATCTCTGCTATATTTTCCAAATAGGAAATCCCATTTACCAGGGCCCTCCTGAAATGCCTGGGATTATGCCAAGGATCGCTTCCCTAGTTATTTTTATGTGTAGACCTGAGGAGTGGCAGAGTATGTAACCTTTAAAGATCATTAAGCACCAGTCTTGGGCTCAGCCTGAATTCTCACTCAGCAAGAGTAATGTAATTGCAATTATAGAACTGATCCATTTTATCACTTTCTGAGAGATCAATTGTCAGAGATTGAGACTCTTAATTCATCCTGGGTTTTAAGGAATATTTAAATGAGAATAAGGAATAAATTGAAAACATCAAGAAACTGACACAAA
>URS000236373A lncRNA from 1 species 
ATTTTATTTGTCTTGGACCAGCGTATCCTTTTGGGGGGAGGTGGGGAGACCTACGAATATTTGAGGAAGAAGCAGCTACCATATTTTTCATTCTCGCGCCAAGAATAAGGGCTCTGGAATTTGGACAGTCGATTGGCATTTGCAGATTCAAACTGAGGAGAAGAACACTAGCGCAAGAACATGAGTTCCGCGACACAAGGTGAACATTCTCGATCTTCTGAAATTTTCTGTTCTTGTTTGTAGCAGTCGCCGATTTATTTTTGATTGAATTTCTGAGACTTGTATTGTTTGACACGATTATGTTGGTATATATTATTTGCATTCCCATAGATGTTGATGGTTGCATCTAATGCGCCACAAATAGAGCGCATCTCGGCGAATTTTTTTCAATTTTCATAAAATATGTTGGATTTATGGAATATATGTCTCAAGCTTGTGTATTACTTGTCGCTGCATACTCAAATATTTTTCTATGGATAGTTGTAATTAATCAATAATTCATTGGGATTAGGTTTTGTGCAAATATCTTATGAATATTTTCTGTAAAATATAATGAGCCTCCTTGACAGCCTCTTGCTCTCTTGATAACTCATATAATTTGTGTACTTCTTGTTGGGGTTGATGGTTTGCAGATGGGAGCAACGGGTTTGTTCGTGGGGGTCGGGTAAACAAGACCGACAAGACTCGACGCAGTTGGTCTACTCAAGAGGAGGCAGTGCTGCTAGCTGCGTTGAAAGAATTGGTGGTGCAAGGATGGAAATCCGACAACGGATTTCGGCCAGGTTATTTGACTAAGTTGGAGGAGGCTATGAAAAAGGTATTCCCAACCACTGACTTGAAAGGGATGCCACATATAAACTCAAAAACCACGACATGGAAGAAGCAATACTATTCGCTAACGCAAATATTGGGGAATACTGGGGTGGGCTTCAATGTGAATGGCATGCATATGGTGGATTGTAATGACGAGCAATGGGAGCAAATCATCAAGGTTAGTAGGTGTTCATATTGTAATATTAAATTCAGGCTGTACAAGTTTTCTAATATGTCTAAATGAACTACAGAAAGATACAAACGCACGCACAATGCGTTACAAAAGTTGGCCCTACCTGGAACAGTGGGCTGAAATATTTGGGAAGGATAGGGCGACGGGAGATGTGGCTGAAGATCTTATGGAGGCCGCACATGACATGTATCGCAAGATTGATCTTAGCGAACCACAAAATGATGGTGACTATCATGTATCCCTCGATGACATGTTCGAGAAGACCGCAACCAATGACAGTGTCAGCCAAACACAAGAAACCGAGTCTGAAGTTCGTGTCAAGCGGAAGAAGAGAAAGCAAGGCGACGAGTTCGAACAAATGTTTCAGGTGTTGGCAGATATCCAACGCACAACCGGACAGCGACTTGTCACAATATCAAGTAGAATGGGCTACGACTTCGACGTATCCAAAGCGAGAAAGGAGGTCTTCGCACAACTAAGCTCAATTCTGGGTTTATCCCTCAAAGCGAAGTTCGAAGTCGCCAATTTACTTGCAAAAGAGGTGGAGATGCTCGATGTATTTACTAGCCTGCCCGAAGAAGCCAAGAATGAGTATGTCAACTTCCTACTCGAGGAGAAATATAAATAGGATTGCTTCGCTGCACCATAGGATCTTGGGTGTTTTTTGGTTTCAAATTTTATTTGCTAACAACTCCTTCATTTCTGGAATTATGTTAGACCAGTAGAACTGCTGTTTCTTTTTATTTTTGGTGTCTTGGAGCTTAGTTCAGACATATCTTATCAAGTGGCTGTATTTTGGAGTCTTGCAGAAGCCACTTGTCTTAAATTATGCAGTTGAAGCTCGACAGAACTTATTTGACATTTTATGTTGCTTTCAAATTTGAATATGTTGGTATGTCTGTTTCAGATTTGCTTATGTTTTATCTTGCGGTGGATTACAAAGGCTTTTGTATAATTTAAATTGTAGTTTCAATAGGGATTTATTTAAATTGCATATGAATCGAAAATTGCTAATTCAGATAAGTTCAAACACAGCTCCCACAGTAAGCACAAATTCATCATAACTAGAAATCATGAGAAAACCAACAAACACAATAGACAATAACAAAGCTGCCTTCATCTACGAGGCACCAAAATAAGAGAAACAACGGTAGACACTGGACCTAACAGCGTGCATCGACGCTAACAAAATGGGAGGGAATAAAATGCGGTCCACAAAAGAGAGTAAGCTCCGCTTACAAATTTATTTAAATGGAGAAGACGAAGCACATGAGCTCCCGCCATAACCGACGTCATCTTTCTTACCATCATTCGGTTTCACGGGAAAGGCGTTCTTTGGAGGAAAGGAGGACGTCGTTTGTTTTGAAAATTTGTTCTTGATGGTAGACCATGGGACGTAGACATGACCCTTATGCGATTTGGGAAACGAGGGAGACACACTCGAACATGCATCATCTGGCTGAACTACCAAGGCACACAGTGGTTGGGTTTTAGTAGACGGGGAGTTCACTTCGTCCTCCGATGAAGTGTCGGTGAAGCTTTCAAATGGAGGACTCTTTTCACCTTTTGACGAGTCCTCTATCACTATCACAGTGTGTGAGATCTCGGGCTTCACATCGTACATTCCGAAGAGGGAGCACAATTTTAGGTACTCGGGCTCACCCTTATGGTAGTAAGCTTTGTAGAACTCATTTTCCTACAACCGATAGTGACTTGTATTAGAAAGACTAGCACACAACAGATTTAAATGATTTAGAACAGCAAAAACAATAGTTATAAAGCATCTCACCTTGAAGAGTTGCTCCCACACTTCATCGCTTGCATGAAGAACATTTGTCGACGCGTCCCGATCGGTCTCCGGGATATTGCAAAGATACTTGAAACNAGCTCTGGAAAAGTCAGCTCTGCCTTTGGTCAGCTCTGGCGATTTTAGCTCTGGAAGTCGGCTCTGGCTCCGAAGTCAGCTCTGGTGACTTAGCTCTGGAACGTCAGCTCTGGCTTCTAAAGTCAGCTCTGGCATGTTGGCTCTGGAAAGTCAGCTCTGGCCTCCGAAAGTCAGCTCTGGCGATTTGCTCGGGAAAGTCAGCTCTGGCCTTCGAAAGTCAGCTCTGCTCTGGCGGTTTCCAGCTCTGCTCTGGAACTTCCAGCTCTGCTCTGGTGTTTCCAGCTCTGCTCTGGAATTTCCAGCTCTGCTCTGGAACTTCCAGCTCTGCTCTGGCATTTTCTAGCTCTGCTCTGGCATTTCCAGTTCTGCTCTGGCATTTCCAACTCTGCTCTGGCATTTTCTACTCTGCTCTGGCATTTTCTAGCTCTGCTCTGGCATTTTCTGTTCTGCTCTGGTATTTTCTGGGCAGAACGACGAGGGTTTCCAGTTTCCAAAACTAGGGTTCTTTGTCCTTTCTTGCCTCGATTCTCACTCGTACGTCGGCCCTAATCTATTCCTATGTGAGCATGCTGTGCTTGTTCAAGTTCATCTACGTTTAAAGCCTAAAGTTCTCGTCGTTTAATCAAGGTTTCAAGCCGTGGGTTCTACCGAAAAAGTGACTTAACATGCTTCTTGTGTTCGTGCGTATCTAGAGCCTAAAACATGCTTTCTACGAGCGTGTGATTCATGCTGAAAGGAGAGGTCGAGAGTTACCTTGATGTCGCGCGCTTTGGTCGGACAAGCACGATGGTTCCTCGCTTCTCCGATCGTCGAGGTTCAAGGTGTCGAGAGAGTGATGGAACTCTTGCTGTTGCTGCTGGATTTCAGAGTGCCGAAGGAAGAGGAAGGGTCACACAAAGGGGTTGAAGGGGAGTTTAAATAGGGTGTTCGGCTGATGCACTTGAGTGCCTAAGGGGAGAGCTTCGGCTGTAGCTCTGCACAGCGTGGAAGAGGGGTGCAGCAGGCGTGCTAAGCTCTGCTGTGGTGTTGCGTGGGGAGGGCTGCTGCTGCTCTGCCGGCGTGGAGATGGAGTGTGGCCTTTCGGCTGCTCGTCCAATGGAGGCTGCTGCCGTGGCTGCTCTGGTCTGGCGTGGAGTGTGGCGTGGCGTGGAAGAGGGGTGCAGCAGGCGGCCCTTCGGCTGCCCAGCCAATGGGGGCTGCTGCCGCACCTTTTCCTACTTTTCCTTTTCTCCATTTTTCCTTCTTTTCTTAACTTGTAGCGTTGGCAAGTGTTGGGATTGGGTGGCGTGAGTGGTGAAGTGATCTAAGAGAAGATCTAAATAAAATCCTTCAGTGTCGGTCATTCTCAGTATTAAAAATACTGGTTTCGTGCTTGCTAACATCGATAAATGCTAAATTAAATCCATAGACTCAATCCGTTCGTCATTCTAATACTTAAATTAAATCCGTAGATTTAATTAGCTTCAAAGTCGGAAATAATTCACGACTTAAGTAACAATGTGAAATAAACTCTATCTTGATAAATAACCCAACTTAGCTAAGTTGGTTATAACTTTGAAGAATAATAATTCATCGACTCAAGGATTCTCATCGCGGTCTTAAACACGCGAAGCTAAATAAATGCATACTTGCTAGTGTAGTGACTCTGTCTCCAAAATACGAAATTCATAAACATAGATGAAAACATGAAACGCTTCAATTACTGGCAGATAGAAAAATAAACATGCAAAAACTGAAATTAAATGATGATAAAAGAGCGGGTTGCTACAACTGAACATCGGGCGGAAGCTTACATCAGAACATACGAGGCAAATCATTATAATTCGGCTCAAAGGTATATACGTCAACATCGTTATAACTTCTTGAATATTAGAAATTTCAAGAAGAAAAGCAAAGTAGGTACAGCTTATTTTCCATAAGGAAACATAATATCAAGAGTACCACAGCAAAAGGCGTAACAATTATATGTATGAAGACATATAACCGCGAGTATATTGCTTGATTAGAAAGGAATAAGACATCATCTCACTAAGGTTTTATCAACATCAGAAGGAAAGCAAAGTACATCATCCTTAAGACTCTAACATCAAAGGAAAAACAATATAGAAACTTCATCAATGAAACCATCCCCACCAGCACCAGTCCAATCTTGCTCCATTGCTTAGCCTGCACATTTAGGCTATGTTTGGTGTCTGGTAATGGATTAGGCAATATAGTTTATTTTCGGCTACCTAATCTTGATTACAATGATATTAGTATGCTTTGTTGTTGTTTGATTATTTAAATAGTTACATAACAATCTATTTTGGTTGGTTTGGTGAGCAGTAATAATAGCACGATTAAAGCTGAATAGATGATAAAATGACTAATATACCCACCCATTTTATTTGTCTTGGACCAGCGTATCCTTTTGGGGGGAGGTGGGGAGACCTACGAATATTTGAGGAAGAAGCAGCTACCATATTTTTCATTCTCGCGCCAAGAATAAGGGCTCTGGAATTTGGTACAGTCGATTGGCATTTGCAGATTCAACTGAGGAGAAGAACACTAGCGCAAGAACATGAGTTCCGCGACACAAGGTGAACATTCTCGATCTTCTGAAATTTTCTGTTCTTGTTTGTAGCAGTCGCCGATTTATTTTTGATTGAATTTCTGAGACTTGTATTGTTTGACACGATTATGTTGGTATATATTATTTGCATTCCCATAGATGTTGATGGTTGCATCTAATGCGCCACAAATAGAGCGCATCTCGGCGAATTTTTTTCGATTTTCATAAAATATGTTGGATTTATGGAATATATGTCTCAAGCTTGTGTATTACTTGTCGCTGCATACTCAAATATTTTTCTATGGATAGTTGTAATTAATCTAATAATTCATTGGGATTAGGTATTGTGCAAATATCTTATGAATATTTTCTAGTAAAATATAATGAGCCTCCTTGACAGCCTCTTGCTCTCTTGATAACTCATATAATTTGTGTACTTCTTGTTGGGGGTTGATGGTTTGCTAGATTGGGGAGCTAACGGGTTTGTTCGTGGGGGGCCGGGTAAACAAGACCGACAAGACTCGACGCAGTTGGTCTACTCAAGAGGAGGCAGTGCTGCTAGCGGCGTTGAAAGAATTGGTGGTGCAAGGATGGAAATCCGACAACGGATTTCGGCCAGGTTATTTGACTAAGTTGGAGGAGGCTATGAAAAAGGTATTCCCAACCACTGACTTGAAAGGGATGCCACATATAAACTCAAAAACCACGACATGGAAGAAGCAATACTATTCGCTAACGCAAATATTGGGGAATACTGGGGTGGGCTTCAATGTGAATGGCATGCATATGGTGGATTGTAATGACGAGCAATGGGAGCAAATCATCAAGGTTAGTAGGTGTTCATATTGTAATATTAAATTCAGGCTGTACAAGTTTTCTAATATGTCTAAACGAACTACAGAAAGATACAAACGCACGCACAATGCGTTACAAAAGTTGGCCCTACCTGGAACAGTGGGCTGAAATATTTGGGAAGGATAGGGCGACGGGAGATGTGGCTGAAGATCTTATGGAGGCCGCACATGACATGTATCGCAAGATTGATCTTAGCGAACCACAAAATGATGGTGACTATCATGTATCCCTCGATGACATGTTCGAGAAGACCGCAACCAATGACAGTGTCAGCCAAACACAAGAAACCGAGTCTGAAGTTCGTGTCAAGCGGAAGAAGAGAAAGCAAGGCGACGAGTTCGAACAAATGTTTCAGGTGTTGGCAGATATCCAACGCACAACCGGACAGCGACTTGACACAATATCAAGTAGAATGGGCTACGACTTCGACGTATCCAAAGCGAGAAAGGAGGTCTTCGCACAACTAAGCTCAATTCCGGGTTTATCCCTCAAAGCGAAGTTCGAAGTCGCCAATTTACTTGCAAAAGAGGTGGAGATGCTCGATGTATTTACTAGCCTGCCCGAAGAAGCCAAGAATGAGTATGTCAACTTCCTACTCGAGGAGAAATATAAATAGGATTGCTTCGCTGCACCATAGGATGTTGGGTGTTTTTTGGTTTCAAATTTCATTTGCTAACAACTCCTTCATTTCTGGAATTATGTTAGACCAGTAGAACTGCTGTTTCTTTTTATTTTTTGGTGTCTTGGAGCTTAGTTCAGACATATCTTATCAAGTGGCTGTATTCTCGGAGGCACACAACAGATTCATATGACCATTTCCACAGCTGCATAGAGGGGTAGGTGTTGATGTCTCAGACGCGGCGTCCATCCTACAACACCAATGTATAGTATTTTAGTATTTTGACATGAGTAGCATAGAAATTGATAGAAAACTTATATGGCCATGACAAGCAGCATCGCAGCAAGATCAGATAAATATTAACAAGGGAATTAGCAAGAGACCACTAGAGACTACTATATTCATTGTAAAAATCAACAAGATTTTAAATTTTATTCACATCAATATCATCAACAGCTGAGATAAGGATTTCTTATGAATTAAAAAATTATTACAATTGTCGAAATCGAACACAATTAAATGGAATTTTATCATGTAAACCCAACATCATCAAAATCACAGCTGAACACAAGCAAATTAGAGATAGATGTCACCAAGAACTTGCTGCAACAGTTTAAAGACGAATTAACATGCAACATTCTAAAGAGAACACCTTAAATGAATGTAAAAATTATTGCAATCGTCACCTAATGATTATTCAAGTATTGAAGCCACATCCCCTCCGCCAATTCATCCCTTGCGGCATTCCATTGGGGAGAAGACTCGACCGTGGCAATGAACTCGTCATGATCGGCTTCAAGGCCATGAGCATTACTATTTGCCATCGCATCAAATTCCTCTTCTATTGGATCGACCGGCATTTGCATTCGAATAAAATTATGAAGTAAAAATGTTGCCATTATTAACCTATTTTGGACCTTAATTGGGTAGAACGTGGTGGACCGTAGAATACCCCACGCATTTTCATAATTCCAAATGCTCTCTCAATCACATTCCTCGCCTTACTATGCCTCAGGTTAAATAACTCCTCCTTGTTTTGGGCCTGGCAGCAGTGGGACCCCACTCCTTCAGGTGGTATCTAACGCCCTTGTAAGGCGTTAGAAAACCATCACTATTTGCGTAACCGTTGTCACACAAATAGTAATTTCCTGTTGAAGCCCCAACAAACCAAAACAAAAGAGTAATTTAGGTAAACTTTGATAAATAATCCACGTAAACACAAACGCTATTCGAATTAAAGAGCAAATAATTGGCATTACCCTTTGGCACTTTAAGACCGTGGGGTCTACTTATGGCATCCCTTAATATCCTAGAATCTGCAGCAGAGCCTTCCCAACCGGAAAGAACGTAGACAAACTTCAAGTTTCGGTCACATACACCTAACACATTCTTGGATATCTGTCCTTTCCTTGTCCTATAGCGTGCTTGGTCGTTAGTGCTCACCATCACATTAACATAGGTGCCGTCTATAGCTCCTAGACAACCCTAAGTTGAAGAGAGACATTTAAAAACGAGTTAGTGCTAATAAAATTTATGATCATACTTACTAGAATAACTACAAGGCTGCCCTACATACCTTAAACCACTGCCACCGGCCATCTGTACAGTCATTGGACACAGCTTCCGGTTTTGATAAAAAAATTTCGTGTATCTTCAATATTGCTCCTAACACGGCATGTACGTAGCGCGATATGGTTTGCCCAGAAACGACAAAAATCAAATCTTACAACTCTATTTTTCTTTGTGATGTGCTAAGACAGACAAGAAAATGGCTACTTGTTCCTCCACACTCACGTAATCACCATCAACTAAGCCTCCCAAACCCCGTAAAATGGTGCACAACCGCCCGAAGGTATTACGATCCATTCGCAAGTTCGCGATGCAATCGACATCATTGACACTTATCAGCCTACTTAAATATTTTATTTGGTCCGGCATTCTACTTATCATCCCATATTTTCGTGATCCAAACCCACGTTTTCTTTTTCTTGAGCTAGACTTGATAAAATATGTAATTACTATAACCAACTGCATTATATGCTGAAGCATTATTTCTTGCAATAGCAAGAACAAGATATCGGACATACGGGGACGTACACGGCCAGACATCTAAAATAGAAACAATAAGAGATAATTATAACTTATATTCACTGCATTTCACCACCATGGCAGATTTATTTAAATTAATTTCAGTTTGAGCAAGTGATGGCAGAAACAAAACGAACCATGAACATATCATCAATCAAAATGTAACTGCAACAAGTGTCGTACACCAAGAGACAATTATAACTTATATTAATTGCATTACCAGGCACTATGTCAGATTTATGCCAACAAGCCATTCAACAACCAATCAATAATTCATCACCACATTAAAACTGTACTACCGAGAAAAAATCCCAATAAGCAAATATTTTCTCATAAAAAAAAAGAATATGTCATGCATATCAGGAAGAGATACTATTCAGCCACAATAGGCACTCCGTTAATTCTTTCAGAAATCATATTATGTTATTGTTTATACATGCATCGATCGTCAATTTGATAGTTTAAAAGACATATACAACGAGTGTGATTTATATATATCCCTAGAGATAACAAGCAATCGGACAAGCACTAACCTTGGTCTGTTCACAAAGCCTTCGACGTGGAGACTGAGGCTGCTTTCCGATGAGCGTAGCGACCAGAAATACGGACAAGAAATCCCAAAGTGTTTTGGC
>URS0000A5EA3D rRNA from 1 species 
TACGTATGGGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGAGTGCGTAGGTGGTTACCTAAGCGCAAGGTTTAATCTTGAGGCTCAACCTCATTCTGCCTTGCGAACTGGGCTACTTGAGTGCAGGAGGGGAAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTACACAGAACACCAATTGCGTAGGCAGCTTACTGAGCCGACACTGACGCTGAGGCACGAAAGCGTGGGGATCAAACAGGATTAGATACCCCGGTA
>URS00009D2B09 rRNA from 1 species 
TACGAGGGGTCCTAGCGTTGTTCGGAATCATTGGGCGTAAAGAGTCTGTAGGCGGCTAGATAAGTCAGGTGTGAAATCCCCGGGCTCAACCCGGGACGTGCATTTGATACTGTCTAGCTTGAGTATGGAAGAGGCTAGTGGAATTCTTGGTGTAGTGGTGAAATACGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGGCTAGCTGGTCCTATACTGACGCTGAGAGACGAAAGCATGGGGATCAAACAGG
>URS0000CEB689 lncRNA from 1 species 
CACCCGCCCTGACACCGTCCTGATGGGGGTCCTGCAGAGAAGACTCCTTACTTAGCCCACAGTGCTCCCACCCACCCTCAATGTATAACTTCACGTTCAGAAATGTGTTACCCCCCTCCTCAGACCTCACACAATTCACGAATTTCCAAACAGCAGGAAACAGAAACTTCTAAGAAAGCAGAACCCTTGAGTCCAGGTGGGAGAAGGTGCCTGAGAAAACAGCCCTGCCAGAGACAGTACCCCAGCATCCGGACGTTACTCCACAGACGGCCACGTGAGAGACCGGGAACCACCCTTCCCACCGTACCCCAGCGTCCGGACGCTACTCCACAGACGGCCACGTGAGAGACCGGGAACCACACTTCCCAAGCCTTCTGCACTCCCAAAAACATCAGCTTCCCGGAAACCTGAGACATGCTCAAGGAAGAGCACGGTGTGAAGTCAGCTGTGGGTGGAGGATGACCCAGGTGCCCAGGCAAGAGACTGAAGGCACAAACTGTTTCAGTATAATAAAGCAAATAGAATAAGAA
>URS000155D742 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGGGTGCGTAGGCGGGTCTTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGAAGATCTTGAGTTCGGGGAGAGGTGAGTGGAACTGCGAGTGTAGAGGTGAAATTCGTAGATATTCGCAAGAACACCAGTGGCGAAAGGCGGCTCACTGGCCCGATACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGGATAG
>URS000074D688 rRNA from 1 species 
TTTATTCAGGGTTCAAAATNAACTTNGGCGGCGNGNATTAGNCATNCAANTTNGTCCTTCCCCAAGGCAGGGCGAGGCNCAAGGGTGANTAAGGCGACGTAANCAACCCCGAGGATGGGCATANCCGCGGNAAANTGCNGGTNATTCCCAGCGACGTCGAGACGTGNCATCACGCTTCGACCCAAAGGTGTGAATCCCCTCGGGACGGNCCNTCGTGGTATCAGGTAGTTGGTGGGGTGATGNCCCACCAAGCCAAAGACGCCTACCGGGCGTGCGAGCGTGGCCCGGCACACTGGGACTGAGACACTGCCCAGACACCTACGGGTGGCTGCAGTCGAGAATCTTCGGCAATGGGCGCAAGCCCGACCGAGCGACGCCGCGTGGAGGACGAAGGCCTTCGGGTTGTAAACTCCTGTCGAGGGGGAACAAGGGGGCGTGAAGAGCGTCTCTTGAGTGATCCCTGGAGGAAGCACGGGCTAAGTTCGTGCCAGCAGCCGCGGTAAGACGAACCGTGCGAACGTTATTCGGAATCACTGGGCTTAAAGCGCGTGTAGGCGGAGTGACACGTCGGATGTTGAAAGCCCCCGGCTCAACCGGGGAACGGGCACCGATACGGTCGCTCTGGAGGGGCGTAGGGGGAGCTGGAACTTCCGGTGGAGCGGTGAAATGCGTTGAGATCGGAAGGAACGCCCGTGGCGAAAGCGAGCTCCTGGACGCCATCTGACGCTGAGACGCGAAAGCCAGGGGAGCGAACGGGATTAGATACCCCGGTAGTCCTGGCCGTAAACGATG
>URS0000AF452E rRNA from 1 species 
CCTACGGGATGCACCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGAAGGCGTTAAGGTTAATAACCTTAGCGATTGACGTTACTCGCAGTTGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAGGGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGTCCACTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTCGTAGTC
>URS000178FACD rRNA from 1 species 
TACGTAGGTGGCAAGCGTTGTCCGGATTTACTGGGCGTAAAGGGCGTGCAGGCGGTTTGTTAAGTGCAGGGTGAAAGCTCCCGGCTCAACTGGGAGAGGTCCTTGCATACTGGCAAGCTCGAGGGAGGCAGAGGAAAGTGGAATTCCCGGTGTAGTGGTGATATGCGTAGATATCGGGAGGAACACCTGTGGCGAAGGCGGCTTTCTGGGCCTTACCTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACGGG
>URS0000F98CBA rRNA from 1 species 
TGCGTAGGCGGGCCCGTAAGTCAGTGGTGAAAGTTTGCGGCTCAACCGTAAAATTGCCATTGAAACTATGGGTCTTGAGTGTAAATAAGGTAGGCGGAATGTGTTGTGTAGCGGTGAAATGCCTAGATATAACACAGAACACCAATTGCGAAGGCAGCTTACTGGGATACAACTGACGCTGAGGCACGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCC
>URS00020667BA rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTAGAACGCACAGTTTATACCGTAGCTTGCTACACCATAAACTGTGAGTTGCGAACGGGTGAGTAACGCGTAGGTAACCTGCCTGGGAGCGGGGTATAACTATTGGAAACGGTAGCTAATACCTCATAATATTGATTATTGCATGATAATTGATTGAAAGATGCTATTGCATCACTACCAGATGGACCTACGTTGTATTAGCTAGTAGGTGAGGTAACGGCTCACCTCGGCGAGGATACATAGCCGACCTGCGAGGGTGAGAGGCAAAACTGGGATTGGAACATGGCCCAGCCCACTACGGGAGGGAGACGTCGGGAACTCCTGGGAATGGAAGCAAGGCTGAACGAGCAACGACGGGCGAGTGAAGAAGGCTGTCGGATCGTAAAGGTCAGTTGTACGAGAAGAATGGGAGTGAGAGTGGAACGTTCACACTGTGACGGTACCTGAACAGAAAGCGACGGCTAACTCCGTG
>URS00019D34DB guide_RNA from 1 species 
AAAACACGAGACAAAGTAAAGAGGGAGAATAGATAGAATG
>URS0000089A8C tRNA from 1 species 
TCTAGAAGAATGGGACTTGAACCCACACCTAAGACTCCAAAATCCTTCGTACTACCACTATACTATCCCCTA
>URS00017CC75E rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTAGAACGCGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCCGATGGAGGGGGATAACTAATGGAAACGGTAGCTAATCCCGCATACCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGGGAGGTGGACCAGCGCCCATGGAACTTAGACACGTTCCACACTCCTACGGGAGGCAGCTGTGGGGAATATTGCACAATGGGCGCAAGCGTGGTGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGAGGAGGCGTTACTCGCAGAATAAGCACCGGCTAACTCCGTGCCAGCGGCCGAGGTAATTC
>URS0001993F25 snRNA from 1 species 
ATGCTTGTTTCAGTAGCACATAGACTAAAATTGGAACAATACAGAGAAGATTTGCATGGCTGTGTGCAAGAATGATAAGCAAATTTGTGAAGCATGCCATATTTGG
>URS0001E9A07D rRNA from 1 species 
GATGAACGCTGGCGGTATGCTTAACACATGCAAGTCGAACGGACTCTTCGGAGTTAGTGGCGGACGGGTGAGTAACGCGTGAGAATCTGGCTTTGGGTTCGGGACAACCACTGGAAACGGTGGCTAATACCGGATGTGCCGAGAGGTAAAAGAGAAATTGCCTGAAGATGAGCTCGCGTCTGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCAGCGATCAGTAGCTGGTCTGAGAGGATGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCGGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAATACCGCGTGAGAGAAGAAGGCTCTTGGGTTGTAAACCTCTTTTCTTAGGGAAGAACAAAATGACGGTACCTAAGGAATCAGCATCGGCTAACTCCGTG
>URS00019E5825 rRNA from 1 species 
TGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGAAGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGCGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTCACGTCGGGTGTGAAAGCCCGGGGCTTAACCCCGGGTCTGCATTCGATACGGGCTAGCTAGAGTGTGGTAGGGGAGATCGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGATCTCTGGGCCATTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGGTGGGAACTAGGTGTTGGCGACATTCCACGTCGTCGGTGCCGCAGCTAACGCATTAAGTTCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCATGTGGCTTAATTCGACGCAACGCGAAGAACCTTACCAAGGCTTGACATACACCGGAAAGCATCAGAGATGGTGCCCCCCTTGTGGTCGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTCTGTGTTGCCAGCATGCCCTTCGGGGTGATGGGGACTCACAGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGCCCCTTATGTCTTGGGCTGCACACGTGCTACAATGGCCGGTACAAAGAGCTGCGATACCGTGAGGTGGAGCGAATCTCAAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCCCA
>URS0000291A32 rRNA from 1 species 
GCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTGATACGTAGGGTGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGGGCTCGTAGGTGGTTGATCGCGTCGGAAGTGTAATCTTGGGGCTTAACCCTGAGCGTGCTTTCGATACGGGTTGACTTGAGGAAGGTAGGGGGAGAATGGAATTCCTGGTGGAGCGGTGGAATGCGCAGATATCAGGAGGAACACCAGTGGCGAAGGCGGTTCTCTGGGCCTTTCCTGACCCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGCTTAGATACCCTGGTAGTCCACGCTGTAAACGGTGGGTACTAGGTGTGGGGTCCATTCCACGGGTTCCGTGCCGTAGCTAACGCTTTAAGTACCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGCCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGTAGAACCTTACCTGGGTTTGACATGGATCGGGAGTGCTCAGAGATGGGTGTGCCTCTTTTGGGGTCGGTTCACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTCACTGTTGCCAGCACGTTATGGTGGGGACTCAGTGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACGCATGCTACAATGGCTGGTACAGAGAGTGGCGAGCCTGTGAGGGTGAGCGAATCTCGGAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCTCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGGCTTGTACACACCGCCCGTCAAGTCATGAAAGTTGGTAACACCCGAAGCCGGTGGCCTAACCGTTGTGGGGGAGCCGTCGAAGGTGGGACTGGTGATTAGGACTAAGA
>URS0000A4E5B4 misc_RNA from 1 species 
GTACCCTCCAGCCCTGCTGGGTGTTGGGCGTTTTGTTCCGCCGCGCGCGTGAACTCGCCTCAAATACATTGGCAGCCAGCCGTCCCGCGTGGGAGCGCAGCACATTTTGCGCTCTCCGCTGGGTGCGGCGGCGTCCACAAGCCTAATTTTTTACGC
>URS00007CA1EC rRNA from 1 species 
TGGAATACAGCGTCATAGTGGTGAGAACCCAGTATATGATGTGGATGCCTAGTGCTTTGTGATACATTTTCAAAGAGTCGAGTTGTTTGGGAATGCAGCTCAAAATGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTRCCGTGAGGGAAAGATGAAAAGCACTTTRGAAAGAGAGTTAACAGTACGTGAAATTGTTGAAAGGGAAACGCTTGAAGTCAGACTTGCTTTTGAGTTTACTTGATGGCAGGCTAGCATCAGTTTCTGASAGTAGAAAAGGGTATTGAGAAGGTMGCAGCTTAGGTTGTGTTATAGCTCTTTACTGGATGTGCTCTTGGGGACTGAGGAACGCAACACGCTTTGTGCAATGTCTTCGGGCATTTCGTGTTAAGGATGCTAGTTAATGGCTTTAAACGACCCGTCTTGAAACACG
>URS0000B0FA7A rRNA from 1 species 
TGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGAGTGAAGAAGGCCTTAGGGTTGTAAAACTCTTTCACCGGGGAAGATAATGACGGTACCGGAGAAGAAGCCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGGGCTAGCGATGTTCTGAATTACTGGGCGTAAAGCGCGCGTAGGCGGCTTGGTAAGTTGGAGGTGAAATCCCGAAGCTCAACTTCGGAACTGCCTTAAAAACTGCTTGGCTAGAGGCAAGGAGAGGAGAGCGGAATACCCAGTGTATAGGTGAAATTCGTAGATATTGGGTGTAACACCGGTGGCGAAGGCGGCTCTCTGGCCTTGATCTGACGCTAAGGCGCGAAAGCGTGGGGCGCAAACAGGATTAGATACCCCCGTAGTCC
>URS00001D86A5 rRNA from 1 species 
GGGTCGATACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTNCACGCCCTAAACGATNTCAACTAGGTGTTGGTAGGGTAAAACCTATTAGTACCGTAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGATTAATTCGATGCAACGCGAAAAACCTTACCTACCCTTGACATGTCCAGAATCCCTGAGAGATTGGGGAGTGCCTTCGGGAACTGGAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCATTAATTGCCATCATTCAGTTGGGCACTTTAATGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTATGGGTAGGGCTTCACACGTCATACAATGGTCGGTACAAAGGGTTGCCAAACCGCGAGGTGGAGCTAATCTCAGAAAGCCGATCGTAGTCCGGATCGTAGTCTGCAACTCGACTACGTGAAGTCGGAATCGCTAGTAATCGTGGATCAGCATGTCACGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTTCACCAGAAGTAGGTAGCCTAACCGCAAGGAGGGCGCTTACCACGGTGGGGTTCATGACTGGGGTG
>URS000235E350 lncRNA from 1 species 
GCTTAGTTTGCTAAATAAATAAATAAATGAAGTTTGCTATGAACCCTCATGATAAGCTCTCACATAAAAATGATGAATAGTTGCTCTGCCATTACTAGTTCTCAAAATTGAAATCTCTCTCAAGTTTAGGCATGACTGTTATGAATTAAGATTTGCTCTAAAACTGAACTTGTGGGAAGAGTACTTGATCAAAAGTCTATGTCGTTAACGGATACGATATGGGAAGGTTGAGCTGCTATTTATCTGTTCCTAGAGATGCTAGAATTCTAGAGAATTTTATCTTTGAAAATCTTTAAAATATTGCATGATGAGTTCCTGTATGATGAGTGTTTAAAATCCTACCACAGCCATATATACATGCTTATTAGACTATGAACCATACATTTACTTTTTACTACTTATGAGCATTGAGTGTGGTGAAGTTGTGTAGACCCTTAGGAGCTTGTCATGTGGTTAAAATCAAGATTCACTTGCACATTCACTCATACATGCTGCTTCTACTTCAGAAGTACGCATCTACATACATCCATTCATTTCCATCTCCAGATTCACCCAAAATTATTCAACTCCTATTCAGGAGAGAATAGCCAAAAACATTATCCTATCCCTGTAATTCCCCGTGAAATAAATGCTCTTGATATTTTGGTTACTACCAATTGCTACATTATTCTAGGAGGGTGAGTGCTCTGAAAAAAAGTGAATACGAGGAAATAAAAAGGGACAAGTGCCCGAAACCTCGAAGAAAAGAAAAAGTGAGACGAGAGGTAAAAATGGACAAGTGTCCGACAGTAGAATTAGGGGTACAAGATACCCACCTGAGAGAAAAGAAAAAAAGAGAAAATATAGAGCATCTCATTCCCCTAAAAAAAGCTTCAAAGTGCAAGAAAGGTATGTATCCCCTCAAAAGAGCAACAGTAGAATTAGACTTTCACCATTATCACCATCATCACCATACACCATTCATGCGCCACACATGCACATCTTGATTTGACTTATTGACTTGTTTCTTTGGATCCATGGTTTGACTATGCAATAAATGACTTGTAAGTATGTATTAGCTGTCTCCCACCTATGAGCTCCAGATATCAAAACCTTGTTAGAGTAGGGTGAGAGAGAGGGCAATATCATTATGCCTCATACCACAAATAACACATACTTTGAGAGAAGGCATATATCATCACTGCGTTGGTAAGGATCTAGAAATACCACAAAAGAGAGACTAGAGAGAGTCATACAAGGAATCTCTGAGTTTTATTTGAAAATTTGCAAAAACTCCAGAGCTATAGTTGATGAAAGAACAAGAGACATGGTGCTTGACTTGACCGTTCTATCTTTTAACTGCTCAAGACACAAGTGACGGTTGCAAGCCCCATGGTGGAAGGTAATATGAGTAATTTTAAATCTTAACAGTTTACCTTAACCCAGAGATGAGATTTTGTTTGAACGCATGTGTACCTTTAAGGCATAAAACCACTGAAGAAACTATTGAGTCCATCCTTGCTCAGGGACGAGCAAGAGGTATGCTTGAGGGAGTTGTTGACGGTCCTTAAGTACTAAATATAACGATCAAATAAATAAAGAAAAGGATCCAAATGCAACGAACACCCAGACTTAGGGTTTTATCTGACAGAATTCCATGAGTTTTGGTGTTTGTCTATTTCTGCAGGGGGTTATCAGGAAATATGGAGGAAAGGCCCACATGTCGGGTTTACATAGAGATATGAACGTACCGTGCAAATTTTTATCATCTAGAAGACTCTAGAAGCCACGGGAACGAACGGGAGGCCAAGCGGGCTCGGGGGTAGGGCGCCCGCCCTCCCCCCTTCGGCGCCCGCCCTATCCCACAGTCCAATCAGGACTCGCTTCGGGGATTATGCTCCACCGAGCTAAAGGATCAAGAATAACCGTTCAATCAACGTCGGTTTGATCCGACGGCCCAGATTCACTTGAGGGGACTATATAAGCAGACCCCTAGCCTCTGGAGGAGGCACCCCTTGATCCCTATTCATTATTCATAGATAGAGCAAAAGCTAGGGTTTGGAGATGAGAGCTCTCCTCTCATCTCTAAACTAGAGTAGATCTAGATAGTAGCGAGACGGAGAGCGAGGGAGGATTGGAGGAGAGGCCGGCCTGTCGATTCTTCCTCCGGTTGTACTTCGCCATGATCAAGCTCTAATCAAGCTTCCTCATGGGATGACTCTGGTAATCTACTTCTAATTCACTATGCAATTACTATTCATGTATGTTCTGGTTCACAACTCTTTTGTGTACTTCTAATCTCTAGGACCCTATAGGTTAGAGTTGTAGTATAGGTGTAAGCATGGTGCTTAGACCTAGATTACTTGTGAATATCCCCTGTCTAGCTGGATCGTGTGGTAGGCCGCGTAGGTGACAGTTACGTTGGTCCCCTGTAGTAAACCTCCTGTTAGCAGGACAGGTAGGGTTTATCGGCCTATGGATAAGCATCCTTTGTGGTGTATTCTTATCACGTAGTTCATCCCAGACATAGACATACCCCTTTGAAGTAGAAAAACCATAGTTATCATCTCTATTCTGCAACCATCGCCCATATACTAGAATGCTCTACTCTCTATTCCCATATTATCACCCATTGTTATCTTACCTTTAATATTGTTCTTATTCAATTCTACCATCTTTCCTATTTACACTTATCTATCTATCTTGGTTAAGTTAGAGCGTAGTTGGTTCTCCCGTTTCCCTGTGGATACGATAAAACCTTTAACCGGGTAAAAGCTACAACGGTATCCATGCGCTTGCAGATTTATCTGTGTCCGTATAAATACCATAGTACACTCTAGTGTCATGCTGGGGATGACAACCTAGTATTCAAGTGGTGTTAGCAAGTGTCAACAGTCGTCGGATGATGATCAAAGGGCTTAGGATTGGGTGGAGAGGTATTTCTAGTATTTGACTTCTGGCTAAGCTATCCTAAGTATATTTGAGAGTTAACTCCCTTCCTACTGTGGCCGATAGGTGAAAAGGGTGTGGCGAAACACTTCCCTAGGCAGCTACCATGCAAGCCAACTATTATTTGCAACTTGCCTAACAACACACTAAAGAGAACTCCTAATGTCCAGTAGAGGAATGTTATGCTTCGCTGCTGGTGTTCTTCAGGTGCGACAAGAAGTCCACAAGGGCAGACAAAGTCTAGACACCATGTCTACACTAATTCTACTACTCTAGACCCAGCTAAGGTTTCGAGCACTTCACACAAGGCAAAGCAATGTGCCAGATAGGCCGGTTGTATACTTAAAATAAACTAAGATAGAAAGTAAATACTGGAAATACTCAGATGAAAGGAAACTAGAAGGAAGACTTACTAGAAGACAAGCATCCGCTGAGGCACTCCTAGAAGAAGACTCCCGACAAGTCGGTGTTGACACTTGCTAACACCACTTGAATACTAGGTTGTCATCCCCAGCATGGCACTAGAGTGTACTATGGTATTTATACGCACACAGATAATCCGCAAGCGCACGGATACCGTTGAAGCTTTTACCCGGTTAAAGGTTTTATCGTATCCACAAGGAAACGGGAGAACCAACTACGCTCTAACTTAACCTAGATAGATAGATAGGTGTAAATAGGAAAGATGGTAGAATCGAATAAGAACAATATTAAAGGTAAGATAACAGTGAGTGATAATATGGGAATAGAGAATAGAGCAATTCTAGTATATGGGCGATGGTAGCAGAATAGAGAGAATAACTAAGGTTTCTCTACTTCAAAGGGGTATGTCTATGTCTGGGACGAACCACGTGATAAGAGTACACCACAAAGGATGCTTATCCTTAGGCTGATAAACCCTACCCATGCTGCTAACAAGAGGTGGACTACAGAGGACCAACGTAACCGTCACCTACGCGGCCTACCACACGATCCAGCTAGATAGGGGATATCCACAAGTAATCTAGGTCTAAGTGCCACGCTTACACCTATACTACAACTCTCACCTATAGCGTCCTATAGATTAAAGTACTCAAAAGAGTTGTGAACCAGAACATACATAATTAATAATTGCATAATGAATTAGAAGTAGATTACCAGAGTCATCCCATGAGCAAGCTTGATTAGAGCTTGATAATGACGAAGTACAACCGGAGGAAGAACCGACAGGCCGGCCTCTCCTCTAATCCTCCTTCGTTCTCCATCTTGCTATTATCTAGATCTACTCTAGTTTAGAGAAGAGAGGAGAGCTCTCCTCACTAAACCCTAGCTTTTGCTCTGTCTATGAATAATGAATAATGATCAAGGGGTGCGTCCTCTAGGGGCCAGGGTGTCTGGTTATATAGTCTTTTCAGATGAATCTGGGTCGTCGGATCAAACCGACATTGATCGTGTGGTTTTCCTTGAAGTATTAGGTCGGTGGAGCATGATCCACGAAGTTGAAGCTGATTGGTTACTGTAGCTGGGCGGGCACCCATGGGACTTGGGCGGGCGCCCTGCCCCCGGGCCCGATCGGCCTCCCGTTCGTTCCCGTGGCTTCTGGAGTCTTCTAGATGGTAGAAAATTGCGCGGCACGTTAATATCTCTATGTAAACCCGATGTGTGGGTCTTTCTTTCATATTTCCTGATAACCCCCTACAGAAATAGACAAACACCAAAACTCGTGGAATTCTGTCAGATAAAACCCTAAGTCTAGATGTTGATTTCATTTGGATCCTTTTCTTTGTTTATTTGATAATTAAATTTGATACTTAAGGACCGTCAACAAACTCCCCCAAGCTTACCTCTTGCTCGTCCATGAGCAAGGATAGACTCAGCAATGGATCAGAAGTTGTTGCAATATCTTAAAATTTTGATGGTACACATGCTTTTAAATAAGATCTCATCTCTGAGTTAGAGTAAACTGTCAAGAACTAAAACTTACTTACTTTACCTTTCACCATGGGACTTGTAACCATCACTTCTGTCTTGAGTAGTTAAAAGATAGAACAGTCTAGCCAAGTGCCATATCTCTTATTCTTGATCAGCTATAGCTCTGGAGTTTTTGCAGATTTTCAAATAAAACTCAGAGATTCCTTGTATGACTCTCTAAATCTCTCTTTTGTGGTATTTCTGGATCCTTACCAAGGCAGCGATGGTATATGCCTTCTCTCAAGATATGTGGTAGTTGTGGTATAAGGCATAGTGACATTTCCTTCTCTCTCACCCTACTCTAATAAGGCTTTAATATCTGGAGCTCATAGGTGGGAGATAAAGTATACATACTTACAAGACATTTATTGTATAGTTAAACCATGGATCCAAAGAAACAAATCAATAAGCCAAATCAAGATGTGCATGTGTGGCGAATGAATGGTGTATGGTGATGATGGTGATAACAATGGTGAAAGTCTAATTCTACTTTTGCTCTTTTGAGGGGATATATACCTTCTTTGCTTTTTGAAACTTTATGAGGAGAATGAGATGTTCTATCTTCCATTTTTCTTTCCTCTCAGGTGCGTATCCTGTACCCCTAATTCTACTGTCGGACACTTGTCCATTTTTACCTCTCGTCTCACTCTTTTTCTTTTCTTTCGAGGTTCCGGGCACTTGCCCCTTTTTATTTCCTCGTTTATTTATTTTTTTTTCTTTTCTTCTCTTTTCTTTTTTTTCAGAGCACTCATCTCTTGAGATAATATAGCAAGTGGTAGTAGCAAGATAACTTGAGCATTTATTTCACAAGGGAAAACAGAAATATTTTTGGCTATTCTCTCCCGGATTAGGAGTAGAATATTTTTGGGTGGTTCTGGAGATGGACATGGATGGATATATGTGGATGGTACTTTCAGAGTAGAAGTAGCATATATGAGTGAATGTGCAAGTGAAATCTTGATTTAACCACATGACATGCTCCTAAGGGTCTACACAGCTTGACCACACTCAATGCTCATAAGCAGTAAATAGTAAATGTGTGGCTCAAAGTCTAGCAAGCATGTATATATGGCTGTGGTAGGAATTTAAACTTTCATCATACCGGAACTCATCATGCAATATTTTAATGATTTTTCAAAGATAAAATTCTCCAGAATTTTAGCATATCTAGGAACAGATAAACAGCAGCTCAACCTTCCCATATCATATCCGTTAACAACTTAGATTTCAGATCAAGTTTTTATCCCACAAGTTTAGATCTAGAGCAAGCTTTAAATTATAACAGTTATGTCTAAACTTGAGAGAGAACTTCAAATTTACAAATTAGGCAGAGCAACTATTCATCATATCCATGCTAGAGTTTTATTATTAAGATTCAGATTAGCATAGCCACTTTATTTATTTATTAAACACACTAAGCAAAAGATATATATAAGCACAAAATCTTTATTTGGTTTTTCATAGTTTATGTATTTTAATATTCTAATATAATATAAGTATAAAGATAGTTAGAAATACTTAGCGAGATAAATGGGGGTGCTCTTCCCCAAGCTGAATTTTGACGTAATTTCTCTTGATGTAGCTAGCAGGTGGCAGAGGTGTATTTGAAAGTCAGTAGCATTCTGACAGCGATTAGAATGTCCTCCGTCTGCTAGTCTTCTTGATTCTTAAATTCTGTGGAGCTCAAATAGACAACAAAGCTTGTGGAACTAATTAAGTGTTAGCATAAATATCTAGCCTTCATCATGTTGAGCTTCGTCAATAAATATTACTCCCTGTTTTTATATTTTTATTTTATAAAGCAGAAAAGAAATATTTATTTTATTTTTATGCCACCACAGTGAAGGTACTTATGGGTTTTATGCCACTCGTATACTCACATGGGGCTTAGTATTTTTTAATATTTTTATTTTCTTTTCAAGATAGCATGATTAACTAATAATCTATTTAAGGAAAGTAAATAATTAAAGGGAAAAGGGAATGCAGAAAGGATAAATATGGATAACTACCGATCTTACCTTTCGGCGAGGGTTCAATGTTTTAAGTCTTCTTAACAAGACTTCTCACCGTGTTCATTCTTCAGGTGCGTCATTTGATTCAGGTGCGGACCTTGACGTCTGCACCTCTTCGTTTGCCCAGCAGTGGCGTTGGCAGTATCCTGCTCAGTGTGTTTGTGCTCGTAGATCCAGGTCCTTCACTTGGTAGAGTTTGAGAGTTACAAAACTTCTCTGTGTTTTGTTCAAAGTATACCTGCTCATAGAGACAAGGCAGAGATCATGTGCATGGGTCCTGTTGGTGGAAAACACCAACAGAACCTAAAGTGTATTTGTTCTTCTCTAACCCTAAGCATAGTGAGCAAGACAAAGTTGATGGATGAAAAGTTCATGAGTGTAGCACTTATAACATTTGTCAGATCAGATCGCTCAACCTTATGGAAAGATAATCTATCTATGTATAATGCTTTTTCTTTATATCTTCTCAAAGATTGAATGTATAACATTTTAGCTCATATGATTAGGAGTGTGGGATCATGGAGGTAGTACTAAGAACAAGGATTAAAGGACTAAACATGTTGAATCAGTTGGGTTGGTTAATATAGAGTTGTAAATCATACATGTTTGTCTCTTTTATTTATATGAACGCTAGAACCAAGGAGAAGCTTATAAAAGTGATAGTCAAGTACCTTAAGATGTTACCTTGCTTGAAGAGTGATGGTACAATATCACCTTGTGGAAGCTTTCCTTTCTTAGCGGTTGTGCATCGTGTTTGTGGCACCCTCCGTGGATCATCTCTCTATGATGAATGAGCTATGTCCTTCTTGTGCAAATTGTTAAACTTCATGTGTCACTCTCTTCGTCTCTGATGTGAGTTTATCTCAGGACTTCCCAAATCGATATTGAAAGTTTTTCTGCAGGGGTTAGTCCGACAAAAATATACCAATGTCTACACAAGCAGTTTTTAGTTCAATAACCGAACTAGACTCCATGTCTAATCAGATTAAGGAAGGCTGTTTAACTTAAGCACCATGCTTAATTTAAAAGCCAATAGAAGTATGTGTAGTACTTCCAAACTAACACTTACTAGGATAAACAAAGGTAGCGTGATGGCATTTATAGAGATCTACTCGAGTGGAGACGAAGTAGTGTGATTAGTATTTAACAAATTGAGCATGTCTTAAAGGTAGGGACAACCAACATAGCAACATGGCAAAGAATGTTTTTATGTAAAGTACTCCCCTAAGCTTGATTTTTGCAGAATTCAAGTTTGGATGAATTTAATTCAGTGTTGCATGATGATTGGTTGGACATACCTTGTACTTGCTTGTCATTCATCTGATCTTCTTGTTCCAATCCTGAAAAGGTTAGTGACAAGAATACCTGAAGGAATATTTTTACAATTATCCTTATATGCTCAATACACAAGGTAATGTTGCAAATAATTAAAAACTCATGTTACGATCTGATCAGTGCTTATTTTAGGACACTGAGCTTGTCCTTGGGAAACCATCAATTTATGTCGGCGAAGTGGTTTCCCTTCCAACGCTGACCTAAATCAAGATCAACTCAACGCGATCTGCAATATTTATTATAGACATATGCATCGACAACCACCCTTTTAAAGTTTTTATAAATAGAAAGGAAGAGGGGGTTGGAGATCTCAAATGTGGTGATGTTAGAGAGACCAATAGATTGGGAAGATGTTACATATGAGCATGGAGTAAACAAAGTGGCTATGAAATAAATTCCATGCTCATTAATGTTATCTTCGTCTCCAATCTGAATGTTCAGAGTTCCTCTTGGATTGGTCTAACTTATGTCCTCTTCTATAGTTGGATGAATCCCATCTTCAAAGGGAGTCAAGAACTCACCATTTGAAATTGAACCAAAGTCAGAATTCATTAAGGCTTCTTCCTTATCCATCCATTCTACACATTCTAGCCATTTAGAACTTGTGATCAGGAAAGGGGAGGTGTTAGAATTTTCTATATGGCTTAGCTCTCCTTCACTTGATATGTCATCCTTGACTTCTTCATAACAGGAACCAGGACATTCTCTAAGGATATGTCATCCTCGACTTCTTCATAACAGGAACCAGGATATTCTCTAAGAGAACCATTATTGCAAGGATTTGAATTATCCCTACTTGAAGGTCTCTTATGGAACCAGAAGTCTAAACCATCAGCATCTGAAAGATTTAAGGTCGGAATTCCTTCCTCCCTTCGACAATTTTGGGGTATTGATGGTTTAGGATTGATAGCTAAAGTTTGGAATTGAAGTGGTTGTGATCTGGCTATCGAAACTTCTTCTTCTTGTCTAGGAACTGGTTCTGTCTCTTTCTCAGGGATATAAAAGCTAGGAGACTTTCCACTTAATAAATCAATCAAATTCCAAGCTTCACTAGCAGGTAGGTGATAGAAGGATCCTCTAGAGGCTGTATTCAAGGTTTGCTTATCTTCCCTACTAAGGCCCTCAAAAAAGTGAATTAGAAGAACTTCTTCTGGAATAGAAAGCTTTGGGCCAGTGAGAGTAAGGTTAATAAAGCGGTCCCATGATTTGCCAAGAGATTCTTCTTCCAGTTGTCTAAAAGAAATAATCTCACGCCGAAGTTCCGCCACTTTGGAGATTGGAAAATACTTAGAAATAAAACTACTATATAACTCCTTCCAATCTCCATGAACACTCCCTATTTTGAGTTTGTACCAATGTCTAGCTTTTCCCGTTAAAGAGAACGGAAAGAGCTTCCATTTGAGGGTCTCATCGGACATTCCTTCTATGCGAAGGAGGTCACAGACTCGATAAAACTCTCTTAGGTGTGTCTATGGGTTTAGACAGAGCAAAAGCTAGGGTTTAGAGATGAGAGCTCTCCTCTCTTCTCTAAACTAGAGTAGATCTAGATAGTAGCGAGATGGAGAGCGAGGGAGGATGGGAGGAGAGGCCGGCCTGTCGGTTCTTCCTCCAGTTGTACTTCGCCATGATCAAGCTCTAATCAAGCTTGCTCATGGGATGACTCTGGTAATCTAATTCTAATTCATTATACAATTACTAATCCTGTATGTTCTGGTTCACAATTCTTTTGAGTACTTTAATCTATAGGACGCTATAGGTGAGAGTTGTAGTATAGGTGTAAGCGTGGTGCTTAGACCTAGATTACTTGTGGATATCCCCTCTCTAGCTAGATCTTGTGGTAGGCCGCGTAGGTGACAGTTACGTTGGTCCCCTGTAGTCCACCTCTTGTTAGTAGGACGGGTAGGGTTTATCGGCCTATGGATAAGCATCCTTTGTGGTGTATTCTTATCACGTGGTTCATCCCAGACATAGACATACCTTTTTGAAGTAGACAAACCATAGTTATCCTCTCTATTCTCCTACCATCGCTCGTATACTAGATTGCTCAATTCTCTATTCCCCTATTATTACACATTGTTATCTTATCTTTAATATTGCTCTTATTCAATTCTACCATCTTTCCTATTTACACTTATCTATCTATCTTGGTTAAGTTAGAGCATAGTTGGTTCACCAGTTTCCTTGTGGATACGATAAAACCTTTAACCGGGAAAAAGCTACAATGGTATCCGTGCGCTTGCGAATTTATCTGTGTGCATATAAATACCATAGTACACTCTAGTGCCATGTTGGGGATGACAACCTAGTATTCAAGTGGTGTTAGCAAGTGTCAACAAGCATTTTTGGCACCGTTGCCGGGGAGACGGTTGCTGAGTTGACTACGAACTAGCTTAATCATTTTATAAAAAAATAATAAAAAAATATATATTTTCCTTTTATCCTTTGCCTCATCTCTGCTATTCTTTCTTCTTATCTAATCCTTGATTTCTGGTCTATCATGAATGCAAACATGTCTATCTATGAATTTCATAGACCTACGGGCACACATCTCGAACCACCAAAATCTTCAAAGCCTATCATAGCATCTAGTTTTGAGATAGACCCCGAATACATAGAATTTGTTCAAAAACAACCTTTCTCAGGAGAAGGTGAGGAAAACCCATACACACACCTAAGAGAGTTTTATAGAGTCTGTGACCTGCTTCGCATAGAAGGCATGTCCGATGAGACCCTTAAATGGAAGCTCTTTCCGTTCTCTTTAATAGGAAAAGCTAGACATTGGTATAAACTCAAAGTAGGGAGTGTTCATGGAGATTGGAAGGAGTTACATAATAGTTTTCTTTTAAAATATTTTCCAATCTCTAAAGTGGTGGAACTTCGGCGTGAGATTATTTCTTTTAGACAACTGGAAGAAGAATCTCTTGGCAAATCATGGGACCGCTTTGTTAACCTTACTCTCACAGGCCCAAAGCTTTCTATTCCACAAGAAGTTCTTCTAATTAACTTTTTTGAGGGCCTTAGTATGGAAAATAAGCAAACATTGAATACAGCCTTCGGAGGATCTTTCCACCACCCATCCGCTAGTGAAGCTTGGAATTTGATTGATTTAATGAGCGGAAAGTCTCCTAGCTTTTTTATCCTTGAGAAAGAGAAAGAACCAGTTCCTAGAAAAGAAACAGAAGTTTCAATAGCCAGATCACAACCACTTCAATTCCAAACTTTAGCTATCGATCCTAAACCATCAATACCCCAAAATTCTCCAAGGGAGGAAGGAATTCCGACCTTAAATCTTTCAGATACTGAGGGTTTAGACTTCTGGTTCCATAAGAGACCTTCAAGCAGGGATAATTCAAATCCTTGCAATAATGTTCCTCTTAGAGAATGTCATGGTTCCTTTTATGAAGAAGTCGAGGATGACATATCAAGTGAAGGAGAGCTAAGCCATATAGAAAATTCTATCAGCTCCCCTTTCCTGATCACAAGTACCAAATGGCTAGAATGTGTAGAATGGATGGATAAGGAAGAAGCCTTAATGGATTCTGAGTTTGGCTCAATTTCAAATGGTGAGTTCTTGACTCCCTTTGAAGATGAGATTCATCCAACTACAGAAGAGGACATAGGTGAGACCAATCCAGGAGAAACTCCGAACATTCAGATTGGAGACGAAGATAACATTAATGAGCATGAAATTTATTTCATAGCCACTTTTTTTACTCCATGCTCATATGTAACATCTTCCCAATCTATTGGTCTCTCCAACATCACCACATTTGAGATCTCCGACCCCCTCTTCCTTTCTATTTATTAAAACTTTAAAGGGCGGTTGTCGATGCATATGTCTTTAATAAGTATTGCAGATCTCGTTGAGTTGATCTTGATATAGGTCAGCGATGGAAGGGAAACATTTGCCGACATAAATTGATGGTTTCCCAAGGACAAGGTGTTGGGTATTCTTAACATCACTACCAAAAGTAGACAGCTTTCTAATTCTAGTAACGGTGCCAAAAATGCCAAACCTATCCCTCATACCACTTAAGCCAAGTTATGATCCCCAGCATGACATGAGAGACGCGGTATTGAAATATGCAATTGCTCTTCTAAATATATAATGAATGGAGTCTGCAAGCGCACAGATTAATACCGATGTAGCATTTTAACCGGGAAGTATTCCAGGTATCGTTATTTATATTTTTACCACTGGGAAGGGATTAACAATCATCAATATTGATTACAGAATAGAATATGAGATTGAGTATCTATCATTGCATGTATAATTGAGAACATTGTATCTAATTCTTTCATATAGGGGTAAGTGTCACATAAAAGATATATGAAATAATGAATAGTGACAAAGGTAATTAGTCTGATCATAACTTCGCCACATATATATATGATAAGCACCTCAATTAGATACTCTAGAAAGTCATTAGCATGGTATTAGAACGAACTACAAGAATATTTCCTAAGTTATTCTCAACTATATAGTCTAGCATTATCATAGTTAGTGCAAGCATACTTAGCAATCATTGTGAGACAAGACTACGCCCATGCATAGTGATATTAGCAAGGTAAATGAGAAACATAGCAATCACTCCCCTGTAATAATGTTGCTCTGCTAGCCCGATACACGAGAGGGGGACTATATAAGAATCAATGAAGCTGTCACTATCACGAACTACCCCACGATCTGGCATATTGGGTACAATCACAGATAAATACGGTATAAGCACCACGCCTACACAATATCTATCATTTACCCATGGATCTGATGGATAAACGCTATACAATCCTAAACATGTATATAGATCCAATCTGTCGAGGGTATCAGTAAGGGGTACCCTCACCGATGCACATAACGAGACTACCCGTACGCAGGTCGAGGCCCTCAACTCGATGCCCTGGTCATACATATGCGCGGTCGTCGACGACCGCAGCCTCGAAGACGGAAATAGCGTCGAGCGAATCGATCAGGGTCGAGCGCCAGCTACCGTCGAATACGGAAACGGGCTCGCACGAACCAGGAGGCGTCGAGCGCAAGGACGCCGCCCGCCGCCTGACGCGTGCACGAGAGCCAGGGCATTTAATGCGCCTGTCGCTTTCCCACCTAATACGCTGGTCACGGGAAGCGTGATAGGGAACAGGCACCCGTCCCGTCGTTCTTTTTGCAGCCTTCTCCACCAAACGACCCACAGCATGTCAGGACGCGGGAAGCAGGGATGGAACGTCTAATGAGGACCCCCTCGAGGTAGCCAAGGTCAGCGCTCTGGATATCAGGGCATTGCACGGCATCCGACCCTCGATCAGACATGGTTCCTTCTTGGAGACGAGGTGGGCGTCGACTGACAACATCGCAACCACTCCGCCGGATCTGCCGCCATACCGTACAAGCGTGCGACCGGTGAACCAGCCCAAGACGGCGCGCAGAGCAGGATACAGGGGCACGCGTAATCGTCATCGAGCTACCAAGATGGGATGGCTCGAGACCACGCCAGTACGGAGGCCTCGAGTAGGTCAGCGCGCCATGCTTCTATCGACCCCTACTCTGACACCTATACATGTACCCTAGGTCTCTCCTTGGAGCTATAAAAGGAAGGACCCGCGAGTAGATAGACACACGCAACACTACACCCATACGCAGTAGAACTCCCATACTCCATACCACGCTTGTATTCGCCCCTGTACAAGCACTTAGGTGCAAGATAATACAAACTTCCCTCCCCCGCTGAACGTAGGGCCTTCTCTTGCCCGAACCAGGATAAATCTTTGTGTCTTCTTGCATCACCATCTGGGAAAGGGAGCACGCATACAAATTTACTCGTTGGTGTGACCCCCGTGGCGAAAACACCGACAGTTGGCGTGCCAGGTAGGGGTCCTGCGTGTTTTTTCATCGATTTCCCATTCCTTTCCAGATGGCCACTCTCGCCTCGCCGATTCCGCGCTCCACGGTGATTTGGTTTGGGAGTCTCGAGTTCATGTCTACTGGCTCCGGCTATGACATGATCTTGCTCTCGATCAAAGGACCGGGAGGAGCTCGCGTTGCGCCAGCACGGTTGAGGGCCCCGAGATGCCCTCGCCACCACGCCTCCCCGCCCAAGAAGAGGCGTGGACAGCACCATCGTCGCCCCTCTGCCTCGTCACGACCTGCAGTTTGTGCTAGGCAGGAGGTGACACAGGAGCCGGCAGCCCCGCGTGCCGGAGCCATGGACGTGCCGGCTCAGTGTCACATGACGACAAGAGGAGACGCACCTACCGCCAGGCTACTTCCACACGGGTTGTTCACTCCAAGAAGGGCACTGCCATTCGGATTGGACAACGTCGCGGCATCGCTAGCCAGAGCGATATGCCCAAACGCCCAGACGTACGTGGAGAGACCAATGGTCCTCCCATGTAACTCTAAAGCACAACAACCGACGTCCGAATTGCCAGATTTCTCCTAGGTACGAGGCCTCCGTCGCCTAGGCCCTGGACGGTACACGATCACCTCACTCAGGCAGCGGCTGCTGGAGGAGAGACGTGGATGTTTCTATGCCGCCAAGCCGGACTCCGATTCCAAGACCGATAGCTACGACCCTACTAGGGACTGCTATCACATCGACGGAGCGGTAGAAACTACCGACGAGACGCAGGATGCAGCTGCGGGCGGTCGAGCCCCTGCGGCAAGGGAAGACCCCAGGACGCCTGGGAACGACGGACAGGTCGACCCGCTTCCACAGGAAGACAGGGCTGCGCAGCTCGCGCAGCTACGAGAGCTCAAGACCAAGCTTGACGAGGATCGTGAGCGCCTCGTCTTGCTCGAGCAAATCCTCGAGCAAGACTTGCCTTACCCGCCTAGCGGGAGTGTCCGTAGGCGTGCTCGAGAGGTACACCGGCAAATCATCGGAGACGCGGAGCCAGAGCAACCCGTCAACCGCTTCCCTCGAGCAGGCCAGAATGTAGTGGCAGCAACAATGCTGCTACGCAACATGCCAGAGTCATCGAACTCCCAAGCTCGACGCATTCGAGACGAGGTGCAGACTTTGCTCCAGGTAGTGGCGGTTCAACAAGCCGAAAGCTCGGCTTCTCTATGACGAGGAGCCGCCACTGAAAAGCGCGATGAGCCACCCCAAAATGAAAAGGAGGTTTCAGTCCATCAACAGCCACCCCCTCGAGGAAGAAAGACCACTCTTGTCCTCCCTGTCGACAATCAGCGTCGACACAACGCGTGGCATGACATCGAAGAGAGTCGACGCCGTCGGTATGGGGACGCGGAAGAGCGTGGTTACAGCGCACATCGCGGTGGGAGGTATGACAGCGACGAGGACCGGATGGCCCCCGAACCACCAGGCCCACGGGTGTTCAGCAGGGCAATCCGCAGCACGCCTACCAGCATCGCAAAATACAATGGTGAGACCAAACCAGAGTTGTGGCTGGCCAATTTTAGGCTGGCCTGTCAGCTAGGAGGCGCTCGAGGAGATGATCGAGCTATCATCAGACAGCTACCGCTCTTCCTCTCCGACACCGCCCGTCGATGGCTCGAGGAACTTCTAGCTAATCAGATCCATGACTGGGTCGATTTGGTTAGAGTCTTCGAGGGTAATTTCAAAGGGACCTACATACGGCCCGGGAACTCGTGGGACCTCAGCAAATGCAAGTAGAAGTCAGGAGAAACTCTTCGAGAGTACGCTTGACGCTTCTCAAAACAGCGCACCGAGCTGCCACATATCCCCGACCACGACGTCATCCTGGCATTTGTCTCTGATACCACTAGTCGAGACTTGGTGCGGGAATTAGGTCAAAATGGACCTCAGACCATCGATGAGCTCATGGACGTAGTGGCAAACTACGCAGCAGGAGAGGAAGCAGTCGGTGCCTTCTTTAGTTGTGAAGGAAGGAAAGGCAAGCAGCCTGCCGATGAAGATGGGACCCCCAGTCGAGGGCTCAAGAAGAACAAGAAGAAGCAGAAAGTGCGGCAGTTCAAGTAGGAGAACTTCGACGACGACCTCGTCGCCGCCATGGAGCGGAAGAAACCTCGAGGCCCCCCAGATGGGGGTATCTTCGATAAGATGCTAGAGGAACCATGCCCTTACCATAAAGGAGGAGCCAACCACAAGCTCAAGGACTGTCGTATGCTGAAAAAGCATTTCGACGGCCTAGGGTTCAGAAAGGACGCGCGCGACGACCCAAAGAAGGAGAAGGCGGCGACAAGGAGGGCAACAAGGATGACGATGGTTTCCCTGCCGTCCACAACTGCTACATGATCTATGGTGGGCCCTCAACGCAGTTGACTGATAGGCAGCGCAAGAGGGAACGCCGTGAGGTCTTCGCCGCAAGAATGGCGGTGCCCCAGTACCTCAGCTGGTCGAGCACACCCATCACCTTCGACCGAGAGGATCACCCCGACAAGGTGGTTGCCCCAGGCGTCTACCCGCTCGTCGTCGACCCCATCATTGTCAATACCCGGCTCTCGAAGGTGCTAATGGACGGATGCAGCAGCCTCAACATCATCTATCTCGAGACCCTCGACCTCCTCGGCATCGACAGGGGACGGCTCAAACCAAGCGCTGGCGGTTTCCATGGCGTCGTGCCAGGGAAAAAGGCGCTGCCAGTGGGTCGAATCGACCTACCCGTCTGCTTTGGCACGGCAGCCAACTTCAGGAAGGAGACGCTCACCTTTGAAGTGGTCGGGTTCCGAGGCACGTATCACGCCATCATCGGGCGCCCGGGCTACGCCAAGTTCATGGCCATACCCAACTACACTTACTTGAAGCTGAAAATGCCCGGTCCCAAAGGAGTCATCACCGTCAGCTCCTCCTTCGAGCACGCTTACGAGTGCGACGTCGAGTGCGTCGAGTATGGGGAGGCGGTTGAAAACTCCACCCAGCTCGTCGCAAAGCTCAAGGCCCTGGCCGCTGAGGCTCCAGAGCCCAAACGCCACGCGGGCAGCTTCGAGCCAGCAGAGGGGACCAAGAAGATCCCGCTCGATCCTAACAACTCCGACGGCAAGGTGCTGACGATCAGCGCCGACCTCGACCCCAAATAGGAAGCTGTGCTTGTCGACTTTCTCCGTGCGAACGCCGACATGTTCGCATGGAGTCCCTCGGACATGCCAGGCATACCGAGGGAAGTCGCCGAGCACTCCTTGGAGATTCGAGCCGGTTCCAAGCCAGTGAAGCAACGGTTGCGCCGATTCGACGAGGAGAAGCGCATGATCATTGGCGAGGAGGTCCACAAGCTTTTGACGGCCGGATTCATCAAGGAGGTTCACCATCCCGACTGGTTAGCAAACCCTGTACTAGTTAAGCAAAAGAATGGGAAAATGAGGATGTGTGTCGATTATACGAGTTTAAATAAAGCATGTCCGAAAGTTCCCTTTCCATTACCATGTATTGATCAAATTGTTGATTATACTGCGGGATGTGAAACCCTTTCTTTTCTTGATGCATTTTCTGGTTACCATCAAATAAAAATGAAAGAGTCCGACCAGCTCGCGACCTCTTTCAAGACACCTTTTGGGATGTATTGCTATGTAACCATGCCGTTTGGGCTTCGAAATGCGGGAGCCACGTACCAACGCTGCATGCTTCACGTATTTGGCAAGCACATAGGGTCGACGTTCGAGGCCTATGTCGACGACATTGTCGTCAAATCAAAGCGGCGAGGAGACTTGATCCAGGACCTTGAGATCGCTTTTAGCTGCTTACGCGTCAACCAGATCAAGCTCAATCCCGAGAAATGCGTTTTCGGCGTGCCTCGAGGCATGCTCTTGGGTTACATTGTTTCCCAGCGGCATCGAGGCCAACCCCGAGAAAGTCTCGGCCATCACAAGAATGGGGCCAATCCGAGACATCAAGGGTGTGCAGAGAGTCACGGGATGCCTAGCGGCGCTGAGCCGTTTCATCTCGAGATTAGGAGAAAAGGCGTTACCACTGTATCGACTTCTAAAGAAGGTCGAGCGTTTTTCTTGGACCCCCGAGGCTGAGGAAGCCCTCGAAAATCTGAAGAGAACGCTGACCTCAGCACCAGTCCTGGTCTCACCTCAACCTGCGGAACCACTGCTCCTTTACGTCGCCTCGACGACCCAGGTTGTCAGTGCGGCGGTGGTGGTCGAAAGGCAGGAGGAGGGGCACGCATTGCCAGTCCAGGGGCCAGTATATTTCGTCAGCGAGGTGCTCTCGGAGACCAAGGCACGTTACCCCCAAATTCAGAAGCTGATCTACACCGTAATCCTCGCCCGCCGTAAGCTGCAGCACTACTTCCTCGGTCACCCCATCACGGTGGTCCCGTCTTTCCCCCTGGGCGAGATAATCCAGAGTAAGGAGGCCACGGGAAGAATAGCTAAATGGTCGGTCGAGCTCATGAGTGAGACTCTCACTTATGCGCCTCGCAAGGCCATCAAATCGCCAGCTCTGGTGGACTTCGTCGCGGAATGGACAGACTCCCAGCTTCCCCCGACCCAGGTCCAGGCGGAGCTGTGGATGATGTATTTCGACGGGTCACTCTTGAAAACAGGGGCCGGGGCCGGCCTGCTGTTCATCTCGCCCTTGGGCATCCATATGAGATACGTCATCAGGATTCACTTTGCCGCATCTAACAATGTCGCAGAGTACGAGGCCCACGTCAACGGTCTCAAGATCGCCATCGAGCTAGGAGTCCGACGCCTCGACGTCCGAGGCGACTCCCAACTCGTCATTGACCAAGTGATGAAGACTTCAAGCTGCCATGACCTGAAAATGGAGGCGTACTGCAAAGAAGTCCGTCGACTCGAGGACAAATTCCATGGCTTTGAGCTCGTCCATGTCGCCCGACGCTACAACGAGGCAGCCGACGAACTCGCCAAGATCGCGTCGACCCAAGGCACGGTGCCACCTGACGCGTTCTCGAGAGATCTTCACGAGCCATCCGTCGACTTGGGCTTGGGGGCTGGCGTCGATGCCGATCCTGCCCAGCCAACCGACATCGTCGACGCACTGTTAATGTCAGCTGAGGCGATGGAGGTAGAACAGCGGCCCGGTCGACCGTTCGACTGGCGCACACCATTACTCGACTGCCTAATCCGCTGCGAGCTGCCAGAAGATCGATCTGAGGCCCGCCATATCGCTCGAAGAGCCAAGTCATACGTGATTTATGGCGAAGACAATGAGCTATATCGATGAAGCCCGACGGGGATTTTGCAGCGTTGCATCACCGTGGAAGAAGGCCGGAAACTCCTCGAGGATCTGCACTCGGGGGCTTGTGGCCACCATGCTACTCCACGGACCCTTATAGGGAACGCCTTCCGACAAGGCTTCTACTGGCCAACGGCCGAAGCAGATGCCGTCAAGCTCGTACGCTCATGTGATGGTTGCCAGTTCTACGCCAAACAGACGCATCTGCCCGCCCACGCTCTTCAGATGATCCCCATCACATGGCCATTTGCGGTGTGGGGGCTCGACTTAGTAGGGCCCCTACAAAAGGCGAAAGGCTGGTACACCCACTTGCTGGTGGCCACCGACAAATTCTCCAAATGGATCGAGGCTCGACCCATCACCAACATCCGCTCCGAGTAGGCCGTCCTTTTCTTCACCGACATCATCCACCGGTTTGGGATTCCCAACGTCATCATCACCGATAACGGCACTTAGTTCACCGGCAAAAAGTTCTTGAACTTCTACGATCAGCATCACATCCGTGTGAACTGGTCTGCAGTAGCCCACCCTCGAACTAACGGCCAGGTCGAGCGTGCCAACGGCATGATTTTGCAAGGACTCCAGCCAAGGATCTACAATCGCTTGAAGAAATTCGGCAAGAAGTGGGTCGAGGAGCTTTCATCGGTCCTATGGAGCCTGAGGACAACGCCAAGCAGGGCCATAAAATACACCCCATTCTTCATGGTCTACGGCTCAGAGGCTTTCCTCCCCACAGACCTCGAGTATGGGTCTCCTCGACTCAAAGCATACAACGAGTAATCAAATATGGAAACTCAAGAAAACGCGGTCGACCAACTTGAGGAGGCTCGAGACATGGCCCTCCTCAACTCTGCCAGATATCAGTAGAAACTTTGACGCTACCACGACAAGCACGTGCGCAAGAGGGACTTAAACGTGGGCGACCTTGTCCTACGACGGCGGCAAAGCAATCAAGGACGCCACAAGCTGACTCCACCTTGGGAGGGCCCGTACGTGGTAGCCGAGGTCTTGAAGCCAGGGACGTACAAGCTCGCGGACGAAAAGGGGGCGATCTTCACCAACGCGTGGAACATCGAACAGCTACGTCGATTCTACCCCTAGAAGTTCAAAACTTTATGTCCCTATGTACATTCTGTACCAAGGCCTTGTAAATGAATAAATAAAGCCTTTCCCTCAAGCGATTTACTTTCTCACAAATCTCGATGCCAGAAGGGAGTACCAACTATGACCCATCATAGTCAATACCCCCTCGGGGGCTACCAGGGGGGCAACCCCCCCCCCAAGTGTCGAAAAAACCAAGAAATTCTCTCTTCCTTACTTAGTAAACCTTGCACGTTCGAGTAGTTGAGGCGCCTCGAGCCCCTTAAGGGCCGAGGGACAACGAGTCTGAGAACTCCTACGCCCCCGGGCTATGGAAACTCTACACACTTCCTCACCCTCGAGGTGACCGAGGCTGTTTTTAACAAAAGATCGAACAAGGAATACAAACGTAGGCGCAAAGGGAAATAAAAGAACCTCGAGCGGAAAGATAGATAAACATTTAACAGTCACAAAAAGACATTGTACCACTTATAGAGAAGTTAATAGAGTATTATACAAGGGGCCCTAGGCACCCTAAGCAGGCTCGCAGGCCTCAGTCTTCAGCACGATCCTCACCACCCTCGCCTACGCCCGAGCTAGTCTCAGGAGGAAGCACCTCAGGCTCAAATAGCTTGGCCAGCCTCTCTCCAGGAGCCTCCGCGTCGTCGATCAAGGCGTGGAGCCTCTCTTCGTTCTCCGCGTCGGTCTTAGAGATGTCGGTGACGAAGCCGTGGGACACCACCTCCATGTCGTAGGAGAAGACCGAGCAGACAACCGCCATCGCCCGCTTCACCCCGATGTGGAGGGCATCCCGCACCCGATCTCTCAGCGTCGCGCCTAGGTAGCACAGCTGGTCGACCAGTGCGTCGCCTCGAGCGTCCTCCTTCGACTCGTCCATAGGCTCGACCTCCCAAGAGGTCGAGAGGTCGTTTATCGCCGTCCGCACTCGACGGTTCAAAGCAATCTCCGCCTCAAGCTGGGCCTTAGCACTACGGGCCTCGACTTGGGCGGCCAAGAGTTCGTCCTTAAGCCCTATAAATGCCAATACAAGAAGCTTTAGAAAAAACCAAGCACACCTCGAAAAAGAAATCCGACAAAGGAAACGTACCGCGGACATTCTCCTCCAGGGCCGTGTTCTCGCCGATTAGTCTGGTGTTGGCCCTCTCGATCTCTTTGTTGGAGCGGGCCAGCTCAGTGTTGGCAACGCGGAGATCCTCGATCGCCTGGCCAGCCTGAGCAATGGCCCCACTCTTCTCCAACAGCTCTCCCTTCAGACGTTCGACGTTGTCAGAGAGACTGCGGGATCGAGCCCGCTCCGCCTCGAGGTCTTCGAGGGCCTTCTTCTTTGCGTCCTCGACGACACCTCTAGCGACCTCACTGTCCACATACGCCACCTTCATCTTCTGGAAGGAGTCTCGGAGGGAGTCCAGGTCGGTCTTGAGAAGGCCCTTCTCCTTGTCCAGGTCTGCAATGACGCTCTTGTAGGACAGGGCCTCCTCCCGGGCTTTGGATGCGGCCTCCTCGACCGTCAGAGCTCGCTCCCGCAGCAGCGTCATCTCCTCCTCTGCCTTCTTTGAGGCCTCTTGAGCCTCGACCAGGGCAGCCTCCCTTGCCTTCTTCTCCTCCTCGAGCGCTATGAGGTCTTTGTAGGCCTTAAGGAGCTTTTCTTGCGACTCGAGGAGTTGGTCCTAGAGGACGGGGAGCTGCTCCCAGCCTCCTCTTGTGGCGTGAATGAAGCTAGACTTGATACGGGAGGTCTCTTTCATGTCCTACGAGCCGGGGGTCGAACGGTTAGAACACGAAACCAAAGGATCTATGAGAATTAAGGACCAAAAAATACTTACAAAGTAGGCCGGCCCGAGCCCGTTGTTGATGACGTCCGATAGGAGCCCCACCACGTGCTTCATCCAAAGGCGGAGCTCCTCAACGTGTTCCCATTTCGCCGCCTCCTTCCTGTCGTCCAGGAAGATGTTGGGCTCGGACGGATCGGTGGAAGCCCGGATGCGGATCCGATCGGGGCACCAGTTCTCCATCTCCTGGTCAGCCCGCGCCTTGACGCCGCGGATAAGGTCCTCGACGGTCTCGAGGGAGCCCCCATGGCGCAAGAACAGGTCGACGAGGCATGGGAACCGTCCGTCGTCATCCACCGTCTTCCAGGTACCGTCCTTACTCCCCGACGTCCCGATCTCGTCCTCCTCAGAGGGAAAACGGTCCTCCCACGCCCGACGCTCTCGGAGGAACCCTGGGGCGATCCCATCCATGCCGTAGATCGTCTTCCTGATCTCGGACTCGGGGTCGGCGGGGGTGCGCATCATGCAGGCAAGTGCCACCACACTGTCCGCTCGCCCCGGCTCTGCCCGGATCGCGGTGGGCGCCCCCGGAAGGAGCCACGCTGGGGTTGGAGGGCCGTACACCGGCAAATCCTCTTCCTGTTCTCCGGGCTCTTGCGGCGCCGGTGGTACTGGTTGGGGCAGACCTTGAGGCAGGGGCTCGAGCGGTCCTTCTTCTTGGCCCCCCTAATGCTGTTGCTGCCCCTCGAGCATTTGCTGCTGTTGCTCCACCTGCTGCTGCTGCTGCTGCTCCTGCTGCTGCTGCTGTTGCTGCTCCTGCTGCTGCTGCTGTTGTTGCCCCGCGTGTTCCTACGACTCTTGTCAGCGGCCCTGCTCCTGCGGCTGCCGCCTCGCCTCGCGCTCCCGCTCCTCCTCCTCCTCCTTCTTCCTCTGCTCCTCGAGGGTGCGGAGACCAGCAGGCCAGGGCGTCCGTTCCACGACAAAGGAGGTCGACGCCTCCTCATCCATAGGGCGGGCATCCCTCGACGTCTCGTTGCCGCCAGACGTGTCGCAGATGGTGATGGGATCCCCCTCGACCCCCGATCGGGGAGGCTCGGGGGCTCCCTCTTGCCCCTGGGTCTGGGCCACCTCGACCCGTGTCGGCGGCGACGGGGCAAGCTCGAGACGAGGCGGGGCGCTCTCAGCGACGGCCGAAGGCTGAGAGTCGGAGGAGCCTATAAAGCCAAGAATAAAGGTCGGTCATTGTAATGACCAACGTAAGAACATCACAAGTCCCAGAGGTAAGTCACAAACCTGGCTCCTTGGAGGCTGCTCCCATTTTGAGCCTCTTCGCCATTGAAGGCTGAGCCTACTCGAGCGTCCACTTTAATCTGAAACAAAAGGAACAAGCGTAAAAAGACCGGCATACAAGAAAACACAGAGGAACAGGAGAACAAAAGTCACAACGTCGAAGAGCTTACCCCACGGGGAGAACAGCTCGCCTGCCGGTGCCCCGACCGGTGGGCCTCGAGCCACCCCGTGTCAAGGTCCCAGACCCCTCGAGGACAGGCGTTGGCCTTGGCCCAGCAACTTCCCCTTGGTGGGCACCGGGACTGGTGCTCCTGCGGCCAGTGTCTCCTTTCTCGGAGGCCGCGGCACGACCGCGAGTCAGTGGCCCCGTCGCCTGAGGCCTAGCATGGCCACCCATCTTGGGCGCTGGGGGAGGGCGCGGGGCAACCTGACCAGTCGCGGGCACCGGGGGGGTGTCGGCACGAGGGCGGTGAGTTCCGCCTGGTCCCTCTTTTGGTGTCCCCATCCGCGGGGCGTCGACGTCACCTCGAGGCGGACCCTCGAGGATGCGGTCGAGGCGAGACGCCATCCCCTCGGAGTCATCGCTGTCCTCATCATCATCTCCACCATCATCGTCGTTGGGGGACTCTTCCTCAGGCTCCCCCCTCTGCCTGAATTTAGACTGACGTGCCTCTAATGCTTGGCGATCGAGGTTTTTCTTTTTCTCCCCTTTCTTCTTAGAGTCCTTGGCGGACTTTAACTTCTCGGCGAACCGGCACCGCGCGTCGCGATCAACCTCGTCCTCCTTCACTGGAGGCCTCGAGGACCGGACATCAATCCGTCCCTGCCAGAACAAAGGTGGATTTAGGAAAAAGGGAAGAAAAGAAACCCAGAATCAAGGCTGCGCACGAGAAGAAAGCATACCAGATCGATCGAGCCTACATCTGGCCTCATGGGGAAGCCGTTAACATGCTCTGGCTTGATGTCACCAGCAATGGCGGCCCTGACCCTGGCCGCGACTTCGTCGTTCGCCGGAGCCTCGCTTGACATCCGGCATGCCTCGAGGTCCCAAGATGAGGCGCCAGGAGCCATCTCGTCCATCCTCAGCGGTCGAGACATCAACGGGAGAACTCTCCGGTGATGGACGGCCAAGAGAACGAGGGCGGCGGTAAAGCCCTCCGAGCGCAGTTTCTTCATGACGTCGAGGAGGGGGTCGAGCCGAGATTGATGAACCTGGACGACGCCGTACGTCCAATTTTCCGGACGCTCCGTGATCAGACGCCCGGTGTAGGCGGGCAGGAGGTCGTCGTCATTTCTCAAGTAGAACCACTAGGAATCCCAGCGGGCGTGGTTGGTCGACAGTCCCACCGGGATGTACTCGCGCGGCCTCTCCGTCTTCTCGGTCCTCAACACGAGGTTGAGGCAACCTGCCAGAACAGGCTTCCTCACGCTGGTGGTCCCAGTGGGGGCGTTGAAGAGCTCGCCCCTGTAGAGGTGGAGCCACAGCTCCCAGTGGGGCATCATCCCCAAATAGCCCTCACACACCGCGGCGAAGACCGCGGCGACGGTGATGGCGTTTGGGGAGAAGTGCTGGAGCTCCACCCCGTAGTGCTGGCAGAGCGCCCGCATGAAGCGGCTCGGGGGAGCGCCCAATCCATGGCGGTGGAACTTGGCAAACGAAACCACATAGCCCTTGGGCGGCCTGGGCTCCCTGTGGTCCGCCGGCGGCGCGATCCACTCCGGCGACGACAGCGAGGTGCGGCGGCGCAGGAGTCCCTCCCTCTCAAGCTCTTGCAGCCGGCGCTCCGTCATCGACGATAGGCGCCAGTCATCGGCGGCGACAAGCCTCATAGGCATTCTAGCCGGAAGGATGGCGGATCCGCTATTACTCGAGGGGGGCACGCGCGCATAGGATGGCAAGGGAACTAAGGCAATGAGAGGGCTAAGGCGAGAATGAAGACGGGAGGCAGAAGGGAGAACAGCGGCGACGCCAGGACACATTTATAGGCAGCTGTCCACCAATGGGCAGATCCGATAAAAGAGGTAGCTCCCCTCCGTAAATGCGCCGTCTAATGGTCCTTTCCCTCCTCTCAGGTGGAGCGCCCCGAATTCCACGCCAACGCAGTGTCATAACGTCTCCCACCTAAAAAGGCGCGCCCAACGGGCAAGAAGGCGAACTACCCACGGTCTTTTCCTTCCCTTGTAAGCCAAGGAGTGCACCCGTGGAAGCCTCGAGAGGTCGCAGGCTGGCCCACTGAAAGGGTTCGATAGCCGATCTCGAGCACCAGAGTCAGGGATCCCTAGCGAGAGGTCGAAGATCGAGGTCCGCCTCGAAGACTTACTGGGGATGTCCAAGGTAGGGTCGAGACAGTTGAGAGGAATGCCCCCGACGGGAGGCATCGAGCCGCCGGACACTATCGAATGAGACCGGTATCCCCGACCACGTCGACCCTGCTTTATGAGAACGCCTCCGGGCTACAGCTGACCCCCTCGAAAGGGGCACAGGTTCTCACTTGGACTACCCGCTAGGAACTCAATCTGGGGTGGAAGACGCTCGCTCTATCGAGAGTACGTCAAAACCTCCGCGCAAAACGAGCCAATCAGAACCTTCCACCACTGGTGTCGATAGCGTTTCTGCGAATTAGGCAATATAACCCTTGAAGGAGTCAAAAACTCCTCCAAGGGCTCGGGGGCTACCCCCGCGGGGTCGCTCGCGCGCCCCCATGGAAATTCGATCGCAAAACAAAGCCTCCACTCGAGCGCCAGCGCTCAAATGGAGACTCGGGGGCTACTGTCGAGGGTATCAGTAAGGGGTACCCTCACCGATGCACATAACGAGACTACCCGTACGCAGGTCGAGGCCCTCAACTCGACGCTTTGGTCATACATATGCGCGGTCGTCGACGACCGCAGCCTCGAAGACGGAAATAGCGTCGAGCGAATCGATCAGGGGTCGAGCGCCAGCTACCGTCGAATACGGAAATGGGCTCGCGCGAACCAGGAGGCGTCGAGTGCAAGGACGCCGCCCGCCGCCTGACGCGCGCACGAGAGCCAAGGCATTAAATGCGCCTGTCGCTTTCCCGCCTAACACGCTGGTCACGGGAAGCGTGATAGGGAACAGGCACCCGTCCCGTCGTTCTTTTTGCAGCCTTCTCCACCAAACGACCCAGAGCATGTCAGGATGCGGGAAGCATGGATGGAACGTCTAATCAGGACCCCCTCGAGGCAGCCAAGGTCAGCGCTCTGGATATCAGGGCATTGCACGGCATCCGACCCTCGATCAGACATGGTTCCTTCTTGGAGACGAGTTGGGCGTCGACTGACAACATCGCAACCACTCCGCCGGATCTGCCGCCATACCGTACAAGCGTGCGACCGGTGAACCAGCCCAAGACGGCGCGCAGAGCCGGATACAGGGGCACGCGTAATCATCATCGAGCTACCAAGATGGGACGGCTCGAGACCACGCCGGTACGGAGGCCTCGAGTAGGTCAGCGCGCCATGCTTCTATCGACCCCTACTCTAACACCTATACATGTACCCTAGGTCTCTCCTTGGAGCTATAAAAGGAAGGACCCGGGATTAGATAGACACACGCAACACTACACCCATACGCAGTAGAACTCCCATACTCCATACCACGCTTGTATTCGCCCCTGTACAAGCACTTAGGTGCAAGATAATACAAACTTCCCTCCCCCACTGGACGTAGGGCCTTCTCTTGCCCGAACCAGGAGAAGTCTCTGTGTCTTCTTGCATCACCATCTGGGAAAGGGAGCACGCATACAAATTTACTCGTTGGTGTGACCCCCCATGGGGAAAACACCGACACAATCTAACTAAGCCAAGTATATAACTATGATAAACTAAGAACAATATAATCTTGAATATAAGCAAGTAGAGCAAAGTCATAAGCAATATATTGAAATAGAACAAAATCATATTCATAATATTGAAGAACAAAGAAAATTAGAAGAACAATTAGAAGCACAATTAGAGAATTACCAAGAATCCTCTTGACAGATCCGGAAACCAATCGAAGATTAAGTCCTTCTAGTTCTAATCCTATGTAGCTATGCTAATCTAGATGTCTAATTGATGTGGTGGCTCTAATCTTGATGAGAGGCTTCTTCTCCCTTGAAGAATAATGAATTAGGGTTGAGAGGCTCTCTCCTCCAGGGGCCAGGGGGTCTGGTTTTATAGTCCCTTCAAGTGAATATGGGCCGTTGGATCAAACCGACATTGATTGAACGGTTATCCTTGATCCTTTAGGTCGGTGGAGATCTCCCCCGAAACAGAGTCCTGATTGGACTCCAATAGAGGGCGGGTGCCCTGGTTACCTGGGCCGGCGCCCAGGTCCTGGCCCCATTCGGCCTCCGCTTCCTTCCCGTGGCTTCTGGAGTCTTCTAGATGTAAGAAAATTGCACGGCACGTTGATATCTCTATGTAACCCCGACGTGTGGGCCTTCCTTTCGTATTTCCTAATAACCCGCTGCAGAAATAGACAAACACAAAAACTCGTAGAATTCTGTCAGATAAAACCCTAAGTCTAGATGTCGATTTCATTTGGATCCTTTTCTTTGTTTATTTGATAATTAAATTTGATACTTAAGGACTGTCAACAAACTCCTCCAAGCTTACCTCTTGCTCGTCCCTGAGCAAGGATAGACTCAGCTATGAAAGTTGTTGTAATGCCTTTAAAAATTGACGGTACACATGCTTTTAAATGATGTCTTATCTCTGAGTTAGAGTAAACTGTCAAGACTTAAAACTTACTTACTTTACCTTTCACCATGGCACTTGTAACCGTCACTTCCATCTTGAGTTGTTAAAAGATATAACAGTCTAGTCAAGTGCCATGTCTCTTATTCTTGATTAGCTATAGCTCTGGAGTTTTTGCAGATTTTCAAATAAAACTCAGAGATTCCTTGTATGATTCTCTTAAATCTCTCTTTTGTCGTATTTCTGGATCCTTACCAAGGCAGTGATGGTATATGCATTCTCTCAATATATATGGTATTTATGGTATAAAGCATATTGCCTTCTCTCTCACCCTACTCTAATATGGCTTTAATATCTGGAGCTCATAGGTGGGAGATAAAGTATACATACTTACAAGACATTTATTGCATAGTCAAACCATGGATCCAAAGAAACAAATCAATAAGTCAAATCAAGATGTGCATGTGTGGCGAATGAATGGTGTATGGTGATGATGGTGTTAACAATGGTGGAAGTCTAATTCTTTTGCTCTTTGAGGGGATACATACCTTCCTTGCTTTTTGAAACTTTATGAGGAGAATGAGATGCTCTTCTTTTTCTTTTCTCTCAGGTGGGTATCTTGTACCCCTAATTCTACTATCGGACACTTGTCCATTTTTACCTCTCGTCTCACTTTTTCTTTTCTTTCGAGGTTCCGGGCACTTGCCCCTTTTTATTTCCTTGTATCTTTTTTTTCTCTTTTTTTAGAGCACTCATCTCTTGAGATAATATAGCAAGTGGTAGTAACAAGATAACTTGAGCATTTATTTCACAGGGAAAAACAGAAATGTTTTTGGCTATTCTCTCCCGGATTAGGAGTAGAATATTTTTAGGTGGTTCTAGAGATGGAAATGGGTGGATATATGTGGACGGTACTTCCGGAGTAGAAGCAGCATATGTGAGTGAACGTGCAAGTGAAATCTTGATTTAACCACATGACAAGCTCCTAAGGGTCTACACAGCTTGACCACACTCAATGCTCATAAGCAGTAAAAAGTAAATGTTGTGGCTCAAAGTCTAGCAAGCATGTATATATAGCTGTGGTAGGAATTTAAACTCTCATCATACAGGAACTCATCATGCAACATTTTAAAGATTTTCAAAGATAAAATTCTCCAGAATTCTAGCATCTCTAGGAACAGATAAACAGCAGCTCAACCTTCCCATATCATATCCGTTAACAACTTAGACTTCAGATCAAGTTTTCATCCCATAAGTTTAGGTCTAGAGCAAGCTTTAAATTATAACAGTTATGTCTAAACTAGTGAGAGAACTTCAAATGTGCAAATTAGGAAGAGCAACTATTCATCATATCCATGCTAGAGTTTTATTCAGATACAGATTAGCATAGCCACTTTATTTATTTATTAAACACACTAAGCAAAAGATATATATATATAAGTATAAAATCTTTATTTGGTTTTTCATAGTTATATTTTAATATAGTATAAGTATAAAGATAGATAGATAGAAATACTTATCGGGATAAATGGGGGTGCTCTCCCCCAAGCTGAATTTTGACGTAATTTCTCTTGATGTAGCTAGCAGGTGGCAGAGGTGTATTTGAAAGTCAGCAGCATTCTGACAGCGATTAGAATATCCTCCGTCTGCTAGTCTTCTTGATTCTTAAAATTCTGTGGAGCTCAAATAGACAACAAAGCTTGTGGAACTGATTAAGTGTTAGCAAAAATATCTATCCTTTATCATGTTGAGACTCCTCAATAACTATTACTCCCTATTTTTATATTTTCATTTTTATAGAGCTGAAAAATATTTATTTTATTTTTATGCCACCATAGTGAATGTACTTATGGGTTTTATGCCACTCGTCTACTCACATGGGGCTTACTGTTTTTCAACATTTTTATTTTCTTTTTAGGATAGTATAAATATAACTAATTAAGTAAACTATTTTAAATAATTGAAAGGGAAAGGATAACTACCAAGTTTACCTCTTGGCAAGGCGTTCGGTATTTTTAAGTCCTCCGAACGGGACTCTTCTCTTTCTCCATTGTCCTAAGATTCGTTGGGTGGCGTAGTCGGTACTTCCGGCGGCGCCTCCTCTTCATGTATAGTTGTCTTCTCTTTCCATACCTGACTCGGTGCTACGGTCTCCTTTGGATAATTCTGTTTAAACTATACGTCTTCTAACCTTACAACTTCTCCATCATAGTCTGCCCATCCGTCCTTGATGATTTGCCTCCTCTGGTTGCGGTTGCGTCGTTTTCTTACCTGCTTAGATTCTTCAAAGATATATTTAGGGTCAGTAAAATAACGGCGTACCTTCTCTAAGGGGAAGTGCATATGGACTTCTCCAGTTTTAATGTAGATGATTGCTTTAACGTTGCTGAGGAATGGTCTTCCAAGGATGATGGGTGGATCGTACTCATCTTCTCCCATGTCAATAACCTAAAAGTCTGTGTAGACAAAATGATCGTCTATTTTGACTGGGACATCAGTTACTGTTCCTTTAACTTCTCGAAATGTCTGATCTGCCATCTGGAGCTGAGTGTATGTTGGTCTTAGGGGCATGGTTCCGAACAAGAGACGATAGGTGACTGCGGCCATTATGTTGACGCCTGATCCGGTGTCGCAAAACGTCTTGTAGAAGTTGTATCCATTTATGGAGCAATAGATGCTTGGCATTCCTGGGTCATCCTTCTTGGTCAAAAACGGTGACTTAAGTTGGTGATCTTGGCCTCCATGAACTACAGTGATCATCTTAGCTGACTCGGTCCACACTTGCTTGTTCCTGTTCCTCCTGTTGGTCCTCTTCCTTGATTCACGACTGGATTGATCTAGGATTTGTGTAGTCTTGTTCCTGAAGAAAAACGTCTCCTTCCTCCCTTTGAAGTAGAAACTGATCTTGGCAGCACTAGCGTAGATGATAGCTCCCGAGGTGTTCAAGAATGACCTCCCTAAATGATGGGTGCCCTCTCATCATTACCGGTCTCTATCACCACGAAGTCTGCTGGGGCATATAAGGTACCAACTCGGACACAAAGGTTCTTCAATATTCCTTTTGGAAAACTTAATGCCTGATCTGCAAACTGCAAACACATGGTTGTCTCTAATAAAGGATATGTAAAGAATTTTTCATAGAGTACCCTGGGTATAATGTTGACGCTAGAGCCAAAGTCGCAGAGTGCTTCTGGGACGTTCACCATGCCGATGGAGATCGGGAAGACGGGCGTCCTGGATCACCTCTCTTGACTGGCAGAAGGTCAGTAGTGAATTCAGTGATGGGGTTACTCCAGTTATTACCTGCATCAAACATGTCTACAAGATTTGCAGATTCTAATCCTTCCGGTTGTGATGGTATACCGGGGTTAGTAGCAGGAACAGCAGCAGATATTTGATTTAACTGAGATTCAATCATTTTATTAAAGCTAATTTGATTCTTGATGGAAGTAGAGAAATTATCCATTCTATTATTTATATTTTCTAGCATTTTATCATTATATGCCAATTTCTTAGATAGGTTATCCATTAGTTTTCCTTGATTAGACACTAACTCTCTCAGAGGTGGAAAATTATTATTATTACTGTAAGAATTGTTACCTTGATAATTACCTGAGTAGTTAGGCCTCTGTTGATTCCAACCTTGATTTTGTTGAGGACGGTTGTAATAGTTGTTGTTGTTATTATTGATGTAGTTCACACCCTCAAGCATCTCAGGACAGTGATTGCCTGAGTGTCCAGTATCTCCACACTCCTCACAAGTCATGTGAGAGTCGTAGATGTGCATAACTTCTTTCTTATCTCCAGCTCTATCGTCGAGCTTCTTCATGAGCAGGTCTAGCTTTGCAGACAGCATGTCTACCTCCTTGAGCTGATGCATACCTCCACCTCTCTTGCGTGTCTAGGTCCTTTCTTCATTCTAGCCTTGGTTGGACGCCATCTTTTCCACAAGAGCTGTGGCTTGTGGTATAGTAAGTGATAAGAATGCTCCTCCGGCTGCAGCATCCATGGTCTCTCGGGCACTGTTGCCGAGCCCATGATAAAACATCTGCATCAATAGCCAACTCTCCATTCCATGATGGGGACATTCTAGGATGTAGTCTTGAAAGCGCTCCCATGCTTCTGGAACGGATTCATCATTTTATTGCTGAAAACTTGTAATCTTCCCACGGAGAGCATTGGTCTTGCCCATGGGAAAGAACTTAGCCAGGAAGTTTGTTGAGCAGAGTGCCCACGTAGTATTCTTCTCCTTTGTAGCGTAGAACCACAGCTTCGCTCTTCCTAACAGTGAGAATGGGAAGAGGCGAAGTAGTATAGCATCTCTGGGGACTCCTGATATGGTAAATGTATTGCAAATCTCCAGGAAGTGTTGTAGATGAGCACTAGCATCTTCGTGTGCCTTTCCACAGAACTGGTTGGATTGCACCATGTTGATAAGTCCAGGCTTGAGCTCAAAGTTGCCATCGATCTCTGCAGCAGGTCCAGTGCGGATGTTGTCCGTAGTGGGAGCTGAGAACTCGCAGATTGATTTGTTCGCCATGGCTTCGAACTCTGAAGACAAGTTTCGGTGATCTTCTTGATTGGATGAAGCTTCTTGCTGAAGTGTTGATGATCTCTTCTTGAGCTTGGCTCTAGTTCTTTTGAATAACGCTTCGGGATTGTCAACAAAATTTCCTAGAAGATGTCTTCTATTCATACATTCCCCTGCATAAGATAAAATAGAAAATATCAGGGTAAAACTGTATGAGAGAATAGATAAGCTCAATCATATTAGTGATGCGAATGATAACTCAAAATCTATATCCATTCCTGATTAGTAATCAACCTTCCCCGGCAACGGCGCTAAAAATGTTTGGTGGGTATTCTTAACATCACTACCAAAAGTAGACAACTTTCTAATTCTAGTAATGGTGCAAAAAATGCCAAACCTATCCCTCATACCACTTAAGACAAGTTGTCATCCCCAGCATGACATGAGAGACGCGGAATTGAAATATGCAATTGCTCTTCTAAATAAATAATGAATGGGATCTGCAAGCGCACAGATTAATGCCGATGTAGCATTTTAACCGGGAAGTATTCAAGGTATCATTATTTATATTTTTACCACTGGGAAGGGATTAACAATCATCAATATTGATTACAGAATAGAATATGAGATTGAGTATCTATCATTGCATGTATAATTGAGAACATTGTATCTAATTCTTTCATACAAGGGTAAGTGTCACATAAAAGATATATGAAATAATGAATAGTGACAAAGGTAATTAGTCTGATCATAACTTAGCCACATATAAATATGATAAGCACCTCAATTAGATACTCTAGAAAGTCATTAGCATGGTATTAGAACGAACTACAAGAATATTTCCTAAGTTATTCTCAACTATATAGTCTAGCATTATCATAGTTAGTGCAAGCATACTTAGCAATCATTGTGAGACAAGACTACGCCCATGCATAGTGATATTAGCAAGGTAAATGAGAAACATAGCAATCTCTACCCTGTAATAATGTTGCTCTGCCAGCCCACGATCTGGCATATTGGGTACAATACATGAGAGGGAGACTATATAAGAATCAATGAAGCTGTCACTATCACGAACTACCCCACGATCTGGCATATTGGGTACAATCGCAGATAAATACGGTATAAGCACCACGCCTACACAATATCTATCATTTACCCATGGATCCGATGGATAAACACTATACGATCCTAAACATGTATATAGATCCAATCTAACTAAGCCAAGTATATAACTATGATAAACTAAGAACAATATAATCTTGAATATAAGCAAGTAGAGCAAAGTCATAAGCAATATATTGAAATAGGACAAAGTCATATTCATAATATTGAAGAACAAAGATAATTAGAAGAACAATTAGAAGCACAATTAGAGAATTACCAAGAATCCTCTTGACAGATCCGGAAACCAATCGAAGATTGACTCCTAGTTCTAATCCTATGTAGCTATGCTAATCTAGATGTCTAATTGATGTGGTGGCTCTAATCTTGATCAGAGGCTTCTTCTCCCTTGAAGAACAATGAATTAGGGTTGAGAGGCTCTCTCCTCCCGGGGCCAGGGGGTCTGGTTTTATAGTCCCTTCAAGTGAATATGGGCCGTTGGATCAAACCGACATTGATTGAACGGTTATCCTTGATCCTTTAGGTCGGTGGAGATCTCCCCCAAAACAGAGTCTTGATTGGACTCCAACAGAGGGCGGGCGCCCTGGTTACCTGGGCGGGCACCCAGGTCCTGGCCCCGTTCGGCCTTCGCTTCCTTCCCGTGGCTTCTAGAGTCTTCTAGATGTAAGATAATTGCTCGGCACGTTGATATCTCTATGTAATCCCGACGTGTGGGACTTTCTTTCGTATTTCCTGATAACCCCCTGCAGAAATAGACAAACACCAAAACTCGTGGAATTCTGTCCGATAAAACCCTAAGTCTAGATGTCGATTTCATTTGGATCCTTTTCTTTGTTTATTTGATAATTAAATTTGATACTTAAGGACCGTCAACACAAGCTTAGAGTCTTAAAATAAGCACTGATCAGATTGTAACATGAGCTTTTAATTATTTGCAATATTACCTGGTGTATTGTGCATATAAGGATAATTGTAAAAATATTCCTTCGGGTATTCTTGTCACTAACCTTTCCAGGATTGGAGCAAGAAGATCAGATGAATGACAAGCACAAGGTATGTCCAACCAATCATCATGCAACACTGAATTAAATTCATCCAAACTTGAAATTTTGCAAAATTCAAGTTTGGGGCAGTACCTTACATAAAAAAAACATCCTTTGTCATGTTGCTATGTTGGTTGTCCCTACCTTTGAGACATGCTCAATTTGTTAAACGCTAATCATTCTATTTTCATCTCCACTTGAGTAAGATCTCTATAATGCTGTTATGCTACCTTTATCTATTCGCAAGTAAGTGTTGGTTTGAAAGTACTCGACATACTTCCATTCGCATTTAAATTAAGCGTGGTGCTTAGGTTAAATAGCCTTCCTTAATCTGATTAGACATGGAGTCTAGTTTGGTTACTGAACTAAAAACTGCCTGAGTAGACATTGGTATATTTTGTTGGACTAACCCCTGCAGGAAAACTGTCAATATCAACCTAGGAAGTCCTTAGATAAACTCACACTGGAGACAAAGAGAGAGACACATCAAGTTTAACAATTTACACAAGGAGGACGTAGCTCATAAGAGATGATCCCTGGAGGGTGCCACAAACACGATGCACAACCGCTAATAAAGGAAAGCTTCCACAAGGTGATACTATACCATCACTCTTCAAGTAAGGTAACATCTTAAAGTACTTGATTATCACTTTTATAAGCTTTTCCTTGGTTCTAGCTTTCACATAAATAAAGAGACAAACAGGTATGATTTATAACTCCAAATTAACCAACCCAACTGATTCAACTTGTTTAGTCCTTTAATCTTTGTTCCTAGTACTACCTCCAAGATCCCACACTCCTAATCATATGAGCTAAAATATTACACATTCAATCTTTGAGAGATATAAAGAAAAAGACATATACATAGATAGATTATCTTTCTATAAGGTTGAAGGGATCTGATCTGACAAATGTTATAAGTGCTACACTCATGAACTTATCATCCATCAACTTTGTCTTGCTCACTATGCTTAAGGTTAGAGAAGAACAAATACACTTTTGGTTTTGTTAGTGTTTTCCACCAACAGGGCCCATGCACTTGATCTCTGCCTTGTCTCTATGAGCAGGTACACTTCAAGCAAAACATGGAGGTGTTTTATAACTCTCAGACTCTACCAAGTGAAGGACCAGGATCTATGAGCATAAACACACTGAATAGGATACTGCCAACGCCGCACTTCGAACTACTGGGCAAATGAAGAACATGGGTGACACCGTATCAAGAGGTGCAGACGCCAAGGTCCTCACCTGAATCAAATGACGCACCTAAAGAATGAACACGGTGAGAAGTCTTGTCTAGAAGACTTAAAACATTGGATCCTTACCGGAAGATAAAATCGGTATTTATCCATATTTATCTTTTCTGCATTCCTTTTCCTTTTTATTCCATCACTTGCATTAGCATATTTACCTTTCCACATTAGCATTAGAAAAGAAAACAAAAAAAATTTTGTTCATTGCACTGCATCATAAAATCTAAAGCATAGATTTGTGGTTTAAAACCCATAGGTATATTGACTGCGGTGGCATAAAATAAATATATTTTCATCTTACAATACAAATATAAAAATAATAAGTGCACGATCCTGCTAAATAAATAAAATTTATTAGGAGGAATCTCAATATGATAAAGGCTAAGAGATATTATGCTAACACTTAACCAGTTCCACAAAGCTTTGTTGTCTATTTGAGCTCCACAGAATTTAAGGATCAAAGAAGACTAGCAGATGGAGGACATCCTAATTGCTGTCAGGGTACTGCCGACATTCAAATACACCTCCGCCACCTGCTAGCTACATCAAAAGAAATTACGTCAAAATCCAGCTTAGGGGAGAGCACCCCCATTTATCCAGCTAAGTGTTTCTACTCGTGTTTATACTTTACTCAAATAATAAAAAGATGCAAAATCATAAAAATCCAAATAAAGATTTTTGTGCTTATATATATATCTTTGCTTAGTTTGCTAAATAAATAAATAAAGTTTGCTATGAACCCTCATGATAAGCTATCACATGGAAATGATGAATAGTTGCTCTGCCATGACTAGTTCTCAAAATTGAAATCTCTCTCAAGTTTAGGCATGACTGTTATGAATTAAGATTTGCTCTAAACCTGAACTTGTGGGAAGAGTACTTGATCTAAAGACTAAGTCGTTAACGGATATAATATGGGAAGGTTGAGCTGTTGTTTATCTGTTCTTAGAAATGCTAGAATTCTCGAGAATTTTATCTTTGAAAATCTTTAAAATGTTGCATGATGAGTTCCTGTATGATGAGAGTTTAAAATCCTACCACAGCCACATGTACATGATTATTAGACTATGAACCATACATTTACTTTTTACTGCTTATGAGCATTGAGTGTGGTCAAGCTGTGTAGACCCTTAGTAGCTTGTCATGCGGTTAAAATCAAGATTCACTTGCACGTTCACTCATACATGTTGCTTCTACTCCGGAAGTACGCATCCACATACATCCACTCATTTCCATCTCCAGATGCACCCAAAGTTATTCTACTCCTATCTAGGATAGAATAGCCAAAAACATTATCCTATCCCTATTATTCCCCGTGAAATAAATGCTCGAGATATTTTGGTTACTACCACTTGCTACATTATTCTAAGAGGGTGAGTGCTCTGAAAAAAAAGAAGAAAAATACGAGAAAATAAAAAGGGGCAAGTGCCCGGAACCTCGAAGAAAAGAAAAAGTGAGACAAGAGGTAAAAATGGACAAGTGTCCGACAGTAGAATTAGGGGTACAAGATACCCACCTGAGAGGAAACAAAAAAATAATATAGAGCATCTCATTCTTCTCAAAAATCTTCAAAGTGCAAGAAAGGTATGTATCCCCTCAAAAGAGCAAAAGTAGAATTAGACTTCCACCATTGTTACCACCATACACCATTCATTCGCCACACATGCACATCTTGATTTGACTTATTGACTTGTTTCTCTGGATCCATGGTTTGACTATGCAATAAATGTCTTGTAAGTATGTATTAGCTGTCTCCCACCTATGAGCTCCAGATATCAAAACCTTGTTAGAGTAGGGTGAGAGAGAAGGCAATATCATTATGCCTCATACCACAAATACCACATACTTTGAGAGAAGGCATATATCATCACTGCCTTGGTAAGGATCC
>URS000176A646 rRNA from 1 species 
TACAGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGGGCTCGTAGGCGGCCAACTAAGTCAGACGTGAAATCCCTCGGCTTAACCGGGGAACTGCATCTGATACTGGATGGCTTGAGTTCGGGAGAGGGATGTGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCGGTGGCGAAGGCGGCATCCTGGACCGACACTGACGCTGAGGAGCGAAAGCCAGGGGAGCAAACAGG
>URS0001DA5C55 misc_RNA from 1 species 
GATGAAGAACGCAGCGAAGTGCGATAAGTAATGTGAATTGCAGAATTCCGTGAATCATCGAATCTTTGAACGCAAATTGCACTTTCTGGTATTCCGGAGAGTATGCCTGTTTGAGGGTCAGTGTAATAAAAATAAATCGTGGTTGTTTGCCACCTTTTCGTGGTGACGCTTCGGAATTGAGTCGTCTTTACCCCTTCGGGTTAAGTGACTTAAAATTTTTTCATACGATTTCGAAACGTATTTAATGTATTATTTACGTTCACGAATATCGAATTTTTATTAGGTGCGGTCATTTTTCATGAATTCGCGTCTATAATTTTTTTTTTTTTTTGACCTCAAATCAGGTAAGAATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS00001B9A8C rRNA from 1 species 
CACTGTCACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCCTAGGGTTGTAAAGCTCTTTCAGCGAGGAGGATAATGACGTTACTCGCAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGTTCGGAATCACTGGGCGTAAAGCGCACGTAGGCGGACTTTTAAGTCAGGGGTGAAATCCCGGGGCTCAACCCCGGAACTGCCTTTGATACTGGAAGTCTTGAGTCCGAGAGAGGTGAGTGGAACTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGCTCGGTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAG
>URS0001494730 rRNA from 1 species 
GTGGGGAATATTGGACAATGGGGGGAACCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTTTGGTTGTAAAGCACTTTAAGCGAGGAGGAGGCTACCGAGATTAATACTCTTGGATAGTGGACGTTACTCGCAGAATAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCAAGCGTTAATCGGATTTACTGGGCGTAAAGCGCGCGTAGGTGGCCAATTAAGTCAAATGTGAAATCCCCGAGCTTAACTTGGGAAGTGCATTCGATACTGGTTGGCTAGAGTATGGGAGAGGATGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGATGGCGAAGGCAGCCATCTGGCCTAATACTGACACTGAGGTGCGAAAGCATGGGGAGCAAACAGGATTAGAAACCCTGGTAGTCC
>URS0000295BDA rRNA from 1 species 
CCCTAGTAACTGCGAGTGAAGCGGGAAAAGCTCAAATTTAAAATCTGGCGGTCTTTGGCTGTCCGAGTTGTAATCTAGAGAAGTGTTATCCGCGCTGGACCGTGTACAAGTCTCCTGGAATGGAGCGTCATAGAGGGTGAGAATCCCGTCTTTGACACGGACTGCCAGGGCTTTGTGATGCGCTCTCAAAGAGTCGAGTTGTTTGGGAATGCAGCTCAAAATGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGAACTTTGGAAAGAGAGTTAAACAGTACGTGAAATTGCTGAAAGGGAAACGCTTGAAGTCAGTCGCGTTGGCCGGGGATCAACCTTGCTTTTGCTGGGCGTACTTCCCGGTTAATGGGTCAGCATCAATTTTGACCGTTGGATAAAGGTCAGGGGAATGTGGCATCTTCGGATGTGTTATAGCCCTTGGTCGCATACAACGGTTGGGATTGAGGAACTCAGCACGCCGCAAGGCCGGGTATTTATACTACGTTCGTGCTTAGGATGCTGGCATAATGGCTTTAATCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGCCTGCGAGTGTTTGGGTGGAAAACCCGAGCGCGTAATGAAAGTGAAAGTTGAGATCCCTGTCGTGGGGAGCATCGACGCCCGGACCAGACCTTCTGTGACGGATCCGCGGTAGAGCATKTATGTTGGGACCC
>URS0000468D61 rRNA from 1 species 
GACTAACAATGGTTAGTTGAGTGGCTAAGCGAAAGTGATAAGTGACCCACCTGGGGAGTACGCTCGCAAGAGTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCAGGGCTTAAATGTAAGTTGCATGGACCAGAGATGGACCTTTCTTCGGACTACTTACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCAGGTTAAGTCCTATAACGAGCGCAACCCCTGTTGTTAGTTGCCAGCAAGTAAAGTTGGGTACTCTAGCGAGACTGCCGGTGCAAACCGTGAGGAAGGTGGGGACGACGTCAAATCATCACGGCCCTTACGTCCTGGGCTACACACGTGCTACAATGGTCGGTACAGAGAGCAGCCACTACGCGAGTAGGAGCGAATCTTCAAAGCCGATCTCAGTTCGGATCGCAGTCTGCAACTCGACTGCGTGAAGCTGGAATCGCTAGTAATCGCATATCAGCCATGATGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCAAGCCATGGAAGCTGGGGGTACCTGAAGTCGGTGACCGTAAGGAGCTGCCTAGGGTAAAACTAGTAACTGGGGCTAAGTCGTAACAAGGTAACCGTAA
>URS0001AC9055 rRNA from 1 species 
TGAGAGAAAGGGGGCCTCTGCTTGCAAGCTCTCGCTATGAGATGAGCCCGCGTCCGATTAGCTAGTTGGTAGGGTAAAGGCCTACCAAGGCGACGATCGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTGCGGGTTGTAAAGCACTTTCAATTGGGAAGAAAAGCCTGAGGTTAATAGCCTCGGGTCTTGACGTTACCTTTAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATCACTGGGCGTAAAGCGCGCGTAGGCGGCTTGATAAGTCAGATGTGAAAGCCCCGGCTTAACCTGGGAATTGCATTTGATACTGTCTGGCTCGAGTATGGTAGAGGGGGGTGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCAGTGGCGAAGGCGACCCCCTGGACCAATACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTAGCCGTTGGGCTCATTTAAGGGTTTAGTGGCGCAGCTAACGCGATAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCAGCCCTTGACATCCAGTGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAGCACTGTGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCTTAGTTGCCAGCACATAATGGTGGGAACTCTAAGGAGACTGCCGGTGATAAACCGGAGGGAGGTGGGGATGACGTCAAGTCATCATGGCCCTTATGGGCTGGGCTACACACGTGCTACAATGGCCGGTACAAAGGGTTGCGAAGCAGCGATGTGGAGCTAATCCCGGAAAACCGGTCGTAGTCCGGATTGCAGTCTGCAACTCGACTGCATGAAGTCGGAATCGCTAGTAATCGCGAATCAGAATGTCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGTTGCACCAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACGGTGTGGTCAATGACTGGGGTGAAGTCGAAACAAGGTA
>URS000014146A rRNA from 1 species 
GATGAACGCTAGCGGCAGGCTTAATACATGCAAGTCGAGGGGCAGCGGGGTAGCAATACCGCCGGCGACCGGCAAACGGGTGCGGAACACGTACAGAACCTTCCTTTAAGCGGGGGAGTAGCCCACTAGAAATGTGGATTAATACCCACTAGTAATGTTTAATGGCATCATTAGATATTTAAAGTATTTATCACTTAAAGATGGCTGTGCGGCTGATTAGGTAGTTGGTGCGGGTAACGGCCCACCAA
>URS0002127D47 rRNA from 1 species 
TAATTTATTGGGGGTAGAGCACTGAATGTGCTAGGGGGCCTACAAGCTTACCAACCCCAATTAAACTCCGAATACCGATTACATGATGTACAGCAGTGAGGCTATGGGTGATAAGGTTCATAGCCAAGAGGGAAACAACCCAGATCATCAGCTAAGGTCCCAAAATTGATACTAAGTGATAAAGGATGTGGAATCGCCCAGACAGCTAGGAGGTTGGCTTAGAAGCAGCCATCCTTTAAAGAAAGCGTAACAGCTCACTAGTCAAGGGGTTCTGCGCCGATAATTTCCGGGACTAAGTATCATACCGAAGCTATGGGATTCATTCGATTCGAATGAATCGGTAGACGAGCGTTCTATTAACTTGTGAAGGTTGACCCGTGAGGGCAGCTGGAGGAGATAGAAATGAGTATGCTGGAATGAGTAGCGATAAAGCCTGTGAAATGCAGGCTCGCCGTAAGCGTAAGGTTTCCTGAGTAAAGTTAATCTGCTCAGGGTTAGTCGGACCCTAAGCCGAGGCCGAAAGGCGTAGGCGATGGAAAACAGGTTTAATATTCCTGTACCAGTTTAATATTGTTTGAACTATGGGGGGACGCAGAAGTGAAAGGAGATCCCGGTTTTGATTGTCCGGGTTTAAGAGTGTAGGGAGTTCTGATAGGTAAATCCGTTGGAATAATCCTGAGACTCGAATAGGAGGGCTTAGCCCACAAACTCTCCCTAATCCTGCTGCCAAGAAAATCCTCTATGTTAGATATTTGACTGACCGTACCGTAAACGGACACACGTACGCGAGGAGAGTATCCTAAGGCGCTTGAGAGAATCCAAGTAAAGGAACTAGGCAAATTAGCCCCGTAACTTCGGGAGAAGGGGTGCCAATTAAGGAAAAGAACTTCGCGTTCTGCTTTTTATTTGGCCGCAGTGACCAGGCCCAAGCGACTGTTTACTAAAAACACAGGTCTCTGCTAAGTCGTAAGACGAAATATAGGGACTGACACCTGCCCGGTGCTGGAAGGTTAAATGGAGAGGTTAGCTTCGGCGAAGCTTTGAAACGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCTGCACGAATGGTGTAACGATTTGGGCACTGTCTCTACTTGGAGCTCAGCGAAATTGAAGTGTCGGTGAAGATGCCGGCTACCCGCGGCCGGACGAAAAGACCCCGTGCACCTTTACTACAACTTATCATTGAATACTGATTCTGCTTGTGCAGGATAGGTGGGAGACTTTGAAGCAGTAGCGCTAGTTATTGTGGAGTCATCCTTGAAATACCACCCTTGTATTGTTAGTATTCTAATCCCATCCCGTGAATCCGGGTGAGAAACAGTGGTAGGTGGGTAGTTTGACTGGGGCGGTCTCCTCCCAAAAAGTAACGGAGGAACCCAAAGGTTCCCTCAGCATGGTCGGTAATCATGCGAAGAGCGCAAAGGCATAAGGGAGCTTAACTGTGAGGTCGACGGACCGAGCAGGTACGAAAGTAGGGCTTAGTGATCTGGTGGTTCCGTATGGAAGGGCCATCACTCAATGGATAAAAGGTACGCCGGGGATAACAGGCTTATCTCCCCCAAGAGTTCATATCGACGGGGAGGTTTGGCACCTCGATGTCGGCTCATCACATCCTGGGGCTGGAGAAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGTGGTACGTGAGCTGG
>URS0000ADD2ED rRNA from 1 species 
AAGCCACGGCTAACTACGTGCCAGCAGCCGCGGCAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGTTTTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGAAAACTGGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGCAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACGCTGATGTGCGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAAATCTTGACATCCTTTGACAACTCTAGAGATAGAGCTTTCCCCTTCGGGGGACAAAGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTAAGCTTAGTTGCCATCATTAAGTTGGGCACTCTAAGTTGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGATTTGGGCTACACACGTGCTACAATGGACAATACAAAGGGCAGCGAAACCGTGAGGTCAAGCAAATCCCATAAAGTTGTTCTCAGTTCGGATTGTAGTCTGCAACTCGACTACATGAAGCTGGAATCGCTAGTAATCGTAGATCAGCATGCTACGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGCCGGTGGAGTAACCTTTTAGGAGCTAGCCGTCGAAGGTGGGACAAATGATTGGGGTGAAGTCGTAACAAGGTAGCCGTATCGGAAGGTGCGGCTGGATCACCTCCTTTCTAAGGA
>URS0000EBB953 lncRNA from 1 species 
GGAAGAGAAGGAGGAGGAGGAGGAGGAGGAGAAAGTGGCTCTCAGCGGCCGGTCGGATTAAAAGTAACCAGACTCGTCCAGAAAACTGCGTCCAGGAAGGAAGTGACAGAAGACGAATGGGAAAAGGAGAACAGCTCACAGCGTTTGAAACATCGCGGCACCACTTTCAGATAAAAACATAGACCTGAATGGCATCATCCAGTATCCAAGGAAACCATGTTCTCTAAACATGAATATGCCTTTGGGGGAAGACAGAAGAACATGGAAGCCATGTGAAAAAAACGGATCCTAAGGCAGTTTTGAACATCTGGAGGCCTGATTTATTGGAGATTGCAAATGTACAGTGTAACATAGCTGTGGAGAGCGAGAAGATCAGGATTGTCAATGCTGTCATTGCTTTTACTGGAATCCCCAGCACGAATTGAAGGTCTCACTTTGCCACCTAGGCTGGATGCAATGCAACGGTATGTTGATCTTGGTTCACTGCAGCCTCAACCTCCTGAGCTCATGTGATCCTCCCACCTCAGTCCCCCACGTCGCTTGGATTACAGGCCTGTGCCACCACACCTGGCTAACTTTTTTTGTAATTTTTGTAGAGACAGGGTCTCACTATGTTTCCCATGCTGGTCTTTAATGCCTGAGCTCAAGCCATCCGCCTGCCTCGGCCTCCCAAATTGCTGGGATTACAGGCATGAGCCACCATGCCCAGCCTAATTCTTCTAAATCTTATCCTAGTAATTAAGCCAGAATTTTTCTCTGCCAAGACCAATAGATGGACCAAGAAGTACTCATCCTTGTAAACTTTCTTTGGATAAATTGCTTACATATAATAAATTCAGAGTTAAGTAATAAAAATAATGAACTACTGTCTTG
>URS000194FCEC lncRNA from 13 species 
ATCTCCAGACCCAGTCAGACTTTCAGACACTGAAGTTTTGGCTGACATTTTGACTACATCTTCGTGAGAGTGCCCAAGGCAGAACCACCCAGCCAAGCCACTCTGACTCCTGATCCATAGAGACAGTGTGCGACAGCACAGGATTATTGTTGTGCGAAGTCATGAGTATTTGAGGCAATTGTTATGTAGCTTTAGCTAATAGAGACCTATTCTGCGGCTTAGGAGGAAGTGAGAATAGAGCCAGTTTGGGGGCTCCAGGAACCTACAGTCTCCAGGTGACCAAGCAGACACTGACGAAATATGAAGGCGCTGGGGCTGGAGAGAGACGACGTCTACTGGGCCTGATAATGGACTCAAAACTACAGAAGTAAACACAGGAAGGAAAAAAGTACCGAGAGAGAGGGGTGAGCTGCTGACAGAGGCTTAGGGACCATTTGGAATCGCGCAGACCTGGATTCAAATCCTCACTCCATCACTTTAGTCTTGGGAACTCAAGCAAATTACTTAAACTCCTTATAGAGTCCCAGATTCCTGTAACAGCAGCATGGATCCTTGCTGCAATGAGGATTAAGCAGAATATGTCACTGAAAATGAAATGAAATGAGAAGCCCCTAACCCAGCCCCCTAGCTCATGG
>URS00011AB3B6 rRNA from 1 species 
TGGCTCAGATTGAACGCTGGCGGTATGCTTAACACATGCAAGTCGAACGGTAGATACTTCGGTATCGAGAGCGGCGGACGGGTGAGTAACGCGTAGGAATCTGCCCAGTAGTGGGGGACAACCAGAGGAAACTCGGGCTAATACCGCATACGCCCTAAGGGGGAAAGCGAGGGATCTTCGGACCTCGTGCTATCAGATGAGCCTGCGTCGGATTAGCTAGTTGGTAGGGTAAAGGCCTACCAAGGCAACGATCCGTAGCTGGTTTGAGAGCGCGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCAATACCGCGTGTGTGAAGAAGGCCTTAGGGTTGTAAAGCACTTTCAGCAGTGAGGAAAAACTTAAGATTAATAACCTTAGGCTTGACGTTAACTGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGGGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCGCGTAGGTGGTTTGGTCAGTCGGATGTGAAAGCCCTGGGCTCAACCTGGGAACTGCATTCGATACTGCCTGACTAGAGTGTGGTAGAGGAGAGTGGAATTTCAGGTGTAGCGGTGAAATGCGTAGATATCTGAAGGAACACCAGTGGCGAAGGCGGCTCTCTGGACCAACACTGACGCTGAGGTGCGAAAGCGTGGGTAGCAAACGGGATTAGATACCCCGGTAGTCCACGCCGTAAACGATGTCTACTAGCCGTTGGGTTCCTTGAGGACTTAGTGGCGCAGCTAACGCATTAAGTAGACCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATATGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACCCTTGACATACAGAGAACTTTCTAGAGATAGATTGGTGCCTTCGGGAACTCTGATACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTATCCTTAGTTGCTACCATTAAGAGTTGGCCACTTTAAGGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGGCCCTTACGGGTTGGGCTACACACGTGCTACAATGGCTGGTACAGAGGGCTGCTAACTTGCGAGAGTACGCTAATCCCTTAAAGCCAGTCCTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGCTGGAATCGCTAGTAATCGCGGATCAGAATGCCGCGGTGAATTCGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTGGGTAGGCTAACCTTCGGGAGGCCGCTCACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAGCCCTA
>URS00016A699B rRNA from 1 species 
TGGGGAATTTTGGACAATGGGGGGAACCCTGATCCAGCCATCCCGCGTGTGCGATGAAGGCCTTCGGGTTGTAAAGCACTTTTGGCAGGAAAGAAACGTCGCGGGTTAATACCCCGCGAAACTGACGGTACCTGCAGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTCGGAAAGAAAGATGTGAAATCCCAGAGCTTAACTTTGGAACTGCATTTTTAACTACCGGGCTAGAGTGTGTCAGAGGGAGGTGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAGCCTCCTGGGATAACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCAACTAGCTGTTGGGGCCTTCGGGCCTTGGTAGCGCAGCTAACGCGTGAAGTTGACCGCCTGGGGAGTACGGTCGCAAGATTAAAACTC
>URS0000BC3C0C rRNA from 1 species 
TTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGCGCAAGCCTGACCCAGCAACGCCGCGTGAAGGAAGAAGGCTTTCGGGTTGTAAACTTCTTTTGACAGGGAAGAGCAGAAGACGGTACCTGTCGAATAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTACTGGGTGTAAAGGGCGCGTAGGCGGGATGGCAAGTCAGATGTGAAATCCAAGGGCTCAACCCTTGAACTGCATTTGAAACTGTCGTTCTTGAGTACTGGAGAGGTTGACGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGTCAACTGGACAGCAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGCC
>URS0002274C91 rRNA from 1 species 
AATGCCGGATGCTCCGACTCCTCGCATGGGGTGTCGGGAAAGATTTCATCGGTATGGGATGGGGTCGCGTCCTATCAGGTAGTCGGCGGGGTAACGGCCCACCGAGCCTACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTTGATCGGGAGCAAGCCTTCGGGTGAGTGTACCTTTCGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTATCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTTCGTCGCGTCCGGTGTGAAAGTCCATCGCTTAACGGTGGATCTGCGCCGGGTACGGGCGGGCTGGAGTGCGGTAGGGGAGACTGGAATTCCCGGTGTAACGGTGGAATGTGTAGATATCG
>URS0001B5E2EE rRNA from 1 species 
GGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCCTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTTGTTGGTGGGGTAACGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTG
>URS00005D6907 rRNA from 1 species 
TGCCCGAACGTAACACGACACCACCGTCCGCCAAATAACTACGAGTACAAACTTAAAATTTAAAGGACTTGACGGTATTTCACACTCAACCTAGAGGAGCCTGTCTACTAACCGATAACCCACGATTAACCCAACCGCTTCTAGCCCCCAGCCTATATACCACCGTCGCCAGCCTACCTTATAAAAGAAACAAAGTGAGCTAAACAGTAATACACTAAAACGACAGGTCAAGGTGTAGCTAATGAATCGGATTAGGATGGGCTACATTTTCTAACCCAGACTATACGAACCAGGCCATGAAACAAGCCTTCGAAGGCGGATTTAGTAGTAAGCCGAGAACATAATACTCAACTGAAACCAATGCAATGAAATGCGT
>URS0000822125 rRNA from 1 species 
ACATGCAAGTCGAGGGGCATCGGGATGTAGCAATACATTGCCGGCGACCGGCGCACGGGTGAGTAACACGTATCCAACCTGCCTTTTACTCGGGGATAGGCTTTCGAAAGAAAGATTAATACCCGATGGCATAATCTTCCGCATGGTAGAATTATTAAAGAATTTCGGTCATCAATGGGGATGCGTTCCATTAGGTTGTTGGCGGGGTAACGGCCCACCAAGCCTTCGATGGATAGGGGTTCTGAGAGGAAGGTCCCCACATTGGAACTGAGACACGGTCCAAACTCC
>URS0001663DCE rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAACGCAGTGGGGACGGGTGCGTAACACGTGGGTAACCTCCCATCAGAGGGGATAACCCTTGGAAACAGGTGCTAAACCGATACTGATGGATGGACCCGCGGGGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCCACGATGCCTAGCGGGCCTGAGAGGGTGATCTGCCACACTGGGACTGAGACACGGGCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGTGTGAAGAAGGTTTTCGGATCGTAAAACTCTGTTATTAGAGAAGCGTTATCTAACCAGGAAGCCACGGCTAACTCCGTGCCAGCAGCCGCGGTAATTC
>URS00009B24CA lncRNA from 1 species 
GGCCAGAAGAGCAGTTCTCCAGGCCCAGAAGTAAGCTACACCCACAATTCTGTATGCAGCTGTGAGAAAGGAGAGTGGAAATCCAAGTCAATGCAGTATCACCGTGTTCCCAATCACGAGTATTCCACTGGGCCCACTGGCTGCCAAGACATGGATGGGATCCAGTGGTGAGCCTGCCCCAGCACATGAAACACATGCTTGGGAAACAGTGCCTGACTGGATGGAGCCCTCTGGTACCCTCAAAGAGAAGCAACTCGCCTCATGACGGCAAGAACTGTAAAACAAAGCTAGGATTTTACCCCTACTGGGCCATCCACGCTTTTAGAACCACAGATTCTCAGGGAATGCAGCATTAACCTACATACAGCTAGAAAATTGACAGTAGCATATCTCAACCCAATTACCTTGAATCACAACTCTGGTAAAAGTTTTAGCAATGGAAGAGTTAAAATGATTCACTAGATGGAAGTTTTTGATAATTTGTTGACTTTAGCCATGGATAATTAAGAGTGATGGAATCCTCGTTTCACTATCAAGGAAGCTGCAGTCAAGGTCAAACAGATGAGCGCCCTGGAATTCCATGGAAGACAGCACAAAACCAATAAAACCACTGGTGTTCAGTT
>URS000183F9F2 rRNA from 1 species 
GACGAGGGCGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTTGCGTCAGCTGTGAAAACCCGCAGCTCAACTGTGGGCTTGCAGCTGATACGGGCAGGCTAGAGGTAGGTAGGGGAGAATGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGATACTGACGTGGAGGAGCGAAAAGCGTGGGGGAGC
>URS00021C87A3 rRNA from 1 species 
TCGCGTCGGGAGTGAAAACACCGGGCTTAACTCGGTGCTTGCTTTCGATACGGGCAGACTAGAGGTATGCAGGGGAGAATGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGTTCTCTGGGCATTACCTGACGCTGAGGAGCGAAAGTGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACACCGTAAACGTTGGGCGCTAGGTGTGGGGCCTATTCCATGGGTTCCGTGCCGTAGCTAACGCATTAAGCGCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGAAGAACCTTACCTGGGTTTGACATACACCGGAAGCCTCTAGAGATAGAGGTCTCTTTGATACTGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTTCCATGTTGCCAGCACGTAATGGTGGGGACTCATGGGAGACTGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACGCATGCTACAATGGCCGGTACAAAGGGCTGCGATCCCGTGAGGGGGAGCGAATCCCAAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCCCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACGTCACGAAAGTCGGCAACACCCGAAGCCGGTGGCCTAACCC
>URS00006073C1 rRNA from 1 species 
AACGAACGCTGGCGGCAGGCCTCAAACATGCAAGTCTAGCGGGCGTAGCAATACGTCAGCGGCGGACGGGTGCGTAACACGTGGGAACGTACCCTTTGGTTCGGAACAACTCAGGGAAACTTGAGCTAATACCGGATGTGCCCGAAAGGGGAAAGATTTATCGCCAAAGGATCGGCCCGCGTTCGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCGATAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTTGGGAATCTTGGACAATGGGGGAAACCCTGATCCAGCCATGCCGCGTGAGTGATGAAGGCCTTCGGGTTGTAAAACTCTTTCGACGGGGACGATAATRRCGG
>URS0000627A27 tRNA from 1 species 
GCAGTCGTGGCCGAGTGGTTAAGGCGATCGACTAGATATCCATTGGGGTCTCCCCGCAAAGGTTCGAATCCTGTTGACTGCG
>URS000100738B rRNA from 1 species 
TACAGAGACTGCAAGCGTTATTCGGATTCACTGGGCGTAAAGGGCGCGTAGGCGGCCACTGCAAGTCAGTTGTGAAATCTCCGGGCTTAACCCGGAAAGGTCAACTGATACTGCAGGGCTAGAGTGCAGAAGGGGCAACTGGAATTCTCGGTGTAGCGGTGAAATGCGTAGATATCGAGAGGAACACCTGCGGCGAAGGCGGGTTGCTGGGCTGACACTGACGCTGAGGCGCGAAAGCCAGGGGAGCGAACGGG
>URS00004CBF81 rRNA from 1 species 
AGAGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACGGTAAGAGCTTGCTCTTATGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACCTTTTGGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGCCCTTCGGGGAAAGCCGGGGACCAGCAATGGCCTGGTGCTGATAGATGAGCCGATGTCGGATTAGCTAGTCGGTGAGGTAATGGCTCAACAACGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCACGACCACACGTCGAACTGACGACACGGTCCA
>URS00017EC46A rRNA from 1 species 
CCCTTAGATGTTCTGGGCCGCACGCGCGCTACAATGATGAATTCAACGAGTTTATAACCTTGGTTGAAAGGCCTGGGTAATCTTTTGAACTTTCGTCGTGATGGGGCTAGACCCTTGCAATTATTGGTCTCCAACGAGGAATTCCTAGTAAACGCAAGTCATCAGCTTGCATTGATTACGTCCCTGCCCTTTGTACACATTGCCCGTCGCACCTACCGATTGAATGGTCCGGTGAAATCTTCGGATTGAGACTTTGTTTTCTTCACGGAAAACGCTGTTTTAAAAAGTTGATTAAACCTTACCATTTAGAGGAAGGTGAAGTCGTAACA
>URS000026EF3C rRNA from 1 species 
TAGGGAATCTTGCACAATGGGCGGAAGCCTGATGCAGCGACGCCGCGTGAGGGATGAAGGCCTTCGGGTCGTAAACCTCTGTCCTTGGGGACGATGATGACGGTACCCAAGGAGGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTGTCCGGAATCACTGGGCGTAGAGGGTGCGTAGGCGGCCTAGCAAGTCCTGTGTGAAAGGTCTCGGCTTAACCGGGGAGGGTCATGGGAAACTGTTAGGCTTGAGTGCCGGAGAGGGCAGTGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCAGTGGCGAAGGCGACTGCCTGGACGGTAACTGACGCTGAGGCACGACAGCTGGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCCAGCCGTAAACGATGAGTGCTAGGTGTTGGGGGTATCGACCCCTCCAGTGCCGTAGTTAACGCAATAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTG
>URS0001CAC1D5 rRNA from 1 species 
AGCGAACGCTGGCGGCAGGCTTAACACATGCAAGTCGAGCGGGCCCTTCGGGGTCAGCGGCGGACGGGTGAGTAACGCGTGGGAACGTGCCTTCTGGTCTGGAATAACCCTGGGAAACTCGGGCTAATACCGGATACGCCCTTTTGGGGAAAGGTTTACTGCCGGATGATCGGCCCGCGTCTGATTAGCTAGTTGGTGGGGTAACGGCCTACCAAGGCGACGCTCAGTAGCTGGTCTGAGAGGAGGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGTAGAAGTGGGGAATATTGGACAAGGGGCGCAAGCCTGAGCAAGCCAGGCCGCGGGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCGTTTATCCGGGACGATAATGACGGTACCGGAGGAATAAGCCCCGGCTAACTTCGTG
>URS0000D28D64 lncRNA from 1 species 
AAGAAGTCCTACCACTGAAAGGATGTGCGGGTAGAAATGAGCAATTGCAACTAGAAGAGCCTGTGTGCCCACAATCAGGGGTGAGGAGGAGTGTCATGGAGCAGCTCTCTACTGCCCTGAGAATGACATCCCCACTGTTCACCATGGCCTTAAATCCCCTGCGAATTCCACCTCATCCTCTGCCACTTCCCGTCACTGCTCTGAAGATGCCCTGATCTTGTTTCAGTCCCTTGGATGTACCCAGCTCTTCTCCATCTTTGCATGTGTCATAGCCTCTTCCTGGAAAACCCTTCCTGCTGCTCATCCCAGAACTGACTCTCCATGTATTTACTCTTATTTTGAGAGAAGGGGGCATTTCCACCACCAGAAGGGAACTTGCTATCTTGGTAGCGTTGTCCCCTGACACCTGGCACATCTACTCTATACAGTCACCATTCAAGTGGATGTTGAATGAGTACACTTGTTTCACAGTTTGGTTGGGTAAGCCCCAAAGCTTGGTTCCCGGTAGGATCAGGCTTTATGAGTGGGCTGAGTTTCTATAAAAGTCTCCCTACCAGTTTCCAATCTTGGTGAAACTA
>URS0000DCF6EE rRNA from 1 species 
TAGGGAATATTAGAAATGGACGAAAGTCTGATCTAGCAACACCGCGTGTGCGAAGAAGGCCTTCGGGTCGTAAAGCACTTTTTGGAAGGAATAGGAAGGAATGTACTTCCAGAATAAGTCTCGGCTAACTACGTGCCAGCAGCCGCGGTAACAAGTAGGAGGCGACCGTTATACGAATTTACTGGGCGTAAAGCGCGTGTAGGTGGTTCTGTAAGTAGGGCGTGAAAGCTCCTGGCTCAACTGGGAGAGGCCGTTCTAAACTACAGAACTAGAGGATGGTAGAGGGAGGTGGAATTCCAGGTGTAGCGGTGGAATGCGCAGATATCTGGAGGAACACCAGTGGCGAAGGCGGCCTCCTGGACCATTCCTGACACTCAGACGCGAAAGCTAGGGTAGCAAACG
>URS000241AE0D lncRNA from 1 species 
TGGTTCAGATTTAATATAAATCCTAGTCTAGTCCCCTTGGGTTGCAAAGGAATCTCTCTTTCAGTTCCTTGAAATTTTTTGGTACAGGTGTATTGATGTTGTTGAACATACATCAATATCTTGTCAAAGTATAAGTATCTTTCTGAGTTTTGATGCAATGTCTCACCAGTGTTTTTCTCTCTTTCATCTCTCTACTTATTACACAGTAATAGACTATACTTCTTGTTTGGTGTAGAACAAAAAGCTTGATAATAGTTCGATCAAAGTATGTTTATGTCATTAGACCTTTGATTGTATATATATATGACTTGAGAGAAGATCTTCTTGATTGGAGCAGATCTTTGAGAGATAGGCAATCCAAAAGAATTGATCCTTGAAATGAACCTTAATTGATTCCTTTCAGAAATAAGTTGGAACTTTCCTATACTTGGACCCTGAAGTACGGCGTGATAGATGTTGCTTCCTCGATCAGCGTAACTTGATATCTTTTGCAAATCTTCCATATAATGCGTCTGATATGATTGCCCTTAACTTTCGTGATTAAGAATTGAGACTGGATATTGATCTTCCTTGATCCCTGTGATTTGGAACTAAGAGCAGAATTGATTCTTCAATCTTAGCCTTCCTTCTTTGGATAGCTTCTGAATCATTAGTTGGCTCTTACTTCCTTCTTTGGATAGCTTCCAGATCCTTGATTGCCTGCAATAGAAATAAGTTATTGTTTACCATTAAAACTCAGATCTAACATTAACAAGTATGAGTTGGAAATGGTTTAAAGGTCTTTTAATTATATATTAGGCTATCAACTAGGTAATTGGCTGTAGCAAGTATGATTTGATAGCTTTAAGAAATAGAAAATATCCCATTATAGTTGGTTACAACATAGTAGTTAAATAAAATTTTAATGGGAAAAGCATAAAAAGAACCCCAAACTTATTTCGGATTACCAGATACACATTTAAACTTTGCGAGTGTCTTGTGACTCCCTTATACTATTTTGAACTAGAATTATTAACTCCCTAAGGAGTCGTTTGGTATGAGGTATAAGTACAAATAGTGTTGGAATAAAAATTTAATACCACCTTAATATTTTATTTGGTTAGCAAACCTGAGATAAGTTATCTCGGGATTAAAATAAATACCGGGATAACTTATACCTTGTAGGGTGTGGAGTAATTAGTGTCGGGATAGCTTATACCTTCTTCTTAGAAATTATGTAAATATCATTTTTAATACAACATACCAAACAGTGGATAAAAAATAATCTCAGCATAACTAATCCCAGCATAACTTATCCTAGCATAACCTATATTCAAACCAAACGACCCTTAAGTGTTGAGGCGGTAAAGAAAGTGTAATCCGGGACATTTTTGATAGCGTTTTTATGCTTTTTCCAGATTTTACGTTCGCAATGTCTATATATCAAATACAATTTTGAAAACCATGCCACTTGATGGTGTACATAACTTGTTTGTTTTCGAAATGAATCTGATTTTTGCACCAAATCTGCGCGAGTTCCCTGAATTTATAGCTACGGGACCTATGAATTTTCTATTTTTCAGTTTTCTTAATTCTGAGCTAGCACTAGGCAAAGAAACTTTCATGAAAGACCCATAGAAACCAAGAGAATAGCAAAAGATACACAAGAATTGAAGAAGTATACAAAATTCAATTTGATAATGAAAAATCTGTGACATAAGTCTAGAGGTCAATATGTGACAGTTCATTCATAGTATTATGAACTCATGAGTAACTTCATGGATACTGTTAAGTGGTCCTAGCATAATTGAAATTTTGCTATTTTTTTTATCAACAGTATTAAAAGTTATATGATTTAAAAAAAAGATGTGGATTTAATTTTGTGGGCATGGGAGGTTTCCAAAATTGCAAATTAAAATTAAAGTTATTCATCATGAAAGAAAATCAGATACTCCACTAAAATGACAATTTAATTTTTATCTTATAATGATCTATCGTTTTGAGTCAATGACTAAACTATTCTATTTGCTTCCTTCGGAAATCCCATTTATTTGGAGAAGAAATCAAAAAAACAGTCAACAGATTCTTAAAGTATGAAAAAGACAATATTTAAGAATTAAATTGCCATGAGATGGCTTAAGAGTTAAGACTCGTGGGAATTCACCTCTTGCTTGGTTTTTGTCCAAAAATAAATTAAATGAATAAATCTTGTTGCGTGCAATATAATTGTGTAAGAATGACATTAGAAAATAGAGGAAAACTAAATTATAACACAAATATTTGTTGTTATAGCGAATCTACGGTATCTTACGTGTTGATTGTGTTATCATCTTCTCTGTCGTTGGTGTCTTTCACCGTTAGTTCTGGATCATCCGATAAGTCGTCGTCTTCTTCTTGGAATGAAATGGTGTTTTTTGTCGTTGTGATAGAAATATCTGTGGTTAAGGTGTTTTTGTGATGGTGGTGTGGAGTGGTGAGGTTGTGTGATAACACGGGTATGCCCCATCTATGTCCGTGTATTTCTTGT
>URS000033F791 rRNA from 1 species 
ACCGCCCGTCCAAGCCATGGGAGCCGGGAGTGCCTGAAGTGCGTGAGCGCAAGCAGCGCCCTAAGGTAAACCGGTGACTGGGGCTAAGTCGTAACAAGGTAGC
>URS0002366112 lncRNA from 1 species 
TTTTAAAAGGCATCCAATAATTCTTGTGGCCATATATCAATTCATGTAAGTTTGATTGTAATTATTGGTGAAGGGGTTTCACTTCCCGTCTCTAAATAAAAATACTGATTCTTTAAGGTACATGCCACTAGGGATTGCGAGATTAACGAGTCTTTGGACATTGGAAGAGCTCCTTGTGAGTGGAGGAGGAGGTGTTGATGGTAGCAAAGCATGTGGGCAGTGGGCTTGAATCTCTTAAAAACTCGGAACTCCTCCAAGCGTAAGTATACGTATACTGGGAAATGTGTTAGATGTGGATGAGGCTAAGAGATTAGAGCTTGACAAAATGAAATACCTCTTTCATTGAGACTTAAATTTGATGGGGAAGAAGAAAAAGAAGAGGGAAGGAGGAAGAATGAGGATAATCAACTTGTTCTTGAAGCCTTGCAACCACCTCTGAATTTGAAGGAATTAGAGATTTGGTCATACAGAGGCAACAT
>URS00001A8944 rRNA from 1 species 
AGAGTTTGATCATGGCTCAGGATGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAGCGATTTACTTCGGTAAAGAGCGGCGGACGGGTGAGTAACGCGTGGGTAACCTGCCTCATACACATGGATAACATACCGAAAGGTATGCTAATACAGGATAATATAAGAGATTCACATGGATTTTTTATCAAAGCTCCGGCGGTATGAGATGGACCCGCGTCTGATTAGCTAGTTGGTAAGGTAATGGCCTACCAAGGCGACGATCAGTAGCCGACCTGAGAGGGTGATCGGCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGTGATGAAGGCCTTCGGGTCGTAAAACTCTGTCCCCAAGGAAGATAATGACGGTACTTGAGGAGGAAGCCCGGCTAACTACGTGCCAGCAGCAGC
>URS0000D1F0EB sRNA from 1 species 
GGGTCGCTGCGAACCCCGGCGTTCCGCGGTGGAGGGGTGCTATACTGGGATGCAGGCGCGGCAATCATGCCCTGGGAGCTAATGTAGAGCTTTGGATAATGCTTTTGCAAGTTGTACGAGAAGGGAAGTTCTTGGGGTTTCTGACCTCCTGCAGCCTCCTCTTGCCTCGGGCTGCCCAGATCTTGGCGGCTGAGGCTGGCTTACCTTCAAGCCGTTCCTTCATGGGATTTGCTGCTCCCTTCACCAACAAGCGAAAGGCTTACTCGGAGCGTAGAATCATGGGGTACTCAATGCAGGAGATGTATGAGGTGGTGTCCAACGTCCAGGAGTATCGTGAGTTTGTGCCCTGGTGTAAGAAGTCTCTGGTGGTATCCAGCCGTAAGGGTCACTTGAAAGCCCAGCTGGAGGTTGGCTTTCCACCTGTCATGGAACGTTACACCTCTGCAGTTTCCATGGTCAAACCTCACATGGTCAAGGTGAGGCCTGTATGGGAGGGATTGACAAGATTTTTTGTTTTTAGCAGTTTCATATGAAAGTGCTATTTTGGCCTTCCTTGTTAAGGACTTTATGTCCATGTGTCAAGTATTTCCCTAATATCAGAAAAGAAGGAAAATGGCTTTCAATTCCTTTATATTGTATCCTATACTTAGTAA
>URS0000B6CEE1 rRNA from 1 species 
TTCCTACGGGGGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGGGGGATGAAGGCCTTCGGGTTGTAAACTCCTTTCGCTACCGACGAAGCCCTTTGGGGTGACGGTAGGTGGAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTGTCCGGATTTACTGGGCGTAAAGAGCTCGTAGGTGGTTTGTCGCGTCGTCTGTGAAATTCCGGGGCTTAACTCCGGGCGTGCAGGCGATACGGGCATAACTTGAGTG
>URS000200AAC7 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTGTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATGGGGACTGAGGTACGGACCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGGTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS00019A43BA pre_miRNA from 1 species 
AGCAGAATTATTGAGTCATATGGTAATTCTATATTTAATTTATTAAAGAACTACCAAATTGTTTTCCACAGTAGCTACACCACTTACTTTCTTACCAGCAAT
>URS00012BF748 rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGTCCGGTAAGTCGGTTGTGAAAGTCCAGGGCTCAACCCTGGGATGCCGATCGATACTGTCGGACTAGAGTTCGGAAGAGGCGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS0000AF9FF6 rRNA from 1 species 
AGGATTCCCCTAGTAACTGCGAGTGAAGCGGGAAAAGCTCAAATTTAAAATCTGGTAGTCTTTTGGCTGCCCGAGTTGTAATCTAGAGAAGCATTATCCGCGCTGGCACGTGTACAAGTGTCCTGGAATGGACCATCATAGAGGGTGAGAATCCCGTCTTTGACACGGACTCCCAGGGCTTTGTGATGTGCTCTCAAAGAGTCGGGTTGTTTGGGAATGCAACTCTAAATGGGTGGTAAATTCCATCTAAAGCTAAATATTGGCGAGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGAACTTTGGAAAGAGAGTTAAACAGTACGTGAAATTGCTGAAAGGGAAACGCTTGAAGTCAGTCGCGTCGGCTGGGGATCAACCTTGCTTGCTTGGCTTACTTCTCCAGCTTGACGGGTCAGCATCAGTTTTGACCAGTGGATAAAGGTTGAGGGAATGTGGCACCTAGGTGTGTTATAGCCCTTGGTCATATACATTGATTGGGACTGAGGAACTCAGCAAACTCTTGTGCTTAGGATGCTGGCATAATGGCTTTAAGCGACCCGTCTTGAAACACGGACCAAGGAGTCTAACATGCCCGCGAGTGTTTGGGTGGAAAACCCGAGCGCGTAATGAAAGTGAAAGTTGAGATCCCTGTCGCGGGGAGCATCGACGCCCGGACCAGACCTTTTGTGACGGATCCGCGGTAGAGCGTGTATGTTGGGACCCGAAAGATGGTGAACTATGCCTGA
>URS0000C86EDA RNase_P_RNA from 2 species 
GAGAGAGGAAGGGCGGCTCACGCACCGAAAGGTGTGAGGAAAGTCCCCCCACCGTTTGGACGCGCGGGCGTCCGCAAGGGCGCAGGGCGAGAGTCCTGGCAATTGCACAGAAACGCCACCGCCCCTCATGAGGGCGATGATTCCGAAAGGATGAGGTCGTGAGGCGGCGGATGAAACGGCAAACCCCGCGGGTGCAAGTGGGGAGTATGGTGGACGTCCAACCACCACCCCGTTGTACGCTAAGCCAAATGCCGCCAGAACAGAAGGGGGCTTACTCTCCTCACTC
>URS0000DA6093 tRNA from 1 species 
GGTGGCTCAGTGGTAGAGCGCTTGCCTCGCATGCATGAGGCCCTAGGTTCAATTCCTCAGCACCA
>URS00017E371D rRNA from 1 species 
GACGGAGGATGCAAGCGTTATCCGGAATGATTGGGCGTAAAGCGTCCGCAGGTGGCAGTTCAAGTCTGCTGTCAAAGACCGGGGCTTAACTTCGGAAAGGCAGTGGAAACTGAACAGCTAGAGTATGGTAGGGGCAGAGGGAATTCCTGGTGTAGCGGTGAAATGCGTAGAGATCAGGAAGAACATCGGTGGCGAAGGCGGCTCACTGGTCCGGTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGG
>URS0000BEF9DA tRNA from 1 species 
GACCTCGTAGCTTAGTTGGGAGAGCGTGCGCGTACAAAGCGTAGGCGGCGTCCATGCGTGGGTTCGAATCCCAAGGAGGCCA
>URS000130260F rRNA from 1 species 
CCTACGGGGGGCAGCAGTGGGGGATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGGGTGAAGAAGTATTTCGGTATGTAAAGCCCTATCAGCAGGGAAGAAAGAAGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTATCCGGATTCACTGGGTGTAAAGGGAGCGTAGACGGCCGTGCAAGCCAGGAGTGAAAGCCCGGGGCCCAACCCCGGGACTGCTCTTGGAACTGTGCGGCTGGAGTGCGGGAGGGGCAGGCGGAATGCCTGGTGTAGCGGGGAAATGCGTAGAGATCAGGAGGAACACCGGCGGCGAAGGCGGCCTGCTGGACCGCGACTGACGTTGAGGCTCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCCAGTAGTC
>URS00023DD7C2 lncRNA from 1 species 
GTACCACTTGGCGAGCTCATCGTCAGCAGGGGAGACAGCGGCAGCCTTAGCTTTGGCAGGAGCTGCAGCCGCCTTCTTTTTGAAAAGGGCAACAGTTTTGAAGGTAGCAGAGGAGGATGGAGATGGAGCAGCAGGCCTTGCAACACCGCTAAACTTGACCGGACTTCCGAGCATCTCGGAGACGTATAGAGAGGTAGCTGCAGCCATTTGTAGCTAAACGGTGTCGCTGGCAAGAGGTAAAAAAAATTGAGGTCGAGTTGATGATGAGAA
>URS00023CEA75 lncRNA from 1 species 
GCCTCCGCTTCCTTCCCGTGGCTTCTGGAGTCTTCTAGATGTAAAATAATTGCGCGTCATGTTGATATCTCTATGTAATCCCGACGTGTGGGCCTTTCTTCCGTATTTCCTGATAACCTCCTGTAGAAATAGACAAACACCAAAACTCATAGAATTCTGTCAGATAAAATCCTAAGTCTAGATGTTGATTTCATTTAGATCCTTTTCTTTGTTTATTTGATAATTAAATTTGATACTTAAGGACCGTCAACAAACTCCCCCAAGCTTACCTCTTGCTCGTCCCTGAGCAAGGATAGACTCAGCAATGGATCAGAAGTTGTTGCAATATCTTAAAAATT
>URS0001CC7192 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTAGAACGCACAGTTTATACCGTAGCTTGCTACACCATACACTGTGAGTTGCGAACGGGTGAGTAACGCGTAGGTAACCTGCCTGGTAGCGGGGGATAACTATTGGAAACGATAGCTAATACCGCATAATATTGATTATTGCATGATAATTGATTGAAAGATGCTATTGCATCACTACCAGATGGACCTGCGTTGTATTAGCTAGTAGGTGAGGTAACGGCTCACCTAGGCGACGATACATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAGCTCTGTTGTAAGAGAAGAACGGGTGTGAGAGTGGAAAGTTCACACTGTGACGGTATCTTACCAGAAAGGGACGGCTAACTACGTG
>URS0000E5BE8F tRNA from 1 species 
GCGGCGGGCTCCAGACTATATTAAGACGGGTATGATGACCTCTGGGATGATTGGAGTCTGGAGCTTTGGGATACCCGTCGGTCGTGGGTTCAAATCCCACCGGCCCCA
>URS0000E04A9A lncRNA from 1 species 
CGTAGAGCTGCTGGTCAGAGATGTGACTTGGTGTTGCCACACTACTGACTTCACTCTGAAAAGGCCAGTTTGGAAAAGAAGCAGCCTCGTGTCGCGGGAAGCATTTGTTCCAAATTCTGTGCTGGTCTGGGACTGCTCTCCAGGTCAGCCGGGTAGACCGCATCCGTTTTGTTGAGTCAGGGCTCTGTAAGACTTGGTCCTTAGACGTTTTTCTTTCAGTCTCTGCTGCAACAAAGGGTAAATTAATAATGAGGTGCAGACAAATCGAGCCAAAGAGCTTTCAAGGGGAGCAACGTTATGGTTTCAGTGCTTACGTTCTACTTTCGGTCTCTGATTCTTCTGGGGTGCAAAACCACAAAAACCTTCTGTAGAGGCTGGAATCGGTTTCAGATTGTTCAGACAAGATCATCATTCTTATTCCTGACTCTTACCAGAGGCAGAGCTGAAGGTTGAGATATTTAAAGCTTTTCTTGTGGCCACATAGATGCTAAACTGTCAGAGATGGGGAGAGAGAATAATCAATTCATCTCTAATGTAAACCCACAGAAAAGGGCTTTTCAGTGAAAAGTAGTAAAAGTTTTACATTGACCGATGCCTCTGTGAGCTATTTGAGGTGGAGATAAACAACTAAAAGGGGAAGATAAAGACTTAAATAGGTCAATAGAAGTATTTTCAGAATTGTATTCCATATGTGAATATAGAACACTCAGAGGGAGCAGTCAACAGAAACAGCAGTGGTGCATCATTTTAAGCAAAAGACCTAGATGCATTAGTTTAGGGCATATTTTAATATGGTTTTACTGGTGAATAAATCAGTGTGGTTTTCCCTTATAGCA
>URS0000DD8E81 rRNA from 1 species 
CCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCGACGCCGCGTGAGTGATGAAGGCCTTCGGGTTGTAAAGCTCTGTTGAGGGAGAAGAAAAAAGCTGGGAGTAACTGCCTGGTTCTTGACGGTATCCCTTTAGAAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAAT
>URS0000815E56 rRNA from 1 species 
TACAGAGGGTGCGAGCGTTAATCGGATTTACTGGGCGTAAAGCGTGTGTAGGCGGTTCGTTAAGTCGGATGTGAAAGCCCTGGGCTCAACCTAGGAATTGCACTCGATACTGGCGAGCTAGAGTACGGTAGAGGGCGGCGGAATTCCGGGTGTAGCGGTGAAATGCGTAGATATCCGGAGGAACACCGATGGCGAAGGCAACCGCCTGGGCCTGTACTGACGCTGAGACACGAAAGCGTGGGGAGCAAACAGG
>URS0001E053E9 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGGGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTGCGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS000084AE89 rRNA from 1 species 
AGGAAATAGATACCCTGGTAGTCCCAGCCGTAAACGATGCTCGCTAGGTGTCAGGCATGGCGCGACCGTGTCTGGTGCCGCAGGGAAGCCGTGAAGCGAGCCACCTGGGAAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACAACAACGGGTGGAGCCTGCGGTTTAATTGGACTCAACGCCGGACAACTCACCGGGGGCGACAGCAATATGTAGGCCAGGCTGAAGACCTTGCCTGAATCGCTGAGAGGAGGTGCATGGCCGTCGCCAGTTCATACTGTGAAGCATCCTGTTAAGTCAGGCAACGAGCGAGACCCGTGCCCACTGTTACCAGCATATTCTCCGGAATGATGGGTACTCTGTGGGGACCGCCGATGTTAAATCGGAGGAAGGTGCGGGCCACGGTAGGTCAGTATGCCCCGAATCTCCCGGGCTACACGCGGGCTACAATGGATGGGACAATGGTCCCTACCCTGAAAAGGGCTGGTAATCTCACAAACCCATTCGTAGTTCGGATCGAGGG
>URS0001BF7771 lncRNA from 10 species 
agctatgaggcaaataagaactagaacttgaacatttgaaaaattctcagtatacccatattgcaagaaatgatgaagcacgctctggaaagaacactaagggtgtcatgggactaacttttgctggagagattagacttgtgactcatgagttcactcaaccatctcagtagaacctctgccctcttggactgaaagggacagagatttgacaaaatgtaagaaggcagtcagacttctggaattcctgggtaggaaatgggctgaaagggctacttgacaatgaatacatatcatttttcaagaaaagcaaagcatgattttgagagtagctcagaggccagcagggCTGTGGAAGATctgcctacacactgattttggatttctagccttcagaactctgagataatacatttctgattttatacaacctagtctgtgataacttgttatggcagcactaggaaacAATGAAACCTCTCAGCGTCTTTTGATAGTGCTTAATATCATCTCAAAAATCCCTTTTACCATGACTTCTATTACACCAAGGCTTTGAGCTTGTTACTATTACTACCTGTTTTTAATGCATTTTCCATGTTGCAACCAGAGTGTTCCTTTAATTGCTTATGTAACAGTTTATTTCCAGTGATTCTGGTTACATGGAACTCCTGCATGGCTATCTGGTTTGTTtttgtttgtttgtttgtttgtttgtttgttttgagacagagtctcactctgtcacccaggcgggagtgtggtggcacaatctcagctcactgcaacctctgcctcctgggttcaagcaattctcctgcatctgccacttgagtatccgggattaaagccctgtaccaccacacctggttaattttttggtagagacagtttcaccattatggcaaggctagtcttgaactcctgacctcagatgatccacccgcctcggcctcccaaaatgctgggattacaggtgtgagccacctcgcccggccACATggctatctttacagcaatgattcagagaccaggttcctggcatcctgttgctccaccattatatagaaccacttattgatggagagggaataataagtgagaatgggggatcacgtattggagattttaatggatgggactgacctagaagcaatgcacatctatctcttcacatttcattgattagaattcagtggcattaccacacctagataaaaaagaaaaaaaaaa
>URS0000E4C665 rRNA from 2 species 
CTGAATAGGGCGCATAAGTAACAGGTCGTAGACCCGAAACCAGGTGATCTACCCATGTCCAGGATGAAGGTAAGGTAATACTTACTGGAGGTCCGAACCCACGCACGTTGAAAAGTGCGGGGATGAGGTGTGGGTAGCGGAGAAATTCCAATCGAACTTGGAGATAGCTGGTTCTCTCCGAAATAGCTTTAGGGCTAGCCTCGAGGTAAAGAGTCATGGAGGTAGAGCACTGTTTGGACTAGGGGCCCTTCTCGGGTTACCGAATTCAGATAAACTCCGAATGCCATGTACTTATACTCGGGAGTCAGACTGCGAGTGATAAGATCCGTAGTCGAAAGGGAAACAGCCCAGACCACCAGTTAAGGTCCCCAAATATATGTTAAGTGGAAAAGGATGTGGGGTTGCTTAGACAACCAGGATGTTGGCTTAGAAGCAGCCACCATTGAAAGAGTGCGTAATAGCTCACTGGTCGAGTGACCCCGCGCCGAAAATGTACCGGGGCTAAACATATTACCGAAACTGTGGATGAACCTCTTTAGAGGTTCGTGGTAGGAGAGCGTTCTAAGGGCGGTGAAGTCAGACCGGAAGGACTGGTGGAGCGCTTAGAAGTGAGAATGCCGGTATGAGTAGCGAAAGAAGGGTGAGAATCCCTTCCACCGAATATCTAAGGTTTCCTGAGGAAGGCTCGTCCGCTCAGGGTTAGTCGGGACCTAAGCCGAGGCCGATAGGCGTAGGCGATGGACAACAGGTAGAGATTCCTGTACCAGTGCTAATTGTTTAACCGATGGGGTGACACAGAAGGATAGGGAATCGCACGAATGGAAATGTGCGTCCAAGCAGTGAGTGTGAGAAGTAGGCAAATCCGCTTCTCGCGAAGCATGAGCTGTGATGGGGAAGGAAATTAAGTACGGAAGTTCCTGATTTCACGCTGTCAAGAAAAGCCTCTAGGAAGAGTAGTACTGCCCGTACCGCAAACCGACACAGGTAGATGAGGAGAGAATCCTAAGGTGAGCGAGAGAACTCTCGTTAAGGAACTCGGCAAAATGACCCCGTAACTTCGGGAGAAGGGGTGCTCTATTAGGGTGCAAGCCCGAGAGAGCCGCAGTGAATAGGCCCAGGCGACTGTTTAGCAAAAACACAGGTCTCTGCAAAACCGTAAGGTGACGTATAGGGGCTGACGCCTGCCCGGTGCTGGAAGGTTAAGAGGAGTGCTTAGCTTCGGCGAAGGTACGAATTGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCGGGTAAGTTCCGACCCGCACGAAAGGCGCAACGATCTGGGCACTGTCTCAACGAGAGACTCGGTGAAATTATAGTACCTGTGAAGATGCAGGTTACCCGCGACAGGACGGAAAGACCCCGTGGAGCTTTACTGCAACCTGATATGGAATGTTTGTACCGCTTGTACAGGATAGGTAGGAGCCGAAGAGACGTGTGCGCTAGCATACGAGGAGGCAATGGTGGGATACTACCCTGGCTGTATGACCATTCTAACCCGCCACGCTTAGCGCGTGGGGAGACAGTGTCAGGTGGGCAGTTTGACTGGGGCGGTCGCCTCCTAAAGAGTAACGGAGGCGCCCAAAGGTTCCCTCAGAATGGATGGAAATCATTCGCAGAGTGTAAAGGCACAAGGGAGCTTGACTGCGAGACTGACAAGTCGAGCAGGGACGAAAGTCGGGCTTAGTGATCCGGTGGTTCCGCATGGAAGGGCCATCGCTCAACGGATAAAAGCTACCCCGGGGATAACAGGCTTATCTCCCCCAAGAGTCCACATCGACGGGGAGGTTTGGCACCTCGATGTCGGCTCGTCGCATCCTGGGGCTGTAGTCGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGCACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCCTATCCGTCGCGGGCGCAGGAAATTTGAGAGGAGCTGTCCTTAGTACGAGAGGACCGGGATGGACACACCGCTGGTGTACCAGTTGTTCCGCCAGGAGCATCGCTGGGTAGCTATGTGTGGCAGGGATAAACGCTGAAAGCATCTAAGCGTGAAGCCCCCCTCAAGATGAGATTTCCCATTTCTTCGGAAAGTAAGATCCCTGAAAGATGATCAGGTAGATAGGTTTGGAGTGGAAGTGTAGCGATACATGGAGCGGACAAATACTAATCGATCGAGGACTTAACCAAAA
>URS0000CB5B26 rRNA from 1 species 
AATGGGGGAAACCCTGACGCAGCAACGCCGCGTGAGTGAAGAAGGCCTTAGGGTTGTAAAGCTCTGTCATATGGGAAGATAATGACGGTACCATAAGAGGAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCGAGCGTTGTCCGGATTTACTGGGCGTAAAGGATGCGTAGGCGGATATTTAAGTGGGATGTGAAATCCCCGAGCTTAACTCGGGGGCTGCATTCCAAACTGGATATCTAGAGTGTCGGAGGGGAAAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGAGATTAGGAAGAACACCAGTGGCGAAGGCGACTTTCTGGACGATAACTGACGCTGAGGCATGAAAGCGTGGGGAGCAAA
>URS0001773291 rRNA from 1 species 
TACAGAGGTCTCAAGCGTTGTTCGGATTCATTGGGCGTAAAGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTCGGAGCTTAACTCCGAAACTGCATTTGATACTGCCGTGCTTGAGGACTGGAGAGGAGACTGGAATTTACGGTGTAGCGGTGAAATGCGTAGATATCGTAAGGAAGACCAGTGGCGAAGGCGGGTCTCTGGACAGTTCCTGACGCTGAGGCACGAAGGCCCAGGGGAGCAAACGGG
>URS0001DB2352 tRNA from 1 species 
GCCCCAGTAGCTCAGCTGGTCAGAGCGGTAGCCTTGTAAGCTACAGGTCCCGAGTTCAAACCTCGGTTGGGGCT
>URS0002395A25 lncRNA from 1 species 
AATTTGTTTGGTTATTACCCTCTTTATTCCTTAATTTCTCTTCCAAGTCACGTACAAGAGTTGATACCTCCCTGGTAAGTACTCCGACATGAGCCAAGAGATCAAAAAGTTTGTCATGATGAATAAAGTCCTTGGGCATATCAGAAAGAATAAGTAATAGGAACTCCATCATGACATGAATGTTTCGAGCCCCTGAAGTGCTAGGGTGAATAACAGTTATCATATGCTCTTGTAGTTGAATGATATATTCTCTGAGAATATCCGGTGAGGTTTCCAGGAGCTTCTTAATGAAGCGTCCAACTTCTGCTGAAGTTGAAGCTTTCAAGTTTGTATAACATATGTGCATAACCTCCATTTCAGTCGGAACAATCTTCAAGAGTAGCTGGAAGAGTCGAGAGTCTCTATCATTCTGATCATCCTCATCTGAGTCTTCATCAATCTGATCCTCCCAAAGGAAGTGTCCTACTCTTTCAGCCATCAGTTGAAACAGAGGTAAGACATTCTCAACCGTCTCATGCTTAATGCAACCATTCACTATCAACCCATGGAAGTCTCTTATGTTGCCACATACATTCTGAAGAACTTCATATTGAGTCACTTCAGGAAATATCTTTTCAGCGTGATGCTTGGATAGATGATACAGATTCAAGAGGAGGAAGTCCAATTGCTCATCCATCATGGTGGCATCTGATTTATAAGAACGATGATACAAGCTGATACAATCATCCATATTACTAGTGAGGCTAGTAAGGACATCATCATCCAAAAGTGGTTGAAGCAGATTCTCAACCTCTTGTCTTTTTCTCGTCATTATATCTTCAAACTGCTCAAAATTGGAATAAGAAAGTTGAACATATGTACAAATAAATGCCATTTTCAATTTTAGATTTTCAACTTCATCTTTGTCAAGAGATTTTTGATTTTCCTCATTCTCTAGGAAAACCAGAACATCGGCAATGTCCTTGTTAAGAGCAGAGAATAACACCTGCCAAAATAATACATTTTAAAGCCACATATCTATAATTCAATACTTTACGGTTTACTCTATAAAATAACATACCAATGAGTTGTTTGCTTCTTCATTATCTTTTCGTTTTTCCATGATTCTACTTTTTCTCTAGACCTGATGAATAAAAAGTAGATAAAACTTTAACAGGAGAAAGAAGATGAAAAGATAAGAATAATCAATAATATCACTATTTTCACACATAGTAATTTTAGACTCGCACAATTGGAAATGTCAATCTTAATCACACATCAAAATGTTTATGACATAAAATCACAAACATAAAATCTCACAACTGTTAAGTAAAATGTCATTAAATTAATAATCTCTCTAATAATATTTTTCTCCTATCTCCTTGGGCTAATGGAAAAAGATTACTCTTTTATTTTGATAAAAACTAGTCTTCGGAACTTGCATCGCACGTCTGTCCCCTAATTGATATTAGTAAATTTTAATTTATATAGCTATGTTCAAATGTATGTCCTTTCATATGTAAGTTTAACATAAGAATTTAACTTTGCACAAAGTGTAACATGAAAATCTTGTGTTAGATGTTGGAGGTCTGATATATTAAATACTTCATGAAAAATGAACATTTATTTTATCAGAGGAATTAATATATTTTAATTATTAAACATAAATTTTAATAATCAAAAAAGAAATTGTCTATAAAAAAGATACGTATAAAGAAAAATATTACAAAATGTTTGGGCGGTATACCATCAAATTTATAGAAAAAATTAAAATTTCAAACGAAAAAAAAAGAATAAATAAAGACGTCGCATCCATAAAAAAAGACATCACATTTAAATATATAGACAAAATATTTTCATACTAATTGAATTACATTTTGTTAAAAGTAGACTTATTCTAGACAAAACATGCCTTACTCTAGACGAAACATATCATATGCATAAAAAACTATAATCATATATAATAATAAATAAGACAAACAGAAAAGAAGACATGAATATGTTAAGAATAAAGATAAATTGTATTTCTTGAACTATATATATATATATATATATATATATATATATATATATATATAAATGAATTCTAAAATAATATTATTCAATATATCATTTAGTCATTTTTTACTATACATTATTTTATTTTATTTTTTTACTTTTGCACTTATTTTGTACCTCTCTATAACAATTAAGTGCATGAATTTTTTGAATATTTGAGATTACATATAAAAAGGAAAAAGTACAAATATGTTGGTTTAAAAAGATAAATGATTATCAAACAATGAAAAATACATAATTATTATTCTATGGGATTTAGCATGTTTACCCTCAAAATAATTAATGATAAATACAAAATGTGATTAGCTTTATTATATATATCCTAAAAATAGAAGAAAGGATGAATACAAAAATACAGTAATTAACTACAAAGTTATATTTAAAAACTCAAAATGATAGAGATGTGAAAAATAAATATTTACTTACAACTTCATGTTGGAGTATATTCATCTTGTAACTATCATAGTTTACATATTCCTCAACAAAAAGAAGATGAATATGTATGAAATTTTAAAGGATTAAATAAAATAGTAAGAATTCTTATATTTACAAACTGGTAATGAAAATTTTACAAGGGAGGTAGACTAACCTACTGTAGTATGCGAGATGATTATAAACTTGAATAAAATAAGGAATATATATAATGTGGTGTGAGCGTGTTTGATAGACTCTTCATTACCCCCCACTTATCTTACAAATTAAAGTTGAAAGGTTATTAGACTCTTCATTATCTACATTTAATTAGTACATGAATATATGATGCATTAAGATCTTATTTGACTTAATATTTAATTAATTAAATAGATATTAATATTAATTTATTTTAGAGGTAAAATAAGGTTAAAATGATAATTCAACTTTGAGGTTAGAAGCTTCTCACTTATAATAATAATATATGATAATAGTAAGATTTTTTGTGAGAGTAGCTGAAATAGAATCAATAGAGATCTCCGATTAAGCATGTTCATACCTTTTTGACATATTTTTGTTAGACAGGTTGAAGTAAGAGATTGAAGTCTAGATCTAGAATTGCAAGATTAATAAAATACAATTCATTGACTTCACAAGTCCTTTAAATACCAAAAGTGCTCACTTAATCATTAAGTTTAGCAAAGAAGAAGATGGTACCTTTACACAAGCTGAAGTTTAGCTACAGAACCCTTTGTTTGAGAAATAATGCTGAACCTATTGGAGAAAAAAACAAGTGTAGTAGTTGAAATATACAATACAAGTCTTTTAGTAATGAAATATTAAAACACAAACCCATAAGTCTTTTTTTAATCAATGTCTTTTGTCTTTCAATTTTTATACTGGCGAAGATAAAAACAAGTGGTTGTCATTTCATCAAACACATTGAAGACATTGGCAATTTCCACATTATAGAATTTAATACAAAATATCAAAACATGAATTCTTGAAATGGAGTATAATAATTATTTTCTTCACAATGAATATACGTACTATATGTGTATATGTTCAATATAACCGGAGAAAACATTGCCAGAAAAAATAAATAACAGAGTTTAAAATATGTACTCAAAAACAATAATTAATATCATAAGTATAAATTAATGAGGAAAAAAAATTATACCGCGATACGAAAAAATAGAACGAAAAAAATTGAGTCCACTGAATGCACAATGTCCTCTTAAGGAAACTACTATTTCCCTCCAATTCCGAAAATTTAAAGAATTACATCCTCTTAGGATGAACGATGTTATTCACCCATATGGGTTCGGCTCTGGTGGGCGCCCACCCAGTGACTCTAATTCCTAAATTCGTCTATACTGTCAGTAACTCATTCAACAGCATCAAAGTAAGTACATGAATATTTAATTTTGCAGAAATAAAAGAAAATGATTATAATTGTTTTTTGTTTTAAAATAAGGGTGTGTAGTATGAAGGAAAACATTTCTCGGAAAATATTTTTTCAATTTTCTCATATTTGGTTGGATGAAATCATTTTTCTCAAATTTAAAAAAAAAAAAGACTTCCTTTCCAAACTTAAGGAAAACATTTTCCAAAATTCTTTTCTAACCTTCCCCTACCCACCACCTGCTAGCCCCCCACCCATACCCCTAAAAAGTTTAAGTTTAGTTTTTTAAAATATTTTAACTTCACAATTTCTTTTTTTCACCCCTACCCTCGACCCCCAACCCACCCCCTACCACCCCCATCCCCAAAAAAAATAATTTAAGTTTGTTTTTTAAAAAATATTTTAAACTTAAAAAATTTATTTTTTCACCCCCTACCCTCGACTTACCCACTCCCTACCAGCCCCCCTCCCCCCACCCCCCCACCCCCTCTTCAAAAAAAAAGTTAAGTTTGTTTTTAAAAAATATTTTAAACTTCAAAATTTCATTTTTTCACTCCTACCCTCGACTCCCCACCCCACTCCACTAGCCCCCTACCAGCGCACCCCCACCACGAAAAAAAATTTTAAGTTTGTTTTTTTAAAAAAATAAATTCAACTTCAAAAATTATTTTCTACTCTAGTAAAAAATAAAGATATTTCTCAAAAGTATTTTTCATTGAAAAAACAAACACTAAAATATTTTTCTAGAAAATATTATCTACTGACCAACCAAACATCAGAATATAAGTAAAATATCTACCTGTTTTTCAGAAAAACATTTTCCAAGGAATTTCCATCATACCAAACACACCCAAGAGTATATTCCTCTATTTATAGACAACAAAAGGTAATGTGAACAAATATTTATTGTGCCTTATTAGAAAGGATAGAACTATTTGTAAAAATTGCAACCCTTCGGAAAGTTTATAACGTTTCATAAAAGTCGCAACTCTTCATAAAAGTCACAACTCTTCATTAAAGTCGCAACTATATACATATATACAAATCTTATAGGGATGAACAAGTTTGAACAAGTTTCAGTTTTGTAAACTATCTTGATCTTCGATTAATTTCACGGGATATATAGATCTAGATCTACATGTACAAATAGTTTATCTTCTTTTTTTTGAAAGAATTTTCTTGTGTATTATGTACGAGTATAAATATACAGGAAGAAATGCAAAATTTTAGCACAATATGAAGTGTCTAATCAATCTTGATATTTAAGCACCCAAATTCAGTATTTCGCTTTGATAGGTTCATAATTAAGAATCAAAATAATAATAGAGACTAAAATAAAATTCATTGACTTTTCAAGTCTTTTTCATCAATTTTGTAAATATGTATATTCATATTACAAGTTGATAGACTTGTGGAGATTGTTAATTAGCTTGTGAATGAAGATGATGTGTGTGTAGATCATGGATTTGAGCCACTAATGTTTCTATACTAATGTTGGGTGTAGGCTGCGTTCTTGTTAGCGGAAACGTGAAATTAAAGAATAAGGAAGAACAATAATGAAAATAAGAAAAGAAGAAGAGAGTTTTGAAGCATGAACTAATTACCTCTGCAATATTAGAAGCCCTGCTCCTTGTTTCAGAAACAGAGTAATTGTTTGCCAAATGATCCAATTAATGTAGTTGAAACAAGATCTGGACTTTATTATTATTATTATTATTATAAGTCTTGTTATTCACATAGGAAGATTCCTAAATGAGATTATTAATTCAACTGGCTAACAATGAATTAATTACTTGAAAGGCCAACTTAACAAGAATAAAATATATATATATATACATCTTGACAGTTTGTTCATTCATAATACTAAAATACAATTCATTGACTTTTGAATTATACATCTATCATCTTTTTGGTGCTTCTAATTTTGAGTGACAACGACATTATCATATGTTACTTTTCTATATTACTGAAGTGGAAAACTCCAAAAGTTAATTTTTTTAAAAAAAATAAATAAATTCCATTTCCAATTTTTATTTTTTTTTAAAAAAAGAACATCCTTCGTTTCAGAAAGAATGATCTAGTTTGACTTGGAACGGAGTTTAGGGAAAGAAAGAAGATTTTTTAGTCTTGTAGTTCTAAATTAAAATTATGTCATATGTACCAAAATGTCATTTAATCTTATGGTCTTAAACATGTTACATGAAAAATTAAAATTAAAATATTGTCAAAAAAGGAAAGGTGTCATTCTTTTTTAAACAAACTAAAATTGAAATAGGAACATTCTTTTTTAACAAGAATAATATATATATATATATATATATATACTAGTTTGTGAGGACGTGCTTCGCACGTGTGTTTCATGTGACTTTTTATAGATACGTTAGAATAACTAAAATCTCATGAAAATATATATATATATATATATATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTATGTATGTATGTATGTATGTATGTATGTATGTGTGTGTGTGTGTAAATTGTAATGAATAATAAAATGTAACAACTACAAAATTAAGAAGTCTAACAGAGTAAAAAAGATAAAAAGAAACACAATATTTAAGAAAAAAATACAATATAGACATTATTCTTATAAAATTGATGTATATATAGATGAAAAAATAAGTACAAAATTAGTACATAACTCTTTTAGAAAACTAAATTAAGAAGTCTAACAGAGTAAAAAAAGATAAAAAGAAACAGAATATTTAAGAAAAAATAAAATATCGACATTATTCTTATAAGATTGATGTATATATAGATGAAAAAATAAGTACAAAATTAGTACATAACTCTCTGAGTTTTTATTGATTCCTTTCATATCCTATCAAAATTCAAGAATCTTCATCATCTGTTTTTACTATAGAATAAAAATAATATCCTAATAATCTTGGTAGGGTTTCATGAGATAAAGAAGTTGAATTTATATAAACAGAATAGAAGGAATATCAAAAGATATCTTAAAGTTTTAGTTTAAATATTTGGAAGTTATGAATATGAAAAGATGAGAGTTATGAATATTAAGAGTATAAAAGTTAAATAAATAATTAGAAAATAATAATAAATAAATGAAAGAATATGAAAAAAAATTAAAGTTAGCAAACCATGTAAAAAGAACAACTAAAGTTCTTATCATGTAATTAAGCATTAATGAATTTAAATTTGTGAAGCTAGAGTCATTCTTTAATAATAATTAAGAGGACATTATTAAAGTGCATCTCCATTTTATAGATTTGCACCCTTTAAATTATTAAATTTAGTTATTTATCATAAAGGATAATACTTTATCCACAATTATATTATTCATGAGAGGGGTTAAGAAAAAAGTTATAAGAAAAGGAAAAGAAAAGAAATTTAGGTAAAGATTTTTTCTAAAAAAAATTATAATTATTATATACACATAGATTATAGATGATAAATATTAATAGATTAGATATTTAATTAGTAATTAATCTTAGGAAGTCCAAAAGTCATTAACATTTAATTAAATTTATACAATCAAATATTAAATATTTTATAACAATTTAATTTATAGTAAAGGTAAAAGCGTAATTCAACTTTCAACTTTTTTGTTCATGCTTTTAGTAATATATGATATATATATTGACGGTTTGTTCATTCATAATACTAAAATTCATTGACTTTTGAATTATACCTATCATCTTTTTTTGAGTTACCAACGTCAGGGGCAAATGTATATTGTCGAGACATGAATGATTTGGCTTTTAGATGAGATGGTCACATATATAATAACTTTAGGATCCACCCGAACCCAATGAGTCAATGACGATAGATTTTTCCTGTAATTAACTTTAAGGTTGATGAGGTGAAAGGAAATTTTACTCATTTCTACTTAATAAATTCAGTTGAGACTTTTATCAAACACATCTTTTAACATTAGCGGTTTTCACTACAAGACTTGATTTTTAAGCAGCAAAAATGGTTACTTATAACAATAGAGAACATGTTATAATGCTGCTGTCACTTAAATTATGCTCCATAATTTTCCTTTTTGATTTTTGTTAATCATGCTGACTGGATTAACTTGCACACATTTCAATCAATTTCACAAGATACCGTTCACTTTCAATTTGCATGCACTTTGACTAATTTCATGCTTAACTCTATTCGTCAAAGACATGGATAGATTATAGAAAAAAGGCAAAATACATAAATATGTCCTATTAACTTGACTTCAAATAACATTTATGACCTTCAACTTTGGGCATGCACAAATACACACTTAAACTTGTATAAAGTTTATCAAATAAACACACATGTCCTATATGATATCCTACATGTAATTTTTTGTCCTACGTGGTGTCCTGTAGGACTCGTGTGTTTATTTGTTCTATTTTATATAAGTTTAAGTTCTACTTGTTCATATTCAAATTAAAGTTGGAGGACATAAACGTAAAATGAGGTCAAGTTAAAAAGTACATTTATGTTATATGCCAATAAATCACCCTTTTCTTGCTGAACTGCATTGCTCGCTGCTCATGAAAGAGTATTAATTTCTTATTTTCCATGCTATGTATGATCAAATTTTGGACTATTTTGATAAAATAAAAGGTAAAAAAAGGCTCAATATGTTGAATATTTTTGGGTGTGGAGACGACGGGGCACTATCGATTTCTCACAACTTGAATTTTATTATATCAAAGTAAGAACCCGATACAGTCTTACAATCTTTACAACACTTGTTGTTTTCTTCAGCAACACTCTTTACTTGAGCATTCATTCTTGGTTGCTCTCTTGCTTTTATTACTTTGTTCTTGCTAGCTTGCCTACAACTCAAATGGACCACCTCTATTCACAGGAGGTGATAGAACAATCTAGCTAAACATATTTTTCTGCTATATCATAGAATATTCCTTTAATTACTTAATTCTAGAATTACCCTATCTAGAATACTAGTCTCTCTAGAATACACATTTAGAGATCTTCCTCAATTCTCCATAACTCCGGAATATTCTAGATTTTCTTGACTTGTCTTGAGTACATAATTAAGTTGGCGATGAATTCTTTAAAAAATATATTATCGAATTTTGAGAAAAAGTTTATTTATGTAGCTTGACTCATTTATGTCATTGTCGTTTGAGAAAAGACATATTCATGCTATTATTTTTTAGGCATATTACATGAATATGCCCTTTAACTTGATCTCCTTTCACATTTATGTCCTCCAACTTTGAATGTGCACAAGTACACACTTAAACTTGTATAAAATTAAACAAACAGACACAAACGTCCTACTGGCATCCTACATGAAAATTTGTGTCCTATGTGGTGTCTGTTAGGATTGAATTCACGCACTCACACTTGATGAATGAAGAACACAAGAACTTTCGAAAGAAAGAGATGAGAGATCTAGAGAGAGAAATATAAAATCCAATATTTCGTGGTAACACCCCGTGAGTAAACTTCCACGGTGGTGAGGTATATTTATATTAATAAATCAGAATATTTTTTATTGCAGAGAATAAATAGTAAAGCCTAAAATTTCCATAACCCCTGGCAATCTCACCGCGGAGGTTAAACCACATAAACAATTATATATATTAATCAAGCTCCACAACCTAACAGTGTCTTGCATGTATTATGACAAGTAGGACTCGTGTGTCTATTTGTTCGGCTTTACACTAATTTAACTGTCTTTTTGTGCACACTCAAAATTGAAGGACATAAATACAAAATAAGACTAAGTTAAATGGTATATTTATGTATTATACCTATTTTTTAATTCCAATTATGCAAAATCATTTTTTAAACCTGACCATTTATTATTCGACCACATCATTAATTTTAAAACGTGAATAATCTGACATATTGTCTTTGCCAATTTATCCTCCCAAATTGGGATGACACACCCAATTTTTATATTCTATTAATTGAGTATTGAGTACTGAGGTGATTTCTAATTAACATAAAATCATATATAAAACTATAAATATAGAAACATGTGAAATAAGATGATTATATGGTTACTAACATAATAAGATATGATTTGTAAAAAAAATTTATACACATCAATACAGTAAGGTTATTTGCTTTCAATTTCTATTACCACTTAACAATGAAATCAATTAATTAGCTATAAAGAGGCATATTTATGTAATTTCTAAAGAAAAATGGAATTGAGCATATTATTGTACTTATTTTATTATTTAAACCAAAAGTGACAAAACTTAAGGGACTAACTATTATATTTGAAGGGTACAAAATGGATACTATCCCTATACATAAGTGATAATTTTGTCTTAAAAAAGAACTCTGATTATTTCAGTTGCGATTTTGGTAAGCAGAATCTTGATCCTAAAAAGAAAAATACTTCATTATGATTTCTTCATTTTGAAGACAAGTTTGAGTTTGAAATTCTCATCGTGTTTGTCACCTACTATGTTTGAACTTCACCTCATAAGTTAAGTTCTATTTGTGTTTGTCGAACAATAATTGAATCAATGACATCTTTTGCCTCATATGCCACATCTAAAACACGTGGCCAGAGATCCTTGTACCATTCTTGCTCAATATTTCTTATCCATTCGAGGTCTTGTTTCACCAGCCCAACTTCTTCCTTTATCAAAGCAATTGAATAAGCATTGGAATCCAACAAATCATCTAAGTGTCTCTGTAGAAGATGCATGAAGAGAGGTCCATGAATGATAAACATGTTTGAGATAAACATCGTTCTACAACTTGATTTAGAACGATGTTGTGAGCTTATAATCAATATTATCCCTGAGGCTAGCAAAGGACACGATGCATGTCGTATTTACATGCAACGTTGTTGTCAACATAATATAAAATTGATTGAATCAGATTCTCAACCTCTCGTCCTTTGGCAGTCATTACATCTTCAAACTACTCCAAATCAGAACATTTCAGCTTTTCAACTTGATCCACATCAACAACTTTTTGATTTTTATCATTCTTCAATCTCTCTAGGAAATCCAGAACATCGATAATGTCCTTGCAAAGAGCAGAAAATAATACCTGCGAGAATAACACATATCAAATTTTTAAGGCCACACGATATCTACAATTCAATACTTTACTCTCTATCAAATACTAACATACCAATGAGTTGCTTGCTATTGTCGTTTTTCCATGATTGTAATTTTCCTTTCAAGTTCTGCATAAAAAGTACACACAAACTTTATCATGTAAGAAGTCACCCTGCTTCTCACCTAGTAAGAATTCACACTTACCGGATGTTTAATACCAAACTAATACAACTTATCATGGGTAGGTAATGATTTAATAAGGTGAATATAAACATTAACTAATCATAATTAAGTGATAATGTTGTCAGTGACGGAGTCAGAATTTTTGCCAAGAGTGTTCATACTTTAGGAAAAAACAGAATAATGAATAAAAAAATTGTCACACTTGGGCTCGAACTTGAAGCTAGAGGTATTCTTGCACAGCCTTAACTGCTGGGCTGACAACCTTTATTATGTCAAGGTTGTTCAACAATTAGTATATATCTAAAAAAAATCGATATTTAGTATATATTCGGAAATTTTTTTTGATGAAGGTTGTTCATCTAACCAACCTTGTCAAGCTATAGCTCTGCCCTGAATGTTGTGCATCTATTGATTTGTTGTAAATCGATGGTGTTAGTACGTATTTAATTCTCTCTCTTTCTCCTGCATTTTGTTTCTGTTTATAGATTTCATTTTCCTTGCATCATTTTTTACTTTTCGATAATTTTACTTCAATAGAGATGAGAGTAGCAACCTTTTTACTTGATGATGAAACTATATATCCTTTGCTTGCTTTGATATTAGATTTATAGTGCTCAAAATTCTTGAAGTAAACAGAATACGGTGAAAGAGAGTGAGCGCACTCTGCCTACATTCTTGTTCTTCAGGATATAACAATTCAATAACGTCGGTATAACTCAAGAAACTTCGAATTAATTTAATAGTCCAAAACTTCACAAAAAAAAATATTTTTCTTCAACATATAATTATTCTCTTTTATATAGTGAATATAGTCGAAGATTTTAGAGTATTTTTCTTTGTCTCGACTCTATTTTCACTATATTAATCTCAATATAAACACAATGTAGTATTCCTCGTCTTTTTCACTCCACATTTTCTTGTATATCTTTTGTTATCAAAACAAAGTAAGACCATCACTATTCAATGGTGATACTTCCTTGCAATAAATAAAAAGATTATAGAATAGTAAATAAAGTAAATAAATAGTCCAAAAGTTACACAAATTACAAACATAATGTATTCGAATAATAACATTCAAAATTCTTCTCTACTATATTAAACTTTGTTGTTTGAAATAAAGTCAAACCTTAAAATTTTGTGGATGCAAAATTCTAAAATTTAAAAATTACAGAGTACTAAATTAATAATTTTTATATATTCAATAAATTTCTTACTACAAATTACTCTTATATTAGAAAAGGCATGTTCAACATGCCTGCTTCATAGGTCTGAGGGTATTTTAGTCTTTTTAGTACTCCATTCTGGCTACGTGTCCTGTTGTTGTGCTTTCAATGTACACGTTACTGCAGACTACCGATACATCAAAAGTTCTCCTTTCTCCAGCATTCTGTTGAGGTAAGCTTCTTCATATGATTTCTTTGGTTTTTTTGTGATCTTCTTTGTTTTCCTCAAAATTGATGATTTTTTCTTCTTTTTCAGTTGGTTTTAGTGTTGATGTTCAATTTTTGTTATGTGGTTGTGTTTTTCCTGTTTAATTACTGATTTTTGCTTTGTTTATTACATGCAACAATTAATTTAGTCTGTCTTCATCATAATTCTTTTGAATCTTATCTGTTCATAGATGGTTCTTTGTCGAAATTAACTTTTTGGGTTCCTTAATTCCAGTTGTTTTTTCCATCATACTTCTTTTGGACTTCCTCTGTTTGTATATGTTGGTTTTCCATTGGAATTAACTTTTTGGGTTTCTTCATTTTAATCATATACTGTTGTGGGTTTCGCTTCGAGTTCTTTTTACATCATTGCATTAACTTTTTGAAATTATTTTAATTTACAGTGTGAAAATTTAAAGATCTGCAACTACTTATGCCAGAATTTGAACTATCGATGTGTCTTCTTAGCAAATTCAAGGATCTGGAACTACTTATACCAGATTTGAACTACGGGTATGTTCGTTGATGGTTTCTTACGCCCTTTATTCCGATTTTGCTCTTTGTCCTACATTAGATACGTCTATGAGCTTTCTTGCTAAAGTGCATCTTCATTATCTGAGTTGTGTGTACTGAAGGACCTGAGAGAATTAGAGAACCGATTATTATGGGTGCTTCGTTTGGTCATGGGGAGAAAGTCAATCTGCATCTAGCCAGGGAAGCTGGCCACTCCTATTGCCAAATTGTCCGTGCTGCTAATATGAGAGTCAGAGAGATAGAAAAGGCTCTTATTAGAGGCAATCATTGAGTATCCTACAACACACGTGTTTCAACACCATTTGCTATAGATTTGTTGACCAATCAAGTAAGTTTATTCATTTATAGCAACTGTTTGTGTTGGTTATTATGGAGAAAATTTTCTGTTCTAGCATCAATTTGGTCTGAAATGAAGGGTTGTTGCTTTAATCTAATCAAACTTGGAATTATTCTTTTGCTTATGTGTCATAGTTGATTCGAATGACATGCATTCAAACAATTGCTATGTTGTCGATGTCTTAAAGATATTCATGTATTATGATGTATGAATTTGTGTAGGTGCACTAACTATGATTCTAATGATGTATAAATGACATTTAACGAAGTTTCGACCCGACTATATGTGATCTGTATGTTGTGAATATTGTACAATGATTTGCATATGCTATTGGTTATGATACTTGACTTCATATGCATACCTGAAAAATATTAGATCTCACCTATATAAGTGCTCCCAAAAGCTCTATTAATTGGCAATATTACTTACTATTATTGTGTCTTAAAAATAAATTCTCAACAAAATGGGTTTTCAATGAGTTGTTGAACTTCTGCTTGTCTTACATTTGTATTTTCCTATTGGCTCATTTGTTTTTTTTAAAAAAGATTCATTGGCCTGTTCTGGTGAAAAATATTGTCAATAACTTAGAGCTATTGGAGTTAGCAATTTCTTTATTGAAAAACTGAAGATCTTCTCGAAATAGCTCTTATTACTCTTTTTATTAATCAAGTGGAGTGTCAATGGTATGATCAAAGAGAAGGTAATTGTATATGACGAGAGCTGATACATGAAAAATGCATTTTTTGAACTTGTCAAGTCTATCAGTGAGCCAAAATTGTGTTGTTGTTGTAGTTATAACTTATTATTCATTACAGCTGCATATAACTATGGCTATAGTATTATTGATGTAGTTACTTTGTGAAGAAGGTTGACTCATCATCCAACTTTATAGTGATAATTAAACAAGTTTATTTACTAGCTCTTCCTTTTGATTAAATTAACATAATTTTTTGTGTAGTTGTCCATATTAATTTTCAGGTTTTGTAAAAAATTGCATCCTTTATTTTCCTCTTTACTTTTTTTTCTATTTTTTTATTTGCTATTTGGATATTAATTGTTAAGTGTTAATTGCTATCATTTTTTATGCTATGCTTAGTTTGTGGACTAATAGTTCAAAGAAGCTTAGCAGTCGTCCCTATTCTAGAAATTGAATGGTAATTCTATATTTTATACTGTTAAATTTATATATTATCAGCTTAGCTTAGTAGGAGAAAGTTACAACATGTGGGAAATGAAAAGGCTAGAAATACTCAAAAATGAACCAAGCAAGTCATGGCTTTTGTTGGCTTCTGCAATAGGAATGAGATTACTATGCTAAAATAGAAAAATGAAGACCCCTTTGTAGAATGCAACATCATTATTTGTTCCTTGCATAAATAATCTAGCCCAAATTTTTTTGTTCCTTGCATAAATAATCTAGCCCAAATTTTTTTGTTCCTTGCATCAGTGTTATTATCCATGCTCTTGAATAATTAAAAGCATAATAGTTGCTCCTCTTTTTGGCACAAAAATACTGAATTCATATTATTGTGAGTTGTTTTTAGGAATATTATTAGTTGGCGAACAAACAATTAATTTTTGTTCCATATTTTCAAGACATCCATAAAGTTTCATCCCTTTAGAATATTGAAGGAAAAATATATCGCTGAGACATTTATTTGTTAAAGTAATTCATGGTTTGTAAACATCTTTTATTGAACTTGAAATCCTAATGTTTCTCTATTTAATTAAGGTAGAACAAAAAATGAGAAGGTATGTGCAGGTTTGGACAATGCGATGAGATGTGTTGTAAGAGTCATGTTCTGAAGGATTAACAATGGAGTGTTTATATTGTTCGTGCCCCTGACTCTACTTGCTATGTGAGGTTTGTCATCTCTCCGTTTTATCACTTTGAATTTATTATATGGATGGTTCCTCACTCTTTGAAAGTGTAAAATGTTTTTGTATTGATATTGTGCTGCTGTGACTATGTTTATTGATGCTCTTCTTATGGCCTTTTAGTTTCTATATTTGTAAGGAGTTTGAGATTTTTATTTCAGGGTTTGCCAATTGAGGATTTAGGAGTGCAAATGTATTCTTTCATTTCACAGCTGAGTTGAGCAGTCATATGTTATTGTTGTGCGAAATTCGAGATAATACGTGAAAATATAAACGCAAAAAACAAGACAACAGATTTACGTGGTTCACCAATAAATTGGCTACATCCACGGGGAAGAGAGGGAGCAGTTTTATTATGGAGAGGCAAAAACAGAATTACAGAATAGGGTTTGCCATAGCGTCTATATATAGTGCTAAGCTACGCCCTAACAGACTTGGGCCCAACATACAGAATTGACAGATAATTAAGGGCCCAACAGCGAGACCCCCGTCCTTTCTGTTGTAACGGGTCCGATTCAAGGCATTCAACAGTTATGATTAAATATTTCTATTTCAGATCCTCATACTACTTTTTAAATTACTACTGAAGTTTAGTAATTTGATTTCAGTCGTAGTTACGGCATGAGTGTGTTATCTAATATTTATATTCTATTTTTGAGTTAGTTTTTTATGTTAGTTATGTTGAAATTCATTTTATTAACATGATATTAAAATTATACCAGCACGTCCATGTTGTGTGATTTTCAATATTTATCGCCCTGCTGTGTTGGTGTGATAGGGTGTCTCCATAGATTTCCAGAGTGAAATGTTGTCTACAAATGATGGATAATAATATGCTGCGGCAGAAATGTTGAAGTAGTATATCAATTTCTTGCTCTTCATTATTAAAGAAAAATTAGTTAAGTAGTTTCCTCATTTAAATTTTAGTTGTTTAGTAATAATTTAGAATGCTAATACAAACTTTATACTTGCTTCACATGATGAGGCCTCAACAACATTGGTCTATAGAGAGTTCGTTTCAATGGTTTTCAACAAGGTGTTTAATTTGTTCCTACTCTAAAATGAATGTGTTAAAGGAAACTTAGACTGAATAAGAGGTTAGACGTATCTTCTCTTAGAAACACCCCTAAAAATTCAAGTTAGTGAGACTGACAATACTATCTTTGATTTGTAAATCAGTTTACTTTATTAGTGAATCGTGAATTTGTGATTAATAAGATTTGTAAATCAATTGTTCCAAGTAAAGTATAAAGAAACAATTTATATGCTACCAAACTTTGAACCATGAACTCCTCAAGCCATGTGTTGTGAAATATTGCTTTTGAAACTTTTGTATGTTGAAGTGTTTGTAACAGATGTAGGATGTGGACATGCTTTCTTCTCTTTATTTTTCTAGGGAAGTTGAGGCAGAATCTGAGAGTGAGAAAAAGCCTAAACAGATTTAAAAACTATTTATTTATTCATCATGTAGACTATTTAATTAAAAAGGAATACATCTTTAATTAAATGTAACTAAATCTGTTAGAACAATATCTAGGAGAAGAAGCTAAAATAGAATACAATAGACTACCAACTAAAAGGTTATACCATATAGAATTAACATCCTCTAAATAAATCAAAGTTACATAAGTTAGGAATTCCCTCTCCCAGCGCCAAAATGTGAGTCTAAACCTCTGTCTCCTACAATTTTATCTAATATTTAGTGTTAGTCCGCCTAAAAGATAATGAAATCCGCAGATTTGAACAGACCATAAAAGTTAATCCTGATGATGATGATGATGATGATGGTGATTCCAACACGGAAGACGATAGGGATAACAAAGAGAAGGCTGAGGAAGCTGATGATGGGAACAAAGACCGTAGTAATTGTAAGAGTGATCCGCTTATCACAGATCATGTTAGAGTCCTTTGGATGGATGAGTCTGAGTCTACAGAGAGTAGTAATAATGTCATAGTTGTCGATAGAGGATTTCTGCATGGTGATTATGTTGCTGCAGCTTCTGATCCAACAGGTCAAGTAGGACTCGTGGTTGATATCAATATATCTGTAGATTTATTAGCGCACGATGGCTCTATTTTTAAAAATGTCTCATCTAGAGAGTTGAAACGTGTTCGGGGTTTTACAGTTGGTGATTATGTTGTCCTTGGCCCTTGGTGGGGTAGAATTGATGATGTTTTTGATAATGTCACAGTGATGTTTGATGATGGTTCTGTATGTAAAGTTATGAAGGCTGACCCTTTACATCTTAAACCAGTTGGTAGGAATGGCCTTGAAGATGGACATTTTCCTTTCTATCCTGGTCAGCGTGTAAAAGCTAGCTTCATCGTCAGTTTTCAAGAATTCCAGATGGTTATCTGGCTCATGGAAAGCAAATAGGTTAGATTATGAATTCGACTCTGATACGTATATTATTTGGTAGGTCATTTTCTATTGACAGAATTATTTATATATATATATATATATATATATATATATATATATATATATATATATATATATATATAATTCAAAGAGTTATGTACTAATTTTGTATCTATTTTTTCATCTATATATACATCGGTATTATAAGAATAATGTCTACGTTGTATTTTTTCTTAAATCTGTTTCTTTTTGTCTTTTTTTTCTCTATTAGACTTCTTAATTTAGTTTTCTATGAATGTTTAATTACTGTAAGTCTTTACACTTATTTTGTAACCAGTTTCTGATAACGTGCATTGCACATTTGTCCCTTACGTTCATTACAATTTTTTTTATTTATTTAGAAGTGAGTTATAAGATATTGATATTGAAATTAACAATATTAATTTTACTATTTATTTTTTATTGATTAAAATAAATCATAAAATAGAATGGTGCATTTGCTATCAAACCAGAAAATGTGAATCATGACTTAAAATGTCTATGAATTCGTGATAGAAAAATAATAATAAATGTATCTAATGCCTTTAATGAAAGAACAAAGGCGCGAGACAAATTTATCAGAAATATAAATTTCAATTACACATTTTGCATTTTCTATAAAGAACATAAACATCGAAGCTTAACGACAATATGATAAGATTGTCTTGCGAACACAATTACTTGTGATAAGTCCATGGGTCTATATATGAGTATATTCTGATGATATGATGTTTCAGTATTCATGAAAAAATCATCACTCTATTCAAATAGTAAAAATAATTAATATGTTTTAGTTTTCAAATTTAATTTTTAATAAACAGAAAATAAATTAACAAAATAAAAAAAACAGACGAACCAATAATAACATTATAAACATGCTTATGATGAGTCATATATAATTTGAAGGAAACAATACTACAAATTCAAACTGAAGAGAAAATAATATCTAAGACATACTAAGATTAAAATATGTTCTCTAACTAAGATCTTAATCTTAATCACCCATAAATTAAATAGGGAAAGAAAAGACTCTTGTAAAAGAAATGATGATGTATACAATTTAAAAGCTTGTATGTGAAAATAAGAGAATAAATATATTGCATAAAAAAATTATAGATGCGAAAAATACCATGTGTGATTCTTAAAGGTAAAATTATTTTACTATTACCTGTAAATTATATACTTTCATCATATTTATTGTTGAAATTTCACCTTTTAAAAAATGAAAAACAAGCTAAGAAAAAAAAAGTAAAAAGGGTAAAAAGGAACAAATAAAGACTAATAAAATAGAGAAAGGAAAAAATCCAGTGAATATCCTGATTGAAACAGCGTTATAGAAATACTCGGATAAATCAATATACCTTGAATTTCAAGAACACTTCAAATTGCATCACATATAAATCTAAGAAGAGACATATTCTACAATAAGAGGAGGGGGGATGGGGGGTTGGAAGAAAACAACAACAAAGAAATAGTGTTAAAAATTTGACACCTTCCAATTTCAAAAAAGAAAAATGATGAAGGGTAGGGGATGCTGGAGGACTATGAGATTTCTAGGAACATAAAATCAGTTTCTCACCGTGTGGTTGTCGAGAAATCGCTGCAGACACCACACTTCATATGTTCTTCATGATTGTCTTAAAGTCTTCGATTTCTTAACTAAAATAACGTTCCTATATCTTCTATACCTTTTGAAATGTATATGAAAATGAAATAATTTACTTAAAGATAAACATAGTTTCTTTATTTACCTGAAGAAAGTCATTATTTCACTTGGAAAAAAGATTTATTACTTTCAATTGCCTTTTTGTTTATCCTATTCATGGTTATTTAAATGTAAGTTTAACTGTTGTCTTTTCATTTATCCTAATTATTGTAATTGAAGTGTGAATTTATTTTTTTCAGGTCATTAAAAATGAAAATATTATGCTTTTATTTTCATATAATGTTATATATATTCAAATAATGTTCAAGTGAAGGGTAAATTCGTAATTCAACTTTGAGCTAAAGGACTTCCCACTTATAATATAACTAGTCTCCGAGCACGTGCGTTGCACGTGTATCCCAAATAAAAATCAATAAAAAAATAAATGAAAACGTATATAATAAACTATTAGGAGAATTATGATGTTTTTTTCGAGTGTTCTTTCGATATTTTCGATCTACTGCACATTAGATAAGTCTCCAAAGCTTCCAAGAAAGACACATCAAGTTAAAGAATTAAAAAGGGAAAATGCGACGTTACTTAAAGTCATCTGGTATCCTTAATGTGTATCGTTACAAATGTAACTACTTCCTTAAAAACTTTCAGATATACCCAGACTTACATTTACAGGCTTACAACTACTATCCATCACTGTTAGAGAAGACTTGGAGTTGCTACATTTGTTGAAGAAAATGTGATATATTTTGCTAGCAAACAACTGCAATTTCAATTTATTATTAATAGTTTGAAAGTTTAAACATGGTTTCTTTTCTGTGGGAAGCTATGCGTAGAGAGTTTCAAAGAGAGTTGATCATCATTCAGCATCAAACCATATGTGTACAACAGCATTCAATTTTTGATATGTGTGATTATACCTTTCAAGCTATTTATTTTACCTATTAAAAAAATTAGAAAGTTATCATTCAAATGAAGTTAGCAAATCAAACGAAAAAATCTAGACTTAATAAGATTGTACCTGAAAATTAGAAGACATTTTTGTACCCACTTAACAATGGAAGCTTGTGTTGAATGACTAATATTGAGTATGTTTATGTAGTGTAGTCTTGGAGATTTGTTGATAAAAACTCTTTGATATTCCTCAATTACTTAATTTGATCCTTTTCAACTTCTCATAATTAGCAAAATACGTTTCAACTTCTATATTAATTGAAACTTTATTAGTGTTCATCCTATTTGGTTGTTTCACACATAGTAATTGAATAGACTGTTGAACTTCTTATTTTGTTCCTTTATTATGTAATTCAATATTACTATTTAATTAGATATTTAATTTATATTTGGGAAAAGTATTTTATTACTTTTTAATTTAGTATAGGGGCAAAGTAGTAATTCAACTTTACACTTTAGAGCTTCATGCTTATAATAATACTAGTTTCTGAGGACGTGTTTCGCACGTGTATTCTATGTGAATTTTTATAGATATGTTATAATGATAAAAAATTTATGGAAATATATATGTAAATTAATGAATAATATAATTTAACAATTACAAAATAAGAATAAAGACTTACGCAATAAAACATTCATAAAAAAACTAAATTAAGAAGTCTTATGGTGATAAAAAAAAAAGACAAAAAGAAACAGATTTAAGAAAGATCCAATGTAAAAATTGTTCTTATAAGACTGATGTATGTATAGATGAAAAATAAGTACAAAATTAGTACATAATTCTCTGTGTTTTTATCAACTCCTTTCATATCCTATCAAAATTCAAGACGTTTCTTCATCTACTTTAACTATAGAATGAAAATGATAGCCTAATAATCTTGGTAGGGATTTCATGAGATTAAAAAAGTTGAATTTATATAGATAGAATAGAAGGAATATCAAAAGATATATTAAAGTTTTAGTTTAAATATTTGGAGGTTATGAATATGAAAAGATGAGAGTTATGAATATTTAGAGTATAAAGTTGAATAAGTAATTATCAAATAATAATAAATAAATGAAAACTATGAAAAAAGAAGTTAAAATTAGCAAACCATGTAGAAAGAACAACTAAAGTTCTTATCACGTAATTAAGCGTTAATGAATTTAAATTTGTGAAGATAGAGTCATTCTTTAATAATAATCGAGAGGACATTATCAACGTGTGTCTCCATTTTGCAGATTTGCACCCTTTATATTATTAAATTCGTTATTTATCATAAAGGATAATACTTTATCCACATAAATTATATTATTCATGAGAGGAGTTAAGGAAAAAGTTATGAGAAAGAGGAAAATATAGCAATTTAGTAAAGACTTTTTTTTTAAAAAAAAATTATAATTATTATATACATATAGATTATAGATGATAAATATTAATTAATTGGATATTTAATTAGAAATCAATCTTTAGAAGTCTAAAAGTCATTAACCTTTTAATTAAATTTATACAATTAAATATTTAAATATTTTATAACAATTTAATTTATAGAAGGGGTAAAACTGTAATTCAACTTTCAACTTTTTTTGTTCATGCTTTTAGTAATATATGATATGATATGATTGTTACATTTTATTATTCATTACATTTTGCATATATATTTCCATGAAATTTAGTCATTCTAACGTATATATAAAAATTCACATGAAACACACGTGTGAAGCACAAAGATTTATATAATCAAAAATTCAAAATTGCTGATTTTCAAGATTATCAGCATAATTTCTTCCTCCCAAAGGAAGTGTCCTACTCTCTCAGCCATCAGTTGAAACAGAGGTAAGACACATTCAACAATCTCGTGATCAATGCAACCATTCACTATCAATCCATGGAAATCTCTTACGTTTCTACATACATTCTGAAGAACCTCATACTCCAGGAAACATCTTTTCAGCACGATGCCTCGCTAGATGATAGAGATTCAAGAGGAGGAAGTACAATTGCTCATCCATCATGATGGCATCTGATTTAGAATGACGATGATCATCCATATTACCGGCGAGGCTAGTAAGGACATCATCATCCAAAATTGCTTGAAGCAGATTCTCAACCTCTCGTCATTATATCTTCAAACTGATCCAAATCGGAATAAGAAAGCTGAACATATGTACAAATAAATGCCAGCTCCAATTTTCGCTTTTCAATTAGATCCACATCAACATCCTTTTGATCTTGTTCATTCTTTAATCTCTCCAGAACATTGGCAACGTCCTTGCGAAGAGCAGAAAATGACATCTGCCAAAAGACCAATCAAATTTACAAAGCCACATTTCTACCCTGCAATAACTGCTGACATGTTATATTTCAGTGCCCAAATATTTGACTTATACTTCCTCGATAGCTAACACATAGTCCAGTCACTTCAATGATATAAATAACGTTTGAACATTGGGACTGTACAACCATTCATTCTCAACTATAAATATTAATAGCCTACTATATGGCTTGTTTACCCAGAGTAATCGAAATTTAATTTGTAGACAAAATATAATGATACTAACTCGCTATATATTTAGTAGATAATGTGCTTGATTAAAATCTTACTAGAAAATGACATTTAGCTTGACTTCGGTGGATAATTGTGACCTTTAACTTTGCCGGTGCACAAGTATGCTTATCTGCCACAAAGGAAAGAGATAAGAAAGTTAATCAAACTTTCAATAGTCTCAGTTTGAAGTCAATGAAGTGATTGAGAGAACTCAGGTTCAAATTTCAGTGGAGTTATCTGATACCTGTTGCTGGTGCGTGTTTTCAATAGTCATGGCTCGATACATTAACTGTTTTTTTTCTGAGAAGGGATACATGAACTGTGTTTGTGATAAAAGAGATAAATTGATTGTTAGTTGTAAAACCAGAAGTTTCCAAGAGAAAGAACAATAATCCTAATTTATTAATTGTGTTGCTGCTTTTGATAAATGCCAGGGATAAATAAACAGTGTAATGAACTTCAGTGTTTAGTGAGATAACATAGTTAAACAATTGATGTCGAGTGAACTCTTTGAATAATTTAGTGGTCTGCCATATGAAGAATAACTTGATGTTGCACAAATCCTACATTTTGACAATTCATGTTTATCTTTCCTAGTTAGACGCTTCATTAGCTTTTGAGCTCTTCTTGTTCAGTGGCTCTTTTGCATAATTGGTTATCCAGCTTACGCTTTAAGGCACTTGGAATGGATGTGATAGAGGAGATTACCAACACTAGTAAGGAACTTCAAGATCTTAGGGTGTTTCCTTCTGATCCATGACCTAATGTATCCTTGACAGAGCAAGGCCTTGTAAGTGTCTCCATGGGCTGCCCTAAGCTTCAGTCAGTTTTATACTTCTGCCTCCAAATGATAAATGACGCCTTAGTTACTATTGCTAGGAACCGTCCTAACATGATCCAATTTCATTTATTATTGAGCCTCGAACTCCTGACTTGAACCACTTGATGCTGGTTTTGGGACATTGTGCAACACTGCAAGGAATTGCAGCAACTTTCTCTTTCTGGCATCCTTACAGATCGTGTGTTTGAGTACATCTGGGTCCATGCTAAGAAGTTAGAGATGCTTTCCTTAGCTTTTGCGGGGGATAGCGATCTATGTTAATCTTTCACCCGCGTATACTTGCTTGAGCCTTGTGTAGTTGTAGTGCTGGTTATGACCCTTTGTTGAGCGACTTTGCAGCAATATCATTTTAAAGTTCACTACACGGCCTAGCTTTTGTGATGAAAGTTCGCTGGGTTTGTTATAGAGTAGTATCAATATCGTTTTAAATCAGTACCTTGACTAAGCTTTGAGCATATAAATGGGACTTCAGACGAAGTTAGACATAAAGGAGGTTTGGACAGCCAAAGGCAAATCCACGGAGTAATCTATGAATTCATGTGAATCCCTCAATTTCTGTCAAAATCCTATACATATGTGAATCTAATTGTTATTGATATTAACATGAGGTCGCCACAAATACTTGTAAACATCAAATCCTGGATTCCTCTTGCATACGGATAATACAGATGTAGTAATATGCAGTCTACTAGAAAATTAATGTGTATGTGAATGGAAAGAAAAAAAATAAAGAGAGAACGACAATGGCAAACAACATAGCATAGGAATAGTAGTTTGGTATACAAGATTAATGTTTATAATATGAACTTCAGATAGTTACTTCAATCTGGACAAATTAACAAATGATACGTGTACTTATAAAAATTATATTTTTTGTTAAAAGAAACTAAGAGGAATCTCATAACAGGATATTTTAATCATATACAATATCACCCAGCAAAGTTCAACCATAATGCTACTTAAATAAGGGGATATTCTTCTGGCCAAGGATCTGAAGCTCGCTCCCTCCTCTCATATCTTCAGCGTATTCCTTAATCTTGAGAGCAGAATCTTCAAGTTGAGGACTCTTTACAATTTTGATAACTTTCAATGAATAAATATCTCCAAAACTAGGTGGAATCTCCTCAAGCTTACGACATCCCTGCAGTTTTAACTTCTCAAGATTGGGGAAGGATTCCTCTCCAACCTCCCACTTGGAAAGAGTCGCTAGACGCAAGTTCAAAAATTTGAGATTCTCAAAGGTGTCTTCCTCCCCCATGTTCCATTCTTCTCCCTGGATGATTGCATCATAAAGGGACAACTCTTCAAGGTTGGGCAGTCTCGCTATTGTTGATAGTGAATCGGATGTCAGAGGAAAGTCATGCAATGACAGTTGTTTCAAATTTGAAGGAAAGTGAAAATCCCACGGCCGATTTGTCTTTACAGAGGACCCACTGTGGTTTGTGTTTGAACTTTTAAAACCTACATTGAGTATTTCTAGTTCAGTTAGGCAATCCAATTTCGGGAACCAATGTTGCTCTGTTGAATAATCCCATGACTCCTTGAGTTCAAACTGAAGCATCTGAAGATTGGGAAACCTTTTGAAAATATTCTTTGTATCTTTCGAATAGGAAATCAACAGTTCCCCTAATATTCTCAACTTCTCTAACTTTGTGTCCTCTGCTATCAATATTGATTCATCTGCATCCATATCAAAGAAAGAACAAGCATCCGCGAACAGCACTCGCAGCTTTACAAGATCCCAAATTCTTGGTAATAGTATCAAGGTTGATTCTTTGTTTTCAACCCACAATAATTCTAGATTCCAGAGGTTTGAGAAAGACAAAGGCAGATATTTAACTTGTGTCCCAATTCTTAAGTACCTCAAATGATTCAACATGCATATTTCATTCAGCAAAGAATCGTTCACCATGATAAAAGAGGTATCCAGGACCAACACTCTAAGAAGCCTCAAGTGTCTTAGGTGAAATGTATCAAAAAGACTGTCATCCAGCTCGTCTCCAAAAATCCTCAAAGAATAGATGTGTTTACCAGAATGCCTTTTCTTATTTGAATCAAAAATGACAAAATTAAGCCCAAAGTGCTCCTCATCATCATCATAATCAATGGTAATTTGACGAGGCAACAAATCTGTTGGAGCACTTGATCTTATCTGATCAAACAAATTTTCCTTTCTTGCTTTTATCAAACAAAAGTCATGCACAAGATCATGAATTTGGAAATTCAGTGCATCACCTATCTCATTGAAACAAATTACCAAGCTACTGGAAATTAAATCATCCATATAAATCTTCACCACTTCTTCCATACTGTTCATCTCCGCCTTTCCCACAAATCCTTCAGCACCCAAATAAACATTAAACTCATAGATTGTCAATGAAGTGTCCTTCGGAAAACTTGCAAAATACAGCAAGCATGGCTTGAGGTGATGTGGTAAATGGTCATAACTTAATTCTATAACTTTCATCACTTCCACTTCACTGTTCAAAATAAAAGAACTCAAACTACTTTGAACTTCAAGCCACACACTCCTTTTCTTTTCCCTCCCAGCAATGACTCCAGCAATCAGATCAGCCACCAAAGGAAGCCCTTTACAATTTTCGGCAATTTCTTTACCGACATCTAATAGTTCATCAGGGCAACTCTCGTCCCCAAATGCCCTTTTCTCTAATAATTCCCAACTTTCATCAGGTCTTAGCAATCGAAGGTCAAGAGGATCAGTGTAGAGCTTTCCATGCAAAGCTACTTCCTTTTCTCGAGTTGTCAAAATAATTCTACTTCCTTTCTTAGCTTCAGGAAAAGGTCTTGTCACCTCATCCCATGTAGTAGTCTCCCACACGTCATCTAAGACAATAAGATACCTCTTTCCATACAGTTGTTTCCGTAGCTTATCAGGAACATCAATATTCTCACTCAATTTTGAATCTGAGTCACTAACTTGATTGAAAATTTTATTCAACAACTTCTTCTCATCACATCCTTGGTCGACCGTGCACCATGCACGAAGGTCGAAATGGCTAGAAACTGACTTATCATTGTATACTTTGTATGCCAAAGTAGTTTTACCTGAACCCGGCATACCAGTGATCGAAATGACATCTAGATCTGCCGGTCCACTGGTGAGCTTTCTAAGTATCAAGTTCGTCTCCTCCTCAAAACCTACAATTATTTTATTAGTTGTCAATGACTTTCTCTCAACTGGTTTCTTGGGAGAGTTCACAGCGATTAGACCTCTGTCCTTGGGAATGCTCTCATCTAAAGCAGAGATCTCTTCTTTGATAAGTTTGATCTTCTTTATGGTAATGGGAAGTGAGAAAATAAGATGTAAGAGACCATTATCTCGAACAATAATTGAATCTATGACATCTTTTGCCTCATAAGCCACATCTAGGACACGTGCCCAGATATCTTTATACAATCCTTGCTCAGCATCCACAAAGAATGATCTTATGAATTCCAGGTCTTGTTTCACCAACTCGATTTCTTCCTTTATCAAAGAAATTGAATAAGCATTAGAATCTAGCAAATCATTTAAGTGCATGTGTAAAAGATGCATGAAGAGTGGTCCATCACTCATGGGGAAGCAACATTGAGATGAATCCGGGGCTTTCAGATAAACATGTTTGAGATCTTTCTTGAGGAGTTCAATATTTTCCAGCAAGTCTAGGGTTGCACAATTTGTTTGGTTATTACCCTCTTTATTCCTTAATTTCTCTTCCAAGTCACGTACAAGAGTTGATACCTCCCTGGTAAGTACTCCGACATGAGCCAAGAGATCAAAAAGTTTGTCATGATGAATAAAGTCCTTGGGCATATCAGAAAGAATAAGTAATAGGAATTCCATCATGACATGAATGTTTCGAGCCCCTGAAGTGCTAGGGCGAATAACAGTTATCATATGCTCTTGTAGTTGAATGATATATTCTCTGAGAATATCCGGTGAGGTTTCCAGGAGCTTCTTAATGAAGCGTCCAACTTCTGCTGAAGTTGAAGCTTTCAAATTTGTATAACATATGTGCATAACCTCCAGTTCAGTTGGAACAATCTTCAAGAGTAGATGTGTTAGCTGGAAGAGTCGAGAGTCTCTATCATTCTGATCATCCTCATCCGAGTCTTCATCAGTCTTATCCTCCCAAAGGAAGTGTCCTACTCTTTCAGCCATCAGTTGAAACAGAGGTAAGACATTCTCAACCATCTCATGCTTAATGCAACCATTCACTATCAACCCATGGAAATCTCTTAGGTTGCCACATACATTCTGAAGAACTTCATATTGAGTCACTCCAGGAAATATCTTTTCAGCGTGATGCTTGGATAGATGATACAGATTCAAGAGGAGGAAGTCCAATTGCTCATCCATCATGATGGCATCTGATTTATAAGAACGATGATACAAGCTGATACAGTCATCCATATTACTGGTGAGGCTAGTAAGGACATCATCATCCAAAAGTGATTGAAGCAGATTCTCAACCTGTTGTCTTTTTCTCGTCATTATATCTTCAAACTGCTCAAAATCGGAATAAGAAAGCTGAACATATGTACAAATAAATGCCATTTTCAATTTTAGATTTTCAACTTCATCTTTGTCAAGAGATTTTTGATTTTCCTCATTCTCTAGGAAAACCAGAACATCGGCAATGTCCTTGCTAAGAGCAGAAAATAACACCTGCCAAAATAATACATTTTAAAGCCACATATCTATAATTCAATACTTTACAGTTTACTCTATAAAATAACATACCAATGAGTTGTTTGCTTCTTCATTATCTTTTCGTTTTTCCATGATTCTACTTTTTCTCAAGACCTGATGAATAAAAAGTAGCTAAAACTTTAACAGGAGAAAGAAGATGAAAAGATACGAATAATCAATAATATCACTATTTTCACATATAGTAATTTTAGACTCGCACAATTGGAAATGTCAATCTTAATCACACATAAAAATGTTTATGACATGAAGTCACAAACATAAAATCTCACAACTGTTAATTATTTACAAAAAAAGAAAAAGGAGTCCTGCTCGTTTACCATTACTTTTCCAACCTATACAAAGAAGAAAGTTATCGACTTAATAATTATAAATATGTGATTGTCAATCTAATTATTATTGATATTAATATGACGTCGACATAGAAACTAGTAAATATCAAATCCTAGATTCGTCTATGTGTATATGGCATATAAGGAGCCTACAAGAAAATTATTGTGCGTGTGAATGTAAAGAAAATAAAATAAAGAGAGAATGAGAATGGTAAACATCATCAAATGTATCTGTCTAACTTTTTTCTGCCAAAAAGTCTATAAGGTAAAGGTAAAGAAAACAGTAATAGGAATGATGTTTTCGTGTATAAGATTAATGTTTAAAATATCAGCTTTAGATTTGGCATCAACCTCAGATAAAGTTGTGTATGATCAAGTAGAAATCTATACTTGACATCGGTGTGTCTCATGGACATACTCATATGTGATGACGTGCCAAACGGACAAATCAACAAATGATACATGTTTTAAAAAACTTGTAAGTTTTCTAATCGAAACACCGAAAAGTCAAACAAATATGTAATCATATACAGATCTACTCATTAAAGCATAACTTACTGTCTATTCTGCTATGTTTCTTCTTTCTACTTTCCACCCATAATGCTTAAAAGCTAGTTAAATAACGGGATATTATTCCCTTATTTTGATTAAAATTAAGTAAAATGTCATTAGATTAATAATCTCTCTAATAATATTATTTTTCTCCTATCTCGACTTGGGCTAATGGAAAAAGATTTTTTCTGAGAGTAGCTGAAGTAGAATCAATAGATTAAGCATGTTCACACCTTTTTGACATATTTTTGTTGAAGTAAGAGATCGAAGAAGTAGTTTGGTTGAAAGGAGACTAATCAAATAGCTAGATCTAGAATTCAAACAAAGATTACTAAAATACAATTCATTGACTTCACAAGTCCTTTAAATACCAAAAGTGCAAGATTACTAAAATACAAATGAGTAGTTTTTGTTGAAAGGAGAACAACAAAAAGCTAGATCTTAACCATTTTCATGTTATTCTGCTGCGAATAAAGTTTAGCAAAGAAGAAGATGGTACCTTTACACAGGCTGAAGTTTAGCTACAGAACCCTTTGTTTGAGAAATAATGCTGAACCTATTGGAGAAAAAAACAAGTGTAGTAGTTGAAATATACAATACAAATCTTTTTGTAATGAAATATTAAAATACAAACCCACTGACTTCTCAAGTCTTTTTTTAATCAATGTCTTTTGTCTTTCAATTTTTATACTGACGAAGATAAAAACAAGTGGTTGTCATTTCATCAAACACATTGTAGACATTGGCAATTTCCACATTATAGAATTTAGGGAAAAGGGTCAAATATGCCTTAAAATATTTAAAAAGGTCTAGATATACCTAAAGTTTGTTCATTGATGGGCTCGCCATTCAATTTTTGGTCCAAATATGCCCTTATGACCACGTTAGTTGTCATGTTGGACATATCCAACTCATTTTTCATTTCTTTAAATGTCACTTGGAATTGTCATGTCATTTTGGTCTTACCACATAACATTTATATGAAAATGGAAAGATATTTGGACTCATAAACACCTAATCCGACCCTTAAATAAACCTCCTTTTAAATAAATTATCCGGCTAATTTTCAACAATTTTGTTTAATTTTTATTTTTTCAATACATTCAAAAAATGAGTAATTGTTAATTAAAAAAATAGGAAAATATGAAAAAAGTATAAGATTAACGCCAAAAATTCATAAATAATTATAGTAACCTAAATTCAATTTAGACACTTTTTTTAAAAAAATCATTTTTTTCGATAAATCCCGAAATGAGTAATTGATTAATAAAAAGTATGAAAAGATATAAAATTAACGCCAAAAATTAAAAAATAAATACCGTAACCCAAAATTCAACAATTTCAACATTTTTTTAATTTTTAATTTTTTCGACAAATCCCAAAAATGAGTTTATTAACAAAAAAATATAAAAATTACACGAAAAAATCAGAAATAAAAAATAGGAAAATATGAAAAAAAATATAAAATAAAAAAAATGGTTGAAATTATTGAATTTAAGTTTACTATATTTAATTGTGAATTTTGACGTATATTTTTTATTTTGTTTTCATATTTTTCCCTTTTTATTAAAAAATTACTCATTTTCGGGATTTGCCGAAAAATATAAAAAATTTAAAAAAATTGTAGATTGAAATGTTACTATATTTATTTGTGAACTTTTGGCGTTAATTTATATTTTTTTCCATACTTTTGATAATTTTTATTAATTAATTACTCATTTTCGAGATTTATCAAAAAATAAAAAATTTAAAAAAAATTGAAATGTTAGATTTAATGTTACTATATTTATTTGTGAATTTTTGGCATTAATTTTATATTTTTCATATTTTTTCTATTTTTTATTAATCAATTACTCATTTTCGGGATTTACCGCAATAATAAAAATTAAACAAAATAGTTAAAATTGGTTCAGATAGTGAATTTAAAAGGAGTTGATTTATGGGTCGGATTAGGTGTTTATGAGTCCGAATATCTTTCCATTTTCATATAAATGTTATGTGGTAAGGTCAAAATGACATGACAATTCCATGTGGCACTTAAAGAAATGAAAAATGAGTTGGATGTGTTCAACATGACAACTAACGCCCATAAGGACATATTTGGACCAAAAGTTGGACGGCGAGGGCATGAGTGAACCAAACTTTAAAAGGAGGATATATCTAGACCTTTTCAAATTGTTTAGGAGCATATTTGACCCTTTTCCCTAGAATTTAATATAGAATATCAAAATATGAATTCTTGAAATTGAGTATAATAATTATTTTCTTTACAATGAATATATGTACTATATGTGTATATGTTCAATATAATCGAAGAAAATTTTGCAGAAAAATAAACAACAGAGTTTAAAATATGTACTCAAAAACAATAATTAATATCATAAGTATAAATTAATGAGGAAAAAAAAACATACCGCGATATGAAAAAATAGAATGAAAAAAATTGAGAAAAAACAGTGTTGTCAGTCAGCGGCAGATCTATCAAGGCCCGTGAGGGTGCCACACAACCCACGAACTTCGAAGGAAACTCTATTTATATTTATATACAACATATGTATAAATAATAATAGTGCCACTTAGAGAACAAAAGTATTCTTTGGTGTAGTGGTAGACTATCAAGTTTACAAGCCATAGTCCAAGGGATCAACCCTATTGACAGCGCTTTTTTGTTTTATATTTTTCTTTTTAACCACATGCAGTGTTTCTTTTTTAAACTACAAGGCACATTCTCTTTTGATTTTGATTTTTTTTATTAACTTCTTATTAAGTATTAATCAATAATTATTTTTAACTAATTTAATTTAACTTTTTGATTTTTCTTTTATATGATTAAATATAATAAGAAAATTCTATTCACCGTTGAATTCTCCTTTTAACTTTGGAACAACAAAAGTTGTCGTTAATTAAAGCTTCAGGCTTTCATCCGTCGCTCAATCCTGCTCTCCTGTCCAGCCACAAGACGAATAATTCTATCTGAATCTAATATTGATTTTATCGATGAGTCTACTAAGCATTAGAGACAATTTAAAATTTGAAGATTTTGATGCACCAATACTATTTTAATTGAGATAGTTAACAAAATTTTTACTACAATTAACGAATAATGTAGTACTTGATTGGTTACTAATGGCTCGAATATGATTTATAAGCTAAACTTAAAATAAAAAATAATGAAATACGATTGAACTGTATTCTCGCGAGTGGTTCCTCTGGCTTGTAAACCAACTAAACAAGGGCACCTCTACGCTTCTTATGGGTGCACTGTTGATTATATCCTACTTTATGTCAGTATCTCACGATAGATATACATATATACATGTAATTTTTTTGAAGTTAACGGATGCACGTGCACCCCTATCAAATCATGTGGGTTCGGCTCTGGTTGGCACCCAGTGGCTATAATTCCTAAATTCGCCTCTGCTGTCAGTAAGTCATTCAACAGTAGCAAAGTACATAAATATTTAATTTTGCAGAAATAAAAGAAAAAGATCATAATTGTTTTTTGTTTTAAAATGAGGGTGTGTTTAGTATGAAGGAAAACATTTTTCGAAAAATATTTTCCAATTTTCTCATATTTGGTTGGGTCAAATATTTTCCAAATCAAATCATTTTCCTCAAATTTATGGAAAATGACCTCCATTCCAAACTTAAGGAAAACATTTTCCAAAACTCTTTTCTAACCTCCCCCTACCCACGCCATTCTACCAGTCCCCAACCCACCCCCTTCCAGCCCTCTACCCACCCACCCATACCCCTAAAAAGTTTAAGTTTAGTTTTTTAAAAATATTTTTAACATCACAATTTCATTTTTTTTTTCACCCCTACCCTCGACCCCCTACCACCCCCATCCCCAAAAAATAATTTAAGTTTGTTTTTAAAAAAATATTTGTAACTTCAAAAATTCATTTTTTTACCCCTACCCTCGACTTACCCTCTCCCTACCAGCCCCCCCCCCCCCAAAAAAAAATAAGTTTGTTTTTAAAAAATATTTTAAACTTCAAAAAAAAAAATTCACTCCTACCCTCGACCCCGCACCCCACTCCACTAGCCCCCTACAAGCCCACCCCCACCACGAAAAAAATTTTAAGTTTGTTTTTTTTAAAAAATAAATTCAACTTCGAAAATTATTTCCTACTCTAGTAAAAAATAAAAGACATTTCTCAAAAGTATTTTTCATTAAAAAACAAGCACTAAAATATTTTTCCAGAAAATATTATCTACTCACCTACCAAATATGAGAAAATCAGTAAATTATCTACTTGTTTTCCAGGAAAATATTTTCCAAGGAATTTCCGTCATACCAAACACACCCAAGAGTATATTCCTCTATTTATAGACAACAAAGGGTAGTGTCAACAAATTTTTATTGTGCCTTATTAGAAAGGATACAACTATTTGAAAAAATTGCAACCCTTCGGAAAGTTTACAACGTTTCATAAAAGTCGCAACTCTTCATAAAAGTCGCAACTCTTCATTAAAGTCACAACTTATTATAAAAGTCACAACTTTTCATAAAAGTCACAACTTTTGATAAAAGTCGCAACTTTTCATAAAAGACAGATTTTTTCTTCAAAGAGGAAGGCTCGTTTTAGAAATAAATAAATTTAAAAGAAAATTATTGCTTGTGGCGGCGCTACATAGGTGGTCCTAGGATTCTCTTTTATATAAATATATGAATTTTTTTATTAACGTGGTGTTCGGACCAACTTTCACACTTTGATCTGCTGAAATTTGAACCTAAAACCAAATGGTTCTCATTTCTCAGTCACTTCATGGACCATTAGGTCACACTGTTAGGTGCCCAGATATATTCATGTCCAAACATCCCTTGGCCAATTTCCATATACCATTATTCAACCTTGTATTATTAGTTTATTCTAATTTCACATTTTTAATGTTCAAACGCCCACTTATATTCTGCCTGTTTATATCAAAAAATTCCAACAGATTTGAATTCATGGCATACACTTGATATTTTCTCAAAAGTAAATACTTAATAGGGATAACGCACAAGTACCTCCTCAAACTATGACCGAAATCGCAGAGTCACACTTATACTATACTAAGGTCCTATTACCTCCTAAACTTATTTTATAAATAATTTTCTACCCATTTTCGACCTACGTAGCACTATCTTTTTGGCCCAGCGTGACATTTTTTTCTCAAACTGAAATTAAAATTTAAACTATTTTCTTTTAAAAAAAAATAATTTGAAGTTTTGATTTTTTTGGTTGGGGTGAGGTTTATCAGTTCTTGCAAAAGGCTTAGAATTATCAAAGGATCTGAAGCTAAAGGTTTAGCAAGTCTATAAAAACATGGACATATATATATATACACACATATATACAAATCTGATAGGAATGAACAAGTTTGAACAAGTTTCAGTTTTGTAAACTATCTTGATTTTCGATTAATTACACGGGATATATAGATCTAGATCTCATGTACAAATAGTTTATCTTTCTTTTTTTTGAAGAATTTTCTTGTGTATTATGTATGAGTATAAATATACGGGAAGAAATACAAAATTTTAGCACAATATGAAGTGTCTAATCAATCTTGATATTTAAGCACCCAAATTCAATATTTCGCTTTGATAGGTTCATAATCAAGAATCAAAATAATAATAGAGATTAAAATAAACTTCATTGACTTTTCAAGTCTTTTTCATCAATTTTGTAAATATGTATATTCATATTACAAGTCGACTTAGACTTGTGGAGATTGTTAATTAGCTTGTGAATGAAGATGATGTGTGTTGTGTCCATGTAGATCATGGATTTGAGAAGATCTAATATTTTTTTGGTAGTAAAACTTAACTAGTGAACTTAGCCGCGCTTCGCACGATCATAAATAACTCGCTTAATTTGTCAAAAAAAAGAATTAAAATAGTATTGATAAAAGTTTTGTGAAGGTTCTTTGTTGTGTTTAATTGAAATATATCATATTTGAAATCTTAATCAAGTTTAAATACTATTTAAGTTTTTGTATCCGTTTTAATTTTAAATCGCTTAAGCTAAAAGTTCACATTCAATGATCTCAGCCTATAATTTTATTGGATATGTGTAGCCCATGCTTTTATAATTTTATACAACTTTTTTAAAATCTATCTTTTATTTTTAGTATGTTTTTTGTTTTGTTTGTATCTTTCTCGCAAAATTGAAGAATTTAAACCCAAATAAACTTGTAAATTTTGAAAGCTCAAAACATCAAAATGTCATTATCCTCCTTGTTCATCAAATCAAAATAATTTTTAAATATTTATTGTGGTTCAAGAAAATCAATTATATTTTTATAAAATTACTCTTTTTCCTCCAAACATCGTAGTCTCTTACTATTTTCTTTTTAATGTTTATATTCTTCAAAAGTTGTTATCCTTTCGTCGATAATGATGAATCAACTCTCTTTTCATCTTTCACAAGTCATAAACTAATTTTTACTACAATGTAATATACTTATAAATTTATATATAAAAAAATATATTGAGAGACATAGAACCTCAATTACACAAAAAATGTAAAGTATTTGGAGAAATTAATTATTTGAAACAATCTCTTAAATGCATATAACAAATTTGAGAAATTCTTTTTAAACAAACTTTATCAAAATCCCATTGCAAGAAAGTTGAGTCTTTTTTATACCTTTTTTTTTTTTTTTGAAAAAAAAAGCTTATCTTGTAGCATATGCATACAAATTATATTATTTATTTTGAGATAAAAAAAATCAAATTTTATTGACTTGTCACGTGCATTTAAAGCATGAAGCTAATCATACTTTATCAATTTCCTTTTATTTTTCAAGGGAAAAGGGTCTGATTTACCCCTCAATTTTGTCATTTGGAGCTGATATACCCCTCGTTATAAAAGTGGTTTATATATGCCCTTACCGTTATTCAAACGGCTCACATATACCCCTGCCGTTACAAAATGGCTCACATATACCCTTCATTTAACGAAAGTTAAAAAATTAGTTTTAAATTTATATTTATTACTTGTAATTTTTTTTAAAAAATTATTTAGGGGTATATATGATTCTTCTATCAAAGTTCAAGGTATATTTTAATTTTTTTTCATACATAAATTATTTTTTGACTTCGCTTATTATAATTATTTGAGTTTCTTATTCTTATTTTGTTTTTTTCTTTCATTACTTAGTTTAAAGAAAAAAATTTAAACAATTTTTTTGTGTATTGTAATTTAATTTCGTATTCGAAGAAAAAATTTGGTCTACAATAAGTTTTACAAGAATATTAGTGAAACATAAACAAATTTGATTATCAAAATTATAATTATAAATTAGTCATTGAAACAAAAAAAATAAAAAAAAATATGTTTTACGAGGATTAAATTTACTCATATTAGATTATATATTTTATAAAATAAAAATAAAAATTTAGATTAAAATTATTTTTTTCATTTCCGTTAGAGGAAAAGGGTATATGTGAGCTATTTGTTTACAAGTAGGGGTATATATGAGTCACTTTCATAACAAGGGGTATATCAGCTCTAAATAACAAAGTTGAGAGGTATATCAAACATTTTTCCCTTTTTTCAATTTGTAAATTAAATATGAATTTAGTATGTCATGATTATTTCTATTAAATTAAGATATTATCTTGACAAACAAAATGTGAGATTACTATTTTTGAATTAATATTATAACCATAAATTTTATAACATTTTGAAAGAGTAGAGAATAGTAACAAAATTTGCATATGTTAATAATGACAGTGTGTTCATCAAACTTGAACTTAAATCTCAAATATTGTCATTTGTTCATTTTATCTTTCACCGTAAACAATAAAAATAATTCACATAAAAAATGAAGAATAAAAAGAATGAAAAAATCACCAACAATAATGAAGAAAATAACACAGACAAGAAAATAGAAGGAAAAACACTATAAATAAGAGACATCAACAAAACTAAAATAAAACAAATAATCTTATCTATTTTGTTTAAATTTTGAATTTGAATTCTCACAAACAACATAGGTATATGCTCATCCTATCTTTCATACAATAAACCAAAAAAAACTAATCACATATAATATAACATTATAAAATTAGGCATAACAAAGTGATGTACTTAAGTGTAAATATAATCAAGAAAAAAATAATTTCTTACCATTGATGAGGATGATATACTTTAGTATTTATAGTAATCAGTAAATTTGTAACTTAATTAAATAATATGAATTAAAAAAATAATATAGTAATAAATAAAATTGTAACTTATATTGATATTAATTGTTTTAATTATAATATAATAATATTTTTAAGAAGGAATAAAGAAAGGTTTAGGAAAAGGTGATAAATGGTAATGGTAGTGGGCTTAGTTTTTAAGTAACTGTTGGGCTGCAAGATTAATTACTCTTATTTACTGTGATATTTTAACTCATTTAGACATTTATACATTTTTAAGGGGGAAAAAGTCAGAATTTTTTTTTTTAAAAAAAGAAAAAACATATAACTGCAAATGCTGATCATTGGAGGGTGCCACATCAATAATTTTAGATTTAGCTTTATATTATTATATAGATTTCGCTCCCTTTATTGAAAACGTAAAATGTTAAATATTTTTTTATTCTTAATAAAGATTTTTAAATTTGAACCTTAATATATTAAATCATCTTTATTAGAAAAAACTTACTTCCAATTATAAAATCTCAAACACACAAAAAATGATAATTGAATGTTAATATATTTATCAAACATCGAGCGAGAAATGAAAAAAGAAGAAGGGAAGTATAGGTGCATTACTTAGAAAACGACCATTCACTAATGCTACAACCCCACAATGTGTAAATTGATTTGAACTATTGCTTTCAACTTCACTTTTTTAGTTTTTTTTTTCTTTACAAGAATAACAATTAAATCAAATGATTTGGTTTGAAAACAACACCAATTTTTTGAAAAGTATTCAGAAAATTATTTTTTCAACATTTAAACAAAATTTTAACTACTTTTTACTATATTCCAAAACGTCTCGTTAAAAAAGGAATATAAAATCTCAATCAGGTTAATTAATACAATAAGATTTTTGTATTTTTAGCTATAGTCATAGATGAATTTAAAATCATTTTAAAAAATTAAGTTATGAAAAATTATTCTATATATATATTAAAAAAGTTCTTACTAGAATTATTGAAAACTTTTAAGACCGTAAATCGTAATCAATCATCTAACTAGCTTTTATCCGTAATATTCGAATAATTTTCTTCGCTTTTCCAAGAGGAATATATGTTGTTTTATGTTAAAAAAACTTCTACATAAGATTATTATTATTTAGGGTTAATTATATATAGTGTGTGCATTAACAATGTCACAAACTCTCAATATTACAAAAAAAAATTAGAAATATAAATCCACGCAATTGTATAAAAAGGGGTTAATCAATATCCTAAAATAATAATAATGTAATAGCATTAACGTATGTTAATATGTTATATTACGAAATTCAAAAATATGTGAACTTTAAATAATATTGTCATCATTGTATGAAAGATTCACAATTTATATCACTTTTGTATAATTTATTTTTTTTAAAAAAAATTGATTGAATTAACCCTCTAATAGTAATAATAATAACAATAATTATACAAATTAGTATTTTAATTATGTCTATCTTAAATCATTTCAAATTATAATGTGTAATTGATTACTTTTTAAATCATTAGATTCCCTAAATTTCTAAAGCCAAAATCCATTACTTTTCGTCTCGTTATATTTATCGGACACGTGTCTATTCATATACAATGACATAATTGTCCCCACATAAAAAAAGTAACCCAAACACTTGACTCATCTTAACCATGGTTTCATTTTAACCCAACACATTTCCACCTCTTTTTGTTTTTTATAATATAAAAAATCGTTTGATAGCAGAAATATAAGTATTAAATTTTACATAAGTAATACCGTATTTAATAGTTGATTGAAAAAAAAGAGCTATTCATAAGAAAGTTTTAATCTTTTCATCTGGGGTTTAATACCTGTATTTGCTTGTAATTGAGGAAATGGTAGGTTTTGTAGAGCATTATTGCTTGAGTTCTTTAGTATTTACTGGTGAAAAAGAGTTCAAATCTTTGCACTGTTGTCTAAGTACTTTAGCCGTTGCCGGTGACTTCATTAAACTGATTTGATAGAACAGAAGGTTTTGTGGAACATTGGTGTCTGAGTACTTCAGCCCTTACTGGTTGGGATGAGTTTTAATCTATGCATCTGAGGAACTTTTCTTGCTTGTAATTGAAGCAGTGGGTTTTGTGGAGCATTATTGTGTGAGTACTTTAGTCTTTCTGGTGAGAAAAGTTCTAATCTTTGCATCTGGGGTTTGAATGTTTCTTGTTAGTAATTGAGGGTTTGAGGAAGTAGTAGGTTCTGTGAAGCATTCTCGTCTGAGTACTTTAGCCCTCCCACATTGTGTGAACAATCTCTTCTCATCGAGCATGCGTTTCCCCATCAGCTGAAGCAACACTGTTAATCTTTATCTCTGGTTGGTCGCTGATATTAAAGTTGGGGTTGTTATAACCAAAAAATCAGGGTACATTTGAAAATAAAATATAATTCAACATTCGAAAGCGGGTTATAAGTTGTTTTCCAAATTTGATTTACAACTTCGAACTTTTCGTACACAAACACTGGTTTTCGAATAAAGTGGACATTATATCAGAAAAAAAGTAAATAATATTTATGGGTCCTTAATTAAGTCTTTCAGTTCATTCCTCTGTTTTGCTTGATTGATGGTATTTCACAGTAGTTGGTGGCCATAGAGAAGAAATGCCTTAGTACTTTGAATCGCTTACTGGGTAAAGAAGCAAAAGCATATAGTGTATGACTTGGCTACAACAAACGAAAGGGATGTAAGAGGGCACAATTTCGTCCACCTTTAGAAACTAAGCATAAACTGAATCTAATTAAATTTTTGTTTTGATATGTGCACTTTACTAGCAATGTTGCACAGAAAGTGTGAACTACTGGTTCGGTGTTATAAGTAGTTCAATGATTTGAATTATTGAAAGGGTTGAATATCTTGTAACATGGTTATCAAATTAATGTTGCATTTTTATCTCTTTCCATTTGATTTATCACAACTCCTCTTATATTTGGACCTTCTTTTGCTGCTATTCTTGTTTAGCGCTGGGAATAAAAACTATAGAAGCAATGTAACTCGTTTTTTGCTGCAGGAACCTGAGAGAACTGGAACTGGGAGAAAGTGAAGCAGAAGACCTGAGTGGCCATTGGCTTAGTCATTTTTCTGATAGTTGTACATCGCTTGTGTCACTTAACATTGCTTGTTTGGCTTCTGAGGTCAGCTTCTCAGCTTTGGAGCGTCTAGTTGCTCGCTCTTCTCATTTTAGGACTCTTCGGCTCAATCGTGCTGTTCCCATTGAGAAACTTCCAAAGCTACTTCGTCATGCTTCGAAGTTGGTTGAATTTGGTACATGATCCTACTCTGCTGACATGCAGGCTGATGTTTCTGAAGTTTTCGTAAATGTATCTCAAGCATTTTCAGGCTGTAATCAACTTAAAGGCTTGAGTGGGTTTTGGGATGCTGTGCCAGCCTACTTTCCAACTATTTATCCAGTCTACTCCAAACTCACCTCTTTGAATTTAAGCTATGCTACCATTCAAATAGCTGATCTTTGCAAGCTCATTGGCAATTGTTTCAATTTGCAGCGGTTGTGGGTAGGTTCTAGCTTGTGTTTTACTTTTGTATACTTATCGAGTGTTTTCAATAGTCATGGCTCAATACATTAACTGTGTTTGTGATAAAATAGATAAATTGATTGATAGTTGTAAACACACAAATTTCCAAGAGAAGAACAATAATCCTAACTTAGTAATTGTCTTGCTAATTTTGATAATGCCAGGGATAAATAAACAACGTAATGAACTTCAGTGTTTACTTAGATAACATAGCTAAACAATTAATTTCGAGTGAACTCTTTGAATAATTTGCTGGTCTGTCATACAAAGAATAAGTTAATGTTGAATCCTAGTGTTGCACGAATCCTACACTTTGACAATTCATGTATATCTTTCCGGGTTAGACGCTTCCATTAGTTTTTAGGCTTTTCTTGTCCAGTGGATCTGCTGCATAATTAGTTATCCAGCTTACGCTTTAAGGCACTTGGAATGGATGTGATTGCAGGTTCTAGACTACATTGAAGATAGCGGTCTTGAGGAGATTGCCAACACTTGTAAGGAACTTCAAGAGCTTAGGGTGTTTCCTTTTGATCCATTTGCTCCAGGACCTAATGTATCCTTGACAGAGCAAGGCCTTGTAGCTGTCTCAATGGGCTGCCCTAAGCTTTAGTCAGTTTTATACTTCTGCCGCCAAATGACAAATGACGCCTTAGTTACTATTGCAAGGAACCGTCCTAACATGATCCGATTTCGTTTGTGTATTATCGAGCCTCAAACTCCTGACTACTTAATCCTTGAACCACTTGATGCTGGTTTTGGGGTCATTGTGTAACACTGCAAAAAATTGCAGCGACTTTCTCTTTCTGGCCTCCTTACAGATCGTGTGTTTGAGTAAATCGGGGTCCATGCTAAGAAGTTAGATATGCTTTCCTTAGCTTTTGCAGGAGATAGTGATCTAGGCCTCCTATATGTTCTCTCTGGTTGTGAGAGCCTCCGTAAGTTGGAGATTAGAGACTGCCCTTTTGGCGATGAGGCTCTGTTGGCTAATGCTGCAAAGCTGGAGAGTGGAGACCATGCGATCCCTTTGGATGTCTAATTGTTCAGTAAGTTTTAAAGCATGTAAGCTGCTAGCCCAGAAGTTGCCAGGCTTAATGTTGAAGTTATAAACGAGAGGGGTCATCCGGATACGAGACCAGAAAGTTGCTCTATTGAGAAACTTTATATACACAAGACAGTGTCAGGAAGGAGGTTCGACACTCCTGGTTTTGTTTGGACTAGGCTCCGGGCACGTGTATTCCAAATAAAAATCAATAAAAAAAATAAATGAAAACGTATATAATAAACTATTAGGAGAATTATGATGTTTTTTTCGAGTGTTCTCTCGATATTTTCGATCTACTGCACATTAGATAAGTCTCCAAAGCTTACCCATTTATAAGCAATTAAATGTACAGACAGTCATCAACAAGTAAAAATTCTAAGAAAGACACATCAAGTTAAAGAATTAAAAAGGGAAAATGCGACGTTATTTAAAGTCATCTTGTATCCTTAATGTGTGTCGTTACAAATGTAACTACTTCCTTAAAAACTTTCAGATTTACTCAGACTTACATTTACAGGCTTACAACTACTATCCATCACTGTTAGAGAAGACTTGGAGTCGCTACATTTATTGAAGAAAATGTGATATATTTTGCTAGCAAACAGCTGCAATTTCAATTTATTATTAATAGTTTAAAAGTTTAAACATGGTTTCTTTTCTGTGGGAAGCTTGCATAGAGAGTTTTAAAGAGAGTTGATCATCATTCAGTATCAAACCATATTGTACAACAACATTCAATTTTTGATATGTGTGGTTATACCTTTCAAGCTATTTATTTTACCTATTAAAAAAATTAGAAAGTTAGCAAATCAAACGGAAAAATCTAGACTTAATAAGATTGTACCTGAAAATTAGAAGACATTTTTGTACCCACTTAACAATGGAAGCTTGTGTTGAATGACTAATATTGAGTATGTTTATGTAGTGTAGTCTTGGAGATTTGTTGATAAAAACTCTTTGATATTCCTCAATTACTTAATTTGATCCTTTTCAACTTCTCATAATTAGCAAAATACGTTTCAACTTCTATATTAATTGAAACTTTATTCGTGTTCATCCTATTTGGTTGTTTCACACATAGTAATTGAATAGACTGTTGAACTTCTTATTTTGTTCCTTTATTATGTAATTCAATATTACTATTTAATTAGATATTTAATTTATATTTGGGAAAAGTATTTTATTACTTTTTAATTTAGTATAGGGGCAAAGTAATAATTCAACTTTACACTTTAGAGCTTCATGCTTATAATAATATATGATTATTGATGAAGATGCAACATCGACTCCATATAGCAATGGGGATTGCTCTTTGGCTTCTTCTTAGGAAGACTTCAGGTATTAGTTCTATGCTGATCTTTCACCTGCATTTACTTGCTTGAGCCTTGTGTAGTTGCAGTGCTGGTTATGGTGGCAGTGAAGCGCATGTGCCATTGATTTGACCCTTTGTTGAGTGACTTTGCAACAATTAATTACAAATAATGAGTTTAAACTCTTGTTGTTGTGCTATATCACTAAGGATAACTATTGTATTTTCAACTCTTATTGTTTTTTCTGTTGAAATGATGCTGTCAATGTACTTGTTGTCCTGTATTGTTGTAATTCTCCTTGAAGATAAATGGGAACCTTTCATTCATTTGAGTGCTGAAATCCGATTTAATTTGTTGAACGTTTAGAAGAAGGTATTTTATTGTTCTAGTACGAGTCAGCCTGATAAACAAACACTTACATAGGTATGATGACTGTTCATTTTCTCAATTTTATACCTACTCGTGCAAATCCAAAGTTAAAAGGTCATGTTTATGTATTATGCCAAATCTATACTCACATGTGTGCTTGCGATAAAAGAAATAGACAAATCAACAAATGATACGTGCATTTATAAAAATTATAATTTTTGTTGAAGAAACTTTGAGAAATCCACAAAAATATTTCATAACTGCAACAAAGTTTTCTTAATCATATACAATGTACCCTGCAAAGTACAATCTACTTTTCAACCATAATGCTACTTAAATAAGGGGATATTCTTCTGGCCAAGGATCTGAAGCTCGCTCCCTCCTCTCATTTCTTCAGCGTATTCCTTAATCTTGAGAGCAGAATCTTCAAGTTGAGGACTCTTTACAATTTTGATAAATTTCAATGAATAAATATCTCCAAAACTAGGTGGAATCTCCTCAAACTTACCACATTCCTGCAGTTTTAATTTCTCAAGATTGGGGAAGGATTCCTCTCCAACCTCCCACTTGGAAAGAGTCGGTAGACGCAAGTTCAAAAATTTGAGATTCTCAAAGGTGTCTTCCTCCCCCATGTTCCATTCTTCTCCATGGATGATTGCATCACAAAGGGACAACCCTTCAAGGTTGGGCAGTCTAGCTATTGTTGACAGTGAATCGGATGTCAGAGGAAAGTCACGCCATGACAGTTCTTTCAAATTTGAAGGGAAGTGGAAATCCCACGGCCGATTTGTCGCTACAGAGGACCCAATGTGGTTTGTGTTTGAACTTTTAAAACCTACACTGAGTATTTCTAGTTCAGTTAGGCAATCCAATTTCGGGAACCAATATTGCTCTGTTGAATAATCCCATGACTCCTTGAGAACAAATTCAAGCACTTTAAGATTGGGAAACCTTTTGAAAATATTCTTTGTATCTTTCGAATAGGAAATCAACAGTTCCCTTAGTATTCTCAAGTTCTCTAACTTTGTGTCCTCTGCTATCAATATTGATTCATCTGCATCCATATCAAAGAAAGAACAAGCATCCGCGGACAGCACTCGTAGCTTTACAAGATCCAAAATTCTTGGTAACAGTATCAAGGTTGATCCTTTGTTAGACACAAACAGACTTTCTAGATTCCAGAGGTTTGAGAAAGACAAAGGCAGATATTTAACTTGTGTCCGAATTCTTAAGTACCTCAAATGATTCAACATGCATATTTCATTCAGCAAAGAATCATTCACCATGATTAAAGAGGATTCCAGGTCCAACACTCTAAGAAGCCTCAAGTGTCTTAGGTGAAATGTATCAAAAAGACTGTCATCATAATCAATGGTAATTTTACGTGGCAATAAATCTGATGGAGCACTTGATCTTATCCGATCAAACAACTTTTCCTTTCTTGCTTTTATCAAACAAAAGTCATGCACAAGATCATGAACTTGGCAACTCGGTTCATCACCTATCTCATTCAAAAGAATTACCAAGCTACTGGAAATTAAATCATCCATACAAATCTTCAGCACTTCTTCCATACTCTTCATCTCCGTCTTCCCCACAAATCCTTCAGCACCCAAAAAAAACATTCAACAAATAGATTGTCAATGGAGTGTCCTTCGGCAAACTTACAAAGTGAAGCAAGCATGGCTTGAGGTGATGTGGTAAATGGTCATAACTTAATTCTATAACTTTCATCACTTCCACTTCACTGTTCAAAATAAAAGAACTCAAACTATTTTGAACTTCAAGCCACACACTCTTTTTCTTTTCCCTCCCAGCAATGACTCCAGCAATCAGATCAGCCACCAAAGGAAGCCCTTTACAATTTTTGGCTATTTCTTTACCGACATCTAATAGTTCATCAGGGCAACTCTCGTTCCCAAATGCCCTTTTCTCTAATAGTTCCCAACTTTCATCTGGTCTTAGCAATCGAAGGTCAAGAGGATCAGTGTTCAGCTTTCCATGCAAAGGCACTTCCTTTTCTCGAGTTGTCAAAATAATCCTACTTCCTTTCTTAGCTTCAAGAAAAGGTCTTGTTAACTCATCCCATGTAGTAGTATCCCACACGTCATCTAAGACAATAAGATACCTCTTTCCATACAGTTTTTTCCGTAGCTTATCAGGAACATCAATATTCTCACTCAATTTTGAATCTGAGTCACTAACTTGATTGACAATTTTATTCAACAACTTCTTCTCATCATATCCTTGGTCGACCGTGCACCATGCACGAAGGTTGAAATGGCTAGAAACTGACTTATCACTGTATACTTTGTATGCCAAAGTAGTTTTACCTGAACCCGGCATACCAGTGATCGAAATGACATCTAGATCTGCCGGTCCACTGGTGAGCTTTCTAAGTATCAAGTTTGTCTCCTCCTCAAAACCTACAATTATTTTATCAGTTGTCAATGACTTTCTCTCAACTGGTTTCTTGGGAGAGTTCACAACGATTAGACCTCTGTCCTTGGGAATGTTCTCATCTAAAGCAGAGATCTCTTCTTTGATAAGTTTGATCTTCTTTATGGTAATGGGAAGTGAGAAAATAAGATGTAAGAGACCATTATCTCGAACAATAATTGAATCTATGACATCTTTTGCCTCATAAGCCACATCTAGAACACGTGCCCAGATATCTTTATACAATCCTTGCTCAGCATCCACAAAGAATGATCTTATGAATTCCAGGTCTTGTCTCACCAACTCGATTTCTTCCTTTATCAAAGAAATTGAATAAGCATTAGATTCTAGCAAATCATTTAAGTGCATGTGTAGAAGATGCATGAAGAGTGGTCCATCACTCATGGGGGAGCAACATTGAGATGAATCCGGGGCTTTCAGATAAACATGTTTGAGATCTTTCTTGAGGAGTTCAATATTTTCCAGCAAGTCTAGGGTTACACAATTTGTTTGGTTATTACCCTCTTTATTCCTTAATTTCTCTTCCAAGTCACATACAAGAGTTGATACCTCCCTGGTAAGTACTTCAACATGAGCCAAGAGATCAAAAAGTTTGTCATGATGAATAAAGTCCTTGGGCATATTCAGAAAGAATAAGTAATAGGAATTCCATCATGACATGAATGTTTAGAGCCCCTGAAGTGCTAGGGGGAATAACAGTTATCATATGCTCTTGTAGTTGAATGATATATTCTCTGAGAATATCCGGTGAGGGTTCTAGGAGCTTCTTAATGAAGCGTCCAACTTCTGCTGAAGTTGAAGCTTTCAAATTTGTATAACATATGTGCATAACCTCCAGTTCAGTTGGAACAATCTTCAAGAGTAGCTTGAAGAGTCGAGAGTCTCTATCATTCTGATCATCCTCATCTAGCTCGGAGAGCCGAGAGTCTTCATCAGTCTGATCCTCCCAAAGGAAGTGTCCTACTCTTTCAGCCATCAGTTGAAACAGAGGTAAGACATTCTCAACCGTCTCATGCTTAATGCAACCATTCACTATCAACCCATGGAAGTCTCTTATGTTGCCACATACATTCTGAAGAACTTCATATTGAGTCACTTCAGGAAATATCTTTTCAGCGTGATGCTTGGATAGATGAAACAGATTCAAGAGGAGGAAGTCCAATTGCTCATCCATCATGGTGGCATCTGATTTATAAGAACGATGATACAAGCTGATACAATCATCCATATTACTGGTGAGGCTAGTAAGGACATCATCATCCAAAAGTGGTT
>URS00015E57C9 rRNA from 1 species 
CCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGACGAGAGTCTGAACCAGCCAAGCCGCGTGAAGGAAGACTGCCCTATGGGTTGTAAACTTCTTTTATATGGGAATAAAACGGTCTACGTGTGTGAATTTGAAAGTACTGTACGAATAAGGATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATCCGAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGAATGTTAAGTGAGGTGTGAAAGGTGCGGGCTTAACCGGGGAATTGCATTTGAAACTGGCGATCTTGAGTGCAGGAGAGGTAGGCGGAATGTGTGGTGTAGCGGTGAAATGCTTAGATATCACGCAGAACACCGATTGCGAAGGCAGCTCACT
>URS0000C6D546 snRNA from 2 species 
AGCCATGTGGTGAGCACAAAGCGAACTATTCTTTCGCCTTTTACTAAAGAATACCGTGTGCTCTCCACGCTAAGTGGCATACGCCTATTTTTGTAGGGTCTTGCTTTTAAGCGAGC
>URS0000C3F3E8 tRNA from 1 species 
GACGTCGTGCCGGAGTGGTTAACGGGTGCGCCTGCTACTTTTAGCATGTCAGTGTATAGGCTCTGCCTGCGTGAGTTCGAATCTCATCGACGTCG
>URS0000B1CE7F rRNA from 1 species 
TGGGGAATCTTGGACAATGGGGGCAACCCTGATCCAGCGATGCCGCGTGAGTGATGAAGGCCTTCGGGTTGTAAAACTCTTTCACCTGCGAAGATAATGACGGTAGCAGGATAAGAAGCACCGGCAAACTCTGTGCCAGCAGCCGCGGTAAGACAGAGGGTGCTAGCGTTGTTCGGAATGACTGGGCGTAAAGGGCGCGTAGGCGGCCAATCAAGTCAGATGTGAAAGCCCCGGGCTTAACCTGGGATGTGCATTTGATACTGGTTGGCTGGAGTACGAGAGAGGAAAGTGGAATTCCTAGTGTAGAGGTGAAATTCGTAGATATTAGGAGGAACACCAGAGGCGAAGGCGGCTTTCTGGCTCGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAA
>URS000118AF15 rRNA from 1 species 
TACGGGGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCTCGTAGGTGGCCAACTAAGTCAGACGTGAAATCCCCAGGCTCAACTTGGGAACTGCGTCTGATACTGGCAGGCTTGAATCCGGGAGAGGGATGTGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCGGTGGCGAAGGCGGCATCCTGGACCGGTATTGACGCTGATGCGCGAAAGCCAGGGGAGCAAACGGG
>URS00008D4438 rRNA from 1 species 
TACGGAGGGTGCAAGCGTTATCCGGATTTACTGGGTTTAAAGGGTGCGTAGGTGGATTGGTAAGTCAGTGGTGAAATCCCCAAGCTTAACTTGGGAACTGCCATTGATACTATTTGTCTTGAATACCGTGGAGGTGAGCGGAATATGTCATGTAGCGGTGAAATGCTTAGATATGACATAGAACACCAATTGCGAAGGCAGCTTGCTACGCGGATATTGACACTGATGCACGAAAGCGTGGGGATCAAACAGG
>URS0000E895E3 lncRNA from 1 species 
CTTATCTGGTGAGGGAGGTTTTCCTTTGTTTCTGGAGCTTGGTTAAAGTAAGCCAAGCTTTATTTTTCTAACTTGAACTCTGACTAAGTAAATAATATTCTGATTGTCCTTAAAGATGCAGAGCATCTTACTCCGTGTGTGTGTGTGTGTGTTACAGCAGGGGTTCCTAACCTTTTTATGCTGCAGACTGGCAAACTGCAGACCAGAGATGACAGTGGACTGGAAGTGACCACAGACTGACAAACTGCGGACCAGAGGTGACTGTGGACCAGCAAACTGCAGACCAGCAGTGACCAGCATACTGGTACCAGACCGCAGTCTGAGGGTTGGGAACCCCTGTGTTACAGTAAAGCAAAAGCACAAAGTAGGAGGCATACTCTTAATTGGAACCCAGGTCAAGGAGATGGGTACCACAATGGCAGATGTGTGGATGGGACCAACCATGATGAATATCTTGCACAAAATTCAGCCTTGGATGAAGATAAAATTTGCCTGCCCTGGATCAACCTGGTAATCAAGTCAGTCCTGGGATTTATACCAAATTCTGGTGTTAATGCACCATGGACTCTTCAGTGCATGTTGCTTGGAGCCTTTGGTTCCTGCTGTTCACAGAATGCTGCAGATGGCTGCCTCAGCAGGAAGCCCTTCCCCCTTCCTTAATGGAGCTCGTGGGAATGCAGGGATCCTGGAACTGAAGCCCTCCTTCCCTTCCAAACCTCCTCTCCAAACCCCTACTGAGTAAAAGGAAAAAAATCCCCACATCCCTGGAAACATTTTTGCCAGCCTGTTTTTCAGTAAAATCTTAAATTAACCACTT
>URS0000DD7A4F rRNA from 1 species 
AGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTTTTCGGATCGTAAAACTCTGTTGTCGGGGAAGAACAAGTATGATAGTAACTGATCGTACCTTGACGGTACCCGACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCTCGCAGGCGGTTCTTTAAGTCTGATGTGAAATCTTGCGGCTCAACCGTAAACGTGCATTGGAAACTGGAGGACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAAC
>URS0001657D77 rRNA from 1 species 
CAGCCGCCGCGGGAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGCGGTTTCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAAGGTCATTGGAAACTGGGAAACCTGAGTGCAGAAGAGGAGAGCGGAATTCCACGTGTAGCGGTGAAATGCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGAGACCCCTGTAGTCCCTGTCTCTTATAC
>URS0000010E3A rRNA from 1 species 
TCAGTCGACTCCTACGGGGAGGCAGCATGGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTGTAAAGCACTTTCAGTAGGGAGGAAGGTAGTGTAGTTAACACCTGCATATTTGACGTTACCTACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCATGCAGGCGGCCTGTTAAGTCAGATGTGAAAGCCCGGGGCTTAACCTCGGAATTGCATTTGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAATACCAGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGATGCGAAAGCGTGGGGAAGCAAACAGGATTAGATACCCTGGTAG
>URS00007A8810 rRNA from 1 species 
CCTACGGGAGGCAGCAGTAAGGAATATTGGACAATGCTCGCAAGAGTGATCCAGCCATGCCGCGTGCAGGAAGACGGCCCTATGGGTTGTAAACTGCTTTTGAACTAGAGAAAACCCTTCTACGTGTAGAAGGCTGATAGTATAGTTAGAATAAGCATCGGCTAACTTCGTGCCAGCAGCCGCGGTAAGACGAAGGATGCAAGCGTTATCCGGATTCATTGGGTTTAAAGGGAGCGTAGGTGGACTGATAAGTCAGTGGTGAAATCTCCGTCGTACCGTAACGAAGTAAGTCGACT
>URS0001848EE8 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGAATCATTGGGCGTAAAGTGCGTGTAGGCGGTCCGGTAAGTCCGCTGTGAAAGTCGGGGGCTCAACCCTCGAAAAGCCGGTGGATACTGTCGGGCTAGAGTGCGGAAGAGGCGAGTGGAATTCCCGGTGTAGTGGTGAAATGCGTAGAGTATCGGGAGGAACACCAGTCGGCGAAGGCGACTACCTGGCC
>URS0001910395 rRNA from 1 species 
CCCTTAGATGTCCTGGGCTGCACGCGCGCTACACTGATGCGCTCAACGAGTTTACGATCTTGCCTGAAATGGCTGGGTAATCTTTTTAAAATGCATCGCGATGGGGATAGATCATTGCAATTATTGATCTTCAACGAGGAATTCCTAGTAAGCGCGAGTCATCAGCTCGTGCTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTCCTACCGATTGAGTGATCCGGTGAATAATTCGGACTGACGCAGTGCTCAGCTTCTGGACGTTGCGTCGGAAAGTTTCATGAACCTTATCACTTAGAGGAAGGAGAAGTCGTAACA
>URS00006E6EF3 rRNA from 1 species 
TGGGGAATATTGGGCAATGGGGGAAACCTTGACCCAGCAACGCCGCGTGAAGGAAGAAGGTCTTCGGATCGTAAACTTCTATCCTCGGTGAAGAGGAGAAGACGGTAGCCGAGAAGGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTGTCCGGAATGATTGGGCGTAAAGGGCGTGTAGGCGGCTAAGTAAGTCTGGAGTGAAAGTCCTGCTTTTAAGGTGGGAATTGCTTTGGATACTGCATAGCTAGAGTGCAGGAGAGGTAAGTGGAATTCCCAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTGCTGGACGATGACTGACGTTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGACTACTAGGTGTCGGGTAGCAGAGCTATTCGGTGCCGCAGCCAACGCAATAAGTAGTCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCTGCTCTTGACATCTCCCTGACCGGACTGTAATGAGTCCTTTCCCTTCGGGGACAGGGATGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCTTTAGTAGCCAGCGGTTTGGCCGGGCACTCTAGAGAGACTGCCAGGGATAACCTGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGAGCAGGGCTACACACGTGCTACAATGGCGTAAACAAAGGGAAGCGAGCCTGCGAGGGTAAGCAAATCTCAAAAATAACGTCTCAGTTCGGATTGTAGTCTGCAACTCGACTACATGAAGCTGGAATCGCTAGTAATCGCGAATCAGAATGTCGCGGTGAATACGTTCCC
>URS00022CA99A rRNA from 1 species 
TGGGGGATTTTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGAGGGATGAAGGCCTTCGGGTTGTAAACCTCTTTCGCTGGGTTGAAAGGCCATGCTTTGGGTGTGGTTGATTTGAACTGGTAAAGAAGTACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTACTAGCGTTGTCCGGATTTATTGGGCGTAAAGGGCTTGTAGGTGGTTTGTCGCGTCTGTCGTGAAATCCTGTGGCTTAACCATGGGCTTGCGGTGGGTACGGGCAGGCTTGAGTGCGGTAGGGGAGACTGGAATTTCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGTTACTGACACTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS0000A0C1A7 rRNA from 1 species 
GTGAATGCTGGCGGCGTGGATGAGGCATGCAAGTCGAATGGGTTTAGACCCATGGCAGACGAGGTAGGAACACGTAGGTACGTACCGGAGAGTCAGGGATAACCTGGAGAAATCCGGAATAATACTTGATGGTCCCGAGAGGGTAAAGATTTATCGCTCTCTGAACGGCCTGCGTTCTATCAGCTTGTTGGTAAGGTAACGGCTTACCAAGGCTACGACGGATAGGGGAGGTGAGAGCCTGACCCCCACCGATGGAACTGCGACACGGTCCATACTCCTACGGGAGGCTGCAGTCGAGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCGACGCCGCGTGGTAGATGAAGTCCTTAGGGACGTAAATACCTTTTATGAGGGAAGAAGTTTATTGACGGTACCTCATGAATAAGGGGCTCCCAATTCTGT
>URS000254C320 misc_RNA from 1 species 
GAAGTGCGATAAGCAGTGCGAATTGCAGAACCGTGAGTCATCAGATTTTTGAACGCAACTGGCGCCGATTGGTCCTCCAGTCGGCATGCTTGTTTCAATATCTTGTTCTCTCATCACCCAAATCTTAATGCTAGAGATACCCTTCTCTGGTTAAGTATGAAAGCACTCTGTACTCTGCAGGCAATCCTTCGGGAGTTGCACTCAATGCAGCAGTCACATTGATTACAGTGTGAACTCATTGAGAGTTGAGAACAGTTCAGCTATGCTGTTAGTGCTTAGATAACTAAACTTACTTGCATTTGAAATCAAGCAGGATCACCCGCTGAACTTAA
>URS000255DEA3 misc_RNA from 1 species 
TCGCGGCTTATCACCGGCAGTCCCCTTAGAGTGCCCAACCTAATGATGGCAACTAAGGGCGAGGGTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACACGAGCTGACGACAGCCATGCAGCACCTGTGTTCCAGCCAGCCGAACTGAAGGGGTCCATCTCTGGTCCCCATACTGGACATGTCAAAGGTTGGTAAGGTTCTGCGCGTTGCTTCGAATTAAACCACATGCTCCACCGCTTGTGCGGGCCCCCGTCAATTCCTTTGAGTTTCAGCCTTGCGACCGTACTCCCCAGGCGGGGTGCTTAACGCGTTAGCTAAGGCACCGCAGGGGTCGATACCCGCTACACCAAGCACTCATCGTTTACGGCGTGGACTAC
>URS000043B807 rRNA from 1 species 
TCGAGACCGAAACACAACGAGCGATTTTGTGAACCTGTAAAAATAAGCGGTGGCTCTTGCTGCTGCGATAAAATCCACCCGAGTCATCGCCTCATCCCCTCTTTGGGGTGGGGACGTGATGAAGGATGGATGAACCCTCAAATCGGCGCAGCGTTGCGCCAAGGGAATCTTGAAGCACAAGCCCATAAATGGGTTTCGTGGGATGGGGTGCTGTCGCACGCCATATTGATTGACACGACTCTCGGCAATGGATATCTCGGCTCTCGCATCGATGAAGAGCGCAGCGAAATGCGATATGTGGTGCGAATTGCAGAATCCCGCGAACCATCGAGTCTTTGAACGCAAGTTGCGCCTGAGGCCAACCGGCTGAGGGCACGTCCGCCTGGGCGTCAAGCATTTTATCACTCCGTGCCTACTCTCCCATTCATGGATGTGTTGCTAAGGCTCGGATGTGCACGGTGGCTCGTCGTGCCCCTTGGTGCGGCGGGCTGAAGGGCGGGTCATCTTCTCGTTGGCTGCCAACAATAAGGGTGGATTAAATAAGGCCTATGCTATTGTGTCAAGCGCGCCCGAGAGATGGTCATACTTTTTAGGTGATCCCAATTCATGCGTTGATCCATGGATGGCGTATCGAAT
>URS0001EC40D3 rRNA from 1 species 
ATTGAACGCTGGCGGCATGCTTTACACATGCAAGTCGAACGGCAACAGGCCGCAAGGTTCCGCCGAGTGGCGAACGGTTGCGTAATGCATCGGAACGCGCCCAGTCGTGGTGGTTAACTACGCGAAAGATTAGCTAATACCGCATACGACCTCTGGATGAATACGGGTGACAGTAAGGCCTCGCTCGACTTGACCCGCCGATGTCAGATTAGGTAGTTGGTGGGGTAAAGGCTCACCAAGACAACGATCCGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGAACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGCGCAAGCCTGATCCAGCAATGCCGCGTGCAGGAAGAAGGCCTTCGGGTTGTAAAGTGCTTTTGTAGGGAAAGAAACGGATCTGATTAATACCCGGGGCTAATGACGGTACCGAAAGAATAAGCACCGGCTAACTACGTG
>URS000126A115 rRNA from 1 species 
TACAGGGGGTGCAAACGTTGCTCGGAATCATTGGGCGTAAAGCGCACGTAGGCGGTCTGTTATGTCGGATGTGAAAGCCCTCGGCTCAACTGAGGAAGTGCATCCGAAACTGGCAGGCTAGAGTACTAAAGAGGGTCGCGGAATTCCCGGTGTAGAGGTGAAATTCGTAGATATTGGGAGGAACACCAGTGGCGAAGGCGGCTACCTGGACCGGTGCTGACGCTGATGCGCGAAAGCGTGGGGAGCAAACAGG
>URS00016D22DE rRNA from 1 species 
TACGGAGGGTGCAAGCGTTATCCGGATTCACTGAGTTTAAAGGGTGCGTAGGTGGCTTTGTAAGTCAGTGGTGAAATCTTAGAGCTTAACTCTAAAACTGCCATTGATACTGCTTAGCTTGAATCAAGTAGAGGTGGATGGAATAATACATGTAGCGGTGAAATGCTTAGATATGTATTAGAACACCGATTGCGAAGGCAGTTCACTATGCTTGTATTGACACTGAGGCACGAAAGCGTGGGGATCAAACAGG
>URS0000FAD9B3 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGAAGCGACTCAAAGTTTTCGGACAGAGAGTTGACTGAGTGGCGGACGGGTGAGTAACGCGTGGATAACCTGCCTCATACAGGGGGATAACAGTTAGAAATGACTGCTAATACCGCATAAGCGCACAGTACCGCATGGTACAGTGTGAAAAACTCCGGTGGTATGAGATGGATCCGCGTCTGATTAGCTAGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGACCTGAGAGGGTGACCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAAGAAAATAACGGTACCTGACTAAGAAGCACCGGCTAAATACGTGCCAGCCGCCGCTCGTAAAAC
>URS000049D5CE rRNA from 1 species 
ACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGGATGCGTATCGGAAAGCTTCGGCCGGAAGATACGTTATCTAGTGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTTATGGAGGGGGATAACAGAGAGAAATCACTGCTAATACCGCATAAGCACGCAGTACCGCATGGTAGAGTGTGAAAAGATTTATCGCCATAAGATGGACCCGCGTCTGATTAGCCAGTTGGCAGGGTAAAAGCCTACCAAAGCGACGATCAGTAGCCGATCTGAGAGGATGACCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCCATCAGCAGGGAAGATAATGACAGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGAGTGGCAAGTCTGAGGTGAAAACCCTGGGCTCAACCCTGGGACTGCTTTGGAAACTGTTAATCTAGAGTGTTGGAGAGGTAAGTGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAAGAACACCGGAGGCGAAGGCGGCTTACTGGACAATAACTGACGTTGAGGCTCGAAAGCGTGGGGATCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGAATACTAGGTGTCGGGGAGCAAAGCTTCTCGGTGCCGTCGCAAACGCAATAAGTATTCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGAG
>URS000101C2DC rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGTTCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGTGTGTCAAGTCAGGCGTGAAAGCCCCGGGCTCAACCTGGGAACCGCGCTTGAGACTGGCACGCTCGAGTTCGGGAGAGGATGGTGGAATTCTCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCGATGGCGAAGGCAGCCATCTGGACCGACACTGACGCTGAGGCGCGAAAAGCGTGGGGAGCAAACAGG
>URS000172D02F rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAGTGGCGAACGGGTGAGTAATACGTGGGTAACCTGCCCTCTTTCTGGGATACGCCTTTGCAACGGGGACTAATACCGAATATAGGGGGATGGGCTCGCGGCCTATCAGCTGGTTGATGGGGTGATGGCCTACCAAGGCGGTGACGGGTAGCCGGCCTGAGAGGATGAGCGACATAAGTGGGAATGAGAAAAGGCCGAGAGTCGTACGGGTGGGAGCAGTGGGGGATATGGCACAATGGGGGAAAGACAGATGCAGCGACGCCGCGTGGGGGATGAAGGCAAGCGGGTTGTAAACCTGTTTAGCTATCGAACGGGTAGGTGGAGAAGAAGCGCCGGCGAACTACGTTCCAGCAGCCGCGGTAATAC
>URS0000A77429 sRNA from 1 species 
TTTTTGGGTGATTAAAATCCATATATTTTGTTACACTAGTTTTCATTCTATTTGAGACAACACGTTTTGTATGTTTACACGATTGTACGGCCACCTCCAAACCACGGGTTCGATGACAGATCAGTGATCACCTCTTTATTGGTTTAGCAAACGACGGCCCTAACCTCGATCCTTTCTCTCGGTTCCTTCTCTAATGGGT
>URS00004E56CD rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGAGTTCCTTCGGGGACTTAGTGGCGAACGGGTGAGTAACGCGTGAAGAACCTGCCTTTCAGTGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATAACATATATTGTGGGCATCCACGATATATCAAAGGAGCAATCCGCTGAAAGATGGGCTCGCGGCCGATTAGCTAGATGGCGGGGTAACGGCCCACCATGGCGACGATCAGTAGCCGGTCTGAGAGGATGAACGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGAGGCAGCAGTGGGGAATATTAGGCAATGGGGGGCAACCCTGGACCTAGCAACGCCGCGTGAAGGAA
>URS000163D073 rRNA from 1 species 
ATACGTAGGTGACAAGCGTTATCCGGATTTACTGGGCGTAAAGGGCGTGTAGGCGGTCTTGCAAGTCAGAAGTGAAATTCCTGAGCTCAACTCGGGCGCTGCTTCTGGAACTGCAGGACTTGAGTGCTGGAGGGGATAGCGGAATTCCTAGTGGAGCGGTAAAGTGCGCAGATATTAGGAAGAACACCGGTGGCGAAGGCGGCTATCTGGACAGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGGTTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATACTAGGTGTAGGGGGTATCGACTCCCTCTGTGCCGCAGTTAACACAATAAGTATTCCGCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAATGAATTGACGGGG
>URS00025C2B18 rRNA from 1 species 
ATGGCGATGGAGACGCCCGGGCAGGAAGGGCTCGATCCGGATGAACCAGCTCGCACCGAGCCCGGCCGCCTCAACAGGAGCTCGTATCTCTGCCTGCCAGCGGCTCACCGGAGCCGCCACTGCCGGCGACTGCCTCCCTCACCTTGTGCCCCTCCTCCTTCGCCTTTCTTCCTCTCTTCCCCGAGGAGCGGGGAGCCGGCGAATCCATCGGTCAGGAGCTGGGCGGCGCCCTCCATCATCGCCGTTGTTTGGGGAGGGACGCGGTCCTGGTCGATGCGGTATGGGGCGGGCGACGCGGGGCAGGAGGTGGCGGCGGGATGGAGGTACATGTGA
>URS0001D99DCB rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCGAAAGTTCTTCGCTATGTGTAAAGCGGCGGACGGGTAAGTAATGCATGGGAATTTGCCTGGTAGTGGGGGACAACGTCTCGAACGGGACGCTAATACCGCATTAGCCCTACGGAGGCAAGGGGGGGTTCTTCGGACCTCTCGCTATCAGCTGAGCCCATGTCAGTTTGGCTCGTTGGTGGGGTAAGGGCCTACCAAGGCGACGATCGGTAACTGGTCTGAGCGGAGGATCAGTCGCACTAGAACGGGAACACGGTCCATACTCCTACGAGAGGCAGCAGTGGGGAATAGTGGACAATGGTCGAGAGCCTTGTCCAGCGAGGGCGAGTGTGTTGAGAAGGCCTTGGGGTTGTAAAGCACGTTCAGTGGTGATAAAGGTTTTTTACTTGATACGTAGGCAGAGTGATGGTACCTGCAGAAGAAGCACCGGCTAACTCCGTG
>URS00025F9C51 lncRNA from 1 species 
TAGCTTTGAGAAACCTAGCCACACTTTCAGCACTCAGGCCTTTAGTGCTCATTGGAATAAGGTCCCCGCAATCCAATGTCGACCTACAAATGAAGTTTTTTACGGACAGGAGCATTTTTCTTCAACATGGAACTAACAGTCATGATTTTCTTCTCATAACGTAAATCTGAAAGGTCACTTGTTACATCCGACATCGGGCTGAAAATGTATACACATTGCATTGTGTTAAAAAGAATTATGATGGAAAAATAGTGAGATCTCTCTTTCTAGACTGTAGGGTGATGAACCTGTACCAATCATACTGTCTGTCTTATTTATCTGACAACTGTCCCGATACTGAAGAAAATGTTGACAGACAACACAATTAGGCTAGGAAGACTAGATGGTCAGTGATTCAAAATTACTAAATTTGAATTGTTACATAAAAAAAGTAACTGGTTTACAAATTATCCTAACAGTCAAAATTTGTTAAAGATATATTTTTAACCATTCAAAATTCAACTTTAAAGGTGGGGGGGGCAGAATTCATCACTAATGTCCTAGCTTCGAATCTAAGTAGCTCTGAATTTGATTGTAAACTACTTCATACTTAATCTCAAAATACTATTTTTATATTTGCTTATGTGTTTCATCCTGACATCTTCAGGGTTGCTAAGAACGGCATTCATACTCCAAAATTACAATTAAGTTCAGAACTTATTAGAAACATGTTTTTCTCAAGGGAAGTATGTGGCCTATTTGCCAAGAGAGAATTTTTTGTGTCAGAGCCTGTGCTCCCCCCCCTTTGGTTTTTGAATGCATTGTGCACAAGAGAAAACTTGGTCCAGAGCTTTCTCTATAAAACTGAGTGTTAATGTAAGAGAGTTGGCCAAAAAATAAGATAACTTATGTACAGGAATTATTGTAAATAAACTTGTAGGGTAGTACACTTTTTTTCTGCGTGTTACCTCTTGTACCCACATGATGATGATGTCAACTCTCTCCCTCTTGGCTTTACAACATTTTCATAATCCTATAATGATAAATATACATTACTCATTCAATTTTAACACAATACACTGGTAGATATGGTATTAATAGATTTAATTTTATATTAAAACACGATCCGAAAACACACACTGAACATGGTCACCAATACATTAAACAAAGAGAAGCAGAGAAATATTTGTTGCATATATAAGCACATGGATTAAATAGTTTGGTTCATTAAATAATAAAGAATCTACATCAAAGTGA
>URS00009B757A lncRNA from 7 species 
AATTAGCCTCAGAGGTTTAAGACTTGCTTGCAAGTGTGCCTTCTGTTTATAGGTTAAGCTAGCTATTTTAATTCTATTATTTGTGAGTTCTCCATAGATGTAAAGTATGACGTAATTCATGTGCCAGGCCACATTGGAGATAGTCAGCTGCCATCGAGCCAGAGTTCCGCAGGCCCTCAGCCAGAGCTCCTCACCAGGGACCCTGCTAAACAGGCAAATCCGCATTCTAACACTGAGCAAAGATTCCTTTCTGAAGGTTGGGGAGTCTGGCATGCACCAATCAAAGGCCTTTCTTTATTGACCACAACACCCAAGACTGCCACCTGGGTAGCTTCCTTCCATACTCCTCACTTTAAATTTATAGCAGCAATTGCTTCTCAATGTAGTCACATGTGCTGGTATAATCTGCCTTTCTTTCTTTCTTTTTTTTTTTTTAAGATTTATTTATTTATTATATGTAAGTACACTGTAGCTGTCTTCAGATACTCCAGAAGAGGGAGTCAGATCTCATTATGGATGGTTGTGAGATGGTTGTGAGCCACCATGTGGTTGCTGGGATTTGAACTCCAGACCTTCGGAAGAGCAGTCGGGTGATCTTACCCACTGAGCCACCTCACCAGCCCGTAATCTGCCTTTCATAAGAATGAATTACAAGTAAAAATCTTGGGGTTTAGATTTTGTTTTGGTTTTTTTTGGTTATTTGAGGTAAGGTCTTATGTAGCTCAGACTGTTCTAGAACTTGCTGTATAACTGAAGCTGAACTTGAATTCCTGATTTGCCTGCTTCCACCTCCTAGGTACCACACAGAGGCCCTGTTTCTGTGGTGCTAGGATTTATTTTTATTTTATATACATTGGTGTTTTGCCTGCGTGTATGTATATCTGTTTGAAGATGTCAGATCACGTGGAGGTGGATTACAGATTGAACTTGCATCCTCTGGCCGAGCAGCGCCAATCTTAACCACTGAGCCATCTCTCTAGCCCTGGAAGCCAGGGCTTTATGCATGCTAGGCAAGTGCTTTCCAATTGAGCCACCTCTCCAGCTCTAGGGAATCTTAATATTATTTTATTCAAGGTACATTTATGCTTCTTTTGACTTAGATTAGATTTTATGAAGGTGTTCCATTTTCTAGTTTTTGGTTCACTCGTCTTAAAAACTTAGGAAGACTTTTAGTAATAATTTTCTACCTCTATATGAGACTTACTATTTTCAGAGAACTTTCAAGTTTCTATCTCATTTATTAATACTCCCAGAAAGACTCTGTGAAGCTAAGATGAACAGATATTTATTGCTATTATTGTTGTTTTCAGAATTTATTTACATTATTTTGCATGTATGACTACCTACATATGTGTCCATGGAGGCCAGAAGAGGTGTCAACACTTAAGACTTAAGAACTATTTTAAGGGGCTGGTGAGATGGCTTAGGGGTTAAGAGCGCCGACTGCTCTTCCAAAGGTCCTGAGTTCAAATCCCAGCAACCACATGGTGGCTCACAACCATCTGTAAGGAAATCAGATGCCTCTTCTGGAGTGTCTGAAGACAGCAACAGTGTACTTACATATAGTAGATAAATATTAAAAAACAAACAAACAAACAAACAAACAAAAAAAGAACTATTTTAAAAGCTATTTCAAAGGTTTGAATAGCTAAAACAAATCTAAAAGAGTTTAATAACTTAGTATAATAATATTAAGGTAATTATACTTTAACTAATCCACATAAACTGAACTTGGTTCTCTTTTTTTAAGATTCAAATAGATCTTAGTAACCTTTTTTAGTCTACCCTTCTTTCAAAGAAAGAAAATCAATATTCAGATAGGACCACAATATGTGATTCTGCTTGTTTATTCATTCATTTGTTTGATCACACCCATGCAGTTATTTATCCTGTATGTGCACATGCATGTGCACAGCATCTGTGTGGAGATCAGGGGACAGTTAACTTGTAGGGGCCTGTTCTATACTTCTGTTCTGTCATGTGAGTCCCAGGTATCACACTCAGATTATCAGACCTGGTAGTAAGCATTTAGCCCCCTGAGCCACCTCACCAGCCCAGATGTGGTCCAGTCTAATGCCACCATCTTATACCAGTTTCTGTGCAGAGAAAAACTTGATGTAGTTTGGGTTCCAATGGACTGGGCAGAATGTTCTCAGAGGCTTCGCAGTCGGCTGAAATGGGTCTCAGTGGAAGACATCACTCCTGAGCCCACTGGGGAGTGGCGTTCTCACCCATCAGTAGGACCTCCCAGCAGTATCTTCCAGAAGTAGAAATAAGTCACAAGGAAAGGAATTAAAGATGAAGTACAGTGAGGTGGCACAGCCCCTAGCCCTACCACTCAAGAGGCTGTGCGGTAGGAACACGGGAACTCCAGCGCCAGTCTGGGCTGTGAGCTCTTGTCTCAAAAAGCCAAACCATCGGTGTAAATGAAGTATAAAAGAGAATTTTATTTATTTCATTATTTTTTCATTTTCATGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGCTACACATGTACATTGCCTGCCATCCAAGGCTAGAATTAGAGTGGACCATGGTGCCTGCCTGGTGTTTGCTTATTCTTAGAATCCAGGCTTCTGTCCTCACTGTTGCATGGCAAATGCTTTAACTACTGAGCTGCTTCTACAGCTCCAAAGAGTATTTTAAAATCTATTGGCATTACAAAGCAACTGTAGCACAATGACTGGCATTATTTTAAAATGTGTATGTCGTTTTATTTATGACT
>URS000181443A rRNA from 1 species 
CACGTAGGGGGCGAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGATTTGTAAGTCAGGGGTGAAATCCCGGGGCTCAACCTCGGAACTGCCTTTGATACTGCAAATCTCGAGTCCGGAAGAGGTGAGTGGAATTCCTAGTGTAGAGGTGAAATTCGTAGATATTAGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGTCCGGTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGG
>URS00010F31BB rRNA from 1 species 
CCTACGGGTGGCAGCAGTGAGGAATATTTGTCAATGGACGCAAGTCTGAACCAGCCATGCCGCGTGCAGGAAGACGGCTCTATGAGTTGTAAACTGCTTTTGTACGAGGGTAAACGCAGATACGCGTATCTGTCTGAAAGTATCGTACGAATAAGGATCGGCTAACTCCGTTCCAGCAGCCGCCGTAATACGGAGGATTCAAGCGTGATCCGGATTGATTGGGTTTAAAGGGTGCGTAGGCGGTCGGATAAGTTAGAGGTGAAATCCCGAGGCTCAACTTCGGAATTGCATCTGATACTGTTCGGCTAGAGTGTAGTTGCGGGAGGCGGAATGTATGGTGTAGCAGTGAAATGCGTAGAGATC
>URS00003180C5 rRNA from 1 species 
GGGTGGTAAATTTCATCTAAAGCTAAATATTGGCCGGAGACCGATAGCGCACAAGTAGAGTGATCGAAAGGTTAAAAGCACCTTGAAAAGGGAGTTAAACAGCACGTGAAATTGTTGAAAGGGAAGCGCTTGCGGTCAGACTCGGGCGCAGGGTTCAGCGGGTGCGTGTCACCCGTGCACTCCCTGCCGCCCGGGCCAGCATCAGTTCTGACGGCCGGTCAAAGGCCCCCGGAATGTGTCGTCTCTCGGGACGTCTTATAGCCGGGGGTGCAATGCGGCCCGTCGGGACTGAGGAACGCGCTTCGGCTCGGATGCTGGCGTAATGGCCGTAAGCGGCCCGTCTTGAAAAACACGGAC
>URS00019A9808 lncRNA from 1 species 
TGAGTTCTTGATTAGAATAATTATATTATATGTATGTATAATATGTCAAAATATACTCTAATATCATGTATACATTAAAAGAACAAAGGAAAAGAACATCACTGGAATTGAAAAGGGCATGGTGATACAAGCTAATGGTACTAAGAACTTTTCAGTCGAATAATAGAAAAAAATTTTTTAAACTTCAAGTATTAGGTGAACATTTAGGAGTCATATAGAACTAAACATATAAAATAGCAAAAAAATCTCTCTGACACATCATAATCAAAATGCCTAACATAGTGAATAAGAATGGAATTTTAAAACTGCAAGGAAAAATGTCAGAGCCAGGCACAGTGGTACACCTGTAATCCCAGGGGCTCAAGAGGCTGCTACTTCAAATCTAGCCTTAGCAACTTATCAAGGAACTAAGCAACTTAGAAAGACCCTGTCTCTAAATAAGTTACAAATAATGGCTGAGAATGTGGCTCAGTGGTTAAGTGCCTCTTAGTCCAATCCCCAGTAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAAACATGTCAGCACACATTAGAGGTAAACCAGTGCAGACAACTCCTCAGTTCTTCACACCATTTTAAATCCAGGAAGGCATAGAATGAGGTTATCTGATCTCTGAAAGAAAATTCCCAACCAAGATCACTATATACAGCAAAACCATCCTTTAGAATCAAATAAAAAATAAAAACTTCCAAAAATGAGAATATACTAAAAGAATTCATGACTACAAGGTAGCACTACATAAAATACTTAAAAAAATACTATCCATAGAAGAATTTAAAAATAATCTCAACTTGCCTCTAATGTGGGCTGCCATTTTTCTCTTTCAGCTTTTAAAATTCTATCTTTGTTCTGTGTAGTAGATGGTTAATTATGATGTGTCTTGGGAAGGATGTTTTTTCATCTTATCTATTTGGGGTTCAAAATTCCTCTTGTATTTGGATTTCACTTCATTCCTACAGTTTGGAAAACTTTTTGATATAGTTTCACTGAAAATTTTATACATTTCTTTAGTTTGTGTCTTGGTGCCTTGTTCACAAAGAGTCTTAGAATTGAGCTCTTAATGCTATCTCTGATTTCTTGTATATTCTGGTCATGATTTGTTACCTTTCATTTATTGTTGACTTTGCTTTTAAAATTGTATACTTCATCTTTGATATTAGAAAATCTGCCTTATGTGTGGTCTAATATATTGGTGATGCTTTCAGCTGAATTTTTTATTTGATTTATTATTTCTGTTCCAGAATTTGTTCTTTTCAAAAATTTCTGTTTATTTTAATATTATATCATTTCTGGTATATTATCTCTTAGTTCACTTCATAGCTATGCCTTTAGTACACTGAAAAATTTAATTAGCAGCTGTTTTAATCAGCTTATTTTGCTACTGTGAACTCAAGACCCATCAAGAAAAATATTAGAGGAAGAAAACTTGATTTGGGGGCCAACGGTTTCAGAGGTCTCAATCAATAGACAGCAGGCTCCCATCCTCAGGGCTCAAGGTGAGACTACTCATCATTGCAAAGGGAAGCAGTTCACATGATGAACAAAAGGCAGAGAGAGCGGTCTCCACTTGCCAGATACAAATATATACCTCCAAACCATGTCCTCAATTCCCACCTCAACCAGCTACAACCCACCACTGCAGTTACTACTCAGTCAATACCTATTAAGGGATTAATTCACTGGTTAGTTAAGACTCTCACAACTCTATTATTTCTCCTCAGAACCTTCTTGCGTTTTCTCACACATAAGATTTTGGGGAACACTTCATATCCAAATCATACATAAATTTTCTAAATTCTTTTTCTGGCATTTCCTCCATTATGATATCAATGGGATTAGTTGTATTGTGGGGTATTCGGAATGACTTGATTCATTGCTTTCCATATTGTTAGTATTCCTTAAGGGATATTTATCTCTTTTGCTTTTATATAAAGGACATTTTCTTGTTATGCTGTGGGTTGGGTGAATGCCTTGAGGTCCACATTTTCACTCAATTTAAATTTCCTATTATGTCTAGTCTCTAAGAGGACACTGAGAGGAGAGAGATTAATTTCAAGTAGTTACAACCACTTCAGAACAATTTCATACTCATAAATCTTTTAAAAACGTATTACAAATGTTCTCCAGAAATCCACTAGTCTGAGTGGTAAATGGGGGTGATTTTATTTAATTGGTTGATAAATTAGTTA
>URS00020D7727 misc_RNA from 1 species 
GACGAAGAAACGCAGCGAAATGCGATAAGTAATGCGAATTGCAGAATTCAGTGAGTCATCGAATCTTTGAACGCACATTGCGCCCCGTGGTATTCCGCGGGGCATGCCTGTTCGAGCGTCATTTCAACCCTCAAGCCTGGCTTGGTGTTGGGCTCTGCCGTCCGCGGCCGGCCCTAAAGACAGTGGCGGCGCCGCATGGCCCTGAGCGTAGTACATCTCTCGCTCCAGGGCCCCGCGGTGGCCTGCCAGAACCCCCAACTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS0002581D6F miRNA from 1 species 
TGTGTATTTAGCAGTCTGTGTGTGTGTGTGTATTTAGCAGACTGTGTACTCAGCAGTCTGTGTGTATTCAGCAGTCTGCTAAATACCCATACAGACAGACTGCCGAGCAC
>URS00017F4189 rRNA from 1 species 
TACGGAGGGTGCAAGCGTTATCCGGATTCACTGGGTTTAAAGGGTGCGTAGGCGGGCAGGTAAGTCAGTGGTGAAATCTCCGAGCTTAACTCGGAAACTGCCATTGATACTATTTGTCTTGAATATTGTGGAGGTAAGCGGAATATGTCATGTAGCGGTGAAATGCTTAGATATGACATAGAACACCAATTGCGAAGGCAGCTTACGACACAATGATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGG
>URS00025256B9 misc_RNA from 1 species 
TCCGGTTTGTCACCGGCAGTCTCGCATGAGTCCCCAACTGAATGCTGGCAACATGCGACGGGGGTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACACGAGCTGACGACAGCCATGCACCACCTGTGAAGGTGCCCCGAAGGGAGGCCGTGTTTCCACGACTGTCACCTACATGTCAAGCCCAGGTAAGGTTCTTCGCGTTGCCTCGAATTAAGGCACATGCTCCGCCGCTTGTGCGGGCCCCCGTCAATTCCTTTGAGTTTTAGCCTTGCGGCCGTACTCCCCAGGCGGGGCGCTTAATGCGTTAGCTGCGGCACGGAACTCGTGGAATGAGCCCCACACCTAGCGCCCAACGTTTACGGCGTGGACTAC
>URS00002B3B99 rRNA from 1 species 
GGAAAACCGTAGAGATACGGTCCCCCCTTGTGGTCGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCTTATGTTGCCAGCACGTGATGGTGGGGACTCGTAAGAGACTGCCGGGGTCAACTCGGAGGAAGTGGGGACGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCGACACATGCTACAATGGCCAGTACAGAGGGCTGCGAGACCGTGAGGTGGAGCGAATCCCTTAAAGCTGGTCTCAGTTCGGATCGGGGTCTGCAACTCGACCCCGTGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGCCTT
>URS00000C876E sRNA from 1 species 
TGGAGAGGTGGTCCAGGGTTACGTAAA
>URS00005C10BC rRNA from 1 species 
GATGAACGCTAGCGGCAGGCTTAATACATGCAAGTCGAACGGGATTTAGGGGCTTGCCCTTAATGAGAGTGGCGCACGGGTGAGTAACACGTACACAATCTACCTTGTACAGGGGGATAGCCTTGGGAAACTGAGAATAATACCCCATAGTTTTTAGTTATCGCATGATGATTAAAATAAAGCTGAGGCGGTACAAGATGAGTGTGCGGATGATTAGGTAGTTGGAAGGGTAACGGCCTCCCAAGCCGACGATCAATAGCTGGCGTGAGAGCGCGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTGGACAATGGGCGGAAGCCTGATCCAGCCATGCCGCGTGGAGGATTAAGGCCCTCTGGGTTGTAAACTTC
>URS0000CDD785 rRNA from 1 species 
TTTAATTGAAGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGTAACAGGAATTAGCTTGCTAATTTGCTGACGAGCGGCGGACGGGTGAGTAA
>URS000241D8E8 lncRNA from 1 species 
GAAACTTGATCTGAGTGAAACCGCAATTGAAAGTCTACCTGCAAGCATTGGTAATTTGGAATCTCTTGAGAACCTTGATTTGAGTGGAACCGCAATTAAAAGCCTACATGCAAGCATTGGTAAATTGCAATATCTTCAGAAATTTTATCTGAGTGGAACCGCAATGGAAAGCCTACCTGCAAGCATTGGTAATTTGAAATGTCTGGATAAACTTGATCTGAGTGGAACCGCAATTAAAAGCCTACCTGCAAGCATTGGTAGTTTGAGATCTCTTGAGAAACTTGATCTGAGTGGAACTGCAATTGAAAGCCTACCTTCAAGTATTGGTAGTTTGAAATCTCTTGAGAACCTTGATTTGAGTGGAACCGCAATTGAAAGCCTACCTGCAAGCTTTGACAATTTGAATTCTCTTGTGAAACTTGATCTGAGTGGAACCGCGTTTAAAAGCTTACCTGCAAGCATTGGTAATCTGAAATCTCTTGAGAAACTTGATCTGAGTGGAACCGCAATTGAAAGCCTACCTGCAAGCATTGGTAATTTGAAATCTCTTGAGAAACTTGATCTGAGTGGAACCGCTGTTGAAAGCCTACCTGCAAGCATTGGTAATTTGGAATCTCTTGAGAAACTTGACCTAAGTGGAACAGCAATTAAAAGCCTACCTGCAAGCATTGGTAATTTGGAATGTCTTGAGAAACTTGATCTGAGTGGAACCGCAATTGAAAGCCTAC
>URS00006EC10E SRP_RNA from 2 species 
GCTGGGCGTGGTGGCACGTGCCTGTAGTCCCAACTTCTCGGGAGGCTGAGGTGGGAGGATCGCTTGAGCCCAGGAGTTCTGGGCTGTAGTGCGCTATGTCAATTGGGCGTCCGCACTAAGTTCGGCATCAATATGGTGATCTCCCGGGAGTGGGGGACCACCAGGTTGCCTAAGGAGGGGTGAACTGGCCCAGGTCAGAAATGGAGCAGGTCAAAACTCCCGTGCTGATCAGTAGTGGAATCGCGGCTGTGAACAGCCACTGCACTCCAGCCTGGGCAACATAGCGAGACCCCATCTCTA
>URS00007D8A7A rRNA from 1 species 
TGAGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCAGTTACCTAATACGTATCTGTTTTGACGTTACCGACAGAATAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATACAGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCGCGTAGGTGGTTTGTTAAGTTGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCAAAACTGACAAGCTAGAGTATGGTAGAGGGTGGTGGAATTTCCTGTGTAGCGGTGAAATGCGTAGATATAGGAAGGAACACCAGTGGCGAAGGCGACCACCTGGACTGATACTGACACTGAGGTGC
>URS0001F1218A rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCCTTTGGGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGCGTAACCTGCCCTTGACTTCGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAATCCTTGCTGCATGGTGGGGGTTGGAAAGCTTCGGCGGTTTTGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCTGGCCTGGGAGGGCGACCGGCCACATTGGGACTGAGATACGGCCCAGACGCCTACGGGGGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCAGCAGGGGCGAAGCTTGTGGTGACGGTACCTGCAGAAGAAGCACCGGCTAACTACGTG
>URS000062BC82 tRNA from 2 species 
GGGATTGTAGCTCAGTGGCAGAGCACTTGCCTAGCACATATGAGCCACTGAGTTCGATCCTCAGCCCCA
>URS000041D298 rRNA from 1 species 
AGTCGAGCGAACGGATGAGAAGCTTGCTTCTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATTTTGAACCGCATGGTTCAAAAGTGAAAGACGGTCCTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTGGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAAACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACATATGTGTAAGTAACTGTGCACATCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTATCCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGTTTTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGAAAACTTGAGTGCAGAAGAGGAAAGTGGAATTCCATGTGTAGCGGTGAAATGCGCAGAGATATGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGTCTGTAACTGACGCTGATGTGCGAAAG
>URS00020E5DB6 misc_RNA from 1 species 
GATGAAGAACGTAGCGAAATGCGATAAGTAGTGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCATGGGGCATGCCTGTTCGAGCGTCATTTGTACCTTCAAGCTTTGCTTGGTGTTGGGTGTTTGTCCTGAGGGACTCGCCTTAAAGTAATTGGCAGCCAGTGTTTGGTTTTGAAGCGCAGCACAAGTCGCGATTCAAGGCTATACACCAGCTTCCACAAGCCTTTTTCACTTTTGACCTCGTATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS0002614DC9 lncRNA from 1 species 
GAAACAAGAGAGTGTGAGAATTGTCACGTGATCTCGATGACGCAACAGTATTAACCACTGTATTTAAGGCTTTTCTTTTGGCAATTGTGACAAATATTTGTGCCAGATGGTTTTCATACATCATGTGATGTACAAAACACGTCATTCTTTTATTAAGAAAGAGAACCTGACTTCAGTATCCTAGCGTACTTAGTAATCAATAGTTTCGTAAAGTTGTTCTTGTTTGTATACTTTGAGTGCGTGTTGTAATTATATTATAGTTGATAGTGGAGTATAATTATGAAGCTGAAGATCAAAGTAACATATTGTGGTGCCTGAGGGTACGAGCCCAAGTTCCAGAAACTTCAAAAGGAACTTGAGCAGAAATTTCCTGGAAAGTTAGACATTGTAAGTTACTACTTCATGCATTTGTGATTTGCAAAAAGGTTGT
>URS0000D36178 rRNA from 1 species 
AGTCGTACGAACAGCGGAAAGTGCTTGCACTTTCCAAGTAAGTGGCGAACGGGTGAGTAACACGTGAATAACCTACCTCAAAGACTGGGATAACCATTGGAAACAGTGACTAATACCGGATAAAACCCAGTAGCACATGCTACAAGGTTAAAAGCTGCGTTTGCAGCGCTTTAAGATGGATTCGCGGTGCATTAGTTAGTTGGTGAGGTAAAGGCTCACCAAGACAATGATGCATAGCCGAGTTGAGAGACTGACCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCTGCAGTAGGGAATCTTCCACAATGGGCGCAAGCCTGATGGAGCAACGCCGCGTGTGTGATGAAGGCTTTCGGGTCGTAAAGCACTGTTGTATGGGAAGAACGGGTTTAAGAGGAAATGCTTAAGNAGTGACGGTACCATACCAGAAAGGGACGGCTAAATACGTGCCAGCAGCCGCGGTAATACGTATGTCCCGAGCGTTATCCGGATTTATTGGGCGTAAAGCGAGCGCAGACGGTTCGATAAGTCTGAAGTGAAAGCCCACAGCTCAACTGTGGAATGGCTTTGGAAACTGTCGAACTTGAGTGCAGTANAGGTAAGTGGAACTCCATGTGTAGCGGTGGAATGCGTAGATATATGGAAGAACACCAGTGGCGAANGCGGCTTACTGGACTGCAACTGACGTTGANGCTCGAAAGTGTGGGTAGCAAACAGGATTAGATACCCTGGTAGTCCACACCGTAAACGATGGATACTAGTTGTTANAGGGTTTCCGCCCTTTANTGACGAAGCAACGCATTAAGTATCCCGCCTGGGGAGTACGACCGCAAGGTNANACTCNAGNAAT
>URS0001AD154A rRNA from 1 species 
CCTGGTTGATTCTGCCAGTAGTCATACGCTCGTCTCAAAGATTAAGCCATGCATGTCTAAGTATAAATACTTGTACTTTGAAACTGCGAACGGCTCATTATATCAGTTTTAATCTACTTGATAGTCCCTTACTACTTGGATAACCGTAGTAATTCTAGAGCTAATACATGCGTCAATACCCTTCTGGGGTAGTATTTATTAGAAAGAAACCAACCCCTCCGGGGTGATGTGGTGATTCATAATAAGCTTGCGGATCGCACGGCTTTTGCTGGCGATGGATCAATCGAGATTCTGCCCTATCAGCTTTGGATGGTAGGGTATTGGCCTACCATGGCTTTAACGGGTAACGGGAAATTAGGGTTTGATTCCGGAGAGGGGGCCTGAGAGATGGCCACCACATCCAAGGAAGGCAGCAGGCGCGTAAATTGCCCAATCCTGACACAGGGAGGTAGTGACAATAAATAACAATGCCGGGCCTTTTTAGGCCTGGCAATTGGAATGAGAACAATTTAAACCCCTTATCGAGGAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTGTGGGTGGAGCGACCGTCCCGACGCTTTGCGTGGGTGATGGTCGTCTCCGTCCATCTTTGGGTGGAATCCGTGTGGCATTAAGTTGTCGTGCGGGGGATGCCCATCTTTTACTGTGAAAAAATTAGAGTGTTCAAAGCAGGCTTACGCCGTTGAATATATTAGCATGGAATAATGAGATAGGACCTGGGTACTATTTTGTTGGTTTGCGCACCGAGGTAATGATTAATAGGGACAGTTGGGGGTATTCGTATTCCATTGTCAGAGGTGAAATTCTTGGATTTTTGGAAGACGAACGACTGCGAAAGCATTTACCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGATGATTAGATACCATCGTAGTCTTAACCATAAACTATGCCGACAAGGGATTGGTGGGCGTTGTTTTGACCCCATCAGCACCTTATGAGAAATCACAAGTTTTTGGGTTCCGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGAAATTGACGGAAGGGCACCACCAGGAGTGGAACCTGCGGCTTAATTTGACTCAACACGGGAAAACTTACCAGGTCCAGACATAGTGAGGATTGACAGATTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCCCTGCCTGC
>URS0000B34B7F misc_RNA from 1 species 
ATAAAAGTACCTCAGGCTGAGAAGAATTTGCAGATGAATGATATATCTTTCTATTTGTTAGTGTCAGTGCAAAAGTTTGTTTGAGACTTGGCCACTTTAAGTGAACAAGATATAAGATTGATTTATGGCTTACATACAAGATCAATTGTTCAAAAATGTTAATAAAAAATATAAAAAATTTCATATAAGATAAATTCATTACTTGGCCAAAAACATAAACTCCATGAGAGAGTGTCAAGTACATAAGAACATTGAAAGAAGTAAAATGGGAAAAAAGAACCTGGCTTACTCTAGGTTTTATTGTTGTGAACATCCTCATTTAAGAATTTTAATTAGCGATAAGGTAGCCAACTATGCTTTATTTTTTTTCTTTTTTGAATGAATGCTTTAAATTAATTTAAAAAAAATAATAACTTCAATTAGCAACAAATAAAAGCAATAATAATACTAATCTAAGAGAAGATGTTTAGAATAGCCTGGGATATGTCGATCGAGGCACGCAAATTCTGCGCTGTCCTTAGAGGTTAGCTAAGCTACTCCTATGATTGTTTTTTCATATTTGTTTACTTGAACCACCCTTCAACTTAATTGTCCAAGTGTTCATAGAGATAAATCAAAACTGTAATCAAATTTATATGTAATTTACTTGTTTAAGAATCACATTTTTGAACATTAAAAACTTGTTAGGCTTCTGCACAGTGACAAAGCCCAAGCCCAG
>URS000228E453 misc_RNA from 1 species 
AACTTTTGGCAACGGATTACTCGGCTCGTGTGTCGATGAAGAGCGCAGCCAGCTGCGTGAATTAATGTGAATTGCAGGACACATTGAACATCGATATCTTGAACGCATATTGCGGCCTCGGGCAATCCCGAGGCCACGCCTGTCTCAGGGTCGGTTGAACGTCAATCGCGAAGCTGCTCTCCTCGCTCGCGCATTGGGCGTCGCAGTCGCTACCAGCGGCTGCGTCGCCTCAAGTTCAGACGGGTTGCTCGGTCTTCGACGCGTTCGCCTGACCGGGACGGTGACTCGACTCTCGTAGAGCGCACCATCTCCCGGGTCGTGGCGATTGTCGCTGACGTGCGGCGACCGCAAACATACTCACACTGACTTCGACCTGAGATCAGACGAGATTACCCGCTGAATTTACGCATATCAATAAGCGGAGGCT
>URS0001A2104B lncRNA from 1 species 
GTGGAGGCGAAGTCAAGATCGAGAGCCGGAAGGTCAACTTTAAGGAGAAAGCTCAGCCCAAGGTGAGCTCGATGGATAATGTTAATCACGAGCCCGGAGGCGGGAATGTCAAGGCTGAGGGGGCGCAGGAGACTGCTGAGGGCAGCGGGGCTCCCTCTAGTGGTGTCTCAGCAGGCCCTGCCCAGGAGAATGGGCTGAAGGAGGGCGCCCCCTGCAGGAGTGAGGAGCTCCGGGACCCGCAGGGCCTGGACTCGCTCATCCCTGAAACAAGCATCTAACTCGACTTTTTGCTATCACTCTGCCCTCTTCATTTCCCCCCCCCGACCGCTTCCTCTCCTCCCCTTCTTTATGTCCTGTCCCTCCTCTGTCCTGTCTTTCTCCACACTCTCTGATGCAGATTGAGTCTTTCAAGCTAAATTTCCGCGAGAAGGCCCGCTCTCGCACGGACCACGGCGCCGACATCATCACCTGGCCCGTCTCGGGTGACAGCCCTGCCCCCCCCCACCTCGCTCCGCAGCAGCGTCTCGCTCAACGACTCCCTCGCGACCGCCGGCATCCCTCGCTCTCACACCACCCCGGCCCTCTCCTCCTCACAGGAACAAGGCTCGCTCACCGGACTCTGGATATGATTTCTGTCTTTTCATTGGCCCGCTGCTCTCTAAACCCCGCCCCCTACCATTGCTAAGACTCATGTGATTGGTGTGCTCTCTGTTGACGTTCTTGATTCCTGATTGGTGAGGCTGTACAGATTACAGTCATCAGGATGCGCTAAAAAATGAAGGCTGCTGACCCGAGGGTCTGTAAACTCTGAGGTTACACTCTGAGTACATCCTGCTACATCACTTGTTGTAGATCTGATCACATGCAAACACATCTGGACATCATCTCTAGCTGCCTTCAAGTCCTCATGGGAAGTTCGTACTTACGAGTTGTTTACGATGCGATCGTGTCATGTGATTTTAGATGGAAAAAATCACTTTCTGACCAAACCAAGAAGCTTCTTTTAGTGCCAAAGCAACAAAATGAAGAGCAAAGCATGTGCATTAGATGTGTGCATTTGATCATTCTAATGAATAGGGAATGTAGTTTGGTTTTGTGAAGATTTAATTCACGTTCACACTACATTTCGAGCATGCAAAGTGTCTACAGATTTAAAATACACTGAAAAAAAATAAAATAAATTGGTGCACGAACAGTTTTCGCTCAGAAACGGCTTAATTTCACAAACAATTACAAAGAAACCGCATGCAACGCGTTTGAATTAGACGCGCAATTGTAAAGTAGAAGAATTGAAATATTTTCCTTTATTTACTACTATAAAAAGAAAAAAAAATTGTAAAATGGTGTTTTTTTTTAATAAAAATATGCAATCTGCAATCTACTGAAATATACTGCAAGTCTGCAGATTTAAAGTTTGCTGTTTTTGTTTAATTCAGCTAAGACGTCACTCCACGTGCATGAGCTTGCTTTTCCTCTCTCCACGTTTGCATGCGTGTGAATCGAAGTCAGTAGAACGTAAAGTGTAGTGTGATCGTCCCTTTATGCCTCAAAAATTGTCTAAATGAATATTATCTGAAACTTTTACATCTAAAATGGCTAACAACAGCTCCAACTCGGAAAGTCCCCCAACATCAGATGTCAGATTTGGGTGGCGCTCGTCTCGTAAGCACGATCATTTCTGCTTGATTTGAAGGCAGCATCATTCAGCATACAGGGCTGTCATGTGACCCTCTCTCACCTTCACCCTTGACCTCCAGCAGAGCTGTCATCGGAGCACATAGGCTTTCTGAATCTCTCTCTAAAGCTGTTTTGTGATGGTGTGTTTGAGTGAATACTGTAGCAATGAACCGCTTTCCTTCGACTCTTCGTTTTATTTTTCGTGACCAGCAGATGTTTCCTTTTCCTTGTTATTGTAAAGCAATATAACAGTCTCCTATAATGCCTATAAGACATGAAACTCCACTTAAACGCACAGTAAACAGCACTCAGTGTCAAACGCAGCTCCAGACGGCTTCAGGAACGTGTAGAGGGTCTGAGGTGGACGTGTAACGAAAAATACCCTTGTGAAAAAGAAGAAACAATAATATTAATGAAATAAAAGCCCACTTAAGTGTACTTACAGTAGGCCGTTTCCTAACACACTTAAGTACGCTTTGCAATATTGTCAAATTAATTGTTTTAAAGTACATTTTAAATCATTATGTTTTGATAATCTTTGAAGACGTACACTTATTTTGACGTGTTGACTGTCATACTAAAGCGCATGTGAAATACTTGATTATAATCGAACTGTAGTGTTATGCGATATTACATTCAAAGTTATTTTACTCGGCTGCATTCATCATTACAAATGTATAATTAAAAATTTATTTAAATACATGACTTACAAGTTTAGTTTACCATGCATGCTTGTCATTGCAATCAGCAATACACTTTAACCGTGTTTCAAAGACACTAGAAGTATTTGTGAATCTGCGTATAAAGATGTACTTAAATCCTACTTACAGTAAATGGCTAAAAAACACTATAAAGTTCAGATCATTGCATTTAAAATAAATTTGAACCATTATAGACTTCATTTCAATTAACATACATTCAGTTCACACTTACAGTAAGTATATTCGTCTAAAGTGCATTGCTGTAATAAGTATACTTAAGTGTACTTCTTTTTCACAAAGGCAAGGGAAGTGTGGAGACACTAGATGTTGACTTGATGCTTGAGGGGTTTCTGTTGGGATTGAATAGTTGATGTTTTGGCATCATGTACAGTAGGTACAGTATGTTTTAAATGGAAGTGAGGATCAAGTTCGTGCCTGATAGAAATCGCATCCCTTCGGAGGGACGCAGAGACAGAATGTCAAAGCTTGAAAGCTTTTACGTACTTTTAATAGTTGCTTTACGAGAAACCAGTGAAATTGCGAGTGAGTCTGGTGGTGGTTTTACTTCTCTTATTCGTTTCTGCAGGTCTTTTTTAGGAGTTAAAGTGTGATCATGTGGGTTGAAACGTTCCTGCGGGGTTTTAATGGTGGAGCTTAATTCTCTTGTAGCATTTTACAATAGTTTATCTTCAGATGGTCGCACTGAATCACATGCTTAACACGAATCTGCTTGGTTTAGTGTCCTTTTGGTGTAATAATGGGGTAAGAGGACGTGGCCGTTCTTTTAGTGTTCATTTTGTCATCAGCTGAGGGCGATATGGAGGTCCGACGTACATTTATTTTTTATGAGTATGACAAATTATTGTTGCATCTATCTTGTCAGACCGTTTCAATCCCAGAACATACAAAGCAATAAGACTGTCACACTGACAGACCCCAGATTTCGACTTTTAGAAACCTACATCGTGCATGACGGCGTAAAGCATTCAGATCATGAAATATTACGCGATTGATCGAAAAATTTACGAATGCATGGCCATGCTACAAAATCAAGTTTCTGAGAGATAGCTACCTTATCTAAGATACAGATGGTAGACAACCAAAATGGGTAATACCGCCGCGCGTACCGCCGCCGCAGGGCCGCGGCGTTAACTTCAAGTCAGTCAAGTGTTAAAATCCTTCGCGAAACTACCACCAGGTGGCGCAAAGGGACGGATTGCGAACTGAATGTAATTGTAAAATGAGATAAAAGGAGGAGGTAAAACAACAATAACATTATGATATAACATTGTACCATCTTTAAAAAACCATTAAAAAATGTACAGTGAGTTAATTTCAAAATGTAGGATAGTCTTAGGCTACAGTTTACTCA
>URS000030206D rRNA from 1 species 
GTGGGGTAATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGACGAAGCGCAAGTGACGGTACCTGCAGAAGAAGCGCCGGCCAACTACGTGCCAGCAGCCGCGGTAAGACGTAGGGCGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGCTTGTCGCGTCGACTGTGAAAACCCGTGGCTCAACTGCGGGCCTGCAGTCGATACGGGCAGGCTAGAGTTCGGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGTTGGGCGCTAGGTGTGGGGGGCCTCTCCGGTTCTCTGTGCCGCAGCTAACGCATTAAGCGCCCCGCCTGGGGAGTACGG
>URS0000C8846A pre_miRNA from 1 species 
GAATTACTCCCTTCGTTCCAAAATTTTTTGTCTTACATTTATGTAGATATGAATGTATGTAGTCATATTTTAGTATTTAGATACATCCATTTATAGACAAATCTAAGAAAAGAATTTTGGGACGGAGGAAGTACAAA
>URS0001332FF6 rRNA from 1 species 
TACGTAGGGTCCGAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTTTGTCGCGTCGGGAGTGAAATCTTACAGCTTAACTGTGAACTTGCTTTCGATACGGGCAGACTTGAGGCATTCAGGGGAGAACGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCAGTGGCGAAGGCGATCTTCTGGACGGATACTGACGCTGAGGCGCGAAAGCTAGGGGAGCAAACGGG
>URS00019FE4B3 tRNA from 1 species 
GGATTGTGGCTCAGTGGCAGAGCACTTGCCTAGCACGCGCTAGGCCCTGGGTTCAATCCTCAGCACCA
>URS00021AA98B tRNA from 1 species 
GCGGGGTTGCCCTAGCCTGGTAGGGGGCAGGCCTGCTAAGCCTGTGGCCGATTTCGGCCGCGCGGGTTCAAATCCCGCACCCCGCGCCA
>URS000050F67C piRNA from 1 species 
GCAGAAGCTCCACCACCACAGCAAAG
>URS000242CB14 lncRNA from 1 species 
CGGCGAAGCTTTTCCGGTGAGTAATTGGACGGCACAGGGACGGTCTTCCGCGGTGGATTTTTCGGCGATCTCTACCGTTTTCCCCCAGAATTTCTCGATGAGAGGAGAGAGGAGGGTTCTCCTCCTTAAATAGGACTGGAGGGAGATCGTTTCCGACTCCGATTGGGAGCCGGCGAGAGGAGGAAGAAGACTCCCTTCGGGAGTCTTCTCCCCTGTTTTCTTCTCTTTTTTTTTTATTTTGGGCTT
>URS000242DE7D lncRNA from 1 species 
TAAATCATCGAGCTCTTTTTGACTTAGTGTCAATACAATTTTATGAGATAATAATGTCTATTTCCTAAATCGGAAAAACGAAAAATACAAAAATAAAAATTTTTAAATACGATTTCGGATCTTAAGACTCTTTCCTGAATTGTCTTTCGACCTAAAGATAAATCAAGCTAAATTATAAATCAAACAACAATAAAAAAAATAATAAG
>URS00022EBB93 tRNA from 1 species 
GGTGCCGTAGCCAAGTGGTAAGGCAAGGGTCTGCAAAACCCTTATACGTGGGTTCGATTCTCACCGGCACCTCCA
>URS00019F1EF9 lncRNA from 1 species 
ATGGAAATATCTTGGATCAAGTTGGATCCCATTACCTTGAATCATCGACAAATTCTTTCACTTATCGCATTCTCAATCTTTTCTTTATTTTTTATTACAATACATATCGACATGCTTTTGAAAAATATATCATTTACATAAACAGTTAATTTTTTAATATATAACGTGATGTTATCCATTCATCATAATATTTTAACATGA
>URS0002545815 rRNA from 1 species 
GGCCAGGGAAAAGGACACGGAGGCTGGGACAGCGATGTCCCCGCTCGGGGGCGGCCTGGTGGAGCGGCCGCAGCCGCCCACCTATTCCGAGGTGGGTGCGGCGACTCCCCTATTCAGAGGGGGAGTCGGAGCAGGAGTAGTCGGGGGCTATAAAGCGGTGAGAGAGCGGAGGAGTTACCAGGAGAGACAGCTCCCCCTCTTCGTCGGCTCGGGGGACAGCGGCGGGCGGCAGCGAGTGGCGCCACTGGCGGAGGGGGCACGAGGAGGCTAACCAAGTTGTGGAGGCGGCAGAAGGCGACGATGGAGATGCAGCTGCGCGCGCTCGGCCCTCCGTGGTGTCGTGGCCTAGCTCGGCAGAAGAAGGAGCCTAGGGGCGGCAGCCAGCGGCAGCTAAGTAAGCGGAGGTCGTTGGGGCCGGAGGGGCTCTACGAGAGGGAGAGGCGATGGGGCTCTGGCGACAACTACGGGGACACTAGCTGATGCAGCTGCTGCTGGGAAGAAGGCAAAGTCGCTTCGAAGGTCTACCACCTAGGGACCTTGGTCTACGGTGGCGGCTACCTACGACGATGTACTTCTGGCGGCTGCTGGTACTCATCAATCCTCCAGGGTCCGTCCTCCAGAACGGAGAAGCTAGCAACAACGAAAACACGATCGGAAGAATTCCGTAGGAACAAATTGAATACATATATGAGTCTATAACAACGAAGGCGACTGAGAACACATAGCTCGATACATAAACTCGGGAGCTCCGGGGACCGAACATTATATTTCGAACATAATAAAACTAAACACAGATCTCAACACAACACTATAGAAGGGCACTCAGG
>URS0002061C56 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGCGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGAGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS0000EFE3C8 pre_miRNA from 7 species 
TTAAGGGAGTTATTGACTGGGCTTCCCACCACTTAAACGTGGTTGTACTTGCTTTAGACCTAAGAAAGTAAGTGCTTCCATGTTTTGGTGATGGTATGTTTTCCTTTATATTCATGCCTTT
>URS00025F4A4B lncRNA from 1 species 
TATTTTTTACAATATATTTTTAATAAGAAAACTGTCAGTTTTCTTGTGGGGATTTTTGATGTTTTTATTGTATTAAAAACTATTGCAAATCAGCTTACAGTTTCAATGTAGGAAAAGGGGTCTGGCTCCTTAGGCAGGCCTGATGTGGGCCATAAATATGATACAAATTTTGAGAGCAGAAAAAATCACAGGGATATTTCAAACTTGCTGACTTTGTGTTACCCCGTAGGAAATGAATCTACCAATAATGGGCCTTATTATTCCACCTCCTGTAGACTAACAAGAGCAATTCTGGTTGTTTATTTAGATACACTGATTTTGCAGACTATACCTCGAGATGGTTGAGCTTAATGTGGTCATACTTATTTGACTAAGGGTAAATTTTTAGCTCTGGCAGAGAGCAGATGTAGCTGTCAACAACTTCCAAGCATAGCTGTCTTTAAGGGAGCTCTTTCTATTAACAGCAAACACTCAGTGAATGAGAGGGCAGTACTTGTACAGTGCATGTCCACAGTTACATGCATATGGCAAAGCATACTTCAGCTTTTGGTTTTGAAACTCATCTCCCACTAAGGCCAAAGCCCTGACATCCTTACTGCCGTGTGTCTGGGATTTTGTTTCAGCGTATGTCCAGTCTTATCTTATGAGCTGAACACCTTCAGTATGTATATGTGCAATTAGCAGTTTGTTCTTGCATGGGTCTGTCAGGGCTTGGGAGACATTCGGCATGTGCATGGGTAGGTTCCCCTGGCTTGATTTTTCTCTGTGAGGAACCTGGTTCATATGCATCGGCACTGCTCTGCAGCCAAGCCCTCATCTGAAAGTAATTGAGTGGCTCTCTTCAAACCTGCCTTGTTGCCCCAACCAAAACATTAGTGTGAGCCCAGTCCCTGACAGCTCACTGCGGTTGGCTCTCTGTGGGCTGATTTGCGTGCTGTGTTGACTGAGTTTCCTCTCAGCTCTAAAGACTGTGTATCATTTATCTATTTTTTTTACAGGTGTCATTATGCAAATTATGTATGCATACAAATATAAACACATATACACAAATCTTACGTGGATAAATATGTAAAAACAAACTTCAATTATACCTACAAACATCCATGTATATGTATATATTTGCCATAATATATTATTGCAAAGGTATTATCTCCACAGTTGATGATGGTCTGAATGCCATTGCAGCTACTGTTATTGTCCTTTGGTTGGAGTGATACCCGTCCAGCACTGCCCTTTATTAGAAGATTATCCGAACTTCTCAGTTATGCAAACAAACAAAAATGTATTCTGTAGGTTTGTTACATTGGTCACAATGTGAAGTGCATTTGTATGAATTGAAAGCACATGGGACTGCAAGCTATAGCTACATTACAAGTTTCCAAGGATATACTGCTGTCAATGTCATTTTTTTTAGCAAAAGTATCTTCACCAAACCTCAAACTACACCTCAAGAAGCCAAGAAATAATAATGGTGGTTTGAGGCATGAAACAAAGGATGGTATTGTTGTGTGGAGGAAGCAAGCACAACCTAGGTAGGTAAAGCATGGTAAGTCCAGGTGCAGTCTCACATCAGTGCCTGACTGCCTGCATTCCATTGGCTTCCTTGCTGCATTTATTTCTTTTCCTATGAGATGCCAAAGCCCCAGCCATGCTAGAGTGTGTGTCTAAGCAATGAGCTGCTCTGTTGATTAATCTGCTGTCGCTGTGGAGCAAATTGCTTGGCATGTTTTAGCTGTGACAGGTGGGTTTCTATTAGCCAGTGTTCACGTAGCTTGCACTATCCATCACATAAAGAATCATGTCATGTCAGAGCTGCATTGTGATCATGACAAGAAGACAGATCAGGTATCGTATAGGGGAAATAAAAATACATGCATGGTGCAAATAAAAAAAATCTTTAGGGTTTCTTTGTTTGTTTGCTTTGTAATTAAGAAGACACAGAGATGCAGGATGAAATTGGGAAATAGAAACTGATAACTGAGTTAGAGGGACATGGTTTTCATCCCAGAGGTTTTTACAGAGTACACAGGGATTAACTGAGTTGTTGAAGCTTGTACTCTCTCTTGCTAATTAAGCCTAAGTTCAATACAGAATAATTGCTTGTGCATTGCAGGTAAGGTGAAGGAGGGAACTCGTTGCTGTTGTGCAGTTCTGCAGCAGGCAAGACCTGAGCTGCATAAAAAAAAGCATTTATCTATGGTAATGTTTTTGTCACCTTTTTGATACTTTAGAAATATTCCTAATTCACTGTCTTCCAGGTAGAGAAGTTATTTCTATTATATAAATGATATTAAATATGTATATTAAAATGTAATGTCCTTTGGACAGTTCTAACTTGTGGGATGAAATGGCAAGGCAGATGGGGAAAATGTCTGTGGGAACAGGGGAGTAACTGGAAGATAAGTGAAAAAAACAGGATCTGACTATTAAAGACATCTGGGAGGTTTGTATGTCTAAAAAATTTGGGGATTTACAATCACAACATGCTATAAAACTGGAGTTGCAAATCAAACTTCTCTTACTTTATATGCCTTGCAGGGGGAGTGAGCCATGTTTTGTGAGTCAAACACAGAACAAAATAGAAACCCCCAAAACACCCCAAGCACACTGGGAAGTCACCCAGAGAGAAGAGATTACGTTTAGAAGAGCTTTTGTTCCCAGTGAGCTAAAGATATTAATACGCATCTGGTATACAATGATATCAGCATACTGAATTGCAGGAAGAGCAGGTTATTGGGGAGTCAGGATCTGTTGTTGAGATTTGTTTGTACTCAGTATTTAGCAAAAAGAAAAGGAATATAATTAGAAGACTGTGAACTGGGGTAAGAGTTGTTTCTTCTAAAGAAGAAACAATGAGGAGAGGATGTCTGCTGAAATAGTCTCTTCATGCAGGCAGCTCAGAGATGTCCACGGAAGGAAATCTGTTCAGTAGCCCATAATCGCTCTGAGTTCCATGTAGATGTTGATCTTTTGTTCAGCTGATTTCCTTTTGGTAGCTGTTTTCTGCTTTGCAATCAAGAGATAGAATAAACGGGACTCCTGCTTTTCCTTATTCTTATCGAACGACAGAGGAATCTTAAGGCCAGGTGTTGGTGTATGCTAGTTGCTCTCCAGGGAACAAAAGCAGCAAGCAGGTGGAGACAGAATGGTTCGCTTCCAAATGTTTCAGAGTTCTTGGGCTTGGGATGTGTTACCTCCTAGCTCAGTTCGACGCAAGGTGGTGGCTTGCAAAAGGAAGCCTCCCATGGCAGCCTTCAGCCAGCATAGCTTTACCAGGCTCCCGTTGAAATGAAGTGAGCGTTTAACTCAGATGATAACTGTGTGTCTTGTGGGTTCCTTCACATCTCCAGTCCGGTTACTGGGAAGTTTTCTCCTCCAACCACCCTTTGACTGTCTATAAATAAGTGTAACAAAAAGGGTACTGAGTACTAATTCACAGTGAATCACAGCTGAACAGTATGATCAGGTGAATCCCATAAAGAGAACTGACAGTGTATTCAGATCGGGTGTTTGCCATTCAAGGATCTGCACCTCTTATGATCTATTTGGGCCCATCTTTCTCTAGCCTTTAGAAAAGACTTCTAGAGTCTTGCTGGTTGTCTTATTAACATGTAGAGATGGCTAACTGGTGAATCACAGCTTCCTTTAAGTAGCCCCTGACATCTGTAGCATTTTGTCAAAGTGTAGAGGGAAATGAGATGAAAGGCTTAAAATGCTGTGTGGCTTTTCCAATTTTAAGTAATGTCAGACATTCTTTGAAGTAATTTGGCCTCTTGTGAAAAATGTTCCCTGTGTTCAAGGGCATCAAAACCAGGCAGCCCTCCTAAAAATAGTACATACTTATTTGTTGAGTTAAAAGTTTCACAGGTATCCTTTTTATGCATCCTACTTTGTTTATCTGTGAAGGTGCTCATTTGTTTGTTTTCCTTGCAAGATTCCTGAGAACGTTCTTATACTTCCAAACCACATTTCTCGAATCTGAGTATGGGAAGGGGGTAGTACATAGATTACTTGCTGAATATACTAAAACTCAATCATATTTAACTACTTTATGAAGTCTGTTTAAGTTTTGTAACATTTAACTACTTTAATTCTAGGCTAGATCCTCTTTTCTGCTAACTTGTTTTCCTAGTGAAAAAAGAGAAAATAATAGGTGCATTAATTGTTAGTTAAGGTAGCAGGCCATGGTGAACCTCTTAACATTCTCCTATTTTATGAGCATAAAACTTCTATTTTAATAATGCCTTGCAATAAAGGATCTTTTCATGGCAGCTAAATGATGTACAATGGTAATATTTCTACAAGAAAATTAGATTTTGATATTGCCTTGGTTTTCAGTGAAACAAAAGAATTTGTGAAGAACTTGAAAGAGAATACCACTCATCATCATGGACAGCTGATGAAGAAGACGGAACCAGGGAAGAGTGGTTGAGATTCTTTTTTTCTAGTTAAAGGAAGCAGGAGATGTTCTTGCTCTAGCAAACAGCACTGACATGATCAAGAATCTCTGAAAATCCCTGGAGAGATCTCTCCAAGTGAGCATTGAATTAACTTCCTTTCCTACTGTTCCACTCTGTACAAAAGAAGTCCTTCCTTCAAAAGTCCTTGGAATACAATGCTGTGTTTTGTAAGCAGAGTCCAGAAAAGCACAAACACCTCTAACAAAAGAATAGTAAATAATGGCTATTTCTACTCTCATTACCCTGGGCTGCACTTCCTCTGCTATCAGGCACTGTGACAGCAGGGAGGCAGGCATTCTCTTGCTACTTTATGATTCAGTAAGAAAAGGATGAGGTTCCAGAAGTGAAGGATGTAGAAGAGATGACTTCAGTTGGTGCACAAGACATTTATTTCAAGTAGCCGTTTCAGGGCTAAGACTTTGCCCACCATCTTCACCCCCTGCAGTACTCTGGTTTCTGAAACTTCAAGCCTGCTGAGCAAGCCTGTTAGGTTTCACAGAAGGAAAATTCAGATGTGTAGACTCAGGGGAGCTGGGGAGTCCTCTGCAAAGTGGACTTGAAAATACTTCTGCAATTTGCTGAAACAAGTAAACTGAAGTGCAGAAGAGAGGCTGAGACGTGGCAAGGAATCGGTTAATCCTGAAATGTAAAATATGTGAAAAATCTGCACTATTTTGATTTTTAGCATATATGGTATTGCTGGGTTAGGTTTCCTAGGGTTTCATATGTACAAAAAAATCACTCATCACAATACTGTGAAATAAATGCATTTACATGCCATACCAGAATCTGATATTATTTGCCTGTACAGGGTTTCATAAGGTGGACCTCTGTGGAAAATGACTTAAGACTTCCAGCAGTAACTTCTCCTTCTCTCTTGGAAGAGAAAGATATCCTTGTGCTCTTGGTTCTGTGTATTCTGGAGCTTTCCTGTCAGCTTGAGTGGATCAGAACAAGTCTGTCTCCATTGATCAGACTTCTGAAGATTAATGCTCAAACACTGAAACTTTCCCCACGCTGCACTGCTAAATTGATGCAGCAAAACACTTGAACACACACAATCAAACTGAAGTTTAAAACAAGTCACACAGAATTGAGTTTACCTTTGTATTAGTTTAAAATCTGCTTGAAGACCATTATCTTTGTGCATCCTTTCAGGAAAGCTTTATTAGGCACCAGAGGAAATTATTTCTAGACCAGATGTAACCTAAATACACTCCAGGATTGCTGCCCATTAGTTTTTGTTTTTAAAGACTGGAATAGAAAATTAAGTGCAAATGAAATGTTTAGGAAAGTATGACCATAACTACATCAATCTGATTATGCAATTAAATGGCCTTTATAATAATAAAAAAAAGACTGTGCTCTCTAAATGTTAGACATATGCCAGTAAACCAGTTTTACTTTCAGTTGCTGAATAAGAAGCGTGGGAGCGCATTGTTCCATTTCATTTTCTTCTCTGCTGCTTTCTGTTTAAAGTCAGACATAGCGAAAAAAGAGGAGCTCCTCAGTAAGAGCTGTAGTATGGTTTGTCCTTGATTTACACAAAGTCAATGTTGCTGTTTGAAACAGTCCCTCAAGTTGTTACTTTTAAATGTTAGCTTTAGCAACTCTAAAATTAGTTTTAGCTTAGCATGGTAACCAGGGGTTATTATTTTTCCCCTTCAATGAGAGGGAGTCTGAATATCAAATTCATACACTTTGGTCCTTCTTTGATTAATGAACAGGCTCTTTCAGTGTGTGGTTTAAAATGCACTTATAAAAATGAATTTTACAGCATTAATTTAAAAAAGTAATATATGAGTATGGAACTCCTGTTTCATCTTCCC
>URS0001447AD9 rRNA from 1 species 
CACGTAGGGTGCGAGCGTTGTCCGGAATTATTGGGGCGTAAAGAGCTCGTAGGCGGTGTGTCGCGTCGGCCGTGAAAACCTGTGGCTTAACCATGTGGTCTGCAGTCGATACGGGCAGGCTAGAATTCGGTAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGATATTGACGCTGGAGGAGCGAAAGCCGTGGGGAGCGAACAGG
>URS00001955B1 rRNA from 1 species 
CGGGGTGCAGCAGGCGCGAAAACTTTACAATGCTGGCAACAGCGATAAGGGGACCTCGAGTGCCAGGATACAATCTTGGCTGTCGCGATGCCTAAAAAGCATTGCATAGCAAGGGCCGGGCAAGACCGGTGCCAGCCGCCGCGGTAACACCGGCGGCTCGAGTGGTAACCGCTATTATTGGGTCTAAAGGGTCTGTAGCCGGCCGGATAAGTCTTTTGGGAAATCCAGCTGCTCAACAGTTGGGCTTTCAGAAGATACTGTTCGGCTCGAGACCGGGAGAGGTGAGAGGTACTTCAGGGGTAGGGGTGAAATCTTGTAATCCTTGAAGGACCACCAGTGGCGAAGGCGTCTCACCAGAACGGATCTGACGGCAAGGGACGAAAGCTAGGGGCACGAACCGGATTAGATACCCGGGTAGTCCTAGCCGTAAACGATACTCGCTAGGTGTCAGCCACGGTGCGACCGTGGTTGGTGCCGTAGGGAAGCCGTGAAGCGAGCCACCTGGGAAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTG
>URS000146AAE0 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGAGTGGCGGACGGGTGAGTAATGTATGTGAAACTGCCTGGTGGAGGGGGATAACTACTGGACACGGTAGCTAATACCGCATACCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAAAGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGCACTTTAAGCGGGGAGGCGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCCGCCGCGGTAATAC
>URS0001DA31B7 rRNA from 1 species 
AGTGAACGCTGGCGGTAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTACGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTTTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCAGGGGATCTTCGGACCTTGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAGTGGGCGCAAGCCTGACCCAGCCATACCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGCAGGTTAATACCCCGCTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTG
>URS00016B5AE1 rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGTTCGGATTTACTGGGCGTAAAGCGCACGTAGGCGGACTATTAAGTCAGGGGTGAAATCCCGGGGCTCAACCCCGGAACTGCCTTTGATACTGGTAGTCTTGAGTTCGAGAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAACACCAGTGGCGAAGGCGGCTCACTGGACTGGTATTGACGCTGAGGTGCGAAAGCGTGGGGAGCAACAGG
>URS00023938D4 lncRNA from 1 species 
TGGTCTATGTTAGTAGCTTGGACAATCTACATAGTACTTTAAAGAAGTTTTTTAAGTGATGGTTTGGACCGTATGTGGTAACAATTACTCATGATAATGTAACTTATTTGTTGCGGGAGTTAGATGGAACAAGGTTAAAAATACCAATTATAAGGAAGCGAGTAAAAATATTTAAATAAAAATATACGGAAATAAATATAGAAGACCTTATTGAGGACATAGATATTCATCAACAGGAAGATGAATTTGACTTGAATAACAAAAGTGATGAAGAGGATTTGAATGGAAACTTGAAGAACATATTATGAATCAAACAACAACTAGGTGATTTGGTGCATACCATTAGATGCACAGGTTCAGAGGGGATGTATGTCGTATTGTAACATGACTATATGATGAAAATATAAATTAAAAAGATTTTATTAATATTTAGTCATCTTGGATGTTAGAAATAGTGGCCAATTCCAGTACCAATATTCAAGGGCCAGTTAATGTCACTCTATTGTAAGTTATACCACCGTATGTGACATCAGCAATATGCTCTACCAACGTCATCAAATTTAGTATCCTCCATATCAACGGGACAACTAGAATTATTTTCTAACCCTATATGGAACAAGCCTAGTAGGTATGTACCGATGGAGACAACCAATATGCTTGATGGGGGTACAAGAAGACTATTTCGTTGTTTCTATTACAAACAGATTGGTCATTATGCTAATGAATGGTCCAATCCCAGACCCAGTGACAATTGTGCACTAGTGTGTGGGAATTGCAAGCAGTCAGAGCATACTTATTAGCAAAATAATGCTCCGTTCAATTTTAATAATCAAGATCCGCAAATCCAAAGTCAAGAAAGAAATTGAAGAGATAAATGGAAGACTCTAAGATTCTCTGATAAATTGAGTGGAATGTGTCTAAGCCGTTCTTACCGAGAGTCCGCAAAAGGAGATAGGACCAATTCAACAATTAG
>URS00018A4A88 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCGTGTAGGCGGCCAGGTAGGTCTGCTGTGAAAACTCGAGGCTCAACCTCGAGACGTCGGCGGAAACCATCTGGCTAGAGTCCGGAAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAGCACCCGTGGCGAAGGCGGCTCTCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS0000CC585E snRNA from 1 species 
TTGCTTTGGCAGCAAATAACTAAAATTGGAATGATACAGAGAAGATCAGCAGGGCCCCTGAGAAAGGATGACATGCAAATTCACACAGCATTCCATCACAGC
>URS0001480F9E rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCTTAACACATGCAAGTCGAACGAGTGGCGGACGGGTGAGTAATGCTTGGGAATCTAGCTTATGGAGGGGGATAACTACGGGAAACTGTAGCTAATACCGCGTACCATAGGATGAGCCCAAGTGGGATTAGGTAGTTTGTGAGGTAAAGGCTCACCAAGCCGATGATCTCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGGGAAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTCGTAAAGTACTTTCAGTCGGGAGGCGGTACCGACAGAAGAAGCACCGGCTAACTACGTGCCAGCCGCCGCGGTAATTC
>URS0001FB3C4B rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAGACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGGCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS0000CF422D rRNA from 2 species 
ACGGGAGGCAGCAGTGGGGAATATTGCACAATGGAGGAAACTCTGATGCAGCGACGCCGCGTGAGGGAAGAAGGTTTTCGGATTGTAAACCTCTGTCCTTGGTGACGATAATGACGGTAGCCAAGGAGGAAGCTACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTACTGGGTGTAAAGGGAGCGTAGGCGGGAAGGTAAGTTGACTGTTTAAACTATCGGCTCAACCGATAGTCGCGATCAAAACTGCCATTCTTGAGTGAAGTAGAGGCAAGCGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGGCTTGCTGGGCTTTAACTGACGCTGAGGCTCGAAAGCGTGGGTAGCAAACAGGATTAGATACCCTGGTA
>URS0000E65B77 lncRNA from 1 species 
CTGATCTCTATTCCCGGATCTGCCTCTGGCTTCCTGCGTGACCTTGGGCTGGTCACCTACCTTTTCTTTTCTTTGGTTCCCAAATTGTAACATGGAAATAATTCTCTTCCTGCGGTGCCTCAGCCCCTGCTGCCTTTAGGGTGGTCGAGATCCTCTGACGGGAGGAAGGTAGCACGTTTCCACTGGAGAAATACTTACCCAGAGCACGGTAATTTGGGGGCGTGTTGGTGTTCACTCGGGTACAGCAGGGTGCGTGCTGCTGCTTGTGCTTTTTTTTTTTTTTAGTAGGCAAACCTGTGGTGGAAGTCAAATTCCGTTTGTGGTGGATGCAGAGCAACGTCAGCTGCAGCGTGCCCTTTCCTCACTAGGAGATGGTTACCTAGCCAAGGTCACTGCTGCTGCATGCCTGTATCACGCAGCGAGCCAGCCTCCTCTTCCTTCCACGGGCGCTGATCTCAGCGAGGCTTCCCCAGAGCCAGCTGCTCCCGGAATAGTTTGGGAATGAAATGTCACCGTTTGAAACTGCTGGATCCTAGCGCCTTCTCCGACAGGACTAGGTCGTATCTGTCTGACAACGCACCTACAGTGACTCTCTTAATTAAGTCTCCCTGCACTGCTGTGAGGGCAGCATTCTGTGTTCCTGCTCCAGCCTACGAGAGCCAGCCATTTCCACGCGGCAGCTCTGCCTCGTAGGCACTAAGAAATGGGCACCTTGAGCTGAAGTGCCATGGTTGTTGTAGTACTACTGGTGTACTACCGAGCGGTCCCGGGCGTGCTGACTGTAGCTGTCGCTGCCCCAGCCTGCTGCCAGAGGTTTGTG
>URS000031FA0E piRNA from 5 species 
TGTAAACATCGTACACTCTCAGCT
>URS0001CC563E rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATGAGCAGAAATGGAAAGGAGAAAGCGGAAAGCACAGTCAGGGAGGAACAAGTGGGGAAAATGGGCGAAGGGGGGCAAGACTGAGACAGAAATAAAGAGGGGGTGAAGAAGGTGTTAGGGTCGTAAAACCTGTTTGTTGGGAAAGAAAAGAAGCCGGCGAATACACAGGTGCCGTGAAGGTACCTAAAGAATAAGAAAAGGATAACTTCGTG
>URS0002428F28 lncRNA from 1 species 
GTGAATAGTGGCCTCCTGGGTAAATGAAGGTGGTGGCGAAATGCGGTCACCTCGCTGCTCCCAAATATGGACCTGCTGCTGGAGCCATCCATAAATATATTGTCCACCCTGATACGGTCATCCCGCTGATAGTGTGTAAGGGACCTATGAAGGCTCCCCTGGTATAGGATGGGGACAGTGAAACTAGCGAAGCACACGCTCTGTGGCATGATACTCAACCATATCAAAGAAGATCATCGGGACCGAGGTGGCCAAAGCAGTCGGTCGACTGAGCAATAATAGGGCAACTGAGCTAGCAACTCGTCGCTGTATGGCGTCCAGATGAA
>URS000018DC94 rRNA from 1 species 
AACGAACGCTGGCGGCGCGCCTAACACATGCAAGTCGAACGAGAATCCGGGGCAACCCGGTAGTAAAGTGGCAAACGGGTGAGGAATACATGGGTAACCTACCCTTGAGAAGGGAATAACCCGCCGAAAGGTGAGCTAATACCCTATACGCTATCTTTTTTTCGAAAAGGATAGGAAAGCCGGGTCGAGGACCTGGTACTCAAGGAGGGGCTCATGTCCTATCAGCTTGTTGGTGGGGCAACGGCCTACCAAGGCTACGACGGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGCACTGAGATACGGGCCAGACTCCTACGGGGAGCA
>URS000019B6AB rRNA from 1 species 
CCGTTGCCGGCGACCGGCGCACGGGTGAGTAACACGTATGCAACCTGCCCGTGGCAGGGGGATAAGCCGGGGGAAACCCGTCTAATACCGCGTAACGCGGCCTTGGGGCATCCCAAGGCCGCCAAAGGGAGCAATCCCGGCCACGGATGGGCATGCGGCGCATTAGCTAGTCGGCGGGGTAACGGCCCACCGAGGCGACGATGCGTAGGGGTTCTGAGAGGAAGGACCCCCCACACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAG
>URS000060EFE9 rRNA from 1 species 
AGTGATTTTAAGTCATGCAAGTCGAACGAACCTTGTGTTCGTGGCGAACGGCTCAGTAACACGTGGATAACCTGCCCTTGGGACCGGGATAACCCCGGGAAACTGGGGATAAACCTGGATAGGTGATGCGGCCTGGAATGGTGCTTCACCGAAACACCCCTCGGGGTGCCCAAGGATGGGTCTGCGGCCGATTAGGTAGTTGGTAGGGTAACGGCCTACCAAGCCCATCATCGGTACGGGTTGTGAGAGCAAGAGCCCGGAGATGGAACCTGAGACAAGGTTCCAGGCCCTACGGGGCGCAGCAGGCGCGAAACCTCCGCAATGCACGCAAGTGCGACGGGGGAACCCCAAGTGCCACTCTTAACGGGGTGGCTTTTCAGAAGTGTAAAAAGCTTCTGGAATAAGGGCTGGGCAAGACCGGTGCCAGCCGCCGCGGTAACACCGGCAGCTCAAGTGGTAGCCGCTTTTATTGGGCCTAAAGCGTCCGTAGCCGGTCTGATAAGTCTCTGGTGAAATCCCGCAGCTTAACTGTGGGAATTGCTGGAGATACTATCATGACTCGAGGTCGGGAGAGGCTGGAGGTACTCCCAGGGTAGGGGTGAAATCCTGTAATCCTGGGAGGACCACCTGTGGCGAAGGCGTCCAGCTGGAACGAACCTGACGGTGAGGGACGAAAGCCAGGGGCGCGAACCGGATTAGATACCCGGGTAGTCCTGGCCGTAAACGATGTGGACTTGGTGTTGGGATGGCTTCGAGCTGCCCCAGTGCCGAAGGGAAGCTGTTAAGTCCACCGCCTGGGAAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCACCACAACGCGTGGAGCCTGCGGTTTAATTGGATTCAACGCCGGACATCTCACCAGGGGCGACAGCAGTATGACGGCCA
>URS000043FDF3 rRNA from 1 species 
AGCAGCCGCAGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCAGGCCTGGCTGGACGGTCCGCCCTTCGGGTGAGTACTGTCTGTGGTCGGGTCCTACCTTCTGGCGAAGCGTCATGGCCTTAACCGGCCGTGGCGGGGAACCAGGACTTTTACTGTGAAAAAATTAGAGTGTTCAAAGCAGGCAAATCGCTTGGATACATTAGCATGGAATAATGGAATAGGACAATGGTTCTATTTGTTGGTTTCTAGGACCGTTGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGAATCGGGCGATGTTGAAAAAATGACGC
>URS000076D469 rRNA from 1 species 
ACGGAGGATGCAAGCGTTATCCGGATTCATTGGGTTTAAAGGGTGCGCAGGCGGAATGATAAGTCAGTGGTGAAATCCTACGGCTCAACTGTAGAACTGCCATTGATACTGTTATTCTTGAGTACACTTGAAGTGGGCGGAATGTGTCATGTAGCGGTGAAAAGATTAGAGATGACACAGAACACCGGTGGCGAAGGCATCACACTAAATTGTAACTGACGCTGGTGCGCTAAAGTGTGGGGATCAAATAG
>URS00025935AF lncRNA from 1 species 
TTAAAATTAGCTAAAATTTGGTATGGAGCAGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGCTTAGGCCGGTATGGAGCAGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGTTATGGTTGGTATGGAGCGGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGTTCAGGTTGTGTGATGCTTTTGTGTAATACCTCTTTAATTGGAACTCAACTGCAGAATTTTCTGAGGGCAGGAACAGTAAGTTTCACCTCCTATTATATTGGAGTGAAATCAGTGGACTGTATCTTTAAATAATAATCAGGAAAATGCCAAGTTAGTTCCAACTTGAATTTTAATAATGAAGTTTTAGCCTTAGCAGCAATCCTTATTTGTCAACAGAGAGTTTAAAGAAATTAAATACTATAATTAATTGATATGACTTGCTTTCCTTGACAAAAGATTTACTTAACTTAGAAGCACTCTGGCACTGGAAGGGTTAATTCACCCAATGGAGGAAGAGGAAGGAGTCTCTTTTAACAAACTGCAGTTTAGTAGTGAGAGAAAGGAAGTCCGTTTGTCCAAGCCGAGGTCTGAGAGAGGAGAAGGTAGAAATCCGTTTACAAGCCGAGGTCTGGGAGAGGAGAAGGTAGAATTCCGTTTATAAGCCGAGGTCTGAGAGATGAGAAGGTAGAATTCCGTTTACAAGCCAAGGTCTGAGAGAGGAGAAGGTAGAAATCCGTTTACAAGCCGAGGTCTGAGAGATGAGAAGGTAGAATTCCGTTTATAAGCCGAGGTCTGAGAGATGATAAGGTAGAAATCCGTTTACAAGCCGTGGTCTGAGAAGTGGAGCCGGTAGCATCGAGTAGAGCAGCTGATCTCACTGCCGCACCTGAGTGAATAATCCAGCACTTTGAATCTGGCGCGGTCTTCCTAAGTATCGTGGAAAGACCGCGTCAGAAAAAAGGGGCGGAGCTAAGTGCCGTGAACCCGGAAGTGGGTTCCGGCGGCAGCATGATTGTTAGGTATACCTGACAGTACCCCCTTCTCATGGGGCATCCTCTGGGTGCACTTATTTCGGTTTAAAGGGGTAGCGTTTGTGAAAAGCATCAACTAATCTCTTAGCATGAACATTAGATGAATCTTCCCAGGTATCTTCATCTGATAAGGTATTGTAAAGAGCCACGGTGGATACAAGAATCCAAAATCTTATGAATTTCATATTCTTCTTCACCTTGGACGATGATAGGTTCAGGAGTTGTTACTATTTCTCTATGGAAAGGATCAGGGATGTGTGGTTTAAGCAAAGAGACATGGAATACTGGATGAAGTTTAAAACTTGGAGGAAGTTTTAATTTAACAACGTTATCATTGATGATTGTAGTTATTTGAAAAGGACCAAGAAAAAGAGAGCTCAATTTCTTTGAAGGACGGTTTGTGGTAATATTTTTTGAAGAGAGCCAGACAAGATCCCCCACTTTATAAGGAGGGGGAATTCTTCTATTATGGTCAAAAAACTTTTTCTGGTAGTTTTGGGCGAGTTGAAGATTCTCCCGTAATTTAAGGAATAGAGAAGACATAAATTCATTTTTTGAAGTAACCGTGGGATTGGATGAAGAATTAGATGGGATGGGAAATGAGGACGGATGAAAACCATAGTTGGAGAAAAAAGGAGTCATTTTCGTACTAGAATGAATGGTATTATTGTAAGAAAATTCAGCCATAGGTAACAAAGTGGTCCAGTCATCTTGCAGGTATGAACAATAACATCGGAGATATTGTTCCAAACATTGATTAACTCTCTCTGTTTGCCCATTAGTTTGGGGATGATAGGCAGAAGAGAGTTTGCGTTGAATTTGAAGAGAGAGACACATCTCTTTCCAGAATTTGGAGGTAAATTGTGTCCCCCTATCAGAAATAATTTCTTCTGGAAGACCATGAAGCTTTACAATATTATCAATAAAGACTTTGGACAATTCTACGGAGGAGGGTAATTTTTTTTTAAAGAGATGAAATGGGACATTTTAGTGAAGCGGTCCACAACAACAAGAATAGTGGTGAACTGTCGGGATGGAGGAAGGTCAACAAGAAAATCCATAGAAATGGATTGCCAAGGTTTTTCTGGAATAGGTAAGTTAAGTAGTAATCCAAAAGGTTGGTTATGTTCAGATTTGGACCTTTGACAGATAGGACAAGTTTTGACATATAATTCAATTGTTCTATCTTGGCGAGGCCACCAATAATATCGTGAAGTTAGTTCAAGAGTTTTCTTTATTCCAGGATGTCCAGCTAGGGGTGAATCATGAACCATTTTGAGTAATTTGTTCCTAAGAATGGGAGGAATATAAATTCAATTTTTAAAGTAAAATATACCATCCTTTTTTGTTAAATTAGGTGTTTTGGGAAGTTCAAAATCCTTTTGATTCAAGTTCCTTAAGTCATCCTGAAGAGAAGAGAGGATCCCTATTATTTTGTTAGGAGGATAAACATCAATAGAAGTTTTAGAAGGAATTCGAGAAAGAGCGTCAGCCTTTTTATTTCTAGTTCCAGGTCTGTATATTAATTGGAAGTTAAACCGGTTAAAAAATAGGTTCCATCTAACTTGTCTAGCCGTAAGGGTTTTATTAGTATAGAGATATTCAAGATTTTTATGGTCTGTATAGACTATGATAGGTTGATTTGTATCTTCTAATAGATGGCGCCAATTTTCAAAGGCAGCTTTAACACTTAATAATTCCTTTTCACCAATAGGATAATTTTTTTCAGCAGAGCTCAAGGATCTTGAAAAGAATGCGACTGGATGAAGTGGATCTTGAGGAGTCTTTTGCTGAGAAAGAACTGCTCCGATAGCTGAATCTGATGCATCGACTTCTAGGACATACAAGAATGTTGGATTAGGTAGCTGTAGAATAGGTGCAGTTGTAAATCATTTTTTTAAACTGTCGAAGGCAGCTTGTGCATCTTTATTCCATTTGAAAGGACGTTTAGTACTGTTAAGGAGGTTAAGTGGATGTGATACCTCTGAATAGTTTCTAATGAATTTTCTATAGAAGTTTGCAAATCCAAGAAATCGTTGCAATTCTTTTGTAGTAGTAGGAACGGGCCAGTTAATAATACATTCGATTTTAGAGTTATCCATTTTCAGAGAATGAGGTGAAATAATGTATCCAAGAAAGGAGAGTTCAGTAACTTCAAAAAGACATTTCTCTGGTTTAGCGTATAATTTGTGAGTTCTCAATCTAGATAGAACACATCTTACATGCTTCCTATGTTCATCCAAATTGTTAGAATATATTAGAATATCATCTAAGTAGATAATAACACAAACATCTAAAAGATCTCTAAAGATATCATTTATAAAATGTTGGAATGTTGCAGGGGCATTACAAAGCCCAAAAGGCATCACTAGATATTCGTAGAGACCATATCTAGTCCGGAAGGCGGTCTTCTATTCATCATCCTGTTTTATTCTAATGAGGTTATATGCGCCTCGGAGGTCGAGTTTAGTGAATATAGTTGCAGTTCTTAACCTTTCAATTAATTCATTTATTAGTGGAAGAGGATAACGATTTTTTATGGTTATTTTATTTAAGGCTCTGTAATCTATAATGGGTCGGATGGTTTGGTCCTTATTCCTCACAAAAAATATACTAGAGGCAGCCGGTGAAGTCGAGGGTCTGATGAATCCTTTACGTAAATTTTCATTAAGATATTCTTTTAAGGTCTGTAATTCCTTTTCAGAAAGTGGATAAATGTGTCCATAAGGAATGGGAGCACCAGGTATTAGATCTATTGGGCAATCATATGCTCGATGAGGTGGAAGTGTTTCCGCTTCTTTTTTACAAAAGACATCTGAAAAGTCAGAGTAGAATGGAGGTATAATTGATTCCTGAGTAGTTTGGAGAATAGGAATATGTTGGTTCCATTGAAATTGGCTGGATTATTCTGTGATGCTTTTGTGTAATACCTCTTTAATTGGAACTCAACTGCAGAATTTTCTGAGGGCAGGAACAGTAAGTTTCACCTCCTATTATATTGGAGTGAATTCAGTGGACTGTATCTTTAAATAATAATCAGGAAAATGCCAAGTTATTTCCAACTTGAATTTTAATAATGAAGTTTTAGCCTTAGCAGCAATCCTTATTTGTCAACAGAGAGTTTAAAGAAATTAAATACTATAATTAATTGATATGACTTGCTTTCCTTGGCAAAAGATTTACTTAACTTAGAAGCACTCTGGCACTGGAAGGGTTAATTCACCCAATGGAGGAAGAGGAAGGAGTCTCTTTTAACAAACTGCAGATTTAGTAGTGAGAGAAAGGAAGTCCGTTTGTCCAAGCCGAGGTCTGAGAGAGGAGAAGGTAGAAATCCATTTACAAGCCGAGGTCTGGGAGAGGAGAAGGTAGAATTCCGTTTATAAGCCGAGGTCTGAGAGATGATAAGGTAGAAATCCGTTTACAAGCCGAGGTCTGGGAGAGGAGAAGGTAGAATTCCGTTTATAAGCCGAGGTCTGAGAGATGATAAGGTAGAAATCCGTTTATAAGCCGAGGTCTGAGAGATGATAAGGTAGAAATCCGTTTACAAGCCGTGGTCTGAGAAGTGGAGCCGGTAGCATCGAGTAGAGCAGCTGATCTCACTGCCGCACCTGAGTGAATAATCCAGCACTTTGAATCTGGCGCGGTCTTCCTAAGTATCGTGGAAAGACCGCGTCAGAAAAAAGGGGCGTAGCTAAGCGCCGTGAACCCGGAAGTGGGTTCCGGCGGCAGCATGAATGTTAGGTATACCTGACAGGTTGGTATGGAGCGGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGTTCAGGCCGGTATGGAGCAGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGTTATGGTTGGTATGGAGCAGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGTTCAGGCTGGTATGGAGCAGGTTAGTAAGTAAAGCAGGAATGCAGAGTTGTTATGGTCGGTATGGAGCGGGTTAGTAAGTAAAGCAGGAATGCAGAG
>URS0001BC7D2F tmRNA from 13 species 
GACGGGAUUUGCGAAGCCCUAGGAGCAUGCCGAGGGGCGGUUGGCCUCGUAAAAAGCCGCAAAAAAAUAGUCGCAAACGACGAAAACUACGCUUUAGCAGCUUAAUACCCUGCUUAGAGCCCUCUCUCCCUAGCCUCCGCUCUUAGGACGGGGAUCAAGAGAGGUCAAACCCAAAAGAGAUCGCGUGGAUGUCCUGCCUGGGGCUGAAGCGUUAAACUCAAUCAGGCUAGUCUGUCAGUAGCGUGUCCAUCCGCAGCUGGCCGGCGAAUGUAAAGAUUGACUAAGCAUGUAGUGCCGACGGUGUAGUAAUUUCGGACGGGG
>URS00004B6BEF rRNA from 1 species 
CACGTAGTTAGCCGGTGCTTTTTCTGCAGGTACCGTCACTTTCGCTTCTTCCCTACTAAAAGAGGTTTACAACCCGAAGGCCGTCGTCCCTCACGCGGCGTTGCTGCATCAGGCTTTCGCCCATTGTGCAATATTCCCCACTGCTGCCTCCCGTAGGAGTCTGGGCCGTGTCCCAGTCCCAGTGTGGCCGGTCACCCTCTCAGGCCGGCTACCCGTCGTAGGCTTGGTGAGCCATTACCTCACCAACTACCTGATAGGCCGCGAGTCCATCCTTGACCAAAATTCTTTCCACAACCAGACCATGCGGCCAGCTGAAATATCCGGTATTAGACACCGTTTCCAGTGCTTATCCCAGAGTCAAGGGCAGGTTACTCACGTGTTACTCACCCGTTCGCCACTAATCCACCCAGCAAGCTGGGCTTCATCGTTCGACTTGCATGTGTTAACGCACGCCGCCAGCGTGTCCTGTAGCCAGGACGTCAAACGTCT
>URS00023C0FDA lncRNA from 1 species 
GGAAATTAGAAATTAAAACTGTCACTAAAGGGCCCTATAGCGACAGAACCGTCGCTACAGGTGTTCTTGGTGTTCTTGATGCCTGCCCAGATCTTCAAGTCAGTGAACAAGGTAGGTGGTTTGACCGGATATAGATCTTTGGTCCTTACGTTTTCTGGGCTGCTAAAGTGTTAAGATTGTAGTACTTATGTAGTACTACAACTACAAACGACTGTCATGGCCATCATGCATCTAAACAGAAAGTTATAGGCCATCAAAATCCTTGTCAGACATGTTCTTCATTTTCTGGGTTACCCAGAAAATGAAGAACAGTCAAGGTACCTACTTTGGATCCTTATAGTTTGCAGTATAGGTCTTGTTTGTATAATATAGTGGTTCCATCATGTAGAAATAATGTCAGAGTACAACTACATACCCTCATATAAGTCTAATCAACATTACAGATGAGAGATTAAGGCCGGTCAAAGT
>URS000109A09B rRNA from 1 species 
TACGTAGGCAGCGAGCGTTGTTCGGAGTTACTGGGCGTAAAGAGTGCGTAGGCGGTTTTCTAAGTTTGGTGTGAAATCTCCCGGCTTAACTGGGAGGGTGCGCCGGAAACTGCGAGGCTAGAGTGTGGGATGGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAGGAACACCTGCGGTGTAGACGGCTCTCTGGACCACTACTGACGCTGAAACACGAAAGCGTGGGTAGCAAACAGG
>URS0000E5769B tRNA from 1 species 
AGCTCCGTGGTGAATAGATCATGTTGAATTGCAAATTCAAAGAAGCAGCTTTAACGCTGCCGGGGCTTC
>URS00026126AE lncRNA from 1 species 
CCACAATGATGTTTTAGGGGCTCTGTTTTTTGTTGAGGCTTAAAATACTGTACTATTTGTTGATATATTTCAGACCACTGCGCCCCCAACCCGTGCCAGAACGGCGGTACGTGCCAACCATCAATCTGGCCCCACGAGCCCCACCTGATCACCTGCCAGTGTCCACCTGGGTTCGAAGGTCCTCTGTGTCAGTACACAGCTCTAGATCCTTGTAGTCTGCCTCTCAGCACAGGTTCTTGCTCAAGCAGAGAGTCGAGATGGTACTTTAACCAGCTCAGCGGACGATGTCAGAAGTTCACATATCTTGGTTGCCATGGCAATGCAAATAACTTTGCCTCCATTTTTGAGTGCCAAGAGAGATGCATCAAAGGATCATGCTGTACCCGCACCCCAAAAATTCGTAGTCAGAACATTGGATTTGACAGTCAAGGATATGATAAGTATGTCTGACTTTTTTTATGAGTTCTTCTGTGTCATTTTGTTGTTGGCTTATCATTGTGTTCACCTGTTTCAGTTGAAATATCTGCTGCATGAAAAAATAGAGGATGCAAAACAATTTTTGTGGTCTGTAATTTTTCAAAGTCCTCTGGGTTTTAAAAAAATAATAATTTAGGCGCAGTTTTCTTTGCTGTTTCTTCTTGAACACGTACAGTTTATTATAGTAGAACAGCCAAACCTGCCGTGATGGTCACCTGTTCTTGTTAAAAATAGATGGGTATTTTTTCACTAATCAACACGCTGTATGATGATACCAATAGCTCTAGCTATATGTCCAAATATTGATGAACGCCTGATTTCACCGCATCGTGACACATATTAAAATGATTCTGTCATAGAGGATGGCCTGTCTGAGATGACCACTTTTCTTCTGAGCATTGGGTGGTTATCTTGTAGGCCTACATTTGATAATACTTATATTTAAGAACTTGGTACCAGTATGCTGAAGTATGAATAAAGTAGTTCAATGTAATATACTGGTATACTACAGTACGAAAGTAGTCCAATATAATATTTTGGTAAGCTAAAATACGGAAATAGTCCTACATGATATTTTGGTAATCAAAAGAAATGGAAGTTGTGCTACACAATATTTTGGTAATCAAAAGTATCTCAAAATTCATCATTACTTTCCATTAGCTTTGAGTTTGTCTCATTCTGACTTGTTTGCTTGTCCCTTCTCAGTTGTGTTCAATTGTCTCGTGATACAGGTATGGATTCAATCAAGAGGGACTGAACAGATTTGGGGACAGGAGAAATGTTGACAACAGCTTCCCACTCAGTACCCGTCGCTTTGACGAGTCCGGTCTGGACTGGCAAGGTTATAACAGAGAGGGCTATGGTGAAGATGGCTTGAGCAGAGCTGGCTTTGACAAGTACGGCTTTGATGTGGACGGCTTCAACATCAGTGGGTACAGCCGTAGTGGAGAGTTTGACGGGATCATTGACTATGATGAAGAAGGATATGATCCTGAGGGATTTAACAGGTAATTCTTCCTTCTTTGTATT
>URS0001321690 rRNA from 1 species 
CCCTTAGATGTTCTGGGCTGCACGCGTGCTACACTGATATTGCCAATATGTCATTCTTATCCGAAATGGATTGGGTAATCAAGTAATGAAATTTCATGCTTGGAATCGGTAATTGCAATTTTATCGTGAACGAGGAATTCCTAGTAAGCACTAGTCATCAGCTAATGTTGATTATGTCCCTGCCCCTTGTACACACCGCCCGTCGCTACTACTGATTGGGTGTTCAAGTGAGATGCTTAGACCCTTGTTGCATGGTTCATTATTGTGCTCCGAAAGGAAAAAGTTTCAAGCTTGAGTGTCTAGAGGAAGTAAAAGTCGTAACA
>URS00004F4253 rRNA from 1 species 
GATGAACGCTGACAGAATGCTTAACACATGCAAGTCGATTCGATTTACCTTCGGGTATTGAGGATGGCGGACGGGTGAGTAACGCGTAAGGAACTTGCCTCTTGGTCTGGGACAACTGTTGGAAACGACAGCTAATACCGGATATTATGAGATTCTCGCATGGGAAACTTATGAAAGCTATATGCGCCAAGAGAGAGCCTTGCGTTCCATTAGCTAGTTGGTGGGGTAACGGCCCACCAAGGCGACGATGGATAGCCGGCCTGAGAGGGTGAACGGCCACAAGGGGACTGAGACACGGCCCTTACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGACCAAAAGTCTGATCCAGCAATTCTGTGTGCACGATGAAGGTCTTCGGATTGTAAAGTGCTTTCAGTTGGGAAGAAGAAAGTGACGGTACCAACAGAAGAAGCGACGGCTAAATACGTGCCAGCAGCCGCGGTAATACGTATGTCGCAAGCGTTATCCGGATTTATTGGGCGTAAAGCGCGTCTAGGCGGAAAAATAAGTCTGATGTTAAAATGCGGGGCTCAACTCCGTATTGCGTTGGAAACTGTTTTTCTAGAGTACTGGAGAGGTGGGCGGAACTACAAGTGTAGAGGTGAAATTCGTAGATATTTGTAGGAATGCCGATGGAGAAGTCAGCTCACTGGACAGANACTGACGCTAAAGCGCGAAAGCGTGGGGAGCAAACAGGANTAGATACCCTGGTAGTCCACGCC
>URS00003E0BF5 rRNA from 1 species 
GCTCAGAAACTTAAATGACTTGAGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCTGGGCTCAAATGTATGTTGACGTATTCTGAAAGGGATACTTCTTCGGACAATATACAAGGTGCTGCATGGTTGTCGTCAGCTCGTGCCGTGAGGTGTCGGGTTAAGTCCCATAACGAGCGCAACCCCTATCATTAGTTGCCATCAGGTCAAGCTGGGGACTCTAATGAAACTGCCTACGCAAGTAGTGAGGAAGGTGGGGATGACGTCAAATCAGCACGGCCCTTACGTCCAGGGCTACACACGTGCTACAATGGCCGGTACAAAGGGCAGCTACCTGGTGACAGGATGCTAATCTCAAAAGCCGGTCTCAGTTCGGATCGGAGTCTGCAACCCGACTCCGTGAAGCTGGAATCGCTAGTAATCGCGCATCAGCCATGGCGCGGTGAATACGTTCCCGGGCCTT
>URS0001224666 rRNA from 1 species 
TACGGGGGGGGGCAAGCGTTGTTCGGAATTACTGGGCGTAAAGGGCTCGTAGGCGGCCAACTAAGTCAGACGTGAAATCCCTAGGCTCAACCTAGGAACTGCGTCTGATACTGGATGGCTTGAATCCGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAATACCGGTGGCGAAGGCGGCATCCTGGACCGGCATTGACGCTGATGAGCGAAAGCTAGGGGAGCAAACGGG
>URS000137232C rRNA from 1 species 
TACGAGGGGGGCAAATGTTGTTCGGATTCATTGGGCGTAAAGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTCGGAGCTTAACTCCGAAACTGCATTCGATACTGCCGTGCTTGAGGACTGGAGAGGAGACTGGAATTTACGGTGTAGCGGTGAAATGCGTAGATATCGTAAGGAAGACCAGTGGCGAAGGCGGGTCTCTGGACAGTTCCTGACGCTGAGGCACGAAGGTCAGGGGAGCAAACGGG
>URS00009BFC8A lncRNA from 7 species 
CACAAAGAGAAGCTTTAAAAATCTTGCCTTCTGCCCCCTCAATTTCTTCTCCCTTCCTTCTCTATTTCCCACTGGTTTAGCGTGCCTGTCTCTCCCATTTTACCCTGCTTCAATCTCCTCCCAGTTGCTTCTGCTAGAGTTGCCTTTTGTCCTCTCACATCCCTAGGTCATCCTTGTTAGGGCTCTCCTGGCCTGGTTCCTTGTCCGCTTGAATTCCAGGGAGTGTTACAAGGTTTGGAGGTTTTTGCTTTACACATGGACCCAGAAGGAGCTGCAGCCTACAGGCCTCTCCCAAGAAGGCCTTTTCTCTGCCTGACTTTGGACTTCTCCCCAAGGTCAGGACAGTGTCCAGATGGCCCTGCTGCAGAATCTTTGCCTCCACTTCCTTCATCAAGAGGCTGTAGGTACATCTTGAGTTCATCTTGTGTCCTTCTGAAGCATTGCAGAGGGCAGCGGCTGCCTGGCATGGCACCGGTCCTGGGCATCACCCATGGGCCACCAGTGTTTTAGGGAGTGGAGAGCCTGGCTTGGGCAAGGACCTCAG
>URS000260A6B2 lncRNA from 1 species 
TAAGATCTGGTGTACCAGCCATTACCCAAGTGTTAAGGTCTGGTATATCAACTATTCCCCAAGTGTTAAGGTCTGGTGTACCAGCTACTACCTATTGTTAAGGTCAGGTATATCAACTATTACCCAAGTGTTAAGGTCTGGTATATCAAGTATTACCCAAGTGTTAAGGTCTGGTATATCAACTATTACCCAAGTGTTAAGGTCTGGTGTACCAGCTACTACCTATTGTTAAGGTCAGGTATATCAACTATTACCCAAGTGTTAAGGTCTGGTATATCAACTATTACCCAAGTGTTAAGGTCTGGTATA
>URS00002A34A8 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGACCTATGTTGAAACCTAGTGATATATAAGTTAGTGGCGGACGGGTGAGTAACGCGTGGATAACCTGCCATATACAGGGGGATAACACTTAGAAATAGGTGCTAATACCGCATAAGCGCACAGTTTCGCATGAAGCAGTGTGAAAAACTCCGGTGGTATATGATGGATCCGCGTCTGATTAGCTTGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCAGTAGCCGGCCTGAGAGGGTGAACGGCCACATTGGGACTGAGACACGGCCCAA
>URS0000F20FBF rRNA from 1 species 
CACGTAGGGCGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTCTGTTGCGTCCGCTGTGAAAACTCGGGGCTTAACCCCGAGCCTGCAGTGGATACGGGCAGACTAGAGGTAGGTAGGGGAGAATGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCGGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACGGG
>URS000118C396 rRNA from 1 species 
TACGTAGGAGGCGAGCGTTGTCCGGAGTTACTGGGCGTAAAGGGTGCGCAGGCGGTGGCCCGCGTGGGCGGTGAAAGCTCCTGGCTCAACTGGGAGAGGGCCGTCCAGACGGGGTCACTTGAGGGGCGGAGAGGGGCGTGGAATTCCGGGTGGAGCGGTGAAATGCGTAGAGATCCGGAGGAACACCAACGGCGAAGGCAGCGCCCTGGACGAGACCTGACGCTCAGGCACGAAAGCTGGGGGAGCAAACAGG
>URS00013DEF05 rRNA from 1 species 
TACGTAGGGTGCGAGCGTTGTCCGGAATTACTGGGCGTAAAGAGCTCGTAGGTGGTTTGTCGCGTTGTCCGTGAAAACTCACAGCTTAACTGTGGGCGTGCGGGCGATACGGGCAGACTGGAGTACTGCAGGGGAGACTGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCTGGAGGAATACCGGTGGCGAAGGCGGCATCCTGGACCGACATTGACGCTGAACGGCGAAAGCTAGGGGAGCAAACGGG
>URS000057D191 piRNA from 1 species 
TCTATTAGGAGCTGTCAGGTGTGTT
>URS0002185586 lncRNA from 1 species 
TAACATGGTAGGAGCACAGGTTTTTGGGAATATGTGGAAACAGACTCTGTTTAGCAACCATAACCATTTTGACTTCAACTGTGAAGATAATGACAGACCGTAAAGGCCACACATTACCCATGTGAACTATCGTATGCTGCGTGTCATAAGTATGACGTTGACCTCCTGAACTCTCGGTTCTGTGTTGTTTGCGTTGCAGAGAATAAGGCAGTTGGAAGACATGATTGAGATGCAAAAGAGACAAGTAAAGGAAATAGAAGAAAAGTTTTTGTTCCTCTTCTTGTTTTTCTCTCTAGCTTTTATTCTTTGGCCTTAATGACACTGACATGGACCGACAACAGGTGCTAAGGTGCTCAGGTGGAGAGTGAGGAAGAGAAACACAACATTTTTTTTTTTTTTTTCATGCATTTATAGATGGTTCACAAACCTTATATGGCCTTTTTGATACACGTGCACTTTTGTGGAAAACATTTACCTGGAATGCAAAACAAAACCAGGACTTTGAAAAGTGAACAAATATCAGAGACATGTAAAAGAGGTATATCAGAGATTTTTTTTATTTTTTATAACGGAAATGTCCCCTACCATTTTTGGAAGTGGAACATTTAGCCAAACTCTAATGTGAGTTCTAAAAAGCAAGAACATTGTAACTGGAACTCTGAAGCAGGTCAATAAAGGAACAGAGCAACTGAGATGGAGACAGTGCCTCAGATGGATTTAGAGCCAGACAACGAAAGAGTGCAATCGTAGAGGAGGAGGAAGGAGGAGGAAGGAGAAAGAGTTGATTCAAAAAAGCAGGACGATTTCCAAACAGACGAGCCAAGTCCTGGGCATTCCCAGAAAGCTCAGTGCAGGAGGGTCTCCATGGAAACAGCTGGCGAAACGGCTGTCATGGCCAAAGTTCAATGAGCAAGAAGTGAAAGCTTTGTACTCCGGAGTAGAGCGACACCAGAGGACTACGGGGACAGAATGTGTCACCGGTCTGTGAAACACAAAGAATCCTCAATAGCTGTGACCTCCAGGTTTTGACCCATAGAGTGAACCGTCTAGAGCACAGCCTGAGAGACAACGTCAGCTCCTTTACTGAGTCTGAGAGCTTGCTGCACAACAGAGAGTTGGAGGTGCCAGAGCAGAGCCTGCTACAGAAGGTGGAGGACCTCACAGCACACTCAGTCCTCCACTGTCCCAGCATGCAGCGACGCCAGAGGCTGGACGAGCGGCTCCACGCGCTCAGGGAGGAGGTGCGCTTCATGGTGAGTAGAGACTGTACTGAGCTTTACATTAGCTTCAATGAGGCTTATAGAGTGAGAAGTACTCAAATGTACATGTCATGTAAGCTGTACTGTAAATTGTAGTATAAGCCTGTAATTATTGTGTAAGTGTAATTATTGTGTAAGTGTATTGTGAGTGTGGTTTAAATCTATCGTTTCTCAGGTGTAGTGCTATTGTGACTGTAGTCTCCCTCTCTGTTGCATTATATGAGATGTGTATGACATTACTCAGATGTGAGGAGTAACTGTGTCATAGTTCTATCATGACCGGTCCTTCCCAGTACCAGGAGAAGGAGCATAGGAATCGTGTGTGTGGAGGGAGAGGCTACAGTGCTGCCAGGCCCAGC
>URS0000A07E96 rRNA from 1 species 
CACGCAGTAAACGATGATTACTAGTTGTTTGCGATACACAGTAAGCGACCGAGCGAAAGCATTAAGTAATCCACCTGGGGAGTACGTTCGCAAGAATGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGAGGAACATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCCGGGCTTGAAATGCAGATGACAGGGGCAGAGACGCCCCCTCCCCTCGGGGCATCTGTGTAGGTGC
>URS000257F2CE snoRNA from 1 species 
GTTGCTTCATAATGGTGAAATCTCTCAAAATCGAATGAGAGAATCTCAAGTTTCCGGAGCATAGATTAAGCATTCTATCACCAGTATTAAACAGCTCGGTGCGTATACAATCGCAT
>URS000210DF6D rRNA from 1 species 
AATTAATGAATTAATTATAATTAGTTAAATTTTATATGAAGTTCAATATTAAGTTTAGAAATATTGGCGGTGTTTTATTAAATTCTGAGAATCTTGCATAATTAAAATGATAGTACACAATTTATCTTATCTTAGTTTTGTTGGTTTATATATTGCTGTTTTATTTATGGTTTGGTTTTGATAAAATAGGTAAAAGGATTTTGTAGTAAGAAGTTCAAGTCAAAATATAGTTTTATTAAGGTTTATGTGAGTTGCTTTTGTTTAGAAAATAGGAATAATAAAGTAAAATGAAATTTTATATAAGAAGGGATTAGGTTGTAAGGGAAAAATTAATAAGTTTTCTTGATAAATTATATGAACATGT
>URS00014E047D rRNA from 1 species 
GACGAACCGTGCGAACGTTGTTCGGATTCACTGGGCTTAAAGGGCGCGTAGGCGGACGGTCAAGTCAGGGGTGAAATCTTTCAGCTCAACTGGAAAAGTGCCTCTGATACTGATCGTCTCGAGGGAGGTAGGGGCATGTGGAACTTCCGGTGGAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGTGGGCTGGGCCGGAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS000238B563 lncRNA from 1 species 
ATTCTCTCTCCATTTTAGAGAGAGAGTTGAGATGGAAATTATAATTTTCTCTCGATTTTAGAGAAACAGGTTTTTATTTTTTTGTGAGGCAAAGGATTTTGATTCGTGTCAATTTACGGCCTCTACCTCAATTGGACAGATGTGGCTCTCTTTACCTCTCTCAAAAATGTGTTTCTTCCTCCCTGTCCTTCCGGGTGAGAGTGTAAATAGATTTTGATCTGTGGTTTTTCGGCAGGAGATAGTTATTTGTGAGGGAGTCTCCATTTTCCTACCAAATAATTTGGTTGCATGTTTGTTTTCTTTTTCTCTTCCTTTGTGTTTTGCAGATGGAGGATTCCTGGCGGTGCTTTTTCTAGTTTGTTCTTCTGCCATTAGGAAACGATGGAGAGATCTATACTTTTCAATCTCGTAATCGACGCTTTTGTCCTAAGTTCTCATTCCTTGGCTCGAGAGGATGGTGGGTGGACTCGATTGCAAAAGTCTCTTTTCTCTTTCTATTGTATTCATCGTTCATCTCTCAACCTTGCTAGGGCTGCATGCGTTTTTCTGCTCGGTGCCATCCTTTGTTTCTATTGCTTTAGTTGCCGGAAAAGAACTACTGTTCGGAAAAAAAAAACTTATTTCCTCTTATCGGCCATGGCAACTGAGTTTTTGGGTCTTAGGGTTTCTATGTGTTTGAGTTGCCTCCAAATAAAAGTTTG
>URS00021B94DD lncRNA from 1 species 
AGTTGGTGAACACAATAGCAAATCTTTTTAATAAAAATAACAGCAATAAAAAAATAACAAATATTTGAAATTTGATATTAAAATATGAACAATGACAAAAATACTGAAAGAAGTTACAATATTAACAAATATTGATATAAAACAATGGTTAAAAAATTGTCTTCATAAACAATAGCACGTGCATTTTTCTCGTGCAGTTACGTCAGGTGACCATGTATTCAGTGAATCACAAGTAATAAATAAACAAAAAATATGAGTGTGTCTTACCTGAGTTATACATGTTATAACCAACAAAAGTATTAAAAGTCTTAAAACATTTTTAAATATTATAATAATATGCCCTAGCAAGATACATAAACAATCAACCTTAAGAAAAACAATAACAAAAGTAAACCTAATTTAGGTAAACATGATAACATGGTACGCATTTAACAAAAAAAATTAAAAATTAAAAAAAAAATTCTGAAAAACTTGGATCATTTTTAGAACACAAAATATTAACATTGATGAAATAGTGTCATAGCCTATGAGGAAATCGTTTTAAAATCAAGTTACTTCCCAAATAACTGACATCTACTTTACATGTGTATATGTCTCATCCCCACTTTGAAGATGTAGATTTG
>URS0000350E7B rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAGCGGTAAGGCCCTTCGGGTACACGAGCGGCGAACGGGTGAGTAACACGTGGGTGACCTGCCTCTAGCTCTGGGATAAGCCTGGGAAACTGGGTCTAATACCGGATATGACTCCACGGCGCATGTTGTGGGGTGGAAAGCCTTGTGTGGCTAGAGATGGGCCCGCGGCCTATCAGCTTGTTGGTGGGGTGATGGCCACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATCTTGCGCAATGGGCGAAAGCCTGACGCAGCGACGCCGCGTGAGGGATGACGGCCTCGG
>URS00015AB4C8 rRNA from 1 species 
TACGGAGGATCCAAGCGTTATCCGGAATCATTGGGTTTAAAGGGTGCGTAGGCGGGTATGTAAGTCAGTGGTGAAATCCTGGAGCTTAACTCCAGAACTGCCATTGATACTATATATCTTGAATATTGTGGAGGTTTGCGGAATATGTCATGTAGCGGTGAAATGCTTAGATATGACATAGAACACCTATTGCGAAGGCAGCAGGCTACACATATATTGACGCTGAGGCACGAAAGCGTGGGGATCAAACAGG
>URS0000254467 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCTTAACACATGCAAGTCGAACGGTAACATGAAGAAGCTTGCTTCTTTGATGACGAGTGGCGGACGGGTGAGTAATGCTTGGGAATCTAGCTTATGGAGGGGGATAACTACGGGAAACTGTAGCTAATACCGCGTAGAATCGAGAGATGAAAGTGTGGGACCTTCGGGCCACATGCCATAGGATGAGCCCAAGTGGGATTAGGTAGTTGGTGAGGTAAAGGCTCACCAAGCCGACGATCTCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGGACTGAGACCTGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGCAATATTGCGCAATGGGGGCAACCCTGACGCAGCCATGCCGCGTGAATGAAGAAGGCCTTCGGGTTGTAAAGTTCTTTCGGTAGCGAGGGAAGGCATTTATGTTTAATATGATCTAAG
>URS0001ED777B rRNA from 1 species 
TCATATGCTTGTCTTAAAGATTAAGCCATGCATGTCTAAGTATAAGCTTTTATACGGCTAAACTGCGAATGGCTCATTAAAACAGTTATAGTTTATTTGATGGTCTTTACTACATGGATAACCGTGGTAATTCTATGGCTAATACATGCGCACATGCCTCTTCCCCTGGAAGGGCAGTGTTTATTAGATACAGAACCAACCCACCTTCCGGTGGTCCTCAGGTGATTCATAGTAACCGAACGGATCGCGTTGACTTCGGTCTGCGACGGATCATTCAAGTTTCTGACCTATCAGCTTTCGACGGTACTGTATTGGACTACCGTGGCAGTGACGGGTAACGGGGAATTAGGGTTCGATTCCGGAGAGGGAGCCTGAGAAACGGCTACATCTAAGGAAGGCAGCAGGCAAATTACCCAATCCTGATTCAGGGAGGTAGTGACAAGAAATAACAACACTGGAAATTTCATTTCTAGTGATTGGAATGATAGGAATCCAAACCCCTTTCAGAGTAACAATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGGATTTCTGCTGGAAGCAGCCAGTCCGCCCTCAGGGGTGTGCACTTGGTGAATTCTAGCATCCTTCTGGATTTCTCCACACTTCATTGTGTGGAGTTTTTTCCAGGACTTTTACTTTGAGAAAATTAGAGTGTTTCAAGCAGGCTTGTCGCCTTGAATACTGCAGCATGGAATAATAAGATAGGATTTCGGCCCTATTTTGTTGGTTTCTAGGACTGAAGTAATGATTAATAGGGACGGTTGGGGCATTCGTATTTAACTGTCAGAGGTGAAATTCTTAGATTTGTTAAAGACGAACTACTGCGAAAGCATTTGCCAAAGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGCTCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGAGATAGGAAAACGTCATGCTTGACTTCTCCTGCACCTTATGAGAAATCAAAGTCTTTGGGTTCTGGGGGGAGTATGGTCGCAAGGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGCGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTCACCAGGTCCAGACATAGGAAGGATTGACAGATTGATAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGTGATTTGTCTGGTTAATTCCGTTAACGAACGAGACCTTAACCTGCTAAATAGGATCAGGAACTTCGTGTTCTTGTATCACTTCTTAGAGGGACTTTGCGTGTCTAACGCAAGGAAGTTTGAGGCAATAACAGGTCTGTGATGCCCTTAGATGTTCTGGGCTGCACGCGCGCTACACTGATGCATCCAACGAGTTTATAACCTTGGCCGATAGGTCTAGGTAATCTTGTGAGTATGCATCGTGATGGGGATAGATTATTGCAATTATTAATCTTCAACGAGGAATGCCTAGTAGGCGCAAGTCAGCAGCTTGCGCCGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTCCTACCGATTGAGTGTTCCGGTGAATTATTCGGACCGTTTTGTGGCGCGTTCGTGCCCGAAATGGGAAGTTTTGTGAACCTTAACACTTAGAGGAAGGAGAAGTCGTAACAAGGT
>URS00019AFD52 lncRNA from 1 species 
GCTTAGGCCACCATGCAGCCTTATTTCTTGACCCTGCTTTAACTCCTACTCCTGATGTGAGCCGGAAAAGGACTCCCCATGTCCACCTTCTTTGGGTGTAGGTTCCATTTCTACCCCCAGTGGGGTCCAAAAAGGTTTCTCTTCGCCATTGCAGTTTCTTCTGCTGTTTCCTTGCATTCTGGGGCCCTGTTTGTGCACATAACCTTTGCCTCACCTATGTGGCCGCCTCTTGCCCCTGAGCGCTGGCCGTCCCTGTTGGACCGGCTAGTGACCTGACTCCATGGCCGCCCAGCAGTGCCATCGCAGGCCGGGCTGCCTTCAGGCAGACCCAGGCACACTTGCGGTATGTGAAAGCAAGCATTCCTGCCTTTCAGTCATGAAAAGAATGTCCTTGGCCTCTACGTTACGGTGACGCTAGTGGATAGCTTAGCCCGCACAACCCTGCCTCCTCCTCCCGGGGCCTGGGGCTGGCCCTCCTCTCCTGCCTCCCACACCTGGCCACCAGAACCCCTACCACCCTGCACCTGGTGGATCGCTCAGAGCGCACACCCCCTGGTGCTGACCAGTCGGGGAGCGCCTGGACGCAGCGACCTCTGGCCGGCTTTCGGTGTTCTCATGCGTGCGAAGAGAGCGCGTGAGGAAAGCCGCGCGGGGTCGGCAGGGTCGGCGGCCGGTGCGGACGCGCCTCGGCGGCGCGCGGCGGC
>URS00001839AB rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGAGTTGATCCTTCGGGATTAACTTAGTGGCGGACGGGTGAGTAACGCGTGGGTAACCTGCCGTATGCTGGGGGACAACAGTTGGAAACGACTGCTAATACCGCATAAGCGCACAGTACCGCATGGTATAGTGTGAAAAACTCCGGTGGCATACGATGGACCCGCGTCTGATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGTCGACGATCGGTAGCCGACCTGAGAGGGTGATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGGGCAATGGGCGAAAGCCTGACCCAGCAACGCCGCGTGAAGGAAGAAGGTCTTCGGATCGTAAACTTCTGTCCTAAGTGAAGAGCAGAAGACGGTAACTTAGGAGGAAGCCCCGGCTAACTACGTG
>URS00002AB1FD piRNA from 1 species 
TGGAAATGAAACAGTCTTTAATGTCTA
>URS0001E049BC rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGGGCCTTGTCCCCTTTTTTTTTGGGGGTGGGGTTAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCCTCACTTCTGGATAACCGCTTGAAAGGGTGGCTAATACGGGGTGTTCTGGCCTGCTCGCATGGGTGGGTTTGGAAAGATTCGACCGGTTTTGGTTGTTTTGGTGGGGGATGGGCTCGCGGCCTATCAGCTTGTTGGTGGGGTGATGGCCTGCCAAGGCTTTGACGGGTAGCCGGCCTGAGGGGGTGGGCGGTCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGCGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGAGGGATGGAGGCCTTCGGGTTGTGAACCTCTTTCGCCAGTGAAGAAGGTCCTGCTCTTTGTGGTGGGGTTGACGGTAGCTGGGTTAATGAAGCGCCGGCTAACTACGTG
>URS0000DC40A1 rRNA from 1 species 
AACTCAAATGAATTGACGGGGCCCGCACAAGCAGCGGAGCGTGTGGTTTAATTCGATGATACGCGAAGAACCTCACCCAGGTTTTGACATGCATGTGGTACCAAGGTGAAAGCTGAGGGACCCTTCGGGGAGCATGCACAGGTGTTGCACGGCCGTCGTCAGCTCGTGCCGTGAGGTGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTGTCGCCAGTTGTATTTTTCTGGCGAGACTGCCGAGAAAACCTCGGAGGAAGGAGGGGACGATGTCAGGTCAGCGTGGCCCTTACGCCTGGGGCTACACACACGCTACAATGGGCAGTACAACGGGTCGCGAAGCCGCGAGGTGGAGCTAATCCCATCAAAGCTGTCCTCAGTTCGGATTGCAGGCTGAAACCCGCCTGCATGAAGCCGGAGTTGCTAGTAACCGCAGGTCAGCATTACTGCGGTGAATACGTTCCCGGGCCTT
>URS00009444FC ncRNA from 1 species 
CATCGAGTTGGTGCGCTAGGCCGCGACGAGTAGGAGGGCCTCGGCGGCGGGCGTAGAAGCCTAGGGCGCGAGCCCGGGTGGAGCAGCCGTCGGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGGCCGAAGTGGAGAAGGGTTCCATGTGAACAGCAGTTGAACATGGGTCAGTCGACCCTAAGGGATAGGCGAAGGCCGTTCTGAAGCGGGGTGATGTTCGCGTCGCCCCGGCGGACCGAAAGGGAATCGGGTTAATATTCCCGAACCTCGACGCGGAGATTGGCGCTCCGGCGCCTAGTGCGGCAACGCAAACGAACTCGGAAACGCCGACGTGGGTCCCGGGAAGAGTTCTCTTTTCTTGGTAAGGGGCGGCGACCCTGGAATCGGTTCGCCCGGAGATAGGGACATGGGCCCCGTAAAGCAGCACGTCTCTTGTGCTGTCCGGTGAGCTCGCGTCGGCCCTTGAAAATCCGAGGGAGACGGTGTAATTTTCGTGCGAGGTCGTACCCATATCCGCAGCAGGTCTCCAAGGTGAACAGCCTCTGGCCGATAGAACAATGTAGGTAAGGGAAGTCGGCAAACTAGATCCGTAACTTCGGGAAAAGGATTGGCTCTAGGGGCTGGGTCGGTCGGGCTGAGGTACGAAGCGGGGCGCGGCGCTGTACCGGACTGGGCG
>URS0000B3F0C3 misc_RNA from 1 species 
AATAAGATTAAATTTTGTAACAGATCAATGAGATCCAGAGCAGACATTCTTAAAGACAACTAAGAAAACAAAAATCATATGTAGAATCTTTCAATATTACAAATGAAAAATCAAGATTTCCTTATTGCTCATCTACCGGTTTGAATCCTTAACAAATCGCAAACCAAAGCTATTATGGAAACCACAAAGTAGTACTCCAGCTTTCGCCTTCTCGGGCTTTTCCTTCAAGCTGTGTCCAATTCCATTCATTCTCCTCCTCCTCCACAATCTTGCCTTTAAAAATTCACTCCAAGGGTTAACCATAGAAGAGCGACAATGAGTACGATCGGAGCCCAAGAAAAGAGCGGTGCCGGGGACTGGACAAATTTTCCTCTGTCTCGGCGGCGGCGACGTTCTTGATCCTCCAAGAGATGGCAGTATCATGAGATGGCGTTCAATATGATGGCAAAGTGACACCAAACTCATATGAGTCGT
>URS000206F7FE rRNA from 1 species 
ATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCGACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACCCGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS00022DD3B1 rRNA from 1 species 
CCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGGGGTTAGTAGGTTGGTCATGCCTCTGGTATGTACTGGTCTCACTGATTCCTCCTTCCTGATGAACCTTAATGCCATTAATTTGGTGTTTTGGGGAATTTGGACTGTTACTTTGAAAAAATTAGAGTGTTTAAAGCAAGCTAACGCTTGAATACATTAGCATGGAATAATGAAATAGGACGTTCGATCCTATTTTGTTGGTTTCTAGGATTGACGTAATGATTAATAGGGAGAGTCGGGGGCATTAGTATTCAATTGTAAGAGGTGAAATTCTTGGATTTATTGATGACTAACTACTGCGAAAGCATTTGCCAAGGATGTTTTCATTAATCAAGAACGAAAGTTAGGGGATCGAAGACGATCAGATACCGTCGTAGTCTTAACCATAAACTATGCCGACTAGGGATCGGATGATGTTAATTTTTTAATGACTCATTCGGCGCCTTACG
>URS00017ABA52 rRNA from 1 species 
CCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGCCGGAAGGCTGAACCAGCCATGCCGCGTGAAGGTCAGTGCCCTATGGGCGTTAAACTTCTTTTGTGCGGGAGCAATAATGGTCGCGTGTGGCCAGACGAGAGTACCGTACGAATAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGGGGATGCAAGCGTTATCCGGGTTTATTGGGTTTAAAGGGTGCCTAGGCTGGGAGGTAAGTCAGCGGGGAAATGCCCCCGCGCAACGGGGTGAAGTGCCATTGATACTGCCTTGCTGGAATGCGGATGCCGTAGGAGGAATGTGTGGTGTAGCGGTGAAATGCATAGATATCACACAGAACACCGATTGCGAAGGCATCTCACGAATCCGCGATTGACGCTGATGCACGAAAGCGTGGGTATCAAACAGGATTAGATACCCCGGTAGTC
>URS0001280152 rRNA from 1 species 
GACTAACGCTGGCGGCAGGCTTAACACATGCAAGTCGAACGCATCCTTCGGGGTGAGTGGCAGACGGGTGAGTAACGCGTGGGAACGTGCCCTTCAGTTCGGGATAACCCAGGGAAACTTGGGCTAATACCGGATACGTGCGAGAGCAGAAAGATTTATCGCTGAAGGATCGGCCCGCGTCTGATTAGCTAGTTGGTGGGGTAATGGCCCACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACATTGGGACTGAGACACGGCCCAAACTCCGACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCATGAGTGATGAAGGCCTTAGGGTTGTAAAGCTCTTTCGTCCGGGACGATAATGACGGTACCGGAAGAAGAAGCCCCGGCTAACTTCGTGCCAGCCGCCGCCGTAA
>URS00025670D8 misc_RNA from 1 species 
AACGCACATTGCGCCCCTTGGTATTCCATTGGGCATGCCTGTTCGAGCGTCATTTACCCCTTCAAGCTCCGCTTGGTGTTGGGCGTCTGTCCGCGTTTCCGGCGCGGACTCGCCCCAAATCCATTGGCAGCGGCTCCGCCGGCTTCTCGCGCAGCACATTGCGCTCTGGGAGGCTCTCGGCGGGGCCCGCGTCCACCAAAGCAACCCCCCATTTTGACCTCGAATCAGGTAGGGATACCCGCTGAACTTAA
>URS000223CBAB misc_RNA from 1 species 
AGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCAGTTAAAAAGCTCGTAGTTGAATTTCGGGGTCAGCAGGTTGGTCGTGCCAATGGTATGCACTGGCCTTGCTGATTCCTCCCTCTTGATGAGCCGTAATGCCATTAATTTGGTGTTGCGGGGAATCAGGACTGTTACTTTGAAAAATTAGGGTGTTTAAAGCAGGCAAGCGCTTGAATACATTAGCATGGAATAATGAAATAGGACGTTCGATCCTATTTTGTTGGTTTCTAGGATTGACGTAATGATTAATAGGGATAGTTGGGGGCATTAGTATTCAATTGTCAGAGGTGAAATTCTTGGATTTATTGAAGACTAACTACTGCGAA
>URS0000D99911 rRNA from 1 species 
GGGTAAGTCGGGACCTAAGGCGAGGCCGAAAGGCGTAGTCGAAGGACAACAGTTTGAAATTACTGTACCACCGTAATCCGCTATGAGCGATGGGGTGACGCAGGAGGGTAGTGACGCGGACTGATGGATATGTCCGTCTAAGCAGTGAAGAGGCAGACCAGGGGAACTGAAACATCTAAGTACCCTGAGGAAGAGAAAACAATAGTGATTCCGTCAGTAGCGGCGAGCGAACGCGGAACAGCCTAAACCAAGGGGCTTGCCCCTTGGGGTTGTGGGACGTCTCACATGGAGTTACAAAGGAATATGGTAGGCGAAGAGGTCTGGAAAGGCCCGCGATAGAGGTAAAAGCCCTGTAGCCTAAACTGTGTTCTCTCCGAGACGGATCCCGAGTAGTGCGGGGCACGTGAAACCCCGTATGAATCCAGCAGGACCATCTGCTAAGGCTAAATACTACCTGGCGACCGATAGTGAAACAGTACCGTGAGGGAAAGGTGAAAAGCACCCCGGAAGGGGAGTGAAATAGAACCTGAAACCGTGTGCTTACAAAAAGTCAGAGCCCGATCTATGGGTGATGGCGTGCCTTTTGTAGAATGAACCGGCGAGTTACGTTTAACATGCAAGGTTAAGGTGAGAAGCCGGAGCCGCAGCGAAAGCGAGTCTGAATAGGGCGACTAAGTATGTGGACGTAGACCCGAAACCGTGTGATCTACCCCTGTCCAGGGTGAAGGTGCGGTAACACGCACTGGAGGCCCGAACCCACGCATGTTGAAAAATGCGGGGATGAGGTGGGGGTAGCGGAGAAATTCCAATCGAACTCGGAGATAGCTGGTTCTCCCCGAAATAGCTTTAGGGCTAGCCTCGGTGAATGGAGTGGTGGAGGTAGAGCACTGATTGGGTGCGGGGCCCGCAAGGGTTACCAAGCTCAGTCAAACTCCGAATGCCATTAACTTCTTGCCGGGAGTCAGACAGTGAGTGCTAAGATCCATTGTCAAAAGGGAAACAGCCCAGACCATCAGCTAAGGTCCCCAAGTGTGTGTTAAGTGGGAAAGGATGTGGAGTTGCACAGACAACCAGGATGTTGGCTTAGAAGCAGCCACCATTGAAAGAGTGCGTAATAGCTCACTGGTCGAGTGACTCTGCGCCGAAAATGTAACGGGGCTAAACACACCACCGAAGCTATGGCTAGATGCTTTGCATCTGGGGTAGGGGAGCGTTGTATGTGGGTTGAAGGTGTACCGTAAGGAGCGCTGGACAGCATACAAGTGAGAATGCCGGTATGAGTAACGAAAAGATCAGTGAGAATCTGATCCGCCGAAAGCCCAAGGTTTCCTGAGGAAGGCTCGTCCGCTCAGGGTAAGTCGGGACCTAAGGCGAGGCCGAAAGGCGTAGTCGAAGGACAACAGTTTGAAATTACTGTACCACCGTAATCCGCTATGAGCGATGGGGTGACGCAGGAGGGTAGTGACGCGGACTGATGGATATGTCCGTCTAAGCAGTGAAGCTGATGTGTAGGCAAATCCGCACATCAATAAGGCTGGGCTGTGATGGGGAGCGAAAATTGTAGTAGCGAAGCTGGGGTAGGGGAGCGTTGTATGTAGGTTGAAGGTGTACCGTAAGGAGCGCTGGACAGCATACAAGTGAGAATGCCGGTATGAGTAACGAAAAGATCAGTGAGAATCTGATCCGCCGAAAGCCCAAGGTTTCCTGAGGAAGGCTCGTCCGCTCAGGGTAAGTCGGGACCTAAGGCGAGGCCGAAAGGCGTAGTCGAAGGACAACAGTTTGAAATTACTGTACCACCGTAATCCGCTATGAGCGATGGGGTGACGCAGGAGGGTAGTGACGCGGACTGATGGATATGTCCGTCTAAGCAGTGAAGCTGATGTGTAGGCAAATCCGCACATCAATAAGGCTGGGCTGTGATGGGGAGCGAAAATTGTAGTAGCGAAGGTCATGATCTCACACTGCCAAGAAAAGCCTCTAGCCAGGAGAAGGTGCCCGTACCGCAAACCGACACAGGTAGGCGAGAAGAGAATTCTAAGGCGCGCGGAAGAACTCTCGTTAAGGAACTCGGCAAAATGACCTCGTAACTTCGGGAGAAGAGGTGCCTCGGTAGGGTGAATAGCCCGAGGGGGCCGCAGTGAAAAGGCCCAAGCGACTGTTTAGCAAAAACACAGGTCTGTGCGAAGCCGCAAGGCGAAGTATACGGGCTGACGCCTGCCCGGTGCTGGAAGGTTAAGGGGAGTGGTTAGGCCGAAGCTGTGAACCGAAGCCCCAGTAAACGGCGGCCGTAACTATAACGGTCCTAAGGTAGCGAAATTCCTTGTCAGGTAAATTCTGACCCGCACGAATGGCGTAACGACTTGGGCGCTGTCTCAACGAGAGATCCGGTGAAATTTTAATACCTGTGAAGATGCAGGTTACCCGCGACAAGACGGAAAGACCCCATGGAGCTTTACTGCAGCTTGATATTGAATTTGGGTACGATCTGTACAGGATAGGTGGGAGCCGTTGAGGCAGGAGCGCAAGCTTCTGCGGAGGCGCCGTTGGGATACCACCCTGATCGTATCTAGGTTCTAACCTAGTGCCCTTACCGGGTACGGGGACCGTGTCAGGCGGGCAGTTTGACTGGGGCGGTCGCCTCCTAAAGAGTAACGGAGGCGTTCAAAGGTTCCCTCAGAATGGTTGGAAATCATTCGCAGAGTGCAAAGGCATAAGGGAGCTTGACTGCGAGACCTACAAGTCGAGCAGGGACGAAAGTCGGACTTAGTGATCCGGTGGTACCGCATGGAAGGGCCATCGCTCAACGGATAAAAGCTACCCTGGGGATAACAGGCTTATCTCCCCCAAGAGTCCACATCGACGGGGAGGTTTGGCACCTCGATGTCGGCTCATCGCATCCTGGGGCTGAAGTAGGTCCCAAGGGTTGGGCTGTTCGCCCATTAAAGCGGTACGCGAGCTGGGTTCAGAACGTCGTGAGACAGTTCGGTCCCTATCTGTCGTGGGCGCAGGAAATTTGAGAGGAGCTGTCCTTAGTACGAGAGGACCGGGATGGACGTACCGCTGGTGCATCAGTTGTTCCGCCAGGAGCATGGCTGAGTAGCTACGTACGGACGGGATAAGCGCTGAAAGCATCTAAGCGTGAAGCCCCCCTCAAGATGAGATTTCCCAATTAGTAAGACCCCTTGAAGACGACGAGGTAGATAGGTTGGAGGTGGAAGTGCAGCAATGCATGGAGCTGACCAATACTAATCGGTCGAGGGCTTATCCAA
>URS000235B2B5 lncRNA from 1 species 
AACTGTTGCGGCAGCCATGCTTGTGAGCTTATGATGTGCCGCTAGTTTAGTTTGTCGGTTTCTGTGAACCGTTCTCTGTGATGTATGATGTATTGCTGCTGTTAGCTGTAAATGTGTTGTATGATGAGTTGACTTGATGGTTCGTTTGAGGCTGTCTTGTGAAGGTTACTGTTAGTTAACATGAGTTAAACAAATACATACACTTGCTGCTGTTAGCTGTAAACATGAGTTGACTTGATGGTTCGTTTGAGGCTGTCTTGTGAAGGTTACTGCTAGTTAACATGAGTTAAACTATTACATGCACTGGGACCCATTTGACTAGTGGACCCATTTAATAAAAATAAAAATGAAATTGTTTAGACAAAAAGGCCACGGCCCAACAATAAAAAAGGCTGCAACGTTGGGCTTGGCCCATGAAGTCGACCAAAAATTAACAGAAAAAGGCTGAATTGTTGGGCTCGGCCCATCTAAAGCAGCGAAATGGACCGGGCTGATTCTTATCAACGACCTTTTCATTTGGTCGCAATTTTGCCACGTCAGATTGCCACGTCGGATCCGACGGGGCCTGGGCAGAGAGCTAGCGACCAAAATAGAAGGTCACAGAATCAACGACCTTTTGTTTTGGTCGTGGAATTCCACGACATTCTCAAAGAGAAGGTCGTTAATTTCAATTTACGACCGCCAGCTTTTGACCATCTATTTTTGGTCAAAAAAAGGTCGCAAATGAAAATCAATGACCTTTCAGTGACCAATAGTGAGGATTGCAAGTTGACATATTTCTTGTAGTGAATTCCGGATAACTTCATAATATATTATGAAGCCTCTGCTTGGCTCAATGGATAGGCGTACAAGTCGCCGCCACTGTGTTTTGATTAACTTCAACAACCAGTTGGGATGAATCATCAGCTGGGTTATTGACACAGCCCATACGGGATCATTTATAACCCGCCGAGGGTTCCGCTGTTTAACAATATGTCGGTTTATATCACGGTCAAGTATGGAGAATCTCAAGACAACTCCTCGAGTCGTCTTAAGACTCGGGGGCTACAATGACATGACTCAGCAAATCCTGCCAGCTTCAGCTAATTCAAGAACCCCGGGTCATTGGAGGGAAGATAACCCGGTCCCAGAGGCTACTGCTATATTGATGAAAATTTAAAGGCCGTCAGAAAATTCCTGGCTTAAAATGAAGAATTCGGGATTAAAATCCAGCTCAAGGGAAATCTATCTCTCATAAAGCTTTGAAGCTCTCAACATCCGGTTTAAAATTCCGGTTCAAAAAGAATCCTTCTCTCGCAAGTTCGAGTTCAAGAAAAATTAAAGGTTGCCAAAGAGAACTCGCTACCATGATGCGCGGTTCAAACATGGGTATCCTGCCTTATTGGCTTATCACATTATTGATCACTTGGGGGCTTGCTGCTCATTGAGCATAGCTATGACTACCTTCTTAATCCGGCTTGTACGCCATGATTACAAAATACTTGGGGGCTTCCTGCTCATTGAGCATAGCTGTGATTACCCTATTGATAACCCACTTGGAGACTTGATGCCCGGGTTAAAGGTACCAAAGAGAGTCTATTGCAGAGCACAGCTCAAACATAGGTACCCTGCTTTGATGGCTCAATATATATCACTTGGGGGCTCCCTGTTCATTGTAACATAGCTTTGGTAACCATTTTGATTGGCTTGAAACGCCAGGTGTATACACCAAAAAATTTCAGTTGATCCTGCCTTTTACGTCTGCCACTTCGCTCAGGTAATCCTGGAATGACCCACCGAACTCTTAACAGTCAATCTTATTAAGACCCTGAACTTGTCAAGGTTAAAACGGCGGTTGGTCATGTGAGGCCCGACTTATAAGGTTTGAATGAAGGATTAACTTAGCGGTTGTGCAAGCCTATGAAAAGCACTTGATGATTGAGGCCTGGCCGCCTATGAAAGCCTTGATTTTTTGTTATTTGTTTTTGAACGATGTTTGAGTTCATACCTTTTTTGATATATGGTTTAAACTGATTCAGGCCATGTAGCCTTAATCCTTATGACTCGTATTTGAGCATATTTGGGGTTTGATAACCCAGCCTGGCTTTGGATGATAAGTCGCCAGTATGCTTTGATTGTGCGCTGATGTCTACTACGCAACCTTCTTCTTGTAGACGTTGTTGGGCCTCCAAGTGCAGAGGTTTGTAGGACAATAGCAAATTTCCCTCAAGTGGATGACCTAAGGTTTACCAATCCATGGGAGGCGTACGATGAAGATGGTCTCTATCAAACAACCCTGCAACCAAATAACAAAGAGTCTCTTGTGTCCCCAACACACCCAATACAATGGTAAATTGTATAGGTGCACTAGTTCGGCGAAGAGATGGTGATACAGGTGCAATATGGATGGTAGATATAGGTTTTTGTAATCTGAAAATATAAAAACAGCAAGGTAACTAATGATAAAAGTGAGCACAAACGGTATTGCAATGATAGGAAACAAGGCCTATGGTTCATACTTTCACTAGTGCAATTTCTCTCAACAATAATAACATAATTGGATCATATAACTATCCCTCAACATGCAACAAAGAGTCACTCCAAAGTCACTAATAGCGGAGAACAAATGAAGAGATTATGGTACGGTACAAAACCACCGCAAAGTTATTCTTTCCGATCAATCCATTGTGCTATTCATATAAGTGTCACAAACAGCCCTAGAGTTCGTAGTAAAATAACACCTTAAGACACACATCAACCAAAACCATAATGTCACCTAGATACTCCAATGTCACCTCAAGTATCCGTGGGTATGATTATACGATATGCATCACACAATCTCAGATTCATCTATTCAACCAACACATAGAACCTCAAAGAGTGCCCCAAAGTTTCTATCGGAGAGTCAAGACGAAAACGTGTGCCAACCCCTATGCATAGGTTCATGGGCAGAACCCGCAAGTTGATCACCAAAGCATACATCAAGTGAATCAATAGAATAACCCATTGTCACCACGGTTATCCCACGCAAGACATACATCAAGTGTTCTCAAATCATTAAAGACTCAACCCGATAAGATAACTTCAAAGGGAAAACTCAATCCATTACAAGAGAGTAGAGGGGGAGAAACATCATAAGATCCAACTATAATAGCAAAGCTCGCCATACATCAAGATCGTGCCAAATCAAGAACACGAGAGACAGATCAAACACATAGCTACTGGTACATACCCTCAGCCCTGAGGGTGAACTACTCCCTCCTCGCCATGGAGAGCGCCGGGATGATGAAGATGGCCAGCGGTGAGGGATCCCCCACCCCTCCGGAAGGGTGCCGGAACTGGGTCCCGATTGGTTTTTGGTGGCTACAGAGGCTTGCGGCGGCGGAACTCCCGATCTATTCTGTTTTTCGAAGGTTTTTGGGTATATTGGTATATATAGGAGGAAGAAATACGTCAGGGGAGCCACGAGGGTGGAGGGCGCGCCCAGGGGGGTGGGCGCGCCCCCTGCCTCGTGCCCTCCTCGTTGATTTCCTGACGTGCACTCCAAGTCCCCTGGATTGCTTCCATTCCAAAAATAACTTTCCCAAAGGTTTCATTCCGTTTGGACTCCATTTGATATTCCTTTTCTGCGAAACACTGAAACAAGGGAAAAACAGAAACTGGCACTGGGCTCTTGGTTAATAGGTTAGTCCCAAAAATAATATAAAAGTGTTTAATAAAGCCCATAAACATCCAAAACAGATAATATAATAGCATGGAACAATCAAAAATTATAGATACGTTGGAGACGTATCAGCATCCCCAAGCTTAATTCATGCTCGTCCTCGAGTAGGTAAATGATAAAAACAGAATTTTTTATGTGGAATGCTACCTAACATAATTATCAATGTAATCTTTTTTATTGTGGCAAGAATATTCAGGTCCATGAGATTCAAGACAAAAGTTTAATATTGACATAAAAATAATAATACTTCAAGCATACTAACTAAGCAATCATGTCTTCTCAAAGTAACATGGCCAAAGAAAGTTCATCCCTACAAAATCATATAGTTTGGTCATGCTCCATTTTCATCACACAAGAATGCTCTCGTCATGCACAACCCCGATGACAAGCCAAGCAATTGTTTCATACTTTAGTAATATCAAAATTTTCAACCTTCACGCAATACATGAGCGTGAGCCATGGATATAGCACTATGGGTGGAATAGAATATGATGATGGGGGTTATGTGGAGAAGACAAAAAAGGAGAAACTCTCACATTGACGCCGCTAATCAACGGGCTAGGGAGATGCCCGTCAATTGATGTCAATGCAAGGAGTAGGGATTGCCATGCAACGAATGCACTAGAGCTATAAATGTATGAAAGCTCAACAAAAGAAACTAAGTGGGTGTGCATCCAACTTGCTTGCTCATGAAGACCTAGGGCACTTGAGGAGGCCCATTGTTCGAATATACAAGCCAAGTTCTATAATCAAAAATTCCCACTAGTATATGAAAATGACAAAACAAGAGACTCTCTATCATGAAGATTCTGGTGCTACTTTGAAACACAAGTGTGGTAAAATGATAGTAACATTGTCCCTTCTCTCTTTTTCTCTCATTTTTTTGGGCCTTCTCTTTTTTTATGGCCTTTCTCTCTCTTTTTTTTATAGTCCTCACTTGGGACAATGCTCTAGAAAATGATGATCATCACACTTCTATTTATTTACAACTCAATGATTACAACTCGATACTAGAACAAAGTATGACTCTATATGAATGCCTCCGGCGGTGTACCGGGATATGCAATGAACCAAGAGTGACATGTATGAAAGAATTATGAATGGTGTCTTTGCCACAAATACTATGTCAACTACAAGATCATGCAAAGCAATATGACAATGATGAACGTGTCATGATAAACGGAACGGTGGAAAGTTGCATGGCAATATATCTCGGAATGGCTATGGAAATGCCATAATAGGTAGGTATGCTGGCTGTTTTGAGGAAGATATAAGGAGGTTTATGTGTGAAAGAGCATATCATATCACGGGGTTTGGATGAACCGGCGAAGTTTGCACCAACTCTAAATGTGAGAAAGGGCAATGCACGGTACCGAAGAGGCTAGCAATGATGGAAAGGTGAGAGTGCGTATAATCCATGCACTCAACATTAGTCATCAAGAACTCACATACTTATTGCAAAAATCTACAAGTCATCAAAAACCAAGAACTACGTGCATGCTCCTAGGGGGATAGATTGGTAGGAAAAGACCATCGCTCGTCCCCGACCGCCACTCATAAGGAAGACAATCAAGGAACACCTCATGTTTCAAATTTGTTACATAACGTTTACCATACGTGCATGCTACGGGACTTGCAAACTTCAACACAAGTATTTCTCAAATTCACAACTACTCAACTAGCACAACTTTAATATCACTACCTCCATATCTCAAAACAAGCATCAAGTATCAAACTTCTCTTAGTATTCAGTGCACTTATATGAAAGTTTTTATTATACCCATCTTGGATGCCCATCATATTAGGACTAGTTACATAACCAAAGCAAACTACCATGCTGTTCTAAAGACTCTCAAAATAATATAAGTGAAGAATGAGAGTTCATCTATTTCTTCAAAATAAAACCACCGCCGTGCTCTAAAAGGATATAAGTGAAGCACTAGAGCAAATGACAAACTACTCCGAAAGATATAAGTGAAGATCAATGAGTAGTCGAATAATTATACAACTATGTGAAGACTCTCTAACATTTAAGAATTTCAGATCTTGATACTTTATTCAAACAAAAAGCAAAACAAAAGAAAATAAAATGACGCTCCAAGCAAAACACATATCATGTGGTGAATAAAAATATAGCTCCAAGTAAAGTTACCGATGAACGAAGAGGAAAGAGGGGATGCCATCCGGGGCATCCCCAAGCTTAGGCTCTTGGTTGTACTTGAATATTACCTTGGGGTGCCTTGGGCATCCCCAAGATTAGGCTCTTGCCACTCCTTATTCCATAGTCCATCGAATCTTTACCCAAGACTTGAAAACTTCACAACACAAAACTTAACAGAAAACTCGTAAGCTCCGTTAGCGAAAGAAAACAAAAAACCACTTCATGGTACTGTAATGAAATCATTCTTCATTTATATTGGTGTTAAACCTACTGTATTCCAACTTCTCTATGGTTTATAAACTATTTTACTAGCCATAGAGTCATCAAAATAAGCAAACAACACACGAAAAACAGAATCTGTCAGAAATAGAACAGTCTGTAGTAATCTGTAACTAACGCAAACTTCTGGAACTCCAAAAATTCTAAAATAAATTTTTGGACCTGAGGAATTTGTCTAGTAATCATCTGCAAAAAGAATCAACTAAATAGCACTCTCCAGTAAAAAGTTTAGCTAATCTCGTGAGCGCTAAAGTTTCTGTTTTTTTACAGCATGCTCATAAAGACTTCACCCAAGTCTTCTCAAATGTTCTACTTGGCACAAACACTAATTAAAACACAAAACCACATCTAAACAGAATCTAGATGGATTATTTATTCCTAAACAGAACCAAAAAGTAAGAAACTAAAATTAAGTTGGGTTGCCTCCCAACAAGCGCTAATGTTTAACGCCCCTAGCTAGGCATGATGATTTCAATGATGCTCACATAAAAGATAAGAATTGAAACATAAAGAGAGCATCACGAAGGATATGACTAGCACATTTAAGTCTAACCCACTTCCTATGCATAGGGATTTTGTGAGCAAACAACTTATGGGAACAATAATCATCTAGCATAGGAAGGCAAAACAAGCATAACTTCAAAACTTTAAGCACATAAAGAGGAAACTTGATATTATTGCAATTCCTACAAGCATATGTTCTTCCCTCATAATAGTTTTCAGTAGCATCATGAATGAATTCAACAATATAACCAGCACCTAAAGCATTCTTTTCATGATCTACTTGCATAGAAATTTTACTACTCTCATAAGCAAAATTCTTCTCATTCCGAATAGTGGGAGTATCATAAGAGACTTGAATACTATAAATTGTTTCCACATTAAAAGAGTAATGTTCAGAAAAAGGGTAATCAGAATCATGACAAGTTTTATAAATATAATCATCACTACTTTTTATAGCATAAGTTTCATCACAATAATCAGCATAAGTAGCAACTGTGTTCTCATCATAATCAATTGAAACCTCTTCCGAAATAGTGGATACATCACTAAATAAAGTCATGACCTCTCCAAATCCACTTTCATAAATATTAAAAGATTCAACACCCTCCAAAATAGTGGGATCATTACTTCCTAAAGTTGACACTCTTCCAAACCCACTTTCATCAATATAGTCATCATAAGTAGGAGGCATGCTAACATCATAACAAATTTGCATATCAAAACTTGGGAGGCTAAAAATATCATCTTCATCAAACATAGCTTCCCCAAGCTTGTGGCTTTGCATATCATTAGCATCATGGATATTCATAGAATTCATACTAACAACATTGCAATCATGCTCATCATTCAAATATTTAGTGCCAAAAATTCTAATGCATTCTTCCTCTAGCAATTGAGCACAATTATCGGAATCCTTATTTTCATGAAAGATATTAAAAAGATGAAGCATATGAGGTACCCTCAATTCCATTTTTTTGTTGTTTTCTTTTATAGACTAAACTAGTGATAAGGCAAGAAACTAAAAGATTCGATTGCAAGATCTAAAGATATAACTTCAAGCACTCACCATCCCGGCAACGGCACCAGAAAAGAGCTTGATGTCTACTAAGCAACCTTCTTAGTGTAGACGTTGTTGGGCCTCCAAGTGTAGAGGTTTGTAGGACAGTAGCAAATTTCCCTCAAGTGGATGACCTAAGGTTTATCAATCCGTCGGAGGCGTAGGATGAAGATGGTCTCTCTCAAACAACCCTGCAACCAAATAACAAAGAGTCTCTTGTGTCCCCAACACACCCAATACAATGGTAAATTGTATAGGTGCACTAGTTCGGCGAAGAGATGGTGATACAAGTGCAATATGGATGGTAGATATAGGTTTTTGTAATCTGAAAATATAAAAACAGCAAGGTAAGTAATGATAAAAGTGAGCACAAACGGTATTGCAATGATAGGAAACAAGGCCTAGGGTTCATACTTTCACTAGTGCAAGTTCTCTCAACAATAATAACATAATTGGATCATATAACTATCCCTAAACATGCAACAAAGAGTCACTCCAAAGTCACTAATAGCGGAGAACAAATGAAGAGATTATGGTAGGGTACGAAACCACCTCAAAGTTATTCTTTCCGATCAATCCATTGGGCTATTCCTATAAATGTCACAAACAGCCCTAGAGTTCGTAGTAAAATAACACCTTAAGACACACATCAACAAAAACCCTAATGTCACCTAGATACTCCAATGTCACCTCAAGTATCCGTGGGTATGATTATACGATATGCATCACACAATCTCAGATTCATCTATTCAACCAACACATAGAACCTCAAAGAGTGCCCCAAAGTTTCTACCGGAGAGTCAAGACGAAAACGTGTGCCAACCCCTATGCATAGGTTCATGGGCGGAACCCGCAAGTTGATCACCAAAGCATACATCAAGTGAACCAATAGAATAACCCATTGTCACCACGGTTATCCCACGCAAGACATACATCAAGTGTTCTCAAATCATTAAAGACACAATCCGATAAGATAACTTCAAAGGGAAAACTCAATCCATTACAAGAGAGTAGAGGGGGAGAAACATCATAAGATCCAACTATAATAGCAAAGCTCGCGATACATCAAGATCATGCCAAATCAAGAACACAAGAGAGAGAGATCAAACACATAGCTATTGGTACATACCCTCAGCCCCGAGGGTGAACTACTCCCTCCTCGTCATGGATAGCGCCGGGATGATGAAGATGGCCACCGGTGAGGGATCCCCCCCCCCTCCGGCAGGGTGCCGGAACAGGGTCCCGATTGGTTTTTGGTGGCTACAGAGGCTTGCGGCGGCGGAACTCCCGATCTATTCTGTTTTTTGAAGGTTTTTGGGTATATTGGTATATATAGGAGGAAAAAATACGTCAGGGGAGCCACGAGGGGCCCAGGAGGTGGGCGCGCCCCCTGCCTCATGCCCTCCTCGTTGATTCCCTGACGTGCACTCCAAGTCCCCTGAATTGCTTCCGTTCCAAAAATAACTTTCCCGAAGGTTTCAGTCCGTTTGGACTCCGTTTGATATTTCTTTTCTGCGAAACACTGAAACAAGGGAAAAACAGAAACTGGCACTGGGCTCTTGGTTAATAGGTTAGTCCCAAAAATAATATAAAAGTGTTTAATAAAGCCCATAAACATTCCAAACAGATAATATAATAGCATGGAACAATCAAAAATTATAGATACGTTGGAGACGTATCATGCGCTTGGAGTTCTGTGCTCTAAGTTTTTGGGTTGTTACCCTTGCTGCGTATGGCGCTGTAAGCCGGCTGTATGAACCGATTTCACAGGCCATGTAGCCTTGATTGTATGACTCATCATGGAGCATCTTTGGGTTTGATAACCCGCCCTGATAGCGGATGTTGAGTCGCCAAGATATCTTTGCATTGAGCAATCAAAATTATGATATTACATGCCTACGGGTCAATACCCGTGACGGATTATAATTATTGAGGTATCACCAGGATGTCAATCTCCAGGTATGTTTTTCAATAATGGTATGAATATTTTGGGTTTGGTAACCCGCCCTGGCTATGGACTTTAAGTTTCTAGAATACTTTGGATTGCGCAATTGGGATTATGCGCTTATGAATACTTGGGATGTGGCTATGTAAGCCGGCAATTTGAGCCAAATTTCTAGGTATGTTTTTAAATTGTTGGATGAATATGTGAGGTTTGATAACCCGCCCTGGCTTTGGACATTAAGTCGCCAGTATATTTTGGATTGCACCATTGGAATCATGCGCTTATAAATTATTGGATTGTTACCCTCACTGGATATGGCGATGTACGCCAGCGGTATAAATCAATCCTACAGGTATGTTTTCCTGGTTATATGAATATACGAGGTTTGATAACCCGCCCTAGCTTTTGACTTTAAGTCGCCAGTATGTTTAGGCTTGAATGTCCTTGCTTAGTCTTTTCGGTAATTACATAAGACTATATTATGTTTGGGTTGTTGCCCGCCCTGGCTTTTGACGTTAAGTCGCCAGGGCATATGTTGTTTAAACTGTGTAGAACATGCAGAGCTTTACACATAAGTAAGAATACTGCTATTGCTCATATGAATCATTGCGTTTAAACCCATCATCTGGCCATCTGAAGATATTGCCGGGTTATCCGGCTCCGGGCTATATTGTTCAATATTGAGTTTATTGAGGCTATGAGCTGCCAAAGTGATCTTGTCAAAAACTGGACATGATTATGAGCCGCCATGGATGGGGTTATCAATTCTTGATTTTTACAAAGGCTATAAGCCGCTGGATTGCAAAGTCCCGGATTACAATGGATGCGCATTAAGTCGCCATCGACCAAGAGCCGCCGGGTATTTAAATTCCGGATTTACTTGTCAAACAGATAAGGTATTCAAATCTTTAATAGCCAAACTTGGCTGGAGTTTCATTATAATATTGAATGATTGAGGTTTTCATACCGGATTATATGACCCGGCCGGACATGGCGCCTCACCAGAAACCCGGTTGATACTTGGCGACTCACTAGAGACCCGCCCGAACCTCAGCGACTCATTAGTAACCCGGCGGGCGGGTCAGACGATCGACAAGACCCAACGGCCCAGAAGGCGACTCGTGGGAAGGCCGGCTCGTGTTATGGTGGGCCGGCTTAAGATGAAAGGCTAAAGAATATTCTCCTAGAAAGAAAGCAAGACTAGGACTGCACTTGTAATAGAGTAGTCCTAGTCCTACTAGGACTCCACATGTAACCCGCCCCTCCAACTTAGATAAGGAGGGACAGGGCACCCCAAGAGGGACAAGTTTTCACGAGTTGGACAAGTTAGGGTTAGACAGACAAGTCTATAGCTATCGAGATAGAGCACCCTTGTAATCGTGATCATCATCATCAATATCAATGAAGCAGGATGTAGACTTTTACCTCCACCGTGAGGGCCGAACTTCGGTAAAAAACCTCGCGTCTCTCGCCCCACTCAACCCCTCTCAAGCTACCACATAGATGCGTTGGCTTCATGACTAAGTCCTCATACTAGGACATCTGCCGTGACAAATCCACGACAAGATTCAAGTGGAGGCAACATGTGGTGCACATCGAAAGTTTGGATTAGTAGTATAGCTTCGAGATGCACCACATGCTGCCTCCACTTGAACCTAATCCACCTCCATTTCACACACTGTTATGGACATAATGATATATCAACCTCATAATTGGTCCTGTATACAAATTTGTACAACGGCGTATAAATACACTAAAAGTAAAAAAATAAAAAACAGTATACTGGTAGCGCTGGACCGGAAACACGCTACTACTAGCTAGTTAGATTAGCAGTAGCGTGTGTTGCACGGGCTACTGCTAAGGAATAGCTGTAGCGCCTTACTAGTAGTGCGGTGACACGCGCTACTAGTAGATCAACGTCTTCAGTGGCATGTTCAGCAGCTGGATCTTCTCCGCGGTGGTCGGCACTACCATCGGGTTCCAGGTGATCCTCGTGGAGTTGTTGGGCACGGTTCACCTGAACGGGAGGCTGTGACTCATGAGTGTGTTGATCGGGTCGGTCAGCCTGGTTATCGGCGCCGTCCTCAAGTGCATCCCTGTTGGTTCCGGCAACGCCTCGTCCGATCGTCACGACGGATACCAGCCCATCCCCACCGGCCCTAGTGCCATGTGATTTTGAAGAAGTTTTGGTTGGTTTGTTTAGGAAAGGGGAAGATGTATGAATCTTTTAGAATCAAACTTTGCAGCTTCAGTTTTTTGTAGGAGGTACCGGAACAATTTTTTTGGATTGAGAAAACCGGACATACTTGTGGTAATGACGGTTCTGAGAAATTTAAGTTTCTATTTTTTTTCGTTGTTTTTGTTTTGTGCTTTCTAGCCAAATAGGACTATGGATTTCCATTGTAGGATTACTATGCAATGATAAATGCAGTTGCTTACTATCTAGTATCTATACACAAATCTTCACATTTAGGGTTATACTCATGCGGGTGACATGTGATTTCTGGAAGATGTTCTTTTTATTTATTTTTCCTTTTGGAGGAAAAGAATGTAGTGTTAAATGAACTTTTAAGTACAGTTTGAGCTTTTTCCCCACTCAGGCAAATGAAGTTTCTGAAATTTTATTGTAGAATCCTTATAAACAACAAAAAAAAACTGAACCATGCAGGAGACTTACATGTACTCCCTCCATTTCAAAATATACGGTGTATTAGTTTTTTCAAAAATAAAACATGTGCAAGCTTGACCAAGGTTTAAGAAAAAATTATCAATATTTACAATACCAAATTTGTAGCATTAGATCCTTCACTAAACAAATTCATATTTTCTTTATTTGGTTTTGTAGAAGTTCATATTTTATTCTATAATCTTGGTCGAACATATATAAGTTTGACTTGCACGAACCTGATTCACCTTATATTCCGGAACGGAGGAAGTAATTCGGTAATAAAGAGATCAGTACAACGCCAAAGATGGCACAACCGTTACATCGCCAACACCATGACCAAACTACGACACTTACATCACCAACAATGGCGCAACCTAAACAACACAATGAGAATGACCCAATACAACTCGGACTAGGGCAAGCGTCCAACACCAGGCATAAAGAACAGAGAAAGATCCTCTGCAAGAGCCTGCACAATAGCCCGACACAACACTACCCCAACGACGACTACCACGTCAACGATTACTGACGTACAAGCAATACTATTTGCAGCAACATAGGCATGACGTCACGAATACAAGAGTCCACCTCAGGCTGTAAGTGGGACGCTCCGCGGGAGGCCCGCGTCCGCCCCACATCTGCCGCGTAGATTAAGTGGAATTCCCGTTAAAGCCTGCATATTATTATGTGGGATATGTGGGTTTAGTAGGATACCCACAAAATTCATACAGATGCTTCTGTTGAAAGTCAACTTGAGGTGGTGAGCTACAATGACTGGTTCGTCGGGAGCTCGAACAGCTCGTGTGCATGATGCGCACGTACAGCCGGCATGCCTTGGCCTTGCCCTAGTGCTCTTGTGCCGTCGATGGAGCCTCTTGGAGCAAGAAAGACTGCTCGCTGAAACAAACCCAACAGTTCAGATCGCTGAATCAACTACTCCCTCCGTTCGGAGTCATTTTTGTGACAAGTAATTCCGAACTGAAGGAGTAGTAACTAATAGCCATACATTTACAAGTTTTCAGTAGAGTAGCATTTATATACCAGGTTAACACCTCACACATACACAAACACAGACACAAATACAAGCGTCCATGGCTGGACGCGGCGCGGCAGCCGGTGCTGGCGATGCACGGAGACAGGCTGTCGACGTGGCCGTCCAACAGGCCGCGGCCCTCACGGACACCGACGAGCAGGCCTCGGTTCCACGGACGTCGCACACAGGAGTACGTCCTCGAGCCTGCAGGACCGTCGGCGAGCGCGCCCGGCGGCCGGAAGCTGCGACGGAGGTAGACGGCGGCACTGCGGCGCCCACGGCGGAGATGGGCGATGACGCTAGTGCGGCCATAGAGGAGGTCGACGGAGTCGCTAGGTCGTCCATGGAGGAGGTGGACGACGAGGTAGGCCGGCCATGGCTGGCGGCGACCCCTAATCCCCGCAGCGTGTCCAGATAAGTGGGTTCGATGTGGGCATCGTGGGATAACCCACATATTCCACATATTGTGGTGTATTGACCGTGGGTGTCCACGAACGCAAAATAAACGGGCCTTTAAGTGGGCACCGCGGGTGGCCCGTGTCCACCTACAGCCTGAAGTCCACCATTCCAACGCCGCCAGGCTAGCCTCCATCCAGACCATACAAGGAGAGTCATGGGGGTGGGCATGCAAAACCGGAGGGGGGCAGCGACGACCAACCAGGGGCGCTAGCGAGGAAAAGGCGACGCTCGCGCAAAACAAACACTGACTATCACTAGCCTTCCATCAACACCAGTCACCACGGGTCTCTCTCGAACTCTCCATAGAAGACAGAACGCGAGAGGAATCCCAGAGGCGTCCGTTTTCCCGGTCCTTCCGCCGGCGACCTCGCCGCTCCTCCTCGCCTCTGATGGCCGTTTTGGCCTCAGCAGGAGGGGGGAGCTCCGGGGAAGCCCGGCCGTCTAGGTAGGTTCCAGGAGGCGCCGTTTAGATGTCGGCGGCGGCACCGTGTCAGAATAAATGTCGCCTGGCTTCAGCCGTGTTTCGTCGGAGATCTTGTCCCCGGCGAGAAGCCCATGGGTGCGTGGTTCATGTTGAGGATATGTGTTATGTGCATATTGTGTATTGGGCTGGCTTCCTAGTTCCTTGTATAATTGAGGTATGTGGCTCATCTTTGTATATCATATATACGTGCCTATGCACAAAGAGCAATACATCATGCAATTCACATATTCTATATAGTATCAGTTTTTTAGGTTCTCTCGCTTCCGCTGCCGCCGCCGTCGTGCGTCTCCTCCGCGCCGCCGCCGCCGCCGCCCGATCTCCTTGCCGCCAACAGTCAATCCACGGCCGCCGCAGCCCTCTGCCACCCGTTCGCCGACGCCAACCCTCCCGACGTCAATGACATCCGCAACCTCAACATCTTCGAGCGGGTGTCGGTTCGTCTTTCGCAGGCGAACTCCTCCTACTACACGTGGAAGACCTACTTTTCCCTCGTGTTTCGGGAGTATCATCTTGTTGATCACGTGGACGGCACCGTCGACTCCAGCCTTGTCCCCGATTTCCATGAATGGTCCACCATCGACACCACGATCATCCGATGGTTCTTCCTCACCATCTCGCCAGACCCCTTCCAGGCGGTTGTCCAAGACGGTGATGACGCATGCGCCGTGTGGACCAACCTGAACGGGCTCTTCACCGACAACAAGCTCCAGCATCGCGTTTTTTTTGCAGCAAGAGTTCTTTGGGTGTCACCAGGACAACACCTCCGTCGACGACTATTGTCGCCGCCTGAAGACTCTCACTGACGAGCTCCGCGATATTGGCGCGAAAATTGATGATGACCTCCTCCTCACCACGCTGACCGCCGGGCTCAACGAGGATTTCGGCAACGCCGCGGCGAACCTCAGTCTCATCCCCAACCCGTCCTTCGCCAAGTTCATTGTGTACCTCCGCTTGGAGGAGCAGCGGATGAAGCAGGTGAAGGCGCGGGCCATCCACACCGCCCTCGCCGCCGGCACCACCCATGGCGGGTCCTCGGCGCCTCCCGCTGCCCCGGCCGCGCCCCTGCCGCAGCGCCACCTGGCGCCGCTGCCGTACCCGGCGCCCCAGCAATCGGGGCTGCTCCCGCTGCCTTATGGGTCGCCCGCCCCTCCCGCAGAACGGCGCCGCGGGGGCCGGCGTGGTGGGGGCCACCGCGGCGGTCAGCAGCAGCAGCCGCAGGGCGCCGGCCAGCCCCGTCAGCAGCAGCAGCAGCAGTTCCAGGTGCCCCCTCCGTGGGCCTCCGGCTACAACCCGTGGACCAGTGTTGTTCATACCCACACCATGCCGGTTCCACGGGCTCCTGGACCGACCCTTCCCGTGCCGCGCCCGTCGGCGCATCAGGCGTATTACGCGGCTCCGCAGCCGTACGGAGGATACCCACTGCTGCAGCTGAGCGGCGCCTACGGTCTTCCTGCGGCCCCGCCGCCGCCCTTGCCGGCCCTGCCGCCGGCGCCTTGGGATCCGGTGCTCCTCGCTGCGCTGCACACCGCGCCTACGCCGAACAACTACACTGGAGGCGGTGATTGGTACATGGACACCGGGGCTACGGCTCACATGTTTGCTTATCCTGATAATCTTGCCTCCTTCACTCCCGTCACCACCGATCGGCGCATCATTGTCGGCGACGGTTCCACACTCCCTATCACACATGTCGGGCACACTTCTTTTCCTTCTAATTCCATGCCTATTACTTTGTCTAACATACTACTGTCACCTCATCTTATTAAGAACCTTGTTTTCGTTCGTTGTTTAACTCGTGAAAATCCTGTTACTGTTGAATTTGATGAGCCTGGTTTTTGTGTCAAGGACGCTCGAACCAGGATGGTACTTCACCGATGTGACAGCCTCGACGAGCTCTATCCGGTGCATCCGCCGTCCACACCGGTTGCTCTCTCCGCCGGTGTCAATCTCTGGCACGCTCGTTTGGGTCATCCCAACCCAGTCACACTTCGTCATATTCTTAGGAGTTTCAGTTTCAGTTGTAATAAGATAGAGGATCACACCTGTCATGTCTGTCGTGTCGGCAAACATGTTCGCCTCCCATTTAATAACTCCACCACCATAGCTTCTTTTCCTTTTCAGTTGATTCATAGCGATGTGTGGACCTCTCCGGTTCCTAGTAATTCGGGCTATTTATATTATCTGGTTATCCTTGATGATTATTCTCACTATGTGTGGACGTTTTCTTTACGACGAAAGTCGGATGCACTCTCCACTTTGTCGGCTTTTTACTCCTATGTCAGCACGCAGTTGGGCATCCCATCCTTGCTCTTCAGACTGACCATGGAAAAGAGTTCGACAACCTTGCTTTCCGCACCTTTCTGTCGCACCACGGCACAGTTTTTCGTCTCACATGCTCGTATACTTCATAGCAGAACGGTCGAGCTGAACGCGTCCTTCGCACTCTGAACGACTGCGTTCGCACGCTCCTGTTCCATGCTAATGTGCCGCCTCGTTTCTGGCCAGACGCACTCTCTACTGCTTCAGTTCTCCTTAACCTTCGCCCTTGCCGCCCACGATGGAACTATGCACCTCACCATCTTCTCTTCGGTACGCCCCCATCTTATGACGGCTTGCGTATTTTCGGGTGCCTTTGCTATCCTAGCACTGCCGACTCCGCTCCTCACAAACTCGCACCTCGTTCTATCGCTTGCATCTTCATCGGCTACCCCTCCAACTCCAAGGGATATCGGTGCTACGATCCCGTCTCCCACCGTGTGTTCACCTCCCGGCACGTTTACTTTGATGAGCATGTGTTTCCGTTTCAACAGGTACCCCCGGCTGTTCCTCCCGCCACCAGTGACGTGGGCTCCTCGACTCCTCTCCCAGGGCGCTCACACGCCTCTCTTGGCCCGCCCCTTGGCTTTGAGGCGCGCCCCCCGCATGCAGCGGCTCCTACCGCCGCGGCACTAGCGCCCCCGACATTGGCGCCCGCGGCCCCCCTGGCGCCCCTGGCGTCCCCGGCCCCCCGGCTCCCTCGGCGCCCCCGACGCCCCCGGTGCCCGCGGCCGGTCCGGTCACCCGCGCCCGAACGGGTTTTTTTCGCCCGAGCTCGCACTACGCCTCGGATGATTACGTCCATGCGGCTGATGACCCACAAGTATCGGGGATCTATCGTAGTCCTTTCCATAAGTAAGAGTGTCGAACCCAACGAGGAGCAGAAGGAAATGATAATCAGTTTTCAGTAAAGTATTCTCTGCAAGCACTGAAATTATCGGTAACAGATAGTTTTGTGATAAGATAATTGGTAACGAGCTAGTTTTCATCACGCTCATATGATTCGCGTTCGGTACTTTGATAATTTGATATGTGGGTGTACCGGTGCTTGGGTGCTGCCCTTACTTGGACAAGCGTCCCACTTATGATTAACTCCTATTGCAAGCATCTGCAACTACAAAAGAAGTATTAAGGTAAACCTAACCATAGCATGAAACATATGGATCCAAATCAGCCCCTTACGAAGCAACGCATAAACTTGGATTTAAGCTTCTGTCACTCTAGCAACCCATCATCTACTTATTACTTCCCAATGCCTTCCTCTAGGCCCAAACAATGGTGAAGTGTCATTTAGTCCACGTTCACATGACACCACTAGAGGAGAGACAACATACATCTCATCAAAATATCAAACGAAAACCAAATTCACATGACTACTAATAGCAAGACTTCTCCCATGTCCTCAGGAACAAACGTAACTACTCACAAATCATATTCATGTTCATAATCAGAGGGGTATTAATATGCATTAAGGATCTGAACATATAATCTTCCACCAAGTAAACCAACAAGCATCAACTACAAGGAGTAATCAACACTACTAGCAACCTACGGGTACCAATCTCAGGCTATGAGACGAAGATTGGATACAAGAGATGAACTAGGGTTTGAGAGGAGATGGTGCTGGTGAAGATGTTGATGAAGATTGACCCCCTCCCGATGAGAGGATCGTTGGTGATGACGATGGTGATGATTTCCCCCTCCCGGAGGGAAGTTTCCCCGGCAGAACAGCTCCGCCGGAGCCCTAGATTGGTTCCGCCAAGGTTCCGCCTCGTGGCGGCGGAGTCTCGTCCCGCAAGCTTGCTTATGATTTTTTCCAGGGTAAAAGACTTCATATAGCAGAAGATGGACACCGGAGGCCTGCCAGGGGGCCCACGAGGCAGGGGGCGCGCCCAGGGGGTAGGGCGCGCCCCCCGCCCTCGTGGCCAGGGTGTTGGCCCCCTCTGGTATTTTCTTCGCTCAGTATTGTTTATAATTCCCAAAAATAACTTCCGTGGAGTTTCAGGACTTTCGGAGTTGCGCAGAATAGGTCTCTAATATTTGCTCCTTTTCCAGCCCAGAATTCCAACTGCCGGCATTCTCCCTCTTCATGTAAACCTTGTAAAATAAGAGAGAAAAGGCATAAGTATTGTGACATAATGTGTAATAACAGCCCATAATGCGATAAATATCAATATCAAAGCATGATGCAAAATGGACGTATCAGCGGCGTCCACCTCTGAGCCGTCATTGTTGCCGTCCTCTGTTCGAGCCGCTCTTCGTGACCCGCTCAGGATGGCTGCGATGCAAGAGGAGTTTGACGCCCTATTGCGCAACCGGGCGTGGCAGCTTGTTCCCTGTCCCCGGCGCGCCAACGTGATTACCGAGAAGTGGGTCTTTAAACACAAGCTCCGTCCTGATGGTACCCTTGATCGCTCTAAAGTGCGTTGGGTCGTTCGTAGCTTCCGACAACGTGCTGGCATCGACTTCACCGACACCTTCGCTCTGGTCGTCAAGCCCGGCACAATACGCACGGTTCTCCACCTTGCGGTCTCCCGTGCTTGGCCGGTGCACCAGATGGACGTCTCCAACGCCTTCCTCCATGGTCACCTCGAGGAGAAGGTCTTCTGCCAGCAGCCCACCGGGTTTGTTGACCCGGCGCTTCCCGACCACGTGTGCCCGCTTTCGCGGTCCTTGTACGGACTCAAGAAGGCTCCGCGCGCTTGGTACCAGCGCATCGCAGCGTTTCTCCACCAGCTTGGGTTCCGTTCTACCCGCTCGGACGCCTCGCTCTTCGTCTATCATCAGGGCTCTGACACGGCCTACTTGCTGCTCTATGTCGACGACATCATCCTGACGGCTTGTACGGCTGGTCTCCTCAGTCAGCTCAAGGCTCGTCTTCGCGCTGAGTTCGCCATCAAGGACTTGGGTCCTTTGCACTACTTCCTCGGTGTCGAGGTGGTGCGCCGTCCGGATGGCTTCTTCCTTCATCAGCGGAAGTACGCTCACGAACTCCTGGAGCGCGCCGGCATGCTTAACTGCAAGCCCGCCGCTACGCCTATTGATACGAAGGCCAAGCTTTCTGCCACGGATGGTTCTCCTGCTTTGGATGCCGCTTTCTATCGGTCTATCGTTGGTGCTCTCTAGTACCTCACTCTGACTCGACCGGAGATCTAGTATGTCGTGCAGTAGGTGTGTCTTCATATGCATGCTCCTCGAGACGTCCACTGGGCTGCCGTCAAGCGGATTCTCCGCTATATCTGTGGCACTATGGATCTTGGCGTCACGCTTCACGCCTCCGCCGACACCGCCCTCACCGCCTACTCCGATGCAGACTGGGCGGGCTGCCCTGACACTCGTCGCCCCACTTCGGGCTATTGTGTCTACCTTGGATCCTCACTTATCTCGTGGTCGTCCAAGCGGCAGCCTACGGTCTCTCGTTCCAGCGCTGAGGCTGAGTATCGTGCGGTGGCCAACGTCGTCGCCGAGTGTTCGTGGCTTCGCCAGCTGCTTAAGGAGCTCCCTTCCCCTATTGACCGTGCCAGGATGGTCTACTGCGACAATGTCTCGGCGGTCTACCTCTCCGCTAACCCGGTGCATCATCGACGGACCAAGCATATTGAGTTGGATATTCATTTTGTTCAGGAACAGGTGGCCCTTGGCCTAGCCTTCTAGAGCTTGTTGCATGCCACTGTTATCTCTCAAACGAAAGAACATATAAATGTATCGCGATCCGTGCAGGTTATCAGTGACAACAGGCAAGGATCTCAAAGCAATGTTGGAGGGATGAGGATAAGAGGTTTCATATAGCTCGGCCTGCACAGGAACTTTCTGTATCTCCATTCACCGTTGTGCCGCCCTTAAATTGTTTCCGTAGGGTTCAGCCCGCGTAGAGCTTGCCGATCTGTACGGCAGTGTATCCAGCAGGGACAATATGATAAGTGGATACAGTAGCTGCATTTCCGTGTACCTCCTATACCCAACATATTGCACCAGCCACCCCAACTCATACAAGTTGTCAATTCTTCACTTTTTCATTCTTGCTAGTTTGGGTGCTACTATCTTGATAAGATGCAGACGGTCAGGAGGCTATGAGAACATGACTCCATAGAAAGGATATCCTTTATAAGAGTTGTTCAAGTTTATAATAGGAGGAGTTGGTGAGCGCATTAGATATCCATAAATTGAATCTAAAATAGAAATAAAGTCTCAAGGTTTACTACTTTCTATTCAATGGTATTTGCGTTATGTCAGTAATTTTGATGATGGGGCATTGGCAAATGCATCCATGTTGAATTTAGTGACGATTAGTCCTACCACCATAATATAGGCTACCAAGGTGAACTCGAGAGTGATTATCATAGTGGTCAACATCGCCAAATGGCGCCACTCCGTGTAAATCAACTCCCAAAACTTCGTCAGTTCCAACTCACTGCCAGCATGGTGGCCCACATGGTCGACTTTAATTGTCTCCGCATATTTCACAGGTGCACTGAAACTAACTCCATTGATTATTCACGCTCACACATTTTTGCGATGTCCTAGCACTCTCTGAGTCCATTCACATATGTTTCGATGCGTGCTGTTGATGATCGTGTAGCTACTTTAGGTGAACCTAATCATAGACACCCTCAGCGCGTTCATAATACAGCTACCAACCAATACTTCCTCTGATCACCACGATGGATACCAGTTGATCCCCACCGGACATGGACAAAGTGTCATGTGATGATATTTTAAACATGTTTTGTTCTTGCTTCTTTGTAGGAAGAAGAAGAAGAAGAAGAATCTGTGCTTTACAAATTGACTTTCCATCTTTAGTTTTTCTTCTGATATGTGACACCGGAATGGATTAAGATGGTGATTACACTTCCGACTTATTTGAGACTTTTCGATCAAAGTTTTCATCCGATGCTTTCTAGGTAACAACATATCTGAAACTTCTTAACCATGTCGGTTTCCATCAACAAAGGATTAAATGTTTCTTACATATAGACAAAAATTTCTTAGTAGAAAATTCCACCCAGAAACTCCTTCGGTTTCCATCTAGTAGTATCCTTTCTTTGGGCTTGGTTATAAGTTTTTGATGCCTCTAGAAGCAAAAGTTTAAATGAACACCTAATTTTTAGTTTGCTCATGGGAAGCATTTATAAATAATGCACTACAATCAAGAAGCACGGAAATAGTGGCTTCTGCAAGGCCGTAACTCCTACCAGCTTCTATTTTTTTGATAAAGGACATTTTATTGAATTGATATATCGAGGTGATACAATCGCATCGAAAGAATGCCCGACCTCTGCATAACTCCATGCACACAGCCAAAAAGTCCAACCGATCCAAAAAAATAAAATCGTCTTACAACTTAAAAAGATAAATTAGTCCAGCCTATGATGTGGCAGATCCTATCCGGAGATCACACCGCCATCCATGGGGGAGAAAACCTCCCTGGCTATACGCTCCAGCCGCGTAGACGCCATCATAAAACGGTCCCTGTCCTCCGGCCTCTGCAGGATATACCAAGTACGGAGCCATCGCGTACATACATGAATAATCTGCATAGGAGATGAAACACATTTTTTATTAAAAACCACATCATTCCTGGTAAGCCACAATGCCCAACATAAGGCAGCCGCCCCCACAAGAATATGTGCACAAAATTGTTTATCAATACCCCTCAACCAGTTGCCGAACATGTTACATGCACTAGGTGGTGGGTATAAATTTGAAGCTACTCGAACTATGGCCCAAACCGCCCAAGCGAACTTACACTCAAAAAATAAGTGCTTAATAGACTCGTCGTGTTGGCAAAAGACACACGCCTTGGTGCCTTGCCAGTTGCGTCGTGCCAGATTATCTCTAGTTAAGATGACCCCTCTGTTTAGGAACCAGAGGAATATCTTCACTCTTAGAGGGATTTTAAGCTTCCACAATTTCCTGTTATTAACTGGAACATCACAATGAACCATTGCATCATACATGGATTTGACTGTAAACTTGCCATTCCGATGCAAATTCCATCAAAAGATGTCCGGTTCATCTGACGGCTGAATAGCCTCTAGACGTATGAGTAGCTCATTCCAAGCTGCCAGGCGAGGTCCTAAAAGGTCCCTACGGAAGGAAATATCAGGGTTTTCTTGTCCCAAAACTTGTTTGATGGTGACAAATTTATGTCTAACAATCCTATACAAACTCGGGTATTGCACCATGAGTGGTGTGGTCCCTAGCCAGGTGTCTTTCCAGAATCGAATCTGGGAACCGTCCCTAACCGAGAAAGTCCCAAATTGGAAAAAGAATTCCTTGGGCTTCATGACTCTAGACCAAAAATGTGAGTCACCAGTTTTCCAATGGACTTGAGAAATGGCCTTGGATTCCACGTACTTGTTACGAATGATTTCCTGCCACACTCCATTCTCAGTGAGTAGTTTATAAACCCATTTGCTGAGAAGAGCAATATTTTTAATCTCAAGGTCCTGAATTCCAAGTCCCCCTTGACTTTTAGGTCGACATAATACAGTCCACCTAGTCAGTCGATATTTCTTTGATTCATTATCACACTGCCAAAAAAATCTAGATCTAAAGTAATCGAGACGCTGAAGAACCCCTTTCGGTAGATGGAAGAACAACAACATATATAAAACCATGTTGCTGAGGACGGAATTGATCAAGATCAATCGCCCCCCATATGACAAGAGTTTGGCTTTCCAACTGGCTAGCCGTTTCTCAAGTCTCTCTTCCACGTGCTTCCACTCAGCGATAGTTAAACGCCGATAGTGTATGGGAATACCCAGATACCGAATCGGGAACTGCCCGAGCTGGCATCCAAAAATGTCAACATACTTAGGTGCATATTCTGCAGCATCCCCGAAGCAAAAAAGTTTGCTCTTATGAAAATTAATTTTGAGGCCAGAAAGTTCCTCAAATGCACATAAAAGCAGCTTGAGATTTCTTGCTTTATCTAGATCATGATCCAAGAAAAGTATCGTGTCATCTGCATATTGTAGGATAGATAAACCCTCTTCTACCAAATGAGGAATGACACCGCTAACCTGACCGGCCACCTTAGCCCGCTCAACAAGGGTAGCTAACATGTCAGCCACAATGTTAAACAAAATGGGTGATGCGGGGTCCCCTTGGCGAAGCCCCTTCCTTGTCTGGAAATAGTTGCCAACCTCATCATTAACTTTGATGGCCACACTACCTCCAGAAACAAAACTCTCAACCCATCGACACCATTTTGGTGAAAACCCCTTCATGCGTAAAGTTTTCAACAGAAAGGGCCATTTAACTTTATCATAGGCTTTTTCGAAATCTATTTTAAAGATCACTCCATTCAACTTTTTGCGGTGAAGCTCATGTACCGTTTCATGCAGCACAACCACACCATCTAGTATGTTGCGTCCTTGCATGAATGCTGTTTGAGTGGGCTTGACGACATGATCAGCCACCCCGTTCAACCGGTTAGTTGCGACATTCGTAAAGATTTTGAAGCTTACATTGAGAAGGCAAATCGGTCGATATTGTTGAATACGACTGGCCTCCTTAATCTTAGGCAGTAGGATAATCTCCCCAAAGTTTAAGCGGGAAATATCAAGGTCTTCGGTATGCAGTTGGTTAAGCAACTGAACCAAGTCCGCCTTGATCACATCCCAAAAGCATTGATAAAACTCTGCCGGAAAACCATCCGGTCCCGGAGCCTTGTTGTGTTCCATTTGAAACACCGCGGTTCGAATTTCCTCTTCAGAAAACGGAGATGTTAAGAATTCATTTTCCGCTTTCGAAACTTGAGGGATGTCATTTTCCTACCAGCTTTTATACCCTTGTTACATGAATGCTCTAAAAGTTGCTCTGACTTGTTGTATGTATACCTAAAATTCCATTACTACATATATAGACATGTTTATGATTAATTTGCCACCTTCCTTGTTGGCCCGTCATCCGTCAACCAGGTTGCAACCCCAACCTCCCTCCTTTCCCTCCAACTCAATTCACTGTTGCACACCACCCTTGAATTGTTTCCATGTAGTACAACCCACACATAATGGATTAGCAACAATATGCTAAGTCACTACAAAACACACGATTGTTAGTAACAAAAATCCTCATGACGGGAAAGGAACTGTCACCTAAAATCATTTTCCGTGATGGTGGTTGTCACAAACTAATGCCGGCCCGGGCATCTTAGGTGATGGTCCGGTCTGATTTTAGGTGACGCTTTCCAGTGTCACAAGACATATGCATGTTCGGTGAAGATTTTTAGTGTCACCAATATCTTGGATGGGTTAGTGAAGGAAATATATAAATAGAAAAAAATTGGTCTATGAAATTCGAACTCGTGACCTCCCACATTTGTGCATGTAGGACTCAAAGTTTGGTCGCTAGGCTAGTGTTTAATTAGTGATAATACTTTGTAGCTCTATTTTTAGTATGTAGAATGGGACTACATGTACATTTCAATGAAATAAATAAAACAAAAAACACCTTACCTTGAGACTAGTCTAATTAAAAAGAAGACCCCACATGTCATGTCTTATTTTGAAACCTCCAAAGGAAAAATAGGTGTTATTAATGAGGCCTCAACCATGGCCATGGGCCTCATGTGAAGAGAGAGAGGTTTATTACTGGGCTAGTGTTTTATGAGTGGTAACTTTGCAGCTCAATTCTTTTGTAGTATTTCCAATGGCACTACATGTGCATTTCCGTGAAAAATAAAAAAAATCGTGTTCACTTGAAACTATTCTAATTAAAAAGTGGACCCCATCTGTCTTGTTTTATTTGAAAAGTAGGTGCTACATATGGGATTTGAACCCTTGTCATGGGACTCATGTGGAGAGACAAAACACTAGCCATTTTATATATGTTGCCTTGGTGTTGAAATAAATGAAGTTGCCCTACTTGGGTGCATATGTTACTAAGACGTGCAGGGTTTCGGCCTCAAGGCGGCTTCAAAATGAAAAAGTTCTCAGCATGAAAGTTTTTCGCCTCGTCGAAGCGAACAACATAGCTTTTTCATCACCTTAATCTGGTATCACATGCAATCTCCACAGCCGATACAATGTGAAAACTTTTGACCTATGTGAAATTCTGGACACACTTGTCCGAATTTGAAAAACATTTGCTTACACGATATCGATACTTTTGCATGTGCTCATCTCATGGCTTAGGAGATAGGTGAAAAGTCACATGAGAGTTACTAAAACTCTCAATGTACTTTTCTTTGACTGGGTGGATCTACTAGGATGTTTCTTAGACATTCAAGACAAATTATGATGTTTCCAATAACCAATTGTTCTGTTTGTACATGTAACTTTAAAAATGGACTGGACCATGTACTTCATCATTACTACTGATAAATTTAGCTTCATATTGCCATTTGTCAAGTCATACAATGATTTTCCTACTTTTTAAATGTCTAAAAATGAGTACGTTAAGCACAATGTAAAAATGTTTATAAACCATGAACTAAACCATGTATTACAGATACTTTCTAGTTTTGATATTTTTCTAGATCTCAATTTCAATTTTAAGGCTTTAAATGCATTTTCTATGCATTTTTCATCAAAAATAGCAACCACCCAAGTTCTGATAAAAAATGTGAACATTTGCATCGACTGATATTATTCGTTTAGGATATAGGTGAAAAGTTTGGTGATATTTAAAAGTAATCTTGTACTTTGCTTTGTAATGGGTCGATCTACTAGGATAATTCTTAGACATTCAAGTCAAATTATGAGGTTACTAATGAAAAATGATTTTATATGTACATGTAACTTTATTTTATAGTGGACCATGCCATGAAGTTCATCGATAGTATTGAGAAACTTAACTTCATATTGCCACTTGTCATAGTCACAATTTCTTTGTCCTACTTCACAAATACTTAGAAATCGGTACCTTGTGAAGCACCTTGCACGGATATTTATCCAACATGTTCTAGACTTTTTGTACATGAACTAAACAACAAATTAGAGATAATTTGAAATTTATGGTTTTTAGATCCCATTTGCTACATTTTAGAAATGAAATGCACTCTTTGGTTTTTTAGTCAGAAAACAGAAACCAACCAAAAACTGCTCGAAAAGTGGTAAACTTTGCATGGGATCATGTACGGGTTTAGGAGTTAGGCGATAAAGTCTCACAAGATTTGACAAAAGTTTCCTTCTTCTTTGCTTTGTAATGGGTGGATCTGCTAGGATATTCCTTAGACATTGAGGTCAAACTATGATATTTTAATGTCATATCATTTTATATGTACATGCAACTTTAAAAATTGACTAGACCATATAGTTCATCGAGAGTATGAGAAATTTAACTTCATATTGCCACTTGTCATGTCATAATATATCTTTCCTACTTTGCAAATACTTACAAATAGATACATTGTGGAGCACCTTGTATTAATATTTATCCATCATGCTCTACACTTAAAAAAATGGACTGGACCATGAACTTTACCATTAGTCTTTTTCAAGATGCTCCACATCATTAGACTTTACCATTAGTCTTGAAAGACATAACTTCATATTATCACTATCATGTCATAATATGTTTTTTTGTACTTCGTAGATGCCTAAAACCTAGTACCTTGTGGAGCACCTTTCAAAAGTATCCATATGAAACACTCATCTGCCTTCAAGCATCTTCCTATGCCTTCACGCGTCCGCCTCTCTCATCTTCCTCTGCCTTCGTGTATGAGAGCCTGAGCCTCCAGCCTAGCCTTTCCTCCTTCACCTCTTCATGTGTTCGTCCACCGGGAGAAGGATCTCACCCACGGATCTGGCGCTCTTGTTCAAATCCAGCTAGGAGAGGCCTCGGGCCACATGCCGGCGAGGTCCCCTACTTTGTGCGGCAGGGTTGGCATCATCCTCGCCATATCCATCTCCACCATCCCTCCTCTCTCACCGTCACTTCATCACCGGCGTCCTGATCCTCAACAACAGCTTGTAGGATCTGGCACCAGGGCATGGAAGTTTCCATCTCATGAGGCCATGGGCTCCGTGTTCAGCGGTGCGGCAACAGTCGGCGTGACAAAAATGGCCTCTCGGGTGCGTGTGGATCTACATGCGGAGCTTGACAAGTTGACATCCAGTGGTCACACCATGCCTGAGATGCGCCATTCAATGGTCGTCCGGTGCAGGAAACACAATGGGCCGGCGAGGAGTTTTGATTTTGTTGGCTTTGGTATTTGGTATTTTCTCCATGTATAAACCAATGGTCAACTTATTTATTCAATGATTCTTCATATTATACATATATATATATATATATATATATATATGAATGGAATGGTATGTATTAGGCGAATTGCATCATGTCACTAGCCAGGTAAAAGAGCATACTTTTTTGTTTTGTGAATTGTTTACTGATGGCGTGCTGTCAATAAGTGCACATCATAGGCATGTGTGCTCATTTGTGATGGTAAGATTAAAGGCACACCACCAATATTCCTATTAGTAGTGGCGTGGAGGTTGGAGGCACACCACCAATATGTAAAATACTGATGGCAAGTGGGCCACATGCCACCAACAACCACTTATCAGTGGCGTCATATCGGTGGCTAAGGCCGTGGGGCCCCTATGCCACTAAAGTAGTTTTTGGCATGCCATTAGTAGGGTTTTCTATAGTAGTGACAATTTTTCATGCAATAGTCATACAACTCATGGGTTGGTGTGGGGCGTGCTGATGGGTTGTTGTAGCGTTGTGAACCATGGGCTAGGAACAACCCAACAAAAAATAGCGCGCGAAAGAAGAGAGAAAGTTCTGGTTGCATGCTTCATGGGCCGGCCCATTATGCGGTTTTCCTGTGTCTTTTTCTAGCCGGTTATGGGAACGTTTTATATCCTCCCCTAAACCGTTTTTTTTTTCACCTTTTCACTTGTTTCTTCCATTTTATTTTTTATTATTAGCATTTTTATTTTTAAATTCATGAATATTAATGTGTTTTTTCTTTCGGTTTTTTTGATTTCTTTCTTTCCACCAATTTTTCCTATTCAGTTTTTCCATTTTCAAATTCCGAAGAATTTTTGAAATTAGCAAACCTTTTTGAATTCATGAATATTTTCTAAAATTCACAAACATTTTTTAAAATTCTCTTGCTTTTATAAATTTGTGAACATTTTTTCACTCAACGAACATTTTTCATTATTTGGGAACAATTTCAAAATTCATGAAGATTTTTCAAATTTGCAAGCTTTTTCGAAATCCATGTAAATTTTCAAATTCATGAACACTTTTTTGAATTTATGAACAAATTTTGAATTGGAGAACATTTTGTTTGAAATTAATGACCTTTTTGTATTCCTGGATAGTTTTTGAAATTCATGAACAATTTTCAAATCATCATTATTTTTGAAATTAGGAAAAAAAATAGATTCATGATATTCTTTGAATTTTGACCGTTTTAAGACTTCATGGACATTTTATGAAAACCCTAGAGATTTTTTAAATCATGGACTTTTCTCGAAAGTCAGAACATTTTTTAAATCCTCAAAAAATTTGAAATTGAGAACTGTTTGTGAAATTTCAAATATTTTTAAAAATTATTCATGAAAAAATTGAATAAAAAGAAAAAACAAAAAAAGAAAGAACAAAAATGAAATAAGACAAGAGCGGCCAGGCCGCACATGAGCTGGCCTAATGCGCGATGGGTGAGCTGTGGGGTGCGCGATTTGTGGCTATCTGCCGACGCACACGACAAATACAAGCTCCTGTTTGGGCCATCCTTTTTCGAGCTATTTTGGTCCTGGTTTTCCCAAAAGGAAGAGAGGAAAGAAAAGGAAATGAGCGAACGGCCCAAGAGAAAATTCAAAAGAGGGAAGAAAGCGTTCTGGCCATGGTATATGTGGCATGGTTCGTTGAGGTTTAAAAGATGAAACAATAATAAAATAAAAATGGCCTCGAAAAATATGATTAAATTAAACTAAACATGAAGATTCCAATAAAATAGCAGTTAGGGTCAGCAACCAACTTAGGGTGCTTAGGAAATACTTTTAGCTACCATCAAGGATCTGGTTCAAAAACCTTAAATCATGCCACGAGGTGACCTGGTTGTCCAGGACTCTTTTTTCAGTCTACAGCCTGACCATGTCTATGGTGCCCTCTAAGATTAGCAGATGCGGAAATTTTCCTTCCTAATGTGTCTCATCCCCATCATGTATGGAGGCCACCGTCTATCATTATCTCCCCTTATTTCCTTTGAGTCTCCTATCTTGATTCATTCCTATTAGGAGGGGTTCCTATTACCCATGTGTTACCTGTTAAGATGTGGTATGTGGATTGTGTATGTAAAACGGTGGTCACTACATAGCACACATATTCACACAAAATGTCTATCTACACAAATAATGTAATTACCCACACAATTGCCTAGACATCACTATTTATACCAAGAGCACTAGCTACCAGTTTCAATACTATAGATGAAGTTCTATAATTGGTAGCAGGGCTAGGCCCACCTACCCAACAACCTAAGAGATTCTTTTCGAGCCTCGTAATAATTGTAGTTCAATTACGTTCTTGTACAATGTTGCATCTAATTCTCCCTTCTCGTATTTTATTAACAAACCATTTGCTAATTTCAATTCAATGGCTGAAAAACAGGATCAACTCATCATGGAAAGAAAATAACTCTATCGGGCCATGATGTGCACGCTGGTTAATTAAGCCTTCAAACACTTTTGTGCACTCATCAATAGATTCGAAAATAACTAAAGGCATGCCCATGCTTGAAATACTGCTCGCATCGCCGGAGGGGTGGGGGTTGAGGCGGCTCAGGTGAAACCCTAGCTGCCCCCACCATGTCACCTCCTTTCCTCACCTCCATCGTCACCTTCAAATGACGCAAGTGGGCAATGTCCTCTCGGCCGGCGATAATGGCGGTGATGCCTTCATGTGCGGTAATCTCTCGCACAAGGAGCTCTCCAGTCATGCGGTGCGGTGATCTCAGAGGTTGTGACATATTCAATGGAGCTTGGGTGTCGCAGCAACATCCCGGGGTGCCCTAAGTTGTTGTGATGCCACTATGTTGTGTCGGAGGCGGCCGTTGGCGCGGGAGGCCGCGTGTGATGATGGGCCTTTGTGCTTTGATCTGGCAACGGCACCTCGTGGACTAGTCGGTAGTGGCAACAACAAAGCGACAACGGTGGCGGTGACACAAACACATGCATAGGAAGGTCGGGGTGATGCGGCTAAGGCTTGTCGCAACCACAAAGTTGTCGCCATGTCTCTGCACTATTGTCCCCGTCTCCTCAGCACCTGATTTTTGAAGCAAGTGCGCGTAAGAAGGATTCTGGTGATGTTTGGCTCTCTCTGTTTTGTGAGAGTTTTATGCTCGCATGCACAGATTCGATCATGTGGTGATATCTACGCTAAGGATGTGCACACGAGCGGCTACCTTTGAGCGTGAGTTCCATCAAATGGTTGGGATATTGATTTTCGTTACCATGGTGTGTCGATATCTTTCCATGCAGTTTCTTCTTCGGCAAAGGGTTGTCTGCAACACATGGTGTCTTTGGATTGGTGCACTACAAAAAAAAGACACATCCGTGATGATACGCCTTTGTCAGGGTAGATCACATTTTCTGTCACTCATGTATATCCGTGACGGTTTTATGAAAAATCATGATAGCCATACTTGTGCTGTCGAGGATGTGTTACATGACAAAATCACTTTATTATCATGGAACTGTCCACTTCCATGAGATTAAGGGCCTGTACTGAAGTCCTCCCACTCCACGCTTCTCCAACTTCAGATGTGGAGTCGGACAGAACGTTTGAGCTCCGTGGAGTCAGCTTTAGGGCTTGTTTGGGACTGCTCCGCTTCACTAAAATCAGTTTCACTCCATCAAATTCACTTTAGAGCAGTTTCATACAGAAGTTATGCATACCAAAGAGAATGTTTGGCTTCCATGTAGCTCCAGCTTCAAGAATGGAAAATTTGGTGAAAAGGAAATATTTGATTGGATGAGAGGGGAGAAACGAAGGGGTATCCACTTACTGGTGGCAGTGGTGGGTAATTTCCCCCCAACTCCAGCTTCTAGAGTTTTTTGAAGCACCCCCTCAAGAGCTTCATAAAAAACTGGGAGTTGTACCCCAGATTCTAGTTTTTTTGTGAGCGGCATATCGTGGAGCTACCCTGTTTGGCTAATGTTTTCTGAAGCGTAGCTGAATTTTAAGAAGCAGAGCAGTCCCAAACAGGCTCTTAAGAAGCGGTACAAGTCTGTAGTGCAAATTTCTGAAGCTGCTAAAGCCCAGCTTCACAAAACAAAGAAGCGAGGAGCTCCTACTAATTACAAGAGGATGCCACCGCGAAGTATAGAAAACGATTCGCGAAACGGCTCCCAGCCGCTCGTGGTATGCTCGCCTCGCTAGTTTCCTGTGCGAGCGCACGTGGCCAGCCCTCCTCCACACAACGATACAAGGTGGACTGCCTCCATCCGGCCCAAACTGGCACCCAACAGGCTCCCAGCTAGGACAAATCGTGAAGAGAAGCTACAAACACTGTTGAACGAATGGAATCGCCAGGTGAAGTTCGAAGCAAGCTCCAGAAGCTGGTTTTGTGGAGTTTGAGAAGCCCAAAGAGGTTCAGAATAGGCTCTAAATAGCACATCATAATTATATTCGTGAAGGGTTACCAAAATCTGGCAGTGATATGTCTCCAACGTATCTATAATTTTTTACTGTTCCATGATGTTATATTATCATTATTGGATGCTTTACAATTATTTTATAGCAACTTTATGTCATTTTTTGGGACTAACCTATTGACATAGTGCCCAGTGCCAGTTGCTGTTTTTTGCTTGTTTTGTACTTCGCATGAAATCAATATCAAACAGAGTCCAAACACAGCGAAACTTTTTCGAGAATTTTTATGGACCAGAACACCCAGGATGGGCCAGAGAAGTACTAGAGGGGTGCCCTGAGGGGGGCACAACCCACCTGGACGCGCCTGGGGGCCCAGGCGCACCCTGGTGGGTTGTGCCCACCTCGGTGGCCCCCCACACTTCCTCTTCGCCCTATAAATTGTCAAATATTAAAAAACCAAGGGTACCCCCTAGATCGGAAGTTCCGCCGCCGCAAGGCTCTGTAGCCACGAAAAACCAATCTAGACCCCGTTCCAGCACTCCGCCGGAGGGGAAATCATCACCGGTGGCCATCTTCATCATCCCGGCGGCCACCATGATGAGGAGGAAGTAGTCCACCCTCGGGGCTGAGGGTTTGTACCAGTAGCTATGTGTTTAATCTATCTCTCTCTCGTTCGCTCGCTCTCTCTCTCTCTCCCCCTCTCGTGTTCTTGAGATGGCATGATCTTGATGTATCGCGGGCTTTGTTAATATAGTTGGATCATATGGTATTTCTCCCTCTCTATCCTGTTGTGATGAATTGAATTTTCCCTTTGAGATTTTGTTTTATCGGATTGAATACTTTTATGGATTTGAGAGCACTTGATATATGTCTTGCATATGAATACTCGTGGTGACAATGGGGTATTATATTGATTCAATTGAGATATGTTTTGGCACTCAACTCGTGGATTCTCGAGGTGACATTGGGGTAATCTATGCATAGGGGTTGATGCACGTTCTCGTCTTTTGTTTCTCCGGTAGAAATCTTGGGGCACTCTTTGAGGTTCTTTGTGTTGGATTGAGTATTATGAATCTGAATTTGCTTTGGTGTTATTTTAGTACGAACTCTTGATAGATCGATCGGAAAGAATAACTTAATGTCATTTTAGTACGAACTCTTGATAGATCGGTCGGAAAGAATAACTTGGTGTTATTTTAATACGAAGTCTTGGATAGATTGATCGGAAAGAATAGCTACAAACAATTTTTTTCTTATGTTCCCCGCTAGATAAGAACTTTGGAGTGATTCTTCATCACACGTTGAGGGATGGTTATATGATCCAACTAGATTAGCATTGTTGAAAGATTGCACTAGCTAAAGTACGGACCCTAGGCCTCATTTTCAAGCATTGCAATACCGTTTGTGCTCCGTTTTATCAATTGCTACTTTGCTGTTTTTTATTGTTCCTATTATAAAAAACCAATATCTACTATCATTACTACGCTTTTATTACCATCTCTTCGCCTAACTAGTGCACCTATAAAAATTACCATTATATTTGGTGTGTTGGGGACACAAGAGACTCTTTGTTATTTGGTTGCAGAGTTGTTTGAGAGAGACCATCTTCATCCTACGCCTCCCACGGATTGATAAACCTTAGGTCATCCACTTGAGGGGAAATTGCTACTGTCCTACAAAACTTTGCGCTTGGAGGCCCAACACGACTCTACAAGAACAAGTTGTGTAGTAGACATCAGGCAGCAACTGTAATGGGTCATCACTAAGCTATCAGGTGCGGGTTCCAGATCCAATACCAGTTAACAACCCCGACCAATGACAAATTTCCACATGTTGGCTTCTCATTTGTCAACGGAGCCACGCGTCAACTCTTCCTTGTGATAGGTGTCACTCATCCAACGGATGATATGCGCCTATGAAACGAAGACACATGGCATGGCCCAACATTGGCCAGTTATAATGGCCAGCCCAGTAGGAGGCCCACAAGATTTGGGCACAACTTAGCGGGTCAGCCCACTAACAACCCTCTTGCAGATAGCTCAATTACAACTCTAGTCCATACATCCTAGTGACAATTCGGTGCGTCACCGCCCCGTTGGGTCTTCAGCATCATTACGACCCTTTGGTAGTTCTGGCCCATTAACAACCAGCTTTGTCTTTGGCCCAATTATGACCCATTGTGTCTTCCAGCCTATTAAAGGCATGTGGTAGACTCAGACTCATTTGCTGCCCAATGTTTCTTTCGGCCTGTTAGCGGCTCGTGGTGGAATTGAACCGTTTTCTATGTGATGTGTCTTTCGGCCTATTAATGGCCTAGGGTACACTTGGGCCCATTTACAACCCGATGTGTCTTTCGGTCTGTTAATGGACCAAGGTACACTTGGGCCCATTTGTTTTCCGAAGTGACTTTCGGCCTGTTAAATACACATGGTATATTTTGGCTCATTAATAACATGAGTTGGCTTTTGGACTATTAATTGTTTGTGATGTAGTTTGGCCAATTAAGGCCTGATTTCATTATCGGCTTGTTAATTGTCCGTTGTCTTGTTGGTACGATATGCCTTTTGGACTGTTAAAGGCCCGTGGTATCTTCTGGCGCATTTTAACAACCCATGGTGTGTTTGGGCTAAATGTGGCCCGAGGTTTATTCGGCCTGTTCACAGGTACTGGTGCGTTTGGTCCGGCCATACATTTCGGCTTGCTAATAGTTCAAACTGATTATGGGCTCATTTAAATCCCATAGACCGTGTCGGCCCATGAATGGCTCGTGATGATTTTGGCCAAGTTAGATTGACCGATACTATTTTGTAGTTGCGTTAGGACAATTCGAACTGATTATGGGCCCATTTAAAGCTCCCGCTTCAAGTTCATGCGATAGCACATCGACCTTCTGATTGTTAGGTTACCAAAATTGTGGTGCTCGTGCCCTGGTTTGTGTGTTTAGCTCTTTCTGATTTGTCTTCTGATTTGTTTCTATTGGTGGGAGGGATGCAAACTCGATAATGGCAATGGCGGTCATTCACCGGGGTGATAATGTTCTCAGTTTTATGTTTGTTGTCATATTTCTTAGATTTTGAATTTCGTGATGGTGATTACTCAATAGTTTTTTAGTTCGTTAATCATTTACTGATAATTTTTCAGTCCCATTTAGCATATTAGTTTGTAAGATGATTAATAGTTTTTCACATTTTCTTATTTCAGTCTGTGTTCAGTTCATCAATTATCAGTTAAACTAGATTTCAGTTTGTAGTGTTTTACTTTTGATTTTTAGTCTTTGTTTATTTTTGAGTCTTAATTTTTCAGGCTTGTATGTCTATGTCTTAGTCATAGTTCTTTTTTCAGTTAGCAAGCTGATGAATAGTCAGTTAGTTTTCAATTTAGGTCATTAGTCATTACTTATTAGCCATGTTTAGTCATCTATTAGTTAGTTCATCAGTATCTTCAGTTAGTCAAGTGTGTTCAAATTATCAGCTCATTTCATTTAATCTAACCTTCACTCGTTGTATAGGTTATCATTGTATTTATTTTCAGTCTTTCATCTTCTTCGAGTTGATCAGTCCATATTGTCTCCCTTAATAGTTAAGTTATTTAGTCATCTATCAATTACACTGGTAGAAAATGGGCCTTTAGTCCCGGTTCGCAAAGGCCTTTAGTCCCGGCTGTGCAACCGGGACTAAATATGCGCGACTAAAGACCCCCCCCCTTTAGTCGCGCCTCTTACGAACCGCGACTAAAGGCCCGTCCACGTGGGCGCCAGGGGTCCGTCGGGGCGGAGGACCTTTAGTCCCGGTTCTCGTGGCTAACCGGGACTAAAGGCCCGTCCACGTGGGCGCCAGGGGTCCGTCGGGGAGGAGGACCTTTAGTCCCGGTTCTCGTGGCTAACCAGGACTAAAGGCCTCCTCCGCAGGTTTAGGGTTTTAGCCCCCCTAAACCTGGTTTCTTTTTAATTTGTAGTGTTTTATTTCTTTTATATTTTATTTTGTGTTTTATTTTAATTTTGATGAAGTTTCAGTACACATATTCTACGCTACTATATACATGCATATGAAATTTCAAACAAGAAGAATTCAAGAGGAATATATAATATATATTCAATCTCGGGTGACCATATACAACTTCGAACAAGTTTCCATACACAATTAGGATGGATGACCATATACAACTTCGAACAAGTTTAAATCTCGGGTATGCATATAAATTTCTTCGTCCTCGGTATAGTGTTCTCCTTTAGGATTGATGACTTCCCTCATGAAAAATCCTGCTAATTCATCTTGAATTGGTCGGAAGCGAGCTTCTGGACTAAGCCTCCTCCGCAAGTTATCCGTCGCCTTCCGCACGCTATCCGATGCCTTCCGCTCAGAGGTGTGTCTCCGGATGTTCTCACAAACATAGTATCCACATAGATTGGTCCCCGGTGGCTGCTTATCCACACTAACTAACCTTCTAAAATCTAGCTCATGTTTGAATTCACCGACAATTTCTTCTGAGAACTGTCTCCAAACCCTACAGGGCAAAGAAAATTAAATGAACAAGGGAGTTATTAGTTACTTGATATTAGGAAATGAACGAAAGAGACCGATCGATATAGAGCTCAAATGATTGAAAATAATTACTTTTGCAGCAGTTTTCTCATGTCGGCCCAACGCTTTGGATCCGAATCCATAGAGTCCATGATTAGAACTCTGGAGGTGTGAAGTTCAATATTTAGCAGAATCCAGTGGAACCTGCGGACACGTTACATGCACAGTCATGCATAACTCATCGATTAGACATACCATGCATGGAGTAAACACAAGAGAATGGGCACAAGAGAGAAACACTCACCCAAAATGGTAAGGAAATAGAATATGACTTTTGAGTTGATGCTTTCTAAGAAACTTGTACAAGTCTTTCTCCACGTCTTCGGGGTGATTTTGTAACACATGTCCATTAACGATATGTGGGTCAATGAACCCAACATCATGGATGTTTCTTATTTTGCATTCCCAAATCTTCAATCTGCATAATAGCGTACGCAACAATATAGTTAGGACAATATATATATATATATATATATATATATANNNNNNNNNNCAACGCTTTGGATCCGAATCCATAGAGTCCATGATTAGAACTCTGGAGGTGTGAAGTTCAATATTTAGCAGAATCCAGTGGAACCTGCGGACACGTTACATGCACAGTCATGCATAACTCATCGATTAGACATACCATGCATGGAGTAAACAAAAGAGAATGGGCACAAGAGAGAAACACTCACCCAAAATGGTAAGGAAATAGAATATGACTTTTGAGTTGATGCTTTCTAAGAAACTTGTACAAGTCTTTCTCCACGTCTTCGGGGTGATTTTGTAAGACATGTCCATTAACGATATGTGGGTCAATGAACCCAACATCATGGATGTTTCTTATTTTGCATTCCCAAATCTTCAATCTGCATAATAGCGTACGCAACAATATAGTTAGGACAATATATATATATATATATATATATATATATATATATATATATATATATATATTTATTTATTTATTTATTTATAGTGCAGGCAATGAAGAACGAGATGAGGTAGAAATAAATCACTTACAGAACGTAGCAACTCAGCATAGATTTGTCGAGGTCGCGCAGATTGAACAGCTGGAACAATTCACTCATATGAACTTGTACAGAGTACCGTTTGGTGTGATGCTCCTCTGTAACATCCGCATAAACATATTCTTTGTCGGCCCATGTTATGAATTGCTTGTACCAACGTAGCAGATTTCGCATTTGTGGTGGTAGACTCTTTTCCCGCGCAGGCTCGACGAGAGGCCCATTCCGCACATATTGTAATGCTATCTCACATACTGGCGCATCCTCAAGGCCTAAGAAGGCACGAAGAGTCAAACCCATCTCGGACGCTTGTTTCATGGCACTCGCTACAGTCAATCCAAGTGCTGCCGCAGCTGCTATGATCTCGGGGTCCTCTTNNNNNNNNNNCACTCACCCAAAATGGTAAGGAAATAGAATATGACTTTTGAGTTGATGCTTTCTAAGAAACTTGTACAAGTCTTTCTCCACGTCTTCGGGGTGATTTTGTAACACATGTCCATTAACGATATGTGGGTCAATGAACCCAACATCATGGATGTTTCTTATTTTGCATTCCCAAATCTTCAATCTGCATAATAGCGTACGCAACAATATAGTTAGGACAATATATATATATATATATATATATATATATATATATATATATATATATATAGTGCAGGCAATGAAGAACGAGATGAGGTAGAAATAAATCACTTACAGAACGTAGCAACTCAGCATAGATTTGTCGAGCTCGCGCAGATTGAACAGCTGGAACAATTCACTCATATGAACTTGTACAGAGTACCGTTTGGTGTGATGCTCCTCTGTAACATCCGCATAAACATATTCTTTGCCGGCCCATGTTATGAATTGCTTGTACCAACGTAGCAGATTTCGCATTTGTGGTGGTAGACTCTTTTCCCGCGCAGGCTCGACGAGAGGCCCATTCCGCACATATTGTAATGCTATCTCACATACTAGCGCATCCTCAACGCCTAAGAAGGCACGAAGAGTCAAACCCATCTCGGACGCTTGTTTCATGGCACTCGCTACAGTCAATCCAAGTGCTGCCGCAGCTGCTATGATCTCGGGGTCCTCTTCCGGACCGGCTTTCACTATGAGCGGGGGGATCGATTGTTTATTCTGCATCCCGAGCTGGTCAACTTGTTTCCCGCTTTTTTTACTTTCTTCTTTCTCCTCCTTCAATATTTTTGCTTGCCTACGAAGTTCATGTCCATAGTCGTCAGGCATATTCAGCTCGGCTTGGGACGGTGTCGTCAAAAAATCCTTAGCCCACTTCTTTTGCTTCTCAGTGAATACTTGCTTGGGCTCAGGCTCTTTTATCGCCTTCATATCCGCCTTCCATTTCTCATAATGAGCAGACGCGGCCAATTTGGTTTCAGCTTCACTAAGTTCCCAAGGCCTTGGGAGGAGAGGCTTCAGTGATGGCTCCGGTACCCTTGTGGTCTTAGGTACATAAGGGTCCGGGTTAATAGTCCAGGAGCGGGTTTCCTTGCTATCCGCCTGCTTCTGCTTCTTCGCCGGAGGTGGATTGGGGGGCGTCGTACCCGCCGGAGGAGGATTGGCGGGCGTCGTACCCGCCGGAGGTTGTGGATCGGGGGACGGCGTCGAATGGCGTGAAGGAGGTGTAGGTGAACCACCACGACCACCACCACCGCCACCACCACCACCACCACCATCGGAGGGGGGTGGACTTGTTAGCCTTGGCGCCTCGCCTGGAAACACTATGTACTTCTTTTTCCATAGAATGATCTGGCGCTTGACATCTCCAAGTCTTCTCTCTCCTTCGGGTGTAGCTTTGTCAATCTCCAGGTCCTCAAACCCTTGGACTATGTATTCCACCGTGACACGAGCATAGCCATATGCAATGGGGTTGTTGTGGTGGAGTGCTCCAGGTGTACAGGGTAAAGCACTGCCGCTAGCTACCTTCGTGGAAACGTTCCCCACGGGATAATGCAGATCACATTCTTTCATCTCCTTTACATCATCCACGGGGTAGTGAGGCTCCGGTGCACGAATCTCGATCATCAGTGCACTAGCACCAGGCGGGGCATCCGTGGAAGCCACGCTGCTTCTCCGCTACTGGCTTCCGCGATCCGCTTCATGATCTTCATGCGGCCCTGCAGCCGATTTTTCTTTTACTAGTTCATGCACGGTCGGCTTCAACTCATGGAGTTCCGATGCAAACTTCGCCATAAGATCTGCATCCCGGTCCGTCTTTCTCTTACGGCTTCTGTAACAGTACGGGTCATTGTCCTGGGAAAACCCTACTTTCCACGGAACTTTGCCTTTGCCTCGTACACGTCCTCCGTGTTCATCATTCCCGAGGGCTGTTGTCAGTGCGTCTTTCTCTCTGTTGAACTTGATCAAGCCCTCTTGAGCTTGGATCATTGCGTCAATAAGGGCTTGGGTGGGAGCAAACTTTTTCTTCCGGTGAACACACAACCCTGTCTCCGGGTCTAGTGATCCCCCATGCCCGTACCACCAGCTTTTGGCCCTTGGGTCCCATCCCTCTGTACCTAGAGGGATTCCTCGCACCCTCAGGTCCTCCTCCATCTTCTGCCACTTAGACTCCGAAAGGCGGTATCCTCCTGGCCCCATAATATGATGGAACTTTTTCTTACTCGCATTATCCTTATTTTTTTCGATATTTCCTTGAAATGCTCCGATTGCTTTTGCCTCACAAATTCTGGCCAATCATCTTTCAGTTTCTCATGTAGTCCATTGAAATCCGGAGTCTTGCCCTTGTTGACATAGTCACGGGTTAAATTTTTCTTGAAGTTCCGGAATGCTTCGCCCATCTTCTGAAAAGCGAACTCTTTAACTAGCCTCCTCCTCTCACGTCCACCCGGAACCTCGTTACCAAATTCATCGACTTTGTTGTATTCCGGAGGTAGAATGAAATGTTCCATAGCTTTCTCCAGCAATCCTTTTTCGTTCTCTTGTCGACAAAACTGAAACCAAGACGTGCCTTCTTTGGCTCCTTCCATTCCTGGACGGTGATCGGGACGTTGTCTCTAACAACGACTCCGCATTGGTTGATAAACTTTGAGGTGTGCTGTAGGGGCTTGCCGGTTTCACTGACAAACTCAATGGCATATGTTTCTCCTGTTTTCATCGCCTTGGATTTGCCACGCTTTGTCGTACTCGATCCGGCCGAGGGCTAAAAAAAGAAAGAGAGTCGCGCGCATTAATACATATGTATTCACATTTCAGTAAGTTTGTATCACGAGAGGCTCAATGTATATATATACCTCGCCGGAGGTGGTTGCTACTTGCAATTCGAGATCGTCGTTTGTTGACGGTTGACCTCCGTCGACAATGTCCGTTCCTCCACCTTCTTGATCATCGACAATGTCTGTTCCACCGTCAAGGTTCAGAAAAGAAGAGACTACATCCTCTTCTTGCTCATATTCTGAGCCCGGCACATAAGGAATCTCGTTGTTTATGATGCCCATTAAATAACGTTCAGCCTCCGGATCCCTAAGCGGCTCGGCTCTATCGTCCGCCATATGTCACTCCTGCATGTAGTAAAAATTAATTAAGTATAAAGGAATTAAAAAATAAGATTAAGGAGACATAGAGGAGGAGGAATTAAAAAATAAGATTACTGAGCACTGCCAAGTATTTTGTTTTTCCTTTTCTTTTTCCTTTTCTTATTTTCTTTTTCCTTTTCTTATNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTCTTCTTCCTTTTCTTCTACCTTTTCTTCTTCCTTTTCTTTTTCCTTTTCTTCTTCCTTTTCTTCTTCCTTTTCTTCTTCCTTTTCTTTTTCCTTTTCTTATTTTGTTTTTCTTGGTTTTCATTGGTTTTCTTTGTTTCTTTCTCGATTTTCTTGATTTCATTCCTTTGCATTGGTTTCTTTTGTTTTGTTTTCTTTGTTTTTCTTTTTGGTTTTCATTGGGTTTCTTTGTTATTCCTTATCTTTTGTCGATTTTATCGGTTTCTTTTTGCTTCAACACGTGTTAACTTTTTCAACCTTTTTCTTATACATCAGAAAGATTTTCATATATACATTTAACATTTTTAAACACATGATTAAGTTTTTTTTGAAAACTTATTTTTTTGGATGTATGGGTTTTTTTCATACACACTGTACATTTTTGGCATATATCTAATACATTTTCCTAATACATGTTTAACATTTTCCTAATACATGTTTAACATCTTCCAAACACATTTTAATATTTTTTGAACACATGGTCAACATTTTTCCTTCGTTTGTGGAGGCGGCGGCGGGAGGCGGAGGACGGCAGGCGGCGACGGGAGGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATCAAAAAATTCAGAAAAATAAAACTAATTCATTTTAAAACCTTAAAAATACAAATAATATATCAAAAAATTCAGTTCATCGATCCCTTGAAGGTTTGACAAAAGGTTTGATACATCATTCAGTTCATCGACCAAATACAAATCATCCGGATTCGCCATCGTACGTTTTAATTCACATGATCCATTCAACAAAGTTTGGTACAATACATTATTACACATCAATTCCTCCCTTGTGTCCCTGCTTGCTTACGATTGTGCCGTATCCATGGAGCATCCTCATCATTTAACTTAATGCTTGGGTCAGTGTTCACTTTGAAGGACAGAATTTCACCAAACATATTATAATCTTCTGACATGTCTGTCTTGTCCTCCACTCCCACGATGTTTCTTTTCCCTGAAAGAACAATGTGGCGCTTTGGATCATCGCATGATGTACTGATCGTTTTCTTATCTTTCTGTTTCCTCGGTTTGCTACTCATGTCCTTCAAATAAAAAACCTGAGCGACATCTTTGGCAAGGACGAAGGGTTCGTCAAGGTAACCAAGATTGTTGAAATCCACCATTGTCATTCCGTATTGCTCGTCCATCTTTACCCCACCTCCTGTTAGCTTGAACCATTTGCACCGGAACAAAGGGACCTTAAAGGAGGGTCCATAGTCAAGTTCCCATATCTCCTCTATGTAACCATAATATGTGACCTTTTGCCCATTCTCGGTTGCTGCATCAAAGCGGACACCACTGTTTTGGTTGGTGCTCTTTTTATCTTGGGCGATGGTGTAAAATGTATTCCCATTTATCTCGTACCCTTGGAAAATCGTTATAGTCGAAGATGGTTTCTTGGCCAACATGTACAGCTGATCTCTAACATCATTGTCATTCATTAAATGTTTTCGCAATCAACTGCCGAAAGTCTCCATGTGGGCCTTTCTAATCCAGGATTCAGGCTTCCCCGGGTTGTTCGAGTGTAAAATATTCTTGTGTTGCTCGAAGAACGGAGCCACCAAGCTGGAATTTTGCAGAACTGTGTGGTGTGCTTCAGTCATAGAATGACCGTCCATACATATCGTTGATTTCCTTCCGATCGTGCCTTTTCCACTTAGTCTCCCCTCGTGCCGCGATTGAGGAATACCAATCGGCTTAAGGTCAGGAACATAGTCAATACAGAACTCAATTACCTCCTCATTTCCATAGCCCTTGACGATGCTTCCTTCTGGCCTAGCACGGTTACGAACATATTTCTTTAATATTCCCATGAACCTCTCAAAGGGGAACATATTGTGTAGAAATACAGGACCGAGAATGGAAATCTCTTCGACTAGGTGGAGCAGGAGGTGCGTCATAATATCGAAGAAGGATGGTGGGAACACCAACTCGAAACTGACAAGGCATTGGACCACATCGTTCTGTAACCGTGGTAGATCTTCTGGATTGATTACCTTCTGAGAGATTGCATTGAGGAATGCACATAGCTTCACAATGGCTACTCGAACATTTTCCGGTAGGAGCCCCCTCAAAGCAATCGGAAGCAATTGCGTCATAATCACGTGGTAGTCGTGAGACTTCAGGTTTTGGAACTTTTTCTCCGCCATGTTTATTATTCCCTTTATATTCGACGAGAAGCCATACGGGACCTTCATACTGCTCAGGCATTCAAAAAAAATGACCTTCTCTTCTTTGGTAAGAGCGTAGCTGGCACGACCTTGAAACCATTCCGGATGCCGGCCATCTGGGTCTTTCAAAAGTTGCTGGTCCTGCCGTGCTTCCTTTGTATCATTTGTCTTCCCATACACGCCCAAGAAGCTTAGCAGGTTCACGGAAATATTCTTCGTAACATGCATCACGTCGATTGCAGAGCGGACATCTAGGACTTTCCAATATTCTAGCTCCCAAAATATAGATTTCTTCTTCCACATGGGTGCGTGCCCGTCAACTCCCCGCGGAACTGATTGTCCGCCAGGACCCTTTCCAAAGATGACTTTCAAATCCTTGACCATATCAAATATCTCAGCACCAGTACGTTCCGCAGGCTTTGGCCGGTGATCTGCCTTGCCGTTGAAATGCTTGCCTTTCTTTCTTACGTTATGATTTCGGGGAAGAAATCGACGATGACCCAGGTACACGTTCTTCTTACAATTAACCAAACGTACACTTTCAGTCTCATGTAAGCAGTGTGTGCATGCATTGTATCCCTTATTTGTCTGTCCCGAAAGGTTACTGAGAGCAGGCCAATCGTTGATGGTTACAAAAAGCAACGCTCGTAGGTCAAATTCCTCTCCTTTGTGCTCATCCCAGACACGTACACCAGGTCTGGCCCACAACTGTAAAATTTCATCAACTAATGGCCTTAGGTACACATCGATGTCGTTCCCGGGTTGCTTTGGACCTTGGATGAGCACTGGCATCATAATGAACTTCCGCTTCATGCACAACCAAGGAGGAAGGTTGTAGATGCATAGAGTCACGGGCCAGGTGCTATGGCTGGAGCTCTGCTCGCCAAAAGGATTCATGCCATCAGTACTTAGACCAAATCTTATGTTCCTTGCGTCAGCTGCAAAATCTTTGAACACTCTGTCGATCTTTCTCCATTGCATTCCATCAGCGGTGTGTCTCAACTCCCCGTCGGACTTACGGTCCTCTTTATGCCATCGCAACGACTTGGCATGCTTTTTGTTCCTGAACAGACGTTTCAACCGTGGTATTATAGGAGCATACCACATCACCTTGGCGGGAACCCTCTTCCTGGGTTTCTCGCCCTCAACATCGTCACCAGGGTCATCGCCTCTGATCTTATAACGCAATGCAGTGCATACAGGGCATTCATTCAAATTCTCGTATTCACCGCGGTAGAGGATGCAGTCGTTAATGCATGCATGTATCTTCAGAACCTCTAAACCTAGAGGGCAGACAACCTTCTTTGCTTCGTACGTACTGGAGGGCAACTCGTTATTCTTCGGAAACATGTTCTTCAACATTTTCAGCAAATTTTCAAATGATGAGTCACCTACACCTTCCTGTGCCTTCCATTTTAGCAAATCCAGTGTGCAGCCCAGCTTTTTCAGACTATTATCGCATCCTGGATACAACGACTTTTTGTGATCCTCTAACATGCGATCCAAATTCTCCCTATCCTTGTCAGTTTCGCAGCGTCTCCGTGCATCAGCAATGGTCCGACCAAGATCATCAGCGGGCTCATCATGTGCCTCTTCTTCACCTTCACCTAACCCTTCCCCACCTTCAGCATCATCCTCCATGAAAGTATCACCGAAATGATCATGATAGTTGTCATCGATATCATCCCCTTCTTCATCTTCTTCCATTCTAACCCCTCTTTCTCCATGCTTGGTCCAACAATTATAGCTTCGCATGAAACCGTGCCGAAGCAGGTGCATGTGAACGTCTCTTGAGGAGGAGTAACCCTTCTGATTCTTACAAACAGCACATGGACAGATAATAAAACCTTGCTGCTTGTTCGCATTTGCCACTACGAGGAAATCTTTCAAACCCGTAGTGAACTCGCCGGAGAGTCGGGGACCGTACATCCATTGCCGATTCATCTGCATTATTATTATATAAAGTATATAATTGACCATCATGCATTTGTTAAACTAACTAGCTAGAAATAATACAAATTAAACAATGAACTACACACATGCATATTTTATCAATGACACATGAAAGGTTCAAGTTGCTAACCGCGATCGCGAAGGAAAAATAAATGAGAAAGCTCAAGTGTGGCTCGGACACTTCGTATCATGTTTGTTTCAGGCTCTCAGGCATTTCATCGAACACCTTGTGTGCATAGGAGGAACCAAAAGCAAACCCGCCACCCCCTTCTGAATATTGTGAAGTGAGCTGAGTGAAGTGAAGTGAGCTGAGTCCTATATATAGGGATGGGCCTTTAGTCCCGGTGGCCTGGCCAACCGCGACTAAAGGCCTTCGGGGACCTTTAGTCCCGGTTGGCCAGGCCAACCGGGACTAAAGCCCCTCCCGTCCGCCAGCTGTCGACCGAGCGCGCTGGGCCCAGATAGTTGGTCGCGGGTCTCCTCCCGAACCGCAACTAAAGACCCCTTTGTCGCGGTTCGATTATTTTGGGGACTAATGGGGGCGTATGGAAGCCTCTTTTTCTACTAGTGTTAGTTCATCAATATCACTAGTAAGTTCAATGTGTTCTGTTCATTAATTAGTTCAATTTCTTTAGTATTCATTTGTTTATTCACTTCTTTAGTTTATATTACATCATTAATTCTTATAATTATCAGTGTTTTTTTTTGTTCTTTTCACATTCTCGTTTGGTGCACTATCTCACTACGACGAACAATGAACTACCATAGGTGGTATGTAGGGGTTTTCACGATTTCTTAGATATGTACTCTTCACAAATCATTATTTCATTATGCAGGCATGTCTATATATGTATCTTCACTCTTCACTCATTCTATATTTTGTCATTCATTCATCACTATTCACTTATCAGGACATTTGTTTCATCCTTTAAGTATTTTGTTAAGTCCATTCTCTATTCCTTAGTCATTTGTTCCATTTAACTTGATAACACAACATTTTATCATCGATTGGAACACTTTTTGTTCATGTGTAGTTCTGACCAGCTAATCAGTGATGGTCACTGCCTAGAACTAAGAATTAGAGTTATATGTACCTATGTTCTGATTCCAAATGTTTGAGTTATCATTAATACATTTTCATAGGTTTTTTTTATTTCCTATCATTCAAAGATCAGGACACTTTCAATCCATATTTTTTGGTGGAGTGTTGATGAATGGTGTGTGTCATACCTGGCCAAATGGCTCGGCACGGCCCGGCCTGCGGTAAACGTGCACGACACGACCCGCGACGGCACGACTAATAGCCGGGCCGTGCCGGGCCGGCCCACGGGCGGGAGCTCGCACCCTAGGCACGGCCCAGCTACTAATTGGGCCGGCCCACCTGAAGGAAATATGCCCTAGAGGCAATAATAAAGTTACTATTTATTTCCTTATTTCATGATAAATGTTTATTATTCATGCTAGAATTGTATTAACTGGAAACATGATACATGTGTGAATACATAGACAAACAGAGTGTCACTAGTATGCCTCTACTTGACTAGCTCGTTGATCAAAGATGGTTATGTTTCCTAGCCATAGACATGAGTTGTCATTTGATCAACGGGATCACATCATTAGGAGAATGATGTGATTGACTTGACCCATTCCGTTAGCTTAGCACACGATCATTTAGTATTCTGCTATTGCTTTCTTCATCACTTATACATGTTCCTATGACTATGAGATTATGCAACTCCCGTTTACCGGAGGAACACTTTGTGTGCTACCAAACGTCACAACGTAACTGGGTGATTATAATGGTGCTCTACAGGTGTCTCCGAAGGTACTTGTTGGGTTGGCGTGTTTCGAGATTAGGATTTGTCACTCCGATTGTCGGAGAGGTATCTCTGGGCCCACTCAGTAATGCACATCATTATAAGCCTTGCAAGCATTGTAACTAATGAGTTAGTTGCGGGATAATGTATTACGGAACGAGTAAAGAGACTTGCCGGTAACGAGATTGAACTAGGTATTGAGATACCGACGATCGTATCTCGGGCAAGTAACATACCGATGACAAAGGGAACAACGTATGTTGTTATGCAGTTTGACAGATAAAGATCTTCGTAGAATATGTGGGAGCCAATATGAGCATCCAGGTTCAGCTATTGGTTATTGACCGGAGACGTGTCTCGGTCATGTCTACATTGTTCTCGAACCCGTAGGGTCCGCACGCTTAAAGTTCGATGACGGTTATATTATGAGTTTATGTGTTTTGATGTAACGAAGGTAGTTCGGAGTCCCGGATGAGATCGGGGCATGACGAGGAGTCTTGAAATGGTCGAGACGTAAAGATCGATATATTGGACGACTGTATTCGGACATCGGAAAGGTTCCGAGTGATTCGGGTATTTTTCGGAGTACTGGAGAGTTACGGGAATTCGCCGGGGAGTATATGGGCCTTATTGGGCTTTAGGGGAAATAGAGAGGAGAGGCTGGGCGCCCCCCCAAGGCCTAGTCCGAATTGGACTAGGGGAGGGGCTGCGCCCCCTCCTTCCTTCTCTTCTCTCTCCCCTTTCCTTGACTCCTACTCCTACTACTTGGAAGGGGGGGAATCCTACTCCCGGTGGGAGTAGGACTCCTCCTAGGGCGCGCCATAGAGAGGGCCGGCCCTCCCCCTCCTCCACTCCTTTATATACGGGGAGGAGGGCACCCCTTGGAGATACAATAATTGATCGTTTGATCTTTTAGCCGTGTGCGGTGCCCCCCTCCACCATAGTCCACCTCGATAATACTGTAGCGGTGCTTAGGCGAAGCCCTGCGTCGGTAGAACATCATCATCGTCACCACGCCGTCGTGCTGACGAAACTCTCCCTCAACACTCGGCTGGATCGGAGTTCGAGGGACGTCATCGGGCTGAACGTGTGCTGAACTCGGAGGTGCCATGCGTTCGGTACTTGATCGGTCGGATCGTGAAGACGTACGACTACATCAACCGCATTGTGCTAACGCTTCCGCTTCCGGTCTACGAGGGTACGTGGACAACACTCTCCCCTCTCGTTGCTATGCATCACCATGATCTTGCGTGTGCGTAGGAATTTTTTTGAAATTACTATGTTCCCCAACAGTGGTATCAGAGCCAGGTTTTATGCATAGATGTCATATGCACGAGTAGAACACAAGTGAGTTGTGGGCGATATAAGTCATACTGCTTACCAGCATGTCATACTTTGGTTCGGCGGTATTGTTGGATGAAGTGGCCTGGACCGACATTACGCGTACGCTTACGCGAGACTGGTTCTACCGACGTGCTTTGCACACAGGTGGCTGGCGGGTGTCAATTTCTCCAACTTTAGTTGAACCAAGTGTGGCTACGCCCGGTCCTTGCGAAGGTTAAAACAACACCAACTTGACAAACTATCGTTGTGGTTTTGATGCGTAGGTAAGAACGGTTCTTGCTAAGCCCAGTAGCAGCCACGTAAAACTTGCAACAACAAAGTAGAGAACGTCTAACTTGTTTTTGCAGGGCATGTTGTGACGTGATATGGTCAAGACATGATGCTAAATTTTATTGTATGAGATGATCATGTTTTGTAACCGAGTTATCGGCAACTGGCAGGATCCATATGGTTGTCGCTTTATTGTATGCAATGCAATTGCCCTGTAATGCTTTACTTTATCACTAAGCGGTAGCGATAGTCATAGAAGCATAAGAGTGGTGAGACGACAACGATGCTACGATGGAGATCAAGGTGTCGCGCCGGTGACAATGGTGATCATGACGGTGCTTCGGAGATGGAGATCACAAGCACAAGATGATGATGGCCATATCATATCACTTATATTGATTGCATATGATGTTTATCTTTTATGCATCTTATCTTGCTTTGATTGACGGTAGCATTATAAGATGATCTCTCACTAAATTTCAAGATAAAAGTGTTCTCCCTGAGTATGCACTGTTGCCAAAGTTCGTCGTGCCCAGACACCACGTGATGATCGGGTGTGATAAGCTCTACGTCCATCTACTACGGGTGCAAGCCAGTTTTGCACACGCAGAATACTCAGGTTAAACTTGATGAGCCTAGCATATGCAGATATGGCCTCGGAACACTGAGACCGAAAGGTCGAGCGTGAATCATATAGTAGATATGATCAACATAGTGATGTTCACCATTGAAAGCTACTCCATTTCACGTGATGATCGGTTAAGGTTTAGTTGATTTGGATCACGTGATCACTTAGAGGATTAGAGGGATGTCTATCTAAGTGGGAGTTCTTAAGTAATATAATTAATTGAACTTAAATTTATCATGAACTTAGTCCTGGTAGTATTAGCATATCTATGTTGTAGATCAATAGCTCGCGTTGTTGCTTCCCTATGTTTATTTTGATATGTTCCTAGAGAAAAACTATGTTGAAAGATGTTAGTAGCAATGATGCGGATTGTATCCGTGATCTGAGGATTATCCTCATTGCTGCACAGAAGAATTATGTCCTTGATGCACCGCTAGGTGACAGACCTATTGCACGAGAAAATGCAGACGTTATGAACGTTCGGCTAGCTCAATATGATGACTACTTGATAGTTTAGTGCACCATGCTTAATGGCTTAGAATAGGGACTTCAAAGACGTTTTGAACGTCATGGACCATATGAGATGTTCCAGGAGTTGAAGTTAATATTTCAAGAAAATACCCGAGTTGAGAGATATGAATTCTCCAACAAGTTCTATAGCTAAAAGATGGAGGAGAATAGCTCAAGCAGTGAGCATATGCTCAGATTGTCTGGGTACTACAATCGCTTGAATCAAGTGGAAGTTAATCTTCCAGATAAAATAGTGATTGACAGAATTCTCTAGTCACGATCACCAAGTTAGTAGAACTTCGTGATGAACTATAATATGCAAGGGATGACGAAAGTAATTCCCGAGCTCTTCGCGATGTTGAGATCGACGAAGGTAGAAATCAATAAAAGAGCATCAAGTGTTGATGATTAACAAGATCACTAGTTTCAAGAAAAGGGCAAAGGGAAAGAAGGGCAACTTCAAGAAGAACGGCAAGCAAGTTGCTGCTCAAGTGAAGAAGCCCAAGTTTTGACCTAAGCCTGATACTGAGTGCTTCTACTACAAAAAGAACTGGTCACTGGAACAAAAGTATATTTGATATACATGTTATTGATGTGTACTTTACTAGTGTTTATAGCAACCCCTCGGTACTTGATACTGGTTCAGTTGCTAAAGAGTAGTAACTCGAAACGGGAGTTGCATAATGAACAGAAACTAGTTAAGGATGAAGTGACGATGTGTATTGGAAGTGGTTCCAAGATTGATATGATCATCATCGCACACTCCCTATACTTTCGGGATTAGTGCTGAACCTAAATAAGTGTTATTTGGTGTTTTGCGTTGAGCATGAATATGATTTGATCATGTTTATTGCAATACGGTTATTCATTTAAGTTAGAGAATAATTGTTGTTCTGTTTACATGAATAAAACCTTATATGGTTACACACCCAATGAAAATGGTTCGTTGGATCTCGGTCGTAAGTGATACACATATTCATAATATTGAAGCCAAAAGATGCAAAGTTAATAATGATAGTGCAACTTATTTGTGGCACTGCCGTTTAGGTCATATTGGTGTAAAGCGCATGAAGAAACTCCATGCTGATGGGCTTTTGGAATCACTTGATGCTTGCGAACCATGCCTCTTGGGCAAGATGACTAAAACACTGTTCTCCGGAACAATAAAGCGAGCAACAGATTTGTTGGAAATCATACATACTAATGTATGTGGTTCGATGAATATTGAGGCTCGTGACAGGTATCGTTATTTTCTGACCTTCACAGATGATTTGAGCAGATATGGGTATATCTTCTTGATGGAACATAAAGTCTGAAACATTTGAAAAGTTCATATAATTTCAGAGTGAAGTGGAAAATCATCGTAACAAGAAAATAAAGTTTCTATGATCTGATCGTGGAGGAGAATATTAGAGTTACGAGTTTGGTCTTCATTTCAAACAATGCAGAATAGTTTTGCAACTCACGCCACCTGGAACACCACAGCGTAATGGTGTGTCCGGACGTCATAACCATACTTTATTAGATATGGTGCGATCTATGATGTTTCTTACCGATTTACCACTATAGTTTTGGGGTTATGCATTAGAGACAGCTGCATTCACGTTAAATGGGGCACCATCGAAATCCGTTGAGACGACACCTTATGAACTGTGGTTTGGCAAGAAACCCAAGTTGTCGTTTCTTAAAGTTTGGGGTTGCGATGCTTATGTGAAAAAGTTTCATCCTGATAAGCTCAAACCCAAATCGGAGAAATGTGTCTTCATAGGATACCCAAAGGAGACAGTTGGGTACACCTTCTATCACAGATCCGAAGGCAAGATATTTGTTGCTAAGAATGGATCCTTTCTAGAGAAGGAGTTTCTCTCGAAAGAAGTGAGTGGGAGGAAAGTAGAACTTGATGAGGGAACTGTACCTGCTCCCTTATTGGAAAGTAGTTCATCACAGAAATCTGTTCTTGTGACTCATACACCAATTAGTGAGGAAGCTAATGATGATGATCATGTAACTACAGATCAAGTTACTACCCAACCTCGTAGGTCAACCAGAGTGAGATCAACACCAGAGTGGTATGGTAATCTTATTCTGGAGGTCATGTTACTTGACCATGACGAACCTACGAACTATGAGGAAGCGATGATGAGCCCAGATTCCGTGAAATGGTTTGAGGCCATGAAATCTGAGATGGGATCCATGTATGAGAACAAATTATGGACTTTGATTGACTTGCCCAATGATCGGCGAGCCATTGAGATTAAATGGATCTTCAAGAGGAAGACGAACGCTGATAGTAGTGTTACTATCTACAAAGCTAGAATTGTCGCAAAAGGTTTTCGACAAGTTCAAGGTGTTGACTACGATGAGAGTTTCTCACTCGTATCTATGCTTAAGTCTGTCCGAATCATGTTAGCAATTGCCGCATTTTATGAAATCTGGCAAATGGATAAACAAAACTGCATTCCTTAATGGATTTATTAAAGAAGAGTTGTATATGATGCAACCAGAAGGTTTTGTCGATCCAAAAGGAGCTAACAAAGTGTGCAAGCTCCAGCGATCCATTTATGGACTGGTGCAAGCATCTCGGAGTTGGAATATACGCTTTGATGAGTTGATCAAAGCATATAGTTTTATACAGACTTGCGGTGAAGCCTGTATTTACAGGAAAGTGAGTGGGAGTACTACAACATTTCTGATAAGTATATGTGAATGACATATTGTTGATCGGAAATAATGTAGAATTATTCTGCAAAGCATAAAGGAGTGTTTGAAAGGAGTTTTTCAAAGAAAGACCTCGGTGAAGCTGCTTACATATTGAGCATCAAGATCTATAGAGATAGATCAAAATGCTTGATAAGTTTTTTCAATGAGTACATACCTTGACAAGATTTTGAAGTAGTTCAAAATGGAACAGTCAAAGAAAGAGTTCTTGCCTGTGTTACAAGGTGTGAAATTGAGTAAGACTCAAAGCCCGACCACGGCAGAAGATAGAAAGAGAATGAAAGTCATTCCCTATGCCTCAGCCATAGGTTCTATAAAGTATGCCATGCTATGTACCAGATCCATTGTATACCCTACACTGATTTTGGCAAGGGAGTACAATAGTGATCTAGGAGTAGATCACTGGACAGCGGTCAAAATTATCCTTAGTGGAATAAAGATATGTTTCTCGATTATGGAGGTGACAAAAGGTTCGTCGTAAAGGGTTACGTCGATACAAGTTTTGGCACTGATCCAAATGACTCTATGTCTTGATCTGGATACATATTGAAAGTGGGAGCAATTAGCTAAAATAGCTTCGTGCAGAGCATTGTAGACATAGAAATTTGCAAAATACATACGGATCTGAATATGGCAGACCCGTTGACTAAACTTCTCTCACAAGCAAAACATGATCACACCTTAGTACTCTTTGGGTGTTAATCACATAGCGATGTGAACTAGATTATTGACTCTAGTAAACCCTTTGGGTGTTGGTCACATGACGATGTGAACTATGGGTGTTAATCACATGGTGATGTGAACTATTGATGTTAAATCACATGGCGATGTGATCTAGATTATTGACTCTAGTGCAAGTGGGAGACTGAAGGAAATATGCCCTAGAGGCAATAATAAAGTTACTATTTATTTCCTTATTTCATGATAAATGTTTATTATTCATGCTAGAATTGTATTAACCGGAAACATGATACATGTGTGAATACATAGACAAACAGAGTGTCACTAGTATGCCTCTACTTGACTAGCTCGTTGATCAAAGATGGTTATGTTTCCTAGCCATAGACATGAGTTGTCATTTGATCAACGGGATCACATCATTAGGAGAATGATGTGATTGACTTGACCCATTCCGTTAGCTTAGCACACGATCATTTAGTATTCTGCTATTGCTTTCTTCATCACTTATACATGTTCCTATGACTATGAGATTATGCAACTCCCGTTTACCGGAGGAACACTTTGTGTGCTACCAAACGTCACAACGTAACTGGGTGATTATAATGGTGCTCTACAGGTGTCTCCGAAGGTACTTGTTGGGTTGGCGTGTTTCGAGATTAGGATTTGTCACTCCGATTGTCGGAGAGGTATCTCTGGGCCCACTCAGTAATGCACATCATTATAAGCCTTGCAAGCATTGTAACTAATGAGTTAGTTGTGGGATGATGTATTATGGAACGAGTAAAGAGACTTGCCGGTAACGAGATTGAACTAGGTATTGAGATACCGACGATCGAATCTCGGGCAAGTAACATACCGATGACAAAGGGAACAACGTATGTTGTTATGCGGTTTGACCGATAAAGATCTTCGTAGAATATGTGGGAGCCAATATGAGCATCCAGGTTCCGCTATTGGTTATTGACCGGAGACGTGTCTCGGTCATGTCTACATTGTTCTCGAACCCGTAGGGTCCGCACGCTTAAAGTTCGATGACGGTTATATTATGAGTTTATGTGTTTTGATGTACCTAATGTAGTTCGGAGTCCCGGATGAGATCGAGGACATGACGAGGAGTCTCGAAATGGTCGAGACGTAAAGATCGATATATTGGACGACTATATTCGGACATCGGAAAGGTTCCGAGTGATTCGGGTATTTTTCGAAGTACCAGGGAGTTACGGGAATTCGTCGGGGAGTATATGGGCCTTATTGGGCTTTAGGGGAAAGAGAGAGGAGAGGCTGGGCGCCCCCCAAGGCCTAGTCCGAATTGGACTAGGGGGAGGGGCTGCGCCCCCTCCTTCCTTCTCTTCTATCTCCCCTTTCCTTGACTCCTACTCCTACTACTTGGAAGGGGGGAATCCTACTCCCGGTGGGAGTAGGACTCCTCCTAGGGCGCGCCATAGAGAGGGCCGGCCCTCCCCCTCCTCCACTCCTTTATATATGGGGAGGGGGGGCACCCCTTGGAGATACAGCAATTGATCGTTTGATCTTTTAGCCATGTGCGGTGCCCCCCTCCACCATAGTCCACCTCGATAATACTGTAGCGGTGCTTAGGCGAAGCCCTGCGTCGGTAGAACATCATCATCGTCACCACGCCGTCGTGCTGACGAAACTCTCCCTCGACACTCGGCTGGATCGGAGTTCGAGGGACGTCATCGGGCTGAACGTGTGCTGAACTCTGAGGTGCCGTGCGTTCAGTACTTGATCGGTCGAATCGTGAAGACGTACGACTACATCAACCGCGTTGTGCTAACGCTTCCGCTTCCGGTCTACGAGGGTACGTGGACAACACTCTCCCCTCTCGTTGCTATGCATCACCATGATCTTGCGTGTGCGTAGGAATTTTTTTGAAATTACTACGTTCCCCAACACCACCGACACGCCGGGCCCGCTATTTCGTCTGCTATTTGACGCATTGGGCGTTTTTAGCCTGTTTTACCTATTGGGCCATATAGAGATGTATAGAAAAAAAAACCGTAATCGATCCGTGCCGTGCCAGCCCGTGTGCTCAGGCTACCAGCCCAAGCACGGTCCAGGGCGTGCCGCATGCCGGGCCCGTTCCGTGCCTGGCACATGGCGGGTCGTGCCGGCATGCTCAGGGACCGGCCTGGTTAATTAGCCCGGCCCATTTGGGCAACTATAGTGTGTGTGTGATCACTGCATTTATATGTTTGGCCAAATAGTTGTCTATTTTTCGTAGAAGAGTTTCTGAATACACTTTATGTGTGTGTAATTTGTTTTTTTTAAAACGTGTGTGTAATTTGTTGGCATCTAGAAAGTACTAGAGGAAGTTGCTACGACCGTGTTGGCAGAAGCTGCAGCCAGCCATGGTGGAGCTAACCGGCTTCGACTCGTGTCACGACTGGCGGTGGCAAAAGCTACAACTGGCGTCGTCTCGTGCTATGACTTTTGGCGGCGGAAGCTACAACCGGCCACATTGACCGACATAGGTTTTTTGCTGGAACTAACGGTGGCAAAGCTGCAACCAGCGACGTCACTTGCTGGAACTGGCAACATTGAGTGTTGGCACTGGGTACGGCCATTTGCTAGAACCAGCCACATAGATTGTTGGGACCGAAAGGACGAAGCAAGCGGAGCAGATCCGACGGTTCACATTAGTCGCATCCTACGGCGCGGATTGCGACCGATCGAGGCTGGCGCCGATCGACCGGCGCCTGGCAATGGCCTAAACCAAAACGCACGTGCTTCTCGCAGTGGGGAGGTGGGGAAATGGCGTCGGTGAACAGTTGACCACTCGATCTATCCTCCTCACTTTTCCTATTTCCACTCCACCACGCGGTTCGGGCGCGCTCCAACTCCCAGCTCCATAAACTCCAGATCCATAGGAGTCGGCGCGCTGCAGCTCGTCCGCCGGCGGCAGCCCTCCCCACCGCCGCGGCCTGCCTTGCCCCGCCTTGAGTCGCCTTTCACCGCCGGGCTCCCCCCTTGTCTGCCTCCGGGCCCCTCCTTTTCTGCCGCCGTCGTCGACCATCTCCGCCGCCGTCCCCGACCACCGGACTCCCTCCTTGTCTGCCGCCGTCTTCCCCGACCACCGGACCACGCAGGCTGTGCGCCTCCTCTGCCTCCCCGACCACCTCGCATATCAACTGAATCACAGTAGGTGAGTGAAAAAAATTGCATTTTTCTTTGATTGGTACTAGTATTTTGCTGCGATGTGCTACGGTGGTGTGCTGCTGCTAGACTTGTGGATGGTCTGTAGGACTGATGATGTGCTAGGATGCTCATTTGGGGTTTGGGCGCTGGGGATTTGGGGTTTCGAGTATCAGATCTCTGGGCGATCTGGTCCGGCACTGGTGGTTGGTGGCGAATGCCGCCGGTTTTCGGTTAAGATCTCGCGAGCTTGGTGAACCCTTCGGATTTTTAGATTCACATCTGTGTGAAAGGTGCAAAATTTGCGGACCGAGATCTGATCCTGCTTACTCAAATCTCCTGGATCAGTGCAAATGTGTGGGCATTGTGTGTTCCGTTGGGAACCACATGATTACTTGATTTATTGGGACCAGGGGTTTAGTTTGTTCTTACTTGCAGTTGAGTTGTGCGTCAAAGCTTGGTCTCGTCATGCCTGAGGAAAACACTTAGCATTACGATTTGGTACATGGATATGTGTAAGATCAATCTCAATCCGTATACAATACAGGTCTCTATGGGCATGTTCATCTAGATTAGCATCTTTACTTCATAAACGGCGCAAAAATTCTGAGTATCTTGGAATGCTTTCTTTCCTTTTCTGGGAATGTGAAGGTTGTGACTGTGTAAACTGTGGGTCCTACAAATTGCAGTTTGCATTTAAAGAATAGTTGATGATAGTGTAGGATTCTAAATCTTTTTCTCACATTGCATAATGGTAAATGTAATATGCATGCCTTGATTCATCTAAGATCTAACTGAGCGGTGTTGGTTTTTCCATCTCCATTGAGCAGGTCGCTTGAGTTAATGTGCACCATATAGTGCTTTGTCTCTGTTAAATTGCTTATGAGATCAGTAAACTGCTATGGATATATGAAGCACAGCTGAAGAAGCCCATAGTGTTTCATACCAGTGAATGATCAATATTTTGTCTGTTTCAGATCTTAGTACCACTAGAGATGCAAGGAAGAATGACAGATTTATGGTAAACCCTGGTAAATATTCGTGGGAGGTCAACAAGTGGCGCCCTGATTAAGACTGCTACAACACTTTGTGGTTCATCTCTAATTAGTGATGGCGAGAATGAAGATCCCAAAGCGTTATGTCATAGTATTGCTGACATTCATCTGCACAAATGTTTGTTACGTTGAGCGTGTGGGTTTCTCGATTGCGTACACCGTAGCAGCTGATGCAATCAACGTGAATCAAGCAAACAAGGGCCTGATACTCTCCATGTTCTATTATGGTTATGTTTTGTCGCAAATTCCTGGTGGATGGGCAGCTCAGAGATTGGGAGGCAGACGTGTTCTGCTACTGTCATTCCTGTTGTGGTCTTTGATATGCGGTCTAATTCCACTGGACCCCAACAGAGCAGTCATTCTGGTCCTTTCTCGCCTTTTTGTCGGTGTAGCACAAGGTTTCATATTTCCTGCCATTCACACAGTCCTGGCACAATGGGTGCCACCGCAGGAGCGCTCTCGCTCAGTGTCATTAACAACCTCAGGGATGTACCTCGGGGCAGCTTGTGGCATGTTGTTTTTTCCAAGTCTGGTGAAGCACATGGGACCCCAATCTGTATGTTTAGTCGAAGCAGTACTTGGAGTAGCATGGTCTGTAATATGGTTGAAGTTCTCCAGTGAGCCACCTCGCACTGACCTTCCAAAAGTGGCAATGCCAAAAGTAGCATCTCGGGAGAAGATTAAGGCGCAATCAGTAGGGGTTGTTGCACCTCGCACTGTAAAGATACCATGGCGAAAGATTATCTTCAGTCTACCTGTTTGGGCAATTGTCGTGAACAACTTCACCTTCCACTATGCCTTGTATGTTATCATGAACTGGCTGCCTACCTATTTCGAACTAGCCCTTAAGCTTAGCCTCCAGGATATGGGATCGTCAAAGATGCTTCCCTATTTCAACATGTTTATATTCTCCAACATTGGTGGAGTGGTTGCTGATCACTTGATTACAAAAAGGATCTTATCAGTTACCAAGACAAGGAAGCTCCTTAACACCATTGGGTTTGTTGTCTCGGCTGTTGCACTCATGGCCCTCCCTTCATTCGGGACGCCCTCAGGGACTGTGATCTGTTCATCGGTGTCTCTTGGCTTTCTGGCTCTAGGAAGAGCAGGGTTTGCCGTGAATCACATGGATGTTGCTCCAAAGTTCGCCGGCATAGTGATGGGGGTTTCCAATACAGCTGGGACATTGGCTGGGATAGTTGGCGTTGGCCTCACGGGAAATATTCTGGAGGCTGCAAAGGCTTCTAACATGGATCTAACGAACTCCGAAACCTGGAAAACAGTCTTCTTTGTTCCAGCATACCTCTGTATTTTTAGTTCAGTCATTTTCTTGGTCTTCTCAACTGGTGAGAAGATTTTTGAATAGAGGATGATTATTTTTGCCTGTTCTTTTCTTGTCATTTACGGGCGGCGAGGCAGGATAGAAACACGGGAATCTCACATGTATTTTATTCATTATACCTGTCAGATTTCAGAGCTCAGACTGCATCCCACACATATTAAGACTTATGTTATGTTAGGAGGAATAACACTTGTCCGTAGTAAATTGTGTTATTTGGAATGATCCTATGACTCTGTTATTCCAGCTGGCTGGTTGGCCTATTTACAATACGTTGTGTAAGCTGGGCATACATCATCTTTGTTTTGTAAGTCATTTTCCTGGGGATAGGAAACAATGTGAATTGTGCAGCAAGAAGTCAGGATGACATGACAACATTTTGTTTGCTGGCAGGATCTGAAAAGAAAATGTGATTGGTCTACATTTGATCTAAATGAAATTTCTATTTAAAGGTAAATCTGACTGGAACATGGACGCTCCCTTTGGCTGTGTAGAGGCGCATTTTTATGTTTGATAAACCTGCTGGAAGATGTTTATTTCACTGTAAGTGAGCAGTAGAACCTGAAAAACCTGTGCCCACACATCCCTAGCAAGCTCCATTCCTTTACATTCACATGTTAGTTCAACTATATTGGGTAAAGTTGAGGGCCTCTTTGATTCATAAGGTTTCAAAAACACATTGATGTGCATAATTGGGTGTTTAATTCACAAGAATAGGACAAGTACAGGAAGCCTAAAATATTATGGTCAAATTAAGATTTAACCATATGCAAAGGTAAGATGAAGATATTATTATATGCTACTTAAGGCCTTTGCCTTGTTCTTCATGCATATGAATGTGAAAGAGAAATTTCAATGCTTTGAATCAAATGGATAAAATAGTAGGAAAAATCTTATTGATATGGTTTTCTTATGAATCACAGACACCATCAATGTAAAGTCTTGAGAAAACTACGCTTTGCAACCAGTAGTCATTACATATACCGCTGTCCATTGTGTCCTCTCGTGGAAAGTAGTAATCTAAACGCTTTTATATTAGTTTACGGAGGGAGTATTATTTTTGAACAAGAGCAGCAGGGCGGGATGGTGATCCTACCAGCTTACAATACAAGATACATTAACAAACAAACAAAAGGAATATAAAAAACAGAAATCTTGTCCACGCGTCGGCAAAGCAGAGACAATAGATTCATGGCCCTGTTTTCCCCAGTCATCTCGCACAGTTCAAGGTTAGAGTATATGCTTGTGGACTTTTATATAGAATATGAGAATGGGGAACTATCATTGAAAATCTTTTGTCAAGCCATCAAACGGGTGACAAGTGAAGTGTTTGGCTATTTTTGTGATTGTAAATGTTTATAGGGAAAAATATTTTTTGCCAGGTTTTTCATCTAAATATTCGATTATGAGCACTACTTTTTTTTCCGTTGCAGCTCAAATTTTTTTCCTATGAAAATTTTCATATCTATTTTTCTGTATCTTTCGATAACAGAAATTAATTTTCTATGGGAGTATGTCGCTCGGAGACATTTGGCAGTCTTCCTATTCTGAATTTCTTCCAGTAGCGTAGAGTTCAGACACGACTTGCTCTCTTATACTTTTCAAACTTCTGGCACTAACCTAGTTGCTGATGGCATTACCACTTGAGATATTTCCACCCCCAAAAGTACTGCTGCGAGCGCTGCCTTCAAGTTTCGGTTAGTCCAAAGCGTTTCAAGATGCCTCCCATTCCTAATGAACTACAGACGCACTTCCACTAACTTCTTCTATTTGCCATTCCTCTCACCCTCTCTCGAGGCTCTCAACTCAATTCTTGTTAACTAGGAGCTACTTGCTTCATAAGAAGAGCTAATATATGAGGTGGGAGGAAGACTACGGTCAAAAAATGGGTATGCAAGTATTGAGCAGGAGAAGGCAATGCATCCTTATATAAAGGCACGTGCCATAGGCCGAGAGTGTTCACCTCTTTTCTGAAAAAAGTATAGGAAGACACATGTACAAGAAAATAAAGTTGATACCTATGTGTGTTGCTTCAACTTTATAATGCGACCACAAGCACCTTACATAGTAGTATTGCTAGAATCCTAAAAAAAAATAGTATAGCTAGAAAAATACTCACTTCATTTCTTTATGTAAGGTGTATTATTTTTGGCACGGTGATCATGGCATAAAATTAGACAATTTCAGACAAAACTACCCTTGACAAATCATTGGTTAGTGGCAAGTAAATCAATTAGTCCAGGAAATAAAGAGGTATACACAATCAAGAGACAGATATTTTCCTTCTTTTCCTAGAAGGAGATATACATGCAATCATAAGAGAGATACTTTCCTATTTTCTGGAGGGCTAAGAACGGAATAAGGAGGAATTAGAACAAATGCACCTTAATTGTGAAATTTTATCAAAAAACAAATACAACTTTTTTTGATCGGTAACAAATACACCTTATATTAAGAAACAGAAGGAGTATATAACAATAGTAAAAGAAACAGGCCCAGCCCATTAAGAGAGGCAAGTCACGAACGAACGTGATCTCCTTTCTTTCGTTCTCTCCGATAACGCCGCTGCAATCTCATTCGTCTCCCAGTCTCTCCATATTTCTCTCCCCCAATTGATTGCCCCGAATTCCTAAGAGACTCCAACTCCCCAAGCTAATCAATTAATTTGTGTCACTGTCCCCATGGATTTCTTGGGTGTCTTTCATCATATAACTAACCCCAAAGCCATTAGTGGGCCGGAGAAGAGAAGCCGACGAGGACGCCAACCCGCGGCGTGGCCGTCCATCGTCAAGGCTCTGCCAGGGTCCGAGCCTCCGAGGGTAGTAGGCGGTGGAGTATTATGCTATATGACGAATTGATGCAATGATATTTGACCGGCTTGATCTTTTCTTTTACGTCAGTACAATGAGGTAGGTTCTGCTGTTTATGACATTGCTTGCATTTGGATTATTGGATAGCTGGAGCATGGGATTTCTTCCAATGTACTCCAAAATGAGTAAATTAACTGTTGGCCTAACTTATTACAAGTACCAGAGGAGTCTCGGGCAGAATAAAAGCTTTCATTACATTGGCCCAACTTGTTACAAGTACAAATGTTTACATTTGTTTTGTTGATTCTCATCTACCTCATGTGTTTTGCTCAAAGAAGTTTTTTTAACCCATGTGTCATATAATTTTACACGGAAACTCACGGATATTTTTATTGTTGTATCTCTTTTTTCCTTTCGATAAACTTTCAAATTCCAAAAAAAATCAAAATTTAAAAAACGTTTCATTTGAAAATATTTTCTCAAATTAAAAAATGCTTGTGGTTTTCAAAAATATAAAATTTGAAAATATATTCACAAACTAAAAAAATCGCTTTTAAAAATATGTTCAAAATTTAGAAACAATTTGAATTTAAAAAATGCTCATGTTCTCCTAATATTTTGCATTTTCAAAAAATATTATTTTTTTTCTAATTTTTTATCGCTTTTGTAAAATGTTCGCAAATTGTAAAAAAACTTTCACGTTTTCAAAGTAATGTCGTCCAATTTGAAAAGATTGTTCGTGTTTGCCAAAAAAGTGTAAAATTTGAAACACAATTCACGTTTACAAAAATGTTCATTTGAAAAATTCTCTCGTTTTCAAAATTTTACATTTTTGCAAAATGTGCAGAAATTTTAAATAATTGTTTCCGTTTTTGCAAAAAAAATATTCTAAAAAATTTCAATTTATATGCTGCAGTAGTCTCGTTGGTTACAGAATCCAGTTTCCTACAGGTCGGGTTGCTATAGTATCGGGTTGCTATAAGAAACTGGTGCGCTATATAAAACCCGACCCGCTACAATGTGTCTAAAGAAAATACCAAGAAGCCCCTTGAAGAAATTGGGGTCGCTACATGTTTTTTTTTTTTTGAGAATTGGGGTCACTACACGTGAGCGCGCCTCCGTGCGAGTGGGCTGGCCCAGGCGGGGCAGAGGGCACCTGTTTTGCACTGGCATTCATGTTTTTTTTTTTTGCTTGTGATTGTGCTCAAAAGGAACTGTGCTAATTTCATGGTATTTCACAACAAATCGAGTTACAATTTGCGTTTTCCCATCCTGTTTGATTTGATCTCACAAGGTCTTATGGCCTTAACCTTCACATATGTCCAGCATGTGCTGGTGAACTGGTGATAGGAAGCAACCGAGGCCTCCATTGCAACGGCAAGTGGAGGGACGTATTTCCGGATGCTTCCCATTTCCAACGCATCTGACCCCTCCTGTTATCATGTCATTCCCGTTTATCACTTTCTTCTTTCCATGTCTTAATCTCATTTGTGTCGATTTGGCGGCTTCAAATTGAGAAGCAGAGCTTGCTAAGATGGGTAGTAGGCTAAAGGAAAAGGAGTGCCCATCAATTGGATATATACTCAGCTGGGTTTGGAAGTATGAAGAGGAGCCATATACTTTATATATATGTGTAAATGGTGTGGGCCCGTGTAAAGATCGTCATAGTTTCTAGTTAAATATCTCCTGTGTACTACAACTCATCAATGATCTCTTGCTCTAGTAAAGTAGAGGATAGGTATCTCAGTGGCATTAGTGATATCTCAACTCATCAATTGTTTCTTGTTTCCATCTCCATGAACGTAGCAAGAAACCAGTTTCAAAAAAAGAAGTACCAATAAACCTACAGACACTTGCAGAGTTCTTTTTCTCACTACTCTGCTATTGAGGAGTAAATAGCAAAAAGCTACCACATTATAGGCTAGGGTTACAAAAAACTACCTCTTTTCTTAATTTCCCAAAATGCTAGCACAAATTTGGTTCGCTGTTCCAAAAAACACTAGTGAGTAAAGCGTTAACTTTTAACTGCGGTTATGACAACTTTGGCCCACCCGTCAGGTCTGATGTGGCATAAAACTCAACACCGTTAGCTTTGGCCGTTATGACAGGTGGAACCCACATGTCATTCACTTCCAAAAAAATAAAAAGCAATCGGGACCCTATACCTTTCTAGAAAAGCAATCGGATCACTGTAAATGTCTAAAAAAGCAATCAAGTCCCTGTAACTTTCTAGAAAAAAGCAATCGGGTCCTGTGAAAAAAATTAATCGGGTCCTGTGAAAAAATTAATCGGGTCCTGCTTGGCTGCCGGCGAGCTCATCCCTGCTTCGGCTGCCGCGGCCTAGGGTCGCCGCGCGCGCTGATCCTGGCTGCGCACCTTCCACTCGCCAGTGAGGAGAGCCAGAGAAGTGATGGGATGGCGAGGGAGCTCCAGCTCTCCCTTCATTGGCCTCCGCCGCCACTCCCGTGTATGTCCCTTCCCGCGCGCTTGACCGGGAGAGTCCCTCTTCTCCGGCACTGGTGACGCCAGCCCGGCCCGCTCACCCTCGCTTCCACGCTCCCCCCTTCCGATACCGACGCAGCAGTGAGTAGCAGCATGCAACGGCAGCGGCATGCAGCATCGGAGAATTGCGGCGGCGGCGGTGGAGAGCAGCAGCAACAACAACACACAGCAGCAGCGGTAGCTTCTGCCCATGGCGTTGGGGCTACGGGAGAGAGACAGAGCAAGGCGCATAGGGTGGGTGTCGTGATATAGAGAAGAGAAGAGAAGGGAGAGAAGAAGCTGACATGTGGGCCCCACCCGATCATAACCGTCAACTTAACTGTTTGTTTATATAACGGTGCTGACTTTTTTGCCACGTGGAACTGACGAGCGGGCCCTCCATGTCATAAACCAGATTAAACCATTCAGTCACTAGTGTTTTTGGAACAACAAACCAAATTTGTGGTAGCATTTTGGGAAGTTAAGAAAAATGTTAGTTTTTCGTAACCCTATCCCATAATGTGGTAGTTTTCTGCTATCTACTCTTTGTTTAAAAGGGGAAGTTAAGAAGTTGGCATCCATGTAATATATTTTTTGAAAAGGGAAATATATTAATATCACGAAGATGCCAATTTCTCTGTTTAAAATTTGCTCTAAAAGCCAAATCAAAATACACACATATTGTTTGAATGGATTATAATTTCCTCGTGGGCGCTGGAGCTCCACTCAGATCTACCCACACTCAGTCATACGAAGCCAAGGTCGGAATGCTGCGCCGTTGTAGGATCACAGCAATCACACATGCTAAGGTTGATCCTGTGTGTTGGTCCGGCTCTAGTTGATCCTCTGTGTCGCCATCCAAACTCGGGAAGGTCAAGTGCCCACTGCCACCATCACAACTCACATCATTGAGCGCCTACACTCGTCCAAGTACAAACATCATTGAGCGCCCAGTCAGACGAAGCCAAGGTCGGAATACTGCTCCATTTATAGGATCTGTCAGACCAGAGCCCTCCATCTCCTTCGCCATGGTCGCTCACTCGATCACAGTTGTAGCGCACGCTAAGGTTGACCCTACATGTTGCTCCAGCTCCAGTTGACCCCCTGTGTTGCCATCCAAACCCGGGACAGTGATGCACCCTCTGCTACCAGCATAAGCGACCGATCACCATTCACCCATCCCCACAATGCCGACGTCCCCTCCCACTAAACCCTCTCATGGCAACCCCAACACAAGCACCAAGAAGAATTAGTTCTCAGAGTTCGGTGAAGATGGCGAGCAGTATAGGGGAATAGGGCATAGCGCTAAATCACTCTTTGCATTGTTTGTCGTAGGTGTGAATTATAGCATGACTGATTGTCTTTCTTCCTGTTCATGTAGCTGGTCATTGGTACTTATCTTTACCATGAGTGGTAGTCTGTTATCTTGTTCTACAATTTGGCGTTTGCCAACTTGGTATACTGATCGTTGTAGCATTGCACTCTGCTTATCTTTAGTGAAATACGTGCACTGTGTGTTCTCGAAATCAGCATTGTACTCTGCTTCTCCTGGATTAAATATGTGTTCTTGGAAGAAACACCGGACTACTTTAAGTATTGCAATATATTTTATCAACAAGGTAAATAGGTTGCATGAAAAAAATTCAGTCAGTAGCCAAATTTAGTAAATCAAATATCGAGGAGGTAATTTTCTTTCAATTGGTTTTGGATGAAGATCTATTTCAGATTAAGTACTACTCATCTTATTAACTTGTAGTTCATGATTTTTTAATTGTATTCATAGATGTTGAATATTTTTTTTCAATAATACAGGAGATAACGTGAGTCTTCATTAAAAGCTGCATGATTAGTAACTCCCAGTATAGGAACATCTTCCCAATTTGGGCACTCGCAGAGTACCGGCACCGAGTCTTGGCTGGTGGCAGCTAGTACTTATGTGTTTAGGGGCAATGAATTTGTGCAGTCTGTAGGAATCTGCAGATCATTTATTTATTTATGTATGTTCATTGTTGATGAATATATAACCCAATATGTAAAACATATAATTTTGTGAGGGGTTCCGATCTCTTTAAAACATAAATCAATGCAATTCTAGATGGACAGATAGTAGAGTTCATCAGTTTATGTCATTGATAAGAGCGACTTTTTCAGAGAGCTGTAGTAATTTTCTGTAGATATATTTCCACCAAAGGGCAAATTAGGTTAATGCCGAAAATCAAATCAATTCTTTGGATGGAAATTTCAGTATATCGAAATGTGGGCTTGCAGCAATGGTACCGTCCTATGCACAATCCAGATCAAAGCAGCGCATTGTCCCCTTTGCTGAGCTCGCGGCCACCCCTAGTTGTGCCCAACCTGCACCCGCGAGATGAAAGCCGAGTTCCCTCTAGTCTTTAACCTTCACATCCTAGTCATTGCATATTCTGCATGTGGTGGAGAAAGGCAGCAATCGACGCCTCCGTTGCAACAGCAAGTGGAGGGACGTTTTTCCGGATGCCTCACATTTCCAGCACATTGCACACCCATCTAACCCCTCCTATTGTCATGTCATTCCCATTTATCACTTTCTTCTTTCCATGTCTAAGTCTCATTTGTGTCGGTTTGGCGGCCTCAAATTGAGAAGCAGAGCTAGCTAAGATGGGTAGTAGGCTAAAGGAAAAGGAGTTCCCATATACTTTATATATATGTGTAAATGGTGTGGGCCCGAGTAAAGATCGTCATAGTTTCTAGTAAAAAAGAAAATATCTCCTGTGAACTACAACTGATCAATGATCTCAGTGGCAGCAGTGATATCTCAACTCATCAATTGTTTCTTGTTTCCATCTCCATGAACGTAGCAATAGACCTCAAACGAAAAAAAAA
>URS0000F1BCF3 rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGATTCATTGGGCGTAAAGGGTGCGTAGGCGGCGCGGTAAGTCGGGTGTGAAATCTTGGAGCTTAACTCCGAAACTGCATTCGATACTGCGGTGCTTTGAGGACTGGAGAAGGAGACTGGAATTCATGGTGTAGCAGTGAAATGCGTAGAGATCATGAGGAAGACCAGTGGCGAAGGCGGGTCTCTGGACAGTTC
>URS0000D17570 sRNA from 1 species 
TCCCAGCCGGGTTCGTGTCGCCATGGGGCAGATCGAGTGGGCCATGTGGGCCAACGAGCAGGCGCTGGCGTCCGGCCTGATCCTCATCACCGGGGGCATCGTGGCCACAGCTGGGCGCTTCACCCAGTGGTACTTTGGTGCCTACTCCATTGTGGCGGGCGTGTTTGTGTGCCTGCTGGAGTACCCCCGGGGGAAGAGGAAGAAGGGCTCCACCATGGAGCGCTGGGGACAGAAGTACATGACCGCCGTGGTGAAGCTGTTCGGGCCCTTTACCAGGAATTACTACGTTCGGGCCGTCCTGCATCTCCTGTGAGTCCCCGCCCTGCACCCCCTCTAGGGCTCAGGAGGGCTTGGAGCCGACCCTCCCCACTGTCCCACCGGCCGGGCTGCCTGGACAGGAGCCACCCCCACTTACCTCAGTGTTTTTCCAAACAAAAATTCGGGTCCCTGGCTCTGGCAGGGCCTGTGTCTGCTGTCTAGTGTGCAGGATTTGTAAGGATCCACTCCAAATCCGAGTAGCTCCGATCCGTCGCCACGGTCTGGGGTCAGCAGGCACTGCTGGGGGGTCTTGCCTGGGCTTCCTGGTAGGGTGGAGGGTTCCGTGCTGTGTGTCTGGTGGTTACTGCCGGCTGAGGCCAGGAGACCCACACGTGGCTGGTTCCTCCGAGCAAGTGCCCCAGAGCCACTAGTGTCCACATCAAGGCCGAGAACACCCAGGACCGAAACAAGCCCTGGTCCGCGCACGTCCCCTGGGTGTTCCTTGTGCTGAGACTTTGCAGCCCTGGGCCATGCACGTCCCCTTGGTCTGCAGTCTGCCTTGTCCTGAGACTTTGTGGCCTTGGCCCCCAGACCTGGGGCTCCGTTCCCCTTTCTGAGTGCCCTTCTGTGTCCCTGCCTCTCACCCGCTGTCCCCCAGGCTCTCGGTGCCCGCCGGCTTCCTGCTGGCCACCATCCTTGGGACCGCCTGCCTGGCCATTGCGAGCGGCATCTACCTGCTGGCAGCTGTGCGTGGCGAGCAGTGGACGCCCATCGAGCCCAAGCCCCGGGAGCGGCCGC
>URS00003EB83F lncRNA from 1 species 
CAGATTTAGGGCAAAGTTAACACTTCAAAAATATCTCCAGTAATTGAGTAAATTGCTCATCTGTCAAATTGGCTCTTTGGCAAATTACTCTGCTTGCACATATTAATAGCCAAGCTTAGCCAACTTGAAATATGGAGATTTACTGGAAATCACAGTGAAGTGAAGAGAGAGGCAAGAGCAGAATTGAAATTCCCACCTGGCAGCAAAAGAGAGTTATGCAGAGCCTATCAGGACCCGTGTTCACACCAGCACTTAGTTTGGAGGAAGCACCTGGAGGAGATGCAGAGTCCAGATGTGCGCCCTCTGCCGGAAGCCTACTGCACCAGGACGTAGGCCTGGAGTGGCCCTTAACGCATTTGGAAATCAGTCTTCACTAAAAAAACTTCCTCCAAAATGTTCTTTAACAGCCCTTTAAAAGCCATTGTTTCAAAACAGTCCAAGGTGGTGAACAATTAATATTTTCGATTTACATGAAGACTCTGGAGTAGGAATTACCTGAGTTGGAAACTCAGTTCTACTCTATTGGTATCAGGTTGCATTCTGTATCATCATTAAAATTTTCAGAAAAACTCTC
>URS000039DFEA rRNA from 1 species 
GAATCTAGCTTCAGGTCTGGGACAACCACTGGAAACGGTGGCTAATACCGGATGTGCCGAAAGGTGAAAGATTAATCGCCTGAAGATGAGCTCGCGTCTGATTAGCTAGTAGGTGGGGTAAGAGCCTACCTAGGCGACGATCAGTAACTGGTCTGAGAGGATGACCAGTCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTCCGCAATGGGCGAAAGCCTGACGGAGCAATACCGCGTGAGGGAGGAAGGCTCTTGGGTCGTAAACCTCTTTTCTCAGGGAAGAACACAATGACGGTACCTGAGGAATCAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCAAGCGTTATCCGGAATGATTGGGCGTAAAGCGTCCGCAGGTGGCTGTGTGTGTCTGCTGTTAAAGAGCAAAGCTCAACTTTGTAAAAGCAGTGGAAACTACACAGCTAGAGTGCGTTCGGGGCAGAGGGAATTCCTGGTGTAGCGGTGAAATGCGTAGATATCAGGAAGAACACCGGTGGCGAAAGCGCTCTGCTAGGCCGCAACT
>URS00007386F9 rRNA from 1 species 
GCGGCAAACGGGTGAGTAATATCTGGGAATCTACCCAAAAGAGGGGGATAACTACTAGAAATGGTAGCTAATACCGCATAATGTTGAAAAACTAAAATGGGGGACCTTTTTAGGCCTCATGCTTTTGGATGAGCCCAGACGAGATTAGCTTGTTGGTAAGGTAAAAGCTTACCAAGGCTACGATCTCTAGCTGGTCTGAGAGGATAGCCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCTATGCCGCGTGTATGAAGAAGGCCTTAGGGTTGTAAAGTACTTTCAGCGGGGAAGAAAAAAATAAAAATAATACTTTTAT
>URS00008F63D8 tRNA from 5 species 
GTGCCCATAGCTCAGTTTGGTTAGAGCATCCGACTCATAATCGGCAGGTCCTCGGTTCAAGTCCGAGTGGGCGCACCA
>URS00007B46A8 snRNA from 1 species 
CCCACCCTGGAAACGGCTCAGC
>URS0000B49266 rRNA from 1 species 
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGTAGCACAGAGAGCTTGCTCTCGGGTGACGAGCGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAATGTCGCAAGACCAAAGTGGGGGACCTTCGGGCCTCATGCCATCAGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGGGGAGGAAGGCGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGATTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAATCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACAGAACTTNTTGGTGCCTTCGGGAACTGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTTCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCATATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTATGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTAGATCAGAATGCTACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTGGATCACCT
>URS00003BE16A rRNA from 1 species 
TGAACGCTAGCGGCACGCTTCATACATGCAAGTCGAGGGGCAGCATAAAGTACTTGTACTTTGATGGCGACCGGCGAACGGGTGCGTAACGCGTATGCAACTTACCTTTTACTAGAGAATAGCCAAGAGAAATTTTGATTAATGCTCTATACTCTTTTTAACTCACATGAGTTTTTAAGAAAAGCTCCGGCGGTAAAAGATGGGCATGCGTCCTATTAGCTTGTAGGTGAGGTAACGGCTCACCTAAGCTCCGATAGGTAGGGGTCCTGAGAGGGAGATCCCCCACACTGGTACTGAGACACGGACCAGACTTCTACGGAAGGCAGCAGTAAGGAATATTGGACAATGGAGGAAACTCTGATCCAGCGATGCCGCGTGAAGGAAGACGGCCCTATGGGTTGTAAACTTCTTTTATACAGGAAGAAACCTTTCCACGTGTGGAAAGCTGACGGTACTGTAAGAATAAGGATCGG
>URS00025B9EB0 lncRNA from 1 species 
GGAGAATTGCAGTGATAAAAATGAATGTTTTACCGAGGCTACTCTACATATTTCACACAGCCCCACAGGTGATTCCGCAGGCATTTTTCAGGACACTCAAAACAGCAATCACACAATATATTTGGAGAGGGGAGAAGGCCCGCATTGGCTTTGACAAGCTCTGCTTACCAAGAAGCTGGGGAGGGTTAGCCTTGCCCGACATCAGAAAATACCACCAGGCTACAGTACTGCAGAGGCTCAAG
>URS0001DE2DB5 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTTGAGCGCTGAAGGTTGGTACTTGTACCAACTGGCTGAGCAGCGAACGGGTGAGTAACGCGTGGGGAATCTGCCTTTGAGCGGGGGACAACATTTGGAAACGAATGCTAATACCGCATAAAAACTTTAAACACAAGTTTTAAGTTTGAAAGATGCAATTGCATCACTCAAAGATGATCCCGCGTTGTATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGATGATACATAGCCGACCTGAGAGGGTGATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGACGAAAGTCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGGTGTCGGATCGTAAAACTCGGTTGGTAGAGAAGAACGTTGGTGAGAGTGGAAAGCTCATCAAGTGACGGTAACTACCCAGAAAGGGACGGCTAACTACGTG
>URS0001C397AE rRNA from 1 species 
GATGAACGCTAGCGGCAGGCCTAATACATGCAAGTCGGACGGGATTCAGGAGCTTGCTTCTGATGAGAGTGGCGCACGGGTGCGTAACACGTATGTAACCTACCTTTATCAGGGGGATAGCCTCTCGAAAGAGAGATTAAGCCCGCATAAAATCACAGCACAGCATTGTGTAATGATCAAATATTTATAGGATAAAGATGGGCATGCGGAACATTAGCTAGATGGCGGGGTAACGGCCCACCATGGCGACGATGTTTAGGGGATCTGAGAGGATGGCCCCCCACACTGGTACTGAGACACGGACCAGACTCCTACGGGAGGCAGCAGTAAGGAATATTGGCCAATGGGCGGAAGCCTGAACCAGCCATGCCGCGTGCAGGAAGACGGCCCTACGGGTTGTAAACTGCTTTTATACGGGAATAAACCCAGATACGTGTATCTGGCTGAATGTACTGTAAGAATAAGGATCGGCTAACTCCGTG
>URS0000EF62B1 lncRNA from 1 species 
GCTGCCACCTCTCTTGACTCCCTTGTGAGGAGATCGGCTCTTGCTCCTCCTCATGCCATGACTCTTTAATTTGCGGCTGGTCGACATGCCATTGTGACAAGGCACCATCAATCATCATGTCCCTTTACCAGGAGGGCCCGTGTCATAAGCCACTATATAAAGGGAATGATGGGTGGACTGCTTTGGACAAATGGACCTGCGGTAGGAGAGAGGGACAACAGTAGGAGCAGGCAGATCTTGCTGTTTCAACCAAAACCTCATGCTGACCAGAGTTGAGGAACAGAAGAAGATGGTGAAGGCCTGCAGGTATAGGTGTTCAGCATGTCATCTGAAATATTCCCCACAGAGGCAAAAAGAAAGGAAATTATCTCTGAAAAGGAATGGGAGGACAAGTCAGCAGAATATGTCAATGTTTTGGTTGAAGAAGCTGCTTGAATCTGGGCTTTTCTGTGCCATGTGTTCTCCCAGGGCCAGCACAAAGAAGGGCTTTTGGTGCAGGCCCAAGACCACCATAATCATCATTGATTATTCCTCTCCACGCCAGTGTCTCTAAATAAACTTTCTCTTCTTTCTCTGACAAA
>URS0002429CE1 lncRNA from 1 species 
TTTTCTTGAATGGACAATAATGCGTTTTGTGTCCAAGTTTGCAACAAAAGTTGTATTTGCTTTGGTGTTGAACATGTAAGATGGGGCCTTTTATGAAGGTGGTTGGATTTTGGTGAGGACTTCTCACAAATCCGATTCCACTTCTTTTGGGAACGTGACCCTTGTTTGCAAGGATCATGTTCAGTGACTTGCTACCAACCTCGAATTTCTTCAAGGTGTCCTTAAGTAGCAAGTTTTCCTTTTGGAGAGTTTCTAGATCATGGCATTT
>URS0001CE0F72 rRNA from 1 species 
GGGTTGTGAGGTTAAGCGACTAAGCGTACACGGTGGATGCCCTGGCAGTCAGAGGCGATGAAGGACGTGCTAATCTGCGATAAGCGTCGGTAAGGTGATATGAACCGTTATAACCGGCGATTTCCGAATGGGGAAACCCAGTGTGATTCGTCACACTATCATTAACTGAATCCATAGGTTAATGAGGCGAACCGGGGGAACTGAAACATCTAAGTACCCCGAGGAAAAGAAATCAACCGAGATTCCCCCAGTAGCGGCGAGCGAACGGGGAGGAGCCCAGAGCCTGAATCAGTGTGTGTGTTAGTGGAAGTGTCTGGAAAGGCGCGCGATACAGGGTGACAGCCCCGTACACAAAAATGCACATGCTGTGAGCTCGATGAGTAGGGCGGGACACGTGGTATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTCCTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCCCGGCGAGGGGAGTGAAAAAGAACCTGAAACCGTGTACGTACAAGCAGTGGGAGCACGCTTAGGCGTGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCTGTAGCAAGGTTAACCGAATAGGGGAGCCGAAGGGAAACCGAGTCTTAACTGGGCGTTAAGTTGCAGGGTATAGACCCGAAACCCGGTGATCTAGCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACTTGTGGCTGGGGGTGAAAGGCCAATCAAACCGGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGTGAATTCATCTCCGGGGGTAGAGCACTGTTTCGGCAAGGGGGTCATCCCGACTTACCAACCCGATGCAAACTGCGAATACCGGAGAATGTTATCACGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGAAGAGGGAAACAACCCAGACCGCCAGCTAAGGTCCCAAAGTCATGGTTAAGTGGGAAACGATGTGGGAAGGCCCAGACAGCCAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAATAGCTCACTGGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTAAACCATGCACCGAAGCTGCGGCAGCGACGCTGATGCGTTGTTGGGTAGGGGAGCGTTCTGTAAGCCTGCGAAGGTGTGCTGTGAGGCATGCTGGAGGTATCAGAAGTGCGAATGCTGACATAAGTAACGATAAAGCGGGTGAAAAGCCCGCTCGCCGGAAGACCAAGGGTTCCTGTCCAACGTTAATCGGGGCAGGGTGAGTCGACCCCTAAGGCGAGGCCGAAAGGCGTAGTCGATGGGAAACAGGTTAATATTCCTGTACTTGGTGTTACTGCGAAGGGGGGACGGAGAAGGCTATGTTGGCCGGGCGACGGTTGTCCCGGTTTAAGCGTGTAGGCTGGT
>URS00003281C0 rRNA from 1 species 
CTACGTGCCAGCAGCCGCGGTAATACGTAGGTCCCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGTTAGATAAGTCTGAAGTTAAAGGCTGTGGCTTAACCATAGTACGCTTTGGAAACTGTTTAACTTGAGTGCAAGAGGGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCTTGTAACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGGTGTTAGACCCTTTCCGGGGTTTAGTGCCGTAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCCTCTGACCGCTCTAGAGATAGAGCTTTCG
>URS00016D14C4 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAATGGATTGAGAGCTTGCTCTTATGAAGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCCATAAGACTGGGATAACTCCGGGAAACCGGGGCTAATACCGGATAACATTTTGAACCGCATGGTTCGAAATTGAAAGGCGGCTTCGGCTGTCACTTATGGATGGACCCGCGTCGCATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAAGGTGGTCGGCCACACTGGGACTGAGAGACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCGTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGCTTTCGGGTCGTAAAACTCTGTTGTTAGGGAAGAACAAGTGCTAGTTGAATAAGCTGGCACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCCGCCGCAGTAA
>URS000090AB96 SRP_RNA from 1 species 
GCCGGGCGTGGTGGCGCATGCCTGTAATCCCAGCTACTCGGAAGGCTGAGGCAGGAGAATTGCTTGAGCCCAGGGAGCGAAGGTTGCAGTGAGCAGAGATCATGCCACTGCACTCAAACCTGGGCAACAGGGTGAGACTCTGTCTCAA
>URS00023BAE1B lncRNA from 1 species 
CTGAACCCTTATCAGTAAAAGTTTATCCGGAGTCAGAGAACAGGGAATGGCACTCGACGCAAAAATCGGGCGAGGCCCAGCCCTAGATGTGGGTTCATCTACAGTGTGGGGGTTTTGGGGGACCAAACAAAGGCCCTAAAAATCCTGGAACCACTAGAGGCGGAGGTACCGAAAGATATTTCAAACAAAGGCCCTAAAAATCCTAGAAAAATCAGGCGGGATAAGAGGTGAAAGGTTTGCGGGGGACCAAACCAGAGGAATGTGGCAGAAGAAAAATGGAGGAGAAAGGGCACCT
>URS00022ED730 rRNA from 1 species 
TGGGGAATTTTGGACAATGGGGGCAACCCTGATCCAGCAATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTTGTCCGGGAAGAAATCGCACCTGATAATACCGGGTGTGGATGACGGTACCGGAAGAATAAGGACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTCGGGTCCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTGTGCAAGACCGATGTGAAATCCCCGGGCTTAACCTGGGAATTGCATTGGTGACTGCACGGCTAGAGTGTGTCAGAGGGGGGTAGAATTCCACGTGTAGCAGTGAAATGCGTAGAGATGTGGAGGAATACCGATGGCGAAGGCAGCCCCCTGGGATAACACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGG
>URS00010F344E rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTAGGACGCAGTTGCGAACGGGTGAGTAACGCGTAGGTAACTACCTATTAGAGGGGGATACCTATTGGAAACGATAGCTAATACCGCATACCTGTAGATGGATCTGCGTTGTATTAGCCAGGAGGTAGGGTAATGGCCTACCTAGGCAACGATACATAGCCGACATGAGAGGATGATCGGCCAGACGGGGAGTGCGGCACGGCCCAGACTCCTACGGGTGGCAGCAGTAGGGAATCTTGGGCAATGGGGGGAGCCCTGACCGAGCAACGCGGCGTGAGTGAAGAAGGTCGTCGGATGGTAAAGCTCTGTTGTTAAGGGAGCGGTACTTAAAGAGAAAGGGACGGCTAACTACGTGCCAGCAGCCGCGGTAATAC
>URS0001F774E1 misc_RNA from 1 species 
GATGAAGAACGCAGCGAAATGCGATACTTGGTGTGAATTGCAGAATCCCGTGAACCATCGAGTCTTTGAACGCAAGTTGCGCCCGAAGCCATTAGGCCGAGGGCACGCCTGCCTGGGCGTCACACGTCGTTGCCCCCCCATCTACTCCTTCGGGATTGCGGGGGGCGGATGATGGCCTCCCGTGCGCCTCGCCGCGCGGTTGGCATAAATGCCAAGTCCTCGGCGACGCACGCCACGCCAATCGGTGGTTGCGAAACCTCGGTTGCCCGTCGTGTGCGGTCGTCGCGCATCGAGGGCTCGAAAAAATTGCCGGGTTCCGGCTCGGCTTTCAACGCGACCCCAGGTCAGGCGGGGTTACCCGCTGAATTTAAGCATATCAATAAGCGGAGGA
>URS000076AF46 rRNA from 1 species 
GGTTAAGCGACTAAGCGTACACGGTGGATGCCCTGGCAGTCAGAGGCGATGAAGGGCGTGCTAATCTGCGATAAGCGCCGGTAAGGTGATATGAACCGTTATAACCGGCGATACCCGAATGGGGAAACCCAGTGTGACTCGTCACACTATCATTAACTGAATCCATAGGTTAATGAGGCGAACCGGGGGAACTGAAACATCTAAGTACCCCGAGGAAAAGAAATCAACCGAGATTCCCCCAGTAGCGGCGAGCGAACGGGGAGGAGCCCAGAGCCTGAATCAGCATGTGTGTTAGTGGAAGCGTCTGGAAAGGCGCGCGATACAGGGTGACAGCCCCGTACACAAAAGCGCATGTGCTGTGAGCTCGATGAGTAGGGCGGGACACGTGGTATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTCCTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCCCGGCGAGGGGAGTGAAAAAGAACCTGAAACCGTGTACGTACAAGCAGTGGGAGCCCCACCACCAAAGCATTCTCTGGTGTTGAAGGCCCTGCAAAGCAGCATCGCGGTGGCGGAGCGTCGTTTGCGACGCCCAACACACAAAACAAGCGGTGAATGCTTTGGGGTGGGGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCTGTAGCAAGGTTAACCGAATAGGGGAGCCGGAGGGAAACCGAGTCTTAATTGGGCGTTAAGTTGCAGGGTATAGACCCGAAACCCGGTGATCTAGCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACCTGTGGCTGGGGGTGAAAGGCCAATCAAACCGGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGTGAATTCATCTCCGGGGGTAGAGCACTGTTTCGGCTAGGGGGCCATCCCGGCTTACCAACCCGATGCAAACTGCGAATACCGGAGAATGTTATCACGGGAGACAC
>URS0001199C7A rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTCTGTCGCGTCTGCTGTGAAAACTCAGGGCTTAACCCTGAGCTTGCAGTGGGTACGGGCAGACTAGAGTGCGGTAGGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCATTTCCTGACGCTGGAGGCGCGAAAGCGTGGGGAGCAAACAGG
>URS0000FE9A33 rRNA from 1 species 
TACGGAGGGTGCAAGCGTTATCCGGATTCACTGGGTTTAAAGGGTGCGTAGGCGGGTTGGTAAGTCCGTGGTGAAATCTCCGAGCTTAACTCGGAAACTGCCGTGGATACTATCAATCTTGGATATCGTGGAGGTAAGCGGAATATGTCATGTAGCGGTGAAATGCTTAGATATGACATAGAACACCAATTGCGTAGGCAGCTTACTACACGATCATTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGG
>URS0001565352 rRNA from 1 species 
AACGTAGGAGGCGAGCGTTATCCGGATTCACTGGGCGTAAAGCGCACGTAGGCGGTCGGGTAAGTCGGATGTTAAAGCCCTTGGCTCAACTAGGGGAGGTCATTCGATACTGCTCGGCTTGAGGATGAGAGAGGAAAGTGGAATTCCCGGTGTAGCGGTGGAATGCGTAGAGATCGGGAGGAACACCAGTGGCGAAAGCGGCTTTCTGGCTCATTCCTGACGCTGAGTGTGCGAAAGCGTGGGTA
>URS000144CD04 rRNA from 1 species 
CAGTCGCCGCGGTAATACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGTGTAGGTGGTTGTTTAAGCCTGTCGTGAAAGCCCTGGGCTCAACCTGGGAATTGCGATGGATACTGGGCGACTAGAGTGCGGTAGAGGATAGTGGAATTTCCGGTGTAGCAGTGAAATGCGTAGAGATCGGAAGGAACATCTGTGGCGAAGGCGACTATCTGGGCCAACACTGACACTGAGACACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCGTGTAGTCCCTGTCTCTTATAA
>URS00000D01ED rRNA from 1 species 
AGGATGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGTCCTGTCTCGCAAGAGGCAGGGAGTGGCGGACGGGTGAGTACCACGTGGGTTATCTACCGTGAGGTGAGGAATACCGGCGAGAAATCGCCGACAAGACCGCATAGCCTCGGTGCAAGCCGAGGAAAGCTTTCTCGAGAGAGGGAGCGCCACACGAGGAGCCTGCGCCCGATTAGCTAGCTGGTGGAGTAACGGTTCACCAGGGCGACGATCGGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGATTGAGAACGGCCCAGACTCCTACGGGGGGCAGCAGTGAGGAATTTTCGTCAATGGGGGCAACCCTGAACGAGCAACGCCGCGTGCAGGAAGAAGGTTTTCGGATCGTAAACTGCTTTTCTCGGGAAGAGAACGGACGGTACCCGAGGAATCAGCCCCGGCTAACTACGCGCCAGCAGCCGCGGTAA
>URS0002347B5A lncRNA from 1 species 
TTCTATGTAAGTATACTTCCGGGGTCTTGCCTCCCTTCTGCCCTGATTCTTCCCTTGTGGGTGTGCTGTCCGCATGCGCAGTGGCCTGCTAGCCCTTGGAAAGGAAGCATACGCAGTGTTTACTGGAGTTGTACGCATGCTCACTCCAGGCGTTCTTCCCTTACCTGCCGAATGTCCCTAGGAGGTCATATACCAGTTAAACTGCCCCATTTTGCCTCTTAGTGTACATTGTGAGCCCACTCAACCAGTTCCTGAGATACTACTGGGAAGCTGCTGATCACCAGTTTCAGGTTTTTTCCATCTGTTGGGAAACTGCCTATCCCTTGTGCTCGCTGCAACCAATTATTATTTTAGGGAGACAGTTAACCGCCTGACCATCACCCGATGATCGCCTGATGTTCATGCATCCATGACTACATAAACTTTTTGGCCGTTTGACCAAATGGGGACATCTGGCATACTGCTATCAACCAATATCACTTACTATGTCATAGGCACTGAACCACAAGCCTTCTGCAGGAATGATCTCATTTAATTCTTACAGCAATCCTATGAGATAAGTAGTACTGATATTACCATTTTACTAATTAGAAACTTGAAGCTTGGCGAGGTTAAATAATATGTCCAAAGTTGCAGAATGATTCAGTAGCAGAGGCTCATTGAGGGGCAAACAAGATCAATCCAATCCCATTCCTGTGTGAAGAAGACAGACATTAAACAATTAACCAAATAAATAATTGATGATAGCTGTAATGAGTGCTATGACAGGTGCTGAGCCAAGGCATAACTTCTGTTCTGAGGGTTCAAGGAAAGCATTGTTCCCTGACAAAATGACATTCAGTCATGGACTCCCACAGTGCTTAGGAGCTGGCAAGGCAAAGGCTTGGGTAGGATGGTTGGGATGAAAGTAAGAATGAGGAGTGAACAGTATTCTAGCTGGGAGGGTCCAAAGTGGGAAGGGGCATGGCAGACCATGGAACTGAGAGAAGGCCAGCAGGCAGGCTGCAAAGAGGGTGAGGGAGGAGGCAGCACCAGATGAGATTGGAAAGCCAGGTTGGGGTGTCATGATAGAGGCTTTGTAGCCATGAGAAAATGTTGGGCCAGGCCAGGTGTGGTGGCTCACACCTG
>URS000084D716 rRNA from 1 species 
TACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTTTAAGACAGATGTGAAATCCCCGGGCTTAACCTGGGGACTGCATTTGTGACTGTAAGACTAGAGTGCGGCAGAGGGGGGTAGAATTCCACGTGTAGCGGTGAAATGCGTAGATATGTGGAGGAATACCGATGGCGAAGGCAGACCCCTGGGTCGACACTGACGCTGATGCGCGAAAGCGTGGGGAGCAAACAGG
>URS0000CD773A rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTTTGTCGCGTCTGCTGTGAAATCCCGAGGCTCAACCTCGGGTCTGCAGTGGGTACGGGCAGACTAGAGTGTGGTAGGGGAGATTGGAATTCCTGGTGTAGCGGTGGAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCAGATCTCTGGGCCATTACTGACGCTGAGGAGCGAAAGCATGGGGAGCGAACAGG
>URS00011E7DCB rRNA from 1 species 
TACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTGTTAAGACAGATGTGAAATCCCCGGGCTTAACCTGGGAACTGCATTTGTGACTGGCAAGCTAGAGTATGGCAGAGGGGGGGTAGAATTCCACGTGTAGCAGTGAAATGCGTAGAGATGTGGAGGAACACCGATGGCGAAGGCAGCCCCCCTGGGTCAAGATTGACGCTCATGCACGAAAGCATGGGGAGCGAACAGG
>URS00002D8EF0 rRNA from 1 species 
AGCGGCGAACGGGTGAGTAACGCGTGAGCAACCTACCTTAGTTACTGGGATAGCCCGAGGAAACTCGGATTAATACCGGATATTCTTATTTAATCACATGATTTTCTAAGGAAAGGTCAGCCGAACTAAGATGGGCTCGCGTTCTATCAGCTAGTTGGTAGGGTAACGGCCTACCAAGGCTACGACGGATAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCTGCAGCAGGGAATATTGTGCAATGAACGAAAGTTTGACACAGCGACACCGCGTGTGGGATGACGGATCTAGGTTTGTAAACCACTTTCAGGAGGGAAGAAAACGACGGTACCTCCACAAGAAGCCCCGGCCAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGTTCAACAAGTCGGTCGTGAAAGTTCAGGGCTCAACCCTGAAATGTCGATCGATACTGTTGTGACTAGGATACGGCAGAGGTGAGTGGAATTCCGAGTGTAGCGGTGAAATGCGTAGGTATTCGGAGGAACACCAATTGCGAAGGCAGCTCACTGGGCCGCTATCGACGCTGAGGAGCGAAAGCTAGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCTAGCTGTAAACGATGGATACTAGATGTAGGAATTGGTTTAACGATTTCTGTATCGTAGCTAACGCGTTAAGTATCCCGCCTGGGGAGTAC
>URS0000C7CC16 tRNA from 1 species 
TCTCTGGTAGTCCAGTGGCTAAGGCATTGCACTGCCAATGCAGGGGACCCAGGTTCGATCCCTGGTCTGGGAA
>URS00000379BF rRNA from 1 species 
GGCTTTTTGATAATAATTTAAAGTCTTACCTGCTCTATGATATTTTAAATGGCTGCAGTATTTTGACTGTACAAAGGTAGCATAATCATTAGTTTTTTAATTGAAAGCTGGAATGAATGGTTTGATGAAAAAATATCTGTCTTTATTTAATGATTAAAATTTTATTTTTAAGTTAAAAAGCTTAAATTTTTTTAAAAGACGAGAAGACCCTATAGAGTTTGATATTAATTTTTTTTTATTTTAAATTTAGAATAAATTTTTTAATTAATGRTGAATATTTGATTGGGGTGATTAAAAAATTAATTTAACTTTTTTTATTTTATTTCATAAATTAGTGTATATTTGATCCAAAATTTTTGATTATAAGTTTAAATTACCTTAGGGATAACAGCGTAATTTTTTTAGAGAGTTCTTATCGAAAAAAGAGATTGCGACCTCGATGTTGGATTAAAATTTATATTTGGTAGTAGAAGCTGAAATATTGGGTCTGTTCGACCTTTAAAATTTTACA
>URS0002047E1F rRNA from 1 species 
CCTACGGGTGGCAGCAGTAAGGAATATTGGTCAATGGACGCAAGTCTGAACCAGCCATGCCTCGTGGAGGATGAAGGTCCTCTGGATTGTAAACTTCTTTTATTTGGGAAGAAACTCCCGATTTCCATCGGGCTTGACGGTACCAGATGAATAAGCACCGGCTAACTCCGTGCCAGCCGCCGCGGTAATACGGAGGGTGCAAGCTTTATCCGGTTTAAATGGGTTTAAGGTGGGCAGGGAAGGCAGTGTAGAAATCTCCGGGCTTAACCCGGAAACTGCCATTGATACTATTTGTCTTGAATACTCTGGAGGTGAGCGGAATATGTCATGTAGCGGTGAAATGCTTAGAGATGACATAGAACACCCATTGCGAAGGCAGCTCACTACGGAAATATTGACGCTGAGGCACGAAAGCGTGGGGATCAAACAGGATTAGATACCCTTGTAGTC
>URS000059B2B0 rRNA from 1 species 
CTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGTGGTTTAATAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGTTTAACTTGAGTGCAAGAGGGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCTTGTAACTGACGCTGAGGCTYGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAGTGCTAGGTGTTAGACCCTTTCCGGGGTTTAGTGCCGTAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCT
>URS00014BE65D rRNA from 1 species 
ATTGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGATCGGTAACGCGGGGGCAACCCTGGCGACGAGAGGCGGACGGGTGAGGAACGCTTGGGAATCTGCCTATCAGCGGGGGACAACACGGGGAAACTCGTGCTAATACCGCATACGCTCTACGGAGGAAAGCCGGGGACCGCAAGGCCTGGCACTGATAGATGAGCCCAAGCCGGATTAGCTAGTTGGCGGGGTAACGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAGTATTGGACAATGGGGGAAACCCTGATCCAGCGACGCCGCGTGGGTGAAGAAGGCCTGCGGGTTGTAAAGCCCTTTCGGTAGGGACGAAAGCTCTCGACCTAACACGTCGGGAGGATGACTTAACCTACAAAAGAAGCACCGGCTAACTCTGTGCCAGCAGCCGCGGTAATAC
>URS00004D4C08 rRNA from 1 species 
ATGCAAGTCGAACGATGAAGCCCTTCGGGGTGGATTAGTGGCGAACGGGTGAGTAACACGTGGGCAATCTGCCCTGCACTCTGGGACAAGCCCTGGAAACGGGGTCTAATACCGGATACGACCACTGAGGGCATCCTCGGTGGTGGAAAGCTCCGGCGGTGCAGGATGAGCCCGCGGCCTATCAGCTTGTTGGTGGGGTGATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGGGATGACGGCCTTCGGGTTGTAAACCTCTTTCAGCAGGGAAGAAGCGAAAGTGACGGTACCTGCAGAAGAAGCGCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGCGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGCCTGTCACGTCGGATGTGAAAGCCCGGGGCTTAACCCCGGGTCTGCATTCGATACGGGCAGGCTAGAGTTCGGTAGGGGAGATCGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGATCTCTGGGCCGATACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGTTGGGCACTAGGTGTGGGCAACATTCCACGTTGTCCGTGCCGCAGCTAACGCATTAAGTGCCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTGGCTTAATTCGACGCAACGCGAAGAACCTTACCAAGGCTTGACATACACCGGAAAGCATTAGAGATAGTGCCCCCCTTGTGGTCGGTGTACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTGTGTTGCCAGCATGCCCTTCGGGGTGATGGGGACTCACAGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGCCCCTTATGTCTTGGGCTGCACACGTGCTACAATGGCCGGTACAATGAGCTGCGATACCGCGAGGTGGAGCGAATCTCAAAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCCCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCATTGCTGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACGTCACGAAAGTCGGTAACACCCGAAGCCGGTGGCCCAACCC
>URS000030D236 rRNA from 1 species 
CATGCAGTCGGAGGTAACATTTCTAGCTTGCTAGAAGATGACGAGTGGCGGACGGGTGAGTAATGCTTGGGAACTTGCCTTTGCGAGGGGGATAACAGTTGGAAACGACTGCTAATACCGCATAATGTCTTCGGACCAAACGGGGCTTAGGCTCCGGCGCAAAGAGAGGCCCAAGTGAGATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCGACGATCTCTAGCTGTTCTGAGAGGAAGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTTGTGAGGAAAAGTTAGTAGTTAATACCTGCTAGCCGTGACGTTAACAACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATCACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGCTAGATGTGAAAGCCCCGGGCTCAACCTGGGATGGTCATTTAGAACTGGCAGACTAGAGTCTTGGAGAGGGGAGTGGAACTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACATCAGTGGCGAAGGCGACTCCCTGGCCAAAGACTGACGCTCATGTGCGAAAGTGTGGGTAGCGAACAGGATTAGATACCCTGGTAGTCCACACCGTAAACGCTGTCTACTAGCTGTGTGTGTCTTTAAGACGTGCGTAGCGAAGCTAACGCGCTAAGTAGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACACTTGACATGCTGAGAAGTTACTAGAGATAGTTTCGTGCCTTCAGGAACTCAGACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTAAGTCCCGCAACGAGCGCAACCCTTGT
>URS0000D53B79 miRNA from 14 species 
TTTATTCTCAGTTTGTTGCTC
>URS00018E852B rRNA from 1 species 
CAGCCGCCGCGGTAATACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTATATAAGACAGATGTGAAATCCCCGGGCTCAACCTGGGACCTGCATTTGTGACTGTATAGCTAGAGTACGGTAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGACCTGTACTGACGCTCATGCACGAAGGCGTGGGGAGCAAACAGGATTAGATACCCCGGTAGTCCCTGTCTCTTATAC
>URS0001DF4263 tRNA from 1 species 
GGGTGATTAGCTCAGTTGGTAGAGCAGGTGACTCTTAATCACCGGGTCCACAGTTCGAGCCTGTGATCACCCACCA
>URS00007C3FF8 rRNA from 1 species 
TGGGGAATCTTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGAGTGAAGAAGGCCTTCGGGTTGTAAAGCTCTTTTACCAGGGACGATAATGACGGTACCTGGAGAATAAGCCCCGGCAAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGATTGTTAAGTCAGAGGTGAAATCCCGGAGCTCAACTTCGGAACTGCCTTTGATACTGGCAATCTCGAGTCCGGAAGAGGTTAGTGGAATTCCCAGTGTAGAGGTGAAATTCGTAGATATTGGGAAGAACACCAGTGGCGAAGGCGGCTAACTGGTCCGGTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCCAGTAGTCCCTGAGCGGGC
>URS0000D54BB5 miRNA from 15 species 
ATGGGTAGCACAAGGATTAATG
>URS000041BA98 siRNA from 1 species 
TCAACCTAGGCTCTGATA
>URS00000BB073 rRNA from 1 species 
GGCGGTTAGATAAGTNTGAAGTTAAAGGCTGTGGCTTAACCATAGTACGCTTTGGAAACTGTTTAACTTGAGTGCAAGAGGGGAGAGTGGAATTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAGGAACACCGGTGGCGAAAGCGGCTCTCTGGCTTGTAACTGACGCTGAGGCTCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTNCACGCCGTAAACGATGAGTGCTAGGTGTTAGACCCTTTCCGGGGTTTAGTGCCGCAGCTAACGCATTAAGCACTCCGCCTGGGGAGTACGACCGCAAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGTCTTGACATCCCTCTGACCGCTCTAGAGATAGAGTTTTCCTTCGGGACAGAGGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATTGTTAGTTGCCATCATTCAGTTGGGCACTCTAGCGAGACTGCCGGTAATAAACCGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGACCTGGGCTACACACGTGCTACAATGGCTGGTACAACGAGTCGCAAGCCGGTGACGGCAAGCTAATCTCTTAAAGCCAGTCTCAGTTCGGATTGTAGGCTGCAACTCGCCTACATGGAGTCGGAATCGCTAGTAATCGCGGATCAGCACGCCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCACGAGAGTTTGTAACACCCGAAGTCGGTGAGGTAACCATTNGGAGCCA
>URS00002C2482 rRNA from 1 species 
TGCGCCTTGCCAGCCCGCTCGAAACTTAAAGGAATTGACGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCAGGCCTTGACATGCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCTTAGTTACCAGCACGTTATGGTGGGCACTCTAAGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGGCCTGGGCTACACACGTGCTACAATGGTCGGTACAAAGGGTTGCCAAGCCGCGAGGTGGAGCTAATCCCATAAAACCGATCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGTGAATCAGAATGTCACGGTGAATACGTTCCCGGGCCTT
>URS00007D10E7 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATGCATGCAAGTCGCACGCAGCACTCTTCGGAGTGCTGAGTGGCGCACGGCTGAGGAACACGTGGGCACCTGCCCGCGCGTGGGGGATAACCCGGCGAAAGCCGGGCTAATCCCGCATACGCTTGGCTCCCAATAGCCAAGCAAAGCGGCAACGCGCGCGCGGAGGGGCCTGCGGCCCATCAGGTGGTTGGCGGGGTAACGGCCCACCAAGCCGGTGACGGGTAGCTGGTCTGTGAGGACAACCAGCCAGACTGGGACTGAGAGACGGCCCAGACTCCTACGGGAGGCAGCAGCAAGGAATTTTCCCCAATGGGCGCAAGCCTGAGGGAGCAACGCCGCGTGCAGGACGACGGCCTTCGGGTTGTAAACTGCTTTTCGGAGGGACGAGAGTGACGGTACCTTCGGAATAAGCCCCGGCTAACTCTGTGCCAGCAGCCGCGGTAAGACAGAGGGGGCCAGCGTTGTCCGGACTAACTGGGCGTAAAGCGCGCGCAGGCGGTCGGAGGCGTCGGTGCTGAAAAGCTCCCGCTTAACGGGAGACGGCGTGCCGATACGCTTCGACTGGAGGGCGGGCGAGGGTGGTGGAAGTGCCGGTGTAGTGGTGAAATGCGTAGAGATCGGCTCGAACACCAGTGGCGAAGGCGGCCACCTAGCCCGCCCCTGACGCTGAGGCGCGACAGCGTGGGGAGCGAACTGGATTAGATACCCAGGTAGTCCACGCCGTAAACGATGCCGACTCGGTCTTCGTGGAGCGACAAGCTCCGGGGGGGCCCGAGCTCACGCGCTAAGTCGGCCGCCTGGGGACTACGAGCGCAAGCTTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCAGCGGAGCGTGTGGTTTAATTCGACGCAACGCGCAGCACCTTACCCAGGCTGGACATGGAGCTGCACAGCGGGGAAACCCGCTGGCCTTCGAGGGTGCTCCACAGATGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCCGCGGCCAGTTACACGTGTCTGGTCGGACCGCCCTTCGGGGAGGAAGGCGGGGATGACGTCAAGTCCGCATGGCTCTTACGTCTGGGGCGACACACACGCTACAATGACGCCGACAGTGCGAGGCGAAGGAGTAATCCGAAGCGAATCGCCAAACGGCGTCCCAGTGCAGATCGGGGGCTGCAACTCGCCCCCGTGAAGGCGGAGTTGCTAGTAACCGCGTATCAGCCACGGCGCGGTGAATACGTACCCGGGCCTTGTACACACT
>URS00004C538B rRNA from 1 species 
AACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGANCGAACCCTTCGGGGTTANCGGCGGACGGGTGAGTAACCCGTGGGAACGTGCCCTTCTCTGCGGAATAGGCTCGGGAAACTGGGTTTAATACCGCATACGCCCTTCGGGGGAAAGATTTATCGGAGAAGGATCGGCCCGCGTTAGATTAGGTAGTTGGTGGGGTAATGGCCTACCAAGCCTACGATCTATAGCTGGTTTAAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGAGGAATCTTGGACAATGGGGGAAACCCTGATCCAGCCATGCCGCGTGAGCGATGAAGGCCTTAGGGTTGTAAAGCTCTTTCAGTCGTGAAGATAATGACGGTAGCGACAGAAGAAGCCCCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGGGCTAGCGTTGTTCGGAATTACTGGGCGTAAAGCGCGCGTAGGCGGACTATTAAGTCAGGGGTGAAATCCCGGGGCTCAACCCCGGAACTGCCTTTGATACTGGTAGTCTAGAGTTCGAGAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAGGAACACCAGTGGCGAAGGCGGCTCACTGGCTCGATACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGAATGCCAGTCGTCGGCAAGCATGCTTGTCGGTGACACACCTAACGGATTAAGCATTCCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGCAGAACCTTACCAACCCTTGACATCCTGATCGCGGTTACCCGAGAGGGTTCCCTTCAGTTCGGCTGGATCAGTGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTCGGTTAAGTCCGGCAACGAGCGCAACCCACACCCTTAGTTGCCAGCATTCAGTTGGGCACTCTAGGAGAACTGCCGATGATAAGTCGGAGGAAGGTGTGGATGACGTCAAGTCCTCATGGCCCTTACGGGTTGGGCTACACACGTGCTACAATGGCAGTGACAATGGGTTAATCCCCAAAAACTGTCTCAGTTCGGATTGTTCTCTGCAACTCGAGAGCATGAAGTCGGAATCGCTAGTAATCGCGTAACAGCATGACGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTGGGTTTACCCGAAGACGGTGCGCCAACCCTTACGGGGGGCAGCTGGCCACGGTAAGCTCAGCGACTGGGGTG
>URS0000D271BB rRNA from 1 species 
GAGGAGAGCTTGCTCTCTGATTTAGCGGCGGACGGGTGAGTAATGTATAGGGAGCTGCCCGATAGAGGGGGATACCAGTTGGAAACGACTGTTAATACCGCATAATGTCTACGGACCAAAGTGTGGGACCTTCGGGCCACATGCTATCGGATGCACCTATATGGGATTAGCTGGTTGGTGGGGTAATGGCTCACCAAGGCGACGATCCCTAGCTGGTTTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGCGGGGAGGAAGGGGATGTGGTTAATAGCTGCGTCTTTTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGTAGGCGGTATGTTAAGTTGGATGTGAAAGCCCCGGGCTCAACCTGGGAATTGCATTCAAAACTGGCATGCTAGAGTATGTGAGAGGGGGGTAGAATTCCAAGTGTAGCGGTGAAATGCGTAGAGATTTGGAGGAATACCAGTGGCGAAGGCGGCCCCCTGGCACAATACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCTACTA
>URS0000CC6E85 SRP_RNA from 1 species 
GCCAGGAGAGGTGGCTCGTGCCTATAGTCCCAGTTATTTGGGAGGCTGAGGTGGGAGGATTGCTTGAGCCCAGAAGTTCTGGGCTGTAGTGCGCTGTGCCGATTGGGTGTCTGCACTAAGTTCAGCATCAATATGGTGACCTCCCGGGAGCGGGGAGCCACCCAGAGGGGTGAAACTAAGGAGGCATGAACCAGCCCAGGTTGGAAACGGAGCAGGTCAAAACTCCCGTGCTGATGAGTGGTGGGATCATGCCTGTGAATAGCCACTGCACTCCAGCCTGGGCAACATAGTGAGACCCCGTCCCC
>URS0001C732DD rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGAGACCTTCGGGCCTAGTGGCGCACGGGTGCGTAACGACTGGGAACTTGCCCTTGGGTTCGGAATAACTCCCCGAAAGGGATGTTAATACAGGTTAATGTCTTAGGGCCAAAGATTTATCGCCTTTGGATGGGGCCGCGTTGGTTTGGCCAGTTGGTAGGGTAAAAGCCTACCAAGGGGACGATCCTTAGCTGGTGGGAGAGGAGGCTCAGCTACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGGAGGAGTAGGGAGTATTGGGCGATGGGCGAAGGCCTGATCCAGCAATGCCGGGTAAGTGATGAAGGCGTTAGTGTTGTAAAGCTCTTTTAGCCGGGATGATAATGACAGTACCGGGAGAATAAGCTCCGGCTAACTCCGTG
>URS0000BDC546 lncRNA from 1 species 
GAACTTCCTACAGTCTGAACTGGCTGTCCTCGCTTTGTTTGTAGACAGCCACGGACATGAGTTAGGAGAGGAAGACTCGGAGGGATCACTGGCCCCAAGTGGAAATCGAGGAACCTTCCCGACCCAGGAGGGCCCCGAAGAACTCGAGGAGCAGGACTGCGGAGAACAACGGGCTGGGAGGTGCGAGCCCGCCGAGGGCCTCTTCCTGACCTCCCGTCAGGTGAGGGGTCACGGTCCTGGCTGGCATGAGTTTCTCTCAGGTCCTGGCTCACGGCTGCTCTACAGGTGCACTTTCCCGGGCTTATCCTGTCACTAGACATCTGGGCTATGACAAGAGCAGGACCTCCCGGTAGGAAGACAGAGCAGGACACAGGAGCCGGGAGCCAGCGTGAAGGGAGGAGGCAGTGAGCTGAAAGGGGTAAGGCCCTTGGCAGCGCATCAGCGTTTCTCAG
>URS0000DCD19B rRNA from 1 species 
AACTTAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCCGGAGACCCTTAGGAAACTAGGGGGTGCTTCCATCTGGAAGAATCTGGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTGCTTCCAGTTACCATCATTAAGTTGGGGACTCTGGAAGGACCGCTGCGGTAACAACGCAGAGGAAGGTGGGGACGACGTCAAGTCAGCACGGCCCTTACGTCCAGGGCTACACACGTGCTACAATGGTCGGTACAAAGGGTTGCCAAGCCGCGAGGTGGAGCTAATCCCATAAAACCGATCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTCGGAATCGCTAGTAATCGTGAATCAGAATGTCACGGTGAATACGTTCCCGGGCCTT
>URS000122ED6C rRNA from 1 species 
TACGAAGGGGGCTAGCGTTGCTCGGAATCACTGGGCGTAAAGGGTGCGTAGGCGGGTCTTTAAGTCAGGGGTGAAATCCTGGAGCTCAACTCCAGAACTGCCTTTGATACTGAAGATCTTGAGTCCGGAAGAGGAGAATGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTGGCGAAGGCGGCTCTCTGGGACGGTACTGATGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS000217E4C6 lncRNA from 1 species 
AACAGCTCTCCCCATCCCCGACTTGCTGAGCAGCCCTGGGCAGTCTACTCTACAGCTCTCGACCTCCCTGAGGTCCATCTAGGGAGGACACAGGGACAATAATTCAAACAAATGCTTTCACGTCGGTCTGAGCTAACAGAGGGGGTGACTGGGGTGGGGGCCCCCTGGGGAGAGAAGGAGGGAATGGAGAAGCCTTCCCAGTGTCCAGAGTCACCACTTATTTCAGAGACGCTGGCTTCTGTGGGCCACCCAGATCTTCCTTCTCCTCTTCAGTGAATGACAGGCGGGGACCAAAGTCCCATCGAGCCAGAAGGGTCATTTGATAGTCCCATTCTCTATTACTGGTGCCTTTACAGGTGAAAAACTAGCCCAGCTCCCACTTACCCAAGAACACATCACAGGCCTTCCAATGTCTCTAAGCACTGCCGGGGCCCCAGGGCCTGATCGAGAGGGCAGGCCCTGCGGATGGCCGTCCACCACAGGGGAACCTTAGGGACTGTCTATGGAAACTGAAAAGAGCCACTGGCACCTGTCTTTGTCCAGCGAAGAAGGGAGATGAGCGGCCCCACCCAGCCCTTAGAGCTGCTTTCCTTCCCTTCCCCCACAGCCCGTGCCCTGACCCGGGGTGAGGGCTGCCCTGGGGCCTGGGCGCCGGCCTGCTCTTTGCCTGTGTGTGCCTGCGAGTGGGAGACGGAGAGAACACTTGGGAGCGAGTCTTTCCTTCCTGAACTTCTATTTCCTCAACTATTAACAAGGAAATTGCATTAGGTGATCTGTGGGTCAGGGCTTCCTCCTCTCCAGGAGGAGGATGTTCTAGTCTTTTCTCGCTGCACGCAGTCCTGAGCTCCACTGCAGAGAGAAACCGAGAGCAGAACGTTCATTCCTAAGAGTGAGGTGTCCAGTGCCCAGCTCTCCCTGGCTTTCCTGCTTGGAAAAGGCAGAGGAGAATGGCTTACAAACGCCAAAACCTGGCCGGCGATCATGCTGTGGTTTGCAGAGAATTAGAAGGCATTGTGGATCTCGCAAGGTGTTTGTAGCCAGAGCAGAAATGCCTTGGCAGGAGAAGCCAGGCGCACCAGCCCAGCCTCGTGGGTGGGCCTCTCTGTTGGCCACCGGACAGGGGCTGCCAGGACGTTTCTTGCCCCCAGCTGCCCTAAAGTCATGAGAGAAAATGGGTCAGACTGCAGAGGCTTATCCTTCTGGGACTCAGCTTTACTGCCCTGTGGCTCCAAGAGAAATGAAGAATATTAATCAGAAATTAAAAAAAAAAAATCAGCTCCATCAAAGGCCCCAAACTAGGCAAAAGGTTGAAGAATCTGCTCTCTGCTTGTATCTCTCTGTCTAGAGGGTATCCTCCCAGCAACAGCTTGTAGGGATGCTGTTATGGGCCCTTCTCCCAAATCCATATATCCTAACCCCTAATACTTCAGATGTGACTATGTTTGGAGATATGGTCTTTACAGAGGCAATTACATTAAAATGGAGTAACTAGGGTGAGCTCGAATCCAGCAGAACTGTAGTCTTTATCAGAAGGGAACATTTGCCTGCGGACGCACATGGAGGAGAGACACCAGGAGAAGATGGGCGTCCCCAGCCAGGGAGAGCGGGCCGGGGTGGATTCTTCCTTTGCACCCTCAAAAGGAGCCCACCCTGCCAACGCTGTGATTGTGGACCTCTAAGCTCTGCTGTTTAAGCCACCCAGTTTGTGGCACTTTGTTAGAGCAACTCTAGCAAATTTCTCCAGATGCTGCTCTGTTGGGAGGTCTGCACAACCTTGAGACTGCCTGGACTCAGAAGAATGAGTCCGCATGAGGGGAAGGGTTCTGCCCTTGCAGTGCAGCCTTATTTTAACATGAAACAAAACTGATCTATTACTCTCTTCCCTCAGAGCCTAGTCTTTTAAATTTTTTATTTCTTTTGGTATTGGTTTAACACGTTTTATTGTTTTAATCCCTTTAGTCTTTTTATTTTGTGAGTTTAATGAGTTTACTTATCTCAGTCATTTTTTAATCCCGTTTTTTCTTTCTTCTAGCTATTTTATACTATGTCTTTTATCTCATCTTCTAGATCTTTTGGTATTATATTTTTATTTTCCGTCTGTTATTTCTAACCCTTTGCCTTATCGTGCCTTTGTTCCATCTTTTAATTTCTTTTTAGCTTATTTTTTTTATTTTTAGTTCATATTGTCGCTTGCCTGCTGCCTTTTTTTTTAACTACTTTTTATTTCTTC
>URS000185AE94 rRNA from 1 species 
GACGGAGGGTGCTAGCGTTGTTCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGCCTTGCAAGTCGGTTGGTGAAAGCCCGGGGCTCAACCCCGGAGGTGCGGCCGAGACTGCAGGGCTGGAGGCCGGAAGAGGAGGGTGGAATACCCAGTGTAGAGGTGAAATGCGCAGATATCGGGAGGAACACCAGTGGCGAAGGCGGCTATCTGGACGGTTTCTGACGCTAAGACGCGAAAGCGTGGGGAGCAAACAGG
>URS00013B9BDC rRNA from 1 species 
TACGTAGGGGGCTAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGCTCGGTAAGTCCGCTGTGAAAGTCGGGGGCTCAACCCTCGAATGCCGGTGGATACTGTCGAGCTAGAGTGCGGAAGAGGCGAGTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCAATTGCGAAGGCAGCTCGCTGGGACGTCACTGACGCTGAGACGCGAAAGCGTGGGGAGCAAACAGG
>URS00021EA825 tRNA from 1 species 
GCCGAGATAGCTCAATGGTAGAGCAACCGCCTTGTAAGCGGTAGGTTACGAGTTCAAGTCTCGTTCTCGGCT
>URS0001B16A08 rRNA from 1 species 
ACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCTACTAGCCGTTGGAAGACTTGATCTTTTAGTGGCGCAGCTAACGCGATAAGTAGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGACGCAACGCGAAGAACCTTACCAGGTCTTGACATCCTGAGAATCCTTTAGAGATAGAGGAGTGCCTTCGGGAACTCAGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCTTAGTTGCCAGCACGTAATGGTGGGAACTCTAAGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGGCCCTTACGACCTGGGCTACACACGTGCTACAATGGCCAGTACAGAGGGCTGCAAACCCGCGAGGGAGAGCCAATCTCACAAAGCTGGTCGTAGTCCGGATCGCAGTCTGCAACTCGACTGCGTGAAGTTGGAATCGCTAGTAATCGTGAATCAGAATGTCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTGGCTAGTCTAACCTTCGGGGGGACGGTCACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAGCCCTAGGGGAACCTGGGGCTG
>URS000113661D rRNA from 1 species 
GCAGCAGCCGCGGGAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCTGAGCTTAACTTAGGAATTGCATTCGATACTGGGAAGCTAGAGTATGGGAGAGGATGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGATGGCGAAGGCAGCCATCTGGCCTAATACTGACGCTGAGGTACGAAAGCATGGGGAGCAAACAGGATTAGATACCCCTGTGTCCCTGTCTCTTATACA
>URS000018AC20 rRNA from 1 species 
ATTGAACGCTGGCGGCATGCCTTACACATGCAAGTCGAACGGTAACGGGCCTTCGGGTGCCGACGAGTGGCGAACGGGTGAGTAATGCATCGGAACGTACCTTTCAGTGGGGGATAACGTAGCGAAAGTTACGCTAATACCGCATATTCTGTGAGCAGGAAAGCAGGGGATCGCAAGACCTTGCGCTGATTGAGCGGCCGATGTCAGATTAGCTAGTTGGTGAGGTAAAGGCTCACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGATCCGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAAATGGGGGCAACCCTGATCAGCCATGCCGCGTGAGTGAAGAAGGCCTCGGTT
>URS0001022610 rRNA from 1 species 
CAGTAGCCACGGGAATACGAAGGGGGCTAGCGTTGTTCGGATTTACTGGGCGTAAAGCGCACGTAGGCGGATCGATCAGTCAGGGGTGAAATCCCAGAGCTCAACTCTGGAACTGCCTTTGATACTGTCGATCTGGAGTATGGAAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAGGAACACCAGTGGCGAAGGCGGCTCACTGGTCCATTACTGACGCTGAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCCCGTAGTCCCTGTCTCTTATAC
>URS0000FD5F85 rRNA from 1 species 
CCTACGGGCGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCGACGCCGCGTGAGGGATGAAGGTCTTCGGATCGTAAACCTCTGTCAGCAGGGAAGAACGGTCACTGTGCTAATCAGCAGTGAATTGACGGTACCTGCAAAGGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTATTGGGCGTAAAGCGCTCGTAGGCGGTATGTCAAGTCAAGGGTGAAATCCCCGCGCTCAACGTGGGAACTGCCTTTGAAGCTGGCAAACTGGAGTGTGTGAGAGGATAGTGGAATTCCAGGTGTAGGAGTGAAATGCGTAGATATTAGGAGGAACACCAGTGGCGAAGGCGACTTTCTGGACTGTACCTGACGCTGAGGCGCGAAAGCGTGGGTAGCGAACGGGATTAGATACCCCAGTAGTC
>URS000184CF18 rRNA from 1 species 
AACGAACGCTGGCGGCATGCCTAACACATGCAAGTCGAACGTGAAGGGGACTTCGGTCCCTGGAAAGTGGCGCACGGGTGAGTAACACGTGGATAATCTACCCGATGATCTGGAATAACACTTCGAAAGGGGTGCTAATACCGGATGAGCTTACGACGTCTTCGGACGACGCGGGAAAAGGGGGCTTCGGCTCCTGTCATCGGATGAGTCCGCGGCCCATTAGCTAGTTGGTAGGGTAATGGCCTACCAAGGCTACGATGGGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGCGCAATGGGCGAAAGCCTGACGCAGCAATGCCGCGTGAGTGATGAAGGCCTTCGGGTCGTAAAGCTCTGTCAGAGGGGAAGAAACTCCCGTCGGTTAATACCCGGCGGGCCTGACGGTACCCTCAAAGGAAGCACCGGCTAACTCCGTGCCAGCCGCCGCAGTAAAAC
>URS00020C60CA rRNA from 1 species 
GACGAACGCTGGCGGCGCGCTTAACACATGCAAGTCGAACGGAAAGGCCTGCTTTCCCTTGTGGATTGCGGGTACTCGAGTGGCGAACGGGTGAGTAACACGTGAGTGATCTGCCCCCAACTTGGGTATAAGCCTGGGAAACTGGGTCTAATTCCCGATAGGACTGCAGGGTGGTGCCGGTGGTGGAAAACGATTTTCTAGTGGTGGGGGATGAGCTCGCGGCCTGTCAGCTTGTTGGTGGGGTAGGGGCCTACCAGGGCGGCGACGGGTAGCCGGCCTGGGAGGTGGGCAGGCGAAATCGGGCCTGATATAGGGCGGAGACTCCGGGGGGAGGCATCAGTGGGGGGGATGGCACAATGGGCGGAAGCCTGATGGGGGGACGCCGGGTGCGGGGTGACGGACTTCGGGTTGTAGGCGGGGATCCCCTGTGGTGGAGAGGGTGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTG
>URS00023F918D lncRNA from 1 species 
CCATACATGTACCACTGCTACATGGTGCAGTAAATTCAACACACAACCTACCCCTTAAACCCTATGAGTTACAACATAGGCACCTGCACTATCAACTTCTCATGACTACTAACGAACATGTCACACAAGCATACAAGTTCAATGGAATACTTATAATAGGATTCTAAGCTCACATTGTCATAATAGTTACCATACATGTCATTCATATTATCAAGAAGATAAATACACATCTATATCACAATAAGGCATCCCATACATGTAGACTAAGATATATATATTACTTGGGATAATTCACTAACTGATATTGCCTGACTAAGCCCTACTTGGTCTTTAGTAATACTAATTTTAGTATTCAAGAACGATTAAGAACATTTTGATCAAAATCAAACCTAGTAGATCAATTAGGAAGATCCGCCCACTAGATTTTCAATCCGTAAATTCCTAAGGTCCTCAAATATTACATATAATAACATATTAAAGTTTGGTAACGATCTAACGGTCGGATCATCGATTGTTATAATATTCAAGTGGTGGTCTCTAACGAAAATATGTTCAAACGACGGGATTTCATCAATCGGATGACACATATTAACTCGAGGTATTGAATTTAGCATAGAAAGATAGAGTTGGCCCACTGGTTACTCACCGCCACATGCGGCGGTTTCTGGCAAACGAAAACCCAATTTTTTGACAAACTCCAAAAAATTACCAAATTTTATAGAAATGTAGAGCAAGTCAAGGGGAATAATTTTCATACCTGGGTCAAAGTTCAATTTGGCTA
>URS000228E004 rRNA from 1 species 
GCATCTCTTGAATATCAAAGGTGAGCCAGTACAGGATGGACCCGCGTCTGATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCGACGATCAGTAGCCGACCTGAGAGGGTGATCGGCCACATTGGAACTGAGACACGGTCCAAACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGAAAGCCTGATGCAGCAACGCCGCGTGAGTGATGAAGGCCTTCGGGTCGTAAAACTCTGTCCTCAAGGAAGATAATGACGGTACTTGAGGAGGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCTAGCGTTATCCGGATTTACTGGGCGTAAAGGGTGCGTAGGCGGTCTTTCAAGTCAGGAGTGAAAGGCTACGGCTCAACCGTAGTAAGCTCTTGAAACTGGGAGACTTGAGTGCAGGAGAGGAGAGTGGAATTCCTAGTGTAGCGGTGAAATGCGTAGATATTAGGAGGAACACCAGTTGCGAAGGCGGCTCTCTGGACTGTAACTGACGCTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCTGTAAACGATGAGTACTAGGTGTCGGGGGTTACCCCCTTCGGTGCCGCAGCTAACGCATTAAGTACTCCGCCTGGGAAGTACGCTCGCAAGAGTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGTAGCGGAGCATGTGGTTTAATTCGAAGCAACGCGAAGAACCTTACCTAAGCTTGACATCCCAATGACATCTCCTTAATCGGAGAGTTCCCTTCGGGGACATTGGTGACAGGTGGTGCATGGTTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCTTTAGTTGCCATCATTAAGTTGGGCACTCTAGAGAGACTGCCAGGGATAACCTGGAGGAAGGTGGGGATGACGTCAAATCATCATGCCCCTTATGCTTAGGGCTACACACGTGCTACAATGGGTAGTACA
>URS0000E6547F lncRNA from 1 species 
CCATCACCAACACCATGTCCTCCCTGGTGAAGGAGCTGCACTCGGCAGAGGAAGAAGACGAAGAAGAAACAGAGAAGCTGCAGAATGGGAAGGACCGAGGTGAGGAGACAAAGCTGTCTGAGAGCTCTGCAGCATTTTCTGACTCACTCAGGGTTCTCTGGCTCCCTTTGGAGCCCCACCAGGGCCTCTGGGTGCACGTGGGTGGCTCTGGGTGCCTCTGGATCAGATGGCTCTGGACCACATGGATGGCTCTGGATCAGATGTGCTGATGGGGTTCCATGGTGACCTCAGCTGGACACGTGTCCCTGTGCTGGGTCCCATGGTGTCCCTGTGCTGGGTCCCTCAGTGTCCC
>URS000193CF2E rRNA from 1 species 
GTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGCGCGCGCAGGCGGTCCTTTAAGTCTGATGTGAAAGCCCACGGCTCAACCGTGGAGGGTCATTGGAAACTGGGGGACTTGAGTACAGAAGAGGAAAGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATTTGGAGGAACACCAGTGGCGAAGGCGGCTTTCTGGTCTGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGGATTAGATACCCTGGTAGTCCATGCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCCTTAGTGCTGCAGCTAACGCATTAAGCACTCCGCCTGGGGATACGGCCGCAAGGCTG
>URS00011F5F41 rRNA from 1 species 
TACGTAGGGACCGAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCGTGTAGGCGGCTTGCTAAGTCTTGCGTGAAATCTCGGGGCTCAACCCCGAGCGGTCGTGGGAAACTGGCAGGCTAGAGTGCGGGAGAGGAGAATGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCCGTCGGCGAAGGCGGTTCTCTAGTACGGTACTGACGCTGAGACGCGAAAGCGTGGGGAGCGAACAGG
>URS00005015FB rRNA from 1 species 
TCTTCGGGATAGGTAGTAGTTAAGGTGATGGCTTAACTAGCCAAAAATTCTCGTAGTCGAAACTGAAAGGTTGATCGACCACATTGGGTCTGAAAAAACCCCAATGCAAGTTAGTACAGCAGTGAGGAATATTGGTCAATGGCCTAACGGCTGAACTGGCAACTTGGAGAAGTGGTAAGTCTTATTTTGATTAGATTATAATATATAATCTATAAGATTGTATTAATATTGAATAAAGCTTTGTTTATATATTGATAATGACAGTATATATATCGTGTCTTGACTAATTACGTGCCAGCAGTCGCGGTAATACGTAAGAGACTAGTGTTATTCATCTTAATTAGGTTTAAAGGGTACCTAGACGGTCAATATATCTTGTAAAATGTTAGTACTTGACTAGAGTTTTATATAAGAGGGCAGTACTTGAGGAGGAGAGATGAAATTCTATTATACCAAAGGGACTCGGTAAAGGCGAAGGCAGCCCTTTATGTATAAACTGACGTTGAAGGACGAAGGCACAGAGCACAAACAGGATTAGATACCCAAGTAGTCTTTGCAGTAAATGATGAATGCCATAGGTTNAGATTAA
>URS000156E271 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCTTAACACATGCAAGTCGAGCGGAGATGAGGTGCTTGCACCTTATCTTAGCGGCGGACGGGTGAGTAATGCTTAGGAATCTGCCTATTAGTGGGGGACAACATTCCGAAAGGAATGCTAATACCGCATACGTCCTACGGGAGAAAGCAGGGGATCTTCGGACCTTGCGCTAATAGATGAGCCTAAGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCTGTAGCGGGTCTGAGAGGATGATCCGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGGAAGCCTGATCCAGCCATGCCGCGTGTGTGAAGAAGGCCTTTTGGTTGTAAAGCACTTTAAGCGAGGAGGAGGCTACTGAGACTAATACTCTTGGATAGTGGACGTTACTCGCAGAATAAGCACCGGCTAACTCTGTGCCAGCCGCCGCCGTAATAC
>URS0001EFA8A7 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATAGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCGAAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCACGTCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS000127A0CB rRNA from 1 species 
TACGTAGGGGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCGTGTAGGCGGTCAGGTAGGTCCGTTGTGAAAACTCGAGGCTCAACCTCGAGACGCCGATGGAAACCATCTGACTAGAGTCCGGAAGAGGAGAGTGGAATTCCTGGTGTAGCGGTGAAATGACGCAGATATCAGGAGGAACACCGATTGCGAAGGCAGCTCGCTGGGACGTTACTGACGCTGAGACGCGAAAGCGTGGGGAGCAAACAGG
>URS0000123E88 piRNA from 1 species 
TGATAAGTGTCCTCCAAATGGCCAGTGAGC
>URS00015DB2A6 rRNA from 1 species 
TACAGGGGGTGCAAACGTTGCTCGGAATTATTGGGCGTAAAGCGCGCGTAGGCGGCTACTTAAGTCGGATGTGAAAGCCCCTGGCTCAACTGGGGAAGTGCACCCGAAACTGAGTGGCTTGAGTGCGAAAGAGGGTCGCGGAATTCCCGGTGTAGAGGTGAAATTCGTAGATATCAGGAGGAACACCGGTGGTGTAGACGGCTCACTGGACCGTAACTGACGCTGAGACACGAAAGCGTGGGTAGC
>URS00006B5731 tRNA from 1 species 
TCCCTGGAGGTCCAGTGGTTAGGACTTGGTGCTTTCACTGCAGTGGCTGAGGTTCAATTCCTTGTCAGGGAA
>URS0001521DBC rRNA from 1 species 
CCTACGGGTGGCAGCAGTGGGGAATATTGCACAATGGGGGGAACCCTGATGCAGCGACGCCGCGTGGGTGAAGAAGCGCCTCGGCGCGTAAAGCCCTGTCAGCAGGGAAGAAAATGACGGTACCTGAAGAAGAAGCACCGGCTACCTACGTGCAAGCAGCCGCGGTAATAAGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGGGCGCAGACGGCGATGCAAGCAAGGAGAGAAAGCCCGGGGCCCAACCCCGGGACTGCTCTTGGAACTGCGTGGCGGGAGTGCAGGAGGGGCTGGCGGAATTCCTGGTGTAGCGGTGGAATGCGTAGATATCAGGAGGAACACCGGTGGCGAAGGCGGCCTGCTGGACTGCAACTGACGTTGAGGCCCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCCTGTAGTC
>URS0001374C98 rRNA from 1 species 
TACGTAGGGTGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGAGCTCGTAGGCGGTTTGTTGCGTCGGCTGTGAAATCCCGAGGCTCAACCTCGGGTCTGCAGTCGATACGAGCAAACTAGAGTGTTGCAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGATGGCGAAGGCGGCTATCTGGCTCACAAACTGACGATCAGGCACGGAAAGCGTGGGGAGCAAACACGG
>URS00005F7B23 piRNA from 1 species 
TCCGAAGTCACAAGTAGGCAAAGCTGGCCTT
>URS0000A2FBFB rRNA from 1 species 
GACGGAGGAGGCGAGCGTTATCCGGAATTATTGGGCGTAAAGCGTCCGTAGGTGGCTGAGCAAGTCTTTTGTCAAATAGTGGAGCTTAACTCCATAGAGGCGGGAGAAACTGTTTAGCTTGAGTATGGTAGGGGTAGAGGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAAGAACACCAGTGGCGAAGGCGCTCTACTGGGCCATAACTGACACTGAGGGACGAAAGCTAGGGGAGCGAAAGGG
>URS00023F966A lncRNA from 1 species 
CCATTCCAATCACATCTAATGCCTCCCTCGCTCGCCAGAGGTATGCCGACTCTTGCGAGGCTGCCATTAACGAGCAAATCAAGTAAGCATCCATCCATTAAAATCAAAAGCTCCCTTAAAATTTAGATATTAACAGAGGTTGAGGTTGATTTTTGGACAGTGTGGAATACAACGTGTCGTATGTGTACCATTCAATGTACGCCTACTTTGACAGAGACAACGTTGCTCTCAAGGGTCTTGCCAAGTAACTTTTTCTTACTACTACTACTGCCTTTCAATCTTAATCTAACTAAAGCAAAAATTTAATAATATGATAAAACTTGGTTCAGATTTTTCAAGGAATCAAGTGATGAAGAAAGAGAGCACGCTGAGAAGTTTATGGAGTACCAGGTTTCCCTCTCTTTTTTCCCCATTCTAGAAGTTGAAAAGAATATTGATTTGATTTGAGGGTTAATATATGTATGGTTTATGTATATGTGTGTAGAACAAAAGAGGAGGAAGAGTGACACTCCACCCTATCGTCTCCCCTATCTCTGATTTTGAACATGCTGAAAAAGGAGATGCCTTATATGGTATATATTTTTTTTTATACTTATACAAAAAAAAAAAACACTTTCTTTCTTGATTAATAAGTGTATACACAGATCTTGAAATGGTCTTATACTAATCTATATTATTTTCAGCAATGGAATTGGCCCTGTCTCTGGAGAAACTTACCAACGAGAAGCTTCTAAACCTTCACAGAGTATGTTCCCAAAACTTATCCATCTAAAGTCAATCAAATAAGGCATTCACTAATTTTAAAATAATAATTAAAAAAAACAGGTGGCATCAGAGAACAATGACCCACAGTTAGCTGATTTTGTTGAGAGTGAGTTTCTCGGAGAGCAGGTGTGTTTTTCTTTTGTTCGTTTTCTTAACTAGTGACTTGAAACTAGTACCCACTTTTAAATAAACATATTTTTCTCTCCCCCTTAGATTGAAGCAATCAAGAAGATCTCAGACTTCATCACCCAGCTAAGGATGGTTGGCAAAGGACACGGTACGCTGTTTGATCTAAACCTCCCCTATATTCAGTACTAGGACTAGAATTTCAGTAGTAATTTTTTTAGAAAAGCTTATTAAATTTTTATGTGTCTTTTGCAGGAGTTTGGCACTTCGACCAGATGCTTCTGAACTAGAGTGGGACCTCTATAAGTTCACTTTATGCTCTGGGGAGATTAAAAGAGAAGTAAACAGAAGAAGATTCTGTAAAAGTTGCTAGAGTGGAAGTTATTATTGGAGCAAAAATAAGATTTGTAGTACTAATAGTAGTAAGCTTTGTGTGTTAAGATGATGGGTTTTTTTTTGTAATAATTTCATAAGTTTAATCTATGAAGGTGGTTTTTGTTTCATATTTTCATGTTCTGACTATATATATGAACAAACGGAGACTTGAGTCCGATTAATAGGTAGAGAAACACTCTAACTAAACGCAATGCTGCAATTCAAAAGGTGAAAGAAGAGTTAAAAAAAAATAAGGAACCTGTGGATGAAGAACATGAAGCCTCGGTCACTCAGTGAGATAACTGAAAAGCAAACAAAGAAGAGTTAAAAAGAAAAGATATATGAATTGAGACTTTAACATAAGTGCAATGCAAGTTGTTTATATTTCCAAACAGTATGTTTGATCCAGAGCTAGTATCTGATGCCCTAACTTAGATTCTATCTTGAACACTAGACTAGACAGTCTTCT
>URS000010D699 rRNA from 1 species 
AGGACGAACGCTGGCGGCGTGCTTAACACATGCAAGTGGAGCGACGAACCAGGGCTTGCCCTGGGGCAGAGCCGCGAACGGGTGAGTAACACGTGGGTTACCTGCCTCGATGACCGGGACAACCCGAGGAAACTCGGGCTAATACCGGATGTGCCCGCAAGGGGAAAGGAAGCTTCGGCCTCCGCATCGAGATGGGCCCGCGGCCCATTAGCTTGTTGGTGAGGTAACGGCTCACCAAGGCTTCGATGGGTAGCTGGTCTGAGAGGACGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGGGCAGCAGTGAGGAATTTTCCGCAATGGGCGCAAGCCTGACGGAGCAACGCCGCGTGCAGGAAGACGGTTTTCGGATCGTAAACTGCTTTTCTCGGGGACGAGAACGGACGGTACCCGAGGAATCAGCCCCGGCTAACTACGTGCCAGCAGCCGC
>URS00002998B4 rRNA from 1 species 
GACGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGATGAACCGGAGCTTGCTCTGGGGATTAGTGGCGAACGGGTGAGTAACACGTGGGCAACCTGCCCCAGACACCGGGATAACCATTCGAAAGGATGGCTAATACCGGATACGACCACTTCGGGCATCCGATGGTGGTGGAAAGGATTCTGGTCTGGGATGGGCCCGCGGCCTATCAGCTTGTTGGTGGGGTAATGGCCTACCAAGGCGACGACGGGTAGCCGGCCTGAGAGGGCGACCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCGCAATGGGCGAAAGCCTGACGCAGCGACGCCGCGTGAGGGACGAAGGTCTTCGGATTGTAAACCTCTTTCAGCAGGGATGAAGCGAAAGTGACAGTACCTGCAGAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCG
>URS0000E6E834 lncRNA from 1 species 
GCAGCAGCAGCCAGCACAGTGTCTTTGGCACAGCCCAGGCAGACAGGTGGAGGAGAACTGAATCCTGCTTCTTGACAGCCCATTCTATCAGCCTTCATCTCCAACTTGTTAAATTTCCAACAAGTTGCTTCGTGCTCTCCTTTATCCACTGCCCCCAAGCATGGGAGGAGTTACTGCAAGTAGCCACAGAGCCACCTTCTGTTCTCCTGCAGCTTCCTCCTGCAAAACCCAACCACCAGTCCAGGAACACAAATATCAGCCAGAAGTGGTATGTGATTGCTTCCATCTGATTTGGAGAGGAATTGCTTTTCCAATAGTGGATGATTTGATCCAGAACTGGAGAACCAACCTGGCAGTCAGCAGCTTCATGAGACCAAATCTGACCCAGGGCCTCAGAGCTCTGCCAGCTGCAGGCAGGTGATCACAGAAGCTAGAACAGAGCAAAACAAAATTAAAAAAAATCCATGAACTAAGTGTAGAATCCATCTGAATTCAGCAAGATGGGCTGTAACAGGAGAAGTTTTATTTATTCCTTGACCTGAACTCAGCTCACACCCATCAAAGTGACAAAAGGTGATAAATATCCTTTGGGGTTCCAGGTAATTTCTTCCCTTCTGCTTTACCTGGCAGGGAATGTTTTTGGAAGATTAATGAAATACCCAGAATTTTGTGCATGTATATGTGTGTGCGTATGTGTGTATAGCTATTTATTTACTTACTTATATCTATAAACCAGCATTTTTCATGCAAACTGAGAATTCATCGACATGGTATTGTTCTTGTTGCAACCCAGGGAATTAAAGGATGCCGACAATTAATGGAATCACAGAAGTACAAGATGGTTTGGGTTGGAAGGCACCTTAAAGCTCATCTTGTTCCACCCCGTGCCCTGGGCAAGAACACCTTCCACCAGACCAGGTGGCTCCAAGCCATGGAACATACGCAGAGCTGGGGCAGACACACATGGGGGCACAAACACAGCTTCTGGTTTTTATTTCACAGTTCTGAGTTGTGGGTCTGTTTAGGAGGAAATAACCCCCCACACACACAGTAAGTGCAGGGTTTTCCAGGCCCCCTCCAAACATCCCCTGCAGGCTCCCCCTGATCATCCCTGCCAGGCCAGCAGCCCACCCCCACTGCTGTATTCAGTGGTACCAGGACACCTCCAGCTCTGTATCTGTGTCCTCCTGTTCTCAGGGAAACCCATGAGGATCAGTTTGCTTTTGTATCAAATTTACTTCTTTGCTGGTACCATTTTCTCTGCTTACTCATAAACACACCGAGCACCACAAACACTTTGGAAACTCAAATGACTCCTTACTGTGAAAACTGGGAGCAGAGCCTAACCCCCATCTGGGTGCACCCTCCTGTCAATGAGAGCAATGGGAGAGTTCTTCCAAATCAGCCCAGCTGAGCACAGGTGTTTCCTGATGTCCCTCCAAACCTGCAAGATTAATTTTCTGCCCATTTAGTCCTTGTGCTGGCAGTGGAGATGTCCTGGTCACAGTTTTTAGATGTCTTCTCTAGACTGAGGAATCAGAGTTCAGGCATAAACCACCTTCTTTTGGGACATGAGGAATAAAACTTCCATATCCGCAGCCCA
>URS00019739F1 lncRNA from 13 species 
ATGCAAGGTATCTGTGGAAGCCTGAAGACGCCAGAATTTTGTCTGCTTGTAATGAAGGTTTCAGGTCTTACAGATCCCTCGGCAAAGTCCATGCCCCCTAGCTACCCACAGTGTGACACTAGCGCTCTACCGTCTAGTTATGTCAGCATCACAGTAAGAATGCCCTCGCATCCGAACCATGATGGGAAATCAGCTGGCCACAGCAAGGCTGGAGAACCCTGTGTGTGCAGTCCTGCAGCACGGCCTTCTGAAGGCGCACCTCCTGCAGAGGTGTTGACGGGAAAGGCGAGGAAGAGGGGATAATGTGACCTGCTTTCACAGGAAGCTTCAGATCATTTCCCTTTGTCTCTGTGCCCCTTTGGGAGATTTTGATCCAATTTGCTGTGGTGAGAAGAAGCTCTCGACATTACAAGAGAAAAAAAAAAAACCCAAAACTTTCATTTTCCTCCTAAGAAATGAAATTTTATTTCTGGATGACAAGGGCTTTGGAAGGCCATGGTGTGGTAATGAGTGACCCTTTCATAGCTGTTGAACATCAGTAGGCGACACATCCAAAGTATAGAGGCAGCTCTTAAAATACCAGCTAAAGGAAGAATTTAGAGAACAGAATGTCTTTAAGGAACTGTGCGAATGTTATTGATTCTTTCAAATAATGGTGTAACCTCTGTGATACAGCAACAATCTTCATGAGCTGTATTTATAAGGAACTGAGCTCATGAAGACAGCATGGGGGGTCTGGCGATGCAGGGCCCTTTGTTAACCATTGTTCTATTATTAGTATTGTTAGCATTGCCCTGCACAAGTTATCCACTTTTTCTCCAGCCCCCTGGGTATTCAGCAGAAATGATTTAAGAATGCCTGTAACAGCTGGGTGCAGTGGCTCACACCTGTAACCCCAACACTTTGGGAGACCGAGGTGGGTGAATCACAAGGTCAAGAGGTGGAGACCATCCTGGCCAACATGGTAAAACCCCGTCTCTACAAAAAATTGAAAAAAAAAAAGTTAGCTGGGCCTGGTGGCGTGCACCTGTAGTCCCAGCTCCTTGGGAGGCTGAGGCAAGAGAATCACTTGAACCCAGGAGGTGGAGGTTGCAGTGAGCTGAGATTGTGCCACTGCACTCCAGCCTGAGTGAGAGAGCGAGACTCCATCTCAAAAAAAACAAAGAATGCCTGTAACTTAGTCTCCTACTTGGCATCACCTAAGAGTTCAGGAGTGCAGTGACAGGTTAACTGAGCTCTTGCAGAAAGGTGCTGTGGACAGCGAGGTATAAGTCAGAGGAGTGACATGTTCTATGATGGGAAAGAAGAAAGCTGAAATCCCAAGGTGCTCCCTGACATTTGCCACTCACATAAACTGATGAGAGAGTTTGTTATTAAAGGCCTTTTTGTTTAATTAGAAATCAAACCAGAAGACCCTGGTGTCATAATTTATTCTCTTGCAAAATTATGTGATCAGAAGTTCCAGCCATAACCACAGAGGCATTGGAAGTTGGTAAATGATGCTCTGACTCAAAAGCTTCAAAGACATAGGAGGGGCAGAGGGAAGGAAATGTATCATTAATAAACAGCCTGAGCAAGTGGGCA
>URS00014F887F rRNA from 1 species 
TACGTAGGGTGCGAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTCTGTTGCGTCAGGAGTGAAAACCCGGGGCTTAACCCCGGGCCTGCATTCGATACGGGCAGACTCGAGTGTGGTAGGGGAGACTGGAACTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAAGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCACTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS00019CB411 rRNA from 1 species 
GGCTCAGGACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAACGCGTTTCCGTTATTGATTTTAGATGCTTGCATTTAAATGATTTAACACGAAACGAGTGGCGAACTGGTGAGTAACACGTGGGTAACCTGCCCTTGAAGTAGGGGATAACACTTGGAAACAGGTGCTAATACCGTATAACAACCAAAACCACATGGTTTTGGTTTAAAAGATGGCTTCGGCTATCACTTTAGGATGGACCCGCGGCGTATTAGCTTGTTGGTAAGGTAATGGCCTACCAAGGCAATGATACGTAGCCGACCTGAGAGGGTAATCGGCCACATTGGGACTGAGACACGGCCCAAACTCCTACGGGAGGCAGCAGTAGGGAATCTTCCACAATGGACGAAAGTCTGATGGAGCAACGCCGCGTGAGTGATGAAGGGTTTCGGCTCGTAAAACTCTGTTGTTGGAGAAGAACAGGTGTCAGAGTAACTGTTGACATCTTGACGGTATCCAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGTGGCAAGCGTTGTCCGGATTTATTGGGCGTAAAGCGAGCGCAGGCGGTTTCTTAGGTCTGATGTGAAAGCCTTCGGCTTAACCGGAGAAGTGCATCGGAAACCAGGAGACTTGAGTGCAGAAGAGGACAGTGGAACTCCATGTGTAGCGGTGAAATGCGTAGATATATGGAAGAACACCAGTGGCGAAGGCGGCTGTCTGGTCTGTAACTGACGCTGAGGCTCGAAAG
>URS000065A135 ncRNA from 1 species 
TGTCTCCTCCAACTGATCAAATATTGGATTCAGCCCGCTGCCGCAAGGAAGCGGGCTTTTTTTT
>URS00000A33BD rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTAGAACGCTGAAGGAGGAGCTTGCTCTTCTGGAAGAGTTGCGAACGGGTGAGTAACGCGTAGGTAACCTGCCTCTTAGCGGGGGATAACTATTGGAAACGATAGCTAATACCGCATAAAAGTCGACATTGCATGATGTTGACTTGAAAGGTGCAACTGCATCACTAAGAGATGGACCTGCGTTGTATTAGCTAGTTGGTGAGGTAACGGCTCACCAAGGCGACGATACATAGCCGACCTGAGAGGGTGATCGGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATCTTCGGCAATGGGGGCAACCCTGACCGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAGCTCTGTTGTAAGAGAAGAACGAGTGTGAGAGTGGAAAGTTCACGCTGTGACG
>URS000054A298 rRNA from 1 species 
GCTCAGTAACACGTGGATAACCTGCCCTAAGGTCCGGCATAACCCCGGGAAACTGGGGATAATACCGGATAAACCATAGATACTGGAATGTTCTGTGGTTAAAAGTTCCGGCGCCTTAGGATGGATCTGCGGCCTATCAGGTAGTAGTGGGTGTAAAGTACCTACTAGCCGACGACGGGTACGGGTTGTGAGAGCAAGAGCCCGGAGATGGATTCTGAGACATGAATCCAGGCCCTACGGGGCGCAGCAGGCGCGAAATCTTTACAATGCGGGAAACCGCGATAAGGGGACACTGAGTGCCAGCATATTATGTTGGCTGTCCACCTGTATAAATCACAGGTGTTAGCAAGGGCCGGGCAAGACCGGTGCCAGCCGCCGCGGTAACACCGGCGGCCCGAGTGGTAGCCACTATTATTGGGTCTAAAGGGTCCGTAGCCGGTTTGATCAGTCTTCCGGGAAATCTGACAGCTCAACTGTTAGGCTTCCGGGGGATACTGTCAGGCTTGGGACCGGGAGAGGTAAGAGGTACTACAGGGGTAGGAGTGAAATCTTGTAATCCCTGTGGGTCCACCAGTGGCGAAGGCGTCTTACCAGAACGGGTCCGACGGTGAGGGACGAAAGCTGGGGGCACGAACCGGATTAGATACCCGGGTAGTCCCAGCCGTAAACGATGCTCGCTAGGTGTCTGGGATGGTGCGACCGTTTCAGGTGCCGCAGGGAAGCCGTGAAGCGAGCCACCTGGGAAGTACGGCCGCAAGGCTGAAACTTAAAGGAATTGGCGGGGGAGCAC
>URS00002125CA piRNA from 1 species 
TGCGATAGATATTGCTTCCTATCCTGGGCT
>URS0000BE8870 snoRNA from 1 species 
AGGATCAGTGATGAGGACTGGTGGCGAACGAGTCACAGAGATGACTACACGTCTGCGACTCTGAGGTCTAT
>URS0001BC925D snoRNA from 16 species 
GUCGACGUACUUCAUAGGAUCAUUUCUAUAGGAAUCGUCACUCUUUGACUCUUCAAAAGAGCCACUGAAUCCAACUUGGUUGAUGAGCCGAAGAACCUUUGUACCCAAGAGUGAGAAAAAAGAAUGUAUUAUUAGCUUGGUCCACAACCCUUAGCGGUUUGGCCAUCUACUCCCACAUUUUUGCUUUGCCUUUUGCAUAUGGUUUGUGUAUGGAUAGAGAACUUAGCUUGGUGGUUUAGAAGUAGGAAUUUCGAUUCUAUGCUUUUUGAACUUACCGGCUUUUUUCUUGUUUUAACUCCUGCAUGAACCGCCUUUUAAUUGGCGCGAUGAUCUUUGCCCAGUUUGUGGACUUCUUCGUGAGGGGACAAACGUAUUGGGUGGGUACAAAUGGCAGUCUGACAAGU
>URS000199981D lncRNA from 1 species 
TTTGCAAACATAATTAAAACACAGACATGTTCACTAATACTATCTAAAAACATACAAGTGTCGTGAGTCTTTATTCACTTACTGTATGCTTGTTCTGTACTATTGCCACTTCCTATGGAGTAACGTCCAGTAGTAACACTGGCACATGGCACCTTCTCTGAGTCAGACTTTTATAATCAAAGTTGCCAATACAATGCCTGAGGTTGATAAGTAAGATACAGGGTTCTTCTTCTGAGTTATGTCAGTGGCTGTATAACTCTAAATACGAAAGAGATGTTTTACAAAAAAACAAAGGCAAGTGTTTTACATTAAATCTTATAAAACTGTACATAATAAAAGTCTACAACATGAAAACGGCCATTAAACTGTTGTGATAGTTACGAAATGTAGTAAATATAACAATGCTAATGTTTCATGTATTTATCATTAATCACTGTATTCATACAGTGCTGTTTGTATATATAAATATTCAATGGCACTGTAAACAGGTGTTGGAAAACACACATTTACTCTTAACCCATTAGAAGTTATTGTAGTACTTTTTAATCCAAAAGGTCAAAATGCATTAATGCATCATTGATTTAGAAAAATAGCCTTGTACTATGATGCACATTTTGACATTTTCTAGGGTAGCAATCAGGATGAAGCATAACAAAGAATGCCAGATTTCAGACTGGTTTACATTTACACCTACCATGACACAAAATTTTAAACATTAAATGTCATTAAATAATACACAGTTTATAAAACAGTTGATTTCAGAGATGCACAATACACAAAAATCTAGTTAGTGTCTAATGGGAGTTCCCAATAATTTATATCTCTGGGACCTTTATGAGAAATTTAAGTCTGTTTCTCTTTACCATCACGTAGGCAAAGTGAGTTTGAATTGAATTACCTTTTTCTTAGTCTGTACAGAGCTGCATTCAACTGGATAAAATATGCTTATTCATGTTTTCCACTGCTGGACATTCATCCAATAAGTCTTGAGCATATGCTTAAGCATCTGGTAATGGCATTTTGTGGGGCAAGGAAACTCACTATCTCTATCCCTCAGTAAACAAAGTGGTTCTAATTTTATCCATAGTTAAGGCAACTATACTGATATATTAGACACACCATATGCTTTTATGTTGCTGCCTACAATCTAAACGGTAAGAGCGAAAGGAAGTTTCAAACATGCTTTGATCTTCTTGACCACTCAGGAGTTTCATC
>URS0000E66266 lncRNA from 1 species 
TCAACTTGTAACAGGTGCAGCATGTACCTTCCACTTCTTTTATTGACCGTGAATTGTCAAAACACAACTGCAGCATGATTCCGAATCAGGGCACGAGCTGGGGATGAAACCTTCACCTTCTTAGGAAGAAGATGAAGCCAGTAATCCAGAGGTCACCTGGTATGTGGGCCTTCTGATTTAAAGGCTTCTTTTGGGTCAGGAATTACTGGGGAAGCCATACGGAGTTAGTTACTCCACACAGAACTGAGAAGAGGTTTTGGACTTCCTCTTACAGCTGAAGTTTCTTCAACCCAGTTGTGCTGTTATTTAATTAGCATCGCCTAGGAAAGTCTGGTATGAAGTCTAAAATGTGTCTGAAAAGTGTAACCTTTGCATGTGCCATTGTAAATG
>URS000194BC91 lncRNA from 1 species 
CCAGGGCCTGAACCCATGCCACAGCAGTGGCAATGCCAGATCCTTAACCACTAGGCCACCAGAGAACTCCCTTTTACTTGTTTTTTGGCCAATGTTCCAAGACATTAAAGGGTTAATCCTCCTAATTGAAGCTGAGATCTTTTTTTGTGGCATCATTTTTGACAAGAGAAAGTCCTCTAAAAAGGACTTGTTGAGCGTTAGGAGGTCTCCTCCTCAACAGCGGTAACAAATGTTCCCTTTGTTATAACTCGACCTCCAATTTTCTCTATTTTCAACCCTGCTATATAGACAGGAAAATTCCCCCAAGTAATCATCATGATGCTCTTTCAGATCCAAACTCCTTGGGCCTCTTCTCCGCAAAAAGTAACCTGGTATGAATTGTCCTCTAGAACAAGGTTAGAAGGGTAACTTGAAACCCAGTTGTACAAGAGCATAGAAGCTCCATGCCCTTTCTGAATAAAATTATAAAGACTTTAGATTTGGTACAGCCATACTGGAAGCCCTACTCCCGTGGGTCCTACTCCAGCGAAAGTGCCAGGAACTACAGACGTCAGCCCCATGTCCCTTGGTTGCATTGCAGCTAATTATTCACAACAGCAAAGAGGAAACAAAGATTTACTCTTTTCCTGAAAGTCTCCACCCAGGTTCCTCAAGAATCTTGAAGCGCCTTGTAGGTGCCTTGAATCCCGAGGCCAGCAGTGGCTATGCTGAGCTAAGTGATATCTTGGTCATCCTTCTGATCTTCCCTGGCTCTGTTTTAGTCCAGGACCCAAAGGCCATAGAGCTAGTGGTATTGAAAGAGCCAGGAATGACCACGAAGGATGCCCCGCTCCTAGGCTGCCTTCCTCCTTCTCTCCCTCTTTCTTGTTAAAATCTAGTGAACTACATAGATATTCTTCTATGGATATCTTGAAGGCTATTCCAGATATTCCTGAAAGGCTTTCCAATCAGCCCTGCCTACCCCTCTAATCTCAGTCTCCTGTCCTCCAAGTATTTCACCACTCAGAAATGTCAGACTTCCCCTTTCTTGGTGCATTTTAGGGATTTTTCGGTATCCCAAGGGAGGGATTCTGCACAAATCTCTTCTTCTTTTCTTGATTCCTAGGATGCCTATTCCTGGTTCAGCATAGTACAGGCTCAGACAATGGTACTCACTGTTGGACCGTTTATTTATAGCAGGTTGAGTATGAGTTGAGACATTGGACAGACGTGGCATTGGATCCTACCTCTTGTGACTTGCTAAGTTTGGGAACTAGGGAAAGTTATTTAATTTCTATGGACCTCATTTTCATCATTAGTAAAATGAGAATCCTTATGGCAAGTACTACTTTAGGATTATCGTAGTACCCGACAGACAGAAGGTTTCAATCCAGCTGTTATTAAGGGTCTGAAACTTGGAGTTCCCATCGTGTCGGATTCGTTAACCACTGCGCCACGGCGGGAACTCCAAAAATGAGTGATATTACTCCAAAGTTGCACACTTCCCCTGCGGCCCCTCATGCCAGGCTCCACTGCCTTGGTGGGGGCCACCTGCTCTTCTCAGGCCTGAGCATGGAGACCACCAAAAATGCCCCCTCACACCCTGCTCTCCCATCCTTCCTCTGAGCCCACTTTTCCCTTCTCTTCAGCTGAGGGAACTTCAGCCACTCACAGTATCTTAGAAGTATCTTTCACAACAAATAACAGTGCCTTTGAGAAGAGAGAACCCAAAACACTTTCCCTCATGGGTCTTTAAAACAGTCATTGGCTGTACCCACAGCAGGTGGAAGTTCCTGGGCTGGAGATCAAACCTGGGCCACAGCAGTGACCCAAGCCACTGAACTACAACCCTGGATCCTTAACCTGTTGAGCCACAGGAGAACTCCTAAAACACGATCATCTTCATGATCACGGAAGCAACATCCTCCACTATCATTTGCTATTGAGTGAACTAACATACATGAAATAGTTCTTAGGGCCTGACACATATTCAATGGGCATATATAGTACATATTAGCTCTTACCACTATCATGGGATTAAGTACATACTAAGTTTCAGGGTGCTATGCTGAATCCTTTCTATACCAAATCTCCTTTAATTGCTGTAAGAACTCCATGGGTGGAAGATATTTTATACCCATTTGAATTATTTACTTACTTAAAAAAATTTTTGGAGCATTTTATTTTACTTATTTTTATGGAAGTATAACTAATGTATAATATTATGTAAATTATAGGTGTACAATAGAGTCACAATTTTCAAAGGTCATACTCCATTTTTAGTTATTATAAAATAACTATAATCCCCATGTTGTACAATTAGTCCTTTTAGCTTATTTTATTTTATTATTTTTTGACTGTGTCCATAGCATGCGAAAGTTCCCAGGAGGGAACCCCATCCACAGCAGTGACAATGCCAAAGCCTTAACCACTAGGCCACCAGGAAACTCCAATTATAGCTTATTTTACACCTAACAGTTTGTACTTCTTAATCCTCAACCCCTTTCCCTCTCCCCACTGGTAACCACTACTTTGTTCTTTATATCTGTGAGTCTGCTGCTTTTTTGCTATATTCACTAGTTTGTTGTATTTTTTAGATTCCACATATAGGTGATATACAGTATTTGTCTTTCTCCAACTTATTTCACTTAGCATAATTCCCTCCCAGTCTATCCATGTTGCTGCAAATGGGAAAGTTTCATTTTTTTTCTTATGGCTAAAATATTACCTTGGAATACCCTTCATCTGTTGAGAGACACTTAGATTGCTTCCATGTCTTAGCAATTTTACACCCATTTTACAGATGAGGAAACAAGATGGTAAGAAGTCAAGTGCCCAAATTCATAGTGTTGATTCATTCTAGAACTGAATTCAAACCCAATCTCCACAGACTGTATTGTCTATCCCCGACGTCAACTGTGTTTGTGTTTAGGTGGGAATGACTTATGGGCAGTCTTTGAAAAAGACTGGGGAATCATCAAGCTGAAATGTTCTCTTGGATTTAAAAATTCTGTAATGAAGACTTAGATGGTTTACTAAAGGAGAAATACATCTGGGTTGGGGGGAGAGGAATAGAAGCAAGGAAGGAGAGAAGAAACATTTATTAGGTCTCCCAGTTGGCTTAGTGGTCAATTCAAACTTTATTTATTTGCTTTTTTTTAGGGCCACACCTGCAGCACATGGACGTTCCCAGGCTAGGAGTCGAATCAGAGCTACAGCTGCTGGCCTATGCCACAGCAACACCGTATCCTTAACCCACTGAATGAGGCCAGGGATCAAACCCACATCCCCATGGATACTAGTCAGGTTCATTTCCACTGTGCCACAATGGGAACTCCCCAATTCAAACTTTAAATCCAGGTTGGTCTCACCTCAGAGCCCAGCTTTCTGCCAAGGACTCCAGAGTTGTACACTTGTGCTCCAATTCTATAACTCCACTGCAAGTAATTTAACAATAATTTCATATTTTCCACTGAGACACTGAAACGTCTTATTGAAAGAGGTCAGGGAAGTCGCTTCCCCAGAGCAGAGTTGGAGAGACAGCTAGACAGTGGCACTGGGGGTGGGGGTGGCTTTCAGTGCAGAACTACGCAGAGGTGTGAAGACGAATGAGCTGGCCTTTTAGGTCTTTTCCAGTCCCCGAGCTCCAGGATTTATTTGGCCATGAAAATGTCAGGCTTTTTCTTCCATAAAATGATGTATGATGGTCTGAGTACATTCCCCAATCCCACCCCCACCTCCTCATATCTGATTAAAAAGCAAAGATTAAATCACTGAAAACAATGGAAAGGAAGGTTTTTCTCCAAGAGGGATGAGGTTTTCCTGAGACAAAGCAACAGGAGGAGCAGAGGGAGTACAAAGGAAAACGCAGGGGTCTGGGAGGGACAAGCTGAGCATAGAGCAGGTGGATGGATCCAGCAGAGAGTGGGGGCTGGGACAAAGGCCAGTTGCAGTTGGGTTATGAGGGCTATCAGCTTACATTAACCAACAGGCATGGAGTGGAAACCAGGGCTCTAGTTATGCAAACCAAATGAATGCATTTGAACAATTTGTGAACCATGTTTTTTATTTTTATTTTGAAAATTTTTTCTTGATATAGGATCTCAGTTTCCAGAGAAAGGACTGAACCTGGGCTGCAGGGGTGAAAGCACTGCATCATTATGACTAAACCACCAGGGAACTCTCTAGAACCATCCTTTTTTTGTTGGGTGTTTAGGGTTTTTTTTTTTTTTTTTTTTTTTTGGCTGGCTAGCAGCATGTGGAAGTTCCCAGGCCAGGGATCAAACCTGCAATCAATTGAAGTTCTCTTGTGGTGCAGATCTTTCACTTACTGCACTGCACGAGAACTCCTAGAACCATCCTCCCCCCACCTTTTTTTCCCCCCAGCACATGAAAGTTCCCTGGCCAGGGATCAAACCGGAGCTGGAGCTGCGACCTCCACCACAGGGGCAGCAACTCCAGATCCTTAACCCACTGTGCCAGGCCGGGGATTGAACTGGTGCCTCCACAGAGATAAACTGGATCATAATGCACTGTGCCTCAGCAGGAACTCCCTAGACCTATCCCTTTTTACCCAGGAGATATGAGGTCAGCCTTGAATCAGAACTCATTCATTCAACCAATACTCATCGCCGCCACTGTACCAGACAGAGTTCTGGGTTTGGAGGATACAGAAATGACCCAAGCAGTTCTAGTTCACTGCCTTTGGGAAGAGAGAAAATAAACACCACGATCAGTAGTAAAGCATGTGGTATTCTAGTTAGCATCAGGGACTAAGTAAAAAATAAAGCAGAGAGCCCAAGAGGAAACATCGGCGCAAGAGTCGGAGGTGGTAATGTTTGGGGGATTTGGCCAGGCATGATGCCTGACTGAGGGGGTCAGAGCAGAGGAAGGAAAGGACAGGGTGCTGATGACAGTGGGGCAGGAGGGTCCTAGGCAAGGGAGGGACAGTCCAGGTCCTGGGGTGGGAGAGGACCTGGTGCCTGAGAGACAGTGAGGACAACCAAGTAGCTGGGTAGGAGGTGGAGTCACAGAGCTCACAGGGGCCAGATCCTGCAGGGCACTGAATATACCTGAAAAGATTTTAGCTTTCAGATCCAGGGAGATGGGACTGCACCCTGGGAAAGGTAAAGCAGGGAGACCACCTAGGATGCTGTTGCAATAATCCAAGCAAGAGATGATGTTGGCGTAGACCAGCTGTAGTGGTAGCAGAGGTGGAGGAAAGTAGTTAATGTCTGGATATGTTAAAATGCTAGGCCTTCAGGGGTAAAAAGGAAGACAAGCCTCAGGAAAGGAGGGAAGCTCTTGCTAATGATCTGCCCTTAATACATCTGCCACCGTTTGTCATCTCAGCAAAAAAAAAACCCTGGAGGCTCCATTCAGACTGACTGTGCAATGGGACTCACTCATGCGCTTAGCTGGTTTCCACTGAGAGTTGGGACAAGGGGTTGTATTTTCCATATTTGCAGGTGACTGACTTCT
>URS000240C156 lncRNA from 1 species 
GGGATAACTATCACTCCTCCATAATTGAATTCGGTTTTCATTTGTTTATTTATTTATTTTTTTTCCCACCTGTGGCATTGAGTTATTGATAATTGTCAAGTACTTTTCGGATTTGTATAATAATATAATTATTAATTATTATATGTTGGGGAAGAAGTTGTCGGTAAGGTCATTGTCTTAGTAACTTAAATGAGTTTTTAAGCAAAATAAGGACAAATATTTGTTGCCAGTGGTACTGATAATTTATTACAACTTTCATATACATGTATCTTTCATTGTTATAATAATCGCAAGATATTTCACACTGCTTGTTAATACTATCCAAAGAGTTGTTGACTCAAATGACTCTAAAACAGAGGTCTAAAGATGGATACACTACTTGATATATTTATTAAATTTTTTTATTTATTAAATTTTTAGTTTCTATTCTAAGATCCTAATTGATAAGAGTAATAAATCTTCATATTATTGTAAAACAGTGAACTAGCAGAGTATAAATGATAAAAGCAAGATCAATTCTTCACTACTGATTAATAAACAGATATGTAGATTAATTTTTTAAGTTGAATATTCGAAATTTCAACTAAATTTTTTCTTATTTAGTTAATTTTTTCCTGTTAAGCCAAGTGGGGGATTATGGTCAGTTAGTTCTTAATTTAAACTTAGAATCCCCCCCCCCCCCCCCTCCCCTTTCTTTAGCTTTCCTTTTTCAAGCTAACTAAAGATGCGAAGTTTATTTTGCCTTCTTCTGTTTTGTGGTGGTCCAGATTTGGTTTAGGTATATTGATTGAGAGTTATATAATTGTATAATTTTTGTTTGAAGGTATATAAATTAAGGACGCGTGCGATGTATTAACAATAATTTTTTGAAGTTACATTCGTTGTTGGTCGTTGATTGTTAAATGATAAATCTTTCCCATCAAACACTTTGCTCAGCGTCCATGCAATTATACACGAACGATGACACTTTTATTTTATTTTTTCTTTTTTATTATTATTATTTTTGGACCAATTAAGTTCATTACCCTAGTATTTTTAGCAAGACTTCGGTTCATACTTTGACTGGCAAAGAATTTTCAACTCAAATTTTAAGCCTAAAACAGAAGACCATTAACCCAAAAGAAAGAAACAAAATATGTTTCAGGAATTTGGTTAGATATCACAATCAAGTTATTATAAATATAATTTACTGGAGGGGCAACATTATCAGAGTCTTGAGTCATGGAGAAAAGCTGTGTCTGATATTTGATAATTTGAAAAGCAGGTATTAATTCTTTCCGTCCGAGGGTAACTAATACGGCACAGAAATTTTATTTTATTTTCTTTAAATATTATTATTTAACATTCAAACTCTTCATCCCTGATGACTTAATTTTGGGCTGGTCGGTTTCTAGATACAAACTATATATGGCATGTGTTAATCACGGAATAGTCTTCATGCAAATGGGAGACGTTCACACGGGAGCGGAGCCCACATTAAAATTTTAGGGACACAATTCTATATCACAAAATTTTAAAGAGTTAAAAAAATGGACTTAATTATTGGGTTAAACTGTTGAAATATTAAACTTGCATGATTGCATCGGTTAAATTATAAAAAAATCTCTCTTTTAAAAGTTAAATTTCTAAATTTATCATATATGTAAACTAAGTTTTTTTTTTTTTCTAAGACCAGCAGCAGGTGCCATGGCACCTAGTAGTTTTGCGGCAGCTCCGCTCCTGCTCACACACTTAGGTTACTTCTAAGTTACAGCTACTTTTTGTTGCAGACCATTTGTATTTTTATTTTTTAACATATTAAATTACAATCTAATAATATTCTAGTTTATACTTTGATAGTCTGATCATATGTTTCTTTTGATGAGTAAGAGACTTACTATGACCTCTTGACAAGTTTTACAATTTTCCCTCCTCCTATTGAGATTTCGGAGCAAAAAAAAAAAAAAAATCCACCAATATTTTTGGAAAAATAAATGTATTATGGATTAGATGGCTAATGTCAGTCTTATTTGCGCTTCTTTAACTTAAGTAACACCCTTTTGCAGCCTTCCCAACAAGGGTGCTGATACTTACCCTAAGTCAAACCCCGGACATTAGCGAATGACACATTTTTTTATAAAAATTACAACACAATTTTAGTTTGGATCTTTATAGAAATTAAAAAAACAAAAACTCATTTTCCTTAACACAATTCAAAAGCAACAAAACTCAATATACTGCTGCGAGTAACCAACCGTGGCCAAGCCACGAATCCCACTGTACCACTGCGAGCAGTCATATTCAAGCCACGACGTTTAAAATGTCTGTGCCTAGCTGTTCTAGCCACTGCTACTCGTGTAAGTTGAACTTGGGATTTTAAATATTTTCTGGAATTTTATGATTGAATTTATTATAGACTAATTCAGAGTGTTATTAGCATAAGAAATCTCATGGGAGTTCAAGAGAAGTTTCTTGTGCTCATAAAATAATTGGGATAATTAATTAATAAAACCAAGAAATTGCATACTTTTATGTTGTTATTTTGCAGTAGTTATTTTAAATATGATTTGAAAAAAAATTGATGTAGTAATGGAGAATTTGGAACAAGTGGATCAAGTCAAAGAATTGGAGGAATTGGAGGCATTAGACGAGTCTGATTTATAAGAAAATATTGAGTAATTCGAGGAGACCGAATTTGATAACAATGAAGATGTGAAAGAAAAAGTTGCTAAGCCTCAGGTTGGGGTGTGAAAGAAAAAGTAGCAGTGGCAATGGTTGATTTTGGGGTGCCGCTTTGTAAGTGGCCGTGGTTGTCGCGTGGTGGCTGTAGGCAGTGGCAGTGACAATGGCTGTGGTGTGGTGGTTTGGGTGATTTTGGGAGAGTGCTTGTGCTATGTGACTCTGGGGAGTATACTTTCTGCTTTGTGGTTGTCATTCACAACCATAAAGAATAAGAAAGTTTTTTATTTTATTTTATTTTGATATTGCTAAAGTTAGACGGTGCATTTTCATCCCAACAATAACTTTTGTAAAATTCTTCGTTTTGCGTTGTTTTACCTCTTAGTTTTTTCTGTTTGTATTGTTTGCATTTTTATATGCTACTTTTATCTCTCTCTCTCTCTCTCTCTACAAGGTAATTAGGATCATTACATACTCCTCTTATTTAAATGTTTTTTTTCCACTTTACTTTAATAAACTTCCCTTGTAGAGTTAAGATTTCACTAAAAAATTACTAATATTTATAGTCTGAAATTTGTTGTGGTTTTGTCTTGATAATTGTTTTTTTAACGCAATAAGATTTTGTCTCTAATACTTCGAAGGAAGTTTTAATAACATATACACAAAAGAGAATGTATTACCTTACTAATGGCGGGTGATTGCCAAGTCAATAAAACCATTATTTGTAAGTGCTATTTCACACTTATTATATAAACATTAACTTATTAACTAAAAAAGTTATGAGTAGATTTCTTTGTTTCTCCCTCCACTCGATACAACGGTAGCAATGTTTAAGCACTGGGAACTTGCCAAACTTTATTAAAGAGAAATCTCGCATTGAATTATTTGCATAATCAACGTAGATTCAAATAATTGGGCTCCCTAATGGGCCAATTGGGTTCCTCAATGAGCCTCAAATGGTCGAAGATATTTGTTAGGTCCAACTCTGTAGAAGTTCGGGCAAATCATATGCCATCCAATATTCCAAATCCTTTGAAAAAAGCAAAGGGTTAGACTACTGACACCCTTCCAATTTGGGGTATACAAGATATATACAATTGAATTCAACTCAATCAAATCAATTAATCCAACTTAAATTAATCTAATTTTATCGGACTGACTTTTTAATTAGATTAGATTATATTAGATTAGATTAGATTACAAAATAGAATATCTAATGTTATTATATTGGTAAATGGATCTATGTGTTAAAATCTAATATAAACTATTCTAACCAACTGATTCTCATTTTCTTTCTCTATTTTTTAAAAAGGTTACGTGGC
>URS00021E5558 rRNA from 1 species 
GCTAAAAACCTAGCTCAAATTTACGCAAATGCCACAACCAAACAACTGTAACTAAACAAAACATTTTTAAATTTTAGTAAAGGCGATTGAAAAATACCTAGAAGCTATAACAATAGTACCGCAAGGGAAAGGTGAAATAAAAATGAAACAACTTTAAAGCAAAGCTAAGCAGAGACTTAACCTCGTACCTTTTGCATCATGGTCTAGCTAGTTCAACCAAGCAAAACGCAATTGTAGTTTGACACCCCGAAACTAGGTGAGCTACTTCAAAACAGCCTTTAAGGGCCAACCCGTCTCTGTTGCAAAAGAGTGGGAAGATTTTCAAGTAGAGGTGACAGACCTACCGAACCTAGAGATAGCTGGTTATTCAGGAAAAGGATTTAAGTCCTACCTTAAGTTTTTTTATACCACAAAATATAACAGTAGACTTAAGAGCTATTCAAATAAGGTACAGCCTATTTGAAACAGGAAACAACCTTAAACACAGGGTAATGATATTCTAAACGTGACCAAGTGGGCCTAAAAGCAGCCAACTTTTAAACAGCGTTAAAGCTCCATCACTTTATTTAACTAATAACATTAATATTACAAAACCCTTCACCACTACTGAATGACTCCATAACCATATGGAGAACACTATGCTAGAACTAGTAACAAGAAGAAGACCTCCTCCAAAATGTAAGTGTAAGCCAAAATGAACAACTCACTGGCACTTATCGTCTCTGAACTTAAAGTAGTAACTTCACAAGAAAATTCTACCCCCACAAACGTTAACCTTACACCAGAACATTACCGGAAAGATTAAAAAAAGAGGAAGGAACTCGGCAAATTTTAACCCCGCCTGTTTACCAAAAACATCGCCTCCTGAAATAACCATAGGAGGTCCAGCCTGCCCAGTGACAAAGTTAAACGGCCGCGGTACCCTAACCGTGCGAAGGTAGCGCAATCACTTGTTCTTTAAATGAGGACTAGTATGAATGGCATCACGAGGGTTATACTGTCTCCCTCTTTTAATCAGTGAAACTGATCTTCCCGTGAAGAAGCGGGAATACATCTATAAGACGAGAAGACCCCATGGAGCTTTAAACTCAGTATCAACTGCCCTCCCAATATATCCACCTAATTAAGCAGACATGACTACTAGTTTTCGGTTGGGGTGACCGCGGAGCAAAACAAAACCTCCACGATGAAAGGAATTAACCTCCTAATCAAAGAGCTACATCTCTAAGAATCAACAAATTGACATTTATTGATCCAATTTTTTGATCAACGAACCAAGTTACCCTGGGGATAACAGCGCAATCCATTTCAAGAGCCCCTATCGACAAATGGGTTTACGACCTCGATGTTGGATCAGGGTATCCCAGTGGTGCAGCCGCTACTAAAGGTTCGTTTGTTCAACGATTAAAACCCT
>URS00018C7DE1 rRNA from 1 species 
TACGTAGGGTCCAAGCGTTGTCCGGATTTATTGGGCGTAAAGAGCTCGTAGGCGGTTCGGTAAGTCGGATGTGAAAACTCAGGCTCAACCCGGAGACGCCATCCGATACTGCTGTGACTTAGTCTGGTAGGGGAACACGGAATACCTGGTGTAGCGGTGAAATGCGTAGATATCGGAAGGAACACCAGTGGCGAAGGCGACTTCCTGGCTCATTACTGACACTGAGGCGCGAAAGCGTGGGGAGCGAACAGG
>URS0001E9E6F4 misc_RNA from 1 species 
GATGAAGAACGTAGCGAAATGCGATACGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCATATTGCGCTCTCTGGTATTCCGGAGAGCATGCTTGTTTGAGTATCAGTAAACACCTCAACTTCCATATCTTTTTTGAAATGGGAGTTGGACTTGAGTGATCCCAACGCTTTTCCTCACCGAAAAGTGGCGGGTTACTTGAAATGCAGGTGCAGCTGGACTTTTCTCTGAGCTATAAGCATATCTATTTAGTCTGCCTAAAAAACAGAATATTACCTTTGCTGCAGCTAACATAAAGGAGATTAGTTCTTGTGCTGACTGATGCAGGATTCACAAAGACGGCTTCGGCCGACTTTGTAAACTCGATCTCAAATCAAGTAAGACTACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS000057C40D tRNA from 1 species 
ATTATTTTGGCAGATTAGTGCATTAAATTTAGAATTTAATTATGTAAAATAAATTACAAATAATAC
>URS0001919D12 rRNA from 1 species 
TACGGAGGGAGCTAGCGTTATTCGGAATTACTGGGCGTAAAGCGTACGTAGGCGGCTTTGTAAGTAAGAGGTGAAAGCCCGGAGCTCAACTCCGGAACTGCCTTTTAGACTGCATCGCTTGAATCCAGGAGAGGTGAGTGGAATTCCGAGTGTAGAGGTGAAATTCGTAGATATTCGGAAGAAACACCAGTGGCGAAGGCGGCTCACTGGACTGGTATTGACGCTGAGGTACGGAAAGCATGGGGAGCAAACAGGG
>URS000239B5F5 lncRNA from 1 species 
GGAAAAGGAGACAGGGAGTTCTGAGGTTATCCACTGCCATGGAGCCATCACTTTTGGCCAATTGTTGAGATGGAATCCAAGACCAGGAGAACGGTACACAATGATGTTGCAAGCATTGCACTTCGTTTTTACCTCAGAGATGCTCGGCATACAACGGAGACATGGCCTGTCCATCATGGAGAAAGTTCTTTCTCCGTGAGACCCAGGCG
>URS000017EE1C rRNA from 1 species 
CAGCAGGTCACGCAATTACCCACTACCCGGCACGGGGAAGGTAGTGACAAAAATAACGATACGGGACTCATATGAGGCCCCGTAATCGGAATGAGTACACTTTAAATCCTTTAACAAGGATCCATTGGAGGGCAAGTCTGGTGCCAGCAGCCGCGGTAATTCCAGCTCCAATAGCGTATATTAAAGTTGTTGCGGTTAAAAAGCTCGTAGTTGGTTCTGCGTGCTACGCTGTCGGTTCGCCGCCTGCCGGTGTAACTGGCATGCCGTGGCATGTCCTGTCGGTGGTGTTCGGGAGCCTCGTCTAGGTGGTGCCCTCGGACCGCAAGGTACGAGGTGTTCACAGGCCGGAGGTCCCCCCGTTCGCCTACTCTATCCTACCTAGGTGCTCTTCACCGAGTGTCGAGGTAGGCCGACACGTTTACTTTGAACAAATTAGAGTGCTCAAAGCAGGCTGAAATTTCTGCCTGAATAGTGGTGCATGGAATAATAAAACAGGACCTCGGTTCTATTTTGTTGGTTCTTAGGAACACGAGGTAATGATCAATACGGACAGGCGGGGGCATTCGTATTGCGACGTTAGACTTGGCAAATGCTTTCGCGGTGAAATTCTTGGATCGTCGCAAGACGCACAAGAGCGAAAGCATTTGCCAAGTATGTCTTGATTGATCAAGAACGAAAGTTAGAGGTTCGAAGGCGATCAGATACCGCCCTAGTTCTAACCATAAACGATGCCAGCCAGCGATCCGCCGATGTTCCTCCGATGACTCGGCGGGGAGCTTTTTCCCGGGAAACCAAAGCTTTTGGGTTCCCGGGGGAAGTATGGTTGCAAAGCTGAAACTTAAAGGAATTGACGGAAGGGCACCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGAAACCTCACCAGGCCAGGACATTGGAAGGATTGACAGATTGATAGCTCTTTCTTGATTCAGTGGGTAGTGGTGCATGGCCGTTCTTAGTTGGTGGATCGATTTGTCTGGTTAATTCCGATAACGAACGAGACTCTAGCTTATTAACTAGGCGTTTTCCGGTGCCCTCGTCACCGGCGACACTCATTCTTCTTAAGGGGACAAGCGGCTTATAGCCGCACGAGATTGAGCAATAACAGGTCTGTGATGCCCTTAGATGTCCTGGGCCGCACGCGCGCTACACTGAAAGAATCAGCGTGTGCCTCCCTGGCCGAAAGGCCCGGGTAATCCGCTGAACCTCTTGCGTGCTAGGAATTGGGGCTTGCAATTGTTCCCCATGAACGAGGAATTCCCAGTAAGCGCGAGTCATAAGCTCGCGTTGATTACGTCCCTGCCCTTTGTACACACCGCCCGTCGCTACTACCGATTGAATGATTTAGTGAGGTCTTCGGACTGGCGGTAATCCCTATCGACTTGTCGGTATCGATGAACGCTGGAAAGATGACCAAACTTGATCATTTAGAGGAAGT
>URS000219C8A1 lncRNA from 1 species 
ACTGCCTCAACTGTTCGCTCAATGATTTCTGGACCCAAAATTCTGTTTTCCCCGACTTCATCCCAATGGATAGGGGATCTGCACTTTCTACCATAAAGAGCTTCATACGGGGCCATTCCTATAGTGGCCTGAAAACTATTGTTGTAAGCAAACTCCACTAACGGCAGGTGTGTCTCCCAACTACCTCCAAGATCCAAAACACATGCCCTTAGCATATCTTCCAAAGTTTGGATGGTTCTTTCTGATTGTCCATCCGTCTGAGGATGATAAGCTGTGCTAAACTTCAGTTTTGTCCCCATGGCTGTCTGCAAACTTTTCCAAAATTTAGATGTGAACCTCGGGTCTCTATCTGAAACAATGGTGACTGGGACTCCATGCAACCTGACTATCTCCTTGATGTATAAGTGTGCCAGCTGTTCCAAGTTAAAGTTTACTTTAATTGGAAGAAAATGGGCTGACTTCGTCAGACGATCCACCACTACCCAGATAGCATTGTGACCTTTTGCTGATCTCGGGAGGCCTACCACAAAGTCCATCGTTATGTGTTCCCATTTCCATTCTGGAATATCCAACGGTTTCAGTAATCCTGATGGCCTTTGATGTTCTGCCTTAACCTGTTGACAGATAATACATCTCTCCACGAACAGACCAATTCCTCTCTTCATGTTTCTCCACCAAAATACATCCCGGAGATCTCGGTACATTTTCGTACCACCTGGATGAGCAGAATAAGGGGTTGAATGAGCCTCTTCTAATATCTCATTTCTTATACTTTCATCCTTAGGTACACACAGTCTTCCTTTGAAAGTTAGCGCATTATCTGCAGATACTTCAAACCCTATATGTTTATCTGTACCAATCTCGGCCTTTATCTTCTGTAAAAATGGATCTTTATCCTGTGCCTCCTTGATTCGATCTCGAAGTGTAGGTTGAATCATGAATGCTCTTATTCTCGCTGAAATCTGAGTTGGCGGCGTGATAACTTCCAATCTCAATTTATCAAACTCCCTTATCAAGTGTTCCTGTACTGTGGGTAAAACTGCTAACTGTGTTCCTGTCTTTCTGCTTAGGGCATCTGCAACTACATTAGCCTTACCCGGATGGTAATGAATTGTGCAGTCATAATCCTTCACTAACTCCAACCATCTCCTCTGTCTCATATTTAGTTCCTTCTGTGTGAAAAAGTATTTGAGACTCTTGTGGTCCGTATAAATTTCACACTTCCCACCGTAAAGATAATGACGCCATATCTTTAAGGCGTGAACAACTGCTGCAAGCTCCAAGT
>URS0000884EE1 rRNA from 15 species 
GGCGTGCTTAACACATGCAAGTCGAACGGAAAGGCCCTGCTTTTGTGGGGTGCTCGAGTGGCGAACGGGTGAGTAACACGTGAGTAACCTGCCCTTGACTTTGGGATAACTTCAGGAAACTGGGGCTAATACCGGATAGGAGCTCCTGCTGCATGGTGGGGGTTGGAAAGTTTCGGCGGTTGGGGATGGACTCGCGGCTTATCAGCTTGTTGGTGGGGTAGTGGCTTACCAAGGCTTTGACGGGTAGCCGGCCTGAGAGGGTGACCGGCCACATTGGGACTGAGATACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGGAAGCCTGATGCAGCAACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTCGCCTGTGACGAAGCGTGAGTGACGGTAATGGGTAAAGAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTGATACGTAGGGTGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGGGCTCGTAGGTGGTTGATCGCGTCGGAAGTGTAATCTTGGGGCTTAACCCTGAGCGTGCTTTCGATACGGGTTGACTTGAGGAAGGTAGGGGAGAATGGAATTCCTGGTGGAGCGGTGGAATGCGCAGATATCAGGAGGAACACCAGTGGCGAAGGCGGTTCTCTGGGCCTTTCCTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGCTTAGATACCCTGGTAGTCCACGCTGTAAACGGTGGGTACTAGGTGTGGGGTCCATTCCACGGGTTCCGTGCCGTAGCTAACGCTTTAAGTACCCCGCCTGGGGAGTACGGCCGCAAGGCTAAAACTCAAAGGAATTGACGGGGCCCCGCACAAGCGGCGGAGCATGCGGATTAATTCGATGCAACGCGTAGAACCTTACCTGGGTTTGACATGGATCGGGAGTGCTCAGAGATGGGTGTGCCTCTTTTGGGGTCGGTTCACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTTCACTGTTGCCAGCACGTTATGGTGGGGACTCAGTGGAGACCGCCGGGGTCAACTCGGAGGAAGGTGGGGATGACGTCAAGTCATCATGCCCCTTATGTCCAGGGCTTCACGCATGCTACAATGGCTGGTACAGAGAGTGGCGAGCCTGTGAGGGTGAGCGAATCTCGGAAAGCCGGTCTCAGTTCGGATTGGGGTCTGCAACTCGACCTCATGAAGTCGGAGTCGCTAGTAATCGCAGATCAGCAACGCTGCGGTGAATACGTTCCCGGGGCTTGTACACACCGCCCGTCAAGTCATGAAAGTTGGTAACACCCGAAGCCGGTGGCCTAACCGTTGTGGGGGAGCCGTCGAAGGTGGGACTGGTGATT
>URS0000B9E3AC rRNA from 1 species 
GCGCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGAGGAAGAAGGACGGTACCTGAGTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGCGAAGAAAGTCTGAAGTGAAAGCCCGCG
>URS000252BD60 tRNA from 1 species 
GATAAGATGGCAGAGAGTTAAGTGCATTAGATTGTAAATTTAATAATGAGGGTTAGATTCCTTTTCTTATTA
>URS000022CE74 rRNA from 1 species 
TTCGGGGTGAGTGGCAGACGGGTGAGTAACGCGTGGGAACGTGCCCTTCAGTTCGGGATAACCCAGGGAAACTTGGGCTAATACCGGATAAGCCCTTACGGGGAAAGATTTATCGCCAAAGGATCGGCCCGCGTCTGATTAGCTAGTTGGTGGGGTAATGGCCCACCAAGGCTACGATCAGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTTAGGAATCTTGGACAATGGGCGCAAGCCTGACGACGCAACGCCGCGTGGAGGACGAAGATTTTCGGA
>URS00001AC001 rRNA from 1 species 
CGTACTCCTACGGGGAGGCAGCAGTGGGGAATATTGCACAATCGGGGGAAACCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTGTAAAGCACTTTCAGTAGGGAGGAAGGTAGTGTAGTTAACACCTGCATTATTTGACGTTACCTACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCATGCAGGCGGCCTGTTAAGTCAGATGTGAAAGCCCGGGGCTTAACCTCGGAATTGCATTTGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAATACCAGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGATGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAG
>URS000182260B rRNA from 1 species 
ATACGTAGGTGACAAGCGTTATCCGGATTTACTGGGCGTAAAGGGCGTGTAGGCGGTCTTGCAAGTCAGAAGTGAAATTCCTGAGCTCAACTCGGGCGCTGCTTCTGAAACTGCAGGACTTGAGTGCTGGAGGGGATAGCGGAATTCCTAGTGGAGCGGTAAAATGCGCAGATATTAGGAAGAACACCGGTGGCGAAGGCGGCTATCTGGACAGTAACTGACGCTGAGGCGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCAGGTAGTCCACGCCGTAAACGATGAATACTAGGTGTAGGGGGTATCGACTCCCTCTGTGCCGCAGTTAACACAATAAGTATTCCGCCTGGGGAGTACGGCCGCAAGATTAAAACTCAAAGGAATTGACGGGG
>URS000010CDEA rRNA from 1 species 
TAGGCCTAACACATGCAAGTCGAACGGCAGCGCGGGTGCTTGCACCTGGCGGCGAAAGGCGAACGGGTGAGTAATACATCGGAACGTGCCCTAGAGTGGGGGATAACTAGTCGAAAGATTAGCTAATACCGCATACGATCTACGGATGAAAGTGGGGGACCGCAAGGCCTCATGCTCCTGGAGCGGCCGATGTCTGATTAGCTAGTTGGTGGGGTAAAAGCCTACCAAGGCGACGATCAGTAGCTGGTCTGAGAGGACGACCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGAATTTTGGACAATGGGGGCAACCCTGATCCAGCAAAGCCGCGTGTGTGAAGAAGGCCTTCGGGTT
>URS000217ECBF lncRNA from 1 species 
GGATGTTAAGAGAAGGGGTTGTTTAAGATAAAAGATAAATTCTATATTGATGTAAGTTAAATTTAAAATACTGATGGACTATCCAAGGTGAAGATGTCAAGTAGGTATTTGGGGAAATAGCAATCAAGTGCAAGAGACAGGGAATTTTCTTTTGGAACAATGAGAATTCTCCAAGCTTCCTCAACAGACAACTGGAAGTGGCAGCAAAGAGGCAGTGGAAAAGCAGCAGAATGGCAGTAGAATGGCAACAGCTGCACTGGGATCAGAGGCTGCACTGGGATCAGGGGCTGTGCTTAGATCGTGCTGAGTCATTGCTGGTGTTGGACGGAGTGACAGCGCGGAGGAGGATTACGTGTGCCAACTGCTGGATTTCCCAAGTTTGCCTGCCCTTGCCTAGGTGCGAGCTGAGGTGTGTGAGTGTCGGGGACTGATGGGTTTGGGGAGGCCTCAGCCCGGACGGCCCTCCGCGATCTGGGTCTGAAAACACGAGCCCCCGTCTCTTAGGAGGCGCGGGAAGGAAGGTACATGATAACTTCTGTAAAGAAAGATGGGATCAGACTTATGTTGAAAAAGGAAGCTGGTAAAATTCTCTGCTAGTGATTCATGTACCACTATGAAGCATTTGAGTCAATGGTTATGGATCTCAATCGACTCCACCATTTTCCAGGTCTCAGAACGGCTAGCGATTGGATGAACATTCTTTGATGTAACTGTTCTATTAATTCATTATATTAGTGGTGTAAAACTTTCTGGTTCTTGTTTGATCCAACTTTTATTTTCATTGTCCATTATTTTATTGTCCATGAAGATGACAAAACCTTTTCTACATTTTTCTGGCTTCAGAACTTCTCTTACCTCTGATTGCTTTGACTCTAAAGATGCTATAATAAAATTACTGATTGATATTCAACTG
>URS00016BEEAD rRNA from 1 species 
TACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTTTGTTAAGTCTGTTGTGAAAGCCCCGGGCTCAACCTGGGAATGGCAATGGATACTGGCAAGCTAGAGTGCGGTAGAGGGTAGTGGAATTCCCGGTGTAGCGGTGAAATGCGTAGAGATCGGGAGGAACACCAGTGGCGAAGGCGGCTACCTGGGATGACACTGACGCTCATACACGAAAGCGTGGGGAGCAAACAGG
>URS00011B15C7 rRNA from 1 species 
CCCTTAGATGTCCTGGGCCGCACGCGTGCTACACCGATGCATACAGCGAGTACTTTCCAGCTCCGCGAGGCAGCTGGTAATCAGCAATATGCATCGTGCTGGGGATAGATCTTTGGAATTATAGATCTTGAACGAGGAATTCCTAGTAAGCGCAAGTCATTAGCTTGCGCTGATTAAGTCCCTGCCCTTTGTACACACCGCCCGTCGCTCCTACCGATTTCGAGTGATTCGGTGAACCTTTTGGACAGCGTCTGTCCTCGTGTCAGATGCTGAAAGTCAAGTAAACCATATCACTTAGAGGAAGGAGAAGTCGTAACA
>URS000170A9F1 rRNA from 1 species 
AACGAACGCTGGCGGTAGGCTTAACACATGCAAGTCGAGCGCCCCGCAAGGGGAGCGGCAGACGGGTGAGTAACGCGTGGGAACATACCCTTTTCTACGGAATAGCTCGGGGAAACTGGAATTAATACCGTATACGCCCTACGGGGGACAGATTTATCGGGGAAGGATTGGCCCGCGTTGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCAATAGCTGGTCTGAGAGGATGATCAGCCACATTGGGACTGAGACACGGCCCAAACTTCTACGGGAGGCAGCAGTGGGGAGTATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCTTGAATGATGAAGGCCTTAGGGTTGTAAAGCTCTGTCACCGGAGAAGATAATGACGGTATCCGGAGAAGAAGCCCCGGCTAACTTCGTGCCAGCAGCCGCAGTAATAC
>URS00021A8CBE lncRNA from 1 species 
AATCATTTTGTTGTACAAGTCAGCATGAGTTATCAAAAGGACATGAAGGCACCCTAACATTATGGAAACAAAAATTTAAAAAATTTGCTGATTTAGTATGCTGGTATATAGATGTATGAATAAAAGTGCTCACATGGTCAGTTTTGGTCTACACTGTCAAATAATTTTGTTGCACAAGTCAGCAAGAGGTATCAAAACTACTGAAATTTTGTTACGTATCAATATTTTGAATAAAAGGAGGACATATGCTGGCACCCTAAATTTA
>URS00020CA31D rRNA from 1 species 
GATGAACGCTAGCGATAGGCTTAACACATGCAAGTCGAGGGGTAACGTGTTGGAAGCTTGCTTCCGATGACGACGACCGGCGGATGGGTGCGTAACGCGTATGCAACTTGCCTCACAGTGGAGAATAACCCGGAGAAATCCGGACTAATACTCCATACACTCTTAAGTACGCCTGTACATGAGAGGAAAGATTTATCGCTGTGAGATAGGCATGCGTCCTATTAGGTAGTTGGTGAGGTAACGGCTCACCAAGCCGACGATAGGTAGGGGTGCTGAGAGGCAGATCCCCCACATTGGGACTGAGACACGGCACAAACTCCTACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGAGGAAACTCTGAACCAGCCAAGTCGCGTGAAGGAAGAATGTCCTAAGGATTGTAAACTTCTTTAGCGAGCGAGTAAGGACTTCCACGTGATGGGAGTTTGAAAGTAGCTCGAGAATAAGTATCGGCTAACTCCGTG
>URS0002179DC9 lncRNA from 1 species 
ATTACTTTGTTTAGAAAAATTAACATTTTTCTGGTTATGATGTAAGACACACAAATAGCTACTTTGATTTTTATTTAACAAATACATGAACCATTCCCCATGCTCCGAATAAGTCATCATGAGTCTATAAAATCTTGTAACTTTTTTTAATGGTACTTGAGACAGTTTACATTGTTTTATAGAACAAAATACAATACTTCTAATTCTCCTCATACTGCCTTTCAACTCTACGGTGAGAGCTGTGCATAAAAACATAGCAGCTTGGGTAGCTCATGGGTTGCAACATAATCTCCGCATTGGGTTGGGCTGGGGGATGGCAAGGAAGGCATTCTAAGATATAAGTTCTGAGAATAAAGAAACAGAGATTTCCCTCAAGAAAATTTATACTTGTCTCCTTTATAAGCACAGGTCCCATACAAAAAGTATTATCACTGAATTGCTCTGTCTGACTTATAAGCTATAATTAAGATTCCAGTCTGATGTGGAGCAGCTTAAAATAGCATCACACACCCTGTTGATTCTTGCCTAGTTGAAACAGAAACATAAATTTGAGGGAAGAAGGTGGAAATGATTATTATCAATTCCCCTTTAATAATACTGATATAGGTATCCATGGGCACAGAAAATTAAGTAAAGTAAGTATTCCAAATTATCTCCCTCTTCAAATCGCTTATACCTGATTTTGGCTGGGCAGAGATTTACTAATAAGGAGGTGAGGGTTTACTTCCAGGAAAAGCTATAATAGTGAGACAGAAGTTCAGGGCAGAGCAAGCACCAAATATAGGGCAGTACAGATAGTGACCTGCTTGGGACCTAGGAACTAGGTAGCATGTGGAGTAGCAGGAGGAGAGCCTAGAAGACAAGCGCTTGACCAGTAAAGTGAGAAGACCTGCTCAATTTAGAGAAGGATTTGCAAGTAAGAAACAGAACATTTCTTGAGTATTTACCTAATTCTAGGTTGATACTAGGTACACTTCATTTAAACCTAACTTTAAAAAGTCAGAAATATCCATCATTTCACCAATTCACTCATATGGAAACTGAAGCTATGAGGTTCCCTACCATAAATCCCACATAATGAAGCTGGGACTCAAACGCCCGCATAATTTAAAACTTTGTGCCCTTTTATGCTAAC
>URS00012349DE rRNA from 1 species 
CAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGTGCGCAGGCGGTTTTGTAAGACAGAGGTGAAATCCCCGGGCTCAACCTGGGAACTGCCTTTGTGACTGCAAGGCTAGAGTACGGCAGAGGGGGATGGAATTCCGCGTGTAGCAGTGAAATGCGTAGATATGCGGAGGAACACCGATGGCGAAGGCAATCCCCTGGGCCTGTACTGACGCTCATGCACGAAAGCGTGGGGAGCAAACAGGATTAGAGACCCCAGTAGTCCCTGTCTCTTATAC
>URS0000B93F3B rRNA from 1 species 
TGAGCCTACGGGGGGCAGCAGTGGGGAATATTGCACAATGGGGGGAACCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAATCTCTATCAGCAGGGAAGAAGATGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGGATTTATTGGGTTTAAAGGGTGCGTAGGCGGACAGTCAAGTCAGCGGTAAAAATGCGGTGCTCAACCCCGTACTGCCGTTGAAACTGCATCCCTTGAGTGCGCGAGAAG
>URS0000854D01 rRNA from 1 species 
AGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGCAGCTTGCTGCTTTGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAATGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCCATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAAAGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGTCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGGAGTAAAGTTAATACCTTTGCTCATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTTTGTTAAGTCAGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATCTGATACTGGCAAGCTTGAGTCTCGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACGAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCACGGAAGTTTTCAGAGATGAGAATGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTCCGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGATCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGTTGCAAAAGAAGTAGGTAGCTTAACCTTCGGGAGGGCGCTTACCACTTTGTGATTCATGACTGGGGTGAAGTCGTAACAAGGTAACCGTAGGGGAACCTGCGGTTGGATCACCT
>URS0001C3A371 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACGGACGAGAAGCTTGCTTCTCTGATGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTGCCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATGATATTTTGAACCGCATGGTTCAAAAGTGAAAGACGGTCTTGCTGTCACTTATAGATGGATCCGCGCTGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCATAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACCCCTACGGGAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAACTCTGTTATTAGGGAAGAACATATGTGTAAGTAACTGTGCACATCTTGACGGTACCTAATCAGAAAGCCACGGCTAACTACGTG
>URS0001B15B4F rRNA from 1 species 
CCTGGTTGTTCCTGCCAGTAGTCATATGCTTGTCTCAAAGATTAAGCCATGCATGTGTAAGTATGAATAAATTCAGACTGTGAAACTACAAATGGCTCATTAAATCAGTTATAGTTTGTTTGATGGTATCTACTACTCAGATAACTATAGTAATTCTAGAGCTAATACATGCAACAAACCCCGACTTCTGGAAGAGATGCATTTATTAGATAAAAGGTCGATGCGGGCTCTGCCCGTTGCTACGAGGATTCATGATAACTCGACGGATCGTACGACCATCGTACCGGCGATGCATCATTCAAATTTCTGCCCTATCAACTTTCGATGGTAGGATAGTGGCCTACCATGGTGGTGACGGGTGATGGAGAATTAGGGTTCGATTCCAGAGAGGGAGCCTGAGAAACGGCTACCATATCCAAGGAAGGCAGCAGACGCGTAAACTACCCAATCGTAGTTGCACTTTGGGATGGGCCGGCTGGTCCGCCTATGGTGCGCACCGATCGTCTCATCCTTTCTGTCGGCGATGCGCTCCTGGCCTTAACTGGTCGGGTCCGGTGCTGTTACTATGAAGAAATTAGAGTTCTCAAAGCAAGCCTACGCTCTGTATACATTAGCATGGGATAACATTATAGGATTTCGGTCCTATTACGTTGGCCTTCGGGATCGGAGTAATGATTAACAGGGACAGTCGGGGGCATTCGTATTTCATAGTCAGAGGTGAAATTCTTGGATTTATGAAAGACGAACAACTGCGAANCTGCGAAAGCATTTACCAAGGATTTTTTCATTAATCAAGATCGAAATTTTGGGGCTCGAAGGCGATTAGATACCGTCCTAGTCTCAACCATAAACGATGTCGACCAGGGATCAGCGGATGTTGCTTTTAGGAATCCACCGGCACCTTATGAGAAATCAAAGTTTTTGGGTTACGGCGGGAGTTTGGTCGCAAGGCTAAAACTTAAAGGAATTGACGGAAGGGCTCCACCAGGAGTGGAGCCTGCGGCTTAATTTGACTCAACACGGGGAAACTTACCAGGTCCAGACATAGTAAGGATTGACAGACTGAGAGCTCTTTCTTGATTCTATGGGTGGTGGTGCATGGCCGTTCTTAGTTGGTGGAGCGATTTGTCTGGTNGATGGCTGTTCTTAGTTGGTAGAGCGATTTTTCTGGTTAATTTCGTTAACGAACGAGACCTCAGCCTGCTAACTAGCTATGCGGAGGTATCCCTTCGCGGCCAGCTTCTTAGAGGGACTACGGCCTTTTAGGCCGTGGATGTTTGAGGAAATAATAGGTCTGTGATGCCCTTAGATGTTCTGGGCTGCACGTGCACTACACTGATGTATTCAACGAGTTTATAGCCTTGGCCGACAAGCTCGGGTAATCTTTGAAATTTCATCGTGATGGGGATAGATCATTGCAATTGTTGGTCTTCAACGAGGAATTCCTAGTAAGCGCGAGTAATCAGCTCGCGTCGACTACGTCCCTGGGCTTTGTACACACCACCCATCGCTCCTACCGATTGATTGATCCAGTGAAATGTTTGGATCACGTCGACGTGGGTGGTTTGCTGCCCGCGACGTCCCGAGAAGTCTATTGAACCTTATCATTTAGAGGAAGGAGAAGTCGTAACAAGGTTTCCGTCGGTGAACCTGCGAAAG
>URS0002562826 rRNA from 1 species 
ATGCCACCTGTTCAGGGAAATGGGCAAGCCCTAAACGGCAACAGTCAGCAATCTTCTCAGCAATTTCCAACGCCAATCTTGTGGCAGCCAACCAGCAACCACTCAATGCAACATGGCGAAGGATGTAGTCTGCCACCACCTAGCATGCCGAATCCATTGCCAGTAGCAGTTCCAGGATATTATCCACCTTTACCTGCTTTTGGACAGGACCACTGCACTAGTTTACCTAATGCAAGTTCTCAACTTGAATTTCGGAACTTCCCAGCGTACATGCCGTTTAATGATATTCCCCAGGGGAATTCCATTCTTGGATGGGAAGAATTTGTTGAAGATGTAAGTCATTCAAATGTCCGGCCACCAGTTGAAGAGCATTATGTAGATGCGTCATTTAGATGTAATCAAGTGCTACTTCAATGGGATGAGCCTCATATGGAGGTCAAGAAACGTTGGAACTTTCTTGATCAGCTCATGCCGCTGTATAGCACACAATCAGGGTTTTATAAAGAAGATTTCCCCAGTACGAGCCTCATGGATAAAACCCATAAGTTACTGGCCAGTATTTCATCAGACGATTCTGTTTGGAAGATAATTACCAGTGTTACGAGTCGAGCCACACAAACTCCTCAGAGGAGAGGTGTTCTCATTCGGCCCATTGAGCCATATGATTCAGATGATGGGCCACCAATTAAGAAGCAAAGGACCAAATATCAATTGCGATTTGTCAATACGGTGTGCAATGACTACTTCACACGGGAGAATATCAAATCAGAGGATGGAAATCTCTTAAAGGTGGCTTTGTATGATGAGAACAATCTGGTTGTCACATCTGGTCCGCTGTCTGCAGCTTTTGTGGAGATCGTACTACTTCATGGTGATTTCAATGCTGAAGGTCAAGATTATTGGACATCAGAGGAGTTTAGTGACTGCCTAGTGCATCCACAATCTGTAAAAGAACCACCAGCCTTGGGAGGTGATCGTGTCTTGACACTGACTGATGGAGAAGCAGACCTTGGTAATGTCTATTTCCGAACTTCCTCCTTCCATGCTAGAACTGAAAAGTTCAAGATGGGTGTTGAGATTAAAAATGTAAGAGAAGAGTGTGTTCAAGAAGGAATCACTAGCCCTTTTTTTGTGAGAGTTCGCCAAGGGGAAGAATCAATTGGCCAATGGATCACATCCCTCAAAGCATCGCTCAGAGTGAGCAAACAAGTCCCCCCGCTGGAGTGCGATGCTAGGAAATACGTCGACGCATTAGCAGTTAAAATGAGCACGGAGGAAAAATTCAAAACTGGAAAGCTTAAGGTAAAAAGGGAAAAAGATAAGAACAAATATGAGGAAGATCTCAGAATACTCATGGAAGACCACCAAGAGTTCACATTAAAAACCGAAGATATGCGAAAGGAAGGGCGTGCTGAGTTAAATCATTACATTCTATCTCCACCTCAGAGATCAATGGTTATCCAATCAACAAGATTTCGTCTAGTAATTGAAAATAGTGTGAGCAGAACAATTTACAAAAATAGTACTGTAAAGACCGAGGATGGCGGAGATCACATAAAAGTTGTCATGTACGATGGTGGCAAGCCAATTGCATTTGACCACCCTCTTGCTTCAATAACAGTTGACCTAGTTATCATTGAAGGAGGGTTCGATGAAAAGCGAGATTCGTGGTCTAAAGAGGAGTTTGAGGAAAGCATAATAGAACCAAGAAAAGGAATCAAAAGGCTAGTGAAAAATGGTACATTTGATTTGATTGATGGGAGGTGTGATCATCATGGTGCCATTATTATGGACAATTCACTACGAATGGAAGTTAAACTTGGAGTAAGGATCGCAGTGCATACAGACATAAGAGTTATTGAAGGGGTATCAAATCCTTTCAAAATGAAGGAAGTCCGGACAAGAGTACATGGAAAGAGTACTATTCCATACAAGGACGACGCGGTACATCGACTGAAGAAAATTGCCCTGAAGGGAAAACATTGGAACAATCTTGAGGATCAATATATTACCAAAGTGAAGCACTTGTTGCGCCATTATCACAAAGATAAATTTGGTCTCCAAAAGCTTGTTGACATGAAGAAAGAGGATTGGAATACCATGATTAATCATGCCACCATGTGTGTTCCTGGGGATGAGATCTATTCCTACTGTGTTCAAGAGGATAACTGTGAAATCCTATTCAATGATTTCTATGATCTTGTCGGTAAGATCACTGATGACTATGTTCCGTACAGTGTCAATGACGTCGATCAGTTTCCGCAGCTTAAAGTGAACAACTGGAAAAAGTCTGCGTATAAGAAGTTTGACGAGAGGGAGAACTCAGGGCTCTTTGGTCTTACTCCTGATTACTTCATGAACAATGGCCGCCCAGTCCGTGCAGCGCCCCTGAACAATGACGCAGGTCCTACTGTACAAGCATCTACATGGCAATATCCTAATGACAGGGCTGCACAACACGGCCTTAATAGAAGTGCAGTCTGCCAATACACAGATGCCTGGAGTCCGGCTTCTAAAAATACCAATCAAAATAATGTGATTCCTCCAACGACGACAGCAGATGGGAATGGGATGCTTGGGTCACTGACAATGGGGACAAGCAGCACCAGCGACATGAAGAAGAGCATGATGGAGGACGTTGCCAATGGTCTCTTCAATTGA
>URS0000051310 piRNA from 1 species 
CAGGTCTTGTTTTAGTTGGACGAGGA
>URS0000A621CB tRNA from 1 species 
AAAATGCCAGCTTTGGGAGTTGGTGATGAAGGTTCGACTCCTTTCTTTCTGA
>URS000113D973 rRNA from 1 species 
TACAGAGGGTGCAAGCGTTGTTCGGAATCATTGGGCGTAAAGGGCGTGTAGGCGGTTTGGTAAGTCATGTGTGAAATCCCTCGGCTCAACCGGGGAACGACGCATGAAACTGGCAAGCTAGAGTACCAAAGAGGGCGGTGGAATTCCCGGTGTAGCGGTGAAATTCGTAGATATCGGGAGGAACACCAGTGGCGAAGGCGGCGATCTGGACGGATATTGACGCTGATGTACGAAAGCGTGGGGAGCAAACAGG
>URS00001901B3 rRNA from 1 species 
TTAAAAGCTCGTAGTTGGATTTCTGGCAGGAGCGACCGGTCCGCCGCAAGGTGTGCACTAGGTCGTCTCCAGTCATCTTTGTGGGAACTGCTCTGGCATTAGGTTGTCGGGGTTAGGGAACACATCGTTTACTGTGAAAAAATTAGAGTGTTTAAAGCAGGCTTATGCCGTTGAATACATTAGCATGGAATAATAAGATAGGACTTTGGTGGTCTATTTTGTTGGTTTGCACACCAAGGTAATGATTAATAGGGATAGTTGGGGGTATTCGTATTTAATTGTCAGAGGTGAAACTCCCTTGGATTTATGAAAGACGAACTACTGCGAAAGCATTTACCAAAGATGTTTTCAGGGTAATCAAGAACGAAAGTTAGGGGATCGAAGATGATTAGATACCATCGTAGTCTTAACCATAAACTATGCCGACTAGGGATTGGTGGTCCGTTCATTATGA
>URS00005FFC84 siRNA from 1 species 
TGACTTTGGAGCCATTCTTCCC
>URS00005C67CE rRNA from 1 species 
TTAATTATAGTTAAATAGTATTGTGAAAGAAAATTGAAATAATTTGAAAAATTAATATTTTAAAAGAAAATTTAATTTATTGTACCTTGTGTATCAGGGTTTATTAATTAAAAATTATTTACTATAATTTTCTCGATTTTAAAAGAGTTAATATATTATAAAAGTTAATGTGACAAAATTATTTTATATAGTATATTAGAAATGAAATGTTATTCGTTTTTAAAGGTATCTAGTTCTTTAAGAAATAAATTTAATTTAGAAATATTATATTATTTAGTTAAATGTATTAATTAAATAATTATTTTATTTTAATATTTTATGGGATAAGCTGTGAAATAAATTATTAAAAATTTTTAAATAGTTTAATAAATATAAGCTTAGAAATAGTTATTATTAATGAAATTGTTATAATTTATTTTATAATATTTATTATTTATTAAATTTTAATTATGTATTAGAGTATTTATTTTAATTTAAAAAATAAAAAAATAATGATAAAATTAGTATATTATGATGTATAAATATGTGAAATTGATAAGTTTTTATAAAGAACTCGGCAAAAATAATGTT
>URS0001988726 lncRNA from 1 species 
CACATGTTATGGACATTTTTATTTATTGACATGGTCAAATTAACAGGCAGCAGCATTTATTTTTAATGATAGCCTTGAAATCAGCCCAGGAAGAAAGTTAACATTGATGTTCAGAATACTGCATGCCATCCACATTTTTCCAGATGAAAGTATATTTTAAACTAATAATTAAATATTGTCACCCTAATTAAGTTACCTTGAGCAGGTGAGAGAAACACAGTTCTTAGTCATTGCAAATCTTGTTTGTCCTATTCTCAAGCTGTACAGAAAAACTACCCAGCAGGAGAAATTCGGCAAGCTCCATGGTTTAAAGTGTGCACTTAATTTAGGTGAATGATAAGCTGTGTCTATAAAGATTTGTGTTGGTCACCACGGAATGGAAGATTCCTGTGAAGTAGACAAGATGTAATTGCCAGTAAATATCAGTGCTAGCTTGGCCACACAACATTCACAGAGCAGGAGGGAATATCTTGGTATATTTATTATTACAGTGGGGAATTTTGACAGTCACCTTAATCACTCTTTGAGACAGGTAAAGAGAAAGGAACTGGGCAGCAGCACAGTTATCAGCTGGGTTAGAGAAAGCACACAGAGCAAAGGAGAATGAAGAGCATTTCACAAGGTATTTTAAACAGGTTTACATTGGGATGAAGATATTAGGAGTTTTTAGATATTAAGCACTTGTGGAAATTAAATCATTGCTTCATGCATTTAAAATTTACGCCCTAGAAGTACCTTCACAAACCAGACTGCCCACTTTAAAACTTCTGATCTACCCACCTTAAACAAGAATATTCTATAAATTACAAAGAAAGACTGGGAAATGATCTGTGTGTAATAGCTGAACCAAGCAATTTGCATATTTTCATGAATTACTGTAATGTGTTCTGCTTGTAATTTCACTTGTATACAAAGGATCACAGTTGCAAAAAGTACCAACTTTTCATGTTCAAAAGTGATTCAGGAGTCGAATTTCCTAGTCCAAAATGCTGAGACACTTAAAAATTAGAAGCTGAAATCATTGTTCTCTTCATTGCACTAGAAAGTTTTGCACTAAATCCTGCTCAGTGGCTTAGATATGAGCTGGAAATAATTTTTAGGAAAGCCCTGAACCAGGACACACTATTAGAGACTCCTTGGTTCTTTTGACTTGGCATTCACACATGTGCATGCAGATATGCAGATAGCCCTGTCATGATCTATTAAAAAAACAAACAAACAAAAAAATCTAGAAAAATCAATTTTCACTGAAAGATTCCAGTTTTTTTTCAGGGAAGAAAAGGTCTGTAAGCTTACCTGAGAAAAAGTTTCCACAGCAATTTTATTTTTTAAAAATGGTGATGAACGACCCACAGTGAACGTGGGAGAAGGATCCAATTTCTGCCCACGAGGGAGAAGAGTGTGTGCATGGTGGGCACCTCAGGCTGCAAGAGCAGGCACAGGATAGGGCATGGGCACGCAGGGCAGCTGCCTGCAGCTCCTGGCCAGTCTCAGCCTCTGTGGGGTCCCTTAGAGGGGTGAATTATTGTGCCCAGGGAGCTCCCCCCCCCATCCTGGCCAAGTCAGGATACATTTTTATAGCCCTTCTTCAAGTGATAGAAATATCAAGGGGAGGGCAAAATATATGGGAGGAGGGAAAGGGAGGCAGTTTCCAGTATTTGTCATTATTATAGGTTATATATACAGGAAGAAAGTTAATTAAGCTTTAAAAAATCCATCACACATCAATGGGTGCATTTTAATGAGTAGAAAAAGTTGAGATGTTTACTGCCAATTAAAGTGGTTTTTAAATAAGCATTAATTAACACAGAAATTCAGAAGAAAGTTATACCTTGTCAAAGAAAGGCCAGTGCAGTCTATGCCCACTTCTGCTCCCATTCATACTCAGATAGTAATTACCACCAACCCTATATTTTCCATAATAATGAGGAGAGGCTGTCATGGCTGTCAAACAAAAACAAAACAAAAAAAAAAAGAAAAAAAGGTGCTGCACAAAAATACCCTCAATCTGAAGTAAACTTTTGTTTTTAAATGTATAATAAAAAGCCACAGGAGACAGCAATATGGGGCAAGGCAGTGAGTGGGGCAGTCAGGCAGCCATGCCAGAGGCAGCTGCACACACATGGCTCCTTCCTAGGGAGCAGAGACTTTGGAACTCAGGATGAAGCCTCTCCAGACAGTCCAGCTGAAGAAAGACTGAAGAAAAGCCAAAGAAAAAGCAGTTCGTTCCTAGTTTCATCCCTAGCGCTGGAACTCGTGGAGGAGCTGATTCCCCTGTTAAAGCCAGAGGAGCTCGTTTTTTCCACAAACAAGTGCTGACAGACTAGCTCCATGCTTCCCAAAGTCAGATCAAAGCAACCACTGCAAATAAGTTCAGCTTGCATGTGCACTTCCAGCTGGAGCAACTGGTGACAGGAAAAACAGTACGACCCTCAATTCTGTCACTTCTCCATTCTTGCAGGATTTCTTAATAATTGTCAGGAGTTTCAGCTCTACTTCAGCTAGTGTCAAATCCTGATGGGACAGCAAAGGAAGTGATTTCTCCCATTGTTAGTCTGGTGAATGTTTAAATATCTTAGGAAAACCTTCCTTCCCCCAAATGCATCTTAGGCACCAAGTAAGATTTTCAAACTGCCTCATTGAGAATGGCTTCTCTCCTCACTTCCCCAGCTCCAGCTGTGGAGAGATAAAAACCCCACTGCCTTTTCAGACAGCAGAAGAGGCAGGTCACATAAAAATTTGTTAGTAGCCTAAGAAATTTTACAAAAATCTCTGGTGTAGTGTTTTTAAAGTTAATTTAAAAAACAAAACAAAACAAAACAAAAGAAGCAACAAAACACAGAAAAGAAGGCTGTAGATATGCACAGACTCCTGTTCCTAACCCTTGGCATTTCACTCAGATAATGTGCAGCCTCTCTGTAGCTTGTGTCTATCAGGGAGTATCTGGGAGCCTTTTTCCTACTCCATGTCCACAGGCAATATCTGCAGTAGAATAAAAAAAGGAGAGCATTAAATGCCATGGAAGTTTTGTTGAATGTAACTGGACAGGGCCTTCAGATCTTG
>URS0000ADFB99 rRNA from 1 species 
TTCTAACAGAAATAATTGTTAGTAAATCCTGCTCAATGATTCGTTAAATAGCCGCAATAACTTGTGCTAAGGTAGCATAATAATTTGCCTATTAATTGTAGGCCAGAATGAAAGGATTAACATAAGAAATTCTTTATTCATTAAATAAATTTAACTTCATTTATAAGTAAAAAAGCTTATATTTTTTAGAAGGACGACAAGACCCTGTCGAACTTCACTAAAGTTTTACTGGGGCGGTAAAAAAACTAACACTTATTTTCCATTTACAAAATATAAACATAATGTTAATTCTAAACAAGTTACCGCAGGGATAACAGCATAATTTTTTCCTAAAGATCTTATTAAAGAAAAAGATTGTGACCTCGATGTTGAATAATTTATCTTATTGGGGCAGCACCTAAACAAGTAAGTCTGTTCGACTTTTAAAAAATTACA
>URS00009AD4FC lncRNA from 7 species 
ACGCCGGCGTGAGAGGGCACGGGGAAAAAGGTGGCTCTGGCCGGGGCGGCTCTGTTTCCTGGGGTTATGTAGCAGGGCTTGTCGGCTCGCGAGACCTCCCGCTGCCCTCGCCCGTGTCCTAGCGCGGGGTTTCTGCTCCGGGCGGAGGCCGTGTTCAAGCCCGCCGCGCTCCCTCGACGTAGAGCTCGCTCGTCCGCCCGTGGGAGCGTCCCGGCCGAGCTGCGCTGAGGGGGGAGGGGAGGCCATTTTGTCCCGACCGACTCCCCGGAACCGGGCGGAGCGGCTGGGAGAGGCTGCGGAGCCGCGGGCGCCGCCCCTCGGAGGCACGGGCGCCGCCACCGTCGGGGCTTCCTCGACGAGGCCGTTCGGAAGGTCTCCTGCTCCGTCTCGAGAGCTGCTTTCTCCTTCCGCACACGCTACCCGGCTGCTGCGGCCCCAGAACGCCCGGGTGAGGAGTTGGTTGTAGTGAGCAGTTCCGATCCCTTGGGGCTACCGGCGGCGAGCGCCCGAGCCGCTCCTCCCAATGGCGAAGAAGACGTACGACCTGCTTTTCAAGCTGCTCCTGATCGGGGACTCGGGAGTGGGCAAGACCTGCGTCCTTTTTCGTTTTTCGGACGATGCCTTCAATACCACCTTTATTTCCACCATAGGTAAGACCTGTGGGAGGATGGTGTGGGGGCTCTGTAGCCGCGAGCCGTTTTCTTTTATTCCAGACATCTTGCTTCCCGGAATTTACGCCTTTGTTCCAGTGATTCCGATTCCAGACGACAGACCTAAGTTACTGTTGGAATCGGAATAGCCTTACTGGGGCGGGGTCTTCCCATGCTTACCATCCGGTCTCAAGTCTCCTTCTCTGTTCGGTGCCTTCTGGCACAAAATATGCAGCATTTAGCAGCGTTCCAGAATCCGGTTTCTTTAAGTGACTTGCCTGGCCTTACCATAATTGCATGAAGTTACTTGATGTGCTATTTGTAATAGACGTAATTTAGTGGTTGGGATTGAAGCAGTACTGGCTATGTGGCAAAGGCCCGAATTGGGGGTCAAAGAGAAAATATTCTATCTGACTGTAACTTGGAGTAAACTTGAGAGTTGCAGAATCATTAAGGAAAATGAGAGGGGCGGGGGAAAGTGAGTTGGCTGTCTTGACTGAACCATTGATGTGTCAAACAATCGGAGGCCCTTCGTGCTTGGGGTGGGAATCTGGCATGGTTGGCTCACAGTGCTTTTTCAAGACCTCAACGAAGCAGATGGACGGTTTCTGTTTTCAACCCAATGGAATCAAGTCAAGTTCTAATGTTTTACTTGATGTTAGAATTTACAGGAAAATCTTTCGTCAGTCATGGCTCTAAGGACTTCTAATGTACTACCACATATTTCGGAATTACTTGGTATGGAAATAAAAACTGACCTTTTAAATGGGTTTCCTGTTTCGGAAATGAAAAGGGAAGGTTTCAAGAAAGTCGTTTTGACGCTGGCACCAACATCAATTTTGTCAAAGTAACTGTACATGACCACCCCCCTCCCTGGTTTTTTAAAGTATCCGGTGTCTTTCATTTTTGAACCTCAGCTCCGGCATTAGAGCAGTGCAGGAAAACTTGTGATAAATGTAACTAGCTTCACGATGAGAAGCGACTCTAGTGGTTTTCCTTAAGAATTGTGAAAATCTTGTTTTAACCAATTTATAGTATAGGATTTCCTTAAGACATATTTGTAAGTAGCTTAAGCATATTTTCGCAAAATATGCTTAAGTTATACTGCAATTAAGATGAGCAAATTTTTATTTAAAATAGGTTGTTTTACCTTACTGGTGGGCAGGATTGTCAAAATATCACGAAGCTTGAACTTGTCCTCTGCTTAGTGGGTTAGCACTTACACAGCACTAAGTTTGCTTTGAAGTGTAGCTGGGTCAGTCAGGTGGCTAGATCAGCAAATATTTATTGAGCACCAAGTTCTAGGCACTGTTAAAAGCGTTGAAAATAAGTGGTCGATACAATAGACCCCTTGAGCATTCTGATAAAGAAGGCAACAACAGTGTGCAAAGCACTAGAGTGAGGAGAGGGAGGAAGGGGAGTAGTCTGAATTATGGGGAATCTGCTTTGCATGGATGTTTAAAACGTAGTCTGAAAGACAAGTATGAATTGGATCAGAGGAGAGGTAGCCTCTTTGAAAGAGAATTTAGTGTGCGATCCTTTTTTTTTTAACCTGCTCTTGAGAACGGGTAGGTGAAAGTAGGAAGTAAAGTTTCCTGGTGAAGAAAGCTACTTAGCCCCCCAGCTGCCTGTCCTCAGGTACTGGGCATTGACTAACCTCATGCGTGGTAGGCAAGCTGCTGAGTTACACCTCCAGTCCTCCTTGTATCCATAGTCTTCATTGTCCTTTGACTTAGGGAGATGGGTTGTTTCCCATGCAGCCTGCTGTTTTGAATTCCTGGCTCCACAGGAATTGCAACTTTGGCTACAGTGTCTTATTCGACAGTGCAAATGCCATGTATGGTGCTTGTGAGGATTAATACAGGTCAGCGAGAGCAAAGCACCTAACAATGGTGCCAGGTACTTTGTAGGAACACAGTGCAGATTTGTGCAGAATATATGGCCTTCCTGATACTGGTGTGTGACAGAATAAGTTGCTTTATGGATTGAATATGTCTTGTGTGTAATGGCTGCTTGAATATCTGTTGGTGCTCTGCTAAACAATTATACAATAACCTCTGACATTTATACATTTTGATATAAAAACATTTGATGTTTTGACACAAGATTTGAATAAAGTAAGCTAAGAAAATGAACAAAATTCTGACAATTCTTAGTCCAGCTCATACTTGACTCTTTGCAGATTTTGAATTCTGTTAGCCTCATAAACTTTGGTAGTC
>URS0000A9B0F3 lncRNA from 12 species 
TTTCCTTCCTCTTTTCAAGCTTATTGAAGGAGCCAAATCATTCCAATTCAGCCTGGACTGACCTTTATGTGCTTCATTTTAGTTTAAAAGAAACCCAAACTTCAGTTCTCTGGGATTCTGGGCTAAACATTAAGGAATCCATTCAAAGGTTGTACCTTCCTCCTCATGGTTAACCATTTCAAAG
>URS00013E7246 rRNA from 1 species 
TACGTAGGGCGCGAGCGTTGTCCGGAATCATTGGGCGTAAAGAGCTCGTAGGCGGCCTGTCGCGTCTGCTGTGAAATCCCGGGGCTTAACCCCGGGCGTGCAGTGGATACGGGCTGGCTGGAGGCAGGCAGGGGAGAACGGAATTCCCGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCCGTAACTGACGCTGAGGAGCGAAAGCATGGGGAGCGAACAGG
>URS0001D4A06F rRNA from 1 species 
AACGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGCCCTTTCGGGGGAGCGGCGGACGGGTGAGTAACGCGTGGGAATATGCCCTTCTCTACGGAATAGCCTCGGGAAACTGAGAGTAATACCGTATACGCCCTATGGGGGAAAGATTTATCGGGGAAGGATTAGCCCGCGTTGGATTAGGTAGTTGGTGGGGTAATGGCCTACCAAGCCGACGATCCATAGCTGGTTTGAGAGGATGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCGTGGGGGAGGCGGCAGGGGAGAATCTAAGAAGTGGGGGGCAACCATGAGTGAGCACTGGCGGGTGAGGGATGAAGGCCTTGGTGTTGTAAAGCTGTTGACGGTGGGAATAAAATGGCTGTACCAGCAGAAGAAGCCCAGGACAACTCCGTGCCAGAAGACGAGTTAATAGTCAAAGACACACGTCTGAAC
>URS00022CCAAD rRNA from 1 species 
TGGAAGCGTCTGGAAAGGCGCGCGATACAGGGTGACAGCCCCGTACACAAAAGCGCATGTGCTGTGAGCTCGATGAGTAGGGCGGGACACGTGGTATCCTGTCTGAATATGGGGGGACCATCCTCCAAGGCTAAATACTCCTGACTGACCGATAGTGAACCAGTACCGTGAGGGAAAGGCGAAAAGAACCCCGGCGAGGGGAGTGAAAAAGAACCTGAAACCGTGTACGTACAAGCAGTGGGAGCACCCTTTGGGGTGTGACTGCGTACCTTTTGTATAATGGGTCAGCGACTTATATTCTGTAGCAAGGTTAACCGAATAGGGGAGCCGCAGGGAAACCGAGTCTTAATTGGGCGTTAAGTTGCAGGGTATAGACCCGAAACCCGGTGATCTAGCCATGGGCAGGTTGAAGGTTGGGTAACACTAACTGGAGGACCGAACCGACTAATGTTGAAAAATTAGCGGATGACCTGTGGCTGGGGGTGAAAGGCCAATCAAACCGGGAGATAGCTGGTTCTCCCCGAAAGCTATTTAGGTAGCGCCTCGTGAACTCATCTCCGGGGGTAGAGCACTGTTTCGGCTAGGGGGCCATCCCGGCTTACCAACCCGATGCAAACTGCGAATACCGGAGAATGTTATCACGGGAGACACACGGCGGGTGCTAACGTCCGTCGTGAAGAGGGAAACAACCCAGACCGCCAGCTAAGGTCCCAAAGTCATGGTTAAGTGGGAAACGATGTGGGAAGGCCCAGACAGCCAGGATGTTGGCTTAGAAGCAGCCATCATTTAAAGAAAGCGTAATAGCTCACTGGTCGAGTCGGCCTGCGCGGAAGATGTAACGGGGCTAAACCATGCACCGAAGCTGCGGCAGCGACGCTGATGCGTTGTTGGGTAGGGGAGCGTTCTGTAAGCCTGTGAAGGTGGCCTGTGAGGGTTGCTGGAGGTATCAGAAGTGCGAATGCTGACATAAGTAACGATAAAGCGGGTGAAAAGCCCGCTCGCCGGAAGACCAAGGGTTCCTGTCCAACGTTAATCGGGGCAGGGTGAGTCGACCCCTAAGGCGAGGCCGAAAGGCGTAGTCGATGGGAAACGGGTTAATATTCCCGTACTTGGTGTTACTGCGAAGGGGGGACGGAGAAGGCTATGTTGGCCGGGCGACGGTTGTCCCGGTTTAAGCGTGTAGGTGTGTGTTCCAGGTAAATCCGGTTCACTTTAACACTG
>URS0000B7FAC1 rRNA from 1 species 
ACCTACGGGGGGCAGCAGTGGGGAATATTGGGCAATGGAGGCAACTCTGACCCAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATTGTAAAACTCTTTAAGTGGGGACGAAGAAAGTGACTGTACCCACAGAATAAGCCTCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGAGGCAAGCGTTATCCGGATTTACTGGGTGTAAAGGGAGCGTAGACGGCTTGGCAAGCCAGATGTGAAAGGCTGGGGCTCAACCCCAGGACTGCATTTGGAACTGTCATGCTAGAGTGTCGGAGGG
>URS00001F4C6B rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAACACATGCAAGTCGAACGGGGGTAGCAATACCTCAGTGGCGAACGGGTGCGTAACACGTGAAGAATTTGTCCAACGGCGGGGGAGTAGCCGGCCCAACGGCCGGGTAATACCGCGTACGCCCTTCGGGAGGCATCTCCTGATTGGGAAAGCCGCAAGGCGCCGATGGAGAACTTCGCGGCCTATCAGCTAGTTGGTGAGGTCATGGCTCACCAAGGCGACGACGGGTAGCTGGTCCGAGAGGATGACCAGCCACATTGGGACGTGAGACACGGCCC
>URS000030270D rRNA from 1 species 
CAGCAGCCGCGGTAATACGTAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGGGCGCAGACGGTTACTTAAGCAGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCGTTCTGAGCTGGGTGACTAGAGTGTGTCAGAGGGAGGTAGAATTCCACGTGTAGCAGTGAAATGCGTAGAGATGTGGAGGAATACCGATGGCGAAGGCAGCCTCCTGGGATAACACTGACGTTCATGCCCGAAAGCGTGGGTAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGTCGATTAGCTGTTGGGCAGCTTGACTGCTTAGTAGCGAAGCTAACGCGTGAAATCGACCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGATTAATTCGATACAACGCGAAGAACCTTACCTGGTCTTGACATGTACGGAACCCTCCAGAGACGGAGGGGTGCCTTCGGGAGCCGTAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCATTAGTTGCCATCATTAAGTTGGGCACTCTAATGAGACTGCCGGTGACAAGCCGGAGGAAGGTGGGGATGACGTCAAGTCCTCATGGCCCTTATGACCAGGGCTTCACACGTCATACAATGGTCGGTACAGAGGGTAGCCAAGCCGCGAGGTGGAGCCAATCTCACAAAACCGATCGTAGTCCGGATTGCACTCTGCAACTCGAGTGCATGAAGTCGGAATCGCTAGTAATCGCAGGTCAGCATACTGCGGTGAATACGTTCCCGGGTCTTGTACACACCGCCCGTCACACCATGGGAGTGGGGGATACCAGAAGTAGGTAGGGTAACCGCAAGGAGCCCGCTTACCACGGTATGCTTCATGACTGGGGTGAAGTCGTAACAAGGTAGCCGT
>URS0001E386D7 rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGCTGCAGGGTACTTGCTCCTTCTTTCGGCTGCCGACTGGTGGACGATGCCTAGGTATCTCCCTATTTGTTTTTGCTTACGTCCTAACGTGGGCGCTCTTACCCCATACGTCCTTACGACCTACGTGTGGAATCTTCGGACCTTCCGCTCTCGCATGATCCTATGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCGTAACTGGTCTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGGGTGAAGAAGGTCTTCGGATTGTAAAGCACTTTAGGTTGGGAGGAAGAGCAGTAAGTTAATACCTTGCTGTTCTGACGGTACCAAAAGAATAAGCACCGGCTAACTTCGTG
>URS0001DD23C1 misc_RNA from 1 species 
GATGAAGAAGTAGCGAAATGCGATAAGTAGTGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATTCCATGGGGCATGCCTGTTCGAGCGTCATTTGTACCTTCAAGCTCTGCTTGGTGTTGGGTGTTTGTCTCGCCTCTGCGTGTAGACTCGCCTCAAAATAATTGGCAGCCGGCGTATTGATTTCGGAGCGCAGTACATCTCGCGCTTTGCACTCATAACGACGACGTCCAAAAGTACATTTTTACACTCTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
>URS000221B86E rRNA from 1 species 
TGATCCCGGCCCAGAATGAATGCTTGCGACAAGCCTAATACATGCAAGTCGAGCGCACTTTTAGAGTGAGCGGCGAACGGGTGAGTAATGCGTAAGAATCTACCTTCTACATAGCCATAAATAGGTAAAGGCCAAGTCCGGTAGAAGATGAGCTTGCGTAAGATTAGGTAGTTGGTGAGGTAAGAGCTCACCAAGCCAGAGATCTTTAGCTGGTCTGAGAGGTTGATCAGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTGGTCAATGGGCGAGAGCCTGAACCAGCCATGCCGCGTGCAGGATGACGGCCTTCTGGGTTGTAAACTGCTTTTATATGGGAAGAAAAAGGTCTTGCGAGACAAATTGCCGGTACCATATGAATAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTGTCCGGATTTATTGGGTTTAAAGGGTACGTAGGCGGATTTTTAAGTCCGTGGTGAAAGCCTACAGCTTAACTGTAGAACTGCCATGGATACTGGAAATCTTGAATTCAGTTGAGGTAAGCGGAATTTATGATGTAGCGGTGAAATGCATAGATATCATAAAGAACACCTATTGCGAAGGCAGCTTGCTGGACTTGAATTGACGCTGAGGTACGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGATTACTCGCTGCTAGCGATACACAGTTAGTGGCCAAGCGAAAGCGTTAAGTAATCCACCTGGGGAGTACGCTCGCAAGAGTGAAACTCAAAGGAATTGACGGGGGTCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGATACGCGAGGAACCTTACCTGGGCTAGAATGTGAGCGCTAGATTTAGAGATAGATCGTTCTTCGGACGTGAAACAAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCCTATCCCTAGTTGCTAGCAGTTCGGCTGAGAACTCTAGGGAGACTGCCGGTGACAAACCGGAGGAAGGTGAGGATGACGTCAAATCAGCATGCCCCTTACATCTTGGGCGACTCACGTGCTACAATGGTCGGGACAAAGAGATGCTACCCTGCGAAGGCAAGCTAACCTCAAAAACCCGATCTCAGTTCGGATTGCAGGCTGCAACTCGCCTGCATGAAGTTGGAATCGCTAGTAATCGCAGGTCAGCCATACTGCGGTGAATACGTTCTCGGGTCTTGTACACACCGCCCGTCACACCATGGAAGTTGGTAATACCCGAAATCGCGCGTCTAACCTTCGGGAGGACAGTGCCTAAGGTAGGATCAGTGACTATGGTGAAGTCGTAACAAGGTAGCCGTACTGGAAGGTGTGGCTGGATTACCTCCT
>URS00005DE4A8 rRNA from 1 species 
GGCCCGCGCAAGCGGTTGAGCAAGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACCCTTGACATCGTGCGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAGCGCACAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGTAACGAGCGCAACCCTTGTCCCTATTTGCCAGCGATTCGGTCGGGAACTTTAGGGAGACTGCCGGTGACAAACCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGGCCCTTACGGGTAGGGCTACACACGTGCTACAATGGCCGGTACAATGGGTTGCAAAGCGGCGACGTGGAGCTAATCTCATAAAGCCGGTCTCAGTCCGGATCGGAGTCTGCAACTCGACTCCGTGAAGTCGGAATCGCTAGTAATCGTGCATCAGAATGGCACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGACTGCACCAGAAGTGGTTAGCCTAACTTCGGAGGGCGATCACCATCGGTTGTACATATCT
>URS00010C272E rRNA from 1 species 
TACGGAGGGTGCGAGCGTTGTCCGGAATCACTGGGCGTAAAGGGCGCGTAGGCGGCCTGCTAAGTCGAACGTGAAATCCCCGGGCTCAACCCGGGAACTGCGTCCGATACTGGCAGGCTTGAATCCGGGAGAGGGATGCGGAATTCCAGGTGTAGCGGTGAAATGCGTAGATATCTGGAGGAACACCGGTGGCGAAGGCGGCATCCTGGACCGGCATTGACGCTGAGGCGCGAAAGCCAGGGGAGCAAACGGG
>URS0001E10DE4 rRNA from 1 species 
GATGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAGCGAACAGACGAGGAGCTTGCTCCTCTGACGTTAGCGGCGGACGGGTGAGTAACACGTGGATAACCTACCTATAAGACTGGGATAACTTCGGGAAACCGGAGCTAATACCGGATAATATATTGAACCGCATGGTTCAATAGTGAAAGACGGTTTTGCTGTCACTTATAGATGGATCCGCGCCGCATTAGCTAGTTGGTAAGGTAACGGCTTACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATCGGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTAGGGAATATTCCGCAATGGGCGAAAGCCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTCTTCGGATCGTAAAGCTCTGTTATTAGGGAAGAACAAATGTGTAAGTAACTATGCCCGTCTTGACGGTACCTACTCAGAAAGCCACGGCTAACTACGTG
>URS000163CC5A rRNA from 1 species 
CCTACGGGGGGCAGCAGTGAGGAATATTGGTCAATGGGCGGGAGCCTGAACCAGCCAAGTCGCGTGAGGGAAGACGGTCCTATGGATTGTAAACCTCTTTGGGCGGGGAGCAATGCCGGGCACGTGTGCCCGGAGGGAGAGTACCCGCAGAATAAGCATCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGATGCGAGCGTTATCCGGATTTATTGGGCGTAAAGCGCTCGTAGGCGGTATGTCAAGTCAAGGGTGAAAGCCCCGCGCTCAACGTGGGAACTGCCTTTGAAACTGGCAAACTTGAGTGTGTGAGAGGATAGTGGAATTCCAGGTGTAGGAGTGAAATGCGTAGATATCTGGAGGAACAGCAGTGGCGAAGGCGACTATCTGGCACATAACTGACGCTGAGGAGCGAAAGCGTGGGTAGCAAACAGGATTAGATACCCCAGTAGTC
>URS0000FA15DB rRNA from 1 species 
GACGAACGCTGGCGGCGTGCCTAATACATGCAAGTCGAACGCAGTGGGGACGGGTGAGTAACACGTGGGTAACCTCCCATCAGAGGGGATAACACTTGGAAACAGGTGCTAAACCGATACTGATGGATGGACCCGCGGTGCATTAGCTAGTTGGTGAGGTAAAGGCCTACCAAGGCAAGGATGCATAGCCGACCTGAGAGGGTGATCTGCCACATTGGGACTGTGACACGGCCCAACCTCCTACGGTAGGCAGCAGTAGGGAATCTTCCGCAATGGGCGCAAGCCTGACGGAGCAACGCCGCGTGAGTGAAGAAGGTTTTCGGATCGTAAAGCTCTGTTGTCAGAGAAGCGGTATCTTACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGGTAATAC
>URS0000AF79E1 sRNA from 1 species 
ACCCGCTGAATTTAAGCATATTAATAAGCGGAGGAAAAGAAACTAACAAGGATTCCCTCAGTAATGGCGAATGAAGCGGGAATAGCTCAATTTTGGAATCTCCGCTTCGGCGGCGAATTGTAGTTAATAGAGGTGTTTTCTCAGGATGCGGTGTGGTTTCTAAGTCCCTTGGAACAGGGCATCATAGAGGGTGAGAATCCCGTATGTGGAACCGCACTTGTCCCTTCGATACACTTTCTACGAGTCGGGTTGTTTGGGAATGCAGCCCAAAATGGGTGGTAAATTTCATCTAAAGCTAAATATTGGCACGAGACCGATAGCGAACAAGTACCGTGAGGGAAAGATGAAAAGCACTTTGAAAAGAGAGTCAAACAGTACGTGAAACCGTTAAAAGGGAAACGATTGGAACTAGCAGTGACAGCATGTAATCAGTGGTTTGCTTGTGTTGTGATGGTTGTGTCTTTAAAAAAGCTCTTCTTGATCAGCCTTGTGGACTATGCACTTGCGTGTTTGTCGTGTCAATGTCAGTTTCTTCGGCGGGAGAAAACCGGGGAAAAGGTAGCTTGGTTCTTCCAAGTGTTACAGGTTCTCGGGTATATCGCCCTAGGGACTGAGGAGTGCGGGTCGTGCCTTTTGGCAAGGAAGCCTTTTGATGCCGGTGTATGTTTCTGCCCGACTGCTTGCAGTGGTGTGGTTGCATGCATGGTAATGCTTGGGGTTTTCCATTCACGTCCCTCAGATATTGACGAAATAGTTTCAACCGACCCGTCTTGTAACACGGACCAAGGAGTCTAACATGTATGCGAGTCTCTGGGTGTAAAACTCGTGGGCGCAATGAAAGTAAACGTAGGTGAGACGCTTCGGCTGCATCATCGACCGATTTGGATTTTTTATGAAAGATTTGAGTATGAGCATATATGTTGGGACCCGAAAGATGGTGAACTATGCCTGAATAGGGTGAAGTCAGAGGAAACTCTGATGGAAGCTCGTAGAGGTTCTGACGTGCAAATCGATCTTCAAATTTGGGTATAGGGGCGAAAGACTAATCGAACCATCTAGTAGCTGGTTCCCACCGAAGTTTCCCTCAGGATAGCTGGAACTTGTTCAGTTTTATCAGGTAAAGCGAATGATTAGAGGCCTTGGGGTTGAAACAACCTCAACCTATTCTCAAACTTTAAATAGGTAAGAAGTCTGACTTGCTTAACTGAAGCCAGACGATCGAATGTTGAGTTCCAAGTGGGCCATTTTTGGTAAGCAGAACTGGCGATGCGGGATGAACCGAACGCGGAGTTAAGGTGCCAAAATCAACGCTCATCAGACCCCACAAAAGGTGTTGGTACATCCAGACAGCAGGAAGGTGACCATGGAAGTCGGGACCCTCTAAGGATCGTGTAACAACTCACCTGCCGAATGTATTAGCCCTGAAAATGGATGGCGCTAAAGCGTTGTACCTATACTCCGCCGTTGTGTTAATAACGATGACACAACGAGTAGGTGGGCGTAAAGGTTTTTGTTCTTTTTGAACTTTTGTGACGAAGCTTTTGATGTGAATCTGAGTTGAACGGCCTTTAGTGCAGATCTTGGTGGTAGTAGCAAATATTCAAATGAGAACTTTGAAGACTGAAGTGGAGAAAGGTTCCTTGTGAACAGCAGTTGGACAAGGGTTAGTCGATCCTAAAAGATAGGGTAATTCTGTTTGAAATGGCTTTCTTGTAAAGCACCTTATTGAAAGGGAATCAGGTTAATATTCCTGAACCGGAATGTGGATATTTCTCTCTTCGGAGGGAATGTGTGGTAACGCAACTAAACTCGGTGACGCTGGCAAGTATCCCGGGAAGAGTTCTCTTTTCTTTTTAACGATTGCATTGACCATGAAATCAGGTTAACTGGAGATATGGTTAAATCGCAACCAGGGCCACCTTCGGGTAGCCGACGGTAAAGCACTGCAATTTTTTCGCAGTGTCCGGTGCATTCTTGACAGCCCGTGAAAAACCGAGGGAAATAATAATTCTCACATCCGGTCGTACTCATAACCGCAGCAGGTCTCCAAGGTGAACAGCCTCTAGTTGATAGAAGAATGTAGGTAAGGGAAGTCGACAAAAAAGATCCGTAACTTCGGGATAAGGATTGGCTCTAAGGGTTGGGCATGTTGGGGCCATCTCCTTTTTGGATTTGCCTGAAGCTCGTTGATTAGCGGGCGTGGATGCGCTTTCGGGTGCGTTCTGCCTGCTCGATTGACCTGTTGAGGGTGGTGGCTGAGGGGGGGGGTTTTTTCTCCTCTTCTCAACTGGCATGTAATTAGCAACCGACTTAGAACTGGTACGGACAGGGGGAATCCGACTGTTTAATTAAAACAAAGCATTGCGATGGCCGGAAATGGTGTTGACGCAATGTGATTTCTGCCCAGTGCTCTGAATGTCAAAGTGAAGAAATTCAACCAAGCGCGGGTAAACGGCGGGAGTAACTATGACTCTCTTAAGGTAGCCAAATGCCTCGTCATCTAATTAGTGACGCGCATGAATGGATTAACGAGATTCCCATTGTCCCTATCTACTATCTAGCGAAACCGCAGCCAAGGGAACGGACTTGGCAGAATCAGCGGGGAAAGAAGACCCTGTTGAGCTTGACTCTAGTCCGACTTTGTGAAAAGACATTGGAGGTGTAGCATAGGTGGGAGCTTCGGCAAACTTGAAATACCACTACTCTGATCGTTTTTTTACTTATTTAATGAAGCGGGAAGCGAGTTTTCACCGACTCAATTTTTGGGATTTAAGCTCCCCCTTTTTGGGGGGGTGATCCGAGTTAAAGACATTGTCAGGTGGGGAGTTTGGCTGGGGCGGCACATCTGTCAAAAGATAACGCAGGTGTCCTAAGGTGAGCTCAATGAGAACGGAAATCTCATGTAGAACAAAAGGGTAAAAGCTCACTTGATTTTGATTTTCAGTGTGAATACAAACTGTGAAAGCATGGCCTATCGATCCTTTAGTCCTTTTTTGAAATTTAAAGCTAGAGGTGTCAGAAAAGTTACCACAGGGATAACTGGCTTGTGGCAGCCAAGCGTTCATAGCGACGTTGCTTTTTGATCCTTCGATGTCGGCTCTTCCTATCATTGTGAAGCAGAATTCACCAAGTGTTGGATTGTTCACCCACTAATAGGGAACGTGAGCTGGGTTTAGACCGTCGTGAGACAGGTTAGTTTTACCCTACTGATGAGTATCTATGATATAGACCACAGTTGTTGCAATAGTAATCAAACTCAGTACGAGAGGAACCGTTTGTTCGGACAATTGGTATTTGCCCTTGGTTGAACAACCAATGGGGCGAAGCTACCATCCGTAGAATTATGACTGAACGCCTCTAAGTCAGAA
>URS0001793305 rRNA from 1 species 
TACGTAGGGGGCGAGCGTTGTCCGGATTTATTGGGCGTAAAGCGCGCGTAGGCGGTTTGGCAAGTCTGATGTGAAAACCCGGGGCTCAACCCCGGGCGTGCATTCGATACGAGCAAACTAGAGTGTTGCAGGGGAGACTGGAATTCCTGGTGTAGCGGTGAAATGCGCAGATATCAGGAGGAACACCGGTGGCGAAGGCGGGTCTCTGGGCAACAACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGG
>URS0000082604 rRNA from 1 species 
GAGTTTGATCGTGGCTCAGGATGAACGCTGGCGGCGTGCTTAACACATGCAAGTCGAACGAAGCACTTTACCACGATTCCTTCGGGATGACGGTTTAGTGACTGAGTGGCGGACGGGTGAGTAACGCGTGGGGAACCTGCCCCATACCGGGGGTAACAGCCGGAAACGGCTGCTAATACCGCATAAGCGCACAGTACCGCATGGTACGGTGTGAAAAACTCCGGTGGTATGGGATGGACCCGCGTCTGATTAGCCAGTTGGCGGGGTAACGGCCACCAAAGCGACGATCAGTAGCCGGCCTGAGAGGGCGACCGGCCACATTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTGGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCAACGCCGCGTGAGTGAGGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGGGGAAGAAGAAATGACGGTACCTGACTAAGAAGCCCCGGCTAACTACGTG
>URS00023E414C lncRNA from 1 species 
CATGTTCACAATTTGGTAGCTGCTAGTTATTAGTCATTACATATAATATTTGAGATCAAAATATATTATTTTTTTAGGAAAAAAAAATCAAAGTATATGTAATGCAAGCTAGGAGGCCTAGCATGAGGTTCACTGTAATCTAGAGGAAGATTAAATTAACTAAGAAGGAATTAAACTAATTATAAAATAAAGAAAATATCAAACTCCAAAAATCTACGGGCA
>URS000233A4B4 lncRNA from 1 species 
TGTTAACAAAAATAGAGTGGGGAATAGGGTTAGGCCATGACAGGCAATGATCCTAAGAGCTAGAGATCTCTCCCACCCCAACAGAGAGAGACAGAGAGACAGACAGAGAGAGAGAGAGGGAGACAGAGACAGAGAGAGAGACACACACAGAGAGAGAGAGACACACACGCACACACACAGAGAGAGAGAGACACACACACACACACACACAGAGAGACACAGAGAGAGAGAGAGACAGAGACAGAGACAGAGAGAGAGAACCCTAAGGTATTAATATTCCTGACTTGAATACCTCAGGCTTTTCCCAGCCAACTTCCACGTTGCTCTCCTATCCGTCTCCACACCTAATTCTTCTACCAAACCCTTCTGTCCACCCCAGGAGATTGTGAACTCAGGCACCAAATCCAACAAGCTCCCCGAGGAACTTACAACAGTCTGTTTTACAGAGAAGTAAATGTTGCTGAGAGAGAAAATTGTCAGGCCTCGGTGTTCCAGAGCAAGAGGCATTCCTTCATTCCCAGAGAGGCCCTGGGCCTCAGCAAGCAAGCCCGACAAGCCCTCCGCAGCCAGAATCCAAGCTTCAGGCTGCACCTCCCTCACCGCTGGGCCCTGGACAGTGAGGCTGCTGCTCAGAACCCCTCTCCTCAGAGGGAAATTCCTCAGGGCTGCCCCACCCGACCCGTTCTATCAGTCACTCAAGCCCTCTATCCTCTGTCACAGCCTGGCTCTGTCCCTTCCCATGCCCCAACCCCCAACCTCCCAGGACCCAGTATCTCAGGATTTCTGCCCTCCTCCAGCCCCGAGCAGCCTGGAAGCCAAGTGGCAAGGATGTAGTCAGCCGGGTGGGCCCTGAGAGCCGGTGGAATGGTGTCCATGTTGCAGGAAACAAGGGAAGGTGAGGGGTACAGGGGTGCCTGTGCCAGGCCACCACTCCACAGCTCATTCTTCTCTGAGGTTATTCCCCGACCCATACCCCTCTGGAGCCCACCCCAGCTGCTTCCTCTTCCTAGGGGTCTCCACCTGATGTTCTGTGAC
>URS0001C069FB rRNA from 1 species 
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGATGAAGGGAGCTTGCTCCTGGATTCAGCGGCGGACGGGTGAGTAATGCCTAGGAATCTGCCTGGTAGTTGGGGATAACGTCCGTAAACGGGCGCTAATACCGCATACGTCCTGAGGGAGAAAGTGGGGGATCTTCGGACCTCACGCTATCAGATGAGCCTAGGTCGGATTAGCTAGTTGGTGGGGTAAAGGCCTACCAAGGCGACGATCCGTAACTGGTCTGAGAGGATGATCAGTCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGAAAGCCTGATCCAGCCATGCCGCGTGTGCGAAGAAGGTCTTCGGATTGTAAAGCACTTTAAGTTGGGAGGAAGGGCAGTAAGTTAATACCTTGCTGTTTTGACGTTACCAACAGAATAAGCACCGGCTAACTTCGTG
>URS0000ECE6B7 rRNA from 1 species 
GGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTTGTTGCCAGCGGTTAGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTAGATCAGAATGCTACGGTGAATACGTTCCCGGGCCTT


================================================
FILE: src/alphafold3/test_data/miniature_databases/uniprot_all__subsampled_1000.fasta
================================================
>tr|A0A3A3JCS5|A0A3A3JCS5_SALMO Octaprenyl diphosphate synthase OS=Salmonella montevideo OX=115981 GN=ispB PE=3 SV=1
MNLEKINELTAQDMAGVNATILEQLNSDVQLINQLGYYIISGGGKRIRPMIAVLAARAVGYQGNAHVTIAALIEFIHTATLLHDDVVDESDMRRGKATANAAFGNAASVLVGDFIYTRAFQMMTSLGSLKVLEVMSEAVNVIAEGEVLQLMNVNDPDITEENYMRVIYSKTARLFEAAAQCSGILAGCTPEQEKGLQDYGRYLGTAFQLIDDLLDYSADGEHLGKNVGDDLNEGKPTLPLLHAMRHGTPEQSAMIRTAIEQGNGRHLLEPVLEAMTTCGSLEWTRQRAEEEADKAISALQILPDTPWREALIGLAHIAVQRDR
>tr|K8XEW0|K8XEW0_RHOOP LexA repressor OS=Rhodococcus opacus M213 OX=1129896 GN=lexA PE=3 SV=1
MKDDSSTDGSTPRVSGGSAAGLTDRQRRVLEVIRTSVNERGYPPSIREIGDAVGLTSTSSVAHQLRTLERKGFLRRDPNRPRAVDVRGLDEVAAGVAANASASAAVGLAAVKSGADGAPLPEPTFVPVLGRIAAGGPILAEEAVEDVFPLPRELVGQGSLFLLKVVGESMIDAAICDGDWVVVRQQNVAENGDIVAAMIDGDATVKTFKRTENEVWLMPHNPLFDPIPGNDAVILGKVVTVMRKI
>tr|A0A0P0EB71|A0A0P0EB71_9MICO 2Fe-2S ferredoxin-type domain-containing protein OS=Microbacterium sp. No. 7 OX=1714373 GN=AOA12_02545 PE=3 SV=1
MPRVTYIQPDGASSEVEASRGDSVMSAAIAAGVPGIVADCRGGLTCATCHVFVDEEWLERVGEKEPEEEEMLELTAVPATECSRLSCQIVLVDELDGLVVTVPEEQE
>tr|A0A212KYF3|A0A212KYF3_9DELT Uncharacterized protein OS=uncultured Desulfovibrio sp. OX=167968 GN=KL86DES1_10311 PE=4 SV=1
MNFPFIPKIVAFARQHTLALAAAVLVLIVFVVSFSGWRYYQYRQSSQYAYEILRDALKTGDTETIAELVDFNSLSRGLAKDLAQNYPFLKAGADQERQIGDMIQTALLKQSRTKQEPVKDEPDLKIRLKTALYALPPDFLAQLASSLSLQPPNDGTALLTAKVRHPLLDKNFLLILRMDQTPTGWRVRQLVNSPELVRQFREAQVERMTAQRQMILDKNAATEKRMKELFPLQPCSASAGLISDGSTLLVVVHVLARDIGTVSVNNMNLFTELSSATGELLLTRYLNAVQPTHPGEDFERNWTIELDGNSELGRRVLNGQPLQCKGAWKTLGLDNGEVLHISEAPAPIEEFQ
>tr|A0A5H1ZRJ3|A0A5H1ZRJ3_DANRE Transmembrane channel-like protein (Fragment) OS=Danio rerio OX=7955 GN=tmc2b PE=3 SV=1
XSSSSDNNSDDESMSEGEMARLKEEVEEKKKLIATLRNKPWRMKRRLKCLKEAQEFVEKFEGALGKGKGRRLYAFKVMMTKKLIKFNRDFENFKTACIPWESRIKEVESHFGSSVASYFIFLRWMYGLNLVLFGFMFGLVVIPELLMGIPYGSIPRKTVPREEQDSAMDFSVLFEFGGYCKYSILFYGFYNNQRTIGFLQFRLPLSYLLVGVGIFGYSLMVVIRTMARNANEGGDGGDEGNFTFCWKLFTSWDYLIGNPETADNKFASTTTSFKESIVDEQENLKDENIHLRRFLRLLANVLILCCLAGSGYLIYAVVKRSQDFAKRDRNELTWLQKNEVEIVMSLLGLVCPPLFEAIAELEDYHPRIALKWQLGRIFALFLGNLYTFLFALFDEVNGKLENEKQIKNQTVWALKEYYANYTLQYNITENIPPPNIAPADVIRGPCWETEVGIEFVKLTVSDIQVTYLTILIGDFLRALIVRFLNYCWCWDLEAGFPSYAEFDISGNVLGLIFNQGMIWMGAFYAPGLVGINVLRLLSSMYYQCWAVMACNVPHERVFKASRSNNFYMGLLLLVLFLSLMPVIYSIMTLPPSFDCGPFSGKDKMYDVITETIDKDLPPFMADIFSYASNPGLIISVVLLMVLAIYYLNAVSKAYQNSNLELKRKMQMQRDEEKNRRNNKDSTNQVMKDLEDLLPNKSLIPPPSVEETEKPAEQPSKSSKVTGKPGAAASGKGVHVQKDVSLAAANPRAPVTRAPGPRQPGPLPGNPRGPPPGQGMGRGRGGPPPRR
>tr|A0A1H1BTM6|A0A1H1BTM6_9GAMM Short chain dehydrogenase OS=Pseudoxanthomonas sp. CF125 OX=1855303 GN=SAMN05216569_1554 PE=4 SV=1
MTADPNLDQTLQLLEAIAADRTVLDMWPEEERVRLHKAIASIYHPEPKLRRKKTKELERERHAEKLRRADALLDQTGIRALRRAPVFTTPNYFPPAGFVAQDNVEERPEPLESPELRHCYVCKKKYTQVHHFYDQMCPECAEFNFAKRTELADLSGRVALLTGGRVKIGYQAGLKLLRAGAHLIVTTRFARDSAARYAQEPDFEQWGHRLEVFGLDLRHTPSVEAFCRELSAKYPRLDFIINNACQTVRRPPEFYAHMMEAETAALRDTPEHVRKLLGSYEGLRSHDLLPEASALQVAIKQGFPEVAGLTHAAELSQVPLLAEELLGQKHLFPEGRLDQDLQQVDLRGRNSWRLQMAEVPSVELLEVQLVNAIAPFLINARLKPLMLRTPERDKHIVNVSAVEGQFYRNFKTTRHPHTNMAKAALNMMTRTAAADYHGDGIHMNSVDTGWVTDEDPVELAARKTVQERFHPPLDIVDGAARIVDPIIHGINTGEHVWGQFLKDYRPTDW
>tr|A0A217EZB4|A0A217EZB4_9SPHN Uncharacterized protein OS=Croceicoccus marinus OX=450378 GN=A9D14_19100 PE=4 SV=1
MAAPLALAACGSGDDTEMMDDTAMAEGQMADGQMPMDGGDMSMMGSDSAMQTASAEGTVTAIDADAGTITVDHGAVPAIEWPAMTMAFEADEELRQDVAVGDTISFDFTTDESGNAITSITKK
>tr|A0A1C5RVT8|A0A1C5RVT8_9CLOT Uncharacterized protein OS=uncultured Clostridium sp. OX=59620 GN=SAMEA3545292_01435 PE=4 SV=1
MSGLYTITLNGVSEEVYNKAADYIQAHALRLNYRPEVSTIDCEFPDDLDPAKAPELSEAVIRKVHQQL
>tr|A0A2M7MVT7|A0A2M7MVT7_9PROT Uncharacterized protein OS=Hydrogenophilales bacterium CG_4_10_14_3_um_filter_63_21 OX=1974028 GN=COZ24_06435 PE=4 SV=1
MRTWLDLNGLCARKREQGEHPRPFWTLMKRYLPQNYRWNIVHEDDSLIIAGIEHGLHGHLGPNGARGNPKNLRSVGKANTGHTHSAGITEGVYTAGVFGQLDMGYNKGLSSWSHSFILTYENGKRTICTIRDGRAWR
>tr|A0A1H5Q8D7|A0A1H5Q8D7_9PSEU Transcriptional regulator, LacI family OS=Amycolatopsis pretoriensis OX=218821 GN=SAMN05421837_101914 PE=4 SV=1
MTTKSDDPEPCASRVTIARIAAETGVSVPTVSKVLNGRPDVAESTRARVEAVIGKYGYRRRADERSRRSRLLELMFHELESTWALEIIRGVEYVARENGMAVVLAESSGRHTPGQSWLESVLARRPVGIVSVCSDFTGGQLAKLRARDIPLVVVDPAGAPGPETPSIGATNWQGGLTATRHLVELGHRRIAMIGGPDGVLCSRARIDGYRTALETAGLAFDPALVRRGDFHVRSGYRELASLLTLPDRPTAVFAGSDLQALGVYEAARDAGLRIPDDLSVVGFDDLPVARWLTPELTTIRQPLQEMAAAGARLAISLARGTHPESHRLELATSLVVRQSTAAPARRAVPAGRG
>tr|A0A1I0W1D7|A0A1I0W1D7_9ACTN NAD-dependent protein deacetylase, SIR2 family OS=Nocardioides alpinus OX=748909 GN=SAMN05192575_101623 PE=4 SV=1
MTLAPTDRVESALDLLTTRPLVVLTGAGLSTDSGIPDYRGPGSTARAPMTYQEFVGSAEAQQRYWARSHLGWQRMGRALPNDGHRALAALDPVLLITQNVDGLHEAAGSRHLVALHGRVADVICLSCRTTSSRDDLEQRLDDLNPGWLEQHGWVESRPDGDVDLDDTSDFVVPTCACGGPIKPDVVFFGENVPADRVARCYAAVESLGPDGALLVAGSSLTVMSGLRFVKRAAQGGTPIVIVNRGATRGDPLASYTLDVGCSEFLTRLAELAG
>tr|A0A4W2HU19|A0A4W2HU19_BOBOX Ubiquitin conjugating enzyme E2 L3 OS=Bos indicus x Bos taurus OX=30522 GN=UBE2L3 PE=3 SV=1
EGAEARGDARPQQVALLPQLFDLLVLGQQRARLLRQVPRALVGQGLAKLQARAALSGHRRAHGPQELEEIRKCGMKNFRNIQVDEANLLTWQGLIVPDNPPYDKGAFRIEINFPAEYPFKPPKITFKTKIYHPNIDEKGQVCLPVISAENWKPATKTDQVIQSLIALVNDPQPEHPLRADLAEEYSKDRKKFCKNAEEFTKKYGEKRPVD
>tr|H2DDU6|H2DDU6_9BACT Exported protein KikA OS=uncultured bacterium OX=77133 GN=kikA PE=4 SV=1
MNRKMTVVSASLVGALSLFSQTAKADDWGCQVLLCLSDPRGPTTESECKPPIHKLWDHLRKGKPFPSCAMATNSRTGKRSYAQLVYDPYDPCPDGTKPAGGYIAQSQSADRKDWRRLQYAFSTHGRRYDSGGAWNMYEGNGPRACVGNHLGSYSVYRGNDDSNISVQVYDQVVWQQPQNPRAIDVFIDEAFHHRVRY
>tr|A0A7D7KQY5|A0A7D7KQY5_9MAGN Maturase K OS=Neolitsea pallens OX=344110 GN=matK PE=3 SV=1
MEELQGYLEMDGFRQQYFLYPFLFQEYIYALAHGHALNGSILYEPVENLDHDNKSSSLIVKRLITRMHQQNRLIISVNDSNQNRFVGHNNHFDSQMISEGFAVVVEIPFSLRLVSSLEEKEIAKSHNLRSIHSIFPFFEDKLSHLNRVSDILIPHPIHLEILVQTLHSWIQDTPSLHLLRFSLYEYWNSNSLITPKNAISLFSKENQRFFLFLSNSHVYECEFIFIFLRKQPFHLRSKSFGSFLERTHFYAKIEYLVVVLCNDFQKTLWLFKDSFMHYVRYQGKSILASRGARLLIKKWKSHFVNFWQCHFDLWSQPARIHIKQLYNHPFHFLGYLSSVRLNSSVIRSQMLENSFRIDTAIKKFETVVPIIPLIGSLAKAKFCNVSGHPISKPFRADLSDSEILNRFGRICRNLSHYHSGSSKKQSLYRIKYILRLSCARTLSRKHKSTIRAFLKRLGSEFLEEFFTEEEQALSLIFPTTSSPSHRSHRERVWYLDIIRINDLVSHL
>tr|A0A839YFJ7|A0A839YFJ7_9SPHN Glutamyl-tRNA synthetase OS=Sphingomonas sp. BK580 OX=2586972 GN=FHY05_001379 PE=4 SV=1
MSATEINERAVVTRFAPSPTGFLHLGGARTALFNLLFARHHGGTFRLRIEDTDRARSTQPAIEAILNGMRWLGLDWDGEEVYQFARADRHAAVAHRMIEAGHAYRCYLTSEELDAMRAAAQAAKQPLRIRSPWRDRTDWPADQSYVVRLRAPTEGATTIHDRVQGEVTVQNAELDDLVLLRSDGTPTYMLAVVVDDHDMGVTHVIRGDDHLNNAFRQLPIYRAMDAIEGGWPDPVYAHIPLIHGSDGAKLSKRHGAVGIEAYRDEMGILPEALDNYLLRLGWGHGDEEIIAREDAVRWFDLDAVGKSPSRFDLKKLEHLNGHYIRASDDSRLADLVAEKLGLDRDDTRRAVLAAAMPALKPRAANLNELADGTAFLFATRPLVIDTEAAPLLAGEAPALLARLHAALDAVHNWDTETIEAAVRQVADAAGVKLGQVAQPLRAALTGRRTSPGIFDVLVLLGRDESLARIADHQA
>tr|A0A1B3Z9R2|A0A1B3Z9R2_9SPHN Uncharacterized protein OS=Sphingomonas panacis OX=1560345 GN=AWL63_09520 PE=4 SV=1
MFDRCNDKALTVVSMCDDVPPAPERRSDARNLSILKAAILRTALGEELCLVRNISRGGLMAHIFSELEVGDPVKIEFRSSKIVRGRVVWRRPELMGVRFSQFIDIGEILTDPKPQPSHAARAPRVTVNVPARLRSGGRYQAAALGNISQGGARIYLSEPDRLGDDVVLSVAGLPVLTGSVRWRDDTAAGIAFSELLAFEDVGRWVSSHNIGVPPQLVE
>tr|A0A7V8Z0K8|A0A7V8Z0K8_9BACT 2,3-bisphosphoglycerate-dependent phosphoglycerate mutase OS=Blastocatellia bacterium OX=2052146 GN=gpmA PE=3 SV=1
MHKLVLIRHGESEWNKENRFTGWKDVDLSEKGREEAQAAGKLLKAEGFTFDESYTSVLKRAIRTLWIILDELDLMWIPETKSWLLNERHYGALQGLNKAETAAQYGEEQVQIWRRSFDIPPSIMEETDERHLGKDPRYCEIEAGKFPGSECLKDTVARVIPYFETAILPKVKDGKRIIVAAHGNSLRALVKYLDGISDTEIVNLNIPTGIPLIYELDDDIKPIKSYYLGDNEAIRKAQEAIANQGKAK
>tr|A0A3C0TX47|A0A3C0TX47_9PROT Ribosomal-protein-alanine N-acetyltransferase (Fragment) OS=Alphaproteobacteria bacterium OX=1913988 GN=DCO82_10580 PE=4 SV=1
VATHNEAAISLYKRQGFIAAGLRKAYYAPEPGQSTSTDALIMRCNL
>tr|A0A1M3DHD8|A0A1M3DHD8_9SPHN DUF4142 domain-containing protein OS=Sphingomonas sp. 67-36 OX=1895849 GN=BGO24_13795 PE=4 SV=1
MKLAAMTMTAAALALTACGHKETTTTMTTDNTVVATNDIAAVPTPSGGQSFANTAAASDAFEIATSKLALDKSGSAAVKKFAQKMIDAHTGSTARLKAIAAGAVPAITPDPTLTAGQQATVDSLKNLTGPDFDKAYAAAQVDGHQKTLDALKAYAATGDVPAFKDFATNLVPTVTAHLNMAKSLKP
>tr|A0A661FLP6|A0A661FLP6_9GAMM ThiF domain-containing protein OS=Gammaproteobacteria bacterium OX=1913989 GN=DRR11_20880 PE=4 SV=1
MTTDYTARFARQITLPQIGTVGQQRLADSHALIIGLGGLGSAASLYVANSGVGRLTINDFDRVDITNLPRQILFTEQDIDEFKTTATAKRLQQINPGIQIDEINQRLTEAALHEAVAASDIVLDCTDNFVTRGAINRACYAAQRPLITGAAIRFEGQLAVFRHDVPRGRHLPDNPCYNCLYTEEDENLEGCAGQGILAPVVGTIGCMMATEAIKLLAGIESLLNGKLWIYDALSVTTKTVRINARVDCPVCGVKA
>tr|A0A225NGS3|A0A225NGS3_9RHOB PMT_2 domain-containing protein OS=Marinibacterium profundimaris OX=1679460 GN=ATO3_21925 PE=4 SV=1
MRLGVLAVLALTLYRVVLLAFASADLFVDEAQYWAWGQNLEFGYYSKPPLIGWVIRAFTEVAGSDAPFWIRLPGPLFHGAAALVVLATARRLWGDVAGAATGIAYASMPGVALGALLISTDTILLPFFALALFFWLKLTERSSAGVALAMGAAVGLGMMAKYAAIYFVLGALFSVIFVRGARISWRDAALAALAFLVVFAPNILWNLQNGLTTVSHTADNVDWINDPSTRLRLNFSGLAEFFGGQFGVMGPVFFAAYLVVVARKIVTGDWPARWLIWMSLPIILLVCVQAILSRAYANWAAPAYVAAVILTAPWLFDRARRIYCAALGINLALSLALPLAAVFATSWTLNDRLVLGRYVGRAEASARILSTAREAGLTDVVATSRDLLADLFHAAKGTGIAPWSVPFEGHVPHYYAQRFPYPTGQSAPALYADFADVPPLCAPGTEVTELTRWDIPGGAYRGRTLVAWRVGPGCWTD
>tr|A0A0E3SH12|A0A0E3SH12_9EURY Uncharacterized protein OS=Methanosarcina horonobensis HB-1 = JCM 15518 OX=1434110 GN=MSHOH_2470 PE=4 SV=1
MIMNEHKTLWEKYFLNFRNVASPLRKPALFDWLYNSYRCLYLSCVDPSLVSRLTDLKTCLSMIGVAVDDSCDYALLREKNGGDKFSYEILSMLYNTDKIESGDYILLDAHLTNNMYIKTTIGIYSDLVRNQIASLPRYCDFRGEFLLAMRNVAESMEFSYLLNKNKIVYPFSHVVRSRAASTMIETHSLLDLMSSKNFDTSELGKAIVLFKLADIVAMLSNTINTWTREITERDYSCPVISLALEKKLIKFSDFERASTENLKEKLSPVSEVIEDELDKAILSMKEFAENSEIKSFDTSKFVNNYVNLYWQTDAMN
>tr|A0A6P1BJ03|A0A6P1BJ03_9BRAD Isoprenylcysteine carboxylmethyltransferase family protein OS=Bradyrhizobium uaiense OX=2594946 GN=FNJ47_21045 PE=4 SV=1
MNETSNPPRINLRRAAFTFVGLGTLLFLAAGTMRWAGAWVFLLEITIGGLITEAWLARHDPGLLAERRTARGQAGWDRIITSIMPLLWLTWLPLMALDAVRYQTSFIPVWLQCTGALMIAASFYIAYRTYRENSYAAPVVKIQRERGHTAVTTGPYAYVRHPIYAGGLLTYLGTPLLLGSWYGLAIVPVMAALLGLRSMMEERMLTAELDGYADYIARVRYRLVPMVW
>tr|A0A7X6LY41|A0A7X6LY41_9NOCA Respiratory nitrate reductase subunit gamma OS=Nocardia veterana OX=132249 GN=narI PE=4 SV=1
MTSTVWATLPYIAFTSFVLGHLWRYRNDQFGWTTRSSQIYESRLLRLGSPLFHFGMLGVIGGHVLGVLIPQSWTDAVGISEHLYHVIAVAAGSVAGVAVIAGIAILAYRRLRVPAVRKATTRNDVFMYVLLAAALITGLLNTVGSNLLWGTYNYRETVSPWFRSLFTAHPQPDLMVGTPWTFQAHGLIVLTLIAVWPYTRLVHMFSAPVGYLVRPYVVYRSKPVDTANKRKYARAWQTPVLPR
>tr|A0A508XB42|A0A508XB42_9HYPH Diguanylate cyclase OS=Sinorhizobium medicae OX=110321 GN=EMEDMD4_790360 PE=4 SV=1
MELQESAIYAGPPIASPEVRSQLLRPAVMAEVERLLGGRTRDIRLKGELGRLFEERSWSRTAKIIRAWMIWVTLLDVLTLGLNAILLPNAVALSMLPPACILPPAALATAFIWRKPRGVGLQRVSLVAGLFLILLSVALVGVSAGGEFYERHLNIMLFVAITAIIIFSIPLAWTVAVASFALALYLIFQLRNPMLDTGSAVAGTLFFTSGIVATVVARRTMTILAQKTFLLELRDKRRVAELADANARLERLAKTDPLTGIANRRWMMETLNRLWGAGAERPAGTAMLMCDIDDFKSLNDRLGHAEGDRCLVKVAGIIQSSVRRNRDHVARYGGEEFLVVLPGADVQAALATAERIRASVEAASLPNPASRVAPYVTLSIGVAAQGAAGEIIEPEKLQNQADTALYLAKQAGRNRVVLFRPE
>tr|A0A820L477|A0A820L477_9BILA Hypothetical protein (Fragment) OS=Adineta steineri OX=433720 GN=OKA104_LOCUS48766 PE=4 SV=1
VAYGGTTMHGIRHYCQFPFIYQGKQYTNCISDKPPHATPDQTVFDPWCSLTHNHDIDDQWGFCDIGVTDSTIYSICQNQLQTIQCSPGYVIDILTADYATKQDGTNSCNYNKNDCFQSDASTIENLCSGKTSCTVYHYAKTLVSCQNRLSTYLQIDYTCVPNDIETIMTYDICNNDSKPSGDIRRGFLISPNFPNVKNNINCIYDLHILKPHQD
>tr|A0A841MMF6|A0A841MMF6_9CAUL Two-component system response regulator FixJ OS=Caulobacter sp. YL-Caulobacter OX=2723104 GN=HDO15_004474 PE=4 SV=1
MSDAAPIGAQVVHVVDDDESARESLAFLLESADFEVAAYASAPAFLDALADARPGVIITDVRMPEMSGQELVARLGALKVKMPIVMITGHGDIPMAVEAMRSGVVDFIEKPFSESRMLDALGRAFKSVEAAPASNDQTAILKRIETLSERERQVLDGVVAGHANKVIARELGISPRTVEIYRAKLMTKMQADNLAALVRMTLSARGE
>tr|A0A1E2YF14|A0A1E2YF14_PARBR GTP-binding protein rho2 OS=Paracoccidioides brasiliensis OX=121759 GN=GX48_00269 PE=4 SV=1
MAQQQLQQLQTENVMRRYVDGKHLWSWKLVIIGDGACGKTSLLSVFTLGYFPTHYVPTVFENYVTDCRVDGRSVQLALWDTAGQEDYERLRPLAYSKAHVLLIAFAVDTPDSLENVRNKWIEEANERCPDVPIILVGLKKDLREDPLAIEEMRKKSLRFVSSKEGHDTAAQVGARKYLECSSLTGEGVDDVFEAATRAALLTFEKDRGSCCVIL
>tr|A0A6N9C681|A0A6N9C681_9BACT FRG domain-containing protein OS=Candidatus Poribacteria bacterium OX=2026781 GN=F4X33_06180 PE=4 SV=1
MNTQNSTDLQDYYLNGLNKIINEIMEKSADGNYIYRGEPKCYPTIASQLYLNRYAESNQRLTPIDVAQAFEIVMASNYLDSEAEKEFFPIASELRHYGSPVNYLDFTTDYNIALYFACAKHFACAKLGEDGHGKDGRIVLLQRNKETKEKYQIKPVQDPPNRAKAQKSVFVEPPDGFILSNDKDVKTVCIPKELKQWILIHLHRFQCISYQTLYHDIYGYIAQKDLRASAEEKHKSHEGTERWHIAQIEHSPYSVRYYYDLACYYGKDMYKYDCAIETFSKAILLKPDSVFAHINRGISYARNNILDRAIQDFVKVIPMLFKFPFSDALFLVYKSLGQVYDIRGDCHSAIEYYQKAQQLRFDDPVVAAYLDKSKRPQLSKLEYYVR
>tr|A0A1H0ZCM6|A0A1H0ZCM6_9MICO DNA-binding transcriptional regulator, LysR family OS=Leucobacter chromiiresistens OX=1079994 GN=SAMN04488565_1638 PE=3 SV=1
MNLEQLRGFVEIAQLGNFTRAAERLHLAQPSLSRQIAALETDLGVELLHRVRGHVAATPAGERLLPIARRMLADAETARHEMSDLAELRGGRIRLGATPTLCTSLVADVLAEFRARYPGIEIEILERGSRSLISALMEGALDLALIVTSVSSGAARAVLEREQILSERLVVVSDPNRPDPFAPEGAEARDPGRPVDLEELARVPQVLFPENYDLRATVDAAFRARGLTPLVAVAGAEMDAALSFARRGIGVAVVPAMVAADRPALRTAPLADDALARTVSVARRADMAPTRAGAALQAVIREIADRVTAPGAELSSLVTRVGEPAPLRSAAPPPA
>tr|A0A1G6ZFJ8|A0A1G6ZFJ8_9BACL Uncharacterized beta-barrel protein YwiB, DUF1934 family OS=Paenibacillus sp. CF095 OX=1881033 GN=SAMN05428987_0174 PE=4 SV=1
MSNMRPVHIRLHSRYEGEDVLQEMQGEAVLKGSVLYVRYEEPQVGPEGGTTRTTLKLGGQSIKIIRHGEVESEQTFELNRKLPGFYRSPYMSFALSTHTQKLELSIQGLSARAAWSYDFYRFDEESGHFAISLHIQEEPIS
>tr|A0A654FXQ0|A0A654FXQ0_ARATH (thale cress) hypothetical protein OS=Arabidopsis thaliana OX=3702 GN=AN1_LOCUS20985 PE=4 SV=1
METPGASHDSFRGSPRRNSILSASNIIQAPISTLLEYSGLFRARPSPSHEAETLVSDDSSGLSNGEVAIRIIGNTEQDAETDTNALREPGHSELLGSSATQVDPMGGASEGASQAAPGDPAAGDAASRDSPYQRYDIQQAARWIEQILPFSLLLLVVFIRQHLQGFFVAIWIAAVMFKSNDILKKQTALKGERHISALIGISVAFTAHVVGVYWWFRKDDLLYPLIMLPPKSIPPFWHAIFIIVVNDTLVRQASMIFKCFLLMYYKNSRGRNYRKQGQLLTLVEYFMLLYRSLLPTPVWYRFFLNKDYGSLFSSLMTGLYLTFKLTSVVEKVQSFFTALKALSRKEVHYGSYATTEQVNAAGDLCAICQEKMHTPILLRCKHMFCEDCVSEWFERERTCPLCRALVKPADLKSFGDGSTSLFFQIF
>tr|A0A7K9WNV0|A0A7K9WNV0_9PASS DMXL2 protein (Fragment) OS=Rhipidura dahli OX=667186 GN=Dmxl2 PE=4 SV=1
LTGAQDGSVRMFEWTRPQQLVCFRQAGNARVTRMYFNAQGNKCGVADGEGFLSIWQVNQTTSNPKPYLSWQCHSKTTSDFAFITSSSLVATSGQSNDNRNVCLWDTLVSSGNSLIHAFTCHDHGATVLQYAPKHQLLISGGRKGYICIFDIRQRQILFTFQAHESAVKALALDPSEDYFVTGSAE
>tr|A0A7Y9UAN0|A0A7Y9UAN0_9CELL YCII domain-containing protein OS=Cellulomonas hominis OX=156981 GN=GGD73_001711 PE=3 SV=1
MPSLWHERPEEPPVGHDAGMPIFAVRYTYDARTDLQDAIRPEHRAYLQGVAERGELLGSGPFPEGPAGALLVFRTADRDALDAVLTADPFALAGVIAETEVRTWNLVLGPWAEHPAG
>tr|A0A660XH96|A0A660XH96_9BACT TonB_dep_Rec domain-containing protein (Fragment) OS=Candidatus Marinimicrobia bacterium OX=2026760 GN=DRP89_06950 PE=4 SV=1
AETFKSPELGDIEHRQLLAVIPGLSIRSYGGPAGITTLSLDGGPSSQTKVIVSGFDLTNAQNGEMDLSQLPGPFVENVSYIPQDENFYGSGSNESTIHLNPWSGKSGLSLSTGSYGHSSIHGTLNLHKNQWIGNFLIGKRHDDGNYPFKWRNESFKRENNYFDQKFISAQFNTVIQKRAFLRFLYLLSNQSRGIAGQSWNPSKNANRDDKLQIIGVKFGWTNKKGHGYIQTMYRYSWENYKNPMIAVNSFHRLSTWQFILNQEKKINEKIGVNLLFETKKDGLKSKDTNNHYRISYSTAITVPYFLSKTFKFQPAYCYDISPNLYYEHSYVLKLLTSLNFLFIKSLTIHQGRYFRYPTFNDLYWIPGGNPNLKPEHTDNVSLDINCHLIQDSDLEILLFYKSSDDLIQWTPISSYWQPKNIQHAVRKGYKIIYRWNSQNIPLEAFVHYSSNRTKDLSQGNCYGKPLRYAPEQTAAVGINWQPEPLSFHLQIHHTSERISMYSWPEDVILSEATLIFTSCAYTWKRPSGDIIIVFAMDNLTDKRYETIKGYPEPGRTFRMTISYQH
>tr|A0A2U0ZQI9|A0A2U0ZQI9_9BACT ATP synthase subunit beta OS=Filimonas sp. YR581 OX=2135469 GN=atpD PE=3 SV=1
MSNKGKIKQVIGAVVDVHFENDHSLPEIYNALEITRPSGEKLVLEVQQHLGEDSVRTIAMDGTEGLVRGMEVIDTGKAIAMPTGPGINGRLFNVTGDPIDGLPALSKTTSRPIHALPPKFEDLSTATEVLFTGIKVIDLIEPYAKGGKIGLFGGAGVGKTVLIQELINNIAKGHGGLSVFAGVGERTREGNDLLREMIEAGIMKYGDKFIHSMEEGGWDLSSVDMEGLKESKATFVFGQMNEPPGARARVALSGLTIAEYFRDGDGTGKGKDILFFVDNIFRFTQAGSEVSALLGRMPSAVGYQPTLATEMGLMQERITSTKSGSITSVQAVYVPADDLTDPAPATTFAHLDATTVLSRKIADLGIYPAVDPLDSTSRILTPAVVGEKHYNTADRVKLILQRYKELQDIIAILGMDELSEEDKQIVSRARKVQRFLSQPFHVAEQFTGLKGVFVSIDDTIRGFNAIMDGEVDEYPEAAFNLVGTLEEAIEKGKKLLAQAQG
>tr|A0A231W898|A0A231W898_9BACI 2-dehydro-3-deoxygluconokinase OS=Bacillus sp. OG2 OX=1979526 GN=B9K06_14550 PE=4 SV=1
MDVITIGETMVLFTPQTTGLMRYANQFSMTFGGAESNVAIGLTRLGHKAGWISKVGNDEFGKAMLSFISGEGVDTTQVLIDSEAPTGVYFKEPRRANDVRVYYYRKDSAASRLEPGDINEEYLSNANYLHLTGITPALSDNCRELVYEAVAMAKKHGVQVVFDPNLRKKLWPEDQARKVLLDLASKAAIVLPGIAEGEFMFGEKDPVKLGRLFLALGPAVVVLKLGEEGCMVFTKDLQAKVPGFPVDRVIDPVGAGDGFAAGFLSGMLDGLSLEDAATRANAVGAFVTMVDGDVEGLPEKDEILGMLENKFDDVSR
>tr|A0A0B7HH50|A0A0B7HH50_9FLAO Tetratricopeptide repeat protein OS=Capnocytophaga cynodegmi OX=28189 GN=CCYN74_100115 PE=4 SV=1
MTKKYLLIFIIVALILTILAFVFLPKKDSYSKIEKVDIVTNQGYAGSHSCKECHEQEYAEWELSDHFKAMQHADDKTVLGDFNDVTYTADGITSRFFKKNGKFYINTEDENGKYRDFEIVFTFGHYPLQQYLTKFGGGKMQVFRQSWDSRENKWFHQYAGEKIPPGDYLHWTNAGQNWNLMCSTCHSTNLQKNYNPLKDTYKTTYDELTVGCESCHGPGKKHNDFMRSSDYQKGISKNFFITLGVNTPQKTELNTCMPCHARRGEVTQHHTASDEIMDNYIPEIPITNIYFADGQALDEVYKYGSFLQSKMYHVSIKCTNCHLPHSGKLRMQGNQLCLQCHTPNYATSAHTFHKENTEASDCKSCHMPTRTYMGNDIRHDHNFAVPRPDLSEKYGVPNACNACHNDKSAKWASQAVEKWYGKERRPHFAENLIIGSLQNEKSLERLNELLTNSATPDIIRATAVHYLGGIYTEQSLQLVKKELNNSDAQTRYRAVIALGNFPIHLYENELISLLSDKVKAVRIATAYVFLSQKGWEQSKLLTSFESARKEYETFVLSQADFPVGSATAADYFTHLGDTDKAILFYERAIKKDKTLNHVRLNLATLYNGKGQNDKAWQILHQAQNYAPENAQVYYFMALLSSEEKDYNQAKKYFEKAMQLGMNNENIQRNYQSVIQIINKKN
>tr|W2ZLA7|W2ZLA7_PHYPR Uncharacterized protein OS=Phytophthora parasitica P10297 OX=1317064 GN=F442_06838 PE=4 SV=1
MQTRASIFAQHIPALHHVSSTLYRSQSAAVAASSPLSRVTSDRPAIRQQSRPDGDNG
>tr|A0A1F9MIM0|A0A1F9MIM0_9DELT Metallophos domain-containing protein OS=Deltaproteobacteria bacterium RIFOXYA12_FULL_61_11 OX=1797896 GN=A2284_00320 PE=4 SV=1
MVPTAADLVPFSIVLVPDTQYYTSKQGNGEENTYWKQMRWIRDHRETENILMAVHLGDITGSNEPEQWEIASAAHRILDQADLPYSVVPGNHDYLGKSSASFRSRTFFDSHFPASRFSGRAWFGGSLGSSNVNNYTLFENGAQKFLVLSLEYAPRKDTLCLAEDLLARHPDRRVIVATHCYLTKGGAYAEGCPNPDYGTVGAAGETVWDEFVSRYSSIFLVVSGHVNESAHAPRTGNAGNTVQQLVVDYQAEAACNAKSPDQCNDHCKAGTYTGNGWLRQLVFDPAVGQVQARTFSVEDGNTSVFPGGHPVLFCSELNKQGNDDYPSDPLAPDHAFSFTYEPLWTKPFVREDLGRRSFLDRTVNSVGEGQQERPAVAMAENGDFVAVWEDDSSKADGAGNRDIFLRGFLAGGCQKFPAQVINGNQNGQQRHPAVAVDRDGRAVVVWEDDTDGNGVFQVKARGFHADGSERLPVFTVNSEASGQQRNPAIGMSSDGRFVVAWEDVAGGNGAQILVRGFNADGSPLFPDRSGHTDTAGQHLEPTVALDASGAFVVAWQDDTDGNGYYQIHARGFDSAGKERFPKIVVNSVDTGQQYRPSLSLDQAGHFVVVWEDDQDKDGNSNLLARGFNADGTARFSDFAVVAGAGTHAAPSLAAGTDGSFVVAWQDDGDGNGTSQIHAKAFRADGSEWQARWTVNLQSAGQQLSPSVALAGKTLVVAWQDDLDGNEVYQILARGVDLP
>tr|A0A1S7RCV2|A0A1S7RCV2_9HYPH Uncharacterized protein OS=Agrobacterium sp. NCPPB 925 OX=1631629 GN=AGR6A_Cc80407 PE=4 SV=1
MSAEPVDTNDAYRPIMETVSTMVSSIDLSTRLTATRLALKAIKQQDDSSADQSSSTRTALLSSYGIDSSSSTNTRLAQLLAQYGEASGDDTQTEGTDTQPSSGDITKADFMKGLKGMLEELSKDPDKASQANAMLEALKAGTLTVSDPAEGARIKAWDVASDTETASKPSTEITTTGWSDFLKEHLKRDGSIYAKGASGAYVDTISGDNAFFGSVGSRYYYLTWPQAKNGTLTV
>tr|A0A5X5WLM0|A0A5X5WLM0_SALET Diol dehydratase reactivase subunit alpha OS=Salmonella enterica subsp. enterica serovar Corvallis OX=593905 GN=pduG PE=4 SV=1
MRYIAGIDIGNSSTEVALARQDETGALTITHSALAETTGIKGTLRNVFGIQEALALVAKRAGINVSDISLIRINEATPVIGDVAMETITETIITESTMIGHNPKTPGGVGLGVGITITPEELLTRPADSSYILVVSSAFDFADIANVINASMRAGYQITGVILQRDDGVLVSNRLEKSLPIVDEVLYIDRIPLGMLAAIEVAVPGKVIETLSNPYGIATVFNLNADETKNIVPMARALIGNRSAVVVKTPSGDVKARAIPAGNLELQAQGRTVRVDVAAGAEAIMKAVDGCGKLDNVTGEAGTNIGGMLEHVRQTMAELTNKPSSEIFIQDLLAVDTSVPVSVTGGLAGEFSLEQAVGIASMVKSDRLQMAMIAREIEQKLNIDVQIGGAEAEAAILGALTTPGTTRPLAILDLGAGSTDASIINPKGEIIATHLAGAGDMVTMIIARELGLEDRYLAEEIKKYPLAKVESLFHLRHEDGSVQFFPTPLPPTVFARVCVVKPDELVPLPGDLALEKVRAIRRSAKERVFVTNALRALRQVSPTGNIRDIPFVVLVGGSSLDFEVPQLVTDALAHYRLVAGRGNIRGSEGPRNAVATGLILSWHKEFAYGQ
>tr|A0A4S1A4Z3|A0A4S1A4Z3_9BACT LPS biosynthesis choline kinase OS=bacterium M00.F.Ca.ET.156.01.1.1 OX=2563902 GN=EN799_28860 PE=4 SV=1
MTDDLRAALATVPVLAGYDGPLERLGGLTNMVYRAGDVCLRIPGKGTEEYINRANEAVAAREAAKAGVSPEVLYADPETGRMATRFIAGAETMSPEKFKTRKGSAARAGEAFRKLHRSGAVFPFRFELFAMIDDYLKVLSTKDVALPAGYHDVVREAGSVRAALDAHPIELAACHCDPLCENFLDTGERMWIVDWEYSGMNDPLWDLGDLSVEGKFNEAQDEELMRAYFGGEARPAERGRVVIYKAMCDLLWTLWGLIQLANDNPVDDFRAYADGRFARCKMLMETAEFSGHLAAVRLG
>tr|A0A5B8NLP5|A0A5B8NLP5_9CHRO 50S ribosomal protein L35 OS=Euhalothece natronophila Z-M001 OX=522448 GN=rpmI PE=3 SV=1
MPKLKTNRAAAKRFRATGRGKIRRRKAFKNHLLEPKKTSRKRRLSKLTFVNERDAEKVEQMLPYMK
>tr|A0A098VY33|A0A098VY33_9MICR ATP-dependent Clp protease proteolytic subunit OS=Mitosporidium daphniae OX=1485682 GN=DI09_143p40 PE=3 SV=1
MQLIKAPVYTIAMGMAASMGSFLLAAGAPGHRKALPNSRIMVHQPSGGATGPAADIEIAAKEILRLRTLLNEIYARHTGQSLSTIERALDRDRYMTPEEAAGFGLIDGVLNATPSRQIL
>tr|T2IPC9|T2IPC9_CROWT Transposase OS=Crocosphaera watsonii WH 0005 OX=423472 GN=CWATWH0005_4898 PE=3 SV=1
MGLCVVQIAKVLNLNYCYRIYPDSSQEKELLDWLEICRGVYNYALRERKEWINSRKCKVNACSLHSEYIIPADQPFPDYYKQKKALTQAKKEYPSLKRVQSQVLQQVMGRLDKAFNFFWKRSFGFPRFKKYGQYRSINFPQFKENPITGYQIKLPKIGSVRINLHRPIPDGFVVKQVQIVKKASGWYAVICIQSDVKVPSPQPQGKSLGIDLGLEKFIATSQQELIARPRFFVELQSKLQWLQRRLSKKQKGSKNWHKAREKVARLHEHIYNTRKNFHYQVAHHLCDQANIIFAEDLNLKAMSRGMLCKHTLDAGFGGFLEILKHVAWKRDVYFEKVDANLTSQTCPNCGMVTGKKDLSQRVHECSNCGFITDRDVAAAMIVEQRGLAALGLGVKLPVEDEVIGDVRKKSSRASRRSRKAS
>tr|A0A1G1DFT8|A0A1G1DFT8_9BACT Uncharacterized protein OS=Nitrospinae bacterium RIFCSPLOWO2_01_FULL_39_10 OX=1801683 GN=A2889_02485 PE=4 SV=1
MVAVRRKLLTAQKMRKIYRRVKSVCLSVCLSVCLCKVDTILFIPHPPPSPQPSPRGRGREGQGEREYQ
>tr|A0A524FY20|A0A524FY20_THOAR Response regulator OS=Thorarchaeota archaeon (strain OWC) OX=2053491 GN=EU527_15255 PE=4 SV=1
MALEDAGFDVVAEAEDTENLLIQCQGNRPAVVIIDFNMDQIEIVRLIEHLLDIDPIVAIVVISDIADGQTEMVLAAGARAFLQKPFSMYDMTDIVRKVKPVY
>tr|A0A853UB48|A0A853UB48_9MICO Uncharacterized protein OS=Dermabacter sp. HMSC06F07 OX=1581125 GN=HMPREF3157_09225 PE=4 SV=1
MRGVSAKSLQSVLRRAAESTSANTPSTEIASELFEAVRVIDSSNQLVRLLSDPGRDEDLKADVVRRLFGGRVSEAALEVLLEASRCTWSEQNHLLEGIEFAGVSLVLDKARGRGTAHAVEEELFQVARLVEDTPELSEAFDSKRDDVPARVGIIERLLGGKVDEATVALAAQAVSFEPEAKVPARLLEFANFASAERDRRSGVVTSAIALSPEQQERLTRILSARYGGELSLNYEIDPSVIGGLRITIGDDLYDATIFGRVRDARERISA
>tr|M0J625|M0J625_HALVA Uncharacterized protein OS=Haloarcula vallismortis ATCC 29715 OX=662477 GN=C437_14607 PE=4 SV=1
MSATEETVRVWLVERTYSDDEQNLIILTYATPDGDQYFRKERALTSFSDVRETTAAVDADPDNLGSVDDPDLQAQYAAEATRMAEKHDPDDAI
>tr|A0A2W5SS74|A0A2W5SS74_STANO Uracil-DNA glycosylase OS=Starkeya novella OX=921 GN=DI549_11565 PE=4 SV=1
MASPSETLDDVLAAIRACRVCVEHPLGRPLPHEPRPVLHMGTRARILIAGQAPGTKVHGSGLSFNDRSGDRLRDWLGVDRETFYDGDSIAVAAMGFCFPGQDAKGGDLPPRRECARLWHDRLFAARPPFDLVVAVGATSQAYHLKRLGLERFATGGLTERVMRWREIWAASNQTRVLPLPHPSWRNTGWLKRHPWFEAELLPVLRQEVARIVGSAREGREPREPA
>tr|A0A3G8GEA2|A0A3G8GEA2_9BURK Acylphosphatase OS=Pigmentiphaga sp. H8 OX=2488560 GN=EGT29_00430 PE=3 SV=1
MQELDSTAPLETVLVRVTGRVQGVGFRLATVRRAHLVGVGGWVRNNEDGSVEALVQGTPDQVDQMLEWMRQGPPQARVDDLASERQFIDRRFARFEQQ
>tr|W9AG96|W9AG96_9BACI Glutamate racemase OS=Oceanobacillus picturae OX=171693 GN=racE PE=3 SV=1
MEQAIGVIDSGVGGLTVAYELMRQLPKEKLIYLGDTARCPYGPRSEEEVKKFTWELVDFLLEKNIKMLVVACNTATAFTLQELQEKLDIPVIGVIQPGARAAIKFTRNNNIGVIGTEGTIRSEAYTKALESIHSSIKVNALACPLFVPMVEQGILTGKKAQEVVESSLSPLMEGEMDTLILGCTHYPLLKQTIQNVMGEQVTVISSSEETARETSTILDVHNIIKTGDVIPVHEFYTTGELEIFIEIAKSIFKDPYLQMVTIKKAQLGQTQKT
>tr|A0A5D2YB87|A0A5D2YB87_GOSMU HIT domain-containing protein OS=Gossypium mustelinum OX=34275 GN=E1A91_A08G187300v1 PE=4 SV=1
MARAISPCIFCQIAGSSNSTPLLHSVRSLDDKVVAFKDINPSAFRHYLVVPVEHIPTVNDLQRRNEDYTLVSHMINVGETLLRRDAPQSNQYRFGFHQPPFNSVDHLHLHCFALPFIPRWKQLKYMSLGPLGGFIEAEKLLEKIKPLSPIPP
>tr|A0A1L8DSH3|A0A1L8DSH3_9DIPT Putative ubiquitin carboxyl-terminal hydrolase 46 OS=Nyssomyia neivai OX=330878 PE=4 SV=1
MGANISQLERDIGSDQFPPNEHYFGLVNFGNTCYSNSVLQALYFCRPFREKVLEYKAKNKRTKETLLSCLADLFYSIATQKKKVGSIAPKKFIARLRKEKEEFDNYMQQDAHEFLNFLINHINEIILAERNIKGKITTGNTETPPEPTWVHEIFQGILTSETRCLNCETVSSKDENFFDLQVDVDQNTSITHCLKCFSNTETLCSDNKFKCDNCCSYQEAQKRMRVKKLPMILALHLKRFKYMEQYNRHIKVSHRVVFPLELRLFNTSDDALNPDRLYDLMAVVIHCGSGPNRGHYISIVKSHGFWLLFDDDMVDVYIFLNCARKKN
>tr|A0A428EVY3|A0A428EVY3_STRIT Uncharacterized protein OS=Streptococcus intermedius OX=1338 GN=D8829_03240 PE=4 SV=1
MTKRYNINKIFESIITSRTRETFEVTESLIELGKIVGTRPVAFKQLYKAYRSLETSFSYTPVIGAPISCRFDYDKEEATLAYLDLSADLSLADFTDFMGVIDSVYSSIYPIGTVVELDLDLLPPHLHRLFTDGPGALVTITGRKLPVRGKFGEYIVDYLARLWPFGELPGVAPIYVNNMMIRQVHQEGLRNDWEDEFTEDILRSNQLSAQLVSTAFMRKEDNAVYVQELLKEATHELSH
>tr|A0A436AXU5|A0A436AXU5_9HYPH Antibiotic biosynthesis monooxygenase (Fragment) OS=Mesorhizobium sp. M7A.F.Ca.CA.001.08.1.1 OX=2496691 GN=EN913_26470 PE=4 SV=1
MSGFVVWVDFRLKPGARGRFRELVDANATASVRREAGCRRFDVTQARGEP
>tr|A0A4Q2S8K2|A0A4Q2S8K2_9ACTN Maleylpyruvate isomerase family mycothiol-dependent enzyme OS=Nocardioides glacieisoli OX=1168730 GN=EUA06_04035 PE=4 SV=1
MTRLPSETYLDHLRTESARFREVLTACDPAARVPSCPDWSAADLLWHLATVQRWWAEVVAARPTRPEEVDPPRPESYDELLATFDEWSAELARVLEAADPAEEAWNWSDDHTVGFILRRQAHEALIHRVDAELAAGDRTDLEPLLASDGVHECLAVMYGGCPPWGRWEPGEDLVRVDVTDTGEEFWVRFGIFSGTDPESGTTYADEEDFHVVDAPEDDAVEPDVVVDGTAAALDLWLWSRSDDEELSVVGDEAVLDRFRAIVGSPIN
>tr|A0A2W5D315|A0A2W5D315_9PSED Recombination protein RecR OS=Pseudomonas kuykendallii OX=1007099 GN=recR PE=3 SV=1
MSFSPLIRQLIDALRILPGVGQKTAQRMALQMLERDRSGALRLAHALNEAMERVGHCKRCRTLCEEELCPQCADPNRDDSLLCVVQAPMDVFAVDQTGFRGRYFVLKGHLSPLDGLGPEAIGVPELLARIAEGAFSEVILATNPTVEGEATAHYIAQLLIPKGLSVSRIAHGVPLGGELDLVDGGTLAHAFNGRKAITL
>tr|A0A4P6U3H2|A0A4P6U3H2_STRSO Catalase OS=Streptomyces seoulensis OX=73044 GN=D0Z67_28970 PE=3 SV=1
MTDIPRTTTDSGAPVESDEHSLTVGPAGPILLQDAYLIEQMAQFNRERIPERQPHAKGSGAFGHFEVTGDVTPYTKAAVFQPGTRTDLVARFSTVAGERGSPDTWRDPRGFAVKFYTSEGNYDMVGNNTPVFFVKDPMKFQHFIRSQKRRADNNLRDHDMQWDFWTLSPESAHQVTWLMGDRGVPRTWRHMNGYTSHTYMWINEAGEEFWVKYHFKTDQGIEFFTQDEADQMASADTDYHTRDLFEHIRDGEHPSWTLYVQIMPYADAAEYRFNPFDLTKVWPHGDYPLIEVGKMTLDRNPTDNHAEIEQLAFQPNNFVPGIGPSPDRMLLARLFSYADAHRYRIGANYAQLPVNAPITDVHTYSKDGAMAYRKTSDPVYAPNSKGGPAADTAEFGKPPTWHTDGDITRTAYATHAEDDDWGQAGALVREVLDDDARDRLVDNVVGHLLNGVTEPVLERAFEYWTNIDPKIGARIAEGVRAKADAKDPKAADQGNPARSSMQHKA
>tr|A0A2U3P8A5|A0A2U3P8A5_9MYCO Endonuclease III OS=Mycobacterium numidiamassiliense OX=1841861 GN=nth PE=3 SV=1
MNRTLAQAFPDAHCELDFRTPLELTVATILSAQSTDKRVNLTTPALFVRYTSALDYAQADRAELEELIRPTGFFRNKASSLIGLGQALVERFGGEVPSTMDELVTLPGVGRKTANVVLGNAFGIPGITVDTHFGRLVRRWRWTEDEDPVKVEHAVGELIERKEWTLLSHRVIFHGRRVCHSRKPACGVCLLAKDCPSYGLGPTDPLLAAPLVQGPETEHLLALAGL
>tr|A0A3S5CJ78|A0A3S5CJ78_9PLAT Uncharacterized protein OS=Protopolystoma xenopodis OX=117903 GN=PXEA_LOCUS6098 PE=4 SV=1
MLNQYYKIKKKSESVHEDSRRKNRELLERHNADLRLFDSESTRLGINTDALLGANTVSELIPPGASHLNNLARHFSAMQSVVIDTSSTSSSCGSTGRAAPTASGETNSSGRLVFANRNSMIVLNAGNTAHMSGHHVSMSESDSPGQNQR
>tr|A0A1V2VH64|A0A1V2VH64_9BURK Aliphatic amidase OS=Herbaspirillum sp. VT-16-41 OX=1953765 GN=amiE PE=3 SV=1
MRHGDISSSKDAVGVAVVNYKMPRLHTRGEVLENARKIAAMLVGMKQGLPGLDLVVFPEYSTHGIMYDRDEMFETAATIPGEETAIFSEACRIAGVWGVFSLTGERHEEHPRKVPYNTLILINDQGEIVQKYRKIMPWTPIEGWYPGDTTYVCDGPKGLKVSLIICDDGNYPEIWRDCAMKGAELVVRCQGYMYPAKEQQIMVSKAMAWMNNLYVAVANAAGFDGVYSYFGHSAIVGFDGRTLGECGTEEMGIQYAELSIGAIRDARRNWQSQNHLYKLLHRGYTGKINSGESPAGVAECPFDFYRTWVNDPQAARAQVEALTRNSAGTPECPMPGIPTEPAA
>tr|A0A370VY99|A0A370VY99_9ACTN ABC transporter ATP-binding protein OS=Streptomyces sp. M7 OX=255705 GN=DWC19_11045 PE=4 SV=1
MIGVAPPAYDPAAPTTAHTLPVGAPATVRAYVAELFRRHRRAFLLLVLVNTVAVVASMVGPWLLGGLVERVSDGAAGRDLRLELTVGLFVAALLVQAAFVRQVRLRGAMLGERMLADLREDFLVRSVGLPPGVLERAGTGDLLSRITTDIDRLANAMREAVPQLAIGVVWAALLLGGLVATAPPLAAAVLVAVPLLVAGCRWYFRRAPSAYRSEAAGYAAVAAALTETVDAGRTVEAHRLGERRIEQSDLRIKQWTAWERYTLWLRSVLFPVINVTHVTVLSSVLLIGGVFVLQGWIGVGQLTTGALIAQMLVDPVGLILRWYDELQVAQVSLARLVGVRDIEPDAGDARLTPDGRDVHADRVHFGYREGVDVLCKVSLEVAPGTRLALVGPSGAGKSTLGRLLAGIYAPRDGRVTLGGAELSRMPAERVRAHVALVNQEHHVFVGSLRDNLLLARTGAGDAELWEALRAVDADTWARALDEGLDTEVGSGGFALTPAQAQQIALARLVLADPHTLVLDEATSLLDPRAARHLERSLARVLDGRTVVAIAHRLHTAHDADLIAVVENGRVSELGSHTELVAADGAYAALWRSWHG
>tr|A0A150FR67|A0A150FR67_CLOPD Uncharacterized protein OS=[Clostridium] paradoxum JW-YL-7 = DSM 7308 OX=1121328 GN=JWYL7_1169 PE=4 SV=1
MGRLERTLEKKKNKKAKRVGYCIFILIIFMLILGVNIVDYRINTFMGNYNRALILRVYDFTKGLSLLQR
>tr|A0A7G6UKH5|A0A7G6UKH5_PSEMX Uncharacterized protein OS=Pseudoxanthomonas mexicana OX=128785 GN=H4W19_14390 PE=4 SV=1
MAVRYYISLPDPARARGGDPAFSFDAHGADEFAAQLQHALRTSSLFERWRARQDDPDDVDPGLGAVDPDAAVAGQQDDLSILLVARSSIPGHVLKHRLRLLAGRAWELRDVAAA
>tr|A0A4Y8KC96|A0A4Y8KC96_9MICO Triosephosphate isomerase OS=Cryobacterium sp. Hb1 OX=1259147 GN=tpiA PE=3 SV=1
MNINPRRTPLIAGNWKMNLDHLQAIAFVQKLAWNLKDAGHDTAAVEVAVFPPFTDLRSVQTLISADKLPLAFGAQDVSAHDSGAYTGEISGAFLAQLECQYVIIGHSERRTLHNESDEQVAAKVTAALKHNLVPLICVGESAEDLAVHGPSAVPVAQLRAALAGVTNAVDIVVAYEPVWAIGSGQAATPEQAEQVAAALRGVLSDTLGQDVADKTRILYGGSVKSTNIAAFMREPNVDGALVGGASLDIAEFSSIIRYQKHVGL
>tr|A0A328IIY1|A0A328IIY1_9MOLU Thymidylate kinase OS=Candidatus Phytoplasma oryzae OX=203274 GN=tmk PE=3 SV=1
MKFIAFEGLDGSGKTTQINLLKVVLTKEYRKKVTVIQGLGSSIIGPMLREMFLYQTKITPFTRMWLSFANMEQTQTEIIQPALENNHIILADRWIASTYAYQVFGHYLDIPLKKFHKLHCSFFFQPAITFYFDIKPAIGLIRKQQKLDYEPDLFEKKGIAYFEQVKRGYDYFFKKDFLVKNYNADIPKSILFKKVITFLKEKKIIEFRI
>tr|A0A502MPE9|A0A502MPE9_9HYPH 4-hydroxybenzoate octaprenyltransferase OS=Mesorhizobium sp. B4-1-3 OX=2589889 GN=ubiA PE=3 SV=1
METVQSKVIQGRVADAPSGHWVYRVLPRWVWPYAQLARWDRPIGWQLLLWPCWWSAALAAGAYPRPTDPLLTLLPAPWYLLLFFIGAVAMRGAGCTYNDLADEDIDNQVERTRSRPLPAGKVTRRQAWAFVIIQALVGLAVLLQFNSFAIPLGIASLAIVAVYPFMKRITNWPQFVLGLAFSWGALMGWAVEFGDIDDPAIMLYIGSILWVIGYDTIYAHQDKEDDAIVGVRSTARLFGDNTKMWLTGLYGGALICFAIAFASAQAPIVALAGLIAAGAHMARQIIRLDINNPDQCLKLFKSNNQVGWLIFLGLIGGSVWIWLKPLV
>tr|A0A3S1L2A4|A0A3S1L2A4_9HYPH Flagellar biosynthetic protein FlhB OS=Mesorhizobium sp. M1E.F.Ca.ET.063.01.1.1 OX=2496750 GN=flhB PE=3 SV=1
MAEAVDKDSKTEEATEKKIRDTIEQGKLPHSRETAIFASFLAILVFAVFYAKDAVVDLGMFLSTFLEKPEAWPMDTETDVITLYEQVLIEIGRAVVSLLVLLVVAGIGASVFQNMPQLVGERIRPQLSRISIAKGWSRLFGVQGFVEFGKSLAKLAFAIAVLAFTLSEDHRRLLAGMITNPVSFGMVIRGIFVDILVSIVFVMGLIAVADIVWSRFHWRRDLRMTKQEVKDELKQSEGDPIVKSRLRSLARDRARQRMMTAVPRATLVIANPTHYSIALKYVREEDSAPVVLAKGQDLVALKIREIAREHNIPIFEDVALARSMYKQVSVDSVIPSQFYQAVAELVRIVYSKKAVRRVPS
>tr|A0A6P7RXF0|A0A6P7RXF0_MUSCR Pendrin OS=Mus caroli OX=10089 GN=Slc26a4 PE=3 SV=1
MAGRGGRSEPPQLAEYSCSYAVSRPVYSELAFQQQRERRLPERRTLRDSLARSCSCSRKRAFGVVKALLPILDWLPKYRVKEWLLSDIISGVSTGLVGTLQGMAYALLAAVPVQFGLYSAFFPILTYFVFGTSRHISVGPFPVVSLMVGSVVLSMAPDDHFLVPSGNGSALNSTTLDTGTRDAARVLLASTLTLLVGIIQLVFGGLQIGFIVRYLADPLVGGFTTAAAFQVLVSQLKIVLNVSTKNYNGILSIIYTLIEIFQNIGDTNIADFIAGLLTIIVCMAVKELNDRFKHRIPVPIPIEVIVTIIATAISYGANLEKNYNAGIVKSIPSGFLPPVLPSVGLFSDMLAASFSIAVVAYAIAVSVGKVYATKHDYVIDGNQESTGGKTQVAGLISAVIVMVAIVALGKLLEPLQKSVLAAVVIANLKGMFMQVCDVPRLWKQNKTDAVIWVFTCIMSIILGLDLGLLAGLLFALLTVVLRVQFPSWNGLGSVPSTDIYKSITHYKNLEEPEGVKILRFSSPIFYGNVDGFKKCVNSTVGFDAIRVYNKRLKALRRIQKLIKKGQLRATKNGIISDVGSSNNAFEPDEDVEEPEELNIPTKEIEIQVDWNSELPVKVNVPKVPIHSLVLDCGAVSFLDVVGVRSLRMIVKEFQRIDVNVYFALLQDDVLEKMEQCGFFDDNIRKDRFFLTVHDAILHLQNQVKSREGQDSLLETITLIQDCKDPLELMEAEMKEEELDVQDEAMRRLAS
>tr|A0A1I3Q7I7|A0A1I3Q7I7_9DELT tRNA uridine 5-carboxymethylaminomethyl modification enzyme MnmG OS=Desulfomicrobium apsheronum OX=52560 GN=mnmG PE=3 SV=1
MTIPTVPDIFDVIVVGAGHAGCEAAMAAAHMGMQTLLLTINADRIGHLSCNPAIGGLAKGHMVKEIDALGGMMGKWADQAGIQFRILNTRKGPAVRSSRAQIDRTEYVRVVQQDIFTCPNLFVRQETVASLTVEDGRVTGVVTTLGETIACRAALLTTGTFLQGLIHVGLDSFSGGRQGDPASHGLSPRLTELGFELGRLKTGTVPRLLKSSIDYSVMEEQAGDNPPRPFSFDSPGIKLRQLPCFVTYTTERTHEIIRTGFDRSPMFTGVIKGTGARYCPSIEDKIARFPEKDRHQIFVEPEGLTSHEVYPNGIPTSLPLDIQKALVTSIPGLEKAQIIRPGYAIEYDYVPPTQLKPTLETKLVRGLYMAGQINGTSGYEEAAGQGLWAAINAVLALRGEPELILTRSQAYIAVLVDDLVTKGTLEPYRMFTSRAEHRLLLREDNADERLTAIGRELGLVDDSRWQRFTRKQAAVNEIMTGLESIRVRPDAATKDLVEAMGGTIPQKSVSLKELLRQPELTIEVLAPLWPELENFDEEALEEAEIKAKYEGYLRRQQELVDRFEKMEQTALPEDMNYVGIPGLSREVTEKLTRIQPRTLGQAGRISGITPAALSCLEIQLKKIGRL
>tr|R6KI73|R6KI73_9CLOT Type I restriction-modification system S subunit EcoA family protein OS=Clostridium sp. CAG:265 OX=1262787 GN=BN573_01150 PE=4 SV=1
MKKVRDKYKMTELGEIPSEWHIEVLGECSNVTKLAGFEFTEYIEYIDDGEIIALRALNLKNGKLNLEDIKKIDKKVSESLTRSKLYINDVLFSYVGTVGEVALIEENDKFHLAPNVAKLTFNDSVVPKFALQYLMSSNMRNEINRYVTTTSQPALSMENIRKLKIIVPKKEEQEKISFILSTVDEQIDNVDALIEKNKELKKGLMQTLFTKGIGHTKFKNTEIGEIPEEWDVKKIGDICEVKGGKRLPKGYQLEDEDNAFPYIRVADMYMGGIRQDDIKYVPKDIVDKIKNYKISKDDLFISVAGTLGIVGQVPYELDGANLTENADKLCNIQINKLYLMKVLQSNIVQSIIEAEQTKSAQPKLALTRIKEFLIPVPSDIEQVKIASILMEVDEKIGQYKNKKQKLEELKKGLMQQLLTGMIRVTV
>tr|A0A669D541|A0A669D541_ORENI Uncharacterized protein OS=Oreochromis niloticus OX=8128 GN=miga1 PE=3 SV=1
VSVCCTQVMRAPNSENIHTVLRIRELPSHGQSVTMTHETLTSSQLSMRTAALRMVDLPLSVYSSLTQVRIVSTDTKKLVVATAFGAVSLLFLARRFQRRKGRKKVHPQHWEQAGLEFHPPAAGENDNTSQNITLSLNSKNGYSSDLVLSAGGYRKLSGSVMSLASVKSLNSSSSSTCANDSTCWDGVEDADSCSVLNLPVTTPENLYLMGMDLFEEALRRWEEALTFRSRQAEDDASCASVKTGAGDTIAEQSMEDVISAEFIHRLKALLHRAYRLQEEFEGVLGMSEPSSHMADILSREELDDACLRDSISIASTDSFVSAAEMSEHRELRSVFTLGHHPLYEEAHGNLYSVVIVPLTEMLECLGDLDFLAKLHCVRQAWQLILCDRTTWTFLADTGKKILSSIIVKAHKSPKRFEEVFEEMISFLEHTEHWENTELELATRGVKHLNFYDIVLDFILMDSFEDLENPPISIQNVINNRWLNSSFKETAVASSCWSVLKQKRQHMKVSDGFIAHFYSVCEQISPVLAWGFLGPKGSLHDLCCFFKDQVLHFLKDIFDLDKVRYCSVESLADDVLQLLHRRSELLLAYLGADSLRYLNGCNSPPVQLVPSALLEARVQ
>sp|A3CWV2|FEN_METMJ Flap endonuclease 1 OS=Methanoculleus marisnigri (strain ATCC 35101 / DSM 1498 / JR1) OX=368407 GN=fen PE=3 SV=1
MGVAIRDILADCKETLTWDDLSGIAALDAHNALYQFLSIIRQPDGTPLMNGAGRITSHLSGILFRTVNFLEKGIRPVFVFDGKPPEFKQETINERREHRARADEAWKTALREGDMEEAYKQASASARIDSHTIASSRELLDLLGIPWVQAPSEGEAQAAYMARQGKVTYAVSQDYDSLLFGSPVLVRNLTVSGRRKTRGRTITVNPERIVLSSFLDRLGVTREQLVKIGILVGTDFNPGIRGVGGKTALKIVRNGEFESVIAEKQPDFNPAPIRDFFLNPPVTDDYTLEWRTPDVEGVVEMLCGRYDFSEERVRSALAKVSVKATQKTLDAWF
>tr|A0A3S4B8B4|A0A3S4B8B4_9ACTN MBL fold metallo-hydrolase OS=Streptomyces albidoflavus OX=1886 GN=EQK42_07550 PE=4 SV=1
MRFIKKRHSCVRLEKESGTLVIDPGGFTEPDAALGADVLLVTHEHPDHFDEGRLRAALEASPAAQLWTLASVAEPMAAAFPGRVHTVGHGDTFTAAGFGIEVHGELHAVIHPDIPRVTNVGYLVDGEVFHPGDALTVPDRPVETLLLPVMAPWNKLSEVVDYVREVRPTRAYDIHDALLTDLALPVYERQIGALAGTDHHHLGPGTFTEV
>tr|A0A5J4FE44|A0A5J4FE44_MICAE Uncharacterized protein OS=Microcystis aeruginosa NIES-4325 OX=2569534 GN=MiAbW_03334 PE=4 SV=1
MYQMNKTAIDQWLKGVGAFLFQNFGVHLFIENQNNLKKA
>tr|A0A5E7AN68|A0A5E7AN68_PSEFL Glyco_trans_2-like domain-containing protein OS=Pseudomonas fluorescens OX=294 GN=PS720_01060 PE=4 SV=1
MASRKFGLNLVIVLAIAALFSGFWALINRPVTAPNWPEQISGFSYSPFQQGQYPQKDQYPTDDQMRRDLEIMSKLTDNIRTYSVDGTLGDIPKLAEEFGLRVTLGIWISPDLERNEREIQRAIEIANSSRSVVRVVVGNEALFREEITPEALIVLLDRVRAAVKVPVTTSEQWHIWEKNPQLAKHVDLIAAHILPFWEYIPMDKAGQYVLDRARDLKKLFPKKPLLLSEVGWPSNGRMRGGNETSPADQAIYLRTLVNKLNRQGFNYFVIEAFDQPWKVSDEGSAGAYWGVYNAARQQKFNFDGPVVAIPQWRVLAIGSVVLALLSLTLLMIDGSSLRQRGRTFLTFIAFLCGSVLVWIGYDYSQQYSTWFSVTVGILLALGALGVFIVLLTEAHELAEAVWTHKRRREFLPVEGDSDYRPKVSIHVPCYNEPPEMVKQTLDALAALDYPDYEVLIIDNNTKDPAVWEPVRDYCETLGPRFKFFHVAPLAGFKGGALNYLIPHTAKDAEVIAVIDSDYCVSPNWLKHMVPHFADPKIAVVQSPQDYRDQNESTFKKLCYAEYKGFFHIGMVTRNDRDAIIQHGTMTMTRRSVLEELGWADWCICEDAELGLRVFEKGLSAAYYHDSYGKGLMPDTFIDFKKQRFRWAYGAIQIIKRHTASLLRGKGTELTRGQRYHFLAGWLPWVADGMNIFFTVGALLWSAAMIIVPTRVDPPLLIFAIPPLALFVFKVGKIIFLYRRAVGVNLKDAFCAALAGLALSHTIAKAVLYGFFTTSIPFFRTPKNADNHGFWVAISEAREEMFIMLLLWGAALGIYLVQGLPSNDIRFWVVMLLVQSLPYVAALVMAFLSSLPKPAPKVELATAE
>tr|A0A7S1LF74|A0A7S1LF74_ALECA Hypothetical protein (Fragment) OS=Alexandrium catenella OX=2925 GN=ACAT0790_LOCUS8164 PE=4 SV=1
MCEAQIQKDDGDQKKQGHTAFATATMARDLAREAGDLRAEAEALHAMALAQERLDCFEEALRYADEAMDLYLELKDKRREAGELLSMADLSLCLGDFKQALIHAEDAMSIYQELGSKSEVEAIQTVYRVLVCRGDFQAARKIANRGLKRFHDLGNIKAQSQMMFMLINLNCKEGEIEYLTDKTRNKYKDALEVTQKALRLMHQLGEKQIEARLLVVLSALCLRLDRLDGALLAGQQALKMIKETGDTPWTSSARYFIENNSGLSSSNMGDVLFTLSHAYMKKDQHEEALALAQDLQQYFRENSNRRGEAAALMTINTCYLKLDLKPEAMKVAMQAQMLFNEAGDAAGEAYVLRALMDAEWEREDYAAAVRLGERAAALFREVEDRRSEAGVLYGIAVNNIHMAVRMGARVGDGGAGQRYYGERTRAITEALAKAQRAAENGVRLCKELMQETSKAGQLLAASLATLAQVHMFNSKPATALECADEAVILFREQGDYHSEGSALLQSADALRVTGQYEEAKEAAEEALSLCQKYEDEAGVMVAK
>tr|A0A7R8YYH3|A0A7R8YYH3_HERIL Hypothetical protein OS=Hermetia illucens OX=343691 GN=HERILL_LOCUS11551 PE=4 SV=1
MVAVPYLFNEVYDIFRKAPFYTVVLEVLLLISVVWVIFYNNKNKRKRYTPEQEEEIIAKWQPEPLVGDTPADHPALFPRIVEGRVGKRINVDGHDCLNLATHDYLGLLEDEGIRKAAITSLRKYGVGSCGPRGFYGTLDVHLELEERLAKFMEMEEAVVYSYGFSTIASAIPAYSKRVDIIFADEKVNFAIQKGLDASRSTIYYYKHNDMKDLERLLIEQQKRDEKNPKKAAKTRRFLVAEGIYMNTGEICPLPELVELRKKYKLRLFLDETISFGTLGENGRGLTEHFNVDRIEVDLIIGGLENSVASIGGFCVGSSFIVEHQRLSGLGYCFSASSPPLLTQAAICALDRFENEPKMFAQLQESTTKLHNKLGSLTHMSLGGNKISPVKHLYIKESRDVDTERALLKEIVGKCIEKGLAVIDAQYLEHIEKHCPRPSLRITANRLLEDKDIDFAFQTLEKVSSDILS
>tr|A0A3D9YZA5|A0A3D9YZA5_9HYPH TYR_PHOSPHATASE_2 domain-containing protein OS=Methylovirgula ligni OX=569860 GN=DES32_1626 PE=4 SV=1
MPRIHVCSLFQIADVTAATGARSLITVINQGIYVDRPPAIAPERHLQVAISDVCEETEGHILADSGHIQSLIDFVRAWDQAEPLVIHCFAGVSRSTAGAFIAACTLNPQVNEAEIARRMRRASPTATPNIHLVSLADQALGRDGRMITAIREIGRGAECFEAEPFALELY
>tr|W1WC24|W1WC24_ECOLX Transposase_31 domain-containing protein (Fragment) OS=Escherichia coli DORA_A_5_14_21 OX=1403943 GN=Q609_ECAC02469G0001 PE=3 SV=1
MSKKQSSTPHDALFKLFLRQPETACDFLAFHLPAPIHALCDMKTLKLESSSFIDDDLRESYSDVLWSVKTEQGPGYIYCLIEHQSTSNKLIAFRMMRYAIAAMQNHLDAGYKTLPMVVPLLFYHGIESPYPYSLCWLDCFADPKLARQLYASAFPLIDVTVMPDDEI
>tr|A0A811T4R2|A0A811T4R2_9EURY Uncharacterized protein OS=Candidatus Argoarchaeum ethanivorans OX=2608793 GN=EMLJLAPB_00228 PE=4 SV=1
MIENEKEIIFHPYALYKMNKRNISKQEVIKTLKEPHSGMDGQYGRRISQRVYGHHVLRVIFEEYEDHILVITAYPAKAERYLGRM
>tr|A0A022PN75|A0A022PN75_ERYGU Uncharacterized protein OS=Erythranthe guttata OX=4155 GN=MIMGU_mgv1a007123mg PE=4 SV=1
MLELRGMSELTEWLQAELRSAAPENDQRLVVFPRLEYLQIIYCRQLKSAPSHFPCLKELLIDGVESELPLVSICGINLISLTKLHIHSIDGLTCLPNCLFRKNQNLSMLVISGCRNLTHLVPCLEGGGTALRNLEIWDCPELRELPDDLHTLSALENLAIYGCSKLKTIPYPYETHNDDDDEQLLLGLSCLRRLFIEYCDELTNLPIELCAESLESLTLRGLMNLRMTMGTLIGYCMQKMPRLSELRIVDVPTTNNPWEIVGSVTLGNLRDLTISCDEYSVSAVDAILKASAKSLHRLTLLGTEHSRELPGQLQHLTALSELGLYDFGEMEELSDWLIGNNNNNNLSSSLQILHLSRCKKLRYLPSKEAMLHLTKLYISNCPMLHIKGGDSDYGSEWPKISHIPYVVLDWVQIPTHAQ
>tr|A0A0N0T8W0|A0A0N0T8W0_9NOCA Chaperone protein HtpG OS=Nocardia sp. NRRL S-836 OX=1519492 GN=htpG PE=3 SV=1
METLEFQSEARQLLQLMIHSIYSNKDTFLRELVSNASDALDKLRLESFRDKDMVVDTDDLHIVIESDPAQRTLTVRDNGIGMTREDVVRLIGTIAKSGTAEFLRKAKEQQAGAGSDLIGQFGIGFYSSFMVADKVTLLTKYPHAEKGVRWESTGESTYTIEDVDDAPQGTSVTLHLKPSDDEDQLPDYTEPAKIREIVKRYSDFITWPVRLGGEEINSRKALWARPASEVTEEEYAEFYRHISHDWNAPLETIRMQAEGTFEYQALLFLPAQAPLDLFMRDGKRGVQLYVKRVFIMDDCAELMPEYLRFVKGVVDAADLSLNVSREILQQDRQIQLMRRRLVKKVLSSIKALMGSRPDDYAKLWREVGAALKEGLLSDADNRDAILEICSFASTHSAEAPTTLADYVSRMKDGQEHIYYMTGDSRTSVEHSPHMEALRAKGYEVLILTDPIDEMWVDAVPAFDGRQFQSVAKGQVDLETEEEKSAAKAKAEEFGDLLTWLQGLLEENVKEVRLSSRLTTSPACVVGDAHDITPTLEKMYKAMGQELPKIKRILELNPSHPLVEGLHKAFAAGERDALADTAELVYGLALLAEGGELADPSKFVKLVADRVQRTF
>tr|A0A4V3UMH6|A0A4V3UMH6_9EURO PKS_ER domain-containing protein OS=Aspergillus tanneri OX=1220188 GN=EYZ11_013270 PE=4 SV=1
MQRARVRAGKPEKLEHSSPQRFNIGAENPRKISRTKRNTRKYATFPTNSSTLTLLQPDLSSTRLELVDRPIPIANPDANEHLIRVHCTAPCAGELGWYAYVSLPDREPVPCDDMAGTVVTAPPNSPFQPGDEVYARSTFNRPGCARDYTVVVTDELARRPQNLSWAESAATPLSAETAWQALFEQSGIGGFSSSAWKGKRILVTAASSSTGMWLVQLGRIIGAQIIGTCGPNNVDLVRGLGAVDVVNYRSQSLREWGQNEENKVDLVIDCIGGQSLEDAWRCVRDQGIVISICRSPNEVKPAEVTAKEVRGLFFIMTPRRSDLEEITKLVEAGECRPLVDSVWPLEQFQSVFDRVEGRHARGKVVMDLRLNRKLES
>tr|A0A1H5GDJ1|A0A1H5GDJ1_9ACTN Succinate--CoA ligase [ADP-forming] subunit alpha OS=Streptomyces sp. Ag109_O5-10 OX=1855349 GN=sucD PE=3 SV=1
MAIYLTKESKVLVQGMTGGEGMKHTRRMLAAGTDVVGGVNPRKAGRTVDFDVPQCPNGLGGAPTAVPVFGTVAEGMAATGADVTVVFVPPAFAKAAVLEAADAGIGLAVVITEGIPVHDSVAFTSYARRNGTRIIGPNCPGLITPGQSNAGIIPADIAEPGRIGLVSKSGTLTYQLMYELRDVGFSTCVGIGGDPVVGTSHIDCLAAFEDDPDTELVVLIGEIGGDAEERAAAYIREHVTKPVVGYIAGFTAPEGRTMGHAGAIVSGAAGTARAKQEALEAVGVRVGSTPTETARLVLELLKAGS
>tr|A0A2P7YVD5|A0A2P7YVD5_9ASCO Uncharacterized protein OS=[Candida] pseudohaemulonii OX=418784 GN=C7M61_001726 PE=4 SV=1
MSTWQAHTDHSATSPRSTLPATKQLDSDATPRMSHLPTPLGELKLLVNNDLLRKNPNFVTSEAALSSTIEQLDLETLKISAYARLDFENYTFFVQTLQVVLGRKAVEDAAPTHHAVDVHLSSKKAISRRHAKIFYNFGTQRFEISILGRNGAFVDDQFVETGITVPLVDNTKIQIGDIPFTFVLPSLEPPEKKNATPAKPFNPSDAINLRSNLYLNPASPNRKKSLTDEQKKARRNLRADIVRRLSNARRKSLASSTNDEITALLKELEDIGDDDESDPFDKEVNELLRLGNLEAEEDELDELVKQHNLLQGIGVEDKDRKDVDVDMSVLDQEIASLAPLIDGQHPEKDAIDNKQGVYGRHGTTLATDTADNKNAPLMGRPAGPRMGKPAQIQPPANRAYGRQPVGPMYGYPNSGAYPQGYNSPYGSPAGYPTGARNSMYHPMMMPTRPPPPKLEVEVETISTVPVKSATIPFKAISTGVGNVQRPPVCVFKTLDIPLNKPKIPLRRKDAPSIKRPKSQGNKDITDQYKSKPTVSITAMITSVLRGPNSRKSGFTFSEICDGIKEFYPYYQYCPDGWQSMITHNLKTHNMFKREFKGGLDSEHLWVIDDDYLAEKERVRKKQQEVAMAKAKEAALKAVELRLKQLTPQYGAVGRPFMTPYASSFGQPRYPTSRDLSPPMPNGAPGQKPKSIAELASEIKRDSPGALNQSSYLPRLSLSPTVNSAEQSNSIKDQLAANRSASASLTNITSDVKTERSSPTPQPVAAAAAAVSANTNSGLVSKLLPMNADTKKSLGYLQKELFTLYKARKLSYNTATTTNIITKALATTIAQVNTIGAKAGCGDNALSFLVEKAPQQVSKILDIALTKSIKEVEGKLSNPTSKESTPVPTASPAASNIGLVQKPPASIESTSSASRPATPNSPAGGTPKPSYSGGLSRPHFSGMARPQNPSKPGALLKGPLFLSNKPRQEKRPAEETGEDPLKSIKLE
>tr|A0A6P1IPK0|A0A6P1IPK0_9BURK AMP-binding protein OS=Hydrogenophaga sp. BPS33 OX=2651974 GN=F9K07_06005 PE=4 SV=1
MTAQVATGWNLANIFDGVAARVPKDRPAIVHGDTVVRWGELDARSNRAARALLATGHTAGERVGFLSRNHPGYIEGFVACLKSRLIHVNLNYRYTVDELAGVLEDAGATALLYQQEFAPLVPALLERLPALRSRICLDGDGLGQATAQFQTMAAQGDASPLDASTREERDPLLLYTGGTTGRPKGVVWPGHHYRACQLESPLVQRRPANLGEHLDLVAANANPGRVLPACPLMHGAGISSTLAELLNGGTALLLAGARFDAHELWQLAERERASRVLIVGDVFARPMLAALDEQPGRYDLSSLKVISSAGLMWSEEVKAGLLRHMPWLVLADIYGASEAAGLGYAITTQDRATPTGRFEPGPRTVMVGDDGHIVPAGQEGEGWLARGEPLPEGYFGDPKKTAEVFRTIDGQRYAVPGDRVRRHADGSMQLLGRGSLVINSGGEKIYVEEVEEALKRLPGVDDVLVVGVPDVRWGSAIVALLRTDTPPDVQALRAGLAPHLAGYKMPKHFLAVDQLPRADSGKGDYKAARALAEQLLETT
>tr|A0A7D8UVQ1|A0A7D8UVQ1_9HELO Aspartate--tRNA(Asp/Asn) ligase OS=Lachnellula cervina OX=1316786 GN=aspS PE=3 SV=1
MTIILRAARHMIVRNTRTAVYVSPWRGAAASLVSSWLPSRGFHVSYRLAKEERWGREVEKPEDKERRGRSLEEQGVVEEQEEVEAEALKPQSFWEEFKGTSFVNLYLDNVPPPTFPFEKRIPSHFMALRVTTVGFLTKIVRLSDALTFAHINRGTGPEVLQLLSKNKETTKKLQSMRLNSAISVTGVIHKKYKPKVASKRKELEFEEGWFYLEELELEIEEITCLNTFDKDIGYGPEHVYRPENRHLQIRFDTNLQKALLYRSDVAACAREELKDFYEIETPILFKSTPEGAREFLVPTRRPGFAYALPQSPQQYKQMLMASGIHKYMQFAKCFRDEDLRADRQPEFTQIDLEMAWADGEVVMARVEKLIRALYKKFAAPDTQLQPLFQTPFHRITYDEAMSHHGSDKPDFRIPGLIQQVDHIVPDQLGKMLTHIEYPIFEACKIRLNGHPERIKKFVSMFFSTPVGEVFGKNIDGGPGVAVFDSSRPLEGLQTFGFEGAEKLKALYSNLPQQAFHGKEAHENATTFDDGDLIIVQARKNLPHSGGSTALGRLRIALYRAALAEGLLEPDLYHHYLWVTNFPMFTLENGVDPGQEGTAGFSATHHPFTAPKTAEDVDLLRTDPLMAKADHYDLVVNGVELGGGSRRIHSAKMQRFVMQEVLKMNPRRIEDFSHLLKALSAGCPPHAGLAIGFDRLIAVMRGVDSVKDVIAFPKSSKGEDMLVKSPRRISRKEWKRYHLQKIDLRTENSHKPMEKDATEKPKESKWTRFWNIVTIRK
>tr|A0A1X1VYA0|A0A1X1VYA0_MYCGO Aminotransferase class V OS=Mycobacterium gordonae OX=1778 GN=AWC08_00950 PE=4 SV=1
MREAFGEKFDVPAGYLDTAAIGLPFARVADTLVDTIAHWRAGALQVTDFDADVVAARNAWAQLVGVAPLDVVTGASVSQLVGLLAASVPDGTKVLTVHNEFTSVTFPFAAQQRRGITVTEARPAELLSQLRRHDLVAISAVQSADGFTVDLDELRAAAEAARVRVLLDVSQAAGWQQLRLHWAEFVVGAAYKWLLAPRGAAWMAVRRDVLADVVPQAANWSGAEDIWSGLYGLPLRLADNARRLDLSPVWFSQRGAAIALPWLAGLDLSAVRQHCVGLANATLAGLGLDPCNSAIISLGIAAEAAHRLVQAGAAISMRAGRVRLSFHLYNTMEDVELVLSALR
>tr|A0A0C5V338|A0A0C5V338_9GAMM tRNA 2-selenouridine synthase OS=Gynuella sunshinyii YC6258 OX=1445510 GN=selU PE=3 SV=1
MSRPDTDDYAAIFLHDTPMMDTRAPGEFLKGAFPHTVSLPLMTDNERAKVGTCYKQQGQQKAIELGHQLVSGTLKEERIQRWLEFARAHPDGYLYCWRGGLRSQIVQQWLQQAGCDYPRIKGGYKALRRFLIDTQERIVSNTRFRILAGHTGCAKTDLLTAVPGSIDLEGLAHHRGSTFGKRPAGQPSQIDFENRLAIALLRQDHQYPGATILLEDESRLIGRCALPETLRRRMAEAPLIIVESTLEQRVEHSFRNYILNKLAEWQQARGAEEGFTAFAEDLTTSLFKIRRRLGGLRYQELSAILEQALKQQQQGDDSLHREWIRILLRDYYDPMYDYQLSQKQGPVEFRGTATDIKNYLLTH
>tr|A0A7K7XU01|A0A7K7XU01_9PASS SGSM2 protein (Fragment) OS=Mohoua ochrocephala OX=874463 GN=Sgsm2 PE=4 SV=1
GVVEACLLHMLKRRAAGFLRTDKVAALFTKVGKTYAVAGDVCKKVQELQQQVESRKNQPNGQEPLKRQGSTTSKTPVLTPQAIKHIWVRTALIEKVLDKIVQYIVDNCSKYYEKEALLADPVCGPILASLLVGPCALEYTKLKTADHYWTDPSADELVQRHRIHGAHGRQDSPSKRPALGIRKRHSSGSTSEDRFAASAREYVESLHQNSRTHLLYGKNNVLVQPKDDLEAIPGYLSLHQSADSLTLKWTPNQLMNGTLGDSE
>tr|A0A4R6GLC2|A0A4R6GLC2_9BACT Coenzyme A biosynthesis bifunctional protein CoaBC OS=Sunxiuqinia elliptica OX=655355 GN=coaBC PE=3 SV=1
MRLKGKHIILGLTGSIAAYKAAYLLRGLVKEGAEVQVVMTPAAKEFITPVTMSALSGRPVASEFFAANDGTWHSHVDMGQWADLMLIAPVTAATLGKMAHGIADNLLVTTYMSAKCPVYLAPAMDLDMFKHQSTLNNLETLRSYGDVILEPGEGELASGLHGKGRMQEPEQLVEEVVAFFHSKKKLLNKKVLVTAGPTYEKIDPVRFIGNYSSGKMGFALAEELAKEGAEVILVTGPVHLKTTHPNIHRVDVESAMEMHNACLEHFPATDAAIMCAAVADYRPKEQADRKIKRNAGEMNIELQATEDIAAALGQLKTPSQRLVGFALETNDEKQNALAKMQKKNLDFIVLNSLQDNGAGFGVDTNKITILSKDNNAQEFELKQKTEVAVDIVKKLIGELTND
>tr|A0A4S0Y8E6|A0A4S0Y8E6_9BACT UPF0102 protein EN806_46285 OS=bacterium M00.F.Ca.ET.163.01.1.1 OX=2563906 GN=EN806_46285 PE=3 SV=1
MAERTLGHRRKAYRRGHRGEWLAALALMLKGYRILARRHRTRLGEIDLIARRGDLVLFVEVKARRTLIEAMEAIGHESERRIEGAADIWLSRQPDYGRLSLRFDMVAVLPWRWPVHVENAFYGRN
>tr|A0A3G5P5X5|A0A3G5P5X5_9HIV1 Envelope glycoprotein gp160 OS=Human immunodeficiency virus 1 OX=11676 GN=env PE=3 SV=1
MRVTGILRNCPRWWIWGILGFWMVMSYNVVGKEDLWVTVYYGVPVWKEAKTTLFCASDAKAYEKEVHNVWATHACVPTDPNPQEMELENVTENFNMWKNDMVDQMNEDIISLWEQSLKPCVKMTPLCVTLECQDANFTKANLTNTVTNNSDSIITNGTMKDVMKNCSFNATTELRDKKNKEYALFYRLDIIPLSGENNSASGNYRLINCNTSTITQACPKVTFDPIPIYYCTPAGYAILKCNNKTFNGTGPCNNVSTVQCTHGIKPVVSTQLLLNGSLAEGEIIIRSENITNNAKTIIVQLNKSIEITCTRPGNNIRKSVRLGPGQAFYATNDIIGDIRQAYCIINRTDWSETLQGVGKKLKEHFINKTIVFSPHSGGDLEVTMHSFNCRGEFFYCNTSKLFNSNSTANESNIELPCRIKQIINMWQGVGRAMYAPPIAGTIQCTSNITGLLLERDGGNHNGTETFRPTGGNMRDNWRSELYKYKVVEIKPLGIAPTGAKRRVVERQKRALGIGAMFLGFLGAAGSTMGAASIALTAQTRQLMAGIVQQQSNLLRAIEAQQHMLQLTVWGIKQLQARVLALESYLKDQQLLGIWGCSGKLICTTTVPWNSSWSNKSQNAIWGNMTWMQWDREISNYTDTIYGLLEESHYQQEKNEKDLLALDSWQNLWNWFDISKWLWYIKIFIMIVGGLIGLRIVFTVLSIINRVRQGYSPLSFQTLTPNPRGPDRLGEIEEEGGEQGRDRSIRLVNGFLAIAWDDLRSLCLFSYHRLRDLILVTTRVVELLGRSSLRGLQRGWEVLKYLGTLVQYWGLELKKSAISLLDTIAITVAEGTDRILELLQRICRAICNIPARIRQGLERALL
>tr|F6HXQ9|F6HXQ9_VITVI Uncharacterized protein OS=Vitis vinifera OX=29760 GN=VIT_09s0002g00830 PE=4 SV=1
MGVSFKISKTGSRFCPKVVLSDAPLNEEEEEIAKENSRIPDRNESLSNSTTRKLEADIIEGDEDVAGISGSSISSGGLLIPSDNEVSFTLNLFPDGYFIGKPSENETTHQAMLQDVPKLLHPYDRTSETLFSAIESGRLPGDILDDIPCKYVNGALLCEVRDYRKCASEPGFSVPCADGLPIVNKVCLRMSLENVVKDIPLISDNSWTYGDLMEVESRILKALQPQLCLDPSPKLDRLCEKPVPAKLNLSLSSVRKKRLRQMPEANITSSNKIHVKKISMDRAGESLNGRLRDSGPMSGAVMAQHVHENLAAQNVGPINILTPGPKSFVQDASNPALPLASPRSKYQVSVGNPKIMQDHGSGSVVNASGASSSIQDMMISYTDNVHGKRENQDDQLSPLSNMTKRQRLTAVGPEGIQQQHLVPHIDSFHGSDLQWKNAALLPHQLNARGNPYANTGIQKYPQQVFDGVLNQEAASASFAETEKLDRPELNRVKNDMHMGEIESNHLDPQQSRLQSRLPQQIPFMRSNSFQAPWNNITQHIEKDPRKERKLVQSPRVSAQGLVQSPLSSKSGEFSSGSLGPQFGPTATTAVLGASQKDKPAVTSVPPVVGTPSLTSSANDSVQRQNQMQIVPKRRSNSLPKAPAVGSPASVGNMSGPSNANSPSVATPPSADQTMLDKFSKIEIVVMRHQLNCKKNKVEDCPVKKPTFSPQELLGRLSMASHNEDIKDDTCKMPLSKSLAGGSMNVCKLRVLNFVQAERVVQGSVVSVVPRARSTMIMSEKANDGSVAVHHGDVVDGDFLSAEDYVSTLPNTHFADLLAAQFCSLMNREGYHLMEDRVQPKPARMNLASSNQSNAPGISPNNSAAEMQQYSETASGQPHNEVAKPTNSGNTPLNASQNLLANSRMLPPGNAQALQISQGLLTGVSLPTRPQQLNPQPLQQPQQQNPQSLIQQQHSQFQRSSLMLPTNPLSHLSAMGQNSNMQLGNHMVNKPSATLQLQMLQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQQPMQRKMMMGLGTAVNMGNMGNNIASLQGLGNVMGIGGARGMGSTGISAPMGSISSMGNVGQNAMNLNQASSVTNMLGQQFRNPQLGTMAAKIRMLNPAILGGRQAGIAGMTGTRQMHSHPGSTGLSMLGQNLHRPMNPMQRTGMGPMGPPKLMTGMNLYMNQQQQPQQQFHLQQMQQQQQHHQQQQLQQQQLQQQQQQLQQQHQQETTSPLQAVVSPPQVGSPSTMGIPQQLNQQPQQQQPQQQQASPQQMNQRTPMSPQQMNQRTPMSPQQMSSGAVHPMGTGNPEACPASPQLSSQTLGSVGSITNSPMDLQGVNKSNSVSNT
>tr|A0A7Y3TR66|A0A7Y3TR66_9FLAO IS701 family transposase OS=Flavobacterium sp. CLA17 OX=2724135 GN=HAV12_33835 PE=4 SV=1
MPASRAARPTIHFVDEYCQLYEDLFPEVRSYEAFKLLHLGMISEIKRKSLPAIAKAVGLNNQQNLHHFLTESPWQVQQLRQKRLELTLKVLNGRSLILLIDETGDCKKGKSTDYVKRQYIGNVGKKENGIVAVTAYGLVDGMIVPLSFEVYKPRERLKEGEEYQSKPQIAATMIRQLQALGFEFELVLADSLYGESKVNFVDVLDELNLPYILAIRSNHALWLPQDQEVYQEPWQTFKRTFSNGTTETRHMAEVIYGKSHRKQYWLLTTDPDTLPDNSTSYVMVCAPAIKLKDIGDSYGFRTWIEYGLKQAKDALGWADFRMTRYEQIEKWWELVMSTFLMVSLFADPFNDSCPLAHQRFSQHPWWNNQSGWKNLLNNLRLVIQPLVCFNWLKHWLTVFPIASLQLGFEQLTQKMNQFICPRVHQLNLQLIFSSA
>tr|A0A7G3FQZ2|A0A7G3FQZ2_9BACT CsbD family protein OS=Roseivirga sp. XM-24bin3 OX=2133949 GN=DCO95_02490 PE=3 SV=1
MSATTDKLKGNWNIIKGKLKQNYADLTDDDLTYTEGQEDELLGRIQRKTGKTKDEIKDFIDSI
>tr|A0A2T0UIC1|A0A2T0UIC1_9ACTN Acetolactate synthase OS=Glycomyces artemisiae OX=1076443 GN=B0I28_10654 PE=3 SV=1
MSTPVKAPKPGPQAGSAGTQAAKAQPARPKAPRPAPPLGAPAAAPVLTGAQAVVRALEELEVEAVFGIPGGAILPAYDPLLDSEKVRHVLVRHEQGAGHAAQGYALATGRVGVCMATSGPGATNLVTPLADAHMDSVPIVAITGQVASTAIGTDAFQEADIVGITMPITKHSYLVTTGEEIPRVLAEAFHVASTGRPGPVLVDIPKDILSGSAPFVWPPKMDLPGYRPTTQPHGKQIREAAALIAEAKRPVLYVGGGVVKSGAHAELRELAELTGAPVITTLMARGAFPDSHPQHLGMPGMHGSVPAVHALQKSDLIVALGARFDDRVTGKLDSFAPEAKIVHVDIDPAEIGKNREVDVPIVGDCRAAIAAMTEAYADPGKERLKTWWETLDDLRGRYPLGYTDIDDGLLSPQYVIERLGALAPEDTIWTAGVGQHQMWASQFIKYETPGTFLNSGGLGTMGFAVPAAMGAKLGEMGRTVWAVDGDGCFQMTNQELATCAVEGIPIKVAVINNGNLGMVRQWQTLFYDKRYSNTNLSTHHSEASPRIPDFVKLAEALGCVGLRAETPEEVDAVIAQANAINDRPVVVDFTVGPDAMVWPMVPAGVSNDEILYARDVRPNFDDEGEI
>tr|A0A1Z2XRM7|A0A1Z2XRM7_9FIRM DUF3502 domain-containing protein OS=Acutalibacter muris OX=1796620 GN=ADH66_10645 PE=4 SV=1
MSKKILCLILTLALLATCFVGCADKGESKKESSSTPESSAAESSETQSSDTGDKTTDEEPYTVHFAYYIAKESPNMGALSDAVNELAMKELNMKVDLQALTQGTYHQQIPMMLAAGEPMDVFISRASEVGTFIESQYILDCTPYLDKMENAKAALGDDIQACYIGDFLAGFGSMAERATPGAMVVRKDIFDELGFKKEDFDYTLPNMGVLDQITEMYAKVKEKYPDMICFDGTAVPASCAFCFVDNLSSSFGVLETPESTTVVNWFETDMYRRLCEAAMEWYNKGYSSKDIAVNTDGGDVKMKGGNCFSYFQSWKPGVETEKKSQTGYDVEMIQLIDAPKTSYNVNTRLWSIANSSEDPEKAAQFLDWTYKSGEFTDLINWGVPGTDWVLNDDGQADYPEGVTAATVGYHNDKGFSYPNQFNGTLWAGAPKDLWEQYETWHATLKESAAFGFAFNSMPVATEMATLQTVYDKYQKTVGFGTLPDLDAAIQEFNDALYEAGLQKVLDEKQKQLDEWLANK
>tr|A0A0Z8MB24|A0A0Z8MB24_STRSU Membrane protein OS=Streptococcus suis OX=1307 GN=ERS132461_01172 PE=4 SV=1
MKKLLTNHFFYLTIAFLLILVIYFSGIDKRWIILASFLYFIPSQILYRRRLKERLQEDQPK
>tr|K8FB40|K8FB40_9CHLO ATP-binding cassette transporter OS=Bathycoccus prasinos OX=41875 GN=Bathy12g02760 PE=4 SV=1
MSAVDHRKENVEDPTNRLEQYASLCRDELEAHGGKLPSVEIKCDFDYTLHLPANKIDRSIKTVPGVLTDVAMKIPNKVREKISGKENDATKMEPFRVLKDVDCCFKAGSLTLVLAPPGHGKTSLLKAVGQILPSAVLSGGKGVTYSKMTAEELKEKDIDANRMAMYVTQQDEHLPFLTVRETTKFSHENATPTPTNEREEDVHSRKIDSVHRLLSLENCLDTIIGNDLVRGVSGGEKKRVTIGEAMVTNARVFCMDEISTGLDAAVTHNIIAALREWTRITNGTVIVSLLQPTPEVYELFDDVLCLRDGTPVYHGDVDKVVDHFCGLGFDSENAKKGDVADWLLSVLVDPLAHSKTGASNQFASGDGLRKGWVENSNGLYKKSIGETDCVDKSDGKNMIDLRTPFAKAQYSTAYPKAWPSMYKSVIKRQFQITLRNKVFLSARMFGALITSVVLGSVWFDLPLDRGFERLGMLLFCVLHISFSNFSELTFSVEQKYVAYKQLDYKLFPTFAYIVSSIATQLPIAVLETAIFSCILYPMVGLSMEFENWLVFFINLTCANVAMASFFRVVALLAPNMEAAQTFPGPVIAIMVIFAGFLISPEKMGVLHFLYWISLFAYSLRSLCQNEFLSDQFKYKVPLDPTAAAVYVQGYTGDPKTMAEFCEENAFPCEDAGKITLSTIDISSDKKYFWAGPIFSIGFFCLMTAIGYRALSKIRIQRNIGSSRTSSSEKKKDGENAEEVSISISKVDAEASQRALSFTPMSITWEDLEYTVKVPGEDGKPLSGSKKILNSVTSAAQPSRMLALMGASGAGKTTLLDVIAGRKSGGEMRGTIKLNGHVVKKETFARLTAYCEQQDLHNAFTTVKEALEFSATLRLPSDVSKDARKAVVDEALDILELRGIENRLIGVAGSPSGLSPGQRKVLTVGVELVSNAPVFFLDEPTSGLDSRAALIVMREVKKVANLGRTVITTVHQPSKEIFNLFDDMLLLQRGGYQVYFGPCGVNGKTFVDYLQKIPNAHALPDGMNPASWMLDVLGGTDSSNAGEKSALKKSKSTAAGSLQPAMTMKRSGSGGALNGLLLVERFKASQEGAAGTRLVKELCAKGEKSEMFAFASPYARSFLAQLRCLIQRASLAHNRDVAYNLGRIGILFVLYLLFGFVYFDLDASNETGVQAMVGVIFMTSIFAGIIFMNSVMPVRVRERAVAYRERTSFMYDAVPYSLSHAICEVPWVLLVTFVTVTPLYFMVGLVPTFEHYIFHVLMVFTVSMAFMSLGQLIACLCATIQTAQAGASAFIPICFLFGGLYLPYPQIPVYWKWAYFIDPVAYAIQGVTAPQFEHRGCTGAYPDGDCPTIQAFRGTYFETVDTLAYVEEKYDVQLSQKWYMLIYVAIFVLCMQTLHIIAFKFKKVVAR
>tr|A0A0B7H5Q7|A0A0B7H5Q7_9FLAO Uncharacterized protein OS=Capnocytophaga cynodegmi OX=28189 GN=CCYN74_10172 PE=4 SV=1
MNYILPFLSIITGFGTVLIFKPKNQRNIKLLLAFSGAFLLAMTVFTLIPEVFHSLEHSHEHDIHDHNTGKKIGLWIVIGILLQIILEFFSKGAEHGHMHHPHSELKNAFPWSLFISLSIHSILEGFPLHHHHHMVYGIFVHHLPIAMVLTIFFLDSGIGLKKTFIFLILFALMTPFGTLLAEFIPQLGRYHIQISAIVIGIFLHISSVILFETSENHKFNHIKLGTIILGFVAAYFT
>tr|A0A7I6VAI1|A0A7I6VAI1_AERCA Membrane protein OS=Aeromonas caviae OX=648 GN=WP8S18E04_21180 PE=4 SV=1
MNLMLYVSTVLIWGSTWIAIAWQLGPIPIEVSVLYRFALAALALFALLTVSGKFPRLPWAGQRYAALLGALLFSTNFLCFYHATLYIPSGLSAVIFASASIFNGLNLWLFEGKRPGLRWLQGSLLGLLGTLLLFWPVLADAQLGANGWKGLLFACAGTLCFSLGNLVSARGQRQGYHVLQMVPWGMVYGVALLQGWVTVLGQSLTLPTDPRYLAAMVYLAIFGSVIAFTAYLTLVGRIGASKAAYATVLFPLVALTLSTFYEGFVWQTVSIVGVVVSLIGNLVIFAPPVKAWRWPLSRAANGTCP
>tr|H8X476|H8X476_CANO9 Histone-lysine N-methyltransferase, H3 lysine-36 specific OS=Candida orthopsilosis (strain 90-125) OX=1136231 GN=CORT_0C06550 PE=4 SV=1
MNGNTKNSDYASPLFLDVEDKTEEALTKFQNLQISTYQSKSIAAPSNNKRPEYMTCDCEEEWDGEQEKNLACGEDSNCINRLTSVECTNRHCLCGDDCQNQRFQKRQYADVSVFQTELKGYGLKANKPISEGQFIYEYIGEVIDEGAFRQRMIEYDVKNYKHFYFMMLKPDAFIDATEKGSLARFVNHSCNPNAFVDKWVVGDKLRMGIFAKRKIAKGEEITFDYNVDRYGAQSQPCYCGEPNCIKFMGGKKQTDAALLLPEGIAEALGVTSRMEKAWLKENKHVRADQQKDDSTINEMFVQSLEVEPMQDADVSKVMAALLKSQQVSITRKLIMRMHMTDDPTVNSLMVKLHGYKTLSGVLQGVEDEDLIKMILEILSKWPAMTKNKISSSQIEDVVKEIEANSTNEEIRQLASDLLAQWSVLEMAYRIPKTQASDKSLMESYGRVSRSPEHSNGNTSGVINHDQSNFAQYSTNVSQVYSATLPKGPASVPNFGLPENWQAQFDPNTQKYYYYNVLTRETTWDKPGVSIPTRPKLPTGPSSMINQQPQTSHSSQYQNGPPSRNNNIEEEIARREEEKERRERESRAQELLNKERKLRELIEQAQSVKSTPEPEKKSKHKHKHEHKHRHGRTKSHEGKGTAALDDDARVSKESKHKSSSHQHKKKEVKETSLEAQWKHIMAKHVPNLLKSYVEEIGKDNVKGCAKEIVNNLASREAHKGVPPSSSKELDKHKLKKLKEYSDTYMDKFLSKYRSKHHGKRKLGEDEANATSREESRGIDSNVSLSNIDTNGEVESEENKKVKLDSGV
>tr|A0A5N5DU29|A0A5N5DU29_9PEZI Inner centromere protein mis6 OS=Lasiodiplodia theobromae OX=45133 GN=mis6 PE=3 SV=1
MHATIDALRTASTLPAKQRGEKVNAVVDAVCSHAYQHGLSRDHLQSIVAIVTRRNHLDQTSLTNLIKNLYPADRVSSDIVLAIVGSLGHGQAKPSAATQAALLKWIIAVIDALQDATVLSKLYGVLFNMLDTMTLRTPLCHLLSLITRRKHVRPFRIQQLLEMVRGSGQDPALVGLLRVYKDYYPEIIVGNAASGRTSFASAAQDEWRQRLQVIQDANADSNEQLYAQQDGFKVIRRGAKRAKASILPDVHTSYANEKSVTLEEVNSADGLVKNLERIELPNQLLASFKDPLLQKYLILKPSDTAARRLELWLESYLRETLETISSGTKNPDHFDELLDGMLNYTKATKDFKEFKASYLNPAEAAIVTSGTVDAYDRLVTFYTALVQNWNHAANTSRPDSGDAANDLITSTDFTGLTTHISNTILSLLTSQSHTPISTTTTILTYYTTLSTLSSGLTPLTIPTAPTLYTLLFQPSLATLSQLCTLLATYKRAFEADLQDHTTTAANLPRAVTNAFNGYLMDVANLLWRSRALTSTDPNAMACLCAPGVAAALHAYISTTLPPVLIPSANDNTTAPAPGTGPDYTLAALFGLPHNALTAPLARAAFRDLEDAHHGTSGSSNAPRHPPGPVTQRTLHRLARAGNNGNGNGNGNGGGAAGGGGGGLELSWKAYRVCVLEWLAERGVRGLRDFMFVTMKDLMKESAAAAAAAAAKTGATTTTATA
>tr|A0A559MAT3|A0A559MAT3_9HELO VPS37 C-terminal domain-containing protein OS=Lachnellula willkommii OX=215461 GN=LAWI1_G004602 PE=3 SV=1
MSSPSTAYPPYQPHRNSQSFDPNAPPAPPPKPSSQEVSRRSTPAGSQPLPPPPPPQPEGFGTYGASDDPRSFQQARFSSSEVLYAEQIQDPGERWLPKILEDKTFVTLRHKIKQDLADVLAKPDLLAALAHSTSTAHASIASAQEPLQAALTENIALASHLNELEARLAHLRSSTQAQLLSTHALERQWKQKQSDMDRALAPFSPSSLYQRLSQAVQEQEMVCRALEESFLEGDGGTATEREVVEWVRRYREATKVYYSRRERKERWDEGRVGGWR
>tr|A0A3D4HVI7|A0A3D4HVI7_9BACT Uncharacterized protein OS=Patescibacteria group bacterium OX=2052139 GN=DIV45_01950 PE=4 SV=1
MAKQLKLFEKSVKKKQLTKKLVVLGKKKGNFSCQARVPFSEPVGSPNRRSGPEATKLRKYPLKSLPLKKGRRGGDVNLLAPSSPSPSSGRRGEKRHWHWTDYFVSSPLKITPKKKRKTPVVFVMMSGGVDSSATAYLLKEQGFEVVGVYMKNWSFPIKRIDECPLYQDYKDMVKVCKFLKIPYQVWSFEKDYRKRVIDPFFKGYEAGLTPNPDVMCNTEIKFDDFFKKAMKLGADYIATGHHIRSRCADPRFSRHSGESLGRLQNLIIRSWTSQDDDAKXXSG
>tr|A0A1X0VXM2|A0A1X0VXM2_9GAMM NGN domain-containing protein OS=Rouxiella silvae OX=1646373 GN=BS639_21155 PE=4 SV=1
MKNWYLVYCNYNQEDRAIINLERQGVQVFCPMLSQDNHSPHKKGGYMFPRYLFCLFNPEVTSKTTINSTRGVSQLIKFGGRQEIIPNIVIESLMFYIERSPEAEFKGGESPNLKKLSEDLSAIIKGILSECESDKRVLLFFSLYSLIVRDIAKEIVKIPVKK
>tr|A0A1F1KDD4|A0A1F1KDD4_9MICC GntR family transcriptional regulator OS=Micrococcus sp. HMSC31B01 OX=1581073 GN=HMPREF3105_05090 PE=4 SV=1
MSRTGIGTVSLGSAPVSKADRAYQAILEGIRDQRHEPGDRLVLSQIAAELGMSVVPVREAIRRLQSEKLVAYERNVGATVVGIDPVEYRHTMETLALVEGFSTAQCAPHVTAEDLAAAREVNATMRAMTESETAWDPVTFTELNRRFHSILFEHHQNEHVHDLVHRGWNRLAALRSSTFAYVPGRAVASVDEHEHLLRLIEDGARFEEIEAAARAHRLNTLRAYLEHSAEPSA
>tr|A0A7C4I6T5|A0A7C4I6T5_CALS0 TatD family deoxyribonuclease OS=Caldiarchaeum subterraneum OX=311458 GN=ENM30_04935 PE=4 SV=1
MIDVHCHLTEEPLLSNLGEVIMEAKKSSVEAIITSGIGPADCEKVLSIVDGVYIYGSLGIEPYALEGYEKVIELIMRNRERVVAVGEVGLDYYWGKKETREMQAKVFREFIELAKSLDLPLVIHSRSAGKYALNILIEEKAERVVMHAFDGSAGEAERGAAKGYFFSVPPSVVRSEQKQKMVRRLGLENLLLESDAPVLGPERGVVNKPSNIAISAKAIASLKNIPLDKVVEKTTENAKNIFRI
>tr|A0A2E7SH61|A0A2E7SH61_9EURY Thioesterase OS=Euryarchaeota archaeon OX=2026739 GN=CMA77_02820 PE=4 SV=1
MTSDEIGVQRKFAPTSICFGCGPANEKGLQINSTRIEDGLELWFTPSSEHQAFPGMINGGIIGTLLDCHGNWAAAMSIMDARGDSEPPCTVTASYSIQLRRPTPADIPLHVTARVIELQDDRADVEMELYAEGKLCAKGKGLFVAVNEGHPAYHRWG
>tr|A0A1J0GT11|A0A1J0GT11_9CAUD Uncharacterized protein OS=Arthrobacter phage HumptyDumpty OX=1913080 GN=SEA_HUMPTYDUMPTY_66 PE=4 SV=1
MSLTRKERENNLVCRHCGRPIVRNTGPRHRWARALPKMEWLHNAKDFDPSKPIDCFTPEPKA
>tr|A0A7G9IUQ7|A0A7G9IUQ7_MACNE NADH-ubiquinone oxidoreductase chain 5 OS=Macaca nemestrina OX=9545 GN=ND5 PE=3 SV=1
MIMYTPIMMTTLISLTLPIFASLINPSKKHPYPNYVKTTVMYAFITSLTSTTLFICLNQETTIWSWHWMMTQTLNLTLSFKLDYFSMMFIPIALFITWSIMEFSLWYMSSDPNIDQFFKYLLIFLITMLILVTANNLFQFFIGWEGVGIMSFLLISWWHARTDANTAAIQAILYNRIGDIGLILAMAWFLLHYNSWDFQQMLALNSNPSSLPLMGLLLAAAGKSAQFGLHPWLPSAMEGPTPVSALLHSSTMVVAGVFLLIRLHPLMETNVLIQNLTLCLGAITTLFMAICALAQNDIKKIVAFSTSSQLGLMMVTIGINQPYLAFLHICTHAFFKAMLFMCSGSIIHNLNNEQDIRKMGGLFKTMPLTSTSLTVGSLALAGMPFLTGFYSKDLIIEATNTSYTNAWALFITIIATSLTSAYTTRTILLTLTGQPRFPALTNINENNPALLNPIKRLTMGSMITGFLITNSIPPTSPLQPTMPLYLKLSALYATALGFLAALDLTLMTNKLKMKNPSQTFKFSNMLGYFPTTIHRMIPYQNLLMSQNLALLLLDLTWLEKSMPKMISQTHITTSMTVSPQKGMIKLYSLSFLIPLTLTLFLMM
>tr|A0A2D6YFP4|A0A2D6YFP4_9DELT Ribosomal RNA small subunit methyltransferase H OS=SAR324 cluster bacterium OX=2024889 GN=rsmH PE=3 SV=1
MSEPRFRHLPVLLAEVLGSTPANSKNLLDCTLGGAGHSRALLGKFPKANLYGIDRDPAALAASRHRLAEYPGVTAIEQASFLELPYWAEKWRKPFDFILADLGMSSEQLAAPERGFSFLQEGPLDMRMDPFRQVETATQILQQRSEFEIRRLLQTYGEERFAPQIARAIVQHRANAPLVTTSELAELVERVIPRKFQKPNFHPATQTFQALRMEVNQEPQEINALLDFAIENLQPGGRLAIISFHSLEDRPVKQRFREWERPCRCPSDLPRCVCGLQALGVSLQRKPIVAGAEEIEKNPRSRSARLRVFERNAVCFPGXXKXSRN
>tr|G3NV60|G3NV60_GASAC G_PROTEIN_RECEP_F1_2 domain-containing protein OS=Gasterosteus aculeatus OX=69293 PE=4 SV=1
MNNVSVVRFFILSGINETNDYRVTLFTFTLLYYCIILILNTSIIMIIILDQNLHEPMYILLCSFCMNGLYGTTCFYPKFLLDLFSSSQQISYEWCLLQAFVIYSFPCYELSILAVMAYDRYLAICRPLHYQSVMTKRKVSQLICFSWFTPFCILSINIVLTSRLKLCGVNIDRLFCVNWKIVQLACYESDTFSNNITAYFTMLIFISHGLFVVWTYMHLIRTCVKSKDDRVKFMQTCVPHLVSLVTFIVAVVFDLLHIRFGSKDLPQSLQNFIAIEFLLIPPVMNPLVYGFKLKKIRNRILVYCPDAEATASLPGVQKRTPSKTVMHLCNTSSQRTTKNQSCILILSH
>tr|S9V0M4|S9V0M4_9TRYP Npa1 domain-containing protein OS=Strigomonas culicis OX=28005 GN=STCU_11365 PE=4 SV=1
MCTHGFFTHIIEDAADLLQEGSEAGMRLAREAIHTFETQFITSKSVSTHQKRAVLLGQRSILRLLVKALEYAPAAETAAQVLYRIIVELAESPSDYASSHLESVSGQGMPNYLLFTLLRQLRPKCSPLASHLVLFLLHTAPDLIRPFFARVSVHMTEEGGSTAMGRVAASTARVATLNVMTRILQLPLPYHLAARQATLEPVATKVRTFYTMSPREVADEICPAWVAEYVHRLVNGSTNLLMLTFAMQLTQAALIRAQAVMRVVAEIQEVARRPRGDGAGRALGGRRRRHAGRRDRLGGLQRPRACAAGGGGAQTRGVLAPHDAAAAAAADPARGGGRRRRREGAGEDGLCVPPHAPPHGPVRQGARAAAAVAERGARIAPAVHAVAAADRAGAAGRQRRFPVLAGDLHLGPLRAAHR
>tr|A0A096XL47|A0A096XL47_9HYPO DNA-directed RNA polymerase (Fragment) OS=Thyronectria aquifolii OX=1491451 GN=RPB1 PE=4 SV=1
VKKILEIVCHNCSKVLADKSDPEFVAAINTRDPKLRFNRVWAVCKKKRRCENEDRSEKKEKEEEYAPGLKPFVVENHGGCGNVQPQVRQAALQLKAAFEVAQEDGPKKKESMPITPEMAHGILRRISEADLRNMGLNSDYARPEWMVITVLPVPPPPVRPSISMDGTGTGMRNEDDLTYKLGDIIRANGNVKQAIREGSPQHIARDFEELLQYHVAT
>tr|A0A1D5P1X9|A0A1D5P1X9_CHICK FHA domain-containing protein OS=Gallus gallus OX=9031 PE=4 SV=1
MSVTSWFLVSSTGIRHRLPREMIFVGRDDCELMLQSRSVDKQHAVINYDKEKDEHWVKDLGSLNGTFVNDVRIPDQKYITLKLNDVIRFGYDILPL
>tr|A0A2J8WE22|A0A2J8WE22_PONAB ARL8B isoform 4 OS=Pongo abelii OX=9601 GN=CR201_G0011344 PE=4 SV=1
MIRLASWVWLLPPAGVRPCRAGAPRSRWRVRAEARSCGSRRRRRSSVLLSVLAPGRHHAGAHLPPAGLVPFALLEGGDGADARGAAVLGQDHLRQCHRVRSIQ
>tr|A0A1V8U653|A0A1V8U653_9PEZI Uncharacterized protein OS=Rachicladosporium sp. CCFEE 5018 OX=1974281 GN=B0A51_10502 PE=3 SV=1
MGEASVVASQWRMVEVGRVVLFSNGPFAGRLAAIVEIIDHKRVLVEGPSESKDLLVPRHSSPLAALSLTRIVIEKLPRGAGSAALQKLWQAQEVEGTWNKSTYALNKAKTMRRRELNDFERFKAMRLKKQVRFQHRKSFAAAKASA
>tr|A0A7L3JVW9|A0A7L3JVW9_9PASS LTK kinase (Fragment) OS=Drymodes brunneopygia OX=626378 GN=Ltk PE=4 SV=1
WAGGGGGGGGATYIFRQKDGIFEPLLIAAGGGGKAYLKAQDNSLDDVPLEQFENSTAVPGVSGRTGAAGGGGGWQDESLLPQAGKSLLEGGEGGQACPQALAKLQWTTSGGFGGGGGACTSGGGGGGYRGKSAGA
>tr|A0A7J7IY04|A0A7J7IY04_BUGNE SLC39A1 OS=Bugula neritina OX=10212 GN=EB796_022902 PE=4 SV=1
MKAATNTENTRRKSMLDRCISFLSCFAAGVFLGTCLLDLYPEVQTKLYSAVTLYISKDSKFACYPFGEAVMVAGFFLVLIVEQMVLALKEMSVESSTPANQNSQPGSSSQSKRVTYDSINSTTNEYAEHERLLRSNSRDNTQSRSRLGSLSSIRSIESRNNVHSQSDDQHEHSMHHDPSSHSPIRSLIMLAALSLHSVFEGLAVGLQDTEEGVLSIFGALILHKCIIAFSIGLNLVQSKLAVKAIIVSNAVFCFASPLGIAIGILITDFNSDADSSLLVNGILQGLACGTFLYVTFFEVLPHEFNKPKDRLLKLLFVIVGFAFVNGVLFLEMFLSKEPGCD
>tr|A0A7I6S0I5|A0A7I6S0I5_9ENTR DUF446 domain-containing protein OS=Klebsiella sp. WP4-W18-ESBL-05 OX=2675713 GN=WP4W18E05_35930 PE=4 SV=1
MTRHDSLRDQLLLIETLLRQHQHWQDDAPHESAFASDQPFCMDTLEPLEWLQWVLIPRMHQLRDSGMPLPKDFAIAPYYEMALDAAHPLRAIILPPLEQLDAFFTSDPH
>tr|A0A2L2NMZ0|A0A2L2NMZ0_9NOSO Histidine kinase OS=Nostoc sp. 'Lobaria pulmonaria (5183) cyanobiont' OX=1618022 GN=NLP_1471 PE=4 SV=1
MEPRHIDTEVTRLEALRQYQILDTEPEEAYDNLAQLAAFICGTPISLVNFIDENRQWFKAKIGLDVSEMPRNVGLSYLCQEQRNVVVISDTLADEKLASNPVVTGYPYIRFYAGVALITPKGDMLGTLCAIDQVPRQLSQKQVEALVGLSRLVIAQLELRRHVIEVSKVTEKLVAHEQAACAQSEATKTRITNLLESITDGFFALDQKWQFTYINGQAEQLLQKTRNELLGKNIWEMFPEIIGTTFDCEYHRAILEQVSVEFEEFYLPQQQWLKVHAYPAKDGLSVYFQNVTERRKTAEALRESEERWQLALNGNNDGIWDWNLKTNEVFFSTRWKEMLGYKDHEVSNRWDEWTKRIHPDEQDWVLQAFQDHFATKTPFYVCEYRVQCQDGSYKWILDRGQALWDTLGDIVRMVGSYTDITDRKRADEELKRQNLRSQLFAEITLKIRESLQIDEILKTSVTEVQKLLQADRVLIFRLEIDGSGTVVQEAVLPGWPVILGENIFDSCFKEEYIERYRQGRVSVMEDIEAAHIQPCHRKFLQQFAVRANLVVPILVRDGIWGLLLAHQCAAPRQWNQFETDLLQQLANQIGIALSQAQLLEKETQQSQELTRSNAELEQFAYVASHDLQEPLRMVTSYLQLLERRYKNKLDANADQFITYAVNGASRMQTLINDLLNYSRVSTRGQPFVPVDCSAVLEQVLANLQLAIADSKAVVTHDTLPQIMADATQLTQVFQNLIANAIKFCQNQQPRIHIGVARGDTNINGESLNVIPSADEWLFWVRDNAIGLESQYAERIFIIFQRLHGRGKYPGTGIGLAICKKIIERHGGQIWVESKPGQGSTFYFTIPDRALKQSSTL
>tr|A0A4S4NBC8|A0A4S4NBC8_9RHOB Alpha/beta hydrolase OS=Aliishimia ponticola OX=2499833 GN=E4Z66_11820 PE=4 SV=1
MPNYFETAEGRRIAYHKTEGAGPTIVFLGGLKSDMEGTKAVHLEAWAKAQGRAFLRFDYSGHGESSGTFEEGCIGDWHQDTLAAIDNLTTGPVVPVGSSMGGWQSLLLARARPNRIAGLVTIAAAPDFTEDGYWAGFSEAQKALLDSQGYVELPSDYMEPYHVSKRMIEDGRTHLVLRTPLALPFPVRCLQGTADTAVSTETALRLLDHADCEDMRLTLVKDADHRFSDPRCLAMIEAAVSDVLGI
>tr|A0A6I4G232|A0A6I4G232_AGRVI Chemotaxis protein OS=Agrobacterium vitis OX=373 GN=GOZ89_08175 PE=4 SV=1
MTARRSLGARSGFSSFAFYGVLLTLAVGGPVACAGQAYAAGPNTPASNGPSTAPVAGTTGPAKSLPAGGDSDNLPPYLMLRSLQFVQDSVVRGDHSAADMQRFLLTRIDKRLRTAVSSDFEDPRNVDAALIYTMSGGNPATLDYLVARDVDGHFDNRVSDMLRKYLSGKGVLVASSLGEMVPLYQNGRVGPYIALVAGNVTLVKDPAAALKFFDIARLVAPGTIVEEAALRRSFQIAMDTGQNRRAMAYANRYARRFLYSPYASQFADLLVQLVVDHFSELDKNDILATLATMDPDRQREVYLRIARRATINGNQALASLASSQAQSLAGLPDKNDPQALLYGGAALISTTDVKNALSTISQLPKDQLSASDNALLEAARAVAQEIITLPTAPQSPSASPSTPPPSGDYTAPDAPANVSDQQDPGAPANAKANVVPDAGVGTAPVSPASADAKQKPDPEFQTFMSGGRSKLEEIDKMLKGEGVTK
>tr|A0A4Q3Y2I0|A0A4Q3Y2I0_9PROT ATP-binding protein OS=Alphaproteobacteria bacterium OX=1913988 GN=EON59_07995 PE=4 SV=1
MIVGLDEPAFREKLKALLTPAQPISKPEHLHGRDKKLMLIDRALNSPGKHIFIFGDRGVGKTSLARTAAAIHAADEEGFAFIACDQGTTFFDMVEDIYRQLHRLYSLGKFKMDGIELSVPFLKIKANEAFGLPALRTINDAIETLKTIAPKDGVTPVVVIDEFDQLRSDTEKKYIADLIKQLSDQRINLRLIICGIGSSLDELIGVHLSTDRYLATIPLEPLPHDARWQILRTASDALGVTLDRNSEVRIGQLSDGFPYYVHLMGEQIFWQVLDDPKPIKSVSMEHYATGIRASIEEAQTSLKQAYEIATQKHKNSEDYEQVLWAVADGGILKRQVSEIYEKSYLPIMDQFEGRNPLPKNLFYQRLNRLKKATHGSIVIGSSTGWYGFKENVVRGYVRLRAERAGVEIGVDHILG
>tr|A0A7C3NPT6|A0A7C3NPT6_9CHLR Dienelactone hydrolase family protein OS=Chloroflexi bacterium OX=2026724 GN=ENS08_10630 PE=4 SV=1
MYQTHMYEGMLAETITHHGYQAEVINAYFARPLGAGPFPGMVVIHHMPGWDEWYREVTRKFAHHGYAAISPNLYYRAGHGTPEDVAAKVRAAGGVADDQAVGDIGGALQYLLSLPYINGKVGVFGTCSGGRHAFLAACRLKGFAAAVDCWGGRVVMSKEELTPMQPVAPVDYTQDLSCPLLGLFGDEDRSPSPEQVNQLEAALQAHGKVYEFYRYPGAGHGFFYYDRPNYRQEQAVDGWKKIWTFLEKYLKV
>tr|A0A699THK2|A0A699THK2_TANCI Retrotransposon protein, putative, Ty3-gypsy subclass (Fragment) OS=Tanacetum cinerariifolium OX=118510 GN=Tci_880515 PE=4 SV=1
MRQRRWLELLKDYDTNIQYHLGKANVVADALSRKSGMIVGIKVEEEIIRDLERLDIELYVRGQHGYWASLRVEFRLDDDNVLWQNTRLVVPNDASLREAILTEAYSSLFSIHLGSTKMYHDLKLHFWWSGMKRDVATFVSRCLVCQLVKIEHQRASGLLQPLDIPVWKWDEISMDFVTG
>tr|A0A328S3F9|A0A328S3F9_9EURY GTP cyclohydrolase MptA OS=Methanosphaera sp. SHI1033 OX=1945632 GN=mptA PE=3 SV=1
MSVPEFPDTQDKQPSAPISLTRVGVTGVKKLLKIERSGNKRPIILLPTFDAFVDLPSTQKGVHMSRNPEAISEIVDEATNEPEIHIETICANLVKKLLEKHEYAVNAETEAKSEYIINKLSPVTKKKTQETTQIISRAVAHKNEDGTINVKKMIGAEVVGMTVCPCAQESVEKDSKEKLLEFLDEETTEKVLKTVTFASHNQRGIGTILLEVSENQEVNVDDLISIIQESMSSPVCEILKRPDENRIVTNAHQNPVFVEDCVRNMVIGLLNKYPNLPDNSMVTIRQVNQESIHQHNAFAEKVASFGELRQENIQE
>tr|A0A433MDU9|A0A433MDU9_9BURK Phosphoadenosine phosphosulfate reductase OS=Variovorax guangxiensis OX=1775474 GN=EJP67_02995 PE=4 SV=1
MSIDIERINAELGRNAQGLVDWALGLGQPAIVTTNFRPFEAVILHLVTQVKRDVPVVWMDNGYNTEATYRFADEVTKQLGLDLHIYLPRRSRAHREAVEGPTPALDDPRHAAFTEEVKLEPFARALRETAPKVWFTALRATDTAVRAQMDPVSINPDGLIKVAPLLHWSSKDLHEYCVKHGLPNNFDYVDPTKGEDNRECGLHLAH
>tr|A0A147H9Y5|A0A147H9Y5_9PSED Ribosomal RNA small subunit methyltransferase H OS=Pseudomonas psychrotolerans OX=237610 GN=rsmH PE=3 SV=1
MNPVFHHVSVLLDEAVQALEIQPAGRYLDGTFGRGGHSRAVLRLLGGEGRLLGFDKDPQAIAAGQALAAEDARFEIVQRSFAELGDELVSRGWSGQVDGVLLDLGVSSPQLDDPERGFSFMQDGPLDMRMDPSRGQSAAAWIATAAEADIAQVFKEFGEERFAKRMARAVVQRREVQPFERTADLAKVLTEANPAWEKGKHPATRAFQGLRIYINRELSDLEQGLQAAYEQLAVGGRLVVISFHSLEDRIVKQFMRRLAKGEADQLPRDLPIRATVFEPSLRLLGKPIYASEGELAANPRARSAVMRVAEKLK
>tr|A0A2F0BA01|A0A2F0BA01_ESCRO Ubiquilin-2 (Fragment) OS=Eschrichtius robustus OX=9764 GN=ESR_40773 PE=4 SV=1
MQQLIQRNPEISHLLNNPDIMRQTLEIARNPAMMQEMMRNQDLALSNLESIPGGYNALRRMYTDIQEPMLNAAQEQFGGNPFASVGSSSSSGEGTQPSRTENRDPLPNPWAPPPATQSSATTSTTTSSGSGSGTSSSSATGNTVAAANYVASIFSTPGMQSLLQQITENPQLIQNMLSAPYMRSMMQSLTQNPDLAAQMMLNSPVFTANPQLQEQMRPQLPAFLQQMQNPDTLSAMSNPRAMQALMQIQQGLQTLATEAPGLIPSFTPGVGVGVLGTAIGPVGPVTPIGPIGPIVPFTPIGPIGPIGPTGPAGPPGSTGSGAPPGPTVSSSAPSETTSPTSESGPNQQFIQQMVQALAGANPPQLPNPEVRFQQQLEQLNAMGFLNREANLQALIATGGDINAAIERLLGSQPS
>tr|A0A7U8PMI8|A0A7U8PMI8_BRUAO tRNA (guanine-N(7)-)-methyltransferase OS=Brucella abortus bv. 3 str. Tulya OX=520451 GN=trmB PE=3 SV=1
MIDENHPMRAAGNFFGRRHGKPLRPHQSNLFEDLLPRLKLDLATPAPQDLRSLFEAPVEAVRMEIGFGGGEHLHHESGRYPQSGFIGVEPFINGMAKMLAALDQAPRPNLRLYDEDATAVLDWLPDASLAGIDLFYPDPWHKRRHWKRRFVSDANLDRFARVLKPGAKFRFASDIEHYVNWTLQHCRRHAAFDWQAESPADWNDAYEGWPGTRYEAKAFHEGRRAAYLTFIRR
>tr|A0A2S5CXJ6|A0A2S5CXJ6_LYSSH Single-stranded-DNA-specific exonuclease RecJ OS=Lysinibacillus sphaericus OX=1421 GN=recJ PE=3 SV=1
MILSKKRWQVKRPDAQLVQTLQNDLQLSAIAAKILAARGCTTSADAESLLNMTEANIHDPFLMHGMAEAVARIQQALENNEKILVYGDYDADGVTSTTVMLHVLLDLGADVSFKIPNRFLHGYGPSEALFREAHEEGIQLIITVDNGISGIEPIRVAKELGLDVIVTDHHEPGEELPQADIILHPRVPEGHYPFGELAGVGVAFKLAHALYGELPTHLFEFVAIGTVADLVPLVDENRYLVKRGMEEMRRSLSPWIQAMCEVASAEQATINEETIGFYFGPRLNAVGRLGEASPAVELLMAEDTAKATALAKQLNGCNAERKDIVKSITDEAIAFIEADKKIGDSLVLVVAGEGWNAGVVGIVASRLVELYYRPTIVLSLDFEKGTAKGSARSIEGFHLYNELAKNRDILPHFGGHPMAAGMTLPLEHVDELRTRLDAQARACLTEEQLTPVLAIDIPLKIDEISADAIEEIATLGPFGTDFPKPVYVLEDVEIATMRKIGAAENHIKMELTDGLEKLDSVGFNKGHLYHELTYGIKVSFTGDLQINEWQGRKKPQFMIEDVQTTEWQLFDIRGIRQTSRWLHTVPKEEAVFFAFRLETISYYQSLLGVPIELVDVELSNVEQTDYIVLLDLPHNVQLLENVLSKTAPTRIYAHFYMPDSQYFNGIPTREQFAWYYKFLKQRPAFPLDMHLPDLAKHTGWPLEALKFMTQVFFELNFVKMESGLTTVNMNAPKTALTEAPSYKQRSEQIEIEQKLVYAPYIELKQWFDERLNLYANTVS
>tr|A0A0C2NMI1|A0A0C2NMI1_9VIBR Serine--tRNA ligase OS=Vibrio renipiscarius OX=1461322 GN=serS PE=3 SV=1
MLDSKLLRTELDDTAAKLARRGFKLDVETIRTLEEQRKSIQVEVENLQSTRNSISKQIGQKMAAGDKEGAEEIKKQIGTLGSDLEAKKAELDALMAQLDDITLSLPNIPSDEVPDGKDENDNVEISRWGEPKAYDFELKDHVDLGEMADGLDFASAVKITGARFIVMKGQFARLHRAIAQFMLDLHTEEHGYTEMYVPYLVNSESLFGTGQLPKFGKDLFHTEPLAEKVNDEEPRKLSLIPTAEVPVTNLMRDTISDEADLPLKMTAHTPCFRSEAGSYGRDTRGLIRMHQFDKVELVQITKPEDSMAALEELTGHAEKVLQLLELPYRKVVLCTGDMGFGSHKTYDLEVWVPAQETYREISSCSNMWDFQARRMQARFRRKGEKKPELVHTLNGSGLAVGRTMVAILENNQEADGRIRVPAVLQKYMNGAEYIG
>tr|A0A0B4FII0|A0A0B4FII0_METAF Src-like protein (Fragment) OS=Metarhizium anisopliae (strain ARSEF 549) OX=1276135 GN=MAN_04425 PE=4 SV=1
MPAPTVEAPAVALSFANNFWGKEDAGVGPLLERMQSAKTTSDELKSFYSARASIEDEYARKLLHLSRKSLGSHEMGSLKTSLDTVRVEVESMAKQHQSIAAQMKSELEEPLAAFAGGMKERRKIVQSTVEKLLKTKIQQTQQVNKTRDKYEQECLKIKGYLAQGHMVMGQEERRNKAKLEKTQISLATANTEYESAVKILEETTTRWNREWKAAADKFQDLEEERLDFTKSSLWTFANVSSTVCVSDDASCEKIRLSLENMEVEKDIIHFITERGTGQEIPDPPKYINFCRGDVNDGQSEVSEDDNYSVAQFPRSINPAFRSSSPQPSTFESHHDPNSMLANNLAHREPREPPQPTSREAIVTPQKAPPPMRNSVDEQRRGQGQQKPPQYDVNQHGPLAAVPHDPYPMDGMTMLCRTGPPGPQSDRSSQPHSARPSSRESHSDYSIPTSLSSVEPPSGQASPVKQEPVETRSPEKRVLKKKSGFFQNHSPFRRKSTKEVQAPSQNRSTWHVAPGRAELERTASPEPIDANASLALGVGQNVLPVTTPDTRRRPGQGREQDVDQSDPIAMALAELKDVNLGKQSSLRMSADHYHGIATPGPGADPRSGRSSGREAPPSYNTQASVSRLGVPPPAVTSRAMKEATKKATDQSRAVFGNAGNRGASPASRPATRGSDMPRAASPAPTRSASPQPRMSGDSRYRSASPNPYSGHHRNASQASVSQQRGSGQGYYGSGSPHGSTRGSVRGASPASFRGDYDRPRSSYGGGSDMAVQLAPAGDDRYGSQRGRGAVDLYDGGSRPRSKSVADPSRQYTRDGRPILHFARALYMYQAAIPEELGFAKGDYLAVLRHQDDGWWEAEVHGGNGRVGLVPSNYLQPC
>tr|A0A1H6SIL1|A0A1H6SIL1_9SPHN Uncharacterized protein OS=Sphingobium sp. AP50 OX=1884369 GN=SAMN05518849_101367 PE=4 SV=1
MLRRRAQGWCPDTQRAFIDALSRCGVVAQAARSVGRSPRSAYHLRRRAGADSFAAAWDWALDMGLDESRARAIALIRGKRVRPIVRRGEVVGQRTDNDPRLMFAALNALGADQDGRRAAMPHRQRMALRHVITTLIDNGPFSPEEWARLVPALAAVAGASPRPDALS
>tr|M6A221|M6A221_9LEPT ATP-sulfurylase small subunit OS=Leptospira sp. P2653 OX=1218600 GN=cysD PE=3 SV=1
MNRSRLTHLEQLEAESIYILRETASQFERPALLFSGGKDSITLVHLALKAFRPGKFPFPLVHIDTGHNFQEALDFRDELASKIGEKLIVRYVQDSIDQGKAVEEKGKFPSRNGIQTVTLLDTIAEFKFDACIGGARRDEEKARAKERVFSVRDEFGQWDPKLQRPELWNIYNGKIGPGENVRVFPISNWTELDVWEYIRKENIALPSLYFSHKRQVIYRENLLFPVSKFITIDSNDRVEDKVVRFRTVGDMTCTAAVDSQADNIDDIILEIQTTRTTERGSRLDDKRSEAAMEDRKRGGYF
>tr|A0A438U9M4|A0A438U9M4_HELPX 2-amino-4-hydroxy-6-hydroxymethyldihydropteridine pyrophosphokinase OS=Helicobacter pylori OX=210 GN=folK PE=3 SV=1
MMREILISRFFPSLFKKRLDFSNRVVLGLGSNLKNPLKILKNCFLYFKNHSKIGKIFSSPIYINPPFGYTNQPNFYNATIILKTSLSLRHFFALVFYIERRFGRARKRDFKDAPRTLDIDIIAFNQVILRQNDLTLPHPKWNERDSVLVPLALQQILFKKGEW
>tr|A0A4Y7J8A4|A0A4Y7J8A4_PAPSO Uncharacterized protein OS=Papaver somniferum OX=3469 GN=C5167_014818 PE=4 SV=1
MSRGILVWFISSNLRFLDLDGGDCDNQLGAVEYVEEYFISSSKSQSLVRDYLGIHSLKSMRSGSLKLLGMSSMPIASEYEEIWAPEVEYLGIHSLRSMRSGAVALREVRLEKNSLFWKKCSSLTTLTKQATTQFRELRGAPPGSVNWEMQRQATARFCELSGGQMQLHTGLAFVFLLQIQLAELLKWNAGASWRCPAFGQRA
>tr|A0A2T0RHF1|A0A2T0RHF1_9ACTN Transcriptional regulator OS=Pseudosporangium ferrugineum OX=439699 GN=CLV70_12320 PE=3 SV=1
MRVRLLGTVDVHAGDEFRQVPGLRRKAILSVLALNAGRTVSAGRLLELVWGDRAPATGLNTVQSHVSYLRRILGARSAIVSRSPGFLLDLPGDATDAATAERLIHAGLRAADPARAAEHLRAALGLWRGSPLQGVTELPWLAEQARRLSKLELEARRALAEARLALGEHAELVPELQALAAQHPFDEQIQAQLVLALYRTGRQSDALAVVREVRRLLATELGIDVGSALSELETAVLQHDVAPARERIEPAPVPPAGPELVGRGRELGALLRHLDHRRPSGAVVPVVSGDPGMGKTRLLTELAVRAGQSGRTVLWGRAAEFEQQVPFALVMDALADHLAGTDPRRLDAVAGTDRALLREILPMLPAPENRTAARQAVEAERYLLYRAFRCLLEALAAPPGLLLVLEDLHWADQGSAELLAYLLRHPPRGPVVVAVSYRPRQMRGPLRQALGRAIQDGSADLVDLDPLSPAEADTLLPAELAADRRQHLYALSGGNPLYLLALAREGAAGPGEDDRSLGEQDPVPAAVREALRGELDALSAAETVVARAAAVVGNLAEVPLIAATAGLPEAEVSRALDALVGHDLLRPVPRTGRFQFRHPLIRRIAYDMAGPGWRVAAHGRAAAALARQGASAPEQAHHIESSARRGDPAAIDILRRAAAEVLHSSPGTAAHWLGAALRLVTDDHPPEVAQQLLGLRAQSLATSGQLAESREVLHRLRQAIPAEVTPERARLASWCAGVERMLGRHREANALLRAELARVADADGPVAATLLLALGARYIQPVPPGEPDWPRRALAAARRAGTPWMVAEALLQCVYADQAAGTWDASTRERLDEAAALVDARPDGELLELLHMVVWLATAETVYERLDDATRHVDRALGLARAAGQMYVVPGIHLLFVGLHMARGDLPAASRSLDEAREAVALAGTDTMMSMVLSRECTLAALTGDGKLAHRAGTEAVALAGRRGDYAAGVAVQALATAHLQAGEPAMCSSLLDGTEELPSTPTTRGTLYETLALAWSAQDRPEVAATWADRAEREVAVCPTPRRAGLAELARAHALRPVSASASAARAAAAARLFAGVDDRLLGGQAHLHTATALAADGQPGRARRELDRARTLFLSCGATALVDRTDQEERRIRR
>tr|A0A4R4X727|A0A4R4X727_9ACTN Cupin domain-containing protein OS=Nonomuraea diastatica OX=1848329 GN=E1294_00855 PE=4 SV=1
MRRLAAISGATAGSTRLWMGQTHVAPATRSSDHHHGASETAIYVVSGTPAFVFLEDAEEVRIEAGPGDYIYVPPYVPHREENPDPSQEAVVVIARNTQEAIVVNLPGLAG
>tr|A0A7W1Q9P6|A0A7W1Q9P6_9ACTN Response regulator transcription factor OS=Actinobacteria bacterium OX=1883427 GN=H0W90_11130 PE=4 SV=1
MRVLIVEDELKMASLLRRGLVEEGHAADVAPTGEDAVWMAQSHPYEAIVLDVMLPGLSGFETCRQLRNVGVWSPVLMLTARDGVDDRVAGLDAGADDYLSKPFSFAELLARLRALVRRGGGERPTELQVGSLRLDPASRRAWRGQVEISLSPKEFALLEAFMRRPGQVLSRLQLLEHAWDFAYENRSNVIDVYVRYLREKVDRPFDTDSIETVRGVGYRLSEDSDA
>tr|G3MBJ6|G3MBJ6_9CAUD Gp134 OS=Bacillus virus G OX=1084719 GN=134 PE=4 SV=1
MKSSKRVDERIVKDYRIIDSAWDEFSDYVGEHNIGTPLTVKQFEEIFSKLNRNNKFSPMKDYILESFRNDCYAWPFVEKNQ
>tr|A0A5B1MAL1|A0A5B1MAL1_9MYCO SDR family oxidoreductase OS=Mycolicibacter arupensis OX=342002 GN=E6Q54_00665 PE=4 SV=1
MSVLDKFRMDGRVVVVTGASSGLGVYFAKAFAEAGADVVLAARRVEKLAQAADLVAAAGRVGLPVATDIADPDAATAMVEAAMERFGRVDVLINNAGIGTAHPATRETPEQFREVIDVNLNGAYWAAQACGRVMQAGSSIVNISSILGLTTAGLPQAAYAASKAGLIGLTRDLAQQWGGRKGIRVNAIAPGFFASEMTEQYRPGYLESVSGRIVLGKMGDPEDLAASVLWLASDAGGYVTGQTIAVDGGFTIN
>tr|U4PPA8|U4PPA8_9HYPH Putative pyruvate, phosphate dikinase regulatory protein OS=Rhizobium pusense OX=648995 GN=BN877_I0001 PE=3 SV=1
MENKKSFFHLHLISDSTGETLMSAGRAVSAQFHASMPVEHVYPMIRNQKQLAQVIDLIDKEPGIVLYTIVDQQLAEFLDLRCHAIGVPCVNVLEPIIGIFQTYLGAPSRRRVGAQHALNADYFARIEALNFAMDHDDGQMPETYDEADVVIIGISRTSKTPTSIYLANRGIKTANIPVVPNVPLPESLYAATRPLIVGLVATSDRISQVRENRELGATGGFDSRRYTDRATIMEELKYARALCARNNWPLIDVTRRSIEETAAAILALRPRTR
>tr|A0A1G9FD20|A0A1G9FD20_9SPHI Peroxiredoxin (Alkyl hydroperoxide reductase subunit C) OS=Pedobacter sp. ok626 OX=1761882 GN=SAMN04487898_112159 PE=3 SV=1
MAIVGKKFPSVSIDAMSEMGDDLKINIFEEAVSKEKKVILFWYPKDFTFVCPTELHAFQAALPDFEKRNTIVIGASCDTNEVHFAWLNTAKENGGIEGVTYPILADTHRHLANILGILDQDVEYDEEGNESFSGSNVTYRATYLIDETGKVFHESVNDMPVGRNVKEYLRLIDAYAHVQKHGEVCPANWEEGKEAMNANRTGVAEYLSAN
>tr|A0A2T6ZBV9|A0A2T6ZBV9_TUBBO Interferon-related developmental regulator-domain-containing protein OS=Tuber borchii OX=42251 GN=B9Z19DRAFT_1104137 PE=3 SV=1
MSELRRKALGSGKTVSRKAASRQSSAASSRANSRNTSRAGSRAASRANTDDEGSLSDETTFSLGSVDELATIDAELDETTTLWQEELGDRVNQIIERKKSSSAGREESLTAYIRILCAKYAKDEILPKKSELLDAFVRSFKQGKTEKEALLAAKALAITIVTDPEDTLFDKLAPDFKRTITDHASLPLKNALIHALGAVTFYGGASAAETELIMDFLKDIVESDGHDIGAGDDAGVVAAALEEWGNLATQLDDAEEITRRSMSFLVDQLDSSEVLVQVAAGENIALLYEKSYTEAEEDEVVEDHSESGLGKNFIQKYKPYPRHDVLIHTLRGLSSGSKKYLSKRNKKTQHSAFVDILHSVENPMKGPRYSEALDKDNRVRGSRMTVRIHKKGLLRVERWWKLHRLQHLRRILAGGFLNHWIENPVIFESLSLFVEEI
>tr|A0A811ATS3|A0A811ATS3_9GAMM Alpha/beta hydrolase OS=Acinetobacter variabilis OX=70346 GN=RYU24_01130 PE=4 SV=1
MSHPLSSLEYQPDILGEGYEQATLEFPPDTEGTVVATLIRKKTDQPTSKAVLYIHGFIDYFFQTEMAERFNQQGFDFYALDLRKYGRSYMSHQKLYNVYHLSEYDAEISQALEIIGQEGHDTVLLSGHSTGGLITTLYAAHHPDRPLIKGLWLNSPFYDFNMTPFEKKFLVPKLSRLGKRFPEMLFPSRLNRHYVPSLHISYQGEWHFDLEWKKPSYHWVRLSFVHAIHEAQKEIHQGVRLNIPTLLMHAHKTTYPLRFNRNAQTSDVILQVHDMIEHAQKIQGDVQLCSIQNGVHDLVLSEKPVREQVYQQLFQWLENKAL
>tr|A0A3N5TH00|A0A3N5TH00_9DELT TPM_phosphatase domain-containing protein (Fragment) OS=Desulfobacteraceae bacterium OX=2049433 GN=EHM30_15800 PE=4 SV=1
SINKAESETSGEIAIMVLDSSDSYSEAETFGAFVLSGLFSLMLELIISYLIGSEPGWGHGGSGFPYGFLADAAKSASIWTYIPMVFVFYFAFKFLLSKAPEIKILFMSGRRIEETVRERAVMAFYEKGLYKTRDETGILIFISLLEHKVWILGDRGINAKIAPDFWEKIAAELSAGIGKKEYGKAACQAITKCGEELSRYFPIKKDDTNELTNEVIL
>tr|A0A6H3NV40|A0A6H3NV40_9LEPT ParA family protein OS=Leptospira bandrabouensis OX=2484903 GN=EHR08_11550 PE=4 SV=1
MKIITVASLKGGIGKTTTALYLSQALRSLGKKILLIDLDQNNNLSNFMIKQFPKGNDLDEKNILNMLKGYAEISEFIWESSDGIDLIPAKKDIKNIDIEFATDPILGLRFRNDLKSLNYDFILIDAHPATNTGLRCAILASDEIICPVEPSVWSSQGIDDIEIERQNASKAMKNEIKLRALISKCTLKKAEELKPILKKKGYQVFQTAIVNSEAIKVSNDISEFLNEKTGKAFPMFLSLAKEILK
>tr|A0A2T6K4E5|A0A2T6K4E5_9RHOB NADPH:quinone reductase-like Zn-dependent oxidoreductase OS=Yoonia sediminilitoris OX=1286148 GN=C8N45_1303 PE=4 SV=1
MKALVYQKFGPPENLVISDLARPEACSHEVLVRVAYAGVNSVDWKIGAGRIDHYRNAPFPLVTGRDFSGTVVEVGSHVRNFSVGDAVIGCLPGPGGSFAEYVATDALSLARAPSNLTLAEAASIPLVGLTCWQALVGSAKLSKGEVLYVLSGAGGTGSIAVQLGAALGAKVITTCSERNRDYVTGLGANYIFDYSKPNFTDDLIAEFPQGVDVVFSNVLGPLHRDAYRTLRPGGILVTIGESPLPAVAEKHGVDEIDLIVQPNGKQLTEIVTYLENGTIKPPSVSIHALVHGAHAMQNISEGHVRGKIVLQVS
>tr|A0A6G0Z856|A0A6G0Z856_APHCR Dopamine beta-hydroxylase (Fragment) OS=Aphis craccivora OX=307492 GN=FWK35_00015581 PE=3 SV=1
MKKRSASQRSFGHRWTTVVAAVVVFLSATCLVGHAGAEGRRVYTAPLDDTGRTAVYWTVDYGSRTVKFEAHFSGSGSPFDWFAVGFSDRGNHSGADFCVMWVDWKGVTGMLDTWTNDAGRISVDERQDCEEFNVARFHGGGTALTFTRKFDTCDDERDYLIQDGTTHIVWMVGGGPLFAVEGLLVSQARAKGMQRVQLLKPETPQVKLPNKVSKIDVLASKVNIPAEETTYWCHVMKIPLDLSFKHQIVRFESVIEESSRGVVHHMEVFHCEANANSRIPLYSGPCFSEKRPYKTQVCKKVMAAWAMGAAPFVYPEEAGLPIGGPDFNNYIMLEVHYNNPGLRKGMVDSSGIRLYVTPNVRKYDAGVIELGLEYTDKMAIPPKLEDFTLSGYCIAECTAV
>tr|A0A7R9IK79|A0A7R9IK79_9NEOP Hypothetical protein OS=Timema tahoe OX=61484 GN=TTEB3V08_LOCUS7834 PE=4 SV=1
MCQGLYRLLYVSWEGVTPRSRRTTRVTESLRVTEVSRRMEEPDSYYTSNYHLLEAGRILQPEGDDYKLVFISSDSSSKEEEGSYSDDADSSSTTSSVTGVPGFTLDDCDWDYFESSSMVRPVLKDWSWSNNKVSPLGADASVDQQQHSFGFDSPQLSSRRLIYSRPSRGDVDPMLETEEKKTPPARGVRSELSSSPLFLDSPLSSETGSSFLHRRRSPMNMSGGSYIEAPVSPSRYRRPLFQLSRGDSARSSGERSVEEITSSDHYYYGCPPPQQWKVRVGGEMEGKVEKCPPGGIVTEQRTSHSATTAERVRSPSCETCGGPSALFPPGVYGVPVPVPIPVPVPIPVLIPASLWSVGGQHATTTGDTVSVADIVYVGSSGAGDEPTNAGSVRIRIHSFQRPSHGLAGPWCAWPVDNSGVLISPMITDNSAALRGEAEKVPVGRVPDSDRELSDGVHSRGPQSEHLAGDGVHVHTLKTTSSNSHEGETITNSVNFDIMINSPFVELKESEVSCKVLLSVDKDRSDDSATAHECDKDVGDNKIKTNSSVLEQTEPEIEEMSAGKTLPTEPELNTSQSEICASYLTKVTYCEDILDSNMKTEPSDAVSEKSDDEHNSGIVLVNFKPIPSESYSDSLTERHRFIITPEPMSTSATGSDTDNDHPNRRKGYTADKNLLKTKKRRLRKCLHSNDDSKFLPRERMSSNCSSDSGSSADETCVKTPVKRKYYLAGGDMSESGDDAASDVSSDDSTAGHTTDNEEGHFSRVFVINSTQSTSEEENDDSDTGENKTIEECTVLMSESVDRSCDESNEVGVVVQLKHIMALSDEEDMSSHHSEVPKAISTSDTGIVVLKHVRDIPEEHSFASQVPWRSDETVQVLKTNNGVSRSEGKEETPERSTNCLNNICLPTAAGELNNSVNIDGEPEDKCFVHHNEVISKLVSDLKNEVDKMKCEFVARASSVSTGPDKRSITPEESGMVARLQEHLSSEHAGARLVLPPSGNSENLTPPPVDGWPSPPPDTATSLGEVESNQDPSSNVTERETSGIAASASEVDNILARSAVVINTSIKSDLSTFHEGSGDREVIKSEIGENCLSLQDICGGPCSRTNPNSSRDSGDSSPTSPAPTDNTDQTKSPVLHLENTPVENEEVTSETPGALVELYLIDEESPIAITKDTLGDQSAAITSGSSPADLIDEESPVAITKDTSGDQSAVITSESSPADVDTPNISVNTDDLNIPQIEKNIFSDITPVSQKSKEHNLEISSDQTVETLSNSSIRYICKESETGKSSKTIQNELPGSDHAAPSIELVGSESKSGPTDCETSITCDELSGTESFNDYKLKGSFKESSDIEDDRDIEHNLTTEEISCPQVVDSEETGVKFEGNISCNNDDVALDCSSVYSKSGSRDHSQSLEEVQTNTLEDKKGPSPVESFRSGGDTVTAAAESASVGRETTGEREVGCQGVLSVASEPLTVKQRRGDVCPEAGAAAVGSHLSRYTSLVMITQDNNSFLKSQETSPSVVSVVTSETTTVVPEERNGDIIVSHTNWEEDDDAIHEKVSGLAGYFTLTLETAGSTPSMKRPLVTKNKHFMNEYSPPLPAQESGEGESEDLVKVVTGGDTLSAVVCLEEGLADDDSWVEEMDDRNHEDEDFATTTPTEDSSSGDEACSSASYGDREAELRGYHRAALDFTLHTIVEESCEESDDGPAKRKKPRPTSASELEKYFFYELGGGSSGSPGSRNLNSFSDSCSSIYSESLESLRGDDVTGNGEDKRDPAEMASSRLEKYFLKEFMGFAGDNYRDSDGSGSVGSDSEGRPSPEQRRKRLVRARGTGRQHSSSLDNLVASEHSGSEQQTTDTLVESEGSSTETDTHDELGGSMTFEKPDGQFDTVKRKKKKRSVAGSSSPAISDLERRPTPTEFLEKTLTSSNVEDVPQAGGEEDMSSDEDGSKTPQPEFLLPADLSATRNKQQSRDSGFIGSCDDLLREQRSQSDSSSCSNSAEVAQKTKTGSDGSGSGSDHDPPSGERPVTDHAKSESKATQSNKNNRKPSISDDDKSQSCTLSMTSTSVPPTTALTRKDSFNNWSSDEETNLMMSKMRAFFKTMVIAANNTNGPQKTPQTSPSLRPRGMKPPQLVYFENELTRLMKTVPGIRDDQVKEIVEYLSSEDTWSDSYDSSDYTSSDLEGAAAYYQHAMNRSELQEEISASCQQIINKFDTSVEEDNEEDKNGKVSDKSVDNEPSGIRRDTAFVYQKLVASFNKMGSGEQSASSDTNSSPHSSPPLIDKVMHHIGSRLVALMHEVSGGEGAGEMTTSSPKVRYHHHRRLQHKMSVTSTTTEEEDDSHTDTESDSNARSGNELGHDLVGSSTYNPLLARSKSHDLLLEKESRNYSHYHPQHKESSSSGVSDIAEEREASDYERFSWRGSFESALMTSDSRTKLSLLSCGDGSTSSSALALAAKRRSAGDLLFASSSKSSSREQLDRVRSCGSIGGNNAGSVEDKIWGTCNRRNSIPDASAGSGASADGDDDDDDDDDDDDHDDDLRSGRSTTLPRSLQTSCSAGTNSLPRLPTTGPMSSSVPNTPNIHKAHSMHLFLQSQANVKSARYRPPGFNRPAAPKRAVSAPGMQPPHPRRDAARRRPQATSQVLETVKFYSSSKWLPIHDCEALLVYSLGYIPLSTDT
>tr|A0A6J2QCM0|A0A6J2QCM0_COTGO AP2-associated protein kinase 1 isoform X2 OS=Cottoperca gobio OX=56716 GN=aak1 PE=4 SV=1
MKKFFDSRRELVSSGPGSGVGGGGAGSGGGGTFIGRVFTIGRYQVTVEEIVAEGGFAIVFLVRTHQAVRCALKRMYVNNEHDLQVCQLEIQIMRDLVGNKNIVGFLDSSITAVGAGDVWEVLILMDFCRGGQVVNLMNQRLQTGFTEAEVLQIFCDTCEAVARLHQCNTPIVHRDLKVENILLHDRGHYVLCDFGSATNRFQNPQTEGVPVVDEEIKKYTTLSYRAPEMVNLYGGMIITTKADIWAMGCLLYKLCYFTLPFGESQVAICDGNFTIPDNSRYSQDMHCLIRYMLEPDPDTRPDVYQISYIAFKLARRECPVPNVHNSPIPAKLPEPVRASDAVAKKSQSKARLTDPTPTMETSIAPRQRPKAGQAQPQPISGILPIQPALTPRKRPNVAAGGPQAIGVGINVPTPAAAAVQAAAPQPAQTANMLSQPTPQHQQLLMKQQQATPFLSPQSNQQRQLIQTLQQQQQTSSQAFTLLQSKDKPVPPVIALQLHHRQHLAPVHETAASHLTPIPESAVAGPAADPEMAGRVIHKVGSLTPPSSPKMAPKSGHRRILSDVTHSAVFGVPVSKSTLLLQAAAAEASLNKSKSASTTPSGSPCSSQQSVYHPGDGDAQLALTAPNIQPSWNPFGDDNFSKLTAEELLNKDFAKLAETAAPGEKVTGSSENLIPGINAFPEKLIEGLKSPETSLLLPDLLTLVNPFNSSAENSANVKSEVCVDSLIPGLEAPQAQRHSGQPELNPASMPDSLTGEDSLLGCDLLSLTSPHGNQSGSALPSSSSCSSAPPGCGSGSCLEELPPGQTASDSAFLMSCGEKGNGDEFDPIPVLISKNSNQDVQGESNGYSVLDEGRETELQEGDSQANESCVHSSDEEDDDDDDYEEEEEEEAHKEEQQDEGAIESHAAAHDCSGSRPLLLDSEDEEEPGPQLALHSSPHSSTVPTQPSTTFHQPTPSTFAQNHSQHVHEPAQGADAAAADVFLKAPFPIVQEESADVFANAPFPRAHTAAPQPFDVFSQAPFGKRKEATVAHPSYAVTPDQGVLGQVVQQPFRPQALAKYSRHFEGPVPQQPVAAHRVVSNVSRQAAVASVPVGPLHLWTSEVSAVDPFVSAPFHLKATQEKP
>tr|N2A2M6|N2A2M6_9LACO ATP-binding cassette, subfamily B, bacterial OS=Lactobacillus sp. ASF360 OX=97137 GN=C821_00970 PE=4 SV=1
MDIFKKLGWFFKEEKKRYIIGVLFLALTSLANLVPPRVLGLMADELDKGHITWGQYGALILAIVAAAIVLYVLRYFWRKQIWGGAAELERKMRTRLFNHFMIMDKTFYQRHRTGDLMAHATNDVTAIQNVAGDGVLTLVDSLIMGLSTMIAMIVFVDFRLTIVALLPLPFLAWGAWKLGDHLHVAFDKSQAAFSRLNNKTQESVSGIKVLKTFGQGKEDTAAFEKMVDETIKINKHVFVWDSLFDPLGTLIIGLTYAITIIYGGFLVKQNILSVGQLVSFIAYIGNMVWPMFAIGYLFNILERGSASYDRVEKLLNEKSLITDENADETLTAKDIEGDLDYNIKSFAYPDEKDISVLKNIDFTLKPGQTLGLVGRVGSGKTTIIQLLLREFDNYEGKITLNGHDIREIPLNVLLRQISYVPQNNYLFSTSIQNNISFSQIDADNNQVVEAAKKSDLHNDVLQMPCAYQTLVGENGISLSGGQKQRMSIARALLKHSQILILDDALSAVDAKTENEILKSLKKERKGKTTLIATHRLTAVKNADLILVLKNGRIIERGSHDDLLQENGWYADMWRRQELEEKVGDENE
>tr|A0A1J5KGW7|A0A1J5KGW7_9PROT Peptidase_M14 domain-containing protein OS=Bacteriovorax sp. MedPE-SWde OX=1860085 GN=BM556_01360 PE=4 SV=1
MNLLKNEFEFIEELVKRSPDIVDHEVLDSVKFKNKSYDIHSFSIGPKDPEVPVLALFGGVHGLEQIGSHVVIAYLNYVIERLHWDKNFAALFEKVRLVSIPIVNPVGFKNFRRSNGNGVDLMRNSPISSKEKVFPILGGQLISSKIPWYRGDTNQMEKESQLMCDFVKDNVINSKNAISIDFHSGFGFKDRLWYPYACSKKKFDGIDNLKRIESLLDRTLPHHIYKVEPQSDHYTTHGDLWDYLYFHKKEHHPTMNYLPLTLEMGSWIWLKKNPLQLFSKLGLFNPIKDHRFNRAMRRHFLMIDFFLKAAANPDEWTA
>tr|A0A6H1WSD3|A0A6H1WSD3_9BACT Ribonuclease 3 OS=Thermosulfurimonas marina OX=2047767 GN=rnc PE=3 SV=1
MKELYPRLPELERRLGVRFRDPGLLVQALIHRSYAAEKKLPPGADNERLEFLGDAVLSAVITHLLFERFPEASEGELSRMRAWLVREERLARIAERLGLFEFVLVSRGEARSGGPKKASILAGALEAVIGAIYLDGGYGKVFECLRRLFARLLPQARRGMEADYRSRLQELTQALFRETPTYEVVSEKGPSHAPIFEVEVRVGERVLGRGKGRSKKEAAQEAARKALDILEKEK
>tr|A0A371WXQ8|A0A371WXQ8_9HYPH Transposase (Fragment) OS=Fulvimarina endophytica OX=2293836 GN=DYI37_19485 PE=4 SV=1
MARGDLTDEEWAVIGELLPSERGRKSRPAYDNRRFLNGMLFVLRAGCPWRDMDERYEKWNSVYVRFRRWAEQGVWDALLETLVETGLTDDWQ
>tr|A0A7X8YS75|A0A7X8YS75_9BACT Uncharacterized protein OS=Acidobacteria bacterium OX=1978231 GN=GXY47_00410 PE=4 SV=1
MARTMILLALIAAFCTTAAANTDATCDRACLEQWVDRYLAAMRDRDTSPEMFAPGLKFTEDGVRLPFGNEGLWHSMSGVGKYRFYVPDVEAQQVAFLGTVREKAPRSREESLSALALRLKIRNDRITEIEQIVIRPDSVNSSAGDFPPTGPAVEAMGAPHPVFAESIPEAERMSRKDLIETANHYFTGLENNDGKGYYPFTDDCVRFENGVDVLLNTNKETGEQTRTTCKQQFEEGVKGIVTRIRDRRFVAVDREKGIVFSFAFFDHDFIHWTWQLAELFKIENGQIRRIEAIFHRAPYGMNSGWSSFEKGISNEIQAP
>tr|A0A1L3I1X5|A0A1L3I1X5_9RHOB Glutathione hydrolase proenzyme OS=Phaeobacter porticola OX=1844006 GN=ggt PE=3 SV=1
MKHLFWAGILLAATPAWAQEAADAVAPEGAAETADAGFAAISEEVAAAIEAKEEGTPVEADNWMVAAANPHAVSAGAEVLRAGGTAADAMVAVQTVLGLVEPQSSGLGGGAFLVWYDAATGEVTTLDGRETAPLAATPTLFQDDSGEPLKFYDAVVGGRSIGTPGTPALLEAAHRRWGRAAWPGLFTAAIDLAEDGFAVSPRLAGLIEKDADRLSRWSDTADYFLPGGTPLAVGSTLKNPAYADTLRRLAAEGARGFYSGPVAEAITSAVRGAEGNPGVLSAMDLALYQVKERPAVCVAYRAFEACGMGPPSSGALTVGQILGMLGNYDLAELGADNPDAWRLIGDASRLAFADRGRYMADSDFVPMPTQGLVAQDYLATRATLLSGDDALPAVNAGAPEFDHALLLADDESIELPSTSHISVVDQYGNVLSMTTTIENGFGSRLMAAGFLLNNELTDFSFRSHREGVPIANRLEPGKRPRSSMAPTIVLKDGEPVLAVGSPGGSRIIGYVAKTIIAWADWGMDVQQAVALPHAVNRFGTYDVEAGTSAEDMTQPLTDMGFEVNARDLTSGLHLIEIGDGLKGGADPRREGIALGE
>tr|A0A5B7FTI9|A0A5B7FTI9_PORTR Uncharacterized protein OS=Portunus trituberculatus OX=210409 GN=E2C01_042056 PE=4 SV=1
MGWYEARSVGSLQELGMGMRMENFQQVAADIAELEEGGLERGWEVGEELVWDMVGTQ
>tr|A0Y2I9|A0Y2I9_9GAMM Uncharacterized protein OS=Alteromonadales bacterium TW-7 OX=156578 GN=ATW7_12101 PE=4 SV=1
MHVYTFAFKNIVDLYLSIGFNQVLTYTADLHVLFDMYKHRNIVALEYP
>tr|W7X7N4|W7X7N4_TETTS Uncharacterized protein OS=Tetrahymena thermophila (strain SB210) OX=312017 GN=TTHERM_000096738 PE=4 SV=1
MVMSNKINNVQDALLKIATFVINSNVVSNAKVDISYLTIHRFVLKIVELDIIYQIIMNVWRVIKLVSLAKVQQTQIAQLAKVIYISHLPAQNVHNAKTNNIQTIKIIVKVVSPFVRLVTAHQANNVQAVKISQLQAIYHLNVLLQINNIQNHYNIIFKMALSVLKYQVKI
>tr|A0A5S3TR38|A0A5S3TR38_9GAMM tRNA-uridine aminocarboxypropyltransferase OS=Pseudoalteromonas sp. S4498 OX=579562 GN=CWC29_08935 PE=4 SV=1
MKRNTCPVCRFPTNTCVCSYIGNTISNTTQVIIIQHPSEVKVAKNTAKLLALQLDRFTLYVGENTADFEELINFCRLNHVAVLYPNSHAKTLTTEYNFDQTLDAIILLDGTWKKATKLYNLNPWLSQLPSFQFDSVNASEYTIRKSKHEYSLSTLEAAAQFLEIVDQCETADLYKLQAGMVKEQMKLMPDDVKARY
>tr|A0A859QKW3|A0A859QKW3_9HYPH DHA2 family efflux MFS transporter permease subunit OS=Ensifer mexicanus OX=375549 GN=FKV68_04155 PE=4 SV=1
MNRIVPLILAIALFMEQMDSTVISTSLPAIAHDIGVGPITLKLALTSYMVALAIFIPLSGWMADRFGAKRIFRTAILVFIVGSVLCAISNSLIAFVLSRFLQGMGGAMMTPVARLVLVRGAPRSELVSAMALLTIPALVGPLAGPPLGGFITTYFSWHWIFLINVPVGIAGYVLSGIYLPAMERRNPPPVDILGFLLGGIAASGIVFGLSVISLPALPTSVGFASVSAGIAATLLYIVHARRHPAPVLDLKLFRNSAFRAATIGGTIFRISVGAIPFLMPLMLQIGFGLNPFESGLITFVGAIGAITTKFLARRVLAFAGFRTTLIVAAVVGGLLTFANGFFTPATPYLVMISILLLAGFARSFFFTSINALSFADIDDADASKATSMSAVLQQISLALGVAVAGAILEVQTSISGGPLGLEDFHIAFMIIAGANLLGAIPFLTMAKNAGASVSGHRLQMREAETTAGK
>tr|A0A1H3LQ38|A0A1H3LQ38_9ACTN RNA polymerase sigma-70 factor, ECF subfamily OS=Asanoa ishikariensis OX=137265 GN=SAMN05421684_0874 PE=3 SV=1
MVSLRDGGDLDVVPGLGPPGQTSFEEFYAAHFQSLTIQLYAYTRDLPGAQDVVQEAFCRALSRWKHVVDYDDPAAWVRRVAWNLATSRWRRTRTAAQFLRQQRPEHVAEPSPDRVALARALAALKPDHRKALILHYLADLPIAEIARQEGISENTVKSWLHRGRAALATQLSEEEADSA
>tr|A0A0M1JIZ9|A0A0M1JIZ9_9GAMM Uncharacterized protein OS=Achromatium sp. WMS3 OX=1604836 GN=TI05_02375 PE=4 SV=1
MTETTTPQIISIGPENTINEVVVFTSHAQIKRQITTPVQLGTNRFLIELHAFEVDADSLQAAVYGTGEIISVQYKEISVTEAETKQLDLNELKAQQHQLEDQRRTLKYTLEDCKKQRAFVDSALKQVETRDVLGKINIKELFENLQYMLEIVDTTYAKLSQQELDIFKKTQAIEEQLNLVQQQLATRPDVPSTHKIVEVLFNSKTSEKIKMEISYIVNYAIWKPFYKVDVTQDLTNLTIMMFAHIEQNTGEDWQQVKLSVSNAMPIQSTRLPELKSWHIQQPDIFECSTDPWDSNTQQAPLNGVQLDGSSNMEELTTSNLSDFPGSEVHTDDFASEADPLEEADLYIAYGRYEHAETVLLEYIKNHPNSNDAKNKLRALYLVTRNTQKLRELARNHPGKTYLQEILQHIENDDTAFPSSAPAATFIQAQDLQSSLAFEFQLPTLIDIPANGNETLLPLFTKIPKYGFFYYTIPKQDPLVYLVCQADLSNEWLPGRMNIHIGGRFVGNTILDEKQAGQELLINLGSVQDVKIKREKYLDEVSKRMFKGMLDRSNALRKVEIRIVIENLKEQEIQIKILDAIPVSSTDTIQIKDVTMTPEPTLKDWQSQQGVMQWDLNIAAKSVIEIRMQFIVKYPRNCQIAHLNID
>tr|A0A7K5B0S4|A0A7K5B0S4_9FURN IL8 protein (Fragment) OS=Furnarius figulus OX=463165 GN=Cxcl8_1 PE=3 SV=1
AILEGNGNLSCRCAKTTSAYISPKKYESIEIRPVGSTCRRMEIIIKLKAAGKVCVNPEAPWVTKLLKRIAST
>tr|A0A842V0K5|A0A842V0K5_9ARCH Uncharacterized protein OS=archaeon OX=1906665 GN=GF352_04095 PE=4 SV=1
MVKKTELMKEFEEETDQHAVWGGKVTKAFKEWKKERRLKKLVICPWCGKRVKNYTTHQCSRRRRWKG
>tr|A0A1I8IUJ6|A0A1I8IUJ6_9PLAT TGF_BETA_2 domain-containing protein OS=Macrostomum lignano OX=282301 PE=3 SV=1
TACLPAHSEPPSLQSTPTPPGSRSSIKTRPVGGRGEDPLLSRLFHWCGGSFCLSDQTCLEFERSRCLCLAAAICLCGCLLCADSAPAPTTFATPEPLVSSSTEEDAVSFLHKEFYSNAGTTKDGRVISDIIREELRRINLKYEGLSNMTVSTWRKFLRDAYMGVYLKQQSMSDRVTNLLYENLGISKGDVLLDVSEKEDLLTRIPDAILTRVYKWNARPMTRKFEESIFIGTPKTIQDLAGREHHGWSFIIDRSISEQRITKLSMSVHLTPKSRPLVKAMRISVYQLSNASDTLLSPGATRTKNVILSAAAMDEISVDFSADVKPIITKFFSPQSGDQIELFFLIECPQCKTKSDLNVAYLVMDCKVRIRETTGPEDQQNDRQKREASREPWPFEVAAASLFNNVTSSKDITKTQKCILEKMRMRHGQVSCCMMDFTYDLIHQSAVLAPRQLQINYCTGECHGQSEVNNAHSSLLQIFSHSQTSQLSHATREEISLCCVANTYRDFQVLTVVRKPGGGSNVQLKTIKDLSAETCTCA
>tr|A0A0C4EGC0|A0A0C4EGC0_MAGP6 Uncharacterized protein OS=Magnaporthiopsis poae (strain ATCC 64411 / 73-15) OX=644358 GN=MAPG_11851 PE=4 SV=1
MEDLGSGHESLGAASLVARLKALGGSVMAEKKARVRDNWAMRHDCLCFQVLTACAHMPCLPSASRCSPRRARQIREAVYDRVSPRHGHIRHGPVCAIQPRVEALDVHLQTPTGQRAVIARHVVQTTSVGFQQLYKPSLAGEHDYKGGGIHSPEYGGGGGELGQDGAGFEVVMTARSPRYMETLQNVTHPTTLGLYDIGVKEANGLAGLAAAGFPVVDGAPVASVATVAFA
>tr|A0A178C6C2|A0A178C6C2_9EURO Clr5 domain-containing protein OS=Fonsecaea multimorphosa OX=979981 GN=AYO22_04817 PE=4 SV=1
MASADGSPVDRKSKISKRSSNSYTSEEWRRHRPLITQLYFEEGRTLKDVAEYLKREYDFAPTERMYKSRLHTWGLDKKKKEHEMLDLVRQGLQQKGDDKDKVFLVRGRQVTLADALHYFNRKGIKDPSSLLEPQRSVSGDISSPEDADVKTPLSSNDDMLNATQDASDLEMTRSPMEMSEPEKPTLALRLRTSDVAAERLAMLQQALNIPELPPMPPFRTLSVESSVAQVTASAEDQRYQDVIFQNMQNHYMNLFTTRNLSIRNTTGTWTATSDDALADRFYYSMYHGYSFLWNGQRDRAFDNFYKAFALIEGLLKDDHVGFMIYIFDLIIRHDGTGYEEPLLMLLQHLADMAKTVFESEDHPIYVIAMHMHDATASRAWLAESTLRRLLDFFQDSIGYFHPETIALLQTFASGLLNREHFAEAAVRFQQLVDAFETTVNKRCYEVCYALRSTSEAFFHMEDYMRALQAIKASLERSQTLPRTEEREIYVRCLRGLAEISNKLGRKDEANETMQYVVDICRDAFGPEHPFTNRARMHLKTILKGDASSVSAIPPVVYRLGRGGSAAKYIWISRSSPTRLQA
>tr|I2NKN2|I2NKN2_NEISI Proton-translocating NADH-quinone oxidoreductase, chain L OS=Neisseria sicca VK64 OX=1095748 GN=HMPREF1051_1935 PE=3 SV=1
MNDMTLYLIIALVPLAGSLIAGLFGNKIGRAGAHTVTILGVAVSAVLSAYVLWGFIDGSRAKFDENVYTWLTMGGLDFSVGFLVDTMTAMMMVVVTGVSLMVHIYTIGYMHDEKVGYQRFFSYISLFTFSMLMLIMSNNFVQLFFGWEAVGLVSYLLIGFYFKRPSAIFANLKAFLINRVGDFGFLLGIGLVLAYFGGSLRYQDVFAYLPNVQNATIQLFPGVEWSLITVTCLLLFVGAMGKSAQFPLHVWLPDSMEGPTPISALIHAATMVTAGLFMVSRMSPIYEMSSTALSVIMVIGAITALFMGFLGVIQNDIKRVVAYSTLSQLGYMTVALGASAYSVAMFHVMTHAFFKALLFLAAGSAIIGMHHDQDMRHMGNLKKYMPITWLTMLIGNLSLIGTPFFSGFYSKDSIIEAAKYSTLPGSGFAYFAVLASVFVTAFYAFRQYFMVFHGEEKWRSLPEHHSDDHGEEHHGLGKNDNPHESPLVVTLPLILLAIPSVIIGYIAIEPMLYGDFFKDVIFVNADAHPTMHIMKEEFHGALAMVSHSLHSPVLYLAIAGVLSAWLLYVKLPHLPAKIAQTFRPVYVLFENKYYLDALYFNVFAKGTRALGNFFWKVGDTAIIDNGIVNGSAKLVGAIAAQIRKVQTGFIYTYAAAMVFGVLVLLGMTFWGLFR
>tr|A0A233RNA1|A0A233RNA1_9ACTN Uncharacterized protein OS=Streptomyces sp. 2R OX=1883452 GN=BEH93_02570 PE=4 SV=1
MKPRARALAVLSVVAMSIGGVTATATPAAAVGGCPSGKLCLYEGTNYNRLAVTSTSTQACVYLRNFGSGFGTGIASYVNNLPVNAVVYNYRGSTDTFAVAGTIRPGGFSSNSLGANFGVSGAVCMGGVSPS
>tr|A0A1I9YL31|A0A1I9YL31_9BURK Polysaccharide deacetylase OS=Paraburkholderia sprentiae WSM5005 OX=754502 GN=BJG93_10115 PE=4 SV=1
MKRCKALVKEMLAGFVVVSGLAWFTRKLLWRDRVAVLLYHDPDPDTLDRHLTYLRKLCEFVPLTDVSAPGRDRPRVAITLDDGHAGNAKLLPVFIKHNVRPTIFLCSRIVGRPRSHWWLHPGSLRIGHERLKRMTNDERLAALAAQGYQQDGDDRPTGLSIEQIQAMREHIDFQAHTRFHPILTHCSDAESAAEISDSRREIAALLQQPCEHFAYPNGNYGDREVEFVRAAGFKTARTCDIGWNDQHTDPYRLRTIIIDDAASTLRFAAQLSGIAVFLRYLREGGGWRGKFPQF
>tr|A0A8A5HS67|A0A8A5HS67_ECOLX Uncharacterized protein OS=Escherichia coli O89m:H9 OX=2810406 GN=JSU13_20360 PE=4 SV=1
MSGTIRALCHRAHQSSTTRDVALDRHVPGCEDILKEVIWAFSDFVRDHRGVYDPEARYPAGNPWYPVTGQF
>tr|A0A0M1MZY3|A0A0M1MZY3_9MOLU 50S ribosomal protein L17 OS=Candidatus Phytoplasma pruni OX=479893 GN=rplQ PE=3 SV=1
MGYSKLRRTTPQRKSLLRSLVSSLIVNEQIVTTFSKAKELRRVVEKSITLSKKNTLHARRQASLLMFDKKIDEDKTVLQKLFNELSSKYQDRPGGYTRIIKTESRKGDAAPMAIIQLV
>tr|A0A1G7QPU8|A0A1G7QPU8_9EURY C2H2-type domain-containing protein OS=Halorientalis regularis OX=660518 GN=SAMN05216218_11345 PE=4 SV=1
MWGYDTGNLMPECNYCDASFEQEGAYLEHLHTEHDESELSRIDRRRVADHVGDDEEGEFPTGPAIIGGTLLLTVGILVYVVFFLNIGGGSGPAAASGSVGDVEQTPYGLQTVHQHGTIDVIIDGNTLDFSQQQYQLQADAFHFESGNGVRWHKHAQGVTLEYAMSTLSIGVTDSSVTFQGTTYNESDPDTNVTVAVDGNDVDPSSYVLQDDDRIRIVANSS
>tr|A0A4R2BCF3|A0A4R2BCF3_9BACI Histidinol-phosphatase OS=Mesobacillus foraminis OX=279826 GN=EV146_107111 PE=3 SV=1
MVKDGHVHTHFCPHGTNDPFESYIEKALSLGYTEISFTEHAPLPLSFTDPTPLRDSAMDHSDLEEYFAEVNALKKKYGDKIKINAGLEVDYIEGYEKETAKLLDKIGPKLDDSILSVHFLKDPFGYSCIDYSPDHFRYMISAYGSIEQIHVNYYRTLIHSILADLGPYKPKRIGHITLVNKFQLKFPAPRTFSEEITQVLKAMKEYGYELDYNGAGTSKPLCREPYPPAEVIDQAVSLGIPLVYGSDAHRAKELGQGLDLMSKKLENRQ
>tr|A0A5E4KIF3|A0A5E4KIF3_9ARCH Uncharacterized protein OS=uncultured archaeon OX=115547 GN=LFW28011_00478 PE=4 SV=1
MADFEGLELNFTMANLPEYPPDFLPGISFGPLSRYFSGSDQKPPGGAEIEGNYLCNPFCSSCFLVNLHPANRVYAILFLHLKL
>tr|A0A210RZX5|A0A210RZX5_9BURK Peptide methionine sulfoxide reductase MsrA OS=Polynucleobacter hirudinilacicola OX=1743166 GN=msrA PE=3 SV=1
MNETLDKNQTTLERATLGGGCFWCLEAVYQQVSGVKSVVSGYAGGARPNPTYEAICTGVTGHAEIVDILFDPQVISFRDLLEIFFVIHDPTTLNYQGNDHGTQYRSVIFTHSDEQSNIAHEVVKELDDSKIYSRAVVTQIDVAPTIFPAEDYHQNYFVQHPNQGYCMAVVAPKLAKFRAKFKALIAPHYS
>tr|A0A0M8WET4|A0A0M8WET4_9NOCA HTH hxlR-type domain-containing protein OS=Nocardia sp. NRRL S-836 OX=1519492 GN=ADL03_23475 PE=4 SV=1
MHTAGFRNDIGVDQVECDTVSLPYRIGDKWTAHVLRALSPRRRRFTELRAGLPPVTAKVLSETLRTMERDGTVARESFDENPPRVEYELTGQGRKVLALLDLCCEWARENLVET
>tr|A0A519KUV8|A0A519KUV8_9CAUL Uncharacterized protein OS=Brevundimonas sp. OX=1871086 GN=EON87_17510 PE=4 SV=1
MRALILCAAAATALSACASTGENTYANSTAELAAQCRERGGILVPTGRPSTGRPETDNACQINGGASRIP
>tr|A0A416ETJ7|A0A416ETJ7_9FIRM Threonylcarbamoyl-AMP synthase OS=Lachnotalea sp. AF33-28 OX=2292046 GN=DWZ56_01980 PE=3 SV=1
MDTKVYNVEETGRCQEIFMEAGRVIRSGGLVAFPTETVYGLGGNALDARASEKIYAAKGRPSDNPLIVHIADLEELPDLVAEIPPMAETLMNQYWPGPLTLIFKKSLKVPPETTGGLDTVAVRMPDHEAAAMLIRASGVPIAAPSANTSGRPSPTRAKHVQEDLSGKVDMILDGGEVGIGLESTIIDVTGSDPVILRPGYVSLDMVKKLFEGVRMDKACTEPLKEGERPKAPGMKYRHYAPKAGLTIVEGGRAEVSSFINNHIQEESLAGNKVGVLCTEETAGCYPGGICKCMGRRADEETVAHNLFAALREFDEEEVSQIYSESFYGGQLGQAIMNRLMKAAGYHLIQV
>tr|Q7P5J6|Q7P5J6_FUSNV Uncharacterized protein OS=Fusobacterium nucleatum subsp. vincentii ATCC 49256 OX=209882 GN=FNV0999 PE=4 SV=1
MVGNLTDVMEKFDNNNVYSSLGLNRFKFDKNIGFYNLDANLFNLGETKDLSFTGKMSLVSDKKAYGLLVYDKIDDISYGSTIDHDLYTNLSLTKDNNKFRLNARYDYLYDMDPGSTSSDLMSRNERIGANFLLKENGLSISYDKRRGDDYRNFNFLEEDINTSARKRNVLGIDFSYTPTTVAKYEFNNFENIKASLGNYKVGNYTFTPSVSYNFLDRKLDTAKDTYRATVLGSNRLAEFNRFENIVYNNSLERRADLNLSNDNETYRIGFGKTTSEIWSREGLFDGTYRKYENKSKFYEIQLGRQNLPLGNIGTFGIDGTFRQDEFDGSSDKTNLINLKLNNDLYLYKAENLKVTNKFKAEIQKYNFSGNKNNEEGRLITKSDYIKFDNSLIFDGKSTVTTYNIGYKSSKNPYGKKNKSAEQFTTGLGIKFDENTNLSLKYTDDKRFTSKINSGKNVNDLSMKQYSINFETKKYDLGFANTDIDFVGDDFSTITDFREDINEHRIRAGYKFDNSKISLSYAEGKDKLKVDDGRYLDRKNRMYSVAYNIYGDVEQDFIGAFKTYRYGNTRIADDIRNTDVYSFSYAYRDKRFEQEELMKYATLEYEKPKDQITNDEIEQIRAILDRKSSFYNQFELARIQDETFRIGNYKKTLSAYVNLEKNNKRYSQTGNLKDSLSKFSGGLTVSYNRLGIGYTFTQKASWKNSGGSYKWSKDTKEHELSVYAKIGKPSQGWKIKTYAMFYDNKNDSTSSRNRKRSLDSIGVEIGKEMGYYEWAVSYENRYKTSSKDYEWRVGVHFTLLTFPNNSLFGIGAKNRGGTASTKPDGYLLDRPSQLKNSY
>tr|A0A4Q3CBA2|A0A4Q3CBA2_9SPHI Alpha-amlyase (Fragment) OS=Sphingobacteriales bacterium OX=2044944 GN=EOP54_25765 PE=4 SV=1
PAMMENSVIYEVNIRQNSPEGTFAAFSKDLPRLKELGVKVIWVMPIHPIGVKSRKEGLGSYYSIQDYKGVNKEFGTLEDFKAMVKAAHQNGIYVIMDWVANHTAWDHAWVTAHPEYYTKDKDGKMISPFDWTDVVELDFDNKDMRKAMIADMEYWLKEADVDGFRCDVAGEVPVDFWDAAAKDLNNVKPVFMLAEAEKPELMKNAFDMAYGWESHHIMNDIAQGKKTVKDWDTYMATKDSLWEKDDFTMYFTSNHDENSWNGTEYERMGDAAETFTALTFMVPGMPLIYNGQEYDFKKRLKFFVKDQLTKEKGKMYPVYEKLGALKNNNPALNGGKDAASYKRIATSADAAMLAFEREKGSDKVTFIANLTKVPQVFTVPVEGTFTNYMTGEKVTLTKGQKHNLAPWQYWILTK
>tr|A0A2G2HQJ2|A0A2G2HQJ2_9PROT Pyruvate, phosphate dikinase OS=Robiginitomaculum sp. OX=2030823 GN=COA60_09450 PE=3 SV=1
MTKWIYGFGGGTADGSASMKNLLGGKGANLAEMCSLGLSVPSGFTLSTEVCTNYLENQKTWPDGLQNQLAKALQVLEQQSGKSFGDAANPLLVSVRSGGRASMPGMMDTVLNLGLNQKTVEGLAELSGDRRFAFDSYRRFIQMYSDVVLGIDHDLFEEILDEHKDVQGFATEADTELAADDWEQITKLYLALVADELGHEFPDDPVDQLWGAIGAVFDSWTNDRAKVYRDLHDIPQSWGTAVNVQAMVFGNMGQTSATGVAFTRNPSTGESLYYGEFLINAQGEDVVAGIRTPQALTERAKAEIGDTEPSMEAAMPKVFAELTEVFKQLELHYKDMQDIEFTVERDQLWVLQTRSGKRTAKAALKIAVDMVAEGLITEREAILRVEPASLDQLLHPMLADGHNCPIICTGLPASPGAATGKVVFSSEEAVIMASRGEDVILVRIETSPDDIHGMHAAKGIVTARGGMTSHAAVVARGMGRPCVAGAGELKIDYSKGSFMVSGQTVHKNDVITIDGAKGHIFSGTATMVQPELTGDFGVLMFWADKVRRMKVRTNAETPVDVKTACDFGAEGIGLCRTEHMFFEESRIAAVREMILAKDKAGRIAALDRILPMQRDDFVEIFQIMGERPCTIRLLDPPLHEFLPHSEADVAQVSQATGIAVGELMSRAESLAEANPMLGHRGCRLGISYPEIYQMQARAIFEAQGKVKQQTGIMADVEIMIPLAATARELEILQGKIRQIAEQVTGDQGFAPEYKYGAMIELPRAALCAAELSEFASFFSFGTNDLTQTTLGLSRDDATSFLGDYICQGVFEKDPFVSLEQSGVGQLLEIATERSRQAKPDIKLGVCGEHGGDPASIHFFEGLGLDYISCSPFRVPIAKLAAAQAVLLREK
>tr|A0A395H0X9|A0A395H0X9_9EURO Uncharacterized protein OS=Aspergillus ibericus CBS 121593 OX=1448316 GN=BO80DRAFT_465679 PE=4 SV=1
MAGHRRFASTLTSAAMDIGFYGSVRRRVDGALWLPFRDSSFYPERPQIRSPSLIFPWTAIVALPVRNVQMSSWTRTHSCASRLRSRLSFLHVVTVGAVISLCYLFYTFAVPQLHRLQLRTDLSWYDLGLYGFGPSRSYVSFEYESPAVQISEWESGCDSRYTFFAPRGDSVAQPGPMILDSKGELVWMKYNWDVTQDFKVQRYQDTDYLTYWEGGETEGRGYGAWYMLDSTYTQRYVISPVGNHGGDLHEFNITPEGTALVTIYDPLPADLTSIGGPELGWIYDGVFQEIDIATGELIFEWRASEHYPISITYEKLGKSGRLRSFAFDFYHINSVDKDDNGNYIVSARHTHTVSCIDKNNGQVLWTLGGKLNEFRDLSDGKATNFAWQHDARWHANNTLTLFDNARHSSNDPENESRGMAIELNVAAREASLRAAYHHPQQMLSVSQGNVQMLDDSGRVLVEWGHSAAFSEFSADGQLLCNTHFGASAFFGFGRVVSYRAFKGTWVGRPQTVPDAEVLGDRVYVSWNGATEVVAWRLEVWETDDVHDNSFRVVAQFPKDSFETEIEIPNLELPLFRLAALDSDGNVLGITELLQREQGGSFEQVINPQYWIIVMAFVMSGVGLFVGLYTCCGWGQYFRRCRSRSSEYQLVAFSDSEAPV
>tr|A0A828ZLR4|A0A828ZLR4_9BACI Uncharacterized protein OS=Lysinibacillus fusiformis ZB2 OX=1231627 GN=C518_0034 PE=4 SV=1
MVFRPPYPYPMYPGGMRMPMPMQTPPQMSPQSFFPPGGFPVQPRIPGGFPMANGIGSFGGQMPMPPVQEASKVGSFLQQANSLFNTAKTYTPYIQQAMPMVKNIPSLLKLYKGFQGLPSAGGGATEAAGSDSKAAGSRRSSRQSASFTPPEPLPSKPRIFQPPM
>tr|A0A2K5HSM9|A0A2K5HSM9_COLAP Histamine N-methyltransferase OS=Colobus angolensis palliatus OX=336983 PE=4 SV=1
MASSMRSLFSDHGRYVESFRRFLSHSTEHQCMQEFMDKKLPGIIARIGDTKSEIKILSIGGGADFLIWGSSRVLKQNSCFIFCRTCQNDKSVMRIHDEHSSELPFGAARLKGTSSFPSFLVSFSLF
>tr|A0A834YI29|A0A834YI29_9MAGN Uncharacterized protein OS=Tetracentron sinense OX=13715 GN=HHK36_028814 PE=4 SV=1
MGRGRVELKRIENKINRQVTFSKRRNGVLKKAYELSVLCDAEVALIIFSSRGKLFEFGSAGNAVVAVMTKEELWLNSPEQIPSRPGDMGFVLILDLLSFPPISLSSLILFLQTHRSTYNLH
>tr|A0A3S3PID2|A0A3S3PID2_9ACAR Cell cycle control protein 50A-like protein (Fragment) OS=Dinothrombium tinctorium OX=1965070 GN=B4U79_11510 PE=3 SV=1
MPVNFVYEVNSERELQELKNKQTARDALRRQRLPAWEPILTPTAVLSSILLIGFALIVIGIMLLITIEQVNEKVIDYTNCVSSVNIRENCSTVIARNIYEPCWCIQRFSLDEDFGADAFFYYRLSHYHQNLRRYINSKDSKQLLGYDHRKKVSKKCEPFEKNFDPLQGQVLPIAPCGAIANSLFNDTFKLYFIENMSLIPVEIIETDISWPTDKKHLYINPPNMNFEGFTKPPYWRKYVFELDLNNSDNNGYQNEHFIVWMRTSAFPTFRKLWGRIDHKNRFSRSLPKGNYVLQINYNYPVISFGGAKSVIISNTSWLGGKNYFLGYAYIVCGTLFVILDIALFAIYYLYGY
>tr|A0A3G9HIV9|A0A3G9HIV9_9PROT Porphobilinogen deaminase OS=Hydrogenimonas sp. OX=2231112 GN=hemC PE=3 SV=1
MEKLIIATRGSQLAMWQAEYVKSELRKRFPEMEIEFEVVTSTGDKILDKPLALIGGKGLFTKEIEDVMLAGKAHMAVHSLKDVPTVMPEGLKLAAITKRDDIRDCFLSHKYRNIDDLPEGAVVGTTSLRRQMQLRAIRPDLKIKNLRGNVNTRLRKLAEGEYDAIILAYVGMKRLGLLESVPYHDPIDDNVMIPPSGQASLGIEIVDDERVAEIAAVLNDEDSALAARIERDFVSELEGSCQVPIAVNAKISAERVVVRAMVGLPDGTEILKEIIDAPKSEARDLGVRLADIMIEAGAKELLERAEAMAFKDERCERL
>tr|A0A5E4QBA8|A0A5E4QBA8_9NEOP Uncharacterized protein (Fragment) OS=Leptidea sinapis OX=189913 GN=LSINAPIS_LOCUS7231 PE=3 SV=1
MKYVSFSLIATLIFAGYVINTIWNLAEIFIPPECSRGERCFTSYLASNPVQHLVLYTSIKENPYRGGISDAAVNKVHTSLKFDYRKPAKIDLTLKIPRRTRNNGTLFMHAVLLDERRLYDDFIDIFRNEAIYTLPLVTYMDQKDETFNLLQGNNGQEIKPKKIVKPYSHIFKVAPLSILTDDLQLPVKKIPGELYPYVRVRNEKFLPIIQHNVLKSRISDLELLRSNTSEVNVTVEISPTSYGVLRLALHVRLALLQLQSLGFSEKDVDDAKGIFADTNLYLLSATVLIASCHLLFDFLAFKNDVSFWRS
>tr|A0A093L9J8|A0A093L9J8_EURHL Melanotransferrin (Fragment) OS=Eurypyga helias OX=54383 GN=N326_02722 PE=4 SV=1
AALGLERVRWCTISQQELSKCNDMSKAFGRAGILPPLECTAWGSAANCTQMIKEDLADAVTLDGRLIYQAGKEHGLKPVVGEVYDQEIGTSYYAVAVVRKNSSITIDSLKGVRSCHTGINRTAGWDVPVGYLTDSGRLAAMGCDLPQGKTVSDYFNASCVPGAIGVNYPSSLCQLCRGNSAGKSKCERNSQEQYYDYSGAFRCLAEGAGDVAFVKHSTVPENTDGRSLSSWAQRLRSRDFQLLCRNGNTADVTEWRTCHLARVPARAVVVRPDTDGAAVFQLLNQGQQRFNGVGTKFQMFDSAAYGAQNLLFRDSTMELVAITAQDYQAWLGEEYLRAVQALSCNPNTLPESLNWCVVSTEEIWKCGEMAIAFRKKNLKPAIQCISAKTKEQCMEMIQKKESDAVVLGGDDIYTAGKTYGLVPAAGESYSADDNSNAYYAVALVKRNLSNAFTISDLKGKKSCHTGLGRNAGWNIPIGILIKRGIIKTRDCDIPQAVSEFFSASCVPSAKLDSYPSKLCQLCVGDDSGNHKCSASSQERYYSYSGAFRCLAEDSGDVAFVKHSTVFENTDGKNTDSWAQNLNSSDFQLLCPNGARAEVTQFAECHLAQVPAQAVMVHPDTNVFALYGLLDKAQVYFGNSSNGNGFKMFDSSTFQGKNLIFKDSTVEIVPVEEKRTYAEWLGREYLESLEGMQTPQCSGAGNKIRPYLLVTVVSLLWCQAQGLD
>tr|A0A4D6WVR2|A0A4D6WVR2_9FLOR Photosystem I reaction center subunit PsaK OS=Gayliella sp. OX=2575623 GN=psaK PE=3 SV=1
MYINILLNISSNTVNWSPKIALIMIICNLLCITIGRYSIQVRGLGPSIPLIGSEGPGLPELLATTSLGHVIGAGTILGLRSQGII
>tr|A0A255GDV3|A0A255GDV3_9ACTN Uncharacterized protein OS=Propionibacteriaceae bacterium NML 030167 OX=2016500 GN=CGZ94_12075 PE=4 SV=1
MARERTEKRDRPEKRDRDKGDRDRLNTPGRESSRFPRIRMDGDTFGEFAEAFARFMGTAGFLMWMTIIIILWIAWNTLAPESVRFDPFPFIFLTLVLSLQASYAAPLILLAQNRQEARDRISVEDDRRQAAQSRADMDFLAREIASVRMNVGELATRDYIRSELRKELRELLAEHDEPAAGPERGSVGG
>tr|A0A1X6Z5H1|A0A1X6Z5H1_9RHOB Uncharacterized protein OS=Roseivivax jejudonensis OX=1529041 GN=ROJ8625_01941 PE=4 SV=1
MDAAFIVPVLALITLLAGTVYALWSKHVTEQAKADPAHPKSRLAADTPSR
>tr|A0A4T0PB80|A0A4T0PB80_9BASI P-loop containing nucleoside triphosphate hydrolase protein OS=Wallemia mellicola OX=1708541 GN=E3Q18_02634 PE=4 SV=1
MDTVTNSIFEEIKSEISALPEDQRYLVGIGGFPGSGKSSFTKHLTDKFTDSSIKAVAISMDGWHYTRDDPTAAFARRGAPHTFDAEAYTEFVQSLKLEPRVALEAPTFSHSLKDPTPSGTQVDTSVKVVIIEGNYVLLNEERWMKAANNLDKKIWVDIDEETTRQRLIKRHVESGICKDSQEAYDRAENNDLDNGRYARQNLVPDTQIIKSIEDEKFAI
>tr|A0A4Q9TDA8|A0A4Q9TDA8_9GAMM Penicillin-binding protein 2 OS=Pseudoxanthomonas sp. NML171590 OX=2527958 GN=mrdA PE=4 SV=1
MTMSRRRPLKNAHAEADQFRRRAALGFLGVFVCLAGLGAWYFKLQVLDHAEYATRSEANRIKLRPVVPARGSIYDRNGVLLAENIPAFRLDVVPDQAGDPDEWLDALGKVVALDPEEVKHFLAARKVSRGFRGITIKPKLSEEEIAALAVDRWRFPGVEVVPYLTRHYPYGPLLAHVIGYVGRVDEADLAQLGEGNSALTHVGKTGLERYYEQQLRGKVGYEKVETNVEGRALGVVGRVPAQAGTDLKLSIDIKLQQAMTEAFGQYEGAAVAMDPRTGQILGMVSLPSYDTNLFVNGISTRDFKALNENPSRPQFNRLVLGGVAPGSTIKPLMGLAGLDSGTRRPQDKILSTGMFYLPGVSRGWGDSHRGGHGWTDLRKSIAQSVNTYYYKLAVDMGITQVDAYMTKYGFGAPTGIDLAGEIGGIVPSPAYKMKSRKEAWYPGDTVNIAIGQGDWKVTPLQLVRAISGVADGQLRTPRLVMDTRNGFDQPWQPIAPGPTKPISDRPDNLQWVREGMMDTMRPGGSGYAIAVGAPYQMAGKTGTAQVVSRKGLAAVDPRSLPMHLRHRSLFEGFAPAQAPTIALAIAVEGGGYGASTAAPIARKIFDAWLLGKMPGDTPDAPDIVVPEDGTDTGAAPPAPSEIPGAPGPTPPPAPTAAPVPAEAPREPQAAP
>tr|A0A1H3A3S6|A0A1H3A3S6_THIRO Uncharacterized protein OS=Thiocapsa roseopersicina OX=1058 GN=SAMN05421783_11845 PE=4 SV=1
MTNAQCLYGHRPTPGWPGFARACRPSWRDDLCPTWIDLVVPPCSFRVFRDHEVAARRVVGHDGNDIPCFQAYDYRRLDLRSDDDEEYYLAVSYSESVSAWRLRDGRWLVHRRVELLGDEDAATSALSIDERMPR
>tr|A0A1L7CG91|A0A1L7CG91_9CORY Threonine--tRNA ligase OS=Corynebacterium aquilae DSM 44791 OX=1431546 GN=thrS PE=3 SV=1
MSDQPEREFAPFNVPAGTPVGAAMRELELPNKGPEAIVCVKDADGQLKDLSFVPDTTAEFTPVPANTEEGRSVIRHSCTHVLAQAVQAEFPGTKLGIGPAIENGFYYDFDAAEPFTPEDLKRIEKRMKKIIKQGQKFERRVYADQAEAREALANEPYKLELIEDKGNVDPNSDEATEVGSGELTGYYNLNPRTGDVEWYDLCRGPHVPTTKYIPAFALTRSSAAYWRGDQSNAGLQRIYGTAWESTEALEEYQHMLEEAEKRDHRRLGTELDLFSFPDEIGSGFPVFHPNGGIIRLEMEEHSRRRHIASGYSFVNTPHLTKGDLFSKSGHLDFYADGMFPPMQLDGEYDENGNCTKQPQDYYAKPMNCPMHNLIFASRGRSYRELPLRLFEFGTVYRYEKSGVIHGLTRARGFTQDDAHIYCTEDQLEAELTSVLDFIISLLRDYGLDDFYLELSTKDEGKFVGSDEIWEKSTAILQRVADTSGLDLVPDPGGAAFYGPKISVQARDAIGRTWQMSTVQLDFNLPERFNLEYTDSDGSKKRPIMIHRALFGSIERFFGVLLEHYAGAFPAWLAPQQVVGIPVAEAFSPHLEEITARLRDKGIRATVDTSDDRMQKKIRNHTTAKVPFMLLAGARDVEAEAVSFRFLDGTQVNGVPVDEAVELISAWITARRNEQPTEANLRG
>tr|A0A7X7K3W6|A0A7X7K3W6_9CHLR Uncharacterized protein OS=Anaerolineales bacterium OX=2073117 GN=GX601_14875 PE=4 SV=1
MVALRDDFAGELNRHWNTSLVGQGTLTMGESRMRLGVTGASSRRYSNAQIDDYQDLMRRRFPWAPPLRLSVRARFSGSAQTLRGTAGFGLWNDPFMMTGARPPNLPRALWYFFGSPPSNMKLDLHAPGHGWKAATIDALRPISLALGMIALPAVALMNVRPFYRALWPPIQRALHVQEAPLETDMAEWHTYEIEWSASHSYFRVDGTAVLTGAPSPRGPLGFVLWMDNQSLEITPWGRVRWGLLDIPDGQWMDVDWVELA
>tr|A0A4R2CCK3|A0A4R2CCK3_9ACTN Polygalacturonase OS=Kribbella sp. VKM Ac-2500 OX=2512214 GN=EV642_10991 PE=3 SV=1
MVQDKFSRKNFLRMTAGAALLPTAAALTAGQAAAAAAGTPDATAPLGPDGHGGPGWGHVGEILRETRPPRFHDRDFPITAYGAVGDGSTDATAAIRAAIEACHLAGGGRVVVPAGTFLTGAIHLRSNVNLHVSEGATLLFSTDPAQYLPVVLTRFEGMELMNYSPLIYARDCDNIAVTGTGTLDGQATWETWWSWVGPSGPDAQALTDLADRGVPVPERIFGAGHFLRAAFIETYHCRNVLIDGVTLLRSPFWEIHPVLSRNVTVQNVHIDSRGPNNDGVDPECSQYVVIRNCTFDVGDDCIAIKSGRGTDGLRVNVPSENILIEDCTMNIRYGAITIGSEMTGGVRNVFVRNCRIGSGYQYFGLYIKTNSVRGGYAENVYLKDIEISNLTKEVVSCNFYRGEGDTGPLTPRVRNVELRNITVGHARNAFSMTGYPRLPIQDFRLIDCTFTSIDAASTIQDVDLSFENFFVNGQPITDPAQLL
>tr|A0A0A7RLM7|A0A0A7RLM7_9LACO Flagellar motor switch protein FliY OS=Liquorilactobacillus oeni OX=303241 GN=fliY PE=3 SV=1
MSDSLSQAEVDALMAGNAVSKDEGQDNDNGMDEKTRQDIIGEVGNISMSQAATTLSSILNRRVSITTPHVSRMKFEEVLSAVHTPKVATVVEFKEGLAGSNLLLLEVKDAVVIADLMMGGDGNPKSSEFSELQLSAVAEAMNQMIGSASTSMATMINRKVDILPPAVKLWENASNIEYNGIVNAEEIYRISFSLSVEGLIESEIMQIFTKDMVDDITDAMLSDKATVIEREKAVSQPEQKEETKSAPKTASVDTKMMSKEQTKHVEVSKPEFQQLEENKVAEGDNLDLLLDVPLNLSVVLGRSEKTIRDILSFNSGSVVELDRLTDEPLEILLNGKPIATGEVVVINENFGIRITNILSPSQRIHRLK
>tr|A0A3N0E5U7|A0A3N0E5U7_9ACTN Non-specific serine/threonine protein kinase OS=Nocardiopsaceae bacterium YIM 96095 OX=2487137 GN=EFW17_17180 PE=4 SV=1
MTDQEHPQVPVHGDPADGDMPDAVLGARRDVVTFVESANQPDQLVRLWWVTVVLQIAEQHIPNLRMTNGHKHSVKYPRRSYAINSTSSARRYSTTSGRVGRPRLRPRPVTLRHTPRFRPPQPCGKIPVSLAVPNERVVATVRGTPSSGRHSAGPYELVRELGRGGFGSVHLGRDSAGRHAAVKLLHLNQAESARVRADFAREVDAARKVNPFCIAQVLDADLDADEPWIATEYIEGPTLLEAVRADGPRTGADLQRLAVSMATALTAIHRAGIVHRDLKPGNIMLASDGPRVIDFGIARGFEGTEFSVSQMVGTPNYMAPEQLEGNRLTPAVDVYAWGAVIVFAATGRNAFTAPSQAALIRRVLLGEPDLDGTPETLLPLVRRCLAKAPEQRPNAHALLEALLDGATPGTEPGADTGGTATPAPLPNVGPESDGAPPRGPAEPAEPAPPFVFADDSYHSPGDLASAMRRNWSAAVRVFANDQERALLRTWLLEDIDDRTVDRALLRRPPEDPEAVLTEFIAQVRPDLPPTYRGRDMRLSALRQTLRNHSGQPPAELHGLGSRVLRALARHHCVEEDHTCASGAPCKEYQRIHSEFVTRVERVRAATEQVDRTLRAESPQLADTVDVPALAASVTTTLLPGLLHPADETWPPREQRPRTHTEWYTALATAVGSDIPPELHEDRGVTLLYDATATRIAGIQDTEQLRVHTLERDLDRLMAGWRQATKTVFVRTFGGWCAVTLVSLPFFPWTGVFPSGVALVVGLVVVIGTLMAAGRPYAAQRHSLHTPPPDPSWREGRIATWLDGEITQAKQRAGRLPRILAHMTGGSTTG
>tr|F1A946|F1A946_9CREN Acetyl-CoA carboxylase alpha subunit (Fragment) OS=uncultured crenarchaeote OX=29281 GN=accA PE=4 SV=1
AMTDFVVMVEKAATMFVTGPDVVKTVLGEEVSFDELGGAMTHGTKSGVAHFVAKNEYDCMDIIKNLLSYIPQNNTESPPRVKTSDDPNRLDHNLLNMVPEDSLKPCDMKPIILSVLDDNKFFEIHELFAQNVIVGFGRMNGRTVGIVASHP
>tr|A0A497UYM2|A0A497UYM2_9FLAO Uncharacterized protein DUF4230 OS=Flavobacterium lindanitolerans OX=428988 GN=CLV50_0313 PE=4 SV=1
MRRILIIAGIVVAVILAFRFCEFKKDDRSTIEYDTNLIQERIVNVGKLIVTEGHFAEVLTYKDQEKYLMDLISFEKKALVIVNADVTVSYDLRQMKYDIDEKNKTITIKYIPKEEIKINPDIKFYDINQSRMNPFTGDDYNKINKSVKANLAKKIEKSSLKTNAQNRLISELSKILITTNSMGWTLRYDGQTVNEESIDKVLL
>tr|A0A1V2ZGA3|A0A1V2ZGA3_9MICO SGL domain-containing protein OS=Rathayibacter sp. VKM Ac-2630 OX=1938617 GN=B0T42_04245 PE=4 SV=1
MRRRAIAVPVLLAGALAGCTQAGDPAEEEAPPSVATAERVLQVTEVHEATGMTLLEGPAFGPDGSLYVVDVTAPPGEGKVLRIDLDDESVEPVWTDDSSALTSAQFGADGRLYVTDFLGGAVRSMTADGEDVREIAAGAVEGVPMQPDDLDFGADGALYVTDAAGAQDPYWEASGRVVRVDPATGSASVLADELPSPNGIAFSPDHRELWVSMNTGNRIDRLTLTGDGTEVATAFPAIHASPGIGQLDSIAVDADGNLYVGLHSRPEILVYDTAGALLQTVTVAESGLSSATNIAIRPGTTEAFATVSGSDGGFVHSFEALAEGMPQSNGG
>tr|A0A1D8NL70|A0A1D8NL70_YARLL Catalase T OS=Yarrowia lipolytica OX=4952 GN=B0I71DRAFT_163235 PE=3 SV=1
MSKELYANSKDDAVYSYSFGVPYPHHPYSSQRAGPTGPLLLQDTYLIDALAHFDRERIPERVVHANGGGAHGYFEVTDDISDITYAEPFQKIGYKCPTTVRFSTVGGERGSPDTARDPRGFAVKHKTDWGNWDMVGLNSPVFFIRDPVKFIHVNHSQKRDPQTNLTAGDDASNYWNYLVQNPESLHQVVYMFGDRGTPNGWRHMNCFSTHTYKMINKEGKLTYVQFHYKSDQGVKNFTGPEAAEMAGKSPDHDQKDLFFAIDNGDYPSWTVSLQTMTPEQAEEWEYSILDMTKTWPYDKFPLRKVGKLVLNKNAENFFEEIEQAAFSPSNLIHGIEASDDPVLQARLFSYPDTARHRLGPNFNQLPVNQARTFQKGSGCPFMAGNFQRDGNMAIHNQGNRPNYLSTIRPIQSVSVPNEDFKNTHDYCGVVTKEMEDESFKVQAEAAKKHNEKIWESSSYLYLSGFQESDAAQPRDLYERVYDDAAKQRMIDNVVDHASTIKQHGLKEQVAKYFGRISDDLGKKIAEGLGVPY
>tr|A0A4R2XLQ7|A0A4R2XLQ7_9HYPH 50S ribosomal protein L2 OS=Rhizobium sp. GV031 OX=2135727 GN=rplB PE=3 SV=1
MALKTFNPTTPSQRQLVIVDRSSLYKGKPVKALTQGLTKSGGRNNLGRITARFIGGGHKRTYRLIDFKRRKFEVEGTVERIEYDPNRTAFIALISYADGEQAYIIAPQRLAAGDKVIASEKAVDVKPGNTMPLQYIPVGSIIHNVEMKPGKGGQIARSAGSYAQLVGRDAGLAILRLNSGEQRLVPGSCLASIGAVSNPDHANINDGKAGRTVWRGKRPHNRGVVMNPVDHPHGGGEGRTSGGRHPVTPWGKPTKGKRTRSNKSTDKMIMRSRHQRKK
>tr|A0A6F8T1T8|A0A6F8T1T8_9GAMM Superoxide dismutase [Cu-Zn] OS=Legionella sp. TUM19329 OX=2708020 GN=sodC PE=3 SV=1
MNKLTTALISSLLSFNALHAAPMTTTLYTTDTNPTAIGTVEFEETPYGLLISPNLIKLPAGLHGFHIHQLPDCGDHGMSAGGHYDPTNTKSHKGPYGDGHLGDLPVLYVSSDGKANTPTLAPRLKLKDLTGLTLMVHAGGDNYSDTPSLGGGGAREACGVIK
>tr|A0A3D0ZXQ6|A0A3D0ZXQ6_9GAMM LLM class flavin-dependent oxidoreductase OS=Gammaproteobacteria bacterium OX=1913989 GN=DEQ32_11910 PE=4 SV=1
MKFGIFYEHQLPKPWSEGLEEKLFQDALDQVELADKLGIDYAWEVEHHFLEEYSHSSAPEIFLAAASQRTKNIRLGHGIRQVIANYNHPARTAECIATLDLVSGGRVDFGTGESSAILELGGFDIPVESKRQQYLESVEQICNMLAMDPYPGFDGQYFSMPCRNIVPKPVQKPHPPLWVACSNRDTIKMAARLGIGALTFAFVDPLEAQHWVDEYYSIIKSDECVPIGHTVNANICMVTSFSLHHNRAVAIERGLEGFEFFGYALGFLYGFGIHKPGRTDIFREFQAARNAKLVESPVEVGESLTGERGGIGTPDDMREHLRKFERVGVDQVTFIQQAGMNKHEHICESLEIFAAEVMPEFKSRETEREARKAEELAPFIEAAMARKQYMKMPKDDDIPVFPALGRSVVEGDADLTKKAVG
>tr|A0A7Y7XFB0|A0A7Y7XFB0_9PSED Acyl-CoA dehydrogenase family protein OS=Pseudomonas gingeri OX=117681 GN=HX882_17635 PE=3 SV=1
MNLHQYAETHEVTNQPPSLDGTNLYRIDLPLQEWARRFGAGWAESRIEAYGALAGGPLMEAGFLANQNKPVFVSHDRYGHRQDLVEFHPAYHELMRTAVEHGLPSLPWTDPQEGAHVARAAMTYLHSQAEAGTGCPLTMTFACVPALRLQPEIAGQWLPSILSTQYDPRNLGIAHKTGATIGMAMTEKQGGTDVRANTTRAYPVGAGGPGQPYELVGHKWFCSAPMCDAFLTLAQTDKGLTCFLLPRHRPDDSRNQFYIQRLKNKLGNCSNASSEVEFRGALAWMIGEEGRGVPTIIEMVAMTRFDCMVGSSALMRQALTQASHHCAHRLVGGRVLAEQPLMQNVLADLALESEAALALSLRMGRALDRLGDDHEAKFARLVTAVGKYWICKRAPAMINEAAECMGGAGYVEDSILPRLYREAPVNSTWEGSGNVQCLDVLRSLSKEPGVLEVLFSELGDGHGDKRLARHIEHLKLAFTDTHDIQYRARQLTEDIALALQAKLLLEAGNAEVSDGFIASRLEAGGRVYGTLPRGVNVEAIVARSTPQGG
>tr|A0A218LFE2|A0A218LFE2_AGRCR 50S ribosomal protein L33, chloroplastic OS=Agropyron cristatum OX=4593 GN=rpl33 PE=3 SV=1
MAKGKDVRIRVILECISCVRKGANEESTGISRYSTQKNRHNTPGQLEFKKFCRYCRKHTTHHEIKK
>tr|A0A7W2KV63|A0A7W2KV63_9PSED Cytochrome c-type biogenesis protein CcmE OS=Pseudomonas asiatica OX=2219225 GN=ccmE PE=3 SV=1
MNPQRKKRLLLIVGLLVGVGVAVGFALSALQQNINLFYTPTQIANGEAPLDTRIRAGGMVEKGSVQRSSDSLDVRFVVTDFNKSVPITYRGILPDLFREGQGIVALGKLNADGVVVADEVLAKHDEKYMPPEVTKALKESGQAASGGEARP
>tr|A0A495JIB9|A0A495JIB9_9ACTN UDP-N-acetylglucosamine 1-carboxyvinyltransferase OS=Micromonospora pisi OX=589240 GN=murA PE=3 SV=1
MPADLSAGVTAGVAADSTMADVDVIRVSGGARLAGEVHVVGAKNSALKLMAVALLAPGRSVITNVPRITDIAIMGEVLRRLGCEVSFGEDNGTSTGTIDGIPVVGVGDGVPAEVPPVDGAGPVRDVATTPSGEAQAAVDLGAAPGRARTVTIDVPAEPGTDADYDLVRRLRASICVLGPLLARRGYVRVAHPGGDAIGSRGLDMHVSGLARMGAEISGSHGFVIASAPNGLHGATIWLDFPSVGATENLVMAAVLAKGTTEIDNAAREPEIVDICAMLSAMGARIEGAGTSTIRIEGVSELRPVRHRTVGDRIVAGTWAFAAAMTQGDVTVTGASPGFLEIALDKVISAGGLVETRTDAFRVRMDRRPRAVDVVTLPFPGFATDLLPMAIGMASVSEGASLITENIFDGRFMFVNEMARLGADIKTDGHHAVVRGRERLSSAPVRATDIRAGAGLVIAGLCADGVTEISHVHHVDRGYPDFVADLRALGVEVERTTAPAEQAFTL
>tr|A0A1G3BE39|A0A1G3BE39_9BACT Uncharacterized protein (Fragment) OS=Planctomycetes bacterium RIFCSPHIGHO2_12_FULL_52_36 OX=1801980 GN=A3E19_05430 PE=4 SV=1
MGICLSRTIPVRDLFTGLFSGRGAVAIAGFVNKVGSKWYGTARLRRITAYCLLALFLCGLYSAEGVLGAQSVENPYPLFKHDAQHTGRSTFLGAQKANVKWSYPTEDHIISSPTVGGDGTVYVGGMDGNLYAIRPDGHTKWFYPAQSAIFSSPAIAQDGTVYFGCRDKVLFAVGPDMKEKWKFRMGGEILSSPTVGPDGTVYVGNWDGKLYAINQEGALRWTYQTGDSIVASSPAIAHDGTVYVGSRDRQLHAIDPASGKKRWGFQAGDKVDTTPCVGPDGTVYFGANDGILYALSPQGDPKWKFETGSWIYSSPSLGADGTVYFGAKDGKVYAVSPQGQKKWAFQTGDSVSSSPTLGSDGTVYVGSWDGKFYALGPDGQLKWSYDAGASIASSPAIDAEGTVYVGCDSG
>tr|A0A552XCD5|A0A552XCD5_9LACT Carbohydrate ABC transporter permease OS=Lactococcus lactis OX=1358 GN=FNJ55_12300 PE=3 SV=1
MKDSIGYKIFKVINAIILILIVIATVYPFWNVVVQSFSSENAITAGNVVLTPVGFNLETYKYVMSDPIFWINYKNTIIYTVVGTAISLFLTTTLAYVTSKKYLPGRKFFIGLSVFTMFFAGGLIPNYLLIKSLGWMNTMWAVTVPGALSIFNMLIMKSFFESMPDALEEAAIIDGATPFQILMRIILPLSKPILATMVLFYAVGAWNAWFGAFLYMDNKNLFPVSVYLRNLVKGATGAEAQSADEQSQVSSNIKAVTMVLTVLPVLIVYPFCQKYFVNGIMIGSVKG
>tr|X6GFZ8|X6GFZ8_9HYPH Oxidoreductase OS=Mesorhizobium sp. L48C026A00 OX=1287182 GN=X737_09625 PE=4 SV=1
MILQGRIAIVTGAGSGIGQAGSEAMAREGATVIVTDRDLDAARGTVDSIAAAGGRGEAIRVDVTDDAAVVGVIQDVADRHGRIDILHNHAGVQVAGSVEEIDGAGFDHSWAVNVHAQFVACQAVLPVMKRQRGGVILNTSSNSGVFLDRAMTAYITSKAASITMTRQIALDVARYGIRINSLCPGWVDTPFNDPYTDQLGGRKALEHAIANIVPMGRFATTDEIAEVILFMVSDKSSYMTGHALVADGGESLAGGTNSGQSITR
>tr|A0A368JR03|A0A368JR03_9BACT Serine hydroxymethyltransferase OS=Larkinella punicea OX=2315727 GN=glyA PE=3 SV=1
MSTLVTPITRDTQVFELIAKEQHRQESGIELIASENFVSKQVMEAAGTVLTNKYAEGLPGKRYYGGCEVVDEIEQLAIDRVKELFGASWANVQPHSGAQANTAVFVACLKPGDTILGFDLSHGGHLTHGSAVNISGKYFRPTFYGVEQETGVINYDKVEETAQRERPKLLICGASAYSRDWDYVRLRAIADSVGALLLADISHPAGLIAKGLLNDPMDHCHIVTTTTHKTLRGPRGGMIMLRNDFENPFGIKTPKGDLRMMSSLLDSGVFPGTQGGPLEHIIAAKAIAFGEALSDEFGDYANQIQRNAQAMAAAFVSRGYKIISGGTDNHLMLIDLRSKGLSGKLAENTLIKADITINKNMVPFDDKSPMVTSGMRVGTAAVTTRGMKESDMEQIVVYIDDVLMNHDNDAKIQVVKEEINSWMKAFPLYN
>tr|A0A1M3KRH6|A0A1M3KRH6_9HYPH Uncharacterized protein OS=Devosia sp. 66-22 OX=1895753 GN=BGO81_01360 PE=4 SV=1
MVEVKQLLSFPLPRNPAIVSPGLREILMSGSSLSGLPSLYDGKDMFRSAGNRMLWPKPLPAPLYGGATKGRIFSYVAGVIFVPNTVKGVVKNIKKDFWDDSIGKVIKAQMLGIDFQAMTAPPWAGEPPEDISDAVEAVFDAIESGTGKVDENLLYATYWSYRWFSMQKRGAVFLPLTDLVEVSVQQTKGGFLEHFKYEVGEHIGLTFETASGQRSTYYATMSYPDEDERLLRFVPPADRKKEYQSRKLSTEEATALIFADQRIRADIRAVMRTLLDEHLGPGVLPAAYAELSKTRTQDWSRGLDVYYEALRSTDYNVWHAHGDVLARMGSTCVAFRALPFARHGFTNPIDSIERGEPMTWVSIT
>tr|A0A271J2M4|A0A271J2M4_9BACT Uncharacterized protein OS=Rubrivirga marina OX=1196024 GN=BSZ37_13095 PE=4 SV=1
MGALADRVIVAAERQTGCEMPYLRTLADASGGAFARWMLAMPAAQFRQRAPRDAWHLARLGATVAQDCGTCVQIVVTVAQRDGMSVTTLRQALDDPGALYDDARAAYAFGFSISSQADDVADRVAEVEALFGHEAHVELAMAVATCQLFPVLKRGLGQSLACSLVTIEME
>tr|A0A368CC63|A0A368CC63_9GAMM Phosphoribosylformylglycinamidine cyclo-ligase OS=Candidatus Thioglobus sp. OX=2026721 GN=purM PE=3 SV=1
MGLTYKDSGVDIDAGNALVTRIKQAVKSTHRDEVLSDLGGFGGLFELASHKYKQPVLVSGTDGVGTKLKLAQQMNEHSSIGIDLVAMCVNDVIVQGAEPLFFLDYFATGKLDVDVSEDVITGIAHGCRLAGAALIGGETAEMPGMYNDGEYDLAGFCVAVAEKSDIITGQGIQQDDLIIGLHSSGIHANGFSLVNKLLAENNSTLTQDFNGTSLGATLLTPTTIYAKPVLQMLSAFPIKGLCHVTGGGITENLPRILPANIRADINTHAWQRLPIFDWIQTQGNVAEQEMLRVFNCGIGMIIVVTAEHQTAVEQIAKTHNIASNVIGKMSTTDATSHVNYL
>tr|A0A1T1IFK7|A0A1T1IFK7_9PSED Gamma-glutamyltransferase OS=Pseudomonas sp. MF4836 OX=1960827 GN=MF4836_00365 PE=4 SV=1
MLKFSAHEYPYPSQRQSVFARRGMVAASQPLAAEAGIEIMRQGGNAIDAAIATAAALTVVEPTGCGLGGDAFALVWTQGQLHGLNANGHAPAALSIEAVQAAGHQQMPLYGWEPVTVPGCPSAWAELSRRFGKLPFADLLQPAISLARDGFPLSPVVAHQWQIALDEFSPHRSALLEPWFDTFLIDGRAPRAGELFRNPAQARTLEELATSACESLYRGPLAQRMDAHSRATGGYLRATDLADYRAQWVEPIHINYRGVDVWEIPPSGQGLVALMALKILEGFDFDHRDSQQTWHRQLEAMKLAYSDGLHYITDPQHMRVAVADLLSDAYSARRREQIGEQAQPPKPGDPHASGTVYLATADAEGNMVSFIQSNYHGFGSGVVLPDSGIALQNRGQEFSLDPSHANCLAPGKKTFHTIIPGFLSQGGEALGPFGVMGGYMQPQGHVQMVMNLVDFGLNPQAALDAPRWQWLGEMKVGIEQGASRDLANALARRGHQVEIASDLTDYGRGQIILRDPDSGVLCGGTEPRADSHIAVW
>tr|A0A3M3ZGU4|A0A3M3ZGU4_9PSED Uncharacterized protein OS=Pseudomonas syringae pv. tagetis OX=129140 GN=ALQ32_04322 PE=4 SV=1
MFSLKKIALVTAAAAMLGSGPVLAQPDLPAQLDEARQEGSIWTAFALNKHLSPFKIDVDVEQGTAILKGKVENEVDRELAERIALDTKGIEKVDNQLEIDPAVASDPGTRTNMAQRFEDATLVATVKSKLLWSSVTEALSIDVDSKDGVITLKGRAQSPEAKELAGSLASNTDGVVSVNNLISLSAADSIAAKTQPQSVIPTEEMSDAWITSKVKASLIYSRTLDGLNIKVDTNAGVVSLNGVVANFAEKELAVEIARNIRGVKGVNGDALKVMARSAG
>tr|A0A4R8QWY5|A0A4R8QWY5_COLTR Short-chain dehydrogenase chyC OS=Colletotrichum trifolii OX=5466 GN=chyC-1 PE=4 SV=1
MARIFITGSSDGLGAIAAQKLVENGHQVTLHARNAQRAEDASKAVPGAEGVLVGDLSKLADVKKLAQEANSLGTFDAVIHNAGLFRGPFRKTDFGLPIMPSLTAVNVGAPYVLTALLNRPKRIVYISSGLHRGGDATFNDPTWVERGEARWNEDQAYSDSKLHVSTLASAVARLWPDVKSNSVDPGWVPTKMGGASASGSAEDGVATYVMLAEGADGGHVSGKYFKPGKQEDTPQPFTQDEKRQDQLLSLWGELTGVKFPAA
>tr|L0HHT0|L0HHT0_METFS 2-oxoacid:ferredoxin oxidoreductase, alpha subunit OS=Methanoregula formicica (strain DSM 22288 / NBRC 105244 / SMSP) OX=593750 GN=Metfor_2322 PE=4 SV=1
MTRTEFWQGNTACAEGALAAGCNFFGGYPITPSTEVAELMAAKLPKKGGVFIQMEDEIASMASIIGASWTGARAMTATSGPGFSLMMENIGFAAMTETPCVVVNVQRGGPSTGQPTMSAQGDMMQVRFGSHGDYAVIALSPATVQEMFELTAKAFNLADKYRTPVFLMADETVGHMREKILVPDSVEKIGRKPFVPGTPPFKVTDPDLIPGFPTFGTGQHVHVTGLTHDERGYPAATNPPLHAALVKRLVDKIENARDEMADYDIVNPDAEQVFVAYGGPVRTVMQVMHDKKDTNIGFLRIRTVWPFPEKALAKFKNAQRFLVPEMNLGQIAREIQRHVKVPVVPIPKLGGELHTPAELVKVLEGKA
>tr|A0A0G0BS17|A0A0G0BS17_9BACT Sortase OS=Candidatus Roizmanbacteria bacterium GW2011_GWA2_35_19 OX=1618478 GN=UR68_C0020G0028 PE=4 SV=1
MIVRTFYNPLVEETKYFVNKAANKQYIVADNFEANKIQPTIQENQSASKGILAKAFNIKPIEILSPEDPDFSIIIPKIGANSKVVPNVDTSDEKIYLDVLNRGVAQAAGTAYPGEGGHIFLFAHSTDYFWNVTTYNAIFYLLYKLEKNDEVDLFYKGQRYVYKVIGSEVVDPSQVQYLTRKTNREFLTLQTCWPLGTTLKRLLIFAVRVSE
>tr|A0A2S7ULD4|A0A2S7ULD4_9VIBR Probable membrane transporter protein OS=Vibrio jasicida OX=766224 GN=BTO01_24490 PE=3 SV=1
MEMIEPTMLLVLALVAFVAGFIDAVAGGGGMLTVPALLSLGLPPHIALGTNKLAASFASSTAAYTYYKKRLFKPQCWGRAFVATLVGATLGTLFVDAISTEWLEKALPLIILAAAMYTVFHKPPQSTHQSPTPEPCPMLNKKQYMQGLSIGFYDGLAGPGTGAFWTVSSMALYRLNILLASGLAKAMNFTSNFTSLVTFAVLGHINWVLGLTMGVCLMAGAFVGAHSAIHFGAKFIRPVFVTVVSVLAIKLAYDAWFVGLT
>tr|A0A5E7K8T9|A0A5E7K8T9_PSEFL Uncharacterized protein OS=Pseudomonas fluorescens OX=294 GN=PS874_02483 PE=4 SV=1
MRQPDIEIYLKDADVDYKAIAAWLGAALGPCTDWVQKGQTYKCKAGNVPVTWLPKAVGKWNSLFLESDQTPWEDDIACARAAFVALNVEVRCAPGTWVEEEGEETADRWMRISADGEEEITWKTA
>tr|A0A0H4KSG7|A0A0H4KSG7_9RHOB Transcriptional regulator OS=Marinovum algicola DG 898 OX=988812 GN=MALG_01290 PE=3 SV=1
MSGAARELGIAQPALSKQMSQLEHELDAQLFQRHSRGVTLTRAGEKLRQEAAELIRRMEAIRQAIHTEAEDVTGKVVVAVISSLAPTLATELYPRLEQEYPGISLHIVDFPSERAGQALLNEEADLAVMPNAATEFPQLRSRPLFEESFHFLTKATPRAPARTIRLSEAAEHPLVLPFRSHDLRRRIEEAAGSIGVTLNVKYQTGSINVIDAMVERGMVASIVPMTHWLDRIASGQVSARLVTEPGVSRVHSLCHRPVRDLAPAAKVVHDVIMTEVQSLVAAGKLSGKPVRA
>tr|A0A7W0EWG2|A0A7W0EWG2_9DELT Uracil-DNA glycosylase OS=Desulfobacteraceae bacterium OX=2049433 GN=FP816_06960 PE=4 SV=1
METCIHCKYYFITWDSKRPHGCKAMGFKSREVPCVVVRKSSQGLDCLQFKRKDDKSK
>tr|A0A174QDC4|A0A174QDC4_BACT4 RteC protein OS=Bacteroides thetaiotaomicron OX=818 GN=ERS852557_01330 PE=4 SV=1
MKELLENILSEIDVEIDEIDLYGYDIVENSLSMVHRLQAVLNDLKTKLQTYSFPAKEDEITFFKTQKPEILGRLLFFYKIYRIETQCPNGSDDVIRSYINRELDNLTYFFNRNLDFYQYYRSHSTLYDEYYFVRGKSDLRLCTDSAQFDKDPNFSTGYDYKVAKIIANEMLRIYLNKRLVKLETNTQVEDNLQKCLKYPFRFTGKKVFLIELGYSLVSSGDINNGNVEIKEMMNFLGTVFQVELGDYYAAYIAMKERKKDRTAYLSRLQDSLVKRMDEDDSK
>tr|A0A6B0Z2B0|A0A6B0Z2B0_9CHLR LLM class flavin-dependent oxidoreductase OS=Caldilineaceae bacterium SB0664_bin_27 OX=2605260 GN=F4Y42_21435 PE=4 SV=1
MKFGAQVNCYLTTWDNIRAVIEAMEAGRWDSLWFADHYMPSSPKREEELLPAYEGYTLIAAAASITERMRLGNLVLGNTYRNPALVAKMAGTVDQISHGRFTLSIGAAWFQREHEAYGFDFPPMKERSDRLEEACALLRALFTADGPVDFEGRYYRLDQAPLSPGGYNNRQIPIMVGGTGERRTLRTLARYGDIMNLDGWAGGPMTQEYYFHKVGVLERHCENVGRDPSEIKRTILMPVKVTDDPAEAEAFIASRSLGEGTAAGPKDYVIERIGQFMDVGVDEIMFAGLLTRDVEQYHYFEEEILSAFD
>tr|A0A5K1GDA5|A0A5K1GDA5_9MAGN Uncharacterized protein (Fragment) OS=Nymphaea colorata OX=210225 GN=NYM_LOCUS28356 PE=4 SV=1
IVWAGRGADRKGETERGGVQTKKGKTAVGVREEREQVG
>tr|A0A3A8NX55|A0A3A8NX55_9DELT Uncharacterized protein OS=Corallococcus llansteffanensis OX=2316731 GN=D7V93_32740 PE=4 SV=1
MRRSSLQRRLQRGQAMAEYGVITAAFFGFTVLSWPFLIQLLRALNTYFQSIYYIIQSPIP
>tr|Q8X4F5|Q8X4F5_ECO57 Uncharacterized protein OS=Escherichia coli O157:H7 OX=83334 GN=Z5883 PE=4 SV=1
MQPDKLGAKKWMS
>tr|A0A4W6DJV8|A0A4W6DJV8_LATCA Uncharacterized protein OS=Lates calcarifer OX=8187 PE=4 SV=1
IAAHEGSANVVELLLKHGSDPLISDHQGQTPLSLASRQGHVKVLSVLLEWAKSQKPEIAAQMMEHVDSEGWTALRSAAWGGHSEAVRLLLDAGADVDGCDGEGRTALRAAAWGGHEEIVLTLLNYGAEVNKADSKGRTPLIAAAYMGHHEAVEILLDRNAEVDLADGDGRSALSVAALCVPTAAGVKGYGEVASLLLERGADPGHRDHDGMTPLLLAAYEGHDEVVELLLEAGADVDETAGPDGNVPAAAAVTPLLAAAAMGHMKTVSRLLFWGAAVDAIDCEGRTALCLAAARGSTEVVRALLDRGLDENHKDDLGWTPLHAAACEGHRAVCAALTERGSMARVGEMDIEGRTPLILAAQEGHWSTVRLLLDRRSPIDHRAYDGHSALSATLLERPC
>tr|A0A2V8IIA6|A0A2V8IIA6_9BACT OmpA-like domain-containing protein OS=Acidobacteria bacterium OX=1978231 GN=DMF84_27170 PE=4 SV=1
MNAVSEFIVALAVAATACIGATHSVSDADVRPQDAIDLILTAFQNYPLVALSDGAGHGQLETRDFFIGLIRDRRFPQTVRNIVIEFGNARYQSVMDRYVSGEAVTREELRHAWEDTTQVTGVWSLPMYEHMLAEVRAVNRPLPPALRIRVLLGDPPIDWSTVTSPADEDMNDWRDAHFAHVIEREIMNRTANALLFFGGAHLGRKVIFPNSLIHLLDARFPGRTFVLAALDAGRTDSRITKRLQGWTVPAGVSVRGTWLGKMDVQDIGFGFSRGVVEDDVDVVLLLSSAPPRQDEPPALTSSYGRELARRRALHQATLPFRGAKIRFEESRAAFATDADEPLQAVVSELFRDRGVRLLVKAFADPTESNAVALSTLRAELLVDWLAARGVERHRLVPKGCGALRPLTFGKTAADRAMNRRAELVRLTPTAGCEPTTATSPPHSGPPRRSSD
>tr|A0A140H1J1|A0A140H1J1_9VIRU Nonstructural protein (Fragment) OS=Mamastrovirus 1 OX=1239565 PE=4 SV=1
TAKQLRDSGLPARLTEEQLHRIWRGGPKKCDG
>tr|A0A0C3DQN5|A0A0C3DQN5_9AGAM Uncharacterized protein (Fragment) OS=Scleroderma citrinum Foug A OX=1036808 GN=SCLCIDRAFT_63544 PE=4 SV=1
AARKTTHKNVLYEVDSEDTVAWLRSPEGQRLFASKFGTEISLAYRPFSVLIEYVPIALELENPNVHRDIERRNNLPTRSIRSARWIKP
>tr|A0A534C027|A0A534C027_9GAMM Homoserine kinase OS=Gammaproteobacteria bacterium OX=1913989 GN=thrB PE=3 SV=1
MSAAPPRTRASAFAPASVGNVAIGFDILGFAVEALGDRVTVTSTAAPGVTISAVRGIADELPQRAEDNTAGRALLAMQEALQPKFGFTLEIDKGIPLGSGLGGSAASAVAAVVAANALLAEPCGQLELLRFAMAGEAVASGGRHVDNIAASLYGGLVLTVGIDHPRVKRIPVPASVRAVIVHPHMYLATANARAILRRSVELSDFVWQTAHLAGFISGCYTDDLDMIRASLEDVVIEPQRQALIPGFADVRRGAMAAGALGCSISGAGPSMFAWALEATAPKVLAAMREAFARHSLATDEWVVELRSNGARVIG
>tr|A0A1N6JS24|A0A1N6JS24_9RHOB Ribosomal RNA small subunit methyltransferase E OS=Rhodovulum sp. ES.010 OX=1882821 GN=SAMN05444722_2370 PE=3 SV=1
MTPMSDSRSAKIRLYVEQPLGEGQTVPLSRDQAHYLFSVMRLAAGDRVLVFDGRSGEWLARVAEAGKKGGTLVCEAQTRPLQPPPDLWLFFAPIKKARTDFIVEKAAEMGAARICPVQTDFTNAERIRRDRLQAHAVEAAEQCGGTFVPEVCEMRKLSEVLEGWPHGRRLMFCDEMLAGAGRALGDAAPGPWAILIGPEGGFSEAERDRLRALPFAHPVSLGPRVLRADTAAVAALTVWQQALGDWA
>tr|A0A6G5A2B5|A0A6G5A2B5_RHIMP Putative secreted protein OS=Rhipicephalus microplus OX=6941 PE=4 SV=1
MNFEKFAILLMFRHLSVCVALHIKIYTLDHFKGCRNDIYFCKFNTNLCFTREYIIYIELPPRLSTADRKRTSLHRGFLGSLLNAPKPAC
>tr|Q3ZH33|Q3ZH33_9NEOB Rhodopsin (Fragment) OS=Exerodonta chimalapa OX=318317 PE=4 SV=1
NFYVPMSNKTGVVRSPFEYPQYYLAEPWKYSVLAAYMFLLILLGFPINFMTLYVTLQHKKLRTPLNYILLNLAFSNHFMVLCGFTVTMYSSMHGYFVFGQTGCYI
>tr|A0A5F2E027|A0A5F2E027_9LEPT DUF962 domain-containing protein OS=Leptospira licerasiae OX=447106 GN=EHR05_01230 PE=4 SV=1
MTENKKYETLQEFWPFYLREHSNKMNRVFHFIGTTCALVFIVSAIFYLNAWYLLGALFSGYLFAWIGHFFLEKNRPATFIYPFKSFVSDWRMYFYTITGQLGKELEKAGVK
>tr|A0A1H1IN95|A0A1H1IN95_9EURY DNA-binding protein SAMN04489842_3657 OS=Natronobacterium texcoconense OX=1095778 GN=SAMN04489842_3657 PE=3 SV=1
MSERPDEEKLEELRQKKMEQLQERADGQDAEAQEAAQQQAEAQKKAVLRQHLTDDARKRLNTVKMSKPQFGEQVERQVISLARSGRIQGKIDDDKMKQLLKELKPDSKSFDIQRR
>tr|A0A7M3A1Y5|A0A7M3A1Y5_PSEAI Cold shock-like protein CspD OS=Pseudomonas aeruginosa OX=287 GN=cspD PE=4 SV=1
MLSGKVKWFNNAKGYGFILAEGRDEDLFAHYSAIQMDGYKTLKAGQPVNFEIIQGPKGLHAINISPATATTAAPSAPAPQEEPQATPVEA
>tr|A0A2Z6N5H4|A0A2Z6N5H4_TRISU Uncharacterized protein OS=Trifolium subterraneum OX=3900 GN=TSUD_214070 PE=4 SV=1
MKKLVIQVKRMNLTGFYITLFSNTYSHINRVLFYRERILSRESPSTVVHKIPESFQSATDYKNSFIPLLFEETRADLFSSLYGVSQAPFCEIANVSESRRLTTPFPEVQNQFIQFHHVLWLKSETTGNYKPVSGDLIALTHIRPKGLSELNTLESPYRIAYVKEARKEWKELPDRISVLTSKCMKMDIENDLGNNKELSSKCMKMEIRYDLWNNKELKLYAVHLMNMTTNVRIWDALNTISRVKIMKTMLGPSQIVAIRLHRLVMDSLEHDMYGLGDIVLFGHNKRMKLGSHTGLDNVFLDNRVEKLMQCFNPNTGWKTNLQYMIELLESMKESANNTESMKAFKEEFGKQREKLTFLMQILYTHISTSLISPEMVKEMLQALDLLRRLGISLSQAKFKIPANFQLLQISVILDEVCLKGL
>tr|A0A832LQC9|A0A832LQC9_9BACT S1 RNA-binding domain-containing protein OS=Phycisphaerae bacterium OX=2026778 GN=ENS20_04560 PE=4 SV=1
MIPTSYSQEAWPMSESSNDPLKEKFRPEEDPQVKKEVDAALAGVDVEQLLGGDQAAAARAVADGSSRERRGKVVGIGADDVIIDLGEKAQGIAPLSQFDQVRIGEEMDFILDRFDEAEGLWILTRKGAVSQNVTWETLEPGQIVECEATAMNKGGLEVKVKTLRGFLPSGQVDVVYLKDISIFLGQRFKVQVMQVDREKKNLIVSRKKIVEREREELRAKLLAELAEGQVRRGVIRSVTDYGAFVDLGGADGLIHVSEMSHRRIRHPSEVVKIDDIVEVKVLKIDPETRKISLSLKAVGADPWADAAARYAPGTEVTARVAKIESFGAFLSVEDGIDGLLPVSEISWQRIRHPADVLKEGETIKVVSIAVEPQQRKLTFSLRQAVPDPWGVVADKYPRGTVTTGKVTKVLDFGAFVELENGVEGLVHISELAARHVKNPAEAVQAGQQVKVRVLEVDREKRRISLSIRRSEEPKPPEPPSPEELKRREEEAKRLARKKEQRSKLRGGLDF
>tr|A0A1J0GQZ4|A0A1J0GQZ4_9CAUD Uncharacterized protein OS=Mycobacterium phage Albee OX=1913041 GN=SEA_ALBEE_18 PE=4 SV=1
MSASDRQPPGPYPEGFTEAVRPEDVDVSKCDHEFGVCFCVHDWRIHWGNLDRSGL
>tr|A0A3B9GZ83|A0A3B9GZ83_9PROT Aminodeoxychorismate/anthranilate synthase component II OS=Hyphomonas adhaerens OX=81029 GN=DCG58_11365 PE=4 SV=1
MILVLNNRDSFVFNLARCLTLAGADVEVEDSGRITINDIIRRRPEAIVISPGPSRPEQAGVSIAAVQTFGADLPILGVCLGHQVIAAAYGGSVRRSLTPSHGRTANIMHQGRHLFRGLPSPLPVGLYHSLTVDLEPNETGLQVDATAPDGEIMALSHVEHPVFGVQFHPESILTEQGQGLLGNFLRQYRSVPCL
>tr|A0A349TMC4|A0A349TMC4_9GAMM UvrABC system protein B OS=Gammaproteobacteria bacterium OX=1913989 GN=uvrB PE=3 SV=1
MSKPFQLESSFKPAGDQPAAIASLVEGLEDGLHAQTLLGVTGSGKTFTIANVIEQVQRPTLVMAPNKTLAAQLYGEFKEFFPHNAVEYFVSYYDYYQPEAYVPASDVYIEKDASINDHIEQMRLSATKALLERQDVIVVATVSAIYGLGDPNSYLQMVVHLDRGDRMDQRKLLRRLTDLQYTRNDMELRRATYRVRGDVIDIYPAESERHAIRIELFDDEVEKLSYFDPLTGALIKEVPRLTVFPKSHYVTPREKLLATLDDIKIELHERLKQLTSNNRLVEAQRLEQRTKFDLEMIQELGYCNGIENYSRYLSGRESGEPPPTLYDYLPDDALVVSDESHVSIPQLGAMYKGDRSRKETLVEYGFRLPSALDNRPLRFEEWESLTPQIIFVSATPGPYEEEHEGQQVRQVVRPTGLIDPELEVRPASTQVDDLLSEVNRVVALKERVLVTVLTKRMAEDLTDYLAEHDVRVRYLHSDIDTVERSEILRDLRLGNFDVLVGINLLREGLDIPEVSLVAILDADKEGFLRSERSLIQTMGRAARNLNGKAILYADTVTGSMQRAMDESNRRRETQLAYNEAHNITPIGVQKRVLDIMEGAYSAPGSRTRQRTRSVAEPQGDYGTLNFNDPYEIRKEITKLEAAMYEQAKNLAFEEAAATRDSIADLKQQLLRQ
>tr|A0A0Q7TC29|A0A0Q7TC29_9HYPH Protein-export protein SecB OS=Pseudolabrys sp. Root1462 OX=1736466 GN=secB PE=3 SV=1
MTTTNGGQSQDFNPEQVPQLNVVAQYIKDFSFENPNAPKSLIGGEQPQISIQINVNAAPMSDSDIEVVLQLSGKAETGGSLMFSFDLAFGGVFRIRNVPQESMNAVVLIECPRLLFPFAREIIATTVRNGGFPPLLLDPVDFVALYRQKMAQLGGQAPAQ
>tr|A0A1H8PJE2|A0A1H8PJE2_9PSED Ca-activated chloride channel family protein OS=Pseudomonas sp. NFACC39-1 OX=1566195 GN=SAMN03159293_02848 PE=4 SV=1
MFEFAWPWIFALLPLPWLMRLVLPAADSGEPALRVSFLGDLEGLVGRRARSNLPTWRQQAPFILLWLLLLIAAARPQWLGEPLPIAASGRDLLVAVDVSGSMDFPDMRWQDEDISRLALVQHLLGDFLESREGDRVGLILFGSQAYLQAPLTFDRRTVRLWLDEARIGIAGKNTAIGDAIGLALKRLRQRPANSRVLILVTDGANNGGEIDPLTAARLAAEEGVKIYPIGIGADPEESGTAGFVGVNPSLDLDEATLREIAQATGGQYFRAQDGQQLLAIKTTLDQLEPVTQQPTQARPAQALYQWPLAVALLLSVLLVARERWPDNPLQRLFTQPLFQPAEHSEWRRRLKRMRLGKRR
>tr|A0A1C3Z1D9|A0A1C3Z1D9_9LACO Citrate lyase alpha chain OS=Lactobacillus apis OX=303541 GN=GA0061073_0264 PE=4 SV=1
MENKVKRNLPDELMSDMKLKPFESVEVGNPEIKRIAPKVHVTTGENKVVDSLEEVIKKTLKDGMTISFHHHFRNGDFAFNKVMDLIIKLGYQNLTLAPSSLTSVMNDKVIEAIQKGVITNITSSGMRGTLGDFVSHGGLKNPVVFRSHGNRARSIEEGEIKVDVAFLGVPNSDPAGNANGQEGDAVFGSLGYALIDAQYADNVVLLTDNIIDYPNTPASIKQTQVDYVVKVDQIGDADKIGSGATRFTKDPKELKIAEMVNQVIVNSPYYKEGFSFQTGSGGAALAVTRYLRQSMINDGITASFALGGITKPTTDLLDEGLVKKIMDVQDFDKGAAASMAKNRNQQEIDASWYADPHNKGAVVNNLDVAILSALQIDTDFNVNVMTGSDGVIRGAIGGHQDAANAKMTIITAPLVRGRNATVVPSVETVVTPGDSIDVLVTERGIAINPKRKDLIEAFSKVPDLNIVDITELQQMAEKQVGVPKPLEYTDRTVALIQYRDGTIIDTIKQVKD
>tr|A0A3S0XSH9|A0A3S0XSH9_9GAMM 10 kDa chaperonin OS=Legionella sp. km772 OX=2498111 GN=groS PE=3 SV=1
MKIRPLHDRVVVRRMEEERTTAGGIVIPDSATEKPMRGEVIAVGAGKVLDNGDLRALAVKVGDVVMFGKYSGTEVKVEGKELVVMREDDIMGVIEK
>tr|A0A5S9Q0P4|A0A5S9Q0P4_9GAMM ATP synthase subunit delta OS=Zhongshania aliphaticivorans OX=1470434 GN=atpH PE=3 SV=1
MAELSTTARPYAKAAFEHALAASTLGEWSAMLVTAAAVSQQPEVMKFLSSPAMTTAQQAQMFIDVCADTFNAGGENFIKILAENKRLGLLPTISELFDAQKAIQERTVDVELTTAFALDSESEKRLAEVLGKKLAREVHVHTTIDPLLLGGVIVKAGDLVIDGSVRGRLAKLAEAINS
>tr|A0A1H7GQD5|A0A1H7GQD5_RUMAL Uncharacterized protein OS=Ruminococcus albus OX=1264 GN=SAMN05216469_102219 PE=4 SV=1
MKKFTMTNLYSYNELYLSLYLESEETLFVVHTERSECAGTPVTSISG
>tr|A0A699MW03|A0A699MW03_TANCI Reverse transcriptase Ty1/copia-type domain-containing protein (Fragment) OS=Tanacetum cinerariifolium OX=118510 GN=Tci_766510 PE=4 SV=1
MQEELHEFERLEVWELVPRPDKEEGIDFEELFALVSRLEAIRIFLAYAAHKNMVVYQMDVKTAFLNGNLWEDVYVSQPNGFVDPDNANHVYKLKKALYGLKQAPHAWYDMLSLFLLSXELVPRPDQVMVITLKWIYKVKLDEERQRLTSGLQISQNPRSIFINQSKYALESLKKYGFESCDPVDTPMVEKSKLDEDKEGKVVDPSHYRGMIGTLLYLTASRPDLQFAIC
>tr|A0A1C4LAA2|A0A1C4LAA2_9ACTN Uncharacterized protein OS=Streptomyces sp. BvitLS-983 OX=1838282 GN=GA0115250_119211 PE=4 SV=1
MTLFLGLGIAGIVLLVLSLIFDGVLEGFFGDFLDGLLSLPAIAGFVSMLGFGGAIVLGTTGLGVAGATVVGVLAGVVTGWVVLKLSKALMRDQTDATPRSADLVGTAGSVVTAIPASGYGEVLVYLGGQPLKLSAKSTAPLTRGTEIWVEASLSSTSVSVRPVER
>tr|T2KLF8|T2KLF8_FORAG Uncharacterized protein OS=Formosa agariphila (strain DSM 15362 / KCTC 12365 / LMG 23005 / KMM 3901) OX=1347342 GN=BN863_18780 PE=4 SV=1
MFKVKLAFMIKVLINNTATKNIHDKKNYIYLTKHQLYGVLPRFC
>tr|E3RGL9|E3RGL9_PYRTT Uncharacterized protein (Fragment) OS=Pyrenophora teres f. teres (strain 0-1) OX=861557 GN=PTT_06956 PE=4 SV=1
MLKDVIANNPDKTLTQCLDIVIDKLQLLHQAMTQQNGPSERALANQLISACQGVEACSAVLIRPASTFEA
>tr|A0A7J6B8G4|A0A7J6B8G4_AMEME Sodium/hydrogen exchanger OS=Ameiurus melas OX=219545 GN=AMELA_G00035750 PE=3 SV=1
MGSERKHHAAKGAWGTLRLCVLASLSVCLCLCRAEDSSMENIVTEKKAEESHRQDSVDLLVFILLLTLTILTIWLFKHRRFRFLHETGLAMIYGLLVGVVLRYGIHVPRDINNVTLSCHINASPATLLVNVSGRFYEYTLKGKISSNDVKDVQDNEMLRKVTFDPEVFFNILLPPIIFHAGYSLKRRHFFRNMGSILAYAFVGTVVSCFIIGLLMYGCVMLMKYTGQLGGDFFFTDCLFFGAIVSATDPVTVLAIFNELQVDVNLYALLFGESVLNDAVAVVLSSSIIAYQPEGNNSHTFEAMAMLNSLGIFLGVFSGSFALGVATGVMTALVTKFTKLRDFQLLETALFFLMSWSTFLLAEACGFTGVVAVLFCGITQAHYTYNNLSPESQVRTKQLFELLNFLAENFIFSYMGLALFTFQNHVFNPVFIVGAFLAIFLGRAANIYPLSFLLNLGRRNKISYNFQHMMMFAGLRGAMTFALSIRDTATYARQMMFSTTLLVVFFTVWICGGGTTQMLSFQHIRVGVDPDQDNSIGPEGLERRSTKQESAWLFRIWYNFDHNYLKPILTHSGPPLTATLPACCSPLARCLTSPQACENEGQLKDDDSDLILNDGDISLTYGDITVNTDATGTRTISIPAGAAGVHSDDALDRELTFGDHELVIRGTRLVLPMDDSEPPLRHREI
>tr|A0A1I5AAM2|A0A1I5AAM2_9MICO VOC domain-containing protein OS=Mycetocola miduiensis OX=995034 GN=SAMN05216219_1297 PE=4 SV=1
MFTPVHAFSGFSVDDIDAARSFYSEKLGLTVADDDMGILRITLPGGAEVIAYPKPDHTPATFTILNFVVSDVDAAVDELNGRGVTTKIYEDENLPTDEKGVMRDNGPTIAWFRDPAGNVLSVISQ
>tr|V4K2D3|V4K2D3_9CREN Uncharacterized protein OS=uncultured Acidilobus sp. MG OX=1410573 GN=MGAcid_05220 PE=4 SV=1
MLSHTVELMKSSQGERPDGLPGRGYLLTCTPAPR
>tr|A0A1D6F6L1|A0A1D6F6L1_MAIZE Uncharacterized protein OS=Zea mays OX=4577 GN=ZEAMMB73_Zm00001d007456 PE=4 SV=1
MLEPVDIGRDGKTVSCRIHDMVLDLISFLSNEEHFLTKVGEQQPISLDLPKKIHRLSLQISQEEEVKQLATMSFSHVRSLTVSTKVFQLMPKLSAFLVLRVLNLKKCKGVRNHHFKDICNMFHLRYLSLNAEFITEMPREIQNLQFLQVLDISNLGHKVKMPTIIHLRQLLRLCFRPMWGIRLPDGFGKLTSLQEVKGIITIKLPSMLHNLGCLTNLRTLAIDFCDWDESYEEPFIQCLSNLVSLKSMEIKGTMVSSLCSECDKLYPGPQHLCSIDIESTAVPRWMSSLCFLSSINIELLALGAQDFHVLGSIPSLRCLSIHVKETRDERLVIGKCYPFRCLTEMQIDYESMAVVFAPGSMQNLKELHLVFGVKEVMHKYGDCNFGLEHLMSLEHVSVKTMYSIMPEEVEAVKDEFQKSLDMNPGKPTLIVDYKYPIKRKIRSHAQAIRAAILFANAGRIPATEGL
>tr|A0A6A9K9T2|A0A6A9K9T2_PSEAI Exodeoxyribonuclease III OS=Pseudomonas aeruginosa OX=287 GN=xth PE=3 SV=1
MDTLKIATFNVNGIQTRLAALLAWLEREAPDIVCLQELKTPDARFPAAALERAGYGAIWQGQSAWNGVAILARDSQPLEVRRGLPGNASDPHSRYLEAAVDGLLVASLYLPNGNPQPGPKFDYKLAWFEHLIRHAAELMESGHPVVLAGDFNVVPSDFDIYDTRSWKKDALLQPESRECFERLLRQGWVDALRQRFPDRRLYTFWDYFRQHWQRDAGLRIDHLLLSASLADHLEDAGVDRWVRGEEHASDHAPAWVSLRLS
>tr|A0A024VDL3|A0A024VDL3_PLAFA Uncharacterized protein OS=Plasmodium falciparum Vietnam Oak-Knoll (FVO) OX=1036723 GN=PFFVO_00427 PE=4 SV=1
MAFMFKREGCYSKNRLNEVFRKNKSFVNQLMYDLTSFHYENYMKNKIHKNIMNNYNNIEKIQSMLNLINGEKENAYKIKTGYFYFRSGVPVITPHIEQTNEFAESNNYTYNFKNIKKKYLKEVYDSYKHKIGGTDPSVPHFYKHK
>tr|A0A1Z9W0I5|A0A1Z9W0I5_9GAMM Cysteine--tRNA ligase OS=Oceanospirillales bacterium TMED91 OX=1986769 GN=cysS PE=3 SV=1
MSLQIFDTLAREKRVFQPLEAEKIGMYVCGMTVYDHCHLGHGRVMVAFDAIVRYLRFRGFEVNYVRNITDVDDKIFXRAAERQIPFSALTAEMIDAMHADEAKLGCQLPNHEPRATANIDSMLRLXERLLERGAAYQGDSGDVYFRVGAFPEYGKLNNRNLDDMVAGARVAVAKDKEHPADFVLWKSAKAGEESWSSRFGPGRPGWHIECSAMSMDALGETFDIHGGGPDLKFPHHENEIAQSESATGCQFAQYWMHAGAVRVKDEKMSKSLGNFVTLAELFREFHPQVIRFFLLQSHYRSAISFSDDALVQAGAAYTRLVQALPDQLTSPSSDAIFQFQQFMDDDFNTPRAIALLFDLAAEGSEESGSSLLAIGKVLGLFATDKVTFLAEQQQLKAANSGLSDAAINALIAARKQARKDRDFFTADKIRDDLVAQGVVLEDAAGGTSWHRK
>tr|A0A4U5PX20|A0A4U5PX20_POPAL Eugenol O-methyltransferase family protein OS=Populus alba OX=43335 GN=D5086_0000167450 PE=3 SV=1
MASSIENHVSQVDEAKDENFGYAMQLALSSVLPMTLHTAIQLGIFEIITKAGPDVKLSAADIAAKLPTDNPDTPKMLDRILRLLASHQVLCCFVDGSERFYSLAPVSKYFVRNQNGVSLAPFMAMIQENVILQGWSQLKDAVLEGGVAFVRVHGVQAFEYPGLDPRFNQVFNTAMYNQTTIVNGHMLEKYDGFKNLKQLVDIGGGLGHTLKAVTSKYPQIKGINFDLPHVIEHAPAYPGVEHVGGDMFESVPKGDAIFLKWILHNWSDDHCLKLLKNCYKAIPEDGKVIVMESVLPITAKTSPAAKAISQLDVMMMMSQNPGGKERTEDEFMALATAAGFRGIKFETFVCHFWVMEFFK
>tr|A0A2T6GMZ3|A0A2T6GMZ3_9PSED Isocitrate lyase/phosphoenolpyruvate mutase family protein OS=Pseudomonas protegens OX=380021 GN=C5U62_08510 PE=4 SV=1
MDAQSLRANVFKALHERAGAFVIPNPWDAGSARMLVGLGFEALATTSAGNAFSLGRPDAEGAVSLEDTLNNVREIVGASSLPVAADLENGFSDSPEGCAQALLLAAASGVVGGSIEDASGRADEPIYDFNLAVERIEACVVAARSLPFPFTLTARAENLLHGRDDLPDTIRRLQAFAEAGADVLYAPGLRSAEEILQVVRAVAPRPVNVLMSGGLNLSVAQLAELGVKRISVGSALARAAYGAFYRAAEDIRDHGRFDFAERAMPFRQINQLFKQP
>tr|A0A7R9P3G8|A0A7R9P3G8_TIMCA (California timema) hypothetical protein OS=Timema californicum OX=61474 GN=TCMB3V08_LOCUS1220 PE=4 SV=1
MAGSEPASAWKESGKLFRENYLSSPDRDLNLDLFIAGSLAQHETSPLDNYATEATPEEIETSLDAALKAGYRHIDTAFAYKNEDAIGRVLKRWFDSGKIQRKDLFIVTKLPGTGNHAESVEKYIKLSLSALQMDYVDLYLIHSAVGKKDSDRGPAGSDHQAELDMNTDHVSVWKAMEAQVDAGRAKAIGLSNFNARQIKRIWSSARIKPANLQVELNVYFQQRELTAFCKALDITVCAYAPLGNPDFAKRISGKSDLKFSSPMEDPVVVKIAKKHNKTPAQVLLRWIIQRGIVVIPKSKTPSRIKANFEVFPSRVCIQRALLGVPREMEQL
>tr|A0A7K2SMN5|A0A7K2SMN5_9ACTN Gfo/Idh/MocA family oxidoreductase OS=Streptomyces sp. SID8350 OX=2690337 GN=GTY74_01910 PE=4 SV=1
MARSQEQGTEAQTGTPAPPSGQALGTLGVGMVGYAFMGAAHSQGWRTAGHVFDLPVRPALAAICGRDRAKVDAAAARHGWAAAETDWRALIARDDVQLVDICTPGDSHAEIAIAALEAGKHVLCEKPLANTVAEAEAMVRAAEAARARGQVAIVGFNYRKVPAITYARQLIADGRLGTLRHVRASYLQDWLVDPASPLTWRLKREHAGSGALGDLGAHIVDLAQYLAGELLTGVSAVAETFVRERPLLAGAPAGLSGRADTAELGEVTVDDAALFNGRLASGALASFEATRMAAGRKNALRLEINGELGSLAFDLERLNELSFHDHTEPAATSGFRRILVTEPEHPYLEAWWPPGHGLGYEHTFVHQARDVIRTIVEGTEPRPSFADGLQVQRVLAAVEESAAKNSVHTAVPS
>tr|A0A6M1RBC6|A0A6M1RBC6_9GAMM Uncharacterized protein OS=Grimontia sedimenti OX=2711294 GN=G5S52_07050 PE=4 SV=1
MQADQMRKGMIISKTCAVIAKGKSPQTTQPGYSLQSMRHGEPVNEDAIRAKAKQLGLDQQEQDLFVVIKRNLVHSKKVKDGQIAAFAKHVVQYCDSEADIYNALKGIEQQMAVMDHFIRYIHV
>tr|A0A533RQR5|A0A533RQR5_9ACTN Uncharacterized protein (Fragment) OS=Actinobacteria bacterium OX=1883427 GN=FDZ75_06060 PE=4 SV=1
MLEMRIGTIKTPWFLALAVVVALVAIASFALVAVAEPPMAEQSSNDVAHHWTARSAGVAPYTELAPAEAAAIDTAKKALTQPPLGVIRNADHGYGAAQGALDTMKAVSTAAPIVAGHELVLSNGTKAVRVYVNQDGSVKPLGSGTLWVSATPNKALSDHNDFDAAEIARGALALHAALDPGTA
>tr|A0A2A8FPC4|A0A2A8FPC4_9BACI PucR family transcriptional regulator OS=Bacillus sp. AFS026049 OX=2033493 GN=CN563_06555 PE=3 SV=1
MNTSITIEEILTRKHFNLTDIIAGSSGIKRQVKWVHCMEVTQISHLLNGNELILTTGLGWKDCDDTFLSYLRQLIECDAAGLCIEMGANTMAVPQCAIDLANERQFPIILFHEEVPFVEITQDIHSLIINKQYQMISNLENYSQQLNKNLLEIDHYEPILKFLHSYLHVQVILIFNENDIASIPKIKKKSTYQMVADIYEEKRKLDKTVLGQPIQVLGENYAELLICSNGRELTDFDSLILDRTATALAQHLLRELYIEEKKMSEESIWLTNWIEGEYSDEAIRERLSYIDPKMQLDGGIVCICKQHPKYNKNSAKLDGTYFKIMFRTVFEQYGFQIFSMEIQQHLVFILGDNRSSEDWKSRVTSALDRIMKMDVSGRNRMGLLSIGFGKHVQRLSEIYKSYETARETLLLQDTLPEDDRSFFYQDLHMHRMISLINKHGNLEETVYEYLGPVIEYDKQNNGELMPTLKTYLACNGSKQETSKQLFIVRQTLYHRLEKLEKLLGSDFMRSDKRLGLEFMIFALDFLQYSSRKISGKYVDKYIGR
>tr|A0A6N6RG02|A0A6N6RG02_9HYPH sn-glycerol-3-phosphate ABC transporter ATP-binding protein UgpC OS=Brucella intermedia OX=94625 GN=ugpC PE=3 SV=1
MASIDIQSVRKSYGEHAVLHGVDLEIKDGEFIVLVGPSGCGKSTLLRMIAGLEDITSGQVQISGKRVNELAPKDRDIAMVFQSYALYPHMSVADNMSYSMRLRKTPKEKIASAIQSTAAKLGLEPLLERRPKALSGGQRQRVAMGRAIVRQPKAFLFDEPLSNLDARLREQMRAEIKKLHGELKATSIYVTHDQIEAMTLADRIVAMHGGVVQQVGSPLELYDRPANLFVAGFIGSPAMNFLDVTYLEQDGGPRLKLKDGTLIALPQPLNLKDGAKATLGIRPEHVHIEKSAGLPADVDLVEPTGFGIILHLSLHGLPFKIFTLDRDALHMQGSIQVSFPAQHLHLFDGDGNRVEPRAVQ
>tr|A0A522BP99|A0A522BP99_9BACT Transketolase family protein OS=Patescibacteria group bacterium OX=2052139 GN=EPN90_03525 PE=4 SV=1
MELKPTRDGYGLGLVDAGKKDAKVVVLCADLSESTRSHWFKKEFPARFVQIGVSEQSMAAIASGLALAGKVPFISSYAGFSPGRNWEQIRTTITLNDANVKVAGAHAGVSVGPDGATHQMTEDLALMRTLPNMVVLAPCDMQETKKATVAVAGVYGPHYLRFGREKSPVFTTPATPFKIGRAEIFRFGRDVTIVACGILVHEALKAAEELRKKGIEAEVIDSHTIKPLDAKTILASIAKTGCVVTVEEHQVDGGLGAAVAEALGAARPVPLERIGVQNRYGESGEPIMLLEAFGLTSPYIAMAARRATARKAGKKVSEVPDYMAAAERRAVELKKQVISEALSRAPREWGGKKGNIKDLIKKSK
>tr|A0A852SI39|A0A852SI39_9MICO Putative membrane protein YkoI OS=Herbiconiux flava OX=881268 GN=BJ984_000542 PE=4 SV=1
MQKKTKIIGGATLAAVLVLGGTGIAYAATDGFEGSDALTGGDLDRAATVASEEIGGGSVTSAERDDDGYELELKGDDGRYYEVELDGSFGVVSSSADDRVGDTGSSGSGSGSGSGESGESGESGTGEAGGPADGGDDEGDGAGAGSASVDPDDLQGEELEKASAAAIAEAGGGSVTDAETSDDADHAYDVEVRLDDGTEVDIDLDASFGVVRTEK
>tr|A0A0E0XWR4|A0A0E0XWR4_ECO1C Lipid A 1-diphosphate synthase OS=Escherichia coli O104:H4 (strain 2011C-3493) OX=1133852 GN=lpxT PE=3 SV=1
MIKNLPQIVLLNIVGLALFLSWYIPVNHGFWLPIDADIFYFFNQKLVESKAFLWLVALTNNRAFDGCSLLAMGMLMLSFWLKENAPGRRRIVIIGLVMLLTAVVLNQLGQALIPVKRASPTLTFTDINRVSELLSVPTKDASRDSFPGDHGMMLLIFSAFMWRYFGKVAGLIALIIFVVFAFPRVMIGAHWFTDIIVGSMTVILIGLPWVLLTPLSDRLITFFDKSLPGKNKHFQNK
>tr|A0A2V7LM58|A0A2V7LM58_9BACT Non-specific serine/threonine protein kinase OS=Gemmatimonadetes bacterium OX=2026742 GN=DMD60_00570 PE=4 SV=1
MTEGDPRPCARNHRRSVRMLLRPRDRTAQLARNLVYTPRGTEGPVTVDLLLPDLQRALAGRYVLERRLGRGGMGVVYLARELRLDRRVAIKLLPPERATQPTARERFLREARTAAQLSHPGIVPIFAVHEVSDFVYFAMAYVDGDTLGRRVRRRGPVPYATAARLLEEVARALAYAHDRGIVHRDVKPDNILLDQTTGRALVSDFGIARVGSATTTGPQRVVGTAEFMSPEQVLGERVDPRSDLYSLGVVGFFALSGELPFLGPDDMTVLARQVSDPAPPLASVAPHVPHRLAEAIDRCLAKDPAERFPNGEALAAELAAALDRRAAVAVRAFVTEARQLSTTTLFYGAFAAVALPLLVLRLLEPDDPPTRAALVGSVATVVAVPLVVMVLRVRRLSKAGYGQADLVDALSAELGHRREELAFLYGEGPSPLERALRRLCYVCVAAAGAIVAALERVPALAGALGVPTLFGVVTAAALVAAVAARARTEHRTNPKGERRLRFWSGPLGRWLFTLAGLRVKRRATPAPGVLSPVVTPVPEARDA
>tr|A0A1I3RF39|A0A1I3RF39_9DELT Glyceraldehyde-3-phosphate dehydrogenase OS=Desulfomicrobium apsheronum OX=52560 GN=SAMN04488082_103115 PE=3 SV=1
MEKTRIGINGFGRIGRQVLKTIWQRHRDTLEVVAINDLFDTQTNAHLLRHDTSYGHFAAPVEADADTIRVGGEWEIKSFAQRDPKLIPWKSCGVDIVIESTGIFRTGPTAGQHLESGAKKVIITAPSKDEDLTVVIGVNEDKYDPAIHHIVSNASCTTNCLAPAVKVMHAKFGVAKGVLTTVHAYTNDQRILDLPHKDLRRARAAACNMIPTSTGAAKAVAKVIPEMAGRFDGYSVRVPVPAVSLVDFVAVLERDTTAEELKAAFKEASENELKGILGYAEEALVSSDFIADPHSGVVDADFTTVQAGNLAKVLIWYDNEWGYSCRVADLAHLMAQKGL
>tr|A0A401RBY4|A0A401RBY4_STRA9 TetR family transcriptional regulator OS=Streptomyces albulus OX=68570 GN=SALB_07941 PE=4 SV=1
MERAERGERILEAAGELLVAWGYRRVTIDEIARRAAVGKGTVYLHWKTKDALLLAVVLRAKSRSLHAQLARMRADPREILPSRMMRGYYLDFLAEPVLRALYTDDVDVLGRLNDVAKKELAELMAFNDGILLRYLAVLREHGLVRTDIDVRHQQYVLMSTATGFFMAEAMLADHAPDTPEVRADLFAATIRSAVDMPVEGFGAQTVGPPGRSGAPRARTVEEALVAARRDVLPLYEQAEEYGAREMRRQLRG
>tr|A0A1X2LS66|A0A1X2LS66_9MYCO Dehydrogenase OS=Mycobacterium decipiens OX=1430326 GN=B8W66_16385 PE=4 SV=1
MCVLRLLDMALERLCAEGLIKGPLRAGFGQEAVSIGAAAALGEGDITITTHRPHAQHVAIGGRLGPMVAAMTGSTAADIWGGDNQVLDAFPRGGLSAGPCVVKQSPSYAIGHAYRQWLADTGGITLCVTEDCDVNSAAFNEAANMAAVWQLPVVILVENIRCALSVRSDRHLREPQAYRRAAAYGMPGVSVDGNDVKAVRDCVTSAVLRARAGGGPTLVQAITYRTIDFSGSDRGGYRDLAGSEQFLDPLMFARRRLIAAGATRDRVAEEERAACQLVADAVAFAKAGSRRDSGARSQPPACV
>tr|A0A380JP96|A0A380JP96_9STRE Myo-inositol-1(Or 4)-monophosphatase OS=Streptococcus equi subsp. equi OX=148942 GN=suhB PE=4 SV=1
MEDKYAFAKTIIKEAGLFIKDRMKDSLAIEIKTQHDDLVTNVDQETQDFLISKIKKAYPSDHMIAEEGDICHAITDGKVWVLDPIDGTVNFIVQKANFAIMMAYYENGIGKFGLIYDVMADQLFSGGGDFAVTLNDQVLASYQDKPLDLSLIGCNAGMLSRNEYNLHQLIDQTLGVRVYGGAGICMTKVLKQQLMAYFSYIQPWDYAAAAIMGESLGYVLLTLEGEQPDFQSRQKVMFVPKSKLATIQSLLHINENNQ
>tr|A0A2E6Z7C9|A0A2E6Z7C9_9GAMM DUF2061 domain-containing protein OS=Rheinheimera sp. OX=1869214 GN=CML21_09570 PE=4 SV=1
MLKTTTFAIMHFTIAFAVTYAITGDLVLGGLVAVIEPAANTVAYFFHEKIWQRLQQKNTVQKSLTIFKKPALKW
>tr|A0A1D2SEW3|A0A1D2SEW3_9BURK Ribosomal RNA small subunit methyltransferase E OS=Lautropia sp. SCN 69-89 OX=1660104 GN=ABS56_13610 PE=3 SV=1
MIRTLDARQSHHLVRVLRLAAGAPVEGFDGKGARFDARIERADPKACAIRLLAPIAACTESPLAITLAQGISAAERMDWTVEKAVELGAHAIQPIVCARTQVRLDAQRLQRRHEHWARIVEAACMQCGRDHLPELGVPLAFERWLAATDRRAARTRIVLDPRGAVRLAALRVDAAQPVDLLVGPEGGFDATELEAARAAGFQAVRLGPRVLRTETAGLAAIAALQAIAGDF
>tr|A0A1A8F559|A0A1A8F559_9TELE IK cytokine OS=Nothobranchius korthausae OX=1143690 GN=IK PE=3 SV=1
MPETESYSNPLAPDDHELDDHRGGSQAKLTNDDFRKLLMTPRATPSSAPPTKSRHHEMPRDYNEDEDPAARRRKKKSYYAKLRQQEMERERELAEKYRDRARERRDGVNKDYEETELISTTANYRAVGPTAEADKSAAEKRRQLIQESKFLGGDMEHTHLVKGLDFALLQKVRAEITSKEKEEEDLMDKVQKETKKDLEPEEKIEFKTRLGRNIFRMVFRSGVSERNELFLPGRMAYVVDLDDEFTDTDIPTTLIRSKADCPSMEAQTTLTTNDIVISKLTQILSYLRQGTRHKKLKKKDKGKLDDKRAPEADLSIFDDIGDYIPSATSGTKPVKDKDRHRERERERERERNREDDSKSRRQSYFEKPRADEHQLMDVDAGPGSVRDQINMINEKFGGAAGSQWQGQEPGSQRRDSSKEHLGDFFGGSNSYAECYPATMDDLAVDSDEEVDYSKMDQGNKKGPLGRWDFDTQEEYSDYMNNKEALPKAAFQYGIKMSEGRKTRRFKETNEKAELDRQWKKISAIIEKRKKLEADGVDVKRPKY
>tr|A0A5C8LAV1|A0A5C8LAV1_9FLAO Uncharacterized protein OS=Mesonia sp. HuA40 OX=2602761 GN=FT993_07960 PE=4 SV=1
MKKIDKKEIITSTAKSIFGAIPFGGAALDELFFEYNGRLKQNRLNRFVKILAENFTEESDINLDNIKTEDFNDLFESVLRKVVQTKSEAKLIRFKDVLLNELKKPTKQAEINELYLNLISELTEQEIEILYNHRFFTEEFEEEVNEMNRHRDNMKSLKNQMDKESIIVDESKFLKPYENVKAQFENKKSKIDKVLKYRNADFYNLNENKFMFFKQRLFSKGLLIDDRMKRIGTLPFQSMGITEFGVEFIDFIKTSEKKITVGNTVYNK
>tr|A0A1S6WTD4|A0A1S6WTD4_9HYPH 23S rRNA (Guanosine2251-2'-O)-methyltransferase OS=Bartonella sp. WD16.2 OX=1933904 GN=BWD162_004080 PE=4 SV=1
MKEKVSKNSYFPHPRRQYRNTKSFNRMPSIHLKHRSTSSIQNIVYLYGIHSVKEALKNPKRVFNHLYATPNALQRLNITKSDLPCSLKLYPPKKLDELVGKDAVHQGVVLETETLKPRHLSELTNTNLIIVMDQITDPHNVGAIMRSAVAFKAGAIITTYRHSPQESGVLAKAASGALELIDYITVRNLAEALTEIHQAGFNSLGLDSESELPLETALTGKKIALILGSEGKGLRKKTRETVHSLARLNIPGDIKSLNVSNAAAIALYAAHNYLKH
>tr|A0A538MZI6|A0A538MZI6_9ACTN Peptidase_S8 domain-containing protein OS=Actinobacteria bacterium OX=1883427 GN=E6F93_02950 PE=4 SV=1
MAMLRNGGRPGGQSRSSALWGTGNNDDSRSNALWGKGGRGLVTLMAAVLVLGIPLAASAGGDDNTGPETQTYVSPGMLANASKHPDKTIHVIVTANAGDLPKSRILDKTLGSVDRRLGLIDGIALDLRANRLDQLAKIPGLTITPDAPAHPTGSTFSSKQLWVPNTGIDKLWNAPVANSTKTQSDLAVPAIAVVDSGVDTSKAADFGARVVQQVNLTTLPNNSPGDGRGHGTFVAGIAAGQATGYAGASPRSNIVSLDVMDDTGTARTSDVIAAAQWILDNKDKYNIKVANFSLHASNSSSFTHDPLDKAVEKLWFSGVTVVAAAGNYGYANAPSGVKYAPGNDPFVITVGAADMDGNPSPNNDTAPSWSAYGYTNDGFAKPELAADGRYMVGPIPAGSTLASQKASNIVSPGYIMLSGTSFAAPIVAGIAAQIIARNPTWGPDQIKGGLMETARPTPNATPGSLGLGEVNALKAVLLSGAPNPNKALEKFLGPDPSGGNLPAFNAVSWSDTAKANVSWDAVSWGDVSWGDSALAAVSWADISWSDVSWADSLSSADVSWADISWSDSSYEDAAEGDGAGNTTDSFADPADLAAAAADPDLQLPSDLVALQPSATTSLP
>tr|A0A5E6PHC7|A0A5E6PHC7_PSEFL Alginate_lyase2 domain-containing protein OS=Pseudomonas fluorescens OX=294 GN=PS645_00335 PE=4 SV=1
MIDLSTWNLTIPVGAPARVIETPRLVDGYSDAYFRAGNTLFFWAPVTGGTTSKSEFARSELRETYKDGELRNWKYPKADHRMTASLSVNQVPSEGRVVIGQIHIYQGKGPLLKVEYVYDKARQTGSVIANYRLKPGSADTKVVIAEDVDLNKRFTYEIRLSSAGYLHVISQGNRWGKQLSKSWQNKQLYFKAGAYALDNTGYKSEGAQVTFNKLEVKHSKG
>tr|A0A4S2D6C4|A0A4S2D6C4_9MICO Redoxin domain-containing protein OS=Microbacterium laevaniformans OX=36807 GN=E5344_10370 PE=4 SV=1
MNHRALIATASVLLVVGLLAGCGSSESLAQQYRNGNEKGYIAGDFQIVEIPDPDRGEPVAFEGVTETGETVTSDDYRGGVLVVNFWYAACGPCIVEAPLLEEVWQDYQDQGVAFLGVNTYDQPATALSFARDNNVTYPSVIDVNDGRVKLAFAQVTPIQATPTTLVIDQDGRVAARIIGQLASASILSTLVADTLAEDSS
>tr|F2YA48|F2YA48_GLOPA Pectate lyase (Fragment) OS=Globodera pallida OX=36090 GN=pel1 PE=3 SV=1
MLFVIISIVFAQLCQVHALCTFPASPKTTTVQSTINVASNTDYKYTTFVGGSGILNGGCDVKNGKMKYLMVLKNGVTIKNAIINTPGLGIYCEGNCVLENIYYKKLCYHATGFGYKSTSTSYTYQVIGGAGQGSPDKYFTQSGRGTTIIKNFCAEGKYGKVWCSCGNCIDQMPRSVQISNTKIQGPGLAIISANSNLGDKISISGLTLYGQGSPNTLTKYVCQTYNGLTKMATMQPTAKFRPTQAGTGTCAYSTSAIKIVN
>tr|A0A2K4FSF4|A0A2K4FSF4_9PSED Uncharacterized protein OS=Pseudomonas sp. MPBD7-1 OX=2075549 GN=C1892_11745 PE=4 SV=1
MTSKKTATAVSDLTLSPAANGPEVSKPSSPPRPLSTQQYLYFTETNTDRILDNLDGLRDTVFPRPPHLVDDEYDRAQQEFPSVCLIGLGRCGSNIALDVAELVYNARKFYLNEFNAEDKGYSDKGYSPAQWIRNNLRLGTSKASKPVFLVEPLVMLGDLDKDIAGRIRFSRKGEKSGFLRDYSKMKIMDLSEVHAGGAGNAPILGQYLAKIILNKDTQRFSSPDWKMIHSYLIDSCGIKANQSRLYFSIFSAGGGTGSGMASEFGLAQQYSYMNKTFDTKPMDEHDSKSGHSFVFEPIFTSGICVLPNISDHRSEMSEALHINAGRLLCKYLSEEWDFSYNFANEDSSEASVMGRIRPWNAMMLISNDIMRYAEESDDGNIQNIDVNAMEKHANQYISQQIFNILTAQAVTTDYDQNYFRRAGIDIGETIRLDANDLFMSLAGPVAIAYAESVVPETPVPSGDKFKVFEKEPPRLNIDDLFFRSIDLPHFNKVTQAIEGISLLPIESKRYRASLEQYKNSGYDAAALHDLHFFKNCSSVVSIVSLPKDYKLSYMDLNRLKTHLNSLFPNTTLKRYALVIGASANLSLTTLIAKSPCLSDDFLTLIVAFIKRCFARTPYRFDETLDNSILDFIINEDFDEARIDDLLNEFENPAKILDTNWYAIKPMYEKKYRELINDKDKFVSINDIRLSRDCVKKSIKYLREIYRHRIGKTKVISLNNHTGRTY
>tr|A0A401T372|A0A401T372_CHIPU ENTH domain-containing protein OS=Chiloscyllium punctatum OX=137246 GN=chiPu_0015593 PE=3 SV=1
MTSSSLRRQMKNIVNNYSEAEIKVREATSNDPWGPSSSLMAEISDLTYNVVAFSEIMSMIWKRLNDHGKNWRHVYKALMLMDYLIKTGSERVAQQCKENVFAIQTLKDFQYIDRDGRDQGINVREKSKQLIALLKDDERLRVERSHALKTKERMSSVTTAVGSNNQIMFGRGSSHPNLSTSQSDECGKIGGSPASYHGSTSPKISSELEQTRPQTSGEEELQLQLALAMSREEAEQIFKSATTAGSQPRNTVLTLSAQDEQHRRGDDLRLQLALEESRQKLQMPGMAPHKTETALLDLTDSTPSPLTQKSDPWGAPLPSTSTTKPDPWAAVSRPVSNDPWKQMAGSRLAAATSDPWGSSGRRLSGEQQSRSADPWGSAAAAPDRDPWAPTSPQVAPPFHSFSAADAAVTDEFSVFSHLRGSPRKVEGQGTGGRFEVLGDGLTTPATSVVTGCSDVFDMPSMSSTVPSKLPTPKHQPTTQKNPESFLGPNASLVNLDTLITHTTHPNVSTNPFLAQAVPVASANPFHSTPTQMSSSMMAVTQTPFGPVDVTATSFSAMPRVGAAPMVTMPAMQMPQSTGMQGMMGSNYVAMAAPPPTGQSASSTNPFLL
>tr|A0A318DIN8|A0A318DIN8_9GAMM Extensin-like_C domain-containing protein OS=Dyella sp. AtDHG13 OX=1938897 GN=BDW41_11025 PE=4 SV=1
MSVVRYLGLLILMVGVFIALLVASGWRPPYRYNPWARLDLRAEPDWLTRFRLYRLQHHNDQCLAALAQAGAEYRAVSDRPLVDGCGWQGTVMLRGTGQATLATPTVVTCPLAASLVMLDAHVLQPRAASTFGSPVAVIEHVGSYSCRNIRGDDGSALSSHARAEAIDITGFRLKNGHDISVMRDWKRSVSGAFLHQIQAQSCGYFGVALGPDYNAAHAGHFHLQAGAMGWCR
>tr|A0A1R1WU44|A0A1R1WU44_9ACTN Uncharacterized protein OS=Streptomyces sp. M1013 OX=549798 GN=BSZ07_05050 PE=4 SV=1
METLAQFGDGGPGPWILLFPVIWALVIGGGITLLRRTVWRGRRGPARPGAVEDNSPITVLGHRFASGEIDEDEYWRRLSVLDEQFGRTGKGGAA
>tr|A0A2S8IRD2|A0A2S8IRD2_BURCE Uncharacterized protein OS=Burkholderia cepacia OX=292 GN=C5615_17140 PE=4 SV=1
MKKTTLKSVFLTGLLVLVPLAITLWVLGLIIGTMDQTLLLLPESWQPERLLGFHLPGIGAVLTLAFIFIVGLATRNFIGQKLVTWWNAVVRHIPVVGPIYTSVKQVSDTLLSSSGNAFRKALLIEYPRRGSYTIAFLTGTPGGDVLNHLTEEYVSVYIPTTPNPTSGFFLMLPKSEVIELDMSVDAALKYIVSMGVVAPPAPAPAPARRPVEPPL
>tr|A0A2T4IVX8|A0A2T4IVX8_9HYPH Integrase OS=Mesorhizobium helmanticense OX=1776423 GN=C9427_13580 PE=3 SV=1
MLVGYARTSTAEQDAGLLAQQRDLREARVEKLFSEQVSSIGHRKELETSLDFLREGDTLVVTKIDRLARSTSHLLAIVDRLEEKKVGLRILDFGGASVDTKSPSGKLMLTMFAAMAQFEREMMLERQREGIAKAKLDGKYKGRKPTARARSGEVIKLHIDGVGPTEIAKRLGMGRASVYRILEAPGE
>tr|A0A8A6NMP5|A0A8A6NMP5_9ERIC InfA OS=Impatiens loulanensis OX=2822277 GN=infA PE=4 SV=1
MKEQKWIHEGLITESLPNGMFRVRLDNEDLILGYVSGKIRRSFIRILPGDRVKIEVSHYDSTRGRIIYRLRNKDSRD
>tr|A0A7C6PFE8|A0A7C6PFE8_9RHOO Uncharacterized protein OS=Rhodocyclaceae bacterium OX=1898103 GN=GXX56_08515 PE=4 SV=1
MQLPITIELHRSRLQPRILALLLSVALIVVLFYPLPVPLRLIGVTLLALGGGWMVRQLRPQVAALQLLADGSLGIRGTDWNHPEFVPARMLQGATVHPWLTVLRLEAQEGQPYRLLLTPDCLLPEDFRRLRVFLRWRSTVSASDAPV
>tr|A0A6P3QY80|A0A6P3QY80_PTEVA zinc finger protein 512B isoform X2 OS=Pteropus vampyrus OX=132908 GN=ZNF512B PE=4 SV=1
MADPFCVGASRRLPGSSKSGPGKDGNRNEVRLPVRHDPPKLGLPVARGGQSVPSQAPLCFDPGSLASDRTEGKKKGRPKAENQALRDIPLSLMNQWKDEFKAHSRVKCPNSGCWLEFPSIYGLKYHFQRCQGGAISERLTFPCPFCEAAFTSKTQLEKHRIWNHMDRPLPAPKPGPVSRPVTISRPVGVSKPIGVSKPVTIGKPVGVSKPIGISKPVTVSRPVPVTKPVTVSRPVPVTKPVTVSRPVPVSKPVTVSRPMSVTKAVPVTKSVPVTKPVTTNKPVPMTKLVTVTKPVPVTKPVTVSRPIVVSKLVTVSRPIAISRHTPSCKMVLLTKSENKTRAAGRSSGKKRAADGLVACPIPPKQTRPENGEHGPSTLGQSSAFQLGTDPSGGPLSVGNRPSGGKEAPRAPGPVSPTEEGAERTKHRRKQKTPKKFTGEQPSISGTFGLKGLVKAEDKSRSYRARKQDGPSPEDVRKKAPAPASTVSKEVPAPTAHLAPGGPEEQWQRAIHERGEAVCPTCSVVTRKTLVGLKKHMELQDALKCQHCRKQFKSKAGLNYHTMAEHSAKPSDTEASEGSEQEERERLRKVLKQMGRLRCPQEGCGAAFSSLMGYQYHQRRCGKPPCEVDSPSFPCAHCGKTYRSKAGHDYHVRSEHAAPPPEEPEDKPPESEDLLGVERTPSGRIRRTSAQVAVFHLQEIAEDELARDWTKRRMKDDLVPETARLNYTRPGLPTLNPQLLEAWKSEVKEKGHVNCPNDCCGAIYSSVSGLKAHLAGCSKGDHLVGKYGCLLCAKEFSSESGVKYHILKAHAENWFRTSADPPPKHRSQDSLVPQKEEKSLAGGRKRGRKPKERPPEEPAPRTPPRQDDWPPGGRDKGVRGSAGRKVGAGKAPEK
>tr|A0A081RSK0|A0A081RSK0_PHOTE Chemotaxis protein CheW OS=Photorhabdus temperata subsp. temperata Meg1 OX=1393735 GN=MEG1DRAFT_03734 PE=4 SV=1
MSAIEAFNKLSGETAGEGYLVFTLGDEEYGIEILKVQEIRGYDQVTRIANTPAFIKGITNLRGVIVPIIDLRIKFAQETVTYNDNTVVIVLNLLNRVVGIVVDGVSDVLSLKAEQICPAPEFAVTLSTEYLTGLGSLDDRMLILVDIEKLLNSEEMALVDSVAKN
>tr|A0A1V5AGS2|A0A1V5AGS2_9EURY tRNA (Guanine(10)-N2)-dimethyltransferase OS=Methanosaeta sp. PtaU1.Bin028 OX=1811687 GN=A4E47_00993 PE=4 SV=1
MDGRDLKCGLEEAVASELWAFELSGEHATLPRSEALALLKVHSSSFKEVCLLDQCLIVRAPSIDAAALEARLAMSHRVLRVLAISSCSHSDLSFAASSIDIPRQTYRVRARSVGRSALSGYDVEVAVGRELFRRGYRADLSAPCQEIRCIVSQGLVVLGVEVARPDRSGFEGRRPHLKPFFYPGVLMPRMARALVNLTCVRPGERLLDPFSGTAGILVEAGLIGTRCVGLDVQMKIVRGSLANIDGIECSLLAGDARRLPFRDASVQAVVTDPPYGRSAAIRAASRDELLARSFEEMARVLQPGRRAVVVADHPIDDLLASAGFLQREIHSERVHRSLTRRIYISEI
>tr|A0A4V3XAK0|A0A4V3XAK0_9APHY Uncharacterized protein OS=Phlebia centrifuga OX=98765 GN=EW026_g3689 PE=4 SV=1
MSDASDILPPSLDLPPHLSAQKYFFVCTLTVAAWDTLVLSPRSWRLFRTKGWPFLKIAYHFLRIFMPVEFTIVGVAFFDTKWSQETCSHFFLFEPICTAILLAVCSAVHVIRINAIYDKDRRVFTPMVALYAIQILITAICCGFYRSTPLLIGQGCIAEPKHSWVGIYWISATMLYTASFGLALSRAIRSLKIKKISYWKLMLRDGLNLYAAVFLVNLVNMLFWFIITPTGPEDPIRTIVTSMSAVLTASMTLRIILSVRGTLEKGGSTGPVLSLQQPGTGTFNVPLGATESKTHDWVDDKASDQMGMSEVKGEGDFPVESGLGTPTSEDAPKGVKITIDTETAF
>tr|A0A1M8A1H4|A0A1M8A1H4_MALS4 Similar to S.cerevisiae protein RKM2 (Ribosomal protein lysine methyltransferase) OS=Malassezia sympodialis (strain ATCC 42132) OX=1230383 GN=MSYG_0658 PE=4 SV=1
MEQALAAYVARASGSPTLRVAVSDQVPAGRGLVTTGAVQAGETVLRLPPSVLLNPSQMARGRPVPWAPLRHAEEPCPNARPLSTHQLLACVLAQWRAARVAGPSTELSDRDAFFASMPSAFPTVPLSWALDGDTQLLSALPPRAARLHDKVQARFEADWRRLDALDEATRASIWASVSRPGIPAVRPRKADVLWGWLCVNSRCVYVDLRYVRHEDNFTLAPLLDMANHTFVQGKQCKVRYSAEGMELCAPAQCGLQAGDEVCITYGPHTNATLLTEYGFLLAPRDALRGASAWDGNPHAELAVDDAIAERFRAEGDEGAWKVQRLKEEGYSGDYTMHPEPAPAHVSHRLLMALWLLSMAMENKHTTQRLSLRARAALQAKQGLRCVYSPKEAARQWKQVTYGMPDSRHERPMRDVLCRLCTEMAEQRSALLEQLQGRHDEPASLVRLLLEEERDIAHRVQTSAERGEAW
>tr|A0A4V6I9D8|A0A4V6I9D8_9BURK Glycoside hydrolase OS=Burkholderiaceae bacterium PBA OX=795666 GN=MW7_007585 PE=4 SV=1
MAGAPPCVHAETARSRAIDVPGPWTTYYGAASKLDLQQVARTYRLLVIDADPGQHNFTPEQIAQLRDGGRNRVLSYLNIGSCERFRTYWRTTGTAIPGCGANRRAQRGVYHGYPDEVWMDPSDPDHQRLVLDYLAPRLVAQGVDGFYLDNMEIVEHGVRTDNGPCGDACRRGGLELVYKLRARYPQLTIILQNTAGPVTRMGQAGGVPFPTLLDGIAHESVFAPQHDADADAQLALWRAWSSERPEQRFWIGTLDYVGKCENVDRARKAAARSRARGYVPAVSDASAGQQRICDWPQPLAE
>tr|A0A851NIW1|A0A851NIW1_9GALL PPARD protein (Fragment) OS=Penelope pileata OX=1118817 GN=Ppard PE=4 SV=1
MEQLQEEVPEVREEEEEEEEAVTVTGGASDPSAGPDSSLPSSSYTDLSQSSSPSLSDQLQVGCEEAASGALSVECRVCGDRASGFHYGVHACEGCKGFFRRTIRMKLEYEKCERSCKIQKKNRNKCQYCRFQKCLSLGMSHNAIRFGRMPEAEKRKLVAGLTASEISCQNPQVADLKAFSKHIYNAYLKNFNMTKKKARGILTGKASSNPQPFVIHDMDTLWQAEKGLVWKQLVNGIPPYKEIGVHVFYRCQCTTVETVRELTEFAKSIPSFIGLYLNDQVTLLKYGVHEAIFAMLASIMNKDGLLVANGNGFVTREFLRSLRKPFNEIMEPKFEFAVKFNALELDDSDLSLFVAAIILCGDRPGLMNVKQVEEIQDNILRALEFHLQSNHPDAQYLFPKLLQKMADLRQLVTEHAQLVQKIKKTETETSLHPLLQEIYKDMY
>tr|A0A1H7HQ73|A0A1H7HQ73_9LACT Transposase InsO and inactivated derivatives OS=Alkalibacterium pelagium OX=426702 GN=SAMN04488099_103146 PE=4 SV=1
MKIIGLAESTYHYHAKRMNQPDPDREWKTLITKIFLDKDKRAGYRSIHDILIFMGYTINHKKVQRIMQELGLKCHKFSRKSRSYSSYKGTVGKIAKNLINRRFHSTIPLQKLVTDVTEMKCAQGKKLYFNPILDLYNSEIISYSISDTPNVDFVMQALEEALPIINKHATYRTTIHSDQGFHYQNKRWVKKLKENKVFQSMSRKGNCLDNASMESFFGIMKQEMYHSEPLKTFKELKKEIEEYIIDYNESRLKRKLNRQSPVQFRKNQGYTYAV
>tr|A0A2D1KXX5|A0A2D1KXX5_9LACO 50S ribosomal protein L7/L12 OS=Lactobacillus farciminis KCTC 3681 = DSM 20184 OX=936140 GN=LF20184_09720 PE=4 SV=1
MALDTQKIIDDLKDASILELNDLVKAIEEEFDVKAAAPVAAAGAAGGDAAAEKDSFDVELTEAGQEKVKVIKEVRGITGLGLKDSKDLVDGAPKVIKEGVAKADADDMKSKLEAVGATVTLK
>tr|A0A2E5T8Y9|A0A2E5T8Y9_9GAMM Glyoxalase OS=Alcanivorax sp. OX=1872427 GN=CL551_10510 PE=4 SV=1
MFNHIMIGSSDIERSERFYTAVLGVLGAGEPMRXXSXSGHIRLFYRHDGNTLAITQPINNEPATGANGGTIGFKCESPEQVKEFHDVAVANGGTSVEDPPGLREGPMGALHLSYVLDPDGNKLCGIHRLK
>tr|A0A4R4X4E5|A0A4R4X4E5_9ACTN Uncharacterized protein OS=Nonomuraea diastatica OX=1848329 GN=E1294_04030 PE=4 SV=1
MTTPDDYTYVRFGSMEQAYEELKKVVTELDRATDDLYADIKRELGPSWEGEAERFFEEKRQKWNAHEKAMGQQLFQAASAVNVANGNYQQAERRNIGIWTD
>tr|A0A401SWZ4|A0A401SWZ4_CHIPU Uncharacterized protein OS=Chiloscyllium punctatum OX=137246 GN=chiPu_0013380 PE=4 SV=1
MAQDTRVMTFYMELRTDPPGHCAITPPGSLYHDEPSPAQSVANTRSPCFLSPIVPPCTQRRSLPPDTKMDFLGFPGCKKGTASLVRTQSETNPFREFAPASSGRSTAPSSPVCIRTHPFCPVTLENTMGGDTRGRSSVVTFSYIEKARVKTVVNPFNVSVLPQGVKLAGMGQGSSIGWKSPQTSHKVSHGIISMPTPMESFDTRVSTVSVGSCREPSNSLIPNRSLLSSVGSASQRYSDAAAQSPCPGGKRAQSGNELRQGYPSKQVCTKALDLGTDLMTVATPNKTSSNHSIAAIPCVNPIGREIPNSPGLTQVEACMLVGEHSERAQRIAKARREFFYGTLEPQIPEDKADSKTWQAPVNPDNNTTREIAESKDQGASANGSLDAKLGTLSQGSAKVVNDLKSAPLSNGTSTDYKARDQLRAMKYSETDLDAVPIRHYQETNLDEVMTDYNITSSDGQELTHLMNSTLDSVQMDHPVPSRGFGRDQTTGNHEVCREEQSKAAEDDVFSELSSAADERSLEVEVKNLLPPVATIPIARSLSEEGTDTFSKQFESILESHRDKGTSYTSLDSMETLPSPSRNQGNYFTFDFPSLTSEIQVQIKENARLIEEEWSSADGEGCTNSAKASDWPDSPGCQATRTERKLGVSPMVGYSKSENTLTRCQLYAEGNLLKRALEIGDDEPKSEYSSSDSNLNHLVMDSESEMDSTEQLALGSTDTLANGNKTDQEAAKRLAKRLYYLDGFKRSDVARHLGKNNDFSKMVAEEYLRFFDFTGMNLDQALRAFLKEFALMGETQERERVLIHFSHRYHQCNPGAISAEDGIHTLTCALMLLNTDLHGHNIGKRMSCSDFIGNLEGLNDGKDFPKELLKVLYSSIKNEKLQWTINEEELRKSLSELVDERTDPSLKAMNRISGGSNPFLDIVQDPNAATYKHGFLVRKVHADSDGKKTPRGRRGWKTFYAVLKGMILYLQKDEYKSDKQLSEDDLKNAISIHHSLAVRAADYSKKPNVFYLKTADWRIFLLQAPNAELMQSWITRINLVSAMFSAPPFPAAIGSQKRFSRPLLPTTLTRLSLEEQIKAHDTRLKSMTVDLTEHRSYPPDKKVKGKELDEYKQKEEYLEFEKMRFSTYVSLLRAKLKSGTDDLDKFESALFDNIESEGNGLTKSHSSPSLHQEPPVMAIRVKRNTSERRSYRHSANTKHKL
>tr|E3NQ34|E3NQ34_CAERE SUN domain-containing protein OS=Caenorhabditis remanei OX=31234 GN=CRE_07925 PE=4 SV=1
MKYKTGAENKPFLRDVESPSDNPSNPFHFRKNEYFGNEKPIAKKESWHQVLNNRLRHYTVLEAFLFVFLVILLFKIYSLQSQIDTLERKLDSKKNAESHLMKTKEILEEKKVIHEIVQNVINPSSPFPKEKEGKVKLNSEFNAASLVLGASIETRQSSHSVSPGNSYFDIVSFALGSDQSAFSLLDRVELPVDKAWCTDDRKPVLTVNLADYIKPISVSYQHSKWNRTVPNGAPKLYDVVACIDGDCNQPLVSNCEYSKSGNQEQKCLISTGLPLVNKIQFRFHENHGNLNKTCVYLVRVYGEPSGSKEVKIQVKNQKEEEETAKICSRLAWFHDNIPVFYNGLASKNCSTLYSNNCCHECPNCCSECQINDSTLLNNLQFFIIFFVLFFILFPMYIAGISACCFGLKRFFGI
>tr|A0A1Q7VVJ2|A0A1Q7VVJ2_9ACTN Uncharacterized protein OS=Catenulispora sp. 13_1_20CM_3_70_7 OX=1805055 GN=AUG49_18720 PE=4 SV=1
MSSPSKFLRDLAKKTNTASAARAVLRAAHVKTGPSRLGDPRAGLPASVLPAGGNRITVENAKPGSANWRMGSGRSRAATDYERQIKGYASTDSVALGSAIDFHVAVXYGVAGAGGRTAAGPHSGPGNGTDRRGMASRMDAGHPHGLGLRNICRCPG
>tr|A0A4R4JD96|A0A4R4JD96_PHOLU Flavin prenyltransferase UbiX OS=Photorhabdus luminescens subsp. mexicana OX=2100167 GN=ubiX PE=3 SV=1
MKRLIVGLTGASGAIYGIRLLQVLQPVEGVETHLVISHSARQTLALETDYSLRDVQALADVVYDNRDIAAAISSGSFKTLGMVILPCSMKTLSGIVHSYTDGLVTRAADVVLKESRKLVLGVRETPLHLGHLRLMTQAAEIGAVIMPPVPAFYHQPQQIQDIIDQTVNRVLDQFDIELPHDLFTRWQGAKSVEI
>tr|A0A1E3ZHP6|A0A1E3ZHP6_9BORD Nitrate/sulfonate/bicarbonate ABC transporter ATP-binding protein OS=Bordetella sp. SCN 67-23 OX=1660091 GN=ABS43_07680 PE=4 SV=1
MNTAPVLEARGVARRFPNGVDALSPIDLTVRAGEFVTLLGPSGCGKTTLLRIFAGLDAPTAGSLRRHGEVDELSYVFQDATLMPWASVATNVRLPLDLERGPRRQPMEARRGRVREALERVGLTDFAAARPSELSGGMRMRVSIARALATEPSLLLMDEPFGALDDITRQHLDDELLGLAARQNLTVVFVTHSIFEAVYLSSRVIVLSRRPGRIVADIPIEAPTRDAAFRVSPAFAMQAARLQAALLEGQQ
>tr|A0A2D4C9B4|A0A2D4C9B4_PYTIN Uncharacterized protein OS=Pythium insidiosum OX=114742 GN=PINS_010966 PE=4 SV=1
MNPQQFASYVPQQQQMQGRVGSMGFAGQFATTGRVASSSSMASPVPIHAWTPPSPMEQQYFDMLFTMADEERRGAIGGRIAVAFFSRSNVDKTLLREQRSELSRNEFYVAMRLISMAQRGEAINVQRFYEMAAAPFPLPTLDGVPPPPSPQSSFVPGAPQPAVPTPSPMGGPQKGPFAITDEEKARYDGIFQQYDTDRDGFLQGGEAVGLFSKSGLDRMILRDIWAMADRTQDSRLDAKEFYIAMHLIVCISKRGLSMPTEAPQELLESPPVAPPAPEPKKDPMDAFAGLSPIQDSSDDPVDDGGAVGVNAGGPSAISK
>tr|A0A0C1QX44|A0A0C1QX44_9CYAN Uncharacterized protein OS=Tolypothrix bouteillei VB521301 OX=1479485 GN=DA73_0227160 PE=4 SV=1
MYTIDLTVRNTAFPISVERKSAEDAEQLYQLILTAMRSGNPDIVELQSEGKTEKKIAVRASEIAGVQVIQKDGSAAGTGRPPGFFALASE
>tr|A0A7T0C4B3|A0A7T0C4B3_9BACT tRNA 2-thiouridine(34) synthase MnmA OS=Candidatus Nitrohelix vancouverensis OX=2705534 GN=mnmA PE=4 SV=1
MTEKPKIVIAMSGGVDSSVAAALLKERGHEVVGISLQLWNYSGESDNRFGTCCSLDDLSDARRVAHKIDIPFYVLNLESEFRAEVVDYFVDEYLQGRTPIPCTLCNQKLKFDRLFQKAEAFGIERVATGHYASIVQVDGRYTIRRGEDRTRDQSYFLFNLSQSQLSRLEFPLADMAKTEVRRIATELDLVVAQKSESREICFVPDNNYAKFVASEAPHAFAEGEIVDKSGAVLGRHGGYPAFTIGQRKGLNIGGLKEPHFVTGIDPESNRITVGPKDDLIASEFYVSRANWCLDVTGPVEAEVQIRYRHSAAPAEVTPLENGRAKVSFYDPQLSITPGQAAVFYKDDCIVGGGWIE
>tr|A0A2S9KN53|A0A2S9KN53_9BURK Hydroxymethylglutaryl-CoA lyase OS=Burkholderia ambifaria OX=152480 GN=C6P77_27700 PE=3 SV=1
MTFPTAVKIVEVGPRDGLQNEKTFVPTDVKIALVDRLSRAGFRNIEAASFVSPKWVPQMADGADVMAGIERRAGTVYSVLTPNLKGFENALAARADEVVIFGAASEAFSQRNINCSIAESIARFEPVAKAAKDAGVRLRGSVSCTLGCPYQGEVPVASVVDVVERFAALGCDEIDIADTIGVGTPKRTREVLSAVTRVFPRERLSGHFHDTYGQALANIYAALFEGIEIFHASVAGLGGCPYAKGATGNVATEDVLYLMQGLGIDTGVDLAQVVAAGDFISNAIGRANVSRAGRALLAKAQSATDAPSCV
>tr|A0A4U3MG24|A0A4U3MG24_9ACTN Winged helix-turn-helix transcriptional regulator OS=Herbidospora galbida OX=2575442 GN=FDA94_14520 PE=4 SV=1
MSAVPPYDPDAPGPATYVYARVADHIAARILAGELVPGMRLPGERDLAAEYGVALGTARRAIEELRGRRLVVTLAAKGTYVARPEDIDPPTG
>tr|A0A7Y4Z391|A0A7Y4Z391_9BACT Uncharacterized protein OS=Bacteroidales bacterium OX=2030927 GN=HOO91_10445 PE=4 SV=1
MNNKNQILPEEIKSILLKYYDGCTTIEEELLLKKYFAQNQIPYSNISDKALLSFVNDNELSIFPENEIWNKILVTEKKVNKQRKTIRILSSIAASVLILISLSIWLFYPTKRVEILTDSYSNPHDAYNAVQKYLGLVSTKLSYAYNEIKPIEKLTIPCDAMQAFSTIDKNVKRLQQFDKLGASAHELERFSIISDIVIVDKN
>tr|A0A257X4W0|A0A257X4W0_9PROT Uncharacterized protein OS=Methyloversatilis sp. 12-65-5 OX=1970398 GN=B7Z51_07255 PE=4 SV=1
MSLSDIPDEMTLRLAADGRIECRRGTDAAAPAIRFDPAFFGQPESADAQRALGRFVFSLLQGMAPAAGTAAGPAIDGPASLLELAEKSLQQSAAAGFGQAIEALKDWPSVRTVADMLIARGPEQPR
>tr|A0A800G627|A0A800G627_9CHLR Uncharacterized protein OS=Dehalococcoidia bacterium OX=2026734 GN=EYQ67_00675 PE=4 SV=1
MPRLHLNPNRMIKDRGQGGRLRRALENLRKQHQWGDISDDEYRRERGIIMRQLKVHTSTIVMPTHLPNLERAANFLEDLPALWLHPGVTHEEREALVRQVFLRITIAGKEFVDIEPKPEYASLFATMVTAQKIGYQELESSRSPVSLLLLPSGISVFGI
>tr|C8BFH5|C8BFH5_9HIV1 Reverse transcriptase (Fragment) OS=Human immunodeficiency virus 1 OX=11676 GN=pol PE=4 SV=1
PISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKVGPENPYNTPVFAIKKKDXTKWRKLVDFRELNKKTQDFWEVQLGIPHPAGLKKKKSVTVLDVGDAYFSVPLDKEFRKYTAFTIPSINNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDLVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLKWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYPGIRXKQLCKLLRGAKALTEVIPLTAEAEL
>tr|A0A2M9CET1|A0A2M9CET1_9CELL Uncharacterized protein OS=Sediminihabitans luteus OX=1138585 GN=CLV28_2224 PE=4 SV=1
MREYDATPASTSRGQAALRWVLWIGGAALLAFGVLTALTTVPSTSQRINVLLWLAGGVVVHDAVLVPLALLVGVVVLPRVPPSWRPALRGGLLALAVLGIVAVALVAGAATRANPSVVPQDVGAALALAGIVLVVGVLVGMFLGGARRPR
>tr|A0A1Q5JW10|A0A1Q5JW10_9ACTN Lysophospholipase OS=Streptomyces sp. TSRI0107 OX=1703942 GN=AMK31_31985 PE=4 SV=1
MDDAREHVLTGTRGAITVREWAHPRPRYTALLVHGYGEHGGRYTETAGVLAEHGAAVFAPDHAGHGGSAGERVLIEDFEDVVADVRQVAERARAAYPGVPTVMVGHSMGGLISARYAQRYGGDLAALVLSGPVIGTWETPARLLAHDAAHGEIPDIPISPAALSRDPRVQAAYAADPLVWHGPMKRPTLRAFVRALQDVAEGGDVGPLPLLWLHGDDDRLVPLAGSRTGVERLSGGALTERIFPGARHEVFHETNKAEAFAEVTAFLDRVLGA
>tr|Q87XS4|Q87XS4_PSESM Uncharacterized protein OS=Pseudomonas syringae pv. tomato (strain ATCC BAA-871 / DC3000) OX=223283 GN=PSPTO_4102 PE=4 SV=1
MSAFFRLFLRFFAAQRHGLLEGVAHFVEAFVVQIVNAPGALCAQVDQFFIVAHGLPLSDTGKQCQ
>tr|A0A2I2FRI4|A0A2I2FRI4_9EURO Uncharacterized protein OS=Aspergillus steynii IBT 23096 OX=1392250 GN=P170DRAFT_441696 PE=4 SV=1
MSVPTVRRAFGSISKQRSLYSVRDRLHFGILVHLFNIALALVLLPLNNTILLAAYTAGYLSFVLSRSDPIQRRQAALRDVQFYPKTILVTGVDTPHGLAVARSCYHQGHRVVGVSVTETAIPSGESMSKALGAFYRIPKTKYVSRLLDVINREKADVWVPCSEKASVLDDAMAKQVIEGRTECKCITMDTELASMFGRPATFRQYLVEKELPVVENHQVQSRDSIHKILHRSPTKTYRISRPDPVTRENKIITLPKRTLSLTYSEVSEIQISKESPWTLQQQSRLGEFLAEMLVVHGHVKAIKVRPADDQSTWGRSRLDEGLTMSIHKLMERFALKGGYRMTGHICVRVMVDEEVDANQVRYALHINGCTQGAGAVNDLLQDASEQLVRGYLSVEAPHLNGFMASDSVDALRIQAAQSIVSTTPRPKFSLYQKLKEHDDENLFTVLYPVAQHIDTLISGTERALMFWRDWRFSIHDPLPWWWDAHVYQPLKELESIVSGAEVKEA
>tr|A0A1Q5DAT6|A0A1Q5DAT6_9ACTN Nuclease SbcCD subunit D OS=Streptomyces sp. CB02058 OX=1703921 GN=sbcD PE=3 SV=1
MRILHTSDWHLGRSFHRVPMLDAQAAYLDHLVETVRARSVDVVVVAGDVYDRAVPPLSAVQLFDDALHRLAAAGVPTVMISGNHDSARRLGVGAGLIARAGIHLRTDPADCATPVLLPDPEGGDVAFYGLPYLEPALVKDSLGASKAGHEAVLTAAMDRVRADLAARPDGTRSVVLAHAFVAGGEPSDSERDITVGGVAAVPAGVFDGVDYVALGHLHGCQTVTERVRYSGSPLAYSFSEHTHRKTMWLIDLGTGGDLVAERVECPVPRPLARLRGRLEALLEDPALDRHRGAWVEATLTDPARPDEPMARLLERFPYTLSLVFEPERTPDDPSASYAQRLRGRDDQQIAEDFVAHVRGGSGPSARERTVLRAAFDDVRVDDVTGEVSR
>tr|A0A7Z7ZTA3|A0A7Z7ZTA3_9MICO Type III secretion system (T3SS) chaperone YscW OS=Cryobacterium psychrophilum OX=41988 GN=EDD25_0264 PE=4 SV=1
MDESDDDAQTVRGTIVFPPAQRPEEPFTVIVQLEDVSRMDAPSRILAEVRLANRDFGAGRGRELPFRLPFPTELLDPAKAGPLRLNLRVHVRHTAVSHEPASRGIMTHVDVTEGDFVSTQSHPVPRGGALVRIPVQRV
>tr|F9WTX3|F9WTX3_TRYVY Uncharacterized protein OS=Trypanosoma vivax (strain Y486) OX=1055687 GN=TvY486_0039130 PE=4 SV=1
MLGKSCHQLQKNKKLIEMIDTRDECKSYTEKYSVSIRLSSYAEKLDEMNNLIEWKNEMVKLVGQTHKEVKSSAYRGNLWTVNDEKVKEVVQAIRNLTDKPVVTLELLETVRVSVVEANKTVNSTVNSMENVNKTMLSALEGNGTLLPQLVGQYSEVSAQLHERKGRLATTQGNINSTMKAIENALVDVAATESLVKYVNGLILLLSLFGYSSVSRQLRGAKIASETTHDTSDAKAAALMASELPGSAHSYASTAQVEIERETGSLESIKPQLMKHLNETGISISSLTTEACDKGLSKVFNGSLAVAFSRAAGLNSSGMAKAQEALKKLKAEAALVNAKLAYINGSLQQAEKAVQDVDQHDEAVMSTVKNSIVEVVSGAMKDLCETMKGLYTFRLASTSLNEEAEGILGNVSVLVGLSNVTRNKMNKAVKTVPNAAEYFGVANRELAVFARATNKIEKLHSTVQSDVASFLEEQMKRESHINTTHMPSL
>tr|A0A1V0RMR8|A0A1V0RMR8_9RHOB Uncharacterized protein OS=Roseovarius mucosus OX=215743 GN=ROSMUCSMR3_01389 PE=4 SV=1
MTIFTPLTAATNADRLEPSHDTVYSIAFAALLPSLADFIEAERDLDDICHSYDPAYGVWHRDAQVARMRLDSTLRHVHGLRVERPEDQPLRRMALLADAMLKDGAPERPQYLHRQMKLVFFRQFQVQGFGPTAHSRNAMLIQARHLIDAMMRLPLFDYSPDCAIAPDASAPADDLSPAFF
>tr|A0A0J8BW32|A0A0J8BW32_BETVV Uncharacterized protein OS=Beta vulgaris subsp. vulgaris OX=3555 GN=BVRB_8g185090 PE=4 SV=1
MRSKREREELTDGEVKRQRVEKDEEEEVSSPKTHAFENPLLPLASYNDDDEEEEEGNVKKAEVNGRKNEIVDDDEDDDDEEDFKFGQGKHNRLVVVRRDCPYLDTVNRQALDFDFEKFCSISLTNLNVYACLVCGKYYQGRGSKSHAYTHSLEAGHHVYINLKTEKVYCLPDGYEINDPSLDDIRHVLNPRFSKEQVEQLDKSKLWSRALDGSDYLPGLVGLNNIKETDFVNVTIQSLMRVTPLRNFFLIPENYQHCKSPLVHRFGELTRKIWHTRNFKGQVSPHEFLQAVMKASKKRFRIGSQSDPVEFVSWLLNTLHADLRSSKKNTSIIYQCFQGELEVKKEIQSKGTVERRLKGNDQNGGSENPNVITETSKMPFLMLGLDLPPPPLFQDVMEKNIIPQVPLFNILKKFDGETITEVVRPQIARMKYRVTKLPPYIILHMRRFTKNNFFVEKNPTLVNFPVKNLELKDYIPLPTPNDKEKSESKGNKKMQSKDHEKLRSKYDLIANIVHDGKPSEGSYRVFVQRKSEEQWYEVQDLHVSETLPQMVALSEAYMQVYELQQPH
>tr|A0A430LAB7|A0A430LAB7_9HYPO Uncharacterized protein OS=Fusarium euwallaceae OX=1147111 GN=BHE90_012892 PE=3 SV=1
MDSKNSLLYKNFHKHPAALVESASGIYLHTSDGRKILDATSGAAVACLGYDNKEVQKAVVDQLVSVPYCHPGFYKTKSAEDLADFLVDSTNGQMSKAVLCGSGSEAVEVALKLAKTHFSHLAIPQTERCHFIARVGAWHGATLGALTLGDFKVRKDPFVQLISQNSSRVSACSTYRGLRKGETEEAYVQRLAQELDDEFQRVGPNKVCAFVAETVGGSASGCAMPVKGYFPAMKAVCEKYGALLILDEVMCGMGRTGSLHAFEQEDVVPDILVVGKGLGAGYAPISAVMLNTKLVESFQKSGKGFAHGQTYMAHPQAAAAGLKVQQVIRDTNMVAHVQRMGDYLGSRLKERLLPLPWVGDIRGRGLFWAVEFVIDKKSKDPFPYSLGLHGMLHSKGMSKGYEISLFNANGGYDGYSGDHFLICPPFIVNEADVDEIVDRTARVIEDTFSELVNSAVWEKIAIQMDISTEAPVTDISVGETLVSVN
>tr|A0A5I4QS92|A0A5I4QS92_SALET Mn2+/Zn2+ABC transporter ATP-binding protein OS=Salmonella enterica subsp. enterica serovar Agbeni OX=1967642 GN=znuC PE=4 SV=1
MTSLVSLENVSVSFGQRRVLSDVSLELSPGKILTLLGPNGAGKSTLVRVVLGLVAPDEGVIKRNGQLRIGYVPQKLYLDTTLPLTVNRFLRLRPGTQKTDILPALKRVQAGHLIDAPMQKLSGGETQRVLLARALLNRPQLLVLDEPTQGVDVNGQVALYDLIDQLRRELDCAVLMVSHDLHLVMAKTDEVLCLNHHICCSGAPEVVSMHPEFISMFGPRGAEQLGIYRHHHNHRHDLQGRIVLRRGNGHS
>tr|A0A6H0AMT6|A0A6H0AMT6_9MICO Transport permease protein OS=Clavibacter michiganensis subsp. capsici OX=1874630 GN=GW571_05855 PE=3 SV=1
MTAVRPARPAADRAPSLPGVVPLGIHRVRYEVRRYFRQTDTIIFTFLFPVIMLSIFSVAFGSSGNLGTAPDGSGGVSAAAYYLPGMIAAGILLSGVQNLAVDIAMERSDGTLKRLAGSPLPVLSYFIGKGGQVIVTSLLQMVVLLLVARFAFGVELPTDAGRWATFAWVYALGITSSAVLGIALSRIPRSGASATAVITPIVLVLQFISGVYLTFTMLPTWLQDVAAFLPLKWMAQGMRAVFLPDALASVERGGTWDLAGVAVVLAVWLVGGTIAAVATFRWIRRDS
>tr|A0A668RY45|A0A668RY45_OREAU VEFS-Box domain-containing protein OS=Oreochromis aureus OX=47969 PE=3 SV=1
MAPHKQSHPVGLGSGGKPNGLYHHQPSSASMAAAKKPNMQLIQADHELFLQAFEKPTQIYRFLRTRNLIAPIFLHRTLTYMSHRNSRNNVKRKNYKVDNLLFKVEKMRGEQETHSLASNLQLTFTGFFHKAGKLSQDSENEQNSVSLEVLLVKVCHKKRKDVSCPVKQVPTGKKQVPLNPDTSAGVQAKLSSYPSLLVPSSEFEPSNSHMVKSYSLLFRVSRPGHPRTQINGLANGEIHHKEAVNRKRRSSALREEGETTFVAQMTVFDKNRRLQLLDGEYEVSMQEMEECPVGKKRATWETILDGKRLPPFESFSQGPTLQFTLRWTSDSADHSTAPVAKPLATRNSETNQDTRPSTLRATHTPTVKESVNTDVQTRREQVLSEPRQKLRIFYQFQYNNNTRQQTEARDDLHCPWCTLNCRKLYSLLKHLKLSHSRFIFNYVPHPKGAKIEVSINECYDGSYAGNPQDIHSQPGFAFSRNGPVKRTAVTHFLVCRPKRTKPSLSEFLESEDGDREAQRTYISGHNRLYFHSDSCLPLRPQEMEVDSEDERDPDWLKEKTVKQIEDFMDVNEGEKEIMKLWNLHGLFCLFMNEACLLFAEHHAAVIVKRNLCRNFLLHLISMHDFNLISTLTINQAMARLRLVESQSEASISDLPGTLSSTKGFLLAGSVCTCSVESRLRRLLGVKSAAVLQKEV
>tr|I6XM23|I6XM23_9CAUD Uncharacterized protein OS=Pseudomonas phage MP1412 OX=1204517 GN=MP1412_18 PE=4 SV=1
MDLEKLRRDWAEDPQLKFYAFDTVEELAAHLRKVHTDMMNGEHGCFGYLYRQQTLRLRELMKELQDERERKASGR
>tr|A0A498P3D5|A0A498P3D5_LABRO VPS10 domain-containing receptor 3-like protein OS=Labeo rohita OX=84645 GN=ROHU_001246 PE=4 SV=1
MRGRMIKMKDVLGFESSWTYWTLFCLCALLPLPASADITCASCFAPIRRNEAHAKPTAVVSRDFGSAKDGSTDKNWKWRLDGAQLSPEAHKKSPFVSRRQKLQNAHIPRAERTSPAGEKDGKVYPTWSPVETKVDRREKRSLSDSASGSRFEFRRTGGVDGTGKSPRQNEPHLITSTFALSGDAAHNQAMVLWSGHNSSEDGSQGSRVAEPVAVNTLTRGHIKPVKTHSGKTDARLFTVVYERVLRMFCQVILILTKLFDFNLGTVTESSLWRSVDFGTTYEKLTDKVMIRTMLSYLYVCPTNKRKILILSDPEVESSLLISSDEGATFQKFNINFYIMSLLFHPTQENWILAYSHDQRLYSSVDFGKKWILVHERVTPGRFYWALSGLDKEADLVHIEARTDSGQMQYITCRAQKCSEEGRQYPFSGRIDTNSLVVQDQYIFLQLTTAGRTTYFVSYQRGPFRTIQLPKYCLPKDMHIVSTDEGQVLAAVQEWNENDTYSLYISDTPGVYFTRSLPNLRTSRGLAGNLIVDVYKVAGVSGLIIANKKEDAQMRTYITYNKGQTWSLLQPPAKDTTGHDINCNLPSCSLHLHLQMSENPYTPDTISTKHSAPGIIVATGNVGPELSFANTGMFISSDAGNTWRQGEVCVMGERQVYMKRKPGTHCTLGREYSRVVSAEPCICTLYDFECDYGFERQASGKCAPAFWYDVSLPAHTCSHGQRYRNSTGYRKVLLNNCREGLKDTLSPRMQQCKPIAPSGLQLSTVNSQLTAVLGTNITFRVALQNPLITLEGSVSHTFTREGPNSVTVQVSAGGTVLQDVKIITVKDFFRSLLLSFSPNLEEHNPSVAEWRQDVGRVVRATLSQMSEVFMNALNQNLIQFDLKPDTRVTVSVSQLTLAPLVDSSVLPSGSAMLLLVSLGLVGLAILFIYKFKRKIPWIHVETEDTHEKEPEMISAVGQEKNGTRTTATSFTTCSTHTTHTPFPSNTGTHNSFSHLPPPRDLMEKELEAHNTGGLGVGERQRTRQIPNCTNV
>tr|A0A424MM85|A0A424MM85_9GAMM Tryptophan synthase alpha chain OS=Gammaproteobacteria bacterium TMED112 OX=1986734 GN=trpA PE=3 SV=1
MQNSNLLTVNKNKTAFIPYLVAGHTSNEVFSAALKLLNDVGADLIEIGIPFTDPIAEGKIIESAHHHALKNNFVLSEVCKIVKEFRTYSDTPVIAMGYTNSFINPSSEYIATKLSESGFSGVLIVDLPASEKSIINSFTEKKLNLVQLIAPTTQLNLIESFLENDPALIYYITQRGITGSTNLDLAEISEKLSSIKKLSNKPVVTGFGIKTVEDVKNLKNLTDGIVIGSPIVEKINLDSSLNALKEYLKPIVKAIKE
>tr|A0A4P7QD82|A0A4P7QD82_9CORY Putative NUDIX hydrolase OS=Corynebacterium endometrii OX=2488819 GN=CENDO_01140 PE=3 SV=1
MTFIPQPDAPGSNVTLRPEDSPAWMRPALGIDAAHAQRTMGDRAVTNGPWKKEAAVLVLLAGDSVEEGSVLLTHRSPRMRSHSGQIAFPGGRIDPEDLNAVDAALREAWEETGLDRSTVTPVEQWARLSIRATGNPVSPVLAHWHEPSPVGVASPNEADDVFTVPLADLIDPANRLTVGWGQWSGPAFHAQDYVVWGFTGGVLATLLERAGWAEDWDRDTVHPLHETLARSRNNERMR
>tr|A0A257QSR6|A0A257QSR6_9PROT DNA topoisomerase 1 OS=Rhodospirillales bacterium 20-60-12 OX=1970565 GN=topA PE=3 SV=1
MTDIVVVESPAKAKTINKYLGDGYHVLASFGHVRDLPPKDGSVKPDQDFAMLWESDSRGEKQVGAIAKALKGAKILYLATDPDREGEAISWHVRAMLEDKKALKGVTVKRVTFNEITKSAVTTAMAHPRELDQPLIEAYMARRALDYLVGFTLSPVLWRKLPGSKSAGRVQSVALRLICEREAEIEIFKAREYWTIEAGMITPAGAPFTARLTHLQGKKLDQFDLPNEAAAMAAKAAVQAGDFSVVQVEKKRTRRHPPAPFTTSTLQQDASRKLGFSAQQIMRTAQQLYEGVAIGGETVGLITYMRTDGVQMAREAIMAVRDRVKANFGTDYLPATPREYNSKAKNAQEAHEAIRPTDFGLSPDQAGRYLNAEQSKLYELIYKRALASQMQSAELDQTSVDISDAAGTTLRANGSILAFDGFLRLYREDMDDVADDDDAKILPPLAKNDPLKRGEVKAEQHFTQPPPRYSEASLVKKMEELGIGRPSTYASILTVLRDRNYVRLEARRFIPEDRGRLVTAFLTSFFARYVDPDFTAGLEEKLDLVSDGKADWRQVLRDFWRDFSAAIGQTTELKISDVIDALDEDLGPHFFPSRADGSDPRACQACGTGRLGLQLGRHGSFIGCSNYPDCQYTRRLIVDGEEGADTLKEGMKILGQHPETAEDVTLRRGPYGLYVQQGEPVDKEKPRRSSLSRGMNADDLTLDQALGLLSLPRLVGPDPQTGQKIEAGVGRFGPYVKMGSIYASLDKDDDVLAIGLNRAVMLIAKKAEGIRNVGPHPKDGADVMVRKGRFGPYAQHGKTVANLPRGTEIADITLDEAVALLAERGKTLAPKGKAKAGAKKPAKAAKIMATGDAAPKLKPKARPPVKAAKPKAAPAGTAKPAAKAKPKPKAAPKAAAKPSAKKAAARAK
>tr|A0A087GHN3|A0A087GHN3_ARAAL RNase H type-1 domain-containing protein OS=Arabis alpina OX=50452 GN=AALP_AA7G126600 PE=4 SV=1
MYIAESGTSVSAVLVREERGEQKPIFYVSKTLTDAETRYPQLEMLALSVVIAARKLRPYFKSHSIVVLSTFPLRSVLHSPSQSGRQAKWAVELSEYDIEYRGRSCAKSQVLADFLIQLLEGDVAKEDSSQEATLSGEWQLHVDGSSSKSSYGIGIRLTSPTGEILEQSFRLGFKASNNEAEYEAILAGIRLARAFNIEEISVFSDSQLVVNQFSGKYATKDERMEACLGLAKELAALFKKFMFTQIPRGENVNVDALANLASTSDPALKRMIPVEFIEFPSILPAVSLTIITRSQAARKIKVTQKRGENDGKDIVITDATKDNVEMSDATEDTPLTQTDPNPSRLPIANGSSYACY
>tr|A0A549YU05|A0A549YU05_9CORY MMPL family transporter OS=Corynebacterium silvaticum OX=2320431 GN=EU799_09205 PE=4 SV=1
MFSRWGDFAYRHRRVVPVAIVVFIVAIYGIFGIRLADRMSQEGWDDPGSSSTQAANIEQEVFGRDNSGDVVLLFSSEDGIAKNKNFDEIKRYLSDLKALHPNQIADVTSYFDNRNAQLLSKDGKTAFAAVSLRGDHEQTLKDFRAIKGNLKPKFDGVTVQVAGATAVADALDSGMAGDIKRAEVVALPLVAILLLFVFGSVVAAFMPLIVGILSILGSLGVLSILAGFAQVNVFAQSVVTLLGLGLAIDYGLFMVSRFREEMDQGRDIRDAVRITTSTAGKTVVFSAAMVAVALSGLLVFPQAFLKSVAYGAISAVGLAALLSITVLPSIFAMLGTRIDKWTLRRTKRSARTLADTWWYKLPAWAMKRSKTVVVSVVFLLIALTVPLAGITFGGINETYLPPNSDVRKAQSTFDQEFPAFRTEPIKLVVSNATNDQLIKVYQQANTVTGLTDRFKPSTATKDGTTVLSAGIAERKDNESVVKQLRAIEVPEGVSVHIGGTPAMEVESIEALFEKLPWMAIYIVLATFILMSLVFGSMILPAKAIIMTILGMGATLGILTAMFVDGIGSSLFNFSAGPLMSPVLVLIMAIVYGLSTDYEVFLVSRMVEARDNGESTDEAIKYGTAHTGGIITAAALIMIVVCGAFGFSEIVMMKYIAFGMVVALLFDATIIRMLLVPAVMHLLREDNWWAPRWVKRASEAMGHNSAPEPLPVASRPVESGDKPARRVEPAQPRVPVSAYMDDTSTMAPVKEPPAPQRPAAPRPTPPRPMPPRTPPRTDAPAFNPKRTWGSTPATSHNAGGADTVEGQGSHTPKRKLHHSRRETLVSDTTVVDPRTAGRSGRIASEDNELVPFSELVKRLREEH
>tr|A0A662N443|A0A662N443_9EURY Thioredoxin-disulfide reductase OS=Thermococci archaeon OX=2250254 GN=trxB PE=4 SV=1
MFSLTGLSTSGKDENKVRDVLVIGAGPAGYTAALYAARYGLDVDIISKDLGGQIALTDIIENYPGFPEGISGQELATRMYEQVKKLGVDVIFDEVVRIDPTECAYYEGPCKFEVKTKNGKSYKTKTVILAVGAEPRKLHVPGEDKFYGRGVSYCATCDGPLFKGKSVIVVGGGNTALQEALYLKSIGVNVSLVHRREGFRADKIVQDRFRESGIPMILNTVVTEIKGEAKVESVILKNLKTGETFEKKVDGVFIFIGYEPKTDFVKHLGITDEYGYIPVDMYMRTKVKGIFAAGDITNTFKQIAVAVGQGAIAAASAKELLEDWREKNLSE
>tr|A0A7U9R2R0|A0A7U9R2R0_9FIRM HTH-type transcriptional regulator YesS OS=Lachnospiraceae bacterium OX=1898203 GN=yesS_1 PE=4 SV=1
MKAFHFFRHSRTYRRMFLHTYVLYAASSLLLLLAAGLFLFYQDSHTIRNNTLQAAANLAYYADDRLSACQKLSASVGQSERLLSLSSNAATDLDFSLLDSTTLFAAQHDLVSAKALNRFAATLGVYLYNKGFVVSDYGTLTLESFYQSIFNMSPNVFSEYLRPLGSGSYLFLPRGAVEETGTPQHPLIVLSVIDSNSRRYGNLFIFMDERQMREDIEQLLNNRDMEYYLFAGEGQLVVSNRCADPKELSRIYSGLMENDSYQSNTGKYSGWTAFAGYSDAYLRERLHRRLWILAAGLAFLLLSGLPLTHAICRKNYAPIRELAYIVSSPEQRSDNRDMEYEALKSIISSIFKDKSLLEEQLLIYRPLLVNSMLLELLEGAQPRKEVLPGLQKLGIRFPYPYHVCCCLLTARATQDFLMSLAQATRDGETGCLYITFRKHLGIFLISASSPEKCGDAVTRLLALLAEVNPDAFLGVSDAVDDLEQLGAACQQSRSALEYLPSDPFSRGIYWSRVKSSGILKLALPTCLASLPNAFGTGQFAEARNNLNLYFQTISRCGLTKKEHLTHARDRLLEAISRAEKEHGLLFDSASLLNWTPEQPHALKCLQESAFLACDRLERDMLESREQQSLNAAQNLMDYLQLHLRDEDLSLSKLAETFQLSESSISRRIKQITDYNFLEYVNRKRIEYACSLLSETDLSVNDISKASGYVNDITFRRLFKKYMGVTPGEYRRQA
>tr|A0A540WLW0|A0A540WLW0_9DELT LPS assembly protein LptD (Fragment) OS=Myxococcus llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogochensis OX=2590453 GN=lptD PE=4 SV=1
MSLLVPLAAALLVSSAQIPLATQVQLPSGETVELAADFLTYEADKQLLTARGHCELRTGEMLLRSDEVTYDEANQVATATGNVMFVGPDGMAAVADDVHVDIRTFVATLKGGLFMQKKGVTQEALLTAKTPQELRAMGETPIILSGSRIRRTGPNAFVVDDLAFTPCECGPGTPTWRMEASSANVILGERATLTWPVVYIQSVPIFALPWVYLPLAERRTGFLFPSPQFSSLNGLGLEQPLFVTLGRSYDLTFTPGYYHGALVEKTHDPDGNSETKNTITYEEPRPNGVKGPRLLTEFRYVPSERTRGRATLGFLYDSRPKLDPTTLDFFRYPVDPNGIRKIIDAPRGLRGEASWQHFQDLGSGWYDRVDASVVSDGNYTRDLTADILVQGLDYLRSTATVFRRQEDSYAGLDVSLRQDIRWPYRFFQDNRVPAEVDPLRPDLPSPRTFQRLPGLVLSLPERPLLGGITGGLRAEFTRLAPIHEGFGDEGVDGIFRPNGNYLLLGVGDAPDPGQSNALFDSRDREARDRIDFTSRLSTSVALGDVARVTPSLSLRQDVWAGEYSGKSWQRGYPIGGLMLDTQLSRTWTGAKTSYRHSFAPSLELRYVPGGWG
>sp|B8CSY5|RL21_SHEPW 50S ribosomal protein L21 OS=Shewanella piezotolerans (strain WP3 / JCM 13877) OX=225849 GN=rplU PE=3 SV=1
MYAVFQSGGKQHRVEAGHTVRLEKLEVATGETIEFDQVLLVADGETVHVGAPLVEGGKVVAEVVSHGRAEKVTIVKFRRRKHHDKKMGHRQWFTEVKITAISA
>tr|A0A815PV26|A0A815PV26_9BILA Hypothetical protein OS=Rotaria sordida OX=392033 GN=JXQ802_LOCUS53044 PE=4 SV=1
MEELIRSVIQFDGALNQDVIQWLEYIEEVFDRVQLQTSNKYIAIQYFLTNSAATWFKYKKSNIPDWFTFKRELIEAFQSSSSFSSSHLLDRHQLIIKEEPQKLEQEQDILPVPASTSIISNKKNDSEDYQLDLVHDGSIKSLENLEVDDLEDKCLHEHEQGYYSSILVNTNDFDLDIQHQDADAADSCDTQQQGANVADVCDQLEQQGESVINSDSVQTDIEDTFEDFTRPMDSLTGNDSLINIVLPHDVQYLWSDKYKPRPPRILNKAHAVYNWNRYNKLHCNQDDSPPPTIQENQFNTVSTEWNYTYNHGLRFYFYNEMIQLRFSFQKTRKEVIVLRTLQHENIVGYKTVWCEHPPDDWQKKQEKSFQVPSSSEDSTTGFNTIHSISKESKSNQESNDDTSNPFHHSEKWVPLNANSDENKKAPEITNIRSEEEEDNNYEEQ
>tr|A0A444Z367|A0A444Z367_ARAHY Rep_fac-A_C domain-containing protein OS=Arachis hypogaea OX=3818 GN=Ahy_B05g076446 PE=4 SV=1
MISLFKSLISNGVVYAFAYFRVYNNRGSYHTTSHHFRMFVQAIPTVRPSFCNAILLYSIKLVPFTKIMGYFSQHPFLVDVARVITGVEGERKYVKDGKLIDMLLNVAVLGEMVERIKDFVAAGEQQVPVVIFQFATVKTFRGLHRCHEKPPHVEEKDVTHRIEEGDDILSSLRLVAVAERGAPSSPSRLRVWGFEEREKLAEERETVCCREASQYLSILSSKLAYVAEDEVLYSIERKTIKELRAVGFYIVLATVLDVEPALIWWYKSCVCSVKAKANADTYFYDGCNKDVNHVVDMYKLDLLVFYGTATTTFVVFDKEATALFGWTCTEMVKELNEKGKAGKDPIGFKEFLFKVELKTTGWCDSYDVSLISFELTILARWRDTQGLVKSGIAPAGPTTHFDGDDFLIFEKKRSIEQLKLSKEFE
>tr|A0A379C7X7|A0A379C7X7_9FIRM Uncharacterized protein OS=Peptoniphilus lacrimalis OX=33031 GN=NCTC13149_01564 PE=4 SV=1
MDKKTDAPTFTKEQFLNAKDPIGNVDALYAILEDGKEYTKEEALKIYEDFMNREVK
>tr|A0A2I0I053|A0A2I0I053_PUNGR Uncharacterized protein OS=Punica granatum OX=22663 GN=CRG98_042231 PE=4 SV=1
MVKQGFEGRSRRNRSPRWCQRHPKSLVAMVWAAQQRREGVVKETHKTHRIGRFNGILLKTDRFNGSDGSKLQFRFSGESDRTWCRFSEPAGPDHGPSPPATAPARSRSGCSLRSTPARYTFEGVVCLFVGEHCHHRGDEVPGGP
>tr|A0A1L9V3M1|A0A1L9V3M1_ASPGL Chorismate synthase OS=Aspergillus glaucus CBS 516.65 OX=1160497 GN=ASPGLDRAFT_40709 PE=3 SV=1
MSTWGQYFRVTTYGESHCRSVGCIVDGCPPGLQLTEDDIQPQLTRRRPGQSVLTTPRNEKDRAEIHSGTEFGHTLGTPIAIMVRNEDHRPRDYGGQTMEVFPRPGHADLTYLQKYGVKASSGGGRSSARETIGRVAAGAIADKYLRLVHNVEIVAFVSSVGREYLNPPTPEHPSGINPEFQQRLKGITRSIVDQFEPVRCPDQEASQRMIRVIERFRDEHDSIGGTVTCIIRNVPTGLGEPCFDKLEAKMAHAMLSIPATKGFEIGSGFAGCVMSGSAHNDPFVRQNRVLVTKTNHSGGVQGGISNGSAIYFTVAFKPPATIGRPQSTANYQLQDSVLEAKGRHDPCVVPRAVPIVEAMTALVLMDALMAQYARDAARGITGASGWGNKCV
>tr|A0A7N5JEP9|A0A7N5JEP9_AILME Lipocln_cytosolic_FA-bd_dom domain-containing protein OS=Ailuropoda melanoleuca OX=9646 PE=3 SV=1
MPPNLSGYYRFVSQDNMENYLRALDINVALRKLVCLLKPDKEIIHTGDHMTIRTLTSLRNYIMDFDLGVEFEEDLGPVDGRKCQTTTQTR
>tr|A0A353MIV1|A0A353MIV1_9DELT DUF490 domain-containing protein OS=Geobacter sp. OX=46610 GN=DDY22_22195 PE=4 SV=1
MRRAALYIGCALAGLLLLCLLGLFWLLDTTAGARFAVTALTGAAGFNISMQGVEGRLLDRLHLTGVRVSKPQLRAQIDRLDLAWEPRQLWNGHLQVHELAVSGVRVQDDRPATTEPPQLRWPRVSAPLRGLSAQLSRLKVKDLSYRHLEAAPLLVTELTGSLHFKDGLLSASQLSLLSPDGRVSGEIAAGLWHPSLRLDLAVVPAQPVQELDFFSLQARLLPGRLPEQLAGGIVVAGRSGGARRLELTGELGIAVNALNLRRLKLSRPGSRGTLTGDVSMLLSKPEPLFSLALRATDLDLAKELKLQLPTRLSGTVTFSGSLSNFLGSFDLANSGPGWQTASLAAQYRGGPTGVKLAPLTGKLLDGRLRGALEVAWSEGLRISGNLAGRGLNPGRLAAQWPGLVNLDLAGKLEMPEQGVARGELRGKLLESRLHGRDLQGELVAAFAGERLRIDRLLLRGRGFNLQGAGELDRRLNLAARVSDLSGLVPGAAGQLQADGWVRWRDGLFSGAASGQGANLAAAGVSAAALRLDARLGEGKSPPVYLDASLNRLRVGRFQADSALLTLQGTPASHTLTAKLSSSSFAEAPADSSAFAEASASAKTLAELRVALSGGYRDGVWRGELTRFSGRDGVGPWSLAAPTPLMLSAQRMRIAPLVINGLPGERVEVAGELERQPLSGAVRGAWGGLNLARANAWLDGVQLAGASSGDLSLRLLPGERLILTGRAEAKGTLVADGQRVDLERLAATLQGDAGGLRAAVDLTLAGGDGEAHLLFTSTDPASLALPKRGDLTLNWSEFDLALLRPVTPAGLIVDGRSAGLVRGKLLPGSKLELRGNAALDQGHLNWRAEGDELDASIDSAELSFSWRGGTQGAGKGGAGLLTLNARAAATGLYTSKGQRIALIRGTLRADADEQGSRAGLDLTLEEGGALRVDLSSDSPASLGIPETGDLAMEWGGIDPALLKPWLPGTLDLQGEFAGEASGRLLPGKRLEMAGQAEFSQGRAKWQGENGEVSANLRSANLSWNWRGETLSGALSLALAEYGQARGSFVLPIPARLPLLPDRNGALQGALAGRVQERGFLTAFLPGLVQESHGDLDLDLKLAGTWSDPRIAGSLQLSKAGAYLPTAGIRVSDVQLMARLEGDQVRIDNFRAVSGAGHIEGNLEARLEGWQVAEYSGTLSGERFQTVYLPELQMVTSPQLSFKGGGDSVTLRGELRVPEMLVSGPPVRQIVTPSGDVIMEGAPPASEGKPFPLALDGRIRVVLGEKVEVKASGIDAQLGGSMDLVLQGVDSITSSGEIRVVKGRYRAYGMDLEIVRGRVYYVDDPVDQPTLDILALRKVGDVRAGVTVAGFLKAPIVKLYSEPPMPEVDILAYMVLGHPLGASSEQGNMVAMAATSLFSLGESSSVQEQIKDRLGLSVLGVETVDTAGVGLMGYKEIPVTPTGEAQARPAAAESLLTVGKYLTPQLYLSYGRSLITGGNLFMLRYDISRRWQLETQSGSESGLDLYYKLEFN
>tr|A0A1R3FS38|A0A1R3FS38_9VIBR Diguanylate cyclase OS=Vibrio sp. 10N.261.45.E1 OX=1903177 GN=BH584_20360 PE=4 SV=1
MKVTRKYILRFSIALAVVSMILSAVQFNRTEKSLLESNQLFFRTIVNASYDIVDTTVNEAIKTYLKGITDTVASHVWHATPEQEIEQVKQIASELHIGQSGYIYLMSPQGVHLYHPFLQGKKRGHLTHIQKQLSIDSGMSEYFHANPHEISRRAKVAYSMRLPSGNTLVATTYKEELMYLVDIEGLKDKLRKYAFGDSGYVYIIDLKGDLVLHPDYEHKSLQSLIGYSSQLLIDRIATKPEGHFSYSVSSDSGTSSKNVFYKFYPYLNWVISAGILEQELNRNHSLLFISLMALVVSLLCIIVVLVLYLRHRHLKILDVASLDYLTGLPSRRSFIEQLKLKIAQRSPNSLTNVGVILLDIDHFKRVNDQYGHAQGDRVICEVAKSLKRFVNRRRLIARYGGEEFILVTFDCDERELFELSEALRLCIQQLQGLVSPVTISAGCCHAQALTDIETAIDQADKALYQAKESGRNNTQMYRENEYRVAYM
>tr|A0A509DWZ7|A0A509DWZ7_9HYPH Uncharacterized protein OS=Thalassocella blandensis OX=2584524 GN=TDB9533_01798 PE=4 SV=1
MQNKSSQATFENLTQFRTIRRKQMSGGTELPAMTPNEVTAKVVEDINFLRGRIDHIKKAKHANTNPSILKTYESMLESRETILAWLDENYHIQINQSAQVATASAKTSSN
>tr|A0A7C3D3X0|A0A7C3D3X0_9BACT Ubiquinone biosynthesis protein UbiB OS=Bacteroidetes bacterium OX=1898104 GN=ENK07_06575 PE=4 SV=1
MAITSAPRKLKRTRQVMSTLARHGLGAFAAGARRWYTTVLPYRKARPGVEAIPVEVRVRIALEELGTTFIKLGQVLSMRPDLIPHSLAQELEKLQDKAAPLPFDVVEKELARALGPDFREQLGEIEPEPLASASIAQVHRATLPSGEIVVLKIRRPGIKRQVETDLAILHDLARMAERTVTELELIEPTRIVEEFARTIRREMDFIREARNVERFRRHFRNDSTIYVPQLYWKFCRENLLVMEWIDGIKVSDVEHLRKAGLDPKIIAIRGAQAILKQVFEHGFFHADPHGANVFVIKGNVIVPLDYGMMGSLDDRLVRQIEDLLIGIVRMDVDRIMTVLENLGSIRPGTDTRSLYSELYDFLDRYYHVPLYQLNTPELVGELLDIVRRYRLRLPPDLVLMIRSLMLAEAGGRRLYPEFDMMTLAKPYVKRIIMRRLSLKRRIKEAPDTLEEVETLVRLAPKQVQSILSKASQGELSVRVDPAGIPEILHELDRSSNRLAFAMICAALVIGSSITISAGFGPFLFGFPLLGVVGFGLAALLGFWLLFSIMRGGKL
>tr|A0A1Y0RNH2|A0A1Y0RNH2_9CYAN TonB_C domain-containing protein OS=Nostocales cyanobacterium HT-58-2 OX=1940762 GN=BZZ01_25955 PE=4 SV=1
MSYVSLLKNIPEFLSQPTGIAAIASLGIHGAIALLLPIVPMASKPKQEQPSSKSSVGLVELSQAEQSRLPKPATPQLSLQPQAPVLPQVPPTNFANQSIPPLPPLPPPAASTELILPPLPKTDNLAVASLPKGQSLPILSKRDLQPDTSLRTKSRPFSPFVDRVKLGEPKPLESARIPDNIPPVQAANIPQEQDLVNTAAPMSSDQVATALPQGSTATQTTQPGDEVSQVARKQQLVTPVVQPPQARDSSIALGGQNLPQLPQGSNFTAPELPPLAAERSLSTPKTFAERFTEVKNQYPNLETKQPIAAIVDAKAGTEGNVEGDLVVNPQGQVESINFLDNSVASELKTSVREYFRQYFQSNPVQANGKPKFYPFNISFKLNSSNISKTPAQGLSTSSQVNQAQRSLVQRLRSVEVSSQPSKEPQKLNQVERLRSSSVNQQVSQTNQKTSAPQASQERQTSKQQVILRQTTSAPQTNKEEQTSRQQVVVRQSASSLQTNKEEQTSQQQVVVRQSTSAPQTNQEQTSQEEATNNQPSASIESSKKLLQQLRQIRDKRQTSNQEK
>tr|A0A3G1T1W8|A0A3G1T1W8_APPPP Immunodominant membrane protein OS=Apple proliferation phytoplasma OX=37692 GN=imp PE=4 SV=1
MEANQQKKILIGVGSVVGALVLYLILAWSISFWPFSSQSKQEIFDDLSNKITFSTDLEETNTIFNKAATERKKQFKEGFIDNKVNKLVELANKLTTPKITDGDKKTSFDSASASLKEITDNQTLLLNHNDDFWKAETNKTTVQGEIKKIIDAYVQFKTQIKTALDLK
>tr|D4KZC5|D4KZC5_9FIRM Uncharacterized protein OS=Roseburia intestinalis XB6B4 OX=718255 GN=RO1_22070 PE=4 SV=1
MGQSHNKSSFVLEKDRSAAKINHMEGMV
>tr|A0A261RL90|A0A261RL90_9BORD Uncharacterized protein OS=Bordetella genomosp. 9 OX=1416803 GN=CAL26_00210 PE=4 SV=1
MFSWFKQGLGAYAPAPVGASRRDKILGALGALLGLSCTEWIARHALGEASPWFIAPMGASAVLAFAAPASPLAQPWSLMVGNVSAALVGVFFSHLIPAPGLAAACSVAAAIAVMFALRCLHPPSGAVALTAVLGGPSIAQLGYGYALYPVAVNSAVLLCIAVVFNGVLKRNYPHRHVQAAPAALNRAATPLGFTGADLDEALRSHDQLLDISREDLADIVLEAERRASLRRFGGLACGQVMLRDAVVVRDDEPLDAALRLLDRHRLAALPVVDGQGHLLGLLAHGDASARTVRLASAPGAPSRASLARDCMRSEVAYATPAMPAIELARPMASGIACVPVVDDARRLVGVIHASQLIDALYQLALASGDSAAGNPAARRALDVAA
>tr|U3PX63|U3PX63_POPTO Cytokinin dehydrogenase OS=Populus tomentosa OX=118781 PE=3 SV=1
MAENPTITICLMAILFITRLASTLGKSKSWTGLLPPQIQTLDFARHLHVEPDAIKSVSSDYGIIVHENPAAVLYPSSIEDITSLIKFWYNNYTPFTVAARRHGHSVGGQAMASNGVVVDMTSLRNHKNGTGITVSKCPSLGFYADVGGELLWIDVLHSTMEHGFAPVSWTDCLYLSVGGTLSNAGISGTTFRYGPQISNVYEMDVVTGKGELVTYSSHTNSELFYAVLGGLGQFGIITRARIALEPAPNRVKWVRILYSDFSAFRRDQERLISINGRKQKNALAYLEGSLLMAQGPPNNWRSSFFPSSDIPKIMSLVTQHAIIYCLEVAKYYDDGTRHIVDQDLQQLLKGLSFVAGFMFEKDVSFVDFLNRVRSGEQKLHSQGLWDVPHPWLNLFLPKSRILEFNKGVFHDLVLKRNITTGVVLFYPMNRKKWDDKMSAVIPEEHIFYTVGFLHSSGFNDWQAYGHQNKDILKFCDTAGIEIKQYLPLYNSNKEWINHFGSKWRNFRERKAQFDPKMMLSPGQRIFNDI
>tr|A0A5B7BHJ3|A0A5B7BHJ3_DAVIN Uncharacterized protein (Fragment) OS=Davidia involucrata OX=16924 GN=Din_037375 PE=4 SV=1
QRRTVFNSDGSSKSKLQIDGDAASEDVGFDKIYPVESFSSESEGEEMEENSSRSYLKEVEQSKKKAGLERRLSASSLDSAGNDSSTIKMSSNLHDKNEPLSKEIVFDESDDETGNDQDNIPWLKHHDSSSDKKSNLPINEFPKTRQYNAAADEKHLYSQHSDRDRKPASMRTRRVHRD
>tr|A0A327WVV0|A0A327WVV0_9BACT Outer membrane receptor for ferrienterochelin and colicin OS=Larkinella arboricola OX=643671 GN=LX87_02312 PE=4 SV=1
MLVSIAAHAQAPVLFSGSVREITTQEPLQGVHVYVRDHRLGTVTNNAGYYTLALPARDSLTITFSSVGYQTVTRTISSHRPQPLDVYLIPGQTLNEVAIKAQAPLQKGSDLAQMSQIQLPIEQLNKIPALMGEKDVLRVLQLMPGVQKGSEGNAGVYVRGGGPDQNLITVDEAVVYNPSHLLGFFSVFNGDALKQVELTKGGFPARFGGRLSSVIEMSMKEGDRHDLHGTGSIGLIASRFTLEGPLQKGKSSFLLSARQCYLGALTQLLSPRPVSDLPSRSGFGDYNAKLSFDLGARDHVYVSGYTGSDQFRSQQTYDKQVLDAGLNWGNTTGTLRWTHRFSNRTSAHTALIFSQYRMRVVSEETVTAEAPGQPGAILRLEYLSSIRDLSLKQDWDLYAGSGHQLRFGFQITPHRFTPSAVVTAESQAASLSRTSDQAIQVVESGAYVEDFWQPTDRWRINAGLRLSYFWHKQTQYARPEPRLSVGYKLPGDWTLKGAYAQMNQYVHMLSNTGVGLPTDLWVPTTDRVKPQQSEQIALGVVKDINSDITLTVEGYHKTMKNNISYREGANFLVTDITATGDKARWEDNVTAGRGWSYGGEVMLQKKTGRLSGWIGYTLSWTQWQFAELNGGRRFFPRYDRRHDLSLVAVYELSKRINVSGTWVYGTGQALTVPLARYYASANNPEHTTTPAANPFIDTRNVKDYGEKNSFRAEPYHRMDVSLQFHTRRKSWENIWELSVYNAYNRRNPFYYSLEGKGGSEGIASKSVLYRYSLFPVIPTVSYRFTF
>tr|A0A364VAY8|A0A364VAY8_9CORY Coproporphyrinogen III oxidase OS=Corynebacterium heidelbergense OX=2055947 GN=hemG PE=3 SV=1
MTPRVAVIGAGIAGVSAAWELRRQLGPEANIMLVEAYDRIGGKLKTVNFAGGPVDMGAEAFLAFRRDFVELVEQVGLGHQLRAPSTEYTSSLYCRGQLVDVPAATVMGIPARGEDVQAILPAEERRRIDEERGGEPMTWEPGQDAAVGQLVEARFGRAVVDRLVTPLLGGVYSCGADGLGVRSTIPQLAAALDRAGAGGAQFYLSDVVADLLAVRTAGGARRSGPVFQTLAGGFRSLLEQMVLQADPEILFNTAVESIGRSREGWYLEPIGTVDGVVLAAPAPTAALLLRDVADTAAGILSDIELSSSVVVGMRFASDHGIPERSGVLLGPDAPTEAKAFTFSSRKWPHIAEHGGAFVRASYGTYDQPWYVELPDRALINFAAEDLEAITGERKRPEEYFVQRWHGGLPRYGVGYAEALKVAMDSVAAVPTFALAGAMVDGVGVPATAASGIAAARRLAADLSPSPRP
>tr|A0A0N4SWJ4|A0A0N4SWJ4_BRUPA Uncharacterized protein OS=Brugia pahangi OX=6280 GN=BPAG_LOCUS6 PE=4 SV=1
MTVRIKVENGFERITVDNNMYARQFRNTQHPVSGSIAVDGAAGEKNWSTGALRCIEARLTNQYCTSAAQRERRECRDASDARVEMRESC
>tr|A0A2D1UI31|A0A2D1UI31_9INFA Protein PB1-F2 OS=Influenza A virus (A/swine/Iowa/A02215363/2017(H1N2)) OX=2007353 GN=PB1-F2 PE=3 SV=1
MEQEQDTPWTQSTEHTNIQKEGNGRQIQRLGHPSSIRLMDHYLKIMNQVDMHKQTVSWRPWLSLKNPTQGYLRIHALKQWKLSNKQGWIN
>tr|A0A7S3I079|A0A7S3I079_9SPIT Hypothetical protein (Fragment) OS=Favella ehrenbergii OX=182087 GN=FEHR0123_LOCUS5015 PE=4 SV=1
MSIKCLAARQNKSAAINSYGELFMWGSSKNRSLMHASGNGHKDNLKLPTVFESETLLFTKVAVGNEHVAAITEDGRLFTMGTTEHGKLGHPPQELNEEEKQKERDRYKRAGYKPGGLDRSKPAFGFVEGELAGKKIVSVACGDKHTVCVTEDGAVYSWGNGRSGALGHSNTENSAEPKRVEGLSNIVRVDCGTDHTIALDSKGKLHSFGSNTYGQ
>tr|A0A1S1HUD1|A0A1S1HUD1_PROST Uncharacterized protein OS=Providencia stuartii OX=588 GN=A3Q29_01410 PE=3 SV=1
MQFPPCPKCQSEYTYTDNDMYICPECAHEWNDAEPVVESDELIVKDANGNLLVDGDTVTVIKDLKVKGSSSMLKIGTRVKGIRLVEGDHNIDCKIDGFGQMKLKSEFVKKN
>tr|A0A369D4D8|A0A369D4D8_9BACI AsnC family transcriptional regulator OS=Bacillus sp. AG102 OX=2184001 GN=DEU45_10192 PE=4 SV=1
MQLDRVDRKILNELYNDSRLSMRELAKRVNLSAPSTAERVRKLESEGVIQKYTIDIDYKKAGLVLDCILEITLKNGDTTRMQQFIQSYPSASFCYRVTGSLCYIVKISVPSLVELEEFINDVSSYATTVSHIVLSEVSLTPDIEHIFPED
>tr|A0A370DS84|A0A370DS84_9GAMM RNA polymerase sigma factor RpoS OS=endosymbiont of Escarpia spicata OX=2200908 GN=rpoS PE=3 SV=1
MDEPNDANAAGEDSVSSDKPEVSPKPETAQKLKKPNARAAREPNDAQMDATRLYLNEIGISKLLTAEEEVYFSRLAQKGDQSARQRMIESNLRLVVKIARRYMNRGLALLDLIEEGNLGLIRAVEKFDPERGFRFSTYATWWIRQTIERAIMNQTRTIRLPIHVVKEINVYLRAARQLAQTLDHEPSSEEIADLLDRPIGEVKRMLGLNERVTSVDTPYGKDADKPLLDTIPDERASDPTVDIQNDGLNANLDRWLEKLNDKQREVVERRFGLHGYENSTLEQVANELGVTRERVRQIQMDALRRLRDILERDGFSVDTIFK
>tr|A0A2C5Z117|A0A2C5Z117_9HYPO Uncharacterized protein OS=Cordyceps sp. RAO-2017 OX=2004951 GN=CDD83_9509 PE=4 SV=1
MKTDSLSPLFLLSVDASDGPRTTTCDRFVGCHRYDDCRQPTRRPTYANTIIIRTPPLPPAVMAGGRPTTPPTSIVPSPCVPRIMASLLPLISDTPSHGHARLGSGGDGRLAAARCCSSYRGRIRSHPACHRQSTRQNGRSWSVSPTETEMASF
>tr|A0A6J3K058|A0A6J3K058_9HYME zinc finger protein 271-like isoform X3 OS=Bombus vosnesenskii OX=207650 GN=LOC117231473 PE=4 SV=1
MNSEQHALPATTQAQQEDVNAGQSGRPSYPGGLATTTSLGNVGSTPHSSADLRVSVYHHSHHNSSHRSSGGGEASSKEPASSLNQEMALTSSSHHQSTPTHHHHQPSVSSSSHHSSLQPNSQQIPVSLPGLNLDGAHIPASVSHLQAAHAQMQQMQAAQQQQLHQQQQQQPQQQQQQQQQQSHHQMQSHQNAQNSGPTAHNQNAQRDDNKVKDESGSCTTERCSDNQVHCQVQCDLQLQTSQDLQQSLMQQQQQQQQQIGVNISGNSSSEGGSQNNTEKPEKEKELRQLNMTQFQVPDLKPGGHMMDVRTADGSVVKISAGNEQDLAKTLGVEMVQNMYKVNVEDINQLLAYHEVFGKLQSEIAAGTTLVGSTVPTQTVTTIQNGTPIVQQVQLNKFDIKSSDGEATPGPSASPVSVGSHACEICGKIFQFRYQLIVHRRYHTERKPFTCQVCGKAFLNANDLTRHGKCHLGGSMFTCTVCFHVFANAPSLERHMKRHATDKPYNCTVCGKSFARKEHLDNHTRCHTGETPYRCQYCSKTFTRKEHMVNHVRKHTGETPHRCDICKKSFTRKEHFMNHVMWHTGETPHHCQACGKKYTRKEHLANHMRSHTNDTPFRCEICGKSFTRKEHFTNHIMWHTGETPHRCDFCSKTFTRKEHLLNHVRQHTGESPHRCGFCSKSFTRKEHLVNHIRQHTGETPFRCQYCPKAFTRKDHLVNHVRQHTGESPHKCQYCTKSFTRKEHLTNHVRQHTGESPHRCHFCSKSFTRKEHLTNHVRIHTGESPHRCEFCQRTFTRKEHLNNHLRQHTGDSSHCCNVCSKPFTRKEHLVNHMRCHTGERPFVCTECGKSFPLKGNLLFHMRSHNKGSNAERPYRCDLCPKDFMCKGHLVSHRRSHSDERPHSCPDCGKTFVEKGNMLRHLRKHAAEGPPTQVSTPSAIPQSGVLPIPAAAVLVGHPLAPPAPPVVPQHTVVVPTPPGVLTSY
>tr|A0A7V1JCS3|A0A7V1JCS3_9BACT Histidyl-tRNA synthetase (Fragment) OS=bacterium OX=1869227 GN=hisS PE=3 SV=1
MNRPVQPPKGTRDFLPEEMLLRGKVIETLRECFALYGFIEIDSPVFEYFELLSRKCGSEIEKEIYTFDDKAKRKLGLRFEFTSPLGRYYAANRSRLVKPFKRYVIGKVYRYENTQAGRYREFYQADADIIGSYSMNVELELLNLAIFTLSKLGFGDYEIFINDRKILDGIVNAAGIGEDKKDTALRAVDKMAKIGEQGVIKEFAENGIAEDNYKSFMEFIELDKDLSDIGKLSALGGRINAAVKDEFIKNKALEGIEELLSILKNAEAIGLDFITYDPLLVRGLGYYTGPIFEIKSKDVSIGSFAAGGRYDNLVELYGARPEGACGISFGVERIIDIIKERDGKTLELQAFPVKLYVIYLSEDERSYAYKNAEALRLNGINTELCISNR
>tr|A0A0F0I472|A0A0F0I472_ASPPU Classical c SDR OS=Aspergillus parasiticus (strain ATCC 56775 / NRRL 5862 / SRRC 143 / SU-1) OX=1403190 GN=P875_00053022 PE=3 SV=1
MTKITIPTTPPSRSLQGKTAIVTGAGCLGNGIGNGRAIAILLASDGCNVLCVDRNLEWAERTVDMIKAQAEDALVEGKSNYGHATAIQADVTIAADCESIVSTALTTFNRLDILVNNVGISGAAGTAVDVDMEAWAKSLEVNVSSMVLVSKYAIPAMMKNERDEYSGMCGSIVNLGSVAGLRGGTPHLLYPTSKGAVVQLTRAMAAHHASDGIRVNCVCPGMLFTPMMYGGGMSEEAREARRKRSLLQTEGNGWDCATAVVFLAGPHARWMTGVILPVDAGTTAAVGIGMPKSASVNG
>tr|M1EY39|M1EY39_9HYME Protein Wnt (Fragment) OS=Hypoponera sp. Mal1 OX=1157064 GN=Wg PE=3 SV=1
LPAFRVVGDNLKDRFDGASRVMVSNSDRTRGNSNTITSNSASNSVHGHRDGPRRRHRYNFQLKPYNPEHKPPGPKDLVYLEPSPPFCEKNPKLGILGTHGRICNDTSIGVDGCDLMCCGRGYVREDVMVVERCNCI
>tr|A0A452QU07|A0A452QU07_URSAM Uncharacterized protein OS=Ursus americanus OX=9643 PE=4 SV=1
AKQNKDKKDEIIKRKEAPPHEGLEIEEPSSLGLMVGGPDPDLLTCGQCQMNFPLGDILVFIEHKKKQCGGSLGACYDKGLDKGSPPPSSRSELRKVSEPVEIGIQVTPDEDDHLLSPTKGICPKQENIAEPPPRGLCSVQATVFASGPSSEPGRPRKGRGPWQPVFLRQDGTGTRVDEGSHPAGPAASWGQASVS
>tr|A0A4R6LBV2|A0A4R6LBV2_9FLAO Surfactin family lipopeptide synthetase A OS=Flavobacterium sp. P3160 OX=2512113 GN=EV143_10517 PE=4 SV=1
MGYDLFTKLKKLNVTVKVTDGQLDIKAPKGVLDEELLIEIKTKKEDLINLIGKYTKDKANEKNQIPVAPKSEHYPLSSSQKRLWVLSQIDTANFSYNIPGLQVIEEVLNVNAFMLATQDLFNRHEILRTVFKSLDNEDVRQFVIAAEDFEFPFQQIDVDNDEVKLNEILAEVKNTIFDLEKGPLFKGVLVRVTDNKWVFSYNMHHIISDGWSMDIMINELLNNYILRRKDEFVSGLPLKIHYKDYAVWQQQRLADKEFDKEKNYWLTNLEGDLPTLAHFGDNPRPAIMTYNGSVVKRTIETLLIQRFKSFCQEQEGTLFMGCLSILNVLLHKYTEQEDFIIGSPVSGRTHKDLADQIGFYVNTVALRTQLEADNSFKEIFQQNKISTLNAIENQNYPFDELLDNLNVKRDLSRSPLFDVMISVQNENQLNQKADDLSYNEFLDRRVSKYDLTFTFVEKAASLTVELEYNMDIFSKETASTLLYHLENLLVEVLKNPSEEIKSINCLDSEEQFELLENFNNTEKQYPDTGSIVSFFREQVQKTPQNTALVYKDVSFTYLELDALSNQLSNYLEKQYLLDNEDFIAILLQKNEWQIIAILAILKAKCAYVPIASDYPESRIQFILEDTKCKLVITEEEIANFLNVQAEYSDVKTSSPLSPSHLAYVMYTSGSTGVPKGALIEHGGVIRLVKENNYVQLTGKEALLSTGSFSFDATTFEYWSMLLNGGKLVLCDENTLLSPHELSKIIKEEGITIMWFTVGLLNQIIDDNIELFEGLDTILAGGDKLSFTHIDRLQRSYPHLEIINGYGPTENTTFSLTHKIGILNNTNIPIGKPITNSTVYILDKNDNLVPKGVMGEICLGGAGLSRGYLNQPKLTREKFVSHIFKGNERLYKTGDLGRWLKDGTVEFLGRKDNQIKLRGYRIELGEIESVLSQHEAVNSSLVMVHQDNENEKVLVAYITVNTPVNISNLKQWLSERLPYYMVPNYLEVLDIFPLNVNGKVDRSKLPLPESINFDKREEYTEPATAFEKSLAKLWEEVLGISKVGLEDNFFDIGGHSLKATKLISKIHKEFQVKLKLKDLFVHASLQSQCKLIAEAQHSGYSKIPVLTKQNGYPLSLMQRRLWILSQHQAANIAYNMSGAYVFEGDLNVRILEEAFIQLIKRHEILRTSFKEDANREILQYVTEPENVSFTIKNIDLRGTEKLVLDKYLSEDLIAPFDLSSGKLFKANIYRISDNRWVFSNVIHHIISDGWSLGIIVNELLYLYNTLLTGGSVTLTPLNVQYKDYSSWQLKELSDSRLEFHKGYWINQFKGDLPVLDLSGGKQRPITKTYNGGVYNKIISAELSNKLAEFLKTEETTLFMGLLSAVNVLFYHYTKQEDITIGSPIAGRDHADLENQIGFYVNTLALRTIFLKNDTFKTVLAKVKEVVLGAHEHQLYPFDELVSSLNITRDMSRNPLFDVQVIVQNNQDTANTELKNLAVTAYQGELPQSSVFDLVFNFVESENGLATSIIYNSDVFDSERIEQFASHLEHLLAALLQDTELPIEEVKWLSEEEKQHLLSFNSKQMDYDQSKTVIEMVNDQVNKNPEAIAIAFEGTQITYLELHERSNQLAHFLLENYTIEPNDFVGIMMDRSELMFIGILGILKAGAAYVPIDPDYPVSRKEFILKDTNVKVLLTQSDYIFDLAYYQGEIFAMDLQMDTLTNSVTNSEINVLPEHLAYIIYTSGSTGNPKGVIVTHANLQHSLAPRNDVYVPIKCFLLLSSFAFDSSVAGIFSTLTNGGKLAITTNANIANVNFIADYIVAEKVSHLLTVPSYYKLLLMALQGKETALEEVTVAGETCPISLIEDHFKSKIGQSGCQLFNEYGPTECSVWSSVHKYEEGKPVTATIGKPIANTHIYILNDKEDLVPVGVIGELHIGGNGVTKGYLNNSELTNQKFVKDPFQKSGLMYKTGDLGRWNSEGEIEFLGRKDNQVKVRGYRIELNEVQYAIEQSGFIQSAVVLTKENKSGDNELYAYLVADEALNTSDLKNYLKDLLPGYAVPAHFITLSGFPATPNGKIDTKALLEIGDSDNRTGEDYVAPQTEEEIALVNIWQTVLDKEKIGVNDRFFDLGGDSIKVLKIVNGIYNEMRLEISISDVYTYANISKLADFIIHNKKSLDSRKAESTEARKDVVNYIDAIKNSVLESLDQNKSEAIEDLYPMSDIQKGMVYESLLYEGTSIYHDQIINQRQFVNFDISVFRLAMQLMVNKHEILRTGFNMHDYEQEVQIVYKNIEIPVVYQNLSHLDSLKEKEQVIGAFLQSELAKPFDLTSIPLFRMAAFNIGDDMIVFVSQCHHAIIDGWSDSMLLTELNNLYLNLLEDITFKPEKIKASYKNYVIEHEIDKKDTEIQSFWKEELQDSSKLNIFTNTPVSSIYGNILSENEVSELKLLASNSGTTVKEVSLSAYLYMLSILNADPDVVTGLVTNNRPSCEDGDKILGCFLNTIPLRFAINYEVTVKDFILEVQHKLIALKKYERLSLLQIASLSDNQQSNENPFFDVYFNYVDFYTYNKIKSEIKENSNPDKEEESVSLIGANKTNTFLDFNVNTTGDLYHASLSLTKILKSGLTVEQVNDLYFSILRSFIASPHQLLKSVDYLGAKEKHTLLHEFNDTKHEFPSETTLGELFIKQVKNTPDKIALVFQQKEFTFAELNEKSNQLAHYLKANYTLGANDLIAVALPRSEWMITAILAIHKIGGAYVPIDPKHPQDRIDYIVQDSASALIIDAKVLGEFQAVAENYSNENLTLINKPTDVAYVLYTSGSTGNPKGCILEHSGVVNRIQWMWEAFDYTNQDVILQKTTFTFDVSVWEIFMPLCWGTKMVLCSDEDVSIPQNIETLIKNHKVTCLHFVPSMLDVFIDSLFYEAYDFSNLSSLKQVITSGEALQLNTVKKWYEKLETPIQNLYGPTEASIDVTYYTTSKQDTVIPIGKPVWNTSIYILDANNNLVPIGCSGEIYLAGTGLARGYLNRPELTAEKFVANPFAPGEKMYKTGDIGKWTSDGNIIYAGRNDNQLKIRGFRIELGEIEQCLLEIETLDSATVLARKSASNEIDLVAYIVSNQELDVKGIKGTLKKKLPEYMVPNHFVKLETLPLTLNGKLDRKKLLAISTDSEGQTVEIVKPENDVEKKILQIWKEILSKEEISVTANFFEIGGHSLRAIKLQSMLKRKIGLDFSIKDIYNRPTIKRLASDKEKSNSLLIDLQINNRKNIIYFIPPLTGSSILYHPLAKVLSNEFDSVGFQYQGLEHGEEFSLSIKEMAKSFLDEIKNRQTHEPFIVLGYSMGAAIAFEIVRELEKYYSNIDLILVDRPTTVEADQLELQNMDHQANWLLAEYKKVIKLDEEQEKRTLAFLKNNLVLNNQYQLEGKISSNIYVFEATDNKYKGNMQNWQDYTNGDFKHHYLLGTHWDAVSEQNFESYRELFRSIYKKTSIETI
>tr|I4C7D0|I4C7D0_DESTA Uncharacterized protein OS=Desulfomonile tiedjei (strain ATCC 49306 / DSM 6799 / DCB-1) OX=706587 GN=Desti_2801 PE=4 SV=1
MSGKCKMLGLVMLLGLGVTVHAWAVGYERLEVDATKTRTNVVSSNGPAASIAEKCPALLDEVAGVITDLLSQFGIINKKAP
>tr|M6VC02|M6VC02_9LEPT Acetylglutamate kinase OS=Leptospira noguchii OX=28182 GN=argB PE=3 SV=1
MEKLLERVNHILEALPYITQYSGKTVVIKYGGAAMAKADLKESFAKDIVLLKYVGIHPVIVHGGGPEINRLLDNLKIPTEFVHGHRVTDTQTMEIVEMVLTGKVNKQIVSLINSQGGKAVGISGKDGNLAKATKAPVEIELEGKEKQLFDVGLVGKIESINPEILHNLQKEGFIPVISPVAENSEGESLNINADTFAGEIAGALKAEKLILLTDTQGILINQQLVTGLNRSKVKDYIRKGEISGGMIPKVECCLTAIDQGVRRTHIIDGRVAHSILIEIFTDQGIGSLIES
>tr|A0A7G5XKD1|A0A7G5XKD1_9BACT Copper chaperone OS=Lacibacter sp. S13-6-6 OX=2760713 GN=H4075_07020 PE=4 SV=1
MELITFKTNISNERALQRVAPLLNNAVGSSNWQLDVSGAENKLMVYSPGSINEMQVIDAVHKAGFYAVNIEDFYAIF
>tr|A0A7X1L7W5|A0A7X1L7W5_9DELT Bifunctional protein PyrR OS=Desulfobacteraceae bacterium OX=2049433 GN=pyrR PE=3 SV=1
MRKSEMVMDAKDIERTIIRMTHRILEVHKGAADLTLIGIQTRGVFLAKRIQDNIRAIEGTTVATGDMDITLYRDDWTRISHHPVVQATDILFSVDGKEIILVDDVLFTGRTTRAAMDAIMDFGRPDRIELAVLVDRGHRELPIQADYVGRFIETRRSEMINVGLRENDGEDKVLIEERQD
>tr|A0A3R6LV74|A0A3R6LV74_9CLOT TetR family transcriptional regulator OS=Clostridium sp. AF35-15 OX=2293013 GN=DWZ76_13300 PE=4 SV=1
MEISGNTCSLLNYKLYLNNNGLPEEKSMQQGNTKERIVEAYIELESERPVEKITVTALVERSRITRKTFYYYFKDIYDLMEYRMEREMKRVMEETMSQTDPEKALTQLYMYIMENQKHIRALSESVQFMALRRQMGEKVYQYFYNHLERMGMFKNLTMSEAAMAVQIIIFSVMGVAFDAPFKNEADVKERVATFMSVIRKCTGCDPTRNR
>tr|A0A7C3N467|A0A7C3N467_9DELT Universal stress protein OS=Deltaproteobacteria bacterium OX=2026735 GN=ENV48_17320 PE=3 SV=1
MYKKILVPLDGSQLAERALDPAEKLAQFFGSEIVLLQVIPFMPIYGAPELVTPLVVDEKHRESAERYLAALAEKLKAKGLQVSATVRTGQHVAGEILDFAKASAADLIVMNTHGRSGISRWFLGSVTLKVLSRSETPVLLIRSKP
>tr|A0A1I6UAS3|A0A1I6UAS3_9EURY GTPase, G3E family OS=Halostagnicola kamekurae OX=619731 GN=SAMN04488556_3691 PE=3 SV=1
MVTSLSEIPITVISGPLGAGKTTLVNRLLNDPGERRIAVIVNDMGEVNVDAELIADETEEGVVDLSNGCICCRLQGDLVDQATRLAEERSFDYLAVEASGISEPIPIARALTDGTEADSLPDRFRLDTTVSVVDAYGFWKAFDSEESLPDAAPDPERPLTEVLVDQIEFCDVLLLNKCDMVPDDARESIEAAIRELQPRATLHRTTYSDVDPSAVLDTGSFDFEAARRQQGWKRALAGDTANEHPDHDHSDDAVSAAEAHGVESFVYRRDRPFHPERFDAWLDDWDGEIIRAKGFAWVASRPETVLGVSQAGPSVQAGPIGEWGDDDPVTRLVFIGSDLDEAAVTTELDDCLASFDERTDEYSTDPFPRKSN
>tr|A0A126S3A9|A0A126S3A9_PSEPU Heavy metal RND efflux outer membrane protein OS=Pseudomonas putida OX=303 GN=AWT69_001931 PE=3 SV=1
MPIPRKIALLCLLLAGPAGAQGLSLDQALDAAFSQNPDFAAIGREIGIAEGERRQAGLIPNPELSWEVEDTRRDTSTTTVTLSQALELGGKRGARIEVAEAGQAIARLELERQRNSLRADVIQAFHAALRAQTALELAQQSQALTERGLRVVEGRVRAGQSSPVEATRAQVQLAQAEAAVRRARTERGVANQVLARLTGSAEARFDRLDASNLSPGPAPQAEPLLAKVEQTAEWRLAAAQIERGDASLGSEKAQRIPNLTVSLGSQYSREDRERVNVVGLSMPLPLFDRNQGNVLAAARRADQARDLRNAVELRLRSETRSALEQWGTAMGEVQAYDRTILPAAQQAVDTATRGFEMGKFAFLDVLDAQRTLIEARGLYLEALAQATDARAQVERIYGEL
>tr|A0A7L9UZJ5|A0A7L9UZJ5_BIFLN Response regulator transcription factor OS=Bifidobacterium longum subsp. longum OX=1679 GN=BL7055_06065 PE=4 SV=1
MDNDPFALDAMCAMISAVSKDFRVMWSTGSPAVAIEHCHNPHTRPEVLVLDMALGGITGADVCRRIRRRTGGTGIVCVTSYSVDVYQREAIASGAQGLFAKERLRTDIAVAIR
>tr|A0A7W5LBF7|A0A7W5LBF7_9HYPH Diaminopimelate decarboxylase OS=Rhizobium sp. BK312 OX=2587080 GN=lysA PE=3 SV=1
MNHFEYRDGILYAEDVPVPEIAKAVGTPFYVYSTATLERHYRVFAEAFDDVDAMVCYAMKANSNQAVLKTLGRLGAGVDVVSVGELRRALAAGIPASRIMFSGVGKTAQEMDAALEAGIYCFNVESEPELEVLNQRAVRAGKVAPVSFRINPDVDARTHAKISTGKKENKFGISWQRARAVYERAASLPGIKVTGIDMHIGSQITELQPFDDAFKLLRDLVETLRGDGHDIHHVDIGGGLGIPYRDDNNPPPLPDAYAEIVKNQLRGLNCKIVTEPGRLIVGNAGILVTEVIYVKDGGDKSFVIVDGAMNDLIRPTLYEAYHEIRPIAVGDVSTPRIKADVVGPVCETGDYLALDREMALPKPGDLLAVGSAGAYGAVQAGTYNSRLLVPEVLVKGNEFHVIRPRTTYEELIGLDSIPAWLEG
>tr|A0A2S0UY05|A0A2S0UY05_9GAMM dTDP-glucose 4,6-dehydratase OS=Colwellia sp. Arc7-D OX=2161872 GN=rfbB PE=3 SV=1
MKKLLVTGGAGFIGANFVHYWMEKYSADKVVVLDALTYAGNIANLDSVKDEDNFTFVHGNICDQALIETLLVEHSIDTLVHFAAESHVDRSITGPDAFIETNIMGTYSLLKAAKKVWLDGESIVEGHRFHHVSTDEVYGTLSPTDPAFTEDTAYAPNSPYSASKAASDHLVRAYHHTYGLNVTTSNCSNNYGPFHFPEKLIPLVITNILHDKALPIYGDGQQIRDWLYVEDHAYGIDLVLQNGRVGENYNIGGDNEWANIDIVKTISKLVEQEFVKNKDLATRFPAAKAAMTQNTESLITYVKDRLGHDRRYAIDATKTNNELNYQPKESFETGIAKTVAWYLNNEAWWQSVMDGSYQNWIAEQYS
>tr|A0A7K9XDW7|A0A7K9XDW7_9GRUI KRBBB protein (Fragment) OS=Psophia crepitans OX=54359 GN=Klrb1b_1 PE=4 SV=1
EDCVDRGAELVMPEDQDELGFLNEILQKPNRQFWTGLSVSPTGKGWTWLNGSRLDQSRFPLSPGDEGRRCGVLKGGRITSQNCSSEFQWICQKEATQL
>tr|A0A0R2NXL2|A0A0R2NXL2_9ARCH RNA-binding protein OS=Nitrosopumilus sp. BACL13 MAG-121220-bin23 OX=1655561 GN=ABR53_02015 PE=4 SV=1
MKSNLISKSETASLLKKISDAWGIEFPKMKNVKVHQILSDAQIITGDGLKILKINEDYLPFLSETEILKKFPSVEVDMGAVKFMCKGANLMRPGIKKFTEFEKEKLVCIVEETHHKFLAIGKSMVSSSELENMEKGEIIQNLHYISDRFWETGKTIYN
>tr|A0A6I3FRK9|A0A6I3FRK9_9ACTN Uncharacterized protein OS=Actinobacteria bacterium OX=1883427 GN=F2575_05150 PE=4 SV=1
MRLVHPLIWWLWALLLATFVIRADNILIAAAVACAVTLVVVKLKNDNYWSKSFALSIRLALLIIVVRMLIAITIGVPMPGQILFRIPSITLPSWMVGIRIGGDVTSQRLTSTFHEVIIIATVILLCGAANSLASPHRMIRSLPKAMYNLGVALSVATSVLPQIVKSIGRIQSAKRLRGQKTRGIRAWRGIALPLLEESLERALDLATAMEARGYGYHGKTTKYRAEPFTFIDLVMIASGVYLVLLSATLLSHFSVVVLALFSLVIVASPIAIVKR
>tr|D5EYN5|D5EYN5_PRER2 Uncharacterized protein OS=Prevotella ruminicola (strain ATCC 19189 / JCM 8958 / 23) OX=264731 GN=PRU_0725 PE=4 SV=1
MGIVAVLAVVRAEFPQLAEPRIAESHVEVNADSVAAAMPHTDFSATATAKKHKIYSVPSFKACFPDTQSVQLAAAMKWGVKRVKNREDAEKRKSELVYVGANPYVHIDKLYSSIPYLVPRAAVLLQDVGQAFFDSLYVKGIALHRPIVTSVLRTEADVTKLRRHNGNATENSCHLYGTTFDICYNRYETVQDPDGPARRAVRNDSLKYVLCEVLRDMREQGRCYIKYEVKQGCFHMTVR
>tr|A0A0F8VXL6|A0A0F8VXL6_9ZZZZ Uncharacterized protein (Fragment) OS=marine sediment metagenome OX=412755 GN=LCGC14_3138660 PE=4 SV=1
MYRGFRVLVDSALGTLAGAFATNSNRDRAGLLYDKNIAQHNGGVETGSNAYKNWDVLRGRVSANDDQVAVIGEGIVYEYTLGSTTWADASATARANDCFHIYFSCTAAQGASEIAKGGGDYGDTSGVKYIYEYSPWTALAATADIIVPNYYSLGAWANFRVPFPHNTYNTVSTIGDKFGNSTSPFEPATLDSNNFHLDHTGGTGFNQDNAEDFAPFTALELQGLIDYIVVSSGDGVALQADFKMRCTCYDTSDNVVVVDFTIPHRNNYFHVSLPLTQFKNYRARASRRWGDVISNLEPAELEIQEQFEWKNLCMISIQTQDSYDDQGRYFPEDGLFLK
>tr|A0A1C4Z724|A0A1C4Z724_9ACTN Potassium-transporting ATPase ATP-binding subunit OS=Micromonospora matsumotoense OX=121616 GN=kdpB PE=3 SV=1
MREKAMTTSTPAPHGTADAATAGTPATQGNRGGGLLDPRQLLRALPDALRKLDPRTLWRNPVMLIVEIGAAFTTVLTVADPSVFALAITVWLWLTVIFANLAEAVAEGRGKAQAAALRRAKTDAVATRALDWSRGAAPGTYRTESVPAPQLRQGDVVVVEAGETIPGDGDVVEGIASVDESAITGESAPVIRESGGDRSAVTGGTKVLSDRIVVMITQKPGESFIDRMINLVEGANRQKTPNEIALNILLSALTIIFLLAVVTLQPLAIFSKNFQAAAPDSNAVTDGGVTGIVLVSLLVCLIPTTIGALLSAIGIAGMDRLVQRNVLAMSGRAVEAAGDVNTLLLDKTGTITLGNRQAAEFLPVDGLDAAGVADAAQLSSLADETPEGRSVVVLAKNEFGLREREPGLMPHATFVPFTAQTRMSGVDQGAQGGAGGARRIRKGAAAAVMKWVRDNGGHPTEQVGQIVDEISGLGGTPLVVAEHVDGQPARALGVIHLKDVVKAGMRERFDEMRAMGIRTVMITGDNPRTAKAIADEAGVDDFLAEATPEDKLALIRKEQEGGRLVAMTGDGTNDAPALAQADVGVAMNTGTSAAKEAGNMVDLDSDPTKLIEIVEIGKQLLITRGALTTFSISNDIAKYFAIIPAMFAGIYPGLDTLNVMRLSSPESAILAAVIFNALVIVALIPLALRGVRYRPGAASKLLSRNLLVYGLGGIVVPFVGIKLIDLLIQFIPGVS
>tr|A0A2V1NJD8|A0A2V1NJD8_9ACTN ABC transporter OS=Streptomyces sp. V2 OX=1424099 GN=DF268_33570 PE=4 SV=1
MTSTTPHPDGALPRPAVQLTSVTRRYGPGVTALDDLSLTLPAGSFTAVMGPSGSGKSTLLQCAAGLDRPTSGSVRLDGTELTGLSERRLTLLRRAHIGFVFQSFNLLPSLTAAQNVALPLRLAGRRPSSARVREVLARVGLADRAGHRPGELSGGQQQRVALARALITRPRVLFGDEPTGALDSTTGREVLRLLRGMVDAESQTVVMVTHDPLAASYADRVLFLVDGRVHGELAGAGAETIAARMTGLTAAETPPGPRRTGPDPHGTADLHDTADPHGLRDPHDTGDPDSARPNPQGTPTARQETLPC
>tr|R8RZS5|R8RZS5_BACCE Methyltransferase OS=Bacillus cereus HuB4-4 OX=1053211 GN=IGM_02991 PE=4 SV=1
MNELEYKSFYDKVGRLNGWDFSKIKCETVGDTWDFYSEVKERCKPSHILLDVGTGGGENVLNIASSAKLLIGIDNSNGMIATAHSNLKKSGVQNVEFLQMGSEALTFPHAHFDIASSCHAPFLASELAKVMKKGAFFLTQQVSENDKLNLKEAFGRGQCLGERDGTLKEKYMNELISAGFDLVQVREYDVTDYYSRSEDLIFLLKHTPIIPRFGEQEEDFTILQKFIDTYSFEKGIRTNSKRFMIIAVKP
>tr|Q8EYI3|Q8EYI3_LEPIN ABC transporter ATP-binding protein OS=Leptospira interrogans serogroup Icterohaemorrhagiae serovar Lai (strain 56601) OX=189518 GN=dppD PE=4 SV=1
MIRIENLTISYYTKSGFGLKKSRIVAVDGVNLEIGKNEIIGLVGESGCGKSTLGRGLVKLLKPEFGSIYFEDKEITSLSSSEFFPFRKNIQIIFQDPYSSLNPRMTIAEILMEGLEIHEKTSREEAETKIKKILEKVNLSSDILSRFPHEFSGGQRQRIAIARALVLKPKFVICDESVSALDVSTGTQVLKLLVELKNEFGLSYLFISHDLGVVKSISDRIAVMYLGKIVELGNTKNIISSPAHPYTKALFQSTFDVYDRKKNRIPLKGEIPSIVNKPTGCHFHTRCPIARDLCKSEVPVWKEIRNGQKVLCHFPID
>tr|A0A5X0ZI55|A0A5X0ZI55_SALET Bifunctional glutamine synthetase adenylyltransferase/adenylyl-removing enzyme OS=Salmonella enterica subsp. enterica serovar Stanley OX=192953 GN=glnE PE=3 SV=1
MTPLSSPLSQYWQTVVERLPEGFTETSLSVQAKSVLTFSDFALDSVIAHPEWLAELESASPQADEWRHYAGWLQEALAGVCDDASLMRELRFFRRRIMVRIAWAQTLSLVDDETILQQLSHLAETLIVGARDWLYAACCREWGTPCNPQGVPQPLLILGMGKLGGGELNFSSDIDLIFAWPEHGETRGGRRELDNAQFFTRLGQRLIKALDQPTMDGFVYRVDMRLRPFGDSGPLVLSFAALEDYYQEQGRDWERYAMVKARLMGDNDDAWSRELRAMLRPFVFRRYIDFSVIQSLRNMKGMIAREVRRRGLKDNIKLGAGGIREIEFIVQVFQLIRGGREPSLQSRSLLPTLDAIAALHLLPENDVAQLRVAYLFLRRLENLLQSINDEQTQTLPADDLNRARLAWGMKAENWPQLVGELTDHMANVRRVFNELIGDDEADTPQEEERSEPWREVWQDALQEDDSTPVLAHLADEDRRQVLTLIADFRKELDKRPIGPRGRQVLDQLMPHLLADVCSREDAAVTLSRITPLLAGIVTRTTYLELLSEFPGALKHLIMLCAASPMIASQLARYPLLLDELLDPGTLYQPTATDAYRDELRQYLLRVPEEDEEQQLEALRQFKQAQLLRVAAADIAGTLPVMKVSDHLTWLAEAMIDAVVQQAWTQMVARYGQPAHLDERQGRGFAVVGYGKLGGWELGYSSDLDLIFLHDCPMDVMTNGEREIDGRQFYLRLAQRIMHLFSTRTSSGILYEVDARLRPSGAAGMLVTSADAFADYQQHEAWTWEHQALVRARVVYGDPQLTSQFDAVRRTIMTTARDGKTLQTEVREMREKMRAHLGNKHRDRFDIKADEGGITDIEFIAQYLVLRYAHEKPKLTRWSDNVRILELLAQNGIMDEHEAQALTVAYTTLRDELHHLALQELPGHVAQTCFSKERALVQASWRKWLVAV
>tr|A0A846PBJ8|A0A846PBJ8_9BACT ATP-binding cassette domain-containing protein OS=Candidatus Latescibacteria bacterium OX=2053570 GN=GTO29_14730 PE=4 SV=1
MNEPWIQLKNVHLSRGGRPVLKGVTADLAGRAIGLVGANGAGKSTLIGALLGVLKAESGMIHVLDLDLPRNAMQVRSRAGVMAEQAGVFPGGSGVDAVVFAAMLNGLSRRESLRKAHRALDALDVGEERYRPVRGYSTGMQQRCKLAMSLVHDPEILILDEPTVGLDPPGRTQLLNLIRDLRDEGRRILVSTHIMHDADFLCDELLLLEAGTVAFSGPIRDLIDTGVGVVVAAGEGLDAAFAETLGQRGYDIREQADEHITFEPNQDVELREFWQLAAERGAEVRALGRDLPSLESAVIRAMEHTDEQ
>tr|A0A7U8ZSQ3|A0A7U8ZSQ3_VIBCL Uncharacterized protein OS=Vibrio cholerae MAK 757 OX=412967 GN=A53_02263 PE=4 SV=1
MRYLAVLMMGLLTFPAFALTRVNLYQAEVAVDPQQSNADAAARVRGMEEVIVRATGSQDALKNDAVQKALRQSNQYITQISTQQEGAQSVMRLQFSAQHIRSLLSQAQLPFWPESRSNLLVWLVEEANYDRSVSWEHADTPLLNQMKVRARIRGLPLTVPVGDFDDVTGVQVSDLWGGFINPISIASQRYPTDAVLVVRAQGSELRWTLFDQLANTMVSQPKAPISGQASGEQAVTEMIDEISDYYARKSAVVVSSESSQSVLAQFSPLDSAQDFFVVENKLKRLSSVASLDILKVQGTQVTFNVHLLASVEEFTNEVVRMGQAVLMEMPPEEPVSADNNLLENSSLENSASEMPVDPSNPNNAAAQPQPVQPKTLYFSWQG
>tr|A0A7W0QRE7|A0A7W0QRE7_9CHLR D-aminoacyl-tRNA deacylase OS=Chloroflexia bacterium OX=2448782 GN=dtd PE=3 SV=1
MRVLVQRVREARVTVDDVEAGAIGPGLLLFVGIAATDGDGELRAMADKIANLRVFEDDAGRMNRSVLDLVAGGDPVGALVISQFTLYGDVRKGRRPGFTRAAAPEEAAPMIEAFAVCLANPGLVVERGVFGAHMMVSLTNDGPVTIWIDSDDLRQPRRGETSSAI
>tr|A0A7L4YJJ8|A0A7L4YJJ8_9ACTN Uncharacterized protein OS=Epidermidibacterium keratini OX=1891644 GN=EK0264_02370 PE=4 SV=1
MEQTLINDGLPFLGSALPADLAGVELRRAITEHRVLRMMRNTFRDARVPDSREVRVAAIALHAPKDAIVADDTVAWLQGVDTNDPRDRFSFSPSLIVPNHACRPQHPGVRVREGTIDDCDVVEEGGLRLQTNLRATADMLRLKWRPNALATADAMCRHNLIDKGELAEFIRPLRRLPGIPQARALVRLVDPRSMSWGESVLKLRLVDAGFPMPALQHEVNDPRIGVRYLDCAYVAPRVGVEYDGKEFHTAESDREHDAERRELLSDILGWRWEIARRDDLIGTNDALEWRVGEKLGLTPRPRSW
>tr|A0A0P1FSG2|A0A0P1FSG2_9RHOB Uncharacterized protein OS=Thalassobacter stenotrophicus OX=266809 GN=THS5294_03520 PE=4 SV=1
MRLLGAFSLVLGLLVAPEVAPAQGTSVVTGTGTGAVLRTLDKVTGAVFDVEVASGQTMGYGTLEITLSECRYPASNPAGDAFAHLTVMDGSKRQDIFQGWMIASSPALMALDHARYDVWVLRCITS
>tr|A0A1C4RDB8|A0A1C4RDB8_9ACTN Uncharacterized protein OS=Streptomyces sp. DvalAA-14 OX=1839759 GN=GA0115240_152365 PE=4 SV=1
MPTAPRTIDELQQALMANQQLPYGRTRTVGAEELVDAAEQFAEPIALVRTLLELQSAYVYGSEPRKSPVVFARLLALFDEQPDLFDERLRHELFWRFKWVANALRQLPEMPLASIQQWLTEMRTRYEKAGLGLQPYYGQAFQLAAHVGQDIAPAYELWAARTRTPLSDCEACEICDRALYHLRGGDDERALESWEPVLTGTASCQEEPARSISYALLPLLRTGRTDRARELHLAGYRACRHRPSMSGEVGRHLEFCALTGNEARGLELLAENRGLFDEVESPHANFDFLTGVEVLLQRVGLLGHGELPAAGYAGRVWSVAELRAEVRARADDLAARFDARNGTTAHTDRRRARLDRAPLLDALELTLRSRTLDVVAQAAPADAAAGAPVSAPAGAPVPRTPAAVSDSLPELILQARDLDERAHPDANACWARLRALVAAPDYTHPDDPAVGSFVRLRADLLADEASRVHEKEEYAVAAALFTQAGDLYDEAGEPGHAAFARGYALLAEAEQVTEPVKPPEPAEPADAAEAADAAEAAGPAEAGQPAAPAEPAERAAGADGANGAEKAEKAEKAEKAEKADRTGPAAAVEARVAALTGVHAAAVRLQEDTPGLAPYQEARLLRLRATALGLRLQASGNEEHAAPVLAEADLLREFATRHGVVTQISGARFLRATTWAIRGDLPAAHTEVDGLLDELKERGPAWHLPRALGLRARLRLGLGEAQGAHDDLTEALRLAADWPAEAVHTSRLQGDLAEVCMHLGRPDEALRHLTRSAELELRADQRAEAFTTYGNAAALSLDLGRVEDSIALLDSLLAEPDAVAGELNDRLLAQLRLTRARALHAGEDLKAATAEFVALAAESAGWDDDPGSHAMIAAETAVLLGEAGEFGPARQAAEQALAAHARAPRYEQLSNALRELARLQAEQQGPDGLTDALAFLADAGRIADEARAAGFEARGRSLDTALAYEHGRVNAYAGAYEDALAALDKALDLIGEPAPEDDRVEEWAESVRLAGVVEGLYLKRTAPALARLDAAIARLTSLGHPKEATPLTSLAARLRDDK
>tr|F7Y857|F7Y857_MESOW SnoaL-like domain-containing protein OS=Mesorhizobium opportunistum (strain LMG 24607 / HAMBI 3007 / WSM2075) OX=536019 GN=Mesop_3059 PE=4 SV=1
MNKNYEAIKAHYAGSDAMDLAAMMAPITGRTAWTEMAGFPYAGTYVGPDAIIAGVFKRIGEEWDGYNLKLEKLVDGGTTIVGIGTYSGTYKKTGKPMSARVVHVWEMEDGKVLSFEQFTDTRLVAAATA
>tr|A0A2V6GK08|A0A2V6GK08_9BACT Aminopeptidase OS=Verrucomicrobia bacterium OX=2026799 GN=DMF43_07280 PE=3 SV=1
MHDIRFDNLAKLLVEYSIRLGRNEAVLIEAFDIPDEMTIALIQAARKAGGVPFAQIYHTRVNRALAFEASDRQLNLLASHELARMKKMDAYIAVRGSNNITELSDVPAEKMKLLNKKMRPVQDQRVKKTKWVVLRWPTPSMAQLAGMSTEAFEDFYFEVCTLDYRKLQPGMKALKGLMEKTDRVEIKGPGIDLRFSIKAIPAVICGGDRNIPDGEVFSCPVKDSVEGHVTFNAPSIYQGIGFDGIRLEFKNGKIIDATSNETKKLNKILDSDPGARYIGEFSLGFNPRVLQPMRDILFDEKIAGSFHLTPGQAYEEADNGNRSQVHWDMVSIQRPEYGGGEIYFDGKLIRRDGEFLPKQLHSLNRSRTR
>tr|A0A0F9KX35|A0A0F9KX35_9ZZZZ Uncharacterized protein OS=marine sediment metagenome OX=412755 GN=LCGC14_1274400 PE=4 SV=1
MKPKNYKYLDGSGNQYNIQDDMRKTLEYVPVKPESSSSGIYDGGKYVKTEITIDQFNKIVSLLNSAIRKSEIHIKDRVKMSGMIIVEEEGNRNAYILDPYSEEKFSIETKLREIFEI
>tr|A0A1L9MTS9|A0A1L9MTS9_ASPTC FSH1 domain-containing protein OS=Aspergillus tubingensis (strain CBS 134.48) OX=767770 GN=ASPTUDRAFT_130501 PE=4 SV=1
MRFLCLHGAGTNAEIFEIQSGGISYDLAKYGHTFKYYDGCMEAEVEPRTSPRPPHLKIRKLKGLFTGPFYNHYPRDRAPGEYLAPAMKHVYDIIEREGPFDAVMGFSQGAALACAMIVHHAKTHQEPLFKVAVFICGAAPFDSTGNEVIPDTSAEGEYPVKIPTANIVGKQDELYPSSMHLSRLCEPSKMSFHDHGSKHMVPFDVENTNAMVAAIEATVQKALRGE
>tr|A0A2V3TT51|A0A2V3TT51_9HYPH Flavin reductase (DIM6/NTAB) family NADH-FMN oxidoreductase RutF OS=Chelatococcus asaccharovorans OX=28210 GN=C7450_11941 PE=4 SV=1
MADKTRLIVEGGDPAADPKAFRRALGSFPTGVSIITTPGLDAPAGVTANSFASVSLDPPLVLWSIAHTSRSHAAFRQSAHFAINILADDQVGVSQAFASASYDKFSLVDWHRGGTGSPLIDNALAYFDCVCEARHEGGDHTIMIGRVIEFGRSEGSPLAFSQGRYGITLDHPEVAAKARDRKFEEPGLDELPFLSLIAKAHYKEDADLEERRSAARYTQVGSKVLAGLYQSAPLTADELARRMYLDRREVDDSLNEFLADGHVAIFDGHRFALTESGKQRRRQMIEYLSRYQDEQLADINPADLIVATRVLKAFLTGPHQGKPDLHI
>tr|A0A532EZD0|A0A532EZD0_9BACT LPS export ABC transporter ATP-binding protein OS=Nitrospira sp. OX=70125 GN=lptB PE=4 SV=1
MTQSIHAESEALVGPIAVQQGHCLRATGLVKSFRGRKVVKGVAVEVYAGEVVGLLGPNGAGKTTIFDMMVGLCQPDEGEITFIGESVTNLPMYKRARRGIGYLPQESSVFRRLSVEHNVLAILEMLGYARKERSQRVDALLKELDLIHIRKSMAYALSGGERRRLEITRALAATPSFMLLDEPFAGIDPIAVADIQQIITRLKEKGIGILITDHNVQETLSIVDRAYIINEGLILEAGSPEAIVQSPTARAVYLGEQFKL
>tr|Q08U50|Q08U50_STIAD Putative surface protein OS=Stigmatella aurantiaca (strain DW4/3-1) OX=378806 GN=STIAU_1615 PE=4 SV=1
MNPAVPAQYTLTYNVTDSAANVAAPVNRTVTVQDTQGPTLVLNGPATAGLECGTPFNDPGATANDLCEGDLSGAVVRTGTLNQGAVGNYTLTYNVADQGGHTAAPVSRTVAVSDTLAPVVTINGPASLAVECGDNGFQDPGAMAEDACAGTLPATPSTEVDPAVPGVVAITYSATDPSGNTGVGNTGRTVTVEDTLPPTLALLGPANQPLECGTPYNDPGATADDQCAGDLTGSIQRTGSINNKQLGAQMVSYTVQDPGGRTAGPVSRTVTVDDSLAPAIAVNGPLDQVFECGSTYVDPGATANDLCATI
>tr|A0A1X0UNC0|A0A1X0UNC0_9NOCA Putative fluoride ion transporter CrcB OS=Rhodococcus sp. 1163 OX=1905289 GN=crcB PE=3 SV=1
MIAPARPLHLRPRALALVFAGGVIGTAMRYGIEIAIPQVIQGWPVATFSINLLGAFVLGVLLENMARRGADAGVRQQIRLLAGTGFCGAFTTYSTFALEAVLLTRDGHLPIALAYGVSTVFLGALAAWAGIVVGASMHVDRSAR
>tr|A0A3N2GU17|A0A3N2GU17_9PSEU Uncharacterized protein OS=Amycolatopsis thermoflava OX=84480 GN=EDD35_2465 PE=4 SV=1
MDPRDRADALLARAQSRGAFVVTPDAATSPMDASTTQQIPRNVVKEIDNDDPDTTAVVPSSVIESVQGSLAASKPDTHVNMTPVQPEEEVDGLVPTTKTQTGNSDFARRLEGL
>tr|A0A3P9I8G7|A0A3P9I8G7_ORYLA One cut domain family member OS=Oryzias latipes OX=8090 PE=3 SV=1
MELTMENLHSVSAHSQAGDLMSSPHARPSQSPSSTPRNLVSHAPSARSAMVSGMASLLEGSGGDYRTDPSGLSGHLHPSISMCETGMSLSNTYTTLTPLQHLPPISTVADKFHHPHSHHHAAAHQRLSAGNVSGSFTLMRDDHRGLTSMSNLYSHYPKEMSGMGHGSLSPLSSGLGSLHNSQQSLSAYGHSAHLSDAKMISPVPGFESHASMLSRSDQEHLARSLGGHGHGMISNLNGMHHHPHSHLHSQANGAVMLGDRERHGHGASQGVSGSNIQAEEINTKEVAQRITAELKRYSIPQAIFAQRILSRSQGTLSDLLRNPKPWSKLKSGRETFRRMWKWLQEPEFQRMSALRLAACKRKEEDRGRERSQVPKKQRLVFTDLQRRTLVAIFRENRRPSKEMQLTISQQLGLELSTVSNFFMNSRRRCPDRWDTEEHGVHGHGPSGNSSASPIQPGISSANTFSKA
>tr|A0A3Q0S8Y1|A0A3Q0S8Y1_AMPCI Translocase of outer mitochondrial membrane 40 homolog (yeast) OS=Amphilophus citrinellus OX=61819 PE=3 SV=1
MGSVLAAASPSPAPAAAGSGQGVPGLVSVPPGFTMPSVSSVPPASGSDQQTADAQSSLSNPGTYEECHRKCKEVFPLQMEGVRLLVNKGLSNHFQVSHTVTLSTLGDSGYRFGATYVGSKQTGPAESFPVLVGDMDNTGSLNAQVIHQLTTAVRSKIAIQTQQHKFVNWQCDVEYRGEDFTSAVTFGNPDILVGSGILVAHYLQSITPALTLGGELVYHRRPGEEGTVTSLLGRYTGENYVATLTLGGAGAHATYYHKANDQLQVGVEFEASTRMQDTTTSFGYQLDLPKANLLFKGTVDSNWVVGATLEKKLVPLPLTLALGAFLNHRKNKFQCGFGVTIG
>tr|A0A7K3UVX5|A0A7K3UVX5_RHILE DUF21 domain-containing protein OS=Rhizobium leguminosarum OX=384 GN=GR236_14365 PE=3 SV=1
MAIEGALAFLETYWPEILSITALVLMSAFFSGSETALTAVSRSRIHTLEANGDERAGLVRQLIERRDRLIGALLIGNNLANILSSSIATSLFLGLFGNSGVALATLAMTVILVIFAEVLPKSWAISTPDRFALAIAVPAKLFVTVVGPVSTFVNAIVRQILSLFGINLSRETSMLTAHEELRGAVDLLHREGSVVKADRDRLGGVLDLSELELSDIMVHRTAMRAINADDPPEAVVRAILESPYTRMPLWRGTIDNIIGVVHAKDLLRALAEPNMEPQNLDIVKIAQKPWFVPDSTNLEDQLNAFLRRKQHFAVVVDEYGEVQGIVTLEDILEEIVGDISDEHDIEIQGVRQEADGSVVVDGGVPIRDLNRALDWNLPDEEATTIAGLVIHESMTIPEERQAFTFYGKRFVVMKREKNRITKLRIRPAGEDGAKPA
>tr|A0A6J5FC43|A0A6J5FC43_9BURK GAF domain-containing protein OS=Paraburkholderia humisilvae OX=627669 GN=LMG29542_08208 PE=4 SV=1
MIGDPILAMTTSAENQLYALDEIALTLAQPCQRTAVYHTVEDVMQRLIGHRLFTLLAVLPGGHRVQRFWSSNETVYPPSGRKCLDSTPWGEVVLKNKKAWLGRNAADIRWAFADHALIASLGLGSVINVPIVVRGQLLGTMNLLHRENHFTVDDVTIAARVAPYLIPAFIEEVKTIEVS
>tr|A0A7C4RW34|A0A7C4RW34_9BACT Adenosylcobinamide kinase OS=Fervidobacterium thailandense OX=1008305 GN=cobU PE=3 SV=1
MILITGGVKSGKSTFALLMALRYKKRAFLATGVPFDDEMMERIRKHKEERKNLFDTYEEPVDIATILQKIDRHYDVIVLECLTTYLGNLLHYNEDVESRFNILVDVVKTMVSQLIIVTNEVGWGIIPENNLARRYVEILGRWNNELAKIAQEVYLVISGIGVRIK
>tr|A0A221MBY2|A0A221MBY2_9BACI Cysteine desulfurase OS=Virgibacillus necropolis OX=163877 GN=CFK40_08985 PE=3 SV=1
MNQIYLDHAATTPMATEVIDAMVPVYSEVFGNPSSVHAFGRKARHVLDQARRVFAKSIHADEKEIVLTSGGTEADNLALIGTALANKQKGNHIITTVQEHHAVLHAAEHLEGNGFEVTYLPVYEDGKIAVQDLRNALTDKTIVVSIMTVNNETGIIQPIHEVGELLNDHQAYFHTDAVQAYSLLTIDVKKDYIDLLTVSSHKVNGPKGIGFLYINKSVQVNPLQFGGEQERKQRPGTENVVSVVGFQHAVQLLIEQKEKRRETYTSYKKLFLETLEQAGVNFEINGEQSDAVPSIINISFPGTNVESLLTNFDLSGIAASSGSACTAGSVEPSHVLSKMYGANNDRTTNSIRFSFGLHNKKEDSIEAAERIASIVKRLISLQ
>tr|A0A841Y9U4|A0A841Y9U4_9LIST Alpha/beta hydrolase OS=Listeria booriae OX=1552123 GN=HB847_15185 PE=4 SV=1
MKKCVTFIALLIFLLAGCSTDKTTEQDMKNLPNLSAQTALILVHGTGGSTDTFDGFSDVFIDDYHTSNERIKLHIGTDGALTYHGIFSKKALHPIVQIGFADSIDASITQQAVWLRLAMEDLQKKYKFAAFDGVGHSNGGLVLSTYAQKYAKTAPTLERLVAIGSPYNDLDQDDNKGDLAFTDVPKATPLLQKYEKNRSKINPDLLVLSIASNIDDGSFSDDIVPVLSAFSSRLIFKNEAKTYLESYYKGEEYDHRTLFANPDIQKKIAWFLYEYPGDKKEISLAKN
>tr|T0PB79|T0PB79_AERSA ABC-type transport system periplasmic substrate-binding protein OS=Aeromonas salmonicida subsp. pectinolytica 34mel OX=1324960 GN=Asalp_31750 PE=3 SV=1
MIKKLILSTLLLCGLANAAAPASTLDAVLDRGVLRVGFDAGYQPFEMTNKQGQYIGFDVDLAKMVAKEMGVKVEFVNTAWDGIIPALLTDKFDVIMGGMTVTPQRNLRVNFADPYIVVGQTIVLRKDKAGEIKSFSDLNDPKYKIAVKLGTTGEQAVKRLIPKATLLQFETQDDAKLEVINGKVDAFVYDLPYNAIFASQNTGAVVHLDKPFTFEPLAWAIRKGDQDTLNWFNNYLRQIKGDGSYDRLYKKWFESNAWLNQLK
>tr|A0A6C2U970|A0A6C2U970_9BACT Uncharacterized protein OS=Pontiella desulfatans OX=2750659 GN=PDESU_04858 PE=4 SV=1
MDIKRWISLVAVMAVAGTVQAADPLVYEGFEYDTTTGGIESASLGGGVGLSGAWGSSDAAGSFFNVTSGSFSLGSLTVSSNKLKRTNTGGVEAIERTISASLPSEFWFSVLHETSATTQFGIGGGAFGDGSSGNGNMATGPGFGFTHKGGNLGAAVWPAGSAVSVSVGGTVAKSDNNVLLLVGHVKRNVGGNDTVDLYEVDATLVLPGAPLSTVSQPTAAGSLNTLTISSNRGPGIDEIRVGATYNDVVPASAAFTFNLTPDDTQDLLADYPAVVVSNSILTEYANSSSGVEITALNVMSVSNAITAITATPFTLSTPSPAITALDFAFDASAIKAITSATEAFTTTGTVDIVYKNLDDNVLQTNTVALKGTFSNPPFQFSSDSSLGLTLVAPATLVSNDIAVSYVEGRPGYTNVVISEVNILDEQHPGAFSANNPGAIQTTDVITVTFDDSFVGLGNKQSSTCTVEVVYGEAGSSIDYTNTVSVAAFNYDLSTGSVIQQVFGNAVNLNGPLGGGTLPMNNFEAFTNNWNHNGNFTQETSAGSITLSSSGNTRSAYNLVEANTAGSDNFGAQDTHILTNGLYRYEFDYEVLNTDGANVIWSFNAYGLIDQQLFSTSSNPDKVVLDIATGASGGVDVDIQNDGNGYYSEHGDGILAGTGDVARTTGYVYLNVKDNQDALFVMHRSGKCDVRLYDLVLTRVGDYELPVNSTNAVLAAQFEDSAVTNSIVVVGATETNTNGVNNTWRGTGLSHVDRKLKSNAADTAVRATGTIIHRNTAGYDDVGLQDTIALTEGTYELSLDVQVDGTFPSNDSIARVEFWALDQDTSGTNNYVKWDHAPGTGEYLKTNGNAKVTLLGSKTYTNTVTETLVLSDLNVQADQDVAIVFYHRYGPDFFIDNVELLRTGDLPLEGYSLWAEDNGLTAGVNDGLEDDAENGGLGDGLNNLMEYALGGDPLVDDAATVSPQTSEAGGFFYHVYNERTDDPSLTFIVDLNGNLTIPGGWGSAGLEAEERGLDDGEFQSVTNSTDMLEAAEFIRLQVEKD
>tr|A0A2P9ADD5|A0A2P9ADD5_9HYPH Uncharacterized protein OS=Mesorhizobium delmotii OX=1631247 GN=BQ8482_111084 PE=4 SV=1
MHRFCRAGKAAGVDDRDEGLQLIEIEWRFHRSHPSLVLMLKIRNIRWINQSNDGKFTTVHMTACESGPERPLFPAPIARLRPFEYEGD
>tr|A0A3G3A397|A0A3G3A397_9HYME Cytochrome c oxidase subunit 1 (Fragment) OS=Ceraphronidae sp. BIOUG12096-H04 OX=2463984 GN=COI PE=3 SV=1
FLMIFFLVMPIMLGGFGNWLTPIMIGAPDLAFPRMNNMSMWLLPPSLMMLLMSMMTNTGVGAGWTLYPPLTLTPYHDGMSMDLTIYSLHIAGISSIMGSINFLVTIYKMKPSHQTLTSLPLFCWSIMITSLLLLLSLPVLAGAVTMLLTDRNLNTSFF
>tr|A0A7C1QH02|A0A7C1QH02_PSEAS AraC family transcriptional regulator OS=Pseudoalteromonas sp. OX=53249 GN=ENH79_16645 PE=4 SV=1
MDVLSSVLSHFSLNANVFFSGNMCGTSDFSDDQGVGHLHLLRSGTLKVRSNSGFEVVLSTPSVIFFPHSTGHCLFSDKSDGADLVCAQISYQSGGHSPLLQALPFCLNYELTGNGLLEQSAFWIFEEAFKDASGKDLIIDRLCDVFLISVLRKVLKEGTIKSGMMAGLAHPQLAKVLIKIHQTPEQSWSLSAMAEECCMSRSKFADTFKRVIEQTPADYLADWRLSVAKKLILKNQNMDLVANQVGYENGSALARVFRKKTGQAPKEWLLSQQ
>tr|A0A511X4K5|A0A511X4K5_9BACI Uncharacterized protein OS=Halolactibacillus alkaliphilus OX=442899 GN=HAL01_23460 PE=4 SV=1
MELMLEQFMSLNLLNQFWITLFLIIPMVLIARTVVAGTRYSPILIIVIFGLSMGYILVETGVAEPGIGAFPMVNMVASATIIALVVSFFVGGQELRKIFSNKPLTNEEMVIPSQEEAVLGTTRTQIVMIIRSFFLLIGIESSSRVLIGGSTSALSNVYPLIAYIGIVGAIIFIDNRATITNKSLYIRKGIIEIIAIIGILYLSSLIAGGIESLIALPQIFFAMIISAALGALLYRWSFGPTIKALLFAGIPVVLAGNFMVGGSRIGEAFTIDGVNSLILYGFFGQLFFMFGGISLIMYFAKNNHVRNLAPGMAGALSHSGLTGACTAGDLGKEAAQRAPIMINIPFFGHIFVFSVLAISAERGELWTLPSIAIVAIGVLFTIISLKQLKKANNESNKEVKALMQFSFGWQLVAVFGGLLLLSFSQIPFLFTGMAQASAISHFGLFAAVQGGMFGAESASLIPFIFSMPFLVHPVVFFMFGKAMKDDGLMPVKTVHAISFIGLIGVVVSLFIV
>tr|A0A7Z9M5B3|A0A7Z9M5B3_9CHLR Alpha/beta hydrolase OS=Dehalococcoidia bacterium OX=2026734 GN=EYN92_08525 PE=4 SV=1
MPFYERGPVSIFYEEVGSGFPLMIIPGGGLNSSIASLDTSVPFNPMNTYKNDFRCIAADLRNADSGQSSGPLEIDRPWDAYSDDQLGLMDHLGIQEFLVMGFCIGGPMIHNLLRLAPGRIPAAALMQPSGFTSEHPDIFYQTNTERWGPPLCEMAPDITMDKVHDFLTNMYTNRADFVFTVSRDFVRSLQTPLLIAPDNIPAHPYETAMEVAELAPNAETTIFPWKDTPKNIDEAVKHARRFLKKHEPDISP
>tr|A0A7X7DHL1|A0A7X7DHL1_9BACT Uncharacterized protein OS=Lentisphaerae bacterium OX=1932692 GN=GX634_11015 PE=4 SV=1
MNPFPARTRPVRLAMVPLMVLFLGSAIRVGAWESLTFDLPSGGRESLWRDELARHWHGQTEKRIEGGRIDVLTGEYAIEVEFPHKWHEGLGQALHYANATDRQGVLAIIAYARGEAYLHGKSRRRLELIEEQCSANNIKMLVLFPNRPEEFIRHVAPIWIE
>tr|A0A807R958|A0A807R958_PSEME 23S rRNA pseudouridylate synthase OS=Pseudomonas mendocina OX=300 GN=PSMEN_15330 PE=4 SV=1
MTTPASPTSGVQLIEVAPDFAGQRIDNFLRTQLKGVPKTLIYRILRKGEVRVNKGRIKPEYKLQAGDIVRVPPLRLAERDEPEPVAQGLLERLEAAIVYEDKALIVLNKPAGIAVHGGSGLNYGVIEAFRQLRPDAKDLELVHRLDRDTSGLLMIAKKRSMLRHLHEALRGDGVDKRYMALVRGHWATAKKQVNAPLQKSNLRSGERMVEVDGEGKEALTLFRVLRRFGDFATLVEAKPVTGRTHQIRVHAKHAGHCIAGDSKYGDDDFTREIRELGGKRLFLHAYELHVPLPEGGVLKLEAPVDEMWAKTLERLSA
>tr|A0A2T6KQJ4|A0A2T6KQJ4_9RHOB DNA repair protein RecN OS=Yoonia sediminilitoris OX=1286148 GN=C8N45_101426 PE=3 SV=1
MLRGLDIRDMLIIDRLELTFQPGLNVLTGETGAGKSILLDCLGFVLGWRGRAELVRQGAEQGEVTAWFDLPAGHAAFAVLADAGISAEDELILRRVNTKDGRKTAWINDRRVSGEVLRALSETLVELHGQHDDRGLLNARGHRQMLDTYAQLDDDIAEVRSAWRSLSRARKRLSEAEALVAEAKAEEDFLRHAVAELDKIAPEPGEEATLDTQRRLMQAAERIIQDIAKAGEALGLNGAEGMVSDASRWLVGVADKAEGQLDPTLAALEQVMASLDEAQQGVSACLDALSFNPHELEEVEERLFAIRGLARKHGVLADDLSDFADGLRARLAVLDDSAADLAALQASVDESAADFGTKSDALHRKRVSAAAALDAAMSAELAPLKMERAIFATRITEGTPGPEGADDVAFTVATNPGAPAGPLNKIASGGELSRFLLALKVCLTQADAGLTMIFDEIDRGVGGATADAVGRRLAQLAQEGQILVVTHSPQVAALGGHHWRVEKRQDAQSTTSTVVPLDASARVDEIARMLSGDKITDAARHAARALIEA
>tr|A0A2L0BX41|A0A2L0BX41_9CUCU Protein wntless (Fragment) OS=Cyclotoma sp. CSR020 OX=2055377 GN=wls PE=3 SV=1
MALKTFFFPLVVGVIAWFWRRVHLVSRVPALLEYMLLSLGCTLAFLNCPIEYLTLWFDMPYMLLVSDIRQGVFYAMLLSFWLVFAGEHMLIQDNGEKNGIKLYWKHLSTIIIGCASLLVFDLCERGVQLVNPFYSIWITPIGSNLALTFIILAGISASIYFIFLCYMIWRVFKNISIKRSVLPSMSQARRLHYEGIIYRFNFLMMATVICAAITVIGFILSQVAEGQNKWDENMELELSSILH
>tr|A0A1J6PS54|A0A1J6PS54_CAMJU Uncharacterized protein (Fragment) OS=Campylobacter jejuni OX=197 GN=A8118_08150 PE=4 SV=1
MFGAKKNNTEIIEQLEKKCNGLEDILRSIGNTMAVIEFTTDGVILEANQNFLTTMKYSLSEI
>tr|A0A4P8GRK2|A0A4P8GRK2_9MICC L-2-hydroxyglutarate oxidase OS=Arthrobacter sp. 24S4-2 OX=2575374 GN=lhgO PE=4 SV=1
MVEDIGIIGGGIVGIAIARALSSRNLANVTVLEKEQRVAMHQTGHNSGVVHAGLYYAPGSLKAMLCQRGRELTRDYCREKDLPYRELGKLVVALTDDELPALADIERRSVANRVPGLRRLGAGALREIEPHVAGVAALHSPQTAVVDFVAITEALADDVRSSGGQILFGHEAIAISTGQGKVRVTTGRADLVFDRLIVCAGLQSDVVAGLVGASPAPRILPFRGEYWGLAAAKQHFVKGMIYPVPDPRFPFLGVHFTRGVYDTIHVGPNAVPALAREGYGWNRVSFKDTAASVMWPGARALAKQHWRMGAKEIAASLIKPLYYRQAHRFIPELQIGDLTAKTASGVRAQAWSLDGSLLDDFAIDQVGPVTLLRNAPSPAATSAMAIADHLLEHFIHLPK
>tr|I0SJ56|I0SJ56_STRMT Bacterial sugar transferase OS=Streptococcus mitis SK616 OX=1095735 GN=HMPREF1045_0997 PE=3 SV=1
MYSILKRLGDISISLIAITLFCPVFILIAIAIKLDSEGPVIFKQKRFGIHKKTFYVFKFRTMKVESPKYVATRDLQNPEQWITRVGAFLRKTSLDELPQLCNILVGDMSIVGPRPVVVSERDVIETREKYGANDVLPGLTGWAQINGRDNLSTDIKAKLDGYYVKNRSLITDIKCIVRTIPYVLKRKGIVEGSKRES
>tr|A0A1F3KL50|A0A1F3KL50_9BACT Peptidase_S24 domain-containing protein OS=Bacteroidetes bacterium GWF2_43_11 OX=1797352 GN=A2X09_17370 PE=3 SV=1
MAKRLDLKNALQTIKDFYYRNQRIPSLSETAGIFNYSSRNTALYLLNKLVETGYMTRGTKGRLLTTPKFHDKTKLLGSISAGFPAPEEEELRQSLSLDEFLIRKPSATYMLEVSGDSMIGAGILPKDFVLVEKGRTPAPGDIVIAQVDGEWTMKYYRMENGKAYLQAANAKYPDIYAKEELVIAGVVISCVRNYA
>tr|A0A1A0T4H8|A0A1A0T4H8_MYCFO ABC transporter permease OS=Mycolicibacterium fortuitum OX=1766 GN=A5751_24895 PE=3 SV=1
MTVGLAVRTHAASRPSNTRPSRRRSVVARLGVLGWTLAGMGITAALWSVIVATGRFPRQLFPSVPEILAAGQTLWTEGLLAADVSASLSRAAVGFAIGAVAGIAVAVLTATTRAGRSLLQPVLRVFSPIPTIGLVPLAILWFGLGENSKILVIALGVFVPVWINSHSGLASTPVDYLKAARCLGAGRWQTLSRVVLPEAAPDIASGLRVGAAMAFVLIVVAEMTGTTMGIGYRISQAQLFSQADRLIFCLIVLGIIGALCDQLVASVTSPFTRWAHEER
>tr|A0A417V5I4|A0A417V5I4_9FIRM Deacetylase OS=Lachnospiraceae bacterium OM02-26 OX=2292908 GN=DXB19_04045 PE=4 SV=1
MLRKITILILLILTVAQFTSSDSIQSAREFIQNNIYVWSETQEEKLPIYCVDTQKKQIALTFDTAWGNEDIQQILRILKQENVKATFFFCGDWISKYPTDIKTIYEEGHDIASHGDHHKYMTKLTDKQQQEEIQGVTQKIQGLLGIKIDLFRAPYGDYNESVVRNARKMNYYIIQWNVDSLDWQEPTKEQLIEKVCGHKNLSPGSIILMHTGTKCTKQALKQIIRNIKAKGYEFVSVSRLIYRSNYRIDPTGKQMKL
>tr|A0A1H1FUZ1|A0A1H1FUZ1_9HYPH Uncharacterized protein OS=Rhizobiales bacterium GAS113 OX=1884352 GN=SAMN05519103_00535 PE=4 SV=1
MAGGQTPGSFSKNFAWGHTGLRKLHESIRLGFADVLEPVSRKLWRSQSQIDNPGLDLIPVNFFLHNAAGQLTVDELVYQAVSQPYSLRFDRLALFAFNLSQVGRPPLKGPGRPAAWANEFVKEALWQNGVWRRSALAKPAMGAFLKTHIKGQSYWKCQTNYRRLFGLCGYLTGTSPTVNSGAADCQSAWKKDPVSAPKRDPSRRRARRIDPARGAGRGCAARRDRCPVGRSVWVQARFLKRQLSLPVSTISQ
>tr|A0A0N0MN32|A0A0N0MN32_9ACTN Major facilitator superfamily MFS_1 OS=Actinobacteria bacterium OK006 OX=1592326 GN=OK006_1213 PE=4 SV=1
MRTNACPTGSTTRYAAARRPSDTVTTVADQERPGTAAAPTAEHGRLGLALILVAAFMVVLDFSIVNVALSSIQRELGVSAATVQWVVTGYAIAFGGLLILGGRAGDLYGRRRLFLAGIAVFTAASLAGGLARDPVLLIASRVVQGSGAAMVAPAALSLITTGFPEGPRRTRALGLYGATASVGFVAGQVLGGVLVEFLTWRSVFLVNVPVGLAALLLAPRTLRESRSPRTGRHLDASGALLITLAVGALVFAVSRGGGTGIGSADVLVPLALSALAAAAFIANEHHHADPLMQPALLRLHGLRSAGVLMLLLGLWNGGEMLVLSVYLQQVLHMSPLAAGLTIAPQGVFGLATGLLGARLARHLGIQKVLVATGAAATIGFAALTRLPGSDGSHLPLAAVTLVGCGTAGMAFGSMVTASAGVADRDQGLVGGVINTSRQLGAAIGAALLPAVADAVDRTRHASTAVGDRAAMLAGLAAAALAPLVAMNAWRRSRHDGVARCAPRA
>tr|A0A2A7X0U8|A0A2A7X0U8_9BACI Helix-turn-helix domain-containing protein OS=Bacillus sp. AFS002410 OX=2033481 GN=CN692_02510 PE=4 SV=1
MTELGKFLKEAREAKGLSIDDVQELTKIQKRYLEAIEEGNYEILPGQFYVRAFIRQYAETIGVDVSGFLSDKPVVEDTVEANTITEEVKHEEIPSRASKLKEPLNNVKSSRVMDYLPRILIAILIMGICIAIYMMLPSKNDEKSADTNQSQTNSNSEIEKPKNNALDQVKNDNKKQTEKAKNDETKQEPTQKITVDAAQGKRTSISLSGTDVFKLEVVANGESYVDLKNASGKMFYSGILKQGQTQNYDLTEENEVTVNIGASNNVELRINDEVFKYPVSPTNAVHQKITIKNLKMNQ
>tr|G3HRZ4|G3HRZ4_CRIGR Differentially expressed in FDCP 6 OS=Cricetulus griseus OX=10029 GN=I79_013619 PE=4 SV=1
MELKKEEAARQRQRIAELEEMQERLQEALQLEVKARRDEEAVRLAQTRLLEEEEDKLRQLMHLKEEQERYIERAQQEKQELQQEMALQSRSLQHAQLQLEEVRQHRQRAGEDVEAAQRKLRQASTNVKHWNVQMNRLMHPIEPGDKRPTTSSSFTGFQPSPLARRDSSLKRLTHWGSQGSRTLAANSSERKSLNGGDETPILASASQEDKLDPAPEN
>tr|A0A4D9CK05|A0A4D9CK05_MASLA Uncharacterized protein OS=Mastigocladus laminosus UU774 OX=1594576 GN=BLD44_003515 PE=4 SV=1
MAKVNYKLTGKYLPPQIFILGICFVPGVTEVSSEQLTEIRRFIKSDRLLQHYLEQKILIIQD
>tr|A0A1H9PEC9|A0A1H9PEC9_9HYPH Pseudouridine-5'-phosphate glycosidase OS=Rhizobium sp. NFR03 OX=1566263 GN=psuG PE=3 SV=1
MTRPISHDLPIAYSAEVAAAKARGSAIVALESTIITHGMPYPGNLDMARSVEAIIRDQGAVPATVAVIDGTLHIGLDAELLEALAQTRGAMKVSRADLAFAIAERRTGATTVAATMIAAARAGIRVFATGGIGGVHRKAEETFDISADLEELACTGVIVVCAGAKAILDVPKTLEVLETRGVPVVTYDSEIFPAFWSRDSGLKSPLMLNSPAAIANFQRMRDRLGIDGGMLIANPVPEESEIPRDEMEIYIARALDNADRDKIIGKAVTPYLLQSIFELTDGRSLETNIALVENNARLAAEIAVALM
>tr|A0A151WTB8|A0A151WTB8_9HYME RNase H type-1 domain-containing protein OS=Trachymyrmex zeteki OX=64791 GN=ALC60_09730 PE=4 SV=1
MLITPALPAYQNSYYSTCTNVSYLSLPPNILKNLDTIPQQNIQPIFEDTFQRVLARAIVFYTDGSKVDDGTYVGSAVYSPQLDLHFMFKLSSYASVFSSEAWAIYNALLFALHNDFSCIVIVSDSKSVLDSLAGFRNRTNNYIISYIRALIEEAKFCNTQVSFIWVPSHCGIQGNEIADQLAKKAIREGAESNFMTPYSDLFSIPRMRLSKAFDSYIERTSRITGEYYFKNCYSHNNKPWFHDLRFSRIMITTMNRLRSNHFNLNHSLFRKNLIDNPSCPCGAPSQDLAHVIFFCPLTESHAAPIRLALNDLDQDSSQDPITVIIRALCNPSAKICRLFVSFGLACDRLF
>tr|A0A2D1IHR8|A0A2D1IHR8_9ACTN Uncharacterized protein OS=Micromonospora sp. WMMA2032 OX=2039870 GN=CO540_27970 PE=4 SV=1
MSGGGPRRGRRDNGLDAAEYAVAGDVDPRVGEHLLDVLAAGGIAAYLQPSADLNPVTRTTTVPARPVDRLYVDRSHLTTARDYLTQLADEGSDDPPRPDEPDIEAEWAKIVAGFHTTPTAGSHPWPAAEDVDDPVPPAGATAGRAEEPAGPTATDVRRLPYAADVSGVSLGRDRSDEPSLLDGLDTFGADLPGDAEEEHYTPPPPPPLPRFSKYAVLGVLCVVLGFLLFLSPTVVSLVDPAVVTLLGFTGILAGFVMLVWRLRPGDRDEDDPDNGAVV
>tr|A0A3S0HSP6|A0A3S0HSP6_9GAMM Phosphoribosylamine--glycine ligase OS=Halomonas nitroreducens OX=447425 GN=purD PE=3 SV=1
MKVLIIGGGGREHALAWKVAQSPRVETVFVAPGNAGTAREPGLENVAIGVDDLDGLVAFARDEDVALTIVGPEAPLVAGVVDRFREAGLAIFGPTAGAAQLEGSKAFTKDFLARHAIPSAEYRTFVAVEPALAYLAEKGAPIVIKADGLAAGKGVIVAETVEEAEAAVRDMLEANAFGDAGARVVIEEFLEGEEASFIVMVDGETVLSLATSQDHKRAFDGDSGPNTGGMGAYSPAPVVSETVFERIMARVIRPTVQGMAEEGHPYTGFLYAGLMIDTEGNPKVIEYNCRFGDPETQPILLRLTSDLAELCLAGARGELAGHGCDWDERAALGVVMAAGGYPGSYRKGDAIQGLEAAEATGCKVFHAGTAEGESGEVVTAGGRVLCVTALGEGVSAARDLAYRGVAEIHWPEALYRRDIAHRAIARERGER
>tr|A7B7B1|A7B7B1_RUMGV DNA binding domain, excisionase family OS=Ruminococcus gnavus (strain ATCC 29149 / VPI C7-9) OX=411470 GN=RUMGNA_03477 PE=4 SV=1
MNKQYVAICEKVALTIEEAAEYSNIGQNRISSLLKEPRCPFVLYVGTKKLVKRKEFEKFISESVEI
>tr|A0A059AXC2|A0A059AXC2_EUCGR Uncharacterized protein OS=Eucalyptus grandis OX=71139 GN=EUGRSUZ_H01175 PE=3 SV=1
MVMKVHGSVFSAPTMRVLIALHEKDLEFEFVFVDLRAGEHKKEHFLALNLSLHHRPPPPFGQVPAFEDGDLKLLVEAHQFDPAASKLHWELVYKSKIGMATDAAVVKDADKEANLAKVLDIYEARLSQSKYLSCDCFTLADLHHLSALTSLMGTLVKKLLDARPKVSAWVADIVTPPALAKVLTMRNQQ
>tr|A0A2E3M894|A0A2E3M894_9RICK Diguanylate phosphodiesterase OS=Rickettsiales bacterium OX=2026788 GN=CMP19_12800 PE=4 SV=1
MSQHHNSLATLPNRFAFIDTVSKCGVLHPSLSLMLVDVVRFSDVTTSLGINIGDRFLLEIANRIQSLFGGDIRLGRISGDVFGIAFLGTRSSGQMRDMFERLVEHFKTPMHHDGHAFIADFNVGVVTSEGQTFEITAFVSRGEAALKQAKENKYENFCLYNMQDKTDTGRSLALKADLKRALSQNELELYYQPKVNLQTLEVIGAECLLRWNHPLDGVLFPGPLIEAAESYNMMNELGYWTLEQAFRSLVDFDFHRLSLTLSVNISPTQLYDNHLIPSLKMLSKSYAMPLTRIELELTEDVALSNSLMVKRQLDELRALGVAISVDDFGKGYSNLAYIRDLDLSALKIDKTFVIELANHPVNRAIIEAAKIIGKAKNCDVIAEGVETIAQLHILREVGVTIGQGYLFSKAIPLNDFISLAQQEIIVGNSPLRA
>tr|A0A4Z1G3Z5|A0A4Z1G3Z5_9HELO Methyltransf_25 domain-containing protein OS=Botrytis hyacinthi OX=278943 GN=BHYA_0421g00010 PE=4 SV=1
MATVAAGSQAGHDTFDALNIEYEKAYRDNPFKIAAIKKAITLLDPGSKVLDVGCGTGVPVSELLAEAGLEVVGFDIAPKMVEFAQKRVKGTFSVSDMVQFQVEDTFSGVFMIFAHLQLSYAAVHAAVYKYVSALKPGGVFVLGQMPSDSYVKGEGNAAYDETRTYVEDYDAPFMGEPLPTFMMSEQGQRNFLTSMGLEIVSETIDQFQPDNEKCEPEMQQYIIARRPVDGTIVEPQPLPKNK
>tr|A0A526YNJ2|A0A526YNJ2_9HYPH 3-isopropylmalate dehydratase small subunit (Fragment) OS=Mesorhizobium sp. OX=1871066 GN=E5Y60_26890 PE=4 SV=1
MEKFTKLTGVAAPMPIVNVDTDMIIPKDYLNTIKRTGLGSG
>tr|A0A0A1TZ67|A0A0A1TZ67_ENTIV Uncharacterized protein OS=Entamoeba invadens IP1 OX=370355 GN=EIN_043770 PE=4 SV=1
MVSRLEMVFLANVVLKLTNYIDIHNFILVSHNCYESVKSLKTTPKLSSAIDLSWFLSHFYLDTVDFDEVQIPVEKYISSVQCIRNPNFLEDAIAGKLTQSYADTIFPKVVSLSLLYPVYEKDDPCNNLIISNSKKFMSLRRLSGDLEQISLFLKNLTDNGEAIGTKYPNLIVIDSYLESTIVLNETTLNLLRSVELYLKKSYNEKVCYVVAEVPEDRSLIDFVKKGKFYCKNAGSVMCNKDDIFGVCGDFELSGEVERKGEDLKILNERIGANLDAASAFSLTHKYMSNTEYSLELPDSVREYNICVSSLPELVDANYFKYPINFNKIEVLKLVSVSNVSLEVTNALNCLELKSCDFCVFTNDEDSLIAIEEIFVEDSKHIRFLTHSEAIVENVHLFSDTEIDFNWSIKNTENVEIVESRNVGFVGGIFSASCIFHVERSTDTVIKNGEQIASYIKEVNVANFVIGNTGETKSCVLANKHFVCHSVDYLINNHFSCYNEVTENVRSFRPERIVLFTINNFNETSAKVPYFEVKEKGCMLSLGLYDTKGSALTNSTYPIHVGWENGSLGIHTDDWCLYGLDIGGEGENVNVAFDKFESCECVIGCGYNNTRKEVFFTLNGKIVKKIEIPWKNIGAAFAVQRLGTLFVNTGDQKFTFDIENYK
>tr|A0A7C0YEA6|A0A7C0YEA6_9FIRM Uncharacterized protein OS=Firmicutes bacterium OX=1879010 GN=ENF61_00215 PE=4 SV=1
MKHKKEEEMVRRIKMFLMLLLGLGIFLAPLTFHVQDHRKGNGHLVKLDCFCGGDECGICIIPN
>tr|A0A2Z6P333|A0A2Z6P333_TRISU TFIIIC_delta domain-containing protein OS=Trifolium subterraneum OX=3900 GN=TSUD_213440 PE=4 SV=1
MNSPSPLQSAMLMGSPCFPNAISWSQDNLIAVASGNIVTILRPDLPNGPRGLIKVLPREPLIVGFVHRKDVVSGCLMPTSLYRDDKPVVQSISWSPLGMAANSGCLLAVCTSEGHVKVYRPPFCDFCADWIEVVDITERLYEYLQYTEFKDAGVPSSDFSEVPRIRPCLQKNALGQADSITPNDELLENVPDNQLSPLISADEYASRSAMLYSLVVSWSPLLRVASEFSPDPNTSASVSLLAVGGKSGKVSFWIFYQPDCYTIEESKTPTAVKFVGFLQAHNSWITTMSWLLFSFDSSNPLIILATGSSDGSVKVWLGDNDKLLKSSAVDQTSFSLLKEVITVNAVPVSVLSVTVHVQYPSKMLLAIGKGSGSIEIWLCDIPSREFDKLGSYDAHYYVVTGLAWAFGGRFLCSSSQDNGLRGWILHERRLEEMTTFSEMPRSNDSTCPSRDAYDSCFGVAVSPGNLVVATVHCFDVVKLNRMYEGRILRAAIEYLWIGGLQVDVWLKSPSPCYIEELPSFPEKELTYWAANIIWSLNQYQCLDKPLVFWDIIAALLAFKDNNSKYVEYLVIKWLSLSYLGSRTNLPPEEVLSRVISRLSDVPSRLLHLLNIMCRRVMLAQLDADQITTINSKGQNLEGVCPVIEEKMTKWIEILLGSERELRERHVGFSFSAVKTTTSHLEETPSQPGRWYPVGLAQMEQWVALNQEQIRDQLKLIATKVTHGKRFKTKRCSAVEPCSYCSAPVPFESPEFGFCQSKNRSNGNVKPHKLSRCAVCMEVCPSSPLWFCVCCHRNVFRLAPEPLFRMPSCCLDSDSSNRTSSEAVSSKPLCPFCGILLQRKQPDFLLSPAPV
>tr|A5E9B7|A5E9B7_BRASB Hydrogenase maturation factor HypA OS=Bradyrhizobium sp. (strain BTAi1 / ATCC BAA-1182) OX=288000 GN=hypA PE=3 SV=1
MHELGITRNIVKIVEEAAKGRRVKRVTLDVGQFSGVMPDAILFCFDIVAKGTLLDGALLDIQKIAGLARCRSCGEAFKTTSLYQACACGSRAIDRLAGEELKIREMEIEEAA
>tr|A0A0J0YQQ3|A0A0J0YQQ3_9NEIS Probable allantoicase OS=Neisseria arctica OX=1470200 GN=alc PE=3 SV=1
MELPDFATRFVNLASADFGAEVLSCSDEWFAAANRMLQTAPPVFVVGKFDDHGKWMDGWETRRKRYEGYDHAIVKLGLPGVIKGVDIDTSHFTGNFPPAASLDACRCTGVPDESTEWVTLVEAVSLQGDSHRFVEVDDEREWTHVRLNTYPDGGIARLRVYGLPKVDWDALPKDEVYETSAVENGGRIVAVSNAHYGVPFRLNMPGRGINMGDGWETARRRVPGNEWCIIELGTKTLIEKIEVDTAHFKGNYPDTVSIQAADVTFGTDESLVTQSMFWQTLLPQTKTEMDKQHFYTQADFNDLGAVTHIKLNIHPDGGVSRLRVWGKPVR
>tr|A0A4S2D9L7|A0A4S2D9L7_9MICO Glyoxalase OS=Microbacterium laevaniformans OX=36807 GN=E5344_04275 PE=4 SV=1
MTSIFVNIPTNDLERSVAFYRALGCAINPNFTDENAACVVWSDDIFFMVLRREFFATFTEKPVGEPREWAQASLSFSRGSRADVDAIVEAGLAAGGTEPHPAQDYGFMYSRDLDDPDGNSLGFLYMDPVAAEQGPPAEAS
>tr|A0A2R2WQG2|A0A2R2WQG2_XANCI Uncharacterized protein OS=Xanthomonas citri pv. aurantifolii OX=76802 GN=TP45_21175 PE=4 SV=1
MSLLVNAYSTLRTPLWPDFLPQAAVQHRDYADPALVDHLHGFVGYVNQAGDGQMTQSRYHLMRHVQRVRQHFSFQVDDADFGALAQWAEQANAVCFLADGSVRDPHGRVLISQGEPAIDDDAQVPYPPDALQRRAQQSSLLTAQGIRVPPSLPPVPGEAEARVRDAAVVSRRMLALFAVALRAEILATGDTPPSLDEVETRLPGVAAALSPQERAFFAQAAPDAQALANFGWRYEALAAQRALDNAQAAERTTLARRPLPELLDTLDRHLRLHWAVRQAGRSGQPLPAGIVPGVVYERHYALNWLLHFEDAEWDEVETPT
>tr|A0A1M3MBX0|A0A1M3MBX0_9BACT Tryptophan synthase alpha chain OS=Paludibacter sp. 47-17 OX=1895899 GN=trpA PE=3 SV=1
MNRINQLFKNKPSGIMSVYFTAGYPQLDDTLPILDALQANGVDLVEIGIPFSDPMADGVVIQESGHQALQNGMNLRMLFQQLTGMRSSVTIPLVMMGYLNPILQFGFHDFCRECRRVGVDGMIIPDLPMDDYLSEYKAIAEAFGLKFIFLITPETSDERIRIIDQQTDGFIYMVSSAAVTGTQQSFDSREEYFRRIESMKLKNPRLIGFGVSNKATFEMVNRYSSGAIVGSAFIKSLQSSCSVSEAVQALIQQLRS
>tr|A0A418ESL0|A0A418ESL0_9STRA Uncharacterized protein (Fragment) OS=Aphanomyces astaci OX=112090 GN=DYB26_008272 PE=4 SV=1
MTTTRASSIAAAASASPTLATTPTTHDVNDDMEEGAPTPIADAVPTHDANDTLTPGTAPTATLGDDDMTAAAAHRLEEDFPELDGSKATTPPPVPATNPWNWAATTGADMSKPRADDIGFHPATDAQLATLLQLQEQGTWSYDAVLALESSPRREAVGHLIMRPGVSTAKVSENRLFQA
>tr|A0A7X8UWW0|A0A7X8UWW0_9BACT Methyl-accepting chemotaxis protein OS=Phycisphaerales bacterium OX=2052180 GN=GXY44_13280 PE=4 SV=1
MSLKAKLFSSNMILAIVPVVLVSIIVHRTVRDGFRVSAAEAEAGLTTTIQTGREALIASGMTDLRHTAEHVYAMCAAQQEVLQQKVGYDLNVARDLLTQGGGITLMDEEIRWEAVNQFNRQTVSVSLPKMCVGTEWLGQNQEAGTTSPIVDRAQQLVGGTCTIFQRMNPEGDMLRVCTNVMGADGKRAIGTFIPARHPDGQVNAVVEAVRNGKPYLGRAFVVNAQYVTAYEPITDATGQVIGMLYVGVKEESAESLRRAIMSIKVGETGYVYVLNAKGATRGHYVISSQGQRDGEDLWMSKDADGHLFIQDICAKAITLKDNETVMVRYPWQNPGEPRPREKVVTLAYFAPWDWVIGVGSYEDEFFETVKAMEAEGAETLASLQEAGALAIGTVQKWSIGVGLAALVLSFFVAWFVSQGMSRALRRIIADLNEGANQVNAAADQVAGSSQHLAAGASEQASSLEETSSALEEMAAMTRTNASNAQQANGLADQARTAANQGDQTMEQLNQAMTGINDSSQKISKIIKVIEEIAFQTNLLALNAAVEAARAGEHGKGFAVVADEVRNLAQRSAQAAQETTQLIEDAVDKSHNGTQVATQAGQALAAIVKNVDAVTRLINDIAQASSEQAQGVEQVNMAISQMDKVTQQNAAGAEQSAAAAEELSSQSKVLKETVGNLVTLVEGRGAQIE
>tr|A0A258R204|A0A258R204_9PROT Thymidylate kinase OS=Hydrogenophilales bacterium 28-61-11 OX=1970529 GN=tmk PE=3 SV=1
MNMTGKFITLDGVDGAGKSTHIAFVADWLRRQGREVIVTREPGGTPLGETLRELLLHRDMDADTELLLMFAARQEHLAQLILPALARGAWVLSDRFTDASYAYQCGGRGIAAERVAALEAWVQRGFSPDLTLLFDVPPEVAEARRSAARAADRFEREAELFYNRVRQAYLDRAQADPQRIRVLDARHTIAELQAEITRLLQELA
>tr|A0A6D1WBS5|A0A6D1WBS5_9PSED Arabinose 5-phosphate isomerase OS=Pseudomonas sp. JMN1 OX=2518650 GN=EXW70_13605 PE=3 SV=1
MSQSSDLIQSAQRTIRLELEAVEGLLAHIDADFVRACEMILASKGRVVVVGMGKSGHVGNKIAATLASTGTTAFFVHPAEASHGDMGMITKDDIILALSNSGTTNEIVTLLPLIKRLGIQMISITGNPESTLAKAAEVNLNVHVAHEACPLNLAPTSSTTAALVMGDALAVALLEARGFTAEDFAFSHPGGALGRRLLLKVENVMHAGDELPHVQRGTLLKDALMEMTRKGLGMTVILETDGRLAGVFTDGDLRRTLDRTIDIHTATIDAVMTPHGKTARPEMLAAEALKIMEDHKIGALVVVDSDDHPIGALNMHDLLRAGVM
>tr|A0A2L2WP68|A0A2L2WP68_9BACT Ribosomal RNA small subunit methyltransferase E OS=Prevotella sp. MGM1 OX=2033405 GN=PvtlMGM1_1921 PE=3 SV=1
MKETRFFYVPNASISEELPEEEALHALRVLRLNVGDEIVLMDGCGKYYNAEVTFASNKRCVYKILEEHPQKCQWARHYHIAIAPTKMMERMEWMVEKATEIGIDEFSFLNCKFSERRIIKLPRIDKIVISAIKQSHKAWKPQVNDMIAFKQFISTPRAGLKFIAHCYTEIPRKYFFDELKTQGQMDDVTVLIGPEGDFSIEEVRLAIDKGYVPVHLGESRFRTETAAIAALMMMQLSDKLNGK
>tr|A0A663BED7|A0A663BED7_9ENTR Crossover junction endodeoxyribonuclease RuvC OS=Klebsiella quasipneumoniae subsp. similipneumoniae OX=1463164 GN=ruvC PE=3 SV=1
MVRTLLKLPANPQADAADALAIAITHCHVSQNAAQISETRLNLARGRLR
>tr|A0A803PXS8|A0A803PXS8_CANSA Uncharacterized protein OS=Cannabis sativa OX=3483 PE=4 SV=1
MSGSNTNHQETKCKIRKRNCSSSSSSSLVRKYRFKRTILMGKRGGSTTPAVTMWETTSSPAPVSMAETGKGKEAAPGKSVSARKLAATLWELNQKKDGTAKLDKLPKLPSQSASLPPDPSYTPISDRRRDDHAERVGHHRTMSAVTQKFQLTDYYLGGLDSLSTASLMEVEDHARAKTHHHQHHKKCVTNNGGSNKTRLKEVSSGLATSKELVKLLNHVCGLEEQRSLSTSLFSALRFELDRALIHVDRFMREQRSKGGEIEFLVKQFAEEKAAWRSKERERIREAMSCVAEELKAEKKLRKQTERLNKKIGCELADAKAALSKAVKELEREKRAKEILEQVCDELARGIGEDRAQVEELKRESEKVREEVEKERQMLQLADVLREERVQMKLTDAKYQFEEKNAAVEQLRNELETYLLNMDNNSRSYRWSYACGEELNEDEDEESRRVSVDRDFKGRKSISEKIQWGSICLNKSDSGLELDFGNKSQGNSDGVVSQAKKQEFEDEFKRYRSSIKGLADQILSGSEMVPIHGLTSPSRQWGKT
>tr|A0A6N7L718|A0A6N7L718_SINTE DUF1109 family protein OS=Sinorhizobium terangae OX=110322 GN=GHK62_00935 PE=4 SV=1
METHELIKGLAADSRRTGMPMNTAWWAAVLIAIAIAAAVFFALLGPRPDIAGAAQTVRFLFKFVVTIALAASAFVPLRMLSRPETDPRGGLLYLAIAPALILAGVAIELVVAPAETWLTRLVGTNSLVCLTFIPLIGVGPLALLLLALRHGAPSHPALAGAIAGLTAGGIAATFYASHCTDDSPLFVATWYTIATAILALLGTLGGRYVARW
>tr|A0A1Y4K2B0|A0A1Y4K2B0_9BACE Conjugative transposon protein TraK OS=Bacteroides sp. An19 OX=1965580 GN=B5F25_04455 PE=4 SV=1
MVIKNLENKIKLVGIICVSVIIGCVIISLSSIWMARGMVADAQKKIYVLDGNVPVLVQRTSMEETLEVEAKAHVEAFHHYFFTLAPDDKYIQYTMEKAMYLVDETGLAQYNTLKEKGFYNNIMGTSAVFSIFCDSIKFDKEKMEFTYYGRQRIERRTSILMRELVTAGQLKRVPRTENNPHGLLIVNWRTLLNKDIEQKTKNNY
>tr|A0A7X5XVZ8|A0A7X5XVZ8_9SPHN Murein tripeptide amidase MpaA OS=Sphingomonas trueperi OX=53317 GN=GGR89_000656 PE=4 SV=1
MSIQISAAFDSGNIRVVAIEGDRVDCEIVLDHQSDFFQWFHFRVAGAKGRTLTFRILNAGSSAYPFGWPGYKARWSADRESWRMTETDYADGILSFTHHFQTDLTWFAYFAPYSMERHHDLVSRIALQEGVTHRQLGETLDGQPIDCLTMGEGPKQVWLYARQHPGESMAEWWMEGALEFLTDEDNAVAQALRTKATFHCVPNMNPDGSRRGHLRTNAAGVNLNREWHTPTPERSPEVLAVRNAMDATGVDFAMDVHGDEAIPANFLAGFEGIPSWTDALGEKFYEFGRRLAAHTPDFQTELGYDKSPPGKANLAMSTNQLAERFGAVSMTLEMPFKDHDANADPEFGWSPTRSKLLAHACLETLAGMIDTL
>tr|C7LTP9|C7LTP9_DESBD Diguanylate cyclase OS=Desulfomicrobium baculatum (strain DSM 4028 / VKM B-1378 / X) OX=525897 GN=Dbac_0207 PE=4 SV=1
MLNFFCGGQPVKERSSSRVSAPETAAQASFDPGRASWPSRIGIVRRVALLLFVLVLVPMGTTLAMLESGTVIDPVNMLVASLAVALGLLAPISRIGAHFLVLRDLRLLNEFCSQIQQGRYGARFPVGLEGDDEHEMLRLKRNMNWMAHHIETQTKKLHERLDESDLRKRFYEEMSYRDPLTGLYNRRYFDCFVPNALRDPARRQGVFLALLDCDGFKRVNDTHGHQVGDEVLATLGRVIGESVREGVDVGFRFGGDEFGVIFRTVDFSACLGACERIRVRFANSNADGCTVSIGLCAWSPALGHDMPDLVRSCDTCLYQAKGLGGNQVVTNETVSIPPRLSSPAPS
>tr|A0A3D3VBE3|A0A3D3VBE3_9PROT Cysteine synthase A (Fragment) OS=Rhodospirillaceae bacterium OX=1898112 GN=DIT35_08550 PE=4 SV=1
AARKLARLEGIPVGISSGAALAAAAEVGSREEMTGKLMVVLLPSFAERYLSTALFEGV
>tr|A0A7X7I035|A0A7X7I035_9BACT DUF87 domain-containing protein OS=Fibrobacter sp. OX=35828 GN=GX639_08725 PE=4 SV=1
MTFSPIEHNASLRIGSVEFVSPDELKVCLDLEAPDGISANAGIPRAFPRINSYVLIATEAGYIVAQVEWIAIEKTPFPKRKGFQDYGLVDLPYPTRKLRANPLGILKQNSNNQFEFQRGVQSFPSIGEPVLIPTDQQLQAIVESGKNRRIKIGSSPIAGNAEVMIDPDRLFGRHLAVLGNTGSGKSCSVAGLIQWSLAAARPKDSEPNARFIVLDPNGEYTKVFKDKGRVFHVGSDANSLQVPLWFWNSAEWCSFTQASAKAQVPMLKRALREIRSGGGRIASDVDLELRRKISSILISLRTQIRNGDNYEGWKFGPKLEAYKKDIEAFARHFSGHTTTLGEISNAITKALSFPHQTYIKKDGCIGYNDFPVVNIEPIENVIEKFLTTIGGLVFQNDFNEDIPLSFNSVQFADHIDNLAREDSNPHFFEFLVMRIRTMLADTHMQSILGDTVDMTLEKWLKTYIGDNNPTNGCVTIIDLSLVPAEIVHIVTSVISHMVFEALQRYHKHKKTSLPTVLVMEEAHTFVKKYKEEAENQSVSAMCCQIFEKIAREGRKFGLGIVLSSQRPSELSPTVLSQCNSFLLHRISNDKDQELVSRLVPDNLRGLLRELPSLPSQNAILLGWASELPIMVRMNDLNKSERPHSDDPDFWNVWTGKDECGNTVVRDVDWEKIAADWQGRIK
>tr|A0A1Q6MVU0|A0A1Q6MVU0_9FIRM Phosphoesterase OS=Coprobacillus sp. CAG:235_29_27 OX=1896995 GN=BHW13_05765 PE=3 SV=1
MKILLVSDSHGYDDELKKVLENVKCNLKIHCGDSCFDKNSPFIKEFAAIVDGNHDQGFFPLTATLPTALGNILITHGHKFNVYAGYDYLVEYMNKADIHICFHGHTHVPHYEIYKNKIFINPGSIMFNRGQSQCGSYAIVSVDDKLHVDFFDSRTQKKIPQSLIDKDQDILNEFKRFACQK
>tr|A0A495SQH4|A0A495SQH4_9FLAO Helix-turn-helix protein OS=Chryseobacterium defluvii OX=160396 GN=BCF58_0976 PE=4 SV=1
MKTSPKPYSILLFILLFHAVSSELRGQYSEFYQIRKRYEDRKENDTSALPLVQISIEKAKREKNYHELYNGYKFSGYFSESKNSKLIYADSAIEAAFLSKDEALISRAYMGKGIVYYYSFKKYKQALDQYLKAYEYSKKTKDQYQQNKLQYHIGVVKSYIGFYDDALDNLYPSKNYFYNESLKKDIHPNILFGIKRGYFNSLHQILVCYRNLRDYKRIDSLLALAVNDQNLKDNYTLEYGYFLKEKGINEFHKADFRSSITSLNQSLIPIKKAKDFAWESVCYAYLGKSYLRLNNEKKAIEYFTKVDSIFQKEEFMIPEVRDSYECLIQYYKTRGEAKSQLYYTGQLVKADNILNRKFPYLSSKIFREYDTSKLNETHHQEKKTLQREKVIFIGGTIFLLVIFLHRYWKEQNLQKNYRLLEERILNKNVKSNKTQDRQDNPYSLEIEKEILDDLLKKLEDFEKKNKFLESGITLYKLASKFQTNSTYLSQVINEYKGSNFKKYIGELRIEYITQKLYNDKKYLSYTIEGLAEECGIASRPNFSNLFQEYNGIRPRDFIKKRMEDLKNKENLEEGAISCE
>tr|A0A182RGG3|A0A182RGG3_ANOFN Uncharacterized protein OS=Anopheles funestus OX=62324 PE=4 SV=1
MEEFLEAIQCGQYEVVRAALKNSDLDLDHQDPAREGNSALHLATIAKHNKTRLIELLIEAGADCDLRNHANLTPAELALDNGSQYVAEFTLCKELDAVPDDQALRRLIRRGSVELLKIFLEKRAFDIHTKMKLIANLLDELTVKGVPIDRSMRVFLEYELIAHSYEDGTEGNATRQRRLGASGGASSKRKADGKVQSSTGETEADRRIELVLSYTKYLTDRYDDDNLNDLDDEFVVRLRAICECLYYLDGLDCCARSDWKLLKLIPLGELAYLCSVLLSILEKSVGFEMYKLVLNKHQIVSFLRAVSAELGTLVKASTRTVRTDRSFQWTPQLLLDLIVCIREQKLSQYVGRRRRACEDLQRIATTTCPLGAAEHDRVLVELGRRELIALQDGVLERGTKWGVADYVAYLRDDHPLTVGQLWHRYHPKLRLSKRQVAYAASRRELLSKIRARRLDELSRNKTKLLERELGARELQGSPSARTVRRRHRTVFGHIRRTYEQIWQMHTVKKIAYYVENALVIDLDDRSNATLCLMAIQRVMQFIGEVSKESQQHQATFARMLANLLDHVLSPLCTTATLTDADDLRESFSARCSVGKYFLHETLTGEQVRTIQERLKAVYRFCLYVINIQLIEAYKTFLGTAYRLRNTNQLQSYARYIGEHNLHTLSHIKFEHVFYDEKETARIVQELKKMYLGMSNELKLLSFIEKNIHFRFYHMQYHQTRLRVTLSNFAIVYRALKANPDYGCVRRLLHSYLHQSYQKYDISRSISISDANLALKELLRPYSSISENEDTLKVVRHLEELQHLMDPDRLFGINPVHRTGGHSSLEAARYQKFTRKLLKDMNASTLNDEEFQQLHDKLSRMYYGNIFLVQQRYHTLEEFFRTKGVALDETDLLTRRESDEEMLQELFDSKVNDVVEILEKFECTDVQNLCEVIEQLPPVVQFALEYGLLELLEILTSVNAIGSNRWHSLQCSTAVLCGHNLKTFLTGGRESQVLESLTLKSNATIFLNAIIFKQRSYELYGGRVDGRHCSKSKLMVSCFADKFANRLQWLEQQRILYETIRTGEVKLSTLRRQVRDGVEIGGQRFGSLMPNEMCHYGLIDCAIAGDFRAMIDLLTETDSTAESGVSSSERHHLLRYLLRRTTKSHFIAEPLERMKQEDRHTLVLYLCLFLGDVALFRQQLVRYNAYDELHLFVNSEDHRFVQQLLSELPDYDWSRTDANGMTILQKLVNAGNQPAIEDLIRRMSPEQLNSLCSMKYTALNLAARLNLVEIVRVLASAGIDLNVMSEDEKLPVFWLIQYGNSRTVVQQTIDAATELTAFSSELCLLHRAIEYDNEDVLRYLIEDCKVDPTRIYSNCNNVLHVAAGFDRCRIMRYLLTIPGLRKIVNNCNLVKNSPLNVACKEGYIRSARVLLAQGGASTETCGEYGLNALAFAMYTNNVKLARCLFRYDASIGNPLSSDFQPINMAIRNRNIRMLELLLRRGVDVNSAPLCFINAVYAQSRDIVQLLIGRGVKHVNHRDEFCQTALHLCVERDEYEMARDLIRYGAHINAKNRSGMTPLHLAVQRGNVRLVQLLLDHKCSVDELNYHGETPLIRAVASNNTKLVKILLNNGASIERLRNSDPPVLLYLVQENHEEILDYLLEHYQFNANEQDAYGNTLLYVATQHNHINIVKLLVDKYHAKTNPTNHKKLTPLMIARVKEYKEIFHFLEARLVEE
>tr|A0A1S9BZC6|A0A1S9BZC6_9FIRM Oligoendopeptidase F OS=Oribacterium sp. C9 OX=1943579 GN=BXO88_02085 PE=4 SV=1
MKFSEMPYERIDFTKLSKDFKELEERFEKAASGEEQYAVHEDFYKIYNHVMTESQIAMIRSDIDMSDEALLEEQQYFDENMPVFQNLVVSYRKKLFNSKFRPYLEERIGKVAFRNIELAMKSVDEKLIPLMQEENKLQTEYNKLLASARIPWNGEELNLSLMNPYLHNQDRTIRKEAWEKYSAFFVAHQEELDDFYDKLVKNRTKQGELMGHENYLPLGYARMNRNSFGRSDVEEFRKQVKKDFVPFAEKLHDIRRQQLGLSRLSYIDEGVYFTNGNPAPTGTPEEILAAGRKMYNELSPETGRFINFMCDSELFDVLGRKNKKTGGYMTMIPDYQAPFVFANFNGTSGDADVITHECGHAFQGYITAGDPVIEHNDITMEVAETHSMSMEFFTEPWMPLIFGNRAEDYVKMHFMDSVIFIPYGTMVDEYQDIVYSNPGLTPKARNEVWRDLERQYKPHLDYTGNEYFEKGGYWQRQHHIYDSPLYYIDYCIAGANALQYKVWMDQDYKAAWKSYLELCRLSASDFFDGLVKKSGLNNVFEDGCLRYVVKQLEEKM
>tr|A0A355Z3B3|A0A355Z3B3_9PORP Uncharacterized protein OS=Porphyromonadaceae bacterium OX=2049046 GN=DD424_00560 PE=4 SV=1
MQLKSSLKQLLVESRANPGFTSLYVGGVAFAVAFTMIFAIIYYVHLAPLYPEYNRSSTYYINNLTVRNDKTGAMNQSSVGIPFVREFVEKSKNIEYSTIVFQMQGFIQPPDQSGDFSVNIIDTNPDFFKLYSYEFVAGRPFNEAETESAINNIVVDSSVADRLFGVSEQAIGKEISISYRPYRIVGIVRSGNPVAYMSYANVFRPYTIRTKSANTSLKGDKCDYLGDYSVPIKFKDSRQAERFREELTEKVRRINAADSTGQRLDIQSAPISHTLRILSQRSNGENLSMTEYLKPLLITLLVLLIIPAINISGMIGGQMDRRLAEIGVRRSFGATRGHLTRQVMFENLILTLFGGIIGFAIAWIIIAFGRNMLLKLIIPAWECIDAPAEISTEMMFAPLVFIAALLLCLVLNLLSAYIPVRLSLRRPIISSLNSKR
>tr|A0A195BT40|A0A195BT40_9HYME Uncharacterized protein OS=Atta colombica OX=520822 GN=ALC53_01728 PE=4 SV=1
MAKNIGSILLLTFALSFVRADEYERQWNTPPELIPESIVKILDNEESQMRLLSLIPVTATVSLTGENNNAHSVSLDASLDGISFSESKIHDRPTGYETDGSSVSVSKSTTVSAGLSGISTAAAEAYNNGNNAKTESHSLSFGQSTATSFGTIENGQAITGAASSTGLSQSFTIGDNRRQFSQVGAVNMQYPTWSNIGPNNGYIDQRFKRPTLTISNIDPNNGYNDQRFNRPTLIISKPWDETNRPTLNIDVSDTSRQEQKPTIHIHKWQPNRRISRPDFSIKHQLHDIRNDRNHGSISLRIENKNFKQEYSGSDLISDLAQTVDKLFDIV
>tr|A0A5B7XNA0|A0A5B7XNA0_9ENTR Mechanosensitive channel protein OS=Leclercia adecarboxylata OX=83655 GN=ybiO PE=3 SV=1
MPWILLLLISLFCLPAQAVSLPGMPAATAQTPPPAEPDVEQKKAAYSALADVLENDTSRQELINQLRSVAATPPQEPVPKITPPEIADEKTVLENVTDISRHYGDALATRFAQLYRNLIGSPHKAFNPQTFTAAAQQFLILAGLVFAFYWLVRLCAWPLYRRMGSWGRKKNRETSSWIHLPLTIAGAFIIDLLLLALTLFIGQILSESLNTGNPTIAFQQALFLNAFALIEFFKAILRLIFCPRVPDLRPFAINDSAAHYWSLRLSLLSGIIGYGLLVAVPIISNQVNVQIGALANVLIMLCITVWALYLIFHNKRAITEGLLHLADRSLAFFSLFIRAFALVWHWLASAYFIVLCFFSLFDPGNSLKFMMGATFRSLAIVGVAAFVSGLLSRWLAKTITLSPHVQRSYPELQKRLNGWIGVSLKVARILTVCVAIMLLLSAWGLFDFWNWLHNGAGEKTVDILIRIALILFFSAIGWTILASLIENRLSSDIHGRPLPSARARTLLTLFRNALAVIISTITIMIVLSEIGVNIAPLLAGAGALGLAISFGSQTLVKDIITGIFIQFENGMNTGDLVTIGPLTGTVERMSIRSVGVRQDTGAYHIIPWSSITTFANFVRGIGSVVANYDVDRHEDAEKAQGALKAAVDELLEREDIRGLIIGEPSFAGIVGLTSTAFTLRVSFTTQPLKQWTVRFALDSMVKKHFDLANVRMPVQMYQLLPSPTGENTQIQNRT
>tr|A0A1F1XSS9|A0A1F1XSS9_9MICO Esterase OS=Brachybacterium sp. HMSC06H03 OX=1581127 GN=HMPREF3159_00885 PE=4 SV=1
MIRLRTDFFAESLGMGTSMVVLMPQAASGIGMEGSDAPGAGPSADGTADGGADAGGAGAADGPAVPVLYLLHGLSDDCTIWERRTSIERYATEKGIAVVMPEVRRSFYTDEAVGEAYWTFVAEELPRIVARTFRVSTAREDTFVAGLSMGGFGALKLALNHPERFAAAASLSGAVDLTSMDLDWTGTLAQRVWGGREIAGTADDLLGLLGKRDPAELPALFLDCGTEDQLIDQNRRFLAAAEQAEVEVASRLRPGAHTWEFWDEGIQDVLDWLPIRG
>tr|A0A2D8DKP5|A0A2D8DKP5_9GAMM Oxidoreductase OS=Gammaproteobacteria bacterium OX=1913989 GN=CMQ67_01330 PE=4 SV=1
MSDTYNAFVVDEIEDQFKSSIKSLPLPELQDGFVLIEVLYSSLNXKXALSASGNKGVTKSYPFTPGIDAVGKIRQSKDNNLKEGDEVIVTGYDLGMNTNGGFGEIIHVPSGWVVPXPNNLSMEEAISFGTAGITAAASVDAVLSKIDAPEXPVAVSGATGGVGSIAVGLLSKLGXDVTAITGKENSSQFLKDLGAKNIXLRDDFCSEKIRPLDKTKFSAGVDTVGGEILSRIISQVDRHGVITCCGNVNSIKLETTVFPFILRGIALQGIDSAESPITYKKYLWDKIASEWQIGYSKSSIKIIKLNELAPEIDKILNGNQQGXVVVKHGE
>tr|A0A562L573|A0A562L573_9GAMM Aspartate--tRNA ligase OS=Luteimonas cucumeris OX=985012 GN=aspS PE=3 SV=1
MRTHFCGLVDEALIGQTVTLCGWADVARNLGGLCFIDLRDHEGIVQIVAEPDADMAGNADVIAAASQVGYEDCLRVTGVVRRRQSVNDKIRTGQVEVVATKIELLNKAEPLPFHAHENAGEDIRLKYRYLDLRTPEMQRKMRTRIKLVQALRRWLDARDFQDIETPILTKATPEGARDFLVPARMHPGEFYALPQSPQLFKQILMVAGFDRYYQIARCFRDEALRADRQLEFTQLDMEFAWVGERDVQDTTEEMIRSVFREVMGVELASEFPRMTYAEAMRRYGSDKPDLRIALELTDVAELVRNCEFKVFSDWANHADGRVVALRAPGAAALSRKQIDDYAAHAAKHGAKGLAWMKIEDAAKGRDGINSPIAKFLDDATLAAIVSATGAQSGDAIFFGAATYKSASDFMGALRLKLGKDLGLVADGWAPLWVTDFPMFEWDDEEQRYVALHHPFTAPAVDDAADLRANAKTAVSRGYDMVLNGNEIGGGSIRIHNSQMQSTVFELLGIGAEEAEGKFGFLLDALRFGAPPHGGIAFGIDRIAALMAGTESIRDVIAFPKTTTAQCLMTGAPSPVPDKQLAEVHVSIRPKAQP
>tr|A0A830CSJ2|A0A830CSJ2_9LAMI Uncharacterized protein OS=Phtheirospermum japonicum OX=374723 GN=PHJA_002054300 PE=4 SV=1
MAMRTFYNEIKGMKVKELPAHLKPMFTIDYAKNSVKRGLDNYHAKYIETSSVDPLFHICFGGMIFSYLVALPEERRHLEHAKEHGGGH
>tr|A0A5R2N5V0|A0A5R2N5V0_9HYPH 23S rRNA (Pseudouridine(1915)-N(3))-methyltransferase RlmH (Fragment) OS=Mesorhizobium sp. M2D.F.Ca.ET.145.01.1.1 OX=2563933 GN=rlmH PE=3 SV=1
MKISVHAVGRMKAGPERELADRYFERFAKSGPAVGLEFAGITEIAEGRAQSASERQRDEGSRLQAQLQPGTALILLDERGKNLSSQDFASHIGQLRNGGRKALVLAIGGADGHDPPLRDQAELVMSFGALTWPHQLVRVMLGEQLYRVATRSEEH
>tr|A0A7G8J7C1|A0A7G8J7C1_9SYNE Uncharacterized protein OS=Synechococcus sp. SYN20 OX=1050714 GN=SynSYN20_02147 PE=4 SV=1
MVVDCLDHLFLILWSFTTFIDLGFRDLMFFDRLLHAFCFC
>tr|A0A1L8E3I3|A0A1L8E3I3_9DIPT UDP-glucose 4-epimerase OS=Nyssomyia neivai OX=330878 PE=3 SV=1
MSNGKTVLVTGGAGYIGSHCVVSLQEAGYQVIALDNFTNAVNNFKNESMALQRVAQITGKDVAFYKCDLLDKEALEQIFQQYKIDSVIHFAAMKAVGESMQQPLLYYKNNLIGMIHLLEVMKKHKVFNLVFSSSCTVYGEPKELPITEEKETGKVTNVYGRTKFFIEEMLRDISVAEEEWNIIALRYFNPVGAHKSGLIGEDPTKQFTNLMPYISQVASGKKDCLTIFGDDYDTPDGTGIRDYIHVMDLSTGHVKALEKLEKQHLRLKMYNLGTGKGVSVLELLQTFERVNNVKVPYVIEARREGDISSMYADPTLAETELGWKAECTLEEMCTDFWRWQTMNPNGYKTGIVNGH
>tr|A0A1M3I4N8|A0A1M3I4N8_9SPHN 3-oxoacyl-ACP reductase OS=Sphingomonadales bacterium 63-6 OX=1895846 GN=BGO57_05825 PE=3 SV=1
MSISFEGRVAIVTGAGGGLGRAYALELAKRGAKVVVNDLGGARDGTGHSDAALKVVEEIEAAGGEAMSNGASVTEYAQMVEMVAKAKEKWGGVHVLINNAGVLRDKSFSKMEPEDFEFVVKVHLFGSAYATKACWELMREQNYGRVMMTASSSGLFGNFGQANYGAAKLGLAGLAKTLHLEGAKYNIRVNTLAPLAATRMTEDIIPEQIFPMFAPENVVPAALFLVSEDAPNNVIVGAGAGGYHSAWVTMNTPVILPEGERSVEGFAAHWDQISSREGDFVPVSGMEQTQRVLAAIQKAAAGG
>tr|A0A7C6JME1|A0A7C6JME1_9BACT ABC-F family ATP-binding cassette domain-containing protein OS=Petrimonas sp. OX=2023866 GN=GXX67_10465 PE=4 SV=1
MATPILQIDKLTKSFGDLLLFRESSFGIAEGEKVGLIARNGAGKTTLLNILAGKEPYDDGRVVFRNDTRVAYLEQSPTFDPDLTVMEACFSSDNEVVRLIARYEEVIASGDTSNLEEVLTQMDFHNAWERELQVKQVLTWLNITDFQQKMGELSGGQVKRVALANVLISEPDLLIMDEPTNHLDLEMVEWLEERLTRSSVTLLMVTHDRYFLDRVCTRLLEIDDQQIYAYKGNYSYYLEKREERVMAQQAEVERARNLLRKELEWMRRQPQARGTKAKYRIDAFHDLAEKARGESAEQSVRFAAKGSYIGKKIFEAKNVSKRFGDIRITESFNYTFTRYEKMGIVGKNGTGKSTFVKMLLGEVKPDSGYFEIGETVRFGYYSQEGMEFDEQLKVLEAVQKIAEVIDLGEGYRLTASQFLQHFLFPPEKQYDYVYKLSGGEKRRLYLCTVLLKNPNFLVLDEPTNDLDILTLNVLEEYLAGFKGCLIVVSHDRYFMDKVVDHLLVFHGDAKIQDFPGNYSQYREWKAEEDRREAAEAKAEAVKIEAAKAEAINPGKGRVALPNGKTDELGVGSSGETDPETTDLTTHGSKKGEKKRLTYKERQEYESLEGEIERLEKEKESISELLSSGNLPAEELISQSERLSLLLEQIDEKMMRWLELSERA
>tr|A0A839T1V7|A0A839T1V7_AZOMA Ribosome biogenesis GTPase OS=Azomonas macrocytogenes OX=69962 GN=FHR87_000879 PE=4 SV=1
MAKRQLNRRQSWRIEKIQEERANRAARRESRLVDELEGGDLGREQEGLVIAHFGVQVEVEARQDELAGQIFRCHLRANLPALVTGDQVVWRPGNQGNGVIVAQLPRRTELCRPDSRGQLKPVAANVDRIVIVFAPLPEPHANLIDRYLVAAEHAGIQPLLLLNKADLVTAENQVRLETLLAVYRALDYPLLEVSARQGSGMDELKARLDGHVSVFVGQSGVGKSSLVNSLLPGLDTRVGALSELTGKGTHTTTTARLFHFPGGGELIDSPGIREFSLGHVTRAEIEAGFREFDDLLGRCRFRDCHHEHEPGCALLKALEQGRIHPQRMESYRHILSSLPQTEY
>tr|A0A523ZWY7|A0A523ZWY7_9ARCH Transcriptional regulator (Fragment) OS=Candidatus Bathyarchaeota archaeon OX=2026714 GN=E3J20_08840 PE=4 SV=1
HLYVVESADFLFLMRQTGMTFGNLSSHMSRLETAGYIDVEKEFVGKKPNTKLHLTEDGRAAFQEYRRNMRHVFGDLSS
>tr|A0A0B5IZ06|A0A0B5IZ06_9VIRU Uncharacterized protein OS=Pandoravirus inopinatum OX=1605721 PE=4 SV=1
MSQARRVGWRSRRPDAPIHYFFLLHRQTIAGEKRWSSFFGIVSVVLAPLFFSDKRPRPAPPAALSNRTRHGQAARLHTRKAHKACLLRHNQKSIIPSEKEEAEQEKGKQ
>tr|A0A7W5U4L6|A0A7W5U4L6_9HYPH Surface antigen OS=Rhizobium sp. BK612 OX=2586988 GN=FHX13_001390 PE=4 SV=1
MKLRTFFLVVPSLFAALALSGCSTTSSLGGGKSLFSSAKPPASATFINALDGGIVERTGIKLSDSDKQRALEAEYRALETSPLGQPVAWKGRNASGEVVPAAPYQVGSQNCRQYTHTVTVDGKPTTARGAACRNDDGTWTPLE
>tr|A0A382FFA2|A0A382FFA2_9ZZZZ Uncharacterized protein (Fragment) OS=marine metagenome OX=408172 GN=METZ01_LOCUS214166 PE=4 SV=1
VDKNIIAAGDKTTVEAAKEILWLGGNAYDAAVAAVFTSMTAEPALTGPGGGGHFMAYPADGRAVLFDFFVDMPSGVIEPN
>tr|A0A835W1B8|A0A835W1B8_CHLIN Uncharacterized protein OS=Chlamydomonas incerta OX=51695 GN=HXX76_008806 PE=4 SV=1
MEEARVAAVSVSGGVRQQPQVQAQAQTRAASPAASAADAGVGATAATAATPGFAAATATDSAAAATAVAASGPAAAGGGRRPSRSAAVRARSAITHQLHEEQLPLAKREKRDAEFSEQVSDVEGDGVAGTGAAPAAATTAAAEPCGSPPVGDAAAAKQRPRKLRLLPRAPNVICAACAKSCAARGGFFAQGTGAYTCSSCCSRNRIECGFYGPPGTHSLEEAGGRKHNAQQSRPRGISPSASASEGATAVRVVTAATAGTAATAAPGAKAPSGTAAVAGLAAAGGGQKAAAAKAAVARATARVHGAAGASTARKRLPPPPPRPPPPPPPLEDAVPAEDATPAGDATPAPAQPAPPKCTTCGAVRAPHKLTSPGFFARGTGAYTCHGCCVRNLKSAHGFYGPPGTRSLEEAGGRECAECGTQGANSTSWRLHPDRLGHYLCSSCSGRYESRKRKLDRSGGGGGGPAPKAQKRSLGGVVDKASGGGDAPAAAENATAPAAAGKGGSGTKRQRQLAEAAGAGSRSGADAAASSAAAAAPATPAATRQAQSQQPKRQGPTKAASGTVRQAAPAAAAPDGPPAGGGGGAAPAAAAGRPPPAPEPKCSGCSSSFKRTDNGLFGFFSHGTGAYTCHGCCSRNQHAQGFYGPLGTRSLEEAGGRACAGCGRQDATQWRPYPPRLGAYACAACISKHTRRMQQEAQDPEGLTAPADAPRRQTPQPPQQQQQQPKQQPKQQPKQQPKQQQSQQQSPGQGQRQSQPQASGSGPAHSCATPAAPQAQGRGARLGAAPSRAATSAAPAARAQASSQAGASTGLCGASDAAATAATASMSRSTNATAATAFTSSEWTSPAVDGIRCDFCGGRFVRAATGQFGFFARGSSVYTCHGCCCRNLSRYAFYGPPGTRSLQEAGGRECASCRTTQAERWLPHRFRLGLYLCRPCRCRQDKGTLPKVGGGARGNQQAAAAATKAAAPKAVAAKPVAAAGGSARAPPQRRTAAARSEHVVGSDDEELEEQAADGEEEVEKAEDEAEDEEAARSARQRLEQEAAARVRSSRALLAASVDASAVAVAGLIAAEQAAGRRGSSSSGNNSSSCRLPAPPKLEQVAGRISAWLQAHVCQQPLALLLGPSAKALGLDREDGLLGLEAEEQETWNVCRARVCGVWLRVAHQAMEPAAATSPAADAAATAAAAAAAAAAVEARAGAQPAAPSSPAAVQQFRMVAFRASTALASELARWLRSAPRLEVPRASPPPAAPLTPAHAPAARPVRPAGPAEAAQHTSAPGPSQCAAASAAGDGAAVSAGAEVGGGSGGGGSALPPRSPAGSASGSGPAAELPGEDIRVLEAALQPLLLRSVCEAMWLGLTEGSAGDGGVGGGRRRI
>tr|A0A7X4ZEP7|A0A7X4ZEP7_9CLOT Sugar isomerase OS=Clostridiaceae bacterium OX=1898204 GN=D3Z55_07300 PE=4 SV=1
MRNRMGKLKRNSIVALAAQIVNIISAFILPRLILSTFGSDVNGLVNSISQFLQIIGLLELGVGAVVESSLYKPLSERNNLKLSQIMTSATKFYKKIAIVLLIYSVGLVMLYPATVGQAYPFFDVAILIIALSVNSFAQYYFGMVNALLLNADQRSYIVQMLSIIATIANTVISVLLIYSGCSIQAVKVVSSFVFLSKPIFLNNYIKRHYQINYHEVYEVEPIPQKWYGIAQHMAHIVLDSTDVVILTIFSSLSSVSVYSVYNLVTNGMRSLVLSVGTGMQSLLGELIAKKEKGKLDTVFARLDWLIHTVAVVCFGCTMALVVPFVQIYTSGVTDINYVQSLFAFFISLAQCFRCIRLPYNVVILAAGHYKQTQSNYIVAALLNISISIFTVIRFGLVGVAIGTLVAFVYQNIWMAHYISKHIVCWPFKNFIRQTLIDLITLACGYAVTRSLYLGELNYVHWMLNGMLTSVIWIALSMIINFIFYRERLREIYYRYIRRLIG
>tr|A0A7J5A9S6|A0A7J5A9S6_9FLAO RecQ family ATP-dependent DNA helicase OS=Flavobacterium luteum OX=2026654 GN=F6464_13185 PE=4 SV=1
MQTALQILQKYWKHDAFRSLQNEIIDAVLNGKDTFALMPTGGGKSICFQIPGMMKEGICLVISPLVALMKDQVANLQKKDIKAIALTGGIKSEEMIDLLDNCEFGNYKFLYLSPERLQSDWILERLKNLPINLIAIDEAHCVSQWGHDFRPAYLKIAELKPHFPKVPFLALTATATPKVKEDIIAELNLLNPQIFQKSFARENIAYMVFEVEDKLFRIEQILRKNPQPSIIYVRNRKSCLEVSSQLQSLGIKSTYYHGGLSPKEKDKNMQLWMREEVQVIVATNAFGMGIDKANVKTVIHIQLPENLENYYQEAGRCGRDGEKAFSVILTSPSDIVQAESQFIAVLPDKSFLNTMYVKLCNYFQIAYGEGINEQFSFNLNHFCLKYGFPILKTYNAMQFLDRQGIISLSQEFTEKITLQFLISSKEVIRYVSLNPNDESIILNILRTYPGVYDMQTSFNLQLIAKKSNHSENEVLAVLHKLKEKEIIDYHSRNNDATLIFNEVREDERTINRVSKYLERQNNLKKEQLDAVLHYIQEKSVCRSKLILNYFGEKTDSVCGVCSYCISKNSKKRNTTTTTEAIIILLNKGDLNSREIEIKLKYNAEDIIFALQQLLDNDTIMVKPNNKYSIKL
>tr|A0A7K6EWN1|A0A7K6EWN1_9PASS F162A protein (Fragment) OS=Grantiella picta OX=266360 GN=Fam162a_1 PE=3 SV=1
LASLHPLLSLPDRAVKLLGKNIPSILRMSEGVDPKISRRLSIKPQEDLQPKSRSASGVPGYKPTNWEKRFLLWAGHYKKPEDIPETVSIETVRAAMTKLRVKFSYVMIALTIVGCITMVIRGKQAMKRHESLTSINLEKKAQWKAESASAKP
>tr|B0YHV5|B0YHV5_ULVIN Ribulose bisphosphate carboxylase large chain (Fragment) OS=Ulva intestinalis OX=3116 GN=rbcL PE=3 SV=1
ILAAFRMTPQPGVPAEEAGAAVAAESSTGTWTTVWTDGLTSLDRYKGRCYDIEPLGEDDQYIAYIAYPLDLFEEGSVTNLFTSIVGNVFGFKALRALRLEDLRIPPAYVKTFQGPPHGIQVERDKLNKYGRGLLGCTIKPKLGLSAKNYGRAVYECLRGGLDFTKDDENVNSQPFMRWRDRFLFVAEAIYKSQSETGEVKGHYLNATAGTCEEMMERGQFAKDLGVPIVMHDYITGGFTANTTLSRFCRASGLLLHIHRAMHAVIDRQRNHGIHFRVLAKILRMSGGDHLHSGTVVGKLEGEREITLGFVDLMRDDYIE
>tr|A0A2S8NPN6|A0A2S8NPN6_9MOLU Uncharacterized protein OS=Spiroplasma sp. ChiS OX=2099885 GN=C6B38_09260 PE=4 SV=1
MKTLHEMIKDLTGIDVEQDKISDYLEEEVLYLHGAYLRYANLSCANLKGIKITKKQLDQLTVIEENE
>tr|N8Y4E3|N8Y4E3_9GAMM Uncharacterized protein OS=Acinetobacter gerneri DSM 14967 = CIP 107464 OX=1120926 GN=F960_03962 PE=3 SV=1
MKLDPQTALVHAERKAPQYIETVQAPIYRASTIIFKNTSALFDRHWTDDYDYSYGTHGTPTTYTLADNIAQIEGGHYCLLAPSGLSAINLVNSCFLSQGDEVWVADNIYGPNMEHLQDLAKRYGVIVKVYNALDVDSFQPSDKCKLLWLEAAGSVSLEFPDLVQLVKKAQALNILTALDNTWGAGLAFSPFDFSSEHLKVDISVHALTKYPSGGGDILMGSVVSQDKALHHKLFQTHAIQGISVSGDDVAQVQRSLASMQIRYEQQAKSALTLLAWLKQQKQFAQVLHPADPDAAGHQFWQEVCQTQKSAGLVSVIFNDHYDLTDIRKFCDNLNLFKLGFSWGGPVSLAMLYDLKKMRALDYPHLKQGFLVRFCIGLEEPNDLIQDIENALNKMK
>tr|A0A7S0UZ86|A0A7S0UZ86_9CRYP Hypothetical protein OS=Hemiselmis tepida OX=464990 GN=HTEP1355_LOCUS251 PE=4 SV=1
FWFGGEKEKVTDHCRSWRARSLAGGGRLGARLGGRPTGDLTRSRQLGMLFARLAGKAPFDSPGAWDSPSADADIGGADYGKPINLSIYKSIKDDQCSRRRTGCDWTVVGPVTARSRRWEFK
>tr|A0A015LJQ4|A0A015LJQ4_RHIIW DNA helicase OS=Rhizophagus irregularis (strain DAOM 197198w) OX=1432141 GN=RirG_229180 PE=3 SV=1
MSESPSRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQPSSPQTMSDAMLESPNRNRNENNTPEREQHFSPQTMSDAMLESPNRNENENNTSEREQRRSLTQTISDAADSTRNFISNALGLRQEQDNMSTPTHLRTENYSNVHTPRNLLSPATVASSLATPRSISSPRTPRRSQISHDNTPRKSQTSTPRRRINTNPENLAENPDNDLLKEYYEGIKSGSATPRTPRRQQRRGDIHSARSAKRLIDLDIQKGDEDVTMLEAEEKITTDQIWGTTIKVEEVRKSFKKFLKEFKLSDLSRRNGRSDDDPFYIEYLKIIERTEEFKFNLDTQNLLAFEDTHKLYYQIVRYPQEIIPILDYVVAQMYTELHEKEPKEDIRVFRVRPYNLGISKNMRELNPSDIDQLVCIKGLLIRSSPILPEMAVAFFRCSICDKSVEVEVDRSKIDEPSRCPRKQCNSSGTMVLIHNRSIFKDKQVCRLQETPDCIPDGQTPHTISLCLYDNLVDIARPGDKIELTAIYRSSPIRVNNRQRTIKSLFKTYLDVVHIRRSENIHENGDNDFTQIYHGLEDENKEVENVQEGFSHDHFSRDQKRKQLTFTEADIQYFKELSKNPLLYETLAHSLAPSIFGMDDVKKGILLQLFGGTNKLFRKSGSPRFRGDINVLLVGDPGTSKSQMLQYVHKIVPRGIYTSGKGSSAVGLTAYVTRDPDTKQMVLESGALVLSDGGVCCIDEFDKMSDGTRAVLHEVMEQQTVSVAKAGIITTLNARTSILASANPIDSKYDPKKSIVRNIDLPPTLMSRFDLIYLVLDKIDKQADWELATHLVSLYAEDSPFSASVNILPVETLAKYIHYARIHYNPIIGNDEAHKALVDAYVSLRRLGQDPRSSENIVTATTRQLESMIRLAEAHARMRLSNTVEMADVEEAERLLREAIKLSALDPETGRIDLDLITTGHGSYERRLLTVMREAFQKMLNRRNITSINWKKALEDFNEQSDVKINEKQFETMVNSLEQEGILRLAGNGNDREIITLNEDDE
>tr|Q0V3S1|Q0V3S1_PHANO Eukaryotic translation initiation factor 6 OS=Phaeosphaeria nodorum (strain SN15 / ATCC MYA-4574 / FGSC 10173) OX=321614 GN=TIF6 PE=3 SV=1
MAVRAQFENSNEVGVFSTLTNAYAIVAVGASENFYSVFEAELQDVIPICHATIAGTRIVGRLTAGNKKGLLVPTTTTDQELQHLRNSIPDSVKIQRIEERLSALGNVICCNDHVALVHPDIERETEEIIADALGVEVFRQTIADNVLTGSYMALSNQGGIVHPKTSIQDQDELSSLLQVPLVAGSVNRGSAVVGAGMVVNDWMAVTGLDTTATELSVVESVFRLGEGNGPSNINTTHKDAMVESFY
>tr|A0A816CJR2|A0A816CJR2_ADIRI Hypothetical protein OS=Adineta ricciae OX=249248 GN=XAT740_LOCUS50392 PE=4 SV=1
MSIIDVDDAKNRLQEYCQQRNLPLPIYSLIEKTGPDHSPMFQVEVIVDGMTFIGDRSTKKRVAEKLAASEALDYINKPQSPPKKIVNQQTKDPFTLFQSLNLEDESTEIESMEYD
>tr|K1XWP4|K1XWP4_9BACT Site-specific DNA-methyltransferase (adenine-specific) OS=uncultured bacterium (gcode 4) OX=1234023 GN=ACD_80C00146G0003 PE=3 SV=1
MAQLFWTGTIKSHTEILQWFDESKISLIKKLHQDWKNWLLAGETEYEQTFNQLFFWELLGYENRINRIPKGAVIGTGIADLTLWYFDEGKYSPDDIQIVCELKGAKTNLVKKQFWHGGLSAVGQWFSYKTGLKNCKRLIVSNFYEIRLYRDNQTDFEVWTLDELIDPKDNYSNLRKLYLLLHRENLLAHTGKSKTEDLLSHFREEQKEITVKFYKEYKQLRIELINDIKQHNPWISIEILIEKAQKIIDRLIFIFFCEDKGLLPDKKLKENIVRSREAGFSAWEVTKKFFGLIDKGSEQLGIPSGYNGWLFQKDDVLDNLEIGDSICKKFTDMTNYDFDDKLSVNVLGHIFEQSISDLENLKIDLLGQEVETWQLADTGKGRRKKDGIFYTPEYIVDYIVQNSVMKYLNEKEDELIKKYRGEKNDPKLVAKAEIEAYQAYQNILQNIKVLDPACGSGAFLVRVFDVLFEENKRVWSILNSLFDESETYKNILTNNIYGVDLNEESVEITKLSLWLKSAQKGKKLNNLDGNIKCGNSLIDDVFIAREKAFDWNVQFKEIMKNGGFNVIVGNPPYVRTQNLDKNSKSFFDEKYKVSYKNYDIYILFVEKAFSLLESDWVCSYIMPKKFINTDYWEKFKMFLYENNFIDSFVDFWTNQIFGDATTYTWIFVFTKGIKKTLNYKNIDDLNQFPPIWFDSINYSNLSWKDWILTNPKEKELFWKLQKESFLWEFTDRVFQGLVTGVDGIYIMEQKWNNLFSKENGKSYTFDCDIVFPLLKWTEIKRYSTPSANYKIIFPYKIVDWKAILIDEETMKNKYAEIYNYLKEFEIKLRTREWWKFDNQNWYSYSRNQNIALMPSKKILTQVLSNHSSLTLDEAWKYFFVWWWTAGWYWISIDSNWKLDYKYLLTLLNSSLLEWFLHKYASPFNGWYYAYSRATMEKLPIKEIPLSDQQPFVERADKMLALNKDLYELTGKFLHRIQDNLKIEKLTKKLEKFYELDFKYFLIELKKQKVLLTLAQQDEREPYFKECKEKILALKGEIERTDKEIDDMVFDLYGLSEEERKVVFNG
>tr|A0A6I4N661|A0A6I4N661_9ACTN Transcriptional regulator WhiB OS=Streptomyces sp. BA2 OX=436595 GN=whiB PE=3 SV=1
MDWRHNAVCREEDPELFFPIGNTGPALLQIEEAKAVCRRCPVMEQCLQWALESGQDSGVWGGLSEDERRAMKRRAARNRARQASA
>tr|A0A2V5BXM8|A0A2V5BXM8_9GAMM 50S ribosomal protein L23 OS=Pantoea sp. AG1095 OX=2184004 GN=rplW PE=3 SV=1
MIREERLLKVVRAPHVSEKASTAMEKTNTIVLKVAKDATKAEIVAAVEKLFEVEVKDVNTLVVKGKVKRHGQRIGRRSDWKKAYVTLKEGQNLDFVGGAE
>tr|A0A4Q4HXK7|A0A4Q4HXK7_ECOLX IS3 family transposase (Fragment) OS=Escherichia coli OX=562 GN=EWK56_27125 PE=4 SV=1
ELPTYGYRRVWALLRRQAELDGMPAINAKRVYRIMRQNALLLERKPAVPPSKRAHTGRVAVKESNQRWCSDGFEFRCDNGEKLRVTFALDCCDREALHWAVTTGGFNSETVQDVMLGAVERRFGNELPASPVEWLTDNGSCYRANETRQFARMLGLEPKSTAVRSPESNGIAESFVKTIKRDYISVMPKPDGLTAAKNLAEAFEHYNEWHPHSALGYRSPREYLRQ
>tr|A0A455L1B7|A0A455L1B7_9REOV Non-structural protein 2 (Fragment) OS=Rotavirus C OX=36427 GN=NSP2 PE=3 SV=1
MAELACFVSFSLTEDKVKWFPINKKAVKTMLCAKVEKDQRSNYYDTILYGVAPPPEFRNRFKTTERHGLDYESDQYSEVVNLLADVLNMVSMPTEKFQFDIVKTVVQVRHLENLLLRIKDMDDILNENVKLRVKAVMIACNLVNETETTPLTESNDIVYQDSYFTITRLDYSSHKLLPLMTEEYKITINTKTDIPERDQTAFAAYIRYNFNKFAAISHGKRHWRLIPHSQLMAHAERLDRKIKSDKKHGRQFAYDDGDMAFVHPGWKACIGQLCGGTTFDVAKTSLYSVKTSKTVRTATNKIESDLISMVGN
>tr|A0A2N9NG79|A0A2N9NG79_9BACT Glutaredoxin OS=Verrucomicrobia bacterium OX=2026799 GN=SBV1_130006 PE=4 SV=1
MNKPKIVAYLKPTCGWSQGVRAIFRKYDLPYEDRDIINDPAQRQEMIERSGQMLSPCVEIDGSMLADISGEEVEAYLLAHNLVTPSNREADAPIDQPCAHEAPPSAPLHFRR
>tr|A0A1X0RRK1|A0A1X0RRK1_RHIZD Chromatin modification-related protein EAF3 OS=Rhizopus microsporus OX=58291 GN=BCV71DRAFT_229219 PE=3 SV=1
MYFVHYKGWKQTWDEWITEDRVLKYTESNRQKQKQLQEMNARLKTSRTPTRESTEPRGRKRYRDSDIERQRAEEETRRTEFKLIMPETLKGILVDDWENITKNRLVLNIPGEYTVDRILDEYKNQYPVKDDVLDEFIKGIRLYFNKTLGSLLLYRNEYDQYTELCADKEPSSIYGAEHLLRLFVEMPNLLAQASIDAETQNELKSRFEDFLNYMQEHEKDYFLNDYQTKA
>tr|A0A1C3EUB3|A0A1C3EUB3_9PLAN Translational regulator CsrA OS=Planctopirus hydrillae OX=1841610 GN=csrA PE=3 SV=1
MLVLSRKAGESLLIGQGLLGEGIQVTVVAVQGNRVRLGITAPAEVSIRRQEIVLDLPEVAGSEEPCAMSSESHSRTPEFV
>tr|A0A810P5E5|A0A810P5E5_9MYCO Uncharacterized protein OS=Mycolicibacterium sp. TY81 OX=2759662 GN=MTY81_06740 PE=4 SV=1
MPSTNWFERLTGFTEVDYESTCSRLSVDGNQLVSLVNGARYGTGTLRTPTLAELRATVTISDRGRTTVTCTVGDVGAMHGEPEFEGALFQVASQFNLLEMTHYTVTPEDGVTRYAHDHTQGPACAIAAGAGTIYRNYFAPVNGVPGQTADRQLNMLERLGLSLSTHLGRPISSLWRMENGYALCTADGLAAISDYLAAASPQTRDSLAGELAIGLHLGVEVTGVEPLPRQAVSQAYCSALPVAYSDVPQRYWEGFARLVLDSAYEATLLAAAESAANGWSNIVLLTRLGGGVFGNDDEWIDTAILRALKIVECAGLDVRLVSYGSVHPNMRGIADRWAR
>tr|A0A2T0Q272|A0A2T0Q272_9ACTN Acetylornithine deacetylase/succinyl-diaminopimelate desuccinylase-like protein OS=Allonocardiopsis opalescens OX=1144618 GN=CLV72_105245 PE=4 SV=1
MAEVSGEGVEGGRAEVEVVDLCRELIRIDTSNPGDHSGPGERVAAEYVAAKLDEVGLATQIFESHPRRTSVVARMEGEDPSRPPLLLHGHLDVVPADAADWSRDPFGGEIADGCVWGRGAVDMKDMDAMILAMVRERMRTGRRPPRDIVLAFLADEEAGGYFGAKWLVDHHPELFADCTEAVGEVGGFSFTVRDDLRLYLIETAEKGIAWMRLTATGTAGHGSMVNDDNAVTELAEAVARLGRHRFPLRLTKTVRAFLEEVCDAFGIEFDPDDEEAVAETVARLGPIATMIGATLRNSVNPTMLRAGYKTNVIPQTATAEVDGRFLPGLEDEYFATIDELLGPKVTRDSERQLPAVETDFSGALVAAMADALKAEDPAARAVPYCLSGGTDAKAFAELGIKGYGFAPLKLPPELNFAGMFHGIDERVPVDGLQFGVRVLNRFVDNC
>tr|W1INK5|W1INK5_9GAMM Uncharacterized protein OS=Xenorhabdus cabanillasii JM26 OX=1427517 GN=XCR1_1340019 PE=4 SV=1
MTEAQRTAFTVASGHFDITFLYLVCVGFFLAILFLWAAWAAVDVWNGWANEKVRNQTISQFAMRTAILLVVAVWMFAS
>tr|A0A520JI48|A0A520JI48_SPHSX PIN domain-containing protein OS=Sphingomonas sp. OX=28214 GN=EOP67_16805 PE=4 SV=1
MAGRMTTVVDASVAVKFSVEELGSAAASDLIRSEPRLVAPDLILTEAANAYWAMVRGSRLLMIHAERNLDDLPRYFDRLYPTGTLIQQALRIAFHLRHPVYDCVYLALATKLECRLITADRKFHLKAADHYPIDLLPFETD
>tr|A0A2R7W9K3|A0A2R7W9K3_ONCFA Abhydrolase_2 domain-containing protein OS=Oncopeltus fasciatus OX=7536 GN=OFAS_OFAS008407 PE=3 SV=1
MSGLESIRVGRAIEVEYLRLRPEAGRERTAGRFSSNMDRRYKVSGTHKFSNIILCVMVLKAWFSVSKDLIVNQQHVNKAIDLLDSIIQVEKENGIPLNRMIIGGISQGGMLAIDAVYRSYPKVAGCIAVSSVILDSNIFEAAKTRSKNPPLLMCVGSEDNAIGVELARESFQKIFKAGVPAEWKEFLGAHHELTVEELELIYERVKQLIPEKNL
>tr|M4H1V8|M4H1V8_PLEBA Putative secretory peptide-20 OS=Pleurobrachia bachei OX=34499 PE=2 SV=1
MRCFLILISLLALSSATAAWNPVVRDTFIPFDLESTPLQIKTDSTAGSEEQIWVRTYTADGSLVGGVGLKFTSSIQYAIGFCNNNLWVSLPVQPPEEVDKVWTIRKNTTAVSIECNGVEVLNYQLSESSDTRCVSTWGGDVVEKIMFHSSLDTASDSYRTAAVWCPVVRDTLIPFDLESTPLQIKTDLTAGSEEQITVDTYNIGSSFIGGVGVKFTSPIQYGISFCTTSWTVLPVQPGDEVDKIWTIRKTTTAVRIECNGLEVLNYQFSDSSASSCVSRWGGDVVEKILFYAYDTASDSYRVKPVKSVCPEFTVDGSVQESWNDTDIGQTVTINCQRKHVLDGSSERTCNAEGVWDSDAPLCRKLSEFRWEIEKLGVMGLRVFPYYS
>tr|A1JIE2|A1JIE2_YERE8 Putative membrane protein OS=Yersinia enterocolitica serotype O:8 / biotype 1B (strain NCTC 13174 / 8081) OX=393305 GN=YE0246 PE=3 SV=1
MPAFVISLWRQIVLSSPLFVLLALGYGLVRFGQWPSTITDGLTRFVFSLALPAMLFRMMCDFSERPAVDARLLIAFFGSCLVVFVIGRIIASRVFHLDGVSGSVFALGGIFSNNVMLGLPIATIMLGEKSIPAVALVLVFNGLILWTLVTISVEWARNGSPTLAGFAKTARSVLTNPLIIGIISGTLFSLTGLQLPQFIDQPVTMLGQVAPPLSLIVLGMGLAEYRVSEGWQISSAICFLKLIVQPMVIWALAWAMNLPALETQVVVLLGSMATGVNVYLMSRQFNVLTGPAAASLVMSTVLAAVTTPLILTIIGVGMS
>tr|D5EZ65|D5EZ65_PRER2 Uncharacterized protein OS=Prevotella ruminicola (strain ATCC 19189 / JCM 8958 / 23) OX=264731 GN=PRU_0802 PE=4 SV=1
MKATELAQQQIERAIRKIADKFPPTQEANVMTDIHFRVTQDTGELMAFDDNDEEINRCIIEDWIGDTSDNFFEEIPAVFRKCLDKMKDTIENMSILKPFSFVLENEDKESVAELYLVDDETVIFDPELMKGLDEDLDAFLKQLLAD
>tr|S9WGT7|S9WGT7_CAMFR Uncharacterized protein OS=Camelus ferus OX=419612 GN=CB1_001879002 PE=3 SV=1
MASNDTFYITTENSEMSTNIVELRQIHMETIPVETIPVETIPVETMALESIEGCEDISGSWVHGGHHQLPLMALQPLVISSPNPGDHDQEMIMVQTQEEVVGYFESDNLQAGNVENQILIPVDDDAFQQTLASLAASASSSAHSHSRTRSSQGKKPSGKKSCAGSKAEAASSSKVVTKKWEQKQVSIKTLEGEFSVTMWSANNNTDLKTGQTEEHPAPNFSENMTEKKLPPEGIPGVDFSDPKQLAEFTRMKPQNTKDETPRTIACPHKGCMKMFRDNSAMRKHLHTHGPRVHVCAECGKAFVESSKLKRHQLVHTGEKPFQCTFEGCGKRFSLDFNLRTHVRIHTGEKPFVCPFDCCNRKFAQSTNLKSHILTHVKNKKSQ
>tr|A0A183M848|A0A183M848_9TREM Uncharacterized protein OS=Schistosoma margrebowiei OX=48269 GN=SMRZ_LOCUS12223 PE=4 SV=1
MMVGGSQQETLDPGFLLLGTRHQGVPVILKKLVLPGGFDLVSLSFTVID
>tr|K9U3M1|K9U3M1_CHRTP Sulfate ABC transporter, inner membrane subunit CysW OS=Chroococcidiopsis thermalis (strain PCC 7203) OX=251229 GN=Chro_3349 PE=4 SV=1
MNSRMNNSKAKSREQKSWVPTILIVVAIAYVSLVLYIPALNVFIQAFSRGVGPFFANLTRPEFLHAVQLTVMLAAIALPLNTVFGLCAAWALTRHRFPGRAFVLSLIDLPFSISPVVAGLMIVLLYGRQGWFGGWLQDRGLNIIFAFPGMVLATAFVSMPFVAREVIPVLEELGSDQEEAAKTLGANDWQIFWRVTLPNIRWGLLYGLILTNARAMGEFGAVSVVSGNISGKTQSLPLFVEDAYKQYETEAAYSAAVLLALLAVVTLVLKEILERKTRIKDVE
>tr|A0A090PRU2|A0A090PRU2_NONUL Uncharacterized protein OS=Nonlabens ulvanivorans OX=906888 GN=JCM19298_2278 PE=4 SV=1
MVIMKRIIYILCAVVGFTAAAQQTPAPATNKSYTIMNATAHIGNGELIENSVIVIENGKITTVADATTVKMQPKGEVINASGLHVYPGIIACNTTLGLVEIDAVKASDDDREIGTFNPHIRSLIAYNAESRVVETMRLMVFLLLK
>tr|A0A4S0ZDT7|A0A4S0ZDT7_9BACT NAD-dependent succinate-semialdehyde dehydrogenase (Fragment) OS=bacterium M00.F.Ca.ET.156.01.1.1 OX=2563902 GN=EN799_58250 PE=3 SV=1
MPLCLPMIRRLKSPHLFGAIDRLPALGRPVGNKTFEVVNPSTGEVLAELPDMGVEETRAAVDKAYVAQSGWAALTARERSDVLWRWHQLIIDHAGDLAAILTAEMGKPLAEAISEVSHAAAYLQWYAEEANRVYGETISAPSTDRRMLVIKQPIGVVGTITPWNFPASMVARKISPALAAGCTIVLKPAEQTPLVAGAMFALAHQAGFPDGVVNLIYASEGDRVGRELCTNSKIRKISFTGSTEVGRLLMRQCSDQIKKVSLELGGNAPFIIFDDADIDGAVDGAVQAKFRNAGQTCVSANRIYVQSSVHDEFVKKFVERIRHLSVGDGFDAGVDIGPLIDKHALAKIESHIADAIAKGGTIRCGGQRIGKNGTFFEPTVLTEISSVMAVAQEETFGPLAPIIRFNDAD
>tr|A0A5P2QPP3|A0A5P2QPP3_9RHOB Uncharacterized protein OS=Paracoccus yeei OX=147645 GN=FOB51_08200 PE=4 SV=1
MQIVGICRFSLLGRGDWAAFRTIPQDKADENAEAVEARKASIFAPERLERRFTTFEHLTLASIRAQTDPDFTFVVLASELMPQPYRDRLAALCAAVPQVVLRFFPVIHAGTAQGQVFKELGIDYRQTLQFRLDDDDALCNVYIRRMRQAAGGIVPNAFPFAASFRDVLFCSVGGDHAGVYQWRSPFFSAGVALFHPSASIFGFGHYGMAERFTSISIPGHMSLVTHNGMNDTTLDEGRIRRQKMNLIDDEAATKAVERHFPYLTPEARAVAGLPV
>tr|A0A252DKQ5|A0A252DKQ5_9NOSO DNA polymerase III subunit gamma/tau OS=Nostoc sp. RF31YmG OX=1932668 GN=dnaX PE=3 SV=1
MSYEPLHHKYRPKSFAELVGQEAIATTLTNAICSSKIAPAYLFTGPRGTGKTSSARILAKSLNCLGSGKPTAEPCGVCDVCQGITKGYSLDVIEIDAASNTGVDNIREIIEKAQFAPVQCRYKVYVIDECLTGDSLVLTDEGLLRIDDPNIKNKRVLSYNDSSEKWEFKQVVRWLDQGERQTLVIKTTKGEIRCTGNHLVRTDRGWVAAKDVKEGVKILSPVNVDAAASFTNLATVESVYLAGVEQVYDIEVEDNHNFVANGLLVHNCHMLSTQAFNALLKTLEEPPKHVVFVLATTDPQRVLPTIISRCQRFDFRRINLEAMVKHLSAIAHKENIQISLDAVTLVAQIAQGGLRDAESLLDQLALLSGEIIPDRVWDLVGSVSERDLLGLLDAIAQDHAEAVLDCTRNILNRGREPLTILQNLAACYRDLLIAKTAPNRHDLVACTQQTWQAFIGLAQKLDITTILAGQKHLREAEVQIKNTTQPRLWLEVTLLGLLPSANIPVQAASVAPRVSAPVVSPSQPPITSSPPAVASPPVSPLSPPANNISALKAVPSQPPETITVSQPPEEPQPLHPPVQPVTPAASPPVPELIEDTEADFTQVWQQVLSNIQQIPRRELLRQMCHLMEFDGAYARVGVKSAWYKKVQTDLQMITAAFQQTFQREVKVSLEIGNPSTSTSAKKESSANGSSKLKQPSPPSYDKQIPPPAPVQPTPTPAPTKTEPTPKGNSGVQTLPPPTPTTSGDWETDEVAIAAQRLAEFFQGQIIRLSDDAAAFSETMVGSDLLDESDLDDE
>tr|A0A0B2USS7|A0A0B2USS7_TOXCA Cullin-4B OS=Toxocara canis OX=6265 GN=Cul4b PE=3 SV=1
MFRSTEEPGLILMEACDYSRKYLVEPPSNANFSSPVVSGRDLDGWDVGLEIFRDVIMNNDRVRMRTTSGIIKLIETEREGAQIDRQLVKSLLRMMSSLGIYQAVFERRFLETTTALYETEGRNLSRDLEVPAYLLHVKRRLDEESNRVDYYLDASTRKELMAVAEKSLIVDHMEAFIDKGVESMLSGNHCSDLKLMYSLLARTKNGLVLLKSAFAAYIKVCTDHIFASLMFTLLPGVESMLSGNHCSDLKLMYSLLARTKNGLVLLKSAFAAYIKVCTDHIGCGVESMLSGNHCSDLKLMYSLLARTKNGLVLLKSAFAAYIKKVGQAMVMDSARDKTLVADLLVMKSKLDNMLKSCFRNNEKFVQAEKDAFDYFINTRANKPAELVAKYLDSKLRSGNKESTDEELENLMDEVIVIFRFIQGKDVFEAFYKKDLAKRLLLGRSASVDAEKSMLSKLKQECGAGFTTKLEGMFKDMELSKDLAVAFKQYLDHGGPDRALQHSDGHIEFSVNVLTMGHWPSYEPMDVVIPPYLAEYQELFKRFYLSKHSGRKLQWQHSLAQVLLRAHFKPTVVKELQVSMFQALVLLLFNEKTEWAVEEISNATKIETNELERTLQSLACGKLRVLLKTPRGKDIKPKDRLTFNEECNDRLYRIRICQVQMKETAEEHSQTEEQIFQDRQYQIDAAIVRIMKTRKSLAHQLLISELFKQLRFSVKPIDLKKRIESLIEREYMCRDKDDCNTYNYVA
>tr|A0A3R9XIK9|A0A3R9XIK9_9ACTN Uncharacterized protein OS=Streptomyces sp. WAC05374 OX=2487420 GN=E2B92_01640 PE=4 SV=1
MDRSVWDGVERLRQWLDAKAAPATAGDVRLLRVLKIGEEYGEVAEALHGALGANPRKGASHTWQDVEQELCDVIVTSMVALATINGDGARLLDERVRHLVRRALPDEPA
>tr|A0A0E1UTW8|A0A0E1UTW8_BURPE ATP-dependent endonuclease, OLD family OS=Burkholderia pseudomallei Pakistan 9 OX=595498 GN=BUH_4320 PE=4 SV=1
MRLCRFEVRNFKCVEYASLEWEDLLVLIGENNAGKSTILSAIAAFLSGSAIKDPSLFRRHLTDVANAIELIGHFDGLSDEETTQVAVRGRMNGDRWVLKKRYWFEAGEDGESGGWKEALYSFSGAERFEGWPEADATWNAFPEEYQPLIAALPNRGVRPTNAARETLREAVRRQRPDLVAFGAPNWVPNPGGGGNWKSNANSILPRPILVRAVQEASDETNAKDASTYGKLVNLIVERSLAQRPEMVRLQEALDEVLALFRPDEANPQRQAQEVRDLQDRINRSLNEVVGGQALIRTEAPEIRSMVLPSTSLVIRDVEAGIDTDVGHQGHGLQRTLVITLLQSLADAQAQVVPGAALAPVRANILLIEEPELYLHPQMERLMRDVLYRLAEQASTQVACCTHSPVFLDIATKYRAIIRMFKTPQGDAAAHQVTQDLFPGQPLQADRQRLNTVARFDPTVNELFFAKRVVLMEEFSAIAAFERGAELMGLFERHLRLRREVSLVDCNGKSNIPAFQRVLNAFNIPYRVLHDEDPGNPAEQANNQNILALLVAGANQRHLVAPDLEGLLGYQAPRKNKPFLAVSTVEDLHAQGQLPAAFREAVCMAYFGQAVEPLPPP
>tr|A0A5A7S8C7|A0A5A7S8C7_9NOCA TetR/AcrR family transcriptional regulator OS=Rhodococcus cavernicola OX=2495913 GN=FOY51_19370 PE=4 SV=1
MPRSGAETRSHLLKVAGELFYAKGIRATGVDLVAVEAGVAPTTLYRQFASKDDLVGSYVEGVDLAFRDRFASAIAAAGAEPRDQIFAIFDDAIAQAAQDHFRGCPAQMALAEYPDPASSAHANAVTAKSWLLNSIAAVTERLDVDDSVALARQLFVVWEGMLASTMSMGSTGPAQQSRRIVEALLPGE
>tr|A0A3A5ZLU0|A0A3A5ZLU0_9BACE Inorganic phosphate transporter OS=Bacteroides sp. AF25-38AC OX=2292924 GN=DWY55_04125 PE=4 SV=1
MELLVIIIVLALIFDYINGFHDAANSIATIVSTKVLTPFQAVIWAAFFNFVAFFIAKCVIGGFGIANTVSKTVMEPYITLPIILAGVIAAIAWNLFTWWKGIPSSSSHTLIGGFAGAAIMAHGFEAIQLSIILKIAAFIFLAPLIGMVVAFGFTLLVLYICRRAHPHTAEVWFKKLQLVSSALFSIGHGLNDSQKVMGIIAAAMIAGHSEGLGMGINSIDDLPDWVAFSCFTAISLGTMSGGWKIVKTMGTKITKVTPLEGVIAETAGAFTLYLTEYLKIPVSTTHTITGAIIGVGATKRLSAVRWGVTKSLMTAWVLTIPVSALLAAGIYCIVSLF
>tr|D6CL53|D6CL53_THIA3 UDP-N-acetylglucosamine 1-carboxyvinyltransferase OS=Thiomonas arsenitoxydans (strain DSM 22701 / CIP 110005 / 3As) OX=426114 GN=murA PE=3 SV=1
MDKLRITGQRTLQGVVQASGAKNAALPLIAAALLTAETVQLNNAPQLMDVRTLAKLLRSLGAQVEQDGGQIRLSAAAVNHYEASYELVKTMRASVLVLGPLLARFGQARVSLPGGCAIGARPVDQHIKGLQALGADIAVEHGYIVARVATPSGRLRGARITTDMVTVTGTENLMMAATLAEGETLIDNAAREPEIVDLANLLRAMGAQIRGDGTSQIRIQGVDALHGASHRIIPDRIEVGTFLCAALAARGDVTVQGAEPAHQDALLDKLREAGAQIDTGADWVRLRADALPGGRPRAVSVRTTEYPGFATDMQAQFMAVNCLADGAARMTETIFENRFMHVQELMRLGAQIDIDGHTCVVHGVPQLSGATVMATDLRASAGLVVAALAAEGETVIDRIYHLDRGYDAMEVKLRGLGAQIERISDRISGK
>tr|A0A150TBH6|A0A150TBH6_SORCE Uncharacterized protein OS=Sorangium cellulosum OX=56 GN=BE18_01125 PE=4 SV=1
MKTHDGYVALLASGGKRKLRANSLLAYGDEESRFKAAVLFHEAAEIERRALSLLEDAAPETRLRAAVERCACLVMGLDVVEAARAFREVEEASAAVPQETANAHRDRLDPLYFAARQDLTELLKRAPVLVSSRFRWEEIAETDRSRARAELDALLQRFPGESTFHLVDARAALDERRFDDLGRAVRRAHRLCPDNPLLRAYMLLVTAQSIAYPGSATTREEAEAELDTAYQELNREPADGVVYLGFMTASLAAFLAAFYAGEDAAEAHGRRARWAAEIAAQRRSIISEDIGKYIEAAGPLIELLTTQPQMLTAIIENTLREALLNSDVGRASGESLQQPKAASLIRGVISQASRWLTPSAELAELSELALAA
>tr|H3BNA2|H3BNA2_HUMAN Coronin (Fragment) OS=Homo sapiens OX=9606 GN=CORO1A PE=1 SV=1
MSRQVVRSSKFRHVFGQPAKADQCYEDVRVSQTTWDSGFCAVNPKFVALICEASGGGAFLVLPLGKTGRVDKNAPTVCGHTAPVLDIAWCPHNDNVIASGSEDCTVMVWEIPDGGLMLPLREPVVTLEGHTKRVGIVAWHTTAQNVLL
>tr|A0A7L4N192|A0A7L4N192_9AVES FA11 factor (Fragment) OS=Ceyx cyanopectus OX=390723 GN=F11 PE=4 SV=1
SARTVRIVGGTDSSPGEWPWQVSLHVKLSRQRHLCGGSIISKQWILTAAHCITSLENLNIWRVYAGILKQSEINEDTPFFKVEEIIVHPQYKYAQTGYDIALMKLDKPMNFTDLQLPICLPSKEDANILYTNCWVTGWGYRKEKGRVQDILQKAAVPLMSKEECQARYRKRTIGDKVICAGYEEGGRDACK
>tr|A0A373A0Y4|A0A373A0Y4_9ACTN DUF3117 domain-containing protein OS=Kitasatospora xanthocidica OX=83382 GN=DR950_28830 PE=4 SV=1
MAAMKPRTGDGPLEVTKEGRGIIMRVPLEGGGRLVVELTPDEAQALGEALKKACG
>tr|K9IQ04|K9IQ04_DESRO DNA polymerase subunit gamma-1 OS=Desmodus rotundus OX=9430 PE=2 SV=1
MNRLLWKKVAGSTVVGPGPVPAPRRWASSSVSVPVSSNGQPQVRSSEGGQLRYNPLHIQMLSRGLHEQIFGLGAETPGEAAVRRSVEHLQKHGLWGQPDAPLPDVELRLPSLYGGDLDQHFRLLAQKQSLPYLEAANSLLQAQLPPRPPSWAWAEGWTRYGPAGEAEPVAIPEERALVFDVEVCLAEGMCPTLAVAISPLAWYSWCSRRLVEERYSWTSQLSPADLIPLEVPARTGSPAQRGQQEQLVVGHNVSFDRAHIREQYLVQGSLTRFLDTMSMHMAISGLSSFQRSLWMAAKQGKRKAQHDTQRAQKPRSKANGPVVSSWDWLDISSVNNLADVHSLYVGGPPLRKEPRELFVKGSMRDIRENFQDLMQYCAQDVWATYEVFQQQLPLFLERCPHPVTLAGMLEMGVSYLPVNQNWERYLAEAQSTYEELQWEMKKSLMDLANDACQLLSGERYKEDPWLWDLEWDLQEFKQKKAKKVKRKEPEATSPLPVEAAEAPGAPEDQEDPGPPSEEEESQRAVATRTCLEQLKGTTALLPKRPQHLPGHPGWYRKLCPRLDDPAWAPGPSLLSLQMRVTPKLMALTWDGFPLHFSERHGWGYLVPGRRDNLAHVPASTSPAPTGVTCPYRAIESLYSKHCLEQGKRQPEPQEAGLAEDFLLAEEWQMVEELGCLEVQAEAEVEPAEGAVAAQPPAPTGTGRPRGSQPAYHHGNGPYHDVDIPGCWFFKLPHKDGNSCNVGSPFAKDFLPKMEDGTLQAGPGGASGPRALEINKMISFWRNAHKRISSQMVVWLPRSALPRVVTRHPDYDEEGRYGAILPQVVTAGTITRRAVEPTWLTASNARPDRVGSELKAMVQAPPGYVLVGADVDSQELWIAAVLGDAHFAGMHGCTAFGWMTLQGRKSRGTDLHSKTATTVGISREHAKIFNYGRIYGAGQPFAERLLMQFNHRLTLQEAAEKAQQMYAFTKGLRRYRLSDEGEWLVRQLHIPVERTEDGFVSLRDLRKIQREASRKSRRKNWKVVAERAWTGGTESEMFNKLESIAMSDEPRTPVLGCRISRALEPSVAQGEFMTSRVNWVVQSSAVDYLHLMLVAMKWLFEEFAIDGRFCISIHDEVRYLVQEGDRYRAALALQIANLLTRCMFAYKLGLNDLPQSVAFFSAVDIDRCLRKEVTMDCETPSNPTGMERRYGIPQGEALDIYQIIELTKGSLEKRSQPGP
>tr|A0A2N8M530|A0A2N8M530_9GAMM Short chain dehydrogenase OS=Alcanivorax sp. MD8A OX=1177157 GN=A15D_00345 PE=3 SV=1
MKTVLITGAASGLGWALAQQAFALGYRVILADMNEVLLEARVEALAARDAERVTSRVLDVTNSDAVTLLVPWLEKHGGLDLLVNNAGITHRSLAEKTAMSVFQKVMAVDWQAPVELSVACLPLLKKSRGGIINIGSMAGWMPVLGRAGYCSAKSALGQFFEVMRGEVSRYGIHILMAYPSFLDTPIEKNALGHDGKPAAHARSMVGNMRTPEWMAEQVFEAYGKGRKRLFPDRFTWFASVLWRVAPDLYQRLMLRKFASELEQ
>tr|A0A8A9J5M6|A0A8A9J5M6_SARS2 ORF1ab polyprotein OS=Severe acute respiratory syndrome coronavirus 2 OX=2697049 GN=ORF1ab PE=4 SV=1
MESLVPGFNEKTHVQLSLPVLQVRDVLVRGFGDSVEEVLSEARQHLKDGTCGLVEVEKGVLPQLEQPYVFIKRSDARTAPHGHVMVELVAELEGIQYGRSGETLGVLVPHVGEIPVAYRKVLLRKNGNKGAGGHSYGADLKSFDLGDELGTDPYEDFQENWNTKHSSGVTRELMRELNGGAYTRYVDNNFCGPDGYPLECIKDLLARAGKASCTLSEQLDFIDTKRGVYCCREHEHEIAWYTERSEKSYELQTPFEIKLAKKFDTFNGECPNFVFPLNSIIKTIQPRVEKKKLDGFMGRIRSVYPVASPNECNQMCLSTLMKCDHCGETSWQTGDFVKATCEFCGTENLTKEGATTCGYLPQNAVVKIYCPACHNSEVGPEHSLAEYHNESGLKTILRKGGRTIAFGGCVFSYVGCHNKCAYWVPRASANIGCNHTGVVGEGSEGLNDNLLEILQKEKVNINIVGDFKLNEEIAIILASFSASTSAFVETVKGLDYKAFKQIVESCGNFKVTKGKAKKGAWNIGEQKSILSPLYAFASEAARVVRSIFSRTLETAQNSVRVLQKAAITILDGISQYSLRLIDAMMFTSDLATNNLVVMAYITGGVVQLTSQWLTNIFGTVYEKLKPVLDWLEEKFKEGVEFLRDGWEIVKFISTCACEIVGGQIVTCAKEIKESVQTFFKLVNKFLALCADSIIIGGAKLKALNLGETFVTHSKGLYRKCVKSREETGLLMPLKAPKEIIFLEGETLPTEVLTEEVVLKTGDLQPLEQPTSEAVEAPLVGTPVCINGLMLLEIKDTEKYCALAPNMMVTNNTFTLKGGAPTKVTFGDDTVIEVQGYKSVNITFELDERIDKVLNEKCSAYTVELGTEVNEFACVVADAVIKTLQPVSELLTPLGIDLDEWSMATYYLFDESGEFKLASHMYCSFYPPDEDEEEGDCEEEEFEPSTQYEYGTEDDYQGKPLEFGATSAALQPEEEQEEDWLDDDSQQTVGQQDGSEDNQTTTIQTIVEVQPQLEMELTPVVQTIEVNSFSGYLKLTDNVYIKNADIVEEAKKVKPTVVVNAANVYLKHGGGVAGALNKATNNAMQVESDDYIATNGPLKVGGSCVLSGHNLAKHCLHVVGPNVNKGEDIQLLKSAYENFNQHEVLLAPLLSAGIFGADPIHSLRVCVDTVRTNVYLAVFDKNLYDKLVSSFLEMKSEKQVEQKIAEIPKEEVKPFITESKPSVEQRKQDDKKIKACVEEVTTTLEETKFLTENLLLYIDINGNLHPDSATLVSDIDITFLKKDAPYIVGDVVQEGVLTAVVIPTKKAGGTTEMLAKALRKVPTDNYITTYPGQGLNGYTVEEAKTVLKKCKSAFYILPSIISNEKQEILGTVSWNLREMLAHAEETRKLMPVCVETKAIVSTIQRKYKGIKIQEGVVDYGARFYFYTSKTTVASLINTLNDLNETLVTMPLGYVTHGLNLEEAARYMRSLKVPATVSVSSPDAVTAYNGYLTSSSKTPEEHFIETISLAGSYKDWSYSGQSTQLGIEFLKRGDKSVYYTSNPTTFHLDGEVITFDNLKTLLSLREVRIIKVFTTVDNINLHTQVVDMSMTYGQQFGPTYLDGADVTKIKPHNSHEGKTFYVLPNDDTLRVEAFEYYHTTDPSFLGRYMSALNHTKKWKYPQVNGLTSIKWADNNCYLATALLTLQQIELKFNPPALQDAYYRARAGEAANFCALILAYCNKTVGELGDVRETMSYLFQHANLDSCKRVLNVVCKTCGQQQTTLKGVEAVMYMGTLSYEQFKKGVQIPCTCGKQATKYLVQQESPFVMMSAPPAQYELKHGTFTCASEYTGNYQCGHYKHITSKETLYCIDGALLTKSSEYKGPITDVFYKENSYTTTIKPVTYKLDGVVCTEIDPKLDNYYKKDNSYFTEQPIDLVPNQPYPNASFDNFKFVCDNIKFADDLNQLTGYKKPASRELKVTFFPDLNGDVVAIDYKHYTPSFKKGAKLLHKPIVWHVNNATNKATYKPNTWCIRCLWSTKPVETSNSFDVLKSEDAQGMDNLACEDLKPVSEEVVENPTIQKDVLECNVKTTEVVGDIILKPANNSLKITEEVGHTDLMAAYVDNSSLTIKKPNELSRVLGLKTLATHGLAAVNSVPWDTIANYAKPFLNKVVSTTTNIVTRCLNRVCTNYMPYFFTLLLQLCTFTRSTNSRIKASMPTTIAKNTVKSVGKFCLEASFNYLKSPNFSKLINIIIWFLLLSVCLGSLIYSTAALGVLMSNLGMPSYCTGYREGYLNSTNVTIATYCTGSIPCSVCLSGLDSLDTYPSLETIQITISSFKWDLTAFGLVAEWFLAYILFTRFFYVLGLAAIMQLFFSYFAVHFISNSWLMWLIINLVQMAPISAMVRMYIFFASFYYVWKSYVHVVDGCNSSTCMMCYKRNRATRVECTTIVNGVRRSFYVYANGGKGFCKLHNWNCVNCDTFCAGSTFISDEVARDLSLQFKRPINPTDQSSYIVDSVTVKNGSIHLYFDKAGQKTYERHSLSHFVNLDNLRANNTKGSLPINVIVFDGKSKCEESSAKSASVYYSQLMCQPILLLDQALVSDVGDSAEVAVKMFDAYVNTFSSTFNVPMEKLKTLVATAEAELAKNVSLDNVLSTFISAARQGFVDSDVETKDVVECLKLSHQSDIEVTGDSCNNYMLTYNKVENMTPRDLGACIDCSARHINAQVAKSHNIALIWNVKDFMSLSEQLRKQIRSAAKKNNLPFKLTCATTRQVVNVVTTKIALKGGKIVNNWLKQLIKVTLVFLFVAAIFYLITPVHVMSKHTDFSSEIIGYKAIDGGVTRDIASTDTCFANKHADFDTWFSQRGGSYTNDKACPLIAAVITREVGFVVPGLPGTILRTTNGDFLHFLPRVFSAVGNICYTPSKLIEYTDFATSACVLAAECTIFKDASGKPVPYCYDTNVLEGSVAYESLRPDTRYVLMDGSIIQFPNTYLEGSVRVVTTFDSEYCRHGTCERSEAGVCVSTSGRWVLNNDYYRSLPGVFCGVDAVNLLTNMFTPLIQPIGALDISASIVAGGIVAIVVTCLAYYFMRFRRAFGEYSHVVAFNTLLFLMSFTVLCLTPVYSFLPGVYSVIYLYLTFYLTNDVSFLAHIQWMVMFTPLVPFWITIAYIICISTKHFYWFFSNYLKRRVVFNGVSFSTFEEAALCTFLLNKEMYLKLRSDVLLPLTQYNRYLALYNKYKYFSGAMDTTSYREAACCHLAKALNDFSNSGSDVLYQPPQTSITSAVLQSGFRKMAFPSGKVEGCMVQVTCGTTTLNGLWLDDVVYCPRHVICTSEDMLNPNYEDLLIRKSNHNFLVQAGNVQLRVIGHSMQNCVLKLKVDTANPKTPKYKFVRIQPGQTFSVLACYNGSPSGVYQCAMRPNFTIKGSFLNGSCGSVGFNIDYDCVSFCYMHHMELPTGVHAGTDLEGNFYGPFVDRQTAQAAGTDTTITVNVLAWLYAAVINGDRWFLNRFTTTLNDFNLVAMKYNYEPLTQDHVDILGPLSAQTGIAVLDMCASLKELLQNGMNGRTILGSALLEDEFTPFDVVRQCSGVTFQSAVKRTIKGTHHWLLLTILTSLLVLVQSTQWSLFFFLYENAFLPFAMGIIAMSAFAMMFVKHKHAFLCLFLLPSLAAVAYFNMVYMPASWVMRIMTWLDMVDTSLSGFKLKDCVMYASAVVLLILMTARTVYDDGARRVWTLMNVLTLVYKVYYGNALDQAISMWALIISVTSNYSGVVTTVMFLARGIVFMCVEYCPIFFITGNTLQCIMLVYCFLGYFCTCYFGLFCLLNRYFRLTLGVYDYLVSTQEFRYMNSQGLLPPKNSIDAFKLNIKLLGVGGKPCIKVATVQSKMSDVKCTSVVLLSVLQQLRVESSSKLWAQCVQLHNDILLAKDTTEAFEKMVSLLSVLLSMQGAVDINKLCEEMLDNRATLQAIASEFSSLPSYAAFATAQEAYEQAVANGDSEVVLKKLKKSLNVAKSEFDRDAAMQRKLEKMADQAMTQMYKQARSEDKRAKVTSAMQTMLFTMLRKLDNDALNNIINNARDGCVPLNIIPLTTAAKLMVVIPDYNTYKNTCDGTTFTYASALWEIQQVVDADSKIVQLSEISMDNSPNLAWPLIVTALRANSAVKLQNNELSPVALRQMSCAAGTTQTACTDDNALAYYNTTKGGRFVLALLSDLQDLKWARFPKSDGTGTIYTELEPPCRFVTDTPKGPKVKYLYFIKGLNNLNRGMVLGSLAATVRLQAGNATEVPANSTVLSFCAFAVDAAKAYKDYLASGGQPITNCVKMLCTHTGTGQAITVTPEANMDQESFGGASCCLYCRCHIDHPNPKGFCDLKGKYVQIPTTCANDPVGFTLKNTVCTVCGMWKGYGCSCDQLREPMLQSADAQSFLNRVCGVSAARLTPCGTGTSTDVVYRAFDIYNDKVAGFAKFLKTNCCRFQEKDEDDNLIDSYFVVKRHTFSNYQHEETIYNLLKDCPAVAKHDFFKFRIDGDMVPHISRQRLTKYTMADLVYALRHFDEGNCDTLKEILVTYNCCDDDYFNKKDWYDFVENPDILRVYANLGERVRQALLKTVQFCDAMRNAGIVGVLTLDNQDLNGNWYDFGDFIQTTPGSGVPVVDSYYSLLMPILTLTRALTAESHVDTDLTKPYIKWDLLKYDFTEERLKLFDRYFKYWDQTYHPNCVNCLDDRCILHCANFNVLFSTVFPLTSFGPLVRKIFVDGVPFVVSTGYHFRELGVVHNQDVNLHSSRLSFKELLVYAADPAMHAASGNLLLDKRTTCFSVAALTNNVAFQTVKPGNFNKDFYDFAVSKGFFKEGSSVELKHFFFAQDGNAAISDYDYYRYNLPTMCDIRQLLFVVEVVDKYFDCYDGGCINANQVIVNNLDKSAGFPFNKWGKARLYYDSMSYEDQDALFAYTKRNVIPTITQMNLKYAISAKNRARTVAGVSICSTMTNRQFHQKLLKSIAATRGATVVIGTSKFYGGWHNMLKTVYSDVENPHLMGWDYPKCDRAMPNMLRIMASLVLARKHTTCCSLSHRFYRLANECAQVLSEMVMCGGSLYVKPGGTSSGDATTAYANSVFNICQAVTANVNALLSTDGNKIADKYVRNLQHRLYECLYRNRDVDTDFVNEFYAYLRKHFSMMILSDDAVVCFNSTYASQGLVASIKNFKSVLYYQNNVFMSEAKCWTETDLTKGPHEFCSQHTMLVKQGDDYVYLPYPDPSRILGAGCFVDDIVKTDGTLMIERFVSLAIDAYPLTKHPNQEYADVFHLYLQYIRKLHDELTGHMLDMYSVMLTNDNTSRYWEPEFYEAMYTPHTVLQAVGACVLCNSQTSLRCGACIRRPFLCCKCCYDHVISTSHKLVLSVNPYVCNAPGCDVTDVTQLYLGGMSYYCKSHKPPISFPLCANGQVFGLYKNTCVGSDNVTDFNAIATCDWTNAGDYILANTCTERLKLFAAETLKATEETFKLSYGIATVREVLSDRELHLSWEVGKPRPPLNRNYVFTGYRVTKNSKVQIGEYTFEKGDYGDAVVYRGTTTYKLNVGDYFVLTSHTVMPLSAPTLVPQEHYVRITGLYPTLNISDEFSSNVANYQKVGMQKYSTLQGPPGTGKSHFAIGLALYYPSARIVYTACSHAAVDALCEKALKYLPIDKCSRIIPARARVECFDKFKVNSTLEQYVFCTVNALPETTADIVVFDEISMATNYDLSVVNARLRAKHYVYIGDPAQLPAPRTLLTKGTLEPEYFNSVCRLIKTIGPDMFLGTCRRCPAEIVDTVSALVYDNKLKAHKDKSAQCFKMFYKGVITHDVSSAINRPQIGVVREFLTRNPAWRKAVFISPYNSQNAVASKILGLPTQTVDSSQGSEYDYVIFTQTTETAHSCNVNRFNVAITRAKVGILCIMSDRDLYDKLQFTSLEIPRRNVATLQAENVTGLFKDCSKVITGLHPTQAPTHLSVDTKFKTEGLCVDIPGIPKDMTYRRLISMMGFKMNYQVNGYPNMFITREEAIRHVRAWIGFDVEGCHATREAVGTNLPLQLGFSTGVNLVAVPTGYVDTPNNTDFSRVSAKPPPGDQFKHLIPLMYKGLPWNVVRIKIVQMLSDTLKNLSDRVVFVLWAHGFELTSMKYFVKIGPERTCCLCDRRATCFSTASDTYACWHHSIGFDYVYNPFMIDVQQWGFTGNLQSNHDLYCQVHGNAHVASCDAIMTRCLAVHECFVKRVDWTIEYPIIGDELKINAACRKVQHMVVKAALLADKFPVLHDIGNPKAIKCVPQADVEWKFYDAQPCSDKAYKIEELFYSYATHSDKFTDGVCLFWNCNVDRYPANSIVCRFDTRVLSNLNLPGCDGGSLYVNKHAFHTPAFDKSAFVNLKQLPFFYYSDSPCESHGKQVVSDIDYVPLKSATCITRCNLGGAVCRHHANEYRLYLDAYNMMISAGFSLWVYKQFDTYNLWNTFTRLQSLENVAFNVVNKGHFDGQQGEVPVSIINNTVYTKVDGVDVELFENKTTLPVNVAFELWAKRNIKPVPEVKILNNLGVDIAANTVIWDYKRDAPAHISTIGVCSMTDIAKKPTETICAPLTVFFDGRVDGQVDLFRNARNGVLITEGSVKGLQPSVGPKQASLNGVTLIGEAVKTQFNYYKKVDGVVQQLPETYFTQSRNLQEFKPRSQMEIDFLELAMDEFIERYKLEGYAFEHIVYGDFSHSQLGGLHLLIGLAKRFRESPFELEDFIPMDSTVKNYFITDAQTGSSKCVCSVIDLLLDDFVEIIKSQDLSVVSKVVKVTIDYTEISFMLWCKDGHVETFYPKLQSSQAWQPGVAMPNLYKMQRMLLEKCDLQNYGDSATLPKGIMMNVAKYTQLCQYLNTLTLAVPYNMRVIHFGAGSDKGVAPGTAVLRQWLPTGMLLVDSDLNDFVSDADSTLIGDCATVHTANKWDLIISDMYDPKTKNVTKENDSKEGFFTYICGFIQQKLALGGSVAIKITEHSWNADLYKLMGHFAWWTAFVTNVNASSSEAFLIGCNYLGKPREQIDGYVMHANYIFWRNTNPIQLSSYSLFDMSKFPLKLRGTAVMSLKEGQINDMILSLLSKGRLIIRENNRVVISSDVLVNN
>tr|A0A2S2NUK6|A0A2S2NUK6_SCHGA Uncharacterized protein OS=Schizaphis graminum OX=13262 GN=g.56950 PE=4 SV=1
MPYSIGSGFTRYTVGPSVRDVFGENEKIVFIIKLFAEYPAPKRSRDAFRLLSNGDIFFSTVVKNHFSGYRFLSMKNMKLCEKKYQRLSECVLEKRGSCEATSKTVKKNK
>tr|A0A438P4J0|A0A438P4J0_HELPX DEAD/DEAH box helicase OS=Helicobacter pylori OX=210 GN=ECB92_03930 PE=4 SV=1
MELNQPPLPTEIDDDAYHKPSFNDLGLKESVLKSVYEAGFTSPSPIQEKAIPAVLQGRDVIAQAQTGTGKTAAFALPIINNLKNNHTIEALVITPTRELAMQISDEIFKLGKHTRTKTVCVYGGQSVKKQCEFIKKNPQVMIATPGRLLDHLKNERIHKFVPKVVVLDESDEMLDMGFLDDIEEIFDYLPSEAQILLFSATMPEPIKRLADKILENPIKIHIAPSNITNTDITQRFYVINEHERAEAIMRLLDTQAPKKSIVFTRTKKEADELHQFLASKNYKSTALHGDMDQRDRRASIMAFKKNDADVLVATDVASRGLDISGVSHVFNYHLPLNTESYIHRIGRTGRAGKKGMAITLVTPLEYKELLRMQKEIDSEIELFEIPTINENQIIKTLHDAKVSEGTISLYEQLTEIFEPSQLVLKLLSLQFETSKIGLNQQEIDAIQNPKEKTPKPSNKKTQHEPARSFKKGHYREKGSKTNHHSKKPKRR
>tr|A0A5D4XPJ5|A0A5D4XPJ5_9GAMM Uncharacterized protein OS=Luteimonas sp. XBU10 OX=1132694 GN=FZO89_00285 PE=4 SV=1
MKAVAVSTVLLSSSLTAFAAMPEQVQFVGSIQHDDLTPVTFDLHLPSKQSATLKLADGSTLELVTPGGQASPDGARIRLLSPAGEIMHAATVPDPSLASTSFAYRICDGQVTYMSPAPAVVPDCGA
>tr|A0A0W0TLV5|A0A0W0TLV5_9GAMM MFS domain-containing protein OS=Legionella geestiana OX=45065 GN=Lgee_2174 PE=4 SV=1
MHTEKNKHYMWYAWFVCALGAVFYSYEYFLRISPSVMEEALRAHFELNSAGFGKLSAFYYYAYVPMQLPVGILMDRYGPRRLLTIACMICVLGTWMFAGTSVFWVAASGRFLVGLGSAFAFVGVLKLATLWLPEDRLALVSGLATALGTIGAMLGDNILGALVDSAGWQQTVNLTAISGILLVLVLWLGLRDHPDSDEESGSIENFRQSIRDLCIIARNRQIWINGLYGCLVYLPTTVLAELWGIPYLQHAHGMTRSNADFANSLLFLGFTVGAPMMGFLADKLHRRKLPMMTGALGAVIVMSIILYMPGLTAMQINVLMVLLGLLYGAQAIVFAVGRELSPDEAAGTAMAMTNMIVMLGAMFLQPLVGYLLDWSGDYRIALSVIPLGMLIAAVLVFFLKETHAHAPQ
>tr|A0A556AMN3|A0A556AMN3_9BURK Putative glutamate--cysteine ligase 2 OS=Verticiella sediminum OX=1247510 GN=FOZ76_12590 PE=3 SV=1
MHAIEFTPSRYNTLGIELELQLLDPRTLDLSGQAASLLEHIAGHPSADHVKPELTRAMIELNSSVHEHPAGLLAEMRELRDLVCEAGDAIGVRVAGGGAHPFTSWRDCDIHDSPRYRRLADLYGYLARQFTVFGQHIHLGVASGDAACGLIHRLSPYVPHFIALAASSPFREGEDTLFACSRLHALHSFPLAGHMPEHIRDWYQFEAHYTQMRSLGLTESLKDLYWDIRPKPELGTVELRVCDTPLTVEKACQLAAFAQALAIAVQRASAPTAAFWMAYETNRFQACRFGLHANYVTRAGERVRLIEHLRGTFEQLMPVADELGTTDLLGALREDALRLGNDARWLRARHHELRELPAVAAAAADVWRGEPAGAAQAGPGRRRVRASSEPIVHGLPLLPEGTPANLPPRLH
>tr|L7JZ93|L7JZ93_TRAHO Uncharacterized protein (Fragment) OS=Trachipleistophora hominis OX=72359 GN=THOM_0239 PE=4 SV=1
VHPVSPSDVVGLTMLICKTMMGFMGLRERVTSSHMVGPEGHELDLGITGPKFRRDTFITDIEVFAGLFSLTMPFPEPERVKCFNKHIDRSLFVKKFDSSRCEVDMQALVLYIDDFYTACRVTSSLCKYALGFISLCMRPEYGDFGSILSDSPTSLFVELEKFKATGMGSAPACALREPSDFLLWYDRLCSLRALFVNYLTTRNGRFRGLVEMCRIAKEVEKDIEKLESEYNAYLDSQEGFVQDYFRTWGLVGGRGPLFIHSVPMIDVYQACTDKFKNKVNSLVARDDSPVVALMQNLRENGGVLPPDLVERRERFWEWQKKIKKEQKPMRVPINDLLLEFQSEDSGAFVFERQMTFMNLHQAIIERVARCWLNSSLYNDDQSMCNMQ
>tr|A0A6A1VVY6|A0A6A1VVY6_9ROSI Peptidyl-tRNA hydrolase ICT1, mitochondrial OS=Morella rubra OX=262757 GN=CJ030_MR4G021223 PE=4 SV=1
MAIMRTTTSVILRGVVHLPSFSVSRFSALPGVGGTIGYTHRGISFGRIQCAASDSGDGRKVSARLSQVQQLLQEAEERALSADDEPTPKITIALLLRPEDVALVPYSISPVWSWKKRGKGPRGGQNSSTNSCIAWSFERVVTAKSYIGTVIGQQRFQPTFGWITDNYEAQLHFLYFWLFDWLDDSTIGSLQIIWLDHVTVNFARSGGPGGQNVNKVNTKVDMRFNVKSADWLSDRIKEKIIQMEKNRINKDGELVISSTKTRTQKGNIQDALEKLQVLKTPHCIRPYLYSVLEAIIDAASYVPPPPTEEQKKKIAKLAAIGEQKRLKSKKVLSEKKAFRRSRDSWD
>tr|A0A2D5SZF1|A0A2D5SZF1_PSEAS Methyltransferase OS=Pseudoalteromonas sp. OX=53249 GN=CMK64_03795 PE=4 SV=1
MSVCGLCGSDELQPYHQDKRRRYLQCTQCALVIVDERDRLSPEDEKAIYDTHENSLHDEGYRRFLSRAFEPTVERVPSHSKGLDFGCGPGPLLAEMFKEVGFEMACFDLFYANEPEVLTKTYDFVTCTEVIEHLSQPGEVLAKLLSLLDAGGPLVLMTKLIIDQNRFAQWHYKNDLTHIVFFSRETFNYVAAHFDCQVEFIGNDVIVLTKSKK
>tr|A0A091NFS5|A0A091NFS5_9PASS Leucine-rich repeat-containing protein 45 (Fragment) OS=Acanthisitta chloris OX=57068 GN=N310_05272 PE=4 SV=1
GVKLLLHGLCSNTTVKSLDLKGNNLRTVGAEALGKLLRQNKSIRSLTLEWNSLGMWEEGFSFFCQGLGANNFLQRLDLRNNQINHQGAAELAMALTQNDSLQELDLRWNNIGLLGGRALLNCLQSNRTLKKLELAGNNVPGDILKAVEQALDHNRDRETILSEAQNQVSILSKEVMSLKDEKNKQFLDLMDTVDKQKEEKARSERMSAAQISQLQEALDEHYSIVNSLKAKLQMTEAALALSEQKVHNLGELLNAMKQEQTSVAESHFKELQQQRQESADREDKLLHDLSAASEKNLLLRNQVGNQVLGREDQLFQVKQDLTNTTAELKLRAVQAEERLEMEKRRFKQSLEDMESLRVKEVDHMTQHIEASERSMQDRIQRLEAIRISLEEELSQVKAAALAERGQAEEELMKVRSQARLEEQQRLEHLEEKLRLMTESRDEAQNCCLKQKEMVAEAQARAKQCSMQADGLRRRLEELQQDLNRKEEEKVTEVNKVKVELQEQIGHLQAERTAQDGLREKIAALERQLKALSNNHREALLDKEGEMSLLLEKLRMKEAEISRMREEEAQRASFLQNAIMAYVQGSPLGTHSSRK
>tr|A0A817VJW3|A0A817VJW3_9BILA Hypothetical protein OS=Rotaria sp. Silwood1 OX=2762511 GN=CBO169_LOCUS792 PE=4 SV=1
MAYVCSPQHCYQKNLSREKNSSDPSLVVHVNKFDIVPKVLNDYTYRTEVYLQQREKQNIDKTSSSSTSATITTWKILKYQKEMLKNDQAEIDRALSTINSIHEIFNRSASIPYNQVYSSLYGDNNKSDHLMKTFCRCQNHFRKEDDDNHIQTISSSFVNFEDTDSDLDYNEDEEEKKKTYDSGYETFKLIPIDVDLHTQKNMEEHSTNHYDIPGLVLRRGQSFSFTVTFNKDYDIEQNQLYIRLAIGPRSMISKRTQIRLLVDGTPSGNGWSAKSIPIEDDDVKTKKKNCISLQINSPSDAIIGKYTLLLEVCPSKNDDKKFLNKQDPTLFLIEADLYFLFNPWNKDDACALSSSEQINEYVMNEHGQIYLGTSNKPQPIPWYFGQFERSTLLTALTLLDKAKLPAQNRIDPSIIIRILSSKICSNPGTNNGIFPSSYDTKVYSSENHGYTSSTGIFKQYLLSNCRSVQGGCGNNWQHAAILCSLSRSLGIPCRIVTIYNAACQTDGTEDNDTHWDTKQRPLHKLNFDLICSSHVWNECWMRRHDLPNDEQDWQIVDSTPVQMCDGIRRTGPCSVSSLKNDKLSFRWDSPFIHSTINGKKSHWIVYPDGHMELLDVQENIVGTKIITRSLDNEFEPSDITKNYKNLMKTYNKYDNITERINNDVDIELKIPDNIEFGDDITFELNANNKSNEIRTIATALTISILSNNDQKLIVSHDQPVQTLNLEAEKNDHIQLKVTSKQYASYGKQENIILKYYIHSLIKETDQTFTRDDNIVFNKYDIIKPILDDDVIEIGKPVLLKILIANTLSHPINSGQIYIDGLGINQIVHVNRSFAPKESTTLHIKLYPTRIGVSRLYVTFISNNVSSSTQTIPLEIIREPIKQQHERINAQEEPLLTTNTETSAETDEKIEIPSKEDKLVTQSNISDRQDETLIHEEEQHPLVQSPSSLSSSINIADEYQDDRTSNISQPKFELSTTEDDDDDIAELNLKKNQDESSPNPNTSSSLPHDSTLSLEKDKISVDSLDIAHDRRYGTNNNQ
>tr|A0A819KK27|A0A819KK27_9BILA Hypothetical protein OS=Adineta steineri OX=433720 GN=JYZ213_LOCUS36401 PE=4 SV=1
MELNKDNGSWIIHVTFKMGLVYMKWGRYDSAIRHFQGVLDYSSSIQSFPLEVIATFHEHLAMAYEKQRKYKEALNHWEKLLEIQTKIFEPFSIEIADTYLSMAENYLMLLEFGRVIEMWHKVKSVHLNPLSPNYNAASFLFNQMENPDTSSPEYIKTLLLQLRSHSASVKLKAQPSYISEKTEL
>tr|A0A2P1NJ72|A0A2P1NJ72_9BURK GP-PDE domain-containing protein OS=Pulveribacter suum OX=2116657 GN=C7H73_05065 PE=4 SV=1
MKRRAVFALLAGATLAACGGGGDDLEPDQSRPIVIAHRGASGYLPEHTLGGYELAMRLGADYIEPDLQLTRDGALVAMHDETLERTTNVAALFPPRSGGYKVADFTLAEIKTLAVKPTGTGKASYPGFAPGSATPWSVPTFDEVIRLAQSSRSLVGREVGIYPEAKQADPAMEDAILKALVQGGYSARSRVFIQSFSDQTLRSMHVKAQAQGNPLPQILLGAAVMGADGVARLGVIGQAAQPVLLTFKDVASFAQGVGVVINASAYPITKAYIDQAHAVGLKVHGWTFAQPEAGAAAAEYRRYLELGMDGMFSNYPDLAVKARDQYVRERQADWGARGPAHPH
>tr|A0A7J2PPS0|A0A7J2PPS0_9ARCH Uncharacterized protein OS=archaeon OX=1906665 GN=ENH77_08385 PE=4 SV=1
MTLRSRNESKINRFRALNNFLQNKYIILVFIGHKNQIDQTSTVIDVVDEFKIGSRYAYKLLEELESGRFIIKKAKVLKHGIYYSNYIITETAKSELREILKIITSIL
>tr|A0A6T8JG47|A0A6T8JG47_9STRA Hypothetical protein OS=Proboscia inermis OX=420281 GN=PINE0816_LOCUS10274 PE=4 SV=1
ETGLLVDMDPSDQEKAGENLASALQGLLEEPERAIRLGKRGHAHVTERFGLEPFRREWNEIVTGAIPKGATRVSLRAAKNSANSVKQRMRTLARLLAFVAVVYQYGGEGLAVIQRKAAEHFKVIGTILRMVVALIAVMAIRYRS
>tr|A0A6P7FQQ6|A0A6P7FQQ6_DIAVI farnesol dehydrogenase-like OS=Diabrotica virgifera virgifera OX=50390 GN=LOC114332982 PE=3 SV=1
MVLSMKRWIGKVAVVTGASSGIGAAVAKQLVEEGLLVVGLGRRKEKIESLGNRLSGKQGKLFAVKADLTKEDDIKQAFKWATENVGPISILINNAGTHIRTGLLDGDTEAWKTTINVNLLALCIATREAIQSMRKNSIDGHIIHINSFLGHNVAPLPDLDVYPATKYGVTALTETLRVELNSFNLKTKITSISPGFVDTEIIADMKNNEEFKRNVPNLLNPEDIADGIIYALSTPPHVQVHELTIKPLGEKY
>tr|A0A2G2QTX8|A0A2G2QTX8_9GAMM Heptose kinase OS=Porticoccus sp. OX=2024853 GN=COB19_03790 PE=4 SV=1
MSCWFVDRAILSEAAAERFSSLDSVFATTGRRVTRCPISELILTEIGEKSYYVKRYSRRGKVIRRWLGRSRVRAEWENLLFFRGLGLRVPPIAAYGESGARGVLITEEVPGAIDLHSLVRQRPELLRDRNWLDQVVVQVADVAKQLHANSFAHNDLKWRNILVAGEVTPEVYLIDCPMGQTWWGPLLAYKKIKDIACLDKVAKYCLNRTVRLRFYLHYVGRDRLTAADKTFIRKVLAFFAGRE
>tr|C7GZL0|C7GZL0_9FIRM Uncharacterized protein OS=Eubacterium saphenum ATCC 49989 OX=592031 GN=GCWU000322_00425 PE=4 SV=1
MGYDDFFMDIGALFVVLIVAFLGNGLGEFSFKYVAREVFILALLSTAGAFVWTLILAYLKYKRSNNKSK
>tr|A0A4S1VTE3|A0A4S1VTE3_ECOLX 4-aminobutyrate aminotransferase OS=Escherichia coli OX=562 GN=gabT PE=3 SV=1
MSSNKELMQRRSQAVPRGVGQIHPIFADRAENCRVWDVEGREYLDFAGGIAVLNTGHLHPKVVAAVEAQLKKLSHTCFQVLAYEPYLELCEIMNQKVPGDFAKKTLLVTTGSEAVENAVKIARAATKRSGTIAFSGAYHGRTHYTLALTGKVNPYSAGMGLMPGHVYRALYPCPLHGISEDDAIASIHRIFKNDAAPEDIAAIVIEPVQGEGGFYAATPAFMQRLRVLCDEHGIMLIADEVQSGAGRTGTLFAMEQMGVAPDLTTFAKSIAGGFPLAGVTGRAEVMDAVAPGGLGGTYAGNPIACVAALEVLKVFEQENLLQKANDLGQKLKDGLLAIAEKHPEIGDVRGLGAMIAIELFEDGDHSKPDAKLTADIVARARDKGLILLSCGPYYNVLRILVPLTIEDAQIRQGLEIISQCFAEAKQ
>tr|A0A4U1G485|A0A4U1G485_9SPHI Methyltransferase domain-containing protein OS=Pedobacter sp. RP-1-16 OX=2572196 GN=FBD94_20505 PE=4 SV=1
MNQELEIIRDQQQEVWNKFSAGWKKWDTLTMDFLKPVGDEMIRLLNPKGNDMVLDIASGTGEPGLTIASMLTNGKVTLTDLSADMLEIARENGADRGIKNIETIVCDVCELPFEDHTFDVISCRFGFMFFPDMLLAIKEMARVLKPGGRIATAVWNIPEKNFWVTASMGVIRKNMDIPVPPPEAPGMFRCAEAGMMSDLFKQAGLINISEKEVAGKMNCGTTDTYWNLMTDVAAPVVAALSKADQATKDKIKAEVYETINQKYADGDVVIDSSAIVIYAEK
>tr|A0A6G2IRX0|A0A6G2IRX0_STREE PTS fructose transporter subunit IIA OS=Streptococcus pneumoniae OX=1313 GN=GRB29_07185 PE=4 SV=1
MKYLILVSHGGFAQGLKTSLAMFAEDKMDQVIALGLKNGSSVDDFAKECHQAVDHLTEEDTVIVLADIVGGSPLTTALTVLEEKGKLDTTVVLGGMNLPMALTSVVMKDDLEGDDFVAAVLPEASAALQEFKVATTTDNDEDDDI
>tr|A0A847WTI5|A0A847WTI5_9BACI Geranylgeranylglyceryl phosphate synthase family protein OS=Amphibacillus sp. OX=1872500 GN=GX972_07265 PE=4 SV=1
KQFGSMIDWSELTTEGYVILNPEAKAYQLTNCYLPDREDVIAYAQMAEQMFNLPILYLEYSGTYGDPELVRQVKQHLNKTQLVYGGGITTLEQAKEMAQYADTIVVGNSLYDNFAEAIETVHVKE
>tr|A0A7W5HC73|A0A7W5HC73_9BURK Uncharacterized protein OS=Massilia umbonata OX=864828 GN=FHS02_002507 PE=4 SV=1
MVHEEARPPQAARLPLPAPVVAQEIASPPQAAELPLPLPVVVHEMALPPHAAALPVPLPVVVQDIASPPHAASLPAPLPVVVQERARPPHAALLPTPLPVVVQEIARPPQSAWLPAPLPVDAQLIAIPPHAARFPGPEPVVMHDIARPPHAAQLPGPLPVVVQVAARPPQAA
>tr|A0A085DW41|A0A085DW41_9GAMM Uncharacterized protein OS=Halomonas sp. SUBG004 OX=1485007 GN=DK37_25465 PE=3 SV=1
MSLHQDLIERDRKVTFHASTHLRDFAHGDAPGRVITGGKGIHIVDKDGREFIDGFAGLYCVNIGYGRTEVAEAIYKQALELSYYHTYVGHSNEPQIELSERVLKIAGLNMSKVYYGMSGSDANETQLKIVRYYNNVLGRPQKKKVISRMRGYHGSGIASGSLTGLKAFHDHFDLPIDTIRHTEAPHYYLRAAEQHGLTELEFSAYCADKLEAMILEEGPDTVAAFIGEPVLGTGGIVPPPEGYWEAIQPVLDKYDVLLIADEVVCGFGRTGSDFGSHHYNMKPDLITIAKGLTSAYQPLSGVIVGDKVWKVLEQGTGEYGPIGHGWTYSGHALGCAAGLANLDIIERENLVGNAAETGAYFQQQLKATFEGHPLLGDVRGVGLMAALEFSPDAKQRLHFDPTLKVGPRVAAAAMEENLIARAMPQGDILGFAPPLTINRGEVDEMIGRAKRAIDRVTDELVRAGDLKTGQQEAAFTI
>tr|A0A6A3RIU8|A0A6A3RIU8_9STRA Uncharacterized protein OS=Phytophthora fragariae OX=53985 GN=PF001_g20766 PE=4 SV=1
MANLIKPITSGHDLIALAAKCDLTTDAVLDSTEVTKPLPHDKTYLILQRPADMDIGHWTCVHNGKYFDSMGEGPPTK
>tr|A0A2A2IY53|A0A2A2IY53_9PSED Cell division protein ZipA OS=Pseudomonas sp. HAR-UPW-AIA-41 OX=1985301 GN=zipA PE=3 SV=1
MDIGLREWLIVIGIIVIAGILFDGWRRMSGNKGKLKFRLDNSFGNLPDEDVDPNLLGPVRVKEKHAEPQLDEHDLPSMTATDGGKKRSEPFQGDLSLDEPVPTLLNPVDDEVKSESPREQVPVDEVLVINVIARDPEGFKGPALLQNILESGLRFGEMDIFHRHESMAGNGEVLFSMANGVKPGTFDLDDIDLFSTRAVSFFLGLPGPRHPKQAFDLMVAAARKLSSELNGELKDEQRSVMTAQTIEHYRQRIADHERRKLTQKR
>tr|A0A2M9EG28|A0A2M9EG28_9GAMM Efflux transporter periplasmic adaptor subunit OS=Xanthomonadaceae bacterium NML95-0200 OX=2032577 GN=CO610_06720 PE=3 SV=1
MSSQLRPNPPKRRGFWMPAIVIAVLAAGALWWWQGKRSGSDEGAFRTVQIEQGDIRVAISATGTLSAISTVTVGSQISGQVTEVLVDFNSPVKKGDVLARIDPSTYRAQIAQGDAAIASAQAVLRQAEANLRNVRADFSRKNELGAQQLVSRSDVDSARASLEQAEAQVNVARAQIRQQTANTQTTRLNLERTVIRSPVDGVVLMRKIEPGQTVAASLQAPELFTIAEDLSKMKIELGVDESDIGQVKAGQGVSFTVDAFPNRQFRGVVEQVRLAATTSNNVVTYPVVVTVDNSDGTLLPGLTVNAEIEVSKREGVLKVANAALRYKPSEATQALLGEAAASGGSGNARRGMSEKLPKIAAGLRLQPAQQQVFDEALAAMRAAQAERQGATRSGNGSAGGPPMMMRSGSAPDPAMMAQIRARMRERMQRQFAQFRSTLDDEQRAQWDSAMDALLNSNRAPLYLLVDGRPRRVMARIGASDGSSTEISGDFRAGDAVISGERAASSAR
>tr|A0A2D7G1K4|A0A2D7G1K4_9GAMM Uncharacterized protein OS=Gammaproteobacteria bacterium OX=1913989 GN=CMP96_10680 PE=4 SV=1
MDLLKELFSFLRARKKLWLAPIILIMVALGGLLVIAEGSVLAPFIYTLF
>tr|A0A5E4IWU6|A0A5E4IWU6_9ARCH Protein-synthesizing GTPase OS=uncultured archaeon OX=115547 GN=eif2g PE=3 SV=1
MPQAEFNVGVVGHVDHGKTTLTSALTGKWTDTHSEELKRGITIKLGYADVVFKQCTRCGFSSTKERCPKCGAPTQATRKIAFLDAPGHETLMATVIAASSIMDGALFVIAANEKCPQPQTIEHLMILEAAGIKNVVIAQNKVDLVTRQQALEHYKQIREFLKGTTYENAPIIPTAANSGGNLDSLVSALLETIKPVPRESGKTRMLVARSFDVNKPGTNVEKLYGGIVGGSIVSGVLKNGEEVRILPGALRTHKGKEHYQELSTKIVGIRVGDETLEEAKPGGLVALATTLDPSLTGADVLVGCLLFPAKDEPPVVYQTFSLEITPLSRLLEKFPSSFTPNEPLVLGVGTATTVGFVTKQKKKICELMLKKPVCASKTDVIAVMRRANNRWRLYGTAKLVS
>tr|A0A209CHN7|A0A209CHN7_9ACTN Flavin reductase OS=Streptomyces sp. CS057 OX=1982764 GN=B9W61_33485 PE=4 SV=1
MTATPDLAPAPTAATPELFRSVFRRHAAGVAVITAAGERPVGFTATSLTSVAAEPPLISFGVGTSSSSWPVLSEAAYVGVHILGEHQHELAATFARSGADRFGPSTEWSSGPEGVPLLAGVSAWLVCRVVTRVPAGDHRIVIAEAVSGAPSGAARPLVYHQGRFTALRD
>tr|A0A1A7C0Q9|A0A1A7C0Q9_9BURK Porin OS=Janthinobacterium psychrotolerans OX=1747903 GN=ASR47_1005274 PE=4 SV=1
MPIMKKSPLSLRAHQGASLLFLAISGTAAQAASLPEWTLGGFGTAGLVHSSERQADYSANVINRGGAGRTDRWSGSVDSRLGAQLGVEFTPRWSAVLQVIAEHNLQNSWLPVVEWANLKYQATPELSLRLGRIALPIYLAGDYRKPGYALEWVRPPVEVYGSLPVSNSDGVDASYRWQAGATNNLTQVFYGHTSIETDDGGKRARGRQLAGLSNTTTYGALTIRASALTAELTVDLVRPLFDAFRQYGLRGGQIADRYDADHKRVAIANLGVSYDTGDWFLQAEGSRLNTRSFLGDKSSMYLGGGYRLGAWTPYATYAKVKANVPNRDAGIDSAQPGAAYLNGQLNALLQRISSQHTISTGVRWDFLPDRAVKLQYDRLRPTGASSGTLVNVQPGFRTAHPIHVVSIALDFVF
>tr|A0A124SC33|A0A124SC33_CYNCS Homeobox domain-containing protein OS=Cynara cardunculus var. scolymus OX=59895 GN=Ccrd_005381 PE=3 SV=1
MEVARFEDEQQHKNKFFGFNSMSQDYIFNFSHGFERPSQDQQQQNHISHQIRRDKLRVQDFEPPAPASLVGLEQVDEGTGGAGGINPAVYETGAGMLSEMFNFPTGGPATELLENQINYQHHRNQRPNSATGDWYGNSTAQAMQLFLMNPSHESPSSQSSSHHHHHHNSSTSSSTLHMLLPNTVPSSTSTLHHQQSFGSTSGSGQGQFGPSTQFAWIPPGGTTHEGGGGGGDSHGLSLSLSSTLQHLEAAKVEELRIGDDPAATAMLYFNQSGSDPYRHLQLQGGGGGVMGSTHHPIHVGYGSSTVGVVKALRTSRYVKAAQELLEEFCSVGRGQFKINKSGSKPANNPNQNPSNSCGGASSASSKDHPPLSSAERIEHQRRKSKLLSMLDEANRLTKITIETKKSRWIGDTITTMVVNSFDLILGFGAAVPYTALAQKAMSRHFRCLKDAITAQLKHSCELLGEKDVGTSGVTKGETPRLKMLEQSLRQQRAFHQMGMMEPEAWRPQRGLPERSVNILRAWLFEHFLHPYPSDADKHLLARQTGLSRNQVSNWFINARVRLWKPMVEEMYQQESKEEADQHHNHSPHHRHQDDDDDDEDDDQEQEEDKENTKYHNHNHDQNQTDNDGHHHHHPPPQPSSAATQTSMHAPPPPLTSAPTYTTTTTTATDSAAKRSEINDSENDPSLLAINTQHCFSENQAMTYSYSNPIGGITTMAPPPPPPFDGDTCRRGSMLGAEYRTTTGNDAADIGSTLIRFGTTSGDVSLTLGLRHAGNLPEKTSFFS
>tr|A0A1B1T822|A0A1B1T822_9NEOB KIAA2013 (Fragment) OS=Afrixalus dorsalis OX=367642 GN=KIAA2013 PE=4 SV=1
PSKLSSISQLLQLWDLWKLTLQKRGCKSLVMAGAHGLMQGMMLSFGGLQFTENHLQFQSDPHVLHNSYALRGIHYNKDLINLAVLLDQDEKPFLHVSVKFQDKLVKLYACEAGCLNEPVELTSEIRGHTFPVLVTQPLTPLLYISTELTHLQDLRHTLHLKEILAHEEHMAKQYPGLPFL
>tr|A0A251VB46|A0A251VB46_HELAN Putative pentatricopeptide repeat-containing protein OS=Helianthus annuus OX=4232 GN=PPR38 PE=4 SV=1
MMNRIAFIKLRGNFTTSSFLLHSETPFSSFHIGLHSDTRNVSVNRSMFDKITNLNDALNLFDEMSHRHPLPSVVKFTRLLNVVTKMKHFTYALDLFKQMCSLGVPLDKYTLSIAIKCCCQLNRTKDGFAVLGSCFRRAIPPDVYIFSVLLDGLVLEDRILEAEMFFKKLIKQKLCEPDVVMYNTMIKGLCKFGNNVTAVALLRLMEQTNCKPSIVTYSTIIDSLCKDKMIDDAFKLFKEMVFDIGILPNVITYTSLICGLCKLGRWDEASKMLKEMEDENISPDVQTFNVLVDAFCKEGKVEEAEAVINIMIERGKVPNIVTYNALIDGYCLRGEMIKANTIFDSMTLRGLVPDVVTYSSLLNGYCKNLNIEKAEQMFHEMTVKGLKPDVVTYSTMIQGFFQVGRCVAARRLFDEMHARGQIPDQCTYGIVLDGLCNNHLVEDALSLFYLVGKSKLNSDIAVYNILIDGAGKNGKVEVARILFQGLIDKGLQPDVRTYNVMISGFCREGQLGEAKLLFLKMEESGCPPNNITYCVLLQGCLKNKHYDDVEMLLKEMDARGYSLDASTLSLFIDHIAAGLLDRSMLKLFNKLVPKELLDDPRLCDWESN
>tr|A0A258FT73|A0A258FT73_9PROT Uncharacterized protein OS=Caulobacterales bacterium 32-69-10 OX=1970503 GN=B7Y99_04785 PE=4 SV=1
MRCVAASLCEDTTTTVAALLRSTAQEMASLSDMSNRLHDLVARQMGAAVIHEQSVEEAQSIDLLVQHLETIGRFLHLLADEVPSSLAVDFSPIRDRLPLAALADRLGGEAGRRRLDDGDPGDLDLF
>tr|A0A329S1R4|A0A329S1R4_9STRA Uncharacterized protein OS=Phytophthora cactorum OX=29920 GN=PC110_g12992 PE=4 SV=1
MRATAAKQRHKRRRPTAGQDDEGTVAATAGDKNGADRGEDGDESHGVVIAAV
>tr|A0A6A3VWU9|A0A6A3VWU9_9STRA Uncharacterized protein OS=Phytophthora fragariae OX=53985 GN=PF001_g28857 PE=4 SV=1
MALLNRRFDSEDSATAIENLTAKLKKGIQAASTHFFEQEFPHDTREAILCTLDPTKTPLTPVQSGQAIRDHLEAIGRSTSKT
>tr|A0A0D0XGW5|A0A0D0XGW5_9TREE Unplaced genomic scaffold supercont2.14, whole genome shotgun sequence OS=Cryptococcus gattii VGIV IND107 OX=1296105 GN=I308_04987 PE=4 SV=1
MPFRKTPCLSKPIIQFKLPFSSFSYPPCTPPERGTPAQTPGLAMSQTSWPRAMAVSFMIVTPPGQYSTQFPSLYPTEYPAEAAIDESSESDDQSVEDLMSLVTENEDGQERRWDGKGQEPLEKDAICPGAPKLSPIDLPN
>tr|A0A4Q1BKZ0|A0A4Q1BKZ0_TREME Uncharacterized protein OS=Tremella mesenterica OX=5217 GN=M231_04342 PE=4 SV=1
MTGLTLPPLTLFLFSLLLFLLVGPTLVIASPDPTSPNVKRERLVAQAPSNTEITPIETKNIERGITTLPVLPRNDHPTSPPRLPRQPNRLVPQPTKRAEALIENDSVERFIDDVKVERRDEIGIGKRDDACSIAININLSDKTAPAIDLPSCLDGLDLQLGINLDLTDDDGGDDDCELGGGNFLAHSETSSNTKPPASTSKSANPGKSTPGNGGNDSDNIVALSWHVFGGNGYDGPSCGKTLTIVTSKGKQATAVVADECASCPDMYHVDMSTGLFSALGLDKSTGEYVVKWQCPDCVFEEDPTIGGCKNNPGGQYC
>tr|A0A1S1XQS9|A0A1S1XQS9_9XANT Transcription-repair coupling factor (Fragment) OS=Xanthomonas alfalfae OX=366650 GN=BHL63_10710 PE=3 SV=1
ISQRLAALHRLPGLTRGVVIVPVQTLLQQLAPLSYIVGGSFDLTVGQRLDLDAEKRRLESAGYRNVPQVMDPGDFAVRGGLLDVFPMGADTPLRVELLDEDIDSIRVFDPESQRSLDKVDAVKMLPGREVPMDDASVERVLACLRERFDVDTRRSALYQDLKSGLAPSGIEYYLPMFFAKTATLFDYLDKRVLPVIATGVSNAADAFWTQAQNRYEQRRHDVERPLLPPDELYQSPDALRERLNKLARIEVWASDHARIDEAAPLGDQPLPPLPVAAKDAPAGQALATFLSHYPGRVLIAADSAGRREALMEVLAAAQLKPELVADVPAFLAGTLRFAITVAPLEDGFALDQPQIALLTERQLFPERANQPRRTRRVGREPEAIIRDLGELSEGAPIVHEDHGVGRYRGLIVLDAGGMPGEFLEIEYAKGDRLYVPVAQLHLISRYSGASAETAPLHSLGGEQWTRAKRKAAEKVRDVAAELLEIQARRRARAGLALQVDRAMYEPFAAGFPFEETGDQLAAIDATLRDLGSSQPMDRVVCGDVGFGKTEVAVRAAFAAASAGKQVAVLVPTTLLAEQHYRNFRDRFADYPMKVEVLSRFKSTKEIKAELEKVASGEIDVIIGTHRLLQPDVKFKDLGLVVVDEEQRFGVRQKEALKAMRANVHLLTLTATPIPRTLNMAMAGLRDLSIIATPPPNRLAVQTFITAWDNTLLREAFQRELSRGGQLYFLHNDVESIVRMQRDLSELVPEARIGIAHGQMPERELERVMLDFQKQRFNVLLSTTIIESGIDIPNANTIIINRADRFGLAQLHQLRGRVGRSHHRAYAYLVVPDRRSMTSDAEKRLEAIASMDELGAGFTLATHDLEIRGAGELLGEDQSGQMAEVGFSLYTELLERAVRSIRQGKLPDLDAGEEVRGADVELHVASLIPEDYLPDVHTRLTLYKRISSARDPDALRELQVEMIDRFGLLPDPVKHLFAIAELKLQANALGVRKLDLGENGGRLVFEAKPAIDPMTIIQMIQKQPKIYTMDGPDKLRIKLPMPEGADRFNAARGLLAALSPG
>tr|A0A241PHY0|A0A241PHY0_VIBAN Coenzyme A biosynthesis bifunctional protein CoaBC OS=Vibrio anguillarum OX=55601 GN=coaBC PE=3 SV=1
MRRIFEEKTMQTLAGKKILLGISGGIAAYKCAELTRRLIERGAQVQVVMTHAAKEFITPLTMQAVSGRPVSDSLLDPAAEASMGHIELAKWADLVLLAPATADLIARVAAGMGNDLLTTLILATNAPVAVSPAMNQQMYRNIATQENIATLKRRGMMIWGPAAGEQACGDVGPGRMLEPMQLVERCEFFFQTEVANNTLLAGKSLLISAGPTREALDPVRYISNHSSGKMGYAIAQAAAQLGAKVTLISGPVNLLTPPQVQRIDVESACDMHQQVMAQAQSHDVFISCAAVADYRPEIVADQKIKKTDASDHMLITMVKNPDIVASVAALNENRPFTVGFAAETQQVEKYARAKLLNKKLDMICANDVSVAGQGFNSNDNALTVYWQGGEQALPLSSKSALAHALMQLIASQL
>tr|A0A4V1XBV3|A0A4V1XBV3_9PEZI Oxidored_FMN domain-containing protein OS=Monosporascus ibericus OX=155417 GN=DL764_002426 PE=4 SV=1
MASPMSQSRLFEPLQIANGKITLKHRVVLAPLTRNRGTPLNPNSTCENPNRIWIPNDLMAEYYSQRTTDGGLLISEGIPPSLEGNAMPGVPGIFIQEQVEAWKRVTAAVHAKGGIIYAQLWHSGRANIPHLTGTPIVGPSSLPWDDPEECYMYPIPHTDTRVKLADHPPVEMTMSKIKQTIDDFRRAARAAMDAGFDGVEIHGGNGYLPEQFLSSNVNRRTDEYGGSPEKRCRFVLELMAEVAGAIGQENLAIRLTPFGLFNQARGEQRLETWGHLCRELKRDLPHLSYVSFVEPRYEQVFSEAEKQRFLDSWGLPDVDLLPFRRIFGETPFFSAGGWNDANSWGVLETGDYDALLYGRYFISNPDLVERLRHGRPLAPYDRSRFYGPFEDNSIGYIDYPPYKEDNDPPCEEDNGDEDRARRLSVL
>tr|A0A1C5LQ41|A0A1C5LQ41_9CLOT 4-hydroxy-tetrahydrodipicolinate reductase OS=uncultured Clostridium sp. OX=59620 GN=dapB PE=3 SV=1
MTKIILSGANGKMGKVIARCTEERNDCEIVAGVDLNTQAYSDFDIYPSFSECGESGDVIVDFSNPAVLDGMLDYALKTNTPVVIATTGYSPEQIEKIQKAAEQIPVFFSFNMSLGVNLLVSLAKKAAEVLGGQFDIEIIEKHHNQKIDAPSGTALMIADAINDTLDQTQKYMYDRHAQRKKRDKNEIGIHSVRGGTIVGEHEVIFAGHDELLSLKHQAMSKEIFAVGAVNAAVFLKGKPAGIYDMGKMV
>tr|R7KGB8|R7KGB8_9BURK ATP synthase subunit delta OS=Sutterella sp. CAG:521 OX=1262977 GN=atpH PE=3 SV=1
MAELSTIARPYAHAMLLALQDANKGPEEAADLAAVLDGIAQVVTTPELVSVIGDPKLSSEQIYDLIIAGLGQTKLPEEAANLLKVVVENGRLEAVPEIARQFRELKNQSEGVADAYIESAMPMTQAEVDDLVAGLGKRFPGLKLTPVVTINEALIGGVRVRVGDRVLDGSIQTRLAQMQEALTA
>tr|A0A496GGQ1|A0A496GGQ1_HELPX Uncharacterized protein OS=Helicobacter pylori OX=210 GN=DD744_03805 PE=4 SV=1
MRIKAYFLRFIALVLIVLLGFSACKNSQKSQDSQNNTTQQDSPKTYTAMDLNNQEYTITGDLDSLNISPDSNTPTLLVLSALDDFLKDYAPTFNILKKTFKDRLRVLILLNQPYSSDAIKDFIAPFQADLMILNPKDTALFDHLNHNALNHSFNMLLYHKHQLIKMYQGIVPAEMLQFDISNLKD
>tr|A0A847F664|A0A847F664_9DELT Uncharacterized protein OS=Sandaracinaceae bacterium OX=2510337 GN=GX614_10825 PE=4 SV=1
MSSPCLRIALIALLFALPSLSSADDGDLRLLRESIGYIEVADAADDEDPFDFNLSLGFRHDRVSGNITREMLSPVDGSVMQKVGDYSATRSYLDVAAEIGLYRDLAVRLMVPVLLSYDQSITDIESAATPLLGSQDAVSPTRSGIPEIIVGLAWQPMNQMRRADRPNWTWLFNVALPTGKVMSPCLDVPGSSCASNAGVSTGVVRLLPEWRLSYRFRYVETYGGLKGEIPFPTASRDSLFTPGGQLLGYRKTRPSIRGGFIVGAALIPWERRATHQRLAIDMRFHAHYVSGGRDFSPLFDVLGDPNLSPTPRFPEICEDGSVAGTGGVCNPGDPYATRFTGLTTTQSHGNIGGRLTLEIKAARYITFYVSSGLQWITSHLLTTESECNASVDPHPQDAINCNVGRPNPHYQREIDMVGNRFGVGNLTNLDLVLRAQGTF
>tr|B4RA04|B4RA04_PHEZH Transcriptional regulator, Cro/CI family OS=Phenylobacterium zucineum (strain HLK1) OX=450851 GN=PHZ_c3099 PE=4 SV=1
MPRPATDPAKAAQIKALRQQAGRWLKAAREAAGMTQAELAEKVGLRYYTFVSQVESGLGRLPIETQAAWATALGLDPGEFARTLLRYYEPELFRLLFETDSAQGRATA
>tr|A0A1V2CHU8|A0A1V2CHU8_9FLAO Vgr family protein OS=[Flexibacter] sp. ATCC 35103 OX=1937528 GN=BXU01_03190 PE=4 SV=1
MTPPTIIFGIDSKKISHFTSIELVQVINDHHRFEILVPHAAVESPLAYTLENAQAWLGKVVHIVLEEKNNFLGVVTNIDFDQEMGHSGNQIIVSGYSKTILLESGEKLHSWEELTLKDIVKEVVKNGAGEQLQNEINPEYTSKMDYQNQYLETDFQFIQRLAKQFNEWLYYDGEKLIFGKPKSFDSPISLTYNSEISKLKISVQAVPNKFSAFTYNESADKRYTAKSKDTVGGLPKLGNEAFASSKEVFATPAYTHGIVSTGDDLVLESFLKKKQESAAADTNFVSATTKNSKLRIGSIVTIQSSVLENKSLITQEVGSFIITEISHYATHLGEYENNFRAIPSKVLSLPEPDVAYPIAQTQQALVESNTDPQNKGRIRVQMLWQQGTQMKTAWLRVMTPDAGSSDKVGTNRGMVFIPDVGDHVMVHFRYGDPNRPFILGSVFHGKSGGGGGKDNNKRSFATRGGTSLVLDEEKNTFTATDPSGNMIMLNGDGTMTIYAPNKVDIQSKEINLIADEKVSISGVNEVSVDSKKVLVSGTDEVTVKSDTQITDEAPSINIKGKNTILAEGTVVDIDGKTMTNVKGGVVNLN
>tr|A0A7X9ZH40|A0A7X9ZH40_STACP Pur operon repressor OS=Staphylococcus capitis OX=29388 GN=purR PE=3 SV=1
MRYKRSERIVFMTQYLMNHPNKLIPLTFFVKKFKQAKSSISEDVQIIKNTFQKEQLGTVITTAGASGGVTYKPMMSKAEATEVVNEVITHLQEKERLLPGGYLFLSDLVGNPTLLNKVGKLIASIYMEEQLDAVVTIATKGISLANAVANVLNLPVVVIRKDNKVTEGSTVSINYVSGSSRKIETMVLSKRTLAENSNVLVVDDFMRAGGSINGVMNLMNEFKAHVKGVSVLVESKEVKQRLIEDYTSLVRLSDVDEYNQEFKVEPGNSLSKFS
>tr|D2PK46|D2PK46_SULID UPF0148 protein LD85_1482 OS=Sulfolobus islandicus (strain L.D.8.5 / Lassen #2) OX=425944 GN=LD85_1482 PE=3 SV=1
MTNESEVGVKKAAELLRQGATMLEEACPICKMPLFKLKNGDVVCPVHGKVYIVKSDDEEKIVKRNLQLDEIESILIDGLYLSAKKMKEDPLDSERIIQIIRYLDALERLRKIKINSSE
>tr|A0A353T2J5|A0A353T2J5_9FIRM FAD/NAD(P)-binding oxidoreductase (Fragment) OS=Clostridiales bacterium OX=1898207 GN=DDW86_03375 PE=4 SV=1
TTEQGEIRASYLVNAAGVYGEVVSEMVQERSFTIHPRKGEYLLLDKSQGNLVHSVIFQTPTKMGKGVLVAPTVDGNLLTGPTALDVSEKDDVGTTAEGLEKIRKEAGKSVPDIPFRDVITSFAGLRATPDTGDFIIEASGTVKGFLNVVGIESPGLTAAPAIGEYAVDLLGKEGLPLVPRGDFQPVRKPAVRFREQTDEEKQRLIRENPLYGNVICRCEIITEGEIVDSIRRPAGARSLDGVKRRTRAGMGRCQGGFCTPRVTAILARELRIPEERVTKKGKGSELLAEKRGPSC
>tr|A0A3D6A882|A0A3D6A882_9FIRM Guanylate kinase (Fragment) OS=Lachnoclostridium sp. OX=2028282 GN=DHU73_00550 PE=4 SV=1
KSATGKDTLYKEILKRRPKLRTVTMYTTRPIREGETDGVEYFFTDREELERQLASGKVIESRTYQTIAGPWTYYTVDDGQFDVADDESCLMIGTLESYEKMCAYFEAGKMVPVYIEVPDGIRLLRAVKREENQKKPNYREVCRRYLADEKDFSEENLERLGITKRYQNTDMEMCVEEILRDLDK
>tr|A0A5P9EVH6|A0A5P9EVH6_9GAMM Uncharacterized protein OS=Microbulbifer sp. THAF38 OX=2587856 GN=FIU95_07605 PE=4 SV=1
MKKITSKYPQYRAVLKNSIASFTLICASTLVQADTISTKIDLGEPFPFKMEDGVEYEVDLDIGYQFDSIDNACISTEVKGGNASKAFLELESEPAAGSFILGYSESHEIGMIYSFDFPTQENPNPVSELISFGFCAGRFNGSLLKRNFLDGEGKFTVSVSGGYVEFWDFKLVVEGDLSDIQLAIELDEPADFSVPSYGGRVNYDASIRNLDSSQSLITLDQWSVLTLPNGDNYPIHKSRDVVLNYSEAKDYTRNYLTIPEWFEAGDYELTWYVADPSTGVRVKDSLHFTKSAD
>tr|A0A161IP46|A0A161IP46_9BACI Uncharacterized protein OS=Fictibacillus phosphorivorans OX=1221500 GN=ABE65_012790 PE=4 SV=1
MKRQCLHMLTGFLFILLLTACIGEDYDAGPPELRLSVEEDLYALKQANVDWKTEEKEFKNKVEHFLTLGSEQKEIKLSPNQSAELILLENKEDDGEYTNETLEISLWKENEKIELTTKSSTDYSFSFPSDPGQYVLEVNFRTSNGRSQYVGNITLK
>tr|A0A2W4W2P1|A0A2W4W2P1_9CYAN Uma2 domain-containing protein OS=Leptolyngbya foveolarum OX=47253 GN=DCF25_12600 PE=4 SV=1
MIAAKDHPPKLTSEEYFAWEEKQLEKHEYIDGQVYAMSGGSVNHGRLAIRLTAMFDNHLEESSYITGNSDIKVNIVKTVDYTYPDASVTCDDRDQNTPNYFTYPCLIVEVLSDSTEAYDRGGKFRMYQNNPVLQDYLLVSSTRIEMDLYHKNENGDWLILTYQKGDMVTLKSIGLSFPIEQVYRGLSLQQPDQFY
>tr|A0A1B2E8Q8|A0A1B2E8Q8_9BACL Serine/threonine protein phosphatase OS=Paenibacillus ihbetae OX=1870820 GN=BBD41_01205 PE=4 SV=1
MLWILVIPVLNIFYAVLNQAHMPVYSLMTDLDAQIPFVPMFIIPYLIWYPFIIIVLFMLCIRERSVYYRTLLTQCLGLVACYIIFYLFQTTVERPTTMGTGIFEGLVNLVYSTDNPYNCFPSIHVLTSYLMIKGATACASYPNWERTAVKVCAWMIIASTLFVKQHVLLDIAGAIAVVELLWYGVGKLPLGQQSKFKGEVVRQNLTAD
>tr|A0A044SS46|A0A044SS46_ONCVO Methionine--tRNA ligase OS=Onchocerca volvulus OX=6282 PE=3 SV=1
LHLMIRSIKTICAIEGVSISSMRLKHFITTPIFYANGPPHIGHLYTALLADALNRWKLLKDGNIDSDNLLFTSGTDEHGLKIQRSATAAGYDPQSYCDNISGKFKDLFHVFGIHPNDFIRTTEVRHKEVVNHVWVTKELNKRGQIQLGKYEGWYSTIDECFYASDEVETLSGQTSTISKITGSVVEWVQEENYIFPLSKYLGTVRNWLNNCDVIRPKIYFPEALQHASIEGNLSLSRDRKRVTWGIAVPNDESQTIYVWFDALMNYLTVSGIFSNKKRINWPPTCQIVGKDILKFHAVIWPAILLALDLPLPKRIFVHSHWLVNGTKMSKSVGNVVDPFSVSKSLSEEGLRYFLLRQGTPQNDANFIMSKAVDVINTDLVNNVGNLLQRSLIEKLNPSQTYPTFYPDSFHNSLLELGEPLVKSVSCLAELYEEQFDELMIYKALEMLMEVMRQANGFFQFYEPWKELDNRKMSSLLYVCYEVLRICGILLQPVVPHYADHLLNRLGIKKNERGLDNVKFTIDSKYSGKPLGEYNGPIMDRIMCKTGTV
>tr|A0A4D6LT85|A0A4D6LT85_VIGUN Uncharacterized protein OS=Vigna unguiculata OX=3917 GN=DEO72_LG5g291 PE=4 SV=1
MPNDQEALGQLEDPHGSDGHNNSTGSGRHDDPNGSSELDNQDGLARSTTKTGRVGWVNDLNGPNGPNDPNGRHRSNDPNGPDRPDDSNMPICLTILIGLTGPMI
>tr|A0A0S6UQD0|A0A0S6UQD0_9BRAD Sulfopyruvate decarboxylase subunit beta OS=Bradyrhizobium sp. DOA9 OX=1126627 GN=BDOA9_0130710 PE=4 SV=1
MSKANLLDRRQVVSTLLANRKDVVAIGGLGASTNDMCAAGDHARNFYLWGGMGGAAMIGLGLALAQPKLPVLVITGDGEMLMGMGSLATIGLQKPANLSIAVLDNEAYGETGGQTSHTSAAADLVGIAKACGINDSRAVTTMADVEAFAKAVHDVSAGPRFANVKIDSANLERILPTRDGTYIVNRIRADLGFQPI
>tr|A0A3R0JE73|A0A3R0JE73_SHIDY Anaerobic sulfatase maturase OS=Shigella dysenteriae OX=622 GN=DL723_09995 PE=3 SV=1
MHVTAKPYSFQCNLKCDYCFYLEKESQFTHEKWMDDSTLKEFIKQYIAASGNQVYFTWQGGEPTLAGLDFFRKVIHYQQRYAGQKRIFNALQTNGILLNNEWCAFLKEHEFLVGISIDGPQELHDRYRRSNSGNGTFAKVIAAIERLKSYQVEFNTLTVINNVNVHYPLEVYHFLKSIGSKHMQFIELLETGTPNIDFSGHSENTFRIIDFSVPPTAYGKFMSTIFMQWVKNDVGEIFIRQFESFVSRFLGNGHTSCIFQESCKDNLVVESNGDIYECDHFVYPQYKIGNINKSELKTTNSVQLTAQKKRISAKCLKCVYKPICNGGCPKHRITKVNNETVSYFCEGYKILFSTMVPYMNAMVELAKNRVPLYHIMDVAKQMENN
>tr|A0A1V2IM99|A0A1V2IM99_9ACTN Uncharacterized protein OS=Frankia sp. BMG5.30 OX=1834514 GN=BL254_17150 PE=4 SV=1
MSAEPIILLDPATDAGLIVAATEHTFACQMQTFAWAAANTNLPASERAIARAMTGRARAVSPLTQAQMNAQLHQTGGSR
>tr|A0A7V4T793|A0A7V4T793_9DELT Sigma-54-dependent Fis family transcriptional regulator OS=Desulfobacterales bacterium OX=2044940 GN=ENK36_05755 PE=4 SV=1
MENILVVDDEKNYTMIIGEILQEEGYTSITASSGMEALDILNNEIIDLILTDVKMPGMSGIQLLEKIKELNPDIPVIIMTAFGSVEKAVDAMHRGAYTFILKPFENQALIAHIAKALSVYKIVQENSRLRDAISSRYSFDNIIGKSRPMQEIYEIIKKVAPSNASVLIEGESGTGKELVAKSLHYNSPRRNKPLIVVNCSAFAETLLESELFGHEKGAFTGASALKKGRFEISDQGTLFLDEIGELPISLQTKLLRVLQEKIIERVGGTLPIPVDFRLIAATNKNLEDEVKNGNFREDLYYRLNVVKTVMPPLRERSEDIPLLIKHFMDKYTNEQQLESRVSGITSEAVKILCDYQWKGNVRELENILESCILLGSGDMITPSDLPLQVRQNTSSFLDLDGIPQDVGLAETLTAVERRMIRRAMKLSGNVQTKAAQLLGIGKSGLNQKLKKFNLG
>tr|A0A6G1U079|A0A6G1U079_9BACT Virulence protein E OS=Prevotella copri OX=165179 GN=F7D73_08405 PE=4 SV=1
MNINIFNGYQSTEPAIIKFQQMVDIIRGDKQLAELTKRYRITHQREYKSQCYCFSVTCVFQGGKAKKDIIEVTGIGFSDFDHVPKEKLAELCAKLREDRHTLFFHITASGEGLRVLYRYEMKPGMTLEEQMKFYPTAFLHGNQYFSDLLGVEYDEHCCNLGRLMGAAYDPDAFFRPNAEPFSYDWLVARQQEKTLQDNATARLRREVKKIDRLYEDKLAKELEQEMKTYVAGSKNEYVSCLAYKLNAFGFSADAALEFICQEFPDYERPKAVVDSCYRQTEEHGKRKHELQNRRHEAGKSASVNDIIRFLGEHVDLRYNQITMRVEYRMKEESDGEDSSTPGLWQIINDRAVNTLWSEMSKTNRAAVQDFFRVIESNYVQPFNPFTDYLGSLPEWHEGDTDYIQQLADSVTIKGGEEQQKLWACYLRKWLVGMLAGWTLDDVVNNVIIVLIGAQGSGKSTWIAMLLPPELRQYFYTKTNASRLTKDDLLVLATYGLMLCEELDTMKPSELNQLKAAVTMLTIDERAAYAHFAEHRPHIASFAATGNNVQFLSDPTGNRRWLPFEVESIQSPREHPFDYPHIYAQALHLLRSGFRYWFTQQEIIELNLHNHKFEAPRLERELVALYFAHPTEEQHGIFMTASRALQIIGAGISQKLSAVYVGRAFCELGFRKVRVNHCWGYLVIERDGDMIKAQQVRLAMEAEDDYSQQETDPDLPF
>tr|A0A806DEP4|A0A806DEP4_HAEI6 Catalase OS=Haemophilus influenzae (strain R2866) OX=262728 GN=hktE PE=4 SV=1
MSSQCPFSHLAATNLTMGNGAPVADNQNSLTAGPRGPLLAQDLWLNEKLADFVREVIPERRMHAKGSGAFGTFTVTHDITKYTRAKIFSEVGKKTEMFARFTTVAGERGAADAERDIRGFALKFYTEEGNWDLVGNNTPVFFLRDPRKFPDLNKAVKRDPRTNMRSATNNWDFWTLLPEALHQVTVVMSDRGIPASYRHMHGFGSHTYSFWNEAGERFWVKFHFRTQQGIKNLTDAEAAEIIANDRESHQRDLYEAIERGDFPKWTLFVQIMPEADAEKVPYHPFDLTKVWPKKDYPLIEVGEFELNRNPENFFADVEQSAFAPSNLVPGIGASPDRMLQARLFNYADAQRYRLGVNYRQIPVNRPRCPVHSNQRDGQGRVDGNYGSLPHYEPNSFSQWQQQPDFAEPPLRINGDAAHWDYRNDDKDYFSQPRALFNLMNAEQKQSLFNNTAAAMGDAPDFIKYRHIRNCHWCDAAYGEGVAKALGLTVEDALKARDTDPALGQGGLL
>tr|W7JTJ0|W7JTJ0_PLAFA Uncharacterized protein OS=Plasmodium falciparum UGT5.1 OX=1237627 GN=C923_00937 PE=4 SV=1
MSLINKKNKENHNLIGKEEKIENDNTQDIKDNVYSSYSNDNNKYDNNNNTYDNNNNKYDNNNNNFNINTNYLMNICPLFYSFMIFFNQLNSRKKLMKIINIIDEEKCLDKDENEINKKILSSICHGGVWDELVTLYDPIYSSNYESFINRKKNDYNKIYDKPIEMNKNGQDMQSKGNYTTTKNSTTNYNNIQKNDLNKKFVDATTGNTYSDRITAQSYIHDNNDENNNIHNYIDEIDDMDNVHNVVNSCGVHLNDVHSFQKDREDNSSYSYRRNEHMSNNIDTICGSKNLLLNHKGTNQDNNIFERNKENVSNSSYNYINENNTFSEKNFSTCSILKRRNVYHNKDYRYCFSTSQQNDGKYLEQNKSNVLHNDDYNDYYNDEYNDDYYDADNVDVFHYINKNKSNSIISNNYPCDNTYNQNTNLNNDNCKTKNNINMPLNINYPYGISKDEMIHFKNYPYNYNDKYDFDEDISSLMKNLKTDDYTNDDIINIKKKKKKGSLINNKNITDITTYTNSSSSLYNKNNNNKNNNNNYYYTNTKDNFYYNYNQNYDIPKKTYDNISTSCEPNHYMKNSSNNSSHHHSVYEGRYTFNKLNKTNKYMYNSFLPNKQQSFFNNNYNNNYNNNNYHCDYSKFDSEDLIWKYYNNPSNNRNHIKNIHNLEKKYEHNINLASKVSSATWLIYLYELKRASFFINYYFYHLHLFIYFKNYFINYQKNYKLFQNNKWIILKRNYEKQKKKEKYWDMINMKEPEINVHTTCISKKLNDIKAKNVLNNNDHMNKEDKQKNVIDQENNNKQKSNKTHYDIFKRDMHEIIKCTVQNLNYCIDALFEKTKGDIYSLPFKIDKKNKNKNKKINNNNNNNNNNNNNNNNNNNNSNSSSCSSSCCCFNNTTNISPQLNNIHSFLNNKNCKQNNINKDSMTNSYGLILIEGKLIFVKFLYICIDKEKFWDESFLCRRDIRTVIHVKALDVLFISKNKLKKKIKKNIKKKAKNEKDNNLNNIINQNICNNDKKDIYFDIEQNLCTNNKSSQEFSSSNTSNIDNQFLSDDIIFCEQKNNLLKDSKLTHQQTYDINTNLQNNKNHFEEKISMYNNTHKKNDHYVNDDIINLWKCKQEKELSNNFIYNNKNNYIGILMEQNSNQDIFFKNNSKFIIKKNYIDQNNEHMDNMKTYQNDQTDMEKKKYNDENIFSINPCNFVTRINVKTIYVSGKHIHDDLKGTLLQKIDIKKEFKNDDEMNTFLQNQKDIYDEEIYCLRIISRNEIMRYKELIKIMKKGPYYYKNAKNILNNLNNLNNFNTPLQQTVPLCNFCGIKGMCNINTKHYKMSSIQEHVKNKFYTFMYHIFYKYKPKNQGGNIHNNNNNNNEDHLICNHSSKFKHINKEKRNKELPTNYENNIFNHTIVTSKDDQHNCLSDTNYRDNNLSDQCKNYSFHNIYNCDDHENKSELKNNREDKNDHDMYNIVEDIKHTQRNNQYNYKDIKVDNHYDNIIHMDKEKNIEKINIKSNYTKNNSEQYVNKIENFNDKKCESQNNIINNNNNINNINNNIKTELLHQNEINKNCINNNSTFPIKDKQIINNSKGIKNNILSEYYKIKKRQKSIDKISKLYKDEIKKKNNNDFIPHNKKIMRINNTINCLVGQRAQTNFLFLKKNHLNTTTENITTKIVTGAQNNNLNNVSLKKNNSGQMEENNTNDISYVPTFRKFQESKK
>tr|H6AA47|H6AA47_PINCO Tubulin_C domain-containing protein (Fragment) OS=Pinus contorta var. murrayana OX=1115831 PE=3 SV=1
QVYRSLTVPELTQQMWDAKNMMCAADPRHGRYLTASAMFRGRMSTKEVDEQMLNVQNKNSSYFVEWIPNNVKSSVCDIPPKGLKMASTFIGNSTSIQEMFRRVSEQFTAMFRRKA
>tr|A0A7V8T8F4|A0A7V8T8F4_9GAMM Nuclease SbcCD subunit D OS=Pectobacterium versatile OX=2488639 GN=sbcD PE=3 SV=1
MRIIHTADWHLGQYFYTKSRAAEHQAFLHWLIAQVEQHQVDAIIVAGDIFDNGSPPSYAREMYYSFVVALQRTGCQLIVLGGNHDSVAMLNESRELLACLNTQVIACASDDPAQQVILLETRQRQPGALLCAIPFLRPRDVLTSKAGQSGDEKQLALQEAITAHYLQCYQLACQKRDELGLPLPIIATGHLTTIGATASESVRDIYIGTLDAFPAQAFPPADYIALGHIHRPQRVTQSEHIRYSGSPIPLSFDELNSEKSVCLVSFAPDTPAQVEILPTPVTQPMQLIKGSLSDIEQQLTTFQNYQGEKPVWLDIEINTQDYLSDMQKRIQAMTEHLPVEVLLLRRTREQRLQAITQQDKETLNELSVHDVFERRLATETDMEDGRQQRVRTLFNQVIDELENSEPAQ
>tr|E2ZKL4|E2ZKL4_9FIRM Alkaline phosphatase family protein OS=Faecalibacterium cf. prausnitzii KLE1255 OX=748224 GN=HMPREF9436_02217 PE=3 SV=1
MKREDHVMKENKISRRSFLKFGAAASAAGMMAAAPVAANAAQPDADAAADEENCLLGLFQKPKYIFLFIGDGMGTAQIQSARFYKGTVDNNGAVTEADLSFTSFPTVGSVTTYDSTSFCPDSASTATSIATGHKTESGVINMCPWTRDVPYETIAEKLHAQKGYKVGIISSVNIDHATPAAFYAHQKTRKNYYQIGVELANSGFEYFAGGEFQKVNGDGAGPNNHEVAAQAGYNVVTTQAGAAALTAGAGKTLIIAENLADGKAMNYAMDAAAGEWQLTDYVKKGIELLDNPKGFFLMTESGKIDWACHANDAAASIHDVLEMSNAVQAAVEFQQKHPNDTLILVTADHETGGMAIGYKTTNYDTFLTNLAHQKMSYAKFDSTYVQNYIANKTPFEAAMQDVKANFGLTLPSDPDAANAGKLLLTDYEVQNLRTAYERTLKVGSASQKDMSQQDYEMYGTYIPFSMAICHTINHKSGMDHTTYAHTGAMVNVYANGVGAEKFGGVFDNTEIYHKLADLTKVK
>tr|A0A8A6LC47|A0A8A6LC47_SARS2 Surface glycoprotein OS=Severe acute respiratory syndrome coronavirus 2 OX=2697049 GN=S PE=4 SV=1
MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFHAIHVSGTNGTKRFDNPVLPFNDGVYFASTEKSNIIRGWIFGTTLDSKTQSLLIVNNATNVVIKVCEFQFCNDPFLGVYHKNNKSWMESEFRVYSSANNCTFEYVSQPFLMDLEGKQGNFKNLREFVFKNIDGYFKIYSKHTPINLVRDLPQGFSALEPLVDLPIGINITRFQTLLALHRSYLTPGDSSSGWTAGAAAYYVGYLQPRTFLLKYNENGTITDAVDCALDPLSETKCTLKSFTVEKGIYQTSNFRVQPTESIVRFPNITNLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNYNYLYRLFRKSNLKPFERDISTEIYQAGSTPCNGVEGFNCYFPLQSYGFQPTYGVGYQPYRVVVLSFELLHAPATVCGPKKSTNLVKNKCVNFNFNGLTGTGVLTESNKKFLPFQQFGRDIDDTTDAVRDPQTLEILDITPCSFGGVSVITPGTNTSNQVAVLYQGVNCTEVPVAIHADQLTPTWRVYSTGSNVFQTRAGCLIGAEHVNNSYECDIPIGAGICASYQTQTNSHRRARSVASQSIIAYTMSLGAENSVAYSNNSIAIPINFTISVTTEILPVSMTKTSVDCTMYICGDSTECSNLLLQYGSFCTQLNRALTGIAVEQDKNTQEVFAQVKQIYKTPPIKDFGGFNFSQILPDPSKPSKRSFIEDLLFNKVTLADAGFIKQYGDCLGDIAARDLICAQKFNGLTVLPPLLTDEMIAQYTSALLAGTITSGWTFGAGAALQIPFAMQMAYRFNGIGVTQNVLYENQKLIANQFNSAIGKIQDSLSSTASALGKLQDVVNQNAQALNTLVKQLSSNFGAISSVLNDILARLDKVEAEVQIDRLITGRLQSLQTYVTQQLIRAAEIRASANLAATKMSECVLGQSKRVDFCGKGYHLMSFPQSAPHGVVFLHVTYVPAQEKNFTTAPAICHDGKAHFPREGVFVSNGTHWFVTQRNFYEPQIITTHNTFVSGNCDVVIGIVNNTVYDPLQPELDSFKEELDKYFKNHTSPDVDLGDISGINASVVNIQKEIDRLNEVANNLNESLIDLQELGKYEQYIKWPWYIWLGFIAGLIAIVMVTIMLCCMTSCCSCLKGCCSCGSCCKFDEDDSEPVLKGVKLHYT
>tr|A0A6B9XTV0|A0A6B9XTV0_PICSI Uncharacterized protein OS=Picea sitchensis OX=3332 GN=orf05555 PE=4 SV=1
MRCYGHWNVMVPHPAQQIFESHLLQVYTVFHNFYKLAAIEWGMPAIMNSPCLAIDFFLPVGEKTLHSADHTPLCGCNSLCHSYLFESRVSFFSYYSPQRAV
>tr|A0A2A4QF02|A0A2A4QF02_9GAMM Uncharacterized protein OS=Gammaproteobacteria bacterium OX=1913989 GN=COB83_09745 PE=4 SV=1
MLKIIVGFIIVIILTGGVVTPSIEWINKVFHVKNGGIYLSIAFFICYFFLLAFRLIKKK
>tr|A0A418RSL3|A0A418RSL3_9GAMM Antitoxin OS=Methylococcales bacterium OX=2304002 GN=D0528_03225 PE=3 SV=1
MINEVNTAVFQQNLGEMLNQVQYRHDSILIKEDGKPVAALVDAQLFDRIRRFKNRFDTLSNQIANAYESVPQEDGLNEIDAIVSEIRHSQF
>tr|A0A510B6M8|A0A510B6M8_9POAL Photosystem II reaction center protein L OS=Avena longiglumis OX=4500 GN=psbL PE=3 SV=1
MTQSNPNEQNVELNRTSLYWGLLLIFVLAVLFSNYFFN
>tr|A0A2D5H536|A0A2D5H536_9PLAN Antibiotic biosynthesis monooxygenase OS=Gimesia sp. OX=2024833 GN=CME31_26170 PE=4 SV=1
MFCLNVILTLKDAADAEEIQGLLTEACRLSRTEPGCLRFDVYQSEGEPATFVLVEHWESEDAWQTHREAEAYTQIYQPQILPRVERVPYRMKMLLE
>tr|A0A7L7BQ76|A0A7L7BQ76_9ENTR Alpha/beta hydrolase OS=Enterobacter sp. RHB15-C17 OX=2742619 GN=HVX06_10740 PE=4 SV=1
MFSKLAYSTLALTVSLGTVISCQAEATGTDFATAFDHPQQINAGDLNVGYVDIGPKNGQPIILLHGWPYDIHSYAQVAPALAAKGYRVIVPSLRGYGTTRFLSDKTPRNGQPSAMAKDVVNLMDALNIKQAVFAGYDWGARTADIVAALWPERVKSLVSVSGYLISSQQIGKQPLPPKAEVQWWYQFYFATERGAEGYAKNTHDFARLIWSQASPDWKFSDATFDASAKSLDNPDHVAVTLSNYRWRLGLEKGERKYDSYEQKLATLPNITVPTITIEGGNNGAPHPAPQAYAGKFTGKYEHRTFGKTVGHNPPQEDPQDFVNAVVDADKL
>tr|A0A7N0VAI1|A0A7N0VAI1_KALFE Uncharacterized protein OS=Kalanchoe fedtschenkoi OX=63787 PE=4 SV=1
MENAEAFEASTAPLSLHDFFERMRQPAAAEFVKAIKSFVVSFSNKAPNHERDSAAVQDFLSNMERAFREHPLWAGCSVEELDCAGEGLEKYVMTKLFTHVFASLPDDLEVDRQLSDKMALLQQFIRPENLDIKPNFRNEASWLANPPQLHSNLLYIQRYRHHPRLVAEYAYYFTNMLSVESFITNINAKALSMDETEFEMNMESARALNLGLSADTSDMSDQNEQNLENTSNKEAVEIKQGFSNFKTDHVTRPPPSVSKSGKIELRHTKAESSIRKIPSMSDLENKGAFMLLNENRLSRVFQEYPYLFSQVGDLTLDDVESLLNNYKQLVFKYVSLAKGKGSEPLPPPFISMSNSQSQRATPADAERESIEEPVAEKTNNRNEANSWTDEGSIEVSQVPELNSPDYKMPEVSSAQVEADHDHDNS
>tr|A0A3N0D1M1|A0A3N0D1M1_9FLAO NAD-dependent epimerase/dehydratase family protein OS=Sinomicrobium pectinilyticum OX=1084421 GN=ED312_22910 PE=4 SV=1
MKVALIGATGFVGTNILKELVDRGHKVTAIARNPERSEIKGYHVTPVKADVLDTDRLAEILAGHDAVVSAFNPGWANPNIYDDFLRGAKAIQEAVKKSGVSRFVVIGGGGSLYLKPGLQVVDTPEFPAEIKSGADAARLYLEEIRKEKVLDWVFFSPALEMHQGITTGRTGKYRLGLENPVFDKDGRSVLSGEDVGVVIADELETPKHHRERFTAAY
>tr|A0A6P0AN79|A0A6P0AN79_RHILE Siderophore-interacting protein OS=Rhizobium leguminosarum OX=384 GN=GR232_16200 PE=4 SV=1
MDNNQFKDQASSTPGIERIRHDTRRRLLTVESVVDITPSMRRVVLAGDDLADFISLGADDHIKIFVPVADGSEERRDYTPRRYDNIERRLTIDFALHEAGPVTKWAIDADPGDRLEIGGPRGSAVVSKTVKRWLLIGDETALPAIGRRIEESGAGTVVTTIAAVTGPLEEQTFETSAELHLHWAHRPLSQATSATALLKLLSTVDIQPETFIWVAAEASVTRDIRAYLLERGCPLGWIKASGYWVFGKADTTEKFG
>tr|A0A7K4JQ10|A0A7K4JQ10_GEOCA GT252 galactosyltransferase (Fragment) OS=Geococcyx californianus OX=8947 GN=Colgalt2_1 PE=4 SV=1
VATDHNVDNTTAILKEWLKNVQNLYHDVEWRPMEDPQSYPEEIGPKHWPSSRFTHVMKLRQAALRAAREKWSDYILFIDADNLLTNPETLNLMIAENKTLVAPMLESRSLYSNFWCGITPQA
>tr|A0A673XYG3|A0A673XYG3_SALTR Gamma-tubulin complex component OS=Salmo trutta OX=8032 GN=LOC115201020 PE=3 SV=1
MSEFRIHHDVNELLSLLHVRGGDGAEVFIDLLQKNRTPYITTTVSAHSAKVKIAEYSKTPEDFLRKYDELKSKNVRNLDPLVYLLSKLSEDKEVITYISHLITVLCYVPITFVCNRMPKKGLKRLLMRQQVQPLLSLQPSAEVTRKMLRDRHNKKNPTQPNPVFPNWVYDRPALIGDFITGATAAGDPEVAIGTMPLPAQEQALVDDLLFVLVGVDGRDITAQPVLGRQNRSFIVDPTLDMSIKELVNRILPVASYYSTITRFTEEKSSFEYGQVNHALTAAMRTLMKEYLILVTQLEHLHRQGMLSLQKLWFYIQPTMRTMEILASIASSVDKGDCMGGSTLSLLHDRTFNYTGDSQAQELCLYLTKAASVPYFEILEKWIYRGIIKDPYSEFMVEEHELQKEKIQEDYNDKYWDQRYTIVQHRIPSFLQKMADKILSTGKYLNVVRECGRDVTCPDAKEVLYTLKERAYVEQIEKSYYYASKVLLDFLMEEKELVARLRSIKHYFLMDKGDFFVHFMDLTEEELKKPVDDIVPPRLEALLELALRMSTANTDPFKDDLKIDLMPHDVITQLLRVLAIETKQEKAIINADPTEVALSGLEAFSFDYIVKWPLSLIINRKALTRYQMLFRHIFYCKHVERLLCNVWISNKTAKQYALHRAKWFATAFALRQRMLNFVQNIQYYMMFEVMEPTWHIMEKNLKSASNIDDVLCHHTSFLDNCLKDCMLTNPELLKIFSKLMSVCVMFTNCMQRFTQSMKLDREMNRLSLEHGTMEGPPTQSERTEEQEKKRLTSKFLAEHVDALQSDACFEATVSKFDSNFSTLLLDLLDKLSVYSTNDCEHSMINIIYRLDFNGFYTERLERMAIERSQKAAA
>tr|A0A5S5C3J5|A0A5S5C3J5_9BACL Uncharacterized protein OS=Paenibacillus methanolicus OX=582686 GN=BCM02_107172 PE=4 SV=1
MTESNYKNWPTDEHARWIRMGHFFGKTLMEEVKGHAKERIDPASSVEERLAAEKAIRDTLYGFMMLLDGVIDSPIDQDHGVEFALVARVFNQDTREYLEEIELAPDGDGLCMGIHMWEDGEFE
>tr|M5BKI9|M5BKI9_THACB Septin homolog spn3 OS=Thanatephorus cucumeris (strain AG1-IB / isolate 7/3/14) OX=1108050 GN=BN14_01267 PE=3 SV=1
MAYRHRGRKNAKKGIQFTLMVVGASGTGRTTFVNTLCESEVLAPKIADNAETAHVEEGIRIKPVNVELEEDGTRIALTIVDTPGFGDNIDNEFAFQEIVGYLERQYDDILAEQSRIKRNPRFRDNRVHALLYFIPPTGHALREMDIELMRRLSPRVNVIPVIGKADSLTPSELKGFKKRVMEDIEHYGIPVYNFPYDVEEDDEETIQDNSELRAMLPFAIVGSGDEVEIDGQPVRARIYPWGVVEVDNPKHSDFSRLRSALLNSHLMDLKSLTDDVLYETYRTEKLSRMVHADNTDDSILPEDLATQSVRLKEEQLRREEEKLREIELKVQREINEKRQELLAKEESLRNLETRLAAQGSQAEF
>tr|A0A6P8KJN9|A0A6P8KJN9_DROMA synapse-associated protein of 47 kDa isoform X6 OS=Drosophila mauritiana OX=7226 GN=LOC117143185 PE=4 SV=1
MFSGLTNQFTSLVGAVKGGAGDEDVPAPTGDAPAAAPAASTSVEATASSAVDPEAAAAAGGEGLEGEEAGKSGWLGSAKGWLGNASIPSMPAMPSMPSMPAMPAMPSIPSIPGLRKGAGADGAEGAEGAVAGEGGAAASGAVSGGEDDDKSRYISATEGADSHPASGGGTPTGDEGQIGQGKGDEVKITTKVTQQAKHFGSFLSSAISKAGSKIKETVKDNTILDSFNKEQEAFIKGQGGVGNGAAPWIGHANEAKIKEEILGLSQDRRNFVRAPPAGVDFEFSYDTAYPTAIAIMAEDKALETMRFELVPKIITEENFWRNYFYRVSLIIQAAELGTLGADGVGQASSGEDANEVATKEKKSKTAQPAKGDSSVKAIAEQPKAVIEPEAQESDVQAAKSKAKAQAGKELGQKISESEFVSDDFQASSESDLAEIQDGMRKLGIDSMTQQALAPTDEEQWEKDLEAELKDYEVVDEGGTGGGGRRKGRKAGEDDTEADEDEPTISNLRTRSTNNDWEEYADLIEDTDDLKTLKCLKRTMLGYP
>tr|A0A3S6F4D4|A0A3S6F4D4_YERET Fimbrial protein OS=Yersinia entomophaga OX=935293 GN=PL78_17300 PE=4 SV=1
MNKTLLMALLFTLPGVALAATSNNTIKFQGEVAEQTCQVDINGSANTPIVLLPTVASASLSGPNSVAGKTNFTINLTGCNVASKETKISSVFQGMNVTPAGNLGNTGTAQFVAIQLLDSTDRPVILTSGPVEVPGITLATGATSASQDLSVQYISESGNAVAGSVMASAQYAITYP
>tr|A0A2S1PWN1|A0A2S1PWN1_ORITS 56 kDa type specific antigen (Fragment) OS=Orientia tsutsugamushi OX=784 PE=4 SV=1
GDRDFGIDIGNIPQAQAQAANPALNDDQRAASRIAWLYNCAGIDYRVTDPHNPIGPMVLIPTLLTIPKGNPNPAGNPPQRAHQPANFAILNHDLWRHLVVGLAALSNANKPSASPVKVLSDKITQIYSDIKPFADIAGIDVPDTSLPNSASV
>tr|A0A126E925|A0A126E925_9RICK Uncharacterized protein OS=Rickettsia raoultii OX=369822 GN=UQ52_02815 PE=4 SV=1
MNSTNQLQNNSLTNSWLKLGILSLGFAGLYSIILVVLRTPQLSSFFPNPHIFKSALIIHVNLSVLIWLLSVTASVWGGETSLRGEAKPRRGNLMKQYKIPEIAKFSTFARNDVFRLYPKLAFLATLLIAISPIAGHNPVMNNYIPMLENIVFILGLSLFGVTLLLYAINILYFFDWTNLNSLVNFTVLSTIIMFILSFVCFGWSYNGLQNIMQIIPIEIEFYYELLFWSGGHLLQFIYTQILIFIWVSLFRELIARELKFQKFYLFLLYLNFIFGILTLFGHIFYDIIDGAFKVFYTNHMKYLGGIAPVLCLIGMGVELVWVFVIPQLDREIQTKYQNNVIDLAIKLRDDTVTINDRVIKTILLCSITLFLLGGLIAMNITGINVAIPAHYHGSIVGISIACMGCSYLGIGRYQRHCERLKRAWQSHEVIQKLPRLPRRYFVPPRNDNIINFTFYLLTFGQILHILGLAFAGGYGVMRKDPNSVMPMSAKLLMGMMGGGGFIAIVGGLMFVYICVKVMFFKSIKLAHE
>tr|A0A159KM53|A0A159KM53_9HEMI Cytochrome c oxidase subunit 1 (Fragment) OS=Corythucha sp. BOLD:AAG8847 OX=1793449 GN=COI PE=3 SV=1
SWIIRXELSQPGPFIGNDQIYNVIVTAHAFIMIFFMVMPIMIGGFGNWLVPLMIGAPDMAFPRMNNMSFWLLPPSLTLLIMSSMVENGAGTGWTVYPPLSSNISHMGPSVDLAIFSLHLAGVSSILGAINFITTVINMRPSGMSLEKTPLFVWSVVITAVLLLLSLPVLAGAITMLLT
>tr|A0A4U5P1N6|A0A4U5P1N6_STECR Uncharacterized protein OS=Steinernema carpocapsae OX=34508 GN=L596_013647 PE=4 SV=1
MKQRKNALWEMQKLIDCLQSTKWLNVCCYLETDVTSFSINHVMVGPNLTLILDVCLLQVRYRYFDIRYRTAVYWKRNSCFSAFPTYFDKQK
>tr|A0A3E4WUS6|A0A3E4WUS6_PHOVU Uncharacterized protein OS=Phocaeicola vulgatus OX=821 GN=DXC16_05095 PE=4 SV=1
MDDKTGALEKLKAIMAKAEQVEMSSVKIGDIIYVPLDEEDGLILKDGYKDRNKYIVIIGFTPEGVAIGALLINSEIDSSKRSEELLDCQYPLMVRNYRDILDYDSWLDCSDIFELSKLKITEKNGKLKGCLISEDRERVMQFLRETEVFDNATKRRYGIIK
>tr|A0A1R4HFW4|A0A1R4HFW4_9GAMM Secretion ATPase, PEP-CTERM locus subfamily OS=Crenothrix polyspora OX=360316 GN=CRENPOLYSF2_460006 PE=4 SV=1
MYDGFYNLSKKPFQLNADSDFFFNSAVHKRALAYMRYGLTQGEGFVVVTGKPGTGKTMLVKELVNSLNSNDITIGIMVSSQVGADDLLKIISATFGLPYDGEDKATLLTRIERFFIQQAVDGKRVLMIVDEAQNLPKDSLEELRMLSNFEMSGKALFQTFLIGQLQLGETLFLPEMEQLRQRIVATYQLKPLEEEETKNYILFRLEKAGWQQTPQFEEEVFNAICAYTQGIPRRINTLCDRVLLFGYLDELSVIGLNAVNKVIADIEEEASIVTDEFHDVVALSASSNVSYSDGFSPQMEERIVALEKTVENLRNVLGRERALLRKAILIQLDMNEVYDDLGE
>tr|A0A5D4XIW7|A0A5D4XIW7_9GAMM Integration host factor subunit beta OS=Luteimonas sp. XBU10 OX=1132694 GN=ihfB PE=3 SV=1
MTKSELIEILTQRQAHLKADDVDLAVKSLLEMMAGSLAHGERIEIRGFGSFSLHFRPPRTGRNPKTGDAVALPGKHVPHFKPGKELRERVTAVIPLPAEE
>tr|W7W772|W7W772_9BURK Transposase OS=Methylibium sp. T29-B OX=1437443 GN=Y694_04599 PE=3 SV=1
MAMLAKIRRMHLRDGLSIREVARRTGLSRNTVRQWLREEGVTEPKYPERSTASVLDAWAEHLEAALRADAHRPVRERRTAKALFEQIRALGYAGSYPRVVVWVRRWRERQASAPRRAAFVPMSFELGDAFQFDWSCEYVFVGGLRRRLEVAHTKLAASRAFWLTAYPAQSHEMLFDAHARAFEALGGVPRRGIYDNMKTAVDKVGVGKARSVNARFQAMCSHYLFEPEFCNPASGWEKGVVEKNVQDRRRQVWREAGERRWSDLASLNAWLAERCRQGWEETAHPEWSELSVADVLQDERTRLMPCPKPFDGYVEQPVRVSATALVHFQRNRYSVPTRWVNEVLSLRAYPEAVVLVAEGVEVARHTRSFERELTFYDWQHYIALVQTKPGALRNGAPFKAMPEVLQTLQRHLLRHAGGDRVMAQVLAAVPVHGLEAVLVAAEIALEAGRPSAEHVLNVLARLKDGAPALRELTQPAPTLKEEPRADVQRYDSLREAQQP
>tr|A0A6J6Q2H3|A0A6J6Q2H3_9ZZZZ Unannotated protein OS=freshwater metagenome OX=449393 GN=UFOPK2366_01453 PE=3 SV=1
MFEWNEEQQMIRDAVRRFVDDEVRPHVEELEHGDLAPYDILRKLFATFGMDSMARDRFAKQIAREKSVAEMVARGETPPAPAAERSGGDGGGAAMSLIPIIELCRVCPGMVTAMGVSMGLTSAAIMSKGTIAQKERWALDLLTMDKVGAWAITEPGSGSDAFGSMRATARRDGDDYILNGSKTFITNGPYADTTVFICKLDDGGPIEQRKVVSFVLDRGIPGFVQSKRLRKMGMHSSPTGQLFLDDVRVGRDRLIGETEDQPAGGREGAKATFQQERSGVAAMALGIIEECLQLSVAYAKDRVQFGKPIGEFQLIQDKLARMEVARINVQNLVFRTIEMSAAGKTMSLAEASAMKLYSARAATEVALEAVQVFGGNGYMSEFRVEQLARDAKVLQIYAGTDEIQITHIAKELLRA
>tr|A0A1X0ZA11|A0A1X0ZA11_PSEPU Hcp1 family type VI secretion system effector OS=Pseudomonas putida OX=303 GN=hcp PE=4 SV=1
MPTPAYIAIEGKTQGNITKGAFTSDSVGNIFVEGHEDQILVQEVNHRITVPTDPQSGQPAGQRVHGPLIFTCALNKAVPLLYSALSSGEMLPNVELSWYRTSVEGTQERFFTTKLIDAVIIDIDLEMPHVQDKDNSNFTQFFKVSMAYRGIEWEHITASTAGADDWRKPKETAV
>tr|A0A6I3MVR7|A0A6I3MVR7_9ACTN Uncharacterized protein (Fragment) OS=Actinobacteria bacterium OX=1883427 GN=F2940_05525 PE=4 SV=1
MNTSPFRSVLIVCGVATFGLVACGAQESQPQPISFSLAASTRSASDVVGAPESSNSNSKIMAPNYSVEYVVDGKLADLGQEASSWRAQTNVVASDADLKKIATALGVKNTEVQTSSGDPYLSWYYSGAVSSEASSPPSVGMSDSDAETTAPDRTVVSPPVPENVPTKEEAQSIIQKMMAKMGVDVDDANIEINGDEYGIWATAWKTFDGMRSPMSWNIGLGANGAVTYAQGNFLKFDRGANYPVVNTTEAVKRLGNPRYSGWFGYGAVSSKEVLAKDSATIPSQEVVVQTIRLTKVSASLTPVIASDKTLWLLPSYEYLTSDGYTVSTLALDDKYIDQTPTSTVPDNDVNVTTPDAGSGSSGSSTGGTPAVDGGVVEPAPAPQTILPTEKDAKALVGLNEDEAVKIIEGNGWTYRIGSRDGEQFMLTEDYSASRLTLGIE
>tr|A0A067Z5I4|A0A067Z5I4_GLUOY Uncharacterized protein OS=Gluconobacter oxydans DSM 3504 OX=1288313 GN=GLS_c18640 PE=4 SV=1
MMTMNNEERDLIARFVARVGGGPQVTGPGQPPAAPLPPIDPEADRFIAENFQKYPEARYRITQMAVVQEAALAQAQNRIRQLEFQLQQAQQQLAQVQQSGGSKPGLFGGLFSGGNRPQQSAPPPGWGSQAAPPPNFMPQQQYAYPPGYQPGMFQRGGSGFLGSALTTAAGVAGGMMAANALEGLFSDHHGAGGDAAGGWGAGGDTIINNYGSDASASDPFGGAGTDAGSFSDSDFGGGGDAGGGGDFGGGDGGGGGFDDMF
>tr|A0A4P7HFW9|A0A4P7HFW9_9NOCA 2-C-methyl-D-erythritol 2,4-cyclodiphosphate synthase OS=Nocardia sp. CS682 OX=1047172 GN=ispF PE=3 SV=1
MRVGIGSDVHPIEAGRPCWMAGLLFDGDDGCAGHSDGDVAAHALCDALLSAAGLGDVGAVFGTGRPEWAGVSGAAMLKEVRRLLDEAGFEIVNAAVQVIGNRPKIGPRRGEAQQVLGELLDAPVSVSGTTTDGLGLTGRGEGVAAIATALLQACR
>tr|A0A5S4G1W4|A0A5S4G1W4_9ACTN HAMP domain-containing protein (Fragment) OS=Nonomuraea zeae OX=1642303 GN=ETD85_40700 PE=4 SV=1
MSDPAVGTTRSAARTKRSRGPGEVGEPELRQLLAGLTAVRDGDFRTRLPDDADGLLGEIASVFNGMVDQLSLFTSEVTRVAREVGTDGRLGGQADVPAVSGTWKDLTESVNAMAGNLTDQVRSIAQVTTAVARGDLSQKITVHARGEILELKNTVNTMVDQLSSFADEVTRVAREVGTEGQLGGQADVKGVAGTWRALTDSVNFMAGNLTDQVRNISQVATAVARGDLSQSITVSARGEILELKNTLNTMVDQLSSFADEVTRVAREVGTEGNLGGQATVRGVSGTWKDLTENVNVMASNLTNQVRSIAQVATAVARGDLSQKITVEAKGEVAALAQTINTMVDTLGAFADEVTRVAREVGTEGQLGGQARVPNVAGTWKNLTDNVNSMADNLTNQVRSIAQVTTAVAKG
>tr|X0VWK7|X0VWK7_9ZZZZ Uncharacterized protein (Fragment) OS=marine sediment metagenome OX=412755 GN=S01H1_51379 PE=4 SV=1
MAYSLTFGDVAENHIGNQQIGSICHDGFTKAELLYAKTQFEVKGCTCELVELHKDV
>tr|A0A439RUF8|A0A439RUF8_9HYPH PhzF family phenazine biosynthesis protein OS=Mesorhizobium sp. OX=1871066 GN=EOQ56_14750 PE=3 SV=1
MLTRNYLLYDVFTTERLGGNPLAVVLDSKGLDTAAMQAIAGEFNLSETVFVLPPDNPKHRARIRIFTPDHEMPFAGHPTVGAAIALAEMAGDGDTAGIFVLEENIGPVRCAVSKHAGASFAEFDLAKLPEPLELSADPEAIGAALGLGPHEIGFENHRVSFWSAGVPYVTIPVADLEAAARIKLDNQAWSELAPRKSDWALASPYVYCRETVNHDSAFHVRMIVPGNPSYEDPATGSAAAAFAGAIMHFDGPREGVSQRWIEQGLEMGRPSRIRLELNVEGGKLAAARIGGHAVKVAEGKLFV
>tr|A0A669NV56|A0A669NV56_PHACC Membrane associated guanylate kinase, WW and PDZ domain containing 2 OS=Phasianus colchicus OX=9054 PE=4 SV=1
SKFRPHKEGEVPGVDYIFITVEDFMELEKSGALLESGTYEDNYYGTPKPPAEPAPLLVNVTDQILPGATPGAEGKRKRNKSVSNMEKTGIEPPEEEEEERPVVNGNDVTVTPESSEHEDKSTGVSGEVSSTQPCPAPGYTQPEEAKEDMDVTKQTKPEENDDLGPLPDNWEMAYTEKGEVYFIDHNTKTTSWLDPRLAKKAKPPEECKENELPYGWEKIDDPIYGTYYVDHINRRTQFENPVLEAKRKLQQHNMPNAELGTKPMQAQGFREKPLFTRDASQLKGTFLSTTLKKSNMGFGFTIIGGDEPDEFLQVKSVIPDGPAAQDGKMETGDVIVYINEVCVLGHTHADVVKLFQSVPIGQSVNLVLCRGYPLPFDPEDPANSMVPPLAVMERPPVVVNGRHNYETYLEYISRTSQSVPDVTDRPPHSLHSIPADSQLDSTFPPPAHDDNVSMASSGATQAELMTLTIVKGAQGFGFTIADSPTGQRVKQILDIQGCPGLCEGDLIVEINQQNVQNLSHAEVVDILKECPVGSETSLIIHRGGFFSPWKTPKPVMERWENQGSPQTSLSAPAMPQNIPYPPTLHRSSFPDSTEAFDPRKPDPYELYEKSRAIYESRRPDYKELDVHLRRMESGFGFRILGGDEPGQPILIGAVIAMGSADRDGRLHPGDELVYVDGIPVAGKTHRYVIDLMHNAARNGQVNLTVRRKVLPTGEPCPENGRSPGSVSTHHSSPRSDYATYANSNHAVSSSNATPPEGFTSHSLQTSDVVIHRKENEGFGFVIISSLNRPESGSTITVPHKIGRIIDGSPADRCAKLKVGDRILAVNGQSIINMPHADIVKLIKDAGLSVTLRIIPQEELNSPASAPSSEKQSPLAQQHSPLAQQHPLAQQQSPVTQHSPVAQPTLPQPLQLQGHENSYRSEVKARQDVKPDIRQPPFTDYRQSSTDYRQPPLDYRHPPVMDYQQPPPLDYRQPPLLDYRQHSPDTRQYPLSDYRQPQDFDYFTVDLEKGAKGFGFSIRGGREYKMDLFVLRLAEDGPAIRNGRMRVGDQIIEINGESTRDMTHARAIELIKSGGRRVRLLLKRGTGQVPEYDEPSSWSAPAATSPGLQEVALSLDDIISPLSSSHIAPPSDPSHQISPEPTWDIKREHDGRKPKELSVNGHKKKRLGEQRERSASPKKADRSKHDEPSWKGYSEGKTKVTDGGRLTSESRAVGHSVMMEAGAREHVCAGSSDEQFGRKGHLHPISTRSTNTTVRKATVSPGPWKIPGSDKLPGVLKSGTSAMSR
>tr|A0A516QZI1|A0A516QZI1_9BACI Octanoyl-[GcvH]:protein N-octanoyltransferase OS=Bacillus sp. BD59S OX=2499213 GN=lipL PE=3 SV=1
MSNSRSILSQPEWRIVDQSSLGPTFHALQSFAMDDTLCTSIGNGQSAATMRSWVHHNTIVLGIQDSRLPHLEEGISFLKENNFNVIVRNSGGLAVVLDEGVLNVSLLFQETEKGIDIDLGYDTMWHLIQEMLKDYDVTIEAKEIIGSYCPGSYDLSIRDQKFAGISQRRIRGGVAVQIYLCATGSGSERAALVRDFYNLAIQGEETRFTYPEIVPSTMASLSELLGETITVQDLMMRLLKTLQQFAPKLTPSQLTIDEIPLYETNLQRIIDRNNKALGLEK
>tr|A0A7C4ETP5|A0A7C4ETP5_9DELT Uncharacterized protein OS=Desulfomonile tiedjei OX=2358 GN=ENV54_02205 PE=4 SV=1
MLIHDKKTFGLGLLLFITFLIVLGIMFSPFFSGENALKASDKLFNSIAKGSTYYIPDLLKKAQAMGGAKFEATIKLKSDELAQKAQKVLTASGSQVSAAGAQLNVKGALGDVLSAALKDSDSMFHNRDSEVAQRYGFSGREALFVWWSLLKEVEKELTRQSKFKDAAFVSTVVKKGVEVGYNFFGIAPESALSKAGILTFALVFYVVYTLWWGIAILFLFEGLGLEMKAGAKKEV
>tr|A0A0Q7FUL9|A0A0Q7FUL9_9GAMM 3'-5' exonuclease OS=Acinetobacter sp. Root1280 OX=1736444 GN=ASC84_16360 PE=4 SV=1
MRLPVLVFDIETLTDLKSGAHLYGLDLPQDDLEQALAKLRRQESGMDFQRLALHEIVCISGLWIDENGVMKLFSFSREHYTETEILQKFLSIFDKRHPTLVSWNGSQFDLPVILFRAMYHGLSAPSLFDQGEIDTQKRYNNYQNRYHNRHVDLMDVMAMFNGRHFQKLDDVAHLLGYPGKRGISGYFVPEYVNTQQWLKLTSYCEGDVLNTWLIFLRWALLKGQISLQDHRLWIQASIHYLQGQTQQHEFLNVWRETSQRTEFTQADFSSTPD
>tr|A0A5K1MIC2|A0A5K1MIC2_ACIBA Uncharacterized protein OS=Acinetobacter baumannii NIPH 615 OX=1217641 GN=F978_03533 PE=4 SV=1
MKIKEMPKIKVRNQVALSPLLHKGGMHETEKPRAQHRRNRQDTKQQLKKGVW
>tr|A0A7L3CZ56|A0A7L3CZ56_PLUSO MX protein (Fragment) OS=Pluvianellus socialis OX=227228 GN=Mx PE=3 SV=1
QGEEHTLYNQYEEKIRPCIDLIDSLRALGIEKDLALPSIAVIGDQSSGKSSVLEALSGIALPRGNGVVTRCPLELKLKRIPATQAWKGKMCYRNSSVELQDASEVEKAIREAQNVVAGTRGAISGELISLEIWSPEVPDLTLIDLPGIARVAVGDQPKDIGEQIKMLLKKIIGCKETLNLVVVPCNVDIATTEALKMAQEVDPSGERTLGILTKPDLVDRGTEESIVNIIRNLVVPLKKGYMIVKCRGQQDIHDKLALTAAIQQERRFFENHKYFSLLLDEGKATIPCLAEKLTNELVRHIIKTLPTLENQVREVLQKTLQDLQKYRRGTPRTESERLIFLTDLIKLFNQDISQMMRGEEQLYGNEVRLFTKIRREFRTWEVTLLESAAKVKNNVPSKVWKYEDQYRGREFPGFNNYRTFEDIIKEQIIELEEPAVEIMSNVIGLVEEKFMEVTKRHFANFHNLNRAAKTRIEHIREKQAEEAERHIRTQFKMERIVYCQDDAYINDLQSVKQEGATKAGNEKGLLVGSVSNQETSFVQEMGASKRLCNQIPLIILSSALHDFGDQLQTTMLHLLQEKDKLSHLLQEDSEAAKQRTYLSQRVNRLTKACQYLRDFTLV
>tr|A0A1H2WI61|A0A1H2WI61_9ALTE Ribonucleoside-diphosphate reductase OS=Marinobacter mobilis OX=488533 GN=SAMN04487960_104173 PE=3 SV=1
MSTAALAEPQSPASSLQVIKRNGTLVSFDPAKITVAVTKAFLAVEGDQVSGSARIHDSVARVTEQVVQAISRRLKAGGKVHIEDIQDQVELALMRAEEQKVARAYVLYREAHAQERASRAAPVEAHPSLTVKQRNGQVAPLDLGLMKFQVEQACGGVDGVDAAAVVNEALKGLYDGIPEADVLSALVMTARGRIEQEPGYSQVTARLLLEQLRMEAAGALALPLQASLPSVYPQALTAFVHAGIRYELLDEALAAFDLERLGAALKPERDGQFGFLGLQTLYDRYFLHWQGARLELPQVFFMRVAMGLALREDDPNARAIEFYNLLSSFDYMASTPTLFNSGTRHSQLSSCYLTTVGDDLEEIYGAIRDNALLSKWAGGLGNDWTPVRALGSHIKGTNGNSQGVVPFLKVVNDTAVAVNQGGKRKGAVCAYLESWHLDIEEFLELRKNTGDERRRTHDMNTANWVPDLLIERMRRDQDWTLFSPSDVPDLHDLYGNDFRTRYEEYEARAARGELPLHKTVPAKQLWRKMLTVLFETGHPWITFKDPCNLRSPQQHVGVVHSSNLCTEITLNTSAEEIAVCNLGSVNLAAHINGGELDVQRLERTVNTAVRMLDNVIDINFYAVPQARESNLRHRPVGMGLMGFQDALYQLKLAYSSPEAVEFADLAMEQISYFAIRASAELAAERGAYPTYEGSLWDQGILPIDSIQLLADARQDGDLSVNTEARLDWTPVRELVAKHGMRNSNVMAIAPTATISNIVGVSQSIEPAYQNLFVKSNLSGEFTVVNPSLVAELKAEGLWDNVMVNDLKYFDGSVQQIERIPAEIKARYATAFEMDARWLVEAGARRQKWLDQAQSLNLYMAEPSGKKLDALYQLAWERGLKTTYYLRSLGATGAEKSAPVQAAPAPQVCSIDNPDCEACQ
>tr|W6TAY6|W6TAY6_9LACO Terminase OS=Lactobacillus fabifermentans T30PCM01 OX=1400520 GN=LFAB_00210 PE=4 SV=1
MIEYVDQVLSGQVLAGQKIKWACERFKRDLSRSKDDSFPFYYDEDKAAQAVKFIELMPKTDGSQLTMQPFQKWIISELYGWREKTTGNRRYDRAFISMARKNGKTYLASGMAANGLLRERQPARNRQVLFVSNALKQAKLGYDMLSSGLRQVRKQSKYMRQRIKVQKQAITDLETDSQALALASDTSTLDGYAGTTVILDEWHEAKDRKVYNVLKSGQAQEDNSLLAVISTSGLNLNVPMHAEYDMLTDVLKGKTEADRYFVAIWELDDREEVYDQANWIKANPLFSEPHVKQRMTEKIKADVDLAIKQNNLIPILVKNFNMWLQASEDSYISADDWAAGKLAKVPDLHNRDAYIGIDLSKSNDLTAVSWLVPIGNGQFYCDSHSFVGTKYGLDSKIKRDGIDYRSMERAGECSITRLDSGVIDYDELFDYVQNLVGKYNWKVKAIAYDPYNAQTLITKFEKLSYPLFEVRQGTKTLNIPTRNFRDQLYDDKIKHNGNKILAYAVNNAILKVLNNGWQLDKARNSNRIDPIAALINAFVAGMDYYQESEAQQHAEDYYKTATAADLF
>tr|C5LGB5|C5LGB5_PERM5 Subtilisin OS=Perkinsus marinus (strain ATCC 50983 / TXsc) OX=423536 GN=Pmar_PMAR016847 PE=4 SV=1
MPSRVDYDLRNRRIDEKESKIEEILLTGSNGDNDDDAMEHKDNDIVIIKLEACIIDSFVDGEGDGAVIVAVIDSGIDYTHPDLVDNIWINKDEIPGSDNIDNDANGFIDDIYGWNFVHNTNNIMDDNGHGTHIGGIIGAKGSNNIGATGIAWDVAIMPLKFLNADGIGRVSDAMRALDYAIQMGATISQNSWTCHKCDDTTTTNYNAIKMAIQKAGNAHGSINFYATPVDIKNAIMNSVDTDPNLEMKCLSSGILNAYRALNTVIHNNNKNKKKKNDHLHKSKTSSSVINIIISTTTTMNDDYICGDAFCNKYVGSVMTVSDE
>tr|A0A2E9Q7Q3|A0A2E9Q7Q3_9SPIO Aspartate transcarbamylase OS=Spirochaetaceae bacterium OX=1898206 GN=CMN76_04620 PE=3 SV=1
MFDQSKIHPLLKQPVVSRDGIRGIERPRHLLESIPEDAEPLRSLAGMHIVSARQFDRNKILQLGRLAASYETQPDLIHPPLRGKILVSAFYEPSTRTRLSFESAWHRLGGDIMSITDPNTTGIAKGESLADVGEMFNNYGDVVVLRDSSEDSVYAMLDSLRIPIINAGNGIDEHPTQALADIYAMLKWRPDFGSGNLSEEEKITIGVIGTPNRMRTVRSLLLLLSLFSDSIKKVYIVNPASDVLDKEQDEELRAAGLKLEVVHKLRDILPEIDVVYINSIAWVGDSYETLTGDIKLTSESQLKQGAIILHPLARGEELDESLDGTSHNWYFSQARGAVFIRMALLTCLVHRINLVVDSPVEQPDSN
>tr|A0A520KE24|A0A520KE24_9ARCH Uncharacterized protein OS=Candidatus Verstraetearchaeota archaeon OX=2250257 GN=DSO09_03215 PE=4 SV=1
MKKSRIIPIMSIIFTLLLILIIIINQVQWQNHEYYYELRRTIGLPSIAIGTNYEGTRNPLLDIFVRALYDVPGGHDYVVSSSFIDTPLKLKDFFERIPGFNMTVMREGK
>tr|C4NUU6|C4NUU6_ECOLX Aminoglycoside O-phosphotransferase APH(6)-Id OS=Escherichia coli OX=562 GN=strB PE=4 SV=1
MPPVFPAHWHVSQPVLIADTFSSLVWKVSLPDGTPAIVKGLKPIEDIADELRGADYLVWRNGRGAVRLLGRENNLMLLEYAGERMLSHIVAEHGDYQATEIAAELMAKLYAASEEPLPSALLPIRDRFAALFQRARDDQNAGCQTDYVHAAIIADQMMSNASELRGLHGDLHHENIMFSSRGWLVIDPVGLVGEVGFGAANMFYDPADRDDLCLDPRRIAQMADAFSRALDVDPRRLLDQAYAYGCLSAAWNADGEEEQRDLAIAAAIKQVRQTSY
>tr|A0A1Q7EW51|A0A1Q7EW51_9CHLR DUF218 domain-containing protein OS=Chloroflexi bacterium 13_1_40CM_68_21 OX=1805084 GN=AUH33_06650 PE=4 SV=1
MTNDDGDLAEFPEVAVVLGGGMSASGVPSPSTAARAHAASQLAHHRPSLAVIASGSHGDDPAPAKSEAAVMADLISKAGVPRERIFLEERSRDTIGNGVEVAARYLAKIEPRPLYLVTSPFHLERALVVFRNVLGFAWQVQAVAAEQTDDDLARANSETTFLQETFAFFEGIRPGDFPAVEKRYRARQVR
>tr|A0A519RZM3|A0A519RZM3_9SPHI Ankyrin repeat domain-containing protein (Fragment) OS=Pedobacter sp. OX=1411316 GN=EOO86_13990 PE=4 SV=1
MNIYQIEQAYIQGKSLDEIKELYQSEIVGITDEQQVEVWEQVCGFANVEMIDYLIAQGWRTAGVENRNGDTLLHFLATPLHSYDYFISEKRVFECTKKLLEAKVSPLRKNSEGNTALMLGAKVAYTEMLEAYAEIGAKIDFTDRKGNTTLHILAEYSYSAVSDFETALERLMIHQRESNFDENNQRQVQVRHELEWRHNVTKARFNQFITFAIVAREFGIDPFQKNNEGQTAVDIAIYRKSKSIGAILKGVDFDDQERASLYFNAGGMDVHQACVHKDVEALTALITLGENLNEAYDKENDKHNGMTPLAIAMMEHSYEITDLLLKNGADATLRDSKSWHPFRYLFTPNSSVNVNFERFKEKTFQRILKAYID
>tr|A0A429HFY5|A0A429HFY5_9ACTN YceI domain-containing protein OS=Streptomyces sp. WAC 05379 OX=2203207 GN=DMH26_27780 PE=4 SV=1
MGLTARIRTRDGWAVSHAVVTVTDMTGTQVLRLEADTEGAVRDADPLAPGAYTVIVTAVGYAPAAASAIVTASGRAEVGTVTLARQGGTELPPPGPWTVDPAHSSVAAVAQHLGISSVHGRFTRFSGAIEIAPDDIAKSRVDAVIRADSIDTGNGMRDGHLKSPDFLDVERYPEITYRSTGLTAAAGTDRWTVHGELTMHGVLRPVDLDLAYLGTGADPWGGTRAAFRATTELHRDDFAMNYNQVVQAGIAAIGTTLKVELDIQAVQGETLPQA
>tr|A0A7K9HDP6|A0A7K9HDP6_9AVES NCF2 factor (Fragment) OS=Bucco capensis OX=135168 GN=Ncf2 PE=3 SV=1
MSLVETIQLWQEGVCAADRKEWRAALDAFTAVQNPPAKICFNIGCIHLVLGKLAEAEQAFTRSISCDKHLAVAYFQRGIVFYQRQNHEKAIEDFKEALTQLRGNHLIDYKILGLRYRLFACEILYNIALVYATMEDWKKAEEHLALAVNMKSEPQHNKIDRAMEAILKQKVCELVTISAGKLFRPNEKQVAQLEKKDYLGKAMVVASVVDKDDFSGFAPLQPRASGPPPRPKTPEILRALQGQPHRVLYEFIPETAEELQVLPGNIVFVLKKEKDNWATVMFNGKKGIIPCNFLEPVELQNKLHIQEETPLEDEIPESPHSTAPEKPRRPAPVYHLQVVEAAVTSPYILKVHYNYTVTLQVKPGLSYMELLDLVCKKLELQPEHTQLRYKPVESQALVTLSMENLDVAWSQSKGNCLTVWCEITEGEGFLLPQEATLEMGPTQVVAQYSYEATQPEDLEFQAGDVILVLSKVNEDWLEGQCNGKIGIFPSAFVQ
>tr|A0A368E3B5|A0A368E3B5_9PROT SDR family NAD(P)-dependent oxidoreductase OS=SAR116 cluster bacterium OX=2024888 GN=DBW67_07180 PE=4 SV=1
MFRYDNKIVVVTGCGSIAAGIGNGRAMAMAFARQGAKVIGTDRNLEAANQTLEMVHQEGGLMEVVGLDSLDDMSVLAFFEDVLAREERIDVLVNNVGQSEPGGPYDMALETWRGQFALNIDTAFMAIKHVLPSMRARKNGAIINVSSVAGMRYIGKPQVGYAAAKAALVQMTKTTAIIEAPHNIRLNCVVPGLMHTPLVQVLAQKYAGGDTEAFVAKRNNQVPMGRMGDAWDVAHAAIYLGSDEASYVTGTELVVDGGITATTP
>tr|A0A7L4KQA5|A0A7L4KQA5_9CORV Kinesin-like protein (Fragment) OS=Callaeas wilsoni OX=1347786 GN=Kif2c PE=3 SV=1
AMDSRLCRNVHPGVIIKIQRSNGSIHKATVKVVNVEHSCVTVEWSEDGATKGKEVDINDVIAINPELLELPPADVKENVPLQDNVTLQKQKRRTTLSKIPAPREAVRGRSRMSAITESQCSFQEDEMAVDPCTSLQTRKYLLLPAGRTRASGLGCVPEASLSSVNGNTENHLPAARTSSSESPVRRRSNIVKEMEKMRSKREEKRAQISEIRIKRAQEYDSTCPNWEFARMIKEFRETLNCQPISISDPIEEHRICVCVRKRPLNRQELLKKECDVVTVPSKCVLMVHEPKQKVDLTKYLETQTFRFDFSFDETSSNEMVYRFTARPLVETIFEGGKATCFAYGQTGSGKTHTMGGDFSGRTQNASKGIYAFASQDVFLLLNQPRYRSQNLEVYVTFFEIYNGKVFDLLNKKAKLRVLEDGKQQVQVVGLQERPVGCAEDVIKMITIGSACRTSGQTFANASSSRSHACFQIILRRRGQMIGKFSLVDLAGNERGADTSSADRQTRMEGAEINKSLLALKECIRALGQNKSHTPFRESKLTQVLRDSFIGANSRTCMIAMISPGMSSCEYTLNTLRYADRVKELSPHDGGIDAQSQMETEEIETSTEGSGLQFSFSKDEEEELSPHIFSYREVMTQISEREEKVVEQLKELRQRMITELDYLLGMAEKPDYDLETFVSRAKYFVEDSSRNFLSVRETLDALGTAMQLEEQASKQIS
>tr|A0A2D9JC90|A0A2D9JC90_9BACT Protein translocase subunit SecA OS=Rhodopirellula sp. OX=2024855 GN=secA PE=3 SV=1
MSESSARETTNPNELDSSGVPLSSSSTEETGPDPXWTPPDPVLSEATALDPLAPNEPLEDAGNXVETTQEAVVRRSSDPSANKKKWTKASNWRPRMVRWQRXLARVNALESTLQAEDDQTIRKRSLALRYRAMAGEKLSEXLPEAYAXCREAGRRSLSMRHYDVQILGGIALFEGHXTEMQTGEGKTXTATLPLYLHSXVGKGAHLATVNDYLAKRDAEWMMPLFEMLGVSVGIIQTEDDQGGRRKSYGAAITYGTAKEFGFDFLRDRLXLRAQNRMQTEMLGSGDGGFSNSGDQVVMRGMHFXLVDEADSILIDXARTPLIIGSIEDTVRDQIIETYKWAAENAPXFELDEHFEIDDETKRYELTARGRSXVRALPKSDLVRTMGLVDMYEYIERSXKTHREFLLNRQYVIRPSEKDPNVDEIVIVDEFTGRLAEGRKWRDGIHQSIEAKEGVEXSVPTGQAARITVQDLFLRYPHLAGMTGTAATSAGELRKIYRTPVVRVPTNRPPQRIQLPSRVFGTLNSKFEAIAKEVEEXHATGRPVLVGTRSIXKSVLLSKLLDDLGXEHEVLNANXVERXAEIVAEAGGRGKVTVATNMAGRGTDIKLSNDVEQIGGMHVICTXLXXAARXDRQLIGRCGRQGDRGSYRQYLSLDDDILKGGYGAIKYEKLKKRGEATSGSVDRLAAMFHKAQRKVERRHFRDRMVLMHHEKERKXMQREXGQXPYXDTPD
>tr|A0A256Z8B1|A0A256Z8B1_9ARCH Uncharacterized protein (Fragment) OS=Candidatus Bathyarchaeota archaeon ex4484_231 OX=2012512 GN=B6U79_02805 PE=4 SV=1
MNKKLRLLSVFLLLLASFSPVVQAEASCTGSVRRWYSFRELAWGDMNSWADVDGNWVKDEQEIISPCILVSVTFGRGRVICIGDEGFLSNVLVNEADNLRLGLNIIAWLAEAEGNRHRVLFDSAHNEMQDIGSGDPWRGYSIFAGKLRKAGYTVEKNTA
>tr|A0A4Q8BRW3|A0A4Q8BRW3_9ACTN Xaa-Pro aminopeptidase OS=Streptomyces sp. CNZ288 OX=2512147 GN=EV377_6800 PE=4 SV=1
MDKPLARPHTGSHDLDVSAALHTFMGSAWAPSPLPSGVRVPGYDALAGRRARLSARFPGERLVLPAGELKVRSNDCDHRFRPHSAYAWLTGLTGEDQAGHVLVLEPAGAEGHEAALYVRPRSDRSTDEFYRDRRYGEFWVGRRPDLGEAAELTGLACRDLDDLAKLTAGPRPPARVLAGVDARTDGLFDRGPHSAAEPDRDAELGTYLAELRLLKDEWEVGQLQLAVDHTAAGFEDVVRALPAALRHPRGERWIEGVFQTRARAEGNGTGYETIAASGAHACVLHWIRNDGPLDPGHLLLLDAGVETDTLYTADVTRTLPLSGRFSRIQRQVYELVLAAQNAGIAALRPGARFRDFHRAAMAVIAEGLYDWGVLRITPEEALAPDSGLYRRYTLCSSGHMLGLDVHDCAKARASQYLDGVLEAGQVLTVEPGLYLQPDDETLPPELRGIGVRIEDDLVVTEDGARLMSDALPRDPDAVEEWMGTLLDGFRPGA
>tr|A0A068CJ75|A0A068CJ75_9PLVG Protease (Fragment) OS=Human immunodeficiency virus OX=12721 GN=pol PE=3 SV=1
PQITLWQRPLVTVKIGGQLKEALLDTGADDTVLEEINLPGRWKPKMIGGIGGFIKVRQYDQVPIEICGYKVIGTVLIGDTPVNIIGRNLLTQLGCTLNFPISPIETVPVKLKPGMDGPKVKQWPLTEEKIKALVEICTEMEKEGKISKIGPENPYNTPVFAIKKKDGNKWRKLVDFRELNKRTQDFWEVQLGIPHPAGLKQKKSVTVLDVGDAYFSVPLDEDFRKYTAFTIPSTNNETPGIRYQYNVLPQGWKGSPAIFQSSMTKILEPFRKQNPDMVIYQYMDDLYVGSDLEIGQHRTKIEELRQHLLGWGFTTPDKKHQKEPPFLWMGYELHPDKWTVQPIVLPEKDSWTVNDIQKLVGKLNWASQIYSGIKVRQLCKLLRGTKALTE
>tr|A0A2Y9SHQ2|A0A2Y9SHQ2_PHYMC Fibroblast growth factor receptor OS=Physeter macrocephalus OX=9755 GN=FGFR3 PE=3 SV=1
MGAPACALAFFVAVAVVMTGAVSGSPGMEQRVVRRAAEVPGPEPGPRELVFGSGDTVELSCPLPAGAPPGPAVWVKDGVALAPSDRILVGPRRLRVFNASHEDAGAYSCRQRPSQGVLCRFAVRVTDAPSSGDDEEGEDEAEDTAGAPYWTRPERMDKKLLAVPAANTVRFRCPAAGNPTPSISWLKNGKEFRGEHRIGGIKLRHQQWSLVMESVVPSDRGNYTCVVENKFGSIRQTYTLDVLERSPHRPILQAGLPANQTAVLGSDVEFHCKVYSDAQPHIQWLKHVEVNGSKVGPDGTPYVTVLKSWISESVEADARLRLANVSERDGGEYLCRASNFIGVAEKAFWLRVHGPQAAEEELVEAGEAGSVYAGVLSYGVGFLLFILVVAAVTLCRLRSPPKKGLGSPTVHKVSRFPLKRQVSLESSSSMSSNTPLVRIARLSSGEGPALANVSELELPADPKWELSRARLTLGKPLGEGCFGQVVMAEAIGIDKDRAAKPVTVAVKMLKDDATDKDLSDLVSEMEMMKMIGKHKNIINLLGACTQGGPLYVLVEYAAKGNLREYLRARRPPGTDYSFDACRLPEEQLTFKDLVSCAYQVARGMEYLASQKCIHRDLAARNVLVTEDNVMKIADFGLARDVHNLDYYKKTTNGRLPVKWMAPEALFDRVYTHQSDVWSFGVLLWEIFTLGGSPYPGIPVEELFKLLKEGHRMDKPANCTHDLYMIMRECWHAVPSQRPTFKQLVEDLDRVLTVTSTDEYLDLSVPFEQYSPGGQDTPSSGSSGDDSVFAHDLLPPAPPGSGGSRT
>tr|A0A0R1W6U3|A0A0R1W6U3_9LACO CDF family cation diffusion facilitator OS=Lactobacillus suebicus DSM 5007 = KCTC 3549 OX=1423807 GN=FD16_GL000874 PE=4 SV=1
MGGVFSGSLALLSDAFHNLGDSAAILLGYFAQLIGRHPETERRTYGYRRAEIIFALLNSIFLIVISVFLIFEAAKRFSHPQPINGELMLIVAVVGLLANLASAFLLQGGSKDSLNIKATYLHILSDALSSVGVIIGALFIWFTDISWIDPVITILVAIYICYETWPIIHQTLSILMQSSPELDYACIKKDIKQIDGITGVHHVHAWMIDEHRIIFSVHINLKDMKLSEVEPIYQRIETLLKNKYHICHITIQAEVERGIEETMFNTPADKATTSDEVE
>tr|A0A0B1R8M8|A0A0B1R8M8_9GAMM DUF262 domain-containing protein OS=Pantoea rodasii OX=1076549 GN=QU24_03595 PE=4 SV=1
MANDDKTLNLFPIDYPFETLCSRMESNPVKLKLNPDFQRKYKWDQDGWQRSSKFIESCLMRIPLPSCYFAEENDGNHIVIDGVQRLTTIQKFFNDEFSLEGMTTFKELEGKKFSELGSLRSELESTTIRCIVLRKENPKALIREIFSRLNQGAVKLSDQEIRHALYPGGFDDLLNELGGIEAIKNFGLAETTTVKRDSREPDEQVLRFFAFYDDGFAEHFNNTLKDFLDDQMETFSTLEEDRLNEMREIFKSSLQKCEKIFGDDTFTNPTVRRKRKGLVHYDILMPTIGKLSDEVVNDKAENIRQAWEDLCSSNEFKRTLSGGLQNKSSVIRRRDSWTKLLKEVTDGKD
>tr|A0A3E4PQR0|A0A3E4PQR0_9FIRM DUF3794 domain-containing protein OS=Dorea formicigenerans OX=39486 GN=DXC93_09950 PE=4 SV=1
MLNIYRQGKTFTDQFYVDEDYNVPDTKADIREVIESDAVMEEIDLKLVENYIRITGRLAFQVLYVADNSDNTLSSLEGKIPFEEMYYVDETLEETLFLKAAQTELTVNLIHSRKINVKAMAEVTMSSDSQVSEEVTTGIESGEQIYTKYQEKQILTLHTVKKDTYRIKEQLTISGTKESIGNILWKEVLSRRLDTRLEADTLKLQGELLVFCLYESVDGKTDWICENVPYEGQVECFGAEEGMYHQIYPILTDALLEPAMDEDGEMRLLGIEATLSMRFFLCTEEKIQILDDLYSLKTCCVPAYTQCKVENVLMQNHSKCKIAERLSLPEIKDDILQICYSDARIQVEQMTVQDTGIQIEGVLHIRFMYVRPDDQIPFALWQGMIPFSWLLESNEVQEDMTLDMMPSLEQLGISLLGNGEIEVKAVLAFRSFLRGKVTFRNIDSVEEKEIDYKVLEQRPGIIGYIVKEGDELWNLAKYYGTTKEGIMDINHMESEQLKCGDKLLIFKENASIL
>tr|A0A285F1R0|A0A285F1R0_9PSED 3-oxoacyl-[acyl-carrier protein] reductase OS=Pseudomonas sp. LAMO17WK12:I10 OX=1286371 GN=SAMN05660489_00338 PE=4 SV=1
MTESILVTGSSRGIGRAIALRLAQAGYDLILHCRSGRSEAEAVQAEVEALGRQARILQFDVTDRASCKAVLEADVEAHGAYYGVVLNAGLTRDGAFPALSEDDWDTVLRTNLDGFYNVLHPLIMPMIRRRAAGRIVCIASVSGQVGNRGQVNYSASKAGLIGAAKALAIELGKRKITVNCVAPGLIDTAMLDENVPVDELLKMIPAQRMGTPEEVAGAVNFLMSAEAAYITRQVLAVNGGLV
>tr|A0A1B9FWL6|A0A1B9FWL6_9TREE Nuclear RNA export factor 1/2 OS=Kwoniella bestiolae CBS 10118 OX=1296100 GN=I302_07512 PE=3 SV=1
MAPGTSNSNNNNSRGGRPTRGSNNARNPTGTPPIVKQLQTISGKAEREHSKSELTKKLHGEEMKEWIRKRVIADGVLDMSNLPNDPWLKENGILPPGHPNAPPNAGTVFWRIIEGVVQKGAGITVLTLSLANNNLEHLAQLSKLPLTLPDIRALDLSGNPIKNIGELDNLRAAGEKKGKATSGAGSLKSLVEIKLNDCFFRERMLQQPDGPNIYKHDILRRFPGLRILDGVELERIILPIDRKPKVRLTDEQKAAFVAKPFAFPCDVQGGFSEEGVKEAAMQFCAKYFTLFDNDRNALIPGYAPNALISISANTLPSRSAYQVEAQKTRANRPQPVSFEAWTNLPSRNFFRGITTIRARMDSLHNPADAERLLRWWNKVVPRTKHPLSDPERWCFDTWVLDGEGENTKLCLMIQGEFEEMPSGTYRSFSRTFILSPAPPGSLAANAGWPAIALSDTMTVHSYLGTFAFDERNRSLATHGVTIQPPSLPATAPVNGAATGNDALIAQMSQQTRMNAQFSTMCLEQNGWNFEAALKNFEEIKGSIPPEAFV
>tr|A0A1Q6Z6P7|A0A1Q6Z6P7_9ARCH Uncharacterized protein OS=archaeon 13_2_20CM_2_53_6 OX=1805020 GN=AUI07_07525 PE=4 SV=1
MKKSSDPADMVLREIEEMGKKSFIPSIGPLKGRILADIVREHKPRLILEVGALYGYSAILIAKNSPAHAQITTVEKDPKNARITQENVARAGLDDMIEVIQGDAIIILPELPGPFDLVFLDAEKIQYLAYLKAIEAKLHQGSVIVADNVGVFRDQMMDYLNYVRTTGRYRSRTVETLLEFSETTKDAMEISEKRY
>tr|A0A7Z6L1Z8|A0A7Z6L1Z8_9NOCA Low molecular weight phosphatase family protein OS=Rhodococcus sp. AQ5-07 OX=2054902 GN=CVN56_03915 PE=3 SV=1
MHVLFVCTGNICRSPTGERLARAYAAEAGVSGFTASSAGTRAMVGHPIEPTAARVLAGLGGDPTEFQARRMTTALASDADLILTMTESQRDKVLAMAPARLKRTFTLREAARLGSLADARTVEDLAAARPRFRAAEPEDVMDPMGKEENVFHEIGLEIADLLGPLLSRLRFGER
>tr|A0A5T8G289|A0A5T8G289_SALER Phage terminase large subunit family protein (Fragment) OS=Salmonella enterica OX=28901 GN=DQ454_26965 PE=4 SV=1
PPTTGILSLYNRGDRRRWYWPCPHCGEYFQPSMENMTGYRDSADPMVASEAARLQCPHCHKLTEPQQKRELNNRGVWLREGQHIDRDGNITGEARRSRIASFWMEGPAAAYQTWAQLVYKLLTAEEEYERTGSEETLKAVINTDWGLPYQSRRSLEARSSDALMARAEDVSKRTVPDGVRFIVATVDVQGGKKRRFVVQMVGYGAYGERWIIDRYNIRYSLRVNENGESQPVNPAAMPEDWDLLRTDVLDKEYPLAGDPEQFMPVLAMAVDSGGEDGVTDNAYAFWRRCKRRGVAGRVYLFKGDSTRREKLITKTYPDNTERSDRKAKARGQVPLYLLQTNALKDRIAAALEREEPGANYIHFPDWLGPWFYEELTYEERGADGKWKKPGRGNNEALDLMCYAHALVIIRKYEQINWEKPPGWARLPEKGAAKTTQPVGARRQEQHEGGEKAVKARKKKILPAWGGGSGGGWL
>tr|W9B5Y0|W9B5Y0_9BACI 3'-5' exonuclease DinG OS=Oceanobacillus picturae OX=171693 GN=dinG_1 PE=3 SV=1
MERFVVIDLETTGHSAVKRDKIIEVGIVVIEENEVVDSYGTFLNPGKSIPEFISSLTGIRDEDVKDAPTFEERAEEIAALFEDSYLIAHNVPFDMGFINAEFAAVGRELLQNPVLDTVELARVLYPKAPSYKLGQLAEYLGIHHEDPHRALSDAYVTAKLFLKLRERLDNLPYETITHLIRLEKMLKSDLFALLADRENELAFSTQEDPELETFQGLAFKKIKETKNTPQTRIGSYGDFLDAIYEEGGTLSQQMARYEKRTGQREMSETIYDAFQSRRHALIEAETGTGKSLAYILPAIYDAVISGQRLVISTFTTQLQTQLLEEEIPLIRNLLPFPFKVALLKGKSHYISLEKFERELLSTEKDNYDITLTKAMILVWLTETQTGDIDEVQLPSSGYLFFRRVSTDTEAHVDPQSPWFLRSYYQKARKAAQQADIVITNHALLATDIFNDYQLLPSYDKVIIDEAHHFEETASKHYGLKLDYMNMQYTLNQIGETNDPKFIGQLITKYRDFIEEEMIDRWDDLIIDAKYETDDLFRGIFQYVAEQNKHQKSLSDIGRTQYRFENSKEDTAKWDTILEMTNRLMFFLRDLIYILARLDQNLAKQYEDKYDKNEVEQYIEQLQQYMDHLESLFLAADSPKFVKWVEVETYGAKNAVYLYSEPTDISGFLSTDFFAKKESVILTSATLTMKNSFTFIKERLGLTDEEIETKKIPSPFSYKDQVQLMIPTDFPDIKHGNQDDFIYATCEAIFSLAEITSGRMLVLFTSYDMLKKSYYLLKEIMDTSTYALIAQGISSGSRSRLKKNFQTFDQSILLGTSSFWEGVDIPGEDLSSLVIVRLPFQPPDHPIFEAKSANLKENGKNAFMELSLPNAVIRFKQGFGRLIRSNTDRGIVFVCDSRIIQARYGKYFLDSIPEIPLTKDTTQQLMRKAEEWF
>tr|A0A0D3HJS1|A0A0D3HJS1_9ORYZ Uncharacterized protein OS=Oryza barthii OX=65489 PE=4 SV=1
MATKATTALLLLAAAAAALLCHVHVAVAAADSEPCDPSDITIATVKTGRVVGGLPEFQVTIGNECSCPEGDVVLSCLDGVPAGVDRSKIHTAGNDGLCLVNDGLQIVKGSPVVFTYAASAPISLAFDNASPRCQR
>tr|A0A481QYF4|A0A481QYF4_9PSED Pilus assembly protein PilO OS=Pseudomonas sp. DTU12.3 OX=2073078 GN=C2E19_18930 PE=4 SV=1
MRIPRLIVHEYLQGLGIPGLAGLALLLIAVAWALGGLLPGWQSLQHLSQQTQEATEYLAKVEDGSIAPPVVPQRQLDDFRNKLPAQPQATVAIDRIYALAAQEHITLARGEYALGVDPKTHLARYQILLPVRGSYPQLRRFVHALLGQLPAVVVEDLELQRKKIGDTDLNGRIRLTLFLSRS
>tr|A0A412E108|A0A412E108_BACSE Transposase OS=Bacteroides stercoris OX=46506 GN=DWY58_15645 PE=4 SV=1
MEPSIKDKYIILGFIFVAICMISFFITIIIAASFNQDNFVRLIVFVCSNLLGWLLYLSFQTVIFDTYEIYRIKFGKKEMKEITTETVALQEEEPQNTIEPVTQIAEGASSDAHPIELNIDPKRHEEIRSSYKDEQDKENERRIRMVVEYIHFYMPRIADEETVNHVCNEVSNWMNKNNYKPKPIKRRLTQDISNIPLRHFIWNIAERCMYKRYYNGDNRARFVKELFPREFSETDIATIKNFKVDPLKSPIPIDEPEDGKPDFHYPNGYLRKE
>tr|A0A448JZC9|A0A448JZC9_PASAE Membrane-fusion protein OS=Pasteurella aerogenes OX=749 GN=acrA PE=3 SV=1
MTKKRFFLLFIVIVALAAGYFYYGNKNDKTITYLTETVQRGNLQKTVIATGTIRAYNRVEVGAQVSGKIEKIYVTLGQKVKTGDLIAQIDSSTQQNTLDTATAKLASYQAQLKAKKVAYSVAKSSYDRLAKLYAKKSVSLDEFESAKDTLATAEAAIEEIDASIKQAEIEVNDAKTNLGYTKIVAPIDATIISIPVSEGQTVNANQTTPTIVQVADLSKVLIKPEISEGDITKVTAGMEVKFSTLSDPDKIYRATIDSVDPAMTTLTDNEYTESVSDTNAVYYYANVVVENPDNNLRIGMTTQNTITIADVKNTLLIPTMTLKKQNNKVFVNVLTTANQVEQREVQIGLNDDMNTQILSGLNEGEKVVSSQVAAGETVGTVRGPKMF
>tr|A0A1T0CT31|A0A1T0CT31_9GAMM Pilus assembly protein OS=Moraxella pluranimalium OX=470453 GN=B0680_01190 PE=4 SV=1
MTVQKGFTLIEMLVVLAIIAVMAMVAIPAYHAMMQRFESQSSKRHIAEAIRRAKIEANLHQKDIILCPYGVNEQCDRLGQVGLLVFVDKNSNNRLDDADIVSMKQPLDLRYGLLSMRVSLGRHYIKFMSDNAKPRGHIGNIRYCNTEQNNSLSHLTTINMHGVVTAKSGDVVSIDCG
>tr|F8J9Q9|F8J9Q9_HYPSM DNA (cytosine-5-)-methyltransferase OS=Hyphomicrobium sp. (strain MC1) OX=717785 GN=HYPMC_1709 PE=4 SV=1
MEKLKLLDLFSGIGGFSLGLEASGYFEPVAFCEIDTFPQSVLARRFVGVPIYGDIRALTAERLRADGIMVDAICGGFPCQDISVVVLDPFGGSGTTALAAETTERKWILIERDEEYAEKAMARIRDHVLGESHPAPAKKKRTPAALPKPTHEIAQVSLF
>tr|A0A1U8LF61|A0A1U8LF61_GOSHI tubby-like F-box protein 5 isoform X1 OS=Gossypium hirsutum OX=3635 GN=LOC107926834 PE=3 SV=1
MIQMSLKSIMRELKELKDGIGNMSKRGDQSKLWRSRTRSHVAPDEAPLESQLSEQSPWANLPPELLLDIIQRVEESETAWPARAVVVFCAAVCRSWREITKEIVKTPEQCGRLTFPISLKQPGPRESPIQCYIRRDRTSSTFLLFYGLVPSEGESDKLLLAARKVRRATCTDFVISLVADDFSRASNTYVGKLRSNFLGTKFTVYDSQSPCDSRIQSTARPRRRFHSKQVSPRLPACNYIIGTVTYELNVLRTRGPRRMHCILHSIPVSAIQEGGTAPTPSALPQSLDEQLSPLHSSKGKEPIVDIISPSIQATPVFSPGSREPLALKNKAPRWHEQLQCWCLNFKGRVTVASVKNFQLVAAVEPSHNVSPEEQEKVVLQFGKIGKDIFTMDYRYPLSAFQAFAISLSCFDTKPACE
>tr|A0A212IWF4|A0A212IWF4_9BACT Chaperone protein htpG OS=uncultured Dysgonomonas sp. OX=206096 GN=htpG PE=3 SV=1
MQQNGKIGVTTENIFPIIKKFLYSDHEIFLRELVSNAVDASQKLKTYASLGEFKGELGNLSVKVKIDKDNGTLTISDNGIGMTNEEIDKYINQIAFSSANEFLDKYKKDANSIIGHFGLGFYSSFMVSKKVEIITRSFKEGAEAVKWSCDGSPKYTIEAVEKAERGTDIILYIDDENKNFLEQGEIDKLLKKYCRFLPVPIVFGKKTEWKDGKSVETEEDNVINDTNPLWTRKPADLKDEDYKKFYQELYPFSDEPMFWIHLNVDYPFKLTGVLYFPQIKSNVDMNRNKIQLYSNQVFVTDSVEGIVPEFLTLMHGVLDSPDIPLNVSRSYLQSDQNVKKISNHITKKVADRLEEIFKNDRSRFEEKWDSLKIFIEYGMLTDDKFYERAQKICLLKNTDAKAFTFEEYKTLISSDQTDKDGNLIYLYASNKDEQYFYINTAKDKGYDVILFDGQLDVHMAGMLEQKFEKSKFVRVDADTIDNLIPKEDSKEVNLTDKQKEELNEAFTSQLPKIEKTEFIIDYKALDEKAQPIQITQNEFMRRMKEMSAMQTGMGFYGEMPNSFNLVLNIEHPLIKKIMGDIDNKDKEAVNLYATENRDIRQLIDLALLSNGMLKGEALNNFVKRNMENI
>tr|A0A1F0KNA7|A0A1F0KNA7_9MICC Long-chain fatty acid--CoA ligase OS=Rothia sp. HMSC066H02 OX=1739503 GN=HMPREF2999_09040 PE=4 SV=1
MKVFSTPAEVLVDPSLNLTSIVERHRADSSNPVLYRRQMSPGNWQPVRAQQFHQMVTDLAKGMIASGIRPGDRVGIMSRTRFEWTVIDFAIWYAGAISVPVYETNAPAQAAWALAHSEATAIFVEDEKLLARIAEAEEFASTTQEPMQLKHRWVIENGDLDTLSTRASEVSDEQLEQVRSAAGCDDLATIVYTSGTTGRPKGCALTHGHFLNLSANTRLVEPEIANSRNSSILFLPLAHVLARLIQVLALDAGLVIGHSPNIKNLASDLDSFKPTMLLVVPRVFEKVYEGAMAKAAKGGKFNKSLFERSTDIAVRWSQAKVEGRVPLKLAAQYALYDKLVYSKLRAALGGELRYAVSGGGPLGERLAHFFHAVGVQVVEGYGLTETCAPIAVGRINPYQIGMLGPLIPGAEGYIAEDGELLVRGVGVISSYYKNPEEDAHAFTEDGWFRTGDLARFDERGYLKIVGRKKEIIVTAGGKNVIPGIAEGHLRTSPLVSQAMLVGDEKPFISALVTLDPDTLPEQLEHLGLPRSLSIPEAAVHPAVRAAIQKLVDEANQLVSRAEGIREFRIMNRDLTEEDGYLTPSQKLRRAKILQDFSSYVDEMYGKVSDSTSDSLARLQEYAAEQSEKFAELREQAAERLHEYADQQTERLAELREQAAEKFEELREQAVERMQKPQEDKTETKEDAERSEKTNDDSEHETATPAKGVEAKKADTQRSEGEDS
>tr|A0A370IAZ5|A0A370IAZ5_9NOCA Uncharacterized protein OS=Nocardia pseudobrasiliensis OX=45979 GN=DFR76_102294 PE=4 SV=1
MKIALVGILAGLGLLTAAPAHAAALTPDYAQPPNGAGVDPGHNLTPVWSPIQVPALDDVDTASTTTITAHPYLAPWAHERVPIPAGTAVELRGAARVRIPEANGKTLVVNPNGHCYFDGPNAVSGDLTPTALTPVRIDTSAFQLTIEPTLYRH
>tr|A0A5K3FDK5|A0A5K3FDK5_9CEST Uncharacterized protein OS=Mesocestoides corti OX=53468 PE=4 SV=1
MDSVWLLLCTIAKLVFTIIWLMLVVIFRTGKCAVRTAAWVIVKCARFVGIRRKRIHFALMGETQGLVEETTGPIAPWRLVREGLDPEKYRGNYPVLRTHVPPVTTPQPRLVCRSFRATGTGRQVRGRPGAGEIVLRGSTKYRSFAALH
>tr|A0A4U1DEZ0|A0A4U1DEZ0_9BACI Uncharacterized protein OS=Bacillus kyonggiensis OX=1037680 GN=FA727_10130 PE=4 SV=1
MQTLERKGAGGVVVNPNRDKFLKEQRDLKQQYLGGARDNRTEMKSDPEYNNKNDTDISVGATGREVEEE
>tr|A0D4D9|A0D4D9_PARTE PUM-HD domain-containing protein OS=Paramecium tetraurelia OX=5888 GN=GSPATT00013372001 PE=4 SV=1
MKSQIVNNQRYYSCQDEDGNSTRMLRNSNNSVRILTDIQLPQQMSKSTQDAYEKGESEMKNNIFDNVIKENIIGFSIDIYNHYIIQCILEKGLSEHKSYVLRQVVENMDLFCYRKYAYKIVQACLTQFQNNQIIQYIIDNIKRLQFDQYGNLIISTLLDTIQNDEQFAQIINKLQIDKIKYHQYGCVILINMVTCPKANHVGPIINKLIQESIQLSKSQFSNYIIQKMLKERTIEQNKVLINEFLIPNFVELSCNKFGSNVCEIMVTKSLAYQLQNLWNLVIKQYDFYLFQESEITFEQ
>tr|A0A1S1CB24|A0A1S1CB24_9MICC Uncharacterized protein OS=Rothia sp. HMSC061D12 OX=1715161 GN=HMPREF2682_07995 PE=4 SV=1
MQYKARKHYETYYQKIAEAEKDPAVVKGENADGKTYILEKDKLAMVVGKNNEYIIFHQHDGNWSRLRPNGELELTYSDRAWVRVMPDGERIAVKASGNTNIAYHQGDVSEDIITSLKTPEVPAQVEGFASVPQKPVKPKKLGTVVGTK
>tr|A0A1Q4EHA6|A0A1Q4EHA6_9PROT Carrier domain-containing protein OS=Thiobacillus sp. 0-1251 OX=1895858 GN=BGP19_06145 PE=4 SV=1
MDTRQTLADIAIKEFQCDPEKIKEDASIKDLGIDSLGLLEFIFRIEEVFAIRVDNEDAEKVQTLTDIANLVDRLRTMAAA
>tr|Q48M18|Q48M18_PSE14 Type III effector HrpK1 OS=Pseudomonas savastanoi pv. phaseolicola (strain 1448A / Race 6) OX=264730 GN=hrpK1 PE=4 SV=1
MRISSSPSPALGSIVNQPTSGELAAETPLAKVSLTQSSAGGDQAFVQFGQANDNTSFFSDAEQSGSSLMSLLTRSSNSESTSSVDQDSDQVSPITSVLSTASASPAASASGPANAPSATDAAFLDNSEYSSPEALKRWDPMVAHLPPEEREQAAKELNRPIAAAWMAREHGPNADKAMAFINANPALKTAVDVGKDGGNADGKITNKDLKAFAKNMEKAADNADKDLAKYMEDNPGADPQSLEMVRSAAVMRANMPLATAADPHHAVGAPDKTDVDGNVSAEGLKALIKSNPGLSGTLKQSSNMWSQAGFLSQVDEAGLTGRKKAAHSPDQVFDASNMSEWIRKSAPKNGGQFASMLSDAATLNSVAGIDISKLNAQVFEKPKAYTGAQKAAVMIKLQQTQQSVIAGRDLRNTEKTEAGLNERIAQLQADPDVQEYLNKSIPEQERSLVSSDSALQKAVTEQVQNVNSGKALQTDLATADKAVGKHNPDPDYSGAITGLSAQLQLQKDLFPDAQVPTAQQVFNNQPDEVQTKIADSYVRNFSEGGALKQLLGQKKSDAGESLQTADNQKAAYESVLPADFVNGERESYTASTLSELQNSKKGRKLLEGKTDEEGGPSLAAQLAEQGIGGKAFNSVMGFASVSDRLASGDKLGAAQSIIDSSRLGAEAIKGGIDTGAKMMGREASAGLGRLGGQMIGRAVGLVAGEATGLAAGAALGAAIPVIGWAIDGAMALGFGISAIIDAVKKHKAQKAFDHNVDPVLDQFGIAKAH
>tr|A0A7C6ZKE3|A0A7C6ZKE3_9FIRM Ribulose-phosphate 3-epimerase OS=Syntrophaceticus sp. OX=2699755 GN=rpe PE=3 SV=1
MQIKIAPSILTADFSKLGDVVKELEKCGADQLHLDIMDGHFVPNLTFGPPVVASLSQITSLPFDVHLMVEHPEGLFSAFATAGAKSLTVHAEACTHLHRTVQMIKDLGIRAGVALNPATPLSFVEYILPDLDIVLIMTVNPGWGGQAFITTMCEKIRKLRMMLKDSGSPAELQVDGGINQQTVKSVVEAGANSLVIGSALLMERDWGQAIEQYRSLAVEAARDSWWCSS
>tr|A0A089X985|A0A089X985_STRGA Uncharacterized protein OS=Streptomyces glaucescens OX=1907 GN=SGLAU_22790 PE=4 SV=1
MSATPKSQLPVRGGDRKPARVRPYSLTGGRTRFGHVLLVETFVASTAALEAPEERRELTNGSLTTRVMPEMLAIVELCRRMRTVAEIAALLKMPLGVVRVLLSDLADQGKIRVYGTGTGHGTGRPNRALLERVLSGLRRL
>tr|A0A849PEY0|A0A849PEY0_9MICO Acetyl-CoA C-acetyltransferase OS=Calidifontibacter sp. DB2511S OX=2732509 GN=HK411_11245 PE=4 SV=1
MPEAVIVSTARTPIGRAFKGSLKDIRPDDLAAQIVQAALAKVPGLDPTLVEDLYLGCAEPWAEQGSNMARVVAVLSGLDHVPAATVNRFCASSVQTIRMAAHAIKAGEGDVFISGGVECVSRYADFAGAGGSKADWQNPKFADAIKRTEQIAQDNTTWTDPREQGLLPDIYIAMGQTAENVATSRGISRQRQDEWGVSSQNRAEKAIADGFFEREITPVTLPDGSTVSKDDGPRAGVTLEKVSQLQPVFRENGTVTAGNCCPLNDGAAAVVVMSDTKAKELGLTPLARVVSTGVSALSPEIMGLGPVEASKQALARAGMTINDMDLYEINEAFAAQVLPSADDLGMDFDKLNVHGGAIALGHPFGSTGARITTTLLNGLQSTDGTFGLETMCVGGGQGMAIIYERLS
>tr|A0A415DY63|A0A415DY63_9FIRM Amino acid permease OS=Emergencia timonensis OX=1776384 GN=DW099_13175 PE=4 SV=1
MDTKKHEGSFKKAIGPFSGISIVAGMVIGSGVYYLGSYVLERTGLSMGWSLVAWIVGGFITIVGGLCFAELGASMPVAGGQTVYLSKAYSPAFGFINGFSCFLLTGSGGVAALAMAAVTAYRTVFEISDIMVKVLAIAIILVLMVINLLGVREMTFYQNFSMVIRMVPILMIIIAGFVMGKESPDLSLSLAGTSAEGGGVTAVISMIGFATFASLWAYDGWYNLNTVAEEMKNPKKDLPFAIITSLIGVTLIYVLFYLAVYKVLPSEDIAEMINSGNLYLGNEVVSRTLGGTGIWILLICMTIGIVGSANVNTLCDPRTYYAMAKEGYFPKLFGHLSEKHGVPSYGIIVSAGMAVLLVIFNSLQELTDMLIFTTSILNLMTIYGVLIMRKKYPDIERPYKVWGGKFTIYLTSLMYVVLMVNEFIDAPKAAITGVGITVAGLIVYLYFKKKNGGEEYKGEGIE
>tr|A5I032|A5I032_CLOBH Putative non-heme chloroperoxidase OS=Clostridium botulinum (strain Hall / ATCC 3502 / NCTC 13319 / Type A) OX=441771 GN=CBO0840 PE=4 SV=1
MGYYIRVEPNVKIYVEDLNPEGNKTIVFLHGWPGSHNLFEYQFNQLPKMGYRCVGIDTRGFGNSDKPWSGYGYDRLSDDVRCVVEALKLHDFTLLGHSTGGAMAIRYMARHKGHGVSKLALIDAAAPSLIKRPNFPYGLEKEDVIKIIQGTYNDRPKMLRDFGDTFFFQHITEPFSDWFFQLGLQAASWATAAIANTWINEVLFSDLETINVPTLIIHGIHDKVVPFELGEIQNKMIKHSKLIPFKYSGHGSFYDQRDKFNKELVKFIEE
>tr|A0A3D2U5H6|A0A3D2U5H6_9PLAN Tagaturonate/fructuronate epimerase OS=Planctomycetaceae bacterium OX=2026779 GN=uxaE PE=3 SV=1
MTDIPGPCQTLGTIPSFGFGDRIGLATPGHVLAMQRSGQGILPIFPQQSIREMARTDRSPDDVMNDALTGMREAGWDGITGADADHLKTNTDAEITAEAGYTFFTIDPSDHVDEKADTYDEATLRERFAEIQHDLTWLGDYRGRKLTLETGARIECTEQACLRAGVKYGRAINHAIELAGHIAAVQGQAGRDYEIELSVDETDHPTTLAEHYIIADRCLVDGIRLISLAPRFVGDFEKGVDFKGDLEQLVRSLADHAALARHLGPYKLSLHSGSDKLAMYAMLAQATRGCYHVKTAGTSYLEALRVAARHDVSLFREVIEFSRGRFEIDRATYHLSATIDSAPPAEEISDPIELERLYLGLWSEVPVGEGFTGLGRQILHCTFGSVLTDSRLGPRLRSLLETHQDTYTEVLADHFGRHLDALQAGLSQSG
>tr|R7KQJ7|R7KQJ7_9BURK 50S ribosomal protein L11 OS=Sutterella sp. CAG:521 OX=1262977 GN=rplK PE=3 SV=1
MAKKIVGYIKLQVPAGKANPSPPIGPALGQRGLNIMEFCKAFNARTQGVEPGLPIPVVITAYADKSFTFIMKTPPATILIKKAAKIQKGSSRPHTDKVGKITRAQAEEIAKTKMPDLTAADMDAAVRTIAGSARSMGITVEGL
>tr|A0A2G9V0G2|A0A2G9V0G2_TELCI Uncharacterized protein OS=Teladorsagia circumcincta OX=45464 GN=TELCIR_02714 PE=4 SV=1
MHDIFDVVARIHVKWVRVVARTCSLILMVLDVMKPLKHKQLLEYELEGFGIRLNKQPPNIGFKKKDKGGINLTQLISLAELGSLEEEHFCFDVPTKALMNQMGETVLRITSKGHAADGVASTKSQRNTSANAAGLRKKV
>tr|A0A4Y1VGS1|A0A4Y1VGS1_BACUN Protein kinase domain-containing protein OS=Bacteroides uniformis OX=820 GN=Bun01g_11110 PE=3 SV=1
MFTLAKRQQLGNYIITFQVKEGDYAETYRVKDADGKNRFLKLINCAKLHRTQFDANGNILEVQIAKTLNHPNVVKYHDNGEVVLDGRKFAYIVFDYISGETASQYIAREGSLSVYDAKTIVLGILNGIKFLHTQQEPIMHNDLTIQNVMLDMSKGTNVPRIIDFGYARYLSQGSSSFNKNGLSPFYLAPEALNGVFSVKSDIFSSGAILYNLIFGIPPYFVDLSDCKNDATAQREKIDAQRELPLHIPDNDKFELDEQIMNIMRKALASDIEERFKSADEFIRALNGDIKIARIDNQKKAKSGKTPTKKVSYSVPKGKGFSAIAGMEELKEQMRVEVIDALNSPEEYAKYGLTIPNGMLLYGPPGCGKTFFAKHFAEEVGFNFMLIKPSSLKSRFVNATQENIAQMFKDAEENAPTIIFIDEMNELVPNRDSDVHEMARSAVNEMLAQMDRTGERGVFIIGATNYPDMIDPAILRAGRLDKKYYIGTPDFKARSLMFELYLKSRPYDFGLDYEKLAQLTENYVSADLEMIVNDASRIALRQKSRITMVILEDVISKTKPSLTKSELDKYLRIKAAMAGEQIQQSRRRIGF
>tr|A0A3L6ZV02|A0A3L6ZV02_9MICO Multicopper oxidase family protein OS=Mycetocola manganoxydans OX=699879 GN=D9V29_08490 PE=4 SV=1
MPNSISLRQQLSRRTFLSAGLSGAALLALAGCTPTPAFLSPTSARVAKTEAARKATGATTKVALRASTGAIDLAGTSAQTWSFGSIPAPIIRLAQGDELDATIQNTLPDATTVHWHGLALRNDMDGVPNLTQDAIAAGSSFRYRFTAPHPGTYWFHPHVGTQIDRGLYGALIIEDPREPLAYDDEWVVILDDWLDGVTATPEEVLAELSKGMKEMAGMEGMMMRMGNTLMGAESDALGGDAGDVYYPHYLINGRPPADPETYTSAPGKRVRIRMINAGGDTAFRVALAGHTLTVTHTDGFPVEPLDVDSVLVGMGERYDVIVTLGDGAFAFVAEAEGKNARAFAVVRTGSGATPASNVTVSEITGRLATADGLRAASEVVLPNKKPDRELTIRLRGSMKKYDWSLDGRPFTMDDPMIKPYSIAEGERVRVNFVNTTSMWHPMHLHGHTFQHAGGGPRKDTSIVLPDRTLTVDFDADNPGRWLAHCHNIYHGEVGMMGVFAYTG
>tr|A0A817XL60|A0A817XL60_9BILA Hypothetical protein OS=Rotaria sp. Silwood1 OX=2762511 GN=BAC187_LOCUS7404 PE=4 SV=1
MAYLNLASAANSTTSSTSSPYSHVNSNGGVSTIPPSLVSNSPSIFGSVGGGKQWTTIGQPTSSSSSSTLTQQLLMKQQQNILNNQQTNPLSSSSSSSHFDSILGLTMASALASSSQTQIEKNFELQQEDFPPLPHRSNSHEPTSSSTNVQPLYQSQYSSSSSSSNLHQPITNGYSSSQQQQQQQQHSQSQSPISFKTSIDALSTLINRRQTSVNNKTTSLTNNSTSSTTNPQQISSTSTTNINGLPSSTITDQYGLVGLLQMIQQAEKNPETSTLLNYDLTTLGLSMESQNDLYPSFLSPFSDSQARPYEIDYQVPFEYQMGLQIRDKLPPLNFNTLNEDTLFFLFYLFGNDHVQLLAAAELYRRDWRYHKEERIWLTRIKNIMPDQKYDTYETGVYCVFDVQLWRKTHKSMRIDYEKLDVNPVLKQDLFASKLLQQQSPVQPQFAPVSSYNTNSSR
>tr|H6QSH4|H6QSH4_PUCGT Uncharacterized protein OS=Puccinia graminis f. sp. tritici (strain CRL 75-36-700-3 / race SCCL) OX=418459 GN=PGTG_11407 PE=4 SV=1
MAGSLSLILLCLQVVSTVLGNSDPSAQIHRRSPQKPSKPPVSNTKANAKPVPFGFGSKVTGGGNAAPQTPKDPAELEAWLNDPAPRVILISKTYDFTSPNITKTSGW
>tr|A0A2U8VWI3|A0A2U8VWI3_9HYPH Uncharacterized protein OS=Methylobacterium sp. 17Sr1-43 OX=2202828 GN=DK427_22560 PE=4 SV=1
MEHVSEGDPQAGPAFGRTASLLAEIAVILRVDPVIFFDGEIRKRVDQDLAVDELADLLALLRSVDGPDLRAAARDLIRALKRNEADED
>tr|A0A0B7NY01|A0A0B7NY01_PROFF Uncharacterized protein OS=Propionibacterium freudenreichii subsp. freudenreichii OX=66712 GN=PFCIRM138_07065 PE=4 SV=1
MTEAKNPWLSHPAEPEPDTPVAIEEHVRPATGPVAPQRGVPAPDRADQLPLFDRRQNADVWWLGVHGGAGESSLSVVLPGSAAADHGWPQTPGEQPARVVLVARSNMRGLRAAQAAATQWASGLVPGVDVLGLVIVADAPGRLPRPLRDFAHLVGGGVPRTWTVPWIESWRLGEPPALSDAPREVRRLVDELHALIRPGADGTTN
>tr|D7SV11|D7SV11_VITVI Uncharacterized protein OS=Vitis vinifera OX=29760 GN=VIT_04s0008g06260 PE=4 SV=1
MVGLSVGEKHFIQGGIAQDLRTDGRRRLTYRPFNVETGVIPQANGSARVRLGGTDVIASVKAELGKPSPSQPDKGKVNIYVDCSPTAAPMFEGRGGEELSTELSGALQHCLLGGKSGAGAGIDLSSLVVVEGKVCWDLYIDGLVVSSDGNLLDALGAAIKAALTNTGIPKVEVAVGASGDGLPEVDISDDEYLQFDTSGVPVIVTLTKVGRHYIVDATLEEESQMSSAVSVSVSGQGRICGLIKRGGAGLDPSVILDMISVAKHVSEQLMNKLDSEISAAEAFEEES
>tr|A0A352XE32|A0A352XE32_9CYAN Phosphoenolpyruvate carboxykinase (ATP) OS=Cyanobacteria bacterium UBA11367 OX=2055774 GN=pckA PE=3 SV=1
MNQQNYAVESQRRNLHQAHQTSSPVHEQIERHSYTLGSLGMKNLGMVYHNLSVPQLIEKAVARGEGVFADNGALCVKTGKYTGRSPSDKFIVDEPSIHDEVDWNRVNVPLTQEKFDQLYRRMLAYVQGRDLFIFDGYVGADPQYRLSVRVINQLACQNLFAHQIFIRPTEEELQTHEPELTIIAVPGLQGDPDLDGINSEAFIVISFEKRIVLIGGSHYAGEIKKSAFSFMNYLMTKQGVLPMHCAANMDDDGNTALFFGLSGTGKTSLSADTTRHLIGDDEHGWSDRGVFNFEGGCYAKTLHLSHENEPQIWEAIHFGAVLENVILDEETREPDYDDESLTQNTRVAYPVEYIPNCAIPGIGSHPKTVIFLTADAFGVLPPIAKLTNSQAIYHFISGYTSKLAGTERGITEPQATFSCCFGKPFLPLCADVYGEMLYERLVKHNVDVYLVNTGWTGGSYGVGKRIAIQDSRAMVAAALNGELNRVRFYPDPIFKILVPEAVPGVDSDILDPRKTWSDSEAYEQQAQALAKKFVANFQQFNNVSQEIKQAGPSLD
>tr|G5ZW58|G5ZW58_9PROT Putative phytoene/ squalene synthase OS=SAR116 cluster alpha proteobacterium HIMB100 OX=909943 GN=HIMB100_00002480 PE=4 SV=1
MRPMKLSAYSDLRRHAPRLALTLLFQTEEQKQILAFLLLFGLELDRISALASEPMLALIRLKWWEDQLEVKTDEAGPLAGYLHQQLSSAHLKKADVIKLIDLWTMSVQAGQADQSENWAELIDLMAAKVNVQSSELARQIGRAVALSRSGQPSGVIPSARDIHKACGQGAEFLICLAYLAAESQKRDLNSSPFLVLGLLKQVLFKPASR
>tr|A0A183VZ29|A0A183VZ29_TRIRE Uncharacterized protein OS=Trichobilharzia regenti OX=157069 PE=4 SV=1
LCVHIFSCQTCGKEFIQPSNYSRHLRIHTKERPYSCKLCSAEFLYSTSLKRHQQRNHGVELLRCQLCQKTFLNESCLIRHRTGCELRACVKTADEGLCTQLL
>tr|A7LFU4|A7LFU4_CAPHI Galectin OS=Capra hircus OX=9925 PE=2 SV=1
MDSLPNPYQQSVSLTVCYMVKIKANLLSPFGKNPELQVDFGTGTGEGGDIPFRFLYCDGMVVMNTLKDGSWGKEQKLHTDAFVPGQPFELQFLVLENEYQVFVNNKPICQFAHRLPLQSVKMLVVRGDIVLTSVDTL
>tr|A0A4R7X8B1|A0A4R7X8B1_9NOCA Uncharacterized protein OS=Rhodococcus sp. LP_11_YM OX=2485207 GN=EC908_103210 PE=4 SV=1
MTLTTDITVGEVLPQLSIYGDPTFVVSAALATRDFQDVHHDRDLAQKRGSKDIFVNILTDTGLVQRFVTDWAGPRAVLTSIKLRLGVPWYAYDTLTLSGTVTSYDEDLVSLAVVGKNSLGDHITAQVTLAFPASGSNGDIENGDIE
>tr|A0A838UPM3|A0A838UPM3_9CHLR AAA family ATPase OS=Ktedonobacterales bacterium OX=2306968 GN=H0X24_05985 PE=4 SV=1
MPGRTPTAKPMPGQTSDPLPGVQHRGGMCSLGKSSRFAMIPGGLCAIRCRDHEGKRRIEKISHAFSVPPLSMAKREGASAQGRSLCARAFPIWVHCQNFTSEPSQTTLLITQSATLAKELLHSNLDEAAARLAATWLKDGARFPTMVREYREEFEQGAFDFLAFFFHEIILSEKYRPLFQAANGLELLKTQQHMAHDVTAIRGMLELLINHQVPSREEERLGHLMTYLARGNNATSEEQTTAPHHLWKLRTPRQFVGRDADVHWLTQRLSTPPPGDRISGVRGIGGIGKTALVGHVVTRLQQGGAFPAGIVVVNCSELHDVRDIWAEVAQSFGCQVDSPLGGEQLAHLMHETLRERDALVVLDDVQGEVRFTELVQPFAGTTPQIVVTSRLAFGAFPPEALWEVRELSSDHAVDLFRQCYGQPVDADEAALLPQLVAALYHHTLAVRLAGCYAAECQRDLGELLAELRADPLALPAEDQNRMVALILEKSLQNIERIHPLCRQIFTGLAAFGTPEFSREAAVALATYLDHQAPGFAIDRLIRYGLLEAASPHAGSVKVHQSRLHLHPLLYTLALQHFTQADGAQQQPLYSTICRY
>tr|A0A1H9KCN1|A0A1H9KCN1_9BACT Uncharacterized protein OS=Lewinella agarilytica OX=478744 GN=SAMN05444359_12049 PE=4 SV=1
MVAQTQQGRYELTPYAPHAYVFTTERGNTYIVRFIRYWQEEVVELYIKKELEVFEIYFEVMEIKDKGYDRRIQFTIIGAIVDFLAENDRVGFFDIKREDGRGLELLRVYRIWLKMYERNRKEKSIMLNRIVSIPDQFDSHIACLVHPNNKSFKGQNVDQLMDSVLKEIFPRATLTPF
>tr|A0A7J9HNJ9|A0A7J9HNJ9_9ROSI RIX1 domain-containing protein OS=Gossypium harknessii OX=34285 GN=Gohar_003306 PE=3 SV=1
MARFDQLENMYDLGLKPVMLRSLIRQYLPAENHPLNLNNSCFELPSLVSIVQTHCLLSELDSQSIDPKLINTWKSAVDDWLSCLLSLLSSDMSDKCWVGICLLGVTCQECSNQRFLSSYSIWLNKLLSHIQPPADSQLVKIASCTSLADLLTRLARFPEVKKDGNLLAGKLVQPVLKLLNEDNVEAVWEGAANLLYALIAFFPASIHHYYDKVQLMVAGTGRSFFGGWGVKVLEKEDIGVMAYFLGCLNVEAAIASKILSGKYSTKTLKKLGYFLALLPKAKGDKDSWSLMMQKFLISINDHLNEAFQGVEEEAKSDEARRLLVPPGKDLPLPLGGASFKGTSSERLPTATISTLMFCCCKMLTSSYPVQVTVPVRSILALVERLLRVDGSLPHTMLPFMTSVQQELICSELPVLHAYSLELLIAIIKGMRRQLLPHSAYIVRVVTRYFKRCSLPELRIKLYSIIRMLLVSMGVGIAIYLAPDVIENASNDLNSLGGEDIETSPANTDPATGALPQLSNRKRKHGAKTGSLEEKQDAASPKVGESNTHQMTPITVKMAALDTLEVLLTVGAASKSESWRSSIDSLLMKTAINSCKRGWGNLESNIFLPHESASVWADFQFSSLRALLTSFLAPARTRPPYLSQGLELFRRGKQEAGMKLAQFCAYALFALEVLIHPRALPLDDFYSACHNSTDGASNRFLENIYSGSQKQNTSFLSAMRRTEQGGVESHDDDLYDRWLQNENENQNENENIPVEDMKDQTSRPNDPSFTNVLEVREQEPAAANADVHMRTENEIVMQPWHLEESVPKSQGVASAKAVMSPPVGTNPEGSEIESKTPLSASDRLNDTNHDMFSCVDKVDGFDHVAGKTSSTLPNAEKGSSSMVHLDSDSSMDSFPGIVDADPDTDADSD
>tr|A0A239QJE5|A0A239QJE5_9FIRM Redox-sensing transcriptional repressor Rex OS=Clostridiales bacterium OX=1898207 GN=rex PE=3 SV=1
MRSSTLSKATMGRLPLYLQFIRTVQTENVSSATVARALGLGEVQVRKDLASICPAGMPKIGYPTERLREDLEAVLGMKQTIPAVVVGAGKLGRALMAYDGFREYGLEIAAAFDTRVTDSSHERKPILPMEEMTGWCREHEVHIGILTVPAGAAQEAADQMVNSGITAILSFVSVPIRVPDTVTVKHENIALSLACLKIVAGMSNETTEEDSHGSEDL
>tr|A0A1R4IEU8|A0A1R4IEU8_9ACTN Potassium channel protein OS=Luteococcus japonicus LSP_Lj1 OX=1255658 GN=FM114_01400 PE=4 SV=1
MVPGNGTNDDTLLTAGITRAAGFVTAIDDDADNVHATISARALNPELFIVSRASTKAVMHKLEPAGADRAISPYVMAGRRAVQLATRPGAVTCPSAWRRSESMRSWMASPWPTCVVAGWQPWPSATTTATTRPTRPSTVCCAWGRR
>tr|A0A1D7XM32|A0A1D7XM32_9CLOT MBL fold metallo-hydrolase OS=Clostridium taeniosporum OX=394958 GN=BGI42_10650 PE=4 SV=1
MDLRITTLIENNPDKDNLLLSEHGLSLYLEIDKIKVLFDTGKSGDFIKNAEKLKINLNDLDYVILSHGHYDHSGGFKSLVENTNKSFDLIVGNGFFNKKYKLLEEDKYKFNGNSFDEKFIDKNNISIRYVNNDLFKITKDIIFFSNFEKNTDFEMINKKFYIKKDNQYVKDDFLDEIVLAVKHEKGLIVVLGCSHIGVVNILKTIIKRTNMPIYAVIGGSHLIEADELRLNNTIEFFKENNIKLLALSHCTGENAIKKFQYEFGNNFIYNNTGNVIEII
>tr|A0A0P1BF93|A0A0P1BF93_9BASI Zn(2)-C6 fungal-type domain-containing protein OS=Ceraceosorus bombacis OX=401625 PE=4 SV=1
MSHVTSSPIWHEGAFSAEQYRQSAPAVPLQMVPPNAQLRGRMPPSLGHARHFTTPIAAPAQGPTIAHDEARPSDSNGLTPSCSRCRQKKLRCDFQTPCSNCIGKGLQSECHKDVRIPRGRKRPKAESQLTDEEEIVKLRKRLAELEERAGGGRLTPSTSSANSLGGRVSTRSDKPLRHRHHATGPADDRSGGNSSPGSRSHLSSSFVTATRDIIGSQEGLSIHLPLSGSASSDSFRSVPHGSTVPSPHSASVNESVLMKPQTRTRSSKPLILSPLLPAERALRSLETVANPSAARTICGTSERDGLLKRLTGLSDDVPNAYWSDPANAEERIALFVEARAAIPDPIVVEELARTFLYRANHCGGHVVYTPWHKAATELLSIASPEQAVSAPMFQDVSNLGLWFLILSVGYHFHPNNGPTSHTRGFAAVHALRKSGIDPSVRWYGIAKRALAIEKDYVLKSLPALQCASLFLLLGRDDPAWLRMLRAMTIAGARDMGLPRLGSASYAREMTTNDFVRLETAVRVWNFLCVRDWCWSQRDGSYSLHPSQMTTRLPLNLNDADLEAGTTESKSSSNWTEMSFVIAQVGLAHCVREAADLRNANLDDTSRAVVECIDESFRRFLSAGLPHFYSVNSREATPPIMAPQRWMLHQQVFHQLLLVHRNHIASPVGRSTCLSLALGTLELFKQLRMMCPVIEGMYVNSHHLFAAGTLLLLDLFNDNVDDEHRANVRDKVSAAVQYMSPAPRAKQLLSTLLDEEAQYYEATRDRKAYVQRDRTLDLATLCDRVAEVIEQTPGLPRDDVNAIDDVRMPDHHLMPALIGLQSPTSDFNQTKPNLEHHLSQDKVGPNSAFEDPRFFGFDHRQGNTSASPSSRPNTGLMPRRGTVLSPALPSPAELARRAPRILAEGAITLPSIGVDHNLSSNQHNSFNIHPSFRSAVALYHQSRKAHLKNV
>tr|A0A5D8QFW2|A0A5D8QFW2_9THEO Stage 0 sporulation protein A homolog OS=Calorimonas adulescens OX=2606906 GN=spo0A PE=4 SV=1
MDKKYRIAIVDDNKEFCTILKSYLEKEEDLEIVGTANDGNQGLKIIQEMQPDLVILDIIMPYLDGIGVLEKISSLDLIKFPRLIILSAIGQDTITQKAISMGIDYYIVKPFNMDTLLQRVREVLNIKESRTLKLYETSSSKYKWREEPNLEILVTNVIHEVGIPAHIKGYIYLRDAIIMVIENMDLLGAVTKELYPAIAKKYNTTPSRVERAIRHAIEVAWGRGKIETIDNIFGYTIQKNKGKPTNSEFIAMIADKLRLELKVS
>tr|A0A2W5ZP71|A0A2W5ZP71_9BACT ATP-grasp domain-containing protein OS=Candidatus Dormibacteraeota bacterium OX=2052315 GN=DLM67_22145 PE=4 SV=1
MTEPAILFVNLRGVPSEDRSALIAARRLGYQVDLIGPSLPAHAAGLVREFRLADTDDPEQGLRAARALAERASPAGVVTWGDRGVELVALIGQELGLRALSPAAGRRARHKVAMKQAVAHLPGIVGSHVGVVERSDLAPALRQVGFPAVLKPAAAAGSAGIFEVRDRDQAEAAFDRLAGWLQGAPRPFRGDGQGELILEELIEGPEFSLEGWVHEGGVTIAGVTDKWTTDGFHLEYQHVHPSGRLDSEQSVLRKGAELVVRTLGLDHCAFHLECKLTPRGFRLIEVAGRTGGDYIGSHLVPLSTGLDFHGNCIRVACGFPPRMEPVDSLCAGVRFLLARNEGIFLGLDGLAEVLQMGDVEQVFIEVPVGSALRLPPDDYDLQRVAAVVARGPEHSAVIETLDRAARCCAPRVERWDGHR
>tr|Q1Q6C1|Q1Q6C1_KUEST Uncharacterized protein OS=Kuenenia stuttgartiensis OX=174633 GN=kuste2370 PE=4 SV=1
MDLNEKIKEDLKSSMKAQDKMRTSVLRMMLADIKIAETSGKPRDQIDYAAVVQGYQKKLKKTREEYERLSLPEKTREIDNELAIVEEYLPKQLSDEDVQKIVDEVVDENKFTGKEFGVAMKLIMNKCGGTADGKKVLTILKQKLGC
>tr|A0A3A9BJV2|A0A3A9BJV2_9BACT DNA primase OS=bacterium D16-54 OX=2320104 GN=D7X87_23470 PE=4 SV=1
MNVFEAVRENGITARQAAEHCGIKINRNGMAVCPFHKDKNPSMKIDRRYYCFGCGEKGDAIDFVAKFYGLGKKDAAVQIAAAFGISFDDNGGRKPPPIRKRKLSPEQRFERVEKKCFRVLSNYLCRLREWQEQYAPHKAEEEWHPLFCEALEKKDYIEYLLDVLLYAPLSERVELVTDYGEEVLKIERRLEQCTEGTAGGTGKNYEQDGAGGTAGNMV
>tr|M3NA57|M3NA57_HELPX Uncharacterized protein OS=Helicobacter pylori GAM244Ai OX=1159035 GN=HMPREF1407_01122 PE=4 SV=1
MKIIKNGIMIGTLGALLLSGCSSFDAQRFACLPKDHSSKDASTKKEAQYIPKGFFDPYSSNLNHWDSTF
>tr|A0A0B8PB49|A0A0B8PB49_9VIBR Putative ammonia monooxygenase OS=Vibrio ishigakensis OX=1481914 GN=JCM19232_3271 PE=4 SV=1
MKPALNSVSTLAIAFATSALFVLLSVPLGEMFGSIIAIILLSKWGIKTKVPTHTLIFVQLALGLSVGGLIPPSFFATGFPLTMLIGLVVCMSLQVLCGYWLLQRFSWSKSDSLLASIPGAMAAVMVLNESQKTPSARSSSYIPFD
>tr|A0A1A8U716|A0A1A8U716_NOTFU ATPase, Ca++ transporting, plasma membrane 1b (Fragment) OS=Nothobranchius furzeri OX=105023 GN=ATP2B1B PE=4 SV=1
VYFAGQLYKKVPEPDLIPAKILDLLTLGIGVNCAYTTKIMPPERDGGLSRQVGNKTECALLGFSLDLHRDYQAIRNEIPEEKLFKVYTFNSVRKSMSTVLKNSDGSYRMFSKGASEILLKKC
>tr|C3DIS9|C3DIS9_BACTS Oxidoreductase, aldo/keto reductase OS=Bacillus thuringiensis serovar sotto str. T04001 OX=527026 GN=bthur0004_18590 PE=4 SV=1
MKYTKLQKAGLNISKLGLGTNAVGGHNLYADVNEEEGKQLVEEAIQQGITFFDTADSYGVGRSEEMVGEVLKGKRHKLILATKGGIQPLLNGETYINNEPSYLRNAVENSLRRLQTDYIDLYYLHFTNSETSYIDSIGELTRLKEEGKIRSIGISNVNIEQLKEANQHGHIDVVQSPYNMLERTAEEELLPYCIEAGISFIPYGPLAFGILGGKYTEDFKLNEVDWRQNVNLFEENTYKSNFKKVEKLKGLAKENDIEVSHLALAWLLNKEGIDTVIPGGKRAEQIRESVKAVDVALNKRVMKEIQSILED
>tr|A0A659QZ73|A0A659QZ73_SALET MFS transporter (Fragment) OS=Salmonella enterica subsp. enterica serovar Wilhelmsburg OX=1960126 GN=C9F09_13540 PE=4 SV=1
SDWPLNRGNSLSVARILPVICGMLLSCVIVIANYTSSEFVVIAAMSLAFFAKGFGNLGWCVLSDTSPKEVLGIAGGVFNMCGNMASIVTPLVIGVILANTQSFDFAILYVGSMGLIGLISYLFIVGPLDRITLTSSAA
>tr|G8G1N4|G8G1N4_9HELO NADH-ubiquinone oxidoreductase chain 4 (Fragment) OS=Phialocephala helvetica OX=242229 GN=nad4 PE=4 SV=1
MLLTLLLLTPILGIFAISTGISYELS
>tr|A0A4Q2K9X0|A0A4Q2K9X0_9FIRM Uncharacterized protein OS=Candidatus Borkfalkia ceftriaxoniphila OX=2508949 GN=ESZ91_10490 PE=4 SV=1
MIDFEALKRFIEAKRTPPRKVLRAAFKIDAECEPRALCGAAETDENALRERIGKRGKTFSEMLFYWIDARGEKDSDVYKRAGVDRKLFSKIRSDANYTPKKRTAILFAFALSLNEDQARDLLARAGYSLSDADTTDIIVQYFLQTDNHDLSELDEALVRFGEQPVYSE
>tr|A0A841U1R9|A0A841U1R9_9BACL Aldehyde dehydrogenase family protein OS=Cohnella xylanilytica OX=557555 GN=H7B90_11630 PE=4 SV=1
MNGTATIDNYIGGWRPPASGRRVPSLNPARRSETVGLVPDSDRTDLDAAVAAAEAARRSWRKLAGSQRGALLFKAADLLESRMDEIGRAMTREMGKTIGEAKGETARGAAILRYYAGEGMRPIGDVIPSTDAEALMYTTRVPLGVVGVISPWNFPVAIPLWKIAPALIYGNTVVWKPAIETAVTAALVMECFHDAGFPAGTVNMVVGDGAAIGQGIAEHPGIHGVTFTGSNAVGKRVGQIALARGAKYQLEMGGKNPIVVAADADLDLAVDATISGGLRSTGQKCTATSRVIVVREVYETFKEKLLAKIKTLTVGDGLDAETWLGPCASEKQYETVIGYIRKGREEGAELLVGGERPSHPSLADGFFVTPAVFDRVTTGMTIAREEIFGPVLALMEAGDLKEAIELANDTEFGLSASLYTRDLANALAFAQEMEAGLIRINAETAGVELQAPFGGMKGSSSHSREQGQAAIEFYTAVKTVFVKP
>tr|S3MU72|S3MU72_9GAMM Pyridoxal phosphate homeostasis protein OS=Acinetobacter rudis CIP 110305 OX=421052 GN=F945_02860 PE=3 SV=1
MNELHRARREVLEHIQKACEQANRSADEVQLLAVSKTHPSQAIEQLYQSGQRAFGENYLQEALDKIEALKALEIEWHFIGHVQRNKTKHLAEKFAWVHGVDRLIIAQRLSQQRPAGLAALNICLQVNIDQQDSKDGCAVADVVDLVREISALPNLRLRGIMVIPAPHNHQAFNAAAELFQQVKTEHVHAQDWDTLSMGMSADLQAAITAGSTMVRIGTALFGQRSYDLS
>tr|A0A7I7TGD8|A0A7I7TGD8_9MYCO Uncharacterized protein OS=Mycolicibacterium helvum OX=1534349 GN=MHEL_56620 PE=4 SV=1
MAHSIELLIDQRADTAVRQMWHALADGGLPSRHRVPSGTRRPHITLVAAERIAPGIDRVLGGLAEELPLPVVLGAPLVFGTDRLTLARLVVGSAALLALHDEVYGLCRPFAFNVFAHSAPGRWTPHITLGRRFTPAQVGEALAAVDGIAADIRASIVGLRRWDGDAKREYLMVN
>tr|A0A4V2FIN5|A0A4V2FIN5_9HYPH Ribulose-bisphosphate carboxylase large chain OS=Rhizobium sp. BK696 OX=2512157 GN=EV569_4023 PE=4 SV=1
MAQRFTVTYFIRGADAAEAKARALDIALEQTVEIPRAAVPKGYVEDVILGRLEGLEQVRDGRSGFLATISYSEDDVGGDFLQFLNIVFGNSSIKPGLKVEDIGLSSGILDLCRGPRHGIAGLRARAGIGQTPLLMSAIKPVGLSTKELASLAHDFAIGGVHFVKDDHGLVDQRTSPFSERLRACVAAVGEANAKTGGRTSFVPNITGPATAIVERAKEAQEAGAGGVMIAPALAGYDIIRTLAADQDFTLPVVSHPAFSGANVVSPDCGFTHRTFFGTLHRLMGADAVIYPNFGGRFGFSREECLSISAACAAEMGGLNTIAPAPGGGMTLDRVAEMRAAYGNDIMYLVGGALLVDPGGVIAACQRLVSKIYD
>tr|B4DA31|B4DA31_9BACT Uncharacterized protein OS=Chthoniobacter flavus Ellin428 OX=497964 GN=CfE428DRAFT_5771 PE=4 SV=1
MADDSSRYERKDFSPKAVGLSGLGLIVVCVISAVLIRHFEKDLNQFFAYQGRATWTSSPTMQPPEPRLQTNSAREFAEMRAQEEAELHSYGWVDRQYGVIHIPIDAAIKIALERGLPVRKSTPTAAATPVPAPATPTPAPKSAQ
>tr|B1ZML6|B1ZML6_OPITP Stress responsive alpha-beta barrel domain protein OS=Opitutus terrae (strain DSM 11246 / JCM 15787 / PB90-1) OX=452637 GN=Oter_1073 PE=4 SV=1
MSLTSRRQFLATSALATAAAVSPSHAAGTSAMPKLVHHVFFWLKNPSSKEDLATLLAGIRSLGAIETIRSIHVGVPASTEKRDVVEASYSASELLLFDDVEGQNAYQAHPVHQKFVQDCSGLWSKVVVYDSVSVDVPAGSKP
>tr|A0A4Q1QFK1|A0A4Q1QFK1_9GAMM ATP-dependent zinc protease OS=Idiomarina sp. 29L OX=2508877 GN=EST55_04790 PE=4 SV=1
MTTIGWREWGHLPELGISNIHMKVDTGAKTSCLHAFQLEPFMKKGEEWLRIFVHPKQDSQEEHVCEAKVHDKRDVTDSGGHTETRYVIKTRLVLGSFDQKVELTLTNRDTMKFRMLLGRQAMRGHFLVNPDASHLLGDVK
>tr|T2C928|T2C928_9BETA U7 OS=Human betaherpesvirus 7 OX=10372 GN=U7 PE=4 SV=1
MKNFETMAEQYKTLPCVGQLNDGLLRELKNLCRFTDFPGIRLLTERHRNECLSLIWPKNLWLRLAQPVDVAGYSEQQLAELNDHYQGFKENLCLIGAIQIGRKDVPIFVGKSSRIFCHDLEDDVLYYIAEDFDKFVRFGILGTNVITCSEPVYTRFYYDGPKFEKLETLKDLGLLQEPLNLNSSLRFNRKTALALKALRRNYISMLSELDELARCKTLAEIEHFVSINTGLKLRLETPIFTALILQDRKNIHCSTSDQKRFEEQEALFEKVVVLGFLNISAEDYGLRPILCIGETGAIYYYDWIDKVLTRIADCLLTFARIGFARYCGDFGYDKIGKVTARFGRLSTLGSAPVQQYSWYLKIVPVCNDVCIEPTPDLPSFDFAVELLLSSYGEGMEIVRNGIKCCLAWPPNYVLIFGEFYHFKCRRSVITYDWSNLVGADEFLCAVGYAHPNYREPDPDFDPFVMYCSSNKMLALDTVTDELYIIAESPAHFCSIGLRNFPPFARIELDIELDRLWYGETKCSGEEFVLLQKNIPALKNFVNRQCGQKIRIDAFQNFDLSFCSSNDIHYITGSGILEKILRRKYVVIGTCARCQVEPNCRAVILLGPNFHIYVYCDNKINKVARSIREFIRRGFEELLYKERYALNWHDDSLIYVSESEAENLNRMLNGESPILRKKPRHMYPRCDRLLKNMPSILFAVHSSEISNPLVQSVTKFLHPIIIPNGDTELKYIVPVTESRLINGLQASAAGRFGIKGLRLCSDGVIWNRLIDYEYEMFKYPSTFTRADKFLLQLRDLKFMEDFDPKWQCITKLAAVGFYSGASLFNLGAKPGIGYWCRYLCEYLSMLFFKLDGKLKELSKESKQKLGGFSCAFWSESFKTEMQNKTESFFRRDFFDRFQLYLLEHFLLFCGCEECRYNFFRFKNVGTMKKNPGSVKLHFFPALGKIDLPIFPHLSEKYSNLSMFVAKDLCLSFIEGQIEHSRFPISVTVDMGQDKRNLLNILSNIVFLLFIIQTLNSVLFTELKMYYDVYLDELKNLESSMECEMKLGSKGCMNNIVYFNMLKQVKDIVRNPGTSSNFIFNCLEVIKMSFEIPYYKNYDETNFMESFYLHHLYIQRQPAKHTDLVAANNLAPGFFIVNAKEKSFIDVLERSIVNIEAEYLSNTKNINGAMALFFSGLKYFGNFGNGNFQTSPEKDVRAVGYKLGGLDKIQNDLCYFANVETLACVGVDASDGNE
>tr|A0A5C4V3X6|A0A5C4V3X6_9ACTN Pyruvate dehydrogenase (Acetyl-transferring) E1 component subunit alpha OS=Streptomyces sedi OX=555059 GN=pdhA PE=4 SV=1
MGRTQARTAAGKSTAGKTTAGKSTSGKAKPTARKSAAGNATANGAANGKPPAKKATTRKPAASGTAAKPAARKPAAKKPAAGKSPARGTAARTKPADGPEMVQLLTPEGERVEHPDYPLTVSHEELRGLYRDMVLSRRFDAEATALQRQGELGLWPSMLGQEAAQIGSGRALRADDYVFPTYREHGVAWCRGVDPTQLLGMFRGVNHGGWDPNSNNFHLYTIVIGSQTLHAAGYAMGVAKDGGDAAVMAYFGDGASSQGDVAEAFTFAAVYQAPVVFFCQNNQWAISEPTERQTRVPLYQRAQGYGFPGLRVDGNDVLAVLATTRAAAEQTRSGQGPVLIEAFTYRMGAHTTSDDPTRYRRQEELESWEARDPILRLRRHLDREGAADEAFHSELEAESETLARRVREAIRTMPDPDPIAMFDHIYADGHTLVDEERAEFAGYLASFADHEGN
>tr|A0A5B2V3L5|A0A5B2V3L5_9PSED Chaperone SurA OS=Pseudomonas brenneri OX=129817 GN=surA PE=3 SV=1
MNVKIKLSDCLRPLMLGALFLGTAAAHAAVQPLDKVVAIVDNDVIMQSQLDQRVKEVQQTIAKRGGGVPPTSVLDQQVLERLIVENLQLQIGDRSGIRITDEELNQAVGTIAQRNNMSIDQFRAALARDGLSYEDARDQIRREMIISRVRQRRVAERVQVSEQEVKNFLASDLGKMQLSEELRLANILIPTPDSANAEQLNAAAAKTQAIYDRLKAGADFAQMAIAQSGSDNALEGGDMGWRKAAQLPPPFDRELSAMEVGGITQPARTPGGFIILKLLERRGGEASLKDEVHVRHILVKPSEIRTEAQTKELAQKIYERIEGGEDFATLAKSFSEDPGSALNGGDLNWIDPRALVPEFQQVMNDTPQGVLSKPFKTQYGWHVLEVLGRRATDNTTQAREQQALTVLRNRKYDEELQTWLRQIRDEAYVENKLPGAEPTGTDQAAQ
>tr|A0A1D1ZL49|A0A1D1ZL49_9ARAE 60S ribosomal protein L35a-4 (Fragment) OS=Anthurium amnicola OX=1678845 GN=RPL35AD PE=3 SV=1
FLFSYTHPHISYKMGKAVRLYAKGRVLGYKRSKVNQSPNTTLVKIEGVTAKEETQFYLGKHIAYVYRAKREKAGSKIRIIWGRIARPHGNGGVVKARFRKNLPPKTFGASVRIMMYPSRI
>tr|X0K267|X0K267_FUSC4 Uncharacterized protein OS=Fusarium odoratissimum NRRL 54006 OX=1089451 GN=FOIG_02629 PE=4 SV=1
MTALAQVALLRLGASRAMISLFDCQHQHIIAEATPALRISAHANPPSSGSDSLWLCGTAIPRSYGICDRVLVYPEFGGPQQASLASELPVTVISNLAENEEYRNTWYYKARPEHRFYAGVPIRTRRGINIGVFCILDNEPRETLDEASLQVMRDVSASILGQMELTRSGDGRRPGERMVRGLGSYVEGKTTISGWQNSSTHAFNTDASTEEGSLNQTQQKIQNQRDNAAAAADTESISTPDTFVLESPSQNRPTSPFHPTDKTPHSVPTGEESRSQQLNQIFSKAANILRESIEVEGVLFLDAGIGSFAGRIRSGSLRRNSRTHDRSSSSSSSSSSPGKGNISVSSPRNSADSRSSGAMCPILGFSTSVSSSINGEAPAGRSRTIPERQLQMLLRRYPKGKIFNFDGYGVMASSDPASEDSAMAVFQAQKARSIQEGQRGDNQKSRKVNDPYSRKNEGMAIRDVFPGARSVAFVPLWDSHRERWFSGCFVYTMTPTRIFTVQGELSYLAAFSAVIMADVAMMESSIVSLATTSLLSSLSHELRSPLHGIVLCAELLRDTALDVFQGDVLRSLEVCGRTLLDTINHLLDWTRINNFVKAPSGQSPNSGIAFVRGAQSNQRSGPTDGMMHITSNLDLDMLVEEVVECIYAGHTYQQQSLSLVHDDKPNEELNRDPFTRLDGMDVADSIKAGEKISNGAGPDAVLVMLDIDPAVNWAFHVESGALRRIIMNLCGNALKYTTRGYVKVSAYQDTPGQSRLRDRVVHIDITDTGAGIGQDYLNHRLFAPFAQENIHSSGAGLGLSLVRKFVRALGGSIHVQSKVGTGTRIAVKLPLEAVSVDSTETISDREEFQSQAIELSGLRVCINGFTPFGGGGSESQRWNSREFDERALLQKVCHDWLRMHVVDSLHNAEYLPDLILCDESHLETIANQPRDELSSPVVVVCRSAAVARSLDRSHRSQRKLNWGLFSFISRPVGPRKLAKAFVLCFRRWTKLQATAADRASVSTRLDEPPTVSTAETDLVQHGSDDKNRGYFDIAPTLSPKKRRAHWNDDGTRTPLPSMPALQLPTIPRDQRFLLVEDNAINMKILQTYMKKMGVEYDSASDGLQALECYKAQEGCYKCILMDISMPVMDGFEATRQIRGFEKASDLPRRHIVAISGLASKDAQEDAFANGLDLFLSKPVQLKELSRILKSRGLI
>tr|A0A813QIU7|A0A813QIU7_9BILA Hypothetical protein OS=Adineta steineri OX=433720 GN=IZO911_LOCUS5098 PE=4 SV=1
MCGIKRCCRNCCPNGCCGFCKPPKQVQQQVDTLIHLKEAVTASETRYGFIKFYPGVRTVDNNYTCPMFAIHLYRQGKLNANMAQDNRTVTYAGRNHQQTHQGEKQFISTQNASAEEEVIMVPLEDVIHISYKADVKIGMQADIKSHVTPVHERSENCCDRCCAPIVNCCRKTRDCCCCHSRQEENKVAPFVQNTTTIINANSNRNEDYVEQDLPLPKVKESCWSKCCNPCRCWCCRKKRLVRLIKRTNTKAARQAERVITMTIQYSKYSNLDTASHTRLLSNQHQLEYFKAKFQPDAELEFYLINDTEFEPMNFDVKKNEAEVLCRTVMQLKGMKNRYPSADELDKILDQPQQRIFGTIFHEPILQLPSNAEIQRVT
>tr|I2FGU6|I2FGU6_9ANNE Cytochrome c oxidase subunit 1 (Fragment) OS=Megascolecidae sp. Esik120 OX=942496 GN=COI PE=3 SV=1
TLYFILGIWAGMIGAGMSLLIRIELSQPGSFLGSDQLYNTIVTAHAFLMIFFLVMPVFIGGFGNWLLPLMLGTPDMAFPRLNNMSFWLLPPSLILLVSSAAVEKGAGTGWTVYPPLASNIAHAGPSVDLAIFSLHLAGASSILGAINFITTVINMRWSGLRLERIPLFVWAVVITVVLLLLSLPVLAGAITMLLTDRNLNTSFFDPAGGGDPILYQHLF
>tr|A0A2I7QPQ3|A0A2I7QPQ3_9CAUD Coil containing protein OS=Vibrio phage 1.034.O._10N.261.46.B7 OX=1881189 GN=NVP1034O_23 PE=4 SV=1
MATVAAIAGVIGAVTGVVGAVQQRKAAKKATAEQKRQNALNNRVQEVNQRRDIRRSIAASRAQQAQLEQGGIDFGVQGSSIVAGAQGAAQTDLATSIGSGFANQGASAGFAASRNRQADAMLDVQNNIYTDVSNFAGNFTHAGVNEVYKSELTGLFS
>tr|A0A537DGT1|A0A537DGT1_9PROT Thiamine pyrophosphate-binding protein OS=Betaproteobacteria bacterium OX=1891241 GN=E6H40_11730 PE=3 SV=1
MENERPLASPKQNEIWGSDAIAALLRELDIPYIALNPGASFRGLHDSLVNYLGNERPQLLLCLHEESAVAIAHGYAKASGRMMGVALHSNVGLMHATMAIFNAWCDRVPMLILGATGPWDAARRRPWIDWIHTSADQGALVRDYTKWDNQPASVPAAWEALLRAAQIANTAPRGPTYVNLDAALQETKIGPLPPLPDVSRYRAPEAVLPKAELIDAAAQLLSAAERPVILAGRFARTGAGWKSRVALAEKLQASVLTDLKAGASFPTDHPLHVAPPATFLHENAREALREADVVLSLDWIDTAGALKQAWGDAPIGAKVILVSPDAHAHRGWSMDYQGLPPADVYLMCEPDAVVPLLLEAVEPRAAAAAEQRAEETTTDKTLSLRALADGFNTATAGLNVCLARLPLGWNGAYRHFKHPFDYLGGDGGGGVGAGPGMIVGAALALNDSGRMVAGILGDGDFLMGVTALWTAAHYRIPCLLIVANNRSFYNDELHQERVAHERGRPVENKWIGQRIDEPDIDLASMAGAQGAFGIGPVTDLAELQPSLARAIELVREGNVCVVDVRVVPGYDSSVSGSPARR
>tr|A0A7L4GLY1|A0A7L4GLY1_PODST SESN3 protein (Fragment) OS=Podargus strigoides OX=8905 GN=Sesn3_1 PE=3 SV=1
GRLEAVTQQMGYHPQYLDSFLKTQHYLMHMDGPLPFDCRHYIAIMAAARHQCRYLVNLHVLQFLRAGGDPQWLRGLDFIPPKLRNLNEINKILAHRPWLITKEHIEKLLKISEWSWSLAELVHAVVLLAHCHALASFVFGCGCEQDEGLGGRGLLKPLSPGNQCFCEATAGNGCSQELLRISRKRSLDSCMELDSLRERMQRIHVETEGREEMRLLQQDREEGEGQGAEVGHHSDPPAGLSPLADTDGEVTGATNLACYMQDPDFGYQDFARRDEDQTQVFRVQDYSWEDHGFSLVNRLYSDIGHLLDEKFRMVDGLQSSAMAKRQGCEPSVFKRGIWNYIHCMFGIRYDDYDYAEVNQLLERMLKVYIKTVTCYPEKTNPEMFDRFWKQFKHSEKVHVNLLILEARMQAELLYALQAITQYMI
>tr|A0A6A3AK87|A0A6A3AK87_HIBSY C3H1-type domain-containing protein OS=Hibiscus syriacus OX=106335 GN=F3Y22_tig00110462pilonHSYRG00339 PE=4 SV=1
MYTSRHVVFDELQFPFAKLHEKVSNEYNTHASSSSLQIVAVVHKFQHVLAEGYDNNSMTNNSPATVSSNYFSSNVAATSNSQNEAQEDVVDSSSATQNDATQDDDAHEETVVPQSVNECTPSEGVNSDMPTNTHHMMTRSKCGVFKPKVRKETVQAEFDALLTNNTWTLVKLPEDRTAVGCYDFKDTYNPIIKFSILNIVLSIAVTRKWCIRHVDVNNAFLNGKLAEDVFMQQSPGFEKYAVDESVLVCKLNKALYGLRQAPRNWHDKLKTSLIRLGFTESKADVSLFVRIDADCRIYILVYVDDIIITGDSSPSIDSIVHALSRDFSLKDLRSLAYFLGIKVKRTEEAMLLSQRKYIIELLEKICLLNATPTVTPMIGASKMTQEVGALLSDAREYRSIVGALLYVCHTRPDIAFSVNKATQFMHAPRELHLAAVKRILKYLASTLNYSLTFSSNDVSQDVVAFTDADWGGSLDDRRSVSGHAVFLGHCLVIWCSKKQKIISRSTMEAEYRIIADAAVEVMWMSSLLCELGVKHRNMPVEWCDNTSTVALSTNPVYHSRSKLVDMDVHFVREKVAANQLQVNYVHASHQVADVNPTESGSSGQLLLDASNFPERPDQPECRYYMNTVTCKYGSDCKYHHPKEMIANSTINGIGPLWLPSRPPSSVFDSSALTYQRMSPTAHLSETPLPSKLTDWTGNTESVSKKHQNTEMKNSDDPAEQAALTHSLQISSKNSQDD
>tr|B6WSE8|B6WSE8_9DELT Tyrosine recombinase XerC OS=Desulfovibrio piger ATCC 29098 OX=411464 GN=xerC PE=3 SV=1
MGRHIEKDTMEEELDPRTTLEIESFLAWLDVQRGLSPTTQIAYGTDLRQLALFLAQRGASLARPAEVSKKHIQAWLARLYALGEAKSTMARKLAAARTFFRYQQRMGRTENNVAAQVRNPKQEQRHPRVLNVDQAFAVLDTPDALAGTGSPRIPPATGDALAARDHALAELLYGSGLRISEALGLDVTDLRLDESVVRVFGKGARERMSPLSDTSVTALRAWLEQRGTLAPEGEKALFVGARGGRLDRREAMRRIERLCRNAGVEPVSPHALRHSFATHLLDAGADLRSVQELLGHQRLTTTQRYTRVSLERLMHLYDEAHPRAQKK
>tr|A0A6A7M004|A0A6A7M004_9PROT Uncharacterized protein OS=Rhodospirillales bacterium OX=2026786 GN=GEV13_06010 PE=4 SV=1
MWVNAREVPRFYPNAVTLAHDDASIAEQLSNIEVLQKSNLPGRWAVKDSFQALDLSRRGFDVLQEASWIRSVMPTGSSATDIEWQRETQGKAPWPYDDPNFAMFTGRRGFSVVAGGMLYRAAGVAGLSNVVAEAADAVTVWRSLILLASRTFPRLPVVGYESGGELAAALDAGFEIGDPLKIWVRARD
>tr|A0A2T0N3A0|A0A2T0N3A0_9ACTN Uncharacterized protein OS=Nonomuraea fuscirosea OX=1291556 GN=B0I32_10527 PE=4 SV=1
MTEKIPVDLWFDPSCPFAWVTSRWLLEVEKVRPIQPRWRQMSLYFLNEEKDVPADYLERAAKAMGSVRVIAAAAAKHGEHVIGQLYTGLGTRLHNQGLSKEPERLREVIEGALDDAGLERSLAEAMHSEEYDATIRASHDEGIGLVGQEVGTPVIRVGDNAFFGPVITRILRGDDAGKLWDGVLAVTQFDDFFELKRTRTRRPQFD
>tr|A0A3A6JJ78|A0A3A6JJ78_9FIRM Uncharacterized protein OS=Coprococcus sp. AF38-1 OX=2302943 GN=DW025_00330 PE=4 SV=1
MAIRKDGPQKAVMREMMRDYLKNNDISIKDGTDVNSIMCDMMFVILEGALDEKLGYSKMTVELFTSFRV
>tr|A0A4R1JNC6|A0A4R1JNC6_9GAMM Ribosomal protein S18 acetylase RimI-like enzyme OS=Celerinatantimonas diazotrophica OX=412034 GN=EV690_2119 PE=4 SV=1
MIQYRPMQINDYDSVMALWLQTEEMLLREADSQTNIAHYLARNHNLSFVAENENHEIIGAILVGTDGRRGYIQHLSVALECRSQGIGRDLIAKAVKALKEIGIAKTHLFVNIANENAKKFYQRLGWQVREEVRMYSFNSSEDTQI
>tr|A0A7S6MMK8|A0A7S6MMK8_9GAMM Flagellar assembly protein FliH OS=Gammaproteobacteria bacterium OX=1913989 GN=HRU78_01625 PE=4 SV=1
MIASNFVPKEKLTAYQRWEMDSFEAPELSQEAQEAGKESNDQSDSQPQVSLPTEEEIAAVLRSAKEQGYAAGLQEGHTAGHAAGYAEGRALAESEVKAEVARMQTLLTKLDQDLQQMDQQVAASLLELAIALTKKMVTEALKLQPELIVPIVQEAIRNLPNATQHPRLFLHPEDAKLVLAHLHEQLEQDHWSIREDEQLIRGGCRIEAGGSEINGSLEVRWQRVLSTLGQTDEWLNKAD
>tr|A0A852D8G1|A0A852D8G1_PASAF PDIP3 protein (Fragment) OS=Passerina amoena OX=142471 GN=Poldip3 PE=4 SV=1
QLAFSPLEGTKMTVNNLHPRVTEEDIVELFCVCGALKRARLVHPGVAEVVFVKKEDAITAYKKYNNRCLDGQPMKCNLHMNGNVITSDQPILLRLSDTPSVKKEGEPRRSSASASSNPPAEVDPETILKALFKSSGVSASVQPTEFKIKL
>tr|A0A2T7IVZ0|A0A2T7IVZ0_THEOR Uncharacterized protein OS=Theileria orientalis OX=68886 GN=MACK_00001413 PE=3 SV=1
MDGKNPYEFESLVSLMRMNFASIVEKVKGMKVLILDSETSKIISLVYTHSYLLENEVLLTLNIDDGTIFNPDPNVTVDSNLKYLKGIYIVSPNXESLNXISSELKNPHFKEYYVYFTNKVKEDLLELMAKSDTLEIVKGVYEYFVDFYVLDECLFTLNIANLQSLYKDDVNMMLDFSVSKMVNSLFSVCCMLNQIPTVVYRRNNPILQTIANKLQADFNNNNLNLQSIIQSYNNYNSKNPTADHSGCVLLILDRREDCITPLMNQWTYRAMIHEMLKINNNKVMXEDTEYILGNNDDFYGKHLFDEFADVESDLNVLINENKPANSDIYKILESLPEQSKTLNDTTRHVKVLHELSKHIQKNKLLDSGILEQDIATNRRNVINELAEFLNDKTAPTYEKLRVALIFCLKNPGDTNKVNRVKDYLKMNRLDQHVGLVDLCLKLAKFRPVSKTNQDFTLSSLKDKFNKVSLESQSPYLQYKSQLHSTCYNLIKGKLDVELYATMPSAYDLGYTLKHKPASVSIKFFYSSRRTVGDVTYDRPHQITDEMPKVSELDVYKEVLSGEKRKSIRRSDFLKFTGGKRPLISSHLHANLIASGLVVWAVVAFFLTFKVMKPESYEWVENERRRIEAAKQKIALIKKDQENKALAQ
>tr|Q3JRW6|Q3JRW6_BURP1 Putative membrane protein OS=Burkholderia pseudomallei (strain 1710b) OX=320372 GN=BURPS1710b_2292 PE=3 SV=1
MSTLTSPPLSVAAPSMRGRLNGVLFVGLFALAVTSVAQLPAVAHLGLSPLIVGIVAGALYGNLLREGMPASWAAGVDFSARKLLRIAVAFFGLRVSLQEIAQVGVPGLAVSALVVASTLAVGTWAGIKLMKLDRDTALLTAAGSAICGAAAVLAFESALRSKPHQSAMAVGSVVLFGTLSMFAYPLAYRAGWLHLDATGLGLFFGGTIHEVAQVVGAASDVGPEVARVATIVKMTRVMLLVPVLLVLGAWLARSARRSTAAGRGAPRKLAVPWFALGFLGFVIVNSLQMLPAAAIGTLNALDTFALTMAMTALGIETRMSQIRAAGPRALMTGLILYAWLVFGGYAIVWATQRWLG
>tr|A0A661D2Y2|A0A661D2Y2_9GAMM Uncharacterized protein (Fragment) OS=Gammaproteobacteria bacterium OX=1913989 GN=DRQ40_10815 PE=4 SV=1
QDTDPEPEPEPEPEPEPEPEPEPEPEPEPEPENTDDSDELEPVPSNKLSDYLTKSLGGSISDKDNNSVDEVEVDPQTKIESDAGVESELGSEQDQLLSMVADIEAEEADPPIVEDAAESSDEQNQPEDTKSVYGSEIEALSAKVKARTSELKAEAEKAQIRLDSNLEVKTSFDVELQLDKGSELEPNLENDSNLSATDIDLVNDEDFNLEQPEEQPEEQPEEQPEEQPEEQPEEPLPSEEQLDSMLSEVRALEQDKTLKNEKAEEPVVAKSTQDELQAILSSIPSFSDMNKK
>tr|A0A6N6VZN6|A0A6N6VZN6_9BURK Magnesium transporter OS=Paraburkholderia madseniana OX=2599607 GN=FSO04_44420 PE=3 SV=1
MATELLSAQNTDHFPLDRGYLFSGNGVGREIDANTAIEWLKHRDDDSTEFIWLYFHDIPTVPEGWPLQHVQVPEAFGDTLKEGSRSTRITHVYQTLIAVLNDVEYDLERKTSLKVATLWVNVGVHYLISVRNSPLRSVNQLRLAVEAVETFRSPMALLIHLLQEQADVLIGIVRTAAQAANDVDETLLAGRLPTRSGLGGIRRDLVRLRRLLAPEPAALFRLVSRPPHWVLEEDAQSLRQSAEAFSLTLRDMAGLQERIKLLEEEIADRVAEHTNRSVLILTAVAVIALPVNLISGLLGMNIGGLPFKYQPFQGLDQDVPPLARLSRRAVL
>tr|A0A063XZJ1|A0A063XZJ1_9GAMM Biotin synthesis protein BioH OS=Nitrincola lacisaponensis OX=267850 GN=ADINL_1947 PE=4 SV=1
MLSIESLAGQGADLVLVSGWGSDSGIFDPLLPLLSPYFRVHRVLWQTSGWPADDGQLRYQLLNCLRRQAPSRAIWVGWSLGANLALTLADSFPEKVSRLVTLAFNPCFVQRDDWSCAMPQTEFLHFQQNFLTAPAATLKRFQALQVMGSVDRRQVIAALQSSPAHLPPARLSQLLQLLADDLRPQLKRLSQPQLHCLGAQDTLVPCASLLAAYPHLNPQVELRCYAQSAHLPFLSEASRWCEDLRQWCQA
>tr|A0A7V9MZW3|A0A7V9MZW3_9PROT Pentapeptide repeat-containing protein OS=Alphaproteobacteria bacterium OX=1913988 GN=H0U98_14635 PE=4 SV=1
MMLPLPAMAADPAAVAKIHGGIVDCVGCNLAGADLSNTCVKDHDLHGADFTGADATLMCMSFANFTGVSFRGAELSGANLAGAKMDGADLTGAGTSITSFLGTDLTKVKGLTQKQLDIACGDATTRLPPGLNIHTCE
>tr|A0A3A5H6E9|A0A3A5H6E9_9ACTN Recombination protein RecR OS=Nocardioides sp. K1W22B-1 OX=2321396 GN=recR PE=3 SV=1
MYEGIVQDLIDELGRLPGVGPKSAQRIAFHLLQADPADVRRLADVLIQVKAKVKFCSICFNVSEEEQCRICRDPRRDPSVICVVEEYKDVAAIERTREFRGRYHVLGGAISPIDGIGPDQLRIRELLIRLADGAVTEVILATDPNLEGEATATFLTRNLKPLGLRVTRLASGLPVGGDLEYADEVTLGRAFAGRRSADD
>tr|E9F284|E9F284_METRA Cytochrome b-c1 complex subunit Rieske, mitochondrial OS=Metarhizium robertsii (strain ARSEF 23 / ATCC MYA-3075) OX=655844 GN=MAA_06282 PE=3 SV=1
MASLTSASRLCLRSAAKPAMPAVRALSTTAMRSDSAASSYQSPFKMGSDKGSSIPDFGKYMSKKGEGNNKLFSYFMVGTMGALSAAGAKSTVQEFLVNMSASADVLAMAKVEVDLNAIPEGKNVIIKWRGKPVFIRHRTQDEIDQANKVNVASLRDPQTDDERVKQPEWLVMLGVCTHLGCVPIGEAGDFGGWFCPCHGSHYDISGRIRKGPAPLNLEIPEYDFPEEGKLVVG
>tr|A0A2M7QIU8|A0A2M7QIU8_9BACT Restriction endonuclease (Fragment) OS=Candidatus Roizmanbacteria bacterium CG_4_10_14_0_8_um_filter_33_9 OX=1974826 GN=COY87_02155 PE=4 SV=1
MLFKNDWEKTVYESENKIIDFENKLKNITQFPKGKERDCIVKSRINQN
>tr|B1KM11|B1KM11_SHEWM AAA ATPase central domain protein OS=Shewanella woodyi (strain ATCC 51908 / MS32) OX=392500 GN=Swoo_4641 PE=3 SV=1
MDNNYINSMEQALSLSPDNFILRITLIQALYEHQQLSTALSLLKEVESCQVEQELHQILAAKIFIESGDGENALLFLSSNLPEVKILKAKAYQILNEFSLAREFYVEAVKENSSLEDIDFARELRVAKDALDNSKRIKLTVVANDDTDAVEVTRLIKPREEVISFSEVGGLADVKKQIRKKIITPFQKPSLFQRFKKKVGGGILLFGPPGCGKTLLARATAGECNATFINVVISDILDMYIGESEKKLHAIFEQARQNTPSVIFFDEIESLAAKRQHTREATSAKLVSQFLSELDGFAQNNHGVLILGATNVPWALDPAFRRPGRFDRVVFIAPPDVDARTDILKGLLKDRPGGESVDAQKIARLTSGFSGADLMNLVETAVDEAIDHSIESGEEVPLNQTFVKEALKEVNPTTLEWLTMARNYAKYANDSGQYNEVLAFLRKHGK
>tr|A0A2T7C6Y6|A0A2T7C6Y6_9POAL Glyco_trans_2-like domain-containing protein OS=Panicum hallii var. hallii OX=1504633 GN=GQ55_9G257400 PE=4 SV=1
MAPTTVVGSSSQLSPHPNVLLLVPLPLVASRPPTPPPSAGRSYHHGITPTPTHPALSKPNRKKGARSQSCCTRAHPPPHSSLRSVRSKQGTQPARVPMPALAAAAAAWALRAAVWACLAASAMLVAEAAYMGLASLVAAVALWRRPGRRYRWEPMPGGVGGDVEAGPAAAAEFPMVLVQIPMYNEREVYKLSISAACALTWPPDRIIIQVLDDSTDPIIKELVELECLDWASKKINIKYEVRNNRKGYKAGALKKGMEHIYAQQCDFVAIFDADFQPESDFLLKTIPFLVHNPKIALIQTRWEFVNYDVCLMTRIQKMSLDYHFKVEQESGSFVHSFFGFNGTAGVWRVSAINQSGGWKDRTTVEDMDLAVRASLNGWEFLYVGDIRVKSELPSTFQAYRHQQHRWTCGAANLFRKMAWEIITNKEVSIWKKHHLLYSFFFVRRVIAPLVTFLFYCVVIPLSAMVPGVSIPVWGLFYIPTAITCMNAIRNPGSLHLMPFWILFENVMSMHRMRAALSGLLETARANDWVVTEKVGDPAKDDLDVPLLEPVKPTECVERIYIPEILLALCLLICASYDLVLGSHKYYLYIYLQAFAFIVMGFGFVGTRTPCS
>tr|A0A3N5TBJ3|A0A3N5TBJ3_9DELT NlpC/P60 family protein OS=Deltaproteobacteria bacterium OX=2026735 GN=EHM37_16680 PE=3 SV=1
MGRLVRGTMILPFFVLMAAGCTPKYDYTIHKPRVVYQQPSRQALRTSLGEILGKKYVWAEEGPEAFDCSGLTYYAFGRMNLEIPRVSSDQAQGGVEVPRDALQYGDLVFFDTGKNFTGTVTHVGVYIGDEKFQQASTNYGKVVISSLNDSNYANRFLTARRYLTDAASPRQTPTGWARNHGY
>tr|A0A418MJS3|A0A418MJS3_9BACT Uncharacterized protein OS=Fibrisoma montanum OX=2305895 GN=DYU11_05040 PE=4 SV=1
MKSALSKGLLVVAVLSLASCDYQKYNTIRQSDYRGNDPYVYGPNKDSAAIQSKYKYTPNPALEERTQKIREKLFGAGTIGEGA
>tr|A0A2Z5TXE8|A0A2Z5TXE8_9MYCO Putative lipoprotein LppW OS=Mycobacterium pseudoshottsii JCM 15466 OX=1136880 GN=lppW PE=4 SV=1
MRARPLTMLTAAAAVALVVSLVLTGCEAKVQAKAYGTDDRESSRQQSQPQQQQLIELLLRAITPPEDPAALLPSAGLVGVQERIQRATEEAAAKGATITVAILDRATHQLVSNGKTSIIATASVSKLFIADELLLRASQGKNTLSAQDRQALENMLRSSDDGAAEQFWGELGGDAIVTEIATRYGLAATAPPSDGRWWNTFSSAPDLIRYYEMLLDGEGGLPLQSAAIIVNDLAQSTPNGIDGYPQRFGIPDGLYAEPVAVKQGWMCCIGADWMHLSTGIIGSDRRYIMVIESLQASDDATARETITQAVKTIFPAGRI
>tr|A0A839NTR2|A0A839NTR2_9SPHI Large subunit ribosomal protein L5 OS=Sphingobacterium sp. JUb56 OX=2587145 GN=FHR29_003793 PE=4 SV=1
MTYVPRLKVKYAEEIRTALKEKFQYKSVMQVPKLEKIVVSQGVGAATSDKKLIDNALSELTLITGQQAVATKSKKDISNFKLRKGMPVGARVTLRDNNMYEFLDRLIAVSLPRIRDFRGINDKGFDGRGNYNLGITEQIIFPEINIDKINKIQGMDITFVTSAGNDVEALELLKQFGLPFKNQNTNNNG
>tr|A0A432QAS4|A0A432QAS4_9DELT Bifunctional 4'-phosphopantothenoylcysteine decarboxylase/phosphopantothenoylcysteine synthetase (Fragment) OS=Desulfobulbus sp. OX=895 GN=DSY50_03665 PE=4 SV=1
PARYLSNRSSGKMGYALARVARRRGGRVTLVSGPVNLAPPPDVECVNVLTAAEMHQAVMERAADSSIIIKAAAVADFKPQESSPRKIKKSGADLTLELTANPDILAGLGKARTDHQLLVGFAAESDNHEDEGQRKLYDKNVDLMVVNDILGEKTGFDVDTNQVTLITRKNVLPLPFLSKEETAGRILDKILELSRK
>tr|A0A840G848|A0A840G848_9BRAD 3-carboxy-cis,cis-muconate cycloisomerase OS=Bradyrhizobium sp. CIR18 OX=2663839 GN=GGD65_001449 PE=4 SV=1
MSTSLSPLLAPMLSSAAMRAVCDDRSTLQNMLDFEAALARAEAATDVIPASAVVSIEAACKADSFDMTALAEAATRSGNLAIPLVKMLTANVGKADTEAARYVHWGATSQDVIDTATMLTLRAGLDALDADLSRAIRGFAALARSHRNTAMVARTWLQHALPMPFGLKAAEYAASLARARCRLRRLSREGLALQFGGAAGTLAALGDKGLAVAERLAQELNLPLPEAPWHTHRDRIAEAASAFAILAGTCGKIARDVSLMMQTDVGEAFEPAGEGRGGSSTMPHKRNPVSAASALGAATMAPQLAATIFAAQVQDHERSAGPWHAEWPTLPQLMLVTSGALAAIVDIAEGLDVDAARMRSNLDATHGLIMAEAVTFALADKIGKSDAHHLIEAASKRAVAEKKHLREVLTADSQVTAHLSPEKIAALFEPMAYQGASQALIDRLLDSLDRK
>tr|A0A7N8WV28|A0A7N8WV28_9TELE Transducin-like enhancer protein 4 OS=Mastacembelus armatus OX=205130 PE=3 SV=1
MYPPARHPVPHQPGQPFKFTVTESCDRIKEEFQFLQAQYHSLKLECEKLASEKTEMQRHYVMYYEMSYGLNIEMHKQVGNFFFFFLLECQQEVKPHYSRCQMNAQQQLQAQHLSHGHAIPVPLTPHPAGLQPPLPPGAGTASLLALSSALSHQLPLKDERKHHDNNSEHPRGKDCPVCVYLKIKCPSVCVCQESDGEKSDDNLVVDVSNEDPASPHGSPAHSPRENGLDKNRLLKKDAPLSPSSVASSSSTPSSKSKEINLKSTTPVSKSSTPTSRSDALTPSSTATPGLRSAPGKPSGVDTLAPGLRTPLAVPCSYPGPFGMVPHPGMNGELSGVGAAYTGLHNISPQMSAVAAAAVYSFVVGFDPHHHIRVPGLPPNLSGIPGGKPAYSFHVSADGQMQPVPFPPDALIGPGIPRHARQINTLSHGEVVCAVTISNPTRHVYTGGKGCVKVWDISHPGNKTPVSQLDCLNRDNYIRSCRLLPDGRTLIVGGEASTLSIWDLATPTPRIKAELTSSAPACYALAISPDSKVCFSCCSDGNIAVWDLHNQTLVRQFQGHTDGASCIDISNDGTKLWTGGLDNTVRSWDLREGRQLQQHDFTSQIFSLGYCPTGEWLAVGMENSNVEVLHVTKPDKYQLHLHESCVLSLRFAHCGKWFVSTGKDNLLNAWRTPYGASIFQSKESSSVLSCDISIDDKYIVTGSGDKKATVYEVIY
>tr|A0A3D9SW97|A0A3D9SW97_9ACTN Uncharacterized protein OS=Thermomonospora umbrina OX=111806 GN=DFJ69_4288 PE=4 SV=1
MLTSKTKVAMGGVALGVIALWLIPGWILTLLVLGAIAVPVAAYLMLDPSQRRKVRARGRKRLGA
>tr|A0A2U3LCS8|A0A2U3LCS8_9DELT PC4 domain-containing protein OS=Syntrophobacter sp. SbD1 OX=2043167 GN=SBDP1_820009 PE=4 SV=1
MAKEPQIVHSFPKNPLEEVRSSVTYYKGKQYVDIRIYYKGDDGEFHPSKKGVTLSVELFPELETGFQKLKEALEEEQ
>tr|A0A173RRC4|A0A173RRC4_9FIRM Auxin efflux carrier OS=Faecalibacterium prausnitzii OX=853 GN=ERS852582_00615 PE=3 SV=1
MELALITAQQVAVLFLLIGTGMVAVKTGVLKLENKQALSNLLVYIIVPAMVVNSYRMEFSAQILHNLLAAFGMSVLSVLLGTVITLLLTARKTGSRMPIFRFACIFSNAAYMGFPLISALFGSEGLLYASAYVTVFNILLWTLGYGLVSGGSSVKEIARSLVRTPVLYAIVVGLGIYLLQIPLPALITQPLELLAGVNTPLSMLITGMLIAAGDVRSIVTDKHIWKLASVRMLLIPAATLALFGVLGFHGTATQVVTLLECCPAAAITSVFAVQFGHDEHFAAGSVVLTTLLSIITLPLCALIITMVM
>tr|A0A3M1TWK5|A0A3M1TWK5_9BACT Uncharacterized protein OS=Bacteroidetes bacterium OX=1898104 GN=D6730_19965 PE=4 SV=1
MLIGQNPCVCIHKGFFFERKNRLPSAAHNNAAVGALSYRNVKNTGPMAPKGDKCLIFNFRK
>tr|A0A7C3Z4Q6|A0A7C3Z4Q6_9BACT Uncharacterized protein OS=bacterium OX=1869227 GN=ENW92_06685 PE=4 SV=1
MSKFNETIRGIEDRLDLLQDNIQAIKDDLKILDSISTKIDVLTEQVKSHDIILNGNGSEGLKSKISRFEEIISVLKEKIDNIVTLLFGDLNNEGIKSKINLIDFKIGLISAIGGVAGAVAVTIMSDTIVNLIKKIF
>tr|A0A2T6RAW0|A0A2T6RAW0_HELPX Methionine--tRNA ligase OS=Helicobacter pylori OX=210 GN=metG PE=3 SV=1
MQKSLITTPIYYVNDVPHIGHAYTTLIADTLKKYYTLQGEEVFFLTGTDEHGQKIEQSARLRNQSPKAYADSISAIFKDQWDFFNLDYDGFIRTTDSEHQKCVQNAFEIMFEKGDIYKGTYSGYYCVSCESYCAISKTDNTNDKVLCPDCLRETTLLEEESYFFRLSAYEKPLLDFYAKNPEAILPIYRKNEVTSFIEQGLLDLSITRTSFEWGIPLPKKMNDPKHVVYVWLDALLNYASALGYLNGLDNKMAHFERARHIVGKDILRFHAIYWPAFLMSLNLPLFKQLCVHGWWTIEGVKMSKSLGNVLDAQKIAMEYGIEELRYFLLREVPFGQDGDFSKKALIERINANLNNDLGNLLNRLLGMAKKYFNHSLKSAKITAYYSKELEKAHQILDNANSFVPKMQLHKALEELFNVYDFLNKLIAKEEPWVLHKNNESEKLEALLSLIANALLQSSFLLYAFMPKSAVKLASAFNTEITPDNYERFFKAKKLQDMILQDTEPLFSKMEKIERTEKAGEASPEKNEKEKKDRKEKAPLKQENYIGIEDFKKVEIKVGLIKEAQRIEKSNKLLRLKVDLGEGRLRQVISGIALDYEPESLVGQMVCVVANLKPAKLMGEMSEGMILAVRDSDNLALISPTREKIAGSLIS
>tr|A0A6P8YKE1|A0A6P8YKE1_THRPL Non-specific serine/threonine protein kinase OS=Thrips palmi OX=161013 GN=LOC117644815 PE=4 SV=1
MEIVGDYEYNSKDLIGHGAFAVVFKGRKRKDPNYVVAIKSISKKSLAKSQNLLGKEIKILKELTELHHENVVALLDCKESPLQVFLVMEYCNGGDLADYLSVKGTLSEDTIRLFLRQLAGAMKALYAKGIVHRDLKPQNILLSHSGGKPCPQPQEIRLKIADFGFARFLQDGVMAATLCGSPMYMAPEVIMSLQYDAKADLWSLGTIVFQCLTGKAPFQAQTPQALKNFYEKNANLSPKIPAGTSPELRDLLLGLLRRNARERMTFDSFFTHPFLQREAEPTPAPPMPGELPPSPRALFQPPATQSPTHKARLDTCGSQPVPANIPSDHSSDSNPERPSRTRTSSASAASPPRPSFLPISEPIPVPTHRDAFQQRQSIHSQDNEPSKGSVPRSQPINMRRASDQRAANATPDLSSLSPPAVQFMIGTPPNGGCGQRRRSASGSSCETPPPVSTWQVTPTSSPLRRSGASSPLLSGPLAVLPSILGSPNRMSENNNMRQSPLMPFGSRAMTLPEISEAGNFQRLFQDANQPSNIDAPLTFLAPELPEETLLEREHNETLAKLHFVLALSDCVLELAGSRGTPLAALTESVNLGGGGSPNGSSNITGNGVISEGARRAEQLVLLVRALQLLSSGLSLATQQIRAGHLQPSSSVKSVVGIMNQKFRQCLADCKQLNTPGLLQKAGVDPATTNIAADKILYNHAIQMCQSAALDELFGNPEDCFQRYQTAQILLHSLSQQVHHQQDRALLTKYKDAVEKRLFVLQQQGFIYSTQCFTHLA
>tr|A0A151YSI4|A0A151YSI4_9GAMM Mandelate dehydrogenase OS=Acinetobacter lactucae OX=1785128 GN=AWW73_12870 PE=3 SV=1
MSRKLINVEDYRLQAKRTLPRIIFDYLEGGAEDEKGLNHNRTIFDQFRLKPKRLVDISQRDISCKIFNKKWDAPFAIAPTGLNSSLWPHADSILAKSAAKANIPFMLSTASNMSIEAVAKSCDGEKWFQLYVVHQELAVKMVQRALSAGYTTLIITLDVGVNGYRERDIRNGFAIPLKFSPSLILDGMMHPGWSLRFLSQGMPKLANFESSEAHSLEVQNALLKRQMDTTFNLESLKKIRDLWPHTLLVKGLVRQEDALKAIEAGADGVILSNHGGRQLDCSISPMETLYEVSQTIEQPVLIDSGFRRGSDIVKALCLGANMVCLGRATLYGLAANGEAGVDDVIQLLKQDVDRTLAQIGCPSVSQLNKEYIT
>tr|A0A502DVG8|A0A502DVG8_9MYCO Uncharacterized protein OS=Mycolicibacterium hodleri OX=49897 GN=EAH80_27785 PE=4 SV=1
MERTDRRKAQAAIIGGTALLAMGIIGGAAGGPGDGKTALVSGGSMQTGETTTLTYTGTIAPVKAVPSVKATPH
>tr|A0A6P7I339|A0A6P7I339_9TELE caM kinase-like vesicle-associated protein OS=Parambassis ranga OX=210632 GN=camkv PE=4 SV=1
MPFGCLTIGEKKDYNSPSDVTDKYDLGQIVKSEEFCEIFRAKDKTTVKMYTCKKFMKKDGRKVRKAAKNEIFILKMVKHPNILQLVDVFETKKEYFLFLELATGREVFDWILDQGYYSERDTSNVVRQVLEAVAYLHSLHIVHRNLKLENLVYYNRLKHSKIVISDFHLAKLENGLIKDPCGTPEYLAPEVVARQRYGRPVDCWATGVIMYILLSGNPPFYDETDDDDYENHDKNLFRKILAGDYEFDSPYWDDISDSAKSLVARLMEVDQDQRLTAQEAINHEWISGGAASDKNIKENVCAQIEKNFARAKWKKAVRVTTIMKRLRAPEQSDSRSTSPAAGTPADTAAPPADPAAPSSAAVPEVSPAAVTELPAGAPPEAGAGAAAEEPQPPNPALQVAEPASRCNGEASAILHTAAEAGDEQG
>tr|A0A521F3G2|A0A521F3G2_9RHOB Do/DeqQ family serine protease OS=Ruegeria faecimaris OX=686389 GN=SAMN06265380_11652 PE=4 SV=1
MRKVLCSLLLTVAAVSAKAETKVPQTQVEISLGFAPVVKQAAPAVVNIYAKIVREGRSNSLFSDPFFQDFFGGGFGEPRPRVQNSLGSGVILTDDGYVVSNYHVVGSATEIRVVTTDRREFSAEVVLGDQESDIAILRLKDAEALPSIDMRDSDLVEVGELALAIGNPFGVGQTVSSGIISGLARTGTATGNARGYFIQTDAAINPGNSGGALIDVNGDLIGINTSILTRSGGSNGIGFAIPANLVAEFLRQAQAGNDSFVSPWAGMAGQHMSADIAESLGLVIPQGVVISDLHALSPLAEAGLQVGDVVTHVDGDEVNSPAEMKFRMSVAGVGGTSVVTRLRGEDRAELEVALVKAPEVPAAEVTTLNDETVMPGLTVSRINPAVIARLGLLLSQTGVVVVDAGRYGGRSGLRPGDVVDGINGARVERPADVVKALTDPGRRINLDILRGGRPVSLRFRL
>tr|A0A1H9D944|A0A1H9D944_9BACT Monosaccharide ABC transporter substrate-binding protein, CUT2 family OS=bacterium A52C2 OX=1855383 GN=SAMN05216548_102373 PE=4 SV=1
MKSIRSLAVALALGVAAVVSAQAEAADITVGFVPGTVSDPFFQAMKKGAQQAADRLGMKLNWQGSSGEYSPQQQLPFVDAMLANNVSVLIFCPTDPDSMQASVTKAQIQGIPVITVDTTVTDQSSVTSFITGDNVAGGRQAAQTLAEQIGNKGKVFIMATSPSATTNTLRRQGFEEEMKNHPDIKIVGIQYSQSQPDRATSAVNTVLLDQPDLAGVFALDGTNTQGAVAAIRNSGKTGKVKLVGYDAYQAEVDALKDGVVTALVAQRPSEEANMAMEFALAKVSGKDTDKIQKNAVIPNVVITKDNLSENEKYVYSE
>tr|I7C407|I7C407_PSEPT Sulfate adenylyltransferase subunit 1 OS=Pseudomonas putida (strain DOT-T1E) OX=1196325 GN=cysN PE=3 SV=1
MSHQSDLISEDILAYLAQHERKELLRFLTCGNVDDGKSTLIGRLLHDSKMIYEDHLEAITRDSKKVGTTGEEVDLALLVDGLQAEREQGITIDVAYRYFSTAKRKFIIADTPGHEQYTRNMATGASTCDLAIILVDARYGVQTQTRRHSYIASLLGIKHIVVAVNKMDLKGFDEGVFESIKADYLKFAEAINLTPSSLHFVPMSALKGDNVVNHSEQSPWYAGPTLMEILETVEVSADRNFTDLRFPVQYVNRPNLNFRGFAGTIASGVVHKGDEIVVLPSGKSSRVKSIVTYEGELENAGPGQAVTLTMEDEIDISRGDLLVHADNVPPVTDQFDAMLVWMAEEPMLPGKKYDIKRATSYVPGSIASITHKVDVNTLEQGAASALQLNEIGRVKVALDTSIALDGYDSNRTTGAFIVIDRLTNGTVGAGMIIAPPVLPHGSTGHHGKQAHVSTEERALRFGQQPATVLFSGLSGAGKSTLAYAVERKLFDMGRAVYVLDGQNLRHDLNKGLPQDRAGRTENWRRAAHVARQFNEAGMLTLAAFVAPDAEGREQAKALIGKERLVTVYVQASPLVCRERDPQGLYAAGGDNIPGESFPFDVPLDADLVIDTQATSVDEGVKQVLDVLRQRGAI
>tr|A0A2P5F9R2|A0A2P5F9R2_TREOI Son of sevenless protein OS=Trema orientale OX=63057 GN=TorRG33x02_095620 PE=4 SV=1
MARRTAQVLDSIHLMNTTQIFKESIRVILLHPTQFHSISIFLFSPLPISLFISHLLIHHFPNIPSSTISLTHNLFGFPLPKLFSKTMIHIIICFPSSITFSLLGRAAIVQAVSDIYNGINLDGRRLFMRSGLTWIKLLYTTFWEYLIVFGLLGVFALNLVIMPKMFHAFGICSEILGFWGVLGVLGIPFCVAFAHVMVVGNLARVLSVLEGNCYGFESLLKAKSLMEGRRQIALVMALLSNIGFRLVESLFEFRMCKGINLWEGPLLVSMYSSVLVFDTVMNVVFCYACKSFNDQ
>tr|S1PYQ0|S1PYQ0_ECOLX Starvation-sensing protein RspB OS=Escherichia coli KTE182 OX=1181728 GN=A13A_01543 PE=3 SV=1
MKSILIEKPNQLSIIEREIPTPSAGEVRVKVKLAGICGSDSHIYRGHNPFAKYPRVIGHEFFGVIDAVGDGVESARVGERVAVDPVVSCRHCYPCSIGKPNVCTTLAVLGVHADGGFSEYAVVPAKNAWKIPEAVADQYAVMIEPFTIAANVTGHGQPTENDTVLVYGAGPIGLTIVQVLKGVYNVKNVIVADRIDERLEKAKESGADWAINNSQTPLGESFAEKGIKPTLIIDAACHPSILKEAVTLASPAARIVLMGFSSEPSEVIQQGITGKELSIFSSRLNANKFPVVIDWLSKGLIKPEKLITHTFDFQHVADAISLFEQDQKHCCKVLLTFSE
>tr|A0A0D8JWE6|A0A0D8JWE6_COCIM Uncharacterized protein OS=Coccidioides immitis (strain RS) OX=246410 GN=CIMG_11771 PE=4 SV=1
MVHPEPDRIQTGIANDAPVNRLLLPSTSLLDTQFTRTPLGFRGGPDEFPADVDKEFTKSE
>tr|Q4S6C8|Q4S6C8_TETNG Chromosome 9 SCAF14729, whole genome shotgun sequence (Fragment) OS=Tetraodon nigroviridis OX=99883 GN=GSTENG00023347001 PE=4 SV=1
LLLGLFVVCGLALLGLLAFVSWKFAGAARQPAKACCSGSSLSPERHPLQPPLPLPPSPQHPLVTMATEKVKDPAGSLGFLEAAVKISHTSPDIPTDVQLSMREHFLRRTQRMQRQTTEPASSTRHNSFKRHLPRQMQVGSLDLGNDYVLEKEEKSTSLGRIQPELYQQKDLESEDSSKNSSGKNCGSINFSLKYDYENQALLVDILKAVDLPAKDLCGTSDPYVKVYLLPDRKKFQTRVHRKTLNPTFSETFRFPVPYEELAGRKLHMSVFDFDRFSRHDMIGEVELDNLFDLSDLSRETNVWRDIQYATSESVDLGEIMFSLCYLPTAGRLTLTVIKCRNLKAMDITGYSDPYVKVSLICDGRRLKKKKTSIKKNTLNPSYNEAIIFDIPPDSMDHVSLHISVMDYDLVGHNEIIGVMRVGCNAEGLGRDHWNEMLAYPRKPVAHWHPLLEPKKSEKEWKARTASFDSQGSCPSPRPPASP
>tr|A0A4Y6N1A7|A0A4Y6N1A7_SALET AI-2E family transporter OS=Salmonella enterica subsp. enterica serovar Indiana OX=286783 GN=D4X88_10560 PE=3 SV=1
MLEMLMQWYRRRFSDPEAIALLVILVAGFSILFFFSGLLAPLLVAIVLAYLLEWPTARLQAIGCSRRWAASIVLILFVGILLLMAFVVMPIAWQQGIYLIRDMPGMLNKLSDFAATLPRRYPALMDAGIIDAMAENMRTRMLNMGDSVVKYSLASLVGLLTLAVYLVLVPLMVFFLVKDKEQMLNAVRRVLPRNRGLAGQVWNEMNQQITNYIRGKVLEMVVVGVATWLGFLLFGLNYSLLLAVLVGFSVLIPYIGAFVVTIPVVGVALFQFGLGTEFWSCFAVYLIIQALDGNLLVPVLFSEAVNLHPLVIILSVVIFGGLWGFWGVFFAIPLATLIKAVVHAWPDGQVTDTSS
>tr|A0A265NA24|A0A265NA24_9BACI Serine/threonine dehydratase OS=Virgibacillus indicus OX=2024554 GN=CIL03_13610 PE=3 SV=1
MVTVKNIYKAREQISDVINKTPILSSSQLSSICGNRMFFKAEHLQKTGAFKIRGATNKVKQAVKDGATFVTAASSGNHGQAVAYIANELGVPATIVVPEDVNPSKEAAIKAYNGEIERCGLTSAERLPRAEALAAENNGGVIPPYDDPLIIAGQGTVGLEILDQLDGVDVVVVPIGGGGLISGILTAIKEIKPSIKVIGVEPEKANDTYQSIQQGKITSIKEAATIADGLRTSQPGSLTFPIVQKYVDEIVLISEAEIRKALFFILQRMKQLIEPSSAVTVAAAMFDKLNVRDKNVVCVLSGGNVDLKQLGEMNPEK
>tr|A0A2A5WAU1|A0A2A5WAU1_9GAMM Sulfite dehydrogenase OS=OM182 bacterium MED-G28 OX=1986256 GN=CNF02_07660 PE=4 SV=1
MGPKKQNRREFLKQGAAIAGGAAVGAASQSASAQLPGPEGFLHGRDDIVAYGQRSRFIESKRIPHGGRHSPDTFGLDFHIATPLQDQHGVITPSSLFYMGTTRGSYIPDIDPEKHRLMIHGLVDNPLVFTMEELKRLPSVTRMHFVECAGNRSNRRHTTVQETHGMTSNAEWTGVLLSTLLKEAGVKEGADWIVAEGVEEVKGASSIPMTKAMDDTLLAYSMNGEPVRPQQGFPLRMLAPGFEGIFNVKWLRRIKVVDQYYMTYNDYGHLTQDPATAALGYQIGPKSVIVHPSGGQTLPGAGYYQVSGLAWSGGGKVARVEVTTDGGETWFDAEIRGEPQAMAHTLFAFEWEWDGSPCELQSRCIDEIGQVQPSRAEVAEFWNQPADQPPRVRGQDNSIQPWRIESDGSIHNAIA
>tr|A0A1J5QM58|A0A1J5QM58_9ZZZZ L-cystine import ATP-binding protein TcyC OS=mine drainage metagenome OX=410659 GN=tcyC PE=4 SV=1
MSPTEEPPPMGEVLLSVHGLSKSFGANPVLRSIDLTIERGRVLALIGPSGSGKTTLLRCLNGLELADGGTINTPGELTLDFTTPPTRSQLNALRDRSGMVFQHYNLFPHKTVLQNVLEGPLVVQRRPRAEATASALELLARVGLSEKTHTYPFQLSGGQQQRVGIVRALALQPQLLLFDEPTSALDPELVGDVLRLIKELAADGWTMVIATHELEFAREVAHEIAFLDAGTILERGHPSQLLRDPQHERTRQFLHRVLHPF
>tr|A0A0M0J7I6|A0A0M0J7I6_9EUKA Cyclin-y-like protein 1-like protein OS=Chrysochromulina tobinii OX=1460289 GN=Ctob_004972 PE=4 SV=1
MGDEGLTLCARTWRPALLMAIVIASKVVYDEKVYLADYRDMLPEFCLDAASAQELELLKLVNYNTTVRRGQYARYYYALEDVARNQSSNQIFAARS
>tr|A0A7X6ZE57|A0A7X6ZE57_9FIRM Sporulation sigma-E factor-processing peptidase OS=Syntrophomonadaceae bacterium OX=2093811 GN=spoIIGA PE=3 SV=1
MTGHKVYADLTLIINLLMDAVILWAAAKLAGFKFSYTRIFFTAMLGAIYAVGYLFYPMNIFYSFPLKIIFSCFLILLAFYPQSWKDLKRAFQYFYLINFIAAGAITGFASLTAGMKHINNISILWLLMGVIIVIGLGKWGQKYLVNRIIPQLLNYMVEIKFNGHQCSGSGFLDTGNMLRDPLTNRPVLIAEYAWLKNFLPLDLIEFFETGSSETEILSFAANSTWADRVRVIPFSSIGRHNGLLLGFRADEINVSLGDRNICHKNLIVAVYRSKLCQDGHYQMLVPAEILQSG
>tr|R6ZSV7|R6ZSV7_9BACE Putative CTP pyrophosphohydrolase OS=Bacteroides fragilis CAG:47 OX=1263046 GN=BN669_00524 PE=4 SV=1
MKSIEVVAAVIRLGEKYLCVQRGQTKFSYTSFRYEFPGGKVEEGESLQEALQREIMEEMDYVIEVGEKLLTVHHTYPDFEITMHAFLCHPVGQRYVLKEHIAAQWLSTREMAILDWAEADKPIIRKISEQ
>tr|A0A535V1X9|A0A535V1X9_9CHLR APC family permease OS=Chloroflexi bacterium OX=2026724 GN=E6I76_01260 PE=4 SV=1
MRGGRARRKEFDKVAEGYLQAKEESVKPTTQLGRLRRALLGRPLASKQQIHERLTKVKALAVLSSDALSSVAYATEQILLVLGAAGAAAYSYSMPIMVAILVLLIAVGLSYRQTIKAYPKGGGSYIVASDNLGPLAGVVAGSALMTDYVLTVAVSVASGVDSIVSAASAMQAYRVELCVAFVAILIVGNLRGIRESGSIFAAPTYLFIGGILLMLVVTGLRWGTGNVHEATPMLGKATQQVSIFLILRAFASGCTALTGVEAISDGVPAFKPPEWRNARTTLTVMVVLLATMFMGITISARATGARAYDSSDPNYQTVISQLAHTAFGSTFLYYYVIGATTAILVLAANTSFSDFPRLFFFMARDDYAPHLFKRLGDRLAFSNGIIVLGGLAILLLVVFRGRTDALIPLYTIGVFVAFTMSQAGMVSRWLRLREPGWQHGLAMNAVGMTLTAIVFVVTAGDKFTEGAWIVLVLIPLLVMTFFSIHRHYSEVTVDLATETPTSPDELKPVVIVPLADLNGPALQSLALARTLSDQVIAVHISDDPDEIARLKAKWEAWGDHVPLEVIESPYRSLVRPLLAYIDAIDRQRRDDTIVVVLPEMVATRWWHQVLHNQTALRLKAALLFRPGTVVVNVPYHLRRYQHQRRRLRARHGGDDAL
>tr|A0A7T7DGS6|A0A7T7DGS6_9BETA Cy128 OS=Cynomolgus cytomegalovirus OX=1919083 PE=4 SV=1
METHLFSDLAFEQVFEEDPQLPLHVVLDPVDLSFAEAETVRYVYYRSDPDPVGRWRRAAFRVFLRPFELLTYLRDAGLMVAPTVRVVCHHALFTTLGIRCAEQRLSGAQMLYLRLVWNEERFRDWEFLVRDLLREEMSVCQSTEPADRPDPSLLMTDAMLELAKSSSTTAPFFEMPSSGTGNNNASSASAADESSQVERRVIQFLRGDSELTYHAGPLEPPSKIRGHEIVQPRIEVNPDVIYASGPHEDDRTSKTDEWQKGGVMRLGSVWDVRQRLRLHVLWYAQSFWRSRGLKYEDREEDLRLTLDSYFDRLSVEYQVLREVYREIKAVLRSDRMVAQKFSCHLSIETSWLLIWELFDRALELWRDQADVNSCIIKALAHKLRSKAQSSHGNSVSAGKTNPTETWYADVVRCVRAEVNLGLEVQVETCSQSGLWLVRGRDGQLRKWITQPQTYVLYATPGLVFHWVLPGGFAISSRVCLDGVGRDHFERFQMSAPVLTKRMLLETGWTRTEASGVPSCGL
>tr|A0A852XDT0|A0A852XDT0_9MICO GTP-binding protein Era OS=Microbacterium esteraromaticum OX=57043 GN=GGD75_001854 PE=4 SV=1
MTEQTRSGFVTFVGRPNVGKSTLTNALVGEKIAITSEKPQTTRRAIRGIVNRPDGQLVIVDTPGIHKPRTLLGERLNDLVEQVLGDVDVIGFCVPATEKVGPGDRRIAASLDGYPRAKKVAIVTKTDAADKDDIVERLMEVDSLREDWAAVIPLSALTREQLDVLADEMLQLMPVGPRLYDEGVVTDESTDDRIAEMIREAALEGVRDELPHSIAVVIDDVEPRGDSDLTDVYASIIVERDSQKAIIIGHKGSRLRSVGATARAGIEELLGTRVFLKLHVKVAKEWQRDPKQLGRLGF
>tr|A0A7G9B3G3|A0A7G9B3G3_9FIRM MarR family transcriptional regulator OS=Oscillibacter sp. NSJ-62 OX=2763056 GN=H8790_11715 PE=4 SV=1
MDKTERQTTKITREAAKLTLQTMRAEGGTAEFDFIHLVRHYPGITQAELREALKIDKGAAARRAAHLEAKGYLVRRENPADGWSQLLYATEKAEKLKNSKAGIESAFKRLIS
>tr|A0A2K6TWZ0|A0A2K6TWZ0_SAIBB DNA repair protein OS=Saimiri boliviensis boliviensis OX=39432 GN=XRCC3 PE=3 SV=1
MRPLFCLSCEVNHPGDQPTDRMDLDLLDLNPRIIAAIKKAKLKSVKEVLHFSGPDLKRLTNLSSPEVWHLLRTASLHLRGSSILTALHLCQQKERFPAQHQRLSLGCPVLDALLRGGLPLDGITELAGHSSAGKTQLALQLCLAVQFPRQHGGLEAGAVYICTEDAFPHKRLQQLMAHQPRLRTDVPGELLQKLRFGSQIFIEHAADVDTLLECVNKKVPVLLSRGMARLVVIDSVAAPFRCEFDSQASIPRARCLQSLGATLRELSSAFQSPVLCINQVTEAVEEQSTVHGPPGFWDERISPALGITWANQLLVRLLADRLREEEAALGQPVRTLRVLFAPHLPPSSCSYTVSTEGVRGTPGTQSH
>tr|A0A2M7XMW0|A0A2M7XMW0_9BACT Uncharacterized protein OS=Candidatus Shapirobacteria bacterium CG_4_9_14_3_um_filter_36_12 OX=1974877 GN=CO168_02590 PE=3 SV=1
MVETELLKNLKTYFGYDGFRALQEEVVGATLAGKDSLVLMPTGGGKSICFQLSALMLPGITLVISPLIALMKDQVDSLKNNGIKAEFINSSLTTGEILRIETEIIGGKIKLLYVAPERLVLPQFLEFLKTIKISLIAVDEAHCISEWGHDFRPDYRNLTILRQNFPSVPIMALTASATEKVRQDIGLKLNLNNHQLFISSFNRPNLYYTVLPKRNTFEQLLSLVEKYKNNSIIIYAFSRKETDELAVNLSTQGYQALAYHAGLESNIRREVQDKFIKDEVKIIVATIAFGMGIDKSDVRLVVHYSLPKSVESYYQETGRAGRDGEKSECVLFYSYGDTAKQNYFIRMMTDGVVRLNAQKKLREMVNYCELKSCRRQYLLKYFGEELGNNCQSCDCCVKSPPTPSLTKEGNLNLFEKLRILRKQIANQNKVPPYIIFSDATLREMVSFLPKNETEFLKINGVGAEKLKRYGRQFLETINSQNAPKVFLSGTYLETQKMWVAGLSIEQIAKNRGYTNETIINHLEKIIESGVQLNLDKIIFDPTRLKIIKDAFAQTNDTKLAPIKAILDDDYSYEEIRLGRLMVAK
>tr|B4ELZ0|B4ELZ0_BURCJ LysR family regulatory protein OS=Burkholderia cenocepacia (strain ATCC BAA-245 / DSM 16553 / LMG 16656 / NCTC 13227 / J2315 / CF5610) OX=216591 GN=BCAM2812 PE=3 SV=1
MTEQSKNLQSGYAAHAYPLADLTRPLPPLAAIQSFVAAAQLGSVSKAADHLCRTQGAVSRQIQQLETHYRCALFVRHVSGLTLTAEGNALLTVAVNVLTQLVRHADVHARATSVLTLKLPSTFAVRWLLPRLPDIQRAMSGTELRISTSADDTPDFTTSDVDAVVVRGTGQWTGMEAIPLFAEMLTPMCAPALAASLRSVADLAQVELLHPGPSHAEWRCWLDHVGARQVDAGRGLVFDTLELTLAASMEGHGVAIGDPRMARDRLRAGSLVTPFEDVARDGLSYFLVYPPQRAAQPKIRALADVLLRLAREDR
>tr|E9HNJ7|E9HNJ7_DAPPU Uncharacterized protein OS=Daphnia pulex OX=6669 GN=DAPPUDRAFT_116105 PE=4 SV=1
MPCSVVLNENVLHISWELALYGASRISFSDHSAHCFRRKLQCCPCHTPPGVSCGQQLGKCVYVREIFVLRFRSVYPSLAREWLPRIRRWCSWSDLKSVVDKFASLACCKLGYIIPHPKIMASRIGAYRSGSVLAGGRQAGVTVRPGIQYRLMGLGKLAILFAHECPPHLVHFVRFVWDGTGRSAVLRRHQGADGNVAAAGPASSGSLAEEHQRRRAAARPARRQGSRPGLHGEPATDVGDGPQQRRDDGQPDRQSNVGPVVDGSTSAFGRTQEPHRHSVSRLEDSATQTQMEESFFSENKDGTEIQLSSAGVRLSETESGLRRQRIRRRAQQRRFLTDPRPPPNDEEFRWKSRQRYSDDSGSESDDEQHLPGLRYHQQQQQQRPNLSQYVSDSGAPGTGGSGGDGSSQGLSNINTVHLEPLVKSSQVATDLAVRSQSILSNVGTESSGQNNSGFSDLVARSEEDINSSALSRRTDSAILLLDHIGSPSEQQMMNGPDGENLNRSSSSLNKKTTTHSPLMDDVESSRKRTKSERRSEHEGSSAHPPTATHPHSERIKYKAEIPISVIRAAQAKTRRYNLERKIFQQLLDWKQMQIRIGQANEHQLRLVQGGRTLLPLVDSATDREDAATTNGLKYGDVIETESANGTSRTTTTTMPVEKGTHTTQRCPHAMYACTTLPPALAARPCPALPLVISRFSMDVVVEPIDFDSFEGLLVSFLNDSAVPYHKHHRPVTQQHQQPQQPTNHPGTAKLTTENGRIILPKLNLNNNINGHQKSNAPANKGNH
>tr|A0A6P1MDY7|A0A6P1MDY7_9FIRM Type II secretion protein F OS=Aminipila sp. CBA3637 OX=2697030 GN=Ami3637_02060 PE=4 SV=1
MLTYFIAFFAAILTYFIILLIKKNSGREFIENRLNKYLNKDAISRIQDQFYKEKIEKYKKKKDRNFKIASKEFSDYLAMSGIKLRASEFIYIWIIMTYLPILIISLSGLSIVTAAGFAIVGFIIPPLFIHKSRRKRQTEFNKQLGESLVVMSNCIKSGFTFQQSMESIANDMQPPISVEFTKTLREMRFGVNKNDALHHMVNRVQNNDLGLLVSAVITSEQVGGNLSEILDTISDTIKDRIRIKQEVRVLTAQGRMSGIVIGLLPIFIIILLMILNPQYFLSFFETSIGKIMIGVSILMELIGFVIINKIVDIEY
>tr|A1JPW7|A1JPW7_YERE8 Peptidoglycan D,D-transpeptidase MrdA OS=Yersinia enterocolitica serotype O:8 / biotype 1B (strain NCTC 13174 / 8081) OX=393305 GN=pbpA PE=3 SV=1
MKKEPNPFRDYSAESALFVRRALVAFLGILLLSGILVANMYNLQIVRFEDYRTRSNENRIKLVPIAPSRGMIFDRNGTPLAMNRTIYQLELMPEKIEDLPATLNALRPIVDLTDEDIANFEKERKRSRRFTSIAVKTPLTEVQVARFAVNQFRFPGIEVKGYQRRFYPYGSALTHVIGYVSKINDKDVERLDKEGILANYAATHDIGKLGIERYYESVLHGKTGYEEVEVNNRGRVIRQLHEQPPQAGKDIYLTLDLHLQTYIEQLLSGSRAAVVVTDPRTGGILALVSNPSYDPNLFVDGISNKDYQGLLNDPNRPLINRATQGVYPPASTVKPYIAVSALSAGVITKNTSLFDPGWWQLPGSEKRFRDWKKWGHGRLNVTKALEESADTFFYQVAYDMGIDRLSSWMSKFGYGEYTGIDLSEERAGLMPTREWKQKRHKKPWYQGDTIPVGIGQGYWTATPIQMAKALMTLINDGAVKTPHLLQSTRIDGVLVPYKQEDSTQIGDIHSGYWEIAKDGMYGVANRPNGTGRKFFEGTPYKAAAKSGTAQVYSYETYNAHKVAEHLRDHKLMVAFAPYENPTVSVAMILENGGAGPAVGTITRQILDHILLGDNNTELPDAAPLPPGVEAD
>tr|A0A7K2NHN8|A0A7K2NHN8_9ACTN Indole-3-glycerol phosphate synthase OS=Streptomyces sp. SID5468 OX=2690295 GN=GTW54_22445 PE=4 SV=1
MITTVLMIEKPLAPVDVQLVTTLHSDEAVSFVVLMQPRGDQERLLRALDDVALGELREAAREEEEPEGDQALAPAVHALEHSLKALRATGAEAVGQIVEEHPLDLLRSVVEQTGADEVIVLTAPHLVEEFFHRDWASRARHKVGVPVLKLYAHND
>tr|A0A132DP21|A0A132DP21_BURVI NAD(P)H quinone oxidoreductase OS=Burkholderia vietnamiensis OX=60552 GN=BvRS1_03110 PE=4 SV=1
MKAITFKEFGDAEVLQLAEVAAPEVRPDDLLVRVHAAGVNRADLTHRRGGYGRPNFGDSTIMGLEIAGEVIETGSSVQGYKVGDRVMGVVGGGAYAERARIDWRMAMPIPATLDYVHAAAIPEVFVTAHEALLHLGRLQRGDAVLIHAAAGGVGSAAVQLAYATGATIFATAEASKLERIVQLGVDHAIDYKTQDFSEVVASRTGKRGVDVVIDFVGAPYFSRNVASLANGGRLVQVGILGGGGDVSVSLEQILYRHLQIIGTVMKSRDQSEKHAMVRRFREHWLDRFAGGAGLEPVVDSVFPLADAAAAHRRMESAVNVGKIILTMSEDS
>tr|A0A1G8CMD4|A0A1G8CMD4_9PSED Peroxiredoxin, Ohr subfamily OS=Pseudomonas panipatensis OX=428992 GN=SAMN05216272_101672 PE=3 SV=1
MHSIKALYTATATATGGRDGRAVSSDGILDVKLSTPRELGGQGGAATNPEQLFAAGYSACFIGALKFVASQSKRQIPADSSITGKVGIGQIPGGFGLEVELNISLPGLDRTVAEELVAAAHQVCPYSNATRGNIEVRLNVAV
>tr|A0A1Q8LW97|A0A1Q8LW97_9PSEU Methyltransf_21 domain-containing protein OS=Pseudonocardia sp. Ae717_Ps2 OX=1885573 GN=Ae717Ps2_3992 PE=4 SV=1
MTGPRLSFVGRSRVRARRLLARLLRAVPGRTVDWAHRHWITDDGRTDPRWAPVARLLFHRPLHQTVVTVPGSGGIRLHVVGARLERTLYWFGEQGYEPGEAAWWRLLCSRATAVLEIGSNIGWYTTVGAAAAPVGGYLAVEANPEAARATRRNLELNGLGHGAVLTAAAVGQGAPSSLYLALPDQESFSAAPTGSYLRGHTEGTADRAARRSLTVPTLSARHLITGRDLVKLDVEGAEAGILESALDIILRDRPILLVERMPDTPRLDRVLEQLVGGGYLVLRLGTQLQPAGPRPPVDEHYDVLLVPAERGAVPVHLGDLR
>tr|A0A165XXG3|A0A165XXG3_9BILA Cytochrome c oxidase subunit 1 (Fragment) OS=Keratella cochlearis OX=204738 GN=CO1 PE=3 SV=1
TLYFIFGIWAGFIGLSMSLLIRLELGVVGPFLSDEHLYNVIVTAHAFIMIFFMVMPISMGGFGNWLIPLMLGVADMAFPRMNNLSFWLLIPSFTFLLLSSILDSGVGTGWTVYPPLSDSKYHSGISVDLAIFSLHLAGISSILGSINFLTTIICSRTTKVISLDRMPLMLWAISVTAILLITSLPVLXGAXSMLLTDRNLNTSFFDP
>tr|A3XB71|A3XB71_9RHOB Uncharacterized protein OS=Roseobacter sp. MED193 OX=314262 GN=MED193_21946 PE=4 SV=1
MLWTTIQNAILVSMIDLYSAEPDFEAEITILRVEEGGRTVPPHNYIRWDFGYAEDNPLEPRRNLSANIYMIYPNFLNEDGVPIPKGVPLNGTYNAYMHILVRDMVDYHQSRLSVGTNFNCHEGSRIVARGTVTKLRAISP
>tr|A0A7V5NXA8|A0A7V5NXA8_9PROT RNA polymerase sigma-54 factor OS=Hellea balneolensis OX=287478 GN=rpoN PE=3 SV=1
MALAPKLQQKQAQGLTMTPQLQQAIKLLAMTNLELQLFVEEQLQSNPLLERGTGTENRRGENVPEGKPDEAGPEELQLGEASPVALEALDVSAETLEPDSAPSDLPSSGGEIDWSRAGNGGSFNPSSGLDRLENTAAQKTLKQVLSEQLVIAFPSGQERLIGAHLIDQVDENGYLHASLSEMAERLGVEQTQLETILAKLQTFEPCGVMARSLSECLRLQLREKGELDGPMQRLLDNLELLARHDMQGLAKCCGLDREALGAYVKRLKALAPKPGLAYGSDVAQAVAPDVFVRARPDGGWAVELNTETLPQILVNARYYAEVCSSAKDEKVKSYMSECAQNASWLVKSLDQRARTILKVASEIVRHQDAFFAYGVNHLRPLTLKTIAEAIDMHESTVSRVTANKYMATSRGLFEMKYFFSNSISASDGGEGHSAESVKHKIKILISEETTANSVLSDEKIVRLLRDQGIDLARRTVAKYREMLGIPSSVARRRILKNK
>tr|A0A255T6L9|A0A255T6L9_9BACT Zinc ABC transporter permease OS=Prevotella sp. P2-180 OX=2024224 GN=CIK98_17110 PE=4 SV=1
MDNDNIIIRLARPDEAEHVAKLIMTAMTEECCLWFCGKDHDIGDFHKVMTELVKQEDSQYSFLNTLCAVDSHDNIVGILTSYDGGRLHEFRQRFIEAAKMAWGIDHSNIPDETGPGELYLDSLAVEPSSRGKGIASKLIEASVDKARKMGLPFTGLLVDTSNPRAEALYTRLGFRVEGTNQWGGHPMRHMVKLTSNR
>tr|K7P3Q2|K7P3Q2_PINMU Uncharacterized protein (Fragment) OS=Pinus mugo OX=28528 GN=UMN_1037_01 PE=4 SV=1
SSISPAAASSSENSTVTGTPSSSSSNSRVNTPAGDGTAGLYGFSLEVRDALTEQAHCSVTAEECSTVPVPAPYTGLVALDCGSLGTMDQQIHINPELLNSGDLLNSSSFSFGDLIGSSNLAGVTLADLQWKLQQ
>tr|A0A1C7MXD4|A0A1C7MXD4_GRIFR Uncharacterized protein OS=Grifola frondosa OX=5627 GN=A0H81_00337 PE=4 SV=1
MERCAAPYLAESSRSEGCRSVEENWAPRAIVHTDVYRFLGYTNIHLLHCNAPERNTFSTGLLTNHLTQWLRHVTFVRVLTYLFSAQTDVKETVLYGVN
>tr|A0A439ZYD0|A0A439ZYD0_9HYPH Uncharacterized protein OS=Mesorhizobium sp. OX=1871066 GN=EOS34_27205 PE=4 SV=1
MAPNARAHDALLTTAQPHGWTYPFACCSGYDCREVAENAIRERPEGYVIEDTGEVIAYTDSRIKNSPDGVFHWCSVAGANDGHTVCLFAPQRGF
>tr|A0A2E6K1T8|A0A2E6K1T8_PSESP Uncharacterized protein OS=Pseudomonas sp. OX=306 GN=CML01_16865 PE=4 SV=1
MKISNHDHSSSNPGDEAPPGTPGTGENICPVCNGSGRTEAGECKNCGGTGKVIEGIGGA
>tr|A0A4V6KLH6|A0A4V6KLH6_SERFO Immunogenic protein MPT70 OS=Serratia fonticola OX=47917 GN=NCTC12965_00545 PE=4 SV=1
MKKLLCTALCSSLLFSSVSMAAMMSDTVMVGGAAMYPSKNIVENALNSKDHTTLVAAVKAAGLVDTLQGAGPFTVFAPTNEAFAKLPAGTVDTLLKPENKAALTGVLTYHVVAGRYDMKQLEKKIKEGHGTAELKTVNGQPLWIMNNGPPQYSAQRWPRSYCQHQHL
>tr|W9XCM7|W9XCM7_9EURO MFS domain-containing protein OS=Cladophialophora psammophila CBS 110553 OX=1182543 GN=A1O5_01390 PE=4 SV=1
MSEKITAPFLKLYRHLFPKGRNVQNDTAEKAIPPESLIVVLQDIGRVDEVIRRELQDISEEEILSIAKRIKRLLDVCLVSMAWIMFALNSFDRSSLGNARVMGLQKDLDMNSNQYGLAMMLLFIAYVLAQVPSNYYLARGRPSIYLPVVMVLWGCVCTATAFVTTPSQLYVVRFFLGLLEAPFCVGCLFLISSWYTRTELGLRSAILLTAPMMANAFSGLIAFGIYDTIDGARGLEAWRWLFIVGGVCTVFVACVGFYVLPDFPSNTRYLSEKEIAVAQLRMIANGVQDDESDYGRWRGLVMAVRCWQVWVFAGMFLLLAIGASVHNFFPSVVNTLGFSRNTTLWMTAPPYLIGVVVTIANSLCADRHRNACPHVVAPAALAMLGFLLFLLDQSSTRSGVWVRYAAAFLMIVGAHSGYPVVLSWAQKTIRGPKEMRACAIAIINTSGSISQLSMALIYVFTDRHIRTVSKPMGTEVYTVDVLEYHLRAGSDFTCDLHAPSNPCLKLRCDAKSVGCFDEISNWRANPLLISFPVF
>tr|A0A193ATP2|A0A193ATP2_9INFA Nucleoprotein OS=Influenza A virus (A/South Dakota/20/2016(H3N2)) OX=1866071 GN=NP PE=3 SV=1
MASQGTKRSYEQMETDGDRQNATEIRASVGKMIDGIGRFYIQMCTELKLSDHEGRLIQNSLTIEKMVLSAFDERRNKYLEEHPSAGKDPKKTGGPIYRRIDGKWMRELVLYDKEEIRRIWRQANNGEDATSGLTHIMIWHSNLNDATYQRTRALVRTGMDPRMCSLMQGSTLPRRSGAAGAAVKGIGTMVMELIRMVKRGINDRNFWRGENGRKTRSAYERMCNILKGKFQTAAQRAMVDQVRESRNPGNAEIEDLIFLARSALILRGSVAHKSCLPACAYGPAVSSGYDFEKEGYSLVGIDPFKLLQNSQIYSLIRPNENPAHKSQLVWMACHSAAFEDLRLLSFIRGTKVSPRGKLSTRGVQIASNENMDNMGSSTLELRSGYWAIRTRSGGNTNQQRASAGQTSVQPTFSVQRNLPFEKSTIMAAFTGNTEGRTSDMRAEIIRMMEGAKPEEVSFRGRGVFELSDEKATNPIVPSFDMSNEGSYFFGDNAEEYDN
>tr|A0A270NRH6|A0A270NRH6_STEMA Uncharacterized protein OS=Stenotrophomonas maltophilia OX=40324 GN=CEK00_00720 PE=4 SV=1
MLLVLLAPLVSRWLAQGHVAAAAPVAAMDHAMHAEHAQHAMEGHHDHHAMAMPHGETAKKPPADPHADHEMGVDCDYCLIAARLITLLVAAVLLLAPMVPVCRALRGAVQALPQRIGGTLGARGPPALMAA
>tr|A0A0S2CGT9|A0A0S2CGT9_9AGAR DNA replication licensing factor MCM7 (Fragment) OS=Hebeloma hiemale OX=91672 GN=MCM PE=3 SV=1
LLQVNAYTCDVCGSETFQDISNKTFSPILDCQNENECKKNGIHGSLHMQTRACRFSPFQEVKIQEMPDQVPVGHIPRSMTVHVNGNLTRLMNPGDIVHIGGIFLPIPYTGFQAIRAGLLTDTYLEAHHIDQLKKQYSEMELTPEIEXKIAALQKDPNLYEMLASSIAPEIYGHEDVKKALLLLLVGGVTKVTGDGMKIR
>tr|A0A1S3XHK0|A0A1S3XHK0_TOBAC Chlorophyll a-b binding protein, chloroplastic OS=Nicotiana tabacum OX=4097 GN=LOC107765079 PE=3 SV=1
MASMASMAATGSSATVVRATPFLGQTKYANPLRDVVPMGSAKFTMSNELWYGPDCVKYLGPFSAQTPSYLTGEFPGDYGWDTASLLADPEAFAKNRALEVIHGRWAMLGALGCITPEVLEKWVKVDFKEPVWFKAGAQIFSEGGLDYLGNPNLVHAQSILAVLGFQVVLMGLVEGFRINGLPGVGDGNNLYPGGQYFDPLDLADDPTTFAELKVKEIKNGRLAMFSMFGFFVQAIVTGKGPLENLLDHLDNPVANNAWLYATKFVPGS
>tr|T1TFT7|T1TFT7_HHV2 Helicase-primase primase subunit (Fragment) OS=Human herpesvirus 2 OX=10310 PE=4 SV=1
ADPRRFHFHAPPMFSAAPREIRVLHSLGGDYVSFFEKKASRNALEHFGRRETLTEVLGRYDVRPDA
>tr|A0A7M4AVR9|A0A7M4AVR9_9ARCH RRM domain-containing protein OS=Candidatus Poseidoniales archaeon OX=2163009 GN=D7I13_00030 PE=4 SV=1
FTATQDQLNALVASHATVNEVILAMGPGGKPKGFGFVFIAEKDKGEAVVAALNNSDFEGRNIKVDIAKAKGGKGGGRGGNAGGNNSGKSARELQALREEGEGGKKRKRRQRQKKD
>tr|A0A2G4HE61|A0A2G4HE61_9FLAO Phosphoserine aminotransferase OS=Flavobacteriales bacterium OX=2021391 GN=serC PE=3 SV=1
MKKHNFTAGPCILAPEVLEGAAAAVQDFEGMGLSLLEISHRDKKVVAVMEEAQQRVLQTLGLGDDYAVLFLQGGASSQFAMVPFNLLRSEGKAAYLNTGTWASKALEEANKLAPGQAVELASSAEQNFSYIPKGFAIPSGLDYVHYTSNNTIFGTQMKAFPKADSLMVCDMSSDIFSRQLPFGQFDLIYAGAQKNLGPAGATLVVVRKEILGKSGRAIPTMFDYPVHIKGESMYNTPPVFSLFVSLLTLRWMDSQGGLLEMERRANARSAALYGEIDRNPLFKGSAAAEDRSPMNACFLLHDEAKYQAVFDALAKEAGLVGLPGHRSVGGYRASMYNALPQTSVDALVEVMREVERRA
>tr|A0A737VAW6|A0A737VAW6_SALET Putative transport protein YbjL OS=Salmonella enterica subsp. enterica serovar Sendai OX=363568 GN=ybjL PE=3 SV=1
MNINVADLLNGNYILLLFVVLALGLCLGKLRLGSVQLGNSIGVLVVSLLLGQQHFSINTDALNLGFMLFIFCVGVEAGPNFFSIFFRDGKNYLMLALVMVGSALLIALGLGKLFGWDIGLTAGMLAGSMTSTPVLVGAGDTLRHSGIASTQLSSALDNLSLGYALTYLIGLVSLIVGARYLPKLQHQDLQTSAQQIARERGLDTDANRKVYLPVIRAYRVGPELVAWTDGKNLRELGIYRQTGCYIERIRRNGILANPDGDAVLQMGDEIALVGYPDAHARLDPSFRNGKEVFDRDLLDMRIVTEEIVVKNHNAVGRRLAQLKLTDHGCFLNRVIRSQIEMPIDDNVVLNKGDVLQVSGDARRVKTIADRIGFISIHSQVTDLLAFCAFFIIGLMIGMITFQFSNFSFGIGNAAGLLFAGIMLGFLRANHPTFGYIPQGALNMVKEFGLMVFMAGVGLSAGSGISNGLGAVGGQMLIAGLVVSLVPVVICFLFGAYVLRMNRALLFGAMMGARTCAPAMEIISDTARSNIPALGYAGTYAIANVLLTLAGTLIVIIWPGLG
>tr|A0A195DVT9|A0A195DVT9_9HYME Uncharacterized protein (Fragment) OS=Trachymyrmex cornetzi OX=471704 GN=ALC57_10841 PE=4 SV=1
EGSRYDSHSAQSTQDRRKLLKRTRSLAVISEDDSRQDREAANFRLGQSTFDLPRRHQLIPRAKLIDRNSLKDRFILLTFYKRFKVIQMQILFKSNRSRGSLCSRLSKSQQHLSDSYERFNEAKSYHSRSTCGLYSISSGLESLPDPLSYTRKNRIDPDRLNILDWPDPPRRYRSVQNLDTVSGLVDIVEDNWPIEGNRSIDCIYTQFARYNDVSCLRSAVLGLLNILAGLRSLLPTLVKRKRKEHRSLDSILFEDDGELEYFDVLNLLPLSNIRLEYNETDLSSDSNFARKKIHGLRDLRVLEYNEPNEVSPTRSSNATDEEKCKEHEVNDESEKELRENLNSEGTSKRTDSNRRQHRETDESFGADSKINSVNQFTDQYSPSSSKIDHRRTDVENFVISCEEEDQKFEEIEDYKSIWISDENQNKMSRRPQVLKVVDNDVTRRRHRRSVVEIDAIVEDVPKDKRSQEITEEVNERLNASIITSINNVNEKDEGHGRKAKEATTPENAENGATVDDARNFLERKSTEKEAVRNKQNEGRFERIVKETSNILGKACSVVKGSLGFEARSESSDLGLGSESGSDSRRRSMDDGIEDDRPSKKVENSNNSATLRTDDSKKSHTNLTRSRSCVDSIECQDDGQEFDHVRYKIVKSHMFSKNMFNTARGDVTYEGLMQYLREYSFQELLMDNNVVIIEPVRAETIERKSSPLTRTEPKCKIAGAIQKKTENHERNGERSQSGGTAKSSRQSSIKKHFFYQPIRVNRELIDEELPDPDTVRNVRRMFENTLEKKKISDAEFSRDDKTRRSVSMKDLTTIDDNRYDEISDKTREESRSRCSSRAKDLTRLFETKSASSTISIAKEEIGSPRCESKTRILAQSFEARSGNTSPSGSNCSKNKIGRYHHHHHHHHHHHHQNWDSGSVSSGVSSDYPDTDPGSGAHCTSSDDEDVNCNDDDADTRGPGHYVSQDVLRKIRECGTSVTYYGGKVVNMHNGPLVSPLIGNGFKRIDESNDYVKFKLVKSNSCDSRLELTGRFVEGQSLRRTRDRCADLRQCTIAETPSIEITSIDSRQKDEVQRDEDVEQIEQMKREPPVVIGLEPKKEDSKESRKIFKADFKLGDLDDSRSNYPSKFMPSALTRWEVNSSWKVGNDFGKMEFEEFEVLEDSLNGISEQNKYTQAS
>tr|A0A7K9E8D5|A0A7K9E8D5_BARMA Beta-MPP (Fragment) OS=Baryphthengus martii OX=176943 GN=Pmpcb PE=3 SV=1
QCVHAGTGRLRASRAATEVVLNVPETRVSPLENGLQVASEDSGLSTCTVGLWIDAGSRYENEKNNGTAHFLEHMAFKGTKKRSQLDLELEIENMGAHLNAYTSREQTVYYAKAFSKDLPRAVEILADIIQNSTLGEAEIERERGVILREMQEVETNLQEVVFDYLHATAYQKTALGRTILGPTENIKSINRNDLVEYITTHYKGPRMVLAAAGGVPHDELLDLAKCHFGNLPSAPEGGLPPLPPCSFTGSEIRIRDDKMPLAHIAIAVEAAGWSHPDTIPLMVANTLIGNWDRSFGGGVNLSSKLAQIACHGNLCHSFQSFNTCYTDTGLWGLYMVCEPSTVQDMVHFVQREWIRLCTSVTENEVARAKNLLKTNMLLQLDGSTPICEDIGRQMLCYKRRIPIPELEARIEAIDAQTIREVCTKYIYDKHPAVAAVGPIEQLPEYNKICSGMYWLRE
>tr|A0A498AHI4|A0A498AHI4_9ACTN Phosphoglucose isomerase-like protein OS=Micromonospora sp. M71_S20 OX=592872 GN=DER29_1292 PE=3 SV=1
MIDGAAGVSGRREPDEALLDDPAALAEHDPGGMLRHTASAGAQVRETAALAAEANLQVLADEGRPRAVVIAGIGTAGRTGDVLATVAGPRCPVPVIPHRSAGVPGWVGAADVVIAVSASGRSPEALGAAEAAHRRGARLVAVGAPDSQLQSVAERARAPFIPVPRRAPARASLWALTVPVLLAARTLGLVKVNEADLAETAARLDAEADRCRPTAESFVNPAKSLALGLAGSVPIVWGSSPLATVAARRFGDTLSANARYPVVSGALGEAGRGRVGLLDGVFGGLAEGERDIFADPDAEAPSGTRLRLVLLRDGGLNPEDDADEPLDVEERRADAVQTLAERRGVRCDVVTAEGGSALERLASLVAVPDFASIYLALAHGLDPMAVPAITEMKELANQ
>tr|A0A3D8YU66|A0A3D8YU66_9BACL HTH domain-containing protein OS=Sporosarcina sp. BI001-red OX=2282866 GN=DVB69_12070 PE=4 SV=1
MRTKVAIFGSEEFCQRALQFTEQRSDIILDLYPYTIPSEAPDLLKKLLPCDAILFSGSLPYVASTDVLQSIPVPAIYLKQDETEITTTLLAISIHHSLELEKMSIDVRDCSVLENVLADIKADEQRPLTYQLEKNYVLEEVVQFHASAYANSPSNVAVTSVHAVYDRLTEQGIPVFKMISVKSSFLKTIDRVCQEALLQKSETSKIAAGILDNSILTTEVKDIYKRLAQVLHAHCIHSEEGFLFYTTQGAIQSALHTPLFQQLAVQVSGQLAFGSGRTLTAAKENAVSALRYMQTEHNAGPYLLDEKKELHNLIQTNGSAIELRVIEPILTEIAEKTALSPAVLSKLVTFGQSQQSTQFTANDLASHLGVSRRTAERTIKKLLTSEYVNTVGEEMTYRQGRPRAVYELNFPVY
>tr|G9Q7I1|G9Q7I1_9BACI Uncharacterized protein OS=Bacillus sp. 7_6_55CFAA_CT2 OX=665957 GN=HMPREF1014_02623 PE=4 SV=1
MIDKIKNAVEDMYEDEAKDLLQSILIQLNLLEENYSEDTIKNLMDIPKQLTSNPTYKRNVKESAHVHIAFDDSTAGCLKYMLSQEELFEESVVAFSEFFSIGPIYRLHTNEGQLARQKWLINNLTAYDSYFEEEYLSRFIATIEELHTIPVETPITIWKADNAHEHVGLSFVMAQLKDKKNIRVINTSEASREILKQEYDIRGTGELPPESLALFQKSFIKLPYLTEEKRMKFENEWDRLSESIECLRVWKENEVHSVQEDYFDQFIIECAKSVGADREFLKAPRVIGEALGLVEQLVGDTFLEYRLKQLIKQEVFEFEGSLDEMRFYSVKLRK
>tr|A0A5N7CTG2|A0A5N7CTG2_9EURO Uncharacterized protein OS=Aspergillus pseudonomiae OX=1506151 GN=BDV37DRAFT_266922 PE=4 SV=1
MYLSVLSFVDSDSLTSKQQQHYALALYFDWKCAITGKIYQSHSDQTFHAVSKGKFYRAVMARFLDTKMLQFATLCQDLESFDWLTTTTSKMWSDNPNRTLEESFQILEAFDFISNFMLLHILEGPGTFADWVISSDEHQAFTQDPNDSFLNNWISLLRRLQPYLSPFDILVAFRMDEIDLQTLQYFNSLLSLEEYDLKSPIYEIEKEVCCKLSEEYDVADHVWKMYRNHGWRNGARGTSFNEHLSVGAIASEIIGFECHRRNWWELMKQSSKASPYGVRFSLPSCYLSTFNERMDEDEDIHFIITKDDLLTLNH
>tr|A0A210QLV9|A0A210QLV9_MIZYE Uncharacterized protein OS=Mizuhopecten yessoensis OX=6573 GN=KP79_PYT04528 PE=4 SV=1
MVGQRGNRGGGRGGGAWGDDSQDMGAMGGSMLGGYGTQSDTSMYAQGGKKRSYNDSQDGYSMPNYYDSTSTDPYFRGMDPPASRFVKTESTQQPDQYASYYENWDSGYYNQGNDSQSSYSDYGSSPQQSGGGYNQSSDFSQDVDFPSNNTSGFNKGYNKNQQSWNKRGGGGGGGGGRGGRGQQQQQQQPWGRGGQGMRGGGRGNNRGNQGGGMMGKRGQQKPGFPPQKAFPGPMRGNKRGRGGRGGNAMVPPIHSLAKVSVPDVTKMSIAEKIRRFCLYLQAETNKVNSIQTIENALTGSKLGLKTEYEVEELMRVAGRWMYTGYLKLDSIFLTRSVGANKKEVKHDVYTKGLDIVKTKTVAEIFALKDPGVEAIRSELTNSLEVKKEGLGKTESLQVAKQAMEEMTNTYSTKHDGFDKLMTYLRESTNLPESQISCIEQGISASHCGLTHTFDGQMVRLPTGKLFFRGSLTIAEVVVAVGTGYKKKDAKVQTYERALEALRTKTMAQILKSVPEAEAVTGVVQEKVPTVPEKDRSSQTLLEKMTEITQLIKEAQFRENNINYLDVTAIHLGFTPTCIYRKLESEGNKTMIACELYLDSILMATGEAERRKDAQVETYNSAWDVLCTTAPDYILKEHKRLKPGDQDDPSVMDVWVKGSGKPNANTNMPGLKRNKMDPNEAWKTVDVIVLMEHEDWSFDRQRQAFCILNYSSTFNGMLLQWQTEHDGNMFKSTINLQHKMIGEASALGKNTSRNLAAACALFKLYETQHVIRISRRDDTKLWVEYPEIKTKAEALRVASGAPMEEVVATPTPADGEEKPSIPANKWVVQVAEQMITQHIAKQTLDELTFGPGMPFSESKEVRQIARNLDLKHDIRQQEGQSYLIIHKRMTPQEMIKILQANNSQSGKYSLVDKDTLPTYQNILPEIEKHEAMRNTGNTEGASKKKIKKEDISMTDLS
>tr|A0A7Y7LU15|A0A7Y7LU15_9BURK DNA-binding transcriptional LysR family regulator OS=Variovorax sp. SG517 OX=2587117 GN=FHT32_002399 PE=3 SV=1
MDSEALATFLTVHRQGGVSAAATALSRTQSAISRRLALLEEELDAPLFERVGRGLRLSQAGEALLPHAEKVAAAMGDAVAAVQAAKSDAAGTVHIAAVGTLASSGLATVLAKLRQSLPGLDVRLQTATSAEVSEKVRASDVAVGLRYYEDPSPDLLCKVIHHEQLVVACAPSHPLAGTRLKSLVRLSKERWLAFPQPPRRTEPHAEAIFSQFLVRGVERIDWSAVDSLTAQKRLVEAGFGLAFLQESGIAEEVARGSLALIRIDDLDVRVPVACVVRRSAFLSRATRALLAELERAEL
>tr|A0A2A7QG65|A0A2A7QG65_9LACO ClC family H(+)/Cl(-) exchange transporter OS=Lactobacillus sp. UMNPBX18 OX=2042029 GN=CP369_02605 PE=4 SV=1
MESRKEVFHRYNQFNQLIRAIIIGILTGLVVSVFRLIIQHFLQLVTASFAYFHSHPLWLIPWTIGSIILALLLGWLAQSYHDIKGSGIPQVEGQLTNQFDEKWWPVLWRKFLGGIFAIGSGLYLGREGPSIQLGATIGQGVEEKAKVGHLNRQIGIASGAAAGLSAAFNAPIAATIFILEEVYHNFSPVIWLATFVSSLCSNIISMQFFGLRPVLNVPYNHMLPNNLYWHLIALGILLGILGRLYQIVILHLNGWTARIPKLSPIAYPIIPFLLVIPIAWYFPITLGGGNELIIILRSLPFSLALFVGLFVLRFVFSMISYGSQLPGGIFLPILTLGAILGAVYCALMVRLGLMPVRYLPNFIIYGMAGYFACISKAPFTAILLITEMVGSLAHLMPLALVAVVAYLVVDALHGEPVYTAMFNAFIGNNPQPARHKEDVTMSITIYAGAQLDGCKIKDFPWPTDCIVMVVYRGEEKIIPNGQTKLQAGDTLILRANSATTRQAYHEISRAAHYAQG
>tr|A0A0R2BHK3|A0A0R2BHK3_9LACO Uncharacterized protein OS=Lapidilactobacillus dextrinicus DSM 20335 OX=1423738 GN=FC84_GL001267 PE=4 SV=1
MRIIFIGDVMGPIGQETLTTYLPKLKAKYRPQLTIVNGENIAMGKGITKSLYKTILTAGADVVTMGNHTFDKDDIYEFIDDANKLIRPANFPAQHTPGKGYVLTKVNQTTVGVINLQGRVFLDSIDDPFAKVDEILAEIQAQCDYIFLDFHAETTSEKEAMGYYVDGRVTAVVGTHTHVQTNDAKILPKGTAYLTDVGMTGPYDEILGMRKERVIERFLNHRPVRFETPLSGRGQLNGCVIDFSSTKNAARKIELIQITPDQPFLE
>tr|T1BH73|T1BH73_9ZZZZ Translocation protein TolB (Fragment) OS=mine drainage metagenome OX=410659 GN=B1A_07070 PE=4 SV=1
NSDSSINYDGSQIAMMQGNGNVYRIAIMDRKLDNQTRFISPGPMDGSPSYAPNGSMLLYAATDNNGKGVLYEVADNGSVRQRLSLVNGTVQSPSWGPYRVPPSTQP
>tr|A0A7W7F9L6|A0A7W7F9L6_9SPHN Spermidine synthase OS=Sphingosinicella soli OX=333708 GN=GGQ98_002410 PE=4 SV=1
MLPRVLIDTAKIPGGGELRLIQRGTEFSIMLGANELMNSRLKGSEESLASLSCGKIQSRPQPRMLIGGLGMGFTLRAALAKLPADASVTVAEFVPSVVAWARGPMAHIFDGCLDDPRATVAVEDVADLIGDVRSHYDAILLDVDNGPDGLTHPDNDRLYSRKGLIAAREALRPGGILAVWSAAPDHAFKNRLIKVNFEVEETVVRTNGERRGARHIIWIATRPS
>tr|A0A1H5CGP3|A0A1H5CGP3_9MICO Peptidoglycan/LPS O-acetylase OafA/YrhL, contains acyltransferase and SGNH-hydrolase domains OS=Ruania alba OX=648782 GN=SAMN04488554_0368 PE=4 SV=1
MVSTATQDRGRIEGLDGVRALAIVAVLIFHLRPLSLPGGYLGVDVFFVVSGFLITTLLVRELRANRELDLTAFWTRRARRLLPALATVVAASVALAFFAGDDLLVNIGRQVVGALTFSNNWLEISAGSSYFNATSPQLFVNFWSLAVEEQFYLLWPLLFVLIMATTRTGRQRVGVVLGLAAASALLMALLYTPGEDATRVYYGTDTHAFGLMIGAALALSAAGESWNLLAQTWYRRARVLLALGALGGLVALMLVLDPTQPMAYRGGILAASLLTALVLGALPGPTNLLHLIFRLRPVAWIGERSYGIYLWHWPVILLIAAFAPPTAPDSVASWVQRGAALVLTLAVSAASYRWIEMPVRRDGFRATGRRVLAALTAPGGLTPPRVAFLSTTAVLALFAVAVATAPDRSQVQIAMDEASGVVEASGGESGSVAGSTESPQTGSGETDGESSETDGGQTVDGAAEGPGAQISGFGDSMMYVAAPGLSATFPGMSIDAESNRQWPAVAETVAAALDEGTVRDVVVIAAGTNAGVREPEIVRETLDLLGPDREVVLVNIYGSSFWVEESNENLAEIAADYPNVVIADWHQAALDHPEDLQPDRIHPDMEGMYLYADIVQAALEELGVG
>tr|A0A5I0WZT4|A0A5I0WZT4_SALET Type II toxin-antitoxin system RelE/ParE family toxin OS=Salmonella enterica subsp. enterica serovar Oslo OX=1005394 GN=G4H23_002326 PE=4 SV=1
MRIFKTRWFNREAKSHTIKDDELSEAINAVLQGKADNLGGGVYKKRLNQNRDRAIVLAKGGEHWFYTFLYAKQDMANISYRELAGFRELAKHYACLTEDQITALINNKELVEVRHVSKN
>tr|A0A2S8FEH7|A0A2S8FEH7_9BACT Uncharacterized protein OS=Blastopirellula marina OX=124 GN=C5Y96_14010 PE=4 SV=1
MPLLVSGICLLVPSLLAAAPQADFEKILSPILEDAVRRSLPTSFKDESDWGSTHEFTKRLKVRGKWDSLKLERVREAKNHGDWVRYLGHIEDPNQHVRIWIENLSVGPTRSTCQIHARVEFQGEAEYQQWVRGVRLLGVSVVTEATVKIHLDVQLDSKWDMSSLVTSAELTPTVTGGQIELERFYVHRIGKAHGEVAEQIGEQLEGTLAKKLAKKEEKLVREANKAIAKELENGTVKLDLVDYLKKQLLK
>tr|A0A069RH84|A0A069RH84_PEPLI Putative transposase InsK for insertion sequence element IS150 OS=Peptoclostridium litorale DSM 5388 OX=1121324 GN=insK PE=4 SV=1
MICETLSITRSAYYKYKKRVKPEKEKQDELLCSLILEYHAMYDGILGYRRITMFINRLNQTTYSENYVHRLMSYLGITARIRKKKVNRKRVKPDYVKDNILARDFTAKTPNEKWLTDVTEFSIPKDSRKLYLSPIMDLYDNSIIEYEFSFRNSNQLVFKMFDRAVANNPGARPIFHSDRGFSYTNNAFKSKIKNAGMIQSMSRVGKCIDNGPMEGFFGILKSEMFYGKIFKSLDDLVDKIKEYIVFYNERRFQKRLKCLAPIEYRNKALIA
>tr|Q1ZM26|Q1ZM26_PHOAS Uncharacterized protein OS=Photobacterium angustum (strain S14 / CCUG 15956) OX=314292 GN=VAS14_08110 PE=4 SV=1
MTLIERLKDEQKAAMKAKDKPRLGAIRLVLAAIKQREVDEKITLNDDDVLVVLTKMVKQRRDSVAQYEAAGRQDLADVEHAEISVLAEFMPQPLTEEEISALMDEAIAATGAATMQDMGKVMGVLKPQIQGRADMGIVSKLVKTKLG
>tr|A0A1C1VV15|A0A1C1VV15_9PSED Phosphatidylethanolamine-binding protein OS=Pseudomonas sp. S3E12 OX=1873126 GN=BB029_27630 PE=4 SV=1
MNIRSILPALSMAVTLSGYAADFSLTSRDIADNRPLTRREVFQGFGCDGGNTSPELSWKNAPAGTKSYAITVYDPDAPTGSGWWHWTVVNLPASTHSLPSGVGANLPAGAVQGRTDYGQPGFGGACPPVGDKPHRYQFTVWALKVDKLPLDNQASGALVGYMLNANVLAKATITSTYGR
>tr|A0A161XBG4|A0A161XBG4_9CELL Histidine kinase OS=Oerskovia enterophila OX=43678 GN=arlS PE=4 SV=1
MRRRVLQATVAAVAVAVLLLGFPLAFLGAQFVLANEMDQLQGRVDTLARNIDNRLAQNEPIPQSVLDNASVGRPGELPAYVFVNLPDGEQMTAGEVVTGRANEAADRTDQNATVALSTSFAESYWKAAQIVLLVVAASVVAFAAGIAMAVWQANRLSAPLVYLAASAEQLGSGQVRPRLEPSGVEEIDLVAAELARSSDRLAGRLAAERQFASDASHQLRTPLTALSMRLEEISMASDDPAVQEEARISLEQVERLVTVVDDLLTQSRRAQGGTTEAVRLIEVVRQQEEEWVPTFAQAGRELVIDVPEGYQVLATPGALAQVLATLIENSLKHGAGTTTVRARPSGTSGAVAVEVGDEGEGVSDEMAPRVFERGATSGAGTGLGLALARDLAAADGGRLELAQRRPPIFALFLAGVPRTLDPRVVLPTGTLISARGGRRRRRGRGPEVEPR
>tr|A0A0D0Y6D7|A0A0D0Y6D7_9TREE Small nuclear ribonucleoprotein Sm D1 OS=Cryptococcus gattii EJB2 OX=1296103 GN=I306_06210 PE=3 SV=1
MKLNNETVTIELKNGTVIHGTITSVDPQMNTHLKSVKLTLRSQPSSQPPLSLDSIAIRGNNIRYFILPDSLPLDTLLVDDAPKPKKKKEGAAARGARGAARGARGARGGGRGAPRPRGRGF
>tr|D0TP63|D0TP63_9BACE 4Fe-4S binding domain protein OS=Bacteroides sp. 2_1_22 OX=469588 GN=HMPREF0102_01363 PE=4 SV=1
MNVAELDIDKCSGCGLCASVCSKHSISIVPDDSGFLRPIVDKNTCVDCGLCVKRCVIVNPRKQTIPQKTYAAIRQDKDRIALSSSGGVFAAVAEYVLLKKTNWVVVGSTLDETVSANHIIVDNVVDLKNLYGSKYVQSETTGIYKKIQILLDDSKSVLFSGTPCQVAAIQRYTNNHPNLWTIEVICHGVSNNKMFNSYLDMYKRNEIRMFYFRDKEQGWSFNNKIVYQNGKEKKINHRMSSYMTYFLKGETYRDCCYCCPYAKPERCADITIGDFWGILQTRPDLNNKIDIEKGVSCVLVNTDKGISMVGNAELELYDVEYDAIRKENGPVNEPSHHTVKRDLVLAEWGKKKDWTDVHTFWKKNDRKITFVLWSMIPVSLQHKIRVMLGKR
>tr|A0A2A2CDI5|A0A2A2CDI5_ECOLX Spermidine/putrescine import ATP-binding protein PotA OS=Escherichia coli OX=562 GN=potG PE=3 SV=1
MNDAIPRPQAKTRKALTPLLEIRNLTKSYDGQHAVDDVSLTIYKGEIFALLGASGCGKSTLLRMLAGFEQPSAGQIMLDGVDLSQVPPYLRPINMMFQSYALFPHMTVEQNIAFGLKQDKLPKAEIVSRVNEMLGLVHMQEFAKRKPHQLSGGQRQRVALARSLAKRPKLLLLDEPMGALDKKLRDRMQLEVVDILERVGVTCVMVTHDQEEAMTMAGRIAIMNRGKFVQIGEPEEIYEHPTTRYSAEFIGSVNVFEGVLKERQEDGLVLDSPGLVHPLKVDADASVVDNVPVHVALRPEKIMLCEEPPANGCNFAVGEVIHIAYLGDLSVYHVRLKSGQMISAQLQNAHRHRKGLPTWGDEVRLCWEVDSCVVLTV
>tr|A0A168G2W8|A0A168G2W8_CORDF Sulf_transp domain-containing protein OS=Akanthomyces lecanii RCEF 1005 OX=1081108 GN=LEL_05631 PE=4 SV=1
MATVLSGAAFGAAMIAAGFYNPAVVISQLKFENWHMVQAFLAATASSIAYYAISDRAGYASLQPRASSPIGLFGSTYDGNVLGGALLGAGMALSGSCPGTLFAQMAAGVHTGFYALAGAVVGGVLWTGILSKAVARARARAGSKPETVTVNQHLGVSKPAAMLLYEAGFAAVIIVTSLYTPRFPGTKMSGALGGFLISLSQLASIATRGSMIGISGSYGELGGLLWAGLAGDAASKPKSYPNVLFAVSAGAGALLLARLAPVLVEAPALEVAPAVAVLGGALMVVGARMAGGCTSGHGISGISLLSTSSLITIATTFAVGFVVATLVY
>tr|A0A3N2RNP2|A0A3N2RNP2_9ENTR Uncharacterized protein OS=Kluyvera ascorbata OX=51288 GN=EB837_25720 PE=4 SV=1
MSEPRLGNLITVLLPARSYKINCALTTEKLMPGIEQFACRLLLIFDQLYPSELQNYFGLTDREREVLLDGLLANRLININPDGHIEASSFLRKHAASNGGKPSLVKYQERTEEVAFDLLTLSICKPQPNRRFTSGLPELLPRHQIGGDAAAVTEAFSSQFRHHLLLSRNSEYERQRTRLYKIMGCSSHEMVQLPIEIEVSYDASAGSIEPQKFTRSYEYLGNTRLPLSNELEAHIADFLGEHKLDEFGIDCEDFCKLANDKVLLQFANGYKFDYSGWIEAREQRKTGYGTSLTTGMLGAVYLPHNSKLFISMLHNALRDYVGKTAPKALWYSSKVPLWGANGSQLSRFNRDLGDILGNYADDKIARISLLHPSADEGEKRQERKRHLGRFPTGIGLTSEAKFDRLEILLIPDVIALVQYHGQPNSDSALTLPIGYITVEPERLELLKNLMIKRIEGVVATINWSESKLENLTSLLPVEFLIKLNKKSGEDVDAAIQKMQIANRAETARAILSLRK
>tr|A0A1A7ZNK3|A0A1A7ZNK3_NOTFU HFM1, ATP-dependent DNA helicase homolog (Fragment) OS=Nothobranchius furzeri OX=105023 GN=HFM1 PE=4 SV=1
DTAVKTTCPVYKHARAGQHGTCVLTWYLPGHFNHWTTKANTTADLPKTLHVVLEQILNRHPPFGNQIRDSVRHLPKYSVTLEQLPRFGSDTAEVVARVNLKNQADLLSRRTAPGHHFVSLIIGDADNNVAFLQKITDSMLLKSGSWSKKIQVAKPVKGNEISVHLISSDYVGLDIQQRFTMQFSASRTFGSEIPYNTIEQRPQLTAQTPLSAAQRDKASPAEEQGSTYPGHKRQCNHLCKNKTLCAHDCCKVGVAVGRKRSTNHESSFSSYLTDLRNRSDALVQTPVKRLKMGNGPLAVSMQRFAFKPKENLSPVSCYSENEYKAGQMDLAADDSSQLKDISCLNDPDPGTFSDADGAENRTRTTQNPAATQQMFLKDSSARIMSRTGGEPLKSGVNQTKTSTSVHSNWSAATSEQEALQIPAVTFDLGNEWDDWEDFDEENLLHTAAALVPQCRTKPEPQIQQRVDYTSGCPTGSSPVFLSCSQTKCQGTTITTPLRSISAAASCEIRKFDPSPITNILNDEITGKTPEMFFKPPPETQVNRRCDFFHTVDVPLRSDLSLDRSKEEETFFGIFDGIF
>tr|A0A7C6JKA3|A0A7C6JKA3_9BACT 3-isopropylmalate dehydratase small subunit OS=Petrimonas sp. OX=2023866 GN=leuD PE=3 SV=1
MEKFTTITSTCVPLPIENVDTDQIIPARFLKATTREGFGDNLFADWRYDKAGNPKGDFVLNNPTYKGEVLVAGKNFGSGSSREHAAWAIGGYGFKVVVSSFFADIFRHNALNNGILPVAVSEEFLGELFVSVKGNSKATVTVNLQEQTITNNETGKSESFNINAYKKECLLNGLDDIDFLLSNRDKIEAFEKQRVYSY
>tr|A0A7X6IU76|A0A7X6IU76_9PSED EscU/YscU/HrcU family type III secretion system export apparatus switch protein (Fragment) OS=Pseudomonas sp. BG5 OX=2722817 GN=HER21_45805 PE=4 SV=1
GLMRVFGKQALWEGAKALLKTVAIGVALWIVVSGLVPVLMASGSHNITWLLEQAAGGAAALLQVAVVVGIILAALDVAVVMRRNRKHT
>tr|A0A7Z1UA43|A0A7Z1UA43_9GAMM Methyl-accepting chemotaxis protein-2 (Aspartate sensor receptor) OS=Erwinia sp. AG740 OX=2183904 GN=DFO54_1118 PE=4 SV=1
MSVFGRYVRNLKVSHKLYGGFGIVLLLVVLASTFSSARFFAIRDLYIKSSIMNEMGNFIDLTRIARIKFTYTLNDDNLTNLNKYLQQARQLNDKAKALKWDETYQGDFKNVEQDFADYTQNIDRIKSSVEGMNEVTKGISALDQQAAPGDALYTLSNDINLLRQYHQTSVLYGQLVDKVHLLQKENSDAAFKAVKSAYDQAKKSFDSLNSTLPGEVKNSISELGDRIERYNQSGVKYNDKVNQLKASDSALRATGDKLISDIDGVLKKIGARNNDIINNSVFQTVICGITAVILGLLIAWSVTRQITRPVIANLKLAEKIASGDLSASVTVERHDELGQLTLAMMSMTEKLRQLIADIRHSVYSVAKASSEIAAGNHDLSSRTEQQSSAIVETAASMEQLTATVKNNADNARHASQISEQATDNANRGGDIIHRVVQTMGEISGSSKKISDITSVINSIAFQTNILALNAAVEAARAGEQGRGFAVVAGEVRNLAQRSSQAAKEIEGLISESVSRVNTGTVLVSDAGSAMDDIVASVKRVHDIMGEIASASDEQSRGIAQIGGAVSEMDSTIQQNAAMVHESSAAANSLEDEAARLSQLVSVFRLSAQDEPQTSGHTAMLASRLRRPEIANRQAALPGSNTTPGTIANTSADNWTTF
>tr|A0A810LQW6|A0A810LQW6_9ACTN Uncharacterized protein OS=Actinoplanes ianthinogenes OX=122358 GN=Aiant_38990 PE=4 SV=1
MAGASDNGGWPPPDGGSSDDLPDLPEEWGVIVIPDDLSELSDEVEAVRAELHLAPPPNRWQRFARRPAVRRLRRAGALLLRAPVLIVSMAILVTVASLFASAWPGTPRQPATQRTSDTTTTPAKTLPALDLIGADGQAVPLLAHRPMVVIITDGCDCERLIAETVAAVRQDVSVLAVSTTAPSATASQGGLAPAQTPRADGKTVLYLQDPTGHLRERAGLTSARDGSAATFVVNKAGDVLRVCQHVVSVAAFEADLARI
>tr|A0A6B8MQP2|A0A6B8MQP2_KLEOX Helix-turn-helix domain-containing protein OS=Klebsiella oxytoca OX=571 GN=GJ746_00670 PE=4 SV=1
MDNSINQVIDSFIKGQAVIGRVRFSTESRPASEKAVSVDFPRLEIMLEGQLRDPAIKSEYAQLTPHDVLYIPAGGWNDPQWLMPSTLLTILFDKQQLEFVLCHWDGNALNVLDKQQVPRRGPRVGSFLLQALNEMQMQPQEQHTARCIVTSLLSHCADLLGSQAQTSSRSQALFEAIRKHIDAHFAEPLTRESVAQAFYLSPNYLSHLFQKCGPMGFNEYLNHIRLEQARMMLKGHDMKVKDIAYACGFADSNYFCRLFRKNTERSPSEYRRQYHSQLTEKTSSAKN
>tr|A0A1Q3WCK3|A0A1Q3WCK3_9BACT Ribokinase OS=Spirosoma sp. 48-14 OX=1895854 GN=rbsK PE=3 SV=1
MPGQILVVGSSNTDMVVQTTKLPAPGETVLGGTFFMNPGGKGANQAVAAARLTGNVTFVAKVGTDIFGEQAVAGFRQEGINTTYIQSDPDHPSGVALINVDAAGENCITVAPGANAQLRPAETNPALMSAEADALVLVQLEIPLDTVVHVISEAATRGLRVILNPAPAQPLPDELFPNLFLITPNETEAELLTGIRVDDLSSAGQAAQKLHAMGVSNVIITLGSKGAYLSTGTQSQLIATPPVKAVDTTAAGDCFNGALAVALAEGQPLPDAITFACKAASISVTRMGAQASMPRRNEVNE
>tr|A0A2D8DNN8|A0A2D8DNN8_9ALTE Uncharacterized protein OS=Marinobacter sp. OX=50741 GN=CMG78_10605 PE=3 SV=1
MKLAKFIGSALVALTISAPAIAQQSPGGQPDQVAQLAQMVGLSEEQQTEIRGIIDDMQGEIGELRQDARSLQEDLQEQIKPDYDESAIRDNAAKLGDVTGEIAALSALMQAKVDAVFTQEQRDELDRRMKQMQQQMQQQRQMMQPQGQQ
>tr|A0A842MKE0|A0A842MKE0_9ARCH Uncharacterized protein OS=Thermoplasmatales archaeon OX=2268204 GN=H5T45_04690 PE=4 SV=1
MKKIICLFIFLALMGCLKSEKEVEKETAEGFEVLSVFFSETEDYNTVLLNMKVKWVGKEKGAPRCDIYFPPQERLEMGIGPIENGPSIVEPLYQEGSEVKTAILKEFIARSFYPDYIAPEFGKSYYAQIKFYWPSLNETYEWQGNVGWSE
>tr|A0A7X3C2Y9|A0A7X3C2Y9_9LACO Xylose isomerase OS=Secundilactobacillus folii OX=2678357 GN=xylA PE=3 SV=1
MAEDLWNMKNIEYAGNKDLGSGAQFHYYNPDEVIGGKKMRDWLRFSVAYWHTFDQRLVDPFGDGTAMRPYDKYTDPMDNALAKVDYAFEFYRKLGVDFLAFHDRDLAPEGDTLRETNKNLDKVVDKIVEYQKTSGMKVLWNTSNLFTNPRFVAGAGTSPYADIFAYSAAQLKHSLEIGKRVGSENYVFWGGREGYESLWNTNMKLEQEHAAKLFHMAKDYANEIGFDAQMLLEPKPKEPTTHQYDFDAATTIAFMKTYGLDKDFKLNLEGNHANLAGHTYQHEIRVAREAGLLGSLDANQGDKLIGWDIDEYPSNLYETTAAMYEVVQEGGIGPRGGLNFDAKPRRSSFEANDLFYGHIVGMDSFAAGLRVALKMKEDGVLDKIVADRYSSYKSGIGADIESGKATFKTLEDYTLDKTQADLRAATSSDHLEQIKDIINHYIVNVLGK
>tr|A0A5N6QTR5|A0A5N6QTR5_9ROSI Uncharacterized protein OS=Carpinus fangiana OX=176857 GN=FH972_006142 PE=3 SV=1
MGTLVHDAQNVDSDIYLSLGLTELRKGVPAIPRVLSLLSSLLERSVQKNEILLEATQIKDVVTIFHGLRAPTLSIRQYIDRIFKYSGCSPSCFVVAHIYVDRFLQSTEVHLTSLNVHRLLITSLMLAAKFIDDAFFNNAYYAKVGGVSTAELNRLEMKFLFSIDFRLQVTIETFGRYCLQLEKETAEGLQIERPFKACGIKESWSNKDDSSCAPTVAQ
>tr|A0A0D6QGJ2|A0A0D6QGJ2_9DELT Putative ECF RNA polymerase sigma factor SigI OS=Anaeromyxobacter sp. PSR-1 OX=1300915 GN=sigI PE=4 SV=1
MTDTGETFEAQRPALLALAYRMLGELARAEDVVQEAWIRWQRRPGEVDSPKAFLLTTVARLCLDELGSARARREESRSDRLPEPVELDRAGLGRVELLDRISMAFLVLLQRLTAAERAVLLLHDVFDMTHAEIAARLEKSEPACRQLLRRARENVATERRTLRTSRDEHQRLLAAFMEASARGDQGALLDLLAEDAVLVADAGPGVVRYGRIRNVGRPVVGGLKVAALLASVARQRVGPPLELRERTLNGEPAAVAFEGGRPVSAILLGVAEGKVRHVYLQADPERLRHVGSLD
>tr|A0A178W037|A0A178W037_ARATH (thale cress) hypothetical protein OS=Arabidopsis thaliana OX=3702 GN=AXX17_At2g00490 PE=4 SV=1
MEACSRKRRRRRAYTTSTTGYAAVFFCGIFVFAQFGISSSALFAPDHYPSLPRKAGHFHEMASFQAPKATVSFTGQRREEENRDEVYKDDKRLVHTGPNPLHN
>tr|A0A1F8I579|A0A1F8I579_9PROT Rhomboid family intramembrane serine protease OS=Caulobacterales bacterium RIFCSPHIGHO2_01_FULL_67_30 OX=1797584 GN=A2795_02220 PE=4 SV=1
MSDPDGRFAAPPNSEGPKSERLFNAPVAVVLIALSMPVLFFFQRQLPDMGASMAFAPIDLQNGRWGGLFTAMLLHGSWTHALMNAIGALAFGAPVARLFGDRIGPTVFLLFYIGCGVVAALGYGLVHWGSTEAMVGASGAVFGLIGAATRLMGGRGRVLSLFDRRVIGASIAWMAVNAVTGLIGYAPGADGARIAWEAHAFGFIAGLLVIGPLGRAFGKGPLPMGTSARPESDV
>tr|A0A3Q8V945|A0A3Q8V945_9ACTN DUF4132 domain-containing protein OS=Streptomyces sp. WAC 01438 OX=2203204 GN=DLM49_03910 PE=4 SV=1
MGWLAAGEAYEVALVDGRVVARQATPDAPAGQEHTPRKTLPAEIRDRPEVVELQRFAQWLDRHAAECAAQVTTWMVSSLPVPAGLLARVWPDEAWRTALRDIVVVGDGPDETGFLRDARDTGELSVVNLDGETVRLNLPTVTMPHPVLLPDLEELRVFAAESGMVQGVEQLHRATWRKPEGIAPGTTRVTEFAEAEYRSWFHLTARATSLGYKIAGSAVVDRIRDAGRIVTASVGMSDPYSEEKAWTGHLTWGDADGQGTLPLTEVGPVAWSEGMRMAAALHAGRSEGTEGSR
>tr|A0A7Z7G4Q5|A0A7Z7G4Q5_9BACL Drug resistance transporter, EmrB/QacA subfamily OS=Paenibacillus sp. OK076 OX=1884379 GN=SAMN05518670_2026 PE=3 SV=1
MSQARLKERDDVKKGPILFVMILGAFLATLNQTVMSVATPELMGDFNISAATAQWFTTGYMLVNGVLIPITAYFMQRFSTRQLFQASMFIFLIGTIISALASNFGTLLTGRMVQAAGAGIIMPLLMHVILTLFSPEKRGAAMGMVGFAIIFAPAIGPTLAGYILEHYTWQTMFYGMIPLTVIVIGFAFVYLKNVSERVKLKFDTLSVLLSTIGFGALLYGFSRAGSLGWSSAEVIICLAAGVVALGLFTWRQLASANPLLDLRAFKYNMFSLTTIINIAITMIMYADMMLLPLYLQNARGYTALESGLLLLPGALVMGFLMPITGRLFDRFGAKWLAIIGMVITIVTTIGFIDLTDSTSYTYLVLMSTGRRIGMALLMMPIQTAGLNQLPPRLGPHGTAISNTVRQVAGAVGTSLLVSVMTSRTTAHVQDMVATGAAKGLTQQQLGMESMIQGINDAYVVIIGIAVVGLLLSFFIKRTKQATEEDSKQPVRQKVSMNTN
>tr|A0A4Y7SBP5|A0A4Y7SBP5_9AGAR Uncharacterized protein OS=Coprinellus micaceus OX=71717 GN=FA13DRAFT_1647367 PE=4 SV=1
MLGSAKLSRLGGHIAFLGDRFSLVQAARASIEKKAKALYYPVEPPNNEKYNPTRPPKYNLKDLPRRSQAHYWKVIELLNLAKTKTARATISRDSGIVALPACAASPAFLHPSYFPLDPFHLFYENITPFLWDLWTVDSTPGESVHVPSPKIARFGVLVAEAMRTLPPAFCGPVRNPHLKRQSQYKAYEWMALFHWYILPIGLELEFPPALLRNFSYLVEAVEIAMTVQSHSISDLQSLEDLIVDFLLQYEHLYVGDDPEKVQRCRLCIFQLIHVPIHIMWYGSIRLSSQATVERSIGEVGRKITSRKEPFAHLSNIIVEQEIIRVLSLYYPELTHKGATTTNTTRSDTRQKIRISKSENLSEELAHHLSAIFRDPFITWLTHLGQGRNSEGKTSGTLQPTNQHKQMFGEVISFYAITNADNETVEVAVYRPLVDVCQPLKTVIQGRWPSASAKVKIAAVEVESICTVVGIWAAPQSENIYILRKHPGLLMLTPLERGIQEDTERDEMDD
>tr|A0A1B4C1D0|A0A1B4C1D0_9BURK Esterase OS=Burkholderia diffusa OX=488732 GN=WI26_24630 PE=4 SV=1
MRGSMNLVRAFWLLLLLAAAGPALAFQTRIVAIPSAAMNQTLKATVVLPDDYARPRHGPERSVERFPVVYLLHGSGGDHTDWTANTHIAALADRYRVILVMPDGGHESWYIDSPFDSGSRYETFVGDEVVSYVDMHFRTIATKGARAITGLSMGGFGALRIALDRSDTFGAVGSISGAVDPRCCEDEPGIDHVFGDPGRHPSFWNRNAIVENARAFVRAHLDLTIDCGRDDSFVGSNRTLHQRLVALGVPHDYAERPGGHTWDYWAHAIRYQMQFFAASFQHGGYA
>tr|A0A2E7H1W3|A0A2E7H1W3_9EURY Uncharacterized protein OS=Euryarchaeota archaeon OX=2026739 GN=CMB34_05090 PE=4 SV=1
MLLSACEGISVADAYVKADRMTYEAIAPSYRAYVEADENLDEPSKQSRYRLLQTWELRINSNTKNK
>tr|A0A0E0KM68|A0A0E0KM68_ORYPU E2F_TDP domain-containing protein OS=Oryza punctata OX=4537 PE=3 SV=1
MDGSTTIPLPQPPRPPPPAPAPAPPQVFLRRSVLPPPQTGPHRVAPAPPPPGAHVHYFRAASPIPIFRAAASSRPPRPPPTTAPAPPPPPAAPAVTPARPVAVAPPPPPATTTATATEEVAAPATGNPMANTADNEEKNEREAVQSEVPKGETVQGPDKECTTGTVKGIKRPRKPKGFKKGSLRSNEGDAGASLFSPNNCRYDSSLGLLTKKFINLLEGAEDGTLDLNKAAETLEVQKRRIYDITNVLEGVDLIEKTLKNMIRWKGFDMSKPKERERQISALKEEIESLYDEESRLDDEIMEAQEKLNALRVDEDRRKLLYVSKEDINAIPRFQGSTLIAVNAPRGTYIEVPDPNLDMDIYKDLDNQEKHYQIVFRSAMGPVDCFLISNHQETFNADQQMADDLDAAVTSGSSQALQQMDYVQAPEIGESNGVREHTSEPSKRDDPVPGIVKIVPSDDDIAADYWLSSDADS
>tr|A0A3N1VCH1|A0A3N1VCH1_9ACTN Hemerythrin HHE cation binding domain-containing protein OS=Streptomyces sp. 2132.2 OX=2485161 GN=EDE04_6244 PE=4 SV=1
MDSEHVAPARPYGPAAADLTGVRVAHRAILADIERLAGLLAALAAAAEPAGPARAGAIAGYVHRFNDAVRGHHREDRTLWPVVLDAVPDAAEAAAGLAGFVADHEALDAVQADCDAAAARFAAEPGRHAGLLAGLLAVQRDLLAAHIEAEERHVLPVITRRVPGAAYAAARARVRRADRSPDPAWSRAWLLSHATEDETRRLLAVAGARPAAVEPELREYAAQASAVFAG
>tr|A0A2S6FD50|A0A2S6FD50_9PSED DNA topoisomerase 4 subunit B OS=Pseudomonas laurylsulfatiphila OX=2011015 GN=parE PE=3 SV=1
MATPSASSYNADAIEVLSGLDPVRKRPGMYTDTSRPNHLAQEVIDNSVDEALAGHASSVQVILHADHSLEVSDDGRGMPVDIHPEEGVSGVELILTKLHAGGKFSNKNYQFSGGLHGVGISVVNALSTEVRVRVKRDGNEYQMTFKDGYKATELEIVGTVGKRNTGTSVFFAPDPKYFDSPKFSISRLKHVLKAKAVLCPGLLVSFEDKATGEKVEWHYEDGLRSYLVDAVSEFERLPDEPFCGSLAGNKEAVDWALLWLPEGGDAVQESYVNLIPTAQGGTHVNGLRQGLLDAMREFCEFRSLLPRGVKLAPEDVWERIAFVLSMKMQEPQFSGQTKERLSSREAAAFVSGVVKDAFSLWLNAHPETGMLLAELAINNAGRRLKASKKVERKRITQGPALPGKLADCAGQDPMRSELFLVEGDSAGGSAKQARDKEFQAILPLRGKILNTWEVDGSEVLASQEVHNIAVAIGVDPGAADMSQLRYGKICILADADSDGLHIATLLCALFVQHFRPLVDAGHVYVAMPPLYRIDLGKEIYYALDEAERDGILDRLVAEKKRGKPQVTRFKGLGEMNPPQLRETTMDPNTRRLVQLTLEDFEATSEMMDMLLAKKRAGDRKTWLESKGNLAEVLG
>tr|A0A3R7JJI1|A0A3R7JJI1_9EURY Helix-turn-helix domain-containing protein OS=Haloarcula sp. Atlit-47R OX=2282132 GN=DVK00_02090 PE=4 SV=1
MRFIEEIVVDDFLPTFRSLLADALRERGLTQSEVADLLGISQSAVSKYVHGDVARQEDLLAHRGLEELVERLADGLADGDMSPVQALVETEVFIRELEQGGVLAQIHEDAVPELGDYDDEFAVHDPDSQLRAAERTLASVRRGLSVLENTSGFATLIPAVGSNLVQCLPDAESIEDVAAVPGRILDVKGRATIPADPEFGVSEHVATLLLAARTAGSDARAVLNVRYDDGVVAALREAGRTVVEFDAEERVEPAVAAALADDPGVDVLYHTGAMGIEPVVYLLGDDAVSVAETAREIL
>tr|A0A1D3UJH6|A0A1D3UJH6_TANFO Uncharacterized protein OS=Tannerella forsythia OX=28112 GN=TFUB20_01002 PE=4 SV=1
MDIGQIRKDVHAYYHSIFNDKYGRYVRILELFPPIKESDCILDYGCGTGCVSQYFYNKYKCKVDAVEQSEIELTKAKISFQRGG
>tr|A0A4Q7MI29|A0A4Q7MI29_9BURK Enoyl-[acyl-carrier-protein] reductase [NADH] OS=Kerstersia gyiorum OX=206506 GN=EV679_2606 PE=3 SV=1
MRSANLAGKKGLVVGIANDQSIAWGAARAMRASGAELAVTWYSDKSLPYVTPLFDEIGATLRLPLDVSDTAQQQALFDTLRERWGRLDFLVHSVAFAPRDDLHGRVLDSSAAGFAQAMDLSCHSFIRLARDAEPLMAQGGSMMTISYLGAQAVMPGYGIMGPVKAALEASVRYLASELGPRGIRVNAVSPGPLETRAASGIAGFDSLIKDSMERAPLRHTLDIEDAGALCAFLASDAARAISGSTLFVDNAFHILN
>tr|G5HTX5|G5HTX5_9FIRM Uncharacterized protein OS=[Clostridium] citroniae WAL-17108 OX=742733 GN=HMPREF9469_06037 PE=4 SV=1
MGLFGNIIKPLQGKLTTKQEENMKKVAEVFKEKTGKDYQTAVVWKMTTKKKLTKTVYTYYNWIIGYGVNADHIPEIVFIPVDPKWEWIGDPIYCPKTNSEMVQDKKTTLFALKNSQLEDGKMDLQLISSMAMMSNYLMDVNYMFEYDKLNEYCLEHWVGK
>tr|A0A0Q8RTN2|A0A0Q8RTN2_9SPHN Uncharacterized protein OS=Sphingopyxis sp. Root214 OX=1736491 GN=ASE06_19140 PE=4 SV=1
MPLDGSLGTTNAARATVTIEYSATDRSYTVTTDGRSQTFRPADIDAARSSAAATVYIRTNGGTADVLTLTKPGTSGRLTYQYVAGGFWERTVSGATSTSGSVDGFAYGVETPDAALPRSGTANYGIDLIGVMGYPNSAPSPLAGRGTLYVDFAKGSIVITGEADGGTTFNGTATIASASNNFSGRFEYYSLGSMTGQIDGRFFGPGAQEVGAAWHVKNNGGNAAAGIILGRKNPDTPVNSDFVNIANSQFFENSGVILKATYANGSNNSSNKLTQASDFLVHYDAGYKSYTIVAGDKAEFFGPDRVPDNAAPGSHWTKGIGTTRSTLQFLNGGTHVTGARYVFTDGDATSSFVTSNFFIYGFPTANADIVRSGTSFFKSSIAGSMTDQGYDSLLDIAGPGVIQVNFATGAIDIRGAFDIVYRPITGPRAVGNGSYTGTAQLASSANSFTGSIELAASDTYRGDLSGRFYGPAGKELGAIFKASDSGGDVAAGTITASLDPSANASTKALADLTETTVFISSKAQAGITVDQPSGRQFSLGPPSVSRTGLQPRITYDPQTGSYIVREFGGDHQDQLLETLRFGTADRDTAASDAKFDVFNVASGNTTHRISLLRPGAGNPAIQLTYASFIGLVSKTVEGAPINRDTTRYSYFALGTPTAETLMPRSGTGTYNGLATGYGTVRGIGFAEYDISGTSKLSVNFTSLATQLDLTLAGRNLADGTNFNFGDFIFNGALGYSLVDGQRLNQISMGLKRDTLPPGSSGDAFGHLYGPAGQEHVTPFGMQVRGADGSETVIGGVAYGKRD
>tr|A0A6N7CL63|A0A6N7CL63_9NOCA HTH-type transcriptional regulator IscR OS=Rhodococcus sp. T7 OX=627444 GN=iscR PE=4 SV=1
MKISGGVEWSLHCCVVLSQAEGPVPTARLADLHGVSKSYLAKHLQSLARAGLVHPTEGRDGGYVLTRAPGDITVLDVVQAVDGDAPAFRCTEIRQQGLLAAPPEQCKTPCGIARVMADAERAWRSTLSGVTIADLAATLDVTVLKATLEASG
>tr|A0A678Y985|A0A678Y985_9INFA Polymerase acidic protein OS=Influenza A virus OX=11320 GN=PA PE=3 SV=1
MENFVRQCFNPMIVELAEKAMKEYGEDPKIETNKFAAICTHLEVCFMYSDFHFIDERGESIIVESGDPNALLKHRFEIIEGRDRIMAWTVVNSICNTTGVEKPKFLPDLYDYKENRFIEIGVTRREVHIYYLEKANKIKSEKTHIHIFSFTGEEMATKADYTLDEESRARIKTRLFTIRQEMASRSLWDSFRQSERGEETIEEKFEITGTMRKLADQSLPPNFSSLENFRAYVDGFKPNGCIEGKLSQMSKEVNAKIEPFLRTTPRPLRLPDGPLCHQRSKFLLMDALKLSIEDPSHEGEGIPLYDAIKCMKTFFGWKEPNIVKPHEKGINPNYLMAWKQVLAELQDIENEEKTPRTKNMKKTSQLKWALGENMAPEKVDFDDCKEVGDLKQYDNDEPEPRSLASWVQNEFNKACELTDSSWIELDEIGEDVAPIEHIASMRRNYFTAEVSHCRATEYIMKGVYINTALLNASCAAMDDFQLIPMISKCRTKEGRRKTNLYGFIIKGRSHLRNDTDVVNFVSMEFSLTDPRLEQHKWEKYCVLEIGDMLLRTAIGQVSRPMFLYVRTNGTSKIKMKWGMEMRRCLLQSLQQIESMIEAESSVKEKDMTKEFFENKPETWPIGESPRGVEEGSIGKVCRTLLAKSVFNSLYASPQLEGFSAESRKLLLIVQALRDNLEPGTFDLGGLYEAIEECLINDPWVLLNASWFNSFLTHALK
>tr|A0A2N6J824|A0A2N6J824_9BURK Lrp/AsnC family transcriptional regulator OS=Herbaspirillum sp. BH-1 OX=2058884 GN=HBH1_03049 PE=4 SV=1
MELDTTDLRILNILQENSSISNLELASRINLSPSPTLARVKRLETEGIISRYVALADPHLLGLKVNVFVKVILERQGAEALAQFETAVSAFDEVMEVYLMTGDEDYLLRIVVPDLLTLEHFIVDHLTKIPGIKNIRSSFALKQIKYKTALPTPKIKTRR
>tr|K2Q3C7|K2Q3C7_9HYPH Uncharacterized protein OS=Agrobacterium albertimagni AOL15 OX=1156935 GN=QWE_16493 PE=4 SV=1
MATILLQAAGAALGSVFGPVGAAIGQAAGALAGSMIDRSLLSGTREVNGARLSSARISGASEGTVIPRLYGTARLGGTLIWATRFEEETVTERTGGKSSGGTRTTTYRYFANLALGLCEGPIAGVRRVWADGRELDTTEIEMRVYRGTESQPADPLIAAKQGADNAPAYRGLAYVVFERLPLDDFGNRIPLIQFEVIRPVGALEEKIRAVTMIPGATEHGYATVRISDAPSEGAKRWLNRNTLVAATDWQASLDELQALCPDLESVALVVAWFGTDLRAGDCRVLPGVEVGYRNEESRPWSVAGLARGDAYVVSRHSGGPAYGGSPSDESVIEAIRDIKARGLKVTLYPFVLMDIPAGNGLPDPYGGAEQAAYPWRGRITAYPPGSDKTASARAQVSSFVYRSDGYRRLVLHYAALAAAAGGVGAFLLGSELRGLTVLRDEANAFPFVEALVALAGEVRGLLGGGTAISYGADWTEYFGHQPPDGSGDVFFHLDPLWASPHIMAVGIDNYMPLADWRDEDLEAESPDGFTGADDAEGFARTLTSGEGFDWFYASEADRRARVRTPITDGAYGKPWVFRFKDLKSWWENPHFNRIGGVEQASPTAWVPRMKPFWMTEVGCGAVDKGANQPNIFVDAKSAESGRPYFSAGARSDSQQRRFLEAHLDHWTGSLLPPDMVDPSHVYAWTWDARPYPAFPQNMALWADGSNWRTGHWLNGRLGTATLADTIAAILRDHGFADFDVSEVAGDLGGYVKGDLTSARDLIEPLLELFQIDVIEDAGRLKFRTRPTASLAAREITVLADIADRPLWSETRGHDSDFASEALVTFYDPASDYVEASVRSRKVEAATDRQLARDLPAAMPEETALAAAEGWLRDNRLARRTVQLALGPQEIVVEPGDVLRFPEGPEGRFLVQGIDEGFERRLTLRAFAGKVSAPVPVVEPGRVVDGGGAAGFAPVVQFLDLPRLEGASHAGDASVAAYGRPWRRLAVSSSPEAEGYRLRLTLDRPATLGRLVEPLLPGPVGRFDGANALVVEVLAGAFASANRMAVLSGANRIAVRTGTGGWEVIGFVEAEEIAVGHFRLTGLLRGLGGTEDAMAAGAAAGAEIVALDEAVRSLGLANAERGAAQNWILEPMGLVSELSGPHVFAGGLRAETPLSPVHAKVRRQATGDLAITWIRRSRIEAEAWTEGEVPLDEAEERYRLEILDGGTVLRVVEVTEPAWTYAGADELTDFGVPQTALGLRIRQLGRLAAGMPLQAVVPID
>tr|A0A373NFP0|A0A373NFP0_9FIRM Histidine kinase OS=Ruminococcus sp. AF31-14BH OX=2293173 GN=DWZ26_10045 PE=4 SV=1
MIETIMLIVVIFVLSGVFWYSFFYQKEKKLFNRLQQMLDCAIDGELERTEISEEKYSALENSMKQYIDSSFLAKKNQQEQKEVIQKLISDIAHQTLTPISNLKVYGEIISEMSNENQEEIATILEQTEKLDFLIQSLVKLSRMESGIIAVHPEDTAIAQMFASVQQQFNVKAMEKDISLSLFDTDLHAMCDAKWTVEALGNIVDNAIKYTACGGNVQIKTEQYSFFVKIDIIDDGIGIEKEEIPKIFGRFYRSLSVADQPGVGIGLFLAREIIQAQKGYIKVTSKRGKGSTFSVFLPIAKKE
>tr|A0A538LIU9|A0A538LIU9_9ACTN Alpha/beta hydrolase (Fragment) OS=Actinobacteria bacterium OX=1883427 GN=E6G01_13160 PE=4 SV=1
EAAPIPGPNGKSLGPSELVDAGLIPTYEPAADSQFYDALSSALNDRPGQMLALAAAYQESVDYPLYASVECIDSPHPEGSAAFRAFAQELASLSPRFGAAIANELLPCAYWSAPVRSVVGPVTAPDAPPMLVIGTTGDPATPYDQAVRVAQTLAHGRLLTFVGDRHAAYGASQCAADAEAAYFVDLTLPPEGTTCTR
>tr|A0A7K0C3Y3|A0A7K0C3Y3_9ACTN Uncharacterized protein OS=Actinomadura macrotermitis OX=2585200 GN=ACRB68_61920 PE=4 SV=1
MAVFGVDYAWGRPGAAALKRSGVRFACRYLSHDTGGKNLTRAEAAELSAAGIWLVVVWESTASRALSGRAGGAADAREAARQAAACGMPADRPIYFAVDFDATAGQQAAINAYLDGAASVLGRRRVGLYAGLGPVRRAFDAGKITYGWQTYAWSGGRWDGRAQLQQYSNDHTVNGVDVDYDRAVAADYGQWRVGVSPQEDDMPDYVSVGTTTAQPLPPGAWTTVVWDAEYSDAGRQHADKGGPGVLNGPARYSLTAAVRIVGVPAGTRIQARAIEADAGGFEAGAVQDFTSAGEETNLLYGISADSVAKDRSVRFQVLQHGAQAAAIGGGSAKLLYWRG
>tr|A0A173CWC4|A0A173CWC4_9NEOP Cytochrome c oxidase subunit 1 (Fragment) OS=Bucculatrix sexnotata OX=687279 GN=COI PE=3 SV=1
IFGMWAGMVGTSLSLLIRAELGNPGSLIGNDQIYNTIVTAHAFIMIFFMVMPIMIGGFGNWLVPLMLGAPDMAFPRMNNMSFWLLPPSLLLLISSNIVEMGAGTGWTVYPPLSSNIAHGGSSVDLAIFSLHLAGISSILGAINFITTIINMRTNKMSFDQMPLFIWAVGITALLLLLSLPVLAGAITMLLTDRNLN
>tr|Q0JI52|Q0JI52_ORYSJ Os01g0823700 protein OS=Oryza sativa subsp. japonica OX=39947 GN=Os01g0823700 PE=2 SV=1
MESATEKVRRTPSSCLLLRISDICKVRSVGVAPTVREKPKADGSATGESSEDGGAHLKVHPHHVSDHESVSECSSARCEEAFVERLLDAISGLKLSYVNLQQALVPYDPEEITIADERFTSELQETAGLKDLYVNMNKWRNPMYQCYVGSRIQEQQKLAVELQAGMCKRDSEIVCLRAELDELERKNMELEEKIGQSALQKEGSFAIGMGVSTDMFMELFELSTKSIHDFAKLVVRWMKLSRWNLGNLTSPIDNSVVYDKRSHKNYAVEAYFACMMLMGHKEEYLSLDVFDYVMSFSDPFDALMKAPDSCFGRFCREKYLAILPPSMEDSFFGNLDHRSFVENGGHPRTPFYQAFVTMSRYVWASLTVARSLNPRAEMFYVKGGTEFRSKHMECVPSKITKEGDKVSVGFTVMPGFKIGCTVIRCRVYLSMVNERNF
>tr|A0A7S0VQU1|A0A7S0VQU1_9CHLO Hypothetical protein (Fragment) OS=Polytomella parva OX=51329 GN=PPAR00522_LOCUS21823 PE=4 SV=1
KGNQYTNRNYNPHHNDRGDGDEGNSSHCSSDDDGNVDRVATTLKKGNKDSELIDSSFHYREMEVKEERSDTWSGLSNLFHPIASPSAEQILEQLQMIGRTRQLERDRLKQGLQGEESSAESHVAS
>tr|A0A7N0VGN9|A0A7N0VGN9_KALFE Smr domain-containing protein OS=Kalanchoe fedtschenkoi OX=63787 PE=4 SV=1
MASSTPPPHCSITTTNPRSHSRTKSNRVVSLTNPTPSAAAAGAPPCCASSKPLCPAKTHPLASASPSSPRNPNFPSLSDFSGRRSTRFVSKMHFGRHKPSPTSSRHTSVAEDALHQVIRVNATDHRALDAVLHAFAPNLSGSDDYTFLLRELGNRGDCSKALRCFDFAVQRERRKNEQGKLATAMISVLGRMGKVDLARKVFDDAAAQGYGNSVYAFSALISAYGRSGYCDDAIQVFEAMKKSGLRPNLVTYNAVIDACGKGGVEFSRAANILNEMLSDGVLPDRITFNSLLAVCSRGGLWEAAQNLFSEMIYRGVDQDIFTYNTMLDAFCKGGQMDLAFQTMSEMNSKNICPNVVTYSTMIDGYAKAGRLSEALNLLEEMKYAGIGLDRVSYNNLLTIFAKLGRFDEVVNVCKDMESSGIRKDTVTYNALLSGYGKQGKYDDVKKVFQAMRHEHISPNLLTYSTLIDIYSKGGLYQEAMEVFTDFKKTGLKADVVLYSALIDALCKSGMVETAISFLDEMTKGGIKPNVVTYNSIIDAFGRSAIKDFQTDSPAEASELQNESSSSTLPPARSQNGNRIGSGFIKILGHLAAEKPCYLKKYDGKPLEILCILAIFHKMHELEIKPNVVTFSAILNACSRCSSFEEVCMLLEELRLFDNKVYGVAHCLLMGCRGSVWVQAQSLFDDVKQMDSSTASAFYNALTDMLWHFGQKQGAQLVVLEGKRRHVWENLWSDSCLDLHLMSSGAARAMVHAWLLNIRSIVFEGHELPKLLSILTGWGKHSKVVGDGTLRRHIEALLNSLGAPFRLAKCNLGRFISTGINTYMIMMLPSL
>tr|A0A2V6QIG5|A0A2V6QIG5_9BACT 5,10-methylene tetrahydromethanopterin reductase OS=Candidatus Rokubacteria bacterium OX=2053607 GN=DMD80_16590 PE=4 SV=1
MRLGLALPNASPEGRPLTGPALIAGTRAVERAGFDSLWCFDSIGRGSMIPDPLIAVSVAATVTERLTLGTGILQVPLRRPVELAHRILTAHLICGGRLLLGVGAGSTKADFDAVGVDFDTRMQQMEEALALMRRLWQGEKVGPAQLNPWPAALGGPKLLIGSWAGSRWIPRAAKDFDGWIGSGARSSVAALRDGIKRFREAGGQRAIATNIPVDLEAPTAPMPEEGQFHLRCDPTTAAQRLRMLADLGFDDAVLVTRRYGDADLAALRALWP
>tr|A0A7Z7G3P1|A0A7Z7G3P1_9BACL UPF0310 protein SAMN05518670_2319 OS=Paenibacillus sp. OK076 OX=1884379 GN=SAMN05518670_2319 PE=3 SV=1
MNEQAKHDLMANNTEIQQTHTREFLSHQLDIEAESDEGNRYWIGVVSASHVEKGVEGGFAQLCHGKVASLRRMNAGDWLIYYSPRTSMQGGKVLQAFTAIGRIIDDQVYTYHVSDSFVPHRRNVHYYPCQQVKIADLLDQLILTRGQARWGYPFRYGHLQIQREDFLKIAVAMLGTEAENLLTGNKKN
>tr|A0A1I0CXW7|A0A1I0CXW7_9FIRM D-alanyl-D-alanine carboxypeptidase OS=[Clostridium] aminophilum OX=1526 GN=SAMN04487771_100922 PE=3 SV=1
MKSNLFHWKRYLWILSAAGILTVSATPAVVFAAPETGAASTAAQSGSEASAIAETTETATKALYGTSPQQAQSARVASIAAQAAATAGTGEEASAAVASIAAAAAETAAQEVTEDAQAWPSDTGIFSEAGVVIDVDSGCVLFGQNMHQQKAPASITKILTALVVLEHVDNLDQMIPYSHDAVYNTESGSGNKYGLDEGDSLSVRDALYLMLLASSNQSANALAEYVGGTREGFVQMMNDKVAELGCRDSHFANPSGLNDDTQLTSCYDMALIGMAAYRNERLLEIGSTRSHKITTPTKNNPNGINVKMEHKLLITEDPNSENYYPFAVAGKTGYTSIAGQTLVTYAVKEGRRLIAVTMKSRQKTHYTDTINLLEFGFNRFENVPVAEQETAISQASGNVTLGDSTFDAADLSVEETVMTVPKNLSVTDLERTVLTGEDMPAPAPDGAAAYIQYSYRDRVTGGAYVTAESLRAKETGATGTEGNRRTKAESGDNIFSKAAKGIGSFFAGIGDAVRNLSVPGIIAIAAVAGLAILTVIAFFTYSVQKRRENERLERRRTRLREMGVSEEEFAEMVGRRRRSRGEKNSSRDFSAETYRVTEAGNSPADHHGRAEDVKSPAVPQTEALKTETPENPDDSFLDEDFGMDGELITEEDPEKRQPHV
>tr|A0A445NDM6|A0A445NDM6_STRNE Putative glycosyltransferase EpsJ OS=Streptomyces netropsis OX=55404 GN=epsJ_2 PE=4 SV=1
MVKLSVIVPFFNVQTYAPDTLRSLRANARADFEFILVDDCSTDETPDILRRAERELPGAVLVRHEKNGGLATARNTGLERARGEYITFLDGDDWLAPGYYEQLLDVIEGLGVEFVRTDHVQCTARARTVHRVPHGRRGVVLSPRDAILPADRSTSVDYAYAWAGIYHRRLLDEGLLHFRHGLRTAEDRPWIWRLHREARTFAVAGLLGVFYRRGVASSLTQIGDVRQLDFLRAFDQVIDETSRDADAEILLPKAVRTYCAIISHHLGSIERFEPAVARTLRSKSAAALRRMPQDLLKDALNSMDDDRAARLRRLRRRPAPAGVTG
>tr|A0A1G5TNQ2|A0A1G5TNQ2_9HYPH Uncharacterized iron-regulated membrane protein OS=Methylobacterium sp. UNC378MF OX=1502748 GN=SAMN02799622_03000 PE=4 SV=1
MSRARSFRQSMAWLHTWSGLVVGWVLFAIFVTGTASYYRTDISHWMRPELSDSSSDPAAAATRAGAFLQKAMPNAAGWSVRLPNAENPAVEVYWWPHPGGPYHHALLDPATGEPARVRDTRGGDFLYRFHFELSLPPIWGRWIVSVCAMILLIALISGIVTHRRIFADFFTFRRDRSAQRGWLDAHNVMGVLALPFHLMIVYTGLVTLSAMLMPWGMKAVYGNDPLRYYAEAGLATPGVAPAGRPGTPLPLGELVARAAAAGGAVPEVMLVTRPGDAGATVTAYFEEPMGLAHLHPQIAYGADTGSEIARVGEPGAATRTGAVMAGLHEAHFAAAPLRLLFFLCGLMGAATVASGLVLWTVARAPRGADPEGFGLRLVRLLNIGTIAGLPVGLAAYFLANRLLPLGLEARADWEIRVFFAAWITAAIAASLYPRRRAWSVALAVPACAFLVIPVIDAVLVGQPRFLAFDAAMAVVGLALVAGSRLAARPRPAESRLVEANLSRTVEA
>tr|Q71P98|Q71P98_9BRYO Protein PsbN OS=Homalothecium laevisetum OX=184649 GN=psbN PE=3 SV=1
MLTLCTIILIKLIKNKPFFWNYLKMETATLVAIFISCSLVSFTGYALYTAFGQPSKELRDPFEEHED
>tr|A0A3B0J0J5|A0A3B0J0J5_9RICK Uncharacterized protein OS=Wolbachia endosymbiont of Aleurodicus floccissimus OX=2152762 GN=WBAF_0556 PE=4 SV=1
MRLKLAYTNTIHLKHDFNIGDIETKKLCHSKIMLRFQEKAVSSQISCVTEINFGRIAIATANDKQASVYYIFKQNVKHMGNHVLFKVRVGRVATHIFVSDPNLAKIIKCLTIRVMIYIIMAII
>tr|A0A4T0N0J3|A0A4T0N0J3_9BASI Tudor domain-containing protein (Fragment) OS=Wallemia mellicola OX=1708541 GN=E3Q01_03257 PE=4 SV=1
SAEEISQYELQLEQVKETLTADPTNAELIGLKDELSNLIDLLKASTAPAQTAPSTSEQPPQSKGKDSKDVKIFKAGEDIMAKYNDGKFYPAIVKAVSGIHPKIVYTINFRGYEGTQQVQPNQIKAMDPHTKISLTNKRQRDSQKSLTSIEDEKERERKRKKSEKKAEAREQKNSEMNNKQNNWQKFAKKANKKGIHIAGSEGRSIFKTPDNPYGRVGVTGSGKPMTEQKSVRDKHVFVPTLEDQ
>tr|A0A2I2A5J4|A0A2I2A5J4_9GAMM YigZ family protein OS=Hydrogenovibrio sp. SC-1 OX=2065820 GN=CYQ88_04895 PE=3 SV=1
MAYLEPVNAVVEETEIKKSRFIAYAKKVVSRQQAMEYVSELRVAYPDARHVCWGYVIGDPNNSTNSGCNDDGEPSGTAGKPILSQIHYSNIGNVVVVIVRYFGGIRLGAGGLVRAYRESAQKGLKALQTEDYIPKLELSLDCPYEEEALIRRVMASLQGEITDAIYTTQVNLLVSIPTHSLTLLQDQLASLSATIIEN
>tr|A0A7W8SVI5|A0A7W8SVI5_9BURK Membrane fusion protein (MFP) family protein OS=Paraburkholderia sp. WSM4180 OX=2723099 GN=HDG39_006657 PE=3 SV=1
MNFNIFKRGKKKAKLTKGDAAFMSDIRESLLTQSTPGSMIMLYVILTVLAGGLTWAYFARVEEITHGEGTIISKSREQVIQSLEGGILEQLDVREGDIVKKGQVLAKIDPTRAETSYREAWSKSVGLKATIARLRAEAYEQPLTFPDDVKAVPTVVKQETLAYNARRRALNDSVTALEKSYSLSNKEIGLAEPLAAKGLVSEVELLRMRRQANELRSQIVERRNRFQADANSELTKLELELAQTSETVVGRADVLQRTTVIAPVYGTVKNIRFNTIGGVIQPGEHIMEIVPLEDQLLVEARIKPSDVAFLHPDQPSTVKITAYDYGIYGGLKGTVQHISPDTLKDDQKAAAGRPDATYYRVLVLTDSSELHAGGKSLPILPGMVATVDIRTGEKTILDYILKPIFKAREAFRER
>tr|A0A421K520|A0A421K520_9GAMM Alpha-amylase OS=gamma proteobacterium symbiont of Stewartia floridana OX=1968599 GN=B6D75_05870 PE=4 SV=1
MSVDELDTRLLGHLSLLYGEQQAATLLPKLHELIGRHIEVRQGKRLEIPRWDEKDSVLIGYGDSIQYPGMTPLASLKQFLDRRLNGVFSMVHVLPFFPYSSDDGFSVSDFRSVNPELGDWQDIRELGENFSLLFDLVLNHMSREHLWFVNFVHDEEPGRDYVVQVSPDENLSMVVRPRSTPLLSRVRTPRGMLDVWATFSNDQIDLNYANPEVLLEFIDILLDYIRRGARAVRLDAVAFLWKEIGTSCIHLPQTHEVIKLFRTLLDVLEPGAILLTETNVPHQENISYFDQGDEANMVYQFSLPPLILHAIMCQTTEFLVPWARSLEQETLPEGCTYLNFTASHDGVGLRPLEGLVPDEDLDELLDMMRRRGGYVSMRATTEGRDRPYELNISYFDAFAAEDDDVDPWHIARYMLSQTLPLSFRGIPAVYINALGATPNDPLGVERTGMTRSINRRKWDGAELERLIDLPLTDAGQVFPEYIRRLRIRSGIKAFHPDAPQRVLDMPDGILALERTSLDGGQRVYAIHNMTGDLRSVDISALGGASRRWFDALHQVVPDMDGDGVRFRPYQTVWLMAKG
>tr|A0A182WP14|A0A182WP14_9DIPT Uncharacterized protein OS=Anopheles minimus OX=112268 PE=4 SV=1
MSPCVNFRLANLLSHKS
>tr|A0A6P5JSA5|A0A6P5JSA5_PHACI probable aminopeptidase NPEPL1 OS=Phascolarctos cinereus OX=38626 GN=NPEPL1 PE=3 SV=1
MANVGLQFVASAGDGDPQSRPVLLLGQLQNLHRVPWSHLRGKLQPRVTEEIWQTALGTLNPNPTDSCPLYLNYATVAALPSRVSRHNSPSAAQFITRLVRNCLPGGTNRCILMVCERSEVFASACALARAFPLFTHRSSASRRTEKTVTVEFFLVGQNNGPVEVTTLKCLTSATEGVRLAARIVDTPCNEMNTDNFLEEIKKVGKDLGIVPTIIRDEELKQRGFGGIYGVGKAAVHPPALAVLSHMPEGATQTIAWVGKGIVYDTGGLSIKGKTTMPGMKRDCGGAAAVLGAFRAAVRQGFKDNLHAVFCLAENSVGPNATRPDDIHLLYSGKTVEINNTDAEGRLVLADGVSYACKDLGADIILDMATLTGAQGIATGKYHAAVLTNSEEWEAACVKAGRNCGDLVHPLVYCPELHFSEFTSAVADMKNSVADRDNSPSSCAGLFIASHIGFDWPGVWVHLDIASPVHAGERATGYGVALLLSLFGGASEDPLLNMVSPLGEDADPQGDMERDCKRRRLV
>tr|A0A5J6X1V6|A0A5J6X1V6_9GAMM Histidine kinase OS=Aeromonas simiae OX=218936 GN=FE240_18420 PE=4 SV=1
MPRSLLSRMLLLLLLAILLSQTILTGIWMQQIQKRELDGMLSTTRNLAMSAASTVSFFKSLPLQYRHIALDQLRNMGGSRFFVSLNEEEIRINPIPDSERKTMVLSEVKAILGNKLSDTMAIKVNFSHPEDLHVFNNDTLLADLPSSWARYTLSLEPINPPVLVIQIEIKRGEWLYLAALLPAPYMTLDDTVMPANQVRFIALMTVFLCFFTFLLVRWQTRPLRRLAKAAVNLGKDIDQPSLKEEGASEIVAATRAFNIMQHRIRRYIGDRELLFSSISHDLKTPITRLRLRVELLDDETQITKFNKDLDELELMVKGALQTVKDTDIHENMAQIDVDGMLHQLAESLNLREERLTIEGHCKHPYRGKPLALKRCIANLVDNGIKYGKKVRIIILDDDEMLILFIMDEGPGLPEEQIERIFEPYYRFDTEKPGNGLGLGIARNIAHAHGGDLVLENRPTGGLQATLSLPRQ
>tr|A0A1Q6SWC2|A0A1Q6SWC2_9FIRM Aspartate--ammonia ligase OS=Subdoligranulum sp. 60_17 OX=1897022 GN=asnA PE=3 SV=1
MSHITIPEGYQSLLGLYDTQKAIGLIKTIFQEKLCMALHLKRVTAPLFVMQGSGLNDDLNGVERPVSFDVPSLNEQAEVVHSLAKWKRYALYKYGFRPGQGIVTDMNAVRRDEELDNLHSIYVDQWDWERVITADQRTLEFLQETVRDIVDAVCATSDELRWKFPELKNNIHLGREVAFITTQELEDRYPDFTPKQRENAFAKEHGTVCIMQIGGRLKSGQPHDGRAPDYDDWTLNCDILFWHKPLDCALELSSMGIRVDADALRRQLDAAGCPQRAELPFHKLLLDGTLPLTMGGGIGQSRLCMLLLGKAHVGEVQVSLWDDATVQACRNSGVELL
>tr|A0A7W1W6Z4|A0A7W1W6Z4_9BACT S46 family peptidase OS=Acidobacteria bacterium OX=1978231 GN=H0X49_12420 PE=3 SV=1
AAENLFNKFEGKERRSAEETFAESIAERENFDTPEKVIKLYDLSLSDLQKRYPNIVEFMTALGQEKSAVTARTAKFNGEIDRLRLLYQQGMAEMKGIQPYPDANSTLRFTYGNVRGYSPREAVTYSPFTTLRGMIEKDSGEIPFDVPQKLIDLQRTKDFGRFGVGDTVPVNFLATTDIIGGNSGSPIMNAFGEQVGIVFDGNYEGLGNDLFYNEAVGRTIAVDIRYVLFVTEKFGGAGWILGEMNIKGRTPVKARSAAAE
>tr|A0A1Z2QUG4|A0A1Z2QUG4_9ASTR Ribosomal protein L14 OS=Legenere valdiviana OX=2010882 GN=rpl14 PE=3 SV=1
MIQPQTYLNVADNSGARKLMCIRIIGASNRRYAHIGDVIVAVIKEAVPQMSLERSEVVRAVIVRTCKELKRDDGMIIRYDDNAAVVIDKDGNPKGTRVFGAIAEELRQFNFTKIVSLAPEVL
>tr|A0A239R358|A0A239R358_9FIRM Exodeoxyribonuclease III OS=Lachnospiraceae bacterium OX=1898203 GN=SAMN06297422_103139 PE=3 SV=1
MKLISWNVNGIRACVNKGFMDTFNTLDADILAIQESKMQKDQLILETPGYHQYWNYAKKKGYSGTAVFTKKEPLGVTYGMGIEEHDQEGRLITLDMGDYYFVCVYVPNSQNELKRLDYRMKWEDDFRKYLNDLKAEKPVIICGDLNVAHEDIDLKNPSANHRNAGFTDEERGKLTELLESGFTDSFRKLYPDMTDIYSWWSYRFNARERNAGWRIDYFLVSDDIKDKISEAGIHTDIYGSDHCPVELDIDL
>tr|A0A498QHK7|A0A498QHK7_9MYCO Uncharacterized protein OS=Mycobacterium attenuatum OX=2341086 GN=LAUMK136_05508 PE=4 SV=1
MPHAESTVGPALMVAHSGASSHASAPGRDRLEPRAVSRELRASDPEVWQTGLHAASEDAPLRVVGNTPSGMFVDGRRKGSVTVSDKTIVRFGDPTGGKALTFEVVRPSNSPEEQRREQRPSDQSDGHTGEADPGVVRAGAAAAARRRELDISQRSLAADGIINAGALIAFEKGRSWPRERTRAKLEEVLQWPPGTIARIRQGESVGYQAPSPTAQADDEAQPTEGPASLIAQAVAAAVDTCSLAIAALPPPEDPEFTERAAPILADLRQLEGIAVQATRISRITPELIKALGAVRRYHDKLMTLGATAPGATLAQRLYAARRRANLSTSETAQAAGVAEEMIVRAEAEEALPAEAAEAIEALIHQIN
>tr|X0B5K4|X0B5K4_FUSOX Uncharacterized protein OS=Fusarium oxysporum f. sp. raphani 54005 OX=1089458 GN=FOQG_17891 PE=4 SV=1
MVGRPKETSACSGKSGPGSRPDNPVGRGSVWGPEEGSSPARNRASARGTAGRLSMSSRSLYTGRRGRTRMSVGQEDGI
>tr|A0A345E3A3|A0A345E3A3_9EURY Sodium:calcium antiporter OS=Haloplanus rubicundus OX=1547898 GN=DU500_09665 PE=4 SV=1
MRRQALTALGGAAALTLPWVVTYLSGMAHSLATGTVVLVSGLSVLGASFLLAWGAETAEKDVPRAFAIAVLAVLAVAPEYAVDALYAWNAGVHAGTARGVEAGNLAVANMTGANRILIGIGWAGIALFTVYRAGSGDDPAVESRSGFLADAVTLDHDIGLEIVFLFLATLWAFLVPLGGGIDILDMAFLVGLYIAYIAVILKGDVDPDEAHVGVPAYLQRFPKPYRAATVIGLFVYSGLMIFTAVEPFAHGLEQLGQNIGIPSFFMIQWIAPLASESPELIVVVYLVNKARSTAGFNALISSKLNQWTLLIGTLVVVYSIALGQYGALPFDQKQSGEIWLTAAQSFFAISLLVNFEISVREAIVLLVLFLTQVLSEFLLIRGILELPISDYQLLLVFTGIYIVLGTTLFVARRHALGSIVRDSAGTVSDAFSSSGEPRGAD
>tr|A0A1E5AGD2|A0A1E5AGD2_9RHOB Peptidoglycan-binding protein OS=Rhodobacteraceae bacterium (ex Bugula neritina AB1) OX=1868286 GN=AB838_08000 PE=4 SV=1
MTPPRSLLRGRQAPPLLLALLATLAACVQPQPGGPGSETGRYAPPGAAPGTCWSKHTAPAVIETVTRQVLAEPEQQDANGRVIRPATFRTETRQEIVRPRQEQWIEIPCPAMMTPDFIRTIQRALTARGLYRGPVHGRMDAATRRAVQRYQAPLGPDSGTLTLTSARRLGLVAVPG
>tr|A0A0K0DCJ6|A0A0K0DCJ6_ANGCA Ge1_WD40 domain-containing protein OS=Angiostrongylus cantonensis OX=6313 PE=4 SV=1
MGMGDPCVPADHLSPSLARIGAYTAQNDITITLLIIGRSCIVNLGAILFTSVSVIYSSTLDGSDGVIKFANGNNVRALKGRFLTVQGDLIAFRFFNEHTGDVIRIINRVSRNRRLIKGFSKAPVDLCFATHLPLLAVVDGESNLHVYSVASDCQDVETYINIMNWPGSTSNSTPRVVWCPYVAENPSDPSDVVNMLALSKKNSVYVVNLSILKERGSRMTFEEALAVEEAVLSVEMEEDVTAVCISPDSTAVAIARADGVVSFYVMNSNESGLKFAHTWNPQMNRPIVELFFLDGARHIKNQEQFWRHCLVVAEGGRRLALFECENWRCLGRVRFESSVEMATFAVHVDPQARYVHILDIDGSNVFCIELEYSDHPRFAGVTQVTFSHPIIAIVPYEHVYIFIEYSLDDEFDGDRTRNEVLAHYIAIGHRSLLQLDVHLELAELPKPNVDVVPLIKTDAGRDEAERNNEGPSNLLTMVHPPAMNSTSTITYEKLLELVKDMSDKIEQLSVRVERADIERRSAATNEHILSQLQCFKEEFSLREDRLLANVSDLIETNHRETINVVRNALNENSVAVENSIQANHKVFFSAVLCELFTYDMNITYLLLCFLKIVDNLKLPYCSSA
>tr|A0A1P8LAL0|A0A1P8LAL0_9INFA Polymerase basic protein 2 OS=Influenza A virus (A/Washington/101/2016(H3N2)) OX=1936961 GN=PB2 PE=3 SV=1
MERIKELRNLMSQSRTREILTKTTVDHMAIIKKYTSGRQEKNPSLRMKWMMAMKYPITADKRITEMVPERNEQGQTLWSKMSDAGSDRVMVSPLAVTWWNRNGPVTSTVHYPKVYKTYFDKVERLKHGTFGPVHFRNQVKIRRRVDINPGHADLSAKEAQDVIMEVVFPNEVGARILTSESQLTITKEKKEELRDCKISPLMVAYMLERELVRKTRFLPVAGGTSSIYIEVLHLTQGTCWEQMYTPGGGVRNDDVDQSLIIAARNIVRRAAVSADPLASLLEMCHSTQIGGTRMVDILKQNPTEEQAVDICKAAMGLRISSSFSFGGFTFKRTSGSSVKKEEEVLTGNLQTLRIRVHEGYEEFTMVGKRATAILRKATRRLVQLIVSGRDEQSIAEAIIVAMVFSQEDCMIKAVRGDLNFVNRANQRLNPMHQLLRHFQKDAKVLFQNWGVEHIDSVMGMVGVLPDMTPSTEMSMRGIRVSKMGVDEYSSTERVVVSIDRFLRVRDQRGNVLLSPEEVSETQGTERLTITYSSSMMWEINGPESVLVNTYQWIIRNWEAVKIQWSQNPAMLYNKMEFEPFQSLVPKATRSQYSGFVRTLFQQMRDVLGTFDTAQIIKLLPFAAAPPKQSRMQFSSLTVNVRGSGMRILVRGNSPVFNYNKTTKRLTILGKDAGTLIEDPDESTSGVESAVLRGFLIIGKEDRRYGPALSINELSNLAKGEKANVLIGQGDVVLVMKRKRDSSILTDSQTATKRIRMAIN
>tr|A0A0A9C7I2|A0A0A9C7I2_ARUDO Uncharacterized protein OS=Arundo donax OX=35708 PE=4 SV=1
MRSKSARMRRLVPPTTFSRYRETSSGGRRKQSVLTTTKDCSSMGLWAIRGEHSLVLCSTSFLWVPAVRRVSAAGPPLAFPL
>tr|A0A834SHI8|A0A834SHI8_9FABA Uncharacterized protein OS=Senna tora OX=362788 GN=G2W53_041746 PE=4 SV=1
MVGSLKPSRITRRKTCCASEPNTSVRVVFAIRSGFDAPIGVVLAWEERGSCLDIFRTRNRGRISKTLMDYEAKDLLLGVVLAWEERGSCLNIFRMKNHGRISESFMNYEAKDLLRKSADHVLTYSGRQIMVGSQKPSRITREKTCCASESNTSVHVVLANRTGFDAPIAVVLAWEERGSCLNIFWMTNRCRISETFTNYVAKDLLRKSEDHVLTYSGRQIKVGSLKPSRITMQKTCCASEPNTSVRVLFAIRSGFDAPIGLVLAWEERGSCLNIFWTTNRGRISETFMNYEAKDLLRNESNTSVRVVFATRSGFDAPIGVVLAWDESGSCHNIFRTTNLGWISETLTNYEAKDLLRNRLGMGGTWIMSELIPDDKSRSDIRNLHELQGKRLVAQSDLRNLHELRGKILSAQVSQTRWFPLYLRTGVVLMLQLESSWHGRSVDHVLTYFRMTNRDRISETFRNYEAKDCCANESNTSVRVVFVNRSGFAAPIAVFMAWEERGSSLNLFRTTIRSRISETRPFVLYLRTIVVLLLQLESSWHGWSVDLDLTYFGRKSRFKISESFTNYVAKDLLRNRLGMGGVWIMPYHITDDKSRPDLRNLHELRGKRLVALVSQTRRFALYLRTGVVLMLQLESSWLGRSLYHVLTYSERQIMVGSQKPSRITRQKTCCANDSNTSVRVVFANHSGFDALIGVVLAWEERGSCLNIFRMTNSCWILETFTNYEAKDLLRN
>tr|A0A7T9DJD5|A0A7T9DJD5_9ARCH Uncharacterized protein OS=Candidatus Diapherotrites archaeon OX=2026736 GN=IPJ89_04390 PE=4 SV=1
MSASFKVVIILTAEAHHAEVLSGIHKQFKDFFDYSEQAVYIYLDDHHVVWNKKFGELVGYATPAAAFKSKKHFLELFVDASSQKKLVKAFSNAMESGAGSSNTIVWKHKSGKKKKTTTILVPIPYDGHLLALHFIQ
>tr|A0A8B6DBA9|A0A8B6DBA9_MYTGA Uncharacterized protein OS=Mytilus galloprovincialis OX=29158 GN=MGAL_10B009134 PE=4 SV=1
MTTVPTTSELTTEPTTSEMTTEPTTSQMTTEPTTTEMTTEPTTSESTTEPTTSEVTTELTTSEMTTEPTTSELTTVPTTSDMTTERTTSENQNRTTTSELTTEPTTSELTTEPTTSEMTTEPTTSDVTTVPTTSEMTTEPTTSELTIEPTTSDMTTEPTTSEVTTVPTTSEMTTEPTTSEMTTVPTTSEVTTEPTTSEVTTEPTTSDMTTEPTTSESTTEPTTSDMTTEPTTFEVTTEPRTSDMTTEPTTSELTTEPTTSEITTEPTTSEMTTEPTTSDMTTEPTTMR
>tr|B7M9W0|B7M9W0_ECO45 Uncharacterized protein OS=Escherichia coli O45:K1 (strain S88 / ExPEC) OX=585035 GN=ydgC PE=4 SV=1
MGLVIKAALGALVVLLIGVLAKTKNYYIAGLIPLFPTFALIAHYIVASERGIEALRATIIFSMWPIIPYFVYLAALWYFTGMMRLPAAFVGSVACWGISAWVLIICWIKLH
>tr|A0A7X8AQI6|A0A7X8AQI6_9ACTN DUF2142 domain-containing protein OS=Propionibacterium sp. OX=1977903 GN=GX412_13535 PE=4 SV=1
MSRLARALVAIAVAAAALVVGVAWSFASPPVSSPDEDYHLGSIWCPPPAEESGCRMGTVDGKPVVWVPEVMAQRPCYVGRLGDSAACQDELSATELVPSIRFDQGDYPGQYYRIMHAFVGPDLDRSVLTMRVVNVVVAVLLVGAALVLAQPHAGRAATYALFAGLVPTGVFIVASVNPSSWAFVGLTTLWIALNSLAQASGTALRVANGALAVSGAVLASVARGDTGPFVAVIVLALGLLHVRRRPDRGWLAVAAITLAVGAWSYLGSGQAGVAPTVTDVEGRNFGEVLAHNLVEILQVPAGILGVGPWGALGWLEIPMPTSVHVPTISLAGMLLFQGLRRLDRRKALALAVVAGALLALPFYMLMRNLEIAGIQPRYVMSLLPLLFALCLLHPGAVAAYRFTRAQAVLAWVMVTTAHSVALLTTLRRYVTGLDGSYLLGRGGEWWWSSGPSPLAWWLAGSAAYGLAALTLVATAGIERPAASVGRHE
>sp|P36783|VE2_HPV14 Regulatory protein E2 OS=Human papillomavirus 14 OX=10605 GN=E2 PE=3 SV=1
MENLSDRFNALQDQLMNIYETAANTLESQIEHWQTLRKEAVLLYFARQNGVTRLGYQVVPTLAISEAKAKQAIGMVLQLQSLQKSQFGSEPWSLVDTSGETFRSAPENHFKKGPVSVEVIYDNDKDNANAYTMWKHIYYQDDDEQWHKSASGVNHTGIYYMQGTFRNYYVLFADDATRYSKTGHWEVKVNKETVFTPVTSSTPPESPGGQADSNTSSKTPTTATDSTSRLSPADSRKQSQQANTKGRRYGRRPSSRTRRTTETRQRRRSRSKSRSRSRSRSRLRSRSRSQSSERRSRYRSRSRSRQKEVSRITTTTRGRGRGSSSTSSKRSQRARGRGRGGSRGRRSSSTSPTSSKRSRRESESSRQRGISPSDVGKSLQSVSSRNTGRLGRLLDEALDPPVILVRGDPNTLRCFRNRAKQKFTGLYRAFSTAWSWVAGDGTERLGRSRMLISFFSFNQRRDFDQTVKYPKGVDRSFGSFDSL
>tr|A0A7Y4GUD3|A0A7Y4GUD3_9BRAD NAD(P)/FAD-dependent oxidoreductase OS=Bradyrhizobium australiense OX=2721161 GN=HCN58_21515 PE=4 SV=1
MLNKVNKPKLVVIGNGMAGVRTVELLLDRAPDLYDITVFGSEPYGNYNRILLSPVLAGEKTVDDIMLNTEQWYDDNGITLRKGEMIEMIDRRTCEVVTREGARVPYDRLLIATGSNPIMLPLPGKDLPGVIGFRDIQDVEHMVQASTSYKNAVVIGGGLLGLEAANGLMKRGMNVTVVHLLDTLMERQLDQVAGGLLRKSLEERGMVFKMPAQTEAILGEDRVTGVRFADGEVIPADLVVMAVGIRPNVELARKAGLYCERGIVVSDTMQTYDGRIYAVGECVQHRRQTYGLVAPLFDQAKVCANHLAMKGFATYDGSVVSTKLKVTGIDLFSAGDFAPGADKEEIVMQDASRGVYKRIILRDKKIVGAVLYGDTIDGPWYFQHLRDGTDVSQMRERLVFGAANLGDGGHSGKNSVAAMSDDAEICGCNGVCKGTIVKAISEKKLFTIDDVRAHTKASSSCGSCTGLVEQVLAFTLGGDYSAAPKVKPMCACTDHSHDDARRVIVENGLKTIPDVMKFMDWKTPNGCHSCRPALNYYLLATWPGEYRDDQQSRFINERVHANIQKDGTYSVVPRMWGGVTTPDELRAIADVADKFNIPTVKVTGGQRIDLLGVKKEDLPAVWADLNDAGMVSGHAYAKGLRTVKTCVGSEWCRFGTQDSTGLGIKLEKFMWGSWTPAKVKLAVSGCPRNCAEATCKDVGVVCVDSGYEIHFAGAAGLHIKGTEFLAKAATEEETLEIIAALTQLYREQGWYLERMYKWCDRVGLDAIRNQVVDDVANRKTLFSRFTYSQQFSQSDPWAARAQRGVDRNEFTPLAELELA
>tr|A0A4P7ND20|A0A4P7ND20_MAGOR Uncharacterized protein OS=Magnaporthe oryzae OX=318829 GN=PoMZ_04838 PE=3 SV=1
MAFAHQLGAARLLLRQHRFGLAQSSCRRNMATLSQKLSNEPAVIKPSAAEIKNKTLSSRNLEIAVRHLHADGLVVVEDAVPHADLDALNAKMVPDARYLQSLGENGPFNYNQGNLQQDPPPVAEYFFPSIFTNKIATQITSSILGPRPKWTFCSANSAMPPSSPDSPPQRQPVHSDADFDHPHHPFALVVNVPLVTMTLHNGSTELWLGTHHLSDLSAQEGAHGERASGRIKQRLLDARRSTRGPCQPVVKKGSVVVRDLRLWHAGMPNLSRDEVRVMLAFIHFAPWYRNPMRLRLGEDVKARIEDVAAELDVPVDWVGREEVLGEYLRRGFGNSYDFGQEA
>tr|A0A3D1Q1J9|A0A3D1Q1J9_9FIRM MFS domain-containing protein OS=Lachnospiraceae bacterium OX=1898203 GN=DER20_01345 PE=4 SV=1
MAKNVERLQAREAKELIRREKQLGARSNKFYLIYLFMILSLIYITDEIASTISIQFQANIVTEFFVKNMGMEYGAGLSLFSAIGFISYPVTLLIIFYRPLADKFGRKPFLVINTLCMGLGLFLVYLSKDIYVYMIGGTLMGFMVSHDMQCVYILECSDAKSRARNYAIVKAVAILGTLLVPLLRATLMQNVSERWHVVYLVPAIVGFVMSLFALLFAKETNAFLIKRIEYLKTPIEEREQRSKEGREQNAQGGILTAVKFAFKHRQLRFLIIACCCFYLASLGTATYSTVMAKSALMTEEEITLALFLYPVGNALFTLISGFVSDKFGRKVTIVAMSCSALTCYLLFIFSGMFKWTPYLTGFAIGGFMGSYWGAGDTIGGIMFSESSPTNLRSSVTVINTLLNGVMGGLATVITMILLPIIPERMFGYMYLGLTVPGLVGAIVIMWLFVGETRGLDLKTVTGTEWDKPKKVKEEQQEGE
>tr|A0A484R0A0|A0A484R0A0_9ZZZZ Uncharacterized protein OS=plant metagenome OX=1297885 GN=ANDA3_0622 PE=4 SV=1
MTPCLLLRGMCGDLMWAGRGRIAEKRGEMAPLRHRGKSLVSFAGAALRGTPAWCAMPRRRACRHRLRHQFGAGMSTR
>tr|Q5DYX4|Q5DYX4_ALIF1 DUF4123 domain-containing protein OS=Aliivibrio fischeri (strain ATCC 700601 / ES114) OX=312309 GN=VF_A0952 PE=4 SV=1
MHEQSYLVVNPLEDKEVIERFYHYGGGNAFPLYLDTEFDAQKEIGPWLLPYPPKEFLAYFANKPSGFRIYFSDDIETHIQHWKSLTFAGLDGELVLFRYYDRVVLEAMLVSFNQKELSLFLGSSECIEIISSVGSLCSYENSASQVSYKSEPWWKIEKHHSSYSVERHAWITERLAWQRLPSLMKEIYEKNSDIQSQLINHLIEGRAHRLENEELEAYSMNMLIKDSKQQSHDIYEAWYLDSAQIKTVKQVENLVTRSELQQGTQI
>tr|A0A132B1M6|A0A132B1M6_9HELO S-adenosyl-L-methionine-dependent methyltransferase OS=Mollisia scopiformis OX=149040 GN=LY89DRAFT_633225 PE=4 SV=1
MHDDEEDTNAIEAESSDGFDGDSAYAGSSAGSLTETLASTIARGIEEHGRTYAAYGNEEYGLPIDEEELDRIDMSHAKYSMLLEKRLFVAPINPQPQRVLDIGTGTGIWAIEMADKYPSAEVLGLDIAPTQPSWVPPNCIFQIDDVEMPWTLGVETFDYIHARDLLLSIRDWPRLVEQSFDHLKPGGYLELQCVYPRIRCDDGSTPPQTGLEQFSAHAQEASVRIGCPLDACTRYAEYMSSAGFEDVVEKRFKMPSAPWAKEKRMKLIGAFEMHNLLKGISGMSLRMFSKGYGWSREEIEVFLVQVRKDIQNLKYHTYYEFIVVYGRKPGGSGATANHSSV
>tr|A0A6H5HNS4|A0A6H5HNS4_9HEMI Uncharacterized protein OS=Nesidiocoris tenuis OX=355587 GN=NTEN_LOCUS22830 PE=4 SV=1
MIDDLRFLRLSAIPPWETFTLSIVRLLNPFRPMGPSCVIAFKDVFSFHQSLVITCHFGSTWKLCTTAPFSPTNDPHNWIIIGLHWSHNEPYCGMEMIPASLHCRRVTALRKFTRWQQLKEPATISWRILVKTVVIAGLLSVFIDQCERETILNCKGSGAHGRSIWRVEFGHNGDRFLRPSLVVFEDDTDMSFDLDVEYLTPHGSTAPWNPLLVSHRCFLEALFHSSGTQSEVQNRFISEYAEGLKSWAVISVGIVSTVLLNLIMVKQNKKSEARLLDEQTNYEGEFPFPVPDSVFADVERRTSTKRATKNSSGDIINIEPPVKTDRRMSGDHAFTTDPLEEQARSSPRVVAWGPIDRKTPSQMSNINKDPTIQQNLEGITEMKGSPEIYPSKEFSRRISQEGPSGAQRPSNAMSPMVAANPKGVHTFTDSSKSSLGSQVTSDMSMSMTSLSWVDATVEREPFEYKDEQLPRERGNPTNRSV
>tr|A0A5W0I3M7|A0A5W0I3M7_SALTM Transcriptional regulator (Fragment) OS=Salmonella enterica subsp. enterica serovar Typhimurium var. 5- OX=1620419 GN=AT998_25380 PE=4 SV=1
MRNVIIYGINWTNCYALQSIFKQKYPEKCVKTCNSLTALLHSLSDMPDAGLILALNPHEHVYLFHALLTRLQNRKVLVVADRLYYIDRCVLQYFGVMDYVLKDELSCAIRSEREKLRLPEAWLRFCHRPQKKTVAATYAFNAGETPEEVLFNINQYAWWNLPPGVTQAKYALLILLSSGHPAIELAKKFGLGTKTVSIYRKKVMYRLGMDSSPLSLFRGLKLDAHLQRTAFAHNPAVPDDNCALP
>tr|A0A177BXN8|A0A177BXN8_9PLEO Peptidase C45, acyl-coenzyme A:6-aminopenicillanic acid acyl-transferase OS=Paraphaeosphaeria sporulosa OX=1460663 GN=CC84DRAFT_1169559 PE=4 SV=1
MDAQKQNLIITKITQAGKPTIVQVTEAGIIGKIGFNSSGVGTLLNAIKVHGVDASRMPVHFGLRAALESNTAREAVQKLESYGMAASAHILISDSSEALGLEFTKSTFAHCKADGKGRIAHANHLLLEHPGEVDTVWLKDSPVRVKTMTNNTEKLSTEPSWEDISRLFEDEHGFPHSICRQGQDGGSTTLFNIVIDLKAKKGVVRLGRPTQAEETVSLEL
>tr|A0A7R9KXX5|A0A7R9KXX5_9ACAR Hypothetical protein OS=Medioppia subpectinata OX=1979941 GN=OSB1V03_LOCUS10746 PE=3 SV=1
MSKKPEDIVVSGMSGRFPLSVNTDEFAKNLFSGVDMVTEDDSRWPIGLYDMSGRMGKLDCYKDFDSPFFGLNDQIIAESDPQARLLLEVAYEAMMDAGVNPQELRGTKTGVYVGVSIYSMTDGYPEDGQPDLHESMQTLMVQTLANMKTLYSSRISFANDFKGPCLVVDTACSASLSALTLACNDLLLGNTDYAIVCGTHMDFEPFIFQFQQELGICSPDGMSRVLDAAANGFVKAEAVCCVFLQRRQCARRLYGHILTARMNVDGHKKMGMQRRLYGHILTARMNVDGHKKMGMFFPSSEAQEELMRMTYTDAGIDPKKMTFFEAHATGTKVNYMHSCYN
>tr|R5P6Y1|R5P6Y1_9BACT Uncharacterized protein OS=Prevotella sp. CAG:1092 OX=1262919 GN=BN465_01592 PE=4 SV=1
MKQLLFLLIMITGACTFTSCDKSDDTVDPIKENLFNSKYIVNDAGCCVLDGLQPIRAEIINDEVKGYGWKVIGIYKIMDNGKLSQKDYRDMVYGSGYTDYWFKADNNLIGFLHGDVSGKNYINTEWSYDDSKGYIMRYSADLSISERYMQVLYVATLQGKEFYLYTIQKLGYTTIKNDTTKPFYGLVIYQRMTDKELAEIKKEYKLQL
>tr|A0A1Q2H2K3|A0A1Q2H2K3_9GAMM Acyl_transf_3 domain-containing protein OS=Pseudoalteromonas aliena OX=247523 GN=B0W48_18560 PE=4 SV=1
MIRINYIDNMKAAGIILVVLGHAAWLNESIYILIYSFHMPLFFFMSGYLASRQHPIKKALIKLNHRLIIPFGFFFFVSFCVWLPLHFFGGGQASNMPWFDPLFRLITAQADSFHINGVLWFFPCLIVISVLQIVIFSKMKLITAFITSAVILSFLLVNVGLIKTRFYWCISIYKFVDTL
>tr|A0A416WAN5|A0A416WAN5_9FIRM Uncharacterized protein OS=Eubacterium sp. AF15-50 OX=2293103 GN=DWW50_03425 PE=4 SV=1
MTNNEIWENIRHNNMKRDGVNNPIKVDNFVYEIYSLMKERDFSIIESDEIVKSLSGLIENDKKLILREPLKTVEKYNKEG
>tr|A0A7X1RI95|A0A7X1RI95_STRMT GNAT family N-acetyltransferase OS=Streptococcus mitis OX=28037 GN=GEZ71_00850 PE=4 SV=1
MELRRPSLADKETVLEMMEEFEKYQSPHDGGFWDTENFSYEEWLESNQNQEMGINLTEGWVPAIQLVAFSVKGKAIGFLNLRLRLSNFLLEEGGHIGYSIRPSERGKGYAKETLRQGLQVAKEKNIKKALVTCSVNNPASRAVILANGGLLEDVRDGVERYWIEVANE
>tr|Q2VZI8|Q2VZI8_MAGSA Predicted membrane GTPase involved in stress response Membrane GTPase LepA GTPase-translation elongation factor Translation elongation factor EF-1alpha (GTPase) OS=Magnetospirillum magneticum (strain AMB-1 / ATCC 700264) OX=342108 GN=amb4183 PE=4 SV=1
MELRNIAIIAHVDHGKTTLVDAMLRQSGTFRENQQVAERVMDSNDLEKERGITILAKCTSVEWKGTRINIVDTPGHADFGGEVERILSMVDGVVVLVDAAEGPMPQTKFVTGKALGLGLRPIVVINKVDRGDARPHEVHDECFDLFAALDADDNQLDFPTMFAVGRDGWADDSLDGPRKDLSALFDLIVAHVPPPRRDLEAPFSMLATTLEADPYLGRVLTGRIYSGTAKLNMQVKGLSHDGQLLDSSVSPSCWPSAASSAFRWKAPRRATSSPSPA
>tr|A0A5M4AG34|A0A5M4AG34_9BACT Uncharacterized protein OS=Prolixibacter sp. NT017 OX=2652390 GN=NT017_31240 PE=4 SV=1
MKTINIFKAVAILFFTFAAFSCNDLFNWGTRDYSTQLEIGVTKGGAALKSATNDPIYYLDNCELITADAIRISIATPDPGGGDPIPIDDMQDKILPLHAVGNGVASDLIMLLPGTYVVTKFEVLQLVDAGNGGTKYETIMATPMQNSAFSGYVNTPLNYEFEVELYQKKRLLMEVLCFEPTDVASFGFVWTGVDVILGDEICLYVSQCTSNGTETWGPADYSATFYTMIDEQNVGEVYASSGTSSEGWICFPLWSGATDYGVGVHIVYDGSVEEDFIITAAEVNQILLDLQQEPVEAGTGYYLYEIPCPVVP
>tr|A0A1G2MCL2|A0A1G2MCL2_9BACT Uncharacterized protein OS=Candidatus Taylorbacteria bacterium RIFCSPHIGHO2_02_49_25 OX=1802305 GN=A2W52_04225 PE=4 SV=1
MLEEQTPTQTYPPELKRIKTFQSDVEELIQKQQISKAAIALAESERRVKKEEVSAQPSAPAPAYSAKILTLSGGLPPAAPKWNTSTLLAVVVLVLAVLGMGTGVYFFLKQNAPLQISPPRVNVKSGTAITLNTKESREKIVEKIRSHVQALSVPQNEVRVIPIVLDGKTITTTELLEEIEASVPAALLRALGTEPVLGVHGFRGGQPFLLFSVHSYDHAFDGILSWEPNLLREVGPLFGISVRNILGRVASTTSDILENTLTIKDVIIRNKDARVVLGPGEEKIFLYSFLDKETLVLTTNTDTLQFLIGKAWGGRLR
>tr|A0A3Q0R773|A0A3Q0R773_AMPCI Interferon regulatory factor 8 OS=Amphilophus citrinellus OX=61819 PE=4 SV=1
MSNSGGRRLKQWLMEQIQSAQYSGLQWEDESRTMFRIPWKHAGKQDYNQEVDASIFKAWAVFKGKYKEGEKAEPATWKTRLRCALNKSPDFEEVTERSQLDISEPYKVYRIVPEEEQKHGKSPMMAVTATTSSGEITDMDCSPELEELIKEEEGCSIQASPEYWSQGSINAFPLHQDPLPSSSLSSALCQMMISFYYGGKLMHSTLVTHPEGCRISPQQHLGRGALYSSDSMQSVYFPPAELIEFERQRYVTRKLLGHLERGVLVRANQEGIYIKRLCQSRVFWSGLGEVGSQYGSMPGKLDRDAVVKIFDTGRFLQALQLYQEGQIPAPDPTVTLCFGEELNDHNSAKSKLIIVQITAVNCQHLLETMNVRRSQPYCNNPNLEMPDEVVTDQMARIYQDLCSYSGTQRPACYRDNMPITA
>tr|A0A7L0PVY4|A0A7L0PVY4_9AVES EHD3 protein (Fragment) OS=Mesembrinibis cayennensis OX=1118748 GN=Ehd3 PE=4 SV=1
MFSWLGTDDRRRKDPEVFQTVSEGLKKLYKTKLLPLEEHYKFHEFHSPALEDADFDNKPMVLLVGQYSTGKTTFIRYLLEQDFPGMRIGPEPTTDSFIAVMQGDVEGIVPGNALVVDPKKPFRKLNAFGNAFLNRFVCAQLPNPVLESISVIDTPGILSGEKQRISRGYDFAAVLEWFAERVDRIILLFDAHKLDISDEFSEVIKALKNHEDKMRVVLNKADQIETQQLMRVYGALMWSLGKIVNTPEVIRVYIGSFWSHPLLIPDNRKLFEAEEQDLFRDIQSLPRNAALRKLNDLIKRARLAKVHAYIISSLKKEMPSMFGKDNKKKELVNNLGEIYARIEREHQISPGDFPNLRKMQDQLQAQDFSKFQPLKSKLLETVEDMLANDIAQLMVLVRQEESQRPTQMVKGGAFEGTLHGPFGHGYGEGAGEGIDDAEWVVARDKPMYDEIFYTLSPVDGKITGANAKKEMVRSKLPNTVLGKIWKLADIDKDGMLDDEEFALANHLIKVKLEGHELPNELPSHLLPPSKRKITE
>tr|A0A815YX94|A0A815YX94_9BILA Hypothetical protein OS=Rotaria magnacalcarata OX=392030 GN=KQP761_LOCUS19763 PE=4 SV=1
NNGTLVAGGNGQGSVLNQLNSPACLFVDRDHSVYVSDYSNNRVMKWVEGAKEGIVVAGGQGGGSALTQLNYPVGIFVDALGTLYVADSRNHRVMRWAQGAKQGTVIVGGNDQGAGANQFNTPIGLSFDRHGNLYVGDWNNHRVQRFSIE
>tr|A0A2V4LES8|A0A2V4LES8_PSEAC Peptidase OS=Pseudomonas alcaligenes OX=43263 GN=DMO17_00310 PE=4 SV=1
MRSTTLRRWSFVHTWTSLICTLFLLLLALTGLPLIFHHEIEHLLGEAPQLRELPADSPRLSLQQLVEAAERHRPGEVVQYLGWEEDEPNGVVTIMAATAGTEPNSSHTFMLDARTGEAVEMPAANGGFMMLMLRLHVDLFAGLPGKLLLAFMGILFVVAMVSGVVLYAPFMRKLKFAEVRRDKSTRLRWLDLHNLIGIVTLTWALTVGVTGVISACADLLIEAWRNDTLATMVEPYRDAPPLTERAPADELLRIAGEAVPGMRPDFIAFPGTRFSSAHHYAVFMVGSTHLTSHLWTPVLIDARSLAVTAVGDRPWYMDALAMSQPLHFGDYGGRPMQILWALLDGLTIIVLGSGLYLWWVRRRAPRQALRDEVAA
>tr|J3LRP0|J3LRP0_ORYBR Uncharacterized protein OS=Oryza brachyantha OX=4533 PE=3 SV=1
MRGGGRDDEEAAHKLKSMDVDKLENGANGADTPPRPALKYHGWRAMPFIIGNETFEKLGTLGTSANLLVYLTQVFHMRSVDAATLLNGLNGTTSLAPIIGAFLSDAYLGRYLALAIASVASLIGMFLLTMTAGAEGLHPAECGVGEACEKATSGQFAVLFISFAFLVLGSAGIRPCSMPFGADQFDPHTESGKRGINSFFNWYYFTFTSAMLVSATVIIYVQSNVSWPIGLGIPTALMFLACVLFFLGTRLYVRVTPEGSPFTSIVQVFAAAARKRSLKQPKDPKQDLFDPPHTSAIVTKLAHTDQFRCLDKAAIVAGPDEVRSAGGGGPAPANPWRLCSVQQVEEVKCLIRIVPVWSTGIIYYVAVVQQSTYVVLSALQSDRHLGKSFQIPAASFTVFAMLAQTLWIPIYDRLLAAAPPQGHRQGRGAHAPAAARHRHRALHGGHGDVGHRRGPEAAHRADAADAGDDHHRRRHLRHVQPVDGAAAHGAGPLRGVQPHQPDRVLLQGDPGAHAERRRRAGLLQPRARQLPQRLPRHHRAPDHRLRQQLAGAGPQQGEARPLLLDDRRHWHLQHRLLHDLRQVVQVQGSSQLRSESLFIWVVN
>tr|A0A177BWM7|A0A177BWM7_9PLEO SEC14 cytosolic factor OS=Paraphaeosphaeria sporulosa OX=1460663 GN=CC84DRAFT_1169075 PE=4 SV=1
MAATGAKELTLDPKYDDYDYPTTAPTPQNGHPGHTTPEQDAQVHQLRAMLEQAGYTKNLDTLTLLRFLRARKFNVELSKQMFIDCEKWRASYADVGVEELVRTFDYKERPEIFKYYPQYYHKTDKDGRPVYIEQLGNVDLTAMAKITSQERMIQNLVCEYEKMADPRLPACSRKSGYLLETSCSIMDLKGVGIAKATSVYGYLQAVSAISQNYYPERLGKMYVINAPWGFSGVWSVVKRFLDPVTVNKIHILGSGYQKELLAQVPAENLPKLFGGSCDCPGGCELSDAGPWQDDQWVKPPKWAKKAEDKNVIDNTGVPAPTADAPQQPLTGAGPEGVEPAAAPAQNPNTANSA
>tr|A0A371GLZ4|A0A371GLZ4_MUCPR H(+)-exporting diphosphatase (Fragment) OS=Mucuna pruriens OX=157652 GN=CR513_26426 PE=4 SV=1
MFPGATLFLFTEYRYLTMFMGVFGALIFLFLGSVKGFSTQSEPCIYNKGNMCKPALASAICSSVAFLLGALTSVLSAFLLVLYIAINLFKLYYGDDWEGLYHCITGYGLGCLSMTLFERVGGGIYTKAADIGADLVGEVEHSIPEDDPCNPANFICTSVFFLQYEILLTPGSPLLIPIPNKCWKQNLGGFYHPPIDQSFLFSLPRHTLDPCYRKLQEPVNSAPTKPGSTALIPVDRIGYCRQHRR
>tr|A0A5E8VDI2|A0A5E8VDI2_9BRAD ArgE/DapE family deacylase OS=Bradyrhizobium sp. LVM 105 OX=2341115 GN=D6B98_18630 PE=4 SV=1
MNAETQQRILDAVDAGFEAQLATTRDFVAIPSTRGAEGPCQDMIGDLLRERGYEVDDWHIDVDDLKDLRGFGPIEHDFSKARSVVGTYRPQTNDGKSLILQGHCDVVPAGPLELWDTPPFSPVIKDGKMFGRGACDMKSGTIGALYALDAIKAAGFKPTARIHFQSVIEEESTGVGALSTLQRGYRADACFIPEPTGGKMVRSQVGVIWFRLRVKGHPTHVAFAGSGANAIMAAYHLIQALQKLEIEWNERAKADRHFKTLNHPINFNPGIIKGGDWASSVPAWCDVDCRIAVLPGWSIADHQKEIMACVAAAARNHRFLANNPPEIEWSGFLSEGYELTDAAAPEAAFAKAFGKVYGGVPEDLVFTALTDTRFYGLNHGIPSLCFGASGGEMHGFNEFVDLESLKKTTKAMALFIAEWCGLEKA
>tr|A0A498CZE4|A0A498CZE4_9GAMM Uncharacterized protein OS=Acinetobacter cumulans OX=2136182 GN=D9K80_11310 PE=4 SV=1
MGVAIDLTNTERRVSTAEFAMRMNVSEKELYDRIRDGRIKAPAKDGRKNYWLNSYVLECITGVEDGASLLV
>tr|A0A853LVH8|A0A853LVH8_9MYCO Acyl-CoA dehydrogenase OS=Mycobacterium colombiense OX=339268 GN=A5628_13360 PE=4 SV=1
MLLELDDDQRLWRETVRGALTKQCPPSLVRAIAEGGADGGDLWQWYIEQGWTELTSAESLVELTLLLEELGRASDPTPFLATTTQFAPLVGDRVPQDGAGAAVYSGVTACRDRGGWVLEGAARYVLDADRADQLAVVTPAGVFVVEAKAASSRRVAAIDPVLHLADLRFNEVHVSDAHRIASDTERAWHIALTGMAITIVGACQRIVDMVLEHLKQRYQFGVPIGSFQALQHKAADMHVAIERARALAYLSALTIVADDPRRRLFAAMAKAAAGEAQSLVVQHGLQCFGAMGFTWENDLQFAIKRAKAGELMLGDAAEHRALIAREYRAADF
>tr|A0A3B3U8V4|A0A3B3U8V4_9TELE DENN domain containing 3 OS=Poecilia latipinna OX=48699 PE=4 SV=1
MAELPSGLLEACVVVGAPSDKLRELPQHTKSSELPLLDPEVLQVHAPPFVSIEANSNHVIGPAFSRVQRRRSFIKKKRRDRAAEGVSNGDSSSRHEASPVPATEDISVPKDLDLIALPQLCFPDGLQLASEQKDDAYHFLVFTDLFGNRTHGVVVHYYRAVQSFQDSVFQNGHRWNAPKSRLFAPFAVCIISKFPYYNALKDCLSCLLVQLRTVRQADLEETIREFSAKLSLVPLPPPGQLHVSFSLRPLQVVLPSRDDQDSPVVDLNLHLPLLCFTHTALLQVLSCLLQEQRIVFFSSDWARLTLVAESLLLYLQPLSWQQPYVPVLARGMLDFLMAPTAFLMGCHINHFEEIAAETEDLILVNVDDGFIQTSWSEAVDLPALPLAAAECFISRAESLQLQYDLELCHLGTGTDVNTLRSQRRGWQQKLNSQIQNIALELVVNIFRGVQDFLNHEHRVFNSEEFLRTREPDDQLFYRKVLETHIFHSFLRDRLNRKRDSFSRMEQMTQSHAHRNRAMTESPRRPPMSELSRAGPDRKLSKRLGASLPNLDQPINESVPLNANRLLSIRKISPDSGLKFLQKPLKVFRLPEFPPPLAYHYVQNYYSDMVASLGKAINATPPDESALLARYHYLRGLVNTVSNRRLDALEDFHSLYKTDAGIFPSQMVNSLIDSLPDVERVQADRRPEIKRLISRLKREQERERATQGTGQEDAAVKRFQLPKKYMHLEEFVKCVQESGIVKDQGTIHRLFDALTVGHQKQVGPDLFRVFYTIWKETEAEAQEVCLPASVLEHIDAAECVFKLSSSVKTSRGVGKIAMTQRRLFLLTDGRPGYVEVAQYRDLEEVRVSSAPFLVLRIPSLKIRVHGRKETFEANLKTETELWNLMIKEMWAGRSIADRHKDPQYMQQALTNALLMDAVVGSLQSSKAIYAASKLAYFDRMSLEAQMMVPSTTSETLKHKINPSVEFAVPQAVDVLLYTPGQLWVSVGGGKVMVYDASSWSLIQTCQVGNARLNCMLGVDRDQVWMGSEDCVIYIISLVSMVCNRQLTEHRAEVTGLALDNEKYCHKVAYSCSAEGTVMAWEVSTLQVKRHFRLSCDRLQSVYSCGGVLWCCARDGIMEVWRNGTLKQHINLPEQQRVTFSSALLITESEELWSVCVDSAEVYIWHIKNTSRPINRVMLQDCIGCYCMIQVKNQVWVGGMGRSSTKGKIYILDTERYEVLKELHGHIDKVTALCSAEDRYVLSGAAKHDGKVAIWKVEDRGLDSSKC
>tr|A0A6P9APX4|A0A6P9APX4_PANGU pentraxin fusion protein-like OS=Pantherophis guttatus OX=94885 GN=LOC117655567 PE=4 SV=1
MVEASIIPVGDPNVAVGKLSSQSSTFEEKGESRKAIDGSLANIYTNGDCTLTKKDFEPWWMVDLISAFQVSAVVITNRGDCCESRIQGAEILIGDLPQKGGTMNPRCATINSMERGETMSFNCAGMQGQYVTITIPGRYEYLTVCEVQVLAYPWLRIVHGGRSPVLDSDTDSGLQGRVLSFPNESKDSFVIISPMQPFNLMEFTLCMRIAVEYLDEHEIILFSYHSQRDELRVLREAMGHFGLHMGGRSVRFALPDLSPLGSHICVTWESVFGLTAFWMNGKSSIRKVHNMGHILQAGGTAMLGQDQGAQNMSDQQKPHFVGEITDLYMWDYVLKSHDIQKVFQAHEFPRGNIFDWKILSYKIRGNVMVLPKG
>tr|A0A087WPU9|A0A087WPU9_MOUSE La-related protein 4B (Fragment) OS=Mus musculus OX=10090 GN=Larp4b PE=4 SV=6
MTSDQDAKVVAEPQAQRVQEGKDSSHLMNGPISQTT
>tr|A0A4Q7AXS9|A0A4Q7AXS9_9GAMM Efflux pump membrane transporter OS=Acinetobacter bouvetii OX=202951 GN=EXE25_14110 PE=3 SV=1
MSQFFIRRPIFAWVIALFIILLGVLSIPKLPIARFPSVAPPQISITAIYPGATPKTLNDSVVTLIEREMSGVKNLLYYSSSSDSSGTATITATFKPGTDVELAQVDVQNKIKAIESRLPQTVRQQGLMVDAASSGFLMMVGLSSPNGKYSEIDVSDYMTRYVIEELKRVEGVGKVQNFGAEKAMRIWVDPDRLISYGLSIKDVNTAIQNQNLPISPGRIGDVPALTGQQITIPLTAQGQLETVEQFKNISLRAQQNGANVRLSDVARVEIGAQMYNFAILENGKASTAVAIQMSPGANAVKTAEGVKAKIEQLSPALPDGMKFSIPYDTAPFVKVSIQKVIATLLEAMVLVFIVMFIFLHNVRYTLIPAIVAPIALLGTFSVMLLAGFSINVLTMFGMVLAIGIIVDDAIVVIENVERIMATEGLSPVEATSKAMKEITNPIIGITLVLAAVFLPMALAAGSVGIIYRQFTITMSVSILFSAFLALTLTPALCATMLKPIDLNHKKKGIFAWFDRSFEKLNNRYERSLFKVIQHKTIAMLCFLSIVIVLIFSFKQVPTAFMPEEDQGWFMTSIQLPADATQERTRKVVAEFQNHLDQETGIKDNMAVLGFGFSGSGQNTAMYFTNLLPFEERTITAQEVVNNANMAMAESSEGQTMSVLPPAIDELGNSSGFSLRLLDRGNIGMPALREAQDQLLALAAQSKLVADVYPEGLPDGSSVQLKIDRDKLQALGVNFSDVTDIISTSMGSMYINDFPNQDRMQQVIVQLDAKSRMSIEDILQIKVNSQSGKLVSMSEIITPIWQHSPQQYNRYNGRPSLSITGSPAAGMSSGQAMSEMENLIKQLPKGVGYEWTGISLEEKQSESQTLFLLLLSMLVVFLVLAALYESWSIPLSVMLVVPLGLIGAFLAVMLRGMPNDIFFKVGMITIIGLSAKNAILIVEFAKALRVEGMGLVEATVAAAKLRLRPILMTSLAFTCGVIPLVIASGASSETQKAIGTGVFGGMISATVLAVIFVPIFFIVVMSTVEKFSKRKAAH
>tr|M6TB98|M6TB98_LEPIR Transposase DDE domain protein OS=Leptospira interrogans serovar Bataviae str. HAI135 OX=1085538 GN=LEP1GSC170_1474 PE=4 SV=1
MKNKLMPLVDKILLRKRAIIESVNDELKNICQIQHTRHRSFCNWAVNLLSGLVAYSFFPKKPSLNLRSKDNLQLLISP
>tr|A0A2D0KA88|A0A2D0KA88_9GAMM Adenosine deaminase OS=Xenorhabdus ishibashii OX=1034471 GN=add PE=3 SV=1
MIDIQLPLTDLHRHLDGNIRPETILDLARQHNIPLPAYELEALRPHVQIIENEPNLVSFLQKLDWGVTVLADLEACRRVAVENVEDAVNAGLDYAELRFSPYYMAMKHQLPVEGVVEAVIDGIHSASQQHDIQIRLIGILSRTFGEQACTEELAGLLAHKQHITALDLAGDELGFPGHLFEQHFIRARDAGWNISVHAGEAAGAESIWHAIRELGATRIGHGVKAITDPTLMDYLAKNGIGIESCLTSNLQTSTVSSLPAHPLKQFLEHGILASINTDDPAVEGVEIRHEYTVAAPAAGLSPAQIRQAQINGLATAFLSEAEKQALKTKVANR
>tr|A0A2K6SAF3|A0A2K6SAF3_SAIBB 35 kDa nucleoporin OS=Saimiri boliviensis boliviensis OX=39432 GN=NUP35 PE=3 SV=1
IQPPLSGFNMFSPASIGQPRKTTLSPAQLDPFYTQGDSLTSEDHLDDSWVTVFGFPQASASYILLQFAQYGNILKHVMSNTGNWMHIRYQSKLQARKALSKDGRIFGESIMIGVKPCIDKSVMESNDRCALSSPSLTFTPPIKTLGTPTQPGSTPRISTMRPLATAYKASTSDYQVISDRQTPKKDESLVSKAMEYMFGW
>tr|A0A0D6JIV9|A0A0D6JIV9_9HYPH Probable membrane transporter protein OS=Candidatus Filomicrobium marinum OX=1608628 GN=YBN1229_v1_3342 PE=3 SV=1
MGRESVGDVGFMDIGMTWAGFSMLAFSLLAAGVIVGFLSGLLGIGGGGILVPVLYETFAALGVDPAIRMHMAIGTSLAVIIPTSLRALMAHSAKGVVDWVAVRRIGPWIVIGVVLGIMFADQVTGTTLKWVWVVFGTLFAAKMAFGRDTWRLGHDLPALPKLEIFSVLVGIISVLMSIGGAAFIVTFLTLYGRPILTAVATSSAIGPLIAIPGAIGMMWAGWGHPGLPPLSLGFVSLLGAALIVPSSVLVAPVGVRLAHGVSRRKLELAFAVFLVVIVLRFLSSLILE
>tr|A0A353GX24|A0A353GX24_9FIRM Aspartokinase OS=Firmicutes bacterium OX=1879010 GN=DDW50_18565 PE=3 SV=1
MKVIVQKFGGTSVATREGRENVASKVKEALGKGLGVVVVVSAMGRNGDPYATDTLIGLARGVLKYIKPRELDLLMSCGENISTVVMVQTLKAHGIEASAFTGGQAGIITDHHFNNARIIEIKPDNLWKCLEEGKVAVVAGFQGVTKDGEITTLGRGGSDTSGSALGVALHAELVEIYTDVDGIMTADPRLVPQAKPLPVMTYNEVCEMAHLGAKVVHPRAVEIAMEGRIPLRIRSTFSNNLGTLISDGTSIGDIEIRNGKVVTGLAQIAEMALVKIISKVDLNQNGAVLKIFQVLAGAGISVDMIQVAPLNIAFIIKEDLVDKAKEALSPLGLELLVEKGYAKVAIVGSGMRGIPGVMARMVKGLQKEHIAIYHSTDSHTNIACLVKQEDMCGALQALHDEFELAE
>tr|A0A1N6LEK7|A0A1N6LEK7_9BURK Amino acid/amide ABC transporter substrate-binding protein, HAAT family OS=Paraburkholderia phenazinium OX=60549 GN=SAMN05444165_6866 PE=4 SV=1
MAAKWGRVVAAALAAMVMTAAYAAGETGVPSSSAAPGGKPIQLALIEGMSGPFANAGAAVERNLRFGVEAVNAHGGVKLADGAHPLELVVLDSKGSPEEALLQLRAAADRHIGYVLQGNSSAVAAALIGAIDKQNSREPDNRELFLNYSADDPALTNAACSFWHFRFDAHAGMRMDALADVIQHDPSVRKVYLLNQDYSFGHDVSALARSALAAKRPDIAIVGDEFHPIGRVKDFAPYIAKIRASGADAVVTGNWGNDLTLLVKAAREQGLDTKFYTFYGNSLGAPAALGDAGVKRVIAVADWHPNAGGAASDAWYKAFRARYPAAQDDYPVLRMELMVEMLAAAMNKAGSAEPEAVAKALEGMKFDNGFHPSWMRAEDHQMIQPLYVMEMDKAGTPGVRFDNEGSGYGFRTVLALPPGRTVAPATCRMTRP
>tr|A0A850WM95|A0A850WM95_FREMA SIM1 protein (Fragment) OS=Fregata magnificens OX=37042 GN=Sim1_1 PE=4 SV=1
KEKSKNAARTRREKENSEFYELAKLLPLPSAITSQLDKASIIRLTTSYLKMR
>tr|A0A482IAK4|A0A482IAK4_9DIPT Cytochrome c oxidase subunit 1 (Fragment) OS=Tipulidae sp. BIOUG26266-C02 OX=2544765 GN=COI PE=3 SV=1
FIMIFFMVMPIMIGGFGNWLVPLMLGAPDMAFPRMNNMSFWMLPPSLTLLLASSMVENGAGTGWTVYPPLSAGIAHTGASVDLAIFSLHLAGISSILGAVNFITTVINMRSSGITLDRMPLFVWSVVITAILLLLSLPVLAGAITMLLTDRNLNTSFFDP
>tr|A0A2A8TFK0|A0A2A8TFK0_9BACI Transition state regulator Abh OS=Bacillus sp. AFS017274 OX=2033488 GN=CN380_26055 PE=4 SV=1
MKSTGIVRKVDELGRVVIPIELRRTLGINEKDALEIYVEQERIILQKYKPNMTCQVTGEVSDDNMKLADGKLILSPEGAELLIKEIQASMEPAK
>tr|A0A531KVX5|A0A531KVX5_9HYPH M20 family metallopeptidase (Fragment) OS=Mesorhizobium sp. OX=1871066 GN=E5X43_21305 PE=4 SV=1
MDTVPIDRWESDPFSGEQRDGRIYGRGSCDTKGSLAAMLIALSSLGERQPRATVVLAASIDEEYRKLGARAIADSGVTYEGAVVGEPTELELVVAHMGSVRWQIEVQGVPAHTSKPHLGVNAITGMAKVVLALDEHHRSLVSRAQHPLVGSAQLTVSLIEGGLELTTVPPVCRIWVDRRLIPGEQPQDALAEVESILEGLRQGEDKINVRSLLPALEDPPPISSESSRIAAVAAAACAHVAGTGEQKGATGGSDANQLSLAGIPCVIIGPGRTAQAHTNNEFVEIAQLIKAAELYQKIM
>tr|A0A2D5TAC4|A0A2D5TAC4_9GAMM Uncharacterized protein OS=Gammaproteobacteria bacterium OX=1913989 GN=CMP85_02235 PE=4 SV=1
MTFDLVTDRNTCPLLDTRSFVMLRTTCRTHYRDDEAWALRTRDVLLRVSTLTPRQTLGLNYLYKYALQFDAPVGSTEWFQNIVNWLDFKSSIRIVHSFMFETRPKLLYSLDFGTLSPGPRMLWQRLWCRYERVYKKHLKKRKSDLFDVVPCKKRRVLCH
>tr|A0A833PV08|A0A833PV08_BURL3 HTH-type transcriptional regulator NimR OS=Burkholderia lata (strain ATCC 17760 / DSM 23089 / LMG 22485 / NCIMB 9086 / R18194 / 383) OX=482957 GN=nimR_1 PE=4 SV=1
MTANDYAAGTTFPEHAHGRGQFAFASRGTISVSTPHGRWLVPPQRACWVPAGVRHEMTMTGPVTMLNTFVSGDAAQEAGLPEQCGVYGVSALLRQLIDDAIDLPALYDVDGRAGKLMALLVAEIATMPRLSLHAPLPADARLAKVCRHLLASPSIAADLDQVAADAGVSRRTFTRQFRAQTGVSFAAWRQQVCMLSAIARLSDGQPVTRVALDLGYASASAFTSAFRRILGDTPSRYLEIRR
>tr|V7PXT1|V7PXT1_9BACT Cupin_2 domain-containing protein OS=Parcubacteria bacterium RAAC4_OD1_1 OX=1394712 GN=O210_OD1C00001G0424 PE=4 SV=1
MKKGFKENIEKLTEENNNFRKVLYTGASSQLVLMSLLPNEEIGMEIHNENDQFFRFEKGSGKVIIDTTEYEVKDGDAVVVPMGARHNVIAGEEGLKLYTIYSPAHHKDGIVRETKEEAEQNEADFDGQTTE
>tr|A0A1L8MN76|A0A1L8MN76_9STRE D-alanyl-lipoteichoic acid biosynthesis protein OS=Streptococcus bovimastitidis OX=1856638 GN=A9Q68_01415 PE=4 SV=1
MNEKRKILMLFIGKTVLFYLIFILLIYIFDYLGHGQSAFIYNEF
>tr|A0A846M925|A0A846M925_9BACI 2,3-bisphosphoglycerate-independent phosphoglycerate mutase OS=Saccharococcus thermophilus OX=29396 GN=BDD39_000516 PE=4 SV=1
MSKKPVALIILDGFALREETYGNAVAQAKKPNFDRYWNEYPHATLTACGEAVGLPEGQMGNSEVGHLNIGAGRIVYQSLTRVNIAIREGEFDRNETFLAAMNHVKEKGTNLHIFGLLSDGGVHSHINHLYALLRLAAKEGVKNVYIHGFLDGRDVGPQTAPKYIKELQQKIKEYGVGEIATLSGRYYSMDRDKRWERVEKAYRAMVYGEGPTYRDPLECIEDSYQHGIYDEFVLPSVIVREDGSPVATIKDEDAIIFYNFRPDRAIQISNTFTNEDFREFDRGPKHPKNLFFVCLTHFSETVKGYVAFKPTNLDNTLGEVLSQHGLRQLRIAETEKYPHVTFFMSGGREEKFPGEDRILINSPKVATYDLKPEMSAYEVTDALLKEIEADKYDAIILNYANPDMVGHSGKLEPTIKAVEAVDECLGKVVDAILAKGGIAIITADHGNADEVLTPDGKPQTAHTTNPVPVIVTKKGIELRKDGILGDLAPTMLDLLGLPQPKEMTGKTLIIKK
>tr|A0A5C3E0M0|A0A5C3E0M0_9BASI Related to MRPL44 - mitochondrial ribosomal protein, large subunit OS=Ustilago trichophora OX=86804 GN=UTRI_01617 PE=4 SV=1
MSIAAASLKHITAMSFEFAPLSASQASRSMRLLLARLPTKAPMPGMDLPDISTKTVATDALQKIEITYKNKQKLVLDHVASETRLSDLVKKIEEPARALRLKEEGL
>tr|A0A812PJQ8|A0A812PJQ8_9DINO GrpE protein OS=Symbiodinium sp. CCMP2592 OX=631055 GN=grpE PE=4 SV=1
MLDRVSAGPTDCLLGKCLCKDGYCADGDMCKPQVCFAGAEPPRFRPNRWLAFYSGMSDLEQFPEYEELEEEYVQFVLRISPVPLLFLLLGVVVSITTCACLCCGGSGYHFSMDFSDMTHDETKGFVSGTTGNAVIGDEEFARRAWKKRPSCFPMFCAALLIILLCFFGGLTRIVNAAWTEYIIVSSLDRAMDNAADIANASLTINETVTHLHDKLLELPLTCKTDSKAAKQVLYTFVHSALGAIDDYVEQVYFIVETVQPIPDQIGKFKQLTHRAKPFFASLPLAPLWLVAFICIGIVVEATCTTCCRSSSLARCVDVGLKLSALLFGLIVFVVAVLVCVETIVLIALSKFCEDVDHNVLSYVNSTTYNISYIIPEIANYYIRGGDRNPIDEYDTLAMKYINQIQDYYNQAAIGVAGLGMACPAFFDLDVNAIATKARGILGKARELLKGENIYPYYRKVIRAGICNVVISGVGHPS
>tr|A0A5C6ACY5|A0A5C6ACY5_9BACT Isoleucine--tRNA ligase OS=Rhodopirellula pilleata OX=2714738 GN=ileS PE=3 SV=1
MTVPPPKPSSKPSLPSSVDLSSTSSAGGFRAADGSPSFPKLEEEVLAFWDANQIYEQSLARRADAPTFVFYEGPPTANGMPHPGHCLTRAIKDVFPRYKTMRGYRCERKAGWDTHGLPVEVEVGKELGIHSKEEIEAYGVEPFIQKCQQSVWRYMQQWQTLTRRLGFWVDLEKAYVTYHQSYVESVWWSLKNLFDRDLLYQGHKIVWWWAQGGTALSAGEVGQGYREVADPSVYVLFPLIDDNNKKTKRSLVVWTTTPWTLPSNMYAAVKADLDYAVVEDSETGEQLILAEALVETLAGKIKRELRTIETVSGRSLVGMRYVPPFENYRDTLADPVGELKDGGSDSLYWRVVAADFVTTDSGSGLVHLAPAFGEVDHEVLVEERMRFVDGQRPDLLCAVGPDGKFTDDFPSLKGEWVKAADKTLTRDLRERGLLLHLEQYLHDYPFCWRAEEDPLIQYPRESWFIRTTKFRDLMLKNNSKIGWQPEHIQDGRFGNFLESNVDWALSRERYWGTPLPIWVCQSTGRMEAIGSYDELLAKPGVEGTEVWAQAKAENPELVDDLRVHKPYIDAVTYASPFEDGARMKRVTEVIDCWYDSGAMPFAQWGWPHQNHDRFAEQFPADFISEAIDQTRGWFYSQLAISTMLFGEGASIGTDLNTDVPTVSTDAAQDYPHPFRNCIVLGLMLSQWYEAANESGPKTIVLTEEETAEHADLKFTKKTGKMSKSLRNYRSPSEIFDRYGADAMRWYFFANQAPWNSIIYADQAIRDSIPEFLLRLYNTFSFFTIYAEIDGFDPTLAADADDQLSPASLASATTYRDVSQRSEIDRWILSELNRTLEVVVERMDKLDNYNACQAITSLLDGLSNWYVRRSRDRFWGSDKASQDKLDAYWTLYESLVQLTKVIAPFVPFLADKLWQELTRPFGDRVLRSVHLTDYPTADSSRIDASLSESMKVLREIASLGRSARADAKLKVRLPLSKVEVILANDSQIGWLESHDQLVLEELNVKAVEYTTEGGDYVQYNVVPNFKRLGPKVGKNIPLVKKMLGEADGNELLGQLQTSGKVTLAMPDGPLELDNEDIEVRLKAREGWAAAQGTSCVVVLNTEVTDALRREGIAKDLIRAIQSQRKEMKCEYTDRIEVAIVSDDADTEAAIAAHREMICEETLAIRLADQPLQAIDATSIENGQLFVAKVPGE
>tr|A0A165E1C3|A0A165E1C3_EXIGL Uncharacterized protein OS=Exidia glandulosa HHB12029 OX=1314781 GN=EXIGLDRAFT_725429 PE=4 SV=1
MSAPAAQDDADAMDVDATPTPKPARAPRRRRGRPQPPHVQTPRSATAPTTDAHVPFPTSAGPPSPTKSPTKQRSMPDHAFRRPSSPTKTRSSWFDASDTDLTSLGRSTSPTKSGSWASSRSSRSSSPSKSSRSSARPPSPTSLPWAEGRIPPSPSKTSLSSGPDSPQKVRNRPPSLRLHDNPDGIDPSTIVGKVLKRVHRGAAHPNLTLVFADDSVVQVKIEGYHPNARGLSKELEMDSSLDDFLASSAASTVDLLILDCALVRLTDKAFERSDSDASNDSRWSQDHLGLAFKFEGMPHRWYSVWATMQDFDDDGICRFRSYDDVFLSPVAQTPRRPRHARKNSKQIV
>tr|A0A7C1SJJ1|A0A7C1SJJ1_9SPIR ZIP family metal transporter (Fragment) OS=Spirochaetales bacterium OX=2026792 GN=ENI06_01135 PE=4 SV=1
MIFTWFTNQHPILQALLATIFTWLVTALGSAMVFFFKEVKRKVLDSMLGFAAGVMIAASFWSLLAPAIAMAEESGAIPWIPALVGFLMGGLSLRLIDIFLPHLHLGLPMEQAEGVKTSWHRSVLLVLAITLHNIPEGLAVGVAFGALYHNLPGASLAGAIALALGIGIQNFPEGAAVSIPLRREGLSVSKSFWFGQLSGLVEPVAGVLGALAVVVMKPILPYALSFAAGAMIFVVVEELIPEAQMEKNTDIATMGAMLGFAVMMTLDVALG
>tr|A0A2M6W0D3|A0A2M6W0D3_9BACT Uncharacterized protein OS=Candidatus Magasanikbacteria bacterium CG10_big_fil_rev_8_21_14_0_10_43_6 OX=1974650 GN=COU33_04145 PE=4 SV=1
MNVFRVWRKIQNTSNSEKTVLIIGDIKNKIKGLGGDYLSPIVFFLQKSGKLLFLANFVIMRV
>tr|A0A0K2J648|A0A0K2J648_PORGN RND family efflux transporter, MFP subunit OS=Porphyromonas gingivalis AJW4 OX=1403336 GN=PGJ_00014360 PE=3 SV=1
MQLSGYRVVWLPFIFLMALSVVGCNGGKKKTADTSSGEDMELFTSGGDTIDVQIAELKLGPFDRQIVSHGKLRARETAVLQFEDSRQPLHRLYVRNGQHVVQGQKIAAVDDRTALLEVQKSEDEFKQRELDLQDVLVGMGYSPHDKSDIPADKLALACIKSGYNIAESNYKQAQLRLKHVCLTAPISGVVADLHAQEHTIPESGKPLCRIIGDNGFEVVFEVLESELSAIRTGERVEIRPVALRDVTAEGVLQEINPSVDDRGMVQVSAGLRNPSKNLFDGMNVEVRINQRMEERMVIPKSAVVLRSDKPVVFSVRNGTAAWNYVDIEAENAESYCIVSKTLKPGEMIVVDGNANLAHKTPVALRR
>tr|A0A2G5ISA1|A0A2G5ISA1_9ACTN Uncharacterized protein OS=Streptomyces sp. HG99 OX=1958787 GN=B1C81_17685 PE=4 SV=1
MTTPPPQGQNPFAQGQQPYGQPPQGQNPYGQQPGQPGFPQQGAPYDPVPPQRPKRGIKQYLRIAVIVFAVIAAGVGWIASRDDANTAKVGDCMSISNPESTTDPGLEVVDCSSSKAKYKVEEKKSDNSGCDRTKYSEYTETGKNDFTLCLSEYSAK
>tr|B9YBS2|B9YBS2_9FIRM Resolvase, N-terminal domain protein OS=Holdemania filiformis DSM 12042 OX=545696 GN=HOLDEFILI_03279 PE=4 SV=1
MDAQEVMHMTDYSKITALYSRLSVGDEDRDGGESNSIQNQKIFLENYARGQHLTNIRHYIDDDESGRFFDRSAYSRMMDDVENGKIGVCIMKDLTRWGRDYLQVGNAMEIFRRNNVRFIAVNNGIDSEKPDTLEFAPFINIMSEWYAKDISKKVKTGIKTKGMSGKPIVTEAPYGYVKDPDNKDFWIIDEEAAEVVRLIFRLFIGGKNRNQIAVHLKNEQIPTPTFYMKDRGRGTCKNKTLNEDNRCKWNKATLTNILTRQEYCGDVVNFKTTKHFRDKHNHYVDRSQWHITENVHEPIISRSDFETVQRILENAPVKRPNGDGEIHPLSGLLFCKDCGAKMHIRIDYRNGGKRHVAFCSEYHKGKAKNPKCHSPHIMDADLLMQTIAEVLKKIEDYSISNRAEFEALVKKNLAMQQTDQTKKQQKRIPQITTRLEQIDKVLNKLYEDNALGTIPQDRYEQMSQKYSEEYYALKAELATLQEQLSAYENAGGRAQKFLKLTERHAAFTDLTPAILNEFISRIEVHERDQKRARYAIQHISIYFNYIGKFENEVTQLAEPTEQEIRQMREEIEEAKKEKSRAYHRQYSREYRARNLEKQREYDRMKAREYRARRKAQAAAQPAQ
>tr|A0A317E7E7|A0A317E7E7_9PROT XdhC /CoxI family-like protein OS=Zavarzinia compransoris OX=1264899 GN=DKG75_13590 PE=4 SV=1
MIEPDLFAKVYDLQEAETPFVLATVVRTVSVTAAKAGAKAVILADGTVAAGWIGGGCARGATLKAAQDSLADGQPRLISVQPDDQMEEQGLLNGETRDGVRYAHNHCPSRGTMDIFVDPVLPRPELLVMGTSPVARVLVALAGEFGFRVMAAAPAAAHGQLSLADRLIDGFVPPPANGLRYVVVATQGADDFAALSAAVALDVPYIAFVGSRRKAESLRGDLLDAGVPAARLAALKAPAGFDLGAVTPEEIALSILAEAVAVRRRGIASPAP
>tr|J9VWE8|J9VWE8_CRYNH Pre-rRNA-processing protein TSR4 OS=Cryptococcus neoformans var. grubii serotype A (strain H99 / ATCC 208821 / CBS 10515 / FGSC 9487) OX=235443 GN=CNAG_06340 PE=4 SV=1
MSPSSPAGSSSSSLCYTNTLLALPDGPIPSSHRDLISHTTSFIGGYPTFPALPSSSCSTKKVGNTPSEINCGICHKPIPLLAQVYCPPEDGENDRTIYVFACPRVGCQKREGSIRAWRASVRNEEYVRDVEEKRKAAEKAAQEERERARKNPFTVDEAARLNGSALFGTASPLFGGAAHNPFAPPNPVPAMATLSVSDDRPAPTPITSGPSRTFTPPIPAYHPVQYLSTIEEYIPPVDDDVSVASSDDDESPEQKAEWREEGWEKVLPRNVDEVFENFVRRLDQADGGKKQVLRYELGGMPLPYSSASPLTRKLFPGCEKPLAKDEELDLSALYTPKFIPTCPRCGGKRVFELQLVPSLINILRPHTISTTGEAPKASFPKAATEEERKKELAKLAAGVKEEASKDEEGEMEWGNVLVYGCERDCVGVGEEWVGVEWEATLEL
>tr|A0A2T0PRW1|A0A2T0PRW1_9PSED Flavin reductase (DIM6/NTAB) family NADH-FMN oxidoreductase RutF OS=Pseudomonas sp. NFACC11-2 OX=1566246 GN=OE22_101713 PE=4 SV=1
MSSLCDTAFDTRAFRRALGNFATGVTVVTAATEDGRKVGVTANSFNSVSLDPPLILWSIDKRSSSHEVFEAASHFAVNVLAADQIDLSNNFARPKEDRFAAIQFETGEGGAPVFVDCSARFHCEKFQQVDGGDHWIMIGKVVAFDDFGRSPLLYHQGAYSMVLPHTRMTKREEGQSPSSHFQGRLSHNLYYLMTQALRAYQASYQPRQLCTGLRTSEARMLMVLENDAGLNLCDLQREVAMPVREIEEAVANLKRKGLVSDEGERVRLTAKGIDETEGLWAIAKEQQDKVFGQFSEEQVEHFKQVLKGVIRGA
>tr|A0A7H5EXY5|A0A7H5EXY5_9BACT Rhomboid family intramembrane serine protease OS=Lewinella sp. W8 OX=2528208 GN=E1J53_0011935 PE=4 SV=1
MFFPIGDDQVHRGFTPFFSYGFIALNVMIFFYQSSLGEAGAEFIYNYGSIPLEFERGEDYHTLITSIFLHGSWMHLIGNMLYMWIFADNIEASIGNVPFLIFYFLGGLAASLCHIYFNAGSQIPAVGASGALSAVMGAYIVMFPKSNIRGYLLFFRINVAAWVFLGFWFFQQSQAGYASLGDTSGGIAWWAHIGGFVFGVLCGFFFRQRYGVPELDRGRDRYA
>tr|A0A1A3D3H4|A0A1A3D3H4_9MYCO Uncharacterized protein OS=Mycobacterium sp. 1245805.9 OX=1856862 GN=A9X00_01450 PE=3 SV=1
MVQCASEISWDPADTDGLSEDWLDRLLDAVDGNTVVRTPVGMLFAGVSQIERLLAHPALKVPVVEQYELMGVSEAILERARRVILGLDGAPHTRLRRLVSRAFTQRAVERLAETMRSYLVPRLDDVDGEVDFIDEIVGDYPAAIIGGLLGLPAADLPHLTSIAQVITSSQFSLDVDRAHQYLAAAAECDAYLADLVTSKRKAPGDDILTHLTQVGVEGDSLSDAEIVSLCASLMNAGIDTTRNQISLGMTLFARLPEQWNRLRDESVLVGNAVEEILRFLPVTPLLTRLNTEALTFDGVDVPERTYISLGVAAANRDSTLNTGDALTFDVSRPNPRHFTFGHGAHFCVGAALARLEMRELLTQMVSRFVSVEVVGQAPRRSAMGVYGVKNLTLRLDRQRQNAS
>tr|A0A2P8DYT4|A0A2P8DYT4_9BACT Uncharacterized protein OS=Cecembia rubra OX=1485585 GN=CLV48_110110 PE=4 SV=1
MRTLLSIFAISIFISSCVQQGVDKEAQRIVDQSIKAHGGALYQEALISFDFRERHYSIFKSPSKYEYIREFTDSTGFVRDVLNNDGFQRTVNDTPVDLPEDRIRAFSNSVNSVAYFAFLPYGLNDAAVIKTYLGETELEGNSYHIVKVTFRQEGGGEDYDDEFLYWFHKEKYTMDYMAYSYHTDGGGVRFRKAIKQHQVNGLLLLDFENYKPEEKNTSVDKMEGLYKEGKLELLSEIRMENIKVSF
>tr|A0A1U9N7G6|A0A1U9N7G6_9GAMM Muramidase FlgJ OS=Cellvibrio sp. PSBB023 OX=1945512 GN=B0D95_04590 PE=3 SV=1
MQSIDTGIKVPQVQDNYFDPNSLNSIKAMGRDRDPQAIKEVAKKFEGLLVQQMLKSMREANDVFGEGSFLDSQTTRFHRDMLDQQMVLDLTSGPGIGLADHFYRQMMQNYGSTMRPEGGVKNTDSSALGEITPRTANKTSVAEQASVDALDDWIQDFMRMSDNVQMQALGDGDEQQVPAVPAINYALIPQLLSKQAIGTVRGGQKSSISPTQENFVMMLKPHAERAAAELQISPDVLIAQVALETGWGKHVIHDRSGNNSFNLFNIKAGGQWQGEKVNVNTLEYRNGIAAQEKSDFRKYNDYSESFSDYVRLMKNNPRYEKVLATGTNSSAYADALQSAGYATDPHYAKKIKSLLNSDVIKSLDLASVTENMQADLLQTGAQAILSLAASASRHIVE
>tr|A0A411GH85|A0A411GH85_ENTCL ABC transporter ATP-binding protein OS=Enterobacter cloacae OX=550 GN=sapD PE=4 SV=1
MPLLDIRNLTIEFKTGEGWVKAVDRISITLAEGEIRGLVGESGSGKSLIAKAICGVAKDNWRVTADRMRFDDIDLLRLSPRERRKLVGHNVSMIFQEPQSCLDPSERVGKQLMQNIPGWTYKGRWWQRVGWRKRRAIELLHRVGIKDHKDAMRSFPYELTDGECQKVMIAIALANQPRLLIADEPTNAMEPTTQAQIFRLLSRLNQNNNTTILLISHDLQMLSKWADKIDVMYCGQTVETAPSEDLIGAPHHPYTQALIRAIPDFGSAMPHKSRLNTLPGAIPLLESLPIGCRLGPRCPYAQRKCIETPRLTGAKNHLYACHFPLNMERE
>tr|A0A7X8MBI3|A0A7X8MBI3_9BACT Type II toxin-antitoxin system HicB family antitoxin OS=bacterium OX=1869227 GN=GX408_15355 PE=4 SV=1
MRTLKYTYWQDGNFYLGYLIDYPDYQTQAKSKEELIENLKDLLHDIESGDIPFIRKIEELVLA
>tr|A0A1V3S1A0|A0A1V3S1A0_9PSED Alkyl hydroperoxide reductase C OS=Pseudomonas sp. A25(2017) OX=1945865 GN=B0E42_23545 PE=3 SV=1
MPIINSQVKPFNATAFKNGEFVPVSDADLKGKWSVVFFYPADFTFVCPTELEDLADNYAEFKKLGVEIYSVSTDTHFAHAAWHNTSPAIGKIQYTMIGDPTHVISRNFDVLIEEVGLADRGTFVINPEGQIKIVEINDGGVGRDASELLRKIKAAQYVAAHPGEVCPAKWKEGEATLAPSLDLVGKI
>tr|A0A2V9NH91|A0A2V9NH91_9BACT Uncharacterized protein OS=Acidobacteria bacterium OX=1978231 GN=DMG98_20865 PE=4 SV=1
MNDEETIMKHKLTTALLLALCVPIASATTWYVNGVSGSNSNNCKSPTTACKTIGHAISLAVSGDSIIVAHAIYAENLAIGKNLTILGSGAATTIIDGGGTATVVTISNGTHVTLSKMTIRNGNASGVVVIGFMRAISGGGINNSGTLTLTNSTVSGNLAPIPCIHFFVFCEIRGGTAWGAGIYNSGALIISNSIISGNQAGGYCNATCSSFGGGIYNRGTLLMIKNSTLTGNIADTACSTSISCAVGVGGAFYTVGGTVTLNNSTVTANIADRCSGMCGGTGGAIVNGSGNLAVNNSTVSGNYPAGGIFNSGTATLQNSILANNSGRNCRGIITSHGYNLSSDGSCPFSNTGDLNNTNPLLGTLGNYGGSTQTIPLLSGSPAIDSGNPNGCTDGQGHLLKTDQRGKPRPDIEDTAGCDRGAFERQSD
>tr|A0A7D3VXP3|A0A7D3VXP3_9ACTN TPR repeat protein, SEL1 subfamily OS=Actinomadura verrucosospora OX=46165 GN=ACTIVE_7586 PE=4 SV=1
MPVRPWSPEDLGRPTDGTWADVAFGLGEIYECEGDLGQAADWFRRAAESGHAAAALRLGAVLGRMADDGADGSAEDLLAEATRWLSGAQDIATPDAIELITDMLNRHQRQAARRGLEPAVATG
>tr|A0A370P2G6|A0A370P2G6_9BURK ABC transporter permease OS=Cupriavidus lacunae OX=2666307 GN=DN412_03430 PE=4 SV=1
MKSIRLGHAVATVCVVQLLAASPYAVAQGKGSYSQDTVKIGVLTDMSGIFADLGGKGSVTAAQMAIDDFREQNTPPFKIELLQANHQNKADIGASRAREWFDVENVDMITDVINSGVALAVAKVAQNKNKMVMVTGSGTARLHDEDCNPNTIHYGWDARTFANAHVRAQTEQRRKSWFFLSVDYALGRSLEQDATAAIMANGGTVAGSVRHPLSAPDFSSYMLQAQSSKAQVVGIANAGADLVNAVKAANEYGVTRTKSLAGLAATITDVHAMGIDATQGMVVVEDFYWDLNDRTRAWSRRFFDKQKRMPNFVQAATYSAVLTYLKSVLAARSDDSNVVLKQMKQLTINDVFANNGKIRDDNKMVHDVYVMEVKKPQESKAPWDYYRVRRTVAGSDASQPLSASKCPMVKKGI
>tr|A0A1A8TK33|A0A1A8TK33_9GAMM Peptidyl-tRNA hydrolase OS=Marinomonas spartinae OX=1792290 GN=pth PE=3 SV=1
MTGFKLLVGLGNPGSEYENTRHNAGAQWIEALARQSQCSLRTEKKFFGQFGKVSIAGEECYLLIPTTYMNLSGKAVQAVCQFYKIPPEQILVIHDELDIPPGTAKLKKGGGHGGHNGLKDIIARLSNNREFGRLRIGIGHPGHASQVANYVLKKASQDEYRKIEQTIDESLRYIDDIVGGNLNTVMNQLHSFKA
>tr|A0A373QD60|A0A373QD60_9FIRM Uncharacterized protein OS=Firmicutes bacterium AM55-24TS OX=2292896 GN=DXA10_01295 PE=4 SV=1
MEEFFNRTDKKYKIIMLCVIVCIIIVAYIGSQLHDDNHLIVGRWEEVGDCWMDELEFFSDGTYSSDKDNYFGSYTIEDGRIRLGGVLMSDLVYSYKLDGDTLILYKKDIDDGDEYRRVK
>tr|A0A7K2JSV5|A0A7K2JSV5_9ACTN DUF2470 domain-containing protein OS=Streptomyces sp. SID5910 OX=2690312 GN=GTW67_25625 PE=4 SV=1
QELEAAELDPLATSEAGMLTHFVDDHPELVPLLLRLVRPGPDRGVRRALPVGIDRYGLTLRLELARGHRDVRLPFNRPVRDIDHVGAQIHALLSAARRLSHPGHLLT
>tr|A0A6N9SLE2|A0A6N9SLE2_9PROT Cell division protein FtsL OS=Ferrovum sp. OX=2609467 GN=ftsL PE=3 SV=1
MSRSDILLFVCVVVLALGVIHGQQHARRLFIDLQQARDQQVQLQTEGDQLQIEEGTLSASRRVEDRAIRGLKMQLPKSEQKRLVVLGQPGSTP


================================================
FILE: src/alphafold3/test_data/miniature_databases/uniref90__subsampled_1000.fasta
================================================
>UniRef90_A0A8C0C0Z5 NADP-retinol dehydrogenase n=1 Tax=Buteo japonicus TaxID=224669 RepID=A0A8C0C0Z5_9AVES
MATLVPRIVLITGCSSGIGLAVAVRLAQDPQQRFHVIATMRDLRKKEKLEEAAGPALGKTLSIQRLDVCSDSSVAECMENIPGGRVDVLVNNAGVGHVGPVESISVEEMKRIFETNFFGVVRMIKAVLPDMKRRQSGHIVVISSVMGLQGIVFNDVYAASKFAVEGFCESLAVQLLQFNVXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXPAFRTQTNSLYTPLVALKYADPSGDLSVRTYYRLLFNYGTLFHLSMAALRCLTCGCFRRRVTPL
>UniRef90_UPI001863CDCB tumor necrosis factor receptor superfamily member 19L isoform X1 n=2 Tax=Megalops cyprinoides TaxID=118141 RepID=UPI001863CDCB
MMRNHLRCSALVLLSLLGLRGALATQCGWGKVLTSEGCVCLQCPVGQEPSKACGQAEGPEEVVRCQACSAGTFSDTYDSDLCRPHTSCAALNRLLMSPGSTERDATCGDCMPGFYSAAKEKSSSPDSCVRLIPRPLVRVLRNVGKGVARGTGRGPANATNVRSAEEKNTEYAVFALVPIFCVMGLLGILICNILKKKGYHCTAEKEGGDEEAPTPQKEGNSGPYIVDDPNEDTISVLVRLITEKKENAAALEELLLEYESKQMSISKASSIKFPVLPHLPHQFRSLPRLCPHQHHLHTINGLAPRAGNGSCCSRCSQKKWPELLLPPIDTHKTTTVGGKNPLPGEVTILSVGRFQVAQIPEQKALPAELTPPESSDTDSVDTSHTEAADEKSLLGVSSLSSSSTWTKSKQEDRKFVIRLGETNLVI
>UniRef90_UPI00049204AA adenosylmethionine decarboxylase n=1 Tax=Paenibacillus pinihumi TaxID=669462 RepID=UPI00049204AA
MEYSTFGRHVAVDTWGVDFELLNSAEFLQAQMVEAAESCGATVLSVQAKQFEPQGATVLVLLSESHLSIHTYPEKGFAAMDCYTCGETVDPQMAIDYMLSVLKPKTVHAKKLVRGMGELKVEEPVMQQAELV
>UniRef90_B8CVZ9 Putative CoA-substrate-specific enzyme activase n=1 Tax=Halothermothrix orenii (strain H 168 / OCM 544 / DSM 9562) TaxID=373903 RepID=B8CVZ9_HALOH
MGKYYLGVDVGSVSTDMALIDPFGNLIEKIYLRTKGQPIEVIKRGLKKLKENYGSIKVAGVGTTGSGRKLAGVMLGADVIKNEITAHAVAATHLVPDARTVLEIGGQDSKIIILKDGIAVDFAMNTVCAAGTGSFLDQQAARLGISIGEFSRLALKARSPVRIAGRCSVFAESDMIHKQQLGHDLPEIVAGLCEAMVRNYLNNVAKGKDIKPPVVFQGGVAANIGIKKAFEKELHTEIYVPEHNGVMGAIGAALLAMEEVRSRKKETSFKGFEVTEFKFKTTSFECKGCPNRCEIVNINQDGKTIARWGSKCLKWDMTEDKKKEEVNLNPS
>UniRef90_A0A7R9F0M8 BESS domain-containing protein n=1 Tax=Timema bartmani TaxID=61472 RepID=A0A7R9F0M8_9NEOP
MSSRSLVAGGGGSVRQPTPSSGVKLAGEDFNKDKMYEPKHTKRLVRVLTVVAYVFSVSLAAIMLSVYYVFLWNPRDARHPRLPPPTPPTCQPAQVISMYDNYSTEVGMRKEALQRLHLHGRRVVNHLVKTTFNRADWNLNPNLQQPARTTSASSVEDAEEQSAEDEVESQTDLGPNQLTERSKPTQNNQKSPVRNNTCELEFQLSQFMTLHKERQKDDPDKDDRAFFESLLPSLKSLDTDEKLNFRIHQLTLSLVNNRRAVFFTPSSHPAVLI
>UniRef90_A0A2A9MK67 Ras family protein n=1 Tax=Besnoitia besnoiti TaxID=94643 RepID=A0A2A9MK67_9APIC
MRDPSCWQFPSHSSSQESEAVAWAPPRGPGQSGAGRFEGEGGEATACSALSPAGCPLPPFSVPSASVSSSASLTPLCYAVRSVPSSPHSLPVPAPPPVPPPVAIAPSSFLSPPRSPSLLPSCPSSSSPPVQSSSPLVSPLHAFSPSWAPDLLSRSPSPAVCRKRTEEFSSVPPSPEWRAESRFPTSHRSLLDSPVCRPAVVAGGGVAAGGFLSEGEGAAPPGGEIGSEEEDDGASVASSSSDASTAFLRILVVGDQGTGKSFLLHSLCHSPDPQSEFQRPCPAHRGRRGLREQVDTRASDAGAADEKSAPRQDGTGSRLEHSGSRAQLRRGTPDRRDAVHGVGVRMDASEQLERDADAPFSSFASVELTEWPRRADAETGGTQAGRIRGLPEDGRPRAEPRASEPCLAESCVSAPSEQSGDSTSVPRSPSLSPSASPVPSPSSSFSFSLPTSFCPASSSRPPAPVAPPRAASSSSPASSSAAPVARAASAEAAAAAQPAACEDASRQRECTCEADEQQCPACRLPGSYEWTCGVRIFHMFWELPPRERGSKDRQRQSSPGSSSSESSADSLSERGRPAASYPLLPESDASCASGAAAARSAGAATRCLVEFWEVGGTEMLESVRSLAYGQEFDGVWVCFDSRSAASFHHAALWTRELCVHLHLPSSLLFPSSGPQAPLSLAPRSYEAAAPSSSLRSFLPAPAVFQSFACSRRVRRWRRHQEHNAAGEARQRSAEGAAHEVQSLTSFFQMLPTSTVGKVTRAAASAVVRLGSTVASPVVSLVAGERERETDDSATDREEDEMARLKPEREGRGRRKFSAKPSRPFRKGSRRTARFASSLLTSASSVRPPPGMPERDGEEEPREDGEGGGTSVEEKDVELGVLEGGRETLESPADAECRADTASAAKEGTAPTLEAAAFPKGQQGAGPGPEDPDGASSRAFANLEKELTHQQFAVRLLQGVCPVLLVGTKEDLLLSSTAARQTSNESAGGGCEVDEKGLSPFLKHLRSRASVLSGFLSSSSPEAAAGCAVGEDDEDGRGGEAACRASDPSCAAPALCLEEDIGGGTPSRLQTPFSRAYFTQNSFVKARDNIFARLCGTLGPRRVPSGDARLALDGDAGVKLNRRICHLLNSSPLVLTSAVGRTVDPAALSAFFSDALLCQTLFRERSREKKVRRRSKAKSRGARPPVDVMQHVEDAPALLSPLPSPSLRASPGVALSDSANVRRVGVGAGDAAKQTAPVGEAEDGGATPPHARGRAQQPCQDPRLGEERELSADPEPRESPVAEDRPAEERDGKLDGKSRPQTPFSDVAAAAVAAGAAAAAIQWLH
>UniRef90_M3EC79 DDE_Tnp_1 domain-containing protein n=1 Tax=Streptomyces bottropensis ATCC 25435 TaxID=1054862 RepID=M3EC79_9ACTN
MPDAPSARSSLFRAGDRLGPEPLRVLFATTVKPMATEATTGAFWRGLRLPAVDGTCWDPCGQRSRRGRLREAGQRPRDGPERVSPGADGRSGGGGHACGAGRGTRRLAAPGESPLVGRLPGSYGPGQLVLADREFLGTGLWWAFTTTGADPLGALSGGQAPEDC
>UniRef90_A0A4Y2GBA1 Uncharacterized protein n=1 Tax=Araneus ventricosus TaxID=182803 RepID=A0A4Y2GBA1_ARAVE
MSRPLFVIGAKKARNPRPQNKDERVSPHSLQPTTCPDGPEVANDRRARASTVHLRAPLMPKKEERAAACHLQMEIKREAVQFRFAGQSGAEYRLSRASHFGQVARGRHAPSVEKRGERGLTIFLRFLVSKMPWSPEAVRETHMPLCLRRPAMFGSCCFNLDGFGQMARYEGCRWGLRSRRAARGILANCAVMRAPGKGSSHRRFLKSCAEYPDDMQMSSGLFIAVCPVHELPLRFLLAVLLDLEEDVDRCIEHEDHQAKPFISVHELPLRFLLEVLLDLEEDVDRCTEHDGDEEHDGHQGEQIGQEDQVGLKHFSL
>UniRef90_UPI001E28E105 low molecular weight phosphotyrosine protein phosphatase n=1 Tax=Paracoccus sp. MA TaxID=2895796 RepID=UPI001E28E105
MPPPSVLFVCLGNICRSPLAEAALRAAAKRAGAGLLIDSAGTGDWHLGHAPDRRAQAVAARAGIDISTLRARQVAAEDFRRFDHIVAMDRQNLADLRRIAPLDGRARLSLLLDHVPGRAGQSVADPYFGEAAGFETTWHDVTAGTQALLRLLLGPD
>UniRef90_A0A522C2W7 MBL fold metallo-hydrolase n=1 Tax=Frankiales bacterium TaxID=1909291 RepID=A0A522C2W7_9ACTN
MSTFRVEHLSTSGTFSLDGQTFDVDNNVWLLGNDHEVLVLDAPHDAAAIERAVAGRAVVAIACTHAHDDHVRYAPELAERLSTQVLLHPADRVLWDLTHPDRAPDGELRDGAVLEVAGTRVEVLHTPGHAPGAVCFSVPSEELLFSGDTLFAGGPGATGRSYSDFDTILGSIRSRLAPLPPATTVHTGHGPSTTIGAELPSYDEWVRRGH
>UniRef90_Q1PS67 Telomerase reverse transcriptase n=8 Tax=Oryzias latipes TaxID=8090 RepID=TERT_ORYLA
MTSGDLSSVLNILRSLYKRTRTLEEFADGVVFREGRRAALLQPSDTHSFKSFVRGVFVCSDEELQDVPSCNQTCTFPELLAFILNSLKRKRRRNVLAHGYNFLGVAQEDRDADHFRFQGDLSQSAAYIHSSDLWKKVTARLGTDVTRYLLGSCSVFVLAPPSCVFQICGVPAYDRVSMTTASSGFLLRPPSRKHKSFQVGKKTRSANLTKTGSVGDVEESRKRRRVESEVSTRKRKRESEEEESRERRRGVHHEERRQHEAVLDESTLSGKSGENDAAAVKPPPETSAAPPPLEGGPSWRSGAFPPLPSSQCFIRTLGFLYGGRGMHGFCLNRKRRTAAGPRRLQGQDLVRLVFFEGLPYLNGQERKPKKLPLRYFNMVPVFGRLLQRHRKCRYSSVLHRMCPVVELSRAAQGELSSLIPQHCAPHRVYLFVRECLTAVVPEELWGSDHNRLQFFSRVRGFLKSGKFERISVAELMWKIKVMDCDWLKLRRTAGRFPPSELAYRTRILSQFLTWLLDGFVVGLVRACFYATESVGQKNAIRFYRQEVWSKLQDLAFRRHIAKGEMEELSPAQVASLPKGTVISQLRFIPKTDGMRPITRVIGADSNTRLHHKRIRDLMSMLQARVRSAPALLGSTVWGMTDIHKVLRSLAPAQKDKPQPLYFVKVDVSGAYDSLPHDKLKEVITEALSPVQEEVFTVRHYAKIWADSHEGLKKAFARQVDFSDGSMGSTSMKGFVMSLQKSSKVHHAVLVEQAFGSNLRGKDALQFFTQMLTGSVVQHGKKTYRQCRGIPQGSVVSSLLCCLCYGHMENVLFRDIKNKGWLMRLVDDFLLITPDRNQAQSFLSILLAGVPQYGVVANPQKVVVNFQGSEGGGAFPDIRVLPPHCLFPWCGLLLDTRSLDVCKDYSSYAGLSLRYSLTLGSAHSAGQQMRRKLMSILRIKCHPLFLDLKTNSLESAYKNIHKLVLLQACRFHVCVQSLPFAQTVAKNPTYFQQMIWDMAHYANALIRRSNTGLVLGDGAQKGSVQYEAVELLFCLAFLRVLSKHRPVYKDLLPRLHKWKRRLERLLGDLRLARVRQAANPRALLDFLAMQM
>UniRef90_A0A6B3G495 Alpha/beta hydrolase (Fragment) n=1 Tax=Streptomyces sp. SID7982 TaxID=2706094 RepID=A0A6B3G495_9ACTN
MPRSLQAALILLHVLFVATLVGAIRALSTASSVDAVDGYLLGLLLYASLPGVAVFVLSLYVRHGGVRAWYGLLAVLAWIVLGALAELSGGGAEGQGVARLAVPVAVIVLLCRPESRRWFRSGLEQRAEQRLFSFARMMRLRRDGGQTALEYLGLVLVVVALVGGLMATGTGQQLTAEIRSAICELTGSSCPAPGRDVAAGGGSGDGGADGGGDRDTSSSGADGMSGEGESSLTGGTGSTGTTGENATSGTSGTTATAGSPGDTATTGSPGDTATTGAPNTPQGSTPFPQGDFIAPVDAGRPAGPHGGGFIGGFLGDGVGGDVRGVVGAVLRPGETGQRIADQWARDTRGAEQKWARGDYIGAAWDWNKAVGGAGAGLAIPGSGARVDAEVRDAERAHLGERIPQNATPAQRKAWWDGLSPEERERYIELLPERIGNLDGIPVLAR
>UniRef90_A0A833ECX2 Enoyl-CoA hydratase/isomerase family protein n=1 Tax=Caldiarchaeum subterraneum TaxID=311458 RepID=A0A833ECX2_CALS0
MSRQYQDIIYDKSYHSHTALIQINRPHELNSYVLNTLREMIDAFDDAMWDDNIQFIVLTGAGDKAFCTGGNVREYAEIYNRKPSDWWKWGEIYGRFLDVIMHCGKPVLARVNGIVAGGGFEFVAASDLAVAAEHAKFISPGPRVGMTSIGGLSQWLPLHIGLKRTAQVVMTSDEIPARQALEWGIVNDVVPYEGLDDKVKEYIDRMLELSPTSLHYFKVHLNWWRDLVWRLTWEHAKEFFSLNIGGIEPAEGLHAFKEKRRRRYREIRGDIGRGVDPRYPHGPYMLSCNGCGAKYLPLASSYCLNCGKPIKG
>UniRef90_UPI00046BDA5A protein O-mannose kinase n=1 Tax=Eptesicus fuscus TaxID=29078 RepID=UPI00046BDA5A
MEMKPQDGRRSPPHREVPPVVGLLLALAVMNALLYLCLDRFFIAPRRSAPDPRHCPSGHFRVGRMNNCSAWLSCEELRTEVRQLKRVGEGAVKRVFLSEWKERKVALSRLTSLEMKDDFLHGLQMLKSLQSQHVVTLLGFCEEDNTILTEYHPLGSLSSLEATLNLSKYQTVNTWQQRLQLAMDYVGIIHYLHHSPLGTRVMCDSSDLPKTLSQYLLTSNFSIVVNDLDALPLVNRSAGALVKCGHRELHGDFVAPEQLWPYGEDVPFRDDLMPSYDEKIDIWKIPDVSSFLLGHVEGSDMVRFHLFDIHKACKSQTPAERPTAQAVLDTYQKVLSLLRDTVTSQTREML
>UniRef90_A0A0F9NQL3 HTH_7 domain-containing protein n=1 Tax=marine sediment metagenome TaxID=412755 RepID=A0A0F9NQL3_9ZZZZ
MKINVSIEKEYIKCPVCNGAGKIEEIHSDIKIKHAIVIKLFNEGYTYRKIMKLTGYKSTNSISDILIKNKMKLEKPIKNR
>UniRef90_UPI001866D008 ABC transporter permease n=1 Tax=Fluviibacterium sp. MJW13 TaxID=2720031 RepID=UPI001866D008
MGARILNALFVTAVLLGLWQALVTLADLPPFILPGPVRVAQALWNNAGLIGWHALVTFSEVLAGLVLGSLLGIVTALQLATSGLARRLIRPALVLTQALPVFALAPILTLWLGYGLWSKVLMAVLIIYFPVTSAFFDGLMQTPRGYLDLAQTMQATPRQRLWRIRVPAALPGLASGLRLAAVYAPIGAVIGEWVGASNGLGYLMLLANGRAKIDLMFAALVVLACLTLTLHVLVSRACDRLTARMV
>UniRef90_A0A5C5WGI8 Periplasmic protein n=1 Tax=Botrimarina hoheduenensis TaxID=2528000 RepID=A0A5C5WGI8_9BACT
MPALSTPALAVPALADLAPLESRVQEALTGSPYLVASNRLRVEAGEGRVSLHGHVGSFFEKQMAQEVARRIDGVQQVENLLTVAWA
>UniRef90_A0A2K9F958 Lysine biosynthesis protein LysW n=1 Tax=Paracoccus tegillarcae TaxID=1529068 RepID=A0A2K9F958_9RHOB
MPAREAHQPITINCPHCGGESILADACARWNVETQEWELSTVYDDKTCADCGIEVSAEERSVQEGA
>UniRef90_UPI0014593CCD alpha/beta hydrolase n=2 Tax=Aromatoleum aromaticum TaxID=551760 RepID=UPI0014593CCD
MKTWVFLRGLTRESGHWGGFLETFACIVPDSRIVALDLPGTGARHRETSPGDVPRIAEDCRSTLFRLGVDPPYRLLALSLGAMVALAWADRHPAEIAECVLINTSLRTYSPFYRRLRPRSYARLLYLALRDDARACETMILRLTSGQRDERLVDEWVTLRVRHPVTLANAVRQLFAAARYRPPRDRPAPPVLVLASRNDRLVHVACSKAIAAAWNCSLRIHPYAGHDLPLDDGAWVAEQVRHWTDGGGA
>UniRef90_A0A0F8UN67 Cupin domain protein n=3 Tax=Aspergillus TaxID=5052 RepID=A0A0F8UN67_9EURO
MFIRPPLEIQVTSRQIPQWNCIPNTSIQSKPLMIYHQAFAASPEELKQHFRMVGEVTPGWVYTMYSQTHFHSTTHEVLGVVSGSAYLCFGGEGNPGRFETRVEKGDMIIIPAGVGHRLLHEPDLDKGSFKMVGAYPQNKTWDMCYGQSGDEEKCRNIESLGWFQADPLYGTDGPALRV
>UniRef90_A0A2C9GSP0 Glutamate-gated chloride channel n=2 Tax=Anopheles TaxID=7164 RepID=A0A2C9GSP0_9DIPT
MLDHASKAPKSAGWIKLNVFRMASGHFFCAIFYFACLCSASLANNPKVNFREKEKKILDQILGAGKYDARIRPSGINGTDDKATQVFVNMFLRSISKIDDYKMEYSVQLTFREQWLDERLKFDDIGGRLKYLTLTEANRVWMPDLFFSNEKEGHFHNIIMPNVYIRIFPYGSVLYSIRISLTLACPMNLKLYPLDRQVCSLRMASYGWTTADLVFLWKEGDPVQVVKNLHLPRFTLEKFLTDYCNSKTNTGEYSCLKVDLLFKREFSYYLIQIYIPCCMLVIVSWVSFWLDQGAVPARVSLGVTTLLTMATQTSGINASLPPVSYTKAIDVWTGVCLTFVFGALLEFALVNYASRSGFIVFLCETNTINVNNIFAHGQTSVATHRSVYHFRFYCIRSFILSPPTHPQLNRHTHFRFRITPVNQPPTAISPVTPSVKHSHNYERYLVLFVPHLGSFDAFSLFLEKQNLFSFEPPVPGILLFYNNQKFNYFHPFLFALNIRLLLGIVGLTFPLTFSPIWHVNI
>UniRef90_S5G9S1 1-phosphatidylinositol 4,5-bisphosphate phosphodiesterase gamma n=17 Tax=Percomorphaceae TaxID=1489872 RepID=S5G9S1_PAROL
MCAARFSGCLNGCAEEAAAGAAGPVMASRMMDWTEAGPRILHSLEMGTVMTVFYQKKSQRPERRTFQIRQDTRQIVWSRNPDKVEGEIDIREIRELRLGKGSRDFERYPEEARKLDSAHCFIVLYGLEFRLRTLSVAAFSEEEVNIWVTGLNWLMIDTQRAPAPQQIDRWLRKQFEVMDRNHEGSVTVKEVKALLPQVNYRVPNMRFLKDKLQEVEARSDLSYPNFAQLYRTLMFDAQRSIIEQLELAFPLRNVDRPELCQISLYDFQKFLQMDQKESWASELSRVREFLMGYMMGGPHPEPMLQLDEFLTFLFSKENSVCDPRLSPVVLDDMKRPLSQYWISSSHNTYLTGDQFSSESSLEAYARCLRMGCRCIELDCWDGPDDLPIIYHGHTLTSKIKFLDVLHTIKEHAFVTSEFPVILSIEDHCSVVQQRNMATHFKKVFGDLLLVKPVDNNAEELPSPHQLRRKILIKHKKLVEGTLYEEVTSASYSENDISNSLKNGILYLEDPIDHTWTPHYFVLTSNKIYYSEETSHYQTADEEEDDEGKEEHNNNNNNNEQHCAERWFHGKLGGGRDGRQVAEKLLREYCEGGAKDGTFLVRESETFVGDFTLSFWRSGRVQHCRIHSRQESGSTRFYLTDNLVFDSLYCLICHYRVTPLRCNEFEMRLGNPVPQPNAHESREWYHSSLSRVQAEHMLMRVPRDGAFLVRKRSEHNSFAISFRAEGKIKHCRIQQEGRLFMLGSSAEFESLVDLVSYYEKHPLYRKMRLRYPINEDTLGRMGTTELDYGALYEVRTPHFYVEANKMPTARCTVKALYDYRAQREDELCFPKQALILNVDKQEGGWWLGDYGGKKQLLFPANYVEEVPSSPTREQEDVSTENSPLGTFLKGFIDVPSGHVVVHKDGKNSRPYVSTIHSQHLSSHPVQTLDVAADSLEDLTSWVAKIREAAQNADARMQEEKQMERRKKIAVELSELVVYCRPVPFNEDKIGTERTCYRDMSSFPETKAGKFATRSRGKRFLQYNRRQLSRVYPRGQRLDSSNYDPLPMWLCGSQLVALNFQTPDKPMQLNQALFMLGGGSGFVPQPDIMRDDAFDPFDKDSLHVEPITIQLQVLGARHLPKNGRSIVCPFVEVEICGADYDGCKCKTDVVADNGLNPVWVQKQFVFDIHNPTFSFLRFTVYEEDMFSDPNFLAQATYPVRLLRTGYRSVSLKNSYSEELELASLLVHIEIVNAKEEDDENLYTSIQLLRDRTSELSSQVSVLERSGSADLSYQQSLEELRAAQDQLSELVEARNRRLTEKKRREKLRQQVAAKRS
>UniRef90_A0A3L6FD03 NAD(P)-bd_dom domain-containing protein n=4 Tax=Zea mays TaxID=4577 RepID=A0A3L6FD03_MAIZE
MEDTIMAPSTLIIKSMSSMVDQVAAAVRSPAQEFYIKSRLLLRDPEKALTLFGKQDESVLQGVTHVICCTGTTAFPSKRWDGENTPERVDWNGIRNLVSALPQTIKRLVLVSSIGVTKYNEIPWSIMNLFGVLKYKKMGEDFVRNSEYHSRLSCIQVFTEKFFGGSEIYSDMIQAVCRPGRLTDGPYTSYDLNTLLKATTGERRAVVIGKGDKLVGEVSRLVVAEACIQALDIESTEGQMRLIQ
>UniRef90_UPI000CE4C9A8 pyroglutamyl-peptidase I n=1 Tax=Arthrobacter sp. GMC3 TaxID=2058894 RepID=UPI000CE4C9A8
MILLTGFEPFGGESFNPSWAAAQQAAASLTASGLPARALQLPVEFGTSADVLRRALATDPFDLVIAVGQAGGYGTLMLERVAINVDDALFPDNAGHSPVDEPVVAGAPAAYFSTLPIKACLQALQDAEIPARVSQSAGTYVCNHIFYALMNALADMPGVRGGFLHVPYSPEQVTDGKHPSMDVAQVARGLELMVRTSLATEKDLKLGAGTTH
>UniRef90_A0A1G2CBS7 POTRA domain-containing protein n=1 Tax=Candidatus Liptonbacteria bacterium RIFCSPLOWO2_01_FULL_45_15 TaxID=1798649 RepID=A0A1G2CBS7_9BACT
MPKENPVLWSDVRSREERRRARIFSSLVFLIISAFLIFGAWAVIYSPLFKIKSVEITGNKSVSDGDIMELATAEIPRGSFWKSVFGTGNILTWPDGFSGESLKFLPELKSFSVQKSYGQRKIKITVEEKKPFGVWCLLGARISADETQISADTKNNISENQPQNLRESAADCWWFDSSGVIFRKAIGVEGNLIASLDDYSQKNIGLNSKILPDEFIPNIFSIFRAVSASGLSVKEMRLNDLALQEIEVDTYNGLPADLSAIALATAEALAKAGPKIYFSLRFSADNVPEVIKSLKEKTTFGSLQYVDFRVENRVYYK
>UniRef90_A0A410GDA7 Glutamate--tRNA ligase n=2 Tax=Alcaligenaceae TaxID=506 RepID=A0A410GDA7_9BURK
MTTSTPTQVRTRFAPSPTGYLHLGGARTALFSWAFARHHQGVFVLRIEDTDLERSTPEAVQAILDSMDWLGMQPDEGPFYQMQRMDRYREVIARMLKEGTAYYCYSSPAEIEAMRDKARAAGLKPRYDGTWRPEAGKTLPSPPAGRKPVVRFRNPVDGVTAWNDLIKGPISFDNTELDDLIIARPDGTPTYNFCVVVDDWDMNITHVLRGDDHVNNTPRQINILRALGATLPEYGHLPMILGPDGEKLSKRHGAVNVMEYEGQGYLPEAMINYLARLGWSHGNDELFTREELVAWFDTRHLTKSAAQWDPKKLNWVNAHYIKTTTDADLAAHVAPRIRTRGGDPDAVDLLAVMALLKDRAETLEQLADGAMLFCAPFSPADPELQAQYLDDGAKSLLAAFAAKASDLAEWNTESLDGLIKELLTEHGVKMPKLGLPLRLAVTGQKQTPAIGAVLAIIGRERVLQRLAAA
>UniRef90_A0A481SX22 Putative ras-related protein Rab-2A n=1 Tax=Franklinothrips vespiformis TaxID=297892 RepID=A0A481SX22_9NEOP
MSYAYLFKYIIIGDTAVGKSCLLLQFTDKRFQPVHDLTIGVEFGARMITIDGKQIKLQIWDTAGQEAFRSITRSYYRGAAGALLVYDITRRETFNHLTTWLEDARQHSNSNMVIMLIGNKSDLETRREVKTEEGEAFAHEHGLIFMETSAKTADNVEEAFINTAREIYEKIQEGVFDINNEANGIKIGPQKSSTDPSLPSSGQGAGQGSGCC
>UniRef90_A0A2A5J168 GGDEF_2 domain-containing protein n=3 Tax=Rhodococcus TaxID=1827 RepID=A0A2A5J168_9NOCA
MSQPLNASPALLSIFWHSREDYSMAQWWIHFDLAGIQRYVFASRTLLDAIGRAAQVEDATDRAVLTAAAVLPEGVEVEFGAAGALILTTEATEFDNPEQPPQRVKDAVSAYTRWLYEVSDAFTPVVAIQYVRGGEEQQAQMAAADLLRQARHKRIPGVGSAVPPGVLRCALTGAPATDFLPPASEIPVAAEALTARRRGRTWHEAQQSKILASAPLPDGLSVDLPVQIDHLGRTEGASSHVAVLVIDVNDLGAALRTLPPDTLHARSAVADHLRALADELAEHLVHRVCSAIEITAGVPSIAGAPTALSFPLHQAPSPSRAAEPDALSCLTADRSTLDSPGEDLGQTAAPARWSLPLRPWVIAGDDLVLVCESRLAWDLATAAMNWIGEPATSGARTDLAGLGPAFGTGGRLSLTVGIGIAVVPVGYSLAAAHDLAAGLCKNAKKQRRDNKWTGHVLDWHRGPSAIADVLAHRARSDLRSGLRPYRYAPKQAPDESHTSTPTWSDVMTLLDADSPGSMRGPTVDEKSHGWASRRNWVKTDLLAAARSTGNNAVENALAAKNTREKVLTDAPMAELNIDGNSWQECDRANLIVDVIDLLDDHLDLTAAVSPS
>UniRef90_UPI0002377054 shikimate kinase n=1 Tax=Verminephrobacter aporrectodeae TaxID=1110389 RepID=UPI0002377054
MQIRCALVGMPGSGKSTLGRQLAQHSGVPFIDLDQRLEQTLGCSIRSYFEVAGEACFRDLEAQALADVAQQPGGMLLSTGGGAVLRADNRDVLRRFGSVFYLHALPEEICRRVQHDRTRPLLQGGNPLKRLRALYAQRDGLYRETARHVIETGRSSVRTLVGMAALQLEQDLAADAAQRAAE
>UniRef90_A0A251XIF6 RibD_C domain-containing protein n=1 Tax=Clavibacter michiganensis subsp. michiganensis TaxID=33013 RepID=A0A251XIF6_CLAMM
MLDDAGTRTWLEDLYRPGSADHVRLNFVASVDGSVVGADGTSDSLSSVVDRRILGVIRELADVVLVGAGTVRAERYVLPAGRPWQSPPRRAIWRVTASTRTPRRAASSCSARRRRATAPSRRSTACRRRS
>UniRef90_A0A5F0LGG4 N-acetyltransferase family protein n=6 Tax=Herbaspirillum TaxID=963 RepID=A0A5F0LGG4_9BURK
MTTSIRPATTADAAAICEIYNHYVLTTTISFELEAVSTEEMAQRIVEVSAIFPWLVYEEDGRILGYAYATKWKARKAYQQSVESSVYMAKDSGGKGVGTKLYSALFAELKACGVHAVMGGIAQPNPGSIALHEKMGFVKVAHFAQVGRKFDQWIDVAYWQLIL
>UniRef90_A0A849U3X0 Glycolate oxidase iron-sulfur subunit n=1 Tax=Methylococcaceae bacterium TaxID=1933926 RepID=A0A849U3X0_9GAMM
MFEFMDMEYDQAVDASEQTGPYIPEAGECMRCGQCVSSCPTFRLFQIDEETPRRRIRTISKVLVENLPISDDERHHLDNCTQCRACETVCPSRMAYGQLFDLARAQFQAEPGSLAKLAFKLIENKSWRRRLMPLLAIYLKSGLQKPLRRIGLLKKLGLAEAEALVGNPALQALATSYSARAAMRGRVALFTGCIAEHFDRDTLLAAIKLLNAIGYEVLVPPQQGCCGAIHQHNGQSAVGLINNNIAVFNALDVDAVLHTASGCGAMLSEYQADDDAAAELFKQRLQDIYDFLLKHWPDDLQLMDSTLNVAVHEPCSQRNILKNQQSVYALLQKISTISITPLADNQVCCGAGGSYMLTHPDNSGQLRELKRQAIGAAQADLVVSSNFGCAVFLSSDSVRVAHPLILLAGQLQ
>UniRef90_A0A3R7NVI0 Saposin B-type domain-containing protein n=2 Tax=Trypanosoma rangeli TaxID=5698 RepID=A0A3R7NVI0_TRYRA
MRKDHQMRTFIITVCILVVLLFSSAVAAKKEKPLHIPFPKDAVDGISCGVCTFVVKQVYRDVLVLFNASIRRRVRMSEDDVLTALEDVCNPFAETGQWIRRITITHKRETAPFLGVEELQVYTKCKRTCSTVVEACEGVLDHESMDMLSPRLLHLTEYADADKFAEALCDRSPICTKRWGLTASRYDELTTMIDEDTMEEIDPKEMEVERMMDHMERKENRRHSIFYRDEIVKMQEAILRGDKEAVAKVDPSIADLSEEEFAAVQAMVRGKNNEKLRSGTHRADDEGKARDTQRRKHRESDGGEGDLENFELEQEDL
>UniRef90_W6KER4 Cytochrome b5 heme-binding domain-containing protein n=1 Tax=Phytomonas sp. EM1 TaxID=479712 RepID=W6KER4_9TRYP
MLSSLLGFNLWQKKWPLLSDEEICKHNNRMSLWIVSGNSVYDVTSFLNSHPGGDAILLRCGGGSKNCAEDFALHSQFGQRQWERLKIGEISEASTTKKSIFYGKEYSATDPEEEEEAALC
>UniRef90_A0A7W4J316 Amino acid ABC transporter permease n=1 Tax=Gluconacetobacter asukensis TaxID=1017181 RepID=A0A7W4J316_9PROT
MIDWHFIAIIMPRLLRACGQTMGISLCSLSLATILGLSVALLRLSPIRVLGTAAWTYVWLVRGTPLLLQLFALYYAVPLTGLRLDPWLAGVLALGFNSAAYFSEIFRAAIQSIPPGQSEAAIAIGMGPATTLWKIVLPQALRPALPPYIGQAITLIKNSSLVSVIAVPDLMQTAQSIYSVTFKVVEVMLATGVLYLFMTTLLQIAQTWLERRLNYYTVK
>UniRef90_UPI00174618E5 clostripain-related cysteine peptidase n=1 Tax=Phormidium tenue TaxID=126344 RepID=UPI00174618E5
MYAQRLLRSSRLFDSDRQASFDQASRSASLFSSDSPRDTTRAGQRNRAAAAKSAKRQPRRQKTRSVGSAADWTVMVYMAGNTLERFGIQDFLEMANVGSDSRINLVVQFDRTAGGNTSYGNWTDTRRGLVRAGDMPNAFWGNGLGELNMGSTATLKNFVDWGTNTYKANRYALVMWGHGDGFNVSYDDNTGDGISGSELSSVLSSTGNKIELVGTDACLMATTEFAYQIADNASIFVGSQELEPGTGWNYTTTLQDLKANPTMSAAQLGSSIVTRYGQAYPTGNETFSAINLLALRSSNASSLTNTLNSFASTALTSATSSDLSILDSLRDYFANDFGDATYRGSEDLCDVGNLFSNLVNRLDISAAVRTAAQSVLTAYDSTVLQNYSATPGRSTGLSLYFSDRNSIPKSSYTSRLYGFLATTQWDEFLQGWLWN
>UniRef90_A0A1A2YYB8 MarR family transcriptional regulator n=1 Tax=Mycobacterium kyorinense TaxID=487514 RepID=A0A1A2YYB8_9MYCO
MGRIEDAPLGYLLYRVGAALRPEVAAVLRPLELTLPEFVCMRILSMYPGMSSADLARQTNVTPQAMNTVLRKLEDVDVVARPATVPSGRALPATLTTAGRALLKRAEAAVREADARILSKLSASEQREFKRMLEALGSD
>UniRef90_UPI0003641618 heavy-metal-associated domain-containing protein n=2 Tax=Streptomyces TaxID=1883 RepID=UPI0003641618
MTAQTDTQGSVTTVYKVSGMSCGHCEGSVSGEISGLPGVSSVKAVASTGEVTVVSAAPLDDEAVRAAVDEAGFELVGQA
>UniRef90_R9J9S0 DNA repair photolyase n=1 Tax=Lachnospiraceae bacterium A4 TaxID=397291 RepID=R9J9S0_9FIRM
MKNLKEDYFNPFFSHIYVEKSVRNHARTQNILAKFPSAQIIEIGHYKDVFCRSRQNIRLQHCAQKLILAARQGTLLYEGAPVCQRFGNEHFYYVSCAMNCIFDCAYCYLKGMYPSANIVVFVNLEDIFAEVERVLENHPLYLCVSYDTDLLALEPLIGFVQEWCAFAAKHAQLTIEIRTKCANKAFVQSIVPMPNVIYAYTISPQAVIDAFEHHTASLSDRLFCAAALMRAGCPVRLCFDPMIYLPGWKTHYSEMMNQVYRSIAVDQLLDVSIGTFRISQDYLKNMRKQAKDSAVIWFPFQKEDGYCHYPAPLMEEMESFLTAQIAEKIDREKIFRWNV
>UniRef90_A0A6I6SRI0 Gamma-glutamylcyclotransferase n=2 Tax=Halomonas TaxID=2745 RepID=A0A6I6SRI0_9GAMM
MRLSHVVLAASAALLAIVGWLWLTMLSPLTYDRPDHLPEIDEGEHAVFVYGTLRFAPVRWVVMGRAGETEAAVLEGFRREGLDLAEAPDERVQGEIVVVDADELERLDRYERLGIRYQRVPMRLADGRVAWVYRRLNEITQASESPATD
>UniRef90_A0A373XTP8 Dihydropteridine reductase n=1 Tax=Ruminococcus sp. AF17-11 TaxID=2293150 RepID=A0A373XTP8_9FIRM
MNTDKIYAEQLANEYTPKDTSKVVALRKLDAKAKLPATIFTYTFGIISALIAGVGMCLSMKVIGSGSDAMFILGIIVGIIGFVGVAVNYPIYKKLLNKGKKKYAFEIVQLAKEISEKDM
>UniRef90_A0A366JGF4 FAD:protein FMN transferase n=1 Tax=Marinomonas rhizomae TaxID=491948 RepID=A0A366JGF4_9GAMM
MRKKILFSVFLLIAIAVVYRLSVFTPELASFSGPTMGTTYTVKFFTTKEVGDAWVVKEDVDAALVRVNSLMSTYDPNSELSLFNTLPAGQSAVISDDMAYVVDKALLISEMSGGEYDVTVGPLVNLWGFGPGKHEDKVPSQELIDEAKSRVGYQYLKLDGRRLMKEKDIYVDLSSIAKGYGVDAVARVLQDRGIESYLIEVGGEIVSKGLKPDGAPWRIAIESPAGGHDIAERIISVTDVAVATSGDYRNYFEKNGVRYSHTISPISGRPITHRLVSVTVVDKTTTMADGLATAVTVLGPDKGFEFVQKNGIAAYLLVKTDFGFEEHSSDAFKAYLK
>UniRef90_UPI0019100A88 hypothetical protein n=1 Tax=Aliterella atlantica TaxID=1827278 RepID=UPI0019100A88
MVLIDNPNTRVTVRNIVQTLVFEDEEENTISETNGCLVGKLIEVRFGLLRSCGKEK
>UniRef90_UPI0013E3DCB5 hypothetical protein n=1 Tax=Streptomyces sp. B29(2018) TaxID=2485016 RepID=UPI0013E3DCB5
MSNVDELRDLPALLQRVDFREEVVPHTAGAIEVFFGECREMPLRAVDPTKPRERHV
>UniRef90_A0A8C8YVF0 Actin binding LIM protein family member 2 n=1 Tax=Prolemur simus TaxID=1328070 RepID=A0A8C8YVF0_PROSS
MSAVSQPQAAHSPLEKPPSTAILCNTCGNVCKGEVLRVQSKYFHIKCFVCKACGCDLAEGGFFVRQGEYICTLDYQRLYGTRCFSCDQFIEGEVVSALGKTYHPDCFVCAVCRLPFPPGDRVTFNGKECMCQKCSLPTSVGSSAHLSQGLRSCGGCGTEIKNGQALVALDKHWHLGCFKCKTCGKLLNAEYISKDGLPYCEADYHTKFGIRCDGCEKYITGRVLEAGEKHYHPSCALCVRCGQMFAEGEEMYLQGSSIWHPACRQAARTEDKNKETRTSSESIISVPASSTSGSPSRVIYAKLGGEILDYRDLAALPKNKAIYDIDRPDMISYSPYISHSTGDRQSCGEGDQDDRSYKQCRTSSPSSTGSVSLGRYTPTSRSPQHYSRPAGTVSVGTSSCLSLSQHPSPTSVFRHHYIPYFRGSESGRSTPSLSVLSDSKPPSSTYQQAPRHFHVPDTGVKDNIYRKPPIYKQHATRRSDGEDGSFDQDNRKQKTSWLILKGDTDTRTNSPDLDSQSLSHSSGTDRDTLQRVQGDNFHSRPPYSKSDSLPGHGNNGLDHRNANLAPCGADPDASWGMREYKIYPYDSLIVTNRIRVKLPKDVDRTRLERHLSPEEFQEVFGMSIEEFDRLALWKRNDLKKKALLF
>UniRef90_UPI002036F24A dirigent protein 23 n=1 Tax=Beta vulgaris subsp. vulgaris TaxID=3555 RepID=UPI002036F24A
MNKFRLPTSFICVVLTFYIVNVSSAKTPSWAKTERYGHEHKTVIQFYFHDVRSGDAPTVALIAQPVEARSFASGFGNLFMADDPLTVSPDPNSKLVGRAQGFYGSASQESVSYIMGLTYGFVDGIYNGSSVVIFGRNSIVNRVREFPVVGGTGIFRMARGFAVAQTYFHNSTTHNAIVVGYNITVFHLELAMGRAGPDHGPGPRAEVEYGPGQARGP
>UniRef90_UPI000C85D657 HNH endonuclease n=4 Tax=Vibrio TaxID=662 RepID=UPI000C85D657
MNWVIYVANATTKNFDIGLNQGIWGHKEIFSTVNTDKIKVGDTLYFVHHLTFMRDDNGNVIKGAPRVAAEHYKGSISTLVETRVTKGFYIDKKTVWPDDIYPNRYNFEVIEKHQNLPFSDEFFSSEFVQAVRTSTLTKGLAIELEGEHGEVYASNENIDLEYFEGNTVFRRHLVRERSTKLVNDKKRSVRDANLKLACEVCGFDFEDTYGERGYDYIECHHKNPLSESNGQKTKLKDLALLCSNCHRIIHRSRPWISVDELKEILNERASEATV
>UniRef90_A0A507FHA7 PRP1_N domain-containing protein n=1 Tax=Chytriomyces confervae TaxID=246404 RepID=A0A507FHA7_9FUNG
MFHKPAFAPDFLSKKPPPNYIAGLGRGATGFTTRSDIGPAREQAPEEVAPPAIGPMMGGPAIGPGMPGMPPGANGDAPKKPLDDDDEQFQDPDNETGLFNTAPYEADDEEADRIYEEVDKAMDERRRARREAREREELERYRKERPKIQQQFADLKRGLAAVSQEEWAALPDVGDLVRKKGTKKKLPDRYTPSADLITIGGGFGSTVSGGGDAASGFATSIDPRMMGGLSTPAGTASVAGDQSGILTDFVQFGQGRNKVLGLKLDQMSDSVSGQSTIDPKGYLTDLNSMVTKTDAEISDIKKARQLLRSVITTNPKHAPGWIAAARLEEVAQKIVAARELAAKGCEECPKSEDIWLESARLNSTENAKIILATAVRHIPTSVKIWLRAQSLEQDVKAQKRVLRRALEFIPNSVKLWKAAVSLEEDSDDARILLSRAVECVPLATELWLALARLETYENAKKVLNKARTAIPTSHEIWITAAKLEEQQGNIGSLDKIIPNAVTRLAQKGSTLDRDSWIKEAEECEKEGFVGTAQAIIKATIGIDVDDDDREGTWLEDAESSVSHGAIATARAIYAYALQVFPQEEGIWRKAAFLEKSHGTRESLEEVLQRAVKYCPQAEILWLMGAKEKWLAGDLPGAKGILASAFEANQNSEQIWLAAIKLEVETGEYGRAQALLLQARTKADTDRVWMKSAMLERQLGNLPVAMSLLEEAITKFPQFGKLWMIKAQIEEHQLSNVVAARDTLSKALKAVPKSSPSAVTLWLMASRLEERAGQLTKSRALLEKARLLNPKQPELWCEAIRVESRASNQAIADALISKALQECPTSGLLWSEAILSESRPQRKARSKDAWMKSENDPLVLVTVARLFWSERKVEKARNWFARAVKVNPDLGDSWAWWLKFESVQEGDTTKMVADIVAKCKAAEPHHGERWQACAKDLSNTGRSVEEILKMVASSLPVTV
>UniRef90_B2YJ48 Cpn60 (Fragment) n=2 Tax=uncultured soil bacterium TaxID=164851 RepID=B2YJ48_9BACT
ATILAQSIYREGVKAVAAGANPMALKRGIEKAVEAVVEDVKKLSKEVKDNETIAQVGTISANGDAEIGKTIADAMKKVGKDGVITVEESKTMTTELQTVDGMQFDRGYLSPYFITDPDRMECVLEDPYILIHEKKISNMKDLLPLLEQIARSGKPLLVIAEEVEGEALATLVVNKLRGTLNACAV
>UniRef90_A0A6I7QH38 Translocation/assembly module TamB n=1 Tax=Bacteroidia bacterium TaxID=2044936 RepID=A0A6I7QH38_9BACT
MVIIIMMPFIAYAFLQSSRVQTYLVGHLTDYFSRELQTEISVGSVDIRLFRSVILKDVIINDRQGDLILEMRKMRFELGKLSFQNRSLVIKELEFRDAFLNLFKDKQEENYNFQFLVDYFSSPTVANGHNRWEFTCEAFKLTNASFWHLDLNRKSGVNGFDPANFYVSGFYLAMNQIEIVDNTLSLALDYLYYNESSGFIIDYLSGNFLLKHGQLDIDNFIFRTDGSDLNFSLSAKYGSFTSLEELVADLRFQMDIGKSVLHLADLGHFIPGLYGVNDTMKIEGAFEVLGDTLTGDNVLVEYGLKSRFDGDFQLKNFLGGSDMRLEFTARTLQSNFNEIAALNLPVSLEKSKPEFPPFLYNLGDFEFSGRIYGGLHSFQSEGSLASSIGTTYANLLMQRDNESMPYQYQAKVNTRNLDIGRLFGIGASAGKATLELNIKGEGFHPDNLDLLVDGHIASVELASYTYNDISFQTEFLNQNLNGQLGVKDQNLLLDITANAQFDKEIPFFDVLVNIEHANMTKLALFQKDSLVESLLKTHIHFNGKVSSLDSFEGDLVFREIRYEEIPLEQDHHSSRYLVFTDSIFINSKKWSPDNQHIRLRSGFADADVHGKLHLTALPRNLKESVQNILPFGEPDLSGYTGTEYYQDQDIQFSFHFKDTRILSELFLPALSLSGNSWLNGHYRSADHHLIFIAHADTLALENRRFLDLNIGGTHGENNYSITFDSKRLMVSDSLHFDLVSLQSGWKEQSLDVKLEWQGTNGDESGIGVISGHANVYDKNHIEFSFLPSYALIHGDLWRINIDNKIIVDSSRIEVSGLMVYHGDQFIRADGVLSDHPRDRMMVSFSNFEVAYSDLFLGESNFKFGGILDGYVTFTALYQSPSIGAGLTIQNFAFNHQELGDLQLSSIWQFDKQAFLVDGKITSKADDQEHNLLTLSGSVYTGQNIGRYDLGISLHNMKMEVWRPYVQSFSENFKGLATGELHLGGPLNSPELTGQVRLMETSMHIPYLNVTYFLEDDVRFTKNAFVFEDVAIRDTLGNIAKASGAILHNSLRGFGLDLHIRPSNTIVFNTTAVDNSIYHGTGFVTGLAHLHGPVNDITMDITARTNRGTRVILPLNSAGEVRENHFITFVARNPENNLPLMPPPDLSGNITLNFDLEVTPEAEVLLMFSPPFGDIIRGRGNGNLKLEIPPDGAFNIYGDYVITEGEYLFNLQNIINKRFRIEQGSTIRWTGDLNDADVEMQAAYRLRTSLYDLFVGEGIDSETVEMFRRRVPVETLLILQDRLFNPTISFDIQVPGGDENTREMIERVITTEQEMNRQVFSLLVLNRFLPSREDQYNTALGFGVGSTSSELLSNQLSNWLSQISTDFDIGINYRPGDEITSQEVELALSTQLFDNRVTIDGNFGVAGNQTASGQPTQATNQIIGDVNVEVMITPEGKLRVKAFNRSNTFDIIHTNAPYTQGIGVFYRKEFDRLEELFRRNRIPEIPVDSD
>UniRef90_A0A6G6Z3X8 (2Fe-2S)-binding protein n=2 Tax=unclassified Bradyrhizobium TaxID=2631580 RepID=A0A6G6Z3X8_9BRAD
MFKRSDQDKRPSVQIFVDGAAIEARAGDTVSAALLASGRDVRRATAVNGAPRLPYCMMGVCFDCLVTIDGVGNRQGCLVPVTEGMQIEIQKGKREIGR
>UniRef90_A0A7K0PYB7 M50 family peptidase (Fragment) n=1 Tax=Actinomycetia bacterium TaxID=1883427 RepID=A0A7K0PYB7_9ACTN
MLGRSVSVMPGRYPSSPGLSPRRPGVVGWTAMTEIWDRVGATSPPLPPLWLGVTAVLALVLVVQRDLWRVTRNAVTIAHEGAHGVAALVTGRR
>UniRef90_A0A177HN16 Cell wall protein-like n=1 Tax=Streptomyces jeddahensis TaxID=1716141 RepID=A0A177HN16_9ACTN
MPSLKLAPLYLRAEEKGSDSVQRHSSLSGYASMIACRLAFGRGSDSPRAPRTLRMYVSSAPSSARTSVTSMPPSVSVPVLSRQTVSTRASPSIAGSSCTRHCFRPRRMTPIAKATEVSSTSPSGTIGTMPPTVRAIASLKPESSVSSASWLMIRPRAVGIIIHVTYLRIVEMPVRSSEWTSVKREASSASCAAYASRPTLVAVNAPPPATTKLPDITGSPGFLTTGSASPVSSDSSISSPSASATAPSTTILSPGPISIRSPRTISEVLISADTPSRRTVGLASPINARESSVFLARSSWMMPMPVLARIT
>UniRef90_UPI00083E5566 3-deoxy-7-phosphoheptulonate synthase n=1 Tax=Streptococcus himalayensis TaxID=1888195 RepID=UPI00083E5566
MTFKALSQPINVKEVRSNYKLEGASLQRKEERDAALNAIIRGEDDRILLVIGPCSSDNEEAVLEYAKRLAALQETVKDRIFMVMRVYTAKPRTNGDGYKGLIHQPNATAAPSLINGIKAVRKLHYRVITETGMTTADEMLYPENLPLVDDLISYMAVGARSVEDQQHRFVASGADLVTGLKNPTSGNLTVMFNGIYAAQNKQSFLFGNTEVETSGNPYAHAILRGAINEYGKNVPNYYYDNLLDTIAQYEKMGLENPFIIIDTNHDNSGKQYLEQVRIVRQTLINRAWNEKIHRYVRGFMIESYLEDGRQDEPDVFGKSITDPCLGWDHTEQLVREIYETLGK
>UniRef90_UPI0003685307 undecaprenyl-phosphate glucose phosphotransferase n=1 Tax=Gayadomonas joobiniege TaxID=1234606 RepID=UPI0003685307
MGKRGYLREHQHAFSSLYRVIDVVLICLTLFVSWDCFAGLDTKQHYFVAIVASLIFLYLAETFGLYRSWRLARFYQLARTITFVWSVTFLSTVFVAVLLEIPEGVSQLVFVSWGLVGTFLLSAWRYAYYVAIKKLRKKGFNTRSVAIIGHTRVGKELYKQIRLHSEAGLKFVGFYEDRMPQRYMGDKYSSDFIRGSAEDAIKAAQRGEIDQIYIALSLKQEDRISQLLVELGDTTADVHFIPDFFVFNLVQSRMGYVGNLTTLSVFESPYAGTNSWLKRAEDIIFSSIILFIISPVLLAIAIGVKVTSPGPVIFKQYRYGLDGKRIKVWKFRSMTTMDNGDKVVQAKKGDARITPFGGFLRRTSLDELPQFINVLQGRMSIVGPRPHAVAHNEEYRKKINYYMMRHKVKPGITGWAQINGWRGETDTLEKMEKRIEYDLHYIGNWSVWFDIKIIFYTVFKGFLDKNAY
>UniRef90_A0A7V0QHY8 3HCDH domain-containing protein n=1 Tax=Deltaproteobacteria bacterium TaxID=2026735 RepID=A0A7V0QHY8_9DELT
MMGGSMKEKILVLGRGEIARSLFDICKQTELSVTFLESADELGPQLRDTDIIVQFVADGLELPHLKESDFIGKYKVWLIEVIDQSVTRAAGRMGCSERIVGFSISKSFQERRFIEVIGGERTGSDAVTTARNLFERLQFTVVISKDHPGYILNRVVASMINEAIYVSMYGLAQMEDIDQMMRLGANFPMGPFEYADYLGLDRVLKTLEWLAEELGPQYRPCPLLRRKVEAGLLGKKTGKGFYEYGI
>UniRef90_UPI001106F8B2 antibiotic biosynthesis monooxygenase n=1 Tax=Eubacteriales TaxID=186802 RepID=UPI001106F8B2
MICTLVRFHIKHGCGDRFLELARTSVEQTRLEKGNISYDMGPELGKTDTFIFFERWKNQESVDIHESQTYFQSFDRAAGELMDGPVEVFKMEPPF
>UniRef90_A0A2E6YUS8 SLT domain-containing protein n=1 Tax=Halieaceae bacterium TaxID=2026743 RepID=A0A2E6YUS8_9GAMM
MKNVLGIVTLVLSMGSLPGISLAASDDDRAALTTDLSKALTEDNEFQDRFDAEVWLVDMQQRLAPLVPDAQERLDLLTQVHQQASRVVLHPELVLAVIEIESHFDRYAVSRAGAQGLMQVMPFWKNELGRPEDNLTDTATNLQYGCHILRFYLDREDQHLSRALAAYNGSSGSERYPNKVRDAWQTRWRTQPIDW
>UniRef90_UPI001D0CC098 thioredoxin n=1 Tax=Roseitranquillus sediminis TaxID=2809051 RepID=UPI001D0CC098
MLELGGRKEDAATDLIKDSTEATFMQDVVDASRDVPVIVDFWATWCGPCKQLTPALEKAVTEARGKVRLVKVDVDRNQQIAAQLRIQSIPTVYAFWQGQPVDGFQGAVPPSQIKEFIERLVKLGGGDDGDPLAEAVEAAETMLAEGAAVDAAQTFAAILGEAPTNAAAYGGLVRAHLAMGEADRAAQLIDAAPAEISGSPELEAARAQLELARQAEKAGPVAELQQAVEADPTNHQARFDLALALHAKGDVAGAVDQLLELFRRDREWNEAAAKTQLFTIFDALKPQDPIVLNGRRRLSSMIFA
>UniRef90_A0EUM8 Protein Nef (Fragment) n=1 Tax=Human immunodeficiency virus 1 TaxID=11676 RepID=A0EUM8_9HIV1
MGGKWSKNSLGGWPKVRERMRRAEPAADRVEAEPAAVGVGAVSQDLAXXGAITSSNTAATNABCAWLEAQEDEEVGFPVRPQVPLRPMTYKAAXDLSHFLREKGGLEGLXHSQKRQDILDLWVYHTQGYFPDWQNYTKGPGIRYPLTFGWCFKLVPVEPEKVEEANEGENNSLLHPISLHGMDDPEREVLVWKFDSSLAFHHRARELHPEYYKD
>UniRef90_UPI0021B1B406 hemerythrin domain-containing protein n=1 Tax=Mycobacterium sp. SMC-2 TaxID=2857058 RepID=UPI0021B1B406
MTSAWRSSDLAEAFREDHAVLGRGLHEVSEHLRAGNDQAAKARAERVDREAGAHIAFEEQFFYPALRRTLGDAEVDGLYEEHGEGLSVIKALAQLPEGAELTEADRRTLLQASELTESHVAECGELFGVMGRIPPDEQQALYRELLSLREESPRWTEFAARTKEG
>UniRef90_A0A7D4A833 Superfamily I DNA and RNA helicase-like protein n=6 Tax=Actinomadura TaxID=1988 RepID=A0A7D4A833_9ACTN
MTERHLVALTKPEPSPVLDPGEAATRAVDGVLADLGGGHRGVVVDSPPGAGKSTLVVRAAAHLAEAGERLMIVAQTNEQVDDLIERIATKHSQLTVGRLSASGYLPSERVLAHPSVRVAQKADDLAEHTIVIATAAKWATLSDGSWPWAIVDEAYQMRSDMLLRIAGRFERALFVGDPGQLDPFSTVEVERWAGLSWDPMRSAVSVLLAHNPGLPVHRLPVSWRLPASAAPVVSDAFYPFTGFRAGTSDGDRRLEYGARGMGTTYDHALEEAAATGWALYELPARHTLRTDSEAVRATAALAVRLLQRGPVAHSELGSKPVDATRVAIGAAHRDQVTAIRAALGEHGEGITVDTANRLQGREYDVTVMLHPLSGRRDATAFHLESGRLCVLTSRHRHACIVVARAGIPELLDAHPSTEPVHLSVPVKFPDGWEANQSILAHLARHRVAAD
>UniRef90_UPI00132F9BB1 sulfatase-like hydrolase/transferase n=1 Tax=Klebsiella pneumoniae TaxID=573 RepID=UPI00132F9BB1
LRNSGSTFSLVYFSDHGLAFKERGKDVQYLAHDDKYQQNFQVPFMVISSDDKAHRVIKARRSANDFLGFFSQWTGIKAKEINIKYPFISEKKAGSIYITNFQLQKVD
>UniRef90_A0A554VFG8 AtpZ/AtpI family protein n=2 Tax=Flavobacteriaceae TaxID=49546 RepID=A0A554VFG8_9FLAO
MGGTIFLCAYGGKKLDAYYELEKQWFTMGLVLFGVTASIYLVIKQLNRINKSDR
>UniRef90_A0A7C1UAD0 CBM-cenC domain-containing protein (Fragment) n=1 Tax=Phycisphaerales bacterium TaxID=2052180 RepID=A0A7C1UAD0_9BACT
MNVRWRSQGDFCESTCSDGGRGHNNRGALSKRRTTMYKQLMFPICLTVVLGLTARASEPFGHWPFDGHVNDVAGSANGTFFGGSPDYVNGRIEQAIRFDGVDDYVEVMVENLDAYTITAWVMPDRVEPASIVVRTSPSGTTTHWSHQMRIAASGQFEHYVWDGAAQTALGTTQVEAGNWYF
>UniRef90_A0A6P0WQH9 Type II secretion system protein n=1 Tax=Caldora sp. SIO3E6 TaxID=2607806 RepID=A0A6P0WQH9_9CYAN
MNICELPQKLLPQKKTTQPNQSGFTIIESLVAIIVISILMLGLSPVIFLSVAARVQSRRVERGTEVARTYIDGVRSGAIPATNVVVGAATDRTLEAGPVPTALNPVDWSDPGGLYCVDLDASGGCEAGSMNDMVVQGFRTPGDADRGYLLGVRVYRAHAFSGGEPLQKGQTQSSFSGTLGNSKVPVVEMTTEIPPSGAFQDNFSEWCARLPNTNPISTCN
>UniRef90_UPI0006E338CE trehalose-phosphatase n=1 Tax=Streptacidiphilus griseoplanus TaxID=66896 RepID=UPI0006E338CE
MGIPEPTTPAGAEGLAALVADPAHSVIALDFDGTLAPIVPDPDQARAHPGVVPALARLAPQVGAVAVVTGRPAGVAVRHGGFAGVPGLEHLVVLGHYGAERWDAVTGEVRAPHIHPGVASVRAELPGFLDRIGAWEGTWVEDKGRAVAVHTRRTEDPDTALEQLRTPLLELAARHGLMGEPGRMVLELRPPGVDKGVALTGFLHERKARSVLYAGDDLGDLAAYDAVTRLRTEGVAGLLVCSAAEGEEPVGRLEERADLVVGGPSGVVGLLDALADEMGAPRP
>UniRef90_UPI001CB69EC9 polyubiquitin-A isoform X6 n=1 Tax=Frieseomelitta varia TaxID=561572 RepID=UPI001CB69EC9
MQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDDRTLSDYNIQKESTLHLVLRLRGGMQIFVKTLTGKTITLEVEASDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGQ
>UniRef90_A0A6M3XMR9 UDPG_MGDP_dh_C domain-containing protein (Fragment) n=2 Tax=viral metagenome TaxID=1070528 RepID=A0A6M3XMR9_9ZZZZ
ANPFGFVSEAREKQSKWLAKLIKREQERRKLPVVIMGLTFKHNTNLTTDSPAILLMEQLEDMGVKTSAYDPVVMPSRPKDVPSIYFIATRWVKFSTFPYAKGSLIIDPWGFFGVAPEGCELFSIGRNR
>UniRef90_A0A7W1P943 DUF4625 domain-containing protein n=1 Tax=Acidobacteria bacterium TaxID=1978231 RepID=A0A7W1P943_9BACT
MKKPPLQRRTISVPVPELPPGKYKLVIIAESRGAVARSEVLAYEVR
>UniRef90_UPI001F566F06 DUF6516 family protein n=2 Tax=Shinella zoogloeoides TaxID=352475 RepID=UPI001F566F06
MQARLILKTRRHIGEAMFADLVIWRVPEPLRGSRHPFKYRLAFVADGICVMRYDNEAGKGDHKHIGAEEQPYAFQSIEKLLLDFDADMKGWIDGNADRED
>UniRef90_A0A1I7GQJ1 Glycine--tRNA ligase beta subunit n=4 Tax=Burkholderiales TaxID=80840 RepID=A0A1I7GQJ1_9BURK
MTAPSNLLVELFVEELPPKALQKLGDAFAQVLLEQLTAQGLATGASQCTAYASPRRLAAHITAVLPQAADKAVSQKLMPVSVGLGADGQPTPALLKKLTALGADASAAAALKRVHDGKAEVLYFESTAKGALLAEGLQKALDEAVAKLPIPKVMRYQLQDGWSSVNFVRPAHGLVALHGASVVPVAVLGLQSGRATQGHRFEAAASPVALRDADSYAAQLRDEGAVIASFAERRAEIVRQLQAAADKVGGGVRPIEDAALLDEVTALVERPNVLVCQFEQEFLAVPQECLILTMKANQKYFPLLDAEGKLTHQFLVVSNISPQDPSAVIQGNERVVRPRLADAKFFFDQDRKKTLVSRVEQLAKVVYHNQLGTQGERVERVRAIAKAIGAQLFEALAAQHRIDGTQDAEVVQDYLMTCVDNAALLAKTDLVTDMVGEFPELQGIMGGYYAVNDGLPDDVAHAIEDHYKPRFAGDALPRNNVGLVVALADKLETLVGMFGIGNLPTGDRDPFALRRHALGVIRMLAERDLPLDLSALLAAATPAFGGKIEDATAQLADFIYDRLAGSLREQGYSAQEVDAVLALRPQRLALVPKQLAAVRAFAALPEAPALAAANKRVTNILKKAGEVDAHVNPELLQEQAEKDLYVALQRFVPEANAQFLAGDYTGSLQTLAVLRAPVDAFFDDVMVNAEQLDLRLNRQGLLKTLHDAMNRVADLSRLAA
>UniRef90_A0A835R703 Transmembrane protein adipocyte-associated 1-like n=1 Tax=Vanilla planifolia TaxID=51239 RepID=A0A835R703_VANPL
MMAYYGLIWIVSVLNLTWCILQAWQCTPTKEFSWNLLSLCTKSGMLFLEVSLISFLLQGNQAGDLEALTRTFVVSGVIVAVDVLLKAVYVFGFGVPMFLDGVGPSNHVKWGLWIVHKLLLAAVYVLILFMYHSKWREMLPAQPAFRNYICVMFSINALSLFSCLLMENGAGFGYWLLSLVTLCYHSLYLPFLYITFLADFFREEDMRLENVYYSEMKDAGFFDADWD
>UniRef90_A0A806X1Y9 DUF4091 domain-containing protein n=1 Tax=[Enterobacter] lignolyticus TaxID=1334193 RepID=A0A806X1Y9_9ENTR
MLNPCIDDPDEHLVFLDDGRVEPALINGQESRKGKASIQYLGLARAELLQMRARHRRTVIAAIRHTIAALEEGRDPGTDLDDLLTLLSSKEAYVAYTRTLVRTHMSAYIEALGL
>UniRef90_A0A1V9ZKS3 Secreted protein n=1 Tax=Achlya hypogyna TaxID=1202772 RepID=A0A1V9ZKS3_9STRA
MAGRERRAWCSWLLVLLYALTVRGNQLLVISQPATMTAGDMLSPPVLQIVDDTGLVLSDINTGTVTVSIETNPLMYAVLSGTSGLAFPIVAGVVTCSGLSINLVASGYTLSFVALSYGLQTSSNPFDIILGPPYQLSMYTYIGVAQGGTPFSPQPTVAIVDKGGNLVASVSSGSVSVAILNNPVGGILTPAIAHTVYFYEGFGKFYDLQIDKAGGPYTLKFTCDASLNLPGGNSYTTFPFTVAIGPPRTMFIAAYPLAAFGGEAFVTQPMIQLLDAGGNTLQTQPSMQIAATIYANPSGGRLYPATETSASVINGFASFKNLRIDLAGNNYMLRFAITMLNVLGVYAETGLAVVGPSLNVYLGALFSLQVLRPPESAIADGQPFYTQPVLVLRDRGNNTISTENLALVSVSMVPSLALYNNLIVSTANSPIATITDVTLLFSPFSAPFGAGTDLFINVTFSQQIMATGSIVLQMNSAPGALATCNTLLTWSNRLTFGYGITAGDAAAALNYASTSALTLQGGATLVDRLGVPASLILPAAGLRPAVVVDTTAPSIVSVGCVPPFVAGTYGPGQVVSLLVTFSAPVSIYSTLMPYLLLNTLPAQSAIYSSGNQTASLVFQYIVGPTDAVATLDVVAALNTNGGLLRRAGTALKQDALLQMPATASSRLPAQCPLVISSVVPAIDATVGVTSATPNGVYATGDRIFITVPFTALVAVSGIPLLALNTGRNAAYSSGSGSSVLTFQYIVQAGDSVAALDYASPAALMLNAGTIQRFVTAGSPLLDVNIDLTATTASNRNLGQTAALVLNGLAPTVVSVAFPVAPTTYTRGGTVAITVTFSYAVVVQGQPSILLNTGVAATYASGSGSTALVFNYRVQLGDATTDLAYAPTSTIVLNGGSILQQSSTPSLAAQLMLPWPPAIVNAPVTIDPALTAVTTVVSITADQVAGEYGQNQVIQITVTFSDAVQIVGGVRLALTTQTVAYASGSGTKALVFLYIVQPNDATSSLNIASASPFTCTAGGGCSIANANYLAANLDCTGLTLQPTAIVINTVAPSVVSVAALTPAPTINRGTFVVGDLIQILIVVSKAVDVQPSPSVFPTKVPTLLLNTGQVAYFTGYDNGDRTRLLFQYTVAVGDATPNLQYASTGALTLNYNQASIRRLATNPTTPMNLLLPVVANLGTNLVVDTSRTPIVINVASITADGTYFVGDVIAIRVTFSEYVVVSGIPVLLLNLGVYDRSAVYVSGSGSTSLVFQYTIGQDDFSKDLSYIDLRSLYNPPGASILFQSTNPTVAANCQLPLPGSAGSLSANSNLQVLGGTPYIVDIAFLSPNATYTVDNTIDVQVTFSAKVVVSGTPFLRMASGPSLRQAFYVPTVGASTTVVFRYRVQTGDVSMDLDYADTAAIQLNGGSILTAPTLLTSIPVQPANLQLNPPGGALTGTRTVQTVAGVVNYVNLGIDTMGLGYIFYFATATVVTSVQFDVTYSAVWEVRNAPLNEQNRGDRTGSSVDITTGVAVVGSAGAKARQYNVQVVTASGSATKYVNEIQYVQTTCVQRDAIQVLTSSAAPGSTLGGYFTLMLGAEGPTRRLAYNFDATQLKVALELDFGFDAAAVEVTRTPNTFCGCFDAYAWTITFHTDGEIPTLLARSYLTGVSATVGDGTGGASALVLSLPPVVNGQFALRYGALVTASMPSNVDATTMANRLTTDLNLPILSVQRSLPTVQAGYTWSITFYASATIFNPNELEPAPLLLTGNQVLLSVTTVQEGQAPLYGNFRLSIAGHTTPNIAVTASAGDVQTALQTLPEVTSVAVTRSAVNPSGGYSWTITFLQINLMSTYGLVLNSLGTLPPLTPMTLVNGAPILMGTSATIMVNYAGVNPSANSPAGFGNAPGESAGSVTIFVPRNLQWIQSANLLGSDTQSGDNFGAAVAINTAGTQVDRGRKEIQTLTCTADGGSFTLTFLGITSPPISFAATAATLQAAIARLLNVPLSQIAVSTYTNLCAGIGVAVTFATPDLSTETGNVPNLVPDGSSLTSSGGPGSIVVQEIAPGTYRLDGTEAKGATCGGAYFYQASAGMWSQMAKMLPMDGSEGTSSEFGASVALENTYAVVGAPAAADSVGEAYVYIFNGLTWSFFQKLTCAPYAGTKGDRFGEVVKVSGSTIAISAPGYASNLGAVFVYKLVSGVFLSHEKIQAGDLSAGDRFGSAIALDMAVSTLVVGTERQATATGAVYVYYSRDVYFALQQKLQGSDTRVNDGFGHSVAVVRNVLLVGANANFGATTPLTTRKAVQSIVTSATSPIRAGSTFLVGFRQFSIGFENDYVMSTPIPFDASAVLLQVILQRTLNTGALVVTRLGPDANNGYTWYVTFAGSTAAVTRFAVDGTGLKGSNADVAASVLVAVPPIVRSNTYVFTRTGTFWREQATLRPTNKQYFSLFGHSVALSRNGYHAAVGAPNADTLFTGVNSGAGYVFDLGFLDFQLSASAYSVLEGGTISIPVQRCGPLGLTCTMKSTSVEGFIDLDTGDAVTDRAGTNNVPSKMLKYIGPYQQLAMLDMAAVTSGAKYYPGIWGPEPYPQVPMGRYLLPSWVGTAESRAQFYGSAETRSLWIDSQFDYQGHSDYTPTDVAMAFAVNSITSTALIQTTDDMVFEYPDETINVRLSVPGMWPSYPSQFWSQITILDNGDGGFGTKSYTAILLSSATAPVAHGTAVALLDAFNLAAVGEPGEVHPTTRVACGAVLIYLATSGIWALEATLRPPTCIAGSGFGTSVAIDGSYGTVRLVVGAPSALTPTVFVYVRNSATATWNLETAFTEPAAASTSANYGGSYAVDIFGYNIVVGASGLECTFVYTYTTTGWLPAVVLRANDYATDVVYLQNVVHEFEFGAAVSIGQRSIVVGAPRANYGTSRQLDTTFLGTGAAYVYYLPAQVQTITLNIDVLVTAGQFVLSLGGASTSRLNYAISDVDMTTAIQALIPSVQVTRAGTTETGFTWRVTILSEVTTVPLLVATWRGYGCSTCIAFNTGYTADPGRQVDVTSTAALGTWTFHQRLTAADGNRADRFGAAVDLDGDSIIIGAYGSFSLTTTTWDFETGDLTGWVQTGTAFGSQPTFGENVRARASGYLSSYLKSASGILNFEGRYWVGTYEARPGAGRTQQYTPFSCAFMNDDCKATGYTTPDSSIAGSAQGDGPMGTLTSQPFSILGSAIRFRIGGGCNLATVYVELLVDGLSVRKATGRCRESLHRVAWNVTAFTNRTGQIRIVDDTDSVNWGHINVDDFQFDWPVQQPSTEKAGAAYVFYRSTSTTSYGVCQGVPKLQCAWMLQARLVASDKRDHDMFGFSVGINDALGMAVIGAYGQSIVNLNNSIAGGDDAGSLYLFIKTPALLDGVGSIITPQRWPAFETAKLQAVNKAPNAQFGYALSQSNGRVAVGSPGMQRGIGTAYVLDTQFIQVSFASDEVAVNENDVNGQAIVVLYRAGDTSAPLTIEYGGFVKAMNKVTMLARYATSDLTGAGVDATRFAQCMAMPIQNRIRCGRYQQTSGVATFPVGGTSLAIAVPIMNDWCYAEGQTHVAFHLNPPGGDVILGEQFTLRIRIDDDDFGRTAC
>UniRef90_A0A1W1Y6B4 EAL domain, c-di-GMP-specific phosphodiesterase class I (Or its enzymatically inactive variant) n=1 Tax=Oscillospiraceae bacterium TaxID=2485925 RepID=A0A1W1Y6B4_9FIRM
MTPVGTTYLENYTPAADVLVVAVCVVFVILIRSAYINRTRSFRYLRHMIYMAVVASVSNLIFHGILPRAATLPNILIYLPHLLFHASLYSILWLQVQYLKETVRLTFRENRLYTVLSSSGLVALIVLEIVQPLFGFGFYMGADNTLHREIPAFIFGYVFFVLLMLSMLLKYREMIFRAILVGILSSVSISFLLMLIQEWVGETSYTVFTFLFPIYALLYLAHSNPYDLEIGAVDERAFTDLVAISYEHKDELYLMSLYMHDYDGKGQHYPEELQKMIKHFVYKFFKHPTLFLISGGHMILVVRTSSDPGYLEGAEKMIEEFMKLYSEYKIDYKIVYTKNDVRLAEDNDVVNFIKYLHFDMDENSISKPGDKEIEAYLRYKYIVSELVDINNKHDLNDPRVLVYCQPVLNIKTGKYDTAESLMRLDLPKTGLIYPDEFIYIAERLKYIYTLTQIILNKTCLKIKEMLENGYYIQRISVNFSVYDIREPDFCETVEKIIRDSGVPYDKVAIEITETQNERDFENIKKRIDELKESGVRFYLDDFGTGYSNFERIMELPFDIVKFDRSLVIASGSGNKYKSMVSNLAMMFDNGDYSVLYEGVENDEDEKRCIDMNAKYLQGFKYSKPIPIERLTEYLDKGHED
>UniRef90_A0A7W3YDD2 Molybdopterin-synthase adenylyltransferase MoeB n=1 Tax=Lysobacter penaei TaxID=2759900 RepID=A0A7W3YDD2_9GAMM
MEIERIPPAEALRRQRAGTVLVDVRASHERAAGAAEGALGIVRETLEADPTAALPDREAPVMLICQMGGRSLKAAEALRAAGYARVASVEGGTERWRDEGLPLVRDEANADFYERYSRHLRLPEVAEAGQRRLQAARIAMVGAGGLGSPAAFYLAAAGVGTLVLADDDMVDRSNLQRQILHTEARIGTAKVESARIALNALNPSTRVEAFPERITAANVERLLEGADLVIDGADNFPVRYLLNDACVKLGTPLVYGAVHRFEGQASVFDAGRHRGEAPCYRCLFPEPPPAEAAPNCAEAGVLGVLPGLVGLVQATEALKLLLGIGEPLRGRLLQVDALSMRFRETRLGADPDCPVCAPGRPFPGYIDYAAFCAGG
>UniRef90_A0A8H6JB52 AB hydrolase-1 domain-containing protein n=1 Tax=Colletotrichum sojae TaxID=2175907 RepID=A0A8H6JB52_9PEZI
MAATKAPRSLGIVLIHGGFHQSTCFALAKSRLEAAGFSPVLGVDLTSVGTNPSVTLDDDARSIQAAIEPHIDAGREFLALAHSYGAGKKGGIRAAIYLTANMPPKKGASALSVLPPGLDIVDVGDDGLVRANAKAKAAFYGPDMSDETADACMAALLPQSSAALFGGASVGLDELTVPAYYILCEKDQTIAPATQQEIIATIPTLRRVLRNPGGHSAFITEVDRFVEQVVEIAEEVEREGEVEA
>UniRef90_A0A4Q9GHY3 histidine kinase n=1 Tax=Hansschlegelia quercus TaxID=2528245 RepID=A0A4Q9GHY3_9HYPH
MTSEPRLRDGSTLRRHDGAVRPLSASERKIEEAAHEIRTPLGGLLALADLLLAEDLTDAARGHAEAMKDAARHLFGVATTLLGGAETGAASLGMSRFLDRTVPPIAARAAVQSLSFQLLRGPGVPERVTADESWLRQIIDNLADNALRATRSGGIELAVDCIGEDANSALVRFAIRDTGPGLGDDPKALFARYAQGDEPGAAGIGLSLVARLAHRMSGRLEAANRPEGGAEVAAVVRLATQSEPVRHAGAQLKILIAEDNIVNQRVVATILNQFGHDYDIVGDGEAAVAAASTGAYDLVLMDAAMPHLDGLRATRRIRSMDTPAADVRIVGVTARAFAHEIADFIAAGADAVVTKPISIAELWRVIGADVRKAG
>UniRef90_A0A429S8T5 PLP-dependent aminotransferase family protein n=2 Tax=unclassified Streptomyces TaxID=2593676 RepID=A0A429S8T5_9ACTN
MANGRVVHTADRTIGSRQLAALLPPPVLARPGYRALAEAIRTLILDGRVALHIRLPAERELAECLGAGRATVTGAYDLLRESGYARSRRGSGTFTELPDGHRPVGAHALLGAGGSGGFLPDGDPGIDLAIAAMGAPDGALAEALAQAAPRLPAAARTPGYLPFGLPDLRAAVAERFTRRGLPTRPEQILVTAGAQQALTLVVSLLCRAGDRVVTENPTYANALDALRHARLRTAPVAVTDAGWDLEIAESTLRQTVPRLAYVIPDFQNPTGALMPEDQRLALLAATRRTGTWLVVDETLADIALDVPAPAPLAALAARGGADHVVTIGSLSKTHWGGLRVGWVRATAKLVAELTAVRAATDMTGSVLDQLVALPLLDGLERTLPARLEQLRVQRAALIEALQRHTPEWSWTVPPGGLSLWVDLGEPVSSALAERAAAAGVHIGRGARFGVDPGTFEHRLRIPYTLPPERLDEGVRRLAAAFHDGVPLAPAVDRPHWVA
>UniRef90_UPI001F223AC7 type VII secretion system-associated protein n=1 Tax=Streptomyces sp. GQFP TaxID=2907545 RepID=UPI001F223AC7
MADFSHTDKQSIQTFIDGDLASFIGDLKKILAGDPSMKDFENGVYTDRTAGAIEKGKPIMMGRIDRNDLMTGTSFTDALSTSISTVVDVLTAQQDTFDEIDEGLRTTLHELFKTQGDNLGNISAEEFSTSMSDSGFDDSSSSGDSTGDNGSDSTDGESA
>UniRef90_A0A4S4FJ12 4-aminobutyrate--2-oxoglutarate transaminase n=1 Tax=Glaciibacter flavus TaxID=2565934 RepID=A0A4S4FJ12_9MICO
MTTIDAPARTVGGPDIVQERRLVTSIPGPLSRALMTRKTDAVAAGVGATLPVFAAAAGGGVVVDVDGNSLIDLGSGIAVTGVGNSHPRVVEAVKAQLDAFTHTCFTITPYESYVAVAEALNRLTPGDHLKRSALFNSGAEAVENAVKIARHHTGRQAVVAFDHAYHGRTNLTMGLTAKNQPYKNGFGPFAPEIYRAPLSYPFRDGGIDGVTAARTAILQIEKQIGAENLAALIIEPIQGEGGFIVPAAGFLPTLLEWSRANGVVFIADEVQSGFGRTGAWFASEHEGIVPDLVVTAKGIAGGLPLSAVTGRADIMDAAQVGGLGGTYGGNPLACVAALAAIESYASEGLIERAGDIGRLLIDRLTALQASDPRIGDVRGRGAMIAIELVDPETDAPDAALTARVASAAHAQGVIVLTCGTYGNVIRFLPPLTIGDDLLTEGLDVIAEALATA
>UniRef90_A0A7W5AC37 glutamate dehydrogenase n=5 Tax=Actinoplanes TaxID=1865 RepID=A0A7W5AC37_9ACTN
MAVADEAATDSDQTVLDDVPNAERLVAQAVEQAGDDHTTASLVGRFWRFAPDEELVGYTPQEMFAAAAEHRELARNRLPGELKLAITEPSGSQSHSVLRIVTDDMPFLVDSVIALLNAHNLQVYLTVHPLIVVRREPLGALAQLEAEVEPDDAIEGDLVESWIRIEIDPVRRPEAREQLLNEVRRVLTDVRDAVEDWPRMRQRALVISDELAAARGSKNPSPVPDKDLTDSIELLKWLANDHFTFLGYREYRLDDGVLSAVPGTGLGILRGASKPRRLAEEMAPEIYERAMEKRLLVITKANSRASVHRSAYLDYIGVKLFNEAGEVVGERRFLGLFSSSAYRTSVRELPVVRRKVQEVMDRSGLSPRGHSGKDLLQILETYPRDELFQIKTDDLYEAVIGVLRMAGRRQLRLFLRRDGYGRFISCLIYLPRDRFTTGNRLRMQEILLRELNGVGVDYTTRVTERMLARVHFIVRTDPAAPPGQLDPNELAERLADATRMWDDDFSLVLERKLGDEQARRLFQRYSAAYPESYKNTHTPYEGMQDLAKLELLEEPGQLAMHLFRRRRLGADGTPQPDERDVRFKVYRYGEPMMLSAVLPVLHSLGVRVTDERPYEIRRPDGTIYLYDFGLLPPAGHRELAEVRPQVENAFAAAWRGETEVDGFNELVLRAGLTWRQVVVLRAYAKYLRQAGNVFTQQYVESTFTAYPEIAGLLVRLFEVRFSPALPIGEAERTRRAGELRGRITELLDQVESLDQDRILRSYLTLIEATLRTSFYQRGAEGRPKSYVAFKLDPQAIPELPQPRPKFEIFVYSPRFEGVHLRFGAVARGGLRWSDRREDFRTEVLGLVKAQMVKNSVIVPVGAKGGFVLKQKPGDRDEAVECYKRFITALLDVTDNILSGKIVPPEDVVRHDGDDPYLVVAADKGTATFSDIANEISVRKDFWMGDAFASGGSAGYDHKKMGITARGAWESVKKHFRDLGTDTQSEDFTVVGVGDMSGDVFGNGMLLSQHIRLVAAFDHRHIFLDPDPDSSISYAERRRLFDLPRSSWADYDASLISEGGGVYPRSAKSIPVSPQVRAALGLGEASTISPAELMRAILKAPVDLLFNGGIGTYVKGAAESHAEVGDKGNDAIRINGSELRVKVVGEGGNLGLTQRGRIEFARAGGRVFTDFIDNSAGVDCSDHEVNIKILLGGAVVDGELSLPERDDLLAAMTGEVGELVLRDNYEQAMALGNARSQAHSLLPVHRRQLKSLEERGELNRELEALPSDLELAARYENGQGLTPPEFAVLLAYVKISLEREVLTDELVDEAWTTDVLSGYFPTPLRERFAGRMAGHRLRREIISTALVNEVVNRGGTSFVYRAMEESGASAADVIRAYVVVRDVFGLEEIWAAGEALDNRVPTSAQTLVFLETRRLLDRAVRWLVSTRRSPLDVPGEIAKLRPGISALLPLLPEVIVGAERRALFDRIAELVAKDVPEDLAAAVSRVFYGFGLLDVLETAAAIDRDAEEVAQVYFVLSERFGVDALLSHISRLPRGDRWQTLARMALRYDLYAALAALTAEVLHSTPSSAPPEDRVSEWEQVNAASIARASNAMGDVDDSPADLAALSVLLRQIRTLVKTSSAG
>UniRef90_A0A2E6Q8T7 Oxidoreductase n=1 Tax=Rhodospirillaceae bacterium TaxID=1898112 RepID=A0A2E6Q8T7_9PROT
MSVPLFTPIELGNVTLANRIVVSPMCQYSAVEGSATDWHLMHLGNYALSGAGLLIHEATAVVAEGRISHSCLGLYSDKNESALARVLEFCRGISDIPLGIQLAHAGRKGSCERPWEGRGPLSGENAWQTDAPSALAMADNWPTPNAVSIEEMKAIKAAFVTATERAIALDYDLIELHCAHGYLLHEFLSPLANAREDDYGGNLANRMRYPLEVFEAVRAAWPEGKPLGVRISATDFAEGGWEIADSVVLSDALKGLGCDYVTCSGGGVTFDQTIELEPGYQMPGAEAVKRETGMPVMAVGMIRDPKFANTAIADGKTDMVALARGFLYEPRWPWRAAYELGVDAAYPPQFERAAPSAWPEAFPDQSD
>UniRef90_A0A5F7ZVD1 Secreted protein n=1 Tax=Macaca mulatta TaxID=9544 RepID=A0A5F7ZVD1_MACMU
LPEAASLQSSHFYSVPCHNPTVHALCPNIHFLFFLFLLRLSFALVAQAGVQWHDLGSPQPPPPGFKRFSCLSRLSSWNYRHAPLHTPNFVFLVETGGFSMLVRLSRNSHVRRVGRSLFTDEEGNCSSESMTVWLR
>UniRef90_A0A5B9Q9U5 Glyco_hyd_65N_2 domain-containing protein n=1 Tax=Bythopirellula goksoeyrii TaxID=1400387 RepID=A0A5B9Q9U5_9BACT
MKIHLWEIVLFLLAISVANSVARESESELVWFDRPATHFTESSPLGNGRLGAMIYGGTIDETVVLNESGMWSGSTQEADRLGAAEFLPEIRRLLFLGKNVAAEKLMNEEFTCTGQGSGHGSAAELPYGSYQTLCKLQIKFLQNETAPSVQNYRRELDLHDAVVRIEYSRNGVDYLREAFVSFPDQVFLYRFTANKKNSLSFDVSLSRSERSNTKNVGKDELQIEGQLDDGKEGETGVGFCSRVRVLHDGGMVTTQDGTLKVRSANSVVLLVSAATDLEALVSQVDEDIYKATEVVLDRAAAKPFADLLKDHISDYQNYYNRVGLRLAPTRIDSRSKLPTEERLHANWRDTQDNSLAALYFNFGRYLLISSSRPGGRPANLQGIWASEIQTPWNGDWHANINVQMNYWPAEVCNLAELHEPLFRLIESLVEPGSQTAQIYYNARGWVSHVLANPWGFTSPAERVSWGSTNTCSAWLCQHLWEHYLFTQDREFLLSVYPIMKEAAQFYLDTLVEHPTQEWFVTAPSTSPENRFLLPNGEEASICIGATMDMQILRSFLYACREAANELDCDEVFRTQLSDVIGRLAPTRIASDGRIMEWDQEYPEKDPEHRHVSHLWGLYPGDEISNSQTPELAAAARKSLNVRGDSGTGWGLANKIAMWARLHDGDRAHRLLQQHLHPVTHGQRKQQWSGGTYPNLFDAHPPFQIDGNFGATAAIAEMLVQSSISDIDNIKHVNIELLPALPTAWPEGEVRGLCTRGGFEIALNWKDGKLGDVEIHSRHGLPLQLRYKSQEVTLTPARGEKVHFDGDLKLLSTPKSAVVPPSGSNK
>UniRef90_A0A417XX54 SCP_3 domain-containing protein n=1 Tax=Nocardioides immobilis TaxID=2049295 RepID=A0A417XX54_9ACTN
MPSRLRPADPVDVSRALAGVSGGTADRAELRLLTKHFLALLEERAPGRSVEVRVPPFAAVQVIEGVRHTRGTPPAVIETDAETWVALATGELAWADALASGRAQASGERTDLSPYLPLG
>UniRef90_A0A512JR32 Fusaric acid transporter n=1 Tax=Methylobacterium gnaphalii TaxID=1010610 RepID=A0A512JR32_9HYPH
MTLPGWRDWVFAIKTFGAAILAMYLAMWIDLPRPYWALGTVFITSQVLAGATRSKAIYRVCGTLLGAVVSVILVPNLANAPELLTIAIALWVAVCLYFSLLDRTPRSYLMMLGGYTAALIGFPAVGDPGTMFDTAVARAEEITLGILCASLANTVVLPQSVAPLIAGRLDHWLTDARGWIVSVLSHTSNAGDTQSKRLKLASDAIAFDALATPLRYDMSGAERSAEAMATLRQHMLMFLPIVSALSDRIEVMRRAGTMPSRLETLLDDVAAWLAAGRIDEIEAQGLRSRADALCPPMSQQASWTDLVLASLLARLNNFIDLRQDARLLQRHILDGTLTTERLAFSYTAAARTIRHRDHGMALLSAIGVFLSVLLSCTIWIATGWPDGAGAPMMAAVGCCFFAAQDDPAPSIVGFANSAIIGGIASAIYLFAVLPLATNFEMLTLALAPALLTCGVFMTQPKTAPIAMGAAVNGSAMIALQGSYTGDFAAFANSSIAVIAGMWVAALVTRLVRSVGAGWAAHRLRSVNRRSLAQAAERQGAQNGLELAAIMLDRVGLIAPRLTSLPPGDAEWTADLLAEVRVGINVVELRRNRRALSNEARKAVEALLAALARHFHAKALIPPTGLLADIDAALDAVIADRLHAARGVALMGLVGVRRALFPEAPDYKARRTATSEPGWAA
>UniRef90_A0A3D3L9U4 Heat-shock protein Hsp20 n=2 Tax=Verrucomicrobiales bacterium TaxID=2026801 RepID=A0A3D3L9U4_9BACT
MKITRFNPSLNLGRVADFDQWLRNPFAAFPLMGQLLGDFAPAFTSGRPATDVHEDKDNYYACFELPGVKKEDLKVEIHDRLLNVSAERKEKNGEQESSLTLCRSISVPEGVNAEGISARLEDGILVVTLPKQEHRKPKLIEIA
>UniRef90_M4NI99 Dipeptidyl aminopeptidase/acylaminoacyl peptidase n=11 Tax=Rhodanobacteraceae TaxID=1775411 RepID=M4NI99_9GAMM
MSSKTGSSRVLGALVMGALSAGVAAQARTLSADDYARAERFMSYNTVPLVDHAVPKVEWLDDGHFWYVDHDAAGDHFVRMDAASGKTAPLFDQAKLAVALGKAGGKPVDAKKLPVTGYEARPDGRVDIAVRGKHYVCDLAAVEASCVDRTALVKTGKEPGALSPDKQSEAFIRDWNLWLRDVASGKETQLTTDGVENFGYATDNAGWKHTDNAIVEWSPDSKRIATFQQDQRKTGEMYLVSTNLGHPKLEQWKYPLVGDKDVTMIERVIVDVAAKKVLRLQMPPDQHRSTLCDDVSCGPDGGWDDVKWAADGKTLAFVSTSRDHRHEWFRIADANTGKVRTVFEEVVPTYYESGNGAVNWRYLPETNEAIWFSERNNWGNLYLYDLTSGKLKRAITKGEGNVTELLKVDPKTRTVWFRGVGRTAGVNPYYQQFFKVSLDGGKPVLLTPEAADHTVTLSPDGRAFVDAYSTPTTPPVIVLRASDDGRKVASVATADIARLKAAGWVPPIPFTVKGRDGKTDLYGMMFKPTHFDPSKKYPIIDYIYPGPQTGSVRGRSFSAARADHQAMAELGFIVVAIDGMGTPWRSKAFHDAYFEHVEDNTLPDQVAGLKELGKQYPWIDLDRVGIWGHSGGGNATAAAMFHYPDFFKVGWAESGNHDNRNYEDDWAEKWQGLLVTNKDGKTNYDAQANQSFAKNLKGRLMLVHGTMDDNVPPYQTLLVADALIKANKDFDLLLIPNVHHGYAEATPYATRRRWDYFVQYLAGNTPPHEYQLKAWPWR
>UniRef90_A0A1B7P3P8 UDP-N-acetylglucosamine transferase subunit ALG13 (Fragment) n=1 Tax=Emergomyces africanus TaxID=1955775 RepID=A0A1B7P3P8_9EURO
MDSSKRARKLCFVTVGATAPFNALVLEVLGEPFLEALRINNYTDLRIQHGQMGESTFQEFKLQNGTMAKEKYGLDITGFDFNLAGLKNEMLDVKADVDANKAEGFIVSHAGSGTILEVLRLGIPLMVVPNPQLLHNHQDELAKQLAVSGYVIHGKL
>UniRef90_A0A2T5J629 Type I site-specific deoxyribonuclease n=1 Tax=Mucilaginibacter yixingensis TaxID=1295612 RepID=A0A2T5J629_9SPHI
MNEHEFQTYVAQIIGQLFPTLQEGQIEQEHAFSLKFGHHAVVIDGKEPGKYAKSAIYDILLKFQGKPFALLELKKPGNGIEPEDIRQGVSYARLTQPICPLTILTDGTTTQLINTFDGEPFKEEAMDIQFIENLFRQGLLLSANSLKNAISTLLEADHRVIFDVINTISHNAFEQLRGDPEDISKPIMRDFKVARSAERKIWDQLEKTPGVFLTGEPFVGKTNLLYQLFETAKNAGQALLYINAADQNYNIFRRLSNFITMRMRYPVTEERVKEWLLLSSNRSPQDRLVVVYDHFRHDTDEHLKADIAELFDVFEADNNRVILATDNANYDLLTTTAGRTTTNFYRERFARIRLKTFSSKEFELANQLLYDRYGGMVLPGGIFAGEYRNPRVWRLIAKAIRAERTQATALGIIEAVPSFQFLQLISNHWHFDAQTRQDFKALSVAFMESMPLRNEQGDLKLMALNLPVIAEQELKKHLENEVIERLKLAGLLERRLLPDDRWVFLPKLPELIAKNAGEHLKARFQPLLLADFHQHYPEFLEAYQYLPFGEIIAAQTIVHWGYQQELDLFSAFIRKLQSDKPEIETATGGGLVRLYLPEKGHITLPIEPGEEQKYIGNLFPYLILSHLVTLQFVDDSQHPDMERARCIAAVGQTNFQVRSLNVNTFYEPMPTNHEVGNIGNITHSGIGIVEPIVQAMQANIIQSPQVIDILFRHALEKKYYRLLHRIYIAARYSDGLGSPESDALCESIQARYMDHFNKMMAFAIADKGATRSERRKIEKGLRKRDRKQKK
>UniRef90_A0A841IL00 Beta-N-acetylhexosaminidase n=1 Tax=Nocardiopsis algeriensis TaxID=1478215 RepID=A0A841IL00_9ACTN
MRLPAPYALACVGLALSTAACTLLGEVNPSEEDGGSPTEESFEPVLAPRLLEEMDLGDKIGQLMVLTAQGTTAAENAALIETYRPGGLIYFDANLTGAEQIASLSAGVQEIAAEQGAGVPLFLGIDQEQGLVARLPVGTSFPDAMAVGATGDTGQAVLRATTTAAELNALGINLNYAPVADVNTDPDNPVIGIRSFGSDPALVSEMAVAEAGAYAEAGIVPVVKHFPGHGDTDVDSHTGLPVIDMPRDEWEAEHLPPFRAAVDAGVDAVMTAHVIMPQLDAGTDPATLSPAIIDGILRGELGYDGVVTTDALNMEGVRQDHTDGEIAVRALEAGVDQLLMLPDPAAAVAAITEAVEQDRLTEERIDESVLRVLVLKERRGVLEADPVDPAAAEAALSDPAHAEAAQTVADASATLVRNESGLLPLAAGARVRVEGTGADRLAGALAEAGLEVVTEGADAVVVGTNGARGSAEQSAPVEAARAQGLPVVVVAQGGPYDLEAFPGVEGFIAVYSSVDVSLAAAAGVVAGEVEPTGTLPVDIPGADVAAGTGLGF
>UniRef90_A0A5C6Q7Q0 OmpA family protein n=1 Tax=Colwellia sp. C1TZA3 TaxID=2508879 RepID=A0A5C6Q7Q0_9GAMM
MNYIMTILLTLAISGCSIQIQEMTPEPTVQKADLADIEADGIINARDQCQDSFVGASVANNGCGSDRIEELKHKLQVNFIPNSYTVEWRFLSEIKKLAEFMKDNPRAKLTIEGHTSKRGTKVLNQILSQNRAQAIQNILVNKFMVEQARITAIGYGFDRLLLAGDDEYIHARNRRIVAKLSREKLLTDMKWTIYSVDQAEE
>UniRef90_M3I5W0 Oxidoreductase, short chain dehydrogenase/reductase family protein n=2 Tax=Leptospira interrogans TaxID=173 RepID=M3I5W0_LEPIR
MASFNSSGKMNAFVIKHDVTNFDQVETVFQKAIKSMKGLDEIYYASGVMHNIKPDEFDVEKDISMLNTNLLGCVAWLNPAANLFQKQKSGKIIGISSIAGDRGRRGNPVYNTSKAGMNTYLEALRNRLSVLGVQVLTVKPGFIDTAMTKGMKGLFWLISAKEAAEIILKAADSGKENIYVPARWGLVGLIIRCIPSFIFRRLSI
>UniRef90_A0A3E0HEB5 Serine/threonine protein phosphatase PrpC n=1 Tax=Kutzneria buriramensis TaxID=1045776 RepID=A0A3E0HEB5_9PSEU
MSTAHDLTYGRRAAVATRRGVRDHNMDAPALFQASTGVVVAAVVDGIGNDPDGAATMHLIAETAVRIGATKGALAGVLAGAALVEDPGVENHMPDGVIVLALAVPGRPTHLAWVGDSHAYSWDGDTLSRRTDPHTMGAYLRGNGAVDLAPLHDSWVRVTLTSATVTNVAVSSIPANELVVLVSDGLDTLPHDELEALVREHQDNPDTLADAIVAAARETEDGYRDDATAIVLTTAG
>UniRef90_A0A6A5YPJ8 TauD domain-containing protein n=1 Tax=Lophiotrema nucula TaxID=690887 RepID=A0A6A5YPJ8_9PLEO
MAPIALPIVESIKETDTVQPKKDSLALPEPARKRLEDAGIDLSSGYPYRPAKPLYLDDVYNIRNEEREFVDAGSRADPEKKALLSAAKEVIHLTGHIGTEIVGLQLKDLTDQQKDELALLIAERSVVFFRDQDITPQQQKALGEYYGEIEIHVRIQPQVPSVPGVPGTTVIWPALQATEFAASFRQTGGASRWHTDLVHERQPAGITHLHNDTIPSLGGDTLWASGYSAYEKLSPDFRKIIDGKEAVYRSAHPYLDRKNPTAGPKFIERTHPLVRVHPATGWKALWVNRAMTVRIVGLDKAESDLILGYLYDVYERNVDIQVRFKWTQGTSALWDNRITIHNASWDYEGKEPRHGTRVTSLAEKPYFKADAPTRRQALGLAGPGDI
>UniRef90_A0A285NT28 Acetoin utilization deacetylase AcuC n=1 Tax=Natronoarchaeum philippinense TaxID=558529 RepID=A0A285NT28_NATPI
MRFGYSETCLDHDTGDRHPETPDRLRAIKEGLKRKHGVEYVEADSADVETVAAIHDREYVEEVREFCADGGGNWDPDTVAVEGTWDAVLQSAGLSAWAAERAMDGDSGRETPFALGRPPGHHAVVDDAMGFCFVNNVAVAAQHALDDTAAESVAIVDWDVHHGNGTQDIFYERDDVLFCSTHEEGIYPGTGGSGETGTGDGEGTTLNLPMPAGAGDADFAAAFERVVEPAVESFDPDLLLVSAGFDAHRHDPISRLRVSTDGYGVLTGRLRDLADETDTALGFVLEGGYGLDVLAEGVAMVHEVFDGLDPVQPDDDVDDDVEELLTGLRSRHPLLVGN
>UniRef90_A0A1A8J6Y5 Ectonucleoside triphosphate diphosphohydrolase 5b (Fragment) n=1 Tax=Nothobranchius kuhntae TaxID=321403 RepID=A0A1A8J6Y5_NOTKU
MKPTVLLLLLVLLAVSGPSRAQVRSSHLDLPRILPSLSRPANHSRIFYAVMFDAGSTGTRIHVYTFIQNGSEKLPVLDNEMFHSTKPGLSAYADSPETAGETVRRLLKVAKKAVPRLDWKRTPLVLMATAGLRLLPVEKAQALLDQVKGFTRHCRDPRWGCFYK
>UniRef90_UPI000DD31245 peptidylprolyl isomerase n=1 Tax=Paraliobacillus TaxID=200903 RepID=UPI000DD31245
MKKLAIAATIAAGMITLSACSSDDSETVVETASGNITQEAFYEELKELSGSTVLEQMVTQTILEDNYEVDEDQLDEQLQVYKDQYGDQWETILTSSGYADEEAFREDLKLQLLQQEALIEDIEVTDEEIEQRYERMQTEIEASHILVADEETAIDIKAQLDDGADFATLAEENSTDTASAAEGGSLGYFTAGDMVAEFEEAAYSMEVDAISDPVETTNGWHIIQVTDKRDAEEAPEPLEDIRDDIRDEIALTKVDDTAAQEKLDQLMEDADIDVKIEEFEDLFTAEEETATE
>UniRef90_A0A6P0X9G7 AI-2E family transporter n=1 Tax=Okeania sp. SIO2D1 TaxID=2607792 RepID=A0A6P0X9G7_9CYAN
MQQILNQLKKWGEKYLHFDLISLFLIGYATAIILSIDNYIIRILTFFPLLLLLLVDLVILLFAPEKLREIYSKTTLFICTLTAALLLVWII
>UniRef90_UPI001B3ACF38 ribonuclease P protein subunit p14 isoform X1 n=1 Tax=Toxotes jaculatrix TaxID=941984 RepID=UPI001B3ACF38
MSFIWRSVFNKPRLCLSSIAAALPPCRLLHVGQRASLTKAFSSHDVELFAKLTGDNNPLHLDPVYASSTSFEAPIVHGVLINGLISAVLGTKMPGPGCVFLHQEIRFPGPLYVGEEVLAEAEVLKIKMSFALITVKCSVKDKVVMEGEVMVMMPEDQQKRG
>UniRef90_A0A1M7FK69 Uncharacterized protein n=2 Tax=Flavobacterium TaxID=237 RepID=A0A1M7FK69_9FLAO
MNTYADNNKENKKQQTPSAIHKKDNRDTALPVTDSHLSSVAAQLQLQEIANNSPQVKQAFQLQAIANAHAALPIQKKDLITTQSVFQLQKLERGKLNVVGEHHSESNQRRGQEIDIAEREVGGEYWTENNFRIRETKSPGENAVRDTTGDPRILGDALYLRIVESIQYVYEAKNNFEKEWKHWTTQNLNKEELPILKGELQPLLVICKNHTLEANKLAKAYMYNEEFKTLPEFVSDQIVQMYKLLPETEKLFLILVETWKSYTLEQLILKKFLSSFNVFGSNIDILNIYAAQIGGASRTDTSKLRSYEMDNAADFAHDRIGVWKIGFDHVKDIKEDMQHNDTKNYILINREEFNHEYKELPILVEDQMVKQK
>UniRef90_UPI001FB4782B PTS system mannose/fructose/sorbose family transporter subunit IID n=1 Tax=Coprobacillus cateniformis TaxID=100884 RepID=UPI001FB4782B
MGALIPSVVNAKFAYTFTQGEVSIAVQELADKIMPSLAPCLVVLLTYWLLGRKKMNSTRVTLLLVVLGILAFNLMIFA
>UniRef90_A0A2T6FJL9 tRNA (guanine-N(7)-)-methyltransferase n=4 Tax=Cellvibrio TaxID=10 RepID=A0A2T6FJL9_9GAMM
MKPEFKPKSIRSFVIRAGRITVGQKNAFDKYWPGMGLSLFNGAINPDVVFGRQAPLVIEIGFGMGDSLLEMAANEPDKNFIGIEVHPPGVGRLISTASQQGLSNLRVYMADAMDVLEDCIPDGSIDRLQLYFPDPWHKKKHHKRRIVQPAFIQKLRPKLKMDGVLHMATDWQPYAEHMLEVMNSATGFATDFTETGFAPRPDYRPVTKFEKRGERLGHGVWDLLFKKTA
>UniRef90_UPI0012F6EEC0 DUF927 domain-containing protein n=1 Tax=Methylobacterium sp. WSM2598 TaxID=398261 RepID=UPI0012F6EEC0
MSEALFATEMQRLDEAGVEEPSEVRANQERHGGIRWPKGFRMRADGLWYEPEGDEEAMRVSGPFRVPGLARDPAGSGWAVTIEWKDRDDRPHRGFVSYADLVGDGVDWLRPLAAAGLPVTIGTKALRLLKRALYELECTARVRLIRRSGWYRGAFVLPERTIGSAPGEEAVFEGRLDAARYASAGTLEQWVDAVAAPAAGNSRLLLALAVAFAGPVADLLEDEGGGVNLKGASSVGKSTLLVAAGSVWGGGARAGFTQTWRATGNGLEGVAKAHSGTVLILDELGELEAREAGSTAYLLVNGLGKARATRDAELRARHEWRVMLLSAGEVGLADKITEGGKRARAGQLVRLVDVTADAGRGLGIFDDTKGMEPAPFSNMIKSAALKVYGTAGVGFVSGLANDPDRYAAAARRRIAEVSRNLLVGLPEADGQATRAAHRFALIAVAGEMARAVLNLPWAEGEVDGAIKTCFDAWRATRGGDGPGELVAALEAIRSAIERHGEARFRNLDQHDGGAAPIRELLGYRQSRDGDVIYAFTATGWAETLAGTADPKSIVKMLFERGVLFAGRDRTHRHFVKFHGQPIGTYAVRASAVLDTEAA
>UniRef90_A0A7Y9LCB2 DUF2264 domain-containing protein n=2 Tax=Microlunatus parietis TaxID=682979 RepID=A0A7Y9LCB2_9ACTN
MSKPGESWTRDDLVQFTDRSLLALRRWATPGRARFDLPGPRVGSGPERDGLEAFARSFLAVGFRLSAAEIDSHDHAGWYAAGLAAGTDPESPEFWPSLRELPQARVEAAAIAIALHESRRWIWDALTPAVKQRVIDWLSGSVGIAYPDNNWRWFQNVTQAFLRSVGGPYDQAELDENLTFLDDCYLGDGWYSDGRPDRRTGNVDWYVGWVMHLFSLWYCRMSEGEPGIAELQARYAERLRPYLTDAADLFGADGAPLHQGRSLVYRHAVVGALWTGAVFDANPLPLGRLRRTALGAIRFFAERGAFDEDGLLSLGWLGRFEPMRQPYSGPGSPYWASLGLAGLVLPESHPVWAEPEQPTPIETGDVVRPIRPIGWLVSGTADDGIVRVINHGVDHSTATPAPENPYYNRYGYSSVTGPVPAPAGTADGAVDQQVALIDPDGRWSQRPMIERVAVDDHRASSRQRARFARTEPEQGFDDGPELTCVSLVRGSVEVRAVRFDDHDQASAALVISGYAVPRKPAEGARTGLHSAVTALTEGGSSGSSVHPVANAFGADLEVPWCRFEHPEPGRWYVIALCLGEREPAWPTLADTPSGPVITWPDGTTDPL
>UniRef90_A0A0S6VXT7 FGE-sulfatase domain-containing protein n=1 Tax=Candidatus Moduliflexus flocculans TaxID=1499966 RepID=A0A0S6VXT7_9BACT
MSNTTQTRIREKIIMIGISLFILISLGITWFVLYAIIAIKRQNAHRSAILEGLGFSPVANPPAAFVEYITTLHHHVKTSKPRLKLDHVFQQRIGNADVYLFELIDNGSEHSKHYEVVAYVSPSLRLPRFLLNPVLPTKEAKPDENSAIFKVLNSMFRYNHKVEFPDVPEFEERYTLSITDEQDDSEIQNTFTPPVTAGLLNSPSQYSMLGWGDTITERSRLKITTKTTIEEAKAMLEDILSLFLLFENQGASSTVNVRALDSSLSRNLAGKNEIPAALKTFEKSVKIIAALFAISFLLTGASFIFKAVSFQKEQAASQEEAVHEMPAPPIATPTPAPELPPKLPELTGFACAETNGHLECVEPLTGMILVNIPVAQSDMCGAKTEYWLGKYEVTQEEWEKLMGTNPSFFNRSKLGDGYKRHPVEQVSWDDAQAFLQVLNSRYKDKGVKFDVPSTAQYQRGCQAGMNAEWPYGTRDATQLDAYAYHNGNALGSSHIVGEKAGNAFGLYDIIGNIYEWSRDTNFTLKMTDGNAEFIPDKDGRKDLLGGSWKTDPDSQRCTMIPAELPAARRNDVGFRVAVEPVAP
>UniRef90_A0A7Y4V1B9 Transposase n=4 Tax=Mycobacteriaceae TaxID=1762 RepID=A0A7Y4V1B9_MYCFO
MQRPIEPAQYLSLAYTDRLIELGIAPSVGSRGDSYDNALAEAVNAAYKTELINRGKPWRGVDDVELATAEWMAWYNQERLHEALGYVPPAEYEAALKGASHPASQPTPALVPN
>UniRef90_UPI001490A0B5 MlaD family protein n=1 Tax=Muricauda amphidinii TaxID=2735167 RepID=UPI001490A0B5
MKLTREVKTGIIVLAGIVALIFGLNYLKSSPFFENNKTFYAVYSHVGGLQPGTQVSINGLNVGNVQSIRFLDSSGKLVVTFTVGKDFDFSKNSVAELYDTGIIGGKGIQINPVFDKAPNAQSGDTLTSNIKPGITELVQQKLTPLQMKVEGAVSHADTLLMNVNEILDEPTKRDLKLAIGTLNEVVTSFKGSADKLNLLLENNKEQLDSSLKNVDNITSNFSKLSDSLANAGLAQTVSDFQTTVESLNTILSKIEKGEGTLGKLTHDEELYNNLSEVSRELDLLLQDFRLNPKRYVNVSVFGKKQKDYELPENDPAQKQD
>UniRef90_UPI001BCFD6CE universal stress protein n=2 Tax=Roseibium polysiphoniae TaxID=2571221 RepID=UPI001BCFD6CE
MSFKTILAVAEFTEDVKSRLKSAVDLARTQDAHLAVLLVGEVPSLPFYGYGGAGYTKVWMEEGEERAAALKAVQEDVEAALAKEGISFDVRAHQAIVAREDNLVARHAIYSDLALILRSGDGELNTVERQAIDGALFDSGRPLLFLPKPDVPQTVGQNILVAWNSRAEAAEALSDAMPFLVGAGKVTLLLVDPVSGPDDHGESPGADMALVLARHDVEVEVRQVSSNGSSIAEVLNREAKTLGADLIVMGAYGHSRMRQTILGGTTREMLEETACPLFLAH
>UniRef90_A0A6B0S860 PAN2-PAN3 deadenylation complex catalytic subunit PAN2 n=2 Tax=Bovinae TaxID=27592 RepID=A0A6B0S860_9CETA
MNFEGLDPGLAEYAPAMHSALDPVLDAHLNPSLLQNVELDPEGVALEALPVQESVHIMEGVYSELHSVVAEVGVPVSVSHFDLHEEMLWVGSHGGHATSFFGPTLERYSSFQVNGSDDIRQIQSLENGILFLTKNNLKYMARGGLIIFDYLLDESEDMHSLLLTDSSTLLIGGLQNHILEIDLNTVQETQKYTVETPGVTIMRQTNRFFFCGHTSGKVSLRDLRTFKVEHEFDAFSGSLSDFDVHGNLLATCGFSSRLTGLACDRFLKVYDLRMMRAITPLQVHVDPAFLRFIPTYTSRLAIISQSGQCQFCEPTGLANPADIFHVNPVGPLLMTFDVSASKQALAFGDSEGCVHLWTDSPEPSFNPYSRETEFALPCLVDSLPPLDWSQDLLPLSLIPVPLTTDTLLSDWPAANSAPAPRLRAPPVDAEILRTMKKVGFIGYAPNPRTRLRNQIPYRLKESDSEFDSFSQVTESPIGREEEPHLHMVSKKYRKVTIKYSKLGLEDFDFKHYNKTLFAGLEPHIPNAYCNCMIQVLYFLEPVRCLIQNHLCQKEFCLACELGFLFHMLDLSRGDPCQGSNFLRAFRTIPEASALGLILADSDEASGKGNLARLIQRWNRFILTQLHQDLQELEVPQAYRGAGGSSFCSSGDSVIGQLFSCEMENCSLCRCGSETVRASSTLLFTLSYPEGSNSDKTGKNCDFAQVLKRSICLEQNTQAWCDNCEKYQPTIQTRNIRHLPDILVINCEVNSLKEADFWRMQAEVAFKMAIKKHSGEISKNKEFALADWKELGSPEGILMCPSIEELKNVWLPFSIQMKMTKNKGLDVCNWTDGDEMQWGPARAEEEHGVYVYDLMATVVHILDSRTGGSLVAHIKVGETYHQRKEGVTHQQWYLFNDFLIEPIDKHEAVQFDMNWKVPAILYYIKRNLNSKYNLNIKNPIEASVLLAEASLARKQRKTHTTFIPLMLNEMPQVGDLVGLDAEFVTLNEEEAELRSDGTKSTIKPSQMSVARITCVRGQGPNEGIPFIDDYISTQEQVVDYLTQYSGIKPGDLDAKISSKHLTTLKSTYLKLRFLIDIGVKFVGHGLQKDFRVINLMVPKDQVLDTVYLFHMPRKRMISLRFLAWYFLDLKIQGETHDSIEDARTALQLYRKYLELSKNGTEPESFHKVLKSLYEKGRKMDWKVPEPEGQTSPKTCRALVDELEWEIAQVDPKKTIQMGSFRINPDGSQSVVEVPYARSEAHLTELLEEVCDRMKEYGEQIDPSTHRKNYVRVVGRNGKSSELDLQGIRIDSDISGTLKFACESIVEEYEDELIEFFSREADNVKDKLCSKRTDPRVRPPWLYSLRPPGYSELRRTPARLKGALRLAGRLLRLELPGLCAFRPTAGENLKDILADLIPKEQTRVKAFRQQHGKTVVGQITVDMMYGGMRGMKGLVYETSVLDPDEGIRFRGYSIPECQKLLPKAKGGEEPLPEGLFWLLVTGQIPTEEQVSWLSQEWAKRAALPSHVVTMLDNFPTNLHPMSQLSAAVTALNSESTFARAYSEGINRTKYWELIYEDSMDLIAKLPCVAAKIYRNLYREGSSIGAIDPKLDWSHNFTNMLGYTDAQFTELMRLYLTIHSDHEGGNVSAHTSHLVGSALSDPYLSFAAAMNGLAGPLHGLANQEVLVWLTQLQKEVGKDVSDEKLRDYIWNTLNSGRVVPGYGHAVLRKTDPRYTCQREFALKHLPQDPMFKLVAQLYKIVPNILLEQGKAKNPWPNVDAHSGVLLQYYGMTEMNYYTVLFGVSRALGVLAQLIWSRALGFPLERPKSMSTDGLMKFVDSKSG
>UniRef90_A0A8C0HHE9 G protein-coupled receptor 158 n=1 Tax=Buteo japonicus TaxID=224669 RepID=A0A8C0HHE9_9AVES
MPHKRKLPIPTQTSRPPPNASLLPPGTARPLRRANCSGRYELASLAGKSRFTSHPTLHGALDTLTHATNFLNMILQSNKSREQNLQEDLEWYRALIRSLLEGDPNISRAAITFSTEPFSSTPQVFLQASRHESQVLLQDLSSSAHRLANASVETEWFHSLKRKWRPHLHRKVLNTGPKTLENSWKRRESFTADKNHIRWSSPYLECENGNYKPGWLVTLSAAFYGLRANLLPEFRGVVKVDINLQKVDIDQCSSEGWFSGTHRCHLNNSECMPIKGLGFVLGAYKCICKAGFYHPNIFSVDSFQRKDAENRFSGGELSEEVYTCLPCREGCSYCTDDTPCYAQEDKYLRLAIISFQTLCMLLDFISMLVVYHFRKAKSIRASGLVLLETILFGSLLLYFPVVILYFEPSVFRCVLLRWVRLLGFATVYGTVTLKLHRVLKVFLSRTAQRIPYMTGGRVMRMLAVILLIVFWFLVGWTSAITQNLERNIPLIGQGQTSDHLIFNMCLIDRWDYMMAVAEFLFLLWGVYLCYAVRTVPSAFHEPRYMAVAVHNELIISAIFHTIRQVIYSKVSLMPFLEQWVMHSSGCLLDQTCSVHTSFAIHFALQDELKKLYAQLEIYKRKKMIANNPHLQKKRCSKKGLGRSIMRRITEIPETVTRQCSRDEKDLMEHSAVKNMATLRKNPQDSTSSAKPKEETLKNRVFSLKKSHSTYDHVRDQTEEPNSLTTESTEVIATENSLLDSLNGNKLTKNAPEKVEAVSTESVPLVCKSVSAHNLSADKKPLHPRTSVLQKSLSVIASAKEKTLGLTGKTQSLEESTKSHKSQQKGKEASKKHSASDKGEHKDSHRKNSTHSEETKKTHKSGIMKQQRVSQTPANPDTGPGKSLHKDNFNIGEVCPWEIYNQTPGPVPSDSKVQKHVSIASSEPEKNHPSQPKVKTHHKLKTPEGYQQSNQKSPEKVEAPTRETQEQQVFENEKKQSNSKSQVSPGLKCENVNRYTPNTCAGEREELPQKAPEKENLNKLAEQKKNASCEGNVLSSDSHKPSSYLQQPLASRAEVCPWEYDTPDLPNAERSVALSNTSAISANKTATPRK
>UniRef90_A0A2T6DUT4 Endoribonuclease L-PSP n=1 Tax=Opitutaceae bacterium EW11 TaxID=2161865 RepID=A0A2T6DUT4_9BACT
MDLTTPSPQPFLRSAQSLAEDLESEIYATPESEARSSWTHRGCRVEVRASERDSFAEFHVTGLVECAGSAAELAEIVLEEVASVLASRRIQPIQEKLYGLTAIRGEVMKRRETAYRRRRLDPSVPTTWIQGLPLLGCDFVGIQIWGVAPYGGETCVTTVENPSTGAGRLWKGRGFRMLHLPCVRGIQHDGKLAAGPASQADWMFTNAEQGLAAHGFSYSQVVRTWIYVDRLLDWYGDLNCVRTAHYRRLGFGTTGGPAFPASTGIQGRFEEEECLVDVLALETDGRHATAAPVTRSPRQDQSFNYGSAFSRGMTLDVEGRRTIHISGTASINTAGDSTHLGDAEMQSLETLMSIAAILQEQGGTLENITSATLFCKTREAWEAWRRVSQLLRLPAFPKVCVLADVCRDNLLVEMEAVAVI
>UniRef90_A0A8S9K9L2 Transcription termination factor MTEF18, mitochondrial n=1 Tax=Brassica cretica TaxID=69181 RepID=A0A8S9K9L2_BRACR
LEAACALSGFGFPWNKLGRLYREERSVFLQSGDEIGSLLGRLSGVGFSTVAVAGVCLAFPSVLRGGVEIGCLFVKVKRLFEEFGSEDVVEENVESWYAFGRKIRVFYDLGFESEEMWELMGRNRSLFIECSEEALMRKTDYFCRFGVGKEEAALLILRNPDVMSFDLEKPVISVKGVLKHFGLSEDEVDALSLKHPHVFGRNRMKNLPHVVRALGLHERIFDKLKNGTYHLLSSYSLMKPDEDIDREYQRGLEEIQNLRCKTHSFQKLDFLHQIGFAENGLTMKTLQHVHGTAVEIQERFQVLLDSGIDFSKACMLIRSSPKSLNQKPHSIQEKIRFLCEEMGDSLEYLEVYPAYLCFDLENRISPRFRFHKWLVEKGLSEKNYSIASIVATSEKAFIARLYGIHPAIPKHYFERFSYRKDRTTVS
>UniRef90_UPI000836FEF3 nuclear transport factor 2 family protein n=1 Tax=Rhodococcus phenolicus TaxID=263849 RepID=UPI000836FEF3
MTTTPAESTGEAGIAERITRLEDLEAIRLLDARYCRHLDDGNWDALMDLFTEDGEFDGLSHPRGRTEMRAFFAGLAEDGLTAFWHFITNLEIDLDGDRATVRSFLWQPCVTDGVAGIAAGRYTDQVVKIDGRWLYKVKQVRFHFFGPLESGWDENLFALDSARRAAVRA
>UniRef90_A0A523XA31 Phosphomannomutase/phosphoglucomutase n=1 Tax=Candidatus Cloacimonetes bacterium TaxID=2030808 RepID=A0A523XA31_9BACT
MNKEIFRTYDIRGKADIDLTNEVVEILGKSYSIFLPSNAKRIGIGRDIRLSSERIKNNFVKGLLSTGIDVVDFGVIPTPLLYFTVHTHALDGGVEITGSHNPKEYNGLKMLVGKNTIYGDEIQEIRRIADKGVFRKGIGSYEEKETVNEYINDILDRISLGKRKLKIIFDTGNGTTGPVVKRLYSKLPFEFEILFEEPDGSFPNHLPDPTIPEYLNDLIQRVKESKADLGIAFDGDGDRIGAIDEKGRIIWGDKLLAIYSKEVLRKRQGAKIIFEVKCSNGLIEYIKEKGGVPLMWKTGHSLIKAKMKEEDAPLAGEMSGHMFFGDNYYGFDDAIFASLRLIELLSRTQNPLSLLADEVPSYFVTPEIRVDCPDSEKFKVVEDVKKTFEKEYNIIDIDGVRVVFPDGWGLLRASNTQPILVLRFEAKTEEALSRIKKSFTQILEKFPFIKI
>UniRef90_UPI00048A2204 TolC family protein n=1 Tax=Anaerovibrio lipolyticus TaxID=82374 RepID=UPI00048A2204
MRNNRFKTLTALVISGVMTMSMAGTAMAETMDVDIEDCVNMAMANNHTVKSAIDDYDSAVWARHEARRMHGPTLNWTSAAQHIGGKFYDAHNVNSMYTNTVAVSMPIYTGGQLEGSIKAADLALDANELALEATKQGIKAKTQAAYYSALNCRNQIKVAQNSVKTLEEHLRNVNAQFGAGTVAKSDLLASQVQLSNAQLNLVSSQNNYDVAIATLNNVVGLPTGTELNLKDELGYVPYEISLDQCSEYAQLNRPDILAAEYKVKIAEAQLDVASSGNLPKVNATVSKTFAGEKPFSADERPVDNFYQQNTWYAGIGISWDIFDNNVTQAKVKQAKAAIEKAKEAAQEARDTGDLEVRTAYLNLTAAEKSISTAKVAMEKAQEDYTIAQVRYGAGVGTNLDVMDAEEKLTTAQSNYYNALYKYNSSKAALDKAMGLMVDLDVTQLQEKLAKN
>UniRef90_A0A0N8K910 Oligoendopeptidase PepF n=1 Tax=Bacteroidetes bacterium HLUCCA01 TaxID=1666909 RepID=A0A0N8K910_9BACT
MSEKKTSNGAETIYWDLSDLYTSGEDPNIRKDQHRLRDLASTFAARYRGTLATAHAGDLAEALRTYEEINDLLGKMGSFAYLQWSTNTENISYGQLMQQINEFSSELSQQLVFFDVEWLALEEERAAELIADERLKSWKHYLTASRRYKKHILSEKEEQILTAKSVTGSQAWVRYFDETLGAARFELDGEQLTEQEVLSKMHEPDRELRQRAADSLTRGFREHRRTLTFIFNTLLVDKFTNDTLRKYPSWISGRNLSNQIADDTVETLVESVQKFYPTVQRYYKLKKQLLGYDSFFEYDRYAPLLQTESRVSWSDAQTMVLDAFNGFNPEMGRIARRFFDENWIDAAIRPGKRGGAYSASTVPSVHPYVFMNYDGRLRDVQTLAHELGHGVHQYLSREQGILQADTPLTTAETASVFAEMLVFQKLLAELTDPREKLALLMGKIDDTIATVFRQVSMNRFEDAIHTARRQEGELSAERFSELWRKTQTDLYGDSVQLTENYDLWWCYIPHFLHTPGYVYAYAFGELLVLALYNRYENGAENFPQRYEQLLRAGGSDWPENLVSKLDVDIKDSTFWESGLAIIDQLVDQAEQLSAQAGMGQ
>UniRef90_A0A3M6WIU0 C3H1-type domain-containing protein n=2 Tax=Hortaea werneckii TaxID=91943 RepID=A0A3M6WIU0_HORWE
MAGKKPCHLFQLGRCKYGNGCKYAHVKDPSFKRKACINFAKGTCHRGKTCTYSHDQADIDLWGASNDQDTAANASGPSHVDNSQAMFKNWRYNIPQEVGTPTPLGINLGRFFKQAAELIDGDAGRMQEVIVLLASEGGVQRIIELLEQPLDKCHPDILPRLFNTQIICFLEIITHKHVTVSAILKPRLTTIYNIVWGEGGQQAMKLFSAVAQHLQTLRLMGQGEGSSTNTTAIHAIECALTALDKLTEVNTSAQVHDGLKRVAEAFAILFKEPMTDQVRFAVKPSQRHLRRVEQRLGLGQAIPTQSEGKQHKGERAFFTLERPGPGELNIDGVAPRYDNDHVDIRGISILPTTLEIQFAGAEYLPLTDPTQWHIGGLEGLLDRHFRLLRADTVGQLRDTAKTELARLQAPEARGPTQQNKQRTSRAFVYGNATIVDATFTSQNGIEFAISFDQPGKVQRKKKNERKDWWQNSKTLSDDALVCLLSSLGSAIFLTVVPEPKNPKKDAAKGEQQTSIHKQYDLWSNGQRAHVIVKPAQQDGIELILRELSSSGNARLSLVEFPSVLLPAFQPTLRAMQRLTETLEVPFAEVLAPVSTRDNPTREIEIQPPNYATRPGFQFDLSVVTTNGKALRFTPGRDIDGAAAELAQYSIVSSLSRSLALIQGPPGTGKSYTGVQLVKILLAHKKACNLGPILCSLERLLDEGVSNIVRIGGRSKSDRLANVNLREVAHRLDLTKTEKSERFRLTKEVEDEVTELKLILRSMSELGSQSSIEEYLREWQPQHHHQLFSNIDEEGFITVNRHQDSELQQWLNSVPWDQKKRRPVAELENADLRQMTARERRRLYRDWTAKAAHKVQEKFDRALTEYNNAKEQQDDIRTETDQRALRQANIIGITTSGLARNLDLLRRVNAKVLVCEEAGEVLESYLLTALLPSVEHAILIGDHQQLRPHVQNYDLSTESRGGAQYALDVSLFERLVQPQDILAHPLPFCRLQVQRRMHPSISQLVQETLYPNLQNAESVNPIPDVVGMRRRLFWMHHEQIEDHAGDGLKTSHTNSYEVEMTAALVKHLVHQGVYKSEEIAVITPYLGQLRLLRRKLASSFEIVLNERDDEELLKDAGNGIEGDPPSTDVPLRRPSVARGTLLNALRIATVDNFQGEEAKVVVISLVRSNRERKPGFLKTPNRINVLLSRAQHGMYIIGNSDTITGDAGSKAGSVEMWENVLDIFRTNDNFGTALELCCPRHQDTPMSVQQPSDFVRLSPEAGCNLLCDQKLSCGHACTSKCHSDMLHDAVFCSKPCYRLDQDAPIRAKRNACMVLIKDVNVQLECRHIHKSLRCFEYQDPSKVQCQVPVTWTVPGCEHQVKEPCSTDVYSDDYKCRAMCSAILPCGHLPATAKKSARRVQPSAKPVVFTVRVARHAVSLLQLSSRPSMPFALCRSLRLASLLEEVSSDIEVYFLDSKLLTSYCRCEKTLSCGCRCPSVCGEACPTSDFCQVHGSEHIESLNADLVMLCAYRDVDLDEDPCIFPPCGHVFTATSMDGTMEMAAHYEIDPLTGAFTALKSTSEPFSSQELKTCPECRGSLRSINRYGRIVRRALLDEGAKKLTAWANRTHHDLSERLANDQCRLLDSLEMARKPSQNVKLTNSIDDQLREVKRLKYSKRYRQTFAIRTAVKNFSDRLIVDEQPYQRVRDLVETRRRQQLASSSATDIAEFSFASEELQLHEHLQAMLLLVRTEIVILSDVIAMHDKADGPVKGILKLQFDANRLQCTELAEEAARTVNVRQEVEAHIFWAKFAAMECGTSMATEEEGDADVSDYLERLRDKAITHLDTAEAICKRFTANEPDPTSDLSDELAEVRRMLDEGISSSEMRMVVAAMAKEFRGTGHWYRCVNGHPFTVGECGMPMQLARCPTCGEGIGGQHHRPTAGVQHANDIEERFGRMAI
>UniRef90_UPI001FBC0094 HlyD family type I secretion periplasmic adaptor subunit n=1 Tax=Methylobacterium sp. E-016 TaxID=2836556 RepID=UPI001FBC0094
MTHALVVPPPPIQMDWRKPVLTAYLVILLAFGGGAGWASVAKLESAAIAPGVVIAQSNKKTVQHFEGGIVREILVRDGDQVQEGQVLLRFDETQARASLDTIRSQQAVARIQEARLIAERDQTGKIILPENVASRAHEPAVARAIEDQQSNLRERATYLRSQVDVLNSKILQTEQEVRALTNDADSTKQQLVTIDQELGGLRQLLAKQLVPVSRVAALERERIRLQGMLDRAISDAKKGAQSIGETRLTIIQTQKQFLQQVSTDIIEVRKNLSDLIEKERVAQDVLSRLDVRAPRTGIVQSLKVFTIGAVIRPGDTILEIAPTGDQLTVSVQISPNDVDSVSEGLRAEVRFPTYHSRRVPIMLGKVRSVSYDRVTDAQNPQNIYFQGEVVVQASTVPSEIKDKLKPGMPAEAIITTGEQTPLDYFLGPLFDRVSHGLREK
>UniRef90_A0A7R8VGG4 JmjC domain-containing protein n=1 Tax=Timema douglasi TaxID=61478 RepID=A0A7R8VGG4_TIMDO
MHYLLNSGFDYPIVVDDPNGLEMAVPTNFNALQLLDYIDGMQQVKAIDVMSQNIITIYLIDFVDYFLSPYRWHPINLLSVEMSQTSLRDAIQPPLISRILDWSEIAWPADCSEPKSDVQRYCLVSTKRSFTDFHVDFGGSSVWYHVVKGEKILYLIKPTAANIQLFIQWTNTSKHNNSFFGDHVDDCFMLILTEGQTLFLPTGWIHAVYTPEDSVVFGGNFLHDLNIPLQMEIYKMEKATHTRQMYLYPQFEELNWYAGQHILQVICNTNIVGAVPRKYLMQGIRALIPMLNLWLTKNEDGQPFTSIMCQNLIRDLKRELKIGELNTKMLTTPRPGRESKRQRKKTFNADFYYFPAANKVASKASVAKVPLGGSTSPNQSNVSSQKIPLSLCSLPIMSHDLQEKGSSDSSSNKTSHSSSPTLSKDMIHAPETIQQNELKMLCSQIPNQLEEAHALFSTERVDSATILTQMSHQVSESLNSQTITRQKMESTSSQSKQPHTAREESSSFWQASVLGNVPTLKVVLNRLANVPEPVTYPYSTNSVTTKKHHTAACTITSRESQDNNCQPWFVQAHTLCSKKELKMKVKAVSDSSKQTTPRDVYDFHASEDENSLLIDDQSSIESWHTNMQSKVNRKSPNSSVSSPTLSLGSSTQSDSIGLPYVKVNRIDELLKASALTGSGGTSPSTRDAIQGMLSISCSGSSSTSKMPIKTRSKKQHYEMVDDAQELVDEVHRDDDFVYPSLDVSDGEEPLNKRSKKRNIDEAWNPSARIGRLVPRTDRPTRYIKKNQAIEKGLEAAAAKRANLPPPKRPYNKKKTSDTPIPSTPGTLPKKEMPKEIKGIKCKHRQMGEKVTRGERKRKREGRKRQKSQGTPQGQQRSMLETLLPSRSRPFQLLGDEARMRVIFTMLVSLPNSS
>UniRef90_A0A1K0ILZ2 SPOR domain-containing protein n=1 Tax=Cupriavidus necator TaxID=106590 RepID=A0A1K0ILZ2_CUPNE
MRVQSPASAPAPDAAPRSALPSATLAAACIEIGGFSAQAARRATEDLAAAALRVEAFARQEQVRWWVHLPAQPTREHAERKLAELRRRNVTEYSLVTAGTPEATTYTVSLGLFRERERAQQYLDSLRGHGVRTAMLTEAARPLTRQWLRVRDADHAARARLEAMRQRYGAEDVLACS
>UniRef90_A0A6H5GIQ7 Zonadhesin (Fragment) n=1 Tax=Nesidiocoris tenuis TaxID=355587 RepID=A0A6H5GIQ7_9HEMI
GGINHPGPSGTSCYRNQFSEVTLSANFDQIRSNSTSRSIQLRDQTRLRDQTQLQVQRQHRDRIQLRVQTQHRDRIQLIDQSQLRVQTELRDQIQLRIQTQLRDQIQLRDQSQLRVQTELRDQIQLRDQSQLRVQTQLRDQIQLRDQSQLRVQTQLRDQIQIRDQSQLRVQSQHRDRIQIRDQINFEFKLNFEIKFNFEFKLNFEIKVNFEIKFNFEFKLNFEFKVNIEIEFNFEIKVNFKIKVNFDFKLNFEIKFNFEFKLNFEIKINFEIKVNFEFKPNFEIEFNFKIKVNFKFKVNFETKFNFEFKINFEIKVNFEFKLDFEIKFNFKIKVNFKFKVNFEIKFNFEVNGSIVIVLKSRIGTELQKKLFLIHIYSESLPEQVSVCPFDNIFGCSPTNMYPEKIEKIIFYYLIRTPQFLCGRSSNFINTYLILLTGLTRQQFGGVRPCRDKHFSSRNLKKGRKPMPPQ
>UniRef90_A0A067KLY9 PPR_long domain-containing protein n=1 Tax=Jatropha curcas TaxID=180498 RepID=A0A067KLY9_JATCU
MAVKLSHSYFFNSYKPDDASFKQMGAPKRDLLVNPRIRKSNPTKKQMSETPKRGMIKPNSLSLTRSLCEFVDSGAMDNALYLFEKMNQPDTYIWNVIIRGFSNKGLFQEVIDFYHRMEYEGIGIDNFTFPFVIKACGRLLSFIEGKKVHGKLIKIGLDRDIYVCNSLIDMYFKFGFVEVAEKVFEAMPLRDLVSWNCMVNGYRVIGDGLKSLMCFKEMLGLGEKPDRLSMISSLGGCSIGCCVRGGKEIHCQVIRNGLELDIMVQTSLIDMYAKCGKVDYAERVFNEMTCKNIVAWNAMIGGYAINGHFLESFTCLKRMQEDNLIPDAITMINLLPSCSKFGTLLEGKCIHGYAIRKMFLPHLVLETALVDMYGKCGQLKFAECVFGRINEKNMVSWNAIIAAYVQNGRNEEALELFHCLRNQTLKPDAVTIASILPAYAELATVTSLVWSMKGGNCSIL
>UniRef90_A0A521B5K5 Uncharacterized conserved protein n=1 Tax=Saccharicrinis carchari TaxID=1168039 RepID=A0A521B5K5_9BACT
MSEKNLTVTSNKTGQLFDAKGQLLSPPSQWSFLPAGDAGVTRKVTANGKYWRVVFKKGRRIMSKGVWAPTQVIEMAKKEMEATRSTDDYLKKKEYNAKRRKKQQQAYEIEFCAEVEKFLNFHSDYAPVARAMAILVTRHAVPVGSGTVARTAMIPVHERAARAVIAWMRHQTTAYDHMKIARIKGERREVRRMLAQESTRLMNNYRRGLPIPFTCPLKKALDKIISP
>UniRef90_A0A517WN20 Putative adenylyltransferase/sulfurtransferase MoeZ n=1 Tax=Gimesia aquarii TaxID=2527964 RepID=A0A517WN20_9PLAN
MKWTCAVVFTLLITSMGFAVEHTKDSLATIKKNVESKKAVLVDVREKGEWDAGHVKGAIFLPLSSLQDGITAAEQKKLPQDKVVYLHCAVGFRAKIAASLLKKYNDKVRPLPQGYEELIESGFQKSK
>UniRef90_A0A0F5FR09 Serine hydroxymethyltransferase n=2 Tax=Devosia TaxID=46913 RepID=A0A0F5FR09_9HYPH
MSAATSLPLFPHFFSDSVAETDPELAKAISDELARQQGEIELIASENIVSQAVLEAQGSVLTNKYAEGYPGRRYYGGCQFVDVAETLAIERAKQLFGVGFANVQPNSGSQANQGVYQALLQPGDTILGMSLDAGGHLTHGAKPNQSGKWFNAIQYGVRKQDGRVDMDQVRQLAREHKPKMLVAGFSAYSRIMDWAEFRAIADEVGAILFVDMAHVAGLVAGGVYPSPFPHAHVATTTTHKTLRGPRGGLILTDDEDIAKKINSAIFPGIQGGPLMHVIAAKAVAFKEALSPEFKLYARQVVANARVLADTLVKGGLEIVTGGTENHLMLVDLRPKGLTGKATETALGRAHITCNKNAVPFDPEKPAVTSGVRIGTPAGTTRGFGEAEFRHVGELILEVLDGLAANGDENNAAVEEAVREKVKVLTDRFPIYGQ
>UniRef90_A0A6F8V0N0 Prevent-host-death protein n=1 Tax=Bosea sp. ANAM02 TaxID=2020412 RepID=A0A6F8V0N0_9HYPH
MARRDLNARLDQATHALCTRVERAHAVPAGATLRFRQGKPLAPVIFTILESADWDRSALPARDGYPFR
>UniRef90_UPI0014890022 alpha/beta fold hydrolase n=1 Tax=Ruegeria sp. HKCCD8929 TaxID=2683006 RepID=UPI0014890022
MRFLPVLVAVVWLAACTDRSSFVLVPDAVDVGTPRTVFAASARAREADGSYGYRRADRLQFLELTVSIPPTHTPGSLNLSYGRPDPETQFVLAGQEVFASPEPLRQRLLNDQREHGSALREVTLFVHGYNATQNETAFRAAQLANDIEIPGSLMIYSWPSRARAFGYAYDLDSMLFARDGLEQTIRQLKASGAERIVLVAHSMGAALSMEMMRQAEIREPGWSDRMLEGVVLISPDLDVDVFRTQMDRIGTVPQPFVVMVSRKDPALNISARLRGTAESRRLGNIDSIDRIADYPVDVIDTTAFSGDAASRHFVAATSPALVTLLSSAPAMGEAFGPEETSFDFLIPGGVEVSGRAKEIILARPGENR
>UniRef90_UPI00049064DE HAMP domain-containing histidine kinase n=1 Tax=Paenibacillus sp. UNC451MF TaxID=1449063 RepID=UPI00049064DE
MRGLYRRFAFTFICITCGILLIASIVFILETHYHFALYQHQSMDMGADNAQLNAHFEQALVQSVIWTAVGGIALASVVSLYVAKRMTSPLLEMKAAAMKMAEGNLQARTKLVGNDEITDLGLSFNHLAEQLEKQEQLRKTMTADVAHELRTPLATLKSHMEAMIEGIWEPSAKRLKSCHEEIERLIHLVGDLEQLTHLDSPHFQLHMKSENMVSIASQCVQAMQAAFQLKGVQLTLHKPNEDIFAIVDRQRVCQIIINVLSNALKYTPVGETVAVTMAGDHRSSTATISVRDTGIGIESRELPFIFERFYRTDKSRDRKSGGSGIGLTIAKKLTEAHCGKIEIQSEVGRGTTVQIHFPIKSKKSSLSTQDLQKSRI
>UniRef90_A0A2J8RU61 MAP4K4 isoform 8 (Fragment) n=1 Tax=Pongo abelii TaxID=9601 RepID=A0A2J8RU61_PONAB
GRHVKTGQLAAIKVMDVTEDEEEEIKLEINMLKKYSHHRNIATYYGAFIKKSPPGHDDQLWLVMEFCGAGSITDLVKNTKGNTLKEDWIAYISREILRGLAHLHIHHVIHRDIKGQNVLLTENAEVKLVDFGVSAQLDRTVGRRNTFIGTPYWMAPEVIACDENPDATYDYRSDLWSCGITAIEMAEGAPPLCDMHPMRALFLIPRNPPPRLKSKKWSKKFFSFIEGCLVKNYMQRPSTEQLLKHPFIRDQPNERQVRIQLKDHIDRTRKKRGEKDETEYEYSGSEEEEEEVPEQEGEPSSIVNVPGESTLRRDFLRLQQENKERSEALRRQQLLQEQQLREQEEYKRQLLAERQKRIEQQKEQRRRLEEQQRREREARRQQEREQRRREQEEKRRLEELERRRKEEEERRRAEEEKRRVEREQEYIRRQLEEEQRHLEVLQQQLLQEQAMLLHDHRRPHPQHSQQLPPPQQERSKPSFHAPEPKAHYEPADRAREVEDRFRKTNHSSPEAQSKQTGRVLEPPVPSRSESFSNGNSESVHPALQRPAEPQVPVRTTSRSPVLSRRDSPLQGSGQQNSQAGQRNSTSIEPRLLWERVEKLVPRPGSGSSSGSSNSGSQPGSHPGSQSGSGERFRVRSSSKSEGSPSQRLENAVKKPEDKKEVFRPLKPADLTALAKELRAVEDVRPPHKVTDYSSSSEESGTTDEEDDDVEQEGADESTSGPEDTRAASSLNLSNGETESVKTMIVHDDVESEPAMTPSKEGTLIVRQTQSASSTLQKHKSSSSFTPFIDPRLLQISPSSGTTVTSVVGFSCDGMRPEAIRQDPTRKGSVVNVNPTNTRPQSDTPEIRKYKKRFNSEILCAALWGVNLLVGTESGLMLLDRSGQGKVYPLINRRRFQQMDVLEGLNVLVTISGKKDKLRVYYLSWLRNKILHNDPEVEKKQGWTTVGDLEGCVHYKVVKYERIKFLVIALKSSVEVYAWAPKPYHKFMAFKSFGELVHKPLLVDLTVEEGQRLKVIYGSCAGFHAVDVDSGSVYDIYLPTHIQCSIKPHAIIILPNTDGMELLVCYEDEGVYVNTYGRITKDVVLQWGEMPTSVAYIRSNQTMGWGEKAIEIRSVETGHLDGVFMHKRAQRLKFLCERNDKVFFASVRSGGSSQVYFMTLGRTSLLSW
>UniRef90_A0A1V5E6B1 LPG_synthase_C domain-containing protein n=1 Tax=Syntrophaceae bacterium PtaU1.Bin231 TaxID=1811718 RepID=A0A1V5E6B1_9DELT
MNFKKLEVADYAALKPYFDPIPYRLSIYSLPSLIAWGDCVFETRYAVEGDLLVIANESQLRPDDRHLILPVSPGGDPSPERLRAIALESGHRRYWCACGNYVERHRQGLEPLFHIEEQPEFEDYVYLAEDLAELRGNRFVRKRNLIHQFEREFMRNGSRASVEPITRESVPECLAFLEAWCVQRDCDVDGDIDLACERRAVITSLEQLEALDLRGILVRLDERVCAFGIASRLNGDTGILSYEKAFSDVKGLYQFLDRECAKRLFAGCRYINKESDMSLPNLAAMKRSYHPVLRVKSYRLTLR
>UniRef90_UPI000D0912D6 B3 domain-containing protein Os12g0592300 isoform X2 n=1 Tax=Rosa chinensis TaxID=74649 RepID=UPI000D0912D6
MELEERPSFFKVLVDGFSQQLRIPRAFVKNFNGRVPRMCGLRGPCGNLWAVNLKEIKDRVVFHNGWQSFAKHHFLEVGDFLTFTKDDGSIFDVIIYDKSYCEKNVEAAKSRIGNVVDRTINNHIILGKRPALDLVEETSIGSISFNSENPFFTTIFTREFQAK
>UniRef90_A0A0N0N6B7 Amidohydrolase 2 n=1 Tax=Actinobacteria bacterium OK074 TaxID=1592327 RepID=A0A0N0N6B7_9ACTN
MFKEFVVSGDSHIIEPVDLFKTRLPKNLRERALWEEEFTLEEPIVPGGHTEFKKLHTIGFDGWTISKYRQTGGITPDGEPEHIIRDMNLDGVDASVMFPNLSLFVLFTDDHELSMAHAKVWNDWIAERYLQYKDRLRPTAAIPLTYIPDAVAEIERCSRLGIGAILLPDVPPELPYWSSEYDPVWAAADAHGMPVFFHVATGGVKVKESSSATATTVRGMVSSMNMGKGQLTDAMVASRTMSAGGSGAAGPQGIIADLVAGGVCERFPNLHFNLIEYSAGWLVSYMGFMDKLWKTGTGQDPDWWLGFWDDSRSPKDQPTMGRMFAVNQRWPWPLKPSEYVRRQIHVQFADDPTAVKCRNITGLSTIMWGNDYPHAEGTFRSSADCIAENFEGVGDEDRAAILGGTLADIVHFDKSKKLAPVAENA
>UniRef90_A0A4Q9KAX3 VWA domain-containing protein n=1 Tax=Propioniciclava sinopodophylli TaxID=1837344 RepID=A0A4Q9KAX3_9ACTN
MVPLISFFHPERLWLLALVPVLLLLYGALLQRSRTRSRTQGIDNLAKVMPKQAAWKRHIAVLAAVVSLAALVVAFAQPKDAVDVPRERATVVLAIDVSRSMEATDVDPNRLDAAKEAASGFVDLLPRGFNTSLVAFAGSSSIITPPTQDRGLVKRAIDNLQLAPSTAIGEGIYSALDAMLLVPQDPNDPEESTPGAIVLLSDGYTNIGRSSTVAARDAKEAGYPIYTIAYGTPNGYVVSNGRREPVPVNPAELNAVARESGGEAFQAGSREELQRVYASIARSVGYEKVDQEVTEFYAGIALGFAVLASLAVLSLAARWP
>UniRef90_UPI0004DC9B9D PE family protein n=1 Tax=Mycobacterium tuberculosis TaxID=1773 RepID=UPI0004DC9B9D
MSLVIVTPETVAAAASDVARIGSSIGVANSAAAGSTTSVLAAGADEVVSAAIATLFGSHAREYQAISTQVAAFHDRFAQTLSAAVGSYVSAEAT
>UniRef90_A0A2E4XJ01 Enoyl-CoA hydratase n=1 Tax=Acidimicrobiaceae bacterium TaxID=2024894 RepID=A0A2E4XJ01_9ACTN
MEEIQLTQEENIATVTINRPQVKNAVTSDMWDELQRVFTELGYRDDVRAVIVTGAGDDFCSGADVGGMGSRSEGPRLHQLDAMRKVGDCCLSLFNMPKVTIAKVSGVAVGAGMNLALSCDLVVASENARFSEIFAQRGLSVDFGGSFLLPRIVGMQKAKELVLLAEVISASKAHEMGLTNYVVPREQLDEKVLDLATRAASGPPRALAMSKAMLNKSFANSIQDALDQEGTSQTVNFTTKDVSEAMKAFQEKRSPRFKGW
>UniRef90_A0A7S1QCM4 Guanylate cyclase domain-containing protein n=1 Tax=Alexandrium catenella TaxID=2925 RepID=A0A7S1QCM4_ALECA
TSLAGGGDATVAREELVSECRHKLGRSPTNVHLAWSDPHWLIQPRGAWVIGHELQGHFRFNMSADPFAANAIDCRRFDLNTVVLIITGILTCLVFAVTYVHLRTYAVVAVSTTFISLACATGIFGVWMRWVDCRTSGLHDHNMVFRHLATSCFQVANFNGTMYANAMQKHGKLVIAFESNFRHVRQVSRSEVWFGSLSEAFLLVLVIAAHVTFRHKRMQTREARYELMCRRPRLVRCLLENISFLDQLPPRDRTMMAFTLKRVYDEDDGKKFSDLEERYREMLSMKPSPSDLDGVGSSFWPAAVYSLVRALIPSTYRQFIPTATTPGSGMQAYANAVPEENTLWMLSALLRVVMTFCVYLFVLFSIKEASRRYTRTMQVWLVFDSKWHFPSQTSLAGDPMTETVQVSMDDEGECLHMLDRNHQPPIGNFSSEHCCSPRDSEDDGNIVNTQEVKDKLTTWWAWREYLIIDYTDKRVRLEFHLVVAVAMLVVSAVLICVDDFKEGFRPPQLLDIDESMSWFRGHVNSLSFQTAWDLLFLTWPVLNAINTAATMNRLIESHLQKIKHLADLLNEAGIGLPVGADSSPAGQSDVSPQDDVGPSIRNIFRVAKAELASGGSNATRFLNIVPINRQTFAIAGTVLSLFTGGQFMEIFNNLLGAVNGS
>UniRef90_A0A193G2U0 General secretion pathway protein GspM n=2 Tax=Bordetella bronchialis TaxID=463025 RepID=A0A193G2U0_9BORD
MKVSARRAPRLLLPAPLLARCRDTAERASRYWTRLTPRERRLLRALGAILTAAAVFALGLRPAWRDIERWRDELPRLRAQAAAVDALVQEARALKREQGNRIPARDMEEALRASLARAALGGTQQVGKTPDDKAWRIAFDDASPAALFDWLAHAPAFLHLRVVQVHIVRPRDSLGRPIPARATGTLVLRDAGDAAIGARP
>UniRef90_A0A0B8NUT2 OMP_b-brl domain-containing protein n=13 Tax=Vibrio TaxID=662 RepID=A0A0B8NUT2_9VIBR
MIEAETMDHEIRATWTRQGVQPYFEFRSQANGAENAQGDSLVNNAFVFGASYGF
>UniRef90_A0A7S3J898 STI1 domain-containing protein n=1 Tax=Euplotes harpa TaxID=151035 RepID=A0A7S3J898_9SPIT
MLKSLDNLRAAHPGCRQQISLLPPQQMIRKIGDMKNDDPQMTMRGMDKEELSHMQRIMGSMESMAADRSMQFPQVPEDILRRDMEEDQDNSNHNEPEEE
>UniRef90_A0A653T2G2 Glycosyltransferase EpsD n=2 Tax=Microbacterium sp. 8M TaxID=2653153 RepID=A0A653T2G2_9MICO
MSQRSELRTHHRRDLLSDPELPPASAPRVAHLAHTTVAGGAELGLARMLRADAPWRASVLLPPVPAEDGAFAGLPASIPIHRIGVAQPHGASGASAMSAFSLGVRLVAQAVATRRHPSFRQADLIVANSTRAAAYGALAAFGSRKRFLVHLHDITDRETLGGFGLRMMTRIVLPRADGVIANSQATLASAEPYLRPDAVREVIAGASGLTGAARGAREPGPLRVGMLARIDPWKGQLLLLEAFAQAFPGGDEILEFAGGAPFGHADFAVELRDRARALGIADRVHLLGHVEDVDRLLRRWDVGVQASLRAEPLGFNVLEYLDAGLATVVAAEGGPVEWVRDGVNGLVVAPRDVGALAAALRRLGADAGLRSRLGDAARSTPGLATDHVVAQQHAAAYLRVIAQRR
>UniRef90_UPI001B319B05 hypothetical protein n=1 Tax=Bacillus suaedae TaxID=2822140 RepID=UPI001B319B05
MAINYKQCINCESKNTLNLLYGMPTDDASKQAKEGKFKLGGCCVIVGGPEYCCNVCESEWNKEQAIDAAYEKIIGLNAYVGGFFGASYNVDLDLISGSAAWSHWENGEEVASECKALKETTVKKLIEELKIINFLNWKREYIEPGVLDGTSWSVELIREGRNLKRSGANKFPEEWDDFCKLVRRMTGKRFS
>UniRef90_A0A516GYM1 YdcF family protein n=1 Tax=Ferrovibrio terrae TaxID=2594003 RepID=A0A516GYM1_9PROT
MARKDRDDEESTPFFTRISRWLMLLATIGLLWLGGGIAYVERVESIPAPAETKTDAIVVLTGGAARLATALRLLNENKADRLLVSGVAQTATKATLLQAVLPTMPDAAQASSNWQGIDLQLLFDCCVDLGFEADDTAGNAAETASWAAARGYRTIRLVTANYHMPRAQVEFGRYLSGMTIVPHPVRSDAMRVEDWWQRRAATVFLLGEYSKYLAALLRARLGTQLTATLEQKPQTVPVQPAAAPTQEKPTEEKPQ
>UniRef90_A0A7C9L683 Alpha/beta fold hydrolase n=1 Tax=Sediminimonas qiaohouensis TaxID=552061 RepID=A0A7C9L683_9RHOB
MTVVQDPAANADLPVVVMIHGSGWHAQQFDRLAWALRDVAELRAVTLRGHGADPVRRGDVDYIGQLEDDLASAIGDVAPGRKVVMLGHSSGGGLVVRFAGGPHDGMIDAAILLAPFLKHNAPTTRTDAGGWARPLTRRIIGLSMLNMVGIHEFDHLTAIHFAMPKKVLDGPLGHTATTAYSWRLNLSYAPRRDYKADIAALPPFVLIAGADDESFRADEYEPLMSGVTDKGRYHVLPGVGHLGVVDAPQTETLIREALRAL
>UniRef90_UPI001BA7DB86 DUF2130 domain-containing protein n=1 Tax=Bradyrhizobium sp. AUGA SZCCT0177 TaxID=2807665 RepID=UPI001BA7DB86
MTFKATASDAHEPVVRCPNCSHDIRLTESLAAPLLEENRRRFQEQIAQKDAEVARKSEVLLKERDDLARARDQVEEQIKQRLAVERNQLIAAEGKKAQEAAAVELQAKSTEAAELRRTLEANNVKLAEAQKAQADVLRKKRELDDEKRELDLTVEKRVQSSVEDVRVKARQEADDAARLRISEKDHTIESMTRTIEELKRKAEQGSQQTQGEVFELELEEILRGRFPTDMIEPVAKGELGADVVQQVNEASGQPAGIILWETKRTKNWSDSWLAKLREDQRRCGADVALIVSHALPKHVEYFDLIDGVWVAHPRCALPVAVSLRQALIAVSNTRLVQQGQQTKMEQVYQYLTGTKFKQRVDAVIEKFNDMRDDLDKERKFMICQWAKRETQILSVVESTVGMVGDLQAIAGKAMPEIPSLDLPLLEISDAAE
>UniRef90_UPI001447B9A0 helix-turn-helix domain-containing protein n=1 Tax=unclassified Cryobacterium TaxID=2649013 RepID=UPI001447B9A0
MPEAATKKQTLAWLKTVSGELATATLKRLDDTLPWYREMPPGRRSAVGLVAQAGITSFMQWYDDPSSTPWIAADVFGAAPRELLRSVSLTQTLQLIKVTVEVVEERVKGRDESLREAILLYSREIAFGAADVYARAAEARGLWDARLEALVVDSILSGEYDDELPSRIAALGWHGHGEVSVLVGTAPKMLDVDMLRRTARHQDADVLIGVQGSRLVLVIGRAQPASVNEDEGTAPPKPFLDIAMELEPGFGDGFLVLGHEVPSLVDASKSAKAALAGFAVARSWRNAPRPTLADDLLPERALAGDPLARATLITRIYRPLQAHSTELLSTLWSYLDNGRSLEATARELFVHPNTVRYRLKRVSEVIGYDATGARESLILQAALIVGSIAEHDTPRRR
>UniRef90_UPI00131B79F4 3-hydroxybutyryl-CoA dehydrogenase n=2 Tax=Chachezhania TaxID=2603319 RepID=UPI00131B79F4
MTIKSVGVIGAGQMGNGIAHVMALAGYDVLLNDISQAALDKARATIEKNMVRQVSRGAISEDEMKTAMGRMTTSMTLSDVGQTDLVIESATERESIKQAIFEDLLPSLKPNTILTSNTSSISITRLASRTDRPERFMGFHFMNPVPVMKLVELIRGIATDEATFNACKEVVARLGKTSATAEDFPAFIVNRILVPMINEAVYTLYEGVGSIESIDTSMKLGAAHPMGPLELADFIGLDTCLAIMNVLHDGLADTKYRPCPLLTKYVEAGWLGRKTQRGFYDYRGEVPVPTR
>UniRef90_A0A0B5L654 Gag polyprotein n=1 Tax=Human immunodeficiency virus 1 TaxID=11676 RepID=A0A0B5L654_9HIV1
MGARASILSGGKLDMWEAIRLRPGGKKKYRLKHLVWASRELDRFALNPSLLETAEGCQQIMNQLQPALKTGTEELRSLFNTVATLYCVHHRIKVSDTKEALDKIEEIQKKQKTQQAVADAGNNSTVSQNYPIVQNAQGQMVHQSLSPRTLNAWVKVIEDKGFSPEVIPMFTALSEGATPQDLNMMLNIVGGHQAAMQMLKDTINEEAAEWDRLHPIQAGPLPPGQLREPRGSDIAGTTSTIQEQIAWMTNNPPIPVGDLYKRWIILGLNKIVRMYSPVSILDIKQGPKEPFRDYVDRFFKTLRAEQASQDVKNWMTQTLLVQNANPDCKSILRALGPGATLEEMMTACQGVGGPSHKARVLAEAMSQAQQPNIMMQRGNFKGQKRMIKCFNCGKEGHLARNCRAPRKKGCWKCGREGHQMKDCTERQANFLGRIWPSSKGRPGNFPQSRPEPTAPPAESFGFGEEITPSQKQEQKDKELYPSASLKSLFGNDPLSQ
>UniRef90_E1GWA8 Anaerobic ribonucleoside-triphosphate reductase n=8 Tax=Prevotella TaxID=838 RepID=E1GWA8_9BACT
MQNFTITKRDGSKEMFSLDKIMGAILKAFESVNAPTDLAAVSKILSDLTIHNDITVEDIQNQVEQALMKEGYYDVAKSFIVYRHQHSQDRETQDKIKFLTEYCGASNAATGSKYDANANVENKNIATLIGELPKQGFIRINRRLLTDRIKQMYGKELANEYLDLLTHHFIYKNDETNLANYCASITMYPWLIGGTTAIGGNSSAPTNLKSFCGGFINMVFIVSSMLAGACATPEFLMYMNYFIQKEYGKDYWKNADKVVDLSLRQRTIDKVITDYFEQIVYSLNQPTGARNFQAVFWNISYYDKYYFESLFGNFYFPDGSQPDWEGLSWLQKRFMTWFNKERTRAVLTFPVETMALLTENGECRDKEWGEFTAEMYSKGHSFFTYMSDNADSLSSCCRLRNEIQDNGFSYTLGAGGVSTGSKSVLTINLNRCIQYAVNKGEDYKLFLDHIIKLCHKVQLAYNENLKNFLKNKMLPLFDAGYININRQYLTIGINGLVEAAEFMGLDITPNEDYKHFVQGVLGLIEQNNKAFRTKEAMFNCEMIPAENVGVKHAKWDREDGYFVPRDCYNSYFYRVEDTGLTILDKFKLHGAPYIEHLTGGSALHMNLDEHLSKAQYKQLLTVAAKEGCNYFTFNIPNTVCNDCGHIDKRYLKECPCCHSKNVDYLTRVIGYMKRVSNFSQPRQQEAAKRFYAGSDKME
>UniRef90_A0A3S4JM46 imidazolonepropionase n=1 Tax=Klebsiella aerogenes TaxID=548 RepID=A0A3S4JM46_KLEAE
MVFSHKKITFPCAIVDFTGVMKINVYTTHDKLSAMTEATSELVIWRNGRLATLNPDHAQPYGLLERHALLVRDGRIAAIVAEDDVPSGRSIDLEGRLVTPGLIDCHTHLVFGGSRAQEWEQRLNGVSYQTISASGGGINSTVRATRDSSEAELLALAQPRLERLLREGVTTLEIKSGYGLDLPNERKMLRVARQLADHNGVELSATLLSAHATPPEYQGDANGYITLVCETILPTLWQEGLFESVDVFCENVGFSPQQTERVFQAAQALGIPVKGHVEQLSSLGGAQLVSRYHGLSADHNRVSDGRGRGGDARKRHRGSPAPRRVLLP
>UniRef90_UPI001653AF6D hypothetical protein n=1 Tax=Lewinella lacunae TaxID=1517758 RepID=UPI001653AF6D
MPRLKKILLTLLLLTVLAAVFRGPLYRTLVDYESVGASTNYTVKDEKLADLIASKVNRRTDLGITEAIKLSLSITSSQLHFTADNNDVDPNKLVTSKATHCVGYAAFFAATCKYVLSQQKLASSWTAEPQEGQLYFLGTNLHQYFHSAFLKDHDFVAIENHVTGEVLAVDPTIKDYFHIDFIRLRP
>UniRef90_A0A0T0M9T5 Peptidase C51 domain-containing protein n=1 Tax=Chryseobacterium sp. Leaf394 TaxID=1736361 RepID=A0A0T0M9T5_9FLAO
MFKENLILFAVFVMTLVSCKETEYRQKTNQKEPEKELSKKIPEKNILIVEAIKKFGPEISSTYEKAVCTELVIQIIEKFHHLEERDKFRIRIITDGNIQDLIKENSPIPKGVFYALTEKGIGIPIKKEDVLEGDFVQFWTPTWGHCGIVKSISLEKQEMELYSSFPSTKGYGIQKFKIPEYTFFVRVK
>UniRef90_A0A1Y4S3Z9 Hydrolase n=1 Tax=Lachnoclostridium sp. An131 TaxID=1965555 RepID=A0A1Y4S3Z9_9FIRM
MERLKYLFFDLDMTLLRDDKSISDEALAYLRDLKKRKDVRYGIATGRAWTAIEPLIERFGLDTLFDVIVMDNGSEIYDLAEGRRERLGIIQTEQMKQLLDAFGGYDFLAVAFHNPKGFFTTKISYRTERVLINNRLSGYHDPYKEEFEATARVMLLFLIEDQERVLEAVRLHPVPGIHGMLSEPEVYDFLCEGVSKAEGIRHYVTANGDRIEQTVVFGDSENDLEMIQKCGVSVSMKNGTEAVRAAADYVTGYTNNEDGVFRFLKEHEDWFQEG
>UniRef90_C7ZDV9 Succinate-semialdehyde dehydrogenase n=9 Tax=Fusarium solani species complex TaxID=232080 RepID=C7ZDV9_FUSV7
MPYSAPKLKDPSLFVGKNYVDGQWIESVSGKRFDVHDPASGALIGSCPESVAQDAEQAIKIAAAALPEWRSRTGRNRSRILRRWYELVIENKEDLATLITWENGKAGPDAAGEVLFAASFLEWFAEEAPRVYGDVIPHSAPGFRVSVIKEPVGVVGLITPWNFPAAMITRKLGPALAAGCTAVVKTAGETPFTANALLVLGERAGVPKGVINSIAALENTPEIGQTLCASDVVRKISFTGSTRVGKILMNQSSDTLKKLSLELGGNAPFIVFDDADLDLAIAGAIASKFKCSGQTCVCSNRIFVQKGIYSQFVEKLKAVVSKFQVGHGFDSKTTHGPLVTAAAAERVDDLVKEAVKAGAKVEVGGKRRTDLGKSRPNFFEPTILTNVTTDMRLVRDEIFGPLAPIFSFDNEDEVVDIANKCDVGLASYIFTQDVNRVARVTELLHFGMVAVNTGIMSDAAAPFGGVKHSGMGREGSKYGIEDYLHVKTIVTGNVNVVHRALL
>UniRef90_UPI001F05B46E response regulator n=1 Tax=Desulfobulbus alkaliphilus TaxID=869814 RepID=UPI001F05B46E
MHLSTASAMHDEGESYPMKEIRLLTDRLHQEIAEKTRALEKFRHLFEGAENGILVARGDTIEFANPALKHILGHDAEKITSEPFITFIHPDDRATVLDRHIRRMRGEDLEKSYDFRVVASDGSVRWINLSAQIINWDGDLANLSFVNDITERKTAEKEHEKLQEQLFQAQKMETVGRLAGGVAHDFNNMLGVILGYSEMALSQMAADHPLHGALHGINQAAQRSADLTRQLLAFARKQTITPRIIDLNETVEGMLKMLRRLIGEDIDLIWLPGRNLCPVKMDPAQIDLILANLCVNARDAIKGHGKVTIETGLTSFDDAWGAVHTGVVPGEYVLLAVSDNGCGMDQETINHMFEPFFTTKEQGQGTGLGLASVYGAVTQNNGFIDVESEPGQGATFKIYLPQYVIRTEPLPVQDQVGATMRGHETILLVEDEPVILKMLRTMLEHQGYTVLTAGSPEEAIRLAEEHSSRIDLLMTDVVMPGMNGLDLARNLLSRYPGIKTLFMSGYTDDVIAHHGVLDEGVHFIQKPFSMRVLGEKLREALEG
>UniRef90_A0A8B8IMG2 serine/arginine repetitive matrix protein 1 n=4 Tax=Nymphalini TaxID=171576 RepID=A0A8B8IMG2_VANTA
MSSRRNGSVSRAAEAASKNRLHMDRNPQHSRITDPSNPAGRRKEIDNVMKRARQASPGSWDRKLLEVEEKDPNRWRHTGYKQMYLDGSGSASPRRSRSPRRSRSPSRRSRSPRKSRSRSPRRRSPLRRSPARRRRSASPRARRTRPPPRPPSPPDPRKSSPSGSSASSCSDESCSVCSAKNKKVPPKPIKPGVRTSPSPPRTKRPAPPVAARAVQPTRELLKARESSKRSREEKVLEWQRSQLAVRPAPPIPPAHIKREGERRPRPPRPERPDRPDRTDRVSPAAIAAALADSDSDSESDASSEPPPQRLTLSERFGKMAQWSAARCARLENMRITRRDSALHVHIERDDAAPAAPDAPRADYPGLDPAPVGSYPEELLAVAPGGLPSWDDVRVRYDYYKKRGYLRGLTLGDYVKWEEWWYKYQEWLKRERAYERWAEGEGGTSRRERRRRGGRHRRS
>UniRef90_R6N0F5 Polysulfide reductase n=2 Tax=Firmicutes TaxID=1239 RepID=R6N0F5_9CLOT
MESTLFKISEPSRVSGVLYGPITLVYGLGGIALTLADKYILSKIKCNKVLKIILSFIILALILTTVEFLSGYLCKLIFNTEMWNYHNKPYHIGKYICLEYIPLWGLLGTLIIYVLKPFFDKIIKLIPKEATYLLYLIMILDIIITLFTK
>UniRef90_A0A506TYF2 Sigma70_r2 domain-containing protein n=1 Tax=Pararhizobium mangrovi TaxID=2590452 RepID=A0A506TYF2_9HYPH
MTRKNMHINKRINFVIERRFPSFYEEIENVLDQAVDKYQTQNIRDPRIISYIISKCDTDTAVLVSRENDVDLLNDKDKISKDEKINKYLEIFEEYESRIHSFSSEELNAAYKEEKKLEENENLREMMAWDERQEFSDPMASADFDTWLSMATWTVDEAVSLSLAKEPGTVDRSSGFYKFSLKTGSPFISEYEKRTDQLSRAIKAQDLDKPLRPEAVMAWFQGQGMQGAFGGRVHHIARYDEEVEVLRRENERLKRLVTSPEKLETNSVLGLYRLCLGMAICRYEYRTDMRNGAAKSIAGEFAEVGLSITDDTVRKHLQRASKELGFEWKTRSPFEVRSKLRAKPKSD
>UniRef90_UPI000A646756 hypothetical protein n=1 Tax=Colibacter massiliensis TaxID=1852379 RepID=UPI000A646756
MADIKKVINEKKEALRQICKGFTSNNTGGCCGVSLPPEEQAELKRLKEGKT
>UniRef90_A0A7L5ZNR0 Tetratricopeptide repeat protein n=1 Tax=Exiguobacterium profundum TaxID=307643 RepID=A0A7L5ZNR0_9BACL
MLARLAIALFWAAIFFGLGAWSGGHLRPIGDALVTGXANTGEKAVRLWTWARHGAPDAAPDASPATTAAALVDKGRAAFARGDLQGAVEAYREALELRPGDADILGELGNVYYTSGQTAEAALAFHAAAEALIDSGRIEAARALLPAVRAAAPTLAADLDTRLAAAAPVTQ
>UniRef90_A0A4T2C462 DUF445 domain-containing protein n=2 Tax=Subtercola vilae TaxID=2056433 RepID=A0A4T2C462_9MICO
MKLLATGLLVLMAVIFAVSFALQARYPWLQYVRAASEGGMVGALADWFAVTALFRRPLGLKIPHTAIIPTRKNEIGESLGEFVEENFLSDAVVQEKLASVGVSRVVSGWLSQPANAHRLTNEIAGGLTGALSFLSDDEIRSVIEGLARTHLVGRDWSPQIGELASSVLATGHQHIAVDLLVDKAEQWLAANPESFTALVSKRLPSWLPSFVDRLVDDRVYREALKFVQSVQANPGHPLRKALDEYLLRLADDLQHDPAMMKRVEALKEQVLDDPRLRELAALAWQAIKDALTASLENPESALRLTIESTLVDVGTRLASDARLASTVDTWVANAASHLLASYRHDIAAVISETVSRWDGKEASQKIELQVGRDLQFIRINGTVVGSLAGLAIFAVAQGLLSAF
>UniRef90_A0A2M9FV78 Enoyl-CoA hydratase n=1 Tax=Minwuia thermotolerans TaxID=2056226 RepID=A0A2M9FV78_9PROT
MNTTSEVAVGRVDGVVEGGIGWIVFDNQRRHNAMSMAMWEQLSEVLDKHVADPEVRVIVLKGAGDKAFVSGADISEFEKRRSTPEQSDAYSDAGTRAYTALADCPKPTVAMIHGYCLGGGLAIAVNCDIRIAAEGSTYSIPAAKLGIGYMVAGVERLLNLVGPAWTKEIFFSARRFEAAEALNMGLVNRVVPLENLADDVLTTAKQIASNAPLTIAAAKMAVDELLKDSANRNLGACERAIAACMQSSDFVEGRRAFMEKRPPRFTGA
>UniRef90_A0A2D7S292 Cysteine synthase n=1 Tax=Flavobacteriales bacterium TaxID=2021391 RepID=A0A2D7S292_9FLAO
MSNNIKEDLLLFNELVDVFLEEERLKPVTEYIEPNNVQQLLDIKLENNGLSKDKFKEALKQLILNTPKSSSKLFFNQLFGGRHSKAVLGDLLAAILNNSMATYKIAGPQVSVEKEILCQVYKLIGYNKNPGGTFPTGGSMSNFMSLVMARDKVNLEIQQKGITRKLVAYTSENAHYSVSKNASFIGLGKSNVRYIKSDLYGRISVMEFEKQVEKDLKNGFTPFYLNATAGTTVLCAFDNVNELSKCCKKNNMWLHLDGAFGGSVIFSDKYKRLVKGVNLTDSFCFNAHKTLGAPLSTSILVVKDKQDLYNSFNSKANYLYQTHGNEFNLGQTSFECGRRNNALKFWTMWKAIGLKGIASIVEEQFQLANAARKYIISNQDYSLYSFDDSLSICFNYKNFDPEDLCTKLFEMNSLMVGYGTFKKNRFIRLVIVNGENSLDDVTRFFGILERFTEEHQEHIKKI
>UniRef90_UPI001867027B BppU family phage baseplate upper protein n=1 Tax=Staphylococcus cohnii TaxID=29382 RepID=UPI001867027B
MAIYKNKDITTNIESEKLSINNSNTSFYTEDKGSAALRIFIKYRDGAFNLNDTNLTPTLDLFHNDGSIWRDEPLEVIMSDKGLLQYNIPDNVIAHAGLIKAKLFLRNAEQSVHVANFTFDIKDSGIEEAVAKEINVNIVDDTVKRIMNEQPELFKGEKGDDANPEDVKVLLEPYVDEKTNQEFEKLSSAKQVDGEVINARGSDKSLKSRLENPNYVPTKDEMNTKVIATHYDKKPMVTFIDDDGRTEVLQKWEPILQEKGNKLTIALVSSWIDNKESTVIKWEDVYRLKEQYGVEFVNHTYEHKHAQQLTDAEVDAEFRKNKEVLKREGLTHDIIVQPYGENTDSVRRISRKYAKANVSVKEGVNTLPLDTYRLFRISLGEDLYTTFEQYKAILDEAISKNAWVIFKSHSQYTSFDENQLQLIRQIIDYCRENGFIEATMEEGLRDRGNLIDVGDYTLKAKDSDYFILDKEGNIHSRKFAKNYYTLKYNTVDFNTPITNFEDMTTSTLAIVSTNSQGFPNNASGQLLTTKSESLVLSYQLYLPNNSNEIYKRRWNTKTNNWTEFELITPAMKELKTRHYAGNVDLNGQNTVDVVITNSVLDTMNFNTGDVISATVETPLPNGIMYNVFITEKNKITIRYSNVTTEKITIPATYFNFRITYK
>UniRef90_A0A7J2S7S4 DUF5050 domain-containing protein n=1 Tax=Thermoplasmatales archaeon TaxID=2268204 RepID=A0A7J2S7S4_9ARCH
MRRSYVKTIKSNSKMMKNTSLICISLLLINVLGSTGVLQNCGKKEEQVYFNFISRSMPHGRIIFQSLRDAPLGNPNSIKKYWELYSMDVDGSNVTRITRNLYWEHQPDISPDGNKIVFAIHYNPSIDTKETDSGWEIAVMDIDGTNLTRLTSNDKLDACPHWNHDGTKIVYVSDTYGNFSCFDIYIMDPNGENVTKLTNAGIGEFYADPSFSFSDGKSKILYIHSKGYTSNWDIYMMNEDGSDQHLILSTNNKYLAYHDPMFSPDDSAIVFSAKLNENGNHGIPIYKIFTARVDGSNIRQITDNDDESDVVPQYSPDGGKIVYFTWKWNGVVFERKIRIINIEGTNERIISSFSPEEMPSWYPRYIRIEKPVEKHLYIADREIIRLLKNTVIIGKITIKADAYDENGVEKVEFYIDDELKNTDYIMPYSWLWDEFAFGMHEIKVIAYDNEGNADTDEMEVAIFNF
>UniRef90_UPI001D13EC9B DUF485 domain-containing protein n=1 Tax=Saccharopolyspora sp. HNM0983 TaxID=2781240 RepID=UPI001D13EC9B
MRPPVAAGPPDYRAVVDSAEFQQLRTRFRAFVFPMSALFLAWYLTYVVIAAYAPAFMGTPVLGLINVGLLMGLGQFVSTVLIALGYRRYAERRVDPLIDDLRADPPREGDR
>UniRef90_UPI0021BCFAD5 translation initiation factor IF-2-like n=1 Tax=Macaca thibetana thibetana TaxID=257877 RepID=UPI0021BCFAD5
MALNSGRRKEATLQKGVRTALEHSQERSLGGRPEWLRGPGGPGGPRSPAGQPLQPAGSDSRSSANTALGATPTSTRGHLPSLPPPDLQDRIYPGRPPARVSAPSRLGLSPPCTEMAAAGSLLPQPVAASSGPGWPRPPCVSRGTHCAVPVPPVLS
>UniRef90_A0A4U3CDX7 ATP synthase subunit b n=1 Tax=Blastococcus sp. CCUG 61487 TaxID=1840703 RepID=A0A4U3CDX7_9ACTN
MNILAAEQSVLVPPVGEIIIGLIAFAIVLFVVVKFVAPRFEQVFQARREAIEGGIERAEVMQAEAKAALEQYRAQLAEAREEAAQIRDAARAEGQQILEELRAQAQEESARIVARGEEQLATQRQQIVQELRGQIGTLAVDLAGRVVGESLADDARRSGTVDRFLAELDGMSAAGNGQGGAVPAGESNR
>UniRef90_A0A450TCR7 Uncharacterized protein n=1 Tax=Candidatus Kentron sp. FM TaxID=2126340 RepID=A0A450TCR7_9GAMM
MDKKSPFLAQFLARMSAFERENTMFLLVFHPVSADVIFWECTPFSVLLPGHFLFFSHVFGPPSLPQGAKYHSLGLWR
>UniRef90_A0LFP1 Ketoisovalerate ferredoxin oxidoreductase, delta subunit n=1 Tax=Syntrophobacter fumaroxidans (strain DSM 10017 / MPOB) TaxID=335543 RepID=A0LFP1_SYNFM
MNKAREDKFTQARSALCKGEAGRTGDWRSVRPRIDHAKCIPSKNRRPSCFICWLYCPEGVVKRSIPVEIDLDYCKGCGICAEECPGKAIEMVEEHEEA
>UniRef90_A0A351GGH7 TonB-dependent receptor n=1 Tax=Bacteroidetes bacterium TaxID=1898104 RepID=A0A351GGH7_9BACT
MVKKILNLILFLGLSFLSVAQTTTVTGTVKDTTGQTVIGAAVVVKGTNNGKITNENGAFSLNIQDPKTAILQVSYSGYKTNEVAVNGGKNIEIVLRENSLGLSEVMVVGYGTSTKKEFTGANSKVDGEDLQKLNIPRFDQALQGQVSGVNISTNSGSPGGGASIRIRGLSTFGDNDPLILVDGVVFDAAGLNSLNPDDIASVNVLKDATAGIYGVRAANGVILIETKKGKRNSKPSISISSYFGVQSTSRKLDLLNATEYATLKNEMFANGGDDVPFSNVNLLGEGTDWQAEVFQNAPIQSHNITISGGSEKTTYSIGGSYFTQDGIVGLDKSNFTRMNARVNLSTQMSDKLRLTSVFLYTKEQRSTLRENQIGSVLYNTVNAFPTDSVRTSDGRYSYLEEVSDIINPIAQMENTFNEANVNKFVGKEELAYDITDNLTFTNRLSYNYAIVDDKVFSPLVWYGPGKAPNTALNEDLDPTSVEIAPGTSVDRGASVYEQRASYSDLNFESFLNHEVRIKSLHRIKTTAGLSVFTRNGQAVNGTAYNIPNNDLEFADISANLAPGGYLNNTGSFQFQERLLSTFIRGEYGYGSRFNGSFILRRDGSSKFGPNNRYGIFPTVSGSWVISEEKNYAIDRMKFLKLRVSYGISGNDQIDNFAYRGLLNGEGHYVFDDIITQGVAIGRASNPDLKWETTRQFNIGTDFTFLHSFDVTMNYFIKNTRDLLFQPEVSAVLGTYGAGSFPPFINAGDVSNKGFELEVGYKTKSSKIWNLSTGLNATFIRNKVIKTPKGVDFLPGASFGVGGGTATRFQEGYAIGYFIGYETDGIFQSQEEIDNSPVVQEGAKPGDLRYKDINNDGKISFSDDSDKTQIGTPIPKVTLGFNVKVDYKGIDLSGNLFASLGQQIVRNYERQQPYANQLAYNINRWTADNPSQEYHRLTTDLTRNTVFSDFYVENGSFLRLRNLQLGYTFNPLLLKKAKIQSARVYISANNLLTITQYQGFDPDIGSSGGTLAAGIDYGFYPQARTLMTGLSIKF
>UniRef90_A0A565C3H5 BHLH domain-containing protein n=1 Tax=Arabis nemorensis TaxID=586526 RepID=A0A565C3H5_9BRAS
MNLLNSDDNLSMIEALLTSSDLCPLTPPNLSLETTLQKRLHAVLNGTHEAWTYAVFWKPSYYDYSGDSVLKWGDGIYKGDDGNSPRRRMKTTAEKDHRSNVLRELTSMIAGEGFPVMSDGDNDVEVTDTEWFYLVSMTWSFGSGSGLAGKAFATYDPVWVTGSDQIYGSGCDRARQGGDLGLQTIVCIPSDNGVLELGSTEQIRQNSDLFNKIRFLFNFERSKDFSGAPSLMPNELENGNLSXXXXXXXXXXXXXXXLVYKQIQNSLIQDLNFSTATFTSARDIPGEILSFGDDGIRISENPNHNSYSDQIPNEAGKISTGGQKFDSSYQFNIDDSDQYKIDDSILVLENKRPKKRGRKPAHDREVPINHVQAERLRREKLNKRFYALRAVVPNISKMDKASLLGDAIRYIHELKSKAKNTESEKNAIQIELNKLKEAITGRRENAISSVGEKDAITEIDVKIIGFDAMIRVESSKRNHPGARFMTALMDLELEVNHASISVINDLMIQQATVKMGSRSYTEEQLRVMLISKI
>UniRef90_U4LXJ3 Similar to Putative alpha,alpha-trehalose-phosphate synthase [UDP-forming] 106 kDa subunit acc. no. O14081 n=1 Tax=Pyronema omphalodes (strain CBS 100304) TaxID=1076935 RepID=U4LXJ3_PYROM
MSTGTTFVAALHLPYTVQFRSKESRPSSSKSLSSRSLPPPIPETRANVPQLTLSTLRNDLAKTPYGEPIATPMPNLLESLGHGNIATSPTPPLTPTTTTAEELFFRVPSTNSIALGSPSDPSMRRIPTIPAARPKATPFLPGGENVVGRGYFDIPVTEKLAPATRPSRRRSSVASGASIYSQQEQDDWTIEKTDFGNGGLKNAVEASQDASENVYVGTLGFGTDTLDEATKVAIEGRLREDHNCLVAYTSNADFDGHYNHYCKEVLWPVFHYLIPDHPKSKAFLDHSWQYFEALNRSIADVIIKDYKKGDTVWVNDYHLLLVPKMVRDALGPDARIGFFLHVGFPSSEIFRCLAHREKLLAGILGATMVGFQTEEYVRHFLQTCSRLLNVEVQENGVLLDSRLVNVVTLPIGIDPIQLAEKRNEQEVTNWTEQLQQRYAGKKLLVARDKLDGVRGVKQKLLAYELFLKKNPQWVGKVVLIQVALTTTSIVESQSTVSDIVTRINCTYSTLDYQPVVYLHQDITYHQYIALLQIADALVVTSLRDGMNLTSHEFVYLQDKHHAPLILSEFTGSAAIFGGAEISVNPWDHSMCARALERALTMPSQEKEERWKKLYARVTGHTAAHWFSEFLSKLEDAWEEQQRCGSAHIPRLSAKILAEQYSAARKKVFFLQYEGTLVSWGSSSSTVVTSPQRIMDTVNDLMEDPTNVVYIMSSRTVQDLEQIFLRVPSVGLFAEGGCFLRPFGKEKWIRLADPELPWKSSVRDILDYYVERTPGTWIEERSCSFIWHLEKAEDKASAQRQAGDCGNHVNGSCESFDVHAIPVTGGLLVECRRWNKVNACRLVLEHMEERKWVVDWILVAGSGRDDEGVFEWANGLRVEEGEEKEGKSKREVVTVRVGTGHTQAKATTNGVAGVVTALQRLANISVNEST
>UniRef90_A0A8S0R5G1 Eukaryotic translation initiation factor 4B2 n=2 Tax=Olea europaea subsp. europaea TaxID=158383 RepID=A0A8S0R5G1_OLEEU
MSKSPWKNIGDWAAESERAEAEEREQAEQAAAAAQAGGGNFPSLKEAVNTKQKKKTKMSLQEFTMQPSYGSGSAPPSRGLTQEEMFRLPTRPKERPPDEMQHGRHGGGFPSYGNRPGSGYGDGYSDRPTREFENRRSYGGFEDENRRGPTRVSGFDQQTSRADGVDNWASGKKALPDYTSGPAGRPARYSSLGGSSDGISRADEVDSWVATKKPFVQSQPPQQARSSGFGRLEPDRWTRNEGERQRLVLDPTKSDRGGDADVLVKVNKSNPFGAARPREEVLAEKGLDWKKMDMEIEVKKQQHSVSSSRPTSSQSSRPGSTHSSRSESLTTLQSGMAEGAAKQTPKMNPFGDAKPREVLLEQKGLDWRKIDLELEHRLVERPETEEENSLKEEIEHLKKEFLEKSGEEQSCLQDLILKREKDLELLRRELDDKVRYSQKVFERPGSGAGRDAISIERPSRLAPYEEPRAGFPERPPSRPGAHEDPRAGHSERPRSRPGLSEKYRPGFPERPSRPGLYEESRSVFTERPSRSGSYEETRAGFSEKSPSLSQAYQDPRAVDYMERPRSRGTVNSRTRPIDDRKASQGGGVRGFVGSRDVDRSRPRW
>UniRef90_A0A1V5GBZ2 DUF11 domain-containing protein n=1 Tax=Firmicutes bacterium ADurb.BinA205 TaxID=1852897 RepID=A0A1V5GBZ2_9FIRM
MATFYNQATLSYNGTVTNSNITAGEILEVLSADKYAVTSTYSADSDIVYIISIVNSGSSPVSNITVTDDLGAYPFGEEEDYAVPLTYNEGSVGYYINGIQQTPPTVADLSPLTITGITVPAGGNALIVYSARTNAFAPLGAGASITNTASISGTGFGTITASEQITADNAIDLAITKALSPSTVEANGEVTYTFVIQNFGGNAVTPADDVIFSDSFSPAIGSLTAEYNGTAWYEGTNYRYSETSGVFSSLSGQITVPAAQFIQDPATGEWSVQPGISTLTIKGNIL
>UniRef90_UPI001F36B3C5 hypothetical protein n=1 Tax=Alicyclobacillus tolerans TaxID=90970 RepID=UPI001F36B3C5
MTTVFFKNLQINSVSQTSGVFHGDNYLGGFVSKTKSNEGFGEVSGQKNVVVECLDLVLDLDTLDTVVKKPPSPSSE
>UniRef90_W8SRT6 Transcriptional regulator, LysR family n=4 Tax=Alphaproteobacteria TaxID=28211 RepID=W8SRT6_9RHOB
MDWDKLRIFHAVADAGSLTHAGDTLHLSQSAVSRQIRALEEGLNTTLFHRHARGLILTEQGELLFDATKHMTKRLDAAAARIRDSEEEVFGELRVTTTIGFGSLWLAPRLPALYAKYPDLRIDLMLEERVLDLPMREADVAIRMKEPSQADLIRRKLMAINMRLYASPSYLEKNGTPQSLEELSEHRLISQNANSAQVSAGAVLVRELTSYDVGSHLTVNNYFGVLQGVIHDLGIGVLPDYLTQDFPEMVRVLPNVESNEVPVFLAYPEELRQSKRIEAFREFVTEEVIAHRKRLKESLGAQAG
>UniRef90_A0A0S8K1U0 Acyl-CoA_dh_1 domain-containing protein n=1 Tax=Anaerolineae bacterium SM23_84 TaxID=1703388 RepID=A0A0S8K1U0_9CHLR
MRVIHEYTRGCGRREEGGVYLVSELSPLGTLPPWVAIEPPILYGGEHFRGYIYVNGDQLLAGDEEGTWLIGPSLDRLIGEEWKLTLGMPLKIRQKFGICAGLKTVEDVTEKLADLGLYSDKMYPEIATDIHRALEYLKQLDTPAEGAASQLKMAQRLGLSGAQILARCWLIARQLLWDLPLRDPHNDIRVELRKDLARVMVLVGALEDARDLLTGRSREARATGRRSGALTEANTAAAPAPPNGGPARVERWPSVWLHAGRILRAAYSSSIVARSPCFVINSSHFCQTASWNCSRVPRSARLSASCRKSAHAGNGNLIAS
>UniRef90_A0A5P8D839 Lipoprotein n=1 Tax=Mycobacterium phage Marshawn TaxID=2652423 RepID=A0A5P8D839_9CAUD
MNRTLKGLAAAVAAATAVTVVGCSSDADVASDNLSKASEQFEVSRRIVAINGVTDKYLFVVEGRCSLEYPENRTEIVCKLDDGNLIKHVVRQSDNVTLIMEQTNGTAVSTDHYRVIFKPEVIIPNVDRP
>UniRef90_A0A1X7C2T9 histidine kinase n=4 Tax=Cellulosimicrobium TaxID=157920 RepID=A0A1X7C2T9_CELCE
MLRRLSVRGKILAALAVPVLVLFAAAAIISAQAISTARDASQTSALVAALAAQDAAGTEIAAERTYAFLDARGASEDAEAQMMAQREKTDKALDVRDRAYERLDTSALDPRVREALADTIADRSDLQSVRQAIDRSGLGQLQRNSLYGNLIDDALEVPRTLADTTPDRGLAQYLDTYVLLDELLAQQALEQPVAGAVLQAAQVGQESIATNQQAAVLVTTGDELAKRTQTAVRQLPGELRLETATATYNQIRQNLMGSRPGATPASQAAEWPALSQADRDQTAPVRDAVRVETEKKASDLAAAATTRAVVTILVTLAAVILSVLVAGLIARAIVNPLRRLTDAAEDVRDQLPKLVEQVAVPGQGPGIDLAPIAVESTDEVGQLATAFNDVNETTIRVAREQAALRGSIAEMFVNVARRDQVLLNRQLAFLDDLERSEEDAGTLSNLFRLDHLATRMRRNAESLLVLAGIDSGRRVRQPMPASDVIRTASSEIELYDRVRLNLVVDPLMLGHNALNAAHLLAELLENATMFSEPHTPVEVTTGRDENFVYVTVRDHGLGMTPEEIADANRKVATHAASDVVGAQRLGLFVVGRLADRLGAKVRFSAGGDEQGTEVVVSFPAVLFVPDSSVPLPQPTDPLETSTQAAAQQLAGPAAAPALPAPEAPAPFAAPAATASFPAVEPEAPAAVPVDIDALTDGTTQTGMPRRRSRTVDPAAAAPSASFASGPQTGAIVLPPLATPALPDQLPAADEAWTPPAEVADAGSALPSRARPAATPVEPVSAEIPVLDVSTRSALFSSFRPMGDRPAENPVELPAAPDVTATDIPLVTEVPTGSAPVPQDAWSPQPAPAEEPVAQAWPAPEAQAWAPEQAWAPEQPAVAAEQPPAAPEQPAEQSWAPAQAADTWAPSSVGDESLDATRVVPPVPAEPAEEATVARVPLAERAPAVSAPAAPEARPAEDVPVVESANAAAPAEDIPAELTFEALPRFEELMADLPTRRSLRESQARKRGLFGRRPRTTATPQARPAGTSASAAPAATAPAPAGPSAPAPSAPAPAAPAAAATPTAAPVAPSIPVAPQEPAAPARTSAFAPRADQPAPAASFAPPTTPAEEQVPASPEAAYTPLETAYSATEAPAAPQPSYEPSYAAPEQAYAPDVAPSEAGREPAPARDSWAPEPADAAEPAGYGPPSPLVRRPVSETTLEPLEPGYISDSVEARSDWMASAVLYEEMSTLLQGSTDFQEATLADSNDGIYQPLKVDATTASGLARRSRGEEREGYVDRFTARIDRDPEQLRARLSAFQSATARGRVEGQDETSSTWDPQAVDYVPDSAPQAR
>UniRef90_A0A6G5YKI4 Haemolysin XhlA n=1 Tax=Bacteriophage sp. TaxID=38018 RepID=A0A6G5YKI4_9VIRU
MDYMDDYRQQVTDARFQDLKEVINTRFDDMNSRLVTISKQLDNYETKDHAASEINHLAFRCDDLEQKLQDAEDELAKFREGIYRKAALLTTVLSSIVSLVFGILQFVIH
>UniRef90_UPI00190A6268 non-ribosomal peptide synthetase n=2 Tax=unclassified Streptomyces TaxID=2593676 RepID=UPI00190A6268
MEKYRSLPAVGDTVVQLPDAGIPELFERQAAMTPDAVAVVSGDASMTYGELDAGASGVARELLRRGVGPESVVAVAFPRSPELLVALLGVLKAGAAYLPTDPDYPAERVGFMWGDARPVLLLTTAGTAVDLPDSCPRLTLEDLSPADAAPGGRTPYGGPAVHADQLAYVIYTSGSTGTPKGIGVTHRDVVALAADRRWYGGAHERVLLHSPLAFDASVYEIWVPLLNGGRVVVDPDGDLTPGGLSRLVADHGITAVFLTTALFNLLVDEDVRCLAGLREVWTGGERVSPAAFRQAVDACPRTTFVHVYGPTETTVFAVCRPMDPARPVGGDVPIGRPMDHTRTYVLDGSLRRVPPGAAGELYVAGAGVARGYLNRSALTAERFVACPYGTAGERMYRTGDVVLTTPDGELVFQGRADAQVKVRGFRIEPGEIESVLLAHPDVAQAVVTAREDRGAGTGKQLVGYVVPAGAGDGGAALDSASLVGELRTFVAERLPEFMMPAALVVLEQLPLTPNGKLDRTALPAPEFTAMTYRAPRSAGEETLAGIFAEVLGLGRVGIDDDFFTIGGDSIRSIQVVTRARAHGVSVSAGEIFRHRTVTGLAEAAAANARDGGSPVLAELDGGGVGPMPLMPVAKWIEELGPGFDRLSQAMVLELPAGIDRGGLAATVTAVLDRHDLLRARLIPDGLLVDPPGSVDADRLIRDVTCDGQWSGEPWRHLLVGELDEAAGRLDPAAGVVAQFVRFEPPSGPGRLLVVLHHLVIDGVSWRILMPDFAAAWKRIRAGEAPEPAGTLTSARRWAHALVDDAAGAARMAELPLWRSTVDGPDPLLGSRRLDPAVDVRSTVEKVRVLLPVPVTEALLTAVPTVFHGGVNDGLLTGLALAVGQWRRTRGVDEPSTLLTLEGHGREEDAVPGADLSRTVGWFTSVFPVRLDLAGIDLDEAFAGGPAAGAALKAVKEQLLAVPGRGIGYGLLRYLNPETAEVLRAYPMGQIGFNYLGRFSAADMPEELRGLGWTGTAELAEFTELAELDAGHDAAMPALSEVDINATVTDTAAGPRLGAVFGAPTGVLSPAEVRELADLWCAALRGLARYAAEPGAGGLTPSDVPLVSVGQREIEAWEKVYPALVDVWPLTALQSGLLHHSMLAGADADTYQVQLVFGFEGAVDASRMRAAAQALLDRYASLRTAYVPDSAGDFVQLVVEGVTLPWREVRVAAEAYEEFLAEERSVPFDTAAPPLLRTTLVRIGAERTELVLTAHHVLFDGWSEPILLHDLLCLYASDGSAPADPPSFKDFLAWLARRDQEQSVRAYARALEGVTGPTLLAPADPATGAAGFGELDVDLTAAEAQMLARRAADLGTTLNSVVQAAWAVLLAELTGGSDVVFGATVSGRPPTLAGVDSNVGLFINTLPVHVSCAPWKTLARVAADVQSAQAALLDHHDCGLADLHEATGLGVLFDTLVAFQSYPFDNTSIAEASSAAGLGVPSFRSIGGSHYPLVVMAEQDPHLRLRLQYRHSAFERDAAGRMADRFLRVLRAFLADPAGRVGAVGIRTPDERNTSRPEPGTPEVSVPELFVRRAAAMPDAPALVVDEVPVTFRELNARADRLAGACLGLGLGPDSVVAVRCSDPVDQVVALLGVLKAGACFLPIDPEDPPQWSDAVVRDAGPRAVVVDQEAAGPSWGVPRIRVEAPAGDSGPADGGPTGPALPGHMAYVDYVPDESAQPCGTAVTRGGMAARVPRFETFFPGETLAVGPGTRATDLLLALCAGRTVEVRKEAPSAHGDAPDSDRVQVLSPSLAPAAAEAVGELYVTGDVGRGHPGRPGLTAQRFVADPYGTAGSRMYRTGVLGPQGAPGTPAVGSPEVRTGRRAVESVLLAHPGVARAAVVTDGPGLVGYVVADGQAAVVADELRAFVARHLPDRLVPSALVEVDRLPMTANGRLDRRRLPAVAGEQHRTARGEREVLLSRLFSDVLGREEIGIDDDFFALGGNSLLATRLIGRIRNELGVEVSIRSVFQYTTIAELDAQWDDIATASGPRLRKTSRK
>UniRef90_A0A4R1FKP2 Lipoprotein n=1 Tax=Nocardia alba TaxID=225051 RepID=A0A4R1FKP2_9NOCA
MGVVSEIEGSRRRIMMSRSVSYTLPAVVAVALVSAGCGSATPKPAPRAASATLTTTSKPPLTTSRSATPTTTAAKSAAVGVCVDKTTNVRVADDRCDTGSSTHSRFWYQHTDTFVYPAIGVAVALAAGSFLRPTTGEVFDRGAPTDGGTVARGGLGKARPDSSGGGGSAGS
>UniRef90_A0A5E4BYY0 Calmodulin protein 4-like n=1 Tax=Marmota monax TaxID=9995 RepID=A0A5E4BYY0_MARMO
MTTVTIVNQVELAVTRVQGGRLTSPRAFPSLLTLLFGGFLDRNGELDFSTFLTIMHTQIKQEDPKKEILLAMLMADKEKKGYIMASELRAKLTRLGEKLTQKEVEDLFKEANIEPNGKVKYDEFIQKITLPVQDY
>UniRef90_UPI00101D8BA6 hypothetical protein n=1 Tax=Sphingosinicella sp. CPCC 101087 TaxID=2497754 RepID=UPI00101D8BA6
MTDGARLFLDAWTHARPQPPARRAATLLARLGGEAEPERLPIGVRDRRLLELFAGMAGAHLAGVAECDSCGGAIEVAASVDMLMSGPPTAPILVEIDGERVPVRFPTTHDVLAAVAAPDPSRRLAELCAGKGELGAGEAEQVGAALLAADPLLDPQIAVTCPDCGAETVFGFDVGAFLWAKVEDRARHLLSQIHRLACAYGWTESEILKLPEARRAAYLELSAA
>UniRef90_A0A8D2QA42 NME/NM23 nucleoside diphosphate kinase 3 n=1 Tax=Zonotrichia albicollis TaxID=44394 RepID=A0A8D2QA42_ZONAL
SSGSKPSIRTNSFPSPCLEASPPELNLSSCLPGLVPSAQLQHPGSQRSVCSVQASEELLKEHYSALRDRPFYGRLVKYMSSGPIVAMVWQGLDVVKTVRSMIGETNPAESRPGTIRGDFCVEVGKHSCAKPARNESAFPEQKFSLLCSDQS
>UniRef90_A0A8D2AEW9 Espin n=1 Tax=Sciurus vulgaris TaxID=55149 RepID=A0A8D2AEW9_SCIVU
MAHSEEAALLPGNHVQNGCAADPKASRELPPPPPPPPPPLPEAQSSLPPAPPLPLEGAGSGQRRSSSSTGSTKSFNMMSPTGDNSELLAEIKAGKSLKPTPQSKGLTTVFSGSRQPATQPDTQVPPVSPAPSRARSPTPPAVGPQPLLNGSIVPAPPAIPAPGVQLNVETLVPTHDEQGRPIPEWKRQVMVRKLLVKMQEEEEQKRKEEEEEARLASLPAWRRDLLRKKMEEEREQKRKEEERQKQEEIQREKEQSEKLRTLGYDESKLAPWQRQVILKKGDIPKY
>UniRef90_UPI001E3E9EE4 hypothetical protein n=1 Tax=Mucilaginibacter roseus TaxID=1528868 RepID=UPI001E3E9EE4
MMISIAACKNDNDNNPEPSVESVTIDGTSYPTVKIGKQQWISINYSGKGGVFYNGDRDVKYGKLYTRKEAQAIKLQDGWRLPTRSDFVKLASNFPNISADGYVNLKPEGVLKLASSSGWRDKSGDNSSGFNALPAGICKVEADGDNDYSYRGIATQFISSTTETFNDNGATRARTTTFFLQIANSSSQPPTTETAGGVVDVIRADDYRFSVRFLRDID
>UniRef90_A0A7W0CLV6 S1 motif domain-containing protein n=1 Tax=Nonomuraea soli TaxID=1032476 RepID=A0A7W0CLV6_9ACTN
MLSIQQRIADELGVREGQVSAAVDLLDGGSTVPFIARYRKEVTGALDDAQLRTLEERLRYLRDMEERRAAILESIESQGKLTDELREQILAAETKARLEDIYLPYKPKRRTKAQIARELGLEPLADALLADPSLDPVATAGPYVVEGLADAAAALEGARAILIERFAEDADLIGSLRERMWSYGQVSSRVKEGKEEAGAKFSDYFEFAEPFTKLPSHRILAIFRGEKEDVLSVALEPEEGDEYELRIASRFGVSDQGRPADKWLNETVRWAWRTRILVHLGIDLRTRLWQAAEDEAVRVFAANLKDLLLAAPAGARTTMGLDPGLRTGVKVAVVDKTGKVVETATIYPHEPKRQWDQSLAVLGALCQRHGVELIAIGNGTASRETDRLAAELVKHMPGITKIVVSEAGASVYSASEYASKELPELDVSLRGAVSIARRLQDPLAELVKIDPKSIGVGQYQHDVSETKLSRSLDAVVEDAVNAVGVDVNTASAPLLTRVSGIGSTLAASIVAHRDGNGPFRSRTALKDVPRLGPKAFEQCAGFLRIPGGDDPLDSSAVHPEAYPVVRRILTSAATDLKTLIGNTAALRSLKPADYVDDTFGLPTVTDILGELEKPGRDPRPAFKTATFKEGVEKISDLAPGMILEGVVTNVAAFGAFVDVGVHQDGLVHVSAMSRTFVKDPRDVAKPGDIVRVKVLDVDIPRKRISLTMRLEDETEQPTSGGAAGGGSGRGPRQSGGRPGGPRPASQDGRSTDTRPARDGAGGDASGRGGSRDGSARQGAGSGGAGSGSGRDGARGNRDNRGQRGDRSGDRAGDRSGDRAGDRSGDRAGDRSGDRGNDRGNDRRGGQRSGGDRRQDRSAPSGAMAEALRKAGLGGGSDTR
>UniRef90_UPI00068DFD47 tetratricopeptide repeat protein n=1 Tax=Herbidospora cretacea TaxID=28444 RepID=UPI00068DFD47
MNPPEASGEAAVHNEITNGVFFSAVIQGRDITVQLPPQITPALSGMPAGSPAFTGRDLDLRDVLDVLAPVGTTDGSVPSTAVSSAAVVVTAVGGMGGVGKTELAIQAARTALDCGWFPGGVLFVDLFGYDKARRVEPGEALGGLLHALAIPGDHIPSDTEDRARLYASVLAAYAAAGRRVLVVIDNVCSAEQARPLLPTDGSSKAIVTSRHTLGMLGARLLDLKVLAEAEAVALLTRAVDIARPGDTRVSDHPEEAAELAHLCGYLPLALQIIAALLAENPVRPLSTMIEELADESSRLDEMEYGEVAVRAAFELSYRHLAAQEARVFRLLPVNPGPDVSTQAAAVLTGLEAVPARRLLERLARAHLIEHGLGYGRWRMHDLVRLFAEEHGRADAAADGRADALTVLLVHYHSTATAACHHLAATDRDAAKGGFGGRGDALTWLDAERANLVAATHTAAGHDPHRAIARDLPIRLGPFLQLRRHFDDWVALTTAALDAARELGDRRGEARASGDLGLAFRYSRRFDESISAHREAARIWRELGDRGGEARALSNLGLALQEVRRFDDAVAANQESLNIQRELGDRSGEARSLGTYGNALVLKRQFDEAVNVYRKARDIFHAMGDQSMEAAILANLGVALHELRRLDEVAVTYQDALRIYRELEDRHGQARTLTNLGHLLLEEQQLNLNDAVTNLQDALVLFRELEDRHGEARALNNLGLALQGLGQPNVAVTVHQQAVNAFRELEDRHGEAQALCNIGRSLLELMRFDEAIPHLRSALDLFAKIEDRHGAAQVLINQGVALTGLRRFDEAVAAIEEARDVFRELGDQHREAIALTNLEEIRRHR
>UniRef90_A0A7C6BF04 Glutamate synthase n=1 Tax=Rhodobacterales bacterium TaxID=1948890 RepID=A0A7C6BF04_9RHOB
IMMRSGAKSVTLITASGLPGPDTAPDDLINVVPCELEEAVEEGLQIIDHATVGRLIMKGSRVTGVEIVSLKKEVGKDGRKRRVASFGTERVVSVDMVVPCVGEQVDPEAFEGYIDGAYFWPDNPYGRIAEGVYAIGDARGNRGTVAAAIGDGRIAAEAVAAELSGEIDPPADERPVMELDGLNTAYYASTARVKVGKLAVSERTFEAEIEGAISRSEALAEAQRCLSCGNCLACDNCWTMCPDNAVIKTTELARDGSHYVFDYDYCKGCGICAQECPTGYIQSVPETS
>UniRef90_UPI0008A66679 hypothetical protein n=1 Tax=Streptococcus sp. HMSC072D07 TaxID=1739495 RepID=UPI0008A66679
MVKSLCISDSREGIIEHIPKGAIAYYLPNPRGRKKVFFTKETLLLMYHLIRLKYFSREMILDQYFILTGKELYNDALYSLIGNSRMPICQFSSNYNIGRTKFMYVPKVFASWLLSVIPQIPELAELTEVTEYDGSHYSLITNRMNGGTYGIKKINLHDANTRSLALKIGRALIENKVGVSPSELNITYFFPTNRELISVVPDAVIFVQGERYYIEYDRNTEQHFKLLGKIIGYFEESYYKGDTIFFVFDNISEPKDNYLNARVMNFISNVHNVKFKDSGLTYYEQAQQNKVSLYALPYVNAISQIAEVIHLELDHDSTKEDIELVDRFKNEHLVPYEVLSADLVDEPDSPFDLTLTYIDDFFDKKEMPLLKLNYGDISNPDYFENLYKEYKDVYPQCGIIFSASISKQYYPIPHDDFFLAIYIR
>UniRef90_UPI0019112769 ABC transporter substrate-binding protein n=1 Tax=unclassified Pseudomonas TaxID=196821 RepID=UPI0019112769
MTKPLETLWYTHSPVPTGLGIAVQSGRLAEAFTPFGTNIQSLRESSEREVREAHYDHHLQNSVRHGGNIPAIWAYASGVETRVLGLSWSDEVQLILTTEESGVRSIRDLKNRRFGIPKWANVQIDFTRAQALRGLENALKLEGLAVGDVELVDYPYGGTYSDDAKRHLYGAEVSLGTSRVSRRNNELIGLLRGDIDAIFLKGAHAVHLAHEFGLRVVVDTGSHPDPLIRSNNGTPRTLTVDRHLLENHFDASRTLVDTVLRTEQWAWANPVETRRFLARELNTSEYWVAAAYGDDAHRRLRTALDSRSIEALQDFTEFLFRWGFIPRRFDVKAWIDFRVLESVIGSTSRLAV
>UniRef90_A0A7C7DC20 2-isopropylmalate synthase n=1 Tax=Firmicutes bacterium TaxID=1879010 RepID=A0A7C7DC20_9FIRM
MRQVFIFDTTLRDGEQSPGVNLNVEEKVEIATQLAKLRVDVIEAGFPVASPGDFAAVEAVASQIKGPTIAALARTMEKDIDKAWEALRYAERPRIHTFIATSPVHMRYKLRKSPDEVLRMAVEAVRHAKSLTNDVEFSAEDAARSDRGFLREIFEAVIEAGATVINIPDTVGYSTPWEFADLVSYVKANTAGIDRVTISVHCHNDLGLAVANSLAAVTAGATQVECTINGLGERAGNAALEEVVMALRTRKDYFDVSVGIDTTHIYRTSRLVSSLTAVFVQPNKAVVGDNAFAHESGIHQDGILKERTTYEIMTPESVGLPESRLVLGKHSGRHAFSEKLKALGYSLTRDEMEKAFNRFIELADKKKQVSDRDIEAIVEDELVATPGFFELEYIHVISGNHAVPTATVRLKTVDGSVEEAACGDGPVEAVFKAVDAAAKLETHLVSYSLNAVTGGKDALGEATVRIKDNGDTYVGRGTSTDVIEASAKAYVQAINKLLHNRRTFSKAAAPAGAAGVSRPVQDALGTSGS
>UniRef90_A0A8H6QPS6 Uncharacterized protein n=3 Tax=Aspergillus TaxID=5052 RepID=A0A8H6QPS6_9EURO
MAPTKEAASSTSTSTSTSSSSPSSCPTNSASDANTNISDHGSGDSKTLAVGVGVGVSLGVVSLISLIWGVYERRKRQQLLNSMPSMMPMNSDPYAPPAVAKNQYTEPQELAP
>UniRef90_A0A6P6W929 uncharacterized aarF domain-containing protein kinase At5g05200, chloroplastic-like n=4 Tax=Coffea TaxID=13442 RepID=A0A6P6W929_COFAR
MAGVSLMRGMVNDGCLSIFHHQSRQLAPVTVRVSSRSRSTAARKLQFLSKRSSFYARYSQSRDIFTSRVQDRMEKLPKLVEDIVQTSLSTGPRGALRLAQGIQAVLGVGSEWLADLSKTANSSTTLPTEMQLGLLSPLYLRRLFERMGATYIKLGQFIASAPTLFPPQYVQEFQYCFDRVPAVPFADIQAILREELGQPIDAIFEYVDPTPLASASIAQVHGARIRGTQEDVVIKVLKPGIEDTLVADLNFVYIVARILEFLSPELNRASLVAIVKDIRESMLDEVDFKKEAANIESFRRYLEAMGLTRQATAPKVYLQYSTRRVLTMERLYGVPLTDLDSISALVPSPEASLITALNVWFGSLLACETFHADVHAGNLWLLRDGRIGFLDFGIVGRISPKTWAAMEIFLQSLATEDYNSMASALIDMDATNKDVDSMAFARDLEKIFSSIQDLDTEIVVATARGPNTSTTAVAANVIVDERQMNALFLDLVRVSESYGLRFPREFALLMKQLLYFDRYTRLLAPNLDMLRDQRITIVPNQRSRRIY
>UniRef90_UPI001C62E845 hypothetical protein n=1 Tax=Qipengyuania flava TaxID=192812 RepID=UPI001C62E845
MAIASVWVLSGGLGGGSLLTWVVGLPGFLFFGGAMVGFVAALFDRRVKVSVSPQGLVVYPHSPRPIALRSIKRIGTQQSQVRILLHKPSKYPVEGRWRKALIAISSGIQRANGDVWMFCQLYDCSAREMVDAIRAARPRTKFEQEIDAVVASWDENGGPYGDAAHG
>UniRef90_A0A1E7NDJ8 3-dehydroquinate synthase n=37 Tax=Actinomycetia TaxID=1760 RepID=A0A1E7NDJ8_KITAU
MTDTTVRIHVGGSAGHDPYDVLIGHQLLGELAPLIGTRAKRVAIIHPEALAATADAIREDLAGEGYEAIALQVPNAEEAKSAEVAAYCWSVLGQTGFTRSDVVVGLGGGATTDLAGFVAATWLRGVRWISMPTTLLGMVDAAVGGKTGINIAEGKNMVGAFHPPVGVLADLGTLETVPRHDYVSGLAEVIKCGFIADPAILDLIEADPEGAKSPAGPHTVELIRRAIQVKADVVSGDLKESGRREILNYGHTLGHAIERNERYKWRHGAAISIGMVFAAELGRLAGRLDDETADRHRTVLASVGLPLSYRADAWPKLLDAMKIDKKSRGDLIRFIVLDGLGKTSVLEGPDPSLLVAAYAEVSA
>UniRef90_A0A1E3H4Y8 2-keto-3-deoxy-L-fuconate dehydrogenase n=1 Tax=Methylobrevis pamukkalensis TaxID=1439726 RepID=A0A1E3H4Y8_9HYPH
MTDRLKGKTAIVTAAAQGMGRTAVLAFAAEGARVLATDVNAERLAALADVPGVTTRLLDVTDGAAVAALAAEAEAPDILFNCAGFVHHGTVLDCDEAAWDFSFDLNVKSMYRMIRALLPGMLDNGGGSVINMASVASSVIGAPNRFVYGASKAAVIGMTKALATDFVARGVRFNAVCPGTVESPSLEGRMRALGDYETTRAAFVNRQPMGRLGTAEEIAHLVVYLASDESAFMTGQAIVIDGGWSNT
>UniRef90_A0A374BYN1 ParB/RepB/Spo0J family partition protein n=2 Tax=unclassified Firmicutes sensu stricto TaxID=84086 RepID=A0A374BYN1_9FIRM
MSEGKMNIGSAEGDQVLELDINRLRAFKNHPFKVTADMSMVELKDSIEKYGILNPFIVRPVPEGYYEIISGHRRKFAAKQLGYTKVPVIIKVMKNDEAIVAMVESNLQAGLIFV
>UniRef90_A0A254RGW8 Endoglucanase n=1 Tax=Fibrobacter sp. UWR2 TaxID=1964352 RepID=A0A254RGW8_9BACT
MSFKKLITTSTASVIALFIAACGDSDSGLRPVNENPDTPSSEAAVDPSSSSVADTSAQIPPVTGTGLLIDDLEDGDGSTLIGSGWYTYDDHDNGGASVITTPNVTEKGDPLPTATDNGSLYAFTVNYTLDKGDYAYDPYVGWGLLVPDAIDCSNFGGISYWYKGGKHEIHVETTDVTDYDVHLATVPASREWKQVSIRFKDLAQGGWGEEVAFDPFHIRAVSFQAKGDKVTDSLSIDNLYFQDTSEVEKDKPDMTIMDPIIPTVVIPEDLTISSPLQEKAMKYLNKGINITNWLEENKAYFKGKFKFDESDVKLMADNGIKSLRFPIDLDSYATNRDEFVADTTDTVELKFDDENLFAVLDSFVEWTGKHNMSFVIDYHEYDNSYNITSSKNARYIKMMANVWKHVAAHYASNEREDIFYELLNEPDMTNGAVKSPAWHAAAQEDVDSIRTVDTKHTIIFGDAEWYSISVLSKSEPLNDDNVIYAIHTYEPFIFTHQSASWAETKTIKNLMFPYDKEKWSEYSADFGVTKSTPSHIKNSLKNYNRTGSMEAILKSVVPAKKWAIEHNVPVIINEFGAYNLKTDKQSVLNYMSAMRTISDTLQIPLTHWGYTGGFALFDSEDGVKGTKLIDGMKEAYGL
>UniRef90_A0A0A9IMK9 Protein Iojap-related, mitochondrial n=1 Tax=Arundo donax TaxID=35708 RepID=A0A0A9IMK9_ARUDO
MPSVEGQQAGKWVVIDSGSIIIHALEERAREYYDLESIWSKEVSSNISVQELETSLVKTRRRNHSQKPMKSI
>UniRef90_A0A4D4MEH6 Mrr_cat domain-containing protein n=1 Tax=Streptomyces avermitilis TaxID=33903 RepID=A0A4D4MEH6_STRAX
MHQRGLPRKSSHPRAESAPGGPGRAARDSKGAAAYRERKLHKLRNKLTLAEVDRLLTIQETRWMQDMQDGHADGFGATNVWFPSTPTQAIDWRACEHIAAEHLRALGIADAEVTPARGDAGIDVRSEIAIAQVKHQRTPVGRPALQNLVGAAGPAHRGEIKPLKFFYSTSGYAKPAVEYARVNDVILYVINPATGCVSFVSTLYATSVSMPGLIR
>UniRef90_A0A3B3QJW8 Cingulin like 1 n=5 Tax=Mormyridae TaxID=31092 RepID=A0A3B3QJW8_9TELE
MEMESYRVGGISGGSLPPAYLAHECPSRPVSSGPGRYGLSIRVQGIGGHPYVVLNNREREPSPCKELESNGHSADGDPAEQYGQDRYTPPWEQHPDDSLVEYRSHKQMLFAGSHNGVTEFQESQKKPSTLLNFQRHPELLRPYDPENNSLNLEDLPVLTPRPASLSETGSLPCSQLTRGMSPSLDKPGTSATPVYQDRFPQQSEAQVQSLPRRHAPSPDRPAFQVQPETQEMLLPEPTPQSRQPVRPEAQVQQKPQLETQVQSPPHQQAKPQKPVQPTPQDQQKPQTEAAALAPSAPDAGQQARVAPPASTSTGSSLERSRRKPDVLLLRRHDSSGPVLQSQHSSHSSSSPSSTSRPLLGDPLESLGSDPINRHQNRRYIPFMPGTGRDIDTGSIKAVEELIDKFDGKEGLQRRGRAGRRNRINPEERKRSRSVDSAFPFGIRGDTDYLEEFSKNQGRSTEHVLRPSQLRQLKGALAQDFSGPTSPPRGKDGASAVARGRSAPGSPQGTALHSASSALGCRTAVSRSSTLPLESKGGDEPKSIRSFKVLTGMAAASPAVSMISSSKKNEADNPVTPDLLKDQQTLSQQTNEETAKQILFNYLKDGNPDNDDTTKRKVNLVFEKIQTLKSRAAGNVQGDNNPPEAASEVKALQDQKNQLEKEVTVLKKQLEEETKKTAGPTEVQENAGMRDLRMELVRSMEECARLQELLSKAEEELRTTMEELFQVKMEKEKHQTEIRDLQDQLSEMHDELDGAKRSESEGGEQEDVLEEMMQLKLDFQELLQVKEEQEELLRRRERELTALKGALKEEVATHDKEVDTLREQYEEEIRKLLSCVEDAKQNNVSVCREKQEVEAAKGVAESRVERLSLETERLRRRVQELENEVAKLNRIIDESKLQEGRLTDHMRHLEKENSLLGDSLAEVREQEEAMSRANRALTTRLEDVQRNLTKLTQDHKDLNEKLKEERIQKEQFKRTKDEIEDERRLLDRTVEKLQKEMCDMVEASQTSTQDLQVQIDEYKEKNRRELAELQRQLQERGVELENSRMATRKLQEEVSHLEEDLKQCKKERDEAVLREKKLELKVFDLEVELENVSHSKQDRPRYSKITEDRITQLEMDLEEERNNGDLLMDRIEQGRKQVEEMRNELLQERAMRQDLECDKVALERQNKDLKSRVTHLEGSQKSNKESLVSQLEGRIQELEERLEGEERDRANLQLVNRKLERKVKELMIQVDDEHTALQDQKDQLHLRLKALKRQIHEAEEEIERQEHGKKKLQRELEEQLEANEQLQGQILGLRNEMRRKNTTAPSLKDLDDNDDDMSTDGEIYYRSASGYKRSNHNPIS
>UniRef90_A0A3P9PT27 Chromosome 11 open reading frame 87 n=1 Tax=Poecilia reticulata TaxID=8081 RepID=A0A3P9PT27_POERE
MLAAPAASHCVKCVTTIRFTHFSPALPDCFIVAEASGLPAPPQRCLGGLQPNNGTCAEQLSVSLFPPLSSTLALLVLVAVLVGIILVSLATFLFHKRKLRNRKIQRAQEEYERDSRSPARAGPGAGEPARPCVIVRPVRRDEKPSRVTGCVRVAAEPWPRSTGSPHGRQKKPSGIQYF
>UniRef90_A0A183N228 Secreted protein n=1 Tax=Schistosoma margrebowiei TaxID=48269 RepID=A0A183N228_9TREM
MGQGLELHDFISLFIEVFDFLLLLLCTVRHGWGVGQVLIANFFSTFLVNDSLFLLEVCKIFEGISTADDLFTLPILNGDE
>UniRef90_A0A2U8W4D6 DUF2092 domain-containing protein n=2 Tax=Methylobacterium durans TaxID=2202825 RepID=A0A2U8W4D6_9HYPH
MSTAEPTVVRPAPKFCRNVSTRALPRACACTSIPRGARPRSGSGRQSGGSNAAALRRPAAEARASQPRCPRDREETMARPRDAIGLLAALVLCMTAPERAAAQQPAAAQPAQGVEPAAVALLKAAGDTLAAAKSLRFTAIAVHDVPNAEGQSIFYTVRSRVEFRRPDRLRVVTDGDGPSREFIVDGRTLTLFRPEADTVATAPAPASLDAALKAEVAATGESQAFADMLLTNPAQALTNGLTRAFVVGRSRLVGGVETDVVAFADRDAQAQVWIGVQDRLPRQLYVTETGAPGRPRNAVTFSDWMIDPPIEDRIFSTAHTEGARSVPFPNPDF
>UniRef90_A0A419WT42 Uncharacterized protein n=1 Tax=Marinifilum flexuosum TaxID=1117708 RepID=A0A419WT42_9BACT
MNKNTKVIEKYYEQIKANIELGLSPADFANKCVSDYVLIQDNEIKRKREEREKKKKNKIIKKQKEQAKTNIQEREKDLARTILYTKKMVKPITNTSEIDSKNANINPEQRRANKIAKLNINSLSSKMHVTDEVKDLGRLSTKEFDKNTVEGAINSLKMASRMLDLMRGGDDDSDEDYDDDIDE
>UniRef90_A0A6S4NGA2 GRAM_POS_ANCHORING domain-containing protein n=2 Tax=Lactobacillus johnsonii TaxID=33959 RepID=A0A6S4NGA2_LACJH
MPTDAEIIQAIGGLKSGDVYINGFTNGQMPVNVGSYQVKITDQLLQRLQAAFPDYDWDAVSGNNGTARSGSSDSDPIDARHEPATYVITPADTTVTINGAEHIKYGENSTIQYGSDNGYSITITAPVKNETTDNEHEPIYTDLKLETGDLEFVTTPGNVGTYEVKLSAQGLKKLQALTGSTNYSWTQASEARANFFVDQMPVTITVGGNEQNVTYSSNDWLKAIKENPQGYTLTVMTENGTTLNYQAKDGDLIFSQTPGDVGSYQVVLSAQGLDNIKQALGTNYAYPQAASDVTTYGTFNVNQGEVTISLDGSDSKIYDGKTTVPADLNIGKYNLTYSAPVYAPDGSPQTIKLTSDDLQFANGDPINAGTYTVELSPAGQAKLKNLTGNNGDNYKWIFNTQATYTINSATDASASLSGSNQMIFNGSPVTTAEINNGGNIVVNLNFPGSTENSIYHLQDGDYIWNDGAAPTNVGTYTIKLTQAGLAHLQAAIDQYAGSGNAKISADSLTGSATFEIVPKSITDVTISGKDQEKTYDGQAASLDVNDLTISATNLVTDSPLSMKDISASDFDWYDAQGKKLDAIPADAGTYEARLKPSALQALQKDNPNYSFNTASGTIKYTINQKAATDTLDGNGNKVYNGQETTVSDVLNSITWTPSGIVDGQSLDLSKLSDADYAWYTKNADGTYTEMAGLPTNAGTYYLKLKDSSIAKIQVANPNYSFATGAISGEYTYVITQANAVITLPNTSDQTVTWTGNPATIDPANFIPEITTDNPNEKTIVLPSTLQLTASDYEFSQNGKVISAPSEVGTYQVRLTEAGWQKVQNAIAENTNYTWNYQGEGNYHIEKATANVTLDGSASTIYTGNSVVIPATAGVVNGINVKLSNGQTYVLKPEDLEFVNDQGNQIPAPTDAGTYKVRLTKIALDQIRNIESNHYNYTYNNDAVDFTIEKANADVITSGSYDVVYNGQTPEINVDKITNTIATNNDVKLTAPTLTADDYEWVDETGKVITDPVNVGTYYLKLKDSSQSKIANNSNYIWNFKGLASVTISKANATIGFNGNQETSYTGSVIAVDPDKFEVKLSNGQTYQLTDKDIQVIGNPINVGTYKVELSQAGIDSIKAADSNYNYSYDDSQGVLVIVPAKASATISGSQTTQDLELDPHNYSVVLTLNGQQQTITGLTASDFVFSKDGHPAQLTEAGTYDVELSGDAINKIRQENPNYNIDFSSTATFTLENSSQTINYVDADNNVIGSTNISGHIKGTKLPFTPEIPVGWVASDPSDVPTEITINNGTTIIKIKHGTTNVDHNNPVPDGAKTVTGEVIDGAHASDLNQTITRTINVTNPDGTKSTEVQTAKIYRDASYDNVTGEVTYGEWSTGSWKEFSPAEIEGYSASEKVVPAVEVKDGQKNVTVDITYTANEQSGIISYQDEAGKEISTTPLSGKTGETVTVNPEIPAGWELVPGQEIPKTVTATGEGIPTVVIKIEHGITNVDHNNPVPDGAKTVTGEVINGAHASDLNQTITRTINVTNPDGTKNTEVQTAKLYRNASYDNVTGAVTYGEWSTGSWKEFSPAEIKGYTASEKVVPAVEVKDGQPDETINITYTANEQSGIISYQDEAGKEISTTPLSGKTGETVTVNSEIPAGWELVPGQEIPKTVTATGEGIPTVVIKVENSTIIVTPETPEKDIPNGKVPGNPSKNYPEMEKLEVAPTRAIILIKPDGSRENIIQKVIFTRSATFNEVTGEITYSAWKLSNSDDHEALWEAYEPMSISGYTVMNVNQEKVTPDTPNTQLEVTYIPINRPAVTATQTIHFVDEKGKLVESKIYTGKFGEVISVSLSVPKGYSLRNGQSLPTQITIENGMITINLKSESKHPIPNSENKQKPSVTPNTPDAHTDKNNLSSKDNKVVKSHGEKLINTNHVDHVVINQKATRKGTKASSQTYGEKHFESRHMLPQTGAHSENPIFTALGMLAVGLGLFGLSDRRKKKDK
>UniRef90_A0A438IK19 Retrovirus-related Pol polyprotein from transposon RE2 n=1 Tax=Vitis vinifera TaxID=29760 RepID=A0A438IK19_VITVI
MLVTVFHSGPLILFPNHSGQPHRRRISTTPATFSGEIFQRPIFRETTTYSETPEADLHASGNPTGNRHLTRPLARPDISFPNRGHTQVVGYTDTDWAGLPTDRRSTSGYCVFIGGNLISWKSKKQDVVVRSSAEAEYRAMTLATCELIWLRHLLRELRFGKDEQMKLICDNQAALHIASNPVFHEMTKHIEVDCHFIREKIASGCVATSFVNSNDQLADIFTKSLRGPRIKYICNKLGAYDVYAPA
>UniRef90_A0A847NUJ3 DUF1653 domain-containing protein n=1 Tax=Mollicutes bacterium TaxID=37628 RepID=A0A847NUJ3_9MOLU
MDIKIKGIYRHFKGHLYIVECIATHTETLEELVIYRNLETNEIWARPSHMFLAEVNKNNQKYRFELQK
>UniRef90_A0A8B9BS21 vesicle-fusing ATPase n=1 Tax=Anser brachyrhynchus TaxID=132585 RepID=A0A8B9BS21_9AVES
MASSTLYVVFTHRKPPHSPQTSQTAPWPSPEPRPPGGSALPGSPPLAPQPAPEGGPLPAAGSGQLGQLHAHPPVLVGPPPQPCPAAPVMCLLRGISGDDKVPKMLRAGLAQLSLSSMKSAGACIGRPVLLSAAEGRQEVCTAWPTTGFPGGKVGLSETTQKSLKVNLGDAVTVQPVTGAVIQAEEVDVKLRDKDACIKAEEMSVCLLRNLDGKVVLPGNLLAFSFYGKLCNIVVMRVKGTDGTELTAPATSSETQEPDLEKSDLEASALDLSLQLSGLDLDDNPEAVSVSTPSRRMDPASPVPPSSAVASGGHGPAEGALTGSPGVGADLPHGSQPAGTGGREGLLPPGKAGAASSTDSFYYISSRTRIQFVETRTGVADDGDCESRVTYDMIGGLNSQLKTIRETVELPVKQAELFKSYGIPPPRGVLLYGPPGTGKTMIAKAIANEVGAHVTVINGPEIISNPKSVLASTRCRPSIIFIDELDALCPKREGAQNEVEKRVVASLLTLMDGIGSEGSEGQLVVLGATNRPHALDAALRRPGRFDKEIEIGIPNAQDRLDILQKLLKKVPHSLTAAELVQLADSAHGYVGADLAALCKEAGLYALRRALGKRANPSDNEVAGSVMIAFNDFLQGMNDVRPSAMREVAVDVPKVSWSDIGGLEDIKLKLKQAVEWPLKHPEAFIRMGIQPPKGVLLYGPPGCSKTMIAKALAHESGLNFLAVKGPELMNKYVGESERAVREIFRKARAVSPSVLFFDEIDALAVERGSSSGAGNVADRVLAQLLTEMDGIEQLKDVTILAATNRPDMIDKALLRPGRIDRIIYVPLPDAATREEIFRLQFRSMPVSEEVCLVELVQQTHKYSGAEITAVCREAALLALQEDINAKFIMGRHFRYALTVVTPRNPDSLIQFYADYQQQSGLHAL
>UniRef90_L8JDR2 APH domain-containing protein n=1 Tax=Photobacterium marinum TaxID=1056511 RepID=L8JDR2_9GAMM
MIQPQLKRIAGNAYRMMFGLRPEVCNLQETFYGWVVFVASPGSRKAVVKFSREIGRLAKEVQGLERLSQVLTCPVPEVLFFGREEGHDYIMLEWLDGESAHNLPDDPVALEQFRESYTDVLLALHEHQSQKGFEIGDDEFVPDFIQAYESWMSPVLRYVQSSCSPFSSKLKDAYAGLWENREEILSPLNQIASLVHDDCHVGNVLFDPRTYKVAAIVDPCDVGFKHYELDLFHLYDVRPDLRLVERYQEKKKLAEGFEWRRWFFSLWDDAKHSRNMGWYDERWLVSKVALFEASYAGR
>UniRef90_A0A3M7QPY3 Uncharacterized protein n=1 Tax=Brachionus plicatilis TaxID=10195 RepID=A0A3M7QPY3_BRAPC
MNLFIITRFSQIDLIKLNSRQNYVKTTFLRNINNFIFKQYNKEFNFKIFIMIILLYIMDTIDRIIRPLVQTAIGAIMQVLPVTIVLVSFWICGHMASIRYM
>UniRef90_UPI0010AADB8D class I SAM-dependent methyltransferase n=1 Tax=Halorhabdus amylolytica TaxID=2559573 RepID=UPI0010AADB8D
MKRSLDDHAARFDQAADSYDEDGSPEYRAAAALVIEHAAPEPDDVVLDLGTGTGAIALALADDAGAVIGRDISEGMLEQAREKAAERGLESVTFDEGRFREPNVSGDRSVDVVVSNFAMHHLDDDAKREAIETIADLEPRRFVLGDVMLFGEADPEEPFYSPAVDDPATVGVLADALTDVGFALTAVEPVHEQVGVLVAERSEPTEDERA
>UniRef90_A0A8S1JP47 Histidine kinase domain-containing protein n=2 Tax=Paramecium TaxID=5884 RepID=A0A8S1JP47_PARPR
MENKAIKYLGMGLNVLISVFLALTECFIYELSDSIIMDIVLILCGTFFSWIFITQQLGWKKGDISPFFYWALAIKRITLVGTYRSEFIYFLFGFLNGIYSSKLVVKDQKRYFQKARTSFQVILILVLILFNFLTNTFQYQIILIIFNIILLLLLGIYDNIEIQPINSKQQDFNTDQRNTQAELKKCQTIIQQYQSSKSIWEQFNYLTDDWICKIDINKYKFNRSWESKEQSFVLKNFLQENKTNLNQFLNSLIIVGQSSNASVQLQYELQENNTLLQWLEKNYLQENRQNQQNFEKQKQLKDTKTNKQQVQDDQQSILSPQNDGKYIIQKDQSQDFSRLQATPLNMDQQVFANKKFLQCQLCLNQIIYNLNLSIFLIDDDKSNEIKQQSIIIQMKNIDRLIKSEIIDQQRSLFYRFISRLSFHSSQMLKSVCLIKKSIQLQLKEFDSIKSSNFNSSFNDIVLRKSERHIGGLFNAQQTFANQTSEQNTNQKITSTHSNPHESQILNMQQLQIAYFQQSQEIFKQIEKLNFDLIIMKQNNFNFFELFSHTKLDIEQFNILSSFNIVKDIFQQNPLLNQHNIIITQEINHETQVIIQSDRQKFKQILINIINNSIENFEHNFNIKKYQNYENPQIQQRYLKSKQDLKQQNMIVIKAQSDQDRIIIEIQDNGGGIDEEQLKNRLNECKFGLAASQKLLRYLAYDTRKPLEIINYEKCTTGVKGTIIKFVLPITFDNFQQNEDSNQSESLIISNIRDKV
>UniRef90_A0A7S4ARR9 CCHC-type domain-containing protein n=3 Tax=Pseudo-nitzschia australis TaxID=44445 RepID=A0A7S4ARR9_9STRA
EEHSETIEEHVAGLDRILEYPRVNEEIEIEEELAEEDSISSEESDSEFSCGETSSDSGIGSEDSWSTYSYNDLYTESDTDLYSELDSDSEESDGSSMKKSRRLYFGGEKGEFENFMIKWKTRGAKKGYSPYIMDKRHEDLPETGLMMDWTGVAKDVKKRQKKALRLHNYCIADLQEACEPWMVTAWIEESIGTTDEKRRAYPFGRVWIVLKAMITHYRGFSMLDINRFDIDKATIKMLPNENPDAIFNRIYAVRQKYAHQKDLQISDSSWVGLAVNGCTEAYRPVFMSAYSQNKHLPPKEIMAKLKDIAQDNFASMVQSKEIVSKFVTSDEVGLFAGIGPKTAKDKWRKGQECYLCGSKKHKAYNCPKKNQTNTGGGNGGGNGGGKTQNRGKSHANVECYYCHKKY
>UniRef90_A0A7K4MZ21 C2H2-type domain-containing protein n=1 Tax=Marine Group I thaumarchaeote TaxID=2511932 RepID=A0A7K4MZ21_9ARCH
MNFFRRNKEIVITGTTCKFCGMEFSAPDRMVKHMLKAHGKPKKNKGSSCPNC
>UniRef90_UPI00110FA3E4 hypothetical protein n=2 Tax=Streptomyces TaxID=1883 RepID=UPI00110FA3E4
MSTARYLALIDLLRTREFPAQRRRTESGFSGPGYHTVELSAAGEPAGEPAGEDAADQVEARERCLAEHDALVAVLDGRWGEAQVFGLWSLLERSVGGEAVPAPWDELSAGFDSLHLWRADGRWIAVGLALDAEGPSYALAAVVTGIDPP
>UniRef90_A0A847PHQ1 GTPase n=1 Tax=Candidatus Atribacteria bacterium TaxID=2053509 RepID=A0A847PHQ1_9BACT
MFLKKQNVLIMGAAGRDFHNFNVFFRNNENFNVAAFTATQIPDIAGRKYPPELSGPLYPDGIPIFPEEDLPELIKKHNINQVVLAYSDLPHQYVMERASLVLAHGADFRLMGPDNTMLKAKVPLISICATRTGSGKSQTTRKVSAILKEMGKKVVVIRHPMPYGDLSDQIWQRFKTYDDLDRYECTIEEREEYEPHIDVGNIVYAGVDYGEILKRAEQEADIILWDGGNNDIPFYHTDLHIVVADPHRVGHELTYYPGLVNMMMADVVVINKIDTADQENIVQLRDHIAKIVPEAITIDAASPIKVDHAELIRGKKVIVVEDGPTLTHGEMQFGAGIVAAQKYGAAEIIDPRPFAVGSIKDTYQKYPGIGMVLPAMGYGSKQMQELESTINSIDVELVIIATPIDLSRVMKIEKNNVRVKYDLQEIGSPNLKEILLQKLS
>UniRef90_UPI0005F56F2E NADH-ubiquinone oxidoreductase subunit 8 n=2 Tax=Myrmicinae TaxID=34695 RepID=UPI0005F56F2E
MMGPLQIFTLSGKLAPRFLRIAPKGVSVYLSRNKYYYVREDKEQNWTDIMEAASTHMFFHELFRGFGIILSQVFREPATINYPFEKGPLSPRFRGEHALRRYPSGEERCIACKLCEAICPAQAITIEAEERADGSRRTTRYDIDMSKCIYCGFCQEACPVDAIVEGPNFEFSTETHEEMLYNKEKLLNNGDKWESEIASNIHADHLYR
>UniRef90_A0A1G0YLB9 Methyltransf_11 domain-containing protein n=2 Tax=PVC group TaxID=1783257 RepID=A0A1G0YLB9_9BACT
MSAAEYPETADIETSSDDYAGRFSGPIGEWMLGVQEQIALKVLSDRPGATVLDVGGGHGQLALPLCHRGFKVTVLGSADSCRRRIQGVVDEGLCKFLVGNVVELPFPAKSFDVAMSFRLLPHCERWPTLIAELCRVSRHAVIVDYPTTQSVNAFAPMLFGAKKKVEKNTRAWRMFGQGEIRQAFRQNGFSQLSLRKQFFLPMALHRMLNKPAFSKTAENLCRFLGLTAGLGSPVILKAVWDEDR
>UniRef90_UPI001572454A MerR family transcriptional regulator n=2 Tax=Nocardia TaxID=1817 RepID=UPI001572454A
MKSSRTLTIGELAQRFGLGTHVLRYWESMGLLEPARRAGGQRLYEHADLERVALILMGKEAGLTLGELATVLSTADPRDHRDLLCHHVEELERRITQARAAKELIEHVLACPHSLAECEHAREHIAARIPPLPRNSASV
>UniRef90_A0A8C2IYT9 Slow myosin heavy chain 3 n=1 Tax=Cyprinus carpio TaxID=7962 RepID=A0A8C2IYT9_CYPCA
MGDAQMAEFGAAAPFLRKSDIERLEAQTRPFDMKKACFVPDTEEEFVKATIISRDGDKVTCENSKGTTVTVKEIDVHPQNPPKFDKIEDMAMFTFLHEPAVLFNLKERYAAWMIYTYSGLFCVTVNPYKWLPVYNQEVVLAYRGKKRSEAPPHIFSISDNAYQYMLSDRENQSILITGESGAGKTVNTKRVIQYFASIAASPTKKETSDKKGTLEDQIIQCNPALEAFGNAKTIRNDNSSRFGKFIRIHFAASGKLASADIETYLLEKSRVTFQLKAERDYHIFYQILSQKKPELLEMLLITANPYDYAFISQGETQVASIDDADELMATDEAFDVLGFTQEEKNSIYKLVGAIMHYGNMRFKQKQREEQAEADGTEDADKSAYLMGLNSADLIKALCHPRVKVGNEWVTKGQNVQQVSYAVGALSKSVYEKMFLWMVVRINQSLDTKQPRQYFIGVLDIAGFEIFDFNTFEQLCINFTNEKLQQFFNHHMFVLEQEEYKKEGIEWVFIDFGMDLQACIDLIEKPMGIMSILEEECMFPKASDATFKAKLYDNHLGKSANFQKPRIVKGKPEAHFSLVHYAGTVDYNINNWLVKNKDPLNETVVGLYQKSTMKLLSILFANYASADSGELSKEKKKKGSSFQTVSALHRENLNKLMTNLRSTHPHFVRCIIPNETKTPGAMENPLLMHQLRCNGVLEGIRICRKGFPNRILYGDFKQRYRILNPAAIPEGQFIDSRKGAEKLLGSLDIDHNQYKFGHTKVFFKAGLLGTLEEMRDDRLALIITNIQARARGLLSRVEFQKIVERRDALLVIQWNIRAFMGVKNWPWMKLYFKIKPLLRSAEAEKEMANMKEEFLKLKEAYAKSEARRKELEEKMVSLLQEKNDLQLQVQTEQDNLCDAEERCEGLIKNKIQLEAKAKELTERLEDEEEMNAELTTKKRKLEDECSELKKDIDDLELTLAKVEKEKHATENKVKNLTEEMAALDEIIAKLTKEKKALQEAHQQTLDDLQSEEDKVNTLTKAKAKLEQQVDDLEGSLEQEKKLRMDLERAKRKLEGDLKLTQESLMDLENDKQQLEERLKKKDFEISQLNSKIEDEQVMAAQLQKKLKELQARIEELEEELEAERAARAKVEKQRADLSRELEEISERLEEAGGATAAQVEMNKKREAELQKLRRDLEEATLQHEATAATLRKKHSDSVADLGEQIDNLQRVKQKLEKEKSELRLELDDVVSNMEQLAKAKVLVSTLAFLLFSRQLEEKDSLVSQLTRGKQSYTQQIEDLKRQLEEEIKAKNALAHAVQSARHDSDLLREQYEEEQEAKAELQRSLSKANSEVAQWRTKYETDAIQRTEELEDAKKKLAQRLQDAEEAVEAVNAKCSSLEKTKHRLQNEIEDLMVDVERSNAAAAALDKKQRNFDKVLAEWKQKYEESQSELESSQKEARSLSTELFKLKNSYEESLDHLETMKRENKNLQEEISDLTEQIGESGKNIHELEKIRKQLEQEKAEIQAALEEAEGSLEHEEGKILRAQLEFSQIKADIERKLAEKDEEMEQSKRNQQRMIDTLQTSLESETRSRNEALRLKKKMEGDLNEMEIQLSQANRQASEAQKQLKGLHGHLKDIQLQLDDALRSNDDLKENIAIVERRNNLLQAELDELRSLVEQTERGRKLAEQELLDVSERVQLLHSQNTSLLNQKKKLEGDNSQLQTEVEEAVQECRNAEEKAKKAITDAAMMYFLYTLNNGLNNAFSFHTSCMFVRELENEVEIEQRKASESVKGVRKYERRIKELTYQTEEDRKNLARLQDLVDKLQLKVKSYKRAAEEAEEQANTNLGKFRKIQHELDEAEERADIAESQVNKLRAKSRDTRAAKKTSMMNLVQTDHKYHIN
>UniRef90_A0A6G7V9X9 Purine-binding chemotaxis protein CheW n=1 Tax=Caldichromatium japonicum TaxID=2699430 RepID=A0A6G7V9X9_9GAMM
MSAEHLQEAAVDEEGTESADVHQFVTFVVGGEVFAVDMAPVQEIIRLPAVVRVPLAPSSLLGLANLRGKVLPIILLRRIFGFPEQAHDDATRALVIDVGQPLGFVVDRVASVISVRSEQIEPVAGIQGTFNSELLTGILKDVGGFAMVMVLNFARLVAQEFAEIAQIARGTAMTGGVLDSSADNEDKEASDELQLVSFAVAGQEYAIDITSVQEIVQIPETIVHVPNSPTHVLGLMTLRERLLPLVSLRSLFALPARALDEKSRIVVVALGQAAVGIITDSVSEVLRVPLAQVDRMPGLLAREDALSDITEICRLDGGRRLVAILSVDNMFKHTVVQEALKTVDGMNANTHDEQPGEDRSDEEEQLVVFRLAESEFGVPIESVQEIVRLPDELTPVPKAPAYVEGVINLRGAVLPVIDQRKRLGLPPIERNDRQRIMVFVLNGVRTGFIVDTVTEVLKIPKAAIETAPRLSGEQARLLGRVANLEQQGRMIQLIEPAHLIDTTELADLNT
>UniRef90_UPI001A9564E1 hypothetical protein n=1 Tax=Segetibacter sp. SYSU D00508 TaxID=2810307 RepID=UPI001A9564E1
MVLITLHEILLVVTAISFLLLPKLFFKYLPSPYEFYCKIASGILLLLVIWIPEPGDQQSQLLLQVLLTLLTTYYMCKNVMEYRKRKTGITHHK
>UniRef90_UPI0020C6B0B3 SPOR domain-containing protein n=1 Tax=Deinococcus sp. JMULE3 TaxID=2518341 RepID=UPI0020C6B0B3
MIGALVLLLLGGFGTLLLRPQAGTPVSAAADSGTDAPATDTTTLDSVPGAPGSTESTDAATAPVSTTEITAPTGQDSVTSPGSDAPQADGSANPGSVPSTDGADTPVIAAAPIGTPDPTLTDTQTAPQTEDADPASADPASDTPATDPAAPAARTGGAVPTSEQRTPLRSDYRITLGTFGSDAAAQSATQGVGALGYTVYPITVAAGVVAQVGPFADEATAREALADVQRAYPGAVLYPPRDRSLSTPSTPATTGATAETAQTTPAEPATPAPTATTPTYLQVGAFDRLESAQNLVQQLRDLGYNPTVNAPAGKKVTVLVGPYTGDPLTRTETRLQENGLDSFRVR
>UniRef90_A0A2Z6TDT3 Spore coat protein n=1 Tax=Burkholderia vietnamiensis TaxID=60552 RepID=A0A2Z6TDT3_BURVI
MRALRRSFQPYFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFQPHFDPNSPPYSQPPP
>UniRef90_A0A5Y2QT59 PLD phosphodiesterase domain-containing protein n=3 Tax=Enterobacteriaceae TaxID=543 RepID=A0A5Y2QT59_SALER
MNQLIHNAEHYIYIENQFFVSAFGEPSVPDNAPYSPEAKEIARLDRIKAVTTKLVYGDSDKQPVNQIAQWLGDRIKNVIYARYTHDFHVCIVLPVHPEGKLDDGAVMAQVHLTRQTLVSGSKSLLNRVRQALWVRQQLDEDPRANWSKLIPALEKRCETEKKYEEISFEACAKYVTLLNLRGYAELAAYPDKKIAVTEQIYVHSKLMIVDDRYVLVGSANINERSLQGNRGYLATVLAGAGSNLALEGTPV
>UniRef90_A0A1J9RUE5 Cation chloride cotransporter n=1 Tax=Diplodia corticola TaxID=236234 RepID=A0A1J9RUE5_9PEZI
MASRGGSSRMPSRLHSRSNFTTRSAQDDSHQLQRRWSLSQMSAQDEAEPLLAAGPRRRRPVSVPRENRTFGSFLSALFTRRASTRSRSGHRRTRSSGTDRCKPASAPAKLGTFAGVFVPTTLNVLSILMFLRFGFILGQGGLLGMMGLLVACYAINLLTTLSVSAIATNGTVRGGGAYYLISRSLGPEFGGSIGIVFYLGCVLNTGMNAVGLVACFVQNFGSTHGSWANWLPDDFWWQYLWATVVLAVCTVICLAGSSLFARCSNALLIILLVATFSIPVSTLVQTPFSNVKLGIEYTGLSLETLKGNLLPNLTQGAAGSGLKGRETWQDLFGILFPATGGIFAGASMSGDLEAPSKSIPKGTLYGLALTFVTYTIVIISMAASITRLSFYNNDNVIQVVNVSGALVLLGEFASTLFSTLMGVIGSAKLLQALARDKLIPGLLVFAQGSKAADEPMLAIGLTYVLSQLTMLADINQIASLVTMAYLMTFLVTNLACFLLKVASAPNFRPSFHFFNWWTAAIGAIASALTMFFVDGLSASACFATIVLIFLIIHYTTPPKAWGDVSQSLIYHQVRKYLLRLRQEHVKFWRPQILLFINDPRRQYKLIQFCNSLKKGALFVLGHVIVTNDFAGAVPEVKKQQSAWTKYIDFSRIKAFISIVISPNIEWGTRNVVLSAGLGGMKPNIVVMGIYNLNDLRTNPLVDVPSPQPEHTQGTANGTAPHRLKSKGKWKIAEENKLRGQLPTDAIRKESAVTPQSYVTILEDLLLRLQMNVAIAKGFQDLELPAPRPSRLERVLDALHAKSADEEEGTKKYIDLWPIQMSAEVAAPSDGTQSILTTNFDTYTLILQLGCILNTVPSWKRAYRLRVAVFVEYESDVEEERARVKALLYNLRIEAEVMVLWLASGDLQSYEIIVNGQADESYREARQDIEEALREEAWWQDIQKLRQRQTGAITPMEELAQIEGFLETASNWPGTAFRQGDRETKSKRFADIKDMLIERRRTSVGSLKQMGVSMGMRTHRLPPGLDGQESSSDGSSSGGESEAECSDSDRSASSENDPQTESDEGTLSPMRRARSERESTSSFPSTPRQQSQPRRGELLPPAPTAAANSDSTLVTSQPPTNAGSHQSPPTFTSKPVPRTEVAADDGPGPSIMFAEPLSPEEQRERRFGTSIYTRSGSPQVAAPLPGPANPDESGSDSPSTPGSPGAASSSMSQASGFPLQQSVPLSFNDLPCRAQHLILNELIRRESGKDQRTAVVFTTLPSPVEGTCEDEHASVRYLADLEVLCQGLPPVMLVHSNSMTVTTNL
>UniRef90_UPI001F1A8850 DUF6338 family protein n=1 Tax=Pelomonas sp. P8 TaxID=2906762 RepID=UPI001F1A8850
MNLALPTVVVFILLLPGFIFRSRLKRVERTSLDFSPFGAVVAEAVFFAAVLHAAALLLLFWVTGALPDLALLLTLLAPSPAPLNAIPAIGQHAGLVTGYFGLLLVASWLVPTLTRWLITVGRLDRLGHPLSPIARFHQAPWYYLLTGADFAADELPDYIRVTAVVDVGKGAVLYRGTLEEWFTNPDDGQLDRIVLSAASRRPFELDKPLDGSDGGAERFYPIDGDYFVLRYEHMLSLNVQYMRIIEQPDDDLPDDEEADTPAAQ
>UniRef90_V4QRW5 Methyltransferase n=1 Tax=Lutibaculum baratangense AMV1 TaxID=631454 RepID=V4QRW5_9HYPH
MQSEILEGYATAGPELIALYEAVPSAEIYALVRDLLPPGPARAADIGAGTGRASPRCWRRPGS
>UniRef90_A0A0D3GCY4 Uncharacterized protein n=1 Tax=Oryza barthii TaxID=65489 RepID=A0A0D3GCY4_9ORYZ
MNLSATYDSRTSDVESSVVARGDLWRAEASHSSAAAAAPPLFMVQLGPVLFVRDTTLLFPVHLSKRHLIWYGFERKNGVHSVCPAYWSAHRRWFFMSMICLNPFTCSFMDMQFPNGQLRYVAGDGFTTRAFLPLYRGIFQAHVKFPGEKKFSYSFKVSCQMNSKPYLNLLHLNSEVSLLHHIARLVLLTIFFQNRSGGSITPMVQWPDKSLSLGTVQTLSWKRCGLIICPTFGGSRPGLSMELIHSVNENAGVVCGYSHTASPSAYASVSIGRSKLNGSAASSGLVLRVDAPLQSFGRPWFSIQMNSGLEF
>UniRef90_K3XLW2 Ras-related protein RABE1c-like n=2 Tax=Setaria TaxID=4554 RepID=K3XLW2_SETIT
MAAPPARARADYDYLIKLLLIGDSGVGKSCLLLRFSDGSFTTSFITTIGIDFKIRTIELDGKRVKLQIWDTAGQERFRTITTAYYRGAMGILLVYDVTDESSFNNIRNWIRNIEQHASDNVNKILVGNKADMDESKRAVPTAKGQALADEYGIKFFETSAKTNLNVEQVFFSIARDIKQRLSETDSKPEDKVVNIRQDQGAEASSSQKSACCGS
>UniRef90_A0A8C0C567 Uncharacterized protein n=2 Tax=Accipitrinae TaxID=8955 RepID=A0A8C0C567_9AVES
MSKQVVNSSETVTPGPNEGTGVVGISPENEPQNAPSQAPAAMARLPRSLSNDNKTLSSEEAKPNDFERTKVGICKLSSTPVQANSTLQRESVETFPCKHTPGAGVAGQAAIPHCKIPALQSTDGDANLNLGKSTLEQNNAKGAWVTLSQSTVVLGTDGNTSVLPGRVEGVSWLLVGFLSPAFNSWE
>UniRef90_A0A2B7X7V6 Replication factor A protein 3 n=1 Tax=Polytolypa hystricis UAMH7299 TaxID=1447883 RepID=A0A2B7X7V6_9EURO
MSLSTPRLLPEHLHAFAPAPHKSARTVRILGTVSSLRGEHASITCGSHGEVTLVLNRDSHIQMGRVVDVIGKVVEVEGGLGVRVLGAADCGDPKDVDYKIYEELVDVTHRFKEIFYDE
>UniRef90_UPI001663C50F hypothetical protein n=1 Tax=Belliella aquatica TaxID=1323734 RepID=UPI001663C50F
MKKVLHTLAAILISVVSYAQVGIGTDNPDNSAMLQVASSEKGFLLPQMTSTQRNAVSSPANGLQVYDTTTNSIWFFNGSYWVNTQAMATVGDVKSGLQTNDHSGWVLLDGRSIGTLSDNQKAAASALGLSGTLPNAADAYLVQNGGSMGAISGSNTVTLTQANLPNVSFSGTAASAGGHTHTVDPAPVDTDSKGNHTHTVDPAPVNTDTKGEHTHTGSVGGSNWLGGGTLTGGFNAGTFPFQIPNLTINPAGDHFHTVDIPSTTSSENGAHKHSIDIPSTTSSSNGAHTHDVTVSSGGSATPVNVAPKSLSVNMFIYLGL
>UniRef90_A0A3Q3E9K7 Hydroxycarboxylic acid receptor 1-like n=3 Tax=Hippocampus comes TaxID=109280 RepID=A0A3Q3E9K7_HIPCM
MDLDLRSTPAPGGGGGGCPPVGIQLEGVILPPVLTVDVVLGLLGNAVALWVFCFRVKSWSANTVFLVNMVAADFLALVSLPLRIDALLRGHWVFGDVVCRLNLFLMFSNRTASIALMTVIAFYRYVKVVHPHHRFNRMSKRQAGILSLVVWLLVSSPRVPMLAYNHIKELFLKKKTSFTITNYFKRYLKRLLAGIVILVETHRVLTVLEFVIALALLVFYSVQISRSLKRRQMGNVAKVRKAMRVCAAVVAIFLVCFLPTTITTLGLWVSRSLRPWDCAAFYALTQLNIVSLSLNFLNSALDPILYVFSSSVFRKELLAAVPPRLRCKRAVEGTSSVSTSQSTGQVELESVKMTAGSEAS
>UniRef90_A0A3N0Y0W4 Complement factor I n=1 Tax=Anabarilius grahami TaxID=495550 RepID=A0A3N0Y0W4_ANAGA
MPYKCPRQDYHVCTLDGSEYYSMCQTKAISCRSNKPVFSHISTTCRAEEKVKVTVEDSGSHKVVMINTRLGKMFVCGNDWNMAAANVVCRNPLNVARGAAEVTKIKNRILDRDTKWPTECMSVRCTGSELSLAECTIYNPQPITENTVAIAKCYNEPKGAFSSF
>UniRef90_A0A124ILI9 30S ribosomal protein S15 n=1 Tax=Gracilibacter sp. BRH_c7a TaxID=1734398 RepID=A0A124ILI9_9FIRM
MLTPEKKKDIITKFQQHEGDTGSPEVQIAILTTRINELTEHFKTHKKDHHSRRGLLKLVGQRRALLNYLKKNDVNRYRKIVSDLGMRR
>UniRef90_A0A4C1ZDE1 Tubulin_C domain-containing protein n=1 Tax=Eumeta variegata TaxID=151549 RepID=A0A4C1ZDE1_EUMVA
MTVSFLCSGGDAPPQGLCFQNLNMRIHSYAHSNIFAEYYTSYVTDALYKQISKPKFSFWARRGKTVVALCVPFGVSPYRAALSSSPYTDREFLDSSVNIMRRAHDQSIGGGSAVWDLTIKRRPLRDRGVRYETCTALCE
>UniRef90_A0A2J6IBB8 Endonuclease/exonuclease/phosphatase n=1 Tax=Marinilabiliales bacterium TaxID=2053303 RepID=A0A2J6IBB8_9BACT
MKILKLIFFIALSVNLSSQSIMSFNIRYNNPNDGNNSWENRKFELTDLITKYRPDIFGIQEGLYEQNEYIKEQLANYTYVGVGREDGNKKGEFSPIFYDSLKYELIETKTYWLSDTPSEVSVGWDASMERISTFGAFRNINTKDTLYIFNCHYDHIGKKARRKSSKLIIKLIEDKGLLIKNLVVMGDLNSMPEDAAIKILKNKLTDSFEVSNYLKEESIQTYNNFDNQYISNKRIDYIFTRNIYVSSHKIIREKRSNGLFISDHFPVLIQFRNN
>UniRef90_A0A0F2Q2J6 Cupin_2 domain-containing protein n=1 Tax=Clostridiaceae bacterium BRH_c20a TaxID=1629719 RepID=A0A0F2Q2J6_9CLOT
MNKKIRDEIERSLNLKIIDEQSFSWGESYSLQLESKMDFDKYSKKNSRNVAVVTVKPNIKHESHTHYGYDEILYGLEGETIHWANSKKTYLQKGQLVLIPAEGQHIMVNNSPVPAKFLSIVYPTIPERWRR
>UniRef90_UPI00037CD391 VWA domain-containing protein n=1 Tax=Gilvimarinus chinensis TaxID=396005 RepID=UPI00037CD391
MANSLIRVSVLLWAAFFCFHSHAQSPSPSAALVDADVRLLVDISGSMKNTDPDNLRQPALELMVKLLSESAYGGVWTFGEQVNMLVPFSRSDEDWQRRALEQTSRINSVGLFTNIGEVLHRATEVPAKTSSADVILLTDGKIDVDKNAGVNSRERNRVLSELLPEIAEKNFRLHTIALSADADSELLQQLSRTTDGHHLVAKNADELMQAYLQIFDQAVPAKRLPLENNRFLVDDQVNEFTALVFRAPTAEPTQLLMPDGKALSASSHGDNTQWYSADGYDLITITNPAAGRWQLKAQESAQNRVTVVSDLQLYVESLPNNLLAGNALTLAYALQEKGNNLTDADFLDLITAEIVVMNVTRDVSWNLALTDQPDKATGVFTHELPTFNERGQYRLRLRVDGKTFAREFQHQLQVGSMFAVQLDKAVQSSQVKYTLNVKTDSEFVNTDKTSVVAHVKHSSGESELRALKKVSDTQWQLTLTPAKPMRTLIELNASGELTDGREFNEVLPSQYVQFPQEGDPLVVQEDSELAMLKQQIETERAALANEERLADTVAKTPAAKSQTSSPVSESQDDKQEAGFESGPDSAEETDEGGINWPMIAAITLGNLLLIGGLYWAYRRFSAKDVQSELDEIEQQLQAAPNEPSGQATEQQKKEAVALDDDNSVSVLDSLDESSLPMDDFSFDDESDKK
>UniRef90_A0A853FEG6 5-formyltetrahydrofolate cyclo-ligase n=1 Tax=Pusillimonas soli TaxID=659016 RepID=A0A853FEG6_9BURK
MNDSTRNNATPLRTRLKQRRAAMDPVERSRGALLIRGRLYTWLATTRTRLREAGRPVPENIAAFWPLDEEPSLLPLLQQWVEEEGYRVSLPVVTVAGAPLQFRIWTPDAPMQPGAYGIHEPAGEIAPPPDIILVPALGYTRQGDRVGYGKGYYDRTLAALREQGHAFTSIGIAWATGDLSGDSHAPEPHDYRLDSILTDKGWAVPAPVIA
>UniRef90_UPI0021E303A4 FERM domain-containing protein 5 isoform X1 n=2 Tax=Acomys russatus TaxID=60746 RepID=UPI0021E303A4
MLSRLMSGSSRSLEREYSCTVRLLDDSEYTCTIQRDAKGQYLFDLLCHHLNLLEKDYFGIRFVDPDKQRHWLEFTKSVVKQLRSQPPFTMCFRVKFYPADPAALKEEITRYLVFLQIKRDLYHGRLLCKTSDAALLAAYILQAEIGDYDPGKHPEGYSSKFQFFPKHSEKLEKKIAEIHKTELSGQTPATSELNFLRKAQTLETYGVDPHPCKDVSGNAAFLAFTPFGFVVLQGNKRVHFIKWNEVTKLKFEGKTFYLYVSQKEEKKIILTYFAPTPEACKHLWKCGIENQAFYKLEKSSQVRTVSSSNLFFKGSRFRYSGRVAKEVMESSAKIKREPPEIHRAGMVPSRSCPSITHGPRLSSVPRTRRRAVHISIMEGLESLRDSAHSTPVRSSSHGDTFLPHVRSSRADSNDRVAVIADEAYSPADSVLPTPVAEHSLELMLLSRQINGATCSIEEEKESEASTPTATEVEALGGELRALCQGHGGGPEQQQVNKFVLSVLRLLLVTLGLLFVLLLLLIILTESDLDIAFFRDIRQTPEFEQFHYQYFCPLRRWFACKIRSVVSLLIDT
>UniRef90_A0A485M2C4 Transcriptional regulatory protein ZraR n=1 Tax=anaerobic digester metagenome TaxID=1263854 RepID=A0A485M2C4_9ZZZZ
MPSKERKLAKKNIRILIIDDEESIRDGCQQILTRQGYEPTATADGMTGLELARTGAFDVILLDLRMPRIEGLEILRILKSEHPVASKIIVITGYGTIPVAVEAMRLGAHNFITKPFSAAELKLAVQDCLSEKSEERPTGDSLSMIIGTSDYVEELKETIRRVAKTDSTVLITGESGTGKELVARTIHSLSARSNKPFVPVDCSSLVHNLMESELFGHIKGAFSGATENRDGRFQTADKGTLFLDEISNISLDVQAKLLRVIQEQEVPRVGSSIPEKIDVRLITATNKDLRVEVQNGTFREDLFYRISVVPIHIKPLREHRSDIAPIAFHYFDIFRSRHGSKAQSLSPEVVKSLTSYTWPGNIRELKNTIERLCVLCDHEEVTLSDILYYGQDTCSKAPVVDPFSGKMTLVEVEKEHIEKALHHFNNQINKTARFLGIDRKTLRTKIRNYGIEIKDDE
>UniRef90_UPI00103184EA hypothetical protein n=2 Tax=Streptomyces TaxID=1883 RepID=UPI00103184EA
MSAGNNGMSTPEGGDDPFGYLYRPEDGQAPAQQPQQPSYHQVRPVGERRPYGGQRSGYGYPQPQSAPPQHDPHYAAPEAQPGGGGYHSGGPPGPYQNGGEPPRRNTLLIGAIAVVTAVVLGVGAALLFSNNDAGGDDDRADDSSEVNPTPDVPDDEDEGDTDEDGADEDETGEDEEDPEDSGDLPVADFNGADITLSNGAIVGGGQLEGARSSDGSYITGLNNNNSTVSWQFDFDGTPGDYRVYVGYTVEDGDQLMSWAINDSLRGDELEFKDHRKSGAYKDNWTYTWKQVYLNEGSNLLQIGCGGDDTCDVVIDGLVVTPHADGMEPW
>UniRef90_A9YMW7 Ac78 n=2 Tax=Betabaculovirus TaxID=558017 RepID=A9YMW7_9BBAC
MQQHLDIPFDRLTVPDVVDAIPLKLAYSKESDDNNKPPVVPSAQAVYGSREEKSAQSDMSNVWFIALACITVLVVIMLISYYIVSVLRTNNAPLRDYDDDDFE
>UniRef90_UPI00188515FC mitogen-activated protein kinase kinase kinase kinase 4 isoform X15 n=1 Tax=Peromyscus leucopus TaxID=10041 RepID=UPI00188515FC
MANDSPAKSLVDIDLSSLRDPAGIFELVEVVGNGTYGQVYKGRHVKTGQLAAIKVMDVTEDEEEEIKLEINMLKKYSHHRNIATYYGAFIKKSPPGHDDQLWLVMEFCGAGSITDLVKNTKGNTLKEDWIAYISREILRGLAHLHIHHVIHRDIKGQNVLLTENAEVKLVDFGVSAQLDRTVGRRNTFIGTPYWMAPEVIACDENPDATYDYRSDLWSCGITAIEMAEGAPPLCDMHPMRALFLIPRNPPPRLKSKKWSKKFFSFIEGCLVKNYMQRPSTEQLLKHPFIRDQPNERQVRIQLKDHIDRTRKKRGEKDETEYEYSGSEEEEEEVPEQEGEPSSIVNVPGESTLRRDFLRLQQENKERSEALRRQQLLQEQQLREQEEYKRQLLAERQKRIEQQKEQRRRLEEQQRREREARRQQEREQRRREQEEKRRLEELERRRKEEEERRRAEEEKRRVEREQEYIRRQLEEEQRHLEILQQQLLQEQAMLLECRWREMEEHRQAERLQRQLQQEQAYLLSLQHDHRRPHPQPPPPQQQPQQDRSKPSYHAPESKPHYDPADRAREWSHLASLKNNVSPVSRSHSFSDPSPPKFAHHHLRSQDPCPPSRSEALSQSSDSKSEVPDPTPKAWSRSDSDEVPPRVPVRTTSRSPVLSRRDSPLQGSGQQNSQAGQRNSTSIEPRLLWERVEKLVPRPGSGSSSGSSNSGSQPGSHPGSQSGSGERFRVRSSSKSEGSPSQRLENVAKKPEDKKEVFRPLKPAGEVDLTALAKELRAVEDVRPPHKVTDYSSSSEESGTTDEEEEDVEQEGADDSTSGPEDTRAASSLNLSNGETESVKTMIVHDDVESEPAMTPSKEGTLIVRQSAVDQKRASHHESNGFAGRVHLLPDLLQQSHSSSTSSTSSSPSSSQPTPTMSPQTPQDKLTAHETQSASSTLQKHKSSSSFTPFIDPRLLQISPSSGTTVTSVVGFSCDGMRPEAIRQDPTRKGSVVNVNPTNTRPQSDTPEIRKYKKRFNSEILCAALWGVNLLVGTESGLMLLDRSGQGKVYPLINRRRFQQMDVLEGLNVLVTISGKKDKLRVYYLSWLRNKILHNDPEVEKKQGWTTVGDLEGCVHYKVVKYERIKFLVIALKSSVEVYAWAPKPYHKFMAFKSFGELVHKPLLVDLTVEEGQRLKVIYGSCAGFHAVDVDSGSVYDIYLPTHIQCSIKPHAIIILPNTDGMELLVCYEDEGVYVNTYGRITKDVVLQWGEMPTSVAYIRSNQTMGWGEKAIEIRSVETGHLDGVFMHKRAQRLKFLCERNDKVFFASVRSGGSSQVYFMTLGRTSLLSW
>UniRef90_A0A0S9PKG7 4-hydroxybenzoate polyprenyltransferase n=3 Tax=unclassified Agreia TaxID=2641148 RepID=A0A0S9PKG7_9MICO
MSAAFAAASVGLFTPTTDTPGAHTWSSAILLFVIYLALLLRYRVTDEWKDFAHDSAVYPDRPVQRGVVSPRTLFVIGAGAFAVELLGVLLIGGALGFVLYLPVLAYSALTVFEFFSAPRLERHFTLSFVLHEAIYLPLFLWVAVVLGAAPDWRTAAGVLACTALFVSVELARKFSPRFDTEGRVVLDTYSAVWGRGRTLGAMVVLVVLSGVLATTAGAGLASPVIAVVAAAVALARPASDRWVTTVVAIHLPLQAAAMLS
>UniRef90_A0A835JN83 Dentin sialophosphoprotein-like n=1 Tax=Salix dunnii TaxID=1413687 RepID=A0A835JN83_9ROSI
MDLEHGSGTHSESHQEVIDGTGGSDNEDTYPRLRVRIGSSGRLQIDPEKIEGSESGKYSESHSEVINGSDSDKHIEPKPEFTVIEGDIYMPTIKFGSSYSSSSSSSSPSSSGSSLYDLFDVIPKESADPGAGSADFESSNKPHEVTQPASKDHENGVSIDNSHRSEENEDGSSDHALTPPVSGATCESLAHNMSPKQSPPLQVMERPGGYDPLRIPSSIFENNKGTQPMDWSVASNESLFSIHVGNNSFSRDHVLLFGDPGKSGDITKSGESIMFSPLPPREMVTNDNQSSVPDMETNKQKGGSSGMADNTVKDPAEYQNEEDNTNQAVSWKSPSSSNRSYGSGDSVKSFSFPIKASTLAHIMPKFTFSLLYMDVFIFADLLCEFSPDRNACVLGMLVFYA
>UniRef90_A0A0Q5NNY0 Response regulatory domain-containing protein n=2 Tax=Pedobacter sp. Leaf176 TaxID=1736286 RepID=A0A0Q5NNY0_9SPHI
MRYKILIVDDDEIALFLHEMVVGDCGPIDDAETFSSAETALSYLGDINDGSCEYLILLDINMPQMNGWEFAEVVKNHPLREKIKIVMVSSSVEKKDIERADSSVVIDDYLIKPLREEQILTLKEQPKFRAFFNDHQ
>UniRef90_UPI001D111BD5 2-oxo acid dehydrogenase subunit E2 n=1 Tax=Haladaptatus pallidirubidus TaxID=1008152 RepID=UPI001D111BD5
MVEIIRIPKLGLSDYGDLVSWEAEDGEHVTAGDVVAIIESEKASAEVEAPTDGTLLGRYVEEGEEIEIEVGKPLAVIGDEGEEIPDISAIEDGSEVSTEGNSGKDNSSKNRATSSDDGSDVITDVKATPRAKRLATEKDVNLKQIEGTGPQDAVSEEDVQAFLESSDTDTKGDEQEVETEQSSSAGLTVTDSRKLTGTRKTIAKRLSQSAREKPHVMGTREVSVERIQALQSRLSERYGVEVSLNDIILFFVGRVLQDLPEFNAHFEDSQHKLIDEVNIGYAVDGPKGLVVPVIDDVTGRSLAELAERRRNLVGKVLDNEFTTVDLQDGTFTVTNVGVFNMDVSYSIINPPEVGILAIGRRKQAPVERDGEVEFETVVTMSLTIDHRVLDGADSGAFLECLAEYLEYPGNALESVQNEQESV
>UniRef90_A0A7Y3X359 DUF637 domain-containing protein n=1 Tax=Flavobacterium sp. CLA17 TaxID=2724135 RepID=A0A7Y3X359_9FLAO
MPTLSNLVAPKLGFSNGLVGNVMTGLLSNVISKAVQPNYTAQMNRQADEVGTRLLTTVGYSQSSLMNVSSSTRHAQIRAKVQQLIGSNSSSSWWSSGR
>UniRef90_A0A2H0L707 IPTL-CTERM sorting domain-containing protein (Fragment) n=1 Tax=Candidatus Peregrinibacteria bacterium CG11_big_fil_rev_8_21_14_0_20_41_10 TaxID=1974792 RepID=A0A2H0L707_9BACT
DADNNGIGDACDDPIATCEGVVLAPNCTTGNLCDNGDTMPGTEVCNIPNGVVEITCEDRPELCTDNCTDPTIVLNISRHTGDLCDTGEFCADGSERSGHWEVGDNCNYYPDECKVECDAFCVPNPNEECVPVTNNGEVTNNGGITNNGQIANNGDTHNNDTTNNGGDKIPAAPDTGCNVSTIDTPLQARDQIWALLMLAMAAGAMGYSKQRK
>UniRef90_UPI0020C3A1E9 DUF2243 domain-containing protein n=1 Tax=Halomarina sp. BCD28 TaxID=2961595 RepID=UPI0020C3A1E9
MARTTTRRALVAAGVFGFGFSGLIDVLVLHHVLQLHHLVSGLYPMDTLSGLRTNIRADGLFSLAMVGIAGVGAGLLWQSERRTEAPLALRPVAGAALVGLGAFDLFDVLVDHVLLGLHQPTMQGGVYNPHWAAVSLLFVAAGWLLYRSGRDAEDVTRDTAETANDRTE
>UniRef90_A0A6P4XS04 protein timeless homolog n=1 Tax=Branchiostoma belcheri TaxID=7741 RepID=A0A6P4XS04_BRABE
MDLYMMNCELLATCSALGYLEGDTYHKEPDCHETVKDLIRYLRREDETRDIRQQLGASQIVQTDLIPIIKQYHDDKALFETIIRLLVNLTQPAIVCFGKVPKDKMFRHYFLDVVSYLQGYKVAFADGEVWTVLSRKLYELLQLDWENRQEEDSLLIERMLLLVRNILHVPADPEEEKRTDDDASVHDQVLW
>UniRef90_A0A7C3W5F8 4-hydroxythreonine-4-phosphate dehydrogenase PdxA n=1 Tax=candidate division NC10 bacterium TaxID=2072417 RepID=A0A7C3W5F8_9BACT
MKRPLIAVTMGDPAGIGPEIVVKALQDEEVMAASRPLVIGDRGVLEQAARFCEFQGKIRVVGGPEEGAYTLGTIELLDLENVELASLKIGAVQGMCGRAAFEYIQKAAELASSGRVDAIATAPINKESLRAAQVDFIGHTEILSALTGATDPLTMFQVRTLRVFFLSRHVPLQRACELVTRERVLSYIQRCSEALRQIGVAEGTLAVAGLNPHSGEHGLFGEEEVKEIEPALREAQRLGCRVVGPVPADLVFHQALQGQYSAVLSLYHDQGHIPTKMVDFERTVSVTLGLPFLRTSVDHGTAFDLAGTGKASAASMKEAILVAARYLRDFRRP
>UniRef90_A0A1G3PK91 DUF4294 domain-containing protein n=1 Tax=Spirochaetes bacterium GWF1_49_6 TaxID=1802189 RepID=A0A1G3PK91_9SPIR
MKHTLFLLLLLSCFSHLFAAPVNYPEIFGQDFMKALNISIEIKAQVVKLSKEMKADPELVLPAAFPELIRYSLFRDSMELFTLEVFYVNFGSGVNDFSVGIFQMKPSFVEQMENYLNTHDELKMYRPVFVYKFPNDPSAVRKERIERMTKIDWQIRYLVLFSKIAEQVFPKQPGQTKSELVKFYAGVYNTGFWKTKEQILKTMALNIFPNGMSYPGEQNNYSDIALYFFENYWQKFLKDDSIKSFPLR
>UniRef90_A0A6A5RRK3 4F5 domain-containing protein n=1 Tax=Didymella exigua CBS 183.55 TaxID=1150837 RepID=A0A6A5RRK3_9PLEO
MKETAHAEKLEKANVKELKAANKLYNNKIKEQKREAAAAAKEVRDRKCAEERVAIDARKAQRLKDKQARDAQKASQLPNKGKRKASKAPQAPAAKKRRSAQPRSGAVAAAAAPPRGTHTTRSGRTATLYK
>UniRef90_A0A7W8D7Z3 6-carboxy-5,6,7,8-tetrahydropterin synthase n=1 Tax=Chiayiivirga flava TaxID=659595 RepID=A0A7W8D7Z3_9GAMM
MPLTIFKVFQLEAAHRLPHVPPGHKCARVHGHSFKVEVHVGGPLDPTLGWVMDFADVKAAFAPLHEQLDHHYLNDVPGLDNPTSERIAQWIWERLQPTLPGLARVVVHETCTSGCDYRGPTA
>UniRef90_UPI001069C9AA uncharacterized protein LOC114541692 isoform X1 n=2 Tax=Dendronephthya gigantea TaxID=151771 RepID=UPI001069C9AA
MEKDKERSDKNVNEVQPVQTVPVERRVKTKALKGIYHSILMQNSKKTKSIEEPPPVKKQCVSAEEDDAPDDDDVYTTTMIEKQTYCALIPQKFKSLNDLCFSGVLQNCLAVISNVFTPKLAKNGNHFLKISITDPTHYGSYELMWFSKPTEFPNIYRTGEIVLLKGIKCQKYNEIHQILKNFTTNICVIPLDDDPPLMKKARQPLERYESKFGDAIKFLKKWRNSNITATTFSQLDVITTAVEGSSFNFCVKIMKLTELTCDSYCLTVWDGSRPSLQARAREENSNAKANACDVDEEELVDIIVLDQNRSIKKYNLRPLNVLALYDVTLNTDRRLELNMENEESGFTVVKPYCHVARYVPAREQRQEHTWNFKGW
>UniRef90_A0A356NIC5 Probable dual-specificity RNA methyltransferase RlmN n=3 Tax=Verrucomicrobiales TaxID=48461 RepID=A0A356NIC5_9BACT
MLPSLQSITPEILKSQLVDWKQPAYRGDQILDWVYHKRAVTVDSMSNLPKDLREQLDKNFKCYLPDCMQKQGSDDTTQKFLWKLNDGAFVESVLIPANPALYGEASDRHTLCISTQVGCAYGCKFCASGLDGWKRNLEPEEILGQLLAIEHHFQPKLKQGQGRKVNNLVIMGMGEPMANYENLMKALKIANAPWGCNIGARKITISTSGLAPQIVALSREPFQFRLAISLHGATDEVRSRIMPINRKYPIKDLMDACRQYLNKKGKMITFEYILIEGVNDGQNQIQPLADWARELHAKVNLIPYNTVEGLPWSRPEEDIQESFLEGLLSRGINATLRREKGHDIDAACGQLRLKVEKGLTE
>UniRef90_A0A1V5K701 Cell division protein FtsL n=1 Tax=Candidatus Aerophobetes bacterium ADurb.Bin490 TaxID=1852830 RepID=A0A1V5K701_9BACT
MAEFSNRFLRGLNAGSVRPARGGANKAVGLILLLSLPFLLVVWFYTQSAKLSYDITELTRERDSLKSQNKMLEMKVQVAMSGSGIEHIARERYGFRPAKPGDVQVIKKEYGALGLF
>UniRef90_A0A8H3UYL2 Carboxypeptidase n=2 Tax=Venturia inaequalis TaxID=5025 RepID=A0A8H3UYL2_VENIN
MSRFVALIACVFALLNGLSIARETMDERARSSRQRRSEMMTPVRRSPLESRDNSTWRFLNSKSQAYAVDSLPDLDFDLGEMYAGQIPIGNDTSRNMFFVYEPTISEPVDEVVIWFNGGPGCSSLEAFLQENGRFIWGWGQYSATENLYTWVNLTNVLWVEYPVGLGFSTGNVTATSEEETAADFVAFFKNFLDIFAIKNFKIYVTGESYAGRYVPYVSAAMLDENNKESFDLAGALMYDPVIGQYEYVGQTIPAVPYIQEYSKFFNFNQTFMDQLASAHESCGYADFIDKYMVFPPAGVQPWLEGGFNNKSAECDVWDLAWAAAFQPNPCFNVYEISSMCPILSDPLAYPSDLQYQYDGMGGIYFNRSDVKAAIHVSQDLSWSECSGPVFVRSAGGLYGNGDTSLDPIQYVLPKVIEATNRVLVANGDYDFELITNGTLLSIQNMTWNGALGFQSAPTTEIDITLPDLQWQATFEASGLGGYDGPGQGIMGVQHYERGLMWAETFQSGHMQPQFQPRSSYRHLQWLLGHIDTLYVAKAMTNPENEYVSLNKQRCMNEVLVAQADEVKNLLIGAFNTPPGYRPAHAKGTVLTGTWTPTTLPSPLTKAWHIQTPTTVLARFSNNTGIPTIPDTDPNATPKGLALRFNYPPAAADGKRKHTDIVAHSTPHFPARTGAEFARFLKALGEGAAAVDGFLGTHPHTLEFVQAAKPLPVSFGTEAFFGLNAFKFVAGDGVETYVRYEFVPVAGVAHLSDEQARGKGADYLAEEIRERIGRGPVGIKLIVQVAEEGDVVDDITVHWPAERAKVELGTVWLDAVDEEGLETQKKTIFDPIPRVEGIEPSADPILDFRAALYLISGRERRAA
>UniRef90_UPI0003871D39 macrophage-capping protein n=4 Tax=Falco TaxID=8952 RepID=UPI0003871D39
MAPSDPRSPPERANPPGGTRGGAVRPPGVRLAVRRLHIWRVEKLRPGEVPKATWGTFFSGDAYLVLHNGPDERAHLHLWMGRDSSRDEQGACALLSTQLNALLGERPVTHREVQGNESDVFMEYFPRGITYQEGGVDSAFKPTRPSAGAGPVCKLYQVKGKKNIRASEQDLSWASFNTGDCFILDLGETLFVWCGARCNILERSKAQELAMAIRDGERGGKARLEIVVDGEEPPEMLQVLGPKPTLQEGSPEEDVVADQRNAGAAVLYKVSDMTGRMDLSQVATSSPFSQSLLCSDDCFVLDDSAGGKVYVWKGRKASEQERQAALKVAEEVITRMGHSPRTQVEILPQGHETPLFKQFFTSWK
>UniRef90_UPI002022F6CD restriction endonuclease subunit S n=1 Tax=Pediococcus acidilactici TaxID=1254 RepID=UPI002022F6CD
MSNKVPQIRFNGYSDAWEERKLGDVGDTFTGLTGKTKEDFGHGSAKFVTYVNVFQNPIATLDQLDAVEIDEKQNQVQKDDVFFTTSSEIPEEVGMSSVWTYDTKNVYLNSFTFGYRPRVSFDLNYMASMLRSPSIRKKITFLAQGISRYNISKTKMLEIEIPAPNLSEQKKSVRSSNS
>UniRef90_UPI001CBE7AE7 immune inhibitor A n=1 Tax=Kangiella taiwanensis TaxID=1079179 RepID=UPI001CBE7AE7
MKIKLLAGLLAAAIIPSVNAAALESGAQVSPKDPALVNHERIIYWLEKRGELDANATDSQREAALATYLKGVRSNNVALPKIEQARLQRQQTSYLKGESKSHKRTDEKTVKVLAVLIDFPDLKHNAHGLTSGDTDMYYSSYPVSHYQDLMFSTTGFTGPSGQNFTSGYQYYQNESGGTFNFTGQTFGWVTADNNAKHYGQNDPDSNDNDKNVPALIKEAVTKAVAANSINLADYDIEDPYDLDGDGNVDEADGMIDHVMVYHSSIGEEAGGGNLGEDAIWSHRFFVDTNTNGYTIPGTGKKLFGYTIQSIDAATGVVVHEFGHDLGVPDEYDIAGSAVGSPVGYWSVMAGGSWAGEVAGTQPTGFSPYARAYFQSVYGGDWIDEQTVDFKAMATGSQNFDLVEAVNHNGLNQIRIDMPKPLVDFAPPYSGSYQYYSDEGHYLNNALSFDVNIPASGNSVLSMKARWDIEVDYDYAQVLVNGNPIAGNHTKVNNQYHSGVTHFITGESKTISGAEGALGWLDLTFDLSAYAGQSVTVEIKYVTDPAVGGYGLVIDDLVLNNGSDIFTDGAETEGSLTLNGFLRVSDKTDGKAQHYWVQLRSENGQDEGLKRTVYTPGVLVWFADEAYSDNKVEEHPGHGFLGVVDADQNPIKRNGSIASSSLQVIDAAFGLYNQKSYSGDSHLSSTATFDDSLDYSLPQQPESGLVLPTHGLSIEVTAQATNSSTATVKISKATPALTADFGFDIDYKQVAFSNNTKGGDANYTYAWDFGDGSAVSVDANPTHTYAQSGVYTVTLTVTDGEATVDSKSKSVSIADELQAEIVSSVNGAKVSVSGNAVGGSPDYTYSWDFGDGATSSNRSGEHTYALTGEYTITLSVTSSDKQAVEVSKVVQVVAALNASMNTSANGLKVNFTSNVGGGDGNYSYSWNFGDGSSATGANPSHTYASAGSYDVAFTVADSTGVEVTVNKTISVAEKSSGGGGGGSGNILLLMLLAAGLVLRRKS
>UniRef90_A0A0D2KAI6 Pentatricopeptide repeat-containing protein n=2 Tax=Fonsecaea multimorphosa TaxID=979981 RepID=A0A0D2KAI6_9EURO
MSMSLVHCLSDSVSSSGSFSRTFSRPFSISTSNFSASITSTKRPQRRSTSKSWLEDLSPRFFTDTPIYPDVLRIKPLTSNGAPPQDLSSLRPPPLPFIPPPQSNRNGRITLLQRLRYWWRRAAVMRKFYKQRIAQTRQNRKECALLSKRLPRMFVEHPDRAAIYGGSTFTVNDKSFPIPRISRREFQLLVQYGYDNWGFALAVRALPTSEKPEEDRNRQLKALCNRYDWFARNRNDKLDNVTDNSNLSHTAQAEEVFTLLQRRLLRWHYVVVDDALCKLIPWVPFAWTVYAARFFDRWCADYYRIITADTVLIMRQGGFNTLSADDIYDYCVKCASPTFISYAKQALQDGVNPANEAMRKAMIPVLDARAKRMLSIDWTRLKPHALGRIEPFSRVKDLKQPDSVWGRK
>UniRef90_UPI001CCE8B09 LacI family DNA-binding transcriptional regulator n=1 Tax=Celeribacter litoreus TaxID=2876714 RepID=UPI001CCE8B09
MSEPDRISSKNLTMQDIAKAAGVSPMTVSNCFRYPDRVRPKTRETVMNVAAQLGYVPNMSAGLLAAGSSQVIGAVLPSIRNSAFYRYVAGLRQAATERGHELITMIAETPEEELSAVQTLLGLRVAGIALVAGPHVADLRQLLALSGTPVVESWGGEDAIGCGVAYDVGAASRELTQHLIKQGRRRIGFVQVLGGGEQRYTMRFPGFQKVMFDAGLADNLVLTVRAADGFGSGARILNEFLSLEPRLDAILCPTDVVAAGALFECQRRGLDIPGDIAIAGWGDYDIGRQLSPTLTTITPFSFDIGAGAVKMLLEGGAERPNSLLTPYALEVREST
>UniRef90_A0A7D6Z791 AAA family ATPase n=1 Tax=Nocardia huaxiensis TaxID=2755382 RepID=A0A7D6Z791_9NOCA
MAPNHQPFAQVRETHTGVVFLCGERAYKVKKPVVTDFLDFGTAAARERACARELELNRRFAPDVYLGLAQLSDPTGGPDEPVIVMRRMPDSARLADRLDADEEAPELSALAELLARLHDAARRGPEISAAGTPAAVRARWQALLHSLREQPLGALDPDDVEYAELLAGRFLDGRGDLLAQRIAQGRIVDGHGDLLAEDIFVLPDGFRILDCLDFDDALRYVDRLDDAAFLAMDLEFRGHSRLAEDFLREYLRRSGDAPPASLRHHYLAYRALVRAKTDRLRAAQGDPEAGGQARRHLRLTLRHLAAGAVRLVLVGGLPGTGKSTVAAQLGRLTGAEVISSDTVRAELRARGAITGRAGVFGAGAYRPQAKHAVYTQMLERARERLAHGVPVILDAAWTDVAERRRAVRLATDTCSDLVQLCCTCPGTMAAARMRTRAHGDSEATPAIAEAMAVAGEYWCGATLLDTTDTLEHTVAAALREWDAAPLRAPRRPESSSLPSR
>UniRef90_Q31A46 General secretion pathway protein C n=1 Tax=Prochlorococcus marinus (strain MIT 9312) TaxID=74546 RepID=Q31A46_PROM9
MKKFIKFLFFVFICGLVSNSHLVLTKDDNRSKKEIKLHELPIKIKNSKNNQIQLKTLPLPLIEVAANSVNSERNPFLELNKSIEEIGINPKKFFTLTGIIQTGEQLSAMLKSSDGVNLFKEGENINKNLKIKKISLENETVIFTDGENEFKLEFSEK
>UniRef90_A0A848CYM8 YqaJ domain-containing protein n=2 Tax=Aneurinibacillus aneurinilyticus TaxID=1391 RepID=A0A848CYM8_ANEAE
MSNLINRSAAEALRRQISEAAEAQRGHEMVSDFLTMMDRWHGSAEVWDDTLEAEILEQQAYAIRRLKVFPPRGTTYFSPSSANSCKREMYVKLTGAARDNSDSQPHQGRWQRAGTAFGDTIQRDLLFIEKHYEKKFGEKPPFVPERTAHGFPMWERFARKFHSVEHRGYTVNFLGQPDGILRYKDGTRVGLEIKSKQTTSAQTTEYSMRGPKEDHVKQCVVYSIMYGVDDYLIVYGNLSKKAWVMTPEEYAKNPDLRAFYIHVSESDRQALLDDFVDVLQAVKDGNPPRLDVEKWTFNNYKTACALSLTDAELEDIRKQVRQVGRSRLPDWKKQAYYDALDFIERVRKEAM
>UniRef90_A0A1G5F3R4 Aldehyde dehydrogenase n=2 Tax=Desulfoluna spongiiphila TaxID=419481 RepID=A0A1G5F3R4_9DELT
MDTQQEMNKMETSLATMKRAFASSPMPSLNTRIGMLKNLKTALIEYTGKISSAMSDDYGKRSEIDTLIADIAPCIANINHTVGHLHEWMEPSKRDSGPLLSTASVEVIYQPLGVVGIVVPWNFPVMLSIGPLISAIAAGNRAMLKMSEFTPHTNKVLGEMLQSVFDEAYVNVFEGEAEVSAAFTALPFDHILFTGSTTVGRHVMRAAAANLTPVTLELGGKSPVIVADDVSMEMAVERIIYGKSLNNGQVCVAPDYVFLPEGRVESFIAEYKKQYGDLFPDGVDSENLTSMANTRQFNRIEGLLNGETEKQTRIEPCHGNSRDNAKNRLVTHMIVDPAKDSEVMTEEIFGPLLPLIPYGDVQEAMAYIQGNPRPLALYLMTFDEDLQQQVKTTVHSGGMCINDSVFHLAVDDAPFGGVGESGMGNYHGFEGFLTLSHSKTVMTSGTKHNIKHLFAKDDNAFKKAVLEAMLR
>UniRef90_A0A1X1T8H9 Chromosome partitioning protein ParA n=11 Tax=Mycobacteriaceae TaxID=1762 RepID=A0A1X1T8H9_9MYCO
MSADYDRLFHSPDAAQTPDEATLHVDRDALMRSNAAAPAPAGGSNHADGAVPPPLPITQPRTQTAPAPPPRHAEITTQMPPTTQMPPTTHMPPTTHMPPTTHMPPTTQMPPTTQAPPAQSPAPQRPPNGMMRTPQTNLPGGARFEAPRQATTPAPRPAPAPPPSAHFADAPPTEAAWPHGQPPAQPAPTSAAAMGNHRAIDALSHVGVKSAVKMPSQRGWRHILYLLTRINLGLSPDELYEMDLHARIRRNARDSYQIGVLGLKGGVGKTAVTVALGSTLAKVRGDRILAIDADPDAGNLADRAGRQSAATIADLLSDKELARYNDIRAYTSMNGANLEVLSSEEYSQARREFNDDDWKGATEVVSRYYNLVLADCGAGLFQPSSRAVLATVSGLVIVASASIDGARQAAVTMDWMRQNGYQDLLSRSCVVINHIVPSKPNIDVDDLVQQFERHVAPGRVIVLPWDKHIAAGTEIHLDLLDKVFQRRIIELAAALSDDFDRLERR
>UniRef90_A0A0R3QEL7 SH3 domain-containing protein n=1 Tax=Brugia timori TaxID=42155 RepID=A0A0R3QEL7_9BILA
MEKIKVINGLRTTISSLPVRESRKALRYLGRIKRTKRVKAVALECGLLRKLLPGFIVYFNVMLRKELVASGVRYGVMEAVAEHDFNATAEDELSFRKNQILK
>UniRef90_UPI001944A0FC hypothetical protein n=1 Tax=Levilactobacillus andaensis TaxID=2799570 RepID=UPI001944A0FC
MEREQQRLDTGLAAELNAALKTKRTQLELLQLLYGQTPRSQRQCSSVATEQVVRTDAE
>UniRef90_A0A672LGG0 C-type lectin domain-containing protein n=3 Tax=Sinocyclocheilus grahami TaxID=75366 RepID=A0A672LGG0_SINGR
DQNDLDLKIQDQVIHLTFLLVFQRGSRCLVLITVGLGLICVLLLVFIILQHITITAERDRIKSYKNTAEEFNQTINSLQDNHTDLTIKKSQLQDNFNSLSQKNLELESQVRSLSDQLKKESKRGQICCFWSSSLLMHVYSFLKCLCKNLCGLDGFFLSNEFKSWSDSRQYCRDHGADLVIINSGEKQVSFLWIGLSDRQQEGNMKWVDNSPLKQGFWLKGEPNDQGGDEDCIELMPSNPVLNNWNDLSCSEKRKGICQK
>UniRef90_A0A538MFC4 Thiamine-phosphate synthase n=1 Tax=Actinomycetia bacterium TaxID=1883427 RepID=A0A538MFC4_9ACTN
MRLHAIVEDLASARAAVEGGATVVQLRCKGASTDELVEAGRGFGVLEAAFVVNDDVEAALRLGADGVHLGRDDPGAERAVAAGLLLGTSAARVEEARAGEALGAAYVGAGPVWATPSKPDADPPIGLDGLAEICAAVSVPVVAIGGVDASSAGDCIRAGAAGVAVIRAALDAAAVRAAVDAAL
>UniRef90_A0A7V9WRH6 Nucleotidyltransferase family protein n=6 Tax=Streptococcus porcinus TaxID=1340 RepID=A0A7V9WRH6_STRPO
MEVIDKLISQNAELMNLLKLIKGLDLPDSWLCAGTLRNFIWNKLSNHNEILTTDIDLVFFDPNMTYQESLALEQSIMRKFPQYNWDVKNEVYMHYHTPAASAYSSACDAISKFPEKCTAIAARLDDKNQLELFLPYGEADILQFQVNPTPYYTENRERHKKYNQRQYQKNWSSTWPQLKVSFFPE
>UniRef90_UPI001CD804F7 response regulator n=1 Tax=Desulfuromonas sp. CSMB_57 TaxID=2807629 RepID=UPI001CD804F7
MGHKVPKILVVDDEENARLALRVILQQEGYQVDSVANGLEALEFLRRHRVNVVISDIKMPQMNGLAFLRELNRRYPSTRVIMVTAHGGIESYLEAIHLGAFEYIHKPVRVEELKWVMSKMFNEGRTAKAN
>UniRef90_A0A167SRD8 Uncharacterized protein n=1 Tax=Fibularhizoctonia sp. CBS 109695 TaxID=436010 RepID=A0A167SRD8_9AGAM
MCHCGAECHHNINLFEVSQKSDHTSSEVQLIGLLFPYVARLWQRVNITLIAAAVCSRNGDLFGDVEMAAS
>UniRef90_A0A5B7IY87 Secreted protein n=1 Tax=Portunus trituberculatus TaxID=210409 RepID=A0A5B7IY87_PORTR
MLRLMLLSGWILHYHYATTLPRAPPCQCLTPSRPCRHLPLVKTRQQNMEYRLGPAECRRVLCNATPHSQSGLPPPCSFRPSDQHPTTPLVFPPLPQHTL
>UniRef90_A0A6M0BSB5 Uncharacterized protein (Fragment) n=1 Tax=Okeania sp. SIO2H7 TaxID=2607802 RepID=A0A6M0BSB5_9CYAN
MLNLAVIYIDNIFTNVEKKETGDRRQEMEKGVRRQESGDRRWKKESGDRSQETGVRRQELELCFLERSLKKELIDRMKREPAKN
>UniRef90_A0A7S1N3F1 RRM domain-containing protein n=1 Tax=Eutreptiella gymnastica TaxID=73025 RepID=A0A7S1N3F1_9EUGL
VEATAAGAAPTESKAKGTKRKRLPPASEDAAERPPPSKKERKGQLVSATTPKEVAALPPPPADVREVWMTNLPVIVSEKDLYAAYEELGWEAITKVKWMQRTHAAGTSFRRCAYVTFATPDLARRACTLDVEIKGKKPKLELTNPHHVHKSLELFTQGWPTQITDKQVHEAFLLLGLTGITAIRWLPKKGNRLSCFLDFDSKEARDKVLQGGTLQYKGRTVLVQKPLNTLPSDQRTAADRSAKSCELFLDPCFKAMTNDIIQTHYESTLGPDTVVTVRRWQNRGWVVFKTHELALQASKMKPPRNPGKEQVLVRWRLNAK
>UniRef90_A0A4Q3K0R9 MBL fold metallo-hydrolase n=1 Tax=Myxococcales bacterium TaxID=2026763 RepID=A0A4Q3K0R9_9DELT
MASLGEGNGKHPADFGVGVRPLTEVSPASGKPVLAFASHAHVDHIGSLHLYERRAGHPLEAHTFAAMDDLGTLAPEFIGIEGAVTASPSPGWTMADYALVPAPLTELLGEGDHVDLGDRRFTVLHLPGHSPGSIALLDERNGDFFSADAIYDEGLVDDIPGADIETYLRTMRRLADLDVGTVYAGHGEIMDRKQMRDVALGYIASKGG
>UniRef90_UPI000719B42D xenotropic and polytropic retrovirus receptor 1 homolog n=1 Tax=Priapulus caudatus TaxID=37621 RepID=UPI000719B42D
MSTARTCMLPTMLKDLLYAAQDEAPNADAVDDDHVQRFLANFEERFFRKSDQELVKINTFFSEKLAEAHRKWANLKSELGELEERDRNHVSGHQRRKLSSVVQRAKNKKEPAVRNLPQLKLAFSEFYLSLILLQNYQQLNFTGFRKILKKHDKLMQTETGSQWKSVNVASAHFYINKDIDRLIQETEVGRGYYEAIIPRNSGVRPWHSSEDHAGW
>UniRef90_UPI00123D7996 HNH endonuclease n=1 Tax=Roseibium aquae TaxID=1323746 RepID=UPI00123D7996
MIEAPQSFVVREECGKAAFQNGFRRKREEREGWAGFSSTTVPGTIHLAAASAQGPWFLALDHTGVVEELDIPVVDIAGPGLARYAFETLGQVYAVLPRIYQLAASLPDAPLQEFETKVKDLPKTTEAERLVVQRIGQDIFRSGLLEYWQGRCPLTGISDEPLLRASHIIPWKDCESDAERLDVHNGLLLSALWDAAFDRGLVSFDDVGQPIFSPALGEHARSELRWQQPIALTEKHRARLAWHRSHLFKAEQ
>UniRef90_A0A3B6R914 Homeobox domain-containing protein n=2 Tax=Triticum TaxID=4564 RepID=A0A3B6R914_WHEAT
MSPSTSPESGISAGTKRGLEHTSSGVFPAASSDEDDGGGDGAGGRKNLRMSKDQSAVLEECFKTHSALNPKQNKALANRLGLRPQQVEVWFHNRRARTKLKQTALKAAPQAHNGASEGPLTTLTMSLSRKRVASTSSASACTVPRFSANAGTGMPMPSLKEWQFFCAFRDTGAMYGGSSRLAKVVKPAR
>UniRef90_A0A401M0J4 Potassium channel protein n=3 Tax=Bacteroides TaxID=816 RepID=A0A401M0J4_9BACE
MKSALSDFVWEKKGIYGILHVVILLMSLFLVISISIDTFKGIPFYTQTSYMKVQLWICIWFLFDFVLEFFLARHKWHYLRSHFVFLLVAIPYQNIIAYYGWTFSPEVTYMLRFIPLLRGGYALAIVVGWLTHNRASSLFISYLTMLLATVYFSSLAFFVLEHKVNPLVVGYGDALWWAFMDVTTVGSNIIAVTVTGRVLSVVLAALGMMMFPIFTVYVTNLIQRFNDQKNKYYQQQTTQQESVVSQGQTSPQGQTSQQSPTEKSAS
>UniRef90_UPI001FE9B9A5 beta-lactamase family protein n=1 Tax=Sphingomonas colocasiae TaxID=1848973 RepID=UPI001FE9B9A5
MLALALLSLPAALAAQAPVPSDTPGKTASGISYTQPRDWTMTVKGSATIFAAPEANLNIAVVDAGEAESAQAAAAKAWAAYRPDAARTVRLVSPAARGDGWDERVGIAYETSPNERATVSALALRKDKGWTVVITDGAESTANKRSAATSVIQGSLRPAGYAPETFAGKAAHRLTPDRIQAIRDFVAESAKQLEVPGVGIALIDQGKVVWEGGVGVREIGGNEPVTAHTKFMVASNTKGMATLLLSVLADEGKLRWDQKVTDLYPAFRLGSDAVTQSTLVRHLVCACTGLPRKDYAFILADAGAPASDTFRQLAETQPTSKFGELFQYNNLMASAAGYLGGSLAYPKMELGAAFDKAMQTRIFGPLGMRDTGFDNAAAEKGDWARPHGLDVDGRMVEIPNTFNHLIVPHRPAGGAWSSAADMARYAQLELSKGLTPEGKRLVSEANLLERRKHGVPIGENGWYGMGLMERVVSGVTVVTHGGTLQGYHSSFFVLPDAGIGAVILTNADPGASMIAPYLRRLLEVVYDGKPEAAQDVAAVAARIKAQAQARRAKLTVPGDPAVLAGLATTYRSQIDGKISFSDRGGAKWMKAGFIEGPVATRKNADGTVSIVSAGGGAIGVEAVVGSKDGARTLTVRDSQHDYVYTEVR
>UniRef90_A0A536UTK9 SCO family protein (Fragment) n=1 Tax=Betaproteobacteria bacterium TaxID=1891241 RepID=A0A536UTK9_9PROT
REFKFYYSAQQADAQGNYTVDHGAGVYVFDPRGRLRLMMRPGSAVDAMAADVAQLLKE
>UniRef90_A0A290RU70 Cytochrome b561 n=15 Tax=Pseudoalteromonadaceae TaxID=267888 RepID=A0A290RU70_9GAMM
MFKNTPTSYGLIAITLHWLMAFTVFGLFGLGLYMVELTYYDSWYKGSLDLHKSIGITLAAVLIFRILWRVFSPKPRPLSQNKTVNHIAHTAHIVMYLILAVIVVAGYLISTADGRAIAVFSIFNIPALDYNFDGQADIAGKIHYYGACTLIGLAVLHALGALKHHFIDKDKTLTRMIKPKEY
>UniRef90_A0A7W1BD12 DUF1570 domain-containing protein n=1 Tax=Actinomycetia bacterium TaxID=1883427 RepID=A0A7W1BD12_9ACTN
MTASLDECWLKITRAESHFDIVKSAIHGFLQPNPERIAGQLDAESGEEVYYTRRYPGTRREWSIIIGDALQNWRNALDYIVCGLVRMNGEEPSSSNAFPIVDRESDYPAQSKQRIARVYPGSEAVVEGLQAFNRGNAPEDDPLCRLRDMNNWDKHKALHTTTHVVQLESAWPVRMSEDPSAGKFVSGAFERERPLARIPADRELGQAYAEMVFDATFDIAFEGGPPLTEGLEVIETLQQIGDFVRFETLPRFAQFFA
>UniRef90_A0A7C3X0Q5 Aldehyde dehydrogenase family protein n=1 Tax=Candidatus Hydrogenedentes bacterium TaxID=2030809 RepID=A0A7C3X0Q5_9BACT
MSKKELKVINPYTEKEVYSFPMDTIEDAYQKIENAYKAFQEWRFTSMNTRKELCLKFMKEFEKNRDNIAHEITEQMGKPLQQSQNEINTMLDRAQYMISIAEQTLADEYLPEKPGFVRYIRHEPIGVVLDIAAWNYPLLIAVNVIVPAIMAGNAVIVKHARLTPLCGKAFVEAFEKAGAPKGLIQDIIADHQVIDAVIKHPKIGFVSFTGSVRGGHEVVQSASTRFINQGLELGGKDPAYVCADADFDYAVANCVDGAFYNAGQSCCAVERIYVEKPIYNQFVEAFVELTRQYKLGDPMQKETTLGPLAVSSARQFLKKQVEEAVAQGGKLVVSPDEFEVPDQGWFFAPAVVADAPQKSSLMQEESFGTVIGILPVHNDEEAIEYMNDSPYGLTASIWTSDFERAKRIGERVETGTFYMNRCDYLDPALPWTGVKDTGRGASLSHYGYYQLTQLKSMHLRIKW
>UniRef90_A0A7Y5VDB2 Rhodanese-like domain-containing protein n=1 Tax=Saprospiraceae bacterium TaxID=2202734 RepID=A0A7Y5VDB2_9BACT
MFGLFQRTSSDYKNLNADDFRKAIEHDKNAVVLDVRTPAEAHGGKIKGAKVINFMDPGFATAISKLDPGKSYYVYCRSGVRSANACQVMAKNGFKELYNLRGGVLDWPFQLL
>UniRef90_A0A1F2RY10 Lactamase_B domain-containing protein n=1 Tax=Acidobacteria bacterium RIFCSPLOWO2_02_FULL_68_18 TaxID=1797185 RepID=A0A1F2RY10_9BACT
MTGRYVGIVAALALGGASATLQDATSVLNDAARALGASELRTVQYSGTGFVYAFAQSYRPGGPYPKFHATYSRAIDFERGLSRDETVRTQFEDPPRGGGGQPLYRDARAAGVVTENSPWGAGALALTPHGFLQAAMRATPTISTRRVGGGTVTVISFTARERYRVDAFVNGQHLIDRIETRAANPILGDMLIETTFAEYRAFGGVQFPTRIAQRQGGFPTLEIAVTDVRPNAAVALEAPEGGAPQPARSEGQRIAEGVWYLAGRPDPNSQLVEFRDYTVLIESSVTEARALLNLAEARRLVPGKPVRYHVNSHHHGDHAAGLRAMVAEGVTLITHETNRPFYEQTVLRNPHTLAPDLLARNPRPPAWVWVNDKYVLSDPTRTLELYHVENGHAANLLMGYIRQEKLLIITDIFNDFGEPRPNDPPSGLVSPYYAALGDRIRRLGLDVERIAPSHGTGTVPAERLWKALEGKVQAPPVAGR
>UniRef90_A0A7J5FRL1 Transposase n=3 Tax=Bacteroidales TaxID=171549 RepID=A0A7J5FRL1_PHOVU
MGIDDQNKLVNAGFQIIRKDDYPSPRIKFCTGRNGSWKTYKKFETKAERDRAFALLLKDEKIISD
>UniRef90_A0A0E3X9I7 Group-specific protein n=1 Tax=Staphylococcus phage IME-SA2 TaxID=1610831 RepID=A0A0E3X9I7_9CAUD
MDYREKMVSQGQPPLSNFEYYHVIVPYLVGVIVIILSIIFRDSLYSAQSGFGVIITSFIYMLVYVIIGLVGSFVLTIFQARKARQYQTQEDNNEVQ
>UniRef90_A0A2K2F967 Protein jag n=1 Tax=Pseudoclostridium thermosuccinogenes TaxID=84032 RepID=A0A2K2F967_9FIRM
MSYTIEKSAKTVQEAISAALEELNADENEVEVEVIDEGNKGIFGIIGTKLARVRVTLLDTPAKKAQDFLEDIFSKMGIAPEMELTEEDDTLSIKIKGKDIGIIIGRRGETLDSLQYLTSLVANKNGGKYKRVIIDVENYRQKREETLIKLANRLADRVVKYKKSVTLEPMNPYERRIIHSTLQNHKSVETYSVGEEPNRKVVIAPK
>UniRef90_A0YFF1 Hcy-binding domain-containing protein n=1 Tax=marine gamma proteobacterium HTCC2143 TaxID=247633 RepID=A0YFF1_9GAMM
MVMSKVVLLDGGMGQELLRRSSQKPHSMWSARVLLEEPEIVEAVHRDYIEAGARVITLNNYSATPERMAREGHPELFDILQKKAIDIAKRARDNSPRARDHDIKIAGCLPPLFASYKPELAPNFEECLERYRVIADIQKADVDLFICETMSSIKEGTASAVAAASTGLPVWLGLTLEDNLEGRLRSGETLADAMAPIVDLGVEALLLNCSMPESINAAIGTLINGYDTVGAYANGFTSIAALKPGGTVEELQARQDLSPNGYAKFALSWVDSGAKIIGGCCEVGPAHIAELEQQLLAKGHEICSAL
>UniRef90_A0A2T9WSI7 Nucleotidyl transferase n=1 Tax=Nanobsidianus stetteri TaxID=1294122 RepID=A0A2T9WSI7_NANST
MSLYTLILAGGFAKRFRPLSDYVPKPLFPVGGVPLIYYIIEKALETGSDGIIISTNKKYEYHFRHILASLYSFYEPSQIGKIRLVIEPSNSEENKLGSIGGLHYAIKEMGINNNLLILLGDNLFSFNLNKIIKLGNENNSIALAIYDVKNPDNAKNYGVVKIENNIIKEFYEKPQNPLYTTISTGIYYIPREKLYLLDEYMNSNYSKDSMGNFFEYLIKRGEKLYGYIYIMTIMNIGLILVQ
>UniRef90_G2I2J0 Competence-damage protein n=10 Tax=Komagataeibacter TaxID=1434011 RepID=G2I2J0_KOMMN
MNPTACLLVIGNEILSGRTQDVNVQYIARRLSETGITLSEVRIIPDIRTVIVRNVTETRAAYDNVFTTGGIGPTHDDITSACVAESFGVPWVHHPETFRLLEAHFAPDAFNAARQRMATMPQGATPIRNSVSVAPGFTMGNVHVMAGVPRIMRAMFEEVLPTLPHGTPVTSQAWHANGLYEGALAASLEAIQHCYPTVDIGSYPYRLDESQRGVCLLCKGTDTQAVQDAATAVRNLIVEMGFRPQAGEPAKA
>UniRef90_UPI0008255106 DegT/DnrJ/EryC1/StrS family aminotransferase n=1 Tax=Bacillus acidicola TaxID=209389 RepID=UPI0008255106
MISTQLRNIPFSPPDLTEKEIEEVIKTLKSGWITTGPKTKEFEKKIAEYVGVNKAVCLNSATAAMELTLRILGVGPGDEVITSAYTYTASASIIEHVGAKIVLVDTAPNSFEMDYKKLAEAITEKTKVIIPVDIAGKMCDYDTIFEIVESKKELFNSNNELQGLFNRVIVMTDAAHAFGAERRGMKCGQVADFTTFSFHAVKNLTTAEGGAVVWRDIFGLDNEWLYKQFMIYSLHGQSKDALAKTQKGAWEYDIVYPAYKCNMTDIMASIGLIQLDRYEKLLQRRREIIEMYDKALSPIGVQSIQHFGEDFSSSGHLYLARIPEINEQHRNEIIVKMAEAGIACNVHYKPLPMFTAYKNLGFDIKDYPNAYNQYVNEITLPLHTLLSDEDVEYVVGNLKWNLNEI
>UniRef90_A0A455ZFP0 Paeninodin family lasso peptide n=1 Tax=Elizabethkingia anophelis TaxID=1117645 RepID=A0A455ZFP0_9FLAO
MVKKKDYIPPKLEVEIVEMECGIAANSAAVSPQTVNGNTDEAQTDWNGNDDTTIDTPF
>UniRef90_A0A7S3Z719 RNase H type-1 domain-containing protein (Fragment) n=1 Tax=Lotharella globosa TaxID=91324 RepID=A0A7S3Z719_9EUKA
WSLLLAPKAFLKRATSMQRRTLKRFLSLPTCAGGDVAEVYAAIAPLDVLLHRLCAGTLVRMVSAEDHEGRLAYRRYLDSDQPIKDIRRKVSTWKSPFGVMLKAAQALGLPLFPRAKRVRHAMAKSNVNVNVPVFKNFNKKFSERCKKKAREFAESVIANIPSDEYTLYTDGGQCDDHKFAAVCGVKDNMESFTLCFRLTGAAVSSHVAEVYAIKAAILWSIKHDVKVHIVSDSQAAIRATLSPASQCIHARKVHTLLANSKVASLVWVPSHVGLPGNERADAIASGGDHSTIVRVPTSVSDYTNRIKLRALEIWNDRWKRSKNSKELHRLMPNVPHDRSHILGCITARIMARLRTGYCSVASFLHRHKLKDSNLCGRCLDVGKHRVETVAHFFVCKANRPHSTAVLVDFTAILGHRPTSLSEVLDVNLYLSKQI
>UniRef90_K3VTF1 Adenylyl-sulfate kinase n=2 Tax=Fusarium pseudograminearum TaxID=101028 RepID=K3VTF1_FUSPC
MTLKKLTLPYYAPNAEASDKYPSFCPRLKPSDCNKKVERPAPIVHINGFPGVGKSTIAKKLHEHINKWKIKVVQHHELDLLANTIKTPETFDHEQLRRATRALALNTIAESEDRLDTCYVFEDFALNNQGGFRIMEEYRLLALRRGCSLIRIELTCDDVAYKTRLKDQGRIDFRTENDYPRRSCLTCTDQRLVTSPILCRGFSDGGLKSLDVSSKPELWTAMSAAHHVMVTWNAGL
>UniRef90_A1DJ33 Cyclic nucleotide-binding domain-containing protein n=11 Tax=Aspergillus TaxID=5052 RepID=A1DJ33_NEOFI
MERVRKTFFNPLATSKAQVEKILEGLPVGSAHPFSLEQILLCRTENGIEEIDISSYPENFFFNAMDLGEMGEILLRRMAGFQSHLKVFEDFQITQAPSSTFKIPIVSDQITILAVSERTPTYYDFCFADESCNACCWLARNTFPGITHSGDILNGQDLLDYVKINKDSLIEKEICVFISGYQSTLITRFLGTHPALLVADHVDKVLYIIPVPLDAATIGDATICCPLVIKRDGDSLIYSILPTATTDRGMMCDSNKLVSPAFPEAIKRADFTMCTPDLTTRKTAPANDSVVEDTASNSENLRKIITKENAIFTTDSAALPSFIDLEKTQIIRFGTGLEFKLPDEEVPMREEPSAIVLPCIFGTELQGPVLLATGTVPSNVPFPNENALRDYYKQLKNAVVIVDERMTDNARNLASAYRINALFIVQLTPETEPKDTNGVISLMDLANINAVTALAGPQSLILVQISEKYYFYRGIANRAHLNTSGLAFGADVTSVLESVGIGSILDPRIERVINLGDANSIVLPTTGQLVQPQDLQKLFEEISVDQIQNLEEDISAVVPQLQVLLNQKDLQELSRALVTALSTKISNAATPLRDSYTKFLTQDYRMEDPKSVQKKNKMLGELRKITKDMQKALEPVISCLANMISSQTTSKRTHDLKRLVRQTTIQNNVEAVKSMTFETLSGYLEEYAGDMGVMLLNIETTPYRELLGNLKNSAIDASQCCALDSRILHLEGFDAGIIMEQSQTKHNGPLKSTIGPSQPILALPYLSQSSGTGSMLAWVLRWMEKCNEPHIAALRIIMRSTLGQAVASREHDIQPSSPETGHLMSALLMAAMSKLAAMRTSKPVELEKAEDTVTRLMRGLFGNLLTIAGSGIRPLSMVWQLFGLNPQYDLPTSSAEWIWYENVVALYPYTGWPLRQFHGNLEKLLDKAVIRVVTKNENLARIKASRTAEMVKFCKLRNIQLEHSRTIITVFMRMLTAEDIDLQPVAARLLAQLPHKLERQSQSYTRMIMYLNHLARGGERRVNDDLTAANVYTSRSATFAELKKQVCEACKRSDWARMKEACQEIMTKHVEIAALWRVKPESLKIQNMKLYKALLAADFDDIDQNTQIKNIELTRQVLGDAENKRVPWQVGKKGQFGSSIEPLDEVFLHEIMTGEKSEPAPPATIDDFKGEEERAMIETEDEFAEFESSLRAEFIKTMQKNLSAEEVCDIINVPVSAMRVFIKALNPEFIWEDLAVNFKSVILELVKDRSNRVESRPVRRLLRIEVRKNLQIEG
>UniRef90_UPI001C2561C3 uncharacterized protein LOC121770608 n=1 Tax=Salvia splendens TaxID=180675 RepID=UPI001C2561C3
MSAIEKKIEMEDEEKEMIDHWSHKHPLTLVDTTGSDRCYGCERSFSSGEQAYGCSIPGCEYSELLHEECSAMAREIRHPLHTQHILSQRHSQELFRCLICEGIIYSIGYKCTSSGCGYQVHLMCAHDKGVVDANHPEHELKLWRRRCSFKCDACGITSRGSSYTCIKGDCQYWIHVRCASLPQTLKREDHHHSLSLSSYIPPEYIKYNYKCDVCSKALLLKYWIYHCQICRFIVHIKCAFNKPPPPLTDASIGKDIVRLPMNEVAVELVTPFVMRQRGGEVGTLIPPFLIPATAVFDEEDELVNMKYKFLHHQHHLTLVSSTSQHPQILGEEEDEENYGVRWELICDGCITPISSSSSSSYYYMSCSECKYNLHLACFHLPPQLYSLPLHQHDDHQLVLQSCDKHQPWNYETCSVCEYPMNGLFYSCTACDFEVDIKCACMPDTIHHAAHPRHLLKHVTQSDLGRDINRWSLSCAATCGQHVVNYDCYRCCNSSCDFIVHVRCAVLLASVSSRRWDEQHPLLLTYDATVNRPGDFYCDQCETQMNPRSWMYHCRPCDVSFHPRCFITTSGEYRNIKMGQEYDVNEETHPHPLTFQLLTTKRRCNICHINNYELQGFYCALCNFFICYNFCGKGMIAKGDLKAVDLGKLSVLDH
>UniRef90_A0A0G1JNZ0 Integral membrane protein-like protein n=1 Tax=Microgenomates group bacterium GW2011_GWA2_44_7 TaxID=1618500 RepID=A0A0G1JNZ0_9BACT
MGNPSTRQFLLVAALALFLRLILIPHPGFLADIAYWKWWTKDSAQNGLVHTITQTGINYPPLYLTIMKATGHIYGLFANLNNDIQYWDKGNLLFLFLIKLPFILADLSVGYLIFWLLRRFYQRNLSHLGHLSNLPLLGAAFWLLNPGVIYNSALWGQTDSLGVVPILLAYLFAVSGRPIFAGALTGIAFFLKAQSIPLILFLYLYLYLKNGLLTTVKSGAAAVTAGLIVTSPFFLTHTMDRIISTIFTSVGYFPYASLYAFNLWWLVIRGASFQFPDQTLVGNLLSYRTIGFTLFWSAFGFLAFVLWQTALKKNAQELTERFLLSTPLVILSMFLLPTEIHERYLLPFFAFALLPLAFDAISARVKNIKLYLFSYAVLSLIWLLNLHFVMIKNYPENEQPILSLISPSMPVLGVVFSAVSVTLYLVFFGVFLKRCLPTNLKSRILAIGLLILLPLGLLSLQAAPVIKAKSQSKVLLSEIKPTFVRQGWGELSKDKSVAGGNLSTWYFFSWKGLGTHANSQIDFNLDGHYRRLETNVGVDTGGGEAASVEFLILGDDKVIAKSGILKKWQYQKSLVADLTGVKKLSLVVTDAGDGINGDHADWLYPTLYK
>UniRef90_K2AFW7 Extracellular solute-binding protein family 3 n=2 Tax=Bacteria TaxID=2 RepID=K2AFW7_9BACT
MKKLLLASALLAFGAGLASAEVVRLATEGAYPPFNFIDDKGEIAGFEREFGDEICKRAALECTWTTNEWDSIIPNLQSGNYDVIIAGMSITEERGKIITFSENYYPPAASAYLAASADADVKGGVVSAQVSTIQAAYVAESGATLLEFPTPDETVAAVRNGEAVAVFADKDYLRPFADESNGALMFVGDDISIGGGVGLGMRQSDTELKAKMDAAIQAMKADGSLNTLIEKYFGAEGLKF
>UniRef90_UPI001E5627F1 hypothetical protein n=1 Tax=Streptomyces sp. VRA16 Mangrove soil TaxID=2817434 RepID=UPI001E5627F1
MRTLHGEWTKFRTVPGQLWTLPALPLAMIVCTALIAAGAHPEQEGTLDVTALSLSGVYFAQAVAVLVAVAVVSAEYPRMMRTTLAANPRRGTVFTAKTLLAAGAVGVLALPGVTGALLTGRAVLTGGAARLPLSSWPLWRATLGTAVYLLLVALLTTGIALIVRHAAAAVGTALTLLYGPYLATLIIEMPDHALHLVQKISPMTAGLAVQTVGGAGGTSPWSPGAGLAVTAVYAAGALVAGWGMLRWRDA
>UniRef90_A0A3B1DZ09 Chromosome partition protein Smc n=1 Tax=hydrothermal vent metagenome TaxID=652676 RepID=A0A3B1DZ09_9ZZZZ
MKLNSSGKTATIFLVIFSVLLISMTAISVFIFQKEKEMRIESEGDLEKKRSEVIELKTEMREVKRKNFLLQEKNKEADERVNSLMDEVELEKGLKEEVKQENVALEEKVEMFIIARKKLDEKIKKKKEDSQKKVAEFKTLLQAEAERLKEIESLKKVNKELEQKNKDLQGQVTKILEEGKLLKEDNKGSEVIKEMGEVKKKVKNKVELEPIIVTPASGKIAKDNKEKKSVQEEVAQTVANSMKGRIISVDRETEFVIVDLGKKSGIKMGQVMSVYRGKEYLGDIKITRIQPKMSAADLIPPFSSRIVHKNDQVVVK
>UniRef90_UPI0012E1D502 hypothetical protein n=1 Tax=Pseudorhodobacter antarcticus TaxID=1077947 RepID=UPI0012E1D502
MRSLISSSAQAVACRAPAVTAVTAVTAVTAVTAVTAVTAVTAVTASLIRVSVLIKPL
>UniRef90_A0A2D9X1Q0 Protein TPX2 n=1 Tax=Actinomycetia bacterium TaxID=1883427 RepID=A0A2D9X1Q0_9ACTN
MKELDSPRNFSRDLQTPARILKVTRGKKKVTRATKLLPIGQSKKLENKFVESKRSAFKTVKPKGKLSPIQEVTQKTDKDSNTSLRSVETPLSRSLELPPPPPAPKKERAGRLEPLAQGIETNFYKNYYSL
>UniRef90_A0A7V6UPT2 Thiazole synthase n=3 Tax=Bacillales TaxID=1385 RepID=A0A7V6UPT2_9BACL
MTDKLVIGGYEFQSRFILGSGKFSLDLMEAVVEYGEAEIVTLALRRANTGGEENIVHYIPENITLLPNTSGARNAEEAVRIARLARELGCGNFVKLEVIHDSKYLLPDNYETIKATEILAKEGFIVMPYMYPDLYVARSLVDAGAAAVMPLGAPIGSNKGLATKNFIQILVDEINVPIIVDAGIGRPSQACEAMEMGVDAIMCNTAVATAGDVALMAKAFKLAIEAGRSAYLAGLGRVLDFKAEASSPLTGFLED
>UniRef90_UPI0005738328 YqcI/YcgG family protein n=1 Tax=Pseudomonas putida TaxID=303 RepID=UPI0005738328
LRGVHARDPHPWPQAIPADPHDSGWSFCYAGMALFINMNFPGHHQMKSRNLGNHITFVINPRENFDEVANADTESGKRIRARIRERVQHYNDGVMPDSLGFFGQADNFEWKQYQLQEAGSLNPSRCPFHANVHAAPDTQIEN
>UniRef90_A0A158Q2K6 Cytochrome P450 n=1 Tax=Dracunculus medinensis TaxID=318479 RepID=A0A158Q2K6_DRAME
MSVLGIVIVISMAAWMTWMLLRKVSSIFNKINIIQGPSPLPVIGNIHQIHFKPDDFFEQAQGIAYMLQKNGERMTRIWFSGWPWVLLYGAEECEAILSSNRTLKKPFQYGFLSDWIGEGLLISDPKKWRPRRKLLTPAFHYDILKDFVGIYYKHGRTLLSKFENMIGEHYNEIFHIVSYCTLDVICEAALGINPDAQNKPSPYLDSVWRMKYIIHQRTIKAQYYPKIFFNLFGNGSECKKHIKILHDFTGKAIKERKRLADEAGGIENLLKSESKRENEKISINFFTSLFIYFRNQNISGKKRMAFLDLMLDMHSKGDLSLDGIQEEVDTFTFEGHDTTSASMNWFLHLMGTNPDIQRKVQKEVDDVLGKVNLTRLMTDLEERPITYEDLGELKYLEACIKETLRLYPSVPILARLLQEETKIKNNTLPKGTGVIIVPSMVHRDPRYWPDPEVFNPDRFINNEVKHPYSYIPFSAGARNCIGQRFAIMEEKCILALLMRHLKVKSELRTDQMRVSGELVIRPFFGNNIRFAKRTYGDYTQIA
>UniRef90_A0A3S1DSJ7 Alpha/beta hydrolase n=2 Tax=Halomonas TaxID=2745 RepID=A0A3S1DSJ7_9GAMM
MLTKEQVVARNNVTIVGSGEKTLMLAHGFGCDQQMWRHLIPHLKERYTLVLFDYVGSGQSQISAFSESRYRALEGYAKDVTEICQALNLTQVHLIGHSVSGTIGLLASIAHPELFASQVMICPSPCFLNMPPDYYGGFECADIEELLGLMDRNYIGWANYLAPLVMGLENSELLTSELSDSFCSTDPVVAKAFAKATFFSDYRHLLPQAKHEALLLQSQQDSLASPDVGHYMHAHMPGSTLRLLASEGHCLHMTHPELVAQEINTWLRD
>UniRef90_UPI001F334FC1 bifunctional ornithine acetyltransferase/N-acetylglutamate synthase n=1 Tax=Ktedonobacter robiniae TaxID=2778365 RepID=UPI001F334FC1
MYTNFCSFSIKRLIHLCSKVACRLLVHILRDLLCERLRRCTVKVTVADAESFAQAKRVAKVVVNFPLVKTAIFCADPNWGRIAMVIGKCEAQTAIVLEKVSI
>UniRef90_UPI001EE7BB04 hypothetical protein n=2 Tax=unclassified Micromonospora TaxID=2617518 RepID=UPI001EE7BB04
MAVPVTALLAGCAPATAVAGGATGPVSARRSPEGSYAVGVRTNPNAAFPPRPLADTARRRRPLAERAA
>UniRef90_A0A5E3WRX4 Oxidored_FMN domain-containing protein n=1 Tax=Peniophora sp. CBMAI 1063 TaxID=718367 RepID=A0A5E3WRX4_9AGAM
MSTTDKVIPTLFKPTKLGNLLLNHRVVLAPLTRFRADDDSVHTELAVEYYRQRSSTPGTFLITEATVIAPQAGGYPNAPGIWNNEQVAAWKKIADVVHGNGCPIFMQLWSIGRVAVPEVLEKYGHDVVGPSAIALDANHATPRALTVDEIKEYVQLYAQAARNAIRAGFDGVEVHSANGYLLDEFIQSNSNHRTDEYGGSIENRIRFTAEVVEAIAAAVGPERTSVRLSPWSRFQAMRMPDPIPTFNALVQRLADTQPALAYLHIVEPRVNGEADATDVGEDNNDVLKKIWSPRPLVVAGGFSLETALQVSERQENVLVAMGRYFISNPDLPRRWQEGFALAPYERQYFYSRGSRGYTDYAPYVEATKIAV
>UniRef90_A0A350NT93 COX3 domain-containing protein n=1 Tax=Flavobacteriales bacterium TaxID=2021391 RepID=A0A350NT93_9FLAO
MFWTSSEFMIKNTTPAPSNRRDVFDGVEPAVRERTKKMLMYFIIFAVVMLFAGFTSAYIVSNMGQYWVNIEPTSAFWVSNVLLVLSSIGLWSAVRSMRENHKQRAVLALAFTLISGIGFTISQAEGWKTLAEMGLGWTTTDHESGLEAYRWNSIESLLESDAIYGQDYTISRGGEPLLFDASKNEFYASNDALMVRPITRDVARTSNSGASYLWILIAVHILHLTFGFIYLVINGIRVVQGTIHAKDVVQLESLSIYWHFMGALWLYLFVFLFFLH
>UniRef90_A0A1J5ICS2 Polar amino acid ABC transporter permease n=2 Tax=unclassified Syntrophobacteraceae TaxID=869804 RepID=A0A1J5ICS2_9DELT
MDLTKFFLVVAAVAGLLAVGTERLGYHWQWYRMPRYLVRIGDGGWRPGPLLDGVLITFKISGLSLILCFSFGLVAALFRLSHSYLARLLARLYVELIRNTPLLVQIFFIYFVLGPVLGITRFTSAVLALSLFEGAYAAEIFRAGILSIPRGQWEAARSLGLSTYKCYRAVILPQAVRHVLPPLTSQAISLVKDSALVSTIAIYDLTMQGQAIIAETFLTFEVWFTVAAIYLIITVILSILVNVMENRLRVTG
>UniRef90_A0A5B8ASF5 DUF4760 domain-containing protein n=1 Tax=Georgenia wutianyii TaxID=2585135 RepID=A0A5B8ASF5_9MICO
MSVEVWVTLGGVILAGLLAWHQLRASLYVRRREFEDIYVQRYWEISNRLNLDLRIGSYSGGDFAELADAEDKDAQYLAMWDYLALCEDQIDLRKSGNVTDEAWAVWSSSIAGTVSRYPYEAFYDLIEQGLDEAHVDESDRPWEHLRTLRHDPGAGLPDPYPLSGTGWRQRWRRYATGRRERVALTGLEVERLKMRRR
>UniRef90_K1JNL9 ATP synthase subunit b n=2 Tax=Sutterella TaxID=40544 RepID=K1JNL9_9BURK
MNINASLFLQMVVFFLGAWITMKYIWPPLIHAIEERQKKIADGLSAANKGEKALAIATEQGKAIEADARARATTIVSDGEKRAQSIVDEAKAQAQVEADRIIENARAEAAQEMQRAREALRNEVAALAVAGAEQILAREVDKTVHAAMLEQLKAKL
>UniRef90_A0A1J4Z6F5 Chemotaxis protein n=2 Tax=Hydrogenophilales TaxID=119069 RepID=A0A1J4Z6F5_9PROT
MTTQRSFSIFDTAWGSGILGALAVAGPLAGTLAGGPWWPLVFALMAVALAVVCARHRLRQNAWMEKIRRMAADIADGHLSSRLTHVSDARSLAPVVTAFNDAMDRIEAAFREMSGALTAQEAGYTARHAQVIGQVGDYSHVLNTFNTVLASISKHKQAEAYNHMVVRVQSLNAAHLIPDLALTQADFARIVKEEEQVIDLASGSSQKANESAVAVEAMHQGFQRLQALIGEVSAAILDLSAKSSEINQAIDTIHALANQTNLLALNAAIEAARAGEAGRGFAVVADEVRKLAGHSKDAAMQIGNTMQALVSETQSMVVSAEEMRAITEESGRAAADISSEFSQIVSRSSETLRRAKTALTVAFASLTKCDHVVYKQRAYQTIVAGDESLRQQVDVDHHNCRLGKWYAGEGREQFGQLEAFREIDRPHAAVHDAVRQMLALTHQRTWQNDTAQMERVFAELQRMEDASEQVMSVLIALPEQASASSVPG
>UniRef90_UPI0018C1FAF3 GIY-YIG nuclease family protein n=1 Tax=Actinoplanes sp. NEAU-A11 TaxID=2792083 RepID=UPI0018C1FAF3
MTSSGTRPDDVPTDRARTEEALRLLSGVPTGLDVAVKMLSRGGGVYAWWAAPSIFPDLPGPSNLSVPSLRLLYLGRATSLRGRILRNHLRRSGSSTLRRTLAGLLTCEGYRTTWTDRVVLIPEDESRLTAWMYTHLRLTWAEDPEPATIEAELVRRLHPPLNVHGVDPEHIQPAVVAAKNSYNASSRPTERPPTL
>UniRef90_A0A7C3K6X1 Ribosome maturation factor RimP n=1 Tax=Firmicutes bacterium TaxID=1879010 RepID=A0A7C3K6X1_9FIRM
MTREAIVAQVEALVEPIAQRYALEVADVELLGQGARTLLRVTVEQPAGAERVGVDELARFSEALSRQLDLRDLIPHAYTLEVTSPGLDRPLKKDRDFQRFAGREVQVTTFVPVEGRRHFTGRLVGLEAGEVRLEVAGHPVRLPRAQVASARLSIDENELKRDLSGGGRAAR
>UniRef90_A0A1E1W481 Chloride channel protein (Fragment) n=4 Tax=Pectinophora gossypiella TaxID=13191 RepID=A0A1E1W481_PECGO
GGYATVGAAAFTGAVTHTVSTIVIVIEMTGQVTHLLPIMAAVLAANAVAALLQPSCFDSIILIKKLPYLPDLLSSASRMYDICVEDFMVRDVKYIWNRMTFQQLKDLLKENKTIKSFPLVDSPTSMVLLGSIHRWELVRVIEKQVGRSRRLQVAAQWLRDAERRRQENEAKKRRPSRFEVTPAPDMLQVPGTGMTRGSSLTTKDQGGLIPSPGQLFRPKSILKKTNSFTLTRGLVSPGVPQTPLSP
>UniRef90_A4ERI7 Ubiquinone biosynthesis accessory factor UbiK n=1 Tax=Roseobacter sp. SK209-2-6 TaxID=388739 RepID=A4ERI7_9RHOB
MGTIERLAEKLAEDTLKVQDALGEDRFYMEVAQVLGAASQSLEEAFLTEIRVSLADRKAREFISKKLAQVQRELEEKAKG
>UniRef90_A0A7Y0XJK6 DZANK-type domain-containing protein n=3 Tax=Limosilactobacillus reuteri TaxID=1598 RepID=A0A7Y0XJK6_LIMRT
MKKCPYCNTLNPDDAEVCENCGKPLKGRMLALVCPNCGKVNALGSRECSVCHTKLSQSNHQLVSREITPRKNNKRWGYIALIAFGILIALFTYLGGRYARSTSIPGKIEALEFE
>UniRef90_A0A1Z8PZI4 HemY_N domain-containing protein n=1 Tax=Micavibrio sp. TMED27 TaxID=1986607 RepID=A0A1Z8PZI4_9PROT
MIKAFWFAIKVGLVVAIAIWIAERPGFVRIEWLDYVATIQMGFFLLLCVIAILISIFVYRVIAAIVNFPKTYQRYLEVRGYEKGVRALTLGMAAVAAGDEKIAVYQAHRATKLMPEDTGLTNLLTAQAARLDGREDDAVRAFARLLENKEASFLGVRGLLQAAIDKGDYETAKNLVDRALGLYPKQGWILKTAFDVYVRAEDYTEARVLLKRAAKAGTVKSETLHSDLAALYLAEALQDFEAARNERGIKLIKQALKKSKDFIPASVALIQYYIDNNDISSASKLLKKYWRREAHDLYVPQWLSIYKGASSEDKLKHMQSLLKINEKNAVACMETGKAALESSLWGEARKYFEKAESIEPTASLYRSYAQLEELSIHDEAAARTWLEKAINAPVERQWVCQETGRLYTQWKPIAQPHGAFNSMIWGRSTDLQSDNALLIHSGQSTMQGLVHAV
>UniRef90_UPI001FFBE095 hypothetical protein n=3 Tax=unclassified Bradyrhizobium TaxID=2631580 RepID=UPI001FFBE095
MEKTTMRLAQKFWLVFLALGAAIAVQGAPASAQQRLEGQVLLAGEPVVSATVTLWTAGADQPRQVTQTQTGADGRFALSTPPGAGNAPTYLVAKGGTAGGAANTGVNNAIALMVLLGDPLPRAVTVNELTTVASAFAAAQFIKGEAISGNPLGMRIAAGNVPNLVDPATGQWGKVLLDPLNSTRTTTLANLNTLGSLITAFATTTNEDWRARFLKAATVPGGATPKNVIEAMTGIARKPWAQPKELYALFDEAYPQPKDGARRKAPFVPYLAYVPDDFVLSLCFAGGGVYSAGRLMFDAESNLWSGQNWMAGSQSGVNQSIGGGVVKLSPNGTALSPPITGFTGMGIDGVGWGTAVTKDKVWLTSFNGKILVLDFDGHPIGTESDFPFKEKFLGLMGIGVAANGDVWIADGSDNQLLHFPGGRVTDGRIVKVGGLKSPFDIVIDAQNRVWVSNSQSDKVVRFPADDPSKAESFRAGIGVRALALDSKSNVWVASNMSLDFPPPVIPDGASIMEQFKIAAGHMLKVLETNPHMVTGVVNMIRPDGSQPAPTGFTGDKAVSVPWGLNIDGNDDVWIGNFWGRGVVLMAGDNTKGHPAGTKMGDAIHVFKGGSIQMLTDVSIDPAGNVWAANNWNDLNGAASPDPTRPTSTWGGGSGITVIYGVAAPVQPPRMGMVRKP
>UniRef90_UPI0019539C4C hypothetical protein n=1 Tax=Serratia marcescens TaxID=615 RepID=UPI0019539C4C
DVGGRKFEMSDMAYVIRGLGYIKSKEDVENISLGQYNGIPVRVKDLGNVQMGGDLRLGIFDQNGNGEVVGGIV
>UniRef90_I3SW78 F-box/LRR protein n=7 Tax=Trifolieae TaxID=163742 RepID=I3SW78_MEDTR
MSSNSTSEDVISALCINEALTDDELRSILAKVDSEKDKETFGLVCKRWLRLQSTERKKLSARAGPHMLRKMADRFTRLVELDLAQSISRSFYPGVTDSDLAVIANGFRCLRILNLHNCKGITDVGMKAIGDGLSLLHSLDVSYCRKLTDKGLSAVAKGCCDLRILHLTGCRFVTDSILEALSKNCRNLEELVLQGCTSITDNGLMSLASGCQRIKFLDINKCSTVSDVGVSSICNACSSSLKTLKLLDCYRIGDKSILSLAKFCDNLETLIIGGCRDVSNDAIKLLATACRNKLKNLRMDWCLNVSDSSLSCILSQCRNLEALDIGCCEEVTDTAFHHISNEEPGLSLKILKVSNCPKITVVGIGILLGKCSYLEYLDVRSCPHITKAGLDEAGLHLPDFCKVNFNGSINEPAVLL
>UniRef90_UPI001F28D147 RimK-like ATPgrasp N-terminal domain-containing protein n=1 Tax=Thiomicrorhabdus immobilis TaxID=2791037 RepID=UPI001F28D147
MSHFYVVVDSLTDWKPYYSSQDVITFDDYLERVNDRSKKRIRVINLCRDYRYLKTGYYCSLLAEARGHHVLPSLMTINDLGRKSLSSIQLTDTSQLVNRLPLGNEGEQLTFRCWFGKTLNPALAKLAAKLFEKFPTPLLEITLQFKQHWQVKQVKGVSLKALVDPAEQEAFAETFEKFSLQMWRKSKTRKAYRYDLAILVNPDDPLPPSDDAALKQFKKAANQLGIATEFITRKDYMRLAEFDGLFIRETTSVEDHTYQFAKKAEAEGLMVIDDALSILRCTNKIYLADLLNTHKIPTPKTVIINQPSEQALLKLENEIGFPMVLKIPDGSFSRGVVKVENAEELTEQAKILLKQSVMLLAQEYMYTQYDWRIGILNNKPLFACRYYMVDDHWQIYKHESQDTQSGGFETLPTFEAPKAVIDIALKAAKLIGNGFYGVDIKQSGDRVVIIEVNDNPSIDSGVEDKYLGEELYHEIMKDFLLRMESLGR
>UniRef90_A5W1W3 Antibiotic biosynthesis monooxygenase n=32 Tax=Proteobacteria TaxID=1224 RepID=A5W1W3_PSEP1
MVKVALFVRLKAKPGKEKDVESFLLGGLPLVEEEPATTAWFGIRLGPSTFGIFDAFPDEAGRQAHLSGKVAAALMANAAELFAEPPSIEKVDVLAAKLPS
>UniRef90_A0A167MC44 Ribosomal RNA-processing protein 43 n=4 Tax=Cordycipitaceae TaxID=474943 RepID=A0A167MC44_CORFA
MPEVGLSRATFAKLSPHPYLLANLEPSNQDIPPARSNGRAPDEARTPEVNLSSLSHAHGSSLVRIGDTTAICGVRGETILTANIPNYRASNAASELRDYDLLVPNIELATGSSPQNLPGGPPSTLAQTLSTRVYSLLHSSQLLDAADFRIWHTQTADLTAADDEEMQDADADADGEDQAQFNNERQVIAYWVLYIDIFFISLDGNQFDAAWAATLAALRDTKLPRARYDPDSELIVCSRKDPKPLSLNGFPIACTAAVFTGKETDRPTEGKYWVLVDPDTLEESLCDESLTVVADCSGGTTSLLSVSKHGGTVLTPKHLRSKQLLGFVEKRWKGFADAMSV
>UniRef90_A0A1V6I1U0 TonB-dependent Receptor Plug Domain protein n=1 Tax=Bacteroidetes bacterium ADurb.Bin035 TaxID=1852799 RepID=A0A1V6I1U0_9BACT
MKKQKILLIIMLIFNISLSSQITINGKVIDRDSQKPLSFANIKIAGTFLGTVSGNDGSFSLQVKSLPVTLIISFIGYQTDTIVVNENQFLTIYLAPKSILTDEITVTAIRLDDNSPKNFTNLSIEKIQSLKTGQDLPLILNFTPSVVATSDAGNGVGYSDIRIRGTDITRINVTINGVPYNDPESQGVFWVDIPDIASSADNIQIQRGVGTSSFGTASFGASINILTGVMKNDPFVELQTNGGSFNTWGASAKFATGLIKDNWYLEGRLSHQYSDGYIDRAWSNLNSTYLSGGYYGKNTIVKGLFMAGIEKTYQAWGGVPKEYLDDPILRRYNPYTYENETDNYWQYHYHLNVTQKINDKNTLNATLFYIDGLGYYEQYKDNKKLSNYNIPPVILIDTTSNDTIMINSMDIIQRKYLENDFYGAIMSHIFDNNKNLKIRTGLNLYQYDGWHYGKIIWMQYAHNTPINYEWYRNKSIKKEFSLFTKIDYAINEYFNLFTDLQYRYIDFAIKGTDDAFISDTLTKYYNFFNPKLGLVYKISKKDELYLLLGMSHREPNRDNLMLINEDSLKPVPETLYDLELGYSRYFSKGIVNINTFYMYYDNQLVLTGKINDVGDPIMQNVPTSYRAGVELIWNFNFTKWLSWDANCTFSENKIKKMKIYIDDYDLWPQQRIYQVENRPISFSPSIVASSILTFKPISNLSVSIQSKYVSKQYIDNTGDEECVIDPFFVNNIRLDYCIKGKKFDKINLFVNFNNIFNEYYETNAWVYRYYEAGNEYKDFGYFPQATFNVLAGLNFYW
>UniRef90_UPI0019146668 MarR family transcriptional regulator n=1 Tax=unclassified Pseudomonas TaxID=196821 RepID=UPI0019146668
MNPELQLAAPYLPALASYIETVLGDSPTFSGWDQTSRLPYYLNSSYFILQMTLLGQTCIVLLENQQRSVSLPDVKKHMDALRQLTESPLVFVTETLASYERKRLIERGVQFIVPGNQLFIPELGLDLREYFRARQEKTEFMSPATQAMVIHLLMNDWKHSLQLSQATLGQPFKYSKMTISRAVKELKGLGLITVEADKQQHIEIHVPARQLWQNARKHMRSPVKRTLWLNRVPLLDGQPLLLAGESALARQTLLVEPWLAIYACSSETLNALQNAAEPITEVAPEEAACALQIWSYDPTVYAWAVPYVDPFSLILSLQDSKDERIQIGLSQLEGDMKW
>UniRef90_A0A7C6YG77 Uncharacterized protein n=1 Tax=Actinomycetales bacterium TaxID=1911520 RepID=A0A7C6YG77_9ACTO
MNEYVEYPASAEAACRSTYKPASRLPGPGHEERLALSSPAVSSGA
>UniRef90_A0A8J7E1C9 Glutamine-dependent NAD(+) synthetase n=1 Tax=Nodosilinea sp. LEGE 07088 TaxID=2777968 RepID=A0A8J7E1C9_9CYAN
MKFAIAQLNPTIGDLAHNAQQVLNAARQADQLGAQILVTTELVLCGYPPRDLLLRPSFIQAMAQTLEDLALALPPHLAVLVGYAAANPKARYSGEKPLFNSTALLQGGQVQQVFHKQLLPTYDVFDEDRYFAPGQGPSSFTLPCGDWGIRVGVTICEDLWNDEEFWGGRSYARNPIADLAGDGVDLVINLSASPYSLHKAQLRSAMLAHSAARFRCPILYANQVGANDDLIFDGASLAFDRQGELVARLPAFQAGLAVVDYDPVKGDLTPGEVAPLPTDDNEALWSALVLGVRDYTHKCGFAQAVIGLSGGIDSALVAAIAAAALGPDNVLGVLMPSPYSSAHSVSDALALAQALGIAHQTLAIGPLMADYDQVLDPLFADTSPGIAEENIQSRIRGNLLMAISNKFGHLLLSTGNKSEMAVGYCTLYGDMNGGLAVIADVPKTRVYALCQWLNQQVGQGSNGAIAPVTLGTLATRVSAQGLIPQNILDKPPSAELKPGQVDQDSLPPYDVLDDILDRLVQRHESIADMVAAGHDAAVVEKVLRLVSRAEFKRRQAPPVLKVTDRAFGMGWRMPIANRWRSEAAVHPLTAEQLLEA
>UniRef90_L2GXC0 SWIM-type domain-containing protein n=1 Tax=Vavraia culicis (isolate floridensis) TaxID=948595 RepID=L2GXC0_VAVCU
MHFHTLEMLVMVVIFVHADLLKLKSVCKCAEEGSYQCQNVNNPNVKGNGGTTRKACITDDLYAGIFADVVGKDGLTDSHPRTDNAAHSQIMGCSSAPCPCDELLSDEMVEDASNLMRKSYQQNVEHSSCRIAARGDSPNNEEKLNVSDQPVCTRIGVEKECDQDNEENNDENAYWFGSYISSAIQNGCRTVSSIVEEVFSMFQGCGLWIDPSDERNEEFIDEAIDNMSESGNGTDNELKKAGKLLARTCKCFIREFFWCTIGLCDKISGVIGKRKVKYRDANIGSDKNKDKYSNLERTCTCEAYIKRAACRHGSGLKGKKGKAVEHVSDSIYCEFMRAFEQEKHGLTMQELIERVASRGEHRGTQIVDSKKCFNGCDEVQDVTKRSNFYETVELAIKMVSLMGVLLFMVALVATVLHHWTK
>UniRef90_A0A3D1CV37 Single-stranded DNA-binding protein n=1 Tax=Candidatus Pacebacteria bacterium TaxID=2053589 RepID=A0A3D1CV37_9BACT
MSVRSLNKVMLIGNLTRDPNLRFTPTGTAVCSFGIATNRAWTPSDGGEKQERVDFHNIVSWAKLAEICGQLLHKGDKVYLEGRIQTRDWKTEEGVEKRITEIIIDNMMLLSNGRGGAMGGNDQDGAGEDLGQTAPTPVSATTTRAKTKPAAKTDNEVEVVEDVSDDIPF
>UniRef90_W0ZCU4 Geranylgeranyl pyrophosphate synthase n=2 Tax=Microbacterium TaxID=33882 RepID=W0ZCU4_9MICO
MQGSPDAIQAVSQRLERFVSARVDEAADAGPLARPILELSAATLQGGKRLRAAFCYWGWRSVTDATGTDEIVAAAAALEVFHAAALVHDDIIDNSDTRRGHPATHRAFEGAHLAGGWTGDAAAYGRSSAILAGDLLVAWSDDLFEEGIADAPADRARAARRRYAEMRRDVTVGQYLDIAAETVPAPDAEQLGRALHVASFKSARYSVQQPLLIGAAIGGGSTEQQEALRDFGHPIGMAFQLRDDVLGVFGDSAATGKPSGDDLREGKRTALIAFARQELPASVRRTLDELLGDPDLEDTQVRMLQDTIRDSGALDRVEDLIASYTREADRALSGAPLDNASVGALRDLARAAVHRVA
>UniRef90_A0A1I9RWB5 Major capsid protein (Fragment) n=1 Tax=Feline calicivirus TaxID=11978 RepID=A0A1I9RWB5_9CALI
WSTPRFRPITINISVSNGAKLGXGVATDYIVPGIPDGWPDTTIAEKLTPAGDYSITTXSGNDITTAAEYDKADVVKNTTNFRGMYICGSLQRAWGDKKISNTAFITTGTVDNNNIKPSNTIDQXKIAVFQDTHAXXSVQT
>UniRef90_A0A7S1QBK8 Pentapeptide repeat-containing protein n=1 Tax=Neobodo designis TaxID=312471 RepID=A0A7S1QBK8_NEODS
APEHAVALDTVRTALSAPSHTALIEDALEGRPLRGVDLSALPKDVQCSVRRVDLRDASVVGCSFFAGANFDLADCRRTDFTGSQFRDISFAGATLRGAKLQRCTFKHCVFRRCDIRDADLCGATFVGCDFTLCDMSGCTTSGDTTFFEPQSWWRSRREEWRGTKPFVNLDAEEATQQMAARDDSRSRPRGGRPRNTPRRGKTWTKKISTKR
>UniRef90_UPI001F4247D0 hypothetical protein n=1 Tax=Xanthomonas citri TaxID=346 RepID=UPI001F4247D0
MFGEGAEIRFAYQSFKWANLAAKNAGVSVAIIGLTRRNGGTKQIFIANEDGVVTVRTVSNISPYLVPGDNVLVSPRSKVPDERAPMQFGNHPYYANELMLSLDEASGMVGEDARVAEFIRPLYGSRESISGTPRTCLWITDENLALAQEIPAVWARVEKVRKDRKTKTKDVQAKKLVETPWRFRDQYEAESSLLVVPIVSSENRPYLPVVLLSKEAIVHNKAFALYDAPLWNFALIVSKMHLVWVAAVCVRLEMRYSYSNTLGWNTFPVPTLTEQNKADLTRCAEDILLARESHYPATIADLYGPDNMPDDLLRAHERNDEVLERIYIGRRFRNDTERLEKLFDLYTKMTAGQGKPKKKAKK
>UniRef90_A0A3C0QT04 Magnesium chelatase n=1 Tax=Ruminococcus sp. TaxID=41978 RepID=A0A3C0QT04_9FIRM
MIQTFAEKLHNSMAKAIVGKDDVIDRVIAALLCRGHILLDDIPGTGKTTLAKALASSIGCHHSRIQFTPDLLPSDVTGIHWFNQKTQEFTFRKGAVFTNILLADEINRTTPRTQSALLECMQERQVTLDGETMSLAEPFFVIATQNPIETQGTYPLPEAQLDRFFICLHLGYPEKEAERLILTGASQTISEPVCTVEELIQAQNAVENVLVSEPILEYLLAIAEKTRKDRTTIIGLSTRGLQALQLCSKAWAGMQGRNYVIPEDVQAVAPEIIAHRLIMKGGERLQRMEFRHESALRMVEEVSVPVE
>UniRef90_UPI000A359F7A tubulin polyglutamylase TTLL5 isoform X13 n=1 Tax=Heterocephalus glaber TaxID=10181 RepID=UPI000A359F7A
MPVVMARDLEETESSSEDEEVVSQEDHPCIMWTGGCRRIPVLVFHAEAILTKDNNIRVIGERYHLSYKIVRTDSRLVRNILTAHGFHEVHPSSTDYNLMWTGSHLKPFLLRTLSEAQKVNHFPRSYELTRKDRLYKNIVRMQHTHGFKAFHILPQTFLLPAEYAEFCNSYSKDRGPWIVKPVASSRGRGVYLINSPNQISLEENILVSRYINNPLLIDDFKFDVRLYVLVTSYDPLVIYLYEEGLARFATVRYDQGAKNIRNQFMHLTNYSVNKKSGDYVSCDDPEVEDYGNKWSMSAMLRYLKQEGRDTTALMAHVEDLIIKTIISAELAIATACKTFVPYRSSCFELYGFDVLIDSTLKPWLLEVNLSPSLACDAPLDLKIKASMISDMFTVVGFVCQDPAQRAATRPIYPTFESSRRKPIQKPQRSRPLSASDAEMKNLVGPPREKMSEKLGGSVLGLSMEEIKVLRRVKEENDRRGGFIRIFPTSETWEIYGSYLEHRTSMNYMLATRLFQDRGNTRRSLLTGRTRETRGLVKFQDYCHIRLKMTTDGMPELKVESVNSKAKLHAALYERKLLSLEVRKHRRRSGRLRALKPKYPVITQPAEMNGKTEAESEEEEEEVALDNEDEEQEASQEESAESLAENQGKFAPPLTIGIENLPKENSMEVPVWNNKGEQGCKIETQEPEPNFNLMQILQDNGNLSKVQARIAFSAYLQHVQTRLMKASGGQTFSASWAAKEDEQMELVVRFLKRASSNLQHSLRMVLPSRRLALLERRRILAHQLGDFIVVYNKETEQMAEKKSKKKFEEEEEDGVNAENFQKFIRQASEAELEEVLTFYTQKNKSAGVFLGTHSKSSKHSQTLSDNGAKGDHPEMIEEVKIKQPKHQQATEILSDKLSPSLCHPNKHHSGVAKAQKEGEDGSLYSKRYNQSMVTAELQRLAEKQAARQYSPASHITLLTQQAANLNMASGAINRSSASTPPSLRPVISPSGPAWSIQCDPHAPESHSSPPGSRRLQAGGFAWEGEIENNAYSKATGVVPQHKYLPTAGSYQLHFALQHLEQQKLQSRQLLDQGRARHQAIFGSQILPNSNLWTMNNATGCRISGATASGQKPTTLPQKVVPPPSSSTSLVPKPPTNHKQVLKKATSQRASKGSCEEGQLSELQSSLNTTAFVPLPSSTDHLSSFQKGMRQETRTPNPWLDHLPKGTRELKTTRVL
>UniRef90_UPI0016748451 MarR family transcriptional regulator n=1 Tax=Streptomyces xantholiticus TaxID=68285 RepID=UPI0016748451
MPDLSHGATDADVAAVNSLRSAVMRLGRRLKHQRVDETLSPTEMSVLGTLATCGSATPGELARKEHVQPPSMTRIVALLEAKGLVRLEPHPADRRQKVVTQTEQAETMLEESRRKRNAWLATLAEGLDDEEWAKLRAAAPVLEKLAHLQ
>UniRef90_UPI0003C1277F tubulin polyglutamylase complex subunit 2 n=1 Tax=Latimeria chalumnae TaxID=7897 RepID=UPI0003C1277F
MDDNENSSISGFLDRLTLGVTKILETRPGVTEVKFFEKEPVERHVIISWEQRNCCTLPEDLKNFYLMTDGFHITWNVKFDDVPMQLGSMVINSILKLCRLKGSSVYALPHAPTLAILESDSDEEANESQPEKPHFDSRSRLFELDSCGGHGKVCLVYRNAKP
>UniRef90_A0A6J1YNG1 Voltage-dependent P/Q-type calcium channel subunit alpha n=1 Tax=Acinonyx jubatus TaxID=32536 RepID=A0A6J1YNG1_ACIJB
MWKASRVPDPMFSPRSYDALHDGGRGPPAADGTAGAPQDARGPRMSGPCPGPPLKRRGGVVDHRDVILAHQAHKIHSTPQARRKEWEMARFGDEMPARYGGGGSGAAAGVVVGAGGGRGAGGSRQGGQPGAQRMYKQSMAQRARTMALYNPIPVRQNCLTVNRSLFLFSEDNVVRKYAKKITEWPPFEYMILATIIANCIVLALEQHLPDDDKTPMSERLDDTEPYFIGIFCFEAGIKIIALGFAFHKGSYLRNGWNVMDFVVVLTGILATVGTEFDLRTLRAVRVLRPLKLVSGIPSLQVVLKSIMKAMIPLLQIGLLLFFAILIFAIIGLEFYMGKFHTTCFEEGTDDIQGESPAPCGTEEPARTCPNGTKCQPYWEGPNNGITQFDNILFAVLTVFQCITMEGWTDLLYNSNDASGNTWNWLYFIPLIIIGSFFMLNLVLGVLSGEFAKERERVENRRAFLKLRRQQQIERELNGYMEWISKAEEVILAEDETDGEQRHPFDVGALRRATIKKSKTDLLNPEEAEDQLADIASVGSPFARASIKSAKLENSTFFHKKERRMRFYIRRMVKTQAFYWTVLSLVALNTLCVAIVHYNQPEWLSDFLYYAEFIFLGLFMSEMFIKMYGLGTRPYFHSSFNCFDCGVIIGSIFEVIWAVIKPGTSFGISVLRALRLLRIFKVTKYWASLRNLVVSLLNSMKSIISLLFLLFLFIVVFALLGMQLFGGQFNFDEGTPPTNFDTFPAAIMTVFQILTGEDWNEVMYDGIKSQGGVQGGMVFSIYFIVLTLFGNYTLLNVFLAIAVDNLANAQELTKDEQEEEEAANQKLALQKAKEVAEVSPLSAANMSIAVKEQQKNQKPTKSVWEQRTSEMRKQNLLASREALYNEMDPDERWKASYARHLRPDMKTHLDRPLVVDPQENRNNNTNKSRAAEPTVDQRLGQQRAEDFLRKQARYHDRARDPSGSMGLDPRRPWAGSQEAELSREGPYGRESDHHAREGGLEQPGFWEGEAERGKAGDPHRRHAHRQGGSRESRSGSPRTGADGEPRRHRAHRRPGEEGAEDKAERRSRHREGSRPARGGEGGEGDGPEGGERRRRHRHGPPASYEADAARREDRERRHRRRKENQGSGVPVSGPNLSTTRPIQQDLGRQDPPLAEDIDNMRNNKLATAGSAGAHDSLGRPGLPQSPSRTGNSTDPGPAPAPPAVAANPQNAAGRRAPNNPGDPSDPGPPKTPENSLIVTNPSSTQTNSAKTARKPDHTTVDIPPACPPPLNHTVVQVNKNANPDPLPKKEEEKKEEEEDDPGEDGPKPMPPYSSMFILSTTNPLRRLCHYILNLRYFEMCILMVIAMSSIALAAEDPVQPNAPRNNVLRYFDYVFTGVFTFEMVIKMIDLGLVLHQGAYFRDLWNILDFIVVSGALVAFAFTGNSKGKDINTIKSLRVLRVLRPLKTIKRLPKLKAVFDCVVNSLKNVFNILIVYMLFMFIFAVVAVQLFKGKFFHCTDESKEFEKDCRGKYLLYEKNEVKARDRQWKKYEFHYDNVLWALLTLFTVSTGEGWPQVLKHSVDATFENQGPSPGYRMEMSIFYVVYFVVFPFFFVNIFVALIIITFQEQGDKMMEEYSLEKNERACIDFAISAKPLTRHMPQNKQSFQYRMWQFVVSPPFEYTIMAMIALNTIVLMMKFYGASVAYENALRVFNIVFTSLFSLECLLKVMAFGILNYFRDAWNIFDFVTVLGSITDILVTEFGNPNNFINLSFLRLFRAARLIKLLRQGYTIRILLWTFVQSFKALPYVCLLIAMLFFIYAIIGMQVFGNIGIDVEDEDSDEDEFQITEHNNFRTFFQALMLLFRSATGEAWHNIMLSCLSGKPCDKNSGILTPECGNEFAYFYFVSFIFLCSFLMLNLFVAVIMDNFEYLTRDSSILGPHHLDEYVRVWAEYDPAACGRIHYKDMYSLLRVISPPLGLGKKCPHRVACKRLLRMDLPVADDNTVHFNSTLMALIRTALDIKIAKGGADKQQMDAELRKEMMAIWPNLSQKTLDLLVTPHKSTDLTVGKIYAAMMIMEYYRQSKAKKLQALREEQNRTPLMFQRMEPPSPTQEGGPGQNALPSSQLDPGGGLLAHESSMKESPSWVTQRAQEMFQKTGTWSPERGPPTDMPNSQPNSQSVEMREMGRDGYSDSEHYVPMEGQARAASMPRLPAENQRRRGRPRGNNLSTISDTSPMKRSASVLGPKARRLDDYSLERVPPEDTQHHHQRRRDRGHRASERSLGRYTDVDTGLGTDLSMTTQSGDLPSKERDQERGRPKDRKHRQHHHHHHHHHPPPSDKERYAQERPDHGRARARDQRWSRSPSEGREHMAHRQGSSSVSGSPAPSTSGTSTPRRGRRQLPQTPSTPRPHVSYSPVIRKAGGSGPPQQQQQQQPAARPGRAAPSGPRRYPGPAAEPLAGERPPAGGHGSSRSPAMERRGPGPARSESPRACRHGGARWPASEGPPGPRHHGYYRGSDYDEADGPGGGGGEEPRAAAYDAPPPARRACSPRTPRAPGPAACASPSRHGRRLPNGYYLAHGPARPRGPGPRRGLHEAYSETDDDDWC
>UniRef90_A0A7W4JVT6 Chromosome segregation protein SMC n=1 Tax=Gluconacetobacter azotocaptans TaxID=142834 RepID=A0A7W4JVT6_9PROT
AAEAAERARAAARRALDRVEAHIALGRLERERHDEATRLDRLEHAEAEVARAGLRLAACTMDDARMAAIRQAERAVQTARAASRAQATVLNVVLEDGAEGRLVLDGRVLQTGSVDLTDSATLRIDGVGTIRIEPASGDRARLRAELTAAEDALRRMLNQAGCADPDAAETALAQRRQADLALNAARSVLSHLLPGTQDVAAAMAEARRRVAALDERIARQAASLAHGPNPADAAGGEPGVDVAATHDAALRAMQAADARAADARQALFAPDETLRQAAADLAGVRAEEQSAREAAARLVRDMAAARTAEADDVLSARQETARAALAQAGQAVQRAEAARPEGTEALADAAIRRQERLIQDGQARLGTLRQDMAALEARIRAAEGDGLDERIAGQERLRESCAAECAVCTREVKILHCLRDTLTAAERAATERYLAPLCRAIQPALAALFPRAGVTMEADFSVSRLTRRMDEPFDTLSDGTREQIAVLVRLGLADLLRARGRPAMLVLDDALTYSDAGRLERLFDILTDAADRMQILVLTCRAELFTGLGARPLTVEAVDKVQ
>UniRef90_A0A327SST6 Ferredoxin-NADP reductase n=2 Tax=unclassified Kitasatospora TaxID=2633591 RepID=A0A327SST6_9ACTN
MDLETPPPDLYGRPRADRFFARLTAFGDRYSPALGRPGLRRSPRRPEARPVPPLHLVVVSHRVVAEDVAELRLADPSGGMLPPWQPGARIVLTLPSGRARHYSLCGDPADRHAYRIAVRRIADGGGGSVEVHDDLHVGVRLRVRRPRNGFAFCGEEKVLFLAGGIGVTPLLPMARAARQAGLDWRLVHTGRTAAALPFTDELRALDPARVTVRTDDEHGLPDAAELLAHAPRGAAVYVCGPAPMLLAVQRALPGSPAAALHFERFGAAPIRDGHPFGIRIDGRTLTVPADRSALDVAREVRPDLPYSCRQGFCGTCVLKATGGTPEHRDRRLTAEQRAAGLILPCVTRAAAGETLVLEV
>UniRef90_UPI0002D87B73 type II secretion system minor pseudopilin GspI n=3 Tax=unclassified Sphingomonas TaxID=196159 RepID=UPI0002D87B73
MPDRMRPDERGFTLIEMMVALAVFSLAALALIRLEGATIRGATTLDTTLMAQIVARNVAYTAMTDGRAPTIGAASGIEQNGGRSWAWTRVVQPTGDARILRIDVTVLDPGGRRAGHLTVVRDGATRP
>UniRef90_UPI000FEB7CF9 aspartate-semialdehyde dehydrogenase n=1 Tax=Streptomyces cavernae TaxID=2259034 RepID=UPI000FEB7CF9
MAQARSGRPTLAVVGATGAVGTVMLQILSQHADIWGEIRLIASPRSVGRKLTVRGEEVEVVALAEAAFDGIDVAMFDVPDEVALKWAPVAAGRGAVVIDNSGAFRMDPDVPLVVPEVNPHRARVRPRGIVASPNCTTLSMIVALGALHAEFGLRELVVTAFQAVSGAGHAGVIALRRQLSLVAGTELGTSPGDLRRAVGDDTGPFPEPVALNVVPWAGSLHENGWSSEEMKVRDESRKILGLPHLPVAATCVRVPVVTTHSLTVHARFEGDVSVDGAREILATAPGVVLFDDPAAGEFPTPADAVGTDPTWVGRVRRALDDPTALELFVCGDNLRKGAALNTAQIAELVAEELTGR
>UniRef90_A0A7X3VZR8 Xanthine dehydrogenase family protein molybdopterin-binding subunit n=3 Tax=Dehalococcoidia bacterium TaxID=2026734 RepID=A0A7X3VZR8_9CHLR
MTTTEREETKFKVVGTRPVRHDGIEKVTGQALFGADIDLNGLLHGKVLRSPHAHARVVSIDTNRAESLPGVHAVITGDDLTPAGPMERGGGNRTDAILAQGKVLYKGHPVAAVAANSPHVAEEAITLIDVTYEPLPSVTNVEDAVAPSAPVLHEGWDDPSNGVPSSELDSPNAASLERHVRGDLEAGFAEADLVVEREFRTKTVHQGYIEPQNGTASWSPEGRLTIWCSSQGHFGIRDAVAELLDIPVSQLKVVPMEIGGGFGGKLTAYLEPLAAVLSKKSLRPVKMTMTRAEVLEASGPTAGSHVKVKIGVTNEGRITAASGKFLFEGGAFGGGPVAPACAAIFAPYNLENVRIDGYDIVTNKPSTRAYRAPGAPIVAYAVESVMDEIAEMLDIDPMEFRLLNVAREGIRRADGVMNGRIGAAEVMEAVRSHPHYVAPRDGANHGRGVAMGFCRNNTGPACVIANVQDDGRISLIEGSVDIGGSRTVIAQQLAEVLGIPVEDVNPSIGDTDSIGFTSNTGGSGAAFKSGWAAHEAARDIIAQLTERAALIWDVSPEQVRYEDGGVEHVSDTELRMSFREIAGMLPDSGGPVVGRANLNPVGQSGSYSANIVDVEVDPDTGKVDILRYTAFQDVGFAIHPSYVEGQIQGGTAQGIGWALNEEYFMSDDGAMLNTSLLDYRMPTTLDLPMIETVLVEVNNPGHPFGVRGVGEANISPPMAALANAIHDATGLRLRELPMNPQAVSKAIQEKAG
>UniRef90_A0A6G4ZTC8 Sodium:solute symporter family protein (Fragment) n=1 Tax=Chlamydiae bacterium TaxID=2081524 RepID=A0A6G4ZTC8_9BACT
MFLDLFFAGLFLAGLYFFGIRKSEKVQTESAYLIADRKIGLFPLTATLVMTEFNTATLISFSSLGYLAGKRALSLPLVFLIGLLFYAVSVAKKWKGFDGISVASYFSKRYGRDIGIIASIALFMAMSGFSAVYVKSLLLLFSPFFPSIEPWVLSGVLVALVLVMILRGGLLSIIRTDVFSFIVILGFFPLVALFAFKTPLGTPHEMIDVSSHLPVRFVISLVVLTMFTYILAPWYGQKIFAAKSQKTAFLSVFFAAIIVFVLYGLAVMSTWFLRKNGAEVSNPEQAFPMAMMLTLPSGLKGLGYAILFAASATTLSGVWSAMCSLAVGDFLKAKNSYKRSMGLTLMFALLSFVLANVLVDKVLDKLILANIPIAALSFALLAGFYWKRTSRFGVYLSMFVGWVCGIGSYLYFGEAGGYTWYWAMWGIPAT
>UniRef90_A0A7G9G4R0 Ribosome assembly RNA-binding protein YhbY n=2 Tax=Lachnospiraceae TaxID=186803 RepID=A0A7G9G4R0_9FIRM
MNSRQRAYLKSLAMTIDPVMQIGKSSLTPEITEAVSEALEARELVKVNVLKNCLDDPRMIAEALAERTRSQVVQVIGKKIVLYRESKTKKKLELPK
>UniRef90_P59908 Photosystem II protein Y n=4 Tax=Bacteria TaxID=2 RepID=PSBY_PARMW
MLGIDARLFLVVAPILAAVSWAAFNIGRAAVGQLQLLIKRSRA
>UniRef90_A0A645HJN1 CN hydrolase domain-containing protein n=1 Tax=bioreactor metagenome TaxID=1076179 RepID=A0A645HJN1_9ZZZZ
MGDGIQFWGQSFIAGTSGEILAKASADKEENLLVNLDLAEVDATRTHWPFLRDRRIDAYGDLTRRLID
>UniRef90_A0A3A4YZV3 Sulfurtransferase TusA family protein n=5 Tax=Deltaproteobacteria TaxID=28221 RepID=A0A3A4YZV3_9DELT
MTDITPNETLDCRGLSCPMPILKTKKTIGNMKSGQILEILGTDPGTRNDLPAFAKRSGHEYLGEKQDEGFSRFYIKVK
>UniRef90_A0A4U5NX06 Peptidase S1 domain-containing protein n=1 Tax=Steinernema carpocapsae TaxID=34508 RepID=A0A4U5NX06_STECR
MGAVHLFAVFGLLALVEAKELKLVSCFFTFQNVNRAVFSSTTASKVPFCARLELTKEPFKGQFRHIACSTLTSQFIFTSAHCVTFTANGAVFVGITDMATAFNDPNKQFVDFTPTDVIIHPEFSHKKGNGIALVKVRSL
>UniRef90_UPI0020216C25 phage major capsid protein, P2 family n=1 Tax=Halomonas sp. ATCHA TaxID=2945104 RepID=UPI0020216C25
MRKDTRIAYNRLLDRIAQLSGVPSAKEQFAIEPSVQQTLESKIQESSEFLSSVNIIGVDELKGQKLGLGVTGPIASRTDTTQKDRTTSDVSSLESHDYECVATEFDTHITWAKLDAWAKFPDFQTRVRNAIVRQQALDRIMVGLNGTTAAAETDRVANPLLQDVNIGWLQQYRTHAPARVLSEGANAGEVRVGPSGDYENLDALVYDVVNEMLDPWFRESTDIRAICGRKILADKYFPLINQEQAPTEQRALDMILSQKRMGGQQAARVPFMPDGTLLITPPENLSLYWQNGSRRRYLEDNPKRNRIENYESSNDAYVIEDYGFGCLVENIVFGDWSV
>UniRef90_A0A3M1UPZ1 Chain-length determining protein n=1 Tax=Gammaproteobacteria bacterium TaxID=1913989 RepID=A0A3M1UPZ1_9GAMM
MHELYEQLLTQLRGIWRFRWVIPTVAWVLFVAAAVVILRLPDEYRATATVYVDTHSILRPLLRGLAVTGNAEQRVRIMTKTLLTRPNLEKLMRMTDLDVKAATPAEREDLLDSLAARIRVESSRRGENLYKLSFEDPDRKLARKVVQALVSIFVEGLLGQSREDTDTAQKFLDRQLAAYAQRLNEAEKALADFKRKHVGMMPGEGKDYYASLKEEEEKLETARLQLRELENRRRVQRRQLAHLDEEESLFDLDPAEGGSLATPYDARIEALHQRLDELLLRFTDRHPDVIETRRLLAELEAKRKAFLAQARQEHKATGGSDPVRAQLQVLLSETESQIAALRTRVKAYEARVEKLRKMVDTIPKVEAQLKQLTRDYEVYKQQYEALLARRQQADISEKAEVSADDVKFRVVDPPHVPLTPSGPPRLLYLGLAVLGSLAAGVGLALLLHLLRPTFQDVRQLRDTLHLPVFGSVSIAVTDEIRRKRRMEMLSFGTIVLLLFGFYGMALFAELFQLGIIRQLHLHP
>UniRef90_A0A1T4V4Z1 Arabinogalactan endo-beta-1,4-galactanase n=2 Tax=Eubacterium TaxID=1730 RepID=A0A1T4V4Z1_9FIRM
MKKRSLQKVISTILCTAMVASLTSCSIGKGGKSEKPKETGIFADIVNPELSDKHKGDAVESSVLVNKVEGLSEGFIKGMDISSLIAEEQSGVKYHDKDGNEADLLKILKDSGYNYVRVRVWNDPYDANGNGYGGGNNDIDKCVEIGKRATENGIKTLVDFHYSDFWADPNKQSAPKAWANMGIEEKEKAIYEYTKESLNKLKTAGVDVGMVQLGNETNAWLCGEINWINITTLMNSAAKAIREVDKNIIIAVHFADPSSQERYKNYLQILQNFEVDYDVFGTSYYPYWHGSLENLTEILKFAAETYNKKVMVMETSWAYTPDDLDGHGNTIGAGANVVKNYSYTLQGQVEVINDVVQAVVNVGDAGIGVCYWEGGWIPVPEGDAPRSEKWEKYGSGWASSYSAEYDPDDAGKWYGGCAWDNQAMFDENGNILESLYTFDYCYTGTKCDVAIDEVANTECTIRIGDEIKLPETVTAIYNDRHTEEISVKWEEISESAKYSMQESGAQKYVIKGVASVSGTDYDVTCDVNMIEPNYVENQSFEDDSEEGMKVWTIEDRAKDDAEHELFNMDKITDAYTGTHALHWYSKTKCDFTVTQKITGLKPGKYKASCQVQGGDTTNGAFKLTVESNGKTYEEPTEVTEWAVFRQPTIENIVVGKDGTATISFTVYAEANGTKGPWGTVDDFLFNPVEKNK
>UniRef90_A0A1H3EFD9 Cyclic nucleotide-binding domain-containing protein n=1 Tax=Ruminococcaceae bacterium YAD3003 TaxID=1520816 RepID=A0A1H3EFD9_9FIRM
MYVICYGKSPKALEAGGKLIKDIGGRYITGTELLTGSFVIAEGETKCAIVMILPLEAAIRAMGETVTDKTRDLPVIAVSPEGHYAAIIKRGNSVYEQGTDEVYAAVLKSMGPFCFSEFESKSEITSDLTKLISKYNMAVNSEAVLDKVNAAINSGEKINVYTDLPIVFADPVIDPMTYSLHSYPYDLRDEFIKQYKATKNDKNVPSVFITCTYLGDEEDDTNLILVPKLLSLGIEIKVKTDPGYCRPAIRQSLINHLLNPMSVAKVAATYSARESEMVTGIAEELGAEVISYDAEQIANANAPMSMTFNPEKKNDTATALAFLASSEGSIVIRRATSAKGLVFSAAMNRDNIILPE
>UniRef90_A0A3B0X686 Sel1 repeat family protein n=1 Tax=hydrothermal vent metagenome TaxID=652676 RepID=A0A3B0X686_9ZZZZ
MNHFSPLALILLLACALSSTSLAASKNKKPGPPDDFEKGLIAYQKKDYATSLMLWFPLADAGNPQAQYRLGKMYLDQKDQRKDPAEAANWIKKAAIQKHAAAQSLLGQMYLKGVGVKRSFSKSAKWLLKAARKKDREAQYILAKLYYYGDGVDKSAPKAAYWYKKAAKQNHTAAQNKLALMYLTGEGIKKKHKKAKQWFEKAALAGSTHAQINLAKLYLNNEVVKKDSHKAFKWYQKAAITGNAEAQNQLGEMLENGVGTQKNIKQAINWYKKSAAHNYPQAHYNLGRAYVNGYGITKNFKKGIAHFHQAAEKGNGKAQKDLGVAYYTGKGITPDSAIAYAWFYVAAANNVADARKTTNALYKKLTAEDKKKAIALATEYKRKYFIRPE
>UniRef90_A0A4Y2D9G6 Uncharacterized protein n=1 Tax=Araneus ventricosus TaxID=182803 RepID=A0A4Y2D9G6_ARAVE
MVSFDDVWRAIACPWLSPHHCPSGIDLDVKSRLIRKEYVSPLLWCPTATFTGHSRALTCAGDKGTQTTGRRANIPPSCSLHDIVWRDMVLPASTESCDVSCRAVSVLRRLAH
>UniRef90_A0A2K9NRQ2 Peptide ABC transporter ATP-binding protein n=1 Tax=Bacteriovorax stolpii TaxID=960 RepID=A0A2K9NRQ2_BACTC
MLLEVSKLNIHFKSDRSPEPIHAVRDLSFTLKQGEMLGVVGESGSGKSITNMALMGLLPDTAIVRAEKANFNGHNLLNLKEKEWQKVRGQEIAMIFQDPMTALNPFLSVQFQMVETIQGHLKLSKKDAIDKSIELLNLVGIPSPKDRLKSYPFELSGGMAQRVMIAMAISTNPKLLIADEPTTALDVTIQKQILNLIKMLQEKNNMSVILVTHDLGVVSEYSERLQVMYAGEIVETGATADLVRHPRHPYTHALLASRPGAVVDDKKRIPKTPLPSISGIVPAFHQRPLGCQFNPRCQYMTHECQQGHIAIVGEGPQNDNFREYRCIHPIEEAIR
>UniRef90_A0A521V9W9 T9SS type A sorting domain-containing protein n=1 Tax=Saprospiraceae bacterium TaxID=2202734 RepID=A0A521V9W9_9BACT
MQPITHCMKKHLTLALLSLASILAAQPDSLTQEYIHGNNIGALLNSNGSLFWDGGNGHFIAGEDGRSLVRAAGLWIAGVGKAGNLKGAIQMYNEDGRSDFVPGLLGDTVNAENWNHIWKVTGEDILLHIRDWETDGVLDDTIASIFGWPGRGNPFFEQYNGFPLPDINSHQLAPFYDVNLNGVYEPHFGDFPMNDTRSCGSAPVPAELSWFSFHDNTPHSESNMAPLQIEVSTEVTAYRCTDNQFANNSLLLFYKITNLAQEDIDSCYFGVFFDFQIGCPNDDYMATYPEKNIFYAYNSDGYDEDCSPYNGFHDQPPVVAVTLLRGPRNEFLEELPLSVIMPIHEGSTIPGQAPPEQPAEYYNYLTGRGKDGIPLTNGGTGYNPGSTDYTNIIFPGRPGMDTTGWTELNAGTLPGRRRVLASYGPFTLQPNAVNAIQLIITQIPGTNGPLLENLDALYDSLFEAFGFLYNGCIDPTPLYPKCTEDIEIPPLPPPPPLPEEFIISPNPVSKILTIQIKDPGNVERLSIYDATGRLVFEKKMLTDVLEIDVAGWPKGTYFVRLGKGDEQFVKGFVVMRR
>UniRef90_A0A6L2N053 Extensin-like n=1 Tax=Tanacetum cinerariifolium TaxID=118510 RepID=A0A6L2N053_TANCI
MSDVSSAVTYTLVYTDSEPWRYYGEDSAETGPPRIIVLQPVAPPSLDYVPGPEHPPSLDYVPGPKHPPSPIEIPYVPKPEYPEYLAPSNDEVPLEDQPLRADASPIAASPDYLADSDPEEDPEEDPEDDQADYPVDGGDGDNEPFDDDDTDDEDPEEEPFEEDDEEEEEHLASADSPAAALLSPPLLVPSLPLPLPSPLITSSVDTGASLSYREAGIRMRALLPSTSRRTDILGADMPPQKKACLTTPAPGFEIGE
>UniRef90_A0A3P8RZN5 Otopetrin 2 n=1 Tax=Amphiprion percula TaxID=161767 RepID=A0A3P8RZN5_AMPPE
QGRGEPCGEQCSPWPRCSPCKCVTSDNPCEPCRMTVKDRETEEVHLSNNINAVGQTESASEPDLNDSSTEVVRERSRNWGWLLSGIICVNILILGCALVSGSAYNNVKISTPDLQVFLIIILLLTSIWMVYYVIYTARTENAVVYKDDHAGPVWLRGGLVLFGLLICNICFGFMVLKYESNCEIVLQTYFLWVHAKDCVQLQRNISRCGLMLTLSTNLVLWMTNPSARKHIITLLSFGTISCLTAGYGDDKCKCSHTSCSMFKEAYYYLYPFNIEYSLFASAMAYVMWKNVGRVAAEHGHHDIKFSLRDIFLGPVFGVLLVFTGLATFIVYEMEMKKDDHDADKKDQAVMMHFVMNIVIVTLMSVSSVIGCAIYRVDHREHVSEKNPTRSLDVGLLVGASLGQFIISYFSIVAMVATGAKGYLNGLNLAWSILMVIQLGLQNFFIIEGLHREPFHEVEPVAVVPNPYVLEPSKDLSIPEGPVMDTKPNPELTAHSHTPEHRHKLVWKRRVLKEVCVFLLLGNIILWIMPAFGARPQFDHDTETEFYKFNMWAAVVNIGLPFGIFYRMHSVASLFEVFLCS
>UniRef90_A0A267H7W8 ATP synthase subunit e, mitochondrial (Fragment) n=2 Tax=Macrostomum lignano TaxID=282301 RepID=A0A267H7W8_9PLAT
YLLLLFLLFKMLNYLMSASRASKLTFLASLAFTGFSVSFVLWTQKSERDAVKQGVLADIERQKLYEETLQKRAA
>UniRef90_UPI00201FA0E7 ABC transporter ATPase n=1 Tax=Flagellimonas sp. 2012CJ39-3 TaxID=2942214 RepID=UPI00201FA0E7
MLVDFETLPDTARIWIYQSNRSFSPEELEEINQALSQFLNEWTAHGSTLQAGFEVKYKRFIVIGLDQSQASASGCSIDASVHFIQGLEQKYGVELMDRMNVSFKQGEYIAYKSLKDFKKMAKAKSISKNTTVFNNLVANKLEYSEHWEVPASESWHSRFL
>UniRef90_A0A674GZ47 Rap1 GTPase-GDP dissociation stimulator 1-like n=2 Tax=Estrildinae TaxID=40155 RepID=A0A674GZ47_TAEGU
MRTSESASESKGEAQGIHLTVTINCTVAPRANNRGGRPGPSDLTETLNKHLEHLGLCGDGTEAEDQILESLNGILLAITEDKQRSFHLLRGSKIFPTLAKILKGNPRCAVKAAHVLSEIAKNEEMKKPCIEADLVLTLIPLLESTDQEMLLHAGRAIGRICYDNRSLQEELVKVGVIPSLVRILTDYADSEPLVHVALLALYNLADLDSAKEALSMTKVAEQLVKQLRRAESHEKLEIVFEVLQALAENDALKVQLVDAGVPEVLSEILLRLQGSSQAEDTCIMKAASDLIVSLLLGDGNCLRMFQLGVVHQLLDLLEKQVQSGDTSVQQAALSALQSLAVPVVSKVQMLEEGVAERIEALLRAESPPVQFKLLGTLRTLADGQADAAEILGQDPQLLSRLVQWCSVSDPSGICGEANRLLASILHHNRSQEVVKAIQAAQGVKHLVSMTTNEHAAMQNEALNALAIASAIDLETLEESFKESQLVQSLHKLLRDDNTSPEVKYNSMGLLCRLLNSGDLRQEIEEDKIKDTLEKLCSHSNADVVKGATTTLQVLRGETPH
>UniRef90_A0A6L8ETX0 Helicase C-terminal domain-containing protein n=1 Tax=Candidatus Poribacteria bacterium TaxID=2026781 RepID=A0A6L8ETX0_9BACT
MSRANYSNREALNDALKVYLQAMYSFVSECLDEQSIRDFLKLQSSDDLMEDIEVKDIANLIKSYSYWSKCFKEKFKIIDRDNTRYYDARSVTSLIVEGRNQLSHQWLRELDPEFTRTQLFFITDILGKIKRSDAQREVEVIRDELFNDTTEQLVTIGVEDEKAKYEKSIAEMEKRLASAEKNKKKLSKQIVDNAVKLDEKTEELEKRSEQLVSAKLSKQECEKQRDSISKQLKKVQTAHSACKEHITTISNQLTTAETERDDYKERFETASRKREEAETEWQACEESLIAMRKLFTIAAIGNQTVQVVYPPIQTDSTIRILDRRNVEKKNYLLELLEQKQPTVIYVQSEERIDQLLALVGPEKADVIGEHNERISEAEEREILEKLQSGELIAVVSNTAFSTLASPHRIEHFVFCHLVPGLDEFFRQCTPAFASEKHAYLHLIYNSEQDIKGLDQKYPDRKTLEKFYPELRKLAETNGDLIRPESLYNELDIAKQGIETGLAIFEELQLLERNDEGIRLLPPAGNKLEASEIYRRGEQIKNGAADFQAFQFEQSIEQIWEALLKELNVDNEHILEASRVYEVRAFQDAIEDSRAQSESSTDAVEDDNAVDSEDAVAKPTLKSARANAKVTEEDVTEIRSRSAAGESDSELAEADSEKKPEVKQSEFWQPIRAGEFGELFTGKPVPVSNEGWIAKTVRNIGVCLYLTNQRCYVQVYFHGANGSERREKIMTLFPKSEYTYAYRDSSRETKVQFPVLDKGRKDQDDWDEIREKLVAMGTDIYNKIDASDL
>UniRef90_A0A4D9D465 MFS domain-containing protein n=2 Tax=Monodopsidaceae TaxID=425072 RepID=A0A4D9D465_9STRA
MEAPFLAPESSGSSQDGNVASQETVIQRHPWRVHGSRYFQLILLCILILNNAVVWVAFSAITPATAAVYGVSPGLVNIVALSFQMLFLPGTIAGYMLKERWGLRLTLLAGAFMTALSAAIRFVSLYVPPVSLRNASTDGHDVNNGGGAYALLLLGTSLAALAQPLLLNTPPDLAVHWFAVKERDLVTSLAFMCSPLGSALGVTLAPVFVSEAGADTEEDVSGSHRNDARGGLRLFLLAQLGMSVATTLLAHAGATDRPPTPPSRAAALGSQREEERVHSSDASGSRVLCMPLAWELVAPDLRRCLLCNPSFLLLLFCFGIGLGFFNALLTLLGQLLAPCGYSEAEAGALGGIFLGTGLVGAVMAGVLLDASHRYGLLLKSGFLGAWAASLFVVFTLRPDNFLVLALCFGLLGFTMLPLLPVAIENGVEITYPDVPEFFSSGLLLSAGNLTGIPLAFIFAWTIDSYEGSCRKLWKPAAVLVVVVTTACALPVLGYRPRAFGRWEAEKEQRREGLEGCGHDVATRDA
>UniRef90_A0A833JG99 Uncharacterized protein n=3 Tax=Komagataeibacter medellinensis TaxID=1177712 RepID=A0A833JG99_9PROT
MVVTMLFATVLFVVFVTVFVATLFTVLTTLAVVLTMVVTMLSMVFAVIVFSVGDNRQGQTKGSSKQKCFFHVNHFLLIN
>UniRef90_A0A8S3R600 ANK_REP_REGION domain-containing protein n=1 Tax=Mytilus edulis TaxID=6550 RepID=A0A8S3R600_MYTED
MNSWKMLLDNFGSLRDCEWFDVHLAIKSALESAFLYMDKSFIDYISFTYGKKTVDLNYFLNFACQNGKEIVVRWIFEQFETNHIDIIAPLLSVCRKGNKELVVYLLRKCCIEDLNLNATMQAACESGTLDVVTMLWEKFNFDIFDVESCFKSSCRKGNLNIVKWLYESFDKALFHDISVLNLACISSNIELVEYLIINFLKTSDNEMTKIEECLSYCNSSMLRFFVGKYGCDLFDLDHILSVGLSENNAEFVIWSLTNFDFKSVDLNNAVKLACQNGNFRLHTSGETRLVEWFLNSNCYESLELQQASNVSCARGKIDVVIMLHKRYNEKACNVKAAVNNACFSGSIETVYWLLNTFQEKDADLDVALAMACGNGKNNLVMWLLEKYDMKFNMKLAILETFKASLKKERSNGKLSENSSFELLNWMLKECGNHILDIKISVLLACKQGKIGHVKWLFDKFSETCRDINPSEALEAACHGFDTFAIYLFLVKRFRNRKFDLQKVMQYACEFGNDQIVEDLLKRFDKNKLNVREGIFAACLKGHLNVLRVLWLYAKPKYFREKRLVNLVSNSENSEMVNWLIAAVDR
>UniRef90_A0A6M3SAA8 L2 (Fragment) n=1 Tax=Human papillomavirus 35 TaxID=10587 RepID=A0A6M3SAA8_HPV35
KRASATQLYRTCKAAGTCPPDVIPKVEGNTVADQILKYGSMAVFFGGLGIGSGSGTGGRSGYVPLGTTPPTAATNIPIRPPVTVESIPLDTIGPLDSSIVSLVEETSFIESGAPVVTPRVPPTTGFTITTSTDTTPAILDVTSISTHDNPTFTDPSVLHPPTPAEXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXPIPGSRPTTRLGLYSKGTQQVKVVDPAFMTSPAKLITYDNPAYEGLNPDTTLQFEHEDISLAPDPDFMDIIALHRPALTSRKGTIRYSRVGNKRTMHTRSGKAIGARVHYYQDLSSITEDIELXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXSNTTIPLSSGYDIPITAGPDXXXXXXXXXXXXXXXXXXPIXXXXXXXXXXXXXXXXXXXXXXRKRIPXFFADVSVAV
>UniRef90_A0A7C6DX07 Oligosaccharide repeat unit polymerase n=1 Tax=Candidatus Bathyarchaeota archaeon TaxID=2026714 RepID=A0A7C6DX07_9ARCH
MGTVDLLVFVILGALCYFALRFSRFVYGDYFAPVGIFFGVNLASLAFYHLRLIPMVPLSSQAYALIAVAFFSFFTGALTATPTVALRGQPLRKRASSRHVWNSKGLGLFYYFSACVALAGWVFFVTQIVPPGWVRNLWMLQGDYEFPYHLGYTLVAGIAVPPSFVLLGAVRGKTTLPMIFFLITTVFALAIVGIKSYLTIAIATSLIVWATIHPGRLKWKHLAFLALCLVGFMALYDHFIDIFVPRHFPGSRFPTILAFLERPYLYLVGPWAAMSVVMAAPPPQAQWGQVTLFPLWKILGPGGLSVMERVPQYLPFVDIGPSMFNVYSLIGEVYWDWGWVGVILICFLLGFISTRLYVKAQNSRNWIDYLSTGFFSYGLFISFFAYYYRETLIFLLIYPVVIGPLVSKLVSSLRVPRVRPVGIKI
>UniRef90_A0A1M5D686 DNA-binding transcriptional regulator, Lrp family n=2 Tax=Caldanaerobius TaxID=862261 RepID=A0A1M5D686_9THEO
MDKCMDVIELLYENSRLTDEQIATMTGLDTEEVKNIIKKLEDEKVLLKYRALVNWEKTQKEVVHALIEVRVTPQQGHGFNAIAERICQFDEVTSVSLVSGGYDLAVEVEGKTMKEIALFVAERLAPIDGVLSTTTHFILKKYKQEGVFFTDGPEDQRLVVTP
>UniRef90_A0A353M699 ATP synthase protein I n=8 Tax=root TaxID=1 RepID=A0A353M699_9GAMM
MAVKSKLPKIQLIIILVTVAYFSTLGAGLSAAYGGLISLMNTGLVNRHTNKQREDLTISAQAGVGMMAISVIMRMAMVVSLTLAGHFLLKLSTDALIVSLVLGLIGFLIDKMLSNGGQ
>UniRef90_A0A8T0H0I4 Cytochrome c oxidase subunit 1 n=1 Tax=Ceratodon purpureus TaxID=3225 RepID=A0A8T0H0I4_CERPU
MINHSEGSTVKIMFYWGYFVSSSRKTGQWMSSSSFHTDIFTNGFYVGLHEASLIVLIAWFFPSPSICSSQSASVLFVIIASVSSCCKKNDCSPSLAMLHICSTIIKRVAIQFKCTH
>UniRef90_A0A536S874 SGNH_hydro domain-containing protein n=1 Tax=Chloroflexi bacterium TaxID=2026724 RepID=A0A536S874_9CHLR
MMHRVVAVDLLILVLLAGCNAASTATARVTPSPSGTSSPIATATPSSSASLNSVRYVAIGASDTVGVGAVDPARGSWPARIAALLPSGAAYVNLGVSGSLALQAQREQLPGAVAQRPTVVTVWLAVNDLNATIDPASYQDALGAIVDGLVQGTSAMIFVGNVPDLRGVPVYASVDKARLLAGITAYNDAIARVAARSATRVFVVDLFTGSAALVSTATVATDGFHPSDAGYQLIADRFAGAMRAKGIPLRS
>UniRef90_A0A1Q9YEZ7 Translation initiation factor IF-3 n=2 Tax=Erysipelotrichaceae TaxID=128827 RepID=A0A1Q9YEZ7_9FIRM
MSKGRYSIINNRKVAPNNVNDDLFNEKIPFREVRLIDSNGDQLGVKSKREALEIAYRQNLDLLCVAPKARPAVCKILDYGKYHFEQQKKAKEAKRKQHTVELKALRLSPVVDTHDFETKLRQARKWIEQGMKVKIDMRFRGRMMTRQEVGKQIMNDFLEQLSDIASVEKKPSLEGNTMSLILAPQKKK
>UniRef90_A0A1R4ENY9 LigA domain-containing protein n=1 Tax=Corynebacterium glutamicum TaxID=1718 RepID=A0A1R4ENY9_CORGT
MTLTPEDMQLFKDLRMTEFGRVIQEIIDDPDRDHDSFEDKIQQALYAQRDARDNRRIEKLLKAAGLSYTAAALERFDVTGDRGITADRLLRLGPATG
>UniRef90_A0A7J9XK46 Phenylacetate--CoA ligase family protein n=1 Tax=Pseudonocardiaceae bacterium TaxID=1873463 RepID=A0A7J9XK46_9PSEU
MSNANSTAPASRRGAAQRLSEYRRYWDEDRETMDPRLREKKIVERIQNQLRYVYAKVPFYRRHYDAHGFTPDMVTSLEDFTTKVPVITKKMLVADQAEHPPFGSYLGVERSELTRIHGSSGTMGTPTMYGVSRRDWAGAGKFSCMALWCAGLRPDDVVHISFPFTLFFGGWGLLQAAEQLGACTFPVGTMVSTERQIELLQRLDCDVLVATPSYVNHLGTTARAHGIDVRASAISVAVMGGEPGASIPAVRESLHQLWGEVSLIDLAAGSTSEMYPFTTSMGCLESDGGVHLFQDENYTEVVSIEDPNEPVPPGTSGAVVATHLWRDSQPMIRFWTGDEGVIDTEPCPCGRTYPRMPKGVYGRLDDMLLVRGANVYPSAIESVVRGVEGSGGEFRIIVDRPADLDEITVEVERDAALATDRAPALQATLQEQFKNALGVRVAIRVVEPATFEQQTFKARRVIDRRSSS
>UniRef90_A0A7S3PQM2 SSD domain-containing protein n=1 Tax=Aplanochytrium stocchinoi TaxID=215587 RepID=A0A7S3PQM2_9STRA
MLKDGAIDQSEEEGCVGSLKRRYLESMHKRTKTHCGGCFAIVLLLSFTVSAAYEFLQGDADFADPNQPATLAFDAVELSRELFDIAAEESEEESNHFEGVSFGYEWKDGRSENIFTPKNLQTICTIEQIMFAQSAYGFDLCDPRNINTTQTCVTSFTEEGVDTSIAGNFYRFENASFNFEDCHLLADEVVGNYSDLIYTSLSLSDSSPARFFVNSKTKSTITRSTLLLSHPVEKTAEEKLLDMEQDYFDFFGMEATLFRSVYRNPATLGDIKMSFFNIVLLENEFERMLPSDFIMAFGSMTFVAVWMGIYTKSLFLTVCCTGYILFSIPVSLFMYKVVFRILYFDFIHVLVIFIILGIGADGTFVVIDAYKQSRLLLDDDLERLVYSWSRSTATVFNTSFTTVVAFVVTGFTPLIPLSTFGIFAALCITVNFVFVCTIVPSTVILWERWFVKDKEKGVEKSEVVPELKKENSNSSFEGHFKSKDEAKHTLDALVEGNNRVFEHYYVPAILKCKQVFVLLGLVIGILGVYGVTKVSQLTKPEQWFPEDHTQSIFIEKLILEFLSGEEGEYAEVTVFWGIDKVERDYPARYSGDTETYDDKVIFDDSFDITDFQTQLAIIKMCELLENRTCDEDTCGGFTTLLFPETNTYQGMCTMREFHNWWNVEKNFSVPLNSANETLFYERLGLFVVENPEMARHVGIIGGVVKFFSIEYIMTLKILAPGSEVQNYVDIMDNIIEKYKSFAPASAQSVDYSSPDFVEYALELSLQETVIKGLAITFPIVFVVLLLATGNWILAAFSVIAIAFIVVTVMGFVFAALGWELGIAESIVSIMIVGLSVDYAIHLGHMYTVAGKSEGFESREDKFHYAVLTMGPTVLAGGMTTLGAGAFLFGAQITFFGKMGVLLVLTVTCSLFYSLVFLMSVAAWFGPQGTYANLNRTCSKQ
>UniRef90_H6QP23 RNase H domain-containing protein n=1 Tax=Puccinia graminis f. sp. tritici (strain CRL 75-36-700-3 / race SCCL) TaxID=418459 RepID=H6QP23_PUCGT
MAGARRWIGLEALEAGYSAACGEILGSRISGYSMYTDSMCVHNSTNRTFGWARS
>UniRef90_UPI00197E61F8 hypothetical protein n=1 Tax=Salmonella enterica TaxID=28901 RepID=UPI00197E61F8
GRGGGGGRGGDRGRGEGEEEKGEGEGGERGGKKGRRGKEKDRKEERGGRGEGGKREREKEKKGREKGGGKENIGKKKGKRRRRRKGKKEEERGEKKKRKRRKGRRKRGGGKEERKRGKKKKGRKEEEGKRKRGKRKEGRKREEGEGEKRRGEGEKERGRKGERKRETRKKKRERRGEG
>UniRef90_UPI00082B7ECA thermonuclease family protein n=1 Tax=Sphingomonas soli TaxID=266127 RepID=UPI00082B7ECA
MLAALSLLIAAAPAGAACVAVDGDTLRCGDERVRLLGIDAPELPWHCQQGRHCAPGDPYASTRSLRAALSRGPVSLRRFGTDHYGPTLALVSAGGVDLSCWQLSHGQAIYKSWWDNGGQLARICPAAR
>UniRef90_A0A1V6AN80 Heptaprenyl diphosphate synthase component I n=1 Tax=Firmicutes bacterium ADurb.Bin146 TaxID=1852882 RepID=A0A1V6AN80_9FIRM
MNNTKKLTISAIFTALAIAISIAESYIPYSAIAPGVKLGLANVIPMTLLYVLGPLYAISVQAVRIIVTGLLRGNLVTFFFSFFGGMASTVLCALIKKQKIIEFSVIGLSVIGAVIHNTAQFFTALVILKNINILWYIAILAIFAVIAGVLTGIIAKYTIKAIERYSRSI
>UniRef90_V7ICF6 Signal peptide protein n=17 Tax=Eikenella TaxID=538 RepID=V7ICF6_EIKCO
MQKYILTTLLLACATTAGADNFRPQKLALIHSLYVPYQNGNTVHAHPERHFSADLRAVYQEDKQHTAPNEVGCIDYDPIIAGQDWDSASLNRTLNIRPLANGRIEAVFQQFPGDFSATQVQFVLQCSPNGRCLVDDIYSATPGHRLVSFKRSVRRCISEMTNQH
>UniRef90_UPI001C0085A9 TIGR02680 family protein n=1 Tax=Nocardioides sp. LMS-CY TaxID=2840457 RepID=UPI001C0085A9
MTLTQIPTEGIETADQTPPKHHPYRWRMNRAGLVDVWYYYDTEFDLSGGRLVLRGTNGSGKSRALELLLPFVLDADRRKMDATGSGKVSLVELMKAGAADRTTRAGYVWLELARSVDPTDPADAELHESGTTEQHTTIGAHIRFSRSTGEAKVHYFTTDLRVGYDLELLSPTRETLPRDKLADLIGADRITTSPGTHRDRVRATVFTLTGDAGAERYAGLLQLLHTLRSPDVGNRIEEGRLPQILSDALPPLDERALNAAGEQLDGLSETRLAQGRLEAALGHVNTFFDTYRRYAATAVSDSAENTTKAASAAEAAVKDAKNRATVHAELDKARGENQARMGELDESIADLSGTIAGIKQSSAYADARDLDEREKRVEALGAAAVAALVTAERARGAEGREVRTANEAAAKGVSASERAAAAVEKARTKVDAAGVSGGLPASIAATTAPASVLTEPVRLTRDGDPTPLDRPVPVQLSVTPDDLGSAVEQARLVQVSATERGRQAAGRLDKAQALDVQRGKVEAAERRAEEADQRANEAEEVDLERQVELTTAADTYASQWRDWVSAAATVAAFGAEPDLTGTGIDAVLADAPIVIGDLSEDDLTELDHVAGMLAETVREQHTHTIAELDAADQVDDAVRNNLKVERTQLESAVDPSPTTPTWIRPRGVDAIPLWRAIDFGDDLDATDRAGLEGALLASGLLLADLHRDGTLHAENGQLLLTPTGPVDETPVTGKLIADPGSPMPVEVVEAVLARIGFGDRRSGGATTPAGVWVAPDGSWGSGPLTGRYLQPVARHIGTTARAEARRVRLAAIEVELAQLADAAEVRAAARAEARAARDRLGAVTRNAPRTQAVSSARVRAADATNRAAKERSRAHEAAMQASELRTAWSRDVSEHRAICSEFNLPHTADDLQVVRHATGEAESACRDLSNLLDQLITVVADHADAVGRAGDRTDERVEDELRAATEWTTWHREASELESVRSSIGQEAEAAKAELRECETTRKTLEGELDKARTLDSRLGVEVGTAEAEARAAAERVTTTHEDLAATFDQFRRRLEMPGITAAAFAEPPETIELSEVTPAAVRKAVTRTAAGLRRHSQGADENTLFGPQRTLERDLSGSYDVITEVRDGVRLIELSDATGRRSIADAAAELTRTVEEGRNALSERERSVFTEFVLGGVAEELRRRLDQADELIAAMNASLATIRTSHGIGVKLRWKISESSDPAVVRIKELVSTAGAVRSADQTAELTELLKDRVNEAFELDESAGYATHLHDALDYRSWHTVEVIILGPKSGQERRISRKARLSQGETRFVSYVALFAAIDAYLSGLPDTGRALRLLLLDDAFAKVDNRTIGELMGLLVRLDVDFAMTGHALWGDYPQVPALDCYEVRRVEGSAAVTTHVRWDGHTRHLRAAPR
>UniRef90_A0A3A5MMX1 DUF2236 domain-containing protein n=2 Tax=Cryobacterium TaxID=69578 RepID=A0A3A5MMX1_9MICO
MHELAGESVLIAAGGRSILLQLADPQIGHGVADHSNFAQRPLDRLNGTLSYVYAIACGTPAEAAHATARVNRAHKPVQSDGAGGGPAYSAYTPQLQLWVAATLYDSAITMYELIYGRLDDDRADDIYREYAALGTALQVPPGLWPATRADFAAYWQRRLGELATDAATRSVARQLLHSPTGPLWLKLGMPFARFLTIGLLPAHVRDLFDLEWTPGAERRFRRTLRVIRAVYPALPERIRHWPKNHYLRSLRASMAAVG
>UniRef90_A0A4Y9ZFN4 homoserine kinase n=1 Tax=Dentipellis fragilis TaxID=205917 RepID=A0A4Y9ZFN4_9AGAM
MQLSFITLALAFSALSVSAAPHSLAERAGKGGNKGGNANKGNANNDKGNNDAGAKAGGGGGDLQTSLTLDPSVLAKGFESDGQAQQEAGQVPSLTSSNNFINFCATTKKPITNGQQIKGGSCNPAPMGVIAATDKMPSSKFVFPKNTQTIKANQQFDVQMAIQNIVTGNFVNPNTNYYAAPQHTDDSGTIIGHTHFVIEKLDAIDQTKPTNPGTFAFFKGVNTAAKDGVLSVSVDKGLPAGIYRLASINAAANHQPVLVAIAQHGSLDDMVYFFVTEDGQPDAAAAGAQGNGTAAADVKGGAAADGQGGAAAAKGGDGAGAKGGQAQAAKGGNAQGGKGVYWLSGSGYYTVRTAMSTAPRSFTIRVPATSANIGPGFDVATPMSRPPSPTPARGADEVPLDPYKNLTTRVALYVLRCHDIPLLPSHLSIHVNNEIPFGRGLGSSGAAVIAGVLLGSALGNLNLPRERMLDYALMVERHPDNVTAALVGGFVGSYLRELDAAATQAASVPLSEVLPEYPPDAGPEWGTNPPKPPMGIGHYVRFGWAPAIRAVAIIPQFELSTAKAREVLPESYSRKDLVFNLQRLAVLTTALAQSPPDPELIYEAMKDRVHQPYRRGLIPGLPEVTSSITPKSHPGLLGICLSGAGPTILALAVSGFDAIAEDARKIFKEKGVEVIWKLLDVVSEGSLIKEED
>UniRef90_A0A1J3I6D3 Retrovirus-related Pol polyprotein from transposon TNT 1-94 n=1 Tax=Noccaea caerulescens TaxID=107243 RepID=A0A1J3I6D3_NOCCA
MTTTRIDVDRFDGTGDFSLWKVRMLAHFGVLGLKDILTDETLLRDSPTTGAASKEELDAAKKDPQKGIAAEASSSMDPGQELRVCCELQNLI
>UniRef90_UPI0020262455 photosystem reaction center subunit H n=1 Tax=Flavobacterium anhuiense TaxID=459526 RepID=UPI0020262455
MDADNRTIGTIDNLWVNKDMQRVVYLDVKADKTLIEDSQREVHENIADGNEKEFMYRDGDSHLIIPIGSVNINKDTKTVMASGIGYDTFRRTGRFNTQQRFDRNYERAVLRSYYPDNDPSVGYDADDDTFYSRKEFGNR
>UniRef90_A0A4Z1PND5 DDE-1 domain-containing protein n=1 Tax=Venturia nashicola TaxID=86259 RepID=A0A4Z1PND5_9PEZI
MLRSKMICEKPVLWLRQQHTSAQDLVDAEIDTHGRIHFAGTSAAAWKIGDAYCKVKSYIPGMEYEADSINFVCSKVPTIPLPEVIHTWVDEELCRAFLILSQVKGKTLAECWHSLSSEQRTIIARTIASFCTLLAQNSESSLQSVAGRRISM
>UniRef90_A0A7V3M636 TNase-like domain-containing protein n=1 Tax=Proteobacteria bacterium TaxID=1977087 RepID=A0A7V3M636_9PROT
MRAVAIAVLLTLGACGPQLGSLEKGETGRVVRAYNGDTLELDSGLRVFLAEIDAPQGENAYAAQAQGELEALALHRDVQLAYGGARRWVGRAREGQAAAPEAAIAHVFVKSEGGRWFWLQHELVSRGAAYVRPRRDNHARTPELLALEAQARAAERGLWDRREYRSLSVRAAARLATESGGNCMRGDAPYRVIEGEVGEARVSESRALLRMEGAPAETTFALVVFGDNFRAWDGAPLASLNGARIRARGPLGVYAGEPQLCLEHASQLEVLTD
>UniRef90_A0A1C6CXG8 Membrane protein of uncharacterized function n=1 Tax=uncultured Clostridium sp. TaxID=59620 RepID=A0A1C6CXG8_9CLOT
MKRVSLFIIVNAISLYLVSLLMNSMYIGSFGALIILTIIFGALNLTVKPILEFLSLPITFLTLGLFLLIINAIVLKLAFGLVPGVYLYGFVNAIGASILLSIVNTIIYKILD
>UniRef90_UPI00097C6FDA NAD(P)H-quinone oxidoreductase n=1 Tax=Pseudomonas sp. KK4 TaxID=1855729 RepID=UPI00097C6FDA
MTLPHTMTHIEITQPGAPEVLQPRQVPVPTPGDGDVLIRVHAAGVNRPDALQRAGKYPMKPGMNPIPGLEVAGEVVAVGSGVRTFNIGDRVCALTNGGGYAQYCAVPASQTLPIPEGVDWLHAAAIPETYFTVWANLFEMGGARTGHRALIHGGTSGIGTTALMLCREFGIEAFATAGSADKCAVIGELGAQAINYRDQDFAKVIAEKTAGKGVDVVLDIMGGSYLNGNVAALGMEGRLVMLGFLGGAVAKEVDLLSIMAKRAIVTGSLLRSRTREEKAAIAQQLREHVWPVLAAGRCLPMIDKVYPLADASLAHARMEGGDHIGKIVLSVVQ
>UniRef90_A0A3D2TG15 Serine protease n=1 Tax=Planctomycetaceae bacterium TaxID=2026779 RepID=A0A3D2TG15_9PLAN
MTPIVRAVRDARPAVVNIQGQKSVSESAEGTPTSPRQVNGMGTGVVIDSRGYILTNHHVVAGVRRINITLAGGQTYVASVVAYDKTTDLAVIRIRTPSPLQTIRLGTSEDLMEGEAVIAVGNAFGYEHTVTTGIISALHRNVQVNEKQQYLDLIQTDASINPGNSGGPLLNIDGEMIGVNVAVRAGAQGIGFAIPLDKALEIAARLLSIEKLDNHWHGMTALSLDGPTGPVTIARLDRKSPAERSGLQRGDQLQRIGKTSIHRPLDVERALLGRGSGERVPLIVRRGDETLKLDLRLANRSHKRSRGTTRQLSSAIALQQASWDTLGLKLEVEPLDSFQELEVPYRGGMRVVSVRPGSSAAKQGVQTGDVLVKMHRWTTASEKDIRFIVEHADTLARAGKVKFYVVRGEETFFGHLSVAKRSESAVR
>UniRef90_A0A7I7W7J5 6-phosphofructokinase n=1 Tax=Mycobacterium branderi TaxID=43348 RepID=A0A7I7W7J5_9MYCO
MIKRIALNGHRATIVTLTMNPALDITTSADRVLPTDKIRCRGTRYDPGGGGINVARVARVLGASVSAVFPAGGPAGDMLANLLVGEQVPFHRVRIASSTRESLTVNEESSGQQYRFVLPGPQLTFSERAQCLDELRMAASSARFVVASGSLPPGVPAEFYQSVADVCRELGARLVLDTSGTGLQHITSGVYLLKPSVRELRECIGRDLGTEAEQVDAVQELIARGVAEVVVVSLGAQGALLVTKQGAQRFPAIHMRSGSGVGAGDAMTAAVTVGLCRGWPLAKSVQCGIAAGAAMLMTPGTAVCRRDDVERLFELAAEPVDLSSVSR
>UniRef90_A0A499UVA6 Secreted protein n=1 Tax=Streptomyces antimycoticus TaxID=68175 RepID=A0A499UVA6_9ACTN
MLGAEVVTLGLQLDVLRKGGGEHLQALGHDFLADTVTGDHCEANAARHTGTLPLVPWIDIAVPAFGQPPSGNHPFTPCMVRC
>UniRef90_A0A5P1EE21 Pyr_redox_2 domain-containing protein n=1 Tax=Asparagus officinalis TaxID=4686 RepID=A0A5P1EE21_ASPOF
MGNARDRLASKFAAKNAGLWSMDPNQIEEHKGNYANEFIERVRLCDVSAVIQEVMESYEVEINGKVFKKAKKVVVIGGGYIGMEVATATIGWNLDTTEDDDVNSANEGSLPHLRPMGTVVNRHPRHGNRHTRAYGDVLHPSRLQPAGGLMASLCSLVQRFVNRAQQYHKGTVVC
>UniRef90_A0A8K0D6L2 Peptidase S1 domain-containing protein n=1 Tax=Ignelater luminosus TaxID=2038154 RepID=A0A8K0D6L2_9COLE
MAKPTFLVLVCFLLMETYESRRQLKDYPFMKFSGIDDYPFHEEEASSLRNKMVPLVVNPPEQLQPPGFSIVVFRRSSIIGSGAIIAKYFALTICTLLKNLGEETFDLTPITKIQYVLHNSSVDDVDVITPIIHKLIPHPHCGNMKKWNPKANIGLIQTKEPMDKTASLRYPLLLTSGQPIPKGEYILSNFRIKNPNAINIKQAIWYVISKPASHQLCRNLFRADRQAYDTQTNLCMSYVHVGDADSCKGDLGIPLSVRHKNRDYLIGFSVHKHYCGSPKEVASFILVGPNKKWIESTIKKLQS
>UniRef90_A0A6B2C3S4 DEAD/DEAH box helicase n=2 Tax=Thermoprotei TaxID=183924 RepID=A0A6B2C3S4_9CREN
MQPDFTIEVPTFSIPYSNMYLSDSLRLNTFQAEAYNKINNRRDLVLVAPTGSGKTLILLLNNISAQDKIRGFAALYPNNTLLINQMRTVEEILIEHLEAKEVERVTSGCDNEGNKTEICKEEIFPLKIYKINRGKAEGPWSDTEYAAIMALSGKYIKPTSEETKSDVVYRLVEKLYEYSRKNNLYVIVFATPDTYLLVSTGAYRNFELVGKTLHNILVALVNEKSIDELDNILRRTKVLTRDQVSKSLSVYHQLLNQLPLFIDEFHLYSPFELSALYVIIKIYKSMSDLPIVFSSATPAKEIINELRDAGINPEMLNAEIIHGGDGFHVKGDSVIEVIGVDTGKKGLPAYYEAAEKVPGIVTEDLFDEVKEIDRYKDGRALIILERLWMVTRLAEELSKKGIRPDCIASIVPSKICAKGSNVIVGSEATTQGVNLGKIVWGITAGVSSEDVIQRIGRFGRKGVSSKIYLVLPKHVLEKNLPKSTMNYYELTEWLSKVYLDYPKRKKDVSNIIPSEFYNVRKKLIHAYALSSMVRVSGMKGLGEIDLKKEEALKLLNSFIGDSRALVNLLVFRRTGFSVEFIDIKYGEQGEASIGLIARNFKVLAYKGGKLEIDLSQSERQELVLSLNKEPRSFVNKFIDIRTLLKLLKGSLKIGDSLMLDEKSVGEGLVYVVDAGEDLAEYLSYTGEGARTVYTGGSEIRYAIMFI
>UniRef90_A0A6P0Q7Z9 VanZ family protein n=1 Tax=Microcoleus sp. SIO2G3 TaxID=2607795 RepID=A0A6P0Q7Z9_9CYAN
MPSHRSWFFALWFYLGILAAISLAVYLKIIPSKITKIQPIDTILHFIFIGFLAYIGHLSIKKYKIKIFQIFLPIAPIIVLFFSFIDEFIEIFIWRAGFDKLDSAADFCGVIFFTWLAERRHT
>UniRef90_A0A0N4VJ66 LisH domain-containing protein n=1 Tax=Enterobius vermicularis TaxID=51028 RepID=A0A0N4VJ66_ENTVE
MVEQCDKLLNFLSNEDSVKSNTEDLAIVAMFAPQPKAQATTRPAQMLTSQSEASAKENHKLYKVLGGIVLKVRLAGYVYEYLILNGATKTAECFKSEYLSTITKAMPTLQSSDPPGFLQNWFFLFWDLYSAAPEKRDSCEASQEAKAFHEFGFMNPSHGVPTGPVSGPMMNGMHTSHMFSSAAPSPLSLGPGPGGDGMMPGGGYYPPRSAQPGPSGSTSQASPISGVPSAGNFAAVPPRYGMPAARNGPPGPGGMPPAGFPGGAPPHMFTGSEQMRPLPAQRLPPNAGPMRMPTGYPGMRPNGPMRYTSPMYMESPTGAPFSNTMMPNGAMCSSSAASMMSSPGPGGPMQSGPESQDPRSYMMMSSASSMQYMHPEGSMTPGAGGRGSAGPPCSTSDPQMTSLLNGDEMKHSPASTHGGISCGTPSATGGPGSQAAVGGPGSVAGAGVGGPGSVHSQSGGSTGGQGGPPISQGGNAVSGQEEASEISKIKQSLFDDMKYGGKEESTTDNYHQYP
>UniRef90_Q0I9X6 Membrane or secreted protein n=1 Tax=Synechococcus sp. (strain CC9311) TaxID=64471 RepID=Q0I9X6_SYNS3
MNLTKFILRASLLVLAVLVAVAFVLVRRDSIVGGDSFVGDQTKSQRFLVRNGRDRTQSPSTSNSY
>UniRef90_A0A1B6BJ90 Fe-S oxidoreductase n=1 Tax=Fusibacter sp. 3D3 TaxID=1048380 RepID=A0A1B6BJ90_9FIRM
MKTLFMTLNSKYIHSNLAIHSISKYIKRYCTHYDALHDDVLVKEYTINQSQDDILRELIEIDADVIVCSSYIWNIEALIILFSNYRKLNHNSYIIFGGPEVSYDAKDKLEKQAFLDMIAMGEGERTITQVLDLIYEQFKNSNPRNALTANFSHVSGVAYRAGDLISVNSKRIPIEPLDEIPFVYDDFTPFENRILYYESSRGCPYSCSYCLSAAEKGVRFYSLERVFNDLNVFLEKKVSQVKFVDRTFNVDKEHALSILRYLIEHDNGITNFHFEMTATLFDEDYFKLLLNAREGLFQFEIGVQSTYKETMIAINRPIAFDKLKINCMRLLKMGNIHIHLDLIAGLPHEGYERFLRSFDDVFEMNPHALQLGFLKILKGTPIMATQEKHGYEFRKQTPYEVLYNRYIRFEDLTKLKNLETVLEYYYNSGKFKHSIQYLLKTEKGTPSDFFLKLCDYFKAHDLMYIAHSTANLYDILYEFYQENYENHALFNDLLKFDYYYAHMKGLRPFFVMSEIPQFNTRRLHYLKALEHQELINPFYVGMQSKQILKTVEFITLNYDIIALIQSQYEFIEAKLNVVLFDYQRANHAIEPSKYFKVELPVI
>UniRef90_A0A2E4DAR7 ABC transporter domain-containing protein n=1 Tax=Halobacteriovoraceae bacterium TaxID=2026745 RepID=A0A2E4DAR7_9PROT
MKYRLNRKFIPWLVLHSIEYWYYYLGALFCLVMLHHFSSEIPMLAKELGDLAIAGKLDEIEIKTFFLLAIYILFFRTLSRLLFFYPARIQQRNLRMELVNRLEVAPPRNYKNYNEGMLFQTLYNDLNRIRGFVGFALLQFGNIIIATYIFVPKIRDFNPDFLVAFTPLIGTVFCFALIVGGFFPFVKRQMDQYADVQNFLLESYEAKKTIQNYHAEKDFYKYFDEVSGKELKTFFISSIGRVISFPLVKLGFGASLIWAALIVKNDNLPASDLIYFSSFLFLILEPLMFVSWIGIVTTQGYAAWVRIKSLVRDLSAPLTADWLVNQSGLESVRMPLWDHEIEVEFPKNQWSVIVGETGSGKSWLIENYAQYLQVKGKRYSLIHQEPYIYNDTILDNIFLGQEVTLEKLKLAKEYLHKFGLDILAKNMDDLLSLELGENGKRVSGGQAKRIALIRSLVADVDFVLWDDPFSSVDLILEAKILDDLQKEASLKNRTFVLTSHRLSTVRACDHITYISKSQGIIEKGKIEIILNQKSRVDEFFNKQMA
>UniRef90_A0A0C5PBV5 TrfA n=11 Tax=Enterobacterales TaxID=91347 RepID=A0A0C5PBV5_ECOLX
MTDNKTHSELDKLKEAALAQRKKTIDEKNTQKQLTLFDIAPWPDSMRALPNDYARSALFTVKNKRQPREALQKKEIYHINKDVRITYTGLELRADDDELVWQQVLEYAKRKPMGEPITFTFYELCQDLGWSYNGRYISKAEECLTRLQATAMQFISDRVGQLESVSLIGRFRVIERGTRSSRCEVMIDKEMVLLFAGDHYSKFVWEKYRKLSPTARRLFDYFGSHREPYPMKLDTFKLMCGSDSDRIKKWREQVNKACVELKESGLIHSAWVDKDRIYCKRSTDEPKSDGDT
>UniRef90_UPI00036E30A4 DUF4170 domain-containing protein n=1 Tax=Methyloferula stellata TaxID=876270 RepID=UPI00036E30A4
MSQEAPAQLLHLVFGGELENLEGATFKDLSKVDLVGMFPDYASAYAAWKSRAQATVDNAQIRYFIVHLHRLMDPAKGE
>UniRef90_A0A151E9N9 DUF3467 domain-containing protein n=1 Tax=Euryarchaeota archaeon SM23-78 TaxID=1803821 RepID=A0A151E9N9_9EURY
MEKKEMPLIQNLDNNPLLSNQHAIVHNPDKFIIDFKGLYPQFTPDNKPQMVLTHKVVVLEPYVAKEFVKSLSDNIKKYEDKFGKIKEPKAVEKARKESKKADKKNKSTTPRPSYMG
>UniRef90_A0A8S5REQ6 ABC transporter permease n=1 Tax=virus sp. ctkyY8 TaxID=2827995 RepID=A0A8S5REQ6_9VIRU
MHTSVLSRIVRVFQMILTELSTKRRILTLFLWVGVVI
>UniRef90_A0A6P6A4G9 zinc finger protein 6-like n=1 Tax=Durio zibethinus TaxID=66656 RepID=A0A6P6A4G9_DURZI
MAENSISNKSSSADMAPDKQSDQKPSSSLKLFGFSLTEQDEILEKAEDFGESRKFECPFCHRVFANSQALGGHQNAHKRERQRARRAHFHSHQRFIAAAPVLSSHAVRSMPPSFPRGFSSNSAGKLVSQPGYYPSQPLLLPPTPSQYTPRIYIARPLHFGTAGPGFAEFSGKLPEADIGIDLHLKLSPSGS
>UniRef90_UPI000767A53D serine/threonine-protein kinase 17B isoform X2 n=3 Tax=Vespertilionidae TaxID=9431 RepID=UPI000767A53D
MFTIFLLLQKCLETVLSRGKFAVVRQCISKSTGQEYAAKFLKKRRRGQDCRAEILHEIAVLELARSCPHVINLHEVYENTSEIILVLEYAAGGEIFNLCLPELAEMVSESDIIRLIKQILEGVYYLHQNNIVHLDLKPQNILLSSIYPLGDIKIVDFGMSRKLGNACELREIMGTPEYLAPEILNYDPITTATDMWNIGIIAYMLVTHTSPFVGEDNQETYLNISQVNVDYSEETFSSVSQLATDFIQSLLVKNPEKRPTAEICLTHSWLQQWDFGNLFLPEEMSSPPQDQDHTTRSSEDKTLKSSCNGTCEDREDKENIPEDSSVVSKRFRFDDSLPSPHELVSDVLC
>UniRef90_A0A0F5JDP3 N-acetyltransferase n=21 Tax=Tannerellaceae TaxID=2005525 RepID=A0A0F5JDP3_9BACT
MGVVIKEVTSKKELKKFVKFNIDLYKDNPYHIPGLIEEEMVTLDKKKNPAFEVCDAIYFLAYKDGKIVGRIAGMINRRSNEVWNQQRARFGFLDFIDDAEVVDALFNAVEKWAKEQGMKEIHGPLGFTDMDHEGMLIEGFDQLGTMAAIYNFPYYPQHLERMGYEKDQDWHEFKIYIPEGVPDKHLRIGEIVKKKYGLKTMKFKKTKEIWPYAQKIFETLNEAYAPLYGFAPLTQKQIDYYVKMYIPMIRLDLVTLIIREEDDTVVGFGISLPSLSHAMQKAKGHLFPFGWIHLLKALKTKPKVIDLYLTGVLPEYQNKGVNALLFNDLIPVYIGLGVEYAESNPELASNNAVQAQWDYFKREHHKTRRAFIKKLK
>UniRef90_UPI001C659291 IS30 family transposase n=2 Tax=Arthrobacter sp. AQ5-06 TaxID=1914304 RepID=UPI001C659291
RAAIPSEPSKRQGDLGHTHHPRVIETLRQLRSHPQQNRKEGDLIIGKGNQSAIGTLVERSTNYTMLVHLPDGYKAEQMRDALAAKIKTLPAALRHSLTWDQGIEMQDWKTVKIDTGIEIYFCDPHSPWQRGINENTNGLLHQYFPKGTDLSIHSAADLDWVAQELNDRPRKRLEFRKPIELIENLLLQRPPESADPSTGRRVGARANLLIRS
>UniRef90_A0A6G1SZ52 Flagellar basal body rod protein FlgB n=1 Tax=Dehalococcoidia bacterium TaxID=2026734 RepID=A0A6G1SZ52_9CHLR
MNTLFDTTAMRAAKAALTGLSRRQEAISANVANIDTPGYTRRAVSFEGALEAEVMRSQGAAAPGELVRTDAAHLAHRGGSQLGGAGASGDVTRDVVSARNDGNTVSVDEEMLLLVETQLRYQALTQSVGRRLSTLRSVIRG
>UniRef90_UPI001939DEA2 hypothetical protein n=2 Tax=Microvirga TaxID=186650 RepID=UPI001939DEA2
MHLFGALELEIRPGTPDNPASVKIALLRYTRGEDGRLFITPECTSFEEIEGQINSLQDELDEIRERAQRAFQVT
>UniRef90_A0A7W0G2E6 HNH endonuclease n=1 Tax=Acidobacteria bacterium TaxID=1978231 RepID=A0A7W0G2E6_9BACT
MRGEFSNPTRRQAFERAGGRCEICAIPFTPGKFAYDHRDPEWMCGDSTLGNCQVICNQCHADKTAVDAGNRSHVKRLIDRQLGIPKRKGPPMAGTRASGWKKLMNGQVVERR
>UniRef90_A0A4Y3PSW6 BPL/LPL catalytic domain-containing protein n=4 Tax=Paenibacillaceae TaxID=186822 RepID=A0A4Y3PSW6_BREPA
MPFYWWEQTPVQLLATVSRPYRGEVLIPFSVDEAYARLCSQEPTTAPVIHLWRHEKAIVLGARDAKLPHAAEAVRQLEAAGYQTAVRPSGGAAVPLAPGVINLSLVMPVAASDLNPEPFFLRMVELIRATLGDDGAKMSSGEVEGAYCPGTYDLAIAGYKFCGIAQRRLTRAVAVQAFINVEGCGRTYEEIIQSFYEKAAMGAPGEQFPQVQPGRMASLSELGVSGGVEGFVLRLQELLHAHAESSVAVLDACPDSLAHEAKQALDLLKGRHRQLVGS
>UniRef90_UPI001657DD0C hypothetical protein n=1 Tax=Sphingomonas sp. JC676 TaxID=2768065 RepID=UPI001657DD0C
MTIRSRPSLWLALVVPPLAWYGFQQGLATTLRGACGAAGVPLGPLWGAGSIALCIGAGWFARPRPGQQSSDRLLSQLGVLAAGLFSLAIFYQSVATMIIPPCAR
>UniRef90_B7K1R7 Transcriptional modulator of MazE/toxin, MazF n=1 Tax=Rippkaea orientalis (strain PCC 8801) TaxID=41431 RepID=B7K1R7_RIPO1
MVTYNQFDVVVVPFPLTDKTTSKKRPALVISDMAFNLSLKKIVMAMITTSGHSSWMFDVSIVNLAASGLKSPSLIRMKLFTLDDALIVRKIGTLTQSDQERVKNSLKQLFKLL
>UniRef90_A0A846C4J9 Cobyrinate a,c-diamide synthase n=1 Tax=Okeania sp. SIO2F4 TaxID=2607790 RepID=A0A846C4J9_9CYAN
MSLIVAGERSGVGKTTITLALLAYLKQQHLKVQSFKVGPDYIDPMFHQYVTGKPCRNLDPVLTSEVYVQQCFGRNIQDVDCALVEGVMGLFDGVRFFDPPLPPLERGEKDDGDGCFPSFASTAHISRLLNLPVLLVLDCSRLSASVAAIAHGFVSFDPSINFAGLILNRVGSDRHLQLLQNSLKCINSPILGVFRRHQNISIPDRHLGLVPTDEMPDLDILINDLANLAKTCFDWEKLLPILKVENEIYQYLLSSQVCSDQTIYLPSLVANNFEKKRSEILIGVARDRAFNFYYQDNLDILEELGAKILFWSPLKDENLPVGIQGLYFGGGFPEVFAQQLSENFMVRKAVKEAIISGMPTYAECGGLMYLSEAIIDFNSNSWEMVGILPTKAVMGKSLKLGYRQAISNIDTPLLVANTQVYGHEFHRSELTEAPPMPLYKMWRVDEKKNQSQATFEGWNFEIVHASYLHLHWGNRIDIPRRFIEQGSRGVREWGRSQNKNN
>UniRef90_A0A1T0CQ58 Prevent-host-death protein n=2 Tax=Moraxella TaxID=475 RepID=A0A1T0CQ58_9GAMM
MMIDFATLPITVQERIVNLQEPVSILKDGQVVAVLSPKSYDAKFDFARIQASVSSGQVAVPKTATADIDAFDRWLADVAP
>UniRef90_C5M2E7 Topoisomerase I damage affected protein 11 n=1 Tax=Candida tropicalis (strain ATCC MYA-3404 / T1) TaxID=294747 RepID=C5M2E7_CANTT
MDIDEQLRYLALKEMCVVEIKDHITNLNNKLNEHQKELHHLREIIQRSLYKELSTGNSLAKATETRPRQNSNPRDEAIARTRRRRSSLFNDHHNKDFVTPPINDTTTNNTTPATVTTTANPESTSRIWSGLSKPLNLIQQFDTLIQNEFEKSLLSEKDQQVHNDQSRKLEKQISHQSKSSEGSISSIGSINSPLQSKSVNPRPIPMPKPYHNKPSKSDDMMQSVSSSLWSFVNDVKANVLSSLQEDERERKISGQNPPARMYNLDTGSTVDISQTSIAVEDDESETELLEPLASDEEDNVIETLDLSMYKR
>UniRef90_A0A6B8KL02 Type VI secretion system contractile sheath small subunit n=1 Tax=Methylocystis heyeri TaxID=391905 RepID=A0A6B8KL02_9HYPH
MARPSDSGQKFISRNRPPRVQIVYENPNNAEEKIELPFVMGVMADLSGNASGVEKQEVAQRKFLDIDMDNFERRMEAISPGVSLRVANKLADEPGEKLSINLKFQRMEDFGPAAIAEQTPALKKLLDARTQLANLLRYMDGKVAAEEQLRKLLKDPQLMAALRQHFPDQQNNEQ
>UniRef90_A0A1Q3DY06 Dipeptidyl-peptidase V n=2 Tax=Lentinula edodes TaxID=5353 RepID=A0A1Q3DY06_LENED
MVHSSFQFKEGADVFTPKDLMELGRPGVGVANHAGDFVIIPYSKYSFEEKKNHKSIYVAPLESTVKPFKLPLVEGGEAFWLNGKTLAYVVESEQKNLEIFALDVLYQPSTNDSAAVLSTNAPILLGSFPTTSASNFRYSTDGYLVFSDSVYSDGNLTTVKEQDEAWENRGNTALVYDRTYERHWDHWVGPKTQSLFSVRLVQDPNHMWTFGSEFVNLLAGTGHSSPVEPFGGTDDFYVSKQSVIYTTLDPAFEEERAWHTKQNVYIVSITAAGKPRELTSGSQGATRSPVLNDAGDKAAWLELDEDGYESDRAKIVIYDLKKDVRFTLTQKWDRSPGSLAFSKEGDFIYFTADDHALVKVFVLPIPSTPAKSTTDPSLSPKYLNPVTIVEDGASSGLQTLPYGRILISKSSFTSPNDVFLVKGLDALQAQITQSNGTARFTGEIDQVTNFTAPDLEGKNLSKGENFWFKGANDIDVQGWILKPKGWKHGEKKAFPILLLIHGGPQGAWEDQWSTRWNPNVFAQQGYFVVAMNPTGSTSFGQAFTDAIAGDWGGKPFVDLQKGWKYVLENYPEVDADRAVAAGASWGGYAINWIQGHPEFDFGFKALVCHDGVFDSNYNGFSTDELFFFNHDWRGRPWDKNSEEVLRKFNPANFVHKWSTPQLLIHGSKDYRLPETEGIGAFHALQQLHIPSRLVIFPDENHWVLNHGNSLKWHYEVLRWFDQFVGKKD
>UniRef90_A0A2N1ZL77 DNA repair protein RadC n=1 Tax=Gammaproteobacteria bacterium HGW-Gammaproteobacteria-12 TaxID=2013794 RepID=A0A2N1ZL77_9GAMM
MTAFSPSRAACASRIGGWAGYRPATAEQILDAARKVIDQKVQRGAAFTSSELVKDYLIAKLGGFEHEVFAALFLDAKHRLIQYVEMFRGTIDSASVYPREIVKEALRLNAAAVIFAHNHPSGIPEPSQADKVLTQRLKEALALVDVRSLDHIIVAGQRTVSFAELGLL
>UniRef90_UPI0021149202 TonB-dependent receptor n=1 Tax=Pseudomonas sp. LD120 TaxID=485751 RepID=UPI0021149202
MDNLSLTLGNRFDHSEKYGNHNSPRAYVVYHPHPDWAVRGGVSKGFRAPSLKEGSAGAATESRGRGCGSLRPLGYVTGSCWMAGNPNLMPETSTNKEIGVAFEHDGWEAGLTYFHTDFTDKIEYGPLGQYQGRWWTMLENVDKARTRGWEGTTRVPLGDSVTWRTNATYMLESRNLSTGEDLISSPKLSAFSALDWQINDRLSTELSAQHVGKQRGMGNDFVQSYTTYDLTANLAVTKWLTLNGGVQNLMDKDLRDGSTNFYVPGRAFFAGATTYF
>UniRef90_UPI0020420B8D Na+/H+ antiporter NhaC n=1 Tax=unclassified Staphylococcus TaxID=91994 RepID=UPI0020420B8D
MGKKSENSDKNHKTKKPLGLTSALVTLTIMISTMLFTVAVLEKEPHIPLMIGTAVAILITMLHGYEFSEVEEMMYKGIRHALPAIVIIILVGLIIGSWIGSGVVATMIYYGLQLIDPRFFLAVVLILCGIVALAIGSSWSTMATVGVASMGIGISMGISPGMVAGAVICGSYFGDKMSPLSDTTNLASGLTDVDLFEHIKHMFYTTIPALIIAVVAFFFMGLQFGGKHFDTKKVEGILTTMQDNFTISPWLLLIPLIVILLVVVKVPAIPAICVGIILGFFAQIFVQGDSLTDALTALQTGYKIDSGNKMVDELFTRGGLESMFYTISLTLVAMTFGGVLEYSGMLSALINVILKFAKSTGSLIASVIVSCIGTNFTCSEQYISIIVPSRMYASTFKEKNLHPKNLSRALEDGGTLTSVFVPWNTCGVFIASTLGVSVMEYAPFAIVNYLVPIISIIYAYIGFKIVKLNDDRDTSLKEKPLSQSKPV
>UniRef90_U6R8E6 Transposase n=4 Tax=Phocaeicola massiliensis TaxID=204516 RepID=U6R8E6_9BACT
MRYALDIIKKWQFNFPILKYVTGKSGYNVKIRKLLDQIDREVKIFDKDSFDNIYNALYTMGSSKLCRKTHLDMLTKVQVNMYVSGHHKEGSSAVKHNSSLILKDRFIFMCAAYKQLNVIEK
>UniRef90_A0A534PU07 MarR family transcriptional regulator n=1 Tax=Deltaproteobacteria bacterium TaxID=2026735 RepID=A0A534PU07_9DELT
MRLLWAVDHSLQSASKRMESTYGITGPQRLVVRIVGRFPGIAAGRVAEILHVHPSTLTGILKRLEARSVLQRRSDPRDARRALFGLTAKGRKLDSVKTGMVEQAVRRVLTRDGEKVAAAQEILAALAEELEIEE
>UniRef90_C4GAH0 TonB-dependent receptor n=2 Tax=Shuttleworthia TaxID=177971 RepID=C4GAH0_9FIRM
MSRADFRAENLGYLAQSQEIAGAVSGLNFGEQSGIVIIENVPQRSEDNGYKI
>UniRef90_UPI001F50FB05 type I restriction endonuclease n=1 Tax=Enterococcus faecium TaxID=1352 RepID=UPI001F50FB05
MIRVLGEGHNQWTYRPDLKSEEDLWVNLRQKIISNNQAELNDSPLTDKEFETIKTELLLRTKTPFEAAKWLKGENGMARITIEREDPQLGSASLILYSNQDIGGGISTYEVVHQIAKRGSNIEARDRRFDVTLLINGLPIVQIELKQVTA
>UniRef90_A0A061J7E0 Secreted protein n=2 Tax=Trypanosoma rangeli TaxID=5698 RepID=A0A061J7E0_TRYRA
MSPRRVCLSLQLHLCGAKLPFSLTSGGGCRYAHTGRPSTSFLWFSHKREKAARNVTFPPEATCSPSRAASKMSVVGGTLASSSSPPLLLDPPFTPVPGESQALRQRTNCGAPSFLLLYVCGTCKSPLFCSSEYAASSSLGQHSSGWPSFTAPVCNSVLQLRSLLQRSAVQEGGQTPLTATLAARGLRVEGEMRRQTRGGGCERLRPRTWREECLRDENKRSDPTVLEGCCTKCGRAVCRVVMERRRGVKYVVNPTAVNAELTECSDPGVASTPHPSQLPH
>UniRef90_A0A4Q8QWM3 Lipoprotein n=4 Tax=Bradyrhizobium TaxID=374 RepID=A0A4Q8QWM3_9BRAD
MLLRTCLAVIAALIVSASSAQAQAPTTHQTQPVQFRTLFKVLPDPRGEFVRQCAPHMLGRWAHPEAVCGCLHDYAAATVEDPDLREALLRGISETGVPTIETDWVPPSKQSEIGPTFTKIAKPTLQCMFDPATE
>UniRef90_A0A7W2L3H7 NADH:quinone oxidoreductase n=3 Tax=Pseudomonas TaxID=286 RepID=A0A7W2L3H7_PSEPU
MNRFCLLVAGLAPLLGATSSVAQGTAIGMSMLVLILAHQVLLSPLRSQLQGARYWLASLLIVAALASCLQLVLRAWALPLALSLGDFPLLIGVQCLATDSLLPNQGRWRQLLRYLSGLLFISVLLGASRQWLAEGLGLHLASLPSGALLLLGLLLALYNCLRPGPARQGKR
>UniRef90_A0A2V8UVF1 PNPLA domain-containing protein n=1 Tax=Acidobacteria bacterium TaxID=1978231 RepID=A0A2V8UVF1_9BACT
MAGVWPKRYHFVDGGYYDNYGVATLVEWLEDVSHAQSVQPEILLLQIRDSPENGPPRPAEGQAGFLSQMLAPFFTIFRFRDAGQIAHGNLEYCSRQSLETASGVLLSPGLTTPRR
>UniRef90_A0A839QHS3 Uncharacterized protein n=1 Tax=Paeniglutamicibacter cryotolerans TaxID=670079 RepID=A0A839QHS3_9MICC
MSKPRNKKNTARPALRAAPAPVVNQSTQRTPEQARGNGNVIVLAAVGATILLFWYFHLLVLNQMSDLSGGLAMPDQMMGGYSVADIEALRAAMNSDAIGQLNYVHKTAGMLFPLFLALTTMLVVNLHTVRGPVRWVLWAVPMLFAIVDLWENAAIDALFNGPLDPGAVSLASTLTTISWVLLFATAAVLVGVLIASFITTFKAKWSEAGLS
>UniRef90_A0A100YU56 IstB_IS21 domain-containing protein n=2 Tax=Atopobiaceae TaxID=1643824 RepID=A0A100YU56_9ACTN
MGIVGSMGDFHADTGRDGRETRPQVLITPEEAIARGFAREAPPPVRCAHCGRQLRPLGIPVFGSIAWVSHEPCECDGSVRERMEEEQRILEERAMERERRLDRSGIPLRFRRAAPTEAQCIAYADAISGSTSDGLFIHGPVGTGKTHNAAAVAIAASDRGLRTVFTSAIAIFSNIRETFDGGGSSKRALERYASCEMLVLDDLGKESSSRWSLMTLFTIVNARYEGMRPTVITSQYTLGQLRARLASTGEAETAAAIVSRIAAMCADVTLSGPDLRGDAWKPLGMQTMQRTCDVAKRSKLDNFR
>UniRef90_A0A7H8S915 ATP-binding protein n=1 Tax=Lentibacillus sp. CBA3610 TaxID=2518176 RepID=A0A7H8S915_9BACI
MVEALKQTNFTAEPGELIVVVGPSGSGRVHPDDCRRSSNAESWEVINKHNITQMKEKKRSNIRLHEIDISGIPIWSISDSG
>UniRef90_A0A834H4E1 Transmembrane protein n=2 Tax=Rhododendron simsii TaxID=118357 RepID=A0A834H4E1_RHOSS
MIEDRRGGGGAPHAAIFAVVVVAVVVISVVLGDQGQVLTDFIAELLSPVGLLLLPIGLLLVIVFLSSDAGSAFSGLFSTGEPDTIHRVSGSPVGVALFLALLLFLLYSRVSIFGGDDGSDE
>UniRef90_A0A830HN61 MYND-type domain-containing protein n=2 Tax=Pycnococcus provasolii TaxID=41880 RepID=A0A830HN61_9CHLO
MSTGKDVSLVMELCHSSPLGHVVLHEVLRTTVANPDAWPALFPAEERSDGDDDDARHCQQPWNRAISLLRTMSHVSQLARSVATADALWKPAVHRLFEEKAFVCTEALKLKEEGKWRKAYFAACRRVREPRLTQGELCSINFHKRMKKCAGDAWLLRDPYWVTHGARCATMRFLDDGHAETSGEQVSEAAVPTNDEGANERADTAVDNGAPTTLAQLHPPPGAVSTRRKWRFSETGGGRGGPLGAFVRLSDGVREFPTFVVSFHRDTWSPYLESCWAVAASWQLKPEGEDSCMDDANLAISVDAQKAEALAYNCGLPMPEVRSPLEMKNAIAEILEKRDEDQRRLLHAMGIQDEEDDEDNRETTAVEEHDVATTSAGASATPTNSTTTNFDAIIQANRDFLSSFDSRWNAVKRRFDRAINRSIATIALGMTGDVDHAEALLTGSQARRSGGGADERRFEEDEEEQ
>UniRef90_UPI00207B9FB4 hypothetical protein n=1 Tax=Streptomyces hygroscopicus TaxID=1912 RepID=UPI00207B9FB4
MCGICPSLRLPGGAFDVHLRPSAACPFDASTGHRFTEAGVPVCVHPERVGLPAAEYATAGLPLPWETPPPASPDEVAVWVRAALDAAPPDACAEVIERATEILRAADPELDVVAVLRTALS
>UniRef90_A0A386HU81 ATP-binding protein n=3 Tax=Arachidicoccus TaxID=1769012 RepID=A0A386HU81_9BACT
MPELIVGRDAEKKILKEVLDSKEAELLAVLGRRRVGKTFLIRNYYSKQLVFECTGMHEVSLMEQLSNFSNALQQAMKLQVPLAIPDSWLQAFTFLSDFLQAKPEKQPMVILFDEFPWLHTPKSGFLAAFGHWWNNWASRRPQLKVVICGSAASWMTENVLHNRGGLHNRVSRNIRLLPFSLKETEAYLVSRGISLDHYQILQLYMAMGGIPQYLKQVGRGESATQVIDKLFFEKGGMLKTEFDVLYRSLFNNASHHESIVRQLAKRAKGMSRAEVIKACGLTTGGTTTRLFEELEQSGFISQSIPFEKTSRDAIYKLLDEYSLFYLKFIDRARATGTGTWHKLAQGQSYNSWSGYAFEAICQKHIQQIKEVLGIGGVYTEASGWRYTSKTGETGTEIDLLLDRQDRCINLCEMKFSGQEFVINKKYASELDNKVNVFKEQTGTKKTIFLTMITTYGTKQNIYYTGRITSEVKMEDLFR
>UniRef90_A0A6I6M0J7 PEP-CTERM sorting domain-containing protein n=2 Tax=Pseudoduganella flava TaxID=871742 RepID=A0A6I6M0J7_9BURK
MPMKRLATIAVLGAALTAAFASPAAHAATSVATLSGLHVAIIDLTPDDGVAPSLTFMSTGGLVSAGVGTAGGMDTVTDFLRSGNVTAHNAIGGTASVAALYEGQVQAMGSVGNYGDFISQSWLYSNFTLGANTQLVLTGHASLGTDFAAGNPNNVGSASVYIEIVDDQDGGGISLMETYSNEVTSYTAGPVGANDDFTLTFTNASANALLARMTLSAHAEGLVSAVPEPSTWLMLGAGLALTGTLARRRRAQQAN
>UniRef90_E0RVU6 Flavodoxin/beta-lactamase domain-containing protein n=3 Tax=Butyrivibrio TaxID=830 RepID=E0RVU6_BUTPB
MNGVKKVTDGIFWIGGSDRRLERFENIFPIPEGVSYNSYFIDDDKTAVFDTADITISDQYLENLKDCLDGRKLDYLVVLHMEPDHCSLISTVTGLFPEVTVVGNAKTFQIMEQFFPEAAGFNKLEVKEGDSLSTGNHNFKFVTAPMVHWPEVLFAYDDTSKALLCADAFGTFGALDGGLFADEYDFEKVFLNSARRYYANIVGKYGMQVQAVLKKAQGLDIQMLLPLHGPVWRKDIAWFIDKYQKWSTYEPETEDIVVIYGSLYGHTASAAEAVAASIRNKTKAGVKVYDVSGTDVSYLIGEVWRCKNIVIMCPTYNNGIYPPMESFIADMAALGVQNRSFALAQNGTWAPVTVKLMTEKLQTLKNVTILEESLTIKSALHKKDTDSLEAFTDAIVKA
>UniRef90_UPI00034ADB16 hypothetical protein n=1 Tax=Wolbachia endosymbiont of Wuchereria bancrofti TaxID=96496 RepID=UPI00034ADB16
MLTEISIDDLVRAKPMAGKKTVVSFTERENIREMPNKPQKHKFIANIIYSNTSTQTGDCILKFHPAA
>UniRef90_A0A3P8ZCD7 calcium/calmodulin-dependent protein kinase n=1 Tax=Esox lucius TaxID=8010 RepID=A0A3P8ZCD7_ESOLU
MATIVTSTRFTDEYQLYEELGKGAFSVVRRCVKKSSGQEFAAKIINTKKLSARDHQKLEREARICRLLKHPNIVRLHDSISEEGFHYLVFDLVTGGELFEDIVAREYYSEADASQCINQILESVQHIHQHDIVHRDLKPENLLLASKMKGAAVKLADFGLAIEVQGDQQAWFGFAGTPGYLSPEVLRKDPYGKPVDIWACGVILYILLVGYPPFWDEDQHKLYQQIKAGAYDFPSPEWDTVTPEAKNLINQMLTINPSKRITADQALKHPWICQRSTVASMIHRQETVECLRKFNARRKLKVRYFLYLYMSPPSFLTPPFCLNPVIYIFSLFTPLSLLGSDPHHNAGVKELLRWVCLPPSLQLQSGGRSELYSILGSPSIVNTILREGSTESCNTTEDEDMKEMETRGGLRDGDSQYRHSRGENGFYIAVSLNFCLNSSPPDLLSGFLFLARKQEIIKITEQLIEAVNNGDFEAYTRICDPGLTSFEPEALGNLVEGMDFHKFYFENLLSKNSKPVHTTLLNPHVHLIGEEAACIAYIRLTQFVDAQGRPRSSQSEETRVWHRRDSKWLNVHFHCSGAPAAPLQ
>UniRef90_UPI001A9C264E hypothetical protein n=1 Tax=Intestinimonas butyriciproducens TaxID=1297617 RepID=UPI001A9C264E
MRIIENADKEFAAEMHKAVKDNNGYCPCFIEKTPDTKCMCKEFREMEEGACHCGLYIKVK
>UniRef90_UPI0003B3D06B CCA tRNA nucleotidyltransferase n=1 Tax=Flavobacterium antarcticum TaxID=271155 RepID=UPI0003B3D06B
MNYSKDLQNPIFDVIAKASEQLNVESYVIGGFVRDLLLNRTAKKDIDIVAVGSGIELALKVSELLPKNPKVQVFKNYGTAMLRFEDTDIEFVGARKESYNFDSRKPLVENGTLEDDQNRRDFTINALALSLNKTNFGALLDPFNGLVDLEQKTIKTPLNPDVTYSDDPLRMMRGIRFASQLDFEIAAESFASITNNKDRISIISGERIVEELNKILMTDKPSTGFLLLYKSGLLDYILPELTDLNQVEEIEGHTHKNNFYHTLEVVDNIAPNTNDVWLRWAALLHDIGKAPTKRFTKKQGWTFHGHEFLGGKMVKKIFERLHMPLNQKMKFVQKMVIMSSRPIVLAQDEVTDSAVRRLVFDAGEEVDDLMTLCEADITTKNPSKFKKYHNNFNLVRQKIIEVEERDHVRQFQPPISGEQIMELFNLKPGREIGTLKESVKEAILEGHIPNEYEAALEFVTKKALKMGLNKD
>UniRef90_UPI001912B9C1 DUF86 domain-containing protein n=1 Tax=Cyanobacterium sp. IPPAS B-1200 TaxID=1562720 RepID=UPI001912B9C1
MVFALVKAIEIVGEAAGKVSKEYQINHPEISWTAMISMRNRLVHAYFDINKKILWQTLKKDIPELVNILTELLDE
>UniRef90_A0A8J2SN30 3-isopropylmalate dehydrogenase n=1 Tax=Pelagomonas calceolata TaxID=35677 RepID=A0A8J2SN30_9STRA
MKLSLALLAACSDALIAPPAPKPTKTQLRAVAAPQDSYKITLLPGDGIGPEITTATVKALVAAGKTKGVTFDFDEQLLGGCAIDKEGTPWPDKTLKSCQAADSILMAAIGGPKWDGNPRELRPETGLLAMRQQLGLFANLRPAKAIPQLLDASSLKREVVEGVDIMVVRELCGDVYFGKPAGIYTDDAGVRWGQNNMIYSEPEIERIARVAMDVAQKRQGRCCSIDKANVLDVSQLWKDVVIRVHGECGQGVELSHMYVDNAAMQLVRWPKQFDTIVCGNIFGDILSDEASMLVGSLGMLPSASLPSEGPGVFEPIHGSAPDIAGTDAANPLAMILSAAMMCQYDLLQPDLAKLLEDAVEAVLDAGYRTRDIVNEGNADETLVGCKEMGDLVAAKVAELAA
>UniRef90_U4L0U5 Uncharacterized protein n=1 Tax=Pyronema omphalodes (strain CBS 100304) TaxID=1076935 RepID=U4L0U5_PYROM
MMVNSAAFADRQSIPLLS
>UniRef90_A0A8I0SUD4 Octanoyltransferase n=1 Tax=Magnetococcales bacterium TaxID=2026759 RepID=A0A8I0SUD4_9PROT
MVHPPENTHPYDLMRLGQMDYAQALAIQQQRVETLIAHGGPNLLMLLEHPPVYTIGRSGKSGEILDAIPTREHINIIATDRGGRVTYHGPGQLVAYVIRDLRPDTGRILDHVRRLEETIIGTLACFGILGTRERANPGVWVGNEKIAALGVRIRRGITYHGIAINRDPDLDHFSGIIPCGIRDRGVTSMARLGFKTTAEELEECLLAAFAKVFAARWTQ
>UniRef90_A0A3D9YY19 Heat shock protein HspQ n=2 Tax=Methylovirgula ligni TaxID=569860 RepID=A0A3D9YY19_9HYPH
MNVKPRKAKFGIGQIVKHRKYPFRGIIYDVDPVFANTDEWWLAIPEEVRPRKDQPFYHLYAENADTEYVAYVSEQNLLPDTSGDPVRHPQVEEMFTRADDGGYRVKTVRLN
>UniRef90_UPI001E452D4C zinc metallopeptidase n=1 Tax=Aegicerativicinus sediminis TaxID=2893202 RepID=UPI001E452D4C
MGIGLGYYILIGAIALVSWAVSAQLKSKFKKYSQVHLQNGMSGKEIAEKMLADNGIRDVQVISTAGQLTDHYNPKNKTVNLSEPVYHQRNAAAAAVAAHECGHAVQHATAYSMLQLRSKLVPVVSITSQMSQWLIIGGLVLGAAAGVGLGYWVAVAGLAMMGMATLFSFITLPVEYDASNRALAWLENKHMLNREEHAAASDALKWAARTYLVAAIGALASLIYWALQIFGGRD
>UniRef90_A0A5C5TAF6 Sorbosone dehydrogenase family protein n=1 Tax=Reyranella sp. CPCC 100927 TaxID=2599616 RepID=A0A5C5TAF6_9HYPH
MRPIIKKVLLGTVAIIAIVAAAAAFLIRGDTAKLPDEASVGPNPTLPQPTRSLVPTVSIATARGWPQGAKPVPAAGLSVQAFAAGLDHPRWLYVLPNGDVLVAETNAPARPQEGRGVKGWIADLLQNRAGAGVPSANRISLLRDADGDGVAEVKTPFITGLNSPFGMALVGQDLYVANTDAVVRFPYTVGATRIDAPATKIADLPAGPLNHHWTKALIASPDGAHLYVTVGSNSNVGENGLDNEARRAAILRIDRATGQIGVFASGLRNPNGMAWQPETGVLWTVVNERDELGSDLVPDYLTSVKEGAFYGWPFSYWGQHVDARVVPPRPDMVAKAIAPDYALGNHTASLGLVFGAGTSLPAMYRSGAFIGQHGSWNRKPRSGYKVIFVPFASGRPSGAPVDVLTGFLSDDDAAFGRPVGVVTDRTGALLVADDVGNVIWRVTSIGR
>UniRef90_A0A1S1R6I4 Secreted protein n=1 Tax=Frankia sp. BMG5.36 TaxID=1834512 RepID=A0A1S1R6I4_9ACTN
MVEAATASGAGIAKAADRAGPVLDRLDDALVPRTGRALEAVVGAAAATSRTVTAGLLRLALRTRLLPGPPEPPAPAPRPRTADGGSGPDAGSSPSPAAARDASASAVAEGPSVGRALLERGARIAVLGLVAMIVLSAAAALLPGMDGQPRTEPASPPPGGAPAGQADAAVVPSVTIGPTAGESTADYVGGADQSLVALAEAAPEADLLAVVSLNDYRTPDGLQALLATYRVTQVFFTVPGSGTVHQAEVRTPVDDVLAALAAQAAESSRRAATATDPAARERASAQAQTMRGGRSCSCLFAAVVRASAARLLALRQDSSVRVIDAAPPATLENAVRFIPVTPESR
>UniRef90_A0A8B6C0H3 RING-type domain-containing protein n=2 Tax=Mytilus galloprovincialis TaxID=29158 RepID=A0A8B6C0H3_MYTGA
MTDIPPNVSLPLLGIGLISLLLSFIFCIYMWRLRCRAREERGYNRIQFKEKNKKFSSMCAVCLEEFRNYEYIAICRCKHCFHMNCLLQWLKHRNFCPMCKATVQRVPSGERSSLIIMPQQAVPSTSNEPPVEGAQNV
>UniRef90_Q0RVU7 Biotin carboxyl carrier protein of acetyl-CoA carboxylase n=1 Tax=Rhodococcus jostii (strain RHA1) TaxID=101510 RepID=Q0RVU7_RHOJR
MSDTHTLKTSIPGIFYRRPSPSEPVYVEVGQEVATGDIVGLVEIMKSFHSVPSDLAGTVVRFLVEDGAEVSPGQDIVELARS
>UniRef90_A0A8H6B9I7 HAD family hydrolase n=4 Tax=Dekkera bruxellensis TaxID=5007 RepID=A0A8H6B9I7_DEKBR
MRPRMPKLITADAYGTLYAPRFSIPKQYNDVTARFGVVIPENQLEKKWLNSYHTVKKTYPNYGKAAGLTVDEFWRKVLVRIYGKCQEHPEMIGMIIDKLGKKESYKVFRDFVSLAEWAVWEKEIPFCVASNADSGVTHLVIKEFGMETFLDSQDIYLSYDLELWKPNPEFFNRIIDDQLARLRGIRSTDPNYLEERRKLLQSSWHVGDEYENDVKCAMAAGMGAILVDRSITNPELAIQKRGERFYVVSSLDRVRQIFEK
>UniRef90_A0A5J9WI98 Phospholipase A2 homolog 3 (Fragment) n=1 Tax=Eragrostis curvula TaxID=38414 RepID=A0A5J9WI98_9POAL
MASVLAFSRCSLLLLLLLLATTASHALNVGNLLGTPPAGSQGCSRKCESEFCTIPPLLRYGKYCGILYSGCPGEKPCDALDACCMVHDHCVAAHNNDYLNTRCNENLLRCLDSVSPAGPTFPGNDCDVGRTKFVIRGVIETAVVAGKILHKRDDGH
>UniRef90_UPI00200ED720 hypothetical protein n=1 Tax=Serratia sp. arafor3 TaxID=2824122 RepID=UPI00200ED720
MMRYKDIPAEEQQNGPPNTDPASIMHTRLVIGDNVIMASDSCPADPTGATHRAYSLSIRSENVEQGGSITMPFQPAFWAKGFGMLTDKFGVNCRTV
>UniRef90_A0A2W6USA3 Glycosyl transferase n=1 Tax=Microbacterium sp. TaxID=51671 RepID=A0A2W6USA3_9MICO
MSKEPRVVLVAVPLMARSGVYRSTHDLVRAASAAGHQWQALIGMRPQASGDALATPGVREVPFDARGVGGISQIRALIDSVPEVRDADVIVSMITQTDIAVSRARAREDRGWIAWVRGKPWPAAGEQNLARRLLLRAWETRALRSADAVWATTPVLADEFASACQAAIVPAGIPSSRRIAHGEDATSPLVWAGRVDIDKRPELFSRIVELTGHPGRLYGDGPLKDRLASRRVTGLDWAGWRPSGELWSDASVFVGTSSREAFGRSAVEAAAAGIPIVIAREYGAAPLLFTDETLRRACVIDSADPEAWANAVRALLTDRQLRMAVSDHVHSNAQTLTIEASVDAAARRAAALLEGGCK
>UniRef90_A0A327NX72 ISXO2 transposase-like protein n=1 Tax=Algoriphagus yeomjeoni TaxID=291403 RepID=A0A327NX72_9BACT
MNIINFVQYFPDEESCEVYLKSYREKAGIRYKTCKSITKHYWFSTGKFFECSCCRRRSSLKSGTVMERSKLSLHVWMTAFMLMAATKKGFSCLEFQRQLGLCRYDTAFRLMHKIRVVMGKRDALYTLTDMVEMDEAYIGIATDKKVKENLKRGKGSQRKASVAVSAESIPLEDLETGKTSRFCGYYKMEVLGKVDGEHAEKFIKKNTSGEIVLFTDKNTAYEHIEDIVETHFTVISGKESTNDTLQWVHKAISNLKRKLLGINHMITYKYLQNYLNEFVYKLNRRYFGDRLFDRLIIAGIYPYVQ
>UniRef90_A0A3N1WFC1 D-alanyl-D-alanine dipeptidase n=1 Tax=Erwinia sp. JUb26 TaxID=2485126 RepID=A0A3N1WFC1_9GAMM
MDDIQLTDIATSLPQVKIDLKYATADNITGQPIYCEHRCLLHPDAAAALVRSAHIAAIAGFTLLIYDAYRPQKAQMNLWQACPDPDYVIPVSQGSNHSRGTAVDVTLIDEQGSIVDMGSGFDEMHERSHPWHPSVSARALRHRLMLSAIMLEGGFKGIATEWWHFELPGAADYPLLTDIFDCYPPPSAA
>UniRef90_A0A7J3I7R8 Na+/H+ antiporter subunit C n=1 Tax=Ignisphaera aggregans TaxID=334771 RepID=A0A7J3I7R8_9CREN
MSDLLISLAFRTAMIAFVFNTAIALYGVLSRPSLIKKFLCLIMFTDSINIFAIFIGFRYIPGSYPSPPILEDIPTSVRDIERLISMAVDPLPQAMILTAIVIGIACNMFLLSLILMYYKHYGTTDIHVTEEAEAYEETLE
>UniRef90_UPI000C1F926A ATP-binding protein n=1 Tax=Limosilactobacillus fermentum TaxID=1613 RepID=UPI000C1F926A
MDFLKFEDLSFSSAFSEPKEDIHLEYKTATWKLPKNFWETVSSFANTDGGLIVLGVKEDKDNHKYEITGVDDPIVVRQEIFNGNSNSECLSSPVIHDSDVKLVDCFDRTIIEVLVHPEQYNKRPLEAHGIAYVRTDDGDRKATEEQLKYFLVEHQQEIDTRLLRNFDLEDINSLDLDEYVTVLRKNTNTRYKDLESLAFDLGVFRRDRTSNGKDRLLTEGGLLFFGKYKVKSKMLV
>UniRef90_UPI001C270FE8 TRAP transporter substrate-binding protein DctP n=1 Tax=Desertibacillus haloalkaliphilus TaxID=1328930 RepID=UPI001C270FE8
MKSFFVIFCLFIISIVTTACVQDGSNNNGSQSSENSEDTITLRVSSSLSPQNGWWAGFFIPWMESVEEKSEGKVQFDYFTAEELLSVGEELQGMREGTIDIAAPLWTVYDPQRFPLSEVTMLPLTDSDPMMASLAYSELVQSELELVDGKTYADYEFVEKGIKALPIPTTEQYVISTKDYEFNTIEDFEKVSLRSPSRVHEVFANEVGINTVTLPSTELFDSVNRGAMEGSFFSISDWTGYGMQDVFNYTLEGINLGHYSGVWAMSEDKWNSLPKEIQDIMIEAAIEQIPGGAQLWMDRSIENKENSIEDGGVFATTADLEPEAEEMVLQGMENTWYEWIEMTESNGHPGTQIAKLWRDLIVEQGGTVPESIMNLE
>UniRef90_A0A140IHG3 Sodefrin-like factor n=1 Tax=Cynops pyrrhogaster TaxID=8330 RepID=A0A140IHG3_CYNPY
MRAIIATVVLLQALITGDCLLCEQCFALQTSSCSGIFKQCSPDVTHCVAGLENNTLGTHVILTAFKDCLDPSQKAACGREVSFTAPAASLWTSRTCCDSDFCNGGDVQVPPPDDTPNGYICEGCGSDQSAKPCTATEYVQCSGKQNACGTFYGTASRPGKTGEEYTFKGCTTQDFCIAGIFHMAGMQAYDYYVLKCSPALKV
>UniRef90_UPI0021C67275 ABC transporter transmembrane domain-containing protein n=1 Tax=Mycoplasma gallisepticum TaxID=2096 RepID=UPI0021C67275
MLGVAAVGFTFGYLGGRSIIIASVEFAKQLRVNIFERYQSFSVKNTDKFEKASVLTRMTTDINFIHQSIQSGRTAIRGMSVFLFSLVLMFVTS
>UniRef90_A0A5P2U3Z0 MFS domain-containing protein n=2 Tax=Kluyveromyces lactis TaxID=28985 RepID=A0A5P2U3Z0_KLULC
MAVKEEVLGKQAVSTHAVAANEHDLDEKQQEEFLNEYGLPDKLRFTRSLVLRKTEILAQQYDSWYWKAVLLFSVFLCSYGYGLDGSVRSVYTTYATNSYNTHSLLSTISIINLVIGASAQVFFARLSDVFGRLTLLIVATVFYSVGTIIQSQAYDVQRYAAGAVFYNVGLVGVVLQVILILSDFSSLRWRLFYTFVPSWPFIINMWVSGNVVDAANPLENWSWSIGMWAFIFPLTCLPLVCCILHMRYRASKTEAWRHLKVEKTYYQSHGLLQTLIQLFWKLDVVGVLLLTVTLGCILVPLTLAGGVSQKWNNPHVIAPFVLGFVLLPMFVVWESKWALDPIAPFKLLKDRGVWSALTIQFLIYFVYQMAVGYLYTILVIAVDESTTSATRITSVYSFTAAVASPFFALVVTRSKRLKPYIITGCSLWMVAMGILYHFRSGKDSDKGIIGGLVLWGLTSTLFTYPVTVSLQSITSHENMASVTALNYTVYRIGGAVASAASGAIWTQLLYKKLLKEMNGDAALATAAYGSPFDFILDYPWGTPTRDAMVESYRYVQKYEVLVALVFTVPMFILSMFLRDPPLTDDQAQENLKEGEYINTEHDDPIAAWMDDKWTRLTGGRKKE
>UniRef90_A0A2N6BMK7 Serine hydroxymethyltransferase n=2 Tax=Deltaproteobacteria bacterium TaxID=2026735 RepID=A0A2N6BMK7_9DELT
MILIASDHGGFEVKEAIGEHLKARGLEVEDLGTTNTDSVDYPDFAKKLARRVADEPQSKGILICGTGIGMSIAANKVPGIRAALVADTFSAKMAKEHNNANVIAVGGRTNTPEEAKSLVDAWLDAEFEGDRHARRLNKISQMEVSCGVARSISAEDPEVFSAMMGELRREEDTIVLIASENYASTAVLEAQGSVFTNKYAEGYPGARYYGGCEFTDKVETLAIERAKKLFGAEHANVQPIAGSAANMAAYYALINPGDKVVSMSLAHGGHLTHGAKVSFSGRLYDIVHYFVEEDTGKIDYDKLAELVKREKPRLVVAGASSYSRTLDFQRFREIADSVGAYLMVDMAHIAGLVAGGSHPSPVPYADIVTTTTHKTLRGPRGGLILCKAKYAAAVDKAVFPGLQGGPLVHTVASKAVAFREAMTDGFKQYADMVVKNAARMAEGFKKAGYDVVSGGTDNHLFLLDLSSRGLTGDAAEKSLDRAGITCNKNAVPYDKLPPTVTSGIRIGTPILTTRGMGEEEMDKVVELIIRVLENVGDAKVEASVREDVAALCRQFPFYADFLAD
>UniRef90_A0A2V8W5K0 DUF393 domain-containing protein n=5 Tax=unclassified Acidobacteria TaxID=305072 RepID=A0A2V8W5K0_9BACT
MISLVSEYTDGKGRHARGWLFFDAECKFCTRIARWLAPILEKRGMALAPLQDPRVGALLGLAREDLMREMQFLLSDGSRFGGADAAVALAREIWWGRPLVWISKIPGMMEILRKGYHWVAASRSCAAVSCPANEPSPRV
>UniRef90_A0A0A9RIL1 DUF5753 domain-containing protein n=1 Tax=Arundo donax TaxID=35708 RepID=A0A0A9RIL1_ARUDO
MQRVPLQVPLHHPPGQGHLLAHREHERLAIARRTAGRPANPADVLARVTGVVEEHHVVHVSKVDAS
>UniRef90_A0A1Z4M0Q0 Outer membrane efflux protein n=1 Tax=Calothrix parasitica NIES-267 TaxID=1973488 RepID=A0A1Z4M0Q0_9CYAN
MIAVAALNTQSAKADSNSLRQMQTIPNYSIPTSEETTGNFQLSVPSEVIPPDDVEKQLTSDESKSVLDALSPNPNPLQYPTRPEEVQIQKIQAITLEQALELARRNNRELQVGLLELQRAQAAVKESQASLLPNAGLSAEVARQQSAQNQLAVESTNIGTDEATTAFNGSLQLSYDLYTGGRRNAQIGQAKERLRVQELAVEVLEEEVRLNVSTEYFDLQQADEEVRIANAAVVNARASLRDAQALEQAGVGTQFDVLRTRVNLANAQQQLTNAVASQQVARRRLVTRLSLPQSVDIAAADPVKLASLWNLTLENSIVLAYQNRSELQQQLAQRNINLLDRRLALSALKPQVSLVASYSLLDQFDDSVSLTDGYSVGVQANLNLFDGGRAKAQAAQAKANAKIAETQFADTRNQIRFQVEQAYSGLQSNLENVQTSNAALEQARESLRLARLRFQAGVGTQLEVIDAENALTTAEGNNIRAILDYNRALASLQRSVTSRAIP
>UniRef90_A0A0W0Z402 Type I site-specific deoxyribonuclease n=1 Tax=Legionella spiritensis TaxID=452 RepID=A0A0W0Z402_LEGSP
MKKTFDKLDKLKLEQLDNPNYLPKIQNFLPQLKSDFEQHVAPGEFDPIKQADNWLEVVRNLANNKHPAINKDSLKKIEKIYDLLGGQDEDAFRLLDMYQSIDTVNSEQVASKTKKIVADYRAHLANKIEEKGFIISSEDNSIVSLNEGEITPKQQKLLNRYEAISALDERIHNKRILDESDKSEAKQALDICLKNKPEWSEKPFLQKLTDVLSVGIKPLYKAFFSKETRLKEELDQVISGPKR
>UniRef90_A0A2Z6DW79 GTPase HflX n=5 Tax=Proteobacteria TaxID=1224 RepID=A0A2Z6DW79_HYDTE
MFERPRFGERAWLVQIDFGEGRVAERLEELRQLVVSAGAEIVGALTVRRAKPDPATFLGSGKVTELAALVREHGADLVVFNHALSPAQQRNLEQALACRVVDRNTLILDIFALRAKSAEGKLQVELAQLEYLSTRLVRGWTHLERQRGGIGLRGPGETELETDRRLIGARVNRLKARLQRLEKQRATRRRGRQRYGVPQVSLVGYTNAGKSTLFNALTKAQTYAADQLFATLDTTSRRIWLPQTGNVVLSDTVGFIRDLPHDLVAAFHATLEEVKEADLLLVVSDLASPDNDAQREAVTETLRQIGAESVPVLEVGNKIDLLDQSPEVVRDGCGTIRRVTVSAATGAGLELLRAAIDERLHTATNASSGEKNTETNSASTQDHTEPFWEPLEREVSPCP
>UniRef90_A0A2M7SV67 PolyA_pol domain-containing protein (Fragment) n=1 Tax=Chloroflexi bacterium CG_4_10_14_0_8_um_filter_46_9 TaxID=1973937 RepID=A0A2M7SV67_9CHLR
MDLASKINSYFPKELLELLQDTSAEANKLGQRVYLVGGIVRDLLIGYPNFDLDLVTEGDAIELANRIARMSEAKLVIHPRFNTAKIKSGDFAIDIATARSETYASHGALPTVTPCPIEKDLFRRDFSINAMAISLTPEHYGELLDPYHGKDDLDAHLIRILHPGSFTDDATRILRAIRYEQRLGFNLEHETAQLLKRDISMLNTISGDR
>UniRef90_A0A0G1DQW2 peptide-methionine (R)-S-oxide reductase n=2 Tax=Candidatus Magasanikbacteria TaxID=1752731 RepID=A0A0G1DQW2_9BACT
MNDQEFREKLTQEQYHILRERGTEAPFSGKFLDHKEDGSYTCAACGNVLFASGAKFDSHCGWPSFDRDMGEGTVTFLDDTTLGMTRTEVRCAQCGSHLGHIFDDGPTETGKRYCINSLSLGFQSVDKR
>UniRef90_UPI000FD1EFED acyltransferase n=1 Tax=Mesorhizobium sp. M7A.F.Ca.ET.027.02.1.1 TaxID=2496655 RepID=UPI000FD1EFED
MTHQFGMKPRLVGLDVARIFAALAVMVFHLGFWSWAVKGSTPQSVVQGAAAFPELAPFTFWGRFGVEIFFVISGFVIAFSAASATPWQFIRARFLRLVPAALICATMTFVVAITIGLLPTSTLVDRYIRTLTFNPYAPWIDGVYWSLGVEISFYVLIAALLMIRRFSWIEPVAAIIGTASSFFWVWILAATLGYVHPPVSMIDGRSMDLLMITYGAYFATGVFLWSSLMIKPNAARSVALLLFVAGGLAGIYMNAPAYFAKIIDPSLRCVPAVVWLFAISFIVLATRFDYLIVSRMKPGMLAAIRLCGMATYPLYLLHDIIGAAVLRMLVLQDIDRFVALTYTFALMIALSLAVTLAVEPPFRKAISRVIDFRVLRPTTAEASQKA
>UniRef90_A0A2E6BIU5 Dephospho-CoA kinase n=4 Tax=Gammaproteobacteria TaxID=1236 RepID=A0A2E6BIU5_9GAMM
MTQTLKSERLIIGLTGGIGSGKSAATRFFSELGITVVDADELSREVVKPGEPALQAIVAHFGDGVLLDDGQLDRRQLRQRIFDDHNERKWLEQLLHPLIRQEIITRLTASTSPYTLLSSPLLLETDQQRLCSRVLLIDAPESLQIERTIIRDNSSEATVKAIMESQMARHARIERADDIIVNDGDLNQLKDAVAAQHQRYLEMTQ
>UniRef90_V7F2Q5 Stm1_N domain-containing protein n=1 Tax=Mesorhizobium sp. LSJC264A00 TaxID=1287321 RepID=V7F2Q5_9HYPH
MPETPKDKDLEKGDEVLRRLLKTPPKPHGDKAAKEKPEARPAKRSQNAKAK
>UniRef90_UPI0018E26317 uncharacterized protein zgc:113436 isoform X1 n=2 Tax=Cyprinodon tularosa TaxID=77115 RepID=UPI0018E26317
MLSVDSLQVAEEEMVESSSNKLSDIYTFVAKGSLPLTMNPLQKKNFKRYAKKFIFEEGKLFYVGPKKEEKREVVIEAKRKMQIFLDSHLSDVGRHLGQKKTVHRIQSRFYWLGIIKDVVEWIKVCETCRQTERNKNLARTVRPARVEAPWDIVGIDFIGPFTETRRGNRSVVLFIDYFSKWPEAFPVQTVDPLSVARCVSNCIYRFGATKTVVCAQKPEFCEEVSKVLHEKWKLVQRVSALDQPQLNPLHDCSGPLLKEAVEQMVAEKQADWDDFLDPVLFLFRTSSNPTTKFAPYSLMFSRKANPPGETRLTPPQYDEPETDGCREQDGCREQDGCREQDGCREQDGCREQDGCREQDGCREQASTCMNIMREQQNAVKQMVIANMNAAYKQEKKRKKAKRRMQSASPATLKVTEPLFAAGDSPSAKKVKDSLYLSFPVETVLATEPNGAEGVKTELAYRLAQPDVH
>UniRef90_A0A672QD87 Serine/threonine-protein kinase VRK1 n=3 Tax=Sinocyclocheilus TaxID=75365 RepID=A0A672QD87_SINGR
MPPKSKAGGAKKARAPTKRKLAEEFPPGEVLTDNAKKKWKLGSPVGQGGFGLLYLANEDSSGSVGAAAPYVIKVEPSENGPLFSELKFYMRAAKPDLIGAWMKSRKIDYLGVPKYWGSGFHEKGGKRYRFMVMDRFGTDLQKKFEGNEKKFPRKLVLQLGLRLLDILEYIHDHEYVHADIKASNLLLSYTNPNQVYLVDYGLAYRYSPEGVPKEYKEDPKRCHDGTIEFTSIDLDFDVSTNDAGPPSIKTPKRKKAEEKGQSADETEGTPAKKRRAPQKKDVNGAKKTASPAKRPAKKEAQASSEPAVKKSRGRPKKNS
>UniRef90_UPI0013C2E1C0 hypothetical protein n=1 Tax=Trinickia diaoshuihuensis TaxID=2292265 RepID=UPI0013C2E1C0
MVAVGNGKGAAGRGNGKSTVVDEAAVVAGLIFLKTIPCSCAPAATVHAAGGAALFEEDDEDDEDAADDEDAADDEDAADEEDAADEEDAADEEDAADEEDVADAAERGLNPGEPG
>UniRef90_A0A2X1W8T8 Ovule protein n=1 Tax=Photobacterium damselae TaxID=38293 RepID=A0A2X1W8T8_9GAMM
MCQKLYKLLIYYYSVCYFRILVRFTVLKNHGYLFAVKFKKSCTSGWLNLLSGSDYNRDMITLVLISLRIY
>UniRef90_UPI001FFDE7FD SusC/RagA family TonB-linked outer membrane protein n=1 Tax=Sinomicrobium weinanense TaxID=2842200 RepID=UPI001FFDE7FD
MKAMMCKRKTIYVLSAFFFYCQFMLAQQKTVTGVVTDADDGMPLPGVNIVIKGTTKGVSSDFDGNYSIEAPEDAVLVFSNLGYASREVPVAGQSTITITLSADAQELEGVVVTALGIKRETKRLGYAMTEVKGDELAKTNTVNPVQALQGKAPGVSIGSSDGGLFGNSKIQIRGVSALNSNNNQPIFVVDGVILDNNVSDSSADWEGNPNDYGNMLKNLNPDDYESISILKGAAATALYGSRGLNGVVLIKTKDGSGTRGLGVSVKQSVGIDHVYRQPDIQYEYGVGTRAGAVSYGERDANGNYYRFSNNQFYTNDDGIPTLIEHPSSLGYGPKYDGRPIIGYDGEMTTYSPAKDNLLDAYDTGWNTNTSVSLSGGHDKGNFFLSLSHNDRSGTLPNNSFKRDALLFSGAYQLADWLRADASISYTTSKSKNARNDLSQFFINGTYANGYNPSKYRQRQFWQASHGGIPNSDYSDKYAYVPGKSIWFEYSMNNAGSEEQVTRPIVRLTADVAEWLSITAEGNMNYYTTKYERKDWGSGFLNDGGEYQMRHNTDKSYTGKLTANFQKDLTPDITAQLLVGGELWKQEKSETDVRTDGGLIVPGQFFLENSKRNLISSGKVYGTKQISSLYFLSSFGYKDQVFLDITGRNDWSSSLVYTNGEGNYSYFYPSVSSSWLFTQTFNTPDWFTFGKLRASWAQVGSDTDPYAINKGYGIGRYQMDGDKFIYTNDITTTLVDKNIKPERKNSYEIGMDIRFFNNRLGVDFAYYNEIIKNQIGEIPFPQESGYNNYFTNIGTLSNYGVELSVTGTPVKTKNFTWNTTFNYWKNTTKIKDLHEDYGEYKALGGDVAYGNFRIGSVAFKGGEYGVLMSDSSPKKWQSDNPDDPRNGMNVLKWVDSDRGAFYERSYEPERVGKVQPDFEGSLNNSFTYKGISLSVLLDARFGGHIASYSNRYGTSYGWLETSLRGRSPEHGGMTWTSQYSDSQGQQFNDGVIPNGVFAEGQTVTAPNGSTVDVGGLTYQEAMDNGYVEPTHASYFNYYTNSWSDGVVNDDWFSEVKYIALRNISLGYNFPKSVSDKLGAKNFYVSFNARNLGYLYNSLPNNLNPESFRGTSSSDSFRERGFIPYTASYTMTIAIDF
>UniRef90_X1TZX9 KTSC domain-containing protein (Fragment) n=1 Tax=marine sediment metagenome TaxID=412755 RepID=X1TZX9_9ZZZZ
GFEYDPKVKDVFRLLMTPERYNTLYHRSKAAKTRIDRS
>UniRef90_A0A2E0MWS0 Asparaginase n=5 Tax=unclassified Euryarchaeota TaxID=115531 RepID=A0A2E0MWS0_9EURY
MTEQDRPSSVSHGRPGSGIYPSNPLGEKHEGIPTGRDVEWEPLVDFRRLDVSENTIHGAISWVHGDEVIHSFGGNVLVYGRSMMKPLLMKIFTDVLDDVLTDEQKAIACSSHNGDTEHVATAQSILTESEWGLMQCPLDVPLVQFGRQVRRPRRWFHTCSGEHAALLRALRLKGINRAGYTLPTSSWFQDFIDLLNSMLHPDWKPLRIAKDGCGLPTVSNTVDELATLFSALVRTKDDDWIWDAMCKHPDLIGGFNRLDSTIIKAGEGRVLAKEGADGLLGIAIEHDDWPKGLGIVIKIAHGWNSQATWYVARAVLGVLGIQLRNPYPLHRQKAFIVPGIVPEMYLKQLESVVTWDEWDPDQDRFQILENQDNLARNPHGNEGRM
>UniRef90_A0A348B110 Shikimate kinase n=1 Tax=Sulfodiicoccus acidiphilus TaxID=1670455 RepID=A0A348B110_9CREN
MQARAFGGISVVNAVPAWLGSTMAINLVVSVEIEEGDGREEGLIGYVLSYLRNAYSLPPLRVKVYSSLPQGGGLKSSSAVTVALIEAVSRLFNLRLDPPFLSAKLSLEGGFSLTGAYDDAFAAYRGGVSLTDNKSISLLKHLQPPEGLVFLVVPKEGRTADPRLLRRYSKTFEAIFQLALQGKLLEAMKINGVLVAEILGYDLSPIEVALSRGAIAAGVSGNGPSIFAACNEGDEGPVEDSLSRYGRVVRVEAVRIEGEDLQGQG
>UniRef90_A0A5S4GRQ6 ABC transporter substrate-binding protein n=2 Tax=Streptosporangiales TaxID=85012 RepID=A0A5S4GRQ6_9ACTN
MRRTAKIISVAMLAVAAAACAPSTAGNAPSTAATAKALPGPSLDANFDLEALVAAAKKEGSLLVYDSSGDIEEVAKAFTAKYGIAMEGVKSDTPQTAEKMIREHAADNVTIDAAMYEDGGVLVGQLAPQGVTQTWIPQDLKEQIPAENQNPLLALSKATVFAYNTKLSPGGCPVKNIWDLTEPEWAGKLVMQDPLGKPTVLSFFTQLDAHGNQALEQAFQAKYGKALKTEEKSAAYEWVKRLAGNRPVLTGSDEDISGAVGAPSATDKKIGFMSISKFRNNEDKGYTQSTCEGMAPFTGFSYPKYVAIASKSKHPNAAKLYVHFIMTEEGVKHEIGEGGISGNSTVKPLVTPAGLSDWQGQLFHTDPKGLLGDMQNRQTISDFWRVNKS
>UniRef90_A0A453IYK0 ADH_zinc_N domain-containing protein n=2 Tax=BOP clade TaxID=359160 RepID=A0A453IYK0_AEGTS
MALPTQGWGKTIILGVEMHGAPLTISSLEILHGKCVMGSLFGGVKPKQDIPILADKYLNKELELDKFITHEVGLKDINTAFDLLLQGKSLRCTIWMDK
>UniRef90_UPI0021183352 helix-turn-helix domain-containing protein n=1 Tax=Bifidobacterium longum TaxID=216816 RepID=UPI0021183352
MGEVYSHLSEEERQVIQIEVGNGASIRGIGAMLGRSPSSISREIKRNTWFPSNENESYRPVLLQCLFDRFGSVFPQCGLMVFPGVVIVSR
>UniRef90_A0A4R6PNK8 Sucrase ferredoxin n=4 Tax=Nocardia TaxID=1817 RepID=A0A4R6PNK8_NOCIG
MNPFEGMVCSAAAADLPLLGTAVHATGWLCIEHPGAWGRDVLGDEVLGPEITAELAARTSAAKVRPTLIRRPGRYEFTGTRTVLLASARPEGSWCVRFEITDLRELFDIDLHLVDGPAPEIDVPVDDPIVLVCAHGKRDQCCARLGRPIAAALAAEQPGRVWEASHTGGHRFAPAVVLLPSGLTYGRVDIPAARDLLAAADTGEVSLTGLRGRSCYPPIAQLAEVAVREQVQAPADALTVALDPTPTHDPTLAGAAVVTHRDGRRWRVTTRTASAPPRQASCNAKPKPAGYLEPVSIEQLPTL
>UniRef90_A0A7W0RJ01 DNA ligase (ATP) n=1 Tax=Nocardioidaceae bacterium TaxID=1871072 RepID=A0A7W0RJ01_9ACTN
MDLPVMPPLSPMLAKVAKTVPSPEAFEGGLLYEPKWDGFRCIVFRDGDEVELGSRNERPLTRYFPEVVEAAKASLPDRCVIDGEIVVPIDGRLQFERLLERIHPADSRVRKLAVETPASLVAFDLLAIDDEALLGTPLGERRPRLEQALAGATDPIHVTPASDQLSTAEEWFAVFEGAGLDGIVAKPCASTYQPGARAMIKVKHVRTADVVLAGFRLHKKSTEQHPLLGSLLLGLYDDNGRLQHVGVSAAFPADRRAELVRELQPLVVEPADHPWAEWAIAEAGGDRMPGAQSRWNAGKNLSWVPLDPALVAEVGYDHMEGTRFRHTTQFKRWRPDRTPESCTYAQLEEPVNYDLDDILV
>UniRef90_UPI001C08EAC3 hypothetical protein n=1 Tax=Tamlana agarivorans TaxID=481183 RepID=UPI001C08EAC3
MKNVLTLTKKGILMVAMLATVLGFANADDKVIVKRDAKKTSITLEDVKQGDLVSIKDNQGIIIFKESVEATGTYKKGFDLTGLENGDYVFEISKDLEVNTIPFTVNTTNIEFDEAEESTYYKPHTKHEAGLLYVTKLCSENEAAIINIFTEVAAGEYEMIHSELIEDALVIEKVYKLNTGNYKITIHSNNKEYTKFINN
>UniRef90_G0R3Q1 Transmembrane protein (Fragment) n=1 Tax=Ichthyophthirius multifiliis (strain G5) TaxID=857967 RepID=G0R3Q1_ICHMG
MEQERQYIQNQFKNDKNNLINQINFNNENIKLDDKQIKLLKEKKNITRDMLKQHYLQELKKNKGLQNTSMVWITKALLNINEDVNQSEIFPSIIDQQSVSYLIEYAQSEINYDELTFMLQKQQLQNISSSKLEENNFDKNYLNTQYQYNINTIKNKVSKLAQQTVKIKNPLLIQSSKTSIPNLVWEDTESAQKSSN
>UniRef90_T0DQ77 Globin n=3 Tax=Alicyclobacillus TaxID=29330 RepID=T0DQ77_ALIAG
MLSQETRDIIKSTVPVLETHGTAITTRFYQLLF
>UniRef90_A0A2C9KHU1 SHNi-TPR domain-containing protein n=1 Tax=Biomphalaria glabrata TaxID=6526 RepID=A0A2C9KHU1_BIOGL
MATESSTSAVDSVEKLEVMKKAADLLAQGKRNMLCGEVPKAVNLFEEAVQLLVKECGELSRDCADAYFSCGSALLELGRMETNVLGTALEGVEVEEEKEEEESEQFEKPPAEDDSVRQQLREEVYEAMAEGEREKDMQKTDKEIKDGEDGGASQMETVTDENKDNVADKSDLKESITAAGDADKELKKEEIPETNSTVEDKSLTESKINEVKPADSNTVADKDETKDQLEKPKQEEEMEVVEKNSEKSEISHKAHEDAAQSAEAEKETASENAVDTAMDIDEKKDVELEDESEADKDDEETEETVDEEEAVEGDESADGEKDEDVPNFQLAWEYLDLAKVIYLKNESKEDQLKAAECHLKLGEVSMETEQHTIAVEDLLSALKIQQKYLAPDDRLIAETHYQLGLAYGLGKEFKLSIEQYQLAISVIEAKIASLKKVLEDEQIDAENKENLETNPELKKFADEIKELQDLIPEMKNKTEDARIEENDLQKMKAIVKENLFPSGTTKEFGSPSKKSGGSVTSGDVDENGERKASDIAHLVRKKRKPEEDTSAPSEQEVKKIRQEVVSDDVNVETKVDDEAKMNVDEQVNTEESQVNSDNSNINVEPKVNGDEPKVNGDEPNVNGDEPKVNGDEPGVNGDDIKVSGDIIESKVISKVEVSPTEDAKMNGDTETPSIETSASTEVAPMAT
>UniRef90_Q883V3 histidine kinase n=513 Tax=Pseudomonadaceae TaxID=135621 RepID=Q883V3_PSESM
MSDSGRADALLAQLPREGRGRLKVFLGAAPGVGKTYAMLQAAHAQLRQGVRVMAGVVETHGRAETEALLNGLPQQPLLRTEYRGMTLEEMDLDALLKAAPSLVLVDELAHTNAPGSRHTKRWQDIQELLAAGIDVYTTVNVQHLESLNDQVRGITGVQVRETLPDWVLQEAFDLVLIDLPPRELLERLRDGKVYVPEQARAAIDAFFTQTNLTALREMAMQTAAAQVDNDLAQGYRQLGQSAPAVRGRMLVGIDGDMHAERLVRHASRVAQRRHLPWSAVHVDDGQTLDEQSRARLQNAQQLAERLGGEAVSLRAGEVARTLVQHAIERRASVVLVGQSRRHWRRRVFGGGVAARLLREGHGLEISVLDDSEELPDQPPRARPAREVVWFDYGLAFVATLIASLVAWGVAGVLALPNISLIFLAAVLLVAVRSSMGPALACAGLSFLAYDFLFIPPSFSLNIQREEDVLTLLFFLLMSALTGKLAARQRRQLQALRDTQEQTSELLDLSRKMTAATDRKAVLNAAEQHFSGWKELYLCLVDRDTQGGLVVETGGPLTFSEAERAAADWAWQHDQPAGSGTGTLPSGRWWWWPITAEEGPLALLGVCAREGQSFTDQHRRLLAALTQPLAQALARAQLAQELEAARLHGETEQLRSALLASVSHDLRTPLTSMRGSIDSLLALGEAIALEDRRELLEGTRDEAERLDRYIQNLLDMTRLGHGALKLARDWVSPADIVGSALNRLRAVLTPLQVSTQVTGDLPLLYVHAALIEQALVNVLENAARFSPLGGRLQVTAGVVDSELFFSVSDEGPGIPEDERAKIFDMFYTAARGDRGGQGTGLGLAICQGMIGAHGGRLTVEEGIDGLGTRITLFLPLQAQPDAEMEEPA
>UniRef90_Q2KHZ9 Glutaryl-CoA dehydrogenase, mitochondrial n=28 Tax=Pecora TaxID=35500 RepID=GCDH_BOVIN
MALRGVYAQLLNRGPGLRVFRSWSSATAQTEKGEKTQSRSAKPSRPEFDWRDPLLLEEQLTADEILIRDTFRTYCQERLMPRILLANRNEVFHREIISEMGELGMLGPTIQGYSCAGVSSVAYGLLARELERVDSGYRSAMSVQSSLVMYPIYAYGSEEQKQKYLPRLAKGELLGCFGLTEPNHGSDPSGMETRARHNPSSRSYILSGSKTWITNSPVADLLIVWARCEDSCIRGFLLEKGMRGLSTPRIEGKFSLRASSTGMIIMDDVEVPEENVLPGVSGLAGPFGCLNNARYGITWGVLGAAEFCLHTARQYTLDRIQFGVPLAKNQLIQKKLADMLTEITLGLHACLQLGRLKDQDKAAPEMVSLLKRNNCGKALDIARQARDMLGGNGISDEYHVIRHVMNLESVNTYEGTHDIHALILGRAITGIQAFVAGK
>UniRef90_UPI0021D8BFC3 hypothetical protein n=1 Tax=unclassified Shewanella TaxID=196818 RepID=UPI0021D8BFC3
MALRLADIPYYLNPTYQSDGRVKIDSPQQLCIYLIGPDTVEKVRKTLNFFATISKICLVRREKLHIDFSNLQNFTAAASVLLFSEITRAQLVTEIADVVTFTLPKTPDVLKLFRGFGLYKAIMPGGNRKLINLFDDDHPYQSGTDPNKFLISTILNLKNQGLELSNPETRIIHRGIQEAMLNVIHHAYEHETDVSSGIGSRWWQLSFCKHDSKSVAFIIYDKGISIPESIAGKLPVNITTDAEAIEFAFQKGVTRYTDKPTRGKGSEDIKDVTTVKDNSKLLVYSGNGMYYINRERGDTRKLSLPASINGTMIEWLIPYE
>UniRef90_D9WD85 Integral membrane protein n=2 Tax=Streptomyces violaceusniger group TaxID=2839105 RepID=D9WD85_9ACTN
MGADVNEEEIARAVEEGMRRNDVRRAAAWRKARDQEARNLLKGLGCMALVFIVFIVLMVKNPGG
>UniRef90_UPI001FB071F5 discoidin domain-containing protein n=1 Tax=Clostridium perfringens TaxID=1502 RepID=UPI001FB071F5
MLKNRERMKRLIACGIAASIVSVNGLSVLASELNKSDKVNLALNKKTVASSREVNDKWGAELITDGIKDKPSDPNAKPGNSRWASSRSVPQWIYIDFEEATTFDQVDILWDGAYSRNYKLEVSNDGETWEEVYATSEGKGNQESINLGEDITANYLRVSCEDTAHEWGNVSIYEVEVYDNENEENVTPPETETGVNIALNKTATASASETNTLTPDKVVDGDTSSRNSRWSSGGFSNGAKQWITIDLEKESTFDKVRLFWEAANAKVYEIQTSNDNENWKTVHRNEAGKGGTEVIELSEKENARYVRVYCEENNPAVWSSVSLYEVEIYNGEIPSSGDLDEVLNSLEVPTINKGDSKLQMPEVPKGFEIKFIGADYNQIRLLNKQNL
>UniRef90_UPI00166CCB99 hypothetical protein n=1 Tax=Kroppenstedtia guangzhouensis TaxID=1274356 RepID=UPI00166CCB99
MEKFGLAVKVDGEELLLLEIEVENDGKKVISDLPGSIRKLAESMAILIEENGNPLEEVAK
>UniRef90_A0A1G6XTJ4 RNA_ligase domain-containing protein n=1 Tax=Niabella drilacis (strain DSM 25811 / CCM 8410 / LMG 26954 / E90) TaxID=1285928 RepID=A0A1G6XTJ4_NIADE
MPVIKLETLVSADPETCFDLSRSIDLHRFSTVQTGERAIAGKTSGLIEAGETVTWQARHFGVRQKLTSKITAYQRPVHFRDEQQRGAFRFMKHDHYFSAVEAGTLIKDVFEFQSPLGVLGRLTDAIIMRRYLTRFLTKRNRVIKDIAESGMGACLVAAERNPYILERAGAFSYTHDGFIQEEALLRACYAWADVETIFAYKQDLLTTDEVCLDLFTRNGMRVFISESCSGWDRFLQKLSEQFPSLSEGWEWEVAQPPFKTNLALLFDRRGRTLTQAETDCYGGAHKP
>UniRef90_A0A0G1M8D9 Single-stranded DNA-binding protein n=1 Tax=Parcubacteria group bacterium GW2011_GWA2_45_30 TaxID=1618834 RepID=A0A0G1M8D9_9BACT
MLVEGRLQTRSWQDQQGQKHWRTEIIAERIQLGPKPGGGGYEGAGIENENFEPAQNQARGPAAPKAVPPEETTPIIDIAEDEEINVKDIPF
>UniRef90_A0A388PNR4 PPM-type phosphatase domain-containing protein n=1 Tax=Opitutae bacterium TaxID=2026771 RepID=A0A388PNR4_9BACT
MFSSTKKNQTLRWVNCLSGARGLVDQFPFRLPAGSPSPQVTVSPATQGLTLTPTPGRRPLVNGLAIDGPVTIAETSTLQLEDGLLALSLEEADTFRDLRTDAWMLFDAASGELLGEFAPADLLDRANDLGRPPEHLACTPTGLEVGFSLSLAAPLLSPREEIATRGPGPALLAAEQNRGAHLCPVCWTRFDAGDALSIAVHEDLRGDPILGSDARLRFQPTRFNDQGLALDPMGLACTDLACPHCRRQLPPGYLDMPHRILSLIGAPSSGKSYYLAVLTRELQERLPKDFGLAFKDGDPSGNMLLNQMRNTLFSAATPEEALLGKTALEGATYEKLPRLGRLVSLPRPFIYALSRPGARKQETSLILYDNAGEHFEPGVDIHDSPGAMHVATSAGLIFLFDPTANARFKARLIGVEDPQLSLKGRVDQQDSILAEMETRIKRVMGLAHDQRIATPLAFVVGKCDTWSRLLSSPLEPVTTPTGLDLAAIERNSQRVRAVLLDLCPGLVASAESLAEEIRYFAATSFGHNPVVIQQGPNKGRIAPDPQRLAPAHVEEPVYWLLHRASPELLPSAPRVNLEKSPAASRP
>UniRef90_UPI0005BA3CE0 TSUP family transporter n=4 Tax=Streptomyces TaxID=1883 RepID=UPI0005BA3CE0
MPDIALSTLVLLCLAALVAGWIDAVVGGGGLLLLPALLIGLPNATYPYVTGTNKAVAIVGTTGAAVTYVRKTKVPVWTAVRVGLAALAGSTAGALFTTAVDEEILRPLIIVVLVAVAAFVILKPSFGARPEGEDRAPLTRARVVTAIVLVGGGIGFYDGLFGPGTGTFLVLALTAVLHLDLVTASATAKIVNVCTNAGALAMFAYQGTVYWQLAALMAAFNLAGGMAGARMALSKGSGFVRGVLLVVVLSMVAKLGWDQWS
>UniRef90_A0A5Q2W0C9 Substrate-binding domain-containing protein n=2 Tax=unclassified Pseudactinotalea TaxID=2649176 RepID=A0A5Q2W0C9_9CELL
MAVSVRDVAALAGVSVGTVSNVLNRPEKVAPATVERVQGAIGELGFVRNDAARQLRAGRSSTLAMVVLDVANPFFTDVARGAEERAAEDGLTVLLGNSDDQAEREALYLEQFEQQRVRGVLITPVAEDMPLLRQLRERGTPVVLVDREVGDRTFSSVAVDDVAGGRLAVEHLLDGGRRRIAYVGGPVGTRQVIDRLSGARRAVAAVDGASLETVETRALTVHQGREAGEAIAGRDRADRPDAIFAANDLLAIGVLQGLQRSKVEVPTEVALIGYDDIDFVQSTVVPLSSIKQPAHLIGRTAVELLLQDAAGAGSPPEQVVFDPELVVRESTQTT
>UniRef90_UPI000D3822E6 PAS domain-containing protein n=1 Tax=Mangrovicoccus ximenensis TaxID=1911570 RepID=UPI000D3822E6
MEREAGMPDKAGDLGEHVWADVLSAVDRTYAELIEYQEKLEARNNELQVLQDFLASVLASISDVLVVVSRDGLIEDASRSFCDAIGQKIGALRGQTLEGFFAEPARSQVGGAIAAAIRERRESVLEVDLAGAEEPVPLEFSVTAVIS
>UniRef90_A0A5B1CRN5 DNA-invertase hin n=1 Tax=Rubripirellula obstinata TaxID=406547 RepID=A0A5B1CRN5_9BACT
MKNRNIIAAYLRCSSDDQSTEAQRADLERYLEREGFDLSRVQWFIDEGTTGDNLDRPAFEELDRLIANGAVATVVVWKLDRLSRSMIDGLTTVSRWLESGVRFVSTTQAFDFRGTIGKMVAALCFGFAEIEQQSRRERQAVGIQHAKANGTYKGRAKGATKAGVDPSRAKELRSKGLTFREIAAALGVSAPTARSYCMA
>UniRef90_UPI001CB8FAB8 hypothetical protein n=1 Tax=Nostoc sp. 'Peltigera membranacea cyanobiont' 210A TaxID=2014529 RepID=UPI001CB8FAB8
MPELFAGIERQDDSFPVPYPDANIPQAWAAGSIFLLIRTILGLKADASKQQLKVQPNLPDCLPDLELTNLSVGDATVGLRFWRNGEQTQWEVTHLDGELEVSTT
>UniRef90_UPI00200782AC uncharacterized protein n=1 Tax=Purpureocillium takamizusanense TaxID=2060973 RepID=UPI00200782AC
MDCDICHRGHDPQRLPFLCAVDARNQVYDARLKNLHLLIENDKLQAQIAKASGDDTPATTAQLALARQRLAEDRTDQILAAADKLRAEIQAARDDIKARRAALARRRSDLSSVSTGLVDRRARQQHEVEKSLQMLRFRWSQSAEDMAQTRAFLCTEALRLYGLKRTRKSNTSRYDYQIGKVPIVDLTSMDSLTPEIISTSLAHVAHIVMLVSHYLAIRLPAEITLPHRDYPRPTIFNLPGSYQHGPFAFPSASSSMTPMPSSAQIRDPESHHVPRPRPLFVDKPLPQLSKEDPTTYSFFLEGVTLLAYNIAWLCSCQGVSIGDKGSFEDMCHMGRNLYNFVLASQLQGYVQPAEPTNKGSNADNNNGVESRSNWIGRYSHGTSYYYLGGMEGTDFVRTFKLPSPMKLADKLKKKLLGDTPGADWEVLDDDAWKPEDGRTDQSGAKALSGALADKGGLDGTGATRSGTNGWTKVKHRT
>UniRef90_A0A2H5YHE1 Methylmalonyl-CoA carboxyltransferase 5S subunit n=4 Tax=Bacteria TaxID=2 RepID=A0A2H5YHE1_9BACT
MGVRVTDTTLRDAHQSLLATRMRIEDMLPIAPLMDEVGFHSVEVWGGATFDTCLRFLREDPWERLRRLKQCFRRTPLQMLLRGQNVVGYRHYADDVVEKFVELAVKNGMDIFRIFDALNDLRNLETAIRAVKRYGGHAQGTICYTISPVHTIDLYARLAQELVEMGSDSICIKDMAGILRPYEAYELVKRLKDTVPVPVQLHTHSTGGLAPLAVLKAIEAGVDVVDCAISSLSLGTSQPPCESLVATLHGTPYDTGLDLELLSQIADYFAQVRRKYAAFEGEVTVDVGVLIHQVPGGMISNLLSQLREMGAADRLPEVLAEIPRVRAELGYPPLVTPTSQIVGTQAVLNVLAGERYKQVTRETRAYVQGYYGRPPAPIDPDVQRKVLGDADVISGRPADHIPPELEKARADLGELASSEEDVVSYVLFPQVAREFLEWRARGGGLEPEEVAAIAVALAQDHARPQPAAAPRREVSLWKVAGRRRLLNRAGVP
>UniRef90_UPI0014216B0F DUF5668 domain-containing protein n=1 Tax=Alkalibacillus almallahensis TaxID=1379154 RepID=UPI0014216B0F
MKQSQSFLAITLIGFGLYFLIQQYDIPILSQFGNWPSILVILGVAFLFSAYGNNQHDNILPGIILFGLGVHFHLLQHQVNWIDHWGMYTLIIGIAFILRAQKKRQGTIIGIIFIVISFLALSAFAMPTWLGWLDVVFNMIEQFWPILLIIIGFVMLFKK
>UniRef90_UPI001E50B040 type II secretion system protein GspM n=1 Tax=Bordetella sp. LUAb4 TaxID=2843195 RepID=UPI001E50B040
MKRPDDKDVSVPANAGRQSARGPDTPPAPVRGLAPTFATWRLKLRDALRPVAAWHAALTPRERRLVDVGGIVLALFLVFTFAIDPALTTIARSRNELPALRAQAAAVASLTNEAQRLRQHGGRTSNAPLAQTDIDESLRRAGFAPDSWRITQEVGNGNGGGNGNAGKPAVWRVELKQAPSTALMRWSDNVPAELRLRVANVELIRASTEYGRPIPGKVNGTVRLAASVGN
>UniRef90_A0A2T2YAG9 MFS transporter n=2 Tax=Adhaeribacter TaxID=299566 RepID=A0A2T2YAG9_9BACT
MKRTLAASRWYRLIPVAFITYSLAYLDRANFGFGAASSMATDLNITPATSSLLGSLFFLGYFFFQVPGAHYAAHNSAKKLIFWSLILWGGLATATGLVSNVNLLIVIRFMLGVVESAVMPAMLILLSNWFTKTERSRANTFLILGNPATILWMSILSGYLINAVGWRWMFILEGLPAVVWAFFWWRLVDDKPTKASWLTEPEKRALAEQLQAEQQGIKPVKNYAEAFKSRTVILLSFQYAFWSIGVYGFVMWLPSIIKAAPNMDIVKTGWLSSVPYVLAIIGMFSASYFSDKTLNRKAFVWPFLLIGALAFYGSYAIGSDNFWLSFVLLILAGGAMYAPYGPFFAIIPELLPRNVAGGAMALINSMGALGSFAGAYIVGYLNSSTKSFGASYLFMAGSLLLSALITLYAVRGTRTKTPEPIKQAV
>UniRef90_A0A7N1A149 DELLA protein n=1 Tax=Kalanchoe fedtschenkoi TaxID=63787 RepID=A0A7N1A149_KALFE
MKRENQYLYPNPDSSGAGSSSGGKGKVCWEDDPLPESGMDELLAVLGYKVKSSDMAEVAQKLEQLEEVMGSVREDGLSHLASETVHYNPSDISNWIENMLSEFVPAGFDSSLQPLPPASVHSFIPQLDSSASVNFPGFGGGDTSLPDYDLKAIPGNQIIYSPKQQQQQIDELGGNANKRLKTTVTATEAPLTTSTRPVVLVDSQEAGVRLVHTLMACAQAIQQSKLEVAGTLVNQIGLLAASQAGSMRKVATYFAEALERRIFNCHPQESVNPSFTDLLLMNFYEACPYLKFAHFTANQAILEAFSGKKEVHVIDFSMNQGMQWPALMQALALRPGGPPAFRLTGIGPPSPDNTDRLREVGLRLAQLAETIHVDFEFRGFVANSLADLDASKLELNPSDTESIAVNSVFELHRLLARPGAIEKVLSVIREIKPEIVTVVEQEANHNGPVFLDRFTESLHYYSTLFDSLEGSASSQDKVISEVYLGRQICNVVACEGPDRVERHETLDQWRLRFGSAGFEPVHIGSNAFKQASMLLDLFSGGEGYRVEENNGCLMLGWHTRPLIATSAWRVGSTGPS
>UniRef90_UPI0021515D3C SDR family oxidoreductase n=1 Tax=Streptomyces sp. KMM 9044 TaxID=2744474 RepID=UPI0021515D3C
MRIVIAGGHGQIALRLERLLAARGYEVAGIIRKPEQADELRKLGAEPVVLDLESASVEEVAERLRGADAAVFAAGSGPGSGVARKEAVDKASAVLFADAAVRAGVRRFVVVSSMGADPAHEGDEVFDVYQRAKGEADAYVRGLDALAWTILRPGSLTDGAGTGLVRLEARTGPGPISRDDVAAVLAELLKDSSTAGLTLELISGPSPIPAAVKSVAGE
>UniRef90_A0A850P7D6 ArsC family reductase n=1 Tax=Ameyamaea chiangmaiensis TaxID=442969 RepID=A0A850P7D6_9PROT
MTLTLYGIKACDTMKKARVWLETHAIDVVFHDYKTAGIDRRTLERWVAAKGWETILNRAGTTFRKLPEADRLALTPERAVTLMLAQPSMIKRPVLEGDGTLIVGFRPEFYETLLSA
>UniRef90_A0A559KBH2 ThrE_2 domain-containing protein n=2 Tax=Paenibacillus sp. JC52 TaxID=2163881 RepID=A0A559KBH2_9BACL
MMLAAYFGGPVSALAELAVVYIGRFLKEGAIGYVQMAIGITAALGTGLFYRYCRG
>UniRef90_S6GGD3 Lipoprotein n=1 Tax=Osedax symbiont Rs2 TaxID=1330035 RepID=S6GGD3_9GAMM
MQTHQINSWLLFSCLSALTGCANNYPLLQQQIETDNTLYRSGSHSISVSALLQNASTGTVAKVPQKKVQTPFQLRFNDTEVELNYVQQQRLQDYAQSLSAAVLSVHCGAGNSSSTLQAVSIALRRCQKIQRFLSGIQQQSQALVQADTPSQLITVAAANRQSGI
>UniRef90_A0A7V9G8G6 AraC family transcriptional regulator n=1 Tax=Planctomycetes bacterium TaxID=2026780 RepID=A0A7V9G8G6_9BACT
MAQSLRKTAFTIGPACRERFLPLDRPAGLVLRDLGVHLAGISDLARPYEIGRPGVDFHCVLYTVSGAGWCELEGLPPSVGPGDMLVLPAGTSYGYGIAADSWRILWFHFDDGRGLGQALHGRKPAIHAAASIPRLQAAMEGFLAEARETDPESLRAAGLHAELIACYLGRELAADIDPRVAAVRHRLQKLWDDVDRDLRHPWSVAALAGRVHESQINLYRLCARHFRVKPMAMVTRLRMERAKQLLRETDEPLKRIADWVGYHNEFAFSTAFKRFTGSNPRDFRKRKRS
>UniRef90_A0A804R300 LigA n=2 Tax=Zea mays TaxID=4577 RepID=A0A804R300_MAIZE
MRPRPPRVHDRSRQAAARQKPLPHVPHRAHHADDHVRQPDVRRRRHHATGSRLRPGHPLRPPPRRGAPHRPPRPRGLHDALHTAPRDARQGGRLRHVVPGRRGRGGLLLHHPVRRRARARAAGVRLHAVRRVDGRAHAAVTGAGRGGVRGLRGDGRNGRSARDAAGAGSSHAVSADEEGPELRVAGVPRQALHGGRRGHREHGGRAGAVHPRGHRRRPLRAKTPRSGRLPDRPGPASQAAVRARRRRAGSSTAARVREVARRAAPSVRRAALLWEHGRQLPVAPGPRDRRRPRAQRAPLPVGAPWPATAGRFQVPDGRQRPRAAPGRVPGEDEGPRPRVAHVGAAEGHPRQPRRRRLRHPLRLELHPREPVARRTDGALAAVRGAAPERVRARGRHGRRRRHAGGQEARQLRRGGGAGARGPVPDGRVGGEGEEGAGEGHGGEGPEPERRGQRRVVGRVGAETGARDFAQARRQGVCHRKRGEHGQRRRSRISGQNNMIPRTRRNRRRPRINRRPPCDPSGTAHVVWHCSQSPCAL
>UniRef90_A0A1Q9JNL8 Sugar ABC transporter permease n=2 Tax=Roseburia sp. 499 TaxID=1261634 RepID=A0A1Q9JNL8_9FIRM
MQPFRQSKQKWIPTVRNKKVPKWVLGLLFLAPSLLGVAVFVLVPFADVVRRSFLDAMGKEFAGISNYESVFQNEAFQLAAGNTIKFILICIPLLLLVSLVCALLINGLKGYQEFFKTTFLFPMAIPVASVVLLWRLFLDRNGFFNEGVRLFGLSPVDWMNSEKAFGVLVFTYLWKNVGYDMILWLAGLAAIPKERYEAASVDGAGRWQTFRYVTLPGLRSSVFVIGILSLVNCFKVFREAYLIAGDYPHESIYMMQHLFNNWFVSLDIQKMTAASVVMAIVMLVIMSLVWYRNERSQE
>UniRef90_A0A7C7UU56 Septum site-determining protein MinC n=1 Tax=Aquificaceae bacterium TaxID=2053503 RepID=A0A7C7UU56_9AQUI
MIEIKGKTTPVIYITIKEKGNIEALIQEISKKLNNKIFEGSLVIIENPEVLSEWERKKVEEILKKLTKGVFEKQKEEKEENRLLIINKSLRAGQRVEHKGDILILGDVNKDAEVLAGGNIIVFGKLRGIAKAGLIGDDIAP
>UniRef90_A0A535UZE8 M24 family metallopeptidase (Fragment) n=1 Tax=Chloroflexi bacterium TaxID=2026724 RepID=A0A535UZE8_9CHLR
FAWFGDRTAFVGFRLPHQFFPSGRRLEEGMPYILDVAPIVGGYTADIGYAACLGENPVHARLLADLAEYRELLLAGVRARRSLRTVYEDVDRLIDRHGYVNRHRAYPFGVIAHRVGTVGGRGPRPTVAGFGLRALRSLAHDGVMGRRGGWSPLWGPGRASDHPPTPGMWAVEPHIGFRGVGVKFEELLVVTESDAFWLDDDLPHVRRWRGAAAAVPA
>UniRef90_UPI00166AE77F antibiotic biosynthesis monooxygenase n=1 Tax=Ornithinibacillus halotolerans TaxID=1274357 RepID=UPI00166AE77F
MYAHMTNGTIDFLMKLTEKHPTIPFHFMSGTSKDVAYYEGVKKKYFQAGRSFEILVQLGEIQEQGYVVMNHIPVLDEGRPVFEDNFRKRKDEIHHQKGFQAFRLLKPLKGNTYVVFTQWDSANSYEQWKNSKEFQKAHTNIKPPAYFADRPFVNVYQMIEEE
>UniRef90_A0A1M3B6X1 K(+)-insensitive pyrophosphate-energized proton pump n=1 Tax=Chlamydia sp. 32-24 TaxID=1895742 RepID=A0A1M3B6X1_9CHLA
MLSYDYGFVIACGFLAILYGIIMIRYILSLSSGNEKMQSIASAIQEGASAYLNRQYQMITLVGIVIFALLTWILGWHVGIGFLIGAILSGLAGYIGMNISVRANVRTTEAAKKGLSEALGVAFKSGAITGMLVVGLGLLGITGYYLYLKWHNVPMRELLEALVGLGFGASLISIFARLGGGIFTKGADVGADLVGKIEANIPEDDPRNAAVIADNVGDNVGDCAGMAADLFETYCVTLVGTMLLAGVFFQGAILEKMMFYPLAICAVCIIASLFGTYFVKLGTSNNIMNALYKGFVSTAIFSAAGIWAVTKYVLGTDVIYENNGISFNGMNLFYCALTGLAVTGLIILITEYYTLGKYRPVKSIAESSKTGHGTNIIQGLAVSMEATALPVITICAGILIANANAGLFGIAVAATSMLALAGMVVALDAYGPVTDNAGGIAEMSNLPAEIRKTTDALDAVGNTTKAVTKGYAIGSAGFAALVLFAAFLQDLTRYFPASADQCSFNLTNTYVLVGLLIGGLLPYLFGALSMMAVGRAAGSVVVEVRRQFKEIPGIMDGSGKPDYGKAVDLLTKSAIKEMILPSLLPVGAPILLYVIINAFVGQNEAFVALGSMLLGVVITGLFVGLSMTSGGGAWDNAKKFIEEGNFGGKGSDAHHASVTGDTVGDPYKDTAGPAINPMIKIANIVALLLLAILAAMSNQ
>UniRef90_A0A3B4T4F2 Coiled-coil domain containing 142 n=4 Tax=Seriola TaxID=8160 RepID=A0A3B4T4F2_SERDU
MDQNNPETLKDPGGEPGLTADWNNSESVCPEKEQRRCLVTEDVTTNGSWSQSSISRSLQRAETLLRTTFNPSLKWLFHSRSQDEDAEEGHFVVAHNLVSRSSARLLRLQQALLTVAPQWQLVGGAQVGSPQVCVKGIPEREAEGGVVLVPSSSSLQGPYRTLWRLLEQRSLLLFIHEYTRRARLAAAYISRVSHLLEEQLRRPHLTPHQTLSSLSSFRVSLGSLSQELRVHLNHWSCLFSKVQSDHYLRPALVQQTRLLVEIKQTLDSLGLQALVLMEHYVCVILSAVAQAELDSVPREVLQDILAGTDVYNQAVEEQRAQRSATQLRTAVLLRAHHSTLDPGLPHSKQHHPAAFSVRELTVILAVHHAETAAEQLRSWASAQSCQVCQVHHTQEAGTSSVRSSISCGTCTLRPEWTWEQLQHTFLIPPPLLSSHQPTLQLHQDSAENHLPVLAKPTSVQQRPDCSDKDPTSQCQTHIPRNSPIQASVETVDLAQPHVENCEPPQTISPPSESSHRLSAPPVSAVCQQERSSVELLFQLLVSCSDLLVPLVSHTEAPAEPLLPHTPTDVTVTAPIISTDDSVELNRLSTDLNTEGSQADWAELDMTTRLETTCSSGFQRDRDPEGEGTVGLEGTAVAPDCVRPHSVQWLDLGQSLVFADLLGQYRALLWTLCSRALWLQMFVPPAGNAAGSINLQDNHRGFQILDRLSRASKTEDLVPKECRAMLEDFRLNLLVCTAHAQWDYVLCRGLGSALKDKCLIDGSHSVMSSSKMMSVTMEHFLLLTPPLLSSLCCQLSDSRSSGSSSLLTLHRQSVSLVLATVQLSTFWILSKAYQFLSSWSLNRFLLITQGDLKELRESLEVMVRQTRSLMMTPDSDYYSSLLLRQQLEALDRAVSELQTFSSLVLKTFSSDCKRMSGEIFEQTMPSSVHWKHSHRTGFPSSPSEYASLAAQTVIGQVLEGVAPLSDDARVQALSVTMTAFLEAWMEHILKQKIKFSVQGALQLKQDFDSIRELIQSDRYGLSADLHQHLLSLRVFQQVDSAVVCLLQQPQAKPYLQSRTWEPFTRCCPAGSRDSSDAAVGSSITNLGYVEGEDLTQADPSVMTSDLPPVDPSNPGEPYLAPSLALGPVQQEWLDLRIHGSARRWRLPGLQCLSKSEP
>UniRef90_A0A4Z1JUV9 MFS domain-containing protein n=3 Tax=Helotiales TaxID=5178 RepID=A0A4Z1JUV9_9HELO
MSQGEQIKDSDHVAVPTSEKQASSDSQESSDVEKKASFTTPDGIVEDTSFVYMTGWRLHLMRLCCAISMFLVNMEVSIIGTSLISITNDLRGFSQMGWVVTGYLITYTGLLIIWAKISDIYGRKPAMIISMLIFTVFSGGCGAAHTMMQLIVCRVFQGVGAAGAVSLALVAAYEMVPKDKYPLQAALIGSAIALGSLVGPLIGGGVSEHSTWRWVFLINVPVGVVCAALLYISVPSNFPYHGRPVLPHPITNSLSRLDISGASLLLGATVLLVTVLLEAGIEFAWKSGTAIALIILSGILFVAFMLNEKVVSKEKRTQEAVFPFRFLSNRPWMGTLLMSFLSGVPYNIIVIDIPQRFQAIDSISPFTSGLRLIPFNFSISLSSILVNIIAKQRVPPIILLFIGSIIQLVGMSLFSTLPENGTLPNTIYGWEVLTGFGMGWVMGICLLLPPAVVEGRDLAISGGSLLQFRVLGGVLGLAISTAIMNNHLTSHLTPLLGAEQLSLLLQSTREIENLSEELRIETVKAFAYGYNMQMKVNVAFSVVQVLIVGVMWTRNGKGWRGQIEVVEKQILKE
>UniRef90_A0A3C1JH31 Ovule protein n=1 Tax=Acidimicrobiaceae bacterium TaxID=2024894 RepID=A0A3C1JH31_9ACTN
MHLSTRAWDNHLEFIMLKGKNPKLTCRLYGATQMVSMANQSQNFFKKYTKLSLNRKTLWQTWTAGILIA
>UniRef90_A0A7V7MZ47 catalase n=1 Tax=Proteobacteria bacterium TaxID=1977087 RepID=A0A7V7MZ47_9PROT
KTDMFARFSTVAGERGAADAERDIRGFALKFYTDEGIWDLVGNNTPVFFFRDPLKFPDLNHAVKRDPKTNMRDANNNWDFWTLLPEALHQLTILMSDRGLPVGYRNMHGFGSHTYSLLNKDNVRHWVKFHFVTQQGIENLSDEEAAKVIGMDRESSQRDLFEAIKNKDFPKWKMFIQVMTEEQAKTYRFHPFDLTKVWSKKDFPLIPVGEFELNKNPENYFQDVEQAAFNPTNIVPGIGFSPDKMLQGRLFSYGDAQRYRLGVNHYQIPVNKPTCPYHAYHRDGAMRVDGNYGGSKHYEPNSYGEWQEQPEAQEPPLELSGDAYAHNFRDDDEDYFTQPGDLYRIIKADGKADLLFNNTAANIGGAEKFIQIRHIRHCYQADPEYGEGVAKALGLSMDEVNNFDMKPHDQWAPRPSQE
>UniRef90_A0A258AK22 Histidine--tRNA ligase n=1 Tax=Verrucomicrobia bacterium 12-59-8 TaxID=1970608 RepID=A0A258AK22_9BACT
MASFRTVKGFRDFFPEECALRNYITETWRSVARRYGFVEYEAPLVESTDLYRKKSGDEITNQLYCFLDKAEREISLRPEVTPSLARMATARQRDFKKPIKWFQIGPCFRYEEPQEGRGREFIQFNADILGDSSPATSAELIALAIDVMREFGVSADDFIIRLSNREIWSIFLADKNIAEEHTTTFLSIIDKIERARPEETEKKLALIGLTTAEVRAFMSSTDENHPAFAALRENLTARGLWQFIRIDATIVRGLAYYTGVVFEVFDLKHGLRALAGGGTYDKLCALMSDGGVDMPAAGFAMGDVVLGILLKRTPGAQMKLTSAYLAASSIDAFVVVADEAQRPHALAAVQSLRAAGIRIDYSFGSQKVGKQFQAAEDRKARFAIVFGAEYPEVVIKNLIARSQCAVPASGLVGEVQKMLAEPAVGPLIA
>UniRef90_A0A078FTM1 BnaC01g23140D protein n=1 Tax=Brassica napus TaxID=3708 RepID=A0A078FTM1_BRANA
MLLIDWKVTTVNASRVPTFRPHLTAERYILSPDLMWLCCNPNFRLDVFVTLSMFDSNTVSFHKRLEAMRGDPRKWLEVVSILMPLQEHTFISIRRLMLERATFTSWSPLMKHGNGNSLPSHVPDALPGRGRGGDGLGTFPKCFRDSGDGKCFWGRVARCTHAVPVSINFKFSRFPSPYLSPYPFRCNIVLHRTGLPSAAPLLRGYAKVETLTISERNEFIITALTQDIDFICTGKVTSSKIEKMMMFCCLL
>UniRef90_A0A369H8Y5 Uncharacterized protein n=1 Tax=Ophiocordyceps camponoti-saundersi (nom. inval.) TaxID=2039874 RepID=A0A369H8Y5_9HYPO
MAAANPFWWPMTIHKDVRFFQGQPNAPPHPPEARRRKEKLYREAMRKDDYDWASAYALEPVVKDISCDESTCARLCLDAFDDEPGLGRGRRGVWGFWFDFEHGACPMKRCWLDNDWSRKEDVLHWKIGGDRAVFDGLGYPTRDVVLLPGAFIVESLIYSCGDGW
>UniRef90_A0A7K6ALI1 Cytochrome P450 1A (Fragment) n=2 Tax=Upupiformes TaxID=57389 RepID=A0A7K6ALI1_UPUEP
MLAAMKAAMSLVETQGIVSATEVLLAAAVFCLVFLLIQSLRQHVPQGLKRPPGPRGYPILGNVLELRKDTHLALTRLSQKYGDVMEVKIGMRPVLVLSGLDTIRQALVKQGEDFMGRPDLYSFQYISNGQSLAFSTDSGEVWKARRKLAQNALKTFSIAPSPTSSSTCLLEEHVSKEADYLVTKLLQVMEKQKSFDLNQYLVVSVANVICAICFGKRYDHNDEELLKVVNLNNEFGDVAASGNPADFIPVLQYLPSHTMKLFKDVNKRFNFFVGKIVQEHYTSFDRGHIRDITDSLIEHCQEKTVGEDAHISLSNKKIINIVNDLFGAGFDTVATALSWSFMYAALYPDIQKKIQEELDQTIGWERRPRLSDRSMLPYTEAFILEVFRHSSFLPFTIPHSTTKATVLNGYYVPKDTCVFINQWQVNHDEKLWKDPSTFNPKRFLNATGTEIKRMEGDKVLAFGLGKRRCIGETIGRWEVFLFLATMLQQLEFSLLSGEKVDITPQYGLTMKYKRCEYFQVKKRSPVKNS
>UniRef90_A0A2E0V7U8 DNA-binding protein n=2 Tax=Verrucomicrobiaceae TaxID=203557 RepID=A0A2E0V7U8_9BACT
MNKAELIETVQGSLGRDATKRSAEDAVAAVLGAIANGVRTEGKVQLIGFGTFAAKTRKARMGRNPKTGEPMHIAASKSVGFKPSASLKASLAEPTEPTPPSA
>UniRef90_A8UFE2 Peptidase_M24 domain-containing protein n=1 Tax=Flavobacteriales bacterium ALC-1 TaxID=391603 RepID=A8UFE2_9FLAO
MTRTIPVSGKYNDRQKAVYNAVNRVKKEATKMLVPGTLWEQYHVEVGKLMTSELLGLGLIDKADVQNENPDWPAYKKYFMHGTSHHMGLDTHDYGLLNEPMQANMVFTVEPGIYIPDEGFGIRLEDDVVIQDSGEPFNLMRNIPIEIEEIEEIMNS
>UniRef90_A0A2V9IHY2 DUF4488 domain-containing protein n=2 Tax=Acidobacteria bacterium TaxID=1978231 RepID=A0A2V9IHY2_9BACT
MNRSLRAAVIGSVMLWLAALGLAAEKKPKSGPLTGTWECVSHGGPQGDMKFTLYLEQNKETVNGTVSSPLGSTELTSASFKKNTLEIHIDTDQRNYLLIGRYKDGQLAGAWSTNEDQKGTWEGKKSAQTTSQP
>UniRef90_A0A2R6HCQ5 DUF4265 domain-containing protein n=1 Tax=Halobacteriales archaeon QS_4_69_34 TaxID=1919177 RepID=A0A2R6HCQ5_9EURY
MIDGGRGAGEGAPPDVPHWDDEYVDRVSDRLLSNYDLEKDYRVRGEVFPLYGQLSMTSHKQFLHPALSYARHDSAEHLFVRRVGSVTVAELERLVALAHDLADEWIVADEEHFGTEFTFALVVPAIPDEVRAFVADFSDRTLLKYGYYGHYEVNLVVVAPGREAHVASEGADVWRAFAPWADTDGEQPGLIDRLLGVLGR
>UniRef90_A0A3B9ERX6 Glutamine amidotransferase type-2 domain-containing protein n=1 Tax=Rhodospirillaceae bacterium TaxID=1898112 RepID=A0A3B9ERX6_9PROT
MCGIFGIILKDRSAAPKDAFEHDLSLLYKASMARGRDATGLALHDSRNVHLIRRDCSPKQMLASDAYRRVVREGYAAQAAAPLAAFGQCRLVTNGSLAIEANNQPVVAGNVVGAHNGIVVNDGDLLPSEAPKTSAGGGTTALAETVHAANDTTRLMEAIDGALNRLGNLRRAVGEVFLRLEGEASIVVMSRLDGAMTLATNTGSLYFLSRADGSAFAFASERPFLRRLIAEGYVFTDVGDDAVVHLKPGEFLHLVPGRTTFDHGSLTDAAVAPDSGKQADPDNEPPVAAPVIRASNSAGGLLRCTACVLPHTYPGISFDDKGVCNFCRNHQHQKVHGRAALEQLLDKHRRNDGCYDCIVGLSGGRDSSYGLHLLKTEYGMNPVAYTYDWGLTTDQSRRNQAIMCSKLGVEHVLRAPDIAKKRRHVRKNINAWLERPRMGMVPLFMAGDKDFYQLGRDLKRDYEVDLTVFCSGSLLEQRQFFVGFCGVHDHVTYTARLYGYTPKVKAQLALYYLSQYLLNPRYINESFFDSVRSFFTSFLFKDDFLYLYEYIDWDEREIDRTLRDLYDWQSDSGYGRNQWRMGDGQTAFTNYIFHAVAGFSEFDNFRSNQIREGLIERDEALKLVEEDNQPKWGALEYFAYVIGINLDEVLARINNIPKLY
>UniRef90_A0A7X7D244 Cytochrome c domain-containing protein (Fragment) n=1 Tax=Acidimicrobiales bacterium TaxID=2201156 RepID=A0A7X7D244_9ACTN
MSDHESGGEPSVPEVPEPPATAATAAGSAERSQTRRRLRIASLTGVAVALAAVGAFAYKQIKPVVDAQRYATVTYEVPVAPQLTAASGETLLRIDPTRSSLTYEIEETFAGAKRSTATGSTAGIAGDLALNTARLEDSRVGQIVVNIEQFESDNNLRDARIRQDFLQSHRYPLATFDFEEIEGLSGQLEEGETYEFQMLGHVTVKERPAASTWDVTASYDDGVLTATATATAKLSRFDAGPISIAGLVQTEDEVLLTLELTAVEPSANDIATTVERAGRLEAGSQEAPSYEQVIEPILEQHCASCHNSGQFGAHTLTLDDAGDVQAVSDGLKTVTQTGYMPPWFASDEGVELAHKPTISDEEIAALAAWSDAGGPLDVDPETPLDPTKEAAELLPRQDQELRIEPYTGSL
>UniRef90_A0A1F5NZ36 50S ribosomal protein L28 n=2 Tax=Bacteria candidate phyla TaxID=1783234 RepID=A0A1F5NZ36_9BACT
MITPMKSCDVCGKGSKMVGHRIKLRGHYNPTNWTRKYPNLQKTVTPAGEKAVACVQCIKTFAKPARPVKARVLAKTTASAK
>UniRef90_A0A091DCM9 Spindlin-4 n=2 Tax=Fukomys damarensis TaxID=885580 RepID=A0A091DCM9_FUKDA
MSPPAVPPTGIDGVSAYLMKKRHTHRKQRRKPTFLTCRNIVGCRIQHGWKEGNEPVEQWKGTVLEQVSVKPTLYIIKYDGKDSVYGLELHRDKRVLALEILPERVPTPRIDSGLADSLIGKAVGHVFEGEHGTKDEWKGMVLARAPVMDTWFYITYEKDPVLYMYTLLDDYKDGDLRIIPDSSYYFPTAEREPGEVVDSLVGKQVEHAKDDGSKRTGIFIHQVVAKPSVYFIKFDDDIHIYVYGLVKTPKKAVVTAAAWAVPSTIHHWRSGPPTKIIRKLRKITKLLCLQRMTTAFQIRTRSIAFSPQTPKLLEEIVGETDQAVAKNWDQGTYEDNLEGLRVFDKEGKGKVMGTEPRSVLITLGEKMTEEEVETVLAGHKDSNG
>UniRef90_A0A4U3LSB8 aldehyde dehydrogenase (NAD(+)) n=8 Tax=Herbidospora TaxID=28443 RepID=A0A4U3LSB8_9ACTN
MTRQIVSVIGGKDEPSGTPYVSRNPARLKEVVAEVALADAATFAAACRNAAAAQHDWARVPAPVRGRVIASIGRLVETNAEALARLVSEEIGKPYAEALGEVREIVDTCDFFIGEGRRLYGQTVPSEMPDKNLFTFRTPVGVAAVITAGNFPVAVPSWYLVPALLCGNSVVWKPAEYAAASASALHRIFSAAGLPEGVFNVVFADGEQTFAGLETALGEGTVHKVGFTGSSEVGRKIGELCGRHLQSPCLELGGKNPMVVMPDADLTLATEGALFAGFGTAGQRCTSLGTVIVHESIHSDFVARFTAAAQSAHVGDPARKVLMGPLLDQKFADRYEEFLTWIGDHHTVTGPVGRITEANPCGHFLGDDPNEGLFYHPVIVDGVRPTDRLFLEETFGPIVGVTTFSTLDEAIELANLPGYGLSSSIYTRDPQSAFRFRAGVSAGMVSVNNSTSGAEAHLPFGGNGKSGNGSRQSGMWVLDQFTRWQAMNWDYSGRLQKAQMDVAEITPDLEFTL
>UniRef90_A0A250G1B9 site-specific DNA-methyltransferase (adenine-specific) n=4 Tax=Capnocytophaga TaxID=1016 RepID=A0A250G1B9_9FLAO
MNDLKMNIPAKQSTKNKFGQYFTPEVIANFMISLANISNESKILEPSCGEGVFLNLLKEKGYHNLSAFEIDKELSKDFDFVRYESFISAKIDEKFDLIIGNPPYIRWKNLEEELKQELLKNETWNKYFNSLCDYLYIFILKSIELLSEKGQLIFICPEYWMNTTHSVSLRNYMVQNGYFEEIYHFNETPIFDKVTVSTVIFKYVKNCVRKEKIQISKYHSNKKLNNEILENLKNKKTFKDTYHFDIDQFKLNERWILQPEKLKRKLEVLENNCFKKNQSTLLSLFDENKREFHTIGDFCDIGNGLVSGLDKAFQINGCLLTKEENQATINVIKAKNINPYIANNITKYIYIEEGLEESEFIKKYPNFYLHFQKYKSQLEKRYQYNRKINYWEWVFLRNISLFKKQEKRIFVPCKERISNKNYFRFALVDKDVFPTQDVTAIFRKPNTSESIEYILAYLNTPIVFDWLKANGIVKGNIVEFSEKPISSIPFRTIDWSNGKEVEIHNFISESIRNYLKRPNELLLNLINESFSNLLCVK
>UniRef90_A0A7J5EE96 Hemerythrin domain-containing protein n=1 Tax=Flavobacteriales bacterium TaxID=2021391 RepID=A0A7J5EE96_9FLAO
MTKKTPQKRATELVSLSHEHHHALVFCVRLKKASQTTPEITQNYVRYFWENHISSHFDNEEKYLLHLMPTAPLKEQFLSEHNEIRVLVNQLLTSAEEVMNNALLLSEKLNQHIRFEERILFPEIEKFASKKELQAVALQLNKSADCPVFFPEFWK
>UniRef90_UPI001175E0D4 diacylglycerol kinase zeta isoform X2 n=3 Tax=Euacanthomorphacea TaxID=123369 RepID=UPI001175E0D4
MEQPEEDQPPQHDTSLQDGEEPFTSTSVASSSSSSSSNTELPSVPPAPRCLHTSRTFTGLRIFCRRKALSKSGLQHVAAQPGASTPSRTDPLVEPSGTIDWTDNAQFGDHIWFETSGSGDFCYVGEQYCIAKTLQKSVARRKCAGCKISVHTMCMEQLEKINFRCKPSFREPGSRAVRESNVVRHHWVHRRRQTGKCRQCGKGFQQKFSFHSKEIVAISCSWCKQAYHNKVTCFMLQQIEECCSLGAHAAVIVPPTWIIRVRRLQSSLKSSKKKKRTSLKCSKSSKKGTEIQDGRWKPFLVKPLPSQLMKPLLVFVNPKSGGNQGAKIIQSFMWYLNPRQVFDLTKGGPREGLELYAKVPNLRILACGGDGTVGWVLSVLDQLKLRPQPPVAILPLGTGNDLARTLNWGGGYTDEPVTKILSHVEDGNIVQLDRWNLQVEPNPEARPEERDEHQTDKLPIDVFNNYFSLGFDAHVTLGFHESREANPEKFNSRFRNKMFYAGTAFSDFLSGSSKDLAKHIKVVCDGTDLTAKVQEMKLQCLLFLNIPRYCAGTMPWGHPSEHHDFEPQRHDDGCIEVIGFTMTSLATLQVGGHGERLHQCKEVTLTTYKSIPMQVDGEPCKLAPSIIHISLRNQANMVQKAKRRISMPHLNDQQPVPEKLQIRVNRISMAAYEALHYDKDQLKEASTPLGVIIVPGDSDLETCRSHIERLQDNLDQVDTATGQDQDAMKAECLSSQKLSPKWCFLDCTTADRFYRIDRAQEHLNYVTEISQEELYILDPELVLKETVGTSPGMPDLVDSYGEECQDHQRQFAFPCSPSSPSSSTTPRVRDCQRKRISSDSSVAEALAQSSSKTTLCRRGAKILNVHRSNTTLADFRPMLSSTSATSSDTEKELELINCVKTEDLDRLMELHQQGADILLQDSRGCTLLHHAVEAGSKDIVKYLIGNVPTSHLDITEKETGETALHKAATSCQRTICHILVEAGASLMKTDLQGETPKQRAEKAEDQELAEYLENRQHYQMIQREDQETAV
>UniRef90_A0A396NWZ4 PBSX family phage terminase large subunit n=3 Tax=root TaxID=1 RepID=A0A396NWZ4_9FIRM
MSDLTKLIAPSFYGVHHDIKAGRHTHYWLKGGRGSTKSSFISVEIILGMMQDAAANALVLRKVAVNLKDSVYEQLLWAIEALGVENLWQAKLSPLQLSYLPTGQRILFRGADEPKKIKSTKFRKGYCKYIWYEEADEFAGMQEIRTINQSLMRGGSSFFVFYSYNPPKSQSNWVNRECLQPKANRLVHTSDYRRVPPAWLGDAFLQEAEYLKELNEKAYRHEYLGEVVGSGGAVFDNVTVEEITDAEIAAFDRIYNGVDWGFYPDPWAFNRMHYDAARRTLYIFGELTRHRTGNAETARLLRQYGVQDTDLITADSAEPKSVADYRCYGLFCRGAVKGPGSVDYSMKWLQALVRIVIDPVRCPDTAKEFTAYEYDRNKEGEVISGYPDRDNHHIDAVRYGTEPIWKRRGQ
>UniRef90_W6SGZ7 Putative MATE family multidrug efflux pumps n=2 Tax=Clostridium bornimense TaxID=1216932 RepID=W6SGZ7_9CLOT
MENTISESSFSKSIIRIALPITLQSMIRSSFSIIDQVMIGQLGSESIAGIGLGGKFASIYSVVLGAITATAAIMISQYMGQKNVKNVRRSFHVNLLVALFITVLFTFASLLFTEQIFSFYTKDSVTKELGKSYLQIYAWSFLPIALSGMAEAMLCCMEMAVFPLVASVSSLFVNTALNYILIFGKFGLPELGVKGAAIGSVVAQIISCLLTLVFLLWQLRKKKMNLSFDIRFNGNEYISYIKILTPLLICEFMWSLGENVYSAIYGNISTNDCAAMTMTSPIQGLMIGALCGLSQAAGIMVGKSLGNQNYEKAYNDSKKLMKYGLIVSIALSILLILLGKVYTGIYNVAAAVKQTAYALLVVFAIVSPVKVQNMILGGGIIKSGGKTNYIMWIDIIGTWGFGVPLGLLSAFVLKLPIIYVYFILSLEECVRLAISLILFKRKSWMQKI
>UniRef90_A0A8B8PLS0 segment polarity protein dishevelled homolog DVL-3-like n=1 Tax=Rhodamnia argentea TaxID=178133 RepID=A0A8B8PLS0_9MYRT
MTTDIDSNSYFTETEDDSMSCSNYSETTCDTFISQRRNRYYNERSNGRSPNHHHGNQDTYRHTNSRARNIDNISQSSSSTTTSASQSDATAVHCITVYLVLTNENFLGLHIYANTLEGRDEGIYVDGVTENSAVALDGRIEPGDKIMQVNDVSLEELDNEEAVKVLKDAVIKRGPLKLVVAKFVDNNKDPVNGIVDPKEAIHPIDTAAWVAHAQAITMPRISSEMANSATSSPSFGSNAQDTDCIRPASAGMSRLNTGLRLNKATTDIQEIIEHMRMPNIGLEIKDREWLKIHIPKAFLGSDLIKWLERNVYGFSSNRDAKKFASRLLKEGYIRDPISKKSFNSKSYYTLEA
>UniRef90_A0A6L9YVB8 Efflux transporter periplasmic adaptor subunit n=1 Tax=Moorena sp. SIO4A3 TaxID=2607836 RepID=A0A6L9YVB8_9CYAN
MPIASCLARSAITVAAAAEVEATKGVITAMASLQQSQASVRAEQANQARALASLAQAKADMKKAIAARNLAETEMKRYQRLWQQGVVSASDRDRAVTQFQDAQAAVEAAEAGIVSAQSQIRAAQASLEAARGELIAAQAQIDTAESAVSSAKAQLNKRNVILKDTVLRAPFDGIVAYLNIREGL
>UniRef90_UPI0020C880D2 PfkB family carbohydrate kinase n=1 Tax=Alsobacter sp. SYSU M60028 TaxID=2962936 RepID=UPI0020C880D2
MDALFIGQTYIDVTFLADRMPTGDEKSVARDYAVSFGGNAVTAAFCCAKLGVVPDLLTSLADDWLGRMFLDMAAKYRISVHGRKVRESSLSFVLPNNGKRAIIRCRDDHYLHPFPILNIGNIRALHLDGHQGDAAMHYARVCRERGVLTSLDGGGLRENTHDLLGFIDVAICAERLAEQMNLSPEGLLAYLKERGVKIGGVTMGEKGMLWYDEQGVIRRQPPLAVPASAVIDTSGAGDVFHGAYVYSAMQRPDAPWREHFAFARAASTYKIQHLGNEEGLPSLADIERIVSEYREAA
>UniRef90_A0A4R7D5Q2 peptide-methionine (S)-S-oxide reductase n=1 Tax=Maribacter caenipelagi TaxID=1447781 RepID=A0A4R7D5Q2_9FLAO
MKNVNKVGFGGGCHWCTEAVFMSLNGVIKVEQGFIAPKEHLTSFSEAVIVDYDSNVIELKDLVAIHLDTHRSTENHSMRNKYRSGIYFFKQEDELVLKEIMTDVQQDFETPLITAIFPFGAFKSSEDRYHNYYFKDTEKPFCKTHISPKIKMLKEKYAKHVSAKVQ
>UniRef90_A0A2J6HZN0 tRNA dihydrouridine synthase DusB (Fragment) n=1 Tax=Marinilabiliales bacterium TaxID=2053303 RepID=A0A2J6HZN0_9BACT
MSGTDNLYLAPFQGITGAVFREVYTRYFVGVDKLFTPFFTGIYKKKNLTTRSDELDKIHHNKIPLVPQILSKDADEIMRFGEFCSEKGFTEINWNLGCPYPRVANKKRGSGMLPHPKMVAEILSRVQGHLPVQLSVKCRLGYHTPDEIFKLIPVFNQFDI
>UniRef90_A0A3G9IWN6 Uncharacterized protein n=1 Tax=Paenibacillus baekrokdamisoli TaxID=1712516 RepID=A0A3G9IWN6_9BACL
MAAEPMIFIFTGTSGSGRKTIAKQIGSELGLYHVLSCTTRVPRATEGQDRDYHYISHDEFVELERSGQLLQSTTIGKERYGIRHQELDRALANGKHAYLILNSEGASLFKNLFKDRVIRIFIYVDKQTVRERLERKGTPYDVVDRYLDQYTEEVVYRKQCEHTIENVELIRTLEQIRTAINSHL
>UniRef90_A0A661X5S4 Ion_trans_2 domain-containing protein n=1 Tax=Caldiserica bacterium TaxID=2052147 RepID=A0A661X5S4_9BACT
MRIYLFLFFMVGVSILWLWFLFFITRKLTGAKVIAVIIIALVGLVVFFGIKYYSFYLYDPKSFYIIPAHKLTYGGVRLFDFIYFSFVTITTLGYGDIIPLHTLTKILTILEVLMGVSFVGLILGRIVIKRES
>UniRef90_A0A2M7LC39 Copper chaperone PCu(A)C n=1 Tax=Sphingomonadales bacterium CG_4_10_14_3_um_filter_58_15 TaxID=1974093 RepID=A0A2M7LC39_9SPHN
MNKISIMLAASASLLLASCGQGDVLYADKAVVNLSPVEGNPSAGYMNLHGGRTDVALVGVTSDDVLRMEMHETVEKDGMASMNQLKEIPVPAGKTVKLEPGGKHLMIWGVGAGSQQRGLLKMTLIYSNDDRIEIDAVVKKVGEAAPAVE
>UniRef90_A0A6H2DTH0 YbhB/YbcL family Raf kinase inhibitor-like protein n=1 Tax=Mycoplasma sp. 1654_15 TaxID=2725994 RepID=A0A6H2DTH0_9MOLU
MIKIEIKDVKDGVLDTQFGNANLGGKYKNTVSFPIKWSKVKDAKSYAITLVDLEASGAMGIVFIHWIAANIKTNKLSWDFSFEHKDKIYQFENSITDKAENYLLKAFYTEHPNGVYYGPFPPDQDHNYEFRVYALNVDDIFGSHPQLKNNNLFYDDFINLIHNKVIDQGFTTFLYRAKTKINADYTLEKLDKSPKELNAPLKKEKQNFYAIEHPVDFQIFSNSLEKINDNTFLLDINNLMSLANLGYFHGKELELQWNKVDSVQEYVILLYSIAETKTLGVGLVEWVKVGIRSKDFPNNVISSLNSKESVKISNTFSSISLFNIAKLADLDETAFDYIKNGYGLCYIPYLTNNQGNYILNVYGLNQEIDWEQYQKELNRELNLADVYRKIKSKVIAKSEKIIKISPTLI
>UniRef90_X1LS14 Ribosome-binding factor A (Fragment) n=1 Tax=marine sediment metagenome TaxID=412755 RepID=X1LS14_9ZZZZ
ASIKKLKEEKTVISFFLIKSFLNKKTFAFLNPNLKRSIRIKIADRLPVKIKISFLSK
>UniRef90_UPI0011132975 hypothetical protein n=1 Tax=Enterobacter kobei TaxID=208224 RepID=UPI0011132975
MISYKVEFPTQKTVGFKVNGYSSAEGLDCKMVEAIGGDVKVQLDQKTMLTVPYREDITADFTLEGYKQRAETYAKTMIDQIVNAAQHRAADDLIQEVTNAVVSSELFSQLS
>UniRef90_UPI0004D08E5E LOW QUALITY PROTEIN: U7 snRNA-associated Sm-like protein LSm11 n=1 Tax=Galeopterus variegatus TaxID=482537 RepID=UPI0004D08E5E
NVLTRMPLHEGSPLGELHRCIREGVKVNVHIRTFKGLRGVCTGFLVAFDKFWNMVIKPFSRAWGTSXRLNLLYLFDRLKLQDSSKKEADSRSAVEDSTLSRYSQTSTWKVASVWGRGDTDRGSRRRSRSVPSSLQASAREESRSEMSGRTTRTEGSSAGGTFSRATTLSRGQSCKKKRKPKVDYQQVFTRHINQIFIRGENVLLVHLAQ
>UniRef90_A0A8J2R764 THAP-type domain-containing protein n=1 Tax=Daphnia galeata TaxID=27404 RepID=A0A8J2R764_9CRUS
MVRPCCICGIKKNSEAATKGIRFFKFPSTKSESHSNWIKTIRHHSTKISRPFTPRRNSIVCSSHFEDSCFNRSYRKLQLKQGSIPTIFNFDDSSKKVFSTACDVTSKADEEKEGNTEGNVSSSSLRDYASDGSSSLSPPVLLPLQDVNSDFEETIEDPPDLELYHINHDYDESTGLTSFADLDMIKMDHIGSVADILGPDPYMQDESIVMDERPDSSVGEERDEVDGQTILSFTSAEEMHEFAHREASSRLTKTNDFRQIKGWRNKFQQLTPSLSPSPCSSPVSLPARSAISASENSKSPLPTHFSRLCQNPSTSFEMKNLKENGASCEKNSPNLDTQQRPTSPVEEGCIVPSEETAETTEEMANSSLESTLPLPDLIAHSEETKETFQEERKEPLEEGMKKSLEDERKKPLEEETKEPLEEETSELLEETDELMEETAEPSDESTEAFPELGIDGLISYDYAKFAASAACFPFDEKRGKTFKKADNSLTASKKVSPRPKNSATRTRINKQSAVQHVQILPIVDIDEIPSGDMTGFDDSMEEVVVQEEEYVEVYDVPGNLVLPTADCGQLFCRLGCICDILIKTKNRTKVSVEHCGLPECMLQCVCGYQKGKPSSRKCFASLLKGNESFYSKINWSGERRRRERRVPERFSEFHLGNESSSSVSNRSSEEFKQVESKSKNNSHHRAGNSHSSRSSSPFKNASPPQSHSVSPQSVQDSLPCPPKNRKWEPFRVKVCADEIKLLRWDSFVSLSKVYIAPDHDIFCMEHTMYGCPCIETDRRIIRIPSEYVPLPVIDTTKNTENKSPTSSAKKVKAKNVTSSPSAKNVAKKHTNPNMRLAPKSKVMEENAAPAAPQEPVAKTSSLSKMRKILSDERFQLQKLMTEEKTRAFDEEVDLTVRQGQTVQLVAWIRFHRIYHAGRIHIRFLSRRAGPVILVMRPTEIVAADITCDIQDMKGNTNSPEIVKELLDPCISPEETSRYAFLLCDGVKWELVGCLSLKASNDAPPPTSTVPPASLDTPTLFPSPPSPQHSISTTEVPSVVLDEQNAQQKRVAAQMKFLARCPPRTRDEVSPDPSAIQRSSALELKRMQLEERLSVINSKLTLQPPKQSVSFKQFKNKSRASMAPILQPIIPTVSVVETPVIVEELPPSSLSAADPSIQAPRPKTVRRAGKRKPDMTYLIPDQCILPDDPEEMPVVSLTEELPEAQPKKNSQNLPDSVVSQEGKDPNQTLYPAAEKLAMFSRLIINSRNDSMSGGNFSNFEDSSMTASKLSRPAKRPPPKLERIPTPPLPVAVPLPLIAPESTVPNIPPSEMTFIKLQPIGSSLPNGISGQNTVRRIRILTPNSTVNGGSGNSLLPVLTSRNGWEPNLIQQQRLHWSSKGVKPPVNAKITPTPVISDSLITVLPVPTSLGTGQNVSTLTSSCATNASDIVQFIGPVPNQDGKTPAITSDLQVPDWSTQLLMKANAVASTSISLAGVKLLQQKQRGKSTSPPVVNAEPSKETESTSCVFPKIFTAEVITVKSPPGNASQRLKIIYEAMVGQHRDFCPSRASMILPLHNVDDQWCIVAINQVPDSGFQVPGVTVFIPRDMLGRAASAAMERKARVSFPLHFKLKNDGSALKSGFEVYGTPQLPHHVFVGPFPFNYIESCTPLSMMNNNVCMFVIKLTKPIPVSVSDCAKEVQQLKPTEQTEEVIQSTETKSTVNTPEPISETSPSTIEEVSVTSTPVSSNKSSSEADHTASSEATEVSESTLLNTKDSESAEIQIVDEKINSNPKSLSQLPGSSLLRQPIQSESVKRTKKPIRMFVARTPGLPPVNIKLFSENSVVVDHPFLSGEKKMFTSLEKAKTWLQTLAIRNCNVEVKKSKTSNSAEDSWANSDFTEDEEIDVCGQTQGESQEQEETVDSASTTSRSPKRIRRLTEKARILAASKSKSSRNSGSTTSSFKRSQDKLPLPRKVGSSRKNSIQRMLHIQKEQERRGLLGKLIRDLDALCASSSGTRAKIVVLKNATILVGQLEQQAKEMEALYQNLKEQRTTLLTLREQIFNKLPPNASQIFSCFMESVPLPSRHLAMIENNRIKRYRPQVPDRQSQNRVAVIVPNNALLSESVDVAQGGYVLTGVES
>UniRef90_R8UAD6 HTH cro/C1-type domain-containing protein n=1 Tax=Bacillus cereus VD184 TaxID=1053242 RepID=R8UAD6_BACCE
MEIKKFIALTLFDLRNDEGYNRENFAELAGISLNAYASIENGKSLIKIDTLHTLLSELSLPLSVFFRRVEAKIESSK
>UniRef90_UPI0021CAFDB3 AAA family ATPase n=1 Tax=Acidiferrimicrobium sp. IK TaxID=2871700 RepID=UPI0021CAFDB3
MAIANQKGGVGKTTTAVNLGAGLAELGYRVLVVDLDPQGNASTGLGVNARNLEASVYDVILHDVPMEDVIEPTTLRNLFVVPATIDLAGAEIELVPAFSRELRLRRAVESVADDYDFVIIDCPPSLGLLTVNGLAAASEVVVPIQCEYYALEGLGQLLRNVNLVQTNLNPRLEVSTIVLTMYDARTRLAEQVVGEVRQHFGDRVCRNVVPRTVRLSEAPSFGQPIIVFDPSSRGAIAYRELAKEVSGGAAQRVG
>UniRef90_A0A176TEJ0 Cytochrome-c peroxidase n=1 Tax=Polaribacter atrinae TaxID=1333662 RepID=A0A176TEJ0_9FLAO
MKKLILSFLIIQLISSCTKEDVYEPFIFYNPEIEVAIPVNFPELNNSFYTNKPTKYGVKLGEKLFFDKKLSANNTISCSSCHIQANAFSDGISEAIGIYGRVGFRNTPPVQNMAFMQFYNWDGNKQALESQPLVPIITHEEMDSSILEVISKLETEEEYLHLFYNAFGDSKITGDRIYNSIAQYEYTLISANSKYDKVKRNEGETFTENEILGYKTFQDKCATCHSTELFTDQSFRNIGFPKNPNTDEAGRARVTGKTEDISRFRVPSLRNIEYTAPYGSFGQFATLKEVLDYLDNGVLEADNLDSVLKENNNQIPITEEEKDNLILFLKTLSDTDFIGQ
>UniRef90_A0A5C6S3D4 SDR family oxidoreductase n=1 Tax=Phaeodactylibacter luteus TaxID=1564516 RepID=A0A5C6S3D4_9BACT
MDFTGKRVLITGGSRGIGRAAAVAFARAGARVAINFHSNKEAAEEAIKAMPGNGHFAVRADISKPDAVFRMVGAVAEELGGIDILVNNAGVFFPHPVAQSDYAAWQESWSQTIGINLMGAAHTSYCVARQMMGQGMPGKILFVSSRGAFRGEPEHTAYGASKAGMNALAQSLAQELAPYHIFVGAVAPGFVETDMAAHVLDGEGGAAVKAQSPTGRVARPEEIAHCILFLATEGAAYATGCILDVNGASYLR
>UniRef90_A0A1V6YXR8 Abhydrolase_3 domain-containing protein n=4 Tax=Penicillium TaxID=5073 RepID=A0A1V6YXR8_PENNA
MSSIYAPAWDEFVQEIGPLLMTGSTVEDLYKDSEVNIQKIISKYEIPPPDNSVKTEDIKLNYAWIRVFTPPSATGNEPVGLFMHGGGWIMGSVDHEDAACRHITKSTGMKVVSIGYRLAPKFKFPRGLNDCVEATLWTLKHFSLSSVVLMGGSAGANLAFGVALRLIDAGVGDKVRGIVALVPCTVHPDAVPEDKKEHFTAYQENAVHTVNTLAAMKCFLDSYAPPPDDKYFSVLLHPRLQDLKKVYIVECGTDTLRDDARLMKGALEEAGVPIMYDDYPGYPHYFWSYPSPALAKASEEFHTNMFRAIKWINME
>UniRef90_A0A0M2PUS6 Imidazoleglycerol-phosphate dehydratase n=2 Tax=Prochlorothrix hollandica TaxID=1223 RepID=A0A0M2PUS6_PROHO
MTAQGIAVFDIDGVVRDVGQSYRRAIADTVEQFTGGAFRPTLDQIDGLKAEGIWNNDWLGSQELIYRYYEGQGQSRESISLTYDEVVDYFQRQYRGANLEDPSQWDGYINQEPLLMGAPYLQQLAAAGIAWGFFSGATRGSADYVLQRRIGLQFPPLVAMGEAPDKPDPLGLLKVVEQLTHSLGLSPTLPVLYAGDTVADLYTIREAQSQAPDRPWWAVGVLPPHVQEPGPRRQAYEQRLWDAGAHRVVSRVTDLTPGAIGQLFREGA
>UniRef90_A0A1Y4NII1 Topoisomerase n=2 Tax=Lachnoclostridium sp. An169 TaxID=1965569 RepID=A0A1Y4NII1_9FIRM
MPGVTKEQIQQARETDLFAYLQFHEPTVLKRDGPNYRHREHDSLVYVTGKKYWYWNSRGRSINALDYLIEIRGYDLVDAVNQLLGTDTRSVSIPKSSRAVTDQERNVAGEQRKQGNPSAESFSLPWARRCATFAVSYLRRRGISSEVILKCFRLGIFYEARYKGEAVCVFVGKDDEKKARFACMRSIMGKLKKDVYGSDKRYSFCYPPEHPGSRQVAVFEAPIDALSHATLQEVEGWKWDGYRLSLGGTSGVALFSFLERHPEILRVTLYMDNDLAGLVNARKIRSALHKDPMFKHIRVGINPPRTGKDYNEKLLCRLQQIKEDPDVSRQKEAAISI
>UniRef90_UPI001AE5D1C9 PTS transporter subunit EIIC n=1 Tax=Vagococcus allomyrinae TaxID=2794353 RepID=UPI001AE5D1C9
MNAFITLVNKRVTPFATKLSRNIWIASLQDAIMSTLPLTLVGSVISVLSILNSYFPKFPDLSPISSFSFGIIGLAISFVLPVYILQRKKMDNKKNLAGIANVGLYLMLVLAQINENGELVFAGDSFGSGGMFLGILSGYFTAIIFILLAKFTFFKDSEAIPDYIVSSFDSFMPILIILTIAYLVVFTFNINFFEILTKILLPLTNFGQSYLGLLAFVFVTTILYSFGISPWLLYGLFYPIQLAGIAENTQLISQGLAATNINTGEVVQGLITLGGMGTTLPLAFMLIKSKSARLKAIGKAGIVPSIFNINEPIVFGAPIMLNPLLMIPFWLNSFINPTIVYFALKSGLVAIPTKVFNLWFIPAPIQGYLVSGDWKGILLSLVVLAVATAIWYPFWKAYDLEQLELEGEAK
>UniRef90_A0A1X9YSF4 Conjugal transfer protein TraG n=1 Tax=Pontibacter actiniarum TaxID=323450 RepID=A0A1X9YSF4_9BACT
MQTGENAQALRKIIDMTRLISLTLLILHAYVHLYRAFAAWQLTWPLLDRLLDRVLASGLLDGFHRSKFLALGFLAISLLGTRGRPSEALRPRTGWACLAAGLLLYTASSLFLYLPWPVTKAALGYLALLTTGYLLMLSGGTLLARVVRLRLQRPDIFNRANEAFPQEERLLENAYSVNLPARYTLRGKLRRSWINIINPFRGLLVLGTPGAGKSYFVIRHVITQHIRKGFTMFVYDFKFDDLSRIAYNTWLRQRPHDPVPPAFYTINFDDLSRSHRCNPLEPATMRDITDAAEAARTILLGLNREWIRRQGDFFVESPINFLTAVIWYLRCYRDGEFCTLPHVIELMQLDYDSLFTCLRTEKEIEVLINPFVNAYLHDVMEQLEGQIAAAKVAMARLSSPQLYYVLSGNDFTLDINNPDAPKIVCMGNNPQKIQVYGAVLSLYVTRLVKQVNQKDKRPSSLIFDEFPTLYLSSMDSLIATARSNRVATCLGLQDLSQLRKDYGREQAEVIAGIVGNVVSGQVTGDTAKQLSERIGRILQDRASVSINSSDTSVSRSTQLEAALPPSRIAGLSSGEFVGLVADDPDCRIERKAFHSEILNDHAALQREQESYLPLPQVRQLDQAVVQKNYRQIKQDMEELVSSEMERLLQDPSLRHLVIRK
>UniRef90_A0A4U1HMG8 Asparagine synthase (Glutamine-hydrolyzing) n=1 Tax=Polyangium aurulentum TaxID=2567896 RepID=A0A4U1HMG8_9DELT
MCGIFGYVTKKRAVGGPRALGAALRALRHRGPDDEASIELTSGDSRCGLAHTRLAIIDLSPAGRQPMSTADGRFTLVYNGEVYNHPELRKQLEALGVSFRGTSDTEVLLEAFARWGEAAIPRFRGMFALGIWDADRRSLLLARDHMGIKPLYFTAGPDGLAFASEVRALVAAGFAEPRPSRRAIASYLATGSVAEPDTIFEGVSPLPPGTILEYTDAGPRLSPYWELPLETAPPADRASAIEDVRATLADAIRLRLVADVPLGVFLSGGMDSTVIASFAARASSRPLNTFTVTFDEEAYSEERHAAEVARRIGSEHHQVRLSGGETMKSLPAAIDALDQPSVDGFNTYFVSKAARAAGLKVALSGLGGDEVFAGYASFSRFGPLLAAGRAGRRMMPLFDRAARALGKPFGALPQRGRKLLDALRAGGSPEKTYGVMRSMFDLGQISALLSPELAHEAASLPLNVPERLEPLVERGAMDPENAYSALEISNYLRNTLLRDTDVMSMSHALEVRVPLVDHVLVERVIRLPGDMKVGGGLNKPLLAAAAGDLPESVLRRPKMGFCLPFAEWMKGPLRGWAEEALLGEATRRLGFLNADAVARLWRAFLEGDRRVSASRVFCLITLAAYFGSHEALF
>UniRef90_A0A6C0E3C4 Methyltransferase n=1 Tax=viral metagenome TaxID=1070528 RepID=A0A6C0E3C4_9ZZZZ
MQFWKNCLQFFNLVKSTEQQGVSETEASHAKAKAEEPSKEPEVEDEKVKDVVAQESPIEPEVDHVEAEAEAEAEEALVEPEVAHVESEAEAEEALVEPEVDHVESEAEAEEALVEPEVAHVESEAEAEEALVELEVAHVESEAEAEEALVELEVAHVESEAEAEEALVEPEVAHVESEAEAEEALVEPEVAHVESEAEAEEALVEPEIAHELELNTYFNNDPFEYFRSEHTQEKDLLDSDSE
>UniRef90_A0A4R3GCS8 Conjugative transfer protein TraD n=2 Tax=unclassified Rhizobium TaxID=2613769 RepID=A0A4R3GCS8_9HYPH
MARTSTSDARKKDTREKIELGGLIVKAGLRYEKRTLLLGALVELKQRLGDDAGERLRLTLIGAKAFGDDA
>UniRef90_A0A150G0L4 Myb-like DNA-binding domain containing protein n=1 Tax=Gonium pectorale TaxID=33097 RepID=A0A150G0L4_GONPE
MARKKKCHDAKAQKKHSVKGTNTAWSDGEKLILAQAVSEVMPGAANADNIDWPVVARAVPGRTAKQCREKWLSDLRPGIKKGAFTLKEECVLIMAHSKFGNMWAKIAKYLPARSANAIKNCWSSRGRAKELQKVHTLLYLYILLVDVASKEPQEAGRRGKRRREGEDGAAAADNADAVKKAKEEYRELAAAHKLVPLKAFLVDIDHYLSDADGTSPAMRDPRPEIWIMGRGKSRVPVAGEVDRNRCLPLGHDDDDDDDDDDDEQTTTNGNGSGNDDGQRHEMPCDERAGGRPRAMPPVPSVGPGGGGGGGGNGDGGGNGDSCGAAMAAWNASEGERKAEAVDEGSAARGKVGRKGSAGSTARDGSHSFRTAATSNASAGAEQAVPLLEPPSGAYHPCVGGAIGTGDSGALGQQRTESPQHPAPFVFASYGMPGPLREALDAAERTARPQGPQGPQGPQGPGDASFEACLRTLGQRLAERDEQLGRRGGEGGDGGGGGGGQEGDWLCPLDAALRGNAREGGRGRESTPGRDLRRGRRASWSGGAFPSPSPPSFWDTREIDAHFAAELGHPLPGSGFGEADHHRDTPQQQCRSDCACGFHATGCPAAQAAAATQAWAPAPAPVPGWGRVSAGAFHPQQLAPALQNQLIQTPPATAAPSYGSVLPFHSLPGLTAPWEPHHQPPPPLRPATSAPAPFALAALSEPGLVPQQHYGLHGGMTAAPGVAHQAGGGVAGAGAGGAYAAAAFALAPPQPPQYMMLPPRPVWQHGPRLEVDAIRRARFHAEALM
>UniRef90_A0A7X9ZMZ4 Endolytic murein transglycosylase n=2 Tax=Sphingomonas sp. G-3-2-10 TaxID=2728838 RepID=A0A7X9ZMZ4_9SPHN
MIVLILVALAAGFGVLQIWAGPGPSRANVSVIIPEGASLTRAANELEKAGAIRSARVFVVLSQVFGGSEPIKAGEYRIPAGLRQSDVLAMLQGGKTLQRMVTVTPGTPSILVYEALMKAPHLTGEIEIPAEGSVLPDSYAYNRGDTRQMVLDRMQKAMVNYLAKAWEKRAPGIAVNNPRDALILASIVEKETGKAEERGLVAGVYSNRLKRNMKLQADPTIIYPITRGKALGRRILRSEIDAVNDYNTYSMTGLPKGPIANPSRASIDAVLNPAQTNAVFFVADGTGGHVFNETYEQHDAAVQKWREIRRQRGEIQ
>UniRef90_X5MP23 NADH dehydrogenase n=1 Tax=Candidatus Phaeomarinobacter ectocarpi TaxID=1458461 RepID=X5MP23_9HYPH
MGIRVSDVAFVRFQAPDLDQMEAFLSDFGLVRAARTEDALYMRGAGSDPFVHVTHKGEPGFAGIAFLADSVADLEVLAAMEGASPVEDITEPGGGKRVRFVDPNGHKVEVVADRELVPTLPVRRNTPGNEATHSQRVDAALRSGEGPAQVMRLGHCVLNVIDFRQSEAWYKERFGLVTSDEIEIEKDMSIGAFMRCDQGDKPVDHHTLFLLGTGAAGFNHAAFEVANVDDLMAGNSHLQAKGYTHEWGVGRHFLGSQIFDYWRDPWGHTVEHWTDGDLFTSDTPPNMQGIDTLLGVQWGPPPPPTLGT
>UniRef90_A0A259M653 DUF3298 domain-containing protein (Fragment) n=1 Tax=Hyphomonas sp. 34-62-18 TaxID=1970392 RepID=A0A259M653_9PROT
MNHPLNRRVAPLAAVFLLGLIGACGEPPKPDASDTDHGEATVEDYVRGPHNGRLLEDGAFALEMTIFETGVPPQYRIYPYKDGAPLDPSSVDLTVKLHRLG
>UniRef90_A0A060AF13 Flagellar FliJ protein n=1 Tax=Staphylococcus phage 6ec TaxID=1500386 RepID=A0A060AF13_9CAUD
MNYIERIYSELVDLKGTVNILQIEMKEINSKFEDILIKIRETEFNVSQSVEMYKRLQEFLQERRLLRAQIEEMEVQYEILGGDEQLKKYEKALDFKEVKKDREFKKDKKYYRDKKYYNNFREDLKEKAIDLYHIV
>UniRef90_UPI001F0D41BD helicase-associated domain-containing protein n=1 Tax=Arthrobacter silviterrae TaxID=2026658 RepID=UPI001F0D41BD
MAHFGWHHPRPARRVAKALAGFLSEAELLGLSGAGALTDHGRAIVHRDWDGALALVAAALPEPVEHLLLQGDLTAVAPGFLAPELAAELALLADPEGRGAAGVYRFSAASIQRAFSAGRTAEGILSFLAQHSATPVPQPLEYLLRDAQSRHGRFTVGQAGTYLTAEDAAALAELLAGGAAAALELTAISPTAAVSPRSAAEVVSALRAAGHSPGIAPGTPLAAGSDDGGTRRGTTSGAPRSRDRAAQSGPEMLAPHEVARLLAEEADETFEGGAGPDADSGAATAAVVLASAAEAAAAAQLGLLRSRPAWTPGTGESAPALALEQLHAAVRGKQAVWLTAVGSDGHPERRQLFPVSVAGGRVRVFDPGSGRERAIGIHRVMGVEIIAKGKGAP
>UniRef90_A0A6G0IZR0 Cilia- and flagella-associated protein 300 n=1 Tax=Larimichthys crocea TaxID=215358 RepID=A0A6G0IZR0_LARCR
MAGDESDVERAFRLRYGRHRDNTAQMSHVLRYITDGGVKEHFSQFGDVSGDKLVKFGSFWRTEPAPISAAKIRECQHFFSHLSGLAAFFTKSAKRTKLLDEICHAKTACLVCTVYERREELVELFEFVVDSHNDFDDDAVHSMALLTGFEFCFLLATFNSVFSFSDMLFGILQNKEYDMQFCLSSIDDFCSTTEREKVKFDSINEDTVREVGGPCGHRAQRVGDVRAVYQQVYCAFEIVL
>UniRef90_A0A2R6KP62 Cation transporter n=2 Tax=unclassified Halobacteriales TaxID=38063 RepID=A0A2R6KP62_9EURY
MSRASSLRRVGALVLVANIGLFAAKAVVWQTTGSLAVGSEAANSLADSAYSAVVLAGLYLTTQPADADHPHGHERIEPFVSLVVAGGIFLAGGAVAYNAITTVLSGSVTVSRGPTAAVVLAVGGVVKFGLYRYVLGVATDEQSPALRATALDNRNDILAAGAALAGVLGAQVGVPVLDPIAALAVSVAIGYTGVEVVRDNLSYLVGGAPPEELRAEILSRALDHPDVAGAHDVVAHYVGPEVDVSLHIEIEGATTVREAHEIETAVVRAVGETPEVDDVFVHVDPKELDEWKTDSEVDRLAVFEES
>UniRef90_A0A6L5DZ66 CHAT domain-containing protein n=2 Tax=Marinifilum sp. N1E240 TaxID=2608082 RepID=A0A6L5DZ66_9BACT
MKNILKKILLFSLLLVFLSGENLNLAHNSILFSVSEVKTNPDSLLVQQFDRAFQFLRKGDFQYAEQSFRNATNTIENGIVNNKILVYRTYVNFGVLLGRIGKSQEALKYYNLSEQFTIDNFGVNSQKLVPLYVNMGNIFAEAEDLFKAQTYYEKALNLIGNAKSRFLPKIHNNLGTVYYKKRQYNLALQSYKESLRLKELAKTGDKFSSLNGIANCYKRSGNFNEAELFYSKSIYEIKRIGGDNSYQLGDVYLNYAVFQNESKNYNKVLPYLTLAYKVYSSNYGLKHPDTAHCLFNFGDWYHDTNKKYDIALEYYQKAIVSELDNFQDSSIYINPNLNEIEPQLSILQILKGKARALKSLYSTSNKISDLDFGLQTYDLCLNIIDKIRIGYQDEESKFYLSKNEKDTYTVAIEIAVELFQLTGDVSYKEKAFKYAERSKAASLMSSLNDVNAKNFGGIPQELQDEEIQLRKDIASYREKIYEERKKASPDRKKISDWQGVLFDLNEKYNQMVLRFEEDYPEYYALKYDNHTIDIEELQSRLEDNDVLIEYSISDSALFTFTITSSSFEVTRQNLDKDSFESHLEEVRNCLKTNDFAEKSADYYKRYTKSAFHLYKELFQNQPNNLDNKNLMIVPDGKMAYIPFGVLLKNEADSTRMNYRGLDYLIKSNTITYHNSATLGFSIESAGFSFSSNKSVLAFAPSYEDVNDSILYAERAYRDKLYPLPGVKEEVNNISKVIPGDLYVDDFATERNFKDHASDYDVLHLAMHTIIDDENPMYSKLVFTQVEDTTQDGLLNTHEIYNMNFNARMVVLSACNTGDGKLMKGEGVMSLARGFFYAGCPSIIMTLWTVEDQTGSNLMTNFYNFLSQGLKKDEALRQAKLEYLKTADPLKSHPYFWSGYVTMGDVEPLYDFNLKSNIAYMAFGSLGLIFLLIAFRRFRAKKMTA
>UniRef90_A0A1H7CBQ7 Negative transcriptional regulator, PaiB family n=3 Tax=Paraburkholderia TaxID=1822464 RepID=A0A1H7CBQ7_9BURK
MYIPAHFEENRLEALHRLIADYPLGSLVTVGPNGLDANHVPFEFDAGKGPHGTLRAHVARANPVWQEVAERPDALVIFQGPSAYISPTWYPSKHETHRQVPTYNYMVVHAHGPIVVRDDEAFVRGLVARLTRKMEAGEPVPWKMGDAPADYISQMLGAIVGIEIELTKLTGKWKLSQNKASADRRGAADALNERDSDEQRAVADAMLAAPPNLD
>UniRef90_A0A1R3VCA4 MOSC domain containing protein n=10 Tax=Mesorhizobium TaxID=68287 RepID=A0A1R3VCA4_9HYPH
MQALTEIGTVSELWRYPASSLAGERRDVISVGSETIDGDRLFGLVDASDGEIARPDREAKWHKVPLIRARLSQARQLEIATPQGDWLPAPGAECDGAVSAFLGFAASIRPFRQKDAPDYAGLLTAERYRKAPIHLLTTASLARLKALHPEGVADPRRFRPNIVVDVAAIEGSFPETEWIGRKLAIGDLLLTISEPCRRCGFTIIAQDGFDHDAAILRNLVRHNAHNFGVYCTVDRPASVGVGEMMRLV
>UniRef90_A0A4C1WBZ0 Uncharacterized protein n=1 Tax=Eumeta variegata TaxID=151549 RepID=A0A4C1WBZ0_EUMVA
MPATFRTANPGWVHAATPTRKEDADMTNARVPRDLMLFSRSTSLAAGLRRFSQRLKLSPTNTARAPPAGMSTGDNPWRPPTDFDAKAAFDLIEFDHLSYVRLTHCPPLLSSDL
>UniRef90_A0A4Y9ZGX7 Fip1 domain-containing protein (Fragment) n=1 Tax=Hericium alpestre TaxID=135208 RepID=A0A4Y9ZGX7_9AGAM
MRGWFVHSFLAVAELRVEPGRGSNGTASEIETHVGEIVRRAKRASDSRLSFRCRFDQHTLEGEGSPGQLPTTMDDDDFLYGGSAEPEPVPTTPAPEPKPVVAAIEAETIVPDIPFGKREPSSGPITPLTPLDVKDESRNGSVIPPDIGVVVQEAAVMEEVVQVDAKMETEEQEQEEEEEEVEIEEESEDDIEFIMEPPTRSLDLRPSRPVQPRVPSATATFTPTKAPLAAGPSLTTEYTPRERGAPPKPAVTXPSAPPSVSVPPSLPPGPSAEPMQPEQPKIEEGPEPSTLPLVTAPPSHPQINPDIPGTLDGRSILDIDLANMSEKLWRRPGADISDWFNYGFDELSWEAYCYRRRELSDVSSMLKTNVL
>UniRef90_A0A515EVL7 DUF502 domain-containing protein n=2 Tax=Rhodoferax TaxID=28065 RepID=A0A515EVL7_9BURK
MVWLPLAITLWVLLWLVGLLDAVFASFLNGLSAVTPESLGPRLERLHAIPGLGVVLVFSAMLVTGALVSNVAGRWWVKQWDRLFTNIPIVKSIYNSVKKVSDTLFSSNGNAFRTALLVQYPRQGSWTVAFQTGSPSGEVASHLGADFVSVYVPTTPNPTSGFFLMLPKADVIELDMSVDEALTYVISMGSVAPGAQASKIPVSQ
>UniRef90_I9LJW7 Phage_Mu_F domain-containing protein n=1 Tax=Pelosinus fermentans B4 TaxID=1149862 RepID=I9LJW7_9FIRM
MDADSKAIIVQFLATVDKILLDGDFTTSKMLDLNKAILTLKNDYTKLIREGTVKATESAKKLKGVEFKAYKAEVQRLLSAQEVAAAEQVFILGKITAEFGGGLDAKVIDSVWNKVWPDALNVDDRIKRLSAKVKEFTERTIKQGISEGNSAANISRILREHFVIEGLEGKAAFRLAAHTTNMVYQATQAEISIQATFVMGIRIVRGMFGKISPKCPICYEHGGDSYKEYFKSYFGGRDIDLWVLANMPPYHSNCSCGIEQITEDAITFIQRARTEYALKNA
>UniRef90_A0A7R9TH37 IPPc domain-containing protein (Fragment) n=1 Tax=Micromonas pusilla TaxID=38833 RepID=A0A7R9TH37_MICPS
MAMGAGARASSIEDAEGPHPLTKAWAGRIKNAKVRAAFMDEPIAGYTSARDLKVLCGTWNTNGKSPPADLDVSRWLDASSRPDVVVVGFQEIVPLTAGKVLAVEDDKATREWEAIIERALNDAATTATTTAAAAAAPKNAAAFASDTSWQRAGQPPRTQTPQSAAGWTSFDSPGVSGGGGGWTSFDAPAFPGAAAAAAGRDRYIRLASKQLVGVYITVYVNASTAEHTRDVRVHTVSTGFNIGLNLGGFKTPDITLGNKGGAAVWMRVYSTPIVFICSHLSAGSKEGDAEKRSADFGEIVTKLSFPAPPSASSDGVAEKPAGVADAHAAVWLGDLNYRLNLPDDRVRAAIASGNCASLLGSDQLLLERAARKAFVGWIEAPVTFPPTYKYRPGTNTYSGAGDAGAEDENGGGGENGDAGGARVKVSAKEEKKKRTPAWCDRILWRGRDIRQNSYARAELTQSDHKPVLAEFTIVARELQPERLQETLDSLRRRLDAEEAASQPRCTLENPQADFGDLKHGETKAISFRLVNSGDVPARWGFVPGGA
>UniRef90_A0A2W4M120 Oxidoreductase n=1 Tax=Proteobacteria bacterium TaxID=1977087 RepID=A0A2W4M120_9PROT
MRLAPRVGFLGVGWIGSARLASLAASRTAHIAAVCDPSPEARARAHEVVPEASLFEHYEELLEVPLDGVVIATPSGLHARQCVAAFERGLAVFCQKPLATSAAEVQRVIGAARASDRLLRVDFCYRHTRALSVARELVASGELGPIHSVELVFHNAYGPEKAWALDPDLAGGGCLMDLGVHLVDAALWVLGSPRVERAVGRRFREGQRLAPHSSTLEDFAVGLLDLDGGVSASLACSWWSSFGDHARIRAEFLGARGGVVVENVAGSFYDFACDRLRNATRERLVSPPDDWGGRALVSWVAELRASPKYRPEPELLEVARSVDLLLGRDPTAASASEPERVDAAGVV
>UniRef90_UPI00140DB29E hypothetical protein n=1 Tax=Psychroflexus maritimus TaxID=2714865 RepID=UPI00140DB29E
MKNLSYLLFLFPVLCFSQIDLSPILTSGLEDANKFTSSYLEPGLDAVAFNLSNGWYSSAKAKGLGSFEIAIIGNASFVSEDQQSFELNTNEYDFLEFSDGSSAKNVANVLGENDPSITALSVYTDEFGNEQTVSFELPDGLSGSGLNFVPTAALQANVGLVFGFEAVVRALPEVKSENNKFRFYGFGLKNEFTKWIPGTKALPISIAGMINYSKFDARFALEETVLINGNDQRIDLGLETWAIDLIVSTRLPVINFYAGGGYVMANSTYGLNGTYQINDGPNSGETIVDPISNSSSLNGYRATLGTRLSLGIFKLFADYSFQEFSSVSVGMGFGI
>UniRef90_A0A0S4HPD3 SLT_4 domain-containing protein n=5 Tax=Pseudomonadaceae TaxID=135621 RepID=A0A0S4HPD3_9PSED
MKQWRTWLPVLMLLTLTGCATPPPKDQNNLCNIYREYPDWYEDSLKMQEKWGTPQHVAMAIMKQESSFISDALPPRDYLLWVIPWGRVSSAYGYAQAQDPVWGEYKNGTGNGGSRDNFDDAIMFIGWYTTGTQRQLGISKWDAYNQYLAYHEGRGGYRNGTHLSKPWLIQVARKVEQQSQSYNSQLKLCRQALEDNRSWFF
>UniRef90_A0A392UKT4 Ig-like domain-containing protein n=1 Tax=Trifolium medium TaxID=97028 RepID=A0A392UKT4_9FABA
MVTIPNFKAPGANLTVRCKSRNISNNSCWLAITAEHADTLFLLKASATTFAFPG
>UniRef90_A0A231P0P2 Aspartate 1-decarboxylase n=4 Tax=Desulfovibrio TaxID=872 RepID=A0A231P0P2_9DELT
MLKILRAKLHGIRVTQCALDYHGSITLDPEVCRLAGILPLEFVYIWNKNSGQRISTYVIFGEAGSRCCILNGAAARTCQIGDEVIIGAFEYVSGPQDICHREPVVLTFDAQNRIEERLRYVVAQDGEDMAFSIVPDPL
>UniRef90_A0A8H4AAK2 Nucleus protein n=3 Tax=Gigaspora TaxID=4873 RepID=A0A8H4AAK2_GIGMA
MPDESGHKRQRVSKACDSCRRKKVKCDGVQPVCGNCSTFNLDCTYNDATKKRGPPKGYIEAIETRLHRMESLLGGLVHSNDPFAEAVLAELMQDDPRPSRRSGNMEFTWKNGSLSTHGDTGRSGGSEVQSPENVLTSEAKDNSIDDLNEIMGILSIDENRQVRYHGRSSGFYLLKNSERYKNGILSLSDNSPKENLISTQNLESLKRPELTTLPPQEISDHLLETYFTHIHPLLPIIYKPIFFNRLKDRNNPPFLLLNAIYALAARYSDRPELRKVIQDSQTAGDEFFDRAKALLDNDYDKSHITTIQALIIMAIRDIRIDNTTRSWIYIGMAARMAQDLGIHRNNEKWQPISLSHEEKEEQKRAFWSCFVIDRIASTHMGRPLGIDEKDVDAAYPSEDEDDEYELLPFKMIHATSSTLLSSPASTNSSVLGSPMSPASTIINKDSPNAAHSVSRFNCLIKLCEIMGRIIQNIYAIRCNVSSANSTVTSILDSSLTSWYVNLPPHLQYNSSSDQHYDTTTLNLHGLYYSTLILLHRPYANTIGKNPSHNICTTAANAITDIADLMRQRKQLRHSPTTVIYCTFSAAVIHTYNAIQPDITISQPARVNLEKCLKILGDLITIWPLTYKYAVILTELANLRDAQLDVNMEQKNDGSEDGFNSRKHINPPIILDQHERQARYHPLNNKIITSHNNKGSSTQSQMFNPVSLNHSQTYERHPVMGFGNPITISSQSSSSYNQTQKSQLQLHHDLPESAQMFNNPFGYRYITSSTADQQTQHTMGGTDPYAAPGVVSTNNRIGNDTINSINSDLWFSQNAELNERSSYFGSQQMQQSVSPFSSPPSLHSQPQALMQIPLLHDDGNDVNMFADNHAFAAIGVGNCGNRRGNTSPVYY
>UniRef90_UPI0013A69B69 DUF2079 domain-containing protein n=2 Tax=unclassified Actinomyces TaxID=2609248 RepID=UPI0013A69B69
MTAARLRPDRPLTRLLDGLPAALAVVVGAAAMIVYSVGQWRAMQVPSWDLAIFSELAKAYSRLEAPVVPIKGEGYNLLGDHFHPLLVLLGPVWRLFPTPLALLVVQDLLLAISAWPLTRLATRLLGRLAATVLGLFYVLSWGFQGAVASQFHEIAFAVPLLAWAAVAFVEGRWRSCALWLAPLVLIKEDLGLTVLMAGLAIALRGWQGAAQQPTHRGPAWWRRLSTARLGVLVALFGAAAFLLTVLVLLPALSPSGTWEYGLTGGGGADTSLIARLLSSEVKLQTLGALVGTAGLIGLTSPWMALVLPTLSWRFLSSNEFYWGWQNWHYNAILIPIALGALLDAVARLQAAPDAPATEVPGTPTPGTQQPDPEAPHATPGWSAVPMWARWAAALGVVLPLATGLLTLRDLPLWSITRSGYGAPSPRTQAAAQVMDLIPAGASVETDLGLLAYLVPDHTVYWVGTSEVDTDYVVVDSLSSAWGGNPPTDAAAWATGQSQNGAVYELVLDEGGYQLARRVS
>UniRef90_W7AVG7 RMI1_N domain-containing protein n=4 Tax=Plasmodium vinckei TaxID=5860 RepID=W7AVG7_PLAVN
MKRLIEKNVIKINYNTFVNQYKKAFKCEKDIIDEELYEHFIINPFTYSRPFGCLLPNYNNTETYYLNGINIFEVVDYVNINERLYKVENSGDNEDDSDQNEDSFNFPDNSGNEDTIDYSNSEGEYGNGNKKGKKNKKSNKNSESIKTKGHTKGTNRNINSSNITQAKKSNNKYRRIFRFLLFDGKYFIYAYEYEYNEIFNYLETNKYKYPKIILYNNPVIRRKVILLKKNQVIILFKGNTTIEQNSSSIKDEEECYDITDINKKSYFNYTNKQEELIPISTKNESNSYNWSGNYNMPNQNRHRNDDPNYLSRENNVRNFYYEDNKIKNTYTNSGTTKDEKNYNYFHNNNNSKGYNRFTLQENNNNSDKYEHFKSYTPLKQAPNFNENVHNKNFTQTNSPNNNPNRIWINNQSNINKDSFHTNNSNNNNQLIDLTEGFFSSKFFQKSPDISNTCDDVIILDD
>UniRef90_A0A6I7QQX8 ABC transporter permease n=1 Tax=Spirochaetaceae bacterium TaxID=1898206 RepID=A0A6I7QQX8_9SPIO
MFLRMALLNLLKHRRRTILIVFAIMVSVLVMEVMAGMFEGMRVNFFRNLTRESGHIQIHAPGYRDRLNPFTLDYVISGYEEITAALREIDGVLEAEEVLHFGALLEHEGRDLTMAGVGVRKGTRFYRDVREGIRGGTFPGDDAQADHTASGVLLSVAVARLLNLEQGDRVNVIVEDSTGSPYYLQLPLTGLFETSSPDLDEYTFFIDHESAQDLVYLEGGTIEIRLRLLHADEADAVAARIPGHLRRAGIDADLDVRTWRELHGGLTSLLEMMDFFILAMNVFVIIVVASVITNAILMNVFERMRVIGTMRAIGLKRRSAGAMILAEGAIQGVIGSALGLAAGIPIVLYFSVNGLDWGGISEAFGMGSSYYYFGYSLHNSVISALGGVLVALSGSLYAAWVGMRLTIMEALHHV
>UniRef90_J4S719 Universal stress family protein n=5 Tax=Burkholderia cepacia complex TaxID=87882 RepID=J4S719_9BURK
MHRHPFKGHAMYSNILVALDGSDTSSRALDAALDLAAQTGARLTPVYVVDFLVPAYDTFGYDPSILIDAFREEGLRVTEDAAHRMTARGVTGTPQISNVAPAGEDIAHRIVTVADDIGADLIVMGTHGRRGFRRLVLGSVAERVLRQATCPVLMIPASCASKASADTAAASIEKEPS
>UniRef90_A0A849MVB4 Uncharacterized protein n=1 Tax=Roseicella sp. DB1501 TaxID=2730925 RepID=A0A849MVB4_9PROT
MTLVFIALLALSWTGLSLAVLAMLMKRLGPPRQAAWRAFGLSLAVNTMGAAYATPGEPLSAVILILLCHALLLPPLLLAARREGQREGQRP
>UniRef90_A0A1G9RLY4 NlpC/P60 domain-containing protein n=2 Tax=Actinomyces ruminicola TaxID=332524 RepID=A0A1G9RLY4_9ACTO
MSPFKSLHRCTSTAVSVSAAAAAALSIAVALPAAPAQAVVQFDTTSDLMSASGLSGTVYTAGDEAADDGAGMSFSVTNTLPDGIEGNIAVPLADDTWAVPQGLPTSPTREADSAAVEDLISRAQTFYDAGGQLIWDSSRPTPLTGTVVRDSTTAPYGVTCSTFVSMVLLGWDYQHTTYTADTNTQVGYAVDFGVDPTTSKIWRANNLASWFYANGDLWLETDGNYQRGDILFFSEQDPEGRIDQVRSGAESTYFGNVYHAAIYLGDGMLIHSTGTGNGVNITTLNPLLEADLSFVARPTFTAEAANTGQAAESGDDATAQGETTESAGDDAAPTETTGSEGQDSSQDGTTGTTGTTGAGGVRAVTPVSPNRQYSRPIEDHRGWMSR
>UniRef90_UPI001F24B592 CHAD domain-containing protein n=1 Tax=Streptomyces sp. GQFP TaxID=2907545 RepID=UPI001F24B592
MAQQHLEPTDPTTAGPVTADALADYLRAQATEFLRALRLHRETGTASSAPSAEEPVDAARALRHAARRITGTLHTFRPLLDPTWSETMHPELAWLSGTLAREHAYAARLERLLLALQRLSGAVPLPAQAGVAVGSRSARAERVGTAEPGTAGPPTHPATPDRSNLTVGAAKAGALLERQLTLARTRAHSAALQALGSSRFHAVADNVAVLASEVPLTPAATTTPTDLRPLAAAADERLCDAVNALPLLTAGHPYNAEALVHGLSPDPAPHPQDAPWHHVRLLLRLRRYAHEVLDGDEARVDVRMLTAGTALNRHRDASEAAAAAAAAARTPRIAPATAYALGVLHADQRHEVEAARFAFQQSWEKKAMSTR
>UniRef90_A0A0R1J1V1 N-acetylmuramidase n=3 Tax=Companilactobacillus TaxID=2767879 RepID=A0A0R1J1V1_9LACO
MPQKRNYNRRRRRKNKYNQPLIIFLTIIILLGAGVFGFRRYSEYKQEAQTEQVETEHNAFVKKVAPYAIYLGKEYGVLPSITIAQAILESDWGRSTLAKDYNNYFGVKGSDPSNTKVLQTKEYTDGQWVTINGRFRVYSDYRESMKDHAELLVNGTTWNSQQYQQVIHSKDYIEAAVALQTDGYATDPGYTSKIIRVIQKYNLKKYDEGIK
>UniRef90_A0A1Q6SW29 Glycerol-3-phosphate cytidylyltransferase n=2 Tax=Firmicutes TaxID=1239 RepID=A0A1Q6SW29_9FIRM
MNEKQPVIGYTTGVYDLFHIGHLNLFKNAKGMCDRLIVGVTVDELVEYKGKKAMIPFEDRIEIVRSCRYVDAAVPQYDMDKLTAARKLGATVLFVGDDWYGTEKWKKYEREFAEYGIRIIYFPYTKGISSTKITEALNSVRRDDLSDLK
>UniRef90_A0A4V6IDT8 DUF4309 domain-containing protein n=2 Tax=Chryseobacterium taihuense TaxID=1141221 RepID=A0A4V6IDT8_9FLAO
MKRRIIAFAVLFLFSAGIYFLLYHKDKNLNFIPENADAMILIDKKKLTRQYLSAFIAHPSQWFIESSESEKKRSVFKAGLKIPDFLQIFHLKNSKLTEWYAVFDIENPQKLLVFLKEHKFKNLGQNLYIKDMLYIKIADQKCYAGISGHDFEKIGRPLNGIFGDKKLNADHFMEEGTGSLSFISGTRTRNFSIELKDREIEIKNASNIENYASFISQLSKEDLFINAELNKENIKVFNKVLPDFFKDLSEVNHLKMNAKLKQVKDTIISYGYDDDFNEIEEISYQEIVQPDYMIQLETQDPAKIWKHFRSENLINDKNEFTGIPFQPNRVYQSDNGIVIKSVTEQSLHSQKKGKNFILIKNDPLLFSFSKGLNDFKYLKDIEYFFYGNKGQDFFLTLKLKDQKLPLILQ
>UniRef90_A0A4R2KRA3 Purine hydroxylase delta subunit apoprotein n=1 Tax=Marinisporobacter balticus TaxID=2018667 RepID=A0A4R2KRA3_9CLOT
MFRINFTINNKGYTVDVDEALRLVDLLRDKFQLTGTKEGCAEGECGACTVIMDGRTVQSCLVMAFQADGSNITTIEGLEREDGLHPIQRAFLDAGAVQCGFCTPGMVLSSKALLDKNSNPSREEIREGLSGNLCRCTGYNKIVDAVALASKYLKEEESDGASENSRK
>UniRef90_A0A0G1RJJ4 S23 ribosomal protein n=2 Tax=Parcubacteria group TaxID=1794811 RepID=A0A0G1RJJ4_9BACT
MDKLSNNGKYDLEERTAKFAECIIDFVRTIKQDAVNRRIIDQLVGSAGSTGANYCEAVEAESKKDFIHKVGIVKKEIKETKHWLRLFARANPERAEEMRKFWKEAHELLLIFSKISRSSRGQ
>UniRef90_A0A0Q9NGW8 Helicase n=2 Tax=unclassified Arthrobacter TaxID=235627 RepID=A0A0Q9NGW8_9MICC
MIDNDEIFEEAPASLQDLIDNDLDGLLNVPEKAKKVTSSDRLERAFLEIVEFRRTHERLPSSATREIAERKLGARLEGILANDEKIAALKHLDTEFELLAVEAAPESLDELLDSDDLDDLLGDDSGILDVSDLPVIKRPESPDSVAQRVKAEDFDLFEPLFKAKHAELAEGTYSLVPFTGMDLIREGAFFVLSGVMCFVAEVGEDVDLIVGGKPRQKQRLRLVFENGTESAMYKQSLMTRMYEAQGQVLARTGHDATEALDADVESGHIYVLQSLSKDPVVAGMKDLHKIGFSTTKVETRIKNAAKSPTYLMAPVKVLADYRLYNVRASWLEHLLHRVFAEVRLDLTQVDRKGRDYDPSEWFVVPLETINKAVAMIMSGEITDYVYDAQLKKLVERQQAGWE
>UniRef90_T0Z4L1 Delta-aminolevulinic acid dehydratase n=1 Tax=Leptospirillum sp. Group IV 'UBA BS' TaxID=1260983 RepID=T0Z4L1_9BACT
MSYAVKYASALYGPFRDAMMSGPQFGDRSSYQMDYRGIRDALREARLDAEEGADILMVKPALAYLDIITRVSEGPDLPVAAYQVSGEYAMICAAGQNGWIDQDRVMIETLTAIRRAGAQMIVTYFAVAAAKLLSLRP
>UniRef90_A0A8H7V2K7 ADF-H domain-containing protein n=1 Tax=Mucor plumbeus TaxID=97098 RepID=A0A8H7V2K7_9FUNG
MSLNVSDSALIDKYEDVRDDKSETNWVFFDFADGKPDRLQVAGSGNGGLAEFVAQLKPEVAGWGYLRMNMSNDEYSQRIKFVLVPWCGEKVGIMRKAKLSIQISDVKNVLRNFHIEVPASQTSELTESEILTRLRRAGGANYDRQSSNY
>UniRef90_A0A538BAD3 Trypsin-like peptidase domain-containing protein n=1 Tax=Actinomycetia bacterium TaxID=1883427 RepID=A0A538BAD3_9ACTN
MQMFTAGSQCTANFVYYDGTNVYVGQAAHCSGTGGNTETNGCTSGTLPVGTQVDVDGASKPGVMVYNSWITMQRLGEKDANTCQYNDLALVKLDPSDVASVNPSVPHWGGPVGLDTTGTTPGEKVYSYGNSELRGGVSQTSPKEGTSQGDTGAGWSHTVMTYNPGIPGDSGSGFLDATGNALGVLSTIDVGFPTGVTNGVGDLAKELSYLHAHESSFASVQLVDGTDPFQAGTLPGLGGLLGGLGLA
>UniRef90_A0A2E1DI39 Two-component sensor histidine kinase n=3 Tax=Flavobacteriaceae bacterium TaxID=1871037 RepID=A0A2E1DI39_9FLAO
MRENNISLSSRIFYYMMVFIVVESIMIAGVTLYQFNNQNSEYHEGRLERKEKNLLTDLKYEIDKSGINSIDALSNSMILEVADVHNLEFELYSLEGFLLKSSTALTGVRGTTIIDQQIVDYFKNENPSRYVEDDTNTNYFKSSYNLVTNFKNEPLGIIYIPYFADDTSSKQELTGFLIRLGFVHGNMILIAFVIAYFISNFVTKSLDSIGETIKKTNLQNQNVKINIDNTPREVVALIDSYNTMIDELKSSAVKLAKSERETAWREMAKQVAHEIKNPLTPMRLSIQTFERGFSKGQEFTKERIKEFSDSLIQQIDTMSSIATAFSDFAEMPEPKKELLNVVEVVGLAIDIFNKDHINFNSSNKVIQANFDRTQLIRVITNLLKNAFQAIPEDRTPEIKVSILEKDDNVNISIADNGYGISKTDTEKIFEPSFTTKSSGMGLGLSMIKSIISAYNGNITFSSKSNVGTTFNITFPKN
>UniRef90_UPI000DC13EC3 piggyBac transposable element-derived protein 4-like n=1 Tax=Melanaphis sacchari TaxID=742174 RepID=UPI000DC13EC3
MTRNRFFELRSCFHVVDNKAIPKENSDKFVKIRPMYNSFIKRCAQLPVEQNLSVDEQTVPFKENLSIKQYIRGKPSLWGIKNCLLCGQSGLVYNLLLYQGSSTQIDENMQKNFGLGGAIVLKLVENVKPNKHFLFFDNYFSSYNLFCCLLKYKILAAGTI
>UniRef90_J4GUB1 Zn-dependent exopeptidase n=1 Tax=Fibroporia radiculosa TaxID=599839 RepID=J4GUB1_9APHY
MAGNKPSAKLEKQPGTIPAPVVSSPAPARGRCLLRRTVLVGIAAIATFYYVGSLVCQINREINAQQGLWLAKAFGGHSQKGFKHKAAPFGKVAEEIFLAVPNPASALATSRQYATAPHLAGSEGDYKTATDFLALLQSELGISASSPLPVFPAGSSESRGATLSITSSSPSKPSAWIDVYYPVMNTPLDRSLEILDEDGNAVWAANLEEQADETDSDAGKYADAVPTFHGLSRGGEAAGKLVYANYGRKQDYDALVASGVELNGTIVITRYGGIFRGLKVKGAQDLGAVACLIYSDPRDDGTVTQENGYEAYPNGPARNPTSVQRGSTQFLSIYPGDPTTPGYPSYENSTRTEGTNIPTIPSLPISWANAKVLLDEIEEGGGNRTISLVNHVDDRVIPIWNTMGVIPGYIKDEVVVIGNHRDVAHCIRAAWVLGATDPSSGTASIHEVIRGLGVLLKQGWKPLRTILIASWDAEEYGLIGSTEWGEDFADWIDEHVVAYVNLDSSVSGSSFYSAASPSLSHFMRSAAETIAHPTKPGLTLWDATKDKGPLYGNHIDAEALSVYEEEQAQMAADDLGVNVLGSGSDYTVFLQRIGVASTNNGFKSTLSDPVYHYHSVFDSERWQELYADPGFLRHVAIARFLGLQTLRLADSIVLPLNTTHYSVQLDAYLDKVEQLRSSMALDVDFSSLRESISSLRAASVALDNEKSEAESELRHLIRRIARRKFVRDHIRKAWCKLRKIFRKPCKHRKHEAGEEYGHRGNEEHARPRAGHAHPASPARTIEGRTVKPRVGRWAGMLKEQREREHGRDSADKHVRGQKCHIEAHDGKDKELREAFVRAVKRVRAANKKLVAFERGFIHPDGIRDREWYRHLGVAPGKWLGYGATTLPALTESITFDANATMAKYEAGRLKVLFDKLAEEIQV
>UniRef90_L7KPS4 DUF697 domain-containing protein n=2 Tax=Gordonia aichiensis TaxID=36820 RepID=L7KPS4_9ACTN
MDDVRAQPSTLDAVGAQSGQTSVSAGGRVVVAAAGGVDVEALVEACREVGASRGAPTIDFVGFDSDHGHAATSAAVFVIDPASAVVDDEEIAVLHELTAAVGNVALVCGRIESFWDWPRIVRGYRAELDPDELLPVFAVSATAALAGAVDESGIGDLIEWFSTPASAVGDGVAAGTPTPAGEVMSVGDARMRADALATRRARLLAQRDRGRSDRLASLRAGIVRVRAQSSADIATRVRELAAGAEHRSNAVTNADVEATATWLDREIAGLVADIDAVTHARLDAVASSTLVGLDVDDPPVQRADEPMGTRRDVPSGRRTGEDAMVLVIGASTGIGIGRLAVAPLASVHTLQWISMPAALLLGLAVAVWVIRMRRAATTRAQVRTWVGEVLADARTRVERRVAMVLSEAESRIGGQLLRAYERQGRRIADEVAEIDERLRELRTAVTGRSEK
>UniRef90_UPI001C5DEC67 DUF917 family protein n=1 Tax=Saccharothrix obliqua TaxID=2861747 RepID=UPI001C5DEC67
MREISAADLPALMTGSRLLSASTGFIVDACLDWVAELVDRHGPVPLVGVADLPPESPCAAIAMVGSVTALAELPPTGEEPELAVRALEARLGHPLRAVMPLAAATVNALFPIAAAAVSGLPLVDCDGMGRVLPLIQQSTYALAGLPLTPLAAVGAAGDVVVVDAAATRADPLLRAAVTTAGGWMLCAMNPTTAGHLRNAAIPGAVSRLIDVGRVLRTAADHTALLDDLTRVLGAKLLGSGRVVELSHDTRPTGPGLPANPTSVAVVEYTGAGRLIRLEAQNEFLLATVDGAVAAAVPDLLCLLDRRERRVVDPESVVVGDHVDVLVIPAAPVWHTPEGLRLAGPRAFGFPVGHPREGISP
>UniRef90_A0A653DFF8 CCHC-type domain-containing protein (Fragment) n=1 Tax=Callosobruchus maculatus TaxID=64391 RepID=A0A653DFF8_CALMS
MESFVAPPRKTNFMEPDLAYVQVDEDRSIVDQGSSKANSTSKQFRCYRCNQPGHRAAGCTAGMSKKKKPKATDESLTNSLGFTQICSLENNSKSIAELLKENEELKEIIQQNQAIISEKEKLINQLLKENDHLQSHYNLINSNIIEKDTIVGTIDKITKRLENLEKQPSPISYASVANKQLGTPQKSLKKLVIKPKGKQNCSDTKKDLNKNINLSKLQIKIEAVNDTRDGGVELKLQDKYVNILKNEMDQVLLRKYEVMEEKKILPKIKIVGYKTREKPTMEEIKEKLIRENYFLHEEDIRVTYLNYIVQHNYYTIHAEVSG
>UniRef90_A0A0F8X3M4 Glyco_hydro_2_N domain-containing protein (Fragment) n=1 Tax=marine sediment metagenome TaxID=412755 RepID=A0A0F8X3M4_9ZZZZ
MLLYNSPDLQFSTMNLQRSTEKIVFCLLLICLQTSLLKAEKTDTGNPRTSYTINEDWSFTPQGLAFGYRPLAKDPGAEIISLPHTWNTQDPFDGKYTYRRGISWYRKELVVSEKLKGKRLFLYFEGANQVSDVYINSVFVGQHKGGYTAFAVDITDYATFGREEPNLIAVQVDNSHDNHIPPLSVGYALYGGIYRDVRLIATSPVHFKVSDHASSGIYIATPEVSDKMARVDVRGTLVNNTNE
>UniRef90_A0A3Q9BJ05 Cytochrome P450 CYP721A63 n=1 Tax=Panax ginseng TaxID=4054 RepID=A0A3Q9BJ05_PANGI
MNPFLLILLLLVISLLKFIHKFIWIPLSIQNHFRQQGIRGPNYRPFFGNTAEIRRWMMAEAKSSRTDFNHDIVVQRVMPHYYNWSMEYGKNFLYWFGAKPRLAIAEPDLIKVILMNTNGAFRKLKLNPSASLLFGDGLIELVGEKWAVHRRITSQAFNMERVKDWVPEMVASTMKMLDKWEEERGGRDDYEVDVHKELNKLSADIISRTAFGSNFEEGKRIFELQDQQTDLVLQAVRSIYIPGFKFLPTKKNRMRWRLDKETRHSIRTLIERSYTTQDKTKCLLTLLTSPYKNQENEEERLSSEEVIDECKTFYLAGKETTANHLTWTLLLLALHQEWQRKAREEVFQVCRNGEIPTADNLMDFKIINMILNETLRLYPPPVMLMRETCKNVKLGGFDIPAGTQLLLPMAAIHHDTEIWGADAKEFNPMRFAGSRKQLASFFPFSLGPRICVGQNLSVVEAKIIIAMIVRQYYFEVSPSYVHAPRQLLTMQPQFGAQILLRRISE
>UniRef90_A0A6L5FCG8 Thiamine pyrophosphate-binding protein (Fragment) n=1 Tax=Acidimicrobiia bacterium TaxID=2080302 RepID=A0A6L5FCG8_9ACTN
MTTVGHQVGLAVASFGARYAFGVVGSGNFHMTNGLIDGGSVFVPARHECGAATMADAYARTSGELGVVTLHQGCGLTNALTGITEAAKSHTPMLILAADTSSGAERSNFNIDQDAIAASVGAVPERVFSGSTHLDDLIRARNIAMGTGATVVVNVPIDIQTEEVPRQPDPTPFAPGPPLSPDDDSVEGFGRLLENAERPVFVAGRGARSEPARDSLLALSEQAGALLATSAAAKGLLVGSPWNLDISGGFATPLAAELIMGADLIVGWGCSLNMWTMRHGRLISQGTKVVQVDTDADALGAHRPIDLGVLGDVSETARAVSGTVSHGETRYRTDEVAQRIAEEGRWRDVPYHDRGDGERIDPRTLTIGLDDILPADRVMGLDSGNFMGYPSMFLDVPDERGFCFTQGFQSIGLGLATTIGAALAQPHRLPVAAVGDGGILMGASELDTVVRLGLPMVV
>UniRef90_A0A2J6L521 XH domain-containing protein n=2 Tax=Lactuca sativa TaxID=4236 RepID=A0A2J6L521_LACSA
MEEMENTTDDEKTTSLKASILSKYDEVFHAHTSDIKKVNEKITVDCEKFLQYYEDSCSQMEASSKSLQQQEYEITKKELKIQKAKSKQELKKRVRERLLSCKQLLNESCTSKRLLEGVKDELVILRKRRAELESQLKAENYESLESEITQLETALQAIQDDDCIDLQEQMKILQTKLIQKNEQIEEKKHQETIFRLAIETKNKELQEARWELIDGLKTYPIGGVIGTKRMGLVDSNPFFVGCTSSEKKKESATKFASLCKHLIEDPNWHPFTRKSDGSEIINEEDGKMVILKSECSVEQYGAVVTALVERNRYHKNGRNLMEEVWNYRENREVTLIEGIEHILKEWKIQKQRKR
>UniRef90_A0A2A4LJ60 Corrinoid adenosyltransferase n=2 Tax=Alphaproteobacteria TaxID=28211 RepID=A0A2A4LJ60_9PROT
MVKLNKIYTKTGDKGTTMLTSGDIVPKFDLRIEAYGCVDELNAQLGMACILAKKGSKLADLLQYIQHDLFDLGADLSTPKVEGEAPDAALRIIASQVSALEQNIDEFNANLTALKSFVLPNGTQLAVQLHICRTVTRRAERIVAQLMSEQAEQTNAESLKYLNRLSDLFFVLSRYDNDLSGQGDILWKPAKNR
>UniRef90_U7P8K1 Tryptophan-rich sensory protein n=2 Tax=Halomonas TaxID=2745 RepID=U7P8K1_9GAMM
MTPTRSALILLGWLALVMLAALTGIATPPGAWYAGLSKPPFTPPNLAFPIAWTLLYLLMALAAWRATLEAPAAMRWHTLWPFVAQLAANALWSPLFFGLHWMGAALAVLLLLWGLILLTLCRFAAVSRPAAWLLVPYLAWVSYAAYLNAATWWLTG
>UniRef90_A0A4S5EQE4 Transposase n=1 Tax=Candidatus Frankia alpina TaxID=2699483 RepID=A0A4S5EQE4_9ACTN
MPPSRPDARARAEALKPLLRTAHQREQVDQAVAAADGRWNVALDALKRKLPTVADRLAAADALVGWAGDHPSVARARCAEPAADPA
>UniRef90_UPI0004150940 Nif3-like dinuclear metal center hexameric protein n=1 Tax=Peribacillus kribbensis TaxID=356658 RepID=UPI0004150940
MELLHQMVQKLDQELRIDDYGKDSGFSRFIPAVYEPAGFEWDMFFEKKFTELFNGLMLKGGPEVSKVFLAVFPADEVLEKFIAEAKEGDLLFMHHPLVMECGDPQGKWGQGFIPVKERYLRQIKEKKLSLYTCHTPLDYHQELGTNGAMAKALNGNVIDRCLPNEFGEYLVWICEIPSKSTQMLLSELKEIFEIPYVDFEGPAAGRIEKAAIIAGCGDKVSWMEEALRKGAQAYITGEIHCHINNEYGRRRYSEMMEFATRSPIPLIGVSHAASEFLVMKTLMKDWFEANFKVETVMLRQDQWWV
>UniRef90_UPI000C18D182 helix-turn-helix domain-containing protein n=3 Tax=Lysinibacillus TaxID=400634 RepID=UPI000C18D182
MAFEYLAQYTTFESIADMDTAVENHMAAHYYDLTESERAIVFKLASHSLENPGACHLKAATIAAALEISTKTVYRSVKRLEELGIIEKVPSTKLNGIKGASIYRILPHVPSSVSQRETAQAISNDAVSETFTENQSSKSFNHLSFKTSTLQEIYNNTHAEKEAHKEYMNEYQVMLFDFMSSLPLADNLKDELHKVVLAAQVQNASDFIKAKNVLFKIAMDIKEGILTVTSTLRAVFTGAYNKAVQRSNMKLSKSSSIEETADRERLVPFYNWLNERDSRSEICSRPNLENWLEW
>UniRef90_UPI0021CC4CFF uncharacterized protein LOC127046616 n=1 Tax=Gopherus flavomarginatus TaxID=286002 RepID=UPI0021CC4CFF
MLERGHDRDTMQCRIKVKELRNAYCKAREGNRHSGAAPMTCRFYKELDAILGGDPTTNPRTTMDTSERGGEVEAEEKRGEEETESESTGVGGDTLESQEVCSQELFSSQEEGSQSQQPVLGEGQAEERVPATLSSQLPVLTAAQRLQNLWKKPRKSKDDLLQTVMDHSARENKKLQDWRERESRIHQRNAAARKKSTKQLISILARQVDSIHAGRALPRHPPIPKLFPLCPNVSSKPPSPASRFLPPPAASNTCTFTNQP
>UniRef90_UPI00167E4099 hypothetical protein n=1 Tax=Streptomyces echinoruber TaxID=68898 RepID=UPI00167E4099
MTVHDDLASVQRCLDDLTRSVGRLEKQLGSTSLDLRRVRTDADHLRESVALLRAAAAAGPTAARPELVTIPDTPYDGSLWTDSDDEGLGARDRHAP
>UniRef90_A0A3B0UW67 FAD-binding PCMH-type domain-containing protein n=1 Tax=hydrothermal vent metagenome TaxID=652676 RepID=A0A3B0UW67_9ZZZZ
MAQFSPVSEAVLAALTAVVTSDNISTAEAERQLHAQDMSQHAPSLSEVVVWPTTAQQVANVLRIANENHIPLTPWGAGSSLEGNPIPLFGGILLSLQRMDQIITLHEDDFQVTVQPGIGYKDLNEFLGRHASFLPQTREPMPPLAACWQTMQQAAAR
>UniRef90_A0A085F9L8 Transcriptional regulator MarR family protein n=4 Tax=Massilia TaxID=149698 RepID=A0A085F9L8_9BURK
MGERYLKSVRLLAECMQGFERFSGESVRQHGLTHAQFDIIATLGNTPGMSYKELGERTLITKGTLTGVIERLEQKGLVLRERSSDDKRSFFVRLTPAGDGIFRDVFPRVIAHGKQLFSSYGEADFDALENVLRKLRDQIAAGSLPPQPPQAKELP
>UniRef90_UPI001662A726 hypothetical protein n=1 Tax=Pedobacter quisquiliarum TaxID=1834438 RepID=UPI001662A726
MKLKNLSILAVLGLLAYSNHAEAQLLKKFQKTLEDKASQKVDDVLNGKKKATSPAAESTAAKDAPPPVEEVYSFTPGSTILFESDFKRDSKGSMPKRWKTSSTGSVVSIPDMPGNWLALAPRTTYKIDSLLKAPENFTIEFDLVTRSDEAKDIGSMAFGFARDNSIKNYISDAYNDNGITNTQFHFHNRDINNSSSDTKVYNTLSYPFANYANGLLHVAIAVEGETMRVYVNRSKVLDTRMLRKDLPKYFYLSAPFSYDNQAKVYFGNFVMSKS
>UniRef90_UPI00168950BE sulfotransferase family 2 domain-containing protein n=1 Tax=Leptolyngbya sp. FACHB-16 TaxID=2692800 RepID=UPI00168950BE
MKIYNPDQPLFSLHIPKTGGSSLEYVLATWFNKRKFPILRNRPKLERILSIGSLDFQIQRTLGCGFYFHYKNHRRNEVPRRVPLGKTYGFLRPTKQPECVHGHFSDYNTGENVFDFYPEASQFIMVLRDPLEMHISLYHYTKRMIEDNSLYWNGQKRDEFQFNSLDQWILERDFFLLKSLPWNLKAENFKGIIDKYFVHVCVLENFQESLNKLADKLGFEPVKIPQVNTTLRCEMSSSEAAIAFREKYSLEYAIYDYAKTLS
>UniRef90_A0A7V7X2U6 Outer membrane protein assembly factor BamA n=1 Tax=bacterium TaxID=1869227 RepID=A0A7V7X2U6_9BACT
MQKKRSTAKNKIVYISVLKFIHSTTERKFSLMKKLFLHRLPIVLVMALISCLFTVHIAAQTQGLAGRPKIASIKVEGNLKSDAELIIIASGLSVSQEFNADDITKAIENLWEMNVFKDIQVYGEQVEDGIEVVIVVKEYPRLESMDLEGQDNIDEEDIRGKMGLYTSQTVSPQHIKKAIERIKRKYAEEGYLNADVEITTYASQNDSNKVLLKIKITEGAKVKIRGINFFGNYSFADAKLEGTFDDTKSKSGVFRWFKGGDFDEKKYREDVKKLIAYYKKKGYRDFQVVNDSTYYAKNKKDFFIDIHVEEGVKYRIGDVRWTGNTLFSNEELSHAFGFSRGEIFNQEKYDKNMQEQVNAMYYDRGYIFAQIVPIEKPVSKDTLDLEFIVTEGNQVYIEKVEIRNNTKTKEKVIRRDVVAFPGEKFSREALIRSQRNLMVLNYFENVIPDVQPISQDKVNVIMTVTEKPTDTANLSMGYSAQDGLIGSAGVAFNNFLGNGQIVSLNLQLGGAGYRVFSVGFSEPYLFDTRTSFGASFYFSLDGNRRAQYVGYKQRSFGGSISFGRRLKWPDDYFLANWSVGYANSTLKPLSLSNLFPQFTYGQQQSLTLTQVIQRNSKDAAEFPKSGSVYTLTTDFGFVSIDTSGYANAVRVLPQNYTRHTFRAENYYPTLWSFVLYTDFTMGYSRTFKRNPLVEEIPQLDRFYMGGSALDIGSIQLRGYGGRGVGPQESGFAAGGASMVKYSAEIRLPVIPSPTMYILGFAEAGNVFRSLSETDPFKVKRSFGYGFRLFMPLVGVIGLDVAYGLDKTNKNRNFPRFHFQLGQQF
>UniRef90_UPI00217ED0B7 hypothetical protein n=1 Tax=Herbiconiux sp. CPCC 205716 TaxID=2970912 RepID=UPI00217ED0B7
MADWHPVQTLHANSWIFPRPGTTEPFAEIRHLPVKVGERTVWAFRAVSWRRPRHLIGAGYFGTLEDAARECHRVALASAVPSVLNEQRR
>UniRef90_UPI001E5ED8EC ribonuclease HII n=1 Tax=Bordetella petrii TaxID=94624 RepID=UPI001E5ED8EC
MGQNSLFAETPDFTGVLMAGVDEAGRGPLAGGVYAAAVILDPDRPVAGLADSKVLIAERREELALLIQERALAWCVASATVPEIDTLNILRATLLAMQRAVDGLAHVPQVAMVDGNQAPKLRCTVQTVIKGDALVPAISAASILAKTARDADLLRLHALYPQYGFDQHKGYGTVLHMDRLREHGPCPEHRRSFAPVRDRLAGLP
>UniRef90_A0A2T2ULY6 SET domain-containing protein-lysine N-methyltransferase (Fragment) n=1 Tax=Proteobacteria bacterium SW_6_67_9 TaxID=1919227 RepID=A0A2T2ULY6_9PROT
QRVYVGRSPIHGWGLFAREHLERDAHIGTYLGPWAQRNGSHVLWVDTGEGWIGRRGFNRLRYVNHSKRPNAEFDGFDLYARRTIRPDEEITIDYGWDDD
>UniRef90_UPI001B816F5E CvpA family protein n=2 Tax=Neokomagataea TaxID=1223423 RepID=UPI001B816F5E
MQSFSDLAHGSLDALTRFDDVVLALIILSGLGGFVRGFATEISGLFSWVMAIAVTNRLHMMFEPYLAPYVHDVWLLQIFSGILVFLVTLLFLAMVGRKIAGIARVGLLSGVDRVLGLGYGLFRGYLVIVTLCLIGGAFFETTASYLMQRSLTAPYIVAGETRLVGYLPLSWRSHLASLATSGHDAR
>UniRef90_UPI0013CE7A73 prepilin-type N-terminal cleavage/methylation domain-containing protein n=1 Tax=Metabacillus litoralis TaxID=152268 RepID=UPI0013CE7A73
MKFKLAKLFTYNKGFTLIEVLLSIVIFSILTLGMLALFSQAMTYTQKSENDTLGVYAARNMLNFMEQQSFEEIKKIYIDHLKSRGEGSITILNKGICEDWYKDMESDGYELCDLAFNPTINNREINVSVELKKHDDQSLQDLLIPIKVFVQWDKDNESTLEGFITNEKLR
>UniRef90_A0A4D6HJA5 DNA-3-methyladenine glycosylase 2 family protein n=1 Tax=Halapricum salinum TaxID=1457250 RepID=A0A4D6HJA5_9EURY
MTTVTDSPHAALRSDEYLGPLVERHGPVEVEPAEDFFQRFVVSILRQQVSMESAAATRERLFESVEVTPNGILAADKQVLRDAGLSRQKTRYVRNVAEAFIEEGYSRAYFEGMDDDAVRAELTEIPGVGPWTADMQLLFSLGRPDVFPVGDLGIRTRMARLFDDLAVEDRAVMRERSERWKPYRSYASLYLWRATES
>UniRef90_A0A3P1S3R7 FMN-binding protein n=1 Tax=Erysipelotrichaceae bacterium OH741_COT-311 TaxID=2491058 RepID=A0A3P1S3R7_9FIRM
MKKTVQLMLFLAIVSAIAGGILGYVNSITAPVIEKMAIAAEQKNLELLFPNGEFKALEFKDETGLVKGVYQVEGQGYVFKVETVGYNSSTPIVYMVAFSNEGNIIGFKELQQQETNGIGSRVFTDEYSQGLLKKTNKDNYDTLTGATVTSTAVVKGLNASRDLFNTINGLEKVETVEQEPKEVQAVKVLINQDWSVYDAQVTVEGSTYQVNVKGYGLLEGDSSHFDYVRNEFMIEIEDQKIKSITLVTFGDTPNIGDKAVDQTYLDQFIDKTMDDEVDLVTGATYTSNSVIASVLAALQAAGQ
>UniRef90_A0A5C7IGY6 Galactinol--sucrose galactosyltransferase n=1 Tax=Acer yangbiense TaxID=1000413 RepID=A0A5C7IGY6_9ROSI
MPSLSESRRRLLQVSSALLKKAWSILQRLGIWRFQEIYARSFANRLTNIKENHKFQKNGKEGHRVEDAALGLRHIVSDIKENRDLKYVFVWHAIPGYWGGVRPGVTEMEHYESEMAYPVSSPGVQNNEDCECLNSLAKNGLGLVNPEKVFTFYNELHSYLASAGIDGVKVDVQNILQTLGAGHGGRVKLTRKYRQALEASIVRNFRNNGIISCMSHNTDGLYSAKQTAFIRASDDFWPRDAASHTIHIASVAYNTSLHPMAEYHGAARAVGGCAIYVSDKPGQHDFYLLKKLVLPDGSILRAKLPGRPTRDCLFSDPARDGKSLLKIWNLNDFTGVMGVFNCQGAGWCKIGKTNLIHDEQPGTISGYVRAKGVDYLSRLATDQWTGDTIVYSHLGGEVVYLPKNATIPITLKSREYEVFTVVPVKEFSNNEAKLAPIGLIKMFNSGGAIKELRYDEAEGTAAADMKVRGCGLFGAYSSARPKMIQVDSEEVQFGYNEESVLQENKVIPGIKVDKGTVELAGTNQYNKTGARFAKWRAVLKIGPKRAI
>UniRef90_A0A2V5VET0 Divalent metal cation transporter (Fragment) n=1 Tax=Verrucomicrobia bacterium TaxID=2026799 RepID=A0A2V5VET0_9BACT
VLYLQQKGFRYIEALVITLIATIACCFGAELIFSKPNLMSVMLGFVPGPHIVTNQEMLYVSIGIIGATVMPHNLYLHSSIVQTRKFEQSPQGKREAIKYASIDSTGALMFALFINAAILILAASVFHWSGHQEVAAIQDAYQLLSPLLGVGFASALFAIALLASGQNSTLTGRAIAIVPAVLVIGIFGESKTTQLLIASQVVLSMQLGFAVWPLMRFTNEKAKMDEFANLLWLKILSWTTAAIIIVLNVKLLFDTFMPDSVLKAFYNFLRLPAPQ
>UniRef90_A0A6P0P8U6 Tandem-95 repeat protein n=5 Tax=unclassified Okeania TaxID=2634635 RepID=A0A6P0P8U6_9CYAN
MGTEGDDLAFGSVFSDTYSALGGNDIVFGQEEGDSLLGQEGNDQINGNRGNDTVSGGLGDDSLRGGRDADSVLGDAGNDTVFGDRGSDTVRGGEGRDVIYGGKENDDVAGGEENDFVSGDIGDDTVAGDGGNDTLLGQDGNDIISGGAGLDVIRGGEGTDSISGNEDNDSLSGNQGNDTLDGGTGDDVLSGGKDDDLLLGDAGADTLNGERGNDTLDGGEANDILSGGKGNDSIDGGQGDDLLIGGRGDDTLTGGEGEDSFVIVDFEESDNLYTVTDFNTTDDLLSLEGGLTFEDLEISDEGGNTVIRNADGNTLAILIGVDSGTLNSGNFFPTPETPFPTATPTPTPTPTDSPDPSPTPTDSPDPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPTDSPDSTPSPTPPDPGEVTPPSLNDPPTDILLDNDSVEENSEAGTVIGTFTTEDPDESDVHEYRLVDDADGRFALNEDQLVVAEGTNLDFEQQETYDIQVRTFDNAGENLTKSFTIALLNVNDPPEITIPDDQQLVNEGEQLDIVGIEVTDPDAGDGELEVTLETTNDGNLTLNSTSGLTFTTGDGQADAEIVFTGSLENINQSLNTLTYTGNNSGSDSISISVNDQGNTGLGEPQTDTALINLSINDLPLVGTNTELVVNTQETGIIDNTLLETTDDSKTSLIYTVTELPTRGNLLVDGGSFTSFTQEDIDQGLLTYEHDNNDTKNDSFSFSVSDQVGGETTDTFEIRVNVPPNITSKNLSLDEDTQEEITNKNLLAEDPDTDAVAETLIYEVTELPTSGKLQLGKAILEVTDTFTQEDIDQGSLSYQHTGDEPGTDTFSYVVTDQDGGTTSGLLNININPGDTSPIAGDDVFETNEDTAITINKSELLANDSEADGEQITITEFAADNIKNGTLAETTESFIYTPNENFSGQESFTYTITDTQGFTDTATVNINVTPVADTPNLEISTPNVSGTDIEELPLGIAASLVDTSGSENLSITISGVPAGATLSAGTDQGDGSWVLTPEELTNLTISPPGDRETGTTFSFDLTVTATATETANDATATQTGTISVQVEALNDAPVLTDLGNLALTTINENEVNNTGTPVASIIAGAVTDADGGASSGIAITQIDNSNGLWQYSVDDGTNWVDVSNSNTTLLKATTSDRLRFVPNTDFFGDATIQFRGWDTTDGSSNTSELTDISTIGGTNAFSEGVGTANILVNDIPEITKNSELVVNFGGTGSISQNLLQTTDGDNGTNAFTYTVTTEAAAGILQLEDNPTNTFTQENINSGLVIYEHTATNTNDDSFSFRVIDVDGGKVTDTFNIRVNEPPVGTTTDLSAFIGQSKVIPTENLQFIDPDVETATPASLQYTLTEVPTLGELQQGGETLAVGSKFTQENLDNGEISYATTTASIGTDSFNFLVTDQDGGTTSGLLNINIVEANRPPEVEADKTVTLEEDNNATLDIPAPTDPDGDALTITVDSIPNAEIGQVLLSNNTSVTALQQLTTEQLTSLTFVPVANANGAAGTFSYTVDDGNDENSSSTQVINIDVTPVNDLPIAIDDGPVFTNLGNVITIDVLGNDSDIDGPDPLSITTLSNDEPLGILNNLGTQVQYTAVFGTGTDLFQYTITDGLDEATATATVNILDVSNDPDFLVGGEFNDNFDGSGGDDTLEGLAGNDTLAGDDENDSLVGGDGNDSIDGGDDDDIFIGGLGADTLSDDNGNNTFVYTSADDGGAKFNAADAASIGTAISAGLYDRITGFEDLGVVGGDTIAFSSTVIPAVDNIATDVQTTNISGNVLIAGNPGLFAYEVEGKTYLIYDANGDNTVGDDSQILAELEDVSGVVALDINDDFTII
>UniRef90_A0A7K7WYR9 TENX protein (Fragment) n=1 Tax=Mohoua ochrocephala TaxID=874463 RepID=A0A7K7WYR9_9PASS
HFHTHHHPLSTTAAAQPEELPLTSEEPQHEKHRTESPASEAPLVRAVLGELRVSSVTPNSAQLQWSVPEGSFDSFMLQYRDAQGQPQALPIDGGSHSVTVPRLSPSHRYRFHLYGLRGRKKIDHVSTEAVTGTQEQEELPLPSEEQKHEKLQTEAPPSDAPLMRAVLGELKVSSVTPSSVGLQWSVPEGSFDSFMLQYRDAQGQPQALPIDAGSHSVTVPGLSPSRRYRFHLYGLQGRKKTDRVSIDIITAQPEELPLPTEEPQQEKPETKPRPSEGSPVRAVLEELRVSSVTPNSVQLQWSVPEDSFDSFMLQYRDAQGQPQALPIDGRSHSVTVP
>UniRef90_UPI001131192E phosphatidylinositol 5-phosphate 4-kinase type-2 alpha-like isoform X3 n=1 Tax=Oncorhynchus nerka TaxID=8023 RepID=UPI001131192E
MAKELPTYKDNDFINDGQKICIDDDNKKMFLEKLRKDVEFLAQLKLMDYSLLVGIHDVERAEQEEVESEDNEGDDEGESDGGIGTPPDSPSNTLDSTKPLSPGEFDPTIDVYAIKSNDGAPRKEVYFMAVI
>UniRef90_A0A101DIC7 DNA repair protein RadC n=1 Tax=Desulfonauticus sp. 38_4375 TaxID=1635258 RepID=A0A101DIC7_9DELT
MPNKNKPHYLGHRQRLKKKLRENPEALADYEVLELLLGYALPRKDTKPLAKTLLAKFKNFKQLLFAKEKELENIEGVGPGISTFWLALREFLSRASVQEFQKTKQKITSPQDVYNLLAPKLIPLSKEEVWLVMLDNKHQLIKMSRLSQGTLDSSPIYVREILEQVLLNQAKAFILAHNHPSGEPTPSLADLEITRKIEEACKNLEVSFLDHLIISKQGYQSLKEQGF
>UniRef90_UPI001D97EE8E Choline kinase n=1 Tax=Passalora fulva TaxID=5499 RepID=UPI001D97EE8E
MQSHRSSQVFSVFSVTFNPTARPNSRFGVQPHLYSCSSSTRSREEPLTDIRASCPWNHRRSLSALYHIWLRLPPLGPRSRHQSARNSDGREARDDTSCVSITMPHSEQPSPMSSGLVKPKLEECASPSSYLGLNRAASPRSTPKSVSISHHAETISPLILGQRKEDEESDLSPRRPAVISARSRRLSGRPASYGSPGLKPLTPALDGAVHSDERDAADSQHDGHHHIDALVDQVSMWIKDRRAKRSKRKEKRSARREARGAKASDGDVDEPEKSQRRDSDASDSSVDLENLERIIASNLSLRRSSVRRSSISLKSKASVRRLLRKQSTVSDSEEVDVSVPGCDAFLDNSKTLAYTGGASDLSDNDGDELRQVPSYRDFDAWAKFKFDIVRIIHTLRLKGWRKVALEMSSAIAVKRLSGALTNAVYVVSPPADLSLEKYDESGKVVGVSKAPPKLLLRVYGPQVEHLIDREAELAILQRLARKQIGPRLLGTFVNGRFEEYLHAQPLTPKELRDPATSRQIAKRMRELHEGIELLDQERSDGAFVWRNWDKWFQRVEHIVTRMDNQIKALPEDAKPTGQQAWMRRGYICGVPWAQFREIVEKYRMWLKAQYGGSKEVRDQLVFAHNDTQYGNILRMTPSGESPLLLPANTHKQLVVIDFEYANANTRGLEFANHFTEWCYNYHDERKPYAFNSSWYPTPEEQDRFLRAYVRHRPQDGLSTPQTGPSTPSSEVSTPPVKRATSSISDFMLDARHPQSARPNAAKEEEAAKAAEDLEIGRLANETRIWRLANTAQWVAWGLVQAKVPGMPDFDPDSPTSELTSDTEPEELLGERAEEYRQLAKEQAGEDEEEDEEFDYLGYAQHRALFFWGDAVQMGFVKAEDLPEETRSKLKTVPY
>UniRef90_A0A0E3NZ95 Probable dihydroorotate dehydrogenase B (NAD(+)), electron transfer subunit n=2 Tax=Methanosarcinaceae TaxID=2206 RepID=A0A0E3NZ95_9EURY
MIPLNATIEKIMEESPFIRTFVFDHRFEEMEPGQFVMVWVRGVDEVPMGLSRKNSITVQNVGEATAKLFELKEGDSFGLRGPLGKGFSSPAAGEKILVIAGGVGAAPLAPYAEAASTAGAKVHTILGARSGGDLLFEERFAAAGVLDITTDDGSKGTKGFVTDVLKKIDVSSYDNIAVCGPEVMMGFIFKILQEKEVLDKSEFSLHRYFKCGIGVCGACCIDRSGLRVCKDGPVFSGVQLVDSELGKYARDASGRRVKI
>UniRef90_A0A8T4KUD5 Pacifastin domain-containing protein n=1 Tax=Candidatus Aenigmarchaeota archaeon TaxID=2093792 RepID=A0A8T4KUD5_9ARCH
MKGVSLPVNAVIIIALAAVVLLVLSTFFLMGTGPSMSNIEAQRVFEEQCPKIKCEKFVTPGTPAFGGLYKNFFDACQRLYGISGTDSEKSKCFFYCNCGALTSECNTDCTICKNFPVDKERCFAELEKKHGLGCKNSCF
>UniRef90_C0HI41 Uncharacterized protein n=1 Tax=Zea mays TaxID=4577 RepID=C0HI41_MAIZE
MEGCRGRHQSHPPHAIDGARGKTAHLLPTPNLLPFQLKQHRRLVAVWLLVKAPADKGKMEHTTAAVSSVRWVCRSRCKATARSSWEAMVTANFGLWLANTCCRAPDYGSQGEVMLTFAENGSSKVGVRFDKQIPGAIDLGGSCELDHGLLCSVDSLCLDGPGWEDRAKHSFDVVFEVMEFLFFLEHAGELHIIIFRGKIESKLDQNKHYKLTKLPSGGHKHQCTKGSINLEEKQTNHLNSTKDLQ
>UniRef90_UPI001CDD57D1 hypothetical protein n=1 Tax=Vibrio vulnificus TaxID=672 RepID=UPI001CDD57D1
MVENLVSGLVSGLIVVLITLVISRVWTLIVVPWFEERVYKDVKIEGKWFSYYTGGMLGRQEVITLKRHGHQITGTMVCTNIGQPDHGEQYNIHGTFKNLILPLVYENDNQSKTDRGTITLKSTFSAKKLVGQISYYSCREDIINTSIVTWYRTQEDMEAAKNSHETRLKEGFNPQGLIPTEDVVHDGVDKAQVG
>UniRef90_A0A267E9L2 NDT80 domain-containing protein n=3 Tax=Macrostomum lignano TaxID=282301 RepID=A0A267E9L2_9PLAT
MINGGFEDRDNFFLEEEHLTTSLEPHQFDPRLSNAEFIRASVLDGQKIKEELFGICESPFDQQDPSQFDSSVTYAPPATPAFVQPEALYVDQPSRIKRGYDESSSTLEVQTYRRPTSCGGGIDSCLAPPVAKRRLGHNRLQLVQTSVPSSSPSNSSSDAQSPAELGSSGAAAGQPTVAAATQPTSIVISSGPNSMATVGEYDKWSTAAQSFVRRSTIRETDALQCSAANRVGLSTSESRQIYAVDSKTAVDRITTELPPTRPPPAPPPPLSLVPSQQQNGDADVVHPPPPLRFQPWDAAPALTLLEVKPVSQNLQPASISFKIEVDKGFQFSGKEGIWICQKKNHFQITCQVSVTGCQWAVGASSGPQPVTGFRVNLYGVKAESPLDSLVSLEQSEVNRTKRLFAPIPVAMPGGGRFVRVVAQRLHFASTTLNNQRKRGDLHPDQRFFQLVLALEALTETSVAPVQRYISRFIIVRASNPGQFDSASASAVPDNPPAPTPLPQRQPPPQQRSPLPQSSMPPTVEEAATPEDAVGAWISDRPGVVYYSGNVGINTPNPAEALTVEGNLQLRGNLLQPSDARIKSIERELSPAEQLANISRIKIYSYSLSPNDVSDTGVIAQEVAGILPDAVHASSTERVPTGEPLLLVNKDRIYMENVGAVKQLGELTASLDCRIGELERMRSKLCRLRDSLRSSSSSSSTVTAAAAAAAAAAAATASSGCLVGSPRFRSVGTQSSLELEAGLPWPPNLPPPQPPPPPPPPPPPPPPPTLPKSTTPSLTVPASAAAAAAAAGQDQRNRRPRLCSHQHPVAQTLHQQQQQHQQQQRRSSFRFNVVLVALLVTLIVCFLGLASLLLIEKLLPHLSGPGFVGSRNGSSTVSSSGGGSSGGSSGSGPATPPGGGWPRPLHGASSHTTPPEPTPTQKPTPFRPASCGAGGGPCPPVRCCRGQQKLANGNSSGSGGAGSGSGDVIALFESAGDRSGSRGGSSDASSGSGNAAFWELLGAQLISPALGNWSLADAASMHCGSSSGSSSGSGSDVGGHRRRLLRYGGCTGSNLTFHLLLSNSFPLDARLSLRLTMSETLLAVRHCPPVESLSRCDGSGGPGAAADSQSSGCTPVLGDQRGFDCDVSAAASHLLHLAKFRLAAEAKNLCQLESSGLGKEFVELTVLLERQEFGC
>UniRef90_A0A2E8JXE6 Creatininase n=1 Tax=Planctomycetaceae bacterium TaxID=2026779 RepID=A0A2E8JXE6_9PLAN
MNSEAPWRLDETTLGDLEDRCTEPDDPGFDVAVIPFGCTEPHNLHLPYGTDTIESLAIGDRICGHAWRQGARVALLPAIPYGTTTNQAGVRLTLNLMPTTILAITRDLVASLVRHGVRRIVLLNSHGGNDXKWXLRELHDGPSPSAHLFLVDWXRAXRDVSDRIIEQPDDHAGEMETSILMAVRPDLVRHRSDGSLDADDGEVRSTSFEAVEKGWVSITRPWHLLTTNTGAGNPHAATAEKGETLLEILEERFGSFLVELAKGEPGPSFPFPDE
>UniRef90_A0A8J4EGG7 RGI_lyase domain-containing protein n=1 Tax=Virgisporangium ochraceum TaxID=65505 RepID=A0A8J4EGG7_9ACTN
MRAWNRRRFAALAVAAVCLVGVPLPASAAPGAPAGGGHGRVQLEKLDRGLVVATTTGGAFLSWRLLGHEVTGRTSSGMKGPGFEVYRDGRRIATVTDSTNYLDPAGTAGSTYQVAPVRGRKSAPARAWSTTHLDLPLRKPADGVTPAGEAYTYSANDLSVGDVDGDGAYEYIVKWDPSNSKDVSQVGYTGNVYIDAYELDGTPLYRIDLGVNVRAGAHYTQFLVYDFDGDGRSELMFKTAPGTKIIRYDRSGAVRSERFVSLPREDVAKGVTHADDYRMSAADYFEHLVTMFQGWHDHPEVEAGRWPATLEQAFGIAPAYTYPLSREDATALANHFVDVYAPARSARNQLRNFAGFIVDGPEYLTVFEGATGRELQTVRYEPGRHDDGLMWGDYAMARIEPGNRVDRFLATVAYLDGRRPSAVFARGYYTRSTLVAYDWDGRRLHKRWYVDSGWTPMTNPFNDSPHGRDGTDPEFRTLTTQGFHSLSSSDVDGDGKQEIVYGAATIDHDGSLLYSSFAPLPEGSASPGTQARLGHGDAMHVTDIDPTRPGLEIYTVHEGAAGAPYGHAMRDAKTGQVLFGTYSGRDTGRGMVGDILPEHAGLEAWATTGMGLWTAQGQKLGDTIPGTNQSIRWAADLSTQIVDGALEVTPTIQDHRRGTLLTAANTLTNNGTKGNPGLVADIFGDWREELLLRTADSSAIRIHLSTEVTTHKLYTLMHDPQYRAEVARQQTTYNQPSYTSFHLGTGTDWARVPVPTASYR
>UniRef90_A0A372F876 ZU5 domain-containing protein n=1 Tax=Emticicia sp. C21 TaxID=2302915 RepID=A0A372F876_9BACT
MKTLQTVAITLLSLLGLISCETDQQNPKPEQPSKGTPTEVGKPLGAVTAKMIGAQGGNISTPDGKVTLTFPAGALSKETNITIRPVENKAWGNVGIGYEFGPDGSEFAKPVTFTYRYTDKEISGVSLDNMALAFQDQNKIWQATAPLTVNKTQKTITGSIKHFSWWSMITKYRLTPEYDTVLIKQTKELQIEYLESEWPWSNKPDSDILLLVPLVAPKLADRTAISKIYLNGVDCTTTLPKDQSSGLLGFANKDNKAVVMYTAPNKKPNAAYNPVAISIELQHAGKAKLMLVSNLYIDTENTFSIDGSDPTSIAINAAYGAGALYISFEDNMSNVLRVYTEHFAPGTYTFNIKDTNIAAMHHSKKKAGGSVYEHCRDEKSESGRIVIDRIYQSNGKTVIQGSVTGKVCTLHDTDEKCNIIKHETMTVSAKFTTVVMM
>UniRef90_A0A7K4IPH3 DUF420 domain-containing protein n=1 Tax=Candidatus Bathyarchaeota archaeon TaxID=2026714 RepID=A0A7K4IPH3_9ARCH
MALWIADVNFVLQFVILGVLSVGLFYKQRGKFVFHGSTMLIAVVLNAVSFFLVMWPSFVAFDFTVLDSPLKVVSLTHGILGGIAEILGLFLVVAWGVQKKMQSCIRRKIVMRITILLWLIALVLGILLYAGLYGIITI
>UniRef90_A0A662SB18 TMP_3 domain-containing protein n=1 Tax=Candidatus Korarchaeota archaeon TaxID=2056630 RepID=A0A662SB18_9ARCH
MLRNAGIDPTTGSLKAIGDAVAALGGGQEKFNRVLIAFAQIAAKGRVQAEELLQLMEAGIPVQKILQEELGLTNEQIAEIGKLGIDAQVVLDALFSGMQRRYGGAMAELMQRFTGIISNLRDQWDLWLRDIMNAGPWQTLTALLKMALDHINRLKEEGKLDEWAEKIGKRVEDTFWNMAIGTATAIDALKEPILAVWGIIEDMWEGFKKLPSWIREIGIVAAIVGGKKGAAVIASLSWLVETLGRSVKGFEYAWKGWISWKDYITANKEELEKLIQEADRAHKTTGELGDISLDTSSKMGNLEQKVRQIRKEVEKYIETLKDEQKQERKPTETPTAKIPVEFVFDEEKLQKLYQDTIDQINKTILQGQELQAYRAEKWYEQMMENIDTLLEAGQITGEEWSRLFDRIEEGYQKLLEKSGESFDYMQEFAIQAARNMQTAMSDFFFDVMTGKFESFKEYIQGLANTISRIISEILAKLALAKIFGAFGWQAGIAALGLAKGGIVPGPVVPIKQFQYGGIVDRPTLFLAGEGRYPEAIVPLPNGRAIPVQIINKTEEKPIVVHIHIQTPDVESFRASRAQIATEITMALARARR
>UniRef90_A0A0F8B2Q3 Putative Ras-related protein Rab7 n=4 Tax=Sordariomycetes TaxID=147550 RepID=A0A0F8B2Q3_CERFI
MSAGKKGLLKVIILGDSGVGKTSLMNQYVNKKFSASYKATIGADFLTREVLVDDRQVTMQLWDTAGQERFQSLGVAFYRGADCCVLVYDVSNAKSFDALDSWRDEFLIQASPRDPDNFPFVVLGNKIDVEESKRVISNRRAMAFCQAKGGIPYFETSAKEAINIEQAFEVIARNALAQEESEEFSGEFQDPINIHIDNDRDGCAC
>UniRef90_A0A846WZ52 Signal peptide protein n=1 Tax=Tsukamurella spumae TaxID=44753 RepID=A0A846WZ52_9ACTN
MIARRLSVIGTVALATLAVVPGVAQAAPVNTARTILAAHEFPLGSTGYKVETETLKPFDEPDNANTPCSRFIRTMFERLGGAQVTNAQVTRGTTEVEVAVVNRPMAALMAEGFPTCEAQVDPRARSTVLAAPGDLTRLRPFVFRDADEMQAWVDLRGISVNVTATTKNRGPADAETFWQTLRAQVAKVERQP
>UniRef90_A0A6P6DIM4 protocadherin beta-14 n=1 Tax=Octodon degus TaxID=10160 RepID=A0A6P6DIM4_OCTDE
MIVFLNTASFGPRETLEMLLSKAPAKRQVTAILFLLLLREVGSETIKYSVLEESDRGSFVANLEKDLGLGLGELAVRGAQVRSKGSKQHLQLEQSGNLLLREKLDREELCGDTDPCLLPFQVLLKNPLQFIQGELQLQDINDNDPEFLENEILLKISESSRPGTPFPLKIAQDLDVGNNTVQNYTISTNSHFHLVTRDHNDGRKYPELVLDKALDHEEQPEMMLTLTALDGGSPPRTGIAQVHIMILDINDNAPEFGQGLYKVQVPENSPIGFHIITVSARDLDAGTHGELSYTFFQSSSQVMQTFEINTNTGEIRLKKLLDYEETKFYHVEVEASDGGGLSGKCTVKLEVMDVNDNAPELITSLLISDIPENSPETVVAIFEISDPDSGDNGKMVCSIQNHLPFNLKSTVENFYTLLTEGALDREKKSEYNITITVTDLGTPRLKTQHTITLQVSDINDNAPTFTQSSYTLFVPENNSPALLIGTISATDRDSGSNAQVTYSLLPPQHPHPHPQPHPQQQPQPDLASLVSINADTGQLFALRALDYEALRAFEFRVGAADRGSPALSSEALVRVRVLDANDNAPFVLYPPHNASAPYAPRHRLLVQVRDNGEPPLSASVTLHVLLVDGFSQPYLPAAEAAPERAQPASLTAHLVVALATVSSLFLLSLLLFVALRLCRRSGPAALGVCSAAPEGPFPAHLVDVSGTGTLSHSYQYEVCLTGGSGTDEFKFLKPFFPNLPPPNAAQQTEGSAMVRNSFGFH
>UniRef90_A0A0H3GRA2 Bifunctional protein PutA n=3 Tax=Enterobacteriaceae TaxID=543 RepID=A0A0H3GRA2_KLEPH
MGTTTMGVKLDDATRERIKSAASRIDRTPHWLIKQAIFNYLEKLENDETLPELPALLSGAANESDDASEPTEEPYQPFLEFAEQILPQSVSRAAITAAWRRPETDAVPMLLEQARLPQPLGEQAHKLAYQLAEKLRNQKTASGRAGMVQSLLQEFSLSSQEGVALMCLAEALLRIPDKATRDALIRDKISNGNWQSHIGRSPSLFVNAATWGLLFTGKLVSTHNETSLSRSLNRIIGKSGEPLIRKGVDMAMRLMGEQFVTGETIAEALANARKLEEKGFRYSYDMLGEAALTAADAQAYMVSYQQAIHAIGKASNGRGIYEGPGISIKLSALHPRYSRAQYDRVMEELYPRLKSLTLLARQYDIGINIDAEEADRLEISLDLLEKLCFEPELAGWNGIGFVIQAYQKRCPFVIDYLIDLATRSRRRLMIRLVKGAYWDSEIKRAQMEGLEGYPVYTRKVYTDVSYLACAKKLLAVPNLIYPQFATHNAHTLAAIYQLAGQNYYPGQYEFQCLHGMGEPLYEQVVGKVADGKLNRPCRIYAPVGTHETLLAYLVRRLLENGANTSFVNRIADNTLPLDELVADPVSAVEKLAQQEGQAGLPHPKIPLPRDLYGSGRSNSAGLDLANEHRLASLSSSLLNSALHKWQALPMLEQPVAEGEMQPVVNPAEPKDIVGYVREASDAEVQQALTSAINNAPIWFATPPQERAAILERAAVLMESQMPTLMGILVREAGKTFSNAIAEVREAVDFLHYYAGQVRDDFDNETHRPLGPVVCISPWNFPLAIFTGQIAAALAAGNSVLAKPAEQTPLIAAQGVAILLEAGVPPGVIQLLPGRGETVGAALTSDERVRGVMFTGSTEVATLLQRNIASRLDPQGRPTPLIAETGGMNAMIVDSSALTEQVVIDVLAPRRQRRPALLRPARALPAGRGRRSHLNHAARRHERVPDGQSGAPDHRYRSGYRCGSEREYRTPYSGDARQRPHRLPGGA
>UniRef90_A0A0X8F9Q8 Lipoprotein n=4 Tax=Aerococcus TaxID=1375 RepID=A0A0X8F9Q8_9LACT
MRKKVFLLVAVFALFLTACGSSSKETTHVKLGVVGDKNDQWEYIQKELKDKENIDLELVKFTDYRGPIVALEDGSIDLHAALTEIFMEEVNKEGGYSNTTIAYTTLNPMGVFSEKIDSLDDLRDGAVVALPNDVSNESRALLLLQTAGLIKLDPDKGLLPSISDITENPKNLNFKSMAANQTARSLGDADIALINNDMASDAGFVPTQDSIYLEPVAESSKPYYNVIAARQNEKDKDVYQTIVKYYQTDEVAKIIDEMTNGSSIPVWDKDQ
>UniRef90_UPI001E506DDD EcsC family protein n=1 Tax=Mycobacterium florentinum TaxID=292462 RepID=UPI001E506DDD
MGTVATAMGVDAAVLTACSAVVAHDALYYGYDPLDPAEEIFMMHVIALGLAETEPAKVAAYQQLTLLTESLARNAAWQQLDRQVAVKVIQKFAVKFAQDLTLKKLVQLVPGLGVGLGAALNWTTVGEIADAAYWAYRERFLYERAPNSSPSQPISRAPRTTIDYRSISKTSSSRKASSSTANANHGDPTAPTHYRDGQANKGRAPVDHIATADAIAAAAHAGQVDKAGMPYIGHVRRVASYVDPANTDAVVAALLHDVIEDTGLTAADLAERGIPQAAIDAIELLTRRDDQPSADYYRRISAHPTAGKSSSRTWPTTPIPNGWQT
>UniRef90_A0A117EBF1 DUF5753 domain-containing protein n=6 Tax=Streptomyces TaxID=1883 RepID=A0A117EBF1_9ACTN
MTSKLSRIETAKSPTKPNDLEDLLDLYAGLGRDVDDELRAALLALTNEGVRRGWWHSYRGTLTPVYEDLISLEAEAESVSYWQLGAIPGLLQTSEYAREIIRATAMSADVEARVDALVEVRLARQVVLTRETPLTLRAIISEAALRSTSGVDGLMDEQLGRLLTMGKRPNVHIQVLPSDAPLHAGQVGSFVILGFGPHADLDVVHIEGLSSASYIIEEREKVATHRDAWQRLTTTALPPEASTELITEIRKSV
>UniRef90_A0A6J2SVJ9 carboxypeptidase B n=1 Tax=Drosophila hydei TaxID=7224 RepID=A0A6J2SVJ9_DROHY
SLNSFKIYEVATKSRSAGDGLDFSKLANNDSYYELYYSNDAATHVLVHPDAQPEFIELLNGNTLSYKIVNHDAGLSLHREFETNRKLRNAHPYRGRLGTERYYSHGEINQYIEDLAKQHPTRVLVKTVGRSYEGRWLKTIRITNGDGRANKNVILMDGGFHAREWISPAAVVYAIGELVDNYEAYAQLLLDYDWVILPVVNADGYEYTQVSPDTRMWRKTRQPSSAACIGIDPNRNFDFHWNETGASSDPCSETYAGPKSFSEPEAIVVRDLIRGLADRGKMYLTVHSYGNYILYPWGYIDELPDTWEDLDEVGRAGGDAIKAATGTIYKVGCSTQLLYPAAGASDDYAFNAGFPISFTMELPAGGDNYFNPPPEDIDRLVKETWVGIVAMAQKVVEKYPLN
>UniRef90_A0A4Q6E3N3 Glycosyltransferase n=1 Tax=Sphingobacteriaceae bacterium TaxID=2021370 RepID=A0A4Q6E3N3_9SPHI
MDVSIIIPYYNAGNYLPDAISSVRQLLRRTDISCEIVICDDGSTDPYSIEILSGLEKEGLFTIARQPNKGPAAARNTAVKNSTGKYLVFLDSDNKLRERLVEKGIEILGSNKADVVYGNAAFFGESTKPLFTQGELNIPLLMARNYIDMCAIVRREVWETTGGFDEGEELRKGQEDWDLWLRAIKAGFRFLYVDEVLFDYRVRAASLTNDDSLERYNKAREYIYSKHPDFFKQSFFWLSDQLYAYQQDKRTPFRSFFKYLYLKYFKGGK
>UniRef90_A0A1W9W8B2 Prenyltransferase n=1 Tax=Anaerolineaceae bacterium 4572_78 TaxID=1972460 RepID=A0A1W9W8B2_9CHLR
MKNHSRSTKDLSFASNKLSSKIVSKPKSKVRLRTIALPAEHGSWGFVLEPICLGLGVAPSWAGLCLAIGVFALFLLRRPLKIILTDWQNHTTPPPPLKRRGAMRTVIAKRFVMGYGLIAVLGLISGVWLAGWESLYPLLIAVPFSMIFIAYDVKNKSRTWQAEFAGPTAFSLAAASIALAGGWAYNVSFALTGALFARAIPSVLYIRARIRLDKNKPHNKLLAIGMHVVGLIFVAVLTVGAYNHKPLLPTLAEVGLGIFLVLMMIISTRL
>UniRef90_A0A3N5LLQ8 OmpR/PhoB-type domain-containing protein n=1 Tax=Acidobacteria bacterium TaxID=1978231 RepID=A0A3N5LLQ8_9BACT
MKELPEEKTALTQELDRIVKSEAFRSSESLRRLLLYLGNKSLAGEAGDLKEYVVGVEAFGKSSAYDPQLDASVRIQAGKLRQKLQEFYRTEGMEDTVVVSLPKGHFQLDFELRSKPQERQQLQSVPRKWKIAVWSLAAATLLCCSCIAYLLLSVPSGNQPDGNGRLTADLRAIWDPVLKDDRPLVVAVGTPLFTKIGQGFYRDPAINEWNHSAVPSHLERLRDTLGATTLIPAPIYTGIGEATAAFLLCRLLSSEKDLEVRRSSALSWDDVKENNMIFVGCQKYNLQLRDLLSQQDFFMDGNHITNRRPRKGEPHSFTGTCPPDSAYVTQDFAVVTKLPNVQGRELFALAASSTEGTWAASEFLTNEIHARELVSLLRTPSGEMPDSYQVVIRARFRGQVPFEMAIVAERGASPAKSEATDTQTRR
>UniRef90_R8W248 Undecaprenyl-phosphate glucose phosphotransferase n=3 Tax=Butyricicoccus pullicaecorum TaxID=501571 RepID=R8W248_9CLOT
MKGFLQLCRSQLLSGISLGLALMVSALFAVYSFGDSAISARWMNLLPCMTVLYMLAGVLLMAWHRRPPRRRPATPYLSGLNARYIWVLPAFLWWLLFRLTGFDVLERCLLFNLILLAVLWTVEYSMARRMAKALNGALGTRTPTVMPASLIVDLDDCPKGIEAFCIEIERYCIKNHIDYQFIERDKPAIVLMNGVKHRVELGVYYGYVPGWFLKFTEL
>UniRef90_UPI0006692FD6 MazG-like family protein n=2 Tax=Pasteurella TaxID=745 RepID=UPI0006692FD6
MKLTNEQLIDNIKQWARDRGLDTGSTLGKQFVKLMEEFGELCSGLAKQKTDVIADSIGDMIVVMVVMNTIYDNLPLQLKSDSDDKLLIKETMQRLESKYKQDQINTLSEHYFNHYDRRVSFAVGALNALGDETSRIDVFGKDTNIDFMSEAMFSLFRELYNLATAFGLNVNDCLNQAWNEIKDRKGKMIGGAFVKEGDLKDGQ
>UniRef90_A0A387BQQ7 Alkaline phosphatase family protein n=1 Tax=Gryllotalpicola protaetiae TaxID=2419771 RepID=A0A387BQQ7_9MICO
MATLPNAYSQSVSLAAVLASCFAAVERGAPQLPLAPVDAAVVVLADGLGALPLKARAGHARTIAPRLNRATTIESGFPTTTAAALATLCTGVFPGQHGITAYEAVDPEADRVFNHLSGWKTGPDPATWQRVPTLFETHAATGIRSYLVGQARYADTRLTQAVHRGAEYVPAKSIAERMSAAISLARAGRAVVFVYVPELDMAAHQYGWQSPEWTAALEELDAGMAQLERGLGKAQGALLTADHGMVDIADSGKLFFDREAELIEGVRHVAGDYRCVQLHLEPGATAGDLERLAQVWHEAEDDRAWVATRDEAIAAGWFGPSGVADEVLPRIGELLIAARSQVVYYDTRSTNAGNWSMVGQHGSFSPDEVRVPLIGFGAFA
>UniRef90_A0A4Y2A7J8 RNase H type-1 domain-containing protein n=1 Tax=Araneus ventricosus TaxID=182803 RepID=A0A4Y2A7J8_ARAVE
MSKKIRILHPPKSEFVSVYRTPSRKSVPIFIMMKFKFLDINSIPRFPPVGSKSFFAASCDFHVFSYHIETEVHQFRIRDECSVFQAELLCIAQAVNWIRTNENLSSNFLICSDSLSSLYALNCITSPNRLIVKTQTNLNFLHGRGVKVFFSFVRGHIGIYGNERADWLAKEATKLIDFIPVTVRKSFYKSVFKKHVISQWNNLHQISHNAKSTKEFFPSIHGRLKAVHFVPNFRVTQFLTGHGNFKAYLKRFNLSRTDLCSCSSGEIQDVNHLILSCPKFTPARCLLVSTLKKNNFAWPPSFSTLFQNKTCFASFCEFIDGIFPHTI
>UniRef90_UPI0018ED6A80 IS30 family transposase n=2 Tax=Dyella sp. ASV21 TaxID=2795114 RepID=UPI0018ED6A80
SLTWDRGKEMADHRRFTLATDIQVYFCDPQHPWQRGSNENTNGLLRQYFPKGTDVSVYSQAKLDAVARRLNERPRQTLNFETPAERFQQCVAMTG
>UniRef90_UPI0020CC1823 hypothetical protein n=1 Tax=Phocaeicola vulgatus TaxID=821 RepID=UPI0020CC1823
MTTLSSIADYVTDKISSNDISLNEYVTTDCILQNKKGREIATNLPPQPCSLAHYKRGDVLIANIRPYLKKVWFADIDGGASSDVLVFRAKEGHSPSFLYAVLLQDAFFDYVMQGAKGSKMPRGDKDQILRYKMPTLSCSEESIGTLFMNIDSKIRLNEQINQNLPKLDHSSEGAEARHVA
>UniRef90_UPI0021123217 secretion-regulating guanine nucleotide exchange factor isoform X3 n=3 Tax=Delphinidae TaxID=9726 RepID=UPI0021123217
MEREPSATAAAPAAAALFAWGANSYGQLGLGHKEDVLLPQQLSDFCNPGCVKRITGGGGHSAVVTDEGSLFVCGLNKDGQLGLGHTEDVLYFTPCKSLLGCPIQQVACGWDFTIILTENGQVLSCGSNSFGQLGIPHGPRRCVVPQAIEPLREKVVSIAAGLRHALAATASGMVFQWGTGLASSGRRLCPGQTLPLFLTAKEPSRVTGLENSQAVCVLAGSDHSASLTDAGELFVWGSNKHGQLTSHAAFLPVPQKIEAHWFQNEKIAAVWNGWTHLVAQTETGKVFTWGRADYGQLGRTLESHEGWKPKKQDPSVRCSRPSKSTPSSLHCLTGATEQRLLPDAGICQWLVSGSPWSSRLVSSAALSPRVSCGSEHNLAVIEDLVLFQSLAFQVVSPQQCYPSTSQHSGFVVLRMGHWSCHHRLSVSGFRFPARPCEGDVHVTCLPSHDSRFRTKALR
>UniRef90_U3A3Q0 Fimbrial protein n=3 Tax=Vibrio TaxID=662 RepID=U3A3Q0_VIBPR
METMKTFVNNFINDEEGLTLLEYILGAALIVAALLSIGFWDTLASKFTDVASEISGINPTP
>UniRef90_A0A2E3DER3 Phenylalanine--tRNA ligase alpha subunit n=2 Tax=Euryarchaeota archaeon TaxID=2026739 RepID=A0A2E3DER3_9EURY
MDXVDLSPNELKLLKCLRVGTLTPHEASLKSELGEKETMSAASWLRSKGLVNILEESTTFLFPNEEGKKYAEQGLPERRAVEWLNQMGESLVDELPLDDDEKKVVIGWLKRKKFAELEKTEEGLKLIPTGNIDETPDENLLVILSRKPLAESEIDKEGLALLKGRQVLSSKEEISRTFTLTEEGQNFDVDSIDEGMIGELTPEIIKSGSWKDKTFQKYSTETSIESSDFATLHPLTRFTEEIRSIFLQMGFSEIEGDYVESAFWNMDVLFIPQDHPARDLQDTFYLSEPASFVINDQDLVEQVKAIHEDGGETESAGWGSKWSKEKAQQALLRTHTTVGTIRHLSNNPDPPVRVFSVGRVFRREALDATHLPEFTQVEGIIVEPEANFGMLIGVLKEFYRRMGFHDVRVRPAYFPYTEPSLEVEVRFGDKWLELGGAGIFRPEVTAPFGIEHPVLAWGLGLERLAMLHLGIKDIRMLYQSDLQWLKETV
>UniRef90_A0A842MRA5 LLM class flavin-dependent oxidoreductase n=1 Tax=Candidatus Bathyarchaeota archaeon TaxID=2026714 RepID=A0A842MRA5_9ARCH
MSLKSFKQLNFVGTPEDLMQSMQPYLDLDVTFFMLYFGDLPYGDSIKIFAETILKELS
>UniRef90_A0A3Q7RJQ3 complex I assembly factor TIMMDC1, mitochondrial n=41 Tax=Carnivora TaxID=33554 RepID=A0A3Q7RJQ3_VULVU
MAVRPRAPQCFLCGRLGPLPRVFAAGAVAAEAGALAGDQELPEYAESGWDRLRDLFVKDEQQRTSKELENIYKAAVSAGIIGWAYGGIPAFIHAKQRYVEQSQAEVYHNRFDAVQSAHRAATRGFIRYGWRWSWRTTVFVTIFNTVNTGLNVYRNKNALSHFVIAGAVTGGLFRINLGLHGLVAGGIIGALLGAPVGSLLMAFQKFYGETVQERTQKDRKALHELKLEESKARLQFTQLLPEEIESSLQKNQSKDDVKKIEALLNLPRNPSSTNKQDKD
>UniRef90_A0A0F9E616 Deacetylase sirtuin-type domain-containing protein (Fragment) n=1 Tax=marine sediment metagenome TaxID=412755 RepID=A0A0F9E616_9ZZZZ
MKTIDLFPPCTIENCEDKTPLHKHILDLQQEFLDASERFVAL
>UniRef90_UPI0021BE6A85 DinB family protein n=1 Tax=Deinococcus sp. Marseille-Q6407 TaxID=2969223 RepID=UPI0021BE6A85
MTQADPRAQASTLAFARLLPKLFRGGQAFLSVEEIISDISPEQAAQQPERLPHSVASLLDHVNWWNRWMLDILESGEAKPYPEHAADTWREVPAGEWNAVKTEFYDLLARIDAHAARPDLSNPVNFEETVGELLADFALHTAHHFGQIISVRQSIGAWPPSGGGDTW
>UniRef90_A0A1S3XUT0 cytochrome b5-like n=2 Tax=Nicotiana TaxID=4085 RepID=A0A1S3XUT0_TOBAC
MPTLTKLFTMEEASQHNTKGDCWVVIDGKVYDVSSYLDEHPGGDDVVLAATGKDATDEFEDAGHSKDARELMEKFFIGELDSTSPPIPELEIVKKAAKNIPQKVKEITKQYWFIPVAVVGISVVVGFLYTRKK
>UniRef90_A0A8T1TPU1 Secreted protein n=2 Tax=Phytophthora cactorum TaxID=29920 RepID=A0A8T1TPU1_9STRA
MKVALSFFVVVLLSPMTGSSWLAAGNWCLGYTRVLVAGLELMVKDCSAFMFTIVGALEYGSGIIQNGRQVCIC
>UniRef90_A0A443J140 Ribonuclease n=1 Tax=Siminovitchia fortis TaxID=254758 RepID=A0A443J140_9BACI
MIIHSIVPHEHIFPANKDDFSNQTECIWNNIPLLVEQDGHKCKVIRIMSSNPSDYLKSEIQPGSHLYINEVHFS
>UniRef90_A0A2T0LCA4 Bh protein n=1 Tax=Planifilum fimeticola TaxID=201975 RepID=A0A2T0LCA4_9BACL
MEFQELQTELYCIKCEENEMHVLTYLNQRLYKARCEGCGHELFISPDPRKVLYDEFLQRIVTKPERISRELKENPRRIVTLPYRVISKPYRMYKEMQGLRQFIAQGKSRNGSKIS
>UniRef90_UPI00203278C4 MarR family transcriptional regulator n=7 Tax=Curtobacterium TaxID=2034 RepID=UPI00203278C4
MQFVSRAEEAGRTVRVKDLSKHLGLTGPAITGMVDRLEHSGHISRVPNPDDGRSRYIELTDAARRDYARAMDGTNKHLHDLMASFSERERARFVRIIDRIVAAVDLGAPSP
>UniRef90_A0A6A5UJA8 SET domain-containing protein n=1 Tax=Bimuria novae-zelandiae CBS 107.79 TaxID=1447943 RepID=A0A6A5UJA8_9PLEO
MGFVSHPESCVNSLPCLFGSGYTVEGQKTSVEAHGGLQIEVIPKYQDHLRRWFQDTDGHVKTLDLNDVDIDWSQNLNEHDTPASIGLRVGQSVRSYAEPALQRKPLNVEGVAGQRDAVTPQAKYWTSNINASFSLSDPLLVPEFSMWNTKAHAATPATATVTTEAWETTLFSGKKKKAKAKNQWSLGSNEGVYLLNLEIHSSCDTLPEQEPAAEEVLEVQTRDPKAMGLAIDGKIVQDIY
>UniRef90_A0A849VSC1 High-affinity branched-chain amino acid ABC transporter permease LivM n=2 Tax=Phyllobacterium TaxID=28100 RepID=A0A849VSC1_9HYPH
MADVQNTERDSVFAKALKEGIISGAIALGLFCLIVGFRTEQNIRNELILTQRWGLLAIFVLVAAVGRFLVTYTAPMRAERKKLHKVAEAREPSAFRKSFPKIGLGLLFLYPALVVLILSAYQGSMMGGLQASLKYVDNFGIQILIYVMLAWGLNIVVGLAGLLDLGYVAFYAVGAYSYALLSAHFGLSFWLLLPMAGIFAATWGIILGFPVLRLRGDYLAIVTLAFGEIIRLVLINWTAVTKGTFGISGIAKATLFGIPFTPGPTGFAAMFGLPNSGVYYKIFLYYLILCLALLTAWVTIRLRRMPVGRAWEALREDEIACRSLGINTTTTKLTAFATGAMFGGFAGSFFAARQGFVSPESFVFLESAIILAMVVLGGMGSLVGIAIAAAVMIGGTELLRELEFLKLIFGPDFTPELYRMLLFGLAMIVVMVWKPRGFAGSREPSAFLHERKMISGEFTKEGHG
>UniRef90_A0A370FR42 NTE family protein n=4 Tax=Pseudacidovorax TaxID=433923 RepID=A0A370FR42_9BURK
MSASALPLPGRRPKVNLALQGGGSHGAFTWGVLDALLENGRLALDGISGASAGAVNAVALAHGFAKADDAGDPARTAARQAARETLERVWRRVAGVGAPGALASQFMRMLFGQAPAFPSLTTDPWASPYQFNPLGINPLRTLLDQEIDFDALATLDSPRVYVSATQVRTGRAQIFHGAQLTLSAVMASACLPTMFQAVEIDGEPYWDGGYSANPALLPLIENCDSADIVLVQLNPLHRADTPRTPHEIAQRVDELAFNASLISQMRSIDFMQQLLADGRLQEGRQFRQLRLHRIDIDSALDDPLPSSSKLSTDIAMIEQLFERGRHAAQDWLARHIDDVGRRTTIDIQADYVAGAPLPTEPVAKRAPQLRSA
>UniRef90_A0A024U664 TAZ-type domain-containing protein (Fragment) n=1 Tax=Aphanomyces invadans TaxID=157072 RepID=A0A024U664_9STRA
MTSTPFSSSTSTAPMTDGGATLSIQLPLPEQVAVLATHHSEIQLSQTEIHADSTTFLSRVQRYADTGKVDVDGLTATDAAALVHILRRLHATFVKQIDCDEIKCDASRKCPKCGASRVPSSPETSPQRNGTGTTPMSPTAASFRLNGSNSPPADVDMT
>UniRef90_UPI0016706687 nitrate reductase subunit beta n=2 Tax=Streptomyces TaxID=1883 RepID=UPI0016706687
MRVMAQIAMVMNLDKCIGCHTCSVTCKQTWTNRAGVEYVWFNNVETRPGQGYPRRYEDQDRWRGGWELTRRGRLRPRSGGRLRRLASIFANPLLPGIRDYYEPWTYDYRTLTEAPAGDDFPVAAPRSLISGERMDTIPWSANWDDNLGGMPGHGPDDPVLARMSQKVRLEFEQSFMFYLPRICEHCLNPSCVAACPSGALYKREEDGIVLVDQDRCRGWRMCVTGCPYKKVYFNHRTGKAEKCTFCYPRVEAGLPTVCSETCVGRLRNLGVLLYDADRVREAAATPREQDLYEAQLSLFLDPHDPAVAGAAERAGIPLAWLDAARRSPVYDLIATHRVALPLHPEYRTMPMVWYVPPLSPVVESLTATGHDGEDEHNLFGAIASLRIPVAYLAELFSAGNTGPVDTALRRLAAMRAHRRRLNLGERPDASIAGSVGMSTEQLDDMYRLLALAKYEDRYVIPTAAVGDARALEESALGGCSLDFEGGPGMGGGHGSGPFGEASGRPAPATVETFHALRARATDDRPADTAGPGARVNLLNWDGNGRPDGLFPPRTGRDGDDADGDGDGDGDGRRR
>UniRef90_UPI0002DB281B autotransporter domain-containing protein n=1 Tax=Chlamydia abortus TaxID=83555 RepID=UPI0002DB281B
MLCPPPTPEPEPEPPLEGATSLTKLKEANLGSIPSPMGIMHSSVESSETTDNSVFTFEGNSGLTFSENSSDKCGGAIYAKNLKIVSGGPTVFTNNTAKKTGGAIADGGTLSLTAESGDIIFKGNTSNGGTPNAINIGSKAQITDLRASQGRSIIFYDPISFQPEAGTGGTLTEADGTLKINAPDPLPEKSSLPSMGRLMIRAEGDGQPTSKSYTGTVVFSGKSTTKAKEVTNIFLFPSPVELTAGRLVLSDGALFSATSFTQKDADSCVMLEQNTQLQASNSMDLKNLWVNIKDLNSSTFARVSAMGSSGNVNVSGPIIFTVSDPDFYNNPKLAQQLSREFLKISATRGQVTVSDNSNITNDKEETHLGYQGIWKLTWEDSPTGGSGNEKVANLNWQPLGYIPTMDDTQSYTSLVPNSLWGMVADVTAIQRLIEGEANSATGKDIWGAGLSNFFQGKKTHRNRKFRNFSSGYAVGVSSQSLHNFKFSFGFCQLFGQAKDYGETRIHEKILSGSLYTEYSTELLPILKFLAGTSVFKPKILKQVPEDFLVKFQSQSGYFYGDNSMKVRYSDGTQTHSSWENHCYSGDIGTSITLPIKSKDGLLQKATPFVKVQSVYIYQKGFHEKGLRRRAFSHTYLTNISLPLGIKIHGDSLSKDLHYELSAAYVGDAYRHNPKNITMPIVTHVVTTPWLTTATNLQRHAAQFACSGDYALTSYIHLFAQGSIELRKSARGYHANAGSSIHF
>UniRef90_A0A7C1IRV4 Glycosyltransferase family 2 protein n=1 Tax=Chloroflexi bacterium TaxID=2026724 RepID=A0A7C1IRV4_9CHLR
MFLSLIFPAHNEEHRLPPSLMAANAFLAKQPFESEIIVVENGSQDLTAVVAEAFAAEHPRVRVIRERGRGKGLAVRRGMLEARGQFRFFADVDLSMPIEEVSKFLPPQLGGFDVAIGSREAPGARRFNEPAYRHVQGRVFSNLVKWFALPGFEDTQCGFKCFTAHAAEDLFRTQTFDGMSFDVEVLFIARQRGYKILEVPIDWYYRSESRVDPLREPLRMLRDIFTIRRNWAAGKYVKREA
>UniRef90_UPI001E5CF05F helix-turn-helix domain-containing protein n=1 Tax=Streptomyces sp. UNOC14_S4 TaxID=2872340 RepID=UPI001E5CF05F
MADHDETVFFRGGDISALHALVGAEFSPYRLRVTGSCPRAEGSFRRLGRGALSVYELGYGVDADVLPGELPDFYHVHIPLAEHGVLTVDGKEPDSPLSVVGPGQRLVMSWRGDSLNQIVHVPRRTVDRAVAVRLGEPPASVVRFDPSLREENAPVRAWLSVVRAYVEGAEGGLLSASPLAQGHFEQLLVHGLLDTQPHTLGGALRESAAVPPAAVRRAVVFCDEHAHEPISVADIAQAARVSLRALRSGFRAHLGTTPLGHLRRVRLTRAHDDLRAAALGDTAESVTDIALRWGFTHLGRFAQAYRDAYGRTPSQTLRGEG
>UniRef90_UPI001E4F729E glutamate--cysteine ligase n=1 Tax=Blastococcus atacamensis TaxID=2070508 RepID=UPI001E4F729E
MGVEEELLVVDANGRPVPKGPQALDVASRAGEGEDVNLHDRAEHGEVETPETAHLMPELKAQQLELGTPVCSTLDDVRRELRHWRGRADAAASAVGARVAALATSPVAVEPVPTEGERYARLNEAFGLTAWDVLTCGCHVHVSVADDEEGVAVLNRIRVWLPVLTAMTANSPYWRGRDTAYASFRSQVWHRWPSAGPNGPFADAADYHRLVDEVLATETVLDTGMIYFDARLSAKWPTVEVRTADVALRVEDAVTLSGIVRGLVETAAREARAGGAVPHMRPEVLRLAAWRAGRSGLSGNLVHPPTGRPAPATDVLAELVDSIRPALSDAGDEQAVEQGVRAILERGTGADLQRRVHRETGDPAAVVRAAVEATHEDADRATAEATG
>UniRef90_A0A8J3L304 Aminotransferase n=1 Tax=Catellatospora coxensis TaxID=310354 RepID=A0A8J3L304_9ACTN
MTVSHGPESGRPARFPVASMSDLVDRPVRYDLAESTSPPLRLDELLDGDVADRLGALEIGYGTSQGDAELRALIAAGAGVSPADVLVTAGGSSGMFLLAFTLCRPEDHAVVVTPCFPPARAALDALGCRVTPVALSFDDGYRLDVDAVAAALTPQTRLVSLASPQNPSGVRFTEQELRALLGRMAVAAPHAVLLVDETYRQSCYGAAPVPRSTAGLSPRVVTCSSVSKAHGAPGIRVGWLTVTDPALYESLRVAKFNTLITGSGVDELLAAEVLRREEQILGVRRTALATALDTLDRWTAGHRDAVEFVRPDGGALCCLRLRADRYDDQAVRRFHEELAKRETRVGLGGWFGEPDRVFRLGFGHLPAPDFRTALERLAEALAVA
>UniRef90_UPI001BED38F5 hypothetical protein n=1 Tax=Arthrobacter sp. ISL-28 TaxID=2819108 RepID=UPI001BED38F5
MKSKLLFGAGIAAGYVLGSRSGRAAYDKLKARATSIWDSKPVQDKVTAATEVVKEKAPEVGDQLSEAARRAGTVLSSAIHRDASKSADATSGGTSASVGTSVSSGTSASATSTSGTGASGTGASTGAGAGGDTLGSGHVPAHSTHPETVNLGTTSDVESDPARNDAMGQDWSDEGGATDAGAATNVDSKRH
>UniRef90_A0A3B9ZLU8 ABC transporter permease n=1 Tax=Prolixibacteraceae bacterium TaxID=2053594 RepID=A0A3B9ZLU8_9BACT
MNKSFLILKREYLTRVKKKSFIIMTLLIPLFMAAFTILPAYLASMDDKEERTIAVYDPTSLILGKLEDQGYTKFHYIPEQQYNELRKDFKSGQFYALLYIPENILTTNQAELISDKQITFDIKNMVSGRIGTIIETEKMQQVINETGMPDLEKKLAATKTHIELTTIKLGEEGKAVKSSTEIAMAIGYACGFLIYMFVLLYGTMVMRGVMEEKSSRIVEVIISSVKPFQLLFGKIVGIGLVGLTQIALWIILGIGISTGATFFMGGGSAATAVHAQDIMSGGKAMEQMASSNAAHGNVALDIIQMIGNLNLPLIFFALFFYFIGGFLLYASLFGAVGSAVDSDEDAQQMMFPIMMPLIFSIIMLFPVVKNPEGALAFWVSMIPFTSPVTMMVRIPFGVPVWQIILSMSILVATILGTIWVAGKIYRTGILMYGKKVNLKEIVKWLFYKN
>UniRef90_A0A136MJX9 Homoserine dehydrogenase n=2 Tax=unclassified Candidatus Omnitrophica TaxID=1047005 RepID=A0A136MJX9_9BACT
MAKEVKTGLVGFGVVGTGLVQCLQNNQHQIDDRAGIPIRLKTIADLDILTPRDADTSGIHLTTDVNDILNDPEIDVVVELIGGTGFAYDLITQALNAGKDVITANKALLALRGQDLFNLAHKKNRLLLFEAAVGGGIPIIQALRTGICSTEVERIYGILNGTANYILTRMEEAHLDFDVALIEAKAKGYAEADPTYDIEGHDTTHKILLLSQLAFGCQIRFDDIYREGITRLTFFDLQMARELGYRVKLLAIAKREGDRLDIRCHPALIPLSSQLAAVNGVYNAMVVAGHPVGTVMFYGPGAGGPATGAAVASDLMEVARQIQRGNQRRNDYSFDYRNLAIKPVGESACPYYIKLNVLDRPGVVAQVTAVLAEQSISIASFIQKERREPHEAVPIVLTTHEASESAMELAVEKIATLDSVVERPFLIRIENLQ
>UniRef90_UPI0017897FD0 DUF1906 domain-containing protein n=2 Tax=unclassified Paenibacillus TaxID=185978 RepID=UPI0017897FD0
MAKGFDCATPLTDSTAAAFKRDGYVFVARYLVPSSWKALSVKEVQSICNAGLQIVSVFETTADRALGGRSAGLKDGAIALDLAAQMGQPPGSTIYFAVDFDATPAQMSSVIAYIKGASEATPGYNTGVYGSYAVVEAVYAAGACSRFWQTYAWSGGKKSSVANIYQYLNDIVVNGIGIDLNESYGQEGWWSTIPADYMLNPEDANKLIGFMKAGYEAANDAAGKEDFHRLANELRKASGQPEQ
>UniRef90_A0A377GHF6 Sulfate transporter ychM n=2 Tax=Legionellaceae TaxID=444 RepID=A0A377GHF6_9GAMM
MLAIVESYRAGLLTSKYWIQNLIAGLIVGVVALPLAMAFAIASGVKPEQGLYTAIIAALIVGIFGGSRVQIAGPTGAFVIILANITAQYGIDGLQIATLFAGFILVFMGFLKLGAVIKFIPDPVIVGFTGGIGVIIFVGEWNDFFGLSVHIPLNAPFYLKLLALIRAFPNLDWSTVGLAGLSLFLILITPKFLKRVPGPLIAMVVATVLQTLFHFKSVATIGSTFGGITQTLPQFHLPQIQLEYAFNLIGPAFTIALLGAIESLLSATAADGMSATRHHSNQELIGQGLANILSPLFGGFAATGAIARTATNIRNGGNSPIAAIVHSIFLILVIVLLAPFASNIPLCTLAAILFVVAYNMSDVPHFIYMIKHAPSYDLLVLITTFLLTIFTDLVVAVNVGVILAMLLFVRRMGQFVAIEQQDHETLKNELSDIILPKNTVVYTIQGPFFFGAAEKLERAFMITHSDPKNIIFRLKDVPFMDITGLQTFIEIIEQFHKRHINVYLCEAKSNVKNKLMNIGVMHLIKGERIFPTLKDTIKKLQN
>UniRef90_A0A0N0UYH6 Lipocalin-like domain-containing protein n=1 Tax=bacterium 336/3 TaxID=1664068 RepID=A0A0N0UYH6_9BACT
MKINLILKFLVLVAIFTFSCKKKSEPTPKDLLTAHIWIGVNLNYNVNTFGFSDAQIVNTDSTAVEFTKDNIVIFYTRDVNTGLLTERNRQTYTLSSDSKKIEISSTDGLLSPEIQASLSVFGITVPTSINIEKITTTELILKGSLQQNINIPQLPIPVPLTANYTWTYRN
>UniRef90_UPI001CF7C5F2 V-set and immunoglobulin domain-containing protein 2 n=1 Tax=Varanus komodoensis TaxID=61221 RepID=UPI001CF7C5F2
MTGKMKAPAPPHLTLTSATQLPRHPLTGLGACVDVTVPHGQVMQKKGLNVTLPCNYQTSVDKAFMLEWKFSPGSTSPDGGKQILYFTSNTLYKPGAQAKRLHLLQDPPTLGIATIQLTDLRSSDAGIYTCEVNNPPDFYGTSFGQIELIVLMAPSSPVCRGTTSVSVGSNTTLTCNSTEGVPAPIYSWKRLDSKSPLPVSNTVQNEKTGTLELLNVSLALAGIYQCTSSNEFGQKTCQITLQVTAMAQAGVIAGAVIGVLLALLLLVGIAFYVLHRRKQKRNKKAQSIYSANEIREDATAPGISETSLQKKDSKSELHLLESESSRPGSASTTKSQLKHLFI
>UniRef90_A0A6M3IHK1 Putative peptidase n=2 Tax=viral metagenome TaxID=1070528 RepID=A0A6M3IHK1_9ZZZZ
MKIERRCLPITELRTIRDEGQRPKISGYAAVFNMLSEDLGGFREKIDPGAFKKSLGASDTRMLWNHDSNYVLGRKSAGTLKLKEDEHGLKIENIPPDTQWARDLLVSIERGDVTQMSFGFRIEEDKWEEKEGKETIRTLVSISDLMDVSPVTYPAYPDTEVALRSLDEWRAQNDPEHANAAGDHSEDANAPESVPFQALHRRRGLELKLKNERAE
>UniRef90_A0A7L9FI35 Magnesium-translocating P-type ATPase n=1 Tax=Infirmifilum lucidum TaxID=2776706 RepID=A0A7L9FI35_9CREN
MSSEGEWVERDARELVPGDIVFLRLGSIVPADAKVIDGNVLVDQ
>UniRef90_A0A538JN64 DUF5666 domain-containing protein n=1 Tax=Actinomycetia bacterium TaxID=1883427 RepID=A0A538JN64_9ACTN
MGTRTIKAVSAVTALAGVAAITGMVAYERGESHASSATVRYAVHLDGLAVVDGLDHVSRGHELRVAGSYDGRRGTLTITRN
>UniRef90_A0A6L5NWZ8 Methyl-accepting transducer domain-containing protein n=1 Tax=Shewanella sp. XMDDZSB0408 TaxID=2664453 RepID=A0A6L5NWZ8_9GAMM
MFFKKSKAAKVNQSTTAEVLKGSSNRVADKLALTQYSLILCYLPPSLAAQDVSQLTKQLTQRCGDVITIMSSGTISGTENIYNSPDESNVVIHAFPKSMISDVSVAKISIPAHTTDKEIHRHKNSLKSSLKGVNFNFDVDLKDTFILSYFSGLNAFENQTVESILNSGNENFSTHIIGGSAGGKLDFKSAAVAHNGNFSESQLLLVAVKLHPDFGYAINKTHNFAKNRISFVVAKSDNTTRTVTHVLDDNGNLTSIVSYLCSALSCSKQELSAQLANKQFCVDIEGDVMIRSVAAVDLEKESIAFFCDMAFGETIYMVTQEDFATKSNREFDKFTNDLTAKYCQEIDTIIGIDCVLRRLQNDPKVLKQVRLNNVKSHAAFSSFGEIHGQHQNNTSVLVAIYRKQTQSPHASVKRYFVALTEVARYYLAVELNRERFIGELKTSLIDELNHYEGIVVSSTEDLLRLSELSGLIDGEQQTVSQLINELLAKGESQAQIRQDLEARVTELKNSSKQILNVMSSIDAIAEQTNLLALNAAIEAARAGEAGRGFAVVADEVRSLASKSQQDIGRSREAIDSVELSIANISKSVDILTTTSVQMEQSIESAMEQTKKIAELTSKSSQIATHGLSSAQANQNEHVRIQAQKDKLTSLL
>UniRef90_A0A265NDR7 Hemerythrin domain-containing protein n=1 Tax=Virgibacillus indicus TaxID=2024554 RepID=A0A265NDR7_9BACI
MAITGPALRHLDSHRSIHQGAYAEARDITDVMNRLFYDNRMEDCLKAANALVEYWETRVIAHADTEDEGFYKELLEKKPELTKEIHMFSRDHDLFRKIVADIKEEISEEEKVTKNMVNQFNALLIIKKHHNKGEEENLFTE
>UniRef90_A0A838GFU4 Carbohydrate ABC transporter substrate-binding protein n=1 Tax=Chloroflexia bacterium TaxID=2448782 RepID=A0A838GFU4_9CHLR
MATSWARLYNQDLFTQAGIEAAPTSWSELIDAATRLNEAGITPCAGSWNPSWFGRHFLSDFYSTEYEALTGCDGSPGQSPQDEAAAIKAGILSTDDPRFMAWWPFFKGLTDLWSPEYLAQELSVADEGAQEDFQAGQSAMFYSGSWIPRTLQTVGIEFELGSFSFPQLTTEDIEFATNVDVAGVVGGPNAAFQYAMSTPESNTTLEEEGKEAAVIDFLHYIGTPEVIEKVVNELGSFAPTWPGTTPVTGLETFAEQANTGLRVVNIGNSSATILPSWERLFGLYLSGNLELEEAANQFQRELDRGVQGYEEDNPDLDIDSCFAS
>UniRef90_A0A1C0A8Z2 LYZ2 domain-containing protein n=1 Tax=Orenia metallireducens TaxID=1413210 RepID=A0A1C0A8Z2_9FIRM
MNKPKFKVIFLLVIMIFLAMMGYFWTSLFNSKEVNLKQDDSTGEALVSEEEAEPITEEAQEVQEVEQNSFTNIAYDSYKDWERLLEEYNYNINQELVEIPRVKVEKFPEDIGEISDVAKKKKIFLSIILIGAYHVNQDLIEDRRRLQSIAKQYSISDKIGLEDEEWLNQLKKEYSVKSDDLQESLDLLLVKVDIIPLSLVLAQAACESGWGTSRFTRVANNIFGEWTFSKMVAGVVPKDRPVNATYKIRKFDTIEESIKSYINNLNSHYAYEELWKIRANLREREERLDSLKLAEGLLNYSQRRELYIDELRDIIKYNNLQKLDSLLEE
>UniRef90_A0A382ZW10 Tripartite tricarboxylate transporter TctB family protein (Fragment) n=2 Tax=root TaxID=1 RepID=A0A382ZW10_9ZZZZ
MPLDRAIAGIFILICLIYGYTAFVPMEEGLLPFELNMTFLPNTLPKYLSVLGIVIGLVIVLQPRYEGASDSDPNEIDQKKLLQYKFSQALFLLGLMLAYALLLRPIGFVTTTTLFLAFGGIILGERRLVIL
>UniRef90_UPI0009B405AA mixed lineage kinase domain-like protein n=1 Tax=Monopterus albus TaxID=43700 RepID=UPI0009B405AA
MDFIDPILSIASQIYTLVENVQANKKRCRRVSDRVRALEELVKSIEKRKTVETSGNVTKALKELYHTLEAAQKLVKKYTLATWVKRILKSSSHEDEFNIVNERLNNAFQVLSGALQLEQGNVLCKVFALASREEEDKMDGKEDDAELGKLLLEHIKDQEEKTKAMQRTFDELKTSVEMVIEKLNKPSITSEGIRMIKLEELKNRRPFMKTPTSEVFKGQYHGFTVAIKRYTGLVNTSPREVRNIFTKEVETMKRFESPNILRMFGICIQDEDGPSPEFLIIMEYCEKGSLRQVLDSDCKLSWLKKACMCLDAAQGLYRSVIWLLDKFICVRNDRNMGRREEKPRYTGVIKKVKCHFECDIL
>UniRef90_UPI001CA7B725 uncharacterized protein LOC122510909 n=1 Tax=Leptopilina heterotoma TaxID=63436 RepID=UPI001CA7B725
MPSSCIVDKCISASLIRKGRKLSLFKPRESTLELWRQIVPTKDNKELLKSHVVCELHFNENDMDKTFKTIINGVQHEMQKEKISLKVGAVPSLLLSNVKDKLDYSQIIKEKQIIALPSKNWSVVRTSEFIVWINWINNNPHTDRRIILYPDMKIKVFVYGNEVKEKDMDVKSVGDLIALFEKLEKFFPCGSSGTCRSENCIGFIIQKEKHERGRKFVLCAACSKFTKKINRQKRESDKLMKVKCKIEKLYKNSKNTHQKCKRLLDKV
>UniRef90_A0A257RIT0 Peptide deformylase n=3 Tax=Acetobacteraceae TaxID=433 RepID=A0A257RIT0_9PROT
MASAADERADLDSAHAQRYTKNPSFANLNASKFSRFRAGPVCETRQLRHLCIMAILKLARMGHPVLLTRADPVADPTAPEIRRLLADMIETLDDAGGVGLAAPQVHVPLRLFIYKVPERRVSTIEGDEPRGLSAVINPQLTLLDGDPIEDWEGCLSIPGMTALIPRAARLILTGTDASGAKFTRQAAGFHARVIQHEADHLDGILYPTRMTDLRMIGFTDEITKFREDILAVHHNPTL
>UniRef90_A0A6A4KJ17 Peptidyl-prolyl cis-trans isomerase (Fragment) n=1 Tax=Rhododendron williamsianum TaxID=262921 RepID=A0A6A4KJ17_9ERIC
MSSSSDKVRASHILIKHKGSRRKASWKDPDGHVITSTTRESAVAQLKALRDDIVSGKAKFNDSPLVSPIVAPPNAAAISVSLLASAVFSRIRLFRSKIQSPSVRIFYYEAMLSLVLFCKSVPI
>UniRef90_A0A329J1P4 Phage infection protein n=1 Tax=Pseudomonas sp. RIT 412 TaxID=2202161 RepID=A0A329J1P4_9PSED
MNTQKLILGLAFSVLATGAFALPTVHGTSAVAENGSSHTHIERVAADGADRVGANRVAENGSDRTALGRIAADGADRVGANRVAENGSDRTALGRIAADGADRVGANRLS
>UniRef90_A0A6A3LY11 Reverse transcriptase domain-containing protein n=2 Tax=Phytophthora rubi TaxID=129364 RepID=A0A6A3LY11_9STRA
MSPSSTRSRARRRRRMRRRASAASSTPDEVSSVLSGEAPHDCGEQLYTLVNGVTGDVDSDIGLDPLPSLNALLELEEMPVADFGEALKAGDLAEVVMIRPEDELNSSSLLDEAVLEDTKQALNARSGSAILKDPSDPLYSLVVEFGDVVSKVPPMGLPPDRGVRHEIDLVPGTKYCVMRQWPLPKEQCDVIDAFFRAKHAAGLVRESKSPHSTPTFCVRKSNGKWRIVHAFNKLNAATIPAQTPIPRKDVLQNNMVGCMLYSALDLVDGYYQLLMRASDIPLTAVSTPSGMLWEWLAMPQGLSNAPATFNRLVTQLFRPHRAYAQTYFDDIFVHSRAEHGKSDMENHIDHLRAVLECMRANKLYANADKCIFGAEEIPFLECFIGKRGLRADPAKVKAIVDWPVPANQKDLRKWLGLANYLHKYSENYAELARPLPTLLKKDAEWCWDTGQQEAFEAIKESLLQAPILALPDPDRPFSVVCDASDFAIGCALLQADGEGHERVIAFESRQLKAAEKNYPVHDKELLAMKYVLVKFRVHLLGSKPFVIYTDHASLRTATQSPHLSQRMARWLSFFAEYNFEVKYKPGRQNVLADALSRRPDYELAHVTSVTSSISEMIREAYARDDVCVALLRALGSEEFQNSDIKLSARLRARLHRYSLEGQMLYYSTGSDDTPRAVVPHDEDLKNRILYEAHDVPASGHLGREKTYSSVSRHYWWPKLYQWVKTYVSTCETCQRVKP
>UniRef90_A0A850EYH4 Ribosomal RNA small subunit methyltransferase D n=2 Tax=Enterobacteriaceae TaxID=543 RepID=A0A850EYH4_9ENTR
MKRPHSAGGGQIRIIGGQWRSRKLPVPDSPGLRPTTDRVRETLFNWLAPWVTRARCLDCFAGSGALGLEALSRYAASATLLEKDRIVAQQLRKNLETLKAPQGEVVNTDTLSFLAHPGTPFDLVFVDPPFRKGLLNETLHLLEHNGWLADEALIYVESEVENGPPNVPHTWSLHREKVAGQVAWRLYHREVTTGE
>UniRef90_A0A2M7RS75 Methicillin resistance protein n=2 Tax=Candidatus Gottesmanbacteria TaxID=1752720 RepID=A0A2M7RS75_9BACT
MIVKEITDKKIWEAYITQYSPNSLFQSWNWGEVAKKLDDRTNNTKLWRLGFYLNNKLFGIAQVVKVKAKRGIYIQVRHGPILSEWSKKNILMVTDYLKKIGCKENAYFIRMNPLISSSEDNKQIFKEIGFIDAPIHAMDGELVWVLDLNKKKEEIFSGMRKTTRYLIRKGEKLGVKIFKSQNKEDIDNFLILYKKTATRHHFIPHKGIKEEFVTFLKDKQIILFRGYYNNRLLSAALILFYNKQAIYHHSASIEQKVPVSYVLQWEVIKEVMNRGISIYNFWGIAPEDNLHHPWVGLSMFKKGFGGRKVEYLHTKDFILSPKYYFTYLFEYGRKIIKRY
>UniRef90_A0A3D0LW13 DUF4870 domain-containing protein n=1 Tax=Betaproteobacteria bacterium TaxID=1891241 RepID=A0A3D0LW13_9PROT
MSPSADDPPFPECPDPPGQTLAVIAEVLYLMNLLLLPGFAFLILLGLYFKEGGAPQLARCHLRQTVAASLWAVALLGAANGLILLLGGYAMPATWVVVILYFTVCHSTLVLLGVLGLAKAMAGRTFIYPVVGRRCDG
>UniRef90_A0A5C9DQB6 CopG family transcriptional regulator n=1 Tax=Spirochaetes bacterium TaxID=2202144 RepID=A0A5C9DQB6_9SPIR
MKNITLSMDEKVLRAGREYARRHNISFNVLVRRLVEQAVLSTKDSWLDDTFSLMDTLHASTENVMWTREELYRV
>UniRef90_A0A438CFM9 Beta-xylosidase/alpha-L-arabinofuranosidase 2 n=1 Tax=Vitis vinifera TaxID=29760 RepID=A0A438CFM9_VITVI
MSGGGFDISFAKNDDKIASILWVGYPGEAGGAAIADVIFGFYNPSGRLPMTWYPQSYIDKVPMTNMNMRPDPASGYPGRTYRFTLGKPFTHLEMD
>UniRef90_G1PVF8 Synaptotagmin like 5 n=10 Tax=Vespertilionidae TaxID=9431 RepID=G1PVF8_MYOLU
MSKNSEFINLSFLLDHEKEMILGVLKRDEYLKKVEEKRIRKLKNELLEAKHRSGKIQQETSRVCVYCQRNLGLIFDRGNPCQACSLRVCSECRVSDLDGSWKCTVCAKVAQLRIITGEWFFEEKAKRFKQVNVLGTDVVRQSILRRNPGGAKEIQSQEKNHQDAEKSNTSPSTGQKASHDESKEKGFLLSKFRSAARGEIIITPNTESGWSYSMDLDSRNFRHLKSAPSSDRRNTGSSDLNDKEVGPGTLKSSQSSGMTPVTHRSPAPSPCNITPVISREHGFENSLDLAAIEGTSEDFTKNHCTNTSGTPSIAVSRASLSSDQSQSELDLSGSFKEDLKDTVNLRSKYVPGALDKDLDSSEETEESIDDVVSSRFSANTHSLASGLSRNSQAGSDKKWTYLNVPDIDSDTASLNSMLSVYSETGDYGNVKVSGEILLHISYCYKTGGLHIFVKNCKNLAIGDEKKQRTDAYVKSYLLPDKSRNNKRKTKIRTGINPEFNETLKYTISHTQLETRTLQLSVWHYDRFGHNSFLGEVEIPFDSWNFENPSDEWFVLQPKMELSTDIGLQYKGELTVVLRYIPPDEYLMFPPGQLQAHTGKKTFKRGTKKPPVLSGGILEVLIKEAKNLTVVKSGGTSDSFVKGYLLPDDKKVTKHKTLVIKRSVNPQWNHTFMFCGLHPQDIKNVCLELTIWDKEAFSSNIFLGGVRLNSGSGVSHGKTVDWMDSQGEEQHLWQKMADNPGTPVEGILMLRSSMGKRQL
>UniRef90_A0A1G4YLJ9 Acetyltransferase n=2 Tax=unclassified Nitrosospira TaxID=2609267 RepID=A0A1G4YLJ9_9PROT
MNYDVFNGDADGLCALHQLRLAYPVKAELVTGVKRDIKLLDRVQAGAGDWVTVFDISLDSNRSRLMQLLEAAVHVEYFDHHYAGEIPRHINLVSHIDVSADVCTSILVDRSLEGRFRLWAVVAAFGDNLGQSTRSLVGSMGLAESQIEQLAGLGKYLNYNGYGDSVDDLHFHPAKLYEEMKPYPDPFDFIARSTAFNLLAAGFRDDMAMAGSLLPLSEEPCHAAYLLPDAPWARRVVGVFANRLATDHPSRAHAVITPTRHGDYAVSVRAPIAKPEGADMLCMKFETGGGRKAAAGINRLPMDELDRFLAIFAEQFD
>UniRef90_A0A104MTA2 DUF2384 domain-containing protein n=17 Tax=Burkholderia TaxID=32008 RepID=A0A104MTA2_BURPY
MTRHAHAIKGTVAILDVETEAALRSAVGAATMLGPDRARALLRLSDEQLGHLFKIGIAQAIDLAATVTFGIAAAATRDKKKSADPARHVKPAARTDGVPADFERGALSERQTLVAEGRLLPAIEVRVGLGITRQALSKAVAAGRIFTLDVGAGQYYPAFYLAGDIDRKTLGKVAQRLGSLPGWSKWQFFTAPKASLGNITPLEALSRGKVEQVERAAAAFAER
>UniRef90_UPI0021C2958F uncharacterized protein LOC126978868 n=1 Tax=Leptidea sinapis TaxID=189913 RepID=UPI0021C2958F
MSFLLIYPAVAALTLFIIVVIMVMLRFGATCCKLRHTAFANQEDWLEEEAYEQKVSYA
>UniRef90_M0NT14 DUF3194 domain-containing protein n=1 Tax=Halorubrum kocurii JCM 14978 TaxID=1230456 RepID=M0NT14_9EURY
MPSESTDEPTDEEVVRTAAEAAEGVVFAHYDQSAVTDLDVTVTFEEGVLDVDVYLNAPDDPDPDVVAREAAETAGEAVDELFAA
>UniRef90_A0A8C6TNC3 THAP-type domain-containing protein n=1 Tax=Neogobius melanostomus TaxID=47308 RepID=A0A8C6TNC3_9GOBI
MPSACYAMGCTNALSQKKGLAFYKFPKDPVRRQKWITRDEPTHANVRKRQSFVYYLPFL
>UniRef90_UPI000522A661 ubiquitin carboxyl-terminal hydrolase 15-like n=3 Tax=Amniota TaxID=32524 RepID=UPI000522A661
YLVDSRWFKQWKKYVGFDSWDKYQMGDQNVYPGPIDNSGLLKDGDSQSLKEHLIDELDYILLPTEGWNRLVSWYTLMEGQEPIARKVVEQGMFVKHCKVEVYLTELKLCENGNMNNVVTRRFSKADTIDTIEKEIRKIFNIPGEKETRLWNKYMSNTFEPLNKPDSTIQDAGLYQGQVLVIEQKNEDGTWPRGPSTPKSPGASNFSTLPKISPSLSNNYNNMNNRNVKNSNYCLPSYTAYKNYDYSETGRHNEQPGLCGLSNLGNTCFMNSAIQ
>UniRef90_UPI000401F0EE valine--tRNA ligase n=1 Tax=Desulfuromonas sp. TF TaxID=1232410 RepID=UPI000401F0EE
MEPKLPKGYEPREVEEKWYAVWEQAGFFRADENSPKPHYSIVIPPPNVTGVLHMGHALNNTLQDILCRWKRMTGHEVLWMPGTDHAGIATQNVVEKQLAGEGKDRHELGREKFIERVWQWREESGGQIINQLKRLGASCDWERERFTMDEGLSRAVREVFVRLFEEGLIYRDNRLINWCPRCHTALSDLEVEHEEKKGHLWHLRYPVQGTDRFLVVATTRPETMLGDTAVAVNPGDERYADLIGRKVLLPLVDREIPIIADEYVDREFGSGAVKITPAHDFNDFEIGKRHDLEFINILDESGNINENGGPYDGLERYEARRKVVADLEAQGLIEKIDDYANAVGECYRCRTVIEPYMSKQWYVDVKPLAKEAIAAVEEGRTKIVPQQWEKTYYEWMYNIQDWCISRQIWWGHRIPAWFCDACGEITVSRQDPTECAQCGSADIRQETDVLDTWFSSALWPFSTMGWPDQTETLAKFYPTSCLVTGFDILFFWVARMMMMGIKFMGEVPFTEVYIHALVRDAQGQKMSKSKGNVIDPLTVIEEYGTDAFRFTLAAFAAMGRDIKLSTERIAGYRNFANKLWNASRFALMNLEDFNPEKVDLDKLELTLADRWILSRLSETAKEVDTALTGYKFNDAANALYSFTWHSFCDWYIELIKDELYGDDPQAKACAQAVLFTVLEQLLRLLHPFMPFITEEIWQALPGRRPEKSIMHAACPNGEDLPVDAEGAEKMERIMDVVKAIRNIRGEMDVAPSRQIAAVLDCKSESSAAVMREGEGYVKALARVNDLICGVEVERPAQAATQVAGEVEILLPLAGLIDVGEEEKRLEKEIAKVEKDVAMFSKKLSNEKFVSNAPPEVLEKDRGKLAAAEEKLGILQESLKKIQALK
>UniRef90_A0A4S4L702 BAG domain-containing protein n=1 Tax=Phellinidium pouzarii TaxID=167371 RepID=A0A4S4L702_9AGAM
MAYFCTPSSYASTFYDSPFSRRRPSPPPTTYYSRSNAYDPYVRAIAEEQVARSALQDAIQREQEARRRRTQEEARARARAQETARARSRAARQHAGMFYGLPARYQYADYPECGYGYGYEYGDEGDEDDEIKDTYSPFIHFYSTPEFVSKQGSAPPMSRSSSLRPSQQELRAKETEGQSSSKESTPKVSIPINTPSSQTSQHSDQVRNEAVLKIQTIYRKHVARKAALTEIESIRQRFETQCNAFSFPSVLDFQDDPASPEASAAPEERPRLAYTAHNTPVHVHEDALVKMLQALDSVESHGDATVRDVRRTLVRAVEEELGRVDAAVRRVWEELVVQAKAESHKTTEEPMEVLLDLASESDTTVEAVVDQPALAADQALPTMDVESASIAESIVQPVAEKTESGMEEPEARTFPPAEKTNIESTTSTAAESPFDEIAIDDVPIPSTIDNALGQMAHPISTLAPPPPAADVVFEPIPISEPPLNADSETDSEVETPSQPAVAFPAAQVVSAEDRQDDREEEDDTVLVEETLKTPDGYEKNSETAVVDTEFVLV
>UniRef90_A0A401PBY0 Tripartite motif containing 62 n=7 Tax=Chondrichthyes TaxID=7777 RepID=A0A401PBY0_SCYTO
MACSLKDELLCSICLSIYQDPVSFGCEHYFCRKCIAEHWSRQDQSSRDCPECRRSFRDPLLSPSLKLSNIVERYSAFPLDAILQAQRNSFPCKDHDKVKLFCLNDKCLVCFFCDEPALHEQHHVTNIEESFEEIQRELKDQYEVLQDSEHGHVKALQLLKRQLSETKSSAKSLRATIAEAFERLHRFLKEKQKSMLEELETDTARTLNDIEQKIQRYSHQLREVQEGMQILQEKLVEADKLLFLEGINITLERLKGKIHETNLTYEDFPTSKYMGPLQYTIWKSLFQDIQPVPAALTLDPITAHQRLILSDDCTIVAYGNLHPQPLQDSPKRFDVEVSVLGSDSFDGGVHYWEVMVSEKTQWMIGVALESVNRKGSIQIQPSRGFYCIVMHDGNQYSACTEPWTRLNVKSKLEKVGVYFDYNKSLLTFYNADDMSWLYTFREKFTGKFFPYFSPGQSHANGKNVQPLRINTVRI
>UniRef90_D5ASH9 Membrane protein, putative n=3 Tax=Rhodobacter TaxID=1060 RepID=D5ASH9_RHOCB
METLPILVPPVLNLVSAIAVGALIGTERERRKGEGPARSPAGLRTFAIASTAGAVGFSLGGAVLLAVVAASVAGLLAVSYGKRPHQDPGLTTEIVLLLTVLLGGLCIPAPQMAAAIAVTVTVLLHLKAWLHTLVTTLISKDELDDALIFAAATLVILPLVPDRPMGSWLALNPHSLGIVIVLVMAIGAAGYLAVRLFGARFGLPLSGALSGFVSSTATIGAMGARALQSPEMRAACVAGAVLSTVATVLQMALVLAAVSLPTLRQMILPLVFAGVTAVVYGVVLTLAAMRHPAPEAPGPGSAFSLKTALIFGTVLALVLVLAAGLQAHFGGSGVLLAATAAGLVDTHASAISVATLVAAGKVAPEAAAVPILAGLSANTATKILVAAISGGRGFALRVVPGLVLVILAAWAGSLFW
>UniRef90_A0A7S3BTX3 Protein kinase domain-containing protein (Fragment) n=1 Tax=Prasinoderma singulare TaxID=676789 RepID=A0A7S3BTX3_9VIRI
GAAPSASPPRALPAAGGLGPRRSQQSTVPMARTALRAPTARSTARAAARSSRGSRGNHRRAVAAALVGPEAAGALDALALAQQAAEHGVHHAALPSLAEGIGPQCALYDCGDMTYRSTLDLELRKELGGLTLQGKAIIGGVGLYLLATPGVLWGFIDTYIVRLLQRALSPAYRLRDFELGQRLGKGAFGEVFRATCLREGASEDQVVLKRADDYGAEEVWMNGRVSRLPVSTNFARYLGAFRETGRDGSEQTWLAWRYEGDFTLSTYMRRKDFPECLEVSLLGESLEGESKARRRSAVVRELMRQLFEALDAALG
>UniRef90_A0A812J0M9 Mfhas1 protein n=5 Tax=Symbiodinium TaxID=2949 RepID=A0A812J0M9_9DINO
MQKLAKHQNALGQYSSLGTEVFFTEFGADWTSYRSARNRRRVDFSGPQWSLETLEGEQENGLMHKQFIREHIEVLNLAKNKLTDIGCLNAMKDTRAFEFRRLQILNASRNMLTFVKLVNPSLTEINLSHNELIKLPDFSSLTQLSKLLLSHNYIDDMLDQFGQLQKLRVLDLSSNRFFWRPTLFKKQLGHLERIHLEELRFWPNPFAEGFKEYQFITASTLTSLTSLDGFQIDSDLRFQLRVQADQLQLNIADFSIFDVRVEDRGKVGEAEEKCSCRGTSRHHARALLGPHSKHFIPAFLGGREQEVAGVVGILETLKLGDRNVPPQQSGGKVPLLTELIEAMRKSLDQPNDLLKHVYDLEQKVVASDFASGTCHMRHCMQLSVLCLALKLQVLQHPSCNRTSSQVSCMWNAHFWDRRRLMLAEDGERKQRSYMKPAEADRAAAEFADKMQQVLGRFESVQDVLVMCLVRMLGCGNRQLSERCGTLLAEWVDANAEELHDRMDSMSEALFNDLRHALVVGIKSVNEKPMACYEASHGAREPEDDSELEQTEASWHILAALRRFGPSRLYDKVVSPWRARVLRPFLPALCRETKEVLGPDQPPDRWSKYQGFDSFSEDVAEVLEVQEKNLVSCEEKCVRQGFGGFVVEATDELGMVKVCFKQQSPQTLASLRRSSAKRTLHVRPLGRPPKRPNKAAEEGGGRNHAWEAWVDGLAVLVTATSDSQNAAYCVSYFDAHLAVTKHESDKQGFTEAALLGSSEANNAFVRLLQLARNLMQAYGDAGLKAARHFLEAKLHTNCWARARRRLQEGGSPLPVSRLSEMNPDDVALISELVGILHTMVKCGDLEISNQAMNDILAENGMDVFEMLLEVAASSADPDPLFLAISYESVYVFVQSDIMRPRVLSKVISRLRETAILLPYIRGPYIKDVPNEKYMQLWCKCELKYGMKNDARERLEKRYTSLDPDEHSQWRELVPEIRELQNTMMHRTLLGIVKIIQLFSDLARRDDSPPSLKMVTDNVCGGFVKSKKALGEIPGDLLNANDRERLLIGPTTGLVTCPDFDVRVESLICIRHVLEATPDQFDLEEMGWLLNYLTSVGMGIGKQGQFLTEVIDLIKMFVRNNSRTGQSFRNKFAKYAIRECFEMLTVNSRRETHGNKEEAKAKADLTAKIIELLKDCSRPLSGGLRKFLRRVDLLQSIREVLQQEERTSSNPATQILDIWTGRDIRQVLLPIVTSPAFDVHGPVVHAALMRLADVLQAYSWTDVPPTDEAGPWPGLTMLYRLLDYRDAIENEDSGYQQEYFMNSRGLDPLLDFAHRFFAANEDLNILLNRVQDKLAQELGEKERSLRAKWEGRQQDVHQSEASVKTKQEEQTMSEVVQDCLTARLRSLNEGAAAHFRCNLNQYDQKKQEFSLSKLAKVYQNYWKDNENRANQEVQERGDAVYELLRIPDKIAIDGQLRDVQDLGRVPRKQRRIRQPHRDFEKLMYQALSAHKIMKQMLCDSSKRDHNEVARWCQYEPDANGPPSVLAIGLLDFLQDNQALAIDAGLRPREELLVQDKYKYFRRHDRRTNLSCIVLEFPDARCLLAALQEFLKRAQRLFLYQVRNRFRLASDLGEYCIALKFQLQLKDSSIHYSELRMCLSGKSKKNNTVQQYRDTMRKVEEILQSSCDVPTSETTLVAQYLSTMLRSRSIHHSDIIFLRCKDVNLEVDGEEVFAQSAELTSCQLFVIEREAGDGVVKTGDRIRLKSKFTQKYLDVHASGHLRCRLADFSEDYDMTFTVEAIGCRDDYALSRCGMKGSLTEFRSLHTETSLRLKVSASNFVTVRQGANFLTSFGEKLSVKSEPNDAAHEAGQVFTIFRDGALLLDFHSTHSGSRAAIRTLALETSDEILQKTMMEAHMRTEISNGDVDVQGSSFRTVPPEFKTMMWSIAGHFRHVGHSKHAASHEASSLHKLWTRASKNLAAILRCLFVMMEFPQCVGGRRYVLDTFATRMTQHSSLPRIIALVSAVQLVRKEKMPDGELDLTCALLPKKFMRFCSALLSNLWVCQKPDEIEAIFTVPREQERHERELATIDRERMHLLSMVGSYTCDMVVKPMLDKLRVAGQRPLSRDEVLVFQDFASLCMALVQSIFDNEMRCLSLSNQASHHHHHHGTTAISDKERAGPQSGQSPSHKDAVAIPQNVDDGEQGDALNTNVLLASNADKRRANTLSQASWTYVTHFRAGISSATLAVMTRQDARAAVVAEIIPPITIKALVHLFLYALHQEAIAFRSATRDTEIPVRVISGIINQCVTALAALMTLTGKSNAEVGPTEDAPDASGSCDYDVCEAISQAMTEGAQLVPRARVAQLQAERGADCLRAHVQKMMEEGSFEFSSHRGPKLNLSTERVSTVGFVWTRLAGDIQACASPCFYDKQLFLNDRPRIVMHQDTRCLLVTTTRFRMILLRVPARASVMPQPADLHVLSEPRNMQDLKRVIFDLRTLNSVLESVKDRQVSKCPQSFVRMRQILCLVWDGEEGLKFQRLVFESSGRRRSFQEVLRKVPRKQQDTGEEDGKKETASIRMRARGILESAVKSTSLESLRETCQVRRGGIPLVSVTFVQSTGGLGLNAQLDMLVLTRCSVTVVSFNSFWSKFWRSDDESHYEREVTQASLDTDSEDDRLPDFSESVVATSNDHADKCEALHGPWDLEDLQGVWFLSEASPKVRLQFGSTLEVTFLSDGERQRFRRHLATILAEGAVPRAGKASQAWAVVPTDKTDIKTIQKETGAVQNGRLALTRGEGDDVARDVLPSVCFRSRCALWSGSPHKASSGKFAEHATFGGEADALNKRVACTGDDSEEDEWVVLLEVVEGLRSARAAFSDAEYQVLYSQVHSAWDPGRRFCNPLQRGAVRFCLEEHHVHAEELLASSRILSVAASTLTTLLLQAPSESLFWSSDEANASRDAERLVEGAVRSTFRNISSSMQHHLHLAQELDSFSLTEGQLKAFVSILEHLVDPRVQDLGLAVAKALDQYFQGGVTGEQDVKLLLLQATQPRIVEIRELWHEVKLGALHGPGLGWGVAVNPANLFVLQSFGQPVTYQPRQQEHSQAFWVAAATFEQARVLLLHLEALLRTFGMTINAHGLLQSLSGSSEPFLSQLLACHSDDAEAAEMGTEHDLSRYRRMACSIKYGSAGIDVIASIGGSHPGLAPAQS
>UniRef90_A0A6A6N897 Receptor-like protein EIX2 n=1 Tax=Hevea brasiliensis TaxID=3981 RepID=A0A6A6N897_HEVBR
MAWNQLRQWSGIACHNTTGAVLAVDLPNSSGRQPLGGEIRASLAKLKSLKHLDLSGNNFTGKIPHFLSSLENLQYLNLSYAGFSGAIPPNLGNLSSLQFLDVSYWGLTVDNLEWVSGLLSLKYLAMNSVDLSKLGGEWIEPLNKLPLLSELHLEYCGLSGFSYSLPSLNFTSLKVLNLQGSLFKAKLPTWLANISSLVSVDIGNSWLTGRIPLGFGELPNLQSLKLNYNLKLSASCFQLFARSWKKIQILDLSINGLHGVISEAHFHRLGKLEKISLSENSFVLNVSSIWVPPFQVIALEMGSCHLDPLTVKCSNDSNNGGDNYPDGGGKADQTDNGNGFIDKWFYMSIGVGFAAGLLLPYLVFAMKRSWGGVYFAFVDGTAYRLSSEKMKAAARRRNRGAR
>UniRef90_S7SN88 Polysaccharide biosynthesis protein n=4 Tax=Geobacillus TaxID=129337 RepID=S7SN88_9BACI
MRTVASMVAPVSNALYPVSAKLFKKSNDVAIKYLKKFLFIGSLVFMLAGVGMVVFSNVIVLVMTGEENIEIQYLLLIMAFIPLSIYINNIYGTQIMLNLYLEKVFKYLIITNDISLPVLSYILTLNFNLWGASFSLLITEILLTVSMVVYVEFIKKQGFLGVLKK
>UniRef90_E6QXG0 Secreted protein n=1 Tax=mine drainage metagenome TaxID=410659 RepID=E6QXG0_9ZZZZ
MWRQVYKWLLIYLLRWMGYWFDEMGSCGSFGTVFRVANDCNGVVCWFGIARGAIVHLVALSFDYGLESFRYLAGALAVWYSLSSVGSGKFTCCTEYCDGQAPIGLGNHCVACVVAADGDGD
>UniRef90_A0A3N7FFK6 NADH-ubiquinone reductase complex 1 MLRQ subunit n=2 Tax=Populus TaxID=3689 RepID=A0A3N7FFK6_POPTR
MASSRWIRPEVFPLFASVGVAVGICAMQLVRNICTNPEVRVTKENRAAGVLDNFKEGEKYAEHGLRKFVRNKTPQIMPSINGFFSDPDLPTN
>UniRef90_B8A485 PHD finger protein 3 (Fragment) n=1 Tax=Danio rerio TaxID=7955 RepID=B8A485_DANRE
MASRHHADHEMTGAGVRQSPSDGEHNQSGFLQDRRQAGQMQRRQTASRGRVRGRRLGPARKAAESYNRESTCSEEHDRDNSPDEKREALLSRRF
>UniRef90_UPI001F4BB424 secondary thiamine-phosphate synthase enzyme YjbQ n=2 Tax=Belliella TaxID=232244 RepID=UPI001F4BB424
MKLFQKEIKLRSYPRGYHLITDVIQSQFPEIKLVHQGVLQIFIKHTSAGLTINENADPTVRKDFETFVNELVPESYPRFIHTYEGSDDMPAHLKSSFLGNSLQIPITGGKLNLGTWQGIYLCEFRDFGGARSLVLTAFGV
>UniRef90_UPI000F8ECADA GntR family transcriptional regulator n=1 Tax=Pararhodobacter zhoushanensis TaxID=2479545 RepID=UPI000F8ECADA
MNADAPSGPEALVRDVLQGLAEGRFVPGQRLAEPDLMARYGLGRSTVREGLGRLAASGIVVQAPHRGAQIRLLGRRAAQDVLRVTDLLLGLAARQAAEAVAAGADPAPLIAAARDYDAAVPGERARIRARYYRALTTLAGNAELDRLLPLLQVHLIRAQLRLNRPPGRPARTALVAAVAAGRPDAAEDAARSHIRALIAALPNLPDNAFAPD
>UniRef90_A0A7X9B2E4 Leucine-rich repeat protein n=1 Tax=Lentisphaerae bacterium TaxID=1932692 RepID=A0A7X9B2E4_9BACT
MKKLLQRKRRSASTLLAALMTFFLFVGASARGQGAPDPEKDYAYEPYSYGSASGVIITAYLGNEEVVTTPAHLGGQPVIAIGPGVPRVLIDQDMEPDWGTKGFCNTPVTDLTVSEGVLFIDDAGLGNDALTRISLPASLQELGGNPFFAQYNAPNAELVITVAAGNPNFAIEPNSGALIQNGTHLIFWPTLAARAAAVDGLLTIPDGVTHIGTRILAWNRYYDPDARANVYAFTRIAFPAGVTHIADCAFYACHLESLTLPTSLTSLGLWVSFTALDLPASLAHLGGHPSPHQGHLR
>UniRef90_A0A1H4NAP5 MFS transporter, AAHS family, 4-hydroxybenzoate transporter n=1 Tax=Beijerinckia sp. 28-YEA-48 TaxID=1882748 RepID=A0A1H4NAP5_9HYPH
METEALNVTSLIDDRPIGGLQIAVIILCALVNMLDGIDTQSIGVAAPFIAEGLGIPVAQFGPIFSAALLGAALGAIGFGAVADRLGRKPLLLVALLLIGVFTLLTAHASSVKWLVVYRFLAGAGLGGATPCFIALTSEYAPARNRAACVTLMWAGFPLGAMLGAFANSFLLPAFGWRAIFYIGGLLPLIVAMILIIWLPESLKFLVNRGAFDAARRILQRMGIKTEPGTKLTTNEHKQEGLPLRQVFSEGRGLLTLLLWVPFFISFGILTVAVLWTPTLLRLNGISPAMTAFVVAFNGLGALFGQGLAGRLVERFGALRTLVPAFILGALATAGLGYGASSVAAASFFIGLNGLFLGLASGGAIALAALLYPTAVRSSGVGLGMAMGRFGQVVSPLIAGGMLGAGFNAGQIMVVIGSGALVGALFVIWFRILAARRHIATVGTEASTG
>UniRef90_A0A848GUV0 Signal peptide protein n=1 Tax=Ramlibacter agri TaxID=2728837 RepID=A0A848GUV0_9BURK
MKLAVLALSLLACGSAFAQAAATAPEPDYTASVNIGAVTDYRYRGISQSRLQPALQGGADFAHKSGFYIGTWASSIKWVKDAGGNADAEVDLYGGYKFNGGPVAFDVGALRYLYPSSQLAVSPNTTELYVSGTYGPATLKYSHAITNLFGFADSKNSYYVDLNATFDTGYWGLTVTPHIGYQGIKNNSGFSYTDWSVALGKDFGNGFSASLAYVDTNNSNYRSPDGKDLGRATAVLGVKYTYSF
>UniRef90_UPI00214A619A hypothetical protein n=2 Tax=Lachnospiraceae TaxID=186803 RepID=UPI00214A619A
MIRNIYTKTLDSGPITPVSARKEKEKALSWRNTLMEHQKHLDKTLSQCISEDEYRLTAMELDCLEHVIQLDDFYDFCTDYMCEHGIDTVVDIGCAYGHQSEAFLEENLGYIGIESSGDSPKWNIDKCMYLTEKYPCKIPDGCRFAVSNMCFEYFINDYEALAHDFDTVILSGLGKNTKVFELFDVEEIHYRPLIDSNAIWNLFILTNKHIGD
>UniRef90_A0A0D6A1E3 Transcriptional regulator n=1 Tax=Lactobacillus acetotolerans TaxID=1600 RepID=A0A0D6A1E3_9LACO
MTDVVRKDVKQRLENGDYSCAKELTLSMFSGKWKIVILFHLGTDGPYRFNQLMRLLPKTSHKVLTNQLREMEEDQLISRTVKSDS
>UniRef90_A0A2H6N9Y6 Cytosolic carboxypeptidase 1 n=1 Tax=Micrurus lemniscatus carvalhoi TaxID=129465 RepID=A0A2H6N9Y6_MICLE
MWHCTVKVLKYGILLPFLNRTKIAQDIERLIHPNDIIDRVVYDLDNLSCLVPDEGDVLKFNSKFESGNLRKVIQIRKNEYDLILNSDINSNHYHQWFYFEVSGMRTGNAYRFNIINCEKTNSQFNYGMQPLMYSVQEALGGRPSWIRTGTDICYYKNHFSRSSIAAGGQKGKSYYTITFTVTFHHKDDVCYFAYHYPYTYSALMMHLQKLESTNNPQQIYFRQHLLCETLSGNNCPVVTITAMPESNYYEHICQFRNRPYIFLSARVHPGETNSSWVMKGTLEYLMSNTPGAQNLRESYIFKIVPMLNPDGVINGNHRCSLSGEDLNRQWQNPNPDLHPTIYHAKGLLQYLAAIKRLPLVFCDYHGHSRKKNVFMYGCSIKETIWHTNVSAASCDLIEDLGYRTLPKILSQAAPAFCMSSCSFVVEKSKESTARVVVWREIGVQRSYTMESTLCGCDQGKYKGLQIGTHELEEMGAKFCTGLLRLKKLTSPLEYNLPSTLLDIENELIESSCKVTSPTTYVLEEDEPHFLEEVDYSAESNDEPDIDLANNAGDYEPCLHEDGLSDSEITRTHLP
>UniRef90_UPI00197F5B0B hypothetical protein n=1 Tax=Pseudomonas viridiflava TaxID=33069 RepID=UPI00197F5B0B
ISHKIQFLQWVAGCLIRGGLPAMNDDAVLLTYRVDCIAGKPPPKVKCLPRDSATAKTWWCLPQSEFAAR
>UniRef90_A0A1E5KYP1 Zn-finger containing protein n=1 Tax=Enterococcus rivorum TaxID=762845 RepID=A0A1E5KYP1_9ENTE
MGQVWMERLMRWNAKLQHFLKGRYARMDQLNKTMLIGSIVLIIANSFLPTSVLRWIGLALIVFIYYRFLSKRIYVRANENTKYLKIHNRIFGKIKKIKLRFQQRKIYKYFTCPSCKQSLRAPKGKGQIKVTCSKCHQQFSKKV
>UniRef90_E3MKT5 Eukaryotic translation initiation factor 3 subunit A n=1 Tax=Caenorhabditis remanei TaxID=31234 RepID=E3MKT5_CAERE
MAPNYFQKPEAALKRAEELIQVGKESDALDTLHDTIKARRHKQWTQTHEAIMIKHMELCVDLKKQHLAKDALFQYKALTQQINVKSLETVVEHFLKLAESKTEEAQKQSIEKVEEIGDLDQGDVPERLLLAVVSGAAAQDRMDRTVLAPWLRFLWDSYRNCLELLRNNAQVEHLYHQISRHSFSFCLRYQRRTEFRKLCDLLRMHLNQIQKHQYAPNVNSFRVKLTSPESLALMQDTRLVQLDTAIQMELWQEAYKSAEDVHGMMQLSKDKDKRTVKPSSYVNYYDKLALVFWKAGNSLFHAAALLQKFIIYKDMKKSFTQEEAQEQATRVLLATLSIPEGSDSPSDLSRNLDIEEQHVANMRLLSNLLRLPIAPTKNGILKEAARIGVPEASGQIAKDLYKLLESNFSPLKVAKDVQAVLDTITRPDHQQYVESLQAVAAVKALKQVSVIYEAISWERIRKIIPFYSDLALERVVVEASKHRIVKAQIDHRADCVRFGSSDATLAGGVDECDNNEGFTGDDTQLGVEGVRNHLEAMYTRLRVLVEGLDAEKRRKEMVRKIENHVTSYEKNRPTEIDRIHRRKKMLENYKENWERVKAEKTLQAATEQAKREEAARAEEMKRLEEQNKESERKRKQAEAEEIQKKIKQDQLYKMQQNAIYQAIIKEKGLDQFRDMDPEQVLREQRERLDKERAETQRRLQQQEKNFDHHVRALHLEEMNERRAVMHMRMNEAPKLHDQYEEQRITKEM
>UniRef90_UPI001D11B2C3 phosphoribosyltransferase family protein n=1 Tax=Aquihabitans sp. Kera 3 TaxID=2884263 RepID=UPI001D11B2C3
MTTAEPIEEREALTYELFGTAIRDLAHQVDDSGWEPDWILSIARGGLLIGGALAYALGMKNVATMNVEFYTDVEQRRDVPVVLPPVLELVHLADTKVLVADDVADTGETLQLVRDMVADTVAEVRTLVVYEKSRSVIRPDYVWRRTDRWIDFAWSAQPPVTRRPGVF
>UniRef90_UPI001CFFCFA9 GNAT family N-acetyltransferase n=1 Tax=Arthrobacter sp. ES1 TaxID=1897056 RepID=UPI001CFFCFA9
MSVSFLQVRPLTDADAAVLGAWAEDELFCRHAGWTSSSPAKVCDFWIRQIKDPPTGLLRLAAESVDRELLGYMDLHGTDPESRELGFLVGPSRRWGHGLGRRIAEAGLTYGFTELSLERIWAEAVAANVASVQILRSLGMRETGRGEAETFLETNSYYLQFEILRDAWELGADR
>UniRef90_A0A1C6SX88 Beta_helix domain-containing protein n=2 Tax=Micromonospora rhizosphaerae TaxID=568872 RepID=A0A1C6SX88_9ACTN
MTALPSASARTAPSASTPPPRRSTSPSPRSAANPRHSLKAGKNSRAGCALPKYPSPDCTGVPAGTRLATLRLNLDNDSYAVYEAGAVIDRKHIPGNLLIRAPNVTVKDSQIDGTVFNDYNGRLHPFTIVDSTIGPATGCITAPGLAYANYTAKRVRIRGHDDGFRVATPGNVRIEDSYAKLCWNPPELAPPDGSHSGGIQADCRAGECVGIWFNHNTIDNRGPNGNSGITMMSFDGNPVRNVISNDNLVMGGGYSIIYWWTTGPNFELHNNRVVEGTYVYAPADANGTCAHQNWSGNTLVTIDARYNVTSTVGPLPCIQ
>UniRef90_A0A0H4BB36 Uma2 domain-containing protein n=1 Tax=Synechococcus sp. (strain WH8020) TaxID=32052 RepID=A0A0H4BB36_SYNPY
MWQQQPDYARYKEKLNGEGWLVNRQEGMLLQIKPDTPTQHAQFVLVSYYHLSARIGKPVRQQRMLRHLGIEMWINLQKIGWERCLAPQN
>UniRef90_A0A496XIQ2 Alkaline serine protease n=1 Tax=Gammaproteobacteria bacterium TaxID=1913989 RepID=A0A496XIQ2_9GAMM
MRHHTRAVGLLVCLLSSAVQSAPAPETETLQVMLQGGSSQELTQLVETQGGTITHDLHIINAVGALLTQAQLDKVLKSPLVTRHIDDLSVSEAPDEPDESTCEVGGALELDYDTRGLRWTLYNKLPAPAILETLELTWPATLGTVEKISLGDTTIDPELYRDTQIGTLKLQFSGPAAPVLTGKADLRVDLKSPSLLHTSDLPLRQRDFTITASFLGDCSTKLIPGYENNHENFYYASVAGADALHLQGITGKGVTVAVLDSGLWEHEALVNDTSGKPRVLARYDAIKNISGNEVFDESGHGTHMTSVIAHSGAVTVDGKPTGSFKGTAPNVNLVAVKAFDVEGQGDLLDIVRAVQWVVDNRETYDIRVLNLSFSARPRWHYWEDPINQTIMRAWASGIIVIAAAGNTGPDPMTIGSPGNLPYVITVGAMTDSWTPDNRDDDYIPDFSSRGPTPTAHIKPDIVAPGGHITGLTRPNSTLMLEHPDYMLSTGEFVMTGSSQASALVSGIAALLLELEPNLSPDDIKCKLLSSAEPAIHRDGFLAYSPFQQGHGQVNATRAVTLGQIGCGNSDMNIRLDISGVKHFQGPAIVESDGNASLPGLSKIVSPEPSERGLSKTRKWGVKAHIERLDPAVTDLESSEISPIDWQKIYRQEKTAMESLIHEPPE
>UniRef90_A0A520FEH4 3-isopropylmalate dehydratase large subunit (Fragment) n=1 Tax=Sphingomonas sp. TaxID=28214 RepID=A0A520FEH4_SPHSX
MRSRPQTLYEKIWAAHVVERRDDGTCLVYIDRHLVHEVTSPQAFDGLRLAGRKVRRPDLTLAVPDHNLPTTQRVDAAGRELPIADPESAAQLDALRRNTTEFGIDYIDANAVQQGIVHVIGPELGFTLPGTTLVCGDSHTSAHGALGALAFGIGTSEVEHVLATQTLLLSPSKTMEVRVDGTLGFGVSAKDVILSIIGKIGAAGGTGHVIEYTGEVIRALSIEGRLTIANMSIEGGARAGLVAPDDTTFAYLKGRPLAPTGAAW
>UniRef90_A0A842QUU5 Flap endonuclease 1 n=1 Tax=Candidatus Bathyarchaeota archaeon TaxID=2026714 RepID=A0A842QUU5_9ARCH
MGVDLKSILVKDTIKLDELKGKVITIDASNILHQFLSTIRKPDGTPLTDSQGNVTSHLIGLFYRTLKMMREFSVKPVYVFDGEMPDLKTDVVEKRAERRREAKKKWSKAKQVGKDEKAFKEAVKTGFLDDQMIKDAKLLLNNMGLPIVQAPAEAEAQCAYMTHDEEIYAMNSRDYDSMLFGASKLLRYMTISNKDNIEIIDLDKFLNHHEISWAQLVDMGILIGTDYNEGVFRVGPKTALKLIKRHGSIEKIPEKYQKKLDENYADVRKLFLDPPLIEDYSLEFKEINRNGVMQFLCEERGFPHERVLNNLEK
>UniRef90_A0A4Q3S4G9 Acyltransferase domain-containing protein (Fragment) n=1 Tax=Chitinophagaceae bacterium TaxID=1869212 RepID=A0A4Q3S4G9_9BACT
MKAYIFPGQGAQFSGMGKELYENEQAKAMFEKANEIIG
>UniRef90_A0A1Z4EIA0 Peptidase M24 n=1 Tax=Mycobacterium shigaense TaxID=722731 RepID=A0A1Z4EIA0_9MYCO
MVLALTGYVWQQDVGAVFRRDTVLITDGGVDVLTDSPSWG
>UniRef90_A0A672Z142 Cytoplasmic linker associated protein 1a n=1 Tax=Sphaeramia orbicularis TaxID=375764 RepID=A0A672Z142_9TELE
MDLNMEDLLEQLMHKDLGRRIQVGQEILELIPDQDKFPELEQDQTLLDRMVDTVAGSWVNSSNFKVGVASTCLIKGLCLCLIATLNVSFSHLSMNCLVEIYRHVGERVRMDLGKKGLPQSRLNVIFSRFDEVQRSGNMVLSPLSGETYLLTPQTDGGGAGAVDEQDFIQSFDDVPTLQIYSNREVEETMTKIRDVLSDDKRDWELRVAALKKVRSLLLAGAVEFDGFLQQLRLMEAPFKLSVKDLRSQVVREACITLGHLSSVLGGRFDHAAEAIMPALLNLVPNSAKVMATSGVAAIRLILRHTHYPRLIPIITSNCTSKSVAVRRRCFEFMDLLLQEWQTNALERHGTVLMETIKKGIHDADAEARSVARKCYWGFHGHFSREAEQLFQTLESSYQKALQAHLRSGDSLMSLPASDRSSSSSQEIVFLTPASTSSSGSLHRSRSDVDVNAAATATARTRMPAVPAAMQAPPFSSASALPPGSYASLGETHLTTLSFGGSLWTAGRVLKHFHCFPAGSRSGSPGRLLSSTYGRIPRPTMGTAAATGCISGGTMEKGRPRGHRSQGCSRETSPSRSARSRIPRPSMSQGCSRETSRESSRDTSPARGFSPLDRLSHQARISASVNAMRILNTGTEVEAAVADALLLGDSRSKRRPARRRYESPGMYSDDDANSDASSACSERSFSSRNGGVAPHFLRQTEDVAEVLNHCASANWSERKEGLLGLQNLLKGQRTLSRVELKRLCEIFTRMFADPHSKVFSMFLETLVDFIVLHRDDLQDWLFVLLTQLLKKMGADLLGSVQAKVQKALDVTRESFPFEQQFNILMRFIVDQTQTPNLKVKVAILRYIHALARQMDPADFVNSSETRLAVSRIITWTTEPKSSDVRKAAQVVLIALFELNTPEFTMLLGALPKTFQDGTTKLLHNHLRNLCFLRPQASSGTALGRTPPRPPSSRGSPLTSPTNCSHGGLSPSMLDYGSENLNSEEIYSSLRGVSEAIQNFSFRSQEDLMESPRSDGMSGVAASSESAVEVGGRTALDNKTSLLNTPSPRSFAGPRFRDYNPYNYSDAIGSTDKVATKEALYEDAVDPAEQLELVGDLLKALSQAQGGEPGLDERRRTLLELLKVAREDSLVVWEEHFKTTLLLLLETLGDKDHTIRALAMRVLKEILRNQPARFKNYAELTIMKTLEAHKDSHKEVVRAAEEAASTLAGSIHPDQCIKVLCPIVQTADYPINLAAIKMQTRAIERIAKEPLHQLLPDIIPGLLQGYDNTESSVRKASVFCLVAIYSVIGEELKPYLAQLTGSKVPWESLRLVCTCADVGIQSHVKGMGKESVWLEMFF
>UniRef90_A0A7W5NUZ0 Glycosyltransferase involved in cell wall biosynthesis n=5 Tax=Pseudoxanthomonas TaxID=83618 RepID=A0A7W5NUZ0_9GAMM
MNTMAARLPAQDADTLVSVIMPVYNAEQTLRRSADSVLAQSFGQLELILIDDGSRDGSAAIVEELARRDERVVAVRQPNGGVAAARNTGLRAARGTHIAFLDSDDWWEPRKLELQLAWMRETGAMVCYASYQRVAEDGRLLSKVSPPLEVDYRRMLGSNHIGNLTGIYDRRLGEASFQKMGHEDYVFWLDRVRRAGSAVRVPGDAPLAYYLVRNGSVSANKLRAAGWQWRIYRQVEGLSAPRAAWYMLQYIRHALWKRKPVTT
>UniRef90_A0A534HYX9 DNA alkylation repair protein n=1 Tax=Euryarchaeota archaeon TaxID=2026739 RepID=A0A534HYX9_9EURY
MAGPVERMREDLVRQLDAAKRPGKLGAQAYLGSPVPVLGVPVPDLRKIVSGFKKTHKDVDAKTLNPLAASLWDGATFEEKAVAINLLDACLKILDEDSWTLLNRWAGEATGWGLCDWLGMGLIAKIVYRQPRRFQEILGWTKSTNPWRRRIAVYALRNFVFAGELDKPFRLLERLLYDPEVWVQRAVGTWLRECWKKDPRRTEAFLRKHVRGLPKVVITVATERAPAVFRAELRRGREPEAR
>UniRef90_A0A2N2AM00 Precorrin-6Y C5,15-methyltransferase (Decarboxylating) subunit CbiT n=1 Tax=Firmicutes bacterium HGW-Firmicutes-8 TaxID=2013789 RepID=A0A2N2AM00_9FIRM
MSDKQWIYRTGGIPDELFARDEVPMTKAEVRAVTLAKARLQESHVIWDIGAGTGSISIEAALMAVTGKVFAIEKKPEGVQLIKKNIEIFAVANITVCSGIAPEALQGLPEPDRVFIGGSGGNMAEIIRYVHEKMPIGGRVVVNAIVLESLVTSVETMKKYGFGDIDVTQVSIAKTVDVGRLHMFKSHNPVFIISGEKTTNQLTVKKETTEGLAQRSCNQF
>UniRef90_A0A2G2LVQ5 DNA-binding response regulator n=1 Tax=Robiginitomaculum sp. TaxID=2030823 RepID=A0A2G2LVQ5_9PROT
MQSTEQEKAHLLVVDDDDRIRDLLRTYLSRHGYRISVASDAKRVRRLLKTLEFDLVVLDVMMPGEDGISLTRFLRQSSAIPIFLLTARGAPEERIEGLRAGADDYLSKPFEPEELLLRIGAILRRKGTTIGSGATLQFGPWRFTPSTGELVGTKGRVSLTDNEARLLAALCKRPGEAFSREALSRDTAAIERSVDVQIARLRRKIEDNSRFPQYLQTVRGAGYRLLAHHVSETSSA
>UniRef90_A0A699XL38 Secreted protein (Fragment) n=1 Tax=Tanacetum cinerariifolium TaxID=118510 RepID=A0A699XL38_TANCI
MPSAPMMASCLACTPLANVMSPDDVSTSTHCSLVSSWTATLCGDTPDLVVDDKLDRLASTFFLQSAVHEHLVHVLTVEHV
>UniRef90_UPI001FF62731 hypothetical protein n=1 Tax=Amycolatopsis sp. WQ 127309 TaxID=2932773 RepID=UPI001FF62731
MPPTQTFMVVAVLRDDTDLAEFAALRNDEEKQLELLRSAGRIGAHYISPARRATFVEVIADDEKQVAETLATLPFARFFDADVYPTAPPDAAEIAYRARAATA
>UniRef90_A0A8S5L7T1 Large Terminase n=1 Tax=Myoviridae sp. ctKHS5 TaxID=2823541 RepID=A0A8S5L7T1_9CAUD
MKSKEFLAELRAYADSLRQKVEAEFDGWDDSLQAIAERRKKVFDPVTGYDYFVSHYFPHYVRSPHRSELHDYLFATLPEVLADPKSVNMATAAPRGEAKSTLVSQLLTVYCLITQQKRYALIVMDSINQAYPMLESIKVELEFNQRLKIDFPEVAGQGRVWQATTILTKANQKVEIAGSGKRLRGLRHGAYRPDLVILDDIENDELVRSAEQRDKLHDWLKKTVLPLGVPGEKMDVVYIGTILHYDSVLNRTLSSKAWKTAKFKALKKMPDDMALWDKWESFYLNEGEAVADAFYYANRAAMDKGAEISWAARPLLALMKIRARDGHATFDSEYQNDPVSSEDAIFANAIRYWTELPSDLIYFGALDPSLGKAGASRDPSAILVGGYQRSTGKLYVVEAQIKKRLPDLIIEDVIRLHKQYHCQRWFVETVQFQEFLKDELVKRSAQRGCPVPATAIKPNTDKMLRIESLQPHMVNGLIMLHGSQATLIAQLRHFPKADHDDGPDALEMLFKNAASCAAPIEWMGLDALDDDEYDDNDLGYSKWKH
>UniRef90_A0A651EH65 DNA-binding response regulator (Fragment) n=1 Tax=Rhodobacteraceae bacterium TaxID=1904441 RepID=A0A651EH65_9RHOB
MATIALVDDDRNILTSVSLALEAEGFDVRSFTDGVAALAEFGRNAPDLAVLDIKMPRLDGMELLRRLRLKSDLPVIFLTSKDEEIDEVLGLRMGADDYIRKPFSQRLLIERIRAVLRRREAAVEGEREEDDRPLTRGRLTMDPLKHDAFWGGQEVTLTVTEFLILRALAQRPGVVKSRDQLMDVAYDDQVYVDDRTIDSHIKRIRKKFR
>UniRef90_A0A1C9CI92 Acyl carrier protein n=2 Tax=Rhodochaete parvula TaxID=110510 RepID=A0A1C9CI92_9RHOD
MEKHSISDRVKNIVSEQLGVNLDEVTDQASFVDDLGADTLDTVELVMAFEEEFSFEIPDEDAEKIKTVAQAMEFIQQKVEATAT
>UniRef90_A0A2E7B655 Type IV pilus biogenesis protein PilP n=1 Tax=Hyphomonas sp. TaxID=87 RepID=A0A2E7B655_9PROT
MLTLPLLAKMSSAAVAAAITASLTYGQYNIASGPNGSGLMPPASVLHPNARPGAMLDPLAEMASAMTSLKQERAKADRNRAMIDWLAGLQTRFTVQRFETGLVYKVRYAAAGXAGTVLQDXVAVPYGPELPXAVSLQAGXGGXVRVEGLSCSGQETLSEMDAGAGEQAVETAAMSRAEAYLXQPXAADPALPADCLMARLKRG
>UniRef90_A0A3N2C5J3 Vegetative cell wall protein gp1-like n=1 Tax=Plantibacter flavus TaxID=150123 RepID=A0A3N2C5J3_9MICO
MQTPPASRGSSTPPEPEAVPGPPRPPSSPGHRADPCRSPSRPSRSLSRPSRSPSRPLPVTEQPAPVTEPVEVPHTEAPRPTTLPGGPSTSSGNEYPHPGHASQPRSPSNPPRSPSNPHRSLSLSKCHTPKPPAPQRSPGALRHFDKLSAAKLRERTSLPRSPIRPSRSLSLSKCHTPKPPDPRRHPGGPSTLRQAQCGAAQGTDIPPPVTEQTAPGH
>UniRef90_A0A5J4QFG3 Virulence protein (Fragment) n=1 Tax=termite gut metagenome TaxID=433724 RepID=A0A5J4QFG3_9ZZZZ
MEDIPMKENEDIGGRKSKNEQIESYLQERYDFRFNTVKSKPEFRPKNGNHPFSPVTKFDLNSLKREMDRTMGIATSSDNVRTILESDFSPKIHPVREYFNRLPRLDPDINNYTWQLSQTVRVANSDKWLEYLVKWLVGVVANALHDVGCQNHTCLVLTGEQGRFKTTWLDHLCPPSLQSYLFTGKIDPQNKDVLTLIAEYLFINIDDQLKALNKRDENELKNLITTPAVKYRRPYGVYIEEYSHLASFMASVNGNDFLTDPTGSRRFLPFEVISIDME
>UniRef90_UPI0014789B01 phosphoribosylformylglycinamidine cyclo-ligase n=1 Tax=Leucothrix arctica TaxID=1481894 RepID=UPI0014789B01
MEENKTSLTYQDAGVSIETGNALIDRIKPHAKRTKRPEVLGGLGGFGALMSIPSRYENPVLVSGTDGVGTKLKLAIDMNRFDTIGVDLVAMCVNDIIVTGAEPLFFLDYYATGKLNNDDAENVIKGIADGCEQAGAALIGGETAEMPGIYREGDFDLAGFSVGVVERDAIIDQSSVANGNVLIGLASSGPHSNGYSLVRKVIEVSGAKLDEKFSDKEETLLGDALLEPTIIYVKPLLKALKQFDIKALAHITGGGLTENLPRVLPSNCKAVIDLTSWDRPEIFNWLQKEGNIEDMEMLKTFNCGIGMVLVVAEDQADEVINSFKLQDIKSFKLGQISAAETEEAYVEYV
>UniRef90_A0A1I7TZE8 G_PROTEIN_RECEP_F1_2 domain-containing protein n=2 Tax=Caenorhabditis tropicalis TaxID=1561998 RepID=A0A1I7TZE8_9PELO
MDKKYMNCTRCELCATADVIYGTPFMEYSILLRLLTAPLATMGMGLLSATIVKTKGIHINTKVILFVLCISAITCNTGITIDCLYKFFISNVMPDYMQCDFQVFNPQYGLVIRHIEMLGSMCLSTSSIALAVERTVATIFYRNYPSKPTLGSILVVVQIHDYKFYHFITTWQALLNVLAISVFIILWIINYYRMKIIENSHLQVVLARYNLHENMSTTCLMAPIIVVLCLMVFSAELIILLFTPQYDEDTVVTHKVLDEVIEYSFYPELQLTLIPIFFIALILVLITQSKKLRENFLLVSNLSICFPVKVHTTDSRSSSESSSSEGSSSIHWNSKMDGLSITPQVPKF
>UniRef90_A0A3M2HUF5 Spermidine synthase n=2 Tax=Stutzerimonas TaxID=2901164 RepID=A0A3M2HUF5_9GAMM
MKRFVLIDTAQIPDDGGALCLFEYGEDFVIKIQGGNGNQLMNTRTHGSEDALAEIPCRKIAQRPHPRVLIGGLGMGFTLASALRHLGEDAEVHVAELVPGVIEWNRGPLGEKAGMPINDPRARVLRSDVADILKNEPQGFDAIMLDVDNGPEGLTRKSNSWLYSSAGLEACAKALRPKGLLAVWSASADQAFSQKLARSGFNAEEVQVFAHGNRGTRHTIWIAEKRE
>UniRef90_A0A2T1LZU9 histidine kinase n=1 Tax=Aphanothece hegewaldii CCALA 016 TaxID=2107694 RepID=A0A2T1LZU9_9CHRO
MKEQDIKRQFLDEAGDYLNVIESALLGCSTKEITSAQFDAVLRAAHSIKGGAAMMGYQTLSDFAHRLEDFFKVLKSHSKPEIDETVESLFLSSVDQLRQISSFYRQGAETIAPEWLSEQVEPIFQGLLDRIGELTPEKSLSLLSEDVGEEMTVLIFETEVESCLQGLESIIAQPQPTNLREEILSISQELGGLGEMLQLPQFSRLCTSIYEHLKSATEGIDAIALSAIQAWRRAQAMVIVGQKEAITSEFLLNHSTVIPTLETETTSPEELKIETVSTEEKTLRVSSSLLTELADLFGEMSIGRNSMDLQLQRLRRLFNLLNQRIQRLESSSQALRSLYDQRIQGYTSSVIPIKTNSVKPHLALFDNLEMDNYSDLHPLSQEVMETIFQIEEVANDLDIYLAETEKTAKDSQQTFELIQSQLTKARMRPLTDLIAHFPRALRDMSLKYGKPVELKIQGETTRIDRTILESLNDPLLHLLRNAFDHGIEDPEKRKEVGKPPQGTITISASTVRNHTIIQIQDDGAGINLDKIRSQAHKMGLDEDIIAKATIDDLLNLIFEPGFSTAENKSELSGRGVGMDIVKTQVQQMQGDIKVSTLAGQGTTFTITVPMTLSLIRVLLIEVEQMLMAVPCNAIEAMILPEPSQIIQFKGQTFLKEESELFPLIYLKDWLNIPTVYTQRDHESLPSIDKPTILKIALGNNYIGLWVERYWGEQEVTIRPVEGNLKLPNGFTGCTILGDGCVVPLIDPALLLQPSFPPSFLSSSFISNSQPTAQKATLLVIDDSINVRRLLALTLEKAGYQVEQAKDGQDALEKLQRGLGVQGIICDIEMPRLDGYGFLANYKTDSIGQNIPVVMLTSRSGEKHRSIAMNLGASAYFSKPFQEKLLLQTLQSLIKN
>UniRef90_A0A0R0EP28 Glutamyl-tRNA(Gln) amidotransferase subunit C, chloroplastic/mitochondrial n=4 Tax=Glycine subgen. Soja TaxID=1462606 RepID=A0A0R0EP28_SOYBN
MTSKGLLRGASLTANAVWHRSSFFPKVTVSVHPKLVKFQSFSSTTACSSLPPPDLPRLAKTAQISLTPNEVEEIAPKIQQVIEWFGQLQGIDLESVEPSIRAGSL
>UniRef90_UPI0015687092 helix-turn-helix domain-containing protein n=1 Tax=Ensifer adhaerens TaxID=106592 RepID=UPI0015687092
MVDGIPSFFVYGEPEQPLEPGFFHVETVMARRGLHHGQVKAHKHDQLAQVTYWLRGRGSYFIEDKVLDFSAPAVSFVPSGIVHGFSVEPRESDAIVISIADGLMLSVRAQTALAIDVPVMIAGVSGDSQWQRLSQLMDIIADEYATAAFGTQSMMASLASAILTQIARLASFAPSPSQSPDMMLAMQLRRMIDAHFRENWTVGRYTDALGSTPHLLAKATGAAFGMQVKELINERRLLEAKRLLLFTIRPLEDIAYEIGFRDAAYFSRFFRLRTGVAPSDWRQLKLGQTASSP
>UniRef90_A0A261KVG4 Transposase (Fragment) n=1 Tax=Hydrocoleum sp. CS-953 TaxID=1671698 RepID=A0A261KVG4_9CYAN
MILYHFEKRILRPDCIILLSALAQVGHNSPDLIAYAFRSGLFRLPGGTSQTLPKEPVNYTLDQVGDSLKRLELATPKLKQSVVDACAYRTPKWIYKI
>UniRef90_A0A2T5BQX3 Heme-degrading monooxygenase HmoA n=1 Tax=Rhodovulum imhoffii TaxID=365340 RepID=A0A2T5BQX3_9RHOB
MPTISRSNEFQTVITTFEVTPGTCQDLLDALSEAYASFISRQPGFIGAGLHVNDAQTRIANYSQWVRREDFQAMLRSEEMRDRNRRFTELSKSFEPVMYDVFESYD
>UniRef90_A0A1G9W8E7 Neutral/alkaline non-lysosomal ceramidase, N-terminal n=1 Tax=Daejeonella rubra TaxID=990371 RepID=A0A1G9W8E7_9SPHI
MKKLFSCIIISVQIILLSERPAAQENSHSGWKAGVASVVITPEESLWMAGFAHRTKPSDGKLHELWAKALVIEDASGKQALLITTDLSGIPKSISDSIRNQLEKRFKFSRSQIIFNTSHTHSGPVLVDALWDLYPLDDTQKERITKYTKKFELQIESIVRKALGSMKPVNISSENGITRFAVNRRNNIENKIDAQTDLKGPSDYAVPVIRVSDQKGKILALAFGYACHNTVLHGYEWSGDYAGYAQITLEKAHPGATALFFQGCGGNQNALPRKTVPLATQYGKELALAVDAVLEGEMKILEPKLSTAYSEVKLELEKAPSKDELLTIVSKETGYIKNWALNMIKKADKGETFISSYPYPVQFWQLGNQSIVALGGEPVVDYAINLKKVFGPDLFVMGYSNDVMAYIPTAEILREGGYEGHTSQMAFGMPAKWKESIEPTIMREVMILAEQLGVKAKPKP
>UniRef90_A0A5C5YMF9 Putative electron transport protein YccM n=1 Tax=Posidoniimonas polymericola TaxID=2528002 RepID=A0A5C5YMF9_9BACT
MTPLSSLAAILRRAASLEIVVLAFAFLFALATGVEGQEAYDRPVSSAPQPDDIGAGYQTPEVQRTSPRSAALQMLDVVLLIGGMAAIAWVSRRGRRRWVVTAVTLASLAYFGFYRQGCVCPIGATQNVAASLSDASLATPMVVLAFFLLPLAASLLAGRVFCGGVCPLGAIQDLVLLRPVQTPQGVDRWLGMFRYVYLGLAVWFAVLPAGQRDFVICRFDPFVGFFRLNGPAWMLGVGVALLLLGTVVGRPYCRYLCPYGGLISVVSRFAIWPVRITPDEELDCGLCVDSCPFGAIKDLRAKPSECLACARCFAHCPRQQLAWGEIELVELDELVSSAKCVAQRSGGNE
>UniRef90_A0A1I0ZIW2 Enediyne biosynthesis thioesterase n=1 Tax=Amycolatopsis marina TaxID=490629 RepID=A0A1I0ZIW2_9PSEU
MAYYEIRHIVGFEETNLVGNVYYVNYLRWQGRCREMFLKEKAPAVLEEVRADLKLFTLKVDCEFFAEITAFDELSIRMRLEELTQTQIQFTFEYVQLAEGRENLVARGRQRIACMRGPNTATVPARVPEELRTALAPYAEDVKGARTESAAVPATGV
>UniRef90_UPI0013C30B07 phosphatase PAP2 family protein n=1 Tax=Euzebya tangerina TaxID=591198 RepID=UPI0013C30B07
MVRQAFSRLPGAVALSRATTDLGSMFMVAGAAAMLLAGGRVRRAGEVAAAGALGWTVAHQAKKVFDRPRPYEAEATPRLIAEPTGSSMPSGHAAVAMATATVLAGRAGPGRRWVWLLMPAWVPLTRIHLGVHYPTDTMAGLILGHGLGRLVVAVSDHRSRRQPQDDGRVV
>UniRef90_UPI001C0550E4 protein PRRC2C isoform X12 n=1 Tax=Corvus kubaryi TaxID=68294 RepID=UPI001C0550E4
MSEKSGQSTKAKDGKTKYATLSLFNTYKGKSLETQKTTVAARHGLQSLGKVAISRRMPPPANLPSLKAENKGNDPNVNIVPKDGTGWASKQEQHEEEKQPDVPQTQPKPAVPAPPEAAPVAKSWANTKPGGQEGPPIPINSYFQQEFPSLPAAGDQEKSGKDKDAPEDGSGPNLRPQNQDPKALGQEDASATPAEQNDGQKAGDKRDVRLPQVPQPKLNGQQQPPISSQYRAMMPPYMFNQYPRMAYPPSMQGPTRFPNSEPGRGPRGRGPPSWCSEPIERPSILSASELKELDKFDNLDAEADEGWAGAQSEVDYTEQLNFSDDDEQGSSQKEKESGDEQTPSKDSQSPDGQKETEEQTNAKSATQVSAAAAKGSYSKSSQLDQDRGPPQPSIHERGGPALPPKSILPPHPPPPDRQMGRQGPFPPKPVPDDDEIWKQRRRQQSEISAAVERARKRREEEERRMEEQRKAACAEKLKRLNEKFGCVTKPSREDPLKEREREREREREREREREREREKEREREREREKEREKEKEKEREREKEKEKEEKEKLEKAKEQEVEKEKEKEVEKEEKENEKEKEEEKPAHDVPEPVEPVATPVVEKQESETKNNKKEKEDQAVFTRQDSGRNEKEVSQVTHENEPDSGSQPRPAVSSGYSKQFQKSLPPRFQRQQEQMKQQQWQQQQQGVLPQSAPSQPSSGPVPPPQHRPLYQPMQPHPQHLASMGFDPRWLMMQSYMDPRMMSGRPAMDMPPIHPGIMPPKPLMRREQLEGSAAGSDSFEHMARSAREHTVPLSEPRMMWGSDPYPHAESQQSSSPPKVLEEPDDLRSEAHLEQERVAVPASAYPVEHNQLDSHPKTEFFRESGEVEVQKFPSRPLEDVQPLQTDTPNTAVNFEAVNEKVTRSSPELVPVGESHSSLKRSISHGSSHSLKSEDQRSETAANIPKLSNRPIEAKETIERLEIKPKKEILITNRTSEGPKPEKTFKPKSETRWGPRPGYGRRDEGGDRPVRRSGPIKKPVLRDMKEEREQREEREQRKEKEGEKTASEKPGKPEKSDKKEAPQVPLPQAEPERSTSSSAPLAKKITQDAAPVPASQESSQPEAAAKAVVQPPAPAVQQQLPAAQPAAAQLPPAIPQAPATQPAVQPPPHAQPPAPASKEEKQAEKVVSKEVVEKPRLETRPVKREPGLPPRTYWKEARDRDWFPDQGYRGRGRGEYYSRGRSYRGSYGGRGRGSRGHNREYPHYRDPKPRSEHVPSGPVRQREESETRSESSDFEVIPKRRRQHGSETDSDSEVHESASDTLLSDKDSIIKGKHPKREERADGKKPPKPLSFKPENNIRVDNRSLEKTYVRDDENKPKPGFLPKGEPSRRGRGGMYRRGGRDPGGRPPRPSTIRRPAYRDNQWNPRQTEIIKPEDGEPPRRNEHYGPIPIDKRPPKFERKFDPNRERPRRQRPARPPRQDKPPRFRRLKEREAASKMSEVVTSSTTSATVSNAVNEPSNPALDVSGSKTPDLSNQNSSDQANEEWETASESSDFNERRERDEKKTADAAAQVAAKAGENAGVPKREIAKRSFSSQRPGIDRQNRRGNNGPAKPGRNFSGPRSERRSGPPPRSGKRGPFEEQAAPVPGVDPANSNALHQEDGGVAAAGQKTTKDASGKKREEPKAGPKKPKEKVDALSQFDLNNYASVVIIDDHPEVTVVEDSQSNLNDDGFTEVVSKKQQKRLQDEERRKKEEQTVQVWTKKGSSEKGRGQNSKLPPRFAKKQQQAAAAAAQQAQAQPPCPAQSPAQPQAPVPTQSQAAGGTASTDYTVSGKVLQNTQAHNGLGAELWDNKVPPTAVLNDISKKLGPISPPQPPSVSAWNKPLTSFGSATSPEGTKPGQEGGVDLGIETIQFGAPASSGSDNEVGPVLSEKSTDKLPEPKEQRQKQPRAGPIKAQKLPDLSPVENKEYKPGPIGKERSLKNRKVKDAQQGEPEGQEKPSPTSVRSPEPVTTKETKAASELSTEIGTMISVSAPEFGTNTKESVTDYTTPSSHPNTVATSSTKMEETLVTNVPLPHTLPLPRRETLQQSSSLTPVSPATVDLTLKMESARKAWENSPNMGEKSSPVTSAASPIAGGSSSSSTGPSSGTYSSFSSASMPPIPVASVTPTTSLSGAGTYTTSSLSTKTASTSDPPNICKVKPQQLQTSSLASASHFSQLSCMPSLIAQQQQSPQVYVSQSAAGTTAQIPAFYMDTSHLFNTQHARLAPPSLAQQQGFQPGLSQPASVQQIPIPIYAPLQGQHQAQLSLGAAPAVSQAQELFNSSLQPYRSQQAFMQSGLSQPSPVVLSGTALHNFPAVQHQELAKAQSSLAFQQTSNTQPIPILYEHQLGQASGLGGSQLIDTHILQARATLTQASNLYSGQVQQPGQSNFYNTAQSPSALQQVTVPLPGSQISLPNFGSTAQPLIALPQSLQPPLQHTPPQAQAQNLSRPAQVTQPFRGLIPAGTQHSMIAATGKISEMDLKAFGGGIDVKPGTPPVTGRSTTPTSSPFRASSTSPNNQSNKMNSIVYQKQFQSAAAAVRMTQPFPAQFAPQILSQPNLLPPLVRAPFTNTFPAPVQRLPVVLHSQMPSQMTTGLMSHPQLPRVARGPCGSVPGARGTQAQAALKAERDMKVSM
>UniRef90_A0A1A2FR64 MPAB_Lcp_cat domain-containing protein n=1 Tax=Mycobacterium sp. 852002-51057_SCH5723018 TaxID=1834094 RepID=A0A1A2FR64_9MYCO
MKGPATRIADLLNPAAVLLPAANVIMQLSLPGVGYGVLESPVDSGNVYKHPFKRARTTGTYLAVAAIGTESDRALIRGAVDVAHRQVRSTPSSPVSYNAFDPKLQLWVAGCLYRYFVDQHEFLHGPLDDYSAEAVYRDAKRLGTTLQVPERMWPPDRAAFDAYWKRSLDQLRIDPPVREHLHGVASMAFLPWPLRMLAGPFNLFATTGFLAPEFRAMMRLDWSRSQQRRFDWLLVALRLADRLIPHRAWLFSYRLYLWDMRSRARRGRRIA
>UniRef90_A0A7C8PLT4 Uncharacterized protein n=1 Tax=Orbilia oligospora TaxID=2813651 RepID=A0A7C8PLT4_ORBOL
MPTGRFREQFRRFIASEILAASIASGPPKDLSRLEMPKYPIQTRPPKMPSESTRAASTESATLVRIAEYVFDEKYSNQNKFN
>UniRef90_R5PHK2 Glycosyltransferase group 1 family n=1 Tax=Prevotella sp. CAG:487 TaxID=1262928 RepID=R5PHK2_9BACT
MAGRLALKTCALGYVSDDKRIAVIYNAADIYVLPSVEDNLPNTIMEAMACGVPCVGFRTGGIPEMIDHGKNGYVADFRKADDLAAGMHRLLCGDDYEAMSRAAVSKVHIHYSQQSVAMRYIEVYNETAAMKKYII
>UniRef90_A0A067SRJ6 HET domain-containing protein n=2 Tax=Galerina marginata (strain CBS 339.88) TaxID=685588 RepID=A0A067SRJ6_GALM3
MPAIKAAGIDNSRTLYDIVHGCCVTLFACTWLSIHPNICAPSDSDWTSRRRRLKTMLCALIVPELVLVWALRQRTGAKKIAEKQKEKKWTRYHGFFISMGGFNLFCDGKRIPLSPKRLEQLEECGWIAWPGISEREIKDKSKGDFLSKGIAVSQTLWFVVQCIARFEQGLAVTELELVTMAFVVLNVALYWAWWDKPLDVRCPVDVKIKEGITLPQVEDLFYRDDTRSDPPNRLQLPSFRILKLSTEEGIQPTYPDQTFFLRKFMTFIHPKGPHGCLHRMIISLARPFSDMLSSTEIPRGADCVPTFYAPSGDSRSDYSDEYSIALGLGFAILFGLSHCVGIWVNLSFPTEIEQDIWRVTAIAITAAPLAFQLLGGLVLALGSPEPERPWSGVFMYGCLVIWYLILIAYIFSRFVLLVLPLIAMRALPGSAFDDISWAKFLPHI
>UniRef90_A0A8J4Y4H5 Neurofibromin n=1 Tax=Chionoecetes opilio TaxID=41210 RepID=A0A8J4Y4H5_CHIOP
MCVCVTPSPVPSPVTRHRFCSHPDDKKRAKVAMILDKLITLTIEEVEMYPSIQAKIWGNIGQVSELIDMVLDSFIKRSVTGGLGSGQAEIMADTAVALASANVASVAKKVIGRLCRVIDKTCTSPTQTLEQHLMWDDIAILARYLLMLSFNNCLDVARHLPYLFHIITFLVTTGPVSMRASTHGLVINIIHSLCTCTKPTFLGKFVCFVAVFVCRFFRP
>UniRef90_UPI0021698233 SPOR domain-containing protein n=1 Tax=Mucilaginibacter sp. X4EP1 TaxID=2723092 RepID=UPI0021698233
MKNTASYLKTKIGWIGYCIFFVLFILPALSHAQTRGKVEVVKDPLIDTLIARRASLGKNVAVGDDATSGYRVQIFFGSNRQDAYSAQARFLGEYPDTRTYILYTEPNFKVQVGDFRTKLEAQKLQNDLRDKFTSLFIIQGKINPPKTDASND
>UniRef90_A0A8T9PFL0 O-antigen ligase family protein n=1 Tax=Leucobacter sp. H25R-14 TaxID=2932245 RepID=A0A8T9PFL0_9MICO
MAESKTRLGVSAYAICVFIFTLGSNGVRNLVGWPAFLALAVVLTGLGIVLFVRLKPERFRWYRLPAPIYWFLILAALSILWSQYRLESVLGVAAQLATTVLAVVVAFVLSWHEVLRTLGTALRYLIGLSFLFELWVALFVRAPLLPWWMEEPEGETPKLLYWSRDLLFSGGPIQGLVASSVLLGFLGLLGVIIFAIQLRAGLVRPFSGWCWLALSLLTILLTRGATVWVALAAVVVGLVVALWARRLGPERRVPLYVTSGALLAAVIALTLFARDTVFGLLGKSGDMTGRLETWQKVIELAEQRPWFGWGWISYWAPWAEPFASLDRKAGLQVMSAHNAWLDVWLQLGIVGLLAFAPIVVLTMWRTWFRAVDQPRRGHGPALPYATSSLWPFLVIIALLVQSLTESRLLIEGNWVLLILLAVKSRFDFQLPSLDAEPTRLPWRRVPIPQERLVPYKRDPRD
>UniRef90_A0A1Q9V6M8 TetR family transcriptional regulator n=1 Tax=Saccharomonospora sp. CUA-673 TaxID=1904969 RepID=A0A1Q9V6M8_9PSEU
MPKYVDHEGRRTEIVEATWRLIAERGIEEATMRAISESLDMANGALKYYFPDKNSIIRAAFEHVVAATNARVRERVGEATGLAALRAFCVEMAPLTELTKLEARVVLPFWQRALSDPDLERLHTDSVTLLRAHIVEFLQQARAEGTVRASTPDDVLADQLLAMLIGLQALALLDQDGTGEAAQLRMIDAFLDSLA
>UniRef90_UPI0015550403 DUF3990 domain-containing protein n=1 Tax=Palleniella intestinalis TaxID=2736291 RepID=UPI0015550403
MLVYHTSDVQLNIPDTVHSRGNLDFGRGFYTTRLKEQAIKYGERFVALGHDAYLHTFDYTPCSNLRIKTFDSYDEEWLRFVCSCRKGGTEYEQFDIIEGGVANDKVYRTVDFFMTGIYTLEQALQQLVYHKPNHQICFITRKAIDLCLRLSDCRKLNI
>UniRef90_A0A2G2GAA8 CSD domain-containing protein n=1 Tax=Arcobacter sp. TaxID=1872629 RepID=A0A2G2GAA8_9PROT
MKESKGFIMKGKLFNCSNGATSSEHCFVIADGGKHGYFVSSKKADGPLMNGACISFELEDQKKGSIVTDVHILD
>UniRef90_UPI000314C431 metal ABC transporter permease n=1 Tax=Bartonella rattaustraliani TaxID=481139 RepID=UPI000314C431
MYAFFLAPFIDFHFMQNALIGSILLSISACPVGVFLMLRGMSLTGDAISHAILPGVAAAFLFRGFSLISMTLGGLIAGFIVVLATALISRNSFQKEDASLTVFYLIALAAGVMIVSLKNSATDLLHFLFGSVLALDTQAIFLITTIMVITVCSLYILWRALLVESFDPFFFKSLSPLSKYVHLSLLGLVVLNLVGGFQSLGTLLSVGIMMIPAITARFWLSRLGPICILSILLGIIASICGLLLSFHLSLPSGPAIIIAAGSLYLFSCFISPRGFIVAWFPHLFYNYFLNLKK
>UniRef90_UPI00210245CE peptidoglycan endopeptidase n=1 Tax=Sandaracinobacter sp. RS1-74 TaxID=2913411 RepID=UPI00210245CE
MGGAFRPQGRGEEGLDCLGLALRALAAGGCRVDMPRLPMRGHSVEQVHGWLCAAGFARLEVEEASPGDLLLSFPATRQAHLAVRTAEGFVEANAQLRRVVERPWGGGGVWDSAWCIGAGAVKGRG
>UniRef90_A0A2E9K2A4 AraC_E_bind domain-containing protein n=1 Tax=Alteromonadaceae bacterium TaxID=1916082 RepID=A0A2E9K2A4_9ALTE
MVLVSKTTDSTAMNEPEPALVQFEGVKLAQLVHRGSPQTLMASVGAFIQWRKLNGSPPSQSRTFNIFYSDPLNTEPAAFTFGIAAEHSKDIAPNSQGVSEAHIPALHCLSWIETGSDGKLQQRIEQVIGEGGYDWHFEQFPPFIERLHFYPDVPMAEAISRVYLPVQAQ
>UniRef90_A0A8T1N0L7 Fibronectin type-III domain-containing protein (Fragment) n=1 Tax=Clonorchis sinensis TaxID=79923 RepID=A0A8T1N0L7_CLOSI
MSITLDRLDECSETWMGIFAINFAGDSPVSPLVKLISPSAPTAPNDVRFNVDRRTRKIHITWKDTSVCPTTNYTLSDVQKGWLVTTVNREAYLDFGVPCYHYQIHIKGANTGGQGPASDVIRFFTPHNFDAPTNVRVTTEPSVPDVEVSWLATGVCHSIQYMVTLYVAGVIVKTEVTESLNVILRDLEKCKPSSITVKKYTQWWSGDESGRTEFQIPGVPSAPKLIGATTEQNVPSATVSWTYDGACTSTDFLVTVYATAESVPEPVRASGLSTSIGGLPMCVDLVFGVVGRNQFGSGQETKSSPIRIDAVPSAPKLIEATTEQNVSSATVSWTYDGACTSTDFLVTVYTTAGSVPEPVRASGLSTSIGGLPMCVDLVFGVVGRNQFGSGQETKSSPIRIDAVPSAPKLIGATTEQNVPSATVSWTYDGACTSTDFLVTVYTTAGSVPEPVRASGLSTSIGGLP
>UniRef90_A0A843CS01 PAS domain-containing protein (Fragment) n=1 Tax=Methanomicrobium sp. TaxID=2052684 RepID=A0A843CS01_9EURY
MTVKEITKVLEEALMGNYSVRVNVDEAEDELKELAETVNTAIEFIIDSKRTCDNVSMMIQQNPYPMMLLDRNFMPIDVNAAYEKLMGYSKDQILTMLASDYKSRRISGDNTETLFTAGHNTETLVEIDFKDGRKLFVEQRGVPLRDSDGNVEMGLFVFKNVTNEVIEKEEITKQLEQIKVLQGRSEVIVQENPMPILLCDKNF
>UniRef90_UPI0004174C5D hypothetical protein n=1 Tax=Mesorhizobium sp. WSM3224 TaxID=1040986 RepID=UPI0004174C5D
MPFTVIWYGRSGIVDKMSFDAEKAARDYAMSMFQTRKGDDGIVAVEVRKDNGAVVFSHSEN
>UniRef90_A0A1N6TYF1 Putative signal transducing protein n=2 Tax=Marinobacterium stanieri TaxID=49186 RepID=A0A1N6TYF1_9GAMM
MLVTIARYTYPYEAQIARALLDSEGIDAFIADEQTINMQWLYSDALGGVRLQVAQEDVMRAQRILQDDRETPLVELEGEDRPACPVCGSRDTEYYQIGRRWAFLMFLAIDFPLFRVQDGIRCHSCGAISKQHSDAARH
>UniRef90_A0A7Y4ZJH0 3-keto-5-aminohexanoate cleavage protein n=1 Tax=Polyangiaceae bacterium TaxID=2268199 RepID=A0A7Y4ZJH0_9DELT
MSSHDAHYAGELVDGARMLALFGDLATELLIRIDGDEGLFRAYESVEFLAPVLAGDYIEASAELLTLGNTSRKMAFVAKKVVSNLRAHGVSPSAAEVLDEPLVVCRAIGTCVTPKSLQRRPKGLYMPGLPPGPEPEASPIVTPVSNDVILTAAIVGAEVTRAQTKYLPITPQEIADEAARCREAGAAVIHLHVRNDDGTSTQSKERYAEVLEAIAKKTDCIVQTTTGGAVGMPIEERAGPLACKPEMATLNCGTINFGDDVFVNSRPDIRKLAKLIREAGSIPELECYEVGHVEEALALFREEHIQAPLHFQFVLGVAGGIGAREENVHYLRSLVPPEATWGVAAVGRHQVPMTELAMRLGGHARVGLEDNIYLSKGVLSEGSAPLVARAAAFAREIGRTPADPTRARQLLGLTK
>UniRef90_A0A0N5BVH2 Calponin-homology (CH) domain-containing protein n=1 Tax=Strongyloides papillosus TaxID=174720 RepID=A0A0N5BVH2_STREA
MTDNRLTEIPQIIIEKMKLLETLILAKNVIKTLPTCMKGFNSLNYLDLSSNNLTTIPSAIYSLPLQILLLSNNKLDTVSGDIVQMAPTIQELDFSKNRITSITSNISLLKQLRKLNLRSNRLGALPSEMASLDLYSLDISANRLTHIPVEFCSMQSLIHLSILDNPLLSPPIEIVLKGREHIFKYLQSAISSDVDYRGNYTDWSTNRNSFINATIRRPKNAEKVAAKAKRFAALNSSDSGYTSTGDDQRHSYDMEFSRNSLASIDENHKKETIIINKEYNGCLNNDDEGVDLSHTPKDVRKLNLIEECNDVNNSNNNNNNDINMDSSIYTTLASVTVTDSTYIKPNNIVVKDKEPKNEENPDSVLESTSPTTSESHSPLSESMASLSSPDGENNSTLVIESPNVKDNSNILVPISSNESPPKASNNRTLKPPTKKSPPSKVQSKLSVPSQGKSTLLIKKEPTISKLMKPSITTAIPTPRISKLTPPKKSMSISSSRSTTPSTPISPSNDDDVELMKKLLGSKLLAVTKEDEISKQLSSGVLLCNFVNKLKPRTIPVVMASLSPSQPVPLPKAKKNAENYVNAAKKLGLSEVCFTIFIISSF
>UniRef90_A0A1H1DUL9 Lipoprotein n=2 Tax=Pseudovibrio sp. Tun.PSC04-5.I4 TaxID=1798213 RepID=A0A1H1DUL9_9HYPH
MVGTQVANTLLKNTGRALLLIGIGASLAGCGSIMSSDSDLEASSSEAPATERTFDLSVLQAPAMCPSLQELSGTTILAKYPRGKEKTPENLTFQAVITDWARTCKRVGKDSAMKLGIAGNITPGPAWKGGEIFLPIRVAVTNEVDDVEKTTYSKLFSVPVTLGAGSPSATWAFVEEGIILPNETGQNVVFGFDEN
>UniRef90_UPI00097132DB hypothetical protein n=1 Tax=Herminiimonas arsenitoxidans TaxID=1809410 RepID=UPI00097132DB
MKQVLNIFIVGSILLSSQPVFAQSTTTVEADSQSYSVSALTERYPANSIQSSTAASSALADVTKARSFIESRFAAGQRACYKEFFTNSCLAKVKEQKRADLAVIKPIEIEANAYTRHAKVAESDRRLAEKAAQSEGRATASTQNKTDAASGKSTEANDLTKDAQRKVRAENYAKKNADYAERQKLLRENEQADAKKRAENVERYEAKVRESEARQKEVAAKKAEKAREQANKQ
>UniRef90_UPI000FD9191E proton-conducting transporter membrane subunit n=1 Tax=Rhodobacterales TaxID=204455 RepID=UPI000FD9191E
MTTAFSLSFLAPVLLIAAALAAFRTPGRRPGAVPQISEVAALGALGLVALGLIQVIVAGPAVSSLFDGAGVLALRADPVSATLALLVAFIGWIVLRYSRTYLDGEAREGAFHGLMLVTLAAVLIFVMSGSLWLLVAATIATGLGLKRLLLFYADRPEARRAAAKFGLVWHGGDAALIAAALVLTSAHGTGDLSAIAASNGGAGIAGHMAAGLLVLAAILKTACFPLHGWLTEVMEAPTPVSALLHAGIINSGGVILIKTAPLVQTSPGAMAALVMIGGFTALFGAAVMLTQSAVKTSLAWSTVSQMGFMLLQCGLGLWALALLHIVAHSLYKAHAFLSSGGAVAAVAAIRKPGPVAVPDLGAVLKSFGLALLLYAAIAGLFSVAIGPKTAQALALGAILVFGVAYLVAQGLADTAPAELTRRTVAASLAATLAYFSFQAVAQWVWGADLPAAPAPGPLEWALIVLAVLSFGMVALAQSLFPLWAHHPATAGLRVHLANGLYLNALLDRAIGGFRTTKSS
>UniRef90_A0A8J4S172 DNA ligase n=2 Tax=Phytophthora kernoviae TaxID=325452 RepID=A0A8J4S172_9STRA
MPAEDERAALRLSFGALCRVLEKLERTPKSDAKLRLLFSDALRAQLGGGDLYPLIRLVLPQLDRDRTYNLKEKMIAKIYIDVLGMASASKDAQKLEHFNDPNVIASKYVGDFAAVLYEVLLYRSLARDRQNERTLQDIIGLIDALEQADSSAMRKKVVMRLATEFSASEQKWIVRIVLKDLKVGLRHERVLNFLHPDAMKMYNHTNDLHKVCTDLRNSAVRYVPQLEPFRVFSPMVAKQVTFGECITAINADTFVMEPKLDGERITCHVQGKQVQFISRNGVNYTELYGTSMTPHVLSQLMPGVDCILDGEMMVWDNTEYQFREFGLLKNVANAMRNGDATNRWLCYTVWDVVYLGGSPKAESLIHEVFKGPREVSAVMGLPLHARRKLLLRILSPLDHRITIIEQTAVNAKSPKERHDIVMAEVDRQISNGGEGVIMKDLNAHYMCGESSRRAKKWLKLKPDYAGMTTDLDVLIIGGFYGTGRRRSGNVSAFLLGVLAQSVDENAAAETLKPGASCPMVYTFARVGTGYNLEELEQMRQELDPYWQPWDDNNIPPHLNGWKPQKYYLKPDLWIDPRHSKVLEVYGFELTYTTLYQTGLTIRFPRCKSIRNDKEWYQCINLQDLNAARGSLSIKRAGEIALGQKSTAKRAPKRQVLRARRAGGVLANYSQAALDGLEQECDVFEGKEFCVLPGKYDAPPPNSVSAIPSGILEEHAKHMSKQMVEKLLHSFGGSIVQNPIAESTNYVVAAGDAGFKVVNLKKQGHFNIVHISGSPPITAATGNDYGTSDRVQVEQLQPIVRKLRHQGLQEPPTVTKEWVEQSVEQRTQLPVEKFFVAM
>UniRef90_A0A239J7H2 Amino acid ABC transporter substrate-binding protein, PAAT family n=2 Tax=Streptomyces TaxID=1883 RepID=A0A239J7H2_9ACTN
MSERSSLSRRGFLSRTAAVGGLAAVPGLLAACSRTQAGTGAPTGDGDLLATLRKQGYVRVGFAGEAPYGYRDGNELAGEAPTLHGEIFTALGVPELRPTLTDFGALIPGLTADRFDVVSAGMAITPDRCRKVIFSEPEFVSPTALMVREGNPKGLSDLLSCAREKATVGVLSAAVEADYADAAGVPLTSVKSLAKQQDGVDALLADRIDAFALTGISLRWLARTNDGAAVEVLDPFLPVVGGRRQYSPGGAVFRPGATGLRDAFNKELGKITADPGRYTSLIGKYGFTKAEVPPATLRTAQLCKA
>UniRef90_UPI001877F83B 2-oxo acid dehydrogenase subunit E2 n=1 Tax=Microbacterium sp. YJN-G TaxID=2763257 RepID=UPI001877F83B
MIAEFRLPDLGEGLTEAEVVQWLVKPGDTVALNQTLAEVETAKAVVELPSPYEGTVSSLHADAGETVAVGAPLIAFDIGGDTPDSEPDGDEAATGEAADGGSAEKDAAPDAEKAQPNLVGYGAQPASSGRPARRVRRGGAGATATADAAVIEAAPHDALPPSAAEPAVGERPRSTPPVRAHAKRLGIDLVLVAAQVGDRVITRADVDAYAERVGAAAPVGTEQDAEMVPAAPPAPRGERAQTRIPIKGVRKHTAQAMVRSAFTAPHVTTFHTVDVTATMELIEQLRADRSLAEHRIGPLVVVARAVCLALGRNPSLNATWDEDAGEIIQNHFVDLGIAAATERGLIVPIIRDAERMSLPELADALQQLTQTVRAGKTGPADLAGGNFSITNIGVFGIDAGTPILPPGQSGILAVGAVRRQPWEHRGEIALRQVMTLSVSFDHRLVDGAEGARFLKDIADLLEQPGRAMLF
>UniRef90_UPI0004BB0B65 T9SS type A sorting domain-containing protein n=1 Tax=Alkaliflexus imshenetskii TaxID=286730 RepID=UPI0004BB0B65
MKLRLSLLAFLLVLAVDGMLGQQVWFFSEGTGATFYDQGIVDVANLGGSSFEYTHPPGLPQFNDKVPCSATAWSGSTSLKFNYTSAASGNWKATIYRSDWSVADITGMEFLGFYLYAGSGLPASALPKIGLVANRLGGGGDATSLLYDLSAHNDDVPADQWVEVKIPLSVFIEDGGNALLDFTRVKGVVFSQSEVNGVPRLLFIDDIKAFVSMDVVPPVSQLKAEGFDSHVELRWQQPLDFLSYRIYARYAGSEDYVQIAETDKDYYLHFVPQSARNTEISYKVEAFSQDKESDAVTIQATVRDFTDEELLDMFQRYTFRYFWEGAHQPSGMALERTNGDGRTVASGATGMGLMAMVVAYERAYEERAEIKTRILKILEFLENCERHKGAWAHWYNGDTYQTQPFSSLDDGGDLVETSFVAQALITLRNYFRDEDAQSVQIRQKATLLWEAIDWNWYRNGNQNVLYWHWSPNHGFAMNMKIQGWNESLITYVMAAASPTFGINKETYTQGWARNGSMVNPRTYYEHPISLSPNWGGPLFWIHYSHLGLNPKGLSDQYADYWQEHVNTAKIHHAYAVNNPLGHQNYSENNWGLTASDDPFGYTAHEPMNNDNGTISPTAALASMPFTPMESMKALKYFYRERGADLFGLYGPYDAFNDNMGWVQKSYIGIDQGPIVVMIENHRTGLLWKHFMADAEVQAGLDKLGFSYQATSAAPGLEHSELINLFPNPAVDNVSIELPHHLVGRQIAVAIYATDGSQVYSSVFESSETIYTINCSAVQNGFYLLKMVSGSRVYRAKLIIRK
>UniRef90_A0A6I9VL36 secernin-1 n=6 Tax=Bactrocera TaxID=27456 RepID=A0A6I9VL36_BACDO
MSATGDCFIVQSPNTAENTIIFGRNALDADALTEAQEVQYYNANVALEGKPDGGADVVKANGEILRMILQKTQTGIWGGDVGANDHNVCIAVSWSAEEPANDSDTLRSTDIVRLTLAIAKTAVDAVERIGNLVANHGSDNAKFSFVVCDTKEVWLVSSGAKLWAAHQVADGFLRLTNKGLSVKTAIDKSTDDLGDALKTLGLWDGEGDLNFASCFDAAETAEAEWSGEAPNGDGSYTLTSMFDTLRSAADSATSRSASVSVLTNGISCHWFTATPNASESVFKPFVFAPNPKISPLTKVPPDNTHTLLHKLHAQRKPNAVEDLKALEAACVEELNAYLAEHPNADEELDELMKDCVEAEVKFYR
>UniRef90_A0A2Z5ZAZ3 Uncharacterized protein n=1 Tax=Nitzschia sp. PL1-4 TaxID=2083272 RepID=A0A2Z5ZAZ3_9STRA
MIYINFNILLNFFLILYIFFIYTLQVIRPEIVTDTDVMLMSLLVLYNWVLVIQGWKFDPIMLFSQYILILLILTLEWENIRLRGFILILKKIINNK
>UniRef90_UPI001BB17932 GATOR complex protein DEPDC5 isoform X7 n=1 Tax=Microtus oregoni TaxID=111838 RepID=UPI001BB17932
MRTTKVYKLVIHKKGFGGSDDELVVNPKVFPHIKLGDIVEIAHPNDEYSPLLLQVKSLKEDLQKETISVDQTVTQVFRLRPYQDVYVNVVDPKDVTLDLVELTFKDQYIGRGDMWRLKKSLVSTCAYITQKVEFAGIRAQAGELWVKNEKVMCGYISEETRVVFRSTSAMVYIFIQMSCEMWDFDIYGDLYFEKAVNGFLADLFTKWKEKNCSHEVTVVLFSRTFYDAKSIDEFPEINRASIQQDHKGRFYEDFYKVVAQNERREEWTSLLVTIKKLFIQYPVLVRLEQAGGFPQGDNSTSAQGNYLEAINLSFNVFDKHYINRNFDRTGQMSVVITPGVGVFEVDRLLMILTKQRMIDNGIGVDLVCMGEQPLHAVPLFKLHNRSVPRDSRLGDDYNIPHWINHSFYTSKSQLFCNSFTPRIKLAGKKPTSEKTKNGRDTSLGTPKESENTLPIQVDYDAYDAQVFRLPGPSRAQRLATCRSVREQENHNRKSASSCDVSSSPSLPSRALPTEEVRSQASDDSSLGKSTNILMIPNPHLHQYEVSSSLGYTSTRDVLENMIEPPQRDSSAPGRFHVGSAESMLHVRPGGYTPQRALINPFAPSRMPMKLTSNRRRWMHTFPVGPSGEAIQIHHQTRQNMAELQGSRQRDPTHSSAELLELAYHEAAGRHSTSRHPGDSMSLNFGATEELSASLLSNSGAGLNPRTQNKDSPEDGVSTSPDPMPGFCCTVGVDWKSLTTPACLPLTTDYFPDRQGLQNDYTEGCYDLLPEADMDRRDEEGVQMTAQQVFEEFICQRLMQGYQIIVQPKAQKPSTTVPPPLSSSPLYSRGLVSRNRPEEEGQYWLSMGRTFHKVTLKDKMITVTRYLPKYPYESAQIHYTYSLCPSHSDSEFVSCWVEFCHERLEEYKWNYLDQYICSAGSEDFSLIESLKFWRTRFLLLPACVTATKRITEGEVHCDIYGDRPRADEDEWQLLDGFIRFVEGLNRIRRRHRSDRMIRKGTAMKGLQMTGPISAHSLESTGPPVGKKGTSALSALLEMEASQKCLGEQQATVHGKSSTQAAESSSVAMTPTYVDSPRKDGAFFMEFVRSPRTASSAFYPQASVDQTAALVSDSASLGVSTCQSLDRGSNQTLGNSQNIGEQAFPSANSDCSAQQHAASSLTSSSTLVEILEAMKHPSTGVQLLSEQKGLAPCCFISAEVVHWLMNNVEGVQTQAMAIDIMQKMLEEQLITHASGEAWRTFIYGFYFYKIVMDKEPDRVAMQQPTAPWHTTGVDDFASFQRKWFEVAFVAEELVHSEIPAFLLPWLPSRPASYASRHSSFSRSFGGRSQAAALLAATVPEQRTVTLDVDVNNRTDRLEWCSCYYHGNFSLNAAFEIKLHWMAVTATVLFEMVQGWHRKATSCGFLLVPVLEGPFALPSYLYGDPLRAQLFIPLNLSCLLKDGSEHLFDSFEPETYWDRMHLFQEAIAHRFGFVQDKYSASAFNFPAENKPQYIHVTGTVFLQLPYSKRKFSGQQRRRRNSTSSTNQNMFCEERVGYNWAYNTMLTKTWRSSATGDEKFADRLLKDFTDFCINRDNRLVMFWTNCLEKMHASAP
>UniRef90_A0A317JBS3 DUF2959 domain-containing protein n=1 Tax=Chlamydiae bacterium TaxID=2081524 RepID=A0A317JBS3_9BACT
MSLKEECKQLSDLFHRAAEGQSIDLQQVFAQSLQFFERLKVELKEEDPQRRQEAMAMLMEIYQHMIKDTKLICETSGMTEEQLVSFAENPTNFSPEQWASIQESREKISHAGQDLAKALEQLSSSQGEKKPHDPTKKSKKSDWMRS
>UniRef90_A0A8J7MXB5 Tripartite tricarboxylate transporter substrate binding protein n=1 Tax=Candidatus Odyssella sp. TaxID=2589116 RepID=A0A8J7MXB5_9PROT
MAAVAVAASALAVSTVAQAAWPERPVTIIVPAGAGGGTDATARLLAKQLQDELRQPFNVVNQGQASGLVGHTNISQARPDGYTLGIIYPYYQFNLSGQSQLDHSSFTPIALYNMDPSALSVAANSQFRTAQEALAFIRANPGRVRMSCGGSCGGSWDLPLAGLLVRLGIDPRTVVMVPSGGAAPGLQELVSGGVEMIACSLPEAAALISANRVRPLMVLASERAGNFPDVPTAREATGQDHTGGAWRAVAGPPGLPPEVVATMERTLERIWRSDEFQNAMRQRGFGLRWANSRDTAAFLLQHEREWTDGMTALGMVRRAPR
>UniRef90_A0A661CEU1 Ferredoxin (Fragment) n=1 Tax=Gammaproteobacteria bacterium TaxID=1913989 RepID=A0A661CEU1_9GAMM
TQVTLYNTEQLLASDRQTQGLISQQTQQFAQIAEQRSQSDSGGGFGGFLKGLVSVAANVFLPGSGVIAGALVGVVSDVVQGKDLDEALIGGAKDIVGEHCPPCAPAMDVAEGLVQGKEPGDILLNVAKNQLGNYCPECTPFVDVADGLLTGEDPLTTLEHFAKSQLGDACPECVQVWDTAKGIAQGVPPEQLITDLVGHQIGQQCPDCMPAVQAIQGVVAGQPIETVLQNSIGTQLKTYCPECAPVVDIAQQVVAGESLDHILGQAATQALSQSCPECLPAVAVVRSLANGQSPITVLKQALAEPLQTACPSCGTLFEVAEDLAAGKDITDTLTTAAQNQVATVCPECVPAWQTAEKMLQGDDPKTVISALVTDKITEHCPDCAPTLDMVQQIAQGKNPLELVVETTQRQLAKDCPECGEVLQTIIPIAQQAAFDTKQKVLAHLQSQRYNAGFSKEISETLNVSKELMETLQNFL
>UniRef90_A0A2N0DCP7 TPR_REGION domain-containing protein n=2 Tax=Rhizobium sullae TaxID=50338 RepID=A0A2N0DCP7_RHISU
MRTRPDQLDENILTLFNRACRQSRWEVAEHLLRALEASSDEGDGCEPPCVRSPLTDAYLSIASLHSKQ
>UniRef90_A0A819ZRA3 G_PROTEIN_RECEP_F1_2 domain-containing protein (Fragment) n=1 Tax=Adineta steineri TaxID=433720 RepID=A0A819ZRA3_9BILA
MPLNIVQLDLIGRYLNIYLGSFMLIAGLLGSCINLWLFTRHRFRKSSCSRFVIASSLFDILHLIVALFLRVLADGFGKDPASSSVIGCR
>UniRef90_A0A533XQ95 DUF3108 domain-containing protein n=1 Tax=Nitrospirae bacterium TaxID=2026887 RepID=A0A533XQ95_9BACT
MKRVFSQTPSMIRLVGFILTMLLMVGGFMEASGTAEESDQKADAIPAGDYVLYDQVVTRKFLTSATQLVVIDRMTRLRLSPDQEGPTTIDTFQEQGYFDGELPADLVREFSAVNRQPSRLEGRFHFGVGYRFATGDTIEEPEVSLARPVTVARARPVQAPSVLDRLAFSRVARSLLNDDALLYVEALRPDGTGAGFLVWFRRQGGSLTLFDTEVAWAIQAQVEPEEGPLLAP
>UniRef90_A0A7C1TM52 OmpA family protein n=1 Tax=Gammaproteobacteria bacterium TaxID=1913989 RepID=A0A7C1TM52_9GAMM
MHARTRFVVLFLGAMLAVSGCATDEYGRPREMTDTEKGAIIGAATGALLGLATRREAKYGVLYGIVGGVAGGAVGAYMDKQKKDFEKQLAPELDRGVIYMEKLPQNRLLVGMTAATAFEVDSTRIKPGFNPVLDKIARILNKYGKTHLTIIGHTDSTGSRAYNQKLSERRAEAVKQALLARNVIPERITTAGAGEDHPRASNATPEGRRKNRRVEIIIEPIVEPEG
>UniRef90_UPI0005283947 DNA polymerase III subunit gamma/tau n=1 Tax=Bordetella bronchiseptica TaxID=518 RepID=UPI0005283947
MTYLVLARKWRPRSFDTLIGQDHVVRALTHALDTQRLHHAWLFTGTRGVGKTTLSRILAKSLNCENGITSKPCGQCRACTEIDAGRFVDYLELDAASNRGVEEMTQLLEQAVYAPGAGRFKVYMIDEVHMLTGHAFNAMLKTLEEPPPHVKFILATTDPQKIPVTVLSRCLQFNLKQMPPDAIVGHLQAVLGEEQIGFEVPALRLIGQAAGGSMRDALSLTDQAIAYSAGNLSEEAVRGMLGTIDQRHLVRLLDALASGDAAGVLAVADELAVRGLSYAGALADLAVLLSRVAIEQRVRGALPQDDPLTEDITRLAAALHPDAVQLFYSVAVHSRGELTLSPDEYAGFVMACLRMLALNGEAGPATAVQAPRADTTPRAAAPAAAAPAETRPEPTPAPALAPQAAAAPRAVARSESKPQPAPEPEPAPRPAATPVAATPPAVAEPEPVAAPAVQARAAEPEPAPAPVPPWEDLPEAVAAPAPAQPAAAPAPVAADDDGPPAWVDEAIPDEAGGGFVPEHSFTADPDDEFETLAPAAAAMPAPRAPTPRRESGGRGRAARSRLADMSPTGWPELAARLPVTGLAAELARQSEWAGVQGDAVLLRVAVRTLAESESRVRLQTVLCEHFGQGLRLEIEVGVTGDGTAHAVAQIERAARQQAAEDAVAVDPFVQALVADFGGRVVPGSIRHVDNPPAA
>UniRef90_A0A0B1P2W7 Putative rna binding protein n=1 Tax=Uncinula necator TaxID=52586 RepID=A0A0B1P2W7_UNCNE
MGEKTSSRNHQSRKERKAKKRAVENSIPDIPTPELELEPEPVSLATKSAEEVKQLQLDNSLNANEPQGNKRKRNKDGNGESGDNDEEEIDKKKKSKKRNKNLSNKEAKFCEVLKNSVSEATRENINYKNNGEEQRYSPLVKDEGKKKEKKKDSKTKKSNSIIATNNTEEGSSPLLDQEKSSSQKSSKKERKTAKLNVVALKHDHLQNGKNSDDHSGNENMDISKEGLKDSTSTIVTTTTITPPTTTTTSVDEKISKKKKHKKKNSQDPDQSIPKSTSTIIQNTNLPSKRSIKKTSENLVEKVSSSPPRGKSRFIVFVGNLPYTATKDSIMSHFSKLKPLSVRHLTKKEDSSKSRGIAFVEFENFDTHKTALKIMHHSIFDDGKSEPRMINVELTAGGGGNTEDRKTKIKVKNEKLNEERIRRVEEDKAKLKKEEEKKSGLGKESSLKDDQNSSESHIHPSRRRMITA
>UniRef90_UPI001E8E8CDE uncharacterized protein n=1 Tax=Fusarium flagelliforme TaxID=2675880 RepID=UPI001E8E8CDE
MDGPSHSTLPLNPVSVFFSKSSQPALFWSEFPSWASLSLPSLLFSPLFCFALHCASILESWSCVASITFVTSSAPTSTLIPQLHQPPSKRLINFCFTSQRKEDQDFTTSASYYTPSRPRHTASRVPLVVQPHLAVATRLIVLHNDETDFSTTPSETLSLPQYRKTVIVRVRTAEHSEAC
>UniRef90_A0A369W8G8 Formate dehydrogenase subunit gamma n=1 Tax=Pelagibacterium lacus TaxID=2282655 RepID=A0A369W8G8_9HYPH
MALQDPGPDAAAQTRNIIADMTHLEGPLLPMLHAVQAAFGHVPQEALPVIADTLNISNAEIHGVVSFYHDFRRAPAGRHVLKLCRAEACQSMGSEAVAAKLTALLGVRSGETSPDQAVTIEPVYCLGLCSCAPAALLDGEPIGRLDDERIVAIVERVRP
>UniRef90_A0A7I8XJZ7 (pine wood nematode) hypothetical protein n=1 Tax=Bursaphelenchus xylophilus TaxID=6326 RepID=A0A7I8XJZ7_BURXY
MEDGVEEKAWSVVWYGNMHKGFDLTHFGMGFIHLNLKFAVTVDAPEYDAIPTAHLAFHTSQMSMAGAVAS
>UniRef90_A0A6M4IS34 M42 family metallopeptidase n=1 Tax=Gemmatimonas groenlandica TaxID=2732249 RepID=A0A6M4IS34_9BACT
MLSESSVAFLKRLLDTPGPSGFEGAPARVWRAEAATFSTVKADVVGNSLATVEGSGGPTILLAGHIDEIGVIVTYIDENGYIYFEPIGGWDPQVLVGQRMRFLGRNGDVFGVIGKKPIHLMKPEEREKASKITDLWVDIGVKNKAEAMEHLEIGDAGVIDARVMEMPNNRIVSRAIDDRIGAFVVLEALRRYAAKPGAARVIAAATAQEEIGYAGGGARVAAQQLDAKMAIAVDVTFATDHPGVEKKELGEHNVGGGPVLTRGSIVHPVVFRLLADTAKKLEIPYSVHAAGRFTSTDADGIHLTRDGVATALLSIPNRYMHSPNELVSLDDLDRAADLIAEACRAVTSETDFTAR
>UniRef90_A0A836I9D3 60S ribosomal protein L22 n=18 Tax=Leishmaniinae TaxID=1286322 RepID=A0A836I9D3_9TRYP
MVAVRAKVGSRSHIRQKQLAKGKKVFKIDCSIPAADGIFSEDVLGNFEQFFQDNTKLNGRKGKLTEKVRLTMKDNVLIITTTMVYRKKYFKYLTKKFLKKKDLRDWIRILSTGKGTYQLKYFNIQDQEE
>UniRef90_A0A8S9ZRV0 Leo1-like protein n=1 Tax=Meloidogyne graminicola TaxID=189291 RepID=A0A8S9ZRV0_9BILA
MDMENFENGKIIPSQIRNFTVKDFGNSNEAKIELSKPHEELSIHGGRNLFIGNSSGSSSNKNRSRKRNDDNESNEPENCDELPPRQQRRNDGSSESDN
>UniRef90_Q8GPG3 Dimethylsulfide dehydrogenase subunit beta n=5 Tax=Rhodovulum sulfidophilum TaxID=35806 RepID=DDHB_RHOSU
MVKRQISMVLDLNKCIGCQTCTSACKLQWTNRNGREYMYWNNVETHPGPGYPRNYEHSGGGFDEEGALKIGITPSAEDYGIPWEYNYEEALMTGTDPWLRPNVKPTWGANWNEDEGRGEYPNSYYFYLPRICNHCANPGCLAACARNAIYKRQEDGIVLVDQERCRGYRYCITACPYKKVYFNEQISKAEKCIFCYPRIEKGLPTACAKQCVGRIRFIGYLDDEAGPVHLLVERYKVAIPLHPEWGTKPSVFYVPPLAPPRIGDDGEPTEETRVPLAYLKELFGEAVVPALETLKTERAKKQSGAESELMDTLIGYRHPEMFKLS
>UniRef90_A0A3N6CGQ7 ABC transmembrane type-1 domain-containing protein n=46 Tax=Paenibacillus TaxID=44249 RepID=A0A3N6CGQ7_9BACL
MGKSFDLSLVLDFIPELLRYLHITLIVLGGSIVLGLVGGVLLAIPRLYRIPVLSQLATLYVSFMRGTPILIKLFLVYYGLPELLKPIGIDLSRTDPLLFVIVTYALSDAASFAEIFRGAVRSVDKGQTEAAYAAGMTTFQSFRRIVVPQALIVAFPNMANTLIGSLKDTSLAFSIGVMDMVGRGQTLISATSHALEVYISLSVVYYVIVIVLEKGFAFAERRLQRHERKRVVHKPAIRAKRLKEVVQKVRF
>UniRef90_A0A1F8MA83 Ovule protein n=1 Tax=Chloroflexi bacterium RBG_13_51_36 TaxID=1797625 RepID=A0A1F8MA83_9CHLR
MGNEVGNKAEKNGESSTNQADNKVNQSLGLKYLETDQKRNLGLAGTNLEATQKLPPKHVETNLETDLETNRKLTRKPDPKLTQVDSNPDICGN
>UniRef90_A0A285JE01 Two component transcriptional regulator, LuxR family n=2 Tax=Arsukibacterium TaxID=336830 RepID=A0A285JE01_9GAMM
MHKVLLVDDQKLIRDGIKSLLGLSGKVVVVGECVDGSGVLTACSQLQPDVILLDLSMPVMNGVQTLASLKQAGVSTPVLILTTFDEHELVLKSISYGARGFLLKDVSLETLVQAIATLADGGSWFAPNITERLLGSIRQTSDAGFSMPAQLEPLSDKELEILQLMAAGYSNKEIAAALYKSEGTVKNQCSAILAKLGVRDRTRAVLLALELGLIN
>UniRef90_UPI0008F89955 permease n=1 Tax=Haloprofundus marisrubri TaxID=1514971 RepID=UPI0008F89955
MSVVDQLVSAAELVIGMTWETWWALVLGFTLSGAVEAFVSEERMTDLLGDDGWREATLGTAFGAASSSCSYSAVGTARTLFKKGASGVAALAAFMFASTDLVFELGLVMWVLLGWQFVLGEYVGGLVAVVVMVAIFRYVVPQSWFDHARERVRENDDEECAACGMDADGDEAVYADAFPDAVFCCEGCLTAYENRTDAAGETSLRERVFSVAGWKSAASATTKDWEMLWDDIAIGFLIAGVVGAFVPTTWWTALFGADGSLEAVAVNVVIGVVIGILTFMCSVGNVPFALVLWTNGLPFGGILAFIYGDLLIPPLVNLYRKYYGWRLAAALSLSLFVSAVVAGVVVHTLFDGLGLIPTQGTVGGTLSGEYTTVLNLALTPVFLAQVYVTFGRDGVERRLAAGAAKLLRLAEWVVGTVAVLGTATGVVAGVVDAFGDVLHDAGDRARESVRHARVRALRRVRGREMPSPGTADATAEQTESDE
>UniRef90_A0A251SHM8 Ovule protein n=1 Tax=Helianthus annuus TaxID=4232 RepID=A0A251SHM8_HELAN
MNLRTCNKVDTVLRMHLLMNHITRRSNRIWVMGYTGMKVDTEVTVDTVVMVDTGVKVVTVYTIDLGMKLDTVDTKNMVDMVMSPVTHHFMNHLPRAIHFK
>UniRef90_A0A081IBZ0 THO complex subunit 2 n=10 Tax=Plasmodium (Vinckeia) TaxID=418101 RepID=A0A081IBZ0_PLAVN
MSLNFSDDDIYENKGDEIPYENNLNEDIENNEVNFNGDPYGDEYADEFERNANIEEEEQKEKKKKKTITFQLKNLFNETALKQINSDINKKRKNEKRNSYNDDYSNMMDQDEFEEQYSDNDELKKYVQDEKNKIKQLVDEKDELWDMYIYLNLKKKKRKIDYTEERYTSAIKKVLDSFCSEYKNMVIENLFKNKIFEKYLIVSDIDIFFKNNNIENVYKNTTTPVINKKNSLLEIKKRLVDIYNKGNCFNYLKEVSVDNRTRLNGVAEDEYGFENDESINEDKNEYMFNDNSKRGELDTNFIIEREKINLKINKLEHKYIKLIQTVKQYKRKHLRTNFNLFMNLINEVTSKLYFSIHNVLLMNDGENNLADIYKTIRRKYNIHDVLNKVQNLTQKKEVYEHYRSYLIYKYKSTYPICNNTFKNHQMEENINIFNFKKTYNTKFTNNFSLLQDENDLGDEHFNKVENSTSANKTDINANNNMNTNNKKVEENIFAQDIYEEDFFNIDTQNKESDIKTDSWEDREKNNETHPNTNSFASTKQDTQNKLNTPNEPTTIEETPLERAKRIAREKKKKLMESQAKIL
>UniRef90_UPI001C2DB369 hypothetical protein n=1 Tax=Catellatospora tritici TaxID=2851566 RepID=UPI001C2DB369
MSEQNIADAQIVVKSDMGRNHELEFDYDIVVVAGERGRQLAAAQAESILEILEPFGPPAEPSDRPGPEPDETSSRAELM
>UniRef90_A0A1V6QLK6 FAA_hydrolase domain-containing protein n=2 Tax=Penicillium TaxID=5073 RepID=A0A1V6QLK6_9EURO
MSSINIPWTRLVRYSSSADGPVKYGEPVASPNADLGQLANEGKLQVKQLSGSDPFSLQTTDVTEGVFCLYGPLAPKDVPIIRCIGLNYKTHILETGRPLPTCPTIFTKPGPAVADHDSPVPIPTIAQEQCDYEGELVIVIGRDGKNISEADALDYVAAYTAGNDVSARDWQREAGKAGPVPQWGFSKSFDKYAPLGPCLVRQDQLNEANNLSLRTLVNGEVRQDSHTSDLCFGVRKLVAFCSQGQTLQKGSLIMTGTPGGVGLFMKPPNFLKDGDEVSVEIENIGTLRNIMKFEE
>UniRef90_A0A0C2I283 TPR_REGION domain-containing protein n=1 Tax=Pseudomonas batumici TaxID=226910 RepID=A0A0C2I283_9PSED
MSTRNWPRHLLCLSLSLPLGSALACGPDFPLRLLEDRAQSLADLPETNFQFEVNRLGEAVAGLKPATEATLTPYWDSDDNTKPYREQRDKVEASELPENLRAEVARLRNLADPQQVETEGASLPAELRLYIAGAVAFQSGDAQRAVDYFRQVLALPADQRKLRSTWAAYSLGRALVALSAQAEAGVDTPADSAAPVVTSPELQAQARLAFQQTRALSAGDFSDPLELGIASLGEEARLARFDNDWNRAIALYASQSRLGSNSGYTSLKQVAGELARLPDDELGALLKEKNVQALLTAYVLSRVGGFFDEQPEADQRLSRMVLASVAGSLDNADRLAALSYQKGDYAGAKAFVGHAGDGGLAWWVRAKLALRDGDKVQAAAAYAKAAKAFPKDEVWGPRRAPDWSFESIQPGCRVQGESAILALDRGDYLQAFDQLYRSQDIYWLDAATVAERVLTLDELKTYVDAHVPAPPAAKPEDKDNYVRRPVAAQLRELLGRRLLREGRYDEAPKYFDSPELQATARDYGRDRQQAVSRWTATGRAESLFAAATLARKSGMEILGYEMAPDYRALDGYYSLGAAELKPGPFLETAEVQRQQASVAKPDRRYHYRWVAADLANQAADQLPHSSQAFAAVLCKAANWVAGSDEEIQYYQRYVEQGPYVSWAANFGRQCQAPDFDQANRRYLTQPLNSVRSALRPYKVALVVGGLALFGGLAALWVRRRKAKL
>UniRef90_UPI001EF2088A response regulator n=1 Tax=Actinoplanes cyaneus TaxID=52696 RepID=UPI001EF2088A
MAEDDPDIREISLLLMRRAGHRVISAEDGAQGWRAVLFHDPDLVISDVDMPEMDGLELCAKIRGNPATELTPIIFISGVLMPDDDRVITAGATALLHKPFTAAEMLSCVNASLAAGAKAGRDTK
>UniRef90_A0A7Y2JY00 TetR/AcrR family transcriptional regulator n=1 Tax=Massilia aromaticivorans TaxID=2725995 RepID=A0A7Y2JY00_9BURK
MRQKTEAKRQAILAAAGAVFREHGFETSSVSDIAARVGGSKATIYSYFPSKEALLMEVILSAAETRSVTVFSEVLALGDVVTGLRRIGEAHLSFISTAEAVALARLAITAGERSTLGREFYTRGPLVMIENLAAFLAASIARDELRPGDPRQMAESLKALYEAGIVERHLLGDLKGLEGVDLAVHAAQAVDIFLAYYGKA
>UniRef90_A0A1R3UIW8 Inner membrane protein n=2 Tax=Nocardiopsis TaxID=2013 RepID=A0A1R3UIW8_9ACTN
MNFNSLSALAFRVVAVFEAFTWVGLLVGMYFKYLGNGSELGVQIFGPLHGGAFVAYGLVALLAAYRFRWGAWPTLVALAASVPPLGTLLADWWLHRTGRLDPERAETVRTPEPVA
>UniRef90_A0A222G883 Uncharacterized protein n=1 Tax=Cognaticolwellia beringensis TaxID=1967665 RepID=A0A222G883_9GAMM
MEANKLARLSCLFEKAVANNAKLLEKHELDELYNEFINDGRDHIKNTVVAFPKGLRRTAS
>UniRef90_UPI00190B6181 septal ring lytic transglycosylase RlpA family protein n=1 Tax=Paraburkholderia TaxID=1822464 RepID=UPI00190B6181
MSNGQELVTSAPVTPRLIEGSPPMLVAGAENRLDAETPPLPYNHGHVAHFWQSGLASWYGKVFHGRRTASGEQYDMYALTAAHRTLPLGSYVRVTALRDARSVVVRINDRGPYARGRVIDLSYVAAAALGLSRTGTMRVRIESVGKQDSQRVALDCKCTEVETGG
>UniRef90_A0A148KMI4 Alginate lyase n=2 Tax=Paraglaciecola hydrolytica TaxID=1799789 RepID=A0A148KMI4_9ALTE
MLLTPCSYSATDTHQNTLPASHSALAEGELLGDFTKLDPSKKPSENFDLEDWSLTLPTDLNKDKKADMIYEKPLSSGFELKPLFYTADDGGMVFACPNVGAKTSNNTKYARTELREMLRRGDTHIKSQGITGNNWVFSSAHGSDRRNAGAVEGSLEATLAVNRVSTTGDEKMLGRVIIGQIHATDDEPIRLYYRKLPNNNKGSVYFAHEINGGDDVWLDLIGSRSHTLADPEDGIELDEKFSYKITVENDILFVTLVRQGKTNITQSLDMSQSGYNKSNQYMYFKAGVYNQNNSGDPKDYVQATFYHLDNQH
>UniRef90_Q90X71 carbonyl reductase (NADPH) n=2 Tax=Anguilla TaxID=7935 RepID=Q90X71_ANGJA
MSTNKVALVTGSNKGIGFAVVRALCKEFPGDVYLSARDVDRGTAAVENLKTEGLNPFFHQLDITDPASVRHARDFFKEKYGGLDVLVNNAGIAFKVADSTPFGIQAEVTLRTNFLATRDLCNEFLPIIKPGGRVVNVSSGMSSIALKSCSSELQARFRSNDITEEELVMLMEKFVQEAQKGEHTHKGWPNTAYGVSKIGVTVLSRIQARRLREERAGDQILLNACCPGWVRTDMAGPNATKSPDEGAVTPVYLALLPVGATEPQGQFVSEKQVQVW
>UniRef90_A0A5M9QSU3 DUF4134 domain-containing protein n=5 Tax=Lactococcus TaxID=1357 RepID=A0A5M9QSU3_9LACT
MKKNKIILGISLVGFIASMFLPSFQGIDIKVFDYTKMNYFELVKEKWWIYVLLLIILVLIRTLSIEKSKILSSIFVSGFIFFKLSLLSLENGHLFINGYPVLWGYAVATLFGLLVSFSLLIDTYKDRG
>UniRef90_UPI00146DA424 glycosyltransferase n=1 Tax=Flavobacterium silvaticum TaxID=1852020 RepID=UPI00146DA424
MKTITVFTPTYNRAHCLTILYDSLLRQTSDDFEWLVIDDGSVDETKQLVQGWIDEGRIPITYKYKENGGMHTGHNTAYAMISTELNVCIDSDDYLPDDGIEKMITLWRRDGSNKYAGMIGLDVTIKGAVIGTQFPEGLKECTYSELAPRYKVVADKKLVYRTEVVKKYEPYPVFPDERFVPLYFPIVIDRDYKVLCYNEVFCIVDYQPDGSTIGIFKSYFRNPKGFAHSRKIEMIYDPFWKRKVKSAMHYVANAIMTKNANFLSESPKKLLTFLSIPGGVALYLYLNRKKNQDRDISKGYKR
>UniRef90_Q9AAQ7 TonB-dependent receptor n=4 Tax=Caulobacter vibrioides TaxID=155892 RepID=Q9AAQ7_CAUVC
MKKISGLRLCGDNVAALIVRPRVLKKVLEWSASCLQCATSPQSVFAPLSQGGIQKMTNTKTTATAGRRKAFVIALLSGACFAEAALAQSTPAPAADQAAVDEVVVTAFRKSLATALEVKRKDVRVSDGISSEDIGKFPSENIAEAIQRIPGVQISAINGRGSTISIRGLGPQYALTTVNGQAFKSSNFTDGFRYDVIQTELASGIQVYKSPTADMDAGGLAGTVNIDTVHPFDVKGRQIIVAGKLQQQELIGGNPTGKYGLTYVDHFLDGKLGVFLGGGYQELKDRGDYLWMDRWTVSNNVYTPARLRYRRIDRETKRSMINGAVQWKPTEHLQMDLIGTYAEDKTTQNIHQQVFLFTTPSASNVVPITVANGTSTKVQVNNFRLENNQQYENRPQSTSALTTKLHYTGLENWDFNAVAHYSRGNAKHNEEAAVLGINIPSATVDIADPKNVIFTTSTALTNTAQYAPTTLIRNTYPTGAFRTVGSHESAAQFDAKRYLDWGILESVQVGAKTRSEVLKRYVIRKDNQVVPASFSPTMANSGIAVTNFLDGQMTLPNAWVSPNLDAYREALKAQGISVYEGFDPLGSYRVERDLTSVYAMANLRGEVLSKSYRANIGVRNESTDQTIKGYIGSTANPQNTEVRLAAGNYTAKKSYDNLLPSANLSVDLTDNLLLRVAAAKVLVRPIIDSSNQLARTMTSATDTTGRRIFTISSGQGNLNPMTANQLDLTLEWYYGQGNGLSAGYFSKKVKNGVFSQLTCPTSYESVALSRDSSGVCVAANGDNYMITESFNDSRVVDIHGYEVNWQQSLDAWLPIEGFGLIANYTHVTPAKSTTGFRLANLSEHTANGTVYWENQKFSARLSANYRSAYDQTSVESFFAGPLGHTIKARTQLDLNLGYNFNERLSFAFAAMNINNAQEEAYLINASRWQETAVTGPSYFLSFQYKM
>UniRef90_A0A1J5H2U3 DUF3598 domain-containing protein n=1 Tax=Oscillatoriales cyanobacterium CG2_30_44_21 TaxID=1805292 RepID=A0A1J5H2U3_9CYAN
MRSQWECLLKNLGNWKGSFARLNPQGAILEDIPSETILELKEDRQTMRQTVRRFIDGQPQDLVLEYQNLNKSTTFFENGAFSQGSPQFAPYAEFGTEMGLIDGDRRLRLVLLYDKAAQLDRITLIREHLAHSENSQPPILTLHDLLGKWEGEAITIAADWSEPEVIATKTEWNQNGDRVTMSLQMGTQSLTATAFINPFQPQILTFPQDQVQTLFLPDGASLTCPVAIAPRQSFRLSVSWLLEPNLHQRMIRAYDAKGAWSSLSLVTERKTM
>UniRef90_A0A157SJD7 Acyl-CoA transferase n=8 Tax=Bordetella TaxID=517 RepID=A0A157SJD7_9BORD
MSQRSAPLTGIRVLDLTRVLAGPWCTQNLADLGAEVTKIERPGAGDDTREWGPPYLKDEHGNDTTEAAYYLSANRNKLSVALDIATPRGAELVRELAAQSDVLVENFKVGGLRKYGLDYDSLSQINPRLIYCSITGFGQTGPYASRPGYDFMIQGMGGLMSITGERDDLPGGGPQKAGVAVADLMTGMYSTVGILAALHERARSGLGQHLDMALLDCQVAMMANQNLNFMTSGKAPRRAGNAHQNLVPYQVFAARDGHLIVAVGNDSQFRNYSRVIGLPELSADPRYATNPQRVQNRDTLVPLLAERMATGERDRWLAELEAAGVPAGPINTLDQVYQDPQVLARNMRLELPHPTAGKVPMAASPLKFSGSPVQYRHAPPMLGQHTRQVLQERLGLSEDDIQALAQPRA
>UniRef90_A0A223S709 Alpha/beta hydrolase n=1 Tax=Nocardiopsis gilva YIM 90087 TaxID=1235441 RepID=A0A223S709_9ACTN
MGLPVVLVHGLRLSGTMWRPQQELLEAQGRRVVAVDLPGHGTRRGQEFTLPAAIDAVAEAIDAVGGRALLVGLSLGGFVSIAVAAAHPGRVAGLVAAGCTARPAQTLAQVYRIPAVLLDRLPDHGQAVNERFHRLTLPTDGAAAALDGGLAMEAARAVIDEISDMEVLEALGAYEGPVWLINGARDPFRIHERQFLEACVDGRLLNVPRAGHMVSLDQPENFAKLVGDIADVASVRAAEAPPGAARSHGPGV
>UniRef90_A0A8K0DS69 DDE Tnp4 domain-containing protein n=1 Tax=Ignelater luminosus TaxID=2038154 RepID=A0A8K0DS69_9COLE
MDAILKLKKVEKLSKLVKLKRLHEHKNKRLWSREWLLRRDSKELGACSFVEHELQEEDYNLYKNYLRMDKCVFEKLLRLIEEDIAKQDMQFRKSISPRFRLMITLRFLATGETFTSLSYSTRVGVSTLSTFIPEVLSAIYKNLCKLYLKVPSTTQEWKTISNEFLTQWNVPNTVGAMDGKHVVFRPPKSAGSHYYNYKGTHSIVLLAIVDASCRFLYIDVGTNGQISDGGVFEDCDFAVELNRHSLNIPEDTPLPGMTIPVPHVLLADAAFPAQQHILKPFPMKDMTKHQRIYNYQISRGRRIVENAFGILVNRFRVLLNPISLARDKVVLITQACCVLHNYIKTESHEQIIKAQDSENIKKITIQLYIMLHTPEDVQVSDILSHENNLKNTLIIMVQYLGRITKHNVFIIV
>UniRef90_UPI00177E212B Fe-S biogenesis protein NfuA n=1 Tax=Blochmannia endosymbiont of Colobopsis nipponica TaxID=2681987 RepID=UPI00177E212B
MIDITNIAQEHLTKLLSQQKPGTQIRIFVIEPGTYNAECGISYCFAENINPSDIKIRFKSFSVYINKTNLPYLKDTEIDLIFNQTESQLTIKAPNARMCQPNDDAPLDKKIEYILQSKINPVLAQHGGSVKLIEITKDMSAIIQFSGGCNGCSMVNLTLKESIEKELLQKFPELKKICDLTEHQHGKHSFY
>UniRef90_UPI001054CDFC AAA family ATPase n=1 Tax=Occultella glacieicola TaxID=2518684 RepID=UPI001054CDFC
MGRTNYLIEGLSGTGKTTVCDELQRRGHHAIHGDRELAYRGDPETGRPTAGFGHEHHIWDVDKVRALVADREHAATFFCGGSRNFSKFIDLFDGVFVLRVDLATLNRRLDERPDQEWGGGQPTERDRIVHWHRTNTDVPANGIAIDATAPVERVVDEILRRCETDR
>UniRef90_A0A146FHF8 Short-chain dehydrogenase n=1 Tax=Aspergillus kawachii TaxID=1069201 RepID=A0A146FHF8_ASPKA
MTRTWVVVGASRGIGLEFVRQLASSGERVIAAVRSLSSAEQLFGLLSQYTRNGAPLITVEECDVTKPDSIDDFSHNVEKAVRDGGLRLTNVILNAGINQYPNRATEMYAYRP
>UniRef90_A0A0A0MRI8 Obscurin (Fragment) n=3 Tax=Hominidae TaxID=9604 RepID=A0A0A0MRI8_HUMAN
AGKTMAIAAQGACRSLTIYRCEFADQGVYVCDAHDAQSSASVKVQGRNIQIVRPLEDVEVMEKDGATFSCEVSHDEVPGQWFWEGSKLRPTDNVRIRQEGRTYTLIYRRVLAEDAGEIQFVAENAESRAQLRVKELPVTLVRPLRDKIAMEKHRGVLECQVSRASAQVRWFKGSQELQPGPKYELVSDGLYRKLIISDVHAEDEDTYTCDAGDVKTSAQFFVEEQSITIVRGLQDVTVMEPAPAWFECETSIPSVRPPKWLLGKTVLQAGGNVGLEQEGTVHRLMLRRTCSTMTGPVHFTVGKSRSSARLVVSDIPVVLTRPLEPKTGRELQSVVLSCDFRPAPKAVQWYKDDTPLSPSEKFKMSLEGQMAELRILRLMPADAGVYRCQAGSAHSSTEVTVEAREVTVTGPLQDAEATEEGWASFSCELSHEDEEVEWSLNGMPLYNDSFHEISHKGRRHTLVLKSIQRADAGIVRASSLKVSTSARLEVRVKPVVFLKALDDLSAEERGTLALQCEVSDPEAHVVWRKDGVQLGPSDKYDFLHTAGTRGLVVHDVSPEDAGLYTCHVGSEETRARVRVHDLHVGITKRLKTMEVLEGESCSFECVLSHESASDPAMWTVGGKTVGSSSRFQATRQGRKYILVVREAAPSDAGEVVFSVRGLTSKASLIVRERPAAIIKPLEDQWVAPGEDVELRCELSRAGTPVHWLKDRKAIRKSQKYDVVCEGTMAMLVIRGASLKDAGEYTCEVEASKSTASLHVEEKANCFTEELTNLQVEEKGTAVFTCKTEHPAATVTWRKGLLELRASGKHQPSQEGLTLRLTISALEKADSDTYTCDIGQAQSRAQLLVQGEAAKCARA
>UniRef90_A0A5A9P3B1 Leucine-rich repeat and calponin-like proteiny domain-containing protein 3 n=1 Tax=Triplophysa tibetana TaxID=1572043 RepID=A0A5A9P3B1_9TELE
MAASVLHSAESAVPSFTVGHPARATGIHGLSNAPGPGSWNRSLDRALDEAAATGVLNLSGRKLKEFPVIVNFLSKTTHYYLSRNRLPELPVEVCMFVSLENLNLYQNCLRSLPESLINLQSLTYLNISRNQLSTLPAHLCRLPLKVLIACNNKLVSLPEDLGKLRHLTELDVSCNEIQTLPPQIGQLETLRDLNIRRNHLVRLPPEVAELPLVRLDFSCNKVTSIPVCYRNLRQLQSIILDNNPLQSPPAQICIKGKIHIFKYLNMEALVKRKRKNRLLNTPELSCNCLSSVERERKKERDKKKDRGVAEDLGDKRWSGNEASGFQPVEGRSQLASAPILNYACLLITQLMSLCVLTLSSGESRCTHTHSVRESRVQCFYSCRCGCVCKRVAGVTSGSEKQISAERRCYELRQADYLLTSQTFTMGRWHRTHDVCMVFQLCVCEHNKSSPSPTKLSPTDTCYLKSHVSCSISESVPLQTVHSHRRLRPLYGKSQSNRNFIVKRTQSLRLKHTYTGEEADLIEQLRRNIECRLKVSLPSDLGAALTDGVVLCHLANHVRPRSIPSIHVPSPAVPKLTMAKCRRNVENFLEACRRIGVPQKQLCLPLHVLEERGLSQVAGTVQALLDMAPPKQTSSFTL
>UniRef90_A0A1C6D475 Translation initiation factor IF-2 n=4 Tax=Eubacteriales TaxID=186802 RepID=A0A1C6D475_9CLOT
MAKLRVYELAKELGKESKDVLTVLASKNIEVKSHASSLSDEQVDMVRKSLSPKAQVQSQARPQSQVQRPSAPAGEAAAHAPEARPQQEVPKKKPNIIQVYNPQNSQQASLNRQSGRPQAGRPGQNPRPQGQRPMGSQQGARPAQGQGQPGTRPVQGQGQPGTRPVQGQGQQGTRPVQGQGQPGTRPVQGQGQPGTRPVQGQGQQGTRPVQGQGQPGTRPAQGQGQPGTRPVQGQGQQGTRPMQSQGQQGARPVQSQSQQGTRPAGQAGNQGVRPNGSYQGNQGQRPQGQQGSQNRPAGASQYNRPNGQQGNSSQRPAGNQQSYGSNRPYGQQNNNGNRNTAAGQGQRSGQGQYNRPAQGDRPNGRPNQGSGQYQNQGSGQYQRNSQGQGGQRSGQGQYGNRPYQGQNGRPQGQNNRSQGTRPGGAPSMRDGLTIPKPPQTKATEKQNVTSRAERGDRNDRSRDKDRNGRNDRRGYQDNRPNQRNMGGKGRNNAPAPKPVQQEPKEVTIRTIILPETMTIKELAEKMKVQAAAVVKKLFLQGSVVTVNQEIDFEKAEEIALEFNCIAEAEVKVDVIEELLKEEEEDPATLIPRPPVVCVMGHVDHGKTSLLDAIRNTHVIDKEAGGITQHIGAYTVSIDGQKITFLDTPGHEAFTAMRMRGANSTDIAILVVAADDGVMPQTIEAINHAKAAGIEIIVAINKIDKPSANIERVKQELTEYELIPEDWGGSTIFAPVSAHTHEGIDNLLEMILLTAEVCELKANPKRRARGLVIEAELDKGKGPVATVLVQKGTLHVGDSIAAGSSYGKVRAMMDDKGRRVKEAGPSTPVEILGLSDVPNAGDIFVSPENDKEARNFAQTFISEGRERLLEDTKAKMSLDDLFTQIKAGNVKELGIVVKADVQGSVEAVKQSLLKLSNEEVVVKIIHGGVGAINESDVILASASNAIIIGFNVRPDATAKNTAEREGVDMRLYRVIYDAIADVEAAMKGMLDPVFEEKVLGHAQVRQTFKASGVGTIAGAYILDGIFQRNCTVRLTRDGVVIYEGPLASLKRFKDDVKEVKSGFECGLVLEGFNDIKEEDLVEAYTMVEVPR
>UniRef90_A0A315BXB9 MFS domain-containing protein n=3 Tax=unclassified Limnohabitans TaxID=2626134 RepID=A0A315BXB9_9BURK
MMFGNVVIGTGVMMAAGTLNDIVDSLSISVATAGQLISSSALLVCFGAPVLAAVVAGWDRRKLLVGSLLWYALWHFLAALSPGFYSLLGFRAMAMLAAAIFTPQAASCIGLLVKEHQRGQAMTFVFLGWSVASVLGMPLGSWIGGHFGWRWSMGLIALLSVIGAYWLWRQMPSKVLPPALSGAAWRQTLTSRTIWVTLSVTMMLAAGQFVLFSYLAPYVKERFGVSPAQFSLMLLAYGSMGFVGNALLSRFIDRIGPSRCILISLSSMCLSVLIAGEVTHATGMALALGFWGLGGFSSNSAQQARLASQAPWLASASISLNTSAMYAGQAIGATVGGWTIVHQGMSALPQRGLIGLLLAIGLSLLATRYARLHPLRSPEKA
>UniRef90_A0A2N7D5J4 Flagellar basal-body rod protein FlgC n=2 Tax=unclassified Vibrio TaxID=2614977 RepID=A0A2N7D5J4_9VIBR
MSFTDIYSIAGSAMTAQTVRLNTVASNLANADAVSANPDDAYKALKPVFATVYNKSQLSAEQALYPNAEVRIVDVVQSQSQAEQRFEPSNPLANQEGYVYYPGIDVVTEMADMMSATRSFETNVEVLANVKSMQQGLLRLGEGR
>UniRef90_UPI001CF99253 hypothetical protein n=1 Tax=Pseudomonas sp. L5B5 TaxID=2883205 RepID=UPI001CF99253
MLQTLWVLLNWEAWGESLVIAFIPFLLFVWVGALVTMLVLRFRGRISIFWASQLAGGVAGVAATLAFMMAANFVVDYKAYRESVRQLEAQERLQPKPESPNVETQPVELAGGMAGLESMKIFMALLSYRADSKRLRESDRQLGEKELLQTQKTSQTVEVQSVSSPENVLGEVSDSSGHR
>UniRef90_A0A8K0MZ08 Auxin-responsive protein n=1 Tax=Cocos nucifera TaxID=13894 RepID=A0A8K0MZ08_COCNU
MATSASIGVAGKELGVISEASSPLKRYNGLRPLLGSKQMASFAAMRKPNGPFPSLPSLKSPRIRAVASPTVAAPKREKDPKKRIVVTGIGLVSVFGSDIDTFYNKLLEGQSGISLIDRFDASSYSVRFGGQIRDFSSKGYIDGKNDRRLDDCWRYCLVAGKRALDDANLGPEVLQSMDRSRIGVLVGTGMGGLTAFSNGVEALIQKGYKKITPFFIPYSITNMGSALLAIETGLMGPNYSISTACATANYCFYAAANHIRRGEADIMVAGGTEAAILPTGVGGFIACRALSQRNDEPQKASRPWDKDRDGFVMGEGSGVLIMESLEHARKRGATIIAEYLGGAITCDAHHMTDPRSDGLGVSSCIVKSLEDAGVSPEEVNYVNAHATSTLAGDLAEVNAIKKSMIGHCLGAAGGLEAIATIKAITTGWLHPTINQNNLEPDVTVDTIPNVKKKHEVNVGLGEQDLTEELWRLCAGPLVEVPRVNERVFYFPQGHMEQLEASTNQELNQKIPRFNLPSKILCRVFNVQLRAEPETDEVYAQITLHPEPDQSEPTSLDPCPPETRRPMVYSFCQPRRHLLTTGWSTFVTSKRLVAGDAFVFLRFTGTVVGVEDVSSQWTDSKWRSLKVQWDEATNILRPDRISPWEIEPFNTTAPTLNAMHPVLVKNKRPRLPMDMVGYTVLEPTSPFWYSGTTHSHELDGLSSVDANSSATQVIWPCMQKENKGNGVKNGPGSCDPMVLDDWLKGLHSPIKSPPASLTDVSLKLFQDMNDETKVASWPVNPGSMMEQQPVLKLGNGVEEWKKPEVRSSSCRLFGIDLMNHSKSTTVSEKAIAAPAFTKSIAPIEGPSKATASVDESDQQQSGLSKASREHKQGLDSSPKEIQSKHHGSTRSRTKVHMQGMAVGRAVDLTNLVGYNELITELEQMFEIKGELRQRNKWEVVFTDDEGDMMLVGDDPWP
>UniRef90_A0A2E7GD31 50S ribosomal protein L18 n=1 Tax=Bdellovibrionaceae bacterium TaxID=2026715 RepID=A0A2E7GD31_9PROT
MSVKVRKRTDKKKVVRFKRKRKIRSTVEGSSERPRLCIFRSNTNVYAQLIDDQKGHTLASASTKDAELKDQKSTVEGAKQVGALLAKRAQAKKIESVVFDRNGYLYHGRVKALADAAREAGLKF
>UniRef90_UPI0011841962 trans-aconitate 2-methyltransferase n=1 Tax=Catellatospora sichuanensis TaxID=1969805 RepID=UPI0011841962
MWNPETYLRFADERGRPFHDLLARVDAEQPRQVVDLGCGPGNLTATLTARWPGAQVRGIDSSPEMIEKAVADQGGPGPVSYQVGDVREYLPGPEVDVIVTNAVLQWVPGQEELVGRWARALRPGAWLALQVPGNHDGPAHRALRELCASSRWSALLGEIAEQPRSVPGSQEYARLLRAAGCAADTWETEYVHQLPVTGGPHPVLTWLTGTALRPVRAALAEQPGAWEAFCVALEPALISAYPADGAIVDFPFRRVFAVGRRTAAPS
>UniRef90_A0A0M8PST9 Uncharacterized protein n=1 Tax=Lysinibacillus sp. FJAT-14222 TaxID=1932366 RepID=A0A0M8PST9_9BACI
MSRLGQHDVGHEGVITRRDAFSLRSSMCSLQGLIFDANPQGVAQSQLQSTNSYSMYPLPIAII
>UniRef90_A0A7Y9F3N0 YtxH domain-containing protein n=1 Tax=Nocardioides marinisabuli TaxID=419476 RepID=A0A7Y9F3N0_9ACTN
MSRGLWFVAGAGAGVYAMVRGRRAAEALSADGLRDRAGALALGARMFRDEVAQGRAEAEDQLRQRLAAARPREIDSPHPTERTTEQEGTS
>UniRef90_UPI001967ED96 hypothetical protein n=1 Tax=Janthinobacterium lividum TaxID=29581 RepID=UPI001967ED96
MQQDSGTAKAVPLNYFYRGVTVSKKQKTIVNHRSAVSGRFVTERYVKSHPATTVTEHNRISAPAKPLKRR
>UniRef90_A0A5A8ADR5 GNAT family N-acetyltransferase n=1 Tax=Chryseobacterium sp. SN22 TaxID=2606431 RepID=A0A5A8ADR5_9FLAO
MEHLTNFTYSDIKSELFRLKSKEMKANFFMTELQFNRLWSENKIQVFKTEKACFLLTDDDGFKRLYFIASDIEEIKYFLNNEIKNSDTDISVETVGNSKYLQDIRDAFLQNGFYEYSSMVRMSKIRNQVEEVDFENIHLLAADNKEEFQELYRKYFDKFVERIPAIEEIEGFIENKNAYYFSDNNEIQGFIVFEYYGITSHLRYWFVHPDYREKRIGSKLIQLFFNLGENIRRELFWVIESNENAIKRYKHFGFVEEDMHNLILINKNKKYEEPNY
>UniRef90_A0A2D7PFG9 NADPH:quinone reductase n=1 Tax=Candidatus Pelagibacter sp. TaxID=2024849 RepID=A0A2D7PFG9_9PROT
MKKIFIAFGHHNTKNSFNASIRDTFIEEAKKCGHNIDLVNLFDEQEKLPFYNQNINPPPQLVLDYRKRLEKCDVMMLIGSCNNLRLNAILENWIDWVLHPKWFFTYRSLLPGNKYFKNYGYPVAGAMKGKLGVVSITYGGPMISYQSFSFFDNIPYRRLKKSVFQLGGLKTKYLRFYSILPEMEKKEFENHMLKVRKFAKSL
>UniRef90_A0A415FL20 DUF2953 domain-containing protein n=2 Tax=Ruminococcus sp. AF46-10NS TaxID=2292072 RepID=A0A415FL20_9FIRM
MTAVQSFLGIPSKIFKKIRNLTLTIKKFCGKINWYKEFINHAQTRAALSLVWKDGKKLVRHVLPTRITGKITFGCEDPSITGTVLAVLGMTIPFHKNAIAVTPLFDSENVLEGEVMLKGRIYGIMLLKTAAELYFNKHIKYVIHRWRHKEVNHGERE
>UniRef90_A0A7G8QAU1 SmpA_OmlA domain-containing protein n=1 Tax=Dyella telluris TaxID=2763498 RepID=A0A7G8QAU1_9GAMM
MSKLSISLSIALLASAGLGTPAVASAESLLVNRVQQEKTMDLPSRGMSMAEVEKKYGAPQRKLSPRGGGSSKQPVINRWDYSNFIVYFEQSHVIHAVLNTPAGNNTNPASAN
>UniRef90_A0A6J4UR21 3-oxoacyl-[acyl-carrier protein] reductase n=1 Tax=uncultured Thermomicrobiales bacterium TaxID=1645740 RepID=A0A6J4UR21_9CHLR
MSDRARFAGKVALITGGGSGIGAATARLIAAEGGSVAVLGRTAATVKATATAIGGAGGRALAIAADVSREEAIDAAFTRAIEAFGRIDVVVANAAVQLHRRDLPIHEQDFAAWRETQEVNLGGAFLTCRAGVRQMLAQGEGGAIVIVSSVTALAGTAAQNPSYTASKGGLVSLSRALAVKYAPDHIRCNVVCPGALAAPPDVEEIDNAARERRLVGQIPLGRLGDFAEIAPMIAFLASDEASYATGGTFVVDGGLTAT
>UniRef90_A0A8T9LM70 LytTR family DNA-binding domain-containing protein n=2 Tax=unclassified Dyadobacter TaxID=2625061 RepID=A0A8T9LM70_9BACT
MMNTKQLTAKIVIVDDEFFVRQTLVSMIANIPNAMVVGEAEDVGSGIELILEKEPDLILLDIKMPVRSGFDLLEELTHCQQQYGLIFVSGYPDEALTAVQKAAPYFHSDFVVKPIDPVILQTKFSIFYNKWQAAKEQESELAGLLETGIPQIAYKSDQLVFQNSQLFHCIDIDDILYCESANRQINVYCSQYEHINIPNTTLDAIERMLPADAFIRIGKSHILNKSAIRFIQKGNRPKCILARNGKSYEVQLYASNVEKVEQSYSITRK
>UniRef90_A0A811MPR2 Rep_fac-A_C domain-containing protein n=1 Tax=Miscanthus lutarioriparius TaxID=422564 RepID=A0A811MPR2_9POAL
MGSSEDDFTPLSELTVGMNKCRVRVRVSRLWESFNPKNDISFGLDCLLIDDQGETMQARVLPDYIDQFEGQLIEGKTVVNEIEGDIDSIPLHSFEFIDFKNLHSMCDDISILRDVLGHIVYVGDLQEVEKKSRTIEICNATIQNLSGRKLGVTLYGDIACGFAEDMLEKGQKASGVAVFAGMRVESSHSVCSTTCSKYYLDLEIPEVQEFCENLSIQQENPVSEKSQAQKLAESWRTIEQLKRLNPKDYDEDTKFLCRVSLIDIDCTSGWCYLGCNTCYKSMYRAPRKYKCSRCGPIKRPINWYKLKTMVQDATGTMNLMIFCEVAEELVGVSAEELVDEIEDDEEWFTLPDEIEDLLGSTHTFQVFDKHLSGSFSVYAIMDDDTVPVPAATTSQCKEESVPEGSVNAAVPSPATTQCKAEPGMAAPAPAMIPCKEEPVLEENFSMVVPAPTTKHECKEEPFLEHSVNMAVLKPTITQCKVEEPVPKGSAGTGEARLKSTRLQKPNKRLLGDDWIN
>UniRef90_A0A5C7TQB5 Conjugative relaxase n=1 Tax=Rheinheimera sp. TaxID=1869214 RepID=A0A5C7TQB5_9GAMM
MLSIQTLGTMTKDKVAYYTELAATGYYTEAEEPAGQYFGKLASVLNLDQKAVTQEDLLELAKGFDTKGKALVANAGDEHRMGIDLTFSAPKSVSVCFGLAGTELRTAIQKAHESAVKAALTYAEQNFIQVRHGFEDNQQRRMINTGNALFALFEHGSSRSNDPLLHTHAVLLNFSQVKNGEFRCLEAPDLFNYKKALGALYRAELANQLEALGLKTEADEEFFKVTKVPDELCKLFSKRSNEIHDLLQEGGFTRANAKLKQNAALFTRQAKTHQSRETLYKNWAVEAEQISTWKPEQAFTKDRNQNKVDTEKLLESLTEKKSLFTYPDFLEQVFIHFQHAGLSSREAEEFAKATLESKAIRRIQHPQAGICYTTEQQYQLEMSFYKEMTEYLDRWRTAHARCPAFLPAWL
>UniRef90_UPI001A901165 agmatine deiminase n=4 Tax=Halomonadaceae TaxID=28256 RepID=UPI001A901165
MHPTHCPSSVAPSAATPAAQGYVMPAEFAPHDACWMLWPQRPDTWRLGAKPAQQAFVAVASAIAESETVYVGVNDDQYENARHQLPAHVRVVELSSNDAWMRDVGPTFLVHPDKGLALVDWEFNAWGGLKDGLYFPWDKDRRIRPKIAEMLGIPCFDVEVVLEGGAIHVDGEGTLITTEECLLNPNRNPGMDRATMERRLQDSLGIQKVIWLPRGCYLDETDGHVDNLCCFVGPAEVALTWCDDDTDPEYAICREARAVLEASTDAKGRAITVHPLPQPGPLTIAEDEASGIDRLASSHPRRPGDRMAASYVNFYIGNRVVVMPQLDPRHDATVMDILARLFPDRRVVGVPAREILLGGGNIHCITQQQPRP
>UniRef90_A0A6L8CSU2 VWA domain-containing protein n=1 Tax=Gammaproteobacteria bacterium TaxID=1913989 RepID=A0A6L8CSU2_9GAMM
MSGPLSPTPPASRMLEFAGYLRRHGYRIGVGELPDLFRLVDRGARDPVLTRRGLRALCCRTHDEWREFDRHFNRFWFPVESEQVAPASVPGGLPDSPGQTLVGLAGTSDREPDSTHGQSDIEGSGAGRQRTLGKADFRFLRDRTAMHEVESLVERLGQQLRRRLGKRREISPRGGHLDMRRSLRRSLATGGLPLKLVWSRPRPVPLHLVVLHDVSHSMTWNNPLLFRFVRGLMQNFRGSVAFAFHTRLFEVTPFFRERSLERMLARLDAGENLWLGGTCIARSLAEFNRHHAGTLLRSDSHVLIISDGFDTDDPEMLRTELSRIRLRCRQILWLNPMLGREGVTLTEASLSARLPEVHRFLPANSLDGLRAAVENLSRTGPRTRPGGTPPVHGQDSRQGDGH
>UniRef90_A0A1G8EYP0 Catechol 2,3-dioxygenase n=3 Tax=Agrococcus TaxID=46352 RepID=A0A1G8EYP0_9MICO
MPVTGPDFVSLQVRDLAGSQAFYERYLGLERSPAGPPHAVVFTTTPIAFALRDLVEGTDLDASQPGLGVALWLHATDVQQIHDALVADGHAIAVAPFDGPFGRTCTLVDPDGYLVTLHDRA
>UniRef90_A0A1F9IIM5 GlnD_UR_UTase domain-containing protein n=1 Tax=Deltaproteobacteria bacterium RIFCSPLOWO2_02_FULL_50_16 TaxID=1797881 RepID=A0A1F9IIM5_9DELT
MISWVFNIFGMTVEATRQGMTYLEKKAKPKLIDVAEGTFLAEKAREMHIAMRQLLQNHSVERQCSDVKRRARKRVKENIIKAYDRDDVVDEITVRLTDAAMADSFYKKWFAH
>UniRef90_A0A1F5VQL0 CZB domain-containing protein n=1 Tax=Candidatus Fischerbacteria bacterium RBG_13_37_8 TaxID=1817863 RepID=A0A1F5VQL0_9BACT
MGIAITGSDMLCKRITEGFVQQQESVQGKVFYSERIETDFDELLQKERINREVPGSWENTQAVRANKVESSVIRGKEECSRLENVMKEFEEMHNRLSEIITYTMNGRQFNAQELLAFQAEMHRITNYIEMVSKIIEQGINGVKHTLQTQV
>UniRef90_A0A2P8AWN7 HTH_17 domain-containing protein n=3 Tax=unclassified Micromonospora TaxID=2617518 RepID=A0A2P8AWN7_9ACTN
MTTPKRPERGTPRPARHLTIADVCDDLGISRSTFYDWRAKRKGPPARKLPNGEIRIERRDYETWLETLYEEAA
>UniRef90_A0A1M6QX74 Putative addiction module component n=1 Tax=Rubritalea squalenifaciens DSM 18772 TaxID=1123071 RepID=A0A1M6QX74_9BACT
MATLSELENEVLRLPKDQRVSLIHRILEKSELPENSDVKNLWNAEILERIERLDANSTECHSASDVFQAIDEQFAQ
>UniRef90_A0A1M7QN82 Germination protein, Ger(X)C family n=1 Tax=Gracilibacillus kekensis TaxID=1027249 RepID=A0A1M7QN82_9BACI
MIRVIVLLIFSILLSGCYDRIELEQQSYVIAIGIDKTEQEGVYSFTYQIANPEIGSAAVQSGPDEPPTEIVTVNGSDILSSTYTANSFVSKKITLDHTKIIVISEELARSEDFIRVIQSASRTPQIRRSVQMLVSKEKAIDFINNNEPIMEKRPHKYYQFMLNRAVQTGIIPKSTLHRFFQITEGDADLFLAIYATTEQSDQKKNTEGFEDKYIAGEIPQIGGSPTQFMGSAVFKEGQMIDILDGEETRVAQMLDKTLEMEDYLATIPDPKMPEYRISYNYYQKKEPIININYYKNKPTEIDVNISFQVEVIAIPSLIMYSQSKKDQQTLQEALTQRLEEKTNALIEKTQNSYKSDAFYWSLYIRKHFKDIKEYEDADWHKNIYPNAKINVTYELEKMEFGKMINDSNLEDVRD
>UniRef90_UPI001E451F19 hypothetical protein n=1 Tax=Methylococcus sp. BF19-07 TaxID=2743472 RepID=UPI001E451F19
MLWPAWILPEDVFRSIWERVRPVFLASMGQQRIPFTLAEPLARVYLPLAAWVVAHKKDGPFVLGVNGAQGSGKSTLCEFLALILREGYGCKVAGFSLDDIYKTRSERERLAREVHPLLVTRGVPGTHDVGLGLQTLDRLTTAGPEIAVALPAFDKSIDDRCPMSAWPQTSAPVDIVIFEGWCVGCLPQSGEHLVRPINALEAGEDADGSWRTYVNEQLGGPYAELFGRLDRLIMLKVPDMECVYQWRSLQERKLAAAIGNGSSGHRLMDETALRRFIMHYERLTRHMLAEMPARADVTLFLDENHGFARVHINE
>UniRef90_A0A8X7XX04 Uncharacterized protein n=2 Tax=Populus TaxID=3689 RepID=A0A8X7XX04_POPTO
MNQSSSKTHNQKCPSAALPEQPTKIRRRKKQQHHQPSFRRNALQDLNNGGIDTTSIDNSSNASSLSSIEAPRGCLRFFLSHSSSSSSSAKTPFSSSSSNQRLKKVKPSRTPKSAPSMRPTKEKPISKKVEKGKRNHPPCLYQWQSGKKRASSRNEVGDSKVSSFLDSSGSLVKNKLKSGPGELKKVMIDGVCEGSGANLTPLCKVGSGSGLNLGVGGKVMNDDCYEKSSNGKAESNSTSSNTKTPPVQPSVSPEIQCGSSMKLMTVETITPATCYGAGHVVSGVTDKRKCRPRGILAGGEAKALGSFDSDDDIEQANDVGLIENSDVSMLPLPIDASMHWLLSPCDEKDEGQKDNSRNRSRRFRRLEERAIHNSPASPSSGYGGFSPELCNTSANRSISTVSAGRRSASLLSPSALPVPQFQGFLGTPLCDNFPVSSLEEETENRHCTDGENSPFSIGSLGSGNIIQTPQSDTSCDRRVGASGTQVDGKRKKCNFDSDLNSVAEQLQMTSLSPMSHASVWDPTNSSFRFDSLTMPSNSVDLSKFHKILEERNSWFSNSTIENVSQSQMRISWREGLMSRMFEMDEFDCCRYLSDEEDDGNVCNIDCLKSHKSPQLNVEAATDHISINGIGSTEFVKKEQDTGGKTKDGLPSQPPCSCAESISTDGGGLVRSDDSDWTLWSKDSEVNMGNLIEYIDLAGCGPGGKSQLHYKVDGARGLFADIGFTIFGSLVFEEWLAEVERQSMDKLQEMSQAYLELVANLPCHVRIKGKLSQESVPDLVSSSFVFPLIIREKEEPDRAERGSCVLMEGLIPLVCKAFRKNKTRRQYECLSVGTALSYNISDFYTHEAPKSELHFQPSMENTNSQKKVHRRFWSVHEDFSGGFSSPAVRSTTAASPQTKQLARFRSQRV
>UniRef90_A0A853BRY5 Anti-sigma regulatory factor (Ser/Thr protein kinase) n=1 Tax=Streptomonospora nanhaiensis TaxID=1323731 RepID=A0A853BRY5_9ACTN
MAQCDGVDDDVGIYTLRACRTFAGAARECREARLWARRHMRPFPDVADAVELVVSEFFGNAVRHTASGQPGGTVFVSLVGLVSGALHLEVHDEGPRRGAPRTTARVLAPDLERPDGRGLFLAAALTKEWGRLPLHGGPGYAERGYTSIFDPDLDHETSDYVGPMITWAEFSTSFRAAPASAAAHHAG
>UniRef90_X0WKB2 GH26 domain-containing protein (Fragment) n=1 Tax=marine sediment metagenome TaxID=412755 RepID=X0WKB2_9ZZZZ
TGSRPLGEYEPAGTWGSYGINHWLYVAAEDPLYGQAAKDYWGTVNVKGSGNIPLFLDCWFWCGGPENDDTPPAWDGHRILGHTESMNRFCINRHQQGINGVFLDYSARKVWLKELWHVKWARNFNVNYPGPYWETEAPWMAQFKAH
>UniRef90_UPI0012FA07AB hypothetical protein n=1 Tax=Nocardioides alkalitolerans TaxID=281714 RepID=UPI0012FA07AB
MTTLMLDQARTDDATTAPTDVRDVAGGLEDELFEQAVGEQVAGLTTMPSISTIHCLTSRHDTTLLPRL
>UniRef90_A0A2E0G851 Peptidase n=1 Tax=Candidatus Marinimicrobia bacterium TaxID=2026760 RepID=A0A2E0G851_9BACT
MIKKNKHIIFIIIFYSLFVESLFSSDTIVYRVPIQGVIDLGLPTYIERIINEAESNQAEAIIFDIDTFGGRVDAATQIKDAILDSDVPTIAFINRRAISAGALISLSCEKIYMTGGATIGAATAVDMSGNKASEKVISYMREEMASTAENRNRNTDIAKCMVDEDLSFTYVIIDNDSIEVTDLEGRKEGKLITLTTEQALKYKMADGLAEDLDELLSLLELSGAEVKTFYENWSENLVRFLTNPVVASLLTTFGFLGILFELQSPGWGIPGTFGAVCLTLSLSASVIVKLATKSDLLIVFFGLSLLMVEAFLIPGFGIAGLAGIGVILWGLYMLLLPDVPVSQEIYDSAMTGLTIGLIGAIIAVILLFRMMTKTKFWIKLTSPGIESSEEGYNTSLGLENLIGETGVATSDLRPSGWVLVNNEKIFVVTEGEFVDKDQEIKILSVDGNRVVVRINN
>UniRef90_UPI0012BBE16F YeaH/YhbH family protein n=1 Tax=Sansalvadorimonas verongulae TaxID=2172824 RepID=UPI0012BBE16F
MSSIIIDRRRNSKGKSTVNRERFMRRYRRQIQKAVNDAVNSRSITDTDSGEEITISRKSLSEPFFHHGEGGDRDQTHPGNKEFVTGDRFPKPKGGKGKGKGGGGGDASDSGEGLDDFAFQINRDEFLEYLFDDLELPNMVRKELKESSEFAFRRGGFTSAGAPDRLNVIRSLRGAHARRIALSGKDRKEIRALKRELREMEVSPDDTNEARAEEIKLRIKELNEKIKRLPFIDDFDLKFNNLIKVPLPSSSAVMFCVMDVSGSMTRDIKDMAKRFFFLLYMFLQRNYEKVEVVFIRHHAEAKECDEHDFFYARETGGTVVSSALTLARDIIDERYDPKKYNIYVAQASDGDNWEADSPKCSKVISEDMMKNLAYYAYVEITDRHHQNLWHEYKKLEQAHPDHFAMSHIKGPTDIYPVFRELFEKKEAMA
>UniRef90_A0A6A6R4P4 MFS domain-containing protein n=1 Tax=Lophium mytilinum TaxID=390894 RepID=A0A6A6R4P4_9PEZI
MRLLGESGLISKRRYPCIYTKMVLILLPHFQRLQELCRHRSWNGLLIFHAFWCCSVYHYTVRALFTFLFAMGFSVGSCMSFAIPFNVLDSRCAWLSTSERRAQFVLYNMPGCGVR
>UniRef90_A0A8J4XW43 Uncharacterized protein n=1 Tax=Chionoecetes opilio TaxID=41210 RepID=A0A8J4XW43_CHIOP
MAIYLFTRQDPSRPHPPAGKKDAVNWDQHAILLEGRKKTPPGVGWSFDSGLTDTSHVRKVAKNAAWKLELHPTRLRTSWTGSGSRHIYKSQVRSLMEYSPLAWSSYPPSYRCLLDRVQARAQRLARLKAPEDAAQIIQPLQQRRDVAGMWGHVQKGHRMQLLQLAELRLNPGPGPPIYPCGPQHRHQGLAIREDGKITSAPSYPAMVDYGTPFGAPDDLTFTPSMHAFKSGVNAWLQEADEALDGDEGWLLPITSHKASRPLHSEPFVPVAWMVD
>UniRef90_UPI001FD5AA06 methyltransferase domain-containing protein n=1 Tax=Nocardioides sp. W7 TaxID=2931390 RepID=UPI001FD5AA06
MVAQAIPSRIRWAVEFMDVQPSDHVLEIGCGPGAGAEAICSKLETGKLFAIDRSESGVDRTKRRCAKYVASGRLTVRQIDLATLRVPVKRLTKVYAFNVNLFWVRECPDEIALLHERVLPGGAVFLFYEVKFPDQMPTIVEKASAALAGGGFRVSVVEQKTPAVVGVIGRR
>UniRef90_A0A7X8TA91 L-idonate 5-dehydrogenase n=1 Tax=Rhizobium sp. P32RR-XVIII TaxID=2726738 RepID=A0A7X8TA91_9HYPH
MKAVVIHAAKDLRVEERQEEALEPGQVAIAIEAGGICGSDLHYYNHGGFGAIRIREPMILGHEVAGTIKAVGEGVSRLAAGDRVAISPSRPCGSCEYCLKGQQNHCLNMRFYGSAMPMPHIQGAFRQRLVAEEWQCHKVAEGISINEAALAEPFAVTLHAVARAGSLLGKRVLVSGCGPIGALAIIAARAHGAREIIASDVMDAVLKKALSIGADRAINVADDPQALDAYSTNKGYFDVQFEASGNESAVRSGLGVLKPRSTLVQLGLGGDIAIPQNILVAKEIEMKGTFRFHEEFGLSVDLINARRVDLKPLLTGVFPLDDAVAAFEAAGDRSRNMKVQLAF
>UniRef90_A0A1F6CIC4 SsrA-binding protein n=1 Tax=Candidatus Kaiserbacteria bacterium RIFCSPHIGHO2_01_FULL_53_31 TaxID=1798481 RepID=A0A1F6CIC4_9BACT
MELIKNKKAHLKYVPLENFSAGIELIGQEVKALKNKLGSLEGARVVVRGGEAFIVGMTIPAYQAANAPKNYDPERPRRLLLAKAEIAELAAAESKKGLTSIPFGVYTAHNFVKAHVAIVRGKGKADRREDLKKRDAEREAGRILKNR
>UniRef90_A0A3M1TVI0 AarF/ABC1/UbiB kinase family protein n=1 Tax=Deltaproteobacteria bacterium TaxID=2026735 RepID=A0A3M1TVI0_9DELT
MLDAFGRVEVNRKTVEFAGLSATGYVRGGRAAPREEHAPGTPSVSKSSALRTVYANLMATRTAIRDVRRFRQIAGVLARHGFGFLFSRFSRKDPEVAKAVDEALQEAPSAPQVPQALPYAQLARRARAALEDLGPTFIKFGQILSTRPDLLPQAFCDELQNLQDDVPPMSIEEVNAVIRRELGSEPTEIFAEFDETPLAAASIAQVHRARLKSGEEVAVKVQRPGIAAIIEADLDILYFLARQLTVAVPETRLFDPPGIVREFERAIRKELDFSAEARHMKKFARNFREVDYIHIPEVYDRYSTAKVLTMEFIEGVKITDAVEQGLADGEVLAKRLLWALFKQFFQDGFFHGDLHPGNIYVLPGNRVCYLDFGLVGRLTPEMKDRVIDLLFAVGRQDFDALARVLFEMGIREGPVDYDAFVADVYEVAERYFDGTPLAEIDVGGLFRELVEGAMRHHMRMPTTYTMVFKALMTVEGLGKRIAPEMDLVEEAQPFIAELLRERYSPERLWKKASEALYTTSRLLRQVPPAMTRVFEDIDAGRLTFQIDAPRLDDYLEDRRRSDVMWGTGLAYATLMICATLALSWDEYRILGFPALSFIGYLLALPTGLWFFNHWWRR
>UniRef90_UPI00210E2C07 response regulator n=1 Tax=Stutzerimonas stutzeri TaxID=316 RepID=UPI00210E2C07
MDIPLSQRLSFKQASLTVLLALTLGGAFGLTRAVLDYASERDGINRKAQALLTVTTAAADHALREQDARLADQLVHGLLQAPAVLRAELRAADGTPLAIASRHPTESGWRRRLSDRLFGAELHLTLPLADGRGSQHLLLDTWPHGQRFLRRAGLGLAGGLTSSLLLSLALLGLSHLLLTRPLGSLVAALGSRDAQRSARTPLPCPAGHRHDEIGALVGACNEQLARLDSEIAQRRAAEEHLTRALGELEGRVAERTAELERANRELLASNRELQLAQRTTQEMAQARAHFLASMSHEIRTPLNGLLGMLALALDSPLPPQVRQQLGIAHDSGRGLVELLNGVLDLSKFEAGQLELERIPFDLASLVEDTASLLAQNAAPGVELTCLIAPDLPGEVIGDPLRVRQIVSNLLANALKFTRHGRVDLRLIANPDGILLEVRDTGIGIAREALARIFQPFAQAEAGISRQFGGSGLGLSLTRRLCEAMQGTLEVDSQPGLGSRFSVRLPLATHAAATSLPSLHGRVVALCSRRSGLSELLDAWLPAWGIEYLRLDTDASLAGLEVDLLISDCPECLHGRRPQANAAILLVCSYGDFLPEGEAQALQPLEQLPRPLSRAALYQALQRGLGQPLGAGPAQTDEPRRPRILLVEDNPVNQLVVKGLLGRLGLTVEMARQGEQALKLLAQQNFDLVLMDCNMPILDGYETTRRLRREPRHAHLPVVALTANALPEERERCLQAGMNDYLSKPLRREELEAVLARWLPNCLQPA
>UniRef90_A0A6G6VZM2 Multifunctional oxoglutarate decarboxylase/oxoglutarate dehydrogenase thiamine pyrophosphate-binding subunit/dihydrolipoyllysine-residue succinyltransferase subunit n=1 Tax=Microbacterium sp. 4R-513 TaxID=2567934 RepID=A0A6G6VZM2_9MICO
MSSQVTGVGVSNEGEFGANEWLVEELYEQFKIDRNSVDKAWWPILENYHPVDEAAPAVPAAPSAPASEAAAPTQAQPGASEPRPVTAPIPVIGAQPVARTTAKPAANQPIPAQAPAAVPSTGEASTEEDQVTVLRGMTKTLAANMDESLTVPTATSVRTVPAKLMIDNRIVINNHMARTRGGKVSFTHLIGWAIIRALKEFPSQNVFYAEIDGKPSVVAPAHVNLGIAIDLPKPDGTRSLLVPSIKRADTLTFGEYLASYEDLISRARGNKLTAGDFQGTTISLTNPGGIGTVHSVPRLMKGQGCIVGAGALEYPAEFQGSSEKTLVELGIGKTITLTSTYDHRVIQGAGSGEFLKKVHELLIGQRNFYEDIFAALRIPYAPIHWASDINVDIAERVDKTARVQELINSFRVRGHLMADIDPLEYVQRTHPDLEIENHGLTFWDLDREFVTGGFGGKRIMKLRDILGVLRDSYCRTIGIEYMHIQDPGQRAWFQEHVEIKYQKPGHDEQLRILSKLNEAEAFETFLQTKYVGQKRFSLEGGESLIPLLDEILQGAAQSGLDGAAIGMAHRGRLNVLTNIAGKTYGQVFREFEGSVAVGSKSGSGDVKYHLGTEGTFVADGGDELPVLLAANPSHLETVDGVLEGITRAKQDRKPIGTFSWLPILVHGDAAFAGQGVVVETLQMSQLRGYRTGGTIHVVVNNQVGFTTVPGDARSSIYATDVAKTIQAPIFHVNGDDPEAVVRVAQLAFAYREQFHRDVVIDLVCYRRRGHNEGDDPSMTQPLMTNLIEAKRSVRRLYTEALVGRGDITEEEYEKAKLDFQNGLEVAFAETHAAQTGTHPVVPDAEASAPVSGAPETTGVPTEIVQLIGDAFVNKPDGFTVHPKLQQLLDKRLDMSRNGGIDWAFGELLAFGSLLIEGTNVRLAGQDARRGTFVQRHAVLHDRANGQEWIPLANLGDSQGRFWVYDSLLSEYAAMGFEYGYSVERADSLVLWEAQFGDFANGAQSVIDEYISAAEQKWGQQSSVVLLLPHGYEGQGPDHSSARIERYLSLCAQDNMTVARPSTPASYFHLLRRQAYARPRRPLIVFTPKAMLRLRGATSKVEDFVNGTFQPVLDDDRGVDKGAVTRVLLHAGKIHWDLRAELEKNPNPEVALVRLEQFYPAPIQELNAVIDSYPNAQLYWVQDEPENQGAWPFIALEVVKHLHGRTIRRISRSAAASPATGSPKVHAVEHAELMKKALTTTSR
>UniRef90_UPI0014206272 serine hydrolase n=1 Tax=Chryseobacterium sp. Tr-659 TaxID=2608340 RepID=UPI0014206272
MKKLTLAFLISLSFNMFAQSVNDKIKLFESNLNYWDQLKTKKWSLKERMALYNANAVSIAVIKNYKVEWVKAYGFADISENRPATTQTLFQAASISKSINSLGILKLVQEGKLGLNDDINNYLKTWKFPYDDAVSKGKKISIANLLSHTGGLSVGGFGGYEKGEKLPTIIEILNGTAPANSNAVRSIFEPGSKFEYSGGGTVISQLILENTTGEKYEDYMLKNVLVPLGMNSSSFNQPPSKDKEALFAAAYVNGKEVTGKYHIYPEKAPAGLWTNPTDLAQYIIETQLSLLGKSNKVLSKEMSAKRIENNLGVFLNDFKGTKYFGHSGRNEGFTCHYVGSLEDGNGIIVMTNGSNMKLVEEIVSSIASLNQWKNYPLEPMKESIALTIRKECEKNIDKGIALYKKLKNTLPNNYNFSDENELNNLGYEFLRSGNIDSAIKIFNLNVYEFPKSANVYDSRGEAYLNKKEYQLSKEDYSKVLELDPTQQNAREMLLKIKKETGK
>UniRef90_A0A7S1LBN8 Cation_ATPase_C domain-containing protein (Fragment) n=1 Tax=Alexandrium catenella TaxID=2925 RepID=A0A7S1LBN8_ALECA
PNYVLDVCKTWVGRDGSVEAFSDAAREDAMRTIDILSSQALRVLAIAVRPMAQLPFDPEEDQDSSADEKMGILCQDLTLMGLVASIDPPRAGVRDAVQAAQNGHIRVMMITGDYLKTAAAIAQDVGILEPDVGERGALDCTSLRPSGDYLPDLKIDELTKDARVFARAKPEDKLEIVKSLQRQGLVSAMTGDGVNDAPALNAADIGVAMGIQGTEVAKGASAMILTDDNFVSIVGAVEKGRVIYAGIQKFVAFIMSVHIAEVLQIFICIVSELPVMRTPLQILYLILVTDLAPSIALGLEPGQAGIMNDRPRPKKQPILLWWMWVSTVANAAILTAIIISVYIWGLDTFVNERNVKMISRMVVDEEANGLPGHTKRGLEQAQTVAFISLVWSENIRAYTSRSFDSPVCKELCTNRYMQGAIGVAQAALYTAIFLPGLSDILGLKGADIGLKGWIAALVGAGACLVACEAYKALQWLAG
>UniRef90_A0A7J6FTG0 Calcium-binding protein CML44 n=2 Tax=Cannabis sativa TaxID=3483 RepID=A0A7J6FTG0_CANSA
MSPLSTYDLKRIFQKLDKNGDDLVSLEELSWLLERINNGSVHHQFSKTELESLVGKSSLNFDEFLFFYESISSKHNDEIDDEVEEIIISDLVKAFKVFDQNDDGFISCEELQSVLIRLGLMEENSTDKDCKTMINAFDANSDGQLDFEEFKTMMLLTITS
>UniRef90_A0A0P7TU97 Main olfactory receptor family H subfamily 129 member 1-like (Fragment) n=2 Tax=Scleropages formosus TaxID=113540 RepID=A0A0P7TU97_SCLFO
TDLKTDFAVAYRDIVGSGKVGVHEAAHGPGVDQSLSLHFPSALRQTNEYSETNETVLGNTTSNRSLMVIMKICFVSPFFGVFLYCIVVMLHTFILHRQFWDSSRYILFVYMLINDTLQLLSSVLLFLFVMADLHISFACCAPLLFLSTATFQNTPLILATMSLERYVAIFYPLQQPAAWHADHIWVIILSLWLISCIIPTVDFSLGGLRISIDVLLTPVLCKTQALNSSPVQMLFKVILNGLFFTLVAIIILFTYIRILLETRKMRQDRASVSKALHTVLLHGLQLLLCMMSLTHPITEGLIIQHMGWLQDNISFFNYFCFVLLPRFLSPLIYGLRDDMLRKKIRGAIFCCSTKGAQQVTDKHILK
>UniRef90_A0A0Q7EWN4 Carnitine dehydratase n=3 Tax=Massilia group TaxID=2895353 RepID=A0A0Q7EWN4_9BURK
MTPAEPSLPLSGIRVLDLTRLLPGPAATMQLADLGAEIIKIEDPGPGDYARAMGPVRKEVSQFFVAVNRGKRFLRMDLKDAAQREQLLAMVEQADVLVESFRPGVMDKLGLGWDVLRARNPKLVMCAISGYGQDGPYAMLAGHDINYVGYAGMLDQNAAPDGRPALPNLQVGDLLGGAQAALQGILAALVAVKMGGMGRFVDVSMTDAVFANNIMPLVAVNNGGDAAPGRDLLTGGVPCYNVYRTSDGRYMAVGALELKFWQACCDVLQRPDLKARHWQLGQQVGGPDALAVQAELEAVFAQRTLAQWTEAFAGSDCCVSPILRTSEALVHPLFQARGMAVRAVHESEGEYWAAAGPLKFKA
>UniRef90_A0A7W8G837 VWFA domain-containing protein n=1 Tax=Treponema ruminis TaxID=744515 RepID=A0A7W8G837_9SPIR
MPKRHLALILIISLFHSSILFSENAENEAGEVLSLKQIDLLIDTTAYNDALRELSRYIAAHPNDFDRAQKRISRVMKLREEYNKGADSLVELIRNGDESKSEKLAKIAELESSELESNENVIEFTNLARRTVTLGEILILYDRIMREGVALVRSEKFSDAAVKFEEGFAIKNEVSDLVFDVENHSFAAEGTPVVYESDITEPVRKSVSNIRSLVAGNLVSASMESRINDCEKAFNEYMRAVSARDVNSISAALKNVNAAFEKYAALRNKIIADAKVLEAADILANERNPLLYGTSYITFHQKFILGDESNPDTGIIGAFDAYFNSRVERMKDKTNEAVLETLNLLITNLPEGKIYSLANKIDAEQKNVAVAKMYSQFARYVHDLYNLEKNLDGSTVGEKFSGYASSMSFVSEYLSDLSLAYKSAQELAWEKANPEKIDKNDFSDPVLAYNLKKLLRYEQIKADSKSYISLVNEEEKKQKEFFDKKSEREKEIEELRRISGGRLRISGAQKRTTAGVQISDNPLDFRKQIGYFLSLNEQNLKEARNHAKGLWGYMASAYSALAKKDYDHYEKLCSDTEKLLTGGLASSSDSDFSSEFIKKYPIEAKDSALKINQEISIKKTELLEKREVLNGGEEYRMSESDYNKGTLALDKIILDFDSLYAKNQTLAEEAIPKIRDYENLIRNADEQYEIALRAFKKEDFENANIAVDSASEKYAEALDIEYSEKIRAMREETLNELAVKIQRAEYEKVLREVFALKDKAAIAYYSSSFDTAETLLVTAQSRWSKVSTEEDSEIEDMLNIVKTIKSIEYGRVLLQSDPHYPELSYSLDMAKQSFEKGVKLKNDGNTVKANEAFNLALTNIRNVQNVYPLNKEARLITLKIQQELDPEGFPRQFENQYNAARLNANKNERLADLEDLYAINPKYPGLAQEIYDIKDSLGMFPKKEVKKEVKRSADSKIAEAKKAFKDAGSDEAKLNKALLLANEAIAIDGTSKAAKELKLQIQLKIGASATAILSQNDEKMYAEAARLFNQRRFADAKGIMDNLLKGAAAKKSRKVIDLNNRLLKRL
>UniRef90_A0A847Q3W9 DUF814 domain-containing protein n=1 Tax=Candidatus Fermentibacteria bacterium TaxID=2044591 RepID=A0A847Q3W9_9BACT
MDGVYISAVACRLSEELTGRTCSRVTRPFAGGLGLSIGGRMLLLDARPPSPAAWLGDDGADDGDPAPQPWSDGLAGTRLEEVRQEGLDRILVFEFSRVRRYCNPLMRLIFEMTGRNCNLILADSGSRILACTRIVSRSMSRVRTVRPGETYEGPPSSGAGLGSWREDRVLEALGKATSPEEIHPLLEGVGPATAGAILEESRASGRKVPEVVAVLGSALESREFAPWASVHGPMPIRLGEGAPIADVLSPPSGGGPAGACRKAAVEILEARRAFLERKLEKLRSVLDGVPSEDLLRLRGAILLANIPRVPRGAEEVVLPDWDGMEHRIPLRPGRSAVENAQRYFRKARNAAVERSRLESSIRETRAAIGELDAALAGGSGQCRIDRLAGAVGATRGAEARSPAGRAMGGGWTCLVGRSARENDEITFRIAGRDDIWLHARGAAGAHVVLRHESRGQTPPRAVLEAAAALAAASVRNRPDVVPVDYTKVRYVRKFRGAGPGEVVYTGEKTLFVRLCSARRGGARPGEAK
>UniRef90_UPI001FF9ECF4 transglycosylase SLT domain-containing protein n=1 Tax=Bradyrhizobium sp. 1 TaxID=241591 RepID=UPI001FF9ECF4
MPRDRAHFRFGATWRNVAAAALLLASSCAHAGDGEQYTAGAPDLGAAETATSRAEIRRIVDSETGKANLPADLADAVIFVESGYNSSVVGSVGEVGLMQVRPETAAMLGFRGTAEELAKPDANIHYGVLYLARAWRLSGGDLCRTLMKYRAGHGEETMTPRSQVYCNRARNHLLAMNSPVATGATAAPAPAPVPSTVVATTTTSIARSPKALSRPKEVYARFRQGTAAASRAYWAAHEARISLIKARIETRWKRVASR
>UniRef90_A0A0K2UCG6 Uncharacterized protein n=1 Tax=Lepeophtheirus salmonis TaxID=72036 RepID=A0A0K2UCG6_LEPSM
MWPTVHSLIQTLVLLLPDLQP
>UniRef90_UPI001E440651 type IV secretion protein Rhs n=1 Tax=Chryseobacterium gleum TaxID=250 RepID=UPI001E440651
MAEFSVKTLPNDKIMKLYDKKIQLFSSFILSLCSVLGFSQTILYQAESTSRTVQDPQTVVLAPGFRASSTSSNPFVAKIGPATENPGGGPTDSNAGSNNPSGTTAPDGKSFHDTKGNIEVNGAGQLQFTLPIALPPGVKSVAPQVNLVYTSGSSNGIAGYSWNLSGVTTISRVGKNIEKDGEVKGIQLDYSDYYSFNGQRLILKSGEYGKDGAEYITENYSNIKIKSFGSIPGQVWKGPEYWEVTFEDGSQSWYGTIASGNSTARTPLEYNIVKWKDAQGNYITYNYTQNNSNNVAVISSITWGGNETLNKPHFNTIEFTYLPRKIVEISYLKGILFKQDKILDQIKVKANGSPFKSYSIQYSETQNIVNNDSNNKINYDFVEKIVEINSEGKEANPITLSTNPLLTGSNEFDFGDYDNIITTGDYNGDGLIDFIVRQPAQNSRPEGYYLYFNALNNSNPSFVYLGATSVFWPSSSLTTVNIKSADNFIKPRQGLVITKSNVGYNPPSTGNIELAYYSIKSDASVINTYNNPLVFEYSKTIQSNNYLFDSSLYPPETDPEYLGGLNQSGLSVLKEVDIDSDGISELVLPIEDKKCKYVVIVPDPPKGRWQCKTLGYRYIAVDNDNIQNNTISIIPGTTSKNILSKGGIMDFDNDGKQDIMFLEPTDSKVNVTFYTQVINSGSNNSSPVSLTTEAPLNNLKQYELKKVGNNYTINLKNTISVKGLADGLQFGDLNGDRNIEVLLPVGHPYINRLQGWSIYLNTGNGLQEDIQGLMPYFPYTSSNTDNYSYTIPKLMDLDNDGKSEIINSNVSFGPDVIPSNGSYHSSWYIDSYGEASYDPNNSQFKWSFAKKRIFSSVRNEVVVSPIFGDFRVNNSSSKILFLIKGINGNNERKIISYKHYSLNPDKNISLISQGSQNYYIDYKELDPSFNSNIYAPVKKEQYPFVEMDRLSQTFGVSQLRQTDGQTVRKQDFRYRGYIVNLHGNGVTGFRQAARSSWYADGFENTKIWSGTEMDPLNEGVPVKEWSIRTNNENQIFPADISENNTQLLSFKSTNYQIDKLLNGQVVSTVADSDKPKVVTVVAPKISRVKDFLTGTITESTITYGNYYLPSQSVSNVNNGYAITTSTSEYIHNPSGIGSDYYIGRPKSKINVVQAYGDTKSSKEEYIYENSFVKTLKTWNRDNTGYLQETYNYDGFGNVTGKVISNSIDSQTQTTTSSYDPKGRFVVKKTDNLGLETNITYNDWGQILTQTDPLGNVLTNTYDGWGKILTSKTNLAGTITYQYEKDNNSNIIVTQNDPDGNISKKFTNKLGQEYKTSTKAFGQGQYITKTILYDALGRKTSESEFTFSPDGLGGPWNLVAYDDTVFPTKVTATSFNGKQMETSMSGLTTTVKELNGYQRTTSKTTDVLGNIIYSTDKGGTIQFTYNAAGEQIKAQYGENIITTKYDSWGRKSEFNDPSNGIYKYEYDGFGQAKKITSPKGTKEYTYNNLGQLISQKEISTADGGQATNKLISYSYDNKGRLISKSGTSKGQAYSSNISYDLQGRLLSSSESSNGKYFIQKGITYDDKARVISCEKQLYSSGTLTKVQIENVYSIWNGELYQVKDKATGKILWELKETNAKGQVLKSKLGAADINNVYDANGLLANVNHSSQAKPGILQLSYSFDTIKNELKSRITGGDFNITESFDYDDNNRLVNWTNPVTGIKPTTSRNVYDVKGRIILNDQVGTVKFENSTKIYQPTGMTLNAAGEHNYNNDLIQSIIYNENNDPVFIDGMKGDAAFQYGLTSMRQRVTYGGNFSTDGEGKFTKFYSEDGSFEVVKDNTTGKEKHILYIGGTPYESNIVYLKNFSESSGSYKFLHKDYIGSILAISDEAGNKLEQRHFDAWGNFTHLQIGNGSIITDQNTILTLSKDLAIDRGYTSHEHFVEVGIIHMNGRLYDPLLRRFLNADENIQDIFNTQNYNKYGYVLNNPLMFNDPSGEFIWFLGAAWAAAHVFLAGVITAAVIGTAVGLAAYSLGVAISGSKWQLGGALKSMFWGGVSGAVTFGIGSAFTPVAGTVLTLTDKVASAMAQGLVHGFAQGVLSMMQGANFAHGFASGASGSWGASLFGAFAGSFANSAAGTVVSGALLGGVASELTGGNFWEGAVIGGVVAGLNHYLHKIETTNKIRKRIDKYYNDKSVADASVKKGFLQDLTKIFPEIYELTAKNFAIANEENLKQFNESTGADYVLIDKTIVSDGGNGENINGITSMKDGSVLISPHRTRTALGFAATWYHEGIHSLHLVTGMFKAWEIKYGAKEALRITEFYAHSMTDAMSGLSMTSSLAFSRYYPSLYIQSLSSFLRP
>UniRef90_A0A1A9ZG83 RNA_pol_A_bac domain-containing protein n=1 Tax=Glossina pallidipes TaxID=7398 RepID=A0A1A9ZG83_GLOPL
MTCIPEPRIARIFTQEKDTKSSPHESQRKRHENSNTFDNVCAIDMYGHQISSNNIRIKIYSGQIKWWPKGKQAQIYIESDVGPIDDDILITQMRPGHELDIRLAAVKGIGKDHAKFSPVATAFYRLLPEMKLKKDVVDVELRWKFQTK
>UniRef90_A0A0B6Z514 Protein CASP (Fragment) n=1 Tax=Arion vulgaris TaxID=1028688 RepID=A0A0B6Z514_9EUPU
PFKMAANVQLMCQYWKNFDLQELQRELDTTATELANRQDESEGSRKRLVEQSREFKKNTPEDIRKVVAPLLKSFQLEVDSLSKRSKATEAAFLSVYKKLIDLPDPVPTLEHAQNLQKKAHKVQDLEIENKQLRETLEEYNHEFAEVKNQEVTIKQLKEKLKEHEERVEATAQNRAKEKERELQRTFAEKERQLQETQLIVARKLGEAEHQIATLHRALETAQSELFEVKAKYDEATSAKSDEMEIVMADLERANERATSAERQVERLKQQLTLAAESLNHQDEEDITQQNLASDQAMDILKRSTLEVELAAKEKEIAQLVEDVQRLQASLNKLRETTSAQVTKLEEELTAKNHAFRILEDRLRTQEDYEEVKRELRVLKSIEFANVSSEESHNEESKSLEMRLLEKNKSLQTENTHLKVVNSGLTDQVRKLQEEYKEAAATVQEQKSLITQLEEDLRNINAFSSMFRGDAEGEPGPPDANSEAMASIVKEVTQLTSGKFSKSAADSLLPIIQSQRERYRLRAQELEAQTLSQQQQVTLLQNEMDKLRSDNVKLYEKIRFLQSYPNKDGTREGAATDDVTSSYSSQYEDRLDPFTYFSRAERQRRYHELKPYDKITLSMGRLIMGNRTARVFAFFYTVILHVLVFLVLYKLAHTESCKRDMAADWHQRYSEHMMKVHGEEGQHVD
>UniRef90_A0A1V5QNZ9 Transcriptional repressor NrdR n=1 Tax=Betaproteobacteria bacterium ADurb.Bin341 TaxID=1852821 RepID=A0A1V5QNZ9_9PROT
MKCPFCGAEDTAVVDTRINDEGDIVRRRRSCKVCDKRFTTYERAEIRLPQVVKKNGSRTEFNRDKLRASLDLALRKRPVTTEAVDAAITDIEEKLLAMGEREVTSQQVGELVMRELKRLDKVAYIRFASVYRNFEDVSAFSRAIKEVK
>UniRef90_A0A1S8RD89 Acetate CoA-transferase YdiF n=24 Tax=Clostridiaceae TaxID=31979 RepID=A0A1S8RD89_CLOBE
MVKIINSKEAADLVKDNNVLATSGFALLGVPESLIKRLEERFLEENSPKNLTLMFAAASGDRGSKGLNHLAHEGLTGRVIGGHFGLAPKIGALIRDNKTYAYNLPQGVMCHMFRDKASNRTGTITKVGLNTFVDPRVEGGKANSITKDDIVQVIDILGEENLIYKCPKIDIAFIRGTYADEKGNITMDHEATYSEAACIAQAVKNCGGTVVVQVEKIVKFGTLDPRAVKIPRIYVDYIVEAEDKEDQAQILGYNYDPSLTGEANMVVDGLAPLKLDERKIIGRRAAMELVKGQVVNIGIGMPEAISNVANEEGICDYFTLTVEPGAIGGIPQGGNKFGASINPECMYDQPTQFDFYDGGGLDIAFLGLAEVDKQGNINVSKFGPKVPGCGGFINITQSSKKVVFCGTFTAKGLDIKIEDGKLKIINDGSNKKFVDSVQQITFSGNRATKLKQPVMYITERAVFELKEDGLHLTEIAPGVNLEKDILAAMDFAPIVDKDLKLMDARIFEDKVMGLN
>UniRef90_A0A7S4VIJ8 Gp_dh_C domain-containing protein n=1 Tax=Alexandrium monilatum TaxID=311494 RepID=A0A7S4VIJ8_9DINO
TACGAFQEDTELVQISTKVLPLLAEEDPTDVQSLQDCAGALPAGDVPPGVTTALLGASVVPWKEPSAGPPAVGHMVDCSAIDAPRSPLSGSPIAVSSLLALIRAVSACDRTMKLTLEGMAS
>UniRef90_A0A7R8ANC3 Zn(2)-C6 fungal-type domain-containing protein n=1 Tax=Aspergillus puulaauensis TaxID=1220207 RepID=A0A7R8ANC3_9EURO
MSTRKSQSSRKRPLRLPTIAPKDDMTPLRSHDGTPAAIRATVIQPRLRFPPRSRTGCWTCRSRKIKCDEVHPQCNQCARLGHICDYQPRLCFRDDTRRVMERMPDVKTEGNSVWDPTKMSLWRERLGTSDSIPCDLLPDFSKLISDEDREKKAQGSVPGTYHVVAVPESFARLPEYTEDAFETVPGDPYWSPPSESSSHDLMDEVTTSEDPNVVILSQFRDSRKQPYSNRPSHTQSPESELRPTSVSVETIYTSLQNIPEDEISESIDLEAYDMTLLDHFENIVWMQLIPGDYGYLEANIFEQEASNFPPLLHVMMALSALSLVQQGNNHYMDVLQYYDQALPSLQSSLQNCDDVLSDGLFLTHFLLLIYQIAYTTPNNGLNLWSHHLSRLLQLSLLRQSVTEQERYPLIIWLTCHVDLYALLSGASEGAYVRAAIESHLLPETEFLLYPVGLQNSSVMHPDEYDPRSLIMRLYRECFILSARFGLFTAEVKGSKMAYTEPIFRELENMRAAFKHLWNSDEVQFFIESQSNMPKPSQHSFYQLSILFHTSLLFTCTSFGRIESELEKEIQHHTNAILHLAEKMIAQGRHNGPLFLTFPLFLSGAVTSSHTAKMTALKLLAQLGETELGYKAATTSSMLRIVCETQLQHWRSGGSVREIDWSEVAANHGFRLVNYG
>UniRef90_A0A2E4T8P5 AarF/ABC1/UbiB kinase family protein n=4 Tax=unclassified Alcanivorax TaxID=2638842 RepID=A0A2E4T8P5_9GAMM
MSKDTIVNEMRANLAREREGLALVRNTARGAFRVFETVGVVGRQGLGWLLGDREALPRHLRRTFESLGATYIKLGQFIASSPSLFPEEYVSEFQKCLDRTPPLPFHYIRETVEAELGAPLDTLYEWVDPKPLASASIAQVHAARLKNGADVVIKVQRPGVRQVLLTDFNFLYASARLVESLAPGLSRSALSGVIEELQAGMLEECDFLQEARNLDAFNRFLAETGNVAAVAPRPVASHTTKRVLTMERFHGVPLTDLQVLRRYTDDPAGTLITALNTWFSSLMVCDFFHADVHAGNLMLLEDGRVGFIDFGMVGRIRPEAWQGMMAFFEAIGSGDVPAMARAMAMVGMTSEEVDVDALARDISALQDRLTDVDASALVQADRNDREVNQLLTDLVRIGEGHGIRFPREFALLLKQFLYFDRYVQALAPELDMFSDQRVDLFGTLDQLPGDEPLH
>UniRef90_UPI00156E65B2 VOC family protein n=1 Tax=Flavobacterium sp. 7E TaxID=2735898 RepID=UPI00156E65B2
MSKNITGIHHVTAIAGGAQKNLEFYAGILGLRLVKKTINFDAPEVYHLYYGDEQGNPGSVLTFFPYQGLKMGRHGKGMLNTTTFSVPLDSIAFWTERLSRFGIAFKPPQERFQNEIVIYFEDYDGMGLELVFNDTDSRVGYYNGAINESNAIRGFHNVEIWQEGYELTAGVLTQQLNHTLIAEKGNRFRFAAQESSGNYVDILCAPDSLKGLAGSGMVHHLAFKTPNKTSQEAIRTIIVDRGLNPTPILDRKYFTSIYFKEPGGVLFEIATEAPGFAIDEDAEHLGEELQLPEWFESRRAELNSKLPNISIDHNKFL
>UniRef90_A0A6B3SK05 ABC transporter ATP-binding protein/permease n=1 Tax=Noviherbaspirillum galbum TaxID=2709383 RepID=A0A6B3SK05_9BURK
MRRYSASSPEPAANQGTRNDWVTLKTLFPYLWAYKWRMLLALIFLIGAKLANVGVPLVLKKLVDNMSIEPNHPQALLVLPVGLLVAYGALRVSTTMFTELREFVFAKVTQRAVRTIALQVFRHLHALSLRFHLNRQTGGMTRDIERGTRGISSLVSYTLYSILPTLVEIALVTGYLVLHYDIWFAVITFIALGVYIGFTVAVTEWRTNFRRTMNELDSKANTRAIDSLINYETVKYFSNEDFEARRYDQSLENWETAAVKSQTSLSLLNTGQSLIIAIAVTLILWRATQGVIAGTMTLGDLVLVNAFMIQLYVPLNFLGVIYREIKQSMADMERLFQLLEQHREVADAPDAKPLAVRGAEVRFSHVNFSYESKRQILFDVDFSIPAGTTTAVVGHSGSGKSTLSRLLYRFYDIQSGSITIDGQDLRDVTQASLRAAIGIVPQDTVLFNDTIEYNIGYGKPEASKDDIVAAARAAHIHDFIVSLPDGYATMVGERGLKLSGGEKQRVAIARTLLKNPSILIFDEATSALDSKSEQAIQAQLKEVAQDRTTLVIAHRLSTIADAGQILVLDHGRIIERGTHGQLLAADGAYAQMWARQQAHRDEQTASPAAPDLDASAA
>UniRef90_A0A2N3HH73 Sialate O-acetylesterase n=2 Tax=Confluentibacter flavum TaxID=1909700 RepID=A0A2N3HH73_9FLAO
MTVKCFLFISCISMNTAVYAEIKLPAIFGSNMVLQRNSEVSVWGTAKTKSKVTVSTSWNNRSYETTSDKEGNWKIKVSTPEAGGPYIIKMSDGQELVLDNVLIGEVWLCSGQSNMERTLRGAGNDPILGANEAILKSNNPSIRFFTVERAKSEEPEDNFKGDWKVCNRSTAPDFSATGYFFGNLLQEILDVPVGLISSNWGGTQIQRWLDEGTIKTFAPEHWESSPSTLFNAMINPMLNFNIKGVIWYQGESNRENPEIYDEMMVKLVQNWREKWGIGNFPFYYCQIAPYEYDNKVNSAFLREAQLKASKEIPNSGMVSLLDVGEERNIHPANKRAAGERLAYFALKETYGIEGISARSPEYLDMKIEGSTVELNFSENLTSFGKELKLFEVAGKNQIFYPAKARIKGKGIILVSEEVAEPVAARYGFKNFVDGDLYNIHGIPASSFRTDKW
>UniRef90_A0A672QUX7 Galactose-3-O-sulfotransferase 2 n=3 Tax=Sinocyclocheilus grahami TaxID=75366 RepID=A0A672QUX7_SINGR
MLPPQRIAGRERRAFRWRTAIPWTTCVRVACCSRLRFMWFALVVLTVLCGALQMLGVVRQARSSKVLKLVSEQLVRMPAEMYRPVKHKDWENLWSVSAAIVEEPLDLQPFIQRKDESENPHSEEGRDQVLEDTRKKLSSSTKAAPPIEAIKLWLDQYFPNQPQRPAFPKRTPEIHKPPPSDDKTDKQTVKSLVDDTAMCHPKNHIVFLKTHKTASSTILNILYRYGESHNLTFALPLNMQSQLFYPAFFAAHFVEGVRTRSVEEFHILCNHMRFSSQEVRKVMPKDTFYFSILRNPVSMMESLFVYYKAIPAFRTVKSLEEFLIQAPENDTELDKRSAEVIAAVERDFPLILISEYFDESLVLLKHALCWSLDDVSSFRLNSRSERSRRPLSAEIAEWVKEWNSLDWRLYQHFNATFWKRIDSTLGRAKLQQEVELLSAKRRKLEKMCLQEGGAVDPAQVQDSSLKPFQYGAAVIQGYNLRLGLSNATRQLCHRLITPELQYTSALYTKQFPHLADVRAVAANKFAASRSTAMHRAVKHYFDLTYQYK
>UniRef90_A0A8E0G9R0 MaoC_dehydrat_N domain-containing protein n=6 Tax=Burkholderia TaxID=32008 RepID=A0A8E0G9R0_BURTH
MRATPAERRDDALRIVTDLVSPAPAAALAATLDRDAHPRAGDPLPPLWHWLYFWTAARQSSLGGDGHPRTGGFLPDPGLPRRMAAGGRVRFIAPLAIGSSATRTSRVASLERKAGRSGRLAFVTVEHRIESSGALAIHEEQDIVYREPAEPGAPSPPRQAAPDGAHWQREIAPAETLLFRYSALTFNGHRIHYDRAYAQHAEGYPDLVVHGPLIATLLLDLVSRSMPDAVVTDYAYKAVRPAFVGRALTLCGRLAPDGRSAELWAKDHEGSLTMSARASLVR
>UniRef90_A0A3P6UJT8 Mediator of RNA polymerase II transcription subunit 13 (Fragment) n=2 Tax=Gongylonema pulchrum TaxID=637853 RepID=A0A3P6UJT8_9BILA
MCLSLIRDTGEQENIGWEDVLTARQYMEYIDLSGYATQFKYQKVISSLHSIASALASCCGLGAFQSNTVMIEYPSQAALSGLPDSLLYHYHMHRVCVQHSNLVVVKGTFPLKMQ
>UniRef90_A0A8J6DP79 Uncharacterized protein n=1 Tax=Galemys pyrenaicus TaxID=202257 RepID=A0A8J6DP79_GALPY
MDGVMRMPGPTDRTERTNRTDSTDEHQRAAAVESSREVEMHMPASQPLAPMPAMYLTTSTNKSMKSHGGLQDSSSLTRLPRTILTLAPVPPFLPLQMIMENRM
>UniRef90_V5RHL7 Single-stranded DNA-binding protein n=1 Tax=Spiroplasma apis B31 TaxID=1276258 RepID=V5RHL7_SPIAP
MNNVNIIGQIEGTPQLVFNSKNGEKKLFKFILRVPRNYKNKDGIITDDFINVKVWSNVLGDEYEYYDQSFVGIEGRIISFGSTDSVTYGNEIVANKIIHIA
>UniRef90_A0A074WYW5 Ubiquitin carboxyl-terminal hydrolase n=29 Tax=Aureobasidium TaxID=5579 RepID=A0A074WYW5_9PEZI
MSGGWNTIESDAGVFTYLLENLGVKNVQFEELISLDAQSLGQLSPLGVIFLFKYNNDGRKSDGPLDGQFDFEATYNLDDAGSGGDGKGKVWFAAQTIQNACGTQALLSVLMNKDNADGVELGPHLTDFKDFTAAFPPDIRGEALSNSDLIRDTHNSFARSSPFVSDETRMATQDDDLFHFIAYTSINGKLYELDGLQEAPINHGPCAPTDFAEKVIPVLQRRIERYPSNEIRFNLLAMCQDLRVKAREFGDEDMVYREEEKRRAWQWENALRRHNFVGFVGELMKGVTAAKIADGSYDAWIEDSKQKTKKKLEEGKKKGYNPDEMEM
>UniRef90_A0A413WZM4 Secreted protein n=1 Tax=Bacteroides uniformis TaxID=820 RepID=A0A413WZM4_BACUN
MFYGINFLWPASGCFLYLVSKARSAGCARNDNSVSFHHAMFAHQCWNSEKYGIKFLEEMLLSNKREYKLLSFI
>UniRef90_A0A8S3J9F7 Glycylpeptide N-tetradecanoyltransferase n=1 Tax=Rotaria magnacalcarata TaxID=392030 RepID=A0A8S3J9F7_9BILA
MNTYIFNDDIFLATADQILEELADESVVDLRSHWPILPLLQINLYHVPPQPKKVQEWTIVEVDNDDILTPYPYPSDPMIAERFYEEYSSGNKQKSMENEPGKSKTEEKVFKKNNNATEEAMDPSMTLDATMIENNPEIRKMFLDAAVKQESSLVLKYKYGSFFFKNNNNNTVNLLECLM
>UniRef90_UPI00197D08DB FMN-dependent L-lactate dehydrogenase LldD n=1 Tax=Novosphingobium sp. GeG2 TaxID=2726189 RepID=UPI00197D08DB
MIPLSVFDYRSAAKRRLPKFLFEYIDGGSYAETTLRRNMADLQEISLNQRVLRDVSSIDLTTDLFGQTIDLPLVLAPVGLAGMNARRGEVQAVRAAQEKNIPFTLSTVSACSLPEVARATTRPFWFQLYMLRDRGFMREMLETAQEARCKTLVFTVDMPVPGTRYRDYRSGLAGAPGIVGRARRLFQAAMKPQWAWDVGLRGRPHTLGNVAPLLGRNTGLEDFFAWMRTNFDPSASWSDLEWVRERWPGTLVVKGILDVDDAKEAIHAGADGVIVSNHGGRQLDGVVSSAQALPAIAEALSGQATIMVDGGIRSGLDVVRMIALGADAVMIGRAWAYALAARGELGVSNLIDTIRSEMLVAMALTGETNVHNLCTNNIIR
>UniRef90_A0A358QV57 Na/Pi cotransporter family protein n=1 Tax=Desulfotomaculum sp. TaxID=41211 RepID=A0A358QV57_9FIRM
MWHVVILGLIGGMGLLLYGMQILSEGLQKIAGAKLRTLMSTLTQNRLSALAVGATITVLFQSSTATTVILVGLTSAGIMSLKQTLGVILGADIGTTVTAQLIALKVTEIALPIVGLGATIIFFTKRERYRRYGQVLMGFGLLFLGLKIMSDVMYPLRENPMFPEMMAKMSDNPLLAMLIAAVFTFLIHSSAASIGIIMVLSMQHLVSLHAAIYLLFGANIGTSFTAILSSLGSSRESQRVATAHLLFKVAGVIVFLPFVGPFIALMEKITDSPGYQVANAHTFFNIALAIAFTPFVSQFANLLMKIVPEKRKIGEVFGPRYLDIKLINTPAIALGLATKEINRTFDYVYEMTRDTLLMLEKNDASIISTVAKKEDRVDILFKEISQYLTNVLRQPHSRGEFVKCMGLINIVNDLEHIGDIIEKNVTYLAQCKIDGHCTFSEEGWDDISIMHKKVCDLMQMTSTAFVTSNHDLADRAYKLQPEITKMERHLRVLHIHRLRISGSTEEEGALYLDLINALLRISEHVRNIAWEVANEGLEFTASGERVATDER
>UniRef90_A7HUX0 Short-chain dehydrogenase/reductase SDR n=1 Tax=Parvibaculum lavamentivorans (strain DS-1 / DSM 13023 / NCIMB 13966) TaxID=402881 RepID=A7HUX0_PARL1
MASGNTLSGKVAIVTGGASGIGRAIAHAFANEGAKVVIADVEEETGEKTAAEIVEGGGEAIFRYCDVGERLDVRNLVCAAGDAFEKVDILVNNAGVVSKGSDFLTLEEEEFDRVIRINLKGHFLVGQAVAQRMVAQIEEGHAPGTIINMSSINAVVAIPAQAAYSASKGGIKQLTEAMALSLAPYGIRVNAIGPGTIQTAMAGNVNENPGANKMLLSRTPLGRVGQPEEIASIAVFLASDGASYMTGQTVYADGGRLSLNYTALPMAKKKGEEKKE
>UniRef90_A0A3L7A326 GNAT family N-acetyltransferase n=1 Tax=Mycetocola tolaasinivorans TaxID=76635 RepID=A0A3L7A326_9MICO
MTTESMLPLNQRVTAPTQLPVPTGTEGVTWRPATAADLPAILTLDRAVEAVDDPRHVTTIEALTVDFAASGFDPAADSLLAETTDGTVIAYGTAHAEPEARSVVKVHVPGAVHPEYRGRGLGTALLDWQEARAAQHLAASDLAVPGWISTGAAEHAESPRGFLTTRGYVERRWWMELTRDLSDAIPELPLHADVRLEPLTEELSEATRQAFNDSFRDHWGSQPTNEEDWKKYGSVSTLRGDLSALAVTSDNEVAALVIVSVDPAQWEAAGYRFGYIDLVATRRDWRGKGLAKSLLAQVLRNLKAEGLERAALDVDSESPTGALRLYESVGFAPEARSVSLVREF
>UniRef90_A0A0A8VBS4 Transposase n=1 Tax=Yersinia ruckeri TaxID=29486 RepID=A0A0A8VBS4_YERRU
MTALIRRHLRPLYLSLDLTSVVQDSPWAEALSWLRMVFSKKQTLLQRPLAECPPETLPERLRPYLLEFGEDGEPTGLNAGRYEFWLYRQIRKRFKSGEFHLNNSLRHRHLSDELVPEGEQAAVLAAMNIPFLQKPVKTQLKALESELHRQWKAFNRELKQGKLKHLEYDQQTQKLTWHKSVVSRHKAQEKSFYEQLPFCDVTDVFRFVNEHCRFLPAMKPLQPRYAKNEVDADSLMAVIVAQAMNHGNHVMARTSDIPFHVLETTYEQYLRLASLLTANDCITDAIEALPIFPLYSFDPGTLYGAVDGQKFGVERPTVKARHSRKYFGRGKGMVAYTLLCNHIPINGYLIGTNDYEGHHVFDICYRNTSEVKPTAITGDMHSINKANFAILHWFGLRFEPHFTDLNRQLQELYCTRDPSAYKKCLIQPAGQIDLNLIIREKSNLDRIVATLGLKEMTQGTLIRKLCTYTTTNPTRQAVFAYDLLVRSIYTLKYLRDPQLERNIRRSQNRVESYHQLRAAVAKVGGKKELTGKNDIETEISNQCGRLICNAIVYYNSAILSRLLERLETEDNTKGIEALPRISPVAWQHILLNGHYIFQSNNEIIDLDALVAGLKLR
>UniRef90_K7W9Y4 Glycosyl transferase group 1 n=17 Tax=Nostocales TaxID=1161 RepID=K7W9Y4_9NOST
MAGKDIKLSSASASILTLGTGWFPNNPGGLERYIYELIHKLAASQDQVELCGVGLPLDAKNTQIKLTNLACPDSKISSRLWSIRDNFQKTRLGKPDAINLHFALYSFPILDILPKGVPVTFNFHGPWASESQEEVVNKKLSVWLKEKIIEQSTYNRCDRFIVLSKAFGQILHQKYQVPWQKIHIIPGGVDINHFQNNLSRQEARIKLGWPTNRPILFTSRRLVHRMGIDKLLQAIAMIKVGIPDIWLAIAGRGHIQALLQQQARELGLENNVQFLGFVPENDLPVAYQAADLTVMPSQSFEGFGLAILESLACGTPVLCTPVGGMPEILQKFSPDLITEAITVESIADKLAQVMLGKLPLPSREECRNYTIKNYDWTNIAQQVRQVLLA
>UniRef90_S4SV14 Cytochrome c oxidase subunit 3 n=3 Tax=Scarabaeoidea TaxID=75546 RepID=S4SV14_9SCAR
MSAKNHPYHLVDASPWPILGALSAMISMVGIIKWFHMFNSTLLLLGLSITSLIMYQWWRDISREGTFQGLHTYPVTMGLRWGMILFITSEVFFFISFFWAFFHSSLAPSIELGMNWPPKGVIPFNPIEIPLLNTLILLTSGLTVTWAHHSLMENNFTQATQSLILTVTLGVYFSVLQAYEYMEAPFTIADAAYGSTFFMATGFHGIHVIIGTTFLFTCLMRHLNNHFSSIHHFGFEAAAWYWHFVDVVWLFLYISVYWWGS
>UniRef90_A0A6G1DB44 Epidermal patterning factor-like protein n=1 Tax=Oryza meyeriana var. granulata TaxID=110450 RepID=A0A6G1DB44_9ORYZ
MGHLLLLLLALLLLASSVHAKSAAFTEEKGVAGITVVIGSRPPSCEGRCRSCGHCEAVQVPISPQELQKKSGQVDSKKKKKLGHGDRAAAAAGGRTMPDSYDDHSNYKPLSWRCKCGGLILNP
>UniRef90_B5HBE5 CsbD family protein n=4 Tax=Streptomyces TaxID=1883 RepID=B5HBE5_STRE2
MGISDQFKDKAQELADQAKQKAGKGDQSERARRAREEVSERTQQGREQQGARSRESMQERGENAMRERRDRVEDYDA
>UniRef90_UPI001D7ADF37 heterokaryon incompatibility protein-domain-containing protein n=1 Tax=Truncatella angustata TaxID=152316 RepID=UPI001D7ADF37
MDDDLERQHQEFINRPLRDELPCDRCANLKLSTELFNESFDIGEIELTNILVDHFIFREVNSEYCSSCVDLMRRIDRQEITIRPRRILGFNSESEGDDLLVRSTFQINPDLRPLLCRVDNDSKTFDWGSESKSFGTYTTSDIVGPDHIRHVGDTPNYDAIKVWLGHCLRSHKQCNYSGDLKSALEMIFLIDIEKRQVVTYPKNGEHAPEYFALSYVWGGYKGVSYKPHSTLPYPLPQTIEDAIFVTKRLKLGYLWVDAVCIDQDDDVQKKEQISLMASIYRGAVATIIPLSSNTSDDGFPRVHSGSRRSNQLSLDFGHGKCLQQKLPRLADAIHEAKWNTRCWTFQEKLLSHRRIYFTDHQVHLSCAELVCCEAWHDETHYHNNPEEEDYLIMNPPNREDDLFTQNDHDCDIVSDFENIVNQYLERELEKPEDILHAFSGILEELKQHKFPDGFHQGLPKEDFQHSLLWRAGKVYGVMVDKISGKKYGGLSQATKREFLPQLPSWSWISWRPISGIKFYRLPDQTREPEIYSLKPWVHISDTKQVQLYEGSVAFRRKWEKLVLAHHGWSQNFTSPYITINQDLKQDRAIPAHRSNLHEHARLCVEGIVLQLPFQFMRRNTRVRTTSSYTTRYTRDLELTICDHIISKRLDVEWHFDRRFDRTKKYEEALKSSPLLLLDAYLQTDGGILIPGDFVLNLELLVLSWNGLLARREGTVTVRLKLDRKLKNLKSLVLGHHSITSRDGIDWPSDRVGQVDDTKSDGFASLRIDTERMN
>UniRef90_A0A6A7C4R0 Thioredoxin-like protein (Fragment) n=1 Tax=Piedraia hortae CBS 480.64 TaxID=1314780 RepID=A0A6A7C4R0_9PEZI
LTLTTTEARCVVHFAKEEFARCRTMDTALEQLAKRHVETRFVRLEATEAPWVVERLKVRVLPCVMGFVGGKSVARITGFEGLGGGREEQSGFSLGKLERKLVEYGVLER
>UniRef90_UPI001FE2688D hypothetical protein n=1 Tax=Winogradskyella ursingii TaxID=2686079 RepID=UPI001FE2688D
MRQKLRHSSAVFFTILFVALLSAPTIITSFDDSIDISFFYSLSEEEENEKNFKLVFETDSDSEIFFDAKKRKGKGIYKFKKYPKPHLNLVSPPPEFIS
>UniRef90_M5C988 Delta14-sterol reductase n=1 Tax=Thanatephorus cucumeris (strain AG1-IB / isolate 7/3/14) TaxID=1108050 RepID=M5C988_THACB
MPLGTELRTGGRIKYKINAFSTMLLALGLTLGWIINFGPESFTFIYDHWVGLCTASLINSFIQATWCYYISTKNEETRTLAVGGNSGNVLYDWFIGRELNPTIGSFDIKSFNELRPGLILWLLCNISSACEQLTRRGTLIPTDSMGLVLLFQGLYVADALYNEPAIFTTMDITTDGFGFMLAVGDLAWVPFTYSLQARYLAFNHVELGPFWTCIIFVIHAVGYWIFRGANNEKNDFRNGKNPKNLTSLQTERGTRLLTSGWWGMCQHPNYLGDWIMSVSYSLPTGFNTPITYFYCIYFLILLLHRQTRDDDHCRKKYGKDWDTYTSIVPWRMFPYIY
>UniRef90_UPI001CF80729 YggS family pyridoxal phosphate-dependent enzyme n=2 Tax=Dechloromonas denitrificans TaxID=281362 RepID=UPI001CF80729
MRKGSDDGETRPVSSSGTPPRQDELGRYPRPSSLEDFRRNLAAVRARIDAACRRVGRDPASVRLLPVSKTVDEGQIRLSYAAGCRLLGENKVQEAHRKWQAMADLIDLRWSVIGHLQTNKAKWVARFAAEFQALDSLRVAEALERRLQIEGRSLDVFVQVNTSGEASKYGLPPADVQAFLQALPGFPALRVRGLMTLALLSGEAERVRQCFIRLRTLRDQLRQSAPVGTCLDELSMGMSGDFEIAIEEGATVVRVGQAIYGARALPNSHFWPSETNTRESP
>UniRef90_UPI001010A2DF DUF58 domain-containing protein n=1 Tax=Cellulomonas endophytica TaxID=2494735 RepID=UPI001010A2DF
MVLTGRAVLLAAAGVVALALVPSAGTVLVWAVLVALVCVVDALLAASPRRVAVHREVPASVRLSQSATCTLTVTNVGPRRLRGLVRDAWQPSAGAVVDRHRVDLPPGEGRRLRTVLVPTRRGDRRADLVTVRTVGPLGVAGRQASVPVPARLRVLPEFASRRHLPSRLARLRELDGRSAVQVRGAGTEFDSLREYVVGDDVRSIDWRATARRNDVVVRTWRPERDRRVLLVLDTSRTSAARVGDAPRLDAALEAALLLAALASRAGDRVELLAYDRRVRARVVGASGPRLMPALADALAGVEPTLVEADWPGAAAQVRERLSRRALVVLLTALEPAAVEAGLLAVVGPLAQRHQVVLASVADPEAEDLRRGRGDAAAVFDAAAAERAGLERAAVALRLRQRGVEVVDALPDDLAPALADRYLALKAAGRL
>UniRef90_A0A7J2IPL5 (Fe-S)-binding protein n=1 Tax=Candidatus Bathyarchaeota archaeon TaxID=2026714 RepID=A0A7J2IPL5_9ARCH
MSSKMYELFKKTLEKYLPGKGVTKRITPDQLELKRFEDLEHYKDVLYFCGKCGQCRYVFQEAYWSRVCPSGELKKFEAYYLGGKNLLLWGVLSGKLKWTENLAKILYHCTLCGNCTQQCQIPEIHHYALEWLFAARIESVKRGIAPMPEHRKFGEWTKKEHNPYMELHTDRQKWISSDIRRELPEKADIVYFVGCTSSYREIQVAKAMLDILTSLKLNFTILKDEWCCGSPLFWTGQIDIAKECAKHNIEEIEKSGATIVVTSCAGCYRMIKEIYRNKFGLEYSFEVLHAPEFLLSLVKDGTLPLENEISEKVTYHDPCHIGRHMGLYEPPRELLKNIPGIELIEMTRNRRNAWCCGAGAGVKSAFKDLALFAAHERLKEAQSTEAEILATSCPFCERNLRDAAKAYNVNIKVVDIIELIKYSM
>UniRef90_A0A2E3V0Q5 Response regulatory domain-containing protein n=7 Tax=Chloroflexi TaxID=200795 RepID=A0A2E3V0Q5_9CHLR
MNNLSEKNRNQKILIVDDEHMSDLMRSVLRRLEVDGFNTIVVKPKGNMGTGDEYEIQTLFALEEHHPDAILLDVRFGEYDTDRFKGLSILKKIVERNNKIPVLMFTQYAQGPYRDTAVTATLSVDANVDFIDKLASPEEVVLRLRRLIGSSPEKVMIGDIFEIDSDNSAVYAIVDGKKEIVKDVQGMKLEILKELAAALYRSEGELVPFSKLERFSFGEDSRASLRVRIRELKISLGKSIGREFSANELIINVRNRGYRLIHPE
>UniRef90_UPI00189E7165 hypothetical protein n=1 Tax=Halomonas sp. KAO TaxID=2783858 RepID=UPI00189E7165
MASRTSASLSPQAPLSRHLRSSLRLSRWSGQSSPRLPRLIEPAFHLEVEFDAESGELVGMERVRIDAMRRREEAP
>UniRef90_UPI0006E14DC3 hypothetical protein n=1 Tax=Streptomyces neyagawaensis TaxID=42238 RepID=UPI0006E14DC3
MTHPTAVPLAVASLEPALLFAAAAVLTVLAVPSGVWLIRRRPTRIGRERPTAPAVWVAALAAIGCTAYSADTSWRFAADYLDMAGTTERAAMFAAAELALFATALMARQNLASQGAPGLPGVLVWIITGVQVIPAYAESGPIGGTVRAFVGPVMAAMLWHQAMGIELRLRKPGASSRGVTATLGREARERLLSRLGIAERDRDAAQITRDRATARAVTLATRLAGRTPKQRGNWRGRRITRRLQGALARADVGTDPEQLGVLLDQLAARRHATALATVDLPSPWTRPLLSPPHGRRDQPSLAPHQVAVGDQVTPQCHAVPKAGPETKMDSPRIRDRPEEGHMGPALGTEPAGDGDRPRPVPETGDRGAAGDLAADAAAGHGAKGDQASAVPGTEDAQDGDETSEGDGDKTAAQGSDIPSRTPFPYNGDHLVPRTETGAGTESTGDRPQTVPARRRPKASRTRTRGGQGKPSRRQPQLSVDQLVTQLRPHVPRLLERDGNAEVTRTQLREIMRAHNIGIRNDRLTPVLERLRREAATSTTKKRSAR
>UniRef90_UPI0005A97BD1 hypothetical protein n=1 Tax=Streptacidiphilus anmyonensis TaxID=405782 RepID=UPI0005A97BD1
MSSAVLATRETSAAPRSGLRPRGVTWLTWRQTRAALLVVTLGYAAALAYLLYQHHQFDVTTVRLRGLHCSTDTRDPVSVITANCNLAALAVMQAASGVHRLATVALAAPGLLGAVLAAQPLAVDLERGRHRLLWSQSVSPRRWFTQRMLLPAAILLVLSAVLSVALRWAVLWTHPALPIEDWSFDNASDALAPVYPLLTLAAFALGAVVGLLLHRVIAALGITLALYGVLLYGMAQVRPYLVPLHRKVVGPGDPWPSGDWVYDSGPVVHGKDFSYSACPVATGCDKEPSWILYHPLSQFGPMLWVETGMLAALTAGLVALAYRRLLALTR
>UniRef90_A0A5B9QW56 Alkaline ceramidase n=1 Tax=Roseimaritima ulvae TaxID=980254 RepID=A0A5B9QW56_9BACT
MTHPPKSLKPHPGFKGRIGIAREDITPPVGIYSRNWGAAQHDTADSIHRPLTLTALTISASSTDEPLILIDADLGWWRPLDLFQQFQQRLLEELSLESSRLIFALTHTHAAAPLMKPDPALPSSEPLGPWLERVYQATVSAIRRALADADEAILDWHHGRCALAAVRDFPDPDPAANRILCGFNPAAVADDTLLVGRITDASGTVRATLVNYACHPTTLAWANTTISPDYIGAMRETLEAATGATAFFLQGMSGDVAPKHQYVGDVEVADRHGRQLGFAALATLQDMQPAGRQLYFDEVVESGAPLAAWRHRPHALSSELRAVEIAADLQIKDWPTAEELEQQRLACEDRALEERLRRKRDIRRSLGDGSSSPLAVHAWRIGDAVLVGCGGEAYSQLQQELRSRFPELAVICMNLINGSVGYLPPADLYDVDIYPVWQTPFARGCLEHIRETMTSAIEELVR
>UniRef90_UPI000D340775 DUF1566 domain-containing protein n=1 Tax=Muricauda amoyensis TaxID=2169401 RepID=UPI000D340775
MNKTSKLTHLFILTILLIGFGCSNDDDAGSPISLEDLAVSMDENPSNGQTVGMVETVGGTAMNFSIVSQSPAGAMDIDSSSGELTVANASLFDYETNATITATIDAENAENTATITVTLNNVNEVSAQALEVTMDENPTNGDVVGSLQATGTASGFTITSQTPAGALTIDSATGELTVADATLFDYETNPTLTATVTLEDAQNPVTVTVNLDNVFEVTVQDITLSVDENPTDGQVIGIVQTSGATATNFNIVSQTPNGALNIDAATGELSVVDPNLFDFETNPTITATVIVDDAENPATVTINLNDVDEITVQPGNFTIDENPSNGDSIGTLQATAGSSLTYTITFQNPVGAFSIDQNTGELFVADETLFDFEANPNMFATISVDNGTYSVSANVFVALNNLNEIGEFKYGGVIFWIDPADNGHGLVSAITDQSTSATWGCQGTLISGTGTGIGSGDTNTAAIIAGCATPGIAADIASNTTIDGYSDWFLPSRSELNQMYAQKAIIDATAIANGGTAFPPSVFYWSSTEANSNTAWAVFFDNGNNGGFNKGVSTFYQVRVVREFDLGN
>UniRef90_UPI0013DE5835 hypothetical protein n=2 Tax=Pseudoalteromonas TaxID=53246 RepID=UPI0013DE5835
MKVTLNKKSIKSLSANPATIIRAQETPQIGGGRVIDESFWVCINTRSNCEGTKRCPFD
>UniRef90_W9ZDG4 DUF4097 domain-containing protein n=1 Tax=Fusarium oxysporum f. sp. melonis 26406 TaxID=1089452 RepID=W9ZDG4_FUSOX
MDFSSFDLPFTIAEDHTAQPVSTGSAYDFRETIDGTLARRSLANTPDCLISKLAGLKLDSSSAVFRSRIVAVANEDKGVMVKGDGKPIDLLSGSLSIEQVPDKPSFSISSDKVAIQGYYLPGEDDVIIHGHGHDNNELEIAKYSSATGKMASPRVVGTQFRLDDGVWQVSEPSGMQFHLYVFPKTYFLHLTSKPSKRPRLEDGESTPRP
>UniRef90_UPI0010938F88 DUF3108 domain-containing protein n=1 Tax=Mesorhizobium sp. M4B.F.Ca.ET.172.01.1.1 TaxID=2563950 RepID=UPI0010938F88
SSRYENGVYSIDGSVSAAGLAKRFDDTRGTISSKGTISSQKMVPQAFRADYTSGKKASLVDIRFGNGNVTSTKVVPAPEKRDPKSWVPLGAGDLKSVLDPMAA
>UniRef90_A0A095C0S5 Integral membrane protein n=5 Tax=Cryptococcus gattii species complex TaxID=1884637 RepID=A0A095C0S5_CRYGR
MKENYAVENALGTIGAVLWMVQILPQIIKSHREKTTKGLSASLMFIWALASFFLGAYIVAQKLSIPLQVQPQAFGVLAAVSWCQCLHYERGYSLKSVWAIFIAFCCVFAGFEAGSVYALWAGQRNGVEWPVLMYGYISAVLLAVALLPQYWEIYKYREVIGISLLFMVVDILGGVFSFLSLFFRNDLDIAAFVSYSLVVVLDGIVVILYFILNPIAERRRARQAGRHSDSEAKIEGSSSVGMSTVPTLVGHGLMIDKEVQDGDRRQDNVRVDSEMEQSRVDDRDKMKAGGAEVEVHGPDAQGHETTGSSGEHSEESVKTIK
>UniRef90_D7WDM9 Glycogen synthase, Corynebacterium family n=7 Tax=Corynebacterium TaxID=1716 RepID=D7WDM9_9CORY
MMTREYPPEVYGGAGVHVTELTRFMRDIVDVDVHCMGEPREGENIYVHGVDPELTEANGAIKTLSTGLRMAHAADNVDVVHSHTWYTGLGGHLAGLLHGVPHVVTAHSLEPDRPWKREQLGGGYDISSWSEKNAMENADAVIGVSTGMKKAILEAYPNIDEDKVHVVLNGIDTEDWHRVAPSDAESNGVIERLGVDTSKPVVAFVGRITRQKGVPHLVKAAQDFDEDIQIILCAGAPDTPEIADETQALVDKLREGRGGVYWVTDMLPKEEIREIYSAADIFVCPSVYEPLGIVNLEAMACETAVVASDVGGIPEVVVDGETGTLVHYDKDDTETFEKDLAEAVNTLAADADLTKRYAQAGLARVKKEFTWDKIAQETVDIYKSLI
>UniRef90_A0A0K6GGW7 DPBB_1 domain-containing protein n=1 Tax=Rhizoctonia solani TaxID=456999 RepID=A0A0K6GGW7_9AGAM
MRSTQILAVLAVLATSVSSMSIGHVPNQLTHRRHAAEVHESVIQARGARRAVFAQNTPEMAKRDDAPRRRKRGINQRRCAPKTTTGLPQTASVPSTSSAAPTSSAAPTSSVVPTSSAHTTSAASATTPEPEPTSSQAETTTSAKAKYTKPSAQTPTKTSTSVKPTATDDDSGSSSGSTYTGQATYYGTGLGACGITSSDTDYIAAASQLLFDGFDGYKGSDPNSNPICGKKVKANYQGKSVTITIVDRCVACAKYDLDFSPSAFSQLADQALGRLSGMTWSFIS
>UniRef90_A0A1Y1CLL0 PAS domain S-box protein n=1 Tax=Labilibaculum antarcticum TaxID=1717717 RepID=A0A1Y1CLL0_9BACT
MVEQKVLRSRILELLFKGESESAILNELVHQAQLIASDSICSILCVDEKGKRLLLGAAPDLPDFYNKVIHGTPIRHGVGSCGTAAFTGERVIVEDISTHPFWKNVKNLAKEADLGSCWSEPIKDPSGKVLGTFAIYHRTPNSPNPKDLELISELSDLTAIVLDRYKIIKRLEESENKYKVLANAGNEAIFILEGDKIVEVNKRAEIITGYSEMELSGMSIYNFLAKEYWITPYSDESRKFRHKIKAVGVNKNGLNVSVIVRIKNSTFKGKVVCLLSVRDVTNYINAKIELSKLSQSIIQSPVSVVITNVDGDIEYVNPKFNKLTGYSLEEVIGENPRLLSSGNNKAELYKSMWQEIKSGNVWRGEFQNKKKSGELFWEFATISPLKDDREQIINFIAVKEDITDRKRQEQIQRIILNISNAVFTQMTLVEFIQFIREELSSIMDTTNFFVALYDDETELFSLPFHDDEHDSFEKFPKGKTISGWVVDHETALLATAEKLDELEAKGEIDLVGEPSKIWLGMPLKGKEKVIGVLVIQSYIDENVVTEEDKNMLELVSQQISISIEQKRTEQELHKALRDATESDRLKSVFLATMSHELRTPLNAVIGFSELINNEIDLETAVEYSKMVNQSGQNLLNIVEDLFDISLIQSGAVKIKQENYSLLNLFYEISAVINVEQKVLNKEHIELKINFPSDYNDFFIKTDPHRFKQVYLNLLKNALKFTDRGSIEYGFTKSDLKSGIVLQFYVKDTGIGIPEEVQESIFGLFRQANEKLSRKYNGVGIGLSISKSLTELLGGKIWFDSIPEEGSTFYFTHPIK
>UniRef90_A0A2N8BAE4 Mandelate racemase n=1 Tax=Pseudomonas sp. FW305-25 TaxID=2070636 RepID=A0A2N8BAE4_9PSED
MKIISIKVFQFDVPLKEKYSLSGGRLQYASLDTTIVLVTTDSGLVGVGESCPWGATYLPAYAKGVRAGIDELAPHLLGENPLHLDQLNERMDVMLPGHPYVKAAIDLACWDILGKHCQLPVYTLLGGRFQDSVALQSSIPTDDAAQMMAHLERARNQGYRTHSCKVGTGIDDDVAQIKYLLDQRVPGEVITFDVNRAWTVAEAVAVMNSVADPTVCFEQPCESMDQCRAVRELTRNPIILDESIVTFADLVQAQRQNIAQLIGLKIGRVGGLTKARQMRDFCIHHGIRMNIEDVGGTQVSDSAVMHLAASTPRRFHRASWNCCRHHEVQLAEGSFDIRQGRAYLHDSPGLGLTLDPRQFECPIAQYS
>UniRef90_A0A8G2BJ52 Transmembrane transcriptional regulator (Anti-sigma factor RsiW) n=2 Tax=Thalassobaculum TaxID=526215 RepID=A0A8G2BJ52_9PROT
MSTRNGNGTNGSGSIEDWEVGAYVDDELSPQRRREIAAAAGASPELAARIEVYTRHKSLLAGLASRPVDDEIPEQMRAAATRLSRATTVHGWMRRGRQVMVAQARIAAVLVIGAVVGWTAQEILAPRPGNATDGPLAFIDEATEAHRTLALAPMFATDVGSVDFAKLSEMFSEGIDPAGLRANGLILSKVDMASTDQGPAVQFLFFDREARPVSLLLSVNSASLHSVGVPDGEMVVTSYNDFAVAFGRRDSIAFVVTAALPERRVGEIARQLVASAGF
>UniRef90_UPI001B3A3E04 LPS assembly protein LptD n=1 Tax=Pseudoalteromonas sp. MMG010 TaxID=2822685 RepID=UPI001B3A3E04
MNKSWGILMLSVVSTSSLADTELTHKLCGVSMLTRTWQPMQGLELGTVDIKADEVEFLGTQSAEFNGNVDINTLDMSLSAQSALLDKERSLLNATGPITYQNSVSTVHSTGLNADLNNSEISLLGANYNLTEQLGKGGAEKLTVNNSGLLLMNASFTACPGEIPVWAIEADEINLSREEGWGETYNAVLRILDTPVLYLPYFTFPLDERRKSGLLTPSFSSSDSYGLETITPYYWNIAPNYDATITPRYMSRIGLQLQTEFRYLTDTSKGLVGIEYLNEDDSEPELDSRYMFHWQQKSYFGENWRASVDITNVSDDNYLTDLTSNYANTTDTQLYRTGALTHLGDTWRTDIKIQSFEVLGDHDESYTALPQINFTQTAPWRINHFDFSISGELSHFINGSTEVEVDEATRLHIEPKVRFGYEQYAWSFLSEVSLLQTNYKQHGDLDGTQYSSSVSRTLPKVRLYSQLNFERDTSFFFEDGIQTLEPQMQYLYTPNKDQTDIALFDTVNLQEDFFGLFRDTRFSGVDRIAGANQLTIGATTRLFSSKSEEVFNFSAGQIFYLSDSAKPTEQGITEETNYNALFAAQTMVHWHRRWYLSGGIQYDTDGKQMIQSNVTLDYKGDNNQLVQLNHRYANDVSGNTIEQVGMFTSVPISDEWQFIASYHKDIENKRSIEVLTGLQYESCCWAVQITGQRQIKTDLNQAIDQDQATFDSSIRLNFVLKGLGSKSSYDAQKLLQQSIFGYRRPYFLNN
>UniRef90_UPI0016098D3D hypothetical protein n=3 Tax=Rhizobium TaxID=379 RepID=UPI0016098D3D
MQNALLDYADLISLLTAVGTFVAIVAGVVELIKARREHVRAKEQEFNSSYLTISDAYHQLLELSVEYPHLGIFPWQEEPADLSPDDLVRRDIFYEMMISIFERAYLERHKTPEIAEHFWPGWETFLRRQIEKPSFRKYWGIFDGEGAFGAYDKRFEAFAKRLDGGLPGQDGV
>UniRef90_A0A3N5IFY8 Peroxiredoxin (Fragment) n=1 Tax=Planctomycetaceae bacterium TaxID=2026779 RepID=A0A3N5IFY8_9PLAN
MSDWLEPGTPMPSFTLADHTGAKVKSSQWKGKPLAIYFYPKDDTPGCTKEACAFRDASQPLEK
>UniRef90_A0A2Y9K040 AP-3 complex subunit sigma-2 isoform X3 n=13 Tax=Boreoeutheria TaxID=1437010 RepID=A0A2Y9K040_ENHLU
MIQAILVFNNHGKPRLVRFYQRFPEEIQQQIVRETFHLVLKRDDNICNFLEGGSLIGGSDYKLIYRHYATLYFVFCVDSSESELGILDLIQVFVETLDKCFENVCELDLIFHMDKGGLSAAPARAVSAVKNINLPEIPRNINIGDLNIKVPNLSQFV
>UniRef90_A0A379GMX6 Inner membrane ABC transporter permease protein ydcV n=7 Tax=Morganellaceae TaxID=1903414 RepID=A0A379GMX6_PROST
MNTIKTNNGQKVVKISLIFFIFINVVWLGLPFTMAILWSLVDPQHPWSYPDLFPQKLSLARWKIVWEQTSLATALFNSYTIAPAVAILSLLLATPTAYAFGRMTFKGKAVAEMLTLIPLVMPGMIIGIFFSSMLISLNISNTFMSIVIGHTVLTLPYSIRIMSAGFKSIPQDIIDASRDMGASFWGTFCNAFLPMLKPSLLASLIFCLVRSLEEFSISFVLGSPDFITVPTILYSFLGYSFVRPDAAVVSMILVIPNVILMIIIERLLKGNYLSQSTGKA
>UniRef90_A0A382A9E5 Swi3 domain-containing protein (Fragment) n=1 Tax=marine metagenome TaxID=408172 RepID=A0A382A9E5_9ZZZZ
LRPTPGRKDKEHDDGGLNENNDDEEDLEESLKISIKMPKASLFESAGFNVKQQKKVASIFESAIKSTTRQVGKQIHEHYSKVHKKRLAEHQQLIENRLNTYLDVVVEEWVETNRPAVRSSLRTELSENFLNGLQKLFTEHYIDVPESKTDVVKSLTQHVETLKRQVNEQYTEKLKLHRLAETANKKRIVATFARDMSESQAGKLEKLAEDTQYVNANDFREKLSMLKESYFEKQPSRATRLPEENVQEVTETGVAKGEADMVADAITRQAKSSDW
>UniRef90_F8A565 histidine kinase n=2 Tax=Cellulomonas gilvus TaxID=11 RepID=F8A565_CELGA
MSPAPGTRWGLAARLLAALVVVLAVAAFTAWLVASAVGPGLFHEHMVRAGLQDHDSAVLHAERAFRDASAVSLALALGAAAITSAAVSVVLAGRIGRSLATVSKAAARLGAGEYESRVPAAGLGAEFDDLADSFNTMAARLRDADRLRARLLADVAHEVRTPVATIAGYLEAVQDGAQPMDEATMTVLADQAARLTRLAQDLAAVTRAEAGDLVLNVEPVPTRDLLEQTAAAWRDRAAAAGVHLALDPDAGSGAGPVAVDRHRIAQVMDNLVANALRHTAAGGTITLRARAVDDPSRVALAVRDTGKGIAPEHLPHVFERFYRADTARDRASGGSGIGLAICKALTEAHGGTITAASAGVGAGATFVVTLPAINSGP
>UniRef90_A0A651I330 T9SS C-terminal target domain-containing protein n=1 Tax=Saprospirales bacterium TaxID=2026790 RepID=A0A651I330_9BACT
MKSSFFLLPLLFFGTLNMCFSQVPFIEVLNPNEVSLDSTEAVRYDSIVGFGENYQKYLIRINPIQNYVSLDTITISIPLAEIGEIQFVTTAIEYRNDSSFSLTGYNLSGGFLNFTLLESEIGANMFIPESQSLYQFNSISESYAVMLRYPNWTGFESIGCITTGEDGDQEDYYPDEFSGPDSLNYAQERSICDHNRIRVLVLFTTQGRNESFLRGSNMNRDAQRLIDELNLSIANTGISRSRISFALADTRLLGSFVEDDEDEDIQGDVELLSNNQEAQEMRDEVLADIVVLITGNVYGNIFGVARDIRASESRAYAISTYEFTFNGNLTGTHEIGHLIGTRHQRCRRCPSACDPKWSKYKGYKVGSDMRTIMHVQGCGRTRVNVWSSSGAKFMGQSTGNTNNRNSGILKNRASKVACFREGVPPIPPPPPLSIYYIEGPLFLCPDNAFPQYEVHYNQNVFQNPIFNWDISENGLFNWTTIIGKIKNGNPVTLTQPNNLPDVFWLRATVSDPSGTTASTTIQVRKRDEPYSCNTFLRILREANEQDGTNSEYILYPNPTNNDIFVSGIVGKVWYKIFSSAGELIKIGTDNLSKDQELNISLTYFPAGLYFMELIMENNESHVMKLVKK
>UniRef90_A0A4S8PU73 DUF4240 domain-containing protein n=1 Tax=Glycomyces buryatensis TaxID=2570927 RepID=A0A4S8PU73_9ACTN
MDTTKALKKGRNLIPDEVFAKLVTRIEAEHHFDADMAARCVDQAAAYLAACASSTAPLSPSMAADIGWHMFILHTRDYADFCEQVAGRFIHHVPHDEPAEQSTEDVQAILDRSSAAIRKAGYQVDTELWRADGGAGKCNGCHSGCHDDPAPVPPFHEG
>UniRef90_UPI0018E12798 fasciclin domain-containing protein n=1 Tax=Aquamicrobium zhengzhouense TaxID=2781738 RepID=UPI0018E12798
MRMTFALAAGLIAIAIPAHAQDKDIVDTAVAAGEFTTLAAALDAAGLVQTLKGEGPFTVFAPTDAAFAKLPAGTVEELLRPENKEKLAAILTYHLVPGKVMAADVVSLDEAKTVNGETIEIQVDGNSVRVNDASVTATDVAASNGVIHVIDQVILPPEG
>UniRef90_UPI0010459B45 aminoglycoside 6-adenylyltransferase n=1 Tax=Streptococcus downii TaxID=1968889 RepID=UPI0010459B45
MRTEPEMFDVILQIAKSLKVEAVAMSGSRTDTKAPKDEFQDYDVVYVVDDLDNLTSDLSWLDQFGTRIIEQHNVLGNRRLYLMLFEDGNRIDLTLCPTEYIQEWVDSEAGFTVLEDPKGLFAPYSPSPQRYWISLASQTDFEKACNEFWWVSAYVVKGICRKQVIYATDHLYGICQQELLKVVAWQVAADNGTVDVGKNYKYLFQYLPAEKEKEFSALLDFSSVEKLIQSLFATMQLFHQEAQFLANKMGFDYDKEVAEKMIQYAKERLN
>UniRef90_UPI000E3E49EC hypothetical protein n=1 Tax=Paraliobacillus sp. X-1268 TaxID=2213193 RepID=UPI000E3E49EC
MRNVRGAKELSKYLESIGAPISESTIFSLLREGKIPHQRPSPRILIFNLNAIDEWLNLK
>UniRef90_A0A286TUH0 Signal transduction histidine kinase (Fragment) n=1 Tax=Candidatus Scalindua japonica TaxID=1284222 RepID=A0A286TUH0_9BACT
CELGKEGAFIWVNQTAAEMFGYKSPEEMIGTKVNEIYVNIDDGRTQLEMLEKHGVLSNTVYLCKNKSGDCFYAECTSHLVKDKKGKQCRIEGIIRVITERKKSEYRLIAQHAVTKILSESETIKIAFQGILKVICEALDWDFGSLWLEHDNVLRCVYLWHVPGLQFSEFKKKTKEISFLPGIGLPGRVLSKGKAAWIKDVVVESNFPRATAASKVGLHGAFAFPIIANTEILGVIEFFSQKPEEPDKELLNMMEAIGSQVGQFIKRKQADEQVSKLSRAVEQSPVSVVITDTKNNIEYVNRKYTEVTGYSLEEVKGKNPIVLKTVEENVEEHKELWKTITSGKEWQGEFCNFNKNGEIYWESESISPIKNCDGIITGFIQLKEDITERKLVQSHLKTQLEVAKVLAESNTIREASTRIIEVVCIALGWDLGEVWIYDKQQYILRNTEIWHLPSLNFSEFKDITCRTTFSPQKGLPGLVWQTAKPLWIEDVARDSNFLRASVADKEGLHGAFGFPIAIDNVVLGTICFFSREIRRPDDKLLNMMSSIGNHIALFIERKQADEQISKLSRAVEQSPASVVITDTKGNIEYVNRKFTEVTGYSFEEVKGKNPRVLKSDERNSVDYKELWDTISSGKEWRGEFKNKNSDGKAYWEFASISPIKNNQGVTTGYIAIKEDITVHKNLEQQLMHAQKMESIGHLAAGIAHEINTPTQYIMDNTRFLQDSFNDINKLLEKYSHLLETCKSGSVESELIEEIEVAVRELDEDFLVDEIPNAITQSLEGLDRVKNIVYAMKNFSHPDNENKKPIDINKAINNTITVARNEWKYVAEVKTDFDSSLTSVPCFPGEFNQVILNLIVNAAHAIGEEPGNGNEGKGIIVISTLCDGEWAEIRVSDTGTGISGDIRKKIFDPFFTTKEVGKGTGQGLSLVHSTVVGRHNGTITLDTELGKGTTFIIRLPLCTSSSEIVKV
>UniRef90_A0A2N9EE18 Myb_DNA-bind_3 domain-containing protein n=1 Tax=Fagus sylvatica TaxID=28930 RepID=A0A2N9EE18_FAGSY
MGTGIYAREDAKLWPARLEKLFIDIMVEEMHKGNMPMGIFKLKTWCKILEELNLRSKQSFKLKQVKAKYNRLKQKYRVFSQLLQQNGFVWHGETNSVTASDEVWESYLYANPDAERFREKGCEHYKLLGILFNKLIAMGFMAFASTQDAPDTDEERELDEAYRNGAFIDVDSDSQDDHEKKVSQKRTKRSGKCPMRSEAKGRKRSRKADEFSELNDAIRAFAEQTKLMLEAKVARMKEKEKRKQQRDEFSIPNCVNALESLGDLDMNTYTLAIKKFSTAEWREAFMSLSSNARKKAWLDCLK
>UniRef90_L7LLZ8 Phosphoribosylformylglycinamidine synthase subunit PurS n=9 Tax=Gordoniaceae TaxID=85026 RepID=L7LLZ8_9ACTN
MARVVVDVMPKAEILDPQGQAIVGALGRLGFAGVADVRQGKRFELEVDGTVDDAALERIAEELLTNTVIENFNVTRVAE
>UniRef90_Q1IWN5 Nitrogen regulatory protein P-II n=7 Tax=Deinococcus TaxID=1298 RepID=Q1IWN5_DEIGD
MKLITAVVRPERVQQVKAALFEAGISGLTLSRVSGHGGEQEIVEHYRGTRVMVEFRDKVEFRMAVSEPFVEVAIRAICESARTGEVGDGKIFVQPLERVVRIRTGEEDNAALTPVTETRLTPGLPVRHAR
>UniRef90_A0A534D3W2 Lipoprotein (Fragment) n=1 Tax=Gammaproteobacteria bacterium TaxID=1913989 RepID=A0A534D3W2_9GAMM
MFREKRFVSLVLGVSLLAPGCGESTESVSPLQTLPASRGQLLNNPPTKLGSFSVSDLLSRLSGSQMGRELIKLAFSPTCSVDT
>UniRef90_A0A2G2QLC1 C4-dicarboxylate ABC transporter n=1 Tax=Cycloclasticus sp. TaxID=2024830 RepID=A0A2G2QLC1_9GAMM
MVSENKLPLAVVFLFLMLGVIWWPSFSNLGDLFGYAAKAEYKGVSLLNFFRAELVVLVTVWAVLISYKEQNDMVDGNAYVTRFLILVMFVIGQVFMGFFAGGFLVHQDASWYQVIHEANEVMPSQAVILLVCYPLYLFFGGSAFIYAKTRLPKFLKGKEFSFMVLTFAPLAFLPYYDSSFMQAKKDLFEIAYLSVYWLLSVGWVVIGVLYIILKASQGIFKGLSDPYGEM
>UniRef90_A0A562TCA1 Toprim domain-containing protein n=1 Tax=Chitinophaga japonensis TaxID=104662 RepID=A0A562TCA1_CHIJA
MKKLMCAEAKQIDLVDYLASLGHRPQKVRNQDYWYLSPLREEKTPSFKVNRQLNVWYDHGTGKGGDLIDFGTLYFGCSVSDLLDRLSHHQPAPSLSLHPPTHASRQHSGPASFAGERKDASGSRIVILDARPLAEPSLLEYLQKRCIPLEIATRFCKEVDFLLYGEKRTVIGFRNNAGGYELRSGNFKGSSSPKDVTFIDNHAGEITVFEGFFSFLSFQTINNNQQDTVSNCLILNSLSFFEKSRPLMEQHGKVHLVLDRDAAGIHHTQKTLQWDRDKYQDRSDFYHGHKDLNEWLVHHHHSQKEPQRLRRRP
>UniRef90_UPI0017892BBC TlpA family protein disulfide reductase n=1 Tax=Plantactinospora soyae TaxID=1544732 RepID=UPI0017892BBC
MRRPRRARLGALLAVAAALALALVGCSGEDDWKDDCTTKGGVIECAPEHRPQAPKVTGELLSGGNYDLAQDRGQVAVINFWGSWCAPCRAEADDLEATYQATRERGVRFIGINIQDGRDKARAFEEAFKVTYPSLFDPPSRLALAFDIPPNSIPATVVLDREGRIAVVIRTAVTRETLEPILTRVAAEQAAPGGGPN
>UniRef90_A0A3M8TKU5 Tail assembly chaperone n=2 Tax=Pseudomonas putida group TaxID=136845 RepID=A0A3M8TKU5_PSEPU
MKQPERITLVLRASEAAPLSSILPFTKLGDLVSAGRGLAVIAGFSEGDLQARLAECEAQLQEADVLLREAIAYVNDELVNVEYRDILIARIDRLLDRDQAQQAEKPREQEP
>UniRef90_A0A357MHW4 SseB domain-containing protein (Fragment) n=1 Tax=Rhodobacteraceae bacterium TaxID=1904441 RepID=A0A357MHW4_9RHOB
MTEAPKTPETPETALDAAHAAMQAAPADDAARLRFFERVADSELFLLLKREASGDQVDPESFELADGTFVLAFDREERLAAFTGRASPYLALSGRVLARMLAGQGIGLGLNLEVA
>UniRef90_UPI0004CC520E alpha-L-rhamnosidase N-terminal domain-containing protein n=1 Tax=Streptomyces cellulosae TaxID=1968 RepID=UPI0004CC520E
MTYTDGSATSLVTDKDWLTADGPTTFDQVYSGEKDDARRADELEEWRSAGHRAARAGQLLRTVPRVPRHACRGDYPRRPSAAHSGLVQDRVDDLSHLVPALMTADRAVLSLPGRDDRPDQLPRLQVALAPAPRTARTVAAADHAG


================================================
FILE: src/alphafold3/test_data/model_config.json
================================================
{
  "evoformer": {
    "max_relative_chain": 2,
    "max_relative_idx": 32,
    "msa_channel": 64,
    "msa_stack": {
      "msa_attention": {
        "num_head": 8
      },
      "msa_transition": {
        "num_intermediate_factor": 4,
        "use_glu_kernel": true
      },
      "num_layer": 4,
      "outer_product_mean": {
        "chunk_size": 128,
        "num_outer_channel": 32
      },
      "pair_attention": {
        "num_head": 4
      },
      "pair_transition": {
        "num_intermediate_factor": 4,
        "use_glu_kernel": true
      },
      "shard_transition_blocks": true,
      "triangle_multiplication_incoming": {
        "equation": "kjc,kic->ijc",
        "use_glu_kernel": true
      },
      "triangle_multiplication_outgoing": {
        "equation": "ikc,jkc->ijc",
        "use_glu_kernel": true
      }
    },
    "num_msa": 1024,
    "pair_channel": 128,
    "pairformer": {
      "block_remat": false,
      "num_layer": 48,
      "pair_attention": {
        "num_head": 4
      },
      "pair_transition": {
        "num_intermediate_factor": 4,
        "use_glu_kernel": true
      },
      "remat_block_size": 8,
      "shard_transition_blocks": true,
      "single_attention": {
        "key_dim": null,
        "num_head": 16,
        "value_dim": null
      },
      "single_transition": {
        "num_intermediate_factor": 4,
        "use_glu_kernel": true
      },
      "triangle_multiplication_incoming": {
        "equation": "kjc,kic->ijc",
        "use_glu_kernel": true
      },
      "triangle_multiplication_outgoing": {
        "equation": "ikc,jkc->ijc",
        "use_glu_kernel": true
      }
    },
    "per_atom_conditioning": {
      "atom_transformer": {
        "attention": {
          "key_dim": 128,
          "num_head": 4,
          "value_dim": 128
        },
        "num_blocks": 3,
        "num_intermediate_factor": 2
      },
      "per_atom_channels": 128,
      "per_atom_pair_channels": 16,
      "per_token_channels": 384
    },
    "seq_channel": 384,
    "template": {
      "dgram_features": {
        "max_bin": 50.75,
        "min_bin": 3.25,
        "num_bins": 39
      },
      "num_channels": 64,
      "template_stack": {
        "num_layer": 2,
        "pair_attention": {
          "num_head": 4
        },
        "pair_transition": {
          "num_intermediate_factor": 2,
          "use_glu_kernel": true
        },
        "shard_transition_blocks": true,
        "single_attention": null,
        "single_transition": null,
        "triangle_multiplication_incoming": {
          "equation": "kjc,kic->ijc",
          "use_glu_kernel": true
        },
        "triangle_multiplication_outgoing": {
          "equation": "ikc,jkc->ijc",
          "use_glu_kernel": true
        }
      }
    }
  },
  "global_config": {
    "bfloat16": "all",
    "final_init": "zeros",
    "flash_attention_implementation": "triton",
    "pair_attention_chunk_size": [
      [
        1536,
        128
      ],
      [
        null,
        32
      ]
    ],
    "pair_transition_shard_spec": [
      [
        2048,
        null
      ],
      [
        null,
        1024
      ]
    ]
  },
  "heads": {
    "confidence": {
      "dgram_features": {
        "max_bin": 50.75,
        "min_bin": 3.25,
        "num_bins": 39
      },
      "max_error_bin": 31.0,
      "no_embedding_prob": 0.2,
      "num_bins": 64,
      "num_plddt_bins": 50,
      "pae": {
        "max_error_bin": 31.0,
        "num_bins": 64
      },
      "pairformer": {
        "num_layer": 4,
        "pair_attention": {
          "num_head": 4
        },
        "pair_transition": {
          "num_intermediate_factor": 4,
          "use_glu_kernel": true
        },
        "shard_transition_blocks": true,
        "single_attention": {
          "key_dim": null,
          "num_head": 16,
          "value_dim": null
        },
        "single_transition": {
          "num_intermediate_factor": 4,
          "use_glu_kernel": true
        },
        "triangle_multiplication_incoming": {
          "equation": "kjc,kic->ijc",
          "use_glu_kernel": true
        },
        "triangle_multiplication_outgoing": {
          "equation": "ikc,jkc->ijc",
          "use_glu_kernel": true
        }
      }
    },
    "diffusion": {
      "atom_transformer": {
        "attention": {
          "key_dim": 128,
          "num_head": 4,
          "value_dim": 128
        },
        "num_blocks": 3,
        "num_intermediate_factor": 2
      },
      "conditioning": {
        "pair_channel": 128,
        "prob": 0.8,
        "seq_channel": 384
      },
      "eval": {
        "gamma_0": 0.8,
        "gamma_min": 1.0,
        "noise_scale": 1.003,
        "num_samples": 5,
        "step_scale": 1.5,
        "steps": 200
      },
      "eval_batch_dim_shard_size": 5,
      "eval_batch_size": 5,
      "per_atom_channels": 128,
      "per_atom_pair_channels": 16,
      "per_token_channels": 768,
      "transformer": {
        "attention": {
          "key_dim": null,
          "num_head": 16,
          "value_dim": null
        },
        "block_remat": false,
        "num_blocks": 24,
        "num_intermediate_factor": 2,
        "super_block_size": 4
      }
    },
    "distogram": {
      "first_break": 2.3125,
      "last_break": 21.6875,
      "num_bins": 64
    }
  },
  "num_recycles": 10,
  "return_distogram": false,
  "return_embeddings": false
}

================================================
FILE: src/alphafold3/version.py
================================================
# Copyright 2024 DeepMind Technologies Limited
#
# AlphaFold 3 source code is licensed under CC BY-NC-SA 4.0. To view a copy of
# this license, visit https://creativecommons.org/licenses/by-nc-sa/4.0/
#
# To request access to the AlphaFold 3 model parameters, follow the process set
# out at https://github.com/google-deepmind/alphafold3. You may only use these
# if received directly from Google. Use is subject to terms of use available at
# https://github.com/google-deepmind/alphafold3/blob/main/WEIGHTS_TERMS_OF_USE.md

"""Single source of truth for the AlphaFold version."""

__version__ = '3.0.1'